WikiSort.ru - Не сортированное

ПОИСК ПО САЙТУ | о проекте
Screenshot

Distributed Proofreaders (с англ.«Распределённые корректоры») — веб-проект по оцифровке книг для проекта «Гутенберг». Идея проекта состоит в совместной работе массы волонтёров над созданием электронных книг, начиная с этапа сканирования и заканчивая выкладкой готового текста на сайт проекта «Гутенберг».

Проект был создан в 2000 году, с тех пор усилиями его участников каталог проекта «Гутенберг» пополнился более чем 15 тысячами книг[1]. В месяц это число возрастает в среднем на 150—200 книг. Каждый день первый этап вычитки проходит более 2 тысяч страниц.

По историческим причинам сайт не поддерживает юникод, поэтому число языков, книги на которых оцифровываются в рамках проекта, сильно ограничено. По состоянию на апрель 2009 г. список языков таков:

Книги на некоторых других языках, включая славянские, обрабатываются в рамках проекта Distributed Proofreaders Europe, в котором юникод поддерживается.

Этапы создания книг

На первом этапе книги, не защищённые авторским правом[2], сканируются и проходят распознавание. Довольно значительная часть книг в проект попадает, минуя этап сканирования — из Internet Archive, Google Books и других подобных источников.

В результате распознавания получается текст, как правило, содержащий некоторое количество ошибок распознавания (англ. scannos). В связи с этим текст проходит трёхступенчатую процедуру вычитки (proofreading), в ходе которой корректор видит на экране одновременно изображение, полученное со сканера, и текущий вариант текста.

Затем книга подвергается двухступенчатому процессу форматирования, при этом, как и на предыдущем этапе, наибольший приоритет отдаётся тому, чтобы сохранить текст как можно ближе к авторскому варианту.

Отформатированный текст проходит так называемую постобработку (post-processing), а затем — окончательную верификацию. После этого книга считается готовой к выкладке на сайт проекта «Гутенберг».[3]

Примечания

  1. DP: Completed Gold E-Texts
  2. Как правило — с истёкшим сроком действия авторского права согласно законодательству США.
  3. Или на любой другой. Согласно идеологии обоих проектов, книги находятся в свободном доступе.

Ссылки

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .




Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2024
WikiSort.ru - проект по пересортировке и дополнению контента Википедии