Что вижу - о том пою (aragont) wrote,
Что вижу - о том пою
aragont

Все классики

Месяца три назад (так говорят поисковики) открылась интереснейшая интернет библиотека - Академические собрания сочинений Пушкинского Дома. В полном соответствии с названием она содержит академические издания русских классиков, изданные в СССР в 1930-1970 годах. Академические - это со всеми письмами, черновиками и вариантами, известными литературной науке. На настоящий момент на сайте выложены следующие собрания: Белинский, Гоголь, Достоевский, Капнист, Лермонтов, Некрасов, Прокопович, Пушкин, Радищев, Салтыков-Щедрин,Тургенев, Успенский. Больше всего повезло Пушкину - на сайт попало два издания: 1960-х (голубое) и 1970-х (коричневое).

Книги отсканированы с бумажных оригиналов и распознаны в текст. Качество распознавания вполне приличное. Я просмотрел страниц пятьдесят из томика Белинского и могу сказать, что текст содержит примерно одну опечатку на пять страниц. Половина опечаток - это неверные знаки препинания, четверть - склеивание слов и последняя четверть - ошибки в словах. Кроме опечаток в текстовой базе сайта есть шум из за переносов, номеров страниц, типографских меток и полураспознанных обложек на иллюстрациях.

Ещё утром у меня был небольшой список претензий к сайту, но потом я прочитал страничку "О проекте" и большая часть вопросов ушла.

Часть изданий ещё не обработана до конца (в частности Пушкин), поэтому при переходе на содержимое тома вы увидите пустые страницы. Неаккуратно, но уровнем выше в списке томов есть возможность скачать том в формате PDF и просмотреть у себя на компьютере.

Такая же претензия к текстовому слою. На сайте пока невозможно выделить и скопировать текст, хотя он там есть. Выхода два: скачать PDF и скопировать текст из него, либо в Chrome нажать правую клавишу на изображении страницы и выбрать "Просмотреть код".

Простой поиск на сайте ищет вхождение подстроки, поэтому по запросу "Орлов" вам выдадут (среди прочего) страницу со словом "горловой". Разработчики знают про это и намекают, что со временем поиск улучшится. Кстати, поищите строчку "рюмил" и вы откроете для себя новое русское слово.

Напоследок, несколько замечаний всерьёз (вдруг разработчики меня прочитают):
1. Страница сайта не входит в мой монитор 1600х1200 по вертикали, а более крупные мониторы встречаются весьма редко.
2. Поиск выдаёт сложное меню в боковом окошке. Если результатов будет больше десятка, то воспользоваться этим меню будет почти невозможно. Надо сделать поиск как у гугла и яндекса - найденое предложение + ссылка на исходный текст.
3. Сейчас издания можно скачать только в формате PDF. Удобно для человека, но неудобно для обработки на компьютере. Хотелось бы иметь доступ к чистому тексту, желательно размеченному по произведениям и главам.
4. И, наконец, самое дорогое (в денежном выражении). Хотелось бы обработать отсканированный текст так, как это делали авторы бумажных оригиналов - вычитать, исправить опечатки, перечисленные в конце бумажных изданий, построить электронную систему сносок и комментариев. Не знаю, возможно ли это в современных условиях, но надеюсь, что когда-нибудь этот сайт из хранилища качественных сканов перерастёт в настоящее электронное академическое издание.
Tags: книги, ссылки
Subscribe

  • Почти симметрия

    На профосмотре узнал, что у меня кососимметричные глаза: правый хорошо видит третью строчку снизу, а левый — третью сверху.

  • Ассиметрия/симметрия головы

    В парикмахерской женщина-мастер быстро обработала большую часть головы машинкой, а потом приостановилась и начала раз за разом с нажимом ездить…

  • Похоронный вопрос

    Недавно подзахоранивали прах женщины в могилу к ее родственникам. В могилу, в которую два года назад уже подзахоронили ее мужа. Дочь привезла из…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments