В Новосибирске создали алгоритм автоматического перевода старых книг

Специалисты из Новосибирска создали программу, которая может автоматически переводить книги дореволюционного периода на современный русский. Сообщается, что новый алгоритм избавляет тексты от уже не использующихся букв «ять» и твердого знака в конце.

Еще в 1918 году в России была проведена языковая реформа, в результате которой из алфавита были исключены буквы «ять» и «фита», кроме того, изменились и правила написания для большинства слов, к примеру, твердый знак стал использоваться значительно реже. В итоге современному читателю не очень комфортно изучать книги, напечатанные еще в дореволюционный период.

Чтобы существенно упростить процесс адаптации старых книг ученые из ИВТ СО РАН в Новосибирске разработали специальную программу, которая позволяет автоматически переводить такие тексты в современный формат. Это позволяет сэкономить немало времени, избавляя редакторов от рутинной работы и предоставляя исследователям более удобный инструментарий для тщательного и оперативного анализа любых изданий.

Впрочем, на данный момент алгоритм пока еще не способен анализировать случаи написания, которые не упоминаются в справочниках. В будущем его авторы планируют доработать код, постепенно внося в него новые формулировки.
Автор: Михаил Сосновский
25-03-2020, 15:29


Читайте также
Добавить комментарий


Введите комментарий:



Автономная некоммерческая организация содействия улучшению качества жизни людей из групп социального риска «Право каждого», Общество с ограниченной ответственностью «ЛИЗА НОРМ», Общество с ограниченной ответственностью «Процесс 2021», Некоммерческое партнерство «Институт развития прессы, признаны в РФ иностранными агентами.
ПОСЛЕДНИЕ НОВОСТИ
Просмотреть все новости