10:05 25.01.2023 (обновлено: 10:51 25.01.2023)

https://ria.ru/20230125/nefroset-1847255700.html

Нейросети научили расшифровывать документы с дореволюционной орфографией

Нейросети научили расшифровывать документы с дореволюционной орфографией - РИА Новости, 25.01.2023

Нейросети научили расшифровывать документы с дореволюционной орфографией

"Яндекс" обучил нейросети расшифровывать архивные документы с дореволюционной орфографией, доступ к соответствующему сервису уже открыт, с его помощью можно... РИА Новости, 25.01.2023

2023-01-25T10:05

2023-01-25T10:51

общество

москва

новгородская область

яндекс

https://cdnn21.img.ria.ru/images/07e6/0b/1e/1835268913_47:343:3077:2047_1920x0_80_0_0_204bc3e0936715e21265bed43ab9214c.jpg

МОСКВА, 25 янв - РИА Новости. "Яндекс" обучил нейросети расшифровывать архивные документы с дореволюционной орфографией, доступ к соответствующему сервису уже открыт, с его помощью можно ознакомиться с историческими документами с текстовой расшифровкой, сообщили РИА Новости в пресс-службе компании. "Яндекс" научил нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. Попробовать технологию в действии можно уже сейчас в сервисе "Поиск по архивам": он открывает всем желающим доступ к более чем 2,5 миллиона страниц исторических документов с текстовой расшифровкой", - говорится в сообщении. Уточняется, что новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнает утратившие актуальность буквы и "понимает особую структуру архивных документов". Нейросеть обучили на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII-XIX веков и десятков миллионов сгенерированных примеров. Так, разработанная технология может с легкостью разобрать текст, который неподготовленный человек вряд ли сможет понять. "Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени, а наш сервис справляется с этим за несколько секунд. В перспективе технологию можно использовать и для решения других задач в продуктах "Яндекса", - отметила руководитель "Поиска" Елена Бубнова. Кроме того, первым представленным в сервисе фондом стал главархив Москвы - именно на его материалах разработчики обучали нейросеть. Теперь база пополнилась документами из архивов Оренбургской и Новгородской областей. Со временем количество хранилищ и доступных отсканированных файлов будет увеличиваться.

https://ria.ru/20220922/neyroset-1818676921.html

москва

новгородская область

РИА Новости

4.7

internet-group@rian.ru

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

353

2023

Варвара Скокшина

Новости

ru-RU

https://ria.ru/docs/about/copyright.html

https://xn--c1acbl2abdlkab1og.xn--p1ai/

РИА Новости

4.7

internet-group@rian.ru

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

353

1920

1080

true

1920

1440

true

https://cdnn21.img.ria.ru/images/07e6/0b/1e/1835268913_174:0:2903:2047_1920x0_80_0_0_089759052a81990735d772b7d40c5833.jpg

1920

true

РИА Новости

4.7

internet-group@rian.ru

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

353

Варвара Скокшина

общество, москва, новгородская область, яндекс

Общество, Москва, Новгородская область, Яндекс

Нейросети научили расшифровывать документы с дореволюционной орфографией

"Яндекс" научил нейросети расшифровывать архивные документы с дореволюционной орфографией

Перейти в медиабанк

Архив. Архивное фото

Читать ria.ru в

Дзен

МОСКВА, 25 янв - РИА Новости. "Яндекс" обучил нейросети расшифровывать архивные документы с дореволюционной орфографией, доступ к соответствующему сервису уже открыт, с его помощью можно ознакомиться с историческими документами с текстовой расшифровкой, сообщили РИА Новости в пресс-службе компании.

"Яндекс" научил нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. Попробовать технологию в действии можно уже сейчас в сервисе "Поиск по архивам": он открывает всем желающим доступ к более чем 2,5 миллиона страниц исторических документов с текстовой расшифровкой", - говорится в сообщении.

Уточняется, что новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнает утратившие актуальность буквы и "понимает особую структуру архивных документов". Нейросеть обучили на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII-XIX веков и десятков миллионов сгенерированных примеров. Так, разработанная технология может с легкостью разобрать текст, который неподготовленный человек вряд ли сможет понять.

"Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени, а наш сервис справляется с этим за несколько секунд. В перспективе технологию можно использовать и для решения других задач в продуктах "Яндекса", - отметила руководитель "Поиска" Елена Бубнова.

Кроме того, первым представленным в сервисе фондом стал главархив Москвы - именно на его материалах разработчики обучали нейросеть. Теперь база пополнилась документами из архивов Оренбургской и Новгородской областей. Со временем количество хранилищ и доступных отсканированных файлов будет увеличиваться.

Пользователь смотрит фильм онлайн - РИА Новости, 1920, 22.09.2022

Нейросеть предугадает, что вы будете смотреть этим вечером

22 сентября 2022, 14:20

Общество Москва Новгородская область Яндекс