Рейтинг@Mail.ru
Плененный граббером ABBYY - РИА Новости, 26.05.2021
Регистрация пройдена успешно!
Пожалуйста, перейдите по ссылке из письма, отправленного на

Плененный граббером ABBYY

Читать ria.ru в
Евгений Козловский протестировал программу-распознаватель текста, предназначенную для коммуникаторов с операционной системой Android.

 

(Ворчалка № 230)

Двадцать (20!) лет назад фирма ABBYY, которую тогда по старой памяти многие звали еще BIT, выпустила программу – распознавалку текстов, которая в те времена показался мне совершенно потрясающим, FineReader.

Реально программа заработала только года через три, начиная с версии 3.0, да и сканеры поначалу были дорогим удовольствием. Потом сканеры подешевели и стали совершенными, однако возникла другая проблема: они привязаны к компьютерам, и с собою их не слишком потаскаешь.

В девятой версии FineReader’а появилась возможность (скажем мягко: теоретическая возможность) подавать на распознание тексты, снятые цифровыми фотоаппаратами. Конечно, и аппараты должны были быть достаточно умелыми, и сам процесс требовал обдумывания и навыков. Однако возможность все же появилась.

Но по нынешним временам и фотоаппарат стал лишней обузой, повседневное фотографирование перешло на коммуникаторы или, изредка, планшеты.

И их мощность, сравнимая, а чаще превосходящая мощность былых настольных компьютеров, и их работа со встроенными фотокамерами просто не могли не подвигнуть ABBYY на следующий шаг: выпустить вариант FineReader’а для коммуникаторов.

С iOS ABBYY работает давно и плотно, но, не имея ни iPhone, ни iPad’а, я мог знать об этом только понаслышке. А тут появился наконец простенький (но более чем рабочий) вариант для Android’а: начиная с версии 2.3 и требующий не менее чем 3-мегапиксельного фотомодуля. Что – и то, и другое, – довольно давно стало средней нормой для коммуникатора.


Программа называется "ABBYY Text Grabber + Translator" и легко обнаруживается в Google PlayMarket, и стоит около полутораста рублей.

На мой вкус, даже с учетом бесплатности основной массы программ под Android, не так дорого. Особенно, если нужна ее функциональность.

© РИА НовостиABBYY Text Grabber + Translator. Главное окно и About
ABBYY Text Grabber + Translator. Главное окно и About

Главное отличие Text Grabber’а от полноценного, под большие компьютеры, FineReader’а – это неумение давать на выходе ни включенных в текст картинок, ни форматирования. Только голый текст, даже не разбитый на абзацы и иногда с торчащими в середине слов переносами. Понятное дело, что никаких таблиц. То есть их содержание выцарапать можно, но что относится к чему – в этом придется разбираться.

Дело понятное. Распознавание текста хоть и не является задачей для искусственного интеллекта, но отбирает достаточно и памяти, и процессорной мощности, особенно в части форматирования и картинок. А у андроидных (и вообще – карманных) аппаратов существуют определенные ограничения. Text Grabber и так занимает в дистрибутиве немало: 16,9 Мб.

Настроек у программы совсем чуть-чуть: язык текста распознания (там их 40, и можно "подкачать" и дополнительные модули, причем можно задавать до трех языков в одном распознаваемом документе; установка возможности и шага обрезки страниц (если в кадр вдруг попало больше, чем было надо), сохранять или нет распознанный текст, – вот, кажется, и все. Отдельно можно задавать параметры и направления перевода, Text Grabber умеет и это, но не сам, а при помощи гугловского переводчика. Которому для этого нужно быть в Сети. Кстати заметить, вся распознавальная часть Text Grabber’а, включая словари, находится на самом коммуникаторе и Сети для работы не требует.

Результаты распознавания можно отправить буквально в сотню мест, – от почты до установленных на коммуникаторе приложений типа Papirus, SMS/MMS, Bluetooth, и даже в Переводчик Google, который вроде и так сопряжен с Text Grabber’ом. Правда, надо иметь в виду, что эти посланные тексты теряют красные пометки неуверенных распознаваний, которые расставляет Text Grabber. Однако, если вам нужен совсем чистый текст, это можно поправить сразу, после распознавания.

Процесс распознавания идет очень быстро, причем Text Grabber’у совершенно все равно, лежит он на снимке нормально или повернут на любой бок. Главное, чтобы угол поворота был близок к 90 градусам. Впрочем, перекосы градусов в 3-5 Text Grabber’у практически не мешает.

Что же касается качества распознавания… Оно очень зависит от качества фотографии.

© РИА НовостиABBYY Text Grabber + Translator. Снимок-шевеленка и его распознание
ABBYY Text Grabber + Translator. Снимок-шевеленка и его распознание

Если было темновато и камера выставила настолько большую выдержку, что текст очевидно смазался, – может не распознаться вообще ничего, или текст покроется красным ковром пометок. Если текст велик и вы сняли его целиком, то распознание будет зависеть от разрешения камеры и качества ее матрицы, так что порой удобнее снять его двумя или даже тремя частями.

© РИА НовостиABBYY Text Grabber + Translator. Пол-страницы (тени не помешали) и 98-процентно точное ее распознание
ABBYY Text Grabber + Translator. Пол-страницы (тени не помешали) и 98-процентно точное ее распознание

Однако при хороших условиях фотографирования и понимании, как и для чего это делать, распознание идет практически на уровне сканера большого компьютера. Без ошибок.

Иной раз возникают проблемы, если и текст, и его фон – цветные, если бумага сильно бликует, если, наконец, вы делаете снимок с экрана монитора. Но последнее, на мой вкус, – чисто извращение: можно сделать скриншот и распознавать уже его, особенно на Windows 8, где скриншотить можно прямо в файл.

Кстати, программа позволяет брать оригинал не только непосредственно с камеры, но и с сохраненных картинок. Я, например, пользуясь Nexus’ом со сравнительно посредственной камерой и Lumia 920, с великолепной камерой, но невозможностью установить на нее Text Grabber (его для WP8 на сегодня просто нет), при необходимости их просто комбинирую: снимаю на одной и перекидываю – для распознания – на другую.

Если вы хотите сохранить не только результат распознания, но и оригинал, вам лучше всего будет поступать именно так: снимать отдельно, распознавать отдельно, ибо Text Grabber картинок не сохраняет.

Так или иначе, тем, кому такое молниеносно-карманное распознавание "бумажных" текстов нужно (каждый сам про себя это знает), – появление на рынке Text Grabber’а – большой подарок. К тому же, есть предчувствие, что он мало помалу будет совершенствоваться.

А вынесенную в заголовок подпись "Captured by ABBYY TextGrabber", TextGrabber ставит в конце распознанных текстов. Как подпись.

Мнение автора может не совпадать с позицией редакции

 
 
 
Лента новостей
0
Сначала новыеСначала старые
loader
Онлайн
Заголовок открываемого материала
Чтобы участвовать в дискуссии,
авторизуйтесь или зарегистрируйтесь
loader
Обсуждения
Заголовок открываемого материала