МОСКВА, 23 окт — РИА Новости. Российская IT-компания Cognitive Technologies вложила в разработку технологии понимания сложных типов документов (искусственного интеллекта) за последние 5 лет более 70 миллионов рублей, сообщает Digit.ru.
По информации компании, это позволило создать первую отечественную систему, обеспечивающую промышленное качество ввода сложных типов документов, к которым главным образом относится первичная бухгалтерская документация (счета фактуры, товарно — транспортные накладные и т.д.). По заявлению компании, это кардинально иные технологии, нежели системы распознавания символов, в их традиционном понимании.
"Обычные OCR-системы на реальных документах могут дать точность распознавания не более 50% полностью правильных строк таблицы, что говорит об их низкой пригодности для промышленного применения", — говорит руководитель лаборатории систем массового ввода документов Cognitive Technologies Владимир Арлазаров.
Автоматическая обработка сложных типов документов, доля которых в общем объеме бухгалтерского документооборота по разным оценкам, составляет порядка 50%-60%, является одной из сложных задач искусственного интеллекта. Причина состоит в том, что в отличие от многих других типов бизнес-документов, например, платежных поручений, страховых анкет, налоговых деклараций и т.п., до настоящего времени не существует единых правил, регламентирующих эти документы и определяющих расположение их элементов.
Таким образом, система распознавания сложных документов фактически должна как человек "понимать", к какому из признаков относится напечатанная в разных частях документа информация.