НОВОСИБИРСК, 6 мая – РИА Новости. Разработанная ученым Новосибирского госуниверситета новая открытая система искусственного интеллекта "Писец" написала "Тотальный диктант" лучше, чем ожидали разработчики, сообщает в понедельник вуз.
"Тотальный диктант" прошел 20 апреля, охватил 41 страну и почти 700 городов мира. Система "Писец", которую разработал научный сотрудник лаборатории прикладных цифровых технологий международного научно-образовательного математического центра НГУ и сооснователь стартапа "Сибирские нейросети" Иван Бондаренко, впервые приняла участие в этой ежегодной акции наравне с человеческим интеллектом.
"Писцу" вполне можно было бы поставить твердую "тройку", если бы не несколько обстоятельств. Из 276 слов диктанта он пропустил шесть, пять из которых стояли в конце предложения, причем в этих случаях он не ставил точку, но следующее предложение начинал с заглавной буквы. В одном месте пропустил предлог "в", шедший предпоследним в предложении. Еще семь слов им было услышано неверно", - рассказала старший преподаватель кафедры источниковедения литературы и древних языков Гуманитарного факультета НГУ Людмила Буднева.
В частности, искусственный интеллект вместо "наивысшего" написал "наявившего", а вместо выражения "Читай — не хочу" - "Считай, не хотите". Также обнаружились проблемы в написании окончаний — "синями" (вместо "синими") и "портрет ... гимназисткЕ" (вместо "портрет … гимназистки"). Были и другие ошибки.
"Результаты работы "Писца" оказались выше, чем прогнозировалось. Изначально он разрабатывался год назад для автоматического стенографирования звукозаписей интервью или защит диссертаций. Соответственно, даже 20-30% ошибок в расшифрованных текстах — это уже тот уровень, который позволяет человеку гораздо быстрее подготовить чистовой текст стенограммы, чем если бы он писал его "с нуля", прослушивая запись полностью самостоятельно. Но для диктанта 20% ошибок — это неприемлемо, это "двойка", - рассказал Иван Бондаренко.
В итоге, в тех местах, где "Писец" все слова услышал верно, он написал диктант хорошо — на границе между "тройкой" и "четверкой". Система вполне удовлетворительно расставила запятые и разбила текст на абзацы. Опираясь на результаты, полученные на "Тотальном диктанте", разработчики уже наметили ближайшие направления исследований искусственного интеллекта. В их числе создание более эффективной модели среды с точки зрения акустики и лингвистики.