Рейтинг@Mail.ru
Ученые составили самой большой словарь паронимов русского языка - РИА Новости, 31.05.2013
Регистрация пройдена успешно!
Пожалуйста, перейдите по ссылке из письма, отправленного на
Супертег Наука 2021январь
Наука

Ученые составили самой большой словарь паронимов русского языка

Читать ria.ru в
Дзен
До сих пор лингвисты составляли словари вручную, опираясь на языковое чутье. Елена Большакова и ее отец Игорь Большаков, независимый исследователь, впервые предложили формальный критерий паронимии, что дало им возможность составить словарь автоматически.

МОСКВА, 31 мая — РИА Новости. Российские компьютерные лингвисты смогли автоматически составить самый большой компьютерный словарь паронимов русского языка — слов, похожих по форме, но разных по значению.

Правильное употребление таких слов, как, например, "адресат" и "адресант", часто вызывает трудности. "У (нового) словаря есть как минимум два приложения — исправление ошибок в тексте и обучение правильному употреблению паронимов в разных контекстах", — сказала РИА Новости соавтор исследования, сотрудник факультета вычислительной математики и кибернетики МГУ Елена Большакова, представившая результаты работы на конференции по компьютерной лингвистике "Диалог".

До сих пор лингвисты составляли словари вручную, опираясь на языковое чутье. Елена Большакова и ее отец Игорь Большаков, независимый исследователь, впервые предложили формальный критерий паронимии, что дало им возможность составить словарь автоматически.

Исследователи определили паронимы как однокоренные слова одной части речи, имеющие определенные отличия в приставках и суффиксах — например, "добровольный" и "добровольческий". Степень различия слов, при которой они еще достаточно схожи, чтобы считаться паронимами, ученые нашли, анализируя самый большой печатный словарь паронимов русского языка, который содержит 1100 паронимических рядов из 2-7 слов.

В качестве материала для построения компьютерного словаря паронимов ученые использовали созданный ими же словарь однокоренных слов с 23 тысячами единиц. На основании введенных ими критериев, компьютер выбрал среди паронимов 192 тысячи слов, которые составили почти 22 тысячи статей словаря.

Ученые опробовали автоматический поиск ошибок при помощи словаря на отдельных примерах. Встретив в тексте пароним, компьютер обращается к статистике употребления его в разных контекстах. Если пароним оказался рядом с необычным "соседом", алгоритм предлагает варианты замены пары. Дальнейшая задача ученых — уточнить критерий паронимии и протестировать программу на текстах с настоящими ошибками.

 
 
 
Лента новостей
0
Сначала новыеСначала старые
loader
Онлайн
Заголовок открываемого материала
Чтобы участвовать в дискуссии,
авторизуйтесь или зарегистрируйтесь
loader
Обсуждения
Заголовок открываемого материала