На разработку русского голосового поиска у Google ушел год

Наибольшие трудности у разработчиков вызвали русские спряжения и склонения, из-за которых слово или словосочетание может полностью изменить смысл. Как удалось выяснить корреспонденту РИА Новости, на данный момент голосовой мобильный поиск зачастую не справляется и с относительно простыми запросами.

МОСКВА, 22 сен - РИА Новости, Ольга Федина. Google потратил год на разработку голосового мобильного поиска на русском языке, который был запущен в среду, заявил на пресс-конференции один из авторов технологии распознавания речи на русском языке Юджин Вайнштейн (Eugene Weinstein).

"Google занимается технологиями распознавания речи с 2005 года. Первыми голосовой поиск смогли оценить англоговорящие пользователи. На разработку технологии для русского языка нам понадобился примерно год", - сказал Вайнштейн.

Наибольшие трудности у разработчиков вызвали русские спряжения и склонения, из-за которых слово или словосочетание может полностью изменить смысл.

Сейчас голосовой поиск способен распознать около миллиона русских слов. Для этого в базу фонетических данных Google были собраны сотни тысяч голосовых запросов, записанные добровольцами на телефон.

Вайнштейн продемонстрировал, как русский голосовой поиск понимает простые запросы ("погода в Москве") и сложные ("гидравлическая подвеска"). Сложнее всего было научить поисковик понимать запросы, которые состоят из букв, цифр и знаков препинания. "Такие запросы могут быть произнесены по-разному, например, сочетание Xbox360.com русские скажут иначе, чем американцы", - отметил разработчик технологии.

Как удалось выяснить корреспонденту РИА Новости, на данный момент голосовой мобильный поиск зачастую не справляется и с относительно простыми вопросами. Так название автомобиля Mini Cooper система распознала как слово "отменить". По запросу "афиша кинотеатров Москва" выдала результаты для "кинотеатры Москва". Вместо "Красной площади" голосовой поиск "услышал" слово "канапе". В среднем, система ошибалась в половине случаев.

Русский голосовой поиск Google в его нынешнем виде доступен владельцам iPhone, а также смартфонов на платформах Nokia S60 и Android.

Голосовой мобильный поиск успел набрать популярность в США, где им пользуются уже год. Четверть всех поисковых запросов, которые делают пользователи с помощью мобильной версии Google в этой стране, являются голосовыми, заявил директор подразделения мобильных продуктов компании Хуго Барра (Hugo Barra). В настоящее время услуга доступна также для китайского, корейского, японского, французского, немецкого, испанского, итальянского, польского и чешского языков.

Альфа-версию подобного сервиса для внутреннего тестирования в апреле 2010 года запустила компания "Яндекс". Голосовой поиск работает на мобильных "Яндекс.Картах" и помогает искать адреса или ближайшие заправки, парикмахерские, отделения банков или салоны связи благодаря функции автоматического определения местоположения пользователя. Публичная бета-версия сервиса станет доступна пользователям в четвертом квартале этого года.

.

Технологии

Партнеры





Наверх
Авторизация
He правильное имя пользователя или пароль
Войти через социальные сети
Регистрация
E-mail
Пароль
Подтверждение пароля
Введите код с картинки
He правильное имя пользователя или пароль
* Все поля обязательны к заполнению
Восстановление пароля
E-mail
Инструкции для восстановления пароля высланы на
Смена региона
Идет загрузка...
Произошла ошибка... Повторить
правила комментирования материалов

Регистрация пользователя в сервисе РИА Клуб на сайте Ria.Ru и авторизация на других сайтах медиагруппы МИА «Россия сегодня» при помощи аккаунта или аккаунтов пользователя в социальных сетях обозначает согласие с данными правилами.

Пользователь обязуется своими действиями не нарушать действующее законодательство Российской Федерации.

Пользователь обязуется высказываться уважительно по отношению к другим участникам дискуссии, читателям и лицам, фигурирующим в материалах.

Публикуются комментарии только на тех языках, на которых представлено основное содержание материала, под которым пользователь размещает комментарий.

На сайтах медиагруппы МИА «Россия сегодня» может осуществляться редактирование комментариев, в том числе и предварительное. Это означает, что модератор проверяет соответствие комментариев данным правилам после того, как комментарий был опубликован автором и стал доступен другим пользователям, а также до того, как комментарий стал доступен другим пользователям.

Комментарий пользователя будет удален, если он:

  • не соответствует тематике страницы;
  • пропагандирует ненависть, дискриминацию по расовому, этническому, половому, религиозному, социальному признакам, ущемляет права меньшинств;
  • нарушает права несовершеннолетних, причиняет им вред в любой форме;
  • содержит идеи экстремистского и террористического характера, призывает к насильственному изменению конституционного строя Российской Федерации;
  • содержит оскорбления, угрозы в адрес других пользователей, конкретных лиц или организаций, порочит честь и достоинство или подрывает их деловую репутацию;
  • содержит оскорбления или сообщения, выражающие неуважение в адрес МИА «Россия сегодня» или сотрудников агентства;
  • нарушает неприкосновенность частной жизни, распространяет персональные данные третьих лиц без их согласия, раскрывает тайну переписки;
  • содержит ссылки на сцены насилия, жестокого обращения с животными;
  • содержит информацию о способах суицида, подстрекает к самоубийству;
  • преследует коммерческие цели, содержит ненадлежащую рекламу, незаконную политическую рекламу или ссылки на другие сетевые ресурсы, содержащие такую информацию;
  • имеет непристойное содержание, содержит нецензурную лексику и её производные, а также намёки на употребление лексических единиц, подпадающих под это определение;
  • содержит спам, рекламирует распространение спама, сервисы массовой рассылки сообщений и ресурсы для заработка в интернете;
  • рекламирует употребление наркотических/психотропных препаратов, содержит информацию об их изготовлении и употреблении;
  • содержит ссылки на вирусы и вредоносное программное обеспечение;
  • является частью акции, при которой поступает большое количество комментариев с идентичным или схожим содержанием («флешмоб»);
  • автор злоупотребляет написанием большого количества малосодержательных сообщений, или смысл текста трудно либо невозможно уловить («флуд»);
  • автор нарушает сетевой этикет, проявляя формы агрессивного, издевательского и оскорбительного поведения («троллинг»);
  • автор проявляет неуважение к русскому языку, текст написан по-русски с использованием латиницы, целиком или преимущественно набран заглавными буквами или не разбит на предложения.

Пожалуйста, пишите грамотно — комментарии, в которых проявляется пренебрежение правилами и нормами русского языка, могут блокироваться вне зависимости от содержания.

Администрация имеет право без предупреждения заблокировать пользователю доступ к странице в случае систематического нарушения или однократного грубого нарушения участником правил комментирования.

Пользователь может инициировать восстановление своего доступа, написав письмо на адрес электронной почты moderator@rian.ru

В письме должны быть указаны:

  • Тема – восстановление доступа
  • Логин пользователя
  • Объяснения причин действий, которые были нарушением вышеперечисленных правил и повлекли за собой блокировку.

Если модераторы сочтут возможным восстановление доступа, то это будет сделано.

В случае повторного нарушения правил и повторной блокировки доступ пользователю не может быть восстановлен, блокировка в таком случае является полной.

Чтобы связаться с командой модераторов, используйте адрес электронной почты moderator@rian.ru или воспользуйтесь формой обратной связи.