https://ria.ru/20230909/masyuk-1895040733.html
Дмитрий Масюк: нейросети уже сейчас непросто отличить от человека
Дмитрий Масюк: нейросети уже сейчас непросто отличить от человека - РИА Новости, 09.09.2023
Дмитрий Масюк: нейросети уже сейчас непросто отличить от человека
Фантастические фильмы конца прошлого и начала этого века сегодня перестают удивлять: еду в мегаполисах нам теперь развозят роботы-доставщики, такси становятся... РИА Новости, 09.09.2023
2023-09-09T10:00
2023-09-09T10:00
2023-09-09T10:00
интервью
технологии
россия
ясенево
алиса
яндекс
нейросеть
нейросети
https://cdnn21.img.ria.ru/images/07e7/09/08/1895036909_0:0:3072:1728_1920x0_80_0_0_c70881cb310729184bed5b2a9e7ddaf1.jpg
Фантастические фильмы конца прошлого и начала этого века сегодня перестают удивлять: еду в мегаполисах нам теперь развозят роботы-доставщики, такси становятся беспилотными, а голосом можно включить кино и закрыть шторы. Отвечает за новую, но уже привычную киберсреду главный отечественный технологический гигант – "Яндекс". Директор бизнес-группы поиска компании Дмитрий Масюк в интервью РИА Новости рассказал, когда голосовой помощник "Алиса" сможет готовить пользователям еду, что стоит за огромной скоростью обучения нейросетей, и страшно ли ему ездить в машине без водителя. Беседовала Эльвира Муравицкая.– Беспилотные такси "Яндекса" с лета ездят по московскому району Ясенево. Готовы подводить первые итоги?– Всего по России мы уже накатали, сложно себе представить, в общей сложности 26 миллионов километров. Пилотом в Ясенево мы довольны, мы впервые посадили водителя-испытателя не за руль, а на соседнее сиденье, и он контролирует вождение, может экстренно притормозить с помощью специальной кнопки. Пользоваться роботакси в Ясенево сейчас могут около 10 тысяч человек, нам нравится, что получается по результатам тестирования. Мы постепенно расширяем доступность услуги для новых пользователей, и все, что касается автономного вождения и перевозок.У нас еще есть роботы-доставщики, роверы, и с ними есть планы по расширению локаций. Мы уже начинаем сдавать роботов в аренду магазинам и ресторанам, обсуждаем и более масштабные проекты, например, полностью роботизированный кампус университета, в котором доставку осуществлять будут только роботы.– Планируете наделить роверов новыми функциями? Тестируете ли уже летающих курьеров?– Летающих – нет. Нам не кажется, что в этом есть такая уж сейчас большая востребованность, не видим в них практической пользы. На обычных роверах мы уже отвезли 250 тысяч заказов. Они работают во многих районах Москвы, под Санкт-Петербургом в Мурино, в Иннополисе вся доставка только на роверах. То есть технология уже хорошо работает, сейчас важно сделать ее недорогой, и чтобы люди к этому привыкли. Совсем массовой она станет через какое-то количество кварталов и лет.– Когда будете готовы запустить тестирование беспилотных такси в других районах?– Я понимаю, что всех волнует, когда уже у меня появится возможность поехать на беспилотном такси. Но для тестирования технологии это не обязательно, центр города мало отличается от Ясенево, может, просто он чуть более оживленный. Я не стал бы сейчас давать какие-то точные прогнозы, когда мы появимся в соседнем районе. Технология развивается, пока нигде в мире еще не удалось сделать эту технологию массовой, но я думаю, на каком-то горизонте это станет возможным, станет частью повседневности.– То есть и водитель-испытатель тоже постепенно исчезнет?– В этом и цель.– Когда?– В России один из самых прогрессивных в мире законов в сфере развития беспилотных автомобилей. Он позволяет тестировать эти технологии в небольших городах с современной инфраструктурой, таких как Иннополис, в мегаполисах, на федеральных трассах. Поэтому перспективы хорошие, но здесь не нужно никуда торопиться, главное – это безопасность пассажиров.Ключевой показатель, за которым мы наблюдаем, – это с какой частотой водителю приходится как-то вмешиваться. Частотность таких случаев снижается, мы буквально в километрах это измеряем. Точные сроки я бы не стал прогнозировать, потому что все, кто пытается их обозначить, часто оказываются более оптимистичными, чем реальность.– Все же это краткосрочная перспектива или долгосрочная?– Это какое-то небольшое количество лет, не 10, абсолютно точно.– Каков сейчас процент аварийности таких автомобилей?– Смотря что считать аварийностью. Если, например, говорить о столкновениях с другими машинами, это единичные случаи – все же испытатель рядом очень помогает. Происшествий, в которых пострадал бы человек, у нас не было ни одного.– Вы сами бы доверили свою жизнь уже сейчас беспилотному такси без водителя?– Это очень хороший вопрос. Я думаю, здесь ситуация как с самолетами. Большинство людей хотя бы раз испытывали страх во время перелета, потому что ты не можешь сам контролировать самолет. При этом всем известно, что самолеты безопаснее, чем автомобили. А автономные автомобили будут на порядок безопаснее, чем обычные, потому что 90% аварий – это человеческий фактор, который в автономном автомобиле просто исключен. Он никогда не устает, он все делает с идеальным вниманием в каждый момент времени, видит на 300 метров вперед и назад, на 360 градусов, в отличие от человека. И каждый наш автономный автомобиль сейчас использует опыт этих самых 26 миллионов километров, которые ни один человек за всю жизнь не накатал.Поэтому какой-то дискомфорт у всех, у меня, в частности, может быть и будет. Но надо понимать, что технология станет массовой, только когда она будет на порядок более безопасной, чем самый идеальный водитель.– На российском рынке вы сейчас – крупнейший игрок в области развития умных устройств. Какая у вас доля рынка, и куда вы намерены развиваться дальше?– Что касается "Алисы", мы очень удивлены результатами в этом направлении: мы, по сути, и есть рынок умных устройств в России, наша доля – примерно 90%. И на данный момент мы уже продали порядка семи миллионов умных колонок, и интерес к ним не снижается, выручка умных устройств в этом году растет на 70% по сравнению с прошлым годом. Казалось бы, у нас и так 90%, чего тут еще делать? Но если просто представить, что в России около 50 миллионов семей, только у 15% из них есть наши колонки. Наша задача, конечно, чтобы "Алиса" была в каждом доме.Кроме того, мы выпустили на рынок умные телевизоры и хотим с ними повторить успех колонок, потому что мы все всегда сидим с телефонами, и нет никаких причин, чтобы дома телефоном не стал телевизор. С ним можно делать буквально все то же самое, только на большом экране, и управлять голосом.– Параллельно вы развиваете и искусственный интеллект, в том числе нейросеть YandexGPT. Как оцениваете свои успехи здесь и какое будущее для нее видите?– С нейросетями все то же самое – мы хотим, чтобы ими пользовался каждый, и здесь мы тоже в самом начале пути – текстовыми нейросетями в России активно пользуются, согласно нашим опросам, около 5% людей, хотя бы раз ими пользовались еще 19%. То есть три четверти людей в России ни разу не общались с нейросетями. Поэтому фронт работ большой, мы активно развиваем базовую технологию, но еще больше усилий прикладываем, чтобы встроить нейросети в наши основные продукты, в том числе в "Поиск", которым ежедневно пользуются десятки миллионов людей. Наша цель в следующем году, чтобы как минимум половина пользователей наших продуктов начала явно или неявно пользоваться нейросетями через них.– Вторая версия вашей нейросети почти вдвое умнее первой, хотя с момента ее выхода прошло меньше полугода. За счет чего удается достигать такого прогресса?– С точки зрения процесса есть три этапа. Первый – развитие базовой модели, которая обучается на очень сконденсированной копии интернета, грубо говоря, в нее загружают вообще все качественные тексты, которые когда-либо кто-либо видел. Второй – увеличение самой модели и третий – процесс fine tune. Мы постоянно работаем над тем, чтобы в начале обучения, на так называемом этапе pretrain, отбирать наиболее качественные данные. У нас сидит команда людей и разработаны специальные механики, которые определяют, какие тексты включать в обучение нейросети, потому что очевидно, что влезет не все – в интернете больше пяти петабайт информации, мы должны отобрать из них 20 терабайт, то есть в тысячи раз меньше. Выросло число параметров, которые обрабатывает нейросеть, сейчас мы увеличили их число в несколько раз.Третий этап – это фидбэк от человека. Это AI-тренеры, мы уже наняли их сотни и еще продолжаем нанимать, которые профессионально пишут примеры качественных текстов на самые разные темы – от науки до стихов, потому что модель должна все уметь. Они обучают нейросеть на примерах и вслепую сравнивают ее ответы, чтобы нейросеть понимала, какие из них хорошие.– Наверное, есть здесь и вклад пользователей, которые ее тоже в какой-то степени тренируют запросами?– Сто процентов – мы собираем отзывы пользователей, просим оценить ответы нейросети. Но я думаю, что промпт-инжиниринг (умение правильно задавать вопросы нейросети – ред.), который все сейчас обсуждают, в ближайшее время будет сдуваться, потому что фундаментальная задача всех языковых нейросетей – сделать так, чтобы модель на человеческом языке поддерживала разговор и понимала контекст.– А вас самого не пугает, насколько быстро это все развивается и заменяет человека?– У меня абсолютно точно нет страха, у меня есть какое-то благоговение перед тем, что происходит, потому что это происходит под моим руководством и моими командами. Рост качества ответов моделей действительно взрывной, и сейчас на какую-то среднюю тему нейросеть поддержит разговор едва ли не лучше, чем человек. И это естественный процесс, я вижу в этом прежде всего очень много пользы. Конечно, здесь есть и риски, но посмотрим, что будет. Так что нет, я не боюсь, я жду.– Как вы думаете, через сколько уже можно будет сказать, что "Алиса" – это полноценный собеседник?– Я думаю, что во многих аспектах это уже сейчас так, и через небольшое количество лет по большинству мыслимых тем "Алису" сложно будет отличить от человека, и тест Тьюринга она пройдет. Я думаю, что даже сейчас уже топовые модели нейросетей, нашу в частности, в чате непросто было бы отличить от человека.– А если сравнивать вас с ChatGPT, кто впереди?– Конечно, мы постоянно сравниваем наши модели, но это довольно непросто, так как если нейросеть, которая решает задачки по физике, сочиняет сказку и может написать письмо руководителю, лучше делает одно и чуть хуже – другое, то мы какой вывод делаем? Она лучше или хуже? Наша базовая модель уверенно обгоняет в ответах на русском языке ChatGPT 3,5 и в десятках процентов случаев дает более качественный ответ, чем ChatGPT 4. Пока мы ее не догнали, но это вопрос времени. А модель LLama 2 7b по результатам тестов мы обходим уже и на английском, родном для нее языке.– Сейчас снова стала популярной идея создания киберсреды, окружающей человека, уже даже есть сериалы на тему, в том числе "Два холма". Консультировались ли ее создатели с вами? Реально ли создание такого помощника?– Мне кажется, что идея и образ универсального искусственного интеллекта, который не просто с тобой через чат общается, а еще и может что-то делать, он совсем не нов. "Алиса", я думаю, уже стала частью культуры крупных городов, как те же курьеры, например. Напрямую ребята из "Двух холмов" с нами не консультировались, но нам радостно видеть, что нами, очевидно, вдохновились.И я думаю, что если не говорить о приготовлении еды, а просто поговорить, дать какие-то задания, то в своих телевизорах и колонках мы уже тестируем такие возможности, когда "Алису" можно попросить сделать что-то внутри экосистемы, например, заказать такси, включить умный чайник или лампочку.Что касается приготовления физической еды, то через какое-то количество лет мы придем и к этому, я убежден. Не так быстро, поскольку здесь речь скорее о робототехнике, где все развивается медленнее. В цифровой среде уже на следующий год все это будет возможно, в реальной среде – на горизонте 5-10 лет уже можно будет "Алисе" что-то поручать.
https://ria.ru/20230607/taksi-1876713319.html
https://ria.ru/20230607/taksi-1876814923.html
https://ria.ru/20230608/dtp-1877003551.html
https://ria.ru/20230418/yandeks-1866015340.html
https://ria.ru/20230713/chatgpt-1883881056.html
https://ria.ru/20230904/sboy-1894192706.html
россия
ясенево
РИА Новости
internet-group@rian.ru
7 495 645-6601
ФГУП МИА «Россия сегодня»
https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/
2023
Новости
ru-RU
https://ria.ru/docs/about/copyright.html
https://xn--c1acbl2abdlkab1og.xn--p1ai/
РИА Новости
internet-group@rian.ru
7 495 645-6601
ФГУП МИА «Россия сегодня»
https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/
https://cdnn21.img.ria.ru/images/07e7/09/08/1895036909_0:0:2732:2048_1920x0_80_0_0_0bbc1f9c79159b95c471d155690d782d.jpgРИА Новости
internet-group@rian.ru
7 495 645-6601
ФГУП МИА «Россия сегодня»
https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/
интервью, технологии, россия, ясенево, алиса, яндекс, нейросеть, нейросети
Интервью, Технологии, Россия, Ясенево, Алиса, Яндекс, нейросеть, нейросети
Фантастические фильмы конца прошлого и начала этого века сегодня перестают удивлять: еду в мегаполисах нам теперь развозят роботы-доставщики, такси становятся беспилотными, а голосом можно включить кино и закрыть шторы. Отвечает за новую, но уже привычную киберсреду главный отечественный технологический гигант – "Яндекс". Директор бизнес-группы поиска компании Дмитрий Масюк в интервью РИА Новости рассказал, когда голосовой помощник "Алиса" сможет готовить пользователям еду, что стоит за огромной скоростью обучения нейросетей, и страшно ли ему ездить в машине без водителя. Беседовала Эльвира Муравицкая.
– Беспилотные такси "Яндекса" с лета ездят по московскому району Ясенево. Готовы подводить первые итоги? – Всего по
России мы уже накатали, сложно себе представить, в общей сложности 26 миллионов километров. Пилотом в Ясенево мы довольны, мы впервые посадили водителя-испытателя не за руль, а на соседнее сиденье, и он контролирует вождение, может экстренно притормозить с помощью специальной кнопки. Пользоваться роботакси в Ясенево сейчас могут около 10 тысяч человек, нам нравится, что получается по результатам тестирования. Мы постепенно расширяем доступность услуги для новых пользователей, и все, что касается автономного вождения и перевозок.
У нас еще есть роботы-доставщики, роверы, и с ними есть планы по расширению локаций. Мы уже начинаем сдавать роботов в аренду магазинам и ресторанам, обсуждаем и более масштабные проекты, например, полностью роботизированный кампус университета, в котором доставку осуществлять будут только роботы.
– Планируете наделить роверов новыми функциями? Тестируете ли уже летающих курьеров?
– Летающих – нет. Нам не кажется, что в этом есть такая уж сейчас большая востребованность, не видим в них практической пользы. На обычных роверах мы уже отвезли 250 тысяч заказов. Они работают во многих районах
Москвы, под
Санкт-Петербургом в Мурино, в
Иннополисе вся доставка только на роверах. То есть технология уже хорошо работает, сейчас важно сделать ее недорогой, и чтобы люди к этому привыкли. Совсем массовой она станет через какое-то количество кварталов и лет.
– Когда будете готовы запустить тестирование беспилотных такси в других районах?
– Я понимаю, что всех волнует, когда уже у меня появится возможность поехать на беспилотном такси. Но для тестирования технологии это не обязательно, центр города мало отличается от Ясенево, может, просто он чуть более оживленный. Я не стал бы сейчас давать какие-то точные прогнозы, когда мы появимся в соседнем районе. Технология развивается, пока нигде в мире еще не удалось сделать эту технологию массовой, но я думаю, на каком-то горизонте это станет возможным, станет частью повседневности.
– То есть и водитель-испытатель тоже постепенно исчезнет?
– В России один из самых прогрессивных в мире законов в сфере развития беспилотных автомобилей. Он позволяет тестировать эти технологии в небольших городах с современной инфраструктурой, таких как Иннополис, в мегаполисах, на федеральных трассах. Поэтому перспективы хорошие, но здесь не нужно никуда торопиться, главное – это безопасность пассажиров.
Ключевой показатель, за которым мы наблюдаем, – это с какой частотой водителю приходится как-то вмешиваться. Частотность таких случаев снижается, мы буквально в километрах это измеряем. Точные сроки я бы не стал прогнозировать, потому что все, кто пытается их обозначить, часто оказываются более оптимистичными, чем реальность.
– Все же это краткосрочная перспектива или долгосрочная?
– Это какое-то небольшое количество лет, не 10, абсолютно точно.
– Каков сейчас процент аварийности таких автомобилей?
– Смотря что считать аварийностью. Если, например, говорить о столкновениях с другими машинами, это единичные случаи – все же испытатель рядом очень помогает. Происшествий, в которых пострадал бы человек, у нас не было ни одного.
– Вы сами бы доверили свою жизнь уже сейчас беспилотному такси без водителя?
– Это очень хороший вопрос. Я думаю, здесь ситуация как с самолетами. Большинство людей хотя бы раз испытывали страх во время перелета, потому что ты не можешь сам контролировать самолет. При этом всем известно, что самолеты безопаснее, чем автомобили. А автономные автомобили будут на порядок безопаснее, чем обычные, потому что 90% аварий – это человеческий фактор, который в автономном автомобиле просто исключен. Он никогда не устает, он все делает с идеальным вниманием в каждый момент времени, видит на 300 метров вперед и назад, на 360 градусов, в отличие от человека. И каждый наш автономный автомобиль сейчас использует опыт этих самых 26 миллионов километров, которые ни один человек за всю жизнь не накатал.
Поэтому какой-то дискомфорт у всех, у меня, в частности, может быть и будет. Но надо понимать, что технология станет массовой, только когда она будет на порядок более безопасной, чем самый идеальный водитель.
– На российском рынке вы сейчас – крупнейший игрок в области развития умных устройств. Какая у вас доля рынка, и куда вы намерены развиваться дальше?
– Что касается "Алисы", мы очень удивлены результатами в этом направлении: мы, по сути, и есть рынок умных устройств в России, наша доля – примерно 90%. И на данный момент мы уже продали порядка семи миллионов умных колонок, и интерес к ним не снижается, выручка умных устройств в этом году растет на 70% по сравнению с прошлым годом. Казалось бы, у нас и так 90%, чего тут еще делать? Но если просто представить, что в России около 50 миллионов семей, только у 15% из них есть наши колонки. Наша задача, конечно, чтобы "Алиса" была в каждом доме.
Кроме того, мы выпустили на рынок умные телевизоры и хотим с ними повторить успех колонок, потому что мы все всегда сидим с телефонами, и нет никаких причин, чтобы дома телефоном не стал телевизор. С ним можно делать буквально все то же самое, только на большом экране, и управлять голосом.
– Параллельно вы развиваете и искусственный интеллект, в том числе нейросеть YandexGPT. Как оцениваете свои успехи здесь и какое будущее для нее видите?
– С нейросетями все то же самое – мы хотим, чтобы ими пользовался каждый, и здесь мы тоже в самом начале пути – текстовыми нейросетями в России активно пользуются, согласно нашим опросам, около 5% людей, хотя бы раз ими пользовались еще 19%. То есть три четверти людей в России ни разу не общались с нейросетями. Поэтому фронт работ большой, мы активно развиваем базовую технологию, но еще больше усилий прикладываем, чтобы встроить нейросети в наши основные продукты, в том числе в "Поиск", которым ежедневно пользуются десятки миллионов людей. Наша цель в следующем году, чтобы как минимум половина пользователей наших продуктов начала явно или неявно пользоваться нейросетями через них.
– Вторая версия вашей нейросети почти вдвое умнее первой, хотя с момента ее выхода прошло меньше полугода. За счет чего удается достигать такого прогресса?
– С точки зрения процесса есть три этапа. Первый – развитие базовой модели, которая обучается на очень сконденсированной копии интернета, грубо говоря, в нее загружают вообще все качественные тексты, которые когда-либо кто-либо видел. Второй – увеличение самой модели и третий – процесс fine tune. Мы постоянно работаем над тем, чтобы в начале обучения, на так называемом этапе pretrain, отбирать наиболее качественные данные. У нас сидит команда людей и разработаны специальные механики, которые определяют, какие тексты включать в обучение нейросети, потому что очевидно, что влезет не все – в интернете больше пяти петабайт информации, мы должны отобрать из них 20 терабайт, то есть в тысячи раз меньше. Выросло число параметров, которые обрабатывает нейросеть, сейчас мы увеличили их число в несколько раз.
Третий этап – это фидбэк от человека. Это AI-тренеры, мы уже наняли их сотни и еще продолжаем нанимать, которые профессионально пишут примеры качественных текстов на самые разные темы – от науки до стихов, потому что модель должна все уметь. Они обучают нейросеть на примерах и вслепую сравнивают ее ответы, чтобы нейросеть понимала, какие из них хорошие.
– Наверное, есть здесь и вклад пользователей, которые ее тоже в какой-то степени тренируют запросами?
– Сто процентов – мы собираем отзывы пользователей, просим оценить ответы нейросети. Но я думаю, что промпт-инжиниринг (умение правильно задавать вопросы нейросети – ред.), который все сейчас обсуждают, в ближайшее время будет сдуваться, потому что фундаментальная задача всех языковых нейросетей – сделать так, чтобы модель на человеческом языке поддерживала разговор и понимала контекст.
– А вас самого не пугает, насколько быстро это все развивается и заменяет человека?
– У меня абсолютно точно нет страха, у меня есть какое-то благоговение перед тем, что происходит, потому что это происходит под моим руководством и моими командами. Рост качества ответов моделей действительно взрывной, и сейчас на какую-то среднюю тему нейросеть поддержит разговор едва ли не лучше, чем человек. И это естественный процесс, я вижу в этом прежде всего очень много пользы. Конечно, здесь есть и риски, но посмотрим, что будет. Так что нет, я не боюсь, я жду.
– Как вы думаете, через сколько уже можно будет сказать, что "Алиса" – это полноценный собеседник?
– Я думаю, что во многих аспектах это уже сейчас так, и через небольшое количество лет по большинству мыслимых тем "Алису" сложно будет отличить от человека, и тест Тьюринга она пройдет. Я думаю, что даже сейчас уже топовые модели нейросетей, нашу в частности, в чате непросто было бы отличить от человека.
– А если сравнивать вас с ChatGPT, кто впереди?
– Конечно, мы постоянно сравниваем наши модели, но это довольно непросто, так как если нейросеть, которая решает задачки по физике, сочиняет сказку и может написать письмо руководителю, лучше делает одно и чуть хуже – другое, то мы какой вывод делаем? Она лучше или хуже? Наша базовая модель уверенно обгоняет в ответах на русском языке ChatGPT 3,5 и в десятках процентов случаев дает более качественный ответ, чем ChatGPT 4. Пока мы ее не догнали, но это вопрос времени. А модель LLama 2 7b по результатам тестов мы обходим уже и на английском, родном для нее языке.
– Сейчас снова стала популярной идея создания киберсреды, окружающей человека, уже даже есть сериалы на тему, в том числе "Два холма". Консультировались ли ее создатели с вами? Реально ли создание такого помощника?
– Мне кажется, что идея и образ универсального искусственного интеллекта, который не просто с тобой через чат общается, а еще и может что-то делать, он совсем не нов. "Алиса", я думаю, уже стала частью культуры крупных городов, как те же курьеры, например. Напрямую ребята из "Двух холмов" с нами не консультировались, но нам радостно видеть, что нами, очевидно, вдохновились.
И я думаю, что если не говорить о приготовлении еды, а просто поговорить, дать какие-то задания, то в своих телевизорах и колонках мы уже тестируем такие возможности, когда "Алису" можно попросить сделать что-то внутри экосистемы, например, заказать такси, включить умный чайник или лампочку.
Что касается приготовления физической еды, то через какое-то количество лет мы придем и к этому, я убежден. Не так быстро, поскольку здесь речь скорее о робототехнике, где все развивается медленнее. В цифровой среде уже на следующий год все это будет возможно, в реальной среде – на горизонте 5-10 лет уже можно будет "Алисе" что-то поручать.