Российский техногигант "Яндекс" завершил долгожданный переезд от голландских "родителей" в Калининград, а со среды начинаются торги новой компании на Мосбирже. Все технологии и основные наработки продолжат развиваться на родине, заверил директор бизнес-группы поиска "Яндекса" Дмитрий Масюк. В интервью РИА Новости он рассказал о планах международной экспансии, почему "Алисе" можно доверить даже ребенка и на какие вопросы она никогда не даст ответ, куда дальше поедут беспилотные автомобили и роботы-доставщики, зачем компания придумала "Нейро", и можно ли распознать диплом, написанный искусственным интеллектом. Беседовали Эльвира Муравицкая и Диляра Солнцева.
— Во-первых, поздравляем с закрытием сделки, как изменится ваша жизнь?
— Моя жизнь, думаю, практически не изменится, просто теперь другим людям раз в несколько месяцев я буду рассказывать, как обстоят дела в моей бизнес-группе. Но в целом сохранилась максимальная степень преемственности прежней команды, которая продолжает управлять "Яндексом", и мы этому рады.
И никаких изменений, которые могли бы повлиять на пользователей и партнеров, тоже нет. Были какие-то слухи, может быть, даже они сейчас витают, что какую-то часть продуктов или технологий от нас забирают. Это совсем не так. Мы сохранили все технологии, в том числе автономного транспорта, и продолжаем их развивать.
— Какие страны и направления еще видите для себя перспективными?
— Мы уже присутствуем в двух десятках стран, на рынках ближнего зарубежья мы показали быструю динамику, взяли большой фокус на Казахстан. Мы хотим расширяться, безусловно, прежде всего в ближнем зарубежье.
Российский рынок, хотя это всего 2% мировой экономики, интересует многих: зарубежные компании хотят рекламироваться на российских пользователей, а большая часть приложений, которые установлены на наших с вами телефонах, на самом деле сделаны не в России. Поэтому нам нужно договориться с большим количеством игроков, например, китайскими партнерами.
— Но обычные люди знают вас прежде всего по "Алисе". Как вы оцениваете ее развитие в последнее время? Как ее воспринимают люди?
— Нам кажется, и это видно по опросам и исследованиям, что настоящим чудом "Алисы" стала ее эмпатичность, человечность. Она вызывает эмоции. Тесты, которые проводили наши арабские партнеры, когда создавали ассистента на основе технологий "Алисы", показали, что люди видят отличия от американских, например, вариантов — Alexa, Siri, которые вызывают меньше эмоций.
И я по-человечески очень рад этой реакции, потому что в том же кинематографе образ искусственного интеллекта, технологий в целом довольно пугающий. Но в случае "Алисы" или, например, роверов (роботов-доставщиков — ред.), нам удается через дизайн, через очень сознательную работу получить эмоциональный контакт — и как минимум это уже наше конкурентное преимущество.
И во многих других вещах, которые упираются в строгое машинное обучение, например, разговоры с "Алисой" — мы часто выигрываем у конкурентов. Когда технология "Алисы" используется для создания ассистентов на новых рынках, в них буквально скульптурируется "Алиса" — что она знает, что думает про детей, про домашних животных, как шутит — все это описывается подробно для каждой страны. Большая часть стратегии по международному развитию — это целостная адаптация продуктов под локальный рынок.
— Опыт пользователей "Алисы" в России и за рубежом отличается?
— Честно, существенных отличий мы не видим, люди везде похожи.
— "Алиса" подслушивает людей? Только честно.
— Это технологически невозможно, более того, во всех наших устройствах есть кнопка выключения микрофона, которая просто на "железном" уровне блокирует любую возможность услышать что-то (то есть отключает питание микрофонов — ред). Мифы такие есть, но это совсем не так.
— Как вы планируете ее развивать дальше?
— Мы работаем над тем, чтобы развивать ее эмпатичность, эмоциональность, она будет шире, будет больше интонаций. Одни из ярких наших запусков, хотя технологически они были непростыми — чтобы "Алиса" отвечала шепотом или продолжала разговор без необходимости каждый раз произносить ее имя.
И мы это сделали не потому, что провели исследование или нас попросили — мы просто таким образом добавили ей магии взаимодействия. И мы работаем над ее не линейным, а ступенчатым развитием, и скоро будем готовы делиться новостями. Не хочу конкретизировать, но это будет большое улучшение.
Из последних таких улучшений — мы запустили "Алису Про", опцию, которая переводит ассистента на самую мощную большую языковую модель "Яндекса". Мы это сделали масштабно первыми в мире, что, конечно, удивительно. То есть еще прошлой весной мы запустили навык общения с "Алисой", который назывался "Давай придумаем", а сейчас ее можно просто включить, и она по умолчанию будет работать на больших языковых моделях.
Мы используем сейчас третье поколение этих языковых моделей, YandexGPT 3, будет, естественно, 4 и так далее, что позволяет запустить два вектора "Алисы": первый – чтобы она была более умной и функциональной. А второй — чтобы она воспринималась естественно — как член семьи, няня — мы все это называем просто ассистент. Мы хотим, чтобы она не просто могла сказку прочитать, а стала настоящей няней ребенку. Это продукт, который находится дома, естественно, он должен вызывать доверие и по безопасности, и по человечности, и по функциональности.
— А вы полностью доверяете "Алисе"?
— На 100%, потому что я достаточно детально технически понимаю, как она работает.
— Ее пытались взломать? Вы сами проводите тесты, пентест (тест на проникновение), например?
— Безопасность — наш приоритет номер один. Поэтому над безопасностью любого продукта мы работаем непрерывно, у каждого крупного продукта есть отдельная команда безопасности. Каждый день работа этих людей состоит в том, чтобы выявлять потенциальные проблемы безопасности и закрывать их — когда ты ее находишь, это потенциал для взлома.
Просто надо понимать, что абсолютно любой продукт в мире могут взломать, даже крупнейшие эталонные продукты. Задача команды безопасности работать на опережение и предотвращать урон для пользователей.
Кроме того, мы еще привлекаем внешние компании с целью попытки взлома наших сервисов и независимой оценки своей работы, развиваем программы "охоты за ошибками" по поиску уязвимостей. Поэтому мы считаем, что уровень безопасности у нас высокий, очень высокий, и нашим пользователям не о чем беспокоиться. Что не исключает, что какие-то инциденты могут случаться, мы здесь не исключение из мировой практики. Важно быстро реагировать и вкладываться в технологии защиты.
— У "Алисы" есть запретные темы, которые она не хочет обсуждать, в том числе и географические. Вы над этим будете работать?
— Мы над этим активно работаем, но процент таких случаев действительно низкий, единицы процентов. И за четыре месяца мы на треть этот показатель снизили. Задача в том, чтобы свести его ближе к нулю, чтобы отвечать почти на любые вопросы.
Вы можете заметить, что сервис "Нейро" сейчас ведет себя так: если вы задаете ему вопрос, нет практически ни одной темы, где он уйдет от ответа.
Тем не менее, есть какие-то вопросы, на которые мы отвечать не хотим и фундаментально не захотим. В "Алисе" у нас существует "детский режим", который ограждает детей от взрослого контента. А в "Нейро", например, если человек спрашивает, как совершить суицид, мы не даем 10 самых легких способов. Такие запросы к нам тоже попадают. Если человек его задает, мы даем ему телефон доверия, а не ответ на этот вопрос.
Поэтому абсолютный ноль отказов отвечать на вопрос нам не кажется целесообразным. Цель состоит в том, чтобы увидеть, что существуют полярные точки зрения на ряд вопросов, и так и говорить человеку. Но именно отказы отвечать на вопросы должны приблизиться к нулю — и это вопрос скорее месяцев, чем лет, скажем так. И то, что мы умеем делать, видно в "Нейро".
LLM (большая языковая модель – ред.) как технология позволяет буквально сделать выжимку, ее можно спросить: а ты видишь в этой теме существенную полярность? И модель может сама увидеть, что здесь существует полярные точки зрения. Буквально сейчас так и работает "Нейро", подгружая информацию прямо из поиска.
— Если какое-то трагическое событие произошло буквально час назад и уже есть в поиске, как предупредить "Нейро", что это сложная тема, или по ней нужен осторожный ответ? Или сервис уже сам это научился различать?
— У нас есть целая команда по этике искусственного интеллекта, которая заранее работает над десятками сложных сценариев вроде того, о котором вы говорите. Если что-то случилось, мы не видим причины, чтобы об этом не рассказать все, что уже есть в интернете — все варианты, которые там изложены.
Если "Алису" спросить: считаешь ли ты какое-то трагическое событие допустимым, ответ должен быть, конечно, нет. И дальше она может обобщать и все верно понимать, сама, без нас — это и есть чудо искусственного интеллекта. А "Нейро" в целом не ответит на такой вопрос, потому что он не дает никаких оценок, а просто ищет информацию в интернете.
— Планируете ли вы интегрировать "Нейро" в "Алису"?
— Надо понимать, что это фундаментально разные продукты. "Алиса" — это ассистент, ее фундаментальная задача — помогать с личными аспектами, с частной жизнью, если хотите. Мы выйдем точно и в профессиональную область, но это все еще внутреннее пространство человека, его жизнь.
"Нейро" — это инструмент быстрой работы со всем внешним миром. Есть интернет, который обновляется с бешеной скоростью, множество контента. И задача "Нейро" – давать максимально точный и при этом взвешенный, обогащенный ответ с источниками. Фундаментально это скорее инструмент для анализа огромного объема информации, максимально точного, объективного. Это не вопрос специальных ограничений, которые мы закладываем, это вопрос векторов развития.
— Вы сами пользуетесь поиском "Яндекса" или конкурентами тоже?
— Я пользуюсь, конечно, всеми поисковыми системами, чтобы понимать, что нам удается лучше, что коллегам удается лучше. Корейским Naver я стараюсь пользоваться. Их на самом деле не так много, стран, которые сделали собственные поисковые машины, меньше, чем тех, у которых есть космические программы. И это чудо, когда кому-то тоже удалось. И у всех основных мировых поисковых машин — это Bing, Google, Naver, Yahoo — есть какие-то отдельные аспекты, которые нам очень нравятся. И не меньше таких аспектов, которые, нам кажется, у нас лучше работают.
Потому что мы стараемся работать над локальностью, у нас есть поиск по врачам, которого вообще нет у Google, потому что глобальной компании это очень сложно сделать. При этом есть и универсальные и глобальные решения, которые, может быть, у нас могут чуть отставать.
Но в целом это такой постоянный классный спорт, где ты ходишь на площадку, и кто-то там научился какой-то трюк делать, и вдохновляешься тоже, бежишь его делать, потом сам показываешь кому-то.
— Видно, что вы любите свою работу.
— Точно.
— Давайте про "Нейро" поговорим. Вы совсем недавно его запустили, насколько он оказался популярным?
— Мы проводили коридорный тест — то есть когда ты случайному человеку показываешь продукт — и по нему мы видим очень яркую, хорошую реакцию. Нашим поиском пользуется в месяц порядка 100 миллионов человек, "Нейро" уже воспользовались близко к 8 миллионам, притом, что мы не на всех поверхностях его раздаем. Формальные показатели хорошие: почти половина из тех, кто попользовался, остаются в продукте, и для нового продукта это очень-очень хороший показатель.
Если говорить об объемных метриках, то поисковые запросы очень хорошо растут: где-то на 8% год к году, если сравнивать второй квартал. В том числе, мы уверены в том, что это связано с "Нейро". Основная задача теперь — это научиться зарабатывать на нем, поскольку нейроответы в любом виде стоят в примерно в 5 раз больше, чем традиционные, не генеративные. "Нейро" мы запустили без какой-либо прямой или непрямой монетизации, без подписки, без рекламы, и сейчас мы начинаем тестировать и решать эту задачу так, чтобы это не влияло на качество ответов, и при этом мы могли что-то на этом зарабатывать.
Как только задача будет решена в достаточной мере, мы начнем работать над масштабированием продукта. Сейчас мы просто дали к нему доступ. Мы хотим сконцентрироваться на том, чтобы сделать "Нейро" самоподдерживающимся — это вопрос какого-то количества месяцев, этот год, или, может быть, начало следующего, мы посмотрим.
— Это будет рекламная монетизация или подписка?
— Мы рассматриваем все эти сценарии, и сценарий подписки тоже, но это не сценарий по умолчанию.
— Что сейчас спрашивают у "Нейро"?
— В основном — образование, 30% запросов с ним связано, и это, мне кажется, отражение самой сути продукта. То есть школьники, студенты, взрослые пытаются разобраться в каких-то вопросах наук и гуманитарных, и естественных.
Где-то четверть запросов связана с какими-то специфическими сценариями, информационными запросами, например, пересказ футбольных матчей сейчас очень актуален, детали сюжета фильмов. В 5% запросы похожи на обычный поиск, они связаны с тем, как "хорошо жить" — сон, диета и так далее. То есть самый большой срез вопросов связан все еще с познанием окружающей действительности или образованием.
— Давайте на примере, вот я студент и написала курсовую с помощью YandexGPT. Сможете ли вы как мой преподаватель понять, что я написала ее не сама?
— Проблема понятная, и сложность, конечно, с этим есть. Хороший преподаватель, задав несколько устных вопросов, легко может понять, насколько человек владеет материалом.
Это один из самых больших рисков — что качество образования может снизиться. Но у меня появилась и крепнет уверенность в том, что генеративные технологии улучшат качество образования, и я это вижу на собственном опыте — я учу второй язык иностранный достаточно активно, в том числе при помощи нейросетей.
То есть в ближайшие несколько лет абсолютно всем людям, даже в малонаселенном пункте, где нет школ, будет доступен обучающий продукт очень хорошего качества. Я считаю, что генеративные технологии гораздо больше сделают, чем навредят, хотя, конечно, найдется студент или школьник, который захочет схитрить. И это нормально, все мы списывали, вероятно.
— Вы сказали, что полностью доверяете "Алисе", при этом есть множество сценариев, которые по-разному обыграны в кино, когда искусственный интеллект выходит из-под контроля. Вы такого не боитесь?
— Смотрите, когда я говорю, что я доверяю ему на 100%, это не значит, что технология не может ошибаться. Когда я говорю, что я доверяю папе своему на 100%, а я ему на 100% доверяю, конечно, я отдаю отчет о том, что папа тоже может ошибаться. Здесь вопрос интенций и какой-то прозрачности.
Я верю, что и наш искусственный интеллект фундаментально настроен и устроен таким образом, чтобы помогать. Конечно, мы прямо сейчас можем увидеть в наших инструментах "галлюцинации". Но я понимаю, что это может быть, и все равно доверяю.
Понимаю, что, если речь идет о какой-то чувствительной теме, можно и нужно перепроверить. При этом надо понимать, что и "Алиса", и "Нейро" – это универсальные инструменты. И чем более универсальный продукт ты делаешь, тем, конечно, больше шанс на неточность.
Когда мы тестируем технологию на огромной корзине запросов, сотнях или тысячах, мы буквально проверяем процент того, с какой частотой происходят эти ошибки, и в каждом нашем новом поколении мы этот процент снижаем. Вот в YandexGPT3 по сравнению с предшественником он на четверть меньше.
— Какой этот процент сейчас?
— Речь идет про единичные проценты, скажем так, меньше десяти. При этом мы учитываем и те случаи, когда это не фундаментально неправильный ответ, он может быть в каком-то аспекте просто неточным.
— А вы, когда проверяете информацию, делаете дополнительный фактчекинг?
— "Нейро" указывает источники обязательно, максимально четко их прописывает. Поэтому нет такого, что я не понимаю, откуда там взялась информация, и могу проверить ее самостоятельно. Это я имел ввиду, говоря, что это инструмент для поиска информации и ответа на сложные вопросы.
— Франшизная модель в вашем случае возможна, чтобы кому-то просто отдать технологию, которую можно будет внедрить в другой стране?
— Да.
— Теоретически возможно или уже практически?
— Практически возможно. Я не говорю про "Алису", однако какие-то из наших продуктов мы готовы были бы так отдавать. Мне не очень нравится слово "франшиза", поскольку подразумевает, что мы отдаем бренд в полное управление. Мы готовы отдавать технологию не под нашим брендом, чтобы она развивалась. Сейчас, мне кажется, у нас таких громких проектов нет, но в международном развитии мы рассматриваем их. На это есть спрос, однозначно. И возможно, мы расскажем в самом ближайшем будущем о чем-то таком.
— Сколько вообще – времени, денег – занимает внедрение в продукты нового языка?
— С YandexGPT вы уже сейчас можете пообщаться на корейском, я недавно сам лично это пробовал, и неплохо получается. С нашими нейросетями я общаюсь на французском и так далее. Нельзя сказать, что она это делает идеально, но вполне хватает на то, чтобы учить язык.
Сделать так, чтобы язык был готов к тому, чтобы использовать его в продакшене можно, это займет какое-то количество месяцев, не лет. Затраты я не могу назвать, боюсь ошибиться, но это не огромные деньги, совершенно точно.
Мы хотим сейчас прийти технологически к тому, чтобы можно было на хорошем уровне сразу много языков поддерживать. Нам кажется, что это в ближайшее время будет возможно. Я думаю, что здесь будет скачкообразное развитие, когда мы будем не по одному добавлять, а целые группы.
— Это связано с тем, что "Яндекс Переводчик" недавно анонсировал добавление нескольких национальных языков, в том числе народов России?
— Мы придем и в этом направлении к единому стеку технологий вокруг LLM. Большие языковые модели позволяют это делать не парой — сейчас в "Яндекс Переводчике" нужно выбирать пары. И от этого зависит, что под капотом будет отвечать на такие запросы. Именно LLM как новый тип нейросетей позволит нам двигаться здесь пучками, а не отдельно парой языков. Это наша попытка сделать продукт, который способен закрывать задачи людей — предоставить новые возможности общения носителям относительно небольших языков, и дать толчок развитию LLM подходов к языкам.
— Давайте поговорим про ваш автономный транспорт – такси, роверы. Сейчас у них пока узкий ареал обитания, куда и когда поедете дальше?
— Если про роверы, то это продукт, который сейчас буквально находится в активном распоряжении пользователей и очень активно развивается. Мы сейчас в Москве доставляем в семи районах. Не так давно запустили доставку в Сити, что было очень сложно, поскольку там не очень однородное, непохоже на остальной город дорожное полотно, есть сложности с навигационным сигналом, очень много пешеходов.
У нас удвоилось количество ресторанов и магазинов, из которых мы доставляем — до 400, и оно растет буквально каждую неделю. Основной прорыв, который здесь должен случиться в ближайшие несколько кварталов, когда мы должны сравняться по стоимости доставки с обычными доставками. И сделать так, что ровер как экономическая единица окупался в достаточно небольшой срок, небольшое количество лет. Мы позитивно настроены и довольно хорошо идем к этому.
Я думаю, что мы станем одними из первых в мире, кто на масштабе страны, города будет использовать роверы в качестве одного из основных способов доставки.
— А собираете вы их где?
— Роботы производятся в Москве в нашем Инженерном центре автономного транспорта. Есть небольшое количество компонентов и узлов, которые разработаны нами, но производятся в Китае.
— Сколько стоит один ровер?
— Этого мы не раскрываем.
— Сопоставимо с автомобилем?
— Скажем так, есть автомобили, которые столько стоят. Это, на самом деле, не совсем сейчас интересный вопрос, поскольку буквально квартал к кварталу его стоимость очень бодро снижается. Сейчас это дороже, чем мы бы хотели.
— Какой следующий город для роверов будет?
— Не так важно, возможно, Новосибирск. Я всегда за то, чтобы мы развивались не только в столицах, а пробовали запускаться в разных климатах, в том числе, потому что одна из сложностей здесь – это снег. И в этом смысле нам сложнее, чем западным коллегам.
— Ваши беспилотные автомобили сейчас ездят по трассе M4, планируете запустить их на другие федеральные трассы?
— Мы, конечно, будем расширяться. Сейчас нам М4 хватает как тестовой площадки, но в планах есть и М11, и М12, это поступательно будет происходить.
— Вопрос исчезновения человека из беспилотного такси — это вопрос какого количества лет?
— Я не хочу здесь попадать в какую-то ловушку, в которую попадали наши международные коллеги, которые обещали конкретные сроки. Задача очень сложная, это видно буквально по всему миру, который уже 10 лет решает эту задачу. Мы, Штаты и Китай находимся сейчас в технологическом авангарде. И мы довольны тем, как развиваемся, но я не хочу называть какой-то точный срок.
— А количество ДТП тоже снижается?
— У нас серьезных ДТП вообще не было. Были единичные истории, когда поцарапался кузов, это настолько редко происходит, что на таких малых числах даже статистика не работает.
— Как у вас сейчас растут продажи умных устройств в целом?
— Не буду говорить конкретно, поскольку такие цифры мы можем давать только на официальном раскрытии, но продажи продолжают расти двузначными значениями.
— Вы говорили, что хотите, чтобы в каждой семье, в каждом доме была "Алиса". Насколько вы близки к этой цели и сколько осталось до того, чтобы ее достичь?
— Зависит от города. Надо понимать, что чаще в крупных городах наше проникновение гораздо больше, чем в небольших, но бывают и исключения. Мы хорошо движемся в направлении цели, чтобы буквально в каждой семье "Алиса" была. Пока это прекрасное далеко, но по процентам каждые несколько месяцев мы точно добавляем.
Я думаю, что это перспектива нескольких лет — в России порядка 50 миллионов домохозяйств, в последний раз мы говорили, что продали более 10 миллионов устройств. То есть, конечно, это не завтра произойдет. Но мы бы очень хотели, чтобы как можно больше семей нам себя доверили.