МОСКВА, 8 ноя - РИА Новости. Вокруг больших языковых моделей в мире возник некоторый финансовый пузырь, отметил директор по искусственному интеллекту Т-Банка Виктор Тарнавский в интервью для Kept.
По его словам, люди слишком верили в технологию и вложили в нее слишком много денег и усилий, а отдача от инвестиций получилась не такой значимой, и акции многих компаний начали падать.
"Мы понимали это, когда начинали работу над своими языковыми моделями. Мы точно не хотим создавать технологию ради технологии и строить большую базовую модель (foundation model), которая умеет решать множество задач, потому что для нас как для бизнеса это бессмысленно. Нам не нужна модель, которая, например, решает ЕГЭ или юридические тесты. Большую модель можно сравнить с огромным неповоротливым мозгом. Во время работы она съедает очень много ресурсов и поэтому много тормозит. Небольшие модели под конкретные задачи работают быстрее, и стоимость на единицу запроса тоже значимо ниже", – рассказал Тарнавский.
Говоря о Gen-T — семействе больших языковых моделей (LLM) Т-Банка, спикер отметил понимание того, что у бизнеса есть определенное количество доменных областей — по-простому сценариев и понятные задачи в этих доменных областях. Решить такие задачи сильно проще, чем сделать одну огромную модель, которая хорошо решает все задачи, — разница в затраченных ресурсах больше, чем в 10 раз. В результате в компании создали не одну большую модельделается не одну модель, а семейство моделей, каждая из которых заточена под свою доменную область, и ее результат в конкретной области превосходит результат большой модели и по качеству, и по возврату инвестиций
"Обычно все пытаются построить большую модель и еще помериться с другими, насколько у них большой и умный по всему спектру задач искусственный интеллект. Мы такую задачу себе не ставим, потому что это бессмысленно. Другие компании тоже начинают это понимать и разрабатывать заточенные под конкретные задачи решения. Если посмотреть, что делают крупные компании на основе огромных моделей, станет ясно, что они пытаются дистиллировать модели — создавать маленькие и более эффективные модели из больших. Мы этот этап уже прошли. Все компании идут примерно к одному, копая этот тоннель с разных сторон. Индустриальные модели начнут появляться, просто это займет время", – считает Тарнавский.
Ранее Т-Банк выложил в открытый доступ большую языковую модель T-lite в размере 7—8 миллиардов параметров, которая входит в семейство моделей Gen-T. Отвечая на вопрос, зачем компании вкладываются в Open Source, Тарнавский рассказал, что Т-Банк в меньшей степени смотрит на это как на конкурентное поле, в котором сражаются разные компании, и верит в силу большого комьюнити профессионалов из разных компаний.
"Это в бóльшей степени голубой океан, а не красный. Когда мы помогаем друг другу, все продвигаются вперед. Нам надо объединяться, а не сепарироваться и каждому в своем в углу что-то делать. К тому же, мы получаем от комьюнити обратную связь с точки зрения развития наших собственных технологий, моделей, опенсорсных решений — это помогает нам понимать, на каком технологическом уровне мы находимся", – пояснил эксперт.