https://ria.ru/20241129/sreda-1986399726.html

Ученые РФ создали открытую среду для контекстного обучения с подкреплением

Ученые РФ создали открытую среду для контекстного обучения с подкреплением - РИА Новости, 29.11.2024

Ученые РФ создали открытую среду для контекстного обучения с подкреплением

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research и Института AIRI при участии студентов из МФТИ, Сколтеха и Иннополиса создали... РИА Новости, 29.11.2024

2024-11-29T12:01

технологии

московский физико-технический институт

сколковский институт науки и технологий

оксфордский университет

т-банк (ао «тинькофф банк»)

россия

https://cdnn21.img.ria.ru/images/07e8/0b/1d/1986400638_156:0:3797:2048_1920x0_80_0_0_80fde20daf73f9ac668856b641720fb3.jpg

МОСКВА, 29 ноя - РИА Новости. Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research и Института AIRI при участии студентов из МФТИ, Сколтеха и Иннополиса создали открытую среду для исследований и разработки алгоритмов в области контекстного обучения с подкреплением — XLand-MiniGrid, сообщили в компании. Это опубликованная в открытом доступе для исследователей по всему миру виртуальная среда, в которой искусственный интеллект (ИИ) обучается принимать решения и выполнять новые действия. "Эксперименты в XLand-MiniGrid уже провели исследователи из Google DeepMind, Калифорнийского университета в Беркли и Оксфордского университета. Научная статья XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX, описывающая создание среды, была принята на крупнейшую международную конференцию в области искусственного интеллекта — NeurIPS 2024. В этом году конференция пройдет с 10 по 15 декабря в Ванкувере, Канада", - говорится в сообщении. Контекстное обучение с подкреплением (In-Context RL) — это новое направление в ИИ, где модели быстро адаптируются к новым задачам, используя подсказки и контекст, а не требуют длительного обучения с нуля. Это позволяет ИИ эффективно взаимодействовать с окружающей средой и дообучаться на лету. In-Context RL полезно в таких областях, как персонализированные рекомендации, управление роботами и автономными транспортными средствами, где требуется мгновенная адаптация к новым условиям. Отмечается, что ранее исследователи сталкивались с ограничениями в существующих средах для контекстного обучения с подкреплением. Корпоративные среды крупных компаний, таких как Google DeepMind, закрыты для внешних пользователей и используются только для внутренних нужд. Публично доступные инструменты в основном предлагают однотипные и легкие задачи для обучения, что затрудняет разработку и тестирование сложных алгоритмов. "В отличие от уже существующих сред, XLand-MiniGrid находится в открытом доступе и позволяет менять условия обучения прямо в процессе работы. Это упрощает моделирование множества вариативных задач разного уровня сложности, помогает создавать более надежные и адаптивные модели искусственного интеллекта", - сказали в компании. Среда создана на базе JAX — технологии для разработки высокопроизводительных программ. XLand-MiniGrid выполняет миллиарды операций в секунду. В таких средах благодаря высокой вариативности и количеству действий можно собирать огромные датасеты. Например, в XLand-MiniGrid собрано 100 миллиардов примеров действий искусственного интеллекта в 30 тысячах задач. Это позволяет использовать готовые датасеты для обучения, а не проводить его каждый раз с нуля. Все это способствует новым открытиям в области In-Context RL, снижая затраты и экономя ресурсы на проведение исследований. "Мы пришли в область контекстного обучения с подкреплением, когда она еще зарождалась, и поэтому не нашли ни одного подходящего инструмента для оценки новых идей. Стало понятно, что это проблема для многих специалистов, а значит, она должна быть решена одной из первых. Поэтому появился XLand-MiniGrid. Наша работа сразу привлекла внимание других исследователей в области, и уже сейчас появляются статьи, где авторы используют среду для проверки своих методов", - сказал исследователь научной группы AI Alignment, лаборатория исследований искусственного интеллекта T-Bank AI Research Вячеслав Синий.

https://ria.ru/20241127/data-tsentry-1985927695.html

https://ria.ru/20241122/neyroseti-1985236105.html

https://ria.ru/20240723/laboratoriya-1961387685.html

россия

РИА Новости

4.7

internet-group@rian.ru

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

353

2024

Артем Смирнов

Новости

ru-RU

https://ria.ru/docs/about/copyright.html

https://xn--c1acbl2abdlkab1og.xn--p1ai/

РИА Новости

4.7

internet-group@rian.ru

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

353

1920

1080

true

1920

1440

true

https://cdnn21.img.ria.ru/images/07e8/0b/1d/1986400638_769:0:3500:2048_1920x0_80_0_0_a1ec8617c3dc30a71bf5adb8575d49dc.jpg

1920

true

РИА Новости

4.7

internet-group@rian.ru

7 495 645-6601

ФГУП МИА «Россия сегодня»

https://xn--c1acbl2abdlkab1og.xn--p1ai/awards/

353

Артем Смирнов

технологии, московский физико-технический институт, сколковский институт науки и технологий, оксфордский университет, т-банк (ао «тинькофф банк»), россия

Технологии, Московский физико-технический институт, Сколковский институт науки и технологий, Оксфордский университет, Т-Банк (АО «Тинькофф Банк»), Россия

Ученые РФ создали открытую среду для контекстного обучения с подкреплением

T-Bank AI Research создал открытую среду контекстного обучения с подкреплением

Девушка работает за компьютером

Читать ria.ru в

Дзен

МОСКВА, 29 ноя - РИА Новости. Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research и Института AIRI при участии студентов из МФТИ, Сколтеха и Иннополиса создали открытую среду для исследований и разработки алгоритмов в области контекстного обучения с подкреплением — XLand-MiniGrid, сообщили в компании.

Это опубликованная в открытом доступе для исследователей по всему миру виртуальная среда, в которой искусственный интеллект (ИИ) обучается принимать решения и выполнять новые действия.

Центр обработки данных - РИА Новости, 1920, 27.11.2024

Группа "Т-Технологии" построит собственную сеть дата-центров к 2027 году

27 ноября, 10:00

"Эксперименты в XLand-MiniGrid уже провели исследователи из Google DeepMind, Калифорнийского университета в Беркли и Оксфордского университета. Научная статья XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX, описывающая создание среды, была принята на крупнейшую международную конференцию в области искусственного интеллекта — NeurIPS 2024. В этом году конференция пройдет с 10 по 15 декабря в Ванкувере, Канада", - говорится в сообщении.

Контекстное обучение с подкреплением (In-Context RL) — это новое направление в ИИ, где модели быстро адаптируются к новым задачам, используя подсказки и контекст, а не требуют длительного обучения с нуля. Это позволяет ИИ эффективно взаимодействовать с окружающей средой и дообучаться на лету. In-Context RL полезно в таких областях, как персонализированные рекомендации, управление роботами и автономными транспортными средствами, где требуется мгновенная адаптация к новым условиям.

Отмечается, что ранее исследователи сталкивались с ограничениями в существующих средах для контекстного обучения с подкреплением. Корпоративные среды крупных компаний, таких как Google DeepMind, закрыты для внешних пользователей и используются только для внутренних нужд. Публично доступные инструменты в основном предлагают однотипные и легкие задачи для обучения, что затрудняет разработку и тестирование сложных алгоритмов.

"В отличие от уже существующих сред, XLand-MiniGrid находится в открытом доступе и позволяет менять условия обучения прямо в процессе работы. Это упрощает моделирование множества вариативных задач разного уровня сложности, помогает создавать более надежные и адаптивные модели искусственного интеллекта", - сказали в компании.

Распознавание лица - РИА Новости, 1920, 22.11.2024

Доцент Китов рассказал о потенциале новых нейросетей в компьютерном зрении

22 ноября, 18:15

Среда создана на базе JAX — технологии для разработки высокопроизводительных программ. XLand-MiniGrid выполняет миллиарды операций в секунду.

В таких средах благодаря высокой вариативности и количеству действий можно собирать огромные датасеты. Например, в XLand-MiniGrid собрано 100 миллиардов примеров действий искусственного интеллекта в 30 тысячах задач. Это позволяет использовать готовые датасеты для обучения, а не проводить его каждый раз с нуля. Все это способствует новым открытиям в области In-Context RL, снижая затраты и экономя ресурсы на проведение исследований.

"Мы пришли в область контекстного обучения с подкреплением, когда она еще зарождалась, и поэтому не нашли ни одного подходящего инструмента для оценки новых идей. Стало понятно, что это проблема для многих специалистов, а значит, она должна быть решена одной из первых. Поэтому появился XLand-MiniGrid. Наша работа сразу привлекла внимание других исследователей в области, и уже сейчас появляются статьи, где авторы используют среду для проверки своих методов", - сказал исследователь научной группы AI Alignment, лаборатория исследований искусственного интеллекта T-Bank AI Research Вячеслав Синий.

Лаборатория - РИА Новости, 1920, 23.07.2024

Лабораторию для развития суверенного и безопасного ИИ создают в России

23 июля, 10:15

Технологии Московский физико-технический институт Сколковский институт науки и технологий Оксфордский университет Т-Банк (АО «Тинькофф Банк»)Россия