МОСКВА, 18 дек – РИА Новости. Американские ученые создали новую систему искусственного интеллекта, обыгравшую четырех сильнейших игроков в так называемый "техасский холдем" – самый популярный вид покера, говорится в статье, опубликованной в журнале Science.
За последние два года программисты и математики совершили настоящий прорыв в области создания систем искусственного разума, превосходящих человека в умении играть в определенные стратегические и азартные игры. К примеру, в прошлом году ученые создали ИИ AlphaGo, способную играть в древнекитайскую стратегию го лучше чемпионов Европы и мира, а в этом году они представили ее новую версию, способную учиться без участия человека.
Помимо го, системам ИИ покорилась еще одна сверхсложная игра – покер. В марте прошлого года канадские программисты из университета Альберты создали искусственный разум DeepStack, способный играть в одну из простейших версий покера. Ему удалось стать победителем на одном из турниров по покеру, который проводился под эгидой Международной федерации покера.
Покер, как объясняет Браун, одновременно и сложнее, и легче, чем го – вариантов в нем меньше, чем в китайской стратегии, но при этом у него есть одно существенное различие. В отличие от игроков в го, любители покера не вынуждены действовать, не имея полных данных о том, что знает или не знает их соперник, какие карты он имеет на руках и что он может сделать.
Единственным источником информации для них являются те карты, которые имеются у них на руках, возможный набор из нескольких резервных карт, который крупье выкладывает на стол, а также мимика, жесты и прочие аспекты поведения соперников. Оценка всех этих факторов является неимоверно сложной задачей для машины, что часто вынуждает ученых идти на использование различных "заготовок" для облегчения ей задачи или на упрощение правил игры.
Браун и его коллега Туомас Сандхольм (Tuomas Sandholm) создали систему ИИ, не нуждающуюся в подобной поддержке, научив свое детище, Libratus, мыслить "абстрактно". Иными словами, эта версия искусственного разума умеет находить общие черты в различных комбинациях карт, ставок и прочих элементов игры, и считать их примерно одним и тем же вариантом развития событий, что существенно упрощает игру и позволяет находить простые решения для самых очевидных комбинаций карт и вариантов ходов соперника.
Если же ход партнера по игре является неожиданным для машины, то она просчитывает его последствия отдельно, используя мощности суперкомпьютера, и ищет безопасные варианты продолжения игры, которые помогли бы ей выиграть или хотя бы минимизировать потери.
Удачные версии этих новых ходов записываются в специальную "книгу стратегий", которую Libratus использует в последующих раундах игры.
Протестировав работу этой системы в играх с предыдущими версиями ИИ, ученые пригласили четырех ведущих игроков в "техасский холдем" – Джейсона Леса, Дона Кима, Дэниэла Макоули и Джимми Чоу — сыграть с машиной в небольшой турнир с призовым фондом в 200 тысяч долларов, 10% которого гарантированно доставались каждому мастеру.
Этот чемпионат завершился разгромом людей – к концу соревнования на "руках" Libratus имелось огромное число фишек, чья совокупная стоимость составляла 1,8 миллиона долларов, которые он выиграл у каждого игрока по-отдельности. По сути, если бы чемпионат проводился полностью "честно", то весь призовой фонд ушел бы искусственному разуму.
Как отмечают ученые, Libratus можно применять и для решения других стратегических задач, встречающихся в реальном мире, а также для создания игровых систем для других видов покера и прочих азартных или "обычных" игр