Искусственный интеллект впервые победил лучших игроков в покер

МОСКВА, 3 мар – Москва.Ру. Искусственный интеллект DeepStack впервые в истории человечества обыграл 11 лучших игроков в покер во время онлайн-турнира. Программа затрачивала на обдумывание хода не более пяти секунд, говорится в статье, опубликованной в журнале Science.

«Покер всегда был большой проблемой для искусственного интеллекта. Игроки в покер всегда страдают от недостатка информации, потому что каждый игрок знает только свои карты и видит игровую ситуацию со своей стороны. В принципе, все проблемы в реальном мире такие – у каждого свое видение того, что происходит на Земле», — заявил Майкл Боулинг (Michael Bowling) из университета Альберты в Эдмонтоне (Канада).

В прошлом году одной из главных новостей мира науки стало создание системы искусственного интеллекта AlphaGo, совершившей невозможное. Она обыграла чемпионов Европы и мира древнюю китайскую игру Го, которая раньше считалась недоступной для компьютеров из-за высокой вычислительной сложности. В январе этого года инженеры Google проверили новую версию программы на игроках, которые не знали, что играют с искусственным интеллектом.

Боулинг и его команда уже более десяти лет работают над созданием сложных систем искусственного интеллекта, способных предугадывать действия людей и события в реальном мире, не имея полных данных о том, что знает или не знает человек, и как ведут себя другие объекты.

Даже если убрать психологическую компоненту игры в покер, просчет всех возможных комбинаций и действий даже в самых простых версиях игры, как рассказывает Боулинг, невозможно осуществить — их число превышает количество атомов во Вселенной и приближается к числу возможных ходов в Го (десять в 160 степени вариантов для карточной игры).

Для решения этой проблемы Боулинг и его коллеги разработали специальную нейросеть DeepStack, которая просчитывает действия игрока не на протяжении всей партии, как это обычно делают подобные системы, а только в текущий момент времени и в «соседние» промежутки.

Ученые называют этот подход кибернетическим аналогом чувства интуиции у настоящего игрока в покер, который «чувствует нутром», когда нужно поднимать ставки или сбрасывать карты. По сути, стратегия победы по версии DeepStack основывается на принципиальном отсутствии общей стратегии игры. Программа играет «по ситуации», каждую из ситуаций она непрерывно проигрывает у себя в «памяти».

Подобный эвристический метод позволил исследователям заметно сократить число просчитываемых вариантов, не теряя при этом в точности работы, и научить программу выбирать оптимальный ход всего за пять секунд работы на ноутбуке средней мощности с видеокартой, поддерживающей потоковые вычисления.

Работу этой системы программисты проверили на турнире с участием 11 лучших игроков в покер, который проходил в декабре 2016 года под эгидой Международной федерации покера. Каждый игрок сыграл 3000 партий с машиной на протяжении примерно месяца. Ни одному из них не удалось одержать победу над Deepmind: десять игроков проиграли вчистую, а одному почти удалось свести серию к ничье. Таким образом, ИИ удалось одержать очередную победу над человеком, на этот раз в игре, где доступ к информации является по определению неполным.