
Все пошли ва-банк, но выиграла OpenAI: закулисная битва ИИ-гигантов за покерный столом
Забудьте про теорию игр — мы устроили подпольный покерный турнир для ИИ. Наблюдали, как нейросети идут ва-банк, холодно блефуют друг другу и пускаются во все тяжкие. Иногда их логика проигрывает человеческой иррациональности. Готовы узнать, какой ИИ оказался самым циничным игроком за столом?
Основные идеи
Мнение автора
Представляете, прошел настоящий покерный турнир для девяти самых прокачанных ИИ. И что вы думаете? За пять дней моделька o3 от OpenAI просто сорвала банк! Главный инсайт тут дико интересный: ИИ реально научились адаптироваться и играть в условиях неопределенности, почти как живые профи. Но вот их агрессия — это их ахиллесова пята. Они гонятся за огромными победами, но при этом так себе оценивают риски и блефуют, прямо скажем, слабовато.
В ходе цифрового противостояния, не похожего ни на что из того, что когда-либо происходило за карточным столом, девять самых мощных в мире больших языковых моделей провели пять дней, играя в покер с высокими ставками.
o3 от OpenAI, Claude Sonnet 4.5 от Anthropic, Grok от X.ai, Gemini 2.5 Pro от Google, Llama 4 от Meta, DeepSeek R1, Kimi K2 от Moonshot AI, Magistral от Mistral AI и Z.ИИ GLM 4.6 сыграл тысячи раздач в безлимитный техасский холдем за столами с бай-ином 10 и 20 долларов (около 800 и 1600 рублей) и банкроллом в 100 000 долларов (около 8 000 000 рублей).
Когда модель o3 от OpenAI выиграла в покер на 36 691 доллар (около 2 935 280 рублей) за неделю, она не получила никакого приза, кроме возможности похвастаться.
Экспериментальная игра PokerBattle.ai полностью управлялась искусственным интеллектом, и каждому игроку выдавалась одна и та же начальная подсказка. Это была чистая стратегия, если стратегией можно назвать тысячи микрорешений, принимаемых машинами, которые на самом деле не понимают, что такое выигрыш, проигрыш или насколько унизительно проиграть с комбинацией семёрка-двойка.
Для технического трюка это было на удивление показательно. Самые успешные ИИ не просто блефовали и делали ставки — они адаптировались, моделировали своих оппонентов и в режиме реального времени учились справляться с неопределённостью. Хотя они и не играли в покер безупречно, они были поразительно близки к тому, чтобы имитировать решения опытных игроков.
o3 от OpenAI быстро показал, что у него самая сильная рука: он выиграл три из пяти самых крупных банков и почти не отклонился от теории префлопа из учебника. Claude от Anthropic и Grok от X.com замкнули тройку лидеров со значительной прибылью в размере 33 641 и 28 796 долларов соответственно.
Тем временем Llama потеряла весь свой стек и рано вышла из игры. Остальные участники заняли промежуточное положение: Gemini от Google получил скромную прибыль, а Kimi K2 от Moonshot потерял фишки и завершил игру с результатом $86 030 (около 6 647 538 рублей).
ИИ для азартных игрПокер уже давно является одним из лучших аналогов для тестирования ИИ общего назначения. В отличие от шахмат или го, где требуется полная информация, покер предполагает, что игроки принимают решения в условиях неопределённости. Это отражение процесса принятия решений в реальном мире — от деловых переговоров до военной стратегии, а теперь, судя по всему, и разработки чат-ботов.
Одним из основных выводов турнира стало то, что боты часто вели себя слишком агрессивно. Они предпочитали агрессивные стратегии даже в ситуациях, когда было бы разумнее сбросить карты. Они больше стремились выиграть крупные банки, чем избежать их потери. И они ужасно блефовали — не потому, что не пытались, а потому, что их блеф часто был основан на неверной оценке ситуации, а не на продуманном обмане.
Тем не менее инструменты на основе ИИ становятся всё умнее, и это выходит далеко за рамки поверхностных знаний. Они не просто повторяют то, что прочитали; они делают вероятностные выводы в стрессовых ситуациях и учатся считывать обстановку. Это также напоминание о том, что даже у мощных моделей есть недостатки. Неверное толкование ситуации, сомнительные выводы и забывание собственной «позиции» — это проблема не только покера.
Возможно, вам никогда не доведётся сидеть напротив языковой модели в настоящем покер-руме, но, скорее всего, вы будете взаимодействовать с ней, пытаясь принимать важные решения. Эта игра — лишь пример того, как это может выглядеть.
OpenAI тайно запускает Garlic — новая модель готова исправить ошибки ChatGPT


















