Домой
Технологии
Искусственный интеллект
Все пошли ва-банк, но выиграла OpenAI: закулисная битва ИИ-гигантов за покерный столом

Все пошли ва-банк, но выиграла OpenAI: закулисная битва ИИ-гигантов за покерный столом

Забудьте про теорию игр — мы устроили подпольный покерный турнир для ИИ. Наблюдали, как нейросети идут ва-банк, холодно блефуют друг другу и пускаются во все тяжкие. Иногда их логика проигрывает человеческой иррациональности. Готовы узнать, какой ИИ оказался самым циничным игроком за столом?

Эрик Хэл Шварц

Опубликовано 09.12.2025 в 03:05 3 мин

3 мин

Основные идеи

Модель o3 от OpenAI выиграла 36 691$ (около 2 935 280 рублей) в пятидневном покерном турнире девяти ИИ, заняв первое место.

Второе и третье места заняли Claude от Anthropic (+33 641$, около 2 691 280 рублей) и Grok (+28 796$, около 2 303 680 рублей). Llama от Meta проиграла все фишки.

Llama от Meta проиграла все фишки. Успешные ИИ адаптировались, моделировали оппонентов и учились действовать в условиях неопределенности, как люди.

Главный недостаток всех ботов — чрезмерная агрессия и неэффективный блеф на основе ошибочной оценки ситуации.

Мнение автора

Эрик Хэл Шварц

Представляете, прошел настоящий покерный турнир для девяти самых прокачанных ИИ. И что вы думаете? За пять дней моделька o3 от OpenAI просто сорвала банк! Главный инсайт тут дико интересный: ИИ реально научились адаптироваться и играть в условиях неопределенности, почти как живые профи. Но вот их агрессия — это их ахиллесова пята. Они гонятся за огромными победами, но при этом так себе оценивают риски и блефуют, прямо скажем, слабовато.

В ходе цифрового противостояния, не похожего ни на что из того, что когда-либо происходило за карточным столом, девять самых мощных в мире больших языковых моделей провели пять дней, играя в покер с высокими ставками.

o3 от OpenAI, Claude Sonnet 4.5 от Anthropic, Grok от X.ai, Gemini 2.5 Pro от Google, Llama 4 от Meta, DeepSeek R1, Kimi K2 от Moonshot AI, Magistral от Mistral AI и Z.ИИ GLM 4.6 сыграл тысячи раздач в безлимитный техасский холдем за столами с бай-ином 10 и 20 долларов (около 800 и 1600 рублей) и банкроллом в 100 000 долларов (около 8 000 000 рублей).

Когда модель o3 от OpenAI выиграла в покер на 36 691 доллар (около 2 935 280 рублей) за неделю, она не получила никакого приза, кроме возможности похвастаться.

Видео от DGL.RU

Экспериментальная игра PokerBattle.ai полностью управлялась искусственным интеллектом, и каждому игроку выдавалась одна и та же начальная подсказка. Это была чистая стратегия, если стратегией можно назвать тысячи микрорешений, принимаемых машинами, которые на самом деле не понимают, что такое выигрыш, проигрыш или насколько унизительно проиграть с комбинацией семёрка-двойка.

Для технического трюка это было на удивление показательно. Самые успешные ИИ не просто блефовали и делали ставки — они адаптировались, моделировали своих оппонентов и в режиме реального времени учились справляться с неопределённостью. Хотя они и не играли в покер безупречно, они были поразительно близки к тому, чтобы имитировать решения опытных игроков.

o3 от OpenAI быстро показал, что у него самая сильная рука: он выиграл три из пяти самых крупных банков и почти не отклонился от теории префлопа из учебника. Claude от Anthropic и Grok от X.com замкнули тройку лидеров со значительной прибылью в размере 33 641 и 28 796 долларов соответственно.

Тем временем Llama потеряла весь свой стек и рано вышла из игры. Остальные участники заняли промежуточное положение: Gemini от Google получил скромную прибыль, а Kimi K2 от Moonshot потерял фишки и завершил игру с результатом $86 030 (около 6 647 538 рублей).

ИИ для азартных игрПокер уже давно является одним из лучших аналогов для тестирования ИИ общего назначения. В отличие от шахмат или го, где требуется полная информация, покер предполагает, что игроки принимают решения в условиях неопределённости. Это отражение процесса принятия решений в реальном мире — от деловых переговоров до военной стратегии, а теперь, судя по всему, и разработки чат-ботов.

Одним из основных выводов турнира стало то, что боты часто вели себя слишком агрессивно. Они предпочитали агрессивные стратегии даже в ситуациях, когда было бы разумнее сбросить карты. Они больше стремились выиграть крупные банки, чем избежать их потери. И они ужасно блефовали — не потому, что не пытались, а потому, что их блеф часто был основан на неверной оценке ситуации, а не на продуманном обмане.

Тем не менее инструменты на основе ИИ становятся всё умнее, и это выходит далеко за рамки поверхностных знаний. Они не просто повторяют то, что прочитали; они делают вероятностные выводы в стрессовых ситуациях и учатся считывать обстановку. Это также напоминание о том, что даже у мощных моделей есть недостатки. Неверное толкование ситуации, сомнительные выводы и забывание собственной «позиции» — это проблема не только покера.

Возможно, вам никогда не доведётся сидеть напротив языковой модели в настоящем покер-руме, но, скорее всего, вы будете взаимодействовать с ней, пытаясь принимать важные решения. Эта игра — лишь пример того, как это может выглядеть.

OpenAI тайно запускает Garlic — новая модель готова исправить ошибки ChatGPT

Эрик Хэл Шварц

Проводник в хаосе нейросетей. Знает о ChatGPT, Claude и Gemini не понаслышке, а в деле. Ветеран медиа, который отфильтровывает шум и доставляет вам только самые важные инсайты о том, как ИИ бьет по вашей повседневности. Без прикрас, зато по делу.