Как искусственный интеллект завоевал покер

4
Как искусственный интеллект завоевал покер
29.04.2022 15:57
530
0
29.04.2022 15:57
530

В начале 2022 года в издании New York Times вышла отличная статья Кита Ромера, посвящённая покерным солверам. Журналист не стал концентрироваться на потенциальных опасностях, которые несут собой солверы, а провёл любопытнейшее исследование того, как они изменили покерную стратегию.

Всякий раз, когда мейнстримное СМИ публикует какой-то материал о покере, в сообществе возникает некоторая нервозность. Такие статьи редко бывают достаточно подробными, чтобы точно отражать покер, и зачастую авторы преувеличивают неприглядные аспекты игры.

Тем ценнее работа журналиста New York Times, который написал блестящую статью о влиянии искусственного интеллекта, а именно солверов, на современную игру. На Мировой серии покера, прошедшей осенью 2021 года, Ромер встретился с профессиональными игроками Сэтом Дэвисом, Джейсоном Куном, Айзеком Хекстоном, Дагом Полком и Райаном Лапланте и пообщался с ними о том, как PioSOLVER и другой подобный софт изменил игру.

Конечно, статья не обходит стороной и потенциальные опасности, которые сулят для игры такие технологии, в первую очередь программы-подсказчики в реальном времени (RTA), но основной объект исследования Ромера — это применение теории игр в покере. Он не только рассказал историю этого явления, но и подробно рассмотрел такие вещи, как ICM, соотношение блефа и вэлью, поляризованные диапазоны, смешанные стратегии, бэкинг и винрейты игроков.

В фокус журналиста попал и мир суперхайроллерских турниров: Дэвис и Кун дали много комментариев по игре в браслетном турнире за $250,000, а затем разобрали свои ключевые раздачи.

Статья крайне рекомендуется к прочтению, и эксперты называют её одним из ранних фаворитов на премию Global Poker Awards 2022 в номинации «Лучший письменный контент». Ниже мы приводим её русский перевод без сокращений и изменений, в стилистике, максимально приближённой к авторской.

Хорошие игроки в покер всегда знали, что нужно поддерживать баланс между блефом и прямолинейными действиями. Теперь они могут делать это в совершенстве.

Ноябрь 2021 года, Лас-Вегас. Два десятка мужчин, одетых в основном в толстовки и бейсболки, сидели за тремя обшарпанными покерными столами в огромном зале Amazon Room казино Rio и играли в техасский холдем. Иногда кто-то из прохожих останавливался, чтобы понаблюдать за происходящим, но большую часть времени игроки двигали свои фишки в грязном полумраке. Кроме напряжённой, наэлектризованной неподвижности, с которой они действовали во время раздач, ничто не выдавало в них сильнейших покеристов мира, которые ставят в банк суммы, на которые можно купить дом или хотя бы внести первоначальный взнос по ипотеке. Это был первый из трёх дней суперхайроллерского турнира Мировой серии покера, каждый из участников которого внёс по $250,000. Они называли его просто «250K».

Seth_Davies

За одним столом профессиональный игрок по имени Сэт Дэвис слегка приподнял края своих карт, чтобы рассмотреть только что сданную ему руку: 6d7d. После нескольких часов игры Дэвис увеличил свой стартовый стек с 1,5 миллиона турнирных фишек до двух с лишним миллионов, и часть из этих фишек он двинул вдоль поверхности стола, обозначая рейз. Дэвис, 33-летний бывший бейсболист с коротко постриженной светло-каштановой бородой, сидел прямо и внимательно отслеживал происходящее за столом. Два человека уравняли его ставку, а затем Дэн Смит, ещё один профессионал с круглым лицом, усами и в причудливо надетой ковбойской шляпе, сделал крупный ререйз. Уравнял только Дэвис.

Дилер выложил на стол kc4c5c, что дало Дэвису стрит-дро. Смит прочекал (то есть отказался от ставки). Дэвис поставил. Смит уравнял. Картой тёрна была 2d, которая не помогла дро-руке Дэвиса. Смит снова сыграл чек, а Дэвис ещё раз поставил. Смит опять уравнял. Последней картой сдали 2c, которая окончательно разбила надежды Дэвиса улучшить свою руку. К этому времени банк в центре стола, обитого выцветшим зелёным сукном, вырос до миллиона с лишним фишек. Последняя двойка стала четвёртой трефой на столе — это означало, что если у Смита в руке есть хотя бы одна трефа, то у него теперь флеш.

Дэвис, который всё время ставил, нуждаясь в тройке или восьмёрке, чтобы превратить свою руку в стрит, к концу раздачи пришёл с рукой, которая не стоила ничего. После того как Смит прочекал в третий раз, Дэвис почти минуту обдумывал свой ход, а затем пошёл олл-ин на 1,7 миллиона фишек. Если бы Смит уравнял, то Дэвис бы покинул турнир, а его вступительный взнос $250,000 превратился в пыль из-за одного несвоевременного блефа.

Смит посмотрел на Дэвиса из-под полей своей ковбойской шляпы и скривил лицо, злясь на соперника, а, может, на саму удачу. Наконец, бросив сердитый взгляд, Смит выбросил свои карты, и дилер двинул стопку разноцветных фишек в сторону Дэвиса. По его собственным словам, после окончания этой раздачи Дэвис почувствовал не столько триумф, сколько облегчение:

Когда разыгрываешь банк, эквивалентный $500,000 реальных денег, это чертовски сильный стресс.

Настоящая проверка состоялась только в 2:30 утра, когда первый день турнира закончился и Дэвис вернулся из казино Rio к себе домой в пригород Лас-Вегаса, потратив на дорогу 15 минут. Выйдя из гаража, он открыл компьютерную программу PioSOLVER — один из немногих инструментов на основе искусственного интеллекта, которые за последние несколько лет радикально изменили способ игры в покер, особенно на самых высоких лимитах. Дэвис ввёл в программу все подробности этой раздачи и запустил процесс вычислений. В считанные доли секунды солвер сгенерировал оптимальную стратегию. Программа сказала, что он в основном сыграл правильно. На тёрне, когда пришла двойка бубен, Дэвис вместо 50% банка должен был поставить 80%, но блеф на ривере размером 1,7 миллиона фишек был правильным ходом.

«Я почувствовал себя отлично, даже лучше, чем после выигрыша огромного банка, — сказал Дэвис. — Самое приятное — когда выигрываешь его именно таким образом». Той ночью Дэвис отправился спать в полной уверенности, что разыграл свою руку почти идеально.

Стремление к идеальному покеру восходит к работе «Теория игр и экономического поведения», которую в 1944 году опубликовали математик Джон фон Нейман и экономист Оскар Моргенштерн. Они хотели устранить фундаментальную неопределённость в области экономики. «Мы хотим найти математически полные принципы, определяющие „рациональное поведение“ участников социальной экономики, и вывести из них общие черты этого поведения», — писали авторы. Они предложили рассматривать экономическую жизнь как цепочку «задач максимизации», в которых отдельные люди соревнуются в том, чтобы выжать как можно больше полезности из своего повседневного труда. Идея фон Неймана и Моргенштерна была в том, чтобы количественно описать способ принятия правильных решений и на этой базе построить экономическую науку.

Желание смоделировать процесс принятия экономических решений привело их к играм. Большинство из них фон Нейман отверг как неподходящие для этой задачи, особенно игры вроде шашек и шахмат, в которых оба игрока могут видеть все фигуры на доске и обмениваться одной и той же информацией. «Реальная жизнь не такая, — объяснял он коллеге-математику Джейкобу Броновски. — Реальная жизнь состоит из блефа, небольшого тактического обмана, размышлений о том, каких действий противник ожидает от нас. Именно такие игры подошли бы моей теории». Реальная жизнь, считал фон Нейман, напоминает покер.

Фон Нейман использовал собственную упрощённую версию игры, в которой двум игрокам взакрытую «сдавали» случайные числа, а затем они делали ставки заранее определённого размера на то, какое из чисел окажется выше. Из этого он вывел основу для оптимальной стратегии:

Игроки должны ставить крупно как со своими сильнейшими руками, так и с определённым процентом своих худших рук в качестве блефа. Точный процент блефа зависит от отношения размера ставки к размеру банка.

Фон Нейман смог продемонстрировать, что, блефуя и уравнивая с математически точной частотой, на длинной дистанции игрок сможет играть как минимум в ноль, даже если опишет противнику свою стратегию во всех подробностях. В свою очередь, если противник будет следовать любой стратегии, отличной от идеальной по фон Нейману, то на длинной дистанции он гарантированно проиграет.

«Теория игр» указала путь к будущему, в котором любые виды конкурентных взаимоотношений можно будет моделировать математически: аукционы, подводные боевые действия и даже соревнование биологических видов за то, чтобы передать свои гены будущим поколениям. Но на развитие покерной стратегии открытие фон Неймана не оказало почти никакого влияния до тех пор, пока через пятьдесят с лишним лет этим не занялись сотрудники отдела компьютерных наук канадского Университета Альберты. Первой звездой в области изучения игр был профессор Джонатан Шеффер, который после 18 лет работы нашёл решение для шашек. Преподаватели и студенты университета добились существенного прогресса и в таких разнообразных играх, как го, реверси, StarCraft и популярный в Канаде кёрлинг. Однако покер по-прежнему оставался особенно сложным для просчёта именно по той причине, по которой эта игра так привлекала фон Неймана: скрытая информация мешает игрокам принимать правильные решения.

В шахматах и нардах ходы обоих игроков чётко видны на доске, но в покере компьютер должен интерпретировать ставки противников, не зная их карт. Учёный-компьютерщик Нил Бёрч, почти два десятка лет проработавший в Университете Альберты, а затем ставший сотрудником компании DeepMind, назвал безуспешными первые попытки его команды создать покерный искусственный интеллект: «Мы обнаружили, что если посадить толкового покериста шпилить против нашего компьютера, человек одержит сокрушительную победу».

Отчасти это объяснялось тем, что смоделировать весь набор решений в покерной раздаче очень сложно. В теории игр для графического представления различных исходов игры используется схема в виде разветвлённого дерева. В простейшей игре «камень, ножницы, бумага» это дерево маленькое: три ветви для ваших «камня», «ножниц» и «бумаги», каждая из которых делится ещё на три ветви, соответствующих «камню», «ножницам» и «бумаге» вашего противника. Тем сложнее игра, тем больше становится такое дерево. Даже в упрощённой версии техасского холдема, которую играют «хедс-ап» (то есть только между двумя игроками) и где ставки ограничены заранее определённым размером, полное дерево игры содержит 316,000,000,000,000,000 ветвей. Для безлимитного холдема, где игроки могут ставить любую сумму, такое дерево ещё больше. «Оно действительно становится по-настоящему огромным, — говорит Бёрч. — Ветвей в нём больше, чем атомов во вселенной».

Сначала подход группы разработчиков из Альберты заключался в том, чтобы «сжать» игру до более управляемого масштаба, грубо сгруппировав более-менее похожие руки, например, считать пару девяток и пару десяток идентичными. Но по мере того, как искусственный интеллект становился всё более развитым, а разработанные командой алгоритмы всё лучше адаптировались к тонкостям покера, их программы начали улучшаться. Решающее значение для этой разработки имел алгоритм «минимизации альтернативных сожалений». Учёные-компьютерщики заставили свои программы самостоятельно вывести оптимальную стратегию игры в покер. Программы играли против самих себя миллиарды раз, выявляя наименее прибыльные решения в дереве игры (это и есть те «сожаления», которые искусственный интеллект научится минимизировать в будущих итерациях, выбирая другие, более прибыльные варианты). В 2015 году команда института Альберты объявила о своём успехе, опубликовав статью в журнале Science под названием «Лимитный холдем хедс-ап просчитан».

Terrence Chan

Триумф разработчиков из Альберты представлял серьёзную угрозу источнику заработка некоторых игроков, особенно тех, кто играет онлайн. «Помню, когда мы прочли об этом в СМИ, то успели мысленно попрощаться с покером», — вспоминает бывший профессиональный игрок Терренс Чан.

Вскоре стало ясно, что учёные были не единственными, кто интересовался способностью компьютеров находить оптимальную стратегию. Бывший член команды разработчиков из Альберты, попросивший не называть его имени из-за договора о неразглашении с его нынешним работодателем, рассказал, что покеристы заплатили ему сотни тысяч долларов за помощь в разработке софта, способного выдавать идеальные игровые решения. В эту сумму также входили консультации создателей программ-ботов, предназначенных для того, чтобы побеждать людей в онлайн-играх.

Игрокам, у которых не было таких денег, не пришлось долго ждать доступа к стратегиям, полученным с помощью искусственного интеллекта. В том же году, когда в журнале Science была опубликована та самая статья про лимитный холдем, польский программист и бывший игрок в онлайн-покер Пётр Лопусевич начал продавать первую версию своего приложения PioSOLVER. За $249 игроки могли скачать программу, выдающую решения для намного более сложной безлимитной разновидности игры, и эти решения были приближены к идеальным. С 2015 года практическая реализация математического доказательства фон Неймана стала доступной каждому, у кого был достаточно мощный персональный компьютер.

Одним из первых и самых преданных адептов того, что называют «покером, оптимальным с точки зрения теории игр», стал друг и покерный наставник Сэта Дэвиса — Джейсон Кун. Во время второго дня трёхдневного суперхайроллерского турнира WSOP я встретился с Куном в его особняке стоимостью несколько миллионов долларов. Особняк расположен в закрытом комплексе внутри более крупного закрытого комплекса, по соседству с полем для гольфа, спроектированным одним из величайших гольфистов Джеком Никлаусом. Чтобы сыграть в суперхайроллерском турнире, Кун заплатил вступительный взнос $250,000, а вылетев из него спустя четыре часа, внёс вторые $250,000, но снова проиграл все фишки. «Добро пожаловать в мир турниров с заоблачными бай-инами, — написал он мне позже. — Нужно просто показывать свою лучшую игру, и на дистанции результаты выровняются».

Для Куна такое выравнивание результатов воплотилось в более чем $30,000,000 призовых, выигранных в турнирах (по его собственным словам, как минимум столько же он выиграл в дорогих кэш-играх в Лас-Вегасе и азиатской игорной столице Макао). Кун начал серьёзно играть в покер в 2006 году, восстанавливаясь после травмы в Уэслианском колледже Западной Вирджинии, где он был спринтером в команде по лёгкой атлетике. Он хорошо зарабатывал игрой в карты, но у него не получалось стабильно выигрывать в играх с самыми высокими ставками. «До появления солверов я был довольно посредственным игроком, — признаётся Джейсон. — Но когда появилось второе поколение солверов, я углубился в это дело, и моя игра начала улучшаться очень, очень быстро».

 

В своём домашнем офисе, украшенном трофеями с покерных турниров, Кун повернулся к своему компьютеру и запустил PioSOLVER. Указав размеры стеков игроков и диапазон рук, которые они бы разыгрывали на своих позициях за столом, он ввёл флоп из трёх случайных карт. Таблица размером 13×13 ячеек показала все возможные руки, которые могут быть у игроков. Кун навёл курсор мыши на квадратик с тузом и дамой разных мастей. Солвер показал, что Кун должен играть чек в 39% случаев, ставить 30% банка в 51% случаев и ставить 70% банка в оставшихся случаях. Эта смешанная стратегия в духе фон Неймана максимизирует его прибыль и одновременно маскирует силу его руки.

Благодаря таким инструментам, как PioSOLVER, Кун изменил свой подход к игре, поняв, ставки какого размера лучше всего работают в разных ситуациях. Иногда идеально подойдёт крошечная ставка размером в 1/5 или даже 1/10 от банка, в других случаях правильной будет гигантская ставка, в два-три раза превышающая банк. И хотя хорошие игроки в покер всегда знали, что нужно поддерживать баланс между блефом и прямолинейной игрой, солверы определяют точную частоту, с которой Кун должен использовать ту или иную тактику, и, в зависимости от карт в игре, определяют лучшие и худшие руки для блефа. Иногда эти выводы получаются неожиданными.

Профессиональный покерист Эрик Сайдел, который обучался игре в 1980-х годах, сказал мне, что если бы игроки вроде Куна, обладающие сегодняшними знаниями, отправились на 15 лет в прошлое, они бы не оставили камня на камне от лучших игроков той эпохи. «Я также думаю, что все тогдашние игроки приняли бы их за фишей, — говорит Сайдел, используя слово из покерного жаргона, означающее плохих игроков. — Сегодня в исполнении этих ребят можно увидеть много очень странных и при этом эффективных розыгрышей, но если бы они играли так в те времена, их бы с удовольствием звали в каждую игру».

Чтобы извлечь выгоду из ошибок более слабых оппонентов, против них Кун иногда намеренно отклоняется от теоретически идеального покера, блефуя чаще, чем нужно, или делая более крупные ставки, когда искусственный интеллект подсказывает ставить меньше. Но против лучших профессионалов он в основном пытается как можно точнее воспроизвести решения солверов — в той мере, в которой способен запомнить рассчитанные компьютером размеры ставок и частоту их использования. Зная, что в процесс принятия решений могут вкрасться его собственные предубеждения, Кун случайным образом выбирает, какую из тактик солвера применять в каждой конкретной раздаче. Чтобы сгенерировать процентное значение от 1 до 100, он смотрит на секундную стрелку своих часов или отмечает ориентацию логотипа казино на покерной фишке, словно это циферблат. Чем выше процентное значение, тем более агрессивное действие он выберет: «Например, если секундная стрелка в данный момент указывает на 9 часов, это значит 75% — довольно агрессивное значение». В этом случае Кун может выбрать самый крупный размер ставки из одобренных солвером для его руки, а если секундная стрелка будет указывать на 3 часа или 25%, он может сделать чек.

Использование оптимальной стратегии, конечно, не гарантирует Куну выигрыш любой отдельной раздачи. Однако математика говорит, что при достаточном количестве сыгранных раздач он как минимум не должен уйти в минус. На практике его результаты будут ещё лучше, в зависимости от того, насколько сильно стратегии оппонентов будут отклоняться от теоретически идеальной игры. А что если человек сыграет против солвера несколько тысяч раздач? «Солвер выиграет, уверяю», — утверждает Кун. Он сразу же уточняет:

Даже теперь, когда у игроков есть доступ к идеальной стратегии солверов, демонстрировать хорошую игру в покер по-прежнему невероятно трудно.

Эмоциональные качели, которыми сопровождаются выигрыши и проигрыши крупных банков, и усталость от 12-часовых сессий никуда не делись, но теперь лучшие игроки, чтобы добиться успеха, должны проделывать большую работу вне покерных столов. Как и большинство топовых профессионалов, Кун отводит значительную часть своего времени на изучение различных ситуаций, которые могут возникнуть в игре, чтобы попытаться понять логику решений компьютерных программ. «Солверы не могут рассказать вам, почему они принимают те или иные решения — они просто делают это, — говорит он. — Понять их логику — это задача покериста».

Лучшие игроки способны декомпилировать стратегию искусственного интеллекта и находить в ней общие закономерности, применимые к похожим раздачам и ситуациям. И всё же им приходится работать с огромными объёмами информации. Когда я сказал Куну, что это похоже на бесконечное перечитывание книги из 10,000 страниц в попытке удержать в голове как можно больше сведений оттуда, он моментально меня поправил: «Эта книга состоит из 100,000 страниц. Наша игра чертовски сложна».

На самом деле, хранилище данных, к которому обращается Кун, ещё больше. Он арендует почти 200 терабайт облачного хранилища для всех деревьев игр, которые построил после начала работы с солверами. В живой игре у игроков нет возможности пользоваться всей этой информацией, но такое ограничение не обязательно распространяется на покер в интернете. Автоматизированные боты, особенно в играх с низкими ставками, были проблемой для онлайн-покера ещё до появления солверов, но теперь люди, желающие обойти правила, могут выводить ИИ-стратегию на один монитор и использовать эти данные для оптимальной игры на другом. «Когда идёт игра по большим ставкам и на кону большие деньги, всегда есть способ превратить устройство, которое можно использовать во благо, в инструмент для мошенничества», — говорит Кун.

Кун не слишком беспокоится по поводу возможного жульничества в онлайн-играх, в которых он участвует, но другие игроки не настолько уверены в этом. «Это главная причина, по которой я больше не играю много в интернете», — говорит другой профессионал Райан Лапланте. По его наблюдениям, в недавнем онлайн-турнире WSOP с бай-ином $7,000 никнеймы как минимум 4 участников из 100 принадлежали игрокам, которые, по слухам, были забанены на других сайтах за использование так зазываемой «помощи в реальном времени». Лапланте считает, что некоторым крупнейшим покер-румам удаётся поддерживать порядок в своих играх, но он опасается, что по мере дальнейшего распространения солверов баланс сил будет продолжать смещаться в пользу тех, кто жульничает, чтобы получить преимущество. «Я уверен только в том, что всё очень быстро станет намного хуже», — говорит он.

Далеко за полночь во втором дне турнира суперхайроллеров WSOP немецкий профессионал Кристоф Фогельзанг уравнял ставку на все свои фишки с ko9o против aojo другого игрока. С точки зрения солверов, его колл был правильным, но Фогельзанг проиграл эту раздачу и вылетел из турнира на шестом месте. В отличие от обычной игры в покер, где игроки могут покинуть стол и обналичить свои фишки, когда захотят, правила турнира требуют, чтобы они продолжали игру, пока не проиграют или, наоборот, не выиграют все фишки. Размер приза, который выплачивается из пула вступительных взносов, зависит от того, как долго игроку удалось продержаться в игре. Тот, кто в конце турнира забирает все фишки, получает награду за первое место (в этом турнире $3,200,000), предпоследнему выжившему достаётся приз за второе место ($2,000,000) и так далее до последнего призёра (в данном случае $630,000 за пятое место). Фогельзанг и все игроки, покинувшие турнир перед ним, не получили ничего.

Учитывая небольшой размер выборки (несколько сотен раздач за три дня), отдельный покерный турнир — это крайне неточный способ определения сильнейшего игрока, здесь даже у лучших покеристов влияние удачи на результат будет огромным. Если 26 живых людей в этом турнире заменить идеально запрограммированными покерными ботами, то кому-то из них всё равно придётся вылететь первым, а кто-то выиграет турнир, несмотря на то, что все будут использовать одну и ту же оптимальную стратегию.

Игроки в покер стремятся мыслить в перспективе и рассматривают бай-ины в турниры как инвестицию с более-менее предсказуемой отдачей на длинной дистанции.

Isaac Haxton

По мнению профессионального игрока Айка Хекстона, в турнире с относительно сильным составом худшие игроки теряют до 30–40% своего бай-ина. У более сильных любителей ожидаемые потери составляют около 15% вложенных денег, в то время как лучшие профессионалы зарабатывают примерно 5–10% вдолгую.

Чтобы смягчить сильнейшие колебания фортуны на короткой дистанции, многие профессионалы перед началом турнира обмениваются друг с другом процентами от любых потенциальных призовых денег. Например, один игрок соглашается выплатить другому 5% от своего выигрыша, если тот в случае попадания в призы сделает то же самое. Также покеристы могут продавать доли от своих будущих выигрышей сторонним бэкерам, как в старину делали организаторы китобойных экспедиций. Сэт Дэвис не раскрыл мне подробностей своих соглашений, но подтвердил, что из собственного банкролла оплатил меньше половины бай-ина в этот турнир. Тем не менее, после того как в первый день он вылетел и оплатил повторный вход стоимостью $250,000, он поставил на карту «значительную шестизначную сумму» собственных денег.

В третьем и финальном дне суперхайроллера пятерых оставшихся игроков пересадили с потрёпанных периферийных столов в центр зала Amazon, где работала съёмочная группа. Софиты ярко освещали блестящее зелёное сукно покерного стола, а 45-футовый операторский кран поворачивался из стороны в сторону, чтобы снять происходящее с лучшего ракурса. Все пятеро покеристов, дошедших до этой стадии, обеспечили себе попадание в призы, но предстояла нешуточная борьба за более высокие места в таблице выплат. После возобновления игры чиплидер, 27-летний покер-про Адриан Матеос из Испании, продолжил атаковать оппонентов гигантскими ставками. В каждой из таких раздач он словно спрашивал соперника, готов ли тот дать последний бой или же он предпочтёт сделать фолд и подождать, пока из турнира вылетит один-два других игрока, чтобы вместо пятого места можно было финишировать на четвёртом или третьем и увезти домой дополнительные $300,000 или $700,000 призовых.

Подобные ситуации странным образом меняют ценность стеков игроков в зависимости от их места в иерархии выплат. Даже одна-единственная фишка может стоить невероятную сумму настоящих денег, если после вашего фолда другой игрок вылетит из турнира. Существуют солверы, которые способны моделировать и такие условия, но по мере того, как стеки фишек становятся короче по сравнению с размерами блайндов и анте (обязательных ставок, которые игроки вносят в банк перед началом каждой раздачи), безупречная игра сама по себе не даёт никакой гарантии, что покер не превратится в «орла и решку». «Когда дело доходит до этого, вы просто подбрасываете монетку на миллион долларов и надеетесь на победу», — говорит Дэвис.

Ben Heath Winners

После вылета одного соперника Дэвис остался с самым коротким стеком за столом. Кроме него, в раздаче был только один активный игрок, и Дэвис пошёл олл-ин с ac7c, как и советуют солверы в ситуациях с таким размером стека. Этот оставшийся игрок, англичанин с хвостиком по имени Бен Хит, мгновенно уравнял и перевернул пару валетов, сделавшую его 67% фаворитом на выигрыш раздачи. Ни одна из пяти карт, выложенных дилером, не улучшила руку Дэвиса, и Хит выиграл этот банк, а Дэвис закончил турнир на четвёртом месте. Он встал из-за стола, забрал свой рюкзак и маску N95 и покинул сцену. «Это была серьёзная азартная игра», — сказал он мне. По крайней мере, Дэвис был доволен тем, насколько его игра в последние три дня была близка к оптимальной стратегии, сгенерированной на домашнем компьютере. Ещё одним утешением стали $930,791 призовых денег, которые он получил за четвёртое место.

Положив в карман талон для обналичивания этих денег, Дэвис отправился в уже стартовавший турнир с бай-ином $50,000. Сначала он планировал немного пообедать и отдохнуть, но передумал, увидев, сколько в этом турнире собралось игроков, которые, скорее всего, будут использовать однозначно неоптимальные стратегии. «Этот 50K выглядит невероятно. Я не могу терять ни минуты», — сказал он мне.

Не все игроки, с которыми я общался, довольны тем, как разработки, основанные на искусственном интеллекте, изменили покерный ландшафт. Во-первых, несмотря на то, что появление солверов почти не изменило тактику в большинстве более дешёвых игр, на высоких лимитах конкуренция сильно обострилась. По мере того, как оптимальная стратегия стала доступна всё большему числу людей, разница в мастерстве между самыми лучшими игроками и просто хорошими покеристами стала гораздо меньше. Но для Дага Полка, который ушёл из покера в 2017 году, выиграв десятки миллионов долларов, изменения, солверы принесли экзистенциальные изменения: «Я чувствую, что это убило душу игры, изменив покер. Если раньше выигрывал покерист, креативнее других решавший игровые задачи, то теперь побеждает тот, кто может запомнить больше такой информации и применить её на практике».

Пётр Лопусевич, разработчик PioSOLVER, не согласен с такой точкой зрения. Он утверждает, что новое поколение инструментов, основанных на искусственном интеллекте, — это лишь очередное звено длинной цепочки технологических инноваций в покере. До появления солверов топовые онлайн-игроки вроде Полка использовали специальный софт для сбора информации об игре своих оппонентов и анализа их потенциальных слабых мест. «Теперь кто-то привнёс в гонку вооружений оружие большего калибра, и ребята, которые оказались не в состоянии получать прибыль, запели: „Да, но мы не имели в виду такую гонку вооружений. Нам просто нужны наши инструменты, а не лучшие инструменты“», — говорит Лопусевич.

Лопусевич считает, что солверы не столько изменили покер, сколько обнажили его суть. Признавали это покеристы или нет, но игра всегда представляла собой задачу максимизации по фон Нейману. «Сегодня, начиная с определённого уровня, все игроки вынуждены уважать математическую сторону игры, — говорит Лопусевич. — Они больше не могут её игнорировать».

Добавить комментарий