Kā mākslīgais intelekts iekaroja pokeru

4
Kā mākslīgais intelekts iekaroja pokeru
29.04.2022 16:07
408
0
29.04.2022 16:07
408

2022. gada sākumā New York Times publicēja izcilu Kīta Romera rakstu, kas veltīts pokera solveriem. Žurnālists nekoncentrējās uz potenciālajām briesmām, ko sevī nes solveri, bet gan veica ziņkārīgu pētījumu par to, kā tie mainīja pokera stratēģiju.

Ikreiz, kad galvenie mediji publicē kādu materiālu par pokeru, sabiedrībā valda nervozitāte. Šādi raksti reti ir pietiekami detalizēti, lai precīzi atspoguļotu pokeru, un bieži vien autori pārspīlē spēles neglītos aspektus.

Vēl jo vērtīgāks ir New York Times žurnālista darbs, kurš uzrakstīja izcilu rakstu par mākslīgā intelekta, proti, solvera, ietekmi uz mūsdienu spēli. 2021. gada rudens Pasaules pokera sērijā Romers sēdēja kopā ar profesionāliem spēlētājiem Setu Deivisu, Džeisonu Kūnu, Īzaku Hekstonu, Dagu Polku un Raienu Lapplantu, lai runātu par to, kā PioSOLVER un cita līdzīga programmatūra ir mainījusi spēli.

Protams, rakstā netiek apietas iespējamās briesmas, ko spēlei sola šādas tehnoloģijas, pirmām kārtām reāllaika palīdzības programmas (RTA), taču galvenais Romera pētījuma objekts ir spēļu teorijas pielietošana pokerā. Viņš ne tikai pastāstīja šā fenomena vēsturi, bet arī iedziļinājās tādās lietās kā ICM, blefa un value attiecības, polarizētie diapazoni, jauktas stratēģijas, bekings un spēlētāju vinreiti.

Žurnālista uzmanības lokā nokļuva arī superhigh rolleru turnīru pasaule: Deiviss un Kūns sniedza daudz komentāru par spēli $250,000 aproču turnīrā un pēc tam analizēja savas svarīgākas rokas.

Šis raksts ir ļoti ieteicama lasāmviela, un eksperti to ir nosaukuši par vienu no pirmajiem favorītiem 2022. gada Global Poker Awards balvai par labāko rakstīto saturu. Zemāk piedāvājam tā tulkojumu bez saīsinājumiem un izmaiņām, pēc iespējas tuvāk autoru stilam.

Ievads: ideāls pokers WSOP Super High Roller turnīrā

Labi pokera spēlētāji vienmēr ir zinājuši, ka viņi saglabā līdzsvaru starp blefu un tiešām darbībām. Tagad viņi to var darīt perfekti.

Seth_Davies

2021. gada novembris, Lasvegasa. Divi desmiti vīriešu, pārsvarā ģērbušies sporta kreklos un beisbola cepurēs, sēdēja pie trim nobružātiem pokera galdiem Rio milzīgajā Amazon telpā un spēlēja Texas hold’em. Reizēm kāds garāmgājējs apstājās, lai noskatītos spēli, taču lielāko daļu laika spēlētāji kustināja savus čipus netīrajā pustumsā. Izņemot saspringto, elektrizēto nekustīgumu, ar kādu viņi darbojās izspēļu laikā, nekas neliecināja par to, ka tie ir vieni no spēcīgākajiem pokera spēlētājiem pasaulē, kas ieliek bankā summas, ar kurām var nopirkt māju vai samaksāt hipotēkas pirmo iemaksu. Tā bija pirmā no trim Pasaules pokera sērijas Super High Roller dienām, kur katrs dalībnieks iemaksāja $250,000. Viņi viņu vienkārši sauca par “250K”.

Pie viena galda profesionāls spēlētājs, vārdā Sets Deiviss, nedaudz pacēla savu kāršu malas, lai redzētu tikko izdalīto kombināciju: 6d7d. Pēc dažām spēles stundām Deiviss palielināja savu sākuma steku no 1,5 miljoniem turnīra čipu līdz vairāk nekā 2 miljoniem, un viņš pārvietoja dažus no šiem žetoniem pa galda virsmu, parādot reizu. Deiviss, 33 gadus vecs bijušais beisbolists ar īsi apgrieztu gaiši brūnu bārdu, sēdēja taisni un uzmanīgi vēroja, kas notiek pie galda. Divi cilvēki nokolloja viņa likmi, un tad Dens Smits, vēl viens profesionālis ar apaļu seju, ūsām un greznu kovboja cepuri, uztaisīja lielu reraise. Nokolloja tikai Deiviss.

 

Dīleris nolika kc4c5c uz galda, dodot Deivisam straight-draw. Smits nočekoja (t.i., atteicās no likmes). Deiviss ielika. Smits nokolloja. Turn kārts bija 2d, kas nepalīdzēja Deivisa draw rokai. Smits vēlreiz čekoja, un Deiviss vēlreiz veica likmi. Smits nokolloja vēlreiz. Pēdējā izdalītā kārts bija 2c, kas galīgi sagrāva Deivisa cerības uzlabot savu kombināciju. Pa šo laiku pots galda centrā, apšūta ar izbalējušu zaļu audumu, bija izaudzis līdz vairāk nekā miljonam čipu. Pēdējais divnieks kļuva par ceturto kreici uz galda – tas nozīmēja, ka, ja Smitam bija vismaz viens kreicis rokā, tad viņam tagad ir flush.

Deiviss, kurš visu laiku lika likmes, gaidot trijnieku vai astoņnieku, lai pārvērstu savu roku streitā, izspēles beigās ieguva roku, kas nebija nekā vērta. Pēc tam, kad Smits čekoja trešo reizi, Deiviss gandrīz minūti apsvēra savu gājienu un pēc tam iegāja all-in par 1,7 miljoniem žetonu. Ja Smits būtu pielīdzinājis šo likmi, Deiviss būtu pametis turnīru, un viņa $250,000 dalības maksa tiktu pārvērsta putekļos viena nelaikā ielikta blefa dēļ.

Smits paskatījās uz Deivisu no savas kovboju cepures malas un  sašķobīja seju, dusmojoties uz pretinieku, vai, varbūt, uz savu veiksmi. Beidzot ar dusmīgu skatienu Smits izmeta savas kārtis, un dīleris aizbīdīja krāsainu žetonu kaudzi Deivisa virzienā. Pēc Deivisa vārdiem, pēc šīs izspēles beigām viņš juta ne tik daudz triumfu, cik atvieglojumu:

Kad tu spēlē banku, kas līdzvērtīga $500,000 reālai naudai, tas rada milzīgu stresu.

Īstais pārbaudījums pienāca tikai pulksten 2:30, kad beidzās turnīra pirmā diena un Deiviss atgriezās no Rio kazino savās mājās Lasvegasas priekšpilsētā, ceļā pavadījis 15 minūtes. Izejot no garāžas, viņš atvēra PioSOLVER datorprogrammu, kas ir viens no retajiem mākslīgā intelekta rīkiem, kas pēdējos gados ir radikāli mainījis pokera spēlēšanas veidu, īpaši uz augstākajām likmēm. Deiviss ievadīja programmā visas šīs rokas detaļas un sāka aprēķina procesu. Dažu sekunžu laikā risinātājs ģenerēja optimālo stratēģiju. Programmā bija teikts, ka viņš būtībā spēlēja pareizi. Turnā, kad iznāca kārava divnieks, Deivisam vajadzēja likt 80% no bankas, nevis 50%, bet 1,7 miljonu žetonu blefs riverā bija pareizais gājiens.

“Es jutos lieliski, pat labāk nekā pēc milzīgas bankas uzvaras,” sacīja Deiviss. “Labākā daļa ir tad, kad jūs uzvarat tādā veidā.” Tonakt Deiviss devās gulēt, būdams pārliecināts, ka ir nospēlējis savu roku gandrīz perfekti.

Kur sākās spēļu teorija?

Tiekšanās pēc perfekta pokera aizsākās matemātiķa Džona fon Neimana un ekonomista Oskara Morgensterna 1944. gada darbā The Theory of Games and Economic Behavior. Viņi vēlējās novērst fundamentālu nenoteiktību ekonomikas jomā. “Mēs vēlamies atrast matemātiski pilnīgus principus, kas definē sociālās ekonomikas dalībnieku “racionālo uzvedību”, un no tiem izriet šīs uzvedības vispārīgās iezīmes,” raksta autori. Viņi ierosināja ekonomisko dzīvi uzskatīt par “maksimizācijas uzdevumu” ķēdi, kurā indivīdi sacenšas, lai no sava ikdienas darba izspiestu pēc iespējas vairāk lietderības. Fon Neimana un Morgenšterna ideja bija kvantitatīvi aprakstīt veidu, kā pieņemt pareizos lēmumus un uz tā pamata veidot ekonomikas zinātni.

Vēlme modelēt ekonomisko lēmumu pieņemšanas procesu viņus noveda pie spēlēm. Fon Neimans lielāko daļu no tiem noraidīja kā nepiemērotus uzdevumam, jo ​​īpaši tādas spēles kā dambretes un šahs, kurās abi spēlētāji var redzēt visas figūras uz galda un dalīties ar vienu un to pašu informāciju. “Reālā dzīve nav tāda,” viņš paskaidroja kolēģim matemātiķim Jēkabam Bronovskim. “Reālā dzīve sastāv no blefa, nelielas taktiskas maldināšanas, domāšanas par to, ko ienaidnieks no mums sagaida. Šīs ir spēles, kas atbilstu manai teorijai. Reālā dzīve, fon Neimans uzskatīja, ir kā pokers.

Fon Neimans izmantoja savu vienkāršoto spēles versiju, kurā diviem spēlētājiem tika izdalīti nejauši skaitļi, un pēc tam viņi veica iepriekš noteikta lieluma likmes, kurš no skaitļiem būs lielāks. No tā viņš secināja optimālas stratēģijas pamatu:

“Spēlētājiem vajadzētu likt lielas likmes gan ar spēcīgākajām rokām, gan noteiktu procentuālo daļu no sliktākajām kombinācijām kā blefu. Precīzs blefa procents ir atkarīgs no likmes lieluma un bankas lieluma attiecības.”

Fon Neimans spēja demonstrēt, ka, blefojot un kollojot ar matemātiski precīzu biežumu, ilgtermiņā spēlētājs spēs nospēlēt vismaz uz nulli, pat ja viņš ļoti detalizēti apraksta savu stratēģiju pretiniekam. Savukārt, ja pretinieks ievēro kādu citu stratēģiju, nevis ideālo pēc fon Neimaņa domām, tad ilgtermiņā viņam ir garantēts zaudējums.

“Spēļu teorija” norādīja ceļu uz nākotni, kurā matemātiski varētu modelēt visa veida konkurences attiecības: izsoles, zemūdens karu un pat konkurenci starp sugām, lai nodotu savus gēnus nākamajām paaudzēm. Taču fon Neimaņa atklājums gandrīz nekādi neietekmēja pokera stratēģijas attīstību līdz vairāk nekā piecdesmit gadus vēlāk, kad to izdarīja Kanādas Albertas universitātes datorzinātņu nodaļas darbinieki. Pirmā zvaigzne spēļu izpētē bija profesors Džonatans Šēfers, kurš pēc 18 gadu ilga darba atrada risinājumu dambretei. Universitātes pasniedzēji un studenti ir guvuši ievērojamus panākumus tādās dažādās spēlēs kā go, reversi, StarCraft un Kanādā populārais kērlings. Tomēr pokeru joprojām bija īpaši grūti aprēķināt, tieši tāpēc, ka šī spēle fon Neimanam bija tik pievilcīga: slēptā informācija neļauj spēlētājiem pieņemt pareizos lēmumus.

Šahā un nardēs abu spēlētāju gājieni ir skaidri redzami uz galda, bet pokerā datoram jāinterpretē pretinieku likmes, nezinot viņu kārtis. Nīls Bērčs, datorzinātnieks, kurš gandrīz divus gadu desmitus strādāja Albertas Universitātē un pēc tam kļuva par DeepMind darbinieku, savas komandas pirmos mēģinājumus izveidot pokera mākslīgo intelektu nosauca par neveiksmīgiem: “Mēs atklājām, ka, ja uzliksim gudru pokera spēlētāju žarīt pret mūsu kompjuteru, cilvēks izcīnīs graujošu uzvaru.”

Tas daļēji bija saistīts ar faktu, ka ir ļoti grūti modelēt visu lēmumu kopumu pokera izspēlē. Spēļu teorijā diagramma sazarota koka veidā tiek izmantota, lai grafiski attēlotu dažādus spēles rezultātus. Vienkāršākajā akmens, papīra, šķēru spēlē šis koks ir mazs: trīs zari jūsu akmenim, šķērām un papīram, no kuriem katrs sadalās vēl trīs zaros, kas atbilst jūsu pretinieka akmenim, šķērēm un papīram. Jo grūtāka spēle, jo lielāks kļūst šāds koks. Pat vienkāršotajā Texas Hold’em versijā spēlēja “heads-up” (tas ir, tikai starp diviem spēlētājiem) un kur likmes ir ierobežotas līdz iepriekš noteiktam izmēram, pilnais spēles koks satur 316 000 000 000 000 000 zaru. No-limit hold’em, kur spēlētāji var likt likmes uz jebkuru summu, koks ir vēl lielāks. “Tas patiešām kļūst patiešām milzīgs,” saka Bērčs. “Tam ir vairāk zaru nekā Visumā atomu.”

Sākumā Alberta izstrādes komandas pieeja bija “saspiest” spēli līdz vairāk pārvaldāmam mērogam, aptuveni grupējot vairāk vai mazāk līdzīgas rokas, piemēram, uzskatot devītnieku pāri un desmitnieku pāri par identiskiem. Taču, tā kā mākslīgais intelekts kļuva progresīvāks un komandas izstrādātie algoritmi arvien vairāk pielāgojās pokera sarežģītībai, viņu programmas sāka uzlaboties. Kritiski svarīgs šai attīstībai bija “alternatīvo nožēlu samazināšanas” algoritms. Datorzinātnieki piespieda savas programmas patstāvīgi noteikt optimālo stratēģiju pokera spēlēšanai. Programmas ir spēlējušas pret sevi miljardiem reižu, spēļu kokā identificējot vismazāk ienesīgos lēmumus (šīs ir “nožēlas”, ko mākslīgais intelekts iemācīsies minimizēt turpmākajās iterācijās, izvēloties citas, izdevīgākas iespējas). 2015. gadā Alberta institūta komanda paziņoja par saviem panākumiem, publicējot rakstu žurnālā Science ar nosaukumu “Heads-Up Limit Hold’em Calculated”.

Spēļu teorijas pielietošana pokerā: priekšrokas un izaicinājumi

Terrence Chan

Alberta izstrādātāju triumfs radīja nopietnus draudus ienākumu avotam dažiem spēlētājiem, īpaši tiem, kas spēlē tiešsaistē. “Es atceros, kad lasījām par to plašsaziņas līdzekļos, mums bija laiks garīgi atvadīties no pokera,” atceras bijušais profesionālais spēlētājs Terenss Čans.

Drīz vien kļuva skaidrs, ka zinātniekus interesē ne tikai datoru spēja atrast optimālo stratēģiju. Bijušais Albertas izstrādes komandas loceklis, kurš lūdza, lai viņa vārds netiek nosaukts sakarā ar vienošanos par informācijas neizpaušanu ar savu pašreizējo darba devēju, sacīja, ka pokera spēlētāji viņam ir samaksājuši simtiem tūkstošu dolāru, lai palīdzētu izstrādāt programmatūru, kas spēj radīt ideālus spēļu risinājumus. Šajā summā bija iekļauti arī padomi, ko sniedza robotprogrammu veidotāji, kas paredzēti cilvēku uzveikšanai tiešsaistes spēlēs.

Spēlētājiem, kuriem nebija šādas naudas, nebija ilgi jāgaida, lai piekļūtu stratēģijām, kas iegūtas, izmantojot mākslīgo intelektu. Tajā pašā gadā, kad žurnālā Science tika publicēts Limit Hold’em raksts, Pjotrs Lopusevičs, poļu programmētājs un bijušais online pokera spēlētājs, sāka pārdot savas lietotnes PioSOLVER pirmo versiju. Par 249 ASV dolāriem spēlētāji varēja lejupielādēt programmu, kas ģenerēja risinājumus daudz sarežģītākām spēles variantiem bez ierobežojumiem, un šie risinājumi bija tuvu ideālam. Kopš 2015. gada fon Neimaņa matemātiskā pierādījuma praktiskā realizācija ir kļuvusi pieejama ikvienam, kam ir pietiekami jaudīgs personālais dators.

Viens no senākajiem un uzticamākajiem tā dēvētā “optimālā pokera spēļu teorijas ziņā” piekritējiem bija Seta Deivisa draugs un pokera mentors Džeisons Kūns. Trīs dienu WSOP Super High Roller otrajā dienā es satiku Kūnu viņa vairāku miljonu dolāru savrupmājā. Savrupmāja atrodas slēgtā kopienā lielākā slēgtā kopienā, blakus golfa laukumam, ko projektējis viens no lielākajiem golfa spēlētājiem Džeks Niklauss. Lai spēlētu Super High Roller turnīrā, Kūns samaksāja dalības maksu $250,000 apmērā un četras stundas vēlāk izkrita, ieguldīja otros $250,000, taču atkal zaudēja visus savus žetonus. “Laipni lūdzam augstas dalības maksas turnīru pasaulē,” viņš man rakstīja vēlāk. “Jums vienkārši jāparāda sava labākā spēle, un rezultāti izlīdzināsies uz distances.”

Kūnam šis izlīdzinājums ir izpelnījies vairāk nekā $30,000,000 turnīru laimestos (viņš teica, ka vismaz tik daudz vinnējis highroll cash spēlēs Lasvegasā un Āzijas azartspēļu galvaspilsētā Makao). Kūns sāka nopietni spēlēt pokeru 2006. gadā, atveseļojoties no savainojuma Rietumvirdžīnijas Veslijas koledžā, kur viņš bija trases komandas sprinteris. Viņš nopelnīja labu naudu, spēlējot kārtis, taču viņš nevarēja pastāvīgi uzvarēt spēlēs ar augstākajām likmēm. “Pirms solveru parādīšanās es biju diezgan vidējs spēlētājs,” atzīst Džeisons. “Bet, kad iznāca otrā solveru paaudze, es tajā iedziļinājos, un mana spēle sāka ļoti, ļoti ātri uzlaboties.”

Savā mājas birojā, izrotāta ar pokera turnīru trofejām, Kūns pievērsās datoram un iedarbināja PioSOLVER. Norādījis spēlētāju steku lielumus un pozīcijās, kuras viņi spēlēs pie galda, viņš ieviesa trīs nejaušu kāršu flopu. 13×13 rūtiņas parādīja visas iespējamās spēlētāju kombinācijas. Kūns pārvietoja peles kursoru virs kvadrāta ar dažādas masts dūzi un dāmu. Risinātājs parādīja, ka Kūnam vajadzētu čekot 39% laika, likt likmi 30% no bankas 51% laika, bet pārējā laikā – 70% no bankas. Šī fon Neimaņa stila jauktā stratēģija palielina viņa peļņu, vienlaikus maskējot viņa roku spēku.

Pateicoties tādiem rīkiem kā PioSOLVER, Kūns mainīja savu pieeju spēlei, saprotot, kādi likmju lielumi vislabāk darbojas dažādās situācijās. Dažreiz ideāla ir neliela likme 1/5 vai pat 1/10 no bankas, citreiz pareiza ir milzīga likme, kas ir divas vai trīs reizes lielāka par banku. Lai gan labi pokera spēlētāji vienmēr ir zinājuši, ka spēj atrast līdzsvaru starp blefu un taisno spēli, solveri nosaka precīzu biežumu, kādā Kūnam vajadzētu izmantot noteiktu taktiku, un atkarībā no izspēlētajām kārtīm nosaka labākās un sliktākās blefa kombinācijas. Dažreiz šie atklājumi ir negaidīti.

Profesionāls pokera spēlētājs Ēriks Seidels, kurš šo spēli apguva 1980. gados, man teica, ka, ja tādi spēlētāji kā Kūns ar mūsdienu zināšanām varētu nokļūt 15 gadus senā pagātnē, viņi neatstātu akmens uz akmens no tā laikmeta labākajiem spēlētājiem. “Es arī domāju, ka visi spēlētāji tajā laikā būtu viņus sajaucuši ar fišiem,” saka Seidels, izmantojot pokera žargona vārdu sliktiem spēlētājiem. “Šodien šo puišu izpildījumā var redzēt daudz ļoti dīvainu un efektīvu izspēļu, taču, ja viņi tā spēlētu tajos laikos, viņi būtu ar prieku aicināti uz katru spēli.”

Lai gūtu labumu no vājāku pretinieku kļūdām, pret viņiem Kūns dažkārt apzināti novirzās no teorētiski perfekta pokera, blefojot vairāk nekā nepieciešams vai veicot likmes lielākas, kad AI liek viņam likt mazāk. Taču pret labākajiem profesionāļiem viņš pamatā cenšas pēc iespējas precīzāk atveidot solvera risinājumus – tiktāl, cik spēj atcerēties datorizētos likmju lielumus un to izmantošanas biežumu. Zinot, ka viņa paša aizspriedumi var iezagties lēmumu pieņemšanas procesā, Kūns nejauši izvēlas, kuru risinātāja taktiku piemērot jebkurā izspēlē. Lai ģenerētu procentuālo vērtību no 1 līdz 100, viņš skatās uz sava pulksteņa sekunžu rādītāju vai atzīmē kazino logotipa orientāciju uz pokera čipas tā, it kā tas būtu pulksteņa ciparnīca. Jo lielāks procents, jo agresīvāku darbību viņš izvēlēsies: “Piemēram, ja sekunžu rādītājs pašlaik rāda pulksten 9, tas nozīmē, ka 75% – diezgan agresīva spēle.” Šajā gadījumā Kūns var izvēlēties vislielāko likmes lielumu no solvera apstiprinātajiem, bet, ja sekunžu bultiņa norāda uz pulksten 3 vai 25%, viņš var nočekot.

Optimālas stratēģijas izmantošana, protams, negarantē, ka Kūns uzvarēs jebkuru roku. Taču matemātika saka, ka ar pietiekamu izspēlētu roku skaitu viņam vismaz nevajadzētu iet mīnusā. Praksē viņa rezultāti būs vēl labāki atkarībā no tā, cik tālu pretinieku stratēģijas novirzīsies no teorētiski ideālās spēles. Bet ko darīt, ja cilvēks izspēlē vairākus tūkstošus roku pret solveru? “Es jums apliecinu, ka solvers uzvarēs,” saka Kūns. Viņš nekavējoties precizē:

Pat tagad, kad spēlētājiem ir pieejama ideāla solveru stratēģija, joprojām ir neticami grūti demonstrēt labu pokera spēli.

Emocionālās svārstības, kas rodas, uzvarot un zaudējot lielas bankas, un 12 stundu sesiju nogurums nav zudis, taču tagad labākajiem spēlētājiem ir daudz jāstrādā arī ārpus pokera galdiem, lai gūtu panākumus. Tāpat kā vairums labāko profesionāļu, Kūns lielu daļu sava laika velta dažādu situāciju, kas var rasties spēlē, izpētei, lai mēģinātu izprast datorprogrammu lēmumu loģiku. “Risinātāji nevar pateikt, kāpēc viņi pieņem noteiktus lēmumus — viņi to vienkārši dara,” viņš saka. “Izprast viņu loģiku ir pokera spēlētāja uzdevums.”

Labākie spēlētāji spēj dekompilēt AI stratēģiju un atrast tajā kopīgus modeļus, kas attiecas uz līdzīgām rokām un situācijām. Un tomēr viņiem ir jāstrādā ar milzīgu informācijas apjomu. Kad es teicu Kūnam, ka tas ir kā bezgalīgi pārlasīt 10,000 lappušu grāmatu, mēģinot paturēt galvā pēc iespējas vairāk informācijas, viņš mani nekavējoties izlaboja: “Šī grāmata ir 100,000 lappušu gara. Mūsu spēle ir sasodīti smaga.”

Faktiski datu krātuve, kurai piekļūstat Kūns, ir vēl lielāka. Viņš nomā gandrīz 200 terabaitu mākoņkrātuves visiem spēļu kokiem, ko viņš ir uzbūvējis kopš darba uzsākšanas ar risinātājiem. Spēlējot offlainā spēlētāji, iespējams, nevarēs piekļūt visai šai informācijai, taču šis ierobežojums ne vienmēr attiecas uz online pokeru. Automatizētie boti, īpaši spēlēs ar zemām likmēm, ir bijušas online pokera problēma jau pirms solveru parādīšanās, taču tagad cilvēki, kuri vēlas apiet noteikumus, var attēlot AI stratēģiju vienā monitorā un izmantot šos datus, lai optimāli spēlētu citā monitorā. . “Kad likmes ir augstas un spēlē ir daudz naudas, vienmēr ir veids, kā ierīci, ko var izmantot labam mērķim, kāds var pārvērst par krāpšanas rīku,” saka Kūns.

Kūns nav pārāk noraizējies par iespējamu krāpšanos tiešsaistes spēlēs, kuras viņš spēlē, taču citi spēlētāji par to nav tik pārliecināti. “Tas ir galvenais iemesls, kāpēc es vairs nespēlēju daudz tiešsaistē,” saka kolēģis Raiens Laplante. Nesenā WSOP online turnīrā par $7,000 viņš novēroja, ka vismaz 4 no 100 dalībniekiem bija tādu spēlētāju segvārdi, par kuriem tika baumots, ka viņiem ir aizliegts apmeklēt citas vietnes, jo viņi izmantoja tā saukto “reāllaika palīdzību”. Laplante uzskata, ka dažām lielākajām pokera istabām izdodas uzturēt savas spēles kārtībā, taču viņš baidās, ka, risinātājiem turpinot izplatīties, spēku samērs turpinās mainīties par labu tiem, kas krāpjas, lai iegūtu priekšrocības. “Esmu pārliecināts, ka lietas ļoti ātri pasliktināsies,” viņš saka.

Kā profesionāli turnīru spēlētāji pelna naudu

Jau krietni pāri pusnaktij WSOP Super High Roller otrajā dienā vācu profesionālis Kristofs Vogelsangs pielīdzināja likmi uz visiem saviem žetoniem ar Ko9o pret cita spēlētāja AoJo. No risinātāju viedokļa viņa kolls bija pareizs, taču Vogelsangs zaudēja izspēli un no turnīra izstājās sestajā vietā. Atšķirībā no parastās pokera spēles, kur spēlētāji var atstāt galdu un izņemt savus žetonus, kad vien vēlas, turnīra noteikumi nosaka, ka viņiem ir jāturpina spēlēt, līdz viņi ir zaudējuši vai, gluži pretēji, laimējuši visus žetonus. Balvas summa, kas tiek izmaksāta no dalības maksas, ir atkarīga no tā, cik ilgi spēlētājam izdevās noturēties spēlē. Tas, kurš turnīra beigās paņem visus žetonus, saņem pirmās vietas balvu ($3,200,000 šajā turnīrā), priekšpēdējais izdzīvojušais saņems otrās vietas balvu ($2,000,000) un tā tālāk līdz pēdējās vietas ieguvējam (šajā gadījumā $630,000 par piekto vietu). Vogelsang un visi spēlētāji, kuri pameta turnīru pirms tā, neko nesaņēma.

Ņemot vērā nelielo izlases lielumu (vairāki simti izspēļu trīs dienu laikā), viens pokera turnīrs ir ļoti neprecīzs veids, kā noteikt spēcīgāko spēlētāju, šeit pat labākajiem spēlētājiem būs milzīga ietekme uz veiksmes rezultātu. Ja 26 dzīvus cilvēkus šajā turnīrā nomainīs perfekti ieprogrammēti pokera boti, daži no tiem vienalga izkritīs pirmie, un daži uzvarēs turnīrā, neskatoties uz to, ka visi izmanto vienu un to pašu optimālo stratēģiju.

Pokera spēlētājiem ir tendence domāt ilgtermiņā un turnīru dalības maksu uztvert kā ieguldījumu ar vairāk vai mazāk paredzamu atdevi ilgtermiņā.

Isaac Haxton

Pēc profesionāla spēlētāja Ajka Hakstona domām, turnīrā ar salīdzinoši spēcīgu sastāvu sliktākie spēlētāji zaudē līdz pat 30-40% no dalības maksas. Spēcīgākajiem amatieriem paredzamie zaudējumi ir aptuveni 15% no ieguldītās naudas, savukārt labākie profesionāļi ilgtermiņā nopelna aptuveni 5-10%.

Lai mazinātu ārkārtējas īstermiņa veiksmes svārstības, daudzi profesionāļi apmainās ar procentiem no iespējamās naudas balvas pirms turnīra sākuma. Piemēram, viens spēlētājs piekrīt maksāt 5% no sava laimesta, ja tas rīkojas tāpat, ja tiek pie balvām. Tāpat pokera spēlētāji savu nākotnes laimestu daļas var pārdot trešo pušu atbalstītājiem, kā to senos laikos darīja vaļu medību ekspedīciju organizatori. Sets Deiviss man nesniedza sīkāku informāciju par saviem līgumiem, taču apstiprināja, ka samaksājis mazāk nekā pusi no dalības šajā turnīrā no sava bankrolla. Tomēr pēc izlidošanas pirmajā dienā un samaksājot $250,000 rebuy, viņš tomēr notērēja “ievērojamu sešciparu summu” no savas naudas.

Trešajā un pēdējā Super High Roller dienā pieci atlikušie spēlētāji tika pārvietoti no sasisto malu galdiem uz Amazon telpas centru, kur strādāja filmēšanas grupa. Prožektori spilgti izgaismoja pokera galda mirdzoši zaļo filcu, un 45 pēdas garš kameras celtnis grozījās no vienas puses uz otru, lai iemūžinātu darbību no labāka leņķa. Visi pieci pokera spēlētāji, kuri iekļuva šajā posmā, nodrošināja sev ceļu uz naudu, taču par augstākām vietām izmaksu tabulā norisinājās nopietna cīņa. Pēc spēles atsākšanās čiplīderis, 27 gadus vecais pokera profesionālis Adrians Mateoss no Spānijas, ar milzu likmēm turpināja uzbrukt pretiniekiem. Šķiet, ka katrā no šīm rokām viņņš jautāja savam pretiniekam, vai tas ir gatavs dod viņam pēdējo cīņu, vai arī tas labāk nomestās un gaida, kad viens vai divi citi spēlētāji izlidos no turnīra, lai piektās vietas vietā viņš varētu finišēt ceturtajā vai trešajā un aizvest mājās papildu $300,000 vai $700,000.

Šādas situācijas dīvainā veidā maina spēlētāju steku vērtību atkarībā no viņu vietas izmaksu hierarhijā. Pat viens žetons var būt neticami daudz reālas naudas vērts, ja pēc jūsu folda cits spēlētājs izlidos no turnīra. Ir solveri, kas spēj simulēt šādus apstākļus, taču, tā kā čipu kaudzītes kļūst mazākas salīdzinājumā ar blaindu un antes lielumu (obligātās likmes, ko spēlētāji veic bankā pirms katras izspēles sākuma), nevainojama spēle vien nenodrošina jebkādas garantijas, ka pokers nepārvērsīsies par monētas mešanu. “Kad nonāk līdz tam, jūs vienkārši uzmetat miljonu dolāru monētu un cerat, ka uzvarēsit,” saka Deiviss.

Kad viens pretinieks tika izslēgts, Deivisam pie galda palika mazākais steku. Bez viņa izspēlē bija tikai viens aktīvs spēlētājs, un Deiviss iegāja all-in ar Ac7c, kā risinātāji iesaka situācijās ar šādu steku lielumu. Atlikušais spēlētājs, anglis ar zirgasti vārdā Bens Hīts, uzreiz nokolloja un parādīja kalpu pāri, padarot viņu par 67% favorītu izspēlē. Neviena no dīlera piecām kārtīm neuzlaboja Deivisa kombināciju, un Hīts uzvarēja šo banku, Deivisam turnīru noslēdzot ceturtajā vietā. Viņš piecēlās no galda, paņēma mugursomu un N95 masku un nogāja no skatuves. “Tā bija nopietna azartspēle,” viņš man teica. Vismaz Deiviss bija apmierināts ar to, cik tuvu viņa spēle pēdējo trīs dienu laikā bija bijusi optimālajai stratēģijai, kas tika ģenerēta viņa mājas datorā. Vēl viens mierinājums bija $930,791 naudas balva, ko viņš saņēma par ceturto vietu.

Ielicis kabatā naudas izņemšanas čeku, Deiviss devās uz $50,000 dalības turnīru, kas jau bija sācies. Sākumā viņš plānoja paēst pusdienas un atpūsties, taču pārdomāja, redzot, cik daudz šajā turnīrā pulcējās spēlētāji, kuri, visticamāk, izmantos nepārprotami neoptimālas stratēģijas. “Šis 50K izskatās neticami. Man nav ne minūtes, ko zaudēt,” viņš man teica.

Secinājums

Ne visi spēlētāji, ar kuriem esmu runājis, ir apmierināti ar to, kā AI virzīta attīstība ir mainījusi pokera ainavu. Pirmkārt, neskatoties uz to, ka solveru parādīšanās gandrīz nav mainījusi taktiku lielākajā daļā lētāko spēļu, konkurence uz augstām likmēm ir kļuvusi daudz intensīvāka. Tā kā optimālā stratēģija ir kļuvusi pieejama arvien vairāk cilvēku, atšķirība starp labākajiem spēlētājiem un vienkārši labiem pokera spēlētājiem ir kļuvusi daudz mazāka. Taču Dagam Polkam, kurš no pokera aizgāja 2017. gadā pēc desmitiem miljonu dolāru vinnestiem, pārmaiņas, solveri, ienesa eksistenciālas pārmaiņas: “Man šķiet, ka tas nogalināja spēles dvēseli, mainot pokeru. Ja agrāk uzvarēja tas pokera spēlētājs, kurš spēles problēmas risināja radošāk par citiem, tad tagad uzvar tas, kurš spēj vairāk atcerēties šo informāciju un likt lietā.”

Petrs Lopusevičs, PioSOLVER izstrādātājs, nepiekrīt šim viedoklim. Viņš apgalvo, ka jaunās paaudzes instrumenti, kuru pamatā ir mākslīgais intelekts, ir tikai jaunākais posms garā tehnoloģisko inovāciju ķēdē pokerā. Pirms risinātāju parādīšanās labākie tiešsaistes spēlētāji, piemēram, Polks, izmantoja īpašu programmatūru, lai savāktu informāciju par pretinieku spēli un analizētu viņu iespējamās nepilnības. “Tagad kāds bruņošanās sacensībās ir ienesis augstāka kalibra ieročus, un puiši, kuri nevarēja gūt peļņu, dziedāja: “Jā, bet mēs nedomājām par tādu bruņošanās sacensību. Mums ir vajadzīgi tikai mūsu instrumenti, nevis labākie instrumenti,” saka Lopusevičs.

 

Lopusevičs uzskata, ka risinātāji ir ne tikai mainījuši pokeru, bet atklājuši tā būtību. Neatkarīgi no tā, vai pokera spēlētāji to atzīst vai nē, spēle vienmēr ir bijusi fon Neimana maksimizācijas problēma. “Šodien, sākot ar noteiktu līmeni, visi spēlētāji ir spiesti ievērot spēles matemātisko pusi,” saka Lopusevičs. “Viņi vairs nevar viņu ignorēt.”

 

Добавить комментарий