Основна тема
Црно/бијела тема
Инверзна тема

Подешавaња

Умањи / Увећај

Изаберите тему

Основна тема
Црно/бијела тема
Инверзна тема

Nauka i tehnologija

[ Izvor: Nedeljnik, Objavila: M.M.Lj. ]

19. 08. 2019. 19:11 >> 19:10

BLEFIRA I POBJEĐUJE

Vještačka inteligencija igra poker

Za 14 godina koliko profesionalno igra poker, Deren Ilajas nikada se nije suočio ni sa kim ko igra tako neustrašivo.

Tipični pokeraš bi kada mu podijele dva žandarma – jednog otvorenog, drugog sakrivenog, ruka ni dobra ni loša – nastavio da igra sa oprezom. Ali ne i Ilajasov protivnik; činilo se da dobro zna šta radi. Čak i kada je Ilajas odlučio da blefira, protivnik je pratio ulog. Naposljetku je i pobijedio. Još fascinantnije: ovaj protivnik je bila mašina.

Automatizovani igrač pokera nazvan Pluribus dizajnirali su istraživači sa Univerziteta Karnegi Melon u Pensilvaniji i Fejsbukova laboratorija za vještačku inteligenciju u Njujorku.

U tekstu objavljenom 11. jula u časopisu Science, istraživači su objasnili kako je Pluribus pobijedio Ilajasa i još nekoliko drugih elitnih profesionalaca u igri „Texas Hold ‘Em“, najpopularnijoj vrsti pokera.

Istraživači su u posljednjih trideset godina izgradili sisteme koji uspijevaju da poraze najbolje igrače u šahu, igri „Go“, pa čak i televizijskim kvizovima. Ali za razliku od ovih igara, poker se temelji na skrivenim informacijama. Svaki igrač u rukama drži karte koje protivnik ne smije da vidi.

Pluribus je znao kada treba da blefira, kada da prati ulog i kada da promiojeni ponašanje tako da drugi igrači ne mogu da dokuče njegovu strategiju.

“On radi sve ono što rade najbolji igrači na svijetu”, kaže Ilajas (32), četvorostruki osvajač titule na Svjetskom prvenstvu u pokeru. “Radi, doduše, i neke stvari koje ljudi ne umiju.”

Stručnjaci smatraju da bi tehnike koje pokreću ovaj i slične sisteme mogle da se uspješno koriste na Volstritu, aukcijama, u političkim pregovorima i sajber bezbjednosti, odnosno aktivnostima koje, kao i poker, podrazumijevaju skrivene informacije.

Pluribus je naučio nijanse u igranju „Texas Hold’ Em“ tako što je bilione partija odigrao protiv sebe. Posle svake ruke izvršio bi evaluaciju odluka i odredio da li bi drugačiji izbor doveo do boljeg rezultata.

Sistemima koji briljiraju u trodimenzionalnim video-igrama poput „StarCraft“ potrebne su nedjelje, čak mjeseci da bi naučili kako da igraju protiv ljudi. Pluribus je vježbao svega osam dana na potpuno običnom kompjuteru vrijednom 150 dolara. Teži dio bilo je stvaranje detaljnog algoritma koji je analizirao posljedice svake odluke koju sistem donese.

Pluribus je na kraju naučio kako da primijeni kompleksne strategije, uključujući blefiranje i nepredvidivost u realnom vremenu. Potom je, dok je igrao protiv ljudi, brusio strategije tako što je unaprijed analizirao moguće ishode.

Sve partije odigrane su onlajn, tako da sistem nije mogao da dešifruje emocionalni odgovor ili gestikulaciju svojih protivnika. Uspjeh Pluribusa je pokazao da se poker može svesti na prostu matematiku, kaže Ilajas. “Čisti brojevi i procenti”.

Пратите нас на

Коментари0

Остави коментар

Остави коментар

Правила коментарисања садржаја Портала РТЦГВише
Поштујући начело демократичности, као и право грађана да слободно и критички износе мишљење о појавама, процесима, догађајима и личностима, у циљу развијања културе јавног дијалога, на Порталу нијесу дозвољени коментари који вријеђају достојанство личности или садрже пријетње, говор мржње, непровјерене оптужбе, као и расистичке поруке. Нијесу дозвољени ни коментари којима се нарушава национална, вјерска и родна равноправност или подстиче мржња према ЛГБТ популацији. Неће бити објављени ни коментари писани великим словима и обимни "copy/paste" садрзаји књига и публикација.Задржавамо право краћења коментара. Мање

Да бисте коментарисали вијести под вашим именом

Улогујте се

Најновије

Најчитаније