- Hronika
- Kolumne
-
Radio
- Izdvajamo
-
Emisije
- Novosti dana
- Dokumentarni program
- Pop top
- Europuls
- Zrno po zrno
- Radio ordinacija
- Kulturna panorama
- Zelena priča
- Epoleta
- +382
- Spona
- Svijet jednakih šansi
- Matica
- Život po mjeri čovjeka
- Link
- Izokrenuti svijet
- Koracima mladih
- Moja profesija je...
- Sportski program
- Kulturno-umjetnički program
- Koracima prošlosti
- Naučno-obrazovni program
- Muzički program
- RCG
- R98
- Programska šema
- Trofej Radija Crne Gore
- Frekvencije
- Radio drama
Nauka i tehnologija
19. 08. 2019.
19:11 >> 19:10
BLEFIRA I POBJEĐUJE
Vještačka inteligencija igra poker
Za 14 godina koliko profesionalno igra poker, Deren Ilajas nikada se nije suočio ni sa kim ko igra tako neustrašivo.
Tipični pokeraš bi kada mu podijele dva žandarma – jednog otvorenog, drugog sakrivenog, ruka ni dobra ni loša – nastavio da igra sa oprezom. Ali ne i Ilajasov protivnik; činilo se da dobro zna šta radi. Čak i kada je Ilajas odlučio da blefira, protivnik je pratio ulog. Naposljetku je i pobijedio. Još fascinantnije: ovaj protivnik je bila mašina.
Automatizovani igrač pokera nazvan Pluribus dizajnirali su istraživači sa Univerziteta Karnegi Melon u Pensilvaniji i Fejsbukova laboratorija za vještačku inteligenciju u Njujorku.
U tekstu objavljenom 11. jula u časopisu Science, istraživači su objasnili kako je Pluribus pobijedio Ilajasa i još nekoliko drugih elitnih profesionalaca u igri „Texas Hold ‘Em“, najpopularnijoj vrsti pokera.
Istraživači su u posljednjih trideset godina izgradili sisteme koji uspijevaju da poraze najbolje igrače u šahu, igri „Go“, pa čak i televizijskim kvizovima. Ali za razliku od ovih igara, poker se temelji na skrivenim informacijama. Svaki igrač u rukama drži karte koje protivnik ne smije da vidi.
Pluribus je znao kada treba da blefira, kada da prati ulog i kada da promiojeni ponašanje tako da drugi igrači ne mogu da dokuče njegovu strategiju.
“On radi sve ono što rade najbolji igrači na svijetu”, kaže Ilajas (32), četvorostruki osvajač titule na Svjetskom prvenstvu u pokeru. “Radi, doduše, i neke stvari koje ljudi ne umiju.”
Stručnjaci smatraju da bi tehnike koje pokreću ovaj i slične sisteme mogle da se uspješno koriste na Volstritu, aukcijama, u političkim pregovorima i sajber bezbjednosti, odnosno aktivnostima koje, kao i poker, podrazumijevaju skrivene informacije.
Pluribus je naučio nijanse u igranju „Texas Hold’ Em“ tako što je bilione partija odigrao protiv sebe. Posle svake ruke izvršio bi evaluaciju odluka i odredio da li bi drugačiji izbor doveo do boljeg rezultata.
Sistemima koji briljiraju u trodimenzionalnim video-igrama poput „StarCraft“ potrebne su nedjelje, čak mjeseci da bi naučili kako da igraju protiv ljudi. Pluribus je vježbao svega osam dana na potpuno običnom kompjuteru vrijednom 150 dolara. Teži dio bilo je stvaranje detaljnog algoritma koji je analizirao posljedice svake odluke koju sistem donese.
Pluribus je na kraju naučio kako da primijeni kompleksne strategije, uključujući blefiranje i nepredvidivost u realnom vremenu. Potom je, dok je igrao protiv ljudi, brusio strategije tako što je unaprijed analizirao moguće ishode.
Sve partije odigrane su onlajn, tako da sistem nije mogao da dešifruje emocionalni odgovor ili gestikulaciju svojih protivnika. Uspjeh Pluribusa je pokazao da se poker može svesti na prostu matematiku, kaže Ilajas. “Čisti brojevi i procenti”.
Коментари0
Остави коментар