Žabljak
Pretežno oblačno
11.3 °C
Pljevlja
Umjereno oblačno
14.8 °C
Herceg Novi
Oblačno
17.1 °C
Nikšić
Pretežno oblačno
13.2 °C
Cetinje
Pretežno vedro
22.0 °C
Bar
Umjereno oblačno
17.7 °C
Podgorica
Umjereno oblačno
18.5 °C
Ulcinj
Pretežno oblačno
15.0 °C
Kolašin
Umjereno oblačno
9.5 °C

Nauka i tehnologija

[ Izvor: Nedeljnik, Objavila: M.M.Lj. ]

BLEFIRA I POBJEĐUJE 19. 08. 2019. 19:11   >>  19:10 0

BLEFIRA I POBJEĐUJE

Vještačka inteligencija igra poker

Za 14 godina koliko profesionalno igra poker, Deren Ilajas nikada se nije suočio ni sa kim ko igra tako neustrašivo.

Tipični pokeraš bi kada mu podijele dva žandarma – jednog otvorenog, drugog sakrivenog, ruka ni dobra ni loša – nastavio da igra sa oprezom. Ali ne i Ilajasov protivnik; činilo se da dobro zna šta radi. Čak i kada je Ilajas odlučio da blefira, protivnik je pratio ulog. Naposljetku je i pobijedio. Još fascinantnije: ovaj protivnik je bila mašina.

Automatizovani igrač pokera nazvan Pluribus dizajnirali su istraživači sa Univerziteta Karnegi Melon u Pensilvaniji i Fejsbukova laboratorija za vještačku inteligenciju u Njujorku.

U tekstu objavljenom 11. jula u časopisu Science, istraživači su objasnili kako je Pluribus pobijedio Ilajasa i još nekoliko drugih elitnih profesionalaca u igri „Texas Hold ‘Em“, najpopularnijoj vrsti pokera.

Istraživači su u posljednjih trideset godina izgradili sisteme koji uspijevaju da poraze najbolje igrače u šahu, igri „Go“, pa čak i televizijskim kvizovima. Ali za razliku od ovih igara, poker se temelji na skrivenim informacijama. Svaki igrač u rukama drži karte koje protivnik ne smije da vidi.

Pluribus je znao kada treba da blefira, kada da prati ulog i kada da promiojeni ponašanje tako da drugi igrači ne mogu da dokuče njegovu strategiju.

“On radi sve ono što rade najbolji igrači na svijetu”, kaže Ilajas (32), četvorostruki osvajač titule na Svjetskom prvenstvu u pokeru. “Radi, doduše, i neke stvari koje ljudi ne umiju.”

Stručnjaci smatraju da bi tehnike koje pokreću ovaj i slične sisteme mogle da se uspješno koriste na Volstritu, aukcijama, u političkim pregovorima i sajber bezbjednosti, odnosno aktivnostima koje, kao i poker, podrazumijevaju skrivene informacije.

Pluribus je naučio nijanse u igranju „Texas Hold’ Em“ tako što je bilione partija odigrao protiv sebe. Posle svake ruke izvršio bi evaluaciju odluka i odredio da li bi drugačiji izbor doveo do boljeg rezultata.

Sistemima koji briljiraju u trodimenzionalnim video-igrama poput „StarCraft“ potrebne su nedjelje, čak mjeseci da bi naučili kako da igraju protiv ljudi. Pluribus je vježbao svega osam dana na potpuno običnom kompjuteru vrijednom 150 dolara. Teži dio bilo je stvaranje detaljnog algoritma koji je analizirao posljedice svake odluke koju sistem donese.

Pluribus je na kraju naučio kako da primijeni kompleksne strategije, uključujući blefiranje i nepredvidivost u realnom vremenu. Potom je, dok je igrao protiv ljudi, brusio strategije tako što je unaprijed analizirao moguće ishode.

Sve partije odigrane su onlajn, tako da sistem nije mogao da dešifruje emocionalni odgovor ili gestikulaciju svojih protivnika. Uspjeh Pluribusa je pokazao da se poker može svesti na prostu matematiku, kaže Ilajas. “Čisti brojevi i procenti”.

Komentari 0

ostavi komentar

Ostavi komentar

Pravila komentarisanja sadržaja Portala RTCG
Poštujući načelo demokratičnosti, kao i pravo građana da slobodno i kritički iznose mišljenje o pojavama, procesima, događajima i ličnostima, u cilju razvijanja kulture javnog dijaloga, na Portalu nijesu dozvoljeni komentari koji vrijeđaju dostojanstvo ličnosti ili sadrže prijetnje, govor mržnje, neprovjerene optužbe, kao i rasističke poruke. Nijesu dozvoljeni ni komentari kojima se narušava nacionalna, vjerska i rodna ravnopravnost ili podstiče mržnja prema LGBT populaciji. Neće biti objavljeni ni komentari pisani velikim slovima i obimni "copy/paste" sadrzaji knjiga i publikacija.Zadržavamo pravo kraćenja komentara.

Da biste komentarisali vijesti pod vašim imenom

Ulogujte se

Novo