DeepNash blefuje i wygrywa z ludźmi w Stratego, grze o większej liczbie stanów niż go

KopalniaWiedzy.pl · 5 grudnia 2022

Sztuczna inteligencja firmy DeepMind, która jako pierwsza pokonała człowieka w go, nauczyła się blefować w strategicznej grze planszowej Stratego. Co więcej, potrafi wygrać z człowiekiem grę, która ma znacznie więcej możliwych scenariuszy niż go czy poker. Najbardziej zaskakujący był dla nas fakt, że DeepMind był w stanie poświęcić wartościowe zasoby, by zdobyć informację o ustawieniu przeciwnika i jego strategii, stwierdzają twórcy algorytmu.

Celem Stratego jest zdobycie flagi przeciwnika. Każdy z graczy ma do dyspozycji 40 pionków, które umieszcza na planszy o wymiarach 10x10 tak, by przeciwnik nie widział rang – czyli siły – żadnego z nich. Jest to więc gra, w której – w przeciwieństwie do go czy szachów – nie wszystkie informacje o przeciwniku są znane. Dodatkowym wyzwaniem dla sztucznej inteligencji jest fakt, że w Stratego istnieje olbrzymia liczba możliwych stanów gry.

W 1996 roku Deep Blue wygrał w szachy z Kasparowem, stając się pierwszym komputerem, który zwyciężył z szachowym mistrzem świata. Musiało minąć 20 lat zanim komputery – a konkretnie sztuczna inteligencja firmy DeepMind o nazwie AlphaGo – wygrała z mistrzem w go. Pokonanie człowieka w go zajęło maszynom tyle czasu, gdyż go wymaga znacznie większej mocy obliczeniowej. Liczba możliwych stanów gry w go wynosi aż 10³⁵⁰, podczas gdy w szachach jest to 10¹²³. Tymczasem na pokonanie człowieka w Stratego nie musieliśmy czekać tak długo. Wystarczyło 6 lat, by DeepNash stał się jednym z 3 najlepszych graczy na największej online'owej platformie Stratego, Gravon. Liczba możliwych stanów gry w Stratego wynosi 10⁵³⁵.

Poziom gry DeepNasha był dla mnie zaskoczeniem. Nigdy nie słyszałem o maszynie, która w Stratego osiągnęłaby poziom potrzebny do pokonania doświadczonego gracza, mówi Vincent de Boer, były mistrz świata w Stratego i jeden z autorów artykułu opisującego osiągnięcia DeepNasha.

DeepNash uczył się grać w Stratego rozgrywając 5,5 miliarda partii. Nie korzystał przy tym z doświadczeń ludzi, ani nie był trenowany do starcia z konkretnym przeciwnikiem. Sztuczna inteligencja nie próbuje przeanalizować wszystkich możliwych scenariuszy, byłoby to nie możliwe. Zamiast tego postępuje tak by – zgodnie z ekonomiczną teorią gier – uzyskać jak największą korzyść. Optymalna strategią jest taka, która gwarantuje co najmniej 50% zwycięstw w przypadku walki z idealnym przeciwnikiem, nawet gdy ten wie, co DeepNash planuje.

W tej chwili DeepNash rozegrał 50 partii z ludźmi, wygrywając 84% z nich i stając się jednym z trzech najlepszych graczy na platformie Gravon. Jeszcze lepiej radzi sobie z innymi botami grającymi w Stratego. Pokonuje je w 97% przypadków i wygrywa z takimi, które dotychczas wygrywały podczas Computer Stratego World Championship.

« powrót do artykułu

thikim · 6 grudnia 2022

Wychodzi na to że umysłowa przewaga człowieka nad "maszynami" topnieje bardzo szybko.
Gdyby nie to że gruchoty dalej bez lepszego zasilania ani rusz - to już bym to słabo widział. Człowieka jednak można traktować jako taki zbiór nanobotów (komórek) a więc technologia ciała jest o parę poziomów wyżej niż technologia maszyn.

tempik · 6 grudnia 2022

2 godziny temu, thikim napisał:

Wychodzi na to że umysłowa przewaga człowieka nad "maszynami" topnieje bardzo szybko.

ale tylko na papierze. Maszyny działają w ramach jakiś ściśle określonych reguł które człowiek jej zaprogramuje. Bez świadomości nie wyjdzie poza to, dalej będzie zaawansowanym kalkulatorem. Człowiek (jeśli już przestrzega reguł) to sam sobie je ustala, i w każdej chwili może je zmienić. Może np. wywrócić stolik z pionami, kopnąć maszynę w zasilacz i oznajmić światu że to on wygrał

thikim · 6 grudnia 2022

Nie przesadzałbym z tą wiarą w ludzi.
Decyzje ludzi - zazwyczaj sprowadzają się do unikania nieprzyjemności i szukania przyjemności. Ot, gro reguł jakie człowiek sobie ustali i tak się sprowadzi do tych dwóch.
Jakby maszyna miała lepsze ciało - to by oddała dużo mocniej ten kopniak. Jak pisałem - mamy przewagę cielesną dużą.

Zaloguj się

DeepNash blefuje i wygrywa z ludźmi w Stratego, grze o większej liczbie stanów niż go

Rekomendowane odpowiedzi

KopalniaWiedzy.pl 381

Udostępnij tę odpowiedź

Odnośnik do odpowiedzi

Udostępnij na innych stronach

thikim 120

Udostępnij tę odpowiedź

Odnośnik do odpowiedzi

Udostępnij na innych stronach

tempik 85

Udostępnij tę odpowiedź

Odnośnik do odpowiedzi

Udostępnij na innych stronach

thikim 120

Udostępnij tę odpowiedź

Odnośnik do odpowiedzi

Udostępnij na innych stronach

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Zarejestruj nowe konto

Zaloguj się

Podobna zawartość

Ostatnio przeglądający 0 użytkowników

Przeglądaj

Aktywność