Jump to content
Forum Kopalni Wiedzy

Search the Community

Showing results for tags ' poker'.



More search options

  • Search By Tags

    Type tags separated by commas.
  • Search By Author

Content Type


Forums

  • Nasza społeczność
    • Sprawy administracyjne i inne
    • Luźne gatki
  • Komentarze do wiadomości
    • Medycyna
    • Technologia
    • Psychologia
    • Zdrowie i uroda
    • Bezpieczeństwo IT
    • Nauki przyrodnicze
    • Astronomia i fizyka
    • Humanistyka
    • Ciekawostki
  • Artykuły
    • Artykuły
  • Inne
    • Wywiady
    • Książki

Find results in...

Find results that contain...


Date Created

  • Start

    End


Last Updated

  • Start

    End


Filter by number of...

Joined

  • Start

    End


Group


Adres URL


Skype


ICQ


Jabber


MSN


AIM


Yahoo


Lokalizacja


Zainteresowania

Found 2 results

  1. Przed dwoma laty program Libratus wygrał w pokera z czterema zawodowcami. Wielodniowy turniej był rozgrywany w konwencji jeden na jednego, a ludzie ponieśli sromotną klęskę. Dla sztucznej inteligencji był to olbrzymi krok naprzód, jednak nawet współtwórca Libratusa, profesor Tuomas Sandholm, nie wierzył, by SI poradziła sobie jednocześnie z większą liczba graczy. Uczony właśnie udowodnił sam sobie, że się mylił. Sandholm jest współautorem algorytmu o nazwie Pluribus, który właśnie wygrał z sześcioma zawodowcami w nielimitowany Texas Hold'em. Nie sądziłem, że stanie się to możliwe za mojego życia, stwierdził uczony. Dotychczas sztuczna inteligencja coraz lepiej radziła sobie w grach z ludźmi, ale były to rozgrywki jeden na jeden lub drużynowe, dwóch przeciwko dwóm. SI zadziwiała swoimi osiągnięciami w warcabach, szachach, Go oraz pokerze. Wszystkie mecze były rozgrywkami o sumie zerowej. Jedna strona wygrywała, druga przegrywała. Jednak gra przeciwko sześciu osobom to zupełnie inny poziom trudności. Bardziej przypomina to rzeczywiste sytuacje, gdy trzeb podejmować decyzje nie znając zasobów (kart) i procesu podejmowania decyzji przez przeciwników. To pierwszy poważny sprawdzian możliwości SI w sytuacji innej niż pojedynek lub walka dwóch drużyn i gra o sumie zerowej. Po raz pierwszy wyszliśmy poza ten paradygmat i wykazaliśmy, że SI dobrze radzi sobie w takich sytuacjach, mówi współtwórca Pluribusa Noam Brown, zatrudniony w Facebook AI Research. Pluribus zaczynał od rozgrywki, w której brał udział 1 człowiek i 5 niezależnych wersji Pluribusa. Z czasem doszedł do poziomu, w którym mógł wygrać z 5 profesjonalistami jednocześnie. Przeciwnikami sztucznej inteligencji było 15 zmieniających się zawodowych graczy, z których każdy wcześniej wygrał w pokera co najmniej milion dolarów. Rozegrano 10 000 rozdań, a turniej trwał 12 dni. Co prawda Pluribus nie odniósł nad ludźmi tak miażdżącego zwycięstwa jak Libratus, jednak jego osiągnięcia zaskoczyły ekspertów. Istniały pewne dowody wskazujące, że techniki SI wykorzystane w pokerowym pojedynku powinny działać też przy trzech graczach, jednak nie było jasne, czy można je zastosować do większej liczby przeciwników grających na najwyższym poziomie. To naprawdę sensacyjna wiadomość, że sprawdziły się one w meczu sześcioosobowym. To ważny kamień milowy, mówi profesor Michael Wellman z University of Michigan. Pluribus, podobnie jak Libratus, uczył się pokera rozgrywając wiele symulowanych pojedynków sam ze sobą. Jak informują jego twórcy, sukces programu leży w zastosowaniu „wyszukiwania o ograniczonej głębokości”. Mechanizm ten pozwala SI na obliczenie dla wszystkich przeciwników kilku ruchów naprzód i opracowaniu na tej podstawie najlepszej strategii. Tego typu taktykę wykorzystuje wiele programów grających w pokera, jednak jej użycie w przypadku rozgrywki sześcioosobowej wymaga kolosalnych ilości pamięci do przechowania wszystkich możliwych ruchów wszystkich przeciwników oraz wszystkich możliwych zakładów. Libratus radził sobie z tym problemem biorąc pod uwagę jedynie dwie ostatnie rundy podbić. Jednak i tak wymagało to użycia 100 procesorów dla gry dwuosobowej. Pluribus działał nieco inaczej. Brał pod uwagę tylko cztery możliwe zachowania przeciwnika. Jedno to obliczony najbardziej prawdopodobny ruch, drugie w którym przeciwnik skłania się ku pasowi, trzecie gdy przeciwnik raczej wybiera sprawdzenie oraz ostatnie, gdy przeciwnik raczej podbija stawkę. Dzięki temu możliwe było znaczące ograniczenie wymaganych zasobów liczeniowych. Wykorzystane algorytmy były niezwykle wydajne. Dość wspomnieć, że podczas pokazu na żywo Pluribus był uruchomiony na maszynie zawierającej jedynie dwa procesory i 128 GB RAM. To zadziwiające, że w ogóle to się udało i że udało się bez wykorzystywania mocy obliczeniowej procesorów graficznych i innego ekstremalnie wydajnego sprzętu, cieszy się Sandholm. Dość tutaj wspomnieć, że program AlphaGo, który w 2016 roku pokonał w Go Lee Sedola korzystał z 1920 CPU i 280 GPU. Specjaliści z Carnegie Mellon University i Facebooka, którzy stworzyli Pluribusa, opublikują jedynie jego pseudkod, czyli opis kroków niezbędnych do stworzenia podobnego programu. Zdecydowali jednak, że nie upublicznią prawdziwego kodu, by nie ułatwiać rozpowszechniania oprogramowania do gry w pokera. Mogłoby to bowiem zniszczyć zarówno tę dziedzinę działalności gospodarczej jak i społeczność graczy. Wykorzystany algorytm SI może znaleźć zastosowanie wszędzie tam, gdzie trzeba podjąć decyzje bez pełniej wiedzy o tym, co robią lub myślą inni. Przyda się w takich dziedzinach jak cyberbezpieczeństwo, handel, negocjacje biznesowe czy ustalanie cen. Zdaniem Sandhloma może też pomóc podczas zbliżających się wyborów prezydenckich w USA, gdyż pomoże kandydatom na określenie poziomu wydatków potrzebnych do zwycięstwa w kluczowych stanach. Sandholm założył już trzy firmy, które będą świadczyły usługi z wykorzystaniem SI na rynkach biznesowych czy wojskowych,. « powrót do artykułu
  2. Padła kolejna bariera oddzielająca ludzką i sztuczną inteligencję. Program Libratus rozgromił światową czołówkę pokerzystów. W nielimitowanym Texas Hold'em sztuczna inteligencja zdobyła na ludziach 1.766.250 dolarów. Dong Kim przegrał z Libratusem 88.649 USD, Jimmy Chou zubożał o 522.857 dolarów, Jason Les stracił 880.087 USD, a Daniel McAulay musiał zapłacić 277.657 USD. Turniej Brains vs. Artificial Intelligence trwał od 11 do 30 stycznia i był rozgrywany w godzinach od 11.00 do 19.00. Składał się w sumie ze 120 000 rozdań. Libratus powstał na Carnegie Mellon University i jest dziełem profesora Tuomasa Sandholma i doktoranta Noama Browna. Podczas uczenia się pokera program nie korzystał z doświadczeń ludzkich graczy. Zaimplementowano mu zasady gry, które miał przeanalizować, a później - na podstawie około 15 milionów godzin obliczeń w Pittsburgh Supercomputing Center - opracowywał własną strategię. Udoskonalał ją też w czasie turnieju. Nie uczyliśmy Libratusa grać w pokera. Daliśmy mu zasady i kazaliśmy się uczyć samemu - mówi Brown. Początkowo rozgrywki były niezwykle chaotyczne, program zgrywał przypadkowe karty. Jednak po bilionach rozdań opracował skuteczną strategię. Przed wielu laty oprogramowanie komputerowe zadziwiło świat wygrywając w szachy z arcymistrzem. Niedawno rozgromiło też mistrza Go. Zwycięstwo w pokerze pokazuje, że algorytmy sztucznej inteligencji przekroczyły kolejną granicę. Poker znacząco różni się bowiem od szachów czy Go. Gracze nie znają stanu rozgrywki, gdyż nie wiedzą, jakie karty ma przeciwnik. Dochodzi tutaj też element losowy, gdyż to on decyduje, kto jakie karty dostanie oraz element blefu. To tak złożone wyzwanie, że dotychczas badacze zajmujący się SI nie radzili sobie z nim, stwierdza Sandholm. Uczony dodaje, że sam nie był pewien możliwości Liberatusa. Międzynarodowe witryny z zakładami stawiały 4:1 przeciwko naszemu programowi. Okazało się jednak, że wszystko to nie stanowi dla Libratusa większego problemu. Sztuczna inteligencja była w stanie prawidłowo interpretować blef, używany przez ludzkich przeciwników, i... sama blefowała, co zaskoczyło jej twórców. Gdy zobaczyłem, że Liberatus blefuje, zdziwiłem się. nie uczyłem go tego. Nie sądziłem, że jest do tego zdolny. Jestem dumny z faktu, że stworzyłem coś, co potrafi tego dokonać - mówi Brown. Libratus był znacznie lepszy niż sądziliśmy. To nieco demoralizujące, mówi Jason Les, który przed dwoma laty był grupie graczy, którzy rozgromili SI Claudico. Tutaj codziennie wstawaliśmy i przez 11 godzin na dobę byliśmy ogrywani. To zupełnie inne doświadczenie emocjonalne - dodaje. Gracze mogli też uczyć się od Libratusa, który stosował agresywną strategię, stawiał duże sumy, by wygrać małe kwoty. Ludzie tak normalnie nie grają, ale to wymusza na tobie ciągłą koncentrację uwagi - dodaje Les. Zastosowane w Libratusie algorytmy nie są wyspecjalizowane w pokerze. A to oznacza, że będzie można zastosować je w wielu dziedzinach, od gier komputerowych, poprzez negocjacje biznesowe, po branże bezpieczeństwa, wojskową czy medyczną - wszędzie tam, gdzie potrzebne jest strategiczne myślenie w oparciu o niepełne informacje. Poker to najmniejsze zmartwienie. Mamy tutaj maszynę, która może skopać ci tyłek w biznesie i zastosowaniach wojskowych. Martwię się, jak ludzkość sobie z tym poradzi - stwierdził profesor Roman V. Yampolskiy z University of Louisville. « powrót do artykułu
×
×
  • Create New...