Тази Компютърна Програма Може Да Победи Всеки От Покера

{h1}

Нова компютърна програма може да надмине хората в покер игра за двама играчи.

Компютрите са измислили как да спечелят в шах, шашки и тик-так-пръст, а сега компютърна програма завладява играта на покер.

Изследователски екип, ръководен от Майкъл Боулинг, професор по компютърни науки в Университета в Алберта в Канада, разработи компютърна програма, която може да надмине хората в игра на покер за двама играчи - по-специално хедс-ъп лимит. Резултатите могат да имат далечни последици за други ситуации, които изискват сложно вземане на решения, например във външната политика или медицинското лечение.

За разлика от шах или шашки, в покера един играч не винаги знае миналите ходове на останалите играчи. Плюс това, играчът може да спечели ръка, когато останалите играчи се откажат. Следователно, математически погледнато, играта има несъвършена информация. [Топ 10 революционни компютри]

"Шахматът има перфектно решение за игра - отговорът за дадена позиция е, печалба за черно, победа за бели или равенство", каза Боулинг. „Покерът е по-вероятен.“ С други думи, няма абсолютно перфектна ръка или стратегия.

Как работи

Във версията за задържане на покер, която компютърът е играл, залозите между двама играчи са фиксирани и броят на рейзовете е ограничен. Дилърът дава на всеки играч две карти, наречени карти с дупки. Следва кръг от залагания, известен като "префлоп". След това на масата се подреждат още три карти, наречени „флоп“. Флопът е набор от общи карти, раздадени с лицето нагоре, така че и двамата играчи знаят какво представляват. Следва още един кръг на залагане и след това на масата се поставя четвърта карта, наречена „завой“. След трети кръг на залагане се раздава последната обща карта (това е известно като "реката") и в този момент играчите трябва да покажат своите карти с дупки, като приемат, че един играч все още не е сгънал.

Компютърът не изчислява всяка възможна ръка, докато играе. Вместо това той изгражда таблица с резултати преди старта на играта. Използването на около 4000 централни процесорни единици за два месеца - което е равно на около 1000 години изчислително време - симулира милиарди ръце в покер. Самата таблица с резултати зае около 15 терабайта компютърно съхранение, каза Боулинг. За сравнение, типичното резервно устройство за десктоп е един терабайт. [10 технологии, които ще преобразят живота ви]

Алгоритъмът преминава през всички възможни ръце, които противниковия играч би могъл да има, и след това събира резултатите за всяка тактика - например повишаване, фолдване или повикване на залога (т.е. съвпадение на противника). За да добиете представа колко голяма е задачата, има 13,8 трилиона различни ситуации, които могат да се появят в играта. За да стигне до там, всяко човешко същество на Земята ще трябва да играе почти 4000 ръце покер.

Това се различава от шахмата, при която компютърът може да изчислява движения с груба сила, докато играта напредва, за да получи резултат, който е достатъчно добър, за да спечели. (Противно на това, което мнозина мислят, малко компютърни програми всъщност преминават през всяка една пермутация, само тези, които дават най-добри резултати). Представете си вместо това, ако компютрите с игра на шах трябваше да търсят резултатите от милиарди предишни игри със специфична конфигурация на парчета на дъската.

Докато се играят милиарди ръце, програмата измисля оптимална стратегия - тоест тя се сближава с това кой е най-добрият ход за дадена ръка. "Начинът, по който това работи... вече е изигран милиард милиарда покер ръце", каза Боулинг.

Овладяване на играта

Тъй като покерът не е разрешим, какъвто е шахът или шашърите, Боулинг и неговият екип излязоха с различен набор от изисквания, за да наричат ​​играта „решена“. В научно отношение играта е "по същество решена", което означава, че има начин да се използва стратегията, която компютърът използва. Изследователите предположили, че човек играе на компютъра в продължение на 70 години, 365 дни годишно, в продължение на 24 часа на ден. Програмата, която написаха, играеше толкова добре, че ако големият блайнд - фиксираният залог - е $ 1000, най-перфектният играч, който може да спечели, е около $ 1 на ръка, или 1/1000 от големия блайнд.

Други експерти са работили върху компютри, играещи в покер, които се използват в казина, и поне една компания казва, че е разработила алгоритъм за машинно обучение, който коригира стратегията според човека играч. Но никой не е доказал, че експлоатационната му способност - способността на перфектен човешки играч да победи машината - е толкова малка, колкото програмата, създадена от екипа на Боулинг. Нито някой е решил играта по същия математически строг начин.

Но алгоритъмът има ограничения. За един той работи само с игри с две ръце. В игра с трима играчи е възможно един играч да има страшна стратегия (например може би играчът да има тенденция да вдига непрекъснато) и губи по-малко от втория играч, който има по-добра стратегия, в резултат на което при победа за третия играч.

Друг проблем е да разберете как да тествате играта на три играчи справедливо. Един експеримент може да накара двама души да играят на машината, но Боулинг каза, че човешките играчи могат да се договарят срещу машината, дори и неволно. Подобни проблеми могат да възникнат при експерименти с два машинни плейъра и един човек: Дори и двете програми да не се договарят, това може да изглежда по този начин на човек. "Не знаем как да го управляваме справедливо", каза той.

Боулинг каза, че тази технология може да има разнообразни приложения, вариращи от националната сигурност, до проследяване на укриването на тарифи от транзитни системи, до вземане на решения за медицинско лечение. Например програмата може да помогне на лекар, който трябва да вземе решение относно лечението, но не е сигурен в възможните резултати. Методите, използвани в покер програмата, могат да помогнат на лекарите да идентифицират възможностите за лечение с оптимални резултати или такива с най-голяма вероятност за успех.

Изследването беше описано онлайн днес (8 януари) в списание Science.

Следвайте науката на живо @wordssidekick, Facebook, Оригинална статия на Наука на живо.


Видео Добавка: The AI Gaming Revolution.




Изследване


Lockheed Vega
Lockheed Vega

Дали Сградите Някога Ще Бъдат Наистина Устойчиви На Земетресения?
Дали Сградите Някога Ще Бъдат Наистина Устойчиви На Земетресения?

Наука Новини


Защо Сащ Ще Унищожат, А Не Продават Запасите Си От Слонова Кост
Защо Сащ Ще Унищожат, А Не Продават Запасите Си От Слонова Кост

Как Салмонелата Влиза В Зърнените Храни?
Как Салмонелата Влиза В Зърнените Храни?

Ен Гарде! Банда На Диви Котки Атакува Жена, Куче Във Франция
Ен Гарде! Банда На Диви Котки Атакува Жена, Куче Във Франция

„Стелтни Предаватели“ На Грипа Активират Различни Гени
„Стелтни Предаватели“ На Грипа Активират Различни Гени

Защо Е Толкова Трудно Да Се Предвиди Крахът На Космическата Станция На Китай?
Защо Е Толкова Трудно Да Се Предвиди Крахът На Космическата Станция На Китай?


BG.WordsSideKick.com
Всички Права Запазени!
Възпроизвеждането На Използваните Материали Оставя Само Prostanovkoy Активна Връзка Към Сайта BG.WordsSideKick.com

© 2005–2019 BG.WordsSideKick.com