Програма, що отримала назву Libratus, перемогла чотирьох кращих професійних гравців в покер в безлімітному Техаському Холдемі, пише EurekAlert.

У своїй статті автори програми детально пояснили, як їй вдалося домогтися надлюдської продуктивності, розбиваючи гру на керовані частини і, грунтуючись на грі своїх опонентів, усувати можливі недоліки в своїй стратегії під час змагань. Libratus використовує тристоронній підхід для обліку прихованої інформації.

Як відзначають розробники, їх версія штучного інтелекту вміє знаходити спільні риси в різних комбінаціях карт, ставок і інших елементів гри, і вважати їх приблизно одним і тим же варіантом розвитку подій. Такий підхід значною мірою спрощує гру і дозволяє знаходити прості рішення для очевидних комбінацій карт і варіантів ходів суперника.

«Прийоми, які розроблені нами при створенні цієї системи штучного інтелекту, не специфічні для покеру, їх можна застосовувати в будь-яких ситуаціях, коли немає повної інформації для прийняття рішень», – заявив Ной Браун з Університету Карнегі-Меллон. 

Libratus складається з трьох модулів. Перший обчислює так звану абстракцію гри, грунтуючись на загальних рисах між ставками і комбінаціями. Це дозволяє програмі розробити детальну стратегію на перші раунди торгівлі та згрубша стратегію для наступних раундів.

Під час гри другий модуль змінює стратегію в залежності від дій противника. Це робиться за допомогою суперкомп'ютера Bridges. Кожного разу, коли суперник робить хід, який не передбачався початковою стратегією, модуль робить відповідні обчислення. Третій модуль призначений для поліпшення стратегії під час партії.

 

«Вголос»

ІА "Вголос": НОВИНИ