Компьютер сумел разработать идеальную стратегию игры в покер
У научных сотрудников одного из университетов Канады получилось создать программу для компьютера, которая может сгенерировать удачное решение для одного из самых популярных видов игры в покер – техасского холдема, в котором ставки ограничены). То есть, компьютер сумел «придумать» оптимальную стратегию игры, при помощи которой его не сможет обыграть никакой человек – профессионал за всю жизнь. О данной программе под названием «Цефей» можно узнать из журнала о науке «Саенс».
Следует отметить, что покер, наравне с прочими карточными играми, можно классифицировать как занятие с ограниченной информацией, где игроки имеют особое знание о своих картах, которое недоступно другим участникам турнира. В свою очередь это позволяет блефовать, тем самым выводя из игры соперников. К примеру, шахматы являются игрой с полноценной информацией. Это означает, что два игрока могут видеть местонахождение фигур на доске (своих и противника). Если рассматривать компьютерную программу игр в шашки или шахматы, то в данном случае компьютер или побеждает, или может добиться равенства. Однако над программой касательно покера специалисты по разработке программного обеспечения работали около десяти лет. Начало исследованиям положило компьютерное состязание по этому виду игр.
Новая разработка принадлежит Майклу Боулингу и его группе и основывается на закономерности минимизации неудачных вычислений (counterfactual regret minimization), так как одной из особенностей карточных игр является математический расчет стратегии). Данный алгоритм стиля игры возможен за счет того, что программа делит партию на определенные части (примерно сто тысяч), основываясь на полученных данных, таких как: особенности прошлых ходов соперников, знания о выбывших и открытых на данный момент картах).
Также программа оснащена специфической задачей сжатия информации, чтобы обеспечить удобное сохранение моментов партии на дисках (локальных) и их изъятие обратно в память компьютера для удобства использования при вычислении. Известно, что для обработки данных было затронуто более двухсот узлов вычислений. Все расчеты заняли около семидесяти суток. За данный период «Цефей» сыграл сам с собой миллиарды партий, что было необходимо для получения опыта игры.
Одной из ключевых полезных особенностей техники на практике является то, что исследователи смогли снизить требования к данной программе: на данный момент она призвана не найти максимальное равновесие, а только дать гарантию того, что, учитывая скорость мыслительных процессов человека, тот не сможет одержать победу за всю жизнь. Для множества практических дополнений данной функции вполне хватает. Новая разработка вполне может быть применена в любой деятельности, которой присуще отсутствие или ограничение информации, а также состояние неопределенности. Например, модели общения с бизнес – партнерами или разработка стратегии противостояния массовому заболеванию.
Related Images:
Главный редактор “Россия-онлайн”