Melcher, H. (2015). Evaluation of equity models for tournament poker [Diploma Thesis, Technische Universität Wien]. reposiTUm. http://hdl.handle.net/20.500.12708/79991
Turnier-Poker ist ein beliebtes stochastisches Spiel mit imperfekter Information. Das Spiel bewegt sich abhängig von den Aktionen der Spieler zufällig in einer Menge von Turnierzuständen. Heuristische Equity Modelle sind ein häufig genutztes Werkzeug um die erwarteten Auszahlungen der Spieler für einen gewählten Turnierzustand anhand der Chipstände zu approximieren. Trotz der Beliebtheit dieser Modelle, und einer Auswahl von dedizierter Software um sie auf Spielsituationen anzuwenden, gibt es kaum öffentlich verfügbare Evaluierungen der verwendeten Methoden. Als Teil dieser Arbeit wird durch Anwendung von aktuellen Techniken zur Lösung von Spielen mit imperfekter Information ein Epsilon-Nash Gleichgewicht für eine umfangreiche Abstraktion eines Poker-Turnierspiels berechnet. Die Auszahlungswerte und Strategien dieser Lösung werden im Folgenden als Referenz verwendet, um die Genauigkeit der heuristischen Equity Modelle zu untersuchen. Die bereits bekannte Tendenz des Malmuth-Harville Standardmodells zur Unterschätzung der Auszahlungen für Spieler mit großen Chipständen wird als Teil dieser Evaluierung bestätigt, und wird von dem neueren Roberts Modell in einem geringeren Ausmaß geteilt. Von einer der zugrunde liegenden Annahmen der untersuchten Heuristiken, die Gewinnwahrscheinlichkeiten der Spieler wären proportional zu ihren Chipständen, wurden in der berechneten Spielabstraktion bemerkenswerte Abweichungen gefunden. Für die ebenfalls betrachtete Suchtechnik Future Game Simulation (FGS) konnte eine deutliche Verbesserung gegenüber den Standardmodellen festgestellt werden.
Tournament poker is a popular stochastic game with imperfect information, the game transitions probabilistically between tournament states dependent on the players' actions. Several heuristic equity models are widely employed by human players to estimate the expected payoffs for tournament states. Despite the popularity of these models and the availability of dedicated software for applying them, little public research is available regarding their accuracy. In this work, we calculate an Epsilon-Nash equilibrium for a large tournament game instance by applying state-of-the-art techniques for solving games of imperfect information, and use the results of this game to evaluate the performance of the heuristic approaches. We find that the de facto standard Malmuth-Harville heuristic and the model proposed by Roberts display similar accuracy in our game. The known tendency of Malmuth-Harville to underestimate payoffs for large chip stacks is shared by Roberts, although to a smaller degree. The common underlying assumption of winning probabilities being proportional to the chip stacks does not hold true in our game setting. We also evaluate an adversarial search technique called Future Game Simulation (FGS), and find that it provides a significant improvement over the standard heuristics.