
게임 이론 최적화(GTO) 포커는 “무제한 홀덤 플레이 전략의 성배를 설명하기 위해 플레이어가 사용하는 포괄적인 용어”(마스터클래스)입니다. 일반적으로 최적화 이론은 플레이어가 항상 장기적으로 가장 많은 이익을 얻는 결정을 내린다는 것을 의미합니다. 예를 들어, 플레이어가 매 순간 체크/콜, 베팅 또는 폴드 결정을 내릴 때마다 각기 다른 핸드 조합(A,A,K,K,A,K 등)이 있으며, 각 핸드 조합에는 승률이 연관되어 있습니다. 다음 GTO를 사용하면 플레이어는 다양한 핸드 조합을 호출하거나 올릴 수 있는 범위와 여러 핸드 조합을 갖게 됩니다. 자신의 범위 내에 있지 않은 핸드는 접게 됩니다. 하지만 GTO가 항상 통계를 따라야 한다는 의미는 아닙니다. 두 명의 플레이어만 있는 대결 게임에서는 통계를 엄격하게 따르지 않는 경우보다 더 자주 승리해야 하지만 실제로는 이런 일이 거의 발생하지 않습니다.
인간과 게임을 할 때는 어느 정도의 무작위성을 고려하고 그들이 사용할 수 있는 다양한 전략을 고려해야 합니다. “다양한 손으로 전략이 무엇인지 어느 정도 파악할 수 있으며, 자신의 전략을 실행할 때 이를 고려해야 합니다. 즉, 플레이어를 플레이하세요. 이것이 바로 GTO 포커의 핵심입니다.” (야코벤코) (하지만 “상대의 전략에 맞춰 전략을 조정하면 그 사람도 당신의 전략에 맞춰 조정하게 됩니다.” (야코벤코) (야코벤코). 이는 상대방의 전략에 대응하기 위해 전략을 재조정하는 끝없는 순환을 만듭니다. 두 명 이상의 플레이어가 있는 게임에서는 모든 상황에 맞는 최적의 전략을 찾는 것이 거의 불가능합니다. 두 명의 플레이어가 있는 게임에서는 “상대가 다른 가능한 전략으로는 1% 이상의 이점을 활용할 수 없거나 최소한 활용할 수 없는” GTO 균형을 찾을 수 있습니다 (야코벤코). “알버타 대학교의 과학자 그룹은 2015년 텍사스 홀덤의 사전 제한을 위한 GTO 균형을 발견하면서 게임을 ‘해결’할 방법을 찾았다고 선언했습니다.” (앙기오니).
연구진은 200대의 컴퓨터를 사용하여 70일 동안 프로그램을 통해 “자신과의 균일한 게임”을 학습하고, “게임의 모든 가능한 움직임”(앙기오니)을 학습한 후 “완벽함과 구분할 수 없을 때”(앙기오니)를 멈춥니다. 연구진은 GTO 포커를 일관되게 수행할 수 있는 AI를 찾는 것 외에도 “이제 딜러가 게임당 ’88밀리아블라인드’, 즉 게임당 0.088의 큰 블라인드를 달성할 수 있다는 것을 증명할 수 있다”(앙기오니)고 결론지었습니다. 이러한 발견 자체도 중요하지만, 이제 완벽하게 플레이할 수 있는 AI가 있는 환경이 필요한 포커 이론에 대한 다른 질문들도 탐구할 수 있다는 점도 고려해야 합니다.
GTO 포커 이론은 클래스의 게임 이론 부분과 관련이 있습니다. 테이블에 있는 각 개인은 정해진 카드 수에 따라 변수를 결정해야 하는 일련의 결정을 내립니다. 일부 클래스 예제와 같이 이익으로 볼 수도 있는 이들의 당첨 확률은 자신과 테이블에 있는 다른 플레이어의 결정에 의해 영향을 받습니다. 카지노사이트 포커는 또한 클래스에서 논의한 경매 이론, 특히 퍼스트 프라이스 경매와 유사한데, 각 플레이어가 전체 팟에 대해 현재 손에 할당한 값으로 매 라운드마다 입찰을 진행하기 때문입니다.