Las 3 Leyes de la Indiferencia en el poker GTO

En este artículo veremos

Las 3 Leyes de la Indiferencia en el poker GTO

La indiferencia en el poker GTO es uno de los conceptos más malinterpretados. La palabra “indiferencia” significa que dos o más acciones tienen el mismo valor. Por lo tanto, comprender por qué la indiferencia juega un papel tan importante en el póker óptimo de la teoría del juego es fundamental para aprender la teoría del póker.

La interpretación de las soluciones de poker GTO a menudo es más un arte que una ciencia 🔬. Es un proceso subjetivo que requiere una combinación de intuición y análisis científico. Hay muchas reglas empíricas y heurísticas, pero pocas leyes estrictas en el póker óptimo de la teoría del juego. Por lo tanto, es esencial aprender las leyes estrictas absolutas de la indiferencia para separar los hechos de la ficción.

Este artículo describirá las pocas “leyes estrictas” fundamentales de la indiferencia que estructuran el equilibrio de Nash. Estas leyes se aplican tanto a GTO como a todas las estrategias de póker, incluyendo los estilos de explotación.

La Ley del EV Egoísta en el poker GTO

Ninguna mano sacrificará valor para mejorar el valor del resto de tu rango. Una estrategia perfecta siempre toma la acción de mayor EV con cada mano en cada situación.

Piénsalo. ¿Por qué jugarías intencionalmente un movimiento perdedor? ¿Por qué no simplemente jugar siempre el mejor movimiento? Esto debería ser evidente por sí mismo. No existe tal cosa como jugar una jugada con EV negativo para mejorar el valor esperado del resto de tu rango. Si una mano es una llamada perdedora, entonces no tiene sentido llamar y perder dinero.

La consecuencia de la Ley del EV 1 es la Ley 2: La Ley del EV Egoísta implica la Ley de la Indiferencia.

La Ley de la Indiferencia en el poker GTO

Si una mano combina múltiples acciones, esas acciones tendrán el mismo valor. Por ejemplo, si una mano combina entre hacer una apuesta y retirarse, entonces hacer una apuesta debe tener un valor de 0EV. Si una mano fuerte combina entre hacer una apuesta y subir, entonces hacer un trampa debe valer tanto como jugar rápidamente.

A la inversa, cualquier mano con acciones que tengan el mismo EV debe ser indiferente entre esas acciones. Si hacer una apuesta vale $3 y subir vale $3, entonces debes ser indiferente entre hacer una apuesta y subir. ¿Por qué elegirías una acción con EV más bajo? Si hacer una apuesta vale más que retirarse, entonces simplemente nunca te retires.

Veamos un ejemplo. UTG abre, BTN hace un 3bet. La acción se retira a UTG, quien tiene KQs:

Aquí he seleccionado la vista “Estrategia+EV”. Podemos ver que KQs tiene un EV de 0.31bb al hacer una apuesta de 4 o al igualar. Podemos ver que combina entre ambas acciones. Por lo tanto, es indiferente entre esas dos acciones.

Vemos muchas acciones indiferentes. A5s (EV 0) es indiferente entre retirarse, igualar y hacer una apuesta de 4. QQ (EV 42.7) es indiferente entre hacer un all-in, hacer una apuesta de 4 o igualar. 88 (EV 0) es indiferente entre retirarse e igualar. Muy pocas manos toman acciones puras. La estrategia se mezcla de esta manera para permanecer inexplotable contra todas las posibles contraestrategias.

Esta ley se aplica independientemente de las estrategias que se utilicen. Esto se aplica a las estrategias GTO, a las estrategias de explotación y a todas las estrategias intermedias. Si insertas la estrategia imperfecta y explotable de tu oponente, entonces algunas manos inevitablemente enfrentarán decisiones indiferentes. Aunque las simulaciones de explotación tienden a resultar en acciones más puras, ya que hay menos decisiones perfectamente indiferentes contra estrategias imperfectas. La indiferencia no depende de GTO, solo depende de la estrategia de tu oponente.

A veces, los solucionadores sugieren acciones con EV negativo. ¡Esto es resultado del ruido! Si resuelves con suficiente precisión, ese ruido desaparece. El verdadero equilibrio nunca elegiría intencionalmente una acción con EV más bajo.

La consecuencia del EV de la Ley 2 es la Ley 3: La Ley de la Indiferencia implica la Ley de las Estrategias Fijas.

La Ley de las Estrategias Fijas en el poker GTO

Cambiar las mezclas entre acciones indiferentes no puede perder valor contra una estrategia fija. Los errores de mezcla solo pueden ser explotados si la oposición adapta su estrategia.

Bien, ¿pero qué es un error de mezcla y qué es una estrategia fija?

– Un error de mezcla significa mover las manos entre decisiones indiferentes.
– Una estrategia fija (como GTO) no cambia ni se adapta a su oponente.

De acuerdo, pero si mi rango en calles posteriores cambia, ¿no cambiaría mi valor esperado?

– El valor esperado es de suma cero. Para que un jugador gane, el otro tiene que perder. Entonces, si estás mezclando incorrectamente entre dos decisiones con el mismo valor esperado, ¿cómo podría un jugador ganar algo sin cambiar su estrategia? El valor esperado de tu mano abarca decisiones en calles posteriores.
– Una excepción importante a esta regla es cuando el valor esperado no es de suma cero. El rake afecta tu valor esperado, por lo que los errores de mezcla pueden aumentar o disminuir la suma total de rake pagado por ambos jugadores.

Piensa en esto de esta manera. Lo único que has hecho es mover una mano entre dos acciones que tienen el mismo EV. Simplemente has movido una mano entre dos decisiones indiferentes. Dado que ambas acciones tienen el mismo valor contra la estrategia de tu oponente, no pueden obtener ventaja a menos que el villano cambie su estrategia.

Por ejemplo, supongamos que se supone que KK debe igualar el 30% de las veces y subir el 70% de las veces para ser inexplotable. Pero en cambio, lo divides 50% / 50%: eso es un error de mezcla. Sin embargo, ambas acciones tienen el mismo EV (Ley 2). Por lo tanto, si el oponente no cambia su estrategia, ¡cualquier mezcla entre igualar y subir dará como resultado el mismo resultado! Sin embargo, esto no te da licencia para hacer lo que quieras. Tu nueva estrategia es explotable. Si el oponente se ajusta, pueden castigar tu error de mezcla.

Volviendo al ejemplo anterior. UTG abre, BTN hace un 3bet, la acción se retira a UTG:

Imaginemos que te retiras con todas las manos que se retiran en cualquier frecuencia. ¿Cambiaría tu EV?
No. Lo único que has hecho es mover más manos con EV 0 hacia la línea de retirada en lugar de otras líneas. Sin embargo, BTN podría explotar tu sobre-retirada haciendo un 3bet con un rango mucho más amplio. En este caso, estarías retirándote con manos que en realidad tenían un EV positivo como continuaciones, lo que te costaría valor. Ten en cuenta que BTN solo obtiene ventaja contra tu error de mezcla cuando cambian su estrategia.

Para entender este concepto, debes darte cuenta de un detalle crucial: la mejor acción con tu mano se determina únicamente por la estrategia de tu oponente. Las regiones de indiferencia en tu rango son puramente una función de cómo juega tu oponente. Por lo tanto, ellos deben cambiar su estrategia para cambiar qué manos/acciones son indiferentes dentro de tu rango. Aprende más sobre este concepto leyendo este artículo.

GTO es una estrategia fija. Por lo tanto, no obtiene ventaja contra los errores de mezcla. Sin embargo, sí obtiene ventaja contra los “errores puros”. Cualquier acción que pierde dinero contra una estrategia fija es un “error puro”. Existe una idea errónea común de que GTO obtiene ventaja contra “cualquier error”. Sin embargo, esto no es cierto, ya que GTO solo puede obtener ventaja contra errores puros. Pero no te preocupes, incluso los profesionales de alto nivel cometen muchos errores puros; ¡el póker es difícil! Mira este video para aprender más.

FAQ de poker GTO

Las siguientes preguntas frecuentes deberían abarcar la mayoría de los temas fundamentales sobre GTO. ¡Por supuesto, siéntete libre de contactar nuestro servidor de Discord si tienes alguna pregunta!

¿GTO alguna vez realiza una jugada con EV negativo?

¡Sí! Pero solo si tus oponentes están cometiendo errores. Por ejemplo, GTO podría sugerir hacer un 4bet all-in con KK. Esto se sugerirá incluso si tus oponentes solo están haciendo un 3bet con AA. Claramente, esta es una jugada perdedora. Sin embargo, tus oponentes están perdiendo aún más valor al no subir con sus otras manos premium. Cualquiera puede obtener ventaja contra GTO en una parte del árbol de decisiones a expensas del resto de su estrategia.
Si sabes con certeza que tus oponentes solo suben con AA, entonces puedes explotarlos adaptando tu estrategia. Pero incluso si no te adaptas, ellos aún están cometiendo errores puros al perder valor con KK, QQ, etc.

No. La definición del Equilibrio de Nash es que ningún jugador puede cambiar unilateralmente su estrategia para aumentar su EV. Puedes aumentar el EV de algunas líneas a expensas de otras, pero por definición es imposible vencer a GTO.
Una excepción notable es que GTO no garantiza la inexplotabilidad en botes con múltiples jugadores. Ninguna estrategia es inexplotable en botes con múltiples jugadores.

¿Por qué el solver realiza jugadas con EV negativo o no elige la acción con mayor EV?

Esto es resultado del ruido del solver. En la práctica, los solucionadores no alcanzan una precisión perfecta, lo que resulta en ruido en las soluciones. Obtén más información sobre el ruido del solucionador en este artículo.

¿Qué es un error de mezcla versus un error puro?

Un error de mezcla (a veces llamado error de frecuencia) es mezclar acciones indiferentes en frecuencias incorrectas. Por ejemplo, si se supone que KK debe igualar el 30% y subir el 70%, pero lo divides 50%/50%, eso es un error de mezcla. Es específico de las acciones tomadas con combinaciones únicas, en lugar de toda tu estrategia.
Los errores puros pierden dinero contra estrategias fijas. Los errores de mezcla solo pierden dinero si la oposición se ajusta para explotar ese error.

¿Qué es un error de mezcla versus un error puro?

Un error de mezcla (a veces llamado error de frecuencia) es mezclar acciones indiferentes en frecuencias incorrectas. Por ejemplo, si se supone que KK debe igualar el 30% y subir el 70%, pero lo divides 50%/50%, eso es un error de mezcla. Es específico de las acciones tomadas con combinaciones únicas, en lugar de toda tu estrategia.
Los errores puros pierden dinero contra estrategias fijas. Los errores de mezcla solo pierden dinero si la oposición se ajusta para explotar ese error.

¿Qué es una estrategia fija?

Una estrategia fija no cambia en respuesta a su oposición. Una estrategia fija siempre juega de la misma manera en la misma situación. GTO es un ejemplo de una estrategia fija. Por el contrario, una estrategia dinámica se adaptará y cambiará según su oposición.

Si los errores de mezcla no son castigados, ¿por qué no puedo simplemente apostar/ruletear con todo mi rango?

Los errores de mezcla son explotables. Pero requiere que tus oponentes utilicen algo distinto a la estrategia GTO. Esta adaptación de GTO puede ser intencional o simplemente su estilo de juego natural. Ten cuidado de no simplificar demasiado bajo el pretexto de errores de mezcla indiferentes.
Por ejemplo, igualar todas las manos indiferentes para atrapar faroles en el river es fácilmente explotable por estrategias enfocadas en valor. Hacer fold en exceso a mezclas entre igualar y subir tras un check-raise en el flop es fácilmente explotable mediante faroles excesivos.

Si GTO no se beneficia de los errores de mezcla, ¿cómo hace GTO para ganar dinero?

GTO se beneficia siempre que tus oponentes cometan un “error puro”. Los errores puros pierden dinero contra estrategias fijas. Un error puro es cualquier acción con alguna mano que estrictamente pierde EV contra la estrategia actual de tu oponente.

✍️ ¿Cómo estudiar poker?

Fuente: GTO Wizard

Author: Anthony Campbell