Modelos Estadísticos para Predecir Resultados de Fútbol: Poisson y Más

Los modelos estadísticos son herramientas matemáticas que permiten estimar la probabilidad de diferentes resultados en un partido de fútbol. El modelo más utilizado es el de Poisson, que aprovecha que los goles en un partido siguen aproximadamente una distribución de Poisson.

El Modelo de Poisson para Fútbol

La distribución de Poisson modela la probabilidad de que ocurra un cierto número de eventos (goles) en un intervalo de tiempo, dado un promedio esperado (λ). La fórmula es:

P(X = k) = (λ^k × e^(-λ)) / k!

Para un partido necesitamos dos parámetros: λ_local (goles esperados del equipo local) y λ_visitante (goles esperados del visitante).

Calculando los Goles Esperados

El método clásico usa los promedios de la liga:

Ataque local = Goles marcados en casa por el equipo / Media de la liga en casa

Defensa visitante = Goles encajados fuera por el rival / Media de la liga fuera

λ_local = Ataque local × Defensa visitante × Media de goles en casa de la liga

Ejemplo con datos ficticios de La Liga: Real Madrid (casa) vs Valencia (fuera). Si el ataque en casa de Madrid tiene un factor de 1,8 y la defensa fuera de Valencia un factor de 1,3, con una media de la liga de 1,45 goles locales:

λ_Madrid = 1,8 × 1,3 × 1,45 = 3,39 goles esperados

λ_Valencia = 0,9 × 0,7 × 1,15 = 0,72 goles esperados

De Goles Esperados a Probabilidades de Resultado

Con λ_local = 3,39 y λ_visitante = 0,72, calculamos la probabilidad de cada marcador asumiendo independencia:

P(Madrid 2, Valencia 0) = P(X=2|λ=3,39) × P(Y=0|λ=0,72)

Sumando las probabilidades de todos los marcadores donde gana Madrid, empatan o gana Valencia:

Resultado Probabilidad Cuota justa
Victoria Madrid (1) 83,2% 1,20
Empate (X) 10,1% 9,90
Victoria Valencia (2) 6,7% 14,93
Over 2.5 78,5% 1,27
Under 2.5 21,5% 4,65
Ambos marcan (Sí) 41,2% 2,43

xG (Expected Goals): La Evolución del Modelo

Los modelos modernos utilizan Expected Goals (xG) en lugar de goles reales. El xG asigna a cada disparo una probabilidad de gol basada en su posición, ángulo, tipo de asistencia y otras variables. Un disparo desde dentro del área pequeña puede tener un xG de 0,45, mientras que un tiro desde 30 metros tiene un xG de 0,03.

El xG es un mejor predictor que los goles reales porque elimina la varianza del resultado: un equipo que genera un xG alto pero marca pocos goles está siendo «desafortunado» y, estadísticamente, es probable que mejore sus resultados.

Modelos de Regresión

Para ir más allá de Poisson, los modelos de regresión permiten incorporar múltiples variables predictoras: forma reciente, ventaja de localía, importancia del partido, días de descanso, bajas clave, condiciones meteorológicas y más.

Una regresión de Poisson (Poisson regression) es el estándar: modela el logaritmo de los goles esperados como función lineal de las variables predictoras. Los coeficientes de la regresión cuantifican el efecto de cada variable sobre los goles esperados.

Limitaciones del Modelo de Poisson

  • Independencia: Poisson asume que los goles de ambos equipos son independientes, pero en la práctica hay correlación (un equipo que va perdiendo ataca más, dejando huecos).
  • Goles de último minuto: La intensidad de goles no es constante durante el partido — aumenta al final.
  • Factores no cuantificables: Motivación, dinámicas de vestuario y decisiones arbitrales son difíciles de modelar.

El modelo bivariante de Poisson de Dixon y Coles (1997) corrige parcialmente el problema de independencia ajustando las probabilidades de resultados con pocos goles (0-0, 1-0, 0-1, 1-1).

Consulta relacionada: Descubre las casas de apuestas que mejor puntuación obtienen en nuestro análisis estadístico de casas de apuestas en España.