Los modelos estadísticos son herramientas matemáticas que permiten estimar la probabilidad de diferentes resultados en un partido de fútbol. El modelo más utilizado es el de Poisson, que aprovecha que los goles en un partido siguen aproximadamente una distribución de Poisson.
El Modelo de Poisson para Fútbol
La distribución de Poisson modela la probabilidad de que ocurra un cierto número de eventos (goles) en un intervalo de tiempo, dado un promedio esperado (λ). La fórmula es:
P(X = k) = (λ^k × e^(-λ)) / k!
Para un partido necesitamos dos parámetros: λ_local (goles esperados del equipo local) y λ_visitante (goles esperados del visitante).
Calculando los Goles Esperados
El método clásico usa los promedios de la liga:
Ataque local = Goles marcados en casa por el equipo / Media de la liga en casa
Defensa visitante = Goles encajados fuera por el rival / Media de la liga fuera
λ_local = Ataque local × Defensa visitante × Media de goles en casa de la liga
Ejemplo con datos ficticios de La Liga: Real Madrid (casa) vs Valencia (fuera). Si el ataque en casa de Madrid tiene un factor de 1,8 y la defensa fuera de Valencia un factor de 1,3, con una media de la liga de 1,45 goles locales:
λ_Madrid = 1,8 × 1,3 × 1,45 = 3,39 goles esperados
λ_Valencia = 0,9 × 0,7 × 1,15 = 0,72 goles esperados
De Goles Esperados a Probabilidades de Resultado
Con λ_local = 3,39 y λ_visitante = 0,72, calculamos la probabilidad de cada marcador asumiendo independencia:
P(Madrid 2, Valencia 0) = P(X=2|λ=3,39) × P(Y=0|λ=0,72)
Sumando las probabilidades de todos los marcadores donde gana Madrid, empatan o gana Valencia:
| Resultado | Probabilidad | Cuota justa |
|---|---|---|
| Victoria Madrid (1) | 83,2% | 1,20 |
| Empate (X) | 10,1% | 9,90 |
| Victoria Valencia (2) | 6,7% | 14,93 |
| Over 2.5 | 78,5% | 1,27 |
| Under 2.5 | 21,5% | 4,65 |
| Ambos marcan (Sí) | 41,2% | 2,43 |
xG (Expected Goals): La Evolución del Modelo
Los modelos modernos utilizan Expected Goals (xG) en lugar de goles reales. El xG asigna a cada disparo una probabilidad de gol basada en su posición, ángulo, tipo de asistencia y otras variables. Un disparo desde dentro del área pequeña puede tener un xG de 0,45, mientras que un tiro desde 30 metros tiene un xG de 0,03.
El xG es un mejor predictor que los goles reales porque elimina la varianza del resultado: un equipo que genera un xG alto pero marca pocos goles está siendo «desafortunado» y, estadísticamente, es probable que mejore sus resultados.
Modelos de Regresión
Para ir más allá de Poisson, los modelos de regresión permiten incorporar múltiples variables predictoras: forma reciente, ventaja de localía, importancia del partido, días de descanso, bajas clave, condiciones meteorológicas y más.
Una regresión de Poisson (Poisson regression) es el estándar: modela el logaritmo de los goles esperados como función lineal de las variables predictoras. Los coeficientes de la regresión cuantifican el efecto de cada variable sobre los goles esperados.
Limitaciones del Modelo de Poisson
- Independencia: Poisson asume que los goles de ambos equipos son independientes, pero en la práctica hay correlación (un equipo que va perdiendo ataca más, dejando huecos).
- Goles de último minuto: La intensidad de goles no es constante durante el partido — aumenta al final.
- Factores no cuantificables: Motivación, dinámicas de vestuario y decisiones arbitrales son difíciles de modelar.
El modelo bivariante de Poisson de Dixon y Coles (1997) corrige parcialmente el problema de independencia ajustando las probabilidades de resultados con pocos goles (0-0, 1-0, 0-1, 1-1).
