Varianza y Desviación Típica: Midiendo la Dispersión de los Datos

La varianza y la desviación típica son las medidas más importantes de la dispersión estadística. Mientras que la media nos dice dónde está el «centro» de los datos, la varianza y la desviación típica nos dicen cuánto se alejan los datos de ese centro.

¿Por qué necesitamos medir la dispersión?

Dos conjuntos de datos pueden tener la misma media pero ser completamente diferentes. Los salarios {30.000, 30.000, 30.000} y {0, 30.000, 60.000} tienen media 30.000, pero el segundo es mucho más disperso. La varianza captura esa diferencia.

Definición de varianza

La varianza poblacional (σ²) es el promedio de las distancias al cuadrado respecto a la media:

σ² = Σ(xᵢ – μ)² / N

¿Por qué elevamos al cuadrado? Porque las desviaciones positivas y negativas se cancelarían si simplemente las sumáramos. El cuadrado garantiza que todas las desviaciones contribuyan positivamente.

Para una muestra, usamos con divisor n-1 (corrección de Bessel) en lugar de n, lo que produce un estimador insesgado de la varianza poblacional.

Desviación típica

La desviación típica (σ o s) es simplemente la raíz cuadrada de la varianza. Su ventaja es que está en las mismas unidades que los datos originales, lo que la hace más fácil de interpretar.

Si la media de las alturas es 170 cm y la desviación típica es 10 cm, sabemos que la mayoría de personas miden entre 160 y 180 cm. Con la varianza (100 cm²) esa interpretación no es tan directa.

Propiedades clave

Var(aX + b) = a²·Var(X): Sumar una constante no cambia la varianza (desplazar datos no cambia su dispersión). Multiplicar por una constante multiplica la varianza por el cuadrado de esa constante.

Para variables independientes: Var(X + Y) = Var(X) + Var(Y). Las varianzas se suman, lo que es fundamental en la teoría de carteras financieras y en la propagación de errores.

El coeficiente de variación

Para comparar la dispersión de conjuntos con diferentes medias, usamos el coeficiente de variación: CV = σ/μ × 100%. Una inversión con media 10% y desviación típica 5% (CV = 50%) es más volátil que una con media 20% y desviación típica 5% (CV = 25%).

Aplicaciones en el mundo real

Finanzas: La desviación típica de los rendimientos de una acción es la medida estándar de riesgo. Harry Markowitz la usó como base de la Teoría Moderna de Carteras (Premio Nobel 1990).

Control de calidad: Los procesos industriales se monitorean con gráficos de control que detectan cuando la variabilidad supera los límites aceptables.

Meteorología: La variabilidad de las temperaturas, precipitaciones y otros fenómenos se cuantifica mediante desviación típica.

Juegos de azar: La volatilidad de una tragaperras no es más que la desviación típica de los pagos. Una slot de «alta volatilidad» tiene una desviación típica grande: los premios son infrecuentes pero grandes.

Varianza en la práctica: La volatilidad es clave para elegir un casino o una estrategia de apuestas. Aprende más en nuestro ranking de casinos online y nuestro análisis de casas de apuestas.