La varianza y la desviación típica son las medidas más importantes de la dispersión estadística. Mientras que la media nos dice dónde está el «centro» de los datos, la varianza y la desviación típica nos dicen cuánto se alejan los datos de ese centro.
¿Por qué necesitamos medir la dispersión?
Dos conjuntos de datos pueden tener la misma media pero ser completamente diferentes. Los salarios {30.000, 30.000, 30.000} y {0, 30.000, 60.000} tienen media 30.000, pero el segundo es mucho más disperso. La varianza captura esa diferencia.
Definición de varianza
La varianza poblacional (σ²) es el promedio de las distancias al cuadrado respecto a la media:
σ² = Σ(xᵢ – μ)² / N
¿Por qué elevamos al cuadrado? Porque las desviaciones positivas y negativas se cancelarían si simplemente las sumáramos. El cuadrado garantiza que todas las desviaciones contribuyan positivamente.
Para una muestra, usamos s² con divisor n-1 (corrección de Bessel) en lugar de n, lo que produce un estimador insesgado de la varianza poblacional.
Desviación típica
La desviación típica (σ o s) es simplemente la raíz cuadrada de la varianza. Su ventaja es que está en las mismas unidades que los datos originales, lo que la hace más fácil de interpretar.
Si la media de las alturas es 170 cm y la desviación típica es 10 cm, sabemos que la mayoría de personas miden entre 160 y 180 cm. Con la varianza (100 cm²) esa interpretación no es tan directa.
Propiedades clave
Var(aX + b) = a²·Var(X): Sumar una constante no cambia la varianza (desplazar datos no cambia su dispersión). Multiplicar por una constante multiplica la varianza por el cuadrado de esa constante.
Para variables independientes: Var(X + Y) = Var(X) + Var(Y). Las varianzas se suman, lo que es fundamental en la teoría de carteras financieras y en la propagación de errores.
El coeficiente de variación
Para comparar la dispersión de conjuntos con diferentes medias, usamos el coeficiente de variación: CV = σ/μ × 100%. Una inversión con media 10% y desviación típica 5% (CV = 50%) es más volátil que una con media 20% y desviación típica 5% (CV = 25%).
Aplicaciones en el mundo real
Finanzas: La desviación típica de los rendimientos de una acción es la medida estándar de riesgo. Harry Markowitz la usó como base de la Teoría Moderna de Carteras (Premio Nobel 1990).
Control de calidad: Los procesos industriales se monitorean con gráficos de control que detectan cuando la variabilidad supera los límites aceptables.
Meteorología: La variabilidad de las temperaturas, precipitaciones y otros fenómenos se cuantifica mediante desviación típica.
Juegos de azar: La volatilidad de una tragaperras no es más que la desviación típica de los pagos. Una slot de «alta volatilidad» tiene una desviación típica grande: los premios son infrecuentes pero grandes.
Cómo calcular la desviación típica paso a paso
La mejor forma de entender la desviación típica es calcularla con datos reales. Tomemos las notas de cinco estudiantes: 4, 8, 6, 5, 7.
- Calcula la media. (4 + 8 + 6 + 5 + 7) / 5 = 30 / 5 = 6.
- Resta la media a cada valor y eleva al cuadrado. (4−6)² = 4; (8−6)² = 4; (6−6)² = 0; (5−6)² = 1; (7−6)² = 1.
- Suma esos cuadrados y divide entre el número de datos. Esto es la varianza: (4 + 4 + 0 + 1 + 1) / 5 = 10 / 5 = 2.
- Calcula la raíz cuadrada de la varianza. La desviación típica es √2 ≈ 1,41.
El resultado significa que, de media, las notas se alejan unos 1,41 puntos de la media de 6. Si en lugar de muestra completa trabajas con una muestra de una población mayor, en el paso 3 se divide entre n−1 en lugar de n (corrección de Bessel), lo que da una estimación menos sesgada de la dispersión real.
Diferencia entre varianza y desviación típica
Ambas miden lo mismo —cuánto se dispersan los datos respecto a la media— pero con una diferencia práctica clave: la varianza está en unidades al cuadrado (puntos², euros²…), mientras que la desviación típica es su raíz cuadrada y vuelve a las unidades originales. Por eso la desviación típica es más fácil de interpretar: decir que las notas se desvían «1,41 puntos» tiene sentido inmediato; «2 puntos al cuadrado» no. La varianza, en cambio, es más cómoda para el cálculo teórico, porque es aditiva: la varianza de una suma de variables independientes es la suma de sus varianzas. Este vínculo con la esperanza matemática y las distribuciones de probabilidad es la base de toda la estadística inferencial.
Preguntas frecuentes sobre la desviación típica
¿Qué es la desviación típica en palabras sencillas?
Es un número que indica cuánto se alejan, de media, los datos respecto a su valor medio. Una desviación típica pequeña significa que los datos están agrupados cerca de la media; una grande, que están muy dispersos.
¿Cómo se calcula la desviación típica?
En cuatro pasos: calcula la media, resta la media a cada dato y eleva al cuadrado, promedia esos cuadrados (eso es la varianza) y haz la raíz cuadrada del resultado. Esa raíz es la desviación típica.
¿Cuál es la diferencia entre desviación típica y varianza?
La varianza es el promedio de las diferencias al cuadrado respecto a la media; la desviación típica es su raíz cuadrada. La desviación típica está en las mismas unidades que los datos originales, por lo que es más fácil de interpretar.
¿Se divide entre n o entre n−1?
Entre n cuando dispones de toda la población; entre n−1 cuando trabajas con una muestra y quieres estimar la dispersión de la población completa. Esta corrección (de Bessel) evita subestimar la variabilidad real.
