Varianza en Estadística (Uso, definición y formula)

La varianza o variancia es una medida de la dispersión de una variable aleatoria (valores que se obtienen de manera aleatoria). Es ampliamente utilizada en el área de estadística expresando, a través de un número, la variabilidad de dicha dispersión.

Ronald Fisher, un matemático, físico, biólogo y estadístico inglés, en 1918 fue el primero en introducir el termino varianza, en uno de sus estudios publicado sobre biometría. A su vez introdujo los estudios sobre el análisis de varianza.

¿Qué es la Varianza?

La varianza de una muestra o de un conjunto de valores, es la sumatoria de las desviaciones al cuadrado con respecto al promedio o a la media, todo esto dividido entre el número total de observaciones menos 1.

De manera muy general se puede decir que la varianza es la desviación estándar elevada al cuadrado.

En las áreas de economía y finanzas, la varianza se interpreta como el riesgo de que el rendimiento realizado en algún procedimiento sea distinto al rendimiento esperado. Por lo general cuando se espera un mayor rendimiento, el riesgo a su vez es mayor.

La varianza cómo medida de dispersión

La varianza, junto con la desviación estándar, son medidas de dispersión de datos u observaciones. La dispersión de estos datos indica la variedad que estos presentan, es decir, si todos los valores en un conjunto de datos son iguales, entonces no hay dispersión, pero en cambio, si no todos son iguales entonces hay dispersión.

Esta dispersión puede ser grande o pequeña, dependiendo de qué tan cercanos sean los valores a la media.

La varianza de una muestra se simboliza como S2, mientras que la varianza de una población de simboliza como σ2.

La varianza de una muestra es utilizada para estimar la varianza de una población, la cual en muchas ocasiones se desconoce. Es por esto que S2 también es considerada comúnmente como un estadístico y σ2 como un parámetro.

Fórmula de la Varianza

La varianza de una muestra presenta la siguiente fórmula:

S2 =

Donde , representa la sumatoria de la resta entre cada uno de los valores muestreados () y la media (), elevado al cuadrado.

A su vez,  representa el número total de observaciones o datos muestreados. Para valores muy grandes de  la varianza es mínima o incluso despreciable.

En cambio, la varianza de una población presenta la siguiente fórmula:

σ2 =

Donde N representa el número total de observaciones o datos muestreados.

En la mayoría de los casos es muy difícil, por no decir imposible obtener un N total de datos, por ejemplo, al hablar de individuos de una población, no es posible muestrear a todos estos individuos, ya que existe un factor de tiempo y recursos limitante.

Es por esto que se suele utilizar los estadísticos para estimar los parámetros de una población.  De acuerdo a la manera en que se encuentra escrita esta fórmula, las unidades de la varianza presenta las mismas unidades de la variable, pero elevada al cuadrado.

También, vemos que la varianza no puede ser negativa, por lo que el mínimo valor que se puede obtener en esta es cero.

Desviación estándar de una muestra

A diferencia de la varianza, la desviación estándar de una muestra se representa de la siguiente manera:

S =

En este caso, esta medida sí presenta las mismas unidades de la variable muestreada.

Ejemplo de Varianza

Para calcular la varianza, primero se debe calcular la media o el promedio de los datos usados. Por otro lado, si se tiene la desviación estándar, simplemente se eleva al cuadrado ese resultado y así se obtiene la varianza.

A continuación, se muestra un ejemplo para entender cómo se calcula la varianza y cuál podría ser su interpretación.

Supongamos que se tienen los ingresos anuales de cinco empresas distintas, pertenecientes a un mismo empresario, los cuales son:

  • Empresa A: 2.500 $
  • Empresa B: 1.800 $
  • Empresa C: 2.300 $
  • Empresa D: 3.000 $
  • Empresa E: 2.700 $

Entonces calculamos la media de los ingresos, simplemente sumando cada cifra y dividiéndolo entre el número total de empresas, lo cual da como resultado: 2.460$.

Ahora simplemente terminamos de calcular la varianza con la formula ya expuesta, lo cual da como resultado una varianza de 162.400 $2.

Al sacar la raíz cuadrada a este resultado obtenemos la desviación estándar, siendo ésta 403 $ de diferencia entre los ingresos de las cinco empresas.

Aplicaciones de esta medida

La varianza como medida de dispersión tiene múltiples aplicaciones en diversas áreas, algunas de sus utilidades son:

  • Representa una ayuda en la toma de decisiones sobre una inversión (También interpretada como el riesgo en una inversión). Si la varianza o distribución en la probabilidad de los rendimientos de una inversión es alta, puede indicar una inversión poco favorable.
  • Para describir, analizar y entender el comportamiento de una variable a través del tiempo.
  • Permite realizar comparaciones entre diferentes grupos de datos.
  • Permite analizar cuál sería la mejor decisión que se puede tomar. Esto mediante el análisis de varianza, por ejemplo, decidir entre que método representa el mejor aprendizaje o decidir qué inversión representaría un mayor ingreso al año.

Conclusion

En el análisis de varianzas se estudian las diferencias significativas entre dos o más medias de una muestra. Este análisis se conoce comúnmente como ANOVA y nos permite determinar también si esas medias provienen de una misma población (puede ser el número total de empleados de una empresa), o si las medias de dos poblaciones son iguales.

Por otro lado, la varianza al igual que la desviación estándar son muy sensibles a los valores atípicos, estos son los valores que se alejan mucho de la media o que son muy distintos a esta.

Para que estas medidas no se vean tan afectadas, estos valores atípicos pueden obviarse a la hora de realizar los análisis e incluso los cálculos. También pueden emplearse otras medidas de dispersión que son más útiles en estos casos.

En el caso de analizar el riesgo de una inversión, se tienen en cuenta dos aspectos importantes, uno es el rendimiento invertido y otro el esperado de acuerdo a la inversión realizada. Como ya se mencionó, se puede utilizar la varianza para analizar este riesgo.

Deja una respuesta

Su dirección de correo electrónico no será publicada.