InicioEstadísticasVarianza en Estadística (Uso, definición y formula)

Varianza en Estadística (Uso, definición y formula)

La varianza o variancia es una medida de la dispersión de una variable aleatoria (valores que se obtienen de manera aleatoria). Es ampliamente utilizada en el área de estadística expresando, a través de un número, la variabilidad de dicha dispersión.

Ronald Fisher, un matemático, físico, biólogo y estadístico inglés, en 1918 fue el primero en introducir el termino varianza, en uno de sus estudios publicado sobre biometría. A su vez introdujo los estudios sobre el análisis de varianza.

Anuncios

¿Qué es la Varianza?

La varianza de una muestra o de un conjunto de valores, es la sumatoria de las desviaciones al cuadrado con respecto al promedio o a la media, todo esto dividido entre el número total de observaciones menos 1.

De manera muy general se puede decir que la varianza es la desviación estándar elevada al cuadrado.

Anuncios

En las áreas de economía y finanzas, la varianza se interpreta como el riesgo de que el rendimiento realizado en algún procedimiento sea distinto al rendimiento esperado. Por lo general cuando se espera un mayor rendimiento, el riesgo a su vez es mayor.

La varianza cómo medida de dispersión

La varianza, junto con la desviación estándar, son medidas de dispersión de datos u observaciones. La dispersión de estos datos indica la variedad que estos presentan, es decir, si todos los valores en un conjunto de datos son iguales, entonces no hay dispersión, pero en cambio, si no todos son iguales entonces hay dispersión.

Anuncios

Esta dispersión puede ser grande o pequeña, dependiendo de qué tan cercanos sean los valores a la media.

La varianza de una muestra se simboliza como S2, mientras que la varianza de una población de simboliza como σ2.

Anuncios

La varianza de una muestra es utilizada para estimar la varianza de una población, la cual en muchas ocasiones se desconoce. Es por esto que S2 también es considerada comúnmente como un estadístico y σ2 como un parámetro.

Fórmula de la Varianza

La varianza de una muestra presenta la siguiente fórmula:

Anuncios

S2 =

Donde, representa la sumatoria de la resta entre cada uno de los valores muestreados () y la media, elevado al cuadrado.

A su vez,  representa el número total de observaciones o datos muestreados. Para valores muy grandes de  la varianza es mínima o incluso despreciable.

En cambio, la varianza de una población presenta la siguiente fórmula:

σ2 =

Donde N representa el número total de observaciones o datos muestreados.

En la mayoría de los casos es muy difícil, por no decir imposible obtener un N total de datos, por ejemplo, al hablar de individuos de una población, no es posible muestrear a todos estos individuos, ya que existe un factor de tiempo y recursos limitante.

Es por esto que se suele utilizar los estadísticos para estimar los parámetros de una población.  De acuerdo a la manera en que se encuentra escrita esta fórmula, las unidades de la varianza presenta las mismas unidades de la variable, pero elevada al cuadrado.

También, vemos que la varianza no puede ser negativa, por lo que el mínimo valor que se puede obtener en esta es cero.

Desviación estándar de una muestra

A diferencia de la varianza, la desviación estándar de una muestra se representa de la siguiente manera:

S =

En este caso, esta medida sí presenta las mismas unidades de la variable muestreada.

Ejemplo de Varianza

Para calcular la varianza, primero se debe calcular la media o el promedio de los datos usados. Por otro lado, si se tiene la desviación estándar, simplemente se eleva al cuadrado ese resultado y así se obtiene la varianza.

A continuación, se muestra un ejemplo para entender cómo se calcula la varianza y cuál podría ser su interpretación.

Supongamos que se tienen los ingresos anuales de cinco empresas distintas, pertenecientes a un mismo empresario, los cuales son:

  • Empresa A: 2.500 $
  • Empresa B: 1.800 $
  • Empresa C: 2.300 $
  • Empresa D: 3.000 $
  • Empresa E: 2.700 $

Entonces calculamos la media de los ingresos, simplemente sumando cada cifra y dividiéndolo entre el número total de empresas, lo cual da como resultado: 2.460$.

Datos Promedio Datos – Promedio
Dato 1 2500 2460 40 1600
Dato 2 1800 2460 -660 435600
Dato 3 2300 2460 -160 25600
Dato 4 3000 2460 540 291600
Dato 5 2700 2460 240 57600
Total 812000

 

La varianza de la población es la sumatoria de las diferencias de los datos con el promedio al cuadrado, dividido en n, en este caso es 5.

812000/5 = 203000

σ2=162400

Al sacar la raíz cuadrada a este resultado obtenemos la desviación estándar, siendo ésta 402 $ de diferencia entre los ingresos de las cinco empresas.

Aplicaciones de esta medida

La varianza como medida de dispersión tiene múltiples aplicaciones en diversas áreas, algunas de sus utilidades son:

  • Representa una ayuda en la toma de decisiones sobre una inversión (También interpretada como el riesgo en una inversión). Si la varianza o distribución en la probabilidad de los rendimientos de una inversión es alta, puede indicar una inversión poco favorable.
  • Para describir, analizar y entender el comportamiento de una variable a través del tiempo.
  • Permite realizar comparaciones entre diferentes grupos de datos.
  • Permite analizar cuál sería la mejor decisión que se puede tomar. Esto mediante el análisis de varianza, por ejemplo, decidir entre que método representa el mejor aprendizaje o decidir qué inversión representaría un mayor ingreso al año.

Conclusion

En el análisis de varianzas se estudian las diferencias significativas entre dos o más medias de una muestra. Este análisis se conoce comúnmente como ANOVA y nos permite determinar también si esas medias provienen de una misma población (puede ser el número total de empleados de una empresa), o si las medias de dos poblaciones son iguales.

Por otro lado, la varianza al igual que la desviación estándar son muy sensibles a los valores atípicos, estos son los valores que se alejan mucho de la media o que son muy distintos a esta.

Para que estas medidas no se vean tan afectadas, estos valores atípicos pueden obviarse a la hora de realizar los análisis e incluso los cálculos. También pueden emplearse otras medidas de dispersión que son más útiles en estos casos.

En el caso de analizar el riesgo de una inversión, se tienen en cuenta dos aspectos importantes, uno es el rendimiento invertido y otro el esperado de acuerdo a la inversión realizada. Como ya se mencionó, se puede utilizar la varianza para analizar este riesgo.

Matias Riquelme
Ingeniero Civil Industrial con experiencia en empresas multinacionales. Me gusta la redacción de artículos de liderazgo, administración de empresas y estrategia.
Web y Empresas (Sep 10, 2021) Varianza en Estadística (Uso, definición y formula). Retrieved from https://www.webyempresas.com/varianza/.
"Varianza en Estadística (Uso, definición y formula)." Web y Empresas - Accessed Sep 10, 2021. https://www.webyempresas.com/varianza/

7 COMENTARIOS

  1. Excelente trabajo y muy fácil de entender, Gracias, porque nos ayuda a los estudiantes, a entender este tema haciendo de forma didáctico.
    Enhorabuena para Ustedes. sigan con su proyecto. Saludos

  2. Muy buena lectura he podido entender que la varianza es una medida de la dispersión de una variable aleatoria (valores que se obtienen de manera aleatoria)
    junto con la desviación estándar, son medidas de dispersión de datos u observaciones, cada una de estas la podemos ver reflejadas en nuestro diario vivir.

  3. Buena lectura lectura en ella logré comprender que es la varianza es una medida de dispersión de una variable de manera aleatoria junto a la medida de dispersión nos da ejemplo de la vida cotidiana , pero me gustan más los vídeos es una forma mucho más sencilla de entender las estadísticas

    • Hola Ivan,

      Es dificil hacer una interpretación del resultado de una varianza por si sola, lo ideal es compararla con otros datos de varianzas.

      Saludos

DEJA UNA RESPUESTA

Please enter your comment!
Please enter your name here