El diagrama de dispersión forma parte del grupo de las 7 herramientas básicas de calidad, esta trata de un diagrama de tipo matemático que maneja las coordenadas cartesianas para exponer los valores de dos variables, para un grupo de datos.
¿Qué es un diagrama de dispersión?
También se le conoce como gráfico de puntos o diagrama de XY. Son diagramas que utilizan un grupo de puntos, ubicados usando las coordenadas cartesianas (X, Y) para expresar valores de 2 variables, ya que, al seguir una variable en cada eje, se detecta la relación o correlación entre las dos variables.
Entendiendo que la dispersión en la matemática, se conoce como el valor de distanciamiento de un vinculado de valores, con respecto a un valor medio.
A partir de aquí se derivan algunas medidas de dispersión en el mundo de las estadísticas, como el rango, la varianza, la desviación, el coeficiente de correlación, etc.
Ahora bien, el diagrama de dispersión, es la representación gráfica de una serie de datos para dos variables, se analiza la relación entre las 2 variables, conociendo en qué forma se afectan la una a la otra o en caso contrario qué tan independientes pueden ser una de la otra.
Tipos de correlación en el diagrama de dispersión
A través de los patrones del diagrama de dispersión se pueden interpretar los siguientes tipos de correlación:
Correlación positiva
Se da cuando una variable disminuye o aumenta y a la vez la otra variable también lo hace, existiendo una relación proporcional, por ejemplo, en el caso de las ventas, cuando un vendedor vende mayor cantidad de artículos, (variable 1), se experimenta una mayor ganancia, gana más dinero (variable 2).
Correlación negativa
Se da cuando el comportamiento de una variable, es contrario al comportamiento de la otra variable, es decir aquellos casos en que una variable aumenta, la otra variable disminuye. Existiendo una relación proporcionalmente inversa, por ejemplo, en la construcción, un mayor número de trabajadores en una obra (variable 1), disminuyen el tiempo de entrega de la obra (variable 2).
Correlación nula
Es el caso en que no se consigue un comportamiento entre las variables, estos representan los tipos de correlación más evidentes.
Al observarlos desde una perspectiva de la fuerza de la correlación, se encuentra otra clasificación.
- Positivo
- Negativo
- Nulo
- Lineal
- Exponencial
- Forma de U.
La fuerza de correlación se puede determinar por el nivel de proximidad de los puntos en el gráfico. Los puntos ubicados lejos del conjunto general de puntos, son conocidos como valores atípicos.
Para ayudar al análisis se dibujan líneas o curvas, tan cerca como sea posible, esto se conoce por línea de mejor ajuste y se utiliza para realizar estimaciones mediante interpolación, permitiendo mostrar cómo se condensan los puntos en una línea.
¿Cuándo se utilizan los diagramas de dispersión?
Son ideales en los casos donde se tienen datos numéricos en pareja y se desea observar si una variable puede afectar a la otra.
Sin embargo, se debe tener presente que la correlación no es causal y alguna variable inadvertida puede influir en los resultados.
El diagrama de dispersión admite el estudio de las relaciones entre dos conjuntos de datos asociados, que aparecen en pares, por ejemplo, para ubicarse en coordenadas x, y, uno de cada conjunto. El grafico muestra dichos pares en forma de una nube de puntos, las relaciones entre los datos asociados se deducen de acuerdo a la forma de las nubes.
Es por ello que sus usos rondan entre eventos donde es necesario descubrir y mostrar las relaciones existentes entre dos conjuntos de datos asociados y confirmar relaciones anticipadas entre los mismos.
El diagrama de dispersión facilita el estudio de relación entre:
- Dos causas o factores relacionados con la calidad o proceso productivo.
- Dos problemas en la calidad.
- Cualquier problema en la calidad y la posible causa.
Cómo hacer un diagrama de dispersión
- Lo primero que se debe hacer es determinar cuál es la situación que se presenta, de esta manera es posible establecer las variables a estudiar.
- Luego se debe llevar a cabo la recolecta de datos emparejados (x, y), a partir de dos conjuntos asociados para hacer estudio de su relación. Es conveniente por lo menos llegar a contar con 30 pares aproximadamente.
- Dibujar y rotular los ejes X y Y.
- Hallar el valor mínimo y máximo, para ambas coordenadas y según estos valores, elaborar la escala de valores en los ejes X (horizontal) y eje Y (vertical).
- Ambos ejes deben tener una longitud aproximadamente igual o similar.
- Bajar los datos pareados, cuando dos pares de datos tengan valores iguales se deben dibujar círculos concéntricos al punto marcado o marcar a corta distancia el segundo punto.
- Explorar la forma obtenida por la nube de puntos, de forma que se descubra los tipos de correlación y la fuerza de las mismas.
Correlación y tipos de correlación derivadas de un diagrama de dispersión
La correlación no es otra cosa, que la forma en cómo se relacionan ambas variables, a continuación algunos ejemplos:
Línea de ajuste
Se usa para facilitar el desarrollo de predicciones, basándose en datos pasados, al dibujar la recta, se debe tener seguridad de que encaje con el mayor número de datos. Si existe un punto o puntos ubicados por encima o por debajo, en referencia al resto estamos hablando de puntos atípicos, estos se deben dejar fuera de la recta.
Coeficiente de correlación de Pearson
En estadística, este coeficiente de Pearson, constituye una medida de la relación entre 2 variables cuantitativas aleatorias, esta correlación es independiente de la escala de las variables.
En términos más sencillos, se puede decir que el coeficiente de correlación de Pearson es un índice que se puede utilizar para medir el grado de relación de 2 variables siempre que estas sean cuantitativas.
Para concluir debemos tener claro que, al hablar de una relación entre dos acciones, se hace referencia a una relación conocida como causa y efecto, existiendo variables como, la relación entre una causa y otra causa, la relación entre una causa y dos efectos o más causas. El diagrama de dispersión puede relacionar estas condicionantes.