¿Para qué sirve una marca de clase?

La marca de clase se conoce también como punto medio. Es el valor que se encuentra en el centro de una clase y representa a todos los valores que estén en una determinada categoría. Fundamentalmente, esta es utilizada para realizar el cálculo de diversos parámetros, como lo son la media aritmética o la desviación estándar.

El valor de la marca de clase, también es de gran utilidad para lograr encontrar la variante de un conjunto de una serie de datos que ya estén agrupados por clases y al mismo tiempo permite comprender cuál es la distancia que tienen esos determinados datos del centro.

¿Para qué sirve una marca de clase?

Como se mencionó ya anteriormente, la marca de clase tiene una gran funcionalidad para alcanzar la media aritmética y la varianza de un determinado grupo de datos que a su vez han sido ya agrupados en diferentes clases.

La media aritmética se puede definir, como la suma de todas aquellas observaciones que se obtienen del tamaño de la muestra. Si se ve desde el punto de vista físico, se puede interpretar como el punto de equilibrio de un grupo de datos.

La marca de datos sirve para identificar completamente un conjunto de datos, pero podría ser muy riesgoso, por lo tanto, se debe tener en cuenta la diferencia que existe entre el punto de equilibrio y los datos reales. Estos valores se conocen como derivación de la media aritmética y a su vez, buscan determinar cómo puede variar la media aritmética de los datos.

La forma más común que se puede encontrar este valor, es por medio de la varianza. Esta varianza es el promedio de los cuadrados de las desviaciones de la media aritmética. Para realizar el cálculo tanto de la varianza, como de la media aritmética de un grupo de datos que se encuentran en una clase, se deben utilizar algunas fórmulas referidas.

Calcular una marca de clase

Como ya se dijo anteriormente la marca de clase se conoce como el punto medio de cada intervalo. Es el valor que representa al intervalo en totalidad para realizar los cálculos de ciertos parámetros como la desviación típica.

Para poder calcularla se deben seguir los siguientes pasos:

  • Se calcula la marca de clase (Xi), que es el promedio de cada intervalo o el valor medio. Esta sirve para que sea mucho más fácil realizar el cálculo de las diferentes medidas de posición y de dispersión.
  • Cuando ya se haya escogido la cantidad de intervalos, se podrá determinar la amplitud de cada clase o intervalo (C).
  • Esta amplitud debe ser igual al rango de los datos que se encuentran divididos en la cantidad de intervalos.
  • En el primer intervalo, se debe contener el más bajo valor de los datos y por el contrario el último intervalo debe tener el valor de los datos más alto.
  • Se debe determinar la cantidad de intervalos o clase (K) que se usan para poder realizar la agrupación de los datos.
  • Lo más apropiado, es tener entre 5 y 20 intervalos o clases (K).
  • A pesar de esto, si no existe la seguridad de la cantidad de intervalos que se van a utilizar, se puede aplicar la regla llamada Regla de Sturges. Con ella se puede lograr tener una aproximación bastante acertada de la cantidad de intervalos que se necesita para agruparlos.
  • Esta Regla de Sturges, permite que se lleve a cabo el cálculo de la cantidad de clase, una vez que se conozca el tamaño de la población o muestra.

¿Cómo es una marca de clase para datos agrupados?

Dentro de una tabla de datos agrupados por intervalos, se pueden llegar a desconocer los valores reales que toma la variable. Para calcular las medidas de centralización, se debe considerar que los valores estén distribuidos de manera uniforme en los intervalos.

Esto también puede suceder si se agrupan datos parecidos en intervalos. Cuando esto se hace, se corre el riesgo de olvidar sus verdaderos valores y solo se consideran sus aproximaciones que supone la distribución de intervalos uniforme.

Todo esto puede provocar variaciones en las medidas centralizadas, una vez que se consideren los datos que sean conocidos que estén sin agrupar o que estén agrupados por intervalos, lo que significa que no será de gran tamaño.

Si la muestra contiene entre 30 o más datos, es recomendable agrupar los datos por clasificación de clases, luego se deben determinar las características de la muestra y seguidamente las de la población de donde haya sido tomada.

Antes de definir cómo es la forma de determinar las características de interés al momento que se agrupen en clases los datos de la muestra, es muy importante saber cómo se deben separa dichos datos.

Para agrupar los datos se deben seguir los siguientes pasos:

Determinar el rango o recorrido de los datos

Rango = Valor mayor – Valor menor

Establecer el número de clases (K)

Para poder establecer la cantidad de clases donde se van a agrupar los datos, es necesario tener una base como los que se pueden observar en la siguiente tabla.

Tamaño de muestra o número de datos

Número de clases

Menos de 50De 5 a 7
De 50 a 99De 6 a 10
De 100 a 250De 7 a 12
Más de 250De 10 a 20

Deja una respuesta

Su dirección de correo electrónico no será publicada.