La estadística es una de las tantas ramas de la matemática que se encarga de recolectar, organizar, proyectar, analizar, interpretar y presentar datos siguiendo leyes de probabilidad, esto nos permite predecir cierto tipo de comportamientos aplicándolos al campo científico, industrial o social.
Dentro de la estadística podemos utilizar varias pruebas de hipótesis una de las más completas es la prueba T de Student, fue desarrollada por el matemático y químico Inglés William Sealy Goset mejor conocido por su seudónimo “Student”.
Esta prueba estadística consiste en la distribución de probabilidad, por la necesidad de estimar cuál es la media de una población con una muestra pequeña normalmente distribuida. Es decir, menor de 30, por esto esta prueba es bastante utilizada en el campo de la medicina.
Para realizar esta prueba se necesita una distribución normal de los datos, ya que esta prueba estadística es una prueba paramétrica y se utiliza cuando se desconoce la desviación estándar poblacional debido a que si se conociera este dato estadístico en vez de utilizar esta prueba se utilizaría la distribución normal para pruebas de hipótesis.
Conceptos básicos de la T de Student
Para aplicar correctamente la prueba de t de Student debemos tener en cuenta varios conceptos básicos de teoría de teoría de la decisión para muestras grandes.
El percentil
Es el resultado de dividir un conjunto de datos en cien partes iguales, cada una de esas partes representan 1% en la representación de la gráfica de la campana de Gauss se hace el recorrido de la parte izquierda a la parte derecha.
La campana de Gauss
Es una gráfica que representa la distribución normal de un conjunto de datos estadísticos. La distribución normal se utiliza para muestras grandes, esto quiere decir a un dato estadístico mayor a 30 mientras que la T de Student se utiliza para muestras pequeñas, menos de 30.
Características de la T de Student
- Pertenece una familia de distribuciones de campana.
- Es simétrica alrededor de una media de cero.
- Es más aplanada que la distribución normal estándar.
- Tiene mayo área en los extremos y menor área en el centro.
- A medida que el tamaño de muestra aumenta, se aproxima a una distribución normal estándar.
Escenarios donde aplicar la T de Student
Existen varios escenarios en los cuales podemos aplicar esta prueba estadística y siempre va a depender del tipo de muestra que se ha recolectado.
Una muestra relacionada
Esto significa que hay dos medidas las cuales se han obtenido en dos momentos distintos y que además están relacionadas, un ejemplo de ello es cuando se realiza una intervención, bajo este contexto podemos tener datos e información antes de la intervención y después de la intervención, luego podemos observar si en cada sujeto vario el resultado antes y después.
Dos muestras con varianzas homogéneas
Se refiere a que las muestras tomadas para nuestra prueba estadística son similares en las dos muestras.
Dos muestras con varianzas heterogéneas
Esto se refiere a que nuestra prueba estadística posee muestras, datos e información totalmente diferentes.
¿Cómo determinar el escenario a conocer?
Para determinar cuál de los escenarios de dos muestras se está utilizando es necesario conocer homocedasticidad, si los datos de las dos muestras poseen esta característica entonces se deberá utilizar el escenario de dos muestras con varianzas homogéneas, en el caso de que las muestras no posean homocedasticidad se deberá utilizar el escenario de dos muestras con varianzas heterogéneas.
La prueba estadística T de Student posee varios supuestos, en este caso para los escenarios que poseen dos muestras se supone es que los datos poseen una distribución normal, y se deberá presentar en cada una de las dos muestras y además estas muestras son totalmente independientes, los valores que tenemos en una muestra no dependen para nada de la otra muestra.
Cuando utilizamos el escenario de una muestra relacionada, tenemos solamente un supuesto y el supuesto es que la diferencia entre las dos variables relacionadas posee una distribución normal y el ejemplo perfecto es cuando se realiza una intervención, ya que poseemos datos de antes y después de la misma, a partir de esto podemos encontrar la diferencia entre cada sujeto ya que se van restando los valores de antes y después encontrando así los valores de la diferencia.
Esta diferencia debe tener una distribución normal, en este escenario no nos está indicando de que los datos en cada una de las muestras o de los grupos poseen distribución normal, nos indica que la diferencia es la que posee una distribución normal y no los datos de cada uno de los grupos, que es lo que nos indicaba el supuesto con dos variables o dos muestras.
Grados de libertad
La prueba estadística T de Student depende de los grados de libertad. Es el número determinado que nos permite saber la variabilidad de eventos en una muestra, en palabras más sencillas podemos decir que son el número de valores que podemos elegir libremente existiendo un total fijo.
Existen dos fórmulas de grados de libertad, una formula cuando tenemos una muestra que es relacionada, y la otra fórmula que es cuando estamos trabajando cualquiera de los dos escenarios con dos muestras.
Para visualizar esto de una manera más cómoda podemos imaginarnos una familia en la cual existe la madre y 4 hijos, la mama les prepara 10 panes con jamón, el total fijo son los 10 panes con jamón, el primer hijo le dice a su mama que se quiere comer 3 panes, el segundo hijo le pide 2 panes, el tercer hijo pide 3 panes y el cuarto hijo por haber llegado tarde no va a poder escoger cuantos panes de jamón quiere, porque quedo condicionado de lo que pidieron sus otros 3 hermanos, por eso al cuarto hijo le quedaron solo 2 panes.
Lo importante es que de los 4 hermanos solo 3 pudieron escoger cuantos panes querían, en este caso el grado de libertad es de 3 que fueron los que pudieron escoger y ultimo quedo condicionado para completar los 10 panes.
Esperamos que hayas disfrutado de la lectura. ¡Si tienes alguna duda déjanos tu comentario!