Coeficiente de Determinación r2

El coeficiente de determinación que se conoce también como r2, es un término utilizado en estadística, que tiene como función principal predecir el resultado de hipótesis. Esto es fundamental en cualquier estudio con fundamentos científicos y sus aplicaciones pueden tener un amplio, rango como en la economía, el estudio de los mercados o para determinar el éxito de algún producto.

Existen varias definiciones acerca de esta conocida herramienta, las cuales no todas coinciden, por lo que es importante conocer cada una de ellas, como por ejemplo aquellas que están relacionadas con la regresión lineal.

Definición de coeficiente de determinación

Es el cuadrado de correlación que mide que parte viene explicada en una determinada variante como parte de una variación, esto quiere decir cual se puede predecir a través de la variación de la otra.

¿Cómo se calcula el coeficiente de determinación ?

Los modelos estadísticos tienen como finalidad probar o explicar alguna variable aleatoria, esto se realiza a través de otras variables aleatorias que son conocidas como factores. Ya que se puede predecir una variable considerada aleatoria a través de su medida y que para este caso la varianza será el mismo error cuadrático medio, el máximo error cuadrático medio que se puede aceptar es la varianza.

El resultado puede variar entre 0 y 1, esto significa que mientras más cerca esté del uno estará más ajustada a la variable que intentas probar, mientras que en el caso contrario, es decir, cuanto más se acerca a 0 menos fiable será ya que estará menos ajustado el modelo.

¿Cómo se expresa el coeficiente de determinación?

Aquí puedes observar una fracción en la que el numerador se expresa de la siguiente forma:

Aquí se puede observar que en la expresión de varianza la Y lleva circunflejo, lo que significa que es la estimación de un modelo, esto no es el valor real de Y sino una estimación. Otra diferencia con respecto a esta expresión de la varianza es que no se divide por T ya que el denominador también la expresaría, entonces se eliminan ambas para que de esta forma se simplifique la expresión.

Con respecto al denominador observamos que la única diferencia con la varianza que se puede notar es que no se divide por T o N

Aplicaciones del coeficiente de determinación

Son muchas las utilidades que tiene esta fórmula, por ejemplo, en el caso de intentar la cantidad de puntos que anota un jugador de futbol o baloncesto con respecto a la cantidad de partidos que juega, partiendo de la suposición que mientras más partidos más puntos serán anotados. Tomemos en cuenta 8 juegos.

La grafica mostraría una línea inclinada, con una relación positiva, ya que como se esperaba mientras más partidos jugados más puntos fueron anotados, esta grafica mostraría un resultado por encima de cero, el cual como mencionamos antes probaría que está ajustado a la variable real.

¿Por qué surge la R cuadrado ajustada?

Lo que ocurre con R cuadrada y la razón por la cual se da la R cuadrada ajustada tiene que ver con que no penaliza la inclusión respecto a las variables de tipo explicativas no significativas, esto quiere decir que, si se le agrega al modelo por ejemplo 5 variables explicativas que no tengan mucha relación con el puntaje que este determinado jugador ha anotado, el R cuadrado será mayor o aumentará.

R cuadrado ajustado

Es una medida que establece el porcentaje explicado por la varianza de regresión con respecto a la varianza de la variable explicada. Puedes ver que es lo mismo que con el R cuadrado sin embargo con la pequeña diferencia de que penaliza la inclusión de variables.

La R cuadrada siempre aumenta a pesar de que las variables incluidas en el mencionado modelo no sean realmente relevantes. Para resolver dicho problema se aplica que:

En esta ecuación se refiere a N como el tamaño de la muestra y K corresponde a las variables explicativas. Desde el punto de vista de la deducción matemática a valores por encima de k, estará más lejos el R cuadrado ajustado, del R cuadrado común.

Otras funciones del coeficiente de determinación

No tan solo es útil para explicar o mejor dicho, medir la capacidad explicativa de un modelo sino que al mismo tiempo permite elegir cual entre varios modelos es el más adecuado. Esto quiere decir que los modelos tienen las mismas variables dependientes y el mismo número con respecto a las variables que se conocen como explicativas, el más adecuado será aquel que tenga un coeficiente mayor de determinación.

Claramente esto puede variar según el modelo elegido ya que no será lo mismo en el caso por ejemplo de un modelo anidado. Lo más importante con respecto a este coeficiente es su capacidad para predecir la efectividad de los modelos o teorías propuestas, esto puede aplicarse no tan solo a números, esto es vital para saber si las predicciones son buenas o malas.

Deja una respuesta

Su dirección de correo electrónico no será publicada.