Correlación de Pearson y Chi-Cuadrado: Asociación entre Variables

Correlación de Pearson

El coeficiente de correlación de Pearson es una técnica que permite determinar la forma y significación de asociaciones entre dos variables continuas. El R de Pearson se aplica solo cuando las dos variables se asocian en forma lineal. Lo anterior se corrobora con un gráfico de dispersión. Por ejemplo, la asociación entre la variable tiempo de estudio y rendimiento académico. La asociación lineal existe cuando la nube de puntos toma una forma de línea. El coeficiente de correlación de Pearson asume una relación lineal entre las variables, por ende, no conviene aplicar este coeficiente entre variables que no se relacionen en forma lineal.

Ejemplos:

  • Ansiedad y Rendimiento Académico.
  • Aprendizaje y número de ensayos.

El valor del R varía entre -1 y 1. Permite apreciar la dirección en la que se asocian las variables:

  • Positiva: cuando el valor del R es positivo indica que las variables cambian en conjunto, es decir, ambas suben o ambas bajan. Ejemplo: compensación y rendimiento laboral.
  • Negativa: cuando el valor del R es negativo indica que las variables cambian de forma inversa, es decir, una sube y la otra baja o viceversa. Ejemplo: Apoyo social y riesgo suicida.

Cuando existe una correlación positiva se observará una nube de puntos ascendente.

Cuando existe una correlación negativa se observará una nube de puntos descendente.

Cuando no existe covariación, se observará una nube dispersa.

La fuerza o intensidad de la relación de las variables se determina por el valor absoluto del coeficiente (distancia numérica al 0), donde mientras más valor absoluto, más fuerte es la relación entre las variables.

Valor

Interpretación

1

Correlación Perfecta.

Entre 0,81 y 0,99

Correlación Muy Alta

Entre 0,61 y 0,8

Correlación Alta

Entre 0,41 y 0,6

Correlación Moderada

Entre 0,21 y 0,4

Correlación Baja

Entre 0,1 y 0,2

Correlación Muy Baja

0

Correlación Nula

Cálculo del r de Pearson

El r de Pearson es la sumatoria de las multiplicaciones entre las puntuaciones estandarizadas (ajustadas a la media) de ambas variables (X y Y, en la fórmula) en la muestra total.

Toma de decisiones en el r de Pearson

H0: no existe asociación (positiva o negativa) entre las variables.

H1: existe asociación (positiva o negativa) entre variables.

El r se asocia a un valor de significancia que al ser menor a 0,05, se rechaza H0. Lo que se contrasta es si la asociación entre las variables es real o se debe al azar. Al utilizar r de Pearson, estamos verificando solo variables “asociadas”, sin establecer causalidades entre ellas. Es por ello que se debe tener cuidado en establecer correlaciones espurias, ejemplo: Estatura e inteligencia.

Chi-Cuadrado

Es un tipo de prueba que permite determinar el grado de asociación entre dos variables que son categóricas o nominales. Utiliza como base para el análisis, las frecuencias, y lo que busca es determinar que las diferencias encontradas no se deban al azar (es decir que las diferencias sean estadísticamente significativas). La prueba Χ² se utiliza para comparar dos o más grupos independientes, en base a proporciones organizadas en una tabla de contingencia, donde se utiliza esta prueba para determinar que las diferencias entre las frecuencias no se deban al azar.

¿Qué es una tabla de contingencia?

Es un tipo de tabla que se utiliza para registrar y analizar la relación entre dos o más variables categóricas o nominales. Se basa en el registro de las frecuencias en que ambas variables se “entrecruzan” en sus categorías.

Prueba de Chi-Cuadrado para una tabla 2×2

Una tabla de contingencia de 2×2, quiere decir que tenemos 2 variables, y cada una de estas, con dos niveles de respuesta.

Cálculo del Chi-Cuadrado

Ya calculado el Chi-Cuadrado, se busca este valor en la siguiente tabla, con un grado de libertad para probar H0. La regla de decisión es: para rechazar H0, el valor de significancia debe ser menor a 0,05.

La mejor forma de reportar los resultados, es utilizando como complemento un gráfico de porcentajes, donde se debe hacer explícita la conclusión obtenida (quiénes más o quiénes menos). Esta información debe ser apoyada con el valor de la prueba, los grados de libertad y el valor de p o sig.

Ejemplo

Se quiere determinar si existe una asociación entre el sexo y la depresión. Para esto, tenemos que hay 96 mujeres con depresión y 13 mujeres sin depresión; y 48 hombres con depresión y 20 sin depresión.

A partir de esto, lo primero que tendríamos que hacer es plantearnos la hipótesis nula y alternativa:

H0: No existe asociación entre el sexo y la depresión.

HA: Existe asociación entre el sexo y la depresión.

Se encontraron diferencias entre la proporción de hombres y mujeres y la presencia de una sintomatología depresiva (Χ² = 7,33; gl=1; p=0,01). Como se puede observar en el gráfico 1, existe una mayor proporción de mujeres con sintomatología depresiva (54,4%) que hombres con sintomatología depresiva (27,1%).

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.