Estadística Descriptiva y Modelos de Regresión: Un Estudio Detallado

Análisis Descriptivo de la Variable Dependiente

Fisher (Asimetría): Mayor que 0, lo que indica una distribución asimétrica positiva, es decir, la distribución se alarga hacia la derecha.

Curtosis: Mayor de 3, lo que sugiere una distribución leptocúrtica.

Gráficos de Dispersión

  • Al analizar la variable FAMINC (Ingresos de la Familia), se observa una correlación positiva: a mayor número de horas trabajadas, mayores son los ingresos familiares.
  • En relación con la variable NWIFEINC (Renta no salarial de la mujer), la recta de regresión muestra una leve pendiente negativa. Esto implica que, a medida que disminuye la renta no salarial de la mujer, aumenta el número de horas trabajadas.

Selección de Variables Explicativas

Se seleccionan las variables explicativas con una Probabilidad (Prob) significativa.

El modelo también es globalmente significativo (Prob F-Statistic = 0.00000).

Análisis de Multicolinealidad

En este caso, el determinante es de 0.07085. Dado que este valor no está muy próximo a 0 (es superior a 0.05), se concluye que no existe un problema grave de multicolinealidad.

Heterocedasticidad

Test de Glejser

  • Si Prob > 0.05: No se rechaza la hipótesis nula (H0). La variable Z no es significativa y, por lo tanto, no causa problemas de heterocedasticidad.
  • Si Prob

Test de White

  • Si Prob > 0.05: No se rechaza la H0 (Homocedasticidad).
  • Si Prob

Autocorrelación

Estadístico de Durbin-Watson

Se utiliza el correlograma de los residuos, seleccionando 20 rezagos (Lag Specification). Si hay valores que se salen de las bandas, existe autocorrelación.

Interpretación:

  • p = 0: No existe autocorrelación.
  • 0
  • p = 1: Autocorrelación positiva perfecta.

Estadístico de Breusch-Godfrey

Se formula el modelo de regresión original y se obtiene la serie de residuos. Se analiza la probabilidad resultante.

Estimación del Modelo e Interpretación de Coeficientes

Variables Explicativas

  • Cualitativas: ATOTINC (Ingresos Mensuales Totales) y YJOB (Número de años en el trabajo).
  • Cuantitativas: SELF (1 si el individuo es autónomo) y MORTLAT1 (1 si tiene uno o dos pagos atrasados de hipoteca).

En el modelo inicial, la única variable significativa es MORTLAT1 (probabilidad = 0.0169, menor que 0.05).

Selección del Modelo

Se utilizan los siguientes criterios de información para seleccionar el mejor modelo:

  • Criterio de Información de Akaike (AIC)
  • Criterio de Información de Schwarz (SBC)
  • Criterio de Información de Hannan-Quinn (H-Q)

Se elige el modelo con los valores más bajos de AIC, SBC y H-Q.

Interpretación de los Coeficientes

  • Cualitativas: Si la tasa de desempleo sectorial aumenta en una unidad, la probabilidad de aprobación del préstamo disminuye en un 3.38%.
  • Cuantitativas: Si el solicitante es blanco, la probabilidad de aprobación del préstamo aumenta en un 74.43% en comparación con los solicitantes no blancos.

Bondad del Ajuste

Para analizar la bondad del ajuste, se examina el valor de R-cuadrado (R²):

Si R² no es exactamente 0 ni 1, este estadístico no tiene un significado claro y no se puede valorar la bondad del ajuste de manera precisa.

  • R² = 1: Ajuste perfecto.
  • R² = 0: No existe relación entre la variable dependiente (Y) y la variable explicativa (X).

Introducción a la Econometría

Econometría: Rama de la ciencia económica que se dedica a la medición cuantitativa de fenómenos económicos. Utiliza métodos estadísticos aplicados a formulaciones teóricas expresadas matemáticamente para explicar las leyes que regulan dichos fenómenos.

El Modelo de Regresión Lineal

Criterio de Mínimos Cuadrados Ordinarios (MCO)

Consiste en minimizar la suma de los errores (residuos) al cuadrado. Esto evita la compensación entre errores positivos y negativos, ya que todos los residuos al cuadrado son positivos.

Propiedades de la Regresión Lineal

  • La línea de regresión pasa por el punto determinado por las medias muestrales de X e Y. La suma de los residuos es cero.
  • La covarianza entre los valores muestrales de X y los residuos, y entre los valores predichos de Y y los residuos, es cero.
  • Los coeficientes se pueden calcular secuencialmente.
  • La variación total de Y se descompone en la variación explicada por la regresión y la variación no explicada. (Descomposición de la suma de cuadrados).

Coeficiente de Determinación (R²)

Mide la bondad del ajuste, mostrando cómo se ajusta la línea de regresión a los datos. Indica la proporción de la variación total de la variable dependiente (Y) explicada por el modelo.

Características:

  1. En el modelo de regresión simple con término independiente, R² es positivo.
  2. Sus límites son 0 y 1.

Coeficiente de Correlación Lineal

Mide el grado de asociación lineal entre dos variables. Indica la concentración de los puntos muestrales alrededor de la línea de regresión.

Características:

  1. Puede ser positivo o negativo. El signo depende de la covariación entre las variables.
  2. Sus límites son -1 y +1. Si r > 0, X e Y tienen una relación positiva. Si r

Contrastes de Heterocedasticidad

Procedimiento del Contraste de White

  1. Estimar el modelo original por MCO.
  2. Obtener la serie de residuos MCO (ei).
  3. Estimar una regresión auxiliar del cuadrado de los residuos sobre una constante, los regresores del modelo, sus cuadrados y sus productos cruzados de segundo orden.
  4. Calcular el coeficiente R² de la regresión auxiliar.

Procedimiento del Contraste de Glejser

  1. Estimar el modelo original por MCO.
  2. Obtener la serie de residuos MCO (ei).
  3. Contrastar, en las regresiones auxiliares, la significación individual de la variable Zi.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.