Preguntas Frecuentes sobre Modelos Econométricos
Problemas de Especificación y Estimación
A continuación, se abordan preguntas comunes relacionadas con problemas en la especificación y estimación de modelos econométricos, incluyendo cambio estructural, multicolinealidad, heterocedasticidad, autocorrelación y errores de especificación.
- Cambio Estructural:
- ¿Cuál de las siguientes afirmaciones referidas a la problemática del cambio estructural NO es correcta? El cambio estructural de tipo continuo puede ser corregido en un modelo econométrico mediante la especificación de una variable ficticia que cambie de valor a partir del punto de ruptura estructural. (Nota: Esto es incorrecto porque las variables ficticias se usan para cambios estructurales *discretos*, no continuos).
- ¿Cuál de estas afirmaciones referidas a la problemática del cambio estructural NO es correcta? El test de Chow es un método de búsqueda de un posible punto de cambio estructural. (Nota: El test de Chow *sí* es un método para detectar cambio estructural).
- ¿Qué métodos de estimación NO se utilizan para la corrección del cambio estructural? Utilizar variables instrumentales para recoger el cambio estructural. (Nota: Las variables instrumentales se usan para problemas de endogeneidad, no directamente para cambio estructural).
- Para resolver un problema de cambio estructural: NO se deben eliminar las variables que provocan el problema, NO se vuelve a especificar el modelo con las variables en logaritmos, NO se debe incluir una variable proxy, NO se vuelve a especificar el modelo con las variables en primeras diferencias.
- Multicolinealidad:
- ¿Cuál de las siguientes afirmaciones referidas al problema de la multicolinealidad en los datos de un modelo econométrico NO es cierta? La presencia en un modelo estimado de multicolinealidad NO desvirtúa el significado económico de los parámetros estructurales estimados. / La multicolinealidad próxima implica que las variables explicativas no prevean conjuntamente el comportamiento de la variable endógena. (Nota: La multicolinealidad *sí* afecta la interpretación de los parámetros y la capacidad predictiva conjunta).
- ¿Cuál de los siguientes síntomas NO es propio de la existencia de multicolinealidad aproximada en el modelo? Un coeficiente de determinación corregido bajo. (Nota: Un R² corregido bajo no es típico de multicolinealidad; suele ser alto).
- ¿Cuál de los siguientes síntomas NO es propio de la existencia de multicolinealidad próxima o imperfecta en el modelo? Coeficiente de determinación lineal corregido bajo.
- Para resolver un problema de multicolinealidad perfecta: se deben eliminar las variables que provocan el problema.
- La multicolinealidad implica la NO existencia en el estimador MCO. Depende: en la multicolinealidad perfecta no se puede aplicar el MCO ya que el determinante da 0 y no se puede invertir. En la multicolinealidad aproximada, el determinante es casi 0, podemos aplicar MCO pero podría surgir algún problema.
- Errores de Especificación (Omisión/Inclusión de Variables):
- ¿Cuál de las siguientes circunstancias puede provocar sesgos en el estimador MCO? Omisión de variables relevantes.
- ¿Qué efecto origina en la calidad de los estimadores de Mínimos Cuadrados Ordinarios (MCO) la omisión de variables relevantes (OVR) y la inclusión de variables no relevantes (IV-NR)? La OVR origina sesgo en los estimadores y la IV-NR solo pérdida de eficiencia.
- El problema de omisión de variables relevantes en un modelo econométrico: está relacionado con el problema de cambio estructural.
- ¿Qué implicaciones tiene la omisión de variables relevantes para las propiedades de los estimadores MCO de un modelo econométrico? Al omitir una variable relevante, los estimadores del método MCO pierden sus propiedades más importantes: serán sesgados, poco eficientes e inconsistentes. Además, la omisión de alguna variable relevante puede provocar un cambio estructural y heterocedasticidad.
- Regresores Estocásticos:
- ¿Es siempre perjudicial el hecho de que exista un regresor estocástico en la especificación de un modelo econométrico, cara a la calidad de los estimadores de MCO? No es perjudicial si la matriz de datos de las variables explicativas X es independiente del vector de parámetros estructurales B y del vector de perturbación aleatoria u.
- ¿En qué caso/s NO son fiables los contrastes de significación individual? En un modelo con variables explicativas altamente correlacionadas entre sí, en un modelo en el que el término de error no se distribuye como una normal, en un modelo con insuficientes grados de libertad.
- ¿Qué condiciones han de darse para que un modelo econométrico estimado por MCO que incluye especificación de regresores estocásticos no vea afectadas las propiedades deseables de sus estimadores? Que la matriz de datos de variables explicativas sea independiente del vector de perturbación y del vector de parámetros estructurales.
- Dado un modelo econométrico que incluye un regresor estocástico en su especificación, podemos afirmar que: los estimadores B^MCO son sesgados.
- Un regresor estocástico en la especificación de un modelo econométrico provoca en las propiedades de los estimadores: si la matriz X es independiente del vector B y del vector u, las propiedades de los estimadores no se verán afectadas.
Heterocedasticidad y Autocorrelación
- Heterocedasticidad
- ¿Qué matriz de transformación de datos P corregirá la heterocedasticidad en un modelo en el que las perturbaciones aleatorias muestran ausencia de autocorrelación y un comportamiento en la varianza de tipo σt² = σ²(a + bX^(1/2) + µ) con perturbación aleatoria ruido blanco? Aquella que tiene los elementos distintos de la diagonal principal nulos y la diagonal principal del tipo Pij = 1 / (a + bX^(1/2)).
- Dado el modelo econométrico Y = B0 + B1X1 + B2X2 + Ui, para el que contrastaremos la heterocedasticidad con el test de Goldfeld y Quandt, podemos afirmar que: Este test NO se distribuye como una Chi-cuadrado de n-k. (Nota: El test de Goldfeld-Quandt se distribuye como una F de Snedecor).
- Indique cuál/es de los siguientes métodos se pueden utilizar para solucionar un problema de heterocedasticidad en un modelo econométrico: La transformación de todas las variables del modelo tomando logaritmos.
- Indique cuál de los siguientes métodos NO se pueden utilizar para solucionar un problema de heterocedasticidad indirecta en un modelo econométrico: La eliminación de variables explicativas en el modelo.
- Las causas directas más frecuentes que provocan la heterocedasticidad en el modelo básico de regresión son: Los incrementos en la magnitud de las variables llevan asociados incrementos en la dispersión.
- Autocorrelación
- El contraste de Breusch-Godfrey sirve para: Contraste de autocorrelación.
- El contraste de verificación de la hipótesis de ausencia de autocorrelación h de Durbin es un contraste que se realiza: Cuando existe una variable endógena desplazada en la especificación del modelo.
- El hecho de que un modelo econométrico tenga un vector de perturbaciones aleatorias no correlacionadas implica que: La matriz de varianzas y covarianzas del vector de perturbaciones tiene todos los elementos que no pertenecen a la diagonal principal nulos.
- En un proceso estocástico MA(1); Zt = ut – θut-1, donde ut = N(0, σ²I): Y1 = E[Zt, Zt-1] = -θσ².
- Entre las causas de la autocorrelación en el modelo básico de regresión encontramos: La inercia de los acontecimientos, omisión de variable relevante, cambio estructural, manejo previo de datos.
- Indique cuál de las siguientes herramientas NO utilizaría para detectar la presencia de autocorrelación en un modelo econométrico: El contraste Breusch-Pagan.
- Para corregir un problema de autocorrelación del tipo ut = ρut-1 + ε, se puede: Transformar todas las variables del modelo utilizando el parámetro ρ.
Modelos con Variables Endógenas Desplazadas y Ecuaciones Simultáneas
- Variables Endógenas Desplazadas:
- Considere el siguiente modelo que explica las ventas de las empresas en función de sus gastos en publicidad y de su tamaño: log(VTASi) = B1 + B2log(PUBLIi) + B3PYME + B4PYME*log(PUBLIi) + Ut, donde VTAS representa el volumen de ventas de las empresas, PUBLI representa los gastos realizados en publicidad y PYME es una variable binaria que toma el valor 1 para pequeñas y medianas empresas (Pymes) y 0 para empresas grandes. Se quiere contrastar si el efecto de la publicidad sobre las ventas es el mismo para PYMES que para grandes empresas. Indique la Hipótesis nula adecuada para llevar a cabo el contraste: B4 = 0.
- Las consecuencias de la especificación de retardos en el MBR: Aparición de regresores estocásticos (endógena desplazada), presencia de autocorrelación en los residuos y aparición de la multicolinealidad (exógenas desplazadas).
- Las consecuencias de la especificación de retardos en el modelo básico de regresión son: La aparición de regresores estocásticos, la presencia de autocorrelación en residuos y la aparición de la multicolinealidad.
- Las relaciones dinámicas en economía se pueden explicar por: Un desplazamiento en el tiempo de los efectos de una decisión, decisiones basadas en la anticipación a acontecimientos futuros, efecto memoria y hábitos, efectos de una decisión en el mismo periodo/en siguientes periodos.
- Sea el siguiente modelo de regresión lineal Y = BX + U, donde Xi (endógena desplazada) está correlacionada con el término de error. Sea Z un posible instrumento para X. ¿Qué condiciones debe cumplir Z para ser un instrumento válido? Cov(Zi, Xi) ≠ 0 y Cov(Zi, ui) = 0.
- Ecuaciones Simultáneas:
- Dado un modelo de ecuaciones simultáneas con sistema sobreidentificado, podemos afirmar que: Podremos estimar por MC2E (Mínimos Cuadrados en Dos Etapas), utilizando como variables instrumentales las obtenidas a partir de la estimación de la forma reducida.
- De los siguientes modelos, ¿cuáles son modelos multiecuacionales?: Modelos Recursivos o de Cadena causal, Simultáneos, Bloque-recursivos.
- Las circunstancias que obligan a la modelización multiecuacional de un fenómeno económico pueden ser: Las limitaciones de los modelos uniecuacionales, la necesidad de endogeneizar alguna variable explicativa, la complejidad de la variable a analizar y/o del fenómeno a analizar.
Otros Aspectos de los Modelos Econométricos
- Muestras Pequeñas:
- Cuando el modelizador se enfrenta con un problema de muestras pequeñas, ¿se puede afirmar que la esperanza del estimador se aproxima al valor real del parámetro? Sí, se utiliza MCO y los estimadores son insesgados, independientemente del tamaño muestral.
- Diga cuál de las siguientes afirmaciones relacionadas con el problema de las muestras pequeñas es correcta: Las muestras pequeñas originan un aumento en la varianza de los estimadores de MCO, si bien los estimadores son insesgados.
- Diga cuál de los siguientes síntomas es propio de la existencia de muestras pequeñas en el modelo: Incremento en la varianza de los estimadores de MCO, distorsión de los resultados de los contrastes de significación e intervalos de predicción demasiado amplios.
- En un MBRL (Modelo Básico de Regresión Lineal), la existencia de muestras pequeñas puede estar relacionada con: Una mayor varianza residual.
- ¿Qué implicaciones tiene una muestra pequeña en la utilización de un modelo econométrico? Las muestras pequeñas generan una mayor varianza y unos intervalos de predicción demasiado amplios. Por tanto, los resultados no son concluyentes.
- Distribución de las Perturbaciones:
- Dado el modelo econométrico Y = XB + U, donde ut = N(0, σ²Ω) con Ω ≠ I, y si B^MCO son los estimadores obtenidos por el método de MCO y BMCG son los estimadores MCG (Mínimos Cuadrados Generalizados). Indique cuál de las siguientes respuestas es correcta:
- Var-Cov(BMCO) = σ²(X´X)⁻¹ (Incorrecto: Esta es la varianza-covarianza si Ω = I).
- BMCG = (X´Ω⁻¹X)⁻¹X´Ω⁻¹Y (Correcto).
- Var-Cov(BMCG) = σ²(X´Ω⁻¹X)⁻¹ (Correcto).
- Dado el modelo econométrico Y = XB + U, donde ut = N(0, σ²Ω): Este modelo NO cumple la hipótesis de varianza constante (homocedasticidad) y los estimadores MCO serán ineficientes.
- Dado el modelo econométrico Y = BX + U, donde ut ~ N(0, σ²Ω) con Ω ≠ I y si B^MCO son los estimadores obtenidos por el método de MCO, y BMCG son estimadores MCG. Indique cuál de las siguientes respuestas es verdadera: E(B^MCG) = E(BMCG) = B (Correcto: Ambos estimadores son insesgados).
- La presencia de perturbaciones aleatorias no normales implica: La invalidación de los contrastes paramétricos del modelo de regresión.
- Suponga que el término de perturbaciones ε de la ecuación de regresión y = XB + ε posee una distribución Gamma con media λδ (producto de dos constantes), varianza constante (homocedástica) y no autocorrelación, y las variables explicativas X son no estocásticas. Señale cuál de las siguientes afirmaciones es correcta: El estimador MCO no tiene por qué ser ELIO (Estimador Lineal Insesgado Óptimo).
- En el modelo Y = xtB + Ut, donde U ~ N(μ, σ², I), siendo μ = cte para todo t = 1, 2, 3…n y donde se cumplen las demás hipótesis del MBRL, ¿qué propiedades tienen los estimadores MCO? ¿Qué consecuencias tiene esta distribución de la perturbación aleatoria para la contrastación del modelo? Se cumplen las hipótesis del MBRL (normalidad de la perturbación, varianza constante (homocedasticidad), covarianzas nulas (no correlación)). No se cumple la hipótesis de media = 0; tenemos media ≠ 0 y constante. Se produce sesgadez en el estimador para el parámetro original. El estimador para la suma del término independiente y el valor medio de la perturbación será insesgado y constante.
- Dado el modelo econométrico Y = XB + U, donde ut = N(0, σ²Ω) con Ω ≠ I, y si B^MCO son los estimadores obtenidos por el método de MCO y BMCG son los estimadores MCG (Mínimos Cuadrados Generalizados). Indique cuál de las siguientes respuestas es correcta:
- Grados de Libertad:
- Dado el modelo econométrico uniecuacional Y = BX + u, en el que se sabe que el orden de la matriz X es 58×3, podemos afirmar que: Los grados de libertad del modelo son 55 (n – k = 58 – 3 = 55).
- Contrastes de Hipótesis:
- Los contrastes de las hipótesis básicas referidas a la perturbación aleatoria de un modelo estimado con datos anuales son: El test de Jarque-Bera para contrastar la normalidad y el test de Breusch-Godfrey para detectar la ausencia de autocorrelación.
- Los contrastes de las hipótesis básicas referidas a las hipótesis de aleatoriedad de un modelo estimado con datos anuales son: El test de Breusch-Godfrey para detectar la ausencia de autocorrelación.
- Propiedades de los Estimadores MCO y MCG:
- Sea un modelo de regresión múltiple Y = XB + u. Una de las propiedades del estimador MCO de B es: Tiene una distribución normal independientemente del tamaño muestral (si se cumplen las hipótesis del modelo clásico).
- Suponga un modelo de regresión lineal con errores heterocedásticos y considere el estimador de MCG. Señale cuál de las siguientes afirmaciones es correcta: El estimador MCG es el estimador MCO en un modelo transformado en el que los errores satisfacen las condiciones de Gauss-Markov.
- Suponga un modelo de regresión lineal con errores heterocedásticos y considere el estimador de MCG (Mínimos Cuadrados Generalizados). Señale cuál de las siguientes afirmaciones es correcta: El estimador MCG es el estimador MCO en un modelo transformado en el que los errores satisfacen las condiciones de Gauss-Markov.
- Las consecuencias en los estimadores MCO, ante una matriz de varianzas-covarianzas de las perturbaciones aleatorias Σ = σ²Ω, donde ut = N(0, σ²Ω) son: Los estimadores serán insesgados, consistentes e ineficientes.
- Una matriz de varianzas-covarianzas del término de error no escalar: exige la utilización del estimador de Aitken (MCG) para que se conserven las buenas propiedades de los parámetros.
- Otras Técnicas de Estimación:
- Seleccione cuál de estas opciones NO es una técnica de estimación apropiada para la modelización en condiciones de cambio estructural: Contraste de Chow. (Nota: El contraste de Chow es una prueba de *detección*, no una técnica de estimación).
- Hipótesis Básicas Estructurales:
- Las hipótesis básicas definidas como estructurales referidas a la matriz X son: Hipótesis de los grados de libertad, de variables linealmente independientes, de variables deterministas.
- Matriz de Varianzas-Covarianzas:
- La presencia de elementos distintos de cero en la matriz de varianzas-covarianzas y de la perturbación aleatoria de un modelo econométrico: Estas matrices siempre tienen elementos distintos de cero. (Nota: Incorrecto. Si no hay autocorrelación ni heterocedasticidad, la matriz es diagonal).
Ejemplos y Casos Prácticos
Dado el siguiente modelo, determine los problemas que podrían surgir con el mismo de cara a la estimación, evaluación y utilización. Proponga algún método de estimación adecuado para este tipo de modelos. Yt = α + B1X1 + B2Yt-1 + ut
Aparece una endógena desplazada, por lo que nos encontramos con el caso de regresores estocásticos. Las consecuencias de incluir regresores estocásticos no serán ninguna si la matriz X es independiente del vector B y de Ut. Si no se cumplen estas condiciones, los estimadores serán sesgados e inconsistentes. La solución sería la utilización de variables instrumentales.
Dados los siguientes modelos econométricos estimados por MCO, con n = 25 y t = 0.2.08. Sabiendo que en ambos modelos no hay problema de cambio estructural, heterocedasticidad, ni autocorrelación, ¿gozarán los estimadores de las propiedades de insesgadez, consistencia y eficiencia? ¿Qué modelo escogería para realizar predicciones? ¿Y para análisis estructural?
- Estimación 1: Yt = 450 – 7.02×1 – 0.92×2 + 5.3×3 + ut (|0.7| < 2.08 No Sig, |1.1| < 2.08 No Sig, |2.8| > 2.08 Sig). R² ajustado = 0.989
- Estimación 2: Yt = 435 – 1.35×1 + 1.97×2 + ut (2.5, -3.1, 2.9). R² ajustado = 0.822
Se observa en el modelo (1) un R² muy alto y unos t muy bajos, lo que puede sugerir un problema de multicolinealidad. Por lo tanto, los estimadores serán insesgados y consistentes, pero perderán eficiencia. En el modelo (2) observamos unos t más altos y un R² más bajo. Para realizar predicciones, utilizaríamos el modelo (1), ya que tiene el R² más alto y, por lo tanto, explica mejor el modelo. Para el análisis estructural, el modelo (2) es preferible al tener variables más significativas.
Procedimientos Específicos
¿Qué procedimientos utilizarías para estimar un modelo econométrico Yt = XtB + ut en el que el término de error tiene el siguiente comportamiento: Ut = ρut-1 + εt?
- Si la matriz Ω es conocida, aplicamos MCG: B = (X´Ω⁻¹X)⁻¹X´Ω⁻¹Y.
- Si es desconocida, se aplicará MCGF (Mínimos Cuadrados Generalizados Factibles) por diferentes métodos:
- Cochrane-Orcutt: Proceso iterativo que permite estimar el valor del parámetro de autocorrelación desconocido ρ.
- Hildreth-Lu: Proceso exploratorio o de rastreo, en el que ρ puede tomar valores entre -1 y 1.
- Durbin en 2 pasos: Se especifica un modelo transformado, se estima por MCO y se obtiene ρ utilizando esta estimación en una segunda etapa.
Detección y Solución de Problemas Específicos
Explique cómo se detecta la multicolinealidad: Estadísticos t bajos, R² y F altos, sensibilidad a los cambios en la muestra y en la inclusión de variables, a través del coeficiente de correlación lineal (si r²ij > R², colinealidad grave).
Explique los diferentes procedimientos para detectar el problema de multicolinealidad imperfecta y señale 3 formas para solucionar el problema:
La multicolinealidad imperfecta se da cuando el rango de X = k, pero el determinante está muy cerca de 0. Esto indica que las variables explicativas guardan relación entre sí. Formas de detectar el problema:
- Si los estadísticos t son bajos y R² y F son altos.
- Alta sensibilidad a los cambios de la muestra y al cambio de variable.
- A través del coeficiente de correlación lineal: si R²ij > R² → Problemas de colinealidad grave.
Formas de solucionarlo:
- Aumentar el número de datos (con el inconveniente de que puede provocar cambio estructural).
- Disminuir el número de variables (la estimación por MCO será sesgada y, además, existe una relación con la varianza del estimador).
- Hacer estimación por regresión cresta (método alternativo).
- No hacer nada, convivir con el problema, aceptarlo y vigilar sus consecuencias.
Explique la problemática específica del problema de cambio estructural en la modelización:
Hipótesis de partida: Los Bj asociados a cada variable exógena son únicos y válidos para representar la relación entre la variable Y y cada una de las variables exógenas. Si la hipótesis de permanencia se incumple, se habla de cambio estructural.
Causas:
- Cambio de sistema (trabajamos con series temporales o datos de corte transversal).
- Errores de especificación (forma funcional incorrecta, omisión de variables relevantes).
Consecuencias: Estimadores sesgados, inconsistentes e ineficientes. Se detecta con el test de Chow (confirma la sospecha de cambio estructural).
Soluciones:
- Discreta (Switching Regression): Un modelo para cada submatriz e introducir variables ficticias.
- Continua: Modelo tipo explicativo del cambio estructural y modelo de coeficientes aleatorios.