Contrastación de Modelos
3.1 Interpretación de los Parámetros Estimados
Equivalencia entre signo esperado y signo estimado: El primer contraste elemental de todo parámetro es que su signo corresponda con el que cabe esperar a priori por los conocimientos teóricos sobre relaciones entre variables.
Interpretación de los parámetros estimados: Una vez estimados los parámetros del modelo, los valores obtenidos nos deberán indicar la importancia relativa de la variable a que afectan en el comportamiento de la variable endógena. La interpretación “intuitiva” de los estimadores MCO en la regresión múltiple ¿Qué representa un parámetro estimado β? Si imaginamos una ecuación estimada con dos variables exógenas más un término independiente, el modelo estimado seria:
Interpretación de los parámetros cuando en el modelo intervienen variables en logaritmos: En muchas ocasiones, las variables implicadas en el modelo (exógenas, endógenas o ambas) vienen expresadas en logaritmos, lo que puede ser debido, entre otras, a las siguientes causas:
- Algunas veces, el modelo teórico original es una forma no lineal, que se convierte fácilmente en lineal escribiendo la expresión en logaritmos. Es el clásico ejemplo de una función de producción, en la que la expresión lógica (debido a la ley de rendimientos decrecientes) es una función potencial:
- En otras ocasiones, la fuerte volatilidad de alguna de las variables (explicativas o explicada) hace recomendable escribir esta en logaritmos para observar mejor su relación en el modelo (como es bien sabido, la transformación logarítmica alisa el comportamiento de una variable, reduciendo su varianza).
- La forma en la que se introducen las variables en el modelo modifica el modo en el que se interpretan sus parámetros asociados debido al cambio de “unidades” que se está produciendo.
Matemáticamente, la diferencia de logaritmos es muy similar, para cambios pequeños, a la tasa de crecimiento entre dos momentos determinados. Cuando ambas variables (endógena y exógena) están escritas en logaritmos, la interpretación es la clásica en teoría económica: los parámetros representan la elasticidad entre ambas variables o, dicho de otro modo, el cambio porcentual en “y” cuando se produce un aumento del 1% en la variable “x”.
Elasticidad=y/x=β2 = (∆y/y)/(∆x/x) → ∆y/y=β2 (∆x/x) → log(y)=β2 log(x)
Casos de interpretación:
Interpretación del término constante β0: En un modelo econométrico es siempre recomendable incluir un término constante tanto para lograr un mejor ajuste en la curva de regresión estimada como para obtener una mejor interpretabilidad de indicadores de ajuste como, por ejemplo, la R2 cuadrado. Matemáticamente, la inclusión del término constante nos permite que el origen de la curva de ajuste no parta necesariamente del punto (0,0) en los ejes de coordenadas, lo que casi siempre dará lugar a un mejor ajuste.
Resumen:
- Los parámetros estimados en un modelo básico de regresión lineal en el que no se han excluido variables relevantes correlacionadas con las si incluidas, representan el cambio en la variable endógena “Y” aislado de los efectos que el resto de las variables tienen sobre ésta.
- El término constante de la regresión solo tendrá una interpretación económica en la medida en la que todas las variables explicativas empleadas para la estimación puedan tomar valor cero al mismo tiempo y, de hecho, lo tomen en alguna ocasión en la muestra utilizada
- Cuando las variables que intervienen en la regresión lo hacen en logaritmos, su intervención se relaciona con las elasticidades o con crecimientos porcentuales.
Ejemplos:
PRECIO VIVIENDA
Modelo: Pi = β0 + β1 SQFT + β2 BEDROM +β3 BATH+μ
- El coeficiente β0: Es el valor medio esperado de aquellas viviendas que no tienen ningún metro cuadrado de área habitable, ni habitaciones ni baños.
- El coeficiente β1: Considerando dos casas con el mismo número de habitaciones y de baños, para aquella casa que tenga un metro cuadrado más de área habitable, se espera que cambie en media su precio de ventas en β1 miles de euros.
- El coeficiente β2: Considerando dos casas con el mismo número de metros cuadrados de área habitable y número de baños, para aquella casa que tenga una habitación más, se espera que cambie en media su precio de venta en β2 miles de euros.
- El coeficiente β3: Considerando dos casas con el mismo número de metros cuadrados de área habitable y número de habitaciones, para aquella casa que tenga un baño más, se espera que cambie en media su precio de venta en β3 miles de euros
VENTAS DE TABACO:
Modelo: ln(Vi) = β0 + β1 ln(Pi) + β2 ln(GCi) +β3ln(GPi)+μ donde V es Ventas de las principales tabacaleras P es precio, GC es Gastos en publicidad de cine, radio y televisión y GP Gastos en publicidad en prensa escrita y vallas publicitarias
La interpretación económica de β1 es la elasticidad estimada de las ventas de cigarrillos con respecto al precio de los mismos. Es decir
Por tanto, ya que β1 = −0,3, un incremento de un 1% en el precio del cigarrillo hará disminuir las ventas en un 0,30%, dejando fijos el resto de factores que afectan a las ventas. La interpretación del resultado de este contraste es que las elasticidades de las ventas con respecto a gastos en publicidad de distinto tipo no son estadísticamente iguales. Es decir, la eficacia de la publicidad en cine, televisión y radio es distinta a la eficacia que tiene el gasto en publicidad en prensa y vallas publicitarias. En esta muestra, es más eficaz gastar en prensa y vallas publicitarias dado que el valor estimado de esta elasticidad es de 1,45 frente al valor de la otra elasticidad (0,04).
EJ 3: DEMANDA EN FUNCIÓN DE RENTA Y PRECIO
DEMANDA=β0 + β1 RENTA + β2 PRECIOS + μ Y es la demanda, X1.i renta del consumidor X2.i precio del bien
La interpretación de los parámetros corresponde al número de unidades que varía en media Y cuando la variable X varía en una unidad, permaneciendo el resto de variables constantes. El término β0 se interpreta como el pronóstico de la demanda (Y) cuando las X se anulan
Observaciones (1): El valor de los parámetros estimados dependen directamente de la unidad de medida de las variables explicativas. Es decir, si los valores de variable i se multiplica por el factor w, el correspondiente parámetro se verá reducido en la misma proporción (w) y viceversa: Ejemplo: Si se multiplica la variable Renta por w=1/1000, el valor del nuevo parámetro será como se muestra a continuación:FOTO
Observaciones (2): En cambio si los valores de variable dependiente (Y) se dividen por el factor w, todos los parámetros se verán reducido en la misma proporción (w) y viceversa. Ejemplo: Si se multiplica la variable Demanda por w=1/1000, el valor de los parámetros será como se muestra a continuación: FOTO
EJ 4: DEMANDA EN FUNCIÓN DE RENTA Y PRECIO LN.
ln(DEMANDA)=β0 + β1 ln(RENTA) + β2 ln(PRECIOS) + μ
La interpretación de los parámetros se efectúa en términos de elasticidades, lo que supone que cuando la variable i se modifica en 1%, la variable dependiente cambia en β1, permaneciendo el resto de variables constantes.
3.2 Contraste de significación individual de un parámetro:
Prueba t-student:
Se podría pensar en trabajar con los coeficientes estandarizados y no realizar el contraste de hipótesis, sin embargo este hecho no garantiza que aquél cuyo valor se aproxime a cero indique ausencia real de esta variable en la explicación de la variable dependiente. Por tanto se tendrá que tomar en cuenta la distribución estadística del estimador así como su dispersión. Retomando las propiedades de los parámetros y considerando que éstos son una función lineal de la perturbación aleatoria, se concluye que son de igual modo una variable aleatoria que seguirán una distribución del tipo:
Dado que se desconoce el verdadero valor de la varianza de la perturbación aleatoria no es conveniente emplear la distribución normal para el cálculo de contrastes estadísticos y de intervalos de confianza. En su lugar ai,j se empleará la distribución t de Student como alternativa, ya que no presenta este inconveniente.
Por tanto partiendo de la expresión tipificada (Z) de los parámetros (restada su media y divididos por su desviación típica) se puede obtener la siguiente expresión:
Por tanto partiendo de la expresión tipificada (Z) de los parámetros (restada su media y divididos por su desviación típica) se puede obtener la siguiente expresión:
El estadístico resultante sigue una distribución t de Student con n-k grados de libertad. Por tanto, en la práctica al utilizar el estimador insesgado de la perturbación aleatoria se concluyen que los parámetros se distribuyen como una t-student con n-k grados de libertad.