Contrastes de Hipótesis: Fundamentos y Metodología

Los intervalos de confianza se utilizan para estimar parámetros y los contrastes o test de hipótesis para tomar decisiones acerca de características poblacionales. Las hipótesis son conjeturas sobre algún aspecto concreto de la realidad, el proceso de contrastación conducirá al investigador a una conclusión sobre la veracidad o falsedad de las mismas. Para contrastar una hipótesis se deben comparar los resultados esperados (deducciones teóricas) con la evidencia empírica. Una hipótesis estadística es cualquier afirmación, verdadera o falsa, sobre alguna característica desconocida de la población.

Si la hipótesis se refiere al valor de un parámetro desconocido θ de la población, se dice que se trata de un contraste paramétrico, pero si la hipótesis se refiere a otra cuestión, como la forma que tiene la función de cuantía o de densidad f(x; θ) de la población, entonces hablaremos de contraste no paramétrico. Se admite que es conocida la forma funcional de la función de cuantía o de densidad de la población, f(x; θ), en donde θ es un parámetro desconocido, que toma valores dentro del espacio paramétrico Ω, el cual contiene, al menos dos puntos.

Para el planteamiento general del contraste de hipótesis paramétrico, se parte de una población cuya función de cuantía o de densidad f(x; θ) depende de un parámetro θ desconocido, que toma valores dentro de un espacio paramétrico Ω. Formulamos una hipótesis que consiste en hacer θ= θy con la ayuda de una muestra aleatoria procedente de la población, se obtiene el estimador puntual θ(X) que es utilizado para inferir o determinar si la hipótesis formulada, que el valor es rechazada o no rechazada (no rechazada supone aceptada), examinando la discrepancia entre estimador e hipótesis.

En el contraste de hipótesis estadísticas siempre se acepta, provisionalmente, una hipótesis como verdadera, que es la hipótesis nula, y que es sometida a comprobación experimental frente a otra hipótesis complementaria que se denomina hipótesis alternativa. Como consecuencia de la comprobación experimental, la hipótesis nula podrá seguir siendo aceptada como verdadera o, por el contrario, se tiene que rechazar y aceptar como verdadera la hipótesis alternativa.

Para un planteamiento más concreto se debe distinguir entre diferentes tipos de hipótesis paramétricas. Consideremos 2 tipos de hipótesis: simples y compuestas.

Se dice que una hipótesis es simple si se refiere a un solo valor del parámetro, es decir, a un solo punto del espacio paramétrico, quedando totalmente especificada la forma de la función de cuantía o de densidad de la población al conocer ese valor del parámetro. Si la hipótesis no se refiere a un punto del espacio paramétrico o valor del parámetro, sino que se refiere a una región del espacio paramétrico, se dice que se trata de una hipótesis compuesta.

Tipos de Hipótesis

  • La Hipótesis Nula: es la que contrastamos (fácil de identificar y comprobar), los datos pueden refutarla, aparentemente más verosímil (no debería ser rechazada sin una buena razón por ser «neutra o nula»), la que se acepta si las pruebas no indican lo contrario, rechazarla por error tiene graves consecuencias, posee simplicidad científica (fácil de identificar y comprobar).
  • La Hipótesis Alternativa: es la que niega a la Hipótesis Nula (complementaria considerando los valores posibles o preestablecidos del parámetro desconocido), los datos pueden mostrar evidencia a favor, no debería ser aceptada sin una gran evidencia a favor, rechazarla por error tiene consecuencias consideradas menos graves que la anterior.

Metodología del Contraste

Región Crítica y Región de Aceptación

La región crítica (RC o C) está constituida por el conjunto de muestras para las cuales se rechaza la hipótesis nula. La región de aceptación (RA o A) está constituida por el conjunto de muestras para las cuales se acepta la hipótesis nula. El valor o valores que separan la región crítica de la región de aceptación reciben el nombre de valor o valores críticos.

Hipótesis, Decisiones y Errores

En el contraste de hipótesis, basándose en la información proporcionada por la muestra, se tiene que decidir si se acepta la hipótesis nula o si se rechaza. La decisión siempre se toma sobre la hipótesis nula y la consecuencia se deriva sobre la Hipótesis Alternativa (si no rechazo la nula no admito la alternativa y si rechazo la nula admito la alternativa), existiendo un riesgo de equivocarnos que nos llevará a los errores de tipo I y de tipo II.

  • Si se rechaza la hipótesis nula cuando es verdadera, se comete un error, que se llama error de tipo I.
  • Si se acepta la hipótesis nula cuando es falsa, se comete un error, que se llama error de tipo II.
  • Si rechazamos la hipótesis nula cuando es falsa, la decisión es correcta y no hay error.

Es necesario dar una medida de la posibilidad o del riesgo de cometer estos dos tipos de errores. Estas medidas son probabilidades y se denotan por α y β, siendo:

  • α = Riesgo de error de tipo I = P (Error de tipo I) = P (Rechazar HN/ HN es cierta)
  • β = Riesgo de error de tipo II = P (Error de tipo II) = P (Aceptar HN/ HN es falsa)

Si los errores de tipo I y de tipo II son nulos, α=β=0, entonces decimos que el test o contraste es ideal. Cuando se estudian los intervalos de confianza, se dice que 1-α es el nivel de confianza, y ahora se puede decir que representa el complemento de la P(error de tipo I), siempre y cuando el test sea bilateral, es decir: Nivel de confianza = 1-α =1-P(error de tipo I)=P(aceptar HN/ HN es cierta).

Si tenemos un contraste bilateral con hipótesis nula simple, se verifica que si el intervalo de confianza al nivel 1- α contiene al valor dado por HN entonces la muestra está en la región de aceptación del contraste de tamaño α.

Otro concepto fundamental es el de potencia del test o del contraste: 1-beta, que indica el poder o potencia que tiene el contraste para reconocer correctamente que la hipótesis nula es falsa y por tanto sería rechazada. Así pues, siempre se desea un contraste con una potencia grande, próxima a la unidad, o lo que es igual, un valor de β muy pequeño cuando HN es falsa. Dados dos contrastes (dos estadísticos de discrepancia), fijado el mismo nivel de significación (probabilidad de error tipo I) se elige el de menor probabilidad de error tipo II (más potencia). Con una medida de discrepancia y para un tamaño muestral fijo, no se pueden reducir a la vez ambos tipos de error. Fijado α, para reducir β, hay que aumentar el tamaño muestral.

Metodología del Contraste:

El contraste debe plantearse antes del muestreo. Si las hipótesis son sobre parámetros (media, varianza, proporción u otros) el contraste se denomina contraste paramétrico. Comparo creencia teórica (hipótesis nula) y muestra (estadístico estimador). Si las diferencias son «grandes» rechazo hipótesis nula (incoherencia entre hipótesis y muestra) y si las diferencias son «pequeñas» no rechazo hipótesis nula (no incoherencia entre hipótesis y muestra). Las diferencias son «grandes» o «significativas» según el error que considero admisible (hay variabilidad en muestreo) ya que las discrepancias pueden ser o no atribuidas al azar. Se debe indicar a priori el grado de evidencia necesario para rechazar la hipótesis nula. La hipótesis nula nunca se considera probada, sólo puede ser rechazada por los datos (información muestral).

Este procedimiento se detalla en los siguientes pasos:

  1. Formular la hipótesis nula y la hipótesis alternativa en términos estadísticos: las hipótesis deben ser mutuamente excluyentes, y deben ser formuladas de tal manera que el verdadero valor del parámetro poblacional esté incluido en la hipótesis, no siendo posible que no esté incluido en ninguna y ambas hipótesis sean falsas.
  2. Determinar medida de discrepancia o test estadístico o estadístico de prueba apropiado: su función de probabilidad debe ser conocida cuando se supone que la hipótesis nula es cierta, debe contener el valor del parámetro que está siendo contrastado, y los restantes términos que intervienen deben ser conocidos o se pueden calcular a partir de la muestra.
  3. Seleccionar el nivel de significación α que implica nivel admisible de discrepancia: Es deseable que α tome el menor valor posible para tener una menor probabilidad de rechazar una hipótesis nula cuando es cierta. El valor del nivel de significación α, indica la importancia o significado que el investigador atribuye a las consecuencias asociadas rechazando incorrectamente la hipótesis nula.
  4. Determinar la región crítica o región de rechazo: El conocimiento de la región crítica nos permitirá decidir si se acepta o rechaza la hipótesis nula, en función del valor del estadístico de prueba elegido y del valor de significación α fijado.
  5. Seleccionar la muestra y calcular el valor del estadístico de prueba.
  6. Dar la regla de decisión y su interpretación: Si el valor calculado del test estadístico o estadístico de prueba cae dentro de la región crítica, entonces la hipótesis nula se rechaza.
  7. Obtener el p-valor e interpretarlo: Se debe obtener el p-valor para valorar la evidencia aportada por la muestra. Se compara con el nivel de significación si se ha dado o con los valores “recomendados” para comprobar la credibilidad de la hipótesis nula.

Relación entre Contraste, Nivel de Significación, Región Crítica y Nivel Crítico

Tal como ya se ha comentado, contrastar una hipótesis es probar o testear la coherencia entre predicciones teóricas (hipótesis) y datos observados (muestra) sobre la población. Si hay variabilidad o errores de medida el contraste debe ser «estadístico». El contraste debe plantearse antes del muestreo. Si las hipótesis son sobre parámetros (media, varianza, proporción u otros) el contraste se denomina contraste paramétrico. Elementos importantes y relacionados con el contraste son: Nivel de Significación, Región Crítica y Nivel Crítico “p” (p-valor o Significación).

El Nivel de Significación se puede emplear para obtener la Región Crítica (en los Contrastes de Significación). Es la probabilidad de rechazar HN(muestra en RC) cuando hipo nula es cierta. Es fijado de a priori por el investigador mediante un número pequeño (1%, 5%) al diseñar el experimento según opinión a priori de HN y según las consecuencias de equivocarnos. Conocido α se sabe todo sobre la región crítica. Puede ser la referencia para comparar con el p-valor experimental.

Región Crítica son los resultados experimentales que refutarían HN. Con el contraste el Espacio muestral se divide en RC y RA. Los resultados asociados a la RC son valores muy improbables si HN cierta. Se obtiene tras fijar el nivel de significación (probabilidad del error tipo I) y debe ser conocida a priori del experimento. La RA (complementaria a RC) incluye los resultados experimentales que no refutarían HN.

El Nivel Crítico “p” (p-valor o Significación) se puede definir e interpretar de varias formas equivalentes.

  • Probabilidad de obtener una discrepancia mayor o igual que la observada en la muestra cuando HN es cierta, siendo el valor “p” conocido después de realizar el experimento aleatorio (tras obtener muestra ya que es un valor “experimental” o “empírico”).
  • Probabilidad de que por puro azar se obtenga una muestra “más extraña” que la obtenida.
  • Probabilidad de una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra, supuesta HN cierta.

Cuanto menor sea «p» menor es la credibilidad de HN. El contraste es no significativo (no rechazo HN o admito HN) cuando p>α. Es decir, si el resultado experimental discrepa menos de “lo tolerado” a priori. Cuanto mayor sea «p» mayor es la credibilidad de HN. El contraste es estadísticamente significativo (rechazo HN o admito HA) cuando p<α. Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori. Cuanto menor sea «p» menor es la credibilidad de HN. El Nivel Crítico “p” (p-valor o Significación) es conocido tras realizar el experimento y conocido “p” se sabe todo sobre el resultado del experimento ya que permite valorar la evidencia aportada por la muestra.

La decisión sobre rechazo o aceptación de HN depende: de la opinión a priori de su validez, de las consecuencias de una equivocación y de la evidencia aportada por la muestra. Por ello, tras fijar el Nivel de Significación el contraste es significativo (rechazo de HN) si la muestra pertenece a RC o si “p” menor que “α”. En cambio, si “α” no fijado Rechazo HN si “p” menor que 0,01 (orientativo) y No Rechazo HN si “p” mayor que 0,25 (orientativo).

Además, si se decide rechazar una hipótesis debemos mostrar la probabilidad de equivocarnos: rechazar una hipótesis nula no prueba que sea falsa ya que se puede cometer error de tipo I y no rechazar una hipótesis nula no prueba que sea cierta ya que se puede cometer error de tipo II.

Finalmente, rechazar siempre la hipótesis nula cuando se obtiene un contraste significativo puede ser una conclusión absurda en muestras grandes (de forma práctica las diferencias pueden ser pequeñas). Se debe calcular el mejor estimador según los datos y analizar si la diferencia con la hipótesis nula es pequeña o despreciable (según instrumentos de medida y naturaleza del problema). Igualmente, aceptar siempre la hipótesis nula cuando se obtiene un contraste no significativo puede ser una conclusión absurda si muestra pequeña, la población heterogénea, el contraste es poco potente o si a priori la hipótesis nula es poco verosímil. Resumiendo, se debe analizar la capacidad de discriminación del contraste (no sólo aplicación mecánica) mediante estimación de parámetros y estudio de la potencia.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.