Introducción a la Inferencia Estadística
Parámetros y Estadísticos
La **inferencia estadística** se encarga de obtener conclusiones sobre una **población** a partir de la información de una **muestra**. Para ello, se utilizan conceptos clave como **parámetros** y **estadísticos**.
- Parámetro: Es una medida que describe una característica de la población. Por ejemplo, la media de la altura de todos los estudiantes de una universidad.
- Estadístico: Es una medida que describe una característica de la muestra. Por ejemplo, la media de la altura de una muestra de 100 estudiantes de la universidad.
Estimadores Puntuales
Un **estimador puntual** es un valor que se utiliza para aproximar un parámetro poblacional desconocido. Por ejemplo, la media muestral puede utilizarse como estimador puntual de la media poblacional.
Criterios para Elegir un Estimador
Al elegir un estimador, se deben considerar los siguientes criterios:
- Insesgamiento: Un estimador es insesgado si su valor esperado es igual al parámetro que se está estimando.
- Eficiencia: Un estimador es eficiente si tiene una varianza menor que otros estimadores.
- Constancia: Un estimador es constante si su valor no cambia significativamente al aumentar el tamaño de la muestra.
- Suficiencia: Un estimador es suficiente si contiene toda la información relevante de la muestra sobre el parámetro que se está estimando.
Error Cuadrático Medio (ECM)
El **error cuadrático medio (ECM)** es una medida de la precisión de un estimador. Se calcula como la suma de la varianza y el sesgo al cuadrado.
Estimación por Intervalos
La **estimación por intervalos** proporciona un rango de valores dentro del cual se espera que se encuentre el parámetro poblacional. Este rango se conoce como **intervalo de confianza**.
- Intervalo de confianza: Es un rango de valores que tiene una probabilidad determinada de contener el parámetro poblacional.
- Nivel de confianza: Es la probabilidad de que el intervalo de confianza contenga el parámetro poblacional. Se suele expresar como un porcentaje (por ejemplo, 95%).
Fórmulas para Calcular Intervalos de Confianza
Existen diferentes fórmulas para calcular intervalos de confianza, dependiendo de la información disponible:
- Si se conoce la media muestral y la varianza poblacional, se utiliza la distribución normal estándar.
- Si se conoce la media muestral y se desconoce la varianza poblacional, se utiliza la distribución t de Student.
- Si se conoce la media muestral, la varianza poblacional, el tamaño de la muestra y el tamaño de la población, se utiliza la distribución normal estándar con una corrección por finitud.
Contraste de Hipótesis
El **contraste de hipótesis** es un proceso estadístico que permite determinar si hay evidencia suficiente para rechazar una hipótesis nula. La hipótesis nula es una afirmación sobre el parámetro poblacional que se quiere refutar.
Tipos de Hipótesis
- Hipótesis nula (H0): Es la hipótesis que se quiere rechazar. Se asume que es verdadera hasta que se demuestre lo contrario.
- Hipótesis alternativa (Ha): Es la hipótesis que se quiere aceptar si se rechaza la hipótesis nula.
Tipos de Contraste de Hipótesis
- Contraste unilateral: Se busca determinar si el parámetro poblacional es mayor o menor que un valor específico.
- Contraste bilateral: Se busca determinar si el parámetro poblacional es diferente de un valor específico.
Región de Rechazo
La **región de rechazo** es el conjunto de valores del estadístico de prueba que llevan a rechazar la hipótesis nula. Se determina en función del nivel de significación.
Prueba de Contraste
Una **prueba de contraste** es un procedimiento estadístico que se utiliza para determinar si se rechaza o no la hipótesis nula. Se basa en el cálculo del estadístico de prueba y la comparación con el valor crítico.
Tipos de Errores
En el contraste de hipótesis, se pueden cometer dos tipos de errores:
- Error tipo I: Rechazar la hipótesis nula cuando es verdadera.
- Error tipo II: No rechazar la hipótesis nula cuando es falsa.
Muestreo
El **muestreo** es el proceso de seleccionar una muestra de una población. El objetivo es obtener una muestra que sea representativa de la población.
Tipos de Muestreo
- Muestreo probabilístico: Cada elemento de la población tiene una probabilidad conocida de ser seleccionado.
- Muestreo no probabilístico: La selección de los elementos de la muestra no se basa en la probabilidad.
Tipos de Muestreo Probabilístico
- Muestreo aleatorio simple: Cada elemento de la población tiene la misma probabilidad de ser seleccionado.
- Muestreo estratificado: La población se divide en estratos y se selecciona una muestra aleatoria de cada estrato.
- Muestreo por conglomerados: La población se divide en conglomerados y se selecciona una muestra aleatoria de conglomerados.
Tipos de Muestreo No Probabilístico
- Muestreo por conveniencia: Se seleccionan los elementos de la muestra que son más fáciles de acceder.
- Muestreo por cuotas: Se seleccionan los elementos de la muestra de acuerdo a ciertas características predefinidas.
- Muestreo bola de nieve: Se seleccionan los elementos de la muestra a través de recomendaciones de otros participantes.
Error de Muestreo
El **error de muestreo** es la diferencia entre el valor del estadístico de la muestra y el valor del parámetro poblacional. Se puede dividir en dos tipos:
- Error sistemático: Se produce debido a un sesgo en el proceso de selección de la muestra.
- Error aleatorio: Se produce debido a la variabilidad aleatoria de la muestra.
Error Estándar de Estimación
El **error estándar de estimación** es una medida de la variabilidad de la distribución muestral del estadístico. Se utiliza para calcular intervalos de confianza.