Diferencia entre Parámetro y Estadístico
Un parámetro es la medición de un valor aplicado a una población, mientras que un estadístico es la medición de un valor aplicado a una muestra.
Estimador Puntual
Un estimador puntual es un valor que nos permite tener una aproximación de un valor poblacional.
Criterios para Considerar el Uso de un Estimador
- Insesgamiento: Capacidad del estimador para ofrecernos valores cercanos al verdadero valor del parámetro.
- Eficiencia: Grado en que el estimador se acerca al valor real que se está midiendo.
- Consistencia: Capacidad del estimador para mantener valores similares en cálculos diferentes o sucesivos.
- Suficiencia: Capacidad del estimador para describir la característica de la población que se está estimando.
Error Cuadrático Medio (ECM)
El ECM parte del supuesto de que si la tendencia de los valores es pequeña, se espera que las diferencias entre ellos también lo sean.
Valor Cuadrático Medio
El valor cuadrático medio nos permite saber si un valor es esperado para el estimador.
Estimación por Intervalo
La estimación por intervalo consiste en calcular los valores de un intervalo entre los que se encuentra el valor del parámetro poblacional. Este intervalo se define por un límite inferior y un límite superior, y hace referencia a un valor de probabilidad.
Elementos de la Estimación por Intervalos
- Intervalo de confianza
- Nivel de confianza = 1 – alfa
- Alfa = Nivel de significación
Fórmulas para el Intervalo de Confianza
- Cuando se conoce la media muestral y la varianza, se utiliza el valor Z de la tabla de distribución normal para el nivel de confianza deseado.
- Cuando se conoce el tamaño de la muestra (n) y la media muestral, pero se desconoce la varianza poblacional, se asume la varianza muestral como si fuera la poblacional.
- Cuando se conoce la media muestral, la varianza poblacional, el tamaño de la población (N) y el tamaño de la muestra (n).
Intervalo de Confianza
El intervalo de confianza está formado por los valores entre los cuales se estima que se encuentra el valor del parámetro poblacional desconocido. Se espera que este intervalo incluya el parámetro poblacional.
Ejemplo:
M = ? (Se desconoce el valor de la media muestral). Este valor puede estar en el intervalo [X1, X2].
Nivel de Confianza
El nivel de confianza es el valor de probabilidad de que el parámetro desconocido se encuentre en el intervalo de confianza.
Ejemplo:
Si el nivel de confianza es del 95%, significa que en el 95% de los casos, el intervalo de confianza contendrá la media poblacional.
Contraste de Hipótesis
El contraste de hipótesis es un proceso de toma de decisiones que permite verificar la veracidad de una hipótesis establecida sobre una población. Se busca determinar si los valores de la muestra difieren significativamente de los valores esperados en la hipótesis o si son producto del azar.
Tipos de Hipótesis
- Hipótesis nula (Ho): También conocida como hipótesis de no diferencia, es la que se busca rechazar.
- Hipótesis alternativa o de investigación (Ha): Es complementaria a la hipótesis nula.
La contrastación se realiza asumiendo que la hipótesis nula es verdadera.
Tipos de Hipótesis Nula
- Bilateral o de dos colas: La zona de rechazo puede ocurrir hacia un lado o hacia el otro de la distribución. La diferencia ocurriría obteniendo un valor mayor o menor que el valor esperado.
- Unilateral o de una sola cola:
- Hipótesis unilateral superior o con cola hacia la derecha: La zona de rechazo se encuentra en la cola derecha de la distribución. Se rechaza la hipótesis nula si el valor obtenido es mayor o igual que el valor crítico.
- Hipótesis unilateral inferior o con cola hacia la izquierda: La zona de rechazo se encuentra en la cola izquierda de la distribución. Se rechaza la hipótesis nula si el valor obtenido es menor o igual que el valor crítico.
Región de Rechazo
La región de rechazo o región crítica de la distribución contiene los valores menos favorables a la hipótesis nula. El límite entre la región de rechazo y la región de no rechazo se denomina valor crítico, que se determina en función del nivel de significación establecido.
Prueba de Contrastación
La prueba de contrastación o comparación estadística se realiza en tres pasos:
- Seleccionar el estadístico a medir.
- Calcular el estadístico con base en la muestra.
- Tomar la decisión de rechazar o no la hipótesis nula.
Tipos de Error
Al realizar un contraste de hipótesis, existe la posibilidad de cometer dos tipos de errores:
- Error tipo I: Se rechaza la hipótesis nula cuando en realidad es verdadera.
- Error tipo II: No se rechaza la hipótesis nula cuando en realidad es falsa.
La probabilidad de cometer un error tipo I se conoce como nivel de significación (alfa). La probabilidad de cometer un error tipo II se denota con beta (β). El objetivo es minimizar ambos tipos de errores.
Potencia de la Prueba
La potencia de la prueba (1-β) indica la capacidad de rechazar una hipótesis nula falsa. Cuanto menor sea β, mayor será la potencia de la prueba.
Muestreo
El muestreo es el proceso de seleccionar una muestra representativa de una población. El tamaño de la muestra (n) es un factor importante en la precisión de las estimaciones.
Error de Muestreo
El error de muestreo se produce cuando las características de la población no están representadas adecuadamente en la muestra.
Error Sistemático
El error sistemático se debe a problemas en el diseño o la ejecución del muestreo. Puede reducirse con una buena selección de la muestra.
Divergencia al Azar
La divergencia al azar se produce al seleccionar elementos inusuales o poco representativos de la población. Se puede reducir aumentando el tamaño de la muestra.
Tipos de Muestreo
Muestreo Probabilístico
En el muestreo probabilístico, todos los elementos de la población tienen una probabilidad conocida de ser seleccionados.
- Muestreo aleatorio simple: Cada sujeto de la población tiene la misma probabilidad de ser seleccionado.
- Muestreo aleatorio estratificado: La población se divide en estratos o grupos con características similares, y se selecciona una muestra aleatoria de cada estrato.
Muestreo No Probabilístico
En el muestreo no probabilístico, la selección de la muestra no se basa en la probabilidad. Se utiliza principalmente en estudios exploratorios.
- Muestreo por conveniencia: La muestra está formada por los sujetos más accesibles al investigador.
- Muestreo voluntario: Los sujetos deciden voluntariamente participar en el estudio.
- Muestreo en bola de nieve: Se comienza con un pequeño grupo de sujetos, que a su vez recomiendan a otros sujetos para participar en el estudio.
- Muestreo por disponibilidad por condiciones particulares: Se seleccionan sujetos que cumplen con características específicas para el estudio.
Error Estándar de Estimación
: diferencia entre la media poblacional y la media estándar. Se asume como igual a la desviación típica de la distribución.