Preguntas de Estadística Resueltas
Este documento presenta una serie de preguntas de estadística con sus respectivas respuestas, cubriendo diversos temas clave en el campo de la inferencia estadística. Se incluyen conceptos como contraste de hipótesis, intervalos de confianza, muestreo y estimación.
Imaginemos un contraste de hipótesis en el que se rechaza la hipótesis nula a un nivel de significación del 5%. Si para la misma muestra se plantea idéntico contraste pero el nivel de significación pasa a ser del 1%, elija la afirmación correcta:
No se puede anticipar con seguridad si se aceptará o rechazará la hipótesis nula.
Elija la afirmación correcta sobre el p-valor en un contraste de hipótesis:
Nos proporciona la probabilidad de encontrar una discrepancia entre la muestra y la hipótesis nula ≥ que la que tenemos en la muestra tomada.
El responsable técnico de una fábrica ha efectuado un contraste de hipótesis bilateral sobre la varianza encontrada en la variable número de piezas defectuosas por cada 1000 piezas producidas. Dicha variable se ha comprobado que sigue una distribución normal. El contraste ha proporcionado una región de aceptación para σ al cuadrado consistente en un intervalo [4;9] con un nivel de significación del 5%. Elija la afirmación correcta:
El intervalo de confianza para la desviación típica sería [2;3] para un nivel de confianza del 95%.
En un contraste de hipótesis se ha rechazado la hipótesis nula con un nivel de significación del 5% pero se ha aceptado con un α del 1%. Elija la afirmación correcta:
Ello significa que el p-valor es mayor del 1% y ≤ del 5%.
Elija la afirmación correcta sobre la situación que se plantea en un contraste de hipótesis cuando el nivel de significación se hace más pequeño:
Aumenta la probabilidad de cometer el error de tipo II.
Se lanza 100.000 veces un dado perfecto. Interesa saber la probabilidad de obtener más de 50.000 valores pares (2, 4 ó 6). Elija la afirmación correcta:
0,5
Dada una población normal de media 0 y varianza 9, N(0,3), si se extrae una m.a.s de tamaño 9 ¿Cómo será el comportamiento de la media muestral? Escoger la afirmación correcta:
Una variante de media 0, desviación típica 1 y modelo normal.
Elija la afirmación correcta sobre el muestreo aleatorio simple (con repetición):
Los elementos muestrales son variables aleatorias independientes entre sí.
Elija la opción correcta sobre el objetivo fundamental de la inferencia estadística:
Las tres afirmaciones anteriores son falsas (Las 3 falsas son: Caracterizar una población a través de un censo. Caracterizar una muestra a partir de la población de la que procede. Caracterizar una población a través del estudio exhaustivo de todos sus miembros).
Suponga que un analista pretende construir un intervalo con un nivel de confianza del 100%. Elija las afirmación correcta sobre lo que ocurriría:
La longitud del intervalo sería infinita (máxima).
Los estimadores de máxima verosimilitud tienen buenas propiedades en:
Muestras grandes.
En el contraste sobre la bondad del ajuste elaborado a partir de una Chi Cuadrado de Pearson, elija la afirmación correcta:
Se resuelve como un contraste unilateral por la derecha.
En un contraste de hipótesis se ha aceptado la hipótesis nula con un nivel de significación del 5% pero se ha rechazado con un α del 1%. Elija la afirmación correcta:
Esa situación nunca se puede dar.
Elija la afirmación correcta sobre la probabilidad de aceptar la hipótesis nula siendo falsa en un contraste de hipótesis:
Aumentaría al disminuir la probabilidad de rechazar la hipótesis nula siendo cierta.
Determine la afirmación falsa referida al método de máxima verosimilitud:
Los estimadores máximo verosímiles son siempre insesgados.
Dos investigadores han construido sendos IC sobre el mismo conjunto de datos para la media poblacional, de la que se conoce la desviación típica poblacional, el intervalo del primer investigador es más preciso que el intervalo del segundo, entonces:
El primer investigador ha utilizado un nivel de confianza menor que el segundo.
El gerente de una empresa de transportes quiere ahorrar en el coste mensual que le supone repostar a su flota de camiones en dos estaciones de servicio. Para detectar si existen diferencias significativas en el precio diario del combustible en cada estación de servicio toma una muestra de los dos últimos meses de los precios del mismo. El contraste que realizaría es:
De muestras emparejadas (ó dependientes).
Referido al contraste de Kolmogorov-Smirnov, señale la afirmación cierta:
No se necesitan construir intervalos o grupos y no se pierde información.
Referido al contraste Chi-cuadrado, elegir la afirmación falsa:
Solo es aplicable si la función poblacional se supone continua.
Determine cual de las siguientes afirmaciones es cierta:
Si una hipótesis se rechaza al 2,5% de significación pero no se puede rechazar al 1% significa que entre ambos valores se encuentra el p-valor.
Determine cual de las siguientes afirmaciones es falsa:
Si la hipótesis nula se rechaza frente a la alternativa al 5%, usando los mismos datos se debe rechazar también al 1%.
Dado un problema concreto, se tiene un contraste de hipótesis en el que cuando se ha fijado un nivel de significación α=0,1, se rechaza la hipótesis nula. Elija la afirmación correcta cuando se repita el mismo contraste y con los mismos datos para un nivel de significación de α=0,15:
Se seguirá rechazando la hipótesis nula.
Dada una población normal de media 2 y varianza 1600, si se extrae una m.a.s de tamaño 400, ¿Cuál será el comportamiento de la media muestral? Escoge la afirmación más correcta:
Ninguna de las anteriores es correcta (las 3 falsas: variante de media 2, varianza 2 y modelo desconocido. Variante de media 2, varianza 2 y modelo aproximadamente normal (por el TCL). Variante de media 2, varianza 2 y modelo normal).
Sea una variante suma de 3 chi-cuadrado de 6 grados de libertad cada una, sabemos que la variante suma tiene: Esperanza 18 y desviación típica 6. ¿Por qué los extremos del intervalo de confianza son v.a al plantear la resolución?:
Porque se construye a priori como intervalo probabilístico con extremos aleatorios según variantes asociadas a una m.a.s.
¿Es diferente hacer un contraste paramétrico unilateral hacia la izquierda que hacia la derecha?:
No depende de cómo planteemos la hipótesis.
Para contrastar la bondad de ajuste, teniendo como hipótesis nula el modelo Poisson de parámetro 1,2 y dada una muestra de tamaño n=10; No recomendable o conveniente aplicar ni Kolmogorov-Smirnov ni Chi cuadrado.
En un contraste de hipótesis en el que se ha fijado un nivel de significación α=0.1, elija la afirmación correcta respecto a la situación en la que se rechazará la hipótesis nula:
Si p-valor=0,05.
El contraste de bondad de ajuste chi cuadrado de Pearson para muestras pequeñas (menores de 100 observaciones) no rechazará la hipótesis de normalidad en la práctica totalidad de distribuciones simétricas y unimodales. Elija la afirmación correcta sobre lo que esto quiere decir:
El contraste va a ser poco potente.
Elija la afirmación correcta sobre la m.a.s:
Cuando se efectúa con reemplazamiento los elementos de la muestra son independientes.
Elija la afirmación correcta en relación con los estimadores de máxima verosimilitud:
Solo en muestras grandes se garantiza que sean insesgados, eficientes y que sigan una distribución normal.
Suponga que se ha efectuado una estimación por intervalo, para un nivel de confianza ϒ determinado, sobre la media de una variable normal. Elija la afirmación correcta:
Manteniendo ϒ puedo aumentar la precisión incrementando el tamaño de la muestra.
Elija la afirmación correcta respecto a la situación que se plantea cuando en un contraste de hipótesis se acepta la hipótesis nula:
Es una situación en la que se minimiza la probabilidad de cometer el error de tipo I.
Suponga que se ha efectuado un contraste de hipótesis, habiéndose rechazado la hipótesis nula para un α=1%. Elija la afirmación correcta:
Las 3 respuestas son correctas (esas 3 son: El p-valor del contraste es mayor del 1%. El p-valor del contraste variará en función del nivel de significación. Si el contraste, para la misma muestra, se hubiera efectuado con un α=5% la decisión podría haber sido otra).
Suponga que se quiere efectuar una estimación por intervalo, para un nivel de confianza ϒ determinado, sobre la diferencia de medias de dos poblaciones. Indique en cual de las situaciones siguientes se empleará una distribución t de Student:
Para estimar la diferencia de medias de dos poblaciones normales tomando muestras dependientes.
Elija la afirmación correcta en relación con el contraste de bondad del ajuste de Kolmogorov-Smirov:
Es un contraste unilateral por la derecha.
El contraste de bondad del ajuste chi cuadrado de Pearson para muestras pequeñas se dice que resulta poco potente. Elija la afirmación correcta sobre lo que esto quiere decir:
La probabilidad de cometer el error de tipo II es alta.
X e Y son dos marcas competidoras de refrescos de cola. Si, a partir de sendas muestras, la diferencia en la demanda media diaria entre ambas mu x-mu y, en una región determinada y en miles de litros, para un nivel de confianza del 95% se estima mediante el intervalo [-5;2], elija la afirmación correcta sobre ambas variables, a dicho nivel de confianza:
No existen diferencias significativas entre las ventas de X y las de Y.
Una agencia de viajes ha tomado una m.a.s de tamaño 3 para estimar la proporción p de clientes que encontrarán un viaje al extranjero este verano. El resultado ha sido: (0,1,0), donde el 0 significa que el cliente no viajará y el 1 que si lo hará. Elija la afirmación correcta sobre la estimación de máxima verosimilitud de p:
Vale 0,333.
Elija la afirmación correcta respecto a la medida muestral:
Es el estimador de máxima verosimilitud de la varianza poblacional en una Poisson.
La proporción muestral p* es un estimador de la proporción “p” de una variable dicotómica. En m.a.s grandes distribuye como una variable aleatoria normal en virtud de (elija la afirmación correcta):
El teorema central del límite.
Para obtener estimadores de los parámetros poblacionales se emplea el método de los momentos (MM) y el de máxima verosimilitud (MV), siendo preferible este último debido a (elija la opción correcta):
Los estimadores MV tienen buenas propiedades en muestras grandes.
El servicio de urgencias de un hospital recibe una media de 3 pacientes por minuto. Si se toma una m.a.s de n minutos, elija la opción correcta sobre cada elemento de la muestra:
Sigue aproximadamente una P(λ=3).
Elija la afirmación correcta sobre una variable t Student con n grados de libertad:
No depende de, necesariamente, de la varianza de las variables que la definen.
Suponga que se quiere efectuar un contraste paramétrico para un determinado nivel de significación, dudando entre hacerlo bilateral o unilateral. Elija la afirmación correcta:
El resultado puede que cambie, ya que la región crítica es diferente en un caso y otro.
Si se tiene una población uniforme con primer parámetro desconocido y segundo parámetro igual a diez, U(a,10), y una muestra obtenida por m.a.s. Se plantea estimar por el método de los momentos el parámetro desconocido poblacional “a”. El estimador es media muestral menos (formula rara).
Se lanza 10.000 veces una moneda perfecta, interesa saber aproximadamente la probabilidad de obtener menos de 4.500 caras. Elegir la afirmación más adecuada:
0.
Dada una población normal de varianza 4, si se extrae una m.a.s de tamaño 4. ¿Como será el comportamiento de la varianza muestral?:
Una variante que sigue el modelo chi-cuadrado con tres grados de libertad.
Elija la afirmación correcta con respecto a la media muestral:
Es el estimador de máxima verosimilitud de la varianza poblacional de una poisson.
La proporción muestral p* es un estimador de proporción “p” de una variable dicotómica. En m.a.s grandes se distribuye como una variable aleatoria normal en virtud de (elija la opción correcta):
Los estimadores MV tienen buenas propiedades en muestras grandes.
Se tiene una población normal, con la media como parámetro poblacional desconocido. Para hacernos una idea de su posible valor se extrae una m.a.s de tamaño “n” y se propone el uso de dos estimadores: primer elemento muestral y media muestral: Se podría elegir en función de la consistencia: solo uno de los dos es consistentes.
Escoja la afirmación correcta sobre la propiedad de insesgo del estimador proporción muestral obtenido por m.a.s para estimar el parámetro proporción poblacional:
El estimador es siempre insesgado.
Elija la afirmación correcta sobre la varianza muestral S al cuadrado tomada de una m.a.s:
Es un estimador asintóticamente insesgado de la varianza poblacional.
En cierto sector industrial se tiene constancia de que las mujeres cobran menos que los hombres. Elija la afirmación correcta sobre el tipo de muestreo adecuado si se quiere estudiar la variable en dicho sector:
Un muestreo estratificado por sexo.
El procedimiento que consiste en maximizar la función de densidad conjunta de una m.a.s dada, a partir de los distintos valores que puede tomar el parámetro teta, que caracteriza la distribución de la probabilidad de la variable aleatoria a estudiar se llama:
Método de estimación de la máxima verosimilitud.
Elija la afirmación correcta sobre el significado de la distribución en el muestreo de un estimador:
Se refiere a la distribución de probabilidad del estimador.
Elija la afirmación correcta respecto a la situación que resulta más apropiada en un contraste de hipótesis:
Rechazar la hipótesis nula porque el riesgo de equivocarnos (rechazar hipótesis nula/hipótesis nula cierta) es conocido y bajo.
A veces se dice que un contraste es poco potente. Elija la afirmación correcta sobre lo que eso quiere decir:
Que el contraste tiende a aceptar la hipótesis nula en más ocasiones de las que debiera.
Un sondeo electoral en relación con la alcaldía de cierto municipio otorga a un candidato una proporción de voto del 37,5% con un error del 3% para un nivel de confianza del 95%. Elija la afirmación correcta sobre el tamaño n empleado (aproximado) de la m.a.s tomada:
1000.
Elija la afirmación correcta en relación con la situación que se plantea en un contraste de hipótesis a la hora de elegir que hipótesis poner como nula y cual como alternativa:
No da igual la que se ponga como nula porque afecta a los errores (tipo I y II) que se puedan cometer.
Sea una variable aleatoria distribuida como una B(m;p). Elija la afirmación correcta sobre el estimador por el método de los momentos del parámetro “p” a partir de una m.a.s de tamaño “n”:
Es la media muestral dividida entre “m”.
Un sondeo electoral en relación con la alcaldía de cierto municipio a partir de una m.a.s otorga una diferencia en la proporción poblacional de votos entre los dos candidatos A y B que se presentan, que viene dada por el siguiente intervalo de confianza para un nivel de confianza del 95% [-0,05;0,1]:
No hay diferencias significativas en la proporción de votos entre ambos candidatos.
El campo de la estadística que permite obtener conclusiones sobre poblaciones a partir de los resultados de una muestra se llama:
Inferencia.
Los resultados de una oposición se distribuyen como una variable aleatoria N(6;1). Si solo hay plazas para el 5% de los presentados, elija la afirmación correcta sobre la nota mínima a partir de la cual se conseguirá la plaza:
7,64.
En ocasiones, una misma hipótesis se puede probar con dos tipos de contrastes, paramétricos y no paramétricos. En estos casos ¿por qué se prefieren los contrastes paramétricos?:
Porque son más potentes.
Elija cual de los siguientes elementos influye en el p-valor de un contraste de hipótesis:
El estadístico de prueba.
Supongamos que queremos llevar a cabo una m.a.s de tamaño “n” entre las empresas de un determinado sector industrial en el que se sabe que el 40% ha tenido pérdidas en el último año ¿Qué significa o implica que cada elemento de la población tenga la misma probabilidad de ser elegido (rasgo propio del m.a.s)? Elija la afirmación correcta:
Que por término, el 40% de las empresas seleccionadas habrán tenido pérdidas.
Elija la afirmación correcta en relación con la situación que se plantea en un contraste de hipótesis a la hora de elegir que hipótesis poner como nula y cual como alternativa:
No da igual la que se ponga como nula porque afecta a los errores (tipo 1 y 2) que se puedan cometer.
Sea una variable aleatoria distribuida como una B(m;p). Elija la afirmación correcta sobre el estimador por el método de los momentos del parámetro “p” a partir de una m.a.s de tamaño “n”:
Es la media muestral dividida entre “m”.
Un sondeo electoral en relación con la alcaldía de cierto municipio a partir de una m.a.s otorga una diferencia en la proporción poblacional de votos entre los dos candidatos A y B que se presentan, que viene dada por el siguiente intervalo de confianza para un nivel de confianza del 95% [-0,05;0,1]:
No hay diferencias significativas en la proporción de votos entre ambos candidatos.
El campo de la estadística que permite obtener conclusiones sobre poblaciones a partir de los resultados de una muestra se llama:
Inferencia.
Conceptos Clave
- Contraste de Hipótesis: Proceso para evaluar la validez de una afirmación sobre una población, basado en la evidencia de una muestra.
- Intervalos de Confianza: Rango de valores dentro del cual se espera que se encuentre el parámetro poblacional, con un cierto nivel de confianza.
- Muestreo: Proceso de selección de una muestra de una población para obtener información sobre la misma.
- Estimación: Proceso de inferir el valor de un parámetro poblacional a partir de los datos de una muestra.
- Máxima Verosimilitud: Método para estimar los parámetros de una distribución de probabilidad, buscando los valores que maximizan la probabilidad de observar los datos de la muestra.
- Teorema Central del Límite (TCL): Teorema fundamental que establece que la distribución de la media muestral se aproxima a una distribución normal, independientemente de la distribución de la población, a medida que el tamaño de la muestra aumenta.
- P-valor: Probabilidad de obtener un resultado tan extremo o más que el observado, asumiendo que la hipótesis nula es verdadera.
- Errores Tipo I y II: Errores que pueden ocurrir en un contraste de hipótesis: rechazar la hipótesis nula cuando es verdadera (Tipo I) o aceptar la hipótesis nula cuando es falsa (Tipo II).