Prueba T de Student
La prueba T de Student es una técnica estadística que permite inferir si las diferencias en una variable continua, generadas por una variable dicotómica (dos categorías, cada una representada por una muestra), en una muestra pequeña, son estadísticamente significativas. En otras palabras, la prueba T determina si las diferencias generadas por una variable u otra son suficientemente grandes para no ser atribuidas al azar.
Tipos de muestras:
- Para una muestra: se utiliza para detectar diferencias entre un promedio de muestras y un valor teórico que se encontraría en la población.
- Pareadas o dependientes: se utiliza cuando se ha aplicado algo en común a las muestras, como un tratamiento. Se comparan los resultados antes y después de la aplicación del tratamiento.
Ejemplo:
H0: No existen diferencias entre los niveles de esquizofrenia antes y después del tratamiento.
H1: Existen diferencias entre los niveles de esquizofrenia antes y después del tratamiento. - Independientes: se utiliza cuando no se ha aplicado nada en común a las muestras. Se comparan los resultados de dos grupos independientes.
Ejemplo:
H0: No existen diferencias entre los niveles de esquizofrenia en los dos grupos (ambos tratamientos).
H1: Existen diferencias entre los niveles de esquizofrenia en los dos grupos (ambos tratamientos).
Regla de decisión:
- Si el valor de significancia (sig.) es menor que 0,05, se rechaza la H0 y se acepta la H1.
- Si el valor de significancia (sig.) es mayor que 0,05, se rechaza la H1 y se acepta la H0.
Conceptos clave:
- Desviación estándar ponderada: calcula un promedio de diferencias, utilizando los grados de libertad (gl), que es una restricción de la estimación al trabajar con una muestra. Fórmula: N1 + N2 – 2.
- Estadístico T: se obtiene a partir de la desviación estándar ponderada y se utiliza para determinar la probabilidad de obtener los resultados observados si la hipótesis nula fuera verdadera. El estadístico T se asocia a una distribución probabilística que permite obtener el valor alfa (probabilidad de cometer un error de tipo I).
- Intervalo de confianza: rango de valores en los cuales, con un 95% de seguridad (ya que existe un 5% de probabilidad de error de tipo I), podemos encontrar el valor exacto de la medida poblacional.
Supuestos de la prueba T:
- Normalidad: los datos deben seguir una distribución normal. Se puede verificar mediante un histograma.
- Homocedasticidad: las varianzas de los grupos deben ser homogéneas. Se puede verificar mediante la prueba de Levene.
H0: Las varianzas de los grupos son iguales.
H1: Las varianzas de los grupos son distintas.
Regla de decisión: se rechaza la H0 si el valor de significancia es menor que 0,05. En este caso, buscamos aceptar la H0 para cumplir con el supuesto de homocedasticidad.
ANOVA (Análisis de la Varianza)
El ANOVA es una técnica estadística que permite comparar las medias de dos o más grupos. Se utiliza para determinar si existe una diferencia significativa entre las medias de los grupos o si se trata de variaciones aleatorias.
Conceptos básicos:
- Hay una variable independiente o factor
- Hay varios grupos distintos de sujetos formados por la variable independiente
- Los sujetos se asignan aleatoriamente a los niveles de la variable independiente. un sujeto no puede ser miembro de 2 grupos
- Sólo hay una variable dependiente, en la que se produce diferencias en los puntajes según la categoría de la variable.
- el ANOVA se define como una téc. en la que la variabilidad de un conjunto de datos de una variable continua, se divide en varios componentes, asociandolos a una fuente específica de variación.
- esta fuente de variabilidad es una variable categórica que se supone independiente.
CAUSA EFECTO
↕ ↕
v. independiente(x) v. dependiente(y)
v. categórica o discreta v. continua
- V. EXPLICADA:(sistemática)variabilidad entre los grupos
- V. NO EXPLICADA:(no sistemática) variabilidad dentro de cada nivel del factor.
v. total=v.sistemática+v.no sistemática
- el estadistico F contrasta la variabilidad dentro de los grupos.
F=V. entre las medias muestrales
V. dentro de las muestras
- Estadístico F se usa par probar la Ho(que no hay diferencias entre los grupos
- La prueba de sig. se realiza a partir de los gl. obtenidos y y estadistico F
- la prueba F, asociada a un nivel de sig. nos entrega la inf. de si hay o no diferencias entre los grupos.
- Para saber dónde estan las diferencias se realiza la prueba a posteriori o post-hoc, la más realizada es la HSD de TUKEY
Los supuestos del ANOVA son:
MUESTREO ALEATORIO INDEPENDIENTE: supone q los sujetos de cualquier grupo o condición de tratamiento, son una muestra representativa de esta condición. esto se logra asignando aleatoriamente alos sujetos a las distintas condiciones o niveles de la VI
NORMALIDAD:supone que las poblaciones de las cuales se obtuvo la muestra estan normalmente distribuida, se tiene evidencia que el ANOVA de una vía es robusto a violaciones a este supuesto
HOMOGENEIDAD DE VARIANZAS se supone que cada uno de los grupos tiene la misma varianza.
V. DEPENDIENTE MEDIDA AL MENS A NIVEL NUMERICO INTERVALAR: las variables pueden determinar la diferencia entre puntos a lo largo del mismo contínuo. no hay un cero absoluto y se pueden ordenar, restar y sumar las variables.