Estadística Inferencial
La estadística inferencial comprende los métodos que hacen posible la estimación de una característica de la población o la toma de una decisión referente a una población, basándose sólo en los resultados de la muestra.
Prueba Z
Se aplica cuando los datos tienen una distribución normal y un tamaño de muestra de al menos 30. Cuando se conoce la varianza de la población, determina si las medias de la muestra y de la población son iguales.
Prueba T
Cuando el tamaño de la muestra es inferior a 30 y los datos tienen una distribución t de Student, se utiliza una prueba t. Se comparan la media de la muestra y la media de la población cuando se desconoce la varianza de la población.
Prueba F
Cuando se comparan las varianzas de dos muestras o poblaciones, se utiliza una prueba f para ver si hay diferencias.
Análisis de Regresión
Se realiza para calcular cómo cambiará una variable en relación con otra. Pueden utilizarse numerosos modelos de regresión, como la regresión lineal simple, la lineal múltiple, la nominal, la logística y la ordinal.
Valor P
Es la probabilidad de que ocurra un evento de forma aleatoria, tomando una premisa como cierta.
Prueba de Hipótesis
Es una regla que especifica si se puede aceptar o rechazar una afirmación acerca de una población dependiendo de la evidencia proporcionada por una muestra de datos.
Hipótesis Nula (H0)
Es el enunciado que se probará. Por lo general, la hipótesis nula es un enunciado de que “no hay efecto” o “no hay diferencia”.
Hipótesis Alternativa (H1)
Es el enunciado que se desea poder concluir que es verdadero de acuerdo con la evidencia proporcionada por los datos de la muestra.
Hipótesis
Es una observación que puede ser verdadera o falsa.
Métodos Estadísticos
Análisis de Correlación
Es un método estadístico que investiga relaciones entre variables. Determina la magnitud y dirección de esas relaciones.
Correlación de Pearson
Mide la dirección y fuerza de la relación lineal entre dos variables cuantitativas.
Correlación de Spearman
Mide la dirección y fuerza de la asociación monotónica entre dos variables ordenadas o nos sirve para evaluar la relación monótona entre dos variables continuas u ordinales. Mide la correlación entre rangos (o rankings) de dos variables. No trabaja bajo la suposición de una distribución de los datos.
Chi Cuadrada
Es una distribución probabilística continua que se apoya en un parámetro y representa los grados de libertad. Permite determinar la relación entre dos variables categóricas (sexo, nivel de educación, programa preferido).
Grados de Libertad
Se refiere al número de observaciones de una muestra que pueden tomar cualquier valor posible (que son “libres” de tomar cualquier valor) una vez que se ha calculado previamente y de forma independiente la estimación de un determinado parámetro en la muestra o en la población de origen.
T de Student
Es una herramienta para evaluar las medias de uno o dos grupos mediante pruebas de hipótesis. Una prueba t puede usarse para determinar si un único grupo difiere de un valor conocido (una prueba t de muestras independientes), o si hay una diferencia significativa en medias pareadas.
U de Mann-Whitney
Es una prueba no paramétrica que se utiliza para comparar dos medias muestrales que provienen de la misma población, así como para probar si dos medias muestrales son iguales o no. Se utiliza para comparar dos grupos de rangos (medianas) y que su diferencia sea estadísticamente significativa.
Desviación Estándar
Se representa con S, σ, o DE. Es una medida de grado de dispersión de los datos con respecto al valor promedio. Se utiliza para calcular la variación o dispersión en la que los puntos de datos individuales difieren de la media. Entre más dispersos se encuentren los valores de la media, mayor será la desviación estándar.
Varianza
Pretende capturar en qué medida los datos están en torno a la media. Es el promedio de los cuadrados de las desviaciones medidas alrededor de la media.
Cuantiles
Son los valores de la distribución que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo número de valores.
Percentiles
Son 99 valores de la variable que dividen a un conjunto de datos ordenados en 100 partes iguales. Es una medida de posición que divide la distribución de datos en partes iguales.
Análisis de Varianza (ANOVA)
Es una técnica estadística que se utiliza para comparar la media de tres o más grupos y determinar si existen diferencias significativas entre ellas.
Kruskal-Wallis
Es una prueba no paramétrica basada en el rango que puede utilizarse para corroborar si existen diferencias relevantes a nivel estadístico en tres o más grupos de una variable independiente en una variable dependiente ordinal o continua. La prueba determina si las medianas de dos o más grupos son diferentes. El estadístico de prueba utilizado se denomina estadístico H.
La hipótesis de la prueba es:
- H0: las medias de la población son iguales.
- H1: las medianas de la población no son iguales.
Epidemiología
Es la rama de la medicina que estudia la frecuencia, la distribución y los determinantes de estados y sucesos relacionados con la salud y la enfermedad.
Exposición
Es el factor que incrementa el riesgo de una persona para tener una condición adversa de salud.
Evento
Es el efecto de la exposición (una condición adversa de salud).
Estudio Epidemiológico Observacional
Los investigadores observan el efecto de las exposiciones en los sujetos de estudio.
Estudios Descriptivos
Describen las variables en un grupo de sujetos por un periodo corto de tiempo, sin incluir grupo control. Describen las características generales de la distribución de una enfermedad, en relación con las personas, lugares y tiempo.
Estudios Analíticos
Comprueban o rechazan las hipótesis generadas por los estudios descriptivos, con el objetivo de identificar factores de riesgo o protectores de una enfermedad. La presencia de un grupo control nos permite evaluar si el resultado observado en el grupo de estudio depende del factor en evaluación.
Estudio no Aleatorizado
Los participantes se asignan a los distintos grupos de tratamiento (o placebo) mediante un método no aleatorio. Es decir, el investigador decide y controla la asignación. La asignación no aleatoria puede dar lugar a un sesgo en los resultados del ensayo.
Reporte de Caso
Diseño de investigación que hace un reporte detallado de los síntomas, signos, exámenes complementarios de diagnóstico, tratamiento, complicaciones de tratamiento y seguimiento de un paciente individual o de una enfermedad determinada.
Estudio de Series de Casos
Se limita a la identificación y descripción de un conjunto de casos clínicos que han aparecido en intervalo de tiempo.
Estudios Ecológicos
La unidad de observación es grupal. Suelen usar datos existentes en bases de datos oficiales. Pueden proponer hipótesis. Se comparan áreas geográficas.
Estudios Exploratorios
Se comparan las tasas de enfermedad entre muchas regiones continuas durante un mismo periodo, o se compara la frecuencia de la enfermedad a través del tiempo en una misma región.
Estudios de Grupos Múltiples
Se evalúa la asociación entre los niveles de exposición promedio y la frecuencia de la enfermedad entre varios grupos; comúnmente grupos geopolíticos.
Estudios de Series de Tiempo
Se comparan las variaciones temporales de los niveles de exposición con otra serie de tiempo que refleja los cambios en la frecuencia de la enfermedad en la población de un área geográfica.
Estudios Mixtos
Estudios de series de tiempo combinadas con la evaluación de grupos múltiples.
Estudios Transversales
Son estudios observacionales y descriptivos que carecen de direccionalidad. Su finalidad es estimar la frecuencia de una enfermedad o característica en una muestra de una población en un momento determinado.
Estudios de Casos y Controles
Representa una estrategia muestral, en la que de manera característica se selecciona a la población en estudio con base en la presencia (caso) o ausencia (control o referente) del evento de interés. Se basan en la identificación de los casos incidentes en una determinada población durante un periodo de observación definido.
Estudios de Cohorte
Es un diseño epidemiológico observacional y analítico. Es el que mayor valor o cercanía tiene en lo referente a la búsqueda de asociaciones causales.
Medidas de Tendencia Central
Moda
Es el dato que más se repite o que ocurre con mayor frecuencia (datos no agrupados).
Mediana
Es el valor que divide a la mitad la serie de datos que se tienen. La mediana queda en medio de todos los datos cuando los acomodas.
Media
También llamada promedio, es una medida de tendencia central que representa el valor promedio de un conjunto de datos. Se calcula sumando todos los valores del conjunto de datos y dividiendo la suma por el número total de valores.