Introducción a la Estadística
Estadística: Es la ciencia que se ocupa del estudio y la aplicación de métodos para recopilar, clasificar, representar y resumir datos.
Clasificación de la Estadística
Estadística Descriptiva
Es la rama de la estadística que se refiere al análisis, resumen y presentación de resultados relacionados con un conjunto de datos con el fin de describir sus diversas características. La estadística descriptiva resume la información contenida en los datos recogidos y presenta datos de forma informativa.
Estadística Inferencial
Es la rama de la estadística que nos permite deducir características de una población basándonos en datos recopilados de una muestra. Su objetivo principal es obtener conclusiones y tomar decisiones basadas en datos precisos y confiables. Se basa en probabilidades.
Conceptos Fundamentales
Unidad Estadística
Es simplemente un miembro individual dentro de un conjunto de entidades que están siendo objeto de estudio. En otras palabras, la unidad estadística es la “unidad de medida” de la población.
Población Estadística
Una colección de individuos, objetos o medidas que tienen una o más características en común. Conjunto de todos los elementos a los cuales se refiere la investigación.
Muestra
Se integra de una parte de los individuos, objetos o mediciones de una población.
Tipos de Muestra
- Muestra Aleatoria Simple: Cada elemento de la población tiene la misma probabilidad de ser seleccionado.
- Muestra Estratificada: La población se divide en subgrupos, y se selecciona una muestra aleatoria de cada subgrupo.
- Muestra Sistemática: Se selecciona un elemento inicial al azar, y se selecciona cada k-ésimo elemento a partir de ese punto.
- Muestra por Conglomerados: Se selecciona una muestra aleatoria de grupos (conglomerados), y luego se recopila información de todos los elementos dentro de los grupos seleccionados.
Error Muestral
Diferencia entre la muestra y la población: El error muestral surge de la diferencia entre los resultados de una muestra y los resultados de la población total.
Influencias: El tamaño de la muestra, la variabilidad de la población y la precisión del método de muestreo influyen en el error muestral.
Indicadores Estadísticos
Medidas de Tendencia Central: Media, Mediana, y Moda
Medidas de Dispersión: Varianza, Desviación Estándar, Rango
Índices Comunes
- Índice de Precios al Consumidor (IPC): Mide el cambio promedio en los precios pagados por los consumidores por una cesta de bienes y servicios.
- Índice de Producción Industrial (IPI): Mide el cambio en la producción total en las industrias manufactureras.
- Índice de Confianza del Consumidor (ICC): Mide el sentimiento del consumidor sobre la economía.
Proceso de Información Estadística
Recopilación
Obtención de datos relevantes a través de encuestas, entrevistas, observaciones u otras técnicas.
Análisis
Utilización de técnicas estadísticas para interpretar y extraer conclusiones de los datos recopilados.
Presentación
Comunicación de los hallazgos de manera clara y concisa, utilizando gráficos, tablas y otros elementos visuales.
Parámetro
Valor que describe una característica de la población total. (MEDIA DE LA POBLACIÓN)
Presentación Gráfica de la Información
La visualización de datos juega un papel crucial en la comprensión y comunicación de información compleja.
Importancia de la Visualización de Datos
- Comunicación Efectiva: Las visualizaciones hacen que los datos sean más accesibles y fáciles de entender para una audiencia más amplia.
- Detección de Patrones: Al representar los datos visualmente, las tendencias ocultas y los patrones emergentes se vuelven más evidentes.
- Apoyo a las Decisiones: Las visualizaciones de datos ayudan a comprender el contexto y la complejidad de los problemas, lo que permite a los tomadores de decisiones tomar decisiones más estratégicas.
Tipos de Tablas
- Tablas de Datos: Presenta datos organizados en filas y columnas, con encabezados claros para cada columna.
- Tablas de Frecuencia: Muestra la frecuencia de ocurrencia de diferentes valores en un conjunto de datos.
- Tabla de Contingencia: Analiza la relación entre dos o más variables categóricas, mostrando la frecuencia conjunta de ocurrencia.
Gráficas y Definición
- Gráfica de Barras: Representa datos categóricos mediante barras de diferentes longitudes, proporcionando una comparación visual de las cantidades. (Comparación de ventas de productos en diferentes regiones geográficas)
- Gráfica de Líneas: Muestra la evolución de datos numéricos a lo largo del tiempo, utilizando líneas conectadas para representar los cambios. (Evolución de las acciones de una empresa en el mercado financiero)
- Gráfica de Pastel: Representa la proporción de diferentes partes de un conjunto de datos completo, utilizando secciones circulares de diferentes tamaños. (Proporción de diferentes categorías de gastos en un presupuesto personal)
Medidas de Tendencia Central y Dispersión
Medidas de Tendencia Central: Pretenden resumir en un solo valor a un conjunto de valores. (Media, mediana y moda)
Medidas de Dispersión: Miden el grado de dispersión de los valores de la variable. (Amplitud total, desviación media y desviación estándar)
Definiciones Específicas
- Media Aritmética: Es la suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone.
- Mediana: Es una medida estadística alrededor de la cual se distribuye una población o serie estadística ordenada por magnitud, exactamente por la mitad a la misma.
¿Qué sucede si en la mediana hay un número par de elementos?
La mediana será la media de los dos elementos centrales.
- Moda: Es el valor de una variable absoluta que se repite con mayor frecuencia, en un universo dado.
- Amplitud Total: Es la diferencia entre la puntuación de mayor valor y la de menor valor. Se determina restando al valor más alto de la distribución, el menor. Se le conoce también como: Rango, Oscilación, o Recorrido.
- Desviación Media: Es la media aritmética o promedio de las desviaciones absolutas respecto al valor central entre el número de total observaciones.
- Desviación Estándar: Una medida que se utiliza para cuantificar la variación o la dispersión de un conjunto de datos numéricos.
Diferencia entre Desviación Media y Estándar
La desviación media es la media de todos los puntos de datos de un conjunto. La desviación estándar es un índice numérico de la dispersión de un conjunto de datos.