Introducción a la Estadística
1. Conceptos Generales
Supongamos que en una fábrica de neumáticos se quiere analizar la duración de las gomas. Sería imposible y una ruina para el fabricante probar todos los neumáticos, por lo que elige, de acuerdo con los criterios oportunos, solo algunos y estudia su comportamiento. En este caso, se dice que la población estudiada son todos los neumáticos fabricados; al conjunto de neumáticos seleccionados para la prueba se denomina muestra, y a la característica cuyo comportamiento se analiza, la duración en este caso, recibe el nombre de variable.
Las variables pueden ser:
- Variables cualitativas: En el caso de que no se puedan medir numéricamente (por ejemplo: nacionalidad, color del pelo, sexo).
- Variables cuantitativas: Aquellas que vienen definidas por un valor numérico (edad, precio de un producto, altura). A su vez, las variables cuantitativas se pueden clasificar en discretas y continuas:
- Discretas: Si solo pueden tomar valores enteros (0, 1, 5, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3…, pero nunca podrá ser 2,5).
- Continuas: Si pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la altura de los alumnos de una clase (1,53 m; 1,67 m, etc.).
1.2. Frecuencias Absolutas y Frecuencias Relativas
Imaginemos una clase de 20 alumnos en la que se ha hecho un estudio sobre las calificaciones obtenidas en una asignatura. Los resultados obtenidos, a los que llamamos datos estadísticos, han sido… Si efectuamos un recuento de estos datos, se observa que hay dos alumnos con un 10, otros dos alumnos con 9, un alumno con 8, etc.; entonces decimos que la frecuencia absoluta, es decir, el número de veces que se repite un dato, por ejemplo, el 10 es 2; la frecuencia absoluta del dato 9 es 2; la frecuencia absoluta del dato 8 es 1; etc. Si analizamos la información, se observa que la suma de las frecuencias absolutas es el número total de individuos de la población. Pero si dividimos la frecuencia absoluta de cada dato por el número total de datos de la muestra, obtenemos su frecuencia relativa. Obsérvese que la suma de las frecuencias relativas es siempre igual a 1. Si representamos en forma de tabla la información estructurada, se obtiene una tabla de frecuencias.
2. Diagramas de Barras y Sectores
Una forma sencilla de mostrar los datos de una tabla de frecuencias (absolutas o relativas) es hacerlo gráficamente, construyendo distintos tipos de diagramas, entre los que, en este curso, vamos a destacar los diagramas de barras y los de sectores.
2.1. Diagrama de Barras
Los diagramas de barras se utilizan en aquellos casos en los que se desea presentar datos cualitativos de tipo discreto; para lo cual se toman unos ejes cartesianos y se representa:
- En el eje de abscisas, los valores de la variable estadística.
- Sobre el eje de ordenadas, las frecuencias absolutas o relativas. Trazando para cada uno de los valores del eje de abscisas un segmento perpendicular a dicho eje, con una longitud igual o proporcional a su frecuencia. Es oportuno precisar que la unidad que tomamos sobre el eje de abscisas puede ser igual o diferente a la tomada sobre el eje de ordenadas.
2.2. Diagrama de Sectores
El diagrama de sectores sirve para representar cualquier tipo de variable. Consiste en dividir los 360º de un círculo en partes proporcionales a las frecuencias.
3. Parámetros Estadísticos
En general, en estadística no interesan los datos de cada uno de los individuos, sino unos pocos valores que nos permiten resumir y alcanzar una idea aproximada de toda la población; para lo cual es preciso tratar los datos que tenemos a nuestra disposición y obtener esos valores significativos a los que se denomina parámetros estadísticos.
3.1. Media Aritmética
La media aritmética o promedio, x̄, de un conjunto de datos numéricos es el resultado de dividir la suma de todos ellos por el número total de datos.
3.2. Mediana
Se llama mediana, Me, de un conjunto ordenado de datos numéricos al valor que ocupa la posición central. Si el conjunto ordenado de datos tiene un número impar de valores, la mediana es el valor que ocupa la posición central. Si el conjunto ordenado de datos tiene un número par de valores, la mediana es la media aritmética de los dos valores centrales.
3.3. Moda
Llamamos moda, Mo, al valor de la variable estadística que tiene mayor frecuencia absoluta. Se puede calcular en variables cuantitativas y cualitativas.