Unidad 1:
Estadística
Descriptiva
La estadística es entendida como un conjunto de técnicas que nos permiten, por un lado, recoger, representar, clasificar, resumir datos de un colectivo (Estadística descriptiva). Por otro lado, nos permiten obtener conclusiones a partir de esos datos (Estadística inferencial).
Antes de proseguir es bueno dar algunas definiciones que debemos tener presente, puesto que forman parte del lenguaje técnico.
Individuos o elementos: personas u objetos que contienen cierta información que se desea estudiar.
Población: conjunto de individuos o elementos que cumplen ciertas propiedades comunes.
En relación al tamaño de la población, ésta puede ser:
• Finita, • Infinita,
Muestra: subconjunto representativo de una población.
Parámetro: función definida sobre los valores numéricos de carácterísticas medibles de una población.
Estadístico: función definida sobre los valores numéricos de una muestra.
Variables
Propiedades, rasgos o cualidades con respecto a la cual difieren los elementos de la población. Estas a su vez pueden dividirse en cualitativas o cuantitativas.
Valores: diferentes situaciones posibles de una variable.
Los valores deben ser a la vez exhaustivos y mutuamente excluyentes (cada elemento posee uno y sólo uno de los valores posibles).
Clases: conjunto de uno o más valores en el que se verifica que cada valor pertenece a una y sólo una de las clases.
TIPOS DE VARIABLES
Cuando hablamos de variable, hacemos referencia a un símbolo (X, Y, X1, X2, .. ,) que puede tomar cualquier valor de un conjunto determinado, que llamaremos dominio de la variable. En función del tipo de dominio, las variables las clasificamos del siguiente modo:
Variables cualitativas o categóricas, son las que tienen por valores cantidades no numéricas, por lo que no podemos hacer operaciones aritméticas con ellas.
Variables cuantitativas, son las que tienen por valores cantidades numéricas con las que podemos hacer operaciones aritméticas. De acuerdo a los valores estas se clasifican en discretas o continuas. Se dice que la variable es discreta si los valores que ella toma forman un conjunto finito o infinito numerable (se puede contar). También podemos indicar que entre dos valores cualesquiera de esta variable o hay un número finito de ellos o no existen valores. En general las variables discretas se asocian a procesos de conteo. Se dice que la variable es continua si los valores que ella toma forman un subconjunto de la recta real. También podemos indicar que entre dos valores de esta variable hay un número infinito de ellos.
A su vez el tipo de escala para medir una variable es de suma importancia, entre estas distinguimos cuatro tipos: nominales, ordinales, de intervalo o de razón.
Será nominal cuando se utilizan nombres para establecer categorías (excluyentes), sin que denote jerarquía, por ejemplo el genero (masculino, femenino), estado civil (soltero, casado, separado, viudo), la regíón (I, II,…,XII), etc. Observemos que las variables medidas en escala nominal no admiten puntuaciones numéricas ordenadas significativamente, aunque para efectos principalmente de procesos computacionales asignemos números a estas categorías. Por ejemplo, al medir el género de una persona, podemos asignar 1 si es masculino y 2 si es femenino. Esto no significa la mujer sea mejor que el hombre (2>1) ni el doble (2=2×1) como tampoco que existan personas intermedias (1,5). Una exigencia básica de las escalas nominales es que los objetos han de poder clasificarse en categorías que sean mutuamente excluyentes y exhaustivas, es decir, un objeto debe poder asignarse a una y sólo una categoría, y todos los elementos han de poder clasificarse en las categorías existentes.
Será ordinal cuando se utilizan nombres para establecer categorías pero con un orden significativo por ejemplo el grado educacional (básico, medio, superior), factor de riesgo (bajo, medio, alto). Otras variables, por ejemplo la “actitud hacia el aborto legal” podría ordenar el grado de acuerdo mediante el uso de categorías de respuestas; “totalmente de acuerdo”, “de acuerdo”, “no sabe”, “en desacuerdo”, “totalmente en desacuerdo”. Este conjunto de valores ampliamente utilizado se denomina escala de Likert. En esta clasificación también se pueden utilizar números por ejemplo en el factor de riesgo se puede utilizar «1», «2» y «3» para riesgo bajo, medio y alto respectivamente, sin embargo la diferencia aritmética entre una categoría u otra carece de sentido.
Una escala de intervalo posee las carácterística de una nominal (diferentes valores representan diferentes carácterísticas de los objetos) y de la ordinal (mayor valor representa mayor presencia de la carácterística). Sin embargo, la escala de intervalo, añade una nueva propiedad;
La diferencia también tiene sentido. Una de las carácterísticas de las escalas de intervalo es que carecen de un cero absoluto por lo que las operaciones como la multiplicación y la división no son realizables. En esta escala el valor cero no necesariamente significa ausencia de la propiedad que se intenta medir En este tipo de escala se pueden realizar comparaciones de igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente entre cada valor. En estas escalas no tienen sentido las razones, por ejemplo, si medimos la temperatura en grados celsius y un objeto mide 20°C y otro 10°C po demos decir que uno tiene el doble de temperatura que otro, pero si estas mismas temperaturas las medimos en grados Fahrenheit no es cierto ya que 20°C ⇔ 68°F y 10°C ⇔ 50°F, en el que obviamente 68°F no es doble de 50°F. Una escala de razón tiene las mismas propiedades de las escalas de intervalos pero, además, las razones si tienen sentido. Estas escalas tienen un valor base cero natural. Por ejemplo la edad, los ingresos, densidad, etc. En resumen;
Tipo de Variable Escala de medición
Cualitativas o no métricas Nominal u ordinal Cuantitativas o métricas
Discretas o continuas De intervalo o de razón
Reconocida la terminología propia del lenguaje estadístico, estamos en condiciones de comenzar con nuestra primera unidad; Estadística descriptiva