Introducción a la Estadística Descriptiva: Conceptos y Técnicas Fundamentales

Introducción a la Estadística Descriptiva

Conceptos Básicos

POBLACIÓN: conjunto sobre el que estamos interesados en obtener conclusiones.

INDIVIDUOS: cada una de las unidades que forman la población.

CARACTERES: rasgos que poseen los elementos de la población y que son objeto de estudio en la investigación

MUESTRA: subconjunto de la población al que tenemos acceso y sobre el que realmente hacemos las observaciones

Variables

VARIABLE: característica observable que varía entre los diferentes individuos de una población.

Tipos de Variables:

  • Cualitativas: Si sus valores no se pueden asociar naturalmente a un número.
    • Nominales: Si sus valores no se pueden ordenar.
    • Ordinales: Si sus valores se pueden ordenar.
  • Cuantitativas: Si sus valores son numéricos.
    • Discretas: Si toma un número finito de valores en un intervalo
    • Continuas: Si entre dos valores, son posibles infinitos valores intermedios.

Tabla de Frecuencias

Exponen la información recogida en la muestra, de forma que no se pierda nada de información.

  • Frecuencias absolutas (ni): Contabilizan el número de individuos de cada modalidad o clase
  • Frecuencias relativas (fi) (porcentajes 100fi%): proporción (porcentaje) de individuos de cada modalidad o clase
  • Frecuencias acumuladas (Ni, Fi): Sólo tienen sentido para variables ordinales y numéricas. Muy útiles para calcular cuantiles.

Gráficos para Variables Cualitativas

  • Diagramas de barras
  • Diagramas de sectores
  • Pictogramas

Gráficos Diferenciales para Variables Cuantitativas

Son diferentes en función de que las variables sean discretas o continuas. Valen con frecuencias absolutas o relativas.

  • Diagramas de barras para variables discretas
  • Histogramas para variables continuas

Diagramas Integrales para Variables Cuantitativas

Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo.

Parámetros y Estadísticos

Parámetro: cantidad numérica calculada sobre una población

Estadístico: cantidad numérica calculada sobre una muestra

Estadísticos

Medidas de Posición

  • Cuantil de orden α (0<α<1): valor de la variable por debajo del cual se encuentra una frecuencia relativa acumulada.
  • Percentil de orden k = cuantil de orden k/100
    • La mediana es el percentil 50
    • El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%
  • Cuartiles: Dividen las observaciones en 4 grupos con frecuencias similares.
    • Primer cuartil = Percentil 25 = Cuantil 0,25
    • Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
    • Tercer cuartil = Percentil 75 = Cuantil 0,75
  • Diagrama de Tukey:
    • La zona central, ‘caja’, contiene al 50% central de las observaciones.
    • Es costumbre que ‘los bigotes’, no lleguen hasta los extremos, sino hasta las observaciones que se separan de la caja en no más de 1,5 R.I. Más allá de esa distancia se consideran anómalas.

Medidas de Centralización

  • Media: Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral.
  • Mediana: Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales.
  • Moda: Es el/los valor/es donde la distribución de frecuencia alcanza un máximo.

Medidas de Dispersión

  • Amplitud, Recorrido o Rango: Diferencia entre observaciones extremas.
  • Rango intercuartílico: Es la distancia entre el primer y tercer cuartil. Rango intercuartílico = P75-P25.
  • Varianza (S2): Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media.
  • Desviación típica (‘standard deviation’): Es la raíz cuadrada de la varianza.
  • Coeficiente de variación: Es la razón entre la desviación típica y la media.
    • Mide la desviación típica en forma de «qué tamaño tiene con respecto a la media»
    • También se la denomina variabilidad relativa.
    • Es frecuente mostrarla en porcentajes. Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables.
    • No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente.

Medidas de Forma

  • Asimetría: Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de su mitad derecha.
    • En las distribuciones simétricas, la media y la mediana coinciden. Si sólo hay una moda, también coincide.
    • La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución.
    • La media tiende a desplazarse hacia los valores extremos (colas).
    • Las discrepancias entre las medidas de centralización son indicación de asimetría.
  • Apuntamiento o curtosis:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.