Conceptos Fundamentales de Estadística Descriptiva e Inferencial

Tipos de Estadística

Estadística descriptiva: Estudia el comportamiento de los elementos de estudio y los resultados se refieren al conjunto de tales elementos.
Estadística inferencial: Se parte de una muestra, pero las conclusiones obtenidas se generalizan o infieren a toda la población de la que proviene la muestra.

Conceptos Básicos

Población: Conjunto de elementos que poseen una característica en común. Según el tamaño puede ser infinita o finita.
Muestra: Subconjunto representativo de la población. Los elementos de la muestra no tienen ninguna característica que los difiera de los restantes.

Tipos de Muestras

  • Aleatoria: Si es seleccionada siguiendo un método de azar. Puede ser:
    • Aleatoria simple: Cada posible muestra tendrá la misma posibilidad de salir.
    • Sistemática con arranque aleatorio: Se elige un primer elemento al azar y luego se seleccionan los siguientes a intervalos regulares.
  • No aleatoria: Si es seleccionada siguiendo unas reglas predeterminadas.
Subpoblación: Subconjunto que no tiene por qué representar a toda la población y cuyos elementos poseen alguna característica diferenciadora.

Características o Caracteres

Se denominan así a todas las características que utilizamos para el estudio de la población.

Tipos de Características

  • Cualitativas o atributos: No toman valores numéricos. Las distintas categorías observadas para el atributo se llaman modalidades. Ejemplos: sexo, color de pelo.
    • Nominal: Categorías no numéricas mutuamente excluyentes, entre las cuales no se puede establecer una relación de orden ni se puede fijar un origen de referencia. Ejemplo: color de pelo.
    • Ordinal: Categoría no numérica mutuamente excluyente, entre las que se puede establecer una relación de orden y fijar un origen. Ejemplo: nivel de estudios.
  • Cuantitativas o variables: Toman valores numéricos. Las distintas observaciones de la variable se llaman valores. Ejemplos: altura, edad.
    • Cardinal:
      • De intervalo: Variables de tipo cuantitativo en las que se establece de antemano una medida, pudiéndose cuantificar numéricamente la distancia existente entre dos observaciones cualquiera. Ejemplo: temperatura.
      • De razón, cociente o proporción: La única diferencia con la escala de intervalo es que tiene cero absoluto. El carácter cuantitativo se comienza a contar desde 0, que indica la ausencia del carácter. Ejemplo: número de hijos.
    • Discretas: Toman un número finito o contable de valores distintos. Toman valores aislados y no pueden tomar valores comprendidos entre dos consecutivos. Ejemplo: número de hijos.
    • Continuas: Toman un número no finito o incontable de valores distintos. Entre dos valores siempre hay algún otro. Ejemplo: temperatura, altura.

Atributos en Distinta Escala

  • Atributo ordinal: Existe una orden dentro de las modalidades. Ejemplo: nivel de estudios. La medida de posición más adecuada sería o bien la mediana o bien la moda.
  • Atributo nominal: No existe una orden dentro de las modalidades. Ejemplo: color de pelo. La moda es la única medida de posición adecuada.

Ejemplos de Atributos en Distinta Escala

  • Sexo: Escala nominal. Clasifica en categorías no numéricas y son mutuamente excluyentes. No tienen propiedades cuantitativas. Medida de posición adecuada: moda.
  • Estudios: Escala ordinal. Existe una relación de orden entre las modalidades. No tienen carácter cuantitativo. Medidas de posición adecuadas: moda y mediana.

Deflactar una Magnitud

¿Para qué se deflacta una magnitud? ¿Qué características debe tener el deflactor adecuado?
Deflactar una magnitud permite estudiar la verdadera evolución de una determinada serie, eliminando efectos como la inflación.

Momentos en una Distribución Bidimensional

En una distribución bidimensional, defina los momentos de orden (1, 1) centrales y ordinarios. ¿Cuándo coinciden? Demuestre.
Momento de orden (1,1) respecto a la media o centrado: Sxy

Bondad de la Regresión

Si la bondad de la regresión de la media es nula, ¿qué significa? ¿Tiene incidencia en la bondad de la regresión por mínimos cuadrados?
Si R2 es nula (=0) significa que la recta no explica en absoluto las variaciones de Y respecto a las variaciones de X.

Regresión y Correlación

Conceptos de regresión y correlación. Explique las similitudes y diferencias.
  • Regresión: Técnicas mediante las cuales construiremos una función que regule el comportamiento de las variables.
  • Correlación: Conjunto de técnicas que determinan el grado de relación que existe entre las variables.
  • Diferencias: El cálculo de la correlación entre dos variables mide únicamente la relación entre ambas sin considerar dependencias. En el caso de la regresión, el modelo varía según qué variable se considere dependente de la otra. Por norma general, los estudios de correlación preceden a la generación de modelos de regresión. Primero se analiza si ambas variables están correlacionadas y si lo están, se genera el modelo de regresión.

Coeficiente de Correlación y Cambios de Origen y Escala

Los cambios de origen y escala, ¿alteran el coeficiente de correlación?
No le afectan los cambios de origen, pues su cálculo consiste en la división de la covarianza entre el producto de las desviaciones típicas de las dos variables y ninguno de estos se ve alterado por los cambios de origen. Los cambios de escala por su parte solo le afectan en el signo.

Comparación entre Media, Moda y Mediana

  • En el cálculo de la media interviene toda la información de la variable, mientras que en el cálculo de la mediana o de la moda no, se pierde parte de la información.
  • La media y la mediana, de existir, son únicas, pero la moda puede no serlo, si existe.
  • La media es muy sensible a datos atípicos (valores que son muy grandes o pequeños en relación con los demás), por lo tanto, si existen este tipo de datos la media no es un buen promedio.
  • No obstante, la mediana y la moda son robustas, es decir, no se ven afectadas por los datos atípicos.
  • La media solo puede calcularse en caracteres cuantitativos (variables), mientras que la mediana también puede ser calculada en atributos ordinales. La moda es la única medida de posición que se puede calcular en atributos nominales.

Covarianza

Indica el tipo de relación entre las variables.

Interpretación

  • sxy > 0: Relación lineal positiva, es decir, al aumentar una aumenta la otra y viceversa.
  • sxy < 0: Relación lineal negativa, es decir, al aumentar una disminuye la otra y viceversa.
  • sxy = 0: No hay relación lineal, es decir, X e Y son incorreladas.
  • X e Y son independientes → sxy = 0
  • X e Y no son independientes → sxy ≠ 0

Propiedades

  • No le afectan los cambios de origen.
  • Le afectan los cambios de escala.
  • sxy = syx
  • sxx = sx2

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.