Curva Normal y Distribuciones Estadísticas: Conceptos y Transformaciones

Curva Normal (Campana de Gauss): Definición y Propiedades

La curva normal, también conocida como campana de Gauss, es una representación gráfica de una distribución estadística donde las observaciones se concentran en el centro y disminuyen simétricamente hacia ambos extremos. Se caracteriza por tener pocas observaciones en los valores bajos, un número creciente hacia el centro (donde se encuentra la moda) y una disminución de frecuencias hacia los valores altos. Esta curva queda definida por dos parámetros: la media y la desviación estándar. Es importante destacar que pueden existir curvas con la misma forma pero diferente media, o con la misma media pero diferente desviación estándar (lo que indica distintos grados de homogeneidad o heterogeneidad).

Características de la Curva Normal

  • Su representación es un trazo continuo, ya que representa infinitos casos de una variable continua.
  • Tiene una curtosis media (mesocúrtica).
  • Los valores de la moda, la media y la mediana coinciden.
  • Es simétrica, con un eje vertical que pasa por la media.
  • Es asintótica, es decir, no corta el eje horizontal (eje de la variable o abscisa).
  • Entre ±3 desviaciones estándar respecto a la media se encuentra el 99.74% de las observaciones.
  • Entre ±1 desviación estándar respecto a la media se encuentra el 68.26% de las observaciones (zona de normalidad estadística).
  • Existen tantas curvas normales como pares de valores de media y desviación estándar se puedan establecer.
  • El área total bajo la curva es igual a 1, representando el 100% de los casos.
  • La proporción de casos entre dos puntos de la variable es constante, independientemente de la curva normal específica.
  • Existe un área constante (proporción de casos constante) entre dos ordenadas, una en la media y otra a cierta distancia, medida en unidades de desviación estándar. Esto se cumple sin importar los valores de la media y la desviación.

Transformación de Puntajes

La transformación de puntajes brutos a una escala común permite comparar resultados de diferentes observaciones (del mismo sujeto o de sujetos distintos), variables medidas de distinta forma, o la posición de un individuo dentro de una distribución. Esto se logra mediante la conversión a puntajes z.

Puntaje z

El puntaje z indica cuántas unidades de desviación estándar se aleja un valor de la media de su distribución. Se calcula de la siguiente manera:

z = (x – M) / s

Donde:

  • x: Puntaje original
  • M: Media de la distribución
  • s: Desviación estándar de la distribución

Un puntaje z igual a 0 indica que el valor original es igual a la media.

Puntaje Z

El puntaje Z es una transformación lineal del puntaje z que evita valores negativos y decimales. Se utiliza una media (Ma) de 50 y una desviación estándar (Sa) de 10 (aunque estos valores pueden ser arbitrarios). La fórmula es:

Z = Ma + Sa * z

Por ejemplo, un puntaje z de 1 se transforma en un puntaje Z de 60 (50 + 10 * 1).

Percentiles

Los percentiles indican el porcentaje de casos que se encuentran por debajo de un determinado valor. Aunque son fáciles de interpretar, no respetan la forma de la distribución original, tendiendo a agruparse en el centro y dispersarse en los extremos. Para transformar un valor a percentil:

  1. Convertir el valor original (x) a puntaje z.
  2. Buscar el área correspondiente al puntaje z en una tabla de áreas bajo la curva normal.
  3. Sumar o restar el área encontrada a 50 para obtener el percentil.

Medidas de Variabilidad

Las medidas de variabilidad complementan a las medidas de tendencia central, indicando cómo se dispersan los datos alrededor de la tendencia central.

Amplitud Total

La amplitud total (At) es la diferencia entre el valor máximo y el valor mínimo de la variable. Una mayor amplitud total indica mayor variabilidad.

At = Valor máximo – Valor mínimo

Desviación Semi-Intercuartil (Q)

La desviación semi-intercuartil (Q) es la mitad de la distancia entre el cuartil 1 (P25) y el cuartil 3 (P75). Es útil en distribuciones asimétricas.

Q = (C3 – C1) / 2

Un valor de Q pequeño indica que los puntajes se concentran en el centro, mientras que un valor de Q grande indica mayor dispersión.

Desviación Estándar (s)

La desviación estándar (s) es la raíz cuadrada del promedio de los cuadrados de las desviaciones de los valores respecto a la media. Indica el grado de homogeneidad (menor desviación estándar) o heterogeneidad (mayor desviación estándar) de la distribución.

Varianza (s²)

La varianza (s²) es el cuadrado de la desviación estándar. Es otra medida de dispersión.

Homogeneidad y Heterogeneidad

La homogeneidad se refiere a la concentración de los puntajes alrededor de la media, indicando una menor amplitud en la variable. La heterogeneidad, por otro lado, se refiere a una mayor dispersión de los puntajes y una mayor amplitud en la variable.

Curtosis

La curtosis indica el grado de apuntamiento o achatamiento de una distribución. Se clasifica en:

  • Leptocúrtica: Curva apuntada (Cu < 0.263).
  • Mesocúrtica: Curva normal (Cu = 0.263).
  • Platicúrtica: Curva aplanada (Cu > 0.263).

Donde Cu = Q / (P90 – P10)

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.