Curva Normal (Campana de Gauss): Definición y Propiedades
La curva normal, también conocida como campana de Gauss, es una representación gráfica de una distribución estadística donde las observaciones se concentran en el centro y disminuyen simétricamente hacia ambos extremos. Se caracteriza por tener pocas observaciones en los valores bajos, un número creciente hacia el centro (donde se encuentra la moda) y una disminución de frecuencias hacia los valores altos. Esta curva queda definida por dos parámetros: la media y la desviación estándar. Es importante destacar que pueden existir curvas con la misma forma pero diferente media, o con la misma media pero diferente desviación estándar (lo que indica distintos grados de homogeneidad o heterogeneidad).
Características de la Curva Normal
- Su representación es un trazo continuo, ya que representa infinitos casos de una variable continua.
- Tiene una curtosis media (mesocúrtica).
- Los valores de la moda, la media y la mediana coinciden.
- Es simétrica, con un eje vertical que pasa por la media.
- Es asintótica, es decir, no corta el eje horizontal (eje de la variable o abscisa).
- Entre ±3 desviaciones estándar respecto a la media se encuentra el 99.74% de las observaciones.
- Entre ±1 desviación estándar respecto a la media se encuentra el 68.26% de las observaciones (zona de normalidad estadística).
- Existen tantas curvas normales como pares de valores de media y desviación estándar se puedan establecer.
- El área total bajo la curva es igual a 1, representando el 100% de los casos.
- La proporción de casos entre dos puntos de la variable es constante, independientemente de la curva normal específica.
- Existe un área constante (proporción de casos constante) entre dos ordenadas, una en la media y otra a cierta distancia, medida en unidades de desviación estándar. Esto se cumple sin importar los valores de la media y la desviación.
Transformación de Puntajes
La transformación de puntajes brutos a una escala común permite comparar resultados de diferentes observaciones (del mismo sujeto o de sujetos distintos), variables medidas de distinta forma, o la posición de un individuo dentro de una distribución. Esto se logra mediante la conversión a puntajes z.
Puntaje z
El puntaje z indica cuántas unidades de desviación estándar se aleja un valor de la media de su distribución. Se calcula de la siguiente manera:
z = (x – M) / s
Donde:
- x: Puntaje original
- M: Media de la distribución
- s: Desviación estándar de la distribución
Un puntaje z igual a 0 indica que el valor original es igual a la media.
Puntaje Z
El puntaje Z es una transformación lineal del puntaje z que evita valores negativos y decimales. Se utiliza una media (Ma) de 50 y una desviación estándar (Sa) de 10 (aunque estos valores pueden ser arbitrarios). La fórmula es:
Z = Ma + Sa * z
Por ejemplo, un puntaje z de 1 se transforma en un puntaje Z de 60 (50 + 10 * 1).
Percentiles
Los percentiles indican el porcentaje de casos que se encuentran por debajo de un determinado valor. Aunque son fáciles de interpretar, no respetan la forma de la distribución original, tendiendo a agruparse en el centro y dispersarse en los extremos. Para transformar un valor a percentil:
- Convertir el valor original (x) a puntaje z.
- Buscar el área correspondiente al puntaje z en una tabla de áreas bajo la curva normal.
- Sumar o restar el área encontrada a 50 para obtener el percentil.
Medidas de Variabilidad
Las medidas de variabilidad complementan a las medidas de tendencia central, indicando cómo se dispersan los datos alrededor de la tendencia central.
Amplitud Total
La amplitud total (At) es la diferencia entre el valor máximo y el valor mínimo de la variable. Una mayor amplitud total indica mayor variabilidad.
At = Valor máximo – Valor mínimo
Desviación Semi-Intercuartil (Q)
La desviación semi-intercuartil (Q) es la mitad de la distancia entre el cuartil 1 (P25) y el cuartil 3 (P75). Es útil en distribuciones asimétricas.
Q = (C3 – C1) / 2
Un valor de Q pequeño indica que los puntajes se concentran en el centro, mientras que un valor de Q grande indica mayor dispersión.
Desviación Estándar (s)
La desviación estándar (s) es la raíz cuadrada del promedio de los cuadrados de las desviaciones de los valores respecto a la media. Indica el grado de homogeneidad (menor desviación estándar) o heterogeneidad (mayor desviación estándar) de la distribución.
Varianza (s²)
La varianza (s²) es el cuadrado de la desviación estándar. Es otra medida de dispersión.
Homogeneidad y Heterogeneidad
La homogeneidad se refiere a la concentración de los puntajes alrededor de la media, indicando una menor amplitud en la variable. La heterogeneidad, por otro lado, se refiere a una mayor dispersión de los puntajes y una mayor amplitud en la variable.
Curtosis
La curtosis indica el grado de apuntamiento o achatamiento de una distribución. Se clasifica en:
- Leptocúrtica: Curva apuntada (Cu < 0.263).
- Mesocúrtica: Curva normal (Cu = 0.263).
- Platicúrtica: Curva aplanada (Cu > 0.263).
Donde Cu = Q / (P90 – P10)