FUNCIONES DISCRIMINANTES
El análisis discriminante estima
Aquellas combinaciones de variables que maximicen las diferencias en la medias
Entre los grupos. Cada una de
Esas combinaciones lineales
De las variables se conoce como
Función discriminante.La base del análisis discriminante supone establecer una
Combinación lineal de las variables que permita discriminar mejor entre la
Pertenencia a los grupos.El criterio
Discriminante es una
Estimación de la variabilidad entre grupos explicada por
Cada una de las funciones discriminantes. Cuanto más alto sea de una función más eficacia presenta esa
Función para discriminar entre los grupos.La medida en que una función
Discrimine depende cuánto aumente las diferencias entre los grupos y disminuya
Las diferencias dentro de cada grupo.
La primera función discriminante será la
Que más discrimine, la segunda será la segunda que más discrimine, etc.En principio,
Pueden distinguirse tantas
Funciones discriminantes como variables independientes haya o como grupos
Menos uno (k-1), lo que sea menor.Para
Valorar la capacidad
Discriminante de cada función
Se puede utilizar el
Autovalor, la varianza explicada
Y la correlación canónica de cada función.El autovalor es la razón entre la
Suma de cuadrados entre los grupos y la suma de cuadrados dentro de los grupos
(intra-grupos).
Funciones Discriminantes
Mientras los coeficientes
Discriminantes denotan la contribución única (parcial) de cada variable a las
Funciones, las correlaciones de estructura denotan las correlaciones simples
Entre variables y funciones.Los coeficientes discriminantes deben usarse cuando
Se pretende discernir la contribución específica de cada variable a la función
Discriminante.Las puntuaciones calculadas
Pueden representarse en un
Diagrama de dispersión con tantas dimensiones como funciones discriminantes
Existan. Ese mapa territorial es, por tanto, una representación de la posición
De los grupos como regiones separadas en cada una de las funciones
Discriminantes., la diferencia entre los grupos vendrá expresada en términos de
La distancia entre los casos que pertenecen a cada grupo.toma en cuenta las dos primeras
Funciones discriminantesDel mismo modo, se puede representar la posición
Promedio para cada grupo: la media para los casos de un grupo en las diferentes
Funciones.Ese punto, llamado centroide de grupo, se puede utilizar para valorar
La similitud entre los casos dentro de un grupo y entre diferentes
Grupos.Algunos casos podrían
Estar más próximos
Al centroide de otro grupo que al suyo propio y, así, podrían ser
Reclasificados dentro de otro grupo.Una regla para esa reclasificación, la
Regla de Bayés, se basa en la probabilidad que tiene un caso de pertenecer a
Cada uno de los grupos.Para aplicar la regla de Bayés y así determinar el grupo
En el que cada caso será reclasificado se han de tomar en cuenta tres tipos de
Probabilidades.
La probabilidad Previa [P(Gi)] es la probabilidad de que un caso pertenezca a un grupo si No se dispone de ningún tipo de información previa sobre el mismo.Esta probabilidad Se puede calcular Considerando que los grupos tienen el mismo tamaño o según el tamaño de Cada uno de los grupos La probabilidad Condicional [P(D|Gi)] es una medida de la probabilidad De obtener una Determinada puntuación discriminante bajo los supuestos de que la misma Pertenezca a alguno de los grupos.La probabilidad Final [P(Gi|D)] es la probabilidad de que un individuo, con una puntuación Discriminante determinada, pertenezca a uno u otro grupo.
Puede evaluarse el nivel aceptable de
Precisión de la clasificación o predictiva
Mediante la comparación con varios criterios.Un criterio
Al azar implica que la tasa de aciertos puede compararse con el porcentaje de
Sujetos que se habría clasificado correctamente por mero azar.
criterios de clasificación al azar:
1
Criterio de probabilidad
Proporcional: cuando el tamaño de los grupos es desigual, el porcentaje de
Clasificaciones correctas al azar es igual a la suma de la proporción de casos
Que hay en cada grupo elevado al cuadrado.
2
Criterio de igual probabilidad: cuando el tamaño de los grupos es igual, el porcentaje de casos clasificados correctamente
Por mero azar
Es igual a 1 entre el número de grupos.
3
Criterio de máxima probabilidad: el porcentaje de clasificaciones correctas al azar Debería ser superior al porcentaje que representa el grupo de mayor tamaño.
OBJETIVOS
Es determinar qué variables y en qué medida sirven para
Diferenciar entre los tres grupos de clientes.
1
Determinar si los distintos tipos de clientes de Hatco presentan de
Promedio consideraciones
Diferentes sobre la calidad y el precio de sus productos y los servicios que
Presta.
2
Establecer cuál(es)
Es(son) la(s) variable(s) que sirve(n) en mayor medida para discriminar entre
Un caso en un tipo u otro de clientes de Hatco.
3
Qué dimensiones de discriminación se pueden establecer de modo que separen al máximo la
Pertenencia a uno u otro de los tipos de clientes.
4
Cómo se reclasificarían los clientes de Hatco de modo que las dimensiones distinguidas puedan Servir para clasificar A nuevos clientes en los tipos Previamente establecidos.
DISEÑO
1.
Seleccionar variables: Establecer si las variables que van a tomarse en cuenta
Cumplen una serie de condiciones previas.2. Tamaño de la muestra:
Determinar si
La muestra tiene un tamaño adecuado para que los resulta- dos sean estables y
Extrapolables.3. División de la
Muestra: Elaborar muestras
De análisis y de validación para llevar a cabo una validación cruzada.
Selección De las variables
La
Variable dependiente elegida para el análisis tiene que ser categórica, y las
Categorías o grupos han de ser mutuamente excluyentes y exhaustivos El número
De grupos que estén definidos en la varia- ble dependiente han de ser, al
Menos, dos.Si
Los grupos están relacionados en una escala, se podrían analizar solamente los
Dos grupos extremos y prescindir de los grupos intermedios (enfoque de los
Extremos polares).
Tamaño Muestral
El tamaño de la muestra puede influir en
Los resulta- dos, de modo que con muestras muy grandes hasta las variables sin
Capacidad de discriminación pueden producir diferencias significativas entre
Grupos.Por esto, en el análisis
Discriminante es conveniente que exista una adecuada relación entre el tamaño
De la muestra y el número de variables predictoras.Es conveniente que haya, al menos, una razón de 20 a 1 entre el
Número de casos y el de variables.
División De la muestra
Esto implica que se ha de adoptar
Una validación cruzada: dividir la muestra en dos mitades, con una obtener los
Resultados y con la otra validarlos. Al dividir la muestra en dos mitades, la
Muestra de validación no está sesgada y, en principio, posee las mismas
Propiedades que la muestra de análisis.
SUPUESTOS
1. Normalidad.
La distribución de las frecuencias para las variables independientes
Debe ajustarse a una curva normal.2. Matriz
De varianzas-covarianzas. Los diferentes grupos deben exhibir varianzas
Iguales.3.Multicolinealidad. Las
Variables independientes no
Deberían estar altamente correlacionadas entre sí para
Evitar efectos de multicolinealidad.
EXTRACCIÓN1. Método de cálculo: Introducir todas las variables o elegir un método de selección “paso a paso”. 2. Significación: valorar en qué medida cada una de las variables presenta medias Iguales en grupo. 3. Funciones: determinar el número de funciones Discriminantes que es adecuado retener.
Significación
Una vez
Elegido el método
De selección “paso
A paso” de variables (con criterio λ de Wilks), se trata de valorar en
Qué medida cada una de las variables establece diferencias entre las medias de
Los grupos. Para eso, se trata de examinar el valor del coeficiente λ de Wilks
Y el valor de F y su correspondiente nivel de significación.
INTERPRETACIÓN1
.
Evaluación de las
Funciones: establecer la contribución específica de cada variable
A cada función y el contenido sustantivo de éstas.2. Capacidad predictiva:
Determinar la capacidad de las variables para preveer la clasificación de los
Casos mediante la matriz de clasificación.3. Discriminación entre grupos:
Deducir los rasgos específicos de cada
Grupo a partir
De sus puntuaciones discriminantes
En las funciones.
VALIDACIÓN
La
Validación de los resultados del análisis discriminante se puede llevar a cabo
Dividiendo el conjunto de datos originales,
Recogiendo nuevos datos
O utilizando los perfiles de los grupos. Un método habitual es la
División de la muestra en dos mitades, una de análisis y otra de
Validación. Un método distinto supone
Analizar los perfiles de los grupos en cada una de las variables, para
Garantizar que se corresponden con la definición de los grupos.