Método belson

FUNCIONES DISCRIMINANTES

El análisis discriminante estima Aquellas combinaciones de variables que maximicen las diferencias en la medias Entre los grupos. Cada  una  de  Esas  combinaciones  lineales  De  las variables se conoce como Función discriminante.La base del análisis discriminante supone establecer una Combinación lineal de las variables que permita discriminar mejor entre la Pertenencia a los grupos.El  criterio  Discriminante  es  una  Estimación  de  la variabilidad entre grupos explicada por Cada una de las funciones discriminantes. Cuanto más alto sea  de una función más eficacia presenta esa Función para discriminar entre los grupos.La medida en que una función Discrimine depende cuánto aumente las diferencias entre los grupos y disminuya Las diferencias dentro de cada grupo.
La primera función discriminante será la Que más discrimine, la segunda será la segunda que más discrimine, etc.En  principio,  Pueden  distinguirse  tantas  Funciones discriminantes como variables independientes haya o como grupos Menos uno (k-1), lo que sea menor.Para  Valorar  la  capacidad  Discriminante  de  cada función  Se  puede utilizar  el  Autovalor,  la varianza explicada Y la correlación canónica de cada función.El autovalor es la razón entre la Suma de cuadrados entre los grupos y la suma de cuadrados dentro de los grupos (intra-grupos).

Funciones Discriminantes


Mientras los coeficientes Discriminantes denotan la contribución única (parcial) de cada variable a las Funciones, las correlaciones de estructura denotan las correlaciones simples Entre variables y funciones.Los coeficientes discriminantes deben usarse cuando Se pretende discernir la contribución específica de cada variable a la función Discriminante.Las  puntuaciones  calculadas  Pueden  representarse en un Diagrama de dispersión con tantas dimensiones como funciones discriminantes Existan. Ese mapa territorial es, por tanto, una representación de la posición De los grupos como regiones separadas en cada una de las funciones Discriminantes., la diferencia entre los grupos vendrá expresada en términos de La distancia entre los casos que pertenecen a cada grupo.toma en cuenta las dos primeras Funciones discriminantesDel mismo modo, se puede representar la posición Promedio para cada grupo: la media para los casos de un grupo en las diferentes Funciones.Ese punto, llamado centroide de grupo, se puede utilizar para valorar La similitud entre los casos dentro de un grupo y entre diferentes Grupos.Algunos   casos   podrían   Estar   más   próximos   Al centroide de otro grupo que al suyo propio y, así, podrían ser Reclasificados dentro de otro grupo.Una regla para esa reclasificación, la Regla de Bayés, se basa en la probabilidad que tiene un caso de pertenecer a Cada uno de los grupos.Para aplicar la regla de Bayés y así determinar el grupo En el que cada caso será reclasificado se han de tomar en cuenta tres tipos de Probabilidades.

La probabilidad Previa [P(Gi)] es la probabilidad de que un caso pertenezca a un grupo si No se dispone de ningún tipo de información previa sobre el mismo.Esta  probabilidad  Se  puede  calcular  Considerando que los grupos tienen el mismo tamaño o según el tamaño de Cada uno de los grupos La probabilidad Condicional [P(D|Gi)] es una medida de       la  probabilidad  De  obtener  una  Determinada puntuación discriminante bajo los supuestos de que la misma Pertenezca a alguno de los grupos.La probabilidad Final [P(Gi|D)] es la probabilidad de que un individuo, con una puntuación Discriminante determinada, pertenezca a uno u otro grupo.

Puede evaluarse el nivel aceptable de Precisión de la clasificación  o  predictiva  Mediante  la  comparación con varios criterios.Un criterio Al azar implica que la tasa de aciertos puede compararse con el porcentaje de Sujetos que se habría clasificado correctamente por mero azar.
criterios de clasificación al azar:

1

Criterio de probabilidad Proporcional: cuando el tamaño de los grupos es desigual, el porcentaje de Clasificaciones correctas al azar es igual a la suma de la proporción de casos Que hay en cada grupo elevado al cuadrado.

2

Criterio de igual probabilidad: cuando el tamaño de  los grupos es igual, el porcentaje de casos clasificados  correctamente  Por  mero  azar  Es igual a 1 entre el número de grupos.

3

Criterio de máxima probabilidad: el porcentaje de          clasificaciones correctas al azar Debería ser superior al porcentaje que representa el grupo de mayor tamaño.

OBJETIVOS Es  determinar  qué variables y en qué medida sirven para Diferenciar entre los tres grupos de clientes.

1

Determinar si los distintos tipos de clientes de Hatco presentan  de  Promedio  consideraciones Diferentes sobre la calidad y el precio de sus productos y los servicios que Presta.

2

Establecer cuál(es) Es(son) la(s) variable(s) que sirve(n) en mayor medida para discriminar entre Un caso en un tipo u otro de clientes de Hatco.

3

Qué dimensiones de discriminación se pueden establecer           de modo que separen al máximo la Pertenencia a uno u otro de los tipos de clientes.

4

Cómo se reclasificarían los clientes de Hatco de modo     que las dimensiones distinguidas puedan Servir     para  clasificar  A nuevos clientes en  los tipos Previamente establecidos.

DISEÑO


1. Seleccionar variables: Establecer si las variables que van a tomarse en cuenta Cumplen una serie de condiciones previas.2. Tamaño de la muestra:
Determinar si La muestra tiene un tamaño adecuado para que los resulta- dos sean estables y Extrapolables.3. División  de  la  Muestra:  Elaborar  muestras  De análisis y de validación para llevar a cabo una validación cruzada.

Selección De las variables


La Variable dependiente elegida para el análisis tiene que ser categórica, y las Categorías o grupos han de ser mutuamente excluyentes y exhaustivos El número De grupos que estén definidos en la varia- ble dependiente han de ser, al Menos, dos.Si Los grupos están relacionados en una escala, se podrían analizar solamente los Dos grupos extremos y prescindir de los grupos intermedios (enfoque de los Extremos polares).

Tamaño Muestral


El tamaño de la muestra puede influir en Los resulta- dos, de modo que con muestras muy grandes hasta las variables sin Capacidad de discriminación pueden producir diferencias significativas entre Grupos.Por esto, en el análisis Discriminante es conveniente que exista una adecuada relación entre el tamaño De la muestra y el número de variables predictoras.Es conveniente que haya, al menos, una razón de 20 a 1 entre el Número de casos y el de variables.

División De la muestra


Esto implica que se ha de adoptar Una validación cruzada: dividir la muestra en dos mitades, con una obtener los Resultados y con la otra validarlos. Al dividir la muestra en dos mitades, la Muestra de validación no está sesgada y, en principio, posee las mismas Propiedades que la muestra de análisis.

SUPUESTOS


1. Normalidad. La distribución  de las  frecuencias para las variables independientes Debe ajustarse a una curva normal.2. Matriz De varianzas-covarianzas. Los diferentes grupos deben exhibir varianzas Iguales.3.Multicolinealidad.  Las  Variables independientes no  Deberían  estar  altamente correlacionadas entre sí para Evitar efectos de multicolinealidad.

EXTRACCIÓN1. Método de cálculo: Introducir todas las variables o elegir un método de selección “paso a paso”. 2. Significación: valorar en qué medida cada una de las variables presenta medias Iguales en grupo. 3. Funciones: determinar el número de funciones Discriminantes que es adecuado retener.

Significación


Una  vez  Elegido  el  método  De  selección  “paso  A paso” de variables (con criterio λ de Wilks), se trata de valorar en Qué medida cada una de las variables establece diferencias entre las medias de Los grupos. Para eso, se trata de examinar el valor del coeficiente λ de Wilks Y el valor de F y su correspondiente nivel de significación.

INTERPRETACIÓN1


. Evaluación   de   las   Funciones:   establecer   la contribución específica de cada variable A cada función y el contenido sustantivo de éstas.2. Capacidad predictiva: Determinar la capacidad de las variables para preveer la clasificación de los Casos mediante la matriz de clasificación.3. Discriminación entre grupos: Deducir los rasgos específicos de  cada  Grupo  a  partir  De  sus puntuaciones discriminantes En las funciones.

VALIDACIÓN


La Validación de los resultados del análisis discriminante se puede llevar a cabo Dividiendo el conjunto de     datos  originales,  Recogiendo  nuevos  datos  O utilizando los perfiles de los grupos. Un método habitual es la División de la muestra en dos mitades, una de análisis y otra de Validación.  Un método distinto supone Analizar los perfiles de los grupos en cada una de las variables, para Garantizar que se corresponden con la definición de los grupos. 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.