Método belson

FUNCIONES DISCRIMINANTES

El análisis discriminante estima Aquellas combinaciones de variables que maximicen las diferencias en la medias Entre los grupos. Cada una de Esas combinaciones lineales De las variables se conoce como Función discriminante.La base del análisis discriminante supone establecer una Combinación lineal de las variables que permita discriminar mejor entre la Pertenencia a los grupos.El criterio Discriminante es una Estimación de la variabilidad entre grupos explicada por Cada una de las funciones discriminantes. Cuanto más alto sea de una función más eficacia presenta esa Función para discriminar entre los grupos.La medida en que una función Discrimine depende cuánto aumente las diferencias entre los grupos y disminuya Las diferencias dentro de cada grupo.
La primera función discriminante será la Que más discrimine, la segunda será la segunda que más discrimine, etc.En principio, Pueden distinguirse tantas Funciones discriminantes como variables independientes haya o como grupos Menos uno (k-1), lo que sea menor.Para Valorar la capacidad Discriminante de cada función Se puede utilizar el Autovalor, la varianza explicada Y la correlación canónica de cada función.El autovalor es la razón entre la Suma de cuadrados entre los grupos y la suma de cuadrados dentro de los grupos (intra-grupos).

Funciones Discriminantes

Mientras los coeficientes Discriminantes denotan la contribución única (parcial) de cada variable a las Funciones, las correlaciones de estructura denotan las correlaciones simples Entre variables y funciones.Los coeficientes discriminantes deben usarse cuando Se pretende discernir la contribución específica de cada variable a la función Discriminante.Las puntuaciones calculadas Pueden representarse en un Diagrama de dispersión con tantas dimensiones como funciones discriminantes Existan. Ese mapa territorial es, por tanto, una representación de la posición De los grupos como regiones separadas en cada una de las funciones Discriminantes., la diferencia entre los grupos vendrá expresada en términos de La distancia entre los casos que pertenecen a cada grupo.toma en cuenta las dos primeras Funciones discriminantesDel mismo modo, se puede representar la posición Promedio para cada grupo: la media para los casos de un grupo en las diferentes Funciones.Ese punto, llamado centroide de grupo, se puede utilizar para valorar La similitud entre los casos dentro de un grupo y entre diferentes Grupos.Algunos casos podrían Estar más próximos Al centroide de otro grupo que al suyo propio y, así, podrían ser Reclasificados dentro de otro grupo.Una regla para esa reclasificación, la Regla de Bayés, se basa en la probabilidad que tiene un caso de pertenecer a Cada uno de los grupos.Para aplicar la regla de Bayés y así determinar el grupo En el que cada caso será reclasificado se han de tomar en cuenta tres tipos de Probabilidades.

La probabilidad Previa [P(Gi)] es la probabilidad de que un caso pertenezca a un grupo si No se dispone de ningún tipo de información previa sobre el mismo.Esta probabilidad Se puede calcular Considerando que los grupos tienen el mismo tamaño o según el tamaño de Cada uno de los grupos La probabilidad Condicional [P(D|Gi)] es una medida de la probabilidad De obtener una Determinada puntuación discriminante bajo los supuestos de que la misma Pertenezca a alguno de los grupos.La probabilidad Final [P(Gi|D)] es la probabilidad de que un individuo, con una puntuación Discriminante determinada, pertenezca a uno u otro grupo.

Puede evaluarse el nivel aceptable de Precisión de la clasificación o predictiva Mediante la comparación con varios criterios.Un criterio Al azar implica que la tasa de aciertos puede compararse con el porcentaje de Sujetos que se habría clasificado correctamente por mero azar.
criterios de clasificación al azar:

Criterio de probabilidad Proporcional: cuando el tamaño de los grupos es desigual, el porcentaje de Clasificaciones correctas al azar es igual a la suma de la proporción de casos Que hay en cada grupo elevado al cuadrado.

Criterio de igual probabilidad: cuando el tamaño de los grupos es igual, el porcentaje de casos clasificados correctamente Por mero azar Es igual a 1 entre el número de grupos.

Criterio de máxima probabilidad: el porcentaje de clasificaciones correctas al azar Debería ser superior al porcentaje que representa el grupo de mayor tamaño.

OBJETIVOS Es determinar qué variables y en qué medida sirven para Diferenciar entre los tres grupos de clientes.

Determinar si los distintos tipos de clientes de Hatco presentan de Promedio consideraciones Diferentes sobre la calidad y el precio de sus productos y los servicios que Presta.

Establecer cuál(es) Es(son) la(s) variable(s) que sirve(n) en mayor medida para discriminar entre Un caso en un tipo u otro de clientes de Hatco.

Qué dimensiones de discriminación se pueden establecer de modo que separen al máximo la Pertenencia a uno u otro de los tipos de clientes.

Cómo se reclasificarían los clientes de Hatco de modo que las dimensiones distinguidas puedan Servir para clasificar A nuevos clientes en los tipos Previamente establecidos.

DISEÑO

1. Seleccionar variables: Establecer si las variables que van a tomarse en cuenta Cumplen una serie de condiciones previas.2. Tamaño de la muestra:
Determinar si La muestra tiene un tamaño adecuado para que los resulta- dos sean estables y Extrapolables.3. División de la Muestra: Elaborar muestras De análisis y de validación para llevar a cabo una validación cruzada.

Selección De las variables

La Variable dependiente elegida para el análisis tiene que ser categórica, y las Categorías o grupos han de ser mutuamente excluyentes y exhaustivos El número De grupos que estén definidos en la varia- ble dependiente han de ser, al Menos, dos.Si Los grupos están relacionados en una escala, se podrían analizar solamente los Dos grupos extremos y prescindir de los grupos intermedios (enfoque de los Extremos polares).

Tamaño Muestral

El tamaño de la muestra puede influir en Los resulta- dos, de modo que con muestras muy grandes hasta las variables sin Capacidad de discriminación pueden producir diferencias significativas entre Grupos.Por esto, en el análisis Discriminante es conveniente que exista una adecuada relación entre el tamaño De la muestra y el número de variables predictoras.Es conveniente que haya, al menos, una razón de 20 a 1 entre el Número de casos y el de variables.

División De la muestra

Esto implica que se ha de adoptar Una validación cruzada: dividir la muestra en dos mitades, con una obtener los Resultados y con la otra validarlos. Al dividir la muestra en dos mitades, la Muestra de validación no está sesgada y, en principio, posee las mismas Propiedades que la muestra de análisis.

SUPUESTOS

1. Normalidad. La distribución de las frecuencias para las variables independientes Debe ajustarse a una curva normal.2. Matriz De varianzas-covarianzas. Los diferentes grupos deben exhibir varianzas Iguales.3.Multicolinealidad. Las Variables independientes no Deberían estar altamente correlacionadas entre sí para Evitar efectos de multicolinealidad.

EXTRACCIÓN1. Método de cálculo: Introducir todas las variables o elegir un método de selección “paso a paso”. 2. Significación: valorar en qué medida cada una de las variables presenta medias Iguales en grupo. 3. Funciones: determinar el número de funciones Discriminantes que es adecuado retener.

Significación

Una vez Elegido el método De selección “paso A paso” de variables (con criterio λ de Wilks), se trata de valorar en Qué medida cada una de las variables establece diferencias entre las medias de Los grupos. Para eso, se trata de examinar el valor del coeficiente λ de Wilks Y el valor de F y su correspondiente nivel de significación.

INTERPRETACIÓN1

. Evaluación de las Funciones: establecer la contribución específica de cada variable A cada función y el contenido sustantivo de éstas.2. Capacidad predictiva: Determinar la capacidad de las variables para preveer la clasificación de los Casos mediante la matriz de clasificación.3. Discriminación entre grupos: Deducir los rasgos específicos de cada Grupo a partir De sus puntuaciones discriminantes En las funciones.

VALIDACIÓN

La Validación de los resultados del análisis discriminante se puede llevar a cabo Dividiendo el conjunto de datos originales, Recogiendo nuevos datos O utilizando los perfiles de los grupos. Un método habitual es la División de la muestra en dos mitades, una de análisis y otra de Validación. Un método distinto supone Analizar los perfiles de los grupos en cada una de las variables, para Garantizar que se corresponden con la definición de los grupos.