Monografias | Estadísticas para marketing (1) El Análisis FactorialEstadísticas para marketing (1) El Análisis FactorialResumen: Marketing. Estadística. Investigación de Mercados. Análisis Factorial. Análisis Multivariado. Componentes Principales. Reducción. Datos. Eigenvalue. Test Bartlett. Índice KMO. Comunalidad. Carga Factorial. Gráfico. Sedimentación. Factores Rotados. Índice 1. ANTECEDENTES DEL ANÁLISIS FACTORIAL 2. ¿QUÉ ES EL ANÁLISIS FACTORIAL? 3. UTILIDAD DEL ANÁLISIS FACTORIAL 4. ¿CÓMO SE LLEVA A CABO UN ANÁLISIS FACTORIAL? 5. UN EJEMPLO PRÁCTICO UTILIZANDO EL SPSS 6. CONCLUSIONES Y BIBLIOGRAFÍA 7. CONSULTAS Y SUGERENCIAS EN PRÓXIMAS ENTREGAS ANALIZAREMOS OTRAS
MODALIDADES DEL ANÁLISIS MULTIVARIADO: EL ANÁLISIS CLUSTER, EL ANALISIS
DISCRIMINANTE, LOS MAPAS PERCEPTUALES, EL DETECTOR AUTOMÁTICO DE INTERACCIÓN
(CHAID), EL CONJOINT ANALYSIS (TRADE – OFF ANALYSIS), LA REGRESION MÚLTIPLE
ASI COMO LA APLICACIÓN PRÁCTICA DE ESTAS TÉCNICAS EN EL MARKETING. LOS
EJEMPLOS PRÁCTICOS SE PRESENTARÁN UTILIZANDO LOS PAQUETES ESTADÍSTICOS SPSS
(Versión 6.1.3 en Español y la Versión 10.07 en Inglés) * SE ANALIZARÁ ESPECÍFICAMENTE EL ANÁLISIS
FACTORIAL DE COMPONENTES PRINCIPALES (AFCP). El Análisis Factorial deriva, según todos
los indicios, de dos grandes vertientes: la ciencia del comportamiento y la
matemática pura. Gómez Bezares (1985) manifiesta que esta técnica proviene
esencialmente del campo de la Psicología. Por su parte, Zaltman y Burger (1980)
son de la misma opinión y señalan que el Análisis Factorial tuvo su origen en
la intuición de los psicólogos de inicios del siglo pasado, los cuales eran
conscientes que existían muchos aspectos desconocidos vinculados con la
personalidad y la inteligencia a los que se podía acceder por medio de
evaluaciones indirectas cuyo análisis profundo debería detectar la presencia
de ciertos esquemas básicos responsables del comportamiento. De esta manera, el
objetivo específico del Análisis Factorial se vinculó estrechamente con el
objetivo último de la ciencia en general: superar las múltiples y elusivas
apariencias externas en busca de un conjunto reducido de factores internos
explicativos. Galton (1822-1911) matemático y antropólogo,
desarrolló técnicas fundamentales de medición estadística, entre las que
cabe destacar principalmente el cálculo de correlación. Pearson (1857-1936)
matemático y filósofo, definió los significados de correlación, análisis de
regresión y desviación típica. Sin embargo, fue un psicólogo, Charles
Spearman (1863-1938) quien aplicó inicialmente el Análisis Factorial
intentando resolver el dilema acerca de sí la inteligencia respondía a un solo
factor general o sí, por el contrario, estaba conformada por un conjunto de
habilidades específicas. Otros psicólogos, como Thurstone y Garwett en la década
de 1930, prosiguieron en esta línea de investigación, posibilitando que se
desarrollaran, en las décadas de 1940 y 1950, una serie de teorías sobre la
estructura de las habilidades (Vernon), de la inteligencia (Guilford y Eysenck)
y de la personalidad (Eysenck y Cattell). Por tanto, la controversia respecto a la
procedencia del Análisis Factorial puede ser resuelta señalando, a manera de
solución equitativa, que si bien los planteamientos iniciales del Análisis
Factorial resultaron obra de los matemáticos, fueron los psicólogos quienes le
dieron una aplicación práctica. Posteriormente, el Análisis Factorial se
aplicó en la Investigación de Mercados. En este sentido, Green y Frank (1987)
reconocen hidalgamente que la Investigación de Mercados, ha hecho y sigue
haciendo, un uso creciente de conceptos y técnicas tomadas de las ciencias del
comportamiento, tales como la Psicología, la Sociología y la Psicología
Social. La difusión del Análisis Factorial fue impulsada, a partir de la década
de 1960, por la irrupción de cada vez más potentes equipos de cómputo así
como por el desarrollo de programas informáticos cada vez más accesibles.
Green y Frank (1987) han efectuado una breve reseña de las primeras
aplicaciones del Análisis Factorial en la Investigación de Mercados: q
Twedt realizó un estudio sobre los factores determinantes de la lectura de
avisos publicitarios. Se consideró una muestra de 137 anuncios y se tomaron en
cuenta una gran cantidad de variables que debían influir en la lectura de estos
avisos (color, encabezamiento, número de palabras, características del
producto, ubicación, etc.) El resultado del Análisis Factorial fue que 20 de
las variables estaban estrechamente intercorrelacionadas y que de éstas 20, sólo
7 eran realmente significativas. q
Farley llevó a cabo un estudio sobre los factores determinantes en el nivel de
lealtad a una marca de alimentos. Adicional-mente generó un nuevo conjunto de
variables que empleó con fines de pronóstico. q
Harper sometió a un Análisis Factorial los resultados de 13 pruebas de calidad
para quesos. Encontró 3 dimensiones sig-nificativas para evaluar la calidad del
queso. Para finalizar este acápite consideramos
pertinente citar un texto de Kerlinger (1990, p. 648) sobre el Análisis
Factorial: “Debido a su poder, elegancia y proximidad al núcleo del propósito
científico, al Análisis Factorial puede atribuirse el nombre de reina de los métodos
analíticos”. Es
una modalidad del Análisis Multivariado que nos permite reducir una
serie de variables a un conjunto menor (factores) que contienen la
mayor parte de la información y son suficientes para explicar el modelo. Zikmund
(1998) plantea una clasificación del Análisis Multivariado que considera dos
grupos básicos: Métodos de Dependencia y Métodos de Interdependencia. Este
autor indica que el objetivo de los Métodos de Interdependencia es dar
significado a un conjunto de variables o tratar de agrupar las cosas. Por tanto,
el Análisis Factorial se ubicaría dentro de éstos últimos. Kinnear
et al. (1989) manifiestan que es un procedimiento
mediante el cual se toma un gran número de variables y se investiga para ver si
tienen un pequeño número de factores en común que expliquen su intercorrelación. Grande et al. (1996) señalan que el Análisis
Factorial de Componentes Principales analiza tablas de individuos por variables
métricas. Es decir, este análisis se aplica a tablas rectangulares de datos,
en las que las columnas representan las variables y las filas a los individuos.
Esto se puede apreciar en el siguiente gráfico: VARIABLES SUJETOS X1 X2 X3 X4 X5 1 2 3 4 McDaniel
et al. (1999) precisan que el objetivo del Análisis
Factorial es simplificar los datos ya que condensa la información contenida en
un gran número de unidades métricas (por ejemplo, escalas de calificación) en
un número más pequeño de escalas resumidas, llamadas “factores”. Por ejemplo, una encuesta conformada por 40
items (cada uno de los cuales será considerado una variable de insumo, es
decir, de entrada) con seguridad contendrá una serie de redundancias, en el
sentido de que varios de los items pueden estar midiendo en parte la misma idea
fundamental. Esta idea fundamental es lo que se denomina “factor”. Aaker
(1990) define el “factor” como una variable que no es directamente
observable pero que necesita ser inferida de las variables de insumo (entrada).
Es decir, el factor es el agrupamiento de aquellas variables de insumo que miden
o que son indicadoras del factor. Zikmund
(1998) propone el siguiente ejemplo, en el cual, las variables talla y peso
pueden ser resumidas en el factor “condición física” y las variables
ocupación, educación e ingreso pueden ser resumidas en el factor “condición
social”.
VARIABLES
FACTOR Malhotra
(1997) señala que el Análisis Factorial puede aplicarse en: q
Segmentación de Mercados: Para identificar las variables subyacentes en las
cuales deben agruparse los clientes. Así, por ejemplo, los compradores de automóviles
nuevos pueden agruparse sobre la base de la importancia que dan a la economía,
la comodidad, el desempeño, el lujo, el servicio postventa, etc. q
Investigación de Productos: Para identificar los atributos de las marcas que
influyen en la elección del consumidor. Una marca de pasta dental puede
evaluarse por: la protección contra la caries, la blancura que proporciona a
los dientes, el sabor, el aliento fresco que otorga, su precio, etc. q
Publicidad: Para comprender los hábitos de consumo del mercado meta. Los
consumidores de comida rápida (fast food) pueden espectar determinados
programas de TV, preferir determinado tipo de música, gustar determinado tipo
de ropa, transporte, etc. q
Estudios sobre Precios: Para identificar las características de los
consumidores sensibles al precio. Estos consumidores pueden ser de clase media,
preocupados por la economía, caseros, etc.
El Análisis Factorial se utiliza para
reducir una gran masa de información a un nivel fácil de manejar. Si se han
recolectado 50 atributos de un producto, el Análisis Factorial reducirá los
atributos a un número mínimo de factores que sustenten los 50 atributos y que
pueden utilizarse posteriormente en vez de los 50 atributos con una pérdida mínima
de información. Un nuevo campo de aplicación es el del MARKETING POLÍTICO
(Segmentación de Electores, Características Ideales del Candidato, Características
de los Electores de cada Candidato, etc.) 4.
PASOS PARA REALIZAR UN ANÁLISIS FACTORIAL Malhotra
(1997) indica que es importante que las variables consideradas para el Análisis
Factorial se midan con una escala de intervalo y que el tamaño de la muestra
sea, cuando menos, el quíntuplo de las variables empleadas. Por su parte,
Weiers (1986) señala que es conveniente aplicar una prueba preliminar (Prueba
Piloto o Pre–Test) A esta Prueba Piloto se le aplica el Análisis Factorial
para “depurarla” de modo que sólo contenga preguntas realmente relevantes,
es decir, que midan cosas distintas sobre el objeto de estudio. Con esto se
ahorra gastos de tipeo y de su aplicación, se abrevia el cuestionario y se
incrementa la tasa de respuestas. Kinnear
et al. (1989) manifiestan que hay tres pasos en el
proceso de Análisis Factorial: a. Elaboración de la Matriz de
Correlaciones Se
debe obtener, en primer lugar, una matriz en la que se ubican las correlaciones
entre todas las variables consideradas. Es muy conveniente solicitar una serie
de pruebas conexas (tests) que nos indicarán si es pertinente, desde el punto
de vista estadístico, llevar a cabo el Análisis Factorial con la data y
muestras disponibles. Al respecto, Miquel et al. (1999) señalan que la mayoría
de programas computarizados que realizan el Análisis Factorial disponen de una
serie de tests que permiten verificar si es posible llevar a cabo el mismo.
Entre los principales tenemos: q
El Test de Esfericidad de Bartlett: Se utiliza para probar la Hipótesis Nula
que afirma que las variables no están correlacionadas en la población. Es
decir, comprueba si la matriz de correlaciones es una matriz de identidad. Se
puede dar como válidos aquellos resultados que nos presenten un valor elevado
del test y cuya fiabilidad sea menor a 0.05. En este caso se rechaza la Hipótesis
Nula y se continúa con el Análisis. q
El Índice Kaiser-Meyer-Olkin: Mide la adecuación de la muestra. Indica qué
tan apropiado es aplicar el Análisis Factorial. Los valores entre 0.5 y 1
indican que es apropiado aplicarlo. El Gráfico de Sedimentación representa en
el eje de las “x” el número de orden de los factores y en el eje de las
“y”, los valores propios (eigenvalues). Muestra la forma en que van
disminuyendo los valores propios, graficando el hecho de que el primer factor es
el que más varianza explica. La “comunalidad”, es la cantidad de
varianza que una variable comparte con las demás variables consideradas. Los
“eigenvalue” (valores propios) pueden interpretarse como la cantidad de
varianza explicada por cada factor. La “carga factorial” es la correlación
entre las variables y los factores. b.
Extracción de los Factores Iniciales Se
dispone de muchos métodos para extraer los Factores Iniciales de la matriz de
correlación. El más utilizado y el que empleamos en este estudio es el de
“Componentes Principales”. Este procedimiento busca el factor que explique
la mayor cantidad de la varianza en la matriz de correlación. Este recibe el
nombre de “factor principal”. Esta varianza explicada se resta de la matriz
original produciéndose una matriz residual. Luego se extrae un segundo factor
de esta matriz residual y así sucesivamente hasta que quede muy poca varianza
que pueda explicarse. Los factores así extraídos no se correlacionan entre
ellos, por esta razón se dice que estos factores son ortogonales. c.
Rotación de los Factores Iniciales Con frecuencia es difícil interpretar los
factores iniciales, por lo tanto, la extracción inicial se rota con la
finalidad de lograr una solución que facilite la interpretación. Hay dos
sistemas básicos de rotación de factores: los métodos de rotación
ortogonales (mantienen la independencia entre los factores rotados: varimax,
quartimax y equamax) y los métodos de rotación no ortogonales (proporcionan
nuevos factores rotados que guardan relación entre sí). En el presente estudio
aplicaremos los métodos de rotación ortogonales, específicamente el Método
de Rotación Varimax. Éste es, actualmente, uno de los métodos más
utilizados. En
cuanto a la denominación que debe adjudicarse a los factores encontrados,
McDaniel et al. (1999) señalan que esto es algo subjetivo y requiere de una
combinación de intuición y conocimiento de las variables. En lo que se refiere
a cómo interpretar el “Gráfico de Factores” (Gráfico de Saturaciones), Grande et al. (1996) señalan las siguientes indicaciones generales: q
Proximidades entre las variables: Dos o más variables muy correlacionadas
positivamente se sitúan muy próximas. Dos o más variables muy correlacionadas
negativamente están muy alejadas. Si son independientes, su distancia es del
tipo medio. q Cuanto más alejada esté una variable del origen en un plano factorial
mayor es la calidad de representación sobre ese plano. Utilizaremos
un caso muy sencillo. La data ha sido tomada de Gómez Bezares (1985) y ha sido
modificada ligeramente con propósitos expositivos. Una empresa especializada en
el diseño de automóviles de turismo desea averiguar cuáles son las
preferencias más importantes del público que compra estos automóviles.
Con este fin diseña una encuesta de diez preguntas y se la aplica a un grupo de
potenciales clientes. Se les pide que valoren de 1 a 5 cada una de las características.
A mayor puntuación mayor preferencia de la característica. Estas diez características son:
VARIABLES
CARACTERÍSTICA V1
Que sea barato V2
Que se pague a plazos V3
Que tenga poco consumo V4
Que use gasolina normal V5
Que sea seguro V6
Que sea confortable V7
Que tenga gran capacidad V8
Que de buenas prestaciones V9
Que sea juvenil V10
Que sea aerodinámico Se
trata de averiguar si estas diez variables pueden agruparse en pocos factores.
Tabuladas las encuestas los datos se ingresan al SPSS. Las variables (características
vehiculares) se ingresan como columnas y los datos de cada sujeto conforman una
fila. Inicialmente el SPSS arroja la respectiva Matriz de Correlaciones, la cual
se puede apreciar en la siguiente imagen: A
continuación apreciamos los resultados de los tests requeridos: Test de
Bartlett e Índice Kaiser-Meyer-Olkin: Luego, el SPSS da la primera Matriz
Factorial (No Rotada) que presenta la “Carga Factorial” (correlaciones entre
las variables iniciales y los “factores” recién creados). En el caso de nuestro estudio apreciamos
que se han extraído dos factores. El primer factor (Factor 1) presenta una
mayor cantidad de variables altamente correlacionadas. Hay que tener en cuenta
que, como indica Gómez Bezares (1985), el primer factor antes de la rotación
es el que mejor discrimina. q
Que use gasolina normal
(0.933) q
Que se pague a plazos
(0.923) q
No juvenil
(-0.879) q
Que sea barato
(0.878) q
No buenas prestaciones
(-0.861) q
Que tenga poco consumo
(0.840) q
No aerodinámico
(-0.765) El segundo factor (Factor 2) aglutina las
siguientes características: q
Que sea confortable
(0.900) q
Que sea seguro
(0.720) q
Que tenga gran capacidad
(0.671) Esto
se puede apreciar en el siguiente Gráfico de Factores (Gráfico de
Saturaciones) proporcionado por el SPSS: A continuación el SPSS entrega la Tabla de
Estadísticos Finales. Encontramos que ha variado la “comunalidad” y que se
ha reducido el número de factores. La variación en las comunalidades es
consecuencia directa de la reducción de los factores. Las comunalidades
expresan la cantidad de información de cada variable representada en los
factores que quedan. En la Tabla de Estadísticos Finales se
puede observar que hay dos factores. De esta forma se ha pasado de diez
variables a tan sólo dos, produciéndose la pérdida de tan solo el 22.3% de la
información original representada por las diez variables iniciales. De
inmediato el SPSS muestra la Matriz Factorial Rotada, la que ofrece el mismo
tipo de información que la Matriz Factorial No Rotada, aunque en este caso la
nueva matriz se ha obtenido tras un proceso de rotación ortogonal (Rotación
Varimax). Vemos
que las variables importantes siguen las mismas y con coeficientes muy parecido,
por lo que la interpretación no varía. 6.1 CONCLUSIONES El Análisis Factorial es una de las técnicas
más complejas de la Investigación de Mercados la cual, gracias al desarrollo
de la informática, puede ser aplicada actualmente con relativa facilidad. Además,
brinda la posibilidad de optar entre diferentes procedimientos de acuerdo a los
objetivos del estudio, lo que confiere a este análisis la posibilidad de buscar
la solución más precisa, desde el punto de vista matemático y, la más
elegante, desde el punto de vista estético. Como conclusión teórica podemos citar lo
manifestado por Namakforoosh (1995) respecto del Análisis Factorial: Reduce la
multiplicidad de pruebas y medidas hasta lograr una sencillez notable. Indica qué
pruebas y medidas pertenecen al mismo grupo y cuáles miden prácticamente lo
mismo. Por lo tanto, reduce el número de variables y ayuda a localizar o
identificar unidades o propiedades fundamentales en que se deben basar las
pruebas. Como
conclusión empírica podemos indicar que las
diez variables consideradas inicialmente han quedado reducidas a dos factores:
“economía” y “seguridad”. Se ha pasado de diez
variables a dos, produciéndose la pérdida de tan sólo el 22.3% de la
información original representada por las diez variables iniciales. Por tanto,
puede aplicarse una encuesta de sólo 2 ó 3 items, por ejemplo: a) Que sea económico;
b) Que sea seguro; c) Que no sea deportivo. 6.2.
BIBLIOGRAFÍA 1.
Aaker, D. (1990) Investigación de Mercados. México: McGraw Hill. 2.
Alarcón, R. (1991) Métodos y diseños de investigación del comportamiento.
Lima: UPCH-CONCYTEC. 3.
Angeles, J. (1995) Procesamiento estadístico de datos. Lima: Universidad del
Pacífico. 4.
Bellido Vásquez, Pedro (1992) Análisis Estadísticos por Computadora:
Aplicaciones en Administración e Investigación de Mercados. Lima: Separata. 5.
Gómez Bezares, F. (1985) Cómo utilizar e interpretar la Estadística. Madrid:
Ibérico. 6.
Grande Esteban, I. & Abascal, E. (1996) Fundamentos y Técnicas de
Investigación Comercial. Madrid: ESIC. 7.
Green, P y Frank, R. (1987) Investigación de Mercados. México: Limusa. 8.
Kerlinger, F. (1990) Investigación del Comportamiento. México: Interamericana. 9.
Kinnear, Th. & Taylor, D. (1989) Investigación de Mercados. Bogotá: McGraw Hill. 10.
Lerner, M. (1994) Métodos y procedimientos de Investigación de Mercados. Lima:
CIUP. 11.
Malhotra, N. (1997) Investigación de Mercados: Un enfoque práctico. México:
Prentice Hall. 12.
McDaniel, C. & Gates, R. (1999) Investigación de Mercados Contemporánea. México:
Thomson. 13.
Miquel, S. & Bigné, E. & Cuenca, A. & Miquel, J. & Lévy, J.
(1999) Investigación de Mercados. Madrid: McGraw
Hill. 14.
Namakforoosh, M. (1995) Metodología de la Investigación. México: Limusa. 15.
Prialé, F. (1983) Tests Computarizados. Revista de Psicología. Vol. I, No. 2. Universidad Católica.
Lima. 16.
Weiers, R. (1986) Investigación de Mercados. México: Prentice Hall. 17.
Zaltman, G. y Burger, Ph. (1980) Investigación de Mercados. Barcelona: Hispano
Europea. 18.
Zanolo, B. (1989) Introducción a la computación en Psicología. Lima:
Biblioteca Peruana de Psicología-CONCYTEC. 19.
Zikmund, W. (1998) Investigación de Mercados. México: Prentice Hall. Agradecemos anticipadamente cualquier
consulta y/o sugerencias. Sírvase dirigirse a: Pedro
Bellido Vásquez Tlf. 9995120 (Lima – Perú) ARTÍCULOS
DEL AUTOR PUBLICADOS EN LA WEB q
ESTADÍSTICAS PARA MARKETING (1) EL ANÁLISIS FACTORIAL q
ESTADÍSTICAS EN LA INVESTIGACIÓN OPERATIVA (1) ESTRATEGIAS DE LOCALIZACIÓN q
ESTADÍSTICAS EN LA INVESTIGACIÓN OPERATIVA (2) PROGRAMACIÓN LINEAL Publicación enviada por Pedro Bellido Vásquez Contactar mailto:pedrobellido@hotmail.com Código ISPN de la Publicación EpyukylkEFAVidhbVk Publicado Monday 22 de September de 2003 Ultimas Publicaciones en ilustrados.com
ilustrados.com nace con el fin difundir el conocimiento publicando trabajos de investigación, monografias, tesis, presentaciones powerpoint y afines. Publicar trabajos en ilustrados.com ha alcanzado prestigio y reconocimiento internacional siendo cada vez más el número de académicos, empresas, investigadores, científicos que consultan las publicaciones de nuestro portal. | |||||||||||||||||||||||||||||||||||||||