Ledelse og Erhvervsøkonomi/Handelsvidenskabeligt Tidsskrift/Erhvervsøkonomisk Tidsskrift, Bind 36 (1972)Faktoranalyse - en metode til datakomprimeringNiels J.Blunch *) ResuméEt ofte tilbagevendende problem ved behandling af data fra markedsanalyser, er den store datamængde, der kan gøre det vanskeligt at overskue sammenhænge mellem de mange variable, der indgår i en sådan analyse. Man løber en risiko for at »drukne i data«, og der opstår behov for fremgangsmåder, der kan hjælpe til at besvare spørgsmål som: (1) hvilke variable skal jeg vælge til videre analyse? og (2) hvad er det egentlig jeg måler med alle de mange variable? I denne artikel skal gives en kortfattet introduktion til den såkaldte faktoranalyseteknik, der i de senere år har fundet stadig større anvendelse ved løsning af disse problemer. Artiklen er disponeret som følger: 1. Om univariable og multivariable statistiske modeller. — 2. Problemet. - 3. Faktoranalyse og komponentanalyse. - 4 En geometrisk fortolkning af de principale komponenter, — 5. Eksempler på anvendelse af faktoranalyse inden for marketingområdet. - Matematisk appendix. 1. Om univariable og multivariable statistiske modellerDe statistiske metoder, der gennem årene: har vundet indpas i markedsanalysearbejdet og som i dag udgør en væsentlig del af enhver lærebog inden for området, er karakteriseret ved stort set at være begrænset til univeriable metoder, d.v.s. til metoder, hvor der kun knyttes én statistisk variabel til hvert af de elementer (personer, virksomheder el. lign.), der er genstand for undersøgelse. *) Cand. mere, amanuensis ved Institut for Markedsøkonomi, Handelshøjskolen i Århus. Det er velkendt, at dette gælder for hele dataindsamlingsområdet, hvor teorierne omkring de repræsentative undersøgelser (stratifiering, klyngeudvælgelse etc.) implicit bygger på den forudsætning, at kun en enkelt variabel er genstand for undersøgelse; medens teorien stort set er ude af stand til at give velfunderede operationelle anvisninger på, hvorledes man skal løse de problemer, der opstår, når dette ikke er tilfældet. Inden for det område, der omfatter analysen af de indsamlede data, gør samme tendens sig imidlertid gældende: De statistiske modeller, man anvender, er næsten alle univariable. Dette gælder endog modeller, hvori indgår måling af flere egenskaber. F. eks. er den almindelige multiple regressionsmodel ikke
multivariabel i statistisk forstand, da den eneste
statistiske variabel Da man imidlertid inden for markedsanalysen næsten altid er interesseret i at måle flere egenskaber ved de elementer ( f. eks. personer, husstande eller virksomheder), der er genstand for undersøgelse, opstår der behov for en teoribygning for multivariable statistiske ?nodeller. En sådan har da også været under stadig udvikling siden tyverne. Det er dog først inden for den sidste halve snes år, at de udviklede metoder har fundet udbredelse inden for markedsanalysen, men så er der til gengæld også tale om en eksplosionsagtig udvikling, således at man i dag næppe kan åbne et markedsanalysetidsskrift uden at støde på betegnelser som diskritninantanalyse og faktoranalyse. Hvorfor er der da
gået så lang tid inden metoderne har fundet anvendelse
Vor det første støder opbygningen af en statistisk teori for multivariable fordelinger på større teoretiske vanskeligheder, end tilfældet har været med den univariable teori: De matematiske formuleringer bliver mere komplicerede, og ikke mindst opstår der problemer, når de opnåede resultater skal fortolkes. Udviklingen er derfor gået langsomt, og problemer, der for længst er klaret for de univariable tilfælde, er stadig uløste. Vor det andet medfører anvendelsen af de udviklede metoder så enorme beregningsarbejder, at alene dette rent praktiske forhold indtil fremkomstenaf EDB har kunnet sætte en stopper for en mere udbredt anvendelseaf de teoretiske resultater. Det er i den forbindelse værd at gøre sig klart, at selv om nogle af de pågældende metoder har været anvendt i antropologi, biologi og botanik i snart et halvt hundrede år og ferst har naet markedsanalysen via psykologers og sociologers anvendelse,er det forst i de sidste ar, at metoderne har fundet virkelig udbredt anvendelse inden for savel disse som andre videnskaber, og der er ingen tvivl ora, at dette ma saettes i f orbindelse rned EDB-anlaeggenesvoksende Jeg har i en tidligere artikel (En metode til klassificering af kundeemner. Erhvervsøkonomisk Tidsskrift rtr. 2, 1968, p. 81) beskæftiget mig med den multivariable model, der går under navnet multipel diskriminantanalyse og vil i det følgende give en introduktion til den vel nok mest anvendte af alle multiple modeller, nemlig faktoranalysen eller rettere komponentanalysen (en nærmere præcisering af disse begreber foretages i afsnit 3). Dog først lige et par ord om multivariable sandsynlighedsfordelinger. Foretages der måling af p egenskaber ved de elementer, der er genstand for undersøgelse og opfattes disse p målinger som statistiske variable, bliver deres simultane sandsynlighedsfordeling p-dimensional, medens det sæt målinger, der er knyttei: til det enkelte element, kan opfattes som en søjlevektor i p dimensioner: (1.1) Vektorer betegnes her som overalt i det følgende med tykke små bogstaver, medens matricer betegnes med tyl.cke store bogstaver. Vektoren x opfattes da som en statistisk variabel, og dens forventede værdi er den vektor, hvis elementer er de forventede værdier for elementerne i (1.1), altså: (1.2) Som bkendt
defineres variansen på en statistisk variabel x som
(1.3) En analog
anvendelse af denne definition på det multivariable
tilfælde (1.4) hvor T angiver, at vektoren er transponeret. o-., betegner kovariansen mellem den i'te og den j'te variabel. Hvor i—j angiver o-., variansen i den i'te marginalfordeling. I overensstemmelse med den almindelige konvention skrives som regel a\ i dette tilfælde. 2. ProblemetVed markedsanalyse såvel som ved anden dataindsamling, hvor der indsamles data om flere egenskaber ved de elementer, der er genstand for undersøgelse, vil. man ofte have en mere eller mindre velbegrundet mistanke om, at i hvert fald nogle af de foretagne målinger ved det enkelte element er korrelerede. Skulle dette være tilfældet, indeholder de indsamlede data redundant information forstået på den måde, at flere af malingerne i større eller mindre omfang dækker over samme grundlæggende egenskaber ved det enkelte element. Dette kan afbildes i et Venn-diagram, hvor hver enkelt cirkel illustrerer den mængde af egenskaber, der registreres ved den pågældende måling. Vi ser, at i det afbildede tilfælde registrerer målingerne 1 og 2, 1 og 3, 2 og 3 samt 2 og 4 parvis nogle fælles egenskaber (angivet ved skravering), ligesom en mindre mængde egenskaber registreres af både måling 1, 2 og 3 (angivet ved dobbelt skravering). Derimod registrerer måling 5 udelukkende egenskaber, der ikke registreres af andre målinger. Faktoranalyse er netop den falles betegnelse for en række teknikker til at kortlægge denne underliggende struktur i elementernes egenskaber. En sådan kortlægning har stor teoretisk og praktisk interesse. For det første kan det have interesse at fastslå, hvor mange »egenskaber«, vi egentlig måler ved hvert element Er der overlapninger således som vist i figur 1, er antallet af egenskaber mindre end antallet af målinger. Det vil derfor eventuelt være muligt - med kendskab til måleteknikken - at identificere (»navngive«) disse egenskaber. For det andet må tilstedeværelsen af redundant information betyde, at det er muligt at komprimere de indsamlede data uden at miste for meget information. En sådan komprimering må kunne ske enten ved at nogle af målingerne bortkastes;., eller ved at der skabes en enkelt eller nogle få nye ukorrelerede variable,, der er funktioner af de oprindelige. Faktoranalysen anviser netop, hvorledes denne komprimering kan foretages med mindst mulig tab af information. I denne sidste anvendelse er faktoranalysen altså ikke nogen erstatning for eller konkurrent til de gammelkendte analysemetoder (som f. eks. regressionsanalyse), men derimod et glimrende supplement til disse på de tidligere og mere explorative stadier i analysearbejdet. Disse er jo ofte karakteriseret ved, at man endnu ikke har klart formulerede hypoteser med hensyn til hvilke variable, der er relevante for problemstillingen. Under den indledende søgen efter brugbare arbejdshypoteser, vil man derfor ofte starte med at kaste det: store men ret grove net ud: En lang række forhold gøres til genstand for en ret overfladisk undersøgelse, og på grundlag heraf vælges så de variable, der findes relevante for en nøjere undersøgelse. 3. Faktoranalyse og komponentanalyseDer må på dette sted skelnes mellem faktoranalyse og komponentanalyse. Som regel benyttes begreberne i flæng, eller faktoranalyse anvendes som en fællesbetegnelse. I virkeligheden dækker de to betegnelser to forskellige problemstilinger, som det nok er værd at holde sig for øje, selv om de som regel sammenblandes. Ved
faktoranalyse har vi a priori opstillet den teori, at de
p målinger, lingermålerfælles egenskaber.
Spørgsmålet er nu: Hvorledes er sammenhængenemellem
Dette kan lidt
mere formelt udtrykkes i folgende model: (3.1) Denne model
fortolkes som følger: Resultatet af den i'te måling op
(1)(1) m
nkorrelerede egenskaber, fk , der er faelles for flere
malinger (2) En
risidualvserdi, c.'* der repraesenterer enten en
egenskab, der De m egenskaber
kaldes fcelles faktorer (common factors) og de mp
Bemærk at de p målinger, x., udtrykker m variable, der ikke er direkte konstaterbare. Derimod udtrykker (3.1) en model, og problemet er at estimere denne models parametre, lik, samt at teste modellen. For at kunne gøre dette, er det nødvendigt at opstille forudsætninger vedrørende fordelingen for x. Denne forudsættes som regel at være multinormal, da dette foruden at være det eneste gennemarbejdede tilfælde, ofte vil være den rimeligste forudsætning. Af ovenstående følger, at der er uendelig mange faktormatricer L = (lik), der opfylder (3.1). Faktoranalysearbejdet falder derfor i to faser. Først bestemmes en vilkårlig faktormatrix, L. De ved L bestemte faktorer vil kun sjældent kunne fortolkes meningsfuldt. Derfor vil man i anden fase søge at transformere L til en ny matrix, der med bibeholdelse af samme »usikkerhed«, e, er lettere at fortolke. Idealet er, at den ny matrix - den såkaldte roterede faktormatrix - har rækker (eller søjler) hvori der kun forekommer én værdi nær 1, og at alle andre elementer i rækken (søjlen) har værdier nær 0. D.v.s. at hver måling kun er stærkt korreleret med én faktor (eller at hver faktor kun er stærkt korreleret med én måling). Det vil da være lettere, med kendskab til måleteknikken og til den foreliggende teoribygning inden for det område, der er genstand for undersøgelse, at »navngive« faktorerne. Der kommer ved denne rotation - der foregår ved fortsatte multiplikationer af L med ortogonale matricer - et subjektivt element ind i faktor analysen, som man ingenlunde må være blind for. Ved komponentanalyse har vi derimod ikke a priori opstillet nogen teori angående antallet af fælles faktorer, men kan tværtimod have til hensigt at benytte de indsamlede data som udgangspunkt for opstilling af en sådan model. Da vi ikke a
priori har fastlagl: m, vil vi i stedet Soge at udtrykke
yk kaldes i komponentanalysen, principale komponenter (principal components). Det er muligt, at vi kan udtrykke de p målinger, x., i færre end p variable, yk, og iså fald har vi opnået en reduktion i vort problems dimension (ligesom ved faktoranalyse). Dette vil imidlertid være undtagelsen, og i stedet vil vi søge en reduktion »med tilnærmelse« ved følgende teknik: Vi har i (3.2)
udtrykt x'erne som funktioner af y'erne, men det er
Vi kan betragte
(3.3) som en transformation af de p x'er til p nye
På den måde får vi altså ved at se bort: fra nogle af y'erne summen i (3.2) til at indeholde færre end p led, mod at lighedstegnet nu kun gælder »med tilnærmelse«. Selv om man ikke kan (eller vil) »ofre« nogle af y'erne, men i stedet vælger af: arbejde videre med dem alle p, vil det forhold, at de - i modsætning til x'erne - er ukorrelerede være en fordel i sig selv ved mange former for videre statistisk analyse af materialet. I modsætning til, hvad der er tilfældet med faktoranalysen, er bestemmelsenaf matricen L= (l-k) eller den dermed forbundne matrix A= (ajk) eentydig bortset fra fastlæggelsen af en skala. Dette betyder, at fortsat rotation for at finde mere »meningsfulde« dimensioner, vil medføre, at de principale komponenters egenskab, at de er ordnet efter faldende (og
maksimal) varians, falder væk. Dette er et forhold, som
Læg mærke til, at ved faktoranalyse arbejder vi os fra en model mod nogle data, medens vi ved komponentanalysen arbejder fra data mod model. Det er altså ikke ved komponentanalyse nødvendigt med nogen form for forudsætninger angående variabierne xr Kun deres kovariansmatrix er af interesse, medens deres statistiske fordeling i øvrigt er uinteressant. Jeg har her prøvet at drage et skel mellem faktor- og komponentanalyse. Som tidligere nævnt anvendes disse udtryk oftest i flæng, eller man benytter betegnelsen faktoranalyse om dem begge. Dette skyldes to forhold: (1) I praksis vil man oftest arbejde »i ring«: Nogle data giver anledning til opstilling af en model (komponentanalyse), og senere søger man at verificere modellen på andre data (faktoranalyse). Dette fører måske til modifikation af modellen, der så igen søges verificeret o.s.fr. (2) Jeg har ovenfor skitseret formålene og principperne i de to former for analyse, medens de til rådighed stående beregningsteknikker ikke er behandlet. Af sådanne findes der et utal, og det gælder for en del af disse, at de kan anvendes i nogenlunde samme form både til komponent- og faktoranalyse, hvilket medvirker til sammenblandingen af begreberne. Den teknik, der efter fremkomsten af EDB sædvanligvis regnes for den bedste, har navnet »principale komponenters metode«. Den er i sit udgangspunkt en komponentanalyse, og vil i appendix blive gennemgået i denne form, men den finder efterhånden i tillempet form også anvendelse inden for det, der ovenfor er kaldt faktoranalyse. 4. En geometrisk fortolkning af de principale komponenterBegnenser vi os til det to-dimensionale tilfaelde - hvor der foretages to malinger, xl og x2, pa hvert element, kan resultatet af en stikproveundersogelse baseret pa n observationer afbildes i et saedvanligt retvinklet koordinatsystem, idet vi afbilder den j'te observation som det af stedvektoren (4.1) bestemte punkt.
En sådan afbildning er foretaget i figur 2, hvor det
Som nzevnt i appendix svarer den vecl. komponentanalysen foretagne ortogonale transformation til en drejning af koordinatakserne omkring origo, saledes at observationerne i clet ny koordinatsystem er givet ved ligning (3.3). I det to-dimensionale tilfaelde fas: (4.2) hvor
koefficienterne er bestemt ved, at yx skal have størst
mulig varians, Lad os først se, hvad der sker, hvis vi drejer xt-aksen om origo. Det fremgår, at hvis en sådan drejning foregår mod uret, vil punkternes xx-koordinater i begyndelsen blive »spredt mere ud«: Variansen vil vokse. Fortsætter drejningen vil xj/koordinaterne igen blive »trykket sammen«: Deres varians vil blive mindre. Observationsmaterialets maksimale varians målt på den således drejede xl-aksex1-akse opnås åbenbart når aksen går »midt gennem« punktklyngen. Benytter vi nu betegnelsen y1 -aksen for den således drejede xj-akse, har vi åbenbart opnået, at kunne udtrykke vore to målinger x:L og x2x2 ved en ny variabel ylsyl5 der er den lineære funktion af x 1x1 og x2, der har størst varians. y2-aksen må da stå vinkelret på yj-aksen i origo, da yt og y2y2 skal være ukorrelerede. I figur 2 er de nye koordinatakser indtegnet ligesom de karakteristiske vektorer er angivet. Vi ser, at disse entydigt bestemmer beliggenheden af det nye koordinatsystem. Det skal til sidst bemærkes, at y-L-aksen ikke må forveksles med den sædvanlige regressionslinie, der bestemmes ved minimering af summen af punkternes lodrette afstand fra linien. Derimod kan det bevises, at summen af punkternes vinkelrette afstand fra y1 -aksen er mindre end til nogen anden ret linie. Denne egenskab, der er en konsekvens af Phytagoras læresætning, betyder, at bestemmelsen af yt -aksens beliggenhed i anden forbindelse ofte omtales som ortogonal regression. Denne mere håndfaste geometriske fortolkning af de principale komponenter lader sig uden videre generalisere til flere end to dimensioner — selv om man ved flere end tre dimensioner må tage fantasien til hjælp. At transformere de oprindelige variable, x, til nye ukorrelerede variable, y, med maksimal varians er altså ensbetydende med at foretage en drejning af koordinatakserne., således at summen af punkternes kvadratafvigelser fra den første nye koordinatakse minimeres. Dernæst bestemmes den anden koordinatakse således, at den er vinkelret på den første i origo og således, at summen af punkternes kvadratafvigelse fra den minimeres o.s.fr. Vi ser, at det ej heller i denne formulering af problemstillingen er nødvendigt at gøre forudsætninger om den statistiske fordeling for x. 5. Eksempler pa anvendelse af faktoranalyse inden for marketingområdet.Massy
grupperer de formal, man kan forfeilge med
faktoranalysen som (1) Bestemmelse
af antallet af dimensioner, der er nødvendigt til
beskrivelse (2) Gruppering af
de undersøgte elementer i mindre, homogene (3) Bestemmelse
af hvilke målinger, der skal udvanges til videre
(4) Skabelse af
helt nye variable, der - som funktioner af de
oprindelige Man vil bemærke, at i de to første anvendelser er faki:oranalysen den endelige analysemetode og altså et mål i sig selv, medens den i de to sidste anvendelser ikke er en konkurrent til andre analysemetoder, men et supplement til disse. Det er min opfattelse, at det er i denne - måske mere ydmyge rolle - at metoden vil komme til at få sin største betydning inden for markedsanalysearbejdet. Der er i den sidste halve snes år fremkommet en lang række referater af praktiske anvendelser inden for marketingområdet, således at en blot nogenlunde dækkende gennemgang af disse ikke er mulig inden for en tidsskriftsartikels rammer. Jeg vil derfor i stedet knytte nogle kommentarer til de af Massy opstillede fire problemformuleringer og illustrere dem med enkelte henvisninger til offentliggjorte analyserapporter. Ad (1). Bestemmelse af antallet af dimensioner, der er nødvendigt til beskrivelse af et elements egenskaber,Dette er den oprindelige anvendelse af faktoranalyseteknikken. Problemetopstod ved psykologers forsøg på ved hjælp af en lang række tests at beskrive et menneskes personlighed. Spørgsmålet var nu: Måler disse mange tests nu virkelig forskellige egenskaber, og hvis ikke, hvor mange dimensioner er da nødvendig til en tilfredsstillende beskrivelseaf personligheden? Dette fører imidlertid frem til en grupperingaf tests, der måler samme dimension. En sådan gruppering er af stor praktisk interesse, da den giver mulighed for inden for hver gruppe, at vælge den bedste test, d.v.s. den test, der er stærkeste korreleretmed den pågældende faktor (—dimension), smlgn. formål (3) i Massy's opstilling. Af større teoretisk interesse er det imidlertid, at man med udgangspunkt i en sådan gruppering eventuelt kan opnå at identificere
(»navngive«) de enkelte faktorer og dermed give disse
Fra psykologerne er faktoranalysen kommet til marketingomradet sammen med skaleringsteknikkerne. De forste - og fleste - markedsanalyseanvendelser er da ogsa sket i forbindelse med fortolkningen af indstillingsundersogelser af forskellig art ved hjselp af skaleringsteknik. Et eksempel herpa er Eastlack's anvendelse af faktoranalyse af prasferancedata ved benyttelse af Osgood's semantiske differentialskala. Formålet med undersøgelsen var at bestemme hvilke egenskaber en ny kaffeblanding, der skulle sælges som mærkevare, skulle være i besiddelse af for bedst muligt at appellere til en større andel af forbrugere på et lokalt marked. Som et eksempel på en anden problemstilling, der kan angribes med faktoranalyseværktøjet kan nævnes Dudek's analyse af en række af de af amerikanske markedsanalyseinstitutter publiserede index for TVkigning. Formålet var her at undersøge, i hvilket omfang de forskellige index måler samme dimensioner og hvilke dimensioner, der da er tale om. Der er et aspekt ved anvendelsen af faktoranalyse som middel til at fortolke måleresultater, som det nok er værd at ofre et par ord på: I denne anvendelse, hvor man »navngiver« de matematiske abstraktioner, der optræder under den neutrale betegnelse faktorer, benytter man sig i realiteten af faktoranalysen som et udgangspunkt for en generering af teorier. Såfremt man benytter faktoranalysens resultater forudsætningsløst, d.v.s. lader dem tale for sig selv uden at referere til den almindelige viden og teoribygning, der findes inden for det fagområde analysen anvendes på, løber man en meget alvorlig risiko for, at der kommer meningsløse eller direkte vildledende resultater frem. Det er jo velkendt, at korrelation ikke er ensbetydende med rsagssammenhæng, blot er et udtryk for samvariation. Utallige er de advarsler, vi har fået: mod at drage for vidtgående slutninger på grundlag af den såkaldte »nonsenskorrelation« mellem f. eks. antallet af skudte ræve i Finland og antallet af indgåede ægteskaber i Paris, for nu at nævne et klassisk eksempel. Ved faktoranalyse
ei: risikoen for at gå vild på denne måde i
virkeligheden Ad (2). Gruppering af de undersøgte elementer i mindre, homo gene grupper.I den første anvendelse af faktoranalyse var udgangspunktet en gruppering af målinger, således at målingerne inden for hver gruppe var stærkt korrelerede indbyrdes, og derfor forudsattes at måle samme egenskabsdirnension(er), kaldet faktorer. Foretager man fuldstændig samme beregninger, men nu således at man lader målinger og elementer bytte plads overalt i beregningerne, vil man åbenbart opnå, at få opdelt elementerne i mindre grupper, der er homogene med hensyn til de foretagne målinger. Med et blot nogenlunde rimeligt antal elementer vil kovariansmatricen, V, få så enorme dimensioner, at der opstår problemer med lagerkapacitet ved EDB-anvendelse, og det er da heller ikke lykkedes mig at finde offentliggjorte eksempler på anvendelse af denne såkaldte omvendte faktoranalyse på realistiske problemer. De steder, den har været anvendt har nærmest haft form af pilot-undersøgelser med det formål at studere metoden og ikke problemet. En nærliggende anvendelse af omvendt faktoranalyse er gruppering af forbrugerne i grupper, der hver især er mere homogene i deres følsomhed over for de forskellige handlingsparametre end alle forbrugere taget under ét. En sådan viden kan danrie grundlag for at differentiere en virksomheds politik over for enkelte segmenter af markedet. En lignende fremgangsmåde kan anvendes til gruppering af geografiske områder (f. eks. handelsområder) i grupper, der er homogene med hensyn til socio-økonomiske og demografiske egenskaber. En sådan gruppering kan da være et hjælpemiddel ved udvælgelse af test- og kontrolmarkeder til anvendelse i forbindelse med markedseksperimenter. Ad (3). Bestemmelse af hvilke malinger, der skal udvælges til nærmereSom tidligere nævnt, kan den ved faktoranalyse fremkomne gruppering af målinger, der for det enkelte element er stærkt indbyrdes korrelerede, benyttes til inden for hver gruppe at udvælge én variabel til videregående analyse. Blandt de utallige offentliggjorte rapporter om denne anvendelse skal kun to nævnes. Frank, og Boyd har benyttet metoden til at bestemme hvilke af en lang række socio-økonomiske variable, der mest hensigtsmæssigt kunne indgå som forklarende variable i en regressionsanalyse med det formål at forudsige husholdningers forbrug af private mærkevarer. Twedt var
interesseret i at bestemme hvilke egenskaber ved en
fagbladsannonce(f. var bestemmende for hvor mange læsere den fik. Foruden at identificerede underliggende dimensioner, blev faktoranalysen benyttet til blandt de oprindelige 20 variable at udvælge 7 - én for hver af de identificerede faktorer -, der skulle indgå i en regressionsanalyse, som skulle gøre det muligt at forudsige størrelsen af en given annonces læserkreds. Ad (4). Skabelse af helt nye variable, der - som funktioner af de oprindelige - kan gøres til genstand for videre analyse.I stedet for at udvælge nogle af de oprindelige variable - x-værdierne - til videre analyse, kan faktoranalysen benyttes til skabelse af nye variable - y-værdierne - der så kan indgå i den videre analyse. Hver y-værdi vil da repræsentere en række indbyrdes korrelerede x-værdier, medens y-værdierne i sig selv vil være indbyrdes ukorrelerede, hvilket gør dem velegnede til at indgå som forklarende variable i en regressionsanalyse eller diskriminantanalyse. Farley har benyttet denne teknik i en undersøgelse, hvis formål det var at konstatere årsagerne til, at mærkeloyaliteten varierer fra produktgruppe til produktgruppe inden for fødevareområdet. 6. Matematisk appendixPrincipale
komponenters metode. Vi tager
udgangspunkt i formuleringen (3.3), der skrevet på
matrixform (A.l) Vi kan betragte en sådan transformation til nye variable som en ndring det koordinatsystem, hvori vi udtrykker vore målinger. Af sådanne transformationer er der naturligvis uendelig mange, hver bestemt ved udformningen af transformationsmatricen A. Vi vil nu stille følgende krav til transformationsmatricen A: (1) At
transformationen er afstandsbevarende. (2) At
variablem.e yk er ukorrelerede. (3) At Var(yi)
> Var(y2) > > Var(yp). (4) At Var(yk) er
størst mulig for samtlige k. Lad vektorerne xa og x f 5 repræsentere to punkter i det p-dimensiale rum. Kvadratet på afstanden mellem disse to punkter er da D (xa, x f?) = (xa-x/?)T (xa-x f?). Ved transformationen y —Ax føres de to punkter over i punkterne repræsenteret ved vektorerne ya —Axa og y f 9 = Ax f?. Kvadratet på afstanden mellem disse to punkter er da Vi ser altså, at transformationen kun er afstandsbevarende såfremt ATA =I, hvor ler enhedsmatricen. En matrix, der opfylder denne betingelse kaldes ortogonal. Er transformationsmatrixen, A, i (A.l) ortogonal kaldes transformationen ortogonal. En ortogonal transformation svarer til en drejning af koordinatsystemet omkring origo, hvilket er illustreret i afsnit 4. Da vi kun er
interesseret i variationerne i x, vil vi i det følgende
Er a en
søjlevektor i p dimensioner i A, har vi (A.2) hvor (A3) da A er
ortogonal. Vi har nu (A.4) At finde den linearkombination, y, af x, der har maksimal varians, er ensbetydende med at maksimere (A.4) under bibetingelsen (A.3), hvilket ved intruduktion af la Grange-multiplikatoren. X, er ensbetydende med at maksimere (A.5) Vektoren af
partielle afledede m.h.t. a er (A.6) Vi ma" kraeve, at
(A.6) er lig 0. Med andre ord, der ma\ for at (A.5)
(A.7) I og a kaldes
henholdsvis en karakteristisk værdi (eller egenværdi) og
(A.B) En løsning på
(A.B), der samtidig sikrer, at (A.3) er opfyldt, må
(A.9) (A.9) er et
polynomium i / af p'te grad og har derfor p redder af
Ved
multiplikation med aT på begge sider af lighedstegnet i
(A.B) (A.10) hvoraf ved
indsættelse af (A.4) og (A.3) på henholdsvis venstre og
(A.11) Da vi ønsker at
maksimere Var(y), vælges den største rod i (A.9)-
Denne rod har vi
tidligere betegnet ?,1. Hvis betegner en normeret
er den normerede
linearkombination af x, der har maksimal varians.
Det kan bevises
(Anderson 1958, kap. II), at den normerede
linearkombination, hvor a2a2 er den til den næsthøjeste karakteristiske værdi, å2, svarende karakteristiske vektor. Det kan herefter bevises, at den linearkombination, y3, der har maksimal varians under bibetingelsen, at y3y3 hverken er korreleret med yx eller y2, er hvor as er den
til den trediestørste karakteristiske værdi, h svarende
Vi kan altsa
beregne ai, a2, as, ak, , ap og dermed bestemme
(1) Samtlige
rødder i ligningen (A.9) bestemmes (2) Rødderne
opstilles efter faldende størrelse. (3) Den første (største) rod, Al}A1} indsættes i (A.B), der løses m.h.t. vektoren a. Den fundne vektor er den første søjle, aL i A Dernæst indsættes den anden (næststørste) rod, f2, i (A.B), der igen løses m.h.t. a. Den fundne løsning emu 32, den anden søjle i A o.s.fr. Ved løsningen af (A.B) benyttes endvidere, at aT 3 =logat kovariansen mellem yk og yh skal være 0 for alle h=£k. Da Aer ortogonal, medfører y=Axatx= ATy. D.v.s. at vi ién arbejdsgang får bestemt såvel koefficienterne i (3.3) som søjlerne i A, som koefficienterne i (3.2) som rækkerne i A. Med andre ord er lik ==: aki- Det bemaerkes
endelig, at da X er en kvadreret storrelse (varians)
hvor samtlige
lighedstegn kun gælder i det helt uinteressante
tilfælde, (1) Nogle af A'erne kan være 0. så fald er kovariansmatricen, V af lavere rang end p. Dette medfører, at datamatrixen X = (xig), hvor xig betegner den i'te måling på det g'te element, er af lavere rang end p. En hver måling xig kan da udtrykkes i færre end p y-værdier. (2) Nogle af
fTeren kan være lige stoie. I så fald findes der
uendelig Endelig skal det
bemærkes, at det ved anvendelse af faktoranalyse Dette gøres ved
at foretage transformationen zk = (l fy7k )yk for
Ligeledes ser man
ofte, at x'erne standardisere før beregningerne
ReferencerStandardværket er
1. Harry H. Harman:
Modem Factor Analysis. University of Chicago Press,
1960. En statistisk
orienteret fremstilling findes i 2. T. W. Anderson:
Introduction to Multivariate Statistical Analysis.
Wiley, 1958. Computerprogrammer kan søges i
3. W. W. Cooley
and P. R. Lohnes: Multivariate Procedures for the
Behavioral 4. W. J. Dickson
(Ed.): BMD Biomedical Computer Programs. University of
California 5. IBM Scientific
Subroutine Package. Eksempler pa
anvendelse af faktoranalyse inden for marketingomradet
er talrige, og 6. Frank J.
Dudek: Relations among Television Rating Indices. JAR
Vol. 4, 1964, 7. J. L.
Eastlack: Consumer Flavor Preference Factors in Food
Product Design. JMR 8. J. V. Farley:
Why Does Brand Loyality Vary Over Products? JMR Vol. 1,
1964, 9. R. E. Frank
and H. W. Boyd Jr.: Are Private Brand-Prone Grocery
Customers 10. W. F. Massy:
Applying Factor Analysis to a Specific Marketing
Problem. Proceedings 11. Jan Stoetzel:
A Factor Analysis of the Liquor Preferences of French
Consumers. 12. D. Twedt: A
Multiple Factor Analysis of Advertising Readership.
Journal of Applied 13. Norman L.
Vincent: A Note on Stoetzel's Factor Analysis of Liquor
Preferences. |