Nationaløkonomisk Tidsskrift, Bind 113 (1975)Om multicollinearitetsproblemetStatistisk Institut, Københavns Universitet Peter Toft-Nielsen I de senere år
har økonomer i forsøget på at forklare sammenhængen
mellem Idet den
afhængige variabel benævnes Xi kan problemet være at
bestemme (O hvor Ter antallet
af observationer, xx2t og xzt de forklarende variable
målt som For at få gode estimater af parametrene /?i, (32 og (33 må en række forudsætninger opfyldt. Her skal dog alene fremhæves, at selve beregningen kræver, at ingen af de forklarende variable må kunne skrives som lineære funktioner af de øvrige. Hvis dette er tilfældet kan estimationen af de enkelte regressionskoefficienter mindste kvadraters metode ikke gennemføres, ligesom de forskellige EDB standardprogrammer ikke kan benyttes. I fig. laer
relationen (1)(1) afbildet som et plan i3 dimensioner.
Ved mindste Resumésummary. Many economists have in their attempts to explain the interaction amongst economic variables used the method of multiple regression analysis. If there by accident or systematically should be a very close relationship amongst the explanatory variables there is said to be a high degree of multicollinearity. As already shown by Ragnar Frisch (1934) this can lead to situations where the classical analysis indicates significant regression coefficients although a partial interpretation is nonsense. To avoid this a method containing two steps is suggested. the first step the presence of multicollinearity is tested and the second step is an application of the bunch-map analysis developed by Frisch. Finally an example, taken from the thesis of Erling Olsen (igji), is examined. Artiklen er tildelt Zeuthen-prisen. Bedømmelsesudvalget har bestået af Else Zeuthen, Jon Stene, Jan Rasmussen samt tidsskriftets redaktør. Side 123
tionertilplanet
er mindst mulig. Af tværsnittet ses det, at afstanden er
minimereti Som et
kvalitetsmål for den fundne relation benyttes
traditionelt determinationsgraden Økonomer er som regel interesserede i at tolke de estimerede koefficienter 62 og bz hver for sig d.v.s. som de partielle bidrag fra henholdsvis X2 og X3 til forklaring af Xi. Det må hertil bemærkes, at en sådan partiel fortolkning ofte er misvisende, fordi størrelsesforholdet mellem 62 og b3b3 afhænger af samvariationen mellem x2x2 og xz. Det er kun i de tilfælde, hvor X2 og xs er ukorrelerede, at &2*s størrelse er uafhængig af størrelsen af bz. Hvis derimod #2 og #3 for eksempel er positivt korrelerede, vil 62 og bz være negativt korrelerede. Man beregner sædvanligvis standardafvigelsen til hver enkelt regressionskoefficient. udføres et test for om den beregnede parameter er signifikant fra nul i de tilfælde, hvor man er interesseret i at undersøge, om den pågældende variabel har nogen betydning for forklaringen af variationen i den afhængige variabel. Hvis dette test falder positivt ud, antages det ofte, at en partiel fortolkning er tilladelig. Dette er imidlertid farligt. Hvis nemlig to eller flere af de forklarende variable tilnærmelsesvist er lineært afhængige, men hvor afrundings-, index- eller regnefejl bevirker, at selve udregningen af parametrene kan gennemføres, således at man ikke opdager denne sammenhæng mellem de forklarende variable, kan den klassiske metode lede til upålidelige eller i værste fald til nonsensestimationer. Side 124
Herom skrev Ragnar Frisch allerede i 1934: »In practice, particularly in the social sciences, these cases are apt to arrive much more frequently than is usually recognized. As a matter of fact I believe that a substantial part of the regression and correlation analysis which have been made on economic data in recent years is nonsens for this very reason«. Med EDB
teknikkens udvikling kan det ofte virke fristende at
udføre regressionsanalyser Om multicollinearitetHvis to eller
flere forklarende variable er korrelerede er det
vanskeligt at Af fig. ib ses det, at enhver projektion af observationerne i Xix2xs rummet ned på planet x2xa vil kunne henføres til den rette linie L. Ved forklaringen af Xi mistes derfor én dimension. Det bedste skøn over Xi er ikke et plan, men den rette linie F. Da regressionskoefficienterne stadig kan beregnes sålænge det lineære er ufuldstændigt, medfører den indbyrdes korrelation, at man må opgive at fortolke b'erne hver for sig. Hertil vil nogle økonometrikere stadig hævde, at estimatorerne kan anvendes til forudsigelsesformål, selvom en partiel fortolkning er udelukket som følge af multicollinearitet. De vil sige, at så længe man holder sig til Pi (se fig. ib), opstår der intet problem. En sådan konklusion må dog ses i lyset af, at dette kun Side 125
er tilfældet,
hvis sammenhænget mellem x2x2 og #3 ikke er tilfældigt
men systematiskkoncentreret I modsætning til fig. ia, hvor planets placering i rummet var stabil, er det nu principielt muligt at lægge uendelig mange regressionsplaner gennem F. Planet P kan derfor frit rotere omkring F afhængig af minimaliseringsretningen. Man kan derfor konkludere, at et plan i tilfælde af multicollinearitet ikke kan gives nogen fornuftig fortolkning. Et naturligt spørgsmål må derfor blive: Har vi i de to tekniske størrelser, determinationsgraden og spredningen på de estimerede parametre, der jo traditionels som indikatorer for den estimerede regressionslignings pålidelighed, sikkerhed for, at »nonsensestimater« altid bliver opdaget? Lad os først se på determinationsgraden defineret ved R2. Hvis målsætningen den estimerede regressionsligning er at kunne anlægge en partiel fortolkning, det rent intuitivt være klart, at R2R2 er et upålideligt mål. Hvis man nemlig til et ukorreleret sæt af forklarende variable x= [x 2,x2, ..., x%, ..., xn) tilføjer en ny variabel Xk+i, der på nær afrundingsfejl og lignende kan beskrives som en lineær funktion af x, vil R2R2 trods eksistensen af næsten fuldkommen multicollinearitet ikke aftage, idet den forklarede variation ikke vil falde. Man må derfor
håbe, at standardafvigelserne på de estimerede
regressionskoefficienter Estimatet for
standardafvigelsen, SD, til den /te
regressionskoefficient skrives (2) hvor s2i og ss2j
er de empiriske varianser for xi og Kj hvor j= 2,3.
Ijo højere grad x2x2 og xz er korrelerede jo nærmere vil rr2232 232 3 være ved 1, såledesat i (2) er næsten o. Dette resulterer ceteris paribus i at SD går mod uendelig. De estimerede regressionskoefficienter vil derfor ikke blive fundet signifikant forskellig fra nul og en fejlagtig partiel fortolkning vil blive undgået. Under forudsætning af, at antallet af frihedsgrader er positivt, vil det ofte vise sig, at de to forklarende variable (^2,^3) simultant giver en god beskrivelseaf således at determinationsgraden R2R2 ligeledes er næsten 1. Herved vil også tælleren i (2) være næsten o. Dette forhold trækker altså i retning af at gøre SD mindre. (2) kan da blive en upålidelig indikator for, om det er forsvarligt at anlægge en partiel fortolkning. Helt grelt bliver det, hvis man hypotetisk antager,at Side 126
tager,atfejl -
eller direkte regnefejl skjuler denne korrelation.
Herved bestemmesden Hvis man mindre ambitiøst ønsker at anlægge en svag fortolkning af de estimerede dvs. blot er interesseret i fortegnene til bo og bz, kan eksistensen af multicollinearitet også i dette tilfælde lede til fejlkonklusioner. Det kan vises, jvf. Toft-Nielsen (1974), at risikoen for forkerte fortegn er til stede, hvis f. eks. x-is procentvise andel af den samlede forklaringsgrad er mindre end den indre forklaringsgrad. Ligeledes er det vist, at både b2b2 og bz i denne situation kan blive fundet signifikante, og det til trods for at estimationen må betegnes som direkte vildledende. At problemet ikke blot er af teoretisk interesse vil et konkret eksempel senere i artiklen klart demonstrere. Da således de traditionelle teststørrelser ikke med sikkerhed giver et klart signal i de situationer, hvor en partiel fortolkning bør undgås, bør man supplere den klassiske regressionsanalyse med en metode til at afsløre og afhjælpe forekomsten multicollinearitet. En sådan blev
allerede i 1930'erne konstrueret af Ragnar Frisch,
nemlig Af øvrige arbejder skal her blot nævnes Farrar og Glauber (1967) hvor forskellige tests for multicollinearitet gennemgås, Theil (1963) og Theil og Goldberger 1961) anvendende a priori information, Silvey (1969) anvendende supplerende samt Neeleman (1973) anvendende Penrose-generaliserede ved estimation af simultane modeller. Vedrørende de matematiske aspekter ved multicollinearitet henvises specielt til Silvey (1969), Klein og Nakamura samt Toft-Nielsen (1974). Ragnar Frisch's konfluensanalyseBetragtes istedet
for eksemplet i (1)(1) en generel model med k-1
forklarende (3) Frisch postulerer
herefter, at der eksisterer en eksakt lineær relation
mellem (4) Side 127
Ud fra formel (3) og (4), skulle man nu være i stand til at se forskellen mellem den klassiske metode og konfluensanalysen. At alle de økonomiske variable at indeholde index-afrundings- eller direkte målefejl ifølge (3) må siges i mange praktiske situationer at være en realistisk udvidelse af den klassiske metodes forudsætning. Imidlertid lider konfluensanalysen også af visse mangler. Af (4) fremgår det, at Frisch går ud fra en fuldt specificeret relation hvor samtlige variable er med i sættet, hvorved antallet af observationer bliver uden betydning for vurderingen af usikkerheden på estimaterne. Den restriktive forudsætning om en eksakt lineær relation mellem de systematiske medfører ligeledes, at det ikke er nødvendigt at specificere et kausalt sammenhæng. Alle indgående variable behandles ens. Ser vi endnu engang på fig. ia medfører relation (4), at man uanset minimaliseringsretning skulle bestemme det »rigtige« plan på nær en vilkårlig proportionalitetsfaktor. Hvis derimod planets placering er ustabilt grundet eksistensen af multicollinearitet, man forvente (se fig. ib), at planerne ville rotere afhængigt af minimaliseringsretningen. kan derfor opdeles i to faser. En estimationsfase, ikke vil blive omtalt her, samt en metode til visuel afklaring af de estimerede regressionsplaners placering i rummet i forhold til hinanden. Denne fase kaldes bunch-map analysen, og må nok anses for at være Frisch's væsentligste bidrag. Da de klassiske
forudsætninger og Frisch's forudsætninger i højere grad
er Konstruktion af et bunch-mapI den klassiske flerdimensionale regressionsanalyse blev estimaterne af hældningskoefficienterne ved at benytte mindste kvadraters metode. Mere eksakt minimaliserede man residualernes afstand til hyperplanet i xi's retning med xi som endogen variabel. Generelt er det naturligvis muligt at minimalisere i enhver af de k x'ers retning. Hvis Xi fastholdes som endogen variable, kan man få i alt k estimater for hver af de k-1 regressionskoefficienter ved at minimalisere i hver retning. Uden tab af
generalitet antages det i det følgende at alle x'erne er
på normaliseret Side 128
og man får
eksempelvis 3 skøn over regressionskoefficienten til den
forklarende Som det ses,
svarer det første skøn til det klassiske1. Det andet
skøn svarer 2) 1. |Rjj ler defineret som kofaktoren til rij iR. Side 129
De tre rette
linier i fig. 2 betegnes stråler, og alle strålerne
under et kaldes Bunch-map analysen, samt vejledende regler til klassifikation af nytilførte variableHovedtanken i bunch-map analysen er herefter, at man forsøger at konstruere bunch-map for enhver tænkelig kombination af det givne antal variable. Ikke kun i det fuldstændige sæt med k variable, men også for alle undersæt. Lad m være antallet af variable i undersættet. Man lader da m gå fra 2 til k. For k = 4 er proceduren fremstillet i fig. 3. Ved at studere de mulige bunch-maps udvælger man det sæt, der giver den bedste beskrivelse, dvs. det tætteste strålebundt. For at få et indblik i hvilken betydning en nytilført variabel har for et givet undersæt, eksempelvis variabel nr. 3 til sættet 12, har jeg valgt kort at give en oversigt over forskellige vejledende regler, der kan benyttes ved klassifikationen af en nytilført variabel som værende A: nyttig, B: overflødig eller C: skadelig. Alle punkterne behøver ikke at være opfyldt samtidigt2. 2. For en mere omfattende diskussion henvises til Toft-Nielsen (1971).(1971). Side 130
A: En nyttig
variabel -* i. Strålebundtet
indsnævres, dvs. at vinklen mellem de to yderste stråler
formindskes 2. Strålen
repræsenterende den nye variabel falder indenfor det
gamle strålebundt. 3. Strålebundtets
hældning ændres generelt. B: En overflødig
variabel - O 3. Den nye stråle
falder udenfor det gamle strålebundt. 4. Den nye stråle
er væsentlig kortere end de øvrige. Til punkt B4 og B5 bør det bemærkes, at størrelsen af regressionskoefficienten i den nye variabels retning, vil være bestemmende for det generelle niveau af de øvrige koefficienter i ligningen. En given stråle i bundtet vil derfor generelt blive kortere jo mere fuldstændig de øvrige variable i sættet er lineært afhængige. Da alle de indgående variable er på normeret form og derfor sammenlignelige, man prioritere deres indflydelse efter strålens længde. En meget kort stråle betyder derfor, at den pågældende variabel er uden betydning en overflødig
variabel. C: En skadelig
variabel - A 1. Strålebundtet
eksploderer. Denne adfærd forventes, hvis der opstår
multicollinearitet 2. Strålebundtet
udvides. 3. Den ledende stråle for den endogene variabel (her nr. 1) reduceres kraftigt. kausale sammenhæng bliver domineret af et stærkere lineært bånd mellem de exogene variable, hvorved de klassiske regressionskoefficienter indeterminerede. Ved hjælp af de
opstillede regler skulle man nu være i stand til at
gennemføre Da den
skitserede metode imidlertid er ret tidkrævende, selv
for en trænet Side 131
bunch-map
analytiker, kan det ikke anbefales at benytte den ved
hver eneste regressionsanalyse. I de tilfælde, hvor de forklarende variable er parvis uafhængige dvs. ukorrelerede, bunch-map analysen være overflødig. Hvis derimod en eller flere af de forklarende variable er eksakt lineært afhængige er bunch-map analysen en nødvendighed. I praksis vil den observerede determinant til korrelationsmatrisen ligge mellem oog 1. Den naturligste måde at løse problemet på, er da ved at teste en hypotese om, at de forklarende variable er parvis uafhængige. Hvis hypotesen forkastes gennemføres bunch-map analysen, da eksistensen af A/ulti Collinearitet kan give nonsensestimationer. Jeg har valgt at kalde testet MCi-test. MCI-test for multicollinearitetLad testhypotesen
være at de forklarende variable er uafhængige, svarende
(5) under
uafhængighedsforudsætningen er tilnærmet x2-fordelt med
\ (k-l)(kfrihedsgrader. Et konkret eksempelModellen og observationsmaterialet til dette eksempel er hentet fra Erling Olsens disputats fra 1971 International Trade Theory and Regional Income Differences, kapitel 6. Allerede ved forsvaret af disputatsen påpegede P. Nørregaard 4 i forbindelse med visse reestimationer: »Det kunne jo være, at begge estimeringer led af en fælles svaghed, som måske er særlig relevant i dette tilfælde. Problemet er multicollinearitet - et begreb, som Frisch indførte for næsten 40 år siden, men mærkelig nok overhovedet ikke nævnes af forfatteren«. For at
undersøge denne påstand har jeg valgt rent statistisk at
vurdere én 3. T. W. Anderson (1958) hvor øvrige referencer er omtalt. Side 132
komstenpr.capita, den relative
løn og det relative økonomiske befolkningspotentie
(6) Ved at tage
logaritmen til (6) bringes relationen på lineær form
(7) I det oprindelige
observationsmateriale er der 18 datasæt, 9 regionssæt
fra Resultatet ses i Tabel i6. Det ses, at ud fra et statistisk synspunkt, må estimationensiges være tilfredsstillende. Korrelationskoefficienten er 0,935 og alle regressionskoefficienterne er fundet stærkt signifikante. En partiel fortolkning skulle derfor være mulig. Ud fra et økonomisk synspunkt stiller sagen sig anderledes,ju. stadig negativ og med Erling Olsen (19(197 1, p. 143) kunne man sige »Again, our impression is that the explanation of the negative should be found outside conventional economic theory. But it is also our impression that it 4. Nationaløkonomisk Tidsskrift (19(197 1 p. 61-72 (især p. 69-70)). 5. Jævnfør Erling Olsen (1971,(1971, p. 90-91). 6. Resultatet er ikke sammenfaldende med Olsen (1971, p. 143) da logaritmetransformationen er udeladt. Side 133
is more than
difficult to find a reasonable one7«. At HogAer negative
og signifikantemåtte Vurdering af relationenAf Erling Olsens kommentarer til de estimerede regressionskoefficienter må man slutte, at målsætningen med den estimerede relation er at kunne tolke b partielt. For at undersøge, om en sådan er forsvarlig udføres først et MCi-test. Da k=4, T= 13 og I Rul (iflg. appendix) er 0,006982 haves følgende teststørrelse formel (5) Da 99 % fraktilen i x2-fordelingen med 3 frihedsgrader er 11,3, må hypotesen om, at de forklarende variable er parvis ukorrelerede forkastes. Vi kan derfor konkludere, at der er afhængighed, og man må specielt være på vagt over for multicollineære sæt. Midlet hertil var bunch-map analysen. Kommentarer til bunch-map analysenLad os først betragte undersættene bestående af den endogene variabel nr. 1 og én af de exogene. Lad os betegne dem 2-sættene. Af fig. 4 ses det, at sættet (14) giver det tætteste strålebundt svarende til, at variabel nr. 4 giver den største Ved at tilføre nr. 2 til sættet ses det, at denne må betegnes som en overflødig variabel. Den nye stråle (nr. 2) er kortere end de øvrige, ligesom strålebundtet (14) og (12) ikke indsnævres i (124). Tilsvarende
gælder for variabel nr. 3. Strålebundterne i (13) og
(14) indsnævres Går vi fra sættet (134) resp. (124) til (1234) ses det, at alle strålebundterne indsnævres betydeligt. Dette er generelt set et godt tegn. Imidlertid reduceres stråle nr. 1 og 4 kraftigt. Nr. 1 reduceres næsten til o-vektoren. Dette er et af tegnene på »multicollinearitet«. De klassiske regressionskoefficienter bliver næsten indeterminerede. Nr. 2 resp. nr. 3 må derfor betegnes som skadelige Lad os herefter
starte med (12) resp. (13). Ved at tilføre 3 resp. 2 ses
det, 7. Da /i i hele eksemplet forbliver negativ, kunne forklaringen være, at befolkningsbevægelsen i U.S.A. fra 1880—1900 netop var rettet mod Vest. Dette ville give et ft < o. Se f. eks. Faulkner: Economic History, London 1964, kap. 18. Side 134
Side 135
forvente8,
bliver de begge negative i (123). Ved at betragte (23)
ses det tydeligt, Vi kan herefter konkludere, at selvom den klassiske flerdimensionale regressionsanalyse det reestimerede Erling Olsen eksempel klart indicerede signifikante samt en teknisk determinationsgrad på 0,935, rn^ den fundne relation alligevel siges at have karakter af nonsens. Skulle man rent statistisk anbefale et bedre sæt, må det blive (14), dvs. at væksten i den i'te regions skulle forklares udelukkende ved det relative, økonomiske befolkningspotentiel. At regressionskoefficienten a priori må forventes at blive negativ i perioden 1880 til 1900 skyldes sikkert »frontierbevægelsen«, der gjorde sig gældende i U.S.A. i dette tidsrum. Litteraturanderson, t. w.
1958. An Introduction to FARRAR, D. E. Og R. R. GLAUBER. 1967. Multicollinearity Regression Analysis: The problem revisitet. Review of Economics and Statistics 49:92-107. FRiscii, ragnar. 1934. Statistical Confluence Analysis by Means of Complete Regression Universitetets Økonomiske Institut, Oslo. Klein & nakamura. 1962. Singularity in the Equation Systems of Econometrics: Some Aspects of the problem of Multicollinearity. Economic Review 3. neeleman, d.
1973. Multicollinearity in linear NØRREGAARD
RASMUSSEN, P. 197 I. En disputats olsen, erling.
1971. International Trade siLVEY, s. d.
1969. Multicollinearity and Imprecise TiiEiL, n. og
goldberger. 1961. On Pure and TiiEiL, ii. 1963.
On the use of incomplete toft-Nielsen, p. 1971. Flerdimensional regressionsanalyse specielt henblik på undersøgelse af multicollincaritet. Stor opgave politstudiet. toft-Nielsen, p. 1974. Nogle OLS estimatorers og hældning under varierende Universitetets Statistiske Institut, nr. 23, grå serie. APPENDIXDen simple
empiriske korrelationskoefficientmatrise i Erling Olsen
eksemplet Determinanten
|R1:1|R1:1| =0,006982 8. Nr. 2 angiver indkomst pr. capital som i modellen virker modsat og nr. 3 angiver den relative |