Nationaløkonomisk Tidsskrift, Bind 113 (1975)

Om multicollinearitetsproblemet

Statistisk Institut, Københavns Universitet

Peter Toft-Nielsen

I de senere år har økonomer i forsøget på at forklare sammenhængen mellem
forskellige økonomiske variable i vid udstrækning benyttet sig af regressionsanalysen
flere forklarende variable.

Idet den afhængige variabel benævnes Xi kan problemet være at bestemme
parametrene i følgende relation:


DIVL2021

(O

hvor Ter antallet af observationer, xx2t og xzt de forklarende variable målt som
afvigelsen fra deres middeltal og et det stokastiske led.

For at få gode estimater af parametrene /?i, (32 og (33 må en række forudsætninger opfyldt. Her skal dog alene fremhæves, at selve beregningen kræver, at ingen af de forklarende variable må kunne skrives som lineære funktioner af de øvrige. Hvis dette er tilfældet kan estimationen af de enkelte regressionskoefficienter mindste kvadraters metode ikke gennemføres, ligesom de forskellige EDB standardprogrammer ikke kan benyttes.

I fig. laer relationen (1)(1) afbildet som et plan i3 dimensioner. Ved mindste
kvadraters metode estimeres et plan P, således at afstanden fra de T observationertil

Resumé

summary. Many economists have in their attempts to explain the interaction amongst economic variables used the method of multiple regression analysis. If there by accident or systematically should be a very close relationship amongst the explanatory variables there is said to be a high degree of multicollinearity. As already shown by Ragnar Frisch (1934) this can lead to situations where the classical analysis indicates significant regression coefficients although a partial interpretation is nonsense. To avoid this a method containing two steps is suggested. the first step the presence of multicollinearity is tested and the second step is an application of the bunch-map analysis developed by Frisch. Finally an example, taken from the thesis of Erling Olsen (igji), is examined.



Artiklen er tildelt Zeuthen-prisen. Bedømmelsesudvalget har bestået af Else Zeuthen, Jon Stene, Jan Rasmussen samt tidsskriftets redaktør.

Side 123

DIVL2041

fig. la. Grafisk fremstilling afXu = (3i + (S2X2 + fcx^ + et samt snit gennem planet P.

tionertilplanet er mindst mulig. Af tværsnittet ses det, at afstanden er minimereti
retning, dvs. lodret. Minimaliseringsretningen determineres af hvilkenvariabel,
betragter som afhængig.

Som et kvalitetsmål for den fundne relation benyttes traditionelt determinationsgraden
2 defineret som forholdet mellem den del af variationen i den afhængige
Xi som forklares af #2 og Xz og den samlede variation i Xi.

Økonomer er som regel interesserede i at tolke de estimerede koefficienter 62 og bz hver for sig d.v.s. som de partielle bidrag fra henholdsvis X2 og X3 til forklaring af Xi. Det må hertil bemærkes, at en sådan partiel fortolkning ofte er misvisende, fordi størrelsesforholdet mellem 62 og b3b3 afhænger af samvariationen mellem x2x2 og xz. Det er kun i de tilfælde, hvor X2 og xs er ukorrelerede, at &2*s størrelse er uafhængig af størrelsen af bz. Hvis derimod #2 og #3 for eksempel er positivt korrelerede, vil 62 og bz være negativt korrelerede.

Man beregner sædvanligvis standardafvigelsen til hver enkelt regressionskoefficient. udføres et test for om den beregnede parameter er signifikant fra nul i de tilfælde, hvor man er interesseret i at undersøge, om den pågældende variabel har nogen betydning for forklaringen af variationen i den afhængige variabel. Hvis dette test falder positivt ud, antages det ofte, at en partiel fortolkning er tilladelig. Dette er imidlertid farligt. Hvis nemlig to eller flere af de forklarende variable tilnærmelsesvist er lineært afhængige, men hvor afrundings-, index- eller regnefejl bevirker, at selve udregningen af parametrene kan gennemføres, således at man ikke opdager denne sammenhæng mellem de forklarende variable, kan den klassiske metode lede til upålidelige eller i værste fald til nonsensestimationer.

Side 124

Herom skrev Ragnar Frisch allerede i 1934: »In practice, particularly in the social sciences, these cases are apt to arrive much more frequently than is usually recognized. As a matter of fact I believe that a substantial part of the regression and correlation analysis which have been made on economic data in recent years is nonsens for this very reason«.

Med EDB teknikkens udvikling kan det ofte virke fristende at udføre regressionsanalyser
flere og flere variable, men herved øges også risikoen for multicollinearitet.

Om multicollinearitet

Hvis to eller flere forklarende variable er korrelerede er det vanskeligt at
separere deres indflydelse på den afhængige variabel Xi. Hvis korrelationen er
høj tales der om multicollinearitetsproblemet. Lad os igen illustrere dette grafisk.


DIVL2088

fig Ib. Grafisk fremstilling af »fuldstændig« multicollinearitet i regressionsmodellen k = 3 samt tværsnit af linien F.

Af fig. ib ses det, at enhver projektion af observationerne i Xix2xs rummet ned på planet x2xa vil kunne henføres til den rette linie L. Ved forklaringen af Xi mistes derfor én dimension. Det bedste skøn over Xi er ikke et plan, men den rette linie F. Da regressionskoefficienterne stadig kan beregnes sålænge det lineære er ufuldstændigt, medfører den indbyrdes korrelation, at man må opgive at fortolke b'erne hver for sig.

Hertil vil nogle økonometrikere stadig hævde, at estimatorerne kan anvendes til forudsigelsesformål, selvom en partiel fortolkning er udelukket som følge af multicollinearitet. De vil sige, at så længe man holder sig til Pi (se fig. ib), opstår der intet problem. En sådan konklusion må dog ses i lyset af, at dette kun

Side 125

er tilfældet, hvis sammenhænget mellem x2x2 og #3 ikke er tilfældigt men systematiskkoncentreret
linien L i hele forudsigelsesperioden.

I modsætning til fig. ia, hvor planets placering i rummet var stabil, er det nu principielt muligt at lægge uendelig mange regressionsplaner gennem F. Planet P kan derfor frit rotere omkring F afhængig af minimaliseringsretningen. Man kan derfor konkludere, at et plan i tilfælde af multicollinearitet ikke kan gives nogen fornuftig fortolkning.

Et naturligt spørgsmål må derfor blive: Har vi i de to tekniske størrelser, determinationsgraden og spredningen på de estimerede parametre, der jo traditionels som indikatorer for den estimerede regressionslignings pålidelighed, sikkerhed for, at »nonsensestimater« altid bliver opdaget?

Lad os først se på determinationsgraden defineret ved R2. Hvis målsætningen den estimerede regressionsligning er at kunne anlægge en partiel fortolkning, det rent intuitivt være klart, at R2R2 er et upålideligt mål. Hvis man nemlig til et ukorreleret sæt af forklarende variable x= [x 2,x2, ..., x%, ..., xn) tilføjer en ny variabel Xk+i, der på nær afrundingsfejl og lignende kan beskrives som en lineær funktion af x, vil R2R2 trods eksistensen af næsten fuldkommen multicollinearitet ikke aftage, idet den forklarede variation ikke vil falde.

Man må derfor håbe, at standardafvigelserne på de estimerede regressionskoefficienter
give et klart signal.

Estimatet for standardafvigelsen, SD, til den /te regressionskoefficient skrives


DIVL2072

(2)

hvor s2i og ss2j er de empiriske varianser for xi og Kj hvor j= 2,3.
rr223 er kvadratet på den simple empiriske korrelationskoefficient mellem
X2X2 Og X3.

Ijo højere grad x2x2 og xz er korrelerede jo nærmere vil rr2232 232 3 være ved 1, såledesat i (2) er næsten o. Dette resulterer ceteris paribus i at SD går mod uendelig. De estimerede regressionskoefficienter vil derfor ikke blive fundet signifikant forskellig fra nul og en fejlagtig partiel fortolkning vil blive undgået. Under forudsætning af, at antallet af frihedsgrader er positivt, vil det ofte vise sig, at de to forklarende variable (^2,^3) simultant giver en god beskrivelseaf således at determinationsgraden R2R2 ligeledes er næsten 1. Herved vil også tælleren i (2) være næsten o. Dette forhold trækker altså i retning af at gøre SD mindre. (2) kan da blive en upålidelig indikator for, om det er forsvarligt at anlægge en partiel fortolkning. Helt grelt bliver det, hvis man hypotetisk antager,at

Side 126

tager,atfejl - eller direkte regnefejl skjuler denne korrelation. Herved bestemmesden
størrelse af standardafvigelserne udelukkende af afrundingsfejlene.

Hvis man mindre ambitiøst ønsker at anlægge en svag fortolkning af de estimerede dvs. blot er interesseret i fortegnene til bo og bz, kan eksistensen af multicollinearitet også i dette tilfælde lede til fejlkonklusioner. Det kan vises, jvf. Toft-Nielsen (1974), at risikoen for forkerte fortegn er til stede, hvis f. eks. x-is procentvise andel af den samlede forklaringsgrad er mindre end den indre forklaringsgrad. Ligeledes er det vist, at både b2b2 og bz i denne situation kan blive fundet signifikante, og det til trods for at estimationen må betegnes som direkte vildledende. At problemet ikke blot er af teoretisk interesse vil et konkret eksempel senere i artiklen klart demonstrere.

Da således de traditionelle teststørrelser ikke med sikkerhed giver et klart signal i de situationer, hvor en partiel fortolkning bør undgås, bør man supplere den klassiske regressionsanalyse med en metode til at afsløre og afhjælpe forekomsten multicollinearitet.

En sådan blev allerede i 1930'erne konstrueret af Ragnar Frisch, nemlig
hans konfluensanalyse (Frisch 1934), der efter min mening må anses som værende
relevant i økonomiske relationsanalyser.

Af øvrige arbejder skal her blot nævnes Farrar og Glauber (1967) hvor forskellige tests for multicollinearitet gennemgås, Theil (1963) og Theil og Goldberger 1961) anvendende a priori information, Silvey (1969) anvendende supplerende samt Neeleman (1973) anvendende Penrose-generaliserede ved estimation af simultane modeller. Vedrørende de matematiske aspekter ved multicollinearitet henvises specielt til Silvey (1969), Klein og Nakamura samt Toft-Nielsen (1974).

Ragnar Frisch's konfluensanalyse

Betragtes istedet for eksemplet i (1)(1) en generel model med k-1 forklarende
variable, er ideen i konfluensanalysen, at hver variabel er sammensat af en systematisk
xi' og en forstyrrende komponent xi\ således at


DIVL2098

(3)

Frisch postulerer herefter, at der eksisterer en eksakt lineær relation mellem
de systematiske komponenter, dvs.


DIVL2104

(4)

Side 127

DIVL2108

Ud fra formel (3) og (4), skulle man nu være i stand til at se forskellen mellem den klassiske metode og konfluensanalysen. At alle de økonomiske variable at indeholde index-afrundings- eller direkte målefejl ifølge (3) må siges i mange praktiske situationer at være en realistisk udvidelse af den klassiske metodes forudsætning. Imidlertid lider konfluensanalysen også af visse mangler. Af (4) fremgår det, at Frisch går ud fra en fuldt specificeret relation hvor samtlige variable er med i sættet, hvorved antallet af observationer bliver uden betydning for vurderingen af usikkerheden på estimaterne.

Den restriktive forudsætning om en eksakt lineær relation mellem de systematiske medfører ligeledes, at det ikke er nødvendigt at specificere et kausalt sammenhæng. Alle indgående variable behandles ens. Ser vi endnu engang på fig. ia medfører relation (4), at man uanset minimaliseringsretning skulle bestemme det »rigtige« plan på nær en vilkårlig proportionalitetsfaktor. Hvis derimod planets placering er ustabilt grundet eksistensen af multicollinearitet, man forvente (se fig. ib), at planerne ville rotere afhængigt af minimaliseringsretningen. kan derfor opdeles i to faser. En estimationsfase, ikke vil blive omtalt her, samt en metode til visuel afklaring af de estimerede regressionsplaners placering i rummet i forhold til hinanden. Denne fase kaldes bunch-map analysen, og må nok anses for at være Frisch's væsentligste bidrag.

Da de klassiske forudsætninger og Frisch's forudsætninger i højere grad er
komplementære end alternative foreslås det, at den traditionelle regressionsanalyse
med bunch-map analysen for at undgå nonsensestimationer.

Konstruktion af et bunch-map

I den klassiske flerdimensionale regressionsanalyse blev estimaterne af hældningskoefficienterne ved at benytte mindste kvadraters metode. Mere eksakt minimaliserede man residualernes afstand til hyperplanet i xi's retning med xi som endogen variabel. Generelt er det naturligvis muligt at minimalisere i enhver af de k x'ers retning. Hvis Xi fastholdes som endogen variable, kan man få i alt k estimater for hver af de k-1 regressionskoefficienter ved at minimalisere i hver retning.

Uden tab af generalitet antages det i det følgende at alle x'erne er på normaliseret
d.v.s. at gennemsnittet er o og spredningen SD 1. Den centrale
matrise bliver derfor korrelationsmatrisen R. For k = 3 bliver R

Side 128

DIVL2125

og man får eksempelvis 3 skøn over regressionskoefficienten til den forklarende
variabel x-i


DIVL2129

DIVL2131

Som det ses, svarer det første skøn til det klassiske1. Det andet skøn svarer
til koefficienten fundet i den forklarende variabels egen retning. Hvis vi betegner
disse skøn som værende de to ledende (markeret ved cirkler), kan de 3 regressionskoefficienter
sionskoefficienterfremstilles grafisk i et såkaldt bunch-map (se fig


DIVL2141

*&^- J Nævner fig. 2. Et bunch-mapfor b s~\ /T\ i sætlet (123) f7\ °& r<?\ er e^enc^e stråler.

2)



1. |Rjj ler defineret som kofaktoren til rij iR.

Side 129

De tre rette linier i fig. 2 betegnes stråler, og alle strålerne under et kaldes
et strålebundt. Hvis planet er stabilt må man forvente, at strålerne ligger tæt, og
strålebundtet kaldes derfor lukket.

Bunch-map analysen, samt vejledende regler til klassifikation af nytilførte variable

Hovedtanken i bunch-map analysen er herefter, at man forsøger at konstruere bunch-map for enhver tænkelig kombination af det givne antal variable. Ikke kun i det fuldstændige sæt med k variable, men også for alle undersæt. Lad m være antallet af variable i undersættet. Man lader da m gå fra 2 til k. For k = 4 er proceduren fremstillet i fig. 3.


DIVL2187

fig. 3. Grafisk fremstilling af bunch-map analyse proceduren for k = 4 variable.

Ved at studere de mulige bunch-maps udvælger man det sæt, der giver den bedste beskrivelse, dvs. det tætteste strålebundt. For at få et indblik i hvilken betydning en nytilført variabel har for et givet undersæt, eksempelvis variabel nr. 3 til sættet 12, har jeg valgt kort at give en oversigt over forskellige vejledende regler, der kan benyttes ved klassifikationen af en nytilført variabel som værende A: nyttig, B: overflødig eller C: skadelig. Alle punkterne behøver ikke at være opfyldt samtidigt2.



2. For en mere omfattende diskussion henvises til Toft-Nielsen (1971).(1971).

Side 130

A: En nyttig variabel -*

i. Strålebundtet indsnævres, dvs. at vinklen mellem de to yderste stråler formindskes
at inkludere en ny variabel i sættet.

2. Strålen repræsenterende den nye variabel falder indenfor det gamle strålebundt.

3. Strålebundtets hældning ændres generelt.

B: En overflødig variabel - O
1. Strålebundtet indsnævrrs ikke.
2. Hældningen ændres ikke markant.

3. Den nye stråle falder udenfor det gamle strålebundt.

4. Den nye stråle er væsentlig kortere end de øvrige.
5. De øvrige stråler forkortes ikke nævneværdigt.

Til punkt B4 og B5 bør det bemærkes, at størrelsen af regressionskoefficienten i den nye variabels retning, vil være bestemmende for det generelle niveau af de øvrige koefficienter i ligningen. En given stråle i bundtet vil derfor generelt blive kortere jo mere fuldstændig de øvrige variable i sættet er lineært afhængige. Da alle de indgående variable er på normeret form og derfor sammenlignelige, man prioritere deres indflydelse efter strålens længde. En meget kort stråle betyder derfor, at den pågældende variabel er uden betydning

en overflødig variabel.

C: En skadelig variabel - A

1. Strålebundtet eksploderer. Denne adfærd forventes, hvis der opstår multicollinearitet
sættet, da planets hældning bestemmes af den tilfældige
variation.

2. Strålebundtet udvides.

3. Den ledende stråle for den endogene variabel (her nr. 1) reduceres kraftigt. kausale sammenhæng bliver domineret af et stærkere lineært bånd mellem de exogene variable, hvorved de klassiske regressionskoefficienter indeterminerede.

Ved hjælp af de opstillede regler skulle man nu være i stand til at gennemføre
analyse og således sikre, at de estimerede regressionsligninger
får et meningsfyldt indhold.

Da den skitserede metode imidlertid er ret tidkrævende, selv for en trænet

Side 131

bunch-map analytiker, kan det ikke anbefales at benytte den ved hver eneste regressionsanalyse.

I de tilfælde, hvor de forklarende variable er parvis uafhængige dvs. ukorrelerede, bunch-map analysen være overflødig. Hvis derimod en eller flere af de forklarende variable er eksakt lineært afhængige er bunch-map analysen en nødvendighed. I praksis vil den observerede determinant til korrelationsmatrisen ligge mellem oog 1. Den naturligste måde at løse problemet på, er da ved at teste en hypotese om, at de forklarende variable er parvis uafhængige. Hvis hypotesen forkastes gennemføres bunch-map analysen, da eksistensen af A/ulti Collinearitet kan give nonsensestimationer. Jeg har valgt at kalde testet MCi-test.

MCI-test for multicollinearitet

Lad testhypotesen være at de forklarende variable er uafhængige, svarende
til at den sande korrelationsmatrise er lig en enhedsmatrise af orden k-1.
Hvis de forklarende variable (x2,. ..., xx) følger en flerdimensional normalfordeling,
det vises3, at


DIVL2197

(5)

under uafhængighedsforudsætningen er tilnærmet x2-fordelt med \ (k-l)(kfrihedsgrader.
hypotesen forkastes, forekommer der multicollinearitet og
bunch-map analysen bør gennemføres.

Et konkret eksempel

Modellen og observationsmaterialet til dette eksempel er hentet fra Erling Olsens disputats fra 1971 International Trade Theory and Regional Income Differences, kapitel 6. Allerede ved forsvaret af disputatsen påpegede P. Nørregaard 4 i forbindelse med visse reestimationer: »Det kunne jo være, at begge estimeringer led af en fælles svaghed, som måske er særlig relevant i dette tilfælde. Problemet er multicollinearitet - et begreb, som Frisch indførte for næsten 40 år siden, men mærkelig nok overhovedet ikke nævnes af forfatteren«.

For at undersøge denne påstand har jeg valgt rent statistisk at vurdere én
af Erling Olsens regressionsligninger, nemlig relation 6.14 p. 139, der angiver
væksten i den i'te regions arbejdsstyrke i forhold til hele landet forklaret ved indkomstenpr.



3. T. W. Anderson (1958) hvor øvrige referencer er omtalt.

Side 132

komstenpr.capita, den relative løn og det relative økonomiske befolkningspotentie
5.


DIVL2212

(6)

Ved at tage logaritmen til (6) bringes relationen på lineær form


DIVL2218

(7)

I det oprindelige observationsmateriale er der 18 datasæt, 9 regionssæt fra
1880 og 9 fra 1900. Dette antal reduceres til 13, hvilket øger den multiple korrelationskoefficient


DIVL2234

tabel 1. Resultatet af den flerdimensionale regressionsanalyse. For t=iBBo og igoo på relation (7).

Resultatet ses i Tabel i6. Det ses, at ud fra et statistisk synspunkt, må estimationensiges være tilfredsstillende. Korrelationskoefficienten er 0,935 og alle regressionskoefficienterne er fundet stærkt signifikante. En partiel fortolkning skulle derfor være mulig. Ud fra et økonomisk synspunkt stiller sagen sig anderledes,ju. stadig negativ og med Erling Olsen (19(197 1, p. 143) kunne man sige »Again, our impression is that the explanation of the negative should be found outside conventional economic theory. But it is also our impression that it



4. Nationaløkonomisk Tidsskrift (19(197 1 p. 61-72 (især p. 69-70)).

5. Jævnfør Erling Olsen (1971,(1971, p. 90-91).

6. Resultatet er ikke sammenfaldende med Olsen (1971, p. 143) da logaritmetransformationen er udeladt.

Side 133

is more than difficult to find a reasonable one7«. At HogAer negative og signifikantemåtte
have undret, især da Erling Olsen (p. 91) forventer, at både
H og A er positive.

Vurdering af relationen

Af Erling Olsens kommentarer til de estimerede regressionskoefficienter må man slutte, at målsætningen med den estimerede relation er at kunne tolke b partielt. For at undersøge, om en sådan er forsvarlig udføres først et MCi-test. Da k=4, T= 13 og I Rul (iflg. appendix) er 0,006982 haves følgende teststørrelse formel (5)


DIVL2244

Da 99 % fraktilen i x2-fordelingen med 3 frihedsgrader er 11,3, må hypotesen om, at de forklarende variable er parvis ukorrelerede forkastes. Vi kan derfor konkludere, at der er afhængighed, og man må specielt være på vagt over for multicollineære sæt. Midlet hertil var bunch-map analysen.

Kommentarer til bunch-map analysen

Lad os først betragte undersættene bestående af den endogene variabel nr. 1 og én af de exogene. Lad os betegne dem 2-sættene. Af fig. 4 ses det, at sættet (14) giver det tætteste strålebundt svarende til, at variabel nr. 4 giver den største Ved at tilføre nr. 2 til sættet ses det, at denne må betegnes som en overflødig variabel. Den nye stråle (nr. 2) er kortere end de øvrige, ligesom strålebundtet (14) og (12) ikke indsnævres i (124).

Tilsvarende gælder for variabel nr. 3. Strålebundterne i (13) og (14) indsnævres
i (134) ligesom stråle 3 er væsentlig kortere end nr. 1 og 4.

Går vi fra sættet (134) resp. (124) til (1234) ses det, at alle strålebundterne indsnævres betydeligt. Dette er generelt set et godt tegn. Imidlertid reduceres stråle nr. 1 og 4 kraftigt. Nr. 1 reduceres næsten til o-vektoren. Dette er et af tegnene på »multicollinearitet«. De klassiske regressionskoefficienter bliver næsten indeterminerede. Nr. 2 resp. nr. 3 må derfor betegnes som skadelige

Lad os herefter starte med (12) resp. (13). Ved at tilføre 3 resp. 2 ses det,
at strålebundtet i (123) indsnævres betydeligt. Medens regressionskoefficienterne
havde modsat fortegn i (12) og (13), som man iflg. Erling Olsens model skulle



7. Da /i i hele eksemplet forbliver negativ, kunne forklaringen være, at befolkningsbevægelsen i U.S.A. fra 1880—1900 netop var rettet mod Vest. Dette ville give et ft < o. Se f. eks. Faulkner: Economic History, London 1964, kap. 18.

Side 134

DIVL2265

fig. 4. Bunch-map analyse på Erling Olsens data. Konstrueret udfra appendix.

Side 135

DIVL2268

tabel 2. Oversigtsskema til bunch-map analysen i jig. 4.

forvente8, bliver de begge negative i (123). Ved at betragte (23) ses det tydeligt,
at interkorrelationen mellem (23) slår igennem sættet. Da 2 resp. 3 reducerer
den ledende stråle nr. 1 kraftigt, må de begge karakteriseres som skadelige.

Vi kan herefter konkludere, at selvom den klassiske flerdimensionale regressionsanalyse det reestimerede Erling Olsen eksempel klart indicerede signifikante samt en teknisk determinationsgrad på 0,935, rn^ den fundne relation alligevel siges at have karakter af nonsens. Skulle man rent statistisk anbefale et bedre sæt, må det blive (14), dvs. at væksten i den i'te regions skulle forklares udelukkende ved det relative, økonomiske befolkningspotentiel. At regressionskoefficienten a priori må forventes at blive negativ i perioden 1880 til 1900 skyldes sikkert »frontierbevægelsen«, der gjorde sig gældende i U.S.A. i dette tidsrum.

Litteratur

anderson, t. w. 1958. An Introduction to
Multivariate Statistical Analysis. London.

FARRAR, D. E. Og R. R. GLAUBER. 1967. Multicollinearity Regression Analysis: The problem revisitet. Review of Economics and Statistics 49:92-107.

FRiscii, ragnar. 1934. Statistical Confluence Analysis by Means of Complete Regression Universitetets Økonomiske Institut, Oslo.

Klein & nakamura. 1962. Singularity in the Equation Systems of Econometrics: Some Aspects of the problem of Multicollinearity. Economic Review 3.

neeleman, d. 1973. Multicollinearity in linear
economic models. Holland.

NØRREGAARD RASMUSSEN, P. 197 I. En disputats
om interregionale udligningsmekanismer.
Nationaløkonomisk Tidsskrift 109:61-

olsen, erling. 1971. International Trade

siLVEY, s. d. 1969. Multicollinearity and Imprecise
Journal of Royal Stat.
Soc, Series B.

TiiEiL, n. og goldberger. 1961. On Pure and
Mixed Statistical Estimation in Economics.
International Economic Review 2.

TiiEiL, ii. 1963. On the use of incomplete
prior information in regression analysis.
Journal of Am. Stat. Ass. 58.

toft-Nielsen, p. 1971. Flerdimensional regressionsanalyse specielt henblik på undersøgelse af multicollincaritet. Stor opgave politstudiet.

toft-Nielsen, p. 1974. Nogle OLS estimatorers og hældning under varierende Universitetets Statistiske Institut, nr. 23, grå serie.

APPENDIX

Den simple empiriske korrelationskoefficientmatrise i Erling Olsen eksemplet

Determinanten |R1:1|R1:1| =0,006982



8. Nr. 2 angiver indkomst pr. capital som i modellen virker modsat og nr. 3 angiver den relative


DIVL2282