Nationaløkonomisk Tidsskrift, Bind 3. række, 44 (1936)

OM SVINGNINGSLIGHED MELLEM ØKONOMISKE RÆKKER

EJNAR LOMHOLT

KORRELATIONEN er et udtryk, man ofte træffer i den økonomiske
statistik; hvor stor er korrelationskoefficienten,
spørger man. Adskillige, maaske mange, tager korrelationskoefficienten
som et bogstaveligt udtryk for aarsagsforbindelsen mellem
to økonomiske rækker; er korrelationskoefficenten f. eks. 0,70, er
der 70 % aarsagsforbindelse! Dette ræsonnement er faktisk forekommet
i amerikanske undersøgelser. Hvad korrelationskoefficienten
viser, er imidlertid kun svingningslighed mellem de
paagældende rækker, og først en nærmere undersøgelse kan fastslaa,
om der foreligger egentlig aarsagsforbindelse. Der findes som
bekendt tilfælde, hvor man kan paavise svingningslighed mellem
rækker, som afgjort ingen aarsagsforbindelse har med hinanden.
Indenfor den økonomiske statistik vil man ofte finde ret stor
svingningslighed, fordi samtlige økonomiske forhold er indbyrdes
tidsbestemte og underkastet samme varierende, meget betydelige
fællesfaktorer, først og fremmest konjunkturerne. Da Pearsons
korrelationskoefficient ofte anvendes ret »haandværksmæssigt«, vil
det være hensigtsmæssigt at fastslaa, at korrelationskoefficienten i
virkeligheden er det geometriske gennemsnit af koefficienterne for
de to rette linier, som bestemmes af a's og b's indbyrdes forhold,
beregnet ved hjælp af de mindste kvadraters metode, idet a og b
er værdierne i to økonomiske rækker1).

Det, som korrelationskoefficienten faktisk vil vise, er, med hvilken nøjagtighed man kan beregne b-værdierne af a-værdierne og omvendtved hjælp af første grads ligninger (rette linier). Naar korrelationskoefficientener 1, kan man med fuld nøjagtighed beregne



1) Jfr. formlen r=l/— -2y v 2= Vkx-ky, hvor kx og ky er koefficienterne til regressionslinierne, se lærebøger i statistikens teori.

Side 135

b-værdierne af a-værdierne og omvendt. Korrelationskoefficienten forudsætter imidlertid, at aarsagsforholdet mellem de paagældende rækker bedst kan udtrykkes ved rette linier; er dette ikke tilfældet,taber den sin værdi som maalestok for svingningslighed og dermed aarsagsforbindelse. Et typisk eksempel i saa henseende er prishyperbelen; hvis en vares pris er omvendt proportional med den udbudte mængde, vil korrelationskoefficienten give et misvisendebillede af svingningsligheden mellem pris og mængde, idet ligningen er y= (K er en konstant totalværdi af varemængden); for logaritmerne til pris og mængde vil man derimod i dette tilfældekunne anvende korrelationskoefficienten, idet ligningen da faar formen log y= log K— log x. Et andet vigtigt forhold er den kendsgerning, at aarsagsforbindelsen mellem to økonomiske rækker i mange tilfælde er ensidig eller i overvejende grad ensidig; f. eks. vil der her i landet være en betydelig aarsagsforbindelse mellem valutakurser og automobilpriser, naar valutakurserne er svingende, saaledes at automobilpriserne i stor udstrækning bestemmesaf valutakurserne, men ikke omvendt. Tager man forholdetmellem raajernsproduktion og renten for 60/90 dages veksler i Amerika, finder man, at renten følger raajernproduktionen i dens svingninger med c. 5 maaneders efterfølge, d. v. s. stor raajernsproduktionefterfølges af høj rente, og lille raajernsproduktion af lav rente; vil man vende forholdet om og gøre rentens bevægelser til forløber og dermed til aarsag, maa forholdet blive, at lav rente efterfølges af stor raajernsproduktion, og høj rente af lille raajernsproduktion,hvilket ogsaa i nogen grad holder stik, men faktisk er der en langt nærmere aarsagsforbindelse for den store raajernsproduktion(højkonjunkturen), som medfører høj rente, end for den lave rente, som medfører stor raajernsproduktion, da man meget vel under højkonjunkturen kan have baade stor raajernsproduktionog høj rente samtidig. Naar en økonomisk række er forløber for en anden række, maa den i almindelighed betragtes som »aarsag« til den anden række og ikke omvendt, og det er derfor rigtigt kun at betragte svingningsligheden ensidigt med den første række som »variabel« (x) og den anden række som »afledet værdi« (y), mens korrelationskoefficienten bygger paa begge muligheder,y beregnet af x, og x beregnet af y.

En betydelig ulempe ved anvendelsen af korrelationskoefficienten
er de store udregninger, naar man skal bestemme efterfølgen (»lag«,)
mellem to økonomiske rækker, som det er sket i vid udstrækning

Side 136

DIVL1133

ved de velkendte Harvardundersøgelser af konjunktursvingninger. Spørgsmaalet er derfor nærliggende, om man ikke ved en betydeligtsimplere metode kan opnaa samme eller næsten lige saa gode resultater. Anvender man f. eks. tyngdepunkter til bestemmelseaf de to rette linier, har man en meget simpel metode med faa udregninger; skal man beregne Y værdierne paa grundlag af X værdierne, deler man X værdierne i en øvre og en nedre halvdel,saaledes at samtlige X værdier i den øvre halvdel er større end eller lig med enhver X værdi i den nedre halvdel; derefter bestemmer man tyngdepunkterne for de to halvdele:

For Y værdierne er gennemsnittet taget af de Y værdier, som er sammenhørende med X værdierne henholdsvis i den øvre og den nedre halvdel. Ligningen for svingningslighed mellem X og Y bliver da:


DIVL1036

Paa ganske tilsvarende maade kan man beregne ligningen for
X, beregnet paa grundlag af Y.

En grund til at foretrække den sidste metode, som vi kalder T-metoden (tyngdepunkterne) i modsætning til K-metoden (de mindste kvadraters metode), er den kendsgerning, at yderværdier i økonomiske rækker, store udsving, ofte har deres aarsag i ekstraordinære forhold (strejker, bankkrak, panik etc), som er uden betydning for det egentlige aarsagsforhold mellem de undersøgte rækker, og det er en velkendt sag, at de mindste kvadraters metode netop giver yderværdierne særlig vægt, da metoden bygger paa afvigelsernes kvadrat. Ved at anvende de to metoder sideordnet paa økonomiske rækker, vil man faa deres forskelle belyst. I den bekendte Harvardundersøgelse: »Indices of General Business Conditions« (1919) har vi valgt to rækker, hvis indbyrdes forhold er grundigt undersøgt i det paagældende værk, nemlig renten for 60/90 dages veksler og raajernsproduktionen (side 124). Det drejer sig om en bestemmelse af efterfølgen (»lag«) mellem de to rækker, idet rentens bevægelser følger efter bevægelserne i raajernsproduktionen

Side 137

DIVL1135

Undersøgelsen omfatter perioden Januar 1903 til Juli 1914, men for at undgaa krigstallene udskyder man en maaned, hver gang efterfølgen forøges med en maaned; for 12 maaneders efterfølge sammenligner man saaledes raajernsproduktionen Januar 1903 til Juli 1913 med renten for Januar 1904 til Juli 1914. Som omtalt i »Indices etc.« side 12 kan man af korrelationskoefficienten beregne koefficienten til x (raajern) i ligningen for y (renten) ved at multiplicere korrelationskoefficienten med forholdet mellem middelfejlene for x og y; man faar saaledes for de samtidige værdier t. eks.


DIVL1044

For at spare arbejde har man ved Harvardundersøgelserne anvendt en lidt mere summarisk metode ved beregning af korrelationskoefficienten (jfr. side 123), idet man bruger samme middelfejl for alle beregningerne, skønt de spænder over forskellige tidsrum. Endelig er de værdier for raajernsproduktionen og renten, hvorpaa beregningen af korrelationskoefficienten er bygget, ikke de oprindelige værdier, men derimod de oprindelige værdier, udtrykt i procent af grundretningen og med sæsonsvingningerne fjernede (jfr. side 35). Da summen af disse x værdier og y værdier ikke er o, faar ligningen for y følgende form y = k • x -f- a, og de nøjagtige formler for k og a er efter K-metoden:


DIVL1048

hvor n er antallet af værdier; beregner man saaledes ligningen
for 5 maaneders efterfølge, faar man:


DIVL1052

koefficienten til x bliver her praktisk talt den samme som ovenfor,
nemlig 0.769 i stedet for 0.77.

Side 138

Anvender man nu T-metoden i stedet for til beregning af ligningen y = k • x -f- a, hvor y og x er de samme bearbejdede værdier for raajernsproduktion og for rente, som blev anvendt til beregning af korrelationskoefficienten, faar man følgende resultater:


DIVL1137

Koefficienten til x er væsentligt højere iflg. T-metoden end iflg. K metoden, men forskellen er faldende, og ved 12 maaneders efterfølge er kx lidt større (0.46) iflg. K-metoden end iflg. T-metoden (0.42); begge rækker kulminerer ved 5 og 6 maaneders efterfølge. For at kontrollere, hvor nøjagtigt man ved de paagældende ligninger kan beregne y værdierne paa grundlag af x værdierne, har vi foretaget en sammenligning for 5 maaneders efterfølge, hvor koefficienten kx er paa sit maksimum i begge rækker, nemlig 0.9 iflg. T-metoden og 0.77 iflg. K-metoden. Ligningerne bliver følgende:

K-metoden:


DIVL1062

T-metoden:


DIVL1066

Metoden er simpelthen at beregne den gennemsnitlige numeriske
forskel mellem de faktiske y værdier og de beregnede
y værdier; resultatet er følgende:


DIVL1139

Afvigelsen er altsaa kun 0.25 eller 2.5 % større for T-metoden end for K-metoden. Da y værdierne er de oprindelige værdier i procent af grundretningen, vil det altsaa sige, at man kan beregne renten med en gennemsnitlig afvigelse paa c. 10 % paa grundlag af raajernsproduktionen, naar man regner med en 5 maaneders efterfølge for renten efter raajernsproduktionen. En undersøgelse

Side 139

DIVL1141

af afvigelsernes fordeling bekræfter, at yderværdierne faar en
særlig vægt ved K-metoden fremfor T-metoden, fordi K-metoden
bygger paa afvigelsernes kvadrat, man faar saaledes:

De 20 yderværdier er beregnet af de 10 højeste og de 10 laveste x værdier. De gennemsnitlige afvigelser er for K-metoden omtrent ens for de 20 yderværdier (10.01) og for de resterende 114 mellemværdier (9.95), hvorimod T-metoden viser betydeligt højere afvigelser for de 20 yderværdier (12.69) end for de 114 mellemværdier (9.77), det er altsaa de 20 yderværdier, som er aarsag til en højere gennemsnitsafvigelse for T-metoden (10.21) end for K-metoden (9.96). Selvom man ønsker at gaa fuldt eksakt til værks, vil T-metoden som en første beregning give en klar og tydelig vejledning, som derefter, om fornødent, kan kontrolleres ved de mindste kvadraters metode for de »efterfølger«, som er af interesse, det vil i dette tilfælde sige fra 4—646 maaneder.

Vender vi os nu til den hjemlige økonomiske statistik, finder man indenfor det danske prisniveau en interessant svingningslighed mellem priserne paa vegetabilske og animalske levnedsmidler. Fælles for de to varegrupper er den almindelige prisnedgang fra 1925 til 1931—32, efterfulgt af stigningen til 1935. Desværre tillader pristallet os ikke at gaa længere tilbage end til 1925. Vil man derfor undersøge særbe vægels erne for de to prisgrupper, maa man fjerne denne fællesbevægelse, prisniveauets almindelige udvikling; det sker ved at dividere pristallene for de to varegrupper med det samlede engrospristal for hver maaned t. eks.


DIVL1143

Det vil sige, at vegetabilske priser i April 1925 ligger 7 °/o under
prisniveauet, og animalske priser 3 % under prisniveauet. Yderligeremaa
tages i betragtning, at animalske priser er undergivet

Side 140

DIVL1145

sæsonsvingninger, som paa grundlag af pristallene for September
1925—August 1935 er beregnet til følgende forholdstal1):

Efter disse forholdstal naar de animalske priser deres hojdepunkt i November og December og deres lavpunkt i AprilJuni; vi har fjernet sæsonsvingningerne fra de animalske priser ved at dividere indekstallet for priserne med indekstallet for sæsonsvingningerne, man faar saaledes for April 1925 102 °/o som ovenfor anført. Kalder vi nu indekstallene for vegetabilske priser x og for animalske priser y, faar vi følgende værdier for k, naar vi beregner ligningen: y = k • x -f- a efter T-metoden:


DIVL1147

Ved at forskyde priserne i forhold til hinanden, saa de animalskepriser følger 1 maaned, 2 maaneder etc. efter de vegetabilske, ser man, hvorledes koefficienten k stadig stiger, fra 0,08 for samtidigeværdier lige til 0.87 for 24 maaneders efterfølge, hvilket vil sige, at særsvingningerne i de vegetabilske priser skulde vise sig i de animalske prisers særbevægelser 2 aar senere, det maa dog bemærkes, at stigningen i koefficienten kun er ringe fra 21 maaneders efterfølge til 24 maaneder (fra 0.83 til 0.87). For vegetabilskepriser har vi hele vejen igennem anvendt tallene for Januar 1925December 1933, mens tallene for animalske priser er de tilsvarende tal lige fra samtidige til 24 maaneders efterfølge,



1) Om metoden ved. beregningen, se min artikel om konjunktursvingninger i Nat. Tidsskr. 1925.

Side 141

altsaa i sidste tilfælde fra Januar 1927—December 193G. Paa kortet har vi afbildet de to kurver for vegetabilske og animalske priser, udtrykt i procent af engrospristallet og uden sæsonsvingning, idet vi har rykket de animalske priser 2 aar tilbage, da deres efterfølge er 2 aar. Hovedbevægelserne ide to kurver er nogenlunde ens undtagen for 1933 (resp. 1935 for de animalske priser).

Forklaringen paa denne sammenhæng mellem særbevægelserne
i vegetabilske og i animalske priser 2 aar senere maa sikkert,
søges i den kendsgerning, at varegruppen vegetabilske levneds-


DIVL1130

Særsvingninger i animalske og vegetabilske priser. V: pristal for vegetabilske levnedsmidler, udtrykt i % af engrospristallet, 19251933. A: pristal for animalske levnedsmidler, udtrykt i °/o af engrospristallet og uden Sæsonsvingninger, 19271935.

midler hovedsagelig er bestemt af kornpriserne, som utvivlsomt er bestemmende for de animalske priser paa verdensmarkedet, navnlig flæskepriser. Høje kornpriser tvinger landbruget til indskrænkningaf svineholdet, men først c. 2 aar efter faar denne indskrænkning sin fulde vægt og resulterer i høje flæskepriser, og omvendt faar lave kornpriser landbruget til at udvide svineholdet, hvilket først faar sin fulde virkning c. 2 aar senere. Meget tyder paa, at der ikke er saa god overensstemmelse mellem særbevægelsernefor foderstofpriser og animalske priser som mellem vegetabilskeog animalske priser, fordi verdensmarkedets priser fortrinsvis er bestemt af kornpriserne og ikke af de foderstofpriser, som er afgørende for det danske landbrugs rentabilitet; her synes at være

Side 142

en særlig mulighed for det danske landbrugs rentabilitet, fordi dets fodermateriale er saa sammensat og derfor kan varieres mere hensigtsmæssigt end de store landes landbrug, hvor fodersammensætningener mere ensidig.

Udregner man ligningen for de 24 maaneders efterfølge, faar man: y= 0.867 •x -j- 16.78, og den gennemsnitlige numeriske forskel mellem faktisk og beregnet y udgør 4.72, hvilket er 5.4 % af gennemsnittet for y (87.8). Ser man paa afvigelsernes fordeling, faar man:


DIVL1149

Der er altsaa en lille skævhed i fordelingen af afvigelser. Som
den egentlige maalestok for svingningsligheden vil vi opstille
følgende fejlforhold:


DIVL1090

Ma er middelfejlen paa den beregnede værdi d. v. s. middelfejlen
for forskellen mellem faktisk og beregnet værdi.

a er den gennemsnitlige numeriske forskel mellem den faktiske
og den beregnede værdi.

Ms er middelfejlen paa den faktiske værdi d. v. s. middelfejlen for
spredningen af de faktiske værdier omkring deres gennemsnit.

s er den gennemsnitlige numeriske afvigelse (spredning) for de
faktiske værdier fra deres gennemsnit.

Fra den normale eksponentialfordeling ved vi, at den gennemsnitlige numeriske afvigelse er c. 80 % af middelfejlen, og vi vil derfor overalt, hvor fordelingen er normal, lige saa godt kunne anvende den gennemsnitlige numeriske afvigelse som den mere omstændelige middelfejl ved beregning af fejlforholdet. Hvis fordelingen afviger væsentligt fra den normale fordeling, vil dette ikke slaa til, men i saa fald vil heller ikke middelfejlen være den fuldgyldige maalestok for fordelingen som forudsat.

Beregner vi fejlforholdet for de vegetabilske og animalske priser,
faar vi:


DIVL1104
Side 143

Der er altsaa en lille forskel mellem de to værdier for fejlforholdet,
men den er uden praktisk betydning i denne forbindelse;
aarsagen til forskellen er sog Ms, idet vi har


DIVL1108

altsaa det normale forhold; for s og Ms skyldes afvigelsen, at de
faktiske værdier samler sig tættere om gennemsnittet end normalt,
som en undersøgelse vil vise.

Beregner vi fejlforholdet for raajernsproduktionen og renten paa
grundlag af de gennemsnitlige numeriske afvigelser, faar vi:


DIVL1114

K-metoden


DIVL1118

T-metoden:

Fejlforholdet er altsaa meget nær det samme for de to grupper, raajernsproduktion og rente for 60/90 dages veksler med 5 maaneders efterfølge, og særbevægelser for vegetabilske og animalske priser med 24 maaneders efterfølge. Naar fejlforholdet er 64 %, vil det sige, at gennemsnitsfejlen ved beregningen kun er 64 %> af gennemsnitsafvigelsen for de faktiske værdier fra deres gennemsnit (spredningen), altsaa er det kun en meget moderat nøjagtighed eller en ret begrænset svingningslighed, som er til stede i disse to tilfælde. Forholdet er som maalestok for svingningsligheden væsentligt klarere end Pearsons korrelationskoefficient og betydeligt simplere at beregne. Naar fejlforholdet er 100 % eller derover, er der ingen svingningslighed mellem de paagældende rækker, er fejlforholdet 0, er der fuldstændig svingningslighed. Drejer det sig om samtidige rækker, hvor det ikke er klart, hvilken af rækkerne, man kan betragte som hovedfaktoren, maa man foretage en dobbeltberegning, nemlig beregne y af x og omvendt, men i de fleste tilfælde vil en af rækkerne være den dominerende, f. eks. naar man sammenligner det almindelige prisniveaus bevægelser med svingningerne i raajernsproduktionen.

En lav korrelationskoefficient kan dække over en betydelig korrelation mellem to økonomiske rækker, hvis deres indbyrdes forhold bedst udtrykkes ved en kurve forskellig fra den rette linie (jfr. prishyperbelen ovenfor); i saa fald vil man hverken ved K-metoden eller T-metoden opnaa et tilfredsstillende resultat. Men forudsat, at den rette linie er det bedste udtryk for de to rækkers indbyrdes forhold, vil T-metoden give fuldt tilfredsstillende resultater.Hvorvidt

Side 144

tater.Hvorvidtforholdet mellem to rækker bedst udtrykkes ved en ret linie eller anden kurve, kan som regel kun afgøres ad rent empirisk vej, ved forsøgsvise undersøgelser i det enkelte tilfælde. Fejlforholdet derimod er i alle tilfælde en paalidelig maalestok for overensstemmelsen, hvadenten det er en ret linie eller anden kurve, som bedst udtrykker forholdet mellem de to rækker.

Note.

Til belysning af T-metodens anvendelse kan vi anføre følgende tal fra beregningen af forholdet mellem pristallene for vegetabilske og animalske priser, omregnet til procent af det samlede engrospristal og uden sæsonsvingning. Ved deling af indekstallene i øvre og nedre halvdel for aarene 19251933 faar man:


DIVL1170

Ved forskydning af de animalske priser i forhold til de vegetabilske, forskyder man blot de ovennævnte tidsrum et tilsvarende antal rnaaneder ved beregning af forskellen for animalske priser; man faar saaledes:


DIVL1172
Side 145

For 24 maaneders efterfølge er tyngdepunkterne følgende


DIVL1174

Ved beregning af den gennemsnitlige numeriske afvigelse mellem faktisk og beregnet kan man formindske udregningerne betydeligt ved at dele y-værdierne i to grupper, nemlig y-værdier, som er større end eller lig med de beregnede, og y-værdier, som er mindre end de beregnede værdier; man faar saaledes for animalske priser med 24 maaneders efterfølge:

y-værdier over de beregnede værdier


DIVL1176

y-værdier under de beregnede værdier


DIVL1178

altsaa er summen af numeriske afvigelser 509.5 og den gennemsnitlige
numeriske afvigelse følgelig 4.72.