Nationaløkonomisk Tidsskrift, Bind 3. række, 44 (1936)OM SVINGNINGSLIGHED MELLEM ØKONOMISKE RÆKKEREJNAR LOMHOLT KORRELATIONEN er
et udtryk, man ofte træffer i den økonomiske
Det, som korrelationskoefficienten faktisk vil vise, er, med hvilken nøjagtighed man kan beregne b-værdierne af a-værdierne og omvendtved hjælp af første grads ligninger (rette linier). Naar korrelationskoefficientener 1, kan man med fuld nøjagtighed beregne 1) Jfr. formlen r=l/— -2—y v 2= Vkx-ky, hvor kx og ky er koefficienterne til regressionslinierne, se lærebøger i statistikens teori. Side 135
b-værdierne af a-værdierne og omvendt. Korrelationskoefficienten forudsætter imidlertid, at aarsagsforholdet mellem de paagældende rækker bedst kan udtrykkes ved rette linier; er dette ikke tilfældet,taber den sin værdi som maalestok for svingningslighed og dermed aarsagsforbindelse. Et typisk eksempel i saa henseende er prishyperbelen; hvis en vares pris er omvendt proportional med den udbudte mængde, vil korrelationskoefficienten give et misvisendebillede af svingningsligheden mellem pris og mængde, idet ligningen er y= (K er en konstant totalværdi af varemængden); for logaritmerne til pris og mængde vil man derimod i dette tilfældekunne anvende korrelationskoefficienten, idet ligningen da faar formen log y= log K— log x. Et andet vigtigt forhold er den kendsgerning, at aarsagsforbindelsen mellem to økonomiske rækker i mange tilfælde er ensidig eller i overvejende grad ensidig; f. eks. vil der her i landet være en betydelig aarsagsforbindelse mellem valutakurser og automobilpriser, naar valutakurserne er svingende, saaledes at automobilpriserne i stor udstrækning bestemmesaf valutakurserne, men ikke omvendt. Tager man forholdetmellem raajernsproduktion og renten for 60/90 dages veksler i Amerika, finder man, at renten følger raajernproduktionen i dens svingninger med c. 5 maaneders efterfølge, d. v. s. stor raajernsproduktionefterfølges af høj rente, og lille raajernsproduktion af lav rente; vil man vende forholdet om og gøre rentens bevægelser til forløber og dermed til aarsag, maa forholdet blive, at lav rente efterfølges af stor raajernsproduktion, og høj rente af lille raajernsproduktion,hvilket ogsaa i nogen grad holder stik, men faktisk er der en langt nærmere aarsagsforbindelse for den store raajernsproduktion(højkonjunkturen), som medfører høj rente, end for den lave rente, som medfører stor raajernsproduktion, da man meget vel under højkonjunkturen kan have baade stor raajernsproduktionog høj rente samtidig. Naar en økonomisk række er forløber for en anden række, maa den i almindelighed betragtes som »aarsag« til den anden række og ikke omvendt, og det er derfor rigtigt kun at betragte svingningsligheden ensidigt med den første række som »variabel« (x) og den anden række som »afledet værdi« (y), mens korrelationskoefficienten bygger paa begge muligheder,y beregnet af x, og x beregnet af y. En betydelig
ulempe ved anvendelsen af korrelationskoefficienten
Side 136
ved de velkendte Harvardundersøgelser af konjunktursvingninger. Spørgsmaalet er derfor nærliggende, om man ikke ved en betydeligtsimplere metode kan opnaa samme eller næsten lige saa gode resultater. Anvender man f. eks. tyngdepunkter til bestemmelseaf de to rette linier, har man en meget simpel metode med faa udregninger; skal man beregne Y værdierne paa grundlag af X værdierne, deler man X værdierne i en øvre og en nedre halvdel,saaledes at samtlige X værdier i den øvre halvdel er større end eller lig med enhver X værdi i den nedre halvdel; derefter bestemmer man tyngdepunkterne for de to halvdele: For Y værdierne er gennemsnittet taget af de Y værdier, som er sammenhørende med X værdierne henholdsvis i den øvre og den nedre halvdel. Ligningen for svingningslighed mellem X og Y bliver da: Paa ganske
tilsvarende maade kan man beregne ligningen for En grund til at foretrække den sidste metode, som vi kalder T-metoden (tyngdepunkterne) i modsætning til K-metoden (de mindste kvadraters metode), er den kendsgerning, at yderværdier i økonomiske rækker, store udsving, ofte har deres aarsag i ekstraordinære forhold (strejker, bankkrak, panik etc), som er uden betydning for det egentlige aarsagsforhold mellem de undersøgte rækker, og det er en velkendt sag, at de mindste kvadraters metode netop giver yderværdierne særlig vægt, da metoden bygger paa afvigelsernes kvadrat. Ved at anvende de to metoder sideordnet paa økonomiske rækker, vil man faa deres forskelle belyst. I den bekendte Harvardundersøgelse: »Indices of General Business Conditions« (1919) har vi valgt to rækker, hvis indbyrdes forhold er grundigt undersøgt i det paagældende værk, nemlig renten for 60/90 dages veksler og raajernsproduktionen (side 124). Det drejer sig om en bestemmelse af efterfølgen (»lag«) mellem de to rækker, idet rentens bevægelser følger efter bevægelserne i raajernsproduktionen Side 137
Undersøgelsen omfatter perioden Januar 1903 til Juli 1914, men for at undgaa krigstallene udskyder man en maaned, hver gang efterfølgen forøges med en maaned; for 12 maaneders efterfølge sammenligner man saaledes raajernsproduktionen Januar 1903 til Juli 1913 med renten for Januar 1904 til Juli 1914. Som omtalt i »Indices etc.« side 12 kan man af korrelationskoefficienten beregne koefficienten til x (raajern) i ligningen for y (renten) ved at multiplicere korrelationskoefficienten med forholdet mellem middelfejlene for x og y; man faar saaledes for de samtidige værdier t. eks. For at spare arbejde har man ved Harvardundersøgelserne anvendt en lidt mere summarisk metode ved beregning af korrelationskoefficienten (jfr. side 123), idet man bruger samme middelfejl for alle beregningerne, skønt de spænder over forskellige tidsrum. Endelig er de værdier for raajernsproduktionen og renten, hvorpaa beregningen af korrelationskoefficienten er bygget, ikke de oprindelige værdier, men derimod de oprindelige værdier, udtrykt i procent af grundretningen og med sæsonsvingningerne fjernede (jfr. side 35). Da summen af disse x værdier og y værdier ikke er o, faar ligningen for y følgende form y = k • x -f- a, og de nøjagtige formler for k og a er efter K-metoden: hvor n er
antallet af værdier; beregner man saaledes ligningen
koefficienten til
x bliver her praktisk talt den samme som ovenfor,
Side 138
Anvender man nu T-metoden i stedet for til beregning af ligningen y = k • x -f- a, hvor y og x er de samme bearbejdede værdier for raajernsproduktion og for rente, som blev anvendt til beregning af korrelationskoefficienten, faar man følgende resultater: Koefficienten til x er væsentligt højere iflg. T-metoden end iflg. K metoden, men forskellen er faldende, og ved 12 maaneders efterfølge er kx lidt større (0.46) iflg. K-metoden end iflg. T-metoden (0.42); begge rækker kulminerer ved 5 og 6 maaneders efterfølge. For at kontrollere, hvor nøjagtigt man ved de paagældende ligninger kan beregne y værdierne paa grundlag af x værdierne, har vi foretaget en sammenligning for 5 maaneders efterfølge, hvor koefficienten kx er paa sit maksimum i begge rækker, nemlig 0.9 iflg. T-metoden og 0.77 iflg. K-metoden. Ligningerne bliver følgende: K-metoden:
T-metoden:
Metoden er
simpelthen at beregne den gennemsnitlige numeriske
Afvigelsen er altsaa kun 0.25 eller 2.5 % større for T-metoden end for K-metoden. Da y værdierne er de oprindelige værdier i procent af grundretningen, vil det altsaa sige, at man kan beregne renten med en gennemsnitlig afvigelse paa c. 10 % paa grundlag af raajernsproduktionen, naar man regner med en 5 maaneders efterfølge for renten efter raajernsproduktionen. En undersøgelse Side 139
af
afvigelsernes fordeling bekræfter, at yderværdierne faar
en De 20 yderværdier er beregnet af de 10 højeste og de 10 laveste x værdier. De gennemsnitlige afvigelser er for K-metoden omtrent ens for de 20 yderværdier (10.01) og for de resterende 114 mellemværdier (9.95), hvorimod T-metoden viser betydeligt højere afvigelser for de 20 yderværdier (12.69) end for de 114 mellemværdier (9.77), det er altsaa de 20 yderværdier, som er aarsag til en højere gennemsnitsafvigelse for T-metoden (10.21) end for K-metoden (9.96). Selvom man ønsker at gaa fuldt eksakt til værks, vil T-metoden som en første beregning give en klar og tydelig vejledning, som derefter, om fornødent, kan kontrolleres ved de mindste kvadraters metode for de »efterfølger«, som er af interesse, det vil i dette tilfælde sige fra 4—64—6 maaneder. Vender vi os nu til den hjemlige økonomiske statistik, finder man indenfor det danske prisniveau en interessant svingningslighed mellem priserne paa vegetabilske og animalske levnedsmidler. Fælles for de to varegrupper er den almindelige prisnedgang fra 1925 til 1931—32, efterfulgt af stigningen til 1935. Desværre tillader pristallet os ikke at gaa længere tilbage end til 1925. Vil man derfor undersøge særbe vægels erne for de to prisgrupper, maa man fjerne denne fællesbevægelse, prisniveauets almindelige udvikling; det sker ved at dividere pristallene for de to varegrupper med det samlede engrospristal for hver maaned t. eks. Det vil sige,
at vegetabilske priser i April 1925 ligger 7 °/o under
Side 140
sæsonsvingninger, som paa
grundlag af pristallene for September Efter disse forholdstal naar de animalske priser deres hojdepunkt i November og December og deres lavpunkt i April—Juni; vi har fjernet sæsonsvingningerne fra de animalske priser ved at dividere indekstallet for priserne med indekstallet for sæsonsvingningerne, man faar saaledes for April 1925 102 °/o som ovenfor anført. Kalder vi nu indekstallene for vegetabilske priser x og for animalske priser y, faar vi følgende værdier for k, naar vi beregner ligningen: y = k • x -f- a efter T-metoden: Ved at forskyde priserne i forhold til hinanden, saa de animalskepriser følger 1 maaned, 2 maaneder etc. efter de vegetabilske, ser man, hvorledes koefficienten k stadig stiger, fra 0,08 for samtidigeværdier lige til 0.87 for 24 maaneders efterfølge, hvilket vil sige, at særsvingningerne i de vegetabilske priser skulde vise sig i de animalske prisers særbevægelser 2 aar senere, det maa dog bemærkes, at stigningen i koefficienten kun er ringe fra 21 maaneders efterfølge til 24 maaneder (fra 0.83 til 0.87). For vegetabilskepriser har vi hele vejen igennem anvendt tallene for Januar 1925—December 1933, mens tallene for animalske priser er de tilsvarende tal lige fra samtidige til 24 maaneders efterfølge, 1) Om metoden ved. beregningen, se min artikel om konjunktursvingninger i Nat. Tidsskr. 1925. Side 141
altsaa i sidste tilfælde fra Januar 1927—December 193G. Paa kortet har vi afbildet de to kurver for vegetabilske og animalske priser, udtrykt i procent af engrospristallet og uden sæsonsvingning, idet vi har rykket de animalske priser 2 aar tilbage, da deres efterfølge er 2 aar. Hovedbevægelserne ide to kurver er nogenlunde ens undtagen for 1933 (resp. 1935 for de animalske priser). Forklaringen paa
denne sammenhæng mellem særbevægelserne midler hovedsagelig er bestemt af kornpriserne, som utvivlsomt er bestemmende for de animalske priser paa verdensmarkedet, navnlig flæskepriser. Høje kornpriser tvinger landbruget til indskrænkningaf svineholdet, men først c. 2 aar efter faar denne indskrænkning sin fulde vægt og resulterer i høje flæskepriser, og omvendt faar lave kornpriser landbruget til at udvide svineholdet, hvilket først faar sin fulde virkning c. 2 aar senere. Meget tyder paa, at der ikke er saa god overensstemmelse mellem særbevægelsernefor foderstofpriser og animalske priser som mellem vegetabilskeog animalske priser, fordi verdensmarkedets priser fortrinsvis er bestemt af kornpriserne og ikke af de foderstofpriser, som er afgørende for det danske landbrugs rentabilitet; her synes at være Side 142
en særlig mulighed for det danske landbrugs rentabilitet, fordi dets fodermateriale er saa sammensat og derfor kan varieres mere hensigtsmæssigt end de store landes landbrug, hvor fodersammensætningener mere ensidig. Udregner man ligningen for de 24 maaneders efterfølge, faar man: y= 0.867 •x -j- 16.78, og den gennemsnitlige numeriske forskel mellem faktisk og beregnet y udgør 4.72, hvilket er 5.4 % af gennemsnittet for y (87.8). Ser man paa afvigelsernes fordeling, faar man: Der er altsaa en
lille skævhed i fordelingen af afvigelser. Som Ma er
middelfejlen paa den beregnede værdi d. v. s.
middelfejlen a er den
gennemsnitlige numeriske forskel mellem den faktiske
Ms er
middelfejlen paa den faktiske værdi d. v. s.
middelfejlen for s er den
gennemsnitlige numeriske afvigelse (spredning) for de
Fra den normale eksponentialfordeling ved vi, at den gennemsnitlige numeriske afvigelse er c. 80 % af middelfejlen, og vi vil derfor overalt, hvor fordelingen er normal, lige saa godt kunne anvende den gennemsnitlige numeriske afvigelse som den mere omstændelige middelfejl ved beregning af fejlforholdet. Hvis fordelingen afviger væsentligt fra den normale fordeling, vil dette ikke slaa til, men i saa fald vil heller ikke middelfejlen være den fuldgyldige maalestok for fordelingen som forudsat. Beregner vi
fejlforholdet for de vegetabilske og animalske priser,
Side 143
Der er altsaa en
lille forskel mellem de to værdier for fejlforholdet,
altsaa det
normale forhold; for s og Ms skyldes afvigelsen, at de
Beregner vi
fejlforholdet for raajernsproduktionen og renten paa
K-metoden
T-metoden:
Fejlforholdet er altsaa meget nær det samme for de to grupper, raajernsproduktion og rente for 60/90 dages veksler med 5 maaneders efterfølge, og særbevægelser for vegetabilske og animalske priser med 24 maaneders efterfølge. Naar fejlforholdet er 64 %, vil det sige, at gennemsnitsfejlen ved beregningen kun er 64 %> af gennemsnitsafvigelsen for de faktiske værdier fra deres gennemsnit (spredningen), altsaa er det kun en meget moderat nøjagtighed eller en ret begrænset svingningslighed, som er til stede i disse to tilfælde. Forholdet er som maalestok for svingningsligheden væsentligt klarere end Pearsons korrelationskoefficient og betydeligt simplere at beregne. Naar fejlforholdet er 100 % eller derover, er der ingen svingningslighed mellem de paagældende rækker, er fejlforholdet 0, er der fuldstændig svingningslighed. Drejer det sig om samtidige rækker, hvor det ikke er klart, hvilken af rækkerne, man kan betragte som hovedfaktoren, maa man foretage en dobbeltberegning, nemlig beregne y af x og omvendt, men i de fleste tilfælde vil en af rækkerne være den dominerende, f. eks. naar man sammenligner det almindelige prisniveaus bevægelser med svingningerne i raajernsproduktionen. En lav korrelationskoefficient kan dække over en betydelig korrelation mellem to økonomiske rækker, hvis deres indbyrdes forhold bedst udtrykkes ved en kurve forskellig fra den rette linie (jfr. prishyperbelen ovenfor); i saa fald vil man hverken ved K-metoden eller T-metoden opnaa et tilfredsstillende resultat. Men forudsat, at den rette linie er det bedste udtryk for de to rækkers indbyrdes forhold, vil T-metoden give fuldt tilfredsstillende resultater.Hvorvidt Side 144
tater.Hvorvidtforholdet mellem to rækker bedst udtrykkes ved en ret linie eller anden kurve, kan som regel kun afgøres ad rent empirisk vej, ved forsøgsvise undersøgelser i det enkelte tilfælde. Fejlforholdet derimod er i alle tilfælde en paalidelig maalestok for overensstemmelsen, hvadenten det er en ret linie eller anden kurve, som bedst udtrykker forholdet mellem de to rækker. Note.Til belysning af T-metodens anvendelse kan vi anføre følgende tal fra beregningen af forholdet mellem pristallene for vegetabilske og animalske priser, omregnet til procent af det samlede engrospristal og uden sæsonsvingning. Ved deling af indekstallene i øvre og nedre halvdel for aarene 1925—1933 faar man: Ved forskydning af de animalske priser i forhold til de vegetabilske, forskyder man blot de ovennævnte tidsrum et tilsvarende antal rnaaneder ved beregning af forskellen for animalske priser; man faar saaledes: Side 145
For 24 maaneders
efterfølge er tyngdepunkterne følgende Ved beregning af den gennemsnitlige numeriske afvigelse mellem faktisk og beregnet kan man formindske udregningerne betydeligt ved at dele y-værdierne i to grupper, nemlig y-værdier, som er større end eller lig med de beregnede, og y-værdier, som er mindre end de beregnede værdier; man faar saaledes for animalske priser med 24 maaneders efterfølge: y-værdier over de
beregnede værdier y-værdier under
de beregnede værdier altsaa er summen
af numeriske afvigelser 509.5 og den gennemsnitlige
|