Nationaløkonomisk Tidsskrift, Bind 110 (1972)IAf Niels Kærgård * og Peder J. Pedersen ** 1. IndledningI dette
tidsskrift har Martin Paldam beskrevet en metode til at
forudsige årets nationalindkomst ![]() (1) ![]() (2) hvor Mt og Xt er
henholdsvis import og export for år t, medens MMtt,....
MMnt, X^,..., XXnt er ![]() (3) Et skon over
nationalindkomsten fås da ved at indsætte de fra (1) og
(2) skønnede udenrigshandelstal Paldams artikel er interessant set fra to synsvinkler. For det første er den et overbevisende forsøg på at vise, at en formaliseret model kan anvendes til forudsigelse og give resultater, der er fuldtud lige så gode som de ikke-formaliserede forudsigelsesmetoders. For det andet er den en interessant påpegning af, at den skematiske opstilling, i hvilken de endogene variable forudsiges ved hjælp af tal for de exogene, ofte i praksis vil være irrelevant, fordi der foreligger tal for endogene variable før der er tal for alle eksogene. Imidlertid udnytter Paldam kun den eksisterende økonomiske og statistiske teori i ringe omfang, idet hans metoder hovedsagelig er empiriske. Det må antages, at mere eksplicitte formuleringer af forudsætningerne med teoretiske overvejelser vil føre til bedre resultater og give mere indsigt i resultaternes egenskaber. Det følgende kan derfor både ses som konkrete forbedringsforslag og som forsøg på at påvise, at præcise teoretiske overvejelser er en nyttig baggrund for empiriske undersøgelser. ; I afsnit 2 skal sammenhængen mellem måneds- og helårstal for udenrigshandelen diskuteres, afsnit 3 behandler sammenhængen mellem helårstal for nationalindkomst og udenrigshandel. Spørgsmålet om betimeligheden af denne totrinsprocedure overfor en direkte sammenkædning af månedstal for udenrigshandelen med årets nationalindkomst skal kun rejses her. 2. Tidsrækkeanahjse af importenI dette afsnit
diskuteres kun beregninger foretaget på (1), idet
problemerne med (2) er parallelle. * Kandidatstipendiat ved Københavns Universitet. ** Amanuensis ved Handelshøjskolen i København. 1. Martin Paldam, »Udenrigshandelen som konjunkturindikator«, Nationaløkonomisk Tidsskrift 108 (1970): 46-64. Side 236
hjælp af tal for 1. halvår. Denne forudsigelse, som svarer til forudsigelse af 2. halvår ved hjælp af 1., skal generaliseres til forudsigelse af et vilkårligt halvårs import ved hjælp af det foregåendes herved opnås uden ulemper en fordobling af observationsantallet, fordi der ingen sæson er på halvårsbasis. I Paldams
forudsigelse er der et fast forhold mellem et halvårs
import og det efterfølgendes ![]() (5) hvor Mr er importen i r'te halvår. Denne antagelse om eksponentiel udvikling synes ikke begrundet de faktiske observationer jvf. fig. 1; tværtimod synes der i lange perioder at have været en stabil lineær trend. Det forekommer derfor naturligt at erstatte (5) med en lineær relation ![]() (6) hvor 13 er den gennemsnitlige importstigning fra halvår til halvår i perioden 1955-67 (importen 1955 = 400). Forudsiges M ved hjælp af enten (5) eller (6) fås en sum af afvigelsernes kvadrater på 8457 for den eksponentielle metode mod 8350 for den lineære; den eksponentielle giver 5 store afvigelser (forudsigelsesfejl på over 10%), medens den lineære kun giver 3 tilsvarende. Søges AMr forklaret ved AMx-x fås regressionen ![]() (7) hvilket heller
ikke tyder på en konstant opgangningsfaktor fra periode
til periode ![]() Figur 1 ![]() Side 237
I fig. 2 er forudsigelserne fra (5) tegnet op mod de faktiske værdier; figuren ville få et lignende hvis (6) anvendes istedet for (5). For begge modeller er hovedårsagen til fejl énperiodes udsving fra trenden, hvilket giver anledning til en fejl ikke blot i den pågældende periode, men også i næste, fordi forudsigelsen af denne periodes import alene er baseret på den foregående ekstreme værdi. Denne sidste fejltype kan undgås, hvis trendskønnet bygges på flere forudgående observationer. En stokastisk model til brug ved estimering af et sådant trendskøn er formuleret af Theil og Wage (1964) efter forskellige forløbere (Mutli 1960; Winters 1960) og videre behandlet af Nerlove og Wage (1964). Modellen består af tre relationer: ![]() (8) ![]() (9) (10) ![]() Den første af disse spalter Mx i dens trendværdi fr og en tilfældig variation ur, den anden er en definition af trendændringen fra t—l til r, r/r. Den tredie relation postulerer, at trendændringen en periode er lig med den foregående ændring på nær vx, der er en tilfældig variation. Det ses, at (10) svarer nær til (6). Det forudsættes, at de stokastiske led u og v er uafhængige tiden, indbyrdes uafhængige og har konstant varians, og der betragtes kun forudsigelser, der er vejede summer af de foregående observationer. Derefter kan de vægte, der minimerer middelværdien af den kvadrerede forudsigelsesfejl, udregnes. Disse vægte vil alene afhænge af én parameter h, der er bestemt af forholdet mellem variansen på v og u; både (5), (6) og (8-10) er således énparametermodeller. Parametren h er vanskelig at estimere, hvorfor de følgende beregninger foretages for flere forskellige værdier af h. Forudsigelserne med denne model er for perioden 1955-67 væsentlig dårligere end de tidligere 2. Summen af afvigeisenes kvadrater bliver over 10000 uanset værdien af /?, og der er lige så mange store afvigelser som i (5). Imidlertid er der væsentlige forskelle på de fejl, der begås; de store fejl for modellen (8-10) findes blandt de 10 første observationer, medens er spredt over hele perioden for (s)'s vedkommende. Fig. 1 viser, at der sker et trendskift 1958-59, og den stokastiske model er mere følsom for sådanne skift, fordi den fjernere fortid indgår ved beregningen af forudsigelserne. Af figur 3 fremgår, at for perioden 1960-67 - i alt 15 observationer - er (8-10) de øvrige modeller klart overlegen. Figuren viser summen af afvigelsernes kvadrater som funktion af parameteren h, og samme summer fra (5) og (6). Det ses, at for h mellem 0,20 og 0,35 er summen af afvigelsernes kvadrat for (8-10) mindre end for (5). Den optimale værdi af h er i denne periode 0,25, hvilket svarer til en sum af afvigelsernes på 5252 mod 6209 for (5) og 5833 for (6). I denne kortere periode giver (5) og (6) to store afvigelser, medens (8-10) ikke giver nogen. Gentages beregningerne for 1960-63 og 1964-67, fås for begge delperioder en optimal h-værdi på mellem 0,20 og 0,25, hvilket tyder på, at den optimale /i-værdi er stabil over tiden. For begge perioder vil enhver værdi af h mellem 0,2 og 0,3 give forudsigelser med mindre fejl end (5) og (6). I fig. 4 er forudsigelserne fra (8-10) tegnet op sammen med de faktiske værdier. Modellen svinger mindre end observationerne, idet den giver en forholdsvis stabil trend, der kun afbøjes når flere på hinanden følgende observationer har betydelige afvigelser til samme side. Sammenlignes med fig. 2 er forskellen tydelig. Det kan
konkluderes, at i perioder med en stabil trend giver
(8-10) gode forudsigelser, men 2. Beregningerne foretages ved at erstatte rækken af observationer, der ligger mere end to perioder tilbage med forudsigelserne i de to sidste to perioder; problemet indskrænkes derved til at finde to initialværdier for de forudsagte størrelser. Dette løses ved at antage akcellerationen fra 1952/1 til 1953/2 lig nul. Disse arbitrære begyndelsesværdier får hurtigt aftagende betydning. Side 238
![]() Figur 3 ![]() Figur 4 metoden er følsom overfor trendskift. Modellerne (5) og (6) er mere robuste overfor trendskift,men selv i perioder med stabil trend af og til store afvigelser (tilsyneladende i ca. 10-20% af forudsigelserne). Et valg mellem metoderne må bl.a. bero på, om det er muligt at forudse trendskift. Sker der grundlæggende forandringer i en periode - f. eks. tilslutning til fællesmarkedet - vil parametrene i en økonometrisk model, der er estimeret på historiske data, givetvis ændres, og ingen vil mekanisk bruge modellen i en sådan situation, der normalt kan forudses. Til sidst skal forudsigelserne for modellerne (5) og (8-10) sammenlignes uden for eslimationsperioden. 1969, hvor importstigningen var ekstraordinær høj, sker der tilsyneladende et trendskift, jvf. fig. 5. (5), som er mere robust overfor ekstraordinære ændringer, klarer sig bedst i og lige efter 1969, men allerede i 1970/2 er forudsigelserne fra (8-10) igen på højde med (s)'s. I (8-10) benyttes
hele den viden, der ligger i serien af halvårstal; den
information, man har 3. Estimation af inverse import funktionerI dette afsnit
koncentreres undersøgelsen om relation (3). Først skal
specifikationen diskuteres, I den enkle
keynes'ske korttidsmodel arbejder man med en
importfunktion af typen (11) ![]() Loses modellen
m.h.t. AY, fås den almindelige multiplikatorligning
![]() (12) hvor Ei,..., Ek
er de eksogene variable, hvortil man almindeligvis
regner eksporten. Paldams ![]() (13) Teoretiske
overveielser må give anledning til skepsis overfor
inddragelsen af AX som for Side 239
klarende variabel. Ved vurdering af zlA"s virkning på A Y er aktivitetsniveauet helt afgørende. Da estimationsperioden indeholder afsnit med højt og lavt aktivitetsniveau, findes der næppe en stabil koefficient til AX i (13). Desuden angiver eksporttallene stort set en ren trendudvikling,hvilket statistiske grunde gør denne serie mindre egnet som forklarende variabel. I tabel 1 er
korrelationskoefficienten mellem A Y og AX,
regressionskoefficienten og dennes ![]() Tabel 1. Sammenhæng mellem AY og AX. Det ses, at AX
giver et meget beskedent bidrag til forklaring af Y's
variation. Koefficienten til Det skal dernæst
diskuteres, hvilken vej en regression mellem AY og AM
skal foretages; ![]() (14) og ![]() (15) Med mindre de to
variable er fuldkommen korrelerede, fås to
regressionslinier med forskellige Dette valgproblem er af gammel dato i økonometrien. En af de første, der beskæftigede sig med det, var den danske økonom E. P. Mackeprang, der i sin doktorafhandling, Pristeorier fra 1906 søgte at bestemme efterspørgselsfunktioner på grundlag af tidsserier for sukkerpris og sukkerforbrug i England i perioden 1824-52. Mackeprang rejste spørgsmålet om, hvilken vej regressionen mellem pris og mængde skulle foretages, men opstillede ikke selv noget valgkriterium foretog derfor regression en begge veje. Dette valgproblem forblev et økonometrisk diskussionsemne i en lang årrække; så sent som i 30'erne foretog bl.a. H. Schultz (1938) i sine efterspørgselsanalyser pris-mængderegressionerne begge veje. Schultz foretrækker regressionen prisen som uafhængig variabel, men uden at dette sker ud fra et generelt princip. Et kausalitetsprincip er en mulig løsning på dette problem: eksogene variable indgår som forklarende variable i regressionen, mens endogene indgår som forklarede (se Wold 1969). Dette løser imidlertid kun problemet, i det omfang ens teori giver en tilfredsstillende opdeling i, hvad der er årsag og virkning. I den foreliggende problemstilling må det antages, at A Y bestemmer forbrugerne efterspørger flere udenlandske varer, fordi deres indkomst er steget, producenterne flere maskiner fordi en øget produktion gør det påkrævet. Med tilstrækkelig perioder ville dette antagelig vise sig ved, at AM afhænger af AY i den foregående periode. På helårstal vil AM og AY imidlertid blive simultant bestemt, da både AM og det bestemmende Y indgår i forsyningsbalancens ex post identitet mellem samlet tilgang og samlet anvendelse. I det følgende gennemgås to tilfælde, dels hvor virkningen går fra AY til AM, og dels hvor A Y og A M bestemmes simultant uden mulighed for at skelne, hvad vej virkningen går. Det antages i
dette afsnit, at A Y kan betragtes som eksogen. Et
estimat for stigningen i nationalproduktet ![]() (14a) hvor betegner
estimerede værdier. På basis af en ny observation af den
afhængige variable Side 240
![]() Figur 5 ![]() Figur 6 tionen.Hvisantagelsen om A Y's
eksogenitet er korrekt, er A Ya maximum-likelihood
estima Som alternativ
til (14a) har man den estimator, der fås ved invers
regression ![]() (15a) Forskellen mellem
(14a) og (15a) fremgår, hvis man udskriver
parameterestimatorerne ![]() hvor nu og yi er de respektive ændringers afvigelser fra deres middeltal. Maximum-likelihood estimatoren 1/^3 vil være større end ö, fordi SyfEm? :> (EnnyiY, se f.eks. Terkelsen, 1971, pp. 61-62. Da begge linier går gennem punktet bestemt af de gennemsnitlige værdier, følger med de gjorte antagelser om A Y's eksogenitet af det foregående, at A Yi systematisk skyder for lavt, når importændringen er over gennemsnittet, og for højt, når den er under, menszlF^ skulle forudsige uden systematiske fejl (se fig. 6). En tentativ kontrol af antagelsen om AY's eksogenitet kan derfor bestå i at lade de to regressioner forudsige A Y for en række perioder, hvilket er forsøgt ved en regression på perioden 1951-60, der derefter anvendes til at forudsige perioden 1961-70. Relationerne bliver følgende: ![]() (14b) det vil sige
![]() (14c) "g ![]() (15b) Side 241
Forskellen mellem de faktiske os de forudsagte stigninger i Y er vist i fig. 7. A Yi er mindre end A Y i 6 af de 8 år, hvor importstigningen var større end den gennemsnitlige i regressionsperiode 3. Desuden er koefficienten i (15b) vanskelig at tolke, idet den implicerer en marginal importtilbøjelighed på over én. Med hensyn til den gennemsnitlige kvadrerede middelfejl klarer den inverse estimator sig lidt bedre end maximum-likelihood estimatoren; der vil nedenfor blive vendt tilbage til dette forhold. I den statistiske teori har man under betegnelsen kalibrering arbejdet med de problemer, der opstår, når man onsker at give et skøn over den værdi af den uafhængige variable, som har frembragt en ny observation af den afhængige. I mange tekniske og biologiske problemstillinger det lettere eller billigere at skaffe nye observationer af den afhængige variable end af den uafhængige. Man kan f. eks. lænke sig, at slagtekyllingers vægt afhænger af mængden af vitaminer i deres foder, og at det er kostbart at måle en foderblandings vitaminindhold, men let at veje kyllinger. Har man så én gang fundet sammenhængen, kan det betale sig at måle foderblandingers vitaminindhold indirekte ved hjælp af kyllingers vægt. Den ovenfor diskuterede problemstilling er helt analog hermed, såfremt A Y kan betragtes som eksogen. Visse intuitive fornemmelser af hvilke resultater, der må nås, kan fås ved at betragte fig. (i. Hvis et punkt P ligger midt mellem de to regressionslinier i lodret afstand, vil det have en væsentlig vandret afvigelse for A Ya end for A Yi. Jo fladere linierne er, jo større bliver forskellen vandrette og lodrette afvigelser, så for meget flade linier må det ventes, at en linie, der minimerer den lodrette afvigelse, kan give meget store vandrette afvigelser. Det ses desuden på figuren, at valget mellem estimatorerne er af større betydning ved ekstrapolation som i vort problem end ved interpolation, som er det almindelige i tekniske og biologiske problemstillinger. Estimatorernes egenskaber er belyst ved Monte-Carlo forsog, der er genereret under den forudsætning, at Y bestemmer M (Krutchkoff 1967). Derved introduceres der afhængighed mellem den forklarende variabel og residualerne i (15), hvilket implicerer, at den inverse estimator er skæv. Forsøgene viser, at middelfejlen vokser kraftigt med faldende hældning, og at den entydigt er mindst for den inverse estimator. Det er imidlertid tvivlsomt, om det kvadrerede middelfejls-kriterium bør anvendes som tabsfunktion i den foreliggende situation, da det kan vises, at såvel maksimum-likelihood estimatoren som enhver anden central estimatorhar ![]() Figur 7 3. Til nærmere vurdering af dette er /-størrelsen: /— e\s{é), hvor eer den gennemsnitlige afvigelse mellem faktiske og forudsagte værdier i de nævnte 8 år, beregnet for begge regressionsligningers vedkommende. Bruges (14c) fås t = —1,28, medens (15b) giver t — 2,91, der er signifikant større end 0. Side 242
torharuendelig
stor varians (Williams 19fi9)4. Williams konkluderer
derfor om den inverse I den foreliggende situation, hvor den kvadrerede middelfejl på forudsigelserne ikke er brugelig som mål for en estimators godhed, kunne man soge at specificere en anden tabsfunktion. (1970) har på basis af en tabsfunktion defineret som den kvadrerede forskel mellem sand og estimeret hældning fundet en Bayes-estimator5. Denne estimator nærmer sig til maksimum-likelihood estiinatoren, når liniens hældning bliver stærkt signifikant forskellig fra nul. Når dette ikke er tilfældet, er det optimalt at forskyde maximum likelihood estimatoron de estimater, der fremkommer ved invers regression. Den inverse estimator er dog kun en Bayes-estimator under meget specielle forudsætninger6. Som konklusion på
diskussionen om valg af estimator, når AY antages
eksogen, kan iolgende 1. AYaer
maximum-likelihood estimatoren for AY. s\ 2. AYa er en
central estimator for AY, medens AYi er skæv. 3. En
sammenligning af de to estimatorer efter et kvadreret
middelfejlskriterium er irrelevant, 4. Den kvadrerede
afvigelse mellem estimeret og sand hældning er lille for
maksimumlikelihood I det konkrete
problem, hvor /? er signifikant forskellig fra 0, må det
konkluderes, at stærke Herefter skal valget af regression i tilfælde, hvor både AY og AM antages at være endogene, undersoges. I denne situation fås skæve parameterskøn ved enkeltligningsestimation, uanset hvad vej regressionen foretages. Den korrekte fremgangsmåde er at opstille en makromodel der indeholder eksogene variable. I denne kan der beregnes et konsistent skøn over den marginale Foretages alligevel enkeltlignings-estimation, er det af interesse at undersøge, hvad vej regressionen skal foretages for at minimere skævheden i hældningsskønnet. mellem A Y og AM antages at fremkomme i følgende enkle makro-model, der af overskuelighedsgrunde er opstillet i absolutte værdier af de variable, ikke i ndringerne Importfunktionen
![]() (16) eller ![]() (17) idet ![]() 4. Da \\p har uendelig stor varians. Williams foreslår derfor at bruge konfidensinterval-estimatorer stedet for punktestimatorer. Dette er imidlertid ikke til megen hjælp, da konfidensintervallet AY bliver fra —oo til -f oo for værdier af AMi nærheden af dens middelværdi, idet intervalgrænserne bestemmes fra en 2. gradsligning, hvis rødder er imaginære for A M i nærheden AM, se Brownlee 1965, pp. 346-49. 5. En Bayes-estimator kræver specifikation af en a priori fordeling for AYogen tabsfunktion defineret forskellen mellem estimeret og sand parameterværdi. Med udgangspunkt heri beregnes som den estimator, der minimerer tabsfunktionen (om Bayes-estimatorer f.eks. Mood og Graybill 1963, pp. 187-92). 6. A priori fordelingen af A y'erne skal være en /-fordeling med n—3 frihedsgrader, middelværdier. cg skalaparameteren [<r. ; l)/ — 3)]i . Side 243
Forbrugsfunktionen ![]() (18) Ex post
identiteten ![]() (19) hvor R
repræsenterer de øvrige efterspørgselskomponenter, som
antages at være eksogene. Skævheden på skønnene
kan udtrykkes på følgende måde (se f. eks. Johnston.
1963, p. 15) ![]() (20) ![]() (21) d.v.s. som
forholdet imellem kovariansen mellem regressor og
residual og variansen på regressoren. ![]() (22) Ved løsning af
modellen m.h.t. Y kan kovariansen mellem Y og u og
variansen pa Y bestemmes til ![]() (23) og ![]() (24) hvor s— I—b.1—b.
Variansen på M fås af (16) til ![]() (25) Indsættes (22-25)
i (20) og (21), fås skævhederne udtrykt ved
residualleddenes varianser og kovarianser ![]() (26) (27) Afgørende betydning for skævhedernes størrelse har kovariansen mellem residualleddene i import- og forbrugsfunktionen, oou e, målt i forhold til variansen på importfunktionens residual. Under den realistiske forudsætning, at variansen på de eksogene efterspørgselskomponenter er større end residualvarianserne, falder skævheden på /?, når aue vokser, medens skævheden på d vokser med voksende aau e (kan f.eks. ses ved at differentiere skævhederne m.h.t. au£). Antages, at residualvariationen er næsten uden betydning i forhold til variansen på de eksogene at opsparingskvoten er 0,2 og importkvoten 0,7, har /J mindre end å, hvis mere end omkring en syvendedel af variationen i importfunktionens residualled er fælles variation med residualleddet for forbrugsfunktionen (d.v.s. aue > 1/7 ctm2). I praksis må aUE antages at være relativt stor, da et unormalt stort forbrug antagelig bevirker, at de hjemlige producenter når kapacitetsgrænser, der bevirker, at en unormal stor import bliver nødvendig for at dække efterspørgslen; omvendt vil et unormalt lille forbrug bevirke, at indenlandske producenter får øget incitament til at holde udenlandske producenter ude. Desuden u og e bl.a. ikke medtagne regressorer, som kan tænkes at være af samme natur i de to funktioner. Det må således antages, at skævheden ved enkeltlignings-estimation minimeres, hvis Y anvendes som regressor og M som regressand. Sammenfattende
kan det siges, at i tilfældet, hvor A Y bestemmer AM,
giver en traditionel Side 244
ncmsnitligc.Itilfældet, hvor J V og AM bestemmes simultant, giver den traditionelle regression systematisk for store forudsigelser, mens den inverse giver for små, når importstigningen er större end den gennemsnitlige. Den systematiske fejl er imidlertid, under rimelige forudsætninger,mindst den traditionelle regression. Denne konklusion bekræftes af beregningerne i forbindelse med relationerne (14b) og (15b). LITTERATURBrownlee, K. A. 1905.
Statistical theory and methodology in science and
engineering. New York. Hoadley, B. 1970.
A Bayesian look at inverse regression methods af
calibration. Journal of the Johnslon. J.
1963. Econometric methods. New York. KrutchkolT, R. G.
1967. Classical and inverse regression methods of
calibration. Technometries 9: Mackeprang, E. P.
1906. Pristeorier. København. Mood, A. M. og F.
A. Graybill. 1963. Introduction to the theory of
statistics. International Student Muth, J. F. 1960.
Optimal properties of exponentially weighted forecasts.
Journal of the American Nerlove, M. og S.
Wage. 1964. On the optimality of adaptive forecasting.
Management Science 10: Schultz, H. 1938.
The theory and measurement of demand. Chicago.
Theil, H. og S.
Wage. 1964. Some observations on adaptive forecasting.
Management Science 10: Williams, E. J.
1969. A note on regression methods in calibration.
Technometrics 11: 189-92. Winters, P. R.
1960. Forecasting sales by exponentially weighted moving
averages. Management Wold, H. O. 1969.
E. P. Mackeprangs fråga om val av regression. I Essays
in memory of B3rge Barfod, Wold, H. O. 1969.
E. P. Mackeprang's question concerning the choice of
regression, a key probem |