Nationaløkonomisk Tidsskrift, Bind 123 (1985)Praktisk modelbygning og moderne økonometri - en kommentar1. IndledningSvend Hyllebergs disputats Scasonality in Regression er selvfølgelig først og fremmest en afhandling om sæsonen og dens behandling i økonometriske modeller. Værket må nærmest siges at have karakter af en avanceret lærebog. De empiriske dele indskrænker sig til illustrerende eksempler; efterspørgslen efter sodavand i Canada og forbrugsfunktionen for England er de to gennemgående. Der diskuteres både de båndspektrale metoder. Hylleberg tidligere har arbejdet med (Hylleberg 1977), og de i praksis anvendte sæsonrensningsmetoder som X-11 og Fællesmarkedets DAINTIES. Men forfatterens hjerte ligger ikke hos disse løsrevne sæsonrensningsmetoder, men hos mere integrerede metoder: Det må imidlertid forventes, at en ordentlig behandling af sæsonproblematikken kræver en simuitan modeiiering at samtlige sæson og ikkesæson processer. Dette kan gøres på flere måder, men den mest lovende synes at være en integration af den traditionelle økonomiske model med en tidsseriemodel, som f.eks. den type, der er diskuteret af Box og Jenkins i deres bog Time Series Analysis fra 1970 [Hylleberg i det danske resumé side 327]. Derved bliver bogen ikke kun en diskussion af sæson, men også en mere generel anvisning på, hvordan man efter Hyllebergs opfattelse bor bygge økonometriske modeller. Specielt kap. 7 er en 63 sider lang kogebogsagtig fremstilling af, hvordan økonometriske modeller bor fremstilles, og det er denne opskrift, der skal diskuteres i det følgende. Inden
diskussionen af kap. 7 skal den Holdningen til de ældre forfattere er helt klart lidt nedladende. De havde intet blik for, at sæson ikke var noget, der bare skulle renses ud, f.eks. citeres Jevons: Every kind of periodic fluctuation, whether daily, weekly, monthly, quaterly or yearly, must be detected and exhibited not only as a subject of study in itself, but because we must ascertain and eliminate such periodic variations before we can correctly exhibit those which are irregular or non-periodic, and probably of more interest and importance. [Hylleberg side ll]. Klogere var de ikke, mener Hylleberg. Men er det nu sikkert? Hele filosofien i disse første undersøgelser var at eliminere alt, hvad der kunne elimineres. De eliminerede jo også trenden for derved at begrænse undersøgelsen til en enkelt eller i hvert fald yderst få forklarende variable. Men det var ikke, fordi de ikke så sammenhængene. Mackeprang - økonometriens store danske pioner fra århundredets første årtier - diskuterer f.eks. i sin disputats fra 1906, om de årsgennemsnit af uge- og månedspriser, han bruger, er rimelige. Disse gennemsnitspriser, der ikke tager hensyn til omsætningen, er alt for høje, siger han, da omsætningen er yderst beskeden i de perioder, hvor prisen er høj (Mackeprang 1906, side 24). De vidste altså godt, at der var Dette indlæg er en, visse steder noget omformuleret, gengivelse af forfatterens opposition ved det mundlige forsvar af Svend Hyllebergs disputats ved Aarhus Universitet fredag den 28. september 1984. Side 105
sammenhæng i
det. men de havde ikke de Når Hylleberg er så opsat på at regne på en stor model, der integrerede alle processerne, er det jo fordi, han har hele 1980-ernes EDB-mæssige apparat i baghånden.2 2. Praktisk modelbygning og moderne økonometriHyllebergs disputats er en dansk økonometrisk afhandling, der bliver udgivet på engelsk; og det kunne derfor være en god chance for at gøre nogle af de, på grund af sprogbarrierer, oversete danske bidrag kendte for en bredere kreds. Den chance har Hylleberg absolut ingen intentioner om at udnytte. Identifikation diskuteres relativt generelt uden bare en enkelt lille fodnote om, at Warming var den første, der nævnte problemerne. Mackeprang er lige så overset hos Hylleberg, som i den angelsaksiske verden (Kærgård 1984). Faktisk er kun tre danskere (udover Hylleberg og hans nærmeste medarbejdere Bunzel og Bollerslev) fundet værdige til at optræde i litteraturlisten: Barndorff-Nielsen, Hald og Westergaard, og de er jo alle velkendte i forvejen i udlandet. For os mere nationalistiske, der ikke kunne drømme om at omtale det balancerede budgets multiplikator som andet end Gelting-effekten, er dette selvfølgelig noget skuffende. Hyllebergs disputats åbner således ikke omverdenens øjne for, hvad der sker og er sket i Danmark. Men den kan have den modsatte funktion. Den kan tjene til at åbne danske praktikeres øjne for, hvilke teorier der er udviklet i økonometrien ude i verden; og her er kapitel 7 en ret håndfast indføring i den modelbygningsstrategi, der er udviklet i de senere år af bl.a. Hendry. Fremstillingen er endda så håndfast, at Hylleberg selv får samvittighedsnag og indføjer udglattende sætninger som f.eks.: It may be worth underlining that this very schematic and apparently dogmatic procedure must be applied with flexibility. In practice one cannot build empirical models on dogmatism but one must apply all the information available and proceed with an open mind. [Side 227] Sammenholdes dette citat, med den øvrige fremstilling, kan man ikke undlade at komme til at tænke på det gamle Henry Ford I citat: »De skal have mulighed for at købe biler i lige den farve de ønsker sig blot de ønsker sig sort«. Hvad er da budskabet? I fig. 1 er både en gammeldags praktikers og den moderne økonometrikers (Hyllebergs) syn opstillet - selvfølgelig urimeligt skematisk, men alligevel. I det følgende
skal de 4 forskelle fra fig. 1 3. ModelstørrelsenMed hensyn til modelstørrelsen er Hyllebergikke særlig præcis. Men det ligger tydeligt i hele den valgte strategi, at der tænkes på små, lineære modeller, som så til 1. Man kan minde om historien fra Mackeprangs erindringer. Om sin store rejse til Tyskland umiddelbart efter sit bryllup, hvor han begynder arbejdet med disputatsen, siger han: »Grete var mig til stor hjælp, hun blev efterhånden ganske ferm med en logaritmetabel« (Kærgaard 1976). 2. Ganske vist takker Hylleberg også sin hustru Elly varmt i forordet, men det synes mest at være for moralsk støtte. Havde han stået med en regnestok og så Elly med en logaritmetabel, havde han næppe stået så uforstående overfor de gamles lyst til at simplificere modellerne. Side 106
gengæld har en relativ generel dynamisk struktur med flere lag på både endogene og exogene og med en relativt generel dynamisk struktur på residualleddene. Hvis ikke modellenvar lille, ville f.eks. koefficientpolynomiet \A(L)\ blive uoverskuelig stort og indviklet. Forudsætningen om modelstørrelsen nævnesnæsten eksplicit side 246 nederst: In the following we will present a Full Information Maximum Likelihood estimator applying the scoring algorithm and the Kaiman filter. However, at least in cases where the system is large, an individuel equation method may be the only tractable way. Ved brugen af tidsrækkemetoder, hvor generelle moving avarage og autoregressive processer er det normale, er der sket en drejning væk fra simple lagfordelinger (som f.eks. Koycklagget) og simple autokorrelationsmønstre (som almindelig første ordens autokorrelation!. Men denne drejning har ikke været omkostningsfri; det er kun muligt at arbejde med disse mere generelle metoder for små modeller. Integreringen af tidsrækkemetoder og traditionelle økonometriske modelbygningsmetoder kan altså nok resultere i modeller, der i visse henseender er mere generelle end den gammeldags type, men de nye er så til gengæld så komplicerede, at de kun er håndterlige, hvis modelstørrelsen holdes nede. Besynderligt nok er det sket samtidig med, at der for praktiske anvendelser er sket en øgning i modelstørrelsen. Brugerne har presset på for at gøre modellerne så store, at det er muligt at beregne virkningen af konkrete instrumentændringer. Desuden har den økonomiske krise med • samtidige betalingsbalanceunderskud og arbejdsløshed krævet en mere kompliceret økonomisk politik med forskellige former for tvist mellem sektorerne, hvilket har krævet et øget sektorantal. I netop den periode, hvor interessen i den teoretiske økonometri er drejet over mod små modeller, er f.eks. den officielle danske model ADAM således vokset til i 1982 at have 672 endogene variable mod Side 107
117 i 1973. (Se Andersen 1984), og det er næppe utypisk for udviklingen indenfor de økonometriske modeller, der anvendes af økonomisk-politiske beslutningstagere. 4. Brugen af økonomisk teoriBrugen af Økonomisk Teori er også helt forskellig. I den gamle praktiske metode blev der lagt afgørende vægt på den viden, man havde om de enkelte ligningers specifikation og om hvilke parameterværdier, der var rimelige. Hvor den viden kommer fra, kan ofte være ganske diffust. Ofte vil det være relativt ambitiøst overhovedet at kalde det teori. Det er en eller anden sum af erfaringer stykket sammen af brokker fra både teori og resultater fra tidligere undersøgelser. Vel nærmest en tro på, at viden akkumulerer, således at det vil være dumt helt at se bort fra, hvilke resultater man plejer at få. Den type af »teori« er ikke let at indarbejde i de Hyllebergske modeltyper, hvor det foretrækkes at arbejde med ligningssystemet på den såkaldte Autoregressive Final Form - vel når det kommer til stykket det nærmeste man i en dynamisk model kan komme det reducerede system fra statiske modeller; og altså et system, hvor de enkelte parameterværdier i struktursystemet ikke fremgår direkte. Der er således umiddelbart en mindre interesse for den tidligere beskrevne a priori-viden. Derimod vises der i den nye metode en betydelig interesse for modellens langsigtede egenskaber; om de genererer en steady state, hvor forholdet mellem forskellige variable tenderer mod at være konstant. Dette synspunkt spiller ikke nogen dominerende rolle i disputatsen, men findes i bl.a. eksemplet med den engelske forbrugsfunktion side 198-206 (i kap. 6). Med hensyn til en automatisk indbygning af steady state egenskaber ved modelopstilling er der sket meget i de senere år med udviklingen af de såkaldte Error Correction-modeller, der i den simpleste udgave består i at introducere et differensled (xt^ l —y t^ 1) i en relation i ændringer (normalt vil det være naturligt at tænke på x og v som målt i en logaritmisk skala, altså x= logX og y= log Y): Derved vil forholdet mellem x, og y, tendere mod at være lagt fast på langt sigt. Lad os antage, at y er mellem 0 og 1. Tænker man sig da et niveauskift opefter i x fra én konstant værdi til en anden, vil der, selv om leddet fiAxt bliver nul igen allerede perioden efter niveauskiftet, fortsat være en vækst i y forårsaget af leddet y(x, _,- —y(_;) indtil (.xrr _ ,• — y,_,) bliver lig —a/y, hvilket, hvis xog y er målt logaritmisk, svarer til at der er et fast forhold mellem X og Y. Disse modeller kan i mange henseender betragtes som opstillet som en kritik af relationer estimeret i ændringer (idet sådanne relationers langtsigtsegenskaber er helt übestemte, da de bl.a. hænger på det ikke specificerede konstantled), se f.eks. Hendry m.fl.: Fisher (1962) advocated using equations involvingonly differenced variables to facilitate study of short-run behaviour without having to specify trend dominated long-run components. The main defects in this strategy are that one loses almost all a priori information from economic theory (as most theories rely on steady-state arguments) and all long-run information in the data (yet Granger's "typical spectral shape" suggests the economic data are hughly informativeabout the long-run: see Granger, 1966). [Davidson, Hendry, Srba, Yeo 1978, side 680]. Side 108
Det der sker nu i økonometrien, er vel en drejning væk fra det korte sigt på tilsvarende måde, som det skete i makroøkonomisk teori, da vækstteorien i slutningen af 1950'erne for alvor blev introduceret. Som Ølgaard formu- lerede det dengang i begejstringens rus: Dertil kommer, at formålet med modellerne kun er at diskutere betingelserne for en harmonisk vækstrate på længere sigt; alle disse problemer af mere kortsigtet karakter, som nødvendigvis opstår samtidig, er ladt ude af betragtning. Imidlertid kan man jo ikke samtidig stange ål og gå på harejagt, og spørgsmålet er vel, om man ikke tilstrækkeligt længe har stanget de Keynes'ske ål, så det snart kunne være på tide at prøve at jage harer på vækstens udstrakte vidder; ellers risikerer man måske helt at glemme, hvordan det her ser ud. - De, der har lyst, kan jo så i mellemtiden prøve at konstruere et amfibium, hvormed man både kan fange ål og gå på harejagt . . . [Ølgaard 1958] Man kan blot undre sig over, at interessen for langt sigt bliver skabt i økonometrien præcis samtidig med interessen for vækstteori (og langt sigt) stagnerer i den almindelige makroteori. Skal man vurdere den nye retnings holdning, må man nok sige, at den tolker relationerne væsentlig mere håndfast end sædvanligt. Hvis man, som det førhen var tilfældet, bcgrunder en lineær relationsform ved en linearisering af en generel ikke-lineær differentiabel funktion, bliver de langsigtede egenskaber noget, der ligger langt uden for, hvor den lineære approximation er gyldig, og dermed uden for, hvad estimationerne kan sige noget om. Ud fra denne betragtning bliver det nærmest en fordel, at relationer i ændringer intet siger om de langsigtede egenskaber, da man netop ikke er villig til at bruge så restriktive forudsætninger om relationerne, at det er muligt at bestemme langsigtsegenskaberne. 5. Specificering af modellenTæt forbundet med det forrige er også den procedure, der anbefales ved eksperimenter med specifikationen. I en situation som den ovenfor beskrevne »gammeldagse«, vil. det være naturligt at begynde med det, man er nogenlunde sikker på, og så forsigtigt føje nye variable på, og se om det går empirisk godt. F.eks. kan multicollinearitet betyde, at det bliver tvivlsomt hvilken en af to stærkt korrelerede variable, der får den afgørende betydning, man kan tænke på indkomst og realkassen i en forbrugsfunktion. Er det tilfældet, smider vi da realkassen ud, da alle tidligere undersøgelser indicerer, at indkomsten bør være inde. En formel variant af denne procedure er den såkaldte prioriterede regression, beskrevet af Nils Kousgaard i forbindelse med en medicinsk undersøgelse (Kousgaard 1984). Her er ideen den udbygning af den ovenfor anførte, at man prioriterer de forklarende variable i. forskellige grupper, og så lader de højst prioriterede variable tage hele den den del af variationen, de kan; og så kun overlader de resterende variable at forklare det tilbageblevne uforklarede. Her over for står den nye metode, hvorefter man starter med den mest generelle specifikation(altså kun lader teorien afgøre hvilke variable, der evt. kan komme på tale) og så bruger data til at finde specialtilfælde af denne generelle model, der giver lige så rimelige forklaringsgrader (altså bruger data til at indskrænke antallet af forklarende variable). Et centralt led i denne simplificering ved hjælp af data er den af Sagan udviklede COMFAC-analyse (se Hylleberg side 241 ff. og Hendry & Mizon, 1978). Heri testes, om der findes sådanne restriktioner på de Side 109
generelle
modeller, at koefficienterne kan Hendry (1979) beskriver de gammeldags metoder, som »excessive presimplification with inadequate diagnostic testing« overfor det nye »intended overparameterisation with data based simplification«. Også Hylleberg
argumenter helt klart for The procedure usually applied in this context starts out by a formulation and estimation of a very general model which supposedly incorporates the likely alternatives. The model is then gradually simplified by help of a series of tests until the final model emerges. [Hylleberg side 240] Ingen af metoderne er uden ulemper. Starter man med en grundmodel, hvor visse variable fra den sande model er udelukkende, vil man under hele specifiseringsfasen arbejde med en fejlspecificeret model med alt, hvad dette indebærer.4 Omvendt vil en meget generel modelformulering med mange variable medføre en betydelig risiko for multicollinearitet og dermed risiko for, at centrale variable kan blive smidt ud (den sidste argumentation vil ikke uden videre blive akcepteret af tilhængere af et generelt startoplæg, idet de vil argumentere, at multicollinearitet skal ses relativt til forklaringsgraden, og forklaringsgraden vil stige med flere variable).5 interest in economic theory. A further drawback is that the significance level of the unstructured sequence of tests actually being conducted is unknown.« (Hendry 1979 side 226). 5. Efter at have henvist til formlen for den kvadrerede /-værdi for test af om en koefficient er signifikant forskellig fra 0: fif/\dr {fit) = (T-m)rf/(\-rf), se Theil 1971 side 174, siger Hendry :»A crucial point is that a partial correlation like ri can increase as m increases to m+n even if the n added variables are highly (but not perfectly) collinear provided they are relevant to explaining the regressand. Thus t values can increase even though the moment matrix requiring inversion in least squares becomes "more singular" in the sense of having a smaller determinant or a smaller ratio of the least to the greatest eigenvalue ... In effect, the issue is that "collinearity problems" are likely to conjunction with omitted variables problems. If the n initially excluded regressors are important in determining the regressand, then adding them may well help resolve what appears to be a collinearity problem between the m originally included variables... Consequently, it is not universally valid to assume that a group of badly determined estimates indicates the presence of collinearity (to be solved by reducing the dimensionality of the parameter space) rather than omitted variables bias (solved by increasing the dimensionality of the parameter space)«. (Davidson, Hendry, mf. 1978 side 676-77). 3. A(L)y = B(L)x +u er en relation, hvor A(L) og B{L) er lag-polynomier. Hvis A(L) = C(L) a(L) og B(L) = C(L)b{L), kan relationen reduceres til a(L)y = b(L)x + c hvor C(L)r =u. Da a(L) og b{L) er af lavere orden end A{L) og B(L) er koefficienterne reduceret, men til gengæld har residualmønstrret antagelig ikke samme pæne egenskaber. Adskillige simple specifikationsformer kan tolkes som COMFAC-reduceringer af den generelle model, f.eks. vil y= b(L)x fremkomme hvis C(L) = A(L). 4. Eller med Hendrys ord: »Such an outcome highlights a major problem with the "specific to general" approach, namely that every test is conditional on arbitrary assumptions which are to be tested later, and if these are rejected, all earlier inferences are invalidated, whether "reject" or "not reject" decisions. Until the model adequately characterises the data generation process, it seems rather pointless trying to test hypotheses of Side 110
6. EstimationsmetodeEndelig, hvad angår estimationsmetode. er praktikere mere og mere gået væk fra at interessere sig for simultanitetsbias. Argumentationen er, at man først og fremmest har brug for en enkel og robust estimationsmetode, som man aldrig kommer helt galt af sted med, og som kan bruges til hvad som helst. Det minder lidt om et andet af Henry Ford Fs udsagn om biler: »Vi stræber efter at lave biler, hvor alle dele kan repareres af enhver, hvorsomhelst, blot med brug af en tang og en skruetrækker«. Økonometriens Ford T det er utvivlsomt OFS. Her ovenfor står så det teoretisk optimale Full Information Maximum Likelihood. Med til at give maksimum likelihood metoderne vind i sejlene ved simultan estimation er nok også den øgede brug af disse metoder på andre områder (f.eks. til estimation af Logitog Probit-modeller). Derved er den frygt for normalfordelingsforudsætningen, der tidligere var udbredt, blevet nedbrudt. Samtidig er de beregningsmæssige hindringer for brugen af FIML, ikke længere så afgørende både begrundet i øget EDB-kapacitet og bedre algoritmer. Der kan gives teoretiske argumenter for begge holdninger (simultanitetsbias er måske ikke så stor i de almindelige makromodeller estimeret på variable med trend); men når alt kommer til alt, er valget nok helt bundet til det tidligere diskuterede om modelstørrelsen. I en lille model med nogenlunde ligeværdige relationer kan FIML være naturlig. En stor model, der består af relationer af meget forskellige kvalitet (herunder af tvivlsomme relationer, som man, hvis ikke de er strengt nødvendige, prøver at undgå brugen af), kræver, at man let kan tage relationer ud og ind uden at røre ved den øvrige model. Samtidig vil man her ikke være interesseret i at få fejlene i tvivlsomt specifieerede dele af modellen spredt ud over alle relationerne. 7. KonklusionDet foregående er ikke nogen afbalanceret diskussion af Svend Hyllebergs disputats. Det er en understregning af. at udover at være en afrundet fremstilling af sæsonens behandling i økonometriske modeller, er disputatsen også en introduktion til den retning af den moderne økonometri, der har D. F. Hendry som ledende talsmand. Formålet med dette indlæg har været at gøre opmærksom på, at de anbefalinger, der ligger i denne moderne økonometriske retning, og som er systematisk beskrevet i Hyllebergs kapitel 7, afviger radikalt fra, hvad man traditionelt har gjort blandt praktisk arbejdende økonometrikere. Hvilket alternativ, der bør foretrækkes, kan det være vanskeligt at afgøre ud fra teoretiske overvejelser. Men man kan erindre om den kinesiske leder Deng Xiaoping's udtalelse om, at han er mindre interesseret i kattes udseende, end i om de kan fange mus. Lige sådan er det med økonometriske metoder det afgørende er, hvordan de virker i praksis. Og hvor effektiv den Hyllebergske metode er til at fange mus, er det nok for tidligt at udtale sig om - at kunne beskrive sodavandsefterspørgslen i Canada, er måske ikke ligefrem nogen fed mus, og den engelske forbrugsfunktion har der været mange katte om at fange. Men under alle omstændigheder står vi med en konsistent og sammenhængende metode, der også bør diskuteres blandt danske modelbyggere. Den er vel endnu ikke så gennemprøvet, at det uden videre kan Side 111
anbefales praktiske modelbyggere at forlade de gamle metoder. Nu er det op til dem, der tror på de nye metoder, at vise, at de også fungerer ved praktiske empiriske undersøgelser. Økonomisk
Institut, Kobenhavns
Universitet Niels Kærgård
LitteraturAndersen, Ellen
1984. Lidt om ADAM. 1 Davidson, J. E. H., D. F. Hendry, F. Srba og S. Yeo. 1978. Econometric Modelling of the Aggregate Time-Serie Relationship Between Consumer's Expenditure and Income in the United Kingdom, Economic Journal 88, 661-92. Fischer, F. M.
1962. A Priori Information and Granger, C. W. J.
1966. The Typical Spectral Hendry, D. F. og G. E. Mizon. 1978. Serial Correlation as a Convenient Simplification, Not a Nuisance: A Comment on a Study o( the Demand for Money by the Bank of England. Economic Journal 88, 549-63. Hendry, D. F. 1979. Predictive Failure and Econometric Modelling in Macroeconomies: The Transactions Demand for Money. I Ormerod (red), Economic Modelling. Hylleberg, Svend. 1977. A Comparative Study of Finite Sample Properties of Band Spectrum Regression Estimators. Journal of Econometrics 5: 167-182. Hylleberg, Svend. 1983. Seasonality in Regression. The Integrated Econometric Time Series Procedure. Memo 1983-9, Økonomisk Institut, Aarhus Universitet. Hylleberg, Svend.
1984. Seasonality in Regression. Kousgaard, Niels.
1984. Prioriteret regressionsanalyse. Kærgård, Niels.
1976. E. Ph. Mackcprang Kærgård, Niels. 1984. The Earliest History of Econometrics: Some Neglected Danish Contributions. History of Political Economy. Theil, H. 1971.
Principles of Econometrics. Ølgaard, A. 1958.
1 Problemstillinger i |