Nationaløkonomisk Tidsskrift, Bind 112 (1974)

kim andersen: Numerisk simulation og statistisk Aarhus: Institut for Operationsanalyse, 260 pp. Kr. 35,00.

Erik Harsaae

Når en afhandling indleveres som disputats, dens forfatter dermed gældende, at han mener at have præsteret noget originalt, noget nyt, på sit forskningsområde. mener altså at vide noget om de udforskede ting, som andre ikke kan vide. Derfor er det et stort krav at stille til et bedømmelsesudvalg, at et sådant skal kunne vurdere det præsterede arbejde på grundlag af en i formen knap redegørelse de undersøgte matematiske modeller, algoritmer og taleksempler uden motivering af undersøgelsernes formål baggrund sammen med en nødtørftig over litteratur uden nogen oversigt over denne litteraturs indhold sammenhæng med afhandlingen. Et sådant krav mener undertegnede anmelder af Kim Andersens afhandling Numerisk simulation og statistisk ligevægt, at det udvalg, som af det økonomiske fagråd ved Århus Universitet blev nedsat at bedømme denne afhandling, blev stillet overfor. Anmelderen indtrådte som statistiker i udvalget, hvis andre medlemmer var professor Svend Fredens, Institut for Operationsanalyse, Aarhus Universitet, og professor Ole Nielsen, Handelshøjskolen i Århus. Udvalget drøftede de mangler ved afhandlingens lingensydre form, jeg har antydet, men kom til det (muligvis forkerte) resultat, at det ville være dårlig anvendelse af en forskers evner at tvinge ham til at opfylde som var af rent fremstillingsteknisk

Men af denne karakteristik fremgår det, at afhandlingen af mange må føles vanskeligt Stor fortrolighed med den kø teoretiske litteratur om analyse af køsystemer ved numerisk simulation er næsten en forudsætning for et positivt udbytte af læsningen. Vanskeligheden består i, at forfatteren skriver uklart, men at afhandlingen er altfor uorganiseret, at man uden en sådan indsigt kan gøre sig klart, hvad det enkelte afsnits funktion i helheden er.

Som statistiker må man være meget interesseret i en afhandling om numerisk simulation af stokastiske processer, således der her er tale om. I en vis forstand numerisk simulation jo en statistikers i stedet for at måtte nøjes med de sædvanlige mangelfulde empiriske data producerer man sine data ad libitum på maskine.

Og på en anden led: man får mulighedfor at løse matematiske problemer, hvis deduktive løsning kan være vanskelig. Betegnelsen »induktiv« angiver, at der er tale om en slutning fra stikprøve (simulerede data) til den logiskestruktur et system (data-generatoren).Ved

Side 463

ren).Vedsådan slutning må den generellemetodik, kaldes »statistisk inferens«(teorier estimation og hypoteseprøvning),være Det kan derfor for en statistiker føles lidt forsmædeligt at måtte tilstå sine store vanskeligheder ved at tilegne sig Kim Andersens afhandling.

Helten i H. C. Andersens eventyr om kejserens nye klæder er jo det lille barn. og ikke den embedsmand, som roste svindlernes af skræk for at få skyld for ikke at forstå sit embede. Nu har jeg vurderet afhandling i embeds medfør og vil ikke være så barnlig, at jeg beskylder Andersen for slet ikke at have givet kejseren noget på, men nok for, at det er svært at samle de leverede klædningsstykker til et pænt sæt tøj. Jeg skal klunse i bunken, så godt jeg kan.

Lad mig bemærke, at denne anmeldelse er ensidig i den forstand, at den ikke yder afhandlingens kø teoretiske og datamatiske aspekter retfærdighed. Udvalgets øvrige medlemmer havde til opgave at dække disse områder, som opfattedes som afhandlingens hvorfor det også Fredens og Ole Nielsen, der var officielle opponenter ved det mundtlige forsvar af disputatsen den 23. november 1973. Bemærkningerne i det følgende står for min egen regning, idet jeg dog samtidig vedstå min gæld til de nævnte personer for den grad af forståelse, jeg trods alt har nået.

Desværre må jeg konkludere, at man på Institut for Operationsanalyse benbart mener, at de erkendelsesteoretiske der klassificeres under betegnelsen »statistisk inferens«, kræver nogen speciel ekspertise. Det var det økonomiske fagråd, som insisterede på, at en statistiker skulle indtræde i udvalget, instituttet ikke fandt dette motiveret. Ikke desto mindre opstod der senere mulighed for fornyet diskussion af Kim Andersens arbejder (herunder disputatsen) bedømmelse af ansøgerne til et professorat i statistik, hvoriblandt Kim Andersen. Udvalget til bedømmelse af disse ansøgere bestod af Fredens og undertegnede med professor P. C. Matthiessen, Københavns Universitet, og direktør O. Ingvartsen, Kommunernes Landsforening. Grunden til, at jeg også må nævne professoratsudvalgets bedømmelse, senere blive klar.

Under drøftelserne i udvalgene er det blevet fremhævet, at Kim Andersens fortjeneste består i, at han som en af de første inden for køteoretisk forskning har forsøgt at udvikle rationelle kriterier for standsning af en numerisk simulation, når man har produceret en tilstrækkelig stor stikprøve til at nå den nøjagtighed, hvormed et bestemt aspekt af et system (udtrykt ved en parameter) ønskes estimeret.

Simulationen producerer stikprøven i form af en realisering af en stokastisk proces (et kø- eller lagersystem). Denne realisering sker ved at starte i en bestemt tilstand, tilstand nr. i. Tallet i kan f.eks. angive antal kunder i et ekspeditionssystem antal enheder på et lager. Ved hjælp af tilfældige tal simuleres ndringer systemet. Stikprøvens størrelse kan måles ved det antal skridt, man lader processen (f.eks. en Markov-kæde) gennemløbe. kan alternativt tale om længden T af den tid, man simulerer. I en realisering kan man registrere, i hvilke andele af den samlede tid systemet

Side 464

har haft et givet antal elementer. Antallet tidspunkt / angives ved en funktion X(t) eller, i Kim Andersens notation, an {i), hvis værdisæt er endeligt, f.eks. X{t) = j, hvor j = o, 1, 2, .. ?JV. Af en realisering beregnes et tidsmiddeltal


DIVL8744

(0

der er formuleret som et betinget middeltal, værdi afhænger af initialtilstanden (som i Kim Andersens eksempler antager samme værdier som j ovenfor). Tidsmiddeltallet i (1) afhænger dermed af den forventede systemtilstand i tiden t, betinget af start i tilstand nr. i, nemlig


DIVL8750

(2)

hvor pij(t) er sandsynligheden for overgang tilstand nr. i til tilstand nr. j i løbet af t tidsenheder. Som man ser, er h{T) i (1) et middeltal af de faktiske størrelser, hvis forventede værdier er qi{t), for o <; t < T. Medens (2) refererer til at tidspunkt, refererer (1) til et tidsinterval. Desuden kan man indføre


DIVL8756

(3)

Si{T) = standardafvigelsen på r$ (T). (4)

Det vil føre for vidt her at gå nærmere ind på udledningen af Sf(T) i (4). Netop udledningen af algoritmer for en række køsystemer til bestemmelse af (4) er det væsentligste resultat af Kim Andersens arbejde. Idet endelig


DIVL8764

(5)

hvor pj er systemets ligevægtssandsynligheder, hvor Q, den forventede systemtilstand ligevægt, er den parameter, som ønskes estimeret ved simulation, definerer Andersen de tre varianter af »statistisk ligevægt«, der hentydes til i afhandlingens nemlig


DIVL8770

DIVL8772

Denne terminologi forekommer en statistiker dels fordi den sammenblander som ikke direkte har noget med hinanden at gøre, dels fordi den undlader at knytte kontakt til den sædvanlige terminologi i den statistiske estimationsteori. Betegnelserne »1., 2. og 3. art« antyder, at der er tale om opspaltning en iøvrigt homogen gruppe af begreber, hvorved man slører den indsigt, ligevægt af 1. art er en karakteristik det simulerede system (f.eks. at det besidder Markov-egenskaber), medens ligevægtene af 2. og 3. art karakteriserer en estimator. En statistiker ville sige, at en estimator som r$ (7") var konsistent, idet konsistens i ordets statistiske betydning netop består i, at ligevægt af 2. og 3. art samtidig karakteriserer ri{T), svarende til, at ERi(T) - Q. -+ o og st (T) -» o for voksende 7".


DIVL8776

Ligevægten af 1. art er altså til stede (eller ikke til stede) alt efter valget af det system, man vil undersøge. For et givet system kan man overveje, hvorledes man bedst muligt opnår information om dets egenskaber. Hvilken estimator eller esti-

Side 465

mationsprocedure overhovedet skal man vælge? Det afgørende er her ikke, om man af praktiske grunde netop er interesseret at bestemme Q,i (5). Havde man f.eks. estimeret pj i dette udtryk, ville Q. være beregnelig som en afledet størrelse samtidig med, at kendskabet til pj kunne muliggøre også andre beregninger. Statistikere sandsynlighedsteoretikere har netop i de senere år udledt en række resultater estimation af pj i Markovkæder fra relative hyppigheder i overgangsmatricerne.

Nu har Kim Andersen imidlertid bestemt for at benytte estimatoren (1) og udviklet et program, som tillader beregning (4). Han undersøger i nogle af sine taleksempler estimatorens fordeling finder, at den i mange tilfælde nærmer sig den normale fordeling for voksende T. I sådanne tilfælde benytter han de klassiske tre sigma-grænser til konstruktion af sikkerhedsintervaller for Q,. Ved det mundtlige forsvar af disputatsen Kim Andersen imidlertid, dette ikke skulle opfattes sådan, at brugbarheden af algoritmen til bestemmelse si (T) var betinget af normalitet. Selv når den normale approksimation svigtede, (4) stadig en nyttig størrelse at kende, idet man kunne falde tilbage på Tjebysjefs ulighed.

Det var diskussionen af dette spørgsmål, fortsatte i det senere professoratsudvalg, de specielt statistiske sider af disputatsen måtte komme i forgrunden. Kim Andersens metode til afgørelse af spørgsmålet »normalitet eller ikke-normalitet«, det klassiske Karl Pearsonske kunne betragtes som en acceptabel metode hos en »bruger af statistik«, hvorimod man, dersom man specielt interesserede sig for problemets statistiske aspekter, nok burde gå ind i et direkte arbejde med spørgsmålet om, hvad der måtte være den optimale metode at afgøre, om normalfordelingen er brugbar. Da der under alle omstændigheder tale om en asymptotisk normalitet spørgsmålet er, hvornår en fornøden grad af approksimation nås) er der ikke tale om testning i bogstavelig forstand.

De systemer, Kim Andersen bruger i sine eksempler, er systemer, for hvilke Q. kan bestemmes såvel analytisk (deduktivt)som form af et estimat) ved simulationen.På sigt må formålet være at udvikle standsningskriterier for tilfælde, hvor facit ikke på samme måde kan bestemmes på forhånd. Kim Andersensgoodness-of-fit-tests at normalitet ikke altid tilnærmes i tilstrækkelig grad, og at Ti visse modeller skal være høj, for at approksimationen bliver god. Hvordan klassificerer man i praksis et system som værende af den art, hvor normalitet kan forudsættes? I så fald kan man i hvert fald klare sig med et langt mindre T, end hvis Tjebysjefs ulighed skal benyttes. Spørgsmålet er derfor praktisk vigtigt. Man må foretrække kriterier, som beregnesaf stikprøven, f.eks. i form af skævheds-og/eller kurtose-mål, eller også må man forsøge at slutte ud fra karakterenaf system, der genererer data, om h(T) i et sådant system bliver tilnærmelsesvisnormal rimelige Tværdier.På baggrund forsøgte jeg i professoratsudvalget at få den betragtningfrem, de generaliseringer af den centrale grænseværdisætning, som under

Side 466

visse forudsætninger er gyldige også for middeltal af autokorrelerede størrelser, var nok så relevante som de omtalte goodness-of-Jit-tests. En uheldig formulering motiverede den indsigelse, at asymptotisknormalitet ikke var generelt gyldig.Nej, ikke: det drejer sig netop om at finde et operationelt kriterium på, hvornår den er, og hvornår den ikke er, kombineret med en sekventiel procedure,der at den fornødne approksimation indtræffer ved praktisk relevante T-værdier.

Kim Andersens afhandling indeholder desuden nogle argumentationer, som polemiserer fejlopfattelser i den køteoretiske F.cks. tager han stilling spørgsmålet: bør den eventuelle bias i h{T) som estimator af Q_, der kan tilskrives det vilkårlige valg af tilstand nr. i som initialtilstand, motivere, at man beskærer en realisering (stikprøve) ved at udelade den første del af den (så at »tilfældet« afgør, hvilken tilstand der i den beskårne realisering er initialtilstand) ? Kim Andersens argumentation mod denne nemlig at man ikke kan undgå at starte i én bestemt tilstand, må bifaldes. for, at beskæringen bevirker et informationstab, i afhandlingens afsnit er dog vanskeligt gennemskueligt og strengt taget overflødigt som i forvejen kendt (jvf. variansanalysen). Efter min mening er der imidlertid her tale om, at Kim Andersens procedure er endnu bedre, han selv giver den kredit for. I alle sine eksempler har han nemlig gennemført med alle mulige initialtilstande, så han ikke blot benytter gennemsnitligt god procedure, men en procedure, som viser, hvor langsom en konvergens mod Q, t værste fald kan blive (nemlig med den initialtilstand, som i det givne system er den uheldigste i så henseende). Det vises bl.a. i nogle af eksemplerne, at konvergensen ikke altid er monoton, hvilket strider mod, hvad nogle køteoretiske undersøgelser har forudsat.

Også i andre henseender har Kim Andersen interessante resultater i disputatsen, men jeg må i nogen grad støtte mig på andres udsagn, forsåvidt angår deres køteoretiske originalitet. Hvad den datamatiske side af afhandlingen fremkom en kritik ex auditorio, offentliggjordes i »Ingeniørens Ugeblad« samme dag, som den mundtlige foregik. Såvidt jeg ved, er der i samme blad senere fremkommet en kommentar hertil fra professorerne Fredens Ole Nielsen.

Som medlem af den økonomiske faggruppeved Universitet må jeg beklage,at mange værdifulde ting, der (såvidt jeg kan bedømme) findes i Kim Andersens afhandling, ikke er blevet fremlagt på en måde, som var lettere tilgængelig for en større læserkreds. Jeg har forsøgt at tale lige ud af posen i min anmeldelse, forsåvidt angår min vurdering af den faglige kvalitet af arbejdet, og det vil jeg også gerne gøre, forsåvidt angår et andet stridsspørgsmål, nemlig: er dette en økonomisk disputats? Lad mig svare ved at sige, at jeg ikke er i tvivl om, at f. eks. en undersøgelse af multiple lineære modeller ved numerisk simulation ville kunne godkendes som en økonometrisk disputats. Kø- og lagermodeller er endnu tydeligere relevante som operationsanalytiske(og driftsøkonomiske)

Side 467

undersøgelsesobjekter. En afvisning af afhandlingensom økonomisk relevant finder jeg derfor ikke motiveret, hvorimod man nok i bagklogskab kunne ønske, at udvalget havde lagt større pres på forfatterenfor få ham til at gøre sine intentionerhelt og sætte dem i tydeligere relation til tidligere arbejder inden for området.

Statistisk Institut, Aarhus Universitet