Ledelse og Erhvervsøkonomi/Handelsvidenskabeligt Tidsskrift/Erhvervsøkonomisk Tidsskrift, Bind 22 (1958)Markovkæder og samfundsforskningErnst Lykke Jensen 1) Inden for sandsynlighedsregningen har en væsentlig del af bestræbelserne været rettet mod udforskningen af egenskaberne ved hændelsesforløb, i hvilke hændelserne er indbyrdes uafhængige. Som et simpelt eksempel kan man tænke sig et forsøg, der kun kan give to udfald, Ai og A2, der gensidigt udelukker hinanden, f. eks. krone og plat ved kast med en mønt. Ved n gentagelser af forsøget realiseres et eller andet hændelsesforløb, f. eks. følgende for n=-5 (1) Sandsynligheden
S(H) for netop dette haendelsesforleb er 2) hvor Si (Ai) er sandsynligheden for hændelsen Ai i første forsøg, og hvor f. eks. S3(A2AiA2) er sandsynligheden for forekomst i tredie forsøg af hændelsen A2 betinget af, at At forekom i første og A2 i andet forsøg. Opstiller man nu den Forudsastning 1,
at udfaldet af et vilkarligt forsog er uafhaengig af
forenkles formel
(2) til (3) Forudsætningen
indebærer nemlig, at f. eks. A2 i tredie forsøg
forekommerlige 1) cand. polit., Københavns Universitets Statistiske Institut. Side 268
S3(A2IA2Ai) og
S3(A2|A2Aa) er lige store og altså netop lig med
sandsynlighedenS3(A2) I formel (3) har
man ikke udelukket den mulighed, at sandsynligheden
Forudsaetning 2,
at sandsynligheden for et bestemt udfald af forsoget
forenkles formel
(3) til følgende udtryk (4) Idet udfaldene Ai
= krone og A2=plat ved montkast antages at
tilfredsstille De foranstående bemærkninger tjener til at vise vej mod en generalisation af den model, der hviler på forudsætningerne 1 og 2. Det er nærliggende som et første skridt på vejen at lade udfaldet af et bestemt forsøg afhænge af udfaldet i det umiddelbart foregående forsøg, men derimod ikke af det tidligere hændelsesforløb. Dermed erstattes forudsætning 1 af Forudsaetning I'.
Udfaldet af et vilkarligt forseg er afhaengig af, og kun
Hændelsesforløbet
H i (1) har da, jfr. (2), sandsynligheden (5) Om de i (5)
indgående betingede sandsynligheder gør vi nu Foriidscetning 2'.
Sandsynligheden for et bestemt udfald i et forseg
betinget Dette betyder, at
S2(A2 Ai) og SS(A2JAi) er lige store, og vi kan derfor
(6) En følge af
forsøg, for hvilke sandsynligheden for ethvert endeligt
Side 269
kaldes en
Markovkæde 2). Er forudsætning 2' opfyldt, gælder (6),
og Markovkædensiges Som sagt, de betingede sandsynligheder, der indgår i (6), kaldes overgangssandsynligheder; f. eks. er S(Ag|Ai), som herefter betegnes pig, sandsynligheden for overgang fra udfaldet Ai i et vilkårligt forsøg til udfaldet A2 i det efterfølgende forsøg. Da vi betragter et forsøg med to udfald, må der specificeres fire overgangssandsynligheder pn, pi2, P2l, P22, som det viser sig at være bekvemt at ordne i rækker og søjler i følgende kvadratformede, såkaldt stokastiske, matrix: (7) Det er klart, at
rækkesummerne i P er lig med 1; f. eks. er pn-f pi2=l,
Af hensyn til anvendelserne indføres nu en anden terminologi. I stedet for at sige, at et givet forsøg resulterede i udfaldet A2, vil vi tale om, at systemet på det pågældende tidspunkt befinder sig i tilstanden A2. Vi vil endvidere nummerere tidspunkterne fra 0 og opefter, således at hændelsesforløbet (1) angiver, at systemet er i tilstanden Ai på tidspunktet t = 0, i tilstanden A2 på tidspunkt t — 1 o.s.v. Den i (1) angivne udvikling af systemet fra t = 0 til t = 4 kan da tilknyttes sandsynligheden (8) hvor ui er sandsynligheden for, at systemet til tiden t = 0 befinder sig i tilstanden Ai. Da vi betragter et system med kun to tilstande, angiver talparret (ui, U2) systemets sandsynlighedsfordeling på udgangstidspunktet, d.v.s. ui + U2=l. Den kaldes for udgangs- eller initialfordelingen. Det står nu klart, at med en given udgangsfordeling og en given stokastisk matrix P kan systemets sandsynlighedsfordeling beregnes for alle værdier af t. Med andre ord, systemets fremtidige udvikling kan forudsiges i sandsynlighedsmæssig forstand. Speciel interesse knytter der sig til fordelingens opførsel for store værdier af t.; grænsefordelingen, d.v.s. fordelingen for t-> 00, kaldes stationær, hvis dens udsende ikke beror på t. Det siger sig selv,
at modellen uden videre generaliseres til et
vilkårligtendelig 2) Efter den russiske sandsynlighedsteoretiker A. A. Markov (1856-1922). En indgående behandling af teorien findes i W. Feller: An Introduction to Probability Theory and its Applications, Vol. I, Second Edition. Wiley, New York, 1957. Kapitlerne 15 og 16. Side 270
ligtendeligt3)
antal tilstande Ai, A2, •••, Ak. Med konstante
overgangssandsynlighederkan (9) og den
stokastiske matrix (10) i hvilken diagonalelementet pjj angiver sandsynligheden for, at systemet forbliver i tilstanden Aj fra et tidspunkt til det næste, medens pij er sandsynligheden for overgang fra tilstanden Ai til tilstanden Aj. Som tidligere nævnt er rækkesummerne i P lig med 1, d.v.s. Lad os på dette sted standse et øjeblik og se på de eventuelle anvendelsesmuligheder for den betragtede model. Det bedste udgangspunkt for en sådan drøftelse får man, når man erkender modellens fundamentale kendetegn: Systemets fremtidige udvikling er betinget udelukkende af dets nutidige tilstand, hvorimod den historiske udvikling, der har realiseret denne tilstand, er uden betydning. Dette forhold er naturligvis i flere lorbindelser en svær hindring for anvendelse af Markov-modellen inden i'or økonomisk og social forskning. På den anden side er den dynamiske betragtningsmåde modellens fornemste kendemærke, og dermed er der i hvert fald knyttet et stærkt bånd mellem adskillig samfundsforskning på den ene side og sandsynlighedsregning på den anden side. Modellen er med sit dynamiske oplæg et skridt i en rigtig retning. På de områder, hvor modellen er åbenbart urimelig, har man i det generelle oplæg i indledningen, jfr. (2), i princippet mulighed for at ændre den på en sådan måde, at den bliver mere virkelighedsbetonet. Noget andet er så, om modellen i matematisk henseende bliver håndterlig. Hvad angår den beregningstekniske side af sagen kommer man vel ikke i nød i elektronregnemaskinens På denne
baggrund skal der i det følgende nævnes en række områder
3) Teorien for uendelige Markovkæder skal ikke her gøres til genstand for omtale. Side 271
vendelseafdet
forbliver i hvert enkelt tilfelde, i storre eller mindre
1. Ved
opinionsundersogelser 4) er det af interesse at kende
ikke alene 2. Som et andet muligt anvendelsesområde kan man nævne de såkaldte konjunkturtest 5), hvor man klassificerer de adspurgte virksomheder efter forskellige kendetegn, f. eks. lagerstørrelse, i f. eks. tre grupper (tilstande): fremgang, stilstand og tilbagegang. 3. I hvert fald som et udgangspunkt kunne man forsøge at angribe problemet om arbejdskraftens bevægelser 6) sandsynlighedsteoretisk efter de her beskrevne retningslinier. Drejer det sig f. eks. om den faglige bevægelighed, repræsenterer fag eller industrigrupper de forskellige tilstande i modellen. Også her vil man naturligvis stå overfor vanskelige spørgsmål af samme karakter som nævnt foran i forbindelse med opinionsundersøgelserne, hvortil kommer, at mobiliteten er afhængig af situationen på boligmarkedet, sæsonvariationer i beskæftigelsen, det økonomiske udviklingstrin og tempo i forskellige egne 4) Se eksempel 2, p. 275. 5) Helge Munksgaard: Konjunkturtesten. - Et moderne bidrag til bedømmelse af afsætningssituationen. Nationaløkonomisk Tidsskrift, 1958, 96. bind, 1.-2. hefte. 6) F. Blumen, M. Kogan, P. J. McCarthy: The Industrial Mobility of Labor as a Probability Process. Cornell Studies in Industrial and Labor Relations, Vol. 6, 1955. Side 272
af landet og
konjunktursituationen i det hele taget; også hele
spørgsmålet 1. En markedsundersøgelse har f. eks. til formål at belyse en virksomheds markedsandel for en vare. Ved hjælp af en repræsentativ undersøgelse kan markedsandelen fastslås på undersøgelsestidspunktet 7); det kan imidlertid også have interesse at forudsige udviklingen i markedsandelen; en Markovkæde med to tilstande kan eventuelt benyttes hertil. En husstand er i tilstanden At, hvis den forbruger pågældende varemærke, ellers i A2, og markedsandelen er antallet af husstande, der forbruger varemærket i procent af antal husstande, der forbruger varearten. 5. Hidtil har vi karakteriseret de forskellige tilstande kvalitativt. Man kan imidlertid knytte en talværdi, Xi, til hver tilstand, Ai.Derved fremkommer den særlige type af stokastiske processer, som kaldes Markovprocesser. Herved forstås altså en følge af stokastiske variable Xo, Xi, X 2, • • •, Xt, • • •, hvor den variable til tiden t, Xt, kan antage de mulige værdier xi, X2, • • •, Xk, med den egenskab, at f. eks. jfr. (6). Den variabel, hvis tidslige udvikling betragtes, kan f. eks. være prisen på en vare, virksomhedernes lagerhold o.s.v. Det vil ses, at denne betragtning åbner mulighed for anvendelse af teorien for Markovprocesser inden for dele af økonomisk teori, f. eks. konjunkturforskningens periodeanalyse og pristeorien 8). Efter denne omtale af nogle mulige anvendelser af Markovmodellen vil vi forsøge på simpel måde at redegøre for den teknik, der muliggør beregning af systemets sandsynlighedsfordeling på et vilkårligt fremtidigt tidspunkt på grundlag af udgangsfordelingen (9) og den stokastiske matrix (10). Af hensyn til overskueligheden indskrænker vi os til at betragte en Markovkæde med tre tilstande. Idet altså fordelingen på tidspunkt t = 0 er (12) 7) Finn Madsen: Nye metoder i markeds analysen. Nordisk Tidsskrift for industriel Statistik, Bind 3, Hæfte 2, 1958. 8) F. Zeuthen: Economic Theory and Method, 1955. Kapitel 35 og 36. Side 273
hvor ui + U2 +U3
= 1, og de konstante overgangssandsynligheder er givet
(13) ønsker vi at beregne systemets sandsynlighedsfordeling for t = 1, 2, 3, ••• . Betragt f. eks. tilfældet t=2. Lad det være givet, at systemet på tidspunktet t = 0 befinder sig i tilstanden A3; under denne forudsætning er sandsynligheden for, at det på tidspunktet t = 2 befinder sig i tilstanden A2, lig med (14) idet f. eks. P13P12 er sandsynligheden for, at systemet fra t = 0 til t = 1 bevæger sig fra tilstanden A3 til tilstanden Ai og dernæst fra t = 1 til t = 2 overgår fra Ai til A2. Det bemærkes, at p^ er lig med produktsummen af elementerne i tredie række og anden søjle i den stokastiske matrix (13). Beregnes på samme måde som angivet ved (14) de øvrige sandsynligheder, kan disse opstilles i følgende matrix (15) Ved række-søjle
multiplikation af (13) med (15) fås dernæst (16) hvor f. eks.
(17) er
sandsynligheden for, at systemet til tidspunkt t = 3
befinder sig i tilstanden (18) Side 274
Vi emu ved hjaelp
af (12) og (18) i stand til at finde de segte
sandsynligheder (19) Sandsynligheden fremkommer altså ved multiplikation af udgangssandsynlighederne (12) med søjleelementerne i (18). (Læsere, der er bekendt med matrixregning, vil kunne udtrykke det foregående mere kortfattet og elegant ved indførelse af matrixnotation og anvendelse af reglerne for regning med matricer). Hvis p1 for
voksende t konvergerer mod en matrix med ens rækker,
(20) ses det af (19),
da ui -f U2 -f U3 = 1, at systemets
sandsynlighedsfordeling (21) Graensefordelingen er altsa
uafhasngig af udgangsfordelingen 9). Vi vil herefter
gennemga et par eksempler, der kan tjene til at belyse
Eksempel 1.
81. a. på
baggrund af hvad der er omtalt under punkt 4 p. 16
vedrørende 9) Se herom Feller, op. cit. p. 356 ff. eller B. W. Gnedenko: Lehrbuch der Wahi scheinlichkeitsrechnung. Akademie-Verlag, Berlin, 1957, p. 10.5. Side 275
Man kan tænke sig, at man på ethvert tidspunkt inddeler husstandene i to grupper: husstande i gruppe 1, der er forbrugere af varemærket, og husstande i gruppe 2, der ikke er forbrugere af varemærket, a er da den brøkdel af husstandene i gruppe 2, som fra et tidspunkt til det næste flytter over i gruppe 1. Tilsvarende er fi sandsynligheden for, at en husstand, der på et tidspunkt er forbruger af varemærket, på det nærmest efterfølgende tidspunkt ikke er forbruger af varemærket. Det kan vises
10), at Da der kun
knytter sig interesse til tilfældene o<a<l og
o</Kl, Eksempel 2.
Talmaterialet til dette eksempel stammer fra T. W. Anderson: „Probability Models for Analyzing Time Changes in Attitudes" i P. F. Lazarsfeld (red.): „Mathematical Thinking in the Social Sciences". The Free Press, Glencoe, Illinois. Second Edition, 1955. En gruppe på 600 personer i Erie County, Ohio, blev i forbindelse med en undersøgelse, foretaget af „Bureau of Applied Social Research", interviewet i hver af månederne maj-oktober 1940. Et af spørgsmålene angik hvilken kandidat den adspurgte havde til hensigt at stemme på ved valget i november. Svarene blev grupperet i tre grupper: Republikaner (R), Demokrat (D) og ved ikke (O); den sidste gruppe omfatter også svarnægtere og svaret „Andre kandidater". Der var 445 personer, som besvarede alle seks interviews. 10) Feller, op. cit. p. 384, se også S. Goldberg: Introduction to Difference Equations. Wiley, New York, 1958, p.p. 217-33. Side 276
1 nedenstaende
fern tabeller er de 445 personer grupperet efter deres
Ved raekkevis at
dividere ind i en tabel med tallene i tabellens hejre
Lad os et øjeblik
antage, at der er tale om en markovkæde med
konstanteovergangssandsynligheder, Side 277
stanteovergangssandsynligheder,d.v.s.
at de fem stokastiske matrixer Akcepterer man,
at perioden for valgkampagnen med hensyn til
vælgernesstemmehensigter Side 278
på den
tidligere angivne måde sammenfattes til følgende matrix
med Vi kan på
grundlag af P forudsige valget i november. I tabellen
neden A Der er forskelle mellem forudsigelsen og den faktiske stemmeafgivning. „The most reasonable explanation of this discrepancy is the difference between verbalizing a vote intention and action. It is well known that in general not everyone who intends to vote actually does so. Furthermore, other studies show that Democrats are more vote-delinquent. Our analysis bears this out" (op.cit.p.s2). - Vi har i det foregående kun betragtet Markovkæder med konstante overgangssandsynligheder. Man kan i dette tilfælde beregne sandsynligheden for systemets overgang fra én tilstand til en anden tilstand t perioder senere ved at multiplicere overigangsmatricen P med sig selv t gange, jfr. (18). Disse sandsynligheder er de samme, uanset hvor tidsintervallet af længden t placeres. Betegner man med pij(m,n) sandsynligheden for systemets overgang fra tilstand i på tidspunkt m til tilstand j på tidspunkt n, gælder det altså, at (22) d.v.s., at
overgangssandsynligheden er uafhængig af
udgangstidspunktet Side 279
fremgår
endvidere af det foregående, at
overgangssandsynlighederne er (23) Når overgangsmatricen ændrer sig med tiden, sådan som det f. eks. var tilfældet i eksempel 2, har vi at gøre med en Markovkæde med variable overgangssandsynligheder, og teorien må baseres på udtrykket (5) i stedet for udtrykket (6). I så fald gælder relationen (22) ikke længere idet overgangssandsynligheden pij(m,n) afhænger af såvel begyndelsestidspunktet m som sluttidspunktet n, og relationen (23) må erstattes af den mere generelle relation mellem overgangssandsynlighederne (24) der kaldes
Chapman-Kolmogorovs ligning. Det bemærkes, at r er et
Det vil ses, at de to modeller, Markovkæder med konstante og variable overgangssandsynligheder, i matematisk og beregningsmæssig henseende blot adskiller sig ved, at sidstnævnte model er lidt vanskeligere at håndtere end den førstnævnte. I stedet for at operere med een matrix P af overgangssandsynligheder nødsages man til at arbejde med flere overgangsmatricer Pi, P2, P3, • • • svarende til forskellige tidspunkter. Medens sandsynligheden for overgang fra én tilstand til en anden i løbet af f. eks. tre perioder fås ved beregning af P3P3 i den første model, fås den i den anden model ved beregning af P4 • P5 • Po, hvis begyndelsestidspunktet er t=4, men af Ps-Pg-Pt, hvis begyndelsestidspunktet er t—s. Der er i den her givne fremstilling lagt afgørende vægt på at fremhæve modellens muligheder i prognostisk henseende. Inden man kommer så langt, må der naturligvis udføres et stort statistisk og faglig-teoretisk arbejde med henblik på en simpel beskrivelse af det pågældende procesforløb. I denne forbindelse er det vigtigt, at det foreliggende statistiske materiale inddeles i homogene undergrupper, f. eks. efter kriterier som alder, køn, geografisk beliggenhed o.s.v. Det drejer sig da om for hver undergruppe at finde frem til karakteristiske egenskaber ved overgangsmatricen og de forhold af f. eks. sæsonmæssig karakter, der betinger et bestemt mønster for udviklingen i overgangssandsynlighederne. Det næste skridt består i en sammenligning af de forskellige undergrupper for derved at finde frem til kriterier, der bringer de forskellige delområder ind under en fælles synsvinkel. Ved en sådan analyse rejser der sig en række statistiske problemer vedrørende estimation og hypoteseprøvning, som falder udenfor rammerne af nærværende artikel. |