Ledelse og Erhvervsøkonomi/Handelsvidenskabeligt Tidsskrift/Erhvervsøkonomisk Tidsskrift, Bind 22 (1958)

Markovkæder og samfundsforskning

Ernst Lykke Jensen 1)

Inden for sandsynlighedsregningen har en væsentlig del af bestræbelserne været rettet mod udforskningen af egenskaberne ved hændelsesforløb, i hvilke hændelserne er indbyrdes uafhængige. Som et simpelt eksempel kan man tænke sig et forsøg, der kun kan give to udfald, Ai og A2, der gensidigt udelukker hinanden, f. eks. krone og plat ved kast med en mønt. Ved n gentagelser af forsøget realiseres et eller andet hændelsesforløb, f. eks. følgende for n=-5


DIVL5111

(1)

Sandsynligheden S(H) for netop dette haendelsesforleb er


DIVL5117

2)

hvor Si (Ai) er sandsynligheden for hændelsen Ai i første forsøg, og hvor f. eks. S3(A2AiA2) er sandsynligheden for forekomst i tredie forsøg af hændelsen A2 betinget af, at At forekom i første og A2 i andet forsøg. Opstiller man nu den

Forudsastning 1, at udfaldet af et vilkarligt forsog er uafhaengig af
udfaldene i de foregaende forsog,

forenkles formel (2) til


DIVL5127

(3)

Forudsætningen indebærer nemlig, at f. eks. A2 i tredie forsøg forekommerlige
hyppigt, hvadenten A2 efterfølger AIAI, AIA2, A2AI eller A2A2,
således at de betingede sandsynligheder S3(A2|AiAi), S3(A2|AiA2),



1) cand. polit., Københavns Universitets Statistiske Institut.

Side 268

S3(A2IA2Ai) og S3(A2|A2Aa) er lige store og altså netop lig med sandsynlighedenS3(A2)
for, at A2 indtræffer i tredie forsøg.

I formel (3) har man ikke udelukket den mulighed, at sandsynligheden
for Ai henholdsvis A2 kan variere fra forsøg til forsøg. Gør man imidlertid

Forudsaetning 2, at sandsynligheden for et bestemt udfald af forsoget
er konstant,

forenkles formel (3) til følgende udtryk


DIVL5139

(4)

Idet udfaldene Ai = krone og A2=plat ved montkast antages at tilfredsstille
de opstillede forudsaetninger, er S(H)=— sandsynligheden for
32
raekkefolgen krone, plat, plat, krone, plat ved fern kast med en „aegte"
tnont, d.v.s. en mont for hvilken S(Ai) = S(A2)=— .

De foranstående bemærkninger tjener til at vise vej mod en generalisation af den model, der hviler på forudsætningerne 1 og 2. Det er nærliggende som et første skridt på vejen at lade udfaldet af et bestemt forsøg afhænge af udfaldet i det umiddelbart foregående forsøg, men derimod ikke af det tidligere hændelsesforløb. Dermed erstattes forudsætning 1 af

Forudsaetning I'. Udfaldet af et vilkarligt forseg er afhaengig af, og kun
af, udfaldet i det naermest foregaende forsog.

Hændelsesforløbet H i (1) har da, jfr. (2), sandsynligheden


DIVL5151

(5)

Om de i (5) indgående betingede sandsynligheder gør vi nu

Foriidscetning 2'. Sandsynligheden for et bestemt udfald i et forseg betinget
af et bestemt udfald i det foregaende forsog er
konstant.

Dette betyder, at S2(A2 Ai) og SS(A2JAi) er lige store, og vi kan derfor
skrive (5) på formen


DIVL5161

(6)

En følge af forsøg, for hvilke sandsynligheden for ethvert endeligt
hændelsesforløb af typen (1) kan beregnes på den i (5) angivne måde,

Side 269

kaldes en Markovkæde 2). Er forudsætning 2' opfyldt, gælder (6), og Markovkædensiges
at have konstante overgangssandsynligheder.

Som sagt, de betingede sandsynligheder, der indgår i (6), kaldes overgangssandsynligheder; f. eks. er S(Ag|Ai), som herefter betegnes pig, sandsynligheden for overgang fra udfaldet Ai i et vilkårligt forsøg til udfaldet A2 i det efterfølgende forsøg. Da vi betragter et forsøg med to udfald, må der specificeres fire overgangssandsynligheder pn, pi2, P2l, P22, som det viser sig at være bekvemt at ordne i rækker og søjler i følgende kvadratformede, såkaldt stokastiske, matrix:


DIVL5169

(7)

Det er klart, at rækkesummerne i P er lig med 1; f. eks. er pn-f pi2=l,
fordi det er sikkert, at Ai i et forsøg enten efterfølges af Ai eller A2 i det
næste forsøg.

Af hensyn til anvendelserne indføres nu en anden terminologi. I stedet for at sige, at et givet forsøg resulterede i udfaldet A2, vil vi tale om, at systemet på det pågældende tidspunkt befinder sig i tilstanden A2. Vi vil endvidere nummerere tidspunkterne fra 0 og opefter, således at hændelsesforløbet (1) angiver, at systemet er i tilstanden Ai på tidspunktet t = 0, i tilstanden A2 på tidspunkt t — 1 o.s.v. Den i (1) angivne udvikling af systemet fra t = 0 til t = 4 kan da tilknyttes sandsynligheden


DIVL5177

(8)

hvor ui er sandsynligheden for, at systemet til tiden t = 0 befinder sig i tilstanden Ai. Da vi betragter et system med kun to tilstande, angiver talparret (ui, U2) systemets sandsynlighedsfordeling på udgangstidspunktet, d.v.s. ui + U2=l. Den kaldes for udgangs- eller initialfordelingen.

Det står nu klart, at med en given udgangsfordeling og en given stokastisk matrix P kan systemets sandsynlighedsfordeling beregnes for alle værdier af t. Med andre ord, systemets fremtidige udvikling kan forudsiges i sandsynlighedsmæssig forstand. Speciel interesse knytter der sig til fordelingens opførsel for store værdier af t.; grænsefordelingen, d.v.s. fordelingen for t-> 00, kaldes stationær, hvis dens udsende ikke beror på t.

Det siger sig selv, at modellen uden videre generaliseres til et vilkårligtendelig



2) Efter den russiske sandsynlighedsteoretiker A. A. Markov (1856-1922). En indgående behandling af teorien findes i W. Feller: An Introduction to Probability Theory and its Applications, Vol. I, Second Edition. Wiley, New York, 1957. Kapitlerne 15 og 16.

Side 270

ligtendeligt3) antal tilstande Ai, A2, •••, Ak. Med konstante overgangssandsynlighederkan
systemets fremtidige udvikling forudsiges ved hjælp
af udgangsfordelingen

(9)


DIVL5189

og den stokastiske matrix


DIVL5193

(10)

i hvilken diagonalelementet pjj angiver sandsynligheden for, at systemet forbliver i tilstanden Aj fra et tidspunkt til det næste, medens pij er sandsynligheden for overgang fra tilstanden Ai til tilstanden Aj. Som tidligere nævnt er rækkesummerne i P lig med 1, d.v.s.


DIVL5199

Lad os på dette sted standse et øjeblik og se på de eventuelle anvendelsesmuligheder for den betragtede model. Det bedste udgangspunkt for en sådan drøftelse får man, når man erkender modellens fundamentale kendetegn: Systemets fremtidige udvikling er betinget udelukkende af dets nutidige tilstand, hvorimod den historiske udvikling, der har realiseret denne tilstand, er uden betydning. Dette forhold er naturligvis i flere lorbindelser en svær hindring for anvendelse af Markov-modellen inden i'or økonomisk og social forskning. På den anden side er den dynamiske betragtningsmåde modellens fornemste kendemærke, og dermed er der i hvert fald knyttet et stærkt bånd mellem adskillig samfundsforskning på den ene side og sandsynlighedsregning på den anden side. Modellen er med sit dynamiske oplæg et skridt i en rigtig retning. På de områder, hvor modellen er åbenbart urimelig, har man i det generelle oplæg i indledningen, jfr. (2), i princippet mulighed for at ændre den på en sådan måde, at den bliver mere virkelighedsbetonet. Noget andet er så, om modellen i matematisk henseende bliver håndterlig. Hvad angår den beregningstekniske side af sagen kommer man vel ikke i nød i elektronregnemaskinens

På denne baggrund skal der i det følgende nævnes en række områder
for mulig anvendelse af det fremførte begrebsapparat; den faktiske anvendelseaf



3) Teorien for uendelige Markovkæder skal ikke her gøres til genstand for omtale.

Side 271

vendelseafdet forbliver i hvert enkelt tilfelde, i storre eller mindre
grad, et „quaestio facti".

1. Ved opinionsundersogelser 4) er det af interesse at kende ikke alene
befolkningens indstilling pa. et besternt tidspunkt, men ogsa. at kunne
foretage ekstrapolationer vedrorende udviklingen i denne indstilling.
Deter naturligvis en mulighed at foretage en undersogelse pa to eller
flere hinanden efterfalgende tidspunkter, hvorefter man pa grundlag
af de indsamlede oplysninger skonsnicessigt vurderer den fremtidige
udvikling. Markov-modellen har imidlertid den fordel, at den objektivt
giver anvisning pa, hvorledes ekstrapolationen skal udferes.
Det kan f. eks. dreje sig om en valgforudsigelse, saledes at systemets
tilstande er de partier, der kan stemmes pa; elementet pu i den stokastiske
matrix er sandsynligheden for, at et individ pa. et tidspunkt
vil afgive sin stemme pa partiet Aj, nar det pa det umiddelbart foregaende
tidspunkt havde til hensigt at stemme pa. Ai. Deter klart, at
man ved analysen nodsages til at tage hensyn til en r^ekke forhold;
der rejser sig saledes sporgsmalet om inddeling af vaelgerne efter
ken, alder, erhverv 0.5.v., ligesom der ma tages hensyn til, at vEelgerskaren
bestar af en hard kerne og en mere eller mindre flydende
vaelgermasse.

2. Som et andet muligt anvendelsesområde kan man nævne de såkaldte konjunkturtest 5), hvor man klassificerer de adspurgte virksomheder efter forskellige kendetegn, f. eks. lagerstørrelse, i f. eks. tre grupper (tilstande): fremgang, stilstand og tilbagegang.

3. I hvert fald som et udgangspunkt kunne man forsøge at angribe problemet om arbejdskraftens bevægelser 6) sandsynlighedsteoretisk efter de her beskrevne retningslinier. Drejer det sig f. eks. om den faglige bevægelighed, repræsenterer fag eller industrigrupper de forskellige tilstande i modellen. Også her vil man naturligvis stå overfor vanskelige spørgsmål af samme karakter som nævnt foran i forbindelse med opinionsundersøgelserne, hvortil kommer, at mobiliteten er afhængig af situationen på boligmarkedet, sæsonvariationer i beskæftigelsen, det økonomiske udviklingstrin og tempo i forskellige egne



4) Se eksempel 2, p. 275.

5) Helge Munksgaard: Konjunkturtesten. - Et moderne bidrag til bedømmelse af afsætningssituationen. Nationaløkonomisk Tidsskrift, 1958, 96. bind, 1.-2. hefte.

6) F. Blumen, M. Kogan, P. J. McCarthy: The Industrial Mobility of Labor as a Probability Process. Cornell Studies in Industrial and Labor Relations, Vol. 6, 1955.

Side 272

af landet og konjunktursituationen i det hele taget; også hele spørgsmålet
om uddannelsen kommer ind i billedet som en vigtig faktor.

1. En markedsundersøgelse har f. eks. til formål at belyse en virksomheds markedsandel for en vare. Ved hjælp af en repræsentativ undersøgelse kan markedsandelen fastslås på undersøgelsestidspunktet 7); det kan imidlertid også have interesse at forudsige udviklingen i markedsandelen; en Markovkæde med to tilstande kan eventuelt benyttes hertil. En husstand er i tilstanden At, hvis den forbruger pågældende varemærke, ellers i A2, og markedsandelen er antallet af husstande, der forbruger varemærket i procent af antal husstande, der forbruger varearten.

5. Hidtil har vi karakteriseret de forskellige tilstande kvalitativt. Man kan imidlertid knytte en talværdi, Xi, til hver tilstand, Ai.Derved fremkommer den særlige type af stokastiske processer, som kaldes Markovprocesser. Herved forstås altså en følge af stokastiske variable Xo, Xi, X 2, • • •, Xt, • • •, hvor den variable til tiden t, Xt, kan antage de mulige værdier xi, X2, • • •, Xk, med den egenskab, at f. eks.


DIVL5217

jfr. (6). Den variabel, hvis tidslige udvikling betragtes, kan f. eks. være prisen på en vare, virksomhedernes lagerhold o.s.v. Det vil ses, at denne betragtning åbner mulighed for anvendelse af teorien for Markovprocesser inden for dele af økonomisk teori, f. eks. konjunkturforskningens periodeanalyse og pristeorien 8).

Efter denne omtale af nogle mulige anvendelser af Markovmodellen vil vi forsøge på simpel måde at redegøre for den teknik, der muliggør beregning af systemets sandsynlighedsfordeling på et vilkårligt fremtidigt tidspunkt på grundlag af udgangsfordelingen (9) og den stokastiske matrix (10). Af hensyn til overskueligheden indskrænker vi os til at betragte en Markovkæde med tre tilstande. Idet altså fordelingen på tidspunkt t = 0 er

(12)


DIVL5225


7) Finn Madsen: Nye metoder i markeds analysen. Nordisk Tidsskrift for industriel Statistik, Bind 3, Hæfte 2, 1958.

8) F. Zeuthen: Economic Theory and Method, 1955. Kapitel 35 og 36.

Side 273

hvor ui + U2 +U3 = 1, og de konstante overgangssandsynligheder er givet
ved den stokastiske matrix


DIVL5229

(13)

ønsker vi at beregne systemets sandsynlighedsfordeling for t = 1, 2, 3, ••• . Betragt f. eks. tilfældet t=2. Lad det være givet, at systemet på tidspunktet t = 0 befinder sig i tilstanden A3; under denne forudsætning er sandsynligheden for, at det på tidspunktet t = 2 befinder sig i tilstanden A2, lig med


DIVL5235

(14)

idet f. eks. P13P12 er sandsynligheden for, at systemet fra t = 0 til t = 1 bevæger sig fra tilstanden A3 til tilstanden Ai og dernæst fra t = 1 til t = 2 overgår fra Ai til A2. Det bemærkes, at p^ er lig med produktsummen af elementerne i tredie række og anden søjle i den stokastiske matrix (13). Beregnes på samme måde som angivet ved (14) de øvrige sandsynligheder, kan disse opstilles i følgende matrix


DIVL5241

(15)

Ved række-søjle multiplikation af (13) med (15) fås dernæst


DIVL5247

(16)

hvor f. eks.


DIVL5253

(17)

er sandsynligheden for, at systemet til tidspunkt t = 3 befinder sig i tilstanden
Ai, når det til tidspunkt t = 0 befandt, sig i tilstanden A2. Man
kan nu fortsætte på den angivne måde og har generelt


DIVL5259

(18)

Side 274

Vi emu ved hjaelp af (12) og (18) i stand til at finde de segte sandsynligheder
u^, u^ og u^ for, at systemet befinder sig i de tre tilstande pa et
vilkarligt tidspunkt t:


DIVL5265

(19)

Sandsynligheden fremkommer altså ved multiplikation af udgangssandsynlighederne (12) med søjleelementerne i (18). (Læsere, der er bekendt med matrixregning, vil kunne udtrykke det foregående mere kortfattet og elegant ved indførelse af matrixnotation og anvendelse af reglerne for regning med matricer).

Hvis p1 for voksende t konvergerer mod en matrix med ens rækker,
d.v.s.


DIVL5273

(20)

ses det af (19), da ui -f U2 -f U3 = 1, at systemets sandsynlighedsfordeling
konvergerer mod en stationær fordeling:


DIVL5279

(21)

Graensefordelingen er altsa uafhasngig af udgangsfordelingen 9).

Vi vil herefter gennemga et par eksempler, der kan tjene til at belyse
teorien.

Eksempel 1.

81. a. på baggrund af hvad der er omtalt under punkt 4 p. 16 vedrørende
markedsundersøgelser, har det en vis interesse at betragte en Mar -
kovkæde med to tilstande med følgende overgangssandsynligheder


DIVL5291


9) Se herom Feller, op. cit. p. 356 ff. eller B. W. Gnedenko: Lehrbuch der Wahi scheinlichkeitsrechnung. Akademie-Verlag, Berlin, 1957, p. 10.5.

Side 275

Man kan tænke sig, at man på ethvert tidspunkt inddeler husstandene i to grupper: husstande i gruppe 1, der er forbrugere af varemærket, og husstande i gruppe 2, der ikke er forbrugere af varemærket, a er da den brøkdel af husstandene i gruppe 2, som fra et tidspunkt til det næste flytter over i gruppe 1. Tilsvarende er fi sandsynligheden for, at en husstand, der på et tidspunkt er forbruger af varemærket, på det nærmest efterfølgende tidspunkt ikke er forbruger af varemærket.

Det kan vises 10), at


DIVL5297

DIVL5299

DIVL5301

DIVL5303

Da der kun knytter sig interesse til tilfældene o<a<l og o</Kl,
ses det, at (l-a-Py går mod nul for voksende t. Fordelingen på de to tilstande
er altså for store værdier af t stationær med


DIVL5307

Eksempel 2.

Talmaterialet til dette eksempel stammer fra T. W. Anderson: „Probability Models for Analyzing Time Changes in Attitudes" i P. F. Lazarsfeld (red.): „Mathematical Thinking in the Social Sciences". The Free Press, Glencoe, Illinois. Second Edition, 1955.

En gruppe på 600 personer i Erie County, Ohio, blev i forbindelse med en undersøgelse, foretaget af „Bureau of Applied Social Research", interviewet i hver af månederne maj-oktober 1940. Et af spørgsmålene angik hvilken kandidat den adspurgte havde til hensigt at stemme på ved valget i november. Svarene blev grupperet i tre grupper: Republikaner (R), Demokrat (D) og ved ikke (O); den sidste gruppe omfatter også svarnægtere og svaret „Andre kandidater". Der var 445 personer, som besvarede alle seks interviews.



10) Feller, op. cit. p. 384, se også S. Goldberg: Introduction to Difference Equations. Wiley, New York, 1958, p.p. 217-33.

Side 276

1 nedenstaende fern tabeller er de 445 personer grupperet efter deres
liensigt med hensyn til sternmeafgivning i to pa hinanden felgende maaeder.


DIVL5377

DIVL5379

DIVL5381

DIVL5383

DIVL5385

Ved raekkevis at dividere ind i en tabel med tallene i tabellens hejre
margin fas skon over overgangssandsynlighederne; resultatet af beregningerne
frerngar af nedenstaende tabeller.


DIVL5387

DIVL5389

DIVL5391

DIVL5393

DIVL5395

Lad os et øjeblik antage, at der er tale om en markovkæde med konstanteovergangssandsynligheder,

Side 277

stanteovergangssandsynligheder,d.v.s. at de fem stokastiske matrixer
kun afviger tilfældigt fra hinanden. Efter juni-interviewet opstilles majjuni-matricen;dernæst
beregnes P5, jfr. (18), hvorefter de beregninger,
der er vist i (19), udføres; u'erne repræsenterer fordelingen af de 445
personer på de tre grupper i juni, d.v.s. ui = 143, U2 = 129 og m — 173.
Dermed har man en forudsigelse for november måned af, hvorledes de
445 personer vil fordele sig på grupperne R, D og O. Efter juli-interviewetforetages
en sammenfatning af maj-juni og juni-juli matricerne;
7 -i- f\
hyppigheden, der f. eks. skal stå på pladsen (DR), bliver -■
128 -\-129
Denne matrix multipliceres med sig selv 4 gange, og man har så ved
hjælp af julifordelingen en forudsigelse for november måned. Tallene
i tabellerne viser imidlertid klart, at der ikke kan være tale om en for
hele perioden fælles matrix af overgangssandsynligheder. Det oplyses
i den citerede afhandling, at det republikanske konvent afholdtes mellem
juni og juli-interviewet, medens det demokratiske afholdtes mellem juli
og august interviewene; og „it may be expected that the probabilities of
one changing his mind are different before the conventions and after the
conventions. This is observed casualy in the tables above. We see that
before the conventions the probability is about "85 of retaining one's
opinion for a month. However, after the conventions the probability is
about '95 of retaining vote intention for one of the major parties"
(op.cit.p.49). Ved hjælp af et statistisk test påvises det, at der ikke er
noget til hinder for at antage, at de to første matricer kun afviger tilfældigtfra
hinanden, og det samme gælder for de to sidste matricer: „The
results of this analysis is that the changes in the first two periods are
explained by one model, and the chainges in the third period are explained
by a second model, and the changes in the fourth and fifth periods are
explained by a third model" (op.cit.p.49-50). Selv om konklusionen lyder
besnærende, kan man måske være lidt skeptisk overfor, om observationernevirkelig
støtter den. Betragter man grupperne R og D, vil man se,
at diagonalelementerne gennem hele perioden systematisk forøges, medenselementerne
uden for diagonalen systematisk aftager. Det er derfor
måske mere rimeligt at betragte perioden under et og anlægge det synspunkt,at
hele perioden kan beskrives ved een model; der bliver i så fald
tale om en model, hvor overgangssandsynlighederne ændrer sig efter et
eller andet bestemt mønster, jfr. (5).

Akcepterer man, at perioden for valgkampagnen med hensyn til vælgernesstemmehensigter
kan opdeles i tre faser, kan de to sidste matricer

Side 278

på den tidligere angivne måde sammenfattes til følgende matrix med
gyldighed for valgkampens slutfase


DIVL5323

Vi kan på grundlag af P forudsige valget i november. I tabellen neden
for er forudsigelsen sammenlignet med oktoberhensigterne og den faktiske
stemmeafgivning.


DIVL5397

A
Tallene, der angiver forudsigelsen ved P, fremkommer ved at beregne
A
produktsummerne af sejleelementerne i P med tallene, der angiver fordelingen
i oktober, se september-oktober matricen. F. eks. er


DIVL5329

Der er forskelle mellem forudsigelsen og den faktiske stemmeafgivning. „The most reasonable explanation of this discrepancy is the difference between verbalizing a vote intention and action. It is well known that in general not everyone who intends to vote actually does so. Furthermore, other studies show that Democrats are more vote-delinquent. Our analysis bears this out" (op.cit.p.s2). -

Vi har i det foregående kun betragtet Markovkæder med konstante overgangssandsynligheder. Man kan i dette tilfælde beregne sandsynligheden for systemets overgang fra én tilstand til en anden tilstand t perioder senere ved at multiplicere overigangsmatricen P med sig selv t gange, jfr. (18). Disse sandsynligheder er de samme, uanset hvor tidsintervallet af længden t placeres. Betegner man med pij(m,n) sandsynligheden for systemets overgang fra tilstand i på tidspunkt m til tilstand j på tidspunkt n, gælder det altså, at


DIVL5335

(22)

d.v.s., at overgangssandsynligheden er uafhængig af udgangstidspunktet
m og sluttidspunktet n; den afhænger kun af tidsafstanden n-m. Det

Side 279

fremgår endvidere af det foregående, at overgangssandsynlighederne er
knyttet sammen ved relationen


DIVL5341

(23)

Når overgangsmatricen ændrer sig med tiden, sådan som det f. eks. var tilfældet i eksempel 2, har vi at gøre med en Markovkæde med variable overgangssandsynligheder, og teorien må baseres på udtrykket (5) i stedet for udtrykket (6). I så fald gælder relationen (22) ikke længere idet overgangssandsynligheden pij(m,n) afhænger af såvel begyndelsestidspunktet m som sluttidspunktet n, og relationen (23) må erstattes af den mere generelle relation mellem overgangssandsynlighederne


DIVL5347

(24)

der kaldes Chapman-Kolmogorovs ligning. Det bemærkes, at r er et
mellem ti og t2 vilkårligt indskudt tidspunkt.

Det vil ses, at de to modeller, Markovkæder med konstante og variable overgangssandsynligheder, i matematisk og beregningsmæssig henseende blot adskiller sig ved, at sidstnævnte model er lidt vanskeligere at håndtere end den førstnævnte. I stedet for at operere med een matrix P af overgangssandsynligheder nødsages man til at arbejde med flere overgangsmatricer Pi, P2, P3, • • • svarende til forskellige tidspunkter. Medens sandsynligheden for overgang fra én tilstand til en anden i løbet af f. eks. tre perioder fås ved beregning af P3P3 i den første model, fås den i den anden model ved beregning af P4 • P5 • Po, hvis begyndelsestidspunktet er t=4, men af Ps-Pg-Pt, hvis begyndelsestidspunktet er t—s.

Der er i den her givne fremstilling lagt afgørende vægt på at fremhæve modellens muligheder i prognostisk henseende. Inden man kommer så langt, må der naturligvis udføres et stort statistisk og faglig-teoretisk arbejde med henblik på en simpel beskrivelse af det pågældende procesforløb. I denne forbindelse er det vigtigt, at det foreliggende statistiske materiale inddeles i homogene undergrupper, f. eks. efter kriterier som alder, køn, geografisk beliggenhed o.s.v. Det drejer sig da om for hver undergruppe at finde frem til karakteristiske egenskaber ved overgangsmatricen og de forhold af f. eks. sæsonmæssig karakter, der betinger et bestemt mønster for udviklingen i overgangssandsynlighederne. Det næste skridt består i en sammenligning af de forskellige undergrupper for derved at finde frem til kriterier, der bringer de forskellige delområder ind under en fælles synsvinkel. Ved en sådan analyse rejser der sig en række statistiske problemer vedrørende estimation og hypoteseprøvning, som falder udenfor rammerne af nærværende artikel.