Nationaløkonomisk Tidsskrift, Bind 91 (1953)

W. Edwards Deming: Some Theory of Sampling. Wiley & Sons, New York 1950. 602 sider. Pris: $9.

A. Hald.

Side 76

Grundlaget for den repræsentative undersøgelsesmetodehar genstand for megen diskussion i det sidste halve rhundrede.Det statistiske institut vedtog i 1903 en resolution, hvori metoden anbefaledes, og besluttede at nedsætte en kommission til nærmere udredningaf Kommissionen, hvoraf Arthur Bowley og Adolph Jensen var medlemmer, blev dog først nedsat i 1924 og afgav i 1925 en betænkning, hvori såvelteoretiske praktiske problemer behandledes udførligt af ovennævnte to medlemmer. I betænkningen sondredes mellem to metoder: den tilfældige og den bevidste udvælgelsesmetode. Medens den første åbenbart hvilede på den klassiske sandsynlighedsregning, savnedes der i betænkningenen redegørelse for den bevidste udvælgelsesmetodes sandsynlighedsteoretiskegrundlag. i 1934 afklaredes problemstillingen gennem J. Neyman's afhandling i Journal Roy. Stat. Soc, idet Neyman fremhævede, at tilfældigudvælgelse nødvendig for at sikre en objektiv og målelig repræsentativitet

Side 77

med hensyn til den übekendte størrelse, medens bevidst udvælgelse kun kan sikre, at prøven er repræsentativ m. h. t. kontrolkendetegnene,derimod m. h. t. den übekendte. Heri ligger ikke, at bevidstudvælgelse fører til et dårligere resultat end tilfældig udvælgelse, men kun at resultatets nøjagtighed ikke kan bestemmes ud fra selve stikprøven.

Den bevidste udvælgelse har utvivlsomt forekommet de fleste statistikere umiddelbart fordi den udnytter det forhåndenværende til populationen ved hjælp af kontrolkendetegnene. Udviklingen den tilfældige udvælgelsesmetode er derfor efter 1934 naturligt nok gået i retning af at kombinere den tilfældige udvælgelse en bevidst inddeling af populationen grundlag af »kontrolkendetegn«, har ført til de forskellige former for tilfældig udvælgelse af stikprøven, går under navnene: stratified sampling, multistage sampling, clustersampliug, area sampling, etc.

I løbet af de sidste 15 år er en så omfangsrig om sampling vokset frem i de statistiske tidsskrifter, at kun specialister kan følge med. Demings bog giver en systematisk fremstilling af resultaterne udviklingen indtil 1943 og betyder således en meget væsentlig hjælp ved studiet af disse metoder, som Deming selv i så høj grad har været med til at udvikle og anvende gennem sit arbejde i Bureau of the Census og Bureau of the Budget i Washington samt som medlem af U.N. Sub-Commission on Statistical Sampling 1947.

I de første to kapitler fremstilles de generelle principper for planlægningen af en statistisk undersøgelse, og de forskellige diskuteres. Bogen indeholder gennemgang af 19 fejlkilder, hvoraf de 17 er fælles for totalundersøgelser og stikprøveundersøgelser, medens kun to, random sampling errors og sampling biases, angår stikprøveundersøgelser. Om disse fejlkilder bemærker Deming: »At present, sampling errors are the only errors are in satisfactory condition so far as theoretical and experimental knowledge concerned«, og han tilføjer: »The next step in the direction of greater reliability surveys must lie along the line of further research in other types of errors«.

De følgende to kapitler indeholder en fremstilling med beviser af de fra den klassiske sandsynlighedsregning kendte sætninger om binomialfordelingen og den hypergeometriske fordeling samt middeltallets Endvidere vises, hvorledes sætninger kan anvendes ved planlægningen af en stikprøves omfang.

Kapitlerne 5 og 6, der er bogens vigtigste med hensyn til planlægningen stikprøveundersøgelser, behandler udtagning af stikprøven i flere trin, valg af sampling-enhed, inddeling af helheden i ensartede dele, strata, hvorfra den tilfældige sker, samt udnyttelse af hjælpevariable, hvis størrelse kendes både for stikprøven og for helheden.

Ved en befolkningsundersøgelse kan f. eks. kommuner benyttes som samplingenheder første orden og husstande som enheder af anden orden. Ensartede kommuner i grupper og den tilfældige udvælgelse finder sted indenfor disse grupper. Indenfor de udvalgte kommuner udvælges husstandene tilfældigt. På denne måde opnås, at de udvalgte husstande ikke spredes tilfældigt over hele landet, hvilket naturligvis som regel forøger resultatets usikkerhed, men formindsker omkostningerne.

Både resultatets usikkerhed (middelfejlen) undersøgelsens omkostninger afhænger stikprøvens opbygning og omfang. ledende princip for planlægning af stikprøveundersøgelser består derfor i minimalisering af middelfejlen for givne omkostninger eller omvendt minimalisering omkostningerne for given størrelse af middelfejlen. For hver af de ovenfor nævnte udvælgelsesmetoder udleder Deming og opstiller omkostningsfunktioner, den optimale og sammensætning af stik- Dreven bestemmes.

Beviserne bygger alle på udledelsen af

Side 78

forventningen af lineære funktioner eller kvadrater på lineære funktioner af iagttagelserneog således ikke kendskab til højere matematik.

I kapitlerne 9 og 10 vises, hvorledes resultatets kan udledes af iagttagelsernes og betydningen af en analyse af såvel spredninger som omkostninger med henblik på planlægningen af fremtidige undersøgelser.

Endelig indeholder kapitlerne 11 og 12 en detailleret gennemgang af to eksempler større stikprøveundersøgelser. I kapitel gennemgås en amerikansk undersøgelse bestemmelse af antal bildæk på lager iios detailhandlere i marts 1945 (i forbindelse med administrationen af rationeringen bildæk), og i kapitel 12 refereres stikprøveundersøgelse af befolkningen Grækenland i 1946 med det formål at bestemme folketallet og befolkningens fordeling køn, alder, etc., specielt med henblik på kontrollen med antallet af stemmeberettigede ved det første valg efter krigen.

Foruden ovennævnte ti kapitler indeholder yderligere syv kapitler med videregående statistisk teori, hovedsagelig en gennemgang af binomialfordelingen, den hypergeometriske fordeling og den normale fordeling med de dertil knyttede tests for signifikans.

IV valgte metoder og eksempler er som helhed præget af de betingelser, hvorunder Bureau of the Census må gennemføre sine undersøgelser, d. v. s. med benyttelse af spørgere og uden folkeregister. De amerikanske kan således ikke uden videre overføres på danske forhold. Det må endvidere fremhæves, at problemstillingen den simplest mulige: at finde skøn over eet middeltal eller totalantal. De i praksis forekommende opgaver er som regel mere omfattende.

Bogen indeholder et stort antal værdifulde og »remarks«. Forfatterens lidet ortodokse skrivemåde og hans evne til at formulere rammende ordsprogsagtige sætninger gør det til en fornøjelse at læse mange af de ikke-matematiske afsnit i bogen.