Ernst Lykke Jensen: Repræsentative undersøgelsers og metode. I. Simpel tilfældig udvælgelse. Universitetets statistiske Institut, København 1957, 273 sider.

Side 239

I de senere år har der været rig grøde i litteraturen om repræsentative undersøgelser, de, der blot følger en lille smule med i moderne teoretisk statistik, vil tydeligt fået fornemmelsen af, hvilken central plads ikke mindst teorien om simpel udvælgelse har fået.

Det foreliggende kompendium, der som første del af et større værk alene omfatter simpel tilfældig udvælgelse, er den første virkelige indsats på området her i landet. Kompendiet er blevet et vægtigt arbejde, som giver en både udtømmende og systematisk særlig af emnets teoretiske Det er forfattet af Lykke Jensen på grundlag af en forelæsningsrække af professor, dr. phil. A. Hald i 1954^—55 for specialstuderende under det statsvidenskabelige og tænkes i fremtiden benyttet som lærebog for de specialstuderende. af bogens aktiver er de mange konkrete eksempler, udarbejdet af sekretær, polit. Erling Jørgensen, som Lykke Jensen siger i forordet: »på dygtig og selvstændig måde.«

Bogen falder i tre hovedafsnit: 1. De praktiske problemer i forbindelse med afgrænsning undersøgelsens formål og genstand. 2. De praktiske problemer i forbindelse eliminering af fejlkilder ved indsamling og bearbejdelse. 3. De mere teoretisk betonede problemer i forbindelse med valg af udvælgelsesmetoder og udledelse skøn over de søgte størrelser under til, at den tilfældige — men uundgåelige —- variation ønskes så lille som muligt.

De to første problemkredse er behandlet i nogle indledende kapitler; men da disse emner vel ikke indeholder så megen »statistikens har Lykke Jensen kun draget hovedsynspunkterne frem og iøvrigt til den eksisterende righoldige litteratur herom.

Selvom bogen behandler simpel tilfældig udvælgelse; har det naturligvis ikke kunnet at der siges et par ord om den bevidste udvælgelses metode. I tidligere tid var denne metode højt estimeret takket være Adolph Jensen og andre og har da også været en del benyttet her i landet.

Mod den bevidste udvælgelse fremhæves det — og med rette — at man kun har garanti at stikprøven er repræsentativ for kontrolkendetegnene, medens man derimod de kendetegn, hvis fordeling er ukendt, og som ønskes belyst, kun kan håbe på repræsentativitet. Yderligere understreges at sandsynlighedsregningen ikke kan bringes i anvendelse til angivelse af usikkerheden på resultatet. Hvad der gælder den bevidste udvælgelse, gælder også, hvad jeg vil kalde en særlig form for bevidst udvælgelse, nemlig kvotametoden. brydes staven dog ikke fuldstændig disse metoder — hvoraf kvotsmetoden har udstrakt anvendelse -_— det siges nemlig på side 17:

»De foregående betragtninger må ikke opfattes således, at de omtalte og andre metoder, f. eks. anvendelse af et bekvemt udvalg, er værdiløse og aldrig har givet nyttige resultater. De indeholder mange af de elementer, som må inddrages i over-

Side 240

vejeiserne ved en fornuftig planlægning af en repræsentativ undersøgelse, f. eks. ekspertens om den pågældende population, stikprøvens størrelse

0.5.v.«

Men med følgende tilføjelse på side 18:

»Men der savnes en grundlæggende teori til at afveje disse faktorers betydning mod hinanden. Og dernæst er det gentagne gange blevet fremhævet, at præcisionen af de fundne resultater ikke kan angives efter en. objektiv målestok. Dette hænger sammen at sandsynligheden for, at en enhed kommer med i stikprøven, er ukendt. Udvalget finder sted efter personlig vurdering skøn«.

len får næsten normale fordelinger for stikprøvegennemsnittene, medens derimod den sidste fordeling endnu ikke for n— 1000 (i stikprøven) har givet normalfordeling, /h.T=0.21 og /3-j.r=3,34. Denne fordeling drejer sig om formueansættelser for købmænd, detailhandlere o. lign. pr. 31. dec. 1950 — og den er ekstremt skæv. Dette ekstreme tilfælde ændrer naturligvis ikke det sædvanlige, at de fleste fordelinger vil være så »skikkelige«, at de repræsentative der foretages af kyndige folk, normalt vil være tilstrækkeligt omfattende at den normale fordeling vil være en særdeles god tilnærmelse til middeltallets

Forudsætningen for mange og gode besvarelser en tælling på basis af en stikprøve men uden spørgere er, at man prøver at gøre en indsats efter de linier, der er omtalt i bogen (skemaet ledsages af en venlig anmodning om besvarelse, anonymitet garanteres, ikke for indviklet skema 0.5.v.). Dette forsøgte Det statistiske Departement ved en i december 1956 afholdt som ved postforsendelse een »rykker« gav en svarprocent 82.

I den egentlige teoretiske del har det navnlig været morsomt at læse forfatterens af tendenser i retning af normal fordeling for gentagne stikprøver udtagne fra forskellige skæve fordelingskurver.

På side 109 er anført en tabel over de normerede momenter af tredie og fjerde orden Øx (x) og /Jo (x) for stikprøvegennemsnit ialt 5 skæve fordelinger. Hvis stikprøverne fordelte sig normalt, skulle man jo vente, at /?i (x) bliver 0 og /?₂ (x) o

Man ser, hvorledes man allerede for n=3o for de to første fordelinger i tabel- Ved kvotientskøn diskuteres forudsætningerne anvendelse af kvotientskøn fremfor det simple middeltalsskøn. Geometrisk kommer Lykke Jensen til det enkle resultat, at kvotientskøn bør foretrækkes for det simple middeltalsskøn, n såfremt /3 > —, hvor /3o er hældningen for den rette linie gennem 0-punktet og systemets tyngdepunkt (d.v.s. kvotienten M) ogÆ = n_—— er regressionskoefficienten i den todimentionale fordeling for henholdsvis og estimationsvariablen (.r og y). Det skal tilføjes, at denne ulighed ikke siger noget om kvotientskønnets i sammenligning et regressionsskøn. Dette vil altid være bedre end kvotientskønnet (bortset fra når de to skøn falder sammen).

Under den teoretiske del gøres også klyngeudvælgelsen til genstand for indgåendebehandling, det er af interesse at få belyst, hvornår klyngeudvælgelse vil være at foretrække for tilfældig udvælgelseaf Det, som må afvejes, er omkostninger contra sikkerlieden.Omkostningerne

Side 241

lieden.Omkostningernevil ofte være mindre ved klyngeudvælgelse, medens til gengæld usikkerheden ved, hvad man kan kalde »naturlige« klynger (kommuner, i mange tilfælde roder o.s.v. — samt husstandejfr. vil være større end ved rent tilfældig udvælgelse af analyseenheden,således en afvejning i hvert enkelt eksempel vil være nødvendig — forudsatat har et valg.

Ved valg eksempelvis mellem husstande og personer vil det dog formentlig ikke være lige så oplagt, at klyngeudvælgelsen er underlegen, jfr. det følgende eksempel. Afgørende for, om klyngeudvælgelsen er personudvælgelsen overlegen, er klyngens karakter. Jo mere heterogen klyngen er (en slags miniaturebefolkning), jo større chance er der for, at klyngeudvælgelsen er personudvælgelsen overlegen.

Som mål for klyngeskønnets efficiens benyttes homogenitetskoefficienten 8, og kun når 8 < 0, kan man være sikker på, at klyngeudvalget er det rent tilfældige udvalg overlegent. Almindeligvis er 8 positiv, de nedsatte omkostninger ved klyngeudvælgelsen da af større usikkerhed.

Der omtales et morsomt eksempel, hvor klyngeudvælgelsen er den rent tilfældige udvælgelse af analyseenheden langt overlegen, ved bestemmelse af »mandsprocenten« + drenge i forhold til hele befolkningen). Man tænker sig, at enhver familie består af fire personer: mand, kone og to børn og har valget mellem benytte »husstanden« som udvalgsenhed det enkelte individ.

At husstanden må være en bedre udvalgsenhed det enkelte individ, skyldes, at i husstanden vælges mand og kone sammen gang, hvilket må give en stærk ophobning omkring mandsprocenten, 50 pct. Korrelationen mellem mandens og konens er jo negativ og -4-1, og dette bidrager til, at homogenitetskofficienten er negativ, -4-1.

Efficiensen bliver 2, hvilket udtrykker,
at variansen med husstanden som udvalgsenhed
enheder det halve af variansen, hvis individet
været anvendt som udvalgsenhed.

I Det statistiske Departement har vi i forhindelse de tidligere arbejdsstyrketællinger grundlag af en stikprøve sammenlignet usikkerheden ved den anvendte med usikkerheden personudvælgelse. Undersøgelsen omfattede 25 forskellige tællingskategorier, og i de fleste tilfælde var usikkerheden for den samme stikprøvestørrelse ved husstandsudvælgelse end ved personudvælgelse; samtlige beskæftigede 50 pct. større, for arbejdere 25 pct. og for funktionærer 12 pct.

Der var dog også tilfælde, hvor usikkerheden mindre. Det gjaldt f. eks. selvstændige landbrugere, hvor usikkerheden 15 pct. mindre ved husstandsudvælgelsen; modsætning hertil var for landbrugets arbejdskraft usikkerheden på husstandsudvælgelsen 50 pct. større.

De to sidste eksempler viser tydeligt det afgørende for klyngeskønnets kvalitet. Når man ser på landbrugets arbejdskraft, er klyngen homogen — og usikkerheden derfor Betragter man derimod den selvstændige vil variansen ved udvælgelse husstande som nævnt være mindre end ved udvælgelse blandt personer, fordi det samme antal selvstændige landbrugere af et væsentligt færre antal ved husstandsudvælgelsen end ved personudvælgelsen.

Det sidste kapitel omhandler systematiske Det fremhæves her, at hvis der ikke findes nogen systematik i populationens elementer, vil en systematisk stikprøve opføre sig på samme måde som enkelt tilfældigt udtaget stikprøve.

Hvis der derimod findes en »trendbevægelse«
populationen, vil den systematiske
udvælgelses teknik give mere pålidelige re-

Side 242

sultater end den helt tilfældige udvælgelse, og det fremhæves, at systematisk udvælgelse meget effektiv, når man ønsker at fjerne virkningerne af en lineær trend.

I hogen findes et gennemgående eksempel fra brugsforeningsstatistikken. Fra et pædagogisk kan det måske være godt at tage det samme eksempel; men det kan let komme til at virke som en slags »formel« med tal i stedet for bogstaver.

Dette danske værk om repræsentative undersøgelser er overlegent og godt skrevet og vi ser hen til en fortsættelse med megen forventning.

1. Kontorchef i Det statistiske Departement. ved Handelshøjskolen i København.

Nationaløkonomisk Tidsskrift, Bind 95 (1957)

Ernst Lykke Jensen: Repræsentative undersøgelsers og metode. I. Simpel tilfældig udvælgelse. Universitetets statistiske Institut, København 1957, 273 sider.