Ledelse og Erhvervsøkonomi/Handelsvidenskabeligt Tidsskrift/Erhvervsøkonomisk Tidsskrift, Bind 41 (1977) 1

Sampling teori og anvendt statistik

Flemming Hansen *)

Side 215

Augustus, der skrev alverden i mandtal, er næppe den første, der har forsøgt sig med befolkningsundersøgelser. Augustus' formål var administrativt, militært og skattemæssigt. Et hjemligt forsøg af samme art er matrikelsystemet, der blev udviklet i 1600-tallet. Også her var formålet administrativt, militært og skattemæssigt.

Først meget senere er man begyndt at bruge udvalgsundersøgelser til at indsamle de oplysninger som Augustus, Ole Romer, m.fl. var interesserede i. Repræsentative befolkningsundersøgelser foretages i Danmark af Social-Forskningsinstituttet, af Danmarks Statistik, og af private analyseinstitutter. Metoderne, der anvendes varierer; de kan dog alle karakteriseres som tillempede forsøg på tilfældige udvalgsundersøgelser. Egentlige kvota-undersøgelser benyttes næsten aldrig i forbindelse med nationale undersøgelser.



*) Professor, ekon.dr., Institut for Afsætningsøkonomi, HHK.

Side 216

De anvendte undersogelsesformer bygger alle pa statisdsk teori, hvis
anvendelse hviler pa nogle fa helt kritiske forudsaetninger. Deter saledes
helt fundamentalt, at

1. Det univers, der skal undersoges skal kunne beskrives.

2. Der skal kunne udtraekkes et udvalg af enheder fra universet, som
der kan inclsamles oplysninger om.

I sin simpleste form listes hele universet, hvorefter der udtrækkes på en sådan måde, at hver enkelt enhed i universet har den samme sandsynlighed for at komme med i udvalget. Når disse forudsætninger er opfyldt, kan der opstilles en række regierom hvilke konklusioner, der kan drages vedrørende universet på baggrund af resultater, der stammer fra udvalget. Dette er samplingsteoriens område og i sin simpleste form er den behandlet f.eks. i Nielsen (1975). Mere dybtgående bearbejdninger findes f.eks. i Hansen & Hurwitz (1953) og i Jensen (1960). Ved sådanne simple tilfældighedsudvalg (fra en uendeligt univers) estimeres spredningen på resultaterne ( nnr 2) som:


DIVL3239

hvor n2er spredningen i populationen og ner stikprøvestørrelsen.

Der findes forskellige varianter af det grundliggende princip. Universet kan opdeles i mindre delgrupper, og der kan fra hver af disse udtrækkes relativ flere eller færre enheder afhængigt af økonomiske forhold, spredningen på den undersøgte variabel i de respektive delgrupper, m.v. I sin ekstreme form kan denne stratifiering føre over i en selwejende udvalgsprocedure, der dog i praksis kan være vanskelig at gennemføre (Jensen, 1965). I sin almindelige form (med uendeligt univers) indebærer det stratifierede udvalg at usikkerheden i tilknytning til resultaterne estimeres som:


DIVL3245

hvor nn 2er variansen i stratum h, Nh er antallet af enheder i stratum
h og N er det samlede antal enheder i universet. Det følger således at,

Side 217

DIVL3249

Det gælder i øvrigt at 11. altid vil være mindre end eller lig med I. Det
er således risikofrit at stratifiere. Hvor stor en fordel der opnås, afhænger
af hvor homogene strata det er muligt at danne.

En anden variant består i at lade udvælgelsen foregå i flere trin. Her opdeles universet i et antal mindre enheder, blandt hvilke der udtrækkes et udvalg af enheder. I hver af disse udtrækkes dernæst et antal analyseenheder. Hvor universet er geografisk spredt (som det er tilfældet i de fleste former for markeds- og opinionsundersøgelser), kan der være betydelige økonomiske fordele forbundet ved en sådan fler- trins procedure. I en mere praktisk anvendt form, i forbindelse med markedsanalyse, foregår klyngeudvælgelsen som en tre-trins-proces (Deming, 1960), Ferber (1954). Først udvælges geografiske delområder, dernæst udvælges husstande inden for disse, endelig udvælges tilfældige personer i de udtrukne husstande.

Den principielle effekt af klyngeudvælgelsen er afspejlet i estimatet af
usikkerheden på resultaterne, der bliver,


DIVL3257

hvor nk2 er variansen i universet af klynger og aer antallet af klynger. Det fremgår her, at variansen alene hænger sammen med antallet af klynger. Det er derfor en fordel af have størst mulig spredning i de enkelte klynger.

Mens stratifieringen først og fremmest har den effekt, at den nedbringerspredningen, d.v.s. reducerer den usikkerhed, der knytter sig til undersøgelsens resultater, så har klyngeudvælgelsen til formål, at reducerede med undersøgelsen forbundne omkostninger. Ofte benyttes de 2 principper i kombination. Herved opstår en udvalgsform, hvor der er 2 modsat virkende faktorer inde, der påvirker usikkerheden på undersøgelsens resultater, sammenholdt med den, der forekommer ved den simple tilfældig udvælgelse. Det gælder imidlertid stadigt, at den grundliggende idé er at sikre sig, at man på baggrund af udvalget

Side 218

kan drage konklusioner vedrørende universet. I hvilken udstrækning dette mål nås, afhænger stadig af de 2 forudsætninger: At universet kan kortlægg;es, og at der kan fremskaffes oplysninger fra et udvalg trukket fra universet.

I en lang række situationer repræsenterer disse forudsætninger ikke noget problem for den praktiske anvendelse af statistisk teori. Det gælder, hvor universet består af »døde« enheder, som det f.eks. er tilfældet ved kvalitetskontrol i forbindelse med masseproduktion, ved udtrækning af allerede indsamlede informationer fra eksisterende filer, m.v. Det kan imidlertid være et alvorligt problem, når det drejer sig om analyser, hvor analyseenheden er personer, grupper af personer, organisationer, firmaer, m.v. Her opstår alle de problemer, der følger af at analyseenhederne kan afgive unøjagtige informationer, kan nægte at svare, kan ændre status i universet i løbet af analysen, o.s.v.

I praksis må analyser af befolkningsforhold foregå på måder, der kun i ringe grad opfylder de forudsætninger, der gælder for tilfældig udvælgelse. Man kan derfor sætte spørgsmålstegn ved rimeligheden i at anvende de regler for konklusionsdragning på baggrund af udvalget, som gælder for tilfældige udvalg.

Dette er for så vidt ikke noget nyt - omend en række forhold udvikler sig på en måde, der gør at problemet accentueres. Konsekvensen heraf drages imidlertid sjældent: Hvordan formuleres regler for konklusionsdragning på baggrund af udvalg af den type der i realiteten er muligt at lave. Det er formålet med nærværende artikel, at undersøge problemet med henblik på udvikling af mere anvendelige inferensregler. Til dette formål skal de fejlkilder, der knytter sig til gennemførelse af praktiske undersøgelser belyses. Dernæst skal en i praksis anvendt — men i teoretisk statistik stedmoderligt behandlet procedure; nemlig opvejning drøftes.

Fejlkilder i markedsanalyser

Ved vurdering af resultater fra udvalgsanalyser må man være
opmærksom på fejl, der kan tilskrives 3 forskellige forhold:

Side 219

1. Målingsfejl, d.v.s. fejl, der følger af at de oplysninger, der indhentes
hos analysepersonen er inkorrekte, inkomplette, eller bevidst fordrejede.

2. Samplingfejl, d.v.s. afvigelser der hidrører fra det ikke er hele universet
der undersøges, men kun et udsnit heraf. Deter alene denne
usikkerhed, statistisk teori beskæftiger sig med.

3. Non-response fejl, d.v.s. fejl der følger af at det ikke er muligt at
gennemføre interviews med alle de udvalgte enheder.

Informationsbrugeren må se på alle 3 fejlkilder, og han må se på dem i forhold til hinanden. Traditionel statistisk teori beskæftiger sig imidlertid alene med fejlkilde nr. 2. Det er formålet her, at pege på veje man kan gå såfremt man også ønsker at inddrage de 2 andre fejlkilder i overvejelserne. Det kan i denne sammenhæng være interessant at se på sammenhængen mellem de 3 fejlkilder.

Mange praktiske analyser beskæftiger sig med at måle personers adfærd. Man måler hvornår personer har købt eller brugt forskellige varer, læst forskellige aviser, anvendt forskellige transportmidler, set forskellige TV-programmer, o.s.v. For alle disse analyser gælder, at der er en indre sammenhæng mellem de 3 fejlkilder. Det kan illustreres med et eksempel på undersøgelse af TV-sening.

Man kan antage at der til en given analyse er en vis kapacitet til rådighed, d.v.s. et vist antal interviewere, der kan interviewe i et bestemt antal timer pr. dag. Man kan nu ved en undersøgelses gennemførelse vælge mellem at lade dataindsamlingen foregå over en længere periode, hvorved et større antal interviews opnås, eller at foretage dataindsamlingen i en snævert tidsmæssigt afgrænset periode, hvilket naturligvis vil give færre gennemførte interviews.

Ved målingen af det man er interesseret i, d.v.s. personens adfærd tilbage i tiden, er man afhængig af personens hukommelse. Jo længere tid der forløber, fra den hændelse man interviewer om, til det tidspunkt hvor interviewet gennemføres, jo større er sandsynligheden for at respondenten ikke husker eller husker forkert. For TV-programmer i Danmark (med 1 kanal) viser erfaringen at man kan opnå pålidelige resultater, når man interviewer 8-10 dage tilbage i tiden, såfremt man som hjælp benytter sig af trykte TV-programmer, som hukommelseshjælp ved interviewets gennemførelse.

Side 220

Man kan nu på 2 måder udvide den datamængde, man får indsamlet. Prisen er i begge tilfælde øget unøjagtighed som følge af fejlerindring. For det første kan man udstrække interviewperiodens længde; jo flere dage man tillader dataindsamlingen til at foregår over, jo flere interviews vil der kunne gennemføres. For det andet kan man variere længden af den periode vedrørende hvilken man interviewer. Man kan indskrænke sig til at spørge om en enkel dag, eller man kan spørge om TV-seningen over en hel uge. Det er klart, at tillader man en uge til dataindsamling, og spørger man om TV-sening inden for en uge (og spørger alle respondenter om de samme TV-program dage) så vil der kunne gå op til 14 dage fra udsendelsen af et bestemt program (på undersøgelsesugens første dag). Hvor man vælger at lægge sig er ikke blot et økonomisk spørgsmål, men også et spørgsmål om at minimere unøjagtigheden i forbindelse med de indsamlede oplysninger.

Yderligere kompliceret bliver problemet, når man erindrer sig, at der
også forekommer substitution mellem non-response fejlene på den
ene side, og sampling- og målefejlene på den anden.

En ikke uvæsentlig årsag til non-response er, at man ikke kan træffe analysepersonen hjemme. Denne form for non-response kan reduceres ved at foretage genbesøg på de samme adresser. Normalt må man dog lade omkring 24 timer gå mellem hvert enkelt besøg, da sandsynligheden for at træffe personen hjemme med kortere intervaller ikke er stor. Det betyder, at såfremt man ønsker at gennemføre op til 3 genbesøg på de adresser, hvor der ikke træffes nogen hjemme ved forudgående forsøg, og såfremt man tillader en uge til dataindsamling, så forøges den samlede dataindsamlingsperiode til 10 dage, idet de sidste genbesøg på de adresser, der blev interviewet på den sidste dag i undersøgelsesugen først finder sted 3 dage efter undersøgelsesugens afslutning.

Også her kan man vælge mellem forskellige alternativer. I stedet for at lade tidsafstanden mellem den adfærd, der måles og interviewet vokse, så kan man reducere antallet af dage hvorpå der interviewes. Med 4 dages interviewning + 3 dages genbesøg, foregår interviewningen såledesinden for én uge. Herigennem opnås imidlertid et mindre udvalg(og dermed større samplingsfejl). En anden mulighed består i, at reducere antallet af genbesøg. Herved opnås flere interviews inden for den effektive interviewperiode, (og dermed mindre samplingsfejl), til

Side 221

gengæld fås en større non-response og heraf følgende større non-responsefejl. Dette kan være uhensigtsmæssigt med mindre man har teknikkertil rådighed ved hjælp af hvilke man kan håndtere non-responsen.

Årsager til non-response

Udover non-response og målefejlsproblemet er der en række yderligere forhold, der i praksis kan medføre at forudsætningen ikke er opfyldt om at universet er kendt og at observationer kan foretages hos alle enheder i udvalget. De væsentligste grunde er,

1. Problemer ved konceptmaessig definition af universet.
2. Problemer i forbindelse med operationel definition af universet.
3. Problemer i forbindelse med udvalgsproceduren.
4. Problemer i forbindelse med stratifikation.

5. Problemer i forbindelse med kommunikation af udvalgsadresser til
interviewere.

6. Problemer i forbindelse med interviewere.

Der skal ikke gås i detaljer med disse tekniske problemer, men kun siges
nogle få ord om hver af dem.

Problemerne ved definition af samplingenhederne på en entydig måde kan være særdeles store. Dette gælder industrielle undersøgelser, hvor udvalgsenhederne kan være virksomheder og organisationer, kontorer, o.s.v. af forskellig art; men det gælder også undersøgelser af individuelle personer eller familier. Det generelle problem, at definere hvad en familie er, og hvad der er en husholdning eksisterer stadig i praksis. Det kan f.eks. i praksis være svært at afgøre om et ungt gift par, der bor med deres forældre udgør to familier i en husholdning, eller to husholdninger i én familie, eller én husholdning og én familie. At gøre denne definition general på en sådan måde at den resulterer i fornuftige sammenlignelige husholdnings- eller familiebegreber, når den anvendes ikke blot i Danmark, men f.eks. også i sammenlignelige undersøgelser i Spanien og Tyrkiet kan være vanskeligt.

Side 222

Selv med en nogenlunde klar definition af hvad udvalget bør være, er der komplicerede problemer forbundet med at definere universet på en operationel måde. I forskellige lande kan forskellige fremgangsmåder komme på tale. Dette hænger ikke mindst sammen med de forskelle, der forekommer i hvilket udvalgsmateriale, der er til rådighed. I visse lande, som det f.eks. har været tilfældet i Sverige, kan befolkningsregistre r benyttes, og analysebrugeren kan købe tilfældigt udvalgte adresser på individuelle personer med kendte karakteristika, såsom alder, køn, geografisk placering antal børn i familien, o.s.v. I andre lande, hvor der ikke er befolkningsregistrer tilgængelige eller hvor analytikeren ikke har mulighed for at få adgang til dem, kan valglister, telefonbøger, lokale håndbøger, ejendomsfortegnelser, postlister, o.lign. tænkes anvendt. I visse situationer kan ingen gang denne information opnås. Her kan så anvendes area-sampling, hvor interviewerne dernæst mere eller mindre omhyggeligt registrerer alle adresser inden for de i forvejen udvalgte områder. Dette producerer en listning ud fra hvilke de adresser, der skal interviewes på, kan trækkes. Alternativt kan analyseinstituttet med udgangspunkt i »tilfældige« startadresser instruere sine interviewere om at følge i forvejen fastlagte ruter, - den såkaldte »random routing«.

De problemer, der her er tale om kommer måske klarest frem, når man beskæftiger sig med sammenlignelige analyser i forskellige lande. Det er vanskeligt at udføre analyser i forskellige lande på en sådan måde, at de giver resultater, der kan sammenlignes, når mulighederne for udvalgsetablering er så forskelligartede, som det er tilfældet.

Anvendelse af stratifikation indebærer også problemer. Den tilgængelige information, på baggrund af hvilken universet kan opsplittes i forskellige strata, varierer fra land til land, ofte er der meget lidt information til rådighed, og mange steder hvor information er tilgængelig, er den fejlagtig, forældet, eller opbygget ud fra definitioner, der ikke er identisk fra land til land.

Med universet defineret kunne man forestille sig, at det at udtrække et tilfældigt udvalg er relativt simpelt. På grund af forskelle i vigtigheden afrejseomkostninger i forskellige områder, på grund af heterogeniteten i udvalgslistningen, og på grund af heterogeniteten blandt de personer og institutter, der beskæftiger sig med udvalgsgennemførelsen, kan markante forskelle imidlertid resultere.

Side 223

Også forskelle i den måde hvorpå adresserne leveres til interviewerne kan være vigtige. Hvis adresserne er sådan, at det er svært for intervieweren at identificere respondenten, kan det have alvorlige implikationer for besvarelsesprocenten. På samme måde forskelle i interview-teknik, kvaliteten på interviewere, tidspunkt på dagen hvor interview gennemføres, o.s.v. kan resultere i dramatiske forskelle i besvarelsesprocenter og i karakteren af udvalg, hvormed der rent faktisk gennemføres interview.

Vejning

Vejningsproblemet kan lettest illustreres med et lille eksempel. Man kan forestille sig, et udvalg på ialt 60 personer (stratifieret) som vist i figur 1. Der er således udtrukket 10 personer af hver køn i hver aldersgruppe. Med dette udvalg gennemføres nu interviews med ialt 43 personer, der fordeler sig som vist i figur 1 b. Det er klart at resultater direkte baseret på dette udvalg, vil blive skævt på den måde at det vil underrepræsentere yngre, specielt mænd, og overrepræsentere middelaldrende, specielt kvinder. For at hjælpe på det problem kan man gå flere forskellige veje. Man kan sondre mellem 4 forskellige fremgangsmåder (figur 2). På den ene side kan man sondre mellem opvejning og duplicering. På den anden side kan man sondre mellem hvilke kilder, der benyttes til fremskaffelse af de informationer, der benyttes til etablering af vægtene.


DIVL3350

Figur 1. Stratifieret udvalg (a) og gennemførte interviews (b).

Side 224

DIVL3353

Duplicering baseret på generelle kriterier vil normalt benytte demografiske kriterier. I det foreliggende eksempel vil det indebære, at der for eksempel blandt de 8 middelaldrende mænd tilfældigt udtrækkes 2, således at antallet af besvarelser i denne celle bringes op på 10. På samme måde dupliceres besvarelser i de øvrige celler. Det bemærkes således at blandt de yngre mænd, dupliceres samtlige observationer.


DIVL3355

Figur 2. Oversigt over vejeformer.

Alternativt kan duplicering foretages på baggrund af oplysninger om bortfaldets faktiske karakter. Man kan f.eks. have hørt sig hos naboer eller på anden måde fået oplysninger om køn, alder, erhverv, m.v. for de personer, der ikke er truffet hjemme, eller som har nægtet at deltage i undersøgelsen. Herefter findes personer med samme karakteristika i besvarelsesmaterialet, og disses besvarelser dupliceres.

Vejning indebærer at hver enkelt besvarelse indgår i databearbejdningenmed en vægt, der korrigerer for den non-response, der knytter sig til den type af respondenter, som den pågældende repræsenterer. For det valgte eksempel her, vil vægtning baseret på køn og alder resultereri

Side 225

DIVL3358

Figur 3. Vægte baseret på køn og alder.

rerivægtene, der er vist i figur 3. Middelaldrende mænd indgår såledesi undersøgelsen med vægten 1.25, mens middelaldrende kvinder indgår i undersøgelsen med vægten 1.11. Vejningen kan i øvrigt baserespå en lang række forskellige kriterier, såsom geografi, erhverv, husstandsstørrelse, m.v. Blot kræves at universets sammensætning på de respektive krjterier kendes.

Opvejning baseret på oplysninger om bortfaldet gennemføres efter samme retningslinier. Oplysningerne om bortfaldet kan bestå i oplysninger om køn, alder, geografi, m.v. En særlig fremgangsmåde, der bygger på en sondring mellem de to hovedformer for bortfald, nemlig nægtelse og manglende kontakt, skal dog omtales. For en del af bortfaldet, der skyldes at man ikke har truffet personen hjemme gælder, at de personer man ikke får fat i, er karakteriseret ved at være meget lidt hjemme. De har en lille chance for at være hjemme på de tidspunkter, hvor interviewene gennemføres. Ved at sprede interviewningen over hele dagen og ved at opveje baseret på interviews foretaget på samme tidspunkt, som det manglende interview, kan man forsøge at korrigere denne non-response. Tilsvarende med nægtere: Nægtere er karakteriseret ved at de ikke ønsker at deltage i undersøgelsen. Det er imidlertid ikke altid de samme personer, der optræder som nægtere. Der er på den anden side nogle der er mere tilbøjelige til at være nægtere end andre. Ved hjælp af indstillingsmålinger kan man forsøge at kvantificere analysepersonernes tilbøjelighed til at nægte. Ved at lade de personer, som er meget tilbøjelige til at optræde som nægtere, veje særligt tungt i opvejningen kan man forsøge at tage hensyn til denne særlige gruppe.

Side 226

Hertil kommer at vejning vil normalt ogsa bruges til at konvertere husholdningsdata til individuelle data, og visa versa. Visse steder er udvalgsmaterialet tilgaengeligt i form af listninger af individer (f.eks. vaelgerlister) andre steder er husholdninger udvalgsenheden (f.eks. baseret pa ejendomsregistre). I det sidste tilfaelde er det nodvendigt at tage stilling til hvorledes interviews med personer gennemfort i udvalg sammensat af husholdninger kan fortolkes som et udvalg af individer. Med mindre en eller anden form for vejning benyttes enten i interviewfasen eller i databearbejdningsfasen vil personer, der lever i storre husholdninger have en mindre chance for at blive repraesenteret i udvalget, end personer, der bor i sma husholdninger, hvor udvalgsenheden er personer opstar det modsatte problem.

Uanset hvilken form for opvejning, der benyttes gælder det, at der produceres resultater, hvor teoretisk statistisk inferensregler ikke umiddelbart har nogen mening. Med besvarelsesprocenter på 60-8096 (som, der oftest arbejdes med i praksis), kan man spørge om i hvilken udstrækning man overhovedet kan tale om et tilfældigt udvalg. Forskellen mellem det opvejede eller duplicerede tilfældige udvalg, og den egentlige kvota-udvælgelse synes mere at være kosmetisk. (Weinberger, 1973). Spørgsmålet er imidlertid om det er muligt at udvikle regler, der gør det muligt at konkludere på baggrund af de opvejede data. Dette må være en væsentlig opgave for fremtidig samplingteori.

Nogle tanker herom er følgende:

I princippet kan opvejningen anskues som en stratifiering med disproportional udvælgelse. Stratifieringskriterierne er de kriterier på hvilke opvejningen finder sted. Et skøn over usikkerheden efter opvejning kan således tage sit udgangspunkt i formel (II.). I praksis vil der imidlertid være problemer forbundet hermed, fordi der udover opvejningen har fundet stratifiering sted i selve udstrækningen af analyseenheder. Hvortil kommer at udvalgsetableringen normalt vil have fundet sted som en en- eller flertrins-klynge-udvælgelse. Som ved almindelig stratifiering gælder det dog, at jo mere homogent universet er på de kriterier der benyttes til opvejning, jo mere risikofrit er opvejningen. (Koch, 1973).

Side 227

Målefejl

Medens opvejning først og fremmest tager sigte på at korrigere for non-responsen rummer målefejlene et andet problem. Årsagerne til målefejl er diskuteret i den meste markedsanalyselitteratur (Blunch, 1974, Green & Tull, 1975). Meget kort kan man sondre mellem målefejl, der tilskrives analysepersonen, og målefejl, der tilskrives intervieweren.

Målefejl, der kan tilskrives analysepersonen er dels sådanne, der følger af vanskeligheder med at forstå, eller af manglende evne til at besvare de stille spørgsmål. Dels er der tale om fejl, der skyldes manglende villighed til at besvare de stillede spørgsmål korrekt. Fejl, der kan tilskrives intervieweren er dels sådanne som har med ukorrekte præstationer at spørgsmål at gøre, dels sådanne som skyldes bevidst afvigelse fra det forelagte spørgeskema.

I begge tilfælde er virkningen den, at den sande parameter i universet »x« ikke er en konstant, men må opfattes som en stokatisk variabel. Det stokastiske element afspejler dels her tilfældige variationer i respondenternes besvarelse, dels tilfældige variationer i interviewerens registreringer af besvarelserne. Hvis man nøjes med at se på det simpleste tilfælde, har man (Lipstein, 1975) søgt at bevare den samlede variation i resultaterne.

Disse forsøg viser at de variationer, der kan tilskrives tilfældige variationer i den målte variabel ofte kan være 2-3 gange så store som de variationer, der skyldes udvalgsprocedure. Det er i denne sammenhæng nærliggende at pege på muligheden af en mere hyppig beregning af den faktiske spredning i analysedata. Ved større undersøgelser vil dette f.eks. være muligt gennem opsplitning af det udvalg i mindre udvalg, hvor den undersøgte parameter estimeres fra hver af deludvalgene.

Litteraturfortegnelse

Blunch, N.: »Markedsanalyse«, E. Harck, København 1974.

Deming, W. E.: »Sampling Design in Business Research«, New York, Wiley, 1960.

Ferber, R.. »Marketing Research«, McGraw Hill, New York, 1949.

Green, P. E. & Tull, D. S.: »Research for Marketing Decisions«, Printice Hall, New York, 1975.

Jensen, E. Lykke: »Repræsentative Undersøgelsers Teori og Metode«, bl. 1 og 2. København,
1.957 og 1960.

Jensen, E. Lykke: »Self-weighting two Stage Sampling procedures«, København, Det danske
Marked.June, 1965.

Koch, Gary. G: )>An Alternative Approach to Multivariate Response Error Models for Sample
Survey Data with Applications to Estimators Involving Subclass Means«, Journal of The American
Statistical Association, Vol. 68, No. 344, December, 1973, pp. 906-913.

Lipstein, Benjamin: »On the Limits of Reliability in Social and Commercial Surveys«, in fieldwork,
Sampling and Questionnaire Design, ESOMAR, Amsterdam, 1975.

Nielsen, A. Schultz: »Indføring i teorien for stikprøveundersøgelser«, Samfundslitteratur, København,

U. S. Bureau of the Census, »Evaluation and Research Program of the 1970 Census og Population
and Housing; Estimates of Coverage of Population by Sex, Race and Age: Demographic
Analysis«, Washington, D. C, February, 1974.

Weinberger, Martin: »Getting the Quota Sample Right«, Journal of Advertising Research, Vol.
13, No. 5, October, 1973, pp. 69-72.