Nationaløkonomisk Tidsskrift, Bind 3. række, 40 (1932)

WALTER ANDERSSON: Researches into the theory of regression (Lunds Universitets Årsskrift, N. F. Avd. 2. Bd. 28, Nr. 1). Lund 1932.

Hans Cl. Nybølle

Side 291

Statistiske Undersøgelsers Hovedværktøj er Gennemsnitstal, og forsaavidt tilkommer der ved Korrelationsundersøgelser Regressionslinierne en særlig Interesse. Kan Fordelingsmådens Form ikke antages kendt, er det den sædvanlige Fremgangsmaade at bestemme Regressionslinierne empirisk — d. v. s. uden at tage Fordelingsmådens Form i Betragtning — idet man paa en eller anden Maade udjevner de for en Række Værdier af det ene Kendetegn beregnede Middeltal af det andet. Ganske særlig er her Udjevning efter rette Linier ved mindste Kvadraters Metode kommet i Yndest, d. v. s. ikke alene blevet meget brugt, men ogsaa meget misbrugt. Men Brugen kan iøvrigt til sin Retfærdiggørelse anføre det ikke uinteressante Faktum, at hvis man af et Materiale, der fordeler sig normalt, bestemmer Regressionslinierne (der her altsaa paa Forhaand vides at være rette Linier) ved en Udjevning efter mindste Kvadraters Metode, faar man de ved den givne normale Fordelingsflade definerede Regressionslinier.

I det foreliggende Værk undersøges det nærmere, hvad der kan opnaas ved Betragtning af krumme Regressionslinier; naar disses Ligninger udtrykkes ved Parabler af passende højere Orden end af første Grad, lader de sig lige saa vel bestemme ved Udjevning efter mindste Kvadraters Metode,som naar Linierne antages rette. Ligeledes lader de fra et begrænset Materiale hidrørende „tilfældige" OmstændighedersIndflydelse

Side 292

hedersIndflydelsepaa Bestemmelsen af Regressionskurverne sig da ogsaa relativt let udtrykke. Vanskeligheden er her blot den velkendte, at den Nøjagtighed, hvormed Led af højere Orden kan tages i Betragtning, bliver højst utilfredsstillende, fordi man netop intet forudsætter om Fordelingsmådens Form. Efter en af Prof. Wicksell udkastet Ide er Forf. nu gaaet den Mellemvejblot at tænke sig Loven for Korrelationens marginale Fordelingerkendt og har efter detailleret at have udviklet, hvorledesBestemmelsen af Regressionslinierne da falder ud, resp. kan simplificeres, ved en Række Eksempler nærmere vist, hvorledes Nøjagtigheden ved Bestemmelsen af krumme Regressionslinierda kan skærpes i saadanne Tilfælde, hvor den ellers vilde blive saa ringe, at der ingen Interesse knytter sig til denne Bestemmelse.

Det virker straks ganske kuriøst, at en saadan Begrænsning i Forudsætningerne om Fordelingernes Form er saa langt fra at virke ødelæggende, som Eksemplerne viser. Spørgsmaalet er imidlertid ogsaa, om det er mere end et Kuriosom, fordi det Grundlag, hvorpaa Udførelsen hviler — Regressionskurvernes Udjevning efter arbitrært valgte Funktionsformer — trods Anvendelsen af den ny tilkomne og ikke uinteressante Ide ialt Fald foreløbigt ikke kan anses for rationel, men mere som noget, der lader sig høre „i Mangel af bedres Havelse". Heroverfor er der bl. a. eet Spørgsmaal, som skulde synes at trænge langt dybere ind i de af Forf. behandlede Problemer, og som Afhandlingen mere er „midt op i" end blot berører, nemlig Spørgsmaalet om Muligheden i det hele taget af Regressionslinier'nes Bestemmelse ved Udjevning efter mindste Kvadraters Metode, et Spørgsmaal, hvis videre Udredning maatte kunne give betydningsfulde Bidrag til Belysning af Forbindelsen mellem Korrelation og Udjevning i det hele taget, hvad der specielt ogsaa berører Forstaaelsen af Begreberne Sandsynlighed og tilfældige Omstændigheder, de Tapper, hvorom al Erkendelse ad statistisk Vej drejer. H C1 Nvbøne