Produktionstilrettelægning ved statistiske metoder.

1. Indledning.

Den foreliggende artikel er et forsøg på i koncentreret, men dog forhåbentlig nogenlunde letforståelig form at give et indtryk af moderne metoder inden for den statistiske forsøgsplanlægning med særligt henblik på de anvendelser af disse, der i den senere tid er udformet af den engelske statistiker, G. E. P. Box, efter hvem de ofte sammenfattes under betegnelsen „Box's metode". (1). Der gøres samtidig forsøg på at sætte Box's metode i relation til produktionsteorien, bl. a. fordi denne disciplin tør formodes at være læserne af netop dette tidsskrift så præsent, at de statistiske problemstillinger derved bliver lettere forståelige. (2). Da Box bygger på mere generelle statistiske metoder såsom regressionsanalysen og den særlige udformning heraf, der er karakteristisk for de såkaldte faktorforsøgsplaner, er det tillige nødvendige med nogle indledende afsnit herom. Selvom det er tilstræbt at udforme fremstillingen her således, at den skulle kunne læses uden mere end rudimentære forestillinger om den statistiske teori, må det dog anbefales at supplere læsningen af de senere afsnit med et studium af de relevante dele af en større statistisk lærebog. (3).

2. Produktionsprocesser. Produktionsfaktorer. Udbytte.

I en produktionsproces transformeres strømme af produktionsfaktorer til en produktstrøm. Udbyttet af produktionsprocessen kan måles kvantitativt ved strømmens størrelse i mængdeenheder pr. tidsenhed eller ved strømmens værdi under hensyntagen til eventuelle kvalitetsvariatione. En sådan værdiangivelse kan være teknisk (fx. renhed, koncentration etc.) eller økonomisk (værdi i kr. pr. tidsenhed).

Sammenhængen mellem udbyttet, y, og et vist antal produktionsfaktorer,
Xi (i = I, 2, . . . , k) kan udtrykkes ved en produktionsfunktion

*) universitetsadjunkt, cand. oecon, Aarhus Universitet.

Side 172

Produktionsfaktorerne kan fx. være en række ingredienser, der frembringer et produkt ved at kombineres i et vist blandingsforhold, fastlagt ved en recept. Men produktionsfunktionen bør ikke altid opfattes på denne substantielle måde; i en rensnings- eller extraktionsproces kan de forskellige xi angive forskellige behandlinger af et råstof, y (udbyttet) kan da være det relative indhold (koncentrationen) af et ønsket stof efter indsatsen af de pågældende behandlinger.

Produktionsfunktionen kan iøvrigt opfattes på flere måder, altefter hvor fuldstændig specifikationen af faktorerne tænkes at være. Har man med de k faktorer angivet alle forhold af betydning for udbyttet, fx. samtlige ingredienser i en recept, d. v. s. at xi angiver blandingsforholdene og y er en vilkårligt valgt enhed for produkt af en given kvalitet, er selve produktstrømmens størrelse (pr. tidsenhed) ligeledes en vilkårlig størrelse, og det er rimeligt at opfatte produktionsfunktionen som en homogen funktion, d. v. s. at

hvor a er en skalafaktor, der fastlægger produktstrømmens størrelse. Gyldigheden af denne relation formuleres undertiden verbalt som paripassu-loven, d. v. s. at en forøgelse af samtlige produktionsfaktorer med en vis procent øger produktmængden med samme procent.

Ved produktionens tilrettelægning i en given virksomhed må man i reglen nøjes med at betragte en del af de faktorer, som i det hele influerer på udbyttet, som variable i virksomhedens dispositioner. Antallet af variable faktorer kan være forskelligt ved virksomhedens kortsigtede og langsigtede planlægning, men det i denne forbindelse relevante er simpelthen, at man er interesseret i udbyttets afhængighed af de variable faktorer under hensyntagen til de givne forhold, d. v. s. man ønsker at finde det i en vis forstand optimale udbytte opnåeligt ved en produktionsfunktion på kort sigt, fx. på basis af et givet anlæg og udstyr i virksomheden, d. v. s. ved en given konstellation af nogle af de faktorer, der påvirker udbyttet.

I sidste instans må optimum-kriteriet altid være af økonomisk karakter,fx. formuleret som størst muligt udbytte, y, målt i penge, for en given indsat af produktionsfaktorer, ligeledes målt i penge (ved givne omkostninger). Men i tekniske forsøg foretager man ofte undersøgelseraf et udbyttes afhængighed af variable, hvis variation ikke nødvendigvishar omkostningsmæssige konsekvenser, fx. ændring af maskinindstilling,ændret rækkefølge af iøvrigt identiske operationer o. s. v. Man har da en rent teknisk problemformulering: at realisere den effektiveudnyttelse

Side 173

tiveudnyttelseaf de givne ressourcer. Om de variable, der indgår i et sådant problem kan kaldes produktionsfaktorer i produktionsteoriens forstand er vel tvivlsomt, men det formindsker jo ikke betydningen af at studere virkningen af deres variationer på udbyttet.

I produktionsteorien, således som man benytter denne i økonomiske problemstillinger, forudsættes det i virkeligheden, at de tekniske effektivitetsproblemer er løst, idet det er betingelsen for, at der overhovedet svarer et entydigt bestemt udbytte til en given indsats af produktionsfaktorer; entydigheden opnås netop ved at regne med, at faktorerne udnyttes

Ved forsøg tilstræber man at konstatere, hvorledes y varierer ved
variation af een eller flere faktorer, det være sig egentlige produktionsfaktorer
eller variable af den just nævnte art.

3. Partielle produktionsfunktioner. Det faldende udbyttes lov.

I den enkleste form for produktionsforsøg varieres kun een faktor,
d. v. s at man i virkeligheden undersøger en partiel produktionsfunktion

d. v. s. en funktion, der angiver sammenhængen mellem y og x\ (i det

Fig. l.

Side 174

følgende betegnet x) ved et givet niveau af de øvrige k-l faktorer. Den sidste og bekvemmeste skrivemåde af de tre ovenfor, som vil blive benytteti det følgende, bør ikke friste til at glemme, at der i virkeligheden er tale om en niveaukurve, d. v. s. at funktionen kun har betinget gyldighed.

For en sådan partiel produktionsfunktion postuleres gyldigheden af
det faldende udbyttes lov, d. v. s. at sammenhængen mellem y og x er
som afbildet i fig. 1.

Man bemærker, at der i fig. 1 er angivet to former for totaludbyttekurver (d. v. s. de kurver, der angiver y som funktion af x); i version I nærmer y sig en øvre asymptote og i version II falder y fra et vist punkt at regne. Når man tænker på grænseudbyttekurverne (d. v. s. dy fdx som funktion af x), er det faldende udbyttes lov generelt gyldig, idet grænseudbyttet er faldende for x > x i fig. 1. I version II er loven også gyldig for totaludbyttet, idet dette er faldende for x > x".

Det er motiveret at postulere det faldende udbyttes lov, når man betragter en partiel produktionsfunktion, idet man ved at forøge en enkelt faktor alene kun kan øge udbyttet til en vis grænse som følge af, at der efterhånden bliver større og større relativ mangel på de øvrige faktorer. Ragnar Frisch citerer efter von Thiinen et exempel svarende til version I, hvor totaludbyttet asymptotisk nærmer sig en overgrænse: der samles kartofler på et givet jordstykke. Totaludbyttet forøges ved indsats af flere arbejdstimer, men tænkes disse indsat sukcessivt, vil merudbyttet ved indsats af endnu en arbejdstime blive lavere, jo flere gange marken allerede har været gennemsøgt, d. v. s. grænseudbyttet er faldende. Som exempel på version II kan man forestille sig, at en afgrøde sprøjtes mod skadedyr. Jo stærkere sprøjtevædske der benyttes, desto fuldstændigere bliver udryddelsen af skadedyrene, men til gengæld vil planterne selv efterhånden lide sprøjteskade, og merudbyttet ved den fuldstændige udryddelse af skadedyrene kan blive mere end opslugt af denne skadevirkning. Også ved gødskning af planteafgrøder kender man exempler på, at for ensidig tilførsel af kunstgødning ikke blot ikke betaler sig, men kan give direkte skadevirkning.

4. Statistiske metoder til bestemmelse af udbyttekurver. Regressionsanalyse.

For nemheds skyld forudsættes det i det følgende, at vi arbejder med den tekniske problemstilling: effektiv udnyttelse af givne ressourcer, hvor det kan anses for rimeligt at definere optimum i en partiel produktionsfunktionsom det maximale totaludbytte, hvorved yderligere må forudsættes, at udbyttet varierer som i version 11. Den variable faktor x kan fx. være den temperatur, ved hvilken en kemisk proces realiseres. At problemstillingen kan opfattes på den anførte måde, kan forsvares med, at man kan tænke sig, at omkostningerne ved at holde

Side 175

en høj temperatur er knyttet til selve op fyringen etc., så at man kan se bort fra en eventuel ringe forskel i omkostninger ved at præstere alternativtfx. 125 eller 150 graders varme i blandekarret, hvor processen foregår. Den partielle produktionsfunktion svarer altså til totaludbyttekurvenaf version II i fig. 1, og problemet er at bestemme den temperatur, der giver maximalt udbytte. (Var udbyttekurven af version I, gjaldt det simpelthen om at holde så høj temperatur som muligt med det givne anlæg, men det ville da næppe være muligt at disponere rationelt uden hensyntagen til omkostnings variationer).

Den måde til løsning af problemet, som her skal diskuteres, går ud på en fastlæggelse af den partielle produktionsfunktion, hvormed maximumspunktet tillige vil være bestemt. Box's metode består i virkeligheden i en fravigelse fra denne ofte unødvendigt omstændelige metode, således som vi senere skal se.

Realiserer man den exemplificerede kemiske proces ved n forskellige x-værdier, xi, X2, .. x_n, vil man registrere nogle hertil svarende empiriske totaludbytter, y\, y2, .. y%. (xi betyder nu forskellige værdier af een faktor, x, ikke som i afsnit 2-3 forskellige faktorer). Problemet er nu ved statistisk analyse af de n talpar (xi, yi) at bestemme funktionen

Det er da først et problem at bestemme selve funktionstypen. Dette søges løst ved aprioriske overvejelser på grundlag af de egenskaber man ønsker partielle produktionsfunktioner skal have (4). Vi skal ikke gå nærmere ind på disse problemer her, men holde os til en klasse af funktioner, som giver de statistiske beregninger den enklest mulige form, nemlig polynomier af typen

y betegner her de teoretisk rigtige som kunne beregnes,
hvis man kendte den rigtige funktion.

I ethvert forsøg (og i særlig grad netop i produktionsforsøg, hvor det
ofte er vanskeligt at realisere forudsætningen om de øvrige faktorers
konstans mere end approximativt i hvert enkeltforsøg) optræder der
forsøgsfejl, i den følgende fig. 2 markeret ved, at de empiriske
dier, indtegnet med kryds, ikke nøjagtigt falder på linjen y.

På grund af forsøgsfejlen opstår der et behov for udjævning af de fundne Ganske vist kan man, når man har n talpar, altid føre en kurve af polynomialtypen nøjagtigt gennem samtlige punkter, nemlig ved at bestemme konstanterne fo ved løsning af de ved talparrenebestemte n ligninger med n übekendte. Polynomiet vil da blive af

Side 176

n— l'te grad (eller lavere, såfremt løsningen tilfældigvis giver nul for
Pi-værdierne med højest index).

Udjævningsproblemet består i at bestemme færre end n konstanter på en sådan måde, at de ud jævnede værdier, y, bedst muligt passer til de observerede idet afvigelserne y—y postuleres at skyldes forsøgsfejl, og man går ud fra, at vil ligge nærmere de teoretiske værdier y end selve de observerede værdier, da disse sidste jo påvirkes af forsøgsfejlen. Dette postulat er stort set korrekt, når y netop beregnes af den rigtige funktionstype, men mere generelt må man tage hensyn til, at der i afvigelserne y—y kan indgå specifikations fejl, som skyldes valg af forkert funktionstype. Det bør endvidere anføres, at forsøgsfejlen nødvendigvis må påvirke skønnene over funktionens parametre, så at y selv i bedste fald ikke vil svare nøjagtigt til y. Som nævnt er problemet netop at bestemme y bedst muligt. (Cf. fig. 2).

Parametrene i den ud jævnede kurve bestemmes ved mindste kvadraters
metode, d. v. s. ved minimering af størrelsen

bi er her de ved mindste kvadraters metode bestemte skøn over de tilsvarende
A, og k må naturligvis forudsættes at være mindre end n.

Man beregner dernæst de partielle differentialkvotienter af dette udtrykm.
h. t. bo, bi, b>, . . . , bu og sætter dem lig nul. Herved fastlægges

Fig. 2.

Side 177

det såkaldte normalligningssystem, der løses m. h. t. bu Dette ligningssystemfår

(Alle summationer her og i det følgende sker over de n y-, respektive
*-værdier).

Da faktoren x forudsættes at være en variabel, man har under bevidst kontrol, kan man forudsætte, at de n x-værdier er ækvidistante. Som det vil fremgå af de følgende afsnit, gør man i reglen klogt i at planlægge sine forsøg således, at »-værdiernes ækvidistans realiseres. Betegner d den konstante differens mellem sukcessive »-værdier, kan man indføre en ny variabel, z, idet

Vi indfører nu middeltallet af z som nulpunkt. Forudsætter vi for
nemheds skyld n ulige, har vi middeltallet z bestemt ved et helt tal;

Med z som nulpunkt får vi en ny variabel Z fastlagt ved

og for Z gælder, at 2Z — 0.

Vi erstatter nu x med Z i normalligningssystemet og skriver da Bi for bi, hvor denne ændring i notation markerer, at funktionen nu er en funktion af Z i stedet for af x. Er den søgte kurve fx. en ret linje, står de relevante ligninger i normalligningssystemet nordvest for den punkterede linje i skemaet ovenfor. Da 2Z = 0, får vi følgelig:

Vil vi bestemme et 2. grads polynomium, må de tre normalligninger
nordvest for den fuldt optrukne linje i skemaet tilfredsstilles. Vi indførernu
tillige en nulpunktsforskydning for y, idet Y = y—y. Regressionsligningen(som

Side 178

sionsligningen(somvi betegner den ved mindste kvadraters metode bestemteligning
for y eller Y) bliver da

og vi får derved en reduktion til de to normalligninger

idet jo 2Z³ ligesåvel som 2Z må være lig nul. Det realiserede formål med transformationerne fra x til Z og fra y til Y er at undgå nødvendigheden af en simultan løsning af normalligningerne. Når vi skal beregne skøn over parametrene i 3. grads, 4. grads etc. polynomier, må mere effektive transformationer af x indføres, de såkaldte ortogonale polynomier. Disse vil blive nærmere omtalt i afsnit 5.

Koefficienterne Bi, 82, ■ ■ ■ ■ siges at udtrykke henholdsvis lineær, kvadratisk,
.... effekt (nemlig af faktoren Z på udbyttet Y). Ved omregning
til bo, bu &2, ■ • • • på basis af de benyttede transformationer får
man ved de mindste kvadraters metode bestemte skøn over /?o, fiu P 2,
ved hvilke man kunne have beregnet y (forudsat det pågældende polynomium
er den rigtige funktionstype). Det karakteristiske for skøn, fundet
ved mindste kvadraters metode, er, at de har disse såkaldte sande
værdier som middelværdier og varierer omkring disse værdier med den
mindst mulige varians.

Disse egenskaber er generelle, men vi kan nu yderligere forudsætte, at afvigelserne y-y er normal)ordelte omkring nul. Heri ligger dels en forudsætning om fravær af specifikationsfej 1, dels impliceres visse forudsætninger om rationelt valg af skala for >>-værdierne. Vi må her forudsætte, at læseren er fortrolig med, hvorledes en statistisk fordeling i almindelighed samt i særdeleshed den normale fordeling beskrives ved middelværdi og varians.

De anførte forudsætninger kan kort skrives M(b{) — fii og M(y—y)2 = 02,o2, hvor størrelsen
af variansen o2o2 udtrykker forsøgsfejlens størrelse, hvor y er normalfordelt omkring
y' og forsøgsfejlen normalfordelt omkring nul.

For et normalfordelt observationssæt 3^, y2, .... yn registreret under ensartede omstændigheder
(uden variation af x) gælder

SAK betegner .sum af afvigelses&vadrater, størrelsen f=n —1 kaldes antal frihedsgrader. Medens relationen mellem SAK, a og f bygger på de nævnte forudsætninger, kan naturligvis et hvilketsomhelst sæt observationer indsættes i selve beregningsformlen for SAK, der iøvrigt med udnyttelse af definitionen på y kan omskrives som følger

hvor SK betyder sum af kvadraterne på observationerne, S sum af observationerne.

Side 179

Vore transformerede variable Z og Y har begge summen nul, hvorefter SAK = SK.

Når vi har beregnet en regressionslinje Y, kan vi opspalte observationernes afvigelse
fra middeltallet (d. v. s. nul) i afvigelserne fra Y, og afvigelserne fra Y til middeltallet
(nul), d. v. s. Y selv.

Vi betragter exempelvis 2. grads polynomiet

Heraf

Da 2ZS = 0, fås heraf

Idet

får man ved at udnytte relationerne Bt =-- (2ZY)/{2Z2) og B2B2 = (2Z^Y)/(2Z% at

hvoraf følger, at

Dette resultat benyttes i en opspaltning af SAK, beregnet af y-værdierne, idet vi har

For 2. grads polynomiets vedkommende medfører vore transformationer altså, at kvadratafvigelsessummen for den afhængige variable kan spaltes i tre additive komponenter: de kvadrerede afvigelser mellem de faktisk konstaterede værdier og den beregnede linje plus et led, der afhænger af den lineære regressionskoefficient og 2Z2 plus et led, der afhænger af den kvadratiske regressionskoefficient og 2Z*. Denne opspaltning af SAK i additive komponenter er også gyldig for polynomier af højere orden, når man benytter de før nævnte ortogonale polynomier.

Den viste opspaltning ligger, i forbindelse med den tidligere omtalte relation mellem SAK, f og o2o² i det tilfælde, hvor y varierer normalt og uafhængigt af x, til grund for opstillingen af de kriterier for vurderingen af de beregnede effekters betydning, der omtales i afsnit 6.

5. Multipel regression. Ortogonale sammenligninger. Faktorforsøg.

I dette afsnit fortsættes redegørelsen for, hvorledes man udformer forsøgsstrukturer, der giver så bekvemme beregninger som muligt, idet vi nu tænker os, at flere end een faktor kan variere samtidigt. De konsekvenser dette får for forsøgets problemstilling diskuteres i afsnit 7.

Som udgangspunkt betragter vi det enkle tilfælde, hvor Y er en
lineær funktion af k variable (xi betegner nu igen forskellige faktorer)

Denne ligning er analog til den ligning, der udtrykker Y som funktionaf
samme faktor i første, anden, ... etc potens. En mere generel

Side 180

ligning ville'dels indeholde flere faktorer, dels forskellige potenser af
disse faktorer. Holder vi os imidlertid til den lineære funktion, ser man,
at anvendelse af mindste kvadraters metode nu giver normalligningerne

Analogt til det foregående finder man, at forudsætningen for, at man
kan undgå simultan løsning af ligningssystemet, d. v. s. for at man ved
at indføre Zi = f (xi) kan bestemme bi af nogle Bi, hvor for alle i

er, at

Ved fornuftig planlægning af forsøgsstrukturerne (valg af ækvidistante
xi) kan man opnå, at man kan indføre transformationer, Zi, der sikrer
dette.

Vi skal nu generalisere disse synspunkter, som har vist sig af så stor
betydning i regressionsanalysen, til statistisk analyse af observationer
i det hele taget.

Vi tænker os, at vi har forelagt et observationsmateriale

hvor der er stillet os den opgave at uddrage en vis information af diernes variation. Dette gør vi ved sammenligning af observationerne. Matematisk kan en sådan sammenligning siges at bestå i opstilling af et koefficientsæt, q%, der determinerer en kontrast mellem y-værdierne, nemlig størrelsen

der formelt kan opfattes som det skalære produkt (Y) (Q) af de to vektorer
(talsæt) (Y) = yi, y>2, •-••, y% og (Q) = q\, #2, •••, tf«. Et simpelt,
intuitivt forståeligt exempel er sammenligningen af summerne af
dier i to lige store grupper på basis af differensen mellem de to summer.
Det svarer til, for n = 2 k, at

I exemplet er 2qi = 0, og denne egenskab vil vi i almindelighed kræve
af et koefficientsæt, der skal fastlægge en sammenligning.

Side 181

Den variable Z, som vi har benyttet i regressionsanalysen, er en sammenligning,
når den betragtes som et koefficientsæt —Vz (n — 1), ....
—1, 0,1, ...., V2 (n — 1), og tillige bliver Z3, Z5Z5 ... sammenligninger.
De lige potenser af Z må derimod, som det senere skal omtales,
reguleres til summen nul.

To sammenligninger, q% og s%, er indbyrdes ortogonale, når

hvilket stemmer med terminologien i vektorregningen (5)

Vi introducerer nu begrebet faktorforsøg. Herved forstås forsøgsstrukturer, hvor et udbytte y konstateres for alle de mulige faktorkombinationer, der dannes af flere faktorer, der antager hver et antal mulige ækvidistante faktorniveauer. Varierer fx. to faktorer i hver tre niveauer, får man 323² =9 y-værdier, yu (i = 1, 2, 3; ;= 1, 2, 3). Vi skal nu se, hvilke kontraster der kan beregnes af disse 9 y-værdier og hvilke relationer der er mellem disse kontraster indbyrdes. Ligesom før får vi en række additive S^lÆ-komponenter, og til hver af disse svarer een frihedsgrad (hver af dem lægger eet bånd på de 9 observationer).

Vi kan beskrive den totale variation i de 9 y-værdier ved beregning af en SAK med 8 frihedsgrader, dersom vi ser bort fra j's afhængighed af de to faktorer. Vi må derfor, hvis vi holder os til indbyrdes ortogonale sammenligninger, hvor der til hver svarer additive SAK-komponenter med een frihedsgrad, netop kunne formulere otte uafhængige sammenligninger, der udtrykker den samlede information i de ni y-værdier.

Det viser sig, at hvis vi her starter med de sammenligninger, vi kender fra regressionsanalysen, nemlig de Z-koefficienter, der direkte benyttes ved beregning af lineaer effekt, kvadrerer koefficienterne og regulerer deres sum til nul, som det senere forklares mere detailleret, og af disse danner nye koefficientsæt ved en regneregel, som kaldes direkte vektormultiplikation, ifølge hvilken to vektorer multipliceres ved almindelig multiplikation af sammenhørende koefficienter( altså en anden regneregel end den, der giver det før nævnte skalære vektorprodukt), vil man netop få otte indbyrdes ortogonale vektorer. Det viser sig tillige, at uanset hvorledes man kombinerer disse parvis ved hjælp af den nævnte regneregel, vil en af de allerede givne otte vektorer fremkomme påny. Disse vektorer udgør m. h. t. denne regneregel en såkaldt lukket gruppe. Vektorerne (koefficientsættene) bliver som følger:

Side 182

Fodtegn ij

Det fremgår umiddelbart, at disse otte koefficientsæt er sammenligninger, og at direkte vektormultiplikation giver de samme sæt påny; heraf fremgår også, at de alle parvis er ortogonale. Tillige fremgår det heraf, hvorfor det i definitionen af en sammenligning krævedes, at koefficientsummen skulle være nul.

Man forlanger af en lukket gruppe, at den skal indeholde et enhedselement, d. v. s. i dette tilfælde et koefficientsæt, som ved direkte multiplikation med et andet sæt giver dette uforandret. Et sådant sæt ville i dette tilfælde blive et sæt på ni ettaller. Men dette sæts sum er 9 og ikke nul, og det er derfor ikke nogen sammenligning. Derimod vil man ved at danne det skalære produkt af denne vektor og yij-vektoren få summen af observationerne, og denne sum fastlægger jo y, der er valgt som nulpunkt for Y. Den fuldstændige gruppe på ni vektorer fastlægger altså et nulpunkt og otte sammenligninger i relation til dette nulpunkt.

Z_v og Zw (v = 1,2) er henholdsvis lineær og kvadratisk effekt af de to faktorer. Koefficientsættene Zw fremkommer som følger: kvadrering af de tilsvarende koefficienter i Zv: —1, 0, 1 giver 1, 0, 1 med summen 2 og middeltallet 2 f3. Subtraktion af 2 f3 fra hver koefficient (hvorved summen, som den skal, reguleres til nul) giver 1 f3, —2 f3, 1 f3 og multiplikation med 3 giver endelig 1, —2, 1. Denne sidste multiplikation er ikke væsentlig, men giver bekvemme tal, ikke blot for Zw selv, men også for de vektorer, hvor Zw indgår som den ene faktor i den direkte vektormultiplikation. Zv og Zw er de ortogonale polynomier for n = 3. Der henvises iøvrigt til tabeller over ortogonale polynomier og det tilsvarende textafsnit i (6).

De effekter, der beregnes ved benyttelse af de fire sammenligninger
tilhøjre i skemaet, hvori begge faktorer indgår, kaldes samspil.

Side 183

6. Exempel. Analyse af forsøgsresultaterne.

Vi betragter et exempel på et 2222 faktorforsøg.

I en kemisk produktionsproces har man varieret faktorerne reaktionstid og temperatur.
I en enkelt forsøgsserie har man følgende faktorkombinationer og tilsvarende konstaterede

SAK af y-værdierne repræsenterer i dette forsøg tre frihedsgrader, hvortil svarer to
lineære effekter og eet samspil.

I første omgang specificerer vi regressionsligningen

Vi finder da

d. v. s.

og ved indsætning af de relevante Zj- og Z2-værdier heri fås de beregnede udbytter
i anden kolonne i tabellen ovenfor.

Vi kan nu opspalte den totale kvadratafvigelsessum i overensstemmelse med formlen
i afsnit 4. Denne opspaltning kan fx. opstilles i en tabel som følgende:

Skøn over o2o² betegnes s2 og beregnes af SAK ff. I det foreliggende exempel er sondringen mellem SAK og s2s² derfor irrelevant, men i reglen vil man i en realistisk regressionsanalyse naturligvis have flere end een frihedsgrad svarende til variation om linjen.

Vi må nu diskutere spørgsmålet, hvorledes man vurderer de fundne resultater i relation
til en model, man har formuleret som udgangshypotese.

Side 184

Regressionsmodellen udtrykker Y som en lineær funktion af to faktorer. Det kunne
tænkes, at disse faktorer var irrelevante for størrelsen af Y. I så fald kunne man godkende
den såkaldte nulhypotese, der, hvis Y er normalfordelt, betyder, at

d. v. s. at observationerne kunne karakteriseres som tilfældigt varierende med s2s² — 157, idet M (s²) = 02.o². De tre komponenter i SAK er faktisk 144, 324 og 4, og hvis forskellen mellem disse kun var tilfældig, d. v. s. at R og T i sidste kolonne i skemaet var lig nul, er kvotienterne

størrelser, der varierer som den stokastiske variabel F, forholdet mellem to uafhængige skøn over samme o2o² i en normalfordeling. Store værdier af F, hvis middelværdi ligger nær een, forekommer med ringe sandsynlighed. Man fastsætter da et i princippet vilkårligt signifikansniveau for sandsynligheden og afleder heraf en signifikans grænse for F. Overskrides denne, anses nulhypotesen modbevist, d. v. s. at B^ eller 82,B₂, eventuelt begge, afviger signifikant fra nul. Den benyttede opspaltning af SAK, med tilhørende signifikanstest af den nævnte type, kaldes variansanalyse.

Kvotienterne, der benyttes i F-testet, er generelt

hvor SK% er kvadratsummen af Z-værdierne og s2s2 er restvariansen (her = 4). Uddrager
man kvadratroden af dette udtryk, får man

hvor størrelsen i nævneren undertiden kaldes middelfejlen på regressionskoefficienten. På grundlag af denne kvotient og kan man i stedet for F-testet udføre et t-test. Mere generelt kan man jævnføre #j med tilsvarende hypotetiske værdier f?,ved teststørrelserne (S_f — fti)/(s/V SK_Z) , hvor nulhypotesen blot giver et specialtilfælde. Anvendelsen af er her naturlig; F-testet har sit anvendelsesområde, hvor der er flere end een frihedsgrad i tælleren (her er 2-testet ikke defineret). Begge disse fordelinger må tabelleres under hensyntagen til antal frihedsgrader; kun under hensyntagen til nævnerens antal. Vi finder her for f = 1, at tilfældig variation kan give en t-værdi på 6 (B^) eller derover i 5 % af samtlige tilfælde, en t-værdi på 9 (B₂) eller derover i ca. 3% % af samtlige tilfælde. (7).

Det er naturligt, at to faktorers virkninger skal være meget kraftige for at de skal
kunne påvises i et materiale på kun fire observationer.

Da disse fire observationer netop svarer til de fire faktorkombinationer, der kan dannes af to faktorer i hver to niveauer, stemmer forsøgsstrukturen overens med faktorforsøgets, og vi kan derfor opfatte opspaltningen af SAK i tre komponenter som svarende til de tre sammenligninger, der kan formuleres i et sådant forsøg. Ud fra denne opfattelse er den tredje komponent ikke længere en rest, svarende til S (y—y)², men den kontrast der svarer til samspillet Zl2.Z₁₂. Denne kan vi udtrykke ved koefficient B^, bestemt ved

Den komponent i SAK, som før udtrykte variationen omkring linjen, beregnes nu
explicit af

Side 185

Vi kan skrive dette resultat af faktorforsøget som en regressionsligning

men vi har da ingen mulighed for hypoteseprøvning, medmindre vi gentager de fire
faktorkombinationer og opfatter divergensen mellem dobbeltbestemmelser som udtryk
for forsøgsfejl.

For at et givet sæt observationer kan analyseres som et faktorforsøg, må det indeholde alle de mulige faktorkombinationer lige ofte (eventuelt en hensigtsmæssigt valgt del af kombinationerne, cf. den senere omtale af et ukomplet faktorforsøg). Modellen kan også formuleres som en regressionsmodel, hvilket i reglen vil være at anbefale. Derimod kan ikke ethvert materiale, som tillader gennemførelse af en regressionsanalyse, tillige analyseres som et faktorforsøg.

7. Udbyttet som funktion af flere variable.

I afsnit 3 introduceredes det faldende udbyttes lov i relation til en
partiel produktionsfunktion

Er optimum bestemt ved totaludbyttets maximum, kan vi tilpasse et polynomium, differentiere dette, sætte differentialkvotienten lig nul og således bestemme dette maximum. Har hele produktionsfunktionens forløb interesse, er dette en rimelig fremgangsmåde, men er man kun interesseret i at finde optimum, er det mere praktisk at udføre sekventielle forsøg: man sammenligner udbyttet for to #-vær dier; viser der sig en stigning i y ved at øge x, slutter man af det faldende udbyttes lov, at maximum må ligge ved en endnu højere x-værdi, hvorfor man øger x endnu mere o. s. fr., indtil der viser sig en stagnation i udbyttet. Proceduren bliver naturligvis omvendt, hvis man i første omgange konstaterer en negativ sammenhæng mellem x og y.

Vi betragter nu udbyttet som afhængigt af to faktorer,

Som regel må en sådan funktion naturligvis stadig opfattes som partiel,
men vi kan her for argumentets skyld tænke os, at der i det hele kun er
to faktorer, der influerer på udbyttet.

Det viser sig nu, som det lettest ses af de grafiske fremstillinger i fig. 3 og 4, at det ikke er tilstrækkeligt til entydigt at fastlægge produktionsfladens form, at vi forudsætter gyldigheden af det faldende udbyttes lov for begge de mulige partielle produktionsfunktioner

Side 186

I fig. 3 ser man fire forskellige produktionsflader, der alle er forenelige
med det faldende udbyttes lov for de projicerede partielle funktioners

Fig. 3

I fig. 4 fremstilles de samme flader ved en anden fremstillingsteknik,
nemlig ved iso-udbyttekurver. De enkelte figurer i fig 3 og 4 svarer sammen
i overensstemmelse med de vedføjede bogstaver.

Box's problemstilling går i virkeligheden ud på at finde rationelle metoder til orientering på og bevægelse i sådanne produktionsflader, som naturligvis i det generelle tilfælde kan blive endnu mere komplicerede

8. Fortolkningen af samspil i faktor forsøg.

Inden vi går nærmere ind på Box's metodik, er der behov for en kort
omtale af, hvorledes samspil i faktorforsøg fortolkes.

Som nævnt i slutningen af afsnit 5 kaldes kontraster baseret på sammenligninger,hvis
koefficienter dannes ved multiplikation af koefficienteri

Side 187

Fig. 4.

terisammenligninger, der refererer til t(3 eller flere faktorer, for samspil(underforstået
mellem de pågældende faktorer).

Det er vigtigt at gøre sig klart, at når der forekommer et samspil af signifikant størrelse, får dette konsekvenser også for fortolkningen af de såkaldte direkte virkninger eller gennemsnitsvirkninger af de enkelte faktorer betragtet isoleret.

Det er lettest at illustrere dette ved to exempler på et 2222 faktorforsøg,
et hvor der ikke forekommer samspil (cf. fig. 5) og et, hvor der forekommer
samspil (cf. fig. 6).

Fig. 6.

Fig. 5.

Side 188

Punkterne i figurerne markerer de fire faktorkombinationer i de to tilfælde, og fremstillingsteknikken er iøvrigt den samme som i fig. 4. Forsøgsresultaterne og de fundne kontraster kan angives som i følgende tabel:

Vi bemærker altså, at de direkte virkninger er de samme i de to til— fældt, medens man af figurerne ser, at der er den afgørende forskel, at i fig. 5 kan faktorvirkningerne realiseres uafhængigt af hinanden, i fig. 6 vil variation af en faktor alene intet merudbytte give. Samspilvirkningen markerer forskellen på de to tilfælde.

Når vi kommer til den nøjagtige bestemmelse af et maximum m. h. t.
mere end een faktor, er den enkleste forsøgsstruktur, der kan anvendes,
det i afsnit 5 omtalte 32-faktorforsøg.32-faktorforsøg.

Vi skal nu diskutere den geometriske fortolkning af de fire samspil
i et sådant forsøg.

Vi indfører først nogle mere suggestive betegnelser end de i afsnit 5
benyttede, idet

Zl2 kaldes (lineær) X (lineær), forkortet LL,

Z122 kaldes (lineær) X (kvadratisk), kort LK,

Zll2 kaldes (kvadratisk) X (lineær), kort KL,

Z1122 kaldes (kvadratisk) X (kvadratisk), kort KK.

Forudsat de fire samspil er reale, d. v. s. ikke blot de beregnede, men
også de sande værdier afviger fra nul, hvad er da deres fortolkning?

Fig. 7 viser forskellen mellem et tilfælde, hvor IX er henholdsvis
lig med eller forskellig fra nul.

Side 189

Fig. 7.

En real LL-effekt betyder, at den lineære hældningskoefficient for en faktor er forskellig for forskelligt niveau af den anden faktor. I stedet for at betragte udbyttet som afhængig variabel, kan man betragte den lineære hældningskoefficient som afhængig variabel, og varierer den igen lineært m. h. t. den anden faktor, udtrykkes dette ved LL. Varierer den derimod med den anden faktor på en måde, der må udtrykkes ved en kvadratisk kvotient, bliver LK real. Symmetrien i LK og KL viser, at det er ækvivalent, at en faktors lineære koefficient varierer kvadratisk m. h. t. den anden faktor, eller at den anden faktors kvadratiske koefficient varierer lineært m. h. t. den første faktor. At den kvadratiske koefficient varierer kvadratisk udtrykkes ved KK.

9. Bestemmelse af den stejleste stigningsretning. Exempel.

Det forudsættes nu, at man befinder sig i en sådan situation, at den hidtil benyttede faktorkonstellation i en given produktion giver et udbytte,der ligger relativt langt fra optimum, cf. punktet P i fig. 4a. Denne forudsætning betyder, at en realisering af en anden faktorkonstellationi reglen vil medføre forholdsvis store ændringer i udbyttet. Anlægger man derfor et faktorforsøg i omegnen af punktet P (fx. således,at dette er nulpunkt for de transformerede variable Zi), vil en analyseaf

Side 190

lyseafforsøgsresultaterne formodentlig vise, at de lineære effekter er forholdsvis store set i relation til effekter af højere orden, d. v. s. at specifikationsfejl ved benyttelse af en lineær model vil få ringe praktiskbetydning. Omvendt vil naturligvis et sådant forsøgsresultat føre til den slutning, at man befinder sig langt fra optimum, og man vil være interesseret i ved en række sukcessive (sekventielle) forsøg at bestemme et sådant optimum ved så få enkeltforsøg som muligt.

Har man af forsøgsresultaterne bestemt en lineær regressionsligning

og akcepteret denne som en fyldestgørende repræsentation af produkttionsfladen i omegnen af P, betyder dette for positive Bi (i = 1,2), at det vil kunne betale sig at øge både Z\ og Z2, idet en forøgelse af hver faktor med en enhed øger udbyttet med henholdsvis beløbene Jsi og 82. I det område, hvor regressionslinjen er en fyldestgørende approximation, kan man opretholde et konstant udbytte, To, for alle kombinationer Zi Z2, der tilfredsstiller

d. v. s. (idet vi sætter Yo = 0, d. v. s. y = y), at man kan bevæge sig
langs linjen

uden at der sker ændringer i udbyttet. Omvendt betyder bevægelse ad
den på denne linje vinkelrette (den første linjes normal)

maximal stigning i udbyttet for en given vejlængde i Zi, Z2-koordinatsystemet.
Dette er den såkaldte stejleste stigningsretning (cf. pilen i
fig. 4a).

Realiserer man nu sukcessivt en række faktorkombinationer på denne linje (følger pilen i fig. 4a), vil man konstatere nogle faktiske udbytter, Y, som så længe den beregnede regressionsfunktion er en god approximation til den virkelige produktionsfunktion Y' vil ligge nær de af funktionen beregnede udbytter, Y.

Før eller siden vil differensen (Y —Y) begynde at vokse numerisk som følge af approximationens svigten. Man må da anlægge et nyt forsøgtil undersøgelse af, om der blot er tale om en ændring af stigningstakten,eller om man er kommet til et stationært område af en af de i fig. 3-4 viste typer. Forekommer det sidste alternativ plausibelt, bør man i det nye forsøg anvende en forsøgsplan, der enten tillader, eller kan udbygges, så den tillader, beregning af i det mindste kvadratiske koefficienter,så

Side 191

ficienter,såfladens form kan vurderes og et eventuelt maximum lokaliseres.Finder man et saddelpunkt (cf. fig. 3b), frembyder der sig nye stigningsretninger (cf. bemærkningerne i det afsluttende afsnit). Man taler her om kortlægning af et stationært område.

Vi giver nu et exempel på bestemmelse af maximal stigningsretning,
konstrueret på basis af et amerikansk exempel.

Produktet er her en gasart, der indeholder et uønsket stof, A, som kan fjernes delvis, når man lader gassen strømme gennem en beholder, der samtidig gennemstrømmes af vand og damp, således at en del af A følger med vandet og dampen. De variable i forsøget er gennemstrømnmgshastighederne, gassens x±, vandets x2x₂ og dampens x 3;x₃; udbyttet y angives som den procentdel af A, der fjernes.

Da man kun kan udføre fire enkeltforsøg om dagen og må regne med en vis variation fra dag til dag, kan man ikke realisere alle de otte kombinationer i et 23-faktorforsøg.23-faktorforsøg. Men under forudsætning af, at man kan nøjes med en model med lineære effekter og uden samspil, d. v. s. modellen

kan man også klare sig med fire observationer (omend de fundne resultater da ikke kan signifikanstestes). Det er imidlertid praktisk at vælge fire faktorkombinationer, der svarer til et halvt faktorforsøg. Viser der sig siden behov for en mere udførlig model, kan man realisere den anden halvdel af f'aktorforsøget en anden dag og på grundlag heraf udbygge modellen (cf. herom afsnit 10).

Såvel forsøgsplan som -resultater fremgår af følgende tabel:

Den kraftige variation i y-værdierne kunne tyde på, at forsøget snarere er et øvelsesmateriale
til indøvning af Box's metode end et alvorligt ment forsøg i den amerikanske
virksomhed, hvorfra materialet stammer.

Man finder y = 50.5 og følgende skøn over de øvrige parametre:

d. v. s.

At man i det foreliggende tilfælde ikke er i stand til at skønne over den tilfældige
variation af forsøget selv og at modellen tillige kan være for primitiv (indeholde specifikationsfejl),er
ikke så alvorligt, når man følger Box's sekventielle teknik: vi følger

Side 192

Fig. 8.

nemlig nu den stejleste stigningsretning og sammenligner stadig de for punkter på denne linje registrerede faktiske udbytter med de af ligningen beregnede. Så længe der er tilfredsstillende overensstemmelse, fortsætter man i den anviste retning. Vi skal altså nu formindske Zj og forøge Z2Z₂ og Z3Z₃ proportionalt med de fundne 5,-. De realiseredepunkter på stigningslinjen og dertil hørende faktiske og beregnede udbytter kan fx. være som i følgende tabel (resten af exemplet er konstrueret):

Side 193

Den fundne ligning fastlægger en simultan variation af x_it x2x₂ og *g, og man kan derfor determinere en given vejlængde ved hver af disse for sig; man har her valgt at benytte a^-enheder. Man kan derefter give en grafisk fremstilling, der viser udbyttevariationen i relation til *j, men hvor der altså i virkeligheden er tale om en variation af tre faktorer samtidig i et givet mængdeforhold. En sådan grafisk fremstilling ses i fig. 8.

Bortset fra, at det er en erfaringssag, om Y i det hele taget kan extrapoleres, er det
i dette tilfælde klart, at da Y kan overskride 100 %, må det faktiske udbytte Y efterhånden,
som også fig. 8 antyder, komme til at ligge under linjen Y.

10. Alias-relationer. Fortolkning af relativt små faktorvirkninger.

Som nævnt realiserede man i exemplet i afsnit 9 kun halvdelen af de kombinationer, der hører til et komplet faktorforsøg. I den følgende tabel anføres den lukkede gruppe af sammenligninger for det komplette 23-faktorforsøg:23-faktorforsøg:

I det omtalte exempel havde man kun realiseret kombinationerne svarende til tabellens øverste halvdel. I et sådant halvt faktorforsøg optræder virkningerne i det komplette forsøg parvis, som hinandens alias, d. v. s. man kan ikke af forsøgsstrakturen selv skelne mellem de pågældende to virkninger, cf. tabellen:

den direkte virkning af faktor 1 er alias samspil mellem faktor 2 & 3
den direkte virkning af faktor 2 er alias samspil mellem faktor 1 & 3
den direkte virkning af faktor 3 er alias samspil mellem faktor 1 & 2

Hvad det tredobbelte samspil angår, kan det her slet ikke beregnes,
hvilket også kan formuleres således, at det har enhedselementet (summen
af observationerne) som alias.

Betragter man den nederste halvdel af tabellen isoleret, ser man, at
disse kombinationer ville have givet de samme alias-relationer. Koefficienterne
skifter ganske vist fortegn, men grupperingen er uændret.

Side 194

Realiserer man imidlertid kombinationerne svarende til øverste halvdel een dag, nederste halvdel en anden dag, vil netop på grund af fortegnsskiftet de virkninger, der i et halvt forsøg optræder som hinandens alias, kunne adskilles, d. v. s. at de direkte virkninger og de parvise samspil kan beregnes explicit. Tør man gå ud fra, at dag-til-dag-variationen er übetydelig, kan forskellen mellem de to dages observationer tages som udtryk for det tredobbelte samspil, men generelt siger man, at dag-til-dag-variationen og det tredobbelte samspil er konfunderede (sammenblandede).

Under diskussionen i afsnit 8 om samspillets fortolkning blev det
nævnt, at man ikke af faktorernes direkte virkninger alene kan slutte,
om disse virkninger er indbyrdes uafhængige eller betingede af samspil.

Dette er yderligere motivering for ved benyttelse af en regressionsmodel som i afsnit 9 at følge en stigningsretning, som betyder simultan variation af faktorerne. Undertiden kan man på rent teknisk grundlag med god sikkerhed postulere, at samspil mellem faktorer er udelukket, og modellen i afsnit 9 er da uden videre gyldig, også m. h. t. variation af en faktor ad gangen. Regressionskoefficienternes størrelse indicerer størrelsen af de direkte virkninger.

Er den direkte virkning af en af faktorerne lille i forhold til virkningerne
af de andre, kan dette have tre mulige årsager:

1. man er nær et betinget maximum m. h. t. den pågældende faktor,

2. faktoren er irrelevant for udbyttets størrelse,

3. enheden for denne faktor har været valgt uforholdsmæssig lille i
sammenligning med enhederne for de andre faktorer, så at virkningen
af denne grund bliver relativt lille.

Ved gentagelse af forsøget vil valg af ny basis kunne differentiere
mellem 1. og 2., medens en samtidig ændring af faktorenheden kan
belyse, om årsagen har været 3.

I exemplet viser faktor 3 en meget lille virkning.

11. Kortlægning af stationært område. Exempel.

I exemplet i afsnit 9 vil man formode, at totaludbyttefunktionen er af version I, og i så fald er der ingen mening i at søge et maximum. Det er derimod nyttigt at kende produktionsfunktionen som grundlag for en tilrettelægning af produktionen ud fra økonomiske synspunkter. I exemplet vil man fx. forestille sig, at formindskelse af gassens gennemstrømningshastighed må fordyre produktionen.

Side 195

Men selv i tilfælde, hvor udbyttefunktionen er af version 11, kan'man ikke uden videre slutte fra en affladning af udbyttet, således som den viser sig i fig. 8, til at man er i nærheden af et maximum, idet fig. 3-4 viser, at der er flere mulige situationer. Når udbyttet stagnerer, må man derfor anlægge et nyt forsøg med en forsøgsplan, der i det mindste gør det muligt at beregne kvadratiske virkninger. De enkelte faktorer må følgelig varieres i mindst tre niveauer.

I mangel af bedre exempel samt for lettere at kunne knytte fremstillingen til det foregående, tænker vi os nu, at observationerne i exemplet i afsnit 9 repræsenterer et andet problem, hvor udbyttefunktionen er af version 11, og hvor det følgelig kan være rimeligt at søge efter et maximum.

For at kunne give enkle geometriske illustrationer forudsætter vi desuden, at man er kommet til det resultat, at faktor nr. 3 er irrelevant. Vi kan da anlægge et 32-faktor3²-faktor forsøg med ni kombinationer. Af nemhedshensyn forudsætter vi tillige, at der nu ikke mere gælder nogen restriktion til fire observationer daglig.

Fuld udnyttelse af alle otte frihedsgrader giver modellen

Det forudsættes imidlertid, at de sande værdier af koefficienterne B^2, °S
BBU22 er nul> så at de hertil svarende kontraster blot giver skøn over forsøgsfejlen.

Som basispunkt for det nye forsøg vælges »i = 20 og x2x2 = 3.5, og i betragtning af de
stærke udsving i resultaterne i det foregående forsøg vælges noget mindre enheder
for faktorerne end hidtil. Forsøgsplan og -resultater fremgår af følgende tabel:

Heraf fås

tilsvarende S-4£-komponenter 6 5,2 = 0.0337 18 Æ_n 2n² = 12.9880 6 BB₂ ² = 1.8816 18 B 2B₂₂ ² = 4.8257 4 #₁₂ ² = 0.1722 12 5115₁₁₂ ² = 0.7957 12 £₁₂₂2 = 1-7101 36 fi_I]22 ² = 3.0334 SAK ialt 25.4404

Side 196

Som skøn over o2o2 har vi følgelig

Dersom vi ville støtte os på signifikanstests, kunne der være tegn til, at modellen kunne reduceres yderligere, men dette er kun en hypotese, inspireret af resultaterne. Fastholder vi den model med fem parametre, som var vort udgangspunkt, angiver de negative Bjj-koefficienter, at et maximum er indkredset. I fig. 9 er indtegnet de af

beregnede iso-udbyttekurver y = Y+ 80.96 = 80 og 82.

Disse kurver er ellipser.

Fig. 9.

Ved differentation af Y kan man bestemme de værdier af Zt og heraf xit der svarer
til maximum. Det viser sig, at det fundne Y indicerer som optimal faktorkombination

for hvilken konstellation y = 83.75.

Side 197

Med resultatet af den ovenfor skitserede variansanalyse in mente vil man næppe have übetinget tillid til, at man hermed virkelig har bestemt det reelle maximum og man ville sandsynligvis ved indsamling af flere observationer tilstræbe en nøjagtigere bestemmelse. Det bør indskærpes, at dette er den rigtige fremgangsmåde fremfor et forsøg på ved omformuleringer af det foreliggende materiale at få et klarere resultat frem (9).

12. Kommentarer til Box's metode.

Der er i den her givne, ret grove redegørelse for Box's metode ikke meget nyt i selve de grundelementer, metoden er bygget op af, så at det nye ligger i den måde, hvorpå problemstilling og -løsning er sammenkædet. Man kan her atter sige, at det mest originale i metoden ligger i det sekventielle princip, som er forbundet med beregningen af og bevægelsen ad den stejleste stigningsretning. Hvad kortlægningen af et stationært område angår, bliver denne jo groft sagt udført som en variant af almindelig multipel regressionsanalyse.

Box har i de senere år arbejdet med mere specielle forsøgsplaner, såkaldt roterbare planer, som bevarer de af faktorforsøgenes egenskaber, som er værdifulde i forbindelse med hans problemstilling, og søger at imødegå nogle af manglerne (fx. at middelfejlen på Y varierer ved variation af faktorkonstellationerne) (10). Dette er dog mere statistisk-teoretiske detaljer, som der ikke er grund til at gå ind på her.

I de hidtil omtalte, rent tekniske problemstillinger er det et vigtigt problem at skønne godt over faktorernes relative betydning, så at regressionskoefficienterne bliver af samme størrelsesorden (cf. slutningen af afsnit 10). Såfremt man rådede over en ideal estimationsmetode, d. v. s. at man kunne bestemme de sande værdier fii, fin, ... Pa, .... etc., kunne man også bestemme den rigtige (stejleste) stigningsretning fejlfrit, og i så fald var koefficienternes størrelsesorden ligegyldig, eller, anderledes udtrykt, man tog netop hensyn til forskelle heri ved at følge denne stigningsretning. Vanskeligheden opstår som følge af, at middelfejlen på koefficienterne er konstant, samtidig med at virkningens størrelse er afhængig af, om man har varieret på en måde, der svarer til den pågældende faktors reale betydning.

For en økonom må det være nærliggende at interessere sig for mulighedenaf at benytte Box's metode ikke blot i den hidtil forudsatte, temmeligrestriktivt formulerede, tekniske problemstilling, men også i en model, der tager hensyn til omkostninger og udbytteværdi. Ved hensyntagentil

Side 198

tagentilfaktorpriserne vil vanskeligheder ved valg af faktorenheder være overvundet ligesom angivelse af udbyttets størrelse ved dets værdi kan korrigere for sådanne kvalitative ændringer i produktet, som ofte vil ledsage de kvantitative variationer, der eventuelt forårsages af faktorvariationerne.Hermed menes naturligvis ikke, at en sådan hensyntagenkan klare de tekniske effektivitetsproblemer: her er omkostningerne jo netop invariante ved variation af de pågældende variable.

I den økonomiske produktionsteori, hvor det faldendes udbyttes lov omformuleres gennem indførelse af faktorpriser og produktpriser, får man kommensurable monetære enheder på begge axer i fig. 1. Grænseudbyttet kaldes da grænseproduktiviteten. Optimumspunktet er nu fastlagt ved, at størrelsen af een variabel faktorindsats tilpasses, så at faktorprisen pr. faktorenhed er lig grænseproduktiviteten (idet den sidste yderligere må være faldende i skæringspunktet). I von Thiinens kartoffeloptagningsexempel vil man da netop benytte så mange arbejdstimer, at værdien af de kartofler, der optages i den sidst indsatte arbejdstime, svarer til timelønnen.

I det foregående er betydningen af at erindre, at totaludbyttekurven i en fremstilling som fig. 1 er en niveaukurve, fremhævet flere gange. Det samme gælder naturligvis grænseudbytte- og grænseproduktivitetskurverne. Frisch (cf. (2)) gør opmærksom på, at man ikke kan finde et optimumspunkt ved tilpasning af faktorerne een ad gangen ifølge ovenstående regel. Varierer man, efter at have bestemt optimumspunktet for een faktor, derefter en anden til dennes optimumspunkt, er den første ikke længere optimalt tilpasset.

Forudsætningen for tilpasningen via faktorpris - grænseproduktivitet er, at de øvrige faktorer skal holdes fast på et givet niveau. Situationen i praksis vil altid være den, at man kan variere flere end een faktor, men ikke alle. Problemet er da at variere de beherskede faktorer simultant på en sådan måde, at det omtalte tilpasningsprincip realiseres for en vis faktorkombination af disse, fx. svarende til enheder på abscisseaksen i fig. 8, hvor mængden af tre faktorer i et givet indbyrdes mængdeforhold varieres. Forudsat den beregnede stejleste stigningsretning er den rigtige (og den benyttede model tilstrækkelig specificeret), findes optimum, hvor prisen for den sidst indsatte enhed af denne komplexe faktor netop betales af udbyttestigningen. En forudsætning for dette argument er naturligvis ifølge det foregående, at kun de tre pågældende faktorer er variable i den foreliggende situation.

Den principielle løsning på det økonomiske tilpasningsproblem er derfor,at
man arbejder med faktorforsøg i alle de variable faktorer, lad

Side 199

der fx. være n, og derefter finder den stejleste stigningsretning i et ra-dimensionalt rum. Man bevæger sig dernæst ad denne, med eventuelle revisioner deraf, om fornødent, indtil den nævnte lighed mellem prisen på faktorindsats og grænseproduktivitet realiseres. I praksis kan et sådant,måske meget stort, faktorforsøg opbygges sukcessivt af mindre forsøg,i hvilke kun en del faktorer varieres, men med omhyggelig registreringaf niveauerne for de ikke-varierede faktorer.

I praksis vil man vel i reglen nærme sig optimum gennem stigende faktorindsatser (svarende til udgangspunkt P i fig. 4a), og den relevante stigningsretning vil altid udgå fra koordinatsystemets nederste venstre hjørne, cf. følgende fig. 10, hvor den såkaldte expansionsvej er indtegnet,bestemt ved isoproduktkurvernes røringspunkter med de rette linjer med hældning — 1, der angiver konstant faktorindsats i kr. Det kan vel tænkes, at man ved formindsket indsats af en faktor opnår merudbytte,nemlig hvis P ligger nordøst for totaludbyttets maximum, men

Fig. 10.

Side 200

optimum er entydigt fastlagt, idet det kun nås ved bevægelse mod nordøsti

I fig. 10 betyder indsatsforøgelsen fra 30 til 40 kr. netop en tilsvarende udbytteforøgelse, medens de næste 10 kr.'s indsats kun betales med 5. Mere detaljeret kortlægning vil fastlægge optimum helt præcist, fx. som antydet ved knap 20 kr.'s indsats af hver faktor. I den økonomisk formulerede problemstilling er det ikke nødvendigt at forudsætte totaludbyttekurve af version 11, idet grænseproduktiviteten er faldende for begge versioner. De i afsnit 6 omtalte signifikanstests må her omformuleres, idet problemet ikke mere er, om stigningen er nul, men om den svarer til forøgelsen af faktorindsatsen.

Uanset om man arbejder med teknisk eller økonomisk formulerede problemstillinger, forudsætter Box's metode, at produktfladen ikke har for bratte toppe og dybe dale, idet man så vil kunne overse et lokalt maximum. Allerede saddelfladen (fig. 3-4b) volder vanskeligheder, idet man ikke kan gå ud fra, at den lokalt stejleste stigning vil føre til det højeste af to toppunkter (bedste af to optima). Denne vanskelighed er imidlertid endnu større, når man arbejder med ikke-sekventielle metoder, hvor antal punkter i et enkelt forsøg må spredes over et langt større område. Når forudsætningerne for anvendelse af Box-metoden er til stede, er den givetvis anbefalelsesværdig.

Henvisninger:

(1) Davies (ed.): The Design & Analysis of Industrial Experiments, London & Edinburgh
1956, kapitel 11.
Artikler af Box og Youle i „Biometrics" årg. 1954-55.

(2) Ragnar Frisch: Innledning til produksjonsteorien, dupl. Oslo 1946.

(3) fx. A. Hald: Statistical Theory with Engineering Applications, New York 1952.

(4) H. C. Plessings artikler om landbrugets udbyttelov, Nordisk Tidsskrift for teknisk
Økonomi, lbnr. 38 (1951) og 39 (1953).

(5) Andersen, Bohr & Petersen: Matematisk Analyse, bd. 1, side 81 ff.

(6) Fisher & Yates: Statistical Tables for Biological, Agricultural & Medical Research,
London & Edinburgh 1953.

(7) Cf. fx. kapitel 14-15 hos Hald (cf. (3) ovenfor)

(8) Cf. Davies side 539, fig. 11.8 (cf. (1) ovenfor).

(9) Cf. Erik Harsaae: Nogle kommentarer til en teknisk statistisk disputats, Nordisk
Tidsskrift for Industriel Statistik, bd. 4, 1959, side 119.

(10) G. E. P. Box & J. S. Hunter: Multi-Factor Experimental Designs for Exploring
Response Surfaces, Annals of Mathematical Statistics, vol. 28, 1957, side 195.

Ledelse og Erhvervsøkonomi/Handelsvidenskabeligt Tidsskrift/Erhvervsøkonomisk Tidsskrift, Bind 25 (1961)