Nationaløkonomisk Tidsskrift, Bind 118 (1980)

Diskriminantanalysen som mikroøkonomisk problem

Institut for Statistik og Datalogi, Hundclsliojskolen i Århus

Kai Kristensen

Resumé

summary: This article is a continuation of the author's 197%-article in this journal, wherein the cutoff point in discriminant analysis was discussed from a microeconomic point of view. The purpose of the article is threefold: (1 and 2) to discuss the globality and comparative statics of the optimal solution, and (3) to discuss special kinds of utility functions with convenient numerical properties.

1. Indledning

I et tidligere arbejde har forfatteren beskæftiget sig med diskriminantanalysens afskæringsværdi (cut-off point, kritiske karakterværdi) fra en valghandlingsteoretisk synsvinkel (Kristensen, 1978). Formålet hermed var at give et bidrag ti! belysning af et af de mest centrale problemer i forbindelse med den praktiske anvendelse af diskriminantmodellen ved løsning af økonomiske klassifikationsproblemer: beslutningstagerens af, hvilken opdeling af karakterværdierne (værdierne af diskriminantfunktionen) der skal være afgørende for, om et individ skal henføres til den ene eller den anden af de betragtede grupper (f.eks. egnet/uegnet til en bestemt jobtype eller kreditværdig/ikke-kreditværdig). Det blev foreslået at lade denne vurdering tage udgangspunkt i sandsynlighederne for at træffe en korrekt beslutning, som klart må afspejle det præferencemønster, der i sidste ende er afgørende for beslutningstagerens valg. Ved en approksimation af dette præferencemønster vil det herefter være muligt at opnå et udtryk for den karakteropdeling (opdeling af diskriminantfunktionens udfaldsrum), som beslutningstageren anser for at være optimal. Det teoretiske udgangspunkt for en sådan procedure er beslutningstagerens nyttefunktion specificeret i de betingede sandsynligheder for korrekt klassifikation, U(fi\-fi2)i som maksimeres under den af Mahalanobis1 generaliserede afstandsfunktion, 2, givne bibetingelse. Idet <P er standardnormalfordelingsfunktionen, kan dette maksimeringsproblem formuleres som følger:1



1. Det forudsættes, at c+±^. således at ()<fil<\. i=\.2. Hermed bliver Kuhn-Tucker betingelserne for løsning af (1) identiske med førsteordens betingelserne for et klassisk programmeringsproblem. (c = afskæringsværdien).

Side 225

DIVL4947

(1)

hvortil svarer førsteordens betingelsen uul(pl=u2(2(p2 — SU/6A, hvor Uj — SV/Sfij, og ep,
er standardnormaltætheden for den fte population.

Foruden at tjene som baggrund for den praktiske løsning af klassifikationsproblemet en sådan teoretisk beskrivelse af stor værdi for en nærmere analyse af det optimale valg, dets forudsætninger og dets variation med problemets parametre (komparativ statik), der er forhold af stor betydning for den praktiske løsnings anvendelse. Det foreliggende arbejde har derfor til formål at føre den teoretiske analyse et skridt videre med et studium af andenordens betingelserne, en komparativ statisk analyse og et studium af specifikke nyttefunktioner. Studiet af andenordens betingelserne har til formål at afklare, hvilke krav til funktionsform der gives af ønsket om en global løsning af maksimeringsproblemet, medens den komparative statik sigter mod etablering af generelle resultater for d^/dA og cl/./dA i optimum, hvilket svarer til de praktiske konsekvenser for sandsynlighederne for korrekt klassifikation og for informationens grænsenytte af en ændring i antallet og arten af de i analysen indgående variable. Studiet af nyttefunktionsformer er afledt af de i Kristensen (1978) opnåede resultater for afskæringsværdiens beregning. Disse resultater viser, at nyttefunktioner med lineære eller isoelastiske indiffeien^kuivei ei specielt bekvemme fra et beregningsteknisk synspunkt, og det er derfor naturligt at foretage en nærmere klasseafgrænsning af disse funktioner.

2. Betingelserne for et globalt maksimum

Maksimeringsproblemet (1) er illustreret i fig. 1, hvor A og B er eksempler på hhv
bibetingelsens og nyttefunktionens niveaumængder.


DIVL4986

tig. i. Niveaumcengder

Side 226

Det fremgår, at det er en tilstrækkelig betingelse for et strengt globalt maksimum, at begge niveaumængder er konvekse, og mindst en af dem er strengt konveks. (For den strengt konvekse mængde. E, gælder, at når /^,, [112 £- og /.e(0.1). da er /Aix +(1 —/.)/i2 et indre punkt i 3).

For fi's vedkommende svarer konveksitetskravet til et krav om kvasikonkav nyttefunktion, hvilket normalt antages at være opfyldt. Dog er det næppe rimeligt generelt at antage, at B er strengt konveks, da lineære eller stykkevis lineære niveauflader ikke er et utænkeligt fænomen. For /Ts vedkommende er konveksitetskravet opfyldt, hvis bibetingelsen er kvasikonveks, hvilket det efterfølgende har til formål at vise. Mere præcist skal det vises, at mængden


DIVL4968

(2)

hvor G er bibetingelsen, er konveks, hvilket er tilfældet, hvis (tilstrækkelig betingelse):


DIVL4974

(3)


DIVL4978

(4)

Det ses umiddelbart, at (3) er opfyldt, medens (4) kan omskrives til (pi<P2~(P2 l P\ >0- For standardnormaltætheden gælder imidlertid, at q>'(z)= —z(p{z), der ved substitution umiddelbart giver, at (4) er opfyldt for /I>o.2 Det kan yderligere konkluderes, at (2) er strengt konveks for A >0, medens A = 0 resulterer i en konveks, men ikke strengt konveks niveaumængde (lineær niveauflade). Imidlertid repræsenterer =oen situation, hvor diskrimination er umulig, således at dette tilfælde kan lades ude af betragtning.3

Sammenfattende kan det konkluderes, at maksimeringsproblemet (1) under det normale krav til en nyttefunktion (kvasikonkavitet), og forsåvidt der overhovedet eksisterer et diskrimineringsproblem (/!>()), altid vil resultere i en strengt global losning.

3. Komparativ statik

Overvejelser af komparativ statisk natur har til formål at studere den optimale løsnings variation med parameteren /I, hvilket tjener til at sætte beslutningstageren i stand til at vurdere værdien og konsekvensen af yderligere information tilvejebragt ved ændring i A; en ændring (forøgelse), der i praksis finder sted ved inddragelse af yderligere variable i analysen. De for denne vurdering centrale mål er d/./dA og



2. Det erindres, at r, = (c--\A2) Aogz2 =(c+ \A2]2 ] A, således at z2z2 = Z\+ A.

3. Et nærmere studium af bibetingelsen viser, at selv om der er tale om kvasikonveksitet i hele definitionsområdet, så er der kun tale om konveksitet for /i, og /^2^0,5.

Side 227

d/ij/dA, der kan opfattes som hhv. et værdimål - d/./dA beretter om
nytteaccellerationen ved informationsændringer - og et konsekvensmål.

Total differentiation af maksimeringsproblemets førsteordens betingelser og
bibetingelsen er analysens udgangspunkt. Dette leder til følgende matrixligning:


DIVL5000

(5)

hvor (p1 =(— \/(pl — \/(p2), dp = (dfll dfij)1 og /. er grænsenytten af Mahalanobis' A
(Lagrange-multiplikatoren). Endelig er


DIVL5006

W

hvor uij = S2U/t>(iii>[]j, /,_/'= 1,2. Det ses, at det ved løsning af (5) er muligt at tilvejebringe udtryk for de ændringer i optimalkombinationen af de betingede sandsynligheder for korrekt klassifikation, som følger af ændringer i Mahalanobis7 A, ligesom også ændringen i grænsenytten af A fremtræder som et resultat. Udtrykt på elasticitetsform er der her tale om et modstykke til de valghandlingsteoretiske indkomstelasticiteter og til pengenes grænsenyttcflcksibilitet.

Idet matricen på venstresiden af (5) (den bordede Hessematrix) kaldes N, er det
muligt at nå frem til følgende resultat:


DIVL5014

(7)

som indsat i (5) giver:


DIVL5020

(8)


DIVL5024

(9)

hvormed de søgte udtryk er tilvejebragt.

Speciel interesse knytter sig til fortegnet for (9). Apriori vil man forvente aftagende grænsenytte for langt de fleste afskæringsværdier, men man kan dog ikke se bort fra muligheden af voksende grænsenytte, specielt i situationer med ekstremt beliggende afskæringsværdi. Som det fremgår af (9) er d/./dA en kvadratisk form i H"1. Heraf følger, at det er en tilstrækkelig betingelse for aftagende grænsenytte, at H~l og deimcd H er negativ delinit. Betingelsen er imidlertid »alt tor tilstrækkelig«, hvilket fremgår ved udskrivning af (9). Man får:


DIVL5032

(\o\

Side 228

Da U{{i\,li2) ex def. er kvasikonkav, er c= (ull(p2 + u22(p]-2u22(p]-2ui2(pl(p2)t^Q- Endvidere
er /.A >0, hvorfor nævneren i (10) altid er negativ. Tælleren ses at være lig \H\(p\<p\, og
(10) kan derfor omskrives til


DIVL5038

(H)

hvoraf det nu fremgår, at fortegnet alene bestemmes af \H\. Man får:


DIVL5044

(12)

Når kravet |W|>o er svagere end kravet om negativ definithed hos H for opnåelse af
aftagende grænsenytte, er årsagen den, at sidstnævnte ikke blot kræver |//|>o, men
også negative diagonalelementer.

I moderne efterspørgselsteori er det vanligt at antage, at nyttefunktionen er konkav, hvilket indebærer en for nyttefunktionen negativ semidefinit Hessematrix. Antagelsen kan opfattes som en moderne udlægning af Gossen's lov, i henhold til hvilken ethvert godes grænsenytte er en aftagende funktion af mængden af dette gode - dvs. Ujj^O for alle i. Som tidligere anført er antagelsen ikke nødvendig for opnåelse af et strengt globalt maksimum, men den er på den anden side i mange situationer rimeiig.

Indføres antagelsen om konkavitet i nærværende analyse, vil man se, at det som
hovedregel må antages, at grænsenytten aftager med voksende A. Dette skyldes, at i
det løsningsområde, som må antages at være altdominerende i praksis, nemlig 2
eller c£{ — \A2 \\A2), er bibetingelsen egentlig konveks, hvilket kombineret med
antagelsen om konkav nyttefunktion, idet Lagrange-multiplikatoren er positiv,
medfører konkav Lagrangefunktion. På den anden side indebærer dette, at H bliver
negativ semidefinit, hvoraf resultatet (d/./dA)^O følger. Almindeligvis må det således
antages, at grænsenytten af Mahalanobis'' A er en aftagende funktion af A.

Betragt som et specialtilfælde nyttefunktionen Uifi^(12) =(h+ k(i2, hvor /c>o. For
denne nyttefunktion fås c=ln/c, og iøvrigt bliver


DIVL5056

(13)

således at elasticiteten af A med hensyn til A er lig med produktet af argumenterne i
de normerede tætheder. Heraf følger umiddelbart, at grænsenytten er aftagende i
intervallet (— jA2; jA2), medens den til gengæld er voksende i det øvrige område.

Ændringen i de optimale sandsynligheder for korrekt klassifikation fremgår af (8),
der udmærker sig ved en iøjnefaldende aggregeringsmulighed.4 Det fremgår, at



4. Aggregeringen kan også etableres ved direkte differentiation af bibetingelsen, eftersom A ikke indgår i nyttefunktionen.

Side 229

DIVL5064

(14)

som i udskrevet form indebærer:


DIVL5070

(15)

Det konstateres, at (15) er det umiddelbare modstykke til valghandlingsteoriens Engelaggregering og det heri indeholdte krav om, at det med budgetandelene vejede gennemsnit af Engelelasticiteterne skal være lig 1, og det føles derfor naturligt at benævne (15) Mahalanobis-aggregeringen.

Ved udregning af (8) finder man følgende udtryk for de to afledede


DIVL5078

;Ir\


DIVL5082

(17)

Nævneren i disse udtryk er altid negativ, hvorfor fortegnet bestemmes udelukkende af tælleren. Apriori forventes såvel d^/dA som dfi2/dA at være positive, idet der dog intet er i vejen for, at negative resultater kan tænkes at forekomme i specielle situationer. Af (16) fas:


DIVL5088

(18)

og et helt analogt resultat kan opnås for dfi2/dA

For specialtilfældet U{fix,P2)~Pi +^2 finder man {dfil/dA) = (p1z2/A, hvoraf
fremgår, at ændringen i /?j ved ændringer iA vil være positiv, når o —jA2, og
negativ ellers.

Nyttefunktionen U{fil,fS2) = fil +k[32 kan opfattes som den bag den traditionelle
Bayes' løsning liggende. Denne løsning er meget udbredt i praksis, og der knytter sig
derfor speciel interesse til netop denne løsnings komparative statik.


DIVL5106

Fig. 2. Bay es' losningens komparative statik.

Side 230

Figur 2 samler resultaterne, som er udledt på basis af dette afsnits generelle resultater, men som ligeså godt kunne være udledt med udgangspunkt i en direkte differentiation af sandsynlighedsudtrykkene. Det fremgår, at punkterne — \A2 og \A2 er centrale, eftersom samtlige fortegnsskift finder sted ved disse punkter. Mellem punkterne finder man den »ordinære« løsning, hvor informationens grænsenytte er aftagende, og hvor yderligere information indebærer en for begge populationer voksende sandsynlighed for korrekt klassifikation, medens man i yderområderne finder løsninger, hvor informationen har voksende grænsenytte, og hvor yderligere information fører til favorisering af den mindste af de to sandsynligheder for korrekt klassifikation.

4. Om specielle nyttefunktioner

førsteordens betingelserne finder man


DIVL5116

(19)

hvor c er den optimale afskæringsværdi. Normalt kræver løsning heraf anvendelse af en iterativ procedure, hvilket besværliggør beregningsarbejdet, og det kan derfor være af interesse nærmere at afgrænse den klasse af nyttefunktioner, som fører til en direkte (dvs. iterationsfri) eller næsten direkte løsning af (19).

Hvis iteration helt skal undgås, må det kræves, at det marginale substitutionsforhold
konstant, svarende til lineære indifferensflader. Idet k er en positiv konstant,
fås ligningen:


DIVL5124

(20)

der er en lineær, partiel differentialligning af første orden. Den almene løsning hertil
kan ved hjælp af Lagrange's metode vises at være givet ved udtrykket:


DIVL5130

(21)

hvor g er en vilkårlig differentiabel funktion. Hvis Sg/SU kan løsningen i stedet
gives på formen:


DIVL5136

(22)

hvor \jj i princippet er en vilkårlig, differentiabel funktion. Nu er der imidlertid tale om en nyttefunktion, som ex definitione har positive førsteordens afledede. Heraf følger, at ip må forsynes med kravet i//'>o. Hvis tillige Gossen's lov kræves opfyldt, må også kravet t//'<o respekteres. Et eksempel på en nyttefunktion, som tilfredsstiller begge de ovennævnte krav såvel som (20), er £/(/ii,/?2) = log ((l/Å')/?!

Side 231

Klassen (22) er i øvrigt interessant på en anden måde. Således sikrer den, at den for praktiske formål foreslåede beregningsmetode (se Kristensen, 1978, p. 364 ff), giver valide resultater i første forsøg. Konstanten k. der entydigt bestemmer c\ kan nemlig uanset i// - beregnes ved hjælp af blot to punkter i indifferenskortet.

Af andre interessante klasser kan nævnes den klasse af nyttefunktioner, som har isoelastiske indifferensflader. Denne klasse sikrer en iterationsfri løsning af (19) for store værdier af Mahalanobis1 A2A2 (se Kristensen, 1978, p. 361 ff). Klassen kan beskrives ved følgende partielle differentialligning:


DIVL5146

(23)

hvor k er elasticiteten af H. mh t /?.. Denne difTercßtia!!i-nin- har den almene
løsning givet ved:


DIVL5152

(24)

eller, hvis + O, ved


DIVL5158

(25)

hvor \Jj'>o. Et velkendt eksempel på en nyttefunktion fra denne klasse er Cobb
Douglas funktionen.

5. Afslutning

I det foregående er en række teoretiske aspekter i forbindelse med betragtningen af afskæringsværdiens fastsattelse i diskriminantanalysen som et økonomisk valghandlingsproblem afklaret, herunder specielt optimalløsningens globalitet og komparative statik. Hensigten med de opnåede resultater har været at tilvejebringe et for det praktiske arbejde med diskriminantanalysen i økonomiske - herunder specielt driftsøkonomiske - valgsituationer teoretisk vurderingsgrundlag, som kan tjene som rettesnor ved overvejelser om nyttefunktionsformen og informationsniveauet.

De opnåede resultater er baseret på en række forudsætninger, som naturligvis bør haves i erindring ved resultaternes anvendelse. For det første kræver konklusionen om, at optimeringsproblemet altid resulterer i en strengt global løsning, at nyttefunktionen tilfredsstiller de normale krav til en sådan. Nærmere præciseret lorudsætter dette en refleksiv, transitiv og sammenhængende præferencerelation, således at denne medfører en såkaldt komplet quasiordning af goderummet (se f.eks. Fishburn. 1970. p 10 ff • Intriilipator. 1971. p. 144: Pearce 1964.p M)5 Desuden må



5. Idet R er præferencerelationen »mindst lige så god som«, og x,\\z er tre kombinationer af sandsynligheder for korrekt klassifikation, er der tale om følgende relationsegenskaber: xRx for alle x (refleksiv); xRy a \Rz => xRz for alle x, y og z (transitiv); xRv v \Rx for alle x. v (i>amnienhængende).

Side 232

den såkaldte Debreu-betingelse være opfyldt for at sikre eksistensen af en reel, kontinuert nyttefunktion. Betingelsen kræver, at præferencerelationen er kontinuert, forstået på den måde, at to kombinationer med næsten samme indhold skal være placeret tæt ved hinanden i ordningen,6 (se Pearce, 1965, p. 22 ff; Intrilligator, 1971, p. 145). Dette indebærer eksempelvis, at ordningen ikke må være leksikografisk. Endelig forudsættes det, at nyttefunktionen er differentiabel med kontinuerte afledede af anden orden.

For det andet må det erindres, at resultaterne fra den komparative statik er baseret på infinitesimalc ændringer. Da der i praksis naturligvis er tale om endelige ændringer, kan resultaterne kun betragtes som vejledende, på samme måde som det er tilfældet med efterspørgselsteoriens resultater. Formelt set, kan resultaterne betragtes som en approksimation af første orden.

Litteratur

Dixit, A. K. 1976. Optimization in Economic
Theory. Oxford.

Fishburn, P. C. 1970. Utility Theory for Decision
New York.

Intrilligator, M. D. 1971. Mathematical
Optimization and Economic Theory. New
Jersey.

Kristensen, K. 1978. En metode til kalibre-

Pearce, I. F. 1964. A Contribution to Demand
Analysis. Oxford.

Sydsæter, K. 1978. Matematisk Analyse.
Bind 2. Oslo.