Nationaløkonomisk Tidsskrift, Bind 124 (1986)Hedoniske regressioner: Hvad koster en meter bil?Økonomisk Institut, Københavns Universitet Chr. Hjorth-Andersen Resumésummary: Commodity prices are usually given data for economists. When a commodity viewed as a bundle of characteristics, the prices of the characteristics cannot be assumed to be given, however, but must somehow be computed and the tool for this has been provided by hedonic regressions. Originally, this approach was suggested as a means of correcting price indices for quality change but hedonic regressions have a much wider field of application. The correspondence between the basic theoretical model and the practical empirical work is not always obvious, and it will be shown, in theory and in an empirical example, that prices of characteristics differ in a number of ways from prices of commodities. 1. IndledningHvis gennemsnitsbilen igennem en årrække bliver større og større, vil prisindeks blot baseret på markedspriser for biler overvurdere den reelle prisstigning. Kun empirisk arbejde imidlertid afgøre den kvantitative betydning af denne effekt, og det var med dette formål, at arbejdet med hedoniske regressioner blev påbegyndt. Ved en hedonisk skal forstås en regression af en række varianters priser på en vektor af egenskaber: F.eks. kan en række forskellige bilpriser blive forklaret ved en række egenskaber for de pågældende biler. Denne viden kan dernæst udnyttes til at konstruere hedoniske prisindeks, som er renset for kvalitetsændringer. Det har imidlertid vist sig, at hedoniske regressioner har en langt større anvendelse end det oprindelige udgangspunkt. Nyere teoretisk forskning har understreget den dybtgående betydning for strukturen på det enkelte marked, som produktbegrebet har. Inden for industriøkonomien (industrial organization) findes der efterhånden talrige eksempler på, at det ikke er tilfredsstillende blot at betragte gennemsnitstal, men at det - f.eks. af hensyn til konsekvenserne af påtænkte offentlige indgreb - er vigtigt at forstå prisstrukturen på markedet. Cand.polit. Timm Larsen takkes for beregningsassistance og Statens Samfundsvidenskabelige Forskningsråd finansiel bistand. Side 90
Det er karakteristisk for dette område, at teori og empiri ikke gik smukt hånd i hånd1. I begyndelsen af 60'erne blev en række amerikanske arbejder af empirisk tilsnit hvoraf Griliches (1961) utvivlsomt er det bedst kendte 2. Senere i midten 60'erne kom arbejderne af Lancaster (1966) og Becker (1965), men uden mere end en enkelt fodnotes henvisning til den empiriske litteratur. Først i 1970'erne begyndte der at komme en vis konvergens mellem den teoretiske og den empiriske litteratur, se bl.a. Muellbauer (1974), Rosen (1974), Lucas (1975) og Lancaster (1977), jfr. sammenfatningen Deaton & Muellbauer (1980)3. I denne artikel skal først fremgangsmåden ved de hedoniske prisindeks kort omtales som en optakt til den teoretiske diskussion af fortolkningen af de estimerede koefficienter de involverede økonometriske problemer - en diskussion, der skal gives med udgangspunkt i Rosen's model fra 1974. Dernæst skal en række mere eller mindre erkendte velkendte fortolkningsproblemer diskuteres. I sidste afsnit skal et empirisk for 12 amerikanske varer gennemgås. Umiddelbart synes eksemplet måske nok lidt specielt, og datamaterialet kan næppe heller siges at være omfattende, men det skal argumenteres, at erfaringerne fra det empiriske eksempel antagelig har implikationer et ganske stort udsnit af industrivarer. 2. Den generelle fremgangsmådeDet centrale ved
hedoniske prisindeks er utvivlsom regressionen af
varianternes priser Den første
hovedvariant kunne kaldes skyggeprismetoden. I en lineær
udgave kunne (1) hvor p; er
varianternes priser (i = 1,...,n), ztj er indholdet af
den i'te variants j'te karakteristikaog 1 Triplett (1975, s. 308) taler om »the degree of operational content - or lack of same - provided by the theorists the orientation of some of the contributors to the hedonic literature«. 2 Se Griliches' introduktion til samleværket Zvi Griliches (red.): Price Indexes and Quality Change (1971), i hvilket en række af de vigtigste tidligere arbejder er genoptrykt. 3 Der er efterhånden blevet publiceret et meget betydeligt antal af disse studier, omend de ofte foreligger i en relativt utilgængelig form som »research papers« fra forskellige institutioner; som dansk eksempel kan henvises Møller (1978). 4 Jfr. Griliches (1971) og Deaton & Muellbauer (1980). Side 91
nåleændringi
prisen som i følge af en marginal ændring i zV], altså
en (konstant) marginalskyggepris Relationen (1) er
ikke tidsdateret. Med et sample for 2 perioder kan
relationen estimeres (2) hvor ZjoZj0 =Dj ZijoZij0 Qio,Qi0, hvor QjoQj0 = det samlede salg i basisåret oaf variant i. ZjoZj0 bliver dermed den samlede mængde af karakteristika j i basisåret. (2) udtrykker dermed, hvad de forskellige mængder af karakteristika i basisåret kommer til at koste i år t i forhold basisåret. Den anden hovedvariant kunne kaldes »dummymetoden«5. Filosofien bag ved denne metode er ganske simpel. Når mængden af karakteristika per variant ændrer sig fra år til år, kan man forsøge at holde deres betydning konstant ved en regression, og den systematiske del af den resterende variation henføres til egentlige prisforandringer. I den ofte anvendte semilogaritmiske udgave: (3) hvor dummyen D
antager værdien 0 i basisåret og værdien 1 i det
pågældende år, og De to varianter giver ligeledes anledning til forskellige problemer. Griliches anfører således, at dummy-metoden ikke er så følsom over for multikollinearitet, men at den til gengæld er følsom over for det sample, der anvendes. Til dette kommer, at dummy-metoden kræver omtrent halvt så mange frihedsgrader som skyggeprismetoden hvilket kan have ganske stor betydning. Det er
imidlertid ikke hensigten at referere disse arbejder i
detaljer, da hovedvægten 5 En tredie metode til behandling af kvalitetsforskelle er anvendelse af data for priser på brugte genstande. En væsentlig fordel ved metoden er, at man ikke behøver data for de individuelle egenskaber, men det er netop data, som haves, men til gengæld ikke data for priser på brugte genstande. Der skal derfor blot henvises artiklerne i Griliches (1971). 6 Det fortjener dog at blive bemærket, at Laspeyres-indeks som angivet i (2) baseret på skyggeprismetoden ikke nødvendigvis som ved normale goder angiver en overgrænse for prisstigningens størrelse. Problemet er, at y/ir for karakteristika iogj kun under specielle omstændigheder vil være uafhængigt af niveauet for karakteristikaene i og j, se Muellbauer (1974) og Klevmarken (1977). Side 92
derimod vigtigt
at diskutere fortolkningen af de estimerede
koefficienter mere indgående. 3. Rosen's model: Fortolkning og identifikation af koefficienterne11974 præsenterede Sherwin S. Rosen en model, der siden har stået som standardreferencen området. Selve modellen er teknisk ganske kompliceret (og bliver i den efterfølgende da også behandlet med passende ærbødighed!), men Rosen har selv i 1978 givet en mere tilgængelig fremstilling 7. Rosen opfatter en vare som fuldkommen bestemt af en vektor afmålelige karakteristika, (z,,„zm). Producenterne bestemmer hver især den konkrete værdi af z, som derefter er given for den enkelte forbruger. Varen antages ikke at være delelig, så der er ingen mulighed for at kombinere egenskaberne for flere varianter. Den centrale forudsætning at der forefindes en »tæthed« af varianter på markedet, så forbrugerne kan vælge en vilkårlig kombination af z. En klar fordel ved dette oplæg er, at de relevante funktioner kan differentieres, og den almindelige marginalteknik benyttes. Der antages være fuldkommen konkurrence på køber- og sælgerside i den forstand, at ingen køber eller producent kan påvirke hverken varepriserne eller egenskabspriserne. Forbruger i antages at have en strengt konkav nyttefunktion Uj = Uj(z,x), hvor x betegner andre goder. Der antages implicit separabilitet, så forbruget af z kan analyseres af de øvrige varer - en forudsætning, som kan være vanskeligere at vurdere, når det drejer sig om analyse i karakteristikarummet og ikke i goderummet. Hver forbruger køber kun 1 bestemt variant, et meget realistisk træk i modellen. Den enkelte forbrugers budgetrestriktion er givet ved Y4Y4 = x+ p(z), hvor prisen på x er sat til 1, og hvor der kun købes 1 enhed af varianten, men hvor p(z) ikke nødvendigvis er lineær. implicerer - med nødvendige forbehold på grund af p(z)8 - at p'(z) = Uzj/Ux, j = l„,m. Forbrugernes marginale substitutionsforhold vil således svare til den marginale omkostning for forbrugerne ved at ændre kvaliteten. Det er åbenlyst, at denne fremstilling kun giver mening med en tæthed af varianter. Producenterne antages kun at foretage envareproduktion; det bemærkes eksplicit, at flervareproduktionen giver anledning til som et minimum betydelige modeltekniske vanskeligheder. Producenterne maksimerer - i 1978-udgaven - en profitfunktion Fl = np(z) - C(n,z), hvor de udover at fastlægge produktionen af enheder, d.v.s. n, også skal fastlægge kvaliteten z, hvilket umiddelbart giver n p'(z) = Cz eller p' (z) = Cz/n.Cz/n. De marginale implicitte priser p'(z) afspejler således på samme tid de marginale produktionsomkostninger forbrugernes marginale betalingsvillighed. 7 jfr. også Triplett (1975). 8 Det faktum, at selv med lineære markedspriser kan efficiensgrænsen - eller budgetrestriktionen - i karakteristikarummet konveks, kan give anledning til åbenlyse vanskeligheder, hvis den bliver »for« konveks i forhold til nyttefunktionen. Rosen (1974) bemærker problemet, men abstraherer i øvrigt fra det. Side 93
Tilbage henstår at påvise en markedsligevægt. Problemet er vanskeligt, fordi udbud og efterspørgsel efter den enkelte egenskab normalt vil afhænge af niveauet for samtlige egenskaber, og Rosen (1974) giver da også kun løsningen i det simple tilfælde med 1 egenskab. Med dette udgangspunkt er Rosen i stand til at give en klar præsentation af identifikationsproblemet: regressioner kan fremskaffe de (marginale) priser på egenskaber, medens priser normalt er givne data for almindelige varer. Dernæst må udbuds og efterspørgselskurver for hver enkelt egenskab estimeres ved inddragelse af yderligere variable, men dette er blot »a garden variety identification problem« (Rosen 1974, p. 50). Mere konkret kan fremgangsmåden fremstilles i 3 trin:9. Trin 1:
Estimér den hedoniske regression (4) hvor z= (z,„ Zj„ zm) er en vektor af egenskaber for en given vare. Lad os konkret forestille at det er ejendomsmarkedet. Datagrundlaget består således af salgspriser for N huse samt disse huses egenskaber såsom størrelse, udstyr, støjniveau osv. Om dette trin bemærker Rosen (1974, p. 50), at det »econometrically duplicates the information acquired by agents in the market, on the basis of which they make their decisions«. Lad estimatet
være p = p(z). Trin 2:
Beregn de N marginale priser for hver egenskab
(5) for hvert af de N huse, idet den faktiske værdi af z for hvert hus indsættes. For at der skal blive variation i de N marginale priser for egenskab j må (4) ovenfor ikke være lineær, Rosen argumenterer da også for, at dette heller ikke er tilfældet. Trin 1 og 2 har således fremskaffet de fornødne priser, hvorefter udbuds- og efterspørgselskurver estimeres merespå normal vis. Trin 3:
Estimér (6) 9 Witte m.fl. (1979) følger disse 3 trin i et empirisk studie af ejendomsmarkedet. Side 94
hvor a og (3 er
vektorer af eksogene variable, der sikrer identifikation
af kurverne. Der I medfør af trin 3 kan således (f.eks.) en efterspørgselskurve og en udbudskurve for støj (stilhed) estimeres. Når disse kurver er fastlagt, kan f.eks. benefits ved et marginalt støjdæmpende projekt beregnes. Varianter af denne fremgangsmåde har i særlig grad været anvendt inden for forureningsøkonomien, omend måske i en noget ad hoc præget Der findes en lang række studier af ejendomsprisernes afhængighed af egenskaberne ved ejendommen samt forureningsvariable såsom luftforureningsindikatorer støjniveau. Ofte er disse studier imidlertid stoppet ved trin 2. Fra et teoretisk synspunkt er det naturligvis tilfredsstillende med en fremgangsmåde, der kan måle benefits ved forureningsforanstaltninger ud fra objektive markedsdata ,(der er faktisk tale om et kønt eksempel på, at grundvidenskabelig forskning får praktiske men ovenstående fremgangsmåde er imidlertid ikke så simpel endda at forfølge i praksis. Rosen har således ikke ret i, at identifikationsproblemet er af den omtalte velkendte type. Brown & Rosen (1982) gør opmærksom på, at de beregnede marginale priser ikke kan betragtes som informationsgivende data på lige fod med normale Konkret viser de, at hvis (4) er kvadratisk, og (6) er lineær, vil identifikation (6) ikke være mulig. Der er ligeledes en række ikke übetydelige problemer i forbindelse med funktionsvalg og estimationsmetode, som ikke skal uddybes her, men se Blackley m.fl. (1984) og Mendelsohn (1984). Endelig kommer der på det mere praktiske plan ganske betydelige dataproblemer. Ohsfeldt & Smith (1985) har således i et Monte Carlo studie konstateret, at rimeligt præcise estimater af (6) kræver ret betydelige men dette er typisk ikke det store problem på netop ejendomsmarkedet. for at estimere f.eks. en efterspørgselskurve efter støj, kræves der en vis variation i de beregnede støjpriser. Dette er det imidlertid ikke nødvendigvis muligt at opnå i et enkelt velafgrænset område, men anvendelsen af f.eks. flere ret foi skellige områder af hensyn til den korrekte specifikation af (4) være problematisk. Alle disse problemer umuliggør ikke fremgangsmåden, men medfører nok, at man ikke - i hvert fald indtil videre - skal stille for store forventninger til, hvor præcise resultater, der kan opnås. Konkret viser f.eks. Harrison & Rubenfeld (1978), at alene specifikation af den hedoniske regression kan medføre udsving i de estimerede benefits fra 47 til 105 dollars. 4. Nogle fortolkningsproblemerI dette afsnit
skal en række problemer af fortolkningsmæssig eller
praktisk karakter a. Forholdet til Lancaster's modelMan ser ofte, selv
i nyere tid såsom f.eks. Witte m.fl. (1979), at
hedoniske regressioner Side 95
skulle opfattes som det empiriske modstykke til Lancaster's forbrugsteori10. Dette er imidlertid såvel historisk som faktisk überettiget, se især Lucas (1975). Hos Lancaster er det en vigtig pointe, at forekomsten af forskellige varianter i markedet kun kan forklaresved, forbrugerne har forskellige præferencer, hvilket ikke harmonerer særligt godt med den normale forestilling i indeksteorien om repræsentative forbrugere. Hos Lancaster er det ligeledes væsentligt, at efficiensgrænsen er stykvis lineær samt konkav (set fra origo). Denne betingelse hverken opfylder eller tilstræber de normale hedoniskeregressioner opfylde. På dette som på mange andre områder er de mest populære valg af funktionsform en lineær, semilogaritmisk eller dobbeltlogaritmisk regression. Af disse vil imidlertid de to første give en lineær efficiensgrænse, medens den dobbeltlogaritmiskevil en konveks efficiensgrænse. Til disse principielle problemer kommer der en række detaljer. En ny variant, der ligger efficiensgrænsen, vil i princippet normalt medføre, at efficiensgrænsen lokalt vil blive ændret, men ved dummy-metoden postuleres der det samme sæt af skyggepriser de to perioder. Dertil kommer, at i praksis er en række egenskaber af 0-1 typen, som ikke har noget modstykke hos Lancaster. Endelig er Lancaster's forudsætning om delelighed helt uanvendelig på netop den type af goder, der typisk er blevet anvendt ved hedoniske regressioner, såsom biler og huse, køleskabe o.lign. Der er således godt nok tale om beslægtede betragtningsmåder af kvalitetsbegrebet, men der er ikke tale om, at hedoniske regressioner kan opfattes som det empiriske modstykke til Lancaster's teori. b. Antallet af varianterDet er en ejendommelighed i den hedoniske indekslitteratur, at antallet af varianter ikke indgår som nogen central størrelse. Antallet af varianter varierer faktisk fra år til år for biler (Dhrymes 1971, p. 134) som på mange andre markeder ganske betydeligt" . Desuden har den stigende udenrigshandel i de sidste årtier utvivlsomt bevirket en trendmæssig stigning i antal varianter for den enkelte vare; der er kommet langt flere mærker at vælge imellem. For forbrugerne
indebærer en sådan udfyldning af karakteristikarummet
med varianter, c. Konsumenkriterier eller producentkriterier?Det er
ejendommeligt at notere sig, at med én undtagelse ud af
et ganske betydeligt 10 Se Hjorth-Andersen (1982) for en fremstilling af Lancaster's model. 11 Skulle læseren synes, at eksemplet er lidt støvet, kan det oplyses, at det samme fænomen er omtalt i Time Magazine af 4/11 1985 p. 33 for europæiske biler. 12 Denne effekt er efterhånden udførligt omtalt i teorien, se således Sattinger (1984) som et af de seneste bidrag. Side 96
antal studier er de alle i det væsentlige baseret på producentkriterier. Artiklens titel er ikke nogen vittighed; man prøver faktisk at beregne, hvad en meter bil koster 1?. Hensigtenvar konstruere indeks til belysning af forbrugernes situation, altså om konstateredeprisstigninger kvalitetsforbedringer eller reel inflation. Der er imidlertid intet i vejen for, at en række producent kriterier kan være praktisk taget uændrede, medensen konsumentkriterier gradvist er blevet forbedret. Der er ikke på forhånd nogen garanti for, at hedoniske prisindeks baseret på producentkriterier vil udvise samme forløb som indeks baseret på konsumentkriterier, men det er utvivlsomt konsumentkriterierne,der forbrugernes velfærd. Undtagelsen er Ohta & Griliches (1975), der systematisk anvender konsumentkriterier variables«) iet afsnit af deres undersøgelsel4. Deres hovedresultat er, at de for biler når til et lige så godt »fit« med konsumentkriterier som med producentkriterier. alle konsumentkriterierne er imidlertid signifikante, og enkelte har forkert fortegn. På det metodiske plan er det imidlertid datakonstruktionen, der er det mest problematiske. De anvender data fra Consumer Reports fra 1963-66, se næste afsnit, men foretager nogle uigennemskuelige transformationer af de principielt ordinære som de derefter behandler som kardinale størrelser. d. Et begrænset antal varianterHos Rosen var der tale om en »tæthed« af varianter, men dette er ikke typisk for de fleste markeder for industriprodukter, hvor antallet af varianter set i forhold til det mulige normalt er ret lille - omend det måske i absolutte tal kan være ret stort, måske over 100. Et begrænset
antal varianter påvirker for det første koefficienternes
(præcise) fortolkning Antag, at prisen pr. enhed hestekraft for en bil er 1 dollar. Lad forbrugerne være stillet for valget mellem en 200 og en 250 hestekræfters motor, altså med en prisforskel 50 dollars. Med den givne pris ville én forbruger måske have valgt en motor med 190 HK, en anden en motor med 220 og en tredie med 260. På et givet tidspunkt er der i markedet nogle bestemte varianter uden muligheder for kontinuert tilpasning. Hvis der nu
bliver introduceret nye modeller, så der tilbydes
motorer med 220 og 270 13 1 ingen af disse arbejder er der - så vidt ses - nogen henvisning til Brems (1951). 14 Atkinson & Halvorson (1984) anvender dog også for en enkelt variabel, »Comfort of Ride«, data fra Consumers som de skalerer fra 1 til 5 (se p. 421). Da der efterfølgende, (Table 2, p. 422) kun estimeres 1 koefficient, er der ikke meget tvivl om, at de i realiteten har anvendt variablen kardinalt. Side 97
kvalitetsproblemer udvise stigning, medens det hedoniske prisindeks ikke ville vise nogenændring, den første forbruger vil lide et tab, den anden vil være bedre stillet, medens den tredie er nogenlunde lige så godt stillet. Med mange forbrugere er det klart, at det hedoniske indeks kan såvel overvurdere som undervurdere den gennemsnitlige forbrugers tilfredsstillelse. For det andet betyder et begrænset antal varianter normalt, at den enkelte producent får mulighed for at føre sin egen prispolitik. Dhrymes (1971) har som den første beskæftiget med de problemer, der opstår i tilfælde af et begrænset antal varianter, hvor den enkelte producent er prisfastsætter. Hans arbejde er fortrinsvist økonometrisk og vedrører biler og køleskabe. Han antager, at prisdannelsen foregår ved en mark-up k over omkostningerne, uden at dette begreb defineres nærmere. Den mest
naturlige fortolkning er nok, at prisdannelsen foregår
ved, at producent i (7) Han benytter 3
jrskellige omkostningsfunktioner (8a) (8b) (8c) Her som i den økonomiske litteratur overhovedet anvendes »rene« funktionsudtryk, men det mere realistiske er nok blandede funktioner, så de partielle omkostninger ved at producere mere af én egenskab stiger eksponentielt og for en anden f.eks. lineært. Hvis man som i forureningsøkonomien typisk kun er interesseret i en enkelt koefficient, den korrekte specifikation naturligvis af stor vigtighed. Indsættes (8) i
(7), fås den hedoniske regression umiddelbart (idet det
stokastiske led (9a) (9b) (9c) Side 98
Dhrymes centrale spørgsmål er, om antagelsen af en fælles mark-up sats for de enkelte producenter er berettiget; han konkluderer siden, at svaret er nej. (Når dette teknisk kan lade sig gøre, skyldes det, at den enkelte producent producerer en række mærker - hvert bilfirma producerer lastvogne, store biler, små biler o.s.v. -, så han kan estimere (9) for hver enkelt producent). Det er væsentligt at bemærke, at fortolkningen af koefficienterne er væsensforskellig de 3 tilfælde. En estimeret koefficient i (9a) vil ikke angive de marginale omkostninger, derimod omkostningerne multipliceret med mark-up satsen, uden at de enkelte af teknologi og priskalkulation kan identificeres. I (9a) og (9b) vil en estimeret koefficient derimod nok angive den marginale omkostning, men vil ikke være Formuleringen (7) er i øvrigt ikke uproblematisk, Dhrymes undersøger, om de forskellige har forskellig prispolitik under forudsætning af, at de anvender samme mark-up for samtlige af deres produkter. En mindst lige så nærliggende tanke ville imidlertid være, at mark-up satsen for den enkelte producent varierede med prduktets kvalitet, så produkter med høj kvalitet fik en høj mark-up. En rimelig tilnærmelse antagelig være at antage, at mark-up satsen er en lineær funktion af AVC, eftersom der kan gives mange eksempler på, at dyre varianter har en høj avancesats. Indsat i f.eks. (9a) ville dette give anledning til en kvadratisk funktion i z. Endelig skal bemærkes, at der ved (7) og (8) er forudsat en fælles omkostningsfunktion, altså fælles teknologi og fælles faktorpriser. Begge dele kan naturligvis anfægtes. Et beslægtet problem er, at formuleringen (7) udelukkende tilskriver forskelle i de variable omkostninger til forskelle i z. Men der kunne jo meget vel tænkes at være stordriftsfordele produktionen af visse varianter. Er dette tilfældet, og er f.eks. de laveste systematisk de mest solgte, vil relationerne (9) åbenlyst være fejlspecificerede, der bør indgå et udtryk for det absolutte salg eller eventuelt markedsandelen . Sammenfattende må det konkluderes, at når Rosen's forudsætning om en tæthed af varianter opgives, må den erstattes med eksplicitte antagelser om producenternes omkostningsforhold markedsadfærd, for at den hedoniske regression kan specificeres korrekt, og koefficienterne kan gives en præcis fortolkning. 15 Griliches er flere steder (f.eks. 1971, s. 61) inde på, at de enkelte observationer til regressionen p= p(z) burde med deres markedsandel. Betragtningen er imidlertid en noget anden end her, idet til indeksbrug virker ret intuitivt, at små uvæsentlige varianter ikke skal tillægges for stor betydning. Men om der faktisk bør ske en vejning med markedsandele, må vel bl.a. afhænge af den videre procedure ved indekset. Det fremgår (2), at der vil ske en vejning ved konstruktionen af Laspeyres-indekset, medens der ikke vil blive foretaget vejning ved dummy-metoden. Side 99
e. Stabiliteten af de hedoniske regressionerHermed tænkes ikke på, om de hedoniske regressioner er stabile over tiden; det fremgår af det foregående, at forskydninger i efterspørgsels- og udbudsforhold over tiden kunne ændre koefficienterne i den hedoniske regression. Der tænkes på, om den hedoniske regression er stabil selv med uændrede udbuds- og efterspørgselsforhold. Problemet kan illustreres ved at betragte fig. 1, hvor regressionslinien <p er indlagt. Det er herefter simpelt at indlægge en over- og undergrænse for, om observationerne for et givet signifikansniveau kan antages at tilhøre den pågældende regression. På figuren punkt A en »høj« pris og punktet B en »lav« pris16. For varianten A synes der at være to muligheder: Den er virkelig prissat for højtl7; i så tilfælde må man imidlertid forvente, enten at der sker en prisjustering, eller at den taber markedsandele og eventuelt helt forsvinder fra markedet. Den anden mulighed er, at den faktisk ikke er prissat for højt forstået på den måde, at den ikke taber markedsandeleeller 16 Der er her tale om en økonometrisk definition af en inefficient variant. I Hjorth-Andersen (1982) er der anvendt en definition af inefficiente varianter baseret på et mikroteoretisk oplæg. De to definitioner er klart forskellige. F.eks. er punktet C inefficient i forhold til D, men ingen af disse punkter er økonometrisk inefficiente. 17 Empirisk kan dette undersøges ved at teste, om den for høje pris genfindes på brugtvognsmarkedet, jfr. f.eks. Ohto & Griliches (1975). En anden mulighed er mere direkte at teste, om den taber markedsandele, således bl.a. Cowling & Rayner (1970) gør for traktorer. Side 100
kedsandeleellerbliver udsat for et kraftigt fald på markedet for brugte genstande. Detteer fundet at være tilfældet for nor'e biltyper. (Måske ikke så overraskende drejer det sig om f.eks. Cadillac i USA og Jaguar i England). Teknisk set kan sådanne forskelle »klares« med dummy'er, men det er klart, at i den udstrækning, at den slags dummy'er bliver anvendt, bliver den hedoniske regression p = p(z) opløst i enkelte fabrikantnavneo.lign., mod det oprindelige oplæg. Problemet bliver ikke mindre af, at et statistisk signifikanskriterium ikke umiddelbart sig oversætte til et kriterium for, hvilke varianter der faktisk vil tabe markedsandele. vi således anvende 80, 90 5, 99 eller 99,9 pct. fraktilen? Blot at anvende konve Jonelle niveau på 95 pct. . irker i hvert fald ikke tilfredsstillende. Svaret kan imidlertid kun empiriske studier give, og disse foreligger ikke. Det skal yderligere bemærkes, at der ikke nødvendigvis er symmetri mellem for højt og for lavt prisfastsatte varianter. For højt prisfastsatte varianter må, med ovennævnte modifikationer, antages at være mere ustabile end de lavt pris fastsatte. Endelig kan man spørge sig selv, om OLS nu også er den mest velegnede estimationsmetode sådanne tilfælde. Ved at minimere den lodrette afstand til regressionslinjen <p tillægges punkterne A og B den største betydning, altså netop de punkter, der må anses for mest ustabile. 5. Hedoniske regressioner baseret på Consumer Reports 1980I Danmark har der ikke været nogen tradition for at arbejde med hedoniske regressioner. (1966) omtaler metoden, men ender med at advare mod »mekaniske regressioner«. er ligeledes ikke omtalt i Gørtz og Drud Hansens bog om indeksteori fra 1977. Der findes imidlertid enkelte nyere arbejder specielt inden for ejendomsmarkedet. Michael Møller (1978) viser således nogle foreløbige resultater fra typehusmarkedet og anbefaler med forbehold metoden ved nybyggede huse. Kai Kristensen (1983) får rimelige i et empirisk studie fra Århus-området. Søren Eliasen (1981) viser i et upubliceret arbejde, at metoden anvendt på et ret stort materiale fra Bolig- og Byggeregistret give rimelige resultater. Fælles for disse arbejder er imidlertid, at de stopper trin 1, evt. 2, men forsøger ikke at estimere udbuds- og efterspørgselsfunktioner for de enkelte egenskaber i trin 3. Ved senere anvendelser af metoden - f.eks. til formaliserede - må man imidlertid være opmærksom på, at koefficienterne kan være geografisk varierende. Hovedparten af de hedoniske regressioner har været udført på enten boligmarkedet eller markedet for varige og ret kostbare forbrugsgoder. Det empiriske materiale, som skal anvendes her, er imidlertid karakteriseret ved, at varerne ikke er tilsvarende dyre, og i sammenhæng hermed at forbrugernes informationsniveau næppe er særlig højt. Side 101
Spørgsmålet er
herefter, hvilke resultater man kan forvente at opnå på
den slags markeder. Datagrundlaget er taget fra det amerikanske tidsskrift Consumer Reports, som publicerer på samme måde som i Råd og Resultater fra Statens Husholdningsråd. er udførligt omtalt andetsteds, se Hjorth-Andersen (1980), så her skal blot resumeres, at for en given vare defineres en række egenskaber, og de enkelte varianter (mærker) vurderes derefter for hver enkelt af disse egenskaber. Med n varianter og m egenskaber haves således en datamatrix for hver vare, hvortil kommer varianternes priser. Det karakteristiske element for variant i og egenskab j er en angivelse på en 5-delt skala af, om mærket for den pågældende egenskab er »meget god«, »god«, »acceptabel«, »dårlig« eller er »meget dårlig«, alts ikke et kardinalt mål. Det er derefter forsøgt at estimere følgende simple regression: (10) hvor Ejj er en dummyvariabel. Med to hhv. 4 benyttede karakterer er E,j =l for den højeste (de to højeste) karakterer og 0 for den (de) laveste. Med 3 eller 5 benyttede karakterer »mellemkarakteren« henført til den højeste gruppe, hvis der er færrest observationer forvejen i denne gruppe. Defineret på denne måde skal fortegnene blive positive: Sammenlignet med en kvalitet under »gennemsnittet« bør en kvalitet over »gennemsnittet« betinge en højere pris18 . Et væsentligt problem ved (10) er spørgsmålet om frihedsgrader. Antallet af egenskaber Consumer Reports er ofte ret stort i forhold til antallet af mærker (hvilket i endnu højere grad gælder Råd og Resultater), men det er dog lykkedes at finde 12 varer, for hvilke (10) kunne estimeres, så der var mindst 10 frihedsgrader19.1 tabel ler resultaterne Af de 12 varer
fås der ved anvendelse af model (10) i 8 ud af de 12
tilfælde absolut 18 Thomassen (1980) estimerer en hedonisk regression for farve-TV på basis af Råd og Resultater. Husholdningsrådet publiceret 20 egenskaber som værende relevante ved valget af farve-TV. Men af disse 20 egenskaber uden nærmere begrundelse de 5, medens resten negligeres. Formuleringen af (10) indebærer, hvis Consumer Reports har valgten egenskab til at være relevant, bør denne egenskab indgå i den hedoniske 19 Antallet af frihedsgrader er en hovedårsag til, at den valgte specifikation af regressionen er så simpel. Med det anvendte materiale er det kun undtagelsesvist muligt at estimere mere komplicerede modeller. Side 102
men 6 af de
positive koefficienter var signifikante bedømt ud fra en
t-værdi større end Side 103
gressionernepåvarerne»donkrafte«
og »kameratrefødder« kunne måske
karakteriseressompassable. Der kan være grund til at spørge, hvorfor resultaterne ikke er så »gode« som normalt ved hedoniske regressioner. (Der ses herved bort fra, at det ikke her er forsøgt at »massere« ved at estimere med mange forskellige funktionsudtryk, anvende alternative definitioner af variablene o.lign.). De normalt gode resultater ved hedoniske opnås imidlertid hovedsageligt ved variable for »størrelse«20. I Consumer ex størrelsesmomentet imidlertid udelukket p.g.a. afgrænsningen af varen. køleskabe sammenlignes med små køleskabe, og store køleskabe med store køleskabe, så der er ingen mulighed for, at en størrelsesvariabel kan give et væsentligt bidrag til R2. Resultatet i tabel 1 er imidlertid ikke særlig interessant i sig selv, men det kan gives en stærkt udvidet fortolkning. For hver vare kendes de n varianters rangordning m.h.t. prisen og til kvaliteten af den enkelte egenskab. Der kan derefter beregnes en rangkorrelationskoefficient hver enkelt egenskab. Spørgsmålet er herefter, hvorledes denne rangkorrelationskoefficient (Spearman's rho) forholder sig til den estimerede regressionskoefficient angivet i tabel 1. I tabel 2 er svaret givet. Af de 40 medtagne egenskaber var der overensstemmelse i de 36 tilfælde. For de 4 egenskaber, hvor rho angav en signifikant sammenhæng, medens regressionskoefficientenikke signifikant, var regressionskoefficienten dog positiv med de respektive t-værdier 1,4; 0,9; 1,5 og 1,8. Den kvalitative konklusion - en ikke særlig udtalt positiv korrelation mellem pris og kvalitet - synes således at blive den samme ved de to metoder.Hvortil 20 Griliches (1971 a): »Most of the studies included in this volume do quite well with some combination of »size« and »power« variables« (p. 5). Side 104
der.Hvortilkommer som et klart
beroligende moment for rangkorrelationsmetoden, Betydningen af dette ligger i, at de hedoniske regressioner kan kun teknisk gennemføres et fåtal af varerne, medens rangkorrelationskoefficic.cr let kan beregnes for et langt større antal varer. Der er således beregnet rangkorrelationskoefficienter for 127 varer i Consumer Reports, hvilket gav til resultat, at ud af 860 koefficienter blev de 295 beregnet til at være negative, medens 521 blev positive, og resten blev nul. Med andre ord blev - med udelukkelse af koefficienterne på nul - 36,2 pct. af koefficienterne beregnet at blive negative. Et tilsvarende resultat er opnået for Råd og Resultater, idet der her blev fundet 36,7 pct. negative koefficienter mod 63,3 positive. Resultaterne i tabel 2 tyder på, at hvis det havde været muligt at beregne hedoniske regressioner for alle de 127 varer, ville der være opnået ganske mange insignifikante koefficienter, formentlig også nogle signifikant negative koefficienter. Den stikprøve på 12 varer, som her er anvendt, tyder således på, at uafhængigt af beregningsmetoden er samspillet mellem pris og kvalitet ikke nær så entydigt, som der er lagt op til i teorien om de hedoniske regressioner. 6. KonklusionHedoniske regressioner startede oprindeligt som en metode til at rense prisindeks for kvalitetsglidning, men dens anvendelse er imidlertid ikke hverken i USA eller Danmark slået igennem hos de statistikproducerende myndigheder. Metoden har imidlertid langt større anvendelse, end det oprindelige udgangspunkt tilsigtede. I denne artikel er specielt forureningsøkonomien blevet fremhævet, men også en række mere specielle emner inden for industriøkonomien kunne være trukket frem. Det er imidlertid en fejltagelse at tro, at egenskabspriser fraregnct lidt teknisk besvær kan behandles som normale markedspriser. I det normale tilfælde vil de ikke være lineære, hvilket giver en række tekniske komplikationer, hvoraf to er nævnt i fodnoterne og 8. Hvis de derimod er lineære, er identifikation af udbuds- og efterspørgselskurver mulig. Til dette kommer, at egenskabspriserne i og med den stokastiske formulering i en regressionslinie vel også teoretisk burde formuleres som stokastiske variable, hvorefter forbrugeren i princippet må tilpasse sit forbrugsvalg under usikkerhed et aspekt, som hverken Rosen eller andre mig bekendt har indarbejdet i en model, og som givetvis vil give anledning til yderligere tekniske komplikationer. Lige så vigtigt som disse teoretiske komplikationer i tilfælde af en »vellykket« hedoniskregression imidlertid, at ganske ofte kan de hedoniske regressioner ikke estimeres,og dermed ikke fremskaffes, fordi antallet af mærker på markedeter lille i forhold til antallet af relevante egenskaber, hvorfor der ikke er frihedsgradernok Side 105
gradernoktil estimationen. Dertil kommer som noget ikke mindre vigtigt, at selv i tilfældeaf tilstrækkeligt antal frihedsgrader vil estimationen ofte give anledning til negative koefficienter. Når Rosen som tidligere bemærket omtaler de hedoniske regressionersom til den information, som den enkelte agent tillærer sig i markedet,havde formentlig »gode« estimationsresultater i baghovedet. Resultatet fra det empiriske eksempel i forrige afsnit, der godt nok umiddelbart kun vedrører 12 varer,men formentlig kan udstrækkes til et ganske bredt udsnit af industrivarer i såvelDanmark USA, antyder imidlertid, at den information må være ret upræcis og uklar for den enkelte agent. Den teoretiske forudsætning hos Rosen og andre om, at forbrugerne havde fuldkommen information, virker på denne baggrund ikke særligt plausibel. Hvis ikke økonometrikeren kan fastlægge egenskabspriserne med en rimelig grad af nøjagtighed, hvorledes skulle forbrugeren så kunne det? LitteraturAtkinson, Scott E. og Robert Halvorsen. 1984. A New Hedonic Technique for Estimating Demand: An Application the Demand for Automobile Fuel Efficiency. Review of Economics and Statistics 417-26. Barzel, Yoram. 1975. Comments on »Automobiles Revisited: Extensions of the Hedonic Hypothesis. I Household Production Consumption red. Nestor E. Terleckyj. Studies in Income and Wealth, bind 40. National Bureau of Economic Research. York. Becker, Gary.
1975. A Theory of the Allocation Bjerke, Kjeld.
1969. Indekstal. I Udviklingslinier
Blackley, Paul; James R. Follain og Jan Ondrich. Box-Cox Estimation of Hedonic How Serious is the Iterative OLS Variance Bias? Review of Economics and Statistics 66: 348-53. Brems, Hans.
1951. Product Equilibrium under Brown, James N.
og Harvey S. Rosen. 1982. Cowling, Keith og
A.J. Rayner. 1970. Price, Deaton, Angus og
John Muellbauer. 1980. Dhrymes, Phoebus J. 1971. Price and Quality Changes in consumer Capital Goods: An Empirical Study. I Price Changes and Quality Change, red. Zwi Griliches. Cambridge, Mass. Eliasen, Søren Wejs. 1981. En prisdannelsesmodel en-familiehuse baseret på en tværsnitsanalyse. 3-mdr.s opgave. Københavns Økonomiske Institut. Griliches, Zwi. 1961. Hedonic Price Indexes for Automobiles: An Econometric Analysis Quality Change. I Price Changes and Quality Change, red. Zwi Griliches. Cambridge, Mass. Griliches, Zwi.
1971. Price Changes and Quality Griliches, Zwi,
1971a. Introduction: Hedonic Gørtz, Erik og
Jørgen Drud Hansen. 1977. Harrison, David
Jr. og Daniel L. Rubinfeld. mental
Economics and Management 5: Hjorth-Andersen, Chr. 1980. Prisen som kvalitetsindikator. memoserie 78. Københavns Universitets Økonomiske Hjorth-Andersen, Chr. 1981. Price and quality of industrial products: Some results of an empirical investigation. Scandinavian Journal of Economics 83: 372-89. Hjorth-Andersen,
Chr. 1982. Lancasters forbrugsteori. Klevmarken, Anders. 1977. A Note on New Goods and Quality Changes in the True Cost of Living Index in View of Lancaster's of Consumer Behavior. Econometrica 163-73. Kristensen, Kai. 1981. Relationen mellem pris og egenskaber på ejendomsmarkedet 1974-78. Erhvervsøkonomisk Tidsskrift. 47: 49-60. Lancaster,
Kelvin. 1966. A New Approach to Lancaster,
Kelvin. 1971. Consumer Demand: Lancaster,
Kelvin. 1977. The measurement of Lucas, Robert
E.B. 1975. Hedonic Price Functions. Muellbauer, John. 1974. Household Production Quality, and the »Heuoinc« Technique. American Economic Review 64: 977-994. Møller, Michael. 1978. Et hedonisk mængdeindeks boligbyggeriet. Cykelafdelingens nr. 65. Københavns Universitets Institut. Ohsfeldt, Robert L. og Barton A. Smith. 1985. Estimating the Demand for Heterogeneous Review of Economics and Statistics 165-71. Ohta, Makoto og Zwi Griliches. 1975. Automobile Revisited: Extensions of the hedonic Hypothesis. I Household Production Consumption, red. Nestor E. Terleckyj. in Income and Wealth, bind 40. National Bureau of Economic Research. Rosen, Sherwin. 1974. Hedonic Prices and Implicit Markets: Product Differentiation in Pure Competition. Journal of Political Economy 82: 34-55. Rosen, Sherwin. 1978. Advertising, Information, Product Differentiation. I Issues in Advertising red. David G. Tuerck. American Institute for Public Policy Research. Washington, D.C. Sattinger, Michael. 1984. Value of an Additional in Monopolistic Competition. Review of Economics and Statistics 55: 321-32. Thomassen, Finn. 1980. Forslag til hvorledes forbrugerorganisationer kan foretage sammenlignende og vurdere et købs hensigtsmæssighed. I Forbrugerforskning i Danmark red. Børge Dahl og Flemming Hansen. København. Triplett, Jack E. 1975. Consumer Demand and Characteristics of Consumption Goods. I Household Production and Consumption Nestor E. Terleckyj. Studies in Income and Wealth, bind 40. National Bui eau of Economic Research. Witte, Ann; Howard J. Sumka og Homer Erekson. 1979. An Estimate of Structural Hedonic Price Model: An Application of Rosen's Theory of Implicit Markets. Econometrica 1151-73. |