Ledelse og Erhvervsøkonomi/Handelsvidenskabeligt Tidsskrift/Erhvervsøkonomisk Tidsskrift, Bind 59 (1995) 1

Neurale netværk som beslutningsstøtteværktøj

En introduktion

Knud Erik Rasmussen

Side 57

Resumé

Artiklen giver en grundlæggende, ikke-teknisk introduktion til kunstige neurale netværk. Et eksempel på anvendelse af neurale netværk i forbindelse med going concern-problemstillingen beskrives. Desuden beskrives et igangværende dansk projekt vedrørende anvendelse af neurale netærk i forbindelse med ligning af erhvervsdrivendes selvangivelser, samt et eksempel på anvendelse af neurale netværk til vurdering af virksomheder.

indledning

Kunstige neurale netvaerk udspringer af
forskningen i kunstig intelligens-teknikker.
Kunstige neurale netvaerk har fundet
anvendelse pa en bred vifte af problemstillinger,
ikke kun inden for det tekniske
/ naturvidenskabelige omrade (f.eks. »robotsyn*
til automatisk styring af en bil, og
genkendelse af fjendtlige fartojer til brug
inden for militaeret), men ogsa pa omrader
som transformering af skreven tekst til tale,
og omvendt. I industrien er bl.a. set anvendelser
til kvalitetskontrol og til
produktionsstyring.

På det erhvervsøkonomiske område er der i de senere år set anvendelser inden for så forskellige områder som vurdering af værdipapirer, prognosticering afkortperiodiske udsving i aktiekurser, forudsigelse af

Side 58

sandsynlige konkurser, og som en alternativ angrebsvinkel pa optimeringsproblemstillinger. I artiklen gennemgas nogle eksempler pa hvorledes man har grebet disse problemstillinger an. Herigennem argumenteres ogsa for, at denne teknologi sandsynligvis har nogle uudnyttede potentialer inden for det erhvervsokonomiske omrade.

Det »nye« i anvendelsen af kunstige neurale netværk på bl.a. det erhvervsøkonomiske område er begrebet om »lærende« systemer, d.v.s. systemer som er i stand til ud fra et empirisk erfaringsmateriale at lære nogle generelle sammenhænge (eller lidt flot:»teorier«) på et snævert afgrænset område, og ud fra denne »visdom« forudsige korrekte udviklinger og f eller foretage korrekte klassifikationer.

Af dette følger, at anvendelse af neurale netværk primært vil være interessant på områder, hvor man mangler gode teorier og feller modeller, eller hvor domænet er helt eller delvist uudforsket.

En teoris kvalitet kan, foruden forudsigelseskraften, ogsa vurderes pa dens forklaringskraft. Her har kunstige neurale netvasrk indtil videre en svaghed, idet den »visdom«, som et sadant netvjerk tilegner sig ved trasning, ikke er umiddelbart tilgasngelig i en form, som kan omsasttes til domasnefaglige begreber. Den visdom, som netvasrket besidder, er i en vis forstand en »black box«, bestaende af en matrice af numeriske v^erdier, som ikke direkte kan relateres til begreber fra tra;ningsmaterialet.

Det fremhæves ofte, at kunstige neurale netværk i højere grad end f.eks. traditionelle statistiske teknikker er i stand til korrekt at afdække eller »lære« komplek-

se mønstre i et givet datamateriale (Dutta & Shekhar,l9B9; Hansen & Messier, 1991). En del af forklaringen er, at anvendelse af kunstige neurale netværk ikke forudsætter f.eks. antagelser om bestemte fordelinger i datamaterialet, eller a priori formulering af funktionelle sammenhænge på matematisk form. Med andre ord er der færre kompleksitetsbegrænsninger, og hermed også mulighed for »læring« af særdeles komplekse sammenhænge i et givet erfaringsmateriale.

Hvordan fungerer kunstige neurale netværk?

Kunstige neurale netværk er i princippet bygget op med udgangspunkt i (eller snarere inspiration fra) den menneskelige hjernes biologiske funktionsmåde. De er i stand til at »lære« og genkende selv ret komplicerede mønstre i et givet datamateriale.

Til illustration af et kunstigt neuralt netværks funktionsmåde skal her gives en noget forenklet, principiel beskrivelse af en af de mest udbredte netværkstyper, det såkaldte Back Propagation Network (BPN), se side 59.

Et kunstigt neuralt netværk kan betragtes som bestående af et antal simple processorer (»neuroner«), som er forbundet til hinanden ved hjælp afledninger (»forbindelser«,»konnektorer«). Processorerne er organiseret i lag, således at en givet processor i et givet lag har forbindelser til alle processorer i laget »oven over« og i laget »neden under«.

Side 59

DIVL1036

Processorerne består hver for sig af 3 ele
menter:

1) en aktiveringsenhed, som summerer de
indkommende signaler fra laget neden
under til én værdi

2) en transformeringsfunktion, ved hjælp af hvilken det afgøres hvilket signal der skal sendes videre. Denne funktion kan have forskelligt udseende, alt afhængigt af netværkets konkrete anvendelse.

3) en outputenhed (har ikke noget at gøre med outputlaget), som sørger for at sende signalet videre til processorerne i laget »oven over«.

Ledningernelforbindelserne har udover at være transportveje for signalerne også den vigtige egenskab, at de bærer numeriske vægte. Det signal, som passerer gennem en given forbindelse, bliver multipliceret med den vægt, som er knyttet til denne forbindelse. D.v.s. at summeringen i den modtagende processor i virkeligheden er en vægtet summering af de signaler, som

ankommer til denne processor. Man taler om en exitatorisk forbindelse, hvis vægten er positiv, og en inh'ibitorisk forbindelse, hvis vægten er negativ. Disse vægtes værdier ligger ikke fast, men ændres under træningen, og det er bl.a. disse vægte, som på en ret abstrakt form udgør den »viden«, som netværket tilegner sig under oplæring.

Inputlag og outputlag

I forbindelse med såvel oplæring som test og brug af netværket har input- og outputlaget en særlig funktion. I inputlaget »fodres« det oplærte netværk med oplysninger om den foreliggende beslutningssituation. I outputlaget præsenteres beslutningsforslaget f konklusionen.

I mange tilfælde har konklusionen karakteraf en klassificering, hvorfor man i outputlaget vil anvende én neuron pr. muligtudfald. Værdierne på de enkelte outputneuronerkan så tolkes som den relativestyrke i konklusionen. \ed en klar konklusionvil én neuron have en høj værdi, og de resterende lave værdier. Ved en mere»usikker«

Side 60

re»usikker«konklusion vil evt. flere neuronerhave
samme høje værdi.

Multiple numeriske output kan også tolkes som et sammenhængende datasæt, f.eks. beskrivelse af en sandsynlig aktiekursudvikling over en periode.

Endelig kan man forestille sig anvendelser, som ikke omhandler numeriske in- og output, men istedet symbolske inf output, f.eks. transformering af tekst til tale og billedbehandling. I så fald sker der internt en »oversættelse« til ffra numeriske størrelser før input og efter output.

Træning af netværket

I modsætning til traditionelle computerprogrammer skal et kunstigt neuralt netværk ikke programmeres, men trænes med et hertil egnet værktøj. Dette sker ved at netværket gentagne gange præsenteres for et datasæt, bestående af eksempler på problemstillinger og deres rigtige løsning f konklusion.For hvert eksempel beregner netværket sit- eget forslag til outputværdi(er), og sammenligner dette forslag med den rigtige løsning fkonklusion.

Beregningen foretages ved at beskrivelsesdata puttes på processorerne i inputlaget som signaler. Herefter sendes disse signaler videre til næste lag i netværket, og udsættes her for den vægtede summering, transformation m.m. (som beskrevet ovenfor) for til sidst at ende som signaler i outputlaget. Disse værdier kan nu sammenlignes med de rigtige værdier fra træningssættet.

I de første gennemløb af træningssættet vil der typisk være tale om store afvigelser mellem de beregnede værdier og den rigtige løsning, eftersom vægtene i netværket initialt sættes til »tilfældige« værdier. Derfor vil systemet ved hjælp af en indlæringsalgoritme søge at korrigere for disse afvigelser ved en marginal justering af vægtene i den »rigtige« retning. Denne korrigering foregår ved hjælp af en slags »baglæns« beregning af afvigelserne ved de enkelte processorer. Efter et antal gennemløb af datamaterialet vil netværkets vægte have værdier, som gør det i stand til at beregne korrekte løsningsværdier for størstedelen af materialet, f.eks. 80 eller 95 %.

Om denne situation opnås er dog afhængigt af flere forhold. Designet af netværket kan være afgørende for, om deter i stand til at »lære« noget. Det kan være, at antallet af input- og outputneuroner ikke er passende til at beskrive alle relevante aspekter af problemstillingen. Også størrelsen af det »skjulte« lag er en vigtig designparameter. Populært betegnes disse skjulte lag som netværkets »hjerne«, d.v.s. jo større skjulte lag, jo mere komplekse mønstre kan netværket håndtere. Man er typisk henvist til at eksperimentere med forskellige design for at opnå det optimale. Successen afhænger også af datamaterialets beskaffenhed. Det kan f.eks. være, at der slet ikke er noget mønster i datamaterialet, som netværket kan lære, eller at datamaterialet indeholder atypiske eksempler, som er svære at passe ind i et generelt mønster. Her giver udviklingsværktøjerne gode muligheder for at udpege de »svære« eksempler, som så kan gøres til genstand for nærmere analyse.

Et fasrdigtraenet netvasrk skal naturligvis testes pa andre data m.h.p. at afgore gcneraliserbarheden af det indlserte. I denne forbindelse har man generelt gjort den iagtta^else, at selv netvaerk, som kun udviser »moderat« gode tneningsresultater

Side 61

(f.eks. 80 % ), har gode generaliseringsegenskaber, idet test på alternative datasæt udviser samme eller højere »opklaringsprocent«.

Forudsigelse af konkurser med neurale netværk

Problemstillingen er i dette projekt revisors »going-concern«-rapport (Hansen & Messier, 1991). En almindelig forudsætning i revisionsarbejdet er, at klientens virksomhed antages fortsat at eksistere, og klienten bliver derfor behandlet som sådan. Hvis revisor har en formodning om, at dette ikke vil være tilfældet, må revisionsrapporten reflektere dette. Det turde være indlysende, at en forkert vurdering af dette forhold har alvorlige konsekvenser såvel for revisionsfirmaet som for klienten.

I projektet undersøgtes det, hvorvidt forskellige teknikker (neurale netværk, induktionsmetoden (generering af beslutningsregler ud fra et erfaringsmateriale) og logisk regression (en statistisk teknik), er i stand til at støtte revisors beslutning om udstedelse af en sådan påtegning. Eller med andre ord: Hvor godt kan disse teknikker hver for sig forudsige en virksom-

heds konkurs.

Problemstillingen er tidligere belyst ved hjælp af statistiske metoder og induktive, regelgenererende metoder, hvilket giver nogle sammenligningsmuligheder. Endvidere repræsenterer denne problemstilling et komplekst sæt af input (oplysninger om virksomheden m.m.), som skal forbindes med et output (beslutningen), og således formuleret vurderes neurale netværk at passe godt til denne problemstilling.

Datamaterialet var hentet fra et tidligere studie af denne problemstilling og afgrænset til fremstillingsvirksomheder, som udviste finansielle problemer, og som henholdsvis fik eller ikke fik en sådan påtegning.

Sammenligningerne blev foretaget med logisk regression (LOGIT-proceduren i SAS-statistikpakken) og den regelinduktionsalgoritme, som er tilgængelig ved hjælp af Expert Ease. Oplæringsmaterialet bestod af 2 sæt, hver med 40 virksomheder af hver gruppe. Der var tale om et back-propagation netværk, med ét skjult lag. En model af netværket ser ud som følger (Hansen & Messier, 1991, s.140):


DIVL1087
Side 62

DIVL1089

Resultatet af eksperimentet var som følger (Hansen & Messier, 1991, s. 140):

Med andre ord ses det, at i denne forsøgsopstilling kan et neuralt netværk levere præstationer, som er fuldt ud på højde med mere traditionelle teknikker.

Anvendelse af neurale netværk i forbindelse med ligning af selvangivelser

Projektet (udført af NEuroTech og Kommunedata) vedrører anvendelse af neurale netværk til sortering eller prioritering af erhvervsdrivendes selvangivelser, med henblik på at udvikle et værktøj til hurtigere og mere .sikker identificering af selvangivelser med fejl og feller uregelmæssigheder, som et alternativ til en statistisk udvælgelsesmetode, og til aflastning af forvaltningens eksperter på området.

Pilotprojektet bestod i en forsogsvis oplasring af netvasrk baseret pa udvalg fra et datamateriale bestaende af ca. 17.500 selvangivelser fra 3 kommuner. Ud af samtlige felter pa disse selvangivelser valgtes ialt 113 felter som inputparametre. Outputtet var »nettoprovenu«, forstaet som forskellen mellem provenuet for ligning (d.v.s. hvis man accepterer de selvangivne tal som rigtige) og efter detaljeret ligning (d.v.s. en egentlig tilbundsgaende behandling). Nogle resultater fra dette pilotprojekt gengives i det folgende.

I et forsøg tog man 2828 selvangivelser med positive eller negative nettoprovenuer, og brugte en netværksarkitektur med 10 skjulte neuroner, samt 2 outputneuroner repræsenterende henholdvis positivt eller negativt nettoprovenu. Indlæringen steg jævnt mod 100%, dog måtte der ca. 4000 gennemløb til. Forsøget viser, at det tilsyneladende er muligt for netværket at afdække og »lære« nogle mønstre i datamaterialet.

I et andet forsog anvendtes igen et netvasrk med 10 skjulte neuroner og 2 outputneuroner. Der blev nu brugt 1472 selvangivelser, lige mange med henholdsvis positive og negative nettoprovenuer. De 1300 anvendtes til oplasring, og de 172 til test. Oplasringen gik som for problemfrit. Nettets generaliseringsevne blev testet pa den made, at man undervejs (for hvert gennemlob) stoppede op i indlasringen og testede det partielt oplasrte netvasrk pa de 172 testeksempler. Her stabiliserede netvasrkets generaliseringsevne sig pa et niveau pa ca. 70 %, d.v.s. at 70 % af testeksemplerne (som dette netvasrk altsa ikke havde set for) kunne forudsiges korrekt. Dette skal sammenlignes med 50 % ved et tilfyddigt ga^t. Omend dette resultat ikke i sig selv er imponerende, viser det dog, at

Side 63

der formodentlig er en generaliseringsmulighed. Datamaterialet er trods alt meget begrænset i forhold til en generalisering, idet man faktisk forsøger at dække 113 dimensioner af problemet med kun 1300 eksempler. Med et større datamateriale kunne denne generaliseringsevne formodentligt

I et tredie forsøg anvendtes det samme balancerede datasæt som ovenfor. Netværket bestod igen af 10 skjulte neuroner, men denne gang med kun én outputneuron. Denne skulle angive det korrekte nettoprovenu i kroner (i logaritmisk og skaleret form) inden for en tolerance på + f- 10%. Indlæringen steg også her jævnt. Generaliseringsevnen, målt på samme måde som ovenfor, stabiliseredes omkring de 30 %. D.v.s. i 30 % af testeksemplerne var det muligt for netværket at regne sig frem til en værdi, som lå inden for tolerancen. Dette skal sammenlignes med 20 % for et tilfældigt gæt.

Projektdeltagernes konklusion på dette pilotprojekt var dels, at det er muligt at bruge denne teknologi på denne problemstilling, idet det var muligt at lære netværkene en del af de mønstre, der ligger i disse data (d.v.s. en klassificering, som var signifikant bedre end en tilfældig tilordning), og dels at oplæringsmaterialet må forbedres væsentligt, for at netværkene kan nå et brugbart indlæringsniveau. Af samme grund vurderedes det, at de opnåede resultater derfor må betragtes som en nedre grænse for, hvad der er muligt på dette område med neurale netværk.

Et andet problem er, at i oplæringsmaterialet til pilotprojektet indgår kun oplysninger fra selvangivelsen. Disse oplysninger er, set med skattevæsenets øjne, meget getsummariske storrelser. En ligning vil typisk ogsa omfatte granskning af det tilhorende virksomhedsskema samt virksomhedens regnskab. For at opna en bedre generaliseringsevne i netvasrkene vil det altsa vasre nodvendigt at inddrage yderligere information i oplseringen. Information, som vides at vasre af betydning for den manuelle ligning, men som ikke er indgaet i datamaterialet, f.eks. nogletal fra regnskabet og »historik«-variable.

Projektets nasste fase har til hovedformal at udvikle et egentligt beslutningsstottevasrktoj, der integreres i det administrative miljo, som varetager ligningen. Systemet er, i sin endelige udformning, taenkt som en for- eller efterbehandling af en maskinel eller manuel gennemgang, d.v.s. en hurtigere og/eller mere effektiv identificering af de potentielt interessante sager. Dette bor i sidste ende betyde flere provenugivende sager pr. time pr. sagsbehandler (d.v.s. at man »spilder« mindre tid med detaljeret ligning af selvangivelser, som ikke har vassentlige fejl i oplysningerne).

Vurdering af værdipapirer med neurale netværk

Projektet (Dutta & Shekhar, 1989) vedrører udvikling af et neuralt netværk til risikoklassificering af obligationer, d.v.s. der er tale om amerikanske forhold, hvor obligationer kan udstedes af private virksomheder. Det er derfor relevant at vurdere disse bl.a. med hensyn til risiko.

Risikoen ved investering i en obligation gives en rating af forskellige uafhængige organisationer. Denne bruges som målestokfor risikoen ved investeringer i obligationer,og anvendes bl.a. til at definere tilladeligekøb

Side 64

ladeligekøbfor bestemte typer af investorer.Med henblik på at evaluere risikoen foretages en analyse af forskellige forhold ved den udstedende virksomhed, herunderdens evne og villighed til at betale. Der vides generelt meget lidt om, hvorvidt der anvendes modeller (og i givet fald hvilke) til denne vurdering. Situationen kompliceres yderligere, fordi ikke alle de forskellige variable kendes fuldt ud, og at f.eks. villigheden til at betale, påvirkes af et antal forhold, som er svære at karakteriserepræcist. Det er derfor vanskeligt præcist at definere en matematisk model, som kan præstere den ønskede rating med den ønskede pålidelighed.

Selve problemstillingen kan opfattes som et klassificeringsproblem: Givet et sæt af klasser og et sæt af inputdata (instantieringer), klart beskrevet ved hjælp af et passende sæt af karakteristika, forbindes hvert inputdata-instantiering med en af klasserne.

I dette tilfælde udgør de forskellige obligationsudstedelser sættet af inputdatainstantieringer, og de forskellige ratings udgør det sæt af mulige klasser, til hvilken de enkelte obligationer kan tilhøre. Hver obligationsudstedelse kan beskrives ved et sæt af karakteristika, som repræsenterer finansiel information om den pågældende virksomhed. Det eksakte sæt af karakteristika, som eksperter anvender ved disse vurderinger, kendes ikke præcist, men der findes dog en vis konsensus herom på området.

Til dette projekt er brugt et flerlags-netværk. Der er eksperimenteret med 2-lags (d.v.s. uden skjulte lag) og 3-lags-netværk. Valget af struktur i et neuralt netværk er meget afhængigt af domænet. Hvis inputtet tetbestår af ekstremt »low level features«, kan der være brug for et stort antal skjulte lag til successivt at ekstrahere »higher order features« fra inputtet. Et lavere antal skjulte lag er tilstrækkeligt, hvis inputtet i sig selv repræsenterer »higher order features«. I dette studie valgte man at bruge »higher order features« (nøgletal) af effektivitetshensyn, og det viste sig, at præstationerne ikke forbedredes signifikant med et højere antal skjulte lag (mere end ét skjult lag).

Valget af variable til dette projekt blev baseret på tidligere studier inden for området, og resultatet blev afgrænset til at skelne mellem AA-ratings (den højeste rating) og ikke-AA-ratings. Modellen (Dutta & Shekhar, 1989), ses side 65.

Der blev udvalgt 47 tilfældige obligationsserier fra 1986, som alle udløb på samme tidspunkt, fordelt på 30 til oplæring henholdsvis estimering af regressionskoefficienter, og 17 til test. Hovedresultater af forsøgene ses side 65.

De neurale netvasrk overgik saledes i dette forsog konsistent regressionsmodellen med hensyn til prsestationer. »Succesraten« (samlet antal rigtige klassifikationer) er generelt betragteligt liojere for det neurale netvasrk end for regressionsanalysen.

Resultaterne fra regressionsanalysen ligger ifølge forfatterne på niveau med tidligere opnåede resultater. Regressionsmodellens relativt dårlige præstationer indikerer ifølge forfatterne, at den lineære multivariate model er inadækvat til forklaring af dette domæne, og at der derfor er væsentlige gevinster ved at anvende neurale netværk på et domæne som dette.

Side 65

Vurdering


DIVL1169

DIVL1171

I det ovenstående er præsenteret nogle eksempler på anvendelse af neurale netværk. Mere generelt kan man sige, at den frugtbare anvendelse af neurale netværk i princippet ikke har så meget at gøre med områdets substans, men nærmere med fraværet af gode teorier/modeller, kombineret med adgang til eksemplariske problem-

løsninger og feller et konsistent erfaringsmateriale.

På nogle domæner findes veldefinerede modeller fteorier, ud fra hvilke det er muligtat foretage god problemløsning (det klassiske eksempel er her elektrisk kredsløbsanalyse).Andre domæner er karakteriseretved kun at have partielt definerede modeller (her nævnes det medicinske område,diagnosticering

Side 66

råde,diagnosticeringaf sygdomme ud fra symptomer og feller laboratorietests). På sådanne områder har man fundet anvendelsefor f.eks. regelbaserede systemer. Endelig findes der domæner, som er karakteriseretved et næsten komplet fravær af veldefinerede domænemodeller. Her kan konventionelle matematiske teknikkerkun vanskeligt anvendes, bl.a. p.gr.a. de krav som sådanne teknikker stiller. Det vil også være vanskeligt at konstruere regelbaseredesystemer på sådanne domæner,idet disse stiller krav om dyb viden om domænet.

Det er primært på domæner af sidstnævnte type at neurale netværk muligvis kan finde anvendelse. Bl.a. er neurale netværk generelt non-parametriske, og de stiller mildere krav til de underliggende fordelinger end traditionelle statistiske klassifikatorer. De vil derfor (Dutta, Shekar & W0ng,1992) principielt være mere robuste over for problemstillinger, som indebærer non4ineære processer, ikke-normalfordelt adfærd og »støj« i datamaterialet. Netværkenes adaptive natur tillader også, at modellerne kan adaptere ndringer tid i modellerne (netværket kan »videreuddannes« med nyt træningsmateriale). Endelig kræves der ikke detaljerede regler for domæneadfærd, men i stedet gode fvarierede eksempler på problemløsning. Dette kan vise sig at være en fordel for så vidt at en domæneekspert typisk vil have nemmere ved at fremdrage godef interessante eksempler på korrekt problemløsning, end at opstille håndfaste regler for sin bedømmelse.

Neurale netværk anvendt i forbindelse
med beslutningstøttesystemer kan således
potentielt bidrage til at udvide anven-

delsesområderne for sådanne støttesystemer, idet det hermed også er muligt at udvikle systemer på områder, som ikke har nogen veldefineret model.

En svaghed er, at netværkets viden om det generelle mønster findes i en »blackbox«-agtig form, d.v.s. i en matrice af numeriske vægte, som ikke på nogen direkte måde relaterer sig til domænespecifikke begreber. Vi kan altså ikke med domænespecifikke begreber forklare, hvilket mønster netværket har lært, eller hvorfor det opfører sig som det gør. En forklaring er kun mulig på niveau af netværkets tekniske primitiver (vægte, indlæringsalgoritmer m.m.). Det er altså ikke direkte muligt at indbygge egentlige forklaringsfaciliteter i et neuralt netværk.

Et andet problematisk forhold er, at trinvis problemløsning ikke er mulig. Neurale netværk er basalt »1-trins-modeller«. I mange problemstillinger indgår mellemregninger, interaktion med omverdenen m.m. som en del af problemløsningsprocessen. Repræsentation af struktureret viden (f.eks. begrebshierarkier) er også ret besværlig. Det mest naturlige er en »flad« repræsentation.

Endelig mangler neurale netværk modularitet. D.v.s. at et givet neuralt netværk er snævert rettet mod løsning af et afgrænset problem. Skal problemstillingen ndres udvides, må man begynde forfra med design og oplæring. Man kan ikke umiddelbart bygge flere oplærte netværk sammen.

Endeligt skal det vel også påpeges, at neurale netværk, i lighed med mere konventionelleprognoseteknikker, ikke kan lære »mere« end der ligger i oplæringsmaterialet.Kt oplært netværk vil altid generalisereud

Side 67

lisereudfra det lærte, og kan således ikke
forudsige f.eks. unikke udviklinger i aktiemarkedet.

Det særegne ved det kunstige neurale netværk er altså, at det principielt er i stand til at finde, lagre (»lære«) og genkende mønstre aflangt højere kompleksitet (og uden krav om en eksplicit matematisk model) end det er muligt med f.eks. lineære statistiske teknikker, dog på ret snævert afgrænsede problemområder.

Et neuralt netværk viser således en generaliseringsevne, idet det er i stand til på basis af erfaringsmateriale at finde generelle, komplekse mønstre. Det er endvider eksperimentelt påvist, at et oplært netværk besidder en kompletteringsevne, d.v.s. det er i stand til ud fra et generelt mønster at foreslå det rigtige output, også selv om inputtet er mangelfuldt (et eksempel er genkendelse af et bogstav ud fra en partiel beskrivelse). I tillæg hertil er de relativt robuste over for »støj« og mindre fejl i inputtet, idet netværket vil søge at indpasse tilfældet i det generelle mønster, og herudfra foreslå et output.

Kort sagt kan neurale netværk med en passende arkitektur og oplæring, og med en passende snæver afgrænsning af problemstillingen, generelt bidrage til bedre forudsigelser (i bred forstand, fra vurderinger til prognoser), men de kan ikke umiddelbart bidrage til bedre, forklaringer af sammenhængen i et domæne i en »forståelig« form.

Perspektiver

Perspektiverne for anvendelse af neurale netværk i en erhvervsøkonomisk sammenhæng er mangfoldige. I stort set alle erhvervsøkonomiske sammenhænge kendes

problemstillinger vedr. mangelfulde vurderings
- og beslutningsmodeller og utilstrækkelige

Mere specifikt arbejdes der inden for afsætningsøkonomien med udvikling af salgsprognoseværktøjer baseret på neurale netværk (Dutta & Shekhar, 1992). Inden for produktionsstyring og -planlægning er der udviklet systemer, bl.a. til optimering og overvågning af produktionsprocesser. I finanssektoren anvendes neurale netværk bl.a. til afsløring af potentielle kreditkortmisbrugere.

Generelt ses der en tendes til at afprøve denne teknologi på områder, hvor man traditionelt har benyttet sig af lineære statistiske og operationsanalytiske metoder som en tilnærmelse til det »rigtige«). Men perspektiverne stopper ikke nødvendigvis hermed. I og med at neurale netværk er gode til at finde komplekse mønstre, som ikke kan ses med det blotte øje, kunne man også forestille sig anvendelser inden for f.eks. revision (til gennemsøgning af klientens regnskab for »afvigende« transaktionsmønstre).

Inden for økonomistyringen kunne neurale netværk anvendes til at afdække kritiske forhold »under opsejling« i virksomheden (en slags »very early warning«). Det kunne være alt fra afvigende udviklinger i detailoplysninger, som ikke umiddelbart fremgår af perioderegnskabets summariske tal, til bemærkelsesværdige samspil af usædvanlige omstændigheder fudviklinger i regnskabstallene. Forhold, som muligvis vil undslippe controllerens kritiske analyse.

Forskningen i anvendelse af neurale netværk inden for det erhvervsøkonomiske område må nok siges stadig at befinde sig på et slags pionerstade. Tendensen er.

Side 68

at man eksperimenterer sig frem til lukrative anvendelsesomrader, hvilket ogsa betyder, at der muligvis kan hostes nogle konkurrencemasssige fordele ved at vsere pa forkant med anvendelsesmulighederne for denne teknologi. Et udbygget samarbejde mellem forskningsinstitutioner og virksomheder omkring eksperimentelt prasgede projekter af denne art kunne bidrage til et bredere erfaringsgrundlag, og samtidigt udbrede kendskabet til frugtbare anvendelsesomrader for denne teknologi

Summary

The article gives a basic, non-technical introduction to artificial neural networks. An example is given of the application of neural networks in connection with the going-concern problem. A current Danish project is presented concerning the application of neural networks in connection with tax assessment of income tax returns from sole proprietors, and also an example of neural networks application to the evaluation of firms.

Litteratur

Dutta, S. & Shekhar, S: An Aritificial Intelligence Approach to Predicting Bond Ratings, i: Pau, L.F., Motiwalla, J. & Pao, Y.H: eds.,£xpertSystems in Economics, Banking and Management Amsterdam: North-Holland,l9B9.

Dutta, S. & Shekhar, S: Generalizations with neural networks: An application in the financial domain, INSEAD, Fontaineblcu, I-ranee,

Dutta, S., Shekhar, S. & Wong, W.Y: Decision support in non-conserv/itrcf tlnniaws: (iciinahz/ition tilth neural networks, INSEAD, Fontainebleu,

Gutknecht, M. & Pfeifer, R:, An approach to integrating expert systems with eonnectionist networks, pp.116-127, AI Communications vol. 3 no. 3 sept 1990

Hansen, J.V. & Messier, W.F: Artificial Neural Networks: Foundations and application to a decision problem, pp.135-141, Expert Systems With Applications, vol. 3, 1991

MutchlerJ.F: A multivariate analysis of the auditor's going-concern opinion decision, pp. 668-682, of Accounting Research, 23,1985

Rasmussen, K.E: Anvendelse af kunstig intelligens-teknikker pa det erhvervsokonomiskc fagomrade - et studie af det teoretiske grundlag og ct antal praktiskc projekter, Licentiatafhandling, Handelshojskole Syd, 1993.

Rumelharc, D.E. & McClelland, J.L:, Parallel Distributed Processing. Vol. 1: Foundations, Cambridge, Massachusetts: The MIT Press, 1986

Stanley, J: Introduction to Neural
Networks, Sierra Madre, CA: California
Scientific Software, 1989