Insolvenzprognose aus Jahresabschlußdaten:
eine
harte Nuß für Mensch und Maschine
Projektkurzbeschreibung:
Durchführung: DFKI GmbH, Forschungsbereich
"Intelligente Ingenieursysteme"
in Zusammenarbeit mit der Universität
Kaiserslautern,
Mitarbeiter: Prof. Michael M. Richter
(Leitung), Knut Hinkelmann, Ralph Bergmann,
Andreas Abecker,
Wolfgang Wilke
Projektziel: Automatisches Erlernen von Kriterien zur
Erkennung mittelfristig
insolvenzgefährdeter Kreditkunden auf
der Basis ihrer Jahresabschlußdaten
Nebenziele: Potentialanalyse für "Data Mining" im
Finanzbereich,
Beiträge zum Aufbau einer Data Mining
Infrastruktur bei der SYSTOR AG,
praxisbezogene Einschätzung
und Bewertung von Verfahren und Werkzeugen
Die Ausgangsdaten:
- ca. 700 Kundenbeispiele
- Beschreibung jedes Kunden durch 341 Attribute, die die Bilanz aus
1992 charakterisieren
- Ferner die reale Klassifikation: wurde dieser Kunde 2 Jahre später
von seinem Kreditsachbearbeiter als "gefährdet" eingestuft oder
nicht?
Die Aufgabe:
Kann man aus diesen Beispieldaten automatisch lernen, welche
Bilanzkonstellationen dazu führen, daß ein Kunde zwei Jahre
nach der Datenerfassung als "gefährdet" eingestuft wird?
Woher kommen die Daten?
Ausgangspunkt ist das CUBUS System der SYSTOR AG zur
Bilanzbewertung. CUBUS ist ein regelbasiertes Expertensystem, das in
mehreren Aggregationsstufen aus "rohen" Zahlenwerten der Bilanz durch
zunehmende Interpretation mit Hilfe von Expertenwissen und
Zusammenfassung einzelner Werte zu abstrakten Kenngrößen
immer stärker verdichtete Information zur Verfügung stellt:
Welche Verfahren wurden untersucht?
- Statistische Verfahren: Multivariate Diskriminanzanalyse
- Maschinelles Lernen: Induktion von Entscheidungsbäumen und
Neuronale Netze
- Fallbasiertes Schließen: nächster Nachbar-Prinzip
Probleme bei der Extraktion von Entscheidungsregeln:
- Viele Lücken in der Datenbasis.
- Klassifikation als gefährdet kann eine Fehleinschätzung
des Sachbearbeiters gewesen oder durch externe Faktoren (unabhängig
von der Bilanz) verursacht worden sein.
- Die Verfahren erwarten i.a. mehr Beispiele.
- Es gibt keine Anhaltspunkte, welche Attribute für die Einschätzung
wichtig sind.
Ergebnisse:
- Sowohl statistische als auch einfache
Entscheidungsbaumverfahren bekommen das Problem nicht in den Griff.
- Ansatzpunkte für eine Lösung finden sich durch
Erweiterung und Kombination von maschinellen Lernverfahren und beim
fallbasierten Schließen.
- Das Expertenwissen des CUBUS-Systems - das ursprünglich zur
Bilanzanalyse konzipiert wurde - trägt essentiell zur
Klassifikation bei, so daß sich eine Erweiterung des
regelbasierten Expertensystems durch Techniken des Maschinellen Lernens
anbietet.
- Data Mining Techniken können Hinweise auf in den Daten
verborgene Zusammenhänge liefern, die dem Benutzer noch nicht
bekannt waren.
- Kommerzielle Tools unterscheiden sich beträchtlich in
Leistungsumfang und Benutzerfreundlichkeit.
Deutsches
Forschungszentrum für Künstliche Intelligenz GmbH
Dr. Knut Hinkelmann
Postfach 2080
67608 Kaiserslautern
Tel.: (0631) 205-3467 Fax: (0631) 205-3210