In dem Maße, in dem die Flut in Firmen und im Internet zugreifbarer Dokumente ansteigt, werden Techniken und Hilfsmittel zum automatischen Auffinden, Klassifizieren, Organisieren und zur automatischen Extraktion interessanter Fakten von Textdokumenten wichtiger für die effiziente Informationsverarbeitung in Unternehmen.
Das automatische Dokumentverstehen befaßt sich:
Die dabei verwendeten Methoden kann man sich ähnlich
zu Parsing-Techniken aus Programmiersprachen vorstellen, mit dem Unterschied,
daß die Problemstellung aufgrund des wesentlich größeren
Variantenreichtums der dahinterliegenden "Grammatiken" deutlich aufwendiger
ist.
Auf der anderen Seite gibt es vielfältige Potentiale zur Verbesserung der Analyseergebnisse:
All diese Ansätze laufen letztendlich darauf hinaus, daß
unterschiedliche Softwaremoduln in koordinierter Weise Informationen austauschen.
Es liegt daher nahe, in diesem Bereich die Eignung von Multiagentensystemen
als neuem Programmierparadigma zu untersuchen, bei dem es darum geht, daß
weitgehend autonome, intelligente Softwareeinheiten auf einem sehr hohen,
problemangemessenen Abstraktionsniveau kommunizieren, um kooperativ ein
Problem zu lösen.
In dieser Diplomarbeit soll für ein noch näher zu spezifizierendes, überschaubares Anwendungsbeispiel (z.B. Verstehen von Homepages) eine existierende Grobkonzeption zum Einsatz von Agentensystemen verfeinert und prototypisch implementiert werden. Dies umfaßt insbesondere die Auswahl geeigneter Analysespezialisten aus einer Menge existierender Softwaretools, die Auswahl einer Agentenplattform zur Umsetzung von Kommunikation und Kooperation, die Festlegung der Informations-typen und "Sprechakte" zum Nachrichtenaustausch zwischen Agenten, die Basismodellierung der vorliegenden Dokumenttypen und -strukturen, sowie die prototypische Umsetzung und Evaluierung der Ergebnisse.
Kontakt:
In Kooperation zwischen dem DFKI (Deutsches Forschungszentrum für Künstliche Intelligenz) und der Universität Kaiserslautern, Fachgebiet Wasserbau und Wasserwirtschaft - Prof. Koehler, wurde ein Konzept entwickelt, wie sich Vorhersagemodelle für Abflüsse nach Niederschlägen (z.B. für die Hochwasservorhersage einsetzbar) durch Fehlerminimierung auf der Basis gemessener Beispielereignisse verbessern lassen.
Die Fehlerminimierung soll als heuristischer Suchprozeß für gewisse Parameterwerte durchgeführt werden, wobei nutzbares Hintergrundwissen in Form einer Fuzzy-Regelbasis über die Fließvorgänge vorliegt. Bei der Implementierung des Vorhabens fallen verschiedene Aufgaben an, die sich im Rahmen einer Projekt- oder Diplomarbeit bearbeiten lassen, wie z.B.:
Wir bieten dafür ein interessantes, interdisziplinäres, hochgradig anwendungsrelevantes Thema, eine gute Rechnerausstattung, ein Basis-System, das schon praxiserprobt ist, viele Freiheitsgrade bei der Bearbeitung, sowie Unterstützung durch ein ganzes Team engagierter Leute, die sich mit den verschiedenen Teilaspekten des Problems auskennen.
Weitere Auskünfte bei: Andreas Abecker, Raum 57/374, Tel. (0631) 205-3456, e-mail aabecker@dfki.uni-kl.de
Zum Thema ist eine Projektarbeit bereits in Arbeit, weitere Arbeiten wären möglich.
Das DFKI-Projekt VEGA befaßt sich mit der Wartung von Wissens- und deduktiven Datenbanken (Updates, Fehlersuche, Änderungsmanagement). In diesem Kontext behandeln wir auch die Frage, wie man aus relationalen Daten (i.a. Datalog-Grundfakten oder -Regeln) kompaktere, allgemeinere Darstellungen induktiv lernen kann (z.B. eine Regel statt mehrerer Fakten).
Zu diesem Zweck wurde der Algorithmus RelGen ( Generierung von Relationen ) entworfen und in einer einfachen Form prototypisch implementiert. RelGen ist ein Bottom-Up-Verfahren zum Erzeugen neuer Relationen aus bestehenden. Als Grundprinzip wird dabei festgestellt, ob Relationen in den Wertebereichen von Attributspalten gleiche oder ähnliche Konstantenmengen enthalten. Ist das der Fall, haben die Relationen schon einmal etwas miteinander zu tun und wir bilden ihren Equijoin als potentiell interessante neue Relation. Das läßt sich in mehreren Iterationsstufen fortsetzen, so daß man zunehmend komplizierte Zusammenhänge aus den Daten extrahiert.
Wir möchten die Idee von RelGen etwas ausarbeiten und das Verfahren in einer effizienten Implementierung vernünftig in unsere Toolbox zur Wissensbasis-Wartung einpassen. Im Rahmen dieses Vorhabens lassen sich verschiedene Ansatzpunkte für Arbeiten identifizieren, aus denen je nach persönlichen Interessen und Zielsetzungen (Projekt- oder Diplomarbeit) ein oder mehrere herausgegriffen und ausgearbeitet werden können. Z.B.:
Weitere Auskünfte bei: Andreas Abecker, Raum 57/374, Tel. (0631) 205-3456, e-mail aabecker@dfki.uni-kl.de