Projektarbeit
oder Hiwi-Job
"SiteNorm – Ein Werkzeug zur Normalisierung von Web-Inhalten
mit Hilfe von Internet-Werkzeugen und KI-Techniken"
Im Forschungsprojekt FRODO werden Methoden und Werkzeuge zum Aufbau und zur Wartung von verteilten, heterogenen Unternehmensgedächtnissen (organizational memories) für eine informationstechnische Unterstützung des Wissensmanagements entwickelt. In diesem Kontext spielt die Akquisition neuen Wissens eine besondere Rolle. Eine Möglichkeit dafür ist die Analyse von Web-Inhalten aus dem Inter- und Intranet. Eine Voraussetzung hierbei ist die zielgerichtete Aufarbeitung und Normalisierung der Web-Inhalte, die meist durch semantisch sehr schwache HTML-Seiten repräsentiert sind. Dies wird durch die Mode der Verwendung von Frames, Bildern und Tabellen für das Layout und die Verwendung von Imagemaps und Javascript zur Darstellung der Linkstruktur erheblich erschwert.
Im Rahmen der Projektarbeit oder des Hiwi-Jobs soll ein System konzipiert und prototypisch implementiert werden, das Web-Inhalte in einem mehrstufigen Prozeß mit Hilfe von Internet-Werkzeugen (HTML- und XML-Parser/Generatoren, XSLT-Skripte etc.) und KI-Techniken (z.B. regelbasierte Systeme, Dokumentanalysetechniken) normalisiert, und zwar durch Überführung in XML-Dateien mit vorgegebenen DTDs.
Anforderungen:
Bei Interesse:
Michael
Sintek
Deutsches Forschungszentrum
für Künstliche Intelligenz
Forschungsgruppe Informationsmanagement und Dokumentanalyse
Geb. 57/375
Tel.: 205-3460
sintek@dfki.uni-kl.de