I worked together with the following students in student jobs, diploma/master thesis or internships:
iDocument: 01.11.2009 - now
Machine learning techniques for handwriting recognition on preprocessed paper. (Will be more conrete in near future)
01.09.2009 - now
Coupling handwriting recognition and ontology-based informaiton extraction for improving recognition ratios.
01.09.2009 - now
External project thesis at NEC. Topic is semi-unsupervized dictionary learning by googling.
01.07.2008 - 23.03.2009
This diploma thesis deals with the transfer of knowledge on invoice document layout and extraction strategies. This knowledge has been automatically generated by self-teaching mechanisms of the invoice analysis software smartFIX over several years of operation. We present results of analyzing this "treasure" of knowledge and putting it to use in smartFIX systems of new users. The evaluation shows that this transfer of knowledge using state-of-the-art techniques in transfer learning achieves significantly higher initial recognition rates than the unaugmented system, delivering instant economic advantages by reducing accountant personnel workload.
iDocument: 01.07.2008 - 30.09.2009
Mr. Sperber develops visualization widgets for iDocument. He also wrote test cases and analyzed document classification techniques for selecting relevant templates for certain docuemtn types.
iDocument: 01.04.2008 - 01.10.2008
Within this diploma thesis the developed project called iDocument NG covers the integration of paper documents into a personal information space by supporting the user with semantically extracted annotation proposals. The visualisation and the targeted interaction are performed directly on the document image or a representation close to the original document image. Several technologies have been used like the semantic information extraction system (iDocument), the new Optical Character Recognition (OCR) format (OCRopus' hOCR) and a semantic wiki system (Kaukolu wiki). The implementation of iDocument NG does support these requirements and will be presented and discussed within this thesis. A major point of this elaboration is the conceptual design of the Graphical User Interface based on several analyses like the state-of-the-art perspective. Furthermore the system architecture, its design and the encountered problems during the implementation as well are the second major point which will be presented within this diploma thesis. The final conclusion summarizes the achievements and the missing items, and ends with an outlook and consideration on further tasks.
TaskPad: 01.07.2006 - 30.09.2007
Mr. Georgiev further developed a rich client task management application called Taskpad. It is based on the results of project TaskPad.
OntoDav: 15.05.2007 - 31.09.2007
Mr. Woelfert developed a Webdav interface for a RDFS ontology with a focus on PIMO language.
DocuTag, domain ontology for KM group:
Mrs. Scheidel created a wonderful domain ontology about the Knowledge Management Department.
Nepomuk Repository Service for TaskPad:
Mr. Winkler developed a connection to synchronize tasks from Nepomuk Semantic Desktop with TaskPad.
Das Web 2.0 als Hilfsmittellandschaft für die Recherchec in der Translationswissenschaft
Die Diplomarbeit befasst sich mit Web-2.0-Anwendungen als Hilfsmittellandschaft für die übersetzerische Recherche. Verschiedene übersetzungswissenschaftliche Theorien beschreiben das Übersetzen von Texten als Handlungselement-in-Situation, das seitens des Übersetzers verschiedene sprach- und kulturmittlerische Kompetenzen voraussetzt und über die schlichte Umkodierung des jeweiligen Textmaterials hinausgeht. Ein maßgeblicher Faktor für die Qualität des Produktes Übersetzung ist die Recherche, da der Übersetzer als Experte ständig und stetig seine Wissensbestände erweitern muss, um die Effizienz und Qualität seiner Arbeit zu sichern. Sie kann bis zu 75% der Bearbeitungszeit eines Übersetzungsauftrags in Anspruch nehmen. Diese Tatsache erfordert den reflektierten und kompetenten Einsatz entsprechender Hilfsmittel. Untersucht wurde, ob webbasierte kollaborative Anwendungen eine flexible Zusammenarbeit unter Übersetzern auf Arbeitsteiligkeit und Spezialisierung ausgerichtet ermöglichen und somit die Effizienz der übersetzerischen Recherche steigern können. Hierzu wurden verschiedene so genannte Web-2.0-Anwendungen identifiziert und eine schriftliche Befragung unter professionellen Übersetzern durchgeführt, die Aufschlüsse über ihre Affinität gegenüber kollaborativer Anwendungen geben sollte. Basierend auf den gewonnenen Erkenntnissen wurde nachfolgend ein szenario-basierter Nutzertest mit angehenden Übersetzern durchgeführt. Als Umgebung hierzu diente die Social Media Sharing-Plattform ALOE. Es zeigte sich, dass unter Übersetzern eine Affinität zu webbasierten Anwendungen, die soziale und kollaborative Handlungen unterstützen, besteht, diese sich jedoch im professionellen Bereich und insbesondere im Hinblick auf die übersetzerische Recherche noch kaum durchgesetzt haben. Das Web 2.0 bietet mit seiner sozialen Komponente und flexiblen Technologien eine Vielfalt an Möglichkeiten für den Übersetzer. Vor allem die aktive Kollaboration der Übersetzer untereinander kann hierbei von entscheidendem Vorteil sein.
iDocument Sidebar Mock-up: 21.01.2008 - 01.02.2008
Mr. Stemler is going to develop UI mock-up for iDocument.