Konzeption und prototypische Realisierung einer begriffsbasierten Texterschließung

Design and prototypical implementation of a concept based approach towards information extraction

  • Gegenstand der Dissertation ist die Untersuchung der Fragestellung,welchen Einfluss das meist implizit zu Grunde liegende Begriffsverständnis auf die inhaltliche Erschließung von Texten hat. Ausgehend von der Überlegung, dass Begrifflichkeit auf dem Zusammenhang zwischen Sachverhalten beruht, wird die These verfolgt, dass dieser Zusammenhang auch in der schriftlichen Kommunikation wiederzufinden sei. Darauf aufbauend wir eine Vorgehensweise entwickelt, die Texte hinsichtlich auftretender Kommunikationsmuster untersucht, diese extrahiert und anwendet um neue Bezeichner für Begriffe zu identifizieren. Vorteil dieser Vorgehensweise ist, dass keine linguistische Vorverarbeitung und kaum Trainingsdaten nötig sind.
  • This thesis considers the influence of the notion of what a concept is for information extraction. Based on the idea that concepts are created in mind due to their context, the approach is developed. It is shown by means of prototypical implementation that the patterns of communication following this notion can be used for information extraction. The advantage is that no linguistic pre-processing is needed nor huge amounts of manually compiled training data.

Author:Sascha Lorenz
Advisor:Hans Czap
Document Type:Doctoral Thesis
Date of completion:2006/10/11
Publishing institution:Universität Trier
Granting institution:Universität Trier, Fachbereich 4
Date of final exam:2006/09/12
Release Date:2006/10/11
Tag:Communication; Information Extraction; Notion of Concept
GND Keyword:Bezeichnung; Diskretes Muster; Information Extraction; Kommunikationsstruktur; Natürliche Sprache
Institutes:Fachbereich 4 / Wirtschaftswissenschaften
Dewey Decimal Classification:0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik

