• Treffer 11 von 61
Zurück zur Trefferliste

Konzeption und prototypische Realisierung einer begriffsbasierten Texterschließung

Design and prototypical implementation of a concept based approach towards information extraction

  • Gegenstand der Dissertation ist die Untersuchung der Fragestellung,welchen Einfluss das meist implizit zu Grunde liegende Begriffsverständnis auf die inhaltliche Erschließung von Texten hat. Ausgehend von der Überlegung, dass Begrifflichkeit auf dem Zusammenhang zwischen Sachverhalten beruht, wird die These verfolgt, dass dieser Zusammenhang auch in der schriftlichen Kommunikation wiederzufinden sei. Darauf aufbauend wir eine Vorgehensweise entwickelt, die Texte hinsichtlich auftretender Kommunikationsmuster untersucht, diese extrahiert und anwendet um neue Bezeichner für Begriffe zu identifizieren. Vorteil dieser Vorgehensweise ist, dass keine linguistische Vorverarbeitung und kaum Trainingsdaten nötig sind.
  • This thesis considers the influence of the notion of what a concept is for information extraction. Based on the idea that concepts are created in mind due to their context, the approach is developed. It is shown by means of prototypical implementation that the patterns of communication following this notion can be used for information extraction. The advantage is that no linguistic pre-processing is needed nor huge amounts of manually compiled training data.

Volltext Dateien herunterladen

Metadaten exportieren

Weitere Dienste

Teilen auf Twitter Suche bei Google Scholar
Metadaten
Verfasserangaben:Sascha Lorenz
URN:urn:nbn:de:hbz:385-3770
DOI:https://doi.org/10.25353/ubtr-xxxx-df47-b124
Betreuer:Hans Czap
Dokumentart:Dissertation
Sprache:Deutsch
Datum der Fertigstellung:11.10.2006
Veröffentlichende Institution:Universität Trier
Titel verleihende Institution:Universität Trier, Fachbereich 4
Datum der Abschlussprüfung:12.09.2006
Datum der Freischaltung:11.10.2006
Freies Schlagwort / Tag:Communication; Information Extraction; Notion of Concept
GND-Schlagwort:Bezeichnung; Diskretes Muster; Information Extraction; Kommunikationsstruktur; Natürliche Sprache
Institute:Fachbereich 4 / Wirtschaftswissenschaften
DDC-Klassifikation:0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik

$Rev: 13581 $