Suche   SiteMap
Home
A bis Z
BIB-KAT
Andere Bibliothekskataloge
Digitale Medien
Dokumentlieferung
Fachspezifische Informationen
Suchhilfen und Datenbanken
 
Eingang zum Volltext in OPUS

Hinweis zum Urheberrecht

Dissertation zugänglich unter
URN: urn:nbn:de:hbz:385-3732
URL: http://ubt.opus.hbz-nrw.de/volltexte/2006/373/


Nachbarschaften im semantischen Raum

Neighborhoods in semantic space

Wegner, Armin

pdf-Format:
Dokument 1.pdf (1.447 KB)

Bookmark bei Connotea Bookmark bei del.icio.us
SWD-Schlagwörter: Semantik, Bedeutung, Cluster-Analyse, Fuzzy-Menge, Assoziation, Semantischer Raum, Vektorraummodell
Freie Schlagwörter (Deutsch): Wortbedeutung, Bedeutungsrepräsentation, Bedeutungsähnlichkeit, quantitative Bedeutungsanalyse, empirische Semantik, Ähnlichkeitsmaß, Termassoziat
Freie Schlagwörter (Englisch): word meaning, semantic similarity, quantitative semantics, empirical semantics, term association, cluster analysis, semantic space, vector space model
Institut: Linguistische Datenverarbeitung
Fakultät: Fachbereich 2
DDC-Sachgruppe: Sprachwissenschaft, Linguistik
Dokumentart: Dissertation
Hauptberichter: Rieger, Burghard (Prof. Dr.)
Sprache: Deutsch
Tag der mündlichen Prüfung: 21.06.2006
Erstellungsjahr: 2006
Publikationsdatum: 01.08.2006
Kurzfassung auf Deutsch: Es werden die mathematischen Methoden und algorithmischen Verfahren der Clusteranalyse im Hinblick auf Bedeutungsrepräsentationen untersucht. Im Rahmen der deskriptiven und explorativen Datenanalyse werden die Voraussetzungen und Bedingungen des clusteranalytischen Ansatzes und die Möglichkeiten seiner Anwendung diskutiert, die zur adäquaten Ermittlung und Beschreibung von Gruppierungen von Bedeutungspunkten im semantischen Raum verwendet werden, welche nach räumlicher Lage und topologischen Nachbarschaften den Ähnlichkeiten von Bedeutungen sprachlicher Zeichen in Texten entsprechen. Dabei ist die große Anzahl frei wählbarer Parameter und der Einfluß, den jede Wahl eines der bekannten clusteranalytischen Verfahren in Bezug auf die vorauszusetzenden Vorkenntnisse von der Struktur der zu untersuchenden Daten auf die Güte der erwartbaren Ergebnisse hat, eine bekannte Schwäche der Clusteranalyse. Diese generelle Problematik belastet die Abschätzbarkeit von Erfolg und Adäquatheit unüberwachter Klassifikationsverfahren weit über die quantitativ-linguistischen Untersuchungen in der Gebrauchssemantik hinaus. Deshalb wird ein neues Verfahren entwickelt, welches den analysierten Daten in geringerem Maße als bisher Strukturen aufprägt und in höherem Maße als bisher von den analysierten Daten und ihren Strukturen gesteuert wird.
Kurzfassung auf Englisch: Mathematical methods and algorithms in cluster analysis are studied with respect to meaning representation. The prerequisites and conditions of the cluster analytical approach within descriptive and exploratory data analysis as well as the possibilities of its application are discussed. The methods described can be utilised for adequate determination and description of groups of meaning points in semantic space, whose spatial locations and topological neighborhoods correspond to similarities of word meanings in texts. Known weaknesses of cluster analysis are on one hand the number of free parameters and on the other hand the influence on the quality of the expected results exerted by the choice of traditional cluster criteria since each of them implies particular constraining assumptions about the structure of the data. This general problem causes some difficulty in predicting the success and the adequacy of unsupervised classifications, with implications reaching far beyond the domain of quantitative linguistics proper. To overcome these difficulties a new cluster procedure is invented that is mainly driven by the data and its structure and does not that strongly impose a certain implied model on the data.

Home | Suchen | Veröffentlichen | Hilfe | Viewer