Filtern
Sprache
- Deutsch (1)
- Mehrsprachig (1)
Schlagworte
- Luxembourgish (2) (entfernen)
Institut
- Germanistik (2) (entfernen)
Die Beschäftigung mit dem Luxemburgischen unter phraseologischem Gesichtspunkt ist ein Phänomen der jüngsten Forschungen, das erst im Laufe der letzten beiden Jahrzehnte vermehrt Aufmerksam gefunden hat. Trotz einer bereits soliden Grundsteinlegung bietet die Phraseologie des Luxemburgischen noch reichlich Untersuchungsfläche. Die Dissertation "Formelhafte Sprache in der Chambre des Députés: Eine empirische Untersuchung der Phrasemverwendung im Luxemburgischen anhand der öffentlichen Sitzungsprotokolle der Abgeordnetenkammer" befasst sich mit dem Gebrauch des Luxemburgischen in politischen Reden, mit Schwerpunkt auf formelhafter Sprache, sogenannten Phraseologismen, wie etwa Routineformeln (z. B.: Dir Dammen an Dir Hären…; wéi scho gesot…), Sprichwörter (z. B.: Déi aarm Leit kache mat Waasser; Wie schnell geet, geet duebel), Paarformeln (z. B.: de Sënn an den Zweck; ëmmer an iwwerall), komparative Phraseologismen (z. B.: eppes läit engem um Mo wéi eng Zill) und andere vorgefertigte Sprachelemente, die meistens in einer verfestigten Form vorkommen und häufig dazu dienen, bestimmte Kommunikationssituationen zu bewältigen. In diesen Reden spielen Phraseologismen unbestreitbar eine wichtige Rolle, seien es bewusst eingesetzte Wortverbindungen, die rhetorisch überzeugen sollen oder unbewusst vorkommende Phraseologismen, die den Redefluss und die Formulierung erleichtern. Zudem zeigt die Formelhaftigkeit sich in dieser Textsorte umso stärker, weil es in den Sitzungen der Abgeordnetenkammer, ebenso wie in anderen Parlamenten auch, eine Fülle von fest vorgeschriebenen Abläufen und festgelegte Rollen mit eigenen ritualisierten Redeanteilen gibt. Die in den stenographischen Protokollen aufgezeichneten Reden und Debatten aus dem luxemburgischen Parlament bilden also die Grundlage der Untersuchung. Im Vorfeld wurde ein Untersuchungkorpus zusammengestellt, indem die betreffenden Sprachelemente (Phraseme) manuell exzerpiert wurden. Diese wurden in eine Datenbank eingetragen, nach mehreren Kriterien klassifiziert und mit zusätzlichen Metainformationen angereichert. Der Hauptteil der Untersuchung besteht in der Analyse der im Textkorpus vorkommenden Phraseme innerhalb ihres Kontextes in den Abgeordnetenreden, um die unterschiedlichen (stilistischen, rhetorischen, etc.) Funktionen und Effekte herauszuarbeiten, die sie in den jeweiligen Redestellen erfüllen. Dieses Vorgehen ist von großer Bedeutung, um zu erkennen, wie wichtig solche verfestigten Ausdrücke und formelhaften Elemente für die Sprache sind und welche zentrale Rolle sie in den untersuchten Reden und im Luxemburgischen im Allgemeinen spielen. Daneben werden auch quantitative Aspekte untersucht (z. B. allgemeine Phraseologismenfrequenz; Verteilung auf unterschiedliche Phraseologismusklassen; Phrasemvorkommen in unterschiedlichen Zeitschnitten), damit die ausgewählten Texte auch mit anderen Textsorten oder mit Parlamentsreden aus anderen Sprachen vergleichbar sind hinsichtlich des Gebrauchs von formelhaften/phraseologischen Elementen.
Die Arbeit setzt sich mit den theoretischen und praktischen Aspekten der Analyse und Edition eines literarisch wichtigen Textes mit Methoden der Digital Humanities sowie der Korpus- und Computerlinguistik auseinander. Als Materialgrundlage dient das luxemburgischsprachige Werk des Michel Rodange. Hierzu gehören die Werke "Renert oder de Fuuss am Frack an a Maansgréisst" - ca. 35.000 Tokens, "Dem Léiweckerche säi Lidd" - ca. 5.000 Tokens, "Dem Grof Sigfrid seng Goldkuemer" - ca. 10.000 Tokens und zwei Gedichte - ca. 500 Tokens. Auf der empirischen Seite handelt es sich um die Erstellung eines elektronischen Korpus mit historisch-kritischen und linguistischen Annotationen und dessen Darstellung im Internet als Webportal. Dabei entsteht eine Wechselwirkung zwischen Theorie und Praxis, so werden die erstellten Annotationen verwendet, um das Werk aus sprach- und literaturwissenschaftlicher Perspektive zu untersuchen; diese Erkenntnisse können dann wiederum bei der Implementierung der Tools eingesetzt werden, um den Korrektheitsgrad der automatischen Annotation zu erhöhen. Die historisch-kritischen Annotationen beinhalten beispielsweise Lesarten, Korrekturen sowie Worterklärungen, wohingegen die linguistischen Annotationen die Orthographie, Morphologie (Wortklassen und Lemmata) und Phraseologie betreffen. Die Annotationen werden in der Markup-Sprache XML kodiert. Der erste Schritt der Erstellung eines elektronischen Korpus ist die Digitalisierung der Texte. Bei den Handschriften geschah dies mithilfe einer manuellen Transkription, bei den Drucken wurde auf eine OCR-Software zurückgegriffen. Es empfiehlt sich, bereits in dieser Phase den Text gut zu strukturieren und mit Annotationen zu versehen. Dabei wurden zunächst Metadaten festgehalten. Anschließend wurden Informationen wie Seitenzahl, Zeilenumbrüche etc. als Annotationen hinzugefügt. Von besonderer Bedeutung für die Erstellung eines Korpus aus einem historisch und literarisch wichtigen Text ist jedoch seine Anreicherung mit historisch-kritischen Kommentaren. Die Untersuchung und Berücksichtigung der literarischen bzw. wissenschaftlichen Gattung historisch-kritische Edition stellt die theoretische Grundlage für solche Annotationen dar. Alle für die Editionswissenschaft relevanten Texthinweise, -bruchstücke und vom Autor durchgestrichene und gelöschte Stellen wurden dokumentiert. Bei schlecht lesbaren Stellen wurden Lesemöglichkeiten vorgeschlagen und die anderer Editionen diskutiert. Die Text Incoding Initiative (TEI) bietet eine Fülle von XML-Elementen, um solche Annotationen zu speichern. Um diese Arbeit nicht manuell ausführen zu müssen, wurde auf Tools wie TUSTEP, oXygen oder Skriptsprachen wie beispielsweise Perl zurückgegriffen. Diese können u. a. die Such- und Ersetzen-Arbeiten mithilfe der Regulären Ausdrücke bedeutend erleichtern. Den nächsten Schritt der Korpus-Erstellung stellt die Tokenisierung dar. Hierbei gehen die historisch-kritischen Annotationen in linguistische Annotationen über. Die Grenzen eines Wortes werden festgelegt und jedes Wort mit seinem eigenen Element versehen. Aus der digitalen Verarbeitung nicht wegzudenken ist dabei die Berücksichtigung und Untersuchung der Sprache des Autors. In diesem Fall wurde auf Aspekte wie die Dichtungsstile des Luxemburgischen im 19. Jahrhundert, die literarischen Gattungen der Texte sowie die Schreibung des Autors geachtet. Der empirische Anteil der Analyse mit EDV-technischen Methoden und die Speicherung der Ergebnisse als Annotationen stellt die wissenschaftliche Basis für die spätere digitale Präsentation dar. In der Arbeit werden die Ergebnisse der quantitativen und qualitativen Analyse der Sprache des Werks mithilfe von selbstimplementierten Programmen diskutiert. Dabei werden die vorhandenen Theorien sowohl der klassischen Linguistik z. B. aus der Morphologie oder der Phraseologieforschung, als auch der Korpuslinguistik besprochen und evaluiert. Die Implementierung und Ergebnisse folgender Programme für das Michel Rodange Korpus werden thematisiert: Tokeniser, FreqList, POS-Trainer, POS-Tagger, Lemmatisierer und Programme zur morphologischen und phraseologischen Analyse des Korpus. Der POS-Tagger kann die Wortarten im Korpus bestimmen. Grundlage dafür sind die sogenannten Hidden Markov Modelle, die auf der Wahrscheinlichkeitstheorie basieren. Der Lemmatisierer und das Programm zur morphologischen Analyse arbeiten hauptsächlich regelbasiert, wohingegen das Programm für die phraseologische Analyse anhand statistischer Verfahren wie dem Z-Test, dem Chi-Quadrat-Test und dem Exakten Test von Fisher implementiert wurde. So widmet sich beispielsweise Kapitel 3.4 dem Output der morphologischen Analyse und diskutiert die Wortbildung. Kapitel 3.6 beschäftigt sich mit der Interpretation der Phraseologismen. Hierbei zeigte sich, dass viele der automatisch identifizierten Phraseologismen aus Michel Rodanges Werken in der Tat ein fester Bestandteil nicht nur der luxemburgischen Sprache und Kultur sind, sondern sich auch in der gesamten westlichen Kultur wiederfinden.