Doktorarbeit / Dissertation, 2025
328 Seiten, Note: 1,2 (A)
KAPITEL 0: EINFÜHRUNG
1. Motivationen und Vorstellung des Themas
2. Forschungsstand
3. Problemstellung, Fragestellungen und Hypothesen
4. Theoretische und methodische Vorgehensweise
5. Aufbau der Arbeit
ERSTER TEIL: TERMINOLOGISCHE ANNÄHRUNGEN (Computerlinguistik und Textlinguistik)
KAPITEL 1: COMPUTERLINGUISTIK (CL)
1.1. Gegenstandsbestimmung
1.1.1. Computerlinguistik als Fachbereich und computerlinguistische Fachgesellschaften
1.2. Methodische und theoretische Grundlage der Computerlinguistik
1.3. Computerlinguistische Systeme und Ihre alltäglichen Anwendungen
1.3.1. Texttechnologische Anwendungen
1.3.2. Dialogsysteme (Chatboots)
1.3.3. CL& DIDAKTIK
1.3.4. CL &WIRTSCHAFT : Berufsfelder von Computerlinguisten
KAPITEL 2: TEXTLINGUISTIK UND DIE ANAPHORIK
2.1. Zu Begriffen Text und Textlinguistik
2.1.1. Der Text
2.1.2. Die Textlinguistik
2.2. Zum Begriff Textgrammatik
2.2.1. Die Textkohäsion
2.2.2. Textkohärenz und Thematische Progression
2.3. Die Anaphorik
2.3.1. Anfänge der Forschungen zu Verweisphänomenen in der Textlinguistik
2.3.2. Die expliziten Anaphern
2.3.2.1. Explizite pronominale Anaphern
2.3.2.1.1. Personalpronomen, Relativpronomen, Possessivpronomen und Interrogativpronomen
2.3.2.1.2. Indefinitpronomen und Demonstrativpronomen
2.3.2.2. Die Nullanapher
2.3.2.3. Explizite Nominalphrasenanaphern
2.3.2.4. Pluralanaphern
2.3.2.5. Komplexe Anaphern
2.3.3. Die impliziten Anaphern
ZWEITER TEIL: THEORETISCHE ANNÄHRUNGEN (PRONOMINALADVERBIEN & AR-SYSTEME)
KAPITEL 3: PRONOMINALADVERBIEN (PAn) UND DIE ANAPHORIK: Das Pronominaladverb (PA) als Anapher
3.1. Adverb oder Adverbial: Begriffsbestimmung
3.2. Klassifikation von Adverbien: Inhaltliche und Funktionale Kriterien
3.2.1. Der inhaltliche Faktor: Semantische Klassen von Adverbien
3.2.1.1. Lokaladverbien - Adverbien des Ortes
3.2.1.2. Temporaladverbien - Adverbien der Zeit
3.2.1.3. Kausaladverbien - Adverbien des Grundes
3.2.1.4. Modaladverbien - Adverbien der Art und Weise
3.2.2. Nach dem Funktionalen Faktor: Funktionsklasse von Adverbien
3.3. Pro-Adverbien und Pronominaladverbien (PAn)
3.3.1. Pro-Adverbien
3.3.2. Pronominaladverbien oder Präpositionaladverbien? Formbestand und Wortbezeichnung
3.3.2.1. Allgemeinheiten
3.3.2.2. Pronominaladverbien vs Präpositionaladverbien
3.3.3. Gebrauch und Funktionen von Pronominaladverbien (PAn)
3.3.3.1. Allgemeinheiten zum Gebrauch von Pronominaladverbien
3.3.3.2. Grammatische Subkategorien von Pronominaladverbien:Nichtpronominaler Gebrauch von PAn?
3.3.3.2.1. Pronominaladverbien als Verbzusatz
3.3.3.2.2. Pronominaladverbien als Subjunktionen: Fall von „Damit“
3.3.3.3. Textlinguistische Funktionen von Pronominaladverbien: Pronominaler Gebrauch von PAn
3.3.3.3.1. Pronominaladverbien als Katapher: Die Pronominaladverbienkataphern
3.3.3.3.2. Pronominaladverbien als Deixis oder als Anapher
3.3.3.3.2.1. Die Da- und Hier- Pronominaladverbienanaphern
3.3.3.3.2.2. Die Wo- Pronominaladverbienanaphern
3.3.3.3.3. Prototypischer/ vorübergehender Algorithmus zur automatischen Auflösung von Pronominaladverbienanaphern
KAPITEL 4: ANSÄTZE UND THEORIEN ZUR AUTOMATISCHEN ANAPHERNAUFLÖSUNG: Algorithmen, AR-Ansätze und AR-Systeme
4.1. Historische und thematische Darstellung von bestehenden AR-Ansätzen; -Algorithmen und -Systemen (Von 1960 bis 1990)
4.1.1. Das System STUDENT von Bobrow (1964); SHERDLU von Winograd (1972); LUNAR von Woods &Co (1977) und der Algorithmus von Hobbs (1977)
4.1.2. Der BFP Algorithmus von Brennan, Friedman & Pollard (1987): Eine Implementation der Centeringtheorie
4.2. Computerlinguistische Ansätze, Algorithmen & Systeme zur Auflösung von koreferenten Pronominalanaphern (Personal- Possessiv- und Reflexivpronomina)
4.2.1. Auf Heuristiken basierende AR-Algorithmen und oder AR-Systeme für Pronomen im Deutschen und im Englischen.
4.2.1.1. Das AR-System von Shalom Lappin und Herbert J. Leass (1994)
4.2.1.2. Der wissensarme Ansatz von Kennedy & Bougarrev (1996): Die sogenannte KP-RAP
4.2.1.3. Die Übertragung von RAP ins Deutsche (G-RAP)
4.2.1.3.1. Der Ansatz von Hinrichs & Co. (2005)
4.2.1.3.2. G-RAP nach Hollger Wunsch (2010)
4.2.2. Auf Technik des Maschinenlernens basierende AR-Systeme: Einsatz der Künstlichen Intelligenz bei der automatischen Auflösung von Anaphern.
4.2.2.1. Künstliche Intelligenz (KI) und Maschinenlernen (ML)
4.2.2.1.1. Intelligenz und Intelligenzarten
4.2.2.1.2. Zum Begriff Künstliche Intelligenz (KI)
4.2.2.1.3. Das maschinelle Lernen (Machine Learning)
4.2.2.2. Einsatz des maschinellen Lernens (ML) bei der Auflösung von Anaphern
4.3. Entworfener Algorithmus zur automatischen Auflösung von Pronominaladverbienanaphern
DRITTER TEIL: EMPIRISCHER TEIL (HERSTELLUNG; EINSETZUNG UND AUSWERTUNG DES PAAR/TOOLS)
KAPITEL 5 Umwandlung des AR-Algorithmus ins AR-System: Entstehung des Pronominaladverbienanaphernreolvers (PAAR)
5.1. Algorithmen zur Ausschließung von kataphorischen/deiktischen PA
5.1.1. Der Filter für kataphorische hier- und da-PA
5.1.2. Der Filter für kataphorische/deiktische wo-PA
5.2. Angaben über die Auswahl des Parsers
5.3. Angaben über den Ausbau eines geeigneten morpho-orthographischen Taggers
5.4. Angaben über die Kollaboration mit dem Programmierer: Entstehung des PAARS
5.5. Aufbereitung der Datensätze und Einsatz des PAAR
5.5.1. Aufbau eines Textkorpus
5.5.1.1. Bestehende Textkorpora für korpuslinguistische Untersuchungen im Deutschen
5.5.2. Einsatz des PAAR aufs PAK (Pronominaladverbien-Korpus)
KAPITEL 6: AUSWERTUNG DES PAAR-EINSATZES: ANALYSEN, INTERPRETATIONEN, ERGEBNISSE UND HYPOTHESENPRÜFUNG.
6.1. Analyse und Interpretation des Einsatzes vom PAAR auf das Textkorpus
6.1.1. EINSATZ DES PAAR AUF DEN TEXT N°2
6.1.2. EINSATZ DES PAAR AUF DEN TEXT N°3
6.1.3. EINSATZ DES PAAR AUF DEN TEXT N°4
6.1.4. EINSATZ DES PAAR AUF DEN TEXT N°5
6.1.5. EINSATZ DES PAAR AUF DEN TEXT N°6
6.1.6. EINSATZ DES PAAR AUF DEN TEXT N°7
6.1.7. EINSATZ DES PAAR AUF DEN TEXT N°8
6.1.8. EINSATZ DES PAAR AUF DEN TEXT N°9
6.1.9. EINSATZ DES PAAR AUF DEN TEXT N°10
6.1.10. EINSATZ DES PAAR AUF DEN TEXT N°11
6.1.11. EINSATZ DES PAAR AUF DEN TEXT N°12
6.1.12. EINSATZ DES PAAR AUF DEN TEXT N°13
6.1.13. EINSATZ DES PAAR AUF DEN TEXTABSCHNITT (N°14-20)
6.1.14. EINSATZ DES PAAR AUF DEN TEXTABSCHNITT ( N°21-30)
6.1.15. EINSATZ DES PAAR AUF DEN TEXTABSCHNITT ( N°31-50)
6.2. Ergebnisse der Einsatzaktion: Berechnung der Präzision von PAAR
6.3. Hypothesenprüfung; Schlussbetrachtung und Ausblicke
Ziel der Arbeit ist die Entwicklung eines Informatik-Systems namens PAAR, das die automatische Auflösung von Pronominaladverbienanaphern in deutschen Texten ermöglicht. Die Forschungsarbeit geht der Fragestellung nach, wie ein solches System unter Berücksichtigung computerlinguistischer Ansätze und der Integration semantischer sowie pragmatischer Heuristiken konzipiert werden kann, um über herkömmliche, rein syntaktisch arbeitende Verfahren hinauszugehen.
Die Anaphorik
Das Wort Anaphorik bezieht sich, etymologisch betrachtet, auf das griechische Verb ἀναφέρειν. Dieses griechische Verb hat die gleiche Bedeutung mit den deutschen Verben herauftragen und sich beziehen (auf etwas) (Wiktionary). Demnach kann das Wort Anaphorik sowohl für Rückwärts- als auch für Vorwärtsverweise gebraucht werden. Jedoch wird diesem Wort in der Sprachwissenschaft eine Rückwärtsbedeutung zugeschrieben (M.Schwarz 1997: 445-456). In dieser Hinsicht wird der Begriff Anaphorik in den textlinguistischen Forschungen als der Verweis eines Satz- oder Textteiles (Anapher) auf einen anderen, vor ihm stehenden Satz- oder Textteil (Antezedent) aufgefasst (Konrad Ehlich2007: 23). Man unterscheidet im allgemeinen zwei Arten von Anaphorik: Die direkte und die indirekte, wobei jeweils zwischen intrasentialer (Anapher und Antezedent stehen im selben Satz) und intersentialer (Anapher und Antezedent stehen in verschiedenen Sätzen) Anaphora zu unterscheiden ist (Schwarz-Friesel, Monika/Consten, Manfred, 2007: 268).
Eine anaphorische Konstruktion (Anaphorik) wird als direkt genannt, wenn sie durch Anwendung morphosyntaktischer Regeln aufgelöst (also interpretiert bzw. verstanden) werden kann. Hingegen wird eine anaphorische Verbindung als indirekt genannt, wenn sie außer grammatischen Kenntnissen noch zusätzliche Wissen (Text-und Weltwissen) für ihr Verständnis voraussetzt (vgl. M. Schwarz 2000b: 118).
KAPITEL 0: EINFÜHRUNG: Dieses Kapitel erläutert die Motivation des Forschungsprojekts, den Forschungsstand sowie die methodische Vorgehensweise und den Aufbau der Arbeit.
KAPITEL 1: COMPUTERLINGUISTIK (CL): Dieser Abschnitt definiert den Begriff Computerlinguistik und beleuchtet deren theoretische Grundlagen sowie aktuelle Anwendungsfelder.
KAPITEL 2: TEXTLINGUISTIK UND DIE ANAPHORIK: Hier wird das Phänomen der Anaphorik in den textlinguistischen Kontext eingebettet und verschiedene Anapherntypen werden theoretisch klassifiziert.
KAPITEL 3: PRONOMINALADVERBIEN (PAn) UND DIE ANAPHORIK: Dieses Kapitel bietet eine tiefgehende Analyse von Pronominaladverbien als Wortart und deren textlinguistische Eigenschaften.
KAPITEL 4: ANSÄTZE UND THEORIEN ZUR AUTOMATISCHEN ANAPHERNAUFLÖSUNG: Dieser Teil präsentiert einen historischen Überblick über bestehende Algorithmen und Systeme zur Anaphernauflösung.
KAPITEL 5: Umwandlung des AR-Algorithmus ins AR-System: Entstehung des Pronominaladverbienanaphernreolvers (PAAR): Die Umsetzung des theoretischen Algorithmus in ein lauffähiges informatisches System (PAAR) mittels Python wird hier beschrieben.
KAPITEL 6: AUSWERTUNG DES PAAR-EINSATZES: ANALYSEN, INTERPRETATIONEN, ERGEBNISSE UND HYPOTHESENPRÜFUNG.: Das Kapitel enthält die Evaluierung des PAAR-Systems anhand eines Testkorpus sowie die Prüfung der aufgestellten Hypothesen.
Computerlinguistik, Anaphernauflösung, Pronominaladverbien, Textlinguistik, Algorithmus, Maschinelles Lernen, künstliche Intelligenz, Syntax, Textkohäsion, Textkohärenz, Anaphorik, Katapher, Deixis, Korpuslinguistik, PAAR-System.
Die Arbeit beschäftigt sich mit der Entwicklung eines Informatik-Systems zur automatischen Identifizierung und Auflösung von sogenannten Pronominaladverbienanaphern (wie "daran", "hierauf", "womit") in deutschen Texten.
Die zentralen Felder sind die theoretische Computerlinguistik, die Textlinguistik (insbesondere Anaphorik) sowie die technische Implementierung von Algorithmen zur automatischen Sprachverarbeitung.
Das Ziel ist die Entwicklung eines Algorithmus, der Pronominaladverbien im Text erkennt, ihre Art (anaphorisch, kataphorisch, deiktisch) bestimmt und bei anaphorischem Gebrauch den richtigen Antezedenten korrekt identifiziert.
Es wird ein heuristischer Ansatz verwendet, der auf morphosyntaktischen Regeln basiert, ergänzt durch eine empirische Evaluierung mittels eines selbst konfigurierten Textkorpus (PAK) und Programmierimplementierung in Python.
Der Hauptteil behandelt die linguistische Theorie von Anaphern und Adverbien, analysiert existierende Anaphernauflösungssysteme und detailliert die Entwicklung sowie Evaluierung des PAAR-Tools.
Computerlinguistik, Anaphernauflösung, Pronominaladverb, Textkohäsion, PAAR, automatisierte Sprachverarbeitung, Parser.
PAAR ist in der Lage, Pronominaladverbien innerhalb eines automatisierten Prozesses von anderen Verwendungsweisen (wie Subjunktionen) zu unterscheiden und ihre anaphorische Natur in über 70% der Fälle korrekt aufzulösen.
Während sich die meisten bestehenden Systeme auf Personalpronomen konzentrieren, leistet diese Arbeit Pionierarbeit bei der spezifischen Behandlung von Pronominaladverbien, die als anaphorische Konstruktionen semantisch komplexer sind.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

