Psychologisches Institut I und
Institut für Experimentelle Audiologie (Biomagnetismuszentrum) der
Westfälischen Wilhelms-Universität Münster
MEG - Untersuchung der Sprachperzeption anhand des
Einflusses der Stimmhaftigkeit und des Artikulationsortes auf
evozierte kortikale Magnetfelder
Diplomarbeit
vorgelegt
am 15.04.1997 von Hans Menning
Inhaltsverzeichnis
1 Vorbemerkungen------------------------------------------------------------------ 1
2 Wie wirkt Sprache im Gehirn?------------------------------------------------ 5
2.1 Wissenschaftstheoretische Vorüberlegungen --------------------------------------- 6
2.2 Herangehensweise ------------------------------------------------------------------------ 7
3 Grundlagen der Sprachperzeption---------------------------------------- 11
3.1 Theorien der Sprachperzeption------------------------------------------------------ 12
3.1.1 Phonetische Grundlagen der Sprachperzeption -------------------------------------------- 23
3.1.1.1 Die Grundeinheiten der Sprache: Sprachlaute -------------------------------- 24
3.1.2 Distinktive Merkmale ------------------------------------------------------------------------- 25
3.2 Neurophysiologische und neuroanatomische Grundlagen der
Sprachperzeption --------------------------------------------------------------------------------- 26
3.3 Die kortikalen Strukturen der Sprache (BRODMAN-Areale, BROCA- und
WERNICKE -Areal) ------------------------------------------------------------------------------- 27
3.4 Lokalisationstheorien ------------------------------------------------------------------ 31
3.5 Lateralisation der Sprachverarbeitungsprozesse -------------------------------- 35
3.6 Grundlagen der Verarbeitung distinktiver phonetischer Merkmale -------- 38
3.6.1 Der Ort der Artikulation (OA) --------------------------------------------------------------- 39
3.6.2 Stimmhaftigkeit (VOT) ----------------------------------------------------------------------- 41
4 Methodische Grundlagen ---------------------------------------------------- 44
4.1 Grundprinzipien der Magnetoenzephalographie -------------------------------- 44
4.1.1 Was ist Biomagnetismus?--------------------------------------------------------------------- 44
4.1.2 Pro und Contra der Magnetoenzephalographie -------------------------------------------- 44
4.2 Elektrophysiologische Grundlagen der neuromagnetischen
Quellenlokalisation ------------------------------------------------------------------------------- 46
4.2.1 Die Aktionspotentiale - „Sprache“ der Neuronen ----------------------------------------- 46
4.2.2 Fortleitung des Aktionspotentials------------------------------------------------------------ 48
4.2.3 Das Quellenmodell des äquivalenten Stromdipols ---------------------------------------- 50
4.2.4 Das Kopfmodell-------------------------------------------------------------------------------- 54
4.2.5 Das inverse Problem--------------------------------------------------------------------------- 54
i
4.3 Aufbau des 37-Kanal-SQUID-Meßsystems---------------------------------------- 56
4.3.1 Funktionsweise und wichtige Kenndaten --------------------------------------------------- 57
5 Die Methodik der Auditorisch Evozierten Antworten -------------- 61
5.1 Klassifikation und Nomenklatur der AEP und AEF ---------------------------- 62
6 Experimentelle Untersuchung der AEF, die durch Stimmhaftigkeit
und Artikulationsort in beiden Hirnhälften hervorgerufen werden--- 66
6.1 Hypothesen ------------------------------------------------------------------------------- 66
6.2 Experimentelles Design ---------------------------------------------------------------- 72
6.3 Das Stimulimaterial -------------------------------------------------------------------- 73
6.3.1 Der Vokalraum --------------------------------------------------------------------------------- 75
6.3.2 Generierung der Stimuli----------------------------------------------------------------------- 76
6.4 Durchführung des Experiments ----------------------------------------------------- 79
6.4.1 Probanden--------------------------------------------------------------------------------------- 79
6.4.2 Vorbereitungen: Audiogramm, Händigkeits- und Diskriminationstest ----------------- 80
6.4.3 Die MEG-Messungen ------------------------------------------------------------------------- 83
6.4.4 Die steady-state-Stimulation-------------------------------------------------------------- 85
6.5 Datenanalysen --------------------------------------------------------------------------- 85
6.5.1 Reduktion des Rauschens------------------------------------------------------------------------- 85
6.5.2 Artefaktausschluß und Mittelungsprozedur ---------------------------------------------------- 86
6.5.3 Quellenanalyse ------------------------------------------------------------------------------------- 88
6.5.0 6.5.4 Statistische Analysen ------------------------------------------------------------------- 90
6.5.5 Latenz- und Amplitudeneffekte -----------------------------------------------------------------107
6.5.6 Lokalisationen-------------------------------------------------------------------------------------118
7 Ergebnisse -----------------------------------------------------------------------129
8 Diskussion -----------------------------------------------------------------------132
9 Zusammenfassung und Ausblick ----------------------------------------137
10 Glossar -------------------------------------------------------------------------139
11 Literaturverzeichnis--------------------------------------------------------142
12 Anhang -------------------------------------------------------------------------152
ii
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
1 Vorbemerkungen
Die Funktionsweise unseres Gehirns ist trotz modernster Technik noch weitgehend rätselhaft. Doch jedes Rätsel veranlaßt uns, darüber nachzudenken und nachzuforschen, wie es zustande kam und wie es funktioniert. Eine große Anzahl von Wissenschaftlern aus den verschiedensten Forschungsbereichen forscht in dieser „Dekade des Gehirns“, den 90er Jahren des 20. Jahrhunderts, an diesem hochkomplexen Forschungsobjekt, das gleichzeitig Subjekt ist und unser aller Denken, Fühlen und Handeln entscheidend kontrolliert.
Die Psychologie, die sich seit jeher mit der Erforschung der Wahrnehmung, der Kognition, der Emotion, der Motivation oder Volition und des menschlichen Verhaltens, um einige der wichtigsten Themenbereiche zu nennen, beschäftigt, kann sich nicht auf „beobachtbares Verhalten“ allein beschränken, wenn sie ihrem Anspruch, die Beweggründe, Regeln und Gesetzmäßigkeiten menschlichen Denkens, Fühlens und Handelns verstehen, beschreiben und erklären zu wollen, gerecht werden will. Zu diesem Zweck muß sie sich auch in Bereiche hineinwagen, die ein Ergründen der neurophysiologischen und -psychologischen Prozesse im Gehirn unter Anwendung der neuesten Forschungsmethoden ermöglichen.
1
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
Die neuen (nichtinvasiven) bildgebenden Verfahren (Positronen-Emissions-Tomographie (PET), die einen regionalen zerebralen Blutfluß mißt, die Kernspin(resonanz)tomographie (NMR) bzw. funktionale Magnetresonanztomographie (fMRT), Single-Photon-Emissions-Computer-Tomographie (SPECT) oder die magnetoenzephalografische Ermittlung einer neuronalen Quelle der magnetischen Feldstärken einer kortikalen Aktivität (Magnetoenzephalogramm: MEG) sowie die ältere nichtinvasive elektroenzephalografische Ableitung von Potentialdifferenzen an der Kopfoberfläche (EEG), die auf die zugrundeliegende Gehirnaktivität schließen lassen, erlauben heute schon ungeahnte Möglichkeiten des Einblicks in die Funktionsweise und die Mechanismen des Gehirns. Ein Gehirnforscher, der sich solcher Mittel des Einblicks in das menschliche Denken bedient, hält gewissermaßen eine Lupe über die verschiedenen Funktionseinheiten des Gehirns - seien es nun einzelne Neuronen oder ganze Zellverbände aus Nervenzellen, sogenannte Neuronale Netze, oder das Gehirn als Ganzes - und betrachtet die den basalen bis hochkomplexen kognitiven Vorgängen zugrundeliegende neuronale Aktivität; er bestimmt unter festgelegten äußeren Stimulationsbedingungen die Zusammenhänge zwischen den experimentellen Variablen und den untersuchten neuronalen Antworten.
Die Befunde, die in diesen neurophysiologischen Experimenten erhoben werden, werden in einer Sprache beschrieben, in der die Eingangs-und Ausgangsbedingungen eines begrenzten Abschnitts des Gehirns eindeutig festgelegt sind. Die dabei festgestellte neuronale Aktivität wird in Begriffen der Sprache des Wissenschaftlers festgehalten, der sich dadurch mit einer Wissenschaftlergemeinschaft (der sog. scientific community) verständigen kann, der dadurch seine Befunde ordnet und ihnen Bedeutung verleiht. Damit wird jedoch über die Arbeitsweise des Gehirns nur soviel gesagt, wie es die Sprache des Wissenschaftlers erlaubt, da das Gehirn seine Aktivität unabhängig von den Begriffen, mit denen es beschrieben wird, quasi über diese Begriffe hinaus entfaltet. Die hier vorliegende Arbeit wurde unter Rücksichtnahme auf diesen Sachverhalt verfaßt: ihre Methode und Ergebnisse sind eng an die Sprache
2
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
und das Bezugssystem gebunden, in dessen Rahmen die Untersuchung stattfand.
Um Sprache soll es in dieser Arbeit gehen, genauer: um die der Sprachperzeption zugrundeliegende neuronale Aktivität. Die Gehirnaktivität während der Perzeption von Sprache kann auf viele verschiedene Arten beschrieben werden. So wird ein Psycholinguist sich eher für Einheiten der Sprachwahrnehmung (Phoneme, Silben, Wörter), die Aktivierungssequenzen dieser Einheiten und die Art des Aufrufens, der Verknüpfungen und der Reproduktion der einzelnen Informationseinheiten interessieren. Ein Neuropsychologe wird die dabei vorkommenden Sprachstörungen untersuchen und verstehen wollen, und ein Neurophysiologe wird sich mehr auf Fragestellungen konzentrieren, die die Mechanismen innerhalb der Nervenzellen oder innerhalb von Nervenzellenverbänden betreffen. Ein Erforscher der Künstlichen Intelligenz oder ein Kybernetiker werden die Gehirntätigkeit anhand von Neuronalen Netzen simulieren und reproduzieren wollen. Er/sie wird die Tätigkeit des Gehirns mithilfe der Sprache, die die Aktivität eines Rechners beschreibt, versuchen zu erfassen: als ein geschlossenes, sich ständig neu ordnendes Kreisen der neuronalen Aktivität, als ein sich ständig neu errechnendes Errechnen (v. FÖRSTER, 1985).
Auch könnte man die Tätigkeit (sofern hier überhaupt von „Tätigkeit“ die Rede sein kann) des Gehirns beim Verstehen der Sprache im Rahmen einer Selbstorganisationstheorie als einen aktiven Ordnungsbildungsprozeß bezeichnen, der selbstorganisatorisch einen stabilen und eindeutigen Ord-nungszustand herbeiführt.
Allen gemeinsam ist jedoch, daß sie verstehen wollen, mit welchen Prozessen im Gehirn die Verarbeitung der Sprache als eines Signalsystems zur Kommunikation mit der Außenwelt einhergeht, was Sprache im Gehirn bewirkt und welche Gehirnaktivitäten für Sprache verantwortlich sind. Unsere Sprache reicht nur soweit, wie wir denken und wahrnehmen können. Wir schaffen uns Modelle von unserer Welt, von unseren Mitmen-
3
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
schen, von unserer Persönlichkeit und nicht zuletzt von der Funktionsweise unseres Nervensystems, die auf unser Wissen, auf unsere Beobachtungen und Experimente gründen, die aber nur zu einem gewissen Grad identisch sind mit der Welt, die sie beschreiben. Wir nehmen wahr, was wir als wahr annehmen, was sich bis auf weiteres nicht als „unwahr“ oder inexistent erweist.
Aus dieser Perspektive beschreiben die nachfolgenden Ausführungen die wahrgenommene Aktivität des Cortex cerebralis und verzichten auf den Anspruch, die ganze „wahre“ Aktivität beschreiben zu können. Wie das Gehirn die ankommenden Sprachsignale wahrnimmt und verarbeitet, ist das Thema dieser Arbeit. Die der Sprachperzeption zugrundeliegende neuronale Aktivität wird operationalisiert, d.h. sie wird in einem experimentellen Design unter bestimmten Stimulibedingungen räumlich und zeitlich eingegrenzt, die eingehenden (sprachlichen oder nichtsprachlichen) Signale werden auf zwei, drei wesentliche Merkmale reduziert, die dadurch hervorgerufene („evozierte“) Antwort wird gemessen und durch Mittelungen ebenfalls auf ihre wesentlichen Bestandteile reduziert, die somit vergleichbar und interpretierbar werden.
Die Fähigkeit zur Sprache hat ihren Ursprung in relativ umgrenzten Gehirnstrukturen, den sog. Sprachzentren, die sich zusammen mit dem peripheren Sprachapparat entwickelt haben. Diese der Sprachverarbeitung zugrundeliegenden neuronalen Strukturen liegen asymmetrisch über beide Hirnhälften verteilt. Welche neurophysiologischen Strukturen und psycholinguistischen Mechanismen der Sprachperzeption zugrundeliegen, ist Ge-genstand dieser Arbeit.
4
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
2 Wie wirkt Sprache im Gehirn?
Der Impetus für das Aufnehmen dieser Arbeit ging von dem Begehren aus, das "Verstehen" zu verstehen, gleichwohl diese Arbeit nur ein kleines Steinchen im Mosaik dieses Anliegens sein kann. Dabei soll es um keine spezielle Erscheinungsform des Verstehens gehen, sondern um die grundlegende, alle Formen des Verstehens durchziehende menschliche Fähigkeit des Sprachverstehens. Dabei ist schon die Frage: "Was ist Sprache?" oder "Wie wirkt Sprache?" Teil der Antwort, weil wir diese Fragen ohne Sprache nicht stellen könnten.
Es wird um Aspekte des Funktionierens der Sprachperzeption auf einer neurobiologisch-physiologischen Ebene gehen. Und zwar speziell um die Prozesse der Perzeption von bestimmten Sprachmerkmalen, die für das Erkennen eines Sprachlautes konstituierend sind. Welche Teile des Gehirns sind daran beteiligt? Welche Neuronen oder Neuronenverbände arbeiten in welcher Weise bei der Sprachperzeption zusammen? Was geht im Gehirn vor sich, wenn wir Sprache "perzipieren"? Wie kommt Sprache im Gehirn an und was macht sie auf dem Weg zum verstandenen Wort? Wie kommt das verstandene Wort zustande? Welche Entsprechung hat Sprache auf neuronaler Ebene? Gibt es im Bereich der Sprachperzeptionähnlich wie bei der visuellen Perzeption von geometrischen Figuren - sogenannte Merkmalerkennungsneurone? Diese und ähnliche Fragen waren der Ausgangspunkt für diese Arbeit. Diese Fragen sprengen zwar den Rahmen dieser Arbeit. Nichtsdestotrotz ist diese Arbeit nur im Rahmen dieser Fragen sinnvoll.
5
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
2.1 Wissenschaftstheoretische Vorüberlegungen
Es sei mir hier erlaubt, kurz auf die in dieser Arbeit implizierten wis-senschaftstheoretischen Prämissen wissenschaftlichen Vorgehens einzugehen. Die „Wahrheit“ einer wissenschaftlichen Theorie wird nicht als etwas als erwiesen geltendes Absolutes angenommen, sondern als eine (nicht falsifizierte) Konstruktion der Wirklichkeit im Sinne einer iterativen „Errechnung von Beschreibungen“ der Realität (v. FÖRSTER, 1981). Eine wissenschaftliche Theorie setzt sich aus einem Konglomerat von signifikant wahrscheinlich bestätigten Hypothesen und Annahmen zusammen, deren Bestätigung, Falsifizierung oder Exhaustion noch aussteht. „Theorien sind nicht verifizierbar; aber sie können sich bewähren.“ (POPPER, 1973, S. 198). Je weniger falsifizierte Hypothesen zu einer Theorie existieren, um so größer ist der Erklärungswert dieser Theorie. Je öfter sie jedoch eingesetzt und damit überprüft wird, desto mehr sind auch Ergebnisse möglich, die sie falsifizieren und damit einschränken. Durch die Überprüfung von einzelnen Hypothesen wird die Theorie präziser und eingegrenzter, die Hypothesen sind spezifische Ausformulierungen der Theorie und ihre Bestätigung oder Widerlegung sticht das Feld ab, für das die Theorie noch Gültigkeit besitzt. Deshalb gilt:
Die experimentelle Falsifikation einer als bewährt anerkannten Theorie ist es also, die einen Fortschritt einleitet. Durch sie wird eine Auslese erzwungen, in der sich jene Theorie am besten behauptet, die am strengsten überprüft werden kann und bisherigen strengen Überprüfungen standgehalten hat. Ihre Vorhersagekraft, auf die es letzten Endes ankommt, muß erhalten bleiben. Eine Theorie, die nichts (oder alles) vorhersagen kann, ist von geringem Nutzen und sie hat für den Wissenschaftler nur dann Wert, wenn sie Annahmen trifft, die von den experimentell ge-
6
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
wenn sie Annahmen trifft, die von den experimentell gewonnenen Daten auch falsifizierbar sind. In diesem Sinn-Zusammenhang sei die nachfolgende experimentelle Herangehensweise verstanden.
2.2 Herangehensweise
Wenn das „Hauptziel des wissenschaftlichen Arbeitens die Verdichtung von Einzelinformationen und Beobachtungen zu allgemeingültigen theoretischen Aussagen“ (BORTZ, 1993) sein soll, muß eine Herangehensweise gewählt werden, die zuerst eine möglichst genaue und vom Beobachter möglichst wenig beeinflußte Datengewinnung ermöglicht. Diese Daten dienen dann als beobachtete Einzelinformationen ihrerseits dazu, das theoretische Grundgerüst für neue Aussagen über die Realität „an sich“ zu machen.
In dieser Arbeit wurde zur Überprüfung theoretischer Annahmen an-hand von empirischen Daten zur Gewinnung neuer theoretischer Ergänzungen nach folgendem Algorithmus (vgl. BORTZ, 1993, S.1ff.) vorgegangen:
In einer „vorwissenschaftlichen Erkundungsphase“ wurde das Thema „Sprachperzeption“ abgegrenzt, die einschlägige Literatur in Augenschein genommen sowie die Einordnung in gängige psycholinguistische und neurophysiologische theoretische Konzepte gewagt, einzelne Beobachtungen wurden induktiv zu allgemeinen Schlußfolgerungen und gewonnene Einsichten deduktiv auf Beispiele und empirische Überprüfungsmöglichkeiten ausformuliert, bis sich ein theoretisches Gebilde ergab, das eine hinreichende Basis für die nachfolgende Untersuchung abgab. In der „theoretischen Phase“ wurde überprüft, ob die theoretischen Grundlagen, von denen ausgegangen wurde (die im nächsten Kapitel erläutert werden), logisch konsistent sind, ob sie präzise, mit anderen Theorien vereinbar und empirisch überprüfbar, also auch falsifizierbar sind (vgl. OPP, 1970). Es gilt zu überprüfen, welche Schwächen die theoretischen Konzepte, auf denen die folgende Untersuchung aufbaut, in sich birgt und diese gegebenenfalls zu klären und auszumerzen oder eine neue Theorie
7
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
zu entwickeln, die dann einer neuen theoretischen Überprüfung ausgesetzt wird.
Sofern die theoretischen Grundlagen (Kapitel 3) diese Kriterien der Präzision, logischen Struktur, Konsistenz, Vereinbarkeit mit alternativen Theorien und empirischen Überprüfbarkeit erfüllten, wurden sie für die weitere Vorgehensweise herangezogen.
Ziel dieser Untersuchung ist jedoch nicht, das zugrundeliegende the-oretische Gebäude zu bestätigen oder zum Einsturz zu bringen, sondern im besten Fall einen daraus abgeleiteten Teilaspekt zu falsifizieren oder zu verifizieren, eine Hypothese, wie sie in Kapitel 6.1 ausformuliert ist, bzw. einen neuen Aspekt einer Theorie, zu überprüfen. In der „Planungsphase“ wurde die Untersuchung als experimentelles Laborexperiment konzipiert und die unabhängigen Variablen „Stimmhaftigkeit“, „Ort der Artikulation“, „vokalischer Kontext“ und „Hirnhemisphäre“, als auch die abhängigen Variablen, die untersuchten Komponenten des zeitlichen Verlaufs: N 1 m, P 2 m, P 3 m, N 4 m, SF (sustained field) 1 und die räumlichen Lokalisationsparameter der einzelnen Dipole festgelegt. Als Kontrollvariable diente jeweils eine steady-state-Stimulation, die wie eine Landmarke den auditorischen Kortex markierte und die Perzeption der Sprachmerkmale gegen die eines Sinustones 2 kontrastierte. Als Kontrollvariable der phonetischen Merkmale der „Stimmhaftigkeit“ und „Ort der Artikulation“ diente die Variable „Vokalischer Kontext“. Diese Variable wurde miteinbezogen, um zu prüfen, ob sie die abhängigen Variablen moderiert bzw. um zu prüfen, in welchem Maße diese von ihr beeinflußt werden. Sie ist demnach eher eine Moderatorvariable. Konstant gehaltene Variablen waren Raum und Zeit der Untersuchungen (jeweils gleicher Raum, gleiche Zeit für die Messungen beider Hirnhälften: jeweils an zwei Vormittagen oder an zwei Nachmittagen, die Anzahl der Vormittags- und Nachmittagsmessungen wurde ausbalanciert), gleicher Versuchsleiter für alle Probanden (Pbn.), gleiche Händigkeit
1 Die Nomenklatur der Komponenten richtet sich nach den aus dem EEG bekannten Bezeichnugen mit dem Zusatz “m” für “magnetisch” (N 1 m, P 2 m, P 3 m, N 4 m). Gebräuchlich sind bei MEG-Messungen jedoch auch die Bezeichnungen M 100 , M 200 , M 300 , M 400 oder einfach M 1 , M 2 , M 3 , M 4 , die auf eine Angabe der im MEG so nicht vorhandenen Polarität verzichten.
8
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
(rechts) der Pbn., ebenso wurden Instruktionen und Diskriminations-test gleich gehalten, die potentiell einen Einfluß hätten haben können, aber für das Ziel dieser Untersuchung unwichtig waren. Die Operationalisierung der abhängigen, unabhängigen und Kontrollvariablen folgte der bei MEG-Messungen von akustischen Signalen und Sprachlauten üblichen Methodik, wie sie weiter unten erläutert werden wird. In der eigentlichen „Untersuchungsphase“, der Phase der Datenerhebung, wurden an 13 Probanden (Pbn.) 3 die kortikalen Antworten während der Perzeption und Verarbeitung der phonetischen Merkmale „Stimmhaftigkeit“ und „Ort der Artikulation“ in unterschiedlichem vokalischem Kontext auf beiden Hirnhemisphären gemessen, nachdem die Pbn. mit Elektroden beklebt wurden und einen Diskriminationstest durchgeführt hatten. Anschließend an jede Messung wurde eine steady-state-Stimulation mit einem kurzen sinusförmigen 1000 Hz Ton vorgenommen, um eine „Landmarke“ im primären auditorischen Kortex zu setzen. Die Daten wurden sofort auf magneto-optische Platten gesichert.
In der „Auswertungsphase“ wurde das Rauschen in den Daten erst über das weiter unten erläuterte noise reduction - Verfahren reduziert, dann wurden die Herz- und Augenbewegungsartefakte herausgefiltert und die einzelnen „Ereignisse“ über alle in einer Messung vorkommenden Ereignisse derselben Art gemittelt, die Rohdaten in einem komprimierten Format gespeichert und die so erhaltenen Daten auf ihre testtheoretische Brauchbarkeit überprüft.
Nach Feststellung der Tauglichkeit wurden die Daten einer inferenzstatistischen Auswertung unterzogen. In der „Entscheidungsphase“ wurde geprüft, in welchen Fällen die Irrtumswahrscheinlichkeit gering genug ist, damit das Ergebnis als „signifikant“ angesehen werden kann und die bestätigte Hypothese als bestätigt oder falsifiziert gelten kann. Die bestätigte Hypothese überläßt die geprüfte Theorie als eine brauchbare (bewährte) weiteren Falsifizierungsversuchen,
2 Ein Sinuston ist ein reiner Ton einer gleichmäßigen Tonquelle, der sich als einfache, sinusoidale Funktion der Zeit darstellt.
3 Da es in diesem Untersuchungsparadigma um die intraindividuellen Prozesse der Informationsverarbeitung geht und die Kosten jeder einzelnen Messung sehr hoch sind, wird die Probandenzahl in der Regel zwischen 10 und 15 Probanden angesetzt.
9
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
während eine falsifizierte Hypothese eine Einschränkung der Theorie erforderlich macht. Wenn diese Einschränkung dergestalt wird, daß der Erklärungsnutzen der Theorie minimal wird - ihre Belastbarkeit also überschritten ist - muß die Theorie verworfen und zur Formulierung einer neuen The-orie übergegangen werden.
10
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
3 Grundlagen der Sprachperzeption
Was ist „Sprachperzeption“? Der aus dem Englischen (speech perception) übertragene Begriff kennzeichnet einen gemeinsamen Forschungsbereich verschiedener wissenschaftlicher Disziplinen wie etwa der kognitiven Psychologie, der Psycholinguistik, der Neurophysiologie, der Psychoakustik, der Phonetik oder der Computerwissenschaften. Dieser Bereich wird gewöhnlich als der Bereich der Wahrnehmung und Verarbeitung aller Sprachlaute, die phonetische Unterscheidungen in den verschiedenen Sprachen dieser Welt erlauben, gekennzeichnet (vgl. KLUENDER, 1994). Es geht um die Frage, wie ein Hörer so komplexe Laute wie Sprachlaute in seinen Sprachverarbeitungssystemen rezipiert (und wie sie in einem nächsten Schritt in Bedeutung umgewandelt werden). Eine einheitliche Theorie der Sprachperzeption gibt es nicht (KLUENDER, 1994). Sie müßte erklären, wie ein Hörer die Phoneme (als die spezifischen Sprachlaute seiner Sprache) einsetzt, um Morpheme (als die Bedeutung tragenden lexikalischen Einheiten) zu erkennen. Sie sollte auf einer phylogenetischen Ebene erklären können, warum und wie die verschiedenen Sprachen eine spezifische Menge an Sprachlauten benutzen; welche Rolle das auditorische System bei der Auswahl der für die jeweilige Sprache spezifischen Phoneme spielt; warum bestimmte Phoneme oder Kombinationen von Phonemen bevorzugt werden und andere überhaupt nicht benutzt werden; wie Sprachlaute vom auditorischen System enkodiert werden oder wie Sprachlaute in einem perzeptuellen Raum in Kategorien
11
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
abgebildet werden. In der vorliegenden Arbeit soll auf diese letzte Fragestellung näher eingegangen werden.
Auf einer ontogenetischen Ebene sollte eine Theorie der Sprachperzeption z. B. den Prozeß durchleuchten können, durch den ein Kind die für seine Sprache spezifischen phonetischen Kategorien erlernt, wie sich ein mentales Lexikon entwickelt, welche Interaktionen es zwischen dem Erlernen von Sprachkategorien und der Entwicklung des Lexikons gibt.
3.1 Theorien der Sprachperzeption
Es gibt eine ganze Reihe von phonetischen, linguistischen oder „psychologischen“ Informationsquellen für die Sprachperzeption, die der Hörer von Sprache alle bewertet und integriert, um zur Spracherkennung vorzudringen. Das „nackte“ auditorische Signal birgt schon viele verschiedene für die Spracherkennung bedeutsame Informationen in sich (Frequenzspektrum, Amplitudenhöhen, Latenzen, Grundfrequenz, Formanten usw.). Außerdem wird jedoch auch der situationale, psychologische oder linguistische Kontext als Informationsträger vom Sprachempfänger zur Dekodierung der In-formation herangezogen. Auch wurde wiederholt nachgewiesen, daß in der direkten Kommunikation auch die Information von anderen Modalitäten wie Gestik, Mimik oder Lippenbewegungen als Hilfe bei der Sprachperzeption benutzt wurden. Einige Modellierungen der Sprachperzeption im Zusammenhang mit der Worterkennung (Word Recognition) sollen hier vorgestellt werden. Die gängigsten sechs Modelle teilt MASSARO (1994) nach dem in Abb. 1 dargestellten Entscheidungsbaum ein. Danach dringen das Logogen Modell, wie es von MORTON (1964) vorgeschlagen wurde, das Kohorten-Modell nach MARSLEN-WILSON (1984), das TRACE-Modell der Sprachperzeption von MCCLELLAND & ELMAN (1986), das Modell der autonomen Suche nach FORSTER (1979), das von KLATT (1979) entwickelte LAFS (Lexical Acces From Spectra) Modell, das LAFF (Lexical Acces From Features) Modell von STEVENS (1986) und das „Fuz- zyLogical Model“ nach MASSARO (1987) unterschiedlich tief in diese Baumstruktur ein. Die erste Frage ist, ob ein Modell die Worterken-
12
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
Abb. 1: Verzweigungsbaum zur Darstellung der Unterschiede zwischen Theorien der Sprachperzeption (nach MASSARO, 1994)
nung als vermittelt oder unvermittelt annimmt. Dann, ob der Hörer eines Wortes über kategoriale (Alles-oder-nichts) oder über kontinuierliche Information verfügt. Als drittes ist zu überlegen, ob die Signalinformation sofort „online“ oder mit einer gewissen Verzögerung auf lexikaler Ebene verarbeitet wird. Als nächstes wäre zu entscheiden, ob ein serieller oder paralleler Zugang zu den lexikalen Repräsentationen angenommen wird und zuletzt, ob die Worterkennung ein unabhängiger, „autonomer“ oder ein kontextabhängiger Prozeß ist. Im folgenden wird festzustellen sein, welche Rolle die
13
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
einzelnen Modelle der Verarbeitung elementarer distinktiver Merkmale von Sprachsignalen zumessen.
Im Logogen-Modell von MORTON (1964) wird angenommen, daß jedes Wort im Langzeitgedächtnis eine eigene „logogene“, also „wortförmige“ Repräsentation hat, „Logogen“ genannt. Jedes „Logogen“ hat einen Ruhezustand und eine Schwelle, die von der Worthäufigkeit abhängt.
Abb. 2: Schematische Darstellung des Logogen-Modells: Spracherkennung findet in dem Moment statt, in dem die Aktivation des Logogen-Systems ein kritisches Niveau überschreitet und als Antwort verfügbar wird (Skizze nach Morton und Broadbent, 1967)
Wenn das „Logogen“ durch einen visuellen oder auditiven Wortstimulus so weit aktiviert wird, daß es die Schwelle überschreitet, dann feuert das „Lo- gogen“ undmacht das entsprechende Wort verfügbar: das Wort wird erkannt. Häufige Wörter haben nach diesem Modell niedrige Schwellen und werden leichter aktiviert. Nach den oben genannten Charakteristiken wäre in diesem Modell die Worterkennung unvermittelt, da das „Logogen“ ein direktes Abbild des Stimulus ist. Die Rolle von kleineren Einheiten bei der
14
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
Worterkennung, wie Silben oder Phoneme, wird vernachlässigt. Desweiteren wird im Logogen-Modell angenommen, daß der Hörer über kontinuierliche Information verfügt, daß die Wortverarbeitung eher online und eher parallel stattfindet und daß die Kontextinformation ein Logogen genauso aktivieren kann, wie ein Stimuluswort selbst. Nach diesem Modell müßten CV(Konsonant-Vokal) - Silben, die sich nach distinktiven phonetischen Merkmalen unterscheiden, keine Rolle bei der Spracherkennung spielen. Im Kohorten-Modell von MARSLEN-WILSON (1984) wird davon ausgegangen, daß die Information eines Sprachlautes sequentiell Phonem für Phonem mit voranschreitender Darbietung durch Elimination von alternativen Wortkandidaten (Kohorten) erkannt wird. Das Erkennen des ersten Phonems eines Wortes schließt alle Wörter aus, die nicht mit diesem Phonem beginnen. Das Erkennen des zweiten Phonems aktiviert alle Wörter, /e/ /el/ /ele/ /elef/ /elefant/
Eremit
Abb. 3: Der Prozeß des Erkennens des Wortes „Elefant“ nach dem Kohorten-Modell von MARSLEN-WILSON (1984). Die Phoneme werden kategorial „online“ von links nach rechts parallel zur Darbietung kontextabhängig durch Ausschließung unpassender Wörter selegiert und integriert, bis schließlich aus einer Kohorte von Wörtern nur noch ein Wortkandidat übrigbleibt.
die mit den gleichen beiden ersten Phonemen beginnen und schließt alle Kohorten aus, die dieses zweite Phonem nicht an zweiter Stelle haben. In dieser Art wird mit voranschreitender Darbietung eines Wortes mit dem Erkennen eines Phonems jeweils eine Klasse alternativer Wörter ausgeschlossen bis zum „uniqueness point“, ab dem nur noch ein mögliches
15
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
Wort übrigbleibt - das Wort ist erkannt.. Das Modell nimmt eine durch Phoneme vermittelte Worterkennung an, die Phoneme werden kategorial „online“ erkannt, die Alternativwörter sind parallel zugänglich und der Kontext kann einen Einfluß auf die alternativ zugänglichen Wörter haben. Später wurde dieses Modell dahingehend modifiziert, daß auch einfache phonetische Merkmale schon als Charakteristika von Kohorten angenommen wurden, so daß schon die Stimmhaftigkeit, Sonorität, Nasalität oder der Artiku-lationsort eines Phonems alle Wörter dieser Kohorte aktivieren. Diese Merkmale würden auch nicht mehr eine kategoriale Trennung zwischen den aktivierten Wörtern voraussetzen, sondern könnten eine kontinuierliche Aktivierung hervorrufen, die nicht mehr scharf zwischen den Wörtern innerhalb und außerhalb der Kohorte trennt. Auch erlaubt die Modifikation, daß die Worterkennung auch zeitlich verzögert stattfinden kann. Das TRACE-Modell der Sprachperzeption von MCCLELLAND & ELMAN (1986) gehört zu den „interaktiven Aktivationsmodellen“. Die Informationsverarbeitung wird als exzitatorische und inhibitorische Interaktion zwischen einfachen Verarbeitungseinheiten verstanden, die ihrerseits funktionale Eigenschaften von Neuronen oder Neuronenverbänden repräsentieren. Diese Verarbeitungseinheiten können auf der Ebene der distinktiven Merkmale, der Phoneme oder der Wörter wirksam sein. Dabei aktivieren die Merkmale in aufsteigender Reihenfolge die Phoneme, welche ihrerseits die Wörter aktivieren. Alle Einheiten können auf der gleichen Ebene andere Einheiten hemmen. Die Einheiten einer höheren Ebene aktivieren ihre Unterebenen, so wird z.B. die Aktivierung des Phonems /b/ auch die Einheiten aktivieren, die die distinktiven Merkmale dieses Phonems („stimmhaft“, „bilabial“) repräsentieren. Das Phonem /k/ aktiviert demnach auch seine phonetischen Merkmale „stimmlos“, „velar“. Nach den Kriterien von MASSARO (1994) wäre das TRACE-Modell dadurch zu charakterisieren, daß es die Worterkennung als vermittelt durch die Erkennung der konstituierenden Phoneme und deren phonetischen Merkmale annimmt, prinzipiell als kontinuierlich, mit der Einschränkung, daß die distinktiven Merkmale eher kate-gorial wahrgenommen werden, die Verarbeitung findet online statt, alle vom Stimuluswort aktivierten Wörter werden parallel verarbeitet. Ob sie aktiviert werden, kann auch kontextabhängig sein. Was hier von den bisher vorgestellten Modellen am meisten abweicht, ist die Einführung des feedback.
16
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
Ein sprachlicher Stimulus aktiviert bestimmte distinktive Merkmale, die mehr Erregung zu einigen Phonemeinheiten senden als zu anderen. Das Merkmal „stimmhaft“ würde also die Phoneme /b/, /d/, /g/ usw. aktivieren, die miteinander konkurrieren. Diese wenigen auserwählten Phoneme werden dann ein
feedback
auf die Merkmalsebene zurückmelden, so daß nur die Merkmale, die zu einem bestimmten Phonem gehören, aktiviert werden. Dieser
feedback-Effekt
verstärkt also die Sensitivität für eine bestimmte Kategorie, Phoneme könnten somit nach dem TRACE-Modell kategoriale Wahrnehmungseinheiten bilden. Ebenso nimmt das TRACE-Modell eine interaktive Aktivation zwischen der Wort- und Phonemebene an. Eine
bottom-up
Erregungssequenz (von der untergeordneten Ebene der Phoneme zu der Wortebene) aktiviert bestimmte Worteinheiten, welche ihrerseits die Phoneme
top-down
(von der übergeordneten Wortebene auf die Phonemebene) rückaktivieren, aus denen sie sich zusammensetzen. Diese gegenseitigen Aktivierungszyklen auf den unterschiedlichen Ebenen, und Hemmungen innerhalb einer Ebene finden statt, bis das Wort erkannt ist. Ein viertes Modell ist das
Modell der autonomen Suche
von FORSTER (1979), das später noch verbessert und an die neuesten Forschungsergebnisse angepaßt wurde. Das Modell umfaßt zwei Stufen: eine anfängliche Zugriffsphase und eine serielle Suchphase, weshalb das Modell noch „Serielles Suchmodell“ genannt wird. In der ersten Phase wird auf die Lautinformation zugegriffen und eine Untereinheit des Lexikons (in Form von einer Liste mit lexikalischen Einträgen oder den
Adressen
dieser Einträge)
seriell
durchsucht, bis das passende Wort gefunden wurde. Die serielle Anordnung in dieser Untereinheit wird durch die
Häufigkeit
des Vorkommens der Wörter einer Sprache bestimmt
4
. Die Suche geht sequentiell durch die Liste, wobei jeder Eintrag auf seine Übereinstimmung mit dem gehörten Sprachlaut überprüft wird. Die Zeit, die nötig ist, um einen lexikalischen Eintrag zu überprüfen, wird dabei als Maß für die Anzahl der nötigen Vergleiche genommen. Das Modell kann nach den o. g. Kriterien folgen-
4 d.h.die häufigsten Wörter rangieren ganz oben in dieser Liste. Für die deutsche Sprache sind computerunterstützte Worthäufigkeiten am Mannheimer Institut für deutsche Sprache bestimmt worden. Das Mannheimer Korpus MK I hat als die 20 häufigsten Wörtern schriftlichen Texten folgende gefunden: der, die, und, in, den, das, zu, nicht, von, mit, sich, sie, er, ist, des, auf, dem, ich, ein, es, die allein schon 25 % dieser Texte ausmachen. In englischen Gesprächen ergab sich dagegen eine ganz andere Rangreihe der 20 häufigsten benutzten Wortformen: I, and, the, to, that, you, it, of, a, know, was, uh, in, but, is, this, me, about, just, don’t. (nach MILLER, 1993, S. 149f.)
17
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
dermaßen charakterisiert werden: die Sprachperzeption wird durch Untereinheiten wie Phoneme vermittelt, die Phoneme werden online nach Kate-gorien erkannt, die Erkennung eines Wortes verläuft seriell, der Satzkontext hat darauf keinen Einfluß. Die bottom-up Prozesse der Worterkennung finden hiernach ohne die Information der höheren Ebenen statt. Ebenso können die top-down Prozesse (wie z. B. Kontext-effekte) den bottomup Prozeß nicht beeinflussen. Die Worterkennung schreitet also nach diesem Modell autonom und sequentiell als Suchvorgang durch Listen voran. Das von KLATT (1979) entwickelte LAFS-Modell (Lexical Acces From Spectra) nimmt an, daß die erwarteten Spektralmuster von Wörtern in einem sehr großen Netzwerk von Spektralmustersequenzen repräsentiert sind, wo sie dekodiert werden. Ein Wort wird erst in seine phonetischen Repräsentationen zerlegt, die dann zu Sequenzen von spektralen Mustern zusammengefügt werden.
Das Modell nimmt also an, daß nicht distinktive phonetische Merkmale oder andere Sprachsegmente für die Worterkennung von Bedeutung sind, sondern daß die sich abspulenden Frequenzspektren die Sprache repräsentieren. Die Frequenzkombinationen, die jeden einzelnen Sprachlaut repräsentieren, liegen von schon gehörten Sprachlauten im Gedächtnis vor und werden mit neu hereinkommenden Frequenzspektren verglichen. So wird etwa der phonetische Übergang von einem /t/ zu einem /a/ durch 5 “kritische” Frequenzkombinationen repräsentiert, die das für diese Silbe spezifische Spektralmuster abgeben. (vgl. Abb. 4). Jeder Sprachlaut ist
18
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
Abb. 4: Der phonetische Übergang von einem /t/ zu einem /a/ wird durch 5 “kritische” Frequenzkombinationen repräsentiert, die das für diese Silbe spezifische Spektralmuster abgeben.
durch entsprechende unverwechselbare Faktoren gekennzeichnet; jedes Wort setzt sich aus einer spezifischen kontinuierlichen Reihe solcher diskreter Spektralmuster zusammen, die nacheinander aktiviert werden. Das Modell nimmt somit eine durch die Spektralmuster vermittelte Worterkennung an, die Güte der Übereinstimmung dieser laufenden Muster mit schon im Lexikon gespeicherten Frequenzspektren liefert teils kategoriale, teils kontinuierliche Informationen, vielfältige Alternativen können online mit dem ankommenden Stimulus und parallel verarbeitet werden, dem Kontext wird nur ein sehr beschränkter Einfluß zugestanden. Das LAFF (Lexical Acces From Features) Modell von STEVENS (1986) nimmt abweichend vom LAFS - Modell an, daß der Zugang zum Lexikon über die distinktiven phonetischen Merkmale eines Sprachlautes stattfindet. Diese Merkmale sind sprachübergreifend und binär, d.h. sie sind entweder vorhanden oder nicht vorhanden. Die binäre Struktur der Merkmale erlaubt eine Vereinfachung des Integrationsprozesses insofern, als verschiedene mehrdeutige Informationsquellen nicht mehr kombiniert werden müssen. Das Modell kennzeichnet sich dadurch, daß die Übereinstimmungsgüte des hereinkommenden Sprachlautes mit dem im mentalen Le-
19
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
xikon gespeicherten Muster über die distinktiven phonetischen Merkmale des Sprachlautes vermittelt wird.
Abb. 5: Konventionelle und nach dem LAFF-Modell modifizierte lexikale Repräsentation: Nur die relevante akustische Information des englischen Wortes „pawn“ wird repräsentiert, nämlich die Zusammensetzung aus den einzelnen phonetischen Merkmalen und der zeitliche Verlauf der Aktivierung dieser Merkmale. Diejenigen Merkmale, die weder mit + oder 1 („vorhanden“) noch mit - oder 0 („nicht vorhanden) gekennzeichnet sind, wurden als nicht relevant für die lexikalische Entscheidung eingestuft (nach STEVENS, 1986).
Die Information wird nach Kategorien entsprechend den einzelnen distinktiven Merkmalen eingeordnet, kontinuierliche Information könnte aus der Anzahl der Merkmale, die zu einem Wort im Lexikon passen, abgeleitet werden, mehrere Alternativen werden parallel verarbeitet, die Information wird zeitversetzt aufgenommen, dem Kontext wird nur ein geringer phonologischer Einfluß zugeschrieben.
Als letztes sei noch das „Fuzzy Logical Model of Perception“ (FLMP) von MASSARO (1987) vorgestellt, das - ähnlich wie in anderen Ansätzen auch - annimmt, daß die Sprachperzeption in mehreren Verarbeitungsstufen stattfindet: 1. die Merkmalsbewertung, 2. die Merkmalsintegration und 3. die Entscheidung über die Identität des Stimulus nach der Überprüfung der Übereinstimmung des Sprachstimulus mit einem im Lexikon gespeicherten „Prototypen“ . Diese Prototypen sind globale Umschreibungen eines Sprachstimulus und setzen sich aus einer Reihe von Merkmalen zusammen. Die sensorische Repräsentation eines Sprachstimulus muß mit der lexikalischen Repräsentation übereinstimmen, die beiden Repräsentationen müssen miteinander kompatibel sein. So muß z.B. die physikalische Information der Silbe /gi/ von den sensorischen Systemen in der ersten
20
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
Phase auf die Passung der phonetischen Merkmale mit den Merkmalen des Prototyps für /gi/ bewertet werden. Diese Passung kann unterschiedlich gut sein. Wenn die Silbe /gi/ z.B. undeutlich ausgesprochen wird, kann es passieren, daß nur das Merkmal „stimmhaft“ und „vokalischer Kontext (/i/)“ von den sensorischen Systemen aufgefangen werden, so daß eine Entscheidung getroffen werden muß, ob es sich um ein /gi/ oder um ein /di/ oder /bi/ handelt. Alle drei Silben haben die beiden Merkmale : „stimmhaft“ und „vokalischer Kontext (/i/)“ gemeinsam und unterscheiden sich nach ihrem Ort der Artikulation. Dieses Problem wird im FLMP so angegangen, daß der Grad der Passung zwischen Sprachsignal und mentaler Repräsentation durch „unscharfe (fuzzy) Wahrheitswerte“ ausgedrückt wird, die zwischen 0 und 1 liegen, wobei 0 bedeutet: „die Passung ist nicht (wahr)“ und 1 bedeutet: „Die Passung ist wahr“, Stimulus und mentale Repräsentation stimmen vollkommen überein. Der Wert von 0.5 würde dann bedeuten, es ist vollkommen zweideutig, ob es sich um ein /gi/ oder
Abb. 6: Die Verabeitungsstufen eines Sprachsignals nach dem FLMP lassen sich folgendermaßen darstellen (nach Massaro, 1994): Die einzelnen Verarbeitungsstufen sind zwar sukzessive angeordnet, jedoch überschneiden sie sich auch. Die auditorische Informationsquelle A i und die visuelle Informationsquelle V j werden bewertet und auf ihre Übereinstimmung mit Prototypen überprüft. Der Grad dieser Übereinstimmung wird in den Werten a i und v j ausgedrückt. Die am stärksten ausgeprägten Merkmale, die den höchsten Wahrheitsgrad aufweisen, werden zu einer Merkmalskonfiguration p ij integriert, die am ehesten einem Prototyp entspricht. Aufgrund dieser Übereinstimmung wird eine diskrete Entscheidung zugunsten einer lexikalen Repräsentation R ij mit den Merkmalen „i“ und „j“ getroffen.
um ein /di/ handelt, während 0.7 würde bedeuten, es ist eher wahr, daß es ein /gi/ ist, als ein /di/.
In der zweiten Phase der Merkmalsintegration werden die einzelnen Merkmale mit ihren Wahrheitswerten den einzelnen Prototypen entsprechend
21
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
zusammengestellt, sie werden auf einen Prototyp hin integriert. Daraus resultiert dann die Übereinstimmung der Merkmale mit einem bestimmten Prototyp. Das FLMP kann graphisch folgendermaßen dargestellt werden: Die am wenigsten zweideutigen Merkmale haben dann in der dritten Phase den größten Einfluß auf die Entscheidung, ob das gehörte Sprachsignal ein /gi/ oder ein /di/ oder ein /bi/ ist. Wenn also das Merkmal „Artikulationsort (velar)“ nur einen Wahrheitswert von 0.5 hat, also höchst uneindeutig ist und das Merkmal „bilabial“ hat eine Wahrheitswert von 0.8, während das Merkmal „nasal“ nur bei 0.3 liegt, dann wird die Entscheidung, die sich auf die Summe der einzelnen Wahrheitswerte bezieht, ein /bi/ bevorzugen, da dieses am wenigsten zweideutig ist und somit den größten Informationsgehalt trägt. Es entspricht mit den anderen beiden Merkmalen „stimmhaft“ und „vokalischer Kontext /i/“ am ehesten einer Merkmalskonfiguration des Prototyps für /bi/.
Nach den am Anfang des Kapitels dargelegten Charakteristiken läßt sich die Worterkennung nach dem FLMP als vermittelt, kontinuierlich, online, parallel und seriell (s. Abb. 1) und sowohl autonom, als auch kontextabhängig umschreiben. Die Prototypen dieses Modells können V (Vokale)-, CV (Konsonant-Vokal)- und VC (Vokal-Konsonant)-Silben sein. Die vorgestellten Modelle versuchen, die Sprachperzeption zu erklären, sie bieten einen Überblick über die zur Zeit in der Psycholinguistik geläufigsten Ansätze. Wie diese Modelle zeigen, hat die psycholinguistische Erforschung der Sprachperzeption und des Sprachverständnisses die akustischphonetische Komplexität eines Sprachlautes in ihren Untersuchungen oft vernachlässigt. Es wurde weitestgehend angenommen, daß die lexikale Repräsentation eines Sprachlautes von dessen einzelnen Eigenschaften unabhängig ist. Das erlaubte den theoretischen Modellen, eine Prototyp-form oder eine abstrakte Repräsentation jedes einzelnen Wortes im Gedächtnis anzunehmen (z. B. MASSARO, 1994; LAHIRI & MARSLEN-WILSON, 1990), was so einfach nicht als erwiesen gilt. Die obengenannten Modelle implizieren unterschiedliche Verarbeitungsmodi von Sprache. Der Streit, welches die kategorial nicht weiter aufteilbaren Grundeinheiten der Sprachperzeption sind, die eine lexikalische Repräsentation des Sprachlautes konstituieren, soll und kann an dieser Stelle nicht entschieden werden. Die meisten der vorgestellten Modelle sind
22
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
selbst nicht besonders klar als kategoriale oder kontinuierliche einzustufen. Selbst die Annahme von kategorialen Grundeinheiten erlaubt zusätzlich den Schluß, daß kontinuierliche Information aufgenommen wird. Sind diese Grundeinheiten spektrale Schablonen oder Muster (KLATT, 1979), distinktive phonetischen Merkmale (STEVENS, 1986; MCCLELLAND & ELMAN, 1986;) oder sind es phonemische Segmente (FORSTER, 1979; PISONI & LUCE, 1987) oder gar erst die Silben? Die meisten der oben dargestellten Modelle weisen den distinktiven phonetischen Merkmalen eine bedeutsame Rolle bei der Sprachperzeption zu. Wie jedoch im Einzelnen und wo diese Grundeinheiten der Sprache verarbeitet werden, sagen diese Modelle nicht. Dies wird in der vorliegenden Arbeit unter die Lupe genommen.
3.1.1 Phonetische Grundlagen der Sprachperzeption
Perzeption kennzeichnet den Prozeß, durch den verschiedenartige Signale der Außenwelt zu einer einheitlichen inneren Wahrnehmung führen. Oft führen sehr variable Signale zu einer sehr invarianten Wahrnehmung des Sprachlautes, d.h. Signale, die sich in ihren phonetischen Grundeigenschaften (wie Frequenzspektrum, Grundfrequenz, Amplitudenhöhe, Dauer) deutlich unterscheiden, werden gleichbleibend als ein Sprachlaut perzipiert. Diese Unterschiedlichkeit der einzelnen Sprachlaute läßt darauf schließen, daß unser Sprachverarbeitungssystem das Gemeinsame in der Diversität der Sprachlaute erkennt. Dieses Gemeinsame ist eine begrenzte Anzahl distinktiver phonetischer Kategorien, die von Sprache zu Sprache unterschiedlich sein können. So hat MADDIESON (1984) 58 phonetische Attribute gebraucht, um alle 558 Konsonanten, 260 Vokale und 51 Diphtonge der Sprachen der Welt zu beschreiben. Zwei dieser distinktiven phonetischen Kategorien sind Stimmhaftigkeit und Artikulationsort. Bemerkenswert ist dabei auch die Heterogenität im Umfang der Phoneme, die zu einer Sprache gehören: Von 11 bis 141 Phoneme fanden sich in den einzelnen Sprachen!
23
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
Ein „Sprachlaut“ oder „sprachlicher Laut“ kann auf zwei unterschiedliche Arten betrachtet werden: Einerseits ist da die Phonetik, die die exakte akustische und physiologische Struktur eines Sprachlauts ungeachtet seiner Zugehörigkeit zu einer Sprache und seiner Bedeutung darin untersucht. In diesem Fall wird ein Sprachlaut ein Phon genannt und in eckigen Klammern dargestellt (z.B. [p], [b]). Wie das griechische „φωνη“ (Laut, Ton, Stimme) auch besagt, geht es um den Sprachlaut an sich, ohne den Kontext einer Sprache. 5 Phone sind die elementarsten Sprachlaute. Auf der anderen Seite kann ein Sprachlaut als Phonem bezeichnet werden, wenn er zur Unterscheidung von anderen Sprachlauten in einer bestimmten Sprache relevant ist. So sind im Deutschen /b/ und /p/ zwei unterschiedliche Phoneme, im Arabischen oder Estnischen jedoch nur ein einziges Phonem. Phoneme können ganze Klassen von Phonen bilden. So kann ein aspiriertes [p] und ein nichtaspiriertes [p] im Deutschen als ein Phonem bezeichnet werden, da Aspiration im Deutschen kein distinktives Merkmal ist. Die Lehre von den Phonemen ist die Phonematik. Zur Darstellung von Phonemen werden Schrägstriche benutzt (/b/, /p/). Phoneme sind die elementaren Bausteine der jeweiligen Sprache .
5 So sind Zungen-[r] und Zäpfchen-[r] zwei unterschiedliche Phone ein und desselben Phonems /r/.
24
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
3.1.2 Distinktive Merkmale
Entgegen allem Augenschein besteht zwischen sprachlichen Lauten eine solche Variabilität, daß keine zwei menschlichen sprachlichen Äußerungen je gleich sind.
Die Merkmale, die eine bestimmte Sprache zur Unterscheidung seiner Sprachlaute verwendet, nennt man distinktive Merkmale (distinctive features). Distinktive Merkmale bilden die unterste Ebene der Sprache, sie sind noch grundlegender als die einzelnen Sprachlaute selbst 6 . So sind die Wörter Bein und Pein in jeder Hinsicht gleich, nur das [b] von Bein ist stimmhaft, während das [p] von Pein stimmlos und aspiriert ist. Die Aspiration oder Behauchung ist ein geringer, aber hörbarer Luftausstrom sofort nach dem Aufschließen der Lippen, aber noch bevor die Stimmbänder zusammentreffen und der Kehlkopfton des nachfolgenden Vokals anfängt. 7 Das [b] beginnt jedoch fast sofort mit der Vibration der Stimmbänder, was als stimmhaft wahrgenommen wird.
Diese beiden Wörter werden im Deutschen als zwei verschiedene Wörter wahrgenommen, mit verschiedenen Bedeutungen. 8 Folglich ist der Unterschied in der Stimmhaftigkeit im Deutschen ein distinktives Merkmal. Wenn die Stimmhaftigkeit kein distinktives Merkmal wäre, dann würde man zwischen der Aussprache von Bein und Pein keinen Unterschied machen, sondern lediglich zwei unterschiedliche Arten der Aussprache bei ein und demselben Wort wahrnehmen.
6 Vgl. Miller, S.98
7 ebd. , S. 96
8 Was z.B. in finno-ugrischen Sprachen wie im Estnischen und Finnischen oder im Arabischen überhaupt keinen Unterschied macht, [b] und [p] sind lediglich zwei unterschiedliche Arten der Aussprache ein und desselben Sprachlauts. Ebenso kennt das Japanische keinen Unterschied zwischen [r] und [l], sondern behandelt die beiden im Deutschen deutlich unterschiedenen Sprachlaute als einen.
25
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
3.2 Neurophysiologische und neuroanatomische Grund-
lagen der Sprachperzeption
In diesem Kapitel wird auf die neuronale Basis der Sprache und die funktionale Neuroanatomie der Sprachperzeption näher eingegangen. Das Sprachverarbeitungssystem wird in einem kurzen Überblick vorgestellt, wobei im Rahmen dieser Arbeit nur die auditorische Sprachperzeption und -verarbeitung von Interesse ist, so daß die schriftlich-visuelle Modalität des Sprachgebrauchs, die auf andere neurobiologische Grundlagen zurückzuführen ist, nicht behandelt wird. Die für die Verarbeitung der einzelnen distinktiven Merkmale relevanten Strukturen und Mechanismen werden anhand der bekannten neuroanatomischen Läsionsstudien (DAMASIO & DAMASIO, 1980), Stimulationsstudien (OJEMANN, 1983; OJEMANN, 1989; PENFIELD & ROBERTS, 1959), Studien mit bildgebenden Verfahren (PET und SPECT-Studien von POSNER et al., 1988; PETERSON et al, 1988; PETERSON et al, 1991), EEG- und MEG-Studien (STEINSCHNEIDER et al, 1994; MOLFESE, 1978b, 1983a; SEGALOWITZ & COHEN, 1989) dargestellt. Die der Sprachverarbeitung zugrundeliegenden Strukturen sind über mehrere Gehirnareale verstreut. Im folgenden wird vom Sprachverarbeitungssystem und seinen Komponenten die Rede sein. Strukturen, die für die Sprachperzeption relevant sind, werden im Vorder-grund stehen, während die für die Sprachproduktion maßgeblichen Strukturen nur in dem Maße erwähnt werden, als sie für die Sprachperzeption von Bedeutung sind.
26
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
3.3 Die kortikalen Strukturen der Sprache (BRODMAN-
Areale, BROCA- und WERNICKE-Areal)
Sprache kann als ein Codesystem angesehen werden, das eine sprachliche Ausdrucksform mit einer oder mehreren Bedeutungen verbindet (CAPLAN, 1995). Die Komponenten eines Sprachverarbeitungssystems erkennen dabei eine verbale oder nonverbale Repräsentation und wandeln diese so um, daß sie eine andere (mentale oder lexikale) Repräsentation aktiviert.
Abb. 7: Die wichtigsten kortikalen Strukturen der linken Hemisphäre (LH); a. Seitenansicht mit den wichtigsten Gyri und Sulci; b. mittelsagitaler Schnitt der RH mit den wichtigsten Strukturen.
27
Teil I: Sensitivität der beiden Gehirnhälften für Stimmhaftigkeit und Artikulationsort — Grundlagen
Diese Komponenten können entweder als algorithmische Abläufe (PYLYSHYN, 1984) oder als stochastische (konnektionistische, parallele) Prozesse (MCCLELLAND & RUMELHART, 1986) verstanden werden. Diese Prozesse lassen sich durch drei wichtige Charakteristika kennzeichnen: sie laufen zwingend, unbewußt und sehr effizient ab. Zwingend, weil die Aktivität der Perzeption eines gesprochenen Wortes als ein Wort nicht unterdrückt werden kann. Wir können ein bekanntes gesprochenes Wort nicht als Nichtwort perzipieren (MARSLEN-WILSON, 1973). Unbewußt, weil die Perzeptionsprozesse bei normal entwickelten Hörern von Sprache weitestgehend automatisiert sind, so daß die Aufmerksamkeit nicht mehr auf die einzelnen phonetischen oder akustischen Merkmale oder auf den Satzbau usw. gerichtet sein muß (wie das beim Lernen einer Fremdsprache geschieht) und voll auf das Verstehen von Bedeutungen konzentriert werden kann. Daß die Komponenten des Sprachverarbeitungssystems hoch effizient sind, wurde in mehreren psycholinguistischen Untersuchungen nachgewiesen, z.B. daß gesprochene Wörter meistens schon 125 ms nach Wortbeginn erkannt werden, noch bevor das Wort gänzlich ausgesprochen wurde (z.B. MARSLEN-WILSON, 1973). Diese effiziente Verarbeitung wird durch eine massive parallele Architektonik des neuronalen Systems gewährleistet, die eine gleichzeitige Aktivierung verschiedener Komponenten erlaubt.
Alle traditionellen Lokalisationstheorien, die eine Lokalisation der Komponenten des Sprachverarbeitungssystems postulieren, nehmen an, daß die Lokalisationen dieser Komponenten bis auf die unterschiedlichen Lateralisierungen bei normalen Erwachsenen invariant bleiben. Läsionen in bestimmten Arealen des perisylvischen Assoziationskortex verhindern demnach die gleichen Komponenten der Sprachverarbeitung bei allen Menschen (CAPLAN, 1995).
28
Arbeit zitieren:
Hans Menning, 1997, MEG-Untersuchung der Sprachperzeption anhand des Einflusses der Stimmhaftigkeit und des Artikulationsortes auf evozierte kortikale Magnetfelder, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Formatvorlage (OpenOffice) für eine Diplomarbeit, Masterarbeit, Hausar...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 35 Seiten
Formatvorlage / Vorlage zur Erstellung einer Diplomarbeit, Bachelorarb...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 15 Seiten
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Für MS Word 2007 - dotx
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wisse...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 20 Seiten
Erstellen einer schriftlichen Hausarbeit
Vorlagen, Muster, Formulare, Infobroschüren
Hausarbeit, 14 Seiten
Grundtechniken wissenschaftlichen Arbeitens
Bibliografieren - Reden - Schr...
Vorlagen, Muster, Formulare, Infobroschüren
Skript, 46 Seiten
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 39 Seiten
Hans Menning hat den Text MEG-Untersuchung der Sprachperzeption anhand des Einflusses der Stimmhaftigkeit und des Artikulationsortes auf evozierte kortikale Magnetfelder veröffentlicht
Hans Menning hat einen neuen Text hochgeladen
0 Kommentare