Bachelorarbeit, 2013
45 Seiten, Note: 1,3
1. Kontext
2. Intervention
2.1 Content and Language Integrated Learning (CLIL)
2.2 Evaluation von CLIL-Maßnahmen
3. Methodik
3.1 Das Rubin Causal Model als methodische Grundlage
3.1.1 Definition des kausalen Effektes der CLIL-Maßnahme
3.1.2 Kausale Effekte in randomisierten Studien
3.1.3 Kausale Effekte in nichtrandomisierten Studien
3.2 Interne Validität
3.2.1 Die Stable Unit Treatment Value Assumption (SUTVA)
3.2.2 Verzerrung und Konfundierung
4. Einbezug der Fallstudien
4.1 Kontext und Methodik der Fallstudie Jexenflicker (2009), Dalton-Puffer (2010)
4.1.1 Ergebnisse der Fallstudie Jexenflicker (2009), Dalton-Puffer (2010)
4.1.2 Schlussfolgerung und Validität der Fallstudie Jexenflicker (2009), Dalton-Puffer (2010)
4.2 Kontext und Methodik der Fallstudie Ruiz de Zarobe (2008)
4.2.1 Ergebnisse der Fallstudie Ruiz de Zarobe (2008)
4.2.2 Schlussfolgerung und Validität der Fallstudie Ruiz de Zarobe (2008)
4.3 Kontext und Methodik der Fallstudie Gregorczyk (2012)
4.3.1 Ergebnisse der Fallstudie Gregorczyk (2012)
4.3.2 Schlussfolgerung und Validität der Fallstudie Gregorczyk (2012)
4.4 Kontext und Methodik der Fallstudie Várkuti (2010)
4.4.1 Ergebnisse der Fallstudie Várkuti (2010)
4.4.2 Schlussfolgerung und Validität der Fallstudie Várkuti (2010)
5. Ausblick und Schlussfolgerung
6. Literaturverzeichnis
6.1 Allgemeines Literaturverzeichnis
6.2 Analysierte Fallstudien
7. Anhang
Abbildung in dieser Leseprobe nicht enthalten
Die kulturellen, wirtschaftlichen und politischen Veränderungen in Europa erfordern in zunehmendem Maße Fremdsprachenkenntnisse der Europäer. Insgesamt leben ca. 502,5 Mio. Menschen in der Europäischen Union, die vielen Sprachen, die von den Bürgern gesprochen werden, sind in einem großen Mosaik über Europa verteilt. Der Leitspruch der Union „In Vielfalt geeint“ verkörpert die beiden gegenseitigen Ziele der starken Integration der Mitgliedstaaten und dem Anrecht auf die Entfaltung der Persönlichkeit gleichauf. Alle Bürger haben demnach das Recht, in ihrer Muttersprache zu sprechen und zu schreiben, daher existieren 23 anerkannte Amtssprachen[1] in der EU. Es liegt nahe, die Fremdsprachenkompetenz in Europa ist von äußerst hoher Bedeutung. Folglich hat sich die Europäische Union das Ziel der Mehrsprachigkeit ihrer Bürger gesetzt. Dabei wird die Fähigkeit, mehr als eine Sprache zu beherrschen als besonders erstrebenswert angesehen. Durch diese Fähigkeit entstehen nicht nur Perspektiven des interkulturellen Austausches, der Wertschätzung anderer Kulturen, der Integration, des Zusammenhaltes, sondern zudem auch Chancen für alle Bürger bezüglich der freien Studien- und Berufswahl in allen Mitgliedsstaaten (vgl. Commission of the European communities, 2005: 2 ff.). Infolge dessen entsteht auch eine Mobilität auf dem Arbeitsmarkt, die neue Arbeitsplätze schafft und wirtschaftliches Wachstum ankurbelt. Das größte Potenzial des Fremdsprachenerwerbs liegt im jeweiligen Schulsystem der Mitgliedsstaaten. Bereits bei einem Gipfeltreffen in Barcelona, im Jahre 2002, rief der Europäische Rat in den Schlussfolgerungen zu einer „Verbesserung der Aneignung von Grundkenntnissen, insbesondere durch Fremdsprachenunterricht in mindestens zwei Sprachen vom jüngsten Kindesalter an“ auf (Presidency Conclusions 2002: 63). Zehn Jahre später zeigt eine Eurobarometer Umfrage[2] zur Mehrsprachigkeit und zum Fremdsprachenerwerb folgenden Status quo: Fast alle Befragten (98%) sind der Meinung, dass Fremdsprachenkenntnisse für die Zukunft ihrer Kinder nützlich sind. Dabei ist Englisch zu weiten Teilen (67%) als besonders nützlich angesehen (vgl. Europäische Kommission 2012: 8f.). Eine getrennte Studie der Europäischen Kommission, die erste europäische Erhebung zur Sprachenkompetenz, verdeutlicht jedoch die Diskrepanz zwischen Wunsch und Realität, wenn es in der Praxis um Fremdsprachenkenntnisse geht: Tests bei Schülerinnen und Schülern im Teenageralter in 14 europäischen Ländern zeigen, dass nur 42% ihre erste Fremdsprache wirklich beherrschen, bei der zweiten Fremdsprache sind dies nur 25%. Zudem erreicht ein signifikanter Anteil der Schüler nicht einmal das Niveau „Grundkenntnisse“. In Anhang 1 befindet sich eine Darstellung des prozentualen Anteils an Schülern, die das jeweilige GeRS-Niveau (Gemeinsamer Europäischer Referenzrahmen für Sprachen) in erster und zweiter Fremdsprache erreichen (Europäische Kommission 2011: 6). Englisch erweist sich als diejenige Fremdsprache, die Schüler noch am ehesten beherrschen. Es gibt jedoch große Unterschiede im Leistungsspektrum der Fremdsprachenkompetenz zwischen den europäischen Ländern. So liegen zum Beispiel die Schwedischen und Maltesischen Schüler bezüglich der ersten Fremdsprache weit vorne, Spanische, Französische und Britische Schüler weit hinten. Eine genaue Rangliste der Länder befindet sich in Anhang 2 (vgl. Europäische Kommission 2011: 12). Werden die Gesamtergebnisse dieser Studie betrachtet, wird folgender Schluss gezogen: „Die von den Bildungssystemen vermittelte Sprachkompetenz muss weiterhin signifikant verbessert werden.“ (Europäische Kommission 2011: 6). Nur dadurch können Schüler auf den tertiären Bildungsbereich und Arbeitsmarkt angemessen vorbereitet werden. Darüber hinaus bietet das breite Leistungsspektrum zwischen den Mitgliedsstaaten ein hohes Potenzial für gegenseitiges Lernen im jeweiligen Fremdsprachenunterricht. Als Schlüsselfaktor strebt die Sprachenpolitik des Europarats hierbei eine sprachenfreundliche Lebens- und Lernumgebung an. Dies stellt eine neue Herausforderung für den traditionellen Fremdsprachenunterricht an europäischen Schulen dar.
Der Fremdsprachenunterricht hat sich in den vergangenen Jahrzehnten gemeinsam mit dem Zusammenwachsen der Europäischen Union zu einem Kernbestandteil der Pflichtschulbildung entwickelt und ist nicht länger der universitären oder anderer elitärer Bildung vorbehalten. Damit die Bürger Europas vollständig von der europäischen Integration profitieren und ihre Wettbewerbsfähigkeit im europäischen Maßstab weiter verbessern können, brauchen sie neben ihrer Muttersprache (L1) Kenntnisse in zwei weiteren Fremdsprachen (L2 und L3). Um eine sprachenfreundliche Lebens- und Lernumgebung zu gestalten sehen viele Pädagogen der Fremdsprachendidaktik ein großes Potenzial in bilingualem Unterricht. Diese Form von Unterricht ermöglicht es, verstärkten Fremdsprachenunterricht in bereits vollen Lehrplänen unterzubringen. Bilingualer Unterricht ist nichts Neues, erste positive Erfahrungen wurden bereits in den 1960er Jahren bei einem kanadischen Immersionsprojekt in der hauptsächlich frankophonen Provinz Québec gemacht. Dort wurden anglophone Kinder in jedem Schulfach exklusiv auf Französisch, der zweiten Landessprache Kanadas, unterrichtet. In Anlehnung an diese positiven Erfahrungen aus den 1960er Jahren in Kanada sowie durch die zunehmende Globalisierung und Internationalisierung, etabliert sich nun der Trend an europäischen Schulen, eine L2 als Unterrichtssprache zu nutzen. Dies soll keinesfalls ein elitärer Unterricht sein, sondern jedem Schüler nach und nach frei zugänglich werden. Oft handelt es sich bis jetzt jedoch noch um Pilotprojekte, die nicht in jeder Schule bzw. Schulklasse angeboten werden können. Häufig dürfen sich Schüler nach Rücksprache mit ihren Eltern für eine „bilinguale“ Schulklasse bewerben.
Im deutschen Kontext wird bilingualer Unterricht auch als integriertes Fremdsprachen- und Sachfachlernen bezeichnet. Aufgrund der europäischen Mehrsprachigkeit und verschiedener Programme der Staaten sind oftmals andere landestypische Bezeichnungen[3] gängig. Im internationalen Zusammenhang herrscht jedoch hauptsächlich der Englische Begriff Content and Language Integrated Learning (CLIL) vor. CLIL ist ein Überbegriff für alle Immersions- und bilingualen Unterrichtsformen, CLIL ist sehr vielfältig und ist mittlerweile genauso an Grundschulen, weiterführenden Schulen als auch an Universitäten anzutreffen. Im Grundsatz geht es jedoch stets um ein und dasselbe Ziel: Der Inhalt eines Schulfaches, als auch Kenntnisse in einer Fremdsprache sollen vermittelt werden. In jedem CLIL-Unterricht wird demnach die L2 genutzt, um einen bestimmten außersprachlichen Lerninhalt zu vermitteln, gleichzeitig wird der Sachinhalt eines Schulfaches als Ressource für den Unterricht genutzt. Die Eurydice Studie der Europäischen Kommission definiert die zweiteilige Zielsetzung von CLIL folgendermaßen: […] „CLIL is inspired by a twofold objective. It is meant to ensure first that pupils acquire knowledge of curricular subject matter and secondly develop their knowledge in a language other than the normal language of instruction.” (Eurydice 2006: 22). Es sollen also nicht nur Fortschritte in der Fremdsprache gemacht werden, sondern der Sachinhalt muss weiterhin vermittelt werden - und zwar genau so, wie es im kontrafaktischen Fall geschehen würde. D. h. die Unterrichtsinhalte des Sachfachs müssen so vermittelt werden, wie es mit der L1 als Unterrichtssprache geschehen würde. Neben dieser generellen Zielsetzung des CLIL Konzepts kommen noch weitere, teilweise länderspezifische Ziele hinzu. Diese stehen in einer Wechselwirkung zueinander und ergänzen sich meist gegenseitig.
i. Sozioökonomische Ziele: CLIL-Schüler werden auf eine sehr internationalisierte Gesellschaft vorbereitet, dies bietet Ihnen bessere Berufsaussichten auf dem Arbeitsmarkt.
ii. Soziokulturelle Ziele: Durch die L2 als Unterrichtsmedium wird zur gegenseitigen Toleranz und zu Respekt gegenüber anderen Kulturen beigetragen.
iii. Linguistische Ziele: Sprachfertigkeiten werden entwickelt, die es ermöglichen effektiv in der Fremdsprache zu kommunizieren.
iv. Pädagogische Ziele: CLIL-Schüler werden durch eine innovative Maßnahme dazu angespornt, Fachwissen zu erwerben und steigern somit ihr Lernvermögen.
In Übereinstimmung mit der Zielsetzung der Mehrsprachigkeit fördert die Europäische Kommission CLIL als eine Möglichkeit, zwei Fremdsprachen neben der L1 zu erlernen. Schon im Jahre 2003 hat sie dazu ihren Aktionsplan zur Förderung des Sprachenlernens und der Sprachenvielfalt vorgelegtIn diesem wird CLIL als innovative Methode genannt, die einen wesentlichen Beitrag zu den Sprachlernzielen der Union leisten kann. (Kommission der europäischen Gemeinschaften 2003: 9)Seither werden Projekte im Bereich des bilingualen Unterrichts im Rahmen unterschiedlicher europäischer Programme gefördert.
Die externe Evaluation von Schulen ist im Allgemeinen sehr weit verbreitet in Europa. Dennoch finden Beurteilungen zur Wirksamkeit von CLIL-Maßnahmen bis jetzt weder häufig noch in regelmäßigen Abständen statt. Zum einen liegt dies daran, dass einige CLIL-Maßnahmen durch Eigeninitiative von Schulen und Lehrern durchgeführt werden. Zum anderen stellen sie für viele Mitgliedsstaaten eine Neuheit dar. Ein Großteil der Staaten hat CLIL erst in den 1990er Jahren eingeführt, deswegen ist es für eine umfassende Messung der Einflüsse nach herrschender Meinung noch etwas früh. Die Prämisse, dass CLIL-Unterricht bessere Schülerleistungen in der L2 bewirkt und zugleich die Leistungen im unterrichteten Sachfach konstant hält, gilt jedoch als weitläufig akzeptiert. Inwieweit sich CLIL als Unterrichtsmethode eignet soll in der vorliegenden Arbeit im Sinne der Wirkungsforschung und in Anbetracht der gesetzten Ziele näher untersucht werden. Als Grundlage dienen hierfür 4 Fallstudien, die an verschiedenen europäischen Schulen durchgeführt wurden. Im Wesentlichen sollen hierbei nur die Veränderungen der Schülerleistungen betrachtet werden, die tatsächlich dem CLIL-Unterricht als Maßnahme zugeschrieben werden können. Auch die Eurydice Studie über CLIL an europäischen Schulen bekräftigt dies in ihrer Schlussfolgerung folgendermaßen: „Evaluation [is] far from general practice but encouraging nonetheless[.]“ (Eurydice 2006: 57).
Insgesamt sind 4 empirische Fallstudien über den CLIL-Unterricht verschiedener Länder Europas in die vorliegende narrative Übersichtsarbeit einbezogen. Die Ergebnisse, sowie die kausalen Effekte und Wirkungen der empirischen Untersuchungen werden in Abschnitt 4 vorgestellt. In den folgenden Textabschnitten werden jedoch zunächst die interpretatorischen Grundlagen für den CLIL-Zusammenhang veranschaulicht. Als Basis dient das Rubin Causal Model (RCM) für randomisierte als auch nichtrandomisierte Studien. Um im Anschluss die interne Validität der CLIL-Studien zu beurteilen, werden in diesem Hinblick auch die Voraussetzungen der Stable Unit Treatment Value Assumption (SUTVA) und der Anspruch der Unconfoundedness erläutert.
Bei der Überprüfung der Wirksamkeit des CLIL-Unterrichts eignet sich das Kausalmodell möglicher Ergebnisse von Donald Rubin. Das Modell ist bekannt unter dem Namen Rubin Causal Model (RCM), welches zur Analyse des kausalen Effektes einer unabhängigen Variablen (UV) auf eine abhängige Variable (AV) dient. D. h. inwieweit sind die Ergebnisse in der L2 und dem unterrichteten Schulfach kausal auf den CLIL-Unterricht zurückzuführen. Die größte Schwierigkeit bei der Beurteilung der Kausalität stellt die Tatsache dar, dass jedes Individuum nur eine Existenz hat. Grundidee des RCM ist jedoch, dass jedes Individuum potenziell zwei verschiedene Ergebnisvariablen annehmen kann, aufgrund der einmaligen Existenz jedoch nur eine annimmt. Paul W. Holland, Mitbegründer des RCM, bezeichnet diese Tatsache als „ Fundamental Problem of Causal Inference“ (Holland 1986: 947). Da es unmöglich ist, Auswirkungen einer Maßnahme auf ein und dieselbe Person unter Teilnahme als auch unter Nicht-Teilnahme zu beobachten, fehlen die kontrafaktischen Daten. Bei jedem CLIL-Unterricht kann somit zwar auf individueller Ebene faktisch jede Schülerleistung beurteilt werden, aber nicht kontrafaktisch. Somit sind kausale Rückschlüsse auf individueller Ebene nicht möglich und der Maßnahme kann keine Wirkung zugeschrieben werden. Um dennoch einen kausalen Effekt aus den Differenzen der Ergebnisvariablen für den faktischen und kontrafaktischen Fall zu erhalten, werden in den Studien durchschnittliche kausale Effekte von Gruppen betrachtet. Diese Vorgehensweise beschreibt Holland als „statistische Lösung“ des Problems (vgl. Holland 1986: 947). Hierfür wird stets eine Teilnehmergruppe (CLIL) und Kontrollgruppe bzw. Vergleichsgruppe (NonCLIL) gebildet. Die NonCLIL-Gruppe beantwortet die kontrafaktische Frage, wenn sie in allen Faktoren (außer dem Teilnahmezustand und dem Ergebnis) der CLIL-Gruppe gleich oder zumindest sehr ähnlich ist. In Tabelle 1 wird das Fundamental Problem of Causal Inference im RCM für den binären Fall des CLIL-Unterrichts dargestellt.
: Rubin Causal Model, Fundamental Problem of Causal Inference. D=1 steht für die Teilnahme am CLIL-Unterricht. D=0 steht für die Nichtteilnahme am CLIL-Unterricht. Y1 beschreibt das Ergebnis gegeben der Teilnahme. Y0 beschreibt das Ergebnis gegeben der Nichtteilnahme. E(Y1│D=1) stellt bspw. den beobachtbaren Fall der Ergebnisse der Teilnahme, gegeben dass die Schüler an der Maßnahme teilnehmen dar. Der rote Pfeil deutet die Substitution der kontrafaktischen Größe E(Y0│D=1) durch die beobachtbare Größe E(Y0│D=0) an.
Abbildung in dieser Leseprobe nicht enthalten
Intuitiv lässt sich der kausale Effekt der Behandlung CLIL über der Behandlung NonCLIL für ein Zeitintervall t1 bis t2 als Differenz bilden. Diese Differenz wird bestimmt durch die beiden Fragen a) und b):
a) Was wäre zum Zeitpunkt t2 geschehen, wenn die Schüler ab dem Zeitpunkt t1 CLIL-Unterricht bekommen hätten?
b) Was wäre zum Zeitpunkt t2 geschehen, wenn die Schüler ab dem Zeitpunkt t1 NonCLIL-Unterricht bekommen hätten?
Erst durch die Heranziehung einer statistisch ähnlichen NonCLIL-Gruppe als Vergleichsgruppe kann ein durchschnittlicher Effekt (ATET: Average Treatment Effect on The Treated) für die CLIL-Schüler bestimmt werden. Dafür wird die beobachtbare Ergebnisgröße E(Y0│D=0) der NonCLIL-Schüler als Substitut für die kontrafaktische Größe E(Y0│D=1) genutzt. Der ATET kann damit folgendermaßen ermittelt werden:
Abbildung in dieser Leseprobe nicht enthalten
Häufig wird die Randomisierung der Teilnehmergruppe sowie der Kontrollgruppe in Experimenten als „Gold Standard“ des Fundamental Problem of Causal Inference betrachtet (vgl. Campbell & Erlebacher, 1970 in Rubin 1974, S. 688). Die Fachliteratur spricht dabei von Randomized Controlled Trials (RCT). Durch die randomisierte Zuteilung hat demnach jeder Schüler die gleiche Wahrscheinlichkeit, entweder in der CLIL- oder in der NonCLIL-Gruppe zu sein. Da der Zufall per Definition unsystematisch ist und ohne ersichtlichen Grund geschieht, unterscheiden sich die beiden Gruppen nicht systematisch in anderen Störvariablen. Ohne diese Randomisierung bestehen jedoch systematische Unterschiede der Gruppen. Folglich würden diese anderen Störfaktoren zusätzlich zur experimentell eingeführten UV auf die interessierende AV wirken. Letztendlich wäre damit kein zurechnungsfähiger Schluss über die Wirkung der Maßnahme mehr möglich. Im CLIL-Kontext kann eine ganze Reihe von solchen Störfaktoren auftreten, häufig genannte Beispiele sind die generelle Vorliebe der Schüler für Fremdsprachen, Beeinflussung durch Freunde und Eltern oder außerschulischer Kontakt mit der Fremdsprache, die als Störfaktoren Einfluss auf die Kausalität nehmen. Durch diese Konfundierung der Behandlungsfolgen mit dem Einfluss der Störvariablen auf die AV wird die Interpretation der Effekte und ggf. die Übertragbarkeit der Befunde erschwert oder unmöglich. Deshalb stellt die Strategie der Randomisierung eine besonders gute Kontrolltechnik dar, da eine Vergleichbarkeit der Gruppen bezüglich aller nur denkbaren Variablen hergestellt wird. Dabei ist es auch völlig unerheblich, ob wesentliche Störvariablen bekannt sind oder nicht. Solch eine „echte“ Zufallsauswahl ist in der empirisch-pädagogischen Forschung jedoch häufig nur unter beträchtlichem Aufwand möglich. Abhilfe schaffen Klumpenstichproben, hier werden zumindest Klassen oder sonst schon vorhandene Gruppen nach dem Zufall auf Experimental- und Kontrollgruppe verteilt. Obwohl dieses Vorgehen üblich und oftmals unumgänglich ist, ist es mit Mängeln behaftet. Gruppen, insbesondere Schulklassen, differieren systematisch, nicht selten in ihrem Ausgangsniveau, in der Art, wie sie geführt werden und in sonstigen wichtigen Faktoren (Einzugsgebiet, familiärer Hintergrund, Vorkenntnisse oder Vorlieben in der L2, etc.). Inwiefern durch Studien mit Klumpenstichproben dennoch kausale Rückschlüsse gezogen werden können, wird im Verlauf dieser Arbeit anhand von Beispielen noch näher erläutert.
Neben den renommierten RCTs stellen nichtrandomisierte Studiendesigns in der pädagogischen Forschung eine gute Alternative dar. Donald Rubin weist zwar auf die Schwächen von nichtrandomisierten bzw. quasi-experimentellen Studien hin, befürwortet aber dennoch die Nutzung vorhandener Daten, um Kausalschlüsse ziehen zu können: „Even if the position that causal effects of treatments can only be well established from randomized experiments […] its implication - to ignore existing observational data – may be counter-productive.“ (Rubin 1974: 688). Oftmals stehen nur nichtrandomisierte Daten zur Verfügung und entweder ist es zu kostspielig ein äquivalentes randomisiertes Experiment durchzuführen, oder es gibt ethische Gründe die eine Randomisierung in Frage stellen oder lange Wartezeiten, bis ein Experiment durchgeführt wurde stehen entgegen. Es lassen sich also auch durch quasi-experimentelle Studien aussagekräftige Befunde ableiten. Im weiteren Verlauf der Beobachtung einer Maßnahme können randomisierte Experimente stets nachgeholt werden, um die Effekte zu unterstreichen.Quasi-experimentelle Studien sind im Studiendesign verwandt mit den RCTs, mit dem einzigen Unterschied der fehlenden Randomisierung. Im Gegensatz zu den RCTs muss das fehlende Kontrafaktum möglichst gut geschätzt werden. Um kausale Inferenzen schließen zu können, dienen hierfür angepasste Vergleichsgruppen, die der Teilnehmergruppe sehr ähnlich sein sollen.
Diese geforderte „Ähnlichkeit“ der Gruppen ist im schulischen Kontext in Anbetracht meist heterogener Schulklassen eine große Herausforderung. Dennoch können dadurch Aussagen aus nichtrandomisierten Studien gefestigt werden. Bei der Evaluation des CLIL-Unterrichts dieser quasi-experimentellen Studien, stellt daher ein „exaktes Matching“ d.h. die Zuordnung von statistischen Zwillingen eine gute Lösung dar. Bei diesem Vorgang wird ein randomisiertes Experiment durch Konstruktion einer zur CLIL-Gruppe passende Vergleichsgruppe ex post nachgestellt. Dies geschieht anhand eines „Matchings“ der beobachtbaren Charakteristika eines Vektors X. Rubin favorisiert diese Methode bei nichtrandomisierten Studien, da mögliche Verzerrungen innerhalb der Gruppen reduziert werden können: „There is no need for concern about „other“ sources of bias, e.g. unreliability of X, unmeasured background variables.“ (Rubin 1977: 1). Der kausale Effekt kann damit berechnet werden und zwar mit der durchschnittlichen Differenz, gegeben der abhängigen Variablen (Y0,Y1) bedingt durch die Kovariaten Xi in der CLIL- und NonCLIL-Gruppe. Beobachtbare Kovariaten Xi bzw. Charakteristika der CLIL-Schüler sind zum Beispiel: Alter, Geschlecht, Ergebnisse in Einstufungstests, Noten des FU, Noten der unterrichteten Schulfächer, sozioökonomischer Hintergrund, soziokultureller Hintergrund, Schulabschluss der Eltern usw.
In diesem Abschnitt werden die wichtigsten Voraussetzungen für die Aussagekraft kausaler Schlussfolgerungen näher erläutert, welche als Basis für die Analyse der Studienergebnisse dient. Um einen hohen Grad an interner Validität annehmen zu können müssen Alternativerklärungen für das Vorliegen der gefundenen Effekte weitestgehend ausgeschlossen werden. Interne Validität liegt demnach vor, wenn die Veränderungen der AV eindeutig auf die Variation der UV zurückgeführt und mögliche Störeinflüsse ausgeschlossen werden können. Diese ceteris Paribus Voraussetzung muss demnach bei jeder Studie gegeben sein. Kernfrage ist folglich immer, ob hinreichend viele andere Einflussfaktoren ausgeschlossen bzw. konstant gehalten wurden, um einen kausalen Zusammenhang plausibel erscheinen zu lassen. Hierfür dürfen die Stable Unit Treatment Value Assumption (SUTVA), weitere Verzerrungen und das Prinzip der Unconfoundedness nicht verletzt werden.
Donald Rubin stellte die SUTVA Annahme bereits im Jahre 1987 im Zusammenhang mit einer Maßnahme in der Landwirtschaft[4] vor. Diese modellhafte Annahme kann jedoch für jede Intervention als Interpretationsgrundlage dienen, vor allem wenn der Maßnahme eine kausale Wirkung zugesprochen werden soll. Im konkreten Fall für die CLIL-Maßnahme bedeutet dies, dass die Entscheidung eines Schülers an der Intervention teilzunehmen keinen Einfluss auf die Entscheidungen und Ergebnisse aller anderen Schüler hat. Ob ein Schüler am CLIL-Unterricht teilnimmt beeinflusst demnach nicht die potenziellen Ergebnisse anderer Schüler. Zudem muss der CLIL-Unterricht für alle Teilnehmer vergleichbar sein, d.h. nach Möglichkeit darf es keine Variation der Maßnahme in ihrer Art und Weise geben. In Abbildung 1 ist die SUTVA bildlich dargestellt.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 1: Die Stable Unit Treatment Value Assumption (SUTVA) impliziert das Ausbleiben der roten Pfeile. Für alle i ¹ j gilt folgendes: Die Zuteilung eines Schülers (Ri) zu der Maßnahme (CLILi) beeinflusst die Maßnahme (CLILj) und die Ergebnisse (Yj) anderer Schüler nicht. Die Maßnahme eines Schülers (CLILi) beeinflusst die Ergebnisse eines anderen Schülers (Yj) nicht.
Schlussendlich nennt Rubin zwei Kriterien, nach denen SUTVA am ehesten verletzt werden kann: Sobald es a) zwei Versionen der (angeblich) selben CLIL-Maßnahme gibt, die in ihrer Effektivität variieren und b) wenn es eine gegenseitige Beeinflussung der Schüler oder Lehrer gibt (Rubin, 1990).
Darüber hinaus sollte in den Fallstudien keine Verzerrung aufgrund unterschiedlicher Selektion der Teilnehmer auftreten. Werden die Schüler z.B. vom Versuchsleiter nicht zufällig der CLIL- oder NonCLIL-Gruppe zugewiesen, sondern dürfen sich selbst aussuchen, ob sie an der Maßnahme teilnehmen, liegt eine Selbstselektion vor. Dadurch entstehen etwaige Gruppendifferenzen bereits vor Beginn der eigentlichen Maßnahme. Solche Gruppendifferenzen entstehen auch, falls CLIL-Schüler die Maßnahme abbrechen („Dropping Out“) oder zwar nach dem Prinzip der Randomisierung zugeteilt wurden, dann jedoch die Teilnahme korreliert mit unbeobachtbaren Charakteristika ablehnen („Randomization Bias“). Ein weiteres Problem stellt die Konfundierung von Effekten dar, darunter ist eine Überlagerung von Effekten verschiedener UV zu verstehen. Sie tritt dann auf, wenn zusätzlich zur UV noch weitere Kovariablen die Untersuchungsergebnisse beeinflussen. Dieser Einfluss bewirkt, dass nicht mehr eindeutig entschieden werden kann, ob die UV oder eine andere Variable für die Unterschiede verantwortlich ist. Im CLIL-Kontext können eine Vielzahl an beobachtbaren und unbeobachtbaren Kovariablen auftreten, die jedoch nach Möglichkeit kontrolliert werden sollten (z.B. besondere Vorliebe bzw. Abneigung ggü. der L2 oder außerschulischer Kontakt mit der L2). Um kausale Schlüsse ziehen zu können, darf daher keine Konfundierung von Effekten vorliegen, oder sie müssen kontrolliert werden. Rubin (1990) bezeichnet diese Anforderung, wenn die Zuweisung zu einer Gruppe (CLIL oder NonCLIL) unabhängig von den potenziellen Ergebnissen ist, als Unconfoundedness. Formal kann die Anforderung der Unconfoundedness folgendermaßen dargestellt werden:
Dabei beschreibt X einen Vektor der Grundgesamtheit der Schüler und Xi deren Kovariaten. Bedingt durch die Kovariaten X, ist das Paar der kontrafaktischen potenziellen Ergebnisse (Y0,Y1) unabhängig von der Zuweisung zur Maßnahme (D={0,1}). Das Symbol „┴“ bedeutet „unabhängig von“ und „│“ steht für „bedingt durch“. Mit anderen Worten, das Ergebnis der Teilnahme (Y1) und das Ergebnis der Nichtteilnahme (Y0) am CLIL-Unterricht muss unabhängig von der Zuweisung zur Maßnahme (D={0,1}) sein.
Insgesamt werden 4 Studien für die vorliegende narrative Übersichtsarbeit berücksichtigt. Ihnen allen ist gemeinsam, dass aus den jeweiligen Ergebnissen kausale Rückschlüsse auf die Wirksamkeit des CLIL-Unterrichts geschlossen werden. Das Studiendesign variiert jedoch und reicht von einem schlichten quasi-experimentellen Design mit oder ohne Matching über Längsschnittstudien bis hin zu randomisierten Versuchsplänen. Die Studiendesigns stellen jeweils das Gerüst für die Analyse der Ergebnisse dar. Darüber hinaus soll die Zielsetzung von CLIL, d.h. das komplementäre Erlernen des Sachinhaltes und der L2 im Auge behalten werden. Es bietet sich demzufolge an, die Studien in Tabelle 2 einzuordnen, somit ist leicht ersichtlich welche Zielvorgabe (Fokus auf die L2 oder Fokus auf den Inhalt) verfolgt wird und welches Studiendesign vorliegt. Diese Studien werden im weiteren Verlauf im Detail bezüglich ihrer Möglichkeiten und Grenzen untersucht.
Tab. 2: Übersicht der einbezogenen Studien mit Verweis auf den jeweiligen Abschnitt.
Abbildung in dieser Leseprobe nicht enthalten
Die vorliegende Fallstudie trägt den Titel “A comparative study on differences in language output between mainstream and CLIL students at two Austrian colleges of engineering, crafts and arts.” Sie wurde in den Jahren 2008 – 2009 zunächst im Rahmen einer Diplomarbeit (Jexenflicker, 2009) an der Universität Wien durchgeführt. Im Anschluss fand eine Veröffentlichung der wesentlichen Ergebnisse im Buch „Language Use and Language Learning in CLIL Classrooms“ statt (Dalton-Puffer et al., 2010). Kernmerkmal der Intervention stellt ein zusätzlicher CLIL-Unterricht zum traditionellen Englischunterricht in jeweils zwei 11. Klassen an zwei höheren technischen Lehranstalten[5] in Österreich dar. Die Schüler sind zum Zeitpunkt der Intervention ca. 16 Jahre alt. Untersucht wurde die Wirkung der CLIL-Maßnahme auf die allgemeine englische Sprachkompetenz und die englische Schreibleistung der Schüler. Bezüglich der Schreibleistung wurden die Bereiche Task fulfilment, T extual organisation and structure, Grammar und Vocabulary untersucht. Um die allgemeine englische Sprachkompetenz zu bewerten wurde ein C-Test[6] durchgeführt. Als Teilnehmergruppe dienen zwei Schulklassen verschiedener HTLs (College A CLIL und College B CLIL), als Vergleichsgruppe werden ebenso zwei Schulklassen derselben Schulen herangezogen (College A NonCLIL und College B NonCLIL). Die Schüler konnten sich vor Beginn der Maßnahme freiwillig für eine CLIL-Klasse anmelden. Zum Zeitpunkt der Studie bestanden die Klassen bereits, demnach liegt eine Klumpenstichprobe vor. Da keine Randomisierung erfolgte, ist die Fallstudie methodisch einem nichtrandomisierten (quasi-experimentellen) Studiendesign zuzuordnen. Der Versuchsplan sieht keinen Vortest, jedoch die Behandlung und einen Nachtest vor. Von besonderer Bedeutung ist in dieser Studie ein C-Test, der zur Objektivierung der Sprachkompetenz der Schüler zu Grunde gelegt wurde. Die Testaufgabe[7] zur Untersuchung der Schreibleistung bestand aus einem Brief bzw. einer E-Mail an eine fiktive Gastfamilie in New York, bei welcher die Schüler einen zweiwöchigen Aufenthalt haben sollten. Insgesamt umfasst die Studienpopulation n=88 Schüler, davon befinden sich n=41 in der CLIL-Gruppe und n=47 in der NonCLIL-Gruppe. Im Verlauf der Studie brechen zwei Schüler die Maßnahme ab. Die Testhypothese lautet: CLIL Schüler schneiden in der allgemeinen Sprachkompetenz besser ab und übertreffen NonCLIL-Schüler zudem bzgl. des Schreibvermögens. Zweck der Fallstudie ist gemäß der Autorin folgender: “The main aim of this paper is to investigate the impact of CLIL provision on the language output produced by students at two Austrian upper-secondary engineering colleges.” (vgl. Jexenflicker, 2009, S. 1)
[...]
[1] Bulgarisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Deutsch, Griechisch, Ungarisch, Irisch, Italienisch, Lettisch, Litauisch, Maltesisch, Polnisch, Portugiesisch, Rumänisch, Slowakisch, Slowenisch, Spanisch und Schwedisch
[2] Europäische Kommission: Spezial Eurobarometer 386 (2012): Befragt wurden 27000 Personen verschiedener Altersgruppen mit unterschiedlichem sozialem Hintergrund aus allen 27 EU-Ländern.
[3] EMILE: Enseignement d'une Matière par l’Intégration d'une Langue Étrangère, AICLE: Aprendizaje Integrado de Contenidos y Lengua Extranjera, TCFL: Teaching Content in a Foreign Language, EAA: Englisch als Arbeitssprache, BLL: Bilinguales Lehren und Lernen, BILI: Bilingualer Unterricht
[4] Als Maßnahme dienten zwei verschieden effektive Düngemittel, die behandelten Einheiten stellten abgegrenzte Landstücke dar.
[5] Höhere Technische Lehranstalt (HTL,HTLA) in Österreich sind berufsbildende höhere Schulen, mit Schwerpunkt auf technischen, gewerblichen und kunstgewerblichen Fächern. Ausbildungsbereiche sind i.d.R. Bau–Holz, Chemie, Elektrotechnik–Elektronik, Maschinenbau, Textil, und Sonstige.
[6] C-Test: schriftlicher Test zur Feststellung der allgemeinen Sprachbeherrschung in einer Fremdsprache. C-Tests messen objektiv und sehr genau, sie bestehen aus mindestens fünf Texten mit zwanzig bis fünfundzwanzig Lücken, die vom Probanden ergänzt werden müssen.
[7] Lasagabaster (2008) nutzt in seiner Studie fast denselben Test.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!
Kommentare