Bachelorarbeit, 2017
41 Seiten, Note: 2,0
Managment Summary
Inhaltsverzeichnis
Abbildungs- und Tabellenverzeichnis
Abkürzungsverzeichnis
1 Einleitung
2 Grundlagen der Persönlichkeitsmerkmale des Menschen
2.1 Neurotizismus
2.2 Extraversion
2.3 Offenheit
2.4 Gewissenhaftigkeit
2.5 Verträglichkeit
3 Beurteilung der Datengüte
3.1 Reliabilität
3.1.1 Test-Retest Methode
3.1.2 Interne Konsistenz Reliabilität
3.2 Validität
3.2.1 Inhaltsvalidität
3.2.2 Kriterienvali didtät
3.2.3 Konstruktvalidität
3.3 Objektivität
4 Messmethoden zur Erfassung der Persönlichkeitsmerkmale
4.1 Globale Messinstrumente der Persönlichkeit
4.1.1 Revised NEO Personality Inventory (NEO-PI-R)
4.1.2 NEO Five Factor Inventory (NEO-FFI)
4.1.3 Big Five Inventory (BFI)
4.1.4 Big Five Inventory-10 (BFI-10)
4.1.5 Five Item Personality Inventory (FIPI)
4.1.6 Ten Item Personality Inventory (TIPI)
4.1.7 Positive and Negative Affect Schedule (PANAS)
4.2 Deutsche Übersetzungen der Skalen
4.2.1 NEO-Persönlichkeitsinventar
4.2.2 NEO-Fünf-Faktoren-Inventar
4.2.3 Deutsche Version des BFI-10
4.2.4 TIPI-G
4.2.5 Deutsche Version PANAS
4.3 Vergleich der Messmethoden
5 Anwendung der Methoden im Forschungsprozess
6 Zusammenfassung und Schlussfolgerungen
In dieser Arbeit werden konzeptionelle Methoden vorgestellt, wie die Persönlichkeitsmerkmale des Menschen in der (Marketing-)forschung erfasst werden können. Es wird ein Überblick über die die globalübergreifenden, sowie über die deutschen Übersetzungen dieser Skalen gegeben. Des Weiteren werden in einem Vergleich die Unterschiede aufgezeigt, damit in gegenwärtigen Situationen entschieden werden kann, welches Instrument am geeignetsten erscheint. Als Entscheidungsgrundlage wird die Reliabilität und Validität verwendet, die im Vorfeld wie auch die einzelnen Persönlichkeitsmerkmal treffend erläutert werden. Schlussendlich werden die Anwendungsbereiche dieser Skalen präsentiert.
Durch die Arbeit wird ersichtlich, dass das NEO-PI-R das bedeutendste Instrument zur Erfassung der Persönlichkeit darstellt. Durch Selbst- und Fremdbeurteilung kann die Persönlichkeit eines Menschen detailliert beurteilt werden. Diese bringen durch Manipulation Probleme mit sich.
Zusätzlich resultieren in der Praxis durch die fragwürdige Bestimmung der Reliabilität Zustände, auf die in dieser Arbeit näher eingegangen wird und mögliche Lösungsverfahren vorgestellt werden.
4.1.8 Tabelle 1: Überblick über die globalen Messmethoden der Persönlichkeit mit dazugehörigen Forschungsergebnissen
Abbildung in dieser Leseprobe nicht enthalten
Abbildung in dieser Leseprobe nicht enthalten
Die Persönlichkeit eines Menschen ist vielfältig und nimmt in unserem Leben die zentrale Rolle ein. Sie lässt sich in fünf Komponenten gliedern, die geeignet sind, unsere resultierende Verhaltensweise hinreichend zu definieren. Es reichen jedoch vermehrt ökonomische Konzeptansätze nicht mehr aus, die Persönlichkeit vollständig abzubilden. Daher müssen alternative Messmethoden zur Verhaltenserfassung des Menschen gefunden werden. Mit Hilfe von psychologischen Persönlichkeitstests ist es möglich, die Persönlichkeitsfelder durch jeweils untergestellte Facetten näher zu beschreiben. Aus einer Studie von 2015, der Ruhr-Universität Bochum, geht hervor, dass 67% von den Befragten 120, der 580 größten Unternehmen Deutschlands, persönlichkeitsorientiere Verfahren einsetzen (Hossiep et al. 2015). Zum Vergleich wurden im Jahr 2007 bei lediglich 20 Prozent der befragten Unternehmen Persönlichkeitstests durchgeführt (Schuler et al.2007; Hell et al. 2006, zitiert nach Hossiep 2015). In Anbetracht dieser Entwicklung wird deutlich, dass die fachliche Kompetenz allein nicht mehr genügt ist und die Verhaltenskomponente zusätzlich in den Fokus rückt. Diese Arbeit setzt sich mit solchen Skalen auseinander und gibt einen Überblick über die bedeutendsten Konzepte, die in der (Marketing-)forschung ihre Anwendung finden. International werden vor allem die klassischen Methoden, wie das Revised NEO-Personality Inventory (NEO-PI-R), NEO-Five Factore Inventory (NEO-FFI) und das Big Five Inventory (BFI) verwendet, die allerdings durch ihre Itemanzahl besonders zeitintensiv sind. Auch im deutschsprachigen Raum gibt es Übersetzungen, auf die im Folgenden Bezug genommen wird. Gibt es alternativ verkürzte Darstellungen, die dennoch hinreichend in der Forschung verwendet werden können? Insbesondere geben hierbei die Reliabilität und Validität Aufschluss über die Qualität der Messung. Auf dieser Grundlage können Entscheidungen getroffen werden, welches Messinstrument in den jeweiligen Situationen am besten geeignet ist, um die fünf Persönlichkeitsmerkmale des Menschen zu erfassen. Besonders für die Personalauswahl und anschließender Leistungsbewertung der Tätigkeiten lassen sich durch die Fragebögen entscheidende Kenntnisse gewinnen. Zusätzlich können auf der Grundlage von Persönlichkeitstests die Kundenbeziehungen verbessert werden.
Ziel dieser Arbeit ist es, einen Überblick über die elementaren Verfahren zu geben, diese miteinander zu vergleichen, um festzustellen, welches für den Anwendungsbereich in der Marketingforschung am besten geeignet ist.
Der lexikalische Ansatz von Raymond Bernard Cattell gilt als entscheidender Ausgangspunkt für den heutigen Begriff der Persönlichkeit, durch dessen Analyse der Sprache an sich Wörter verglichen werden, die sich in ihren Grundtugenden voneinander unterscheiden. Durch Faktorenanalysen von über zehntausend Adjektiven resultieren fünf Persönlichkeitsmerkmale, die Goldberg (1990) durch den Begriff „Big Five“ prägte. Er stellte fest, dass diese Faktoren die Persönlichkeitsunterschiede nicht alleine definieren, aber das jeder einzelne Faktor als sehr weitgehend beschrieben werden kann. Sie repräsentieren seiner Meinung nach vielmehr die Persönlichkeit auf der höchstmöglichen Abstraktionsebene, in der jede Dimension sechs ausgeprägte Persönlichkeitseigenschaften besitzt (Goldberg 1981). Dieses Fünf-Faktoren-Modell (FFM) hat sich durch deren umfassend darstellenden Faktoren zur weitverbreitetsten Form in der Persönlichkeitsforschung entwickelt (Gosling et al. 2003).
Seitens John et al. (2008) ist es den Forschern nur durch eine akzeptierte Taxonomie möglich, die zusammenhängenden Eigenschaften in speziellen Bereichen grundlegend zu erfassen. Die Persönlichkeitsmerkmale sind dabei durch verschiedene Forschungsansätze identisch. Lediglich in den zu beschreibenden Items der Dimensionen werden deutliche Unterschiede ersichtlich. Diese Merkmale werden im Folgenden allgemeingültig vorgestellt.
Der Neurotizismus lässt sich durch die emotionale Stabilität eines Menschen beschreiben. Die Reaktion auf äußere Einflüsse manifestiert sich bei jedem verschieden, da es einer unterschiedlichen Stärke von Reizen bedarf, um von seinen Gefühlen geleitet zu werden. Belastbare Individuen neigen zu einer gelassenen und optimistischen Haltung, sensible Menschen sind stattdessen schnell reizbar und im Alltag pessimistisch eingestellt.
Außerdem sind Probanden mit hohen Werten auf dieser Skala besonders auf ihr gesundheitliches Wohl bedacht. Sie verfügen jedoch in den seltensten Fällen über eine Bedürfniskontrolle und können somit auf Stresssituationen nicht angemessen reagieren. (Borkenau und Ostendorf 2008, S.7) Eine überdurchschnittliche Neigung in eine Richtung auf der Skala ist nicht empfehlenswert, da beispielsweise durch generelle Frustration die Lebensqualität abhandenkommt und sich das Umfeld als Konsequenz distanziert. Im Privatleben ist diese Unzugänglichkeit gegenüber der Familie und Freunden somit weniger von Vorteil, beruflich kann diese Eigenschaft in Führungspositionen hingegen von hohem Nutzen sein.
Die Extraversion illustriert das Verlangen nach Aufmerksamkeit und wird vor allem durch die Dimensionen Geselligkeit und Durchsetzungsfähigkeit erfasst. Menschen mit einer erhöhten Ausprägung auf der Skala lassen sich, im Gegensatz zu Introvertierten, ausreichend charakterisieren. (Ostendorf und Angleitner 2004, S.40) Extrovertierte treten herzlicher auf und meiden die Einsamkeit. Gruppenaktivitäten sind für sie ebenso bedeutsam wie die Tatsache, dass sie sich bei Planungen in Gesprächen durchsetzen wollen und in Gesellschaft als Lenker agieren. Darüber hinaus stellt sich im Berufsleben eine deutlich höhere Zufriedenheit ein (Judge et al. 2002). Introvertierte leben eher zurückgezogen, bis hin zur Kontaktvermeidung und begegnen ihrem Gegenüber stets sachlich, ohne Wert auf Freundlichkeit zu legen. Auch in diesem Persönlichkeitsfeld wird deutlich, dass eine Balance als wünschenswert gilt, da eine Person gegenüber Fremden zurückhaltend sein kann und sich dennoch freundlich präsentiert.
Bezüglich dieser Dimension besteht zwischen den Forschern der Persönlichkeitsmessungen große Unstimmigkeit der Interpretationsweite, da jeder der Autoren von seiner Facettenbeschreibung überzeugt ist. Durch den Inhalt der Items wäre nach Borkenau und Ostendorf (1999) auch die Bezeichnung „ Offenheit für Intellektuelles und Kultur“ gerechtfertigt. Peabody und Goldberg (1990, 1992, 1993) stellten hingegen fest, dass „Intellekt“ diesen Faktor am besten definiert. McCrae und Costa (1988, 2004) wählen hingegen den Begriff „Offenheit für Erfahrungen“. Der Intellekt ist nach John et al. (2008) jedoch zu eng gefasst und somit bestätigen sie für das BFI die Dimension Offenheit für Erfahrungen.
Das Persönlichkeitsmerkmal der Offenheit beschreibt die Bereitschaft zur Erwägung von Abwechslung. Menschen mit hohen Werten auf der Skala neigen durch ihre Intellektualität zu kreativen und visionären Innovationen.
Der Konservative hingegen hegt die Tradition, da er mit Gewohntem vertraut ist und sieht auf dieser Grundlage keinen Bedarf für die Beeinflussung der Gegenwart. Darüber hinaus gilt bei diesen Menschen die Emotionalität als belanglos, die bei liberalen Menschen hingegen intensiv gelebt wird. Zwischen den Extremen auf der Skala verfügen die Personen über eine elastische Verhaltensweise. Je nach Situation resultiert als Ergebnis ein veränderter oder beibehaltender Zustand. Die Offenheit für neue Erfahrungen nimmt in der Regel mit dem fortlaufenden Alter ab (Borkenau und Ostendorf 1999).
Diese Dimension der Persönlichkeit wird durch die Selbstdisziplin charakterisiert. Diese Eigenschaft differenziert, ob eine Person äußere Einflüsse kontrollieren kann oder diese zur Ablenkung führen und als Konsequenz die Zielerreichung misslingt. Fokussierte Probanden verfügen über ein hohes Maß an Selbstbeherrschung. Sollte diese jedoch zu ausgeprägt sein, besteht die Gefahr für gesundheitliche Schäden und das Fehlen von Bezugspersonen. Diese hohe Merkmalsausprägung korrespondiert mit schulischem, akademischem und beruflichem Leistungserfolg (Ostendorf und Angleitner 2004, S.45).
Eine geringe Gewissenhaftigkeit äußert sich bei flexiblen Persönlichkeiten durch eine unorganisierte Arbeitsweise und Unzuverlässigkeit. Ihre berufliche Karriere ist als Folge somit meist weniger von Erfolg geprägt. Eine Balance sollte auch auf dieser Skala gegeben sein, da eine Selbstdisziplin am Arbeitsplatz ebenso wichtig ist, wie die mögliche Spontanität im privaten Sektor, da ein Ausgleich für die berufliche Zielsetzung geschaffen werden muss. Die Gewissenhaftigkeit nimmt, im Gegensatz zur Offenheit, für Erfahrungen im Laufe des Lebens zu (Borkenau und Ostendorf 1999).
Die Verträglichkeit spiegelt das Bestreben nach den eigenen Interessen wieder. Eine kooperative Verhaltensweise steht einem Konkurrenzdenken gegenüber. Der Nachgiebige wird in den entscheidenden Situationen seine eigenen Interessen unterordnen, um in Gruppengesprächen die Konfrontation zu vermeiden. Er wird sich somit zurücknehmen, da die Übereinstimmung mit seinem Gegenüber für ihn Priorität besitzt. Darüber hinaus setzt der Harmoniebedürftige eine Hilfsbereitschaft seines Gegenübers voraus (Ostendorf und Angleitner 2004, S.44).
Der Kompetitive ist durch niedrige Werte auf der Skala auf seine Durchsetzungsfähigkeit konzentriert und weist in der Facette Altruismus ein egozentrisches Verhalten auf. Durch sein zum Teil aggressives Verhalten statuiert er seine Überlegenheit, worunter Bezugspersonen zu leiden haben. Außerhalb der Pole dieser Skala stellt sich keine Konstanz ein, da diese Person beispielsweise mitfühlend ist, aber dennoch in der gegenwärtigen Situation einer Planung seine Ideen für zielführend betrachtet.
Hohe Merkmalsausprägungen in dieser Dimension sind aufgrund von sozialem Umgang wünschenswert. Daher gelten verträgliche Menschen in der Gesellschaft, im Vergleich zu Kompetitiven, als beliebter. Nichtsdestotrotz ist die Konzentration auf die eigenen Ziele und Interessen in den vielen Situationen von Vorteil. (Ostendorf und Angleitner 2004, S.44)
Die Hauptgütekriterien Reliabilität, Validität und Objektivität geben Aufschlüsse über die Qualität und Brauchbarkeit der verfügbaren Daten. Diese bauen aufeinander auf, für Reliabilität wird Objektivität benötigt, für Validität gilt Reliabilität als voraussetzende Bedingung. Das True Score Model untersucht die Genauigkeit einer Messung, nimmt insbesondere Bezug auf die beiden zuletzt genannten Kriterien und lässt sich in Anlehnung an Churchill (1979) folgendermaßen darstellen:
Abbildung in dieser Leseprobe nicht enthalten
Der resultierende Beobachtungswert Xb setzt sich aus dem wahren, generell nicht bekannten Wert Xw, dem systematischen Fehler Fs und dem zufälligen Fehler Fz zusammen. Aus dieser Formel lassen sich für die Reliabilität und Validität Methoden zur Entwicklung von deren vollständiger Erfassung ableiten (Lienert und Raatz 1998, S.175). Die Reliabilität gibt Auskunft über die Zufallsfehler, wonach die Validität frei von systematischen Fehlern sein sollte. Lediglich durch die Abwesenheit dieser Mängel ist das Untersuchungsergebnis verwendbar. Anderenfalls besitzt die Messung keine Relevanz und ist für nachfolgende Marketingentscheidungen. Diagnostische Urteile sollten somit nicht auf dem beobachtbaren Testwert basieren. Stattdessen sollte bei einem geringen Ergebnis vielmehr der Erwartungsbereich des wahren Wertes berücksichtigt werden (Borkenau und Ostendorf 2008, S.31).
Die Reliabilität gibt als zugehöriges Hauptgütekriterium der Datengüte den Grad der Genauigkeit an, mit dem ein Test ein bestimmtes Merkmal misst, unabhängig von der gewollten Beanspruchung. Auf diese Weise wird die Eigenschaft, beziehungsweise die Fähigkeit durch den Test erfasst. (Bühner 2010, S.60)
Mit der vorangestellten Formel von Churchill (1979) wird deutlich, dass der mögliche Fall Fz=0 keine valide Messung garantiert, da Fs ungleich null betragen kann. Die Reliabilität stellt somit eine notwendige und keine hinreichende Bedingung für die Validität dar. (Kuß und Eisend 2010, S.32) Nimmt die Itemmenge zu, so bewirkt dies auch eine Zunahme der Reliabilität. Als Folge geben auf diese Weise längere Messinstrumente die Vermutung, dass die erhöhte Reliabilität lediglich auf die im Vergleich zu alternativen Methoden erhöhte Itemanzahl zurückzuführen ist. Die Stichprobe sollte daher über eine ausreichende Anzahl von Probanden verfügen und mit Bedacht gewählt sein, da es ansonsten durch Schwankungen im Ergebnis zu Beeinträchtigungen kommt(Kuß und Eisend 2010, S.61).
Die Test-Retest Methode ist durch die Wiederholung einer Messung in einem bestimmten Zeitintervall definiert. Eine Veränderung der Gegebenheiten gilt es zu vermeiden, da anderenfalls die Messung unbrauchbar und die mangelnde Reliabilität nicht auf die geringe Korrelation zwischen den Items zurückgeführt werden kann. (Kuß und Eisend, S.98) Dies äußert sich durch beispielsweise negative Lebensereignisse, die sich sowohl kurz- wie auch mittelfristig auswirken können und als Folge die Testleistungen variieren lassen (Bühner 2010, S.61). Zudem kann sich aufgrund der Erinnerung an die vorherige Messung eine Beeinflussung der zweiten Messung ergeben (Kuß und Eisend 2010, S.98). Da Menschen zu konsistenten Antworten neigen, sollte nach Lienert und Raatz (1998, S.180) die Test-Retest Methode bei einem kurzen Zeitintervall vermieden werden, weil durch eine zu hoch gemessene reliable Messung eine Scheinreliabilität resultieren kann.
Die alternative Möglichkeit zur Schätzung der Reliabilität ist die Methode der internen Konsistenz. Durch die Aufteilung des Messinstruments in zwei gleich große Hälften werden die miteinander korrelierten Testteile verglichen. Je höher die Korrelation zwischen den Items, desto maximaler die Reliabilität.
Die Konsistenzanalyse wird indirekt durch spezielle Kennwerte bestimmt und nicht, wie im Vergleich zur Test-Retest Methode, über Testpaare ermittelt (Lienert und Raatz 1998, S.10). Sie gibt vor allem Auskunft über die Leistungsfähigkeit, die Messgenauigkeit und die Qualität eines Fragebogens und ist daher geeigneter zur Ermittlung der Reliabilität (Lienert und Raatz 1998, S.201).
Das Cronbachs Alpha (a) gilt als meist verbreitet genutzter Index der internen Konsistenz zur Ermittlung der Reliablität (Gosling et al. 2003). Nach Cronbach (1951) stellt das a bei einem gegenwärtigen Test den Mittelwert aller möglichen Koeffizienten von Skalenhälften dar.
Diese besitzen einen Wert zwischen 0 und 1, Werte ab 0,7 gelten zur Erfassung der inneren Konsistenz als ausreichend.
Falls eine nachhaltig geltende Aussage in Betracht gezogen wird, erhält die Test-Retest Methode, bei ausreichend großer Zeitspanne, eine höhere Wertung, als der Koeffizient der Konsistenz. Bei einer repräsentativen Maßzahl und entsprechendem Zeitraum lässt sich aus dieser Methode die tatsächliche Veränderung des Persönlichkeitsmerkmals ableiten. Mit dem Konsistenzkoeffizienten ist dies hingegen unmöglich. (Lienert und Raatz 1998, S.201)
Ein Zustand wird als valide beschrieben, wenn dieser den anvisierten Sachverhalt tatsächlich wiedergibt. Dieser resultiert durch die Vermeidung von systematischen und zufälligen Fehlern. (Kuß und Eisend 2010, S.31) Forscher müssen sich auf die Genauigkeit der Messung verlassen können. Die Validität gibt Aufschluss über die Qualität und hat somit entscheidende Auswirkung auf die Repräsentativität der Untersuchung. Die Validität lässt sich in Inhalts-, Kriterien- und Konstruktvalidität unterteilen.
Nach de Vaus (2002, S.28) stellt die Inhaltsvalidität die Untersuchung dar, in welchem Grad die verschiedenen Aspekte des Konzepts in das Messinstrument einfließen. Bewertung und Eignung des betreffenden Konstrukts erfolgt meist durch Experten, infolgedessen von Augenscheinvalidität gesprochen wird. Murphy und Davidshofer (2001, zitiert nach Bühner 2010) äußerten die Erkenntnis, dass lediglich die Inhaltsvalidität die Definition des Validitätsmaßes entspricht. Allerdings kann diese in der Praxis aufgrund der fehlenden empirischen Prüfbarkeit nicht erfasst werden und wird daher indirekt über die Kriterien- und Konstruktvalidität erfasst (Bühner 2010, S.61).
„Die Kriteriumsvalidität (kriterienbezogene Validität) liegt vor, wenn das Ergebnis eines Tests zur Messung eines latenten Merkmals bzw. Konstrukts mit Messungen eines korrespondierenden manifesten Merkmals außerhalb der Testsituation (Außenkriterium) überein- stimmt[...]“ (Bortz und Döring 2016, S.470).
In der Marketingforschung stehen beispielsweise der Absatz und die Kundenzufriedenheit in einer positiven Beziehung zueinander. Somit sollten die Ergebnisse beider Skalenmessungen ebenfalls einen Zusammenhang aufweisen, anderenfalls ist die Validität als zweifelhaft zu erachten. Die kriterienbezogene Validität ist umso größer, je ausgeprägter die Konformität zwischen dem Kriterium und dem Fragebogen ist. Ein geringer Reliabilitätskoeffizient wirkt sich hingegen negativ aus.
Der Fragebogen und das Konstrukt stehen in Wechselwirkung miteinander, indem der Test das zu messende Konstrukt in bestimmter Weise modifizieren kann, die latente Variable wiederum auf die Struktur des Tests Einfluss nimmt. Somit findet die Konstruktvalidität in einem höheren Maße, als die kriterienbezogene- und inhaltliche Validität in der persönlichkeitspsychologischen Grundlagenforschung ihre Verwendung. (Lienert und Raatz 1998, S.226) Die inbegriffene Konvergenzvalidität beruht nach Peter (1981) auf der Korrelation zwischen den Ergebnissen beider maximal unterschiedlichen Methoden zur Messung desselben Konstrukts. In dieser Messung sollte somit ein hohes Ergebnis erzielt werden. Die Diskriminanzvalidität fordert hingegen bei der Messung zweier unterschiedlicher Konzepte durch ein äquivalentes Messinstrument eine Unkorreliertheit beider Ergebnisse zueinander. Campell und Fiske (1959) weisen darauf hin, dass durch übermäßige Korrelationen mit anderen Tests, die eigenen Fragebögen widerlegt werden könnten, da sie entwickelt wurden, um sich vom Bestehenden zu unterscheiden. Somit gelten niedrige Koeffizienten als wünschenswert.
Neben den erfassbaren Gütekriterien ist auch die Objektivität für die Messung von Bedeutung. Sie fordert die unabhängige Bewertung der Testperson eines Untersuchers. Ein Fragebogen sollte standardisiert werden, damit verschiedene Untersucher die Testleistung für den identischen Probanden kongruent ermitteln und interpretieren (Bühner 2010, S.58). Diese gewünschte Auswertung kann nur unter feststehenden Regeln und präzisen Anweisungen des Testautors resultieren, um gleiche Schlüsse zu garantieren.
Neben den Hauptgütekriterien gilt das Nebengütekriterium der Normierung als eng mit der Objektivität verbunden. Die Einordnung der individuellen Leistung in die Referenzgruppe erlaubt den Rückschluss, wie der Proband die Skalen im Vergleich zu anderen Testpersonen bewertet (Bühner 2010, S.71). Mit Hilfe eines normierten Fragenbogens lässt er sich mit dessen Wahl der Ratingskala durch einen numerischen Wert beurteilen (Lienert und Raatz 1998, S.8). Ein Test, der zwar die Hauptgütekriterien erfüllt, aber nicht normiert ist, besitzt nur geringe diagnostische Brauchbarkeit (Lienert und Raatz 1998, S.12).
Im Laufe der Zeit wurden von den verschiedensten Persönlichkeitsforschern Skalen1 entwickelt, die sich vor allem in ihrer Länge und Qualität erheblich unterscheiden.
Da sich die Welt, seit Einführung der klassischen Messmethoden, vor allem im Bereich der Forschung und dem Internet durch die Globalisierung sehr gewandelt hat, rückt der Zeitfaktor zunehmend in den Fokus. Dadurch geraten Forscher in die Situation, die bestehenden Messinstrumente zur Erfassung der Persönlichkeitsmerkmale weiter zu verkürzen. Gleichzeitig soll garantiert werden, dass die resultierenden Werte der Messung weiterhin als nützlich angesehen werden können. Single-Item Messungen können darüber hinaus die Redundanz der Items beseitigen und somit in Bezug auf den Probanden dessen Ermüdung und Frustration verhindern (Robins et al. 2001).
Die Codierung der Zahlenwerte zu den Antwortmöglichkeiten je Skala erfolgt meist durch freiwillige Hilfskräfte. Die Daten werden anschließend addiert und der erhaltene Summenwert kann von den Testleitern tiefgründig analysiert werden. (Bühner 2010, S.26)
Diese tiefgründige Auswertung ereignet sich allgemeingültig für die folgenden Modelle durch einen Testleiter. Dabei werden die Lösungen der Probanden auf einem Durchschreibebogen abgebildet.
Dieser kann innerhalb von fünf Minuten mit Hilfe einer Farbschablone vom Hilfspersonal abgeglichen werden (Borkenau und Ostendorf 2008, S.35). Sollte zur Erfassung ein elektronischer Fragebogen verwendet werden, resultiert die Verwertung durch Einlesen der Daten am Computer. (Bühner 2010, S.25) Die Fragebogenkonstruktion enthält darüber hinaus eine Umpolung der Items, da anderenfalls Verzerrungen der Testergebnisse resultieren. Sollte der Proband beispielsweise mit der Frage konfrontiert sein, ob er sich selbst nicht als gesellige Person einschätzen würde, erhält er ohne Umpolung die höchstmögliche Punktzahl. Jedoch ist dieser geringfügig extravertiert und durch die vorhandene Modifikation resultiert bei starkem Zuspruch ein Nullwert. (Bühner 2010, S.26)
Im Folgenden soll ein Überblick über die verschiedenen Ansätze gegeben werden.
Das ursprüngliche NEO-Personality Inventory (NEO-PI) erfasste, durch lediglich drei bestehende Dimensionen, die individuellen Unterschiede eines Menschen nur bedingt. Daher wurde das Revised NEO Personality Inventory (NEO-PI-R) durch die zusätzlichen Dimensionen Verträglichkeit und Gewissenhaftigkeit ergänzt. (Costa und Mc Crae 2008, S.181)
Die 240 Items werden in einer Bearbeitungszeit von 45 Minuten auf der fünfstufigen Likert- skala von starker Ablehnung bis starker Zustimmung erfasst. Diese bestehen aus kurzen Thesen, die jeden Faktor der Big Five mit sechs Subskalen messen, die sich wiederum in acht Items aufgliedern. (Bühner 2010, S.25)
Die Autoren bezweifeln, dass eine reine Auszählung für die Persönlichkeitsmessung angemessen ist. Daher entwickelten sie, über die Selbsteinschätzung (Form S) hinaus eine Fremdbeurteilungsversion (Form F), die durch Gleichrangige bzw. Ehegatten vorgenommen wird. (McCrae und Costa 1988)
Dessen Übereinstimmung beträgt für Bekannte 46 %, bei Ehegatten 56 % (Costa und McCrae 1992).
Darüber hinaus erstellten die Persönlichkeitsforscher in ihrem Fragebogen zusätzliche Variablen zur Validitätskontrolle. Die Items A, B und C am Ende des Antwortbogens helfen eine geringe Anzahl von Probanden zu identifizieren, die zugeben, dass ihre Angaben ungültig sind. (Ostendorf und Angleitner 2004, S.77)
Die Rückmeldung des Persönlichkeitsprofils stellt somit für mögliche Probanden eine zunehmende Motivation im Hinblick auf die Teilnahme am Fragebogen und dem implizierten Pflichtbewusstsein dar (Ostendorf und Angleitner 2004, S.71). Durch dieses Feedback wird am ehesten das Ziel der validen Testantworten erreicht (Ostendorf und Angleitner 2004 S.77). Die interne Konsistenz für die Selbstbeobachtung beträgt nach Ostendorf und Angleitner (2004, S.104) 0,89. Auch eine von ihnen vorgenommene Test-Retest Methode über fünf Jahre bestätigte durch den Wert 0,84 eine enorme Stabilität der Messung (Ostendorf und Angleitner 2004, S.107). Die konvergierte Validität beläuft sich auf durchschnittlich 0,59.
Die Diskriminanzvalidität beträgt nach der Gegenüberstellung mit dem BFI 0,17 (Gosling et al. 2003).
Die einzigartige Stärke des NEO-PI-R ist die Verfügung über eine reliable und valide Bekanntenbeurteilungsform, die eine bestehende Selbsteinschätzung ergänzt. Vor allem falls bei der Erstellung des Probanden ein Verdacht auf zweifelhafte Tendenzen vorliegen. (Costa und McCrae 2008, S.189)
Für viele Forscher gilt das NEO-PI-R als zu langwidrig (John et al. 2008). Costa und McCrae führten als Konsequenz das NEO-Five Factory Inventory (NEO-FFI) in die Forschungsprozesse ein. Die fünfstufigen Beantwortungskategorien erstrecken sich von starker Ablehnung, über die neutrale Bewertung, bis hin zu starker Zustimmung. Die Testdauer beträgt mit 15 Minuten ein Drittel der vorherigen Originalversion. Die verkürzte Version der Selbsteinschätzungsform des NEO-PI verwendet je Skala 12 höchst geladene Items zur Erfassung eines jeden Faktors (John und Srivastava 1999).
Das Instrument stellt mit 60 Items eine Teilmenge vom NEO-PI-R dar. Diese können jedoch die sechs definierenden Facetten nicht gleichermaßen wie die Originalversion repräsentieren. Beispielsweise wird die Facette Genügsamkeit, im Gegensatz zum NEO-PI-R, im Neo-FFI nicht verwendet. (John und Srivastava 1999)
Das Cronbachs Alpha der internen Konsistenz beträgt für das NEO-FFI 0,80. Die Reliabilität kann durch das Ergebnis der Test-Retest Methode über zwei Jahre mit einem Wert von 0,78 somit ebenfalls bestätigt werden (Borkenau und Ostendorf 2008, S.18).
Durch die ausreichend hohe Korrelation der NEO-FFI Skalen mit dem NEO-PI-R, liegt es nahe, dass diese eine wesentliche Menge der Validität der Originalversion transportiert (John und Srivastava 1999). Das NEO-FFI besitzt eine Konvergenzvalidität von 0,75 und eine Diskriminanzvalidität von 0,18 (McCrae und Costa 2004).
Die größte Problematik besteht hingegen bei den Items der Dimensionen Offenheit und Verträglichkeit, da die Methode, wie das NEO-PI-R durch deren Items nicht beständig mit der gesamten Skala korrelieren (John und Srivastava 1999).
Als Konsequenz nahmen McCrae und Costa (2004) eine Korrektur des NEO-FFI vor. 14 der 16 Items sollten von den möglichen 180 nichtverwendeten Items ersetzt werden. Durch die Substitution kann das Instrument für eine weitere Bandbreite an Befragten anwendbarer sein. In 13 der 14 Ersatzitems wurden anschließend höhere Faktorladungen erzielt (McCrae und Costa 2004).
Durch diese neuen Studien lassen sich jedoch von 14 der 60 Items höhere Koeffizienten erbringen. Somit kann die Diskriminanzvalidität von 0,18 auf 0,15 korrigiert werden. Trotz der hohen Ergebnisse des NEO-FFI sollte diese Abwandlung durch die mäßigen Unterschiede nur vorgenommen werden, wenn es sich bei den Probanden durch gering Gebildete oder Freiwillige um spezielle Teilnehmer handelt. (McCrae und Costa 2004)
Es wird deutlich, dass auch die verkürzte Methode, trotz möglicher Alternative, für die meisten Absichten durch reliable und valide Messungen ausreicht.
[...]
1 Fokus auf ausgewählte Messinstrumente, die über fünf Persönlichkeitsfelder verfügen, zum Vergleich Wahl des PANAS mit 2 erfassbaren Dimensionen
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!
Kommentare