Beschreibung der Hauptstudie

Site: europa virtuelle Volkshochschule
Course: Subjektiver Lernerfolg
Book: Beschreibung der Hauptstudie
Printed by: Gast
Date: Wednesday, 30 December 2020, 6:30 AM

Description

Konzipiert 2019, durchgeführt ab 1.1.2020

1. Überlegungen zur Art des Konstrukts "Subjektiver Lernerfolg"

Zitation: Hamminger, Leopold (2020). Hauptstudie "Subjektiver Lernerfolg". Überlegungen zur Art des Konstrukts "Subjektiver Lernerfolg". Ebensee: EVVHS.

Korrespondenz an: l.hamminger (at) evvhs.eu

Hinweis: Dieses Kapitel kann gedruckt werden (Zahnradsymbol am oberen rechten Rand).


Das Konstrukt "Subjektiver Lernerfolg" wird in der Literatur (insbesondere der Erwachsenenbildung) häufig als die persönliche Einschätzung Lernender verstanden, welcher objektiver Lernerfolg (bspw. gemessen in Schulnoten) vorliegt. So kann es von Interesse sein, Lernende unmittelbar nach einer Prüfung nach ihrer Einschätzung zu fragen, welche Note sie erwarten (subjektiver Lernerfolg) um diese mit der tatsächlich erreichten Note zu vergleichen (objektiver Lernerfolg).

Für dieses Forschungsprogramm hat "Subjektiver Lernerfolg" eine unterschiedliche Bedeutung. Gemeint sind persönliche Einstellungen oder Überzeugungen zu Lernwirkungen, die das eigene Lernen bewirken können, also Lernerfolg im weiteren (subjektiven) Sinne. Neben Prüfungsnoten kann das die Freude über eine bestandene Prüfung in einem Angstfach sein. Auch die Genugtuung nach einer praktischen Umsetzung des Gelernten, das Gehörtwerden in einer Gruppe oder eine bessere Ausdrucksweise kann als subjektiver Lernerfolg verstanden werden.  

Diese ganz persönlichen Begründungen von Lernerfolg haben ihren Ursprung in den Begründungen warum es überhaupt zu Lernhandlungen (in der Erwachsenenbildung) kommt. Dies wird im Kapitel Theoretisches Modell (Link öffnet im neuen Fenster) näher betrachtet.

Zur Besprechung des Konstrukts ist das Verständnis wichtig, dass nach Holzkamp (bspw. 1993) Lernbegründungen in zwei Kategorien geteilt werden können: expansives und defensives Lernen. Subjektiver Lernerfolg ist damit der Überbegriff für diese beiden Kategorien (es existieren keine weiteren). 

Nach Holzkamp ist die Lernbegründung Expansives Lernen der Überbegriff für die drei Kategorien Gegenstandsaufschluss (auch: Weltaufschluss), Verfügungserweiterung und Lebensqualitätserhöhung (es existieren keine weiteren). Für Defensives Lernen existiert eine einzelne Kategorie: Bedrohungsvermeidung.

Zur Verwendung relevanter statistischer Methoden muss die Art des Konstrukts geklärt werden: reflektiv oder formativ. Unterschiedliche Bezeichnungen existieren, wie die folgende Tabelle zeigt:

Unterschiedliche Bezeichnungen von Konstruktarten
Autoren Kategorie I Kategorie II
Eberle, Giere, Jarvis reflektiv formativ
Jarvis (alternativ) Hauptfaktor zusammengesetzte latente Variable
Law latent Aggregat / Profil
Petter reflektiv (nur eindimensional) formativ (mehrdimensional möglich)

Anmerkung: Aus Platzgründen wurden die Autoren in der Tabelle abgekürzt angezeigt. Die Referenzen zur Literatur sind wie folgt:

Eberl: Eberl (2004)

Jarvis: Jarvis, MacKenzie and Podsakoff (2003)

Petter: Petter, Straub and Rai (2007)

Giere: Giere, Wirtz and Schilke (2006)

Law: Law, Wong and Mobley (1998).

Im weiteren Verlauf wird von reflektiven und formativen Konstrukten (Messmodellen) gesprochen. In der Literatur wird für Messmodell auch die Bezeichnung Spezifikation verwendet. Eberl (2004, 2) weist darauf hin, dass der Begriff der Spezifikation im weiten Sinn zu verstehen ist: Einerseits wird darunter die zu Grunde liegende "reale" Kausalbeziehung der Konstrukte und ihrer Indikatoren, andererseits auch die hypothetisierte Kausalbeziehung verstanden.

Kausalität

Die Frage der Kausalität ist eine wissenschaftsphilosophische, Grund für zahlreiche Debatten in der Literatur. Es gibt jedoch prinzipielle Einigkeit hinsichtlich vier Merkmale (vgl. Edwards & Bagozzi, 2000, 157f):

  1. Kausalität erfordert, dass Ursache (cause) und Wirkung (effect) klar unterschiedliche Einheiten sind. Wenn zwei Variable nicht unterschiedlich sind, dann ist ihr Zusammenhang tautologisch, man sollte daher nicht von Kausalität sprechen.
  2. Kausalität erfordert Zusammenhang, der üblicherweise probabilistisch und nicht definitorisch verstanden ist. Das bedeutet, dass die Ursache eine wahrscheinliche Wirkung ausübt, aber nicht garantiert, dass eine Wirkung eintritt.
  3. Kausalität erfordert eine zeitliche Folge in der Form, dass die Ursache vor der Wirkung auftritt - auch wenn dies nahezu gleichzeitig der Fall ist.
  4. Kausalität erfordert die Beseitigung rivalisierender Erklärungen für den vermuteten Zusammenhang zwischen Ursache und Wirkung (die wahrscheinlich schwierigste Forderung).


Arten der Konstruktspezifikation

1. Reflektive Spezifikation

Die latente Variable ist die kausale Ursache der Ausprägungen der manifesten Variablen. Die Annahme ist, dass - Messfehler vernachlässigt - Veränderungen der latenten Variablen zu Veränderungen aller manifesten Indikatoren gleichermaßen führen. Eberl (2004, 3) bezeichnet sie daher als beispielhafte Manifestierungen der latenten Variablen, da sie a priori austauschbare Messungen für sie darstellen: "Als Beispiel für reflektive Indikatoren kann das Konstrukt Kundenzufriedenheit genannt werden: Wiederkauf- und Weiterempfehlungsabsicht als beispielhafte Indikatoren verändern sich immer in Folge und kausal verursacht durch den dahinter stehenden Faktor Zufriedenheit." (ebenda).

Diese Annahme entspricht dem domain-sampling model von Nunnally: Das definitorische Umfeld (domain) umfasst alle manifesten Variablen, die das latente Konstrukt konzeptionell ausmachen und bilden dadurch das "Indikatorenuniversium des Konstrukts". Dies ist zwar praktisch nicht durchführbar, allerdings bedeutet die Annahme auch, dass diese unendliche Anzahl von Indikatoren durch ihren gemeinsamen Kern untereinander korrelieren. Damit besitzen die Indikatoren eine gleich hohe Validität und sind - eine gleich hohe Reliabilität vorausgesetzt - beliebig austauschbar. (s. ebenda)

Konstruktspezifikation reflektiv

Reflektives Messmodell

(Quelle: Eberl, 2004, 3) 

Gäbe es keine Messfehler, so würde im reflektiven Spezifikationsmodell eine perfekte Korrelation zwischen den Indikatoren bestehen. Die Güte dieses Messmodells zeichnet sich daher durch eine möglichst hohe Korrelation zwischen den Indikatoren aus. Wenig korrelierende Items stammen daher annahmegemäß nicht aus dem Indikatorenuniversum des Konstrukts und sind zu dessen Operationalisierung nicht geeignet. 


2. Formative Spezifikation

Die Ausprägungen der manifesten Variablen verursachen die latente Variable, die Kausalität verläuft damit umgekehrt wie bei der reflektiven Spezifikation.

Konstrukt formativ

Formatives Messmodell

(Quelle: Eberl, 2004, 5) 

Genau genommen haben die manifesten Variablen im formativen Spezifikationsmodell nicht den Charakter von Indikatoren. In der Literatur findet man trotzdem diese Verwendung, sie sind dann nicht im faktorenanalytischen Sinn zu verwenden: "Rather, they are exogenous measured variables that influence the composite defined as a causal indicated variable" (MacCallum/Browne, 1993, in Eberl, 2004, 5).

Im formativen Modell stehen die manifesten Variablen der latenten Variablen zeitlich vor und beeinflussen diese kausal. Jede Veränderung einer einzelnen manifesten Variablen verändert die latente Variable. Andere manifeste Variable verändern sich nur dann, wenn eine kausale Korrelation zwischen den manifesten Variablen besteht. 

Ebenso müssen sich bei der Veränderung der latenten Variable nicht notwendigerweise alle oder einige manifeste Variable ändern - auch die Veränderung einer einzigen manifesten Variable ist möglich. Die manifesten Variablen können als Bausteine des latenten Konstrukts verstanden werden, weshalb sie auch "formativ" genannt werden. Eberl bringt als Beispiel das Konstrukt Sozioökonomischer Status (SES): "Bildung, Einkommen und Prestige des Berufs müssen nicht notwendigerweise korrelieren und bilden doch definitorische Bestandteile des Zielkonstrukts." (ebenda)

Reliabilität und Validität des formativen Messmodells können nicht durch Faktorenanalyse oder Cronbachs alpha überprüft werden, da die manifesten Variablen auch bei Korreliertheit unabhängig voneinander inhaltlich für das Konstrukt bestimmend sind. Würde man aus Gründen niedriger Korrelation Items entfernen (wie im reflektiven Modell), so würde sich dadurch die Inhaltsvalidität des Konstrukts ändern. 

Ein weiteres wichtiges Merkmal des formativen Messmodells liegt darin, dass die manifesten Variablen - als kausale Bestandteile der latenten Variablen - keine Fehlerterme besitzen: "Messfehler existieren nur auf Ebene der Latenten ... Der Fehlerterm wird dabei als mit den Indikatoren unkorreliert angenommen" (Diamontopolous/Winklhofer, 2001, in Eberl, 2004, 8).

Eberl schlägt folgende Vorgehensweise bei der inhaltlichen Ausgestaltung und Operationalisierung des Konstrukts vor:

  • Als erster Schritt ist eine umfassende Definition des zu untersuchenden Konstrukts zu erstellen, also die Bestimmung des definitorischen Umfelds. Für formative Konstrukte ist die Bedeutung der manifesten Variablen ungleich größer.
  • Bei der Auswahl der manifesten Variablen ist jedoch anders als bei reflektiven Indikatoren vorzugehen: Die inhaltliche Vollständigkeit ist zu beachten, auch wenn sie wenig greifbar bleibt. Die Überprüfung von Reliabilitäten im Sinne von Item-To-Total-Korrelationen ist bei formativen Konstrukten kontraproduktiv, im Vordergrund stehen inhaltliche Gesichtspunkte. Einzig sinnvolles Gütekriterium auch im Rahmen der Indikatorenbereinigung ist die externe Validität.
  • Während unter dem faktorenanalytischen Weltbild zwischen den Items eines reflektiven Messmodells hohe Korrelation gewünscht ist und für die Validität der Messung spricht, ist dies bei einem formativen Messmodell problematischer. Sind zwei Indikatoren hoch miteinander korreliert, kann auch im formativen Fall auf einen der beiden verzichtet werden, ohne die Messung substanziell zu verändern.

(nach Eberl, 2004, 10).

Bestimmung der Spezifikationsart

Ob ein Konstrukt reflektiv oder formativ spezifiziert werden soll, war in der Literatur vor 2000 selten im Fokus der Diskussion: "[l]ittle attention has been devoted to the conditions in which measures should be specified as reflective or formative in the first place" (Edwards/Bagozzi, 2000, 156). Es ist durchaus vorstellbar, dass Konstrukte - insbesondere Einstellungen - je nach Kontext sowohl formativ als auch reflektiv spezifiziert werden können (vgl. Rossiter, 2002, in Eberl, 2004, 15).

Eberl schlägt die Bildung einer Spezifikationshypothese vor, die im überprüft wird und im Ergebnis entweder das formative Modell verworfen und das reflektive nicht widerlegt wird, oder das reflektive Modell verworfen und das formative nicht widerlegt wird. Dieser Vorschlag räumt theoretischen Gesichtspunkten eine überragende Rolle ein:

Eberl Spezifikation der Konstruktart

Eberl weist darauf hin, dass die Rückkopplungspfeile in der Abbildung keinesfalls dahingehend interpretiert werden sollen, dass im Sinne eins "Trial-and-Error-Vorgehens" die Konstruktspezifikation so lange verändert wird, bis das Testergebnis akzeptabel ist: "Gegebenfalls muss man das Ergebnis akzeptieren, ein theoretisch fundiertes, jedoch in Bezug auf Gütemaße unbefriedigendes Messmodell spezifiziert zu haben." (ebenda).

Bestimmung der Spezifikation des Konstrukts "Subjektiver Lernerfolg"

Betrachtet wird die unterste Dimension des theoretischen Modells, die Zuordnung der Items sind unter Empirische Ergebnisse aufgeführt. (siehe Theoretisches Modell, und Empirische Ergebnisse, Links öffnen im neuen Fenster). Die Entscheidungsfragen sind (1) Fornell/Bookstein (1982), (2) Bagozzi (1984), (3) MacCallum/Browne (1993); Law/Wong (1999); Rossiter (2002), aus Eberl, 2004, 18, entnommen. 

  1. Sind die Indikatoren des Konstrukts eher als Realisationen eines Faktors zu betrachten, der etwas Beobachtetes zur Folge hat (reflektiv), oder ist das Konstrukt als erklärende Kombination von Indikatoren konzipiert (formativ)? Das Konstrukt wird als Realisationen der Indikatoren verstanden: reflektiv.
  2. Ergibt sich die Bedeutung der Indikatoren aus der Bedeutung des Konstrukts (reflektiv) oder ergibt sich die Bedeutung des Konstrukts aus der Bedeutung der Indikatoren (formativ)? Die Bedeutung der Indikatoren ergibt sich aus der Bedeutung des Konstrukts: reflektiv.
  3. Repräsentieren die Items eher Konsequenzen (reflektiv) oder Ursachen (formativ) des Konstrukts? Die Items repräsentieren Konsequenzen des Konstrukts: reflektiv.  

Die obigen Entscheidungen zu den obigen Fragen, die auf ein reflektives Modell hinweisen, wurden als einigermaßen gesichert angenommen. Weniger klar sind Entscheidungen zu den folgenden Fragen:

  1. Ist das Konstrukt eine hinter der beobachteten Variable stehende Erklärung (reflektiv) oder vielmehr eine erläuternde Kombination aus den Beobachteten (formativ)?
  2. Messen die Indikatoren alle "das Gleiche" im engeren Sinne (reflektiv)?
  3. "Is it necessarily true that if one of the items (assuming all coded in the same direction) were to suddenly change in a particular direction, the others will change in a similar manner" (reflektiv)?
  4. Sind die Indikatoren dieses Konstrukts untereinander beliebig austauschbar (reflektiv)?

Diese Entscheidungsfragen stammen aus: (1) Fornell/Bookstein (1982), (2) Bagozzi (1984), (3) Chin (1983b), (4) Jarvis et al., (2003), aus Eberl, 2004, 18.

Die Entscheidung für das reflektive Spezifikationsmodell kein nicht als vollständig gesichert angenommen werden. Da es aber weniger klare Entscheidungen für ein formatives Modell gibt, wird dem reflektiven der Vorzug gegeben.


Literatur

Eberl, M. (2004). Formative und reflektive Indikatoren im Forschungsprozess: Entscheidungsregeln und die Dominanz des reflektiven Modells. Schriften zur Empirischen Forschung und Quantitativen Unternehmensplanung. Heft 19 / 2004. Ludwig-Maximilians-Universität München.

Edwards, Jeffrey R.; Bagozzi, Richard P. (2000): On the Nature and Direction of Relationships Between Constructs and Measures. In: Psychological Me-thods, Vol. 5, No. 2, S. 155-174.

Giere J., Wirtz, B.W. & Schilke, O. (2006). Mehrdimensionale Konstrukte. Konzeptionelle Grundlagen und Möglichkeiten ihrer Analyse mithilfe von Strukturgleichungsmodellen. Die Betriebswirtschaft, DBW 66 (2006) 6, 678-695.

Jarvis, C.B., Mackenzie, S.B. & Podsakoff, P.M. (2003). A Critical Review of Construct Indicators and Measurement Model Misspecification in Marketing and Consumer Research. In: Journal of Consumer Research. Vol. 30, September 2003, pp. 199-218.

Law, K.S., Wong, C.S., & Mobley, W.H. (1998). Toward a Taxonomy of Multidimensional Constructs. Academy of Management Review 1998, Vol. 23 Nr. 4, pp 741-755.

Petter, S., Straub, D. & Rai, A. (2007). Specifying formative constructs in Information Systems Research. MIS Quarterly, Vol. 31 No. 4, December 2007, pp. 623-656.

2. Theoretisches Modell

Zitation: Hamminger, Leopold (2020). Hauptstudie "Subjektiver Lernerfolg". Theoretisches Modell. Ebensee: EVVHS.

Korrespondenz an:  l.hamminger (at) evvhs.eu

Hinweis: Dieses Kapitel kann gedruckt werden (Zahnradsymbol am oberen rechten Rand).


Basierend auf den Lerntheorien von Holzkamp (siehe bspw. 1993) wurde ein theoretisches Modell der subjektiven Vorstellungen von Lernerfolg entwickelt. Die Annahme ist, dass expansive Lernbegründungen Gegenstandsaufschluss (Weltaufschluss), Verfügungserweiterung oder Erhöhung der Lebensqualität bewirken. Dagegen sollen defensive Lernbegründungen Bedrohungen vermeiden.


Theoretisches Modell ISLE1

Dieses Modell ist vereinfacht konzipiert um eine empirische Überprüfung zu erleichtern. Es beruht auf der Überlegung, dass die persönliche (subjektive) Sichtweise von Lernerfolg vollständig durch die zwei Kategorien von Lerngründen Expansives Lernen und Defensives Lernen gebildet wird. Damit beschränkt sich Lernerfolg auf einen solchen, der auf intentionales Lernen basiert und zieht funktionales Lernen (i.S.v. Siebert, 2012; bei Holzkamp: inzidentelles Lernen bzw. Mitlernen, vgl. 1993, 324f) nicht in Betracht.

Durch die Beschränkung auf intentionales Lernen ist es möglich, in einem späteren Schritt geeignete direkte Handlungsanweisungen zum Lernen zu formulieren. Dies wäre für funktionales Lernen nicht ohne weiteres möglich. Das bedeutet aber nicht, dass die Bedeutung von funktionalem Lernen vernachlässigt werden soll, sondern erklärt nur die Beschränkung in diesem Modell.

Holzkamp gibt den expansiven Lernbegründungen breiten Raum. Aus der Perspektive des obigen Kausalmodells ist Holzkamps Kategorisierung in Gegenstands- (Welt-) Aufschluss, Verfügungserweiterung und Lebensqualität jedoch problematisch. Es ist nicht auszuschließen, dass beispielsweise Verfügungserweiterung direkt, sowie indirekt über Lebensqualität, zur expansiven Lernbegründung beiträgt. Es erschein jedoch sinnvoll, zunächst diese - und andere - Abhängigkeiten empirisch zu überprüfen und deren Ausmaß festzustellen, ehe unterschiedliche Kausalitäten theoretisiert werden.

Aus ähnlichen Gründen der Modellvereinfachung wurde Defensives Lernen nicht weiter kategorisiert. Insbesondere sollte aber der Aspekt des Widerständischen Lernens (s. bspw. Grotlüschen, 2003; Holzer, 2017) nach Vorliegen der empirischen Ergebnisse dieses ersten Modells weiter operationalisiert werden.


3. Planung zum Nachweis der Dimensionen: Explorative Faktorenanalyse (EFA)

Überlegungen theoretischer Natur hinsichtlich der Art des Konstrukts "Subjektiver Lernerfolg" zeigen, dass für den empirische Nachweis der Dimensionen des Konstrukts der Einsatz einer explorativen Faktorenanalyse (EFA) gerechtfertigt ist.

Die nachfolgenden Ausführungen sind Klopp (2013) entnommen, mit freundlicher Genehmigung des Autors, Dr. Eric Klopp, Universität des Saarlandes.

Zitation: Klopp, Eric (2013). Explorative Faktorenanalyse. Verfügbar unter:  http://hdl.handle.net/20.500.11780/3369 [16.11.2020].

Korrespondenz an: e.klopp (at) mx.uni-saarland.de

Hinweis: Dieses Kapitel kann gedruckt werden (Zahnradsymbol am oberen rechten Rand).

Zusammenfassung. Die explorative Faktorenanalyse (EFA) ist ein Verfahren aus der multivariaten
Statistik. Mithilfe der Faktorenanalyse kann aus den Beobachtungen vieler manifester Variablen
(z .B Items eines Fragebogens) auf wenige zugrunde liegende latente Variablen, die Faktoren
genannt werden, geschlossen werden. Eine EFA führt zu einer Reduktion der Variablen auf wenige,
den manifesten Variablen zugrunde liegende Faktoren. Der folgende Text gibt einen Überblick
über die Grundlagen der EFA sowie der wichtigsten Überlegungen, die bei ihrer Durchführung berücksichtigt
werden müssen und stellt die wichtigsten faktorenanalytischen Methoden vor.


Überblick

Die explorative Faktorenanalyse (EFA) ist ein Verfahren zur Datenanalyse, das angewendet wird, wenn in einem Datensatz nach einer noch unbekannten, korrelativen Struktur gesucht werden soll. Die EFA gehört somit in die Gruppe der strukturentdeckenden Verfahren. Unter der explorativen Faktorenanalyse versteht man nicht ein bestimmtes Verfahren, sondern eine Familie verwandter Verfahren. Das in der Psychologie am meisten eingesetzte Verfahren ist die Hauptkomponentenanalyse (principal components analysis, PCA). Seltener zum Einsatz kommen die Hauptachsenanalyse (principal axis factor analysis, PAF) und die Maximum-Likelihood-Faktorenanalyse (maximum likelihood factor analysis, ML). Die PCA ist in der Psychologie zum Teil zu einem Quasi-Standard geworden, obwohl sie keine Faktorenanalyse im eigentlichen Sinn darstellt, dazu später mehr. Einen Überblick über die unterschiedlichen Verfahren bietet Bühner (2006).

Ziel einer Faktorenanalyse ist es, eine Vielzahl von korrelierenden, manifesten Variablen auf einen kleinen Satz latenter Variablen (Faktoren) zurückzuführen, die einen möglichst großen Teil der Varianz der Ausgangsvariablen aufklären. Die Grundannahme der Faktorenanalyse besteht darin, dass sich der Wert einer Variable additiv in eine gewichtete Summe aus den Faktoren zerlegen lässt. Diese Annahme lässt sich durch folgende Gleichung ausdrücken (Moosbrugger & Hartig, 2003):

Gleichung Faktorenanalyse

wobei xim der beobachtete Wert der Person i auf der Variablen m, ξij der Wert der Person i auf dem Faktor j, λmj die Faktorladung der beobachteten Variable m auf dem nicht beobachtbaren (latenten) Faktor j darstellt. f bezeichnet die Anzahl der dem Wert xim zugrunde liegenden Faktoren und εim bezeichnet eine Residualvariable. Die Residualvariable wird gelegentlich als Einzelrestvarianz bezeichnet (Eckey, Kosfeld & Rengers, 2002). Der beobachtete Wert xim stellt einen Indikator dar, welche Rückschlüsse auf den Wert der latenten Variable λmj erlaubt. Diese Gleichung ist die mathematische Formulierung des Modells gemeinsamer Faktoren (common factor model) von Thurstone (1947). Dabei wird die Varianz der manifesten Werte aufgeteilt in die Varianz, welche durch die latenten Faktoren verursacht wird und in die Residualvarianz. Die Residualvarianz setzt sich zusammen aus der Varianz der beobachteten Variablen, die nicht durch die gemeinsamen Faktoren verursacht wird (z. B. nicht berücksichtigte Faktoren, systematischer Fehler) und in die Fehlervarianz, die weder auf die Faktoren noch auf die manifesten Variablen zurückzuführen ist (unsystematischer Fehler) (Brown, 2006). Das Besondere an der explorativen Faktorenanalyse bzw. dem Modell gemeinsamer Faktoren ist, dass jede der angenommenen latenten Variablen einen Einfluss auf die manifesten Variablen hat.

Bei der PCA wird jedoch die Residual- und Fehlervarianz nicht berücksichtigt. Stattdessen geht es ausschließlich um die Reduktion von Daten und um die Reduktion von Redundanzen (Interkorrelationen) zwischen den einzelnen Variablen (Leonhart, 2004). Aus diesem Grund stellt eine PCA keine Faktorenanalyse im eigentlichen Sinn dar, es ist lediglich ein Instrument zur Datenreduktion. Da in der psychologischen Modellbildung, insbesondere in dem Thurstone’schen Modell gemeinsamer Faktoren, die Residualvariable aber eine wichtige Rolle spielt, eignet sich eine PCA nicht für die Analyse psychologischer Daten.

Startpunkt der EFA ist die Interkorrelationsmatrix der Variablen. Davon ausgehend werden nun mittels eines Algorithmus neue „künstliche“ Variablen errechnet, die mit den manifesten Variablen korrelieren (für eine Beschreibung dieses Algorithmus s. Bortz & Schuster, 2010 bzw. Backhaus, Erichson, Plinke & Weiber, 2003). Diese „künstliche“ Variable wird Faktor oder auch latente Variable genannt. In der Fachsprache ist dann die Rede davon, dass die mit ihm korrelierenden manifesten Variablen auf dem Faktor laden. Diese Korrelation der manifesten Variablen mit den Faktoren wird Faktorladung (oder einfach nur Ladung) genannt und kann Werte zwischen -1 und 1 annehmen. Man kann maximal so viele Faktoren extrahieren, wie Variablen in der Analyse vorhanden sind. Allgemein gilt: je höher die ursprünglichen Variablen korrelieren, desto weniger Faktoren werden zur Beschreibung der Daten benötigt.

Eine Faktorenanalyse führt im Idealfall zu einer sogenannten Einfachstruktur (Thurstone, 1947). In diesem Fall laden nur bestimmte Variablen hoch auf einem Faktor und sehr niedrig auf allen anderen Faktoren. Neben den Faktoren und Faktorladungen führt eine EFA zu den folgenden Ergebnissen: dem Eigenwert eines Faktors, den Kommunalitäten, der Ladungsmatrix und den Faktorwerten. Der Eigenwert eines Faktors ist die Summe der quadrierten Faktorladungen eines Faktors über alle Variablen, er errechnet sich durch Quadrieren und Aufaddieren der Faktorladungen in den jeweiligen Spalten der Ladungsmatrix und gibt an, wie viel Varianz ein Faktor erklärt: ein Eigenwert von 1 bedeutet, dass ein Faktor genauso viel Varianz wie eine Variable erklärt. Die Kommunalität ist die Summe der quadrierten Ladungen einer Variablen über alle Faktoren, sie errechnet sich durch Quadrieren und Aufaddieren der Faktorladungen in den jeweiligen Zeilen der Ladungsmatrix und gibt an, wie viel Varianz die Variable an allen Faktoren erklärt. Die Ladungsmatrix ist das Ergebnis von primärem Interesse beim Rechnen einer EFA; in ihren Zeilen finden sich die Variablen und in ihren Spalten die Faktoren. Im Schnittpunkt einer Zeile mit einer Spalte findet sich die Faktorladung der Variablen auf dem Faktor. Der Faktorwert gibt die Ausprägung des entsprechenden Faktors bei einem Individuum wieder und errechnet sich als Linearkombination der Faktorladungen mit den individuellen Ausprägungen der manifesten Variablen bei einer Person. Die Faktorwerte sind standardnormal verteilt.

Eine EFA birgt jedoch auch Probleme. Dabei gilt es folgende Punkte zu berücksichtigen:

  1. Eignung der Daten zur Durchführung einer EFA: Da die Durchführung einer EFA voraussetzt, dass die Variablen hoch genug interkorrelieren, um sinnvolle Ergebnisse zu liefern, ist ein Verfahren nötig, das die Prüfung der Daten zur generellen Eignung auf eine faktorenanalytische Auswertung hin gestattet. Auch von Bedeutung ist eine ausreichende Stichprobengröße, damit überhaupt eine stabile Faktorlösung errechnet werden kann.
  2. Anzahl der zu extrahierenden Faktoren: Dieses Problem zielt auf die Tatsache ab, dass eine EFA es prinzipiell gestattet, so viele Faktoren zu extrahieren, wie Variablen vorhanden sind. Damit ist aber keine Informationsverdichtung erfolgt. Man benötigt also Kriterien, die einem Anhaltspunkte liefern, wie viele Faktoren sinnvollerweise zu extrahieren sind.
  3. Interpretations-/Rotationsproblem: Die extrahierten Faktoren müssen entsprechend der Faktorladungen der Variablen inhaltlich interpretiert werden. Die Interpretation lässt sich häufig durch eine Rotation der Faktoren erleichtern, somit ist es notwendig, sich für eine geeignete Faktorenrotation zu entscheiden.
  4. Bedeutsamkeit von Faktorladungen: Dieser Punkt beschäftigt sich mit der Frage, ab welcher Höhe die Faktorladungen bedeutsam zu interpretieren sind, das heißt bei der Interpretation und Benennung eines Faktors eine Rolle spielen.

Eignung der Daten zur Durchführung einer EFA

Um die Eignung von Daten für die Faktorenanalyse zu bestimmen gibt es mehrere Verfahren. Das am häufigsten benutzte Verfahren ist das Kaiser-Meyer-Olkin (KMO) Maß. Das KMO-Maß errechnet sich nach Bühner (2006) mittels der Formel

Formel KMO KIaiser-Meyer-Olkin Maß

wobei rij  der Korrelationskoeffizient der Variablen i und j ist und rij*z  der partielle Korrelationskoeffizient nach Herauspartialisierung aller anderen Variablen darstellt. Man bestimmt also den gemeinsamen Varianzanteil, den alle Variablen miteinander teilen, und setzt diesen mit dem gemeinsamen Varianzanteil aller Variablen miteinander zuzüglich der Summe der quadrierten Partialkorrelationskoeffizienten in Beziehung. Eine große Summe der Partialkorrelationskoeffizienten bedeutet, dass die Interkorrelationsmatrix wenig gemeinsame Varianz enthält und somit wird der KMO-Koeffizient klein. Um die Eignung einer Interkorrelationsmatrix beurteilen zu können, gelten folgende die in Tabelle 1 aufgeführten Anhaltspunkte (nach Kaiser & Rice, 1974).

Analog zur Prüfung, ob die Gesamtheit aller Variablen zur Durchführung einer EFA geeignet ist, existiert noch die Möglichkeit, die Eignung einer einzelnen Variable zu prüfen. Dies geschieht mit dem sogenannten Measure of Sampling Adequacy (MSA), das eng mit dem KMO-Maß verwandt ist. Das MSA berechnet sich aus den Korrelationen und Partialkorrelationen zwischen den Variablen und den übrigen noch vorhandenen Variablen (Bühner, 2006). Das MSA-Maß gibt somit an, wie gut eine Variable zu den übrigen Variablen passt, mit denen eine Faktorenanalyse durchgeführt werden soll. Die Interpretation des MSA richtet sich nach den gleichen Kriterien wie beim KMO-Maß.

Tabelle 1: Eignung der Daten zur Berechnung einer Faktorenanalyse mittels des KMO-Koeffizienten

EFA Eignung KMO-Koeffizient

Die Stichprobengröße und die Anzahl der manifesten Variablen beeinflussen ebenfalls die Ergebnisse einer Faktorenanalyse. In der Literatur zu findende Daumenregeln (siehe z. B. Brayant & Yarnold, 2001 für eine Übersicht), die ein Verhältnis von Variablen zu Fällen in einem Bereich von 1:3 bis 1:10 angeben, erwiesen sich als nicht hinreichend. MacCallum, Widaman, Zhang und Hong (1999) konnten in Monte-Carlo-Studien zeigen, dass nicht das Verhältnis von Variablen zu Fällen für die Ergebnisse entscheidend ist, sondern die Kommunalität (h2) einer Variablen. MacCallum et al. (1999) geben eine Stichprobengröße von n = 60 als ausreichend an, wenn die Kommunalität aller Variablen mindestens .60 beträgt. Ergebnisse von Mundform, Shaw und Ke (2005) bestätigen dies. Allerdings wurden die Ergebnisse von Mundform et al. (2005) nur an sog. Maximum-Likelihood-Faktorenanalysen mit Varimax-Rotation (s. u.) gewonnen, sodass diese nicht auf andere Extraktions- und Rotationsverfahren verallgemeinert werden sollten. Zusammenfassen lässt sich der Zusammenhang von Stichprobengröße wie folgt (in Anlehnung an Bühner, 2006):

Tabelle 2: Zusammenhang zwischen Stichprobengröße, Kommunalität und Durchführbarkeit einer EFA

EFA Stichprobengröße Kommunalität Durchführbarkeit

Bestimmung der Faktorenzahl

Ein weiteres Problem stellt die Anzahl der Faktoren dar, die es zu extrahieren gilt. Grundlegendes Ziel einer Faktorenanalyse soll es sein, eine Faktorenstruktur zu ermitteln, die in Bezug auf die verwendete Methode der Faktorenextraktion und -rotation so stabil ist, dass ihre Replikation in einer anderen Untersuchung sichergestellt ist. Daher sollte es Methoden geben, die es erlauben, die Zahl der Faktoren objektiv zu bestimmen. Prinzipiell ist die Frage mathematisch zu beantworten, wobei es aber auch eine Methode gibt, deren Ergebnisse subjektiv vom Auswerter abhängen können. Dies ist der Scree-Test, der weiter unten beschrieben wird. Allerdings existiert neben der Frage der Bestimmung der Faktorenzahl noch ein weiteres Problem: ist die Anzahl der Faktoren auch inhaltlich interpretierbar? Es ist keinesfalls gegeben, dass eine bestimmte Anzahl an Faktoren automatisch eine Interpretierbarkeit gewährleistet. Somit befinden wir uns in einem Spannungsfeld, das gegebenenfalls zugunsten der inhaltlichen Interpretierbarkeit entschieden werden sollte. Generell sollte gelten, dass nur die Faktorlösung genommen wird, deren inhaltliche Interpretierbarkeit gegeben ist.

Ein subjektives Kriterium um die Anzahl der zu extrahierenden Faktoren zu bestimmen ist der Scree-Test nach Cattell (1966). Beim Scree-Test werden zuerst die Eigenwerte in einem Diagramm dargestellt. Dabei werden die Nummer des Faktors auf der Abszisse und die dazugehörigen Eigenwerte auf der Ordinate abgetragen. Danach werden alle Punkte dieses Koordinatensystems paarweise mit einer Geraden verbunden. Diese Darstellung wird Scree-Plot genannt. Die Stelle, an dem dieser Graph einen Knick aufweist, bestimmt die Zahl der zu extrahierenden Faktoren; sie wird an der Faktornummer auf der Abszisse abgelesen. An diesem Punkt beginnt die Methode ihre Objektivität einzubüßen. So weist Bühner (2006) darauf hin, dass in der Literatur sowohl Versionen  des Scree-Tests zu finden sind, die nur die Zahl der Faktoren bis zum Knick als bedeutsam erachten, als auch Autoren, die den Faktor nach dem Knick mit einbeziehen. Schließlich ist es auch möglich, dass der Graph eines Scree-Plots mehrere Knicke  aufweist. Somit hängt die Zahl der Faktoren von den Vorlieben des Auswerters ab.

Eines der mathematischen Verfahren ist die Parallelanalyse nach Horn (1965). Bei der Parallelanalyse werden Eigenwerte einer Faktoranalyse eines empirisch gewonnenen Datensatzes mit den Eigenwerten einer Faktorenanalyse eines Datensatzes mit normalverteilten Zufallsdaten verglichen. Die Idee der Parallelanalyse besteht darin, dass bei der Faktorenanalyse des empirischen Datensatzes soviel Faktoren beibehalten werden, wie es Eigenwerte gibt, die größer als die Eigenwerte des Zufallsdatensatzes sind. Anders ausgedrückt heißt dies, dass die Faktoren, die man beibehalten will, wenigstens soviel Varianz aufklären sollen, wie sich bei der Analyse von Zufallsdaten ergibt. Voraussetzung dabei ist die Übereinstimmung der Anzahl der Variablen und Fälle des  empirischen Datensatzes und des Zufallsdatensatzes. Auch sollte die Verteilung der Variablen der empirischen Daten normalverteilt sein; ist dies nicht der Fall, sollten keine normalverteilten Zufallsdaten verwendet werden, sondern die empirischen Daten sollten permutiert werden, wodurch die Verteilungsform erhalten bleibt. In der praktischen Anwendung geht man von einer  künstlich erzeugten Datenmatrix mit normalverteilten Zufallsdaten aus, wobei die Anzahl der generierten Fälle und Variablen mit denen der eigentlichen Daten übereinstimmt. Weichen die empirischen Daten sehr von der Normalverteilung ab, werden die Daten permutiert. Hat man die Zufallsdaten erzeugt (bzw. die ursprünglichen Daten permutiert), wird daraus die Interkorrelationsmatrix errechnet, bevor aus dieser mittels des EFA-Algorithmus so viele Faktoren extrahiert werden, wie Variablen vorhanden sind. Dieser Durchgang wird mehrmals wiederholt und die jeweils errechneten Eigenwerte werden gemittelt. Im Anschluss daran vergleicht man die gemittelten Eigenwerte der Zufallsdaten mit den Eigenwerten der eigentlichen Daten. Man behält nun so viele Faktoren bei, wie es Eigenwerte gibt, die größer sind, als die gemittelten Eigenwerte der Zufallsdaten. Grafisch wird der Eigenwertverlauf der eigentlichen Daten mit dem Eigenwertverlauf der Zufallsdaten in einem Scree-Plot dargestellt. Es werden diejenigen Faktoren beibehalten, deren Eigenwerte in der Grafik über den Zufallseigenwerten liegen. Nach Zwick und Velicer (1986) führt die Parallelanalyse zu guten Ergebnissen. O’Connor (2000) weist darauf hin, dass die Parallelanalyse in einigen Fällen zu einer Überextraktion von Faktoren führen kann.

Ein weiteres Kriterium für die Bestimmung der Faktorzahl ist die Replikativität der Faktorenstruktur.
Zur Bestimmung der Replikativität wird die Versuchspersonenstichprobe in zwei Zufallshälften aufgeteilt und mit diesen beiden neuen Stichproben jeweils die gewünschte Faktorenlösung berechnet. Die beiden resultierenden Faktorladungsmatrizen werden dann mithilfe der Kongruenzkoeffizienten von Tucker miteinander verglichen. Der Kongruenzkoeffizient
(Tucker, 1951) berechnet sich folgendermaßen:

Tucker Kongruenzkoeffizient

wobei aij die Ladung der Variablen i auf dem Faktor j der ersten Faktorladungsmatrix und bik die Ladung der Variablen i auf dem Faktor k der zweiten Faktorladungsmatrix darstellt. Der resultierende Koeffizient Cjk kann Werte zwischen -1 und -1 annehmen und ist analog zu einer Korrelation zu interpretieren. Allerdings gibt es keine Möglichkeit den Kongruenzkoeffizienten abzusichern und es kommt erschwerend der Umstand hinzu, dass selbst durch Verwendung von Zufallsmatrizen hohe Kongruenzkoeffizienten mit Beträgen um die .80 errechnet werden können. Es muss also gefordert werden, dass die Kongruenzkoeffizienten entsprechend hoch sind (über .80), um die Replikativität der Faktorenstruktur sicherzustellen.

Rotation und Interpretation der Faktoren

Das letzte Problem, dass es zu besprechen gilt, ist die Interpretation der gefundenen Faktoren. Häufig ist die erste errechnete Faktorlösung nur schwer interpretierbar. Um die Interpretierbarkeit der Faktorlösung zu erleichtern, existieren sogenannte Rotationsmethoden. Dabei werden die gefundenen Faktoren so gedreht, dass sie möglichst gut zu interpretieren sind, wobei hier die oben schon erwähnte Einfachstruktur ein angestrebtes Ziel ist. Durch die Einfachstruktur wird gewährleistet, dass jede Variable nur auf einem Faktor lädt und somit Interpretationsschwierigkeiten durch Variablen, die auf zwei oder mehr Faktoren hoch laden, verhindert werden sollen. Die Einfachstruktur ist aber nur ein angestrebtes Ziel, das keinesfalls erreicht werden muss.

Grundsätzlich kann man bei Rotationsmethoden schiefwinklige (oblique) und orthogonale Rotationsmethoden unterscheiden. Eine Faktorenlösung mit m Faktoren kann geometrisch als m-dimensionaler Raum interpretiert werden. Wird eine oblique Rotationsmethode gewählt, können die Achsen des m-dimensionalen Raumes nach der Rotation schiefwinklig aufeinander stehen, bei orthogonaler Rotation sind die Achsen nach der Rotation paarweise orthogonal zueinander. Inhaltlich gesprochen bedeutete dies, dass bei obliquen Faktorrotationen Korrelationen zwischen den Faktoren erlaubt sind, wohingegen bei orthogonalen Rotationen die Faktoren immer unkorreliert sind. Wird eine orthogonale Rotation angewandt, sollte man aber bei der Interpretation nicht den Fehler begehen, die Unkorreliertheit der Faktoren als Indiz für in der Wirklichkeit unabhängige Eigenschaften zu nehmen. Die Unkorreliertheit der Faktoren, die als Repräsentation für die wirkliche Eigenschaft stehen, ist ein Artefakt der orthogonalen Rotation. Ob eine oblique oder eine orthogonale Rotation gewählt werden soll, hängt von der zu beantwortenden Frage ab.

Es existiert eine kontroverse Diskussion, ob eine orthogonale oder eine oblique Rotationstechnik angewandt werden sollte. So sprechen sich Moosbrugger und Hartig (2002) dafür aus, nur oblique Rotationen anzuwenden, da sich bei Unabhängigkeit automatisch unabhängige Faktoren ergeben. Allerdings sprechen die Autoren auch den Fall an, dass aus anderen Gründen orthogonale Faktoren gewünscht werden. Dies ist beispielsweise bei Faktoren, deren Faktorwerte als unabhängige Prädiktoren in eine multiple Regressionsanalyse eingehen sollen, der Fall. Oder wenn auf der Grundlage der Faktorenanalyse Skalen konstruiert werden sollen, die möglichst unabhängig voneinander sein sollen. Bühner (2006) empfiehlt, immer zuerst eine oblique Rotationstechnik anzuwenden. Sind die Korrelationen der Faktoren nur gering ausgeprägt, kann anschließend ein orthogonales Rotationsverfahren angewendet werden.

Eine orthogonale Rotationsmethode ist die Varimax-Rotation. Die Varimax-Rotation hat zum Ziel, eine Einfachstruktur in der Faktorlösung zu erreichen. DAs Einfachstrukturkriterium verlangt, dass pro Faktor einige Variablen möglichst hoch laden, während andere möglichst niedrig laden sollen. Dies ist mit der Forderung gleichbedeutend, dass die Varianz der Faktorladungen maximiert wird. Zur Berechnung werden zuvor die Faktorladungen quadriert, sodass positive wie negative Faktorladungen gleich zur Varianz beitragen. Die Achsen werden dann so lange rotiert, bis mittlere Ladungen gering bzw. extrem werden. Zusammengefasst bedeutet dies eine Rotation der Faktoren in der Art, dass die Varianz der quadrierten Ladungen pro Faktor maximiert wird (Bortz & Schuster, 2010).

Das bekannteste der obliquen Rotationsverfahren ist die Promax-Rotation. Bei diesem werden die ursprünglichen orthogonalen Ladungen mit den Exponenten 2, 4 oder 6 potenziert und anschließend oblique rotiert (Eckey et al., 2002). Dadurch sollen extrem hohe und extrem niedrige Faktorladungen vermieden und die Interpretation der Ergebnisse erleichtert werden. Die benutzten Exponenten müssen vor der Durchführung der Rotation festgelegt werden. Die Promax-Rotation mit dem Exponenten 4 führt in der Regel zu guten Resultaten (Eckey et al., 2002, Bühner, 2006).

Anders als bei der orthogonalen Rotation kann nach einer obliquen nicht mehr die Kommunalität (die Summe der quadrierten Faktorladungen) berechnet werden, da die Faktoren nicht mehr unabhängig voneinander sind (Eckey et al., 2002). Ein weiterer Unterschied besteht darin, dass bei obliquen Rotationstechniken die ursprüngliche Faktorladungsmatrix in eine Mustermatrix und eine Strukturmatrix aufgeteilt wird. Die Mustermatrix gibt die standardisierten partiellen Regressionsgewichte der Variablen auf die Faktoren an, währen die Strukturmatrix die Korrelationen der Variablen und der Faktoren angibt. Zur Interpretation sollte die Mustermatrix betrachtet werden (Bühner, 2006). Weiterhin wird bei obliquen Rotationsverfaahren die Matrix der Faktorkorrelation ausgegeben.

Nachdem durch die Rotation die Interpretierbarkeit der Faktorlösung verbessert wurde, muss noch geklärt werden, welche Variablen zur Interpretation eines Faktors herangezogen werden. Das eheißt: Wie hoch muss die Faktorladung einer Variablen sein, damit diese als zu diesem Faktor gehörig betrachtet und zu seiner Interpretation herangezogen werden kann? 

Eine Faustregel besagt, dass bei der Interpretation der Faktoren nur Ladungen berücksichtigt werden, die größer als 0,30 sind (Gorsuch, 1983). Kline (1997) zufolge spielt aber nicht nur die statistische Bedeutsamkeit eine Rolle, sondern auch die psychologische Bedeutsamkeit. Kline gibt ebenfalls die Empfehlung, Ladungen unter 0,30 nicht zu interpretieren. Allerdings wirkt sich auf die Höhe der Faktorladungen auch die Anzahl der Variablen und die Stichprobengröße aus. Diese bleiben in der Faustregel aber unberücksichtigt.

Differenzierte Interpretationshinweise geben Guadagnoli und Velicer (1988, zitiert nach Bortz & Schuster, 2010):

  • Wenn auf einem Faktor mindestens vier Variablen Ladungen über 0,60 aufweisen, kann die Faktorenstruktur ungeachtet der Stichprobengröße generalisierend interpretiert werden.
  • Das Gleiche gilt für Faktoren, auf denen jeweils zehn oder mehr Variablen Ladungen größer 0,40 aufweisen.
  • Wenn weniger als zehn Variablen eine Ladung größer als 0,40 aufweisen, sollte eine Interpretation nur erfolgen, wenn die untersuchte Stichprobe mindestens 300 Fälle enthält.
  • Wenn weniger als zehn Variablen eine Ladung größer als 0,40 aufweisen und der Stichprobenumfang weniger als 300 Fälle beträgt, muss mit zufälligen Ladungsmustern gerechnet werden. Eine Interpretation sollte nur dann erfolgen, wenn sich die gefundene Faktorenstruktur in anderen Stichproben replizieren lässt.


Literatur

Backhaus, K., Erichson, B., Plinke, W. & Weiber, R. (2003). Multivariate Analysemethoden. Heidelberg: Springer.

Bortz, J., Schuster, C.  (2010). Statistik für Human- undSozialwissenschaftler. Heidelberg: Springer.

Brown, T. A. (2006). Confirmatory factor analysis for applied research. New York: Guilford Press.

Bryant, F. B. & Yarnold, P. R. (1994). Principal-components analysis and exploratory and confirmatory factor analysis. In: L. G. Grimm & P. R. Yarnold (Hrsg) Reading and understanding multivariate statistics. Washington: American Psychological Association.

Bühner, M. (2006). Einführung in die Test- und Fragebogenkonstruktion. München: Pearson.

Cattell, R. B. (1966). The scree test for the number of factors. Mulitvariate Behavioral Research, 1, 245-276.

Eckey, H.-F., Kosfeld, R. & Rengers, M. (2002). Multivariate Statistik. Wiesbaden: Gabler.

Gorsuch, R. L. (1983). Factor analysis. Hillsdale: Erlbaum.

Guagdagnoli, E. & Velicer, W. F. (1988). Relation of sample size to the stability of component structure. Psychological Bulletin, 103, 265-275.

Kaiser, H. F. & Rice, J. (1974). Little Jiffy, Mark IV. Educational and Psychological Measurement, 34, 11-117.

Kline, P. (1997). An easy guide to factor analysis. London: Routledge.

Loenhart, R. (2004). Lehrbuch Statistik. Einstieg und Vertiefung. Bern: Huber

MacCallum, R. C., Widaman, K. F., Zhang, S. & Hong, S. (1999) Sample size in factor analysis.  Psychological Methods, 4, 87-99.

Moosbrugger, H. & Hartig, J. (2002). Factor analysis in personality research: Some artefacts and their consequences for psychological assessment. Psychologische Beiträge, 44, 136-158.

Mundform, D. J., Shaw, D. G. & Ke, T. L. (2005). Minimum sample size recommendations for conducting factor analysis. International Journal of Testing, 5, 159-168.

O’Connor, B. (2000). SPSS and SAS programs for determining the number of components using parallel analysis and Velicer’s MAP test. Behavior Research Methods, Instruments, & Computers, 32, 396-402.

Thurstone, L. L. (1947) Multiple factor analysis. Chicago: University of Chicago Press.

Tucker, R. L. (1951). A method for synthesis of factor analytic studies. Personnel research section report no. 984. Washington, D. C.: Department of the Army.

Zwick, W. R. & Velicer, W. F. (1986). Comparison of five rules for determining the number of components to retain. Psychological Bulletin, 99, 432-442.


Weiterführende Literatur

O’Connor, B. (2000). SPSS and SAS programs for determining the number of components using parallel analysis and Velicer’s MAP test. Behavior Research Methods, Instruments, & Computers, 32, 396-402.

Tucker, R. L. (1951). A method for synthesis of factor analytic studies. Personnel research section report no. 984. Washington, D. C.: Department of the Army.

Zwick, W. R. & Velicer, W. F. (1986). Comparison of five rules for determining the number of components to retain. Psychological Bulletin, 99, 432-442.


4. Planung des Erhebungsinstruments: Online - Fragebogen ISLE-1

Zitation: Hamminger, Leopold (2020). Hauptstudie "Subjektiver Lernerfolg". Planung des Erhebungsinstruments: Online - Fragebogen ISLE-1. Ebensee: EVVHS.

Korrespondenz an: l.hamminger (at) evvhs.eu

Hinweis: Dieses Kapitel kann gedruckt werden (Zahnradsymbol am oberen rechten Rand).

Link zum Download des Fragebogens


Zur empirischen Überprüfung dieses Modells wurde der Fragebogen ISLE-1 (Instrument Subjektiver Lernerfolg Version 1 - 2019) für eine online Befragung konzipiert. Mit 25 Items sollen auf einer sechsstufigen Likertskala (1 - niedrigste / 6 - höchste Zustimmung) die subjektiven Vorstellungen von Lernerfolg erhoben werden (es existieren keine invers formulierten Items).

Bei der Planung der Items wurde die besondere Situation der Zielgruppe (berufstätig Studierende) berücksichtigt. Die Erhebungssituation ist nicht vergleichbar mit beispielsweise einer, bei der Studierende im Rahmen einer Lehrveranstaltung einen Fragebogen ausfüllen, mit genügend Zeit zur Verfügung. Erfahrungen aus früheren Erhebungen mit dieser Zielgruppe zeigen, dass diese Personen unter einem besonders hohen Zeitdruck stehen. Häufig wird der Fragebogen spät abends, nach Beruf, Familie und Lernzeit ausgefüllt. Die Gefahr, dass Antworten unreflektiert oder nicht ernsthaft verfasst werden, steigt stark mit der Zeit, die zur Beantwortung benötigt wird. Sowohl die Validität als auch die Reliabilität der Erhebung ist damit gefährdet.

Testtheoretisch wären eine höhere Anzahl von Items wünschenswert. Auch für die Interpretation der Faktoren bei der explorativen Faktorenanalyse (siehe Planung zum empirischen nachweis der Dimensionen; Link öffnet im neuen Fenster) wären mehr als zehn Items je Dimension hilfreich. In diesem Forschungsprogramm wird der Weg gegangen, eine möglichst geringe Anzahl von Dimensionen je Erhebung empirisch zu überprüfen.  

Bei geschlossenen (Likert - skalierten) Fragen zu persönlichen Einstellungen - also solchen, die nicht wahr oder falsch beantwortet werden können - scheint eine Obergrenze zwischen 20 und 30 Items sinnvoll. Es müssen aber auch noch andere Faktoren berücksichtigt werden:

  • Anzahl der Skalenausprägungen. Es ist bekannt, dass eine ungerade Anzahl von Ausprägungen zur Antwortendenz zur Mitte führen kann, auch weil dies die Antwortzeit verkürzt. Es sollte daher eine gerade Anzahl, die aber sechs nicht überschreiten soll, verwendet werden. Das in der Literatur erwähnte damit verbundene Problem  der Nichtbeantwortung konnte bei früheren Erhebungen nicht festgestellt werden.
  • Möglichst kurze, leicht verständliche Fragen,  bzw. zu beurteilende Aussagen, die gleichzeitig die zu erhebenden Einstellung repräsentieren sollen. Diese Forderungen sind aber nicht notwendigerweise kompatibel: sie können Antinomien bilden. Eine kurze, prägnante Formulierung erhebt nicht notwendigerweise die gesuchte Einstellung. Ein Beispiel aus diesem Fragebogen: "Ich interessiere mich nun mehr über den Lerngegenstand". Es handelt sich offensichtlich um eine kurze, leicht verständliche Formulierung. Erhoben werden soll, ob zunehmendes Interesse am Lerngegenstand als Lernerfolg verstanden wird. Allerdings ist nicht auszuschließen, dass Probanden dahingegend antworten, ob dieses zunehmende Interesse tatsächlich auch eingetreten ist. Dieses Item erhielt bei der explorativen Faktorenanalyse eine gerade noch akzeptable Ladung von 0,362 und muss als eher wenig geeignet gelten.
  • Fragen, bzw. zu beurteilende Aussagen, die der Lebenswelt der Probanden entsprechen. Ein Beispiel aus diesem Fragebogen: "Ich mache mir keine Sorgen mehr über fehlende Anerkennung von Menschen, die mir wichtig sind". Mit diesem Item wird zu erheben versucht, ob Probanden Lernerfolg auch darin sehen, dass sie  andere Menschen - die ihnen etwas bedeuten - durch schlechte Lernleistungen enttäuschen. Die positive Formulierung "Ich mache mir keine Sorgen mehr .." soll sozial erwünschte Antworten vermeiden. Diese Formulierung ist weder kurz, noch sehr einfach. Sie spricht aber ein ganz spezifisches Lebensweltproblem berufstätig Studierender an: Oft müssen Nahestehende auf die besonderen Bedürfnisse der Lernenden Rücksicht nehmen. Deren Reaktion auf beispielsweise schlechte Noten kann auf die Einstellung zum subjektiven Lernerfolg relevant sein. Trotz der eher schwierigen Formulierung konnte dieses Item bei der explorativen Faktorenanalyse eine hohe Faktorladung von 0,738 erreichen.  
  • Einleitender Text. Um die Gefahr des "Überfliegens" (wiederum aus Zeitgründen oder mangels Motivation) zu reduzieren, wurde dieser Text kurz gehalten. Die Wichtigkeit der Erhebung für eine wissenschaftliche Studie wurde bereits im Anschreiben betont. Bei Probeläufen stellte sich heraus, dass umfangreiche Erklärungen zu den Items hinderlich sein konnten und die Probanden angesichts der eigentlichen Fragen die Beantwortung abbrachen. 
  • Passender Umfang der demografischen Fragen. Bei der Planung des Fragebogens ist man häufig versucht, so viel als möglich an demografischen und ähnlichen Daten zu erheben. So könnte ein besseres Verständnis der jeweiligen individuellen Lernsituation (bspw. hinsichtlich zeitlicher und finanzieller Ressourcen) interessant sein, da die Vermutung nahe liegt, dass die Lernsituation Auswirkung auf die Einstellung zum subjektiven Lernerfolg hat. Aus den bereits beschriebenen Gründen wurde jedoch bei dieser Erhebung darauf verzichtet. Statt dessen sind weitere qualitative Untersuchungen geplant.
  • Anonymisierungscode. Aus Gründen des Datenschutzes (um die erhobenen Daten getrennt von der Identität der Probanden speichern zu können) wird ein vierteiliger persönlicher Code erhoben, der sich aus Teilen des Namens und Geburtsdatums von Mutter zusammensetzt. Die Erfahrungen aus früheren Erhebungen haben gezeigt, dass ein beliebiger vier- oder sechsstelliger Code nicht ausreicht. Insbesondere die Angabe eines Beispiels (z.B. "Xab175") führte dazu, dass mehrere Probanden genau dieses Beispiele übernahmen und damit Duplikate erzeugt wurden.
  • Zustimmungserklärung. Das derzeitig gültige Datenschutzgesetz (Stand 2020) verlangt eine explizite Zustimmung zur Teilnahme an der Umfrage. Darauf wird in einer eigenen Frage Rücksicht genommen. Ebenso ist ein Link zur Einsicht in die Datenschutzerklärung angebracht.
  • Nach den eigentlichen Items haben Probanden die Möglichkeit durch die Angabe ihrer eMail - Adresse die Zustimmung für eine weitere Umfrage zu geben. Dies ist wünschenswert, da diese Erhebung Teil eines umfassenderen Forschungsprogrammes ist. Ein weiteres offenes Textfeld erlaubt die Angabe eines Kommentars zum Fragebogen bzw. zur Umfrage. In früheren Erhebungen wurde dieses Feld auch für konstruktive Kritik benutzt, die zu einer Verbesserung der Erhebung dienen kann.     

Für die Administrierung des Fragebogens an berufstätig Studierende der Betriebswirtschaft einer deutschen Fernhochschule (Modul Statistik) wurden eingangs Fragen nach den bereits absolvierten Modulen, dem beabsichtigten Zeitpunkt der Klausur, sowie zu demografischen Angaben gestellt (Geschlecht, Erstsprache, Alter, höchster Bildungsabschluss, Berufserfahrung. 

Die Zuordnung der Items zu  den Dimensionen des theoretischen Modells sind im Kapitel Empirische Ergebnisse (Link öffnet im neuen Fenster).

5. Empirische Ergebnisse

Zitation: Hamminger, Leopold (2020). Hauptstudie "Subjektiver Lernerfolg". Empirische Ergebnisse. Ebensee: EVVHS.

Korrespondenz an: l.hamminger (at) evvhs.eu

Hinweis: Dieses Kapitel kann gedruckt werden (Zahnradsymbol am oberen rechten Rand).


Der Link zum ISLE-1 wurde zu Beginn des Jahres 2020 an 1.120 berufstätig Studierende (Fachrichtung Betriebswirtschaft) einer deutschen Fernhochschule versandt. Nach Abzug der unvollständig beantworteten Rückläufe entstand eine Stichprobe von n = 257. Das arithmetische Mittel des Alters war 30,2 Jahre (Median: 28,5) und der Berufserfahrung 9,5 Jahre (Median: 7,5). 75% hatten weiblich als Geschlecht angegeben, 25% männlich. Es gab keine Angaben für "divers". Etwa 98% hatten Deutsch als Erstsprache und etwa 6% gaben einen niedrigeren Bildungsabschluss als allgemeine oder fachgebundene Hochschulreife an.

Die hier näher beschriebene explorative Faktorenanalyse (EFA) wurde mit IBM Statistics (SPSS) Version 26 durchgeführt. Die Eignung zur Berechnung stellte sich als gut heraus (KMO-Koeffizient: 0,861; Signifikanz nach Bartlett: 0,000).

Eignung zur EFA KMO und Bartlett

Hinsichtlich der Kommunalitäten sollten diese nach Klopp (siehe obiger Link zur näheren Beschreibung der EFA) bei dieser Stichprobengröße für alle Variablen über 0,50 betragen. Diese Vorgabe trifft aber nur bei orthogonalen Rotationsmethoden (wie Varimax) zu, In diesem Fall wurde die Promax - Rotation, mit Maximum-Likelihood - Analyse, verwendet. Zur Überprüfung der Kommunalitäten wurde zusätzlich eine EFA mit Hauptkomponentenanalyse und Varimax erstellt, es wurden Kommunalitäten zwischen 0,6 und 0,7 festgestellt, mit zwei Ausnahmen (Item 6: 0,466 und Item 14: 0,454).

Für alle weiteren Ergebnisse wurden die Ausgaben der EFA mit Maximum-Likelihood - Analyse und Promax - Rotation verwendet.

Zur Bestimmung der Anzahl der Faktoren wurde der Scree-Plot nach Cattell erstellt.

Scree Plot

Der Knick ist beim vierten Faktor gut erkenntlich. Da dieser nach Bühner (vgl. Klopp) noch berücksichtigt wird, kann von vier zu extrahierenden Faktoren ausgegangen werden. Die kumulierte erklärte Gesamtvarianz für die ersten vier Faktoren ergab mit 42,721% einen Wert, der verbesserungswürdig ist.

erklärte Gesamtvarianz

Bei der Promax - Rotation (wie bei allen obliquen Rotationstechniken) wird die Mustermatrix zur Beurteilung der Faktorladungen herangezogen. Nach einer Faustregel sollten zur Interpretation der Faktoren nur Ladungen berücksichtigt werden, die betragsmäßig größer als 0,30 sind. Eine differenziertere Betrachtungsweise verlangt auch die Berücksichtigung der Anzahl der Variablen und die Stichprobengröße. Interpretationshinweise gibt es dafür bei Guadagnoli / Velicer (1988; siehe Klopp in obigem Link).

Danach kann die Dimension 1 mit zehn Variablen (von zwölf) über einen Ladungswert von 0,40 generalisiert betrachtet werden. Die übrigen drei Dimensionen enthalten weniger als zehn Variable über 0,40. Die Stichprobengröße sollte daher > 300 sein. Mit n = 257 wird diese Größe nicht ganz erreicht, es muss daher mit zufälligen Ladungsmustern gerechnet werden.

Mustermatrix

Die Variable 11 lädt in etwa gleich stark auf Dimensionen 1 und 2. Aus Gründen der Inhaltsvalidität wurde sie der Dimension 1 zugeordnet. Ähnliche Überlegungen gelten für die Variablen 15 und 18. 

Nach Berücksichtigung dieser Ergebnisse der explorativen Faktorenanalyse ergab sich folgende Zuordnung der Items zu den Dimensionen:


Dimension 1: Lebensqualität
Item Subjektive Vorstellung von Lernerfolg
6 Mein Wissen über den Lerngegenstand wird nun bei Diskussionen anerkannt.
7 Ich interessiere mich nun mehr über den Lerngegenstand.
10 Beim und nach dem Lernen erlebe ich Zufriedenheit / Freude.
11 Ich kann das Gelernte als Grundlage für vertiefendes Lernen verwenden.
15 Ich habe nicht mehr das Gefühl, mich in dieser komplexen Welt nicht mehr orientieren zu können.
16 Ich kann mich sprachlich besser ausdrücken.
17 Durch das Lernen habe ich ein persönliches Ziel erreicht.
18 Menschen, die für mich wichtig sind, stellen fest, dass ich ein persönliches Ziel erreicht habe.
19 Meine beruflichen Aussichten haben sich nun verbessert.
20 Ich habe das Gefühl, in meinem Leben mehr persönliche Freiheit und Autonomie zu erlangen.
23 Ich kann nun einen Beruf ausüben, den ich mir schon lange gewünscht habe.
24 Ich erlange das Gefühl einer Neuorientierung in meiner Lebenswelt.


Dimension 2: Gegenstandsaufschluss
Item Subjektive Vorstellung von Lernerfolg
1 Ich kann das Gelernte beruflich oder privat anwenden.
2 Ich habe ein besseres Verständnis über den Lerngegenstand erworben.
3 Ich kann mein eigenes Wissen über den Lerngegenstand besser einschätzen.
5 Ich kann Aufgaben zum Lerngegenstand besser lösen.
9 Ich kann Zusammenhänge im Lerngegenstand erkennen.


Dimension 3: Bedrohungsvermeidung
Item Subjektive Vorstellung von Lernerfolg
4 Menschen, die mir wichtig sind, loben mein Verständnis über den Lerngegenstand.
14 Was ich gelernt habe ist ausreichend, um bei einer Prüfung nicht negativ zu sein.
22 Ich mache mir keine Sorgen mehr über fehlende Anerkennung von Menschen, die mir wichtig sind.
25 Ich enttäusche nicht andere Menschen, die mir wichtig sind, wegen schlechter Noten.


Dimension 4: Verfügungserweiterung
Item Subjektive Vorstellung von Lernerfolg
8 Meine Noten sind besser als erwartet.
12 Meine Noten sind besser als die anderer Kommilitionen.
13 Ich bin stolz auf das, was ich im Lernen erreicht habe.
21 Ich habe eine Prüfung / ein Lernmodul erfolgreich abgeschlossen.

Die Mittelwerte und Standardabweichungen der vier Dimensionen, sowie ihrer Korrelationen untereinander sind wie folgt:

Mittelwerte Korrelationen Dimensionen untereinander

 Die Mittelwerte und Standardabweichungen der Konstrukte "expansives Lernen" und "defensives Lernen", sowie ihrer Korrelationen untereinander sind wie folgt:



 Mittelwerte Korrelationen expansiv defensiv Konstrukte


Es folgen die Reliabilitäten (Cronbachs alpha) und Korrelationskoeffizienten der Items für die einzelnen Dimensionen:

Dimension 1

Dimension 1 Korrelation und alpha

Dimension 2

Dimension 2 Korrelation und alpha

Dimension 3

Dimension 3 Korrelation und alpha

Dimension 4

Dimension 4 Korrelation und alpha