Mathematik stellt für StudentInnen und akademische Ghostwriter für Statistik gleicher maßen ein Mittel dar, um die komplexe Realität mithilfe von Variablen zu modellieren. Oft ist es dabei wichtig, aus einem großen Datensatz einzelne vermutete oder komplett neue Strukturen zu entdecken. Während die AnwenderInnen beispielsweise bei einem Vergleich mit dem t-Test oder einer linearen Regression immer schon wissen müssen, welche Variablen für eine Untersuchung relevant sind, ist es mit der explorativen Faktorenanalyse in SPSS, Stata und RStudio möglich, neue Zusammenhänge aufzudecken und diese weiter zu untersuchen. An Hochschulen und Universitäten spielt die explorative Faktorenanalyse hauptsächlich in Master- oder Doktorarbeiten eine Rolle, jedoch zeigt sich gerade unter StudentInnen der Psychologie und Sozialwissenschaften auch der Trend, bereits bei Seminar- oder Bachelorarbeiten mit diesem Verfahren in Kontakt zu kommen.
Wenn StudentInnen und Ghostwriter der Statistik die explorative Faktorenanalyse in einer Masterarbeit oder Dissertation anwenden sollen, muss dies in der Regel mit einem ausreichend großen Datensatz geschehen. Das Prinzip der explorativen Faktorenanalyse beruht darauf, dass zwischen den einzelnen oder Gruppen einzelner Variablen (manifeste Variablen) hohe und sehr hohe Korrelationen erkannt werden, sodass sich diese zu ‚neuen‘ Variablen (latente Variablen oder Faktoren) zusammenfassen lassen, weil ihre Ausprägung gut miteinander korreliert. Auf diesem Weg kann (idealisiert) ein Datensatz von anfänglich 500 Variablen auf 10 reduziert werden. Dementsprechend zählt die explorative Faktorenanalyse zu den komplexitätsreduzierenden und strukturaufklärenden statistischen Verfahren.
Nachfolgend sind einige Voraussetzungen dargestellt, die StudentInnen und akademische Ghostwriter für Statistik insbesondere auf dem Niveau von Master- und Doktorarbeiten bei der Anwendung in SPSS, Stata und RStudio beachten sollten:
1. Im Zuge der explorativen Faktorenanalyse korrelieren die Statistikprogramme alle Variablen des Datensatzes untereinander. Für ein aussagekräftiges Ergebnis ist es deshalb wichtig, dass die Signifikanzprüfung der Einzelkorrelationen möglichst signifikant ausfällt (p-Wert ≤ 0,05).
2. Eines der am weitesten verbreiteten Eignungsmaße eines Datensatzes für die explorative Faktorenanalyse wurde von Kaiser, Meyer und Olkin vorgeschlagen, das sogenannte KMO-Kriterium. KMO kann Werte zwischen 0 und 1 annehmen. Je höher dieser Wert ist, desto besser ‚passen‘ die manifesten Variablen für eine explorative Faktorenanalyse zueinander.
3. Eine explorative Datenanalyse kann nur dann zielführend sein, wenn wenigstens eine Beziehung zwischen einigen der eingegebenen Variablen besteht, die sich von reiner Zufälligkeit abhebt. Dies kann mit dem Bartlett-Test auf Sphärizität überprüft werden, der im Idealfall signifikant ausfällt (p-Wert ≤ 0,05). Allerdings erfordert dieser Test eine Normalverteilung der manifesten Variablen.
Die nachfolgende Abbildung zeigt die mögliche Ausgabe von SPSS zu einer explorativen Faktorenanalyse mit sechs eingegebenen manifesten Variablen (drei der ‚Big Five‘: Offenheit, Extraversion und Neurotizismus; sowie den drei Selbstbeschreibungen "ausgeglichen", "motiviert" und "optimistisch").
Anhand der Korrelationsmatrix ist bereits erkennbar, dass es zwischen einigen manifesten Variablen Zusammenhänge gibt, was durch den signifikanten Bartlett-Test auf Sphärizität bestätigt wird (p-Wert ≤ 0,05). Jedoch spricht das KMO-Kriterium mit einem Wert von 0,420 gegen eine gute Eignung der Daten für eine explorative Faktorenanalyse. Die Frage, wie viele latente Variablen zu extrahieren sind, kann beispielsweise über den dargestellten Screeplot beantwortet werden: In diesem Fall sind es basierend auf einem Faktoreigenwert von 1 drei latente Variablen, die in SPSS extrahiert würden.
Der hier dargestellte Ablauf einer explorativen Faktorenanalyse ist für StudentInnen, welche diese in ihrer Bachelor-, Master- oder Doktorarbeit durchführen müssen, jedoch viel zu verkürzt dargestellt. Hier bieten SPSS, Stata und RStudio deutlich mehr Möglichkeiten, eine explorative Faktorenanalyse durchzuführen und einige Aspekte dieses komplexen, strukturaufklärenden Verfahrens konnten nur angeschnitten werden, beispielsweise die Frage, welche Methoden es gibt, um die Anzahl der zu extrahierenden latenten Variablen festzulegen. Writing Science unterstützt Sie daher gerne dabei, wenn Sie beispielsweise im Rahmen Ihrer Masterarbeit oder Dissertation vor der Herausforderung stehen, eigenständig Strukturen in Ihren Daten aufzudecken. Wir freuen uns auf Ihre Anfrage!