Direkt zum Inhalt

Multiple Faktoranalyse (MFA) in Excel - Anleitung

Dieses Tutorium zeigt Ihnen, wie Sie eine multiple Faktorenanalyse (MFA) in Excel mithilfe der Statistiksoftware XLSTAT einrichten und interpretieren.

Was ist eine Multiple Faktorenanalyse?

Die multiple Faktorenanalyse (MFA) erlaubt es gleichzeitig mehrere Tabellen von Variablen zu analysieren und Ergebnisse zu erhalten, die insbesondere grafische Darstellungen der Beziehung zwischen den Beobachtungen, Variablen und Tabellen beinhalten. Innerhalb einer Tabelle müssen die Variablen von der gleichen Natur sein (quantitativ oder qualitativ) jedoch können die verschiedenen Tabellen unterschiedlicher Natur sein.

Die Methode der MFA kann in zwei Abschnitte aufgeteilt werden:

  1. Man führt für jede der Tabellen nacheinander eine HKA oder eine MKA in Abhängigkeit der Natur der Variablen aus. Man speichert die ersten Eigenwerte jeder Analyse, um anschließend die verschiedenen Tabellen im zweiten Abschnitt zu gewichten.
  2. Man führt eine gewichtete HKA auf der Gesamtheit der Spalten der Tabellen durch, wobei die Tabellen der qualitativen Variablen in komplette disjunktive Tabellen mit Indikatorvariablen gewichtet in Funktion der Häufigkeit der entsprechenden Modalitäten. Die Gewichtung der Tabellen gewährleistet, dass Tabellen mit vielen Variablen nicht schwerer wiegen als andere.

Datensatz für die Durchführung einer multiplen Faktorenanalyse

Die Daten entsprechen der Verkostung von 21 Weinen der Region der Loire in Frankreich durch 36 Experten. Der Datensatz umfaßt 21 Beobachtungen und 31 Dimensionen. Die 31 Dimensionen können in 6 Kategorien zusammengefaßt werden:

  • die ersten 2 qualitativen Variablen beschreiben die Geografische Herkunft (Appellation und Parzelle)
  • die nächsten 5 quantitativen Variablen entsprechen der Olofaktion nach der Lagerung
  • die nächsten 3 quantitativen Variablen entsprechen visuellen Kriterien
  • die nächsten 10 quantitativen Variablen entsprechen der Olofaktion nach Schütteln
  • die nächsten 9 quantitativen Variablen entsprechen dem Geschmack
  • die letzten 2 quantitativen Variablen entsprechen der globalen Beurteilung.

Absicht dieser multiplen Faktorenanalyse

Das Hauptziel der Studie ist es zu verstehen, in welcher Beziehung die Weine untereinander stehen und welche der Kriterien übereinstimmen (und eventuell redundant sind?) oder sich unterscheiden. Man beschließt die ersten beiden qualitativen Variablen und die letzten beiden quantitativen Variablen nicht zu benutzen im ersten Teil der Studie, sie jedoch als zusätzliche Variablen gegen Ende der Studie miteinzubeziehen: man möchte eine Analyse ausschließlich auf Basis der objektiven Geschmackskriterien.

Einrichten einer multiplen Faktorenanalyse

Um das Dialogfenster der MFA zu aktivieren, starten Sie XLSTAT, wählen dann den XLSTAT-Sensory Befehl im XLSTAT Menu.

XLSTAT sensory data analysis menu MFA EN

Nach dem Klicken des Buttons, erscheint das Dialogfenster. Wählen Sie nun die Daten, die den zu berücksichtigenden Variablen entsprechen. Wie oben erwähnt können die Variablen in 6 verschiedene Tabellen gruppiert werden. Daher muß die Anzahl der Tabellen mit 6 angegeben werden. Anschließend wählen Sie die Namen der 6 Tabellen aus (Geo, Ruhe, Visuell, Schütteln, Geschmack, Global). Dann muß die Anzahl der Variablen in jeder Tabelle angegeben werden. Da die Anzahl nicht für alle Tabellen gleich ist, so wird ein Bereich im Excel-Blatt ausgewählt, der die Anzahl der Variablen in jeder Tabelle enthält. Da in allen Auswahlen Kopfzeilen verfügbar sind, aktivieren wir die Option "Beschriftungen der Variablen".

mfa1.gif

Dann klicken Sie auf den Reiter "Optionen" um zusätzliche Informationen zu bestimmen. Wir benutzen zwei Typen von Tabellen: quantitative und qualitative. Daher wird der Daten-Typ "Gemischt" gewählt, und dann muß öan die Spalte auswählen, die den Daten-Typ angibt (0 für quantitative, 1 für qualitative) auswählen. Aktivieren Sie ebenfalls die Option "Anzeige der Diagramme auf 2 Achsen" um Abfragen für die Achsen der Faktorkarten zu vermeiden.

mfa2.gif

Zuletzt aktivieren Sie im Reiter "Zusätzl. Daten" um anzugeben, welche Daten in den Anfangsberechnungen einbezogen werden sollen und welche Daten lediglich am Ende als zusätzliche Tabellen verwendet werden sollen. Daher wählen Sie die Spalte aus, die angibt, welche Tabelle aktiv (1) und welche zusätzlich (0) ist.

mfa3.gif

Nach dem Klicken auf den OK Button, beginnen die Berechnungen und die Ergebnisse werden auf einem neuen Excel-Blatt angezeigt.

Interpretieren der Ergebnisse einer multiplen Faktorenanalyse

Die ersten Ergebnisse entsprechen den deskriptiven Statistiken der vielen Variablen. Die Statistiken entsprechen den zusätzlichen Variablen sind in blau dargestellt.

Anschließend werden Analyse für jede Tabelle einzeln durchgeführt. Wenn die Tabelle quantitative Variablen enthält, so wird eine HKA (Hauptkomponentenanalyse) durchgeführt. Für Tabellen mit qualitativen Variablen wird eine MKA (multiple Korrespondenzanalyse) durchgeführt. In unserem Fall wird eine MKA gefolgt von 5 HKA durchgeführt. Die Ergebnisse dieser Voranalysen werden anschließend in der Endphase, der zweiten Phase der MFA, die in Wirklichkeit eine gewichtete HKA (die Gewichte werden auf die Spalten bezogen) darstellt. Die Ergebnisse der MFA befinnen mit einer Analyse der Eigenwerte der gewichteten HKA. Man kann sehen, dass hier mit den ersten beiden Faktoren fast 70 % der Variabilität erklärt werden kann.

mfa4.gif

Die Koordinaten der Tabellen werden anschließend angezeigt und dann dazu benutzt, um eine Karte der Tabellen zu erzeugen. Man kann auf den Karten sehen, dass der erste Faktor stark mit den vier aktiven Tabellen korreliert (große Koordinaten und hohe Kontributionen). Der zweite Faktor ist überwiegend korreliert mit der Olofaktor nach Lagerung, und in geringerem Maße mit der Olofaktion nach Schütteln.

mfa5.gif

Der Lg-Koeffizient der Abhängigkeit zwischen den Tabellen erlaubt es zu messen, inwiefern die Tabellen Paar gegenüber Paar in Beziehung stehen. Die RV-Koeffizienten (siehe unten) der Beziehung der Tabellen stellen ein weiteres Maß dar, das aus dem Lg-Koeffizienten abgeleitet ist. Der Wert des RV-Koeffizienten liegt zwischen 0 und 1, was es leichter macht, ihn zu analysieren. Man kann hier sehen, dass die beiden Tabellen, die sich am nächsten sind, die Tabellen des Geschmacks und der Olofaktion nach Schütteln sind. Erstaunlicher ist es, dass der RV-Koeffizient des Geschmacks und des visuellen Eindrucks sehr hoch ist.

mfa6.gif

Anschließend wird die Korrelationskarte analysiert. Diese Karte zeigt, dass es zwei generelle Beurteilungen gibt (Typischer Charakter und Globale Qualität) die hoch korreliert zu einigen wenigen Variablen sind (Schütteln3, Geschmack5 zum Beispiel), und dass sie mit den ersten Faktor korrelieren. Man ebenfalls bestätigen, dass die Variablen des visuellen Eindrucks hoch mit der ersten Achse korrelieren. Man sieht auch, dass die vielen Variablen "Olofaktion nach Schütteln" in drei der vier Quadranten verteilt liegen. Zuletzt stellt man fest, dass der zweite Faktor hoch mit der Variablen Ruhe5 korreliert.

mfa7.gif

Die Karte der partiellen Achsen erlaubt es zu sehen, wie die Faktoren mit der verschiedenen Analysen der ersten Phase der MFA in Verbindung stehen. Mann kann feststellen, dass es signifikante Beziehung zwischen den Ausgangsfaktoren und den Faktoren der MFA gibt. Dies muß jedoch nicht in allen Fällen zutreffen.

mfa8.gif

Das nächste Diagramm zeigt die Beobachtungen mit den Zentroiden der beiden qualitativen Variablen. Man kann sehen, dass die Wine T1 und T2 sehr eng beieinander liegen und isoliert von den übrigen Weinen. Sie sind hoch mit den zweiten Faktor korreliert, was, wie wir schon oben erwähnt haben, auf die Beziehung mit der Variable Ruhe5 zurückzuführen ist. Der Wein 1DAM hat die größte Koordinate auf der ersten Achse. Man kann auch sehen, dass der Wein 2DAM in Richtung der beiden globalen Beurteilungsvariablen (typische Eigenschaften und globale Qualität) liegt. Diese beiden sind die bevorzugten Weine. Man kann sehen, dass die Parzelle "Ref" die Erde ist, die in die gleiche Richtung zeigt. In der entgegengesetzten Richtung liegt der Wein 1VAU, der die schlechtesten Beurteilungen hat.

mfa9.gif

Das letzte Diagramm basiert auf dem vorherigen, jedoch wurden zu den Beobachtungen die Projektionspunkte sowie eine Linie zwischen den Beobachtungen und den zugehörigen Projektionspunkten hinzugefügt. Die Projektionspunkte entsprechen zusätzlichen Beobachtungen, für die die Information auf nur einer Tabelle berücksichtigt wird, die anderen Tabellen werden in Nullwerte umgeformt. Dies erlaubt es zu sehen, wie die verschiedenen Tabellen die Position eines bestimmten Punktes beeinflussen. Zum Beispiel für den Wein T2 sieht man dass der Geruch in Ruhe dazu tendiert, ihn noch stärker von den übrigen Weinen zu unterscheiden. Betrachtet man die anderen Weine, so stellt man fest, dass der Geruch in Ruhe oft den Unterschied unter den Weinen verstärkt.

mfa10.gif

Schlussfolgerung

Als Fazit kann man sagen, dass die MFA eine interessante und reichhaltige Methode ist, da es möglich ist, komplexe Datensätze zu analysieren und da viele grafische Ergebnisse zur Verfügung gestellt werden: Man kann Tabellen Visualisieren (in denen die Variablen gruppiert werden), die Variablen und die Beobachtungen selbst. In diesem speziellen Beispiel, erlaubt sie, schnell die Position der Weine in einer Karte darzustellen und gleichzeitig diese Position interpretieren zu können.

War dieser Artikel nützlich?

  • Ja
  • Nein