Multidimensionale Skalierungen (MDS) in Excel
Dieses Tutorium wird Ihnen helfen, eine Multidimensional Scaling (MDS)-Analyse in Excel mithilfe der Software XLSTAT einzurichten und zu interpretieren. Sie sind nicht sicher, ob dies das richtige Tool für die multivariate Datenanalyse ist, das Sie benötigen? Weitere Hinweise finden Sie hier.
Multidimensional Scaling
Die multidimensionale Skalierung (MDS) ist eine in den Bereichen Marketing und Psychometrie weit verbreitete Methode, insbesondere in den englischsprachigen Ländern. Das Prinzip der Methode besteht darin, eine Karte der Individuen auf Basis einer Proximitätsmatrix (Ähnlichkeiten oder Unähnlichkeiten) der Individuen zu konstruieren. Im Idealfall, in dem man über eine Abstandsmatrix zwischen den Punkten einer Ebene verfügt (beispielsweise die Abstände zwischen Städten in einer Region) rekonstruiert die MDS die Karte der Punkte, bis auf eine Rotation der Symmetrie genau. Um eine optimale Konfiguration zu berechnen, minimiert die Methode MDS ein Kriterium, das auch Stress genannt wird. Je näher dieses bei Null liegt, desto besser ist die Darstellung.
Datensatz für Multidimensional Scaling
Die Daten stammen aus einer Umfrage von 10 Verbrauchern, die gebeten wurden 5 Schokoladenriegel, von dem nur ein einziger auf dem Markt ist (Produkt P1), zu bewerten (Noten von 1 bis 5).
Das Ziel ist es, zu zeigen wie die Produkte gemäß den Noten der 10 Konsumenten auf einer Karte dargestellt werden können.
Wir haben gesehen, dass man zur MDS eine Proximitätsmatrix benötigt. Im Beispiel liegt jedoch nur eine Individuen / Produkt Tabelle vor. Um eine Matrix der Unähnlichkeiten zwischen den Produkten zu generieren, verwenden wir zunächst das Tool „Ähnlichkeits-/Unähnlichkeitsmatrix“ in XLSTAT.
Einrichten einer Multidimensional Scaling-Analyse
Erstellen einer Proximitätsmatrix
Nach dem Öffnen von XLSTAT wählen Sie auf den Befehl XLSTAT/Beschreibung der Daten /Ähnlichkeits-/Unähnlichkeitsmatrix oder klicken Sie auf den entsprechenden Button in der Toolbar „Beschreibung der Daten " (siehe unten).
Nach dem Klicken des Button erscheint das zugehörige Dialogfenster. Sie können nun die Daten im Excel-Blatt auswählen und die passenden Optionen aktiveren wie unten gezeigt. Die Ergebnisse werden unterhalb der Tabelle angezeigt (Ausgabeoption „Bereich“).
Wir lassen nur die Proximitätsmatrix anzeigen.
Man erhält auf diese Weise die euklidische Abstandsmatrix der Produkte, auf Basis derer die multidimensionale Skalierung durchgeführt werden kann.
Einrichten des Dialogfensters Multidimensional Scaling
Wählen Sie den Befehl XLSTAT/Analyse der Daten /Multidimensionale Skalierung oder klicken Sie auf den entsprechenden Button in der Toolbar „Beschreibung der Daten“ (siehe unten).
Nach dem Klicken des Buttons erscheint das Dialogfenster. Sie können nun die Daten auf dem Excel-Blatt auswählen und die passenden Optionen wie unten angezeigt auswählen. Das Modell „absolut“ wird ausgewählt. Dieses Modell versucht die errechneten Abstände möglichst so nah wie möglich den euklidischen Abständen der Verbrauchernoten anzupassen. Andere Optionen können dieselben Ergebnisse liefern aber mit einem zusätzlichen Skaleneffekt. Andererseits haben wir vorgegeben, dass die repräsentierten Abstände 2 bis 4 dimensional sind, um die zugehörige Verzerrung der Darstellung in einem Raum mit wenigen Dimensionen zu bewerten.
Sofern man keine Ausgangskonfiguration dem Algorithmus zur Verfügung stellt, werden die Startpunkte zufällig ausgewählt. Es ist daher möglich, dass Sie leicht verschiedene Ergebnisse wie die hier angezeigten erhalten. Um sicherzustellen, dass Sie eine Lösung erhalten, die nah bei der optimalen Lösung liegt, können Sie die Anzahl der Wiederholungen, die Anzahl der Iterationen und die Präzision erhöhen.
Die Berechnungen beginnen nach dem Klicken des Buttons OK.
Interpretieren der Ergebnisse von Multidimensional Scaling
Nach der Auswahl der der Darstellung der Diagramme auf den beiden ersten Dimensionen, werden die Ergebnisse im Blatt „MDS“ angezeigt. Die erste Tabelle zeigt die Entwicklung des Stresses in Anhängigkeit von der Anzahl der Dimensionen im Darstellungsraum. Man bemerkt, einen sehr starken Abfall zwischen den Dimensionen 2 und 3 und eine Stabilität zwischen den Dimensionen 3 und 4. (Es ist normal, das eine Darstellung von 5 Objekten in einem 4 dimensionalen Raum perfekt ist.)
Eine Karte auf Basis der Ebene der Dimensionen Dim1 x Dim2 ist zur Darstellung im 2 dimensionalen Raum erzeugt.
Es ist ebenfalls möglich diese Karten für 3 und 4 Dimensionen zu erstellen. Davon wird jedoch abgeraten. Denn es handelt sich um eine Projektion der Punktewolke von einem 4 dimensionalen Raum auf eine 2 dimensionale Ebene, wobei man a priori nicht weiß, ob die Projektion die Proximität zwischen den Punkten der Wolke treu abbildet. Nur eine HKA berechnet auf Basis der Ergebnisse der MDS erlaubt es eine Karte zu erzeugen, die die Punktewolke so treu wie möglich abbildet.
Um eine Darstellung von höherer Qualität zu erhalten und um Fehlinterpretationen der Daten zu vermeiden, wird hier XLSTAT-3DPlot zur Darstellung der Daten in 3 Dimensionen verwendet. Dazu wählen Sie die unten stehenden Daten aus und klicken auf den Button XLSTAT-3DPlot in der Toolbar "Visualisierung der Daten ".
Auf diese Weise erhält man folgendes Ergebnis:
Es scheint, dass die Kunden alle die verschiedenen Produkte wohl unterscheiden, da die Produkte verteilt liegen. Man weiß vorab, dass das Produkt P2 mehr Schokolade als Produkt P4 enthält, das am wenigsten davon enthält: Diese erscheinen diametral gegenüber in der 3 dimensionalen Darstellung. Man sieht, dass die Verbraucher das Produkt P2 in der Bewertung leicht bevorzugen. Man sieht ebenfalls, dass nach den unten stehenden Zahlen, die Produkte P3 und P5, obwohl Ihre Noten im Mittel sehr ähnlich sind, im Darstellungsraum nicht nah beieinander liegen. Die Meinungen der Verbraucher sind hier manchmal entgegengesetzt für die Produkte P3 und P5. Dies erklärt sich durch einen Erdnussgeschmack, der von den Erdnüssen im Produkt P3 herrührt, was nur von einigen Verbrauchern geschätzt wird.
Schlussfolgerung über Multidimensional Scaling
Die Methode MDS erlaubt es also, die beurteilten Produkte zu kartographisieren, deren Interpretation viel reichhaltiger sein kann als die Analyse der einfachen Statistiken.
Bemerkung: Es gibt keine statistisch strenge Methode zur Bewertung der Qualität und der Aussagekrafteiner Darstellung mittels MDS. Jedoch erlaubt das Shepard-Diagramm eine allgemeine Idee der Qualität der Darstellung zu gewinnen. Das Shepard-Diagramm entspricht eine Punktwolke, deren Abszisse die beobachteten Unähnlichkeiten sind und deren Ordinate die Abstände in der Endkonfiguration der MDS sind. Je mehr die Punkte verteilt sind, desto weniger aussagekräftig ist die Darstellung. Wenn die Ordnungsrelation der Abszisse identisch mit der der Ordinate ist, so ist die Darstellung sehr aussagekräftig. Wenn die Punkte sich auf einer Geraden befinden, so ist die Darstellung perfekt. Die linke Abbildung entspricht den Daten aus dem vorliegenden Beispiel im Fall einer Darstellung in 4 Dimensionen. Die rechte Abbildung einer Darstellung in 2 Dimensionen. Man bemerkt den starken Unterschied in der Verteilung der punkte zwischen den beiden Diagrammen.
Im Fall eines absoluten Modells sind die Disparitäten gleich den Unähnlichkeiten und das Shepard-Diagramm ist daher vermischt mit der Darstellung der Geraden für das Diagramm mit 2 Dimensionen und mit den Punkten der Abstände im Fall des Diagramms für 4 Dimensionen.
War dieser Artikel nützlich?
- Ja
- Nein