Direkt zum Inhalt

One-Way ANOVA & Mehrfachvergleiche in Excel

Dieses Tutorium wird Ihnen helfen, eine ANOVA (Analysis of Variance) mit einem Faktor gefolgt von Tukey & Dunnetts vielfachen Vergleichen in Excel mithilfe der Software XLSTAT einzurichten und zu interpretieren. Sie sind nicht sicher, ob es sich hierbei um die Modellierungsfunktion handelt, nach der Sie suchen? Weitere Hinweise finden Sie hier.

Datensatz für die Durchführung einer ANOVA mit einem Faktor

Die Daten entsprechen einem Experiment, bei dem 4 neue Formulierungen einer Zahnpasta an jeweils 6 verschiedenen Patienten getestet werden, um den Effekt auf die Zahnweisse zu messen.

Absicht dieses Tutoriums

Durch den Einsatz der ANOVA-Funktion von XLSTAT soll überprüft werden, ob die Ergebnisse je nach verwendeter Formulierung unterschiedlich sind. Ist dies der Fall, so soll die effektivste Formulierung zu finden. Der vorliegende Fall ist eine einfache balanzierte ANOVA, da es nur einen Faktor gibt - die Formulierung - und die Anzahl der Wiederholungen die gleich für jede der Formulierungen ist.

Einrichten einer ANOVA mit einem Faktor

Nach dem Öffnen von XLSTAT, wählen Sie den Befehl XLSTAT/Modellierung der Daten/ANOVA.

XLSTAT Ribbon

Nach dem Klicken des Buttons erscheint das entsprechende Dialogfenster der ANOVA.

Sie können nun die Daten im Excel-Blatt auswählen.

Im untersuchten Beispiel beginnen die Daten in der ersten Zeile; es ist daher schneller die Spaltenauswahl zu benutzen. Daher erscheinen im Dialogfenster unten die Auswahlen in Form von Spalten.

Die Option „Variablenbeschriftungen“ ist aktiviert, da die erste Zeile der Daten die Namen der Variablen enthält. Wählen Sie die "Abhängigen Variablen" (oder Modellvariable) als die „Zahnweisse“, die ihrerseits durch die verwendete Formulierung als "qualitative Variable" erklärt werden soll.

In XLSTAT ist es möglich, die Daten für die ANOVA auf zwei verschiedene Arten auszuwählen. Die erste ist in Form von Spalten, eine Spalte für die abhängige Variable, eine weitere für die erklärende Variable.

Die zweite Möglichkeit, die Daten auszuwählen, besteht in Form einer Tabelle, wobei jede Spalte eine Modalität der erklärenden Variablen darstellt.

In den ANOVA-Optionen, wählen Sie die Bedingung "a1=0". Dies bedeutet, dass ein Modell erstellt wird auf der Prämisse, dass die Zahnpasta T1 den Basiseffekt an Zahnweisse hat: man weiß, dass der Mittelwert für T1 der kleinste ist und dies garantiert, dass die anderen Effekte positiv sein werden.

Das Anwenden einer Bedingung ist notwendig für ein ANOVA-Modell aus theoretischen Gründen, aber es hat keine Auswirkung auf die Ergebnisse (Anpassungsgüte, Vorhersagen). Der einzige Unterschied liegt in der Art, in der das Modell beschrieben wird.

ANOVA options tab

Im Reiter "Ausgabe" aktivieren Sie die Option "Paarweise Vergleiche", um einen Tuckey-Test und einen REGWQ Test auszuwählen, und aktivieren Sie die Option "Vergleich mit einer Kontrolle“ um einen zweiseitigen Dunnett-Test auszuwählen. Um das komplexe Thema der multiplen Vergleichstests besser zu verstehen, raten wir die Arbeiten von Jason C. Hsu zu lesen.

ANOVA outpus tab

Die Berechnungen beginnen, sobald der Button OK geklickt wird. Falls Sie in den Optionen von XLSTAT die Option „Auswahl bestätigen lassen“ aktiviert haben, so bittet Sie XLSTAT die Anzahl der Zeilen und der Spalten der Auswahlen zu bestätigen.

Der Tuckey HSD-Test, die REGWQ Prozedur und der Dunnett-Test wurde aktiviert. Im Dialogfenster zur Auswahl der Kontrollgruppe für den Dunnett-Test wird die Gruppe T1 als Kontrollgruppe ausgewählt.

anova dunnett

Die Berechnungen werden fortgesetzt, sobald der Button OK geklickt wird, und die Ergebnisse werden angezeigt.

Interpretieren der Ergebnisse einer ANOVA mit einem Faktor

Die erste Tabelle zeigt die Koeffizienten der Anpassungsgüte des Modells an. Das R(Korrelationskoeffizient), R² (Determinationskoeffizient) und das angepasste R².

anova-one-factor-5.gif

Der Determinationskoeffizient (hier 0.56) gibt den Prozentsatz der Variabilität der abhängigen Variablen (hier die Zahnweisse) an, die durch die erklärende Variable beschrieben (hier der Zahnpastatyp) wird. In unserem Fall wird 56% der Variabilität erklärt. Die übrigen 44% sind in anderen Variablen versteckt, die nicht verfügbar sind und die das Modell in den "Zufallseffekten" verbirgt. Es ist wichtig die Ergebnisse der Varianzanalyse-Tabelle zu untersuchen (siehe unten). Diese Ergebnisse lassen uns entscheiden, ob die erklärenden Variablen eine signifikante Information (Nullhypothese H0) in das Modell einbringen oder nicht. Mit anderen Worten ausgedrückt, ist dies eine Art zu überprüfen, ob es Sinn macht den Mittelwert zu benutzen, um die gesamte Population zu beschreiben, oder ob die Information, die von der/den erklärenden Variable(n) eingebracht wurde, wertvoll ist.

anova-one-factor-6.gif

Fisher's F Test wird eingesetzt. Anhand der Tatsache, dass die Wahrscheinlichkeit die dem F value entspricht kleiner als 0.001 ist, ist das Risiko kleiner als 0.01%, dass die Annahme der Nullhypothese (kein Einfluss der erklärenden Variable der Zahnpastaformulierung) falsch ist. Daher kann man sicher schließen, dass ein Effekt der Zahnpastaformulierung auf die Zahnweisse besteht. Berücksichtigen Sie, dass der R² nicht sehr gut (0.56) ist, was besagt, dass ein Teil der Information für eine zusätzliche Erklärung der Variation der Zahnweisse fehlt. Dies ist nicht sehr überraschend.

Die folgende Tabelle stellt die Einzelheiten des Modells dar. Diese Tabelle ist nützlich, falls Vorhersagen benötigt werden. In diesem Fall ist sie nicht sehr nützlich. Man kann schon feststellen, dass Zahnpasta T2 einen Effekt aufweist, dessen 95% Konfidenzintervall die 0 einschießt, was darauf deutet, dass es nicht offensichtlich ist, dass T2 sehr verschieden von T1 ist.

anova-one-factor-7.gif

Das Balkendiagramm der standardisierten Koeffizienten erlaubt es, visuell den relativen Einfluss der Modalitäten zu vergleichen und zu sehen, ob das Konfidenzintervall die 0 einschließt oder nicht.

anova-one-factor-8.gif

Die nächste Tabelle zeigt die Residuen an. Man kann die reduzierten Residuen (standardisierte Residuen) genauer betrachten, die nach den Prämissen der ANOVA normalverteilt sein sollten. Dies bedeutet unter anderem, dass 95% der Residuen im Intervall [-1.96, 1.96] liegen. Alle Werte außerhalb dieses Intervalls sind potentielle Ausreißer oder deuten darauf, dass die Normalitätsannahme falsch ist. Es scheint hier einen starken Ausreißer vorzuliegen (13te Beobachtungen) mit einem Residuum von -2.8279. Um die Differenz zu erklären, sollte zunächst überprüft werden, ob dem 13ten Patienten die richtige Zahnpasta gegeben wurde und zweitens sollte man zu verstehen suchen, warum die Antwort auf die Formulierung nicht die gleiche war wie für andere Patienten. Das Histogramm der Residuen erlaubt es rasch die Residuen zu sehen, die außerhalb des erwarteten Bereiches liegen.

anova-one-factor-9.gif

Nun erhalten wir Antwort auf unsere Ausgangsfrage: Besteht ein signifikanter Unterschied zwischen den Behandlungen und wie sollte dieser Unterschied klassifiziert werden? Wie in der nächsten Tabelle angezeigt, wird der Tukey HSD Test (Honestly Significantly Different) auf alle paarweisen Differenzen zwischen den Mittelwerten angewendet. Das ausgewählte 5% Risiko wird benutzt, um den kritischen Wert q zu erhalten, der mit den standardisierten Differenzen zwischen den Mittelwerten verglichen wird. Andere Softwarepakete geben den d Wert als Ergebnis, wie XLSTAT. Nur zwei Paare scheinen signifikant verschieden zu sein (T1, T3) und (T2,T3). Die Mittelwerte und die Modalitäten werden dann auf Basis dieser Analyse klassifiziert. Man kann erkennen, das es keine Transitivität gibt (> bezeichnet nicht signifikant verschieden, und <> bezeichnet signifikant verschieden): T4 > T3 T4 > T2 aber T2 <> T3

Tukey test after a one-way ANOVA

Das REQWQ Verfahren führt zu unterschiedlichen Ergebnissen (siehe unten), was darauf hinweist, dass man bei dem Gebrauch von multiplen Vergleichsmethoden vorsichtig sein muss. In diesem Fall sind drei Paare von Modalitäten verschieden (T1 und T4 scheinen signifikant verschieden nach dieser Methode). Die Gruppierung gibt nun drei übergreifende Gruppen von Modalitäten.

REQWQ test after a one-way ANOVA

Im Anschluss wurde ein Dunnett Test durchgeführt, um jede Modalität mit der Kontrollkategorie T1 zu vergleichen. Dunnett Test stimmt mit dem Verfahren REQWQ darin überein, dass die Modalitäten T1 und T4 signifikant verschiedenen sind.

Dunnett test after a one-way ANOVA

Schlussfolgerung für diese ANOVA mit einem Faktor

Man kann schließen, dass die 4 Zahnpastaformulierungen signifikante Effekte auf die Zahnweisse haben. Da die Zahnpaste T1 schon auf dem Markt ist, sollten die Zahnpasta T3 oder T4 gewählt werden, da sie einen signifikanten Anstieg der Zahnweisse aufweisen, als einen Kandidaten zur Markteinführung. Bitte beachten Sie, dass eine ANOVA auf parametrischen Annahmen basiert, die überprüft werden müssen, um die Zuverlässigkeit der Ausgabe sicherzustellen.

War dieser Artikel nützlich?

  • Ja
  • Nein