Was ist ein statistischer Test?
Was ist ein statistischer Test?
Ein statistischer Test ist eine Möglichkeit zur Auswertung der von den Daten mit Blick auf eine Hypothese gelieferten Evidenz. Diese Hypothese wird Nullhypothese genannt und wird oft auch als H0 bezeichnet. Unter H0 werden Daten durch Zufallsprozesse generiert. Mit anderen Worten haben die kontrollierten Prozesse (z. B. die experimentellen Manipulationen) keine Auswirkung auf die Daten. In der Regel sagt H0 aus, dass Gleichheit besteht (z. B. Gleichheit zwischen Mittelwerten oder zwischen Varianzen oder zwischen einem Korrelationskoeffizient und Null).
H0 steht normalerweise einer als Alternativhypothese bezeichneten Hypothese gegenüber, die auch H1 oder Ha genannt wird. Meistens ist die Alternativhypothese die Hypothese, die der Benutzer belegen möchte. Sie sagt aus, dass eine Differenz besteht (z. B. Differenz zwischen Mittelwerten).
Liefern die Daten nicht ausreichend Evidenz gegen H0, wird H0 nicht abgelehnt. Liefern die Daten jedoch eine starke Evidenz gegen H0, wird H0 abgelehnt und Ha gilt als wahr mit einem quantifizierten (geringen) Risiko, falsch zu sein. Ein statistischer Test ermöglicht es, H0 abzulehnen/nicht abzulehnen.
Beispiele für H0 und vorgeschlagene Ha-Äquivalente:
-
H0: die Insulinrate von Patienten, die ein Placebo erhalten, entspricht der Insulinrate von Patienten, die eine Medikation erhalten.
-
Ha: die Insulinrate von Patienten, die ein Placebo erhalten, unterscheidet sich von der Insulinrate von Patienten, die eine Medikation erhalten.
-
H0: die Präsenz von Attribut A zeigt keine Wirkung auf die Verbraucherpräferenz in Bezug auf dieses Produkt.
-
Ha: die Präsenz von Attribut A zeigt Wirkung auf die Verbraucherpräferenz in Bezug auf dieses Produkt.
-
H0: Es liegt keine Tendenz in der Zeitreihe vor.
-
Ha: Es liegt eine Tendenz in der Zeitreihe vor.
-
H0: Getreidefelder, auf denen Düngemittel A, B, C oder D ausgebracht wurden, erzeugen dieselben Erträge.
-
Ha: mindestens ein Düngemittel führt zu Unterschieden im Getreideertrag.
Interpretation des Ergebnisses eines statistischen Tests: das Signifikanzniveau Alpha und der p-Wert
Beim Einrichten einer Studie muss ein Risikoschwellenwert festgelegt werden, über dem H0 nicht abgelehnt werden darf. Dieser Schwellenwert wird als Signifikanzniveau Alpha bezeichnet und muss zwischen 0 und 1 liegen. Niedrige Alpha-Werte sind eher konservativ. Die Wahl des Alpha-Werts muss davon abhängen, wie groß die Gefahr ist, dass H0 abgelehnt wird, obwohl H0 wahr ist. Beispielsweise muss der Alpha-Wert in einer Studie, in der die Vorteile einer medizinischen Behandlung gezeigt werden sollen, niedrig sein. Sollen hingegen die Auswirkungen vieler Attribute auf die Bewertung eines Produkts untersucht werden, können moderatere Alpha-Werte gewählt werden. Sehr oft wird der Alpha-Wert auf 0,05 oder 0,01 oder 0,001 festgelegt.
Der statistische Test ergibt eine als p-Wert bezeichnete Zahl (dieser Wert liegt ebenfalls zwischen 0 und 1). Der p-Wert ist die Wahrscheinlichkeit, Werte oder extremere Werte gemäß der Nullhypothese zu erhalten.
Aussagekräftiger ist es, den p-Wert mit Alpha zu vergleichen:
-
Ist der p-Wert < Alpha, lehnen wir H0 ab und nehmen Ha an, wobei sich das Risiko, dass Ha falsch ist, proportional zum p-Wert verhält.
-
Ist der p-Wert > Alpha, lehnen wir H0 nicht ab, was jedoch nicht notwendigerweise bedeutet, dass wir H0 annehmen müssen. Es bedeutet entweder, dass H0 wahr ist oder dass H0 falsch ist, aber unser Experiment und unsere statistischen Tests waren nicht „stark“ genug, um einen p-Wert zu generieren, der unter dem Alpha-Wert liegt.
Was ist statistische Aussagekraft und in welchem Fall können wir H0 annehmen?
In der Statistik wird die Fähigkeit eines Experiments/statistischen Tests, zu einer Ablehnung der Nullhypothese zu führen, als statistische Aussagekraft bezeichnet. Die Aussagekraft eines Experiments steigt mit dem Alpha-Wert, mit der Präzision der Messungen und mit der Zahl der Wiederholungen. Die Aussagekraft unterscheidet sich auch je nach der Art der verwendeten statistischen Tests (siehe den letzten Abschnitt dieses Tutoriums). Die Aussagekraft kann vor oder nach einem Experiment berechnet werden. Sie entspricht 1 minus dem Risiko, bei der Annahme von H0 falsch zu liegen (auch als Beta-Risiko bezeichnet). Je höher die Aussagekraft, desto geringer ist das Risiko, bei einer Annahme von H0 falsch zu liegen (natürlich nur, wenn der p-Wert > Alpha).
Zusammenfassend lässt sich sagen, dass falls p > Alpha UND falls die statistische Aussagekraft hoch genug ist (üblicherweise höher als 0,95), wir H0 annehmen können, wobei sich das Risiko, dass H0 falsch ist, proportional zu (1 - Aussagekraft) verhält.
Verschiedene Arten statistischer Tests
Ein statistischer Test kann Folgendes sein: - Zweiseitig oder einseitig.
Welcher Test eignet sich am besten?
Hier finden Sie ein Raster, das Ihnen helfen wird, den für Ihre Fragestellung am besten geeigneten Test auszuwählen.
War dieser Artikel nützlich?
- Ja
- Nein