Direkt zum Inhalt

Breusch-Pagan & White Heteroskedastizitätstest in Excel

Dieses Tutorium zeigt Ihnen, wie Sie Heteroskedastizitätstests - Breusch-Pagan & White-Tests - in Excel mithilfe der Statistiksoftware XLSTAT ausführen und interpretieren.

Datensatz zum Ausführen der Tests auf Heteroskedastizität von Breusch-Pagan und White in XLSTAT

Für dieses Tutorial verwenden wir einen künstlichen Datensatz, den wir speziell für den Vergleich eines homoskedastischen Modells mit einem stark heteroskedastischen Modell erstellt haben. Die Daten entsprechen einem Experiment zum Testen der Auswirkung des Alters (gemessen in Tagen) auf Zuckerinhalt und Größe einer neuen Fruchtsorte.

Sie können

Die erste Regression (Zuckerinhalt) stellt Homoskedastizität dar, die zweite (Größe) ist stark heteroskedastisch.

Im letzten Abschnitt dieses Tutorials sehen Sie, wie wir die Daten technisch generiert haben.

Ziel dieses Tutorials

Das Ziel dieses Tutorials ist, zu überprüfen, ob sich die Streuung einer abhängigen Variablen (z. B. Zuckerinhalt oder Größe) mit einer erklärenden Variablen (Alter) in einer linearen Regression ändert. Das heißt, wir ermitteln, ob Regressionsresiduen entlang der erklärenden Variablen heterogen verteilt sind. Wenn dies der Fall ist, sprechen wir von Heteroskedastizität. Häufig ist die Größe eines Organismus mit dem Alter variabler. Wenn Sie Babys mit Erwachsenen vergleichen, ist die Größe von Babys relativ "einheitlich", wohingegen die Größen von Erwachsenen stark variieren. Dies ist ein typischer Fall von Heteroskedastizität.

Wir verwenden die Tests auf Heteroskedastizität von Breusch-Pagan und White, um diese in zwei Extremsituationen zu demonstrieren: Homoskedastizität und starke Heteroskedastizität.

Tests auf Heteroskedastizität von Breusch-Pagan und White: Welche Hypothese testen wir?

Tests auf Heteroskedastizität implizieren die beiden folgenden Hypothesen.

H0 (Nullhypothese): Die Daten sind homoskedastisch.

Ha (alternative Hypothese): Die Daten sind heteroskedastisch.

Wenn daher der p-Wert, der einem Heteroskedastizitätstest zugeordnet ist, unter einen bestimmten Schwellenwert (z. B. 0,05) fällt, können wir daraus schließen, dass die Daten signifikant heteroskedastisch sind.

Ausführen der Tests auf Heteroskedastizität von Breusch-Pagan und White in XLSTAT

Öffnen Sie das XLSTAT-Menü, und klicken Sie auf Time / Tests auf Heteroskedastizität. Wählen Sie die Spalte "Residuen(Zucker)" im Feld "Residuen" und die Spalte "Alter" im Feld mit den erklärenden Variablen. Aktivieren Sie das Kontrollkästchen "White-Test" und starten Sie die Analyse, indem Sie auf OK klicken. Die Ergebnisse dieser ersten Analyse werden anschließend in einem neuen Tabellenblatt angezeigt.

Heteroscedasticity tests dialog box

Wiederholen Sie dies mit der Spalte "Residuen(Größe)" im Feld "Residuen".

Interpretation

Für die Variable "Zuckerinhalt" zeigt das Diagramm Residuen/Alter eine relativ homogene Verteilung der Residuen entlang der Variable "Alter".

Heteroscedasticity: Sugar residuals/Age chart

Darüber hinaus ergeben beide Tests hohe p-Werte (0,322 für den Breusch-Pagan-Test und 0,296 für den White-Test). Dies scheint die Nullhypothese, die besagt, dass die Residuen homoskedastisch sind, zu bestätigen.

Heteroscedasticity: BP test result for sugar content

Für die Variable "Größe" zeigt das Diagramm Residuen/Alter, dass die Streuung der Residuen mit dem Alter der Früchte zunimmt. Diese Kegelform ist bei Heteroskedastizität sehr häufig.

Heteroscedasticity: Size residuals/Age chart

Zusätzlich liegt der p-Wert für beide Tests weit unter dem Signifikanzniveau von 0,05. Das Diagramm weist darauf hin, dass die Nullhypothese, die Residuen seien homoskedastisch, verworfen werden muss.

Heteroscedasticity: BP test result for size

Zusatzinformationen: Generierung des Datensatzes für dieses Tutorial

Die vom Zuckerinhalt abhängige Variable ist die Summe der doppelten Altersvariablen und einem zufälligen, nur geringfügigen Standardfehler von etwa Null. Dieser Fehler stellt die Residuen dar. Dies ist ein typischer Fall, bei dem die Residuen unabhängig und identisch verteilt sind. Für die zweite unabhängige Variable (Größe) wurde für die Residuen das Alter mit dem zufälligen Standardfehler multipliziert. In diesem Fall sind die Residuen offensichtlich nicht unabhängig. Weitere Informationen finden Sie auf dem zusätzlichen Infoblatt im Tutorial-Datensatz.

War dieser Artikel nützlich?

  • Ja
  • Nein