Direkt zum Inhalt

Quantile Regression in Excel - Anleitung

Dieses Tutorium wird Ihnen helfen, eine Quantilsregression in Excel mithilfe der XLSTAT Software einzurichten und zu interpretieren. Sie sind nicht sicher, ob es sich hierbei um die Modellierungsfunktion handelt, nach der Sie suchen? Weitere Hinweise finden Sie hier.

Datensatz zum Ausführen einer Quantilsregression

Sie können

Ziel dieses Tutorials über Quantilsregression

Wir möchten mithilfe der Quantilsregression herausfinden, wie das Gewicht der Kinder von deren Geschlecht (der qualitativen Variablen f oder m), ihrer Größe und ihrem Alter abhängt und überprüfen, ob ein lineares Modell sinnvoll ist. Die Quantilsregression gehört neben der linearen Regression, der ANOVA und der ANCOVA zu einer größeren Modellfamilie mit dem Namen GLM (Generalized Linear Models).

Die Quantilsregression liefert im Unterschied zu diesen anderen Verfahren eine Schätzung der konditionalen Quantilen der abhängigen Variablen anstelle eines konditionalen Durchschnittswerts. Mit der Quantilsregression ist daher basierend auf einer Quantilsanalyse eine genauere Qualitätsüberprüfung möglich.

Die Parameterschätzwerte in linearen QR-Modellen werden gleich interpretiert wie in jedem anderen linearen Modell, nämlich als Änderungsraten. Ähnlich wie im Modell der kleinsten Quadrate (Ordinary Least Squares, OLS) können die Koeffizienten des QR-Modells als die Änderungsrate eines beliebigen Quantils der abhängigen Variablenverteilung pro Einheitenänderung im Wert eines beliebigen Regressors interpretiert werden.

Darüber hinaus ist es wie in ANCOVA möglich, qualitative und quantitative erklärende Variablen zu vermischen. In den drei anderen Tutorials über lineare Regression wird dieser Datensatz ebenfalls verwendet, erklärende Variablen sind Größe (Lineare Regression), Größe und Alter (ANOVA) sowie Größe, Alter und Geschlecht (ANCOVA).

Vorbereiten einer Quantilsregression

Wählen Sie nach dem Öffnen von XLSTAT den Befehl XLSTAT / Modellierung der Daten / Quantilsregression (siehe unten) aus.

Menu

Das Dialogfeld "Quantilsregression" wird angezeigt, sobald Sie auf die Schaltfläche klicken. Wählen Sie die Daten in der Excel-Tabelle aus. Die Abhängige Variable (oder zu modellierende Variable) ist hier das Gewicht.

Die quantitativen erklärenden Variablen sind Größe und Alter. Die qualitative Variable ist das Geschlecht. Da wir die Spaltentitel für die Variablen ausgewählt haben, bleibt die Option Variablenbeschriftungen aktiviert. Bei den anderen Optionen bleiben Standardwerte erhalten.

Menu

Klicken Sie auf OK, um die Berechnungen zu starten. Anschließend werden die Ergebnisse angezeigt.

Wir möchten uns hier auf die Analyse der Quantile konzentrieren, bei denen die Koeffizienten der Quantilsregression stark von denen der ANCOVA abweichen.

Im folgenden Beispiel ist eine Datenanalyse in zwei Schritten vorteilhaft, da keine Apriori-Daten mit Quantilen von Interesse vorhanden sind.

Der Quantilsprozess kann als erster Schritt eine Übersicht liefern und so auf Quantile hinweisen, auf die wir uns als Nächstes konzentrieren sollten.

Erinnern wir uns, bevor wir beginnen, an die Hauptergebnisse der ANCOVA, die auf diesen Datensatz angewendet wurden:

Menu

Interpretieren der Ergebnisse des ersten Schritts der Quantilsregression: die Quantilsprozessberechnung

Für diesen vorbereitenden Schritt werden nur allgemeine Ergebnisse bereitgestellt (weitere Optionen im zweiten Schritt).

Zunächst stellen wir fest, dass die Ergebnisse um den Median von der gleichen Ordnung sind wie die der ANCOVA (für den Mittelwert):

Mean result

Wenn wir uns nun auf Alter und Größe konzentrieren, scheint der Einfluss dieser Variablen auf das Gewicht der schwergewichtigsten Kinder (alpha > 0,9) stärker zu sein:

Mean result

Andere Ergebnisse der Quantilsregression weisen jedoch darauf hin, dass das Geschlecht größeren Einfluss auf das Gewicht der Leichtgewichtigsten (alpha < 0,1) hat:

Mean result

Die Quantile von Interesse gehören offenbar zu den Intervallen [0,9, 1] und [0, 0,1].

Dieser Eindruck lässt sich schnell und leicht mithilfe der Diagramme am Ende der Analyse bestätigen:

results

results

results

Im zweiten Schritt werden dann die Quantile 0,95 und 0,05 in der Excel-Tabelle ausgewählt.

Interpretieren der Ergebnisse des zweiten Schritts der Quantilsregression: die Quantilsauswahlberechnung

Diese erste Tabelle zeigt die Anpassungskoeffizienten des Modells für ein spezifisches Quantil. R² (der Bestimmungskoeffizient) gibt den Prozentsatz der Streuung der abhängigen Variablen an, die durch die erklärende Variable beschrieben wird. Je näher R² an 1 liegt, desto genauer ist die Übereinstimmung.

results

In diesem speziellen Fall werden für 0,05 91,6 % der Streuung des Gewichts durch Größe, Alter und Geschlecht und für 0,95 99,5 % erklärt. Die übrige Streuung hängt von anderen Faktoren (anderen erklärenden Variablen) ab, die während dieses Experiments nicht gemessen wurden bzw. nicht gemessen werden konnten. Wir können annehmen, dass genetische oder Ernährungsfaktoren eine Rolle spielen. Möglicherweise können wir aber auch einfach durch Umwandeln der verfügbaren Variablen bessere Ergebnisse erzielen.

Es ist wichtig, die Ergebnisse der Tabelle zur Modellaussagekraft zu untersuchen (siehe unten). Anhand der Ergebnisse kann bestimmt werden, ob die erklärenden Variablen wesentliche Informationen (Nullhypothese H0) zum Modell beitragen. Anders ausgedrückt kann so überprüft werden, ob es sinnvoll ist, dieses Quantil zur Beschreibung der Gesamtheit zu verwenden bzw. ob die von der erklärenden Variable gelieferten Informationen von Nutzen sind oder nicht.

results

Es werden drei Tests verwendet: Maximum-Likelihood, Lagrange-Multiplikator und Wald. Da die Wahrscheinlichkeit entsprechend des Chi²-Werts unter 0,0001 liegt, beträgt das Risiko, dass die Nullhypothese (keine Auswirkung der beiden erklärenden Variablen) falsch ist, unter 0,01 % liegt. Wir können daher davon ausgehen, dass die Aussagekraft der drei Variablen signifikant ist.

In der folgenden Tabelle finden Sie Details über das Modell. Diese Tabelle ist im Rahmen von Vorhersagen nützlich, oder falls Sie die Koeffizienten eines Modells für eine bestimmte Gesamtheit mit den für eine andere Gesamtheit ermittelten Werten vergleichen möchten.

results

Die nächste Tabelle zeigt einen Teil der Vorhersagen und der Residuen. Sie ermöglicht eine nähere Untersuchung der einzelnen standardisierten Residuen.

results

Das folgende Diagramm vergleicht die vorhergesagten mit den gemessenen Werten:

results

Fazit dieser Quantilsregression

Größe, Alter und Geschlecht können über 90 % der Streuung beim Gewicht erklären. Die Aussagekraft des verwendeten Quantilsregressionsmodells ist signifikant.

War dieser Artikel nützlich?

  • Ja
  • Nein