Log-lineare Regressionen in Excel - Anleitung
Dieses Tutorium wird Ihnen helfen, eine Log-lineare Regression, auch Poisson-Regression genannt, in Excel mithilfe der XLSTAT Software einzurichten und zu interpretieren. Sie sind nicht sicher, ob es sich hierbei um die Modellierungsfunktion handelt, nach der Sie suchen? Weitere Hinweise finden Sie hier.
Datensatz für eine Log-lineare Regression (Poisson-Regression)
Die Daten entsprechen der Anzahl von Auszeichnungen, die Schüler in einer High School erhalten haben. Um die Anzahl der erhaltenen Auszeichnungen zu erklären, gibt es zwei Prädiktoren: die Art des Programms, in das der Schüler eingeschrieben war (z. B. berufsorientiert, allgemein oder akademisch) und die Note in seiner Mathematik-Abschlussprüfung.
Da wir von Zähldaten sprechen, muss eine Log-lineare Regression mit einer Poisson-Verteilung angewendet werden, um die Anzahl der von einem Schüler erhaltenen Auszeichnungen zu erklären und/oder vorherzusagen.
Einrichten einer Log-linearen Regression
Nach dem Öffnen von XLSTAT wählen Sie den Befehl XLSTAT/Modellierung der Daten/Log-lineare Regression oder klicken Sie auf den entsprechenden Button der Symbolleiste Modellierung der Daten.
Sobald Sie auf den Button geklickt haben, erscheint das Dialogfeld.
Die Daten werden in einer Tabelle mit 200 Zeilen und 3 Spalten dargestellt. Die erste Spalte ist die Antwortvariable und die beiden anderen sind die erklärenden Variablen.
In der Registerkarte **Optionen können verschiedene Kriterien für den Algorithmus modifiziert werden. Es besteht außerdem die Möglichkeit, Interaktionen zwischen den Variablen hinzuzufügen. Hier übernehmen wir für alle Optionen den Vorgabewert.
Die Berechnungen beginnen, sobald Sie auf OK geklickt haben. Die Ergebnisse werden dann in einem neuen Tabellenblatt angezeigt.
Interpretieren der Ergebnisse
Die ersten Ergebnisse, die angezeigt werden, sind die Statistiken für jede Variable, die abhängige Variable wird blau dargestellt.
In der nächsten Tabelle finden sich mehrere Indikatoren für die Qualität des Modells (oder die Anpassungsgüte). Diese Ergebnisse entsprechen R2 und der Tabelle der Varianzanalyse bei der linearen Regression und ANOVA. Der wichtigste Wert, der betrachtet werden muss, ist die Wahrscheinlichkeit des Chi-Quadrat-Tests über das Log-Verhältnis. Dieser entspricht Fishers F-Test: Wir versuchen, zu bewerten, ob die Variablen signifikante Informationen liefern, indem wir das Modell gemäß seiner Definition mit einem einfacheren Modell mit nur einer Konstanten vergleichen. In diesem Fall, da die Wahrscheinlichkeit niedriger als 0,0001 ist, können wir schlussfolgern, dass durch die Variablen signifikante Informationen geliefert werden.
Die folgende Tabelle liefert den geschätzten Wert der Koeffizienten für das angepasste Modell. Um zu prüfen, ob eine Variable signifikante Informationen liefert, wird ein statistischer Test angezeigt. In unserem Fall stellen wir fest, dass der Parameter des „Allgemeinen Programms“ nicht signifikant von 0 abweicht (bei einem Niveau von 5 %).
Der letzte Schritt ist die Anwendung des Modells auf die Gesamtpopulation.
War dieser Artikel nützlich?
- Ja
- Nein