Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

...

Wenn die Beziehung zwischen zwei Variablen nichtlinear ist oder wenn Ausreißer vorhanden sind, schätzt der Korrelationskoeffizient falsch die Stärke der Beziehung. Das Plotten der Daten vor dem Berechnen eines Korrelationskoeffizienten ermöglicht, die lineare Beziehung zu überprüfen und die möglichen Ausreißer zu identifizieren. Der Fall (A) zeigt positiven Korrelation, wobei die Gerade steigt: Fall (B) zeigt eine unpassende Form der Funktion. Fall (C) veranschaulicht einen Fall, in dem es eine strenge lineare Beziehung gibt, außer bei einen Beobachtung mit großem Einfluss auf die Schätzer und (D) zeigt ein Beispiel von nicht-Korrelation zwieschen den Variablen.

 

 

Andere Möglichkeit ist die sogenannte Partial Residual Plot zu benutzen. Eine lineare Zusammenhang in Form einer roten Gerade is gezeigt. Der grüner Gerade representiert die Modellierung dieser zusammenhang durch sogenannte Splines. Sollte der Zusammenhang nicht linear sein, so können eventuell die vorgestellten Transformationen genutzt werden, um den Zusammenhang zu linearisieren. 

                           

Weiterhin wird vorausgesetzt, dass die Residuen unabhängig sind und eine konstante Varianz aufweisen (\( V(\epsilon_{i}) = \sigma^{2}\)," Homoskedastizität"). Dies kann überprüft werden, indem die geschätzten Werte der abhängigen Variablen in einem Streudiagramm gegen die Residuen gezeichnet werden (sog. Residuenplot). 

                                         

Dabei handelt es sich ebenfalls um ein Streudiagramm, in dem auf der Abszisse die geschätzten Werte der abhängigen Variablen und auf der Ordinate die geschätzten Residuen abgetragen werden. Die Punkte in dem Diagramm sollten unsystematisch streuen. Das Auftreten einer Trichterform deutet auf eine Verletzung der Annahme konstanter Varianzen („Heteroskedastizität“) hin. Ist eine Systematik in den Punkten erkennbar, so ist diese meist auf eine Verletzung der Unabhängigkeitsannahme zurückzuführen.

Image Removed

Image Removed

In A die Residuen sin gleichmäsig verteilt. In B

Image Removed

Image Removed

 

 

 

Die  Die Punkte im Residuenplot sollten ohne Systematik streuen. Eine Systematik deutet auf Abhängigkeiten hin, die nicht berücksichtigt wurden. Formen In Dem Fall (A)verteilen sich die Residuen ungefähr in einem gleichbleibend dickem horzontalen Band.  Formen die Punkte einen „Trichter“ ist „Trichter“ oder „Rhombus“  ist dies ein Hinweis auf eine Verletzung der Annahme gleicher Varianzen (Fall B, C, F).  Fälle sowie (D) und (E) zeigen eune quadratischem/logaritmischen Zusammenhang.


                                       Image Added

Beobachtungen mit großem Einfluss auf die Schätzer können auch in diesem Graph erkennen


                                   Image Added

 

 

 

Damit . Damit man den F-Test und die t-Tests für die Parameter sinnvoll interpretieren kann, müssen die Residuen zudem normalverteilt sein. Um dies graphisch zu prüfen, können zusätzlich die Histogramm und die Normalverteilungsdiagramm untersucht werden. Der erster Output wird dann um ein Histogramm der standardisierten Residuen, dem die Dichte der Standardnormalverteilung überlagert ist, ergänzt (optional). Die Form des Histogramms sollte möglichst der der Kurve entsprechen.  Das Histogramm zeigt, dass die Verteilung der Residuen im Vergleich zu Normalverteilung eher rechtsschief ist. 

...