...
Annahme | Was wirklich bedeutet das? | Wann wird es wahrscheinlich verletzt? | Warum is das ein Problem? | ||
---|---|---|---|---|---|
Linearität | Es kann nicht sein, dass einige Beobachtungen in y, systematisch unterhalb der Regressionslinie liegen, während andere Werte y systematisch darüber liegen. | Gut definierte Untergruppen in den Daten können dieses Problem verursachen (Männer vs Frauen). | Schätzungen von β0 sind nicht korrekt | ||
Unabhängigkeit | Es kann nicht der Fall sein, dass das Wissen des Wertes von y für eine Beobachtung, sagt uns, ob der Wert von y für einen anderen Fall über oder unter seinem Erwartungswert liegt. | Es tritt häufig in Zeitreihenanalyse auf (Sommer vs. Winter) | Maßnahmen der Stärke der Beziehung zwischen x und y können sehr irreführend sein | ||
Homoskedastizität | Es kann nicht der Fall sein, dass die Beziehung x/y für eine Beobachtung stärker und für andere schwächer ist. | Gut definierte Untergruppen in den Daten können dieses Problem verursachen (Männer vs Frauen). | Bo und B1 werden nicht genau geschätzt. Noch wichtiger ist, dass die Bewertung der Vorhersagegenauigkeit nicht korrekt ist. | ||
Residuen normalverteilt | Die Fehlerterme sind normalverteilt | Das kann immer passieren | Konfidenzintervalle und Hypothesentests können irreführend sein. | ||
Nicht-Kollinearität | Es kann nicht vorkomenn, dass wenn eine Beobachtung hat bestimmte Werte, andere Beobachtungen genau so ausehen. | Es liegt vor, wenn zwei oder mehr erklärende Variablen eine starke Korrelation miteinander haben (Arbeiten und Gehald Bekomen ) | Overfitting in Regressionsanalysemodellen kann vorkommen, Redundanz bei der Interpretation der erklärende variablen. |
Die Gültigkeit der Annahmen sollte geprüft werden.
...