...
Annahme | Was wirklich bedeutet das? | Wann wird es wahrscheinlich verletzt? | Warum is das ein Problem? |
---|---|---|---|
Linearität | Es kann nicht sein, dass einige Beobachtungen in y, systematisch unterhalb der Regressionslinie liegen, während andere Werte y systematisch darüber liegen. | Gut definierte Untergruppen in den Daten können dieses Problem verursachen (Männer vs Frauen). | Verzerrung der Schätzungen von β0 sind nicht korrekt |
Unabhängigkeit | Es kann nicht der Fall sein, dass das Wissen des Wertes von y für eine Beobachtung, sagt uns, ob der Wert von y für einen anderen Fall über oder unter seinem Erwartungswert liegt. | Es tritt häufig in Zeitreihenanalyse auf (Sommer vs. Winter) | Maßnahmen der Stärke der Beziehung zwischen x und y können sehr irreführend sein |
Es kann nicht der Fall sein, dass die Beziehung x/y für eine Beobachtung stärker und für andere schwächer ist. | Gut definierte Untergruppen in den Daten können dieses Problem verursachen (Männer vs Frauen). | Bo und B1 werden nicht genau geschätzt. Noch wichtiger ist, dass die Bewertung der Vorhersagegenauigkeit nicht korrekt ist. | |
Residuen normalverteilt | Die Fehlerterme sind normalverteiltfolgen eine Normalverteilung | Das kann immer passieren | Konfidenzintervalle und Hypothesentests können irreführend sein. |
Es kann nicht vorkomenn, dass wenn eine Beobachtung hat bestimmte Werte, andere Beobachtungen genau so ausehen. | Es liegt vor, wenn zwei oder mehr erklärende Variablen eine starke Korrelation miteinander haben (Arbeiten und Gehald Bekomen ) | Overfitting in Regressionsanalysemodellen kann vorkommen, Redundanz bei der Interpretation der erklärende variablen. |
...
Die Gültigkeit der Annahmen sollte geprüft werden.
...