Das multiple lineare Regressionsmodell, in seiner allgemeinen Form mit \(P\) Kovariaten, wird folgendermaßen beschrieben:
\[ Y_{i} = \beta_0 + \beta_1 \cdot x_{1i} + \beta_2 \cdot x_{2i} + \ldots + \beta_P \cdot x_{Pi} + \epsilon_i \qquad (i=1,\ldots ,n) \]
Dabei werden folgende Annahme über den Fehlerterm \(\epsilon_i\) getroffen:
\(\epsilon_{1}, \ldots, \epsilon_{n}\) |
...
sind normalverteilt (Die Normalverteilungsannahme wird benötigt, um Standard-Tests im Regressionsmodell durchführen zu können, für die Schätzung an sich ist sie nicht erforderlich) mit Mittelwert 0 (\(E(\epsilon_{i}) = 0\)) und konstanter Varianz (\(V(\epsilon_{i}) = \sigma^{2}\); Homoskedastizität). | |
\(\epsilon_{1}, \ldots, \epsilon_{n}\) | sind unabhängig |
...
\( \epsilon_{i}\) und \(X_{i,p} \:(p=1, \ldots, P) \) | sind |
...
unkorreliert |
Annahmen des multiplen linearen Regressionsmodells
...