Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

Statistische Analyseverfahren, die mit den Begriffen Cluster- oder Paneldaten in Verbindung stehen, werden in verschiedenen Forschungsdisziplinen mit unterschiedlichen Synonymen bezeichnet. Gängige Bezeichnungen in der Psychologie, Medizin und empirischen Sozialforschung sind zum Beispiel Mehrebenenanalyse (multilevel modeling), Hierarchische lineare Modellierung (hierarchical linear models) und Analyse gemischter Modelle (mixed model analysis). In der Ökonometrie, vor allem in der Längsschnittforschung, ist vorrangig der Begriff der Paneldatenanalyse geprägt. In den meisten Fällen bezieht sich die Bezeichnung auf die Struktur der vorliegenden Daten.

 

Tipp
titleLiteraturehinweise

hier vielleicht empfehlungen für Literatur und inteessante Links aus verschiedenen Disziplinen

Inhalt
stylesquare

 

Datenstruktur

In einem Datensatz können Beobachtungseinheiten in mehreren Ebenen enthalten sein. Ein Beispiel mit zwei Ebenen aus der Bildungsforschung  wäre eine Untersuchung des Lernerfolgs von Schülern (Ebene 1) aus verschiedenen Klassen (Ebene 2). Hierbei bilden die Beobachtungen der Schüler die erste Ebene und die Verschiedenen Klassen die zweite Ebene. Es können Charakteristika (Variablen) auf Schülerebene (z.B. Testergebnisse aus Leistungskontrollen, Geschlecht) und auf Klassenebene  (z.B. Klassengröße, Eigenschaften des Klassenlehrers) im Datensatz enthalten sein. Die folgene Darstellung zeigt eine schematische Darstellung dieser Datenstruktur.  Der Abbildung steht eine Datentabelle gegenüber, die verdeutlicht, wie die Daten orgenisiert sein müssen, um eine Mehrebenenanalyse durchführen zu können.

 

Anker
Beipiel 1
Beipiel 1

Beispiel 1

 

Office Excel
nameBeispiel 2 Ebenen.xlsx
sheet2 Ebenen

Diese Datenstruktur kann auf Beispiele aus anderen Forschungsdisziplinen übertragen werden: in der Paneldatenanalyse entsprechen die Individuen der Ebene 2 und die Zeitpunkte der Ebene 1; in klinischen Studien mit Patienten aus unterschiedlichen Kliniken entsprechen die Kliniken der zweiten Ebene und die Patienten der ersten Ebene. Das obige Beispiel aus der Bildungsforschung lässt sich auf mehr als zwei Ebenen erweitern. Werden die Schüler zum Beispiel über mehrerer Zeitpunkte beobachtet, kommt eine weitere Ebene hinzu. Die folgende Abbildung verdeutlicht dies

 

 

Beispiel 2
Anker
Beispiel 2
Beispiel 2

 

Office Excel
nameBeispiel 2 Ebenen.xlsx
sheet3 Ebenen

 

Analog zu dieser Erweiterung könnten in der Paneldatenanalyse die Individuen aus unterschiedlichen Regionen stammen. Die Regionen würden in diesem Fall Ebene 3, die Individuen Ebene 2 und die Zeitpunkte Ebene 1 entsprechen. Im Beispiel der Klinischen Studie könnten die Patienten über mehrere Zeitpunkte beobachtet werden, wobei die Kliniken dann Ebene 3, die Patienten Ebene 2 und die Zeitpunkte Ebene 1 entsprächen.

Die Datenstruktur bestimmt die Abhängigkeitsstruktur oder auch Clusterung in den Daten. Als Cluster werden allgemein Beobachtungen bezeichnet, die sich aufgrund von Gemeinsamkeiten ähneln. Im Beispiel wird die Abhängigkeit durch die Klassenzugehörigkeit bestimmt. Es ist zu erwarten, dass die Ergebnisse der Schüler innerhalb einer Klasse sich ähnlicher sind als die Ergebnisse im Vergleich zwischen den Klassen. Dies ist bedingt durch messbare klassenspezifische Faktoren, wie Klassengröße oder Geschlecht Lehrers, aber auch durch nicht messbare Faktoren, wie Zusammengehörigkeitsgefühl oder Beziehung zum Lehrer. Werden die Schüler zusätzlich über verschiedene Zeitpunkte beobachtet, kommt eine zeitliche Abhängigkeit hinzu. Es ist zu erwarten, dass sich die Ergebnisse eines Schülers über die Zeit ähnlicher sind als die Ergebnisse unterschiedlicher Schüler. Dies ist Bedingt durch beobachtbare schülerspezifische Eigenschaften, wie Geschlecht oder sozioökonomische Kennzahlen des Elternhauses, aber auch nicht beobachtbaren Eigenschaften, wie Motivation für das Fach oder Begabung. Diese Abhängigkeit, die durch Zugehörigkeit in den verschieden Ebenen bedingt ist wird allgemein als Intraklassenkorrelation (geläufige Abkürzung ICC) bezeichnet.

Auswertungsmöglichkeiten

 

Im Beispiel aus der Bildungsforschung könnten die Daten genutzt werden, um Ergebnisse eines Leistungstest mit verschiedenen unabhängigen Variablen zu erklären. Drei mögliche Herangehensweisen werden hier kurz dargestellt.

 

Aggregieren

 

Die auf Ebene 1 gemessen Variablen, werden auf Ebene 2 zusammengefasst. Für das obige Beispiel hieße das, dass Mittelwerte über die Schüler innerhalb der einzelnen Klassen gebildet werden. Dieses Vorgehen hat einen massiven Informationsverlust zur Folge und die Stichprobengröße wird auf die Anzahl der in Ebene 2 beobachteten Einheiten reduziert, im Beispiel die Anzahl der beobachteten Schulklassen.

 

Auswertung auf Individualebene

 

Die hierarchische Datenstruktur wird ignoriert, und die Daten werden behandelt als wären sie unabhängig. In einer OLS Regression, die Unabhängigkeit der Beobachtungen voraussetzt, könnte das eine fehlerhafte Inferenz zur Folge haben.  Die Standardfehler würden tendenziell unterschätzt werden, was die Wahrscheinlichkeit erhöht Effekte fälschlicherweise als signifikant anzunehmen.

 

Mehrebenenanalyse

 

Verschiedene Ebenen werden in ein Modell integriert. Die abhängige Variable \(Y\) liegt auf individualebene (Ebene 1)  vor, erklärende Variablen können auf individualebene, aber auch auf höheren Ebenen vorliegen. Erklärende Variablen aus höheren Ebenen geben Aufschluss über den übergeordenten Kontext aus dem die Individualbeobachtungen stammen und werden deshalb häufig als Kontextvariablen bezeichnet.

Ein vollständiges lineares Zweiebenenmodell mit einer erklärenden Variable auf auf Individualebene (\(X\)) und einer auf Ebene 2 \(Z\) hat folgende formale Form:

$$Y_{ij} = \underbrace{\alpha_0+ \alpha_1 X_{ij} + \gamma_1 Z_j + \gamma_{11}Z_jX_{ij}}_{fester\,\, Teil} + \underbrace{u_{0j} + u_{1j} X_{ij}+ e_{ij}}_{zufälliger\,\, Teil}$$.

wobei der Index \(ij\) eine Ausprägung von Individuum \(i\) innerhalb einer Kategorie \(j\) aus Ebene 2 kennzeichnet. Mit den Daten aus Beispiel 1 entspräche \(Y\) den Ergebnissen aus dem Leistungstest, \(X\) dem IQ und \(Z\) der Klassengröße.Bei der Entwicklung eines Mehrebenenmodells für dieses Beispiel sollte inhaltlich überlegt werden welcher Teil des obigen Modells sinnvoll ist und aufgenommen werden soll. Folgende Tabelle zeigt die Bedeutung Parameters aus obiger Gleichung.

 

 

 

 

Parameter Beschreibung
\(\alpha_0\)Die RegressionskonstanteIntercept. Entspricht dem theoretischen Outcome (Ergebnis im Leistungstest), wenn alle erklärenden Variablen Null sind.
\(\alpha_1\) Effekt von \(X\) (IQ) auf \(Y\). Erklärt die Variation zwischen den Schülern
\(\gamma_1\)Effekt der Kontextvariable \(Z_j\) (Klassengröße) auf \(Y\). Erklärt die Variation zwischen den Klassen
\(\gamma_{11}\)Interaktionseffekt zwischen \(Z_j\) und \(X\) auf \(Y\). Wird in das Modell aufgenommen, der Effekt von IQ auf \(Y\) von der Klassengröße beeinflusst wird.
\(u_{0j}\)Zufälliger Intercept. Beschreibt Unterschiede zwischen den Klassen.
\(u_{1j}\)  

 

Modellwahl

 

In order to conduct a multilevel model analysis, one would start with fixed coefficients (slopes and intercepts). One aspect would be allowed to vary at a time (that is, would be changed), and compared with the previous model in order to assess better model fit.[1] There are three different questions that a researcher would ask in assessing a model. First, is it a good model? Second, is a more complex model better? Third, what contribution do individual predictors make to the model?

In order to assess models, different model fit statistics would be examined. [2] One such statistic is the chi-square likelihood-ratio test, which assesses the difference between models. The likelihood-ratio test can be employed for model building in general, for examining what happens when effects in a model are allowed to vary, and when testing a dummy-coded categorical variable as a single effect.[2] However, the test can only be used when models are nested (meaning that a more complex model includes all of the effects of a simpler model). When testing non-nested models, comparisons between models can be made using the Akaike information criterion (AIC) or the Bayesian information criterion (BIC), among others See further Model selection.