Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 24 Nächste Version anzeigen »

Häufig ist es der Zusammenhang zwischen Variablen interessant. Um das geeignete Maß zu finden ist das Messniveau von Bedeutung. Für diskrete oder klassierte Merkmale stellt die Kontingenztabelle (auch „Kreuztabellen“genannnt) eine Darstellungsform für den Zusammehang zweier simultan beobachteter Merkmale dar. X hat die Ausprägungen \(x_1\) bis \(x_M\) und Y die Ausprägungen \(y_1\) bis \(y_L\). Für  \(m= 1 ... M\) und \(l= 1 ... L\): \(n_{ml}= Häufigkeit (X=x_l ; Y=y_m)\). Die Zeilen enthalten absolute Häufikeiten von von Y begingt durch Ausprägungen von X, z.B. die Zeile \(n_{m1}\) bis \(n_{mL}\) sind absolute Häufigkeiten von Y Ausprägungen unter Bedingung \(X=x_m\). Am Ende dieser Zeile steht die entsprechende Randhäufigkeit \(n_{m •}\)

 

Im Kontext des Datenbeispiels wäre interessant zu untersuchen, ob Männer und Frauen gleich oder unterschiedlich erwerbstätig sind. Die Beantwortung dieser Frage ermöglicht die folgende Kontingenztabelle für die Variablen BERUFSTAETIG und GESCHL:

 
MAENNLICH
WEIBLICH
\(\sum\)
HAUPTBERUFL.GANZTAGS
1026
545
1571
HAUPTBERUFL.HALBTAGS
41
309
350
NEBENHER BERUFSTAE.
73
135
208
NICHT ERWERBSTAETIG
619
720
1339
\(\sum\)
1759
1709
3468

Aus der Kontingenztabelle ist z.B. abzulesen:

  • 41 Männer haben halbtagige hauptberufliche Erwerbstätigkeit (BERUFSTAETIG = 2 ,GESCHL = 1)
  • 545 Frauen haben ganztagige hauptberufliche Erwerbstätigkeit (BERUFSTAETIG = 1, GESCHL = 2)

Die Werte in der letzten Spalte stellen Randverteilung von BERUFSTAETIG dar und die letzte Zeile - Randverteilung von GESCHL (die Frage wurde von 1759 Männer und 1709 Frauen beantwortet).

Die Kontingenztabelle im Beispiel enthält absolute Häufigkeiten. Es lassen sich auch relative Häufigkeiten in einer Kontingenztabelle darstellen. In bestimmten Situationen hilfreich sind auch Kontingenztabellen mit sog. bedingten relativen Häufigkeiten in den Zeilen oder Spalten.

Die bedingte relative Häufigkeiten lassen sich zeilen- oder spaltenweise ausrechnen. Innerhalb von Teilstichprobe von Männer (1759) sind \(\frac{1026}{1759} \approx 0,5833\) sind ganztag hauptberuflich erwerbstätig, \(\frac{41}{1759} \approx 0,0233\) sind halbtagig hauptberuflich erwerbstätig, \(\frac{73}{1759} \approx 0,0415\) nebenher erwerbstätig und   \(\frac{619}{1759} \approx 0,3519\) nicht erwerbstätig. Insgesamt sind 1339 Personen in der Stichprobe sind nicht erwerbstätig, nämlich 619 Männer und 720 Frauen. Die relative Häufigkeiten unter der Bedingung von keine Erberbstätigkeit sind \(\frac{619}{1339} \approx 0,4623\) und \( \frac{720}{1339} = 0,5377\), d.h. 46,23% von nicht erwerbstätige Beftagte männlich waren.

Mit Hilfe von bedingte Häufigkeiten lasst sich feststellen, wenn man von einem fehlenden Zusammenhang zwichen zwei kategorielle Merkmale sprechen kann, von Unabhängichkeit der Merkmale.

Weiter gilt: X und Y sind dann unabhängig, wenn


! Interne Notiz: Chi-Quadrat, Fisher Exakt Test, McNemar)

 

 

  • Keine Stichwörter