Sie zeigen eine alte Version dieser Seite an. Zeigen Sie die aktuelle Version an.

Unterschiede anzeigen Seitenhistorie anzeigen

« Vorherige Version anzeigen Version 12 Nächste Version anzeigen »

Hier sollte eine kurze Zusammenfassung und Leitung des Abschnittes sein. Diese Seite dient als Vorlage für einen Artikel im Wiki und kann entsprechend angepasst werden.

Inhaltsverzeichnis

Einleitung

 

 

Überschriften, die ins Inhaltsverzeichnis aufgenommen werden sollen, müssen die Größen Überschrift 1 (Kapitel) und Überschrift 2 (Unterkapitel). Es können natürlich auch weitere Untergliederungen vorgenommen werden, allerdings tauchen diese nicht im Inhaltsverzeichnis auf. Jedes Kapitel (Überschrift 1) bekommt einen eigenen Bereich.

Häufigkeitstabelle

 Format im Text

 

Abbildungen und Tabellen werden zentriert. Alle Abbildungen besitzen eine Bildüberschrift, die Teil der Abbildung ist. Wenn dies nicht möglich ist, dann wird entsprechend im Wiki-Editor eine zentrierte Überschrift hinzugefügt. Nach Möglichkeit sollten Bilder eine Überschrift als Eigenschaft haben.

Abweichung

Kontigenztabelle

 

 

 

Lage- und Skalenparameter

 

 

 


Grafische Auswertung

 

In der deskriptiven Statistik ist neben der Beschreibung des Datensatzes mit Hilfe von Häufigkeitstabellen sowie Lage-/Steuungsparametern die Visualisierung der Daten bedeutsam. Für die Darstellung der Daten gibt es viele unterschiedliche Möglichkeiten. Im folgenden Abschnitt werden einige Visualisierungsmöglichkeiten vorgestellt und auf den ALLBUS-Datensatz angewendet.

Balken/- Kreisdiagramm:

Besonders einfach zu lesen – und aus den Medien hinreichend bekannt – sind Balken und Kreis- bzw. Tortendiagramme. Diese Diagramme lassen sich einfach aus einer Häufigkeitstabelle generieren. Wahlweise können beim Balkendiagramm die absoluten oder die relativen Häufigkeiten abgetragen werden. Beim Tortendiagramm werden allerdings immer die relativen Häufigkeiten dargestellt, da „ein Ganzes“ in seine Anteile unterteilt wird. Die Größe des Winkels lässt sich dabei aus der Multiplikation von 360° mit dem entsprechendem Anteil bestimmen. 

Gruppierte Balkendiagramme eignen sich besonders, wenn es inhaltlich sinnvoll ist innerhalb eines Merkmals zwischen verschiedenen Subgruppen zu unterscheiden. So wird in dem hier erstellten gruppierten Balkendiagramm die absoluten Häufigkeiten im Bezug auf Berufstätigkeit nach Geschlechtern getrennt dargestellt. Vergleichend mit dem vorherigem Balkendiagramm können hier zusätzlich Schlüsse über das unterschiedliche Verhalten von Männern und Frauen im Bezug auf die Berufstätigkeit gezogen werden.

 

 

 

 

 

Anwendungshinweise:

  • geeignet für Merkmale mit nominalem oder ordinalem Messniveau, die nur wenige Ausprägungen haben
  • bei metrischem Messniveau sollten Stabdiagramm verwendet werden
  • insbesondere Kreisdiagramme werden schnell unübersichtlich, wenn es zu viele Segmente gibt (eine Lösung ist das Ausweichen auf andere Möglichkeiten der grafischen Darstellung oder das Zusammenfassen unterschiedlicher Merkmale um die Übersichtlichkeit herzustellen)

 

 

  • Stabdiagramm:

 

Das Stabdiagramm enthält ebenfalls Balken bzw. Linien für jede Ausprägung, deren Höhe

sich an der absoluten oder relativen Häufigkeit des Auftretens der jeweiligen Ausprägung

richtet. Anders als beim Balkendiagramm spiegelt die Entfernung der Balken zueinander

beim Stabdiagramm jedoch die Abstände der Ausprägungen wider. Dies setzt natürlich

voraus, dass diese überhaupt interpretierbar sind, was nur bei metrischem Messniveau

gegeben ist.

In dem hier durchgeführten Beispiel zu der Anzahl der Arztbesuche unterschiedlicher befragter Personen (ALLBUS-Datensatz) zeigt sich der Unterschied zu einem Balkendiagramm deutlich. Beim Balkendiagramm wäre keine Lücke zwischen beispielsweise 21 und 24 Artzbesuchen, sondern es wären die Häufigkeiten für beide Anzahlen von Arztbesuchen direkt nebeneinander aufgetragen.

Der Vorteil des Stabdiagramms liegt darin, dass nun die Abstände der einzelnen metrischen Merkmalsausprägungen (Anzahl der Arztbesuche) auf einer Skalar dargestellt werden, sodass für den Betrachter die Abstände zwischen den diskreten Merkmalen verdeutlicht werden.

 

 

 

 

 

Anwendungshinweise:

  • geeignet für diskrete Merkmale mit metrischem Messniveau
  • wenn das Stabdiagramm durch zu viele Balken unübersichtlich wird oder sehr viele Fälle mit der absoluten Häufigkeit von 1 auftreten, ist das Histogramm eine Alternative

 

  • Histogramm:

Während das Stabdiagramm die Informationen aus der Häufigkeitstabelle eines unklassierten

metrischen Merkmals visualisiert, erfüllt das Histogramm den selben Zweck für klassierte metrische Merkmale. Für jede Klasse wird ein Balken gezeichnet, dessen Breite und Position durch die Klassenunter- und Obergrenze bestimmt werden. Die Höhe des Balkens entspricht der absoluten Häufigkeit in der Klasse, der relativen Häufigkeit in der Klasse oder der Häufigkeitsdichte. Letztere ist eine einfache Transformation der relativen Häufigkeiten, bei der diese für jeden Balken ins Verhältnis zur jeweiligen Klassenbreite gesetzt werden. Wird auf der Ordinate im Histogramm die Häufigkeitsdichte abgetragen, entspricht die Fläche unter jedem Balken der relativen Häufigkeit der korrespondierenden Klasse, die Gesamtfläche ist immer 1.

 

In dem hier gezeigten Beispiel wurden die Personen aus dem verwendeten Datensatz in 13 Klassen nach ihrem Gewicht eingeteilt.

 

 

Die Verwendung von unterschiedlichen Klassenbreiten erweist sich als sinnvoll, um Bereiche mit hohen Häufigkeitsdichten besser zu differenzieren. So wurde besipielsweise in ABBILDUNG In den Bereichen zwischen 60 und 90 Kilogramm eine Klassenbreite von 5 Kilogramm gewählt um eine bessere Differenzierung in diesem Bereich zu ermöglichen.

 

 

Anwendungshinweise:

  • geeignet für stetige Merkmale mit metrischem Messniveau
  • insbesondere bei Klassen mit unterschiedlicher Breite sollte auf der Ordinate die

Häufigkeitsdichte abgetragen werden

  • die Wahl der Klassenanzahl/Klassenbreite kann wesentlichen Einfluss auf das Aussehen der Grafik haben und unterliegt einer gewissen Willkür

 

 

  • Boxplot:

Boxplots visualisieren die Quantile des Merkmals. Es wird eine Box gezeichnet, die durch das untere und das obere Quartil begrenzt wird. In der Box wird die Position des 50%-Quantils durch eine Linie markiert. Von den Enden der Box wird eine Linie zum Minimum und auf der anderen Seite zum Maximum gezogen. Diese Linien werden als „Whisker“ („Schnurrhaare“) bezeichnet. Ein Boxplot visualisiert somit in kompakter Form die Position von Minimum, 25%-Quantil, 50%-Quantil (bzw. Median), 75%-Quantil und Maximum. Aufgrund der platzsparenden Form der Darstellung lassen sich mit Hilfe von Boxplots problemlos mehrere Merkmale vergleichen.

 

Das hier verwendete Beispiel vergleicht die Verteilung der Größe von männlichen und weiblichen Befragten des ALLBUS-Datensatzes.

 

 

 

Anwendungshinweise:

• geeignet für Merkmale mit ordinalem oder metrischem Messniveau

• sehr gut geeignet, um mehrere Merkmale miteinander zu vergleichen oder die Ausprägungen eines Merkmals separiert nach einer Gruppierungsvariable zu betrachten

• aus dem Boxplot können unmittelbar der Median (bzw. das 50%-Quantil) und der

IQR (über die Länge der Box) abgelesen werden

 

Einige Statistikprogramme prüfen nach einer bestimmten (aber nicht einheitlichen) Regel, ob Beobachtungen am Rand der Verteilung als Extremwerte einzustufen sind. Fällt die Prüfung positiv aus, werden diese Beobachtungen als einzelne Punkte gekennzeichnet und die Whisker lediglich bis zu den äußeren Beobachtungen gezogen, die nicht als Extremwerte eingestuft wurden.

 

Beispielsweise in der Statistik-Software R wird unter Standardeinstellung die Länge des Whiskers beschränkt durch den Wert des 1,5 fachen IQRs (Ausreißerregel von Tukey). Kleinere und größere Werte werden dann als Ausreißer angesehen und als Punkte außerhalb der Whiskers gekennzeichnet (vergleiche ABBILDUNG…).

 

 

 

 

 

Streudiagramm

Kontingenztabellen (Abschnitt 2.2 LINK) sind geeignet, um den Zusammenhang zwischen zwei diskreten Merkmalen zu untersuchen. Für die Untersuchung von Zusammenhängen zwischen stetigen Merkmalen eignen sich Kontingenztabellen jedoch nicht. Das Streudiagramm ist in diesem Fall die richtige Wahl. Aus dem vorliegenden Datensatz werden Punkte in ein Koordinatensystem gezeichnet, wobei auf der Abszisse die Größe in Zentimeter und auf der Ordinate das Gewicht in Kilogramm aufgetragen ist. Das so entstandene Streudiagramm zeigt den zu erwartenden Zusammenhang zwischen Größe und Gewicht wieder.

 

 

 

 

 

Sofern man davon ausgeht, dass zwischen den im Streudiagramm dargestellten Merkmalen auch ein kausaler Zusammenhang besteht, ist es üblich, das Merkmal von dem der Einfluss ausgeht (das sog. „unabhängige Merkmal“) auf der Abszisse und das Merkmal, welches beeinflusst wird („abhängiges Merkmal“) auf der Ordinate abzutragen.

 

 

 

 

 

 

 

Abweichung

Abbildungen können und sollten über Infoboxen verfügen. Die Infobox besitzt den selben Titel wie die Abbildung. In dieser Box können Quellenangaben und weitere Informationen enthalten sein.

Unterhalb der Infobox können und sollten die Verweise zu den Dateien (Daten, Skripte und dem Bild selbst) auftauchen.

Bildergalerie

  • Keine Stichwörter