- Created by Ann-Kristin Kreutzmann, last modified by Benedict Günter on 18.07.2024
Im Gegensatz zu vielen Statistikbüchern, in denen "nur" anschauliche Beispiele gegeben werden können, soll fu:stat thesis dazu motivieren, Methoden und Beispiele selbst nachvollziehen zu können. Dafür stellen wir einfache Datensätze zum Üben zusammen, welche in den unterschiedlichen Dateiformaten zur Verfügung stehen. Somit können die Datensätze in allen beschriebenen Statistikprogrammen genutzt werden. Die Idee ist, dass nicht nur die Daten zur Verfügung gestellt werden, sondern auch Programmcodes, die zum Nachstellen der Beispiele notwendig sind. Für eine umfangreiche Auswahl an weiteren Datensätzen verweisen wir hiermit auf die UCI Machine Learning Repository.
Inhaltsverzeichnis
fu:stat bietet regelmäßig Schulungen für Hochschulangehörige sowie für Unternehmen und weitere Institutionen an. Die Inhalte reichen von Statistikgrundlagen (Deskriptive, Testen, Schätzen, lineare Regression) bis zu Methoden für Big Data. Es werden außerdem Kurse zu verschiedenen Software-Paketen gegeben.
Umfragedatensatz (Version 1)
Der Datensatz Umfragedaten_v1 enthält 17 Variablen von 3471 Befragten. Dabei handelt es sich um soziodemographische Variablen wie das Geburtsjahr, Geschlecht oder das Netto-Einkommen. Diese 17 Variablen sind eine Auswahl aus der allgemeinen Bevölkerungsumfrage der Sozialwissenschaften 2014 (ALLBUS 2014). Je nach dem, mit welchem Programm gearbeitet werden soll, bieten sich unterschiedliche Dateiformate an. Der Datensatz Umfragedaten wird hier in den Dateiformaten .xlsx, .txt, .RData, .dta, .sd2 und .sav angeboten. Excel-Dateien können im Allgemeinen in jedes Statistikprogramm importiert werden, aber genauere Informationen zu den Dateiformaten für die Statistikprogramme finden Sie hier. Da die Variablennamen in den Dateiformaten .sd2 und .sav für SAS und SPSS beim Export aus R eine Länge von 8 Zeichen nicht überschreiten durften, unterscheidet sich der Datensatz in diesen beiden Dateiformaten in den Variablennamen von den anderen Dateiformaten.
Im Datensatz Umfragedaten sind Variablen unterschiedlicher Messniveaus zu finden. Dabei handelt es sich beispielsweise um metrische Variablen wie die Größe oder um kategoriale Variablen wie das Geschlecht oder der Schulabschluss. Dabei gibt es beim Geschlecht zwei Ausprägungen (männlich/weiblich) und beim Schulabschluss sieben verschiedene Ausprägungen. Alle Informationen über die Variablen, die im Datensatz enthalten sind, können einem sogenannten Codebook (siehe Downloads) entnommen werden. Für den vorliegenden Datensatz wird dieses zusammengesetzt aus Abschnitten aus dem ALLBUS 2014 - Variable Report und eigener Beschreibungen für editierte Variablen. In den Beschreibungen werden auch die Fragestellungen aus dem zugrunde liegenden Fragebogen genannt. Darüber hinaus ist der Datensatz bereits bereinigt. Das heißt in diesem Fall, dass alle Angaben wie Keine Angabe, Weiß nicht oder Trifft nicht zu als fehlend kodiert wurden. Dies erleichtert für den Einstieg die Analyse. Grundsätzlich muss dieser Arbeitsschritt im Datenmanagement jedoch vor Analysen bedacht werden, sodass nicht auf Grund der Kodierung unplausible Werte mit aufgenommen werden. Im ALLBUS ist beispielsweise die Kodierung für Keine Angabe beim Nettoeinkommen 99999 und sollte nicht mit einem Einkommen von 99999 Euro verwechselt werden. Der Ausschnitt aus dem Datensatz ermöglicht einen ersten Einblick in den Datensatz.
Es gibt folgende Variablen:
- Angabe zur Identifizierung: ID
- Angaben zur Person: Geschlecht, Geburtsjahr, Größe, Gewicht
- Angaben zur Bildung: Schulabschluss, höchster Berufsabschluss
- Angaben zur Bildung der Eltern: Schulabschluss des Vaters und der Mutter sowie höchster Berufsabschluss des Vaters und der Mutter
- Angaben zur Erwerbstätigkeit: Art der Berufstätigkeit, Arbeitsstunden, Einkommen
- Angaben zur Gesundheit: Arztbesuche und ob man Raucher ist
- Angabe zur Lebenszufriedenheit
File | Modified | |
---|---|---|
File Umfragedaten_v1_an.RData | 18.01.2017 by Felix Skarke | |
Labels |
||
File Umfragedaten_v1_an.dta | 18.01.2017 by Felix Skarke | |
Labels |
||
Text File Umfragedaten_v1_an.txt | 18.01.2017 by Felix Skarke | |
Labels |
||
Microsoft Excel Spreadsheet Umfragedaten_v1_an.xlsx | 18.01.2017 by Felix Skarke | |
Labels |
||
File Umfragedaten_v1_SPSS_an.sav | 18.01.2017 by Felix Skarke | |
Labels |
Ausschnitt aus dem Datensatz Umfragedaten
Ausschnitt aus dem Datensatz Umfragedaten
Diese Übersicht des Datensatzes Umfragedaten ist erstellt worden mit dem Browse Befehl in der Statistiksoftware Stata.
In den Zeilen stehen die unterschiedlichen ID's, also jede Beobachtung wird in einer Zeile festgehalten. In den Spalten sind die unterschiedlichen Variablen zu finden.
Die allgemeine Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS)
ALLBUS ist eine Querschnittsbefragung, d.h. die Befragung findet mit genau diesen Befragten nur einmal statt. Dabei ist der Pool der Befragten repräsentativ für die Bevölkerung in Deutschland. Die ALLBUS-Daten liefern Informationen über Einstellungen, Verhaltensweisen und soziodemographischen Hintergrund der Befragten. Alle zwei Jahre werden repräsentative Querschnitte erhoben, welche jedoch nicht wie bei einer Panelbefragung miteinander verknüpft werden können.
Der ALLBUS 2014-Datensatz ist mit 861 Variablen sehr umfangreich und bietet daher die Möglichkeit, viele verschiedene Aspekte zu analysieren. Wer daher über die kleine Auswahl an Variablen in dem Umfragedatensatz hinaus mit dem ALLBUS arbeiten möchte, kann sich bei GESIS für den Zugang zum Datensatz registrieren. Die Registrierung ist kostenlos und für jeden möglich, der zu Forschungs- oder Lehrzwecken bzw. Lernzwecken den ALLBUS nutzen möchte.
GESIS Datenbestandskatalog
Nach der Registrierung kann die Suche genutzt werden, um zum entsprechenden Datensatz zu kommen. Wenn nur nach ALLBUS gesucht wird, werden einem auch die Verknüpfungen zu ALLBUS Umfragen aus früheren Jahren zur Verfügung gestellt.
Suchergebnis: ALLBUS
Neben dem Datensatz bietet GESIS auch hilfreiche Dokumente - z.B. die Fragebogendokumentation oder das Codebook - für den erfolgreichen Umgang mit dem ALLBUS Datensatz an.
File | Modified | |
---|---|---|
PDF File ALLBUS_2014_Fragebogendokumentation.pdf | 15.10.2015 by Ann-Kristin Kreutzmann | |
Labels |
||
PDF File ALLBUS_2014_Variable Report.pdf | 15.10.2015 by Ann-Kristin Kreutzmann | |
Labels |
||
Text File ALLBUS_2014_Variablenliste.txt | 15.10.2015 by Ann-Kristin Kreutzmann | |
Labels |
Angebot zum ALLBUS 2014
Bildergalerie
- No labels