Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

 

Inhaltsverzeichnis

Inhalt
maxLevel2
excludeInhaltsverzeichnis|Bildergalerie

Formulierung einer Fragestellung

Am Anfang einer empirischen Studie steht eine Theorie oder Fragestellung, die gleichzeitig einen roten Faden für Studienaufbau und Fragebogengestaltung vorgibt. Daraus werden Hypothesen abgeleitet. Daher ist schon beim Formulieren der Fragestellung besondere Sorgfalt  geboten, die sich an folgendem Beispiel gut veranschaulichen lässt.

Beispiel: Formulieren einer Fragestellung

„Lohnt es sich, viel Zeit auf die Vorbereitung auf Statistik-Klausuren zu verwenden?“ – das könnte eine typische Fragestellung im Umgang mit Statistik sein. Und obwohl vielleicht die eine oder der andere diese Frage klar für sich beantworten kann, ergeben sich bei näherer Betrachtung doch einige Schwierigkeiten.

 

Zunächst ist schon die Wahl des Studienobjekts bzw. die Wahl der Fragestellung eine sehr subjektive Handlung. Und da gerade die Statistik versucht, möglichst objektiv Zusammenhänge aufzudecken, ist die Motivation dieser Wahl klar herauszustellen. Eine weitere Frage ist dann zum Beispiel, was sich „lohnt“. Und eine andere wie viel Zeit „viel Zeit“ ist. Also ist es notwendig die Frage zu spezifizieren, und hier treffen wir schon auf die zweite subjektive Auswahl: „Führt mehr eingesetzte Zeit zu besseren Ergebnissen?“ könnte eine Spezifikation sein. Aber es gibt sicherlich noch zahlreiche weitere, die genauso richtig oder falsch sind. Zum Beispiel könnte man unter eingesetzter Zeit auch die Vor- und Nachbereitung von Vorlesungen verstehen, die Diskussion mit Kommilitonen, die Verarbeitung im Schlaf etc. Von dieser eher abstrakten Ebene ist es dann notwendig, diese Begriffe zu operationalisieren. D.h. es stellt sich die Frage danach, was „messbar“ bzw. „beobachtbar“ ist. Hier könnte die Wahl auf die Zeit der Klausurvorbereitung und die Vor- und Nachbereitung von Vorlesungen in Stunden fallen. Gleiches sollte für den Lernerfolg geschehen. Das ist ein sehr abstrakter Begriff, und es stellt sich generell die Frage, ob er gemessen werden kann. Ideen hierzu sind die erreichte Note, die erreichten Punktzahlen oder aber eine Selbsteinschätzung.

 

Wir wollen nun jedoch versuchen die oben genannte Frage zu beantworten. Dazu stellen wir zum einen eine Hypothese auf, die ganz klar überprüft werden kann: „Je mehr Zeit aufgewendet wird, desto besser die Note“. Nun fehlt noch die Definition der Note: „Zusammenfassung von erreichten Punkten“. Aus dieser Vorarbeit lässt sich nun endlich eine Erwartung an die tatsächlichen Zahlen formulieren: „Die eingesetzte Lernzeit ist (positiv) korreliert mit der erreichten Anzahl von Punkten“.  

 

Dies sollte keinesfalls zum Abbruch des Forschungsvorhabens führen, sondern uns dazu bewegen einen Blick zurück in die Theorie zu werfen. Was gibt es denn für Faktoren, die den Lernerfolg beeinflussen? Da wären die aufgewendete Zeit, Veranlagung, Vorwissen, Intelligenz usw. All diese Faktoren haben einen positiven Effekt auf den Lernerfolg. Das Verhältnis zwischen diesen Faktoren ist anderer Natur: Meist wenden Personen, die eine hohe Intelligenz besitzen, weniger Zeit fürs Lernen auf, als diejenigen, die eine geringere Intelligenz besitzen. Dieses Verhältnis ist also negativ. Gleiches gilt für das Verhältnis der Veranlagung und aufgewendeter Zeit bzw. des Vorwissens und aufgewendeter Zeit. Es wäre also eine Möglichkeit, unsere bisherige Hypothese zu erweitern und eine der oben genannten Faktoren mit aufzunehmen: „Die eingesetzte Lernzeit ist, bedingt durch das Niveau des IQs, (positiv) korreliert mit der erreichten Anzahl von Punkten“. Die folgende Grafik zeigt uns, dass wir diesmal mit unserer Hypothese goldrichtig liegen.

 

 

Wir lernen also daraus, dass Statistik alleine faszinierende Ergebnisse produziert: „Lernen lohnt sich nicht!“ Rückschlüsse aus statistischen Analysen führen schnell in die Irre, wenn sie nicht durch theoretische Vorüberlegungen motiviert sind oder durch theoretische Überlegungen hinterfragt werden.

Es bleibt festzuhalten:

Eine empirische Arbeit sollte mit einer Forschungsfrage beginnen. Diese wird zuerst durch die Theorie beantwortet, und daraus wiederum Hypothesen abgeleitet. Meist sind mehrfache Revisionen der Hypothesen notwendig, bis daraus überprüfbare Hypothesen geworden sind. Es folgt die Operationalisierung („Messbar- bzw. Beobachtbarmachung“) von Zielgrößen und daraus die Wahl des geeigneten statistischen Verfahrens. Auch der Studienaufbau orientiert sich an den aufgestellten Hypothesen, ebenso die Erhebungsmethode und letztendlich die Erhebung selber. Datenaufbereitung, Auswertung, die Darstellung und Interpretation der Ergebnisse ergeben sich dann zwangsläufig aus den Vorarbeiten.

Die vorgestellten Überlegungen sind unabdingbar für die erfolgreiche Planung und Durchführung einer Umfrage. Diese benötigen nämlich das zeitgleiche Durchdenken der Entwicklung der Fragestellung, der Erhebungsphase und der Analysephase. Auch wenn es schwer fällt, an die Datenauswertung zu denken, bevor überhaupt die erste Information erhoben wurde – genau dies sollte getan werden.

Studienplanung

Aus den zuvor angedachten Schritten lassen sich folgende Fragen für die Studienplanung ableiten:

  •         Welche Informationen sollen erfasst werden?
  •         Wer wird befragt?
  •         Wie viele Personen werden befragt?
  •         Wie kann ich diese erreichen?
  •         …

Es lohnt sich außerdem, schon im Vorhinein über mögliche Schwächen der erhobenen Daten nachzudenken. Man kann sich zum Beispiel fragen, über wen man Aussagen machen kann, wenn man die Personen wirklich erreicht, die man gerne erreichen möchte. Gleichzeitig ist es eine Überlegung wert, ob man schon einen möglichen Selektionsbias entdecken kann, d.h. ob es Mechanismen gibt, die dafür sorgen, dass nur eine ganz spezielle Gruppe von Menschen erreicht wird. Die Schlüsse, die man anhand dieser Daten zieht, gelten in dem Fall nur für diese ganz spezielle Gruppe von Menschen und nicht für die Allgemeinheit. Bei einer statistischen Erhebung ist es im Idealfall möglich, eine Zufallsstichprobe aus der Grundgesamtheit zu ziehen, über die Aussagen gemacht werden sollen. Damit ist es meist gewährleistet, dass die Stichprobe in Bezug auf zahlreiche Merkmale der Grundgesamtheit sehr ähnlich ist. Trifft dies nicht zu, wie es bei selbsterhobenen Daten oft der Fall ist, ist eine gängige Lösung eine sogenannte Randanpassung an soziodemografische Merkmale. Das bedeutet, dass die Beobachtungen der Stichprobe auf eine bestimmte Art und Weise gewichtet werden, so dass sie repräsentativ für die entsprechende Grundgesamtheit ist. Obwohl diese Methode gut geeignet ist, mögliche Verzerrungen der Stichprobe auszugleichen, empfiehlt es sich, durch sorgfältige Planung einer Erhebung, Verzerrung von vornherein zu vermeiden.

Ein weiteres Thema, welches die Qualität der Daten beeinträchtigen kann, sind fehlende Werte. Auch hier ist es sinnvoll, bereits frühzeitig über Ausfallmechanismen nachzudenken, d.h. was zum Fehlen von Werten führen könnte wie z.B. das zufällige Übersehen einer gesamten Frage oder strukturelle Verweigerung des Beantwortens einzelner Fragen. Hierzu kann es durch nicht eindeutige Fragen kommen oder durch Fragen, die ungern beantwortet werden wie z.B. die Frage nach dem Einkommen.  

 

Einflüsse auf Antwortverhalten

Selbst wenn die Umfrage theoretisch gut geplant ist, gibt es immer noch Faktoren wie Abbruch, willkürliches Antwortverhalten und Antworttendenzen, die die Vollständigkeit und Validität von Daten gefährden. Sie werden durch zahlreiche „Befindlichkeiten“ der Respondenten verursacht (ein Überblick findet sich in der angehängten Exceltabelle bzw. auf dem Blog von INWT mit anschaulichen Beispielen. Im Folgenden wird auf drei ausgewählte  Einflüsse detailliert eingegangen:

 

Überforderung tritt aufgrund von schwierigen Wissensfragen auf. Auch missverständliche Fragen können durch Doppeldeutigkeit, Mehrdimensionalität und Fachausdrücke Überforderung verursachen. Einen ähnlichen Effekt haben offene Fragen, zu denen die Befragten keine Idee haben, sich aber verpflichtet fühlen, eine Antwort zu geben. Auch geschlossene Fragen ohne "Weiß nicht"-Kategorie können überfordernd wirken. Fragen zu weit zurückliegenden Ereignissen sind ebenso schwierig zu beantworten.

Beispiele: Fragen, die zur Überforderung führen können

 


  1. Unklare Dimension

Image Added

Problem: Es stellt sich die Frage, ob mit den Randkategorien "vorsichtig" und "optimistisch" zwei Pole einer Dimension getroffen sind. Eindeutigere Gegensatzpaare sind "vorsichtig" und "unvorsichtig" bzw. "optimistisch" und "pessimistisch". Außerdem ist eine neutrale Kategorie sinnvoll, um Häufungen in der nichtssagenden „weiß nicht/ keine Angabe“ Kategorie zu vermeiden. Tatsächlich gibt es Fälle, in denen zunächst mit den Polen "optimistisch" und "pessimistisch" gearbeitet wurde. Im Pre-Test stellte sich heraus, dass die Skala nicht voll ausgeschöpft wird. Eine Erklärung dazu ist, dass der Begriff "pessimistisch" negativ konnotiert ist und sich daher kaum ein/e Respondent/in als "Pessimist" benennen will. Um die Skala besser auszunutzen wurde der Pol "vorsichtig" als Alternative zu "pessimistisch" gewählt.

 

 

 

 Zum Umgang mit Abbildungen und Tabellen

 Format im Text

Abbildungen und Tabellen werden zentriert. Alle Abbildungen besitzen eine Bildüberschrift, die Teil der Abbildung ist. Wenn dies nicht möglich ist, dann wird entsprechend im Wiki-Editor eine zentrierte Überschrift hinzugefügt. Nach Möglichkeit sollten Bilder eine Überschrift als Eigenschaft haben.

Abweichung

 

 

 

 

 

Info
titleAbweichung

Abbildungen können und sollten über Infoboxen verfügen. Die Infobox besitzt den selben Titel wie die Abbildung. In dieser Box können Quellenangaben und weitere Informationen enthalten sein.

Unterhalb der Infobox können und sollten die Verweise zu den Dateien (Daten, Skripte und dem Bild selbst) auftauchen.

Anhänge
previewfalse
uploadfalse
oldfalse
labelsabweichung

Bildergalerie

Galerie