Die Plattform fu:stat:thesis wird von der Statistischen Beratungseinheit fu:stat betrieben, um Doktorandinnen und Doktoranden an der Freien Universität Berlin mit Rat und Tat beim Start des Empirieteils ihrer Promotion zu unterstützen. Die Darstellung gibt unter verschiedenen Themen Hinweise auf Software-Dokumentationen und Videos im Web sowie auf Lehrbücher, die FU-Studierenden als E-Book zur Verfügung stehen. Die Hinweise umfassen alle Statistik-Pakete, die hauptsächlich an der FU genutzt werden: JMP, R, SAS, SPSS und STATA.

Im Vordergrund stehen zunächst Fragestellungen in der Anfangsphase der emirischen Arbeiten. Fortgeschrittene Fragestellungen sollen weiterhin durch eine individuelle Beratung bei fu:stat geklärt werden.

Einleitung

Immer mehr Dissertation enthalten einen empirischen Teil. Die Analyse eines realen Datensatzes stellt den Verfasser bzw. die Verfasserin vor eine Aufgabe, für die sie schlecht gerüstet sind: Die Einführungsveranstaltungen in Statistik liegen schon lange zurück und in der Frühphase des Studiums hat man eher daran gedacht, den ''Schein'' zu erwerben, um sich dann der nächsten Vorlesung zu widmen.

Im Regelfall kann der Doktorand nur auf ein verschüttetes Statistikwissen auf elementarem Level zurückgreifen. Eigenes empirisches Arbeiten mit einem Datensatz ist vorher nie geübt worden. Datenmanagement, Umgang mit fehlenden Werten, Value Labels: Schulterzucken! Hinzu kommt Zeitdruck: Die Projektabgabe steht bevor oder der eigene Vertrag läuft bald aus. Schließlich noch die Ansprüche des Doktorvaters, der auf die empirische Unerfahrenheit des Kandidaten kaum Rücksicht nimmt.

Allerdings verfügen die Doktoranden über eine weitaus höhere Arbeitsroutine als bei Studienbeginn. Auch ist die Arbeitsmotivation – die Anfertigung der Doktorarbeit – um ein Vielfaches höher als wenn es nur darum geht, eine Klausur zu bestehen.

In dieser schwierigen Startsituation möchte das fu:stat:thesis Hilfestellungen geben, die den Doktoranden in die Lage versetzen, den empirischen Teil der ''Diss'' anzugehen. Gerade in der Anfangsphase treten einige Standardsituationen auf, die sich gut eingrenzen lassen, so dass der Hilfe suchende Student gut beraten werden kann.

Im Einzelnen gibt das fu:stat:thesis Hilfestellungen in den folgenden Bereichen:

Die Gliederung einer empirischen Arbeit

Was gehört in die Gliederung?
Formvorgaben für Ergebnisse (Tabellen, Graphiken, zitieren von fremden Datenquellen etc)
Praktische Hinweise für das empirische Arbeiten (Ordnerstruktur, Einbindung von Statistikprogrammen, Kommentaren, Anzahl der parallel genutzten Datensätze, etc. )

Datenmanagement:

In der Regel ist der Datensatz nicht ''ready to use''. Um zu einem auswertbaren Datensatz zu kommen, muss der Doktorand selbst Hand anlegen, ob nun in Excel oder in einem anderen Programm.

nötiges Datenformat für eine Auswertung
Variablenmanipulation
Zusammenführen von Datensätzen
Herausfiltern von Untergruppen

\item (Ulrich Rendtel) Das passende Statistik-Paket finden
       \begin{itemize}
         \item Das Datenformat
         \item Das Niveau des eigenen Statistikverständnisses
         \item Spezielle Erfordernisse der gewünschten Analyse
         \item Benutzerfreundlichkeit
         \item Lizenzgebühren
         \item Schulungen
       \end{itemize}
\item Beschreibung der Statistik-Pakete
        \begin{itemize}
          \item (Ulrich Rendtel) SAS
          \item (Ulrich Rendtel) JMP
          \item R
          \item STATA
          \item SPSS
        \end{itemize}

   \item Die erste Bekanntschaft mit dem Datensatz.
             \begin{itemize}
                 \item Erste deskriptive Auswertungen
                  \item Graphische Übersichten
            \end{itemize}

\item Modellauswahl und Modellgüte

Jede Doktorarbeit wird mehrere statistische Modelle prüfen. Daher wird man von einfachen Standardmodellen zu immer komplexeren Modellen wechseln. Doch wo hört man auf? Welches Modell passt noch zu meinen Daten? Die Beantwortung dieser Frage ist oft entscheidend für den Ausgang der Doktorarbeit, und der Kandidat sollte in der Lage sein, hierauf eine eigene Antwort zu finden. Die Bestimmung eines geeigneten Modells ist keine leichte Aufgabe. Sie steht unter dem Verdikt: ''All models are wrong! But some are more useful than others.''

\item Standardauswertungen

\begin{itemize}
    \item Das Lineare Regressionsmodel
    \item Varianzanalyse (ANOVA)
           \begin{itemize}
             \item ANOVA als Verallgemeinerung des T-Tests auf Mehr-Gruppen-Vergleiche
             \item Annahmen, Durchführung und Graphische Darstellung
              \item Omnibus-F-Test und Post-Hoc-Tests
             \item Kruskal-Wallis-Test als Alternative zur ANOVA
           \end{itemize}
    \item Statistische Tests für Kontingenztabellen (Chi-Quadrat Test, FET, McNemar)
    \item Multiples Testen

    \begin{itemize}
      \item Was ist multiples Testen und warum ist es ein Problem?
      \item Korrekturmöglichkeiten
      \item Konzept der FWER und FDR
    \end{itemize}
    \item Modelle für Cluster- und Paneldaten

    \begin{itemize}
      \item Die Datenformate Long und Wide
      \item Lineare Modelle mit festen und zufälligen Koeffizienten (gemischte Modelle)
      \item Umsetzung in Statistik-Paketen
    \end{itemize}

\end{itemize}

\item Die Gestaltung von Umfragen und ihre Auswertung:

   In vielen Fällen ist für das Promotionsvorhaben eine Umfrage durchzuführen und im zweiten Schritt auszuwerten.

      \begin{itemize}
        \item Fragebogengestaltung: Fehler und Tipps zur Fehlervermeidung
        \item Vom Umgang mit fehlenden Werten
        \item (Ulrich Rendtel) Von der Stichprobe zur Grundgesamtheit: Die Methodik der Stichprobentheorie

      \end{itemize}
\item Studiendesign

      \begin{itemize}
        \item Hypothesenbildung
        \item Studientyp
        \item Gesamtpopulation
        \item Studienpopulation
        \item Stichprobenplan
      \end{itemize}
\end{enumerate}

Es ist das Ziel des Projekts, die Doktoranden in die Lage zu bringen, die empirischen Arbeiten einer Dissertation zu beginnen. Bei einem fortgeschrittenen Arbeitsstand werden auch komplexere Methoden und Modelle zum Einsatz kommen. Allerdings ist es unmöglich, hier auf begrenztem Raum einen Überblick zu geben. Eine empirische Beratung von einzelnen Dissertationsvorhaben sollte dann im Rahmen der Statistischen Beratungseinheit fu:stat durchgeführt werden. Umgekehrt fließen in einzelne Teilabschnitte viele Erfahrungen aus der Tätigkeit von fu:stat ein.

Bereichsverknüpfungen

Seitenhierarchie

Versionen im Vergleich

Alte Version 11

Neue Version 12

Schlüssel

Einleitung

Bereichsverknüpfungen

Seitenhierarchie

Seitenhistorie

Versionen im Vergleich

Alte Version 11

Neue Version 12

Schlüssel

Einleitung