- Created by Ann-Kristin Kreutzmann, last modified by Benedict Günter on 19.07.2024
Das Statistikpaket ist der Werkzeugkasten des empirisch arbeitenden Wissenschaftlers. Kein empirisches Resultat ohne die Benutzung einer geeigneten Auswertungssoftware! Aber welches Paket ist das richtige, das für den Forscher passende? Um beim Beispiel des Werkzeugkastens zu bleiben: Wer einen Hammer zum Einschlagen eines Nagels braucht, wird mit einer vollelektronischen Schlag- und Bohrmaschine unzufrieden sein. Umgekehrt sind nicht alle Handwerksarbeiten mit einem Hammer zu bewältigen.
Die Auswahl des statistischen Werkzeugs – hier der Software – kann unter den folgenden Gesichtspunkten vorgenommen werden.
Inhaltsverzeichnis
fu:stat bietet regelmäßig Schulungen für Hochschulangehörige sowie für Unternehmen und weitere Institutionen an. Die Inhalte reichen von Statistikgrundlagen (Deskriptive, Testen, Schätzen, lineare Regression) bis zu Methoden für Big Data. Es werden außerdem Kurse zu verschiedenen Software-Paketen gegeben.
Das Format des zu analysierenden Datensatzes
Im Prinzip ist der Aufbau eines Datensatzes in jedem Programmpaket gleich: Die Spalten stehen für die Variablen und die Zeilen stehen für die einzelnen Beobachtungen. Aber die Codierung der Einträge variiert von Programmpaket zu Programmpaket. Dies gilt schon für unsere alltäglichen Zahlendarstellungen ohne Softwareeinsatz. In Deutschland ist es üblich, das Komma für die Nachdezimalstellen zu benutzen. International wird jedoch der Dezimalpunkt benutzt. Da alle Statistikpakete international ausgelegt sind, sollte man immer mit Dezimalpunkten arbeiten.
Rechnerintern gibt es aber eine Reihe weiterer Zahlencodierungen, die vom ASCII-Format abweichen. Dies merkt man sofort, wenn man einen Datensatz, der in einem speziellen Statistikpaket erzeugt wurde, mit einem ganz normalen Editor öffnet: Man wird keinen Datensatz erkennen.
Das jeweilige Datenformat erkennt man jeweils an der Extension des Datensatzes. So steht beispielsweise die Extension ''.sav'' für ein SPSS-Datenfile, während ''.xls'' für ein Excel-File steht. Gebräuchliche Extensionen und deren Zuordnung zu Statistikpaketen sind in folgender Tabelle zu finden.
Paket | Extension |
---|---|
.jmp .csv , .txt oder .RData .sd2 (bis Version 6) .sas7bdat (ab Version 7) .sav .dta |
Früher bedeutete die Vergabe eines Datenformats, dass der Datensatz nur mit dem Paket analysiert werden konnte, das das jeweilige Datenformat erzeugt hat. Dies hat sich glücklicherweise geändert. Die meisten Statistikpakete sind heutzutage in der Lage, die gängigen Datenformate der anderen Programme zu verarbeiten. Eine Liste der akzeptierten Formate erhält man über ein entsprechendes Menü während des Einlesens der Daten. Damit herrscht heutzutage eine weitgehende Unabhängigkeit von Datenformat und Analysepaket. In schwierigen Fällen kann man zu einer Datenkonvertierungssoftware greifen, etwa zu STATTRANSFER.
Allerdings ist Vorsicht angebracht und man sollte sich vor der Analyse davon überzeugen, ob der Datensatz im Originalpaket genauso aussieht wie im Analysepaket. Da alle Statistikpakete Excel-Files akzeptieren (allerdings nicht in jeder Excel-Version) und dieser Übergang häufig gewählt wird, sind hier die folgenden Hinweise hilfreich:
- Excel enthält in der ersten Zeile häufig die Variablennamen. Dies muss man einem Statistikpaket mitteilen, da sonst die erste Zeile als Datenzeile interpretiert wird.
- Excel kennt keine Unterscheidung in numerische und nicht-numerische Variablen. Für alle Statistikpakete ist dies jedoch ein wesentlicher Unterschied. Die Entscheidung über den Datentyp der Variablen fällt beim Lesen der ersten Zeile.
- Excel kennt keine Konvention über erlaubte bzw. nicht-erlaubte Zeichen. Umlaute und Sonderzeichen sind hier als Eintrag durchaus erlaubt. Dies gilt nicht für Statistikpakete.
- Man beachte, dass die Nutzung von Dezimalpunkt bzw. Komma häufig über das Windows-Betriebssystem geregelt wird.
Das Niveau des eigenen Statistikverständnisses
Das Vorverständnis der statistischen Methodik variiert sehr stark unter den Nutzern von Auswertungssoftware. Für manche Nutzer bleibt die formelhafte Darstellung eines Schätzverfahrens ein Gräuel, das sofort übersprungen wird, bis man endlich ein aussagekräftiges Beispiel gefunden hat. Umgekehrt ist für einen Anwender, der die Formelsprache der Lehrbücher nachvollziehen kann, ein Open-Source Code in einer Matrix-Sprache leicht und vor allem präzise nachvollziehbar, da hier die Formeln des Lehrbuchs quasi eins zu eins umgesetzt werden.
Die Statistik-Programme präsentieren sich sehr unterschiedlich. Als ''einfach'' gelten Programme mit einer sogenannten Klick-Oberfläche. Der prominenteste Vertreter dieser Gattung ist SPSS. Ein moderner Vertreter ist JMP. Eine Klick-Oberfläche, die auf R basiert, ist der R-Commander. Diese Programme sind ähnlich strukturiert: Im ersten Teil wird ein Datensatz eingegeben, im zweiten Teil werden Teilmengen des Datensatzes definiert, für die im dritten Teil eine Analyse durchgeführt wird. Für den Analyseteil werden meistens die folgenden Ebenen dargeboten:
- Univariate Analysen
- Multivariate Analysen
- Regressionsanalysen
Die folgende Abbildung zeigt das Auswahlmenü nach dem Einlesen eines Datensatzes, hier des Titanic-Datensatzes, im Programmpaket JMP.
Über ein Kontextmenü mit der rechten Maustaste kann man dann die gewünschten Parameter des jeweiligen Verfahrens setzen.
Hinsichtlich des angebotenen Analyseumfangs, der Menüführung und der Parameteroptionen unterscheiden sich die Pakete erheblich. Allen Klickprogrammen ist aber gemeinsam, dass sie auf eine formale Beschreibung der Berechnungsverfahren weitgehend verzichten. Die Dokumentation orientiert sich an der Nutzung von statistischen Schlagwörtern, die der Anwender kennen muss, sowie an Beispielen, die der Anwender für seine Zwecke entsprechend verändern kann.
In SPSS und JMP erzeugt der Nutzer über eine Skriptsprache ein Protokoll seiner Auswertung, das abgespeichert werden kann und so die Reproduzierbarkeit der Analyse gewährleistet. Dies ist ein essentielles Kriterium für wissenschaftliches Arbeiten. Wenn man die Datensätze mit einem Skript fest verknüpft, erhält man eine beispielhafte Anwendung, die man für seine eigene Analyse geeignet modifizieren kann. JMP enthält viele Datensätze mit beispielhaften Auswertungsskripten.
Die Klickoberfläche von JMP
Neben diesen Paketen mit einer Klickoberfläche gibt es Programme, die sich einer Kontrollsprache bedienen. Hierbei wird in einem Editor ein Programmcode geschrieben, bzw. eingelesen, der dann abschnittsweise zur Ausführung gebracht wird. Die Statistikpakete unterscheiden sich hinsichtlich der Syntax erheblich. Aber wer sich einmal an eine Kontrollsprache gewöhnt hat, wird auch sehr schnell Ähnlichkeiten feststellen. Programmpakete mit Kontrollsprache sind SAS, STATA und R. Hierbei unterscheidet SAS streng nach den logischen Ebenen ''Erzeugung eines Datensatzes'' (Data Step) und ''Auswertung eines Datensatzes'' (Procedure). Dies macht die Programme übersichtlicher, allerdings auch etwas länger. SAS und STATA sind keine Open-Source Programme. Allerdings werden die numerischen Details ausführlich dokumentiert. Die SAS-Dokumentation liest sich gerade bei fortgeschrittenen Verfahren wie ein statistisches Lehrbuch.
SAS präsentiert für jede Procedure ein einführendes Beispiel (''Getting Started''), das durch weitere Beispiele ergänzt wird. Sowohl die Beispieldatensätze als auch der Quellcode können vom Nutzer kopiert und für seine eigenen Zwecke modifiziert werden.
Dokumentation der SAS Procedure
Wegen der leichteren Bedienbarkeit von Klickoberflächen stellen SAS und STATA für Standardauswertungen Module bereit, bei denen durch Klickoperationen der entsprechende Code in der Kontrollsprache zusammengestellt wird. Beispielsweise gibt es im SAS-Studio unter dem Icon ''TASK'' eine klassische Menüführung durch Anklicken. Fertige Programm-Schnipsel, die man nach seinen eigenen Bedürfnissen modifiziert, bietet das SAS-Studio unter dem Icon ''Snippets'' an.
R präsentiert sich seinen Nutzern hauptsächlich über ''Packages'', die von ihren Entwicklern für die R-Community bereitgestellt werden. Die vom R-Core Team erstellten Routinen arbeiten in der Regel ausgezeichnet. Die von den Nutzern des R-Kerns erstellten Packages sind qualitativ und dokumentationsmäßig sehr unterschiedlich. Aber man hat den großen Vorteil, schnell bei den neuesten statistischen Verfahren zu sein.
In der Publikationsreihe ''USE R!'' wird für einzelne Pakete oder Anwendungsbereiche der statistische Hintergrund zusammen mit Anwendungsbeispielen dargestellt.
Generell sind alle genannten Statistikpakete für einen sehr breiten Anwendungsbereich ausgelegt. Es ist die Entscheidung des Nutzers, wo er sich zwischen Klickoberfläche, Kontrollsprache und Matrixnotation einordnet.
Spezielle Erfordernisse der gewünschten Analyse
Standard-Analysen, wie z.B. univariate Beschreibungen oder Regressionsverfahren, decken alle Pakete mehr oder weniger gut ab. Allerdings haben alle Pakete auch einen speziellen Fokus, der sich teilweise aus ihrem ursprünglichen Anwendungsbereich erklärt.
So ist SPSS in den ''Social Sciences'' entstanden und galt lange als der Standard aller Statistikpakete. SAS ist in der Biometrie entstanden und hat sich in der Business Intelligence, insbesondere im Data Mining, ein zweites Standbein geschaffen. JMP entstand auf einem Mackintosh Betriebssystem und nutzt die exzellenten Grafikmöglichkeiten für interaktive, explorative Datenanalyse. STATA hat sich stark im Bereich der Analyse von Paneldaten engagiert. R entstand als kostenfreie Open-Source Initiative, die fast alle in der Literatur behandelten statistischen Modelle schnell über Packages verfügbar macht.
Der Anwender sieht die Sache jedoch umgekehrt. Er möchte ''sein'' Modell mit seinem Datensatz schätzen und sucht nach der geeigneten Software. Da die meisten Programmdokumentationen im Internet frei verfügbar sind, ist dies eine mittlerweile leichte Aufgabe, wenn man die passenden Abfragen findet. Eine Liste der URL-Adressen mit den Programm-Dokumentationen findet man in folgender Tabelle. Innerhalb des Programmpakets geht es über die Help-Funktion noch schneller. Meist erhält man auch ein Programmbeispiel.
Allerdings sei hier davor gewarnt, sich von vornherein auf ein einziges Modell festzulegen. Der Verlauf einer Datenanalyse ist selten vorhersagbar, häufig überraschend ist in vielen Fällen das Anfangsmodell nicht das Endmodell.
Benutzerfreundlichkeit
Der Nutzer eines Statistikpakets braucht zunächst einmal Zugang zu einem Rechner, auf dem die Software installiert ist. In der Regel wird man am liebsten am eigenen Rechner arbeiten. Dazu muss die Software auf dem eigenen Rechner installiert werden.
Besonders komfortabel ist der Zugang über ein Cloud-basiertes Statistik-Paket. Hier braucht man nur einen Zugang über einen Browser. Allerdings muss man dann seinen Datensatz in die Cloud hochladen. Dies kann aus datenschutzrechtlichen Aspekten problematisch sein. Eine attraktive Möglichkeit ist das SAS-Studio, das für Mitglieder von Hochschulen gebührenfrei ist.
Bei einem Promotionsvorhaben wird die benötigte Software in der Regel auf einem Rechner der betreuenden Professur installiert sein. Der PC-Pool des Fachbereichs Wirtschaftswissenschaft der FU verfügt über alle hier präsentierten Statistikpakete. Allerdings haben nicht alle Studierenden der FU einen Zugang zu den Rechnern dieses Pools.
Die Installation eines Statistikpakets auf dem eigenen Rechner wird mittlerweile durch effiziente Installationsprogramme unterstützt, so dass nach 15 bis 30 Minuten die Software auf dem eigenen Rechner läuft. Vorbei sind die Zeiten, in denen man in mühseliger und fehleranfälliger Einzelarbeit bis zu 50 Disketten auf den Rechner kopieren musste.
Neben der eigentlichen Software benötigen SPSS, SAS und JMP noch einen Lizenzschlüssel mit einer jährlichen Gültigkeitsperiode. Bei SPSS ist der Lizenzschlüssel nur für einen bestimmten Rechner gültig. STATA kennt keine Gültigkeitsperioden. Allerdings müssen Programm-Updates hinzugekauft werden. R kennt keine Lizenzen.
Unter Benutzerfreundlichkeit versteht man im engeren Sinne die Gestaltung der Nutzeroberfläche. Hier sind zunächst die Klickprogramme im Vorteil. Man kann sofort starten: Datensatz einlesen, Analyse auswählen, Parameter setzen, Ergebnis sichten und interpretieren, fertig! Allerdings wird man bald feststellen, dass so eine graphische Benutzeroberfläche erstaunlich vielschichtig ist und sich dem Benutzer erst allmählich erschließt, was das Softwarepaket alles kann, bzw. nicht kann.
Ganz anders präsentieren sich die Programmpakete, die auf einer Kontrollsprache basieren. Hier blickt der Nutzer auf vier zunächst leere Bildschirmfelder: den Programm-Editor, das Output-Fenster, das Log-Fenster und das Graphik-Fenster. Insbesondere das Log-Fenster kann mit seinen Meldungen über die Größe der benutzten Datenfiles, die aufgetretenen Missings bei Rechenoperationen, sowie den Hinweisen zu Fehlern bei der Programmsyntax ausgesprochen hilfreich sein. Die Log-Meldungen bei SAS sind in den meisten Fällen sehr instruktiv. Die Abbildung zeigt die SAS-Kontrollfenster nach Ausführung der Procedure Contents, die alle Variablen des eingelesenen Datensatzes (hier MU284) auflistet.
SAS Kontrollfenster
SAS Kontrollfenster
Gezeigt wird das SAS Kontrollfenster nach der Ausführung der Procedure Contents für den Datensatz MU284.
Da den Programmpaketen, die auf einer Kontrollsprache basieren, das strukturierende Element einer Klickumgebung fehlt, sind sie in viel stärkerem Maße auf eine gute Programmdokumentation angewiesen. Diese Lücke wird teilweise von separaten Buchdarstellungen gefüllt, die eine meist knappe Einführung in die Syntax der Kontrollsprache mit einem Überblick über den Leistungsumfang der wichtigsten Auswertungsroutinen verbinden.
Paket | Autor und Titel | E-Book |
---|---|---|
STATA | Wollschläger (2012): Grundlagen der Datenanalyse mit R Krämer et al (2014): Datenanalyse mit SAS Janssen/Laatz (2013): Datenanalyse mit SPSS Kohler/Kreuter (2012): Datenanalyse mit STATA | ja ja ja nein |
JMP | Meintrup (2018): Angewandte Statistik. Eine Einführung mit JMP | Link |
Die in obiger Tabelle aufgeführten Darstellungen können - bis auf eine Ausnahme- als E-Book gelesen werden. Im Universitätsportal PRIMO erhält man nach Eingabe des Autors und des Titels den Hinweis ''Online verfügbar''. Dieser Hinweis ist mit einem Link unterlegt, der einen auf die entsprechenden Seiten des jeweiligen Verlags führt.
Wichtig: Die Online-Leserechte sind an die FU-Mitgliedschaft gebunden. Diese wird über die IP-Adresse bei der Abfrage verifiziert. Wer eine solche Abfrage von dem heimischen Rechner startet, muss sich vorher über die VPN-Verbindung zur ZEDAT als FU-Angehöriger verifiziert haben.
Allerdings hat sich die Qualität der internen Programmdokumentationen erheblich verbessert. Geradezu vorbildlich ist die Online-Dokumentation von SAS, die auch im Internet frei zugänglich ist. Hier wird zu jeder Procedure (SAS-Slang für Auswertungsroutine) eine Einordnung in die Nomenklatur der Statistik gegeben. Es folgt ein einführendes Beispiel mit einer Erklärung der Bedeutung des Outputs. Unter Syntax werden systematisch alle Parametersetzungen der Prozedur sowie deren Voreinstellungen beschrieben. Es folgen ''Computational Details'' mit einer formalmäßigen Darstellung der Schätzverfahren. Je nach Komplexität der Prozedur werden weitere Anwendungsbeispiele vorgestellt. Den Abschluss bilden Hinweise auf statistische Lehrbücher und Zeitschriftenartikel. Es ist dieses systematische Ordnen und Darstellen, die die als Dinosaurier totgesagten Programmpakete am Leben erhalten.
R stellt in dieser Hinsicht den anderen Pol der Skala dar. Jedes Package ist so gut dokumentiert, wie es dem jeweiligen Autor gefiel. Es gibt kein einheitliches Gliederungsschema. Allerdings versucht die R-Community mittlerweile, der Unübersichtlichkeit der R-Packages Herr zu werden. Unter CRAN Task Views findet man zusammenfassende Darstellungen, welche Pakete unter bestimmten Themenstellungen relevant sind. Es werden folgende Themen angeboten:
Bayesian Clinical Trials Cluster Distributions Econometrics Graphics Multivariate Official Statistics Robust SocialSciences Spatial SpatioTemporal Survival Timeseries WebTechnologies |
---|
Eine wichtige Dimension der Nutzerfreundlichkeit ist die einfache Verwaltung und Weiterverarbeitung des Outputs. Graphiken und Tabellen sollen Eingang finden in die Doktorarbeit. Eventuell sollen einzelne Elemente, z.B. Scatter-Plots oder Box-Plots, zu einer mehrelementigen Graphik vereinigt werden. Schließlich nutzen Doktoranden umso lieber die Textverarbeitung mit Latex, je mehr Formeln dargestellt werden. Es kann eine kostenfreie Textverarbeitung geladen werden. Aber wie transportiert man größere Tabellen des Outputs in das Latex-Format?
Ein historischer Blick zurück offenbart die Steinzeit der ''Nutzerfreundlichkeit'': Es gab ein Output-File im Druckerformat. Wer Tabellenwerte weiter verarbeiten wollte, schrieb sie noch einmal ab. Das war zeitraubend und fehleranfällig.
Für fertige Graphiken und Tabellen kommt man mittlerweile mit Copy and Paste schnell voran, wobei in der Regel zwischen verschiedenen Outputformaten (z.B. RTF, PDF, JPEG und PNG) gewählt werden kann. Bei den Klickprogrammen ist ein Journal-File nützlich, auf dem man die wichtigsten unter den vielen, vielen Outputs sichert.
SAS bietet die Möglichkeit, den gesamten Output über das sogenannte Output Delivery System (ODS) zu steuern. Wer seinen Output gerne im Rich-Text-Format (RTF), als PDF- oder als HTML-File haben will, kein Problem! Mit der Befehlssequenz
wird der Output der SAS-Kommandos auf das angegebene File im RTF-Format geschrieben. In R kann man mit dem Package ''Sweave'' Latex-Code für die Erstellung von Tabellen erzeugen.
Ein wichtiger Aspekt der Nutzerfreundlichkeit eines Statistikpakets offenbart sich in Situationen, in denen man nicht mehr weiter weiß und guter Rat teuer ist. Trotz aller guten Dokumentationen! Diese Augenblicke können kommen.
Wenn ein Statistik-Paket an einer Professur häufig genutzt wird, wird man zunächst seine Kollegen fragen. Weiterhin bietet fu:stat Unterstützung für alle hier behandelte Programmpakete an. Für die wirklich hartnäckigen Probleme sollte man die Hotline des jeweiligen Pakets anrufen (für SAS und JMP habe ich das selbst getestet). Wer es lieber über das Internet mag, kann Rat und Tat über die diversen Nutzer-Communities einholen, z.B. bei hier bei SAS.
Eine aktive User Group im akademischen Bereich ist ein großer Aktivposten von STATA. Hier erhält man Links zu STATA-spezifischen Facebook Gruppen, Email Listen und YouTube Videos. Bei R lohnt es sich manchmal, den Autor des jeweiligen Packages anzumailen.
Nicht zuletzt bieten einige Statistikpakete eine gewisse Durchlässigkeit zu anderen Programmpaketen. Dies ist immer dann sinnvoll, wenn man in der gewohnten Programmumgebung Auswertungen durchführen möchte, die nur mit einem anderen Programmpaket realisierbar sind. So kann man beispielsweise von JMP aus SAS und R Programme starten. SAS bietet mit der Procedure R eine Schnittstelle zur R-Welt. Natürlich müssen die angeforderten Programme auf dem Rechner verfügbar sein, da intern diese Programme aufgerufen werden. Insgesamt sind diese Schnittstellen sehr hilfreiche Brücken zwischen der geordneten Welt der Statistik-Standardprogramme und dem üppig wuchernden R-Dschungel.
Abschließend noch eine Bemerkung zur Verknüpfung von Excel mit den Statistikpaketen. Obwohl Excel für viele, vielleicht sogar die meisten Doktoranden der Ausgangspunkt für ihre empirischen Analysen ist, sollte man nicht vergessen, dass Excel von seinem Ursprung her ein Tabellenkalkulationsprogramm ist. Excel ist kein Statistikpaket! Trotz einiger eingebauter Statistikfunktionen bleiben statistische Auswertungen mit Excel immer umständlich. Wer es trotzdem versuchen will, schlage bei Zwerenz (2007) ''Statistik verstehen mit Excel'' nach.
Viele Nutzer möchten jedoch nicht auf die ihnen vertraute Nutzeroberfläche insbesondere beim Datenmanagement verzichten. Für diese Nutzer sind die folgenden beiden Optionen interessant: Das R-Paket REXCEL bietet eine Schnittstelle zu R, die innerhalb von Excel genutzt werden kann. Bei der Installation von JMP kann ebenfalls eine Schnittstelle zu JMP innerhalb von Excel eingerichtet werden, so dass man direkt aus Excel auf das JMP-Menü zugreifen kann.
Lizenzgebühren
Das Statistikpaket ist das notwendige Handwerkszeug, mit dem der Doktorand die Hypothesen und empirischen Befunde seiner Dissertation absichert. Das sollte ihm schon etwas wert sein. Zum Glück bewegen sich die Lizenzgebühren für dieses ''wissenschaftliche Gerät'' in der Größenordnung eines Schlagbohrers im Baumarkt.
Umsonst sind R, sowie alle unter CRAN gespeicherten R-Packages zu haben. Unter diesem Preisdruck haben die klassischen Statistikpakete zum Teil freie 30-Tage-Testversionen angeboten. Dies gilt beispielsweise für JMP.
JMP steht im Rahmen einer Campus-Lizenz allen FU-Studierenden frei zur Verfügung (Zugang über das Zedat Softwareportal).
SPSS bietet eine 14-tägige Probierversion an.
SAS bietet die unentgeltliche Nutzung einer University Edition und eines Web-basierten SAS-Studios an.
''Umsonst'' ist auch die Nutzung von Statistikpaketen, die in PC-Pools oder auf dem Rechner einer Professur installiert sind. Hier zahlt der jeweilige Fachbereich bzw. die Professur, die die Arbeit betreut.
Wer als FU-Angehöriger eine Lizenz für seine wissenschaftliche Arbeit (kommerzielle Nutzungen sind explizit ausgeschlossen) braucht, kann eine Lizenz über das Software-Portal der Zedat erwerben. Die Verifikation der FU-Mitgliedschaft geschieht über das Eingangsportal. Aktuell gelten die folgenden Lizenzgebühren:
Paket | Lizenzgebühr |
---|---|
Zur Zeit ohne Gebühren für FU-Studierende 109 Euro pro Jahr (Landeslizenz) 62 Euro pro Jahr |
Für STATA existiert keine Campuslizenz. Hier haben sich Nutzergemeinschaften gebildet, die die deutliche Kostendegression mit steigender Anzahl der Lizenzen nutzen. Da keine jährlichen Gebühren erhoben werden, sind die Kosten für eine permanente Lizenzierung deutlich höher. Allerdings sind die Kosten für eine Studentenlizenz mit ca. 138 Euro noch moderat.
Schulungen
Die effiziente Nutzung jeder Software braucht ein gewisses Maß an Routine. Dies gilt auch für Statistikprogramme.
Gerade für die Startphase haben sich Einführungskurse sehr bewährt. Die statistische Beratungseinheit fu:stat bietet ein- bis zweitägige Kurse auf Anfänger- und Fortgeschrittenenniveau für JMP, R, SAS, SPSS und STATA an. Hierbei steht die Vermittlung und aktive Beherrschung der Nutzeroberfläche des jeweiligen Programms im Vordergrund. Einen Überblick über das aktuelle Kursangebot von fu:stat findet man hier.
Für die Nutzung der Programme mit Klickoberfläche bieten sich Videos an, da man hier unmittelbar den Ort und das Resultat der Klickoperationen visualisieren kann.
Für JMP gibt es sehr schöne einführende Videos:
- Unter ''Getting Started With JMP'' werden einige instruktive Einführungsvideos angeboten.
- zusätzlich gibt es eine deutschsprachige Einführung für JMP.
Über die Nutzung des SAS-Studios findet man mehrere Videos:
- Unter der Plattform für die Universitäten findet sich in dem Feld ''Free Training'' ein Link auf ein sehr instruktives Webinar zur Nutzung des SAS-Studios
- Eine Sammlung von YouTube-Videos zur Nutzung des SAS-Studios und weiterer SAS-Komponenten findet sich hier. Insbesondere die Klickoberfläche, die im SAS-Studio unter dem Icon ''Tasks'' für Standardauswertungen angeboten wird, wird in mehreren separaten Videos demonstriert.
In gewisser Weise lassen sich die vielen erläuterten Beispiele in den Programmdokumentationen ebenfalls als Schulung, allerdings sehr spezialisiert, auffassen. Alle SAS-Beispiele können sofort aus der internen SAS-Sample Library in den Programm-Editor kopiert und dort modifiziert werden. Bei JMP sind die meisten internen Datensätze mit ausführbaren Skripts verknüpft, die dann geeignet modifiziert werden können.
Ergänzende Kriterienkataloge
Die hier vorgestellten Beurteilungskriterien für die Wahl eines Statistik-Pakets beziehen sich spezifisch auf Doktoranden an der FU. Ein allgemeinerer Kriterienkatalog für die Anschaffung von Statistik Software wurde von INWT-Statistics, einer Ausgründung von fu:stat, entwickelt, siehe Checkliste für die Anschaffung von Statisik-Software.
Bildergalerie
- No labels