SAS steht für Statistical Analysis System. SAS ist ein professionelles, auf einer Kontrollsprache basierendes, modulares Programmpaket. Neben dem Basismodul sind hier folgende Module von Interesse: STAT (allgemeine Statistik), ETS (Economic Time Series Analysis für Ökonometrie), IML (Matrix Sprache) sowie GRAPH (Graphik). SAS verarbeitet auch sehr große Datensätze aufgrund einer effizienten Virtual Memory Verwaltung. SAS besitzt eine klar gegliederte Programmstruktur und Dokumentation, die auch online zugänglich ist. Die Dokumentation beinhaltet eine formelmäßige Beschreibung der verwendeten Algorithmen und Verweise auf wissenschaftliche Literatur. SAS findet eine breite Anwendung in der Biometrie, im Data Mining und in Großfirmen. SAS ist die Standardsoftware in der amtlichen Statistik sowie in etlichen Verwaltungen.

Inhaltsverzeichnis

fu:stat bietet regelmäßig Schulungen für Hochschulangehörige sowie für Unternehmen und weitere Institutionen an. Die Inhalte reichen von Statistikgrundlagen (Deskriptive, Testen, Schätzen, lineare Regression) bis zu Methoden für Big Data. Es werden außerdem Kurse zu verschiedenen Software-Paketen gegeben. 

Statistische Methoden und Bedienkonzept

Die Online-Dokumentation erschließt am besten den großen Funktionsumfang von SAS. Kernelemente sind die Procedures, deren Namen auf das Einsatzgebiet verweisen. So verweist PROC REG auf Regressionsanalysen und PROC GENMOD auf verallgemeinerte lineare Modelle. Dabei gibt es auch Überschneidungen. Aus diesem Grund enthält die Dokumentation auch Zusammenfassungen, welche Prozeduren für welches statistische Problem genutzt werden können und wie sich die einzelnen Prozeduren dabei unterscheiden. Diese Zusammenfassungen sind für die Erschließung des Analysepotentials von SAS ausgesprochen nützlich. Eine Übersicht der dort angebotenen Zusammenfassungen findet man in folgender Tabelle.

Überblickskapitel in der SAS-Nutzerdokumentation

     Statistical Modeling

     Regression Procedures

     Analysis of Variance Procedures

     Mixed Modeling Procedures 

     Bayesian Analysis Procedures

     Categorical Data Analysis Procedures

     Multivariate Procedures 

     Discriminant Procedures 

     Clustering Procedures   

     Survival Analysis Procedures

     Survey Sampling and Analysis Procedures

     Nonparametric Analysis

     Structural Equation Modeling with Latent Variables


Innerhalb der Beschreibung jeder Prozedur wird ein gleichbleibendes Schema benutzt:

  • Charakterisierung der Prozedur und Abgrenzung zu alternativen Prozeduren
  • Ein einführendes Beispiel (''Getting Started'')
  • Syntax der Prozedur
  • Rechnerische Details
  • Weitere Beispiele
  • Literaturangaben

Datensätze und Programmcode aller Beispiele finden sich in der sogenannten SAS-Sample-Library. Diese Beispiele sind allerdings nur innerhalb des SAS-Programms verfügbar, wenn man unter dem Help-Button den Unterpunkt ''Learning to use SAS'' aufruft. Die Beispielprogramme sind nach den jeweiligen Prozeduren sortiert. Sie können von dort per Copy and Paste in den Programmeditor geladen werden.

Neben diesen fertigen Auswertungsroutinen verfügt SAS über ein eigenes Matrixmodul (Interface Matrix Language = IML). Dieses Modul befindet sich auch in der University-Edition. In dieser Umgebung können eigene Schätzverfahren mit Hilfe von Matrixoperationen programmiert werden. Alternativ können R-Programme über die Procedure R in SAS-Programme integriert werden.

SAS trennt strikt die Erstellung neuer Datensätze im so genannten Data Step von der Auswertung eines bestehenden Datensatzes mittels einer Procedure. Es besteht ebenfalls die Möglichkeit, die Datensprache SQL (Sequential Query Language) für die Erzeugung und Verknüpfung von Datensätzen zu nutzen, siehe PROC SQL. SQL ist im Base-Modul auch in der University-Edition verfügbar.

Ähnliche Programmteile können über die SAS-Macrosprache in effizienter Weise strukturiert werden. Ein SAS-Macro kann als ein Unterprogramm aufgefasst werden, das durch Eingabe- und Ausgabeparameter definiert wird. Bei Simulationsstudien wird man die Parameter der Simulationsläufe zweckmäßigerweise über Macrovariablen definieren. Die Macro-Syntax wird im Base-Modul unter ''Macro Language Reference'' beschrieben.

SAS verfügt über eine effiziente virtuelle Memory Verwaltung, die Memory Blöcke auf die Platte auslagert, ohne dass dies vom Benutzer explizit gesteuert wird. Aus diesem Grund steht SAS in dem Ruf, auch sehr große Datensätze verarbeiten zu können. Für die meisten Promotionsarbeiten, die in der Regel mit eher kleinen Datensätzen arbeiten, ist dies mehr ein theoretisches Problem.




Analysediagramm


Analysediagramm

Dies ist ein Analysediagramm des Enterprise Miner mit dem Datensatz Insurance als Basis.

Betriebssysteme

An der FU existiert eine Lizenz für Windows Betriebssysteme. SAS 9.4 läuft unter 64-Bit Rechnern. SAS 9.2 läuft sowohl unter 32-Bit als auch 64-Bit Rechnern. Das webgestützte SAS-Studio läuft auf jeder Plattform. Die University Edition läuft eingebettet in einer virtuellen Umgebung ähnlich dem SAS-Studio.


Zugang und Lizenzierung

Um Zugang zum kostenfreien SAS-Studio unter dem Stichwort ''SAS for Academics'' und der ebenfalls kostenfreien University Edition zu erhalten, muss man sich zunächst bei SAS ein Nutzerprofil erstellen. Hierzu wird die Angabe einer E-Mail-Adresse und des Nutzernamens sowie die Festlegung eines Passwortes benötigt. Mit dem SAS-Nutzerprofil kann man sich auch bei SAS-Kursen (SAS for Academics) einschreiben. Manchmal ist ein SAS-Nutzerprofil auch notwendig, um einen Zugang zu Schulungsvideos zu erhalten. Dozenten, die Kurse über das webbasierte SAS-Studio anbieten, senden ihren Teilnehmern ein Einladungsschreiben mit Zugangsinformationen. Die hierfür notwendigen Informationen erhalten die Dozenten bei der Einrichtung des Kurses zusammen mit dem folgenden dokumentierten Einladungsschreiben.


Einführungen und Support

Folgendes Video gibt eine Einführung in SAS-Studio.

SAS bietet ein breites Spektrum an Hilfe und Unterstützung. Nutzer der Landeslizenz können außerdem die SAS-Hotline in Heidelberg kontaktieren. Darüber hinaus gibt es ein akademisches Nutzerforum. Videos im Rahmen eine e-learning Kurses über die Nutzung des SAS-Studios findet man nach Registrierung unter ''Free Training'' bei der University Seite.

Eine nützliche Beschreibung von SAS bietet Krämer et al (2014): Datenanalyse mit SAS. Das Buch ist an der FU als E-Book verfügbar.

Eine Übersicht über gebräuchliche Tests und Verfahren mit SAS bietet folgende Website.


Bildergalerie

  • No labels