Versionen im Vergleich

Schlüssel

  • Diese Zeile wurde hinzugefügt.
  • Diese Zeile wurde entfernt.
  • Formatierung wurde geändert.

SAS steht für Statistical Analysis System. SAS ist ein professionelles, auf einer Kontrollsprache basierendes, modulares Programmpaket. Neben dem Basismodul sind hier folgende Module von Interesse: STAT (allgemeine Statistik), ETS (Economic Time Series Analysis für Ökonometrie), IML (Matrix Sprache) sowie GRAPH (Graphik). SAS verarbeitet auch sehr große Datensätze aufgrund einer effizienten Virtual Memory Verwaltung. SAS besitzt eine klar gegliederte Programmstruktur und Dokumentation, die auch online zugänglich ist. Die Dokumentation beinhaltet eine formelmäßige Beschreibung der verwendeten Algorithmen und Verweise auf wissenschaftliche Literatur. SAS findet eine breite Anwendung in der Biometrie, im Data Mining und in Großfirmen. SAS ist die Standardsoftware in der amtlichen Statistik sowie in etlichen Verwaltungen.

Inhaltsverzeichnis

Inhalt
maxLevel2
excludeInhaltsverzeichnis|Bildergalerie

Betriebssysteme

An der FU existiert eine Lizenz für Windows Betriebssysteme. SAS 9.4 läuft unter 64-Bit Rechnern. SAS 9.2 läuft sowohl unter 32-Bit als auch 64-Bit Rechnern. Das webgestützte SAS-Studio läuft auf jeder Plattform. Die University Edition läuft eingebettet in einer virtuellen Umgebung ähnlich dem SAS-Studio.

Zugang und Lizenzierung

FU-Angehörige (Studierende und Mitarbeiter) erhalten einen Zugang zur SAS Landeslizenz über dieses Portal. Nach Durchschreiten des Portals hat man den Icon ''Software'' zu wählen. Bis zur vollständigen Umstellung auf das Software-Portal laufen Bestellungen noch über den Benutzerservice.

Um Zugang zum kostenfreien SAS-Studio unter dem Stichwort ''SAS for Academics'' und der ebenfalls kostenfreien University Edition zu erhalten, muss man sich zunächst bei SAS ein Nutzerprofil erstellen. Hierzu wird die Angabe einer E-Mail-Adresse und des Nutzernamens sowie die Festlegung eines Passwortes benötigt. Mit dem SAS-Nutzerprofil kann man sich auch bei SAS-Kursen (SAS for Academics) einschreiben. Manchmal ist ein SAS-Nutzerprofil auch notwendig, um einen Zugang zu Schulungsvideos zu erhalten. Dozenten, die Kurse über das webbasierte SAS-Studio anbieten, senden ihren Teilnehmern ein Einladungsschreiben mit Zugangsinformationen. Die hierfür notwendigen Informationen erhalten die Dozenten bei der Einrichtung des Kurses zusammen mit dem folgenden dokumentierten Einladungsschreiben. Ein Video über die Nutzung des SAS-Studios findet man unter ''Free Training'' bei der University Seite.

PDF
nameInvitation_Letter.pdf

 

Beratung und Benutzerforen

Beratungen bei Problemen mit SAS bietet fu:stat an. Nutzer der Landeslizenz können außerdem die SAS-Hotline in Heidelberg kontaktieren. Darüber hinaus gibt es ein akademisches Nutzerforum.

 

Buchdarstellungen

Eine nützliche Beschreibung von SAS bietet Krämer et al (2014): Datenanalyse mit SAS. Das Buch ist an der FU als E-Book verfügbar.

 

Spezifika des Programmpakets

Die Online-Dokumentation, online verfügbar, erschließt am besten den großen Funktionsumfang von SAS. Kernelemente sind die Procedures, deren Namen auf das Einsatzgebiet verweisen. So verweist PROC REG auf Regressionsanalysen und PROC GENMOD auf verallgemeinerte lineare Modelle. Dabei gibt es auch Überschneidungen. Aus diesem Grund enthält die Dokumentation auch Zusammenfassungen, welche Prozeduren für welches statistische Problem genutzt werden können und wie sich die einzelnen Prozeduren dabei unterscheiden. Diese Zusammenfassungen sind für die Erschließung des Analysepotentials von SAS ausgesprochen nützlich. Eine Übersicht der dort angebotenen Zusammenfassungen findet man in folgender Tabelle.

Anker
nutzerdoku
nutzerdoku

Überblickskapitel in der SAS-Nutzerdokumentation

     Statistical Modeling

     Regression Procedures

     Analysis of Variance Procedures

     Mixed Modeling Procedures 

     Bayesian Analysis Procedures

     Categorical Data Analysis Procedures

     Multivariate Procedures 

     Discriminant Procedures 

     Clustering Procedures   

     Survival Analysis Procedures

     Survey Sampling and Analysis Procedures

     Nonparametric Analysis

     Structural Equation Modeling with Latent Variables

 

Innerhalb der Beschreibung jeder Prozedur wird ein gleichbleibendes Schema benutzt:

  • Charakterisierung der Prozedur und Abgrenzung zu alternativen Prozeduren
  • Ein einführendes Beispiel (''Getting Started'')
  • Syntax der Prozedur
  • Rechnerische Details
  • Weitere Beispiele
  • Literaturangaben

Datensätze und Programmcode aller Beispiele finden sich in der sogenannten SAS-Sample-Library. Diese Beispiele sind allerdings nur innerhalb des SAS-Programms verfügbar, wenn man unter dem Help-Button den Unterpunkt ''Learning to use SAS'' aufruft. Die Beispielprogramme sind nach den jeweiligen Prozeduren sortiert. Sie können von dort per Copy and Paste in den Programmeditor geladen werden.

Neben diesen fertigen Auswertungsroutinen verfügt SAS über ein eigenes Matrixmodul (Interface Matrix Language = IML). Dieses Modul befindet sich auch in der University-Edition. In dieser Umgebung können eigene Schätzverfahren mit der Hilfe von Matrixoperationen programmiert werden. Alternativ können R-Programme über die Procedure R in SAS-Programme integriert werden.

SAS trennt strikt die Erstellung neuer Datensätze im so genannten Data Step von der Auswertung eines bestehenden Datensatzes mittels einer Procedure. Es besteht ebenfalls die Möglichkeit, die Datensprache SQL (Sequential Query Language) für die Erzeugung und Verknüpfung von Datensätzen zu nutzen, siehe PROC SQL. SQL ist im Base-Modul auch in der University-Edition verfügbar.

Ähnliche Programmteile können über die SAS-Macrosprache in effizienter Weise strukturiert werden. Ein SAS-Macro kann als ein Unterprogramm aufgefasst werden, das durch Eingabe- und Ausgabeparameter definiert wird. Bei Simulationsstudien wird man die Parameter der Simulationsläufe zweckmäßigerweise über Macrovariablen definieren. Die Macro-Syntax wird im Base-Modul unter ''Macro Language Reference'' beschrieben.

SAS verfügt über eine effiziente virtuelle Memory Verwaltung, die Memory Blöcke auf die Platte auslagert, ohne dass dies vom Benutzer explizit gesteuert wird. Aus diesem Grund steht SAS in dem Ruf, auch sehr große Datensätze verarbeiten zu können. Für die meisten Promotionsarbeiten, die in der Regel mit eher kleinen Datensätzen arbeiten, ist dies mehr ein theoretisches Problem.

 

 

Analysediagramm

Info
titleAnalysediagramm

Dies ist ein Analysediagramm des Enterprise Miner mit dem Datensatz Insurance als Basis.

Einführung SAS-Studio

 

Bildergalerie

Galerie