Skip to end of metadata
Go to start of metadata

Das Studiendesign umfasst alle Aspekte der Planung einer Studie. Es ist die Basis für die Beantwortung einer wissenschaftlichen Fragestellung und kann zu einem späteren Zeitpunkt der Studie nicht mehr verändert werden. Aus diesem Grund sollte das Studiendesign vor Beginn der Studie sorgfältig geplant werden.

Inhaltsverzeichnis

fu:stat bietet regelmäßig Schulungen für Hochschulangehörige sowie für Unternehmen und weitere Institutionen an. Die Inhalte reichen von Statistikgrundlagen (Deskriptive, Testen, Schätzen, lineare Regression) bis zu Methoden für Big Data. Es werden außerdem Kurse zu verschiedenen Software-Paketen gegeben. Auf Anfrage können wir auch gerne individuelle Inhouse-Schulungen bei Ihnen anbieten.

Hypothesenbildung

Der erste Schritt bei der Planung des Studiendesigns ist die Formulierung der Fragestellung (auch Hypothese genannt). Diese Hypothese ist eine von Widersprüchen freie, aber zunächst unbewiesene Aussage. Hierfür muss sich der Wissenschaftler über die Ziele seiner Studie im Klaren sein. Sollen beispielsweise mit der Studie offene Fragen beantwortet oder sollen neue Hypothesen generiert werden? Letzteres, also die Identifizierung von Fragestellungen, erfolgt anhand einer deskriptiven Auswertung. Bei dieser Auswertung werden Beobachtungseinheiten durch erhobene Variablen beschrieben. Würden z.B. Daten zum sozialen Status und Erkrankungen bei Kindern erhoben werden, könnten hieraus Hypothesen zu eventuellen Zusammenhängen generiert werden. Im Gegensatz dazu sollen bei der Überprüfung von Hypothesen Zusammenhänge zwischen Variablen erkannt und bewertet werden, beispielweise also der Zusammenhang zwischen dem sozialen Status und einem vermehrten Auftreten von Übergewicht bei Kindern.

Bei der Bildung der Hypothese muss der Wissenschaftler außerdem überlegen, welche Variablen für seine Fragestellung zusätzlich erfasst werden müssen. Ein Hilfsmittel, um ein Problemgeflecht zu visualisieren, ist das Kausaldiagramm. Hiermit können weitere Variablen und auch eventuelle Confounder (Störgrößen) ermittelt werden. In unserem obigen Beispiel wäre also zu überlegen:

WENN Kinder einen gewissen sozialen Status haben -> DANN bestehen bestimmte Essgewohnheiten und

WENN bestimmte Essgewohnheiten bestehen -> DANN erfolgen Erkrankungen bzw Übergewicht.

Die Variable der Essgewohnheiten müsste also in beiden Fällen erhoben werden, in dem ersten Fall würde sie dabei als Zielvariable (oder abhängige Variable) fungieren, in dem zweiten Fall als Einflussvariable (oder unabhängige Variable oder Einflussfaktor). Um zu untersuchen, welche Faktoren die Zielvariable beeinflussen, müssen möglichst alle potentiellen Einflussfaktoren erfasst werden, auch solche, die längst bekannt sind. Die Anzahl der Variablen und Messzeitpunkte sollte dennoch so gering wie möglich gehalten werden, da sonst schon zu Beginn der Erhebung ggf. die Teilnahmebereitschaft niedrig ist (geringe Compliance) oder Teilnehmer während der Studie aussteigen (hohe Drop-out-Rate).

Letztendlich muss die Fragestellung auch noch deutlich konkreter gefasst werden. Wichtig sind deshalb bei der Generierung der Hypothese die sieben W’s: „weshalb, wer, was, wie, wann, wo, wie viele?“ In unserem Fall wäre also genau festzulegen bei welchen Kindern (z.B. Alter), in welchem Gebiet (z.B. Berlin), bei welchem Einflussfaktor (z.B. Essgewohnheiten), in welchem Zustand (z.B. Fast Food), welche Zielgröße (z.B. Übergewicht) mit welcher Messmethode zu welchem Zeitpunkt bestimmt werden soll.

Dabei soll die Hypothese in ihrer Formulierung klar, spezifisch und präzise sein. Sie stellt dabei wertfrei und ohne Widerspruch einen Sachverhalt dar, indem Variablen oder die Relation zwischen Variablen beschrieben werden.

Diese präzise Hypothese muss aber schlussendlich noch in eine empirisch prüfbare Aussage übersetzt werden (Operationalisierung). Das heißt, die Variablen müssen mess- und beurteilbar sein. Die Essgewohnheiten müssen also z.B. in Kategorien eingeteilt werden, und auch die Zielgröße könnte nicht nur als Gewicht angegeben werden, sondern könnte ggf. näher definiert werden (z.B. Verhältnis von Gewicht zur Körpergröße und Einteilung in Normal-, Unter- und Übergewicht). Aus den einzelnen Messgrößen ergibt sich schließlich auch die Wahl der geeigneten statistischen Auswertungsmethode. Des Weiteren wird anhand der Hypothese auch deutlich, welche Erhebungsmethode und welcher Studientyp für die Beantwortung der Fragestellung genutzt werden sollte (Instrumente).


Studientypen

Studien können in die beiden Typen Beobachtungs- oder experimentelle Studien eingeteilt werden.

Bei der Beobachtungsstudie wird eine Stichprobe aus der vorhandenen Population untersucht. Dieser Studientyp beschreibt bestimmte Eigenschaften einer Population, indem z.B. Krankheitshäufigkeiten und das Auftreten bestimmter Risikofaktoren beobachtet werden. Hiermit können die Häufigkeiten bestimmter Ereignisse, z.B. Erkrankungen, einer oder mehrerer Studienpopulationen ermittelt werden. Die Daten werden entweder zu einem definierten Zeitpunkt (Querschnittsstudie, geographische Korrelationsstudie) oder über einen bestimmten Zeitraum hinweg (Kohorten-Studie, Fall-Kontroll-Studie) erhoben.

Experimentelle Studien hingegen wollen eine Intervention (Anwendung oder Veränderung) untersuchen. Hierbei ist die Einteilung der Probanden in die verschiedenen Gruppen (Intervention oder Kontrolle) vor Beginn der Studie von grundlegender Bedeutung für die spätere Aussagekraft der Ergebnisse. Eine Generalisierbarkeit der Ergebnisse ist oft schwieriger, da diese Studien meist sehr spezifische Einschlusskriterien an die Probanden, z.B. gezielt gezüchtete Labortiere, haben, und die Durchführung oft unter kontrollierten Bedingungen stattfindet. Die Darstellung eines speziellen Zusammenhanges ist hingegen mit diesem Studientyp deutlich besser durchführbar.

Im Folgenden werden die einzelnen Studientypen und ihre Vor- und Nachteile anhand von Beispielen weiter erläutert.

Querschnittsstudie
Ziel

Untersuchung der Häufigkeit eines Ereignisses sowie möglicher Einflussfaktoren zu einem definierten Zeitpunkt

Vorteile
  • Darstellung von Eigenschaften der Zielpopulation, z.B. Krankheitshäufigkeit und Häufigkeit bestimmter Risikofaktoren
  • Entwicklung neuer Hypothesen, aber auch hypothesenprüfend
  • Auch für seltene Erkrankungen geeignet -> großer Stichprobenumfang notwendig
Nachteile
  • Momentaufnahme, kein zeitlicher Verlauf
  • Problematisch bei kurzdauernden (akuten) Ereignissen/Krankheiten
  • Bei seltenen Krankheiten müssen sehr viele Individuen untersucht werden
  • Geringe Evidenz für Kausalität (Zusammenhang zwischen Ursache und Effekt)

Maßzahlen
  • Prävalenz (Häufigkeit einer Erkrankung (oder Merkmals) in einer bestimmten Population)
  • Odds Ratio (Chance für das Auftreten einer bestimmten Ausprägung/Krankheit unter Beachtung bestimmter Schutz- und Risikofaktoren)
  • Prävalenzratio (Anzahl der Erkrankten zu einem bestimmten Zeitpunkt im Verhältnis zur Anzahl der untersuchten Personen)
BeispielIn dem Kinder- und Jugend-Gesundheitssurvey (KiGGS-Studie) will das Robert Koch-Institut erstmals repräsentative Daten zum Gesundheitszustand der Bevölkerung unter 18 Jahren sammeln. Hierbei werden 17.000 Kinder im Alter von 0 bis 18 Jahren untersucht und mit ihren Eltern zusammen befragt. Das Themenspektrum umfasst chronische und akute Erkrankungen, die psychische Gesundheit, Allergien, Ernährungsgewohnheiten und Essstörungen, Lebensqualität und soziale Bedingungen der Kinder. Diese Daten bieten eine Grundlage für eine bundesweite Gesundheitsberichterstattung über die nachwachsende Generation und dienen als Basis für gesundheitspolitische Entscheidungen und Prioritätensetzungen. Außerdem werden aussagekräftige Ausgangsdaten für die weitere Beobachtung der gesundheitlichen Entwicklung der Kinder- und Jugendlichen-Generation geschaffen.

Geographische Korrelationsstudie (Ökologische Studie)

ZielMöglichkeit, auf der Ebene von Regionen oder Bevölkerungsgruppen Exposition und Erkrankung retrospektiv in einer Momentaufnahme in Beziehung zueinander zu setzen
Vorteile
  • Vergleich zweier oder mehrerer Bevölkerungsgruppen in unterschiedlichen Regionen hinsichtlich der Häufigkeit des Auftretens bestimmter Faktoren
  • Generierung von Fragestellungen über ursächliche Zusammenhänge
Nachteile
  • Unterscheidung der Gruppen nur bzgl. der Exposition eines Einflussfaktors
  • Bei einer nicht gleichmäßigen Verteilung wichtiger Einflussfaktoren zwischen den Gruppen, wie z.B. Alter (andere Exposition), ist die Wahrscheinlichkeit, falsche Schlüsse zu ziehen sehr hoch

  • Beobachtete Zusammenhänge beruhen auf dem Abgleich durchschnittlicher Expositionen und Erkrankungen in einer Region, nicht auf individuellen, spezifisch für exponierte Personen ermittelten Informationen

Maßzahlen
  • Prävalenz (Häufigkeit einer Erkrankung (oder Merkmals) in einer bestimmten Population)
  • Odds Ratio (Chance für das Auftreten einer bestimmten Ausprägung/Krankheit unter Beachtung bestimmter Schutz- und Risikofaktoren)
  • Prävalenzratio (Anzahl der Erkrankten zu einem bestimmten Zeitpunkt im Verhältnis zur Anzahl der untersuchten Personen)
BeispielEine Forscherin interessierte sich dafür, inwieweit im Rahmen von Hochschulseminaren Witze, die einen Bezug zum Lernstoff haben, die Lernmotivation und den Lernerfolg erhöhen. Sie verglich deshalb zwei von ihr betreute Parallelkurse zur Gesprächsführung. In einem Kurs wurden stoffbezogene Witze gemacht, im anderen Kurs nicht. Am Ende des Semesters wurden Lernmotivation und Lernerfolg in den beiden Gruppen miteinander verglichen.

Kohorten-Studie

ZielProspektive, ggf. historische Untersuchungen von verschiedenen Studienpopulationen, von denen die eine einem Risikofaktor ausgesetzt ist und die andere nicht, läuft über einen definierten Zeitraum (mehrere Untersuchungszeitpunkte); Vergleich der Krankheitshäufigkeiten zwischen den Populationen
Vorteile
  • Beste Evidenz für Kausalität (Zusammenhang zwischen Ursache und Effekt)
  • Untersuchung von Risikofaktoren

Nachteile
  • Confounder (Störfaktoren) können nicht ausgeschlossen werden
  • Nur ein Risikofaktor kann untersucht werden
  • Bei seltenen Erkrankungen müssen die Kohorten groß sein
  • hoher Geld- und Zeitbedarf (lange Beobachtungszeit, viele Teilnehmer, mehrere Erhebungsphasen)

  • Vorsicht bei „Stichprobenverlusten“ (lost cases, Drop-outs)

Maßzahlen
  • Prävalenz (Häufigkeit einer Erkrankung (oder Merkmals) in einer bestimmten Population)
  • Inzidenz (Häufigkeit von Neuerkrankungen (oder Neuauftreten eines Merkmals) in einer bestimmten Population)
  • Odds Ratio (Chance für das Auftreten einer bestimmten Ausprägung/Krankheit unter Beachtung bestimmter Schutz- und Risikofaktoren)
  • Risk Ratio (gibt einen Faktor an, um den sich das Risiko (z.B. für eine Krankheit) zwischen zwei Gruppen unterscheidet)
BeispielIn der „Nurses Health Study“ wurden bis jetzt ca. 238.000 Krankenschwestern seit 1976 alle zwei Jahre auf ihren Gesundheitszustand insbesondere hinsichtlich chronischer Krankheiten untersucht. Hierbei wurden Daten zu Erkrankungen (z.B. Tumore, Herzerkrankungen, Diabetes usw.) erhoben. Mit den Daten konnte bereits nachgewiesen werden, dass Ernährung, physische Betätigung und andere Lebensgewohnheiten eine gute Gesundheit bei Krankenschwestern fördern können.

Fall-Kontroll-Studie

ZielUntersuchung von Risikofaktoren für eine bestimmte Erkrankung; bei Individuen mit (Fälle) und ohne (Kontrollen) Erkrankung wird die Häufigkeit des Vorliegens von Risikofaktoren erfasst
Vorteile
  • Bei seltenen Erkrankungen gut geeignet
  • Moderate Evidenz für Kausalität (Zusammenhang zwischen Ursache und Effekt)
  • hohe Effizienz (spart Zeit und Kosten)
  • vorhandene Daten können genutzt werden
Nachteile
  • häufig fehlende Werte, da Daten bereits vorhanden sind und retrospektiv ausgewertet werden
  • Sorgfältige Auswahl von Kontrollen, die repräsentativ zu den Fällen passen („matching“)
  • nicht gut geeignet bei seltenen oder sehr häufigen Expositionen

MaßzahlenOdds Ratio (Chance für das Auftreten einer bestimmten Ausprägung/Krankheit unter Beachtung bestimmter Schutz- und Risikofaktoren)
BeispielIm Sommer 2011 wurde aufgrund der gehäuften Erkrankungsfälle mit dem Hämolytisch-urämischen Syndrom (HUS) eine Fall-Kontroll-Studie durchgeführt, um die Ursache der Erkrankungen zu finden. Hierfür wurden 26 HUS-Patienten in Krankenhäusern in Bremen, Bremerhaven und Lübeck hinsichtlich ihrer Essgewohnheiten in den letzten Wochen vor Erkrankungsbeginn befragt. Die gematchte Kontrollgruppe (Kontrolle hat gleiches Alter, Geschlecht und Wohnort wie Fall) wurde aus der Nachbarschaft der Fälle generiert. Beim Interview erhärtete sich durch die Ergebnisse der erste Verdacht, dass der Verzehr von kontaminierten Sprossen (bspw. Mungobohnensprossen) eine mögliche Ursache ist.

Randomisierte kontrollierte Interventionsstudie (Klinische Studien)

ZielProspektive Untersuchung von mehreren Gruppen (Intervention/Kontrolle oder verschiedenen Interventionen) hinsichtlich der Häufigkeit des Auftretens bestimmter Ereignisse in einer kontrollierten Umgebung.
RandomisierungNach dem Zufallsprinzip (Randomisierung) werden Probanden/innen durch den Forscher aus einer Population ausgewählt und in zwei Gruppen (Untersuchungsgruppe und Kontrollgruppe) eingeteilt.
VerblindungBeide Gruppen werden einer Interventionsmaßnahme oder Exposition ausgesetzt, meist im Doppelblindverfahren (weder Untersucher noch Proband wissen, welches die verabreichte Behandlung ist)
Vorteile
  • Goldstandard der Epidemiologie

  • systematische Unterschiede zwischen Gruppen durch Randomisierung weitgehend ausgeschlossen

  • sehr gut geeignet, um Kausalität (Zusammenhang zwischen Ursache und Effekt) aufzuzeigen (Kontrollierte Umgebung / Risikofaktoren)

Nachteile
  • wenig geeignet bei seltenen Ereignissen
  • meist ist es möglich, mit einer geringeren Probandenanzahl als bei anderen Studientypen zuverlässige Ergebnisse zu erzielen
  • hoher Geld- und Zeitbedarf

  • Vorsicht bei „Stichprobenverlusten“ (lost cases, Drop-outs)
Maßzahlen
  • Inzidenz (Häufigkeit von Neuerkrankungen (oder Neuauftreten eines Merkmals) in einer bestimmten Population)
  • Odds Ratio (Chance für das Auftreten einer bestimmten Ausprägung/Krankheit unter Beachtung bestimmter Schutz- und Risikofaktoren)
  • Risk Ratio (gibt einen Faktor an, um den sich das Risiko (z.B. für eine Krankheit) zwischen zwei Gruppen unterscheidet)
Beispiel

Alle neuen Arzneimittel müssen, bevor sie zugelassen werden, in randomisierten kontrollierten klinischen Studien getestet werden. Anhand einer Fallzahlberechnung (siehe unten) wird errechnet, dass beispielsweise jeweils 10 Probanden pro Gruppe benötigt werden, um die blutdrucksenkende Wirkung eines neuen Medikamentes zu untersuchen. Randomisiert werden die Probanden also in die unbehandelte Kontrollgruppe und die Gruppe mit dem Medikament eingeteilt. Die Kontrollgruppe bekommt ein Placebopräparat in der gleichen Form wie das Medikament. Weder der verabreichende Arzt noch der Proband oder der untersuchende Arzt wissen, in welcher Gruppe sich der Proband befindet (Verblindung).

Meta-Analyse

ZielErgebnisse von mehreren durchgeführten (publizierten) Studien werden zusammengefasst und statistisch analysiert. Die Studien werden hinsichtlich der Häufigkeit des Auftretens bestimmter Ereignisse verglichen.
Vorteilquantitative Ergebnisse mehrerer Studien werden zusammengeführt (pooling), hierdurch ergeben sich höhere Fallzahlen
Nachteil
  • Heterogenität der Einzelstudien
  • möglicher Publication Bias (Verzerrung durch nicht publizierte Studien)


















































































Studienpopulation

Studien können zur Untersuchung einer Fragestellung aufgrund des Kosten- und Zeitaufwandes meist nur eine Gruppe von Probanden und nicht die gesamte Population einbeziehen. Wichtig ist dabei, dass die Probanden repräsentativ für die Gesamtpopulation sind. Durch eine geeignete Auswahl der Stichprobe kann eine hohe Repräsentativität der Studienpopulation aus der Gesamtpopulation erreicht werden. Allgemein müssen verschiedene Hierarchien von Populationen beachtet werden: die Zielpopulation (Gesamtpopulation), die Auswahlpopulation (aus der die Stichprobe gezogen wird) und die Studienpopulation (=Stichprobe).



verschiedene Hierachien von Populationen




verschiedene Hierachien von Populationen

Unter der Zielpopulation (hier Schüler in Norddeutschland) wird die Gesamtpopulation verstanden, über die die Studie eine Aussage treffen soll. Die Auswahlpopulation ist in userem Beispiel Berlin, das heißt, dass die Stichprobe dort gezogen wird. Unter der Studienpopulation werden hier die teilnehmenden Schüler verstanden, die somit die Stichprobe bilden.




Die Zielpopulation ist zum Teil nicht klar definiert und hängt von demjenigen ab, der die Studienergebnisse interpretiert. Sollten wir also untersuchen, wie hoch das Taschengeld von Schülern ist, könnte z.B. der durchführende Wissenschaftler als Zielpopulation alle Schüler aus Norddeutschland in Betracht ziehen, aber jemand, der die Ergebnisse der Studie liest, eventuell Schüler in ganz Deutschland als Zielpopulation vermuten. Es ist also wichtig, dies zu Beginn der Studienplanung zu definieren und in Publikationen auch zu dokumentieren.

Als Auswahlpopulation wird diejenige Population bezeichnet, aus der die Stichprobe gezogen wird. Jede Person in der Auswahlpopulation sollte dabei „aufgelistet" sein und eine Wahrscheinlichkeit größer als Null haben, in die Studienpopulation aufgenommen zu werden. Es könnte z.B. sein, dass der Forscher als Zielpopulation alle Schüler in Norddeutschland definiert, während die Auswahlpopulation alle Schüler in Berlin darstellt. Dieser Unterschied kann später zu Verzerrungen führen, da sich die Schüler in anderen Bundesländern in bestimmten Eigenschaften von den Schülern in Berlin unterscheiden. Dies sollte bei der Interpretation der Ergebnisse berücksichtigt und diskutiert werden. In unserem Beispiel kann man davon ausgehen, dass die Schüler einer Großstadt nicht repräsentativ für Schüler aus ländlichen Gegenden sind und dass es durch eine Beschränkung auf Schüler aus Berlin zu einer Verzerrung kommt. Zur Sicherung der Repräsentativität wäre es notwendig, Schüler aus unterschiedlich dicht besiedelten Gebieten in Norddeutschland in die Studie einzuschließen.

Aus den einzelnen Individuen, die in die Studie aufgenommen werden (nicht alle Schüler in Berlin nehmen teil), entsteht dementsprechend die Studienpopulation. Vor der Durchführung der Studie muss der Wissenschaftler hierfür die Größe der Stichprobe berechnen und festlegen (siehe Fallzahlberechnung). Es können z.B. nicht alle Schulen untersucht werden, und auch nur eine bestimmte Anzahl an Schülern pro Schule. Die betreffenden Schulen und Schüler werden daraufhin kontaktiert und die Studienpopulation besteht dann aus den Schülern, die bereit sind, an der Studie teilzunehmen.


Auswahl der Studienpopulation




Auswahl der Studienpopulation

In dieser Grafik ist dargestellt wie die Studienpopulation ausgewählt wird. Allerdings ist hier zu beachten, dass nur eine repräsentative Auswahl der Studienpopulation anschließend auch Schlussfolgerungen über die Zielpopulation zulassen. Dieser Zusammenhang wird im folgenden Abschnitt veranschaulicht.




In wieweit die Ergebnisse Schlussfolgerungen über die Zielpopulation zulassen, ist zunächst von einer guten repräsentativen Auswahl der Studienpopulation abhängig. Ist eine Verzerrung nicht vermeidbar (z.B. sind Berliner Schüler vermutlich nicht repräsentativ für ganz Norddeutschland), dann kann als Ausweg die Zielpopulation korrigiert werden. In unserem Beispiel könnte man entscheiden, dass die Berliner Schüler statt der norddeutschen Schüler die Zielpopulation sind. Die Ergebnisse sind dann nur für die Schüler in Berlin gültig und können nicht auf alle Schüler in Norddeutschland verallgemeinert werden.

Die Verallgemeinerung von Ergebnissen aus experimentellen Studien, die mit Hilfe von statistischen Tests ausgewertet wurden, ist oft deutlich einfacher als Ergebnisse aus rein beschreibenden Studien. Der Anteil von Berliner Schülern mit einem bestimmten Betrag an Taschengeld wäre dementsprechend ggf. eine deutlich andere als der Anteil der Schüler in Brandenburg mit dem selben Budget. Andererseits wäre ein genereller Zusammenhang zwischen der Höhe des Taschengelds und dem Alter der Schüler leichter zu verallgemeinern.

Selektive Auswahlkriterien wie beispielsweise Alter, Geschlecht oder sozialer Status schränken die Aussagekraft über die Gesamtpopulation ein. Denn in diesem Fall kann z.B. nur eine Aussage über die Population getroffen werden, die genau diesen Auswahlkriterien entspricht. Ein- und Ausschlusskriterien müssen vor Beginn der Studie genau definiert werden und auch bei der Interpretation der Ergebnisse muss daran gedacht werden, dass die Ergebnisse nur genau für diese Population gelten. Eine Generalisierung z.B. auf andere Altersgruppen kann in der Diskussion der Ergebnisse bestenfalls diskutiert werden. Des Weiteren muss die Rekrutierung der Probanden vorher festgelegt werden. Dieses wäre einerseits der Ort und der Zeitpunkt der Untersuchungen, aber auch die Auswahl der Probanden. Sie kann zufällig, beispielweise durch zufällige Auswahl aus einer Liste von Schülern, oder konsekutiv (nachfolgend), etwa alle Schüler einer Klasse in einem Jahrgang, erfolgen.


Beobachtungseinheit

Die Stichprobe umfasst die Gesamtzahl aller Beobachtungseinheiten. Bei der Beobachtungseinheit kann es sich um ein Individuum (Mensch oder Tier) handeln. Aber auch mehrere Probanden, z.B. im Teilkollektiv (z.B. Risikogruppe oder Herde) oder als Bevölkerung (Region), kann eine Beobachtungseinheit sein. Im systematischen Review (systematische Bewertung von Ergebnissen mehrerer Studien) wäre z.B. die einzelne Studie eine Beobachtungseinheit, aber genauso gut kann es sich dabei auch um ein Organsystem oder eine Probe (Blutprobe, Zelle) handeln. Bei der Fallzahlberechnung und statistischen Auswertung muss auf die Definition der Beobachtungseinheit geachtet werden. Die Beobachtungeinheit kann unabhängig oder abhängig sein. So sind zwei Schüler unabhängige Beobachtungseinheiten, aber werden an diesen Schülern nach einem Monat wieder Daten erhoben, stellen die Ergebnisse dieser Wiederholungsmessungen abhängige Beobachtungseinheiten dar. Bei abhängigen oder gepaarten Beobachtungen (Fall-Kontroll-Studie) sind andere statistische Tests zu verwenden als bei unabhängigen Beobachtungen.


Messverfahren

Das Messverfahren beinhaltet zum einen den Einsatz von Messinstrumenten und zum anderen die Messmethodik.

Unter Messinstrumenten versteht man Geräte, die gezielt Daten, beispielsweise Laborwerte, erheben. Aber auch selbst entworfene und standardisierte Fragebögen gelten als Messinstrumente. Wichtig ist, dass ein Messinstrument eine hohe Genauigkeit hat. Bei der Validierung von Messinstrumenten wird diese Genauigkeit ermittelt. Die Genauigkeit umfasst die Begriffe der Reliabilität und Validität. Die Reliabilität oder auch Wiederholbarkeit sagt aus, ob bei einer wiederholt durchgeführten Messung gleiche Ergebnisse wie bei der vorherigen Messung erzielt werden. Durch eine hohe Präzision des Messinstruments können dementsprechend zufällige Fehler reduziert werden. Die Validität beschreibt die Abweichung zwischen dem gemessenen und wahren Messwert. Diese Richtigkeit des Messinstrumentes ist wichtig, um systemische Fehler zu minimieren.

Die Messmethodik beschreibt den zeitlichen Ablauf und die Anzahl an Untersuchungen. Es geht also darum, wie etwas gemessen wird und wie hoch der Untersuchungsaufwand ist. Um eine nachvollziehbare und vergleichbare Messmethodik zu erhalten, müssen die Messbedingungen standardisiert werden. Hierbei wird eine Objektivität der Messmethodik erzielt. Der genaue Ablauf bei der Messung, aber auch bei der Probenerhebung, sollte sich also innerhalb einer Studie nicht verändern und genau dokumentiert werden. So sollte beispielsweise bei der Messung von Blutwerten immer die gleiche Probenmenge und das gleiche Messinstrument genutzt werden. Weitere Umstände, die berücksichtigt werden müssen, da sie die Ergebnisse von Messungen beeinflussen können, sind beispielsweise der Zeitpunkt einer Blutabnahme oder die Lagerung der Proben. Weiterhin ist wichtig auf welchem Skalenniveau das erfolgte Messergebnis liegt. Dieses kann entweder metrisch, ordinal oder nominal sein. Es sollte dabei immer das höherwertige Skalenniveau genutzt werden, da es zwar immer möglich ist ein metrisches Ergebnis in eine ordinale Skala umzuwandeln, aber nicht mehr umgekehrt. Das Skalenniveau hat allerdings wiederrum einen grundlegenden Einfluss auf die spätere Auswertung der Ergebnisse.


Fallzahlplanung

Bei der Fallzahlplanung wird ermittelt, wie viele Beobachtungeinheiten (z.B. Probanden) eingeschlossen werden müssen, um die Studienfragestellung mit ausreichender Sicherheit beantworten zu können. Eine Fallzahlplanung ist wichtig, da es bei einer Studie weder zu wenige noch zu viele Beobachtungseinheiten geben sollte. Dies ist von großer Bedeutung und muss immer vor Studienbeginn durchgeführt werden. Hierfür werden allerdings schon vor Studienbeginn Kenntnisse über den gewünschten Effekt wie beispielsweise Unterschiede in Blutwerten bei erkrankten und nicht erkrankten Probanden sowie die Streuung dieses Blutwertes benötigt. Die Informationen hierfür können entweder aus der bereits vorhandenen Literatur oder anhand von Ergebnissen aus Voruntersuchungen (Pilotstudien) erhoben werden. Häufig ist es aber für die Forscher schwierig, sich im Vorfeld auf die benötigten Werte festzulegen. Das folgende Video zeigt die dabei auftretenden Schwierigkeiten. Link zum Video.

Eine größere Fallzahl wird benötigt, wenn kleinere Unterschiede entdeckt werden sollen oder die Streuung innerhalb der Gruppen von Beobachtungseinheiten hinsichtlich des Messparameters groß ist. Eine zu große Fallzahl, z.B. in einem Tierversuch, stellt allerdings eine nicht vertretbare Belastung der Tiere dar und muss daher vermieden werden. Häufig liegt auch eine Limitierung der Anzahl an Beobachtungseinheiten anhand von Zeit- und Kostengründen vor. Dies sollte allerdings keine Voraussetzung für die Fallzahlplanung sein. Denn eine zu kleine Fallzahl hat zur Folge, dass die Trennschärfe nicht groß genug ist, um einen tatsächlich vorhandenen Unterschied auch statistisch nachweisen zu können. In diesem Fall hat die Studie ihr Ziel verfehlt. Auch dies ist ethisch nicht vertretbar, da z.B. im Tierversuch hierdurch eine unnötige Belastung der Tiere stattgefunden hätte oder Ressourcen wie z.B. Finanzen oder Arbeitsleistung unnötig aufgewendet wurden. Mit einer Fallzahlplanung wird die Mindestanzahl an Beobachtungseinheiten ermittelt, mit der statistisch signifikante Ergebnisse erzielt werden können.

Um eine Fallzahl zu bestimmen, müssen zunächst das Signifikanzniveau und die gewünschte Power festgelegt werden. Zusätzlich müssen Annahmen über die Mittelwerte und Standardabweichungen der Zielgrößen vorliegen. Hierbei besteht häufig eine Schwierigkeit und ein Paradoxon der Fallzahlplanung, denn, wenn man beispielsweise herausfinden möchte, wie hoch die Prävalenz einer zu untersuchenden Erkrankung in der Bevölkerung ist, muss man vor der Studie schon eine Vermutung haben, wie hoch diese Prävalenz sein könnte. Je nach Studientyp und Fragestellung sind noch weitere Annahmen notwendig. Zur Durchführung von Berechnungen der Fallzahl für eine Studie gibt es mehrere Hilfsmittel wie beispielsweise Onlinerechner (http://epitools.ausvet.com.au/content.php?page=SampleSize oder http://www.openepi.com/Menu/OE_Menu.htm) oder Softwareprogramme wie PASS (www.ncss.com).

Durchführung

Bei der Fallzahlplanung zur Ermittlung des Mittelwertes einer Messgröße (Einstichprobenverfahren) oder zum Vergleichen von zwei Prävalenzen (Zweistichprobenverfahren) werden folgende Formeln genutzt (Dohoo et al., 2009, Seite 48 und 52):

Einstichprobenverfahren

Für einen Anteil: \(\large{n=\frac{Z^{2}_{\alpha} pq}{L^{2}}}\)

Für einen Mittelwert: \(\large{n=\frac{Z^{2}_{\alpha} \sigma^2}{L^{2}}}\)

Zweistichprobenverfahren

Für Anteile: \(\large{n=\frac{(Z_{\alpha}\sqrt{2pq}-Z_{\beta}\sqrt{p_{1}q_{1}+p_{2}q_{2}})^2}{(p_{1}-p_{2})^2}}\)

Für Mittwelerte: \(\large{n=2\Big(\frac{(Z_{\alpha}-Z_{\beta})^{2}\sigma^{2}}{(\mu_{1}-\mu_{2})^2}\Big)}\)

\(\alpha\)festgelegtes Signifikanzniveau
\(1-\beta\)festgelegte Power
\(Z_{\alpha}\)das Perzentil der Standardnormalverteilung für die Sicherheit = 1 - \(\alpha\)
\(Z_{\beta}\)das Perzentil der Standardnormalverteilung für die Sicherheit = 1 - \(\beta\)
\(p\)vor Sudienbeginn geschätzter Anteil; bei zwei Stichproben ist \(p=(p_1+p_2)/2\)
\(q\)\(1-p\)

\(\mu\)

Mittelwert
\(\sigma^2\)vor Studienbeginn geschätzte Varianz
\(L\)die Genauigkeit der Schätzung = Weite des vermuteten Konfidenzintervalls
\(n\)Probenanzahl


Beispiel 1 (Einstichprobenverfahren) (Dohoo et al., 2009)

Nicht bei allen Studientypen wird ein Gruppenvergleich durchgeführt. Häufig ist das Ziel einer Studie, einfach eine bestimmte Messgröße innerhalb der Studienpopulation anhand ihres Mittelwertes oder Anteils zu beschreiben. Ein Beispiel hierfür wäre, wenn ein Arzt bei einer Gruppe von Schwangeren die durchschnittliche fötale Kopf-Rumpf-Länge mittels Ultraschall ermitteln möchte (https://biotime.uchicago.edu/eng_samplesize.pdf). Die Begrenzungen des 95% Konfidenzintervall sollen nicht mehr als 1 mm oberhalb oder 1 mm unterhalb der durchschnittlichen fötalen Kopf-Rumpf-Länge der Studiengruppe liegen. Die bereits bekannte Standardabweichung für diese Messgröße beträgt 3 mm.

\(Z_{\alpha}=Z_{0,05}=1,96\), \(L=2mm\), \(\sigma=3mm\)

\[\large{n=\frac{Z^{2}_{\alpha} \sigma^2}{L^{2}}=\frac{1,96^{2}\cdot3^2}{2^2}=\frac{3,8416\cdot9}{4}=8,64}\]

Aus der Fallzahlplanung geht hervor, dass 9 Föten untersucht werden müssen, um den Gruppenmittelwert der fötalen Kopf-Rumpf-Länge zu ermitteln.

Beispiel 2 (Zweistichprobenverfahren) (Dohoo et al., 2009)

Exemplarisch wird hier die Fallzahlplanung anhand einer Studie dargestellt, in der ermittelt werden soll, ob eine bei der Ankunft im Rinderbestand durchgeführte Impfung das Risiko von Erkrankungen der Atemwege bei Mastbullen reduziert. Die Impfung wäre von Relevanz, wenn sie das aktuelle Risiko von 15% auf 10% der Tiere senken kann. Die Sicherheit der Ergebnisse soll bei 95% liegen, und die Studie sollte eine Power von 80% haben, um die Reduzierung des Risikos von 5% aufzuzeigen.

\(p_1=0,15\), \(p_2=0,10\),   \(q_1=0,85\), \(q_2=0,90\)

\(p=(p_1+p_2)/2=0,125\),   \(q=1-p=0,875\)

\(Z_{\alpha}=Z_{0,05}=1,96\),   \(Z_{\beta}=Z_{0,80}=-0,84\)

\(\large{n=\frac{\big(Z_{\alpha}\sqrt{2pq}-Z_{\beta}\sqrt{p_{1}q_{1}+p_{2}q_{2}}\big)^2}{(p_{1}-p_{2})^2}=\frac{\big(1,96\sqrt{2\cdot0,125\cdot0,875}-(-0,84)\sqrt{0,15\cdot0,85+0,10\cdot0,90}\big)^2}{(0,15-0,10)^2}=\frac{\big(1,96\sqrt{0,21875}-(-0,84)\sqrt{0,2175}\big)^2}{(0,05)^2}=}\)

\(\large{=\frac{(0,9167-(-0,3917))^2}{(0,05)^2}=\frac{1,7121}{0,0025}=684,8}\)

Dementsprechend werden 1.370 (685*2) Tiere für diese Studie benötigt werden, davon müssen 685 Tiere geimpft werden, und der Rest der Tiere dient als Kontrolle.


Literatur

Dohoo I, Martin W, Stryhn H (2009): Veterinary Epidemiologic Research. VER Inc., Charlottetown, Kanada


  • No labels