Healthcare and Medicine Reference
In-Depth Information
Interpretation eines nichtsignifikanten Ergebnisses
9.2.4
Ein nichtsignifikantes Testergebnis kann zweierlei bedeuten:
4
Es gibt keinen relevanten Unterschied.
4
Oder es gibt einen bedeutsamen Unterschied, der sich aber wegen eines zu
geringen Stichprobenumfangs nicht absichern lässt.
Ein Konfidenzintervall ist hilfreich, um zu beurteilen, welche Alternative eher anzu-
nehmen ist.
Der Test in 7 Beispiel 11.1 wurde durchgeführt, um herauszufinden, ob ein Zusam-
menhang zwischen Rauchen und Geschlecht besteht. Das Ergebnis »nichtsignifikant«
ist mit Vorsicht zu interpretieren. Abgesehen vom nicht allzu hohen Stichprobenum-
fang ist zu bedenken, dass die Beobachtungseinheiten Medizinstudenten sind. Auf
andere Populationen ist das Ergebnis nicht ohne Weiteres übertragbar.
Wenn man keinen Unterschied erwartet hat, ist ein nichtsignifikantes Testergebnis
nicht aufsehenerregend. Überrascht das Ergebnis des statistischen Tests jedoch, sollte
man nach den Ursachen forschen. Möglich sind ein inhaltlicher Fehler bei der Formu-
lierung der Hypothesen, Mängel des Studiendesigns, ein nichtadäquater Stichproben-
umfang oder eine nichteffiziente statistische Analyse.
Nun gibt es auch Fragestellungen, bei denen die Beibehaltung der Nullhypothese
explizit erwünscht ist. Dazu zählen Anpassungstests und Äquivalenztests:
4
9
Mit einem Anpassungstest soll nachgewiesen werden, dass eine empirische
Verteilung mit einer theoretischen Verteilung vereinbar ist. In diesen Fällen ist
man bemüht, den β-Fehler möglichst gering zu halten. Dieser lässt sich indirekt
durch die Wahl des α-Fehlers beeinflussen. Deshalb setzt man bei einem Anpas-
sungstest meist α = 0,10 (statt α = 0,05) und entscheidet sich für die Nullhypo-
these, falls p 0,10.
4 Äquivalenztests werden unter anderem bei Bioverfügbarkeitsstudien ange-
wandt, um die therapeutische Gleichwertigkeit zweier Behandlungen zu prüfen.
Für den Nachweis, dass zwei Verfahren übereinstimmend dieselben Ergebnisse
liefern (abgesehen von für die Praxis unerheblichen zufällig bedingten Abwei-
chungen), stehen spezielle Methoden zur Verfügung:
5
Für quantitative Messwerte eignet sich die Bland-Altman-Analyse
( 7 Abschn. 5.2.5 ).
5
Bei qualitativen Merkmalen wird üblicherweise ein Kappa-Index berechnet,
um den Grad der Übereinstimmung abzuschätzen ( 7 Abschn. 14.1.4 ).
Ein einseitiger Äquivalenztest wird als Test auf Nichtunterlegenheit (non-inferiority)
bezeichnet. Weitere Informationen findet man in Schumacher u. Schulgen (2008;
7
Anhang ).
 
Search Pocayo ::




Custom Search