Healthcare and Medicine Reference
In-Depth Information
Dabei sind p o und p e die Anteile der übereinstimmenden Urteile, die man beobachtet hat bzw. die
man rein zufällig erwarten würde ( o und e stehen für »observed« bzw. »expected«). Der κ-Koeffizient
quantifiziert demnach den Anteil von Übereinstimmungen, der über das hinausgeht, was man
unter dem Zufall erwarten würde. Stimmen zwei Beobachter in allen Urteilen überein, ist κ = 1.
Falls die Anzahl der Übereinstimmungen der Zufallserwartung entspricht, ist κ = 0. Theoretisch
kann κ auch negative Werte annehmen. (Dieser Fall ist aber praktisch bedeutungslos.) κ > 0,60
zeigt eine gute, κ > 0,80 eine exzellente Übereinstimmung jenseits des Zufalls an.
Beispiel 14.3: Kappa-Koeffizient
Zwei Radiologen bewerten unabhängig voneinander 100 Röntgenbilder. Folgende Beur-
teilungen ergeben sich (in Klammer die Häufigkeiten, die rein zufällig zu erwarten sind):
Beobachter A
Erwartete Häufigkeiten
Beobachter B
Normal
Pathologisch
Σ
Normal
40 (30)
10 (20)
50
e 11 = e 21 = 50 . 60/100 = 30
Pathologisch
20 (30)
30 (20)
50
e 12 = e 22 = 50 . 40/100 = 20
Σ
60
40
100
Daraus ergibt sich: p o = (40 + 30)/100 = 0,70, p e = (30 + 20)/100 = 0,50. Die Untersucher
haben also in 70% der Fälle übereinstimmend geurteilt; der Anteil der rein zufällig zu er-
wartenden Übereinstimmungen beträgt 50%. Daraus resultiert nach
7
Formel (14.7)
070 050
1050
,
,
κ=
=
040
,
. Der Grad der Übereinstimmung ist also recht schwach.
,
Es gibt außerdem einen erweiterten κ-Koeffizienten, der sich eignet, um mehr als zwei Beobach-
ter zu vergleichen. Weiterhin ist ein gewichteter κ-Koeffizient entwickelt worden, mit dem sich
Abweichungen je nach ihrem Schweregrad unterschiedlich gewichten lassen.
i Diese Koeffizienten sind ausführlich in Bortz u. Lienert (2008) beschrieben. Zur
weiteren Lektüre sei das Handbuch von Fletcher u. Fletcher (2007) empfohlen.
14.1.5 Anwendung eines diagnostischen Tests in der Praxis
Sensitivität und Spezifität beschreiben die Güte eines diagnostischen Verfahrens aus
der Sicht des Forschers, der den Test entwickelt. Mitunter erweist sich ein diagnosti-
sches Verfahren in der Praxis als ungeeignet - trotz hoher Werte für Sensitivität und
Spezifität. Dies kann vielfältige Gründe haben:
4
Interpretation des Testbefundes
4
Patientenspektrum
Search Pocayo ::




Custom Search