Agreement Statistics Impacts of Prevalence Between the Two Clinicians in Binary Diagnostic Tests
Journal Name:
- İnönü Üniversitesi Tıp Fakültesi Dergisi
Keywords (Original Language):
Author Name | University of Author | Faculty of Author |
---|---|---|
Abstract (2. Language):
Objective: It has been recommended a lot of statistics in the literature to test the agreement
(consistent) of both clinicians (the raters) for a diagnostic test with two categories. Scott’s
statistics and Cohen’s kappa statistics used most frequently in the literature. As an alternative to
this statistics, the AC1 statistics have been developed by Gwet. The purpose of this study, to
determine agreement statistics, used to test the agreement between two raters, whether affected
by the prevalence. Material and Methods: For testing marginal homogeneity of all agreement
statistics, it’s formulated and calculated by taking partial derivatives on behalf of prevalence.
Results: It’s determined that , kappa, G-index and AC1 gave similar results with prevalence
case is equal to 0.50. Moreover G-index is determined equal to a fixed value for all prevalence
values. In addition, and kappa statistics are equal to 0 when prevalence values case is high
(equal to 1) or low (equal to 0) and its observed these values are not accurately reflect the
agreement between raters. Conclusion: In this study, it’s researched that the agreement statistics
between raters in the 2x2 trial designs. And, it’s concluded that G-index and AC1 statistics not
affected sensitivity, specify and prevalence value than other agreement statistics and showed a
better performance.
Bookmark/Search this post with
Abstract (Original Language):
Amaç: İki kategorisi olan bir tanı testinin iki hekimin (değerlendiricinin) uyumunu (tutarlılığını)
test edebilmek için literatürde pek çok uyum istatistikleri önerilmektedir. Literatürde çok yaygın
olarak kullanılan Scott’ın istatistiği ve Cohen’in kappa istatistiğidir. Bu istatistiklere alternatif
olarak Gwet tarafından AC1 istatistiği geliştirilmiştir. Bu çalışmanın amacı, iki değerlendirici
arasındaki uyumu test etmekte kullanılan uyum istatistiklerinin, prevalanstan etkilenip
etkilenmediklerini ortaya koymaktır.
Gereç ve Yöntemler: Tüm uyum istatistiklerinin marjinal homojenliğini test edebilmek adına
prevalansa göre kısmi türevleri alınarak formüle edilip hesaplanmıştır.
Bulgular: Prevalans değerinin 0.50’e eşit olduğu durumda , kappa, G-index ve AC1 uyum
istatistiklerinin benzer sonuçlar verdiği hatta G-index’in tüm prevalans değerleri için sabit bir
değere eşit olduğu belirlenmiştir. Bunun yanı sıra prevalans değeri yüksek (1’e eşit) veya düşük
(0’a eşit) olduğunda ve kappa istatistiklerinin 0 değerini aldığı ve bu değerlerin
değerlendiriciler arasındaki uyumu doğru bir şekilde yansıtmadığı gözlenmiştir.
Sonuç: Bu çalışmada, 2X2 deneme düzenlerinde, değerlendiriciler arasındaki uyum istatistikleri
araştırılmış ve diğer uyum istatistiklerine nazaran G-index ve AC1 istatistiğinin duyarlılık,
seçicilik ve prevelans değerinden etkilenmediği ve daha iyi bir performans gösterdiği sonucuna
varılmıştır.
FULL TEXT (PDF):
- 3
153-158