2012年8月4日土曜日

κ統計量おぼえがき

「一致率の検定」にもちいられる統計量には以下のようなものがある.

  • Percent agreement 一致率
  • Percent positive agreement 陽性一致率
  • κ statistic κ統計量
  • weighted κ statistic 重み付けκ統計量

一致率とは

κ統計量などはよく論文に登場する.絶対値が大きければ意味があって,ゼロに近いとあまりよくないのかな程度の理解だったが,ここで今一度.
上記のような「一致率の検定」にもちいられる統計量は,その名の通り「一致」をみているわけだが,これはすなわち,ある対象検査の陽性(または陰性)結果が,ゴールドスタンダードの結果とどれくらい一致するか,というような意味である.
具体的には,「虫垂炎を疑うある身体所見が,CTによる検査結果とどれだけ一致するか」といった形で用いられる.
さらにメタに考えると,「一致率検定」は,"Indices of validity and reliability"のひとつであり,reliability(信頼性)の指標といえる.
Quality assurance and control > Indices of validity and reliability > agreement という関係である.

一致率検定のさまざま

一致率検定にもちいられる統計量を上に列記したが,それぞれの特長は簡単に書けば以下の通りである.
  • Percent agreement 一致率
    • 単純計算したもの.
  • Percent positive agreement 陽性一致率
    • さらに,prevalenceにより信頼性が落ちるのでそれを補正したもの.
  • κ statistic κ統計量
    • さらに,「偶然の一致」を除去したもの.
  • weighted κ statistic 重み付けκ統計量
    • カテゴリ数が2を越える時に使えるようにしたもの.
適当だけどざっくりとはこんな感じ.というか,それぞれについては詳しいサイトがあるのでそれらを参照するとよい.

各統計量の限界

結論としては,「有病率により値が変動する」「偶然の一致を勘案するかどうか」が問題となる.後者にかんしては,上記の通りκ統計量が導入されている.最も重視すべきは,前者の有病率にまつわる問題である.
κ統計量は,たとえその検査あるいは観察者が同質の判断を続けたとしても,有病率が高ければより高い値が出る.ゆえに,κ統計量を参照する場合は,当該集団の有病率を確認する必要があり,大きな差がある場合は統計量に由来する誤差が生じることを念頭におかねばならない.あるいは別の改善策として,Positive agreementのような他の統計量を併記する方法もある.
とはいえ,いずれにせよκ統計量は,一致率検定において有用な推定となりうる.有病率の問題を念頭において,うまく利用すれば有意義である.

0 件のコメント:

コメントを投稿