疫学研究に使われるデータには,個人を直接対象としたもの(年齢と血圧)と,集団,組織,場所を対象としたもの(社会の無秩序さと大気汚染)がある.これらのデータ・観察対象は,研究に応じて特定の変数を計測するものとしてまとめられる.しなわち,個人レベルの変数は個人の性質を,あるいは集団,組織,場所の変数はそれらの性質をあらわすものである.このエコロジックな計測については3つのタイプがある;
- 集計指標 aggregate measuresはそれぞれの集団の中にいる個人から得られた観察データのサマリ(平均や割合)である(たとえば,喫煙者の割合と一家の平均収入).
- 環境指標 environmental measuresは個々の集団のメンバーが住んでいたり働いていたりする場所の物理的な性質である(たとえば,大気汚染レベルと日照時間).※環境計測は個人レベルにおいて類似性をもつが,これらの個人レベルの曝露(またはドーズ)はそれぞれの集団のメンバー間で,多くの場合違ってくる(そしてそれらは計測されないままである).
- 全体指標 global measuresは集団や組織や場所の性質であって,個人レベルとは一切の類似点をもたないもので,集計計測や環境計測とは異なるものである(たとえば,人口密集度,社会の無秩序さのレベル,特定の法の存在または健康保険制度のタイプなど).
分析のレベル
分析の単位というレベルが,すべての変数のデータを還元,解析するのによく用いられるものである.個人レベル分析では,それぞれの変数値はそれぞれの研究対象に割り付けられる.エコロジックな計測においては,1つまたはそれ以上の数の予測変数を用いることができる.たとえば,それぞれの国の平均汚染レベルをその国に住む個々の対象に割り付けることができる.
完全エコロジック解析では,全ての変数(曝露,疾患,そして共変量)はエコロジックな計測であり,すなわち分析の単位が集団である(たとえば,地域,勤務地,学校,健康保健施設,地理的階層,または一定期間).したがって,それそれの集団内では,個人レベルでのどの変数の組み合わせについても,結合分布についてはわからない(すなわち,曝露ケースの頻度,非曝露のケース,曝露ありの非ケース,非曝露の非ケース).わかるのは,各変数の統合分布 marginal distributionのみである(曝露の割合と有病率).2×2表における,合計部分しかわからない.
部分エコロジック解析は,結合分布についての情報が,もう少しあるものであるが,完全にはわからない.たとえば,国ごとのがんの罹患率についてのエコロジック研究では,年齢(共変量),疾患の状態などは全数調査や全国がん患者登録などから得られる.これにより,国毎の年齢別がん発生率を見積ることができるだろう.
マルチレベル解析は,2つまたはそれ以上のレベルのデータを結合する特殊なタイプの研究モデル技術である.これについては後述.
推定のレベル
疫学研究あるいは解析の基本的な目標は,生物学的(あるいは生物行動学的)推定,すなわち個人のリスクに影響するものか,あるいはエコロジック推定,すなわち集団の率に関するもの,をしようとすることである.ふつう,因果推論の対象レベルと,解析のレベルは必ずしも一致するわけではない.エコロジック解析に用いた対象について,エコロジックレベルから個人レベルについてある程度はいえるかもしれないが,このようなクロスレベル推定は特にバイアスに弱い.
ある研究の対象が,バイク搭乗の際のヘルメット着用の,バイク関連死亡のリスクに与える影響は,生物学的(個人的)な影響を推定するものであるなら,目的レベルは「個人」となる.ここで,たとえばヘルメット着用法案とバイク関連死亡率が州ごとに違うことをみる場合は,エコロジック研究だといえる.ただし,これをそのまま生物学的な効果とみなすことはできず,この場合だと,死亡率というアウトカムはその法律の遵守の割合によって変化し得る.また更に,エコロジック効果の推定の妥当性は,われわれが交絡因子の結合分布,すなわち州間での年齢やバイクの流通量など個人レベルの変数をどれだけ排除できるかにかかっているのである.
文脈的効果 contextual effectは,たとえば貧困地域への居住と疾病リスクを考えたとき,個人の貧困度をある程度コントロールする必要が生じるが,このようにエコロジックな曝露が個人のリスクにおよぼす効果のことである.
- Ecologic Studies. Modern Epidemiology, K. J. Rothman, 2007
0 件のコメント:
コメントを投稿