メタ解析

(2021年5月17日更新) [ 日本語 | English ]

メタ解析 (meta-analysis)

有珠山 / サロベツ泥炭採掘跡
1986年, 2006年の有珠山火口原. ワタスゲ・エゾカンゾウ

HOME > 講義・実習・演習一覧 / 研究概要 > 小辞典 > 統計学 > メタ解析

メタ解析(メタ分析・メタアナリシス)
系統的レビューの1種 = 研究間結果の統計学的統合

[仮定: 系統的レビューと同] バイアスなし → 結果(相対危険度、リスク差、オッズ比等)を量的併合

統合法 → 統合結果の統計的証拠 statistical evidence = 検定

検索: 関連論文を漏れなく抽出
選択: 解析に用いる論文を決定
要約: 各論文の要約を量的に行える
解析: 効果サイズ (effect size): 中心概念
1. 各研究報告の集計結果使用: 「事象発生までの時間」データ(生存分析等)測定: 集計データから信頼性ある計算不可能な場合がある
2. 各研究対照標本を集め単独研究のようにデータ再分析 → より正確。追加データ併合可能

(Nakagawa & Cuthill 2007)

メタ分析的思考

= メタ分析の有益性

効果量による先行研究の理解は本質的
(信頼区間を伴う)効果量報告 → メタ分析組み込み容易
先行研究の効果量と新たな研究の効果量を比較 → 新たな結果の解釈

系統的再評価(レビュー) systematic review

複数の文献・成果から全体的結論を導く一連の過程

→ 個別研究では見えない疑問解決手技とし有力

一般化 generalizability

Def. 系統的再評価で得た結果が他状況にある集団に適用できる度合
= applicability, external validity, relevance, transferability

仮説1つに絞る → 一般的レビューと異なる点

使用データベース・検索方法および論文選択基準は再現性あるよう記載
採択論文は批判的に評価(吟味) critical appraisal可能
結果は量的に要約できねばならない
解釈・評価は証拠 evidence に基づく

標準的検査 gold standard (reference standard)

一般的に認められた調査測定方法 → よく新検査法と比較される

均一性

均一 = fixed effect (conditional) model
仮定: 研究間違い無く、個々の研究で選んだ対象 primary sampling units のばらつきでのみ結果が異なる
M-H test
Peto法
General Variance-Based法 (オッズ比、相対リスク、差)
不均一 = random effect (unconditional) model
仮定: 対象それぞれ異なる条件研究からランダム選択
Der Simonian & Laird法(D & L法) (比、差) → 不均一性理由の検討

測定基準

有意水準: p値, Z
効果サイズ: r (積率相関係数), Z (Fisher), d
r² (決定係数)

有意水準と効果サイズをそれぞれ「測定値」とし統計解析
有意水準、効果サイズの不均一性(χ²-test)

解析手順

各論文で使用された検定、n (標本数)、期待された効果の方向、Z, p値を抽出
抽出されたn, Z, pよりr, r², rのFisher補正値、d (2グループ間の平均差)算出

これらの指標の他に出版年等必要情報を加えた表を作成

表に基づいて解析を行う → Z, r, Z (Fisher)を重み付けして結合する

有意水準指標

t-test: Z = (df(log(1 + t²;/df)))^1/2·(1 - 1/2df)^1/2, r = (t²/(t² + df))^1/2
χ²-test: χ²(1) → Z = √χ², r = (χ²/n)^1/2

Z (Fisher) = 1/2·(log((1 + r)/(1 - r))) 推測値が極端な値を取る場合にrの分布が歪むのを補正

d = (4r²/(1 - r²))^1/2
→ Z, r, r², dにより各論文の検定が異なっていても比較できる

Ex. n = 10, r = 0.500 → Z (Fisher) = 0.549, d = 1.155, t(8) = 1.633, F(1, 8) = 2.667, χ²(1) = 2.500

ここがやりたいのよ!

遷移 (succession)

遷移研究への応用

火山遷移 (volcanic succession)
遷移 (succession)

効果サイズ (effect size)

= 効果量, 効果の大きさ (effect size): 中心概念 - 変数間の関係の強さ(strength of association)を表す指標

p値: 標本数が増えると有意差はでやすい

Ex. n = 10 (p > 0.05) vs n = 1000 (p < 0.05)

→ 標本サイズで変化しない標準化された指標 = その現象が母集団で存在する程度

効果サイズ指標

標準化効果量 standardized effect size

d family: グループごと平均値の差を標準化した効果量
Ex. Cohen's d，Choen's f, Hedges' g, Glass's Δ
r family: 変数間の関係の強さ(strength of association)を示す効果量
Ex. r²，η²，partial η², ω²，R², φ²

非標準化効果量 unstandardized effect size

平均値差
非標準化回帰係数

Cohen's d

= (m₁ - m₂)/S_p

S_p (プールした標本分散の平方根) =

√((Σ(X_A - X^-_A)² - Σ(X_B - X^-_B)²)/(n_A + n_B -2))

Hedges's g

= (m₁ - m₂)/s_p

s_p (プールした標本不偏分散の平方根)

検定と効果量の関係

検定統計量 = 効果の大きさ × 標本の大きさ

t = (y^-₁ - y^-₂)/s^*√(1/n₁ + 1/n₂)

= d·√(n₁n₂/(n₁ + n₂))

Ex. n₁ = n₂ ⇒ n₁n₂/(n₁ + n₂)

n = 1 → 1/2 = 0.5, n = 5 → 25/10 = 2.5

表. 検定の種類毎に見る代表的効果量の指標と大きさの目安。*: 共変量の影響を取り除き分析し、主効果、交互作用、多重比較の方法はANOVAと同じ
検定(分析)	対象	効果量指標	効果の目安
			小	中	大
相関		r	0.10	0.30	0.50
重回帰		R² f²	0.02 0.02	0.13 0.15	0.26 0.35
t検定	対応あり・なし	r d	0.10 0.20	0.30 0.50	0.50 0.80
一元配置分散分析 (onw-way ANOVA)	主効果	η² partial η² ω² f	0.01 - 0.01 0.10	0.06 - 0.09 0.25	0.14 - 0.25 0.40
	多重比較	r	0.10	0.30	0.50
二元配置分散分析多元配置分散分析(multi-way ANOVA)	主効果	η² partial η² ω²	0.01 - 0.01	0.06 - 0.09	0.14 - 0.25
	交互作用	η² partial η² ω²	0.01 - 0.01	0.06 - 0.09	0.14 - 0.25
	多重比較	r	0.10	0.30	0.50
共分散分析*
多変量分散分析(MANOVA) 多変量共分散分析(MANCOVA)	多変量検定	multivariate η² multivariate partial η² (R²)	- -	- -	- -
	各従属変数の分散分析*
χ²検定	2 × 2分割表	φ (= W)	0.10	0.30	0.50
	n × m分割表	Cramer's V	0.10	0.30	0.50
マン･ホイットニーのU検定ウィルコクソンの符号順位和検定クルスカリス・ウォリスの順位和検定フリードマン検定	検定統計量をZ変換しr求める	r	0.10	0.30	0.50

バイアス(偏り) (bias)

元来持つ規則に基づく歪みにより統計的結果の表現式が成立しない(s.s.)
→ 研究結果を歪めるもの: 観察研究において、制御不能・不足から生じる

発生時期: 研究計画・対象者選択時 / 実施時 / 解析時 / その他

推定が真値からずれた結果や推定、そのプロセス → 系統的systematicに誤差を含む
推測全過程(データ収集、解析、解釈、出版)で結果・結論を事実とは体系的に異ならせるもの(s.l.)

測定値が真値から(一方へ)系統的に変位 = systemic error
測定の系統的変位、データ回収、研究デザイン、結果解析の欠陥により統計値が真値から変位

対象バイアス subject bias (選択バイアス selection bias)

当該母集団の代表的標本群とならず結果が歪む

範囲バイアス, Berkson -, Neyman -, 紹介-, 無回答者-

範囲バイアス spectrum bias

対象標本が偏るため評価に偏りが生じる

バークソンバイアス Berkson's bias

症例対照研究で、病院内は症例がより多くの暴露事例を含むため暴露率が異なる。要因暴露の有無で有疾患や非有疾患で受診率が異なりオッズ比が歪む

ネイマンバイアスNeyman bias (prevalence-incidence bias)

多症例対照研究が、受診者人口から患者群と対象群を得る → 受診前高死亡疾患、軽度疾患では患者群は疾患代表標本とならない

紹介バイアスreferral bias

研究集団と一般集団特性の系統的差によるエラー

Ex. ボランティアのみ、死亡患者除く、特定施設来訪患者referral patientsのみ → 一般化できない

無回答者バイアス non-respondent bias

試験群(対照群)間で、調査に応じた比率が偏るため結果が歪む

調査実施時バイアス

情報バイアス information bias → 誤分類 misclassification
誤分類: 曝露評価や疾病評価 → 系統的に誤った評価(分類)を犯す

nondifferencial misclassification: [仮定] コホート研究で曝露分類時に生じる誤分類は、疾病発生有無と無関係に生じる
Differencial misclassification: ケースやコントロールであることの情報がmaskingされない状況では、インタビューが曝露分類を行う場合、ケース側により詳細なインタビューを行い、コントロールとの間で曝露把握の正確性に差をもたらす可能性
→ 曝露側か疾病側にnondifferential misclassification生じた場合は、リスク比やオッズ比の値を真値から「影響なし」方向に歪め(比尺度なら1に、差尺度なら0に近づく)、differential misclassificationの場合は歪める方向が一定しない

(交絡要因 confounding factor, confounder)

交絡 confounding

非曝露グループが「曝露を受けなかった場合の曝露グループ」と同じにならない → 交絡存在 → 比較グループ間の構成がアンバランス
交絡要因必要条件

疾病リスクファクターで、
曝露変数と関連し､
曝露結果の因果連鎖の間にある変数ではない

交絡制御 =

制限 +
マッチング(効率化) +
層別解析(加重平均) +
多変量モデル(Black Box的解析)

層別解析(主に年齢階級や性別による調整)

直接法による調整 → (年齢)調整死亡率(age) adjusted mortality rate
間接法による調整 → 標準化死亡比standardized mortality ratio, SMR
マンテル・ヘンツェルMantel-Haenszel推定 → 要約率比・リスク比・オッズ比

SMRとMantel-Haenszel推定値: 以下の何れかの場合に両者は類似値示す

各層で観察された比に大きな違いがない
曝露群・非曝露群でも、観察された人-時間合計が各層で大きな違いない
各層において、非曝露群の人-時間が曝露群に比べて極めて大きい
→ 各層の値がほぼ均一の場合Mantel-Haenszel推定値を、各層の値が異なる場合SMRを用いる
※ 層別解析(+ 多変量モデル)は各層の影響の尺度がほぼ一定な時に使用すべき ↔ 層毎の値が大きく異なる場合は要約・調整しない

観察者バイアス observer bias(面接者バイアスinterviewer bias)

調査者が、(無)意識的に仮説・予測知り、先入観に応じデータ収集・判断偏る

想起バイアス recall bias

事象(経験)記憶想起時に正確(完全)さが異なる ⇒ Ex. 調査者がブラインドでも、被験者は通常ブラインドにできず試験群の方での影響をより多く想起

群間デザインバイアス between-group design bias

検出バイアス detection bias (施行バイアス performance bias)

測定方法が相同でないこと

回避法 = マスク化 → 無理なら測定を完全に操作化・構造化

罹病性バイアス susceptibility bias

調査対象者初期状態で結果発生頻度に差が発生

回避法: 無作為割り付けしかない → 未知因子へも均等に分布させられる

測定バイアス instrument bias

精査バイアス(確認バイアス) work-up bias: 1群が不十分情報を多く含む Ex. 陽性者のみgold standard検査

移転バイアス transfer bias

結果に至る途中で当初群からの脱落や別群へ移動等で結果が歪む

期間バイアス length bias

変化が遅い標本の方が頻繁にスクリーニングされ高頻度で検出される

リードタイムバイアス lead time bias (zero time shift)

検診による早期発見期間lead timeだけ生存率計算始点が前にずれ延長し過剰推定 → 自然経過中の開始時点が統一されないため起こる系統的誤差

初発症状バイアス protopathic bias

初期状態のため要因暴露され、要因結果関係を誤って検出

Ex. 胎児異常不正出血 → 対照療法的ホルモン投与実施 → ホルモンが奇形を生じたと結論する誤り

参照バイアス review bias

試験参照バイアス test-review bias

診断特性等検査index test判定時に標準検査結果参照により起こる

診断参照バイアス diagnosis-review bias

標準的検査判定(解釈)時に目的検査結果を参照すると起こる影響

出版バイアス publication bias

統計的有意差でた研究 → 優先報告 (インパクトファクターImpact factor, IF)

言語languageバイアス (英語)

研究発表は英語 - 英語論文しか引用されない

IFバイアス impact factor bias / 引用バイアス citation bias

高IF誌掲載/頻繁引用 = 説得力高い → 偏り(根拠のない権威)

[ 因果関係 ]

因果推論 (causal inference)

[無理だろ]

統計的因果推論 (causal inference in statistics)

傾向スコア propensity score, PS

観察: 無作為抽出困難 + 交絡(1つとは限らない)

交絡要因 = 共変量 ⇒ 調整 - 因果効果推定

Ex. ロジスティック回帰分析・プロビット回帰分析・判別分析・決定木・ニューラルネットワーク・一般化加法モデル・多項ロジットモデル

☑ 複数交絡因子の情報を集約した指標
☑ 交絡調整が目的 ≠ 曝露効果の正確予測
☑ アプローチにより異なる結果と解釈が起こる

⇒ 共変量選択がポイント

無作為化比較試験 randomized controlled trial, RCT
ランダム化(無作為化): 標本を複数群に無作為に分ける

= 交絡因子の影響小さくなる → 処理効果に集中して検証

回帰分断デザイン/回帰不連続デザイン

= regression discontinuity design, RDD
要因効果を推定する(準)事前事後実験デザイン

無作為化比較試験となるのが理想
検出率極めて低い(第2種の過誤)

操作変数法 method of instrumental variables, IV

無作為化比較試験が困難な時の因果関係推定法