(2021年5月17日更新) [ 日本語 | English ]
HOME > 講義・実習・演習一覧 / 研究概要 > 小辞典 > 統計学 > メタ解析
メタ解析(メタ分析・メタアナリシス) 系統的レビューの1種 = 研究間結果の統計学的統合 [仮定: 系統的レビューと同] バイアスなし → 結果(相対危険度、リスク差、オッズ比等)を量的併合 統合法 → 統合結果の統計的証拠 statistical evidence = 検定
|
(Nakagawa & Cuthill 2007) メタ分析的思考= メタ分析の有益性
|
複数の文献・成果から全体的結論を導く一連の過程 → 個別研究では見えない疑問解決手技とし有力 一般化 generalizability
Def. 系統的再評価で得た結果が他状況にある集団に適用できる度合
仮説1つに絞る → 一般的レビューと異なる点 |
使用データベース・検索方法および論文選択基準は再現性あるよう記載 標準的検査 gold standard (reference standard)一般的に認められた調査測定方法 → よく新検査法と比較される |
測定基準
有意水準、効果サイズの不均一性(χ²-test) |
解析手順各論文で使用された検定、n (標本数)、期待された効果の方向、Z, p値を抽出抽出されたn, Z, pよりr, r², rのFisher補正値、d (2グループ間の平均差)算出 これらの指標の他に出版年等必要情報を加えた表を作成 表に基づいて解析を行う → Z, r, Z (Fisher)を重み付けして結合する有意水準指標t-test: Z = (df(log(1 + t2;/df)))1/2·(1 - 1/2df)1/2, r = (t2/(t2 + df))1/2χ2-test: χ2(1) → Z = √χ2, r = (χ2/n)1/2 Z (Fisher) = 1/2·(log((1 + r)/(1 - r))) 推測値が極端な値を取る場合にrの分布が歪むのを補正 d = (4r2/(1 - r2))1/2→ Z, r, r², dにより各論文の検定が異なっていても比較できる Ex. n = 10, r = 0.500 → Z (Fisher) = 0.549, d = 1.155, t(8) = 1.633, F(1, 8) = 2.667, χ²(1) = 2.500 |
ここがやりたいのよ!
遷移研究への応用火山遷移 (volcanic succession)遷移 (succession) |
= 効果量, 効果の大きさ (effect size): 中心概念 - 変数間の関係の強さ(strength of association)を表す指標
p値: 標本数が増えると有意差はでやすい Ex. n = 10 (p > 0.05) vs n = 1000 (p < 0.05) → 標本サイズで変化しない標準化された指標 = その現象が母集団で存在する程度効果サイズ指標標準化効果量 standardized effect size
非標準化効果量 unstandardized effect size
平均値差 |
Cohen's d= (m1 - m2)/SpSp (プールした標本分散の平方根) = √((Σ(XA - X-A)2 - Σ(XB - X-B)2)/(nA + nB -2)) Hedges's g= (m1 - m2)/spsp (プールした標本不偏分散の平方根) 検定と効果量の関係 検定統計量 = 効果の大きさ × 標本の大きさt = (y-1 - y-2)/s*√(1/n1 + 1/n2) = d·√(n1n2/(n1 + n2)) Ex. n1 = n2 ⇒ n1n2/(n1 + n2)n = 1 → 1/2 = 0.5, n = 5 → 25/10 = 2.5 |
検定(分析) | 対象 | 効果量指標 | 効果の目安 | ||
小 | 中 | 大 | |||
相関 | r | 0.10 | 0.30 | 0.50 | |
重回帰 | R2 f2 |
0.02 0.02 |
0.13 0.15 |
0.26 0.35 |
|
t検定 | 対応あり・なし | r d |
0.10 0.20 |
0.30 0.50 |
0.50 0.80 |
一元配置分散分析 (onw-way ANOVA) |
主効果 | η2 partial η2 ω2 f |
0.01 - 0.01 0.10 |
0.06 - 0.09 0.25 |
0.14 - 0.25 0.40 |
多重比較 | r | 0.10 | 0.30 | 0.50 | |
二元配置分散分析 多元配置分散分析(multi-way ANOVA) |
主効果 | η2 partial η2 ω2 |
0.01 - 0.01 |
0.06 - 0.09 |
0.14 - 0.25 |
交互作用 | η2 partial η2 ω2 |
0.01 - 0.01 |
0.06 - 0.09 |
0.14 - 0.25 |
|
多重比較 | r | 0.10 | 0.30 | 0.50 | |
共分散分析* | |||||
多変量分散分析(MANOVA) 多変量共分散分析(MANCOVA) |
多変量検定 | multivariate η2 multivariate partial η2 (R2) |
- - |
- - |
- - |
各従属変数の分散分析* | |||||
χ2検定 | 2 × 2分割表 | φ (= W) | 0.10 | 0.30 | 0.50 |
n × m分割表 | Cramer's V | 0.10 | 0.30 | 0.50 | |
マン・ホイットニーのU検定 ウィルコクソンの符号順位和検定 クルスカリス・ウォリスの順位和検定 フリードマン検定 |
検定統計量をZ変換しr求める | r | 0.10 | 0.30 | 0.50 |
元来持つ規則に基づく歪みにより統計的結果の表現式が成立しない(s.s.) → 研究結果を歪めるもの: 観察研究において、制御不能・不足から生じる 発生時期: 研究計画・対象者選択時 / 実施時 / 解析時 / その他 推定が真値からずれた結果や推定、そのプロセス → 系統的systematicに誤差を含む推測全過程(データ収集、解析、解釈、出版)で結果・結論を事実とは体系的に異ならせるもの(s.l.)
対象バイアス subject bias (選択バイアス selection bias)当該母集団の代表的標本群とならず結果が歪む範囲バイアス, Berkson -, Neyman -, 紹介-, 無回答者- 範囲バイアス spectrum bias対象標本が偏るため評価に偏りが生じるバークソンバイアス Berkson's bias症例対照研究で、病院内は症例がより多くの暴露事例を含むため暴露率が異なる。要因暴露の有無で有疾患や非有疾患で受診率が異なりオッズ比が歪むネイマンバイアスNeyman bias (prevalence-incidence bias)多症例対照研究が、受診者人口から患者群と対象群を得る → 受診前高死亡疾患、軽度疾患では患者群は疾患代表標本とならない紹介バイアスreferral bias研究集団と一般集団特性の系統的差によるエラーEx. ボランティアのみ、死亡患者除く、特定施設来訪患者referral patientsのみ → 一般化できない 無回答者バイアス non-respondent bias試験群(対照群)間で、調査に応じた比率が偏るため結果が歪む調査実施時バイアス情報バイアス information bias → 誤分類 misclassification誤分類: 曝露評価や疾病評価 → 系統的に誤った評価(分類)を犯す
nondifferencial misclassification: [仮定] コホート研究で曝露分類時に生じる誤分類は、疾病発生有無と無関係に生じる (交絡要因 confounding factor, confounder) 交絡 confounding非曝露グループが「曝露を受けなかった場合の曝露グループ」と同じにならない → 交絡存在 → 比較グループ間の構成がアンバランス交絡要因必要条件
|
層別解析(主に年齢階級や性別による調整)
各層で観察された比に大きな違いがない 観察者バイアス observer bias(面接者バイアスinterviewer bias)調査者が、(無)意識的に仮説・予測知り、先入観に応じデータ収集・判断偏る想起バイアス recall bias事象(経験)記憶想起時に正確(完全)さが異なる ⇒ Ex. 調査者がブラインドでも、被験者は通常ブラインドにできず試験群の方での影響をより多く想起群間デザインバイアス between-group design bias検出バイアス detection bias (施行バイアス performance bias)測定方法が相同でないこと回避法 = マスク化 → 無理なら測定を完全に操作化・構造化 罹病性バイアス susceptibility bias調査対象者初期状態で結果発生頻度に差が発生回避法: 無作為割り付けしかない → 未知因子へも均等に分布させられる 測定バイアス instrument bias精査バイアス(確認バイアス) work-up bias: 1群が不十分情報を多く含む Ex. 陽性者のみgold standard検査移転バイアス transfer bias結果に至る途中で当初群からの脱落や別群へ移動等で結果が歪む期間バイアス length bias変化が遅い標本の方が頻繁にスクリーニングされ高頻度で検出されるリードタイムバイアス lead time bias (zero time shift)検診による早期発見期間lead timeだけ生存率計算始点が前にずれ延長し過剰推定 → 自然経過中の開始時点が統一されないため起こる系統的誤差初発症状バイアス protopathic bias初期状態のため要因暴露され、要因結果関係を誤って検出Ex. 胎児異常不正出血 → 対照療法的ホルモン投与実施 → ホルモンが奇形を生じたと結論する誤り 参照バイアス review bias試験参照バイアス test-review bias診断特性等検査index test判定時に標準検査結果参照により起こる診断参照バイアス diagnosis-review bias標準的検査判定(解釈)時に目的検査結果を参照すると起こる影響出版バイアス publication bias統計的有意差でた研究 → 優先報告 (インパクトファクターImpact factor, IF)言語languageバイアス (英語)研究発表は英語 - 英語論文しか引用されないIFバイアス impact factor bias / 引用バイアス citation bias高IF誌掲載/頻繁引用 = 説得力高い → 偏り(根拠のない権威) |
[ 因果関係 ]
[無理だろ] 統計的 因果推論 (causal inference in statistics)傾向スコア propensity score, PS観察: 無作為抽出困難 + 交絡(1つとは限らない)交絡要因 = 共変量 ⇒ 調整 - 因果効果推定 Ex. ロジスティック回帰分析・プロビット回帰分析・判別分析・決定木・ニューラルネットワーク・一般化加法モデル・多項ロジットモデル
☑ 複数交絡因子の情報を集約した指標 |
無作為化比較試験 randomized controlled trial, RCT ランダム化(無作為化): 標本を複数群に無作為に分ける = 交絡因子の影響小さくなる → 処理効果に集中して検証 回帰分断デザイン/回帰不連続デザイン= regression discontinuity design, RDD要因効果を推定する(準)事前事後実験デザイン
無作為化比較試験となるのが理想 操作変数法 method of instrumental variables, IV無作為化比較試験が困難な時の因果関係推定法 |