KuboWeb top

更新: 2012-11-21 15:11:17

生態学のデータ解析 - Gamma 分布の GLM

  • LinksRenv一般化線形モデル の推定関数 glm() でデータのばらつきをガンマ分布 (family=Gamma) を指定したときの統計モデリングに関するメモです (かきかけ)

注意すべき特徴

  • ここでは R のガンマ分布の確率分布関数の記法である shaperate パラメーターを使ったものにします
    • つまり平均は shape/rate で分散は shape/rate^2

dispersion parameter phi も推定される

  • dispersion パラメーター phi については Faraway の赤い GLM 本など参照
    • 分散 = phi × 平均2
  • 平均を m とすると shape = 1/phirate = 1/(phi*m)
    • ただし phi は最尤推定されているわけではなく chi^2/(n-パラメーター数) で推定されているようだ (上記 Faraway 本にも同様の説明あり)
(R の summary.glm() のコードからの抜粋)
df.r <- object$df.residual
……
sum((object$weights * object$residuals^2)[object$weights > 0])/df.r

iwanami04.png

ゼロデータ問題

  • glm(y ~ ...) とした場合に,応答変数 y にゼロが含まれている場合は推定計算をしてくれない
  • ごまかしわざ?: y 全体に微小な値をたす? y.cheat <- y + 1.0e-9