群馬大学 | 医学部 | サイトトップ | 医学情報処理演習
途上国のある村で年齢階級別の人口と死亡数を調べた結果,以下の表が得られたとする。作図した上で,年齢階級によって死亡率に差があるか検定せよ。もし有意だったら,どの年齢階級とどの年齢階級に差があるのか検討せよ。なお,検定の有意水準は5%とする。
年齢階級 人口 1年間の死亡者数 30歳未満 320 24 30歳〜49歳 120 12 50歳以上 110 22 学籍番号・氏名とともに(注:絶対に忘れないこと!),下のフォームにRのコードと考察を貼り付けて送信せよ。
dead <- c(24,12,22)
pop <- c(320,120,110)
names(pop) <- c("-30","30-49","50-")
barplot(dead/pop)
prop.test(dead,pop)
pairwise.prop.test(dead,pop)
上記コードを実行すると,以下の出力が得られる。
グラフを見ると,50歳以上で死亡率が高いようにみえる。prop.test()により3群の死亡率に差がないという帰無仮説を検定した結果は,以下の通り帰無仮説は有意水準5%で棄却され,統計学的に有意な差があるといえる。
3-sample test for equality of proportions without continuity
correction
data: dead out of pop
X-squared = 13.6074, df = 2, p-value = 0.001110
alternative hypothesis: two.sided
sample estimates:
prop 1 prop 2 prop 3
0.075 0.100 0.200
次にどの年齢階級とどの年齢階級の間に差があるのかを見るため,pairwise.prop.test()関数を使い,Holmの方法で検定の多重性を調整した比率の差の検定を行うと,以下の結果が得られ,30歳未満群と50歳以上群の間で,死亡率に有意差がある(p=0.0015)ことがわかった。
Pairwise comparisons using Pairwise comparison of proportions
data: dead out of pop
1 2
2 0.5113 -
3 0.0015 0.1027
P value adjustment method: holm