群馬大学 | 医学部 | サイトトップ | 医学情報処理演習

医学情報処理演習:第7回課題の解答例

課題

carライブラリに含まれているデータフレームWomenlfは,1977年に263人のカナダ人女性を対象として調査した,労働参加状態(変数partic,3つの値fulltimenot.workparttimeのどれかをとる),夫の年収(変数hincome,単位は1000カナダドル),子供の有無(変数childrenabsentpresentのどちらか),居住地域(変数regionAtlanticBCOntarioPrairieQuebecのどれか)についてのデータである。このデータフレームを使って,女性の労働参加状態によって夫の収入に差があるかどうか,あるとしたらどの群とどの群の間で差があるのかを検討せよ。検定を行う場合は,有意水準は5%とする。

学籍番号・氏名とともに,下のフォームにRのコードと考察を貼り付けて送信せよ。

解答例

library(car)
str(Womenlf)
attach(Womenlf)
 stripchart(hincome ~ partic, method="jitter", vert=T, 
  main="Husband's income by wife's working status.")
 mx <- tapply(hincome,partic,mean)
 sx <- tapply(hincome,partic,sd)
 ix <- 1:length(table(partic))+0.1
 points(ix,mx,pch=18)
 arrows(ix,mx-sx,ix,mx+sx,code=3,angle=90)
 bartlett.test(hincome ~ partic)
 oneway.test(hincome ~ partic)
 pairwise.t.test(hincome,partic)
 TukeyHSD(aov(hincome ~ partic))
detach(Womenlf)

上記コードを実行すると,以下の出力が得られる。

女性の労働参加状態別夫の収入

図を見ると,1977年のカナダ女性では,女性の労働参加状態によって,夫の収入の平均値には差がありそうである。ばらつき具合をbartlett.test()でチェックした結果は,下記の通り有意な差は認められなかった。

data:  hincome by partic 
Bartlett's K-squared = 3.9325, df = 2, p-value = 0.1400

Welchの拡張による一元配置分散分析の結果は,下記の通り,女性の労働参加状態を示す変数が,夫の収入に有意な効果を示した(参考:結果は示さないが,通常の一元配置分散分析でも同様に有意である)。

data:  hincome and partic 
F = 7.5844, num df = 2.000, denom df = 97.827, p-value = 0.0008666

次にどの労働状態とどの労働状態の間で夫の収入に差があるのかをみるため,多重比較を行う。まず,holmの方法で検定の多重性を調整したt検定の結果は,

         fulltime not.work
not.work 0.0025   -       
parttime 0.0115   0.7630  

となり,まったく働いていない女性とパート勤務をしている女性の間では夫の収入に差がないという帰無仮説は棄却されないが,フルタイムで働いている女性は,まったく働いていない女性とも,パート勤務をしている女性とも夫の収入が有意に異なることがわかった。念のため,TukeyのHSDを実行すると下記の結果が得られ,同様の結論を得る。

                       diff        lwr      upr     p adj
not.work-fulltime 3.5200391  1.0670259 5.973052 0.0023818
parttime-fulltime 3.8917749  0.5975228 7.186027 0.0158117
parttime-not.work 0.3717358 -2.5315125 3.274984 0.9510350

リンクと引用について