群馬大学 | 医学部 | サイトトップ | 医学情報処理演習

医学情報処理演習第5回「データの分布と検定の概念」課題

2008年11月17日

(注)前回の課題の解答例は,http://phi.med.gunma-u.ac.jp/medstat/it04-2008-r.htmlに示してあります。

課題

http://phi.med.gunma-u.ac.jp/medstat/p05-2008.txtは,総務省の国勢調査結果から作成した,全国の市の平成12年国勢調査から平成17年国勢調査の間の人口増加率(変数名はH12H17R)のデータである。この人口増加率データが正規分布しているかどうか検定し,結果を考察せよ。なお,検定の有意水準は5%とする。学籍番号・氏名とともに,下のフォームにRのコードと考察を貼り付けて送信すること。

(注)なお,帰無仮説にデータが一致しすぎている場合もあって,そういう場合は捏造あるいは都合のいいデータだけを使った可能性を疑うべきである。有名な例はメンデルのエンドウマメであり,偶然のばらつきもあるはずなのに,それが極端に少なく,データが分離の法則に一致しすぎていたとフィッシャーが指摘している。他の例としては,第二水俣病発覚当時,昭和電工が出してきた上流域住民の毛髪中水銀濃度の分布が,対照地域の住民の毛髪中水銀濃度の分布と一致しすぎていたことが挙げられる。水銀汚染がないといいたいがために,差がなさ過ぎるデータを作ってしまったのであろうと言われている(出典:田栗正章・藤越康祝・柳井晴夫・C.R.ラオ『やさしい統計入門』講談社ブルーバックス)。

解答フォーム

項目入力欄
学籍番号
氏名
メールアドレス
解答(Rのコード)
解答(考察)