【第1957回】 実習総括とオンライン審査と院生対応など(2025年11月10-13日)
- 月曜は7:00起床。適当に豚肉野菜炒めを作り、納豆掛け玄米ご飯とともに朝食を済ませてからChapter 7の資料更新を完了させた。その後、Environmental Healthの資料更新も済ませてから名谷キャンパスに出勤。
- まずは検査専攻の実習総括にでて専攻主任として一言喋ってから、オフィスに戻って国際協力研究科の院生のワークショップに参加。
- 夜ドラ「ひらやすみ」は「いつか、無重力の宙で」とはまったく違ったベクトルで素晴らしいドラマで、楽しんでみているが、それ以上に「シナントロープ」が面白い。シナリオノベライズを最後まで読んでしまったので、結末はわかっているのだが、それでも面白い。劇伴や撮影もセンスが良くて素晴らしい。
- 火曜は公衆衛生実習で基本実験データの統計解析方法について説明した。Excelでテキスト形式(タブ区切りまたはコンマ区切り)でデータを保存する方法は常識だろうと思って一言しか触れなかったところ、やり方がわからずに困っている学生がいて驚いた。今年はjamoviでの分析方法もざっくり説明したが、クロスオーバーデザインのときの指定がやや複雑なので、後でちゃんと調べてテキストに追記せねば。
- 水曜は運営会議と病院長等懇談会があった。国際協力研究科からのメールでの問い合わせに答えていたら20:00を過ぎてしまった。
- 木曜は六甲に出勤して一日講義。今日は当初予定していた発表者が暫く前に仕事の都合でキャンセルした穴が埋まらなかったため、ゼミは休み。
🦋 (list)
【第1956回】 講義準備など(2025年11月9日)
- 日曜は雨。外出できないと太るんだよなあ。
- 毎週のことだが、2nd Edから3rd Edへの変化が大きくて、Epidemiologyの講義準備が大変。Chapter 7の資料作りもまだ終わらない。
- ハモネプの本戦出場チームが発表されていたが、うーん、Rabbit CatもNarinも消えたか。やはりプロアマ問わずといっても、リトグリに曲を書くような人がメンバーなグループは別格ということで出さないのかもしれないなあ。それなら最初からアマチュア限定にすれば良いようにも思うが、Mona Shirakawaさんはプロと言えばプロのような気もするから、それだとME2も排除されてしまうから、敢えてレギュレーションとしてはプロアマ問わずとして運用でプロの選考基準を厳しくするみたいなやり方になっているのかもしれない。憶測に過ぎないが。うたごえぽろぽろが全員パフォーマンスのひたむきさが売りの高校生と同じブロックというのは、審査員を悩ませるだろう。軸が違いすぎる。でも、うたごえぽろぽろを決勝に進ませなかったら、アカペラ選手権としてのハモネプの存在価値には疑問符が付く。それくらい、うたごえぽろぽろのコーラスは突き詰められているし、美しい(ハルモネア優勝時のメンバーのままならば)。もっとも、これまでのハモネプの流れからすると、ハイスクールバンバンで一世風靡した天音さんや、PLUS Unison.やAGSを主催しているりょーたさんや、New SchoolerやJETSや8Lawのサポートもしていたばやしさんなど、アカペラファンにとっては有名人ばかりで構成されているあまのんが優勝しそうな気もするなあ。テレビ番組だからなあ。
- やっと立花孝志氏が逮捕されたか。なぜこんなに時間が掛かったのかが謎なくらいだが、検察と警察がこれだけ時間を掛けて逮捕したということは、起訴をして有罪までもっていける確信がもてたということでもあろう。
- 日付が変わったが、まだChapter 7の資料更新が終わらない。が、疲れたので眠ってしまおう。
🦋 (list)
【第1955回】 カテゴリ3つ以上の割合の信頼区間(2025年11月8日)
- 土曜は卒業生からメールで届いていた統計相談に答えた(間に合ったかどうかわからないが)のでメモしておく。
- カテゴリ変数について割合の信頼区間を計算するには、通常、二項分布を仮定してClopper and Pearsonの方法を使う(『Rによる保健医療データ解析演習』の第9章、9.3に書いた通り)。しかし、カテゴリが3つ以上ある場合、各カテゴリの割合は独立ではない(もちろん2つの場合も片方のカテゴリの割合が決まれば、残りも自動的に決まってしまうわけだが、1つのカテゴリが生起する確率、と考えれば二項分布を普通に適用して差し支えない)ので、別のアプローチをした方が良いと思われた。
- 自分の本にも書かなかったけれども、カテゴリ3つ以上の場合の、各カテゴリの割合の信頼区間の推定についても、既に多くの研究があり、Rでも実装しているパッケージがある。DescToolsパッケージのMutinomCI()関数である(もっとも、DescToolsパッケージのvignettesの1つの13.1の解説にあるように、カテゴリ3つ以上でも二項分布を当てはめて信頼区間を求める、BinomCI()という関数も用意されているので、必ずしも各カテゴリについて二項分布で信頼区間を推定して悪いわけではないと思われる→正しくは、個々のカテゴリの割合についての95%信頼区間を求めるのか、すべてのカテゴリの割合について95%同時信頼区間を求めるのか、という違いで、どちらも間違いではない。黒木さん、ご指摘ありがとうございました)。
- MultinomCI()関数にはさまざまな信頼区間推定方法が実装されていて、古くからあり他のパッケージでも実装されているものもあるらしいGoodman (1965)の方法も、method="goodman"というオプションを指定すれば使えるが、デフォルトがSison and Glaz (1995)の方法(明示的にオプション指定するにはmethod="sisonglaz"だが、省略できる)なので、特別な理由がなければそれで計算するのが良いと思う。DescToolsパッケージを引用するには、Signorell A (2025). _DescTools: Tools for Descriptive Statistics_. doi:10.32614/CRAN.package.DescTools, R package version 0.99.60を文献として引用すれば良く、カテゴリ3つ以上の信頼区間の推定方法としては、Sison and Glaz (1995)の方法を使ったと書いて、Sison CP and Glaz J (1995) Simultaneous confidence intervals and sample size determination for multinomial proportions. Journal of the American Statistical Association, 90:366-369.を引用すれば良い。
- 使い方は簡単で、例えば、『Rによる保健医療データ解析演習』の9.5.1で、1日当たりの交通事故件数の分布がポアソン分布に従うかどうかをカイ二乗適合度検定で調べる方法を説明したデータを使えば、まず、install.packages("DescTools", dep=TRUE)でDescToolsパッケージをインストールしておいて、それをlibrary(DescTools)で呼び出したら、後はいきなりMultinomCI(c(79, 61, 13, 1, 1), method="sisonglaz", conf.level=0.95, sides="two.sided")と打てば良い。95%両側信頼区間をSison and Glaz (1995)の方法で求めるというデフォルトで良いならばこれらのオプション指定は不要なので、たんにMultinomCI(c(79, 61, 13, 1, 1))で良い。結果として返ってくるオブジェクトは、列名付きの行列なので、例えばresというオブジェクトに付値しておけば、sapply(as.data.frame(res), function(x) sprintf("%4.3f", x))によって、小数点以下3桁だけ表示させることもできる。
- Xでこの件を(Google blogに統計メモとして転載したものへのリンクと併せて)ポストしたところ、奥村さんと黒木さんからコメントがついて、たしかにもう少し丁寧に考えて書いておかないと良くないかもしれないと思った。ちょっと時間が掛かると思うけれども、とりあえず、個々の割合についての信頼区間を考えるときは二項分布で差し支えないけれども、多重比較で帰無仮説族全体についての有意水準の調整をしたり、中でもTukeyのHSDで平均値の同時信頼区間を計算したりする場合と同様に、すべてのカテゴリの割合について同時信頼区間を求めたいならばMultinomCI()で使われているような考え方が必要になる、とざっくり考えておけば大きな間違いはしないのではないかと思われる。
🦋 (list)
鐵人三國誌:テーマ別リスト | 鐵人三國誌:日付順リスト
▼前【1954】へ(ワークショップと会議(2025年11月5-7日))
🦋 = Cite and link each article to post bluesky, if you have logged in bluesky.
Written by Minato Nakazawa, Ph.D. | Notice to cite or link here | [TOP PAGE]