Top
個別メモ
Latest update on 2012年3月5日 (月) at 10:54:46.
【第411回】 見方の違い(2005年11月9日)
- 6:30起床から投げ込み,食事,往路あさま504号までは昨日と同じ。
- モデルによって何らかの評価を行う場合に,入力に見込まれる誤差の扱いは,大きなポイントだと思う(ここまでは,たぶん一般的に正しい)。そういう場合,シナリオごとに評価をすればいいという視点は,たぶん間違っていて,すべてをひっくるめて評価しなくてはならないと思う。ごく単純な例でいえば,観測値が10, 100, 1000とあった場合,平均値の95%信頼区間は[-990, 1730]となるし,99%信頼区間なら[-2767, 3507]となる(Rでt.test(c(10,100,1000),conf=0.99)としてみたらわかる)。けれども,観測値が100, 200, 1000だった場合,99%信頼区間の上限は3260となり,低い観測値があった場合よりも低くなる。入力データの信頼性が乏しい場合は,低い観測値の存在が信頼区間の上限を押し上げることさえあることがわかる。シナリオごとの評価では不十分なのは,そのためである。こういう場合,たぶん理論モデルだけで分布論で済ますのは無理っぽいので,入力にかなりの
偶然誤差を見込んだシミュレーションをしなくてはいかんのではないか。このネタで暗黙の対象としている事象の場合,評価のためのアウトプットも誤差が大きい可能性がいくつも指摘されているので,意味のある解を引き出すことは,誰がやっても難しいんではなかろうか。
- 11ページの表4にある「5〜6割」というのは凄い誤植だと思うが,どうやって文書を作るとこういう誤植ができるのか不思議だ。
- Windows Update。2件。再起動を要求されるのが嫌。
- 西浦さんの日々の勉学メモに紹介されているChristley RM et al. (2005) Infection in social networks: Using network analysis to identify high-risk individuals. AJE, 162(10): 1024-1031.を読む。ネットワークはUCInetとFortran 95,感染確率はR,生存時間解析はS-PLUS,とツールを使い分けている。どうせなら全部RにImplementして公開すれば誰でも追試できるのに,難しいんだろうか。あと気になったのは,たしかにFig.1は美しいし,モデルとしてはクリアで凄いが,identified coreは実データ上で特定できるんだろうかという点。ていうか,実データをどういうデータ構造にすると,このモデルとリンクできるのかが想像できない。いや,ぼくがアホなだけかもしれんが。
- 面倒そうな仕事が2件入ったり(関心ないんだが立場上断れない),地域保健実習の相談が何件も来たりして,何度も中断するので,仕事が進まない。
- サステナビリティの科学的基礎に関する調査の報告書は,教科書的によくまとまったレビューになっていると思う。これが無料で提供されているのはありがたい。この報告書を作ったRSBSの代表は,元三重県知事だよな。構想ができてから報告書完成まで5ヶ月というのは,レビューワークであり,金と人を大量投入したからできたことではあるが,素早いと思う(もっとも,松田裕之さんの公開書簡などを見る限り,もしかすると拙速という面があるのかもしれない)。パブリシティは今ひとつかもしれんが。
- 今日も復路あさま563号。
▼前【410】(いろいろ(2005年11月8日)
) ▲次【412】(朝から原稿を1本(2005年11月10日)
) ●Top
△Read/Write COMMENTS
Notice to cite or link here | [TOP PAGE]