Top

個別鵯記

Latest update on 2018年3月7日 (水) at 15:42:47.

目次

【第1254回】 日本人口学会関西部会(2016年3月5日)

会場に着くまで
6:00起床。実は昨夜も風呂を追い炊きしただけで眠ってしまったので,まずは入浴と洗髪。その後,昨夜のスープを温め直し,電子レンジ加熱した餅を1個入れて朝食。三宮,京都,国際会館前と経由して,9:40頃地球研着。予定通り10:00にスタート。以下メモ(時々感想も差し挟みながらの私的なメモなので,例によって内容は無保証)。
オープニング
川口部会長から主旨説明。第1期の関西部会のテーマは,「人口学方法論の再構築」と「人口変動の要因解明:伝統社会から近現代へ」。今回のGISへのフォーカスは「人口学方法論の再構築」の一つ。地域人口学,歴史人口学,空間疫学,情報学にかかわる成果を報告していただき討論する。プログラムの説明。
(1) 酒井高正(奈良大学)「昨今のGISデータと人口分析」
普段はGISの普及啓蒙活動をしている。e-Statは地理学者にとっては「地図や図版で見る」のところをよく使う。とくに「統計GIS」と「地図による小地域分析(jSTAT_MAP)」を使う。統計GISは2つのパートからなる。「地図に表す統計データ」というwebベースのものと,「データダウンロード」。前者も少しずつ使いやすくなってきた(Flashを有効にしなくてはいけないが,ブラウザだけで操作できる。PCよりもタブレットフレンドリー)。jSTAT_MAPは登録制だがとくに資格はいらない。webから簡単に申し込める。「お試し版」なら登録しなくても使える。
jSTAT_MAP使用例
Graph Wizardでは例えば250mメッシュの国勢調査人口による塗り分けなど簡単にできる(↑例)。Report Wizardを使えばExcelのファイルとして出力できる。自分で作ったデータをアップロードして描画するとか,2つの地図を並べてみるとかも可能。アドレスのマッチングには,東京大学CSISのgeocodeが有名だが,それよりもjSTAT_MAPの方が精度が良い(プレゼンでは奈良県の例で例示があった)。統計GISのデータダウンロードは統計データと境界データをセットでダウンロードするようになっている(zip圧縮されているので展開は必要)。
統計GISのダウンロードメニュー操作画面例
MANDARAでも利用できる。境界データとしては,世界測地系緯度経度・Shape形式をよく使う。ArcGISやQGISでは,統計GISのファイルを使おうとすると統計データと境界データのマッチングが結構大変。MANDARAでは「マップエディタ>地図データ取得>統計GIS国勢調査小地域データ」を使うと簡単なので(かつ,予め基盤地図情報の等高線データなどをダウンロードしておけば,その情報を重ね合わせることができる),いったんMANDARAで読み込んでからShapeファイルを書き出し保存すると,ArcGISやQGISにデータ付きでインポートできて便利。
MANDARAのマップエディタに札幌市中央区のデータを取り込んだ後で表示される画面
問題点は,GISでは解像度をいくらでも上げられるので,境界データなどがどこまで精度が保障されているかという点。そのための制約もある。戸籍にもマイナンバーを振ることが決まったので,地籍図の地理情報がどれくらい公開されているか・入手可能かという質疑があったが,上記の理由もあってまだ十分ではないということだった。農業センサス結果については,農業集落カード(農水省自体が作成しているらしいので,もしかしたら地理情報データは国勢調査データと違っている可能性はある)の集落名単位でデータが入っている。動態統計はここからはダウンロードできないようだ。
(2) 奥貫圭一(名古屋大学)「江戸・明治初期の村ポリゴンデータの作成とその分析」
GIS学会編集委員長。歴史GIS研究グループ@名古屋大(溝口,奥貫,服部,森田,平松,Skinner GW)の仕事の紹介。Skinner先生は数年前に亡くなった。中国・ヨーロッパ・日本の歴史GISデータを構築されていた。ハーバード大学がデータを引き取った。そのうち日本のデータについては溝口先生も一緒に作ったので,このグループにコピーがある。国Kuni, 1888(明治 Meiji 21)ポリゴン,郡Gun,それらの重ね合わせを作った。中心地の点の分布もデータも作られている。Core Periphery Zones, 1884はSkinner先生がどうやって線を引いたのかわからない(参考:HarvardのG. W. Skinner Mapsから参照できる)。ベースにした地図はたぶん1:200,000 topographic map, 1887であろうと言われている。最近スキャンしてデータを載せてみたら,緯度経度は書かれているもののちゃんと測量したのではなさそう。この後の時代にちゃんと測量して作られた5万分の1とか2万5千分の1地図から推定された「絵図」であろうと言われている(位置の精度は信頼できない)。中心地の人口分布の階層性にSkinner先生は強い関心をもっていたので,地図にその情報が載っている。明治20年以降の行政区画のポリゴンは筑波大学村山先生(地理)が作った「行政区画変遷図」が1889(明治22)からある。旧高旧領取調帳(?)というのがあって,Excelで利用可能。しかし1890年以降くらい。1869年の美濃尾張のを作ってみようとしたのがSkinner先生と溝口先生。まず1890, 91の地形図(大日本帝国測地測量部),1:50000と1:25000がある。それをスキャンして線を引いてポリゴンにしていく。しかし線の位置がわからないところがたくさんある。そこで地籍図(各地の図書館に行って頑張って交渉すれば何とか入手できる)を見て,1つずつ照合してトレースした。それでもわからないところは近世の村絵図をみてランドマークの位置で確認。そういう手法でMura of Mino and Owari, Meiji 2というのがお二人によって作られた。データは古文書に村単位である。それを載せることができる。旧高旧領の石高のデータをGISに載せれば面積当たりの石高のコロプレス図が作れる。尾張でやってみると,明らかに西側が高い。地形を3D図にしてみると,西側が平野で東側は台地・丘陵地であることがわかる。地誌データで田圃や畑の面積を得て計算してみると,田の面積比率%(1672)を出した。畑の面積比率%も出した。どちらも西側が高い。そもそも田の方が圧倒的に多いが。島畑というのがあって,田圃の中に多目的な畑が点在していたため。その地図も作った(1841)。ここまでは溝口先生の本にも出ている話。今回やったのはローカルMoran統計量(空間自己相関の1つ)。田圃が卓越しているところが集積しているところを見ると北西部のみ,畑が卓越しているところの集積は南西部のみという結果。溝口先生の解釈では,伊勢湾に近い南西部の方が洪水にさらされる危険が多く,島畑の価値が高かったのではないかということ。この計算結果が出たのはGISのおかげ。分割手法として,中心地のデータを使ったボロノイ分割と道路によるティーセン分割は変わってくる。中心地の点分布解析を道路の距離で測るとか。中心地と集落の関係を図示するクロスK関数法(?)で分析してみると,中心地に近づいて集落が分布している傾向があることがわかった。溝口-Skinner方式では全国にやるのは無理なので,村山先生の方式で差分データを使って遡って再現するというのを試している。長野県で1889から1887を推定したら困難さがわかった。長野県はまだやりやすい方。<質疑>長野県は大字単位の復元地図が信濃毎日新聞から出版されている(川口先生)。村山先生のデータの正確さは? 線の位置は今の行政境界線だから,誤差の素性がわかっていてやりやすい。地震などで位置座標がずれると,国土地理院は修正する。今のGISソフトなら,正しく情報を入れてあげれば自動的に補正して重ねてくれる。けれども,古いデータを見るときは,地形や土地利用が変わってしまった場合に解釈が難しくなる。
(3) H-GISセッション「時空間分析のための情報技術」
◆関野樹(地球研)「時間に基づいた情報の可視化と解析」地理情報を時間に載せたらどうなるか? 空間情報は緯度経度の上にいろいろなデータが載る。時間情報は時間軸の上にイベントデータや数値の変化が載る。GISであれば空間範囲検索ができる。時間情報解析ツールでは時間範囲検索ができる。時間情報システムHuTimeと時間基盤情報の話。HuTimeは時間軸に沿って年表や時系列データをオーバーレイしていくことができる。年表ソフトはいろいろある。時系列解析ソフトもある。その両方を合わせて扱うソフトはほとんどないので開発したのがHuTime。動作環境はWindowsとLinuxらしい。(→これって目盛を細かくできればTime Allocation Studyにも使える? 系譜人口学とか出産歴分析にも使えそう)年表のキーワード検索ができる。ヒットしたレコードのハイライトとか抽出ができる。いくつものレイヤについて抽出したものを統合できる。滋賀県年表,琵琶湖年表,びわ湖開発資料年表,琵琶湖・淀川水資源開発環境関係年表の4つから「赤潮」または「プログレナ」を串刺し検索して「琵琶湖赤潮年表」を出力できる。よく見ると同じ表題の記事がいくつかあり,それは4つの年表がお互いに記事を参照した場合であろう。マスク機能もある。数値データの場合に,ある閾値以上の期間とか別の変数がある閾値以下の期間とかを抜き出せる。そのANDをとってその期間に起こったできごとを参照するということもできる。(例)風が強くて降水量があった日はどこかをだし,その日にあった災害を抽出できる。実は滋賀ではそれに当てはまった災害は大雪災害が多かった。中国雲南省,東北タイ,近世アジア交易,トウアン資料を使った中国の住血とマラリアの研究,続日本紀,宗門改帳にも使われている。web版のHuTimeも開発中。團十郎にも一部組み込んでいる。時間基盤情報は,基本年表,時間名辞書,暦変換など。それぞれ空間統計で言えば,ベース地図,地名辞書,測地系変換に相当する。基本年表は注目している出来事の相対的な位置を示す。出来事の背景を示すことにも使える。時代区分,主な出来事,人物,組織など。時間名辞書は,時間軸上の位置を得るとか,概念的・時間的な包含関係も示される。(例)「東日本大震災以後」から2011年3月11日以降に変換できる。暦変換フォームはExcelのシートになる。和暦,ユリウス暦,グレゴリオ暦等々。暦変換については,暦に関するLinked Dataになっている。解析はまだバッファリング解析などはできないが今後も実装していく。今は基盤情報に注力している。時間単位は秒までいける。データはCSVやKMLも読み込めるがXMLで専用エディタがある。Linked Dataとしていろいろな確度(日までわかる,年までわかるなど)のデータをまとめて扱える仕組みを作っているところ。日でも秒でも,実は期間であって点ではないので,時間は全部期間であるという扱いができる。
◆山田太造(東京大学史料編纂所・助教)「テキストデータを使うとどのようにフィールドが分類できるか?」データ工学,とくに問い合わせ処理,機械学習が専門。今日の話はスマトラ島の写真を見たときの観察を言葉にする仕方は人により様々「木が伐採されている。若木は植えられていない」「若木がいくらかある」「まだ舗装されていない」「伐採した木材を運んでいるトラックが走っている」「まだ森林が残っている」等々。観察記録としての記述,いわゆるフィールドノートはその例。主観的観察の集合は,他の人の記述だと異なる可能性が大。これと同じような場面・風景はないのか? と考える。写真を見比べるとこれが似ているというのはわかる。風景をみた記述の集合体から類似する場面を探索する方法はないか? フィールドノートを構造化して探す方法。場面データの表現は利活用しやすく多目的に利用しやすいものが良い(→セマンティックウェブ。RDF)。テキストマイニングの手法の1つであるトピックモデルを利用して場面を特徴付けする。1984年から1985年のスマトラ島の旅の観察記録を使って,Travel Routeを可視化。1日ずつ抽出して,そこに含まれる地名をGoogle Mapにフラグを立てることはできる(Google Mapの制限で線は書けない)。場面の類似度は出てくる言葉から共起を元にしてWord Cloudを描かせ,場面を元のテキストでは色分け表示できる。場面データの抽出。形態素解析。地域研究の研究者はこれをどういう活用したいかと尋ねたら回答がなかったのでseeds提案になった。さらにさらに地域研究者との対話を重ねながら進めていく必要がある。検索シナリオをうまく設定できるかどうかが鍵。テキストからの地名抽出などは自動でできる(時々失敗している)。(例えば,狩猟民が狩猟に行ってきた経路の聞き取りデータから離合集散のようなものが可視化できれば面白いが? 時間は制御できるが,空間はGPSをもって一緒に歩いて学習データというか辞書を作ればいける)
◆原正一郎(京都大学)「データベース構築支援ツール:Myデータベース」地域研究と地域情報学。元々はHuman-GISだったがその後Humanities-GISとかHealth-GISとかいろいろな意味を込めてH-GISという。地域研究していると書誌に載りにくい情報が多いので,場所と時間はいつもとれるからGISにきた。地域情報のかなりの部分はwebに載るので,それをbig dataとしてそこからデータを抽出したいというのが,実は山田先生の研究の行き先。GISの例としてHuMap(糖尿病高齢者の分布@タイとカンボジア国境付近)。REACAPによる人の人間関係の解析。500ヶ所くらいの町のデータの人間関係を示せる。師弟関係の多さによりコロプレス図を描くということもタイではやった。データベースは調査の基本だが,作る人によってデータベースは異質。調査データは一人ずつ違うので,それを統合するときには不均質なメタデータができる。CIASの課題は,第一歩としてMyDatabseという共通プラットフォームのデータベースを作って貰うこと(XMLだからどういう構造のデータでも載るが,表形式でなくてもいい。音楽や動画でもタグを付ければOK)。検索時はAPIを提供しているのでwebアプリなどから利用が容易。他施設のデータベースを連携して多言語で使えるようになっている(このサイト?)。
(4) 川口洋(帝塚山大学)・加藤常員(大阪電気通信大学)「牛痘種痘法の普及過程を復原する歴史GISの構築」
1768-1912年の日本の総人口をみると,1840年頃までおよそ一定,1846-1872頃増加が始まった(ぼくの目には1912年頃にはかなり増えているように見えた)。その後は「空白の四半世紀」データがない。何故人口増加が始まったのか? 歴史人口学,経済史の主要トピックの1つ。DANJUROもその1つ。直接人伝牛痘種痘法(Arm to arm vaccination)史料:廣瀬元恭(1849)『新訂 牛痘奇法』。腕から腕に1週間ごとに植え継いでいくスタイル。医学史の分野では前線の研究なので,人口学で欲しい,集落のマジョリティに広まった時期のデータは不明。国産の牛痘の良いワクチンができたのは長与専斎がオランダで学んで帰ってきた明治7年のこと。それが全国に普及。種痘規則ができたのは明治7年10月30日。種痘医以外が種痘することを禁じた。これを受けて明治8年に各自治体が天然痘予防についての規則を作った。明治9年5月18日,天然痘豫防規則公布により種痘は義務化。今日のデータは悉皆調査で一人ずつ種痘を受けたか,いつか,受けなかった場合はどういう理由かという聞き取りをしている足柄縣のもの。村に住む25歳以下の子供について初回接種,再接種,三種の年月・医師名,患者名,地番などが書かれている。これを写真に撮って持ち帰ってデータベース化。「種痘人取調書上帳」時空間分析プログラム(開発中のため非公開となっているが)。SQLで問い合わせてGoogle Mapに表示するシステム。1875年1月の時点で足柄縣東部における種痘接種状況を色分けして円グラフでそれぞれの子供の割合を地図上に表示。円の大きさは人数。4ヶ月後には種痘を受けない子供はごくわずかになっていた。受けない理由は健康状態が悪いこと(百日咳,緑便など)であった。何度も接種しているのは,このときのワクチンは効力が完全でなかったため。初種や再種を受けていても流行時に感染した子供はいた。1855年〜1874年末に種痘を接種した人についての地図をみると,神主などもいる。1874年に種痘医規則により他の職の人は種痘できなくなったので,1875年1月から5月のデータでは足柄上郡はほぼ2人に絞られた。「4ヶ月間に種痘医がほぼ全数に接種した」という仮説が立つ。1875年の人口ピラミッドを作ると,0-3歳は大部分が初種接種済み,その上の12歳くらいまでは再種接種済み,13歳以上は半数が天然痘に罹ったことがある。導入過程はだいたい3段階に分かれる。1850年から1875年までは第2期で初種が徐々に導入。1875年から1900年に普及。データが新しく出てくる可能性は低いのでシミュレーションすることを考えている(開発中)。対策先進地だからデータが残っていた可能性は高い。
(5) 飯島渉(青山学院大学)「医療・公衆衛生資料の整理・保存と利用の可能性」→「感染症データの収集とその保存,利用の可能性:あるいは「歴史疫学」の可能性をめぐって」と改題。
論点:(A)フィリピンの住血,マラリア,フィラリアをめぐる資料。(B)日米医学協力計画とJICAの医療協力,(C)橋下イニシアティブをめぐる資料,(D)寄生虫予防会(国内で対策がうまくいった対策主体。既に解散している)の資料をめぐって。橋下イニシアティブは現在ほぼ中断されている。フィリピンで住血が流行った場所は気候風土によって偏在している。もっとも流行したところの1つはレイテ。1960年代末から70年代にかけて研究は進んだが,対策主体はJICAだった。レイテ島にもJICAがPALOに対策センターを作った。日米医学協力計画は1960年代に3省合同で推進されたが,最近公文書が要求に応じて公開される状態になった(全部ではない)。レイテではまず,やすらおか先生が中心になって対策。現在のミンドロ島では田圃が多くて水路はコンクリ張り。日本国内で上手くいった対策をフィリピンに持って行ってやった。千種先生が学生を連れて行くときに着いていってやすらおか先生に協力した老人へのインタビューをしている。資料は大量にあったが,2年前の台風で壊滅的な打撃を受けてしまった。バランガイレベルの対策についてもすべて残っていたが散逸した。現在,残っているものはカビが生えているので,東北大学防災技術研究所と協力して(やり方を習ってきて)修復を試みている。当初JICAに行けば同じ資料があるだろうと思っていたが,JICAは資料のコピーを持っていなかった。レイテは台風のせいで住血の分布は変化したかもしれないが,昔のデータを復元しないと変化したかどうかが評価できない。日本では筑後川流域,片山町,甲府盆地で流行した。中国は4000万か5000万人か患者がいる。日本住血吸虫という名前は日本で発見されたから。ミヤイリガイが中間宿主なので,対策は貝対策か住血吸虫対策かどちらか。キーパーソンは小宮義孝(予研の寄生虫部長→所長)。水路のコンクリ三面張り化(小宮メソッド,山梨メソッドと呼ばれる)。いまのミンドロ島の田圃の水路はそうなっている。小宮先生が残した資料は放置されていた。この数年間で飯島先生が整理した。中性紙箱に入れ直し,目録化(約6000)。90%はどこにでもある資料だが,あとの10%が相当重要でそこにしかない可能性がある。そのためには全部を目録化するのが前提。琉球大学の大鶴先生(故人)が遺したマラリア資料も整理した。中国の状況を調査したときのフィールドノートや写真もあるし,標本も出てきた。蚊の標本は感染研が引き取ってくれた(貴重な資料。DNA分析できるし)。目録化した資料は目黒寄生虫館,台湾史研究所アーカイブ,青学→長崎大学熱研に分けて保存している。台湾の分は既に整理し中性紙箱に保存されていて検索して公開請求して見ることができる。バンクロフト糸状虫による象皮病は日本では鹿児島,長崎,沖縄にあったが既に制圧に成功した。当時の資料は保健所にあったはずだが捨てられた。ごく一部だけが長崎大学熱研に残っている。個人レベルの経過カルテのようなものもある。フィラリアは僻地,離島で流行していたので,その資料を整理中。対策方法:マラリアはDDT残留噴霧,住血は山梨メソッドからプラジカンテルのMDAへ。フィラリアはスパトニンの選択的集団投薬。橋下イニシアティブとか言っておきながら,やったことの資料は捨てられている。いま名誉教授の人たち(多田先生,青木先生,竹内先生,...)に聞き取りをして資料が散逸しないようにしているところ。寄生虫予防会が解散した後の資料がどうなっているかは来週確認しに行く。そういう個別的なマイクロレベルの資料を蓄積することで疫学的知見を提供することが可能か? 理論疫学と共同するとこうして掘り起こしたミクロデータを再解析する「歴史疫学」は可能か? 次世代に資料を渡す。(質疑・コメント)歴史の時代が来ている。JICAはODA歴史研究プロジェクトというのを始めた。国会図書館の憲政記念館に入れるのがよいと飯島先生は考えている。
(6) 谷村晋(三重大学)「人の移動と感染症流行のモデリング」
人口学会は文系の人もいるのでということで,感染症疫学の基礎,デング熱の解析,その他の先行研究,Epigrassというソフトの紹介という筋立て。感染症疫学の基礎のパートは,ぼくも学部学生向けの講義で喋っているような内容であった(今回の解析は理論疫学的なものではなかったので基本再生産数の定義などは説明されなかったが)。デング熱の解析は2014年晩夏の代々木公園で感染した人たちが地元へ移動して発病したデータなので,まず都道府県別の患者数を円カルトグラムなどで表示した後,その数値がポアソン分布と二項分布の混合分布に従うと仮定し(二次感染がなかったから,要は代々木公園で感染した人の移動のモデルになり,この仮定はまあもっともらしいと思う),都道府県人口と東京からの距離によって一般化線型モデルを使って回帰したという話だった。改良バージョンもあるが投稿中なので今回はここまでということだった。同様なアプローチによるHIVのモデルとしてNakaya 2005が紹介された。EpigrassはPythonで書かれたオープンソースなソフトで,サンプルデータとして,ブラジルのバスで拡散する感染症のSEIRモデルの例が紹介された。モデル記述部分は,CustomModel.pyというPythonコードを編集すれば比較的自由に設定できる,とのこと。
懇親会後帰宅
タクシーで北山駅近くの店に移動し,実にセンスの良い美味な料理とビールと焼酎(日本酒もかなりいろいろ揃っていて美味そうだったが,自分の許容量を超えそうだったので今回は断念した)を楽しんでから,地下鉄とJRを乗り継いで神戸駅へ。しかし終バスは出た後であったので,高速神戸まで歩いて新開地から神戸電鉄で鵯越に行き,30分歩いて帰宅したら汗だくになった。疲れ果てた。

Read/Write COMMENTS

前【1253】(シラバス入力締め切り……ではなかったが(2016年3月4日) ) ▲次【1255】(休日だが出勤(2016年3月6日) ) ●Top

Notice to cite or link here | [TOP PAGE]