Latest update on 2023年6月14日 (水) at 23:28:01.
【第1370回】 人口学会2日目(2023年6月11日)
- 7:00起床。シャワーを浴びて朝食をとってから出発。
- 今日の午前中は西浦さん企画の、企画セッション 1「新型コロナウイルス感染症パンデミックに伴う死亡の分析」。以下メモ。
- 人口学プロパーからのアプローチが欲しかった、との西浦さんのお言葉。それは確かにそうだと思うのだけれども。
- 最初の演者は感染研の鈴木基さん。COVID-19のパンデミックと超過死亡。最初のシステムは入力が保健所の任意だったため入力率が低すぎて廃止された。「新型コロナウイルス感染症等の感染症サーベイランス体制の抜本的拡充に向けた人材育成と感染症疫学的手法の関連研究」(代表が橋爪さん、野村さんも分担)を厚生労働科研でスタート。さらに別の厚生労働科研で、超過死亡迅速把握システムを構築、一昨日も更新された。超過死亡という指標は一般市民の方にわかりにくいのが問題。公衆衛生の指標として適切か? 市民にとってどういう意味をもつのか。QA>現在は自治体から研究班がもらっているのは日付と人数のみ。
- 2人目は野村さん。コロナ禍の死因別・人口動態別の超過死亡分析とその課題。超過死亡研究班としてほぼ毎月報告。超過死亡ダッシュボード。人口動態統計の死亡小票を使っている。死亡が確認された日→7日以内に役所へ死亡届を提出→都道府県→厚労省→研究班がデータ入手するまで、全死亡でも2~3ヶ月の遅れ。死因コード付き詳細データは5~6ヶ月遅れ。報告システムの根本的問題。LMICsでは人口動態統計の元となる登録システム自体がないのが普通。日本は登録システムはあるがデータが使えるまで時間がかかり過ぎるので、早期対応には向いていない。パンデミックによる超過死亡は直接死因としてのその疾患による死亡+広範な社会的影響を経た関連死を含むので、公衆衛生インパクトをみるには重要。算出方法はCDCと同様に準ポアソン回帰であるFarringtonモデルを使った。2020年7月に超過死亡を初公表。2020年前半は過少が続いているが、インフルエンザ流行がなかったから? と考えているとのこと。日本でも超過死亡が出現したのは2021年以降。現象としてはわかるが、原因についてはクリアな説明は不可能。推定した議論はできるが。死因別死亡データで新型コロナを死因とする死亡を除いたすべての死亡で超過死亡を計算してもパタンはほぼ同じ。関連死が多いということ。呼吸器疾患による死亡に絞って分析すると、オミクロンBA.5の流行が始まった2022年夏から超過死亡が増加したようにみえる。循環器疾患による死亡はそこまで顕著な超過死亡が増えた時期はないが、オミクロン株に移行したところでやや増えている。合併症? 循環器については、年齢別、死亡場所別でもみている。2022年には75歳以上でのみ超過がみられ、2020年には病院での死亡が減少し、老健での死亡が増加した。がんによる死亡については顕著な超過死亡はみられない。死亡場所は2020年には病院で減り、自宅で増加。老衰による死亡は21年のデルタ株流行からずっと顕著に超過。長期的な高齢者全体の活動抑制によりフレイルとか全般的な高齢者の健康水準が低下している? 2021年までやっていた人流データでみても、一番行動抑制していたのは高齢者だった。老衰のほとんどは自宅で亡くなっている。自殺における超過死亡は2020年が最も多く、1年間続いた。とくに女性ではすべての年齢層でみられた。男性は20代と80代。女性は家庭・健康・勤務問題を動機とした自殺が多く、男性は仕事上のストレスが多かった。医療アクセスはパンデミック以降低下している。入院者数は2021年に減って、減ったまま。熱中症による救急搬送数は(消防庁データ)、2020年夏にはとくに超過無し。交通事故死(警察庁データ)は2020年以降わずかに減少。緊急事態宣言が出た都道府県ではわずかに過少。外国人と日本人の死亡率の差は、パンデミック前後で変化なし。迅速データは市役所から直接データをもらうシステム。ほぼ1ヶ月遅れでデータ入手できる。報告遅れの影響はでる。5月8日の5類移行の次の週には超過死亡は出ていない。QA(逢見さん)老健での死亡には老衰とつく可能性が高いので、仮にコロナクラスタであっても老衰となっているケースがあるのでは? コロナ前から老衰死は増え続けているので。ただ、long covidかも?(林さん、別府さん)複合死因までみると、2番目以降の死因として出ているコロナから死亡までの時間は長くなっているそうだ。死亡小票のオンライン入力は今では1ヶ月以内にされているので、そこからどこかで滞っている(統計法改正後、一式渡すことは可能になっているが、たぶん審査で数ヶ月かかっている? 責任問題も生じるので)。
- 3人目は米岡さん@感染研。生粋のbiostatistician。超過死亡の統計数理モデル。超過死亡とは一言で言えば予測残差。引く値は、予測の点推定値であることもあれば、予測の95%信頼区間の上限であることも。いずれにせよ、予測モデルをどう構成するかに依存(いくつか世界でよく使われる方法はあるがgold standardはない。2019年の値から2023年の値を予測できるのか? という問題。With Corona時代にBefore Coronaのデータをリファレンスにできるか、という問題)。予測はパンデミックがなかったら? というcounterfactualが前提だが、それを考えるのが難しい。感染研のウェブサイトに超過死亡で使う予測モデルの方法一覧表が乗っている。米国のCDCが使っているFarringtonモデルは、quasi-poissonでreference data(参照期間のウィンドウをずらしながら推定する)が特徴。WHOの方法はMsemburi et al. (2023) Nature。詳細な方法はKnutson et al. (2023) AAS(これか?)。月別データに負の二項回帰。シンプルなのでグローバルに使えるが、だからこそ地域別の状況を反映せず当てはまりが悪い国も。IHMEの方法(Lancet, 2022)は、3つのモデルのアンサンブル。REGMOD(2段階ポアソン回帰)、ポアソン回帰、Constant。アンサンブルの重みは2019年までのMSEの逆数。EuroMOMOはシンプルな準ポアソン回帰。季節性がフーリエ項として2つ入っている。Farringtonの系譜は、元々はインフルの早期検知が目的。Nonfailyが拡張、米岡さんが一般空間Farringtonアルゴリズムに拡張。精度が上がった。データの入手元については感染研のウェブサイトに公表している。参照期間は、w(前後何週みるか)とb(何年遡るか)で決める。Nonfailyは1年分全部を参照期間にする(共変量を入れられない、短い時系列に使えない、感染ネットワーク的な意味での空間構造を考慮していない、という欠点)。推定と予測はquasi-poisson回帰するだけ。過去のアウトブレイクをなるべく無視するための工夫。一般空間Farringtonは共変量を2つ(時間不変、時間可変)入れられる。パッケージ化済み。いま準備中なのはロバストなFarrigton。過去のアウトブレイクは従来手作業で除いていたが、γ-divergenceを使って外れ値としての過去のアウトブレイクがあっても問題ない推定をしてくれる。QA年齢構造の影響は考えなくて良いのか?→Farringtonはローリングするトレンド項が入っているので高齢化の変化は吸収可能(年齢構造以外の効果も入ると思われるが)→年齢別の層別解析もできるが、米岡さんのモデルなら年齢もモデルに入れられる。
- 4人目は岡田さん@京大。2019-21年のCOVID-19流行下の出生時平均余命の変化。(メモ注:平均寿命という用語は意図的に避けているのだろうか?)年齢群や死因別でLE変化へのCOVID-19の寄与度の推移はどうなっているか? LEの変化とCOVID-19流行状況の相関? 2022年のLE変化を入手可能なデータ(愛知県と福井県のみ)から推定できるか? という3つの問い。社人研JMD、厚労省死因統計データ、愛知と福井の月別・年齢別死亡数データ、都道府県別COVID-19流行状況等厚労省オープンデータ。アリアガ分解(Arriaga decomposition)によりLEの変化への年齢群xの寄与Cxを直接寄与と間接寄与の和として計算し、死因別にCxと各年齢群におけるその死因の重みとの積として寄与を推定。LEは20年より21年は下がっているが、19より21はわずかに長い(たぶん22年は19年より下がると思うがな)。2019-20と2020-21で、70歳以上の寄与の向きが逆転している。死因別でみると、心疾患とがんが顕著に変化。2021年にLEは短縮したがその幅は国際的小さく、若者の死亡率上昇幅が小さかったことが原因と考えられる。福井と愛知で相反するLEの推移はCOVID-19死亡数との相関? 関連死も愛知で大きかった可能性。3回以上ワクチン接種率が福井>愛知。5%以上の差がある。axの定義と数値は石井さんの方法(というかJMDなので、0歳は別に推定し、年齢が上の方では各歳で0.5年として5年毎に併合しているので2.5前後になる)に従っている。
- 最後に西浦さん。死亡者のいる家庭のインタビューを通じたオミクロン株流行中の死亡分析。オミクロン株流行以降、日本では感染者数が著増し、COVID-19の直接死亡者数と超過死亡者数が増加。報告されている直接死亡者の中に間接死因による死亡者(持病がコロナで悪化)が増えた。救急の遅れなどの関連死も分解したい。遺族に横断調査し、統計モデルを用いて直接死亡と超過死亡の分解推定し、死亡メカニズムを把握するのが目的。マクロミル社の協力を得て2023年2月に横断調査。少なくとも1人が死亡した家庭で、少なくとも死因について知っている人を対象として、死亡診断書の死因、死亡年月、基礎疾患、施設入所の有無、新型コロナウイルス感染症の罹患の有無等を聞き取り。COVID-19による直接死亡は3.5%。院内死が6割強、施設と自宅が2割弱ずつ。罹患したことがある人は13%。死亡診断書に新型コロナウイルス感染症記載ありは6%程度。往診依頼、救急サービス、到着までの時間などのデータをみると、20%程度が24時間以上待ち。死亡発生の時間分布をみると、がんはフラットだが、心疾患や老衰はパンデミックから増えている。死因別罹患歴をみると、心疾患、脳血管疾患により死亡した人で他の上位7死因に比べてコロナ罹患歴ありが多い。ORが1.67。死亡前2ヶ月以内のコロナ罹患歴に絞るとORが約2.7。死因別医療逼迫状況は、心疾患で死亡した人は、24時間以内受診できず、とか24時間以内に救急が来なかったが多かった。ORが約2。(※地域差は?) 2つ目の研究は、COVID-19の直接死亡データと超過死亡データ(死因別、quasi-poissonによる)を使って第6波のCOVID-19の直接的寄与度を計算。心疾患と呼吸器系疾患と老衰が第6波中はねあがっている。報告日別COVID-19確定患者数、人口、COVID-19の確定患者の致死率、COVID-19死亡報告の中でコロナが死因ではないと判断できる確率、死因別超過死亡率という変数を使ってモデリング。コロナ直接死亡の尤度と死因別超過死亡の尤度を求める式を立て、データに適合させる。月別の医療逼迫によるコロナ死亡の相対リスクと心疾患死亡の相対リスクを出して、心疾患の超過死亡のコロナ由来と医療逼迫由来に分解すると、心疾患の超過死亡の3割くらい(AUCで考えて)がCOVID-19による。呼吸器の場合は半分くらい。QA>サンプルは人口比例抽出している全国データだが、地域の情報はデータに含まれているので地域別分析は可能。超過死亡という残差をモデリングにするよりも、死亡を直接モデリングした方が良いのでは? という米岡さんの指摘→その通りという回答。
- 昼休みはいったん八事日赤方面に降りてコンビニ弁当を買ってきて済ませた。
- 午後は出生2、出生3、統計2のセッションへ。以下メモ。
- 出生2の最初は中国都市部の有配偶者の出生意欲関連要因。データはCFPS2018の個票。都市部20-40歳の有配偶者対象。希望子供数(0, 1, 2, 3人以上)と希望子供の性別組み合わせを他の変数で順序ロジスティック回帰(Proportional Oddsモデルか? それとも他のモデルか?)と多項ロジスティック回帰というアプローチ。説明変数は性別、配偶者の経済的貢献への満足度、配偶者の家事貢献への満足度、子孫が家系を継ぐことの重要性認識、社会保障問題の深刻さ認識、住宅問題の深刻さ認識、等。基本集計の結果、20-25歳は少ない。都市戸籍を持っている人は38%しかないので出稼ぎの人が多い。都市戸籍の有無(無い人の方が希望子供数は多い)を調整した上で、子孫が家系を継ぐことを重要と思っている人は希望子供数が多くなる傾向があった。
- 2番目は萩原さん。家系図データを用いた中長期の人口変動:パプアニューギニアギデラ社会の例。大塚さんを偲んでとのこと。出生は人類進化理解の核心。歴史人口学でも古人骨を用いた考古人口学でもなく、現在伝統社会で生きている人たちから聞き取った家系図を使った分析が有用。今回の発表は生データから家系図を描くアプリを開発したという話(外注だそうだが)。PNG全体の人口増加率とRual、Wipimの人口増加率は概ね同じオーダーだが、Wipim>Rual。転出入の影響か出生の影響かはまだ分析できていない。アプリは名前の変化に対応していない。計算機能もない。実はDMRもまだだそうだ。特定のIDを中心にして上も下も何代か書けるのが利点。クランもデータとして入っているのでクラン別でも書ける。
- 3番目は小西さん。不妊治療及び性交頻度と出生力。生物学的要因にフォーカス。2014年のウェブモニタ調査データ。過去6ヶ月間の配偶者との性交頻度を尋ね、月1日未満の低頻度群と月1日以上の高頻度群に分けた。他に、結婚期間、学歴、配偶者の就業状況、世帯収入、不妊治療経験の有無、既往出生児数を尋ね、35歳以上の既婚女性データのみ分析。重回帰分析で、既往出生児数をその他の変数及び性交頻度と不妊治療の交互作用項で回帰。既往出生児数別に集計すると、年齢はどの群も40歳弱。性交頻度不明が約2割(ただし既往出生児数が多い人ほど不明が少ない。無子群では1/4いるが、子供3人以上では約1割)。不妊治療不明は無子群では1割、3人以上群では4%だが、子供1人群が最も不明が少ない(理由は? 2人や3人子供がいる人は自然に子供ができた人が多いが、1人子供がいる人は不妊治療とか出産について意識的ということか? そもそも、性交頻度不明というのはわかるが、不妊治療が不明ということはないと思うのだが……)。不妊治療あり無しと性交頻度のクロスで平均既往出生児数を出すと、不妊治療経験有り群では性交頻度高い群の方が低い群より既往出生児数が小さいが、不妊治療経験なし群では逆に性交頻度高い群の方が既往出生児数が大きかった(交互作用あり)。重回帰では社会経済変数は3つのうち1つだけ入れたモデルで検討。交互作用は、小西さんも言っていた通り、無子だと子供が欲しくて不妊治療中で性交頻度を増やしているという逆向きの因果が働くということだろう。このデータからは実証できないが。
- 出生3の最初は、基礎自治体が実施した少子化対策が出生率に与えた効果。自治体ごとの少子化対策がTFRに与えた効果の分析。先行研究は多様。2005年時点の対策による2000年代後半のTFR変化をみたときは、幅広い施策をするとTFR回復にプラスであった。2010年代でもそうか? 10年前の調査データ。1742自治体に質問紙を送付し、609自治体から有効回答を得た。TFRの変化率は人口動態統計の市区町村別統計のベイズ推定値として、3種類の変化率を計算。13施策について実施有無を尋ね、実施している施策の数により少子化対策高中低の3群に分けた(分位数で? 閾値があると想定しているのか? そうでなければ施策実施数を数値のまま説明変数にしたら良いのでは?→それは思いつかずやっていなかっただけとのこと)。個別の施策実施ではTFR変化への影響は有意でなかった。重回帰分析。全サンプルの分析と、人口5万人以上の自治体に限定したサンプルの分析を別々にやった。施策実施数高群の方が低群よりもTFR回復に有意にプラスで、とくに10年間の回復の方が顕著。人口5万人以上のサブサンプルの方が顕著。
- 次の報告は「新型コロナウイルス感染症影響下における追加出生意欲」~日・瑞・独・仏を対象とした人口学的・社会経済的要因分析~。内閣府子ども・子育て本部が実施した「令和2年度 少子化社会に関する国際意識調査」の個票データを使って、「追加希望子ども数」「出生意欲」を説明する順序ロジスティックと多項ロジスティックを実施したという研究。調査票と基本集計結果は公開されている。累積コロナ死者数がどの国でも増加していた時期の調査。災害などのリスクと出生行動の関連を分析した先行研究としては、軍事基地が密集した地域では出産増、被災地では出産間隔短縮、スペインかぜパンデミック後のスウェーデンで、出産を延期した影響で、短期的に出生率が上昇したという研究などがある。出生率に対して、所得要因と性別役割分業意識は交互作用効果あるという先行研究もある。
- 次の報告はポストコロナにおける日本の合計出生率の変化―韓国および欧米先進国との比較―。本当にコロナで出生力は下がったのか? 定量的研究は少ない。時期を2つに分けて考えるべき。各国の月次のTFRデータを分析。コロナ危機から暫く経った後のマクロな分析は唯一。先進国を3群に分類。(1)出生率急低下、反動増、元に戻って低下傾向持続=日本、韓国、イタリア、スペイン、ポルトガル、(2)急低下、反動増、高い水準に回復=ベルギー、フランス、アメリカ、(3)急低下なくむしろ急増=オランダ、フィンランド、スウェーデン、デンマーク、ドイツ、オーストリア。コロナ危機が直接出生率変化に影響する一次的影響とライフスタイル変化を介して影響する二次的影響があり、性別役割分業意識が関連している可能性。(1)の国は性別役割分業意識が強いのではないか。急低下ダミー、反動増後トレンドダミーを2つのダミー変数として、月次のTFRの季節調整済み行列を回帰分析。ジェンダーギャップ指数、韓国ダミー、スウェーデンダミー、急低下ダミーを説明変数として、反動増後トレンドダミーを被説明変数とする重回帰。単相関をみると急低下ダミーとは弱い正の相関があるが、重回帰では急低下ダミーの係数は有意でない。(1)の国だけで急低下・反動増の時期を除いたデータセットを作って、この時期前後それぞれトレンドの傾きを被説明変数とした回帰分析。たんなるトレンドの解析になっているので、今後はDIDとか個票データを使った解析を進めたいとのこと。
- セッション間に休憩を計画していなかったため、各セッションがずれて20分押している。来年はセッション間の休憩をちゃんとプログラムに入れること、と大会企画委員としての反省を林さんと共有した。
- 統計2の最初は林さんで、日本の障害統計整備と障害率の動向。戦後の障害者調査による統計。棒グラフ濃い色が実測。薄い色は線形補間。障害率の推移の折れ線グラフをみると、調査ベースでも手帳ベースでも増加トレンド。戦前はほぼゼロ(当然、公的に認知されていないという意味だろうが)だったが、最新は6-7.5%くらい。1974年の調査では障害のある人の中に「国内空襲等による」が例示されていたので、中高年男性にピークがあったが、1979年の調査ではその例示がなくなったのでピークが消えた(ただし男性>女性は継続)。ある程度就業している。2014年からさまざまな障害者統計の進展があった。2021.10の社会生活基本調査にはEU式障害設問が導入され結果公表済み。2022年6月の国民生活基礎調査ではWG式障害設問導入された。結果は未公表。設問により障害の定義が違うので重なりは少ない。EU定義による障害率でいうと、年齢調整してもしなくても日本は欧米諸国より低い。
- 次は国勢調査における外国人人口の過少計上に関する地域差とその経年変化。近年増えている。日本以外も広く見られる。国勢調査と在留外国人統計における(都道府県別/市区町村別)外国人人口比率を捕捉率と考え、その(1)時系列相関、(2)空間的自己相関を調べたもの。捕捉率と先行研究で挙げられた諸要因を代理変数として関連の分析。国勢調査は3ヶ月以上滞在、在留外国人統計は中長期滞留者と特別永住者(外交官などは除く)と在留外国人定義が異なる。国勢調査の方が広そうだが、数え落としがあって在留外国人統計の方が多い。都道府県別捕捉率は異なる。Moran's Iを計算すると1990年から2020年までのデータでかなり振幅が大きい。各年間捕捉率の相関係数も高い組み合わせもあるし低い組み合わせもある。諸要因の代理変数との相関関係も有意に見られる変数もあるが、経時的に一定でない。市区町村別のローカルモラン統計量は近隣k=4で算出して地図にしたが、とくに目立った傾向はない。外国人統計を使う際は、事前に調査年ごとの特性を見極めておく必要がある。QA>座長の井上さんから、これは「捕捉率」ではないのでは? という指摘あり(山本論文で使われている用語だが、捕捉比の方が良い)。2012年に短期滞在者の扱いが変わったので、それが合うように1990-2010年のデータからは短期滞在者は除いて捕捉率を計算したとのこと。
- 今日最後の発表は、国勢調査の補定方法に関する一考察。不詳を補完した結果表提供の背景としては、聞き取り調査の増加がある。個人情報保護法による拒否も増え、聞き取りだと不詳が増加。そこで、不詳を補完した統計を出すようになった。部分補定をしてから不詳以外のデータ構成比を用いた按分で補完している。国勢調査人口について不詳補完をすると住民基本台帳人口との全国人口でのピラミッドのずれは減る(たぶん県レベルとか市町村レベルだとずれて当然だが)。外国人人口も不詳補完をすると住民基本台帳人口とのずれは減る。労働力調査における就業者との比較でも、不詳補完をした方がずれが減る。都道府県レベルの人口移動データでも、不詳補完をした方がずれが減る。いろいろ限界があるので、個票レベルの補定が必要で、カナダ統計局が開発したCANCEISを使ってみた。最近隣法(Nearest Neighbor Imputation Methodology)。一般的な補定補完はFellegi and Holt法で、先にどの変数を補定するか決めた後でドナー候補を検討。最近隣法では距離が小さい変数を複数、補定候補として抽出する。カナダ、イギリス、ドイツ、ニュージーランドはCANCEISを使っている。無料であり国連ハンドブックに例示されている。CANCEISの補定結果は、実は日本で統計局がやっている不詳補完値とほぼ一致(最も差がある年齢でも2%以内)。愛知県データで原数値よりCANCEIS補定した値の方が住基人口に近くなったというのは驚き。
- というわけで、大変充実した学会参加であった。
- 帰る途中でLIFEに寄って晩飯用に寿司と食材を買い、寿司を食べてラストマンを見たら睡魔に負けて眠ってしまった。
(list)
▼前【1369】(人口学会1日目(2023年6月10日)
) ▲次【1371】(研究打ち合わせと講義2つ(2023年6月12日)
) ●Top
Notice to cite or link here | [TOP PAGE]