東京大学 | 大学院医学系研究科 | 国際保健学専攻 | 人類生態学教室TOP | 2nd
社会統計学第1回
「社会統計学とはどういう学問か」(2001年9月20日)
トップ | 更新情報 | 研究と教育 | 業績 | 計算機 | 写真 | 枕草子 | 著者 | 目安箱 | 書評 | 社会統計学目次
最終更新:
2001年10月18日 木曜日 18時35分
全部を一括して読む
講義概要
- 社会統計学=社会調査データを分析する統計学
- ▼前期「社会調査」で触れたように,社会調査には「社会の諸側面の科学的探究」という側面がある。
- ▼社会を構成する全要素の把握を直接することはできないので,サンプリングによる標本調査が行われたり,いくつかの尺度で社会の断面を切り取ったりして調査データを得る。そのデータから,本来の社会全体を再構成し,また仮説を検証する原理として,統計学が用いられる。
- 統計(学)とは?
- ▼本来は,「家畜や他の財産の帳簿をつけるために原始人が木につけた刻み目」(ラオ)
- ▼その後,「ある国およびそこに生きている生命の状態や発展についての,最も完全で,最も根拠のある知識」(マルシャス) 「国家にとって必要不可欠な人口や経済的な情報の収集」(ウォナコット)
- ▼英語のstatisticsは,ラテン語で国家を意味するstatusを語源として18世紀半ばにドイツの哲学者アッヘンウォールが作った言葉の流用。
- ▼かさばり,雑然とした生データを,解釈をやさしくしたり種々の方策決定に用いるために纏め上げる,グラントの生命表やケトレーの度数分布図による発展
- ▼1834年,英国王立統計協会設立による「統計学」成立で,「人間に関係することがらで,数量で表現することが可能で,一般的な法則を導き出すのに十分なだけ積み重ねられたもの」
- ▼現在の広い定義としては,「不確実性を考慮した論理的推論」であり,すべての自然科学や社会科学で適用される科学的分析の技術となっている。(注:論理的推論には,帰納,演繹,アブダクションの3つがある)
- 不確実性=ランダム(乱雑さ)
- ▼世の中のほぼすべての事象は不確実性を含んでいる
- ▼素粒子レベルでは物理法則も量子力学という形で不確実性を含むし,遺伝子の発現や社会における個人の行動なども,決して決定されてはいない
- ▼ランダムな数字の列=乱数列〜次の数字が予想できない,意味のないでたらめな数の集まり,例えば,英国国勢調査の各教区の面積を表す数値の最初と最後を並べたものとか,20桁の対数表における15〜19桁目を並べたものとか,袋に入れた500個ずつの白ビーズと黒ビーズから,よく混ぜて1個ずつビーズを復元抽出したときの色の列など。線型合同法などによる擬似乱数列もある。
- 統計的分析の手順
- ▼目的を明確にする
- ▼データ化(エディティング,コーディング,データ入力)
- ▼記述統計を実施
- データの図示(幹葉表示など)
- 代表値(平均値,中央値など)の計算
- ばらつき(分散,四分位偏差など)の計算
- ▼作業仮説を明示する
- ▼仮説検定または区間推定を行う
- 因果関係と撹乱要因(例)
- ▼数値間に関連があるだけでなく,時間的前後関係などの条件を満たして初めて因果関係がいえる。
- ▼sufficient causeへの注目
- 統計解析の2つの原理
- ▼デザインに基づいた解析
- 推測の土俵をデータの取り方におく
- データが,ランダムにデータを取った場合に得られるパタンの1つであると考え,その確率を計算する
- 撹乱要因は層別で制御
- (例)並べ替え検定,ログランク検定など
- ▼モデルに基づいた解析
- 推測の土俵をモデルにおく
- 結果の分布を記述するために確率分布を仮定し,その未知パラメータをデータから推定する
- 撹乱要因は説明変数としてモデルに入れる
- (例)t検定,比例ハザードモデルなど
- 統計解析の道具
- ▼Excel:覚えておくといろいろ便利だが,ブラックボックスだし,それがないと何も出来ないのでは困る
- ▼R:オープンソースで無料で利用できる優れた統計ソフト(公式サイト)。統計計算のしくみをビジュアルで見るにも適している。
- ▼Rのインストール:Windows版1.31では,SetupR.EXEを実行して指示に従うだけでできる。
- ▼Rの文法のエッセンス
- 代入が“<-”
- 範囲指定が“:”でできる
- 集合はc( )で定義できる
- 変数に宣言は必要ないし,型もないので,Perlのような感じでスクリプトが書ける
- q( )で終了。help( )でヘルプ(メニューの「Help」から「R language (html)」を選んでも良い)。
フォロー
- 専門用語が難しいので用語集の紹介あるいはフォロー希望
- ▼初回は全体像を描き出すために難しい専門用語が多く出ましたが,2回目からは基礎から順に知識を積み重ねるようにしたいと思いますので,上記の用語が全部はわからなくても大丈夫です。
- ▼なお,webサイトとしては,群馬大学社会情報学部青木先生のサイトの統計学用語辞典が充実していてお薦めです。
- パソコンの扱いに慣れていないので基礎から教えて欲しい
- ▼パソコンそのものの動作原理や扱い方全般から始めると別に1コマ必要なので,コンピュータを使って統計解析をするのに必要な作業に絞って講義したいと思っています。
- ▼扱いに慣れるためにも,練習問題をできるだけ出します。
全部を一括して読む | 次回へ