社会学者の研究メモ

はてなダイアリーから移転しました。

社会学と因果推論

8月に入ってからのICPSR統計セミナー、ゼミ合宿、データクリーニング合宿、数理社会学会という怒涛のイベント+出張シリーズが一段落したので、ひさびさに更新します。

先日行われた第56回数理社会学会の新規会長(近藤博之先生)の講演のタイトルは、「ハビトゥス概念を用いた因果の探求」というものでした。そして(すでに論文として発表されている)2年前に行われた前会長の石田浩先生の講演は「社会科学における因果推論の可能性」というものでした。近藤現会長が狙ったのかどうかは不明ですが、両者とも社会科学あるいは社会学における因果関係の位置づけについて極めて示唆的なものです。

石田先生の講演では、ラザーズフェルドのelaborationの考え方から始まり、60年代後半から70年代にかけての回帰分析時代、その後のパネルデータ分析の隆盛、そしてルービンらの反実仮想的な枠組みに至るまで、計量社会科学における因果関係へのアプローチが概観されています。しかし講演の趣旨はこういった流れを確認することにあるのではなく、むしろそこで取り残されてきた問題にスポットが当てられています。

まず、計量社会学パスモデルを持ち込んだダンカンの考え方が紹介されています。ダンカンによれば、回帰モデルは「真の原因と結果の関係」を記述するものではありません。これは後に「回帰分析の横暴」という揶揄にみられるような、ランダム化比較実験を理想状態とした反事実的枠組みからの批判ではありません。ダンカンによれば回帰モデルあるいはパスモデルとは、集団間の異質性を記述する一つの方法であり、厳密な因果を推定する方法ではありません。したがって撹乱項と説明変数との相関は「なくすべきもの」というよりは、説明されるべき重要な要素である、ということになります。そして石田先生の講演では、ダンカンのこの考え方と、ゴールドソープの「因果の生成プロセス」への注目の共通点が指摘されています。

次に紹介されるルービンの反事実的モデル(以下、措置効果モデルと略称)についても石田先生は、回帰モデルに対する批判という意義よりは、いわゆるSUTVA(Stable Unit Treatment Value Assumption)の重要性に注目されています。(SUTVAについては、以下の本の37頁から比較的詳細な解説があります。)

Counterfactuals and Causal Inference: Methods and Principles for Social Research (Analytical Methods for Social Research)

Counterfactuals and Causal Inference: Methods and Principles for Social Research (Analytical Methods for Social Research)

この仮定が成立しないと措置効果モデルは妥当性を失うのですが、この仮定への違反は社会科学においてはきわめて普通に見られるものです。講演では、社会学分野でのモーガンの指摘に触れられています。「私立学校の方が生徒の成績が高い」という観察結果があるとして、これは私立学校と成績との因果を示す情報では(まだ)ありません。ポテンシャルの高い(あるいは家庭環境のよい)生徒が最初から私立学校に入学するというセレクションの問題が回避されていないからです。仮に、この因果関係が実験によって(あるいはその状態を模した調査観察データの分析デザインによって)確かめられたとします。しかしそれでも、では実際にカトリック系の学校に公立学校の生徒が(たとえば大挙して)移動したとして、カトリック系学校が(そうではない場合に比べて)同じパフォーマンスを発揮できるとは限りません。実験デザインがより社会全体の構造を反映したものでないかぎり、たとえば生徒を多く割り当てられてしまった私立学校で、授業のパフォーマンスが維持できない可能性があるからです。

因果推論アプローチに対するこの2つの留保の関係については講演では触れられていません。が、私はこれが結構重要なのでは、と考えています。

Xie (2007)でまとめられている内容を信じれば、たとえば回帰モデルについては以下の2つのアプローチがあります。

  • ガウス的アプローチ:観察データ=固定効果のモデル+測定エラー
  • ゴルトン的アプローチ:観察データ=システマティックな(集団間)多様性+残りの(集団内の)多様性

ダンカンは、(ケトレーの「平均人」アプローチに逆らったゴルトンにならって)後者の考え方を採用した、というわけです。撹乱項を多様性ととらえ、更に分割を加えていくことを科学的説明とみなす考え方は、たしかに社会学にとってはより馴染み深い考え方です。「性別によって所得は異なる、それは一部には性別によって学歴構成が異なるからだ。では学歴が異なればなぜ所得が異なるのかといえば..」という説明の一連の流れを行うのが社会学なのであり、「学歴の差が所得の差の真の原因か」のみを推論するわけではない、ということになります。

因果推論を志向するアプローチと、媒介による説明を志向するアプローチは、この記事でも書きましたが、実は少なくとも回帰モデルにおいてはそれほど異なった分析を生み出すわけではありません。異なってくるのは、因果推論が回帰モデルから離れて、措置効果モデルによって純粋に介入の因果効果を追求するときからです。実験に範をとったこのモデルでは、純粋に原因(介入)と結果の関係を推定するがゆえに、回帰分析では可能であった媒介要因による説明のプロセスが抜け落ちます。観察データに適用される措置モデルでは、外生的な共変量でバランスを取った上で措置の効果を推定するという手続きがとられますので、措置はすでに媒介ではないわけです。逆に言えば、説明のプロセス(≒理論)をスキップできることが統計学の「強さ」の源でもあるわけです。

さて、SUTVA違反問題です。この問題は単純化すれば、措置効果モデルで推定された介入の効果が現実において同じ効果を持たない可能性を指摘するものでした。この記事でも指摘したいわゆる「しわよせ問題」が典型的です。ここで、「措置効果モデルではしわよせ等に起因するSUTVA違反に対処できない」ということと、「措置効果モデルは説明のプロセスをスキップする」ということは、何かしら関係があるのでしょうか。

「部分的にはある」と考えてもよい、というのが私の見解です。

石田先生の論文では、ダンカンは後にログリニアモデリングに興味を持ったことが書かれています。ログリニアモデリングでは、個々の変数の係数推定にはあまり関心が持たれません。むしろモデル全体の当てはまりをBIC等の基準において高めることが目指されます。ログリニアモデルは実際上ロジット回帰モデルとほぼ同じですから(ログリニアとは要するにロジット回帰における複雑な交互作用モデリングの簡潔な記述手法のこと)、特定の説明変数を措置としてその効果を厳密に推定するアプローチとは対極にあるものです。

観察された変数間の関連性を(排除するのではなく)モデルの中に積極的に位置づけることは、ある程度はSUTVA違反を考慮するということでもあります。というのは、しわよせというのはまさに観察される(あるいは観察されない)変数間の関連性によって生じるからです。経済学でいわゆる構造推定によりこの問題に対処するのに比べるとかなりナイーブなモデリングですが、発想としては同じ方向を向いています。

もちろん回帰モデルがSUTVA違反にロバストであるというわけではないのですが、回帰モデルのほうが措置効果モデルよりも変数間の関連を柔軟にモデリングできるというのはその通りでしょう。因果推論にあまり関心を持たない社会学において回帰モデルがこれほど普及したのは、このような特性があったから、といえそうです。

次に近藤先生の講演(「ハビトゥス概念を用いた因果の探求」)です。

「構造的因果性」というとアルチュセールを想起しますが、講演ではブルデューやアボットの立場が紹介されてします。いくつか引用されていたので、引き写しておきます。

「重要なのは要因全体の構造であり、各要因の効果は特定の関係システムに属することから生じる位置価にすぎず、ある要因が変化してもその影響はつねに他の要因の変化によって相殺される。」(ブルデュー『美術愛好』)「ましてその要因が、過程の異なった時点でも、諸要因の異なった構造のなかでも一様かつ一義的な影響力をもつのだと考えるのは、いっそうばかげたことであろう。」(ブルデュー『再生産』)

「何らかの組織されたシステムの構成要素を、あたかも分離可能で、同質的で、独立の操作に従い、それゆえ因果的複合体から引き剥がしたり加えたりすると、その分だけ結果を増減させることができるかのように扱うことの誤り」(R.M.マッキーバー)「社会学者たちは、社会的世界が可変的特徴をもつ有限個の対象からからなり、それらの特徴は一時に1つの因果的意味を持ち、その意味は他の特徴にも、過去の値系列にも、他者の文脈にも依存しないと仮定している。」(A.アボット)

このような意味での「構造的因果性」を捉える方法には様々な立場がありえますが、近藤先生の講演ではハビトゥス概念や対応分析を用いた社会空間アプローチが提起されていました。これは、部分的な介入(媒介要因)の効果を相殺してしまう基底的メカニズムに目を向けるべきだ、という主張が背景にあるからです。

このようにみてみれば、石田先生の講演と近藤先生の講演には、何らかの関心のつながりがあることがわかります。どちらも措置効果モデルで想起されるような因果推論と社会学との距離を争点化しているからです。

さて、ここからは個人的な感想です。

因果が複合的に決定されていて、したがってSUTVA違反がむしろ社会の常態であることは、社会学者の感覚としてはある程度共有されているはずです。そうではないと、パネルデータ分析にあまり関心が向かず(ここ最近社会学者のあいだでパネル調査プロジェクトに参加していて、社会学者がいかに措置効果モデル的な因果推論に関心がないのかを痛感しました)、検定といえば個々の係数の効果の検定ではなくログリニアモデルやSEMなどの確証系分析を好み、措置効果モデルよりは複数の変数間の関係を捉えることに向いている回帰モデルを長く愛用してきたという、一見奇妙な計量社会学の傾向性を理解できません。

計量社会学のこのような特徴に気づかせていただいたという意味で、改めて両会長の講演に感謝の意を捧げつつ。

■以下、補足的に文献紹介■

ログリニアモデルについては、太郎丸先生の本があります。

人文・社会科学のためのカテゴリカル・データ解析入門

人文・社会科学のためのカテゴリカル・データ解析入門

以前京大非常勤で使っていた講義資料の一部で、ログリニアを解説しました。もしよければここからどうぞ。

アボットの引用の該当箇所は、たぶんこれの一章です。

Time Matters: On Theory and Method (Oriental Institute Publications)

Time Matters: On Theory and Method (Oriental Institute Publications)