読者です 読者をやめる 読者になる 読者になる

社会学者の研究メモ

はてなダイアリーから移転しました。

因果推論の社会学

前回の「関西計量社会学研究会」で、「計量社会学と因果推論」という主題でお話をさせていただいた。メモ代わりにそこで話したこと、その後に考えたことを書いておく。

まず、上記研究会で話したことは、短く言うと以下のとおり。

  • 最近は観察データの分析でも因果推論(措置効果モデル)の枠組みが使われることが多くなっている。
  • 因果推論の枠組みでは個体特性(性別、出生年、観察されない性向等)の「効果」は基本的に除去される対象だが、他方で計量社会学者はその個体特性自体に関心を持ってきた。

多少厳密な因果推論(措置効果モデル)の枠組みだと、同一個体に割付(アサインメント)できないものは原因にはなりえない、とされる。性別は(例外はあろうが)その典型例である。しかし主に社会学ではこういった個体の属性の「効果」をみるということがしばしばなされていた。これに対して、因果推論派の方からは「それは違うんじゃないか」というツッコミが入ったりした。

"I suggest that it is epistemological nonsense to talk about one trait of an individual causing or determining another trait of the individual." (Kempthorne 1978: p.15).

「個人のある特性が別の特性を引き起こすというのは認識論的にナンセンスだ」というのである。

さらに上記文章の続きで、

"I regret that I have to take the view that a very fine intellectual creation, path analysis, has led to a flood of work purporting to establish or suggest strongly that certain attributes cause other attributes."

と述べられているように、これは実は「性別・親の地位→本人学歴→本人達成地位」といった「分散分解系」の計量手法の代表であるパス解析における典型的な分析に対して投げかけられた言葉なのである。パス解析や回帰分析は、社会学のなかでは(ダンカン師以降)因果志向の分析の主要な武器であったので、こう言われてしまうと困ってしまう人が多いはずだ。なんと1978年にこういった異議が表明されているが、社会学者には届かなかったのだろう。

こうなると社会学者が伝統的に行ってきたような分析は因果推論ではなく、どちらかといえば確率論的な枠組みを伴った社会記述(社会の説明)である、ということになる。

ここで「分散分解系の手法は因果効果(causal effect)ではなくて因果メカニズムの解明(causal mechanism)を目的としているのでは」という整理をしたくもなるかもしれない。因果メカニズムの定義(や因果効果との区別)についてはいろいろ考え方がありうると思うが、一般的には因果メカニズムの解明とは特定の介入の効果の中身の説明(媒介)だと思うので、「因果メカニズムの語彙ならば個体特性が混ざっても因果を語れる」というわけではないだろう。

ところで、この対比を意識して、Xieはダンカン流の回帰分析を「人口学的アプローチ」と呼んだのであった。これはつまるところ「住み分け」のための整理で、一方が他方を否定するようなたぐいの話ではない。「因果推論枠組みが有効に適用できないような分析にそれを使うことは必要ないでしょう」といったプラクティカルなメッセージである。ここからは、個体特性の影響を分析したいときにパネル観察をすることにはあまり意味がない、といった示唆を得ることができるし、それはそのとおりだろう。

事実、主に社会学で独自に発展した計量分析のテクニック(ログリニアモデル、アソシエーションモデル、潜在クラス分析など)はどちらかといえば(カテゴリカル変数の処理に特化しつつ)社会の記述や潜在構造の解明を目指したものであった。

その上で、「住み分け」の話を超えたところでどういう話が可能か、ということで、以下のようなトピックをリストアップした。

  1. 個体特性による措置効果の違い
  2. 介入と社会記述
  3. その他。主に「個体」概念を巡って。

最初の論点は措置効果モデルの枠内の話で、そこでは多くの場合ATE(平均的措置効果)が求められるが、実際には個体特性ごとの効果を推定したほうが措置を効率化できるので、今後はそういった分析が多くなるのではないか、という(「個別化医療」的な)話をした。(この点について、フロアから、因果推論は個体特性を均質化して分析をしているのに、それを再導入するというのはいかなる手続きになるのか、といった質問をもらった。パネルデータを使わない場合にどういった分析になるのかは、確かにいまのところよく分からない。)

次。措置効果モデルでは、あくまで比較グループを均質化させて片方に介入をした場合の結果の差が求められる。措置から結果までの因果メカニズムの解明においては、少なくとも探索的に分散分解系のモデルが使えるだろう。さらに、実際の世界(観察される世界)では措置はnon-randomに割付される(たとえばセルフセレクション)。つまり、割付についての「広義」のメカニズムが存在する。こういったメカニズムの「記述」(私は「社会記述」と呼んでいるが)においてはやはり分散分解系の手法はかなり便利である。

「割付」の偏りにこそ問題をみる立場(社会学が典型)はあって良いと思うし、それ自体で因果推論と矛盾するアプローチではないので、両者(因果推論系と分散分解系)は補完的に用いることができるのでは、と述べた。たとえば割付効果(セレクション)を除去すると所得に対する「学歴」の効果がなくなりました!という因果推論がでてきたとする(学歴はたいてい措置できないので因果推論は可能か、という問題はさておき)。それは「学歴」に介入する(制度的に割付を変える)ことの是非を問うことにもなるし、それ自体効果がないにもかかわらず学歴による所得格差が生じてきたのはいかにしてか、という問いにもつながるのである。

以上はあまりインパクトのない話かもしれない。(「個体特性の因果効果は語れない!」というのは一部の人達にとっては衝撃だろうが。)

最後に、「まだこれから考えてみたいこと」として少しだけ話をした部分。

報告では主に「個体(unit, individual)」概念について触れた。実は、あらゆる因果推論枠組みは「個体」についての一定の理解のもとで成り立っている。

たとえば因果推論枠組みには(割付のignorabilityと並んで)SUTVAという有名な仮定がある。これはStable Unit Treatment Value Assumptionの略で、簡単にいえば措置グループと統制グループのあいだに相互干渉(interference)がないこと、そして(それと関連するが)個体ごとに措置のばらつき(unequal treatment)がないこと、である。

さきほど引用した文章にもあるように、「個体特性が個体特性を引き起こす(個体特性が原因となって個体特性を結果する)」と考えることは、この枠組みでは確かにナンセンスだ。なぜなら、個体特性は個体特性であるがゆえに「同一個体」に割付できないからだ。

しかし個体とはそもそも何なのか? とりあえず以下のようなことが思い浮かぶ。

  • 計量分析では、「日本」「京都府」「鈴木さん」などが個体の外延だ。「男性」「マニュアル職」「OECD加盟国」などは(個体特性だが)個体ではない。
  • 個体効果を固定効果として扱うことでその効果を除去するのが固定効果推定で、逆に固定効果を除去して個体の効果を推定するのが変量(混合)効果推定である。(なのでこの2つの分析はかなり違う世界に属している。)
  • 個体とは「持続的な特性を多数保持している観察単位」。持続的な特性によって生じる差が「個体差(heterogeneity)」。

個体差がない場合には、当然個体を個体として扱う必要もなくなる。したがって計量分析では、個体はある段階では経験的に存在が確認されるようなものである。たとえばパネルデータ分析では、個体ごとの誤差のまとまりが検出されず、かつ個体効果バイアスが検出されなければ、その個体のレベルはないものとして分析することが許容されている。

しかし、割付やサンプリングの最小単位としての個体は常に前提とされる位置にある。たとえばサンプルを「男性」に限定することと、そうして限定したサンプルから個体をサンプリングすること(あるいはサンプルのなかの個体を割付すること)は異なった手続きである。

計量研究をする研究者が、いかにして何かを個体として理解しているのかは、必ずしもきちんと解明されていないと思う。こういうのはまさに社会学の役目で、エスノメソドロジー的には、たとえば自殺をカウントする際には、自殺がいかにして記述・理解されているかの知識が前提となっている(が、これをきちんと記述するのはかなり大変なので、研究する余地がある)。さらに計量研究者は、介入実験だろうが調査観察だろうが、「個体」をピックアップしたうえで、「これは自殺、これは自殺じゃない」とカテゴライズしたり、ある個体群に措置をして別の個体群に措置しない、という判断をしている。カウントするためには、カウントする単位が確定していなくてはならない。

先ほど書いたとおり、個体が個体として計量分析で機能するためには、それは「持続的な特性を多数保持している観察単位」である必要がある。しかし、何が「持続的な特性を多数保持している観察単位」になりうるかは研究目的に左右されるし、もしかすると時代や地域によっても変わるかもしれない。(たとえば、世帯サンプリングはもしかするとこれからますます使えなくなっていくかもしれない。)

とりあえず以上。

以前の関連記事もどうぞ。)