読者です 読者をやめる 読者になる 読者になる

社会学者の研究メモ

はてなダイアリーから移転しました。

(非計量さん向けの)統計学の話:バイアス編

(今回はですます調でいく。いや行きます。)

まずは、私の後輩や知人たちが書いた本です。↓

エスノメソドロジー―人びとの実践から学ぶ (ワードマップ)

エスノメソドロジー―人びとの実践から学ぶ (ワードマップ)

このなかに、次のような文章があります。

どのような研究に対しても、その主張の妥当性を、そこで採用されている方法と無関係に論じることはできません。だから、「事例の数」やそこから得られる「一般性」を問う前にまず、ある研究が明らかにしようとしていることが、そもそも事例の数によって保証される種類のものなのかどうかということ自体を考えなくてはなりません。

このことは言ってみれば「当然」のことなのですが、研究者の間ではあまり考えぬかれていない重要な論点であるといえるでしょう。

さて、研究における主張を「事例の数によって保証」しているのは、一部の(計量的な分析を行わないが)事例を積み重ねるタイプのフィールドワークや、一部の量的研究について当てはまると言えるでしょう。ただ、モデルを使って統計学的推定・検定を行うタイプの研究では、そのなかでもう少し複雑なことをしています。

今回は「統計学はそのなかでいったい何をしているのか」について、断片的ですが、私なりの見方を説明します。そうしたほうが、「統計学的検証で何ができないのか(どういうときにそれが意味を成さないのか)」について考える際に、よりはっきりした展望が開けると思うからです。統計学は、「ある研究が明らかにしようとしていること」に対して、どのようにその知識の妥当性を「保証」しようとしているのでしょうか。

もう少し(あらかじめ)補足をしておくと、「事例の数(を集める)ことによって知識の妥当性の保証をしようとする」という側面が、たしかに統計学にはありますが、それはいかにしてなのか、を説明します。そしてそれは統計学が「誤差」を考えるときの作業にあたるのですが、実は「誤差」について考えるには、その前に「バイアス」というものについて考えておく必要があります。今回はその話です。

というわけで、以下の解説はむしろ量的方法をふだん採られない研究者の方に読んでほしいものです。非量的研究者の方々からツッコミをいれやすいように、統計学の基本的な発想法をかなり強調して説明しています(博多うどんの麺をもっと柔らかくしたかんじです)。ツッコミをお待ちしております。ツッコミのデータは匿名化のうえ筒井の研究業績として利用されることもございますので、その点どうかご了承ください。

統計学における「説明」とは何か?

以下、統計学(的検証)という言葉で「統計学的推定・検定の手続き」を意味しているものとします。なのでこの手続を含まない計量手法(記述的分析など)は考慮していません。計量経済学といったほうがいいかもしれません。

さて、統計学の基本的発想は、ある事象が別の事象によって「説明」される、という発想から始まります。「説明」とは、ここでは因果関係のことです。因果関係とは、A→Bの場合、Aを動かすことによってBも動く、ということです。(ここ、ツッコミポイントですが、今はとりあえず流してください。)

具体的な例で考えてみましょう。被雇用者の年収はどうやって決まっているのか、を統計学的に明らかにしたいとします。性別はいかにも効いていそうです。そこで、さしあたって年収と性別だけ観察して集計してみました。


性別 平均年収
女性 200万円
男性 480万円

しかしモデルを使った統計学では、あまりこういう表記はしません。次のように書きます。

収入の観察値= 200 + 280×男性

この「200」が「切片」で、「280」が「係数」です。計算方法はいろいろですが、最小二乗法という計算方法が標準的です。ともかく何らかの計算方法で、影響の大きさ(係数)を確定します。ここではたとえば、「男性であることによって女性であることよりも280万円収入が高い」となります。

しかしこの「男性であることによって」というのはどういうことなのでしょう? 男性であることのどういう性質によって年収が上がっているのでしょうか? 男性に正規雇用が多いから? 男性のほうが被雇用者の年齢が高いから? こういった疑問に対して、かなり特殊なやり方で答えを出していくのが統計学です。

ここでちょっと補足します。「説明する」ものを選定するためのロジックは、研究分野によって少しづつ違うと思います。たとえば社会科学の場合、説明要因には基本的に固有名は入りません。たとえば、

収入の観察値= 200 + 100,000,000,000×ビル・ゲイツ

みたいな計算はやってもできないことはないのですが、「年収が高いのはビル・ゲイツだから」といわれても、なんだか説明された気にならないし、じゃあ年収を上げるにはビル・ゲイツになるしかないのか、といわれてもちょっとなれないし、Macユーザとか「なりたくもない」と言う人もいそうですし、やっぱり「ビル・ゲイツであることのどういう部分が年収を上げているのか」と考えて、その要因を加えていくことになります。(「アメリカ人」「(元)オーナー経営者」「業種」などなど。)

さすがに説明要因として「ビル・ゲイツ」とか「佐々木さん」とかいわれても、かなり特殊な文脈でないと聞いている方は納得しないでしょう。「佐々木さん稼いでいるよね〜」→「うん、だって佐々木さんだもん」→「だよね〜」というやりとりは日常的にはありそうですが、それでも「佐々木さんという人が持っている何らかの性質が、佐々木さんの年収を上げているのだ」と当事者は考えているのではないでしょうか。

では次はどうでしょうか。日本人とシンガポール人の年収を観察したデータから、次のように計算されたとします。

収入の観察値= 300 + 100×シンガポール

今度は「ビル・ゲイツ」「佐々木さん」よりはまだ説明された気になるような気がします。実際、国を説明要因にした計量的分析はしばしば論文にも登場します。とはいえ、やはりその先の問い、「日本人とシンガポール人のどういう違いが年収の差を生んでいるのか」があることはみんな分かっているので、分析者はもっと多くのケース(国)を集めて、その問いに統計学的な答えを与えようとします。(その他の国のデータが集まらなかったときは、いろんなマクロ統計---景気動向や産業構成など---などを使って「解釈」します。が、これはすでにここでいう統計学的な判断からは外れた作業です。)

話を戻しましょう。

「男性であることのどういう性質によって年収が上がっているか?」という問いに答えるためには、年収と性別以外の要因も観察しなければなりません。さきほど思いついたのが「年齢」と「雇用形態(正規雇用化どうか)」だったので、とりあえずこの2つを加えたデータで計算をやり直します。すると、次のように結果が出てきます。(実際のデータでやっても、おおよそこんなかんじになります。)

収入の観察値 = -80 + 180×男性 + 4×年齢 + 250×正規雇用

みるとわかりますが、「男性であることの効果」が280万円から180万円まで減っています。差の100万円は、「年齢」と「正規雇用」で説明される分に組み替えられて計算されたわけです。つまり「男性であることのどういう性質によって年収が上がっているか?」という問いに対しては、「少なくともその一部については年齢と雇用形態で説明された」と見るわけです。

ここで、「残りの180万円は男性であること固有の効果である」といえないことはもうおわかりでしょう。すこしばかり説明要因を加えてそのように書いている分析者もいるのですが、それはウソです。「男性であること」は、他にも「学歴」「勤続年数」など様々な要因と関わっていて、さらにそれらの要因は年収にも大きな影響をあたえるでしょうから、さらにこういった要因をどんどん観察して加えていかないと、「男性であること」による純粋な効果まで辿りつくことはできません。

同じように、「正規雇用であること」の効果は250万円と計算されていますが、やっぱり「正規雇用であることのどういう側面が年収を上げているのか」という問いを続けることができます。つまり、「ビル・ゲイツであること」も「男性であること」も、その先の問いがあるという点では実は共通しているのです。

どこまでいったら「説明」が終わるの?

さて、この問いはどこまで続けたらいいのでしょうか?

実は、統計を使った研究に対して、非統計学的な方法を得意とする研究者(フィールドワーカーや概念分析研究者)にツッコミを入れてほしい箇所の一つが、ここにあります。統計学を使った分析者(「量的さん」)が「男性であることの年収に対する効果は...」と言ったとき、まずはジャブとして「いや、それ、説明になってないような気がするんですけど」とツッコミを入れてください。すると中途半端にしか統計を理解していない量的さんは、ほこらしげに「年齢や雇用形態その他の要因は統制してありますから」と返してくるかもしれません。

非量的さんは、この「統制=コントロール」という統計学金科玉条のごとき言葉の前にたじろいではいけません。だって、いろんなツッコミ方があるでしょう。まずは「統制って、それなんなのですか」「他の影響を取り除くって言われても説明された気にならないんですけど」と聞いてください(学会のセッションなどでは時間がないからゼミや研究会でしかやりにくいですが)。

さしあたり「量的さん」にかわって答えておきます。(いろんな説明法がありますが)統制とは「条件をそろえた上で測定し、その平均をとったもの」と考えてください。ここではまず非正規雇用のなかで「男であることの効果」を測定・計算し、次に正規雇用のなかで同じように計算して、(重み付けなどして)あいだをとるのです。もし「男であることの効果」の効果が非正規雇用正規雇用で異なると考えるのなら(実際かなり異なります)、カテゴリーを「女・非正規雇用」「男・非正規雇用」「女・正規雇用」「男・正規雇用」の4つに分けてから分析します(これを交互作用分析といいます)。

このような手続がどういう観点で妥当なのかの検討はする必要があるでしょうが、とりあえずもっと重要なツッコミポイントにすすみましょう。それは、「なるほど、正規雇用や年齢は統制しているのですね。だからといって残った効果が男性であることの効果の説明になっているのですか?」というツッコミです。

「量的さん」がどう答えるのかはわかりませんが、誠実に答えるとしたら「なっていない」のですね。というより、実は計量分析者が行っているのは、「男性であることの純粋な効果」を取り出すことではないからです。そんなものは存在しません。というより、計量分析によってかろうじてわかるのは、「説明要因の関連性」であって、個々の要因のまじりっけのない純粋な効果ではないのです。

では分析では何をしているのかというと、次のようなことをやっています。

ひとつには、「男性であることと考えられていた効果の少なくとも一部は、別の要因で説明できる」ということを示すために分析をしています。「どうして男性のほうが年収が高いの?」→「それは男性に正規雇用が多いからだよ」というふうに、「説明」するわけです。

しかし、「性別」と関連して説明したい要因が観察しにくいものだったらどうでしょうか? たとえば「職業適正」や「上司の差別的意識」だったら?

もちろんこういったことを観察した上で、それを投入することでどれくらい「性別」の効果が取り除かれるのかを分析した研究もあるでしょう。しかしお目当ての効果が観察できなかった場合、とりあえずそれ以外の効果を除去した上で、「残った性別の効果の中に『上司の差別的態度』の効果があるはずだ」と推測するわけです。もちろん推測ですから、これは統計学的に決着を付けることを諦めているわけです。統計学的研究とは、いってみれば「ここまでやったから私の主張の蓋然性は増したでしょ」というベスト・エフォートな研究なのです。

「どこまで要因を分解するのか」についての基準は、「要因間の説明関係」がどこまで公共的な基準からして通用するのか、にかかっています。観察コストの問題も大きいですが、たとえば当該報告を行う学会で通用している基準もあります。「現在の学会の基準ではそこで説明終わらせるのはもう許されないよ。先に行かなきゃ」と突っ込まれることがあるわけです。

そして、量的さんたちがあつまる学会で通用している「要因間の説明関係」には、ぽっかりと忘れ去られている関連性もありますから、想像力豊かな非計量さんたちからのツッコミにも期待される部分が大きいわけです。

でもやっぱり観察・測定コストの問題が大きいですね。量的研究者からすれば、「おっしゃることはわかりますが(=こちらでもいろいろ想定はしていますが)、今回はデータの制約上そのあたりは推測になっています」という答えになってしまうことは多いでしょう。

さて、以上が「バイアス」の話。計量経済学のテキストなどでは、バイアスは「◯◯の純粋な効果が別の何らかの効果によって間違って推定されていること」と説明されていることがたまにありますが、少なくとも社会科学の計量分析では、バイアスとは、実際には要因間の関連性の考察の不足を、何らかの基準に照らして指摘する際に便宜的に使う言葉なのです。心理学系の研究者はこのことを意識することが多いので、あまりバイアスという言葉を使いません。

私は、便利だからよく使いますが。

最後に、ヘタな図示で今回の話をまとめておきます。