社会学者の研究メモ

はてなダイアリーから移転しました。

計量分析におけるミクロとマクロ

このエントリは関心のない人は読まない方がいいかもしれません。(頭が痛くなるわりにそれほど重要な話でもないので。)

計量分析の世界では、しばしば「性別」や「学歴」が個人レベル変数で、たとえば国の特徴を表す変数(「社会支出のGDP比」など)がマクロ変数だと考えられています。結論から言えば特に問題はないのですが、ではどうして後者がマクロ変数なのかと考えはじめると、意外にややこしい説明が必要になります。

しばしばなされる説明は、マクロ変数は「集団の特性」を示す、というものです。たとえば教育社会学でしばしば利用される学校データだと、個人の特徴(性別、出身家庭のSES、エスニシティなど)に対比して学校レベルの特徴(生徒数、男女比、公立か私立か、学校の人種構成など)がマクロである、と理解されています。

しかしここで「集団の特徴だとマクロレベルだ」と考えると、性別やエスニシティがなぜミクロレベルなのかがうまく説明できなくなります。ある人が「男性であること」と「高偏差値を持つ学校に在籍していること」という二つの特徴を持っており、なぜ後者だけマクロとして理解されるのかが、これだけだと分かりません。実際、賃金関数の推計で企業規模変数を投入するとき、通常この変数はマクロレベルだとは考えられておらず、性別と同様に扱われます。ついでにいえば、性別の方がよほど「マクロ」な変数だという気もします(世の中のほぼ半分の集団を表すものなので)。

要するにあらゆる変数は集団の(厳密にはデータの最小単位の)「分け方」だと言うことができてしまうわけです。

このことを反映して計量分析では、便宜的に特定の変数をマクロ変数と呼んでいるだけで、計量分析の理論からすればミクロとマクロに有意味な違いを設定しないことがほとんどです。国別マクロデータの分析方法は、モデルとしては個人レベルのマイクロデータの分析方法と同じです。国別の女性労働力率で出生力を説明する時などは、データが集計データなので「マクロデータの分析」だと言われますが、モデル自体はミクロの回帰分析と同じものです。

ただ、特定のモデルではデータの「レベル」をモデルのなかで分ける必要があることがあります。混合効果モデルが代表的ですが、この場合しばしば国別のデータと個人レベルのデータの両方を同時に処理します。ただしこのモデルは一般的に考えられているミクロデータとマクロデータに常に適用されるわけではなく、同一個人のデータとその個人の別時点でのデータというレベル分けでもいいのです。

それにレベルが違うとはいえ、基本的にはどの変数も(さきほどの言い方だと)集団の分け方であることに違いはありません。だからデータの様子によっては別にこれらのモデルを使う必要がありません。パネルモデルや混合効果モデルに特徴的なのは、レベルが異なるデータを扱うということではなく、「理論的に意味をなさないが、何らかの影響を持つと思われる変数(分け方)を投入する」という点にあります。

「理論的に意味をなさないが何らかの影響を持つ」というのはわかりにくい表現ですが、例を挙げると理解しやすいと思います。たとえば「鈴木さん」とかです。あるいは「日本人」でもいいでしょう。通常はこういった固有名を示す変数は計量モデルには投入されません。なぜかというと「理論的に意味がない」からです。「この回答者の賃金が高いのは、回答者が鈴木さんだからだ」では、なんだか説明された気になりません。説明する要素はしたがって常に理論的に意味を持たされやすい変数であることが期待されます。もちろんここは多かれ少なかれ学者コミュニティの判断に依存している部分もあります。「賃金が高いのは男だからだ」という説明は「鈴木さんだからだ」より通りやすいのが現状です。

どうしてこういうおかしな変数を投入するかというと、「鈴木さん(個人)ダミー」を投入することで、「鈴木さんであること」からくるあらゆる観測されない効果をそこに吸収させ、個人「内」レベルの変化(「朝食をきちんと取るようにした」)が学力などのパフォーマンスに及ぼす影響を測定しやすくするためです。そして固定効果モデルに限っていえば、単に分析者はこういった変数の効果に関心がないだけで、計量モデルの中の位置づけは他の変数と基本的には同じです。

データによってはランダム効果モデルが使えて、そこでは上位レベルの変数を投入することができますが、上位レベルのまとまり(「鈴木さん」や「日本人」)の効果を除去するという方針に変わりはありません。個体固有の観測不可能な影響を除去する必要がなければ、GDPだろうが朝食だろうが、レベルを気にせず投入して解釈すればいいわけです。

したがって、性別による説明に理論的意味がない(がこの分類に観測しにくい影響がある)と判断する理由があれば、性別に対応する変数(たとえば男の平均友人数)をマクロ変数だと呼ぶこともできるわけです。とはいえ、まとまり固有の効果はそれこそ「まとまっていること(によって影響を及ぼし合い、観測不可能な影響を与えていること)」自体から発生する効果であると少なくとも理論的には想定されているので、性別を固有まとまりに設定する理論はちょっと考えにくい。とはいえ閉じられた世界で男女がそれぞれグループを作っているようなケースを観測する際には、これを上位レベルのまとまりとして統御することはありうるでしょう。

■追記
すみません最初の問に答えてませんでした。「まとまり効果」を想定できる分け方(「鈴木さん」「日本人」「3年B組」など)に対応する特徴(「学歴」「社会支出」「クラスサイズ」など)をマクロ変数と呼ぶことがあり、それに関しては単なる便宜上の呼び方の違いというだけではなく、計量分析上の取扱い方が異なる、ということでした。