社会学者の研究メモ

はてなダイアリーから移転しました。

計量分析をめぐるトレードオフ

「全数調査は高価だからサンプリングする」と教科書に書いてある割には、サンプリング調査もはっきりいって高い。でも安くあげようとして郵送法などにすると、回収率が下がって一気にゴミデータになる。

以上はよく聞かれる話。しかし最近はこの問題はもっと深刻だ。クロスセクション調査では分からないことが非常に多いので、パネルデータが望ましい。しかも家族持ちの場合、夫のみあるいは妻のみに聞くとバイアスが除けないので、カップル調査が望ましい...などなど。理想的なデータを得ようとすると、どんどんコストが高くなってしまう。とくにパネルは摩耗の問題があるので推定に特殊なバイアスがかかる。

次。サーベイだと、実態を測ろうとするとコストがかかる。たとえば「生活満足度」は認知的不協和の解消を経た後のものになるので、たいていどの階層でも満足度は高くなる。でもディープな質問票にすると回収率が下がる。回収率を上げようとすると調査コストが半端でなく高くなる。

むずかしい推定モデルを使うと、解釈がややこしくなる。そもそも限られた数のパラメータ推定を行うメリットは「情報の単純化」にあり、解釈のややこしいモデルを使うことはそのメリットを減らす。かといってあんまり単純でいい加減なモデルを使うと結果が怪しくなる。

最後。研究者が実査なんかやってたら、分析する時間なくなるんじゃ...。

...と最近、このようなことを考えています。