January 2, 2017

選択バイアスについて

昼過ぎに帰京して、院生室で作業。

傾向スコア法を用いた分析を進めているのだが、代表的な教科書であるGuo and Fraserでは、一応というか、傾向スコア法を用いた生存分析についても言及がある。生存分析の中で、cox比例ハザードで共変量が時間で変化しないのであれば、パーソンピリオドにする必要はないが、時間依存の共変量や、離散時間ロジットなどのような手法を用いる場合には、パーソンピリオドに変換する必要がある。ともあれ、時間で変化する変数を投入して、例えば賃金などを推定したい場合というのは少なくない。

ここで、関心を持つ処置変数に対して、選択バイアスの可能性が考えられる事例を想定する。例えば、あるプログラムへの割り当てを処置とする場合に、割り当てられるかどうかに共変量と相関があり、例えば企業規模が大きい場合には割り当てられやすいとする。このような共変量がたくさんあり、かつ共変量が量的変数の場合には次元の呪いとよばれる共変量調整が実質的に不可能になる事態が生じる。この問題を解決するために傾向スコアは開発されているわけだが、ふと、バランス後に処置変数を説明変数、何らかのアウトカムを従属変数として、処置変数の割り当てに対して調整した変数を統制変数として投入する場合に、これらの統制変数が時間で変化することは傾向スコア法を用いた因果推論に対して何もおかしなことは招かないだろうかと不思議になった。

おそらく、処置変数の割り当てに対しては時間依存の変数であっても、処置がされた時点やその前に遡った時点の変数を調整に用いて、実際のアウトカムの推定の際に共変量が時間によって変化することは特に問題がないだろうと思うのだが、やや不思議な感じである。

話は変わるが、またセレクションの話。今分析を進めているテーマの既存研究では、計量経済学の人たちが就業と結婚の同時決定性について議論することがある。要するに、賃金などは基本的に就業している人にしか与えられないが、就業していない人を分析に含めないことで推定にバイアスがかかるというもので、その理由は、就業していない人が何らかの留保賃金を設定しており、現実の労働市場を受け取れる対価がこの水準に満たない場合には就労しないという選択を取るのであれば、仮にその人が就労していた場合に受け取っていただろう賃金が分析に上がってこないからである。この留保賃金あるいは提示される賃金が男女などのグループ間で異なるのであれば、セレクションが問題となる。

当初、このサンプルセレクションを考えていたが、自分の関心はあるプログラムへの割り当てに対するセレクションであって、それ以前に就業しているかどうかのセレクションではない。さらに言えば、就業するかどうかにセレクションがあることと、就業を前提にプログラムを受けるかどうかにセレクションがあることは異なる位相にあると考えられる。すなわち、仮にサンプルセレクションのモデルで同時決定性を考慮に入れたとしても、なお、プログラムを受けるかどうかに対して選択バイアスが含まれる可能性は考えられる。と考えていくと、おそらく?サンプルセレクションのモデルが想定しているのは、学歴や性別といった就業以前に決定されている個人の属性のようなものが賃金に与える影響を正確に推定したいという動機があるのではないかと考えた。これに対して、処置それ自体の選択バイアスに関心がある場合には、処置を受けるかどうかに際して必要な前提条件(就業していること)は考慮しなくても構わないのではないかと、要するに、母集団を就業していない人も含めて考えるか、それとも就業している人に限定して考えるのかのいずれかなのですが。

No comments:

Post a Comment