November 18, 2018

JLM-Thinking Through Statistics

11月28日にJLMがマディソンに来てトークをしてくれることになりました。今週はサンクスギビングで中盤から休暇なので、トークで話してくれるTTSを読み進めたいと思います。

Introduction(google playの無料で読めるところまで)
多くの統計は不要であり、世界に関する異なる主張の妥当性を判断するための手法が必要である。ごく少数の事例ではモデルのフィットを良くすることが重要かもしれないが、多くはそうではない。アナロジーで考えよう。医科学の研究に対しては、不可能に思える問題ー不死ーに多くのリソースを割いてることに対して批判がある。しかし、実際にはより重要な問題として、栄養や運動、環境への被曝リスクなどがあげられている。これらの問題は、単に解くことも難しいために敬遠されている。

統計についても同様である。多くの統計の分野で行われて入るのは絶対的に最も優れた推定値を出すことである(bestimates)。しかしながら、たいていの場合、正しいモデルを知っているのであれば、統計をやる必要はない。ここでの問題は、真のモデルからパラメータのbestimatesを得ることではなく、モデルの結果が誤解を招かないようにすることにある。我々にとって必要なことは、社会的世界に関するアイデアを提示することであり、その世界から私たちが間違っていることを知らせてもらうことであり、我々が実際に間違っている時により頻繁に、それを指摘してもらうことである。

多くの読者は統計学者は一つの正しいモデルを知っているとは想定しないと反論するだろう。たしかに、現在注目を集めているのはいくつかのモデルに対して、それらのうちどれが一番フィットがいいかを選ぶ手法である。こうした研究に対して肯定的な意見もあるが、あくまでも可能なモデルのうち、その一部しか見ていないことを肝に銘じるべきだろう。こうしたアプローチの重要性は否定されるべきではないが、繰り返すように、基本的な問題、すなわち真のモデルに近づいているのかを確証させるものではない。

統計学者はありえる変数の中でベストなモデルを選ぶ。社会学者の仕事はより世界をよく理解するためのモデルを考えること、すなわち欠落変数がないかを考えることである。
OLSよりも「正しい」モデルはあるが、多くの場合、OLSはその想定に対する違反に頑健である。ベストな推定量を出すわけではないが、全く間違っているわけではない。

さらに、より重要なこととして、そのデータのモデルとは独立の特徴と関係している。係数をある種の因果効果として解釈することもできるし、偏相関係数としてみることもできる。これらの記述的な解釈は役に立つだろう。多くの研究者は行動理論的なモデルに近づいているが、私(著者)からすればそれは話の半分にすぎない。政治家の「平和を望むなら戦争に備えよ」になぞらえれば、「モデルを望むなら記述に備えよ」となる。

ここでいう「モデル」とは、実際の世界に対して検証可能な含意を含む主張をすることである。あるいは、それは因果や過程に対する主張となる。モデルが仮に正しければ、パラメータは真の世界らしき解釈を導いてくれる。

パラメータの推定値と、測定値(測定の単位とやりとりをする過程)の区別をしておこう。我々は、モデルのパラメータ(及び測定値)と記述統計量との区別をしようとする。記述とはモデルとは独立なデータのセットにおいて情報を要約する方法である。つまり、どんなモデルであっても平均は平均である。それに対して、複雑なモデルではパラメータは、もしそのモデルが間違っている場合には、意味をなさない。

No comments:

Post a Comment