August 15, 2014

GESIS感想(ドラフト)

私は8月11日から15日までの5日間、ドイツにて調査研究法に関するサマースクールを受講してきた。今回サマースクールで訪れたのはGESISという後述する調査研究法や社会調査に関するデータのアーカイブ機能を持った研究所である、DAADによる支援対象にもなっているライプニッツ研究所の一つである。GESISには複数の拠点があるが、今回はケルンのセンターに赴いて授業を履修した。サマースクール自体は8月の前半から下旬までの3週間をかけて開かれている.中心となるテーマはSurvey Methodology、日本語に訳すと調査研究法と呼ばれる分野である。ごく簡単に言ってしまえば、アンケート調査等をする時の質問紙の設計であったり,回答後のデータ処理の向上を目指している分野であるが、私はサマースクールに参加するまで(そして多くの日本人研究者がそうであると思われるように)この分野が社会学における社会調査法と等しいものだと思っていた。社会調査法とは、社会学的なテーマを実証するための調査をするときのプロセスや分析手法全般を指す。日本では、社会調査法を教える人は何かしら専門とするテーマを他に持っている事がほとんどであったため、調査に関する手法は社会学者が片手間にやっているものだと考えていた。しかし、調査研究法が目指すのは、端的に言うと質問紙調査の質の向上である。例えば、調査をするとどうしても生じざるを得ない無回答(これは回答者が欠落している場合 unit nonresponseと回答者が質問の一部を回答しない場合 item nonresponseがある)をどのように減らすことができるかを調査研究法は調査の前後の両方で検討している。前者に関してはサンプリングの段階からどのような調査方法(自記式なのか面接形式なのか、コンピューターの補助はいるか、ウェブにするかなど)、後者に関しては欠落したデータをどのように補充 imputationするかについて検討する。これはほんの一例であるが,こうした改善を通じて質問紙調査の質が向上するというとき,その質が具体的に何を指しているかというと,これはいかに真値から誤差が少ないデータを生み出せるかという点に集約されている。調査研究法の分野ではTotal Survey Error (TSE) というパラダイムが採用されている。これは、調査設計から分析までの全ての段階で生じうる誤差について検討し、できる限り誤差の少ない,すなわち真の値に近いデータを作成することに価値を置く。

 余談になるが、私は調査研究法の「真値から誤差の少ないデータ」といったときに、教科書が真値という言葉をある意味でナイーブに捉えている事に若干の驚きを持った。存在論的に言えば、この考えは世界の事象に対する実在論 realismの立場をとっていると考えられる。つまり、ある現象の原因に、客観的に同定できる形でその原因が存在しているという考えをとっている。この考えは、我々が日常的な発想で良くする推論の拠り所となっている。例えば、病気が発生した時に我々はその原因を医学的な知識を用いて推論するが、この場合私たちないし依拠している医学は原因が実在するという立場を取っている。これを社会現象に応用すると、人々の社会的態度を規定する原因も実在するという立場を取る事ができる。これが社会科学における実在論になるが、調査研究法のパラダイムではまさに実在論が前提されている。これは教科書には明確に書かれていないが、原因が実在すると考えなければ真値という言葉がつかえるわけがない。私がナイーブに用いている事に驚いたというのは、隣接する領域である社会学では、実在論的な考えは唯一の存在論的な認識ではないからである。社会学では社会的事実が構築されたものであるという構築主義 constructivismの立場を取る事が少なくない。詳細は割愛するが、社会学者は社会現象について考える時に、その現象について実在するか構築されたものとして認識するかの二通りの考えをする事が多いと思われる。実際には、実在論的な立場の人も構築主義的な立場の考えを暗黙のうちに考慮に入れた分析をしていると思われるが、調査研究法のパラダイムには、そうした構築主義的な視点が入る事はない。なぜならば原因には真値があるという非常に強固な実在論的な前提を保持しているからだ。確かに、この前提が無ければそもそも誤差を減らすという考えには至らないので仕方ない面もあるのだが、後述するように、本当に社会的な事象の原因が実在するかは安易にイエスとは言えない。調査研究法がこれほど強固な前提を主張しているという事は、ある程度社会学と距離をおいた分野であるという理由が考えられる。調査研究法には調査をする人々以外にも、質問がどのように認知されるかという心理学サイドの人々もおり、英語圏では社会学とは全く別の領域であると考えた方が良い。日本では明確に境界づけられていない調査研究法という分野がアメリカやヨーロッパでは独自の領域として認識されているのは、調査が盛んであるというインフラ的な側面の違いもあるだろうが、これ以外に私はアメリカにおいて社会心理学が社会学の一部である一方で日本では別のものと考えられているのと似たような対比を覚えた。調査研究法の場合は日本で同じと思われているので逆のケースだが、このような認識の転換からサマースクールは始まったと言える。

 私はIntroduction to Survey Designという調査設計に関する入門講座を履修した。確かに内容は非常にベーシックで学部生でも十分ついていけるレベルのものであったが、それは同時にfundamentalである。先の存在論的な認識についてもそうであるし、この授業を通じてTSEフレームワークに準拠した調査設計における誤差の検討法について概観する事ができた。概観というと個別のトピックの仔細には触れずに軽く見渡すというニュアンスになるが、概観する事を通じて、ここのトピックが全体図の中で持つ機能を確認できるのであり、これは個別的な議論(そして社会調査に置ける分析は往々にして断片的な知識に基づいたものであることが多いように思われる)に終始して、それらが全体の中でどのような位置づけになっているのかについて関心を持たないでいる状態とは大きく異なるし、概観できてこそ各要素間の関係が見えてくる事を痛感した。

 初日はサンプリングについて、二日目は測定誤差について、三日目から四日目にかけて質問紙の設計や集計後の重み付けと補充について、最終日に改めて測定誤差について学んだ。初めは調査における妥当性と信頼性という非常に基本的な地点からスタートしたが、TSEフレームワークに則って、各プロセスで生じうる誤差について、それが生じるのはどうしてか,それをどうやって小さくできるかについてが主なレクチャーの対象となった。先の例では無回答に夜データの欠落を用いたが、ここでもこれを例にしてどのようにして誤差が減るか、それをどのように減らす事ができるのかについて考えてみたい。回答しない人と回答する人に分かれるという事が、求めたい真値を探り当てる可能性をどのように減らすのか。対象者の欠落に関しては、ある特定の特徴や条件を持った人は調査から漏れやすいという事態が考えられる。例えば、世帯を単位とした調査では、かなりの確率で家を持っていない人は対象から外れるだろう。電話調査にすれば電話を持っていない人が欠落すると考えられる。明らかにしたい問いによって、対象となるサンプルは定義されるべきだが、それに至る手段が与える影響によって、バイアスのかかったデータが生じてしまう可能性があるのだ。なぜならば、欠落した人々は何らかの社会的な特徴を持っており、それが全体で見た時に現象感の関係に少なくない影響を与えるからである。例えば、ウェブ調査によって対象とするサンプルから低学歴の人が排除されるのは容易に想像できるが、そこで明らかになるのは学歴のバイアスがかかったサンプルに置ける回答分布である。そして、確率的な抽出をしていない場合には、統計的な一般化をする事もできない。したがって、明らかにした糸井に届かなくなってしまう。次に、特定の質問の欠落を考えてみたい。仮にこの欠落が完全にランダムに生じているようであれば、欠落自体は問題にはならない。しかし、多くの場合、質問と回答者の社会的な特徴は関係しており、それによって質問項目の分布に誤差が生じてしまうのだ。例えば、女性が回答しない傾向にある問いやあるエスニシティに分類される人が回答しない傾向にある問いが想定されるとき、これは社会的な属性と質問の欠落が関係していることになる。このように、欠落がランダムに生じない場合、回答に誤差が生じてしまうし、さらに言えば、欠落を無視して(古典的な社会統計では欠落のあるデータは除外されていた)分析をしても、欠落した回答者の属性の影響を見逃している事になる。そこで用いられるのが、データの補充 imputationである。詳細は割愛するが、様々な補充の方法を用いて、できる限り真値に近いデータを再現する事が目指される。

 しかし、話を聞いていると、調査は誤差を減らすための労が非常に多い事に気づかされる。特に、データが集まる前の段階の誤差の修正は非常に重要な課題なのだが、そこには常に資金と時間の制約の問題がつきまとう。これは調査方法の選定や調査員や回答者へのインセンティブという要素と密接に関わる。これに加えて、質問ごとのスケーリングやワーディングによっても回答傾向は異なる。さらに言えば、回答者が同じ質問に対して常に同じ答えをするとは限らない。性別や年齢といった質問への回答に誤差はないが、回顧的な質問、例えばこの一週間に何度飲み物を飲んだかなどについては、回答者が常に同じ回答をするとは言えない。自分が作成した質問のロールプレイで気づいたのだが、強い意見を持っている事項に関しては1度目と2度目の回答に違いはないが、確固とした意見を持たない場合には、その間に違いが生じる事が多い。例えば、ドイツの人にイギリスやアメリカの評価を聞けば安定した回答が得られるが、アジアの発展途上国に対する評価を聞いても、曖昧な回答に終わってしまい、誤差が生じる事が分かった。このように考えていくと、本当に真値があるのか,そもそも真値があるという前提で調査を設計する事にどれだけの意義があるのかについて疑問を持たざるを得なくなってくる。


 まとめると、調査設計の授業は、調査設計のタイミングごとに生じる誤差について逐一検討するという非常にプラクティカルな意味で有益な機会となったが(そして、そうした側面がこの授業の目的でもあった)、想定外の産物としてこのようなリアリズムに対する疑念を生じさせてくれた。自分が将来的にどのような立場を取るのかは定かではないが、ある意味でとても極端な立場の考えの一端に触れられた事は無駄ではなかったと思っている。

No comments:

Post a Comment