日曜から社会ゲノミクスのサマースクールに参加しているわけですが、色々な分野の人と萌芽的なトピックについて一緒に学んでいく過程は、知的刺激に満ちていて、コロナ禍で凝り固まった頭がほぐれる瞬間に幾度も会うことができています。
まだまだ学んでいるばかりなので、変なことを言っているかもしれませんが、社会(科)学がなぜゲノムデータと真剣に向き合う必要があるか、数日考えたメモを書いておきます。後日書き足すかもしれません。
社会科学にゲノムデータが必要なのはなぜか?
社会科学者の多くは、おそらく「なぜゲノムデータを自分が扱う必要があるのか?」と思うことでしょう。「社会」を研究する側にとって「遺伝」は対極にあるものと言えるかもしれません。こうした懐疑的な見方に対して一つ回答を提示するとすれば、「我々が関心を持つアウトカムも世代間で遺伝するから」という答えがあげられます。ここでの遺伝は、生物学的に決まっているという意味よりも、あるアウトカム(遺伝研究では形質)が親子間で遺伝したり、きょうだい間で遺伝的に相関していることを指します。心理学者のTurkheimerはかつて「すべては遺伝しうる(everything is heritable)」という有名な言葉を残していますが、人間同士の差を決める特徴で、遺伝しないものをあげる方が難しいです。
たとえ社会科学が関心を持つアウトカム、例えば賃金、教育年数、政治的志向、健康などが遺伝すると認めたとしても、なお以下のような反論が想定されます、つまり「それは切片であって独立変数にはならない」。集団間で注目する形質が遺伝するとしても、それ自体は生物学的なメカニズムであって、社会的な要因によって形質を説明する限り、遺伝は関係ないという考えです。これに対しては、二点反論をあげることができます。
一点目としては、遺伝子と社会的環境は相関する点があげられます。例えば、教育年数を予測する遺伝子を持つ子どもの親は実際に教育年数が高く、所得も高い傾向にあります。したがって、仮に遺伝子を統制しない場合、環境要因(親の学歴や所得で見た家庭環境)が形質(教育年数)に与える影響が、因果的なものなのか、それとも遺伝子を考慮すると無視できるくらい小さくなるのかは、経験的に検証する必要があります。親の学歴といった個人レベルの環境要因じゃなければ遺伝子を見なくてもいいのではないか?という批判も考えられますが、個人を超えたレベルの環境(例:近隣の豊かさ)も遺伝子と相関します(教育年数遺伝スコアが高い子どもの親は豊かな近隣に住む傾向にある)。さらに、周りの人間の遺伝子も形質に影響することがあります。アメリカの研究では、高校の学年に遺伝的にタバコを吸いやすい人が多いと、自分もタバコを吸いやすくなるという研究があります(これをメタゲノム効果と呼びます)。
二点目は、遺伝子と環境が組み合わさって形質に影響を与えることがあります(交互作用)。例えば、現在多くの研究が、豊かな親のもとに生まれた場合、教育年数を予測する遺伝スコアが教育年数に与える影響がより強くなるのではないか、という点が検討されています。この仮説は、具体的には教育年数が高くなるような遺伝的特徴を持った子どもに、資源を多く持つ親はより多くを投資するのではないか、という予測を導きます。実際には、上述したように環境と遺伝子は相関するので、交互作用が因果効果なのかを同定するのは難しいところがあります。しかし、仮に環境が遺伝子とは独立に生じる場合、強力な因果推論が可能にあります。例として、ソビエトの崩壊後に、教育年数遺伝子スコアの予測力が増加した(共産主義体制の崩壊はより能力的な選抜を重視するようになったから)、ベトナム戦争に招集された人のうち、喫煙遺伝子スコアが高い人(遺伝的にタバコを吸いやすい人)において顕著に喫煙行動の開始が見られた、などの知見があります。具体的な介入がなくても、教育年数遺伝子スコアの予測力は男性では時間的に変わらないが、女性では近年になるにつれ上昇している(昔は女性が高等教育に進出する機会が構造的に限られていたため)、あるいは近年ほど喫煙遺伝子の予測力は上がっている(たばこ税の導入や禁煙規範が強くなったことで、タバコを吸う人はますます遺伝的に吸いやすい人に集中しているため)など、社会の変化と遺伝子の予測力は密接に関連していることを示す研究が近年、続々と出てきています。
社会学はゲノミクスに何ができるのか?
社会ゲノミクスのアジェンダは基本的に、既存の社会科学的問いの中にゲノムデータを位置付けて、今までの知見をブラッシュアップしていこう、という姿勢を持っています。例えば、本人の遺伝的な特徴が教育年数を予測するのか、それとも家庭環境の方が重要なのか、いわゆる「生まれか育ちか」の論争では、先天的な能力指標としてIQや知能指数が用いられてきた歴史がありますが、これらの指標が測られる頃には、すでに子どもは家庭環境の影響を受けており、純粋な先天的指標にはなり得ません(実際には、既存のゲノムスコアもこの限界を克服できていません)。
一方で、社会ゲノミクスに、社会科学の視点を使ってゲノミクスをアップデートしようとする姿勢は希薄な気がします。ただゲノムデータを輸入するだけでいいのか、少し考えたところ、社会学が貢献できるのは以下のような点なのかもしれないと考えています。
社会学は、究極的には個人の行為と制度的条件のインタラクションを研究する分野です。そこでは、例えば親の教育年数と子どもの教育年数が相関するだけでは不満が残り、なぜそうなるのかを説明することは求められます。例えば、学歴の高い親は、自分の得た地位を選抜制度を通じて合法的に子どもに継承させるために、子どもの教育に投資をするのではないか、という仮説がありますが、この仮説の主体は親である個人です。なぜ学歴の高い親にとって教育投資をすることが合理的なのかを、社会学は説明しようとします(ここでの合理性は経済合理的な選択に限りません)。
こうした個人の行為と制度の相互作用を研究する社会学的な視点をゲノムデータを見る際に持ち込むと、以下のような不満が生じます。現在の遺伝研究では、遺伝的に親子の教育年数が相関するメカニズムを説明できておらず、なぜその関連が生じるのかを説明する必要性を強く感じます。遺伝子と形質が1対1に対応する場合は因果的な説明が可能です。つまり、ある遺伝子を持っているかどうかによって、病気になったり、血液型が変わったりする事例です。しかし、社会科学が関心を持つようなアウトカムの多くは、complex traitsと言われ、単一遺伝子では説明できないものばかりです。こうした形質に注目する以上、生物学的なメカニズムがファジーになるのは仕方がないところがありますが、社会(科)学的な視点を応用すれば、教育年数の遺伝的相関を行為レベルに分解して、そのレベルに該当する遺伝的アウトカムや制度的な条件を手繰り寄せる気がしています。
日本事例がなぜ必要なのか?
残念ながら、社会ゲノミクスのためのデータ整備という観点では、日本は著しく遅れています。以上で述べた複雑な形質を予測するための遺伝スコアは、100万以上ある遺伝子座の情報をまとめた要約統計を作成する都合で、まずスコアを作成するために大規模なサンプルが必要であり、さらに(機械学習でいう学習データにあたる)遺伝スコアを作成したサンプルとは別のサンプルを使って、実際の分析をする必要があります。幸い日本でも、前者のデータは整備されつつありますが、後者に使われる社会調査では遺伝子データがまだ集められていないのが現状です。前者についても、日本ではまだ健康や疾病といったアウトカムに着目した遺伝スコアが構築されているに過ぎないのが現状であり、教育年数などのアウトカムはまだ遺伝スコアすらできていません(アメリカの遺伝スコアを使えばいいのではないかという指摘が考えられますが、実はこれができない事情があります)。
そもそもの問題として、社会ゲノミクスにとって日本事例は必要なのか、という考えもあるでしょう。アメリカ以外にも、レジストリデータが整備されている北欧やイギリスなどでも遺伝子データの整備は進んでいて、わざわざ日本のデータを用いる必要はないのでは?という疑問は最もなところがあります。
これに対しては、日本事例は社会ゲノミクスに対してユニークな貢献ができると確信しています。社会ゲノミクスは、遺伝子の研究ではなく、遺伝と社会の相互作用の研究分野です。特に、先述したように社会(制度)の側が遺伝とは独立に変わる時が、今までわからなかったことがわかるようになる瞬間です。この点で、日本はその他の高所得国に比べて独自の強みがあります。日本は150年という比較的短い歴史の間に、急速な近代化と戦争による体制の変化、近年では急速な少子高齢化といった大きな制度的変化が連続して起こっています。社会学では欧米と比べて東アジアの急速な近代化の帰結を「圧縮された近代」と呼ぶことがあるのですが、この視点は社会ゲノミクスの研究関心に新しい知見をもたらすことができるはずです。
個人の遺伝子は急激な制度変化にどのように反応し、その結果としてどのようなアウトカムが生じるのか。複数の制度変化が同時に生じた場合にはどうなるのか、わかっていないことが実はたくさんある気がしています。以上のような理由から、日本でもゲノムデータが整備されることを強く望みます。