June 29, 2018

早寝早起き

帰国後、午前3時に起きている。早起きは三文の徳というが、夏に限っては涼しいことも加わって、悪いところがないような気もする。

午前7時には大学に来て、火曜から4日連続作業していたのだが、それなりに進捗感はある。あくまで感触でしかないが。今週の作業としては、査読結果が帰ってきた英語論文の修正と、進学先の大学の先生との共同研究のための文献レビューが主。特に後者は、関連するトピックとはいえ、全く初めての研究のため、色々と知らないことが多く、驚くこともあった。

とはいえ、金曜にもなると疲れてしまい、久しぶりにブログでも書くか、という気分になる。調子の悪さの原因は過労もあるだろうが、昨日は夜に予定があり、必要以上にご飯を食べてしまって消化不良なのかもしれない。こういう調子の悪い日にやるべき仕事もあるような気がするのだが、なかなかリストにはできない。ひとまず、学会の会員情報管理ページに飛んで、住所と所属の変更、引っ越しの予約、wiscのメールアドレスのactivationなどをしておいた。

夜から帰省して、月曜までは休む予定。

June 22, 2018

PopFest-Oxford-2018

6月19日から21日まで、University of OxfordのNuffield Collegeで開催された26th Annual Population Postgraduate Conference、通称PopFestに参加してきた。

どのようにしてこのカンファレンスを知ったかについては、あまりよく覚えていないが、評判としては、ヨーロッパの大学院の博士課程に在籍している院生中心の集まりとして、ネットワークの側面が強いということを聞いていた。単に授業を聞くだけではなく、自身の研究を発表する機会もあり、予算があるうちにいってみてもよいかなと考え、参加するに至った。

カンファレンスの構成としては、10セッション・35報告のオーラルに加えて、1セッション・10報告のポスターセッションは全て院生の研究発表の時間。セレクションに当たって、多少のrepresentationに配慮があったのかもしれないが、3分の1はイギリスの大学、残りの3分の2は主としてヨーロッパの大学(ドイツ、イタリア、スペイン、スウェーデン、スイス、ノルウェー、フランス)に所属、私を含め若干の非ヨーロッパの所属(ナイジェリア、南アフリカ)だった。

これらの報告に、Oxford関係の教員による3つのKeynote、3つのWorkshopが企画された。当初、Keynoteとworkshopの違いがよくわからなかったのだが、おそらく、後述するように後者はcausalityに焦点を当てたオーガナイズをしたのだと思う。

カンファレンスのオーガナイザーは、Nuffield Collegeに所属する社会学の院生が中心だった。同じ社会科学系の大学院生が所属するカレッジであるSt Antony'sに比べて、Nuffieldには予算が豊富にあると聞いていたが、実際、今回のカンファレンスも後援には社会学部の他にNuffieldの名前があり、報告会場からフォーマルディナーまで、一連のイベントは全てNuffield College内で開催された。同じ社会学部でも、両カレッジに所属する、ないし出身の人には志向性というか、パーソナリティの違いのようなものも感じるのだが、それについても後述する。

大まかな感想としては、期待以上の内容だった。友人から聞いていたのは、院生のネットワークが中心で、議論はそこまで深くできるわけではないというものだった。しかし、実際には、それぞれの報告も博士論文の一部として進められているものが多く、刺激的だった。さらに、教員による6つのレクチャーが用意されており、こちらも社会学・人口学において近年注目を集めているトピックに焦点を当てており、非常に勉強になった。

特に、workshopについては、causalityに焦点を当てたもので、社会学・人口学における因果の問題について考えさせられた、想定外の機会となった。加えて、KeynoteのBreen教授の話も、因果に関するものだったため、結果的にはそれぞれの分野におけるトップランナーである4人の研究者から、因果に関する講義を受けることになった。

例として、最終日のFelix Tropfさんによる、sociogenomicsの話。すでにConleyさんのgenome factorは読み通していて、社会科学においてゲノムがいかに受容されているのかについては、なんとなくわかっているつもりではあったが、Felixさんのトークはゲノムを因果の中に位置付けて体系化したものだった。具体的には、ゲノムがこれまでの社会科学において関心のあった因果関係にもたらす影響は、以下の4つであるという。

(1)ゲノムが交絡要因である場合
これまで、XとYの間には因果関係があると想定されてきたが、ゲノムを交絡要因として統制すると、両者の関係が消える場合。具体的には、母親の第一子出産年齢と子どもが統合失調症にかかるリスクにはU shapeの関連があるとされてきた(若い母親のもとに生まれた子どもと高齢の母親のもとに生まれた子どものリスクが高い)。しかし、実際には統合失調症のリスクが高い母親は若年・高齢の出産をする傾向にあることがわかった。

(2)ゲノムの効果が環境によって異なる場合
genome factorを読んだ限りだと、Conleyさんたちはゲノムで全て決まるわけではなく、実際にはゲノムと社会環境が相互作用するのだ、と主張していたように思う。もしかすると、遺伝決定論などを相対化するために、この点を強調したのかもしれない。Felixさんのまとめによると、これもゲノムが社会科学的な研究に貢献する点の一つということだと理解した。

(3)ゲノムが操作変数の場合
ゲノムがXには影響するがYには影響しないと仮定できる場合には、XがYに対して与える影響を因果的に推定できるため、ゲノムは操作変数になり得る。ただし、一つ一つのSNP(single-nucleotide polymorphisms)とXとの関連が小さい場合が多く、その際には遺伝要因がweak instrumentになる危険性がある。

(4)ゲノムが新しい形でYに影響する場合
この点はまだFelixさんも考えているということだったが、例えばあるゲノムの違いによってライフコース上のアウトカムの差が拡大するのか、縮小するのか(社会階層論で近年注目を集めているaccumulation of (dis)advantageの議論)という点に関心があるようだった。

このように整理されると、確かにゲノムがこれまでの研究にもたらすインパクトは大きいように思われる。ただ、質疑応答の時に、ある遺伝子の発現が、phenotypeではないレベル(社会学などが関心を持つアウトカム)と関連を持つ場合に、両者の関連は(それが因果的であるとすれば)どのように説明できるのか、という質問があった。Felixさん自身の回答は、現在sociogenomicsの研究者はそのlinkについて取り組んでいる最中というものだった。ある遺伝子の発現ならわかるが、polygenic scoreのようなものを使用した場合には、結局のところ、なぜ遺伝リスクと社会人口学的なアウトカムの間に関係が生じているのかは、ブラックボックスのままになってしまう気がする。こうしてまとめていると、自分でもまだわからないことが多いことに気づくので、帰国後に開く勉強会などで不足を補いたい。

-•-•-•-•-•-

あるいは、2日目のKeynoteをしてくださったBreenさんの報告タイトルは、Some Methodological Problems in the Study of Multigenerational Mobility. わかる人にはわかるが、このタイトル、Duncan(1966)のMethodological Issues in the Analysis of Social Mobilityを意識している。

レクチャーでは、Judith Pearl流のcausal diagram (directed acyclic graph, DAG)アプローチで、三世代以上の社会移動研究の問題を3つ指摘していた。

(1)親子の間の交絡
三世代社会移動研究のメインの主張は、祖父母世代(G1)が子ども世代(G3)に対して、祖父母世代(G1)が親世代(G2)を通じて子ども世代(G3)に与える間接効果を考慮してもなお、祖父母世代が子ども世代に対して直接的な効果を持つ、というものである。

ここで、G1をX、G3をYと考えると、間接効果は親世代Zを通じて影響する媒介効果としてみなすことができる。この際、XからZに対してパスが、ZからYにパスが出ることになるが、ZとYの間、すなわち親世代と子ども世代の間になんらかの観察されない交絡要因Uがある場合(遺伝や富など)、X→ZとU→Zの間でcolliderが生じることになる。こうなると、適切に因果効果を推定できない。Uは複数存在する可能性もあるし、仮にそれぞれの世代における居住環境R1, R2, R3がそれぞれX, Z, Yに影響している場合、R3→Yの間とX→Yの間にもcolliderが生じる。

(2)親世代における子どもの条件付け
ここまで、三世代の移動に対して再生産の側面があることを考慮してこなかったが、実際には、祖父母世代が子ども(親世代)を持ったとしても、その親世代が子どもを持たないことはありえる。子どもを持つかをCとすると、Z(親世代)の教育達成などは子どもを持つかに影響すると考えられる。さらに、X→Zのパス以外に、Xが持つなんらかの特徴Vが子どもを持つ確率に影響するかもしれない。この場合、V→CとZ→Cの間でcolliderが生じる。

(3)メカニズムの条件付け
三世代社会移動研究では、G1からG3への直接効果に関心があるが、そもそもG1がG3が生まれる前に死んでしまう場合と、一緒に生活を共にする場合とでは、効果が異なるかもしれない。このexposureの側面は、これまでの多世代社会移動の研究者にも共有されてきたが、例えばG1の教育達成XがG1世代が生存する要因に寄与するEgに対して影響しているとする。同様に、G2世代の学歴からパスが生じるEpも、もしかすると親の生存に影響するかもしれない。この場合EgとEpがG1世代の生存Sにおいてcolliderとなってしまう。

-•-•-•-•-•-

学歴と出生の関係や、学歴移動といった社会学(社会階層論)、人口学が関心を持ってきた領域に対して、遺伝や多世代移動という新しい視点が加わりつつある。そして、これらの新しい視点に共通するのは、因果を明らかにしようとする姿勢にあると感じた。おそらく、10年くらい前であれば因果推論的な考え方自体が社会学では新しかったと思うが、徐々に因果推論やエコノメの知識はスタンダードになりつつあり、これらを知っていることを所与とした上で、既存の研究分野にアップデートを試みようとする動きなのかな、という感想を3日間カンファレンスに参加しながら思い浮かべた。

もっとも、カンファレンスのこれらの企画には、オーガナイザーの意向が反映していることも違いないだろう。今回はNuffield Collegeの学生が中心になって組織したことは先に述べたが、上に紹介した二人以外にも、ワークショップではSir David Cox先生がRCTに関する懸念を述べたり、Nicola Barbanさんがsequence analysisと因果推論を組み合わせた報告をしてくれたが、両名とも、Nuffieldの関係者である。4年前に参加したSorenson Memorial Conferenceの時にも感じたが、Nuffield Collegeのメンバーは、社会科学の一分野として、社会学的な研究をしているような気がする。これに対して、St Antony'sの学生や教員は、より地域の文脈を意識した研究をしていると思う。両者の違いがCollegeの伝統に帰すると言ってしまえばそれまでだが、その伝統が実際の研究においてどう顕在してくるのかと考えると、今回のカンファレンスの内容はそれなりにしっくりくるものだった。

-•-•-•-•-•-

最後に、カンファレンス全体の雰囲気などをいくつか。院生中心のカンファレンスの良いところは、地位や利害めいたものに縛られることなく、フラットな関係を築けるところだと思う。全員の顔がみえるサイズの集まりなので、ちょっとした同級生感覚も芽生えてくる。気の合う人を見つけることができれば、3日間という時間は仲を深めるにはちょうどいい時間だと思う。あるいは、今回の学会でそこまで話さなかったとしても、将来的に別の機会で出会った時に、思い出話をすることもできるかもしれない。サマースクールも似ているところはあるが、今回のカンファレンスでは、オーガナイザーの人たちがキャンパスツアーやディナーもアレンジしてくれて、研究以外に、将来的なキャリアの話や、それこそパブでするようなくだらない話もすることができた(丁度W杯が開かれていたので、最終日にパブでアルゼンチン-クロアチア戦を見たのがいい思い出になっている)。やはり長期休暇にはこういった集まりに参加して、ネットワークを作ることは楽しいし、多分将来的なキャリアにも少しは役に立つだろう。

個人的には、今回の報告も含め、ヨーロッパで人口学的な研究をしている若手の人に出会えたのが収穫だった。アメリカに行ってしまうと、アメリカ内で移動することはあっても、ヨーロッパの人と会えるのはPAAとRC28くらいになる。とはいえ、日本で生じている新しい家族形成の話を、アメリカだけと比べることには無理があり、どちらかというと先行研究もヨーロッパのそれを参照しており、研究報告以外でも、例えばスウェーデンにおいて同棲と結婚の違いがどう認識されているかなどを、現地の院生から聞けたのはとても勉強になった。

最後に、開催場所がNuffieldだったのは、今回参加を決めた大きな理由だった。やはり、自分にとってNuffieldは憧れの場所であり続けている。4年前に参加した時は学部生だったが、今回は博士課程の学生として報告をすることができた。今回のカンファレンス参加を通じて、いつかポスドクなどの機会を使ってNuffieldに籍を置きたいという気持ちがさらに強まったことは間違いない。しかし同時に、Nuffieldは自分の現在地を考える際のreference pointにもなっている気がするので、こういった形でたまにくる方が良いのかもしれない。


関連文献
Chan, Tak Wing and Boliver, Vikki 2013. "The grandparents effect in social mobility: evidence from British birth cohort studies." American Sociological Review 78(4): 662-678.
Elwert, Felix, and Christopher Winship. 2014. “Endogenous Selection Bias: The Problem of Conditioning on a Collider Variable.” Annual Review of Sociology 40:31–50.
Elwert, Felix. 2013. “Graphical Causal Models.” Pp. 245–73 in Handbook of Causal Analysis for Social Research, S. Morgan (ed.). Dodrecht: Springer.
Liu, H. 2018. "Social and Genetic Pathways in Multigenerational Transmission of Educational Attainment." American Sociological Review, 83(2), 278-304.
Mehta, D, FC Tropf et al. 2016. Evidence for Genetic Overlap Between Schizophrenia and Age at First Birth in Women. JAMA psychiatry 73(5): 497-505.
Tropf, FC, JJ Mandemakers. 2017. Is the association between education and fertility postponement causal? The role of family background factors, Demography 54(1): 71-91.
Tropf, FC et al. 2018. Hidden heritability due to heterogeneity across seven populations. Nature Human Behaviour.

June 11, 2018

人と一緒に住むということ

最近、周囲から誘われるがまま、面白そうな研究を相互に関連なく研究している気もするのですが、日本における家族を考える際に、「人と一緒に住むということ」に着目すると、それらのつながりも見えてくるのなと思い、ちょっとメモがてら書いてみます。

ことの発端は、先日のRC28で報告した親同居と結婚形成の日韓比較の論文。日本では、結婚前に親と同居することが非常に一般的であることが知られています。社会学者の山田昌弘さんは、こうした親元に留まる若年未婚者層を「パラサイト・シングル」と呼び、高度経済成長を経てかつてよりも親子ともに豊かな生活を享受できる中で、子どもは独立することによって親元で得ていた豊かな暮らしから離れたくないために、未婚化が生じているとしました。

非常にざっくりとまとめると、そういう主張です。実際、最近のコーホートでは、親同居と結婚への移行は負の関連があります。ただし、なぜ親同居が結婚への移行を阻害しているかというと、経験的にはまだ分かっていないことが多いのかな、というのが所感です。

でも、考えてみると、他の先進諸国に比べると、なぜ日本や韓国では結婚前の親元同居が多いのか?に対する説明には、これまでの研究は儒教規範や、文化的な規範みたいな説明をしがちで、少しストレスが溜まっていました。

山田先生の説明だと、なぜ若年未婚者は親元に留まるのかという問いに対して、親のスネをかじりたいからというわけですが(そこまでは言ってないですが)、なぜ西欧諸国に比べて日本では親元同居が多いかの説明はあまりしていなかった気がします。親のスネをかじりたいのは、万国共通な気がするので、その説明は、国ごとの差を説明していません。

私の考えだと、それも結局のところ儒教規範の一つじゃないかと言われそうですが、やはり親側も子どもが留まることに対して、何かしらメリットがあるので、無理に追い出さないんだと思うわけです。典型的には、跡取りということになります。子ども数が減っている現代では、女性でも一人っ子、あるいは女性だけのきょうだいの長女、という人はいるわけで、親としても「何かあった時のために」無理に自立を促進しない動機はあるだろうと考えられます。それが日本で顕著で、(アングロサクソン、北欧、一部大陸ヨーロッパの)西欧で顕著でないとすれば、「何かあった時」のサポートが、国や民間ではなく、家族に期待されている部分が大きいのではないかと思います。

このように考えていくと、単に親と同居していると結婚しにくいだけではなく、親と同居している子どものうち、家系の継承が期待される(つまりケア役割が期待される)子どもの方が、同居の影響は強いかもしれない、と考え始めました。

そう考えているうちに、別の研究プロジェクトで出生動向基本調査を調べる機会があり、結婚と親同居について、もう一つの視点があることに気づきます。それは、結婚相手の親との同居です。

日本では、長男が家を継承することが期待されますが、家庭内におけるケア役割を期待されるのは「長男の嫁」です。したがって、昔は長男と結婚すると相手の実家に嫁ぐことになるので、それを嫌って長男との結婚を避けるような話もありました(現在でも、女性で相手が長男かどうか考えている人はいるかもしれません)。

とはいえ、全ての女性が等しく相手の親との同居を避けようとしているわけでもありません。出生動向基本調査(旧名称:出産力調査)では、第8回(1982年)から第10回(1992年)の間に、独身者に対して「相手親との同居意向」を尋ねていました。質問内容は調査回によってブレがあり、結局第11回調査からはなくなっているので、当時の調査メンバーだった方も、迷いながら入れたのかもしれないなと思います。

この質問をみると、きょうだい構成によって相手親との同居意向は異なってきます。現実的に相手親との同居が問題になるのは、この頃はもっぱら女性だったと考えられるので、女性の結果についてみます。第9回調査では、一人っ子の女性の場合、結婚相手の親との同居をすると答えた人は48.8%で、きょうだいがいる女性(60.8%)に比べると低いです。これに対して、相手親との同居を「したくない」と回答した人の割合は一人っ子では43%、それ以外では32.6%になっています。

第10回調査でも同様の質問をしており、一人っ子の場合に相手親との同居をしたくないと回答した女性は45.1%と前回調査よりも微増。女姉妹だけの長女も4割が同居をしたくない。その場は33%となっており、全体として同居をしたくない人が増えているようにみえます。

その後の調査ではこの質問がなくなってしまったので、現在はどうなっているのか、測りかねますが、1980ー90年代の未婚者に限っても、きょうだいがいない長女は、きょうだいがいる長女や他の女性よりも、相手親との同居をしたくないと考える傾向にあったことは面白いです。これは、裏を返せば男きょうだいがいなければ自分が面倒を見なくてはいけないことを内面化していると考えられます。実際、同調査の結果から男性のきょうだいがいない場合、女性は自分の親との同居を希望する傾向にあります。

このように考えていくと、「パラサイトシングル」の仮説は、どうも個人主義的な子ども像というか、自分の生活水準を下げたくないことを念頭に置いた説明をしているような気がしてきました。実際には、親と同居する子どもは、結婚後も親との同居を考える必要がないわけではなく、さらにそれは男きょうだいがいない女性と、そうでない女性の場合には、大きく異なる可能性があります。親との同居と結婚への移行を考える際に、そうした文脈も考えてみる必要があるなと思った1日でした。

「人と一緒に住むということ」の話はまだ続くのですが、親同居と結婚の話に限って言えば、日本ではケアが家族によって提供されることが期待される傾向が強いために、より「人と一緒に住むこと」がウェルビーイングに関わってくる気がします。更に言えば「誰と」一緒に住むかが非常に重要で、きょうだいなし長女の場合には、長男と結婚して相手親のケアを期待されるのか、親と別居するのか、それとも自分の親の面倒を見るのか、という可能性を考慮する必要が大きいかもしれません。また、「どのように」住むかを考えることも重要で、同居なのか、近居なのかによって、親子関係によって得られるコスト・ベネフィットは異なってくるでしょう。

パラサイトシングルも、長男の嫁も「人と一緒に住むということ」が個人の生活に何をもたらすかという視点では、(少なくとも日本では)同じ土台で議論したほうがよい気がします。

June 4, 2018

統計法の改正と公的統計ミクロデータ利用の動向まとめ

先日、公的統計の利用に関してあるニュースが流れました。

一般研究者もデータ利用OK=改正統計法成立(時事ドットコム)

この記事によると、統計法の改正によって、従来は公的機関やその委託を受けた研究者に利用が限定されてきた公的統計について、「大学などの一般の研究者」も使えるようになるということです。

この報道を受けて、一部の研究者から「個票がオープン」になるような理解が見られました。あるいは、そもそも個票(調査票情報)と匿名データを混同している場合もあり、上述のストレート・ニュースからは多少の誤解も見られたものと考えられます。

こうした誤解に対して、従来から公的統計の個票を利用してきた研究者からすれば、「今までも個票を使った分析はできた」と反応したくなるかもしれません。もっとも、統計法が改正されて、そのことによって従来よりも公的統計へのアクセシビリティが増すことはわかるのですが、それが具体的に何を指すのか、件のニュースからはよくわかりません。

ネットでググれば、この改正法が意味するところを理解することができます。例えば、「統計法及び独立行政法人統計センター法の一部を改正する法律案要綱」をみると、後述の統計法第33条の規定により調査票情報を提供されたものに加えて、「相当の公益性を有する」場合についても、調査票情報を提供できると書かれています。あるいは、「調査票情報などの利用、提供などに関する法制研究会」が提出した「調査票情報などの利用、提供などに関する統計法の改正」では、詳細に上記の「相当の公益性」と第33条の「同等の公益性」の違いについて言及しています。私自身、当初は相当の公益性同等の公益性を誤解していました。

ここまでくると、改正法によって何ができるようになりそうか、分かる研究者にはわかってくるように思います。しかし、公的統計の個票利用が無理だと諦めていたような方には、そもそも「同等の公益性」が何かがわからないと思いますし、どういった経路でミクロデータの利用ができるようになるのか、わからないのではないでしょうか。

先日、雑誌「統計」の最新号が届き、そちらで公的統計の整備に関する基本的な計画(以下、基本計画と省略)の改定に関する特集が組まれていたこともあり、一念発起して、なるべく簡潔に、公的統計のミクロデータ利用に関する動向をまとめたいと思います。

1.はじめに:公的統計とは何か?

本題に入る前に「公的統計」の定義について確認します。「公的統計」とは国勢調査や家計調査といった、国が行う統計のことを指すのではないか。間違っていません。厳密には、統計法を参照すると「行政機関、地方公共団体又は独立行政法人等(以下「行政機関等」という。)が作成する統計をいう」とあります。要するに、国以外の行政機関による統計も、統計法では「公的統計」と定義されています。国勢調査など、国の政策の根幹に関わる調査は別途「基幹統計」に指定されています。

2.どうやって公的統計のミクロデータを利用できるのか?

さて、みなさんは(社会科学系の研究者であれば)一度は公的統計の個票が手に入れば...!と思ったことはあるのではないでしょうか。国勢調査を使えば、母集団それ自体を扱っているので、統計的な検定は必要ありません。他の調査も、サンプルサイズが巨大なので、非常に細かい分析ができます。企業データなど、そもそも公的調査でしか聞かれていないような項目もあるでしょう。

集計表についてはeStatが利用できることは広く知られていると思いますが、ミクロデータについては意外と知られていないかもしれません。もしかすると「匿名データ」や「オーダーメイド集計」という言葉を聞いたことがある人はいるかもしれませんが、それが個票と何が違うのかは、説明が難しいかもしれません。実際、公的統計のミクロデータの提供自体が平成19年の統計法制定後、2009年4月からの全面施行以降に始まったことなので、まだまだ認知度が低いのが実情でしょう。

国の公的統計の利用方法は、行政機関にいたり、行政機関から委託を受けていない一般の研究者については、主に3つあると理解してよいだろうと思います。

1. 匿名データ(統計法第36条)
2. オーダーメイド集計(統計法第34条)
3. 個票利用(統計法第33条)

2.1 匿名データの利用
順に見ていきましょう。まず、匿名データとオーダーメイド集計は、かつては総務省の機関で、現在は独立行政法人である「統計センター」に総務省から委託されています。

「匿名データ」とは、その名の通り、調査票から得られたローデータを匿名化処理したものです。具体的には、匿名データは個人の特定を防ぐための目的から、例えば変数がトップ(ボトム)コーディングされていたり、リコーディングによって年齢が階級値になってたりします。調査票にはある項目がなかったりもします。

「匿名データ」の利用方法には、学術研究目的教育目的の二つがあります(根拠:匿名データの作成・提供に係るガイドライン)。

学術研究目的の利用は文字通り研究に資する目的のためにデータを利用する場合の申請方法です。大学などの研究機関に在籍している研究者であれば問題ありませんし、大学院生が自身で申請することも可能です(学部生は不明)。具体的には、「提供依頼申出書」に申請理由(研究の必要性)や所属、研究計画を記入します。教育目的の場合には、演習などを実施する教員が申請します。申請には授業の目的や利用する学生の氏名などを記入します。教育利用では、川口大司先生が一橋大学に在籍されていた時に演習で使用されていたようです。私も、現在大学院の演習で匿名データを利用させてもらっています。

初めて利用する場合、本人確認のため受付窓口に訪れる必要がありますが、2回目以降は申請は郵送で可能になります。データの提供も郵送が可能です。詳細については、統計センターの利用手引きを参照ください。なお、データの取得に際して、基本料金1850円に提供ファイル数ごとに8500円が必要になります(追加で、格納する媒体の費用と書き留め料金)。

匿名データは、大学院生も申請可能ということで、公的統計へのアクセスの中でも比較的ハードルが低いと考えられますが、個人的には以下の二つが懸念事項として考えられます。1点目は、提供されているデータの種類が少ないことです。統計センターは総務省の機関だったからか、基本的に利用可能なデータは国勢調査や労働力調査といった総務省所管のデータです。そのため、例えば経済産業省が実施しているデータは利用できません。また、同じ調査でも提供年に制限があります。

2点目は、海外にいる場合には利用が難しいことです。「難しい」というのは、理論上海外で利用することはできるのですが、その条件が常識的に考えて難しいということです(詳細は利用手引きの「利用場所が日本国外の場合の提供要件」を参照ください」。あるいは、厚労省のページにもQ&Aに同様の事項が記載されています。

2.2 オーダーメイド集計の利用
匿名データは、研究者が通常分析するような(それでもDK/NAなどに対してかなり謎な値が振られていますが)、行列でできたcsvファイルの形で提供されますが、オーダーメイド集計では、あらかじめ申請者が仕様書に求める集計表を書いて提出することになります。イメージとしては、おそらくeStatにあるような、表頭・表側に加えてたくさんの「欄外」を作る感じなのでしょうか。詳細は統計センターのガイドを参照してください。匿名データよりも、利用可能なデータにバリエーションがあるようですが、デメリットとしては、手数料が作成時間1時間あたりにつき5900円かかるようで、費用の高さが指摘されているようです。

2.3 個票の利用
最後の方法は、いわゆる「33条申請」というものです。個票利用の最大のメリットは、匿名データなどで利用できないデータでもアクセス可能な点にあるでしょう。ただし、条件として「公的機関との共同研究や公的機関からの公募の方法による補助を受けて行う研究」である必要があります。

この点について統計法では、33条において以下のように規定しています。

行政機関の長又は届出独立行政法人等は、次の各号に掲げる者が当該各号に定める行為を行う場合には、その行った統計調査に係る調査票情報を、これらの者に提供することができる。

さらに、33条2号において以下のように規定しています。

前号に掲げる者(=行政機関等その他これに準ずる者)が行う統計の作成等と同等の公益性を有する統計の作成等として総務省令で定めるものを行う者 当該総務省令で定める統計の作成等

行政機関やこれに準ずる者と「同等の公益性」を持つとは、どのような意味でしょうか。統計法第33条の運用に関するガイドラインには、以下のようにあります。

公的機関から委託を受けた調査研究の一環としての調査票情報の利用又は公的機関と共同して行う調査研究の一環としての調査票情報の利用を行う場合(法第33条第2号に基づく施行規則第9条第1号に該当する申出)、公的機関からの公募による方法での補助を受けて行う調査研究(例:文部科学省科学研究費補助金、厚生労働科学研究費補助金)等の一環として調査票情報の利用を行う場合(法第33条第3号に基づく施行規則第9条第3号に該当する申出)には、その委託、共同研究若しくは補助の関係を示す文書の写し及び調査研究等の概要に関する資料(が必要)

大学院生を含めた「一般の研究者」であれば、太字にした科研費を用いた調査研究が一番ルートとしては容易だろうと考えられます。理論上、科研費はDCやPDなどの日本学術振興会特別研究員奨励費にも該当するでしょう(実際の運用は分かりません)。公的統計の個票を利用して分析している多くの研究者は、33条申請をしている印象です。大学院生が申請する場合には、例えば審査の際に「博論にする」という(あまり公益性と関係のない)事項を書かずに、成果報告について具体的に書くなどのコツが必要になるかもしれませんが、私自身、33条申請はしたことがないので、経験がある方がいましたら教えてください。

調査票情報の提供に関する案内窓口は各省ごとに異なります。総務省のページ(調査票情報の提供についての案内窓口)に、関係機関の窓口がエクセルで一覧になっています。こういう窓口も、統計センターのように統合してくれるとありがたいのですが。

3. 統計法改正によって何が変わったのか?

ようやく本題です。冒頭で述べましたが、ここまで述べてきた公的統計のミクロデータ利用の展開については、平成19年制定の統計法の施行が法的な根拠となっています。この平成19年統計法自体、昭和22年に成立した旧統計法が60年ぶりに改正されたもので、変更内容は抜本的なものだったようです。

3.1 統計法改正までの経緯
今回の統計法改正に際して、最新号の「統計」で特集された「公的統計の整備に関する基本的な計画」(基本計画)が関連してきますので、こちらについて確認します。「基本計画」とは、公的統計の整備のために5年ごとに策定されるもので、平成19年統計法第4条に規定されています。計画主体は政府ですが、総務大臣は総務省の下に設置された有識者からなる統計委員会の意見を聴いて、基本計画の案を作成する必要があります。最終的に計画は閣議決定を経て、実行に移されるようです(余談ですが、その統計委員会の委員に指導教員がいて驚きました)

平成19年から始まった制度のため、現在は第II期基本計画(平成26〜30年度)の中にあることになっています。しかし、平成27年10月の経済財政諮問会議において基礎統計の充実の必要性が提起され、これを契機として平成28年12月の経済財政諮問会議において決定された「統計改革の基本方針」にしたがって、第III期計画は1年前倒しして策定されました(したがって、期間は平成30年〜34年)。

この第III期計画でも5つの基本的な視点として提示されている方針の中に「ユーザー視点に立った統計データ等の利活用促進」が示されていますが、今回の統計法改正に直接関連するものとして、平成29年に内閣官房に設置された「統計改革推進会議」において5月にまとめられた「最終取りまとめ」がより重要であると考えられます。「最終取りまとめ」の内容は統計委員会での審議にも反映されているようですが、「取りまとめ」では「各種データの利活用推進のための統計関係法制の見直し」が提言されており、この結果を受けて、2017年9月より総務省が「調査票情報等の利用、提供等に関する法制研究会」を設置、開催します。

この法制研究会が今年の4月に取りまとめた報告書が先に引用した「調査票情報等の利用、提供等に関する統計法の改正について」です。この審議の結果を踏まえた上で、2018年3月6日に「統計法及び独立行政法人統計センター法の一部を改正する法律案」が提出され5月25日に参議院本会議において可決された、ということです。

3.2 主たる改正内容
さて、何が変わったのでしょうか。まず、ここでの主題であるミクロデータ利用について、可決された法律案と現行法の33条を比較してみましょう。

現行法(平成19年)

(調査票情報の提供)
第三十三条 行政機関の長又は届出独立行政法人等は、次の各号に掲げる者が当該各号に定める行為を行う場合には、その行った統計調査に係る調査票情報を、これらの者に提供することができる。
  一 行政機関等その他これに準ずる者として総務省令で定める者 統計の作成等又は統計を作成するための調査に係る名簿の作成
  二 前号に掲げる者が行う統計の作成等と同等の公益性を有する統計の作成等として総務省令で定めるものを行う者 当該総務省令で定める統計の作成等

改正法(平成30年)
(調査票情報の提供)
第三十三条 行政機関の長又は指定独立行政法人等は、次の各号に掲げる者が当該各号に定める行為を行う場合には総務省令で定めるところにより、これらの者からの求めに応じ、その行った統計調査に係る調査票情報をこれらの者に提供することができる。
  一 行政機関等その他これに準ずる者として総務省令で定める者統計の作成等又は統計調査その他の統計を作成するための調査に係る名簿の作成
  二 前号に掲げる者が行う統計の作成等と同等の公益性を有する統計の作成等として総務省令で定めるものを行う者 当該総務省令で定める統計の作成等

2 行政機関の長又は指定独立行政法人等は、前項(第一号を除く。以下この項及び次項において同じ。)の規定により調査票情報を提供したときは、総務省令で定めるところにより、次に掲げる事項をインターネットの利用その他の適切な方法により公表しなければならない。
  一 前項の規定により調査票情報の提供を受けた者の氏名又は名称
  二 前項の規定により提供した調査票情報に係る統計調査の名称
  三 前二号に掲げるもののほか、総務省令で定める事項

3 第一項の規定により調査票情報の提供を受けた者は、当該調査票情報を利用して統計の作成等を行ったときは、総務省令で定めるところにより、遅滞なく、作成した統計又は行った統計的研究の成果を当該調査票情報を提供した行政機関の長又は指定独立行政法人等に提出しなければならない。

4 行政機関の長又は指定独立行政法人等は、前項の規定により統計又は統計的研究の成果が提出されたときは、総務省令で定めるところにより、次に掲げる事項をインターネットの利用その他の適切な方法により公表するものとする。
  一 第二項第一号及び第二号に掲げる事項
  二 前項の規定により提出された統計若しくは統計的研究の成果又はその概要
  三 前二号に掲げるもののほか、総務省令で定める事項

三十三条の二 行政機関の長又は指定独立行政法人等は、前条第一項に定めるもののほか、総務省令で定めるところにより、一般からの求めに応じ、その行った統計調査に係る調査票情報を学術研究の発展に資する統計の作成等その他の行政機関の長又は指定独立行政法人等が行った統計調査に係る調査票情報の提供を受けて行うことについて相当の公益性を有する統計の作成等として総務省令で定めるものを行う者に提供することができる。

2 前条第二項及び第四項の規定は前項の規定により調査票情報を提供した行政機関の長又は指定独立行政法人等について、同条第三項の規定は前項の規定により調査票情報の提供を受けた者について、それぞれ準用する。この場合において、同条第二項中「前項(第一号を除く。以下この項及び次項において同じ。)」とあり、同項第一号及び第二号中「前項」とあり、並びに同条第三項中「第一項」とあるのは、「次条第一項」と読み替えるものとする。

(変更部分は下線)

改正法と現行法を比べると、だいぶ条項が追加された感があります。重要なのは、これまでの33条申請に関しては、新たに総務省は調査票情報を提供した者の氏名や使用したデータを公表する義務があること、及び利用者は成果を提出することが義務づけられたことでしょう。及び、新たな申請枠については33条の2で規定されているように、はじめに述べた「相当の公益性」があれば、調査票情報の提供ができる旨が書かれています。

ここでいう「相当の公益性」については、先に言及した法制研究会の報告書で以下のように定義されています。

「相当の公益性」における「相当の」とは、法令用語辞典によれば、不確定多義概念の一種で、社会通念上、客観的にみて合理的ないしふさわしいという意味を持つものとされており、「相当の公益性」を有する統計の作成などの具体的内容は、二次的利用の種類(調査票情報の提供か、オーダーメード集計または匿名データの提供か)により異なる。

二次的利用の種類によって異なるということですが、例えば匿名データに関して規定している統計法36条も33条と同様に改正されており、「学術研究の発展に資する統計の作成等その他の匿名データの提供を受けて行うことについて相当の公益性を有する統計の作成等として総務省令で定めるものを行う者に」提供するとされています。また、同報告書では「相当」の公益の程度は「統計の作成などを行うことについて国民の統計調査に対する信頼が損なわれない」あたりらしく、「同等の公益性」より低いとされているため、おそらく、科研費を持っていなくても、今後は個票の利用が可能になるのかもしれません。雑誌「統計」の中で、伊藤伸介先生は「このような「公益性」を担保するための匿名化措置が、今後総務省令やガイドラインなどで具体的に定められると考えられる」(p.17)としています。

なお、改正法では言及されていないようですが、第III期計画では将来的に調査票情報の提供はセキュリティ面を考慮してオンサイト利用の拡充に言及しています。現在、オンサイト利用(=統計センターと連携する研究期間の施設でのデータ利用)が可能なのは一橋大学など一部に限られていますが、今後は利用施設の全国展開が進められるようです。将来的に、現在のように利用場所にある程度の柔軟性があるシステムから、オンサイト利用に比重が移っていく可能性はあるかもしれません。

4 まとめ

ここまで、統計法の改正と、ミクロデータ利用の動向についてみてきました。最後にまとめるとすれば、改正によって「相当の公益性」条件が追加されたことで、今後、個票利用の可能性が広がることには違いないと考えられます。ただし、具体的にどのあたりに線が引かれるかについては、今後の各省のガイドラインによるため、見通せない部分も大きいです。今後、オンサイト利用が展開されることも踏まえると、現在のように科研費があれば比較的柔軟に個票を使った分析ができるというのは、過渡期的な現象なのかもしれません。そう考えると、最初に述べたような「個票がオープンになる」状況とは、いささか違ってきそうです。いずれにしても、今後も公的統計の利用促進の展開に注目していく必要があるでしょう。

第70回日本人口学会

浦安市の明海大学にて開催された日本人口学会に参加、及び報告をしてきました。

一応、日本でする(当分は)最後の学会報告だったので、少し感慨深くなるのかと思ったのですが、終わった後も対して気持ちに浸ることもなく。初日の朝一の報告だったので、そのあとは色々と報告を聞いて回りました。ちょっと並行部会が多すぎる傾向にあるような感じがしました。結果的に、一つのセッションにとどまるというよりは、聞きたい報告のために移動したり、部屋を移ったと思ったら時間配分が違っていて目当ての報告が聞けなかったり、なかなか難しいところです。人口学会の規模的には、並行部会は3つくらいでいいような気がします。

気になった報告はいくつもありますが、一つだけここで紹介します。

それは、国勢調査の不詳に関するセッションで丸山洋平先生がされた住宅所有関係の不詳の問題に関するものです(アブストはこちら)。

国勢調査はプライバシー意識の高まりなどを受けて、2005年以前は調査員が回収時に確認していた方式から、2010年からは確認せずに提出する封入方式に変わったほか、2010年からは対象者が希望すれば郵送による送付が可能になりました。さらに、2010年からオンラインによる調査が実施されています。これに伴い、職業や学歴、5年前の居住地などに不詳割合が増加しています(ただし、オンライン調査の回答者において不詳割合が高いわけではないと思います)。

その中で、住宅関係の項目については、不詳割合が低いです。具体的には、2010年の国勢調査では、世帯主の年齢の不詳数が825,699件だったのに対し、住宅所有関係(借家なのか持ち家なのか)が21件、住宅の建て方(一戸建てなのか集合住宅なのかetc)が3323件。2015年国勢調査では、世帯主年齢の不詳はさらに増え1,177,617件だったのに対して、住宅所有関係は380件、建て方にいたっては0件になっています。

さすがに不詳が0件というのはおかしいのではないか、と思うわけです。この謎を解く鍵として丸山先生が指摘されたのが、国勢調査における「補記制度」です。この制度に入る前に、国勢調査では、以下のような文言が定められており、従来から世帯員以外から調査項目を確かめることが可能になっています。

世帯員の不在等の事由により前項に規定する方法による調査を行うことができないときは、国勢調査員等が 同項の期間内において第五条第一項第一号イ(世帯員の使命)及びロ(世帯員の男女の別)並びに同項第二号ロ(世帯員の数)に掲げる事項を当該世帯の世帯員以外 の者に質問し、これに基づいて調査票に記入することにより国勢調査を行うことができる。

具体的には、お隣さんや大家さんに、調査対象者の名前や性別を聞くことはできたということですね。

さらに、平成22年からは先にあげた「補記制度」が始まっています。

(3) 行政情報の活用及び関係者への質問
調査書類の審査においては,調査票に記入不備等があった場合に世帯に対する照会を行うほか,市区町村においては,必要に応じて行政情報等の利用マンション関係者等への質問による調査票の記入不備の補記を行います。
(平成22年国勢調査実施計画)
http://www.stat.go.jp/data/kokusei/2010/keikaku/pdf/sy02.pdf

行政情報というのは、具体的には住民基本台帳などを使って、調査票を補記訂正することを指しますが、住宅関係の情報は行政情報にはありません。したがって、後者の「マンション関係者への質問」などによって、不詳の情報を埋めることができるようです。

丸山先生のご報告では、「住宅選好指数」という指標を作成し、所有関係の標準化を行い、東京都特別行政区の一部(新宿区や豊島区)で不自然な時系列変化が起きていることを指摘しています。この結果から、補記制度を使って、調査担当者が住宅の建て方を判断し(建物の形状は見た目でおおよそわかる)、そこから住宅所有関係(一戸建てであれば持ち家、マンションであれば民営借家など)を推測しているのではないかという可能性を提起されています。

ただし、実際には同じマンションでも貸家の場合もあれば分譲の場合もあるため、見た目だけからは所有関係を類推することは難しいでしょう。もし、丸山先生が指摘されているように、補記制度によって、住宅関係項目の不詳が類推によって埋められているとすれば、確定値の精度自体にも疑義が呈されることになり、非常に重要かつ論争的な報告だと思いました。