June 4, 2018

統計法の改正と公的統計ミクロデータ利用の動向まとめ

先日、公的統計の利用に関してあるニュースが流れました。

一般研究者もデータ利用OK=改正統計法成立(時事ドットコム)

この記事によると、統計法の改正によって、従来は公的機関やその委託を受けた研究者に利用が限定されてきた公的統計について、「大学などの一般の研究者」も使えるようになるということです。

この報道を受けて、一部の研究者から「個票がオープン」になるような理解が見られました。あるいは、そもそも個票(調査票情報)と匿名データを混同している場合もあり、上述のストレート・ニュースからは多少の誤解も見られたものと考えられます。

こうした誤解に対して、従来から公的統計の個票を利用してきた研究者からすれば、「今までも個票を使った分析はできた」と反応したくなるかもしれません。もっとも、統計法が改正されて、そのことによって従来よりも公的統計へのアクセシビリティが増すことはわかるのですが、それが具体的に何を指すのか、件のニュースからはよくわかりません。

ネットでググれば、この改正法が意味するところを理解することができます。例えば、「統計法及び独立行政法人統計センター法の一部を改正する法律案要綱」をみると、後述の統計法第33条の規定により調査票情報を提供されたものに加えて、「相当の公益性を有する」場合についても、調査票情報を提供できると書かれています。あるいは、「調査票情報などの利用、提供などに関する法制研究会」が提出した「調査票情報などの利用、提供などに関する統計法の改正」では、詳細に上記の「相当の公益性」と第33条の「同等の公益性」の違いについて言及しています。私自身、当初は相当の公益性同等の公益性を誤解していました。

ここまでくると、改正法によって何ができるようになりそうか、分かる研究者にはわかってくるように思います。しかし、公的統計の個票利用が無理だと諦めていたような方には、そもそも「同等の公益性」が何かがわからないと思いますし、どういった経路でミクロデータの利用ができるようになるのか、わからないのではないでしょうか。

先日、雑誌「統計」の最新号が届き、そちらで公的統計の整備に関する基本的な計画(以下、基本計画と省略)の改定に関する特集が組まれていたこともあり、一念発起して、なるべく簡潔に、公的統計のミクロデータ利用に関する動向をまとめたいと思います。

1.はじめに:公的統計とは何か?

本題に入る前に「公的統計」の定義について確認します。「公的統計」とは国勢調査や家計調査といった、国が行う統計のことを指すのではないか。間違っていません。厳密には、統計法を参照すると「行政機関、地方公共団体又は独立行政法人等(以下「行政機関等」という。)が作成する統計をいう」とあります。要するに、国以外の行政機関による統計も、統計法では「公的統計」と定義されています。国勢調査など、国の政策の根幹に関わる調査は別途「基幹統計」に指定されています。

2.どうやって公的統計のミクロデータを利用できるのか?

さて、みなさんは(社会科学系の研究者であれば)一度は公的統計の個票が手に入れば...!と思ったことはあるのではないでしょうか。国勢調査を使えば、母集団それ自体を扱っているので、統計的な検定は必要ありません。他の調査も、サンプルサイズが巨大なので、非常に細かい分析ができます。企業データなど、そもそも公的調査でしか聞かれていないような項目もあるでしょう。

集計表についてはeStatが利用できることは広く知られていると思いますが、ミクロデータについては意外と知られていないかもしれません。もしかすると「匿名データ」や「オーダーメイド集計」という言葉を聞いたことがある人はいるかもしれませんが、それが個票と何が違うのかは、説明が難しいかもしれません。実際、公的統計のミクロデータの提供自体が平成19年の統計法制定後、2009年4月からの全面施行以降に始まったことなので、まだまだ認知度が低いのが実情でしょう。

国の公的統計の利用方法は、行政機関にいたり、行政機関から委託を受けていない一般の研究者については、主に3つあると理解してよいだろうと思います。

1. 匿名データ(統計法第36条)
2. オーダーメイド集計(統計法第34条)
3. 個票利用(統計法第33条)

2.1 匿名データの利用
順に見ていきましょう。まず、匿名データとオーダーメイド集計は、かつては総務省の機関で、現在は独立行政法人である「統計センター」に総務省から委託されています。

「匿名データ」とは、その名の通り、調査票から得られたローデータを匿名化処理したものです。具体的には、匿名データは個人の特定を防ぐための目的から、例えば変数がトップ(ボトム)コーディングされていたり、リコーディングによって年齢が階級値になってたりします。調査票にはある項目がなかったりもします。

「匿名データ」の利用方法には、学術研究目的教育目的の二つがあります(根拠:匿名データの作成・提供に係るガイドライン)。

学術研究目的の利用は文字通り研究に資する目的のためにデータを利用する場合の申請方法です。大学などの研究機関に在籍している研究者であれば問題ありませんし、大学院生が自身で申請することも可能です(学部生は不明)。具体的には、「提供依頼申出書」に申請理由(研究の必要性)や所属、研究計画を記入します。教育目的の場合には、演習などを実施する教員が申請します。申請には授業の目的や利用する学生の氏名などを記入します。教育利用では、川口大司先生が一橋大学に在籍されていた時に演習で使用されていたようです。私も、現在大学院の演習で匿名データを利用させてもらっています。

初めて利用する場合、本人確認のため受付窓口に訪れる必要がありますが、2回目以降は申請は郵送で可能になります。データの提供も郵送が可能です。詳細については、統計センターの利用手引きを参照ください。なお、データの取得に際して、基本料金1850円に提供ファイル数ごとに8500円が必要になります(追加で、格納する媒体の費用と書き留め料金)。

匿名データは、大学院生も申請可能ということで、公的統計へのアクセスの中でも比較的ハードルが低いと考えられますが、個人的には以下の二つが懸念事項として考えられます。1点目は、提供されているデータの種類が少ないことです。統計センターは総務省の機関だったからか、基本的に利用可能なデータは国勢調査や労働力調査といった総務省所管のデータです。そのため、例えば経済産業省が実施しているデータは利用できません。また、同じ調査でも提供年に制限があります。

2点目は、海外にいる場合には利用が難しいことです。「難しい」というのは、理論上海外で利用することはできるのですが、その条件が常識的に考えて難しいということです(詳細は利用手引きの「利用場所が日本国外の場合の提供要件」を参照ください」。あるいは、厚労省のページにもQ&Aに同様の事項が記載されています。

2.2 オーダーメイド集計の利用
匿名データは、研究者が通常分析するような(それでもDK/NAなどに対してかなり謎な値が振られていますが)、行列でできたcsvファイルの形で提供されますが、オーダーメイド集計では、あらかじめ申請者が仕様書に求める集計表を書いて提出することになります。イメージとしては、おそらくeStatにあるような、表頭・表側に加えてたくさんの「欄外」を作る感じなのでしょうか。詳細は統計センターのガイドを参照してください。匿名データよりも、利用可能なデータにバリエーションがあるようですが、デメリットとしては、手数料が作成時間1時間あたりにつき5900円かかるようで、費用の高さが指摘されているようです。

2.3 個票の利用
最後の方法は、いわゆる「33条申請」というものです。個票利用の最大のメリットは、匿名データなどで利用できないデータでもアクセス可能な点にあるでしょう。ただし、条件として「公的機関との共同研究や公的機関からの公募の方法による補助を受けて行う研究」である必要があります。

この点について統計法では、33条において以下のように規定しています。

行政機関の長又は届出独立行政法人等は、次の各号に掲げる者が当該各号に定める行為を行う場合には、その行った統計調査に係る調査票情報を、これらの者に提供することができる。

さらに、33条2号において以下のように規定しています。

前号に掲げる者(=行政機関等その他これに準ずる者)が行う統計の作成等と同等の公益性を有する統計の作成等として総務省令で定めるものを行う者 当該総務省令で定める統計の作成等

行政機関やこれに準ずる者と「同等の公益性」を持つとは、どのような意味でしょうか。統計法第33条の運用に関するガイドラインには、以下のようにあります。

公的機関から委託を受けた調査研究の一環としての調査票情報の利用又は公的機関と共同して行う調査研究の一環としての調査票情報の利用を行う場合(法第33条第2号に基づく施行規則第9条第1号に該当する申出)、公的機関からの公募による方法での補助を受けて行う調査研究(例:文部科学省科学研究費補助金、厚生労働科学研究費補助金)等の一環として調査票情報の利用を行う場合(法第33条第3号に基づく施行規則第9条第3号に該当する申出)には、その委託、共同研究若しくは補助の関係を示す文書の写し及び調査研究等の概要に関する資料(が必要)

大学院生を含めた「一般の研究者」であれば、太字にした科研費を用いた調査研究が一番ルートとしては容易だろうと考えられます。理論上、科研費はDCやPDなどの日本学術振興会特別研究員奨励費にも該当するでしょう(実際の運用は分かりません)。公的統計の個票を利用して分析している多くの研究者は、33条申請をしている印象です。大学院生が申請する場合には、例えば審査の際に「博論にする」という(あまり公益性と関係のない)事項を書かずに、成果報告について具体的に書くなどのコツが必要になるかもしれませんが、私自身、33条申請はしたことがないので、経験がある方がいましたら教えてください。

調査票情報の提供に関する案内窓口は各省ごとに異なります。総務省のページ(調査票情報の提供についての案内窓口)に、関係機関の窓口がエクセルで一覧になっています。こういう窓口も、統計センターのように統合してくれるとありがたいのですが。

3. 統計法改正によって何が変わったのか?

ようやく本題です。冒頭で述べましたが、ここまで述べてきた公的統計のミクロデータ利用の展開については、平成19年制定の統計法の施行が法的な根拠となっています。この平成19年統計法自体、昭和22年に成立した旧統計法が60年ぶりに改正されたもので、変更内容は抜本的なものだったようです。

3.1 統計法改正までの経緯
今回の統計法改正に際して、最新号の「統計」で特集された「公的統計の整備に関する基本的な計画」(基本計画)が関連してきますので、こちらについて確認します。「基本計画」とは、公的統計の整備のために5年ごとに策定されるもので、平成19年統計法第4条に規定されています。計画主体は政府ですが、総務大臣は総務省の下に設置された有識者からなる統計委員会の意見を聴いて、基本計画の案を作成する必要があります。最終的に計画は閣議決定を経て、実行に移されるようです(余談ですが、その統計委員会の委員に指導教員がいて驚きました)

平成19年から始まった制度のため、現在は第II期基本計画(平成26〜30年度)の中にあることになっています。しかし、平成27年10月の経済財政諮問会議において基礎統計の充実の必要性が提起され、これを契機として平成28年12月の経済財政諮問会議において決定された「統計改革の基本方針」にしたがって、第III期計画は1年前倒しして策定されました(したがって、期間は平成30年〜34年)。

この第III期計画でも5つの基本的な視点として提示されている方針の中に「ユーザー視点に立った統計データ等の利活用促進」が示されていますが、今回の統計法改正に直接関連するものとして、平成29年に内閣官房に設置された「統計改革推進会議」において5月にまとめられた「最終取りまとめ」がより重要であると考えられます。「最終取りまとめ」の内容は統計委員会での審議にも反映されているようですが、「取りまとめ」では「各種データの利活用推進のための統計関係法制の見直し」が提言されており、この結果を受けて、2017年9月より総務省が「調査票情報等の利用、提供等に関する法制研究会」を設置、開催します。

この法制研究会が今年の4月に取りまとめた報告書が先に引用した「調査票情報等の利用、提供等に関する統計法の改正について」です。この審議の結果を踏まえた上で、2018年3月6日に「統計法及び独立行政法人統計センター法の一部を改正する法律案」が提出され5月25日に参議院本会議において可決された、ということです。

3.2 主たる改正内容
さて、何が変わったのでしょうか。まず、ここでの主題であるミクロデータ利用について、可決された法律案と現行法の33条を比較してみましょう。

現行法(平成19年)

(調査票情報の提供)
第三十三条 行政機関の長又は届出独立行政法人等は、次の各号に掲げる者が当該各号に定める行為を行う場合には、その行った統計調査に係る調査票情報を、これらの者に提供することができる。
  一 行政機関等その他これに準ずる者として総務省令で定める者 統計の作成等又は統計を作成するための調査に係る名簿の作成
  二 前号に掲げる者が行う統計の作成等と同等の公益性を有する統計の作成等として総務省令で定めるものを行う者 当該総務省令で定める統計の作成等

改正法(平成30年)
(調査票情報の提供)
第三十三条 行政機関の長又は指定独立行政法人等は、次の各号に掲げる者が当該各号に定める行為を行う場合には総務省令で定めるところにより、これらの者からの求めに応じ、その行った統計調査に係る調査票情報をこれらの者に提供することができる。
  一 行政機関等その他これに準ずる者として総務省令で定める者統計の作成等又は統計調査その他の統計を作成するための調査に係る名簿の作成
  二 前号に掲げる者が行う統計の作成等と同等の公益性を有する統計の作成等として総務省令で定めるものを行う者 当該総務省令で定める統計の作成等

2 行政機関の長又は指定独立行政法人等は、前項(第一号を除く。以下この項及び次項において同じ。)の規定により調査票情報を提供したときは、総務省令で定めるところにより、次に掲げる事項をインターネットの利用その他の適切な方法により公表しなければならない。
  一 前項の規定により調査票情報の提供を受けた者の氏名又は名称
  二 前項の規定により提供した調査票情報に係る統計調査の名称
  三 前二号に掲げるもののほか、総務省令で定める事項

3 第一項の規定により調査票情報の提供を受けた者は、当該調査票情報を利用して統計の作成等を行ったときは、総務省令で定めるところにより、遅滞なく、作成した統計又は行った統計的研究の成果を当該調査票情報を提供した行政機関の長又は指定独立行政法人等に提出しなければならない。

4 行政機関の長又は指定独立行政法人等は、前項の規定により統計又は統計的研究の成果が提出されたときは、総務省令で定めるところにより、次に掲げる事項をインターネットの利用その他の適切な方法により公表するものとする。
  一 第二項第一号及び第二号に掲げる事項
  二 前項の規定により提出された統計若しくは統計的研究の成果又はその概要
  三 前二号に掲げるもののほか、総務省令で定める事項

三十三条の二 行政機関の長又は指定独立行政法人等は、前条第一項に定めるもののほか、総務省令で定めるところにより、一般からの求めに応じ、その行った統計調査に係る調査票情報を学術研究の発展に資する統計の作成等その他の行政機関の長又は指定独立行政法人等が行った統計調査に係る調査票情報の提供を受けて行うことについて相当の公益性を有する統計の作成等として総務省令で定めるものを行う者に提供することができる。

2 前条第二項及び第四項の規定は前項の規定により調査票情報を提供した行政機関の長又は指定独立行政法人等について、同条第三項の規定は前項の規定により調査票情報の提供を受けた者について、それぞれ準用する。この場合において、同条第二項中「前項(第一号を除く。以下この項及び次項において同じ。)」とあり、同項第一号及び第二号中「前項」とあり、並びに同条第三項中「第一項」とあるのは、「次条第一項」と読み替えるものとする。

(変更部分は下線)

改正法と現行法を比べると、だいぶ条項が追加された感があります。重要なのは、これまでの33条申請に関しては、新たに総務省は調査票情報を提供した者の氏名や使用したデータを公表する義務があること、及び利用者は成果を提出することが義務づけられたことでしょう。及び、新たな申請枠については33条の2で規定されているように、はじめに述べた「相当の公益性」があれば、調査票情報の提供ができる旨が書かれています。

ここでいう「相当の公益性」については、先に言及した法制研究会の報告書で以下のように定義されています。

「相当の公益性」における「相当の」とは、法令用語辞典によれば、不確定多義概念の一種で、社会通念上、客観的にみて合理的ないしふさわしいという意味を持つものとされており、「相当の公益性」を有する統計の作成などの具体的内容は、二次的利用の種類(調査票情報の提供か、オーダーメード集計または匿名データの提供か)により異なる。

二次的利用の種類によって異なるということですが、例えば匿名データに関して規定している統計法36条も33条と同様に改正されており、「学術研究の発展に資する統計の作成等その他の匿名データの提供を受けて行うことについて相当の公益性を有する統計の作成等として総務省令で定めるものを行う者に」提供するとされています。また、同報告書では「相当」の公益の程度は「統計の作成などを行うことについて国民の統計調査に対する信頼が損なわれない」あたりらしく、「同等の公益性」より低いとされているため、おそらく、科研費を持っていなくても、今後は個票の利用が可能になるのかもしれません。雑誌「統計」の中で、伊藤伸介先生は「このような「公益性」を担保するための匿名化措置が、今後総務省令やガイドラインなどで具体的に定められると考えられる」(p.17)としています。

なお、改正法では言及されていないようですが、第III期計画では将来的に調査票情報の提供はセキュリティ面を考慮してオンサイト利用の拡充に言及しています。現在、オンサイト利用(=統計センターと連携する研究期間の施設でのデータ利用)が可能なのは一橋大学など一部に限られていますが、今後は利用施設の全国展開が進められるようです。将来的に、現在のように利用場所にある程度の柔軟性があるシステムから、オンサイト利用に比重が移っていく可能性はあるかもしれません。

4 まとめ

ここまで、統計法の改正と、ミクロデータ利用の動向についてみてきました。最後にまとめるとすれば、改正によって「相当の公益性」条件が追加されたことで、今後、個票利用の可能性が広がることには違いないと考えられます。ただし、具体的にどのあたりに線が引かれるかについては、今後の各省のガイドラインによるため、見通せない部分も大きいです。今後、オンサイト利用が展開されることも踏まえると、現在のように科研費があれば比較的柔軟に個票を使った分析ができるというのは、過渡期的な現象なのかもしれません。そう考えると、最初に述べたような「個票がオープンになる」状況とは、いささか違ってきそうです。いずれにしても、今後も公的統計の利用促進の展開に注目していく必要があるでしょう。

No comments:

Post a Comment