キービジュアル画像

見えない格差を可視化する、データの整備と活用例(2/3)

社会動向レポート
教育分野を中心に

社会政策コンサルティング部 主任コンサルタント 森安 亮介

  1. 1
  2. 2
  3. 3

3 効果の検証に求められる事前設計・追跡データ・行政情報

それでは、効果検証も見据えた施策の検討・実施にあたり何が必要だろうか。筆者はこれまで厚生労働省や文部科学省におけるEBPM(エビデンスに基づく政策立案)推進支援に携わり、政策の各種効果分析や省内向け研修などを行ってきた。そうした経験を踏まえ、必要となるデータや、対応策実施時の工夫といった観点から、次の3つを紹介する。

(1)追跡データの収集・蓄積

企業・学校・行政にかかわらず、読者がもしデータ構築に携わる立場ならぜひご検討いただきたいのが、追跡的なデータの構築である。個人や企業、学校など同一個体を追跡的に把握するデータを蓄積しておくことで、施策の効果検証は各段に精度が高まる*9。なお、こうした追跡的なデータをパネルデータという。都道府県単位など集計されたデータ(第1世代)、1時点における個別の主体について記述した個票データ(第2世代)と比べて、パネルデータは第3世代のデータとも呼ばれる。

第1世代・第2世代のデータでは、その時点における状態は観察できるものの、何かの施策の因果的な効果を把握することは難しい。例えば2017年以降のキャリア教育の実施によって生徒の進路選択にどのような変化が生じたのかを知りたい場合、実施以前の2015年と実施以降の2020年を単純比較するだけでは、キャリア教育の影響は確かめられない。別の要因(学生の世代の違い・景気変動など)による影響が排除できないためである。どのようなキャリア教育を受けた個人が(又は、どのようなキャリア教育を施した学校が)、その後、キャリア教育を受けていない層と比較して進路状況が変化したかを把握できて初めて、因果的な効果を検討できることになる。

こうしたパネルデータは、例えば21世紀出生児縦断調査(厚生労働省・文部科学省)など、ある特定層を追跡した調査であれば行政でもいくつか存在する。ただし、ある特定の層だけの追跡の場合、他世代との比較ができず分析には限界がある。そうした中、わが国の人口構成を反映したパネルデータとして稀有な例が慶應義塾大学の持つパネルデータ「日本家計パネル調査JHPS/KHPS」である。筆者も共同研究員として週2日勤務している慶應義塾大学パネルデータ設計・解析センター(センター長:山本勲教授)では、2004年から毎年、個人や世帯を対象に追跡した調査を行っている。その調査では、家族構成、個人属性、学歴、就業・就学状態をベースに、所得、教育、健康・医療、消費、所得、住宅、生活時間の配分、親との居住関係に至るまで包括的なテーマについて追跡調査がなされている。また、新型コロナウイルス感染症の影響を把握するため、2020年5月以降追加的に特別調査も実施されている。その結果、コロナ禍前には在宅勤務実施率に所得階層による差は見られなかったにもかかわらず、コロナ禍以後の2021年4月には高所得層で顕著に在宅勤務が拡大。ワークエンゲージメントや自己研鑽の学習時間も高所得層で増大したことなどが明らかになっている(山本・石井2021、石井・中山・山本2021)。こうした分析は、コロナ禍前の段階から個人の就業状態や学習時間、心理状態などを調査し、追跡的に検証できたからこそ可能となる分析である。もちろん事後的にアンケートを行い、回顧的に過去を振り返って回答することも可能である。しかし詳細な前後変化や要因分析、因果関係の検証という点では限界があるし、仮に過去のワークエンゲージメントなどを回顧的に答えてもその信頼性は低い。

なお、慶應義塾大学では、教育分野に特化したパネルデータも収集・蓄積されている。2010年以降、慶應義塾大学パネルデータ設計・解析センターが前述のパネル調査の回答対象者のうち子どものいる世帯に対し、算数(数学)・国語・推論の基礎学力テストや、生活に関するアンケート、教育環境や子育て・子どもの行動に関するアンケートを行っている(日本子どもパネル調査)。加えて、慶應義塾大学こどもの機会均等研究センター(センター長:赤林英夫教授)とも連携し、親子の二世代にわたって追跡したデータも構築。経済格差や教育格差の世代間連鎖に係る各種研究も行われている。


図表4 第3世代と言われるパネルデータ

図表4

(資料)慶應義塾大学パネルデータ設計・解析センターHPを参考にみずほリサーチ&テクノロジーズ作成


図表5 パネルデータのイメージ

図表5

(資料)各種資料を参考にみずほリサーチ&テクノロジーズ作成

(2)行政情報・校務情報など業務上、収集されている情報の利活用

さらに、もしも読者が行政関係者や教育委員会・学校関係者などで、行政データや校務情報にも関わる方なら、ぜひご検討いただきたいのが行政情報や校務情報の活用である。前述のパネルデータは研究テーマに即した調査はできる反面、数値の正確さ・脱落の少なさ・観測値数の多さ等の点についてはデメリットもある(別所ら2019, 田中2020等)。長年にわたり個人や企業を追跡調査する過程で、どうしても回答が途中で途絶えてしまったり、回答者数を増やそうしてもコストが発生してしまったりするためである。

そこで近年注目されているデータが行政データ(administrative data)である。自治体は日々の業務を遂行する上で必要なさまざまな行政データを持っており,特に教育政策に関連する分野では学力テストや体力テスト、児童生徒の健康診断情報など,さまざまな有益なデータを保有している(田中2020)。これらのデータは行政や学校の業務遂行のために収集されたものであり、ほぼ全数のデータが蓄積されている。こうしたデータを他の情報と紐づけることで、目には見えない社会課題を浮き彫りにすることが可能になる。

こうしたデータは既に北欧諸国やアメリカなどで活用されている。特筆すべきは、教育以外の分野のデータとも紐付けることで新たな発見を生み出している点である。例えば、アレックス・ベルらハーバード大学の研究では、ニューヨーク市の児童のテストの点数およそ20年分のデータを、成人後の税務記録や特許記録と紐づけることで、教育が成人後のイノベーションに与える影響について分析している。結果、恵まれない家庭環境等の「教育機会の不平等」によって、イノベーション創出という「教育結果の不平等」が引き起こされていることを明らかにしている。そうした教育機会の不平等によって喪失されたイノベーションの機会*10も推計しており、推計の結果、恵まれない家庭環境など不利な立場にいた生徒たちが、もしも有利な立場(白人の高収入家庭)と同等の教育を受けていたら、アメリカでは今の4倍近いイノベーターが存在することを示している(Alex Bell et al.2019)。この他にも、アンガス・ディートン(11)やアン・ケースらの研究では、教育データに死亡記録や健康データ、人口動態調査などを紐づけて分析している。その結果、アメリカの各属性のうち中年白人の学士号未満の労働者層だけが医療・健康状態の悪化がみられることが明らかになった(アン・ケース&:アンガス・ディートン2021)。教育の差によって、成人後の健康状態や心理的苦痛、死亡率などにも影響が及んでいたのである。

こうした研究の利点は、学校卒業後の「中長期的な教育成果」を明らかにすることにある。一般的に用いられる学力テストなどのデータは、学力向上等については検証できるものの、学校卒業後の影響はとらえにくい。これに対して上記のような研究は、成人後の雇用や健康、福祉、医療、技術革新などの分野のデータを教育データと紐づけることで、学校現場だけでは発見できないような、新たな課題やメカニズムを浮き彫りにしている。もちろんこうしたデータは前述のパネルデータでも取得可能ではあるが、1から追跡データを収集・蓄積すると、生徒が成人後に至るまで多くの年月を待たねばならない。その点、行政データを用いれば既に存在するデータを紐づけることで追跡的なデータセットの構築が可能になるのである。そうしたデータさえあれば、統計的な分析手法を駆使することで、「もしも平等な教育を受けていたら、成人後どんな違いがあったか」という、現実には存在しないような、いわば仮想的な教育成果を推計できる。いま我々が実際に観察できるのは、いま現実に存在する成人の教育成果だけだが、もしこうした仮想的な教育成果を可視化できれば、現実との比較によって我々が気付かないうちに失っている機会を認識することができる。こうした潜在的に失っている機会について、例えば早稲田大学の松岡亮二准教授は「一人ひとりに教育機会がもっと与えられていれば、あなたが癌になったとき、担当医は現在の医者よりも優秀かもしれないし、新しい抗癌剤を創薬する研究者も増えるかもしれない」(松岡2019.p314)と述べている。適切なデータさえあれば、こうした”今とのギャップ”を数字で示すことが可能になる。目の前に見える問題の改善だけに終始するのではなく、こうした可視化によって浮き彫りになる「あるべき姿と現状とのギャップ」に目を向けることで、より適切な課題設定ができるようになる。

もちろん行政データの整備には、情報管理やプライバシー・人権、利活用ルールの在り方や法的側面、社会的合意などいくつかの課題が存在する。拙速なデータ整備や活用にはリスクもはらんでいることは言うまでもない。そのため、先進的な諸外国や先行自治体などの実情やリスクも吟味した上で、検討・対応していくことが必要であろう。なお、国内に限っても東京都足立区・大阪府箕面市・兵庫県尼崎市など、すでに行政データの活用や複数データの突合・利用がなされている自治体も存在する。とくに大阪府箕面市では、教育データと家庭環境に関するデータを突合することで、支援が必要な子どもの早期発見にも活用されている(子ども成長見守りシステム)。こうした先行例の経験にも学びながら、適切な範囲でデータ構築を広めていくことが有用である。


図表6 行政情報の活用が進む自治体の一例

図表6

(資料)各種HPよりみずほリサーチ&テクノロジーズ作成

(3)事前の設計(効果検証にむけた分析のリサーチデザイン)

では、データベース構築に関する部門ではない担当者には何も対応できないのかというと全くそんなことはない。筆者も厚生労働省や文部科学省むけのEBPM研修等で、むしろデータ部門以外のすべての事業担当者にお願いしている対応策は、効果検証にむけた事前の設計(リサーチデザイン)である。重要なのは、施策を実施する前に、(1)施策によってもたらされる効果の仮説を立て、(2)効果のうち、定量化できる指標とデータセットを定め、(3)効果が抽出できるような比較可能な対象(対照群)等の準備をしておくことである。例えば学校教育分野を例にすると、近年1人1台端末の配布やアクティブ・ラーニングの実施など新たな教育ツール・教育手法が学校現場に導入されている。こうした導入の効果検証に際し、事後的にアンケートやインタビューをいくら精緻に行っても、残念ながら因果的な効果を抽出することは難しい。仮にアクティブ・ラーニングの実施頻度と生徒学力に相関関係があったとしても、それはアクティブ・ラーニングによって学力向上が引き起こされたのか、それとも学力の高い学校ではアクティブ・ラーニングの実施がスムーズなのかが識別できないためである。因果的な効果を検証するためには、新たな手法と比較可能なグループ(対照群)を予め設定しておくとともに、新手法によって変化が起こるであろう効果を測るための定量指標やデータ、分析手法を先に決めてセットしておくことが必要である。

このような、事前に仮説を立てて検証項目やデータを検討する姿勢は、前向き(prospective)アプローチと呼ばれる。このアプローチは、すでに蓄積されている調査やデータをもとに集計・分析するようなアプローチ(後ろ向きアプローチ)とは発想が大きく異なる上、事前設計がものをいう。仮に制度上、一朝一夕には比較可能な対象(対照群)の設定は難しかったとしても、少なくともこうした前向きアプローチの視点を取り入れて施策を講じることが、効果検証の質を高める第一歩である。

なお、施策担当者が前向き(prospective)アプローチを実践するための有益なフレームワークが「ロジックモデル」である。これは、行政や教育分野のみならず、何らかの施策実施を担当する全てのビジネスパーソンにも有用なツールだと言える。とくに目に見えない価値・非財務価値の可視化には大きな効力を発揮する。関心のある方は拙著コラム「EBPM推進で用いられるロジックモデルとは? EBPM浸透に向けた第一歩」(2020年11月26日当社HPコラム)や「EBPMで用いられるエビデンスの役割とは?EBPM促進のための「3つのエビデンス」の理解」(2021年7月16日当社HPコラム)を是非ご覧頂きたい。


図表7 効果検証で必要な前向きアプローチ

図表7

(資料)各種資料を参考にみずほリサーチ&テクノロジーズ作成

  1. 1
  2. 2
  3. 3

本レポートは当部の取引先配布資料として作成しております。本稿におけるありうる誤りはすべて筆者個人に属します。

レポートに掲載されているあらゆる内容の無断転載・複製を禁じます。全ての内容は日本の著作権法及び国際条約により保護されています。

関連情報

この執筆者はこちらも執筆しています