ページの先頭です

社会動向レポート

北欧諸国・台湾及び国内2事例における行政記録情報等の活用の観点から

EBPM推進にむけた、データ整備に必要な「5つの視点」(3/3)

社会政策コンサルティング部
主任コンサルタント森安 亮介
コンサルタント 利川 隆誠

4.社会環境や分野・制度・ステークホルダーに即したデータベース構築の検討を

以上、国内外の事例も参照しながら「5つの視点」を紹介した。各事例から浮き彫りになるのは社会の受容性やコスト・ベネフィットなどと関連しあいながら、あるべきデータやその運用の輪郭が形作られるといった過程であった。

最後に、行政記録情報を活用したデータベース構築時にすべての要素を規定することが困難なケースにおいて最低限必要な対応について補記したい。行政担当者によっては、「5つの視点」全ての検討・実施が困難だったり、より早い時間軸での対応に迫られているケースもあったりするためである。筆者らは拙速な推進は避けるべきだとは考えているものの、来る将来に備えておく観点で推奨しているのが「マッチングキー」の対応である。マッチングキーとは、異なるデータ同士をつなぎ合わせる際の鍵となるような情報項目で、異なる統計データで共通の項目を持つような項目を指す。例えば先述のNDBでは「保険者番号・名前・生年月日等」を組み合わせたIDをマッチングキーとしていた。実はマッチングキーを用いた接合の障壁となるのは、法的・技術的な側面もさることながら、運用面の課題が大きい。例えば、記入情報の表記揺れや個人情報の変更などである。技術的には、暗号化*10や匿名化処理によって個人情報の特定を防げるが*11、この時平仮名・カタカナ・漢字・数字・漢数字などの表記が異なるとマッチングキーとして機能しない。匿名化処理によって代替的に付与される個人IDについて、表記ゆれや情報変化によって別IDの生成を招くためである。一足飛びにデータベース構築には至らなくても、将来の接合可能性を見越して、表記ルール統一等の準備をしておくだけでも、構築上の大きな一歩になる*12

本稿では国内外の事例をもとに、データベース構築の検討を進める際に必要な点を検討した。構築したいデータ単体を議論対象とするのではなく、エコシステムの一構成要素としてのデータ(Data)として位置付け、データを取り巻くステークホルダーやその背景に目を向けることが重要である。本稿で紹介した「5つの視点」に照らした問いを紹介し、本稿を締めくくりたい。今後のEBPM推進に向けて、行政記録情報を活用したデータベース構築・整備の参考になれば幸いである。


図表4 サステナブルなデータ利活用に向けた「5つの視点」に照らした確認すべき問い
図表4

  1. (資料)みずほリサーチ&テクノロジーズが作成

  1. *1同事業の背景や日本の公的統計を取り巻く課題の一端は、萩野覚(2022)「統計の国際比較可能性の向上に向けて」『統計』第73巻10号にも詳しい。
  2. *2海外事例は総務省(2022)「公的統計の国際比較可能性に関する調査研究(社会統計編)報告書」を参照されたい。
  3. *3例えば、総務省(2012)「諸外国における国民ID制度の現状等に関する調査研究報告書」によると、スウェーデンの教会による住民登録は1571年に開始され、1686年には登録方法が全国で統一されたことが報告されている。
  4. *42022年10月時点で当社が確認したところ、スウェーデンのミュージシャン『ABBA』のメンバーや著名なジャズシンガーなども住所検索サイトによって住所や年齢などの閲覧が可能であった。
  5. *5保健福祉データ(Health and Welfare Data:HWD)センターにはNHIRDを含む70以上の医療関連データベースが管理されている(Hsieh et.al. 2018)。
  6. *6例えば、2019年に台湾では社会保険番号と各種の情報を統合した「デジタルIDシステム」を導入する動きがあった。このIDシステムは医療情報を一元化するシステムであり、導入に関して多くの議論が行われたが、市民党からの反発によって導入が見送られた。主な懸念点はデータがハッキングされ盗まれる可能性であったという。もちろん改善されれば今後、導入される可能性はあるが、2023年現在導入には至っていない。
  7. *7具体的には、「生活困窮判定」「学力判定」「非認知能力等判定」の3つの要素から、子どもに対する支援の可否が年2回判定されている。生徒情報が経年的に蓄積されているため、学力の絶対値だけではなく学力の変動から予兆が発見できる。また、主観的・定性的な側面での変化もいち早くキャッチアップできていることも特長である。実際、2017年後半で判定の結果「重点支援」と判定された児童477人のうち、その半数弱の212名が学校では問題の予兆を認識していない児童であったという。
  8. *8なお、現在ではNDBにとどまらず、更なるデータ拡充のためにデータベース間の連結が進められている。例えば、NDBと介護DB(介護レセプトと要介護認定情報を格納したDB)は2018年度以降のデータが連結され、2020年10月より研究目的に限り第三者提供が開始されている。また、匿名診療等関連情報(DPCデータ)を格納したDPCDBについても、2022年のNDB及び介護DBとの連結に向けた取組みがなされている。
  9. *9前述の総務省事業でOECD加盟国を中心とした計41の国や地域を対象とした調査を行ったところ、たしかに多くの国で個人番号が活用されているものの、ドイツやオーストラリアなど独自の方法で管理・構築している国も見られた。
  10. *10ここでいう暗号化の代表例はハッシュ関数によるものである。ハッシュ関数とは要約関数とも呼ばれ、名前や生年月日などの任意の入力データから固定長の変数を乱数のように生成する関数である。そうした関数から得られた値はハッシュ値と呼ばれる。
  11. *11例えばNDBでも個人識別情報が匿名化処理されている。具体的には、レセプトに含まれる氏名や被保険者証の記号・番号、生年月日といった情報はデータベースに格納される際には削除される。その代わりにハッシュ関数によって匿名加工されたハッシュ値がデータに付与され、代替的な個人IDとされている。
  12. *12なお、技術的にも課題はある。非常に低い確率ではあるものの、暗号化の特性として同一個人でないにもかかわらず同じIDが生成される可能性がある。これは仕様上避けることができない問題である。個人識別番号を用いないデータの構築にはこのように一定の不確かさを許容する必要があるといえる。

参考文献

  1. 総務省(2022)『公的統計の国際比較可能性に関する調査研究(社会統計編)報告書』
  2. 森安亮介(2022)『見えない格差を可視化する、データの整備と活用例―教育分野を中心に―』みずほリサーチ&テクノロジーズ コンサルティングレポートvol.2
  3. 栗山緋都美(2022)『行政のデジタル化―デンマーク型の行政サービスデザインからの示唆―』みずほリサーチ&テクノロジーズコラム
  4. Hsieh, C. Y., Su, C. C., Shao, S. C., Lin, S. J., KaoYang, Y. H., & Lai, E. C. C.(2018)「台湾の保健福祉データベース─ビッグデータ分析による高品質なリアルワールドエビデンスを得る機会─」『医薬品医療機器レギュラトリーサイエンス』Pharmaceuticaland medical device regulatory science, 49 (7),425-436.
  5. 総務省(2012)『諸外国における国民ID制度の現状等に関する調査研究報告書』
  • 本レポートは当部の取引先配布資料として作成しております。本稿におけるありうる誤りはすべて筆者個人に属します。
  • レポートに掲載されているあらゆる内容の無断転載・複製を禁じます。全ての内容は日本の著作権法及び国際条約により保護されています。

関連情報

この執筆者(森安 亮介)はこちらも執筆しています

この執筆者(利川 隆誠)はこちらも執筆しています

2023年3月2日
医師確保とキャリア両立のために
―地域枠の現状と今後の論点―
ページの先頭へ