⑯ 医療デジタルデータのAI研究開発等への利活用に係るガイドライン
医療データのAI活用を安全・スムーズに進めるためのガイドラインをわかりやすく解説
医療機関に眠っている膨大なデータ。AIが進化する今、これを研究開発に活かせたら素晴らしいと思いませんか? ただし医療情報は「要配慮個人情報」なので、扱い方を間違えると大きな問題になります。
厚生労働省が2024年にまとめた「医療デジタルデータのAI研究開発等への利活用に係るガイドライン」は、そんな悩みを解決するための実践的な手引きです。 私は生成AIが登場した頃からずっと使い続けている古参ユーザーとして、このガイドラインは「本気で医療AIを作りたい人」にとって非常に価値がある資料だと感じています。
このガイドラインの内容を、丁寧に整理してお伝えします。
ガイドブックの基本情報
タイトル:医療デジタルデータのAI研究開発等への利活用に係るガイドライン
発行元:デジタルデータのAI研究開発等への利活用に係るガイドライン作成班(厚生労働科学研究費補助金・政策科学総合研究の一環)
発行日:令和6年3月31日(2024年3月31日)
バージョン:初版
対象者:医療機関等の医療従事者、学術研究機関等の研究者、民間企業等の開発担当者(主に診断用医療AIソフトウェアの共同開発に携わる関係者)
総ページ数:61ページ
リンクURL:https://www.mhlw.go.jp/content/001310044.pdf
タイトル:「ガイドライン」の留意点について
総ページ数:4ページ(本文2ページ+別添Q&A 2ページ)
リンクURL:https://www.mhlw.go.jp/content/001359625.pdf
ガイドラインができた背景
病院では日々、診療記録や検査画像、遺伝子情報などが大量に蓄積されています。世界ではこれをAI開発に活かそうという動きが加速していますが、日本では個人情報保護の壁が厚く、なかなか活用が進みにくい状況でした。
特に「過去の患者さん一人ひとりに同意を取る」のは現実的ではありません。そこで仮名加工情報という仕組みを上手に使って、安全にデータを利活用するためのルールを明確にしたのが今回のガイドラインです。
令和6年(2024年)3月31日に初版が公開され、9月と12月には厚生労働省から事務連絡とQ&Aも出ています。
医療情報の利用目的は3つに整理されている
ガイドラインでは、医療情報の利用目的を次の3つに分けています:
- 診療目的:日常の治療
- 学術研究目的:大学や研究機関での研究
- 製品開発目的:民間企業が医療AIや医療機器を作る場合
ここが大事なポイントです。「学術研究目的」であれば一定の例外が認められますが、純粋な製品開発だけの場合は例外が使えません。そのため、民間企業が医療機関と共同でAIを開発する場合は「仮名加工情報の共同利用」という形を取るのが現実的な道筋になります。
仮名加工情報とは? 基本の考え方
仮名加工情報とは、氏名などの直接的な個人識別情報を削除・置き換えして、他の情報と照合しない限り個人を特定できなくしたデータです。重要なルールとして:
- 原則として第三者提供は禁止
- ただし共同利用の形にすれば提供可能
- 共同利用する際は、事前に「共同利用する旨・データ項目・利用者の範囲・利用目的・管理責任者」を公表する必要あり
- 「転々流通(データをさらに別のところへ渡す)」は禁止
提供元の医療機関ではまだ「個人情報」として扱い、受け取った民間企業では「個人情報でない仮名加工情報」として扱う、という違いも押さえておくとわかりやすいです。
仮名加工情報の作成手順(とても実践的)
ガイドラインの核心部分です。医療情報を以下の6類型に分けて考えます。
| 類型 | 説明 | 例 |
|---|---|---|
| 個人識別符号 | 単体で個人を特定できる | ゲノムデータ、保険証番号 |
| 識別子 | 単体で個人を識別できる記述 | 氏名、顔写真 |
| 準識別子 | 組み合わせで特定可能 | 生年月日、住所、性別 |
| 財産的被害情報 | 不正利用で被害が出る恐れ | クレジットカード番号 |
| 連結符号 | 個人情報を繋ぐ符号 | カルテ番号 |
| 連絡先情報 | 本人に連絡できる情報 | 電話番号、メールアドレス |
必須の加工手順は以下の通りです:
- 利用目的を明確にする
- 対象となる医療情報を特定
- 識別子・準識別子を洗い出す
- 識別子は削除・置換・マスク(必須)
- 準識別子は適切に一般化(例:住所は「番地まで」→「市区町村まで」)
- 個人識別符号や財産的被害情報は削除(必須)
さらに連絡先情報やカルテ番号の削除、郵便番号や生年月日の一般化なども推奨されています。
医療情報の種類別・具体的な加工方法
- 診療テキスト情報(XML):ヘッダーは必須加工、自由記載部分は目視確認
- 生理機能検査情報(CSV):患者基本情報部分を加工
- 医用画像情報(DICOM):タグ確認+顔が写っている部分はマスク処理
- 遺伝子検査情報:個人識別符号に該当する場合は削除
- マルチモーダル(複数組み合わせ):準識別子の組み合わせを横断的にチェック
実際に画像データを使うときは、DICOMタグ一つひとつ確認する必要があるなど、地道な作業が求められます。
研究開発の7段階と使える法的根拠
これが非常に実用的です。診断用医療AIの開発を7段階に分け、それぞれで使える法的根拠を整理しています。
- 探索:学術研究例外
- 開発:学術研究例外 or 仮名加工共同利用
- 性能評価:同上
- 承認申請書類作成:仮名加工共同利用(必須)
- 承認申請:統計情報として提出(個人情報保護法対象外)
- 承認審査:法令に基づく第三者提供
- 製造販売後:再学習時は再度共同利用を設定
異なる法的根拠で取得したデータを混ぜて保持するとリスクがあるため、目的が終わったら速やかに返還・消去することが原則です。
留意点(2024年12月のQ&Aより)
- 本ガイドラインは医療機関が保有する診療データを対象としたもの
- 厚労省のデータベースや学会レジストリは対象外
- 共同利用の範囲は「合理性がある範囲」に限定
- 生命科学・医学系研究に使う場合は、別途倫理指針も遵守
私の経験から
「ルールが明確になると、逆に自由度が増す」ということを感じました。このガイドラインは「何をすれば安全か」を具体的に示してくれているので、医療機関と企業が安心して共同開発に踏み出せる土台になると思います。
特に中小企業やスタートアップの方は、共同利用の公表方法や加工手順をしっかり押さえておくと、交渉がスムーズになるはずです。
まとめと所感
医療データのAI利活用は、日本が得意とする「丁寧で信頼性の高い医療AI」を世界に発信する大きなチャンスです。 このガイドラインは「背伸びせず、正しく」進めるための羅針盤と言えるでしょう。
ぜひ一度、公式のガイドラインにも目を通してみてください。最初は難しく感じるかもしれませんが、章立てがしっかりしているので、自分の関わる部分から読むのがおすすめです。
このガイドラインを活用して、安心して医療AI開発に取り組める人が一人でも増えたら嬉しいです。
他のガイドラインは以下よりご覧ください
AIガイドライン 18本 構造化インデックス
【一覧】日本政府 AIガイドライン 18本【INDEX】




