ヘルスケア産業におけるAI/機械学習活用の現在と課題、未来展望

伝統的に医療や創薬などのヘルスケア・ライフサイエンス分野は複雑かつ広大な学問領域を誇るため、専門家による知識や考察が非常に重視される時代が長らく続きました。

しかし、人工知能(AI)技術や、そのバックグラウンドとしてのデータベース技術の発展と共にビッグデータを取り扱うことができるようになってきたため、近年では論文解析、創薬及び診断などにAI/機械学習を導入しようという試みが活発に行われています。本稿では、このようなヘルスケア産業におけるAI/機械学習の活用の現在と課題、未来展望をご紹介します。

ヘルスケア産業におけるAI/機械学習活用の現在

ヘルスケア産業へのAIの身近な活用例として、NHKスペシャル「新型コロナ 全論文解読〜AIで迫る いま知りたいこと」(2020年11月8日放送)では、NHKが独自に新型コロナに関する論文をAIに学習させ論文の傾向を読み解くという画期的な試みが行われました。

通常、ある分野の論文が複数報出ると、レビュー論文という形で専門家によって原著論文がまとめられます。しかしながら、新型コロナが爆発的に流行したことで関連する研究も加速度的に進み、人の手ではまとめきれない玉石混合の論文が多数報告されました。その結果、何が真実なのか、どのようなキーワードがトレンドなのかといった基本的なことさえ分かりにくい状況に陥ってしまいました。番組では、20万報以上に及ぶ論文をAIに学習させることで、新型コロナ研究に関するトレンドやキーワードの抽出を可能にしました。

創薬・臨床の現場でもAI

さらに創薬研究においても、AIの利用が試みられています。元々、創薬研究には莫大なコストがかかりますが、近年では有効と思われる領域が研究しつくされてきたこともあって研究開発費が年々高騰しており、製薬企業では創薬プロセスの生産性向上が強く望まれています。(マテリアルズ・インフォマティクス)

低分子化合物の創薬プロセスの初期段階では、メディシナルケミスト(合成科学者)によるリード化合物の最適化が行われておりますが、創薬の探索研究プロセスの中でもリード化合物の最適化は経済的にも負担の大きいプロセスであることが知られています。
1つの新薬の上市までの総コストを約1,800百万ドル(約2,000億円)と見積もると、リード化合物の最適化にかかるコストは約414百万ドル(約460億円)と推定されています。リード化合物の設計や合成に関してはメディシナルケミストの長年の経験や勘によるところが大きく、より効率の良い最適化のためにAI技術に対して大きな期待が寄せられています。

創薬研究にAIを導入する具体的な試みとして、例えば2018年には株式会社DeNAが、旭化成ファーマや塩野義製薬が所有する化合物情報を用いたAI創薬の実現可能性を検証するために共同研究を開始しました。
製薬企業から化合物データの提供を受ける形での共同研究は、AI創薬では世界でも初の試みであり、彼らはリード化合物の最適化という創薬プロセスの中でも特にコストがかかる段階にフォーカスして、AIを用いたコスト削減ができないか研究しています。また、これまでの製薬業界の研究では、「リード化合物を見つけるところまでは行ったものの最適化することができず薬にならなかった」化合物も多々あるため、それらをAIによって再発見し、薬にすることが出来るかもしれません。DeNAは、このようにAIを用いてコスト削減のみならず、新たな価値の創出にも挑戦しようとしています。

臨床の現場では、診断にAI技術を導入する試みが行われています。特にAIと画像診断の相性は良く、特に研究が進んでいます。
例えば、オリンパス株式会社は内視鏡画像診断支援ソフトウェア「Endo BRAIN-EYE」を2020年5月から発売していますが、このソフトウェアは内視鏡における病変検出用AIとして国内で初めて承認を得ました。大腸の内視鏡画像をAIが解析し、内視鏡検査中にリアルタイムでポリープやがんなどの病変候補を検出することができます。
エルピクセル株式会社は、医用画像解析ソフトウェア「EIRL aneurysm(エイル アニュリズム)」を発売しています。このソフトウェアでは脳のMRI画像を解析することにより、血管のこぶである脳動脈瘤を検出することが出来ます。エルピクセルでは、大腸や肺、肝臓、乳房のがんなどのAI画像診断支援ソフトも開発中です。一方で、診断に関する情報はそれぞれの医療機関が個別に所持しているため、論文や創薬研究と異なり、データベース化が進んでいないことが課題となっています。

ヘルスケア産業におけるAI/機械学習活用の課題とその対策

ヘルスケア産業に限定した話ではありませんが、ビッグデータを解析できるデータサイエンティスト人材が我が国では不足しており、AI産業における共通の課題として認識されています。

近年、そのような現状に対して危機感をもつ大学や企業において、データサイエンティスト人材育成に関する教育プログラムの展開・普及が進んでいます。次世代シーケンサーやハイスループット計測機器からは日常的にゲノムやオミクス関連のビッグデータが生み出されています。これらのゲノム・オミクス関連データの解析方法や、それらをヘルスケア関連のデータに結びつけてどのように解析及び活用するのかが、今後の重要な課題となります。ここでは、課題である人材不足を解消するため、ヘルスケア産業に関連したデータサイエンティスト人材教育プログラムをご紹介します。

東京大学新領域創成科学研究科においては、ヘルスケア関連ビッグデータを解析及び活用できるデータサイエンティストの育成を目指し、教育プログラム「DSTEP(Data Scientist Training/Education Program)」を創設しました。産業界に対して広く参加の門戸を解放している点が、このプログラムの特徴です。DSTEPは3年間の博士課程研究カリキュラムで、受講生としては、企業在籍研究者や、学内及び学外生を対象としています。ヘルスケア関連企業やバイオインフォマティクス企業など12社が参画しており、幅広く学外機関と連携または協力関係を構築しています。

企業においても、AIや機械学習に通じたデータサイエンティストの育成が行われています。特に優秀なデータサイエンティストの雇用流動性は高く、優秀な人材の継続雇用や流出の防止が課題となっています。対策として、例えば株式会社DeNAでは教育プログラムの一つとしてKaggleコンペティションへの参加が推奨されています。Kaggleとは機械学習モデルを構築するコンペティションのプラットフォームです。Kaggleを学ぶことで、データサイエンティストに必要となるスキルを学ぶことにも繋がります。2018年の4月には、DeNAで「Kaggle社内ランク」という社内制度が設けられ、業務時間を使ってKaggleコンペティションへ参加することが可能となりました。データサイエンティストの育成は今まで個人による自己研鑽や自助努力によるものが大きかったですが、このDeNAの社内制度は個人の努力を認める制度として非常に魅力的です。

ヘルスケア産業におけるAI/機械学習活用の未来展望

ヘルスケア産業は年々膨大な情報を扱う傾向になってきており、AIや機械学習の技術が今後ますます求められるようになるでしょう。現時点ではAIの活用はまだまだ実験的な段階のものが多くありますが、今後創薬プロセスなどへ本格的に生かすことのできるプログラムが増えていくと期待されます。

一方で、ヘルスケア産業において今後このような莫大なデータと対峙するにあたっては、オミクス、計算化学、AI、分子生物、細胞工学、分析化学、ロボット工学など多分野の結集が必須です。しかし、このような異分野の研究者が協力関係を結ぶことは、縦割りの大学組織に代表されるように日本人は苦手としている傾向があり、更に、先ほど示しましたようにデータサイエンティストの人材不足などの課題も挙げられます。

他分野を結合することでシナジーを創出し、且つ新しい分野の人材を育成することが、AI/機械学習を今後活用していくために必要ではないでしょうか。
それでは、また。


<参考文献>

  1. NHKスペシャル「新型コロナ全論文解読〜AIで迫るいま知りたいと」(2020年11月8日放送)
  2. 日本医療研究開発機構研究費(創薬基盤推進研究事業)創薬技術調査報告書(Part1)「創薬の新しい潮流を探る-ビッグデータ・AI、創薬モダリティおよび合成生物学の国内動向-」
  3. 製薬企業の化合物データを活用したAI創薬に関する共同研究等を実施
  4. AI画像診断支援技術
  5. DSTEP(Data Scientist Training / Education Program)
  6. DeNAKaggle社内ランク制度について

関連記事

  1. 【ニュース解説】因果推論 – 2019年ノーベル経済学賞の…

  2. いまさら解説する「教師あり学習」と「教師なし学習」の違い―それぞれの特…

  3. なぜ人工知能プロジェクトではプロマネの腕が問われるのか?

  4. Goole Vision APIの精度とは?実際の利用方法を解説

  5. AI、人工知能、機械学習…なにから勉強を始めたらいいの?

  6. ヘルスケア産業に使われるアルゴリズムのトレンドとは?

  7. manager skill column

    マネージャーにとってのデータ分析とは

  8. AI社会の仕組み変化を見据えた投資が必要だ

PAGE TOP