AI創薬におけるデータクレンジングの重要性

目次

AI創薬のビッグデータとしてのレセプト情報

使用による予後のデータ収集

ゲノム解析のオミックスデータやレセプト情報とAIを活用すれば、医薬品を使ったことによる予後のデータを取得して、医薬品の薬効や副作用に影響する因子を特定できるようになります。

今後、さらに医薬品の予後予測に活用できるとして期待されています。ただ、レセプト情報はそのままでは創薬に使えない場合もあり、データの標準化が必要です。

レセプト情報の使用に関する課題

これまでに収集されてきたいわゆる「ビッグデータ」は、多量のデータであれば多少データが乱雑であっても許容されてきた一面がありました。そのため、都道府県別でデータ形式やフォーマットに違いがあるものや、医師によって診断される病名とは異なる「保険病名」で記載される場合もあり、入力誤差が生じてしまっていました。

これらデータの「ノイズ」は、AI創薬開発がなかなか進まない要因となっています。AI創薬を加速させるためには、入力誤差を小さくするデータクレンジングやデータ整形が必要です。

ビッグデータにおけるデータクレンジングの重要性

マーケティング分野で活用されているアソシエーション分析を応用した「患者層別化AI」が開発され、創薬標的探索に利用されています。

具体的には、患者のレセプト情報とオミックスデータから、オミックスデータの共通する性質と診療データの共通項目を自動で抽出して創薬ターゲットとなる分子を探索するもので、開発を加速させる有力な情報となるのではと考えられているものです。

オミックスデータとレセプト情報を上手く組み合わせて活用するためにも、データクレンジングは重要な工程のひとつといえます。

創薬AI開発におけるレセプトの活用

創薬や診療支援に活用できるデータ分析事業は、国内でも展開されています。TOPPANホールディングスと富士通は2023年10月に業務提携契約を締結し、医療ビッグデータ事業を共同で推進すると発表しました。

TOPPANホールディングスが持つ医療分野のデータ分析技術と富士通のデータクレンジング技術を組み合わせ、医療向けデータ分析サービスの提供を開始することを目指すもので、TOPPANホールディングス創薬や個別化医療の実現に向けた分析サービスを、富士通はデータクレンジングや自社のAI技術処理を対応。製薬企業や医療機関向けのSaaS型分析サービスを新たに開発するための取り組みを進めています。

参照元:日経XTECH「TOPPANと富士通が医療ビッグデータ事業で提携、創薬や診療支援に向けデータ分析」
(https://xtech.nikkei.com/atcl/nxt/news/18/16119/)

AI創薬の現状・課題や
活用効果について詳しく見る

取材協力
FRONTEOの公式サイトキャプチャ

引用元:FRONTEO公式HP
(https://www.new-dd.com/wp/wp-content/uploads/novel-targets-library_20240530.png)

自然言語AI+バイオロジストが課題を解決

FRONTEOの「Drug Discovery AI Factory」は、AIを活用して、創薬プロセスの効率化・高速化を支援するソリューションです。基礎研究・標的探索・仮説生成といった創薬の初期段階において、大手製薬企業出身のバイオロジストが自社開発の自然言語AI「KIBIT」を活用し、重複差分解析や2次元マッピング解析、ベクトル加算解析など独自の解析を実施。顧客のオーダーにあわせた標的分子・バイオマーカー・MoA・新たな適応症の提案などをスピーディーに行なってくれます。