AI創薬におけるデータクレンジングの重要性
AI創薬のビッグデータとしてのレセプト情報
使用による予後のデータ収集
ゲノム解析のオミックスデータやレセプト情報とAIを活用すれば、医薬品を使ったことによる予後のデータを取得して、医薬品の薬効や副作用に影響する因子を特定できるようになります。
今後、さらに医薬品の予後予測に活用できるとして期待されています。ただ、レセプト情報はそのままでは創薬に使えない場合もあり、データの標準化が必要です。
レセプト情報の使用に関する課題
これまでに収集されてきたいわゆる「ビッグデータ」は、多量のデータであれば多少データが乱雑であっても許容されてきた一面がありました。そのため、都道府県別でデータ形式やフォーマットに違いがあるものや、医師によって診断される病名とは異なる「保険病名」で記載される場合もあり、入力誤差が生じてしまっていました。
これらデータの「ノイズ」は、AI創薬開発がなかなか進まない要因となっています。AI創薬を加速させるためには、入力誤差を小さくするデータクレンジングやデータ整形が必要です。
ビッグデータにおけるデータクレンジングの重要性
マーケティング分野で活用されているアソシエーション分析を応用した「患者層別化AI」が開発され、創薬標的探索に利用されています。
具体的には、患者のレセプト情報とオミックスデータから、オミックスデータの共通する性質と診療データの共通項目を自動で抽出して創薬ターゲットとなる分子を探索するもので、開発を加速させる有力な情報となるのではと考えられているものです。
オミックスデータとレセプト情報を上手く組み合わせて活用するためにも、データクレンジングは重要な工程のひとつといえます。
創薬AI開発におけるレセプトの活用
創薬や診療支援に活用できるデータ分析事業は、国内でも展開されています。TOPPANホールディングスと富士通は2023年10月に業務提携契約を締結し、医療ビッグデータ事業を共同で推進すると発表しました。
TOPPANホールディングスが持つ医療分野のデータ分析技術と富士通のデータクレンジング技術を組み合わせ、医療向けデータ分析サービスの提供を開始することを目指すもので、TOPPANホールディングス創薬や個別化医療の実現に向けた分析サービスを、富士通はデータクレンジングや自社のAI技術処理を対応。製薬企業や医療機関向けのSaaS型分析サービスを新たに開発するための取り組みを進めています。
(https://xtech.nikkei.com/atcl/nxt/news/18/16119/)