個別技術紹介

Individual Technology

文献等からの知識抽出・学習技術
(スマートセル設計支援知識ベース)


荒木 通啓
京都大学医学研究科

theme

要旨

スマートセル設計における情報解析システムでは、代謝経路設計から代謝モデル構築・最適化といったプロセスに加えて、酵素遺伝子や改変候補遺伝子の探索において、文献・データベース情報からの知識抽出に依存しており、文献からの知識ベース開発を開発している。

研究の内容

スマートセル開発に特化した知識ベースの構築と、それを支えるAI技術の開発を目的に、知識ベースの概念設計・要素AI技術開発・ワークフロー開発に取り組んでいる。

知識ベースの構築には、大きく次の2つのプロセスの開発が必要である(図1)。すなわち、①知識の収集・蓄積:過去に実施されたスマートセル開発における様々な試行錯誤過程を、事象の関係性を整理して再利用可能な「知識」として蓄積するプロセス、②知識の探索・提示:スマートセル開発者(ユーザー)の問いかけ(クエリ)に対し、蓄積された知識から、ユーザーの解釈、意思決定を支援する事象、仮説、因果関係、または参考となる文献情報を提示するプロセス、である。

①においては、所望のスマートセル実現に向けて実施されてきた株改変の履歴、すなわち設計履歴の整理・体系化を行っている。具体的には、各改変株作製における意思決定内容を、「改変の目的、仮説」「その根拠となる情報と改変内容」「実現手段(合成・検証手段)」に正規化してデータベースエンジンに格納する。

これにより、後述の知識抽出処理において、株改変目的や内容・手段といった軸での横断的探索に活用する。加えて、改変の元となった親株からの派生関係をツリー状に体系化することにより、見落とした改変・実験への気付きや、それに基づく新たな設計仮説着想の支援などの効果が期待できる。 ②においては、ユーザーにより操作端末を介して入力されたクエリに対して、データベースから知識を探索し、ユーザーに設計提案として提示する知識探索技術を開発している。具体的には、目的物質・宿主や、これまでに実施した設計履歴などをクエリとして、データベース・文献等に蓄積された情報からクエリ内容に関連性の高い情報を横断的に探索し、代謝経路・遺伝子改変・DNA配列など、探索された知識をユーザーに分かりやすい形で提示する技術である。

産業界などへのアピールポイント

文献・公開データから、短時間で膨大な知識を網羅的・包括的に処理し、スマートセル設計の定石を提案するとともに、"セレンディプ"な設計指針の提案も期待でき、スマートセルの創製を加速することに貢献できる。

参考文献

1) Y. Saito et al. : Sci. Rep., 9(1), 8338 (2019)

最終更新日:2022年11月14日 12:29