文献等からの知識抽出・学習技術
(機械学習を活用した酵素提案)
荒木 通啓
京都大学医学研究科
個別技術紹介
荒木 通啓
京都大学医学研究科
スマートセル設計における情報解析システムでは、代謝経路設計から代謝モデル構築・最適化といったプロセスに加えて、酵素遺伝子や改変候補遺伝子の探索において、文献・データベース情報からの知識抽出に依存しており、酵素遺伝子探索にフォーカスした機械学習技術を開発している。
代謝設計により出力される代謝経路には、未知・既知を問わず推定された酵素遺伝子候補が複数出現することになり、代謝経路を実際に構築していく上で、酵素遺伝子の選択が重要な課題となってくる。しかしながらこの点に関しても、現在のところ各人がKEGG・BRENDAといった各酵素反応データベースに拡散した情報、文献・特許情報をマニュアルで調査し、研究者の直観による意思決定がなされている状況であり、酵素遺伝子の効率的かつ信頼性の高い選択方法の開発が強く望まれている。
機械学習法は学習データをもとに、予測したいテストデータに対して判別・分類などを行う手法であり、近年のデータ量の増加、計算機性能の向上により、様々な分野で応用されている。本分野においても例外ではなく、機械学習法により、既知の酵素反応データをもとに学習を行い、新しい酵素反応を見出していくことができれば、非常に有用な方法となる。我々は基質・生成物と酵素アミノ酸配列の組合せを考慮した機械学習法、深層学習を応用した酵素アミノ酸配列の特徴抽出手法を開発することで、従来的な配列比較法やクラスタリング法では見いだせない特徴抽出を目指している。
新規代謝経路を実現するための酵素遺伝子探索や既知代謝経路中の新たな基質特異性・活性を有する酵素遺伝子バリエーションの探索において、新たな有用酵素遺伝子を発見に貢献できる。
1) Y. Saito et al. : Sci. Rep., 9(1), 8338 (2019)
最終更新日:2022年11月14日 11:40