G3-6 インシリコスクリーニング支援

ユニット名

連携・融合ユニット

支援担当者

所属 ① 東京大学 大学院農学生命科学研究科
氏名 ① 村松 知成
AMED
事業
課題名 1細胞/微小組織マルチオミックスのオールインワン解析による生命科学研究の支援
代表機関 早稲田大学
代表者 由良 敬

支援技術のキーワード

テキストマイニング、関連性抽出、関連性推定、創薬支援

支援技術の概要

医学・生命科学文献データベースPubMedの利用可能なアブストラクト(約2千万件)から生体分子間や生命現象間の様々な関連性を抽出し、それらを連結することにより新たな関連性を推定するシステムを開発した。これを用いて、個々の疾病に対する関連薬の推定、重要な生体分子間の関連の推定、生命現象間の関連性の推定などを行う。具体的には、各PubMedアブストラクト内での生体分子や生命現象に関する用語間の共起を調べ、それらの集計を用いて各用語間の関連性の大きさを計算する。そして、それらをつなぎ合わせることにより、新たな関連性を推定する。これは、例えば、ドラッグリポジショニングによる治療薬・診断薬のスクリーニングの初期段階で用いることができる。推定する関連性は疾病―薬間だけではなく、タンパク質間やタンパク質―低分子化合物など、どのようなカテゴリー間にも対応でき、要請に応じて、柔軟な検索ならびに推定結果を提供することができるため、基礎研究のための仮説作りのためのアイデア捻出ツールとしても利用可能である。現時点のシステムでは、実際には、各用語はKEGGコード(KEGGエントリー)に紐づけされており、個々の関連性はKEGGコード間の関連性に変換された上で、新たな関連性の推定を行っているが、起点となる事象がKEGGコードに含まれていない場合にも対応できる。

この独自システムの開発とその応用としての新型コロナウイルス関連薬推定については論文として発表済みである(Muramatsu, T. & Tanokura, M., Bioinformatics Advances 1(1) vbab013 (2021)。

支援技術の利用例

  • 新型コロナウイルス関連薬推定については既に論文として発表済み。Muramatsu, T. & Tanokura, M., Bioinformatics Advances 1(1) vbab013 (2021)。
  • 他の疾病関連薬推定にも利用可能。
  • 一般的な事象間での関連性推定にも利用可能。
  • 支援担当者の研究概要

    テキストマイニングによる関連性推定法の開発とその新型コロナウイルス関連薬推定への応用については論文として公表した(Muramatsu, T. & Tanokura, M., Bioinformatics Advances 1(1) vbab013 (2021))。構造生物学的、酵素学的研究も行っており、コロナウイルス主要プロテアーゼの自己プロセシング過程の解析、その際の特殊な特異異性発現とその機構を明らかにしてきた(Muramatsu et al. Proc. Natl. Acad. Sci. USA, 113, 12997-13002 (2016); Muramatsu et al. FEBS J. 280, 2002-2013 (2013))。
    その他のタンパク質構造機能相関研究、食品等の分析なども行っている。

    支援申請する