多様な実験設定におけるランク学習を用いた化合物スクリーニングの性能評価

古井海里; 大上雅史

論文・著書情報

タイトル

和文:	多様な実験設定におけるランク学習を用いた化合物スクリーニングの性能評価
英文:

著者

和文:	古井海里, 大上雅史.
英文:	Kairi Furui, Masahito Ohue.

言語

Japanese

掲載誌/書名

和文:	研究報告バイオ情報学（BIO）
英文:

巻, 号, ページ

2022-BIO-70 49 1-6

出版年月

2022年6月20日

出版者

和文:	情報処理学会
英文:

会議名称

和文:
英文:

開催地

和文:
英文:

公式リンク

https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=218679&item_no=1&page_id=13&block_id=8

アブストラクト

情報検索分野で発展してきたランク学習手法が，リガンドベースのバーチャルスクリーニング (LBVS) に活用されている．ランク学習は順序関係を学習する機械学習の枠組みであり，異なる環境の実験データを統合するのに適しているという利点が注目されている．我々の取り組みで，複数の環境のアッセイデータが得られる状況において，新規標的に対するランキング予測が回帰モデルよりも予測精度の面で優れていることを明らかにした．しかし，標的と同ファミリーのタンパク質や標的そのものに関するアッセイ情報が全く無い，あるいは少し存在するなどの様々な状況下において LBVS にランク学習が適しているかは未知であった．また，従来研究で用いられていた NDCG (Normalized Discounted Cumulative Gain) 指標は他のモデルと比較して優れているかのみを評価するため，予測モデルがランダムな結果よりも悪い結果を出したかどうか考慮できないという問題があった．本研究は，多様なアッセイ情報の保有状況を想定した学習データを用いて，ランク学習手法の LBVS 性能を検証した．結果として，ランク学習手法はランキング予測において回帰と同等以上の予測精度であり，特に標的と関連するアッセイが複数存在する状況でランク学習のデータ統合が有効である可能性が示唆された．さらに，ランダムな予測を基準とした予測性能を評価する目的で新たに提案したランキング指標「Normalized Enrichment Discounted Cumulative Gain (NEDCG)」が，複数のテストデータについて予測結果の良し悪しを評価するのに適していた．

Home

各種検索

サポート

T2R2について

関連リンク

論文・著書情報