用語の説明書

➀  疾患多階層データベースの構築と応用

MGeND

日本人集団から得られるゲノム変異と疾患との関連情報を収載した公開データベース。一塩基置換(single nucleotide variant)やINDELの他、感染症や多因子疾患に対するGWAS解析で得られたSNPセットやHLAアリル頻度情報も収載している。

ClinVar

米国NCBI(National Center for Biotechnology Information)により運用される世界的に広く用いられている疾患とゲノムバリアントの関連性を収載した公開データベース。米国の遺伝子検査会社などから提供される膨大な数のバリアントが収載されている。

パスウェイ

遺伝子や、タンパク質・化合物などの様々な生体分子の関係性を表現したもの。

Gene Expression Omnibus

米国NCBIが運用する遺伝子発現データを収載しているデータベースです。主にマイクロアレイ実験やRNA-Seqなど、ハイスループットな実験により得られた機能ゲノムデータが蓄積されている。

CTOS法(Cancer Tissue-Originated Spheroid)

純度の高い患者がん組織由来がん細胞塊を高効率に得ることができる細胞培養法

➁  インシリコ心疾患データベースの公開と応用

hfpEF (Heart failure with preserved ejection fraction)

駆出率(ejection fraction)で評価される拍出機能が保たれた心不全、老化に伴う心筋細胞変化、組織線維化などが関係しているとされるが、有効な治療法がないため高齢化社会における大きな健康問題となっている。

➂  創薬DXプラットフォームを用いた実践的創薬

インシリコスクリーニング

標的とするタンパク質と化合物の分子構造データを元に、コンピュータ解析により医薬品候補化合物を探索する手法

ドラッグリポジションニング

既存薬再開発ともいい、既存のある疾患に有効な治療薬から、別の疾患に有効な薬効を見つけ出す創薬戦略。

ドッキング計算

結晶構造解析などから得られたタンパク質構造に対して様々な方向から化合物を当てはめ、両者の適合度を評価する。シミュレーションの間タンパク質はほとんど動くことができず、更に溶媒を連続体モデルで近似しているため、MDシミュレーションと比べると計算コストは小さい。

分子動力学(MD)シミュレーション

分子(群)を構成する原子を「質量を持つ粒子」とみなし、古典力学の運動方程式を解くことで原子位置の経時変化を計算する手法。これにより、分子構造の時間変化をシミュレーションする事が可能である。

ColDock法

Concentrated ligand Dockingの略。高濃度リガンド条件で溶媒を露に含めた全原子分子動力学計算を行うことで、タンパク質上のリガンド結合位置を正確に予測するシミュレーション法

MP-CAFEE法

標的タンパク質と低分子量有機化合物の結合親和性(結合自由エネルギー)を大規模分子動力学シミュレーションによって精密に計算する手法。医薬品候補が複数ある場合に、結合親和性計算を通して薬効の高い化合物を予測する事が出来るとともに、低分子有機化合物が介在したタンパク質活性化・制御の分子メカニズムの解明に役立つ。

マルチカノニカル分子動力学法(McMD)

マルチカノニカル分子動力学法は、幅広い温度領域においてフラットなエネルギー分布を持つ人工的なアンサンブルを得るための手法である。エネルギーの状態密度を評価するためのpre-runと、構造を探索するためのproductive-runから成る。マルチカノニカル法は、幅広い構造空間の探索が可能であることや、任意の温度のカノニカルアンサンブルを生成する利点があるため、常温の自由エネルギー地形を平均力ポテンシャルとして算出する事ができ、最安定の蛋白質-化合物の結合ポーズを予測できる。

ChemTS

強化学習の一種であるモンテカルロ木探索を用いることで、目的の性質を持つ分子を設計する手法。タンパクと小分子のドッキングシミュレーションなどを評価指標とすることで、目的のタンパクと結合する分子の探索が可能になる。また、木探索を行うため、学習のために用いたデータベースに入っていない新規な分子の設計が可能である。

Graph convolutional network(GCN)

深層学習方法の1種であり、グラフ構造データを入力に取り、ニューラルネットワークとして扱うことができるような手法。画像分類問題に大きなブレイクスルーをもたらしたConvolutional neural network (CNN)は画像データに対して畳み込み処理をする一方、GCNはグラフ構造に対して畳み込み処理を行う。

➃  インシリコ心毒性評価システムによる抗がん剤服用患者の安全性確保およびシステムの高精度化

hERG チャネル

遅延整流性カリウム電流の早い成分を担うイオンチャネルで、多くの低分子化合物と結合して抑制されるため薬剤誘発性不整脈の原因となる頻度が高い。ショウジョウバエにおいて見出されたether-a-go-go遺伝子のヒトホモログによってコードされることからhuman ether-a-go-go Related Geneチャネルと呼ばれる。

➄  遺伝子と臓器を結ぶ究極のマルチスケール心臓シミュレーション

CafeMol

粗視化分子モデル計算により大規模生体分子の長時間シミュレーションを行うソフトウェア。タンパク質についてはアミノ酸1個をCαに中心を置くひとつのビーズで表す。ポテンシャルエネルギーは、郷モデルという「整合性原理」を発展させた「フラストレーション最小の原理」に基づいている。

ソフトウェアパイプライニング

命令レベルで並列性を高める最適化技術の一つ。プログラムのループ処理内の命令列を CPU の演算器が効率的に処理できるように並び替えることで演算機の待ち時間を削減し、処理全体の実行時間を短縮する技術。

肥大型心筋症

高血圧、弁膜症などの原因なしに心室壁の肥大を呈し、不整脈による突然死、心不全などを生じる疾患、ミオシン、ミオシン結合タンパクCなどのサルコメアを構成するタンパクの突然変異が主な原因とされるが、発症にいたるメカニズム、有効な治療法などは未だ不明な点が多い。

ミオシン結合タンパクC

サルコメアの構造タンパクでミオシンを中心とした太いフィラメントに周期的に結合しておりミオシンだけでなく細いフィラメントのアクチンとも結合することでアクチンミオシン間の相互作用を調節している。肥大型心筋症の原因としてはミオシンに次ぐ頻度が報告されている。

レバーアーム

ミオシン分子の頭部(subfragment 1)の中でATPの加水分解を行うモータードメインに続く一見棒状に見える部分を指す。X-線回折による構造解析ではATPの分解状態に応じてこの部分がモータードメインに対して角度を変えることが示されており筋収縮のメカニズムを説明すると考えられている。

➅  MD×AIに基づく次世代創薬計算技術開発

MAVS (MDxAI-based Virtual Screening)

効率的な結合親和性推定に有効な超音波MD、ColDock等を基盤とし、強化学習・ベイズ最適化等による高速化機構を備えた大規模な仮想スクリーニング手法。

MADD (MDxAI-based Drug Design)

分子シミュレーションに基づく生成分子の評価のためのフィードバック機構を備えた、生成モデルに基づく分子デザイン手法。分子生成モデルとして、強化学習に基づく分子生成手法ChemTSや3次元構造を扱う生成手法を扱う。

強化学習

人間よりも強い囲碁プログラムAlphaGoなどでも用いられている機械学習手法の一つで、正解データを与えて学習(教師あり学習)するのではなく、自ら試行錯誤してより良い解を自動的に探索・学習する枠組み。試行錯誤の際に、分子シミュレーションによる計算結果を利用することで、より活性の高い分子の効率的な探索が可能になる。

ベイズ最適化

ガウス過程回帰を用いることで既知のデータから予測モデルを学習しつつ、可能な限り少ない試行回数で効率よく最も良い候補を探索する最適化手法の一つ。ここでは、可能な限り分子シミュレーションによる評価回数を少なくしつつ、最も結合親和性の高い薬剤候補等を探索する状況等を想定している。

➆  ニューモダリティ(中分子、高分子)創薬のための創薬計算手法開発

GENESIS 2.0 beta

理化学研究所の杉田グループが中心に開発している分子動力学シミュレーションソフトウェア。独自の高速化機能により大規模な並列計算が可能。version 2.0 betaは「富岳」に最適化されている。全原子、粗視化、QM/MMのモデルが導入され、幅広い規模やマルチスケールのシミュレーションが可能。さらにレプリカ交換などの拡張アンサンブル法も導入され、大きい構造変化やタンパク質-リガンドの結合過程を効率的に再現できる。

GROMACS

分子動力学シミュレーションエンジン及び関連する解析をまとめたパッケージ。世界中の研究者に利用されていおり、プラグインや拡張の開発も盛んである。

gREST (generalized Replica-Exchange with Solute Tempering)

レプリカ交換分子動力学シミュレーション法の一つ。系の一部(solute、例:タンパク質-ペプチドの結合サイト周辺)の有効温度を上げ、高温のレプリカを交換させることにより構造探索効率を上げることができる。タンパク質-ペプチドの結合過程など、従来MD法では再現がとても難しい過程の再現ができる。

REUS (Replica-Exchange Umbrella Sampling)

レプリカ交換分子動力学シミュレーション法の一つ。タンパク質-ペプチドの距離空間内でレプリカを交換させることで結合経路を再現できる。

PaCS-MD(Parallel Cascade Selection Molecular Dynamics)

並列カスケード選択分子動力学(Parallel Cascade Selection Molecular Dynamics, PaCS-MD)は、比較的短いMD計算を並列で実行し、得られたトラジェクトリの中から目的の構造に近い構造を複数選び、新たな原子速度を与えて、再度MDを複数並列で行うことを繰り返すという、比較的単純なシミュレーション方法である。 これを拡張させたassociation/dissociation PaCS-MD(a/dPaCS-MD)は、複合体内の各成分の相対運動をモニターし、解離イベントまたは会合イベントに向けてシミュレーションを駆動することで結合解離過程を調べられる。具体的には、相互拡散係数と重心間距離をモニターする。

PROTAC (Proteolysis Targeting Chimera)

E3ユビキチンリガーゼと標的タンパク質を認識するリガンド部位と、それらを繋ぐリンカーで構成される機能性分子である。PROTACは、疾病の原因となる標的タンパク質のユビキチン化を誘導することによってプロテアソームを作用させ、標的タンパク質を細胞内から除去する新たな創薬モダリティとして注目されている。

➇  大規模生体系ネットワーク処理技術開発

グラフニューラルネットワーク

グラフ構造を入力もしくは出力にとるニューラルネットワーク。ここでは、遺伝子間の関係や生体分子の関係などの生体ネットワークをグラフとしてとらえ、それを扱うニューラルネットワークである。他のニューラルネットワーク技術と同様に近年の深層学習技術と組み合わせて多くのタスクで高い精度を達成している。

kGCN

グラフニューラルネットワークニューラルネットワークを医療創薬AIアプリケーション向けに開発したツールである。

ベイジアンネットワーク

確率的な関係を有向非巡回グラフ構造として記述するするモデルである。連続的なデータを扱うことができるベイジアンネットワークには線形性を仮定した線形ベイジアンネットワークと非線形の関係も扱うことができる非線形ベイジアンネットワークがある。

INGOR

大規模非線形ベイジアンネットワークのネットワーク構造を遺伝子発現などの高次元データから推定するために開発したツールである。