ページの先頭です

機械学習とドラッグデザイン

2022年4月4日 サイエンスソリューション部 石田 純一

抗ウィルス薬開発への期待

コロナ禍の今、ウィルスに打ち勝つための薬剤の開発が世界中の人々の一大関心事となっている。中国武漢における初の症例報告からわずか一年たらずでPfizer社がワクチンの開発に成功し、重傷者数の低減という目に見える形で成果を上げた。時を置かずに複数の製薬メーカーがワクチンの開発に成功し、さらに経口治療薬まで登場した。一方でウィルスは変異によりその素性を変え続けており、人類とCOVID-19の戦いは2022年3月現在未だ収束していない。マスクのないかつての日常生活を取り戻すためにも、抗ウィルス薬の開発は今後も継続して進められるであろう。

COVID-19に限らず、様々なウィルス・疾病に対処するために世界中の研究機関で創薬研究が行われているが、それには一般に莫大な開発予算と長期の開発期間が必要となる。近年は開発工程を効率化するために、医薬品化合物設計(ドラッグデザイン)に機械学習を活用する新たな潮流が生まれている。本稿では、機械学習とドラッグデザインと題して、主要な研究開発動向を紹介したい。

機械学習とドラッグデザイン

ドラッグデザインにおいて、特に重要となるのは体内やウィルス等に含まれる標的高分子の同定と、その働きを活性化、又は阻害するための標的分子-医薬品化合物の結合のしかた(ドッキング)の解析である。近年は機械学習をドッキングシミュレーションに活用する事例が増えており、生体分子の構造をニューラルネットワークを用いて数値化し、結合の強さを高精度で予測するなど、さまざまな技術開発が進められている。さらに、標的分子と薬剤分子の結合のしかただけでなく、時間経過に応じて薬剤が生体内でどのような振る舞いをするか、動的挙動を解析することも重要である。そのような解析には一般に分子動力学計算と呼ばれる手法が用いられることが多いが、計算精度と計算速度にはトレードオフの関係があることが知られている。そこで、計算の律速段階である各分子に働く力の計算に高精度な機械学習モデルを活用することで、計算速度と計算精度を両立させようとする試み(機械学習分子動力学計算)がここ数年で大きな潮流となっている*1

これらの機械学習技術の恩恵を受けるためには、大規模な化合物データセットの存在が前提となる。chEMBL, RCSB PDB等の著名なデータベースが頻繁に活用されるが、ここでは日本の北浦・諸熊らによって発明されたフラグメント分子軌道(Fragment Molecular Orbital, FMO)法を用いた世界初のデータベースFMO Database(FMODB)を紹介する。FMO法は生体分子のような数万個の原子を含む大規模な化合物を、フラグメントと呼ばれる小片に分割することで効率的に量子化学計算することを可能にした技術である。FMO法を用いることで、巨大な高分子でも現実的な時間内に系の全エネルギーやフラグメント間の相互作用を高精度で予測することができる。星薬科大学福澤准教授らによって開発が進められるFMODBはFMO計算結果を集積した構造と物性値に関する巨大データベースであり、2022年3月現在登録件数は1万件を超えている*2。これらのデータを活用することで、機械学習によるドッキングの結合親和性予測や分子動力学シミュレーションの高速化が可能となることが期待されており、今後の展開が注目される。

上述のFMO法をはじめ、多くのシミュレーションや機械学習技術は入力データとして化合物の構造情報を必要とする。しかし、構造が複雑なたんぱく質は一次情報であるアミノ酸配列が得られても構造が解けないという事例が決して少なくない。そのためアミノ酸配列を入力とした立体構造予測は、生物学における聖杯の1つであった。この難問に、機械学習を用いて正解に限りなく近い解答を与えたのがDeepMind社が2018年に開発し2021年にオープンソース化したAlphaFold及びAlphaFold2である。後者のモデルはアミノ酸の配列情報から結晶構造を予測する大会CASP14において、平均RMSD(Root Mean Squared Displacement, 予測構造の正解構造への近さを表す指標)約1.6Åという驚くべき精度で立体構造を予想してみせた*3。これは生物学における革命的な出来事と言え、実際、Science誌が選ぶ2021年のBreakthrough of the Yearには「AIによるたんぱく質予測」が選定された*4。AlphaFoldによって予測されたヒトプロテオーム及びその他の重要なたんぱく質の情報はオープンデータベース化されており(AlphaFold Protein Structure Database)、機械学習をはじめ今後多くの研究開発を誘発することになるだろう*5

おわりに

以上、ドラッグデザインに直接関係するドッキング、分子動力学計算への機械学習技術の適用事例や、それを支えるデータベース、構造を予測するための機械学習技術について概観した。新規の機械学習モデルの報告やデータベース拡張は日々継続的に進められており、今後の創薬の現場においてなくてはならない技術としてその重要性は増していくことだろう。もちろん、コンピュータ上で予測された医薬品候補化合物が実際に合成可能できるとは限らないし、核酸医薬への適用や人体への副作用の予測など乗り越えるべき課題は多い。しかしながら、新薬創成というか細い糸を手繰り寄せるためには、これらの技術は研究者にとっての力強い武器となるだろう。

  1. *1Gao, Xiang, et al. "TorchANI: a free and open source PyTorch-based deep learning implementation of the ANI neural network potentials." Journal of chemical information and modeling 60.7 (2020): 3408-3415.
  2. *2Takaya, Daisuke, et al. "FMODB: The world's first database of quantum mechanical calculations for biomacromolecules based on the fragment molecular orbital method." Journal of chemical information and modeling 61.2 (2021): 777-794.
  3. *3AlphaFold: a solution to a 50-year-old grand challenge in biology
  4. *4Science's 2021 Breakthrough of the Year
  5. *5AlphaFold Protein Structure Database

関連情報

この執筆者はこちらも執筆しています

2021年11月
データ駆動型材料開発の現在地とこれから
みずほリサーチ&テクノロジーズ コンサルティングレポート vol.1
ページの先頭へ