グラフ機械学習のヘルスケア分野への応用の最前線

こんにちは,株式会社Ridge-iのリサーチチームの@machinery81です. 今回はグラフデータを扱う機械学習のヘルスケア分野への応用のお話を紹介します.

TL;DR

機械学習データマイニングの応用先としてのヘルスケア分野

機械学習の適用先としてヘルスケアの分野には解くべき課題が数多く存在します. 直近の話で言うと,世界的な感染症として広まったCOVID-19に関連する論文の本数は,2020年の夏時点で急激な伸びを見せており,今現在も増え続けています.

PubMedにおけるCOVID-19関連の論文数の推移

f:id:Ridge-i_Jinguuji:20210114111738p:plain
Photo by Wang, Qingyun, Manling Li, Xuan Wang, Nikolaus Parulian, Guangxing Han, Jiawei Ma, Jingxuan Tu, et al. 2020. “COVID-19 Literature Knowledge Graph Construction and Drug Repurposing Report Generation.” arXiv [cs.CL]. arXiv. http://arxiv.org/abs/2007.00576.

万能薬から精密医療へ

f:id:Ridge-i_Jinguuji:20210114112005p:plain
Photo by Kohler, Stefan. "Precision medicine–moving away from one-size-fits-all." Quest 14.3 (2018): 12-15.

従来までは,一つの疾病につき一つの薬で治療を達成できることが理想とされていましたが,今となってはよく知られているように,このアプローチは非現実的とされています.これは例えば,

  • 体調や生活習慣
  • 患者の体質と疾病との相性
  • 過去の罹患歴

など,患者特有の属性が複雑に影響することに起因します. このように患者ごとに適切な治療を行うことで症状の改善を試みるアプローチは精密治療(Precision medicine)と呼ばれます. 精密治療のためには,疾病,薬そして患者についての正しい理解が非常に大切になります.

電子カルテ

f:id:Ridge-i_Jinguuji:20210114112053j:plain
Photo by Jensen, Peter B., Lars J. Jensen, and Søren Brunak. 2012. “Mining Electronic Health Records: Towards Better Research Applications and Clinical Care.” Nature Reviews. Genetics 13 (6): 395–405.

患者のデータ分析のための有望なデータソースとしては電子カルテ(Electronic Health Record:EHR)が挙げられます. 電子カルテデータは例えば,

  • 投薬量と処方日など,標準化されたePrescriptionシステムから取得できる構造化データ
  • 処方の背景にある,医学的理由を説明する臨床経過などの非構造化データ

などを含んでいます.

このように複数の構成要素からなるデータの取り扱いは難しく,世界的な統一化はいまだ課題となっています.

創薬

創薬から市場に出るまでのプロセスには,平均で10億ドル以上の費用がかかり,期間にして12年以上かかることもあります[DiMasi et al, 2016, Steedman et al, 2019]. これを受けて,現在では創薬・開発パイプラインの様々な部分の迅速化が非常に重要な課題となっています.

f:id:Ridge-i_Jinguuji:20210114112207p:plain
Photo by Wang, Fei, Peng Cui, Jian Pei, Yangqiu Song, and Chengxi Zang. 2020. “Recent Advances on Graph Analytics and Its Applications in Healthcare.” In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 3545–46. KDD ’20. New York, NY, USA: Association for Computing Machinery.

特に分子構造はそのままグラフとして解釈でき,大量のパターンの小規模なグラフを扱うような手法の適用先として有望です.

患者調査

患者調査(Patient Survey)の結果も重要なデータマイニングの応用先になっています. 特に,患者満足度調査の結果は病院の質についての特徴付けに活用できる可能性があります.これは単に病院の対応やサービスの良し悪しの評価だけに止まらず,どこの病院で人員が不足している可能性があるか,病院の規模と実際の患者数とのギャップはどれだけあるかといった問題を解決することにもつながります.

選択式のアンケートであればある程度構造化されたデータとして処理し,自由記述式であれば自然言語処理の技術を応用して機械的に処理できる形へ変換するなど,様々な要素技術が求められる対象ですが,その有用性はとても高いです.

f:id:Ridge-i_Jinguuji:20210114112259p:plain
Photo by Wang, Fei, Peng Cui, Jian Pei, Yangqiu Song, and Chengxi Zang. 2020. “Recent Advances on Graph Analytics and Its Applications in Healthcare.” In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 3545–46. KDD ’20. New York, NY, USA: Association for Computing Machinery.

ヘルスケア分野を繋ぐグラフマイニング

このような,それぞれが属性を持った複雑なデータ間の特性を分析するための強力なツールとして,グラフ解析が挙げられます.

f:id:Ridge-i_Jinguuji:20210114112413j:plain
Photo by Wang, Fei, Peng Cui, Jian Pei, Yangqiu Song, and Chengxi Zang. 2020. “Recent Advances on Graph Analytics and Its Applications in Healthcare.” In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 3545–46. KDD ’20. New York, NY, USA: Association for Computing Machinery.

グラフ上の機械学習

まず初めに,グラフデータに対して機械学習を適用する代表的な手法群について紹介します.グラフ上で動作するほとんどの機械学習手法は,以下の2つのコンポーネントに分解することができます:

  • 汎用エンコーダ:グラフのノードやエッジ,またはグラフ自体を低次元の特徴空間に埋め込みます.グラフ全体を埋め込むには,まずノードを埋め込み,次に順列不変のプーリング関数を適用してグラフレベルの表現(ノード埋め込みの合計、最大値、または平均値など)を生成するのが一般的です.
  • タスク特有のデコーダ:タスクを解くのに必要な出力を生成します.

これら2つのコンポーネントを2-stepで行うのか,End-to-Endで行うのかといった分類も考えられます.

古典的なアプローチ

グラフの統計量に基づく手法

従来は,グラフとそのノードを特徴づけるためのヒューリスティックスや統計量が考案されてきました. 例えば,様々な中心性指標は,グラフの接続性の表現としてある程度妥当であると考えられます.中心性指標の例としては以下のようなものが存在します:

  • 近接中心性(closeness centrality):あるノードが他のすべてのノードとどれだけ密接に接続されているかを定量
  • 媒介中心性(betweeness centrality):あるノードがどれだけ他のノード間の最短距離に位置するかを定量

一方で,グラフの部分構造を利用して,それぞれのノードの周辺のパターンを記述することも考えられます.例としては,モチーフ [Milo et al, 2002]やグラフレット [Pržulj et al, 2004]といったものがそれに該当します.

これらのハンドクラフトな特徴量は機械学習アルゴリズムの入力として使用することができるノードまたはグラフの表現となっています. 特にグラフ統計量に基づくカーネル を用いたSVMSupport Vector Machine)の手法は多く提案されており,graphlet kernel [Shervashidze et al, 2009]やWL kernel [Shervashidze et al, 2011]などが該当します.

ランダムウォークに基づく手法

ランダムウォークに基づく手法は,ノードの近接性を維持するようにグラフのノードを低次元空間に埋め込むアプローチとして主要なものであり,多くのタスクで良い結果をもたらしています.

基礎となるアイディアは,埋め込み空間におけるノード表現間の距離は,グラフ上の距離の尺度に対応しているべきというもので,ここでグラフ上の距離は与えられたノードが別のノードから始まるランダムウォークでどれだけの頻度で訪問されるかによって測定されるというものです.

DeepWalk [Perozzi et al, 2014]とnode2vec [Grover et al, 2016] のは,この手法群の中で最も有名な手法とされています. 具体的には,DeepWalkはグラフの各ノードに対して複数のランダムウォークをシミュレートします.次に,あるノード v_i の埋め込みベクトル x^{v}_{i} について,ランダムウォーク中に出現するすべてのノード v_j に対する対数尤度 \log{p(v_{j} | x^{v}_{i})} が最大になるように学習を行います.この手法は,自然言語処理のために開発されたSkipGramモデル(word2vec)[Mikolov et al, 2013]からインスパイアされています.

f:id:Ridge-i_Jinguuji:20210114112531p:plain
Photo by Tomas Mikolov, Kai Chen, Greg Corrado, and Jeffrey Dean. 2013. Efficient estimation of word representations in vector space. arXiv preprint arXiv:1301.3781 (2013).

DeepWalkでは一様なランダムウォークを行いますが,node2vecを含む後続の研究では,バイアスをかけたランダムウォークによってより高品質な埋め込みベクトルが獲得できることを報告しています.

行列因子分解/テンソル因子分解に基づく手法

行列因数分解は,ある行列 X  n 個の低次元の潜在因子 F_i \ (i=1,\dots,n) の積で表現する問題で,一般的には次のように書かれます:

 \displaystyle
F^*_1, \dots, F^*_n = argmin_{F_1, \dots, F_n} \Delta \Big(X, \prod^n_{i=1}F_i\Big).

ここで \Delta(\cdot, \cdot ) ユークリッド距離やKL-divergenceのような2つの入力の乖離度合いの指標です.

グラフの場合は,この問題はは隣接行列 A または隣接行列の微分ラプラシアン行列など)を因数分解する問題に落ちます. これは,ユーザ定義の制約(例えば、潜在空間次元)の下で,グラフ内のすべてのエンティティの埋め込みを,内積の下で隣接関係が維持されるような低次元上で見つけることとみなせます.

代表的な手法としてはLaplacian eigenmaps [Belkin et al, 2002]や RESCAL [Nickel et al, 2011]などが存在します.

Graph Neural Network

Graph Neural Network(GNN)は1990年代後半に登場しましたが [Sperduti et al, 1997],近年非常に注目を集めており,そのバリエーションは着実に増えています.

典型的なGNNのレイヤーは以下の3つの関数からなります:

  • message passing function(MSG):エッジを介したノード間の情報交換を可能にする関数.単純な線形変換など.
  • aggregation function(Agg):受け取ったメッセージ集合を単一の固定長の表現に結合する関数.算術平均,加重平均など.
  • update function(Update):以前までの埋め込みと集約された表現からノードレベルの埋め込みを生成する関数.多層パーセプトロンなど.

以上のコンポーネントは, t 番目のレイヤー以降のノード表現を h^{(t)} とすると,

 \displaystyle
h^{(t+1)}_i = Update \Big( h^{(t)}_i, Agg(msg_{ji}, j \in \mathcal{N}_i) \Big)

と書くことができます.

f:id:Ridge-i_Jinguuji:20210114112629p:plain

Graph Convolutional Network

Graph Convolutional Network (GCN)[Kipf et al, 2016]の各コンポーネントを,上記のフレームワークにのっとって書くと,

  •  msg_{j}=W^{(t)}h^{(t)}_j
  •  Agg(\dots)= \sum_{i \in \mathcal{N}_i} \frac{1}{\sqrt{d_i d_j}} msg_{j}
  •  Update(\dots)=\sigma\Big(\frac{1}{d_i}W^{(t)}h^{(t)}_i+agg_i\Big)

となります. \sigma はReLUなどの活性化関数です. さらに自己ループの追加を考慮し,隣接行列を \hat{A}= A+I と修正すると,Update関数の部分は以下のような単純な形で書き直すことができます.

 \displaystyle
Update(\dots) = \sigma(agg_i)

埋め込みの更新はノードの局所近傍にのみ依存するため,これらは一般的にneighborhood aggregationとも呼ばれています。 実際,

  • 単層GNNはノードの直近または1-hop近傍に基づいてノードの埋め込みを更新
  • 2層のGNNは中間近傍を介して2-hop近傍までの情報を伝達可能

といったように,層を積むことでより遠くの情報を埋め込むことができます.

f:id:Ridge-i_Jinguuji:20210114112712p:plain

創薬分野へのグラフデータの応用

上述したように,創薬のプロセスは非常に長い時間がかかってしまうため,このプロセスを機械学習などの適用によって効率化することは非常に意義のあるタスクとなっています.

医薬品設計は大きく分けて、標的ベース創薬と表現型創薬(Phenotypic drug discovery;PDD)の2つのカテゴリーに分類されます.これらを簡単に要約すると,

  • 標的ベース創薬:疾患の特定の一つの標的を狙って創薬
  • 表現型創薬:疾患そのものに効く化合物を探索

となります. 特に後者の表現型創薬は医薬品設計の新しいパラダイムとして,コストを大幅に削減と生産性の向上が期待されています. しかしながら,表現型創薬で発見される医薬品は一般に,標的指向の薬剤と比較して安全性のリスクが高いことが懸念されています.

そのような2つの方向性のメリットとデメリットを踏まえた上で,以下ではグラフ上の機械学習がどのように創薬に応用できるのかを紹介します.

ターゲットの識別

ターゲットベース創薬の一つのステップとして,疾患の病態生理において重要な機能的役割を持つ分子ターゲットを発見するという問題があります.最終的には,こうして見つかった重要な役割を持つ分子を利用して,有益な薬剤を創出することが目標となります. 初期のターゲットは,Gタンパク質共役受容体(GPCR),キナーゼ,プロテアーゼなどがあり,ファーストインクラス(画期的)医薬品の中でも主要なターゲットタンパク質群を形成してきました.

f:id:Ridge-i_Jinguuji:20210114112839p:plain

グラフ機械学習をtarget identificationに利用した代表的な研究には[Pittala et al, 2020]があります.この研究では,知識グラフのリンク予測に基づく手法ががOpen Targetsの既存アルゴリズムを凌駕し,パーキンソン病臨床試験中に薬剤標的を再発見するために使用されました.

分子特性予測

製薬会社は,特定のターゲットに対して何百万もの低分子をスクリーニングすることがあります.特に,不均一な化学的性質を持つ分子を選択することは重要なタスクであり,これをグラフ機械学習で解く流れがあります.有名なベンチマークデータセットとしては,QM9MD17などがあります.

例えば,[Duvenaud et al, 2015]は医薬品のグラフ表現を使用することで,分子特性予測タスクにおいて,非グラフベースのアプローチに比べて大幅に精度を改善できることを示しました.具体的には,著者らはGNNを用いて各薬品を埋め込み表現を学習し,多様なベンチマークデータセットでモデルの予測能力を検証しています.

また,[Schutt et al, 2018]は,原子間距離をエッジの重みとした重み付き完全連結グラフとして扱い分子を特徴づけるモデルであるSchNetを提案しています.

グラフマイニングによる既存薬再開発

ドラッグリポジショニング(英: drug repositioning)または既存薬再開発とは、既存のある疾患に有効な治療薬から、別の疾患に有効な薬効を見つけ出すことである。ドラッグリポジショニングに使われる医薬品は、すでにヒトでの安全性や薬物動態の試験が済んでいるため、いくつかの試験をスキップでき、また薬剤の製造方法が確立しているため開発期間の短縮・研究開発コストを低減できる。しかし、その一方で目的とした効能以外での副作用の可能性も捨てきれない。高騰し続ける医薬品の価格の抑制に期待される

出典: フリー百科事典『ウィキペディアWikipedia)』

臨床試験に到達した薬剤のうち,FDAの承認を得たのはわずか12%であることを考えると,既存薬再開発はその期間が短く,創薬の初期段階がすでに完了しているものほど成功率が高くなる可能性が高いため非常に有望であると言えます.

薬品と疾患の相互作用の分析

薬品と疾患の未知の相互作用を特定するために,様々な手法が提案されています.

[Torng et al, 2019]は,薬をそれを構成するタンパク質の結合ポケットで特徴付けることに注目しました.薬は分子構造とタンパク質の結合ポケットで表現され,そのように作ったグラフについてGraph Convolutional Networkを適用しています.

また,[Nascimento et al, 2016]は,この問題を薬とタンパク質の紐付けで作られる二部グラフのリンク予測問題として扱うKronRLS-MKLと呼ばれる手法を提案しました. [Crichton et al, 2018]はこれと同じ問題設定で,グラフ表現学習の既存の手法であるDeepWalkやnode2vecを採用しています.

Combination repurposing

配合薬は,複雑な病因や治療抵抗性が進化的な要素を持つ感染症のような疾患に特に有効とされています.もし相乗効果のある薬が見つかれば,有効性を改善しながら用量を減らすことも可能です. しかしながら,総当たりで薬の組み合わせを探索することは現実的には不可能であり,なんらかの”あたり”をつける方法が望ましいことは想像に難くありません.

f:id:Ridge-i_Jinguuji:20210114112931p:plain
Photo by Andreea Deac, Yu-Hsiang Huang, Petar Veličković, Pietro Liò, and Jian Tang. 2019. Drug-drug adverse effect prediction with graph co-attention. arXiv preprint arXiv:1905.00534 (2019).

グラフ機械学習を用いた最初の併用療法モデルの研究にDECAGON [Zitnik et al, 2018]があります.この手法ではPPI相互作用に加えて,薬物-副作用-薬物のトリプレットを捉えたマルチモーダルグラフを介してポリファーマシー(有害な多剤併用)のモデル化をしました. 対照的に,[Deac et al, 2019]は,知識グラフを取り入れずに薬物構造を直接モデル化して,同程度の精度を達成できると報告しています.

今後の見通し

COVID19という未曾有の世界的な健康危機に対処するために,2021年1月時点で,複数の研究グループがSARS-CoV-2の治療に再利用できる薬剤を特定するためのグラフベースのアプローチを模索してきました [Ioannidis et al, 2020, Morselli et al, 2020, Zeng et al, 2020, Zhou et al, 2020].

例えば[Morselli et al, 2020]は,3つの異なるグラフベース手法を組み合わせたアンサンブルアプローチによってこの問題に取り組んでいます. また、[Zeng et al, 2020]はRotatE [Zhiqing et al, 2018]という知識グラフの埋め込み手法を用いています.ここで取り扱った知識グラフは複数のデータソースから構築され,薬剤、疾患、遺伝子、解剖学などのエンティティ間の多様な関係を捉えた大規模なものです.著者たちはこの知識グラフから,SARS-CoV-2を治療するための再利用可能性を探っています.

f:id:Ridge-i_Jinguuji:20210114113032p:plain
Photo by Xiangxiang Zeng, Xiang Song, Tengfei Ma, Xiaoqin Pan, Yadi Zhou, Yuan Hou, Zheng Zhang, Kenli Li, George Karypis, and Feixiong Cheng. 2020. Repurpose Open Data to Discover Therapeutics for COVID-19 using Deep Learning. Journal of Proteome Research (2020).

希少疾患の分野では,[Sosa et al, 2019]によって希少疾患の再利用仮説を特定するための知識グラフ埋め込みのアプローチが提案されています.著者たちはこの問題を知識グラフ上のリンク予測の問題に置き換えて,Graph Networkによる解決を試みています.

既存薬再開発は,今後数年のうちに新しい治療法につながる可能性のあるグラフ機械学習の最初のユースケースとして実証されてきていると言えるでしょう.

その他の話題

f:id:Ridge-i_Jinguuji:20210114113113p:plain
Photo by Wang, Qingyun, Manling Li, Xuan Wang, Nikolaus Parulian, Guangxing Han, Jiawei Ma, Jingxuan Tu, et al. 2020. “COVID-19 Literature Knowledge Graph Construction and Drug Repurposing Report Generation.” arXiv [cs.CL]. arXiv. http://arxiv.org/abs/2007.00576.

  • 知識グラフマイニングを医薬品の推薦システムに応用
  • 医療の現場におけるQuestion Answeringタスクへの知識グラフの適用
  • 感染症のもたらす社会への影響をSNSから生成したユーザ間グラフから分析

さいごに

Ridge-iでは様々なポジションで積極採用中です. カジュアル面談も可能ですので,ご興味がある方は是非ご連絡ください.

ridge-i.com

参考文献

  • Kohler, S. 2018. “Precision Medicine–moving Away from One-Size-Fits-All.” Quest . https://journals.co.za/content/journal/10520/EJC-1149fa51c7?crawler=true&mimetype=application/pdf.
  • Collins, Francis S., and Harold Varmus. 2015. “A New Initiative on Precision Medicine.” The New England Journal of Medicine 372 (9): 793–95.
  • Hawgood, Sam, India G. Hook-Barnard, Theresa C. O’Brien, and Keith R. Yamamoto. 2015. “Precision Medicine: Beyond the Inflection Point.” Science Translational Medicine 7 (300): 300ps17.
  • Jensen, Peter B., Lars J. Jensen, and Søren Brunak. 2012. “Mining Electronic Health Records: Towards Better Research Applications and Clinical Care.” Nature Reviews. Genetics 13 (6): 395–405.
  • Parks, Jerry M., and Jeremy C. Smith. 2020. “How to Discover Antiviral Drugs Quickly.” The New England Journal of Medicine 382 (23): 2261–64.
  • Wang, Qingyun, Manling Li, Xuan Wang, Nikolaus Parulian, Guangxing Han, Jiawei Ma, Jingxuan Tu, et al. 2020. “COVID-19 Literature Knowledge Graph Construction and Drug Repurposing Report Generation.” arXiv [cs.CL]. arXiv. http://arxiv.org/abs/2007.00576.
  • Wang, Fei, Peng Cui, Jian Pei, Yangqiu Song, and Chengxi Zang. 2020. “Recent Advances on Graph Analytics and Its Applications in Healthcare.” In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 3545–46. KDD ’20. New York, NY, USA: Association for Computing Machinery.
  • Zhavoronkov, Alex, Yan A. Ivanenkov, Alex Aliper, Mark S. Veselov, Vladimir A. Aladinskiy, Anastasiya V. Aladinskaya, Victor A. Terentiev, et al. 2019. “Deep Learning Enables Rapid Identification of Potent DDR1 Kinase Inhibitors.” Nature Biotechnology 37 (9): 1038–40.
  • Joseph A DiMasi, Henry G Grabowski, and Ronald W Hansen. 2016. Innovation in the pharmaceutical industry: new estimates of R&D costs. Journal of Health Economics 47 (2016), 20–33.
  • Mark Steedman and Karen Taylor. 2019. Ten years on - Measuring return from pharmaceutical innovation 2019. Technical Report.
  • Ron Milo, Shai Shen-Orr, Shalev Itzkovitz, Nadav Kashtan, Dmitri Chklovskii, and Uri Alon. 2002. Network motifs: simple building blocks of complex networks. Science 298, 5594 (2002), 824–827.
  • Natasa Pržulj, Derek G Corneil, and Igor Jurisica. 2004. Modeling interactome: scale-free or geometric? Bioinformatics 20, 18 (2004), 3508–3515.
  • Nino Shervashidze, SVN Vishwanathan, Tobias Petri, Kurt Mehlhorn, and Karsten Borgwardt. 2009. Efficient graphlet kernels for large graph comparison. In Artificial Intelligence and Statistics. 488–495.
  • Nino Shervashidze, Pascal Schweitzer, Erik Jan Van Leeuwen, Kurt Mehlhorn, and Karsten M Borgwardt. 2011. Weisfeiler-lehman graph kernels. Journal of Machine Learning Research 12, 9 (2011).
  • Bryan Perozzi, Rami Al-Rfou, and Steven Skiena. 2014. Deepwalk: Online learning of social representations. In Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 701–710.
  • Aditya Grover and Jure Leskovec. 2016. node2vec: Scalable feature learning for networks. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 855–864.
  • Tomas Mikolov, Kai Chen, Greg Corrado, and Jeffrey Dean. 2013. Efficient estimation of word representations in vector space. arXiv preprint arXiv:1301.3781 (2013).
  • Mikhail Belkin and Partha Niyogi. 2002. Laplacian eigenmaps and spectral techniques for embedding and clustering. In Advances in neural information processing systems. 585–591.
  • Maximilian Nickel, Volker Tresp, and Hans-Peter Kriegel. 2011. A threeway model for collective learning on multi-relational data.. In International Conference on Learning Representations, Vol. 11. 809–816.
  • Alessandro Sperduti and Antonina Starita. 1997. Supervised neural networks for the classification of structures. IEEE Transactions on Neural Networks 8, 3 (1997), 714–735.
  • Thomas N Kipf and Max Welling. 2016. Semi-supervised classification with graph convolutional networks. arXiv preprint arXiv:1609.02907 (2016).
  • Petar Veličković, Guillem Cucurull, Arantxa Casanova, Adriana Romero, Pietro Liò, and Yoshua Bengio. 2018. Graph Attention Networks. In International Conference on Learning Representations.
  • Vassilis N Ioannidis, Da Zheng, and George Karypis. 2020. Few-shot link prediction via graph neural networks for Covid-19 drug-repurposing. arXiv preprint arXiv:2007.10261 (2020). * Deisy Morselli Gysi, Ítalo Do Valle, Marinka Zitnik, Asher Ameli, Xiao Gan, Onur Varol, Helia Sanchez, Rebecca Marlene Baron, Dina Ghiassian, Joseph Loscalzo, et al. 2020. Network Medicine Framework for Identifying Drug Repurposing Opportunities for COVID-19. arXiv (2020), arXiv–2004.
  • Xiangxiang Zeng, Xiang Song, Tengfei Ma, Xiaoqin Pan, Yadi Zhou, Yuan Hou, Zheng Zhang, Kenli Li, George Karypis, and Feixiong Cheng. 2020. Repurpose Open Data to Discover Therapeutics for COVID-19 using Deep Learning. Journal of Proteome Research (2020).
  • Yadi Zhou, Yuan Hou, Jiayu Shen, Yin Huang, William Martin, and Feixiong Cheng. 2020. Network-based drug repurposing for novel coronavirus 2019- nCoV/SARS-CoV-2. Cell Discovery 6, 1 (2020), 1–18.
  • Sun, Zhiqing, Zhi-Hong Deng, Jian-Yun Nie, and Jian Tang. 2018. “RotatE: Knowledge Graph Embedding by Relational Rotation in Complex Space.” Openreview.net › Forumopenreview.net › Forum. https://openreview.net/pdf?id=HkgEQnRqYQ.
  • Daniel N Sosa, Alexander Derry, Margaret Guo, Eric Wei, Connor Brinton, and Russ B Altman. 2019. A Literature-Based Knowledge Graph Embedding Method for Identifying Drug Repurposing Opportunities in Rare Diseases. bioRxiv (2019), 727925. * Marinka Zitnik, Monica Agrawal, and Jure Leskovec. 2018. Modeling polypharmacy side effects with graph convolutional networks. Bioinformatics 34, 13 (2018), i457–i466.
  • Andreea Deac, Yu-Hsiang Huang, Petar Veličković, Pietro Liò, and Jian Tang. 2019. Drug-drug adverse effect prediction with graph co-attention. arXiv preprint arXiv:1905.00534 (2019).
  • Wen Torng and Russ B Altman. 2019. Graph convolutional neural networks for predicting drug-target interactions. Journal of Chemical Information and Modeling 59, 10 (2019), 4131–4149.
  • André CA Nascimento, Ricardo BC Prudêncio, and Ivan G Costa. 2016. A multiple kernel learning algorithm for drug-target interaction prediction. BMC ‘Bioinformatics 17, 1 (2016), 46.
  • Gamal Crichton, Yufan Guo, Sampo Pyysalo, and Anna Korhonen. 2018. Neural networks for link prediction in realistic biomedical graphs: a multi-dimensional evaluation of graph embedding-based approaches. BMC Bioinformatics 19, 1 (2018), 176.
  • Srivamshi Pittala, William Koehler, Jonathan Deans, Daniel Salinas, Martin Bringmann, Katharina Sophia Volz, and Berk Kapicioglu. 2020. Relationweighted link prediction for disease gene identification. arXiv preprint arXiv:2011.05138 (2020).
  • David K Duvenaud, Dougal Maclaurin, Jorge Iparraguirre, Rafael Bombarell, Timothy Hirzel, Alán Aspuru-Guzik, and Ryan P Adams. 2015. Convolutional networks on graphs for learning molecular fingerprints. In Advances in Neural Information Processing Systems. 2224–2232.
  • Kristof T Schütt, Huziel E Sauceda, P-J Kindermans, Alexandre Tkatchenko, and K-R Müller. 2018. SchNet–A deep learning architecture for molecules and materials. The Journal of Chemical Physics 148, 24 (2018), 241722.
  • Wang, Qingyun, Manling Li, Xuan Wang, Nikolaus Parulian, Guangxing Han, Jiawei Ma, Jingxuan Tu, et al. 2020. “COVID-19 Literature Knowledge Graph Construction and Drug Repurposing Report Generation.” arXiv [cs.CL]. arXiv. http://arxiv.org/abs/2007.00576.