從神農嘗百草,到李時珍踏遍神州寫下《本草綱目》,他們無一不是在身體力行尋找治病救人的藥。如今,藥物的研發雖然不必行萬里路,卻也一樣要不斷的嘗試,持續的研發。
作為國內藥物研發創新的代表,星藥科技(Galixir)從2019年成立以來始終在使用尖端人工智能技術賦能藥物研發。星藥通過使用人工智能的前沿算法,結合計算化學、藥物化學和生物學的工具及經驗,全方位攻克小分子藥物早期研發流程中的疑難問題,快速發現活性高、成藥性好且結構新穎的候選分子。在這一過程中,火山引擎為星藥科技提供了一系列的技術產品支持,大幅降低了藥物研發過程中的算力需求門檻。
智能時代的藥物研發
星藥科技目前已經和國內外藥企以及研究機構進行了諸多合作,推進多個藥物研發管線,覆蓋中樞神經系統疾病、自體免疫類疾病、腫瘤、呼吸系統疾病等不同疾病領域,作用機制包括抑制劑和激動劑等不同類別。
通過技術創新,星藥科技將單個臨床前藥物研發管線的成本和時間大幅降低和縮短,使得同時儲備多條藥物研發管線、優化整體戰略布局都成為了可能。星藥科技獨立通過將蛋白結構建模,分子設計、性質預測、逆合成分析與智能計算平臺M1及Pyxir平臺有機結合,配合生物實驗平臺,形成了“AI-計算-實驗迭代”的藥物研發新范式。尤其在M1計算平臺中,星藥科技FEP和Docking計算精準度已達到業界先進水平,邀測情況良好,并已完成商業化落地。
技術的發展很難一帆風順,一些難題在研發過程中逐漸浮出水面:
首先,面對業務量的波動,需要實現按需調度的彈性伸縮算力,最大化利用計算資源;
其次,以往計算節點較多,需要大量專人開發維護集群,才能保證應用的高可用性;
第三,醫藥研發有海量非結構化文件數據讀取需求,這就需要有高吞吐的數據讀取能力。
面對以上難點,也為了建立更多增益的差異化管線,尤其是未成藥、難成藥靶點的藥物管線,星藥科技需要有一個充足的、動態的、極致性價比的算力資源,一個可以提供無限計算、存儲等擴展能力的云超算平臺。如果能實現這樣的云超算平臺,就可以滿足其計算任務需求,為藥物研發新范式提供動態資源,從而在更短時間內獲得期望的實驗結果。
火山引擎高性能計算平臺
星藥科技引入了火山引擎的高性能算力資源、機器學習平臺及高性能并行文件系統等資源。基于火山引擎高性能計算平臺,星藥科技能夠無縫集成彈性容器,靈活調度底層計算資源,實現了海量實例快速秒級啟動,從而靈活應對計算高峰。
火山引擎機器學習平臺幫助星藥科技無縫對接了已有集群資源調度引擎Slurm,支持全流程的數據管理、代碼開發、模型訓練等全生命周期工作流;通過機器學習平臺對Gromacs的GPU性能優化,大幅提升效率、降低成本;同時,減少了星藥科技對Slurm集群的維護負擔,節省人力成本30%。

火山引擎與星藥科技的合作解決方案
星藥科技通過集成火山引擎的技術產品,獲得了如下能力:
● 高可用彈性算力集群。其能夠利用云上的高可用、靈活伸縮的特性,實現資源的按需實時調用,無需關心擴容策略。
● 高性能并行存儲–vePFS。提供亞毫秒級時延,20G/s吞吐,百萬級IOPS,同時可以在線彈性擴展,容量與性能實現線性靈活增長。
● 機器學習平臺。能夠支持Slurm提交任務;支持NVIDIA Clara系列工具(如Gromacs)的云端應用,實現醫療生信行業任務的GPU加速;支持從數據托管、代碼開發、模型訓練、模型部署的全生命周期工作流。
● 遷移對接便利:利用Terraform,在多個可用區快速批量創建云上高性能計算集群,節省人力成本,實現資源彈性敏捷。
總體來看,星藥科技在與火山引擎合作后,通過引入IntelAVX512優化指令集,使得整體性能提升了30%;通過火山引擎機器學習平臺提供的Slurm提交任務,能夠卸下自己維護Slurm集群的重擔,減少人力成本投入30%;同時,在火山引擎機器學習平臺中優化Gromacs的GPU性能,將原本需要7小時處理的任務降低到不足3小時,同時算力成本降低至60%,藥物研發的先導化合物發現階段整體效率提升20%。
在聯手火山引擎后,星藥科技更高效準確地找到比對標藥物活性更好、并具有更大專利空間的全新分子,進而大幅度節省藥物開發環節的時間和成本。雙方聯手實現以“AI驅動的研發管線”和“AI賦能的計算平臺”的雙循環,賦能藥物研發產業,讓新藥的研發更加高效。(作者:袁夢)