人工智能正在為生物計算領域帶來新一輪爆發(fā)。5月10日-11日,由中國首家生物計算驅動的生命科學平臺“百圖生科”主辦的首屆中國生物計算大會在蘇州召開,百度創(chuàng)始人、董事長兼CEO,百圖生科創(chuàng)始人兼董事長李彥宏在會上表示,“生物計算是個高度融合的學科,生物+計算的融合,會帶來巨大的突破和進步。依靠生物計算引擎,能夠有效利用大量的生物數(shù)據,把藥物發(fā)現(xiàn)的‘大海撈針’變成‘按圖索驥’,為人類的生命健康謀福祉。”

“AI+生物計算”的逐漸興盛,源于基因組學研究帶來的人體數(shù)據在快速增長,新藥研發(fā)過程當中所積累的知識在快速增長甚至是爆發(fā),以及新生的各類機器學習的算法在快速地變化、在提升和迭代。
目前,生命科學界對人類疾病機理的研究已經可以精細到單個病人單個細胞的全基因組和轉錄組等層面,這為個性化的靶向藥物研發(fā)、疾病的極早期診斷和精細化分型提供了充分可能,也為精準藥物設計打下良好的基礎。
但要讓海量生物數(shù)據迸發(fā)力量,需要更加創(chuàng)新的算法、更加強大的底層計算架構。
百度自然語言處理部總監(jiān)、螺旋槳PaddleHelix生物計算平臺負責人何徑舟在“生物計算與新算法”分論壇上談到,在數(shù)據層面,生物醫(yī)藥領域和其他已經大規(guī)模應用AI技術的領域相比,存在比較高的門檻,生物領域目前優(yōu)質的標注數(shù)據少,而且標注新數(shù)據的成本極高,這在很長時間內限制了AI在生物醫(yī)藥領域的應用。

在“AI+生物計算”領域,百度不僅布局早,同時在算法、算力層面實現(xiàn)了全面和領先。
何徑舟介紹道,百度基于飛槳推出生物計算平臺螺旋槳PaddleHelix,面向藥物研發(fā)、疫苗設計、精準醫(yī)療等場景,降低研究人員的AI算法使用門檻,提升研發(fā)效率。螺旋槳PaddleHelix提供化合物和蛋白質預訓練模型,能實現(xiàn)基于海量無標注數(shù)據的自監(jiān)督學習,同時利用多任務學習,增強模型的泛化能力。
目前,百度已開源螺旋槳PaddleHelix生物計算工具集,提供包括 RNA 二級結構預測、大規(guī)模的分子預訓練、DTI 藥物靶點親和力預測以及 ADMET 成藥性預測等在內的新藥研發(fā)和疫苗設計環(huán)節(jié)的核心能力,幫助生物信息學、計算機交叉學科背景的學習者、研究者和合作伙伴更便利地進行科學研究和應用探索。未來,螺旋槳PaddleHelix算法模型將持續(xù)升級、開源,促進整個生物醫(yī)藥行業(yè)的算法創(chuàng)新,實現(xiàn)AI價值普惠。
在算力層面,百度智能芯片總經理歐陽劍在此次中國生物計算大會上分享道,要通過算力更好地賦能生物醫(yī)藥新產業(yè)發(fā)展,唯一的辦法是找到新的路徑,從工藝、架構、系統(tǒng)、軟件多個層面,拉出一條新的有效算力的增長曲線。

在底層架構創(chuàng)新上,百度歷時十年打造,推出中國第一款自研云端全功能AI芯片“昆侖”,提供512GB/s的內存帶寬,能夠在150W的功耗下提供高達260TOPS的能力,是業(yè)內設計算力最高的AI芯片,目前服務數(shù)十個客戶。而即將量產的昆侖第2代芯片,采用更先進的7nm的工藝,增強了對并行計算和生物計算的支持。昆侖2代相對1代性能提升了3倍,同時內置安全引擎,確保模型安全、高性能視頻轉化,為生物計算領域提供好的基礎計算平臺。
百度在生物計算領域的領先技術實力在抗擊新冠肺炎疫情中發(fā)揮了重要的作用。2020年疫情爆發(fā)伊始,百度研究院立即宣布向各基因檢測機構、防疫中心及全世界科學研究中心免費開放線性時間算法 LinearFold 以及世界上現(xiàn)有最快的 RNA 結構預測網站,以提升新型冠狀病毒RNA空間結構預測速度,從而助力疫情防控。
同年5月,百度又推出全球首個 mRNA 疫苗基因序列設計算法 LinearDesign,能在16分鐘內大大提升疫苗設計的穩(wěn)定性和蛋白質表達水平,從而有效解決了mRNA疫苗研發(fā)中最重要的穩(wěn)定性問題,加速疫苗研發(fā)速度。
在本次中國生物計算大會上,李彥宏表示,“在生命健康這個最關鍵的領域,哪怕投入再大、風險再高、周期再長,我們也要堅決地做。生命科學沒有盡頭,只有盡力。”由此,百度在生物計算上的投入決心可見一斑。
百度之所以能有底氣投身到生命科學“無人區(qū)”中,來自于百度多年積累的技術實力和完整AI生態(tài)。百度正在打造AI新型基礎設施,以百度大腦核心技術實現(xiàn)自主創(chuàng)新,以百度飛槳打造開源生態(tài),以量子計算、生物計算等前沿技術描繪未來藍圖,打造云計算鋪設的智能經濟高速公路,從而推動智能交通、智慧城市、智慧金融、智慧能源、智慧醫(yī)療、工業(yè)互聯(lián)網和智能制造等領域實現(xiàn)產業(yè)智能化升級。根據CIC報告,到目前為止,百度也是唯一一家開發(fā)了從芯片設計到深度學習框架以及應用程序級AI功能的全棧AI功能的中國公司。
談及對生物計算未來的憧憬,李彥宏表示“我們希望用AI技術,縮短藥物研發(fā)的時間,降低藥物的副作用,減輕患者的巨大醫(yī)療負擔,為每一個生命爭取更多的可能性。”有決心、有實力,百度在AI生物計算上的路,還將走的更遠。