4月24日,浙江大學(xué)召開OpenKS(知目)知識計算引擎開源項目發(fā)布會,宣布浙大與合作單位研發(fā)的OpenKS知識計算引擎取得重大進展。中國工程院院士、國家新一代人工智能戰(zhàn)略咨詢委員會組長、浙江大學(xué)計算機學(xué)院教授潘云鶴表示,OpenKS作為知識計算引擎項目中的基礎(chǔ)軟件架構(gòu),定義并豐富了知識計算的內(nèi)涵,是我國在大數(shù)據(jù)人工智能方向的又一次有益嘗試。

(浙江大學(xué)OpenKS“知目”知識計算引擎開源項目發(fā)布會)
該項目由浙江大學(xué)牽頭,聯(lián)合北京大學(xué)、北京航空航天大學(xué)、哈爾濱工業(yè)大學(xué)、西北工業(yè)大學(xué)、之江實驗室等頂尖學(xué)術(shù)機構(gòu)、百度等行業(yè)領(lǐng)軍企業(yè)聯(lián)合建設(shè),旨在建立一整套可服務(wù)于知識密集型行業(yè)共性需求的知識計算工具、算法與系統(tǒng),幫助這些行業(yè)快速地構(gòu)建行業(yè)知識圖譜,提供行業(yè)相關(guān)的智能規(guī)劃與決策支持。
由于構(gòu)建知識計算需要面臨海量數(shù)據(jù),龐大算力和復(fù)雜模型算法等諸多挑戰(zhàn),OpenKS直接基于百度飛槳深度學(xué)習(xí)框架進行建設(shè),在降低研發(fā)門檻的同時還節(jié)約了大量時間。在百度飛槳的助力下,OpenKS可實現(xiàn)模型的大規(guī)模分布式訓(xùn)練與圖計算,解決了從數(shù)據(jù)到知識,從知識到?jīng)Q策的三大問題。

(OpenKS基于百度飛槳實現(xiàn)模型的大規(guī)模分布式訓(xùn)練與圖計算)
從細節(jié)來看,OpenKS的構(gòu)建使用了飛槳超大規(guī)模深度學(xué)習(xí)模型訓(xùn)練技術(shù),支持百億圖譜分布式存儲和檢索,還支持百節(jié)點數(shù)據(jù)并行訓(xùn)練萬億稀疏參數(shù),進而學(xué)習(xí)大規(guī)模的知識圖譜。針對諸如知識問答、知識推薦等知識圖譜的具體應(yīng)用,OpenKS還采用了飛槳集合通信多機多卡訓(xùn)練、引入純GPU參數(shù)服務(wù)器來提升稀疏模型的計算性能,不僅節(jié)約成本,還保障了集群的穩(wěn)定性和擴展性。
面對圖學(xué)習(xí)算法通用性與性能兼顧的挑戰(zhàn),OpenKS則以飛槳圖學(xué)習(xí)PGL作為知識表示學(xué)習(xí)以及知識存儲的重要模塊之一。一方面采用PGL的大規(guī)模分布式異構(gòu)圖引擎,進行知識表征學(xué)習(xí)的在線服務(wù),支撐日益增長的知識關(guān)系;另一方面集成PGL的多種圖表征學(xué)習(xí)算法,同時采用了PGL的高效消息傳遞接口,保證知識圖譜的先進性。

(百度飛槳開源深度學(xué)習(xí)平臺)
最終,OpenKS得以向各機構(gòu)研發(fā)人員提供一系列知識學(xué)習(xí)與計算的多層級接口標(biāo)準(zhǔn),及時提供算力、算法支撐,以縮短各個行業(yè)的智能化改造時間。目前OpenKS已基本支持知識學(xué)習(xí)與計算全流程主要任務(wù),涉及非結(jié)構(gòu)化數(shù)據(jù)集與知識圖譜載入、多模態(tài)數(shù)據(jù)知識抽取、知識表征、分布式知識學(xué)習(xí)與計算、知識服務(wù)與智能應(yīng)用等環(huán)節(jié)模塊。
隨著新一代人工智能技術(shù)進步,知識圖譜技術(shù)作為人工智能領(lǐng)域最重要的知識表示方式,已成為研究熱點。從全社會來看,眾多知識密集型行業(yè),如金融風(fēng)控、智慧城市、工程教育等均有著從海量數(shù)據(jù)中構(gòu)建知識圖譜并基于此進行快速決策的共性需求,而浙大與合作單位研發(fā)的OpenKS知識計算引擎取得重大進展,有望為高校科研探索及各行各業(yè)的“智變”提供充沛動力。