近日,百度硅谷人工智能實(shí)驗(yàn)室(SVAIL)宣布,百度已開源人工智能軟件
Warp-CTC,公開了關(guān)鍵代碼。對(duì)研究人員來說,該軟件可用于解決繪制輸入序列到輸出序列圖譜過程中的監(jiān)督問題,如語音識(shí)別問題。百度表示,代碼將開放給所有從業(yè)者。分析人士預(yù)計(jì),這一舉措將推動(dòng)人工智能產(chǎn)業(yè)的快速發(fā)展,并幫助百度在人工智能標(biāo)準(zhǔn)化發(fā)展中掌握主動(dòng)權(quán)。

(百度位于美國(guó)硅谷的人工智能實(shí)驗(yàn)室)
Warp-CTC是百度前期為了在最新的計(jì)算機(jī)芯片上更快速運(yùn)行而專門研發(fā)的一種改良版深度學(xué)習(xí)算法。Warp-CTC所需的存儲(chǔ)空間小,比普通CTC速度快數(shù)百倍。百度硅谷人工智能實(shí)驗(yàn)室目前已向GitHub上傳了Warp-CTC代碼庫(kù),鼓勵(lì)開發(fā)者試用這些代碼。百度表示,希望此次開源能促使端到端的深度學(xué)習(xí)變得更簡(jiǎn)單、速度更快,加快研究者的進(jìn)度,進(jìn)而對(duì)機(jī)器學(xué)習(xí)領(lǐng)域的進(jìn)步做出貢獻(xiàn)。百度開源Warp-CTC代碼庫(kù)訪問方式:https://github.com/baidu-research/warp-ctc
據(jù)了解,部分代碼已被用于開發(fā)一款強(qiáng)大的深度語音識(shí)別系統(tǒng)Deep Speech
2,對(duì)于一些簡(jiǎn)短的句子,該系統(tǒng)比大多數(shù)人類更善于正確地識(shí)別語音。該技術(shù)使百度數(shù)億用戶可以更好的訪問其語音服務(wù),尤其是在移動(dòng)端。
這次開源關(guān)鍵代碼,并非百度第一次開放在人工智能領(lǐng)域的能力。早在去年5月,百度開源了其深度學(xué)習(xí)平臺(tái)。通過這一開源平臺(tái),世界各地的開發(fā)者們獲得了免費(fèi)優(yōu)質(zhì)的深度算法源碼,大幅降低開發(fā)和部署分布式機(jī)器學(xué)習(xí)系統(tǒng)及相關(guān)應(yīng)用的門檻。
縱觀國(guó)際,谷歌于去年11月開源了TensorFlow系統(tǒng),而Facebook也于去年12月公開了Big
Sur人工智能硬件架構(gòu)。分析人士認(rèn)為:國(guó)際科技巨頭紛紛開源人工智能技術(shù),一方面將迅速降低開發(fā)者部署深度學(xué)習(xí)系統(tǒng)的難度,推動(dòng)創(chuàng)新應(yīng)用及人工智能行業(yè)快速發(fā)展;另一方面,有利于企業(yè)在人工智能技術(shù)標(biāo)準(zhǔn)化發(fā)展過程中占據(jù)主動(dòng)位置,搶占技術(shù)創(chuàng)新背后正在產(chǎn)生的巨大市場(chǎng)紅利。
作為全球人工智能布局較早的企業(yè),百度擁有領(lǐng)先業(yè)界的技術(shù)實(shí)力。從2013年百度深度學(xué)習(xí)研究院(IDL)的創(chuàng)建及2014年Andrew
Ng的加盟至今,百度不斷在深度學(xué)習(xí)的多個(gè)應(yīng)用領(lǐng)域進(jìn)行探索,并取得國(guó)際領(lǐng)先的技術(shù)成果,上線了如xgboost(速度快效果好的Boosting模型)、CXXNET(極致的C++深度學(xué)習(xí)庫(kù))、Minerva(高效靈活的并行深度學(xué)習(xí)引擎)以及Parameter
Server(一小時(shí)訓(xùn)練600T數(shù)據(jù))等產(chǎn)品,在語音識(shí)別、OCR識(shí)別、人臉識(shí)別以及計(jì)算效率提升上發(fā)布了多個(gè)成熟產(chǎn)品。