
“這張海報(bào)就是由大模型生成的。”徐立說,“除了聚焦本身發(fā)布的參數(shù)之外,我們今年更多的關(guān)注了行業(yè)的場(chǎng)景落地,并以行業(yè)來驅(qū)動(dòng)人工智能的爆發(fā)”。
4月23日,商湯技術(shù)交流日在上海臨港正式開幕,延續(xù)著上一次的開場(chǎng)方式,商湯科技董事長(zhǎng)兼CEO徐立,依然在正式介紹前展示出了一張幻燈片:海報(bào)呈漆面工藝風(fēng)格,主要景物以山、樹木等靜態(tài)物質(zhì)為主。據(jù)悉,此次商湯科技推出的是全新版本的「日日新5.0」。

商湯科技董事長(zhǎng)徐立強(qiáng)調(diào):目前,日日新5.0大模型體系綜合能力全面對(duì)標(biāo)GPT-4,技術(shù)領(lǐng)跑加速生成式AI向產(chǎn)業(yè)落地的全面躍遷,實(shí)現(xiàn)大模型按需所取。
高達(dá)200K的推理上下文窗口,日日新5.0全面對(duì)標(biāo)GPT-4Turbo
2023年,AI浪潮來襲,商湯科技的大模型體系也在“大模型 + 大裝置”的戰(zhàn)略規(guī)劃下,持續(xù)高效的進(jìn)行著優(yōu)化與升級(jí)。
自去年4月商湯「日日新 SenseNova」大模型體系正式問世以來,其已正式推出五個(gè)大版本迭代。而今,商湯新一代「日日新 SenseNova 5.0」時(shí)隔一年正式問世,對(duì)已有的多個(gè)大模型進(jìn)行全方位升級(jí)外,還創(chuàng)造了一些「嶄新的面孔」。

據(jù)悉,基于超過10TBtokens訓(xùn)練、覆蓋大量合成數(shù)據(jù),升級(jí)后的“日日新SenseNova 5.0”采用混合專家架構(gòu),推理時(shí)上下文窗口可以有效到 200K 左右。同時(shí),日日新5.0在自然語言能力(大量中文預(yù)料的構(gòu)建)、綜合推理(包括數(shù)字推理)、代碼生成、多模態(tài)交互等整體表現(xiàn)上「更上一層樓」,全面對(duì)標(biāo)GPT-4 Turbo ,并且常用的客觀評(píng)測(cè)上達(dá)到或超GPT-4 Turbo系列模型。
首先,發(fā)布會(huì)上,商湯科技以“高考中紅樓夢(mèng)的相關(guān)撰文需求”展示了日日新5.0的答題能力。測(cè)試結(jié)果發(fā)現(xiàn),日日新5.0不僅解題速度十分優(yōu)秀,還摒棄了大模型最常應(yīng)用的傳統(tǒng)撰文套路,以發(fā)散的撰文思維及時(shí)下最熱互聯(lián)網(wǎng)“熱點(diǎn)”完成了此次創(chuàng)作。
數(shù)學(xué)題目測(cè)試中,商湯科技選擇了以“13個(gè)小朋友玩老鷹捉小雞,捉住了5只小雞外,還剩幾只小雞”為題干,讓ChatGPT4.0及日日新5.0分別進(jìn)行回答。測(cè)試結(jié)果顯示,這兩款大模型在答數(shù)學(xué)題的能力上差異顯著。
可見,在數(shù)學(xué)能力方面,日日新5.0大模型面對(duì)邏輯謎題能夠跳出坑位,給出解決方案。基于此,商湯科技董事長(zhǎng)兼CEO徐立強(qiáng)調(diào):“在很多情況下,如果說模行要有行業(yè)上的差異化,把行業(yè)化的數(shù)據(jù),以及行業(yè)化數(shù)據(jù)背后的理解疊加,一定是形成一個(gè)差異化的競(jìng)爭(zhēng)能力”。
其次,多模態(tài)方面,商湯科技以“一頭老象在茂密的森林中”為命題測(cè)試了日日新5.0生圖能力,并與行業(yè)內(nèi)領(lǐng)先的一眾“對(duì)手”進(jìn)行對(duì)比,測(cè)試結(jié)果顯示,這幾款大模型在生圖的能力上風(fēng)格不同,各有千秋。

而在以“人”為主的生圖測(cè)試中,相較于之前,日日新5.0多模態(tài)的迭代能力有著十分明顯的提升,在人物細(xì)節(jié)構(gòu)造上(即凌亂的頭發(fā)、復(fù)雜的皮膚紋理)都十分出色。反觀其他“幾個(gè)友商”都在皮膚及發(fā)型上有不同程度的模糊化加工。
在本質(zhì)上將“合成與理解”放在一起的技術(shù)處理上,商湯科技以“未來派建筑,樓頂有一個(gè)白色陶瓷LOGO——Sensenova”為命題進(jìn)行了測(cè)試。
從各家大模型的回復(fù)中,我們注意到,除日日新5.0外,對(duì)于文字嵌入建筑當(dāng)中均有一定的缺失,包括文字的理解,及LOGO的擺放位置等等。
反觀日日新5.0,除了完全理解“需求”外,甚至對(duì)于LOGO細(xì)節(jié)處的倒影,及水面波浪式的紋理都做出了具象化的處理。
再有,數(shù)據(jù)推理多模態(tài)能力上。商湯科技以長(zhǎng)圖嵌入數(shù)據(jù)分析為例,展示了圖片文字拆分,圖片文字理解,基于長(zhǎng)圖思考形成邏輯性回答的能力。

值得注意的是,本次發(fā)布會(huì)的演示環(huán)節(jié),依舊采取的現(xiàn)場(chǎng)直播演示,相較于上一個(gè)版本,日日新5.0的確在理解能力、邏輯能力以及數(shù)學(xué)能力的展示上更加全面及詳細(xì)。
大模型之家認(rèn)為,作為商湯「日日新SenseNova」大模型體系的通用基礎(chǔ)模型,日日新5.0的大幅度升級(jí)使得人們?cè)谑褂媚P吞幚矶鄻踊Z言任務(wù)時(shí)更高效、更準(zhǔn)確,讓國(guó)產(chǎn)大模型擁有了與 GPT-4 相媲美的使用體驗(yàn)。
同時(shí),對(duì)于整個(gè)行業(yè)來說,未來基于此模型基礎(chǔ)上開展的學(xué)術(shù)研究、技術(shù)創(chuàng)新、商業(yè)應(yīng)用也有了更多機(jī)會(huì)。
推出企業(yè)級(jí)一體機(jī),商湯朋友圈均有新動(dòng)作
基礎(chǔ)模型升級(jí)之外,基于金融、代碼、醫(yī)療、政務(wù)等重點(diǎn)行業(yè)邊緣側(cè)日益增長(zhǎng)的AI應(yīng)用需求,商湯科技推出了企業(yè)級(jí)一體機(jī),主打高性價(jià)比、開箱即用、數(shù)據(jù)安全及國(guó)產(chǎn)化芯片全適用。
據(jù)悉,一體機(jī)為2-42架構(gòu)(即商湯獨(dú)創(chuàng)),可達(dá)到2P算力,256G顯存及448GB/s的連接。可同時(shí)支持企業(yè)級(jí)千億模型加速和知識(shí)檢索硬件加速,實(shí)現(xiàn)本地化部署,即買即用,降低企業(yè)應(yīng)用大模型的門檻。相比行業(yè)同類產(chǎn)品,推理成本節(jié)約80%,檢索大大加速,CPU工作負(fù)載50%。

此外,商湯科技還推出了創(chuàng)新的端云協(xié)同解決方案,該方案能夠智能地判斷并協(xié)同發(fā)揮端側(cè)與云端各自的優(yōu)勢(shì)。在需要聯(lián)網(wǎng)搜索或處理復(fù)雜場(chǎng)景時(shí),該方案能夠智能地將任務(wù)分流至云端處理,而在部分場(chǎng)景中,端側(cè)處理的占比甚至超過了80%,從而大幅降低了推理成本,提高了整體效率。
值得注意的是,商湯科技日日新·端側(cè)大語言模型的推理速度達(dá)到了業(yè)內(nèi)最快水平。在中端平臺(tái)上,該模型能夠?qū)崿F(xiàn)平均18.3字/s的生成速度,而在旗艦平臺(tái)上更是高達(dá)78.3字/s,為用戶提供了極速的語言處理能力。
而商湯科技的擴(kuò)散模型,同樣在端側(cè)展現(xiàn)了業(yè)內(nèi)最快的推理速度。其端側(cè)LDM-AI擴(kuò)圖技術(shù)在某主流平臺(tái)上的推理速度小于1.5秒,相較于友商的云端應(yīng)用,速度提升了驚人的10倍。更值得一提的是,該技術(shù)支持輸出1200萬像素及以上的高清圖片,并允許用戶在端上快速進(jìn)行等比擴(kuò)圖、自由擴(kuò)圖、旋轉(zhuǎn)擴(kuò)圖等圖像編輯功能,為用戶帶來了極致的便捷和高效體驗(yàn)。

而在自身應(yīng)用方面,商湯“日日新SenseNova 5.0”在秒畫、如影、格物、瓊宇、大醫(yī)、小浣熊家族等產(chǎn)品均有重要更新。
此外,在發(fā)布會(huì)中,商湯還邀請(qǐng)了金山辦公、華為、小米、閱文集團(tuán)等多位生態(tài)伙伴嘉賓,共同探討和交流大模型技術(shù)在辦公、金融、出行等不同領(lǐng)域的應(yīng)用及前景。
金山辦公方面,基于“日日新”大模型的卓越代碼生成及工具調(diào)用能力,助力WPS365打造更高效釋放場(chǎng)景能力的辦公新質(zhì)生產(chǎn)力平臺(tái),為企業(yè)構(gòu)建專屬的“企業(yè)大腦”。
海通證券方面,其攜手商湯科技共同推出了金融行業(yè)專用的多模態(tài)全棧式大模型。這一合作不僅助力雙方在智能客服、合規(guī)風(fēng)控、代碼輔助、展業(yè)辦公助手等多個(gè)領(lǐng)域?qū)崿F(xiàn)業(yè)務(wù)的實(shí)際應(yīng)用,還共同深入研究了智能投顧、輿情監(jiān)控等行業(yè)前沿場(chǎng)景,成功打通了證券行業(yè)大模型從研發(fā)到落地的全棧式能力。
小米則在旗下最新發(fā)布的SU7中應(yīng)用了商湯的大模型技術(shù),并基于商湯端云大模型解決方案,以小米小愛同學(xué)為車主提供智能化交互體驗(yàn)。
華為方面則宣布了與商湯聯(lián)合發(fā)布面向金融、醫(yī)療、政務(wù)、代碼等行業(yè)的大模型,并強(qiáng)調(diào),雙方將發(fā)揮各自在算力、數(shù)據(jù)、場(chǎng)景等方面優(yōu)勢(shì),共建大模型生態(tài),加速人工智能走深走實(shí)。
AI競(jìng)技,商湯底氣何在?
值此商湯技術(shù)交流日之際,截至今日收盤,商湯科技股價(jià)上漲1.67%,報(bào)收0.61元/股,可見資本對(duì)于日日新大模型5.0的看好。
聯(lián)想到實(shí)際業(yè)績(jī)上,據(jù)3月26日商湯科技發(fā)布的2023年業(yè)績(jī)報(bào)告顯示:2023年公司整體營(yíng)業(yè)收入34億元人民幣,其中生成式AI收入達(dá)12億元,占集團(tuán)總收入比例升至35%,實(shí)現(xiàn)近200%增長(zhǎng)。這也是商湯成立十年以來,以最快速度實(shí)現(xiàn)從無到有,并取得超過10億收入體量的新業(yè)務(wù)。
對(duì)此,商湯集團(tuán)董事長(zhǎng)兼CEO徐立博士曾公開表示,“生成式AI對(duì)商湯來說已不僅僅是技術(shù)領(lǐng)域的變革性創(chuàng)新,更成為公司的核心業(yè)務(wù)。商湯生成式AI業(yè)務(wù)的增長(zhǎng),得益于各行各業(yè)對(duì)大模型的訓(xùn)練和推理的廣泛需求,這預(yù)示著中國(guó)硬科技投資的新周期正式開啟。商湯通過在各業(yè)務(wù)層面深入融合生成式AI能力,正在贏得新客戶,并推動(dòng)效率和生產(chǎn)力的全面提升。”無疑,全新的 AI 2.0 時(shí)代下,商湯正加速轉(zhuǎn)型變革,以通用人工智能(AGI)目標(biāo)打造全新面貌的“商湯 2.0”。
眼下,AI賽道的戰(zhàn)火已經(jīng)燃燒到了行業(yè)場(chǎng)景的落地上。而能夠引領(lǐng)大眾欣賞世界的大模型,不僅為用戶帶來了更多的想象力,也為整個(gè)行業(yè)帶來了更加具象化的商業(yè)應(yīng)用憧憬。
在此背景下,為了在千行百業(yè)中用好它們,真正實(shí)現(xiàn)「行業(yè)場(chǎng)景落地」,一套完整的體系勢(shì)必能讓我們事半功倍。而從今日的技術(shù)交流日來看,在這一方面,商湯已經(jīng)做好了準(zhǔn)備。