近日,國產大模型在AI視頻生成領域取得了令人矚目的進展。4月27日,生數科技聯合清華大學在中關村論壇未來人工智能先鋒論壇上發布了中國首個Sora級別的視頻大模型Vidu,引發市場熱議。4月28日,AIGC軟件A股上市公司萬興科技宣布其國內首個音視頻多媒體大模型萬興“天幕”正式公測,受到市場廣泛關注。
公開信息顯示,Vidu采用了Diffusion與Transformer融合的U-ViT架構,支持一鍵生成長達16秒、分辨率高達1080P的高清視頻內容。Vidu不僅能夠模擬真實物理世界,還擁有豐富的想象力,具備多鏡頭生成、時空一致性高等特性。從演示視頻中可以看出,Vidu視頻生成的效果達到了較高水平,例如在生成的游泳的柯基視頻中,Vidu對柯基游泳時腿上毛發漂浮的細節處理得較為精細。

而在4月28日舉辦的萬興天幕大模型公測體驗暨「AI重塑視頻創作」創新論壇上,萬興科技已宣布正式逐步向公眾開放的萬興“天幕”,并將向部分第三方開放API接口。據現場體驗過的參與者反饋,效果也令人滿意。
有參與現場體驗的創作者認為,從業者正迫切追求文生視頻能力,萬興“天幕”能通過簡潔的文字描述生成富有創意的視頻內容,提升創作效率并降低成本,對視頻制作、電影制作和廣告業等市場帶來全新推動力。同時,營銷行業的體驗者看好萬興“天幕”的多媒體內容生成能力,認為天幕將成為“一站式”AI內容生成平臺,簡化工作流程,提升創作效率和創意表達力。
據了解,萬興“天幕”是國內首個專注于數字創意領域的音視頻多媒體大模型,依托15億用戶行為數據和百億本土化音視頻數據,采用先進的音視頻生成式AI技術,為全球創作者提供全鏈路的創作支持。該模型已通過中央網信辦備案,具備近百項音視頻原子能力,并已在旗下產品如Wondershare Filmora、Wondershare Virbo中實現規?;逃?其中文生視頻能力實現不同風格、豐富場景及主題的連貫性,一鍵生成時長率先支持60秒+。

(萬興“天幕”文生視頻《男孩的探險之行》)
從Sora到萬興“天幕”、Vidu,AI大模型正在加速推動音視頻領域的技術變革。據Gartner研究預測,到2030年,90%的數字內容都將是AI生成,預計2032年,全球AIGC市場規模有望達1.3萬億美元。此外,目前全世界有3.05億視頻創作者,43億視頻覆蓋群體,每天200億次以上的視頻播放量,音視頻領域的市場潛力巨大。
當前,隨著全球AI領域企業的財報密集發布,前瞻布局的企業正在廣闊市場的帶動下,迎來業績加速釋放的新時期。例如,微軟第三財季報告顯示,微軟云Azure的收入增長達到31%,其中人工智能增長7個百分點。
國內,萬興科技2023年財報顯示,公司全年實現營業收入14.81億元,同比增長25.49%;歸母凈利潤8620.57萬元,同比增長113.20%,扣非凈利潤8968.31萬元,同比大增817.45%。公司投入研發費用4.03億元,加速AI技術研發、產品功能創新、產品矩陣擴張,借力先進AI技術打造多元化的創意軟件產品與服務。
此外,美圖公司發布的2023年財報顯示,2023年總收入27億元,凈利潤3.7億元。財報中特別強調,收入和利潤的雙增長得益于AI的推動。其中,AI驅動下2023年美圖公司影像與設計產品業務全年收入13.3億元,同比增長52.8%。目前,美圖用戶每天處理數億份圖片和視頻,約83%都用到了泛AI功能。