近日,OpenAI舉辦春季發布會,推出全新GPT-4o模型,掀起了全球AI大模型領域的新熱潮。
作為OpenAI旗下又一個王炸產品,GPT-4o讓人機交互更智能。據了解,GPT-4o可接收文本、音頻和圖像的任意組合作為輸入,并實時生成文本、音頻和圖像的任意組合輸出,使ChatGPT能夠處理50種不同的語言,同時提高了速度和質量,尤其在音頻理解方面表現出色,可以在232毫秒內對音頻輸入做出反應,平均響應時長也僅有320毫秒,與人類在對話中的反應速度相當,實現了人與AI的“絲滑”對話。

側重情感陪伴和情緒價值是GPT-4o的另一個特點。OpenAI研究員Mark Chen表示,新模型具有“感知情緒”的能力,能笑、會唱,可以表達情感,還可以處理用戶打斷它的情況。在OpenAI發布的錄播視頻中,機器人能夠從急促的喘氣聲中理解“緊張”的含義,并且指導演示人員進行深呼吸。
“感知情緒”的能力天然適配AI陪伴應用的需求。所謂“AI陪伴”,通常指的是利用人工智能技術,特別是自然語言處理和機器學習,來創建能夠模擬人類交流和情感互動的虛擬伴侶或助手。這類應用能夠與用戶進行日常對話,提供社交互動和情感支持,甚至能夠成為用戶的生活助手,提供長期陪伴。
實際上,在過去一年里,“AI陪伴”一直是人工智能企業們布局的重點領域,在商業變現的層面,“AI陪伴”目前也是消費者最愿意買單的應用場景之一。國聯證券研報指出,AI陪伴產品預計中期在游戲、直播、社交用戶中逐步破圈,向7億+泛娛樂用戶滲透;長期來看,有望覆蓋13億+泛互聯網用戶,推動社交關系由“人-人”轉化為“人-人/AI”。去年A16Z也曾指出,AI伴侶將是人工智能落地的第一批殺手級應用,能將生成式AI真正帶入消費者的日常生活中。
目前,已有眾多公司布局了“AI陪伴”賽道。2023年5月,AIGC軟件A股上市公司萬興科技(300624.SZ)已率先推出Trumate,這是一款基于多模態技術構建的沉浸式虛擬陪伴聊天應用,融合了AI語音交流、AIGC技術支持的形象裝扮定制、個性化人設問題、基于AI Agent推理的個性化劇場、多個AI Agent協同的精彩群聊等多種功能,在虛擬形象、人設、聲音等方面設置了更多玩法,具有高沉浸感和娛樂感等特征。

公開信息顯示,推出Trumate的萬興科技是中國數字創意軟件領域產品覆蓋面廣、營收體量大、全球化程度高的A股上市公司,也是國內AIGC行業龍頭企業以及國內最大的數字創意軟件出海企業,在出海領域有著長達20年的經驗,業務覆蓋200多個國家和地區,全球累計用戶超15億,被視為中國版“Adobe”。
加速布局“AI陪伴”賽道的不止萬興科技。海外,Character.ai, CrushOn,Talkie,Replika等產品早前已出圈,在用戶量、營收方面有了較為亮眼的表現,例如Character.ai2023年營收約為1520萬美元,證明了該類應用的廣闊商業化空間;國內大廠方面,已有騰訊“未伴”、百度“小侃星球”、美團“Wow”等AI聊天類產品;初創企業方面,有消息稱,推出了Kimi的月之暗面最近也在做一款名為Ohai AI的AI聊天類產品。
隨著GPT-4o的發布,“AI陪伴”賽道鏖戰或將更加激烈。類比移動互聯網生態演進歷程,基礎設施的進一步發展是應用繁榮的重要條件,對于AI應用來說,AI底層模型技術的持續迭代,是AI陪伴應用持續發展的一個關鍵因素。
伴隨著多模態技術的深入發展,大模型領域也在不斷升級變化,從圖文時代1.0加速進入到以音視頻多媒體為載體的2.0時代,基于這樣的趨勢,國內廠商正加快大模型迭代。4月28日,萬興科技旗下國內首個音視頻多媒體大模型萬興“天幕”正式公測,該大模型采用了先進的音視頻生成式AI技術,具備近百項音視頻原子能力,并已在海外規模化商用,其中文字生成視頻能力實現不同風格、豐富場景及主題的連貫性,一鍵生成時長可超60秒。