
5月的第一個大模型來了,你看好訊飛星火嗎?
2022年11月OpenAI發布ChatGPT,隨即2023年1月BuzzFeed宣布與OpenAI合作來協助公司創意生成引爆二級市場,國內外以谷歌、微軟、百度、阿里巴巴、字節跳動、騰訊、華為、科大訊飛在內的互聯網企業紛紛宣布有GPT相關技術儲備。
4月20日,科大訊飛宣布訊飛星火大模型在5月6日發布;緊接著,在4月24日,科大訊飛毫無征兆地對外開啟了公測,用戶填寫問卷調查后就能獲取測試資格。
不少網友稱“科大訊飛實現反向跳票”,在正式發布之前開啟公測,也看得出科大訊飛對訊飛星火認知大模型的自信。
在訊飛星火認知大模型的發布會現場,科大訊飛董事長劉慶峰直言,“認知大模型剛剛起步,還在快速成長和迭代過程中,如果只是找一些單點例子來證明哪個系統強和弱,是沒有意義的。”
但這款大模型的表現到底如何?速途網根據科大訊飛的科學評測體系來體驗一把。
拿小問題細數“星火”的各項功能
發布會上,科大訊飛董事長劉慶峰介紹了當前通用人工智能的七大維度能力,包括了文本生成、邏輯推理、語言理解、數學能力、代碼能力、知識問答、多模態能力。同時,展示了星火認知大模型在寫發言稿、郵件、營銷方案、英文寫作等不同方式的效果呈現,甚至還能以小紅書文本方式生成等。
值得注意的是,在手機或PC瀏覽器中打開訊飛星火,都能夠實現語音輸入問題,就目前市面上的類ChatGPT產品而言,僅科大訊飛實現了語音輸入和輸出,這點值得稱贊。當然,這主要得益于科大訊飛多年在智能語音方面的研究,與訊飛聽見、訊飛有聲等產品內容的基礎相關。
據速途網深度體驗顯示,目前版本的訊飛星火大模型為單模態人工智能大模型,支持文字信息。但速途網在5月5日選擇官方推薦的對話“用emoji表情為我介紹電影《泰坦尼克號》”,星火的回答中出現錯碼/亂碼的情況。


不過,在今日訊飛星火認知大模型發布會期間,速途網再次測試該問題后發現,訊飛星火出現了emoji表情,與此前回復有所差別,不再出現亂碼,這說明訊飛星火已經迭代。

緊接著,速途網又以“今年母親節是哪天?”“今年母親節是幾月幾日?”進行提問。

對于問題中的“今年、哪天”,星火只能反饋到今年是2023年,當提示詞更加精準到“幾月幾日”時,回答也定位到了2023年5月14日。
對于漢語口語化的詞“哪天”,訊飛星火的理解能力表現中規中矩。
此外,速途網通過語音識別輸入提問問題“請幫我籌劃一下,今年母親節我該送給媽媽什么禮物?”訊飛星火的回答與文心一言、ChatGPT等目前已發布的大模型并未有什么差距。



當速途網提問“我在北京,她在山西,我該如何在母親節體驗孝心?”
訊飛星火則回復“即使身在不同的城市,也可以通過以下方式在母親節體驗孝心”,這其中值得注意的是第3個方案中,“為她做飯”,顯然不在同一個城市無法為媽媽親手做一頓豐盛的飯菜,AI的邏輯性還有待提升。

在訊飛星火發布會期間,科大訊飛董事長劉慶峰的測試中,訊飛星火能夠理解“高興、自豪”等情感詞,其理解能力在發布會表現比較良好,由此看來,星火大模型在發布會期間迭代為最新的版本,但在發布會的現場演示中,多語種、邏輯推理和數學能力的演示過程中表現出了不足。
在科大訊飛現場的演示中,訊飛星火能夠合成虛擬人視頻進行文本朗讀也引發了網友的關注,在現場演示中,不到30秒的時間就可以直接生成一段女生形象的虛擬人朗讀上述生成的文本。

但速途網在目前的測試版本中對訊飛星火進行提問,將星火大模型生成的五一旅游計劃進行虛擬人朗讀操作后發現目前的版本中還未支持合成虛擬人視頻,對此,也有不少網友猜測,生成虛擬人視頻功能或許將在未來成為收費項目。


對此,速途網也聯系到科大訊飛工作人員,她表示,目前的版本中不支持生成虛擬人視頻,還未開放全功能版本,將在后續開放全功能版本。
在速途網的測試中也注意到,訊飛星火大模型目前在理解能力、邏輯能力以及數學能力中展示的并不完美,甚至在發布會現場演示也出現了外語回答中夾雜中文字樣的回復,但整體來看,科大訊飛能在5個月的時間內交付出訊飛星火也證明了其多年的技術積累,也希望在今后快速的迭代中,訊飛星火能夠達到客戶滿意的程度。
“AI+”的時代來臨 科大訊飛等中國企業勇敢對標ChatGPT

此外,科大訊飛董事長劉慶峰也在發布會現場提出了“純大模型技術的攻克缺陷”,針對“新知識難以及時更新”、“事實類問答容易張冠李戴”、“史實、傳統典籍等容易編造情節”,科大訊飛針對目前存在的問題也提出了解決方案,更是宣布在今年的三個階段的升級計劃:
第一階段,在6月9日,突破開放性問答,如實時問答;多輪對話能力再次升級;數學能力再上臺階;
第二階段,在8月15日,突破代碼能力;多模態交互能力正式開放給客戶;
第三階段:10月24日,在通用大模型領域對標ChatGPT,中文超越,英文相當。
當然這一計劃公布,不禁也讓網友為科大訊飛捏了一把汗,到底是劉慶峰的口嗨還是中國高新技術企業的自信?
如果說訊飛星火認知大模型的發布是科大訊飛在“秀肌肉”,那將其大模型運用并實踐在了產品中,也是大模型的具體落地形式,讓大模型有了“用武之地”,也在真正意義上實現了“AI+”的趨勢來臨。
對于星火認知大模型未來的行業應用,劉慶峰表示,將主要應用在教育、辦公、汽車、數字員工四大方面。
速途網注意到,在科大訊飛發布會進行到第二部分,劉慶峰演示科大訊飛學習機、翻譯筆、辦公本等硬件產品和訊飛輸入法、訊飛聽見 APP、虛擬人等軟件產品的AI能力,展示了全線接入訊飛星火后,能夠進行作文的評閱修改、英文語法、單詞修改、文章潤色等功能,以及科大訊飛語音識別翻譯等技術,給不少用戶帶來了新功能的驚喜。
以訊飛星火為代表的認知大模型技術,注定會在人工智能領域、各行各業掀起新的變革。事實上,AI大模型此刻的光鮮亮麗,是眾多科技企業多年的技術沉淀與積累。
短短幾個月,國內就超過10來家企業推出了大模型產品,讓人感覺到中國企業科技研發能力的強大。在充滿不確定性的內外環境下,中國企業能夠深耕認知AI,可以預見的是,在新一輪行業變革中,以百度、科大訊飛、昆侖萬維、出門問問等為代表的中國企業已經站在了前沿。速途網期待更多中國企業的研究成果出現,還將持續關注國內最新的人工智能成果。