4月23日,全球化 AI 云開發者平臺——涂鴉智能舉辦的2025 TUYA 全球開發者大會在深圳開幕,匯聚全球智能硬件開發者與產業先鋒,共探產業智能化轉型。作為 AI 硬件技術與生態共建的重要力量,火山引擎智能算法負責人吳迪受邀出席主論壇圓桌,圍繞 “AI 如何重塑行業生態”分享了火山引擎在 AI+IoT 領域的洞察。
涂鴉智能是全球領先的 AI 云平臺服務提供商,致力于構建智慧解決方案的 AIoT 開發者生態,賦能萬物智能。
吳迪指出,未來幾年 AIoT 芯片與端側能力將呈幾何級爆發,端側需承擔“數據優化師”角色——提供更精確的傳感器輸入、更聰明的信息預處理、低功耗低延遲完成意圖識別。云側則依托大模型處理高難度、高智商的任務。
關于端云協同,吳迪補充道,在斷網或高隱私場景下,AIoT 與端模型不可或缺;聯網時,端側完成預處理后與云側大模型協作處理復雜任務。長期來看,端側與云側互為增益、深度協同。端側越強,采集數據越豐富,反哺云側大模型智能提升;云側越智能,越能推動用戶擁抱 AGI 與智能硬件,形成正向循環。

火山引擎智能算法負責人 吳迪
依托 ASR 能力,涂鴉智能 AI 產品語音指令識別準確率提升超20%,日常或嘈雜環境下均能快速“聽清”指令,交互更流暢;
TTS 技術讓 AI 產品發出的聲音宛如真人,同時 TTS 提供了豐富的音色種類,讓用戶有了更個性化的產品體驗;
大語言模型更強的語言理解和生成能力,讓 AI 產品既能準確回答用戶問題,又能進行創意對話,例如編故事、詩詞對答等,極大增強了產品趣味性和用戶粘性。
涂鴉智能技術副總裁柯都敏表示:“火山引擎在多模態與大語言模型領域的突出能力,正是我們選擇其作為核心技術伙伴的重要原因。火山引擎大模型ASR 技術具備很高的準確率,即使在嘈雜環境或面對多種口音時,也能精準識別語音指令,這與我們對智能設備語音交互精準性的嚴苛要求高度契合。其 TTS 技術生成的語音自然流暢,音色種類豐富,能夠賦予產品更加親切友好的’聲音’,提升用戶的交互體驗。”
在端側:依托自研音頻處理技術,集成自動喚醒與音頻3A(自動增益控制、噪聲抑制、回聲消除)模塊,保障復雜環境下音頻輸入的高清與精準,確保“聽清”指令;
在云側:深度融合大模型、語音識別/合成等 AI 技術,搭載 FunctionCall 與知識庫能力,讓設備既能“聽懂”需求,更能“讀懂”深層意圖,提供個性化服務與智能決策,實現從交互到理解的跨越。

未來,火山引擎與涂鴉智能將進一步深化 AIoT 生態領域合作,共同探索智能健康監測、智慧節能等場景的技術應用。借助火山引擎多模態技術,涂鴉智能將以更智能、更人性化的交互能力,開拓全新增長點。同時,雙方也將攜手打造更完善的開發者生態,吸引更多開發者加速創新,豐富智能硬件生態。