小到視頻配音、有聲閱讀,大到呼叫中心、車載語音交互,智能語音的應用場景越來越廣泛,市場規(guī)模和需求也逐步攀升。一些企業(yè)正在通過“定制化”音色的方式,在加強自身IP建設的同時,為客戶帶來更加沉浸、自然的聲音體驗及多樣化的玩法。基于硅基智能在AIGC業(yè)務的需求,火山引擎為硅基智能量身定制了多個精品音色,既包含著名的行業(yè)IP人物,也涉及多位知名的企業(yè)家。
硅基智能是一家以服務智能化和知識智能化為核心的人工智能創(chuàng)新企業(yè),以自研DUIX操作系統(tǒng)為核心,通過打造開放開源、集體進步、任勞任怨的硅基勞動力,為客戶提供近乎無限供給的數(shù)字員工,大幅度降低組織成本,快速提升組織效率,讓客戶在數(shù)字化轉(zhuǎn)型中擁有以算力為核心的創(chuàng)新競爭力。
日常音色處理,有力支撐AIGC業(yè)務
語音合成技術(shù),是人工智能領域的重要組成部分。伴隨著AIGC的興起和逐步落地應用,當前,越來越多的企業(yè)正在通過AIGC的方式打造自身IP形象,一些企業(yè)更是希望在線上打造企業(yè)家或知名人物的“數(shù)字分身”,去親近消費者。
然而,企業(yè)家和知名人士在繁忙的工作日程當中,難以抽出大量時間,在錄音棚內(nèi)錄制高品質(zhì)聲音。語音合成又對原生語音的音質(zhì)、音色、語調(diào)以及背景噪音方面都有極高的要求。
火山引擎精品音色定制產(chǎn)品,可以根據(jù)日常錄音和采訪對話等原生數(shù)據(jù),進行深入分析和處理,并通過降噪、針對性的聲音提取等創(chuàng)新方案的不斷迭代,解決日常對話多人、設備噪音、摩擦底噪等難題,進而產(chǎn)出高品質(zhì)的定制音色。
在硅基智能的AIGC業(yè)務場景中,火山引擎與硅基智能聯(lián)手打造了高品質(zhì)的音色,滿足了不同客戶對聲音的需求。
多場景觸達,全面保障音色音質(zhì)
在強調(diào)視頻化、個性化、體驗化的今天,如何滿足用戶的多樣化“聲控”需求?怎么通過真實、自然、流暢的合成音色,強化自身IP、吸引并留住用戶?是很多提供音視頻服務企業(yè)正在思考的問題。
火山引擎精品音色定制,是一套為客戶打造的專屬精品音色解決方案,支持多情感、多風格、多語種的個性化定制,能結(jié)合客戶實際應用場景需求,量身打造符合場景特點的定制化音色:
? 針對智能硬件的語音交互場景(如手機、車載系統(tǒng)、智能臺燈):火山引擎提供了高度擬人化的播報聲音,使人機之間互動更真實,從而提升用戶體驗和轉(zhuǎn)化率;
? 將AI播講應用于有聲小說領域:可以幫助用戶在聽書模式下解放雙眼,將內(nèi)容轉(zhuǎn)化為更加引人入勝的聲音體驗。有效提高用戶聽書時間,增加應用的活躍度;
? 將定制IP、趣味方言等個性化音色應用于視頻、廣告配音等場景:可提升音視頻內(nèi)容生產(chǎn)效率,打造更多元、便捷的內(nèi)容生產(chǎn)方式;
? 定制專業(yè)主播音色,將聲音應用到有聲資訊以及新聞App中:可減輕主播錄音工作壓力,提升新聞內(nèi)容制作效率,還能為視障人士、老年人提供無障礙的有聲閱讀環(huán)境;
? 為在線教育場景定制老師音色:能夠減少老師重復性、標準化講解的工作,提升授課效率,從而創(chuàng)造更高效的教學體驗;
除應用場景豐富多樣以外,火山引擎精品音色定制:
? 在技術(shù)上,使用自研的行業(yè)領先的端到端語音合成技術(shù),提供自然流暢的聽感體驗;
? 在效果上,僅需1-2個小時錄音棚原音,即可實現(xiàn)MOS值4.2以上的還原效果,高度還原真人錄音的風格及發(fā)言特點;
? 在保障上,通過豐富的發(fā)音人與錄音棚資源,自身的語音語言學專家和錄音指導專家,滿足語種和風格定制需求,全面保障錄音與效果數(shù)據(jù)質(zhì)量;
經(jīng)過抖音集團大量實踐驗證及長期的行業(yè)深耕,火山引擎通過領先的端到端語音合成技術(shù),可為企業(yè)提供17+種語言、13+種方言、100+種不同風格的合成音色,為用戶打造“聲”臨其境的真實體驗。
目前,火山引擎精品音色的定制產(chǎn)品已廣泛服務包括抖音、剪映、番茄小說、今日頭條等內(nèi)部客戶,外部服務如合眾汽車、追書神器、配音鴨等客戶;未來,火山引擎將持續(xù)以音色定制產(chǎn)品為引領,不斷推進技術(shù)創(chuàng)新,通過更加逼真、自然、富有情感的聲音合成技術(shù),為企業(yè)級客戶打造更個性化,更具“人情味”的音色解決方案。