AI 大模型正讓創(chuàng)作變得更高效、更便捷。如果將目光聚焦全球市場,面對海內(nèi)外用戶文化、審美和使用習慣等差異,技術出海的中國企業(yè),如何才能脫穎而出,讓海外用戶為“好用”而買單?
專注于圖像處理研究、匯聚全球用戶的成都恒圖科技有限公司,給出了人均視頻生成次數(shù)提升12%,用戶付費轉化率增長23%的答案。截至目前,恒圖每天平均創(chuàng)建視頻近萬條,日均消耗 Tokens 數(shù)持續(xù)增長,其中超過80%的推理以及訓練任務的相關資源都由火山引擎提供。
“‘創(chuàng)意3.0時代’中,基于 AI 的個性化生成體驗成為了我們核心產(chǎn)品 Fotor 提升用戶粘性的極好抓手,幫助 Fotor 實現(xiàn)了更廣的用戶滲透?;鹕揭鎻娪辛Φ幕A設施為我們的 AI 算力提供了保障,幫助我們將付費轉化率提升了23%,AI 人均視頻生成數(shù)提升了12%,同時用戶滿意度也提升了40%。目前,恒圖超過80%的推理以及訓練任務的相關資源均由火山引擎提供。”成都恒圖科技有限公司 CTO-顏河表示。
用AI響應海量用戶的視覺創(chuàng)作需求
恒圖的用戶95%都來源于海外市場,其兩大核心產(chǎn)品中, Fotor 提供照片裁切、尺寸調整、濾鏡轉換等圖像編輯功能,自上線以來,持續(xù)霸榜100多個國家的 Mac App Store 攝影應用排行榜;Clipfly 則定位于“簡單的多合一視頻編輯器”,讓用戶無需專業(yè)編輯技能,也能打造出高質量、富有創(chuàng)意的視頻內(nèi)容。
早在深度學習還在實驗室階段時,恒圖就已經(jīng)將神經(jīng)網(wǎng)絡算法應用在圖像處理領域,十多年的行業(yè)經(jīng)驗,疊加前沿的技術,讓恒圖成功當選2025年福布斯中國人工智能科技企業(yè) TOP 50、德勤中國2024年高成長高科技50強榜單。
如今,恒圖又將目光放在了 AI 視頻賽道,與火山引擎團隊攜手,通過接入 BytePlus 平臺上的 Seedance 1.0模型,恒圖海外產(chǎn)品的 AI 視頻生成及編輯能力大幅增強。如今,恒圖已能夠為用戶提供包括 AI 文生圖、AI 文生視頻等在內(nèi)的超100種圖像、圖形和視頻功能,受到用戶的廣泛好評。
大模型讓視頻創(chuàng)作降本增效
在恒圖的視頻工作流中,影視創(chuàng)作者只需輸入文字腳本,就能快速生成動畫片的分鏡視頻,不僅省去了傳統(tǒng)分鏡繪制的時間,還能靈活修改與迭代,推動內(nèi)容創(chuàng)意更快落地。
得益于 Seedance 1.0 pro 模型對推搖、升降、變焦等運鏡指令的精準響應,以及遠、中、近寫等專業(yè)景別描述的支持,創(chuàng)作者可輕松實現(xiàn)專業(yè)的影視級運鏡控制,完成影視級效果的視頻創(chuàng)作,原本需要手工繪制、可能耗時數(shù)天的分鏡視頻,現(xiàn)在只需幾分鐘就能完成。
面向營銷場景,用戶也可以通過輸入品牌口號或產(chǎn)品賣點,只需指定視頻的起始和結束圖片,Seedance 1.0 lite 就能幫助用戶一鍵生成絲滑的風格化宣傳短片,并提供人物外貌氣質、衣著風格、表情動作的精細控制能力與多主體動作解析、嵌入式文本響應等功能。
Seedance 1.0還原生支持包括火爆全網(wǎng)的黏土、國漫等多種生成風格,讓用戶通過提示詞即可生成視頻,極大降低了使用門檻,幫助恒圖提升娛樂型用戶的留存與粘性。
恒圖科技 CTO 顏河表示,借助火山引擎的強大支撐能力,恒圖實現(xiàn)了公司有史以來單日最快的增長,在無投流的情況下,全線產(chǎn)品單日生成處理圖片和視頻超過1,000萬次。
在提示詞優(yōu)化上,恒圖還引入了 ByteDance-Seed-1.6 模型,通過自動添加運鏡指令、專業(yè)景別描述、風格描述、動作解析、分鏡描述,將自然語言輕松擴展為專業(yè)提示詞生成指令,使非專業(yè)用戶也能輕松生成高質量視頻。
在合規(guī)層面,通過應用海外模型審核機制,恒圖在視頻生成過程中過濾了不良提示詞等內(nèi)容,實現(xiàn)了合規(guī)攔截率99.9%,將總體生成成本降低20%以上、生成質量也提升了30%。
海外高性能算力支撐,恒圖加速全球拓展
為了滿足圖片生成方面獨特風格模型的訓練需求,火山引擎為恒圖提供了多種類型高性能 GPU 實例,其中,火山引擎提供的搶占式實例,相對業(yè)界平均水準具有更低回收率,即便在業(yè)務高峰期也能保障充足的算力供給,幫助恒圖補充業(yè)務高峰期的算力需求。
火山引擎充足的 GPU 算力和靈活的計價方式,也為恒圖持續(xù)進行高效模型迭代提供了有力支撐,助力恒圖實現(xiàn)全球拓展。
未來,雙方將在數(shù)字人、智能音視頻等方向展開更深入的合作,將視頻生成與虛擬角色、實時交互等新興應用結合,推動 AI 在內(nèi)容生產(chǎn)與創(chuàng)意表達中實現(xiàn)更廣泛落地。