速途網(wǎng)10月31日訊(報道:喬志斌)10月31日,MiniMax正式發(fā)布新一代音樂生成模型MiniMax Music 2.0。相較上一版本,這一模型在音樂理解與聲學(xué)表現(xiàn)能力上實現(xiàn)升級,能夠更準(zhǔn)確地再現(xiàn)人聲情緒與器樂細(xì)節(jié),為用戶提供專業(yè)級音樂創(chuàng)作體驗。

MiniMax方面表示,Music 2.0希望讓音樂表達(dá)從“小眾技能”走向更普及的創(chuàng)造方式。
Music 2.0的核心提升來自兩方面。一是人聲表現(xiàn)更細(xì)膩。模型能夠呈現(xiàn)接近真實歌手的聲線質(zhì)感,并可通過提示詞(Prompt)實現(xiàn)多種唱法演繹,包括流行、爵士、Blues、搖滾、民謠等多種風(fēng)格。此外,模型還支持多聲部與對唱表現(xiàn)。男女聲主唱之間可實現(xiàn)呼應(yīng)、問答與動態(tài)對比,無伴奏演唱場景下仍能保留層次與節(jié)奏感。
二是編曲能力的增強。Music 2.0能夠生成包括主歌、副歌、橋段在內(nèi)的完整音樂結(jié)構(gòu),單曲時長可達(dá)5分鐘,并提升了Hook段落的旋律吸引力,使音樂更易被記憶。用戶不僅可指令生成風(fēng)格化編曲,還可獨立控制多種樂器,使伴奏呈現(xiàn)更豐富的層次和律動。
新版本還同步提升了音質(zhì)。人聲軌品質(zhì)、空間感與細(xì)節(jié)還原均有所增強,使生成內(nèi)容聽感更加沉浸。在復(fù)古disco、80年代器樂等場景中,模型輸出的聲音動態(tài)更飽滿,細(xì)節(jié)更清晰。據(jù)介紹,這得益于底層聲學(xué)建模能力的全面迭代。

MiniMax在內(nèi)測中發(fā)現(xiàn),Music 2.0還具備影視化表達(dá)潛力。通過描述角色情緒和聲場環(huán)境,模型即可生成帶情緒漸進(jìn)的獨白式音樂配樂,具備一定敘事張力。這一能力的出現(xiàn),被認(rèn)為體現(xiàn)了模型在語義理解與聲學(xué)表現(xiàn)力上的同步“進(jìn)化”,使其不僅會唱、還“懂”情緒。
MiniMax Music 2.0現(xiàn)已全面開放,用戶可前往官網(wǎng)體驗。