騰訊發布並開源混元語音數字人模型 X
28/05/2025 12:43
<匯港通訊>       騰訊混元發布並開源的語音數字人模型HunyuanVideo-Avatar,由騰訊混元視頻大模型及騰訊音樂天琴實驗室MuseV技術聯合研發,支持頭肩、半身與全身景別,以及多動態風格、多物種與雙人視頻場景,面向高視訊創作者的高視訊性場景。

使用者可上傳人物影像與音頻,HunyuanVideo-Avatar模型會自動理解圖片與音頻,例如人物所在環境、音頻所蘊含的情感等,讓圖中人物自然地說話或唱歌,生成包含自然表情、唇形同步及全身動作的視頻。

#騰訊 #人工智能  (CW)



本文所提供的任何資料只供參考之用。本網站概不對這些資料的準確性、完整性 、合時性或對基於這些資料而作出的任何決定負責。 而其他網站的轉載或翻譯,並不代表本網站推介或認可該等其他網站。 本網站不對該等其他網站的內容負責,亦未核實有關內容。