騰訊發布並開源混元語音數字人模型 X

28/05/2025 12:43

<匯港通訊> 騰訊混元發布並開源的語音數字人模型HunyuanVideo-Avatar，由騰訊混元視頻大模型及騰訊音樂天琴實驗室MuseV技術聯合研發，支持頭肩、半身與全身景別，以及多動態風格、多物種與雙人視頻場景，面向高視訊創作者的高視訊性場景。

使用者可上傳人物影像與音頻，HunyuanVideo-Avatar模型會自動理解圖片與音頻，例如人物所在環境、音頻所蘊含的情感等，讓圖中人物自然地說話或唱歌，生成包含自然表情、唇形同步及全身動作的視頻。

#騰訊 #人工智能 (CW)

本文所提供的任何資料只供參考之用。本網站概不對這些資料的準確性、完整性、合時性或對基於這些資料而作出的任何決定負責。而其他網站的轉載或翻譯,並不代表本網站推介或認可該等其他網站。本網站不對該等其他網站的內容負責,亦未核實有關內容。