Internet Develppment
      互聯網開發& 推廣服務提供商

      我們擅長商業策略與用戶體驗的完美結合。

      歡迎瀏覽我們的案例。

      首頁 > 新聞中心 > 新聞動態 > 正文

      阿里云宣布自研 EMO 模型上線通義 App,用照片 + 音頻生成唱歌視頻

      發布時間:2024-04-26 09:03:52來源:IT之家

        EMO(Emote Portrait Alive)是一個由阿里巴巴集團智能計算研究院開發的框架,一個音頻驅動的 AI 肖像視頻生成系統,能夠通過輸入單一的參考圖像和語音音頻,生成具有表現力的面部表情和各種頭部姿勢的視頻。

        阿里云宣布,通義實驗室研發的 AI 模型 ——EMO 正式上線通義 App,并開放給所有用戶免費使用。借助這一功能,用戶可以在歌曲、熱梗、表情包中任選一款模板,然后通過上傳一張肖像照片就能讓 EMO 合成演戲唱歌視頻。

        據介紹,通義 App 首批上線了 80 多個 EMO 模板,包括熱門歌曲《上春山》《野狼 Disco》等,還有網絡熱梗“缽缽雞”“回手掏”等,但目前暫未不開放自定義音頻。

        EMO 的主要特點

        音頻驅動的視頻生成:EMO 能夠根據輸入的音頻(如說話或唱歌)直接生成視頻,無需依賴于預先錄制的視頻片段或 3D 面部模型。

        高表現力和逼真度:EMO 生成的視頻具有高度的表現力,能夠捕捉并再現人類面部表情的細微差別,包括微妙的微表情,以及與音頻節奏相匹配的頭部運動。

        無縫幀過渡:EMO 確保視頻幀之間的過渡自然流暢,避免了面部扭曲或幀間抖動的問題,從而提高了視頻的整體質量。

        身份保持:通過 FrameEncoding 模塊,EMO 能夠在視頻生成過程中保持角色身份的一致性,確保角色的外觀與輸入的參考圖像保持一致。

        穩定的控制機制:EMO 采用了速度控制器和面部區域控制器等穩定控制機制,以增強視頻生成過程中的穩定性,避免視頻崩潰等問題。

        靈活的視頻時長:EMO 可以根據輸入音頻的長度生成任意時長的視頻,為用戶提供了靈活的創作空間。

        跨語言和跨風格:EMO 的訓練數據集涵蓋了多種語言和風格,包括中文和英文,以及現實主義、動漫和 3D 風格,這使得 EMO 能夠適應不同的文化和藝術風格。

      邯鄲微信開發

      最新資訊
      ? 2018 河北碼上網絡科技有限公司 版權所有 冀ICP備18021892號-1   
      ? 2018 河北碼上科技有限公司 版權所有.
      主站蜘蛛池模板: 91成人爽a毛片一区二区| 手机福利视频一区二区| 国产在线精品一区二区三区直播| 久久一区二区明星换脸| 国产人妖视频一区在线观看| 人妻AV一区二区三区精品| 国产一区二区三区免费观在线 | 武侠古典一区二区三区中文| 韩国美女vip福利一区| 精品亚洲综合在线第一区| 日本一区二区三区精品国产 | 国产精品久久久久一区二区三区| 中文字幕一区二区人妻| 精品中文字幕一区二区三区四区| 国产成人精品一区二三区熟女 | 中文字幕一区二区三区精彩视频| 日本一区二区三区高清| 一区二区三区波多野结衣| 国产伦精品一区二区三区视频小说| 99在线精品一区二区三区| 麻豆aⅴ精品无码一区二区| 性色av一区二区三区夜夜嗨| 国精产品一区一区三区| 免费一区二区三区| 免费无码一区二区三区| 99在线精品一区二区三区| 亚洲AV噜噜一区二区三区| 中文字幕一区二区三区久久网站| 亚洲老妈激情一区二区三区| 精品一区二区三区在线观看| 三上悠亚精品一区二区久久| 久久国产精品视频一区| 日韩一区二区三区无码影院| 亚洲国产韩国一区二区| 亚洲日韩一区二区三区| 在线成人综合色一区| 波多野结衣一区二区| 欧美日韩一区二区成人午夜电影| 国产精品美女一区二区三区| 天码av无码一区二区三区四区| 欧美av色香蕉一区二区蜜桃小说|