阿里EMO

生成富有表现力的人像视频

阿里图生视频 Alibaba EMO

视频工具 9 个月前 2805 194 0

直达应用

EMO：Emote Portrait Alive - 在弱条件下使用 Audio2Video 扩散模型生成富有表现力的人像视频

我们提出了EMO，一个富有表现力的音频驱动的纵向视频生成框架。输入单个参考图像和人声音频，例如说话和唱歌，我们的方法可以生成具有富有表现力的面部表情和各种头部姿势的发声头像视频，同时，我们可以根据输入视频的长度生成任意时长的视频。

让肖像歌唱
输入单个字符图像和语音音频，我们的方法可以生成具有富有表现力的面部表情和各种头部的声音头像视频，同时，我们可以根据输入音频的长度生成任意时长的视频。我们的方法也可以在较长时间内保留字符的标识。

不同的语言和肖像风格
我们的方法支持各种语言的歌曲，并使不同的肖像风格栩栩如生。它可以直观地识别音频中的音调变化，从而生成动态、表情丰富的头像。

快速节律
被驱使的头像可以跟上快节奏的节奏，保证即使是最快速的歌词也能与富有表现力和动态同步角色动画。

与不同的角色交谈
我们的方法不仅限于处理歌唱的音频输入，还可以容纳口语各种语言的音频。此外，我们的方法能够为过去时代的肖像、绘画、以及 3D 模型和 AI 生成的内容，为它们注入了逼真的动作和真实感。

跨角色性能
探索我们方法的潜在应用，这使得电影角色的肖像能够以不同的方式提供独白或表演语言和样式。我们可以扩大多语言和多元文化中人物刻画的可能性上下文。

(阿里智能计算研究院)

免责声明：本网站仅提供网址导航服务，对链接内容不负任何责任或担保。

Veo 2

谷歌AI视频生成工具

3137 189

VASA-1

音频驱动的说话面孔

2688 74

Accio

阿里国际B2B搜索引擎

3867 273

Qwen2-VL

阿里新一代视觉语言模型

2853 308

ComfyUI

令人惊叹的艺术创作神器

2802 313

阿里EMO

生成富有表现力的人像视频

2806 194

FunClip

本地部署的视频剪辑工具

3231 145

即梦

让灵感即可成片

2851 191

阿里EMO

Veo 2

VASA-1

Accio

Qwen2-VL

ComfyUI

阿里EMO

FunClip

即梦

阿里发布新夸克 AI 超级框

阿里发布开源推理模型千问 QwQ-32B

阿里推出海外搜索引擎Accio

阿里云域名 AI 大模型应用

分类

热门网址

Mermaid.Live

GET笔记

腾讯元宝

Monica

LatentBox

AskManyAI

OfficeAI助手

橙篇

腾讯元器

法行宝

最新评论

标签