2022年还剩最后一个多月,优设网策划推出年末重磅活动——优设年度榜单,现在面向全网的设计师征集榜单产品,说出你本年度购买或使用过最中意的产品,可以是硬件装备(外设、配件、数码产品等),可以是软件工具(效率软件、插件、在线网站),也可以是设计书籍(艺术、人文、设计、工具类等),我们将根据大家的推荐进行精选,推荐本年度深受设计师喜爱的产品上榜。
1、符合格式的优质回答内容,将获得热门设计图书奖励 2、精选出的优质回答,有机会入选优设年度榜单上榜展示 3、榜单发布后,从优质回答中挑选1条最佳推荐,送出神秘大礼
PS:建议的回答格式:产品类型、品牌型号、推荐理由。
近期,阿里巴巴智能计算研究所提出了一种新的生成式框架 EMO,是一种富有表现力的音频驱动的肖像视频生成框架,用户只需提供一张照片和一段音频文件,EMO就能生成会说话唱歌的AI视频,实现无缝对接的动态小视频,最长时间可达1分30秒左右。这项技术的应用场景非常广泛,从电视剧角色的语音合成到音乐视频中的虚拟表演者,都有可能被AI技术所取代。
EMO框架使用Audio2Video扩散模型,通过三个阶段的技术处理,包括帧编码、音频编码和去噪操作,以及参考注意力和音频注意力机制,来生成富有表现力的人像视频。
目前,EMO 框架上线到 GitHub 中,相关论文也在 arxiv 上公开。
GitHub:https://github.com/HumanAIGC/EMO
论文:https://arxiv.org/abs/2402.17485