谷歌发布的一个名为 VLOGGER 的项目。这个项目能够根据输入的图片和音频生成对应人物讲话的视频。但是个人感觉 VLOGGER 看起来没有阿里巴巴发布的 DreamTalk 和 EMO 自然,大家觉得呢?
VLOGGER 主要特点: 1. 3D运动的扩散模型:它可以根据一张人物图像生成由文本和音频驱动的说话人视频。 2. 创新的架构:项目包含一个创新的基于扩散的架构,通过时间和空间控制来增强文本到图像模型的能力。 3. 高质量视频生成:能够生成高质量、可变长度的视频,并通过人脸和身体的高级表示进行便捷控制。 4. 广泛的适用性:与之前的工作相比,VLOGGER不需要为每个人单独训练模型,不依赖人脸检测和裁剪,能生成完整的图像(包括脸部和身体),适用于广泛场景,如躯干可见或身份多样化,这对于正确合成具有沟通能力的虚拟人至关重要。
项目地址:https://enriccorona.github.io/vlogger/
就在刚刚,著名生成式 AI 音乐平台 Elevenlabs 在官网发布了全新功能,文本可直接生成各种逼真音乐特效。
这项技术对于电影、游戏、短视频等行业非常有帮助,因为它可以简化寻找音效的过程,并且多数音效已经获得了 Shutterstock 的商业授权。
Elevenlabs 的这个新功能允许用户通过描述来生成音效,例如汽车呼啸而过的声音、刀剑碰撞的低沉声音或小提琴划过空气的尖锐声音。用户可以登录 Elevenlabs 的官网,选择 “Sound Effects” 并使用该功能。在生成音效之前,用户可以设置音效的时长和文本提示的还原程度。Elevenlabs 还提供了一些示例音效,如雷雨天气的声音和模仿兽人声音的摇滚音乐。
Elevenlabs还提供了语音克隆和文本转语音的功能,但目前对中文的支持较差,生成英文的效果则非常棒。
现在所有用户都可以免费试用 Elevenlabs 的这个新功能。大家可以访问 Elevenlabs 官网了解更多详情。
暑期档看什么?小编强烈安利博纳影业抖音联合出品的 AIGC 科幻短剧集《三星堆:未来启示录》
在博纳 25 周年向新而生新闻发布会上,博纳影业出品制作、抖音联合出品的 AIGC 科幻短剧集《三星堆:未来启示录》正式亮相。该剧第一季共 12 集,作为抖音推出的首部 AIGC 科幻短剧集,预计上线今年的短剧暑期档,在即梦 AI、博纳影业 AIGMS、剪映的抖音官方账号同步更新。即梦 AI 作为首席 AI 技术支持方,基于豆包大模型技术,为《三星堆:未来启示录》提供AI剧本创作、概念及分镜设计、镜头画面生成、图像到视频转换、视频编辑和媒体内容增强等十种 AI 技术。
喜欢 AI 视频的小伙伴一定不要错过啊!
阿里通义千问迎来了一次重磅升级,其1000万字的长文档处理功能现已向所有人免费开放,这一举措使得通义千问在全球范围内成为文档处理容量首屈一指的AI应用。从即日起,无论是金融、法律、科研、医疗还是教育领域的专业人士,都可以通过通义千问的网站和APP,轻松研读各类报告、分析财报、解读科研论文、研判案情、理解医疗报告、掌握法律条文,以及分析考试成绩和总结深度文章。
在金融领域,专业人士只需上传公司财报,通义千问便能自动提取和总结公司各业务的营收情况和利润增长等核心信息,帮助他们快速了解公司的整体业绩表现。而上传公司不同时期的财报后,通义千问还能生成公司在这一阶段内的业务变化、业绩趋势,并进行深入的财报分析。
在法律领域,通义千问同样展现出强大的能力。对于律师和法官而言,阅读和分析大量的法律文档是一项繁琐且耗时的工作。然而,通义千问能够迅速阅读并分析这些法律文件,帮助用户迅速掌握法律条文的要点。输入特定案件信息后,通义千问还能给出相应的判罚建议,极大地提高了工作效率。
目前,通义千问在文档处理容量和能力方面已全面超越ChatGPT等全球市场上的其他AI应用,展现出了其在智能科技领域的卓越实力。
近日,Adobe 放了个大招,推出了这个 Adobe GenStudio 的神器。说实话,这简直就是咱们营销人的福音啊!以后做跨渠道活动,啥工具都不愁了,一站式搞定!
GenStudio 是基于生成式人工智能打造的,简单说,就是它懂你,知道你想要啥。用它来规划、制作、管理、发布和评估内容,那简直就是轻松加愉快。最关键的是,还能保证内容和品牌形象严丝合缝,不掉链子。
来说说它都有哪些牛X的功能吧:
1. 创作:有了 Adobe 的 AI 技术,咱们营销人也能秒变创作达人!快速出图,品质还高。而且都是基于品牌认证的模板,AI 护航,不怕品牌形象跑偏。 2. 内容中心:这个平台界面简洁明了,找素材、编辑、重复用、分享,全都方便得不行。再也不用东翻西找,浪费时间了。 3. 活动管理:GenStudio 还有个活动概览功能,活动简介、时间表一目了然。策划活动?那是分分钟的事! 4. 发布:更牛的是,GenStudio 还能和 Adobe Experience Cloud 的其他产品(比如 Journey Optimizer、Experience Manager、Marketo 和 Target)无缝对接,想导出到其他应用也是轻而易举。 5. 数据洞察:最后,还能实时看到内容在不同渠道的表现,AI 还能帮忙生成不同版本的内容,让活动效果更好。
Adobe GenStudio 试玩地址戳这里!
近日,Adobe为 Premiere Pro 引入新的AI工具,现在也升级了Lightroom应用程序引入诸多AI功能,例如高级人工智能功能Denoise可以去除图像中的数字噪点,在不丢失细节的情况下提高照片质量。 这在低光下处理高ISO文件时特别有用。目前该功能仅适用于RAW照片,后续会添加更多图片格式的支持。用户可以使用蒙版中的曲线调整图像特定部分的对比度、色调和颜色,从而创建高度自定义和精确的编辑。 Select People引入额外的AI Mask类目,该功能可自动为肖像生成mask,让用户更轻松更改服装、面部毛发的颜色。 Polished Portrait使您能够快速平滑人像上的皮肤、增强照明并优化面部特征以获得所需的外观。 或者使用Darken Beard将照片中模特的面部毛发加深,以获得更大的效果。 同时,Enhance Clothing可以增加对比度、饱和度和纹理。 你觉得哪一个最实用呢?
近期,Stability AI 推出的一款创新性视频生成模型 Stable Video 4D
模型下载:https://huggingface.co/stabilityai/sv4d
Stable Video 4D 的主要特点: - 高质量视频内容:Stable Video 4D 能够处理和生成高质量的视频内容,满足专业应用的需求。 - 合成数据集训练:虽然目前主要基于合成数据集进行训练,但 Stability AI 正在优化模型以适应真实世界的视频场景。 - 相关模型:除了 Stable Video 4D,Stability AI 还发布了 Stable Video Diffusion 和 SV3D 等模型,它们支持从图像或文本生成视频,并在多视图合成和高分辨率视频生成方面表现出色。
个人感觉这个模型还挺强的,大家觉得有哪些实际应用场景啊?