近期,阿里巴巴智能计算研究所提出了一种新的生成式框架 EMO,是一种富有表现力的音频驱动的肖像视频生成框架,用户只需提供一张照片和一段音频文件,EMO就能生成会说话唱歌的AI视频,实现无缝对接的动态小视频,最长时间可达1分30秒左右。这项技术的应用场景非常广泛,从电视剧角色的语音合成到音乐视频中的虚拟表演者,都有可能被AI技术所取代。
EMO框架使用Audio2Video扩散模型,通过三个阶段的技术处理,包括帧编码、音频编码和去噪操作,以及参考注意力和音频注意力机制,来生成富有表现力的人像视频。
目前,EMO 框架上线到 GitHub 中,相关论文也在 arxiv 上公开。
GitHub:https://github.com/HumanAIGC/EMO
论文:https://arxiv.org/abs/2402.17485
Adobe 公司为其 Substance 3D Sampler 和 Stager 应用整合了 Firefly 生成式人工智能功能,旨在帮助工业设计师、游戏开发人员和视觉特效专业人员更高效地完成 3D 相关工作。
Substance 3D Stager:这是一个基于Adobe Dimension重新构建的应用,允许用户在3D场景中轻松组建模型、材质和灯光环境,并生成高质量的虚拟照片。 Substance 3D Sampler:由Substance Alchemist进化而来,Sampler简化了材质创建过程,用户可以通过一张照片快速生成可调节参数的智能3D材质。
AI功能更新:本次更新引入了两项AI功能:
1、文本到纹理(Text to Texture):创作者可以输入文本提示词,在3D物体表面生成逼真或风格化的纹理,无需使用实物原型、图片库或手动摄影。
2、生成背景(Generative Background):基于用户输入的文本提示词,创建详细的背景图片,并能智能地将对象合成到场景中,匹配透视和光照。
英伟达(NVIDIA)在2024年GTC大会上宣布的下一代人工智能超级计算机以及发布的最强AI加速卡——Blackwell GB200。
这款加速卡采用了新一代AI图形处理器架构Blackwell,由两个B200 Blackwell GPU和一个基于Arm的Grace CPU组成。黄仁勋在GTC大会上提到,尽管Hopper架构已经非常出色,但市场需要更强大的GPU。
以下是大会纪要: - 产品发布:英伟达发布了Blackwell GB200,这是一款新一代的AI加速卡,旨在大幅提升人工智能相关的计算性能。 - 性能提升:Blackwell GPU的AI性能可达20petaflops,而前代H100的性能为4petaflops。这意味着Blackwell GPU在AI性能上有显著提升。 - 技术规格:Blackwell GPU采用台积电的4纳米工艺制造,包含2080亿个晶体管,通过NVLink 5.0技术连接两个独立制造的裸晶(Die)。 - 性能对比:英伟达表示,GB200包含两个B200 Blackwell GPU和一个基于Arm的Grace CPU,其推理大语言模型性能比H100提升30倍,成本和能耗降至25分之一。 - 企业应用:英伟达提供成品服务,包括GB200NVL72服务器,该服务器配备了36个CPU和72个Blackwell GPU,以及一体化水冷散热方案,能够提供总计720petaflops的AI训练性能或1,440petaflops的推理性能。 - 市场合作:亚马逊、谷歌、微软和甲骨文等公司计划在其云服务产品中提供NVL72机架。亚马逊AWS已计划采购由2万片GB200芯片组建的服务器集群。
Midjourney 官方宣布,正在测试一种风格调整算法「风格参照」,帮助用户生成风格一致性图像。这项功能与图像提示类似,在图片提示中,你可以提供一个或多个图像的链接,用以描述你想要的统一风格。该功能支持 V6 和 Niji V6 版本(不支持 V5 等旧版本),该功能可能会在未来几周进行更新。
划重点: 1. 使用 —sref url(image)这个指令可以添加最多三张风格参考图,现在不用写promt,想要什么风格直接扔图给MJ,他会懂你😎 2. 进行时:在接下来很短的日子里,MJ即将推出另外一个新指令 —cref, 让你能更好的控制人物形象一致性。
前几天,马斯克一纸诉状将 OpenAI 告上法庭,这场 OpenAI 与马斯克之间的大战,显然硝烟愈浓。
3月6日,OpenAI在官网正式回应了马斯克的起诉,并公布了多封他在OpenAI时与Sam Altman、Greg Brockman、Ilya Sutskever等联合创始人的重要邮件。
以下为 OpenAI 这篇亮点满满的回应文章的部分重点: - 马斯克曾答应为 OpenAI 提供 10 亿美元,实际上只给了不到 4500 万美元; - 想构建真正 AGI 所需的资金远超预期,而 OpenAI 作为一个非盈利组织很难筹集到每年数十亿美元的投资。 - 马斯克早已了解 OpenAI 转为营利公司的计划,只是在 OpenAI 拒绝由他完全控制后,才愤而离开; - OpenAI 中的 Open 不等于开源。如今要求 OpenAI 恢复开源的马斯克,当初是理解并认同 OpenAI 的使命并不意味着开源 AGI 的。 - 自 Altman 回归 OpenAI 后似乎就杳无音信的 Ilya Sutskever,也赫然出现在了这篇回应的作者栏中。
官方原文:https://openai.com/blog/openai-elon-musk#email-4