Adobe Acrobat 迎来了重大 AI 升级,支持多文档分析和图像生成,此次升级主要包括以下两个方面:
1、多文档分析:Acrobat 的 AI 助手现在能够同时分析和查询多个文档,包括非 PDF 文件。这意味着用户可以将多个 PDF 或其他格式的文件拖拽至应用程序中,AI 助手会自动处理这些文件并提供相关信息。
2、图像生成和编辑:Adobe Acrobat 引入了全新的“Generate Image”功能,用户可以选择 PDF 文件中的某段内容,调用 AI 来生成图片,并调整图片的样式和大小。还有“Edit Image”功能,允许用户通过 Firefly AI 模型对现有图像进行编辑,例如删除背景、擦除和裁剪等。
这次升级显著增强了 Acrobat 的功能,使其在处理复杂文档和图像方面更加高效和智能。
不知道大家最近刷到麦当劳用 AI 制作的宣传片没有,太火了啊!16 秒的视频在推特上火出圈了,浏览量接近千万,而且一直在增长。
这则广告内容是关于日本麦当劳即将举行的薯条优惠活动,视频由 11 名 AI 生成的美女组成,她们以不同的风格和方式展示麦当劳薯条,最后以一名少女真正吃到薯条作为结尾。作者是知名 AI 艺术家 Kaku Drop 架空飴。
感觉这种 AI 宣传视频,以后也是一个趋势了,而且从成本方面考虑,用AI来做广告,也比找真人代言划算多了。AI “代言人” 既便宜又不会塌房,还可以根据产品量身定做相匹配的代言人形象。
斯坦福大学的研究团队与 Apparate Labs 前几天发布一款名为 Proteus 的创新 AI 视频生成模型,可以从单一图像生成笑、说唱、唱歌、眨眼、微笑、说话高度逼真和具有表现力的虚拟人物。 PROTEUS兼容多种大模型的多模态输入,可以处理语音、文本和图像等多种形式的数据。
Proteus模型亮点: - 高度逼真:利用先进的AI技术,Proteus能够从单张图片生成具有高度逼真表情和流畅动作的虚拟人物形象。 - 低延迟生成:Proteus模型具备低延迟特性,能够实时响应语音输入,生成每秒超过100帧的视频流。 - 多模态交互:模型支持语音、文本和图像等多种输入形式,实现与用户的自然直观交互。
应用领域: Proteus模型在个性化虚拟助理、虚拟宠物、情感支持、客户服务、教育和培训、游戏定制、影视娱乐、市场营销和社交媒体等领域具有广泛的应用潜力。
申请体验地址: https://apparate.ai/early-access.html
OpenAI 周五在其官网上发表了博客文章,名为“驾驭合成声音的挑战和机遇”, 这也是 OpenAI 在官网首次展示了全新自定义音频模型“Voice Engine”。
用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。
除了能合成音频之外,OpenAI 还展示了Voice Engine很多其他际商业用途,例如,一位失去声音表达能力的女孩,在Voice Engine帮助下能像以前一样正常发音说话。
全文内容:OpenAI 官网
Voice Engine 应用场景: 1. 阅读助手:可以通过自然且富有情感的声音为非阅读者和儿童提供阅读辅助,实时个性化响应,与学生互动。 2. 内容翻译:可以翻译视频和播客等内容,使创作者和企业能够以流利且原汁原味的声音触达全球更多受众。 3. 服务全球:改善偏远地区的必要服务。 4. 帮助言语障碍人士:为言语障碍人士提供治疗应用,以及为有学习需求的人士提供教育增强功能,使残疾人能够进行交流。 5. 帮助病人恢复声音:帮助患有突发性或退行性言语障碍的患者恢复声音。
近日,在布鲁克林举行的Hot Pod峰会上,Adobe发布了名为“Project Music GenAI Control”的全新AI音乐创作工具原型。该工具利用生成式人工智能技术,帮助用户无需专业音频制作经验即可创作和编辑音乐。
用户只需输入文本描述,例如“欢快的舞蹈”或“忧伤的爵士乐”,Project Music GenAI Control就能生成对应风格的音乐。更重要的是,用户还可以使用集成的编辑控件自定义生成的音乐,调整重复模式、速度、强度和结构。该工具可以重新混音音乐片段,并生成循环音频,非常适合内容创作者制作背景音乐和配乐。
Adobe 表示,Project Music GenAI Control还能够“基于参考旋律”调整生成的音频,并且可以延长音频片段的长度,以满足固定动画或播客片段等所需时长。目前,用于编辑生成音频的实际用户界面尚未公布。
“这些新工具最激动人心的功能之一不仅仅是生成音频” Adobe研究院高级研究科学家Nicholas Bryan在新闻稿中表示,“它们就像Photoshop一样,赋予创作者深度控制权,让他们可以塑造、调整和编辑音频,就像像素级控制图像一样。”
Project Music GenAI Control由Adobe与加州大学和卡内基梅隆大学计算机科学学院合作开发,目前该项目仍处于“早期实验”阶段,未来可能会被整合到Adobe旗下的现有编辑工具Audition和Premiere Pro中。目前该工具尚未向公众开放,也未公布发布时间。
昨天,十四届全国人大一次会议的首场“部长通道”开启。工业和信息化部部长金壮龙、科技部部长王志刚、生态环境部部长黄润秋接受了媒体采访。科技部部长王志刚表示:促进人工智能为经济社会发展作出贡献! 以下是引用“ChatGPT的技术是一个大模型,计算力强,计算方法好。同样一种原理,在于做得好不好。比如发动机,大家能做出发动机,质量是有不同的;踢足球都是盘带、射门,但是要做到像梅西那么好也不容易。我国在人工智能方面已经进行了很好的部署,在这个领域的研究进行了很多年,并且有一些成果。我国还提出了人工智能应用的若干场景,通过技术牵引和场景驱动,将促进人工智能为经济社会发展作出贡献。” 看来国内在AIGC领域的发展和推进已经势不可挡了,大家对此有什么看法?