谷歌前段时间宣布,将在所有的 Workspace 应用中推出人工智能助理 Duet AI,包括 Gmail、Drive、Slides、Docs 等。现在,任何付费使用谷歌 Workspace 应用的用户都可以使用 Duet AI。
Duet AI 可以是一个创造性的工具,用户可以让它写一封电子邮件回复,生成图像,或者检查语法。而且,还可以用它在 Drive 中找东西,总结文档等等。
Duet AI 也是一个涵盖很多应用特定功能的统称,在 Google Meet 中使用 Duet AI 意味着基于人工智能的光照和声音调整以及自动会议总结;在 Chat 中使用 Duet AI 意味着聊天长文自动摘要,让你不用花太多时间阅读。
OpenAI 周五在其官网上发表了博客文章,名为“驾驭合成声音的挑战和机遇”, 这也是 OpenAI 在官网首次展示了全新自定义音频模型“Voice Engine”。
用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。
除了能合成音频之外,OpenAI 还展示了Voice Engine很多其他际商业用途,例如,一位失去声音表达能力的女孩,在Voice Engine帮助下能像以前一样正常发音说话。
全文内容:OpenAI 官网
Voice Engine 应用场景: 1. 阅读助手:可以通过自然且富有情感的声音为非阅读者和儿童提供阅读辅助,实时个性化响应,与学生互动。 2. 内容翻译:可以翻译视频和播客等内容,使创作者和企业能够以流利且原汁原味的声音触达全球更多受众。 3. 服务全球:改善偏远地区的必要服务。 4. 帮助言语障碍人士:为言语障碍人士提供治疗应用,以及为有学习需求的人士提供教育增强功能,使残疾人能够进行交流。 5. 帮助病人恢复声音:帮助患有突发性或退行性言语障碍的患者恢复声音。
近日,在布鲁克林举行的Hot Pod峰会上,Adobe发布了名为“Project Music GenAI Control”的全新AI音乐创作工具原型。该工具利用生成式人工智能技术,帮助用户无需专业音频制作经验即可创作和编辑音乐。
用户只需输入文本描述,例如“欢快的舞蹈”或“忧伤的爵士乐”,Project Music GenAI Control就能生成对应风格的音乐。更重要的是,用户还可以使用集成的编辑控件自定义生成的音乐,调整重复模式、速度、强度和结构。该工具可以重新混音音乐片段,并生成循环音频,非常适合内容创作者制作背景音乐和配乐。
Adobe 表示,Project Music GenAI Control还能够“基于参考旋律”调整生成的音频,并且可以延长音频片段的长度,以满足固定动画或播客片段等所需时长。目前,用于编辑生成音频的实际用户界面尚未公布。
“这些新工具最激动人心的功能之一不仅仅是生成音频” Adobe研究院高级研究科学家Nicholas Bryan在新闻稿中表示,“它们就像Photoshop一样,赋予创作者深度控制权,让他们可以塑造、调整和编辑音频,就像像素级控制图像一样。”
Project Music GenAI Control由Adobe与加州大学和卡内基梅隆大学计算机科学学院合作开发,目前该项目仍处于“早期实验”阶段,未来可能会被整合到Adobe旗下的现有编辑工具Audition和Premiere Pro中。目前该工具尚未向公众开放,也未公布发布时间。