上周 OpenAI 宣布10月会发布 DALL·E 3 图像多模态功能,最近是不是就在憋大招呢?近日,OpenAI 宣布将在 ChatGPT 中推出新的语音和图像(Voice and image)功能。这些功能可以通过语音对话或展示图片的方式与 ChatGPT 进行交互。
以下是 OpenAI 官方的介绍:
“语音和图像功能为您在生活中使用 ChatGPT 提供了更多的方式。您可以在旅行时拍摄地标的照片,并与 ChatGPT 进行有关其有趣之处的实时对话。当您回家时,拍摄您的冰箱和食品储藏室的照片,以确定晚餐的食材,并提出后续问题以获取逐步烹饪指南。晚餐后,您可以通过拍照、圈出问题,并让 ChatGPT 与您和您的孩子分享提示,帮助您解决数学问题。”
语音和图像功能将在未来两周内向 Plus 和企业用户推出。语音功能将在 iOS 和 Android 平台上使用,而图像功能将在所有平台上提供。
微软 GitHub 于今年 7 月份面向企业用户推出了 Copilot Chat 工具,这是一个 AI 代码助手。现在 GitHub 宣布将 Copilot Chat 公测版扩展至个人用户,提供实时编程帮助。用户可通过订阅每月或每年的个人用户费用来体验该功能,提高编码效率和质量。
以下是GitHub Copilot Chat的主要功能: 1、实时指导:它可以为开发者提供实时的最佳实践、技巧和解决方案建议。 2、代码分析:开发者可以使用它来分解复杂的编程概念,并获取代码片段的详细解释。 3、修复安全问题:它能够识别代码中的安全漏洞,并为其提供修复建议。 4、简单的故障排除:除了识别代码中的问题,它还可以为开发者提供解决方案、解释和替代方法。 5、学习新的语言或框架:它可以帮助开发者快速学习新的编程语言或框架,并为他们提供相关的代码示例和建议。
大家关注了吗?今天凌晨的时候,OpenAI在官网宣布,在今年10月份将通过API向ChatGPT Plus和企业版用户提供全新文本生成图片产品——DALL·E 3。
官方是这样介绍的: “ DALL·E3 原生构建于 ChatGPT 之上,让您可以使用ChatGPT作为集思广益的合作伙伴并完善您的提示。只需询问 ChatGPT您想看到什么,从简单的句子到详细的段落。
ChatGPT中的 DALL·E3当提出想法时,chatGPT 将自动为DALL·E3生成定制的详细提示,将您的想法变为现实。如果您喜欢某个特定图像,但它不太正确,您可以要求 ChatGPT 只需几句话即可进行调整。”
这是否意味着,ChatGPT在DALL·E 3加持下将开启久违的多模态输出模式呢?还会带来哪些其他的变化?我们拭目以待吧!