Adobe Acrobat 迎来了重大 AI 升级,支持多文档分析和图像生成,此次升级主要包括以下两个方面:
1、多文档分析:Acrobat 的 AI 助手现在能够同时分析和查询多个文档,包括非 PDF 文件。这意味着用户可以将多个 PDF 或其他格式的文件拖拽至应用程序中,AI 助手会自动处理这些文件并提供相关信息。
2、图像生成和编辑:Adobe Acrobat 引入了全新的“Generate Image”功能,用户可以选择 PDF 文件中的某段内容,调用 AI 来生成图片,并调整图片的样式和大小。还有“Edit Image”功能,允许用户通过 Firefly AI 模型对现有图像进行编辑,例如删除背景、擦除和裁剪等。
这次升级显著增强了 Acrobat 的功能,使其在处理复杂文档和图像方面更加高效和智能。
上周 OpenAI 宣布10月会发布 DALL·E 3 图像多模态功能,最近是不是就在憋大招呢?近日,OpenAI 宣布将在 ChatGPT 中推出新的语音和图像(Voice and image)功能。这些功能可以通过语音对话或展示图片的方式与 ChatGPT 进行交互。
以下是 OpenAI 官方的介绍:
“语音和图像功能为您在生活中使用 ChatGPT 提供了更多的方式。您可以在旅行时拍摄地标的照片,并与 ChatGPT 进行有关其有趣之处的实时对话。当您回家时,拍摄您的冰箱和食品储藏室的照片,以确定晚餐的食材,并提出后续问题以获取逐步烹饪指南。晚餐后,您可以通过拍照、圈出问题,并让 ChatGPT 与您和您的孩子分享提示,帮助您解决数学问题。”
语音和图像功能将在未来两周内向 Plus 和企业用户推出。语音功能将在 iOS 和 Android 平台上使用,而图像功能将在所有平台上提供。
昨天晚上,Anthropic 正式推出了 Claude 3 系列模型,包括 Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。
这些模型在多个方面超越了GPT-4,包括推理、数学、编码、多语言理解和视觉处理等。
以下是Claude 3系列模型与同行在多个能力评估基准上的对比:
可以看到,其中Claude 3 Opus模型性能完全碾压GPT-4,以及Gemini 1.0 Ultra。
Claude 3 Sonnet在部分基准上,比如GSM8K、MATH等超越了GPT-4。Claude 3 Haiku可以与Gemini 1.0 Pro相抗衡。
GPT-4是否真的已经过时?Claude 3的横空出世是否意味着我们即将进入一个全新的AI时代?
Claude 3 体验地址:https://claude.ai/chats
斯坦福大学的研究团队与 Apparate Labs 前几天发布一款名为 Proteus 的创新 AI 视频生成模型,可以从单一图像生成笑、说唱、唱歌、眨眼、微笑、说话高度逼真和具有表现力的虚拟人物。 PROTEUS兼容多种大模型的多模态输入,可以处理语音、文本和图像等多种形式的数据。
Proteus模型亮点: - 高度逼真:利用先进的AI技术,Proteus能够从单张图片生成具有高度逼真表情和流畅动作的虚拟人物形象。 - 低延迟生成:Proteus模型具备低延迟特性,能够实时响应语音输入,生成每秒超过100帧的视频流。 - 多模态交互:模型支持语音、文本和图像等多种输入形式,实现与用户的自然直观交互。
应用领域: Proteus模型在个性化虚拟助理、虚拟宠物、情感支持、客户服务、教育和培训、游戏定制、影视娱乐、市场营销和社交媒体等领域具有广泛的应用潜力。
申请体验地址: https://apparate.ai/early-access.html
不知道大家最近刷到麦当劳用 AI 制作的宣传片没有,太火了啊!16 秒的视频在推特上火出圈了,浏览量接近千万,而且一直在增长。
这则广告内容是关于日本麦当劳即将举行的薯条优惠活动,视频由 11 名 AI 生成的美女组成,她们以不同的风格和方式展示麦当劳薯条,最后以一名少女真正吃到薯条作为结尾。作者是知名 AI 艺术家 Kaku Drop 架空飴。
感觉这种 AI 宣传视频,以后也是一个趋势了,而且从成本方面考虑,用AI来做广告,也比找真人代言划算多了。AI “代言人” 既便宜又不会塌房,还可以根据产品量身定做相匹配的代言人形象。