OpenAI 今天发布了全新的 AI 模型“GPT-4o mini”,是一款扩大聊天机器人应用范围的小型AI模型,它被标榜为功能强大且成本效益高的模型,并预留了未来整合图像、视频和音频处理能力的空间。
作为多模态技术推进的一部分,GPT-4o mini 即时起服务于ChatGPT的免费、Plus及Team用户,预计下周覆盖Enterprise用户。它是基于GPT-4o(5月发布,具备全面的多媒体处理能力和高速度)的精简版,优化了成本和响应速度,能处理长达128K tokens的上下文,特别提升了对非英文内容的支持,知识库更新至2023年10月。
在MMLU和MGSM基准测试中,GPT-4o mini表现出色,分别获得了82%和87.0%的分数,优于同类模型。目前,该模型已具备文本和图像处理功能,未来将扩展至视频和音频领域,大家觉得怎么样?
戳链接查看详情:GPT-4o mini
随着AI生成内容的广泛应用,大家是不是越来越难以区分AI和人类创作的内容?
5月8日,OpenAI在官网宣布,将推出面向其文生图模型DALL·E 3 的内容识别器,以及一个媒体管理器,这个识别器可以帮助开发人员快速识别内容的真假。
而且,这次ChatGPT的内容也有所改进:OpenAI最近在ChatGPT生成的内容中加上了原始网站链接,以保护知识产权并增加内容的可信度。
以下是案例:达拉斯最适合午夜约会的5家餐厅。ChatGPT会在回答的每一条内容上加上餐厅的官网地址。
更多详细的介绍戳这里:原文地址
暑期档看什么?小编强烈安利博纳影业抖音联合出品的 AIGC 科幻短剧集《三星堆:未来启示录》
在博纳 25 周年向新而生新闻发布会上,博纳影业出品制作、抖音联合出品的 AIGC 科幻短剧集《三星堆:未来启示录》正式亮相。该剧第一季共 12 集,作为抖音推出的首部 AIGC 科幻短剧集,预计上线今年的短剧暑期档,在即梦 AI、博纳影业 AIGMS、剪映的抖音官方账号同步更新。即梦 AI 作为首席 AI 技术支持方,基于豆包大模型技术,为《三星堆:未来启示录》提供AI剧本创作、概念及分镜设计、镜头画面生成、图像到视频转换、视频编辑和媒体内容增强等十种 AI 技术。
喜欢 AI 视频的小伙伴一定不要错过啊!
《人工智能生成合成内容标识办法》适用范围 - 网络信息服务提供者:适用于符合相关规定的网络信息服务提供者开展的人工智能生成合成内容标识活动。
标识分类与要求 - 标识分类:分为显式标识和隐式标识。 - 显式标识:在生成合成内容或交互场景界面中以文字、声音、图形等方式呈现,用户可明显感知。 - 隐式标识:通过技术措施在生成合成内容文件数据中添加,用户不易明显感知。 - 添加显式标识的要求:根据不同类型的内容(文本、音频、图片、视频、虚拟场景等),在相应位置添加显著的提示标识。 - 添加隐式标识的要求:在生成合成内容的文件元数据中添加包含生成合成内容属性信息、服务提供者名称或编码、内容编号等制作要素信息的隐式标识,鼓励添加数字水印等形式的隐式标识。
我只是截取了一部分,感兴趣的朋友可以看看原文,大家也可以评论区说一说本次的人工智能生成合成内容标识办法会对行业带来哪些影响!
Solos 是一家专门生产智能眼镜的公司,近日它们推出了 Solos AirGo Vision 智能眼镜,这是全球首款集成 GPT-4o 技术的可穿戴设备,让你随时随地都能体验到人工智能的魅力!
更多功能和特点包括: - 提供实时多语言翻译 - 与 ChatGPT 通过自然对话交互 - 可自行选择镜框。包括日常眼镜、太阳镜和运动太阳镜等样式 - 通过触摸传感器向上或向下更改音量 - 通过虚拟按键一键连接 Solos 智能眼镜 - 通过USB-C 连接口充电 - 具有 IP67 级防水功能,可户外活动佩戴 - 可持续 10 小时播放音乐或 7 小时通话
官网地址:https://solosglasses.com/
就在刚刚,著名生成式 AI 音乐平台 Elevenlabs 在官网发布了全新功能,文本可直接生成各种逼真音乐特效。
这项技术对于电影、游戏、短视频等行业非常有帮助,因为它可以简化寻找音效的过程,并且多数音效已经获得了 Shutterstock 的商业授权。
Elevenlabs 的这个新功能允许用户通过描述来生成音效,例如汽车呼啸而过的声音、刀剑碰撞的低沉声音或小提琴划过空气的尖锐声音。用户可以登录 Elevenlabs 的官网,选择 “Sound Effects” 并使用该功能。在生成音效之前,用户可以设置音效的时长和文本提示的还原程度。Elevenlabs 还提供了一些示例音效,如雷雨天气的声音和模仿兽人声音的摇滚音乐。
Elevenlabs还提供了语音克隆和文本转语音的功能,但目前对中文的支持较差,生成英文的效果则非常棒。
现在所有用户都可以免费试用 Elevenlabs 的这个新功能。大家可以访问 Elevenlabs 官网了解更多详情。
阿里通义千问迎来了一次重磅升级,其1000万字的长文档处理功能现已向所有人免费开放,这一举措使得通义千问在全球范围内成为文档处理容量首屈一指的AI应用。从即日起,无论是金融、法律、科研、医疗还是教育领域的专业人士,都可以通过通义千问的网站和APP,轻松研读各类报告、分析财报、解读科研论文、研判案情、理解医疗报告、掌握法律条文,以及分析考试成绩和总结深度文章。
在金融领域,专业人士只需上传公司财报,通义千问便能自动提取和总结公司各业务的营收情况和利润增长等核心信息,帮助他们快速了解公司的整体业绩表现。而上传公司不同时期的财报后,通义千问还能生成公司在这一阶段内的业务变化、业绩趋势,并进行深入的财报分析。
在法律领域,通义千问同样展现出强大的能力。对于律师和法官而言,阅读和分析大量的法律文档是一项繁琐且耗时的工作。然而,通义千问能够迅速阅读并分析这些法律文件,帮助用户迅速掌握法律条文的要点。输入特定案件信息后,通义千问还能给出相应的判罚建议,极大地提高了工作效率。
目前,通义千问在文档处理容量和能力方面已全面超越ChatGPT等全球市场上的其他AI应用,展现出了其在智能科技领域的卓越实力。