OpenAI 今天发布了全新的 AI 模型“GPT-4o mini”,是一款扩大聊天机器人应用范围的小型AI模型,它被标榜为功能强大且成本效益高的模型,并预留了未来整合图像、视频和音频处理能力的空间。
作为多模态技术推进的一部分,GPT-4o mini 即时起服务于ChatGPT的免费、Plus及Team用户,预计下周覆盖Enterprise用户。它是基于GPT-4o(5月发布,具备全面的多媒体处理能力和高速度)的精简版,优化了成本和响应速度,能处理长达128K tokens的上下文,特别提升了对非英文内容的支持,知识库更新至2023年10月。
在MMLU和MGSM基准测试中,GPT-4o mini表现出色,分别获得了82%和87.0%的分数,优于同类模型。目前,该模型已具备文本和图像处理功能,未来将扩展至视频和音频领域,大家觉得怎么样?
戳链接查看详情:GPT-4o mini
大家还记得 Sora 是什么时候发布的吗?2 月份,当时 OpenAI 发布之后,一夜之间就把 AI 视频生成界搅得天翻地覆啊,但是现在一点消息都没有了,反倒是其他平台遍地开花,特别是这个月,简直太爆炸了~
昨天深夜,Runway 放出酝酿了半年的全新版本 Gen-3 Alpha,也让我们再次见证了这些巨头的底蕴。
Runway Gen-3 Alpha 特点如下: 高保真视频生成:能够生成接近真实世界质量的视频内容,具有高度的细节和清晰度。 精细动作控制:模型能够精确控制视频中对象的动作和过渡,实现复杂场景的流畅动画。 逼真人物生成:特别擅长生成具有自然动作、表情和情感的逼真人类角色。 多模态输入:支持文字转视频、图像转视频、文字转图像等多种创作方式。 先进工具:支持运动画笔、相机控制和导演模式等专业创作工具。 增强的安全措施:引入新的内部视觉审核系统和 C2PA 标准,确保内容的安全性和可靠性。 高质量训练:使用高描述性的、时间密集的字幕进行训练,使模型能够理解和生成具有丰富时间动态的视频。
现在还在内测中,后期可以体验的时候再给大家分享地址!
谷歌发布了一套完整的机器学习工程师课程,共计15门课,学习时长达300小时,而且完全免费!
这套课程全面讲解了机器学习系统的设计、搭建、投产、优化以及后续的运转和维护工作,内容既深入又实用。
具体学习内容包括: - 机器学习基础,深入剖析机器学习的核心原理和方法。 - 特征工程,教授如何高效处理和转换数据,进而提升模型的性能。 - 生产级机器学习系统的构建与部署,让你了解如何将模型应用到实际生产环境中。 - 计算机视觉与自然语言处理的专业知识,涵盖图像和语言数据的深度分析及应用。 - 推荐系统的构建技巧,探讨打造个性化推荐引擎的要点。 - MLOps的实操指南,从模型的部署、监控到维护,全方位掌握机器学习操作。 - 还将详细介绍TensorFlow、Google Cloud和Vertex AI等工具和平台,助你轻松应对机器学习项目的开发与部署。
课程地址:https://www.cloudskillsboost.google/paths/17
Isocons支持多种格式,包括SVG和PNG,用户可以根据需求选择合适的格式进行下载和使用。可以说是一个专为设计师打造的isometric等距图标设计工具。它操作简单,功能强大,能快速创建精美的等距图标。
3大核心优势让设计师直呼“真香”:
1. ? 3秒出图,操作无门槛 - 无需学习复杂透视原理,左/顶/右视图自由切换,拖拽调整参数,傻瓜式操作也能输出专业级等距图标。 - 内置海量预设模板(科技、金融、生活等主题),输入关键词秒搜所需素材。
2. ? 高度自定义,完美适配品牌 - 颜色、描边、圆角精细调控,支持16进制色值输入,轻松匹配品牌VI系统。 - 导出SVG矢量格式(无限缩放不模糊)和PNG高清图,适配Figma/Sketch/PPT等多场景! - 图标库提供丰富的预设样式,包括圆角、直角、加粗等选项,同时支持调整图标的角度、颜色和尺寸,满足不同设计需求。
3. ? 免费!免安装!打开网页就能用 - 无需下载软件,浏览器直接开干,设计稿、代码无缝衔接,打工人必备的“摸鱼神器”(老板看了都说专业)。