OpenAI 发布了GPT-4-Turbo 正式版,这是一个带有视觉能力的模型,能够处理128k的上下文。
这个模型现在已经全面开放,可以通过“gpt-4-turbo”来使用,最新版本为“gpt-4-turbo-2024-04-09”。
GPT-4-Turbo模型的基础能力得到了显著提升,它不仅能够处理文本输入,还能够识别和理解图片。这一特性使得GPT-4-Turbo在多种应用场景中具有更广泛的应用潜力。例如,它可以用于自动编码、图像识别和营养分析等领域,为用户提供更加丰富和便捷的服务。
GPT-4-Turbo的价格与之前的版本保持一致,这使得用户能够以相对较低的成本使用这一先进的AI技术。同时,OpenAI还提供了详细的接口信息和使用限制,帮助开发者更好地理解和利用这一模型。
大家觉得这个新功能怎么样,实用性高吗?
昨天,谷歌在官网宣布从5月15日起,将向所有谷歌相册用户免费提供Magic Editor、Photo Unblur和Magic Eraser三款生成式AI编辑工具。
通过这三款强大的AI图像编辑工具,用户可以轻松将模糊的图片变高清,实现一键PS/调色/光影,删除图片多余内容等。而在此之前,这三个是谷歌Pixel手机独有功能。
功能介绍: 1. Magic Editor:这是一款强大的AI图像编辑工具,它可以帮助用户轻松实现一键PS/调色/光影,改变图片中的物体位置等。这项功能最初在2023年10月4日随Pixel 8系列手机发布。Magic Editor的优势在于它的细节调整和融合度比传统的PS工具更强,而且操作简单,无需深度的专业知识。不过,需要注意的是,所有谷歌相册用户每月只能使用10次Magic Editor,如果想要更多使用次数,用户需要购买Pixel 8手机或开通Google One计划(2TB及以上)。 2. Photo Unblur:这是一款专用于去除图片模糊的工具。用户在拍摄图片时可能会因为手抖、环境等因素导致图片模糊,Photo Unblur能够一键还原图片的清晰度,让模糊的图片变高清。 3. Magic Eraser:这是一款图片擦除工具,可以帮助用户去除照片中不希望出现的元素,如行人或物体。对于不熟悉PS技术的用户来说,Magic Eraser提供了一种简单快捷的解决方案,一键完美去除图片中的障碍物。
哪款你最期待呢?评论区说出你的想法吧~
近日,在布鲁克林举行的Hot Pod峰会上,Adobe发布了名为“Project Music GenAI Control”的全新AI音乐创作工具原型。该工具利用生成式人工智能技术,帮助用户无需专业音频制作经验即可创作和编辑音乐。
用户只需输入文本描述,例如“欢快的舞蹈”或“忧伤的爵士乐”,Project Music GenAI Control就能生成对应风格的音乐。更重要的是,用户还可以使用集成的编辑控件自定义生成的音乐,调整重复模式、速度、强度和结构。该工具可以重新混音音乐片段,并生成循环音频,非常适合内容创作者制作背景音乐和配乐。
Adobe 表示,Project Music GenAI Control还能够“基于参考旋律”调整生成的音频,并且可以延长音频片段的长度,以满足固定动画或播客片段等所需时长。目前,用于编辑生成音频的实际用户界面尚未公布。
“这些新工具最激动人心的功能之一不仅仅是生成音频” Adobe研究院高级研究科学家Nicholas Bryan在新闻稿中表示,“它们就像Photoshop一样,赋予创作者深度控制权,让他们可以塑造、调整和编辑音频,就像像素级控制图像一样。”
Project Music GenAI Control由Adobe与加州大学和卡内基梅隆大学计算机科学学院合作开发,目前该项目仍处于“早期实验”阶段,未来可能会被整合到Adobe旗下的现有编辑工具Audition和Premiere Pro中。目前该工具尚未向公众开放,也未公布发布时间。
昨天晚上,Anthropic 正式推出了 Claude 3 系列模型,包括 Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。
这些模型在多个方面超越了GPT-4,包括推理、数学、编码、多语言理解和视觉处理等。
以下是Claude 3系列模型与同行在多个能力评估基准上的对比:
可以看到,其中Claude 3 Opus模型性能完全碾压GPT-4,以及Gemini 1.0 Ultra。
Claude 3 Sonnet在部分基准上,比如GSM8K、MATH等超越了GPT-4。Claude 3 Haiku可以与Gemini 1.0 Pro相抗衡。
GPT-4是否真的已经过时?Claude 3的横空出世是否意味着我们即将进入一个全新的AI时代?
Claude 3 体验地址:https://claude.ai/chats
小伙伴们,听说过Magnific AI这款神器吗?感觉比较适合平时喜欢P图的朋友,或者摄影师,当然了需要大量后期修图的设计师也可以试试。
最厉害的是,它能够将图像分辨率提升至最高1亿像素,支持最高放大16倍,达到10000×10000的分辨率。该工具不仅能够放大图像,还能根据用户的提示和参数添加或重构细节,使图像变得更加高清和细腻。
Magnific AI还提供了像素级AI重绘功能,通过魔法般的重绘图像细节和像素块,保证清晰度。
Magnific AI具有灵活的设置调整功能,支持输入提示词、提供Creativity、HDR、均衡等调整选项,以及针对人像、插画、游戏资产、自然风光、摄影、3D渲染等多种优化场景。
最近,Magnific AI的照片风格化功能上线了,可以将你的任意照片转换成你想要的任意风格,喜欢摄影的朋友,推荐一定要试一试。Magnific AI 官网
给大家推荐一个 AI 知识系统学习的Datawhale,Datawhale是一个致力于人工智能教育的组织,旨在帮助学习者通过实践项目来掌握AI相关的知识和技能,也提供论坛便于大家交流学习心得!
以下是网站内容的概述:Datawhale官网
- AI学习起点:Datawhale鼓励每个人学习和探索人工智能,以共同塑造和掌握AI的未来。 - 学习路径:网站提供了多个学习路径,包括数据分析、计算机视觉、自然语言处理和推荐系统等,以帮助学习者系统地学习AI领域的知识。 - 大模型应用开发:Datawhale提供了面向小白开发者的大模型应用开发教程,结合个人知识库助手项目,教授大模型开发的重点入门知识。 - LLM入门课程:这是一个面向开发者的LLM(Large Language Models)入门教程,基于吴恩达老师的大模型系列课程内容,提供中文翻译和范例代码,指导开发者如何基于LLM开发应用程序。 - GPT - Prompt教程:Datawhale设计了GPT - Prompt教程,旨在帮助学习者更好地利用GPT等工具提高学习和工作效率。 - 南瓜书 PumpkinBook:这是一本开源协作学习笔记,作为周志华《机器学习》的伴侣书,旨在帮助初学者提升数学基础能力。 - Joyful-Pandas:这个教程涵盖了pandas库的所有核心操作与特性,分为基础知识、操作和数据三大模块。 - fantastic-matplotlib:关于Matplotlib的数据可视化教程,Matplotlib是Python中重要的数据可视化工具,本教程适合需要进行数据可视化的人员。
微软推出了一项名为Mora的视频生成项目,该项目利用先进的Agents技术来尝试复原Sora的视频生成能力。目前,Mora已经能够基本还原Sora的所有功能,并可以生成分辨率为1024*576的12秒视频。
这些复原的能力包括:将文本直接转换为视频、根据特定的文本条件将图片转换成视频、扩展已有的视频内容、实现视频到视频的编辑、串联多个视频片段,以及模拟数字世界等。
项目简介:原文链接
Mora项目基于一种新型的多AI智能体框架,融合了多个尖端的视觉AI智能体,旨在复刻Sora所展示的强大的通用视频生成能力。Mora能够灵活运用这些视觉智能体,在各种任务中成功地模仿了Sora的视频生成技巧。
通过广泛的实验验证,我们发现Mora在这些任务上的表现已经与Sora相当接近。从整体性能上评估,Mora与Sora之间仍然存在一些差距。但是,我们仍对Mora项目寄予厚望,希望它能够引领未来视频生成技术的发展方向,并通过多AI智能体的协同工作实现更多的突破。