太震撼了啊,没等到GPT-5,却迎来了 OpenAI 新旗舰模型GPT-4o!
5月14日凌晨,GPT-4o 在 OpenAI 官网正式发布了,GPT-4o是一个多模态模型,能够处理视频、音频和文本数据,具有实时推理的能力。它能够执行多种任务,包括实时翻译、唱歌、做数学题和讲笑话等。GPT-4o的语音响应时间非常短,平均响应时间为320毫秒,并且在MMLU评测中创下了88.7%的新高分,超过了其他市面上的大模型。
这是正儿八经的原生多模态,更重要的是可以实时推理音频、视觉和文本,注意这里是实时,实时,实时,推理的不是文本,是音频!视觉!
某种程度上,AGI 已然成为现实,我们即将迎来一个新的时代啊!
今天我要推荐的网站,能为你提供未来感十足的AI网站生成体验!
Framer 由Koen Bok和Jorn van Dijk于2014年创立。他们曾在Facebook和Hype进行产品设计和开发,看到现有设计工具无法满足创建复杂互动原型的需求,于是创立了Framer。当下,Framer已经成为设计和开发领域的重要工具。
虽然在实时协作和矢量设计方面,Figma等竞争对手更具优势,但Framer凭借其在互动原型和动画方面的强大功能,保持了在设计工具市场中的重要地位。
✨ Framer亮点 ✨ ① 无代码设计:你无需编程基础,通过拖放组件即可创建复杂的交互效果。 ② 实时协作:多人同时编辑和评论,团队合作更加高效流畅。 ③ 自动化设计:智能布局和响应式设计功能,让你的作品在任何设备上都完美呈现。这也是最打动我的一点。现在大大小小的设备太多了,能做到多端适配,简直感动到哭。 ④ 丰富的模板和组件:海量模板和UI组件库,助你快速启动项目,节省时间。 ⑤ 高保真原型:从静态设计到动态原型,一气呵成,完美展示用户体验。
官网地址:Framer
大家好,昨天给大家推荐了一款线上的AI图像编辑工具,不知道大家用过没有。今天再给大家推荐一款功能更加强大的AI图像编辑工具:EditAnything
EditAnything 是一款基于Segment-Anything、ControlNet、StableDiffusion等技术的在线AI图像编辑工具,能够对图像进行多种修改和生成操作。它具备跨图像区域拖拽合并的能力,让用户能够自由发挥创意进行融合。
除了对图像中的物体进行修改、添加、删除等操作,还可以通过调整细节和布局来创造出不同风格的图像。EditAnything还提供了多种高品质角色编辑功能,包括衣服、发型、美瞳等。还可以通过绘制草图来生成图像,为创作提供更多可能性。感兴趣的小伙伴可以试试效果哦!
还在为调整矢量图形形状而头疼?Warp SVG在线工具来了! 无需安装、打开即用,3秒让任何SVG图形“活”起来! 无论是设计师、前端开发,还是创意爱好者,收藏它,让你的效率翻倍!
为什么你需要立刻收藏它?
✅ 超简单交互式变形 拖拽网格点、拉伸路径,像捏橡皮泥一样随意扭曲图形,所见即所得! ✅ 实时预览+高清导出 修改效果秒级渲染,支持导出纯净SVG代码,完美适配设计稿和开发需求。 ✅ 零门槛+全免费 无需注册,打开浏览器就能用!告别PS/AI复杂操作,小白也能秒变大神。 ✅ 应用场景超丰富 - 图标/LOGO微调:轻松弯曲文字弧度,打造独特视觉风格 - 动态效果原型:一键生成波浪、膨胀等变形动画素材 - 投影艺术必备:快速校正图形适配建筑、舞台等不规则表面
工具地址:https://pavellaptev.github.io/warp-svg/
释放你的创意脑洞,让矢量图形从此不“呆板”!赶紧收藏,随时调用你的创意灵感!
字节跳动的研究人员开发了一种超高清文生视频模型MagicVideo-V2。
这是一个集成了文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块的端到端视频生成pipeline。MagicVideo-V2能够从文本描述中生成具有高美感、高分辨率、高保真度和流畅性的视频。通过大规模用户评估,它在人类视觉感知方面表现出优秀的性能。
MagicVideo-V2的设计包括以下关键模块: - 文本到图像模型:从给定的文本提示生成一个1024×1024的图像作为视频生成的参考图像。 - 图像到视频模型:使用文本提示和生成的图像作为条件生成关键帧。 - 视频到视频模型:对关键帧进行细化和超分辨率处理,生成高分辨率视频。 - 视频帧插值模型:在关键帧之间插值生成平滑的视频运动,并最终生成高分辨率、流畅、高美感的视频。
论文地址:https://arxiv.org/abs/2401.04468 项目地址:https://magicvideov2.github.io/