看到 Niji 发布的预告来演示局部重绘(inpaint)的效果,是 Midjourney 即将发布局部重绘功能,对于MJ的AI绘画最头痛就是生成一张图片,如果只有细节不满意就要重新抽卡生成,这样导致很多不可控的效果出来而且浪费时间,而即将推出的Inpainting(局部重绘)功能就很好解决这个问题。
这个新功能就像 PS 的AI一样,只需要涂抹一个区域,然后加入关键词就能重新绘制或替换这个区域。至少再也不用担心出现 3 只手,6 根手指头的情况了。有没有小伙伴有内部的消息,Midjourney AI 创意局部重绘功能什么时候能上线啊?
太震撼了啊,没等到GPT-5,却迎来了 OpenAI 新旗舰模型GPT-4o!
5月14日凌晨,GPT-4o 在 OpenAI 官网正式发布了,GPT-4o是一个多模态模型,能够处理视频、音频和文本数据,具有实时推理的能力。它能够执行多种任务,包括实时翻译、唱歌、做数学题和讲笑话等。GPT-4o的语音响应时间非常短,平均响应时间为320毫秒,并且在MMLU评测中创下了88.7%的新高分,超过了其他市面上的大模型。
这是正儿八经的原生多模态,更重要的是可以实时推理音频、视觉和文本,注意这里是实时,实时,实时,推理的不是文本,是音频!视觉!
某种程度上,AGI 已然成为现实,我们即将迎来一个新的时代啊!
嘿,各位电商小伙伴们!今天,我要给大家安利一款超级实用的工具——羚珑!这可不是普通的工具,它是一款集内容生成与管理于一体的一站式服务平台,简直是电商运营的“救星”!🎉
还在为设计发愁?不会PS、找不到灵感、赶不上促销节点? 京东羚珑——专为电商人打造的AI设计神器,用“0门槛+高效率”终结你的设计焦虑! 无论你是商家、运营还是创业者,只需3分钟,就能轻松产出专业级海报、Banner、视频素材,点击率飙升30%+,ROI提升20%+!
为什么选择羚珑? ✅ 智能设计,解放双手 - 一键抠图:复杂边缘精准识别,3秒完成抠图,告别手动修图噩梦! - 商品打腰带:自动添加促销标签、价格弹窗,瞬间提升商品吸引力! - 智能排版:任意尺寸自适应,元素自动对齐,告别“丑到爆炸”的排版!
✅ 海量模板,场景全覆盖 - 电商必备:主图设计、Banner、活动页、直播间背景……10万+模板一键套用! - 全链路支持:从商品图到物流面贴、易拉宝,连DM传单都能搞定! - 多端适配:自动生成横竖版、适配APP/小程序/PC,省心又专业!
✅ 程序化设计,效率狂飙 - AI算法驱动:基于京东用户行为数据,智能推荐配色、布局,点击率提升30%! - 批量生成:节日促销、新品上架?1人搞定全平台素材,效率提升80%!
✅ 企业级服务,团队协作无忧 - 素材云管理:团队共享模板库,设计规范统一,拒绝重复劳动! - API接口:对接自有系统,定制专属设计引擎,企业降本利器!
工具地址:https://ling.jd.com/
小伙伴们!今天要给大家介绍一款超级厉害的设计神器——匠紫AI!如果你还在为设计工作烦恼,或者想要轻松做出高颜值的设计作品,那这款工具绝对能让你眼前一亮!
匠紫AI是一款真正让设计变得简单又有趣的工具。它不仅能帮助你快速完成设计任务,还能激发你的创意灵感,提升设计质量。无论你是设计新手还是专业大神,都能在这款工具中找到属于自己的设计乐趣。
🌟 工具亮点 - 设计预览与编辑:实时查看设计效果,随时调整修改,直到满意为止。 - 智能设计建议:AI会根据你的操作和需求,提供专业的设计建议,让你的设计更上一层楼。 - 海量模板与素材:提供丰富的设计模板和素材库,涵盖各种场景和风格,满足你的所有需求。 - 一键生成设计:简单几步操作,AI就能帮你快速生成设计作品,轻松搞定设计任务。
🎉 适合人群 - 专业设计师:帮你快速生成创意草图,优化设计方案,提升设计效率。 - 非专业设计师:轻松上手,快速制作出符合需求的设计作品,满足日常宣传、推广等场景。 - 创意工作者:激发你的灵感,帮你探索更多设计可能性,让创意无限延伸。
📚 使用场景 - 平面设计:海报、宣传册、名片、PPT等,快速生成设计初稿,轻松调整优化。 - UI/UX设计:界面布局建议、交互设计模板,快速搭建界面原型,提升用户体验。 - 创意设计:插画、图形设计等,激发创意灵感,生成独特设计元素。
工具地址:https://jiangziai.com/
近日,谷歌的全新人工智能模型 Gemini 1.0 引起了广泛的关注。Gemini 到底是个什么样的模型,为什么说比 GPT-4 强呢?
Gemini 是谷歌推出的一种大型语言模型。它是谷歌迄今为止规模最大、能力最强的人工智能模型,具有原生多模态能力,能够同时处理文本、图像和音频等多种信息。
Gemini 的训练数据集包括1.6万亿个参数,是之前的 GPT-3 的两倍。它能够理解和生成自然语言,并能够从文本、图像和音频中提取信息。
Gemini 还能够进行多种任务,包括: 生成文本、翻译语言、编写不同类型的创意内容等。 理解和回答问题,包括开放式、挑战性的和奇怪的问题。 从文本、图像和音频中提取信息,并进行分析。
字节跳动的研究人员开发了一种超高清文生视频模型MagicVideo-V2。
这是一个集成了文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块的端到端视频生成pipeline。MagicVideo-V2能够从文本描述中生成具有高美感、高分辨率、高保真度和流畅性的视频。通过大规模用户评估,它在人类视觉感知方面表现出优秀的性能。
MagicVideo-V2的设计包括以下关键模块: - 文本到图像模型:从给定的文本提示生成一个1024×1024的图像作为视频生成的参考图像。 - 图像到视频模型:使用文本提示和生成的图像作为条件生成关键帧。 - 视频到视频模型:对关键帧进行细化和超分辨率处理,生成高分辨率视频。 - 视频帧插值模型:在关键帧之间插值生成平滑的视频运动,并最终生成高分辨率、流畅、高美感的视频。
论文地址:https://arxiv.org/abs/2401.04468 项目地址:https://magicvideov2.github.io/