Black Forest Labs 发布了 FLUX.1 Kontext [dev] 模型,这是其图像编辑模型 FLUX.1 Kontext [pro] 的开源开发版本,拥有 12B参数,具备 接近专有工具的图像编辑能力,并可在消费级硬件上运行。
它的厉害之处在于: 1. 精准编辑: 能非常准确地修改图片的局部或整体,比如添加物品、更换背景、替换特定对象(狗换猫,人不变),多次修改也不会失真变形。 2. 保持角色一致: 修改图片时,能保持人物的样子(脸、穿着)前后一致。 3. 本地运行免费: 最大的亮点是,它能在你自己的电脑(消费级硬件)上运行,不需要联网上传图片,完全免费(用于研究和非商业用途)!这就打破了GPT-4o和Gemini等收费巨头在这类图像编辑上的垄断。 4. 性能强劲: 官方测试显示,在编辑精度、角色一致性等方面,它的表现甚至超过了谷歌的Gemini-Flash和一些其他开源模型,效果接近最好的闭源工具。 5. 方便好用: 它能和流行的图像生成工具 ComfyUI 无缝结合,操作更简单。官方还提供了很多模板和例子指导怎么用。
总结来说: FLUX.1 Kontext [dev] 提供了一个强大、精准、免费且能保护隐私(本地运行)的图像编辑AI新选择,性能直逼顶尖收费工具。如果你对AI修图感兴趣,值得关注!
模型和技术报告已在 Hugging Face 和 arXiv 平台公开:
- 模型下载: https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev - ComfyUI 使用教程:https://docs.comfy.org/tutorials/flux/flux-1-kontext-dev
继上线视频生成功能后,Dreamina 又上线了一个新功能——智能画布。该功能集成了 mj、sd 和 PS 的功能,让用户能够在一个平台上完成多种操作,无需在不同的软件之间切换。Dreamina 智能画布的核心特点之一是支持多图层的 AI 可控能力,如:边缘保持,支持超清、重绘、抠图、扩图等丰富的后编辑能力。
以下是 Dreamina 功能概况: - 智能画布功能:Dreamina的智能画布支持多图层的AI可控能力,包括边缘保持、超清重绘、抠图、扩图等后编辑能力。这意味着用户可以像使用Photoshop一样操作多个图层,并通过AI生成新的图片。 - 提高工作效率:智能画布的智能化操作方式不仅提高了工作效率,还降低了操作难度,使得更多用户能够轻松上手。 - 应用场景: - 制作小程序产品宣传图 - 生成品牌的创意宣传海报 - logo创意玩法,将品牌logo嵌入图片中 - 对小企业和个人店铺的优势:对于宣传费用有限的小企业和个人店铺,Dreamina提供了一个免费制作宣传图的工具。
→ 官方使用教程文档
小伙伴们,听说过Magnific AI这款神器吗?感觉比较适合平时喜欢P图的朋友,或者摄影师,当然了需要大量后期修图的设计师也可以试试。
最厉害的是,它能够将图像分辨率提升至最高1亿像素,支持最高放大16倍,达到10000×10000的分辨率。该工具不仅能够放大图像,还能根据用户的提示和参数添加或重构细节,使图像变得更加高清和细腻。
Magnific AI还提供了像素级AI重绘功能,通过魔法般的重绘图像细节和像素块,保证清晰度。
Magnific AI具有灵活的设置调整功能,支持输入提示词、提供Creativity、HDR、均衡等调整选项,以及针对人像、插画、游戏资产、自然风光、摄影、3D渲染等多种优化场景。
最近,Magnific AI的照片风格化功能上线了,可以将你的任意照片转换成你想要的任意风格,喜欢摄影的朋友,推荐一定要试一试。Magnific AI 官网
给大家推荐一个 Stable Diffusion ComfyUI 工作流管理插件 Comfyspace,现在新增了模型管理功能。能力更强大了。
点击右上角的模型按钮,即可查看已安装的模型文件,同时它会同步Civitai的模型封面图,无需依靠文字猜测模型。模型分类也非常全面,不再局限于CKPT模型和Lora模型。
点击安装即可轻松查看Civitai的所有模型,并进行搜索,随时下载到对应文件夹。这个插件已成为我使用Comfyui时不可或缺的插件,而且他们的本地插件管理和历史生成结果查看功能也非常实用。
下载安装:https://github.com/11cafe/comfyui-workspace-manager
如果 GPT-4、Claude-3-Opus、Llama-3-70B……外加一个神级新秀 Nana banana 同时站在你面前,你能在 30 秒内挑出最会写代码、最懂梗、也最会哄人的那个吗? 99% 的人会摇头。但 LMArena.ai 把这道题做成了游戏,而且让人上瘾到停不下来。 LMArena 是一个用于评估和比较不同大型语言模型(LLM)的在线平台。
它主要以其“竞技场(Arena)”功能而闻名,其运作方式如下: - 匿名对战:平台会向用户展示两个匿名的AI模型,并让它们回答用户提出的相同问题或指令。 - 用户投票:用户根据两个模型生成回答的质量,投票选出他们认为更好的一个。 - 模型排名:通过收集大量用户的投票数据,平台对各个语言模型进行统计和排名,并将其结果展示在排行榜(Leaderboard)上。
该工具主要运用于人工智能研究与开发领域,特别是大型语言模型的性能评估和基准测试。它通过众包(crowdsourcing)的方式,利用真实用户的偏好作为评价标准,为AI开发者和研究人员提供关于不同模型在实际应用中表现的参考。
现在爆火的Nano Banana模型也可以在LMArena使用哦,详细的工具评测大家可以戳文章:https://www.uisdc.com/lmarena
今天安利一个拯救手残党的神器:Pixian.AI —— 点开即用的AI抠图「闪电侠」 这是一款完全免费的在线 AI 背景去除工具,无需注册账号,无需下载安装,只要有网络,打开浏览器就能直接使用。简洁直观的界面设计,即使是没有图片编辑经验的新手,也能在几分钟内掌握操作方法。上传图片后,AI 算法会自动识别并去除背景,一键生成高质量的透明背景图片,让你轻松搞定各种图片去背景需求。
✅ 毫秒级处理:GPU加速,3秒搞定一张复杂人像/商品图。 ✅ 发丝级细节:专门优化毛发、透明材质(如玻璃、婚纱)的边缘识别。 ✅ 智能填充:自动识别主体轮廓,生成自然过渡的纯色/渐变背景。
现在立马上手!(三步教学) 1. 打开官网 👉 https://pixian.ai 2. 拖入你的图片(支持JPG/PNG/GIF…) 3. 等待5秒 → 右键「保存透明背景图」Done!
Stability AI 发布了 Stable Diffusion 3,宣称这是他们最强大的文本到图像模型,利用扩散转换器架构大大提高了多主题提示、图像质量和拼写能力的性能!
该版本与Stable Diffusion 2相比,在文本语义理解、色彩饱和度、图像构图、分辨率、类型、质感、对比度等方面大幅度增强,可对标闭源模型Midjourney。
Stable Diffusion 3的参数在8亿——80亿之间,也就是说Stable Diffusion 3可能是专为移动设备开发的,AI算力消耗将更低,推理速度却更快。
Stable Diffusion 3 支持申请使用,未来会扩大测试范围。
申请地址:https://stability.ai/stablediffusion3