最近,Stability AI做出了一个重大决策,修改了其社区许可协议,允许Stable Diffusion 3 Medium(简称SD3-M)模型商业化使用。如果企业或个人开发者年收入不超过100万美元(约726万人民币),只需向Stability AI提交申请,即可免费将SD3-M用于商业目的,如数据微调和生成式AI应用开发。
根据最新的协议,100万美元的收入门槛是硬性条件,不论收入是否直接来自SD3-M的使用。Stability AI还承诺,将在未来几周内发布一个更大版本的模型,并继续与社区分享,意味着该模型将会持续开源。
SD3-M模型拥有20亿参数,生成图片时间平均为2至10秒,推理效率高,对硬件要求低,适合在多种设备上运行。相较于前几代,它在图片质量、文本语义、光影和色彩表现上有显著提升,特别是在文本嵌入方面改进明显,提高了字体识别和嵌入的准确性。
训练过程中,SD3-M使用了包含10亿张图片的公开和合成数据集进行预训练,另外还使用了3000万张特定艺术风格和领域的图片进行微调,以及300万张偏好图片。
开源地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium 填写申请地址:https://stability.ai/community-license
给大家推荐一个 Stable Diffusion ComfyUI 工作流管理插件 Comfyspace,现在新增了模型管理功能。能力更强大了。
点击右上角的模型按钮,即可查看已安装的模型文件,同时它会同步Civitai的模型封面图,无需依靠文字猜测模型。模型分类也非常全面,不再局限于CKPT模型和Lora模型。
点击安装即可轻松查看Civitai的所有模型,并进行搜索,随时下载到对应文件夹。这个插件已成为我使用Comfyui时不可或缺的插件,而且他们的本地插件管理和历史生成结果查看功能也非常实用。
下载安装:https://github.com/11cafe/comfyui-workspace-manager
版权一直是设计师非常关注的话题,今年AIGC爆火以来也是如此,整个设计行业对人工智能生成的内容版权没有一个明确的认知,而且随着技术的越来越成熟,很多精美的素材你很难分辨出是否是AI生成的。
近日,亚马逊、Anthropic、谷歌、Inflection、Meta、微软和OpenAI都同意在其生成式人工智能的内容上加入水印,并开放第三方审查。这些公司同意进行安全测试,部分由独立专家进行;对偏见和隐私问题进行研究;与政府和其他组织共享有关风险的信息;开发应对气候变化等社会挑战的工具;采取识别AI生成材料的透明度措施。
这将完全区分正常内容和人工智能生成的内容。这是否意味着未来的AI绘画作品也会加入水印标识呢?这真是令人非常期待!请大家在评论区分享一下对于给AI生成内容添加水印的看法吧!
今天给大家推荐2款自媒体神器,自动剪辑+语音包生成,如果你想做短视频博主或者口播IP,一定不要错过,省时省力,还能轻松展现创意!
1、国内某位高超的开发者推出了一款名为自动剪辑神器的软件,该软件完全免费,没有任何广告和套路。如果你是从事口播IP行业的,使用这款软件可以让你的效率提升50%以上。它的独特功能在于一键自动删除所有停顿和无效的片段,让你的剪辑工作更加轻松和高效。
2、标贝AI语音工坊,只需录制一段自己的声音,即可生成个性化的语音包。以后录制视频时,直接使用该语音包,可大幅提高生产效率。该语音包不仅具有高度识别度,还能让你更容易上热门,更重要的是,这项服务完全免费。
Stability AI 发布了 Stable Diffusion 3,宣称这是他们最强大的文本到图像模型,利用扩散转换器架构大大提高了多主题提示、图像质量和拼写能力的性能!
该版本与Stable Diffusion 2相比,在文本语义理解、色彩饱和度、图像构图、分辨率、类型、质感、对比度等方面大幅度增强,可对标闭源模型Midjourney。
Stable Diffusion 3的参数在8亿——80亿之间,也就是说Stable Diffusion 3可能是专为移动设备开发的,AI算力消耗将更低,推理速度却更快。
Stable Diffusion 3 支持申请使用,未来会扩大测试范围。
申请地址:https://stability.ai/stablediffusion3