近日,苹果公司与瑞士洛桑联邦理工学院(EPFL)联合开源了一款名为4M-21的多模态视觉模型。该模型具有广泛的通用性和灵活性,尽管只有30亿参数,但它可以执行数十种任务,包括图像分类、目标检测、语义分割、实例分割、深度估计和表面法线估计等。
4M-21模型在21种不同的模态下进行训练,能够处理包括图像、文本、音频等多种模态的任务。这种多模态能力使其在跨模态检索、可控生成和开箱即用性能方面表现出色。
4M-21还支持任意到任意模态的转换,进一步扩展了其应用范围。
4M-21模型的推出标志着从传统单模态优化模型向多模态综合处理能力的重大转变,展示了苹果在AI领域的强大实力和创新能力。
开源地址:https://github.com/apple/ml-4m/ 论文地址:https://arxiv.org/abs/2406.09406 在线demo:https://huggingface.co/spaces/EPFL-VILAB/4M
Creative Upscaler 是由 Stability AI 推出的一款基于人工智能的图像增强工具,其主要功能是将低分辨率的图像提升至4K分辨率,并通过先进的机器学习算法为图像添加新的细节和内容,从而实现图像质量的显著提升。这一工具不仅能够放大图像,还能在不损失原始图像细节的基础上,创造出以前不存在的新细节,赋予图像新的生命力。
Creative Upscaler 的核心特点:
1. 分辨率提升:无论原始图像的分辨率如何,Creative Upscaler 都能将其放大至4K分辨率,使图像更加清晰和细腻。 2. 细节创造:通过结合文本提示和图像内容,Creative Upscaler 能够生成原本不存在的新细节,例如增强纹理、修复扭曲的脸部或添加新的视觉元素。这使得它不仅是一个简单的放大工具,更是一个能够创造新内容的条件生成模型。 3. 高质量转换:该工具能够保留原始图像的大部分特征,同时在较低创意设置下保持图像的自然性,适合需要高质量转换的用户。 4. 个性化调整:用户可以根据需求调整创造力等级,以决定是否适度增加或减少新细节的生成量,从而平衡原始图像特征与新内容之间的关系。 5. 适用范围广泛:Creative Upscaler 适用于艺术家、摄影师、设计师等专业人士,也适合普通用户用于社交媒体图像质量提升或商业宣传材料的视觉优化。
每天一个AI工具!设计师们,这款王炸级AI插画工具居然可以免费使用! Pictographic AI生成的插图库,应有尽有。
1、海量插画资源 Pictographic 拥有超 210000 幅插画,涵盖 10 种风格,从简约现代到复古怀旧,各类设计项目都能找到适合插画。 2、智能生成功能 找不到心仪的插画?使用生成功能,依现有风格生成新插画,为作品添独特视觉元素。 3、可定制性 多数插画为 SVG 格式,可在平台自由改色、调整大小等,轻松适配设计。 4、Figma 插件 提供 Figma 插件,无需下载,直接在软件中使用插画,设计流程更高效。