Blockade Labs 生成式 AI 平台,近日在其官方网站上隆重推出了新一代模型——Model 3。
与前代Model 2相比,Model 3在生成效果上有了显著的提升。这款新模型原生就能支持到8192x4096的超高清分辨率,这大大提高了生成图像的质量。而且其增强的文本提示器能更精确地描绘生成的虚拟世界,使得生成的图像更为生动逼真。Model 3还大幅降低了生成图像的灰度值,无论是建筑、风景还是人物,都展现出更高的清晰度和精致的细节。
现在,大家已经可以免费体验这款全新的Model 3模型。虽然目前Model 3还未开放像Model 2中的网格、混音、重组、草图等自定义功能,但Blockade Labs已经明确表示,这些功能将在不久的将来为用户逐一呈现。
Model 3的主要特点包括: 1. 高分辨率支持:原生支持8192x4096分辨率,这比Model 2有显著提升。 2. 文本提示器增强:能够更好地描述生成的世界。 3. 减少灰度值:使生成的建筑、风景、人物等看起来更加高清和细腻。
免费体验地址:https://skybox.blockadelabs.com/1a97298c8f1f88340e91418e93fbee3e API地址:https://skybox.blockadelabs.com/api-membership
Adobe Photoshop 引入了全新的 Firefly Image 3 图像 AI 模型,这一更新是在2024年4月23日宣布的。这个新模型是基于 Adobe Firefly Image 3 Foundation Model 开发的,旨在为创意专业人士和设计师提供更多的AI图像编辑功能和改进。
Firefly Image 3 模型不仅增加了生成式AI特性,还对Photoshop现有的所有功能进行了改进,使得生成的图像和输出看起来更加逼真、详细。
Firefly Image 3 模型通过提供更多的控制、改进图像生成以及使编辑过程更直观,大幅提升了图像编辑的深度与灵活性。这些新功能包括但不限于根据文本提示制作基于AI的图像,以及在Photoshop中引入的新的人工智能功能,如Reference Image等。
Adobe Firefly Image 3 模型的引入,标志着Adobe在AI图像生成领域的一个重要进步,它不仅增强了创意专业人士和设计师的工作效率和创造力,也为用户提供了更加丰富和强大的图像编辑工具。这些更新预计将在今年晚些时候通过Photoshop的beta桌面应用向公众开放。
原文地址戳这里!
最近,Adobe 发布了视频超分项目 VideoGigaGAN。从演示效果来看相当牛批,支持8倍视频放大,可以适应不同风格的视频。
详细介绍: 该模型能够生成既保持时间连贯性又具有高频细节的视频。VideoGigaGAN基于一个先进的大规模图像放大模型GigaGAN进行设计和优化。 如果简单地将GigaGAN扩展为视频处理模型,并增加处理时间信息的模块,会引起视频中的严重闪烁问题。为解决这一问题,我们识别并改进了几个关键技术点,显著提升了视频的时间稳定性。 通过在公开数据集上与其他先进的VSR模型对比,并展示8倍超分辨率的视频效果,我们验证了VideoGigaGAN的高效性。
项目地址:https://videogigagan.github.io/
近日,杰士邦以全新品牌形象亮相上海健康产业博览会,作为杰士邦品牌标识中不可或缺的核心视觉资产,小黄人形象的图形标识在此次升级中得到了全新的诠释。
具体来说,小黄人不再像前三个版本那样直观地联想到安全套,而是被巧妙地置于代表明星聚光灯和自信能量环的圆形窗口之中,彰显了杰士邦不只有「安全套」的战略决心,更体现了其以多元有趣、健康自由的方式为消费者提供两性健康全链产品的品牌愿景。
据介绍,杰士邦品牌隶属乐福思健康产业股份公司,是中国两性健康领导品牌,乐福思健康以「为爱赋能」为核心理念,致力于推动全球两性健康领域的发展。你觉得新LOGO怎么样?
2024年4月23日是联合国教科文组织确定的第29个“世界读书日”。各位设计师来分一本你读过的设计类书籍吧?
“世界读书日”全称“世界图书与版权日”,又称“世界图书日”,最初的创意来自于国际出版商协会。1995年,联合国教科文组织宣布4月23日为“世界读书日”。
世界读书日的主旨宣言为:“希望散居在全球各地的人们,无论是年老还是年轻,无论你是贫穷还是富有,无论你是患病还是健康,都能享受阅读的乐趣,都能尊重和感谢为人类文明作出巨大贡献的文学、文化、科学思想大师们,都能保护知识产权。”每年,在“世界读书日”的这一天,世界100多个国家都会举办各种各样的庆祝和图书宣传活动。
Dynamic Typography这个标题动画方案,简直是神器啊!你想啊,在你设计的标题里,加个SVG小动画,立马就能抓住观众的眼球!
详细介绍: 一个名为“动态排版(Dynamic Typography)”的自动化文字动画方案,它结合了变形字母表达语义和根据用户指令添加动态效果这两项技术难题。 我们的方法采用了矢量图形表示和端到端的优化框架,使用神经位移场技术将字母转换成基本形状,并配合逐帧动态效果,确保动画与文字的意图保持一致。 通过形状保持技术和感知损失正则化,我们确保了动画在整个制作过程中的可读性和结构完整性。
用了 Dynamic Typography,你的设计肯定能让人眼前一亮,赞不绝口!
项目地址:Dynamic Typography
小时候,大家肯定都听到过很多关于“鬼打墙”、“半夜鬼叫”的故事,每次听到都会让人毛骨悚然。👻
直到最近,我才知道这其实也是“恐怖谷效应”的一个体现!简单来说,就是当某些事物(如机器人、仿真玩偶等)与人类相似度很高,但在某些细节上又有微妙差异时,人们会感到极度的不安和恐怖。😨
大家有没有过这种经历?在商场看到那些超级逼真的硅胶娃娃,刚开始觉得好奇,但多看几眼后就会有种莫名的恐惧感。😖
我记得小时候有个仿真度很高的玩偶,初看很可爱,但晚上关灯后,那微微发光的眼睛仿佛在黑暗中盯着我,真的吓到我了!😱
所以说,“恐怖谷效应”真的很神奇,也提醒我们,在设计中追求真实的同时,也要注意不要越过那个“恐怖”的临界点!😉
如今,随着AI技术的进步,机器人和虚拟形象越来越接近真人。这种高度的仿真,一方面让我们感叹科技的神奇,另一方面,是否也触及到了“恐怖谷”的边缘?🤖
想象一下,当你与一个高度仿真的AI聊天机器人对话,它几乎可以模拟人类的情感反应,但在某些细节上又显得那么不自然,这种感觉,是否会让你心生恐惧?😖
谷歌发布了一套完整的机器学习工程师课程,共计15门课,学习时长达300小时,而且完全免费!
这套课程全面讲解了机器学习系统的设计、搭建、投产、优化以及后续的运转和维护工作,内容既深入又实用。
具体学习内容包括: - 机器学习基础,深入剖析机器学习的核心原理和方法。 - 特征工程,教授如何高效处理和转换数据,进而提升模型的性能。 - 生产级机器学习系统的构建与部署,让你了解如何将模型应用到实际生产环境中。 - 计算机视觉与自然语言处理的专业知识,涵盖图像和语言数据的深度分析及应用。 - 推荐系统的构建技巧,探讨打造个性化推荐引擎的要点。 - MLOps的实操指南,从模型的部署、监控到维护,全方位掌握机器学习操作。 - 还将详细介绍TensorFlow、Google Cloud和Vertex AI等工具和平台,助你轻松应对机器学习项目的开发与部署。
课程地址:https://www.cloudskillsboost.google/paths/17
Stability AI 开发者平台 API 现已支持最新版本的 Stable Diffusion3(SD3)及其增强版本 Stable Diffusion3Turbo。
SD3模型的亮点在于其对字体和提示的遵循能力,这在人类偏好评估中得到了突出体现。为了实现这一目标,SD3采用了新的多模态扩散变换器(MMDiT)架构,该架构改进了对图像和语言表示的权重分离处理,从而显著增强了模型的文本理解和拼写能力。这使得SD3在理解和执行用户的文本提示时更为精准,生成的图像更加符合用户的预期。
Stability AI在不断提升服务质量,尽管SD3模型已经通过API对外提供,但公司仍在持续对模型进行优化。Stability AI计划在不久的将来开放模型权重,允许拥有Stability AI会员资格的用户自行托管,这将增强用户的自主性和灵活性。
Stability AI与Fireworks AI的合作确保了API平台的高速和可靠性,公司承诺提供99.9%的服务可用性,这对于企业用户来说尤为重要,因为他们在使用开发者平台进行关键的生成型AI工作时,需要确保服务的稳定性和可靠性。
至于能不能和 Midjourney v6 相媲美或者超越 V6 ,大家不妨多体验,试试看!
API文档:https://top.aibase.com/tool/stable-diffusion-3-api 体验地址:https://sdxlturbo.ai/stable-diffusion3