好消息啊!4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。
大家期待已久的国产大模型,这不就来了吗?
Vidu采用了原创的Diffusion与Transformer融合架构U-ViT,能够支持文本生成长达16秒、分辨率高达1080P的高清视频内容。
Vidu不仅能够模拟真实物理世界,还具备丰富想象力,具备多镜头生成、时空一致性高等技术特点。这也是继Sora发布之后,全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并加速功能迭代中。
现在已经开放试用了,还不赶紧来试一试?
试用地址:https://www.shengshu-ai.com/home?ref=maginative.com
你是否还在为找一款高质量、高精度、完全免费的3D图标而头疼?3D Icons Hub 是全球顶尖的3D图标开源社区,汇聚了来自全球设计师的匠心之作,一键解决你的设计难题! 这里汇聚了超过1500个精美的3D图标,风格多元,分辨率高达4000px。支持Figma、Blender、Fbx等主流格式,无论是UI设计师、插画师还是开发者,都能轻松找到心仪素材。
💎 核心亮点,看完直接收藏! 1.海量精品,应有尽有 1500+ 手工打磨的3D图标:涵盖科技、医疗、自然、抽象等数十种主题,从简约线条到复杂光影,满足所有设计场景! 持续更新:每周新增图标包,紧跟设计潮流,让你的作品永远领先一步。
2.开源自由,灵活商用 免费使用无限制:所有图标均开放下载,无需注册登录! 开源协议友好:支持 MIT、CC-BY 等协议,商用修改自由,告别版权纠纷! 付费高级版解锁:需少量付费的专属图标包,支持设计师持续创作(可选支持,非强制)。
3.极致适配,开箱即用 多格式兼容:提供 GLB/GLTF(Web/VR)、OBJ(3D建模)、PNG/SVG(平面设计) 等主流格式,无缝对接 Figma、Blender、Unity 等工具。 标准化命名与分类:按颜色、风格、尺寸精准分类,搜索效率翻倍!
工具地址:https://3dicons.co/
近日,谷歌DeepMind的研究人员推出了,首个无需数据标记、无监督训练的生成交互模型——Generative Interactive Environments,简称“Genie”。
Genie是一个具有110亿参数的模型,它能够根据图像、真实照片甚至草图生成可控制动作的视频游戏。这个模型的特点是无需数据标记和无监督训练,它通过3万小时、6800万段游戏视频进行了大规模训练,而且训练过程中没有使用任何真实动作标签或其他特定提示。
Genie的核心架构使用了ST-Transformer(时空变换器),这是一种结合了Transformer模型的自注意力机制与时空数据的特性,有效处理视频、多传感器时间序列、交通流量等时空数据的方法。ST-Transformer通过捕捉数据在时间和空间上的复杂依赖关系,提高了对时空序列的理解和预测能力。
Genie的架构主要由三大模块组成: 1. 视频分词器:基于VQ-VAE的模块,将原始视频帧压缩成离散的记号表示,以降低维度并提高视频生成质量。 2. 潜在动作模型:无监督学习模块,从原始视频中推断出状态变化对应的潜在动作,并实现对每一帧的控制。 3. 动力学模型:基于潜在动作模型学习到的动作关系,预测下一帧的视频。
除了视频游戏,你觉得 Genie 模型还能在哪些其他领域发挥作用?
Adobe 公司为其 Substance 3D Sampler 和 Stager 应用整合了 Firefly 生成式人工智能功能,旨在帮助工业设计师、游戏开发人员和视觉特效专业人员更高效地完成 3D 相关工作。
Substance 3D Stager:这是一个基于Adobe Dimension重新构建的应用,允许用户在3D场景中轻松组建模型、材质和灯光环境,并生成高质量的虚拟照片。 Substance 3D Sampler:由Substance Alchemist进化而来,Sampler简化了材质创建过程,用户可以通过一张照片快速生成可调节参数的智能3D材质。
AI功能更新:本次更新引入了两项AI功能:
1、文本到纹理(Text to Texture):创作者可以输入文本提示词,在3D物体表面生成逼真或风格化的纹理,无需使用实物原型、图片库或手动摄影。
2、生成背景(Generative Background):基于用户输入的文本提示词,创建详细的背景图片,并能智能地将对象合成到场景中,匹配透视和光照。
我们都知道 Stable Diffusion 3 是一款强大的文生图模型,拥有20亿参数,因其高效的推理速度和卓越的生成效果而备受瞩目。
近日,Stability AI在推特上宣布正式开源了 Stable Diffusion 3 Medium(SD3-M) 权重,为广大用户带来了免费试用的机会。而且官方还宣称 SD3-M 是他们 Stable Diffusion 3 系列中最新、最先进的文本转图像 AI 模型!
Stable Diffusion 3 Medium(SD3-M)关键要点: 1. Stable Diffusion 3 Medium,由 Stability AI 推出,代表了我们迄今为止在文本到图像领域最前沿的开放模型技术。 2. 这款模型设计紧凑,便于在常见的个人电脑、笔记本电脑,以及企业级图形处理单元(GPU)上高效运行。其优化的大小使其成为文本转图像应用的新一代标准。 3. 现在,这些精心调整的模型权重可以在非商业性的开放许可证和面向创作者的低成本许可证下供您使用。如果您有大规模商业应用的需求,欢迎联系我们以获取更详细的许可信息。 4. 想要体验 Stable Diffusion 3 模型的魅力,您可以通过 Stability AI 的平台 API 来尝试。我们还提供在 Stable Assistant 上注册即可享受的三天免费试用。此外,您还可以通过 Discord 加入 Stable Artisan,进一步探索模型的潜力。
Stability AI官方公告 地址:http://stability.ai/news/stable-diffusion-3-medium
太强了!Adobe 新工具 Project Neo 是一个利用3D技术来提升传统2D图形设计的视觉效果和制作效率的工具。它通过整合3D元素和效果到2D设计中,使得图形更加生动和立体。
Project Neo 的主要功能包括精确绘制路径和曲线、对称画布和图形、转换文本为图形、图像追踪等,可以创建高质量的艺术作品,适合平面设计师、插画艺术家以及创意工作者。
Project Neo还提供了风格化和造型功能,用户可以从多个角度对作品进行风格化和塑形,创建引人注目的矢量和等距插图。工具提供增强的颜色控制,允许用户精细调整中间色和阴影,增加设计的深度和层次感。
教程演示了如何使用 Project Neo + Firefly 制作 3D 等距城市插图。
试玩地址点这里!