3月27日,Adobe在拉斯维加斯盛大举办了“Summit 2024”大会,并在会上隆重推出了其全新服务——Firefly Services。
- Firefly Services介绍:Adobe推出的Firefly Services提供了超过20个生成式AI服务,允许企业利用自己的数据来定制AI模型,以便生成的内容、样式、背景和文本提示风格更符合业务需求。这些服务可以与Adobe的其他产品如Photoshop (PS)、Illustrator、Express等结合使用,简化创意流程。
- 版权保护:Firefly Services生成的内容受到版权保护,因为其训练数据基于Adobe自有和第三方授权的数据。这使得企业可以安心地将生成的内容用于商业场景。
- 功能亮点: - 支持模型微调:企业可以使用少量自有数据来定制Firefly的功能。 - API集成:Firefly Services可以通过API无缝嵌入到日常工具中,包括Adobe旗下的产品,实现自动化生成图片。 - 高质量图片生成:Adobe的自有数据库Adobe Stock拥有数亿张授权图片,为Firefly提供了高质量的训练数据。
详细地址:https://www.adobe.com/creativecloud/business/enterprise/firefly.html
近日,谷歌DeepMind的研究人员推出了,首个无需数据标记、无监督训练的生成交互模型——Generative Interactive Environments,简称“Genie”。
Genie是一个具有110亿参数的模型,它能够根据图像、真实照片甚至草图生成可控制动作的视频游戏。这个模型的特点是无需数据标记和无监督训练,它通过3万小时、6800万段游戏视频进行了大规模训练,而且训练过程中没有使用任何真实动作标签或其他特定提示。
Genie的核心架构使用了ST-Transformer(时空变换器),这是一种结合了Transformer模型的自注意力机制与时空数据的特性,有效处理视频、多传感器时间序列、交通流量等时空数据的方法。ST-Transformer通过捕捉数据在时间和空间上的复杂依赖关系,提高了对时空序列的理解和预测能力。
Genie的架构主要由三大模块组成: 1. 视频分词器:基于VQ-VAE的模块,将原始视频帧压缩成离散的记号表示,以降低维度并提高视频生成质量。 2. 潜在动作模型:无监督学习模块,从原始视频中推断出状态变化对应的潜在动作,并实现对每一帧的控制。 3. 动力学模型:基于潜在动作模型学习到的动作关系,预测下一帧的视频。
除了视频游戏,你觉得 Genie 模型还能在哪些其他领域发挥作用?
上半年 Sora 爆火到现在,AI 在视频领域的发展越来越强了,近日,Runway 的 Gen-3 Alpha 文字转视频功能向所有人开放了。
Runway Gen-3 Alpha 的文字转视频功能是其核心功能之一。用户只需输入文字描述或关键词,Gen-3 Alpha 就能够通过其强大的深度学习算法,自动生成与之相关的视频作品。这一功能不仅支持简单的文本到视频转换,还提供了多种高级创作工具,如运动画笔、相机控制和导演模式等,进一步提升了视频制作的专业度和灵活性。
Runway Gen-3 Alpha 在保真度、一致性和运动表现上均实现了显著的突破,能够生成高保真的视频片段,最长可达10秒。用户可以选择生成5秒或10秒的视频,并且可以根据需要调整视频的详细程度和风格。
Runway Gen-3 Alpha 的文字转视频功能不仅强大且灵活,能够满足各种创意需求,还在技术上取得了显著的进步,成为AI视频生成领域的一大亮点。
但是目前想体验还是需要开通12美元的会员~
各位设计师,耽误大家一点时间,帮忙做一个小调查,经常看优设网的朋友应该有关注过我们每天都会定时定点更新的频道——优设读报
感谢大家一直以来对优设读报的支持!为了更好地满足大家的阅读需求,我们希望了解大家对以下新闻类别的偏好。请选择最感兴趣的3-5个类别(可多选)
1. 设计工具与软件更新:关注Adobe、Sketch、Figma等主流设计工具的最新功能和版本更新 2. AI工具的更新及应用:最新AI工具的发布及新功能的介绍等 3. 科技产品发布:报道最新的科技产品,如智能手机、笔记本电脑、可穿戴设备等 4. 行业大会与活动:预告和回顾设计和科技领域的重大会议、研讨会和展览。 5. 设计理论及研究:深入探讨设计理论,发布设计相关的研究和学术论文。 6. 互联网动态行业资讯:关注互联网大厂及设计行业最新大事件
如果以上都没有,你也可以在评论区给一些你的建议,本次会从评论区抽取2位热心的小伙伴,送书一本!