AI视频新模型Stable Video Diffusion来啦!近日,StabilityAI发布了Stable Video Diffusion模型,这是第一个基于StableDiffusion 的生成式人工智能视频的基础模型。
测试了一下效果真的非常好,可以自动判断哪些地方该动以及应该怎样动。同时也不会有Runway那种涉及到复杂的内容比如人脸的时候画面崩坏的问题,非常稳定。
目前提供研究预览版本:代码、权重和研究论文均已上线。官方强调,这个模型不打算在这个阶段开放或商业应用。未来会推出完整的版本,感兴趣的小伙伴可以关注一下!
论AI绘画软件哪家强?Adobe Firefly 才是王者,应该没有哪位设计师会反驳我吧?从 MidJourney、Stable Diffusion到DALL-E 2,甚至Canva,我觉得应该没有哪个产品比 Adobe 更懂图像处理的。
现在有个好消息带给大家,Adobe Firefly 结束内测,现已正式上线,无版权可商用。每月可以免费生成 100 张图像。付费版4.99美金/月 每个月400张图,支持生成图片商用,订阅用户无图片水印。
主要功能: ✅ 文本到图像: 输入文本描述,生成相应的图像 ✅ 生成填充: 移除对象,或根据文字添加新对象 ✅ 文本效果: 使用文本提示生成文字风格或纹理 ✅ 生成重新着色: 使用文本描述为矢量艺术品填色 ✅ 草图到图像: 可以将简单的绘图转化为全彩图像 ✅ 3D到图像: 使用文本提示生成3D图像
后续会陆续加入图像扩展等其他功能,各位设计师可以关注一下!
看到优设九图频道每天都会分享一些AI绘画作品,有不少小伙伴都在求提示词。今天我给大家分享一个生成式AI人工智能Prompt提示学习共享网站:PromptHero,支持ChatGPT,Midjourney,Stable Diffusion, DALL-E等。
PromptHero是一个专门为生成式人工智能(Generative AI)提供搜索提示(Prompt)的网站,它可以帮助用户使用不同的AI模型来创造出惊人的图像、文本和音乐。PromptHero的目标是让每个人都能轻松地掌握生成式AI的技巧,发挥自己的创造力,享受AI艺术的乐趣。
如果 GPT-4、Claude-3-Opus、Llama-3-70B……外加一个神级新秀 Nana banana 同时站在你面前,你能在 30 秒内挑出最会写代码、最懂梗、也最会哄人的那个吗? 99% 的人会摇头。但 LMArena.ai 把这道题做成了游戏,而且让人上瘾到停不下来。 LMArena 是一个用于评估和比较不同大型语言模型(LLM)的在线平台。
它主要以其“竞技场(Arena)”功能而闻名,其运作方式如下: - 匿名对战:平台会向用户展示两个匿名的AI模型,并让它们回答用户提出的相同问题或指令。 - 用户投票:用户根据两个模型生成回答的质量,投票选出他们认为更好的一个。 - 模型排名:通过收集大量用户的投票数据,平台对各个语言模型进行统计和排名,并将其结果展示在排行榜(Leaderboard)上。
该工具主要运用于人工智能研究与开发领域,特别是大型语言模型的性能评估和基准测试。它通过众包(crowdsourcing)的方式,利用真实用户的偏好作为评价标准,为AI开发者和研究人员提供关于不同模型在实际应用中表现的参考。
现在爆火的Nano Banana模型也可以在LMArena使用哦,详细的工具评测大家可以戳文章:https://www.uisdc.com/lmarena
最近,Adobe 发布了视频超分项目 VideoGigaGAN。从演示效果来看相当牛批,支持8倍视频放大,可以适应不同风格的视频。
详细介绍: 该模型能够生成既保持时间连贯性又具有高频细节的视频。VideoGigaGAN基于一个先进的大规模图像放大模型GigaGAN进行设计和优化。 如果简单地将GigaGAN扩展为视频处理模型,并增加处理时间信息的模块,会引起视频中的严重闪烁问题。为解决这一问题,我们识别并改进了几个关键技术点,显著提升了视频的时间稳定性。 通过在公开数据集上与其他先进的VSR模型对比,并展示8倍超分辨率的视频效果,我们验证了VideoGigaGAN的高效性。
项目地址:https://videogigagan.github.io/