字节研究院发布了一个名为 Boximator 的视频控制方式,看起来相当不错。这种控制方式允许用户选择需要运动的物体,并绘制其结束位置和运动路径,物体将严格按照用户绘制的位置和路径进行运动。与 Runway 的运动笔刷相比,Boximator 可以更精确地控制物体的运动结束位置。
Boximator适用于艺术家、设计师和营销专业人士,它结合了高度的个性化和创意表达能力,使用户能够创造出独特且引人入胜的视频内容。目前,Boximator仍在开发中,但已提供早期体验渠道,用户可以通过电子邮件体验其功能。
线上体验地址:https://boximator.github.io/
给大家推荐一个 Stable Diffusion ComfyUI 工作流管理插件 Comfyspace,现在新增了模型管理功能。能力更强大了。
点击右上角的模型按钮,即可查看已安装的模型文件,同时它会同步Civitai的模型封面图,无需依靠文字猜测模型。模型分类也非常全面,不再局限于CKPT模型和Lora模型。
点击安装即可轻松查看Civitai的所有模型,并进行搜索,随时下载到对应文件夹。这个插件已成为我使用Comfyui时不可或缺的插件,而且他们的本地插件管理和历史生成结果查看功能也非常实用。
下载安装:https://github.com/11cafe/comfyui-workspace-manager
华为诺亚方舟实验室、清华大学信息科技学院、大连理工、香港大学和Hugging Face的研究人员,共同发布了一款名为PIXART-δ的超高清文生图模型。
这一模型集成了潜在一致性模型(LCM)和创新控制架构ControlNet-Transformer,实现了在文生图像方面的重大技术突破。仅需0.5秒2-4个推理步骤,PIXART-δ就能完成图像生成,速度比之前的PIXART-α模型快了7倍。
在ControlNet-Transformer的帮助下,PIXART-δ可以对生成模型的输出进行精确控制,包括图像的边缘、深度、分割和对象姿势等,类似于OpenAI的DALL·E 3。
字节跳动的研究人员开发了一种超高清文生视频模型MagicVideo-V2。
这是一个集成了文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块的端到端视频生成pipeline。MagicVideo-V2能够从文本描述中生成具有高美感、高分辨率、高保真度和流畅性的视频。通过大规模用户评估,它在人类视觉感知方面表现出优秀的性能。
MagicVideo-V2的设计包括以下关键模块: - 文本到图像模型:从给定的文本提示生成一个1024×1024的图像作为视频生成的参考图像。 - 图像到视频模型:使用文本提示和生成的图像作为条件生成关键帧。 - 视频到视频模型:对关键帧进行细化和超分辨率处理,生成高分辨率视频。 - 视频帧插值模型:在关键帧之间插值生成平滑的视频运动,并最终生成高分辨率、流畅、高美感的视频。
论文地址:https://arxiv.org/abs/2401.04468 项目地址:https://magicvideov2.github.io/
Midjourney 官方宣布,正在测试一种风格调整算法「风格参照」,帮助用户生成风格一致性图像。这项功能与图像提示类似,在图片提示中,你可以提供一个或多个图像的链接,用以描述你想要的统一风格。该功能支持 V6 和 Niji V6 版本(不支持 V5 等旧版本),该功能可能会在未来几周进行更新。
划重点: 1. 使用 —sref url(image)这个指令可以添加最多三张风格参考图,现在不用写promt,想要什么风格直接扔图给MJ,他会懂你😎 2. 进行时:在接下来很短的日子里,MJ即将推出另外一个新指令 —cref, 让你能更好的控制人物形象一致性。
1月23日,支付宝宣布“集五福”升级为“五福节”,第一阶段为五福年货节,已于1月10日启动;第二阶段为大家最熟悉的集五福,将于1月29日正式开启;第三阶段为过年天天乐,在大年初一推出。
四大AI玩法是今年最大的亮点,包括:
1、飙戏小剧场 2、会说话红包 3、时空照相馆 4、大家来找福
除了年三十集齐五福分5亿奖金的保留节目,整个五福节期间用户还可以在支付宝上看短视频、参与评论、打榜等方式瓜分3亿红包。今年,除了合成五福卡兑换奖金,多余的福卡还可以在近300个商家小程序里兑换好礼。
另外,五福节期间,支付宝将举办52场“五福节创作者挑战赛”,在现有的创作者分成计划外,额外投入超2500万现金奖励优质内容创作者。
你对集福活动感兴趣吗?今年还会继续参与吗?
谷歌在官网宣布,在谷歌浏览器(Chrome最新版本M121)中新增自动生成文本、壁纸以及自动管理标签3个全新生成式AI功能。
1、文本生成 你是否还为发帖子、写美食感想、购物评论而烦恼?谷歌浏览器最新版本将新增类似的ChatGPT文本生成功能。 使用方法:用户只需右击谷歌浏览器中访问的任何网站上的文本框,然后选择“帮助我编写”。输入文本提示词,例如,写一篇关于地方美食的攻略。
2、壁纸生成 谷歌在Android 14和Pixel 8设备上推出了生成式AI壁纸,受到了极大欢迎。现在,谷歌将文本生成图像功能内置到谷歌浏览器中,帮助用户打造个性化壁纸。 AI将根据你选择的主题、情绪、视觉风格和颜色,快速生成壁纸,帮助你打造绚丽多彩的浏览器。
3、标签管理 我们在使用谷歌浏览器时可能会打开几十个甚至上百个网站,管理这些标签相当麻烦。 现在,借助全新的AI标签管理器,可以根据旅行、科学研究、购物等进行自动分类。 使用方法:右点选择标签管理器,然后点击搜索标签组,标签管理器会根据网站的类型自动创建管理组,用户只需点击创建即可完成。
Chrome 应该是为数不多支持生成式AI的浏览器。但是由于这三项功能处于预览测试阶段,企业和教育账户无法使用。如果正式上线,大家觉得哪一项功能最实用呢?
昨天在优设读报刷到的这个工具,试玩了一下,感觉还蛮有意思的,比较适合做微信头像(不是很会用,就感觉拿来生成卡通的头像太合适了)
PhotoMaker 是腾讯推出的一款真实人像生成工具,快速逼真,效果自然。
功能包括: 1. 利用多张照片作为身份ID,获取人物特征,然后创造出一个新的、个性化的人物图像。
2.把几个不同人的照片特征混合在一起,创造出一个全新的人物形象。
3. 能改变照片人物的性别、年龄和生成多种风格的其他照片。Huggingface上有Demo,试了一下的确可以精准还原人脸特征。
大家有体验过了吗?感觉怎么样呢?
AI商品图,类似的AI工具有不少,这里给大家简单整理下我自己使用过的,不全面,欢迎补充评价。
01 AI设计师|AI商品图生成器 网址:https://www.logosc.cn/design/
⭐️功能特点: 1.上传任意产品图片,智能抠图美化; 2.直接给你的产品生成上百种商品场景图,所见即所得,挑选喜欢的样式进入AI编辑; 3.支持AI生成背景,如果没有满意的效果,可以直接自己生成原创背景图,支持文字prompt或上传图片生成相似背景图
02 Claid AI拍摄商品图 网址:https://claid.ai/
生成产品图是一款自动创建和优化电子商务图片的工具。无论是提高分辨率、移除背景,还是制作高质量的能够提高转化率的AI照片,Claid AI都能够胜任。通过在线平台和API,您可以轻松地提升产品图片的质量和吸引力。
03 Photoroom生成商品图背景 网址:https://www.photoroom.com/zh/tools/instant-backgrounds
功能特点: 1. 瞬间背景生成:Photoroom能够快速生成逼真的产品图片背景,使您的商品照片看起来更加专业和吸引人。 2. AI技术支持:Photoroom利用先进的人工智能技术,通过自动抠图和背景替换,让您的商品图片与背景融合自然,达到专业水平。 3. 平台无关性:无论您使用的是哪种平台,Photoroom都能够适应您的需求并生成与平台相匹配的产品图片。
04 Pebblely宝贝丽 网址:https://pebblely.com/zh/
自动抠图,并根据您的要求生成不同的背景,打光,映射和阴影效果,让您的产品更加生动和吸引人。 拥有20种默认主题,您也可以自定义您想要的场景,如早晨的光,空灵的氛围,柔和的色调等。 可以调整场景图的大小,并扩展您的图像至任意尺寸,适用于多种媒体,如Instagram故事,Facebook帖子,电子邮件横幅,主页图像,广告照片等。 还可以使用AI编辑生成的图像,如添加多个产品,修改图像细节,重复使用背景等。