近日,快手发布了国内首个效果对标 Sora 的视频生成大模型「可灵」,并已在其旗下的快影App中开放邀测体验。
可灵大模型是由快手 AI 团队自研,采用了类似 Sora 的技术路线,并结合了多项自研创新技术。该模型具备强大的概念组合能力和想象力,能够生成具有大幅度合理运动的视频,并模拟物理世界特性。其生成的视频分辨率高达1080p,时长最高可达2分钟(帧率30fps),且支持自由的宽高比。
可灵大模型不仅限于文生视频功能,还将推出其他应用,如“AI舞王”和“AI唱跳”,这些应用可以驱动表情和肢体动作,仅需一张照片就能生成相应的视频。
目前,可灵大模型已在快影App中正式开启邀测,支持720p视频生成,竖版视频生成能力也即将开放,大家可以来试一试,看看生产的效果怎么样!
官网地址:https://kling.kuaishou.com/
今天发现了一个声音克隆的好东西,我刚刚挖到的Fish Speech这个工具,不仅生成速度快到飞起,而且克隆出的声音也很真实,支持文字转语音功能,非常的好用!
Fish Speech 是一款由fishaudio开发的全新文本转语音(TTS)工具,具有强大的语音克隆能力。用户只需提供一段参考语音,系统便能迅速进行语音克隆,无需繁琐的训练过程。
该工具支持中文、英语和日语等多种语言,并且在语音处理上的能力接近人类水平。 Fish Speech采用了先进的AI技术,包括VQ-GAN、Llama和VITS等,能够将文本转换成逼真的语音。它还采用了Flash-Attn算法,以提高处理大规模数据的效率和稳定性。这些技术使得Fish Speech不仅在语音合成方面表现出色,还在语音克隆方面具有显著的优势。
Fish Speech的语音克隆功能特别适合内容创作者使用,他们可以利用这一工具快速生成各种声音效果,用于视频配音、播客制作等场景。
试玩地址:https://fish.audio/zh-CN/
今天给大家推荐一个提示词辅助神器:PromptFolder 从此出图少走弯路!
大家平时用 Midjourney 或者是 Stable Diffusion 做图时,是不是脑海中已经有画面了,但是不知道怎么表达出来,自己尝试写提示词后,出图的效果不尽人意?
这个是专为大型语言模型 (LLM)、大型模型 (LM) 和 LMOps 设计的尖端提示词优化器。自动优化 ChatGPT、GPT-3.5、DALL-E 2、StableDiffusion 和 MidJourney 提示词。不管是文字、图片、还是解决方案的提示词,都可以通通搞定,一键优化。
目前是免费试用,觉得有需要的宝子们快去看看,一下就打开新大陆了!
阿里巴巴最近推出了一项名为Animate Anyone的创新视频生成技术,只需一张图片即可生成平滑稳定的视频。这项技术对短视频、电商和动漫行业都有一定的影响!
Animate Anyone 是由阿里巴巴智能计算研究院开发,你只需提供一个静态的角色图像和一些预设的动作(或姿势序列)然后会生成该角色的动画视频。同时保持图像中角色的外观和特征的一致性。
理论上“动画任何人”... 不仅适用于人类角色,还可以用于动漫/卡通角色、类人角色等,具有广泛的应用范围。
Animate Anyone 创新之处在于它的通用性和高度的自定义能力。用户可以使用任何图像和任何动作序列来创建独特的、定制化的视频内容。
对于任何需要快速、高效创建动画内容的人来说都是一个非常有价值的工具。通过这种技术,可以在不需要复杂动画技能或昂贵软件的情况下,创造出引人入胜的动画视频。
怎么样?有惊艳到你吗?