问答分类 AI创作 - 优设网 - 学AI设计上优设

这个 AI 视频模型 Proteus 很有趣啊，通过单张图片让人物进行实时唱歌和说话！

斯坦福大学的研究团队与 Apparate Labs 前几天发布一款名为 Proteus 的创新 AI 视频生成模型，可以从单一图像生成笑、说唱、唱歌、眨眼、微笑、说话高度逼真和具有表现力的虚拟人物。 PROTEUS兼容多种大模型的多模态输入，可以处理语音、文本和图像等多种形式的数据。

Proteus模型亮点： - 高度逼真：利用先进的AI技术，Proteus能够从单张图片生成具有高度逼真表情和流畅动作的虚拟人物形象。 - 低延迟生成：Proteus模型具备低延迟特性，能够实时响应语音输入，生成每秒超过100帧的视频流。 - 多模态交互：模型支持语音、文本和图像等多种输入形式，实现与用户的自然直观交互。

应用领域： Proteus模型在个性化虚拟助理、虚拟宠物、情感支持、客户服务、教育和培训、游戏定制、影视娱乐、市场营销和社交媒体等领域具有广泛的应用潜力。

申请体验地址： https://apparate.ai/early-access.html

点赞 16 回答 2

Stable Diffusion 3 正式开源，超强文生图模型 SD3-M 上线，赶紧来试试吧！

我们都知道 Stable Diffusion 3 是一款强大的文生图模型，拥有20亿参数，因其高效的推理速度和卓越的生成效果而备受瞩目。

近日，Stability AI在推特上宣布正式开源了 Stable Diffusion 3 Medium（SD3-M）权重，为广大用户带来了免费试用的机会。而且官方还宣称 SD3-M 是他们 Stable Diffusion 3 系列中最新、最先进的文本转图像 AI 模型！

Stable Diffusion 3 Medium（SD3-M）关键要点： 1. Stable Diffusion 3 Medium，由 Stability AI 推出，代表了我们迄今为止在文本到图像领域最前沿的开放模型技术。 2. 这款模型设计紧凑，便于在常见的个人电脑、笔记本电脑，以及企业级图形处理单元（GPU）上高效运行。其优化的大小使其成为文本转图像应用的新一代标准。 3. 现在，这些精心调整的模型权重可以在非商业性的开放许可证和面向创作者的低成本许可证下供您使用。如果您有大规模商业应用的需求，欢迎联系我们以获取更详细的许可信息。 4. 想要体验 Stable Diffusion 3 模型的魅力，您可以通过 Stability AI 的平台 API 来尝试。我们还提供在 Stable Assistant 上注册即可享受的三天免费试用。此外，您还可以通过 Discord 加入 Stable Artisan，进一步探索模型的潜力。

Stability AI官方公告地址：http://stability.ai/news/stable-diffusion-3-medium

5.9k 设计师围观了该问题

点赞 20 回答 1

大白(●—●) 邀你回答

2024/06/13

Luma 发布 DIT 视频生成模型 Dream Machine，对比 Sora，孰强孰弱？

设计师新宠来啦！初创公司 Luma 全新发布 Dream Machine，能从文本/图像直接生成视频。感觉比 Sora 也差不了多少。

Dream Machine 120秒就能给你做出一个120帧的视频！这速度，想改点啥，马上就能再做一个新的，太高效了！而且镜头效果超自然，Dream Machine还超级懂镜头语言！它能模拟出各种电影级的摄像机运动，让你的视频看起来就像大片一样流畅、自然。

大家可以看看下面的演示视频，它还能理解人和物是怎么在现实中互动的，所以做出来的视频里，角色和场景都超级真实，一点都不会觉得假。

最最最主要的是，现在人人都可以免费体验！服务器都快被大家挤爆了，你还在等啥呢？赶紧来试试吧！

体验地址：https://lumalabs.ai/dream-machine

4.0k 设计师围观了该问题

点赞 38 回答 1

大白(●—●) 邀你回答

2024/06/07

首个国产对标 Sora 的视频生成大模型「可灵」发布了，大家来试一试效果怎么样！

近日，快手发布了国内首个效果对标 Sora 的视频生成大模型「可灵」，并已在其旗下的快影App中开放邀测体验。

可灵大模型是由快手 AI 团队自研，采用了类似 Sora 的技术路线，并结合了多项自研创新技术。该模型具备强大的概念组合能力和想象力，能够生成具有大幅度合理运动的视频，并模拟物理世界特性。其生成的视频分辨率高达1080p，时长最高可达2分钟（帧率30fps），且支持自由的宽高比。

可灵大模型不仅限于文生视频功能，还将推出其他应用，如“AI舞王”和“AI唱跳”，这些应用可以驱动表情和肢体动作，仅需一张照片就能生成相应的视频。

目前，可灵大模型已在快影App中正式开启邀测，支持720p视频生成，竖版视频生成能力也即将开放，大家可以来试一试，看看生产的效果怎么样！

官网地址：https://kling.kuaishou.com/

9.7k 设计师围观了该问题

点赞 22 回答 3

设计狮大宝邀你回答

2024/06/06

AI 神器推荐，只需上传链接，GlatoAI 一键生成虚拟人广告短视频！

给大家分享一个超好用的短视频制作 AI 神器：GlatoAI。特别适合那些想快速给产品做介绍的自媒体小伙伴们，还有想第一时间get新产品信息的商务大哥大姐们。

你只需把链接往上一贴，不管是文章、产品页还是啥网页链接，GlatoAI 都能秒速分析，然后给你做个配套的短视频广告。视频里啥都有，包含讲话的人物+语音+字幕。

就这么简单，不需要你费太多脑筋。赶紧试试吧，真的超好用哦！

如果对效果不满意，还可以在以下方面进行更多的调整： 1. 修改名称、上传标志、产品描述、期望持续的时间、额外的介绍信息 2. 除了自动收集链接中的图文视频之外，也可以选择自行上传更多信息 3. 从多个备选的视频脚本中进行筛选 4. 更改不同的数字人形象（性别、年龄、拍摄背景等等）

官网地址：GlatoAI

5.4k 设计师围观了该问题

点赞 26 回答 1

刘谦Designer 邀你回答

2024/06/05

OpenAI 发布最新 GPT 4o 演示视频，可以给角色配音，太惊艳了！

大家可以感受一下，这个效果还是挺不错的，语气都是微妙微翘的，不知道什么时候能用上！

2.6k 设计师围观了该问题

点赞 38 回答 3

难喻、邀你回答

2024/06/04

各位设计师有用过字节跳动的豆包吗？感觉怎么样？

字节豆包近日推出桌面客户端，Windows 与 macOS 均可下载。

据官网介绍，豆包支持 AI 划词翻译、搜索，AI 伴读 PDF 功能还提供中英翻译对照，一键总结全文内容。

在桌面单击一下就可搜索互联网内容。在用户浏览外文网站时，还可以进行逐行翻译，总结并提取亮点。

各位设计师有用过这个 AI 智能助手的吗？感觉怎么样？

4.1k 设计师围观了该问题

点赞 39 回答 2

刘谦Designer 邀你回答

2024/06/02

腾讯出品，一个帮助动画师生成和优化卡通动画过渡效果的工具 ToonCrafter！

腾讯发布了 ToonCrafter，是一种新型的卡通动画生成技术，可以通过生成插值方法生成自然、连贯的卡通动画中间帧。该技术超越了传统基于对应关系的卡通视频插值方法，能够处理复杂的非线性运动和遮挡问题，使动画过渡更加平滑自然。

从演示来看效果很好，过渡很顺滑，而且没有明显问题。ToonCrafter 利用预训练的图像到视频模型，可以插值两幅卡通图像，并根据参考图像对动画草图自动上色。它支持生成最多16帧的视频，每帧分辨率为512x320。通过减少DDIM步骤，可以降低推理时间。

还设计了一个灵活的草图编码器，使用户能够对插值结果进行互动控制。

项目地址：ToonCrafter

3.0k 设计师围观了该问题

点赞 19 回答 2

大白(●—●) 邀你回答

2024/06/01

文字就能生成逼真音乐特效，Elevenlabs 发布重磅功能，快来试一试吧！

就在刚刚，著名生成式 AI 音乐平台 Elevenlabs 在官网发布了全新功能，文本可直接生成各种逼真音乐特效。

这项技术对于电影、游戏、短视频等行业非常有帮助，因为它可以简化寻找音效的过程，并且多数音效已经获得了 Shutterstock 的商业授权。

Elevenlabs 的这个新功能允许用户通过描述来生成音效，例如汽车呼啸而过的声音、刀剑碰撞的低沉声音或小提琴划过空气的尖锐声音。用户可以登录 Elevenlabs 的官网，选择 “Sound Effects” 并使用该功能。在生成音效之前，用户可以设置音效的时长和文本提示的还原程度。Elevenlabs 还提供了一些示例音效，如雷雨天气的声音和模仿兽人声音的摇滚音乐。

Elevenlabs还提供了语音克隆和文本转语音的功能，但目前对中文的支持较差，生成英文的效果则非常棒。

现在所有用户都可以免费试用 Elevenlabs 的这个新功能。大家可以访问 Elevenlabs 官网了解更多详情。

2.2k 设计师围观了该问题

点赞 19 回答 1

首席爆料师邀你回答

2024/05/31

每月 500W 人访问！Framer AI 网站生成工具支持无代码及自动化设计！

今天我要推荐的网站，能为你提供未来感十足的AI网站生成体验！

Framer 由Koen Bok和Jorn van Dijk于2014年创立。他们曾在Facebook和Hype进行产品设计和开发，看到现有设计工具无法满足创建复杂互动原型的需求，于是创立了Framer。当下，Framer已经成为设计和开发领域的重要工具。

虽然在实时协作和矢量设计方面，Figma等竞争对手更具优势，但Framer凭借其在互动原型和动画方面的强大功能，保持了在设计工具市场中的重要地位。

✨ Framer亮点 ✨ ① 无代码设计：你无需编程基础，通过拖放组件即可创建复杂的交互效果。 ② 实时协作：多人同时编辑和评论，团队合作更加高效流畅。 ③ 自动化设计：智能布局和响应式设计功能，让你的作品在任何设备上都完美呈现。这也是最打动我的一点。现在大大小小的设备太多了，能做到多端适配，简直感动到哭。 ④ 丰富的模板和组件：海量模板和UI组件库，助你快速启动项目，节省时间。 ⑤ 高保真原型：从静态设计到动态原型，一气呵成，完美展示用户体验。

官网地址：Framer

3.6k 设计师围观了该问题

点赞 16 回答 2

刘谦Designer 邀你回答

2024/05/31

送福利啦！OpenAI 宣布 GPT-4o 多模态能力向所有用户免费开放！

昨天（5月30日）凌晨，OpenAI 在 x 平台宣布，GPT-4o 多模态能力向所有用户免费开放。不过，在使用次数上官方没有更新公告，预计还是会是有一定次数限制。

北京时间 5 月 14 日凌晨，OpenAI 举办发布会，带来了 GPT-4o 。该模型打通了文本、图片、视频和语音输入，无需中间转换，互相之间就可以直接生成。此次发布会还带来了更智能的实时语音助手，以及适用于 macOS 的 ChatGPT 桌面应用程序。

当时，OpenAI 宣布向 ChatGPT Plus 和 Team 用户推出 GPT-4o，很快就会向企业用户推出。同时，也向所有人开放 GPT-4o 多模态能力，但有使用次数限制。

2.9k 设计师围观了该问题

点赞 28 回答 2

大白(●—●) 邀你回答

2024/05/29

刚刚得知 Open AI 成立了安全委员会，以后不用担心外界的安全指控了！

厉害啊，Open AI 终于准备解决外界的安全指控了，成立了安全委员会。

最关键的信息是 “Open AI 最近开始训练其下一个前沿模型（GPT-6？）而且预计由此产生的系统将使能力提升到通往AGI的下一个水平。”

这也许是 Open AI 在布局 AGI 的下个阶段，感觉他们对这个模型很有信心啊！

详情戳：Open AI 官网公告

点赞 34 回答 2

首席爆料师邀你回答

2024/05/27

苹果 iOS 18 众多 AI 功能曝光，哪项功能最实用呢？

随着今年WWDC的临近，记者 Gurman 在其最新一期《Power On》专栏中，为我们揭秘了苹果在人工智能领域的最新进展。苹果将对其智能助手Siri进行升级，新版本的Siri将依托于苹果自主研发的LLM技术，为用户提供更为智能的服务。

除此之外，苹果还将在多个方面引入AI技术以增强用户体验，例如通过AI技术实现语音备忘录的自动转录、照片的智能修饰，以及Spotlight和Safari搜索功能的优化。而且，AI还将能够根据用户的短信内容，动态生成个性化的表情符号。

在个性化界面方面，苹果也做出了创新。用户将能够摆脱网格的限制，自由地在屏幕上摆放图标，并可以自定义图标的颜色，这一改进虽与AI无直接关系，但无疑将极大地提升用户体验。

同时，有消息称苹果将在即将到来的 iOS 18 和 macOS 15 系统中，为 Safari 浏览器加入一系列人工智能支持的新功能。

1、智能搜索。苹果可能在搜索中引入 Ajax 语言模型来提供文本摘要。

2、Web橡皮擦：这一功能强调用户界面的简化和隐私保护的增强，允许用户自定义网页内容，删除不需要的元素，如广告和图片。

3、用户界面更新：苹果正在将 Safari 的关键工具集中到一个位置，以提高用户的访问效率。

4、 AI增强的视觉查找：苹果可能在2025年推出高级视觉搜索功能，允许用户通过图像获取信息，类似于 Siri 目前识别照片中的植物、宠物和地标的功能。

这些新功能的加入，将使Safari浏览器的使用体验更上一层楼，你觉得哪项最实用呢？

2.8k 设计师围观了该问题

点赞 24 回答 2

约翰张邀你回答

2024/05/26

Sora 平替工具来啦，Viva 免费的图像视频生成工具，效果等你来测试！

Sora发布有一段时间了，大家用上了没有？今天要给大家分享一个可以平替Sora的免费图像视频生成工具：Viva

Viva是一款免费的 AI 视频和图像生成器。

既对标 Sora，支持文生5秒视频、图生4秒视频，4K分辨率放大。

也对标国内版【美图秀秀】，支持生图、扩图、修复画质、涂抹消除、去水印等。

感兴趣的小伙伴可以测试一下哦！！ Viva地址：https://vivago.ai/video Discord地址：https://discord.com/invite/WEC8TK3At6

6.8k 设计师围观了该问题

点赞 17 回答 1

大白(●—●) 邀你回答

2024/05/25

Krea Video 正式进入公测，现在大家都可以用 Krea AI 视频生成工具啦！

Krea AI最近推出了一个视频制作工具，叫Krea Video，现在大家都可以用了。

这个新工具超好用，你只需加些关键帧和文字提示，就能轻松做视频。你可以随意调整视频时间、画面和动效，想怎么做就怎么做。做视频时，先做个低分辨率的看看效果，然后再加强一下画质，就搞定了。觉得不合适，随时点下左边的白按钮就能停。

这个Krea Video，让我们做视频变得更简单。大家如果有兴趣，可以找找教程，自己动手试试。

Krea Video入口：https://top.aibase.com/tool/krea-video

2.4k 设计师围观了该问题

点赞 27 回答 1

首席爆料师邀你回答

2024/05/25

本地体验大语言模型，这个 ollama 工具你一定要试一试啊！

发现一个超棒的工具，在本地就能运行各种大语言模型啦，这都多亏了 ollama！有了它，我们在本地就能轻松体验强大的语言模型，无需复杂的操作和设置。真的太让人惊喜了，大家一定要试试呀！

官网地址：https://ollama.com/

点赞 15 回答 1

菜单 优设网uisdc.com 优设网 - 学AI设计上优设

您还未登录

登录后即可体验更多功能

优设问答你的职场经验书

AI神器

热门！已发布477篇

AI视频

已发布283篇文章

AIGC

热门！已发布4210篇

AI工作流

已发布13篇文章

大白(●—●) 邀你回答

首席爆料师 邀你回答

大白(●—●) 邀你回答

大白(●—●) 邀你回答

设计狮大宝 邀你回答

刘谦Designer 邀你回答

难喻、 邀你回答

刘谦Designer 邀你回答

大白(●—●) 邀你回答

首席爆料师 邀你回答

刘谦Designer 邀你回答

大白(●—●) 邀你回答

首席爆料师 邀你回答

约翰张 邀你回答

大白(●—●) 邀你回答

首席爆料师 邀你回答

近期热门问题

优设情报 2026年07月08日 星期三

字节 Seedance 2.5 上线！30 秒单段生成减少长视频断层

豆包、千问将下线智能体！AI 拟人陪伴迎来合规收缩

Gemini 3.5 Pro 传 7 月发布！开发场景成大模型新战场

腾讯元宝接入混元 Hy3！支持免费生成文档、报告和小游戏

阿里千问语音模型覆盖 30 种语言！方言转写也能实时处理

128位高手大咖在线答疑解惑

说清楚

完整的描述具体问题和细节

耐心等

回答问题需要认真思考，请耐心等待

巧咨询

还有疑问？及时追问获取更多答案

优设官方微信群

添加管理员 招财

微信号: 扫码添加

严格审核打造高质量交流群

优设官方周边

小黄鸡

关于我们

热门频道

AI频道

支持与服务

官方社群

优设官方微信群

微信扫码 添加管理员 招财

微信号： 扫码添加

严格审核打造高质量交流群

进群会有面试题谢绝打广告

优设微博

优设AIGC

400W粉丝！每日更新设计干货

优设

强烈推荐！优设官方品牌微博

优优教程网

官方微博，海量教程看不完

优设基础训练营

零基础入门，带你成为软件高手

优设微信

每天官微五分钟

一年萌新变大神

扫码关注

优设新媒体矩阵等你来关注

湖北省文化创意产业

协会副会长单位

湖北工业大学

数字艺术产业学院理事单位

东方设计奖

全国高校创新设计大赛运营单位

工信国际

数智设计创新应用伙伴

菜单优设网 - 学AI设计上优设

首席爆料师邀你回答

设计狮大宝邀你回答

难喻、邀你回答

首席爆料师邀你回答

首席爆料师邀你回答

约翰张邀你回答

首席爆料师邀你回答

优设情报 2026年07月08日星期三

添加管理员招财

微信扫码添加管理员招财

微信号：扫码添加