问答分类 AI创作 - 优设网 - 学AI设计上优设

想要深入学习Stable Diffusion的小伙伴，这份资料一定要收好！

发现一个好东西，一个 Stable Diffusion 综合资源库：Latent Box

Stable Diffusion 生态论文精选、Diffuseum 播客和精选 AI 产品集等等众多资料，而且还根据不同的作用做了分类，除了论文地址还有对应的代码仓库和模型下载地址。非常适合深入学习 SD 的朋友研究。

2.1w 设计师围观了该问题

点赞 29 回答 4

GPT-4-Turbo 正式版已发布，新功能可识别图片，这个功能实用吗？

OpenAI 发布了GPT-4-Turbo 正式版，这是一个带有视觉能力的模型，能够处理128k的上下文。

这个模型现在已经全面开放，可以通过“gpt-4-turbo”来使用，最新版本为“gpt-4-turbo-2024-04-09”。

GPT-4-Turbo模型的基础能力得到了显著提升，它不仅能够处理文本输入，还能够识别和理解图片。这一特性使得GPT-4-Turbo在多种应用场景中具有更广泛的应用潜力。例如，它可以用于自动编码、图像识别和营养分析等领域，为用户提供更加丰富和便捷的服务。

GPT-4-Turbo的价格与之前的版本保持一致，这使得用户能够以相对较低的成本使用这一先进的AI技术。同时，OpenAI还提供了详细的接口信息和使用限制，帮助开发者更好地理解和利用这一模型。

大家觉得这个新功能怎么样，实用性高吗？

4.7k 设计师围观了该问题

点赞 11 回答 3

一键自动写影评，谷歌重磅发布Gemini 1.5 Pro，功能太强大了吧？

4月10日凌晨，谷歌在官网正式发布了Gemini1.5Pro，现在可在180多个国家/地区使用。

Gemini 1.5 Pro 不仅能够生成创意文本和代码，还能理解、总结上传的视频和音频内容，并且支持高达100万tokens的上下文。

在Google AI Studio开发平台中，用户可以免费试用Gemini 1.5 Pro，并且它支持中文提示。这使得用户能够通过简单的操作，上传视频或音频文件，并获取内容的深度总结。例如，用户可以上传一个视频并询问影片的内容，Gemini 1.5 Pro能够快速解析并提供答案。

Gemini 1.5 Pro还提供了音频理解功能，能够快速解析音频文件并总结其内容。这对于需要处理大量视频和音频内容的用户来说，无疑是一个巨大的帮助，因为它可以节省大量的时间。

谷歌还对Gemini API进行了性能优化，包括系统指令、JSON模式以及函数调用优化，这些改进显著提升了模型的稳定性和输出能力。系统指令功能允许用户根据特定需求控制模型的行为，JSON模式可以帮助开发者从文本或图像中提取结构化数据，而函数调用优化则支持开发者实现更全面的查询响应。

详情点此查看: https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html

音频理解能力: https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb

2.8k 设计师围观了该问题

点赞 17 回答 3

网易云音乐上线 Suno AI 音乐专区了，看来又找到流量密码了~

今天发现个好玩的，网易云音乐整了一个 Suno AI 音乐的 Tab，都是各种 AI 音乐，听了一会儿感觉还是蛮有意思的，只能说搞运营还得是网易云。不知道听什么歌，可以听一下，感受一下离我们越来越近的 AI 人工智能。

5.3k 设计师围观了该问题

点赞 14 回答 4

AI 如何改变音乐视频制作？Sora 给出答案，发布首支MV《Worldweight》

刚刚，OpenAI 官方账号发布的一支由 Sora 制作的MV（Music Video）——《Worldweight》

这支 MV 的音乐是由艺术家 AugustKamp 作曲，而画面内容则是通过 Sora 来生成的。AugustKamp 表示，Sora 使得他能够将原本只存在于他心中的想象转化为可以与他人共享的艺术形式。这并非他首次使用AIGC技术来制作MV，他之前已经在 Instagram 上分享过由 Sora 生成的 MV 片段。

但是和以往不同的是，全球知名的艺术家，包括麻辣鸡（NickiMinaj）、水果姐（KatyPerry）、碧梨（BillieEilish）等，联名抗议AIGC技术的使用。他们认为AIGC技术在未经补偿的情况下使用艺术家的声音、作品来训练AI模型，并稀释支付给艺术家的版税池，这些问题不仅损害了艺术家的经济利益，也对他们的创作自由和艺术价值构成了威胁。

科技的发展与创造力的边界在哪里？从 MV 到音乐剧。AI如何重塑我们的音乐体验呢？欢迎在评论区留言讨论！

点赞 37 回答 2

设计师的新玩具：剪映 Dreamina 智能画布，MJ+SD+PS 工作流一键搞定！

继上线视频生成功能后，Dreamina 又上线了一个新功能——智能画布。该功能集成了 mj、sd 和 PS 的功能，让用户能够在一个平台上完成多种操作，无需在不同的软件之间切换。Dreamina 智能画布的核心特点之一是支持多图层的 AI 可控能力，如：边缘保持，支持超清、重绘、抠图、扩图等丰富的后编辑能力。

以下是 Dreamina 功能概况： - 智能画布功能：Dreamina的智能画布支持多图层的AI可控能力，包括边缘保持、超清重绘、抠图、扩图等后编辑能力。这意味着用户可以像使用Photoshop一样操作多个图层，并通过AI生成新的图片。 - 提高工作效率：智能画布的智能化操作方式不仅提高了工作效率，还降低了操作难度，使得更多用户能够轻松上手。 - 应用场景： - 制作小程序产品宣传图 - 生成品牌的创意宣传海报 - logo创意玩法，将品牌logo嵌入图片中 - 对小企业和个人店铺的优势：对于宣传费用有限的小企业和个人店铺，Dreamina提供了一个免费制作宣传图的工具。

→ 官方使用教程文档

7.7k 设计师围观了该问题

点赞 24 回答 2

何帆UI 邀你回答

2024/04/02

你想过吗？通过聊天就能完成UI设计，OpenUI 这个 AI 工具做到了！

哇塞，W&B团队真是太牛了！他们开发的这个开源工具OpenUI，简直是我们设计师的福音啊！你只需用文字描述一下你想要的UI界面，OpenUI就能立刻帮你渲染出效果，实时呈现你的设计想法。

更神奇的是，你还可以通过聊天的方式随时修改设计，而且它能轻松将HTML转换成React、Svelte、Web Components等各种前端框架的代码。这简直就是设计界的神器啊！

我试了试，发现它现在用的是GPT模型，效果还挺不错的。虽然项目还有些小瑕疵，但已经很有潜力了，绝对值得继续深入研究。对于我们设计师来说，这绝对是个能大大提升工作效率的好帮手！

OpenUI 线上试玩戳这里！

3.4k 设计师围观了该问题

点赞 12 回答 2

胖橘邀你回答

2024/04/02

OpenAI 放开限制了，无需注册即可使用ChatGPT，还有必要付费吗？

就在昨天，OpenAI宣布，将允许用户直接使用ChatGPT，我们现在可以直接使用ChatGPT了，连注册都不用！

之前我就听说，ChatGPT自2023年5月以来全球访问量飙升到了18亿次，可见它有多受欢迎。不过，流量增长开始放缓，可能意味着大家对它的新鲜感逐渐减弱。这应该也是OpenAI放开限制的原因，随着人工智能技术的发展，现有的互联网信息量可能不足以支撑科技巨头训练更先进的人工智能系统，甚至高质量文本数据的不足可能减缓人工智能技术的发展速度。

大家平时有用到ChatGPT吗？还有没有付费的必要啊？

2.9k 设计师围观了该问题

点赞 19 回答 2

刘谦Designer 邀你回答

2024/04/01

OpenAI 首次展示音频模型 Voice Engine，生成的声音太逼真了！

OpenAI 周五在其官网上发表了博客文章，名为“驾驭合成声音的挑战和机遇”，这也是 OpenAI 在官网首次展示了全新自定义音频模型“Voice Engine”。

用户只需要提供15秒左右的参考声音，通过Voice Engine就能生成几乎和原音一模一样的全新音频，在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。

除了能合成音频之外，OpenAI 还展示了Voice Engine很多其他际商业用途，例如，一位失去声音表达能力的女孩，在Voice Engine帮助下能像以前一样正常发音说话。

全文内容：OpenAI 官网

Voice Engine 应用场景： 1. 阅读助手：可以通过自然且富有情感的声音为非阅读者和儿童提供阅读辅助，实时个性化响应，与学生互动。 2. 内容翻译：可以翻译视频和播客等内容，使创作者和企业能够以流利且原汁原味的声音触达全球更多受众。 3. 服务全球：改善偏远地区的必要服务。 4. 帮助言语障碍人士：为言语障碍人士提供治疗应用，以及为有学习需求的人士提供教育增强功能，使残疾人能够进行交流。 5. 帮助病人恢复声音：帮助患有突发性或退行性言语障碍的患者恢复声音。

点赞 20 回答 3

首席爆料师邀你回答

2024/03/30

字节 Dreamina 视频生成正式开放内测，名额有限，先到先得！

近日，字节跳动旗下的 AI 创作平台 Dreamina 宣布开放内测，用户可以通过访问官网体验其强大的功能。在内测期间，每天的名额有限，先到先得。目前，Dreamina 的官网页面已经正式发布了视频生成的入口。

3.8k 设计师围观了该问题

点赞 25 回答 1

设计师于恒邀你回答

2024/03/30

设计革新：Adobe GenStudio 引领营销人员进入 AI 创作新时代！

近日，Adobe 放了个大招，推出了这个 Adobe GenStudio 的神器。说实话，这简直就是咱们营销人的福音啊！以后做跨渠道活动，啥工具都不愁了，一站式搞定！

GenStudio 是基于生成式人工智能打造的，简单说，就是它懂你，知道你想要啥。用它来规划、制作、管理、发布和评估内容，那简直就是轻松加愉快。最关键的是，还能保证内容和品牌形象严丝合缝，不掉链子。

来说说它都有哪些牛X的功能吧：

1. 创作：有了 Adobe 的 AI 技术，咱们营销人也能秒变创作达人！快速出图，品质还高。而且都是基于品牌认证的模板，AI 护航，不怕品牌形象跑偏。 2. 内容中心：这个平台界面简洁明了，找素材、编辑、重复用、分享，全都方便得不行。再也不用东翻西找，浪费时间了。 3. 活动管理：GenStudio 还有个活动概览功能，活动简介、时间表一目了然。策划活动？那是分分钟的事！ 4. 发布：更牛的是，GenStudio 还能和 Adobe Experience Cloud 的其他产品（比如 Journey Optimizer、Experience Manager、Marketo 和 Target）无缝对接，想导出到其他应用也是轻而易举。 5. 数据洞察：最后，还能实时看到内容在不同渠道的表现，AI 还能帮忙生成不同版本的内容，让活动效果更好。

Adobe GenStudio 试玩地址戳这里！

2.2k 设计师围观了该问题

点赞 28 回答 1

大白(●—●) 邀你回答

2024/03/28

AI 神器推荐！使用自然语言就能创建 3D 网站的AI工具：DoraAI

DoraAI 是一个基于生成式AI的网站开发平台，这个工具特别适合那些没有编程或网页开发技能的用户，因为它不需要编码或使用其他开发工具。

DoraAI 的特点包括使用基于文本的AI生成器创建酷炫的3D和动画网站，无需编码即可实现。而且，它还提供了一个强大的无代码编辑器，用户可以在其中生成落地页等网站元素。

试玩地址：https://www.dora.run/ai

4.7k 设计师围观了该问题

点赞 14 回答 2

首席爆料师邀你回答

2024/03/26

Domo AI 新功能来袭：照片转视频，轻松打造人物动态大片！

Domo AI 最近推出了一项令人兴奋的新功能，能够将静态人像变得栩栩如生。

只需要一张静态照片和一个参考的动态视频，就能够将静态照片中的人物替换成动态视频中的人物，使其动起来。

从演示效果来看真不错，比阿里自己的那个线上版本强很多，不过第二个那个腹肌还是有点鬼畜。

5.3k 设计师围观了该问题

点赞 21 回答 3

刘谦Designer 邀你回答

2024/03/26

AI 广告生成器，Adsby 创建广告就像做馅饼一样简单！

这个AI工具比较适合营销创意工作者，只需提供你的网站链接， AI 就会完成剩下的工作，制作引人入胜的广告和精确的关键字。这就像你的口袋里有一个营销专家，可以节省你的时间，毫不费力地提高你的在线知名度。

目前可以免费试用14天，灵感匮乏的时候，感觉可以拿出来救救急~官网链接：https://adsby.co/

2.7k 设计师围观了该问题

点赞 20 回答 2

chan 邀你回答

2024/03/25

想问下RUNWAY，付费会员，可以多台电脑使用吗？

Pro版和无限版本的RUNWAY会员，有什么区别？无限版是不是不限制积分？

7.2k 设计师围观了该问题

点赞 11 回答 5

首席爆料师邀你回答

2024/03/23

性能超越ChatGPT，阿里通义千问重磅升级，免费开放1000万字长文档处理！

阿里通义千问迎来了一次重磅升级，其1000万字的长文档处理功能现已向所有人免费开放，这一举措使得通义千问在全球范围内成为文档处理容量首屈一指的AI应用。从即日起，无论是金融、法律、科研、医疗还是教育领域的专业人士，都可以通过通义千问的网站和APP，轻松研读各类报告、分析财报、解读科研论文、研判案情、理解医疗报告、掌握法律条文，以及分析考试成绩和总结深度文章。

在金融领域，专业人士只需上传公司财报，通义千问便能自动提取和总结公司各业务的营收情况和利润增长等核心信息，帮助他们快速了解公司的整体业绩表现。而上传公司不同时期的财报后，通义千问还能生成公司在这一阶段内的业务变化、业绩趋势，并进行深入的财报分析。

在法律领域，通义千问同样展现出强大的能力。对于律师和法官而言，阅读和分析大量的法律文档是一项繁琐且耗时的工作。然而，通义千问能够迅速阅读并分析这些法律文件，帮助用户迅速掌握法律条文的要点。输入特定案件信息后，通义千问还能给出相应的判罚建议，极大地提高了工作效率。

目前，通义千问在文档处理容量和能力方面已全面超越ChatGPT等全球市场上的其他AI应用，展现出了其在智能科技领域的卓越实力。

2.7k 设计师围观了该问题

点赞 21 回答 3

菜单 优设网uisdc.com 优设网 - 学AI设计上优设

您还未登录

登录后即可体验更多功能

优设问答你的职场经验书

Stable Diffusion

热门！已发布415篇

谷歌设计

已发布38篇文章

神器推荐

热门！已发布1081篇

人工智能

已发布288篇文章

刘谦Designer 邀你回答

首席爆料师 邀你回答

大白(●—●) 邀你回答

在光谷的谷子 邀你回答

首席爆料师 邀你回答

首席爆料师 邀你回答

何帆UI 邀你回答

胖橘 邀你回答

刘谦Designer 邀你回答

首席爆料师 邀你回答

设计师于恒 邀你回答

大白(●—●) 邀你回答

首席爆料师 邀你回答

刘谦Designer 邀你回答

chan 邀你回答

首席爆料师 邀你回答

近期热门问题

优设情报 2026年07月08日 星期三

OpenAI 预览 GPT-5.6 三档模型！API 和 Codex 先向部分机构开放

xAI 改名 SpaceXAI！Grok 和算力业务归入 SpaceX 体系

Figma 并行 AI 改图上线！多张提案图可同步生成且不打断画布操作

微信 AI 小程序成长计划加码！10 亿 Token 和 10 万张生图额度开放申领

蚂蚁灵波 LingBot-Depth 2.0 发布！机器人看清玻璃镜面距离

128位高手大咖在线答疑解惑

说清楚

完整的描述具体问题和细节

耐心等

回答问题需要认真思考，请耐心等待

巧咨询

还有疑问？及时追问获取更多答案

优设官方微信群

添加管理员 招财

微信号: 扫码添加

严格审核打造高质量交流群

优设官方周边

小黄鸡

关于我们

热门频道

AI频道

支持与服务

官方社群

优设官方微信群

微信扫码 添加管理员 招财

微信号： 扫码添加

严格审核打造高质量交流群

进群会有面试题谢绝打广告

优设微博

优设AIGC

400W粉丝！每日更新设计干货

优设

强烈推荐！优设官方品牌微博

优优教程网

官方微博，海量教程看不完

优设基础训练营

零基础入门，带你成为软件高手

优设微信

每天官微五分钟

一年萌新变大神

扫码关注

优设新媒体矩阵等你来关注

湖北省文化创意产业

协会副会长单位

湖北工业大学

数字艺术产业学院理事单位

东方设计奖

全国高校创新设计大赛运营单位

工信国际

数智设计创新应用伙伴

菜单优设网 - 学AI设计上优设

首席爆料师邀你回答

在光谷的谷子邀你回答

首席爆料师邀你回答

首席爆料师邀你回答

胖橘邀你回答

首席爆料师邀你回答

设计师于恒邀你回答

首席爆料师邀你回答

首席爆料师邀你回答

优设情报 2026年07月08日星期三

添加管理员招财

微信扫码添加管理员招财

微信号：扫码添加