优设问答你的职场经验书

刘谦Designer 邀你回答

2024/01/05

视频生成领域的 “ChatGPT 时刻”,什么时候会到来?

今年接触了太多 AI 工具了,AI 绘画的先不说,光是视频生成就已经让我震惊不已。今天刷到了一个 VideoPoet 作者的专访,分享的一些关于视频生成领域的观点非常有意思,其中关于视频生成领域的 “ChatGPT 时刻”的解读前瞻性十足,大家感兴趣的可以了解一下!

以下是引用: “ 视频生成的“ChatGPT 时刻”,我觉得大概是,哪怕模型生成的还是比较短的片段,比如 2-5s,但这个生成是可控的,人类也很难分辨是 AI 生成还是人类制作。从用户角度,只需要几美分的代价,就能获得一个可以被送到好莱坞专业 studio 的样片。如果类比的话,可以类比到图像领域 stable diffusion 1.x 或 2.x 版本,肯定还有再提升的空间,但已经到了能使用的程度,而且能激发很多应用。

我的预测是,到 2024 年底或 2025 年初,我们可能会到这个时刻。并且我认为,实现这个时刻肯定也需要 diffusion 参与,并且 diffusion 在未来一段时间,比如 1 到 2 年内,可能仍然是主流,扮演很重要的角色。这里说的 diffusion 已经包含了 transformer。

“ChatGPT 时刻”意味着模型到了一个相对稳定的阶段,但后面还会再改,只不过是在这个基础上做小的改动,可能一开始版本只能做到逼近好莱坞,有一些缺点,但可以商业化运用了,但要达到真正稳定需要更长时间。随后还可能仍会迭代升级。

现在市场上所有的视频生成都达不到这个标准,所以我认为视频生成的方法可能还需要进一步迭代,有可能要达到“ChatGPT 时刻”需要新的模型和方法,它不一定是全新的模型或者架构,可能是现在市场上的某个技术路线或者方案再往前走一步。”

2.0k 设计师围观了该问题
点赞 37 回答 4

大白(●—●) 邀你回答

2023/12/20

Midjourney V6 发布前瞻,各位设计师期待吗?

从 Midjourney 的发布,到现在不到1年的时间,它的神奇,大家有目共睹吧?可能很多喜欢AI绘画的小伙伴,和我一样,都在等着 Midjourney V6的发布,新版本将支持更复杂内容的绘制,社区评价显示在还原画面和内容方面有大幅提高。预计 V6 版本将在圣诞节前发布,为人工智能艺术领域带来新的突破。

Midjourney V6 特色亮点:

1、超高图像分辨率:V6 呈现 2048×2048 像素,堪称上一版本的翻倍体验。 2、智能自然语言处理:V6 更进一步,理解你的文字提示,创造更加精准逼真的画面。 3、图像变体掌控:你将拥有更多定制图像变体的权利,轻松调整颜色、风格或视角。 4、改良手部生成:全新提升的手部生成技术,可以用双手制作更加真实的照片。 5、3D模型创作:Midjourney 6 支持3D模型生成,开启创作者全新设计的可能性。 6、视频生成创新:V6 能从文字输入中呈现出引人入胜的视频,改变叙事、影视制作和教育的未来。

其他方面升级:独立浏览器版本 - 将 Midjourney 从 Discord 分离到自己的浏览器应用程序中。移动应用程序 - Midjourney APP 应用程序正在开发中。用户界面改进 - 计划更好的用户体验和组织图像(例如文件夹和标签)。

第三方存储同步 - 可能与 Google Drive、Dropbox 等集成。

以上就是 Midjourney V6 发布前瞻,怎么样,各位设计师期待吗?

9.8k 设计师围观了该问题
点赞 17 回答 7

张小闲 邀你回答

2023/12/10

谷歌 Gemini 跟 Bard 有什么关系?AI科普

最近谷歌发布了Gemini 1.0,在网上的关注度非常高,很多小伙伴可能对Gemini都不了解,具体是做什么的,和Bard有什么关系呢?这篇科普问答给你答疑解惑

Gemini和 Bard 的关系是 : Gemini 是 Bard 背后的人工智能技术,它使 Bard 能够处理和生成多种类型的输入和输出,Gemini 是一个多模态人工智能模型,能够处理和理解来自不同来源的信息。

它可以理解文本、图像、音频和视频。这使它能够生成更全面和信息主富的响应。

例如:如果您问 Bard 一道数学题,Gemini可以帮助它理解题目并生成正确的答案。

如果你问 Bard 一个历史问题,Gemini可以帮助它理解背景信息并生成全面的答案。 如果你问 Bard 一个开放式问题,Gemini可以帮助它理解您的意图并生成创造性的答案。

Gemini 还可以帮助 Bard 生成更有趣和吸引人的文本格式,例如诗歌、代码、脚本、音乐作品、电子邮件、信件等。

总而言之,Gemini 是 Bard 背后的关键技术,它使 Bard 能够以更全面、信息丰富和创造性的方式处理和生成信息,以下是 Gemini 和 Bard 的一些具体关系:

1、Gemini为 Bard 提供了多模态处理能力,使 Bard 能够理解来自不同来源的信息,例如文本、图像、音频和视频

2、Gemini为 Bard 提供了生成不同文本格式的能力,例如诗歌、代码、脚本、音乐作品、电子邮件、信件等。

3、Gemini 为 Bard 提供了更全面和信息丰富的响应能力,即使是开放式的问题

Gemini的加入使 Bard 成为了一个更强大和通用的语言模型,它可以用于各种任务,例如信息查询、生成创意内容和答开放式问题。

1.0w 设计师围观了该问题
点赞 9 回答 2