- 提示理解能力更强:对文字与图像提示的理解更准确。 - 图像质量显著提升:纹理更精美,人物、手部、物体的细节一致性更高。 - 默认启用模型个性化:用户需花约 5 分钟解锁,之后可随时启用或关闭。 - 个性化作用:更准确捕捉用户审美与需求。
“旗舰功能:草稿模式(Draft Mode) •成本降低:草稿模式运行成本为普通 V6 模式的一半。 •速度提升:渲染速度是普通模式的 10 倍。 •实时互动:因其响应极快,使用草稿模式时提示栏会切换为“对话模式”。 •用户可以直接输入如“将猫换成猫头鹰”或“设置为夜晚”,系统自动调整提示并启动新渲染。 •语音模式集成:点击“草稿模式”后可启用麦克风,进行语音输入,实现“边想边画”的体验。
草稿模式的用途 •创意迭代的利器:非常适合快速尝试创意与提示组合。 •草图风格输出:图像质量低于标准渲染,但在风格与结构上保持一致,适合快速实验。 •可手动指定草稿模式:在提示后添加 --draft 可显式启动草稿渲染。
后续操作 •喜欢某个草图?点击“增强”或“变化”,系统将以全质量重新渲染。
昨天在优设读报刷到的这个工具,试玩了一下,感觉还蛮有意思的,比较适合做微信头像(不是很会用,就感觉拿来生成卡通的头像太合适了)
PhotoMaker 是腾讯推出的一款真实人像生成工具,快速逼真,效果自然。
功能包括: 1. 利用多张照片作为身份ID,获取人物特征,然后创造出一个新的、个性化的人物图像。
2.把几个不同人的照片特征混合在一起,创造出一个全新的人物形象。
3. 能改变照片人物的性别、年龄和生成多种风格的其他照片。Huggingface上有Demo,试了一下的确可以精准还原人脸特征。
大家有体验过了吗?感觉怎么样呢?
Github 上的一个名为 OpenVoice 的 AI 语音克隆项目爆火,该项目由 myshell-ai 开源,仅开源了不到三周,就有了 6.1k 的 star。
OpenVoice能对声音风格的精细控制,包括情感、口音、节奏、停顿和语调,同时能够复制参考发言者的音色。
主要功能: - 准确的音色克隆:OpenVoice能够精确地克隆参考音色,并在多种语言和口音中生成语音。 - 灵活的声音风格控制:用户可以控制生成语音的情感和口音,以及其他风格参数,如节奏、停顿和语调。 - 零样本跨语言声音克隆:OpenVoice可以在未包含在大规模多语言训练集中的任何语言之间进行声音克隆。
试玩地址: https://github.com/myshell-ai/OpenVoice