Blockade Labs 生成式 AI 平台,近日在其官方网站上隆重推出了新一代模型——Model 3。
与前代Model 2相比,Model 3在生成效果上有了显著的提升。这款新模型原生就能支持到8192x4096的超高清分辨率,这大大提高了生成图像的质量。而且其增强的文本提示器能更精确地描绘生成的虚拟世界,使得生成的图像更为生动逼真。Model 3还大幅降低了生成图像的灰度值,无论是建筑、风景还是人物,都展现出更高的清晰度和精致的细节。
现在,大家已经可以免费体验这款全新的Model 3模型。虽然目前Model 3还未开放像Model 2中的网格、混音、重组、草图等自定义功能,但Blockade Labs已经明确表示,这些功能将在不久的将来为用户逐一呈现。
Model 3的主要特点包括: 1. 高分辨率支持:原生支持8192x4096分辨率,这比Model 2有显著提升。 2. 文本提示器增强:能够更好地描述生成的世界。 3. 减少灰度值:使生成的建筑、风景、人物等看起来更加高清和细腻。
免费体验地址:https://skybox.blockadelabs.com/1a97298c8f1f88340e91418e93fbee3e API地址:https://skybox.blockadelabs.com/api-membership
从Logo到名片、社交媒体封面,省下90%成本,小白秒变设计大神!
BrandCrowd 真的是一款能够满足多种设计需求的宝藏工具,它就像一位随叫随到的设计大师,随时为你提供专业、贴心的设计服务。 无论你是创业者想要打造独特的品牌形象,还是自由职业者渴望提升个人职业形象,亦或是自媒体人追求更吸睛的社交内容创作,BrandCrowd 都能成为你最得力的助手,让你的设计梦想轻松照进现实。
BrandCrowd 不是普通工具,而是你的「24小时设计团队」! ✅ AI智能生成→输入品牌名+关键词(如“科技简约”),秒出100+专业级Logo方案 ✅ 海量高颜值模板→10万+设计师原创素材库,覆盖餐饮、美妆、科技等200+行业 ✅ 一键延伸全套设计→自动适配名片/Ins封面/FB海报,品牌视觉从此统一不翻车! ✅ 自由编辑超简单→像玩拼图一样拖拽改字体、调颜色,3分钟交出满意终稿
工具地址:https://www.brandcrowd.com/
近期,Stability AI 推出的一款创新性视频生成模型 Stable Video 4D
模型下载:https://huggingface.co/stabilityai/sv4d
Stable Video 4D 的主要特点: - 高质量视频内容:Stable Video 4D 能够处理和生成高质量的视频内容,满足专业应用的需求。 - 合成数据集训练:虽然目前主要基于合成数据集进行训练,但 Stability AI 正在优化模型以适应真实世界的视频场景。 - 相关模型:除了 Stable Video 4D,Stability AI 还发布了 Stable Video Diffusion 和 SV3D 等模型,它们支持从图像或文本生成视频,并在多视图合成和高分辨率视频生成方面表现出色。
个人感觉这个模型还挺强的,大家觉得有哪些实际应用场景啊?
Isocons支持多种格式,包括SVG和PNG,用户可以根据需求选择合适的格式进行下载和使用。可以说是一个专为设计师打造的isometric等距图标设计工具。它操作简单,功能强大,能快速创建精美的等距图标。
3大核心优势让设计师直呼“真香”:
1. 💡 3秒出图,操作无门槛 - 无需学习复杂透视原理,左/顶/右视图自由切换,拖拽调整参数,傻瓜式操作也能输出专业级等距图标。 - 内置海量预设模板(科技、金融、生活等主题),输入关键词秒搜所需素材。
2. 🎨 高度自定义,完美适配品牌 - 颜色、描边、圆角精细调控,支持16进制色值输入,轻松匹配品牌VI系统。 - 导出SVG矢量格式(无限缩放不模糊)和PNG高清图,适配Figma/Sketch/PPT等多场景! - 图标库提供丰富的预设样式,包括圆角、直角、加粗等选项,同时支持调整图标的角度、颜色和尺寸,满足不同设计需求。
3. 🚀 免费!免安装!打开网页就能用 - 无需下载软件,浏览器直接开干,设计稿、代码无缝衔接,打工人必备的“摸鱼神器”(老板看了都说专业)。
就在刚刚,著名生成式 AI 音乐平台 Elevenlabs 在官网发布了全新功能,文本可直接生成各种逼真音乐特效。
这项技术对于电影、游戏、短视频等行业非常有帮助,因为它可以简化寻找音效的过程,并且多数音效已经获得了 Shutterstock 的商业授权。
Elevenlabs 的这个新功能允许用户通过描述来生成音效,例如汽车呼啸而过的声音、刀剑碰撞的低沉声音或小提琴划过空气的尖锐声音。用户可以登录 Elevenlabs 的官网,选择 “Sound Effects” 并使用该功能。在生成音效之前,用户可以设置音效的时长和文本提示的还原程度。Elevenlabs 还提供了一些示例音效,如雷雨天气的声音和模仿兽人声音的摇滚音乐。
Elevenlabs还提供了语音克隆和文本转语音的功能,但目前对中文的支持较差,生成英文的效果则非常棒。
现在所有用户都可以免费试用 Elevenlabs 的这个新功能。大家可以访问 Elevenlabs 官网了解更多详情。
阿里通义千问迎来了一次重磅升级,其1000万字的长文档处理功能现已向所有人免费开放,这一举措使得通义千问在全球范围内成为文档处理容量首屈一指的AI应用。从即日起,无论是金融、法律、科研、医疗还是教育领域的专业人士,都可以通过通义千问的网站和APP,轻松研读各类报告、分析财报、解读科研论文、研判案情、理解医疗报告、掌握法律条文,以及分析考试成绩和总结深度文章。
在金融领域,专业人士只需上传公司财报,通义千问便能自动提取和总结公司各业务的营收情况和利润增长等核心信息,帮助他们快速了解公司的整体业绩表现。而上传公司不同时期的财报后,通义千问还能生成公司在这一阶段内的业务变化、业绩趋势,并进行深入的财报分析。
在法律领域,通义千问同样展现出强大的能力。对于律师和法官而言,阅读和分析大量的法律文档是一项繁琐且耗时的工作。然而,通义千问能够迅速阅读并分析这些法律文件,帮助用户迅速掌握法律条文的要点。输入特定案件信息后,通义千问还能给出相应的判罚建议,极大地提高了工作效率。
目前,通义千问在文档处理容量和能力方面已全面超越ChatGPT等全球市场上的其他AI应用,展现出了其在智能科技领域的卓越实力。
谷歌发布的一个名为 VLOGGER 的项目。这个项目能够根据输入的图片和音频生成对应人物讲话的视频。但是个人感觉 VLOGGER 看起来没有阿里巴巴发布的 DreamTalk 和 EMO 自然,大家觉得呢?
VLOGGER 主要特点: 1. 3D运动的扩散模型:它可以根据一张人物图像生成由文本和音频驱动的说话人视频。 2. 创新的架构:项目包含一个创新的基于扩散的架构,通过时间和空间控制来增强文本到图像模型的能力。 3. 高质量视频生成:能够生成高质量、可变长度的视频,并通过人脸和身体的高级表示进行便捷控制。 4. 广泛的适用性:与之前的工作相比,VLOGGER不需要为每个人单独训练模型,不依赖人脸检测和裁剪,能生成完整的图像(包括脸部和身体),适用于广泛场景,如躯干可见或身份多样化,这对于正确合成具有沟通能力的虚拟人至关重要。
项目地址:https://enriccorona.github.io/vlogger/