大家有刷到这张蒙娜丽莎做瑜伽的动图吗?
这是用字节跳动最新发布的 MagicAnimate 生成的,这个AI视频工具和昨天给大家分享的阿里 Animate Anyone 创新视频生成技术一样,只需一张图片即可生成平滑稳定的视频。更离谱的是,字节 MagicAnimate 还支持与文本结合创建动画,并支持多人照片合成。
MagicAnimate 是新加坡国立大学和字节跳动联合推出的「人体图像动画生成器」,能够把指定的人物图片按照既定动作序列生成视频。其主要功能特点包括时间一致性动画,该框架通过运动序列使参考图像动起来,并确保动画在时间上的连贯性,呈现自然流畅的动作,避免突兀的变化。
同时,MagicAnimate在动画化过程中能够保持对原始参考图像的高度忠实度,确保动画中的人物或对象与原图保持一致。
感兴趣的小伙伴可以关注起来,现在国产AI工具已经慢慢开始发力了,大家可以期待一下功能更强大的国产AI工具!
WonderJourney 是斯坦福与谷歌打造,而且这个项目有点厉害啊,只需要1张图片就可以创建3D场景动画,从用户提供的任何位置(通过文本描述或图像)开始,并通过一系列不同但连贯的 3D 场景生成一个旅程。从演示效果来看非常流畅,3D游戏或者影视的场景创建要变简单了。
主要能力: ◆ 从任意位置(由文本或图像指定)开始,WonderJourney 沿着相机轨迹生成一系列多样化但连贯连接的 3D 场景。 ◆ 从同一个地点开始,WonderJourney 可以生成一组不同的“奇妙旅程”,并在不同的目的地结束。使用相机姿势的轨迹渲染下面的每个视频。 ◆ WonderJourney 还可以根据一系列文本描述(例如诗歌、俳句和故事摘要)生成受控的奇妙旅程。
终于还是等到了啊,Midjourney 今日宣布推出其首个 AI 视频生成模型 V1,正式进军 AI 视频领域。
V1 是一款图像转视频模型,用户可以上传一张图片,或使用 Midjourney 其他模型生成的图像,V1 将基于此生成四段五秒的视频。
V1 提供低动态和高动态两种方案,支持延长,每次4秒最多4次。
与 Midjourney 的图像模型类似,V1 目前仅通过 Discord 平台提供,并且初期仅支持网页端使用。
每个月订阅费只需要10美元,视频任务的定价约为图片任务的 8 倍,每次任务将生成四段 5 秒视频。
成本跟图像超分服务相当,非常便宜。
联想官网14周年庆,AI狂欢盛典正式启动!联想官网与文心一格携手,让AI赋予你无限的想象力,让每个人都能化身为Al绘画大师。邀你一同参与,小伙伴们冲鸭!
参赛说明: 1、本次「联想官网14周年庆×为AI想象」主题创作大赛开设普通组和专业组作品投稿及投票,画作尺寸选择【横图】相关比例。 2、本赛道用户参赛作品可用于联想电脑A面定制,定制属于用户的专属AI电脑,请于创作后前往联想官网,自定义上传你的Al作品,体验笔记本A面私人定制。
大赛要求: 1、本次活动需使用文心一格进行AI创作。 2、投稿作品需符合活动主题,作品内容以“为AI想象”为主,无关作品不参与最终排名。 3、投稿作品Prompt (关键词) 不限、画风不限。 4、每人每赛道可投稿1幅参赛作品 (可替换参赛作品,替换后原有票数清空)。每人每天可投5票、每幅作品限投1票、可投多幅。支持合理拉票,但禁止恶意拉票/刷票行为。 5、最终排名将综合最终票数、专业评委意见及加权项评出。
投稿时间:2023年7月14日-2023年7月28日 投票时间:2023年7月29日-2023年8月2日 评选时间:2023年8月3日-2023年8月7日 奖励公布时间:2023年8月10日
大家关注了吗?今天凌晨的时候,OpenAI在官网宣布,在今年10月份将通过API向ChatGPT Plus和企业版用户提供全新文本生成图片产品——DALL·E 3。
官方是这样介绍的: “ DALL·E3 原生构建于 ChatGPT 之上,让您可以使用ChatGPT作为集思广益的合作伙伴并完善您的提示。只需询问 ChatGPT您想看到什么,从简单的句子到详细的段落。
ChatGPT中的 DALL·E3当提出想法时,chatGPT 将自动为DALL·E3生成定制的详细提示,将您的想法变为现实。如果您喜欢某个特定图像,但它不太正确,您可以要求 ChatGPT 只需几句话即可进行调整。”
这是否意味着,ChatGPT在DALL·E 3加持下将开启久违的多模态输出模式呢?还会带来哪些其他的变化?我们拭目以待吧!
还在手敲重复代码?试试用自然语言“画”出程序!
输入“我要一个渐变登录页,带3D按钮”👉 AI自动生成React组件;上传Figma设计稿👉 10秒导出可运行的前端代码!
DoorDash团队用它省下50%开发时间,你的下一个项目,也该让AI当“最强辅助”了!
✨ 让优设粉丝尖叫的三大神技: 1️⃣ 「说人话」编程:用“修复循环报错”“加个缓存机制”代替复杂语法,GPT-4秒级响应 2️⃣ 设计稿→代码:支持Figma/Sketch导入,自动生成HTML+CSS+JS 3️⃣ 多文件智能避坑:AI实时检测跨文件冲突,比人类快10倍定位隐形BUG
🔥 设计师狂喜时刻: ✅ 上传界面图自动标注尺寸/色值 ✅ 用“把图标调大20%”直接修改代码 ✅ 生成带交互逻辑的动效代码,Lottie一键导出
点击体验👉 https://www.cursor.com/ja
GPT-5 来了!这次不是“渐进式升级”,而是 LLM 的“石器时代革命”! 经过两年打磨,OpenAI 终于掏出了“终极大杀器”——GPT-5!这不仅是“更强、更快、更便宜”的升级版,更是全球首个能“主动用工具思考”的 AI,堪称开发者手中的“瑞士军刀”!
核心亮点:为什么说 GPT-5 是“地表最强”? 1️⃣ 编程能力封神!秒杀所有对手 - SWE-bench 测试碾压全场:74.9% 的解决率,吊打 Google Gemini 2.5 Pro(59.6%)和 Claude Opus 4.1(74.5%)。 - 实战表现炸裂:一键修复复杂依赖冲突、从零搭建全栈网站(HTML/CSS/JS)、生成生产级 ClickHouse 数据库查询……开发者直呼:“这哪像 AI,根本就是我的私人大神队友!” - 工具调用天花板:并行使用网络搜索、代码解释器、Git 命令……像真人一样规划步骤、试错优化,效率翻倍!
2️⃣ 成本狂降!开发者狂喜 - 输入仅需 1.25 美元/百万 tokens(比 GPT-4o 便宜 50%),输出 10 美元/百万 tokens(仅为 Claude Opus 4 的 13%)。 - 免费用户直接躺赢:所有人默认可用 GPT-5 基础版,Plus 用户升级不限量,Pro 用户($200/月)可解锁“加强版”无限制调用! - 开发者套餐更狠:nano 版本 0.05 美元/百万 tokens,写个小工具的成本还不如一顿早餐钱!
3️⃣ AGI 的“石器时代”开端 - 用工具思考,而非只会回答问题:GPT-5 能自主决定何时调用网络搜索、代码库或数学工具,像人类一样分解任务、迭代优化。 - 安全与实用性双修:幻觉率大幅降低,医疗/法律场景更可靠;还能诚实承认“我不知道”,拒绝危险请求。 - 长文本处理神器:256k tokens 上下文窗口(约 50 万汉字),读完一本《活着》不在话下!