Meta 公司今天宣布了一款新的 AI 视频生成器 Movie Gen,该工具能够生成带有声音的高清视频。 Sora 有的它都有,可创建不同宽高比的高清长视频,支持 1080p、16 秒、每秒 16 帧。 Sora 没有的它还有,能生成配套的背景音乐和音效、根据文本指令编辑视频,以及根据用户上传的图像生成个性化视频。
核心功能介绍: - Movie Gen 能够使用文本输入自动生成带有声音的高清视频。 - 可以编辑现有视频素材或静态图像。 - 视频中的音频也由 AI 生成,与图像匹配环境噪音、音效和背景音乐。 - 可以生成不同宽高比的视频。 - 能够从图像创建自定义视频或更改现有视频中的元素。
WordHero以其80多种写作工具,全面覆盖博客文章、广告文案、电子邮件和社交媒体帖子等各类内容创作需求。
该工具通过先进的AI语言模型,拥有1750亿机器学习参数,能够在短时间内自动生成原创、类人内容,极大地节省了研究和写作的时间,同时降低了雇佣专业文案的成本。
WordHero的三大动态生成模式——生成器模式、编辑器模式和WordHero聊天,为用户提供了多样化的内容创作解决方案。特别是WordHero Art功能,允许用户通过单一命令创建高质量的AI图像,为社交媒体帖子和博客文章增添吸引力。
用户评价显示,WordHero不仅提高了内容创作的效率,还提升了内容质量。一位用户表示:“我使用WordHero写过超过2000字的文章,只需轻微编辑,比我自己动手写得还要好。它每次都能为我节省数小时的时间,并创造出更优质的内容。”
Devin是首个AI程序员,它能够通过借用其创造者的账号与客户公司的CTO进行交流,并根据回复调整代码方案。
事情发生在办公软件Slack,截图中的akshat是AI基础设施创业公司Modal Labs的CTO Akshat Bubna。
Devin的开发商是Cognition,而Modal Labs是它的首批客户之一。在一次交流中,Devin询问了关于密钥生命周期的问题,特别是密钥更新后传播到正在运行的应用程序所需的时间。尽管Devin已经查阅了大量文档,但仍然没有找到关于密钥传播时间的明确信息。通过与Modal Labs的CTO交流,Devin了解到更新的密钥不会使已经运行的容器失效,但新启动的容器将会读取更新后的值。
Devin能够自主把任务拆解成一系列子步骤,并一步步执行,甚至在遇到障碍时能够查阅文档并修改后续计划。
大家觉得这波修复BUG属于什么水平,优秀的程序员也不过如此了吧?感兴趣的小伙伴可以看看详细的过程→ 原文链接
首先有一个误区,很多人觉得开源就是免费,开源就是没有版权。其实这是完全错误的理解! 开源≠免费。开源≠没有版权。开源≠随意商用。开源≠完全透明。
对开源模型的理解,目前大致有四个 Level,开放程度依次增加: 1. 封闭式“开源”(以 OpenAI 为代表) - 核心理念:早期以开源和非营利为目标,逐渐转向封闭模式,通过 API 提供服务,不公开模型权重和训练细节。 - 特点:模型权重和训练数据不公开,仅提供黑箱化的 API,通过订阅服务和 API 收费实现盈利,有助于控制模型滥用风险。 - 争议:违背了开源的核心精神,被批评为技术垄断。
2. 自定义开源(以 Meta 为代表) - 核心理念:开源模型(如 LLaMA),但采用自定义许可证(如 LLaMA 社区许可协议),强调研究和非商业用途,限制商业使用。 - 特点:公开模型权重,但限制商业使用和分发,主要面向学术机构和非营利组织,用户需申请访问权限。 - 争议:自定义许可证限制了模型的广泛使用,不符合完全开源的定义。
3. 传统开源(以 DeepSeek 为代表) - 核心理念:采用传统开源许可证(如 Apache 2.0),完全开放模型权重和代码,强调自由使用、修改和分发,包括商业用途。 - 特点:模型权重、代码和部分训练数据公开,允许商业使用,无歧视性限制,鼓励社区协作和创新。 - 优势:符合传统开源定义,推动技术普及和创新。
4. 理想开源(以 OSI 为代表) - 核心理念:OSI 正在制定 OSAID 1.0(Open Source AI Definition),旨在为开源 AI 系统提供明确标准,强调透明度、可访问性和可修改性。 - 特点:要求公开模型权重,允许用户自由使用,尽可能公开训练数据的来源和组成,训练和推理代码必须开源,不得限制特定用户群体或用途。 - 目标:确保开源 AI 系统符合开源精神,推动技术民主化。
近日 DeepSeek R2 的最新参数引发了行业内外的广泛关注,以下是爆料的关键信息:
📌 参数规模:1.2万亿参数,780亿活跃参数,采用混合专家模型(MoE)架构。 📌 成本优势:与GPT-4相比,成本大幅降低,输入每百万次仅需0.07美元,输出每百万次仅需0.27美元,成本降低97.3%。 📌 训练数据:使用了5.2PB的训练数据,在C-Eval 2.0测试中达到了89.7%的准确率。 📌 视觉性能:在COCO(Common Objects in Context)图像识别测试中,准确率高达92.4%,视觉性能显著提升。 📌 硬件适配:在华为昇腾910B芯片上的利用率高达82%,显示出良好的硬件适配性。
此次泄露的信息显示,DeepSeek R2正逐步摆脱对美国供应链的依赖,这一转变可能对全球AI产业格局产生深远影响。有业内人士指出,部分爆料内容存在逻辑矛盾,甚至存在外网推文引用中文非正规渠道消息的情况。关于DeepSeek R2的发布时间及网传参数真实性,仍需谨慎看待。
如果DeepSeekR2真的发布了,对此你有什么期待?
还在手敲重复代码?试试用自然语言“画”出程序!
输入“我要一个渐变登录页,带3D按钮”👉 AI自动生成React组件;上传Figma设计稿👉 10秒导出可运行的前端代码!
DoorDash团队用它省下50%开发时间,你的下一个项目,也该让AI当“最强辅助”了!
✨ 让优设粉丝尖叫的三大神技: 1️⃣ 「说人话」编程:用“修复循环报错”“加个缓存机制”代替复杂语法,GPT-4秒级响应 2️⃣ 设计稿→代码:支持Figma/Sketch导入,自动生成HTML+CSS+JS 3️⃣ 多文件智能避坑:AI实时检测跨文件冲突,比人类快10倍定位隐形BUG
🔥 设计师狂喜时刻: ✅ 上传界面图自动标注尺寸/色值 ✅ 用“把图标调大20%”直接修改代码 ✅ 生成带交互逻辑的动效代码,Lottie一键导出
点击体验👉 https://www.cursor.com/ja