看到 Niji 发布的预告来演示局部重绘(inpaint)的效果,是 Midjourney 即将发布局部重绘功能,对于MJ的AI绘画最头痛就是生成一张图片,如果只有细节不满意就要重新抽卡生成,这样导致很多不可控的效果出来而且浪费时间,而即将推出的Inpainting(局部重绘)功能就很好解决这个问题。
这个新功能就像 PS 的AI一样,只需要涂抹一个区域,然后加入关键词就能重新绘制或替换这个区域。至少再也不用担心出现 3 只手,6 根手指头的情况了。有没有小伙伴有内部的消息,Midjourney AI 创意局部重绘功能什么时候能上线啊?
近日,谷歌的全新人工智能模型 Gemini 1.0 引起了广泛的关注。Gemini 到底是个什么样的模型,为什么说比 GPT-4 强呢?
Gemini 是谷歌推出的一种大型语言模型。它是谷歌迄今为止规模最大、能力最强的人工智能模型,具有原生多模态能力,能够同时处理文本、图像和音频等多种信息。
Gemini 的训练数据集包括1.6万亿个参数,是之前的 GPT-3 的两倍。它能够理解和生成自然语言,并能够从文本、图像和音频中提取信息。
Gemini 还能够进行多种任务,包括: 生成文本、翻译语言、编写不同类型的创意内容等。 理解和回答问题,包括开放式、挑战性的和奇怪的问题。 从文本、图像和音频中提取信息,并进行分析。
卷起来了,前不久阿里云推出了首个“AI程序员”。能够一站式自主完成任务分解、代码编写、测试、问题修复和代码提交等整个过程,能够在分钟级时间内完成应用开发。 近日,字节跳动推出了一款名为豆包 MarsCode 的智能开发工具,面向国内开发者免费开放。
核心功能: 1、提供智能代码补全、Bug修复、单元测试生成等AI功能。 2、支持多种编程语言和主流IDE。
云端集成开发环境(Cloud IDE):豆包MarsCode包含AI原生的云端IDE,无需配置复杂环境,直接在浏览器中进行编程和调试。 支持语言:支持C、C++、C#、Go、JavaScript、Java、Node.js、Rust、TypeScript等多种编程语言。 开发模板:提供多种开发环境和模板,减少环境配置时间。 原生AI能力:具备代码自动补全与生成、问题修复、代码优化等功能。
主要特点: 1、开箱即用,简化环境配置。 2、云端IDE,随时随地开发。 3、弹性云端资源,不受本地资源限制。
主要功能: - 编程助手和Cloud IDE:提供代码编写提议、代码补全、Lint错误修复等。 - 项目问答功能:针对需求开发、Bug修复、开源项目学习等场景提供支持。
更多介绍可以访问豆包 MarsCode官网!
太震撼了啊,没等到GPT-5,却迎来了 OpenAI 新旗舰模型GPT-4o!
5月14日凌晨,GPT-4o 在 OpenAI 官网正式发布了,GPT-4o是一个多模态模型,能够处理视频、音频和文本数据,具有实时推理的能力。它能够执行多种任务,包括实时翻译、唱歌、做数学题和讲笑话等。GPT-4o的语音响应时间非常短,平均响应时间为320毫秒,并且在MMLU评测中创下了88.7%的新高分,超过了其他市面上的大模型。
这是正儿八经的原生多模态,更重要的是可以实时推理音频、视觉和文本,注意这里是实时,实时,实时,推理的不是文本,是音频!视觉!
某种程度上,AGI 已然成为现实,我们即将迎来一个新的时代啊!
第一步:AI提炼大纲内容 1. 先把相关的文件或文本内容发给AI,让它帮我们提炼出主要内容呀。 2. 记得要求AI以Markdown形式输出哦。这里给大家推荐几个好用的AI工具,DeepSeek、Kimi、ChatGPT、Claude、豆包等等都可以用呢。输出指令可以很简单,只要求输出为Markdown列表格式就行;也可以提更详细的要求,比如主标题设为文章核心主题,二级标题不超过5个关键模块,三级标题展示具体细节等,这样生成的大纲会更符合我们制作思维导图的需求哦
第二步:新建txt文档导出.md 1. 在桌面新建一个文本文档,然后把AI输出的内容复制到这个文档里。 2. 点击文件-另存为,把文件名后缀修改为.md ,这样就得到了我们后续导入思维导图软件所需的文件格式啦。
第三步:生成思维导图 3. 打开Xmind软件,在左上角选择文件-导入-MarkDown。 4. 接着选中上一步保存好的.md后缀文件进行导入。 5. 稍等片刻,思维导图就生成好啦,你可以根据自己的喜好将其导出为图片或者文档格式保存哦。
教程by:阿靖AI笔记