Whisk是由Google推出的一款AI图像生成工具,以其独特的“以图生图”功能,彻底颠覆了传统图像创作的模式,允许用户使用图像作为提示来生成新的图像,而不需要冗长的文本提示,用户可以提供多张图像来指定主题、场景和风格,Whisk能够将这些图像的风格混合在一起,生成具有新风格的照片。
功能特点 1. 以图生图:Whisk的核心功能在于其“以图生图”的能力。用户无需费心构思文字提示,只需通过上传图片,就能让工具自动理解并生成符合预期的图像。 2. 风格混合:Whisk的智能算法能够精准捕捉并混合不同图片的风格特征,无论是抽象的艺术风格,还是具体的场景元素,都能被巧妙地融入新的图像中。 3. 快速迭代:生成的图像并非一成不变,用户可以通过编辑文本提示或上传新的图片,轻松实现图像的迭代修改,进一步优化生成结果。
用4o生成非常可爱的景区游览笔记,详细提示词:
请生成一张图片,模拟在一张略带纹理的纸张(比如米黄色或浅棕色)上手写的关于景区 [请在此处替换为景区名称] 的讲解笔记。图片应呈现旅行日志/拼贴画风格,包含以下元素:
用手写字体(比如蓝色或棕色墨水)书写景区名称、地理位置、最佳游览季节、以及一两句吸引人的标语或简介。
包含几个主要看点或特色的介绍,使用编号列表或项目符号(例如:[列举2-3个具体看点,如“奇特的岩石形态”,“古老的传说”,“独特的植物”等]),并配有简短的手写说明。
用红色笔迹或其他亮色圈出或用箭头指向特别推荐的地点或活动(例如 [列举1-2个推荐项])。
穿插一些与景区特色相关的简单涂鸦式小图画(例如:[根据景区特色想1-2个代表性图画,如山峰轮廓、特色动植物、标志性建筑等])。
点缀几张关于该景区的、看起来像是贴上去的小幅照片(可以是风景照、细节照,风格可以略显复古或像宝丽来照片)。 整体感觉要像一份由热情导游或资深游客精心制作的、生动有趣的个人导览手记。
教程by:微博 @歸藏的AI工具箱
设计师新宠来啦!初创公司 Luma 全新发布 Dream Machine,能从文本/图像直接生成视频。感觉比 Sora 也差不了多少。
Dream Machine 120秒就能给你做出一个120帧的视频!这速度,想改点啥,马上就能再做一个新的,太高效了!而且镜头效果超自然,Dream Machine还超级懂镜头语言!它能模拟出各种电影级的摄像机运动,让你的视频看起来就像大片一样流畅、自然。
大家可以看看下面的演示视频,它还能理解人和物是怎么在现实中互动的,所以做出来的视频里,角色和场景都超级真实,一点都不会觉得假。
最最最主要的是,现在人人都可以免费体验!服务器都快被大家挤爆了,你还在等啥呢?赶紧来试试吧!
体验地址:https://lumalabs.ai/dream-machine
昨晚 OpenAI 发布了 GPT-4o 后,压力就给到了 Google I/O ,现在给我说 OpenAI 不是故意的,我都不信!
这场发布会体现了 Google 在 AI 领域的深厚技术积累和对未来技术趋势的洞察,同时也表明了 Google 将 AI 技术深度融合到其产品生态中的决心。
以下是发布会的一些重点概述:
发布会要点: 1、Google Search AI:发布了 AI Overviews,加强版 AI 搜索概要功能,多步推理能力上架。 2、Gemini 大模型:Gemini 1.5 Flash(100 万上下文);Gemini Pro(200 万上下文)。 3、Gemma 大模型:发布开源多模态大模型 Pali Gemma 和 Gemma2。 4、AI in Google Workspace:用 Gemini 的能力和 Side Panel 的形式,将 Google 系列产品串在一起。 5、Gemini App:手机版的 Gemini 应用程序,即将支持和 AI 视频对话,近几周发布。 6、Project Astra:最新的多模态 AI 项目,包含 Imagen3、 Music AI Sandbox 和 Veo 等针对图像、音乐、视频的生成式 AI。
更多关于2024 谷歌I/O大会 的介绍及点评,大家可以看看这篇文章,总结的非常详细:Google I/O 2024
近日,谷歌的全新人工智能模型 Gemini 1.0 引起了广泛的关注。Gemini 到底是个什么样的模型,为什么说比 GPT-4 强呢?
Gemini 是谷歌推出的一种大型语言模型。它是谷歌迄今为止规模最大、能力最强的人工智能模型,具有原生多模态能力,能够同时处理文本、图像和音频等多种信息。
Gemini 的训练数据集包括1.6万亿个参数,是之前的 GPT-3 的两倍。它能够理解和生成自然语言,并能够从文本、图像和音频中提取信息。
Gemini 还能够进行多种任务,包括: 生成文本、翻译语言、编写不同类型的创意内容等。 理解和回答问题,包括开放式、挑战性的和奇怪的问题。 从文本、图像和音频中提取信息,并进行分析。
卷起来了,前不久阿里云推出了首个“AI程序员”。能够一站式自主完成任务分解、代码编写、测试、问题修复和代码提交等整个过程,能够在分钟级时间内完成应用开发。 近日,字节跳动推出了一款名为豆包 MarsCode 的智能开发工具,面向国内开发者免费开放。
核心功能: 1、提供智能代码补全、Bug修复、单元测试生成等AI功能。 2、支持多种编程语言和主流IDE。
云端集成开发环境(Cloud IDE):豆包MarsCode包含AI原生的云端IDE,无需配置复杂环境,直接在浏览器中进行编程和调试。 支持语言:支持C、C++、C#、Go、JavaScript、Java、Node.js、Rust、TypeScript等多种编程语言。 开发模板:提供多种开发环境和模板,减少环境配置时间。 原生AI能力:具备代码自动补全与生成、问题修复、代码优化等功能。
主要特点: 1、开箱即用,简化环境配置。 2、云端IDE,随时随地开发。 3、弹性云端资源,不受本地资源限制。
主要功能: - 编程助手和Cloud IDE:提供代码编写提议、代码补全、Lint错误修复等。 - 项目问答功能:针对需求开发、Bug修复、开源项目学习等场景提供支持。
更多介绍可以访问豆包 MarsCode官网!