Google 宣布,从本周四开始,用户可以通过 Google 的"搜索生成体验"(Search Generative Experience,简称 SGE)直接根据文本提示创建图片。
微软早在今年3月就开始利用 OpenAI 的 DALL-E 模型提供了通过必应聊天工具创建图片的功能,因此Google 效仿也不足为奇。
如果你通过Google的搜索实验室计划加入了 SGE现在,就可以在Google搜索栏中输入你的查询。输入后,SGE 会根据你的提示创建一些图片供你选择。Google发言人克雷格-尤尔(Craig Ewer)表示,该工具由 Imagen 系列人工智能模型提供支持。
你也可以通过Google图片制作Google人工智能生成的图片。在浏览Google图片结果时,你可能会看到一个提示框,提示你根据查询结果生成图片--这些生成的图片将显示在侧边栏中。
想象一下,你刚刚在脑海中构思出一个绝妙的网页设计创意,而 Onlook 能让你在几分钟内就将它变成一个可运行的网页。这不是魔法,而是 Onlook 的强大功能。它提供了一个直观的拖拽界面,你可以像拼图一样将各种元素(如按钮、文本框、图片等)组合在一起,实时看到设计效果。而当你调整元素的大小、位置或样式时,Onlook 会立刻将这些操作转化为高质量的代码,让你的设计瞬间“活”起来。
三大核心亮点,爽到停不下来 1. “说话就能建站”的AI助手 输入一句需求(比如*“设计一个咖啡店库存管理系统”*),AI自动生成完整页面框架。 实时聊天修改:像和同事沟通一样,对AI说*“把按钮改成红色,表格加筛选功能”*,立刻生效!
2. 设计师的真·可视化开发 拖拽不输Figma:调整布局、字体、颜色,所有操作直接映射为代码。 组件库自由定制:做好一个按钮,全站同步更新,告别重复劳动。
3. 代码党的效率外挂 支持React/Next.js/Tailwind,生成的代码干净可扩展,无缝对接你的代码库。 从Figma/GitHub一键导入,已有资源不浪费。
工具地址:https://www.onlook.com/
昨天,谷歌在官网宣布从5月15日起,将向所有谷歌相册用户免费提供Magic Editor、Photo Unblur和Magic Eraser三款生成式AI编辑工具。
通过这三款强大的AI图像编辑工具,用户可以轻松将模糊的图片变高清,实现一键PS/调色/光影,删除图片多余内容等。而在此之前,这三个是谷歌Pixel手机独有功能。
功能介绍: 1. Magic Editor:这是一款强大的AI图像编辑工具,它可以帮助用户轻松实现一键PS/调色/光影,改变图片中的物体位置等。这项功能最初在2023年10月4日随Pixel 8系列手机发布。Magic Editor的优势在于它的细节调整和融合度比传统的PS工具更强,而且操作简单,无需深度的专业知识。不过,需要注意的是,所有谷歌相册用户每月只能使用10次Magic Editor,如果想要更多使用次数,用户需要购买Pixel 8手机或开通Google One计划(2TB及以上)。 2. Photo Unblur:这是一款专用于去除图片模糊的工具。用户在拍摄图片时可能会因为手抖、环境等因素导致图片模糊,Photo Unblur能够一键还原图片的清晰度,让模糊的图片变高清。 3. Magic Eraser:这是一款图片擦除工具,可以帮助用户去除照片中不希望出现的元素,如行人或物体。对于不熟悉PS技术的用户来说,Magic Eraser提供了一种简单快捷的解决方案,一键完美去除图片中的障碍物。
哪款你最期待呢?评论区说出你的想法吧~
不知道大家最近有没有关注OpenAI举办的首届开发者大会呢?有哪些亮点值得关注呢?
昨晚的开发者大会让AI界再次沸腾不已,OpenAI推出了备受瞩目的GPT-4 Turbo版本,这对整个行业来说是一个重要的里程碑。
OpenAI还推出了GPTs,这使得那些不懂代码的人也能够用自然语言来创建自己的GPT模型,并将其加入OpenAI的应用商店,与此同时还能够分享收益。
这种创新可以说是OpenAI的突破之举,相当于他们的iPhone时刻,而即将发布的GPT Store则类似于APP store。
虽然其他竞争对手还在探索AI的奥秘,但OpenAI已经开始构建一个宏大而有前景的生态系统。
我们正在见证一个行业的浪潮涌动,也可能正在见证一个巨头的崛起。
哈哈哈,这不是好起来来了吗!!
百度公司最近推出了一款名为"文小言"的AI数字人社交APP。是基于文心大模型技术,可以通过手写、语音和图片等多种方式与数字人交流,享受其以语音、文字和肢体语言相结合的生动回复。最核心的是能够与AI角色建立情感连接,享受不间断的聊天体验。
文小言的主要功能 1、有问必答:AI伙伴随时在线,可以聊关于生活、感情、游戏、工作、历史、新闻等话题。 2、海量角色:文小言提供多种角色选择,包括傲娇女友、温柔空姐、健身教练、舞蹈老师等,满足不同用户的喜好。 3、沉浸互动:文小言支持全屏沉浸式聊天,包括语音、文字、图片和视频通讯。 4、实用专家:文小言提供专业行家的答疑解惑,涵盖画画创作、生活妙招、旅行攻略、新闻时事、同城资讯等领域。 5、免费聊天:用户可以不受时间限制地享受免费聊天服务。
Techcrunch整理了一份AI行业最常见到的技术词语词典,搞懂这些,或许能帮初学者们轻松迈入AI世界的大门。
- AGI 通用人工智能 通用人工智能(AGI)是一个有些模糊的概念,通常指在多数任务上比普通人更强大的AI。OpenAI将其定义为“在最具经济价值的工作上超越人类的高度自主系统”。谷歌DeepMind则认为AGI是“在大多数认知任务上至少与人类能力相当的AI”。
- Chain of Thought 思维链 思维链推理意味着让AI像人一样一步步思考,把一个大问题拆解成多个小步骤。虽然慢一点,但在逻辑推理或编程这种需要严谨思考的场景里,答案会更准确。现在的大语言模型经过优化,在处理复杂问题时,就是靠这种“思维链”来提高准确性。
- Deep learning 深度学习 AI能自我优化学习的关键技术。它模仿人脑神经元连接方式,搭建多层人工神经网络,使AI算法能够建立比简单机器学习系统更复杂的关联关系。 深度学习模型能自己识别数据里的重要特征,而无需人类预先定义,还能从错误中学习,不断改进。
- Diffusion 扩散模型 扩散技术是众多艺术、音乐和文本生成AI模型的核心。受物理学启发,先“故意”一步步往数据里加噪声,直到数据面目全非。然后,AI学习如何“逆向扩散”,把这些被破坏的数据还原回来,从而获得从噪声中“创造”出全新数据的能力。
- Distillation 知识蒸馏 一种“师父带徒弟”的学习方法。让一个大型(“老师”)AI模型处理问题,然后把它的答案用来训练一个更小、更高效的(“学生”)模型,让学生模型学会老师的行为。这样就能用更小的模型,实现接近大型模型的性能。
- Fine-tuning 微调 微调是指对已训练的AI模型进行进一步训练,通过输入新的专业化数据,优化其在特定任务或领域的性能表现,使其超越原始训练的重点范围。很多AI公司都在用这个技术,把大型语言模型“微调”成适合自己行业的产品,提升实用性。
- GAN 生成对抗网络 让AI能“以假乱真”的关键技术。它由两个互相竞争的神经网络组成:生成器负责创造数据,判别器负责鉴别真伪。就像一场“猫捉老鼠”的游戏,两者不断对抗,让AI能自动生成极其逼真的数据,无需人工干预。GAN适合用于生成图片或视频。
- Hallucination 幻觉 “幻觉”是AI行业对模型虚构内容的专业术语,特指AI生成错误信息的行为。这显然是影响AI质量的核心问题。
- Neural Network 神经网络 神经网络是指支撑深度学习的多层算法结构,是推动生成式AI工具全面爆发的技术基础。尽管这个概念由来已久,GPU的崛起也让这个概念迎来了爆发。GPU被证明非常适合训练具有更多层次的算法,使得基于神经网络的AI系统在语音识别、自动驾驶导航和药物研发等多个领域实现了远超以往的性能表现。
- Transfer Learning 迁移学习 把一个已经训练好的AI模型拿来当起点,开发一个针对不同但相关的任务的新模型。这样可以节省大量开发时间,尤其是在新任务数据量不多的时候非常有用。但要注意,模型可能还需要在新领域的数据上进行额外训练才能表现最佳。
- Weights 权重 权重是AI训练的核心要素,它决定了在训练系统所用数据中,不同特征(或输入变量)的重要程度,直接影响AI模型的最终输出。训练开始时权重是随机的,但随着学习的深入,它们会不断调整,让AI的预测越来越准。
这份词典由Techcrunch定期维护,有需要的朋友可以收藏:https://techcrunch.com/2025/05/25/from-llms-to-hallucinations-heres-a-simple-guide-to-common-ai-terms/
ps:转自量子位
上半年 Sora 爆火到现在,AI 在视频领域的发展越来越强了,近日,Runway 的 Gen-3 Alpha 文字转视频功能向所有人开放了。
Runway Gen-3 Alpha 的文字转视频功能是其核心功能之一。用户只需输入文字描述或关键词,Gen-3 Alpha 就能够通过其强大的深度学习算法,自动生成与之相关的视频作品。这一功能不仅支持简单的文本到视频转换,还提供了多种高级创作工具,如运动画笔、相机控制和导演模式等,进一步提升了视频制作的专业度和灵活性。
Runway Gen-3 Alpha 在保真度、一致性和运动表现上均实现了显著的突破,能够生成高保真的视频片段,最长可达10秒。用户可以选择生成5秒或10秒的视频,并且可以根据需要调整视频的详细程度和风格。
Runway Gen-3 Alpha 的文字转视频功能不仅强大且灵活,能够满足各种创意需求,还在技术上取得了显著的进步,成为AI视频生成领域的一大亮点。
但是目前想体验还是需要开通12美元的会员~