最近刷圈总看到「AI Agent」,但你真的懂它明年要怎么“变”吗?一张图把2025年AI Agent的核心趋势全扒透了——从“会说话的助手”到“能协作的研究员”,从“自动写代码”到“像人一样操作电脑”,每一个方向都藏着能直接用在工作里的“效率核武器”!
📌 自主检索增强生成 (Agentic RAG)
基于推理的,用于实时数据检索和生成的AI智能体工作流。
Agentic RAG的应用不局限于单一场景,同样也被应用于医疗保健领域。
举例:Perplexity, Harvey AI 和 Glean AI
📌 语音智能体 (Voice Agents)
能够通过自然口语与用户互动的智能代理,利用广泛的文本转语音(TTS)和语音转文本(STTS)的嵌入和检索技术。
举例:ElevenLabs, Cognigy, Vapi 和 Deepgram
📌 AI智能体协议 (AI Agent Protocols)
简化多智能体之间的通信,支持不同框架下构建的智能体之间的交流。
举例:Accenture,A2A, ACP, SLIM等
📌 计算机使用智能体 (CUA - Computer Using Agents)
能像人类一样与计算机交互的AI智能体,可利用浏览器、命令行界面(CLI)甚至鼠标光标等工具。
举例:OpenAI的Operator, Claude的Computer Use, H-Company的Runner H以及Manus AI
📌 编程智能体 (Coding Agents)
借助巧妙的工具使用和基于大语言模型(LLM)的代码生成,使构建和调试应用程序的速度提高10倍的多智能体。
举例:Windsurf, Cursor 和 GitHub Copilot
(图片来自:rakeshgohel01)
📌 深度研究智能体 (DeepResearch Agents)
协作式多智能体系统,可从大量来源构建内容详尽的研究报告。
举例: Gemini DeepResearch, OpenAI DeepResearch 和 You(.)com DeepResearch
by:微博@karminski-牙医