最近刷圈总看到「AI Agent」,但你真的懂它明年要怎么“变”吗?一张图把2025年AI Agent的核心趋势全扒透了——从“会说话的助手”到“能协作的研究员”,从“自动写代码”到“像人一样操作电脑”,每一个方向都藏着能直接用在工作里的“效率核武器”!
📌 自主检索增强生成 (Agentic RAG) 基于推理的,用于实时数据检索和生成的AI智能体工作流。 Agentic RAG的应用不局限于单一场景,同样也被应用于医疗保健领域。 举例:Perplexity, Harvey AI 和 Glean AI
📌 语音智能体 (Voice Agents) 能够通过自然口语与用户互动的智能代理,利用广泛的文本转语音(TTS)和语音转文本(STTS)的嵌入和检索技术。 举例:ElevenLabs, Cognigy, Vapi 和 Deepgram
📌 AI智能体协议 (AI Agent Protocols) 简化多智能体之间的通信,支持不同框架下构建的智能体之间的交流。 举例:Accenture,A2A, ACP, SLIM等
📌 计算机使用智能体 (CUA - Computer Using Agents) 能像人类一样与计算机交互的AI智能体,可利用浏览器、命令行界面(CLI)甚至鼠标光标等工具。 举例:OpenAI的Operator, Claude的Computer Use, H-Company的Runner H以及Manus AI
📌 编程智能体 (Coding Agents) 借助巧妙的工具使用和基于大语言模型(LLM)的代码生成,使构建和调试应用程序的速度提高10倍的多智能体。 举例:Windsurf, Cursor 和 GitHub Copilot (图片来自:rakeshgohel01)
📌 深度研究智能体 (DeepResearch Agents) 协作式多智能体系统,可从大量来源构建内容详尽的研究报告。 举例: Gemini DeepResearch, OpenAI DeepResearch 和 You(.)com DeepResearch
by:微博@karminski-牙医