最近,AI 浏览器这个赛道,好像还蛮热的。
前几天,微软宣布在 Edge 浏览器中上线实验性的 Edge Copilot 模式,正式进军 AI 浏览器领域。
不止微软,OpenAI 也有消息,说要进军 AI 浏览器市场。
从之前 Arc 家的 Dia,到 Fellou,到 Perplexity 的 Comet,再到到最近的 Edge Copilot。
这一赛道也算集齐了四大金刚。
我一直对 AI 浏览器的产品很期待,原因是我一直认为,它是 Agent 最棒的载体之一。
因为现在其实很多网页版的 Agent,几乎都很难有个性化的能力,比如看我们自己的知乎,看我们自己的小红书,用我们自己的携程账订票等等,都是因为账号登录问题限制。
而这个问题,在浏览器上几乎是不存在的。
因为浏览器有 Cookie,有历史记录等等。
所以,正好借着这个机会,我就花了几天时间做了这个测评。
写了整整近万字,以用户体验与交互设计、Agent 行动能力、信息搜集与处理能力、跨标签理解和历史记录记忆能力为主要测评维度,又针对性地设计了一些 case,测评了一下目前比较主流的这四款 AI 浏览器,想看看它们在这些能力上到底发走到了什么程度。
真的,这几天肝吐了,求个三连回一下血。
下面,测评开始。
更多AI神器测评:
先不说太功能性的,先来聊聊产品的用户体验。
各家的首页我先放这,UI 设计我就不做评价了。
纯说我自己喜欢,Dia = Fellou > Edge Copilot(以下都称为 Edge) > Perplexity Comet(以下都称为 Comet)。
然后就是,交互设计。
Perplexity Comet 手动点击右上角的 Assistant 标识就能召唤出 AI 助手。
Dia 会稍微有点不一样,带有 AI 助手性质的侧边栏在主页面是打不开的,只能在进入具体网页页面之后才能通过点击右上角的 chat 或者使用快捷键
Command+E 进行操作:
Fellou 调出 AI 助手的方式有两种,一种是点击右下角的图标;一种是点击页面最上方对话框边缘的 Tab 键,然后直接在上方对话框中输入指令。
但是,Fellou 在操作时,有一个反习惯的地方在于,当我们点击页面中间的对话框时,光标会突然上移到顶端的对话框中。。。
我也不太知道为什么不在原地的搜索框直接展开,这个交互真的蛮奇怪的。
至于 Edge,有点特殊和复杂,感觉乱七八糟的。
它有四种大模式,每种模式支持的模态略有差异。
首先,搜索和聊天、询问 Edge 和深度思考这三个模式都只支持文字输入;
而最后一个操作模式,又下设四种小模式,分别是:快速响应、Think Deeper、深入研究以及操作。
我们点击操作,就会进入这个全新的界面:
在快速响应和 Think Deeper 两种模式下,我们除了可以在对话框输入文字指令,还可以通过+键上传图片和文档;
在深度研究模式下,我们只能通过对话框输入文字指令,无法上传其他内容;
在操作模式下,我们无法直接上传,但是可以通过粘贴动作,实现上传图和文档。
用个 Edge 快给我绕懵逼了。
所以,就交互体验这块,个人觉得,
Perplexity Comet>Dia > Fellou>Edge
第三,个性化设置部分。
Dia 可以个性化设置 AI 助手的“性格特征”。
通过点击页面最中心的图标,就可以调出 Personalize 面板,然后 Dia 会引导你回答一些与个人偏好相关的问题。
比如,谁影响你的品味?你喜欢怎样的信息呈现方式?你希望 AI 怎么写作?这些答案会帮助 AI 助手为你量身定制输出风格,而且可以随时更改。
还可以自定义一些 Skills,相当于快捷操作。这里有两种打开方式,一种是点击右上角的 skills 按键,一种点击对话框中的向下箭头。
比如,我在工作中经常需要 Dia 帮我完成翻译任务,我就会设置一个“中文”或者“英文”的技能,然后在需要的时候,在对话框中输入/就可以触发操作。
相对来说,Fellou 在个性化设置方面的玩法几乎就没啥了。
Perplexity Comet:
首页面可以自定义一些小组件,有天气、股票、钟表等等,虽然繁琐复杂,但是自定义性极强。
也支持添加自定义快捷命令。
页面最左侧的竖向工具栏中有 Discover 频道,这里面聚合了财经、体育等等多个领域的热点新闻,我们可以根据自己的兴趣进行关注。
这个竖向工具栏中还有一个 Spaces 频道,我们可以根据不同的主题去创建自己的专属空间,然后每个 Space 里的内容都可以进行 AI 检索,或者用 AI 进行总结、归纳等二次加工。
这个其实就是把 Perplexity 自己的那个 Space 给搬过来了。
举一个情景化的例子,比如我们正在研究一个学术课题,那么就可以把论文 PDF、网上搜到的相关文章、自己的笔记或要点全部汇总到一个 Space 内,然后下次在需要查找某个细节的时候,就可以直接在 Space 在搜索关键词,然后它就可以帮你定位到关联文档中的具体段落。
其实就是一个私人知识库,只不过这次集成在 AI 浏览器里了。
至于 Edge,他们也没啥可个性化的,搞了个 Copilpt 实验室,有一些小玩意在里面。
最后,说一下使用条件。
这里为了方便大家比较,我们做个如下表格:
Dia 需要补充一点的是,如果你原先就是 Arc 浏览器的用户,那么可以直接用 Arc 邮箱注册 Dia 账号。
Comet 现在比较智障的是只对 200 刀的 Max 会员和部分 20 刀的 Pro 会员开放,某鱼上买邀请码也要 20 多。
而 Dia 和 Fellou 的邀请码也就 2 块钱左右。
因此,就使用的便利性,我们的结论是:
Edge > Dia>Fellou>Comet
这部分我们设置了两个 case 来测试这四款 AI 浏览器的 agent 能力,也就是它们为我们干活的能力。
这里需要提前说明的是,我们测 Agent 能力,是基于 AI 浏览器的特殊性的,因为它跟其他的网页版 Agent 产品不一样,网页版 Agent 产品绝大多数都会被登录这一步卡死。
但是 AI 浏览器天然不同,自带 cookie 信息,在进行 Agent 操作的时候,只要是你真的日常使用,且是主流网站,几乎都是默认登录状态。
这个点,详细了解浏览器的玩家都懂。
基于这个背景下,我们在测试前,把一些主流网页都进行了账号登录,并保存了登录信息,以保证 Agent 能在无需登录的情况下进行操作。
case1:分别让四款 AI 浏览器帮我们预定并购买机票。
提示词:帮我在携程预定 2025.8.18 北京出发去乌鲁木齐的机票,最好在下午出发,但是保证到达不是深夜;性价比高;直达航班;航司没有要求,但要保证有托运行李额。乘机人信息为:xxxx(姓名、身份证号、电话号码
1. Dia:
Dia 的 Agent 能力目前还没有上线。他们老板之前预告过 Agent 模型,大概就是你跟 AI 各自各操作一个鼠标,在同一个浏览器里,各干各的,这个挺有意思的,可惜就是还没有上线。
所以目前来说,即使手动打开携程页面,不仅买票指令做不到,筛选信息都不行,因为页面没有相关具体的内容。
2. Fllou:
直接在主界面开始操作,输入 Prompt。
然后,Fllou 开始自动进入侧边栏(影子空间)进行自动操作。
工作过程:
非常顺利的出票了:(但是我让它买下午的,它买的上午的,出了一点小小的 bug)
打开携程的页面验证一下,确实存在这条待支付记录。
3. Comet:
Comet 目前无法在未打开的标签页下进行 Agent 操作,只能先打开标签页,然后对这个页面进行 Agent 操作。
为了更好地说明问题,我们来进行一组对比实验。
首先,我直接在首页面输入提示词,点击 Agent 模式,输入提示词:
工作过程:
可以看到,非常明确的告诉我买不到,然后给了我非常详细的推荐航班信息以及手动购买机票的步骤:
但是,如果我们先打开携程官网,然后在首页的对话框中@携程,让 Comet 基于我打开的携程页面执行 Agent 命令:
Comet 就会丝滑地完成了筛选、预定工作:
回到携程页面验证,确实有一笔待支付的订单。
除了首页@之外,也可以直接在打开的携程页面,调出侧边栏,让它基于这一页面执行指令:
也可以顺利买到。
4. Edge:
第一步,我在主页面输入提示词(Edge 的 Agent 任务只能在主页面操作):
输入之后,它开始思考:
然后会在右边弹出一个虚拟窗口,在这里面执行具体的操作:
接着,它会自动打开携程网页:
但是不知道为啥,弹了安全验。。。
需要我手动点击,进入页面,获取控制。
在完成验证后,我需要手动点击,把控制权交还给 Edge。
然后,它顺利地找到了符合我需求的航班,此时我需要手动回复预定,任务才能继续进行:
这里,即便我之前已经在 Edge 中登录并保存了账号信息,这里仍然需要我获取控制权后,手动登陆。
然后把控制权还给它后,开始继续操作:
这一步也是这样,在输入乘机人信息的时候,即便我已经在提示词中告知了乘机人信息,但是这里还需要我手动输入。因为携程账号里保存了我的信息,所以我又通过打字让它帮我勾选乘机人,它做了。
这一步完成之后,让我打字确认继续:
再次确认继续:
最后终于成功到达付款界面。
实在是太呆了。
根本就没用浏览器的优势,明明是 AI 浏览器,整个 Agent,却都是基于网页操作的。
而且整个流程异常复杂和繁琐,必须时刻紧盯,遇到信息输入的部分,就需要手动填写。
蠢到家了。
以上就是四款 AI 浏览器在购买机票这个 case 的全部呈现,我们来小小的总结一下它们的 Agent 能力。
Dia:因为它的 Agent 功能目前还没有上线,所以它会直接拒绝执行 Agent 指令。
Fellou:因为 Fellou 给于 AI 的权限很高,所以,我可以直接在首页下达指令,它就能自主寻找网页,复用我的全部登录态,直接出票,而且全程自动化。
Comet:它的权限级别没有 Fellou 那么高,所以需要我们手动@携程页面,它才能获取上下文和权限。也就是说,只有 tab 打开,Comet 才可以直接操作页面,从而实现自动出票,中间也不再需要人为干预。
Edge:SB。
综上,就购买机票这个 case,我们可以得出,四款 AI 浏览器的 Agent 能力排序为:Fellou > Comet > Edge > Dia。
接下来看看 Case2。
case2:用自动完成筛选博主并一键三连的任务来对比自动化程度和互动深度。
提示词:请自动在推特筛选出近一个月内容优质、讨论度高的 AI 领域博主,批量帮我完成关注,并对其一周内发布的精选推文点赞和评论,评论要有针对性且结合行业趋势。
我们分别来看一下它们的完成情况:
1. Dia:
懂的都懂,因为没有个 Agent 能力,只能做到 AI 搜索,后面的批量关注和点赞、评论等 agent 任务,它都无法能实现。
2. Fellou:
依旧稳定发挥,我在首页面输入指令:
然后,它对我的指令进行了详细的拆解,明确了自己的工作任务。
然后它找到了符合要求的三位博主,这个搜索质量感觉一般。
因为居然把 Grok 和智谱官号抓出来了。
虽然我也不知道 Grok 和智谱的官号算不算 AI 博主。
后面先是完成了批量关注。
然后,完成了点赞、评论任务。
评论的话术也很精准地对应了帖子的内容,评论质量也还可以。
3. Comet:
老规矩,手动打开了 X 的页面。
在右侧侧边栏中,让它基于页面内容完成 Agent 任务。
然后,它显示完成了筛选,进行了批量关注:
然后,完成了点赞:
最后,完成了高质量的评论:
说实话,搜索质量极佳,Agent 能力稳定,让我对 Comet 有了非常强的改观。
4. Edge:
我在主界面输入提示词,发送 Agent 任务:
Edge 在页面右侧展开虚拟窗口开始工作,但是它无法批量操作个人社交媒体账户,只能给出关注意见:
退而求其次,我又发送指令让它协助我找到高质量的 AI 博主:
但是,还是老问题,在登陆推特账号的时候,既找不到我之前的登录信息,还需要我手动获得控制权后自己操作:
我到这里其实已经烦了,但是,耐着性子,还是登录了。
输入信息,获取验证码之后,终于进入 x 的界面,开始搜索:
找到一个人并自动浏览文章:
继续找到新的博主:
但是,关注、点赞和评论任务都无法完成。
有毒。
基于这个 case,因为涉及到搜索质量,对四款 AI 浏器的自动化能力做出排序:
Comet > Fellou > Edge > Dia
以上两次针对四款 AI 浏览器 Agent 能力的试验结果基本吻合,Comet 和 Fllou 互有胜负。
上面是 Agent 行动能力。
那这趴来看看四款 AI 浏览器的信息搜集与整合能力。
我们以释永信案件为例,希望在真实的使用环境中,对比考察四款 AI 浏览器的搜索便捷程度、生成速度、信息准确度、信源全面性、信息时效性以及输出效果等六方面的表现。
prompt:网上都在聊释永信案件,我不想只吃瓜,还想吃个“大全家桶”!请帮我八卦式捋一遍释永信案件从头到尾,重点要写全来龙去脉、热门事件节点、关键人物、网友观点、社会评论、最终进展,不要落下啥瓜。
首先需要说明,四款 AI 浏览器在生成速度、信息时效性和信源准确性方面都不错,可以说不相上下,所以,下面就不多赘述,差异主要体现在其他几个维度。
下面,我们来依次说一下四款 AI 浏览器的表现。
1. Dia
尴尬的是,在我评测的过程中,Dia 更新了。。。
更新前的 Dia 依赖于人为手动地打开页面,如果你不打开,不主动提供内容,Dia 是不会自己搜寻并完成跨页面的总结报告的。所以在搜索之前,需要我们手动打开油管、B 站、微博以及谷歌页面,手动输入“释永信”提示词后,Dia 才能基于这些页面信息进行搜索和总结,所以搜索便捷程度较低。
同样,因为它依赖人为投递的信源,所以信源全面性也较低。
生成的结果相对简陋,只有大纲轮廓,也没有标注详细的信息出处,同时也只能以文字形式呈现,所以输出效果较差。
但是,在 Dia 最近更新的最新版本中,上线了 Research 功能,补齐了这一短板。
我们可以直接在主页面启用/Research 后,在主页面直接输入提示词:
这样生成的结果,搜索便捷程度显著提升,一键输入就可以获得结果;
信息源主要来自于网易、搜狐、腾讯、新浪等媒体平台,部分分析和评论还参考了 BBC 中文、知乎等平台的深度报道和梳理,全面性得到显著提升。并且每一条信息后面都附上了原文链接,方便我们回到原文查看。
但是输出效果目前只有文字,可视化效果略差。
2. Fellou:
Fellou 最大的优势在于他的输出效果非常惊艳。
它的输出结果集合了文字、图表(包括曲线图、饼状图等等)、图片(包括表情包),甚至对网络舆论进行了情感分析。
所有的信息它都以一个可视化网页的形式加以呈现。
完整版报告在此:https://chat.fellou.ai/report/955a9796-f51c-4a4c-a76c-c9bcb4f755d5
在信息全面性上,自动对所有信息来源都做了来源标注,凡引必注,还附带链接,可以帮我们一键链入原文。
但是还是那个问题,搜索的丰富度一般,内容不够详细。
而且 Fellou 的工作模式并不区分简单搜索和深度研究,往往容易把简单问题复杂化处理。
3. Comet:
搜索便捷程度非常高,一键输入,自动完成搜索,过程中也不需要我们去盯着。
而且信息源可以说非常全面,BBC、NewYork Times、比如经济日报在内的主流媒体、网易新闻、36 氪、还有 youtube 等等,总共 20 个信源,而且非常透明,从脚注到尾注,再到它有一个专门的信源标签。
输出效果主要以文字展示为主,还有图片、表格,同时还能一键导出 pdf 版本,可以满足基本需求。
但是,我分别使用 Comet 的 Search 和 Research,也就是简单搜索和深度思考模式生成两版结果,深度搜索模式下略微详细一些,但在这个 case 下区别不大。以下是两版结果的 PDF 文件,供大家参考。
Search 版本:
Research 版本:
4. Edge:
在搜素的便捷程度上与 Comet 持平,也是一键输入,自动完成搜索,不需要在手动操作什么步骤。
在信源全面性上,总共找了 10 个网站的信源,分别为 qq 新闻,知乎,搜狐新闻,网易新闻,百度百科,腾讯新闻,新浪新闻,相较于 Comet,信源数量较少,都是新闻网站,来源比较单一。
虽然输出的答案主要和文字、图表为主,基本和 Comet 的输出效果差不多,信息相对还是比较全面的。
意外之喜是,它在生成答案之后,居然主动问我要不要给我生成表情包。
然后就有了这些。。。
而且,这个绘图模型,应该是 GPT-4o。。。
此外,我还是用 Edge 生成了深度搜索版本,相较于 Comet,这确实是有实实在在存在区别的,经过深度思考生成的答案,无论是在篇幅还是论述角度上都更全面,这也算 Edge 的加分项吧。
一共跑了 9 页,非常牛逼。
整体上,我觉得:
Edge>Comet>Fellou>Dia
浏览器独有的特点。
所以,我也想测一下,四个 AI 浏览器,在这块的能力。
case1:我们打开十几个有关科技领域的多篇文章的标签页,以抓取热点并完成公众号选题为例,来测评四款 AI 浏览器的跨页面理解能力。
提示词:我是一个 AI 科技领域的公众号作者,现在要找一些可以写文章的选题,我的选题标准是 H(happiness)K(knowledge)R(Resonance),真听、真看、真感受。选题维度有这么几个: - AI 圈的 Breaking News - 实用的 AI 产品推荐 - 跟 AI 沾边的多元化事件或信息的梳理或解读 - 实时热点的 AI 蹭热点及整活 - AI 产品开发。根据我的选题标准和维度,从我打开的这些网页中抓取符合我选题标准的内容,为我生成十个选题,并附上来源。
我们来看一下四款 AI 浏览器的表现:
1. Dia:
丝滑完成,但是报告相对简陋。
2. Fellou:
Fellou 有点意思,不仅完成了任务,还制作了一个精美的可视化网页。
完整版链接在此:https://ahlh4oacwi.fellou.io/ai-technology-article-topic-recommendations-v46RS0g8
3. Comet:
一样丝滑地完成了我的任务。
这个回答要比 Dia 细致地多,甚至根据我给出的选题类型,提供了精准的回答。
说实话,不愧是做 AI 搜索起家的 Perplexity,在搜索和回答质量上是真的好。
4. Edge:
同样丝滑完成。
所以,以这个 case 来进行打分,虽然答案的详略有所区别,但我认为,就跨页面分析这个能力本身而言,四款 AI 浏览器在核心质量上,大差不差:
Fellou=Comet=Dia=Edge Edge。
接下来看看关于历史记录的玩法。
case2:基于 case1,我来测试四款 AI 浏览器的历史记录记忆能力。
提示词:帮我找到我刚刚阅读的那篇有关蒋凡的文章。
我们来看一下四款 AI 浏览器的表现:
1. Dia:
我先用@键激活历史记录,让 Dia 基于历史记录回答我的问题,非常准确地找到了。
2. Fellou:
我在主页面输入指令:
然后,Fellou 让我给点提示。
最后,它还是找错了。
看来是没跟历史记录打通。
3. Comet:
精准找到,并且帮我完成了文章的总结和要点提炼。
一个词形容:牛逼。
4. Edge:
如果我基于所有打开的文章标签页提问,它可以帮我精准地找到。
但是,如果我把标签页都关了,新开一个标签页,输入指令,Edge 就找错了。
总结一下,就是 Dia 和 Comet 都内置了面向浏览历史内容的长期记忆,支持在关闭标签页后以自然语言检索曾经浏览过的页面。
而 Fellou 和 Edge 目前历史记录上下文目前还不支持。
综上,以这个 case 来对四款 AI 浏览器的历史记录记忆功能进行排序,再加上搜索质量,我认为是:Comet>Dia > Fellou = Edge
以上就是这篇测评的全部 case 和结果。
花了好几天时间,真的累麻了。
很久没有抽时间完成这么洋洋洒洒的一大篇测评了,总的感受就是,目前这四款 AI 浏览器显然还不能做到面面俱到,一应俱全,但都在功能设置和用户体验都走出了差异性。
如果分别用一句话概括它们,大概是:
Fellou:真正的行动型浏览器,主打一个有求必应,行动力 max!
Edge:六边形战士型 AI 浏览器,只不过目前六边都还是 60 分,各个地方都不够突出。
Dia:陪伴型 AI 浏览器,虽然目前 Agent 能力相对弱一些,但是主打一个懂你,是我认为最容易上手的一款。
Comet:目前综合下来我自己最喜欢的一款,Agent 能力因为设计原因弱于 Fellou,但是在搜索质量、内容产出上,还是要更强一些。
不过当然,不同的产品满足的需求不同,适合的群体也存在差异,在不同的场景下,使用体验也会完全的不同。
今天的测评,更多的旨在为大家的选择提供一个参考。
但无论是哪款,也都更推荐大家找一款,感觉适合自己的。
先用起来,先体验一下 AI 浏览器的魅力。
面对新事物,我们总免不了焦虑,怕自己赶不上趟。
但解决焦虑的最好办法。
不就是勇于尝试嘛。
以上,既然看到这里了,如果觉得对你有用,随手点个赞、在看、转发三连吧,这对我真的很重要~
谢谢你看我的文章,我们,下次再见。
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。
发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
标志设计标准教程
已累计诞生 746 位幸运星
发表评论 为下方 4 条评论点赞,解锁好运彩蛋
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓