为什么你看不下去AI生成的长文档?换个输出格式拯救你的注意力!

一、全文速览图

为什么你看不下去AI生成的长文档?换个输出格式拯救你的注意力!

Anthropic 自家工程师,把公司产品的默认输出格式换掉了。

不是悄悄改的,是公开宣布的:"我已经几乎不用 Markdown 了"。

这句话值得停下来想一想。我们花了将近十年,把所有 AI 工具训练成用 Markdown 和我们说话——计划文档、技术规范、代码说明,全是整整齐齐的.md文件。这件事从来没人质疑过,因为它"够用"。

但够用,不代表对。

二、这个人是谁

说这话的人叫 Thariq Shihipar,在 Claude Code 团队里负责工程、内容和用户反馈三条线同时跑。

他不是那种坐在角落里写代码的工程师。MIT 出身,之前开了五年游戏公司,融了差不多一千七百万美元。加入这家公司的理由,他自己说叫"AI psychosis",大概意思就是他觉得 AI 编程工具就是软件开发的未来,不来不行。

为什么你看不下去AI生成的长文档?换个输出格式拯救你的注意力!

他做过一个叫 AskUserQuestion 的功能,就是让 AI 在信息不够的时候主动问你,而不是瞎猜。他把这个叫"解除模型的束缚"。这个描述我挺喜欢的,因为它说明这个人不是在做功能,他是在想怎么让 AI 真正好用。

这次他把自己和团队用 AI 生成的二十个 HTML 文件全部开源,按用途分成九大类,每一个都是单独的文件,浏览器打开就能用。

不是 demo,不是教程,是他们真实在用的东西。

这个细节很重要。不是他一个人在折腾,是整个团队都在这么干。

三、Markdown 到底出了什么问题

我想先问你一个问题。

你上一次认认真真读完一份 AI 生成的 Markdown 长文,是什么时候。

不是扫一眼,是真的从头读到尾,把里面的内容都消化了。

我自己想了一下,好像很久了。大多数时候是让 AI 生成一份计划或者分析,然后往下拉了两屏,觉得"差不多",就关掉了。里面写了什么,说实话记不住。

这不是我一个人的问题。Thariq 在文章里也说,超过一百行的 Markdown 文档,他自己都读不下去,更别说让团队其他人读了。

这里有一个很有意思的悖论。

Markdown 当年流行起来,靠的是一个核心假设:人要亲手编辑文件。所有的语法设计都是为了让人类手指打字方便——#是标题,**是加粗,-是列表。简洁,直接,对人类友好。

但现在写这些文件的是 AI,不是人。

你回想一下,你上次亲手改一份 Markdown 文件是什么时候。大多数情况是 AI 写,你看一眼,觉得行就提交,觉得不行就告诉 AI 哪里改,让它再写一版。文件从头到尾你没动过一个字符。

那 Markdown"易编辑"这个最大的优势,还有什么意义。

为什么你看不下去AI生成的长文档?换个输出格式拯救你的注意力!

还有一个更根本的问题,就是 Markdown 根本装不下 AI 能理解的信息。

颜色只能用文字描述,图表只能用 ASCII 线框拼,代码改动只能用加号和减号标记。你让 AI 帮你展示一组设计色板,它在 Markdown 里憋了半天,最后输出一排灰扑扑的字符。hex 值标得很准,但那一堆点阵图案,你完全看不出是什么颜色。

全世界最强的编程 AI,被困在纯文本格式里,只能用打字机字符假装自己在展示色板。

这个画面说实话有点荒诞。

四、HTML 能做什么

我挑几个最有意思的场景说。

1. 代码审查这件事

为什么你看不下去AI生成的长文档?换个输出格式拯救你的注意力!

Thariq 让 AI 审查一个代码改动,生成了一个 HTML 页面。里面是完整的 diff 渲染,每段改动旁边有注释,每条注释按严重程度颜色编码。红色是必须修的问题,黄色是值得看一眼的,绿色是安全的。顶部还有一张风险地图,哪个文件改动风险最高,一眼就能看出来。

他现在每次提代码改动都附带一个这样的 HTML 页面,比平台默认的 diff 视图好用得多。

为什么?他说了一句话我觉得说到点子上了:代码的改动是空间信息,Markdown 把它压平了,HTML 能把它还原回来。

这句话可以推广到很多场景。很多信息本质上是有空间结构的,有层级、有关联、有颜色区分,但 Markdown 是线性的,它只能把这些信息拍平成一行一行的文字,然后让你自己在脑子里重建那个结构。

这个重建的过程,就是你的注意力在悄悄消耗。

2. 交互式教程

为什么你看不下去AI生成的长文档?换个输出格式拯救你的注意力!

让 AI 解释一个技术概念,Markdown 只能输出一大段线性文字。但 HTML 可以做成一个交互式的页面。

比如讲一致性哈希,HTML 版本是一个环形图,节点和 key 分布在环上,你可以点"加一个节点"或者"删一个节点",实时看到 key 的重新分配。旁边还有对比表和术语表。

同样的内容用 Markdown 写,大概是两页干巴巴的文字加一张 ASCII 画的圆圈。

你选哪个?

3. 用完即弃的编辑器

这个概念我觉得是整篇文章里最有意思的部分。

假设你有二十四个工单需要重新排序。让 AI 生成一个 HTML 文件,每个工单是一张可以拖拽的卡片,在几个不同状态之间拖动。AI 会先用自己的判断做一轮预排序,你只需要微调。调完了,点底部的按钮,导出结果。

这不是一个产品,不是一个可以复用的组件,就是一个为当前任务量身定制的、用完就扔的单文件工具。

Thariq 给这种东西起了个名字,叫"throwaway editor",用完即弃的编辑器。

还有一个更关键的概念,他叫"双向交互"

HTML 文档不再是只读的。AI 生成的滑块、旋钮、拖拽区域都是活的,你可以在页面里操作,调完之后点导出,把结果转换成文字再反馈给 AI 继续干活。

人→AI→HTML→人操作→导出→AI。

闭环了。

为什么你看不下去AI生成的长文档?换个输出格式拯救你的注意力!

AI 生成的不再是"文档",而是"工具"。

这个转变,我觉得比格式本身更重要。

五、这背后到底发生了什么

好,讲了这么多案例,我想说一个更深层的东西。

这件事被很多人解读成"HTML 比 Markdown 好用",然后就去学怎么在 prompt 里加一句"请用 HTML 格式输出"。这个理解没错,但有点浅。

Thariq 真正在说的,是一个关于"谁是主体"的问题的答案正在改变。

Markdown 的核心假设是:人是文件的作者,工具应该让人写得更轻松。

HTML 的核心假设是:人是文件的读者,工具应该让人看得更清楚。

在 AI 大规模介入工作流之前,这两个假设几乎没有分歧。你写什么,你就读什么,格式是透明的,不需要思考。

但现在写的是 AI,读的是人,这两个角色第一次被彻底分开了。

格式突然变成了一个需要主动设计的决策,而不是一个默认选项。

我在想,这个逻辑其实不只适用于 HTML 和 Markdown 之间的选择。它适用于所有 AI 工作流的设计决策。

当 AI 生产内容的边际成本趋近于零,内容过剩就变成了常态。在这个背景下,真正稀缺的不是信息,而是人愿意读完它的意愿,是人真正能把它用起来的注意力。

一个格式能不能让人真正"读进去",比它是否节省 token 重要得多。

为什么你看不下去AI生成的长文档?换个输出格式拯救你的注意力!

Thariq 在文章里提到了一个"token 悖论",我觉得说得很好。HTML 比 Markdown 多消耗三到五倍的字符数,这是事实。但你要算的不只是单次输出的 token,你要算的是整个对话的总消耗。

一个复杂项目进行到中期,你的上下文里可能已经累积了几十万 token。每一次因为 Markdown 文档看不清楚、决策点不明确而产生的额外来回,都会让那几十万 token 又被重送一遍。

相比之下,一份设计良好的 HTML 交互界面,虽然单次输出多用了几千 token,但如果它能让你在第一次就做出精确决策、减少后续的澄清往返,整体消耗的 token 反而可能更少。

这是一个有点反直觉,但在长对话场景中非常真实的计算。

六、当然 HTML 也不是没毛病

我不想把这件事说得太绝对,因为 HTML 确实有它的问题。

生成速度比 Markdown 慢,有时候慢两到四倍。版本控制的 diff 乱得没法看,你没办法像对待 Markdown 文件那样清晰地追踪每次改动。而且确实更耗 token,这是客观事实。

Markdown 不会消失,就像命令行不会消失一样。在版本控制、文件存储、跨平台兼容性这些场景里,Markdown 仍然有它不可替代的位置。

但 Thariq 说了一句话,我觉得是整篇文章里最有分量的一句:

"你真的会去读 HTML 生成的东西。而 Markdown 的长文档,大概率划两下就关了"

读了,和没读,这个差距比 token 效率大多了。

我自己最近也开始试这个方法了。让 AI 生成分析报告的时候,在 prompt 最后加一句"请以 HTML 格式输出,使用 CSS 样式,让信息层级清晰,关键数据可以高亮",然后把输出内容保存成.html 文件,用浏览器打开。

感受确实不一样。

不是说内容变好了,内容是一样的。是我愿意读了。我会在页面上停留更长时间,会真的去看那些细节,而不是快速扫一眼就关掉。

这个变化听起来很小,但它影响的是你从 AI 工作流里实际获取的价值。

七、格式选择,其实是注意力预算

对了,我还想说一个更大的背景。

我们现在处于一个很奇怪的阶段。AI 的能力在快速增长,但我们和 AI 交互的界面,基本上还停留在纯文字的思维里。

你想想,AI 现在能做的事情,已经远超过它能用文字表达的事情了。它能理解空间关系、颜色信息、交互逻辑、数据可视化,但我们一直在用一个为人类手指设计的纯文本格式来接收它的输出。

这个落差,正在变成生产力的天花板。

Thariq 的这篇文章,表面上是在说格式选择,深层是在说:当 AI 写作成本趋近于零,我们应该把所有的优化方向,都指向"节省人的注意力"。

这不只是 HTML 和 Markdown 的问题。

你现在做的每一个 AI 工作流决策,其实都是在替自己的注意力做预算。你选择什么格式输出,选择怎么组织信息,选择在哪个环节让人介入、在哪个环节让 AI 自动完成——这些决策加在一起,决定了你从AI协作里真正能拿到多少价值。

一个格式的变化,就决定了你到底是在"使用"AI,还是在被 AI 生产的内容淹没。

为什么你看不下去AI生成的长文档?换个输出格式拯救你的注意力!

八、最后想说的

我写这篇文章,不是想让你去学一个新技能,或者记住一个新的 prompt 模板。

我只是觉得,Thariq 这件事背后有一个值得认真对待的信号。

我们花了很多时间在想怎么让 AI 更聪明、怎么写更好的 prompt、怎么选更强的模型。但我们花在"AI 输出的东西,我能不能真正用起来"这个问题上的时间,可能远远不够。

聪明的 AI,加上一个没人愿意读完的输出格式,最终的价值是零。

这件事 Anthropic 自家人已经用行动投了票。

你现在的 AI 工作流,是为了让 AI 方便,还是为了让你自己真正能用起来。

收藏 1
点赞 16

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。