

最近连豆包都准备开始收费了。

看到这个消息我就感叹,又一个。。以前觉得国产AI至少在价格上还有优势,现在看来免费的好日子是真的快到头了。
我自己其实早就在为AI花钱了,从以前充值Midjourney(这个充了年费,但已经很少用了),到现在固定在付费的有两个,ChatGPT Plus和Claude Pro。
ChatGPT主要用来做事实核查,就是把Claude生成的内容发给GPT做交叉验证,两边对着看,能有效降低AI幻觉,减少瞎编的概率。Claude是主力,大部分都靠它完成。
但Claude好用是好用,token开销真的越来越大了。
几年前我开始用Claude的时候,免费就已经非常好用了。现在不充会员,出来的东西就很差。充了会员以后又觉得不够用,每次有重要的事,聊几轮额度就没了,总忍不住想充一个顶配会员。搞得我现在用的时候,总是开2个窗口,一边聊一边看这个额度窗口,魔怔了都。

这就很矛盾。我明明知道AI能帮我提效,但每次一想到token消耗,又忍不住犹豫,这个问题到底值不值得花一轮对话去问?总在想有没有啥办法,别消耗那么快。
前段时间还出了个事。4月21号左右,Anthropic悄悄把Claude Code从Pro会员的权益页里拿掉了。

当时用户骂得凶,所以很快又撤回了,但方向已经很明显了,Claude正在从20美元包月随便用,慢慢变成基础订阅加用量限制加超额按量付费。
不只是Claude,现在各家可能都在准备涨价,token越来越贵。我现在有时候感觉自己是在付费上班。
不过我倒不是说收费不对。我也理解,商业本来就要赚钱,付费的才是最便宜的产品,免费反而可能是最贵的东西。它赚钱,才能养活做这个产品背后的人和家庭,这样才能持久,越做越好。
那问题就变成了,在AI时代,怎么最有效地用好每一个token?花最少的钱,办最多的事,还能顺便把跟AI协作的方法搞明白。
这个问题我自己也研究了挺久,不敢说总结出了什么方法论,但确实有一些日常使用中反复验证过的经验,先分享出来吧,对大家或许能有点用,还能省点钱。
开始之前先快速说一下token到底是什么,很多朋友可能不太清楚这玩意到底怎么算的。
你可能以为一个字就是一个token,其实不是。AI处理文字的方式跟我们不一样,它会把文本拆成一小块一小块的单元,这个单元就叫token。英文里,一个 token 通常接近几个字母或一小段单词片段,不一定等于一个完整单词。OpenAI 给过一个粗略参考,1 个 token 大约等于 4 个英文字符,100 个 token 大约是 75 个英文单词。中文不固定,常见情况是一个 token 对应一到几个汉字,具体要看模型的分词方式。

你每次发一条消息给AI,消耗的token包含两部分,你输入的内容,和AI输出的内容。输入输出都要钱。所以不只是AI回复得长才费token,你每次把一大段背景资料塞进去,光输入就已经在烧了。
而且还有一个很多人不知道的事,每轮对话AI可能都会把之前所有的聊天记录重新读一遍。你跟它聊了20轮,到第21轮的时候,它需要处理的其实是前面20轮所有消息加上你第21条,全部重新读一遍。越往后聊,单轮消耗越大。
这就是为啥经常觉得没聊几句token就没了,因为后面几轮每一轮都在重新消化前面所有的内容。
理解了这个,你就知道省token的关键其实是减少来回折腾的轮数,提高每一轮的有效性。少打几个字省不了什么。
那道理我懂了,但我怎么知道自己每次到底花了多少token?没有具体数字,光靠感觉是很难优化的。
这里教大家一个最简单的方法来建立token体感。
OpenAI有一个免费的在线工具叫Tokenizer,网址是 platform.openai.com/tokenizer,你把准备发给AI的文字贴进去,它会直接告诉你这段话有多少个token,还会用不同颜色标出来每个token的切分方式。虽然不同AI的token算法不完全一样,但量级差不多,用这个工具估误差不大。

如果你嫌每次贴来贴去太麻烦,还有一个更粗暴的估算方法,中文大概两个字算一个token,英文大概一个单词算一个token。你写完一段提示词,数一下字数除以2,心里就有个大概了。
还有一种做法是装浏览器插件。Chrome应用商店里搜AI Token Counter插件,装好后刷新下页面就有了。

装了之后它会在对话界面上直接显示当前对话的token用量,实时更新,这个插件还能根据你对话的AI工具,显示不同的统计数据,还挺方便。

我建议大家把自己平时常用的提问方式贴进去看看到底多少token。有了这个数字之后,你再去优化提问方式,会更有感觉。
好,接下来说两个我自己真实在用AI干活的时候到底怎么操作的例子。
第一个案例,用Claude Design做QQ音乐首页改版
看过我上一篇文章的朋友应该有印象,我之前拿Claude Design认真做了一版QQ音乐的首页改版方案。
我当时给Claude Design写的提示词是这样的,帮我设计一个音乐App的首页,参考QQ音乐的产品形态。要包含顶部搜索栏、今日推荐轮播卡片、根据听歌偏好推荐的歌单横向滑动、新歌速递、以及底部导航栏。整体风格要有情绪感,年轻化,可以用一些渐变和毛玻璃效果。iOS风格,402x874的手机尺寸。
这个提示词,其实就是我已经优化过的。
它把产品类型说清楚了,把页面需要包含哪些模块列得很具体,还限定了视觉方向,甚至连画布尺寸都给了。
所以Claude Design一次就生成了一个相当完整的首页方案,整体布局和模块划分都对得上,省了好几轮来回扯皮的token。
我当时看到结果的时候还挺意外的,心想这AI做UI还是有不少提升。但问题也很多,就是那种远看还行,一近看就知道不能直接交给开发的程度。
这时候很多人的第一反应是再发一大段话让AI全部重做。
千万别。
全文重做就是token黑洞。这时候更省的做法是精准下刀,只改有问题的地方。
我当时就拆成了三个独立的修改指令。第一条专门说图标的问题,让它用更精致的线条图标,控制线宽和尺寸比例。第二条说封面的问题,让它用抽象的几何插画或者色块组合替代纯渐变。第三条说中文排版的问题,给了具体的字号层级要求。
三条提示词分开发,每条都只解决一个问题,Claude Design每次修改的范围都很小,没有把已经做好的部分搞乱。
如果我是跟它说,整体优化一下,大概率它会把排版重新排一遍,把已经对了的模块也改了,最后还得花更多的轮数改回来。
总之,核心就一句话,提示词越具体,AI越省事,token也越省。
第二个案例,日常提问怎么问得更高效
这个其实更常见。我们大部分时候用AI不是在做大项目,就是日常问个问题,查个东西,让它帮你改段话。
我之前有个习惯,会用语音记录一段想法后丢给Claude说,帮我优化一下这篇口述想法。
这种问法就是token黑洞。
AI不知道我要优化什么,所以它只好全来一遍,然后改得乱七八糟。后来我改了问法,让它更口语化一些,像跟朋友聊天的语气,优化内容逻辑,使其更自然通顺,不要修改我想表达的原意。
但我发现一个问题,每次让Claude帮我润色文章的时候,我都得重复说一遍同样的要求。每次都打一遍,烦不说,光这些重复的要求就在烧token。
所以我后来干脆把这些要求写成了一个skill文件。skill你可以理解成一份提前写好的说明书,告诉AI你是谁、你的风格偏好、你的禁区是什么。每次对话的时候AI会自动读取这份说明书,我就不用每次都重复说一遍了。

这个事的本质是什么呢?其实就是把优化范围提前说清楚了。你仔细想想,这个逻辑其实大家早就熟悉了。
你平时用Figma做设计的时候,每一步操作都是非常明确的。你选一个图层,改一个颜色,拖一个间距,指哪打哪,没有任何模糊地带。软件不需要猜你要干什么,你点哪它就改哪,效率极高。
这其实就是最省token的交互方式。
跟AI打交道的道理是一样的。你给AI的指令越接近指哪打哪的状态,token浪费就越少。skill就是帮你把那些反复出现的指哪打哪固定下来,不用每次重新描述一遍。
回到总结资料这个场景,也是同一个道理。很多人会把十几页的资料全塞进去说帮我总结。能用,但巨烧token。
更省的做法是拆成两步。第一步只提取信息,从这些内容里只提取跟XX主题相关的关键信息,按重要性排列。第二步再加工,基于上面提取的信息,写一段800字以内的总结。
第一步筛信息,第二步写内容。任务拆得越单纯,AI每一步就越精准,返工越少,token自然省下来。我自己处理竞品资料的时候基本都是这么干的,比直接扔进去说帮我总结效率高了不是一点半点。
两个案例说完了,顺着上面的再聊聊我自己总结的几个规律。每条我都会附上具体怎么写,你看完直接就能用。
1)每次只解决一个明确问题
最费token的提问就是那种大而全的,AI不知道你到底要什么,只能猜,一猜就长。把大问题拆成小问题,每次只问一个,边界清楚,输出就短。
举个例子,你写了一篇文章想让AI帮忙改,跟它说换成只看开头的前200字,告诉我哪些地方读起来别扭,给出修改建议,其他部分不要动。
同样的,你想让AI帮你做PPT,说帮我列出述职PPT的页面结构,每页一句话说清楚放什么内容,控制在8页以内,不要写正文。

2)给输出加限制
AI真的很容易热心过度。你问一个问题,它给你补背景、讲原理、列延展建议,结尾还问你要不要继续。
这里给大家几句我自己经常用的万能限制语,基本上每次提问都可以往后面加。
"控制在500字以内",限制长度,最直接有效。
"不写背景直接给结论",省掉AI最爱输出的那些铺垫。
"结尾不要追问",省掉AI每次结尾那段"你还需要什么帮助吗"。
"每条建议不超过一句话",防止AI把一条建议展开成一整段。
"只列要点,不要展开解释",适合你只需要方向但不需要细节的时候。
这些话每句可能只有十几个字,但真的能帮你省掉一大截无用输出。
格式限制也一样好用。"按问题、原因、建议三列输出",AI会自动收紧表达。"先给提纲不写正文",先对齐结构再动笔,避免方向跑偏之后全文返工。

3)能局部改就不要全文改
一篇文章如果已经有70分了,最好的做法是精准下刀。
我自己常用的几种局部修改句式,"只改标题给我5个选项""只改开头让它更有冲突感""只找出逻辑不顺的3处并给修改建议""第三段的数据论证太弱了,只加强这一段"。
关键是那句"其他内容不要动"。不加的话AI很容易把你没让它改的地方也顺手改了,改完你还得改回来,来回两轮就白花了。

4)复杂任务先要结构再要正文
就像写文章,别一上来就让AI写完整稿。先问"给我一个5段以内的文章结构,只写小标题和每段核心论点,不要写正文"。你看完结构没问题,再说"按这个结构写正文,控制在800字以内"。虽然多了一步,但更省。因为结构错了全文一定错,结构先对了后面基本不会大返工。

5)长资料分两步处理
前面说过了,先提取再加工,不要一股脑全塞进去让AI总结。第一步"从这些内容里只提取跟XX主题相关的关键信息,按重要性排列"。第二步"基于上面提取的信息写一段800字以内的总结"。两步走比一步到位省得多。

6)开新对话而不是在老对话里继续
这条我在之前的文章里有说过,很简单易于实操的办法。前面说过,每轮对话AI都要把之前所有消息重新读一遍。所以如果你的问题跟前面的对话没关系,直接开一个新对话。

7)让AI先问你问题再动手
在你发给AI的提示词后面加一句"在开始之前,先问我3个你觉得还需要了解的问题"。AI会把它不确定的地方主动问出来,你回答完它再动手,比它猜着写然后你来回改省太多了。

说到这里,我想多说几句。
这些方法听起来都不难对吧?但我自己用了很长时间才真正养成习惯,主要是claude的token实在是用的太快,逼着我想着办法省着用。
但省token这件事,也不能为了省而省。有段时间我特别执着于减少对话轮数,每次都把所有要求写得特别细,一条消息恨不得写500字。结果token是省下来了,但我花在写提示词上的时间比让AI来回改几轮还长。这就搞笑了。
所以关键不是省,是效率。是用最短的路径达到你的目标。
那怎么才能做到每次提问都又快又准呢?说到底还是得靠平时的积累。
关注我比较久的老读者可能知道,我已经坚持每日写作打卡10多年了。现在我在工作中养成了一个习惯,遇到问题或者解决了问题,一定会随手记录下来,几句话就行。这些东西积累得多了,脑子里对各种问题都有一套已经想好的框架,等你去问AI的时候,自然就能把问题说得很清楚。
而且会写之后你自然就会讲,这种改变是潜移默化的。当你开始表达,你就拥有了第三视角,会从别人的反馈里知道自己哪些地方没说清楚,哪些地方逻辑断了。不管是打工还是创业,这个能力都非常有用。像我在群里经常说的,千万不要怕自己写得不好讲得不好,不行动才是最可怕的。
顺便说一下我现在每天是怎么完成知识星球写作打卡的。我想到什么东西,会赶紧打开flomo,然后用豆包输入法,用语音说出来,说完之后就是一大堆口语化的散乱文字,然后复制发给Claude,用我自己的一个语音转短文skill,一分钟就能整理成一篇日记短文。想的部分是我自己的,Claude只是帮我把口语变成了通顺的文字。
这其实就是今天这篇文章想说的事。
AI就像一个能力极强但完全不了解你处境的新同事。你给的信息越精准,它干活越快。你说得越模糊,它就只能猜,猜错了你还怪它。
token越来越贵,反过来看其实是在倒逼我们每个人提升自己的表达和思考能力。以前提示词随便写,AI便宜,多来几轮无所谓。现在每一轮都有成本,你自然就会开始认真对待每一次提问。
这跟小时候打长途电话一样,贵的时候你会先想好要说什么,争取一次说清楚。微信免费之后,反而一句话拆成十条发,沟通效率其实更低了。
开头我说感觉自己是在付费上班。
写完这篇我改主意了。与其说是付费上班,不如说是在给自己的思考能力交学费。这笔学费,AI只是代收的,真正赚到的人是你自己。
想清楚再说话。这大概是AI时代最便宜的投资了。
欢迎关注作者的微信公众号:「彩云译设计」

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。




发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
UI设计精品必修课
已累计诞生 791 位幸运星
发表评论
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓