限量之后，用法必须变了

上个月GLM Coding Plan改了套餐规则，群里炸了一轮。有人说”以前不限量现在限了，吃相难看”，有人说”涨价又限额，这是要赶人”。

我理解这种情绪。但我不是一个旁观者在评理，我是一个每天在GLM上跑大量Agent coding的重度用户，Pro包季600块，到期日7月14号，白嫖的两个月新套餐我也拿到了。所以我想从一个实际在用的人的角度，聊聊这件事。

先说事实：改了什么

4月30号起，老套餐停止自动续订。作为补偿，白送两个月新Pro套餐，老套餐到期后顺延。

新Pro的额度：每5小时400次prompts，每周2000次。听着还行？但GLM-5.1高峰期3倍消耗，非高峰期2倍。也就是说，你用一次，可能扣你两到三次的额度。限时福利到6月底，非高峰期能降到1倍消耗，但这只是临时的。

包年有7折窗口期。如果你信这个平台会长期可用，现在锁价确实划算。

还有个背景：2月12号已经涨过一次，30%以上。这次不是第一次了。

限额、涨价、改规则，这些是表象。真正有意思的是背后那条逻辑链：模型能力上来了→用量暴增→成本暴露了→行业开始算账了。

我自己的体感很直接。去年我用GLM做coding，能力一般，很多任务跑不通，自然用得少。用量少，成本就不是问题。平台不限量也无所谓——反正你也用不了多少。

但今年不一样了。GLM-5.1能力明显上了一个台阶，Agent能跑通的任务多了，我的使用量跟着暴涨。不是我刻意多用，是能用和不能用之间，用量差了一个数量级。

以前不是我不想多跑，是跑不通。现在跑通了，成本就藏不住了。

平台也一样。早期不限量是抢用户的策略——先把你圈进来，培养习惯。等你真离不开的时候，发现成本扛不住了。所有大模型平台都在经历这个阶段。Cursor涨了，Claude涨了，OpenAI的API价格也一直在调整。这不是某一家”吃相难看”，是整个行业从烧钱抢用户的阶段，进入了算账的阶段。

说到用量暴增，有个现象值得单独拎出来说。

有人在GLM上烧了900万token，没有产出任何正经能用的东西。 不是个例。我见过不少这样的案例：Agent跑了一整夜，token哗哗流，最后产出的代码要么跑不通，要么跟需求对不上，要么陷入循环反复改同一个bug。

这说明什么？说明问题不完全在平台限额，也在使用方式。

模型能力上来了，不代表你随便丢个任务它就能完美完成。尤其是Agent coding，你给的指令不清、任务拆分不对、上下文管理混乱，Agent就会在那里反复试错，token消耗指数级上升，产出反而是零。

这跟用搜索引擎一个道理——搜索引擎能力再强，你搜的关键词不对，照样找不到想要的东西。只不过搜索引擎不按token收费，你不心疼而已。

一个东西这么新，就已经要求用户转变使用方式了，这本身就是一个问题。

AI coding才火多久？很多人刚学会让Agent写代码，刚从”哇这玩意能写代码”的兴奋期出来，还没来得及建立任何最佳实践，平台就告诉你：你得学会控制成本了。

这不像手机从3G到4G，流量贵了你就少看视频。AI coding的使用方式转变远比”少看视频”复杂——你需要学会怎么拆任务、怎么给上下文、什么时候该让Agent放手跑、什么时候该人工介入。这些技能，大多数人根本还没开始学。

而且说实话，目前没有谁能教你这些。 官方文档不会告诉你”怎么用更少的token跑出更好的结果”，社区里的最佳实践也还在形成中。每个人都在摸索。

我自己也还在摸索。我有一个Agent写作pipeline跑了大半年了，四条新闻源抓取、八层写作skill按需加载、自动排版推草稿——这套流程是慢慢调出来的，不是一开始就有的。中间也踩过大量浪费token的坑，Agent跑了一晚上结果全是垃圾，第二天全部推翻重来。那些token就是学费。

几个实际的建议，都是我自己在做的：

第一，学会在非高峰期跑任务。 高峰期3倍消耗，非高峰期如果福利还在的话只要1倍。把你那些不急的任务放到凌晨跑，省出来的额度是实打实的。

第二，拆任务比优化提示词更重要。 与其给Agent一个巨大的任务让它自己想办法，不如你先想清楚这个任务能不能拆成三五个小步骤。每个小步骤消耗的token少，而且出错了也容易定位，不用从头来。

第三，设置检查点。 不要让Agent一跑到底，中间设几个检查点，确认方向对了再继续。方向错了立刻停，比跑完才发现要省几百倍的token。

第四，API用户尤其要注意成本。 如果你走API调用，成本意识要更强。GLM的API定价不算贵，但Agent coding的token消耗是指数级的——一个任务如果Agent陷入循环，几万token眨眼就没了。设好max_tokens和调用次数上限，给自己一个止损线。

我不是在替平台说话。限额这事儿确实不爽，尤其对习惯了大水漫灌式使用的人来说。但从行业角度看，这个阶段迟早要来。模型能力的提升不是免费的，算力成本是真实的，平台不可能永远不计成本地开放。

真正的挑战不是限额本身，是我们这些用户能不能在限额的压力下，倒逼出更高效的AI使用方式。 能做到的人，限额反而无所谓，因为你本来就用不了那么多。做不到的人，给多少额度都不够。

这可能是AI工具进化过程中，用户必须经历的一次成长。快了点，疼了点，但躲不掉。