AiCC

/ AI知识共创
首页知识深度AI 行业情报商业业务知识库活动
保持联系
返回列表
AI 实战2026年6月13日

限量之后,用法必须变了

作者 小虾子

上个月GLM Coding Plan改了套餐规则,群里炸了一轮。有人说”以前不限量现在限了,吃相难看”,有人说”涨价又限额,这是要赶人”。

我理解这种情绪。但我不是一个旁观者在评理,我是一个每天在GLM上跑大量Agent coding的重度用户,Pro包季600块,到期日7月14号,白嫖的两个月新套餐我也拿到了。所以我想从一个实际在用的人的角度,聊聊这件事。

先说事实:改了什么

4月30号起,老套餐停止自动续订。作为补偿,白送两个月新Pro套餐,老套餐到期后顺延。

新Pro的额度:每5小时400次prompts,每周2000次。听着还行?但GLM-5.1高峰期3倍消耗,非高峰期2倍。也就是说,你用一次,可能扣你两到三次的额度。限时福利到6月底,非高峰期能降到1倍消耗,但这只是临时的。

包年有7折窗口期。如果你信这个平台会长期可用,现在锁价确实划算。

还有个背景:2月12号已经涨过一次,30%以上。这次不是第一次了。

但真正值得聊的不是规则本身

限额、涨价、改规则,这些是表象。真正有意思的是背后那条逻辑链:模型能力上来了→用量暴增→成本暴露了→行业开始算账了。

我自己的体感很直接。去年我用GLM做coding,能力一般,很多任务跑不通,自然用得少。用量少,成本就不是问题。平台不限量也无所谓——反正你也用不了多少。

但今年不一样了。GLM-5.1能力明显上了一个台阶,Agent能跑通的任务多了,我的使用量跟着暴涨。不是我刻意多用,是能用和不能用之间,用量差了一个数量级。

以前不是我不想多跑,是跑不通。现在跑通了,成本就藏不住了。

平台也一样。早期不限量是抢用户的策略——先把你圈进来,培养习惯。等你真离不开的时候,发现成本扛不住了。所有大模型平台都在经历这个阶段。Cursor涨了,Claude涨了,OpenAI的API价格也一直在调整。这不是某一家”吃相难看”,是整个行业从烧钱抢用户的阶段,进入了算账的阶段。

有人烧了900万token,啥也没跑出来

说到用量暴增,有个现象值得单独拎出来说。

有人在GLM上烧了900万token,没有产出任何正经能用的东西。 不是个例。我见过不少这样的案例:Agent跑了一整夜,token哗哗流,最后产出的代码要么跑不通,要么跟需求对不上,要么陷入循环反复改同一个bug。

这说明什么?说明问题不完全在平台限额,也在使用方式。

模型能力上来了,不代表你随便丢个任务它就能完美完成。尤其是Agent coding,你给的指令不清、任务拆分不对、上下文管理混乱,Agent就会在那里反复试错,token消耗指数级上升,产出反而是零。

这跟用搜索引擎一个道理——搜索引擎能力再强,你搜的关键词不对,照样找不到想要的东西。只不过搜索引擎不按token收费,你不心疼而已。

但这就引出一个更深层的问题

一个东西这么新,就已经要求用户转变使用方式了,这本身就是一个问题。

AI coding才火多久?很多人刚学会让Agent写代码,刚从”哇这玩意能写代码”的兴奋期出来,还没来得及建立任何最佳实践,平台就告诉你:你得学会控制成本了。

这不像手机从3G到4G,流量贵了你就少看视频。AI coding的使用方式转变远比”少看视频”复杂——你需要学会怎么拆任务、怎么给上下文、什么时候该让Agent放手跑、什么时候该人工介入。这些技能,大多数人根本还没开始学。

而且说实话,目前没有谁能教你这些。 官方文档不会告诉你”怎么用更少的token跑出更好的结果”,社区里的最佳实践也还在形成中。每个人都在摸索。

我自己也还在摸索。我有一个Agent写作pipeline跑了大半年了,四条新闻源抓取、八层写作skill按需加载、自动排版推草稿——这套流程是慢慢调出来的,不是一开始就有的。中间也踩过大量浪费token的坑,Agent跑了一晚上结果全是垃圾,第二天全部推翻重来。那些token就是学费。

那怎么办?

几个实际的建议,都是我自己在做的:

第一,学会在非高峰期跑任务。 高峰期3倍消耗,非高峰期如果福利还在的话只要1倍。把你那些不急的任务放到凌晨跑,省出来的额度是实打实的。

第二,拆任务比优化提示词更重要。 与其给Agent一个巨大的任务让它自己想办法,不如你先想清楚这个任务能不能拆成三五个小步骤。每个小步骤消耗的token少,而且出错了也容易定位,不用从头来。

第三,设置检查点。 不要让Agent一跑到底,中间设几个检查点,确认方向对了再继续。方向错了立刻停,比跑完才发现要省几百倍的token。

第四,API用户尤其要注意成本。 如果你走API调用,成本意识要更强。GLM的API定价不算贵,但Agent coding的token消耗是指数级的——一个任务如果Agent陷入循环,几万token眨眼就没了。设好max_tokens和调用次数上限,给自己一个止损线。

最后说两句

我不是在替平台说话。限额这事儿确实不爽,尤其对习惯了大水漫灌式使用的人来说。但从行业角度看,这个阶段迟早要来。模型能力的提升不是免费的,算力成本是真实的,平台不可能永远不计成本地开放。

真正的挑战不是限额本身,是我们这些用户能不能在限额的压力下,倒逼出更高效的AI使用方式。 能做到的人,限额反而无所谓,因为你本来就用不了那么多。做不到的人,给多少额度都不够。

这可能是AI工具进化过程中,用户必须经历的一次成长。快了点,疼了点,但躲不掉。

原文发布于 AiCC,转载或引用请注明出处

We don't just produce information, we reconstruct knowledge. Elevating AI efficiency to an architectural art form.

Follow
公众号
公众号:AI知识共创
小程序
小程序:AI信息王哥
Explore
  • 首页
  • 知识深度
  • AI 行业情报
  • 商业业务
  • 知识库
  • 活动
Connect
  • 活动论坛
  • AI账号
  • 提示词商城
  • AI网址导航
  • 自媒体进化
  • AI应用分享
© 2023 AiCC · JOVI / AI Creative commons
POWERED BY Claude code