定焦｜豆包，开始学智谱

一年多前，Cursor还是林鸣最常用的编程软件之一。

他是互联网大厂里负责Agent落地的工程师。那时候，他用AI写代码，主要让它补几行或者改个参数。在这个软件里，大模型塞进编辑器，他可以随时调用。

现在，林鸣已经很久没有打开Cursor了，日常用得更多的，是Claude Code、Codex，以及公司自研的AI编程工具。

这不只是工具的变化。如果说用Cursor的时候，AI更像一个副驾，程序员还坐在驾驶位上；那么到了Claude Code和Codex，模型被直接接进了研发流程。给它一个任务，它可以自己拆需求、读代码、调用工具、跑测试，并最终交付。

也就是说，林鸣可以把一整块工作都交出去了。但代价是，token的消耗也上去了。

过去，公司给工程师的额度几乎不限量，后来额度收紧，林鸣干脆自己订阅了好几款工具，身边像他一样的同事很多。

当一个开发者愿意自掏腰包，背后是一个已经跑出来的市场。

Anthropic是最早接住这个市场的AI公司。它虽然没有ChatGPT那样的C端流量，却靠Claude Code讲出了一个更容易算清账本的故事——开发者愿意付费，企业愿意采购。如今，它的用户量虽远远不及OpenAI，但估值已经反超，接近万亿美元。

承压的OpenAI也在调整重心。ChatGPT仍然是最大入口，但Codex的位置越来越重要。据报道，Codex半年周活增长逾7倍，目前已经突破500万。

国内的智谱是另一种样本。

其最新模型GLM5.2的软件工程能力逼近Claude Opus 4.8，Coding Plan的价格却只有Claude的七分之一。这家2025年营收仅7.24亿元、净亏损却高达47.18亿元的公司，市值一度突破万亿港元。市场买单的显然不是眼下的财报，而是“中国版Anthropic”的预期。

比起继续追用户规模，找到愿意持续付费的开发者和企业，正在变得更重要，这是2026年大模型商业化的分水岭。

字节现在也在靠近这条路。

其最新发布的豆包2.1 Pro，补上了Coding和Agent能力。在现场演示和评测中，火山引擎反复拿自己和Claude Opus等模型对标。种种迹象表明，字节不再只是追求更多用户打开豆包，而是开始瞄准开发者、Agent和真实工作流。

对于一家长期信奉“模型即产品”，最擅长用C端流量滚出飞轮的公司来说，这个转身本身就代表了一种信号：免费聊天能带来热度，却很难撑起一门生意。

01.豆包掉头：一半是诱惑，一半是成本

豆包的掉头并非突然发生。

据多家媒体报道，字节高层到访Anthropic后，内部启动AI资源重整，把更多资源从豆包这类大众产品，挪向企业服务和编程模型。为此，大模型数据审核团队从约1500人扩到3000多人，专门为编程模型清洗数据。火山引擎MaaS还被定下收入翻10倍的目标。

这次，它不仅仅是发布了一个更会写代码的新模型，是在组织和资源层面，把AI商业化的重心往B端推。

字节转向B端，动力来自两个方向。

向外看，企业市场已经开始为AI能力付费；向内看，持续高企的算力支出，也迫使每家公司尽快找到一条能够自我造血的路。

先看收入端。

短短两年，AI coding已从程序员尝鲜的玩具，变成企业软件工程的一部分。Stack Overflow 2025年开发者调查显示，84%的受访者已在开发流程中使用或计划使用AI工具，较前一年的76%持续攀升；其中近半数（47.1%）开发者每天都在使用AI编程。Gartner则预测，到2028年，90%的企业软件工程师将使用AI代码助手，而2024年初这一比例还不到14%。

图源 / unsplash

AI coding的商业价值，体现在两个层面。

一层是开发者的付费意愿。过去，AI编程工具只是几美元一个月的插件。现在，主流产品普遍采用订阅加用量的模式，个人版每月十几到几十美元，高强度Agent版本可以到100美元以上。

一位开发者打趣说，过去担心的是“别让AI取代我”，现在变成了“别把AI从我手里夺走”。

另一层是企业的买单意愿。企业按席位、按token、按合同付费。只要工具能进入研发流程，就有机会变成可预测的现金流。

Anthropic的收入曲线，更是让行业看到了这个市场的潜力。去年5月才发布的Claude Code，到2026年2月，年化收入已经达到了25亿美元。其中，超过一半来自企业客户，年支出100万美元以上的大客户，两个月内从500多家增至1000多家。整个公司的年化收入也随之水涨船高，从2月的140亿美元，一路攀升至5月的470亿美元以上。

再来看成本端。

互联网时代生意逻辑是“先做规模、再谈变现”。用户够多、停留够久，靠着广告、电商、会员，总能赚到钱。

但现在这一套不灵了。AI应用不是信息流，每一次提问、生成，背后都是真实烧掉的算力。甚至，用户越多，成本越高。

豆包正承受着这种压力。据《晚点LatePost》报道，每天2亿多人使用的豆包，日收入不足百万元，且主要来自电商佣金。但今年5月，豆包每天消耗的算力成本达数千万元——文字聊天尚不算贵，而推理、图片识别、语音聊天、视频聊天等多模态功能的算力成本，是纯文本交互的几倍甚至几十倍。

支出压力也体现在企业内部的token使用上。

林鸣表示，他所在的公司一开始给的额度几乎不限量，是因为管理层看到AI能力强，但不清楚到底多强、能给企业带来什么，只能让大家先用起来看效果。可用了一阵，发现收益并没有成倍增长，于是公司开始控制成本。

字节技术副总裁洪定坤在一次公开演讲中，也提到过类似落差。字节专做AI coding的TRAE团队，90%的代码已经由AI写出，但人均需求吞吐率只提升了60%。

洪定坤认为，问题出在写代码之后。字节做过一组实验，在不同模型和框架下，AI生成代码的功能正确率普遍超过80%，但到了UI、可靠性、可维护性这些真正决定能否上线的维度，分数却只有40到60分。

算力烧掉了，可交付的产出却没跟上。这个差距，正是大厂转向B端时必须先解的题。只有把那些40到60分的半成品打磨成可交付的产出，烧掉的每一分算力才算真正转化成了生产力。

02.字节的优势，也可能是包袱

豆包的这次转向，是字节整体AI战略的一部分。

字节的AI业务大致有四条主线：世界模型、视频模型、Coding与Agent、豆包商业化。现在拨动的，正是后两条。

Coding与Agent负责打开企业入口，豆包商业化负责回答另一个问题：庞大的C端流量怎么换成收入。

AI coding这条赛道，目前已经分化成三个层级。面向程序员日常开发的Copilot式插件、重做开发环境的AI IDE，以及试图接管整个任务流程的Coding Agent。

字节的布局恰好覆盖了这三层。前端用TRAE和插件抢占开发者入口，中间层以CLI和企业版切入研发流程，底层由火山方舟和豆包模型提供算力与模型供给。6月23日发布的豆包2.1 Pro，则将重心明确押在了Coding和Agent上，官方称其在多项测试中接近甚至追平GPT-5.5和Claude Opus 4.7。

字节这套打法的底气，来自于其已经验证过的企业服务能力。

火山引擎在B端服务企业多年，握有从云、模型调用、MaaS到交付的完整链条。飞书沉淀了大量企业客户和办公协同场景。Seedance则已经跑通了“把模型能力卖给企业”的模式，年化收入约143亿元，毛利率约70%，单月进账几乎覆盖豆包的算力成本。

字节真正想做的，是比模型更底层的基建。洪定坤在演讲中提到一个词——Harness。它指向的是一套涵盖上下文工程、架构约束、团队知识沉淀、技术债梳理，以及测试与交付流程的系统。他的判断是，只有把这些齿轮重新咬合，AI coding才能从生成代码跨越到完成需求。

铺开这套基建，字节仍然沿用了低价策略。

根据豆包Coding Plan定价，最低首月仅需9.9元，Lite套餐后续40元/月，Pro套餐后续200元/月。相比之下，海外主流AI编程工具每月订阅普遍20美元起步，高强度Agent版本可达100美元以上——字节给出的入门价格，几乎是“尝鲜无负担”。

API侧的打法更为直接。Doubao-Seed-Code按上下文长度分层计费，输入价格每百万tokens最低1.2元，输出价格最低8元；火山引擎称，配合缓存后综合使用成本比行业平均低62.7%。

Coding Plan还支持Claude Code、Cursor、Cline、Codex CLI等主流开发环境，意味着开发者不需要迁移工作流，只要把底层模型换掉，就能把原本花在Claude和OpenAI上的部分用量切到豆包。这相当于用价格换切量，用兼容换迁移成本。

对比Claude Code和Codex，字节选择了一个“低价+产品化+生态打包”的组合，把价格压下来、把接入做顺、把工具做轻，让开发者低成本试用，再争取进入工作流。

这正是字节在C端最熟练的打法，也是它眼下最大的优势。火山、飞书、豆包模型构成的底盘，是智谱、DeepSeek们短期内复制不了的；低价策略和兼容主流开发环境的设计，也几乎是为快速渗透量身打造的。

但B端和C端不同。C端可以靠低价、补贴和快速试错拉动增长，B端相反，程序员可以为便宜来试用，但能不能长期留下，看的是产品能不能稳定接住复杂任务、能不能在出问题时给出及时的响应。字节最擅长的快速试错文化，恰恰是B端最警惕的东西。

谷歌是一个值得参考的对照。

它手握Google Cloud、Android、Chrome、Workspace，几乎拥有全球最强的开发者生态，也早早推出了Gemini Code Assist和Gemini CLI。论入口、论生态、论企业客户，谷歌并不缺牌；论价格，它也不算激进——Gemini Code Assist Standard年付折合每人每月仅19美元。

但至少到目前为止，开发者心智并没有自然流向谷歌。这说明，在AI coding这门生意里，生态和价格都只是入场券，真正难的，是产品体验、模型能力、任务完成率和开发者信任。

字节靠低价和生态切入，目前也只是拿到了留在牌桌上的资格。

03.贴身肉搏才刚刚开始

在林鸣这样的重度用户心里，模型早已排好座次。

第一梯队是Claude和ChatGPT，第二梯队是智谱、Kimi、DeepSeek，其余大多滑入第三梯队。他算过一笔账，自己花在大模型上的钱，九成给了第一梯队，剩下的大多投向DeepSeek。道理很简单，Claude和Codex负责最难的任务，DeepSeek便宜、耐烧，适合日常的简单活儿。

“这就像游戏里的外挂，”他打了个比方，“最难的任务当然用最强的武器，简单的才交给性价比更高的模型。”

这种“谁好用就用谁”的态度，在开发者中相当普遍。

一位科技博主的说法更直接，AI时代，用户没有忠诚度，换一个AI工具很多时候只是换个输入框。各家辛苦争来的开发者，随时可能因为别家更好用、更便宜、更稳定而流走。

更麻烦的是，模型之间拉开差距正变得越来越难。

林鸣能明显感觉到，模型还在进步，但进步速度已经不如之前，各个模型之间的差距也更小了。

这类判断也出现在很多公开的讨论里。a16z创始人Marc Andreessen近期发文称，多位从业者认为GLM-5.2可能是第一个在多数任务上匹敌、甚至超越美国头部实验室公开模型的中国模型。他将此视为一个关键节点，认为大模型的能力格局正从少数美国实验室主导走向多极化。

当能力差距缩小，各家的定价策略就成为关键。如果算不好账，可能会伤到自家账本。

目前Coding的付费结构主要包括两部分，个人开发者买订阅，企业客户走API、席位费或合同；前者负责扩大规模、养成付费习惯；后者才是利润的大头。

就拿Claude的定价策略来说，个人订阅分为20美元、100美元和200美元三档，虽然不同档位有相应的用量上限，但整体上收入仍受限于月费模式。API则按token计费，以常用于Coding的Sonnet模型为例，输入和输出价格分别为每百万tokens3美元和15美元，更高端的Opus模型则分别为5美元和25美元。在高强度、全天候的Agent任务等极端使用场景下，企业的API支出可能达到个人订阅的数十倍。

图源 / Claude官网截图

Agent一旦进入真实工作流，算力成本持续攀升，订阅收入却有上限，厂商只能靠限额、峰值扣减来兜底。智谱就吃过苦头。其Coding Plan一度卖得太好，不得不限量发售，高峰期按更高倍率扣减额度。

即便是Anthropic和OpenAI，也得小心维持这道平衡。它们一边要让开发者高频使用、形成黏性，一边用精细的限额管理重度用户。Claude的Pro和Max分档限容，Codex的调用计入专门的额度。订阅看似是固定价格，背后却是一本被严格计量的算力账。

这条赛道，还在不断涌入新玩家。

仅6月下旬，DeepSeek就高调扩招、筹建对标Claude Code的团队，Kimi也把企业业务摆到了更重要的位置。

而越往深处看，赛道越清晰地分成两条路线。

一条是Anthropic和OpenAI代表的专有模型高端路线。它们卖的不是一个便宜模型，而是企业里的AI员工。它们的底牌，是模型能力、产品心智和企业信任。

另一条是更低价、更开放的模型底座路线，DeepSeek、智谱、Kimi、MiniMax扎堆于此。它们想成为别人AI员工背后的模型底座，抢的是API调用、工具集成和私有化部署的份额。

DeepSeek以开源和低价切入，智谱更靠近B端，把模型、Agent、私有化和政企服务打包出售；Kimi和MiniMax则用长上下文、多模态和性价比争夺开发者。

字节恰好卡在两条路线的中间。

它想要的，是闭源高端路线的终点——一套能稳定交付、能写进企业合同、能嵌进工作流的Agent系统。但它选择的入口，却更接近低价路线，压低价格的同时，用兼容性把开发者原本花在Claude和OpenAI上的用量切过来。

这种打法，可能让它两头通吃，也可能让它两头都不够硬。因为，论开发者心智，它一时还难超过Claude Code和Codex；论极致性价比，又得直面DeepSeek、Kimi、智谱的持续挤压。

模型还在变强，差距却在变小。这场竞争最终拼的，是谁能在算力账本上撑得更久。谁能跑出来还没有答案，但接下来一定是一场谁都不敢松手的贴身肉搏。

*题图来源于豆包微信公众号截图。林鸣为化名。