AI市场将扩容10倍?多模态Agent需求逐步爆发,ai模块工作原理

21世纪经济报道记者 雷晨

自2023年大模型热潮席卷全球以来,中国科技巨头纷纷入局。在众多玩家中,字节跳动旗下的豆包大模型及其背后的技术平台火山引擎,走出了一条独特路径——不是简单地堆参数、刷榜单,而是以“模型即服务”(MaaS)为基座,向企业级应用和终端设备双向渗透,构建覆盖“云-管-端”的全栈AI能力体系。

截至2025年12月,豆包大模型日均Tokens使用量已突破50万亿,位居中国第一、全球第三;超过100家企业在其平台上累计调用量超一万亿Tokens。这一数据背后,是一场持续两年、从技术演进到商业落地的系统性布局。

豆包大模型的发展轨迹,映射出中国大模型产业从狂热探索走向务实落地的整体趋势。

早期(约2023年),豆包大模型通过字节旗下的AI对话助手“豆包”推向市场,其核心任务是验证技术可行性,并快速集成到抖音、今日头条等字节系产品中,通过海量用户场景打磨基础能力。此时的豆包大模型,是“嵌入”既有生态的工具,目标是在自然语言理解与生成能力上尽快缩短与国际顶尖模型的差距。

进入2024年,随着“百模大战”白热化,单纯比拼参数或测评分数已不足以构建长期壁垒。火山引擎敏锐意识到,未来的竞争关键在于如何让模型“好用、用得起”,并深入企业核心业务流程。

于是,火山引擎的战略重心开始向两个方向倾斜:一是模型能力的深度拓展,坚定迈向多模态。例如,Seed系列模型持续迭代,单次视频理解帧数从640帧跃升至1280帧,并针对安全巡检、产品质检等工业场景优化视频运动分析与复杂空间推理能力。

二是服务模式的范式创新,率先推出“按输入长度区间定价”“智能模型路由”等策略,直击企业“模型调用成本不可控”的痛点,将大模型从“奢侈品”变为可按需取用的“标准品”。

在2025年冬季的FORCE原动力大会上,火山引擎总裁谭待正式提出“以模型为中心的AI云原生架构”,并发布豆包大模型1.8、视频生成模型Seedance1.5Pro,以及AgentKit、HiAgent“1+N+X”体系等一系列支撑智能体(Agent)规模化落地的基础设施。其技术叙事已从“拥有一个强大的模型”,升级为“提供一整套让任何企业都能高效、经济地部署和管理自己AI智能体的架构与方法论”。

“模型之间最重要的还不是竞争,模型最重要的是把市场能做大。”谭待在会后群访中表示,“明年这个市场还要再涨10倍,大家看的就不是存量的竞争,而是说大家一起把这个市场做大。”这种格局,使其技术布局更具前瞻性。例如,新发布的AgentKit平台,将Agent的开发、部署、运维、管控标准化,据称可使代码量减少96%;而HiAgent的“1+N+X”体系,则试图定义企业AI组织形态,推动Agent从零星实验走向大规模生产运营。这些举措显示,火山引擎正试图成为AI时代新IT架构的核心定义者。

与许多从零开始的AI公司不同,火山引擎拥有字节跳动全系产品的“内需市场”作为得天独厚的试验田。抖音、豆包的音视频内容理解与创作需求,飞书的办公协同场景,以及电商、游戏等业务的客服与营销需求,为豆包模型提供了丰富、复杂且真实的训练场。这使得其模型迭代从一开始就带有强烈的应用导向和场景驱动特征。

在稳固内部基本盘后,火山引擎以B2B模式,将豆包能力通过云服务向外输出,市场策略精准地瞄准了智能化需求迫切、支付能力强、且具有标杆效应的行业。

据公开资料,火山引擎已服务超过八成的系统重要性银行和主流券商,在金融行业提供智能投顾、投研、合规等核心应用;在汽车行业,覆盖九成主流车企,从智能座舱的语音交互到自动驾驶的数据标注、仿真测试,全面渗透汽车智能化全流程;在教育领域,与超过七成的985高校合作,切入教学、科研、管理等场景。

这种聚焦高价值行业的“纵深”策略,构建了一个强大的正向循环:通过服务各行业头部客户,获取最前沿、最复杂的产业需求与场景数据,这些数据反哺模型优化,使其更“懂行业”;更懂行业的模型又吸引更多客户,并推动他们在更深的业务流程中使用AI,从而产生更多数据与需求。

谭待指出:“有的行业起量特别快,但是天花板低……有的行业是起量特别慢,但是天花板很高。”他举例称,一个董事长一天可能只问一次“明年什么行业更好”,但回答好这个问题,Agent背后可能要执行几个小时,产生几百亿Tokens的消耗。他认为,模型最大的价值在于“更好的帮人成长,教育、医疗,做新的科研”,这些领域的天花板极高。

谭待透露:“云时代的企业客户和个人客户大概是8.5比1.5,现在AI时代可能是7.5比2.5,我觉得可能未来个人开发者占比还会再高一点。”

据悉,火山引擎推出的“AI节省计划”,通过阶梯式折扣最高可节省47%的使用成本,正是为了进一步降低AI规模化应用的门槛,加速这一正向循环。


nginx