🍀小词元撬动智能经济大市场(大数据观察·智能经济新形态)😈

发布时间:2026-04-03 15:56:07 来源: 格隆汇

  

  人民日报记者 王云杉

  头条看点

  词元(Token),大模型处理信息的最小信息单元。我国日均词元调用量大幅增长,不仅折射智能经济的澎湃活力,也意味着一套新型商业逻辑正在加速演进。智能时代,有了可计量、可定价、可交易的词元,人工智能有望成为像水、电一样支撑社会运转的基础资源。

  用户端,查资料、写代码、改文案;企业端,金融风控、智能客服、代码修正……如今,人工智能应用落地的每一个场景,都离不开对词元(Token)的海量调用。

  词元,大模型处理信息的最小信息单元。今年3月,中国日均词元调用量突破140万亿,两年增长超千倍。怎么理解词元?词元和人工智能产业的关系是什么,未来发展趋势如何?记者进行了采访。

  词元调用量爆发性增长,背后是模型能力提升

  有人疑惑,词元和常见的数据有何不同?

  “人工智能大模型的本质是一套复杂的数学运算系统,它无法像人类一样直接读懂文字、听懂声音、看懂画面。”中国移动研究院网络与IT技术研究所副所长唐华斌说,人工智能大模型必须先将各类原始数据转化为自己能识别的“语言”,再通过运算输出结果,词元就是这套“语言”中最基础的单元。

  具体来看,文字词元像“乐高积木”,一个单词或一个汉字被拆成一块块词元;音频词元像“乐谱上的音符”,一段声音被切成极短的时间片段,每一片包含音调、音量;视频词元像“拼图碎片”,每一帧画面被切成一个个小方格,并且还要考虑时间上的连续性……

  “在大模型看来,三种模态的词元完全没有差别。在模型眼里,它不觉得自己是在读文字或看视频,它只觉得自己是在处理一串极其复杂的数字序列。”火山引擎智能算法负责人吴迪表示。

  一个个基础的词元,构成了智能经济运行的“细胞”。今年3月,中国人工智能大模型周词元调用量连续3周占据领先地位,成为全球大模型应用活跃度最高的国家之一。

  “词元调用量爆发性增长,最直接的原因是模型能力的提升。每一次模型能力的提升,就会解锁更多应用场景,从而使大模型词元调用量进一步激增。”吴迪介绍,以Seedance(豆包视频生成模型)2.0为例,生成1分钟视频大约会消耗超过100万个词元。

  同时,新的应用形态、新的商业模式,也会驱动大模型词元调用量大幅上涨。唐华斌表示,最近兴起的智能体和传统单轮问答不一样,它的运行往往意味着更长的上下文、更频繁的模型调用、更多轮次的任务拆解,以及工具执行过程中的持续反馈。

  “简单任务,如果只需要单轮或几轮工具调用就能搞定,消耗词元只需要几千;如果需要几十轮工具调用,则需要至少消耗几万词元乃至更多。”吴迪说,智能体等新业态的涌现,让词元调用量又进入了一个快速增长的通道。

  词元调用集中在信息密度高、迭代周期快的领域

  60亿,是爱问答科技创始人李加义过去一年的词元调用量。

  走进位于北京海淀区的AI原点社区,一间约16平方米的工作室里,李加义团队正在调试刚刚设计完成的AI玩具。

  “这个玩具要具备交互能力,离不开相应的软件系统。放在以前,同等体量的软件系统开发至少要半年,还得多人共同配合。”李加义说,在AI大模型与辅助编程的深度赋能下,消耗数亿词元,开发周期被压缩至两个月。

  2025年初,非计算机科班出身的李加义接触AI辅助编程工具后,借助新技术打破了软件开发的专业壁垒。“一年间,我们高效地完成了两款APP和一个AI玩具的开发设计。前不久,我们还将自研的AI硬件产品推向了国际消费电子展(CES)。”李加义说,AI助力不仅让开发成本大大降低,也让小微企业的创新探索有了更多可能。

  软件开发,是人工智能应用落地的典型场景之一。总体看,词元调用量的分布呈现出鲜明的行业与场景特征,主要集中在那些信息密度更高、产品迭代周期更快以及模型与生产系统之间联系更紧密的领域。

  以豆包大模型2.0为例,吴迪介绍,从行业分类看,互联网行业词元调用比例最高,消费电子、金融、新零售和商务服务紧随其后。

  从场景来看,非结构化信息的处理和分析占比最大;教育、内容创作和“搜索与推荐”次之。

  观察未来的发展趋势,软件开发、深度研究、个人助理等智能体应用场景或将成为词元调用量爆发的重要领域。“特别是软件开发,当前人工智能正从简单写代码转向理解整个项目,不仅能排查错漏、自动优化,甚至能通过智能体自主完成整个开发任务。代码上下文长、交互轮次多,企业为提升效率的付费意愿较强,这将成为一个巨大的需求增长点。”唐华斌说。

  词元可计量,人工智能有望成为社会运转基础资源

  “今年1月底以来,有的模型企业创下20天收入超越2025年全年总收入的业绩纪录。这组数字背后,是一套以词元计费为基础的新型商业逻辑正在加速演进。”国家数据局局长刘烈宏表示。

  回顾人工智能产业发展历程,过去一段时期,行业聚焦于模型性能的比拼,技术创新与商业落地之间缺乏可量化的衔接桥梁,难以形成“技术迭代—价值产出—持续投入”的良性循环。

  “词元本身具备可计量、锚定算力能耗、跨模态通用结算的特点,使其能够成为连接技术供给与商业需求的结算单位。打个比方,大模型输出的智能好比电,智算中心好比发电厂,电用千瓦时来计量,智能调用就用词元来计费。”联想中国基础设施业务群战略管理总监黄山表示,展望未来的智能社会,人工智能有望成为像水、电一样运转的基础资源,随取随用,用多少买多少。

  从词元的视角出发,打造智能经济新形态,我国有何优势?有哪些发展着力点?

  算法创新持续实现突破,国产大模型通过底层架构优化,与全球顶尖技术的代差逐渐缩小。吴迪说,我国的大模型厂商做了非常多的算法创新,在推理成本、响应速度上不断优化,能以更少的词元完成复杂任务。

  基础设施具备领先优势。每生成一个词元,都在调用数据中心的算力,伴随着电力消耗。我国已建成全球门类最全、规模最大的能源体系,电源足、电网强、市场活。唐华斌表示,我国发电供给持续提升、电力成本不断降低,能够有效降低词元调用成本。

  “能耗和算力是词元调用的两个关键成本。让每个词元用更少的算力和更少的能耗生产出来,体现的是智算中心等基础设施的生产能力和效率。”黄山表示,要构建起安全、高效、普惠的人工智能基础设施,持续提升大模型推理效率、降低单个词元成本,让人工智能最大程度走向规模化应用落地。 🐪