中文名确定!Token正式被译名为“词元”:我国日均调用量突破140万亿

点点百科 百科资讯 1

3月24日消息,国家数据局在官方公告中首次使用“词元”作为Token的标准译名,标志着这一术语在中文人工智能领域的正式确立。

国家数据局局长刘烈宏24日在国新办举行的新闻发布会上表示,到今年3月,我国日均词元(Token)调用量已超过140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,三个月时间又增长了40%多。

“日均词元调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段。”刘烈宏表示,人工智能应用场景在不断深化,从能对话到能决策执行的智能体,中国人工智能产业的竞争力在显著增强,现在备受关注的Token出海,就是产业竞争力增强的一个标志。

《人民日报》在2026年1月发布《漫谈词元》科普文章,将Token定义为“处理文本的最小数据单元”,苹果中国官网、央视新闻、中国计算机学会(CCF)等技术文档也统一使用“词元”。

怎么理解词元?简单来说,词元是人工智能大模型为了高效处理数据,把数据进行拆分后的“最小信息载体”,可以理解为“字/词片段/符号”等。

比如“我爱中国!”,可拆分成“我”“爱”“中国”“!”4个词元。

如果说互联网时代信息传输的核心度量是流量,那么人工智能时代,这一关键指标正变为词元。用户输入的每一个字,模型生成的每一段话、识别的每一幅图像,都在消耗词元。