Token吞噬世界,谁在执掌AI时代的核心“新物资”?

关注
AI产业的胜负手,藏在算力与Token里

目前,中国日均Token调用量已超过140万亿。庞大的Token洪流,折射出行业对更聪明、更高效智能的极致追求。每日在数据中心流转交互的万亿级Token,不仅是驱动大模型推理的刚需燃料,更是数字经济运转的血液。至此,AI的战争,已经从参数战场,转移到了Token工厂。

5月14日,杭州萧山,以「Token工厂」为主题的2026智算基础设施创新大会暨萧山区芯机社区产业生态共建交流会正式举行。会上,OWS Global创始人兼CEO、Web3.0协会副会长傅伟峰John Fu,围绕《算力筑基Token的原生:超算集群驱动AI产业的新范式》发表主题演讲,以下为嘉宾演讲实录,由创业邦整理。

19802219.jpg

大家好!在今年3月举办的英伟达GTC大会上,黄仁勋指出,转折点已经到来——AI已能从事生产性工作,AI市场最核心的转变正从“训练”全面走向“推理”。今天我的分享也将围绕算力、Token以及AI产业新范式展开。

AI产业的胜负手,藏在算力与Token里

现在业内流行一句话:算力即国力,Token即价值,AI即未来。自2023年ChatGPT引爆大模型浪潮以来,产业格局正在被重塑。一个关键变化是:算力和Token已成为AI的核心生产资料。算力是基础——DeepSeek、Minimax、Kimi等领先模型的背后,都依赖数万张高端GPU持续运转;Token则是血液——模型的训练、推理、应用服务,全都围绕它进行计费和交付。

然而,当前行业正面临着严峻的四大痛点:

算力获取困难且成本高昂。全球高端GPU供需严重失衡,2024年全球AI芯片需求增长超300%,但供给仅增长60%,导致高端GPU价格暴涨,中小企业技术创新门槛极大抬高。

算力利用效率极度低下。由于缺乏智能调度与精细化管理,行业内大模型企业的 GPU平均利用率仅在35%左右,这意味着近三分之二的珍贵算力处于闲置或低效状态,每年造成数十亿元人民币的巨大浪费。

Token价值释放严重不足。2024年全球Token生产和消费总量已达百万亿级,但其中真正产生商业价值的仅占30%左右,高达70%的Token潜在经济价值未被充分挖掘。

软硬件协同差导致系统效能低。硬件与软件各自为政,缺乏与之匹配的高效调度架构,导致硬件潜力无法完全释放。对中小企业而言,算力成本已占其技术支出的70%—80%,而其中因效率低下造成的实际浪费比例竟高达40%—50% 。

这四大痛点交织形成了恶性循环,成为拖累整个AI产业发展的核心桎梏。

软硬深度融合,打造智算时代的“肌肉与神经”

面对行业的恶性循环,单纯的硬件堆叠或单一的软件优化已无法解决根本问题。下一代智算基础设施必须具备高性能、高效、开放以及Token原生四大特征。我们不能再把Token当作算力的附属品,而必须将其作为系统设计的起点,围绕Token的生成、流转、消费和结算来构建全栈系统。

基于此,OWS的定位已从单纯的算力或硬件供应商,升级为全球领先的智算生态运营商,致力于覆盖从芯片、系统、硬件到上层应用的全链条,搭建开放协作的智算生态。为此,我们构建了紧密集成的全栈系统架构:

底层硬件基础设施:由自建的超大规模GPU集群构成,提供坚实的算力底座。

系统软件层:包含自主研发的集群管理系统、智能任务调度引擎和资源管理框架,确保硬件资源的高效利用。

应用使能层:不仅针对大模型训练框架与推理服务进行深度优化,更创新地覆盖了Token的生成引擎、存储管理、交易结算和质量评估,实现Token全生命周期的科学管理。

顶层接入层:通过标准化API接口,让上下游生态合作伙伴与客户能够便捷接入,快速构建业务应用。

在这种全栈架构中,硬件和软件不是分离的,而是深度融合、双向反馈的。这种软硬一体化的协同设计,打破了传统厂商各自为政的局限,确保每一层都在为提升整体系统效能服务,是应对大模型时代复杂挑战的必然技术趋势。

无法被复制的系统效能:全栈协同释放AI真正潜力

OWS依托三大核心竞争优势与两大联动业务,已在多个场景中实现了可落地的商业成功,为整个AI行业赋能:

首先,自研GPU超算集群的极致性能。我们不做算力转租,而是从零自主研发智算中心。目前已在海外部署超5万张高端GPU(包括英伟达H200、B300等),整体计算能力达100 EFLOPS。通过联合设计超高速、低延迟的网络架构,我们将 GPU间的数据交换延迟降至微秒级。更重要的是,凭借自主研发的智能任务调度引擎,我们能动态预测计算模式并预留资源,将GPU利用率从行业平均的35%大幅提升至80%左右。

第二,独创的AI Token工厂。作为大规模生产、处理和输出高质量Token的创新平台,Token工厂整合了互联网优质信息源、学术知识库及企业专业数据,支持生成代码、知识库等超100种多元化Token 。通过内部研发的AI质量评估系统,确保输出Token的多样性与代表性。同时,配合灵活的市场化交易机制,让企业既能低成本获取数据,也能将自身Token变现。目前,工厂每月处理的高质量Token已达千万级别,且成本远低于行业平均水平。

第三,软硬一体的协同护城河。我们在设计硬件集群时便预留了软件接口,而调度算法同样基于对硬件特性的深刻理解而开发。测试表明:在同等硬件配置下,我们的软硬一体化方案性能比业界高出30%左右。

第四,落地场景与商业案例。我们的全栈能力已广泛应用于大模型训练、高并发长上下文推理、多模态开发及细分领域专业模型的构建:

首先讲一个大模型训练案例。某头部互联网企业训练万亿参数大模型,由公有云切换至我们的方案后,训练成本从每月5000万降至2000万,节省了60%,且训练速度提升30%,年省近4亿元。

案例二,AI初创公司的模型优化。一家AI初创公司接入平台后,按需租用算力并结合我们的Token数据,成功训练了比原先大10倍的模型,模型效果提升 50% 并顺利获得了融资。

案例三,金融领域的专业模型。某金融机构利用我们私有化的金融AI工厂与调度系统,开发出风控准确率超98%的专业模型,每年为集团挽回数千万元的风险损失。

最后分享下我看到的3-5年AI产业发展四大趋势。

第一,模型越来越大,算力需求指数级增长。目前的大模型还只是起点。下一代超大模型参数量可能会达到百万亿级别,这意味着算力需求也会等比例增长。未来谁能提供这样规模的算力,谁就掌握了产业制高点。

第二,Token会真正成为生产要素和交易商品。现在Token更多是作为计费单元存在,但未来它会像电力一样成为经济的基础要素。会出现专门的Token交易市场、Token金融衍生品,甚至Token价格可能影响宏观经济。

第三,行业走向集中化。不是只有少数企业能生存,而是能够提供全栈解决方案的企业会获得竞争优势,因为软硬协同的优势会越来越明显。

第四,跨地域算力协作会成为常态。大规模训练可能同时调用不同国家、不同地区的算力资源,这需要全球化的协作框架和超高速网络。

AI产业的繁荣需要全生态的协作。我们致力于让每一份算力、每一个Token都有价值,并期待与芯片厂商、软件厂商、应用开发商、Token生态参与者及学术机构携手,共同驱动AI产业的新范式。

反馈
联系我们
推荐订阅