AI算力领域的新锐企业北京容芯致远科技有限公司(简称“容芯致远”),于近期完成了由云岫资本领投的数千万元种子轮融资。本次融资资金将主要用于容芯致远智算新品的研发及量产交付,加速AI计算架构与国产芯片技术的深度融合。云岫资本也将持续为容芯致远在产业发展、资源对接与后续融资等方面服务。
容芯致远专注于计算机体系结构的创新与设计,致力于成为中国AI领域的SuperMicro。紧抓国家信创和AI Infra两大产业发展机遇,容芯致远凭借在“数据加速技术”领域的深厚积累与核心优势,创新GPU体系结构,优化国产服务器数据处理,满足高并发生产应用运行需求,实现客户IT资源效率的最大化。
打破“不可能三角”:以AGC架构重构AI基础设施
大模型带来了巨大的AI算力需求,同时也对传统以CPU为中心的计算机架构(ACC)提出了前所未有的挑战。
在高性能计算(HPC)、大模型训练/推理等场景应用中,GPU相比CPU,作为核心加速计算部件,具有功耗更高、运行温度更高、故障率更高的“三高”特征,对GPU算力的生产级可用性、运维便捷性、使用寿命中构成了重大挑战。有数据表明,某国外著名GPU在非7*24小时使用情况下的故障率为1-3%,在高负荷场景下故障率高达5-8%。长期高温高能耗状态的GPU平均寿命仅有1-3年,这对普通架构智算整机而言,单卡故障会直接导致整机停止服务,恢复时间需2小时以上。所以,更高效地支撑AI时代MOE模型训练推理,需要对计算机体系结构进行变革。
面对大模型浪潮下传统CPU中心架构(ACC)的效能瓶颈,容芯致远于2024年成立之初就提出全球首创AGC智算架构——以GPU为核心重构计算机系统,突破传统AI计算中“成本、效率、灵活性难以兼得”的行业困局,实现GPU热插拔、GPU-RAID高可用、GPU节能延寿等三大技术突破,让GPU发挥更大算力效率,同时更具成本优势和灵活的适应性。
目前,容芯致远的AGC智算产品已适配主流国产GPU,包括天数智芯、寒武纪、燧原、登临科技、墨芯、沐曦、希姆、海光DCU、摩尔线程等,同时也适配了DeepSeek、文心一言、Llama、Qwen、ChatGLM等主流大模型。
产品矩阵:覆盖端侧推理到千亿级训练的全场景算力
基于AGC架构,容芯致远推出了通算+智算双线产品,构建从数据处理加速到超大规模模型训练的全栈能力。
在智算产品线方面,旗舰机型K20支持20卡GPU集群,通过张量并行优化技术实现DeepSeek 671B全量模型单机满血运行,大幅降低硬件投入与运维复杂度,适配多种主流开源大模型。场景化产品K2采用双卡静音设计,搭载预置推理环境并支持RAG检索,为企业提供即用型AI算力终端。
通算产品线方面则作为数据加速引擎,采用了硬件级安全加速技术,通过独立双阵列RAID保护与I/O卸载技术,提升CPU服务器数据读写性能超3倍。该产品线支持全栈国产技术路线,可灵活选配数据加速单元以适配不同场景需求。
战略布局:技术-生态双轮驱动国产算力突围
容芯致远凭借信创国产化与AI Infra升级机遇,构建起三大核心壁垒:技术纵深上,深度优化计算机体系结构并结合自研推理框架,突破国产GPU集群效率难题;生态联盟方面,携手合作伙伴共建RISC-V开源生态,推动端边云协同算力网络落地;成本重构则通过架构创新替代硬件堆叠,助力客户实现IT资源利用率最大化。
5月9日,容芯致远联合中国开放指令生态(RISC-V)联盟在北京宣布成立RISC-V国产智算体系结构创新专业组,现场300多人参与会议。容芯致远一举发布5款采用AGC架构设计的智算新品,从支持双卡到支持20卡不等,成为全球首家单机全面适配DeepSeek各模型尺寸产品的企业。
容芯致远CEO 王成江表示:“云岫团队因其在AI领域架构技术的深厚积累与前瞻性洞见,成为本轮融资顺利落地的重要支撑。作为公司种子轮战略股东,云岫不仅通过产业资源整合助力构建垂直生态系统,更持续输出专业战略指导与运营方法论,为企业在技术迭代、商业化路径及市场布局等维度注入发展动能,夯实面向未来竞争的长期价值基础。”
云岫资本创始合伙人兼CEO高超表示:“容芯致远团队在体系结构层面的颠覆性创新,直击AI算力成本与效率痛点。AGC架构展现的“单机跑deepseek全量模型”能力,有望成为国产算力“ 换道超车”的关键支点。期待容芯致远在在AI算力领域的持续创新与突破,能够为我国乃至全球的人工智能发展贡献更多力量。”