中国算力,雄心与软肋

2023-05-05
​中国算力产业正在进入新一轮发展周期

编者按:本文来自微信公众号财经十一人(ID:caijingEleven),作者吴俊宇,创业邦经授权转载。

中国算力产业正在进入新一轮发展周期,有两个变量将影响中国企业的全球竞争力。

一是去年全面启动的“东数西算”政策。2022年2月,国家发改委、工信部等部门联合印发通知,同意在京津冀、长三角等八地启动建设国家算力枢纽节点,并规划十个国家数据中心集群。全国一体化大数据中心体系完成总体布局。中国将形成一体化的新型算力网络体系。

二是AI(人工智能)让智能算力需求爆发。2022年12月,微软投资的创业公司OpenAI推出了对话AI ChatGPT。这是大模型、AI计算在语言领域的运用。智能计算正在重塑云、软件、芯片产业,还在影响其他产业的智能化转型。百度、阿里、华为、腾讯等中国科技公司正在储备智能算力资源,推出面向企业客户的大模型。创业公司、风险资本也在快速涌入。

数字经济时代,算力无处不在。以芯片、服务器、云计算提供商为主的市场主体,共同构成算力产业的大图景。

中国算力产业的雄心有两面,一是建成一体化算力网络体系,二是算力全产业链自主可控。前者目的是让算力像水电一样便宜简单易用,后者希望中国企业在国际产业链占据主动权。

中国拥有算力资源的两大主力军分别是国资背景的三大电信运营商(中国移动、中国电信、中国联通)、民营背景的几大科技公司(阿里、腾讯、华为、百度)。两大主力军背后,是一条包括设备服务商、芯片供应商、芯片制造商的庞大算力产业链。

电信运营商承担构建“一体化算力网络体系”任务,还要反哺国产芯片产业链。劣势是过去习惯卖资源,研发支出不足。科技公司作为市场主体,优势是研发强度高,紧跟国际技术变革。问题是无法完全承担政策任务。

AI爆发让全球算力大盘中的智能算力占比提升,通用算力占比下滑。中国通用算力规模虽大,智能算力却相对不足。

如果按照市场发展规律,此时各方需要加大智能算力投入,但科技公司资本支出在下滑,电信运营商还在大力投入通用算力。中国七朵云(阿里云、华为云、腾讯云、百度云、天翼云、移动云、联通云)竞争加剧,不断亏损,市场变得更割裂。

另一个矛盾是,中国三大电信运营商和科技公司对算力网络如何落地存在分歧。电信运营商掀起了通用算力资源的军备竞赛,提出要建成全国算力网。科技公司主张尊重供需现状,通过市场规律促进合理竞争。

中国企业还面临芯片“卡脖子”的境遇。2022年8月美国商务部工业安全局对中国禁售目前全球性能最强的数据中心GPU,限制中国AI能力。从中国企业大模型和微软的差距看,遏制手段已经生效。

多位接受《财经十一人》访问的云计算产业人士共同看法是,中国算力产业链中,电信运营商、民营科技公司都不可或缺,产业发展的要害是市场化和公平竞争。如果力量分散且失衡,中国算力产业会在关键时刻被拉开差距。

谁掌握了中国算力?

算力资源的直接提供者通常是云厂商和电信运营商,近些年设备服务商也在扩展上下游服务能力,直接向市场提供算力

中国在国家战略层面重视算力的原因是,它是数字经济的底座,和高铁、5G一样会拉动国民经济。

第三方数据分析机构IDC在《2021-2022全球计算力指数评估报告》中分析了包括美国、中国等15个重点国家,得出结论:算力指数(根据计算能力、计算效率、应用水平、基础设施等指标测算)平均每提高1个点,国家数字经济和GDP(国内生产总值)将分别增长3.5‰和1.8‰。

图片

算力分成三类,分别是通用算力、智能算力、超级计算。AI进入新发展周期,大模型爆发,让芯片(CPU中央处理器、GPU图形处理器、ASIC应用型专用芯片、FPGA现场可编程门阵列)需求结构出现变化。算力大盘虽然在增长,但CPU主导的通用算力占比下降,GPU主导的智能算力占比逐渐增长。大量AI芯片也在诞生。如通过FPGA或ASIC架构定制而成的NPU(神经网络处理器)、DPU(深度学习处理器)。目前GPU在AI芯片市场占比约为90%。

中国算力目前的情况是,如果不分通用算力、智能算力和超级算力,中国算力绝对规模不低。算力总量目前位居全球第二,仅次于美国。

工信部数据显示,截至2022年6月中国算力总规模超过150EFlops(算力的衡量单位是EFlops,指每秒浮点运算次数,是Floating Point Operations Per Second缩写)。其中服务器规模约2000万台,数据中心机架总规模超过590万。

中国信通院《中国算力白皮书(2022)》按照服务器算力总量估算(年服务器出货规模×当年服务器平均算力)称,全球算力规模美国占比34%,中国占比33%,欧洲占比14%,日本占比5%,其他国家或地区占比14%。

掌握中国算力资源的主要有四股势力:阿里、华为、腾讯、百度等科技公司;中国电信、中国移动、中国联通等电信运营商;光环新网、万国数据、世纪互联等数据中心服务商;地方政府“国资云”项目、大数据产业园,政府、金融机构与其他企业自建机房。

服务器规模是统计算力的直观指标之一。服务器数量越多,通常算力资源也就越多。国际数据公司IDC的一位中国分析师对《财经十一人》表示,从服务器采购量占比来看,互联网云厂商等科技公司占比约40%,电信运营商占比超过15%,数据中心服务商、地方大数据产业园以及其他IT服务公司占比约10%。其余35%为政府或企业自用,其中金融行业占比最大,在服务器大盘中占接近10%。

算力生态大致分成四层蛋糕:云计算厂商为企业提供算力服务;设备厂商为云厂商提供服务器;芯片供应商向服务器厂商销售芯片;芯片制造商为芯片供应商做代工。

在算力上下游产业链中,直接为企业提供算力服务的通常是云厂商。云厂商从设备厂商手中采购服务器等,从数据中心服务商手中租赁机房,对外租售公有云算力。全球市场目前只有美国和中国形成了规模化的云厂商。最典型的是美国三大云厂商(亚马逊AWS、微软Azure、谷歌云)、中国四大科技公司的云业务(阿里云、腾讯云、华为云、百度云)以及三大电信运营商云(移动云、天翼云、联通云)。

国际市场上,美国科技公司占据了主要份额。第三方市场调研机构Synergy Research最新数据显示,2022年三季度全球云计算基础设施(公有云IaaS+PaaS以及托管私有云)市场前四强分别是亚马逊AWS(34%)、微软Azure(21%)、谷歌云(11%)、阿里云(5%)。科技公司和电信运营商是中国云市场的主流。IDC今年4月数据显示,2022年下半年中国公有云(IaaS+PaaS)市场前五强分别为阿里云(31.9%)、华为云(12.1%)、天翼云(10.3%)、腾讯云(9.9%)、亚马逊AWS(8.6%)。

科技公司、电信运营商身后是设备厂商。它们向云厂商销售服务器等硬件。但这个市场天然是融合打通的,这些年来,设备服务商正在向上下游扩展,为数字化市场提供ICT整体解决方案。这主要取决于两个因素:一是设备服务商经过多年积累普遍实力雄厚客户稳定;二是它们做“全栈”服务是逐步推进的,这些年的市场环境给予它们充足的转型升级时间窗口。国际设备厂商包括戴尔、HPE等,国内设备厂商包括浪潮、新华三、超聚变、中兴、联想等。

服务器设备制造环节,中国不输国际企业。全球出货规模排名前四强,长期被戴尔、浪潮、HPE、联想占据。中国市场本土企业也占据主要份额。IDC今年3月发布的《2022年中国服务器市场跟踪报告》显示,2022年中国服务器市场规模约为273亿美元(约合1888亿元人民币),同比增长9.1%。出货量前五强分别是浪潮(28.1%)、新华三(17.2%)、超聚变(10.1%)、宁畅(6.2%)、中兴(5.3%)。

服务器厂商需要从芯片供应商的手中采购CPU、GPU芯片。这是中国本土产业链的薄弱环节。国产CPU目前处于起步阶段,与国际厂商差距巨大。国产GPU尚处萌芽期,与国际厂商差距更大。

提供通用算力的全球服务器CPU市场被英特尔、AMD垄断。国产服务器CPU包括阿里的倚天、华为的鲲鹏,以及“中科系”(中科院计算技术研究所持股企业)的海光和龙芯。国产CPU在全球市场份额不足2%,在中国市场份额不足8%。

提供智能算力的全球服务器GPU市场主要被英伟达垄断。市场研究机构Jon Peddie Research数据显示,截至2022年四季度,英伟达在全球GPU市场份额为82%,英特尔为9%,AMD为9%。中国本土产业链有壁仞科技、摩尔线程、寒武纪等创业公司,市场份额可忽略不计。

无论是CPU还是GPU,都需要芯片制造厂商负责代工。这是中国本土产业链目前相对薄弱的环节,也是中美战略博弈的关键领域。

中国台湾地区的台积电、韩国的三星占据全球芯片代工市场70%以上的份额。服务器芯片领域,英特尔芯片由自己生产,极少数芯片设计企业选择三星代工,其他几乎均由台积电生产。如全球最大的GPU厂商英伟达就由台积电代工。台积电主导了14nm以下先进工艺芯片代工,在7nm/5nm市场几乎垄断,可量产最先进工艺为3nm。

中国大陆地区的中芯国际全球市场份额仅5%,初步实现14nm制程工艺量产,被认为落后台积电工艺五年左右。

图片

西部云基地内,由中国联通建设的国家(中卫)新型互联网交换中心机房。图/新华

中国本土企业的另一个压力是在全球算力产业链的价值分配中处于劣势。本土企业目前暂时缺少足够的利润实现良性循环。云计算、设备制造环节,玩家多、竞争激烈且“内卷”。芯片供应、芯片制造环节,玩家少、底子薄,长期技术落后。

云计算服务原本是算力产业链利润最丰厚的部分。中国在技术需求、市场发展有自己的节奏,目前的节奏是,云厂商竞争激烈,暂时普遍亏损。美国三朵云(亚马逊AWS、微软智能云、谷歌云)2022年掌握全球66%市场份额,营业利润总和超3700亿元。中国七朵云全球份额低于20%,七朵云均在战略亏损,2022年营业亏损总和超百亿元。

设备制造是中国大陆本土企业与国际企业差距最小的环节。美国、日本五家企业2022年掌握了全球30%的市场份额,五家企业基础设施业务营业利润总和约为850亿元。中国六家企业全球市场份额占比约为25%,六家企业基础设施业务营业利润总和不足100亿元。

芯片供应是中国企业与国际一流企业目前差距最大的环节。美国、日本四家企业2022年在数据中心CPU(中央处理器)、GPU(图形处理器)两大芯片市场均占据超过95%的市场份额,营业利润总和超600亿元。中国企业目前在两大市场的份额均不足5%,仍需长期投入,短期无法盈利。

芯片制造是算力产业链中,利润规模仅次于云计算的板块。台积电掌握了全球服务器芯片代工的主要利润。2022年台积电数据中心业务营收占比41%,超越手机成为最大收入来源。按比例计算,数据中心业务营业利润高达1000亿元。中国大陆的中芯国际未公布数据中心业务占比,公司全年营业利润148亿元。

两场军备竞赛

两场军备竞赛客观促成了设备市场快速增长,但对于中国算力的强壮有多大裨益,还需要观察

两场军备竞赛客观促成了设备市场快速增长,但对于中国算力的强壮有多大裨益,还需要观察

中国算力产业链正在悄然发起两场“军备竞赛”。一场由三大电信运营商主导的通用算力竞赛,比的是资源投入。另一场是美国科技公司引发的智能算力竞赛,比的是技术能力、资源投入。两场“军备竞赛”客观促成了算力制造市场的新一轮快速增长。

“东数西算”政策背景下,三大电信运营商正在国内掀起算力资源的“军备竞赛”。

东数西算目的是优化资源配置,提升资源使用效率,形成一体化的算力网络体系。决策层从顶层设计出发,希望推动算力资源有序向西转移,解决算力供需失衡问题。由于中国算力、网络调度是两个分离的体系,政策方还提出了“算网融合”设想。东数西算、算网融合被视为将为数字经济建好基础设施。

中国信通院是工信部下属科研机构,长期负责行业发展的重大战略、规划、政策、标准研究。中国信通院云计算与大数据研究所所长何宝宏对《财经十一人》表示,算力资源、网络资源统一调度主要通过“算网融合”实现。全球算力产业竞争日趋激烈,算力是国家综合国力的体现。随着全国一体化算力网络体系逐步形成,未来算力网络会像通信、电力等行业一样,通过资源统一调度,最终实现随用随取。

三大电信运营商运营着中国的通信网络,还掌握了中国50%以上的数据中心资源。作为“国家队”,电信运营商成为落实东数西算的主力,也在尝试推动算网融合的落地。

2021年开始,电信运营商资本支出重点逐渐从5G转向算力——大规模采购服务器、建设数据中心。2022年中国移动、中国电信、中国联通算力资本支出大幅增长,分别为335亿元、271亿元、121亿元,合计727亿元。2023年增长至452亿元、290亿元、149亿元,合计增长22.6%至891亿元。

庞大的算力资本支出为电信运营商带来了不输于科技公司的算力资源。《财经十一人》此前多方了解到,阿里、腾讯、字节跳动等互联网厂商每年服务器采购量约为20万台。目前,中国移动、中国电信服务器采购规模也已经达到了这一规模。三大电信运营商招投标官网公开信息显示,中国移动2021年-2022年服务器集中采购规模约21万台。中国电信2022年-2023年服务器集中采购项目总规模超20万台。中国联通2022年通用服务器集中采购项目规模合计约5.6万台。

在与科技公司的竞争中,电信运营商主导着云网资源,还分配政企大单,同时具备网络优势、成本优势、政策优势。

电信运营商掌握了全国网络资源,及超过50%的数据中心机房。科技云厂商通常大量租赁电信运营商的IDC机房,向电信运营商支付网络带宽费用。

电信运营商还在分配政企数字化大单。2021年后政企数字化转型加速。一些政府、国企考虑到安全可信等因素,偏向让电信运营商成为项目总包商。科技云厂商考虑到项目管理成本往后退。电信运营商取代科技云厂商成为更多政企项目的总包商。

启信宝“全国招投标信息”系统统计了一年来全国公示的超1亿元的政企数字化大单,《财经十一人》查阅后发现,其中中国移动230个、中国电信175个、中国联通12个、阿里云3个、腾讯云4个(不完全统计,大量政府采购项目未公示,只包含已公开部分)。

电信运营商云业务和科技云厂商的营收、份额差距正在缩小。2022年主要云计算服务商的营收规模分别是:阿里云776亿元、天翼云579亿元、华为云453亿元、移动云412亿元、联通云361亿元、百度云177亿元,腾讯未公布云业务的营收规模。2022年三大运营商增速普遍超过100%,科技云厂商普遍低于10%。

《财经十一人》了解到,2023年中国电信旗下天翼云2023年营收增长目标仍是100%。中国电信相关人士此前向《财经十一人》预测,按照这个势头,天翼云2023年营收将超过1000亿元,名义营收将超过阿里云,成为国内规模最大的云厂商。有行业人士称,和科技云厂商相比,运营商云增长偏粗放,网络业务、集成项目占比高,收入质量有待提升。

在大模型技术爆发背景下,微软为首的美国科技公司在全球掀起了智能算力的军备竞赛,战火也烧到了中国。

微软是新技术最大受益者。企业客户通过微软的公有云Azure租赁GPU算力,调用大模型输入数据训练自己的小模型改造业务。美国市场,微软的大模型有200多家客户。

微软云2022年营收1012亿美元,同比增长26.5%。其中智能云(云、企业服务)营收818亿美元,同比增长21.1%;生产力与业务流程(企业软件,如Teams、Power Platform、Dynamic 365等)营收194亿美元,同比增长59.0%。AI计算(Azure Machine Learning,简称Azure ML)收入虽合并在智能云中,但连续四个季度营收增速超过100%。

和外界感知所不同的是,这轮技术升级中国公司并非仓促应战。中国科技公司如阿里、华为、百度和腾讯其实2019年就开始了智能计算和大模型研究。

智算资源部署方面,阿里云2022年在河北张北、内蒙古乌兰察布启用了两座智算中心,为小鹏汽车等客户提供智能计算服务。百度在山西阳泉、江苏盐城、湖北宜昌建成了三座智算中心,用于自动驾驶训练或服务区域政府数字大脑、制造企业智能化。

应用方面,ChatGPT引爆大众市场后,百度和阿里分别对外发布了文心一言、通义千问两款类似产品,但囿于昂贵的智能算力成本,和ChatGPT不同,它们主要针对行业市场定向推广,而非面向公众。《财经十一人》得到的未经证实的信息是,包括字节跳动在内的另一批大型科技公司也在布局类似产品。

由于算力、算法、数据和微软存在差距,中国大模型应用产品的效果仍待改进。电信运营商从商业模式和基因等情况出发,目前在大模型领域几乎没有动作。

百度智能云产品委员会联席主席宋飞今年3月对《财经十一人》表示,百度较早就开始了大模型落地尝试。目前在自动驾驶算法训练、金融机构反欺诈、工厂AI质检、能源企业线路检修等场景中都有案例实践。阿里云CTO(首席技术官)周靖人今年4月对《财经十一人》表示,阿里云期望大模型能更多通过公共云模式服务客户。即使企业专属模型也希望围绕公共云提供。这会带来更好的训练效果、更低的计算成本。

有云计算技术人士评价,中国企业中,华为、阿里、腾讯、字节跳动、百度都有云业务,理论上有跑通大模型商业化的入场券。阿里云目前云市场份额第一,智能算力资源相对充足,看起来最有条件。腾讯、百度、字节跳动有云、有数据,但云在亏损,这考验资金储备、战略意志。华为有云,但因被美国政府制裁无法获得英伟达GPU芯片。电信运营商有云和资金,却缺少智算资源、技术积淀。

ChatGPT只是智能算力蓬勃发展的表象之一,实质是全球算力产业智能算力占比逐渐扩张,通用算力占比下降。智能计算投入成本、技术门槛更高。一家管理咨询公司技术战略合伙人对《财经十一人》表示,决定AI大模型和智算能力的因素是三个,算力、算法、数据。一家公司在各环节投资规模合计可能高达数百亿元。

比如,微软云上部署了数万枚英伟达的A100(1万美元/枚)、H100(3.6万美元/枚)高性能GPU芯片。仅看算力成本,英特尔服务器CPU芯片单枚价格约2000元-1万元。英伟达服务器GPU价格约2万元-10万元。这意味着智能算力成本是通用算力的10倍以上。

此时中国公司出现了一组矛盾:

  • 科技公司技术基础好、研发支出高,原本最有条件发展智能计算,但资本支出却在下滑。科技公司的资本支出通常用于采购服务器、建数据中心、购置园区土地等固定资产。这意味着智算业务投入会受到限制。

  • 电信运营商资本支出高,扩大算力投入意愿强。但目前大部分投入都集中于通用算力。由于研发支出低,缺少技术积淀,智算资源也不足。电信运营商面对智能算力浪潮时,反应迟缓。

美国科技公司资源、技术并重,资本支出、研发支出营收占比长期超过10%。2022年亚马逊和微软的研发支出分别为5099亿元、1807亿元。亚马逊、微软2022年资本支出4062亿元、1970亿元,其中超过50%用于投资云基础设施。这也意味着两家公司算力支出超过2000亿元、1000亿元。

和亚马逊、微软、谷歌等国际厂商相比,阿里、腾讯、百度资本支出的营收占比均低于10%,2022年的资本支出占比、支出规模相较2021年还在下滑。

中国移动、中国电信、中国联通,资本支出营收占比长期在20%左右。其算力开支主要用于采购通用算力。三大电信运营商研发强度长期偏低,营收占比仅3%左右。2022年三家企业研发支出增速分别达到17.0%、40.0%、40.4%,增速均达到了历史高点,但研发强度提升仍需时间。

一位资深通信技术人士分析,电信运营商研发支出占比低的成因是研发需求很低。通信产业长期分工明确。华为、中兴等设备制造商负责研发,中国移动、中国电信、中国电信购买电信设备负责运营。

不过,电信运营商在强化云业务,且并不甘心做“云基础服务管道商”。长期来看,电信运营商研发力度会逐渐加强。中国电信相关人士对《财经十一人》称,天翼云内部有多个研发团队,在算力网络、AI核心能力等领域投入研发。

微软、亚马逊的云业务利润规模可观,大模型有成熟商业路径。此时巨额资本支出、研发支出顺其自然,可以形成良性循环。反观国内,算力资源、技术关键投入期,中国公司尚未走上正循环。云业务普遍亏损,大模型会让亏损加剧,如果没有更好的策略,中国公司在智能算力领域的差距可能会被拉大。

但电信运营商、科技公司掀起的两场军备竞赛客观促成了设备市场快速增长。浪潮、新华三、超聚变、中兴、联想等ICT设备厂商是直接受益者。设备厂商还在向软件、服务纵向拓展,获取更大的市场空间。

东数西算政策引导下,电信运营商大规模建设算力基础设施,地方政府大规模建大数据产业园、地方国资云。服务器、数据中心、网络设备需求爆发。IDC今年1月发布的《2022年上半年中国服务器市场份额》报告显示,2022年上半年中国服务器市场规模135亿美元,同比增长18.4%。

中国数字化市场的云转型尚处中前期。这导致中国IT消费结构和全球不同,特点是硬件大于软件。政府、金融机构、央国企等IT支出主力军习惯通过设备服务商采购硬件部署私有云,获得定制软件和贴身服务。十年前,华为企业BG用“全栈式ICT解决方案服务商”的策略打开了中国市场。如今浪潮、新华三、超聚变、中兴、联想等企业也在沿着这条路前行。

Gartner在2021年2月数据显示,中国IT支出大盘中,包括云在内的软件占比仅为14%,数据中心、硬件设备为代表的硬件占比高达40%。阿里云今年4月公布数据称,中国IT市场云计算渗透率不到15%,数据中心CPU利用率仅为10%左右。

设备厂商虽然被认为云技术积淀不如云厂商,但中国市场的客观现状使得设备厂商政企业务(硬件+软件+服务)整体营收、利润并不逊色于云厂商。2022年,浪潮、新华三、中兴、联想营收分别为695亿元、498亿元、136亿元、620亿元。几家企业均保持正向利润,而非像云厂商长期亏损。

2020年-2022年,浪潮、超聚变借助电信运营商大规模服务器集中采购的机会,频频中标大单。浪潮作为山东国资委控股的企业,主导了山东省的政企数字化建设。

中兴在2022年组建了东数西算特战队。中兴东数西算战队总经理聂胜军对《财经十一人》表示,过去设备制造商习惯简单销售硬件,但客户对产品、方案、流程、商务需求在变化。特战队这种创新组织形式,是提高内外效率的管道。特战队对外收集政府、互联网、金融等不同行业客户的需求,对内整合公司内部产品、技术资源,融合打包为客户交付解决方案。中兴2022年报显示,政企业务营业收入同比增长12%,主要是服务器收入同比增长所致。

科技公司大规模采购AI芯片、建设智算中心,这让设备服务商找到了新的营收、利润增长点。IDC中国分析师对《财经十一人》表示,预计2022年中国服务器出货量为380万台,AI服务器出货量超过25万台,占比6.5%。由于AI芯片昂贵,AI服务器支出占市场总支出的20%。AI服务器芯片内部,GPU是主流,增速超过20%。NPU等其他AI芯片占比低,增速超过100%。IDC在2021年曾预测,2025年中国AI服务器市场规模将达到702亿元,占整体服务器市场近三成。

新华三集团副总裁、计算存储产品线总裁徐润安今年3月接受《财经十一人》采访时表示,智能算力占比变大原因是,x86架构CPU单核性能强、通用性好。但AI场景需要多核、高并发、高带宽芯片。综合考虑成本、效率,GPU、DPU、NPU通常表现更好。CPU部分职能被其他专用芯片分担。在他看来,大模型会带来巨大的智能算力消耗。科技公司军备竞赛时,新华三可以为其建设基础设施,这也是第一轮市场红利。

面对中国市场需求快速增长,联想在去年底快速调整产品策略,适应中国市场服务器定制问题。联想还希望覆盖硬件、软件、服务,成为数字化全栈企业。联想集团执行副总裁兼中国区总裁刘军近日宣布,成立电信、金融、政府、制造、教育、互联网、重点行业七大行业纵队,深度进入智能产品、智能基础设施、方案服务三大市场。

芯片软肋下的共识

考虑到政治风险,国产芯片自研、自用之路一步都不能省,哪怕初期不经济也要有耐心长期坚持

考虑到政治风险,国产芯片自研、自用之路一步都不能省,哪怕初期不经济也要有耐心长期坚持

芯片供应、芯片代工两个环节,是中国本土算力产业链的软肋。政府、企业的共识是谋求自主可控。

芯片设计方面,全球服务器CPU市场分成两个阵营,分别是英特尔x86架构和Arm公司的Arm架构。市场调研机构Omdia数据显示,截至2022年二季度,x86服务器芯片占据全球92.2%份额,Arm服务器芯片占据了7.1%份额。x86服务器芯片主要生产企业包括英特尔和AMD,两者在全球市场分别占据69.5%和22.7%的份额。阿里倚天、华为鲲鹏等中国企业设计的服务器CPU采用了Arm架构。

英伟达全球GPU市场份额为82%,英特尔为9%,AMD为9%。中国本土GPU厂商包括壁仞科技、摩尔线程、寒武纪等,市场份额目前可忽略不计。

英伟达在数据中心GPU市场占据超过90%以上的份额。英伟达A100芯片2020年上市,专用于自动驾驶、高端制造、医疗制药等AI推理或训练场景。2022年英伟达推出了性能更强的新一代产品H100。A100/H100是目前性能最强的数据中心专用GPU,市面上几乎没有可规模替代的方案。包括特斯拉、Facebook在内,都利用A100芯片组建了AI计算集群,采购规模已经超过10000枚。

芯片制造方面,全球先进制程(14nm以下)芯片代工被中国台湾地区的台积电统治。台积电目前超过40%的收入由数据中心芯片代工贡献。最先进的服务器GPU英伟达A00/H100,分别采用7nm/4nm工艺。阿里设计的服务器CPU倚天710采用5nm工艺。华为设计的服务器CPU鲲鹏920采用7nm工艺。上述芯片均由台积电代工。中国本土芯片代工企业包括中芯国际,刚实现14nm工艺芯片量产。

中国本土产业链的芯片供应、代工均高度依赖国际市场。美国正限制中国获取先进产品技术,包括芯片代工设备、高性能计算芯片。美国商务部工业安全局多次把中国算力产业链的关键企业加入实体清单,导致相关企业被断供。

断供产品是为了精准打击中国相关企业,限制技术是为了延缓中国技术发展速度。2022年8月,美国商务部工业安全局限制英伟达、AMD出售高性能数据中心GPU给中国公司,目的是限制中国云与AI产业的技术水平。缺少芯片会使算力不足,模型、数据处理能力变弱,导致中国AI产业出现代际差距。2022年中至今,美国多次联合荷兰、日本限制对中国出售14nm芯片制造设备和设计软件。

为实现自主可控,中国本土产业链正在两条腿走路:一是关键环节自研,如自主设计芯片、自研设计软件等;二是采购国产芯片,政府、电信运营商、金融机构以及其他国企通过规模采购国产芯片的方式培育本土产业链。

自主设计芯片难度相对较低。目前阿里、腾讯、百度等科技公司都有自主设计的服务器CPU/GPU/NPU芯片。如阿里的倚天710、百度的昆仑芯二代、腾讯的紫霄推理芯片。上述芯片主要自用,替代一部分英特尔、英伟达芯片,降低算力综合成本。华为的鲲鹏920/昇腾910,以及国资背景的海光、龙芯、飞腾会对外出售服务器芯片,满足国产化市场需求。

图片

以芯片、服务器、云计算提供商为主的市场主体,共同构成算力产业的大图景。图/视觉中国

更高的门槛是芯片代工、设计软件等。目前中国大陆本土科技公司自主设计的14nm以下先进工艺芯片几乎都由台积电代工。不过,考虑到美国的制裁风险,一些企业正在尝试摆脱台积电。一位半导体公司人士对《财经十一人》透露,百度昆仑芯三代的代工方已更换成三星半导体。

华为、中芯国际等企业在尝试突破14nm及以下先进工艺技术。今年2月,华为轮值董事长徐直军对外称,华为和芯片产业链伙伴实现了14nm以上工艺的设计工具自主化。中芯国际目前实现了14nm工艺量产,7nm及以下制程因为缺少光刻机,尚无法量产。

华为还在尝试培育鲲鹏、昇腾计算产业链。华为为国内十余家服务器制造商提供鲲鹏芯片,还与深圳、武汉等十余个地方政府建立昇腾智算中心。华为提供技术,地方国资公司负责运营,吸引政府、企业、高校、科研机构使用算力。华为昇腾人士对《财经十一人》表示,智算中心和商业化数据中心不同,定位公共算力服务平台。地方政府可借此招商引资和吸纳人才,推动本地产业发展。

芯片如果没有市场规模,意味着成本难以摊薄,也无法实现技术和工艺的持续改进。在自主可控政策的引导下,政府、电信运营商、金融机构以及其他国企正在通过规模化采购国产芯片服务器的方式培育本土产业链。

国产服务器采购招标中,华为海思、海光、龙芯、飞腾等是常见中标方。以电信运营商为例,中国移动2021年-2022年服务器集采项目中,华为鲲鹏、海光服务器共4.4万台,整体招标量占比27.0%。中国电信2022年-2023年服务器集采项目中,国产芯片服务器采购规模共5.3万台,占比26.7%。

国产芯片服务器目前采购和优化成本偏高。国内市场,英特尔x86芯片服务器均价4万-5万元/台,华为鲲鹏920芯片服务器售价8万-10万元/台。一位服务器设备制造厂商人士今年3月对《财经十一人》说,国产服务器芯片另一挑战是软件生态不完善。例如,采购鲲鹏服务器后,通常还要进行长达半个月的软件适配和优化,否则只能发挥理论性能的30%-60%。

即使如此,规模化采购国产芯片服务器仍然被认为是必须要走的一步。一位金融机构CIO和中国电子技术人士此前同时对《财经十一人》直言,国产芯片服务器目前只做到了能用这一步。从经济指标来看,国产服务器采购成本高,易用性相对较差,被认为占用了原本的IT支出。但从政策指标来看,这是必须走的一步。只有先买起来、用起来,国产芯片服务器才能从能用变得好用。

多位受访者的一个共同观点是,考虑到国际地缘政治风险,国产芯片自研、自用之路一步都不能省。哪怕初期不经济也要有耐心长期坚持,慢慢等待中国芯片产业链软件设计、生产代工等环节完善,最终自主可控。

算网雄心的分歧

算力网络规划中最敏感的那根神经是:算力网究竟是由谁主导?每家企业都担心被边缘化

理论上来说,全国一张算力网政策有利于宏观层面的数字经济、智能产业发展。但对“全国一张算力网”的具体实施策略,央企电信运营商和民营科技公司理解有分歧。

电信运营商主张把全国算力组成一张网,像电力、网络一样统一调度算力资源。目前中国算力调度、网络调度是两个分离的体系。电信运营商甚至希望把算力网、通信网统一,实现算网资源统一调度。

一位前电信运营商人士对《财经十一人》表示,政策方提算力网络、云网融合,因为分散的算力连成网才有意义。就像局域网不成体系,互联网才能创造产业价值。就像高铁、4G/5G网络一样,算力网络是个系统工程,要对产业链不同角色重新定位。

科技公司则主张按市场竞争、供需关系规律提供算力资源。希望政策方通过市场配置资源,促进合理竞争,激发创新能力。

国内某头部云厂商的一位高管对《财经十一人》直言,和通信网、电力、高铁等成熟行业不同,云还在技术快速迭代时期。全球科技公司在激烈技术竞赛。算力产业首要任务是技术创新,而不是统一调度。过早规划统一算力网络可能会造成投资浪费,也会限制市场主体的创新意愿。

“算力网络”正在从概念进入实践初期。电信、电力电网市场已有统一的网络体系。电信市场,三大电信运营商经营着全国的通信网络。电力市场,两大电网公司(国家电网、南方电网)负责传输电力,五大发电集团(国家能源投资集团、华能集团、国家电力投资集团、华电集团和大唐集团)负责生产电力。

从技术上来看,单个企业的全国算力资源可以统一调度。云这种商业模式本身就是集中建设数据中心,向全社会提供算力资源。阿里云、腾讯云已经实现这一目标。

电信运营商正在做算力网络相关技术研究。中国电信相关人士对《财经十一人》表示,天翼云自研了算力分发网络平台,希望让不同企业的算力并网,统一调度、计量、消费。今年3月,中国电信在北京推出算力互联互通验证平台。不过,全国统一调度算力技术很复杂,甚至要重构网络、算力标准。

业内共识是,实现全国算网调度至少需要5年-10年。前述通信行业资深人士对《财经十一人》说,华为、中兴等企业也在配合电信运营商研究算网融合,并发现两个技术难点:一是算力标准,云厂商的服务器、芯片、算法不同。管理不同算力,要统一度量体系。二是数据问题,算力调度时,数据也随算力传输,此时要考虑数据隐私的归属和隔离。

在中国建立统一的算力网络体系,从概念到实践还有大量问题需要解决。不管是从市场机制、技术标准、数据归属来看,都还有很长的路要走。何宝宏建议,需要统一算网相关标准,形成算网资源底层互通的标准化通道。加快数据流通共享,推动数据跨区域、跨层级流通。还要加强算力网络核心技术研发。

但全国一张算网想真正落地,核心难题不是技术,而在市场。目前中国云市场已形成相对稳定的市场供需关系。企业按照各自需求从云计算厂商手中租赁算力、存储资源。有多位云厂商、ICT制造企业高管对《财经十一人》表示,像电力网络那样统一调度全国算力资源,这种主张与现有市场需求存在矛盾。大量企业还有私有云、混合云需求,算力网络无法满足这部分需求。

在算力网络如何落地的讨论中,最敏感的那根神经是:

算力网究竟是由科技公司主导,还是由电信运营商主导,或者是由双方的合资公司主导。每家企业都担心被边缘化。

一位第三方数据中心人士对《财经十一人》表示,政策方曾多次和电信运营商、科技公司、第三方数据中心服务商共同讨论如何建立“一体化算力网络体系”。企业都认为这是个好设想,但对如何执行落地有争议。成立合资公司调度资源、电信运营商调度资源等设想都曾被提出,但各方意见不一。

他说,在一张讨论桌上,电信运营商积极主动,华为态度暧昧,阿里、腾讯则没多大兴趣。如果形成统一调度的算力网,电信运营商会像掌握通信网一样掌握市场,获得更大市场份额。华为长期为运营商提供网络设备,网络业务也会因算力网受益。但对阿里云、腾讯云来说,这可能意味着失去现有市场地位。

2022年初,一位中国头部数字化企业高管曾对《财经十一人》说,互联网云厂商最初设想就是成为算力市场的“国家电网”。但随着政策清晰,电信运营商正在云市场不断抢占市场份额。不管是从政策、市场现实来看,这个设想都需要调整。未来算力网如同通信网,可能将由电信运营商等“国家队”运营。

科技云厂商提出了对电信运营商用政策、网络、成本优势抢占市场的担忧,并认为统一调度应首先在三大电信运营商之间实现。

多位云厂商技术人士直言,算力、数据调度都依赖网络带宽。大型互联网公司每年要为电信运营商支付百亿元规模带宽费用。阿里云、腾讯云带宽成本占比超过20%。随着AI计算、东数西算推进,数据传输成本还会更高,电信运营商在数字化市场应该像4G网络阶段一样“提速降费”,做好基础设施服务商,而非利用资源优势侵吞网络、数据中心、云计算、政企项目等各环节的产业蛋糕。

他们认为,理想格局是电信运营商继续担任“管道商”角色,专注降低算网成本,科技公司积极技术创新、参与国际市场竞争。

但运营商并不打算只做算力管道。来自电信运营商的一个主流观点是,中国的电信运营商一直在为中国市场提供廉价网络资源,毛利率长期低于30%,而美国电信运营商没有承担类似的国家级任务,毛利率高达60%。移动互联网阶段,运营商付出巨额资本支出铺设3G、4G网络,却长期被互联网公司管道化。互联网公司既享受了廉价带宽,又赚取了游戏、电商、广告等移动领域巨额利润。产业互联网阶段,电信运营商不想再给人做嫁衣。

一位资深电信技术人士认为,高铁、通信、公路、电力这些国民基础设施都是低利润行业。如果科技公司把算力当成网络一样的公共基础资源,那么就不可能有高利润率。科技公司不能既想垄断云市场成为基础算力服务商,又想在数字化市场赚取像游戏、电商、广告行业的高利润。

尽管具体角色分工有所争议,但双方一个共同观点是,中国市场算力资源分散的格局弊大于利。

上述头部数字化企业高管对《财经十一人》说:

美国只有三朵公共云,三者在市场竞争中形成了规模效应,最大程度降低了算力成本。中国市场有七朵,电信运营商和科技公司是竞争关系,地方政府还在建大数据产业园、做国资云。中国市场分散且割裂,算力成本高,每家云都在亏损。长此以往,企业资本支出、研发支出无法摊薄,难以形成良性循环。

美国三大电信运营商(AT&T、Verizon、T-Mobile)和微软、亚马逊也曾有过短暂竞争。双方很快划清边界各司其职并战略合作,前者只做网,后者只做云。AT&T与微软Azure,Verizon、T-Mobile与亚马逊AWS签署了合作协议。美国电信运营商通过云厂商把网络虚拟化进而提高效率,美国云厂商集成电信运营商的5G网络为客户提供边缘计算。

在美国市场,云厂商主导着电信运营商的发展,单个电信运营商甚至不能做到全美通信网覆盖。在中国,三大电信运营商有覆盖全国的云网资源,希望用“云网融合”参与市场竞争。

国内市场,科技公司、电信运营商竞争仍然在初期。国际市场,算力产业技术竞争在加剧。一位国内头部云厂商的高管建议,中国政府应该鼓励市场竞争和技术创新,以此形成更健壮的产业生态,孵化出具备国际竞争力的平台企业。

本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。