服务器产业链深度 告:CPU平台升级及其影响

获取 告请登录未来智库www.vzkoo.com。

我们坚定看好数据中心服务器产业链,主要逻辑有四点:

(1)流量需求长期稳定向上,无线 通信和数据通信发展的核心驱动都是流量增长,具体表现为 3G/4G/5G 络部署以及后周期 数据中心的持续投资;

(2)从行业周期的角度,相比于无线通信技术十年一代的升级周期, 服务器平台技术持续升级周期仅为 2~3 年,说明数据算力提升的需求比 络带宽增加的需求 更大;

(3)从市场空间的角度,服务器市场规模超过 930 亿美元/年,基站设备约为 215 亿 美元/年(服务器基于 IDC 数据,基站基于三大运营商 CAPEX及中国占全球 70%左右市场) ;

(4)供给端: 服务器硬件升级的核心是数据处理(XPU)、存储(DRAM 和 SSD)和传输 (光通信-连接器和光模块),国产化能力长期偏弱,供应链集中在欧美日韩台地区,但在贸 易战和全球供应链危机背景下,已经呈现加速发展的趋势,我们认为中国大陆电子产业链下 一个十年重点看国产替代,服务器产业链值得重视。

1.CPU:关注华为鲲鹏产业链,以及 AMD产业链封测和基板供应商

服务器主板上数据传输流依次为 CPU、内存、硬盘和 卡,针对图形加速特殊场景增加 GPU。 具体过程表现为:数据经由 卡封装与解封、链路管理、数据编码与译码后,储存于外存(硬 盘为主)之中;当程序需要执行时,将数据从外存经由一级存储器,传至 CPU。其中一级存 储器分为容量相对较大的主存储器(内存 DRAM)和容量较小但速度接近 CPU的高速缓存。

CPU发挥“大脑”的功能,负责数据的处理和运算,CPU与 GPU、内存、硬盘和 卡间并 不能直接通信,需要通过内存控制芯片、PCIe 控制芯片和 I/O 处理芯片等实现,这类通信协 调芯片构成主板上的“芯片组”,芯片组通过各类不同总线(PCIe 总线、USB 总线和 SPI 总线等)与 CPU相连。如果说 CPU是“大脑”、总线就是“神经结构”,芯片组就是“神经 中枢”,决定了主板总线频率和带宽,以及扩展插槽和扩展接口的种类和数量。

围绕微架构和制造工艺,CPU本身持续升级换代;同时由于 CPU结构和功能设计影响芯片 组的集成度和总线类型, “CPU+芯片组+总线”构成“CPU 平台升级”;平台升级带动服务 器主板和其他配件同步换代。服务器 CPU厂商在新一代 CPU正式发布之前,一般提前 2 年 左右将平台雏形、投放和测试性能以及样片给客户,做同步测试(兼容性和生态)和研发, 确保芯片与使用该芯片的服务器同步上市。因而,除 CPU 和芯片组之外,还需要关注平台 升级对其他服务器硬件的影响:

? 主板方面,包括 PCIe 总线、内存、GPU 和 SSD。CPU 内部集成 PCIe 控制器和内存 控制器,PCIe 总线点对点连接 CPU与各类高速设备,包括 GPU、SSD 和 卡等,伴 随 PCIe 升级至 5.0,新一代 CPU平台产品将兼容 PCIe5.0 标准,带动各类高速设备同 步升级;而内存将从 DDR4 型 升级至 DDR5,相关厂商或将逐步进入量产阶段。

? 配件方面,包括电源和散热方案,主要原因是 CPU性能提升带来的功耗增加。

1.1. IDM 龙头 Intel当前占主导地位,警惕新工艺延期风险

服务器 CPU架构包括 X86、ARM 和 MIPS 等,x86 为当前服务器 CPU主流架构,几乎占 据目前服务器全部市场份额,代表性厂商为 Intel 和 AMD。国内方面,海光、兆芯和申威等 也参与 X86 架构 CPU的国产化替代,目前主要定位政务市场。短期来看,Intel 在服务器市 场历史深厚,全球 CPU市占率在 95%左右。未来 2~3 年内,Intel 仍有望保持行业龙头的地 位,因而围绕其 CPU平台的升级仍是影响服务器硬件产业链周期性变化的关键因素。

1.1.1. 新一代 CPU 量价齐升,Intel DCG 业务呈现回暖迹象

Intel 以 Xeon 为品牌名称持续推出系列产品,产品型 命名复杂且动态变化:

(1)“ CPU+芯片组+总线”构成不同的 CPU“平台”:如已经推出 Brickland、Grantley、和 Purley 平台,新一代 Whitley 和 Eagle Stream 预计将在 2020年和 2021 年相继发布;

(2)每一代平台产品具有多个子代,视 CPU 架构、工艺、PCIe 控制器和内存控制器的不 同而有差异:例如,自 2017 年 7 月规模商用的 Purley 平台包括 SkyLake 和 CascadeLake 两代,均采用14nm工艺最高28核心,但是支持的内存通道数从6通道升级至8通道, PCIe3.0 接口数增加。

(3)不同平台的各个子代拥有多种型 名称:2017 年 Purley 平台将产品型 命名方式由此 前连续使用四代的 E7/E5 变为“至强可扩展处理器(Intel Xeon Scalable Processor,SP)”, 系列型 按铂金(Platinum)、金(Gold)、银(Silver)、铜(Bronze)定义。

从 Tick-Tock 到 PAO,Intel CPU 升级按照2~3 年周期持续向前推进:

? 2006年,Intel借意钟摆摆动周期提出“钟摆战略(Tick-Tock)”, Tick 年(大年)改 制程工艺,Tock 年(小年)改架构,按照两年的周期交替推进产品升级,该模式下 Intel 成功推进了 22nm~14nm 系列芯片的迭代。

? 2016年,Intel终止“Tick-Tock”转而采用“制程-架构-优化”(PAO)战略, P (Process) 年改工艺,A(Architecture)年改架构,O(Optimization)年优化,按照三年的周期 交替推进产品升级。背后原因主要在于芯片制造工艺升级的进度放缓。

新一代产品升级会带动 CPU性能提升一倍,价格增长 20%~30%。CPU由运算器、控制器 和寄存器组成,在服务器中性能最重要,成本也最高,视不同参数而异,均价在 1500 元/片, 占服务器硬件成本的 20%以上。一个 CPU可以封装多个处理器内核,称为“多核并行”,多 核 CPU既可以提高运算性能,又可以延长服务器生命周期。最新一代 Intel Xeon Cooperlake 10nm工艺为 56 核心,使用周期为 3 年以上。下一代核心数和单核心性能有望同步跃升,带 动价格上行。虽然考虑到兼容性问题,新产品上市后老产品仍会存在一定时间,且迎来降价, 但新产品爬坡进度较快,甚至有望在一年内达到 50%以上,而老产品逐步退场。事实上,从 Intel 数据中心(DCG)业务收入来看,新产品上市会带动相关业务持续 2~3 个季度的高增 长。

受益于 CPU 升级换代,服务器需求量有望迎来增长。主要是新平台上市前,下游厂商会部 分延缓采购需求,而等到新平台上市后,将前期压抑的需求释放出来。在数据指标上,受产 品出货顺序的影响,CPU 是服务器上游元器件,因而最先反映服务器市场需求情况,Intel DCG 业务增速成为行业景气度先验指标,大概提前 4~5 个季度。2019 年上半年连续两个季 度负增长后 Q3 开始出现回升,连续 Q3 和 Q4 两个季度增长,预示下游服务器需求企稳回 升。

服务器需求量增长带动 CPU 出货量提升,且增速高于服务器出货增速。单台服务器按性能 需求可以使用多个 CPU,一个 CPU 称为单路,两个 CPU称为双路。目前广泛使用的均为 双路服务器,而四路、六路及以上服务器也有特定的应用场景。一般而言,八路及以下服务 器为普通机,16 路及以上服务器为小型机,大型机则一般以定制化独立封闭系统为主。总体 看,目前服务器市场以双路服务器为主,根据 ZDC 数据显示,2018 年双路服务器受到 47% 的关注,四路服务器受到 29%的关注。随着云计算大数据的普及,四路服务器展现出较广阔 的市场空间,具体应用领域有 ERP 系统、商业智能分析和虚拟化应用等。

量价齐升,Intel数据中心(DCG)业务回暖迹象明显,从以往来看,新产品上市会带动 DCG 业务持续 2~3 个季度的高增长,2020 年及 2021 年 Intel Whitley和 Eagle Stream陆续上 市,DCG 业务有望迎来新一轮高增长。Intel 产品主要覆盖 PC、数据中心、物联 、存储器 和编程五大板块,2019 财年依次实现收入 371 亿美元、235 亿美元、47 亿美元、44 亿美元 和 20 亿美元,收入占比依次为 51.5%、32.6%、6.5%、6.1%和 2.8%。

? Grantley平台于2013年底发布,带动Intel DCG收入增速自2014年Q1开始回暖向上, 2014 年 Q2、Q3 和 Q4 连读3 个季度增速27%、27%和 37%。

? Purley平台于2017年7月发布,带动Intel DCG收入增速自2017年Q4开始回暖向上, 2018 年 Q2 和 Q3分别带到 24%和 30%的高增长。

? 新一代 Whitley 平台 Ice Lake 将于 2020 年 9 月推出(根据 Intel 路线规划图),采用全新架构和 10nm制程工艺,以及 PCIe 标准和内存控制标准的同步升级,有望带动 Intel DCG 业务新一轮高增长。

1.1.2. IDM 龙头,Intel 制造和封测主要靠内部消化

Intel 业务覆盖设计、制造和封测全产业链,是典型 IDM 厂商,尤其在 HPC 领域主要依靠自 主产能。因而当前背景下由 Intel 主导的服务器 CPU平台升级,受益于此的芯片产业链厂商 限于 Intel 自身。在中国大陆,Intel 拥有大连和成都工厂,其中成都工厂是 Intel 最大和技术 最顶尖的封测基地(大连工厂目前聚焦存储业务)。

制造端,服务器 HPC(高性能计算)芯片制造工艺已经从 2017 年普遍使用的 14nm 工艺向 10nm和 7nm演进。芯片制造包括 IDM(Integrated Device Manufacture)和Foundary 代 工厂两种模式,IDM 厂商如 Intel 和三星等,Foundary 厂商如台积电和格芯等,但是主要参 与者在工艺进度上存在差距。从目前主流制造厂进度看,Intel 服务器 CPU 还停留在 14nm 工艺,核心看点是 2020 年秋季发布的 Ice Lake(Whitley 平台)10nm工艺以及2021 年初 Sapphire Rapids(Eagle Stream 平台)7nm工艺。相较之下,竞争对手 AMD 已经在 2019 年 Q4的 Rome 系列使用 7nm 工艺,代工厂为台积电。格芯于 2012 年从 ADM 拆分而来, 目前在工艺制程上相对落后。

封测端,HPC(高性能计算)芯片封装主要依靠立体堆叠技术,目前普遍应用的是扇出型晶 圆级封装(FOWLP)与2.5D 封装,未来将向 3D 封装演进。3D 封装通过高端TSV(硅穿孔)技 术,将处理器(CPU/GPU/FPGA/NPU)和存储器(HBM,高频宽存储器)垂直叠合,从而 减小传输路径,提高整体运算速度。相较于 FOWLP 和 2.5D 封装技术,目前 3D 封装开发 成本高、制程难度上复杂、成品良率较低。根据 Yole 的数据,2018 年 HPC 占据 2.5D/3D 封装市场的 20%,到 2023 年有望提升至 40%。

封测行业包括 IDM 和 OSTA(Out Sourced Assembly and Testing,委外封测代工)两种模 式,参与者包括 IDM 厂商(如 Intel、三星、美光和海力士等)、OSTA 厂商(如日月光、安 靠、长电、力成、华天和通富等,以及 Foundary 代工厂如台积电和格芯等)。 2008 年,IDM 和 OSTA 占比分别为56%和 44%,2018 年则为 46%和 54%。因而封测行业呈现由 IDM 向 OSAT 逐步转型的趋势。

根据 Yole 数据,在先进封装晶圆市场份额方面,2017 年英特尔 12.4%、矽品 11.6%、长电 科技 7.8%位列第三。而在 HPC 先进封装领域,IDM 厂商和 Foundary 代工厂走在前列。Intel 于 2019 年初提出Foveros 的3D 封装,2019 下半年陆续有进展。台积电于2019 年4 月完 成首颗3D IC封装,2020年逐步导入,预计将于2021年量产。格芯于2019 年8月采用12nm FinFET 工艺成功流片基于 ARM 架构的 HPC 3D 封装芯片。

1.2. AMD 强势逆袭,带动国内上游封测供应商

1.2.1. AMD 工艺进程走在 Intel 之前,服务器市场有望迎来高成长

X86 市场 Intel 是当前绝对龙头,AMD 为最大潜在竞争对手,7nm 制程工艺已经超过 Intel 当前 10nm水平。根据 Mercury Research,2019 年Q4 AMD 在服务器、PC 和移动 CPU 市场份额分别达 5%、18%和 16%,CPU整体市场份额约为 15%。AMD 高管表示,现阶段 目标是在服务器、PC 和笔记本市场分别占据 26%、25%和 17%份额。

ADM 主营业务划分计算和图形、企业嵌入式和半定制化两大大板块,2019 年计算和图形业 务收入 47.09 亿美元,营收占比约 70%;企业嵌入式和半定制化业务收入 20.22 亿美元,营 收占比约 30%。其中计算和图形板块收入贡献主要来自 CPU。

AMD CPU核心架构为Zen系列,该架构诞生于2017年,迄今已发布14nm Zen、12nm Zen+、 7nm Zen 2。Zen 及改良版的 Zen+是 2017~2018 年主力,接下来 7nm Zen 3、5nm Zen 4 也在规划中,预计 2021 年上市,此后还会有 Zen 5。

Zen CPU架构路线图包括企业级 EPYC 霄龙、消费级 Ryzen 锐龙两条线。服务器 EPYC 方 面,根据易特创芯,AMD 已发布两代产品,分别是 14nm Zen“那不勒斯”(Naples)、7nm Zen 2“罗马”(Rome),即 EPYC 服务器芯片跳过 Zen+架构直接进入 Zen 2 架构。接下来 7nm Zen 3(Milan), 5nm Zen 4“热那亚”(Genoa)正在规划中,AMD 透露“米兰”有望 于 2020 年 Q3 推出,预计“热那亚”推出时间最晚在 2022 年上半年,内存 DRAM 方面兼 容 DDR5。

AMD EPYC 的发布和使用,使 Intel 垄断地位遭到挑战。从目前进展来看,Intel 10nm 工艺 进展缓慢(7nm预计在 2022 年以后发布,但目前下游还没有拿到测试样片),AMD 7nm 工 艺处理器有望在 2020 年商用。目前 AMD 与下游联想等展开合作,服务器产品在微软、腾 讯和阿里开始小批量渗透。根据 Mercury,2018 年 Q2 以来 Intel 市占率从 99.5%开始持续 被 AMD 蚕食。

1.2.2. 由台积电承接高端产品代工,国产封测和 IC基板供应商显著受益

AMD 于 2008 年实施轻资产战略,此后通过一系列业务分拆逐步从 IDM 芯片商转型为 Fabless 设计商: (1)2009 年将晶圆制造部门独立出来,成立格芯(GlobalFoundary), 2012 年出售给阿布扎比的阿联酋姆巴达拉技术公司;(2)2015 年将中国苏州和马来西亚槟城封 测厂出售给通富微电,并通过合资公司(JV)的形式运营,通富微电和 AMD 分别持股 85% 和 15%的模式,通富微电支付 3.71 亿美元作为交易对价。

AMD 基于 Zen 2架构的服务器 CPU Rome 型 于 2019年 Q4 上市,基于 Zen4 架构的 Genoa 预计将采用 5nm 工艺并于 2021 年上市:

(1)代工方面, 台积电于 2018 年率先实现 7nm工艺量产,同时 5nm工艺领先同行业半 年以上,预计将于 2020 年下半年实现大规模量产,因而台积电是 AMD 服务器 CPU代工的 主力供应商;

(2)封测方面,通富微电收购 AMD 苏州和槟城工厂后,承接了 AMD 80%的封测业务(根 据公告),通富超威苏州成为第一个为 AMD 7nm 全系列产品提供封测的工厂(根据通富微 电 2019 年年 ) ;

(3)封装基板方面,封装基板占封测成本的 40%以上(根据深南电路公告),目前供应链集 中在日韩台地区,日本尤其占据高端 CPU 封装基板市场,2017 年全球前十大 IC 载板厂商 合计市占率高达 83.3%(根据 Prismark),行业集中度高。国内从 2008 年开始相继布局, 目前产品集中在微机电系统、存储和射频模块等领域,主要应用于移动手机,深南电路和兴 森科技进展相对较快,2019年上半年IC 基板业务分别实现营业收入5.01 亿元和1.35 亿元。

基于以上分析,处理器代工和封装基板国产替代空间大,长期成长可期,建议重点关注国产 替代供应商中芯国际、深南电路和兴森科技等;短期从业绩弹性的角度,AMD 产业链建议 重点关注上游封测供应商通富微电。

1.3. ARM 架构在服务器市场大有可为,国产替代充分受益

长期来看,一方面,AMD 在 X86 架构下产品进度势如破竹;另一方面,ARM 架构有望发挥 在移动端市场的份额优势,借力端/云协同,抢占服务器市场更多份额,目前站队 ARM 架构 的代表厂商包括华为海思、飞腾、高通、Cavium 和 Amazon 等。此外,国产化主旋律下, 以华为、飞腾、海光和兆芯等为代表的本土 CPU 厂商有望抢占国内利基市场,包括政务、 金融、电力等国产化需求强劲的部门。

2015年4 月9 日,美国商务部拒绝 Intel向国家超级计算广州中心出售芯片用于“天河二 ” 系统升级的申请,同时国家超算长沙中心、广州中心、天津中心和国防科大被列入出口管制 名单,极大地刺激了国产处理器芯片的产业化进程。2019 年 5 月,华为再次遭遇美国商务 部芯片禁运,国产化替代更为紧迫。

经我们测算,国产CPU拥有42亿美元以上的本土市场空间,且未来受益于数据需求量提升, 空间有望持续扩大。不同线程、工艺和主频的服务器 CPU 价格不同,按照 1500 美元/片的 平均单价以及 3000 万片/年的出货量测算,市场规模在 450 亿美元/年左右。结构上,根据 IDC,2019 年中国市场服务器出货量约占全球的 30%,市场空间约为 135 亿美元/年,其中 来自云巨头、互联 厂商、政府、金融和制造业的需求占比依次为 39%、26%、19%、12% 和 2%,需求规模依次为 50 亿美元、34 亿美元、26 亿美元、16 亿美元和 3 亿美元。从需求特征来看,云巨头越来越加速服务器甚至是上层处理器和 AI 芯片的自研,互联 厂商基 于性价比考虑主要拥抱 Intel 和 AMD 等国际巨头 CPU供应商,而国内政府、金融和电力企 业等处于安全考虑国产化需求持续提升,这部分市场空间超过 42 亿美元。

CPU 国产化途径主要有三种:一是获得 IP核授权,二是获得指令集架构授权,三是自主研 发指令集。其中,IP 核授权以一个内核为基础加上自己的外设,技术门槛相对较低,功能上 可以实现差异化,但自主可控程度较低;指令集架构授权则可以对架构进行扩展或缩减,自 主可控程度高,但技术难度也比较大,同时面临生态系统构建的难题。目前商用的指令集架 构主要包括 x86、ARM、MIPS 和 ALPHA 等:

? x86 架构掌握在 Intel 和 AMD 手中,不对外开放,天津海光和兆芯通过 IP 核授权的方式 自研 CPU;

? ARM 架构为 ARM 公司所有,对外开放架构授权和 IP 核授权,国内华为鲲鹏和飞腾均 获得 64 位 V8 指令集授权;

? MIPS 架构在 2018 年获得 Wave Computing 的正式完全开源,国产厂商龙芯在2008 年 一次性买断 MIPS 指令集永久授权;

? ALPHA 架构为美国 DEC 所有,目前已经停止更新,国产申威获得该架构授权,主要用 于超算和军用市场。

从技术优势、市场应用和生态系统构建等角度看,ARM 架构目前最具与 x86 抗衡的实力。

1.3.1. ARM 架构优势明显,端云协同助力开拓服务器市场

相较于 x86,ARM 在“多核并行”提高 CPU 算力方面更具技术优势。CPU 算力提升路径有两种,一是提高单个核心的运算效率,通常以 CPU 主频大小来衡量,主频越高,运算速 度越快,这种方法主要以质取胜;二是增加运算核心的数量,在同一个硅片(Die)上集成 多个独立的物理核心,通过协同工作实现性能倍增,这种方法以量取胜。虽然 CPU 主频与 算力正相关,但也与功耗正相关,当主频提高到一定水平,会面临功耗的约束。x86 更注重 单核性能,坚持性能+速度的发展方向与模式,功耗几十瓦到几百瓦不等;ARM 则偏重多核 并行,功耗上较 x86 表现更好。

开发难度低、设计自由度高、自主化程度强是 ARM 架构相较于 x86 的另一大优势。ARM 架 构由 ARM 公司以 IP 设计和对外授权的方式运营,合作伙伴获得 IP 授权许可证,并支付 IP 许可费用和每块芯片版税。在 IP 授权形式下,芯片设计商可以直接拿到授权图纸,研发周 期大大缩短,同时可以结合自身需求开发出定制化的 CPU。而 x86 授权相对封闭,目前下 游芯片设计商仅可以通过处理器核授权而非架构授权的方式开发产品,设计自由度和自主可 控度都比较低。

? ARM 公司于 2016 年被日本软银高额溢价收购,并从伦交所退市。 ARM 公司最初由苹果、 诺基亚、 Acorn 、 VLSI 、 Technology 等合资创立, 2016 年 9 月 7 日,日本软银正式以 240 亿英镑完成对 ARM 的收购, ARM 也正式从伦敦证券交易所退市。从估值看, 2015 年 ARM 销售收入和净利润分别为 14 亿美元和 5 亿美元,按收购对价 PS 和 PE 分别为 17 倍和 48 倍,而同期美股 Intel PS 和 PE 估值分别为 3 倍和 17 倍, AMD PS 估值为 2 倍( 2015 年亏 损 6.6 亿 美 元 )。

此外,ARM 在移动端市场拥有绝对优势,受益于端云协同,市场有望不断向服务器和 络 基础设施市场延伸。移动终端和 IoT 市场超过 90%的 CPU基于 ARM 架构研发,包括高通、 苹果、华为海思和三星等。根据IDC,移动终端占全球终端出货量比重已经由2010年的44.7% 上升到 2018 年的 77.6%,预计到 2023 年将超过 80%。此外,移动应用也主要基于 ARM 指令集开发、测试和运行。

服务器:受益于云游戏、移动办公等的兴起,移动应用将逐步向云上迁移。端云协同下,云 端计算架构采用与移动端相同的计算平台,可以实现应用开发、部署和运行的无缝协同,大 幅降低开发者难度。目前 ARM 在服务器市场占有率不到 5%,未来有望打破 x86 垄断地位。 事实上,在分布式数据库、大数据、Web 前端等高并发应用场景,ARM 架构“多核并行” 的优势明显,众多芯片设计商和云巨头均已布局基于 ARM 架构的服务器系列产品。

络基础设施:目前基于 ARM 的处理器在 络基础设施市场(基站)约占 28%份额(根据 IDC)。 2020 年 4 月 16 日 ARM 加入 O-RAN联盟(由全球主要运营商于 2018 年在 MWC 期间成立,致力于接口开放化、硬件白盒化和软件开源化) ,进一步深化 5G 基础设施市场布 局。传统 建使用诺基亚、爱立信和华为等提供的专有硬件(OEM),运营商为应对 5G 络建设正努力用白盒平台取代黑盒硬件,西班牙电信和沃达丰已在欧洲和非洲大部分地区部 署 Open RAN技术。ARM Neoverse 芯片架构专门针对此开发,2020 年 Marvell 最新一代 Octeon 处理器搭载ARM芯片,Ampere 推出业内第一款80 核ARM架构64 位处理器Altra, 用于云和边缘计算数据中心(曾推出的 Octeon TX2 被诺基亚和三星宣布用于下一代基站硬 件)。

芯片设计商方面,国际上高通和Cavium等曾推出基于ARM架构的服务器CPU;国内方面, 飞腾和华为是 ARM 架构的主要拥护者:

? 飞腾基于 ARMv8 指令集,于 2016 年发布飞腾2000,最高支持 64 核心,主频 1.5GHz~ 2.0GHz,制程为 28nm,功耗 100W,在性能上与 Intel E5 服务器芯片持平。

? 华为于 2019 年推出第二代鲲鹏 920,同样基于 ARMv8 指令集,最高支持64 核心,主 频 2.6GHz,采用 7nm工艺,功耗较业界基准降低 30%。

云巨头方面,Amazon 和 Microsoft 均布局使用基于 ARM 架构的服务器 CPU。此外,Amazon 和华为均基于 ARM 架构自主研发系列处理器芯片,即基于 ARMv8 架构,自研处理器核、 微架构和芯片设计。目前均已实现商用。

? Amazon 于 2015 年以3.5 亿美元收购以色列芯片公司 Annapurna Labs,该公司主要 研发服务器微处理器。2019 年 12 月,Amazon 推出基于 ARM 架构的自研 Graviton 2 处理器,成本较上一代芯片降低 45%(根据电子说)。

? 华为:很早便基于 ARM 架构打造从芯片到服务器的系列产品,已获得 Armv8 架构永 久授权。2019 年发布 ARM 服务器芯片 Kunpeng 920(鲲鹏 920),以及基于该处理 器的三款 TaiShan(泰山)服务器。鲲鹏920 采用 7nm工艺,可支持 64 个内核,主 频达 2.6GHz,集成 8 通道 DDR4 和 100G RoCE 以太 卡;支持 PCIe4.0,可提供 640Gbps 总带宽。

1.3.2. 国产化加速,重点关注华为鲲鹏产业链

国内飞腾和华为是 ARM 架构的主要拥护者。

1.3.2.1. 飞腾:基于 ARM 架构形成完整家族产品,主要定位超算和党政军市场

天津飞腾产品有 CPU、ASIC 和 SoC 等,CPU主要包括入门级服务器的 FT-1500A/16、高 端服务器的 FT-2000+/64、桌面终端的 FT-1500A/4、应用于嵌入式工控的 FT-2000A/2 等。 公司最初由国防科大高性能处理器研究团队建立,于 2014 年成立于天津滨海。

飞腾 CPU 演进与我国超算成长史同步:以 Sparc 架构(开源)为基础设计了 FT-1000 和 FT-1500 两款 CPU,分别在天河一 和天河二 超算中心获得使用; 2012 年选择 ARM 阵 营,获得授权后开发出 FTC660、FTC661 两款 CPU核,以及 FT-1500A/4、FT-1500A/16、 FT-2000、FT-2000plus 5 款 CPU。“天河三 ”E级原型机采用全自主创新的飞腾 CPU。 目前,飞腾系列 CPU已经形成完整家族,可满足党政军多个领域的实际需求。

2019年8 月 26 日,中国长城以 3.5 亿元向华大半导体(实控人为中国电子)和中国振华(实 控人为中国电子)分别收购其持有的天津飞腾 13.54%和 21.46%股权,收购完成后,中国长 城持有天津飞腾 35%股权,为第一大股东。

? 国防科大自 1978 年承担我国巨型机研发。 1984 年由其主导研发的第一代巨型机“银河”面 世; 2007 年,国防科大与天津滨海新区签署合作协议,联合开展千万亿次超算研制,共同 建设 国 家 超 算 天 津 中 心 , 命 名 为 “ 天 河 ”, 2009 年天河一 研制成功,计算速度曾位居世界 第一; 2013 年 6 月 17 日,天河二 面世,计算速度再次登上全球榜首; 2020 年,运算速 度将达到百亿亿次的天河三 有望研制成功,首次实现所有元器件国产化 ,同时也 是继神威 太湖之光之后第二台全面搭载国产自主 处理器 的超算平台。

2017 年和 2018 年,天津飞腾分别实现营业收入 3265 万元和 6369 万元,分别实现净利润 82.79 万元和 170.50 万元。同期,中国长城分别实现营业收入96.07 亿元和 100.09 亿元, 分别实现净利润 6.69 亿元和 10.56 亿元。目前,飞腾营收体量还比较小,且主要定位超算 和政务市场,但是定位 ARM 路线有望受益于行业生态体系的培育实现发展壮大,未来需持 续关注民用化进程。

1.3.2.2. 华为:“一云两翼双引擎”布局鲲鹏计算产业,2020 年加速发展

2019 年 9 月,华为首次发布基于“鲲鹏+昇腾”双引擎计算战略,打造“一云(华为云)、两翼 (智能计算业务、智能数据与存储业务)、双引擎(鲲鹏芯片、 昇腾芯片)”计算产业布局, 包括 PC、服务器、存储、操作系统、中间件、虚拟化、数据库、云服务和行业应用等。

云服务方面,华为云成立于 2011 年;2017 年 3 月成立 Cloud BU 开展公有云业务;2019 年,华为 Cloud&AI(整合了计算、存储和云服务)正式从 BU 上升为 BG,与运营商、消费 者和企业三大 BG 并列。华为云虽然相较于竞争对手进入市场较晚,但凭借全栈(硬件+软 件/前端+后端)技术能力发展迅猛:

? 在中国市场,入选 Gartner 中国云计算 IaaS 第一梯队。2019 年Q1~Q3 在 IaaS+PaaS 市场连续 3 个季度增长超过 300%,IaaS+PaaS 和 IaaS 市场份额均超 7%(根据 2019 年年 ),排名均上升至第四;2019 年 Q4 在 IaaS 和 PaaS 市场均位列第三(根据 Frost&Sullivan)。在 IaaS 市场,阿里云、腾讯云、华为云、天翼云和金山云位列前五, 市占率合计达 78.1%;在 PaaS 市场,阿里云、腾讯云、华为云、天翼云和 AWS 位列 前五,市占率合计达 81.6%。

? 在全球市场,华为云全球 IaaS 市场排名上升至第六,增速高达 222.2%,全球增速最快(根 据 Gartner)。2019 年华为云新加坡、智利、巴西、墨西哥、秘鲁大区陆续开服,与伙伴 在全球 23 个地理区域运营 45 个可用区。

具体业务方面,下游行业应用的培育是业务开展的关键,而行业应用拓展存在的难度主要包 括:(1)行业广、应用多、堆栈深、区域属性强,软件组件依赖关系复杂(只要一个环节不 支持整个应用不可用);(2)用基于传统计算架构的行业标准来评估新计算架构,制约行业 应用往新计算架构迁移。比如 HPC 行业应用普遍采用衡量双精度浮点计算能力的 HPL (High-Performance Linpack)标准来评估系统性能,但这并不符合内存密集型等应用的业 务实际需求;(3)应用软件迁移到新计算平台带来的额外成本与带来的市场收入不成比例。

鲲鹏计算产业布局主要三个阶段(根据华为《鲲鹏计算产业发展白皮书》 ):第一阶段为试点 阶段,树立标杆行业典型场景,具体包括政务、电信、金融和互联 ;第二阶段为推广阶段, 将行业范围扩展至 18+;第三阶段为深化阶段,达到全行业全场景。截至目前,鲲鹏计算产 业在政府、金融、电信和互联 等主要场景已经规模商用,可满足 20%业务场景迁移至鲲鹏 计算平台。

在芯片布局方面,华为拥有 ARMv8 永久架构授权,并完全掌握 64 处理器核芯片设计技术, 在此基础上发布了基于 ARM 架构的鲲鹏系列处理器,同时开发了包括“算、存、传、管、 智”在内的全面芯片体系。

2019年1 月华为发布的服务器处理器 Kunpeng 920(鲲鹏 920)性能表现优异:鲲鹏 920 包括 32/48/64 核版本,采用7nm制程工艺,主频可达2.6GHz,集成 8 通道 DDR4 和 100G RoCE 以太 卡,还支持 PCIe4.0 接口,可提供 640Gbps 总带宽。典型主频下,SPECint Benchmark 评分超过 930,超出业界 25%;能效比优于业界标杆 30%。相比竞品内存宽带 提升 46%,总 I/O 带宽提升 66%, 络带宽提升 4 倍;

除了处理器芯片(XPU), 华为大力拓展硬件 OEM 和软件(操作系统、数据库和虚拟化等) 合作商,从关键器件(电源芯片/CPLD)、核心部件(SSD 卡、 卡、RAID 卡、显卡和内存 等)、基础软件到上层行业应用:

(1) 开发基于鲲鹏处理器的三款服务器 TaiShan(泰山) :

服务器整机普遍存在厂商利润率低、硬件设计(包含 BIOS、BMC 芯片)能力参差不齐、 以及配套部件(内存、硬盘、 卡、显卡等)可获得性、兼容性差等问题。泰山服务器旨 在树立标杆,使能整个鲲鹏计算产业链,带动相关厂家发展基于鲲鹏处理器主板的自有品 牌服务器。当条件成熟华为可逐步停止泰山服务器销售,转为服务器主板和部件供应商, 最终在服务器整机领域形成多厂家的格局。2020 年 3 月 27 日华为开发者大会上,华为 Cloud&AI BG 总裁侯金龙表示,华为已在北京、广州等地成立 15 个鲲鹏创新中心,11 家 品牌商推出基于鲲鹏主板的服务器和 PC 产品。

(2) 联合整机、BIOS、厂商和 OS 厂家共建开放的IO 总线和管理接口标准:

OS 厂商适配多种 CPU 架构导致版本多,OS 与应用适配工作量大;基础软件厂商(数据 库、中间件、大数据、云平台)对鲲鹏计算平台的适配仍处于起步阶段 ,缺少核心系统应 用。建立 IO 总线和管理接口标准并对外开放,一方面相关企业可以开发各种部件,另一方 面使能 IBV(独立 BIOS 供应商)发展 BIOS 生态,使整机厂商具备总线定制能力,进而实 现品牌差异化。截至目前,鲲鹏计算产业已经有相对完整的基础软件生态,获得了 Linux 操作系统、虚拟化软件、数据库、中间件等的全面支持。

(3)基于自身的硬件兼容性实验室,对操作系统、内存、硬盘、 卡等进行统一的兼容性 认证测试,并定期发布兼容性清单,从而保证 OS、部件与整机的兼容性。

从业务成长性看,华为主要经营运营商、消费者、企业三大业务,2019 年三大业务分别实 现收入 2967 亿元、4673 亿元和 897 亿元,收入占比依次为 34.55%、54.41%和 10.45%, 收入增速分别为 3.8%、34%和 8.6%。除以上三大业务外,2019 年其他业务收入为51.3 亿 元,同比增长 30.6%,收入占比 0.6%(华为尚未对 Cloud&AI 业务单独披露)。当前,运营 商业务发展已经步入成熟期,华为在全球通信主设备市场位列第一;消费者业务加速成长, 华为手机销量仅次于三星位列全球第二;企业业务增长稳定;Cloud&AI 业务基数小,发展 潜力巨大。

? 服务器端:2019 年华为实现硬件收入 36.47 亿美元(根据 IDC),同比下降 6.5%,市 场份额为 4.2%,全球排名位列第七。

? 云服务端:2019 年华为云增长超过3 倍(根据徐直军)。2019 年全球云计算 IaaS 市场 规模达 445 亿美元,同比增长 37.3%,前四大龙头亚马逊 AWS、微软、阿里和谷歌份 额分别为 45%、17.9%、9.1%和 5.3%,华为位列第六(根据 Gartner)。因此对标云计 算巨头,华为依靠鲲鹏生态系统建设,发展空间巨大。

受益于华为鲲鹏计算产业链的培育,行业上下游有望分享红利。根据《鲲鹏计算产业发展白 皮书》,到 2023 年全球计算产业投资空间 1.14 万亿美元,中国占比约 10%达1043 亿美元, 其中服务器及部件市场空间预计 2378 亿元,假设鲲鹏架构市场份额 50%,则 2023 年鲲鹏 服务器硬件市场空间 1189 亿元。

华为鲲鹏系列服务器的发展思路是,现阶段通过泰山服务器树立标杆使能整个产业链,带动 相关厂家发展基于鲲鹏处理器主板的自有品牌服务器,形成多厂家格局;当条件成熟,华为 或将逐步停止泰山服务器销售,产能由核心合作伙伴承接。

服务器整机市场有品牌厂商和 ODM 厂商两类:(1)品牌商完全自主研发、设计、采购、组 装和销售,具备硬件架构设计能力及配套软件开发能力,通过招标和渠道的方式分别向下游 客户销售;目前主要的品牌厂商包括 HPE/H3C、戴尔、浪潮、IBM、华为和联想等。 (2) ODM 厂商则为品牌厂商提供部分机型的代工生产,主要负责后端制造,在产品研发环节配 合主要客户完成,同时在销售环节面向大客户以阶段性招标和锁价的形式实现,往往是台系 厂商,包括:纬创、纬颖、富士康、广达和英业达等。

目前,全球服务器自主品牌参与者主要包括戴尔、HPE、浪潮、华为、新华三、联想、IBM、 曙光和宝德等。2019 年全球服务器市场前三依次是戴尔、HPE、浪潮(按销售额,根据 IDC), 市场份额分别为 17.8%、14.8%和 7%;中国服务器市场前三名依次是浪潮、华为和新华三, 市场份额分别为 28.7%、16.4%和 13.1%,排在后面的依次是戴尔、联想、曙光和宝德,合 计占比 32.1%,ODM 厂商占比 2.9%。

受益于鲲鹏产业链的建立和完善,硬件端中长期看好鲲鹏系列处理器上游供应商,包括 IC 代工和封测。根据我们的假设和测算,2020 年鲲鹏产业链服务器端代工和封测市场空间分 别有望达到 53 亿元和 18 亿元。

鲲鹏系列芯片代工主要由台积电承接,台积电是少数具备成熟 7nm 制造工艺的厂商之一; 封测端,日月光矽品是全球第一大封测供应商,已进入华为鲲鹏供应链,将在今年三季度开 始供货(根据与非 ),国内厂商长电科技和通富微电技术储备成熟。目前通富微电主要为 AMD 供应商,承担 80%左右的订单(根据 2019 年年 公告);长电科技与华为存在合作(根 据 2018 年年 公告)。从合作深度和业绩弹性的角度,鲲鹏产业链建议重点关注长电科技。

2. 独显 GPU:国产化任重而道远,FPGA和 ASIC替代可期

2019 年上半年中国 GPU服务器市场规模为 8.3 亿美金(根据 IDC),同比增长 53.7%,同 期中国市场 x86 服务器市场规模为 73.9 亿美元,短期来看,即 GPU服务器占 x86 服务器市 场的 11.23%,该比例从 2017 年的 2.01%逐年提升。IDC 预测,到 2023 年中国 GPU服务 器市场规模将达到 44.5 亿美金,5 年 CAGR 为27.8%。而中国 x86 服务器市场约占全球的 三分之一左右,假设按照此比例推算,2018 年全球 GPU服务器市场约为 43.5 亿美元,到 2023 年约达到 148.3 亿美元。

GPU(Graphics Processing Unit,图形处理器)最初是用在 PC 和移动端上运行绘图运算工 作的微处理器,与 CPU集成以集成显卡(核显)的形态发挥功能。NVIDIA 于 2007 年率先 推出独立 GPU(独显),使其作为“协处理器”在 PC 和服务器端负责加速计算,承接 CPU 计算密集部分的工作负载,同时由 CPU继续运行其余程序代码。作为独显的 GPU 由 GPU 核心芯片、显存和接口电路构成,因而受益于新产品升级,GPU 产业链除关注芯片代工和 封测外,还应重视显卡 PCB 需求的同步提升。

2.1. GPU 短期受 PCIe 升级有限,核心关注龙头新产品上市

独立 GPU与 CPU之间通过 PCIe 总线连接,因而 PCIe 总线标准直接影响到通信带宽;而 针对 GPU之间的互连,Nvidia 推出 NVLink 技术替代传统 PCIe 总线的方式,带动 GPU性 能 5 倍提升(根据 Nvidia 官 )。

目前由于 AI 性能挖掘仍有空间,已经部署的服务器中 GPU算力尚有冗余,预计 PCIe 由 3.0升级至4.0 和5.0 短期内对GPU影响不大。但主流参与者仍在工艺路径持续推进产品升级。 Nvidia 占据独显市场近 80%的份额(根据 AIB Research),目前其主流产品还停留在 12nm 工艺,7nm正在规划中。根据 Nvidia CEO 黄仁勋表示,下一代 7nm产品有望迅速推向市场, 以配合制造商安排量产规划。

2.2. GPU 市场 Nvidia 遥遥领先,重点关注显卡 PCB 供应商

NVIDIA、AMD 和 Intel 在 GPU市场三分天下。根据 Jon Peddie Research,2019 年 Q4 PC 端 GPU出货量中,Intel、AMD 和 Nvidia 分别占据 63%、19%和 18%的市场份额。Intel 和 ADM 在 PC 端 GPU市场占据强势地位,主要原因是 PC 端主要使用集成 GPU(核显),而 Intel 和 AMD 在 PC 端 x86 CPU市场分别占据 84%和 16%的份额,具有天然优势。Nvidia 虽然拥有基于 ARM 架构的 CPU,但目前处于弱势地位。

而在独立 GPU(独显)市场,Nvida 是行业的奠基者和龙头,占据近 70%份额。AIB 数据 显示,2019 年 Q4,Nvidia 和 AMD 在独立 GPU市场份额分别为 81%和 19%。从新产品进 展来看,AMD 新系列采用 7nm更先进工艺,Intel 也表示将在 2020 年推出独立 GPU,采用 10nm工艺,主要用于游戏端,用于数据中心的高性能 7nm工艺 GPU有望在 2021 年发布。

2018Q4~2019Q3,Nvidia 营收一直处于下降通道,连续四个季度营收增速为负(-24.25%、 -30.78%、17.42%、-5.25%),主要原因是游戏负增长,同时 DC 业务受服务器出货量下滑 的影响增速大幅放缓。然而2019Q4拐点已现,营收增速回暖,单季度同比增长高达40.82%。 2019年 3 月,Nvidia 宣布以 49 亿美元收购 Mellanox,预计 2020 年 4月底该项交易最终 完成,成为 Nvidia 历史上最大的一笔收购。Mellanox是服务器和存储端到端连接解决方案的供应商,产品涉及 HPC、云计算、数据中心、企业计算及存储市场,包括 Smart NIC, 络交换机芯片和高速数据互

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年4月15日
下一篇 2020年4月15日

相关推荐