国产信息基础软硬件行业深度 告:开源、迁移、上云、生态

获取 告请登录未来智库www.vzkoo.com。

一. 围绕信创生态建设的核心,开源、迁移、上云

我们认为,关系到国产基础软硬件发展的四个关键词:生态、迁移、上云、开源。

1)生态:国产基础软硬件体系基本可用,形成整体推进的局面。国产软件/硬件体系在 2015 年开 始进入“可用”阶段,2020 年在信创战略推动下有望向整体“好用”升级,最终有望达到市场良 性循环的状态。

2)开源:是获取技术、开发者群体、用户群体以及扩大技术影响力的最佳选择。信创并不等于彻 底的技术封闭。开源已经成为龙芯、鲲鹏、统信、麒麟等国产行业“支柱”的重要发展方向,也是 时代发展的趋势。

3)迁移成本:信创推进过程中,迁移成本是需要重点关注的问题。过去,国内 IT 产业对 IOE 体 系较为依赖。如何低成本地实现已有设备中的应用、数据、文档向国产设备顺利的迁移,是影响信 创顺利推进的重要问题。有足够的技术实力解决迁移问题的厂商,将有望获得更突出的市场地位。

4)上云:实现上层应用和底层硬件的解耦,减缓了仓促兼容适配对用户体验的影响,也是数字经 济时代的重要趋势。过去数十年间,国产软硬件各种技术路线和设计架构并存,底层硬件也未能在 性能上全方位赶超海外厂商。上云可以有效地提升异构环境下的用户体验。另外,政务和企业上云 是数字经济时代的必然结果,信创推进也将符合这一趋势。

总结来看,较完善的生态基础、面向应用迁移和上云的技术布局、适当利用开源资源,将成为影响 信创相关厂商扩大市场影响力的重要维度。

1. 生态建设:信创推进的根本保障,厂商技术布局的核心

芯片、基础软件、整机、应用软件、打印机等,彼此之间互相兼容,是信创推进的根本保障。从技 术角度,完备的计算机,需要芯片、主板、操作系统、数据库、应用软件、打印机外设、 卡等协 调一致工作,才能实现正常的功能。任何一个组成部分,都无法孤立于其他元件的技术标准之外。 因此,信创产业的推进不是零散的、各条线独立的,而是作为生态整体去推进。

兼容并不是零成本的,往往是厂商之间的双向选择。以操作系统和 CPU 的兼容适配为例,引用龙 芯技术专家的观点“操作系统需要针对不同的主板和升级后的 CPU 进行磨合适配,而在 Wintel 体 系中可以实现不同主板及 CPU 的操作系统二进制兼容,其背后是 Wintel 体系统一的系统架构,包 括指令系统、地址空间布局、中断系统、多核互联架构、IO 接口规范等,需要 CPU、BIOS、桥片、 操作系统配合完成。”在应用软件方面,需要软件开发商针对操作系统的版本进行相应的调试和调 优,同款应用软件经常有多个版本以适应不同的操作系统。针对不同技术路线的软/硬件的兼容调 试,需要技术、资金、时间的投入,IT 厂商选择技术兼容伙伴的根本考量因素就是市场影响力,从 而避免无效的投入。兼容的双向选择,客观上阻碍了影响力较弱的基础软硬件企业步入 IT 产业圈。

过去,以 Wintel 和 IOE 为代表的海外厂商群体凭借先发优势和长期的积累,形成技术兼容壁垒, 几乎实现了垄断地位。微软在 PC 机诞生的初期,就推出了图形界面操作系统 Windows,凭借先 发优势不断扩大市场份额,在和 Intel 长期的技术磨合中,形成了垄断性的 Wintel 体系;IBM、 Oracle 和 EMC (即 IOE),也在相应的领域占据了长期的垄断地位。大数据时代,开源 区、云计 算、分布式数据库、虚拟化集群等新兴潮流在一定程度上冲击了这些厂商的优势地位,甚至重新定 义了技术路径和竞争边界。整体来看,凭借生态建设积积累起来的全球 IT 产业地位,仍然在短时 间内难以得到根本性的撼动。

在 2020 年信创战略进一步推广之年,国产基础软硬件的生态环境已经趋于完善。在相关政策的引 导下,经过前期的探索和积累,国产软硬件产业形成了整体推进的局面:国产芯片的性能已经足够 强大,而中间件、数据库、办公软件、行业应用软件,也涌现了一批优秀的国产企业。

2. 开源:信创不等于技术封闭,开源是生态推进的重要手段

信创不等于彻底的技术封闭,开源的重要性也在不断提升。开源对信创的意义,体现在 3 个方面:

1)向开源项目贡献源代码,可以扩大技术影响力,增强和主流技术趋势的绑定。比如 Intel、红帽、 统信软件、麒麟软件、龙芯、华为等;

2)借助开源软件资源,可以节约不必要的成本。同时,自主创新来确保差异化优势也是必要的, 毕竟开源资源本质上并不存在差异化;

开源的“杠杆”作用:通过参与开源资源项目,甚至逐渐达到开源 区的引领地位,相当于以自有 的研发资源撬动了整个 区的研发力量。而且,一部分开源 区的核心团队、管理团队和运维资金, 都是由主导企业提供,则这种情况下,开源 区版本就成为企业的商业版软件的“试验田”,比如 著名的 Linux 操作系统厂商 Red Hat 以 Fedora 和 CentOS 作为创意试验版和先行体验版。通过免 费提供开源版本,企业获取了用户体验的验证,也形成了对外部开发者持续的吸引力。外部开发者 参与开源项目的贡献,可以作为重要的履历也可作为发挥个人创意的方式。适度的使用开源资源, 是企业和开发者的双赢局面。

3. 迁移:适应生态现状的必要举措,影响实际推进顺利程度

迁移成本将成为国产软硬件信创推广的重要考量,本质取决于生态建设的进度。虽然常用的应用 软件已经基本实现了国产化的覆盖,但是仍然有一部分行业应用软件是基于原有的底层架构开发 的,比如基于 Oracle 数据库或者针对 Windows 系统的。短期内,凭借有限的资金和人力资源,并 不能做到针对所有的应用软件都推出相应的或者相当水平的国产化版本。而且,过去一些机构部门 的软件平台由外包团队开发,版本较多、技术路线较复杂,需要确保现有的应用、数据、文档实现 顺利迁移、低成本迁移、甚至无缝迁移。

以国产操作系统为例,潜在用户群体最关心的是兼容和迁移问题。2020 年 4 月初,计世研究院发 布了关于“国产操作系统使用意愿调研”的问卷调研结果,调查对象主要为国内的 IT/电信/互联 、 政府/公共事业、能源制造等企业。根据本次的统计结果,国产操作系统潜在用户最关注的两个问 题:1)常用软件能否兼容;2)从原来的系统到国产系统,应用和数据能否顺利迁移。

能否提供低成本的迁移方案,或者直接从产品层面做到无缝迁移,成为影响厂商在信创市场影响 力的重要因素。围绕“迁移”展开的研发投入和服务体系建设,也将成为相关企业扩大市场份额的 重要措施。

4. 上云:是适应生态现状的举措,也顺应数字时代的趋势

上云,一定程度上可以屏蔽底层硬件的复杂度。在过去的数十年间,国产基础软硬件的多种技术架 构和路线并存,上层应用需要面临较为复杂的底层基础。而且从底层硬件的性能角度,短期内也难 以全方位赶超国际巨头厂商。另外,虽然国产软硬件的兼容体系已经基本建立,但兼容并不等同于 “好用”。通过上云,可以一定程度地屏蔽底层硬件的复杂度,可以有效地提升用户体验度。国产 软硬件厂商在积极进行云计算、云平台相关的研发投入,开始形成足够的产品储备和服务体系。

政务和企业上云,也是数字时代重要的发展趋势。随着数字经济时代的到来,上云成为政企数字化 转型的重要措施。根据国务院发展研究中心国际技术经济发布的《中国云计算产业发展白皮书》, 预计到 2023 年我国政府和大型企业上云率将超过 60%。2020 年 4 月 10 日,发改委、中央 信 办印发了《关于推进“上云用数赋智”行动 培育新经济发展实施方案》。我们认为,信创体系的 建立,是在整个数字经济时代的大背景中的,上云也是信创推进的重要维度。

小结:开源、迁移、上云,这三个维度本质上都在围绕生态建设。开源是初步形成和持续打造生态 的重要途径;迁移、上云是为了适应生态建设的现状,提供更好的用户体验的措施。

二. 国产 CPU:4 种架构 6 大品牌,性能不断提升

国产 CPU 厂商得到了相应指令集的架构授权,发展成为 6 大主流厂商:龙芯、飞腾、鲲鹏、海光、 申威、兆芯。CPU 的指令集分为复杂指令集(CISC)和精简指令集(RISC)两大类。复杂指令集以 x86 架构为代表,精简指令集则包括 ARM、MIPS、Alpha、Power 等。

6 大主流 CPU 厂商的技术路线和生态建设各有优势。目前在通用计算领域,优势较强的是龙芯、 飞腾、鲲鹏、海光这 4 大厂商,我们将在本章进行重点介绍。

1.龙芯:技术源于中科院计算产业,单核性能提升,生态不断 完善

龙芯技术源于中科院计算产业,沿着市场化的道路不断发展,已有超过 20 多年的 CPU 行业积累。 2001 年,在中科院计算所知识创新工程的支持下,龙芯课题组正式成立。2010 年,龙芯公司正式 成立。龙芯坚持“市场带技术”的道路,而不是“市场换技术”的道路,坚持自主研发,坚持市场 化的机制,整体的发展可概况为三个十年。

龙芯 CPU 系列包括龙芯 3 大 CPU、 龙芯 2 中 CPU 、龙芯 1 小 CPU 三个系列,分 别针对电脑(桌面和服务器)、工控和嵌入式、单片机领域。本章重点介绍用于桌面和服务器的龙芯 3 系列 CPU。

龙芯电脑端(PC/服务器)CPU 经历了三个发展阶段:不可用——可用——好用

1)早期阶段(2015 年之前):性能较低,达不到“可用”程度:龙芯第一代 3A1000/3B1500 的单 核性能较低,SPEC CPU 2006 分值只有 2-3 分,打开 20M 的测试文档需要 33 秒。

2)开始进入“可用”阶段(2016-2017 年):单核性能显著提升:龙芯第二代 3A3000/3B3000/7100 单核性能提升到 10-11 分,超过 Intel 凌动系列,打开 20M 的测试文档时间缩短为 6 秒。

3) “可用”向“好用”升级阶段(2019-2020):单核性能再次突破:龙芯第三代 3A/B4000、3A/C5000、 7A2000 的单核性能提高到 20-30 分,打开 20M 的测试文档时间少于 1 秒。

龙芯 4000 系列虽然采用 28nm 工艺,但凭借优化设计,单核性能较强。

龙芯 3 的更新升级有两种模式:1)工艺更新微结构不变 2)工艺不变更新微结构。龙芯 3A4000 相比 3000,采用相同工艺(28nm)但性能成倍提高;龙芯 5000 系列工艺更新 12nm。

龙芯 3 CPU 下一代 5000 系列的目标:提高主频和核数。龙芯新一代桌面芯片 3A5000 将在 2020 年 Q2 流片,采用 12nm 工艺,单核性能提高至 25-30 分,与 3A4000 可原位替换,操作系 统二进制兼容;龙芯服务器芯片 3C5000 预计于 2020 三季度流片,采用 12nm 工艺,16 核结构, 支持 4-16 路服务器。

虽然从全球整体来看,MIPS 架构的生态基础相对 x86 和 ARM 较为薄弱,但龙芯的信创生态建设 已经较为完善,而且处于不断扩张的发展中。

龙芯非常重视 Linux 生态建设,为开源 区积极贡献代码,增强技术影响力。龙芯致力于 Linux 生 态体系的兼容优化,有上百人规模的开源软件工程师团队,提供操作系统和底层软件兜底服务的能力。2020 年 3 月 17 日,Java14f 发布,根据官方发布的统计,Oracle、红帽、SAP、龙芯和谷歌, 位于 OpenJDK 代码提交次数的全球前五位。

在应用开发环境建设方面,龙芯支持主流的 Linux 开发环境,包括多种编程语言、函数库、平台引 擎和集成开发工具等。

PC 端的生态建设:龙芯 CPU 已经支持主流的整机、操作系统、办公软件、浏览器、输入法和部 分设计工具等常见软硬件,覆盖了基本的办公需求。

服务器生态领域:龙芯目前的 3B4000 服务器芯片是 4 核的,可以支持双路、 四路全相连结构, 实现了虚拟机效率提升至 95%以上、跨片访存带宽提升至 400% 以上、内存数量线性扩展以及高 吞吐率。目前也已经有百款厂商适配了龙芯的服务器 CPU。我们认为,龙芯新一代 16 核的服务器 CPU 在 2020 年内流片之后,龙芯在服务器领域的市场影响力将进一步得到增强。

云计算生态领域:龙芯的 KVM 虚拟机于 2019 年 4 月发布,完善支持 OpenStack 集群管理工 具,实现了从 CPU 到系统, 全链条虚拟机的自主研制。在云容器方面,龙芯的 Doker 容器于 2017 年发布,完善支持集群管理工具 Swarm、 Kubernets、 Openshift、 Mesos 等。龙芯的云 计算生态伙伴包括:浪潮云、 腾讯云、 金山云、 曙光云、 云栈希云、 中标易云、 道客云、航 天科工天熠云、 UCLOUD、 CETC 电科云、 普华云、 升腾云、 金蝶云、江苏华云、 广西梯度 云、 上海田亩云、 北京优炫云、 成都精灵云、 广东品高云,等等。

龙芯在信创云计算的典型案例是和浪潮云合作的电子政务外 云平台。基于龙芯 CPU 和 Docker 技术,依托浪潮云计算中心构建的电子政务外 云平台,可以支撑省市县三级应用,用户数达到了 5 万+规模,实现了办公系统、信息门户、统一认证和授权管理系统、电子签章系统等上云部署。

2020Q1,龙芯中科克服了疫情的影响,逐渐恢复研发、生产和市场工作,实现第一季度收入同比 增长 30%。整体来看,龙芯 CPU 单核性能较强,而核数和工艺也有望在年内实现进一步突破,从 而有望充分争取信创领域的市场份额。

2. 飞腾:基于 ARM 架构,性能高而能耗低,

飞腾有 20 多年的 CPU 研制积累,背后依托中国电子信息产业集团(CEC)。2014 年,中国电子信 息产业集团、天津滨海新区政府、天津先进技术研究院三方联合成立天津飞腾信息技术有限公司, 致力于飞腾系列 CPU 的设计研发和产业推广。飞腾公司核心技术和研发团队来自国内顶尖高校, 拥有 20 多年自主 CPU 研制经验。飞腾的芯片面向三大领域:服务器、PC 和嵌入式,本章重点介 绍服务器和 PC 端的 CPU。

从技术路线角度,飞腾的发展经历了 2 个阶段:

1)早期:基于 SPARC 架构(1999-2012),生态建设受限。2000 年,飞腾第一款嵌入式 CPU 推 出;2005 年,飞腾团队推出了 32 位、64 位的通用 CPU;2009 年推出第一款 8 核高性能 CPU, 2012 年飞腾 16 核高性能通用 CPU 推出。但整个 SPARC 架构生态日渐式微,也一定程度上影响 了飞腾 CPU 的进一步推广。

2)新篇章:基于 ARM 架构(2014-至今),性能显著提升、生态建设顺利推进。2014 年飞腾基于 ARM 架构的 FT-1500A 推出,性能相当于 Intel Xeon E3,从此开启了技术发展的新篇章。2017 年,飞腾推出 64 核的 FT-2000+系列。2019 年,飞腾桌面版 FT-2000/4 问世,采用 16nm 工艺, 性能相当于 Intel Core i3 系列。

飞腾新一代的 CPU 实现了性能的显著提升:在桌面领域:飞腾新一代的 FT-2000/4 较上一代 FT1500A/4 计算性能提升了 1 倍,功耗方面降低 33%。FT-2000/4 还可以通过“降频”、“减核”的 方式,在能源、交通、化工、金融等关键领域实现嵌入式低功耗终端应用。在服务器领域:飞腾新 一代的服务器芯片 FT-2000+/64 较上一代 FT-1500A/16 计算性能提升 5.5 倍,单位功耗算力提升 近 2 倍,是更加高效更加绿色的芯片。

飞腾基于 ARM V8 架构的服务器 CPU,相比 x86 架构的海外厂商产品,优势在于多核处理能力和 功耗上面。在 2019 年的某项目中,4 台基于飞腾 FT-2000+/64(64 核,16nm)的单路服务器和 4 台 搭载英特尔至强 E5-2650V4(12 核,14nm)的双路服务器在大数据方面进行了对比测试。在 Storm 测试中,飞腾的各项测试均相当或占优。在离线计算 Spark 测试中,飞腾得益于其多核处理能力, 也实现了性能占优;在消息队列 Kafka 测试中,飞腾的性能和 x86 服务器基本相当。飞腾的功耗仅仅为对方的 50%。体现出了飞腾对大数据组件,尤其对离线计算的良好支持,也体现了飞腾 CPU 的节能。

针对云计算平台的虚拟化方面,飞腾服务器芯片提供了较好的硬件辅助虚拟化支持。在 FT2000+/64 服务器上对比了虚拟机双核(采用 KVM 虚拟化)和宿主机双核在基准测试中的效率 比值,平均约为 97.5%左右,这为基于 KVM 虚拟化的云平台性能提供了强有力的支撑。

生态建设:飞腾通过性能强大、低功耗的桌面 CPU,构建了终端全栈生态。终端全栈架构包括硬 件层,固件、操作系统及驱动层和应用层。

飞腾软硬件生态圈:飞腾联合了近 1000 家国内的软件/硬件厂商,支持超过 300 款服务器、30 多 款整机、40 多款便携笔记本、20 多款存储设备。

未来发展:2019 年 12 月,在首届生态伙伴大会上,飞腾公布了 2020-2024 的五年发展规划:计 划在未来 5 年内持续投入 150 亿以上,用于研发、生态建设和客户保障,将团队扩大到 3000 人以 上,建立市场化的激励机制,巩固政务、行业办公市场,开拓金融、通信、能源、交通等业务市场, 到 2024 年实现营收超过 100 亿元。我们认为,飞腾 CPU 在性能和能耗方面具有显著优势,随着 市场化进程的深化和研发资源投入力度的加大,未来有望进一步扩大在信创领域的影响力。

3. 鲲鹏:ARM 多核架构,通用计算和 AI 计算并进,生态建设 加速

鲲鹏处理器基于 Armv8 架构永久授权,处理器核、微架构和芯片均由华为自主研发设计,鲲鹏计 算产业兼容全球 Arm 生态。除了传统的服务器 CPU 和桌面 CPU,华为围绕鲲鹏处理器打造了 “算、存、传、管、智”五个子系统的芯片族。历经 10 多年,目前已累计投入超过 2 万名工程师。

在通用计算领域,鲲鹏 CPU 目前主要集中在服务器领域。鲲鹏 920 服务器 CPU 基于 ARM V8 多 核架构,最高集成 64 个物理核,主频最高 2.6GHz,通过多核来提升算力。另外,华为鲲鹏 PC 级 的 CPU 也在规划中。

根据华为开发者大会 2020(cloud)公布的数据,相比英特尔 Skylake 服务器 CPU,华为鲲鹏 920 系 列芯片的性能更高,功耗更低,主要得益于鲲鹏 920 的工艺升级到了 7nm,内核数量更多,而且 进行了多核优化处理。

华为推出了基于鲲鹏 CPU 的泰山服务器系列,包含多个种类。根据华为 2019 年的生态大会公布 的信息,华为未来将重点聚焦于算力的上游,进行生态伙伴赋能,未来有可能逐渐退出服务器整机 领域。我们认为,随着华为生态建设的逐步完善和厂商对鲲鹏 CPU 接受度进一步提高,华为鲲鹏 CPU 未来有望不依赖于华为自己的服务器整机进行推广,从而实现战略升维。

在 AI 算力方面,华为提供昇腾 AI 处理器和 Atlas 平台。昇腾系列包括 310 和 910 两款,均采用 华为自研的达芬奇架构。昇腾 310 定位是高效、灵活、可编程的 AI 处理器,功耗仅 8W,八位整 数精度(INT8)性能达到 16TOPS,16 位浮点数(FP16)性能达到 8 TFLOPS;昇腾 910 定位为 超高算力的 AI 处理器,其最大功耗为 310W,八位整数精度(INT8)下的性能达到 512TOPS,16 位浮点数(FP16)下的性能达到 256 TFLOPS。作为一款高集成度的片上系统(SoC),除了基 于达芬奇架构的 AI 核外,昇腾 910 还集成了多个 CPU、DVPP 和任务调度器,具有自我管理能 力,可以充分发挥其高算力的优势。昇腾 910 集成了 HCCS、PCIe 4.0 和 RoCE v2 接口,为构建 横向扩展(Scale Out)和纵向扩展(Scale Up)系统提供了灵活高效的方法。HCCS 是华为自研 的高速互联接口,片内 RoCE 可用于节点间直接互联,最新的 PCIe 4.0 的吞吐量比上一代提升一 倍。华为 Atlas 平台是搭载昇腾处理器相关的服务器、边缘计算小站、AI 集群等。

鲲鹏生态加速推进:华为聚焦于架构和并发,提供算力;硬件开放、软件开源、支持迁移和生态伙 伴共建生态。在华为开发者大会 2020(Cloud)上,华为宣布“沃土计划 2.0” ,将在 2020 年投 入 2 亿美元推动鲲鹏计算产业发展,并公布面向高校、初创企业、开发人员及合作伙伴的扶持细 则。华为携手腾讯游戏启动在鲲鹏领域的全面合作,并与麒麟软件、普华基础软件、统信软件、中 科院软件所共同宣布基于openEuler 的商用版本操作系统正式发布,加速鲲鹏生态在各行业落地。

以“ Kunpeng+昇腾”算力为中心,华为鲲鹏产业已经聚集了众多产业合作伙伴,涉及应用软硬件、 开发、人才培养等全方位的鲲鹏生态体系已经建立。

4. 海光:一度受贸易摩擦影响,产业链恢复程度有望超预期

海光(Hygon)获得 AMD x86 授权:2016 年,为应对危机,AMD 成立了天津海光来授权 x86 芯片 的设计,由此获得 2.93 亿美元现金。天津海光成立了成都海光微电子和成都海光集成电路公司。 AMD 分别拥有海光微电子股份 51%和海光集成电路 30%的股份。海光微电子由 AMD 持有大多数 控股,因此被授权使用 x86 的设计。截至 2019 年中 ,曙光持有海光信息 36.44%的股份。

海光信息营收显著增长,净利润实现转正。海光信息近 3 年收入明显增长,海光信息近 3 年收入 明显增长,由 2017 年的 0.14 亿增长到 2019 的 3.9 亿元,净利润也实现了超过 6000 万元。

2019 年,海光进入实体清单,产业链一度受到影响,但恢复程度有望超预期。依托中科曙光、中 科院的雄厚的研发实力,从长期来看,海光具备吸收先进的技术并做出自主改进和升级的能力,供 应链的影响逐步减弱。在半导体生产线全球化布局的大背景下,公司通过全面梳理供应链,积极寻 找可替代部件,也和部分上游企业进行了积极沟通,以促进交易恢复。公司供应链运营方面取得了 实质性进展,已经形成了相对完整的应对方案,能够保持公司供应链平稳运行。可以看到,掌握先 进制程工艺的厂商已经有三星、中芯国际、台积电等厂商。

我们认为,海光在吸收了 AMD 的技术的基础上,凭借 x86 的生态和性能优势,依托中科院、中 科曙光的研发实力支撑,通过整合供应链资源,有望在 2020 年实现市场份额的进一步突破。

三. 国产数据库:机遇和挑战同在

1.数据库基本概念和发展趋势

全球数据库行业的 4 个趋势:1)关系型数据库仍然占据主导地位,非关系型数据库逐渐崛起;2) 云厂商自研数据库逐渐崛起;3)开源数据库的重要性逐渐提升; 4)为适应复杂的应用场景,多 模数据库成为重要方向。

国内数据库厂商受益于三个机遇:1)信创战略对国产生态体系的推动;2)大数据时代,非结构化 数据处理需求以及高并行运算带来数据库行业技术革新,国产厂商存在弯道加速的机会(不一定短 期内可以超车);3)国内云计算巨头入局,一定程度改变了竞争边界,打破了过去以 Oracle 为代 表的巨头垄断格局。

数据库是非常重要的基础软件,和操作系统、中间件并列为三大基础软件。几乎所有的应用软件都 要基于数据库去存储、管理和处理数据,数据库直接影响到应用软件的运行效率、可拓展性、灵活 度和可靠性。对于应用软件的开发,选择合适的数据库是非常重要的环节。

数据库随着数据处理的需求不断变化:早期是一致性的数据,随着互联 、云计算、AI 的发展,非 结构数据重要性开始提升,数据库也经历了由集中式向分布式的演化。另外,互联 对于低成本数 据库的需求,催生了开源数据库的兴起。主流的云服务厂商,很多都有自己研发的数据库产品,也 成为行业内的一股新兴势力。

数据库根据数据结构和功能这两个维度进行划分。根据数据结构,可分为:关系型数据库、非关系 型数据库;根据功能不同,可以分为:操作型数据库、分析型数据库。

不同类型的数据库侧重点不同,相应的优势和适用领域不同,也存在各自的短板。所以,并不存在 可以适合所有领域的数据库产品。

操作型数据库:主要面向两类事务数据:需要记录下来的数据,以及临时数据。需要记录的数据一 般和应用软件相关(比如 ERP,CRM 等),需要稳定存储下来,以便在未来某个时间进行查询或分析 使用。临时数据一般也和应用软件相关,但是诞生于软件运行过程中,而且在应用软件任务结束后, 没有必要存储下来的数据。因此,临时数据对于一致性的要求更低,经常使用非关系型数据库进行 处理。

分析型数据库:并不直接链接到某个应用。常用于数据仓库、商用智能软件和数据科学场景。分析 型数据库经常包含了从操作性型数据库提取出来的,用于大数据分析的数据。

关系型数据库是建立在关系模型基础上的数据库,关系模型就是“一对一、一对多、多对多”等关 系模型,一个关系型数据库就是由二维表及其之间的联系组成的一个数据组织。关系数据库基于结 构化的查询语句(structured query language, 简写为 SQL)。关系型数据库包括主流的 Oracle, Microsoft SQL Server,MySQL,PostgreSQL,DB2,Microsoft Access, SQLite,Teradata, MariaDB,SAP 等。

关系型数据库目前仍占据主导地位。据 DB-Engines Ranking 统计,全球受欢迎度前十的数据库名 单中,有 8 家是关系型数据库,Oracle、MySQL 和 Microsoft SQL Server 占据前三。

关系型数据库最大的特点是数据的一致性(事务一致性),由于以标准化为前提,数据更新的开销很 小。而传统的关系数据库的横向拓展性不强,灵活性不足(由于预先定义了关系结构)。传统的关系 型数据库,在涉及到大量的非结构化数据以及高并发操作的领域表现不佳。

非关系型数据库:为了处理非结构化数据,同时适应高并发、灵活拓展的需求,非关系型数据库应 运而生。非关系型数据库也支持除了 SQL 之外的语句,因此也被标记为 NoSQL。根据数据存储形 式不同,非关系型数据库包括:文档型、图像型、健-值存储型、时间序列型和宽列式数据库。

非关系型数据库的优势在于易用性、灵活可横向拓展,对于非结构化数据处理能力更强。而且,非 关系型数据库经常内置于 API 之内,开发者无需深入理解数据库的结构就可以简便地实现查询。 非关系型型数据库主要的短板在于数据不一致性,而且技术发展也不如关系型数据库成熟。

全球数据库的市场份额(商业版)仍然存在少数寡头垄断局面。从市场份额来看,根据 IDC 数据, Oracle、微软、 IBM 占据了关系型数据库收入份额的 79%,垄断地位较高。非关系型数据库中,微 软、IBM 和 InterSystems 的收入份额占全球前三,总计为 76%。整体来看,商业版本市场中,少 数寡头的市场地位仍然较高。

云计算厂商崛起,逐渐加入市场领导者阵营。根据 Gartner 在 2017/2018/2019 公布的操作型数据 库魔力象限,Oracle、微软、SAP 和亚马逊一直处于“市场领导者”象限,而阿里云在 2018 年位 列“市场前瞻者”象限,2019 年位列“挑战者”象限,在得分位置上接近领导者象限。其中,Oracle 代表传统的主流数据库厂商,亚马逊和阿里云代表崛起的云计算厂商。

开源数据库的话语权逐渐增强,形成对商业版本的冲击。开源的数据库版本,凭借其全球开发者 区带来的创新和技术活力,以及几乎为零的使用成本,迅速得到互联 厂商的青睐。整体来看,在 口碑和欢迎度方面,开源厂商逐渐和商业版本形成势均力敌的局面。

开源版本主要在非关系型数据库市场获得青睐,而关系型数据库市场仍然由商业版本主导。根据 DB-Engines 站上对各个类型的数据库的得分对比来看,开源版本的数据库在几大类非关系型数 据库(列存储、时间序列、文件型、健-值型、图像型)的欢迎程度较高。而在关系型数据库领域,商 业版本仍然占据主导地位。非关系型数据库兴起时间较短,主要伴随互联 兴起而发展。非关系型 数据库更强调灵活度,而不是数据一致性。对于强调稳定的数据一致性的领域,也就是关系型数据 库领域,商业版本的技术积累时间更久也更成熟。

多模(multimodel)数据库是重要的发展趋势。过去,从全球整个行业范围来看,数据库的版本和厂 商较多,而且技术路线明显不同,优势领域也不同。随着数字化进程的推进,具体的应用软件项目 可能要涉及到更复杂的数据场景,需要多方位的数据处理能力,因此不得不集成了多款数据库产品 来完成一个复杂项目。而集成不同技术路线的数据库,势必会影响整个项目的效率。为了降低技术 摩擦导致的效率低下,也为了更贴合用户复杂场景的使用,很多数据库厂商逐渐向多模数据库的方 向去发展。另外,关系型和非关系型数据库之间的界限也在逐渐模糊化,以更好适应用户需求。

2. 国产数据库厂商:“老四家”和新起点(略,详见 告原文)

国内的数据库理论最早在 1970 年代引入,在部分领域进行了自研,但在发展早期,市场仍然由 Oracle、IBM、DB2、Informix 主导。随着互联 兴起,MySQL 等开源数据库被互联 厂商青睐, 互联 行业的飞速发展也带动了国内对于数据库技术和知识的重视程度,人才资源逐渐积累。在 90 年代末和 21 世纪初,重要的国产数据库公司成立,并开始进入市场。随着云计算的发展,云厂商 针对云的业务场景自研的数据库也登上了历史舞台。整体来看,Oracle、IBM 等海外厂商在国内 的市场地位不断削弱,属于国产数据库的行业空间逐步展开。

国产数据库行业“老四家”+新巨头格局:老四家是达梦、人大金仓、南大通用、神舟通用;新巨 头是阿里 Oceanbase、华为高斯 GaussDB、。国产数据库发展面临的主要压力是,以 Oracle 为 代表的国际巨头厂商的技术壁垒、生态基础和先发优势较强。数字时代新的需求导致的数据库技术 革新,为国产数据库发展提供了机遇。在大数据时代,高并发运算、非结构数据处理、灵活拓展等 需求的重要性提升,使得传统的关系型数据库巨头厂商过去针对集中式数据场景的技术优势被削 弱。国内互联 行业蓬勃发展,互联 巨头入局,也带来了行业竞争边界的变化。整体来看,随着 信创战略的推广,国产数据库产业有望获得新的发展机遇。

……

四. 国产操作系统:开源建设生态,统一形成合力,崛 起就在眼前

根据核心代码是否向开放,操作系统可划分为两类:开源系统、闭源系统。

1.)闭源操作系统:代码不开放,以微软 Windows 系统为代表

微软公司内部的研发团队开发 Windows 操作系统,并开发配套的应用软件,比如 Office。在生态 建设方面,Intel 和 Windows 长期合作形成 Wintel 体系,在 PC 端市占率全球领先。

Windows 系统最大的优势在于图形界面,使得普通用户操作起来非常便利。相比大部分 Linux 系 统,windows 的常用软件安装和系统设置不需要以命令行的方式去输入系统指令,只需要点击“按 钮”即可完成。如今,绝大多数常见软件、专用软件和底层硬件都支持 Windows 操作系统,形成 了 Window 强大的生态整体。

2)开源操作系统:代码免费开放,以 Linux 操作系统为代表

Linux kernel(内核)由 Linus Torvalds 在 1991 年发布,代码免费公开,由全球开发者共同贡献, 已成为影响最广泛的开源软件项目。以 Linux 内核为基础,不同的开发团体(开源 区、企业、个 人等)对内核代码进行一定的修改和补充,加入 GUI(图形界面)、应用等部分,形成了相应的 Linux 操作系统发行版。Linux 系统版本之间存在衍生关系,由此形成 RedHat、Slackware、Debian 等 几大家族,各家族内部又衍生出一些著名版本,如 Ubuntu、SUSE、CentOS、Red Hat Enterprise Linux、Fedora 等。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年3月8日
下一篇 2020年3月8日

相关推荐