分布式数据库系统原理

分布式数据库系统，简称为DDBS。它源自于两种数据处理方法的结合，一个是数据库系统DBS，另一个则是计算机络。

很有意思的是数据库系统是将企业运营的数据集中起来，提供对数据可控制的存取。但是计算机络技术提倡的是一种反对集中的工作模式。这两种对比如此鲜明的技术合在一起变成了分布式数据库技术，这种技术追求的是在可能取得集成的情况下放弃集中。

分布式

分布式处理（或者是分布式计算）没有准确的定义。

我们使用的分布式计算系统的定义要求它具备一定数量的自主式处理单元，这些单元通过计算机络互连，并且协同处理它们各自分配到的任务。这里的处理单元是指能够执行自己程序的计算装置。

到底是什么需要分布，其中之一可以是处理逻辑。另一种可能的分布，是按照功能。第三种可能的分布则是根据数据，应用所使用的的数据可以分派到若干处理站点上。最后，控制也能够分布。不同任务的控制执行也可以分布，而不是由一个计算机系统完成。

为什么需要分布式处理更好地和现如今分散企业的组织结构相对应。互联的趋势大部分是在向分布式计算进行改变。

分布式处理背后的根本原因是，使用分治的思想应对今天所面临的大规模数据管理问题。如果能够开发出所需的支持分布处理的软件，就可以把复杂的问题分割成更小的部分，然后把它们分配到不同的软件群上解决。这些软件乓工作在不同的计算机上，形成一个系统，有效工作，共同完成任务。

分布式的概念清晰之后，分布式数据库就比较好理解了。我们把一群分布在计算机络上，逻辑上相互关联的数据库称之为分布式数据库。而分布式数据库系统就是支持管理分布式数据库的软件系统。

络上会有一些集中式的数据库，它会把所有的数据库放在一个站点上。所有的请求全部都会路由到这个站点，这种不足以形成分布式数据库系统。

如下图所示

在分布式数据库中，可以从发送方式、频率及通信方法三个维度来考虑。

其中，不同的发送方式包括：内拉，外推和混合。

内拉服务器到客户端的数据传输是由客户端的请求发起的，客户端的请求到达后，服务端进行相应并查询相应的信息。它的特点是数据的变化是在服务器端的，客户从服务器接收的信息只会限于客户所请求的范围中

外推这种方式是服务器在没有任何客户请求的情况下，让服务器发动。这种方式主要针对的是大家所共同关注的数据，以及什么时间进行发送。因此可选择周期性发送、不规则发送以及条件发送。

混合就是同时使用内拉与外推。在客户端发送查询请求后，此后相关的信息更新后服务端可以自主发送数据到客户端。

频率一般包含周期性，有条件或者凭经验（不规则）。

通信方法一般包含单播和一对多。单播很好理解，就是客户端与服务器端进行一对一的通信。一对多则是服务器向多个客户端发送数据。

分布及复制数据的透明管理

透明的意思就是说对用户“隐藏”了所有系统实现的细节。用户只需要关心怎么用即可，不用在乎这个是怎么实现的。

其中又包含了数据独立性，络透明，复制透明，分片透明，透明的提供者
分布式事务提供的可靠性
改进的性能
更加容易的系统拓展

这些都只是一些分布式的基本概念，而且我觉得都没有确切的概念。感觉还有很长的一段路等我去探索，前路漫漫…

文章知识点与官方知识档案匹配，可进一步学习相关知识云原生入门技能树首页概览8747 人正在系统学习中

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！