系统设计-后台系统的伸缩性

1、软件分层

分层思想很普及,把数据流拆成几段,比如接入层(load balancer+webserver),应用服务层(platformserver),数据存储层(数据库database、nosql)。

 

2、伸缩性定义

一种设计目标,使得系统通过加硬件(堆机器)能够解决各种业务问题,不存在性能瓶颈问题。比如微信红包,接入层、plaform层、数据存储层的数据通道是否够宽,扛得住上亿人同时在线的请求速度p>

2.1 接入层(loadbalancer + webserver)

请参考一个客户端请求到后台的流程:tcp-ip 7层 络通信、负载均衡、API层、数据库中负载均衡部分的内容

(loadbalancerhaproxy) + (webservernginx)

haproxy+nginx 增加带宽容量的对策:加更多域名、更多转发机器

负载均衡在有状态情况下,怎么去堆转发机器用户uid=a的所有请求必须转发到某个服务器b上。请参考一致性hash

 

2.2 Platform层

单例:某个程序,一个时刻所有请求都打到一台机器上,由于一台机器cpu/内存有限,会导致单例性能瓶颈。比如设计了一个请求计数器,让所有请求都得经过这个机器上这个进程,在内存里+1,最后得到结果。

正确做法如下:

(1)各个机器分别计数,然后查询的时候查各个机器结果相加,尽量做分布式(让请求均匀打在各个分布式机器上),避免单例。

(2)尽量只用这一层算,不要用这一层来存具体的数据结果,存数据的话,送到下一层的专门的数据存储层。原因是:业务层的处理逻辑比较多,如果要是再用来维护数据的话,一方面很累,另一方面是数据存储层会有通用的数据接口来存各种各样的数据,没必要用这层来存。存储计算分离,存储统一,计算多样。

 

2.3 数据存储层

做后台一般不会专门让设计存储层,有很多现成的模型。请参考一个客户端请求到后台的流程:tcp-ip 7层 络通信、负载均衡、API层、数据库中数据库部分的内容。

(1)读写分离,增加读实例。 

读写分离来确保写和读效率都很高。写数据因为要确保数据不丢失,所以要写入硬盘,机械硬盘有一个摆臂,只适合采用log(尾部能添加的文件)的方式顺序写,摆臂不需要来回移动,速度最快。读数据需要随机读,硬盘访问数据比较慢,摆臂来回移动效率低。实际上这里面有三个进程:log方式顺序写,key-value方式随机读,把顺序写转化为随机读(log格式转为key-value格式)。

增加读实例:实际应用中,往往有很多场景,写数据次数很少,读数据次数很多。比如说写博客只需要写一次,但有可能同时有很多人在读博客。

(2)拆分:拆库和拆表

redis这种非关系型数据库相对来说好做伸缩,可以对key做哈希,分片到某一台机器上。

关系型就比较难做伸缩,俗称分库(竖直拆分)分表(水平拆分):

  • 把库拆成多个库(每个库有自己的master/slaves机器集群),一个库里面有很多细小的业务,按照每个小业务来拆。

  • 把表拆成多个表,原本只需要查一张表,现在需要查10张表,而且有的表是不能拆的。

每个库里的小业务可以拆到不同机器上。但是一个表拆开的不同表必须放在同一台机器上,因此拆库比拆表性能好点。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年10月25日
下一篇 2019年10月25日

相关推荐