昨晚夜深人静之际
当你打开B站刷视频的时候
却发现
? ? ?
??瓦特??
这小破站咋地肥事?
打开微博发现
? ? ?
微博出现了各种版本说法
B站停电了……
B站起火了……
B站被偷袭了……
B站大楼塌了……
直到凌晨2点20分
官方终于通 了原因
? ? ?
服务器机房故障?
于是……在新媒体各大平台
IT界的各路神仙开始沸腾了
“B站这个这么大一 交平台
难道没有两地三中心的容灾中心?
还是说两地三中心没有被负载成功拉起?
又或者是云服务器CDN挂掉了?
关跟着CDN也挂掉了?”
各路神仙提了不少猜测
友们听得更是云里雾里
那今天,咱们就来说说
什么是异地容灾和负载均衡
在数字化时代
IT系统的故障
会直接导致难以估量的损失
尽管我们上了多重的保险
但自然灾害、人为因素等因素
都可能会造成业务中断
著名的911事件就是典型的例子
那怎样才能减轻这种风险呢?
异地容灾无疑是最好的选择
容灾体系介绍
异地容灾,顾名思义就是在不同的地域,构建一套或者多套相同的应用或者数据库,起到灾难后立刻接管的作用。
数据中心
集团公司通过两地建立三个数据中心,通过双活、冷备等方式,实现两地三中心容灾架构。
体系建设
_ |
|
系统类型 |
容灾策略 |
核心业务系统 |
两地三活 |
关键平台系统 |
同城双活 |
非关键系统 |
异地冷备 |
技术方案
异地冷备
恢复能力 RTO≤1h,RPO≤5min
选取异地数据中心搭建灾备环境,通过公司统一平台工具实现应用配置同步,生产库与同城库可进行实时同步,同城库与异地灾备库可进行异步同步。
端到端双活
恢复能力 RTO≤10min,RPO≈0min
系统在两个地理节点部署所有组件并同时承载业务,当其中一个地理节点的系统组件发生故障时,部署于其它地理节点的系统组件可以及时完成业务接管。
B站作为知名的 交平台
想必异地容灾的IT架构还是有的
那为什么服务器还是崩了呢?
不少IT界的 友猜测
可能是因为负载均衡跟不上所导致的
毕竟B站的访问量惊人
负载均衡要承载的并发数也相当高
那,什么又是负载均衡呢?
负载均衡(Load Balance,简称 LB)是高并发、高可用系统必不可少的关键组件,目标是尽力将 络流量平均分发到多个服务器上,以提高系统整体的响应速度和可用性。
通俗点讲
这种官方的说法可能比较难理解,为此小编特地请教了我们的售前工程师讨了个说法:
负载均衡,打个比方,一个150斤的人,需要2只才能拉得动,假设当这个人换成一个250斤的,那可能就需要3-4只才能拉得动了,而负载均衡则可以实现系统自动分配多几只来支援,轻轻松松就能拉动这个250斤的人。
负载均衡的作用
高并发:负载均衡通过算法调整负载,尽力均匀地分配应用集群中各节点的工作量,以此提高应用集群的并发处理能力(吞吐量)。
伸缩性:添加或减少服务器数量,然后由负载均衡进行分发控制。这使得应用集群具备伸缩性。
高可用:负载均衡器可以监控候选服务器,当服务器不可用时,自动跳过,将请求分发给可用的服务器。这使得应用集群具备高可用的特性。
安全防护:有些负载均衡软件或硬件提供了安全性功能,如:黑白名单处理、防火墙,防 DDos 攻击等。
B站这波事件
可没少折腾运维人员
传闻昨晚B站大楼灯火通明
不知道又熬秃了多少运维人
望各大企业引以为鉴
尽早做好异地容灾和负载均衡
切莫因小失大
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!