服务器故障!“B站崩了”冲上热搜第一?

昨晚夜深人静之际

当你打开B站刷视频的时候

却发现

? ? ?

??瓦特??

这小破站咋地肥事?

打开微博发现

? ? ?

微博出现了各种版本说法

B站停电了……

B站起火了……

B站被偷袭了……

B站大楼塌了……

直到凌晨2点20分

官方终于通 了原因

? ? ?

服务器机房故障?

于是……在新媒体各大平台

IT界的各路神仙开始沸腾了

“B站这个这么大一 交平台

难道没有两地三中心的容灾中心?

还是说两地三中心没有被负载成功拉起?

又或者是云服务器CDN挂掉了?

关跟着CDN也挂掉了?”

各路神仙提了不少猜测

友们听得更是云里雾里

那今天,咱们就来说说

什么是异地容灾负载均衡

在数字化时代

IT系统的故障

会直接导致难以估量的损失

尽管我们上了多重的保险

但自然灾害、人为因素等因素

都可能会造成业务中断

著名的911事件就是典型的例子

那怎样才能减轻这种风险呢?

异地容灾无疑是最好的选择

容灾体系介绍

异地容灾,顾名思义就是在不同的地域,构建一套或者多套相同的应用或者数据库,起到灾难后立刻接管的作用。

数据中心

集团公司通过两地建立三个数据中心,通过双活、冷备等方式,实现两地三中心容灾架构。

体系建设

_

系统类型

容灾策略

核心业务系统

两地三活

关键平台系统

同城双活

非关键系统

异地冷备

技术方案

异地冷备

恢复能力 RTO≤1h,RPO≤5min

选取异地数据中心搭建灾备环境,通过公司统一平台工具实现应用配置同步,生产库与同城库可进行实时同步,同城库与异地灾备库可进行异步同步。

端到端双活

恢复能力 RTO≤10min,RPO≈0min

系统在两个地理节点部署所有组件并同时承载业务,当其中一个地理节点的系统组件发生故障时,部署于其它地理节点的系统组件可以及时完成业务接管。

B站作为知名的 交平台

想必异地容灾的IT架构还是有的

那为什么服务器还是崩了呢?

不少IT界的 友猜测

可能是因为负载均衡跟不上所导致的

毕竟B站的访问量惊人

负载均衡要承载的并发数也相当高

那,什么又是负载均衡呢?

负载均衡(Load Balance,简称 LB)是高并发、高可用系统必不可少的关键组件,目标是尽力将 络流量平均分发到多个服务器上,以提高系统整体的响应速度和可用性。

通俗点讲

这种官方的说法可能比较难理解,为此小编特地请教了我们的售前工程师讨了个说法:

负载均衡,打个比方,一个150斤的人,需要2只才能拉得动,假设当这个人换成一个250斤的,那可能就需要3-4只才能拉得动了,而负载均衡则可以实现系统自动分配多几只来支援,轻轻松松就能拉动这个250斤的人。

负载均衡的作用

高并发:负载均衡通过算法调整负载,尽力均匀地分配应用集群中各节点的工作量,以此提高应用集群的并发处理能力(吞吐量)。


伸缩性:添加或减少服务器数量,然后由负载均衡进行分发控制。这使得应用集群具备伸缩性。


高可用:负载均衡器可以监控候选服务器,当服务器不可用时,自动跳过,将请求分发给可用的服务器。这使得应用集群具备高可用的特性。


安全防护:有些负载均衡软件或硬件提供了安全性功能,如:黑白名单处理、防火墙,防 DDos 攻击等。

B站这波事件

可没少折腾运维人员

传闻昨晚B站大楼灯火通明

不知道又熬秃了多少运维人

望各大企业引以为鉴

尽早做好异地容灾和负载均衡

切莫因小失大

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年6月3日
下一篇 2021年6月3日

相关推荐