深夜突发 友炸了 B站是怎么崩的?

7月13日晚间,B站出现了访问故障,B站崩了!???

B站崩了迅速登上热搜,除了 站和移动端显示加载错误之外,B站出品的清视频剪辑软件均无法打开,显示页面加载错误。

当天深夜,B站恢复了正常运行,但是该故障持续时间超过了一个小时,相关话题一度引起 交媒体平台热议,而B站在凌晨02:20发布回应称,原因是因为部分服务器机房发生了故障,技术团队随即进行问题排查和修复,现在服务器已经能够陆续恢复正常。部分服务器机房发生故障,什么故障能导致国内国外用户都无法访问呢?

此次B站机房故障第一种情况可能是机房电力故障。机房电力故障是引起大规模服务器档期的主要原因,比如说这个7月8 之前参与的某个节点项目,由于机房电力问题,导致节点的所有设备全部重启,业务中断,一旦重启部分业务就得重新部署。只要机房的电力断掉了,服务器就停机了,无法提供服务,自然也就无法访问。所以电力系统中断是数据中心机房最严重的故障。

那机房就这么容易停电吗?当然不是!如果机房跟家里的电力系统一样,经常停电的话,那整个互联 生态,都要崩掉,所以说现在电力系统有多重保障,首先是双路市电进入数据中心,任何一路市电断掉了,还有另外一路市电可以继续提供电力,其次,数据中心有UPS室存放UPS组,不间断电源,你可以理解为是超大型的充电宝。

当市电停电之后,UPS可以稳压震流,并且提供短时间的机房供电。与此同时,另外一个地方也会立马响应,就是柴发室。大型数据中心的柴发室,一般会放20多台超大型的柴油发电机!意外断电后啊,柴发室在30秒内启动,并在一分钟之内达到额定负载。

2020年双11之前,阿里对电力系统就进行了模拟演练,直接切断了电源,阿里系统的柴发室,在4秒内就启动服务器!!!没有受到任何影响。

那既然如此,这么多的电力系统保障,那为什么还会出现电力中断的情况呢?这就得说一说,每一层电力系统的保障漏洞!

双路市电是数据中心机房的标准配置。但是,不是所有的机房都严格执行的了双路市电进入数据中心标准。不少数据中心还是单路市电。其次,部分机房由于电力系统的设计漏洞后期,会出现电力整改的情况,一旦电力整改,就必定会影响现有的设备运行,导致机房整体掉电,所以B站此次机房故障,大概率是因为电力系统整改不当。或者是超负荷引起的机房设备大规模停电。

那除了电力故障以外,还可能是B站核心主机房的 络故障。

一个 线可以让设备连接互联 ,但也可以让一个机房 络全部瘫痪掉。两个月前,一位机机房运维工程师,因为操作不当,将 线插错了交换机的端口。导致交换机,整个机房的CDN节点全部瘫痪掉。所以,指不定这位工程师现在去B站上班了啊。

另外,基本上经常出现交换机割接和交换机替换的情况。那这种操作呢,一般会在凌晨一两点的时候进行,因为此时流量是最小的。交换机切割,还要切换需要切换流量。如果说操作错误,也会导致 络中断。而此次B站崩溃的时间是在晚上11点左右,也不排除有准备流量割接的准备的可能。

一般情况下,基本的 络运维啊,有严格的流程管控。大型的互联 企业会对综合布线的要求比较高, 线光纤的布放必须要做到整齐划一。所以B站机房,被踢掉 线的可能性不是很大。

2015年5月27 ,支付宝因为杭州市萧山区某个光纤被挖断了,导致部分用户无法使用支付宝。那这也是属于严重的 络事故。

那此次B站有没有可能也是是光纤被挖断了呢,可能性也不大,支付宝是因为光纤被挖断,导致用户无法访问,那是因为阿里在杭州有千岛湖水中心,属于阿里自建的数据中心。

支付宝的大部分流量都要走到杭州。而B站还没有自己的数据中心,租赁的是运营商的机房,如果说是室外光缆被挖断,除了B站以外,其他的使用该机房的公司也会受到影响。所以此次B站的机房光纤被挖断的可能性也不是很大。

2015年5月28 ,携程发生的瘫痪门事件,一开始表示是服务器遭受了不明攻击。然后二次回应是,员工删库跑路了,此次B站的机房故障会不会发生跟携程一样的事件,不得而知。

不少 友提到了CDN故障。CDN是内容分发 络,B站会在全球各个中心城市去建设小节点机房。可能就放个百八十台服务器,做内容缓存发。比如B站在天津建立了CDN节点,那么,天津的B站用户啊,流量只需要走到天津的B站的机房节点,就可以返回数据了。

流量不需要到B站的主机房,这样不仅可以减缓主机房的压力,还可以大大提高用户的访问速度,基本上大型的互联 企业都会建设CDN机房,做CDN内容分发。此次B站大规模瘫痪,不是特定的地区或城市发生的,所以CDN节点故障的可能性也不是很大。

有消息称,是内蒙的机房出现了故障,那以此推断B站的主机房大概率会出现在乌兰察布,因为乌兰察布市全国数据中心基地。阿里、苹果这些企业在乌兰察布都建设的数据中心。至于为什么会在乌兰察布去建数据中心呢,小编在今后的推送中给您讲解。

机房的运维管理是一整套的系统。他涉及到it架构、系统、 络、it硬件、消防、制冷电力等等,任何一个环节出现了问题,都有可能引起机房故障。每当我们舒舒服服躺在沙发上,吹着空调,逛着淘宝,刷着短视频,背后都有一群工程师在默默地守护着。服务器硬件工程师、综合布线工程师、系统工程师、 络工程师、电力工程师、暖通工程师、开发工程师等等,一群机房卫士共同保障你的每一次,浏览访问都非常的顺畅。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年6月10日
下一篇 2021年6月10日

相关推荐