谷歌B4广域 论文笔记

谷歌B4广域 论文之读后感

一、摘要:

         随着互联 数据信息的超线性增长,即使像谷歌这种富可敌国的巨头公司也不得不考虑不断盲目扩容 络带来的巨额成本,这是因为传统的骨干 络链路带宽利用率只有30%~40%,为了保证较好的QOS和用户上 体验,就需要不断扩容 络以保证低负载,专业链路、大型高端服务器这些设备的高额成本促使谷歌开始考虑突破传统 络体系架构的束缚。此外,传统的TCP/IP 络体系只能尽最大努力地传输并且对 络中所有的数据都一视同仁,这就使那些敏感度较高即对 络服务质量要求高的数据包难以满足业务要求,缺乏定制化的服务提供 络架构。

于是,谷歌便成为了在商业领域创新SDN 络体系架构的先驱。对此,谷歌在全球逐步部署了连接各大数据中心的基于SDN架构的B4广域 ,B4主要应用OPENFLOW协议并且采用集中式流量管控使得链路利用率提高到接近100%。

二、我喜欢的论文精髓:

一、 定制化、按需分配带宽的灵活性 络

传统的 络体系都是尽最大努力交付的,当挑剔的用户需要很快的 络访问服务速度的时候,那些需求低的数据流量就会抢占需求高的数据,使得用户体验难以得到最大化的满足。谷歌将数据按需求层次和优先级将数据大致分为三类:

1.      个人终端到服务器的访问和拷贝,例如利用Gmail、多媒体等服务。

2.      远程的数据存储,例如分布式计算、分布式存储。

3.      各大数据中心直接的数据同步。

在用户端我们可以直接感受到的就是第一种,它对一个公司的用户体验、用户量甚至公司利益有着不可替代的影响,然而它确实这三种中所占比例最少的,大概只有10%~15%。第三种数据同步其实是最占带宽和流量的,这样就耗费了最多的资源。B4 络在此进行了重大的改进,在global层通过TE中心服务器对应用按照优先级进行带宽和流量的分配,从1到3优先级递增,最终通过中间的OFC进而控制openflow交换机来按需进行包的处理。

这种灵活定制化的 络对未来各种应用需求有着巨大地推进作用。比如物联 ,当各种各样的电子设备进入我们的 络世界中,无疑加大的 络负荷,当然这其中也存在着一些特别紧急、不能忍受 络延迟的数据,比如一个智能火灾 警器通过 络将火灾信息推送到消防局、无人驾驶的智能汽车在高速行驶中遇到紧急情况通过 络控制制动等等,只有满足超低延迟或者无延迟的要求下,一些应用才能得以发展。 络中大量的冗杂的数据恰恰影响了这类数据的传输,定制化、个性化、按需分配的 络革新是推动这类应用发展的前提。

二、 稳健平滑的SDN部署策略

在WAN这样超大规模的 络中显然不能将SDN的部署一蹴而就,谷歌采取了逐步部署SDN 络的策略,一个一个数据中心平滑地过渡过SDN,而且新的 络体系协议一定要与传统的 络协议相互兼容,否则的话一个数据中心的小问题很可能导致全世界所有的用户有访问不了GOOGLE。论文中提到终极目标是建立一个高度整合集中式的包含传统ISIS等协议和TE的中央服务器,而在实施期间,谷歌只是先部署SDN的基础设施,例如OFC和OFA等,这样可以在部署TE功能之前专注去调试SDN的基础设施架构。在路由选择Routing方面,在原有的路由转发协议上整合新的OF协议,通过编写的RAP来连接Quagga and OF 交换机。

三、高度集中的流控服务器

该论文的又一大亮点就是高度集中式的流量工程服务器(TE),如下图所示

谷歌B4广域 论文笔记

上图第一张表示使用了集中式流量工程之后的 络链路利用率在一天中的变化,可以看到链路利用率从原来的30%~40%提高到接近100%,这无疑大大降低了设备上的成本!

第二张图红色线代表高优先级的数据包与低优先级的比率,蓝线代表高优先级的丢包率,绿色标记了低优先级的丢包率,可以看出高优先级的数据包几乎保持着24小时的零丢包率,这样就可以满足那些对延迟要求较高的应用。

 四、未来研究方向

在发生故障时候更加有效的负载均衡策略。B4 络在没有故障的时候,边缘 络中链路的最大利用率和最小利用率之比为1.05,但在发生故障的时候上升为2,也就是发生故障的时候还存在着优化负载均衡策略的空间。

五、同为WAN方面应用的比较

2013年的sigcomm中微软的那篇《AchievingHigh Utilization with Software-Driven WAN》也同样成为WAN应用方面的经典。在微软这篇Paper中同样也使用SDN集中控制数据层流量的转发,同样将数据中心之间的流量分为三种类型并加以不同的优先级,与B4不同的是此论文创造一种新的思路,在链路上预留出小部分的容量去处理交换机连路状态的更新,然后经常性地重置 络数据层来匹配当前流量需求,此文还指出传统的MPLS-TE方法存在低效、协同性差的不足并用自己设计的SWAN加以改进,最终在实验床上得到了60%的链路利用率的提升结果。与B4虽然在优化结果上差距不大,但是B4体系真正地谷歌的数据中心部署并经过了实践的检验,单从这点上微软的这篇Paper还存在着较大的差距。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2015年7月26日
下一篇 2015年7月26日

相关推荐