广电超宽带,百兆普及,千兆引领
前言
转型中的广电运营商旨在构建基于IP的业务 络并提高其可靠性,已达成业内共识。但如何顺利实现可靠性的预与立,并非人人皆知。
我们构筑99.99%的高可靠性 络,即每年宕机时间仅为52分钟。业务流量快速切换并且具有强壮性。由于IP技术的复杂性,必须要采用一系列的技术,才能获得所期望的可靠性。高可靠性已成必然需求。
络的可靠性是分层级的,可以分为 络级可靠性和设备级可靠性。 络级可靠性范围覆盖从UNI到应用系统,需要在 络设计之初就提前布局,如冗余节点、备份链路、备份设备、 络协议选择,如trunk等。设备级可靠性是 络中设备本身的可靠性,要求MTBF时间长。
络故障是服务中断最重要的原因,操作失误、物理链路故障和 络设备故障是引发 络故障最主要的三个原因,各自占到整体故障发生比率的20% ~ 30%。考虑到IP 络的复杂性,产生了很多专门保证 络可靠性的技术,今天我们只谈最基本的 络设备本身的可靠性,撇开学究的理论,说说我们最擅长的软件可靠性, 是如何保障我们的设备可靠运行的。
软件可靠性定义
1983年美国IEEE计算机学会对“软件可靠性”作出了明确定义,此后该定义被美国标准化研究所接受为国家标准,1989年我国也接受该定义为国家标准。该定义包括两方面的含义:
-
在规定的条件下,在规定的时间内,软件不引起系统失效的概率;
-
在规定的时间周期内,在所述条件程序下执行所要求功能的能力;
其中的概率是系统输入和系统使用的函数,也是软件中存在的故障的函数,系统输入将确定是否会遇到已存在的故障(如果故障存在的话)。
提高软件可靠性措施
开发平台
自研的Teraband OS,基于现有 络分析和对未来 络发展的考量,采用Linux平台开发,具有高可扩展性、高可靠性等特点。平台易于进行模块化并行开发,模块间采用高效的通讯机制。同时兼具多平台特点,可以在不同CPU架构下做快速迁移。
编程规范
为了提高产品软件代码质量,指导软件开发人员编写出简洁、可维护、可靠、可测试、高效、可移植的代码,总结过去各种典型编码问题,并参考软件业国内外前沿企业标准,制定了凌云的编程规范。
清晰:清晰是易于维护、易于重构的软件所必备特征。目前软件维护期成本占整个生命周期成本的40%~90%。根据业界经验,维护期变更代码的成本,小型系统是开发期的5倍,大型系统(100万行代码以上)可以达到100倍。业界的调查指出,开发组平均大约一半的人力用于弥补过去的错误,而不是添加新的功能来帮助公司提高竞争力。
简洁:简洁就是易于理解并且易于实现。代码越长越难以看懂,也就越容易在修改时引入错误。写的代码越多,意味着出错的地方越多,也就意味着代码的可靠性越低。因此,我们提倡大家通过编写简洁明了的代码来提升代码可靠性。
风格一致:在编程风格上,我们不提倡个性化,要求所有开发人员写出的代码都如出一辙。好处显而易见,阅读别人代码没有障碍,维护人员可以快速上手。
单元测试
单元测试(Unit Testing)是针对程序模块(软件设计的最小单位)来进行正确性检验的测试工作。程序单元是应用的最小可测试部件,在过程化编程中,一个单元就是单个程序、函数、过程等,对于面向对象编程,最小单元就是方法,包括基类(超类)、抽象类、或者派生类(子类)中的方法。
为测试时隔离待测试模块,使用单元测试工具如stubs、mock等,构建单元运行所需要的运行条件。单元测试由软件开发人员编写,用于确保他们所写的代码匹配软件需求和遵循开发目标。
系统测试
任何一个开发人员在系统实现时,总会或多或少的出错,对整个系统而言是不允许出错的,所以系统测试应运而生。系统测试是寻找系统错误,特别是不经常出现的错误、隐藏的错误。系统测试是为了发现错误而执行程序的过程,是为了证明软件有错,而不是证明软件无错误,一个成功的测试是发现了至今未发现过的错误。
软件FMEA
FMEA(Failure Mode and Effects Analysis)即失效模式与影响分析。
从每次的失效和故障中习得经验和教训,是一件代价高昂而又耗费时间的事情,FMEA刚好是一种用来研究失效和故障的更为系统的方法。二十世纪四十年代后期,美国空军最先采用了FMEA方法,尽管最初是由军事领域所建立的方法,但FMEA方法学现在已广泛应用于各行各业。
对系统范围内潜在的失效模式加以分析,以便按照严重程度加以分类,确定失效对于该系统的影响,并针对失效分析做出有效的软件检测机制和业务恢复机制。简单讲就是我们分析所有软件、硬件可能会失效的点,做出针对性的定时检测,一旦发生失效,按照对业务的影响范围做有效的恢复。
FIT测试
FIT(Fault Insertion Test)故障注入测试是与FMEA分析对应的验证机制。目的是验证产品的可靠性是否达到设计需求,检验在各种可能的硬件和软件缺陷被激活时,被测系统的容错设计能否有效发挥作用,恢复系统,如果无法恢复需要上 告警,以便用户发现故障点,手动修复业务。
集团以推动行业用户发展为使命,为国际上五十多家知名光电子公司在中国内地与香港地区做市场拓展、产品推广和应用技术服务。自2000年起,开始在高端视觉图像和光通信领域进行专业研发和生产。至今,已经发展成为员工过1200人,产值逾12亿,自主品牌研发生产和国外品牌代理服务相结合的现代高科技企业。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!