今天在产品软件升级软件后又20+台无法正常使用,需要通过烧片机才可以恢复,影响正常测试工作4天,借这个机会总结下我对产品逃生设计的三个想法。
第一,逃生设计要能保证在各种情况下系统都能够起的来,可以有些性能等问题,但至少能够给系统打补丁或者通过升级版本让整个系统恢复正常。
第二,启动设计要有冗余,有2个区,一个区启动自检并完成正常后后自动同步到另一个区;本次遇到出问题的产品有双区备份,但是没有自测试,可以参考的冗余设计如下:
说明:
- 硬件CPLD支持每次启动自动切换引导区;
- 自检包含各个关键器件:如内存,FLASH, 口等器件(有自测试接口的使用自测试接口,没有的可以考虑使用功能进行替代测试)。
第三,第二不还不能保证时,有个长期备份区或者windows的安全启动模式一样,正常都不使用,出现问题是能够人工切换能进行系统诊断,数据恢复或者升级的操作,让系统能正常启动;
另外发布生产版本时需要慎之又慎,先小面积验证,验证通过后再大面积验证,各个厂家的器件都要尽可能覆盖。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!