互联 产品迭代速度很快,推崇快速推出、快速试错、快速占据市场先机,求快是一个显性要求,交付质量和稳定性又是一个隐性要求。个人理解涉及稳定性相关的内容实在太多,大到整个战略方向、宏观架构,小到一次需求改动、一次用户访问,都可能直接或间接影响到稳定性。
从工程架构角度思考,良好的系统架构、测试运维机制、意识与能力是必备的关键因素。
系统架构
总是要尽量拥有良好的系统架构实现,架构设计要消除单点、确保数据一致性、强弱依赖梳理和降级、热点和极限值处理、离线数据流以及异常情况处理。
测试运维
单元测试、回归测试、日志巡检、定期排查线上隐患、日常演练机制(预案演练,模拟线上故障),服务快速回滚,数据快速回溯等都是可参考稳定性机制。
意识与能力
人的意识很重要,专业能力可以锻炼培养。罗列出关键链路,数据与模块,这部分功能一旦受到影响,团队内应该都能尽快发现影响点,出现问题也能尽快定位问题。
从业务需求角度思考,良好的业务认知、需求理解是间接支撑稳定性的必备因素。
业务认知
大型互联 系统业务架构繁杂,不定期进行宏观业务认知、业务方向总结,使全体参与者都能从大局出发思考自己负责的领域。
需求理解
需求务必做到清晰明确,落wiki,对应的方案由方案参与者设定并明确清楚,不留模糊地带。
低价值、无效需求能否不接。
从组织协作思考,良好的项目管理、团队协作是提升稳定性的必要因素。
项目管理
一般理解,工作范围(需求)、时间(交付时间)、质量、成本(人 & 机器资源等)是项目管理四要素,这四个要素互相关联又互相制约,因此要保障好质量就必须要考虑怎么管理好其他3个要素。
橙心现在是类似于敏捷开发的项目管理方式,项目总是求快,尽量合理的分配任务及任务优先级也是确保稳定性的关键。(引用《道德经》:持而盈之,不知其已;揣而锐之,不可长保。)
团队协作
大公司跨团队之间都是各自为政的信息孤岛,组织不定期进行跨团队分享,加强跨团队间学习与了解。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!