你帶的團隊,線上故障頻發?並不是技術能力問題
- 2020-03-14 21:07:00
- IDO老徐 原創
- 13901
某团队,做SaaS平台的,业务很复杂,接入的第三方系统繁多;每月总能有那么一次线上故障 。
而且,一旦出故障,还是那种几个小时才能恢复的那种 。
另,一个严重的问题是:每次出故障,平台自身并没有任何的预警,用户反馈了,才知道自己平台某个环节(业务流、功能等),出故障了 。
另外,出故障,就得紧急修复,慌忙之中,紧急上线,修复一个问题,往往带来新的Bug 。
客户一堆投诉 。
老板一顿痛骂 。团队开会反省 。
最后,出了一堆的复盘报告、后续处理措施... ;1个月后,其他模块的,类似问题,又来了 。
如此反复,1年结束了 。
总是在「出故障 -> 紧急修复 -> 客户投诉、老板痛骂 -> 团队开会复盘」的循环中 。
这里的问题是什么 ?
1、故障应急预案 。
2、核心业务的数据监控 、 可用性监控 。3、巡检机制 。
4、上线流程 。
等等 。
注:如上的这个案例,场景熟悉否 ?你的团队是否有类似情况 ?
这里的问题,跟技术强相关么 ?有哪些是测试团队可以做的 ?
做了一個混了十幾年的老司機,老徐覺得「核心業務/核心業務場景 的 自動化回歸」,測試團隊得做(而且投入不了太多資源,就有效果) 。
核心业务,业务流回归、业务场景回归 ,确保上线任何版本,不会导致已有问题出故障、而团队不自知的情况 。
如果做不到自动巡检 。
定期人工巡檢 ,这种最传统最土的方式,但有效 ;
每天早上,專人把核心業務走一遍,出問題及時聯系開發解決,在用戶發現前,把問題修複了(這一條,沒任何的技術含量,但會有一點點效果)。
类似的,可以做的,非技术手段,很多很多 。
对于,质量团队Leader,每天都应该思考这些 ;而不是把自己陷入各种无意义的会议,或者具体的测试执行中 。
如果你有任何的團隊管理问题、问题解决能力的问题,欢迎加入「百人計劃
5期」,2020一起成长、一起探讨 。
End 。
推薦文章:软件测试从业者终极目标,线上零BUG如何实现 ?
IDO老徐
2020.03.05 深圳
補充:
重磅推荐,每年1期,每期1年的「百人計劃5期」已启动报名,等了这么久,终于来了 百人計劃 5期 启动报名
IDO老徐
全网同名,个人IP公衆號
日更10年,每天 1 分钟、解决 1 个问题
職場、副業、輕創業、寫作、個人IP
公衆號、視頻號、小红书、知乎
長按/掃碼,關注IDO老徐
關注回複 401 送你「十年原創资料包」
聯系人: | IDO老徐 |
---|---|
Email: | 957863300@qq.com |
QQ: | 957863300 |
微信: | 957863300 |
微博: | isTester |
網址: | idoxu.com |
地址: | 中国 · 广东 · 深圳 |
來源備注:老徐博客