二三读书

字:
关灯 护眼
二三读书 > 首富从看见信息面板开始 > 第六十五章 系统的问题

第六十五章 系统的问题

第六十五章 系统的问题 (第2/2页)

她越说越来劲。
  
  陈建业的脸色越来越难看。
  
  姜亦心感叹了一声:“我真的是第一次见有人那样排查问题的,连日志都不看就知道瓶颈在哪,现场写改动,就好像不用思考一样。”
  
  陈建业站在那没动,开物的扩容计划是韩路一让他写的,崩了。
  
  “老陈你脸色不太好,”姜亦心歪了一下头,“昨天孩子看病累着了吧?”
  
  “有点。”
  
  “那你多喝热水啊。”
  
  姜亦心走了。
  
  陈建业也在工位坐下来。
  
  打开飞书,群里置顶了一份文档,是韩路一写的,标题是《10.15线上事故复盘》,他点进去,从头开始看。
  
  开头是事故时间线:16:27在线人数突破五千,16:31推理队列明显堆积,16:38首批用户超时,16:52超时率突破40%。
  
  影响范围:全部在线用户,持续约三小时,预估流失用户数待统计。
  
  然后是根本原因分析,用的五个为什么方法:
  
  为什么服务崩了?用户量超出设计上限。
  
  为什么用户量超出上限?社交媒体病毒式传播,增长超出预测。
  
  为什么超出了没有预警?没有设监控阈值。
  
  为什么没有设监控阈值?上线流程里没有。
  
  为什么上线流程里没有?我们还没有正式的上线流程清单。
  
  最后是改进清单,监控阈值、压测标准、上线流程清单、架构扩容方案,每条后面跟着负责人和截止日期。
  
  他从头翻到尾,通篇没有出现他的名字——不,出现了,架构扩容方案负责人。
  
  旁边赵磊一直在敲代码,中间去接了次水,路过他工位看了一眼,没打招呼。
  
  看完文档,陈建业又坐了一会,然后他站起来,往韩路一工位走过去。
  
  韩路一面前的两块屏幕,一边是代码,一边是飞书文档。
  
  “韩总。”
  
  “老陈啊,”韩路一抬头看到陈建业,“孩子好点了吗?”
  
  陈建业一愣。
  
  他走过来之前想了很多种开场——道歉、解释、主动认错。他没想到第一句话是问孩子。
  
  “退烧了。”
  
  “那就好。”韩路一的语气跟闲聊差不多,顺着就切进了工作,“昨天下午用户暴涨,把后台冲垮了。我们做了紧急处理,现在系统是临时方案。现在用户量还在涨,得赶紧重新设计一下,我正在写复盘文档,等写完了你看一下,做一下参考,再出一版设计给我。”
  
  陈建业坐在椅子上,没接话。
  
  他不知道说什么。
  
  他在鼎盛干了十多年,见过太多次事故复盘了,每次复盘会都只做一件事,就是甩锅。先找是谁的锅,再定处罚,最后写一份没人看的改进方案。
  
  “韩总……你不开除我吗?”
  
  韩路一看着他,表情严肃了下来。
  
  “我昨天看过了,你做的架构能支持两千同时在线,昨天一下涌进来三万新注册用户,这是谁都没想到的。”
  
  韩路一停了一下。
  
  “老陈,你记住,人都会犯错,所有的线上事故,都是系统流程的问题,不是人的问题。”
『加入书签,方便阅读』
热门推荐
御鬼者传奇 逆剑狂神 万道剑尊 美女总裁的最强高手 医妃惊世 文明之万界领主 不灭武尊 网游之剑刃舞者 生生不灭 重生南非当警察