news center
广鹏产品案例社区目录(备注:V.***为版本号)
(本文转载自曾松鸣老师,文章连载/修订中)
3 突发事件的应急响应(V.230204)
3.1 根据现象快速解决,及时止损(V.230204)
3.2 具有应对措施,按部就班进行处理(V.230204)
3.3 编写应急预案,形成最佳方案(V.230204)
3 突发事件的应急响应(V.230205)
3.1 根据现象快速解决,及时止损(V.230205)
当信息传输发生故障或故障报警时,布线系统是排查的重点之一。应根据现象,分段找出故障所在的系统,如果问题发生在综合布线系统,应进一步,设法找到相关的链路/信道。
排除故障的最简单方法是通知代维公司,让专业人员来找出故障点,并排除故障。但代维公司响应可能需要1~2小时,派人到现场则需要更长的时间。
在代维人员到达前,如果故障造成了传输中断,可使用备品备件构建临时线路。
如果未聘代维公司,可在找到故障所在的链路/信道后,使用现场性能测试仪确定故障位置,进行修复或更换元器件。这时,需要维护人员具有测试仪的使用经验和综合布线系统的端接能力。
在突发事件出现后,应及时保存真实的记录,包括发生、处理的全过程。
突发事件的响应时间和恢复时间越短越好,但考核指标中会给出年度宕机限值。
在系统报警或接到故障投诉后,当班管理人员应立即进行故障确认并将故障对机房运行的影响降至最低。
突发事件处理流程示意图↓
图3.1 突发事件处理流程示意图(举例)
3.2 具有应对措施,按部就班进行处理(V.230205)
应急事件的应对可以逐渐总结经验,找到某一类故障的多发原因,藉此形成应对措施,一步步排查、一步步解决。最终达到一步到位的高手水准。
综合布线系统的故障点多数发生在连接器附近,如:
(1)模块中的线路板/金针故障
(2)连接器(模块是其中的一种)背后的缆线松动或脱落、断开
(3)跳线插头松动
(4)光纤连接器端面积灰、破损、断裂、松动
也可能由于其它现象造成:
(5)调整其它线路或设备时改变了缆线的弯曲半径,或折断了缆线中的芯线
(6)……
3.3 编写应急预案,形成最佳方案(V.230203)
1、将每次故障的全过程形成记录
在运维期间,故障的数量、种类会越来越多,这是正常现象。
每次发生故障后,应将故障产生时的现象、故障原因、排除故障的方法记录在案,后续再发生类似故障时可以借鉴
故障数量的统计将有助于材料库存、人员培训、应急预案制作、局部整改等项工作。
2、编写应急预案
每位运维人员都有自己处理故障的经验和记录,有必要将这些经验和记录共享,并在此基础上,总结出最佳的故障排除预案。
如果发现因先天不足而产生的故障,在条件允许时可考虑运行时逐步排除,在不具备条件时可留待停机时集中处理。
再次发生同样的故障时,运维人员可根据预案快速处理。
应急预案应保存在可随时读取的运维服务器中。
3.4 预留备品备件(V.230205)
故障排除需要有备用的综合布线产品,应在事先予以留存:
1、施工招标时,一般会要求留有一定数量的备品备件。
2、运维期到来时,运维人员应检查备品备件的种类、数量、保存地点
3、进入故障期后,可根据故障的多发概率采购备品备件,补齐库存
(1)系统可能用到的布线产品(包括紧固件、安装附件)均应有所备货
(2)故障多发的布线产品应有更多的库存
(3)形成临时线路的布线材料需考虑在内
3.5 维护盘留能快速排除故障(V.230205)
当故障原因为连接器或连接器的端接时,维护盘留能在几分钟内完成连接器的重新端接
图3.5 可以缩短修复时间的维护盘留工艺
3.6 产品选型对突发事件的帮助(V.230205)
核心功能相同的综合布线产品有许多种造型,每一种造型都有它产生的原因和效果。
有效的产品造型可以大大减轻运维中突发事件临近时的工作量。如:
(1)前拆式配线架可以在机柜正面拆装连接件
(2)抽屉式光纤配线架和旋转式光纤配线架能快速打开光纤配线架
(3)智能布线管理系统能快速定位和发现故障
图3.6 可以缩短维护时间的布线产品举例