第一节、总则
1、保证人员和财产的安全为前提的原则:在由于火灾或电力问题造成的主机故障,在解决故障前,应以保证人员的生命安全和财产的安全为前提,然后进行故障的解决。
2、最快时间恢复业务的原则:本着先想尽一切方法,尽快恢复业务的原则来处理故障,如在有备用设备的情况下,主设备产生了故障,应先尽快将应用切换到备用机上,使业务能够运行,再对故障设备进行诊断和维修。
3、故障应急人员高度负责的原则:当故障应急人员在节假日接到故障通知时,本着高度负责的态度,应迅速接手处理障碍,如远程无法处理解决,应迅速赶到故障设备所在地,进行现场处理,处理故障的同时应及时向领导汇报。应急人员不可互相推卸责任,如因特殊情况,确实无法处理障碍,部门领导必须安排好其他人员处理。
4、尽可能全面的保留故障现场的原则:当故障发生后,应急人员应尽可能全面的备份出能够反映故障现象的各种日志、记录、受损文件等,便于业务恢复后,对故障的分析、解决,杜绝故障的再次发生。
应急方案的目标:保证各系统连续安全稳定地运行。
第二节、应急领导小组
应急领导小组由实验教学中心主任担任组长,由学院办公室主任担任副组长。
1、应急小组组长职责:
(1)保证在任何时间,及时协调应急行动所有涉及的岗位人员;
(2)提供必须的紧急响应设备;
(3)在紧急情况下全面负责紧急行动;
(4)在必要时向外界求救,例如:119、110、120等。
2、应急小组副组长职责
(1)在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;
(2)根据获得的应急信息下达命令。
第三节、电源系统故障应急处理
定期检查信息中心机房电源设备的运行状况,当发生下列突发事件时,按以下方案进行处置:当中心机房发生市电供电突然停电或远程报警电源异常时。首先确认是否为正常停电及预计停电时间。检查不间断电源的电池可供电时间,需在不间断电源供电时效内关闭所有服务器及网络设备。联系查看停电原因,尽快恢复供电,并将情况报告相关领导
使用UPS系统,在紧急情况发生时,应按如下步骤进行关机:
(1)确认所有负载均已安全关机。
(2)关闭UPS负载电源。
(3)将UPS的系统启用开关切换到off 的状态。
(4)将DC电池连接断路器切换到off的位置。
(5)断开PDU上的断路器。
(6)将PDU后面总输入断路器切换到断开位置。
(7)将每个上行主电路断路器切换到断开位置。
第四节、机房漏水应急应急处理
1. 发生机房漏水时,第一目击者应立即通知机房管理人员。
2. 若空调系统出现渗漏水,机房管理人员应立即安排停用故障空调,清除机房积水,并及时联系设备供
应方处理,同时启动备用空调,必要情况下可临时用电扇对服务器进行降温。
3. 若为墙体或窗户渗漏水,机房管理人员应立即采取有效措施确保机房安全,同时安排通知办公室,及时清除积水,维修墙体或窗户,消除渗漏水隐患。
第五节、机房火灾应急应急处理
一旦机房发生火灾,应遵照下列原则:首先确保人员安全;其次保护关键设备、数据安全;三是保护一般设备安全;人员疏散的程序是:机房工作人员立即按响火警警报,并通过119电话向公安消防请求支援,所有人员戴上防毒面具,所有不参与灭火的人员按照预先确定的线路,迅速从机房中撤出。人员灭火的程序是:首先切断所有电源,启动自动喷淋系统或使用灭火器,灭火值班人员戴好防毒面具,从指定位置取出泡沫灭火器进行灭火。
第六节、空调系统故障应急处理
定期对空调的运行情况进行检查,如有报警信息,应及时查找故障原因,对于不能自行排除的问题,应及时与设备提供商进行联系。 当中心机房主空调因故障无法制冷,致使机房内环境温度超过摄氏40度时,打开机房房门,并关闭所有服务器及网络设备。对于无法自行处置的空调系统异常情况,及时与设备提供商联系,并向组长报告。