随着信息化程度的加深,整个社会、各行业、各单位的业务流程越来越依赖信息系统。服务器上存储着大量的核心信息,运行着重要的业务。作为海量数据的关键载体,数据中心机房是信息化的核心场所。其复杂性、特殊性和重要性不言而喻,但数据中心机房往往如此脆弱。
由于数据中心机房环境条件比较特殊,数据中心机房安全包括很多内容,确保数据中心机房的安全无疑是整个计算机信息系统安全的前提。如果数据中心机房存在这样那样的不安全因素,从而导致发生数据中心机房事故,则整个信息系统的安全也就不可能实现。
数据中心机房常见的事故类型包括电气、火灾、爆炸、设备损坏、通信阻断等,特别是机房火灾,一旦发生将给机房造成不可挽回的巨大损失。让我们回顾下一些真实的事件:
2009年,某市电子政务计算机机房UPS电池发生击穿事故,冒起浓烟。经过约两个小时的扑救,现场浓烟得到有效控制,没有造成人员伤亡。事故导致该市政府门户网站、邮件系统、互联网出口、政务服务中心、住房公积金中心等重要系统一度无法使用。据悉,这起事故原因初步认定为供电不稳定,导致恢复供电后产生的瞬时高压造成UPS电池短路,引发火灾。
2011年,上海武胜路电信大楼13楼机房发生火灾,消防搜救出在机房内维修空调4名工人,经抢救无效全部身亡。据警方通报,起火原因系装潢工人切割施工作业时因未采取安全防范措施引燃风管保温材料所致。
2014年6月,某商业银行总行机房突发线路电气故障并引发火灾,事故具体原因目前正在调查之中,初步估计是由于机房电气系统方面着火。官方表示未对机房设备造成大的影响,传言与实际不符。
诸如此类,尽管数据中心机房有动环监控系统和消防系统,但当灾难发生时,预警与消防系统在火灾面前显得如此无力。
数据中心机房火灾现场(网络配图)
防范胜于救灾,只有提高对火灾的防范意识,落实各项防范措施,才能有效避免火灾事故的发生确保数据中心机房发挥其重要作用。
一,应提高对机房可靠性、可用性、安全性等方面的认识,既要重视信息系统安全,又要重视机房的运行维护管理,重视对计算机硬件、软件及网络设备的维护。要树立大局意识和忧患意识,对机房设施安全的重要性给予足够的重视。
二,应重点加强管理制度的执行。管理制度包括预防维护流程和紧急情况处理预案两个方面。要制定相应的管理制度,包括机房管理岗位制度、机房操作规程等,以明确岗位职责。为应对机房中可能会发生的紧急情况,如火灾、断电、数据丢失、设备失灵等,应按各种紧急情况分列处置措施,还要对预案进行演练。
三,应不断提高机房管理人员的技术水平。机房设施非常复杂,涉及很多专业和系统,维护人员只有通过不断的后续学习和培训,提高技术水平,才能避免很多人为错误甚至事故的发生。
四,应加强供配电、照明等电源子系统的监测。同时应重点对温度、湿度、灰尘、有害气体等进行评估和监测。还要加强静电防护、干扰源分析及保护、雷击防护、电磁干扰、振动控制,防火、防水等工作。
五,应加强对进入机房人员的管理。工作人员行为、素质等因素均可能对机房安全造成影响,因此,除制度约束外,门禁和视频监视等物理安全策略均可有效提高机房安全水平。
六,定期巡检和防灾演习,另外应由消防部门定期组织对机房开展专项消防检查,及时堵塞安全漏洞。
七,应定期对机房设施进行安全评估。最好每年聘请第三方机构进行安全评估,专业评估机构拥有专家力量,能够比较安全地对所有的设备进行操作,不会因为误操作引起机房故障。
八,灾备。特殊的数据中心机房如商业银行数据中心机房要建立同城双中心加异地灾备中心的“两地三中心”的灾备模式。