2010年4月11日,某市电子政务计算机机房UPS电池发生击穿事故,冒起浓烟。经过约两个小时的扑救,现场浓烟得到有效控制,没有造成人员伤亡。事故导致该市政府门户网站、邮件系统、互联网出口、政务服务中心、住房公积金中心等重要系统一度无法使用。据悉,这起事故原因初步认定为供电不稳定,导致恢复供电后产生的瞬时高压造成UPS电池短路,引发火灾。
2009年8月23日,位于上海的某一电信机房起火,据报道称,现场聚集了多辆消防车,已有多人受伤送往附近的上海长征医院。据了解事故是由于机房内空调故障以及当时天气炎热,使室内温度骤然升高引起电源短路导致火灾。
随着信息网络技术的不断发展,各类规模大小不等,设备种类、数量不同的网络设备机房广泛分布于用户各分支机构所在地域,由于欠缺与运行网络的规模体系相对称的运维系统,数量众多的无人值守机房的物理运行环境状况、动力配电状况、设备运行状况、人员活动状况以及消防状况的变化包括可能出现的危急状况,均无法得到及时的发现和处理,也就很难被有效预见、防范和避免。因此,由于运行环境造成的网络运行的不稳定和网络设备的隐性寿命衰减,以及由地域楼宇间的距离和区隔造成的管理维护的不便所导致的综合运维开销和建设开销相当巨大。
为保证组织的安全、稳定、高效运行,保证网络设备的良好运行状态和设备使用寿命与安全,实现用户的最大投资效益,就有必要对网络运行环境的电力供应、温度、湿度、漏水、空气含尘量等诸多环境变量,UPS、空调、新风、除尘、除湿等诸多设备运行状态变量,进行24小时实时监测与智能化调节控制,以保证网络运行环境的稳定与网络软硬件资源、设备的安全以及相关信息数据资产的安全。
融智9600系统立足于建设一个全面覆盖用户网络所有核心机房、汇聚层机房、重点和非重点接入层设备间,支持监控运维网带外通讯,支持监控运维网独立自供电运行,集动力、环境、视频、设备、安防、消防综合监测、调控、监视软硬件平台于一体的分布式、智能化网络机房远程运维管理系统。
系统整体拓扑图
1. 动力供电通断监测
对市电/UPS断电进行实时监控报警,随时掌握机房的电力情况,实时监控告警。
2. 温、湿度监测
当机房内温、湿度超出预警温度值或告警温度值的持续时间超出设定值,即按用户设定策略进行本地报警和手
机短信报警,以免过高的温度危及设备安全、信息数据安全甚至成为火灾诱因
3. UPS联动监控配置
动态图示反映当前UPS遥测信息量的实时状态,一般包括:UPS市电输入电压、UPS市电输入电压最大值、UPS
输入电压最小值、UPS输入频率、UPS输出电压、UPS输出电流、UPS输出频率、UPS单相负荷率、总负荷率、 UPS
输出功率、UPS旁路电压、电流、频率。实时记录UPS主要监测量的历史数据。针对异常情况及时告警,同时记录告
警信息。
4. 空调联动监测控制
包括精密空调和普通空调的联动控制
5. 新风机联动监测
包括智能新风机和普通新风机的联动控制
6. 发电机联动监测
实时对发电机输出的功率、频率、油压、油位、油温及发动机的转速等进行监控。
7. 消防联动监测
当有报警信息产生时系统会根据用户预设策略进行告警。
8. 视频监控
对用户机房内现场的视频状况进行监控。
9. 门禁联动监控
实现人员出入的刷卡授权出入管理以及对人员出入的详细记录,包括人员姓名、身份、进、出时间等。实时监
控门的开关状态,对非法刷卡、门打开超过规定时间等状况按用户设定策略进行系统报警。
10. 双鉴探测
实时监控被监控区域的人员移动状况,并按用户设定的布防/撤防时段与告警通告策略对相应状况进行告警、
通告或仅仅软件界面反映。
11. 烟雾探测
当检测到有烟雾时,进行本地报警和手机短信报警,及时通知相关人员对机房做出相应处理,保障中心机房服务
器等设备的安全运转。
12. 水浸监测
对机房空调周围进行实时的水浸监测,一旦空调的加湿水跑水、冰凝水跑水、管道水漏水等水浸状况发生,系
统可立即报警,严禁水浸状况危及机房安全。
13. 数字电力监测
实时监测机房内市电输入的电压(V)、电流(I)、 频率(F)、有功功率(P)等,以数据形式反映当前市
电监测量的数据值,实时反映当前市电情况。对于市电各种异常情况,如市电停电、供电公司供电频率不稳定、单
相负载量过高等,及时告警。
14. 回路监控
针对机房强电配电柜配置回路监测模块,实现对开关状态的监测。当开关跳闸或断电时,系统自动切换到相应
的运行画面,同时发出报警信息。
15. 服务器基本运行参数状态监控
实现对服务器CPU占用率、内存占用率、硬盘剩余空间、网口流量及带宽占用率、CPU运行温度等关键运行参
数的实时监控,并按用户设定策略对相应参数的超限状况进行通告、告警。
16. 关键服务进程监控
探测服务器服务响应的正常与否及响应时间,并按用户设定策略对各类服务响应失败、服务响应异常、服务响
应过慢等现事件按用户设定策略进行报警。
17.远程串口命令
实现对汇聚设备间机房部分交换机的远程串口命令配置 ,实现网管人员对各汇聚设备间的远程console口本
地化串口操作。
18.远程电源管理
对设备间进行远程电源管理,在必要时可对设备间设备进行断通电重启。
19.电池及电池组监控
实时对电池组内阻、总电流及总电压的状况进行监控,针对单体电池可实时对电池的表面温度、单体电池的电
流、电压等状况进行监控。
20.机柜微环境监测
针对重要机柜对机柜的亚环境进行监控,实现对重要设备的精细化动力、环境保障监测;避免大环境合格,但
亚环境超标现象危害重要设备的安全。
21.大屏幕拼接显示
1、独立光纤组网、独立供电,全方位支持带外运维监控管理 2、独立高可靠供电系统设计 3、嵌入式、一体化、数字化硬件系统设计 4、构件化系统配置平台、C/S为主、B/S为辅的运行软件系统结构