浅谈数据中心机房动力环境监控系统设计与优化
时间:2023-10-20 阅读:635
摘要:结合银行数据中心建设项目,设计银行数据中心机房动力环境监控系统,分析银行数据中心机房监控对象、搭建系统监控架构,给出监控实现方法,*后针对运行一段时间出现的问题,提出优化措施和建议,对同类工程建设具有一定借鉴意义。
关键词:数据中心;动环监控;系统架构;网络拓扑
0引言
银行数据中心机房的供配电和精密空调等基础设施多,而设备维护人力资源少,因此增加了基础设施运维人员工作强度和难度。为及时发现设备故障并处理,本文设计了动力环境监控系统,并针对运行中出现的主要问题给出优化措施。
1系统监控对象
银行数据中心机房动力环境监控系统(以 下 简 称 为 动环监控系统)的监控对象可分为三大类:第一是对设备动力系统实时工作状态进行监控,如供配电系统开关状态、UPS和柴油发电机等设备的运转参数和状态等;第二是对机房内运行环境进行监测与控制,如温度、湿度、漏水、氢气浓度及消防等;第三是对人员设备进出进行监控,如门禁、摄像头、防入侵等安全类设备。而机柜内服务器、交换机、加密机等安全或网络类硬件设备运行状态并未纳入,不在本文探讨范围。
2系统架构
动环监控系统采用计算机网络、现代通信技术和控制技术,对机房动力设备及环境等进行实时监控,实现无人值守机房的现代化管理。硬件上采用三层架构:底层为现场设备层,由被监控设备、I/O采集模块等构成;中间层为数据采集处理层,由各串口服务器、动环服务器、交换机等构成;顶层为数据应用层,由监控平台或客户端等终端构成。软件上采用B/S结构,在机房中通过安装各种传感器及数据采集设备进行底层数据采集,将所有子系统集成在统一的用户界面下,对各个子系统进行统一监视、控制和协调,从而构成统一的协同工作的整体。系统架构设计如图1所示。
图1动环监控系统架构设计
3系统实现
3.1工程概况
数据中心主机房设置在6F,按功能细分为服务器机房一、二、三,网络机房,配电间A、B;配电间重要断路器或开关、电量仪、UPS及防雷,主机房内新风机、精密空调及漏水检测、机柜PDU、温湿度、防入侵(红外线检测)需纳入动环监控系统。UPS蓄电池室设置在-2F,柴油发电机间设置在-1F,三电源切换室设置在1F,运维室设置在7F,消防气瓶间设置在8F。动环监控系统的监控对象见表1。
3.2硬件构成
动环监控系统由2台服务器(双机热备)、2台客户端PC机、监控大屏、核心交换机(A、B网)、视频汇聚交换机、门禁接入交换机、采集箱及串口服务器等构成。
3.2.1数据采集层核心设备
采集箱负责开关量、温湿度等原始数据的采集,是整个监控系统的核心,采用深圳计通机架式,大小为2U,可安装在机柜内,箱内采集模块通过端子排与被监控设备相连。串口服务器采用计通OAO-9000E嵌入式智能管理单元,该设备集数据采集、解析、存储告警于一体,具备正确故障定位能力,可满足不同厂家设备数据信号的接入与“翻译”。
3.2.2现场设备层
现场设备层的设备分为需接协议转换器设备、需提供通信协议设备、模拟量直集模块和开关量直集模块四类。
(1)需接协议转换器(串口服务器)的设备包括精密空调、漏水绳、机柜PDU、电量仪、UPS电源、蓄电池、柴油发电机。这些设备需相应厂家提供通信接口及其开放的通信协议,以便对各设备运行参数或状态进行监测。
(2)需提供通信协议的设备包括视频监控和门禁子系统。这些设备需相应的厂家提供通信协议,由动环监控系统进行集成和管理,能实现在动环监控端点击任意摄像头调出相应摄像头的实时监控画面和实现对任意门的开关控制。
(3)模拟量直集模块。①温湿度监测:通过在机房内的重要区域、冷热通道和机柜内部安装温湿度传感器,实时采集温湿度的变化情况和热力分布情况。②氢气监测:通过在电池间安装氢气采集模块,可实时检测PPM值是否超标,及时发现氢气泄漏的电池隐患;当氢气PPM达到设定的阈值时,系统发出报警。
(4)开关量直集模块。①重要开关监测:通过监测配电柜内重要断路器的辅助触点状态,判断开关的通断状态;当监测的开关状态与设定默认状态不一致时,监控主系统发出报警。②防雷监测:通过监测防雷器的遥信触点,实时监测防雷器状态;当监测的防雷器状态与设定默认状态不一致时,监控主系统发出报警。③新风排烟监控:通过在新风和排烟管道中安装压差开关检测压差信号,监测机房内新风机和排烟机的运行状态,可远程控制新风机的启停。④防入侵监测:通过在机房内安装红外探头以监测机房内人员移动状态;当红外探测器的状态异常时,系统发出报警。⑤消防监测:通过采集消防控制主机报警输出点的信号,实时监测机房内各分区的消防状态;一旦发生报警,系统就自动切换到相应的监控界面,火警状态图标变红且闪烁显示,同时产生报警事件并记录存储。
4.软件平台
动力环境集中监控平台软件采用B/S结构,通过在机房中安装各种传感器及数据采集设备进行底层数据采集,外厂家设备需提供通信接口及其开放的通信协议,进行数据“翻译”处理,通过机房监控平台集中监控,全中文、图形化;界面结构层次清晰,实时反映数据状态。集中监控平台能运行于中文Windows操作系统。动力环境集中监控平台软件采用模块化设计,可划分为采集层、处理层、管理层及展示层,如图3所示。其中,个人工作平台能提供动环监控主界面、告警事件列表、待办事项、告警等级统计、PUE实时曲线、基础设施分类饼状图等可自由选择的个性化定制界面。报表管理可根据机房管理原有报表格式生成详细的数据记录报表和数据分析报表,存储格式为Excel或PDF;数据存储时间需长于1年,且具有防篡改功能。软件交互界面中,动环监控模块可直观看到各个机房实时运行状态,设置机房名称、设备图标等超链接可直达各子界面,通过温湿度监测、门禁、视频监控、温度场、漏水监测、红外监测、消防监测等按钮可直达各分画面,并提供基于电子地图、实时曲线、饼状图、折线图、直方图等多形式数据展现方式,便于运维人员分析设备历史运行趋势,以判断设备状况。
图3动力环境集中监控平台软件架构图
系统告警采取短信、电话、现场语音三种报警结合的方式,报警等级分为紧急、重要、一般三个层次,不同级别的报警采用不同报警方式实现报警信息的发送。无论系统处于任何画面,都可自动提示告警,显示告警信息。当一个报警状态解除时,系统可自动发送相应的恢复短信,以便机房管理人员随时掌握相关动态。
5安科瑞动环监控系统解决方案
通过数据中心动环监控系统,实现了对数据中心的门禁状态、水浸状态,烟雾状态,视频状态,环境状态,高低压配电状态,设备运行状态进行实时监测,并进行实时报警,保障数据中心正常运行,避免运行环境的失控导致配电设备运行故障,保证维护人员安全,延长设备使用寿命,减少配电室粗放式管理导致成本过高。同时实现动环监控并对各用能耗能进行能效分析,帮助用户实现用能效率的优化。
5.1系统功能
(1)展示当前数据中心总能耗,IT能耗,空调能耗,及其他能耗并且计算出当前数据中心实时PUE值,通过仪表盘形式直观展示。
(2)选择查看数据中心的中低压配电系统主接线图,并在一次图显示配电系统当前遥测、遥信数据和状态。实时监测各配电柜的电压、电流等电力参数,变电站的温湿度、烟感、水浸、门禁等环境情况。
(3)电气接点温度实时监测,断路器触头、触臂、母排和线缆连接等位置安装无线测温传感器监测接点温度,便于提前发现温度异常导致的事故。
(4)监测各变压器各项参数,包括负载率、频率、功率因数、三相不平衡度等,并且显示历时曲线图,数据实时变化。帮助用户直
(5)电能质量在线监测,可以监测电流和电压谐波畸变率、电压暂升暂降暂中断等暂态事件记录、ITIC容忍曲线等
(6)系统采集UPS输入、输出端和旁路三相电压、电流、有功功率、功率因数频率,同时监测UPS温度、蓄电池电压、当前负载下的剩余时间等数据。
(7)展示单体电池电压、内阻和温度,预测电池带载时剩余时间,每节电池数据均可以设置异常报警,及时发现蓄电池异常。
(8)展示精密配电柜内进线和馈线回路电气参数,包括电流电压功率电能以及开关状态,并可以对数据进行报警设置和分级,数据取自精密配电柜测量模块。
(9)展示智能小母线的始端箱和插接箱电气参数,包括电流电压、开关状态、插接点温度,并对数据进行报警设置和分级。
(10)通过平面图显示数据中心能源分布,设备分布情况,并显示设备能耗数据,点击平面图上设备可以进入具体设备监控界面。
(11)实时显示当前数据中心PUE值以及历史PUE曲线。并且显示各分项用能的用能情况及用能排行。监测各变压器运行及负载情况,给出本月变压器输出电能排行。
(12)显示电能消耗日/月/年报表,并可对具体回路选择曲线图、饼图进行展示。对数据中心用电数据进行同比、环比分析比较,查看用电趋势。
(13)监测精密空调的回风温湿度,出回水温度,并可以设定精密空调的温湿度,达到更好的控制效果。
(14)监测数据中心温湿度、开关门、水浸、烟雾、噪声、气体浓度状态等参数。曲线图直观明了,同时支持历史数据查询
(15)通过列表显示各类报警事件数量,通过柱状图显示逐日报警数量,提供报警总数以及增长趋势。
维管理功能,可针对数据中心各主要设备进行巡检派工,消缺,抢修等维护工作。