66
频繁时,网络堵塞现象就变得十分频繁,从而使得各种人机
界面的节点出现死机现象。某电厂多次出现数据站死机现
象;
(6)DCS 运行外部环境温度高(如控制间空调、电源风
扇和机柜风扇故障等造成)、供电电源波动大和切换时间过
长。
1.2 防范措施
上述网络异常均涉及到网络通信负荷率高、
控制器负荷
率高等问题,
由于目前还没有有效的手段在线监测控制器负
荷率和网络通信负荷率,
找出这类事件的根本原因还有一定
的难度,因此,平时加强 DCS 系统的网络运行维护显得尤为
重要。
(1)利用网络测试仪,定期对 DCS 主系统及与主系统连
接的所有相关系统(包括专用装置)的通信负荷率进行在线测
试,确认在机组出现异常工况、高负荷运行及 DPU 或通信总
线产生冗余切换的同时出现负荷扰动时,网络负荷率控制在
行业规定范围内。
(2)利用机组检修时间逐个复位DCS系统的DPU 和操作
员站及数据站;删除 DPU 组态中的无效 I/O 点,对组态进行
优化;对 DCS 的模件、机柜、滤网等进行清扫。
(3)
对于使用系统服务器作为连接操作员站和主控单元
重要设备的DCS系统,DCS系统网络建议采用双层网结构,管
理网络和系统网络从物理上分开,提高DCS网络的可靠性和
稳定性。
(4)定期检查系统风扇是否工作正常,风道有无阻塞;
检查各通讯线路连接是否牢固,通讯接口是否正常;定期对
各通讯模件、端子进行试验,保证通讯模件的正常工作;做
好机组运行中的设备维护和巡视,检查通讯状态,防止通讯
故障。
(5)对于 DCS 系统和其他系统的接口,建议在采用单向
数据传输协议并在其他系统侧的网关站上,加装病毒防火
墙。
(6)在日常工作中应认真按照 25 项预案要求,充分做
好包括DPU 死机、网络通讯崩溃在内的各种事故预想,将运
行紧急处理措施、安全措施、技术措施、检修步骤编写成册
确保机组的安全运行。
(7)在处理DCS故障或日常维护时严格按照制造厂应用
手册中的要求开展工作。
(8)DCS 电子间的环境温度信号引入 CRT 中,并设置
异常报警。
(9)对 DCS 系统进行技术升级应慎重,在升级前充分调
研,完善升级方案,做好相应的技术措施和安全措施,确保
DCS 和机组的安全稳定运行。
2 硬件故障及防范
2.1 硬件故障的种类
DCS 系统根据各硬件的功能不同,其故障可分为人机接
口故障和过程通道故障。人机接口由多个功能相同的工作
站组成,其中一台发生故障,只要处理及时,一般不会影响系
统的监控操作。过程通道故障发生在就地 I/O 模件或一次
设备时,会直接影响控制或监视功能,因而后果比较严重。
2.2 硬件故障的处理
2.2.1 人机接口故障处理
人机接口故障常见的有鼠标操作失效、
控制操作失效、
操作站死机、键盘功能不正常、打印机不工作等。
(1)鼠标操作失效。某电厂投产初期经常出现鼠标失
效情况,重新插拔安装后恢复正常。原因是鼠标使用的 USB
接口不稳定造成的,与计算机主板有一定关系,更换为串
口鼠标后问题得到彻底解决。
(2)控制操作失效。这是由于鼠标的操作信号不能改
变过程通道参数的异常状态,原因一方面可能是过程通道硬
件本身故障;另一方面可能是操作站本身软件缺陷,在 CPU
负荷过重或打开的过程窗口过多时,导致不响应。在检查过
程通道功能正常后,应对操作员站进行检查,必要时进行重
启初始化操作员站。
(3)操作员站死机。操作员站死机原因比较多,也比
较复杂,可能是由于硬盘或内存故障,软件本身有缺陷,冷却
风扇故障导致主机过热,或 CPU 负荷过重造成。对操作员站
死机不能掉以轻心,应耐心分析其原因,同批次计算机原
可能是相同的。某电厂调试期间就发现同批次计算机由于
内存条问题导致操作员站死机变蓝屏现象,更换另一品牌
内存条后没再出现同类故障。
(4)键盘功能不正常。键盘功能不正常现象比较少见,
使用专用键盘的 DCS 系统出现此类故障会多一些,主要是
按键接触不良造成的,应定期对键盘进行清洁检查,必要
时更换新键盘。
(5)打印机不工作。一般是由于设置的原因或缺少墨
盒所致。检查计算机设置和打印机设置,保证设置的正确
性;打印机墨盒要有足够备品,以保证打印不正常后及时
更换墨盒。
2.2.2 过程通道故障
过程通道故障主要有:
(1)模件本身长时间工作,元器件老化或损坏;
(2)模块与底座接插不严密;
(3)拨码开关错误、通讯线接线方向错误及终端匹配
器未接;
(4)硬件接线与实际信号要求的不一致;
(5)机柜内电源输出不正常;
(6)外部信号接地或强电信号窜入卡件;
因
DCS 系统常见故障分析及处理措施探讨 朱明飘,等