1、分散控制系统安全运行的探讨分散控制系统安全运行的探讨随着机组容量的增大,对分散控制系统(DCS)的安全可靠性要求也越来越高。为了提高 DCS 安全运行的可靠性,一般都对较为关键的部件实行冗余配置,采取双系统运行。扬州第二发电有限责任公司(下称扬二厂)两台 600MW 机组的 DCS 都选用了 TelepermXP(下称 T XP)。在 T XP 系统中,AP 是直接检测和控制现场设备的自动处理单元,AP 系统的正常与否直接决定着 T XP 系统的可靠性,也就影响着机组运行的安全稳定性。1T XP 系统的组成和现状T XP 分散控制系统对机组的在线控制主要由操作员监视系统(OM)和自动处理系统(
2、AS)两大部份协调完成。OM 系统和 AS系统采用冗余配置和分层控制的原则,网络通信使用两路虚拟总线连接(参见 T XP 结构图)。AS 系统的核心是自动处理单元 AP。经过数年来实践和分析,OM 系统的 SU 和 PU 冗余丢失一般不直接影响机组的安全运行,即使在 OM 系统的主从 SU 和 PU 全部故障的极限状态下,只要各 AP 系统运行正常,一般仍然可以在机组不停运的工况下排除故障;但如果 AP 一旦冗余丢失,就只有单 CPU 运行,这时如果主 CPU 或其通讯模件发生故障,整个 AP 就停止工作,与其它柜间的通讯发生中断,严重时造成总线通讯中断或控制系统失控而导致机组跳闸。历史上曾有
3、四次由于 AP 冗余丢失继而引发其它故障,最终导致机组跳闸。自#1、#2 机组商业运行以来,AP 冗余丢失的情况比较频繁。T XP 发生的所有故障中,AP 的故障占了大半。据不完全统计,在 2001 年 1 月至 2003 年 12 月期间,AP 冗余丢失故障就有 56 次(参见附表 1)。AP 冗余丢失的状况正在逐渐改善,但目前尚未彻底改观,这始终是影响机组安全运行的隐患。附图 1T XP 结构图附表 1:2001-2003 AP 冗余丢失情况周期AP1AP4AP5AP6AP7AP20、21合计1 机组冗余丢失3271283352 机组冗余丢失320457212AP 冗余频繁丢失的原因在 T
4、 XP 系统中,AP 冗频繁余丢的根源表现为显性和隐两种状态。AP 模件的软件缺陷和硬件故障可直接导致 AP 冗余丢失,属于显性的根源;AP 运行环境超温、AP 负荷率超标和静电对 AP 模件的破坏所造成的 AP 冗余丢失,往往在当时表现为不明原因,属于隐性的根源;模件和机架积尘的影响多数情况是显性问题,有时也是隐性的问题。2.1环境温度对 AP 的影响DCS 模件的电子器件对温度的变化比较敏感,温度梯度场呈非线性变化,一旦接近或达到饱和区域时工作状态就失常。因此,DCS 对环境温度都有一定的要求。按电力行业标准,电子室的温度应控制在 18 -24。国内的 DCS 多数采用柜内强制通风的冷却方
5、式,当电子室温度在此范围内时,DCS 模件的芯片工作温度在 40以下。然而 TXP 分散控制系统的扩展柜采用上下温差自然冷却方式,冷却效果相对比强制通风方式差;基本柜中也只对电源部份采用了风扇通风,所以模件芯片的实际温度比室温高得多。在现场测试,当室温 21时,AP 柜功能模件温度在 33左右,而芯片的工作温度在 40左右;当28室温时,功能模件自身温度达到 43左右,芯片工作温度高达50左右。因此,对于扬二厂 T XP 而言,即使电子室的温度满足国家行业标准的要求,当室温在 21-24时,AP 模件的芯片实际已经工作在超温状态,何况,过去有时电子室温度高达 25-29。2003 年 5 月份
6、,加装分体式空调,电子室温度控制在 18 -21后, 5 月至 8 月期间的 AP 冗余丢失次数占全年的 35%,比已往同期下降了 50%。从实践情况看,扬二厂电子室最适宜的环境温度应该在 18 -21,电力行业标准不完全适合扬二厂电子室的环境温度要求。2.2AP 柜模件积尘尘埃聚集到电路版和机架槽的表面,形成覆盖层。这些尘埃在三种情况下会对 AP 模件产生不利影响。一是积尘受潮后,形成局部短路,烧坏模件。二是在模件更换或新增模件时,尘埃附着在模件与机架槽的金属接触面之间,形成局部接触不良。这种情况在尘埃较多且插模件方法不当时往往会发生,而且这种接触不良的故障不易被发现。三是在较高电压(例如电容)下尘埃产生电离,形成带电尘埃,条件满足时形成放电。尤其在模件积尘和高温同时作用时,更容易引起局部烧坏。电子室内灰尘较多,电子柜机架和模件表面积尘较严重。#1 机组 AP1 就发生过电源模件因表面灰尘受潮发生短路故障。在AP 冗余丢失故障中,不明原因的 AP 模件损坏现象也常有发生,积尘影响是其中的一个因素。2.3硬件的随机故障硬件的随机故障导致 AP 冗余丢失的问题,一方面是设备使用过程中,模