浅谈通信系统中PCM常见故障处理
摘 要:PCM设备是电力通信网中重要的接入设备,在电力调度通信自动化系统中起着重要的作用。 PCM(Pulse Code Modulation,脉冲编码调制)终端复用设备是完成单路信号和多路信号(这里指2Mbit/s信号)的复接、分接设备,也是实现A/D转换不可缺少的设备,因其具有规范和灵活的接口、智能化程度高等特点,成为电力通信网的重要组成部分。本文着重介绍PCM的常见故障处理。
关键词:PCM;日常维护;故障处理
PCM可以向用户提供多种业务,既可以提供从2M到155M速率的数字数据专线业务,也可以提供话音、图象传送、远程教学等其他业务。PCM线路使用费用相对便宜、能够提供较大的带宽、接口丰富便于用户连接内部网络、可以承载更多的数据传输业务,特别适用于电力调度通信自动化系统和对数据传输速率要求较高,需要更高带宽的用户使用。在电力系统中,PCM承载着大量的重要用户,如继电保护信息、调度电话、自动化信息、会议电话等。因此对PCM设备的维护对保证电力安全运行来讲非常重要。
本文结合实际工作,针对通信系统中PCM的常见故障,将PCM设备的维护分为日常维护和故障处理两部分。
1 日常维护
日常维护主要是保证设备的安全运行环境,主要工作是监视设备工作状态和检测一些主要参数,这种维护只要从网管界面查看和相关监测设备就可实现。
在日常维护中要时刻关注指示灯的情况,如是否常亮、亮什么颜色等等。在设备出现故障时,经常出现较多单板同时告警。这时分析的原则一般为,先检查CU(Center Unit,中央处理单元),再分析TU(Tributary Unit,支路单元);从分析高级别告警开始,再分析低级别告警的单板。维护中,首先从整体上观察设备是否有高级别(危急和主要)告警。即CU板上的红、绿灯的工作状态。再观察支路板的指示灯告警情况,同时结合用户反馈的情况一般可以初步判定故障点。
2 常用检测方法
2.1 环路检测法
对PCM传输设备而言,设备故障定位时最常用的一个手段就是构造环路检测(简称自环)。设备的自环有多种,按自环的信号方向来分有:设备外自环和设备内自环。前者用来检查对端站及传输链路是否有故障,后者用来检查本站设备是否有故障。按自环的信号等级来划分,又可分为:2Mbit/s自环(CU)、TU自环、单支路自环以及外围设备自环,自环分别检查各自的单元是否有故障。通过设备各种不同的自环,就可逐级地分离出故障点来,从而排除故障。比如整个系统不工作,怀疑某块CU板有故障时作2Mbit/s自环判定;某类支路(如数据或4WE&M用户)出现中断,怀疑该TU板故障时作单支路自环检测;需要注意的是,自环时还须注意接口特性,如4WE&M的收发电平是否一致,因此必要时须加衰减器。
2.2 替代法
“替代法”也是一种常用的PCM设备故障处理方法。“替代法”就是使用一个工作正常的物件替代一个怀疑工作不正常的物件,从而达到定位、排除故障的目的。这里的物件,可以是一个设备、一块单板、一条支路、一段线缆等等。“替代法”适用于故障定位到单站后,用于排除单站内单板或支路的问题。如2Mbit/s系统异常,怀疑某块CU板故障时可替代该CU板(当然先得作相应的软件配置);某类支路同时出现中断时可以更换该TU板;某支路发生故障时用另一支路替代(一般每块TU板上有6路到10路不等)。替代单元板时须注意防静电措施。
2.3 仪表测试法
“仪表测试法”指采用各种仪表(如PCM综合测试仪或PCM性能分析仪、误码仪、选频表和振荡器、万用表等)检查传输故障。“仪表测试法”分析定位故障准确,说明力较强,但需要仪表配合工作,对维护人员技术水平要求高。用PCM综合测试仪可以检测:音频话路(2W、4WE&M)、数据链路(64Kbit/s以及n*64Kbit/s、2Mbit/s等),用性能分析仪分析帧的情况,误码仪测试数据业务通道的通断、误码性能;用选频表、振荡器测试4WE&M话路;用万用表测试供电电压,比如检查SUB102板接口、4WE&M的M线电压是否为37v。
2.4 PCM设备上拷贝相关数据,使用已杀毒的U盘或将U盘格式化后,再在终端上使用,确保维护终端的安全性。
2.5 做到安全生产,严格遵守PCM操作规程,确保PCM设备各方向畅通。
2.6 每月一次检查PCM设备各旋钮、开关是否工作正常。每月查看一次PCM的配置管理、故障管理、性能管理和安全管理状况,做好数据备份工作。
1)配置管理:主要负责配置(包括增加或减少)网络单元、控制其运行状态、设置和查看参数以及完成软件升级等,并能对全网配置数据的正确性及合理性进行检查。通过查看配置管理,可确保数据的完整性。
2)故障管理:包括故障时间和位置的判定,并完成对相应故障修复的处理。通过故障管理,可对每月发生的故障次数及故障类型做好总结。
3)性能管理:负责采集和处理系统性能参数,根据测量结构采用必要的网络管理控制行动,改善网络的总体性能水平。
4)安全管理:包括对接入网的物理安全性、传输安全性及业务安全性能的管理。
2.7 PCM设备的网管终端平时设置在只读状态,如无必要请勿进入到可写可读状态,以免造成误操作;如需进行相关配置时,需报告相关人员,在得到允许或有技术人员在场时,值班人员可做必要操作。
3 故障处理
当某一PCM系统与对端的相应系统的连接中由于单板配置、数据配置、虚焊、光路中断或其它原因而导致的传输故障时即引起该告警。
通过单板告警指示灯的状态或从网管计算机上观察到的告警信息,再结合告警信号流程表,可大致定位出故障点。这时就可采用具体的方法来精确定位和排除故障。
常用的故障处理方法有以下几种:
3.1 检查单板
根据告警模块号、告警参数来确定所对应的告警的DT单板。
3.2 检查PCM系统
根据告警参数来确定出现告警的是该DT单板上的哪个PCM系统。查看对应的告警灯。每个PCM系统在面板上有六个告警灯,其中四个对应一号中继的告警,即FAS(帧失步)、MFA(复帧失步)和RFAS(对端帧失步)、RMFA(对端复帧失步)。全灭表示PCM系统传输OK,否则表示传输告警。如果确定告警正确,可断开传输,在交换机侧自环(该PCM系统收发自环),如果告警消除,说明问题已不在本交换机,否则仍要查询数据或更换备板。
下图就是目前PCM典型的组网方案:
3.3 传
输故障
1) 在排除以上两种故障的情况下,则可能是传输故障。在传输通路上一一自环,即从交换机到配线架再到光端机的每段线路都进行自环检查,一查到对端交换机侧,就可迅速确定哪一段传输有故障,或是光端机的故障,然后采取相应的措施。具体步骤如下:
(1)从本端配线架的交换机侧对我局自环;
(2)从本端配线架的网络侧对我局自环;
(3)从对端配线架的网络侧对我局自环;
(4)从对端配线架的交换机侧对我局自环。
(5)对局问题
如果直到对端交换机侧对我局自环仍无告警,则可能是对局问题。确认对局已正确配置相应中继系统的数据。如未配置,则会导致传输告警。
2) 常见的2M传输电路不通或工作不正常情况汇总如下表:
故障原因 | 传输线不通 | 传输设备故障 | 人为因素造成传输不通 |
具体故障位置 | ① | ①T43板因雷击等原因损坏;②T43板插针松动,因受力后退,有效接触长度变短;③NIU板故障;④MSI板故障;⑤MCU板故障;⑥架顶背板故障;⑦传输SDH等设备故障;⑧DN2交叉机等设备故障;⑨设备不匹配,超出基站允许的误码范围;⑩传输设备时钟不同步;11DDF架故障;12接地系统不良;13设备电源故障 | ①鸳鸯线;②传输线路在设备某一段自环;③传输线标签错误;④设备传输所采用校验码不统一;⑤设备误码率容许门限过高;⑥交叉机或DN2数据做错,时隙不对应;⑦用户传输表错误;⑧施工时,用户准备跳线表错误;⑨数据错误,时隙不一致;⑩数据做错,造成 |
3.4 核对系统
如对局也无问题,则只有两种可能:系统对岔和收发接反。
可以通过我方对对局的PCM系统进行自环或断开来查明。
4 网管中有网元告警信息
4.1 对方对应总站的2M电连接口告警时,则先检查总站原因:首先在总站数字配线架上将该网元方向做一环回,如果网管上告警消失,则说明总站PCM正常;如果告警未消失,就用E1环回线在PCM设备背板的相应路口上作收、发环回,如果网管上告警消失,则说明自数字配线架至PCM设备这一段线路存在问题,检查这段线路,用万用表测试E1线头是否短路等;如E1线环回后,告警还未消失,应为PCM设备自身问题,再查板子原因;
4.2 排除总站原因后,与告警网元所对应的通信站联系,询问是否为光端机停电等外部原因,如未停电,则叫对方的PCM设备专管员用自环线将E1的收、发环起来,观察双方PCM设备状态,如对方PCM设备告警红灯消失,而总站网管上依然显示告警,说明对方PCM设备没有问题,应为移动公司的传输有问题,及时与移动公司取得联系;同理,如果环回后,对方PCM设备告警未消失,则该通信站PCM设备有问题,通知相关人员,查找自身原因。
以上所介绍的PCM设备故障处理方法不仅简单易行,而且是经过实践检验了的、可靠的措施。但众所周知,PCM在电力通信系统中发挥着不可替代的作用,在实际工作处理中还要具体问题具体分析,综合考虑,采用多种方法,才能达到防患于未然、事半功倍的效果。
参考文献:
.北京:电子工业出版社,2006.