GA—BP混合训练算法应用于心电图自动识别的策略
1 神经网络
BP神经网络基于误差反向传播算法的多层前向神经网络。其中BP网络是目前应用最为广泛的神经网络模型之一。网络隐节点过多会导致算法存在过拟合现象,影响了网络的泛化能力,使得网络最终失去实用价值。在满足精度的要求下,逼近函数的阶数越少越好,低阶逼近可以有效防止"过拟合"现象。在实际应用中,还没有成熟的方法确定网络的隐节点,隐节点的确定基本上依赖经验,主要式采用递增或递减的试探方法来确定网络隐节点[1]。
2 遗传算法
遗传算法是自然淘汰、遗传选择的生物进化过程的计算模型,它是基于自然遗传、选择变异等生物机制的全局概率搜索算法。其应用优势在于处理传统搜索方法难于解决的复杂和非线性问题,包含问题编码、初始化群。
3 基于遗传算法的神经网络训练方法(GA-BP)
遗传算法优化神经网络的思路:改变BP算法依赖梯度信息来调整网络权值的方法,利用遗传算法全局性搜索的特点,寻找最佳网络连接权和网络结构,遗传算法在进化过程中能以较大概率搜索到全局最优解存在的区域,在遗传算法搜索到最优解附近之后,再采用训练样本优选最好的网络连接权系数及网络结构。
遗传-神经网络模型:
GA-BP算法的步骤:
3.2遗传算法是以目标函数最大值为适应度函数,函数为:
3.3基本解空间编码 遗传算法优化网络结构需对隐含层编码。编码的码串由控制码和权重系数码组成。控制码控制隐节点个数,由0-1组成的串,其中0表示无连接,1表示有连接。权重系数用浮点数编码。按一定的顺序组成一个长串,每个串对应一组解。
3.4初始群体由P个个体组成,每个个体由两个部分组成,第1部分是串长为l1 的0-1串;第2部分是区间[umin-δ1,umax+δ2 上的l2个均匀分布随机数。
3.5由控制码得到网络的隐节点数,由权重系数码可以知道网络的连接权值,输入用于训练样本,按照式(2)计算个体适应度。
3.6保留群体中适应度最高的个体,不参与交叉和变异运算,直接将其复制到下一代。 对其它个体,按归一化适应度大小为概率进行选择,进行遗传操作。当某个神经元被变异运算删除时,相应的有关权重系数编码被置为0,而当变异运算增加某个神经元时,则随机初始化有关权重系数编码。以Pc的概率对选择后的个体的Wij神经元权值进行交叉算子如下:
3.7将新个体放到种群P中,没有交叉、变异操作的个体直接生成新一代群体。反复4~8,每次群体就进化一代,连续进化到K代。把最终个体解码得到相应解,ANN误差平方和不合要求εGA则转4,继续遗传操作,反复进行如果N次依然不能达到要求则训练失败。以GA遗传出的优化初值作为初始权值,BP算法继续训练网络,直到给定精度εBP(εBP<εGA)或迭代次数,最终个体解码即得到网络连接权及隐节点数。
4 遗传算法的神经网络对心电图的自动识别
心电图在诊断心血管疾病等临床医学领域得到了大量应用,近年来,基于心电图的稳定性和唯一性,易于采集,不能复制和仿造等优势,其在身份识别领域也具有广泛的应用前景。
将测量电极放置在心脏或人体表面的一定部位,用心电图机记录出来的心脏电变化的连续曲线,即为心电图。将立体的P、QRS、T环经过投影到额面、水平面和右侧面上,临床上用心向量图表示;此即空间心电向量环的第一次投影。将额面心向量环的每一点依次再投影到各肢体导联轴上,可记录出各肢体导联的心电图;横面心向量环在各胸导联轴上的投影,可描记出各胸导联的心电图。此即心向量环的第二次投影。
4.1波形数据预处理 ①首先对心电信号进行高频滤波处理。由于数据是通过FRANK导联七电极采集的,所以心电信号必然夹杂有电极的50Hz交流干扰、肌电干扰等。需要对心电信号进行50Hz高频滤波处理,以去除工频和肌电干扰,可以采用多点平均值法进行滤波;②其次需要对心电图作基线漂移处理。心电信号的漂移主要有放大器零点漂移和呼吸交流漂移。放大器零点漂移体现在基线偏离原点上下移动,交流漂移表面为基线倾斜。
4.2波形识别 由于心电向量图是由各面心电图的各波起止点间的所有点组成的,所以绘制向量图前必须先将心电图的各波的起止点确定下来,这就是波形识别。主要是对选择的典型波形,识别出P波、QRS波、T波等各波段的特征点即峰点、起止点等。
4.3 QRS波群识别 QRS波群识别方法目前主要有闭值法、轮廓限制法、面积法、数字滤波法和倾斜法,该系统采用闭值法。这种方法通过对正交三导联同时记录的X、Y、Z心电信号进行空间向量模的运算,计算其空间向量长度,以最大空间向量长度作为闭值K,以K作为识别QRS波的依据。然后在K值前后一定时间内(30~80ms),对各点心电向量模值进行测量。如果连续若干点的模值相同,K前相同模值的第一个起点作为X、Y、Z三导联公共起点和K后最远点作为公共终点。再根据公共起点、终点范围、检测X、Y、Z导联中的QRS波的峰点和谷点的时间和幅度。
4.4 T波检测 T波比QRS波小,识别方法与QRS波有所不同。T波的识别方法在识别QRS波群基础上,规定在K值后一定时间(100ms)左右,寻找空间向量的最大值做为T波阐值Ko.以Ko值做为识别T波的依据。T波检测也用面积增量法,可直接或间接检测出T波峰值,T波始、终点及宽度。S-T段上升与下降程度采用传统的J+X法判别标准,J+X法中的J点是S点之后的第一个拐点,ST段被确定在J+X ms的心电信号部分,X的典型值为80ms,一般认为X在20~120ms范围中。ST段水平根据基线可以计算出其绝对值,或可表示为相对于R波峰值的归一化值。
4.5 P波检测 P波的识别方法与T波类似,只是搜
寻区间和闻值规定不同。P波检测是房室传导阻滞,P-R间隔检测的主要参数。但其幅度过小,实时检测十分困难。因此目前采用的方法主要是面积增量法。
4.6心电图的识别 本文收集了房室传导阻滞、S-T段下降、S-T段抬高、T波低平、T波倒置、正常窦律、正常七类心电图。提取其诊断特征值,将其输入神经网络进行训练,识别正确率可达到96%[5-10]。
5 结束语
心电图的识别分析,是一项笼琐而又细致的工作。心电图自动诊断可以将医务人员从烦琐的图形识别中解脱出来,提高工作效率。本文采用遗传算法优化三层BP神经网络的连接权和网络结构克服BP神经网络的瓶颈,有效提高神经网络泛化性能,并将其应用于心电图自动识别,得到了较高的识别率。
参考文献:
[1]徐文,王大忠,等.结合遗传算法的人工神经网络在电力变压器故障诊断中的应用[J].中国电机工程学报,1997,02:109-112.