基于改进的半监督AP聚类雷达信号通信策略
0 引 言
雷达信号分选是电子情报侦察系统和电子支援系统的重要组成部分,只有在分选之后才能对信号的参数进行测量、分析和识别。雷达信号的脉内特征是最具特色及稳定性的参数之一,正确地提取雷达信号脉内特征、识别脉内调制方式,对雷达信号的分选有着重要意义[1?2]。
当信号的调制方式发生变化时,其时频结构也会发生相应的变化,而时频分析能揭示信号的内部结构,反映信号的时变规律。近年来小波变换在信号处理及特征提取中得到了广泛应用[3?6],小波分析在时频两域都有表征信号局部特征的能力,其特点是在低频部分有很好的频率分辨率,高频部分却无法进一步细分。而小波包可以将高频部分进一步分解,将信号按任意时频分辨率分解到不同频段,实现将信号无冗余、无疏漏、正交地分解到独立的频带内。提取雷达辐射源信号小波包能量熵的统计特征,用改进的半监督近邻传播聚类算法对统计特征进行聚类分析;对比直接半监督近邻传播聚类算法以及传统近邻传播算法,改进的半监督算法准确率更高,聚类数更接近实际信号类数。
1 小波包特征提取
1.1 小波包概念及小波函数选取
小波包理论是对尺度空间是一对共轭正交镜像滤波器。定义:
[u0j+1(t)=n∈Zh[n]uj(t-2jn)u1j+1(t)=n∈Zg[n]uj(t-2jn)] (1)
则[u0j+1(t-2j+1n),u1j+1(t-2j+1n)n∈Z]是[Uj]的规范正交基。由式(1)递推,可以把[u0j+1(t-2j+1n)n∈Z]变换成两个规范正交基[u0j+2(t-2j+2n)n∈Z]和[u1j+2(t-2j+2n)n∈Z;]同样也可以把[u1j+1(t-2j+1n)n∈Z]变换成两个规范正交基[u2j+2(t-2j+2n)n∈Z]和[u3j+2(t-2j+2n)n∈Z。]同理,可以依次类推。
使用小波包变换对信号进行分析的一个重要问题是如何选择合适的小波函数,不同的小波函数分析同一个问题会产生不同的结果。从五个方面考虑选择小波函数:
(1) 正交性:采用双正交函数可以有效地解决基函数的对称性与重构的精确性的矛盾问题;
(2) 对称性:对称或反对称的小波可以有效地避免信号处理过程中产生相位畸变;
(3) 正则性:影响小波系数重构的稳定性;
(4) 紧支撑性:保证小波基函数具有优良的时域局部性或频域局部性;
(5) 时效性:可以快速分析信号。通过这五个方面的考虑,选择Coif4小波对雷达辐射源信号进行分解及特征提取。
1.2 小波包能量熵特征
信息熵在应用于信号分析时,可以度量信号的均匀性或复杂度[8]。不同雷达辐射源信号通过小波包分解后,信号内部不同的能量分布特性映射到正交小波包子空间上;时频分布特性不同的信号对应的小波包分解系数也不同,提取各小波包系数的能量熵便能突显各雷达信号的差异。
若对雷达信号进行小波包[i]层分解得到[2i]个频带内的序列[si,j(j=0~2i-1),]对分解序列进行单支重构后得到信号分量[Si,j。]定义[Ei,j]为信号分量在第[i]层第[j]个节点的能量,则:
[Ei,j=Si,j(k)2] (2)
令[εi,j(k)=Ei,j/E],[E]为各节点能量之和,则小波包能量熵定义如下:
[Hi,j=-k=1Nεi,j(k)logεi,j(k)] (3)
式中:[Hi,j]就是信号的第[i]层的第[j]个小波包能量熵。
在对信号提取小波包能量熵[H]后,将其看成是随机序列[9],引入统计特性:均值、标准差、偏度、峰度。均值可以衡量信号小波包能量熵平均值的大小;标准差综合反映各频带内能量熵的差异程度;偏态是指能量熵的不对称性,能够衡量其偏离对称分布的歪斜程度;峰度能够反映能量熵特征分布曲线顶端尖峭或扁平的程度。定义偏态和峰度:
(4)
[kurt=i=1K(Hi-H)4σ4] (5)
式中:[H=1Ki=1KHi]为序列均值;[σ=1Ki=1K(Hi-H)2]为序列标准差。
根据以上分析,给出提取信号小波包能量熵特征统计的步骤:
(1) 对信号进行第[i]层小波包分解,得到[2i]个频带的序列;
(2) 对步骤1的序列进行单支重构得到信号分量[Si,j]([j=0~2i-1]);
(3) 求小波包能量熵构成的特征向量。根据式(2)和式(3)计算小波包能量熵,以这[2i]个小波包能量熵构成该信号的特征向量,即:
[T=[Hi,0,Hi,1,???,Hi,j]]
(4) 根据式(4)和式(5)计算特征向量[T]的统计特性,组成小波包能量熵的统计特征向量[T=[X,σ,SK,Kur]]。
2 改进半监督近邻传播聚类的应用
2.1 近邻传播聚类算法
近邻传播聚类(Affinity Propagation,AP)是2007年提出的一种新的聚类算法[10],其优势体现在:数据点的相似度无需对称,也无需满足三角不等式;不需要事先指定聚类数和初始聚类中心。
AP算法是在数据点的相似度矩阵[S]上聚类的。设所有[S(i,i)]为相同值,以[S(i,i)]作为[i]点能否成为聚类中心的评判标准,这个值称作偏向参数[p。]该算法同时引入两种数据点之间相互传播的信息:第一种被称为吸引度[R,][R(i,k)]反映数据点[k]适合作为[i]点的代表点的累积证据。第二种被称为归属度[A,][A(i,k)]反映数据点[i]选择点[k]作为其代表点的累积证据。两个信息的更新过程如下:
[R(i,k)=S(i,k)-maxj:j≠k{A(i,j)+S(i,j)}] (6)
[A(i,k)=min{0,R(k,k)+j:j?{i,k}{max(0,R(j,k))}}] (7)
[A(k,k)=j:j≠kmax{0,R(j,k)}] (8)
为避免发生震荡,AP算法在信息更新中引入阻尼系数damp,平衡前后两次迭代的[R]和[A],其更新公式如下:
[RT=RT×(1-damp)+RT-1×damp] (9)
[AT=AT×(1-damp)+AT-1×damp] (10)
式中:[RT-1]和[AT-1]分别表示第[T-1]次迭代的吸引度和归属度;[RT]和[AT]分别表示第[T]次迭代的吸引度和归属度。
对于规模很大的数据集,AP算法是一种快速有
效的聚类方法,这是其他传统的聚类算法所不能及的。但是,对于一些聚类结构比较复杂的数据集,AP算法往往不能得到很好的聚类结果。文献[11]提出半监督的近邻传播聚类算法(Semi?supervised Clustering Based on Affinity Propagation,S?AP),引进评价聚类结果质量的聚类有效性指标,对算法的迭代过程进行监督和指导,使算法向最优聚类结果的方向进行。但是该算法对样本间的相似度度量的计算与传统AP聚类算法一样,采用欧氏距离来计算样本的相似度。该算法对于空间分布为任意形状的数据进行聚类时,聚类精度比较低。提出改进的半监督AP聚类算法,同时改进相似度矩阵[S]和偏向参数[p],以产生更好的聚类质量。
2.2 构造相似矩阵
针对雷达信号小波包能量熵的统计特征空间分布的任意性,提出采用高斯相似函数构造相似矩阵,使其更加真实地反映数据点之间的近似关系。定义:
[Sij=exp-xi-xj22σ2] (11)
式中:[xi]和[xj]表示样本空间中两个不同的数据点;[σ(σ>0)]为事先指定的参数,用来控制数据点之间的距离宽度。
当特征数据集比较大时,其相似度矩阵所占内存就很大,计算也更加复杂;而且信号的特征只与部分属于同一类的对象高度相似,与其他非同类的对象相似性很弱。利用这一性质,提出稀疏化相似度矩阵,只保留[xi]是[xj]的[ε]近邻的[S(xi,xj)]。为了保证[ε]大小的最相似性,将每个数据点与数据集中的相似度进行排序,找出[ε]个最小相似度,更新相似度矩阵。
2.3 偏向参数设置
偏向参数[p]是AP算法对输入数据中自相似度的定义。传统AP算法的[p]初始化为[S]的中值,这样得到的聚类数就是中等的,但不一定是真实聚类数。当各样本点的[p=0]时,每个点都选自己为聚类中心,最终聚类数为[N](样本点个数);当各样本点的[p→-∞]时,每个点都不选自己为聚类中心,最终聚类数为1。知道了偏向参数[p]的这些特性之后,就提供了寻找[p]与聚类数目[K]之间的对应关系。
首先需要确定最佳有效。
根据稀疏化的相似度矩阵,寻找,使得聚类数在最佳有效个数区间内;然后将评价聚类质量的有效性指标嵌入算法的迭代过程,进行半监督的近邻传播聚类。
2.4 聚类有效性指标
设一个具有的离差矩阵且有:
(12)
假设[a(t)]为聚类[Cj]中的样本[t]与[Cj]内所有其他样本的平均距离,[d(t,Ci)]是[Cj]中样本[t]到[Ci]中所有样本的平均距离,则[b(t)=mind(t,Ci)],其中[i=1,2,…,K]且[i≠j。]因此,样本[t]的Silhouette指标为:
[Sil(t)=b(t)-a(t)maxa(t),b(t)] (13)
Hartigan指标可以用于聚类数为1的情况,其中满足表示聚类内离差矩阵的迹,则Hartigan指标定义为:
(14)
根据以上分析,给出改进的半监督的AP算法步骤:
(1) 根据式(11)构造雷达辐射源信号特征数据集的相似度矩阵并稀疏化得到[S。]
(2) 根据
(3) 设置初值:
(4) 运行1次算法产生是就转步骤(7),否则转步骤(6)。
(6) 检测[K]个聚类中心是否收敛,若收敛则给出[K]个聚类并计算Silhouette指标值[Sil(K),]标记[HS=1。]
(7) 检测[K]个聚类中心是否收敛,若收敛则给出[K]个聚类并计算Silhouette指标值[Sil(K),]计算最大[Silmax]指标。当[Sil(K) (8) 检查[HC>K2]中[K]是否为2以及循环次数是否为[Cy,]若满足其中任一条件,则转步骤(9);否则,减小参数[p=p+pstep,]转步骤(5)。
(9) 检查[Silmax]对应的最优聚类数目[K0]是否为2,若是,计算Hartigan指标以及判断[K0]是否应当为1。
(10) 输出最优聚类数目[K0]和对应的聚类结果,算法终止。
3 仿真实验
选取常规信号(CON)、线性调频信号(LFM)、非线性调频信号(NLFM)、二相编码信号(BPSK)、四相编码信号(QPSK)以及频率编码信号(FSK)共七种常见的雷达辐射源信号。信号的载频都为10 MHz,采样频率为70 MHz,脉冲宽度为10 μs。其中,LFM信号和NLFM信号的带宽是15 MHz,BFSK和BPSK信号都采用13位的Barker码,QPSK信号采用的是16位的Frank码。
对于7类雷达辐射源信号,在4~24 dB范围内,每隔2 dB,每种信号各产生100个脉冲信号,分别对每一脉冲信号子集提取小波包能量熵的统计特征。对比传统AP聚类算法、文献[9]的半监督AP算法以及改进的半监督AP算法,用3种方法分别对统计特征进行聚类,聚类准确率及聚类数如图1所示。
从图1中可以看出,本文改进的半监督AP聚类的准确率要高于文献[9]的算法以及传统AP聚类算法。在SNR≥6 dB的情况下,聚[第一论文网(www. ) 专业提供论文写作和
发表论文的服务,欢迎光临]类的准确率能达到90%以上,尤其当SNR≥10 dB时,聚类准确率达到100%;在SNR≥4 dB时,也能达到83.29%。图2表明本文改进半监督AP算法在SNR≥6 dB时,聚类数与实际聚类数一样,都为7类,能很好地进行雷达信号的分选;而在SNR≥4 dB时分选出8类信号数,仅比实际数多出一类,多出的这一类数目极少,很容易从主观上判断出为非信号点。而文献[9]的算法在SNR≤14 dB的情况下聚类数为5,聚类时将LFM信号和NLFM信号聚为一类,FSK信号和QPSK信号聚为一类,所以7类信号只能分选出5类。因此,聚类误差较大,从图1中能看出其聚类准确率比较低。传统AP算法聚类的数目与实际数目相差也较大,尤其当SNR≥10 dB时,聚类数比实际信号数多出2~4类。由此证明改进的半监督AP算法的有效性和可行性。
4 结 论
不同调制方式的雷达辐射源信号会在某些频带内具有不同的分解系数,这些差异性使得小波包提取特征能够进行信号调制方式的识别。从正交性、对称性、正则性、紧支撑性、时效性这五个方面进行分析,选取Coif4小波对雷达辐射源信号进行分解及提取小波包能量熵提取和统计分析,并作为最终信号特征向量。利用改进的半监督近邻传播聚类算法对特征向量进行聚类,对比半监督AP聚类以及传统AP聚类算法的准确率及聚类数,实验表明,改进的半监督AP算法在小波包能量统计特征熵的提取上、准确率及正确聚类数要明显高于其他两种算法,也由此证明本文算法的准确性和有效性。
参考文献
. IEEE Journal of Selected Topics in Signal Processing, 2007, l(l) :124?136.
[2] 李合生,韩宇,蔡英武,等.雷达信号分选关键技术研究综述[J].系统工程与电子技术,2005,27(12):2035?2040.
. International Journal of Electronics and Communications, 2011, 66(3): 195?203
[4] 郭双冰.基于小波和分形理论的调制信号特征提取方法研究[J].信号处理,2005,21(3):316?318.
[5] 柳征,姜文利,周一宇.基于小波包变换的辐射源信号识别[J].信号处理,2005,21(5):460?464.
[6] 张葛祥,荣海娜,金炜东.基于小波包变换和特征选择的雷达辐射源信号识别[J].电路与系统学报,2006,6(11):45?49.
[7] 范延滨,潘振宽,王正彦.小波理论算法与滤波器组[M].北京:科学出版社,2011.
[8] 张园园,龚庆武,陈道君,等.基于小波包能量熵判别的高压输电线路单相自适应重合闸[J].电力自动化设备,2009,29(9):11?16.
[9] 白航,赵拥军,赵国庆,等.一种改进的雷达信号小波包特征提取方法[J].信息工程大学学报,2012,13(1):90?99.
. Science, 2007, 315(5814): 972?976.
[11] 王开军,李健,张军英,等.半监督的仿射传播聚类[J].计算机工程,2007,33(23):197?198.
[12] 于剑,程乾生.模糊聚类方法中的最佳聚类数的搜索范围[J].中国科学(E辑),2002,32(2):274?280.