欢迎来到学术参考网

气溶胶单粒子化学成分在线聚类分析

发布时间:2015-07-03 12:26
气溶胶单粒子化学成分在线聚类分析

【摘要】   为了在线快速、自动处理气溶胶激光飞行时间质谱仪在运行过程中产生的海量数据并提取有价值的信息,将基于神经网络的自适应共振算法运用于气溶胶单粒子化学成分在线聚类分析。利用该算法对nacl粒子、nacl和cacl2的气溶胶混合物、三聚氰胺气溶胶单粒子以及大气气溶胶单粒子进行在线分类,被成功分类的粒子数占命中粒子总数的100%,当警戒阈值为0.1,学习速率为0.05时,获得的每类聚类中心都能很好地代表该类物质的特征;深入研究了警戒阈值对nacl粒子在线聚类数的影响。结果表明: 当警戒阈值增大到0.8时,在线聚类数增多,分类更加精细。本算法的质谱分析软件基本满足大气气溶胶单粒子在线聚类分析的要求。

【关键词】 大气气溶胶; 气溶胶单粒子; 化学成分; 气溶胶激光飞行时间质谱仪; 自适应共振神经网络

  realtime classification of aerosol single

  particles chemistry composition

  xia weiwei, gu xuejun, zheng haiyang, fang li

  lab of environmental spectroscopy, anhui institute of optics and fine mechanics, chinese academy of sciences, hefei 230031

  abstract to quickly process the laser desorption/ionization mass spectra which were generated by aerosol laser timeofflight mass spectrometer (altofms) during its working and extract the valuable information, an adaptive resonance theorybased neural network, art2a algorithm, was successfully applied to the realtime classification of single particles of nacl, the mixture of nacl and cacl2 aerosol, melamine and the atmospheric aerosol. experimental results showed that when vigilance factor was 0.1 and learning rate was 0.05, art2a algorithm could successfully reveal the aerosol particles categories. besides the successful probability was near 100%, the centroid mass spectra for the single particle classes were obtained, which could represent the characteristic of single particle classes remarkably. the number of nacl single particle classes as a function of vigilance factor was also discussed. the result showed that the number of nacl particle classes was larger when vigilance factor reached 0.8; furthermore the classification was much more precise. the mass spectra acquisition and control software using art2a can basically meet the requirements of realtime classification of atmospheric aerosol single particles.

  keywords atmospheric aerosol; aerosol single particle; chemistry composition; aerosol laser timeofflight mass spectrometer; adaptive resonance neural network

  1 引 言

  大气气溶胶在全球气候变化、全球和区域污染过程、降低能见度等方面起到重要作用,甚至影响人类的生存环境。www.lw881.com获知气溶胶单粒子的粒径和化学成分将有助于解析气溶胶的来源、传输过程及其在大气中的化学反应[1~3]。气溶胶激光飞行时间质谱仪(aerosol laser timeofflight mass spectrometer,altofms)能够对单个气溶胶粒子的粒径和化学成分进行实时测量[4,5]。该仪器在使用过程中会产生海量数据(每分钟达上百个质谱数据),依靠人工处理数据不仅速度慢、劳动强度大,还易出现误差,极大地削弱了仪器实时测量的优势。因此,开发高效全面的在线质谱分析软件非常必要。

  目前已用于质谱数据分析的方法多为离线分析,如等级聚类分析(hca)、主成分分析(pca)、模糊c均值(fcm)[5]、自组织特征映射神经网络(som)和自适应共振算法(art2a)[6~8]。本课题组利用fcm和art2a算法对气溶胶质谱进行离线聚类分析[5,8],取得了较好的效果,但无法满足实时在线快速提取信息的要求。目前,在线聚类分析质谱数据方面的工作鲜有报道。

  art2a神经网络算法与其它算法相比,其最大的特点是能快速识别遇到过的质谱模式类型,即存储在数据库中的聚类中心所代表的模式类,并且能够根据环境输入,自动将不同于已知质谱模式类但又具有相似特征的输入归为新的一类,并将学习到的这个新类的聚类中心保存下来,作为一种新的模式类参与以后的分类。简单而言,该算法具有无需监督、可灵活控制分类精细程度、快速有效识别已记忆质谱模式类以及根据环境变化自适应快速识别和学习新类的特点,非常适合气溶胶粒子化学成分的在线聚类分析。本研究在前期离线聚类分析基础上,利用art2a算法开发实时的化学成分分析软件,将其加载到altofms质谱采集控制系统中,并对实验室环境下和大气中的气溶胶单粒子进行在线分类,对粒子分类后的分类信息在采集控制系统中实时显示。实验证明,此算法可对气溶胶单粒子的化学成分进行在线聚类分析,并可以较好地运用到整机系统中。

  2 实验部分

  2.1 实验装置

  本实验是在自行研制的气溶胶激光飞行时间质谱仪上完成的。该仪器的工作原理及仪器装置详见文献[3~5,9]。采用空气动力学透镜加两级差分系统进样、双束连续激光测量气溶胶单粒子粒径和激光飞行时间质谱仪进行化学成分分析。使用德维尔比斯(devilbiss 40#)产生气溶胶粒子,方法参见文献[8]。

  2.2 数据预处理

  在线聚类分析中的art2a算法是离线聚类分析中art2a算法的简化版本,前者省略了后者中的重复迭代过程,缩小了后者中学习速率的作用范围。这是为了保证存放在数据库中的聚类中心的稳定性,其余步骤相同,见文献[8]。简化的目的是在保证数据库中聚类中心稳定的情况下,通过牺牲少量的分类精确度,实现实时分类当前采集到的气溶胶粒子。在线仿真时单粒子的分析速度可以达到50个/s,而单粒子的采集速率仅为5个/s,因此,在线聚类分析的速度完全可以跟得上粒子的采集速率。

  3 结果与讨论

  3.1 nacl气溶胶单粒子在线聚类分析

  根据离线聚类分析的经验值[7,9],本实验中警戒阈值和学习速率分别取0.1和0.05。

  即便数据库中不存放nacl质谱聚类中心,软件也能自行学习,将粒子质谱很好地聚成3类:图1所示为nacl单粒子ldi正离子质谱在线聚类中心,class 1在m/z 23(na+)和m/z 81(na235cl+)处有明显的特征峰,占总质谱数的57.5%。将其存入数据库中,命名为nacl ⅰ类;class 2中nacl特征峰全部向后平移了1 da,从而被聚成一个新类,占25.7%,这种峰值漂移不是新质量数谱峰的出现,而是离子在穿越质谱仪的离子引出区和加速区极板时发生部分离子吸附,引起极板间电压起伏造成的[11]。正是这种飞行时间质谱峰值的漂移导致了两个来自相同物质的粒子在某个或全部质量数上相差1 da;class 3虽然完全包含了前面class 1中的所有离子种类, 但它比class 1多出了m/z 46(na2+), m/z 83(na237cl+)和m/z 139(na335cl2+) 3个离子特征峰,同样属于nacl类,记为nacl ⅱ类,占3.5%。这与质谱数据的采集次数无关,是nacl质谱种类本身的多样性造成的。命中质谱113个,能够成功聚类的有98个,另外15个质谱(占总质谱数的13.3%)因na+信号峰太强已经过饱和,没有进行聚类,如果改变软件设置的增益使信号减弱,可以全部分类。当数据库中加载了前面获得的两类聚类中心(nacl ⅰ 和nacl ⅱ)时,同样可以很好地聚成3类:nacl ⅰ, nacl ⅱ和newcluster 1。其中newcluster 1即为图1中的class 2。由此可见,软件的自主学习能力是非常强大的。

  3.2 警戒阈值对nacl粒子在线聚类数的影响

  本实验考察了警戒阈值参数。实验发现,加大警戒阈值,可以增加在线分类数、提高分类的精细程度。图2为不同警戒阈值与聚类数的关系。当警戒阈值<0.7时,可以在线分为3类(见3.1节);警戒阈值≥0.8时,聚类数目逐渐增多;警戒阈值=0.95时,聚类数增加到12类,且聚类中心更加精细。由于某个质谱峰相差1 da都会被细化并归到不同的类别中,表明软件具有很好的学习能力。

  3.3 nacl和cacl2气溶胶粒子混合物在线聚类分析

  用devilbiss 40#分别产生多分散的nacl气溶胶粒子和cacl2气溶胶粒子,将其混合在10 l棕色瓶中,用altofms进行检测。实验共获得255个有效质谱数据,分为5类,各聚类的粒子个数(所占比例)、主要质谱峰和物质类型如表1所示。表1 基于art2a算法的聚类概述(略)

  本实验的前提条件是所加载的数据库中只包含nacl类而没有cacl2类:当实验中采集到的质谱特征峰(如23, 46, 81和83)只属于已有数据库中事先存放好的nacl类时,算法能快速识别出来,自动归属到nacl类中;当采集到的质谱峰(m/z 40, 44, 75和77)不属于nacl类时,art2a算法会自动识别和学习特征峰并形成聚类中心newcluster 1、2和3。实验结束后,只需分析3个聚类中心,并根据经验判断newcluster 2和3可能属于cacl2类,因为这两个聚类中心包含了cacl2粒子的最常见的特征质谱峰(40ca2+, 44ca2+, 40ca35cl+和40ca37cl+),能较好地符合cacl2颗粒的激光解吸附电离特性;newcluster 1中的质谱峰主要以40和23为主,由前面的分析就可以推断出粒子可能是nacl和cacl2的混合物。当nacl和cacl2以气溶胶形式相互混合时,会发生凝并,进入altofms的气溶胶粒子产生的质谱有一部分以na+和ca+形式共同存在。由于离子的空间电荷效应导致质谱峰展宽[12],仪器分辨率有时比较差,nacl与cacl2气溶胶粒子混合后的飞行时间质谱中的na+和ca+峰跨越了几个质量数,因此获得的聚类中心在m/z 40附近有m/z 35, 37和38的峰,并不是杂质的影响。因此,当采集到的粒子质谱数据中出现新的质谱模式类时,art2a算法可以很好地适应环境输入,具有自动识别和学习新的质谱模式类型的能力。利用此算法开发的在线质谱分析软件可以完成质谱数据的在线预处理,反应速度快、误差小,从而使得需要人工处理的数据量明显减少,这极大提高了质谱仪实时检测气溶胶粒子的效率。

  3.4 三聚氰胺气溶胶单粒子在线聚类分析

  以三聚氰胺为例研究有机气溶胶单粒子的在线聚类分析。图3a为三聚氰胺(c3h6n6)典型的正、负离子解吸/电离(ldi)质谱。正离子质谱中, m/z 127为分子离子([c3h6n6+h]+),m/z 85 为三聚氰胺开环分子重排失去h2ncn的碎片离子峰([c3h6n6+h-h2ncn]+),m/z 68为m/z 85脱去nh3的碎片离子峰([c3h6n6+h-h2ncn-nh3]+),m/z 60应为三聚氰胺开环分子重排失去hncncn的碎片离子峰([c3h6n6+h-hncncn]+),m/z 43应为m/z 60 脱去nh3的碎片离子峰([c3h6n6+h-hncncnnh3]+)。负离子质谱中m/z 26是可以标识的,为cn-。图3b为三聚氰胺单粒子的在线聚类中心:负离子质谱在m/z 26, 41和66处有明显信号,这与其质谱完全吻合;正离子质谱在m/z 18, 23, 39和43处有明显信号,m/z 127处没有信号,原因是大多数有机气溶胶粒子的ldi谱峰复杂多样,且常存在金属离子的干扰,分子离子峰本身质量数比较大,探测效率很低(三聚氰胺分子离子峰的探测效率仅有0.2%),软件未分析出来,这就是牺牲少量的分类精确度,换取质谱的实时分类。随着实验方法和实验条件的完善和提高,分子离子峰的探测效率会相应优化,此软件可以很好地应用到有机气溶胶粒子的实时分类。

  3.5 大气气溶胶单粒子化学成分在线聚类分析

  在前面研究的基础上,对大气气溶胶单粒子进行实时在线聚类分析。图4为实验过程中截取的质谱采集控制系统软件界面。在质谱采集控制系统[13]基础上增加了实时的化学成分分析模块,对粒子分类后的分类信息在图5左侧中间的列表控件中实时显示。当采集到的质谱不属于已加载的质谱数据库时,在线聚类名称以newcluster 1, newcluster 2, newcluster 3……命名。命中的103个粒子被很好地聚为4类,被成功分类的粒子数占命中粒子总数的100%。

  4 结 论

  本实验利用art2a算法编制软件功能模块,实现了对气溶胶激光飞行时间质谱数据的在线分类。运用此算法对实验室环境下和大气中的气溶胶单粒子进行了在线聚类分析。当警戒阈值为0.1、学习速率为0.05时,能够快速区分大气气溶胶粒子,被成功分类的粒子数占命中粒子总数的100%。获得的每种粒子的聚类中心都能较好地代表该类物质特征,对于有机气溶胶单粒子而言,随着实验方法和实验条件的完善和提高,分子离子峰的探测效率会相应优化,此软件可以很好地应用到有机气溶胶粒子的实时分类。利用art2a算法开发的软件模块具有很好的自主学习和自动识别学习新类的能力,可以应用于气溶胶激光飞行时间质谱仪海量数据的在线聚类分析。

【参考文献】
  1 suess d t, prather k a. chem. rev., 1999, 99(10): 3007~3035

  2 xu siqi(徐思琦), xie zhouqing(谢周清), liu wei(刘 崴), yang hongxia(杨红霞), li bing(李 冰). chinese j. anal. chem.(分析化学), 2010, 38(2): 219~224

  3 xia zhuhong(夏柱红), fang li(方 黎), zheng haiyang(郑海洋), kong xianghe(孔祥和), zhou liuzhu(周留柱), gu xuejun(顾学军), zhu yuan(朱 元), zhang weijun(张为俊). chinese j. anal. chem.(分析化学), 2004, 32(7): 973~976

  4 zhou liuzhu(周留柱), zhu yuan(朱 元), guo xiaoyong(郭晓勇), zhao wenwu(赵文武), zheng haiyang(郑海洋), gu xuejun(顾学军), fang li(方 黎), zhang weijun(张为俊). chinese j. anal. chem.(分析化学), 2005, 33(11): 1551~1554

  5 guo xiaoyong(郭晓勇), fang li(方 黎), zhao wenwu(赵文武), gu xuejun(顾学军), zheng haiyang(郑海洋), zhang weijun(张为俊). spectroscopy and spectral analysis(光谱学与光谱分析), 2008, 28(8): 1713~1717

  6 song x h, hopke p k, fergenson d p, prather k a. anal. chem., 1999, 71(4): 860~865

  7 murphy d m, middlebrook a m, warshawsky m. aerosol sci. tech., 2003, 37(4): 382~391

  8 lin ying(林 莺), guo xiaoyong(郭晓勇), gu xuejun(顾学军), xia weiwei(夏玮玮), zheng haiyang(郑海洋), zhang weijun(张为俊), fang li(方 黎). spectroscopy and spectral analysis(光谱学与光谱分析), 2009, 29(3): 580~584

  9 guo x y, zhao w w, huang m q, fang l, zhang w j. optica applicata, 2007, 37(3): 229~235

  10 denis j p, kevin p r, anthony s w, david b k, murray v j. anal. chem., 2001, 73(10): 2338~2344

  11 zhang shudong(张树东), xu mingkun(许明坤), kong xianghe(孔祥和). spectroscopy and spectral analysis(光谱学与光谱分析), 2007, 27(4): 799~802

  12 shi yong(石 勇), zhou xiaoguo(周晓国), zhao yingguo(赵英国), liu shilin(刘世林), ma xingxiao(马兴孝). acta phys. chim. sin.(物理化学学报), 2005, 21(11): 1269~1273

  13 guo xiaoyong(郭晓勇), zhu yuan(朱 元), zhou liuzhu(周留柱), zhao wenwu(赵文武), zhou zhiguang(周志广), zheng haiyang(郑海洋), fang li(方 黎), zhang weijun(张为俊). chinese journal of quantum electronic(量子电子学报), 2006, 23(2): 217~221

上一篇:正交试验法优化香附总黄酮提取工艺

下一篇:喉疾灵口含片质量标准研究