利用光谱技术无损检测油菜叶片中乙酰乳酸合成
【摘要】 应用可见/近红外光谱技术实现了油菜叶片中乙酰乳酸合成酶(als)的快速无损检测。对99个油菜样本进行光谱扫描,经过平滑、变量标准化、一阶求导等预处理后,应用偏最小二乘法(pls)建立了als的预测模型。同时提取有效特征变量,作为反向传输人工神经网络(bpnn)和最小二乘支持向量机(lssvm)的输入值,并建立相应的模型。用66个样本建模,33个样本验证。结果表明,lssvm模型能够获得最优的预测结果,预测集样本的相关系数(r)、预测标准差(rmsep)和偏差(bias)分别为0.998、 0.715和0.079,获得了满意的预测精度。结果表明,应用可见/近红外光谱技术结合lssvm检测油菜中乙酰乳酸合成酶是可行的,并能获得满意的预测精度,为进一步应用光谱技术进行油菜生长状况的大田监测奠定了基础。
【关键词】 可见/近红外光谱 油菜 乙酰乳酸合成酶 偏最小二乘法 反向传输人工神经网络 最小二乘 支持向量机
1 引言
油菜是一种非常重要的油料作物,在我国广泛种植。油菜不同时期的生长状况关系到油菜籽的产量和质量。油菜叶片中的乙酰乳酸合成酶(acetolactate synthase,als)的活力是油菜生长过程中一项非常重要的生理指标。als能够反映油菜叶片的生长状况,因此可以通过检测油菜叶片中的als,得到油菜的生长状况。近年来,油菜种植中使用了大量的除草剂,丙酯草醚除草剂是一种新型的als抑制剂。该除草剂可以阻止直链氨基酸的生物合成[1,2],具有对油菜安全、杀草谱较广、除草活性高、持效期长,且低毒、低残留,与环境相容等特点[3]。目前,丙酯草醚除草剂对油菜生长的影响及作用机理的研究还很少。而对油菜叶片中als活力的检测,可以反映出丙酯草醚除草剂对油菜生长状况的影响。传统的als检测方法,需将油菜叶片离体采回,在实验室进行破坏性的实验[4,5],才能得到分析结果。该方法不能够实现长期对同一株或同一小区内油菜生长过程中als的连续检测。因此,开展简单、快速、无损的als检测技术研究是很有必要的。这对实现油菜生长状况的大田检测和连续监测,提高油菜籽的产量和质量有重要意义。
可见/近红外光谱技术是一种快速简便无损的分析方法。它已被广泛应用于农业、食品、石油化工、医药等行业[6~8]。可见/近红外光谱技术已在油菜籽的品质分析中有所应用,如油菜籽的含油量和蛋白质含量[9]、脂肪酸[10]、芥酸和硫苷含量[11,12]以及酸性洗涤纤维[13,14]等。冯雷等[15]应用多光谱视觉传感技术检测了油菜中的氮含量。潘玲玲等[16]应用紫外/可见光谱检测了玉米叶片中叶绿素含量。而应用光谱技术对能反映油菜生长状况的乙酰乳酸合成酶的检测还少有报道。本研究通过对丙酯草醚除草剂处理后的油菜叶片的可见/近红外漫反射光谱进行分析,结合现代化学计量学的方法,得到一种快速无损检测油菜叶片中als活力的方法,为进一步研究油菜生长状况的其它生理指标和实现其大田活体连续监测奠定基础。
2 实验部分
2.1 仪器设备
handheld fieldspec光谱仪 (美国analytical spectral device公司),光谱测定范围325~1075 nm,采样间隔为1.5 nm,探头视场角为20°,光谱扫描次数设定为30次。光源采用14.5 v卤素灯。实验采用漫反射模式,光谱仪探头和光源对准样本中心成45°角,并使油菜叶片样本、光谱仪探头和光源分布于同一条直线上。分析软件采用asd view spec pro,unscrambler v9.6(camo asa, oslo, norway),matlab v7.0(the math works, natick, usa)。
2.2 油菜样本制备及als的测定
实验所用油菜样本来自浙江大学试验农场,采用一般的油菜田间管理方法,对油菜施用丙酯草醚除草剂,浓度梯度为0、100、500和1000 mg/l。共收集了99个样本,其中30、24、24和21个样本分别对应的除草剂的浓度为0、100、500和1000 mg/l。每个浓度梯度随机选择2/3的样本作为建模集样本(n=66),剩余的样本作为预测集样本(n=33)。首先使用asd光谱仪对油菜叶片所有样本进行光谱扫描,获得叶片的光谱曲线,再应用所获得的光谱数据结合化学计量学方法建模,即可实现油菜叶片中乙酰乳酸合成酶的检测。后续应用所建模型,无需对油菜叶片进行破坏性化学方法检测,只需获得光谱数据,即可实现油菜叶片中als的无损检测。
建模中油菜叶片als的测定采用传统的分析方法。剪取油菜叶片,称量,剪碎,加入液氮速冻样品,研磨成粉末状。再按1∶2(v/v)比例加入提取缓冲液,充分研磨后,浸提过滤出粗酶液,待用。整个提取过程在-4 ℃的低温冰浴条件下进行。1.0 ml酶促反应缓冲液中加入als粗酶液0.5 ml,立即置于37 ℃恒温水槽中启动反应,水浴1 h后加入0.1 ml 3 mo1/l h2so4终止反应(空白对照试管在反应前加h2so4);将待测液置于60 ℃恒温水浴槽中脱羧反应15 min;再顺次加入0.5%肌酸和5%α萘酚的10% naoh溶液各1.0 ml,置于60 ℃的恒温水浴槽中显色反应15 min。取出后,冷却至室温,5000 g离心10 min;上清液用紫外分光光度仪在530 nm波长下测定其吸光度,得到als活力,用[od530/g fw/h]表示。
2.3 光谱数据预处理
由于原始光谱数据含有来自高频随机噪音、样本不均匀、基线漂移、光散射等不利因素的影响,需对其进行预处理,例如平滑(smoothing)、变量标准化(snv)、一阶及二阶(first and second derivative)导数处理等。通过多次尝试,实验选择savitzkygolay平滑法,平滑点数为9,并进行snv处理,再进行一阶导数处理,求导的数据间隔点(segment size)为3。为消除光谱数据在采集时首端与末端产生的部分噪音,截取400~1000 nm波段的光谱数据进行分析。
2.4 光谱建模的数学模型
2.4.1 偏最小二乘法模型 在光谱技术建模分析中,偏最小二乘法(pls)是一种应用最为广泛的分析方法[17]。pls可以提取油菜叶片光谱数据的有效信息,并同时考虑als活力,建立光谱数据和als活力的相关关系模型,并通过预测集样本对该模型进行检验。建模时采用交互验证法(crossvalidation)来防止模型产生过拟合。模型的评价指标为样本的als活力的预测值与真实值之间的相关系数(r),预测标准差(rmsep)和偏差(bias)。模型的相关系数越高,预测标准差越小,偏差的绝对值越小,模型的精度越高。本研究建立了快速检测油菜叶片中als活力的pls模型。
2.4.2 反向传输人工神经网络(bpnn)模型 在进行pls建模分析的同时,还可以提取光谱数据的有效特征变量,进行bpnn模型分析[18]。这些特征变量可以作为bpnn的输入值,以减少bpnn模型的计算量,采用sigmoid传递函数,通过调节网络层的参数,减少模型的拟合残差,从而建立快速检测als活力的bpnn模型。
2.4.3 最小二乘支持向量机模型 最小二乘支持向量机(lssvm)是一种新型的统计学习方法[19~21],它通过结构风险最小化原理来提高其泛化能力。本研究用pls提取的有效特征变量作为lssvm模型的输入变量,采用径向基函数(rbf)作为核函数,als活力作为模型输出变量,建立了als活力预测的lssvm模型。
3 结果与讨论
3.1 油菜叶片的光谱图及als活力统计分析
油菜叶片的可见/近红外吸收光谱图如图1所示。图1光谱波长范围为400~1000 nm,纵坐标为吸光度。油菜叶片的光谱曲线的趋势非常相似,并没有明显的差别。在500和680 nm处分别有两个吸收峰,可能由油菜叶片的叶绿素或其它内部成分吸收引起。油菜叶片中als的统计值如表1所示。建模和预测样本的als均包含了较大的范围,这对建立的模型的稳定性和代表性很有帮助。
图1 油菜叶片的可见/近红外光谱原始光谱图(略)
fig.1 original vis/nir spectra of oilseed rape leaves
表1 油菜叶片中乙酰乳酸合成酶活力的统计值(od530/g fw/h)(略)
table 1 statistical values of acetolactate synthase (als) in oilseed rape leaves (od530/g fw/h)
3.2 pls模型的建立
将预处理后的光谱数据作为输入变量,油菜叶片的als活力作为预测值,建立pls模型。采用交互验证法预测残差平方和(press)最小值所在的因子数为最佳因子数,得到pls模型的最佳因子数为28。该模型对乙酰乳酸合成酶的预测结果如表2所示。表2中斜率(slope)和截距(offset)作为评价的参考指标,slope越接近1越好,截距越接近0相对模型越好。对预测样本进行预测的相关系数、预测标准差和偏差分别为0.932、6.395和0.188,获得了较为满意的结果。图2a为预测集样本的真实值与预测值的散点分布图。横坐标为真实值,纵坐标为pls模型的预测值,预测样本分布于回归直线的两侧。结果表明,应用可见/近红外光谱结合pls方法,对油菜叶片中als进行预测是可行的。
3.3 bpnn模型的建立
通过pls分析,计算所有99个样本的特征变量。根据特征变量的累计贡献率,选择前28个特征变量作为神经网络的输入值。因为前28个特征变量,可以代表光谱数据96.0%的有效信息。模型的输出层为油菜叶片的als活力值。通过调整网络参数得到最优的网络结构,从而得到最优的预测模型。经过反复试验得到的最优网络结构为:输入层为28个输入单元,隐含层为8个隐含单元和1个输出层单元的三层bpnn模型。通过对66个建模样本进行训练,限定最大迭代次数为2000,拟合残差为1.0×10-5。对预测集33个样本进行预测,拟合残差为1.4×10-3,预测结果如表2所示。对预测样本进行预测的相关系数r=0.994, rmsep=2.460, bias=-1.536,预测结果优于pls模型。预测集样本的真实值与预测值的散点分布图如图2b所示。图2b中,样本在回归直线两侧的分布与图2a相比更为紧密。
图2 应用pls模型(a)和bpnn模型(b)对油菜叶片als的预测散点分布图(略)
fig.2 predicted vs reference values of als in oilseed rape by partial least squares ( pls) model (a) and back propagation neural net work(bpnn) model(b)
3.4 lssvm模型的建立
该模型同样用前28个特征变量作为lssvm模型的输入值。采用径向基函数作为核函数,该模型主要有两个待定参数:超参数γ和rbf核函数参数σ2,这两个参数在很大程度上决定了模型的学习泛化能力和预测能力。本研究采用带有交互验证的网格搜索法(gridsearch)得到这两个参数的最优组合。寻优过程由粗选和精选两个步骤完成。依据最小二乘支持向量机原理和经验,γ和σ2的取值范围是1~108。因为网格搜索法是一个遍历搜索过程,初始值的选取对结果没有影响,本研究这两个参数的初始值均取最小值。
图3 应用lssvm模型对油菜叶片als的预测散点分布图(略)
fig.3 predicted vs reference values of als in oilseed rape by least squaressupport vector machine(lssvm) model
通过计算得到模型参数的最优组合为:γ=1.1×106,σ2=1.0×105。该模型的预测结果如表2和图3所示。该模型对预测集样本进行预测,其相关系数r=0.998,rmsep=-0.715,bias=0.079,预测精度优于pls模型和bpnn模型。通过三种建模方法的比较,bpnn和lssvm模型的预测结果均优于pls模型,原因可能在于pls方法只能处理光谱数据中的线性相关关系,而bpnn和lssvm方法可以利用光谱数据中的非线性信息,进而提高了模型的预测精度。结果表明,应用可见/近红外光谱技术结合化学计量学方法可以快速准确预测油菜叶片中乙酰乳酸合成酶(als)活力,这为进一步研究油菜生长状况的其它生理指标,以及进行油菜生长状况大田(onfield)活体监测奠定了基础。
表2 应用不同模型对油菜叶片中乙酰乳酸合成酶活力的预测结果(略)
table 2 prediction results of als in oilseed rape leaves by different models
4 结语
应用可见/近红外光谱技术结合化学计量学方法(pls,bpnn和lssvm)建立了预测als活力的模型,实现了油菜叶片中乙酰乳酸合成酶(als)的快速无损检测。同时提取了代表光谱有效信息的特征变量,建立了als预测的bpnn和lssvm模型。结果表明,应用可见/近红外光谱技术快速无损检测油菜叶片中als是可行的,并能获得满意的预测精度。该结果为应用光谱技术进行油菜生长状况大田活体监测提供了参考方法,也为进一步检测油菜生长中其它生理指标,建立油菜生长模拟模型奠定了基础。
【参考文献】
1 cobb a h, kirkwood r c. herbicides and their mechanism of action. sheffield: sheffield academic press, 2000
2 scarponi l, younis m e, standardard a. j. agric. food chem., 1997, 45: 3652~3658
3 chen jie (陈 杰), yuan jun(袁 军), liu jidong(刘继东), fu qunmei(付群梅), wu jun(吴 军). acta phytophylacica sinica(植物保护学报), 2005, 32(1): 48~52
4 leyval d, uy d, delaunay s, goergen j l, engasser j m. j. biotechnol., 2003, 104: 241~252
5 yang y t, peredelchuk m, bennett g n, san k y. biotechnol. bioeng., 2000, 69: 150~159
6 yan yanlu(严衍禄), zhao longlian(赵龙莲), han donghai(韩东海), yang shuming(杨曙明). the foundation and application of near infrared spectroscopy analysis(近红外光谱分析基础与应用). beijing(北京): china light industry press(中国轻工业出版社), 2005
7 xiao yanchun(肖彦春), dou sen(窦 森). chinese j. anal. chem.(分析化学), 2007, 35(11): 1596~1600
8 liu xian(刘 贤), han lujia(韩鲁佳), yang zengling(杨增玲), li qiongfei(李琼飞). chinese j. anal. chem.(分析化学), 2007, 35(9): 1285~1289
9 montes j m, paul c, melchinger a e. plant breed, 2007, 126: 329~330
10 wu jianguo(吴建国), shi chunhai(石春海), zhang haizhen(张海珍). spectrosc. spectr. anal.(光谱学与光谱分析), 2006, 26(2): 259~26211 rui yukui(芮玉奎), huang kunlun(黄昆仑), wang weimin(王为民), guo jing(郭 晶), jin yinhua(金银花), luo yunbo(罗云波). spectrosc. spectr. anal.(光谱学与光谱分析), 2006, 26(12): 2190~2192
12 font r, del ríocelestino m, cartea e, de harobailón a. phytochemistry, 2005, 66: 175~185
13 font r, wittkop b, badani a g, ríocelestino m, friedt w, lühs w, harobailón a. plant breed., 2005, 124:410~412
14 font r, del río m, fernndez j m, de haro a. j. agric. food chem., 2003, 51: 2917~2922
15 feng lei(冯 雷), fang hui(方 慧), zhou weijun(周伟军), huang min(黄 敏), he yong(何 勇). spectrosc. spectr. anal.(光谱学与光谱分析), 2006, 26(9): 1749~1752
16 pan lingling(潘玲玲), xu xiaojie(徐晓洁), tan jingjing(谭晶晶), zhang haihan(张海燕), qian yingzhe(乔英哲), zhang yuhui(张晔晖). chinese j. anal. chem.(分析化学), 2007, 35(3): 413~415
17 haaland d m, thomas e v. anal. chem., 1988, 60: 1193~1202
18 he y, feng s j, deng x f, li x l. food res. int., 2006, 39: 645~650
19 suykens j a k, van gestel t, de brabanter j, de moor b, vandewalle j. least squares support vector machines. singapore: world scientific, 2002
20 guo hui(郭 辉), liu heping(刘贺平), wang ling(王 玲). j. syst. simul.(系统仿真学报), 2006, 18(7): 2033~2036
21 suykens j a k, vandewalle j. neural process. lett., 1999, 9: 293~300