基于太赫兹光谱的植物生长调节剂检测技术研究
陈锡爱1,2,3, 武雪1, 张松1, 王凌1
1. 中国计量大学机电工程学院, 浙江 杭州 310018
2. 浙江大学工业控制国家重点实验室, 浙江大学控制学院, 浙江 杭州 310027
3. 浙江亚龙教育装备股份有限公司, 浙江 温州 325105

作者简介: 陈锡爱, 1981年生, 中国计量大学机电工程学院讲师 e-mail: xachencjlu@163.com

摘要

应用太赫兹时域光谱技术获取了赤霉素、 氯吡脲和噻苯隆的太赫兹时域谱图和参考信号的时域谱图, 并计算获得了折射率谱和吸收谱。 实验结果显示, 这三种植物生长调节剂在太赫兹波段内有着明显的特征吸收峰。 而后基于最小二乘支持向量机对十九种不同物质的太赫兹时域吸收光谱进行了分类检测, 并采用遗传算法和粒子群寻优算法对其进行了优化, 最后通过添加噪声测试了模型的鲁棒性。 该研究验证了太赫兹时域光谱技术用于药物成分检测的可行性, 为植物生长调节剂的检测和鉴别提供了新的实验方法。

关键词: 太赫兹光谱; 植物生长调节剂; 吸收系数; 最小二乘支持向量机; 多类分类
中图分类号:O433.5 文献标志码:A
Study of Plant Growth Regulators Detection Technology Based on Terahertz Spectroscopy
CHEN Xi-ai1,2,3, WU Xue1, ZHANG Song1, WANG Ling1
1. School of Mechanical and Electrical Engineering, China Jiliang University, Hangzhou 310018, China
2. State Key Laboratory of Industrial Control Technology, College of Control Science and Engineering, Zhejiang University, Hangzhou 310027, China
3. Zhejiang Yalong Educational Equipment Joint-Stock Co., Ltd., Wenzhou 325105, China
Abstract

The terahertz spectra of gibberellin, forchlorfenuron and thidiazuron in the range of 0.2 to 2.0 THz were obtained by THz time-domain spectroscopy, based on which their absorption and refraction spectra were calculated. The results showed that all of them had obvious characteristic absorption peaks in the terahertz band. The terahertz absorption spectra of nineteen different substances were classified and tested by least squares support vector machine. Particle swarm optimization and genetic algorithm were applied for the parameter optimization of the least squares support vector machine, and the stability of the model was tested with noise addition. This study demonstrates the feasibility of terahertz spectroscopy for identification of plant growth regulators and will provide a new approach for the detection of plant growth regulators.

Keyword: Terahertz spectroscopy; Plant growth regulators; Absorption coefficient; Least squares support vector machines; Multi-class classification
引言

植物生长调节剂是非营养性化学物质, 传导至植物体内的作用部位后, 可以促进或抑制植物的某些生长环节, 使之更符合人类的消费需求。 赤霉素、 氯吡脲和噻苯隆是应用于农业生产的常用植物生长调节剂, 其在使用的过程中如果按剂量和方法规范使用, 一般不会对人体健康产生危害。 如使用不当, 则可能危害植物生长, 影响农产品品质并损害人体健康。

太赫兹波的频率处于0.1~10 THz的范围[1, 2], 其光子能量只有4.1 MeV, 这种能量级低于各种化学键的键能, 因而不会产生有害的电离反应, 故而对人体是安全的[3, 4]。 虽然它的光子能量较低, 但是这一波段仍然包含了相当大的光谱信息, 太赫兹光谱的分辨特性使得太赫兹探测技术能够鉴别物体的组成成分[5, 6, 7]。 相比于传统的高效液相色谱法(HPLC)、 气相色谱-质谱法(GC-MS法)等药品检测方法[8, 9], 利用太赫兹时域光谱技术检测药品灵敏度高、 快速高效, 是一种潜在的物质快速检测方法。

1 实验部分
1.1 装置

采用美国Zomega公司研制的THz-TDS-Z3透射式太赫兹时域光谱系统, 如图1所示。 分束镜(CBS)将飞秒激光脉冲分为光束Ⅰ (泵浦光路)和光束Ⅱ (探测光路)两束光。 泵浦光入射到砷化镓天线从而产生THz脉冲, 经PM1和PM2抛物面镜聚焦后的THz脉冲以透射方式穿过被测样品, 最后和探测光同时射入碲化锌晶体(ZnTe)。 THz光谱的时域波形通过探测脉冲和激光扫描的时延, 以及探测脉冲的偏振状态计算获取。 为减少水蒸气对太赫兹光谱吸收所带来的干扰, THz光路(图1虚线框)中充满了高纯度氮气, 系统的实验温度为294.1 K, 湿度为1.1%。

图1 THz-TDS系统结构图Fig.1 Schematic diagram of THz-TDS system

1.2 样品制备

实验研究所采用的赤霉素、 氯吡脲和噻苯隆标准品购于大连美仑生物技术有限公司。 为了增加实验样品的粘合性以便于样品压片, 实验中将聚乙烯与每个样品按1: 1比例充分混合, 并采用玛瑙钵细致研磨, 最后在12MP的大气压下压成厚度1 mm左右, 直径13 mm的圆盘形薄片。 由于聚乙烯在太赫兹波段内无吸收, 因而不影响样品的光谱分析。

1.3 方法

采用Dorney和Duvillaret提出的光学参数物理模型[10]求解THz吸收谱和折射率谱。 THz光通过无样品的纯氮气环境获得参考光谱Eref(t), 而后将按1.2节制作的样品放置于检测光路, THz光穿透样品后获得光谱采样信号Esam(t)。 将采样信号Esam(t)和参考信号Eref(t)变换到频率域, 其比值如式(1)所示。

Esam(ν)Eref(ν)=4n(n+1)2exp[-αd/2+i2πν(n-1)d/c]=A(ν)exp[(ν)](1)

式(1)中, d为样品的厚度, Φ (ν )和A(ν )分别为参考信号与采样信号的相位差和幅度比值。 样品的折射系数n(ν )和吸收系数α (ν )可由式(2)和式(3)获得。

n(ν)=1+c2πνdΦ(ν)(2)α(ν)=-2dlnA(ν)[n(ν)+1]24n(ν)(3)

2 结果与讨论

赤霉素、 氯吡脲和噻苯隆的THz时域波形与参考波形如图2(a, b, c)所示, 其中实线表示参考信号的波形, 虚线表示样品的THz时域波形。 从图中可以明显的看出, 三种样品的时域光谱信号与参考信号相比较, 均存在时间上的延迟。 三种样品对THz光波均存在吸收作用, 导致了THz光波的衰减, 除此之外, 样品的折射率大于空气的折射率, 同样导致了其在时域上的相位延迟。

图2 三种植物生长调节剂的时域光谱图Fig.2 THz time-domain spectra of three plant growth regulators

赤霉素、 氯吡脲和噻苯隆的折射率谱如图3(a, b, c)所示, 在0.2~2.0 THz波段范围内, 它们所对应的折射率大小都不相同。

图3 三种植物生长调节剂的折射率谱图Fig.3 Refractive index spectra of three plant growth regulators

根据式(1)— 式(3)计算所得的赤霉素、 氯吡脲和噻苯隆的吸收光谱如图4(a, b, c)所示。

图4 三种植物生长调节剂的吸收光谱图Fig.4 Absorption spectra of three plant growth regulators

从图4(a, b, c)分别可得, 在0.2~2.0 THz波段范围内, 赤霉素在0.5, 1.42, 1.66和1.87 THz处存在吸收峰, 氯吡脲在0.31, 1.23, 1.51, 1.71和1.92 THz处存在着吸收峰, 噻苯隆在0.75, 1.03, 1.61和1.95 THz处也存在着吸收峰。 三种不同试验样品的吸收峰所对应的 THz波段各不相同, 而且吸收峰所对应的吸收强度也各有差别, 与图3对比分析可得, 吸收谱中的吸收峰与折射率曲线中的反常色散区呈一一对应关系。 由图4(a, b, c)可得这三种常用的植物生长调节剂在0.2~2.0 THz波段内的吸收峰位置和强度各不相同, 可以作为其种类和成分鉴别的依据。

3 基于最小二乘支持向量机的太赫兹光谱分类检测
3.1 最小二乘支持向量机

最小二乘支持向量机(LS-SVM)[11]和传统支持向量机(SVM)相比, 其主要区别为: (1)采用了一组线性方程的求解来取代传统SVM的二次规划求解问题; (2)采用不等式约束取代了SVM采用的等式约束; (3)更低的计算复杂度, 易于在线使用。

对于给定的训练样本集{xk, yk }k=1N, LS-SVM要构造一个如式(4)所示的分类器。

y(x)=signk=1NαkykΨ(x, xk)+b(4)

其中, α k为正实数, b为实数, Ψ (x, xk)为核函数。 所需求解的优化问题如式(5)所示。

minw, b, eJ3(w, b, e)=12wTw+γ12k=1Nek2(5)

该问题的约束条件如式(6)所示。

该二次规划问题的拉格朗日函数如式(7)所示。

L3(w, b, e; α)=J3(w, b, e)-k=1Nαk{[wTφ(xk)+b]-1+ek}(7)

其中, α k为拉格朗日乘子, 其优化条件如式(8)所示。

L3w=0w=k=1Nαkykφ(xk)L3b=0k=1Nαkyk=0L3ek=0αk=γek k=1, , NL3αk=0yk[wTφ(xk)+b]-1+ek=0 k=1, , N(8)

式(8)可以转化为式(9)所示的线性方程

I00-ZT000-YT00γI-IZYI0wbeα=0001(9)

其中, Z= φ (x1)Ty1, …, φ (xN)TyN , Y=[y1, …, yN], =[1, …, 1], e=[e1, …, eN], α =[α 1, …, α N]。 采用Mercer条件, 见式(10)

Ωkl=ykylφ(xk)Tφ(xl)=ykylΨ(xk, xl) k=1, , N(10)

从式(9)中选择与ab有关的方程, 转换后如式(11)所示。

0-YTYΩ+γ-1Iba=01(11)

ab可以通过对式(11)采用最小二乘求解获得。 研究中采用高斯径向基核函数Ψ (x, xk)=exp{-‖ x-xi2/2δ 2}, 该函数的参数δ 越大, 收敛速度越快。 对于使用径向基核函数的LS-SVM, 模型建立过程中的关键问题在于其惩罚参数γ 和核函数参数δ 值的确定, 这两个参数的取值很大程度上决定了LS-SVM的泛化和学习能力。

这两个参数值的设置可采用基于网格搜索的方法或基于优化算法获取, 实验模型的验证则可采用交叉验证(cross validation)方法。

3.2 分类对象的数据采集

除三种常用植物生长调节剂外, 研究中还对十六种药品和食品的THz光谱数据进行了采集。 十六种样品分别为: 诺氟沙星、 环丙沙星、 培氟沙星、 氧氟沙星、 恩诺沙星、 氧氟沙星、 甲地孕酮、 酒石酸、 坎地沙坦、 抗坏血酸、 罗格列酮、 苋菜红、 柠檬黄、 乳酸清、 VB16和面粉。 该太赫兹样品检测库由抗生素、 孕激素、 食品添加剂、 植物生长调节剂、 营养药物和食品组成, 这些样品均与人体健康息息相关, 在太赫兹波段都具有较明显的特征, 适合于在太赫兹波段分类建模。

十九种样品均按照1.2节所描述的方法制作10个样片, 每个样片采集10次时域光谱信息后取平均值作为其最终光谱数据, 而后通过式(1)— 式(3)的方法计算其太赫兹吸收光谱作为建模数据。

3.3 基于网格搜索的分类检测建模

十九种样品的190个样片中取部分数据为训练对象, 部分数据为测试对象, 基于交叉验证的方法进行最小二乘支持向量机的建模。 支持向量机训练的输入参数为每个样品在0.2~2.0 THz波段所对应的71个吸收系数值, 采用多类分类方法建模, 模型识别率的计算方法为测试样品的正确识别个数除以测试样品的总数。

在建模的过程中采用网格搜索的方法进行惩罚参数γ 和核函数参数δ 的寻优。 分类算法运行测试的计算机配置为: Wineows7操作系统; Intel酷睿i7-4500U处理器, 主频1.8 GHz; 8 GB内存; 500 G硬盘。 建模过程如表1所示。

表1 基于网格搜索的太赫兹光谱分类 Table 1 Classification of terahertz spectrum based on grid search

经网格搜索算法计算所得的LS-SVM惩罚参数γ 为180.02, RBF核函数的参数δ 为4.13。

3.4 基于遗传算法和粒子群算法的分类检测建模

遗传算法(GA)由美国的Holland教授提出[12, 13], 该算法依据“ 优胜劣汰、 适者生存” 的进化原理, 根据个体在选择、 交叉和变异后的适应情况进行筛选, 淘汰适应度差的个体, 保留适应度好的个体。 在新产生的群体中, 后代个体通过继承上一代的基因信息, 而后选择比上一代还要优秀的基因, 通过不断循环直到满足优化条件。

粒子群算法(PSO)借鉴了鸟类捕食行为[14], 相比于遗传算法, 粒子群算法中没有选择、 交叉和变异等概念, 而是通过在最优解空间寻找最优解。

研究中分别通过遗传算法和粒子群算法对基于最小二乘支持向量机的十九种样品模型进行优化。 以不同约束参数所对应的分类准确率为评价函数, 对模型的惩罚参数γ 和核函数参数δ 进行迭代寻优, 最终建立优化后的模型。 其中遗传算法(GA)的初始种群数为80, 搜索范围为0~200, 粒子群算法(PSO)的初始群20, 最大速度100, 搜索范围0~200。 由于惩罚参数和核函数的参数寻优存在着多解, 因而在遗传算法和粒子群算法的寻优过程中各运行了100次, 而后取其墙均值。 建模的过程如表2所示。

表2 基于GA和SPO的太赫兹光谱分类 Table 2 Classification of terahertz spectrum based on GA and SPO

为了验证模型的鲁棒性, 对每个样片的吸收谱随机添加了10%的噪声, 而后重新建模测试, 测试性能如表3所示。

表3 添加了噪声的太赫兹光谱分类 Table 3 Classification of terahertz spectrum with noise

分类测试结果显示, 最小二乘支持向量机能够很好地实现基于太赫兹吸收谱的物质识别并具有很好地鲁棒性。 相比于网格搜索算法, 遗传算法和粒子群算法在建模效率上有着显著优势。

4 结论

利用THz-TDS技术研究了三种常见植物生长调节剂在0.2~2.0 THz波段的时域谱、 折射率谱和吸收谱, 实验结果显示, 它们在该波段具有较明显的吸收特征峰。 基于支持向量机技术对十九种不同物质的太赫兹时域光谱进行了建模, 并采用遗传算法和粒子群寻优算法对其进行参数寻优。 分类检测结果显示, 基于最小二乘支持向量机的太赫兹光谱检测技术能够很好地实现物质的种类识别并具有较好的鲁棒性, 本研究为植物生长调节剂的识别和检测应用提供了新的实验方法。

由于仅采用三种常用的植物生长调节剂与聚乙烯粉末(在THz波段透明)相混合后进行测试, 而如何检测混合物中微量痕迹的植物生长调节剂还有大量工作要做。 另外, 受样品数量限制, 仅对十九种样品组成的太赫兹吸收光谱数据库进行了建模测试, 下一步的大样品数据建模中还有很多方法待优化。

The authors have declared that no competing interests exist.

参考文献
[1] Meng Tianhua, Du Ruiqing, Hou Zheng, et al. Journal of Archaeological Science, 2015, 55: 280. [本文引用:1]
[2] Marcello Picollo, Kaori Fukunaga, Julien Labaune. Journal of Cultural Heritage, 2015, 16: 73. [本文引用:1]
[3] Fabien Destic, Christophe Bouvet. Case Studies in Nondestructive Testing and Evaluation, 2016, 6: 53. [本文引用:1]
[4] Ma Yehao, Huang Pingjie, Hou Dibo, et al. Chemometrics and Intelligent Laboratory Systems, 2016, 150: 65. [本文引用:1]
[5] Siuly, Yin Xiaoxia, Sillas Hadjiloucas, et al. Computer Methods and Programs in Biomedicine, 2016, 127: 64. [本文引用:1]
[6] Ji Te, Zhang Zengyan, Zhao Hongwei, et al. Optics Communications, 2014, 312: 292. [本文引用:1]
[7] Frank Platte, Michael Heise H. Journal of Molecular Structure, 2014, 1073: 3. [本文引用:1]
[8] Tao Wuqun, Zhou Zhiguang, Zhao Bin, et al. Journal of Pharmaceutical and Biomedical Analysis, 2016, 131: 140. [本文引用:1]
[9] Hyun Ee Ok, Sung-Wook Choi, Meehye Kim, et al. Food Chemistry, 2014, 163: 252. [本文引用:1]
[10] Timothy D Dorney, Richard G Baraniuk. Journal of the Optical Society of America A-Optics Image Science & Vision, 2001, 18: 1562. [本文引用:1]
[11] Cheng Qiang, Jale Tezcan, Cheng Jie. Pattern Recognition Letters, 2014, 40: 88. [本文引用:1]
[12] Ana Roberta Melo, Michelli Marlane Silva Loureiro, Felipe Loureiro. Procedia Computer Science, 2017, 108: 1384. [本文引用:1]
[13] Zahra Alizadeh Afrouzy, Seyed Hadi Nasseri, Iraj Mahdavi. Computers & Industrial Engineering, 2016, 101: 440. [本文引用:1]
[14] Amged S El-Wakeel. Electric Power Systems Research, 2014, 116: 29. [本文引用:1]