激光诱导击穿光谱鉴别硫熏浙贝母
赵懿滢1, 朱素素1, 何娟3, 张初1, 刘飞1,2, 何勇1,2,*, 冯雷1,2
1. 生物系统工程与食品科学学院, 浙江大学, 浙江 杭州 310058
2. 农业农村部光谱检测重点实验室, 浙江 杭州 310058
3. 浙江省中医药研究院, 浙江省中药新药研发重点实验室, 浙江 杭州 310007
*通讯联系人 e-mail: yhe@zju.edu.cn

作者简介: 赵懿滢, 1993年生, 浙江大学生物系统工程与食品科学学院博士研究生 e-mail: zhaoyy@zju.edu.cn

摘要

探究了应用激光诱导击穿光谱(LIBS)结合化学计量学方法鉴别硫熏浙贝母的可行性。 采集了未经硫熏、 轻度硫熏和重度硫熏的浙贝母样本的LIBS光谱, 使用小波变换和归一化对原始光谱进行预处理后, 分别建立了基于全波段(400.41~871.65 nm)和基于特征波段(400.41~600.02 nm)的支持向量机(SVM)、 极限学习机(ELM)和随机森林(RF)的鉴别模型。 结果表明: 基于特征波段建立的三类模型的性能均与基于全波段建立的模型保持一致或更优, 说明特征波段的提取是有效的。 基于特征波段建立的模型中, SVM模型性能最优, 建模准确率和预测准确率分别达到了100%和95.83%。 综上所述, 应用LIBS技术结合特征波段提取和化学计量学方法鉴别不同程度硫熏的浙贝母是可行的, 且具有快速、 简便、 多元素同时分析的优势, 可为鉴别硫熏中药材提供依据, 有助于建立中药材质量检测与分级评定系统。

关键词: 激光诱导击穿光谱; 浙贝母; 硫磺熏蒸; 化学计量学
中图分类号:O657.3 文献标志码:A
Identification of Fritillaria thunbergii Treated by Sulfur Fumigation Using Laser-Induced Breakdown Spectroscopy
ZHAO Yi-ying1, ZHU Su-su1, HE Juan3, ZHANG Chu1, LIU Fei1,2, HE Yong1,2,*, FENG Lei1,2
1. College of Biosystems Engineering and Food Science, Zhejiang University, Hangzhou 310058, China
2. Key Laboratory of Spectroscopy Sensing, Ministry of Agriculture and Rural Affairs, Hangzhou 310058, China
3. Zhejiang Academy of Traditional Chinese Medicine, Key Laboratory of Research and Development of Chinese Medicine of Zhejiang Province, Hangzhou 310007, China
Abstract

The paper discusses the feasibility of identifying Fritillaria thunbergii treated by sulfur fumigation using laser-induced breakdown spectroscopy (LIBS) technology with the combination of chemometric methods. Spectral data of Fritillaria thunbergii samples of no sulfur fumigation (no SF), mild sulfur fumigation (mild SF) and severe sulfur fumigation (severe SF) were collected and preprocessed by wavelet transform and normalization. Discrimination models of support vector machine (SVM), extreme learning machine (ELM) and random forest (RF) were developed on full spectra (400.41~871.65 nm) and characteristic wavebands (400.41~600.02 nm), respectively. Results showed that three models developed on characteristic wavebands all obtained the same or even better performance than the corresponding models developed on full spectra, indicating the effectiveness of extracting characteristic wavebands. Among the models developed on characteristic wavebands, SVM model obtained the optimal performance, with calibration and prediction accuracy reaching 100% and 95.83% respectively. The overall results demonstrated that LIBS technology with a combination of characteristic wavebands extraction and chemometric methods could be used for identifying Fritillaria thunbergii treated by sulfur fumigation. This study provides an instruction for identifying traditional Chinese medicine and can help to establish a quality detecting and grading evaluating system for traditional Chinese medicine.

Keyword: Laser-induced breakdown spectroscopy; Fritillaria thunbergii Miq.; Sulfur fumigation; Chemometric methods
引 言

浙贝母(Fritillaria thunbergii Miq.)是百合科多年生草本植物。 多以其干燥的地下鳞茎入药, 是道地药材“ 浙八味” 之一。 现代药理学研究表明, 浙贝母具有清热散结、 镇咳祛痰等功效。 但新鲜浙贝母在贮存过程中, 易发霉、 虫蛀、 变色, 从而影响其卖相及售价。 硫磺熏蒸(sulfur fumigation, SF)具有干燥、 增白、 防虫、 防腐和防霉变等作用, 在中药材的养护中应用普遍。 但现有研究表明, 硫磺熏蒸会导致中药材中的生物活性物质流失或变化, 同时残留的二氧化硫会对人体造成极大的危害。 因此, 需要建立合适的方法对硫熏中药材进行检测和识别。 当前常用的方法有人眼识别法和化学方法, 化学方法包括酸蒸馏碘滴定法检测二氧化硫残留量[1]、 改良古蔡氏法[2]等。 人眼识别的方法受限于检测人员的经验, 主观性较强, 准确性无法保障。 而化学方法需要经过复杂的样品制备与预处理, 实验操作繁琐, 并消耗较多化学试剂。 因此, 建立一种快速鉴别硫熏浙贝母的检测方法, 对浙贝母药材的质量评价与分级具有重要意义。

激光诱导击穿光谱(laser-induced breakdown spectroscopy, LIBS)通过发射的激光脉冲在样本的表面激发出等离子体, 分析等离子体中的原子或离子特征谱线的波长和强度, 可以获得样品中元素的种类与含量信息。 在实验过程中, 只需做简单的样品预处理或无需预处理, 就可以实现对多状态(固、 液和气态)样品的无损或微损检测, 具有检测快速、 多元素同时分析等优势[3], 已被应用于药材的成分检测[4], 但还未见利用LIBS鉴别硫磺熏蒸中药材的相关报道。 因此, 以浙贝母为实验对象, 探究应用LIBS技术鉴别硫熏浙贝母的可行性具有创新性, 可为快速检测中药材的质量提供理论依据。 故应用LIBS技术, 结合化学计量学方法, 对不同程度硫熏的浙贝母进行了鉴别, 建立了一种快速检测硫熏浙贝母中药材的新方法。

1 实验部分
1.1 材料

新鲜的浙贝母来自浙江省磐安县。 共获取浙贝母样本145个, 其中对照组为不经过硫熏处理(no SF, 0 g/500 g)的样本54个, 实验组有轻度硫熏(mild SF, 30 g/500 g)样本54个和重度硫熏(severe SF, 50 g/500 g)样本37个。 将清洗干净的浙贝母分别放置于熏箱中, 进行硫熏处理。 硫熏过程持续24 h, 然后将样品放置于60 ℃的烘箱中。 用快速研磨仪(Tissuelyser-48, 上海净信科技公司, 中国)研磨成粉后, 称取0.2 g粉末, 用FY-24型台式粉末压片机(天津市思创精实科技发展有限公司, 中国)在20 MPa压力下静置60 s, 制成边长约10 mm、 厚度约1 mm的方片。

1.2 LIBS采集

LIBS实验系统包括Vlite-200型Nd∶ YAG调Q固体激光器(北京镭宝光电技术有限公司, 中国), 二倍频激光(波长532 nm, 最高能量200 mJ, 脉宽8 ns, 光束直径7 mm), Echelle光谱仪及配套的ICCD相机(ME5000, DH334; Andor公司, 英国), DG645型数字延时脉冲发生器(Stanford Research Systems公司, 美国)。 其他仪器设备还包括位移平台和位移台控制器(SC300-1A, 北京卓立汉光公司, 中国), StarLite系列能量计(Ophir公司, 以色列)。

为了得到较好的信噪比, 需要对激光能量、 延迟时间、 ICCD探测器门宽等参数进行调节。 在本实验中, 激光能量设为60 mJ, 延迟时间设为1 μ s, 门宽设为19 μ s。 将样本放置在位移平台上, 采集16个点, 每一次都通过位移台控制器改变激光脉冲在样本表面的采样点位置, 每个采样点累积采集5次, 将平均值作为该点的光谱数据。 为了减小样本的不均匀性和随机噪声所造成的影响, 计算每个样本16个采样点光谱数据的平均值作为该样本的光谱数据。

1.3 数据处理

1.3.1 主成分分析

主成分分析(principal component analysis, PCA)通过线性变换将原始变量转换为新的正交变量, 这些变量是原始变量的线性组合, 称作主成分(principal components, PCs)。 PCA常被用于数据中的模式识别, 尤其是在分类中多有应用。

1.3.2 判别分析方法

采用了三种不同的判别分析方法建立相应的预测模型, 模型的性能依据建模准确率和预测准确率评估。 不同判别分析方法具有不同的原理和优势, 对光谱数据的利用角度也不同。 通过比较不同模型的性能, 可以从中挑选出最适于鉴别硫熏浙贝母的预测模型。 三种判别分析方法包括支持向量机(support vector machine, SVM)、 极限学习机(extreme learning machine, ELM)和随机森林(random forest, RF)。

SVM是由一种基于统计学习理论的机器学习算法。 SVM基于结构风险最小化原理, 通过SVM算法, 可以将低维空间的数据映射到一个更高维的空间中, 继而通过构建超平面, 可以实现样本的线性可分, 其中, 引入的核函数可以有效降低计算复杂度[5]。 SVM可以有效地防止模型过拟合, 尤其是在变量个数远大于训练集实验样本个数的情况中[6]

ELM是一种单隐层前馈神经网络的新型算法, 它随机初始化输入权重和隐层偏置, 设定合适的激励函数和隐层节点数, 计算隐层的输出矩阵并通过Moore-Penrose广义逆得到输出权重[7]。 ELM获得的最优解是唯一的, 具有结构简单、 所需参数少、 学习速度快、 泛化性能好等优点[8]

RF是一种基于集成学习的机器学习算法。 RF需自行设定决策树数目, 通过bootstrap重抽样方法从原始样本中随机有放回地抽取一部分建立决策树并单独进行预测。 结合所有决策树的预测, 通过“ 投票” 的方法确定最终的预测结果[9]。 RF在面对高维数据训练时不容易出现过拟合, 且对训练数据中的噪声和错误鲁棒[10]

2 结果与讨论
2.1 光谱预处理

在LIBS系统的检测范围(228.31~872.44 nm)内, S元素的响应主要集中于400~600 nm波段范围, 还包括600~870 nm范围内的4条特征谱线(674.88, 675.72, 868.05和869.47 nm)[11]。 考虑到仪器检测范围的首末两端存在着大量明显的噪声, 截取了400.41~871.65 nm范围内的12 800个波长作为全波段光谱数据, 三类样本的平均光谱曲线如图1(a)所示, 这一波段包含了以上全部S元素的特征谱线。 小波变换(wavelet transform, WT)用于降低原始光谱中的随机噪声, 选取的小波基函数是db5, 对应的分解层数为3层。 归一化采用最大最小归一化(min-max normalization), 将光谱数据归一到[0, 1]范围内, 图1(b)为三类样本经归一化后的平均光谱曲线, 归一化的数据转换见式(1)

x* =x-minmax-min(1)

图1 400.41~871.65 nm全波段光谱曲线
(a): 原始光谱曲线; (b): 归一化后的光谱曲线
Fig.1 Full spectra curves within 400.41~871.65 nm
(a): Raw spectra curves; (b): Spectra curves after normalization

其中, x* 为归一化后的光谱数据, x为原始光谱数据, min为原始光谱数据中的最小值, max为原始光谱数据中的最大值。

2.2 主成分分析

对全部样本的全波段光谱数据做PCA, 结果表明, 前三个主成分的解释率分别为63.69%, 15.31%和8.58%, 即累积解释率达到了87.58%, 说明前三个主成分可以表达原始光谱数据的大部分信息。 以PC1, PC2和PC3的得分值作为x, yz轴, 绘制三维散点图如图2所示。

图2 前三个主成分的三维PCA散点图Fig.2 3D PCA scores scatter plot of PC1, PC2, and PC3

可以发现, 轻度硫熏的浙贝母和重度硫熏的浙贝母分布较为集中, 具有各自的聚类中心。 未经硫熏的浙贝母分布较为分散, 且与轻度硫熏和重度硫熏的浙贝母之间都存在重叠。 因此, 需要进一步建立预测模型来区分未经硫熏、 轻度硫熏和重度硫熏的浙贝母。

2.3 基于全波段的预测模型

为了区分不同程度硫熏的浙贝母, 基于SVM, ELM和RF方法建立了预测模型。 建模集和预测集按照2∶ 1的比例随机划分, 得到的建模集和预测集的样本个数分别为97个、 48个。 将全波段12 800个波长作为输入变量, 建立基于全波段的SVM, ELM和RF预测模型, 并利用这三类模型对预测集中的48个样本进行预测, 以验证模型的预测效果, 模型结果如表1所示。 SVM模型的判别能力最佳, 建模准确率为100%, 预测准确率达到了95.83%。 ELM模型的建模准确率和预测准确率分别为97.94%和81.25%, RF模型的建模准确率和预测准确率分别为100%和72.92%。 模型出现了过拟合现象, 可能是由于全波段光谱数据的波长个数(12 800)远大于建模集样本的个数(97)。 因此, 需要进一步从全波段光谱数据中提取有效波长来反映样本信息。

表1 基于全波段的SVM, ELM, RF模型结果 Table 1 Results of SVM, ELM, and RF models developed on full spectra
2.4 基于特征波段的预测模型

S元素发射的特征谱线信号较弱, 基于全波段光谱数据建立的预测模型容易受到其他谱线信号较强的元素干扰。 图3为重度硫熏的浙贝母样本在400.41~600.02 nm内经小波变换后的平均光谱, S元素信号的响应主要集中在这一波段内[12]。 图3(b— e)中可以观测到S元素的4条特征谱线, 对应美国国家标准与技术研究院(NIST)的原子光谱数据库(ASD)中S元素的标准谱线分别为481.55, 542.87, 547.36和564.00 nm, 因仪器条件与检测环境不同而略有偏移。 因此, 可以将包含了绝大多数S元素特征谱线的400.41~600.02 nm选为特征波段。 将特征波段包含的6 642个波长对应的光谱数据作为输入变量, 建立基于特征波段的SVM, ELM和RF预测模型, 并利用这三类模型对预测集中的48个样本进行预测, 以验证模型的预测效果, 模型结果如表2所示。

图3 重度硫熏样本在400.41~600.02 nm内的平均光谱曲线
(a): 平均光谱曲线; (b): 481.50 nm附近光谱曲线; (c): 542.90 nm附近光谱曲线; (d): 547.32 nm附近光谱曲线; (e): 563.95 nm附近光谱曲线
Fig.3 Average spectra curves of severe SF samples within 400.41~600.02 nm
(a): Average spectral curves; (b): Spectral curves near 481.50 nm; (c): Spectral curves near 542.90 nm; (d): Spectral curves near 547.32 nm; (e): Spectral curves near 563.95 nm

表2 基于特征波段的SVM, ELM和RF模型结果 Table 3 Results of SVM, ELM, and RF models based on characteristic wavebands

基于特征波段的三类模型的建模准确率都达到了100%; SVM模型的预测准确率最高, 达到了95.83%, 与基于全波段的SVM模型保持一致。 ELM模型和RF模型的效果都优于相应的全波段模型, 预测准确率分别达到了85.42%和81.25%, 说明选取特征波段是有效的。 同时, 模型的输入变量数目减少至51.89%(6 642/12 800), 在一定程度上改善了由于变量的个数远大于样本个数而产生的模型过拟合问题。 利用特征波段建立的SVM模型, 大大减少了变量数, 提高了模型的运算速度, 且对预测集的样本具有良好的预测能力, 可以用于鉴别未经硫熏、 轻度硫熏和重度硫熏的浙贝母。

将观测到的S元素的4条特征谱线(481.50, 542.90, 547.32和563.95 nm)作为特征波长建立SVM模型, 模型的建模准确率和预测准确率较低, 分别为42.27%和47.92%。 S元素的特征谱线可能会发生偏移, 从而影响模型的性能。 此外, 图3(a)中可以观测到K, Ca, Fe, Mg和Na等无机金属元素的特征谱线[13], 这些元素可能与浙贝母发挥药效作用有着一定程度的关联。 连续的特征波段涵盖了更多元素信息, 能够提供更多光谱特征的差异。 因此, 选用400.41~600.02 nm作为特征波段更有利于建立准确、 鲁棒的预测模型。

3 结 论

利用LIBS实现了对未经硫熏、 轻度硫熏和重度硫熏的浙贝母中药材的快速鉴别。 基于全波段(400.41~871.65 nm)和特征波段(400.41~600.02 nm)光谱数据对未经硫熏、 轻度硫熏和重度硫熏的浙贝母建立了基于SVM, ELM和RF方法的鉴别模型。 结果表明: 基于特征波段建立的三类模型性能均与基于全波段的模型保持一致或达到了更优的效果。 其中, 基于特征波段建立的SVM模型的性能最优, 建模准确率和预测准确率分别达到了100%和95.83%。 判别结果验证了特征波段的选取是有效的, 合理选取特征波段, 有利于建立准确、 鲁棒的鉴别模型。 综上所述, 应用LIBS结合特征波段提取和化学计量学方法鉴别硫熏浙贝母是可行的, 且该方法具有快速、 简便、 多元素同时分析的优势, 可为鉴别硫熏中药材提供依据, 有助于建立中药材质量检测与分级评定系统。

The authors have declared that no competing interests exist.

参考文献
[1] ZHOU Hai-yan, FU Jian-guo, ZHOU Ying-qun, et al(周海燕, 付建国, 周应群, ). Modern Chinese Medicine(中国现代中药), 2012, 14(4): 45. [本文引用:1]
[2] HAO Yan-jun, XU Qiu-yang, SANG Yu-li, et al(郝延军, 徐秋阳, 桑育黎, ). China Journal of Chinese Materia Medica(中国中药杂志), 2012, 37(3): 335. [本文引用:1]
[3] Peng J, Liu F, Zhou F, et al. Trends in Analytical Chemistry, 2016, 85: 260. [本文引用:1]
[4] St-Onge L, Kwong E, Sabsabi M, et al. Spectrochimica Acta Part B, Atomic Spectroscopy, 2002, 57: 1131. [本文引用:1]
[5] Dong J J, Li Q L, Yin H, et al. Food Chemistry, 2014, 161: 376. [本文引用:1]
[6] Hidalgo M J, Fechner D C, Marchevsky E J, et al. Food Chemistry, 2016, 210: 228. [本文引用:1]
[7] Bian X, Zhang C, Tan X, et al. Analytical Methods, 2017, 9: 2983. [本文引用:1]
[8] Huang G B, Zhou H, Ding X, et al. IEEE Transactions on Systems Man & Cybernetics Part B, 2012, 42(2): 513. [本文引用:1]
[9] Qiu S, Wang J. Food Chemistry, 2017, 230: 208. [本文引用:1]
[10] CHENG Shu-xi, KONG Wen-wen, ZHANG Chu, et al(程术希, 孙汶汶, 张初, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2014, 34(9): 2519. [本文引用:1]
[11] Dyar M D, Tucker J M, Humphries S, et al. Spectrochimica Acta Part B, Atomic Spectroscopy, 2011, 66(1): 39. [本文引用:1]
[12] Burakov V S, Tarasenko N V, Nedelko M I, et al. Spectrochimica Acta Part B, Atomic Spectroscopy, 2009, 64(2): 141. [本文引用:]
[13] Peng J, Song K, Zhu H, et al. Scientific Reports, 2017, 7: 44551. [本文引用:1]