利用光谱趋势参数快速判定小麦粉DON等级的研究
吴威1, 祖广鹏1, 陈桂云1, 徐剑宏2, 陈坤杰1,*
1. 南京农业大学工学院, 江苏 南京 210031
2. 江苏省农业科学院食品质量安全与检测研究所, 江苏 南京 210014
*通讯联系人 e-mail: kunjiechen@njau.edu.cn

作者简介: 吴 威, 1978年生, 南京农业大学工学院副教授 e-mail: wuwei@njau.edu.cn

摘要

脱氧雪腐镰刀菌烯醇(DON)是一种经常发生在谷物及其衍生产品中的霉菌毒素, 危害人类和家畜的生命健康。 开发快速、 准确、 经济、 无环境危害的检测方法是一个亟待解决的问题。 本研究定义了可见光-近红外(Vis-NIR)光谱的趋势参数TP(trend parameter), 利用TP确定与DON浓度最相关的特征波段。 文中校正集样本的光谱矩阵行按样本DON浓度逐渐增加的顺序排列, 矩阵每一列(每一个波段)都对应一个TP值, 所有样本在某波段下的吸光度在列方向上的递增趋势越强(即TP值越大), 则此波段下的吸光度与DON浓度的相关性就越强, 该波段便可以作为评估DON浓度的特征波段。 研究发现在666, 1 238和1 660 nm处TP出现局部最大值, 利用此三个特征波段下的光谱进行二次判别分析Quadratic Discriminant Analysis(QDA), 以此构建的TP-QDA模型可以将小麦粉按DON污染水平分成轻度(0<DON<1 000 μg·kg-1)、 中度(1 000≤DON<2 000 μg·kg-1)、 和重度(DON≥2 000 μg·kg-1)三个等级。 该模型的整体分类准确率在校正集和验证集中分别为88.24%和86.27%。 对比了传统的主成分分析PCA(principal component analysis)特征波段选取方法, 其所构建的PCA-QDA模型也将相同的小麦样品分成三个污染等级, 整体分类准确率在校正集和验证集中分别为68.62%和72.55%。 这些研究结果证实了TP选择特征波段的方法在判断DON污染水平时优于PCA特征波段选取方法, 并且TP-QDA模型可有效地用于快速对小麦粉的污染等级进行分类, 从而减少收储运过程中分析筛选小麦的时间和经济成本。 研究结果还有待在更广泛的小麦品种中进行普适性验证。

关键词: 脱氧雪腐镰刀菌烯醇; 趋势参数; 二次判别分析; 小麦粉
中图分类号:O433.4 文献标志码:A
The Study on Quickly Determining DON Level in Wheat Flour by Trend Parameter of Spectra
WU Wei1, ZU Guang-peng1, CHEN Gui-yun1, XU Jian-hong2, CHEN Kun-jie1,*
1. College of Engineering, Nanjing Agricultural University, Nanjing 210031, China
2. Institute of Food Quality and Safety, Jiangsu Academy of Agricultural Sciences, Nanjing 210014, China
*Corresponding author
Abstract

Deoxynivalenol (DON) is a mycotoxin that often occurs in cereals and their derivatives. It is harmful to the life and health of human and livestock. It is urgent to develop a detection method, which can rapidly, accurately and economically detect DON without environmental hazard. This study defined a Trend Parameter (TP) of the visible-near-infrared (VIS-NIR) spectra. The TP was used to determine the characteristic bands which were most relevant to the DON concentration. In this paper, the rows of spectral matrix of the samples in calibration set were arranged in the order of gradual increase in DON concentration. Each column (each band) of the matrix corresponded to a TP value. Under a certain band, the stronger the increasing trend of the absorbances of all samples in the column direction is (ie, the larger the TP value), the stronger the correlation between the absorbance and the DON concentration in this band is, and this band can be used as a characteristic band for evaluating the DON concentration. The study found that the local maximum of TP appeared at 666, 1 238, and 1 660 nm. The quadratic discriminant analysis (QDA) was performed by the spectra of the three characteristic bands. The wheat flour can be divided into three grades: mild (0<DON<1 000 μg·kg-1), moderate (1 000≤DON<2 000 μg·kg-1), and severe (DON≥2 000 μg·kg-1) pollution by the constructed TP-QDA model. The overall classification accuracy of the model was respectively 88.24% and 86.27% in the calibration set and verification set. The Principal Component Analysis (PCA) of characteristic bands selection was used to make a comparison. The PCA-QDA model divided the same wheat sample into three pollution levels. The overall classification accuracy rate was 68.62% in the calibration set and 72.55% in the verification one. These findings confirmed that the selection of characteristic bands by TP parameter is superior to the one by the PCA in judging DON pollution level, and the TP-QDA model can be effectively used to quickly classify the pollution level of wheat flour, thereby reducing the time and economic cost of analyzing and screening wheat during the process of acquisition, storage and transport. The results of this study have yet to be tested for universality in a wider range of wheat varieties.

Keyword: Deoxynivalenol; Trend parameters; Quadratic discriminant analysis; Wheat flour
引 言

脱氧雪腐镰刀菌烯醇(DON), 属单端孢霉烯族化合物, 通常存在于感染了赤霉病的谷物中。 DON含量超标的食物具有致癌、 致畸、 致突变的作用, 危害人类和家畜的生命健康[1, 2]。 我国在《食品中真菌毒素限量》(GB2761— 2011)标准中规定了小麦等制品 DON 的限量指标为1 000 μ g· kg-1 [3]

目前, DON的检测手段主要有液相色谱-串联质谱法、 气相色谱-质谱法分析、 免疫亲和层析净化高效液相色谱法等[4, 5, 6, 7], 这些方法技术成熟, 检测的灵敏度高, 非常适合监管测试, 但是这些方法通常步骤繁琐, 需要的设备及耗材昂贵, 同时会产生一定量的化学废物, 对环境造成一定的破坏。 小麦的收储运过程中有大量的样本需要随时检测, 以验证原料是否符合规定, 这样就亟需有简单、 快速、 成本低廉的检测方法来响应市场的需求。 光谱学的方法在检测领域有着广泛的应用, 用近红外光谱检测食品中的水分、 蛋白质、 脂肪等成分时可以达到很高的精确度[8, 9, 10], 但在毒素含量等的痕量检测中效果并不理想。 虽然如此, 在过去的几十年中, 研究者们还是不断地尝试利用光谱学方法对谷类作物中的DON含量进行检测, 以达到简化检测步骤, 降低检测成本, 以及提高检测效率的目的。 Girolamoa[11]使用傅里叶变换近红外光谱(FT-NIR)识别含有少于300 μ g· kg-1 DON的小麦样品, 将低DON(< 300 μ g· kg-1)和高DON(> 300 μ g· kg-1)样品分类, 准确度为69%; Dvoreř Á č ek[12]利用FT-NIR光谱仪采集的光谱构建偏最小二乘回归和判别分析PLS-DA模型, 该技术在DON浓度低于30 mg · kg-1的样品中得到的相关系数较高(r=0.92), 但是这个统计组合不能可靠地区分DON浓度低于欧盟卫生限值1 250 μ g· kg-1的小麦样品; Annalisa, De Girolamo[13]使用阈值为1 400 μ g· kg-1的主成分-线性判别分析PCA-LDA可以将污染小麦成功地分类成低污染和高污染两种。 但当模型使用欧盟卫生限值1 250 μ g· kg-1 DON的阈值时, 约有40%误分类样品; Peiris[14]采用FT-NIR光谱的偏最小二乘(PLS)模型, 将60.8%~82.3%的低DON, 以及82.3%~94%的高DON样本正确分类。 可见, 目前已有的NIR检测DON含量的研究中, 检测的准确率还都不高, 尤其是卫生限值附近的DON浓度识别率还不是很理想; 另外已有的研究多采用全波段PLS分析建模, 使得采集的冗余数据较多, 也影响检测速度; 由于小麦在作为食品原料之前还会进行清洗和去皮等处理, 这些处理会大大减少DON的含量, 因此在收储运环节的检测, 可以将未处理小麦DON的浓度限值由国标的1 000 μ g· kg-1提高到2 000 μ g· kg-1, 并且只需要将小麦按污染水平分成几个等级, 即可满足原料筛选的需要。 基于以上分析, 本研究旨在开发一种简单、 快速、 廉价的Vis-NIR判定方法, 通过定义趋势参数(TP)选取与DON浓度变化趋势最相关的特征波段, 构建判别小麦粉中DON含量等级的二次判别分析(QDA)模型, 从而快速评估小麦样品的DON污染等级。

1 实验部分
1.1 样本制备和光谱采集

实验共采集了102个具有不同DON浓度的小麦样品, 品种为镇麦168。 这些小麦样本在扬花期接种了赤霉菌毒素。 样本经过去皮、 磨粉、 过筛, 其粗细程度满足我国标准粉规格。 使用近红外光谱仪InfraXact(Foss, USA)收集样品光谱。 光谱仪配备硅探测器(570~1 100 nm), 铟镓砷探测器(1 100~1 850 nm)。 样品以2 nm间隔在570~1 848 nm范围内扫描, 数据采集的频率为每次扫描3 s。 每个样品扫描两次, 取其平均值。 通过ISIscan(Infrasoft International, Port Matilda, PA, USA)收集光谱数据。

1.2 DON测定

DON含量参考值按照《GB 5009.111— 2016 食品安全国家标准食品中脱氧雪腐镰刀菌烯醇及其乙酰化衍生物的测定》[15](第二法免疫亲和层析净化高效液相色谱法HPLC), 使用HPLC系统(SHIMADZU, SPD-10A, UV-VIS DETECTOR ; LC-10AT VP)进行定量测定。

1.3 数据预处理

利用Unscrambler® X, v10.1(CAMO Software AS, Oslo, Norway, 2011)软件进行数据预处理。 所有样本的光谱首先通过15点Savitzky-Golay函数平滑, 然后通过去趋势处理, 最后进行乘法散射校正(MSC)。

1.4 基于趋势参数的特征波长选取方法

在光谱矩阵中, 每一行对应一个样本的光谱, 并把样本按DON浓度从低到高进行排列。 第一列为样本的DON浓度, 其后的640列为570~1 848 nm波段下的光谱值(吸光度)。 选取其中所有的奇数行作为校正集光谱, 所有偶数行数据作为验证集光谱, 校正集和验证集均有51个样本。 在这样的光谱矩阵中, 单波段下所有样本的吸光度从上到下的递增趋势越强, 则说明该波段下的吸光度与DON浓度的变化趋势越是一致, 则该波段可以作为评估DON浓度的特征波段。 据此, 可以为每一个波段定义一个判断递增趋势的趋势参数, 以期找到递增趋势最强的特征波段, 具体做法如下:

定义一个参数Vj来衡量第j(2≤ j≤ 641)列的递增趋势, 设xij(1≤ i≤ 51)是光谱矩阵中第i个样本的第j个波段的吸光度。 将xij与在该波段下的其他样本的吸光度相比较, 当xij的值小于位于其下面样本xmj(i< m≤ 51)的吸光度(xij< xmj), 趋势参数就加1分(Vij=Vij+1); 同样, xij的值大于其上面样本xnj(1≤ n< i)的吸光度(xij> xnj), 趋势参数也加1分, 反之不加分。 将xij与其他50个样本在该波段下的光谱值依次进行比较, 算出其对应的趋势参数Vij, 最后将该列所有样本的趋势参数相加, 就得到该波段下趋势参数值 Vj=i=151Vij, 较大Vj值对应的波段可以被选为特征波段。

1.5 二次判别分析QDA模型

利用Unscrambler® X, v10.1软件中的二次判别分析QDA模块进行分析建模。 提取校正集中特征波段下的光谱, 采用两个阈值1 000和2 000 μ g· kg-1, 将校正集数据分成低、 中、 高程度三类污染水平, 因此QDA建模的类别数为3。 假设所有变量的先验概率均相等, 权重均为1.00。 所构建的模型在验证集特征波段的光谱下进行模型检验。 DON的分类准确性通过计算被正确分类的样本数占样本总数的百分比来评估。

2 结果与讨论
2.1 样本中的DON含量分布

在102个小麦样品中, DON水平为319~31 437 μ g· kg-1不等, 通过可见光-近红外光谱法分析小麦样品, 并且以570~1 848 nm之间的吸光度记录光谱。 图1显示了6种不同DON浓度小麦样品的Vis-NIR原始光谱, 其范围在319~5 895 μ g· kg-1 DON范围内。 从这些谱图的比较来看, 低DON水平的小麦样品与含有高DON水平的小麦样品具有相同的Vis-NIR谱带, 因此表明两种样品中的主要官能团和化学成分是共存的。

图1 六种不同DON浓度(用高效液相色谱法测量)小麦样品的Vis-NIR光谱Fig.1 Vis-NIR spectra of wheat samples with six different DON concentrations (measured by high performance liquid chromatography)

2.2 选取的特征波段

按照1.4节的特征波长选取方法, 计算各个波段对应的趋势参数, 结果如图2所示, 可见在666, 1 238和1 660 nm波段处出现三个局部最大值, 将其提取作为评估DON浓度的特征波段。

图2 各个波段下趋势参数分布图Fig.2 Distribution of trend parameter of each band

2.3 二次判别分析QDA分类结果

只提取校正集样本的三个特征波段(666, 1 238和1 660 nm)下的光谱。 采用两个阈值1 000和2 000 μ g· kg-1, 事先将校正集数据分成低、 中、 高程度污染。 利用QDA将校正集样本分成三类, 结果的混淆矩阵如表1(左侧)所示, 校正过程中整体分类正确率为88.24%。 低和中度污染水平样本都100%被正确分类; 重度污染的31个样本中只有6个样本被误判为中度污染, 剩余的25个(80.64%)的重度污染样本被正确分类。 利用校正集构建的TP-QDA模型去判定验证集合中的样本, 验证集也只选取三个特征波段的光谱, 验证结果如表1(右侧)所示。 验证集总体判断正确率为86.27%。

表1 趋势参数(TP)-二次判别分析(QDA)模型的校正及验证结果 Table 1 The calibration and validation results of Trend Parameter(TP)-Quadratic Discriminant Analysis (QDA) model

主成分分析PCA是选取特征波段最有效的方法之一, 谷物中DON含量检测的文章中很多都采用了主成分分析[11, 12, 13, 14, 15], 从而对数据进行降维。 以下将对相同的校正集样本, 采用PCA选取特征波段, 建模方式仍为QDA分析, PCA-QDA模型检测的准确率仍在原来的验证集样本中测试, 从而对趋势参数法和主成分分析法选取特征波段的有效性做一一对比。

对校正集全光谱数据进行主成分分析, 选取前2个主成分, 解释了91%的变量。 QDA分析时采用PCA的选取的两个主成分, PCA-QDA模型的校正和验证集分类结果, 以及其与TP-QDA模型检测结果的对比如表2所示。 可见, 除了验证集中的轻度污染样本, TP-QDA模型在各个分类中的分类正确率以及整体分类正确率都高于PCA-QDA模型, 因此, 趋势参数法选择的特征波段能获得更高的识别率。

表2 TP-QDA和PCA-QDA模型校正和验证识别准确率对比结果 Table 2 The classification accuracy comparison of TP-QDA and PCA-QDA model in calibration and verification sets
3 结 论

通过定义各个波段下光谱的趋势参数, 可以得到与小麦粉中DON浓度最相关的特征波段, 选出的特征波段有助于快速准确地判定小麦粉中DON含量的等级。 分类模型表现出良好的预测性能, 总体分类率高, 小分类错误率低, 模型简单, 无需昂贵耗材, 能快速分析大量的样品, 所提出的分类模型在筛选小麦样品的脱氧雪腐镰刀菌烯醇含量方面具有实际应用价值, 使得NIR光谱学成为监测安全程序的强有力的工具。 但是该方法还需要在更多品种小麦样本中进行普适性验证。

参考文献
[1] Lessard M, Savard C, Deschene K, et al. Food & Chemical Toxicology, 2015, 80: 7. [本文引用:1]
[2] Smith M C, Timmins-Schiffman E, Coton M, et al. Journal of Proteomics, 2018, 173: 89. [本文引用:1]
[3] GB2761—2011 Maximum Levels of Mycotoxins in Foods(食品中真菌毒素限量), 2011. [本文引用:1]
[4] Michael S, Franz B, Rudolf K. Rapid Communications in Mass Spectrometry, 2010, 20(18): 2649. [本文引用:1]
[5] Wei W, Liu A, Li M. Cereal & Feed Industry, 2013, 12(1): 60. [本文引用:1]
[6] XIE Gang, WANG Song-xue, ZHANG Yan(谢刚, 王松雪, 张艳). Journal of Instrumental Analysis(分析测试学报), 2011, 30(12): 1362. [本文引用:1]
[7] LI Rui, XIE Gang, WANG Song-xue(黎睿, 谢刚, 王松雪). Food Science(食品科学), 2015, 36(6): 206. [本文引用:1]
[8] WANG Fan, LI Yong-yu, PENG Yan-kun(王凡, 李永玉, 彭彦昆). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2018, 38(12): 3736. [本文引用:1]
[9] ZHANG Xin-yu, WANG Ying-jie, LIU Ruo-xi(张新玉, 王颖杰, 刘若西). Journal of China Agricultural University(中国农业大学学报), 2017, 22(5): 25. [本文引用:1]
[10] LUO Qu, YU Xiu-zhu, ZHANG Jian-xin(洛曲, 于修烛, 张建新). China Oils and Fats(中国油脂), 2018, 43(3): 136. [本文引用:1]
[11] De G A, Lippolis V, Nordkvist E. Food Additives & Contaminants Part A Chemistry Analysis Control Exposure & Risk Assessment, 2009, 26(6): 907. [本文引用:2]
[12] Dvorř Áček V, Prohasková A, Chrpová J. Plant Soil & Environment, 2012, 58(4): 196. [本文引用:2]
[13] Annalisa D G, Salvatore C, Angelo V. Toxins, 2014, 6(11): 3129. [本文引用:2]
[14] Peiris K S, Dong Y, Davis M A. Cereal Chemistry, 2017, 94(4): 677. [本文引用:2]
[15] GB/T 5009. 111—2016. Determination of Deoxynivalenol and Its Acetylated Derivatives in Food(食品中脱氧雪腐镰刀菌烯醇及其乙酰化衍生物的测定), 2016. [本文引用:2]