近红外高光谱成像技术在筛查保健食品中违禁添加抗炎药物双氯芬酸钠的研究
王成1, 于航1, 姚卫蓉1, 成玉梁1, 郭亚辉1, 钱和1, 谭志强2, 谢云飞1,*
1.江南大学食品学院, 江苏 无锡 214122
2.中国科学院生态环境研究中心环境化学与生态毒理学国家重点实验室, 北京 100085
*通讯作者 e-mail: xieyunfei@jiangnan.edu.cn

作者简介: 王 成, 1995年生, 江南大学食品学院硕士研究生 e-mail: wangcx926@163.com

摘要

双氯芬酸钠是一种非甾体抗炎药, 抗炎症效果较好, 抗炎化学药物双氯芬酸钠有可能违禁添加到缓解炎症保健食品中。 目前已有一些文献研究水、 肉及牛奶等中的药物双氯芬酸钠, 主要利用高效液相色谱、 表面增强拉曼及电化学等方法, 需要相对复杂的预处理过程, 操作步骤相对复杂, 耗时。 为了快速、 无损检测保健食品中违禁添加物的成分, 探索建立采用1 000~2 524 nm波段或特征最优波段的光谱作为自变量, 将近红外高光谱成像技术结合化学计量学分析的方法定量分析缓解炎症保健食品中可能添加的不同浓度的双氯芬酸钠。 研究主要运用了8种光谱预处理方法, 基于全光谱波长建立了偏最小二乘回归及主成分回归模型, 同时, 为了提高模型的准确性和稳定性, 利用β系数方法选择最优波段1 130~1 147, 1 412~1 468, 1 658~1 709, 2 010~2 055, 2 122~2 178和2 395~2 423 nm为自变量建立与双氯芬酸钠浓度的多元线性回归模型。 比较了偏最小二乘回归、 主成分回归及多元线性回归三种模型。 分析结果显示, 经标准正态变量预处理方法建立多元线性回归模型, 该模型的准确性和和预测能力较好, 其预测最低限为0.05%, 预测值与实测值的 R2为0.992 5, 预测均方根误差为0.004 9, 标准预测偏差为0.004 9, 说明近红外高光谱成像技术为快速定量分析缓解炎症保健食品中违禁添加抗炎药物双氯芬酸钠提供了理论基础。 有望进一步开发拓展到其他违禁添加药物的快速定量应用。

关键词: 近红外高光谱成像技术; 保健食品; 双氯芬酸钠; 多元线性回归模型
中图分类号:O433.4 文献标志码:A
A Study on the Screening of Anti-Inflammatory Drug Diclofenac Sodium in Dietary Supplements by Near Infrared Hyperspectral Imaging
WANG Cheng1, YU Hang1, YAO Wei-rong1, CHENG Yu-liang1, GUO Ya-hui1, QIAN He1, TAN Zhi-qiang2, XIE Yun-fei1,*
1. School of Food Science and Technology, Jiangnan University, Wuxi 214122, China
2. State Key Laboratory of Environmental Chemistry and Ecotoxicology, Research Center for Eco-Emironmental Science, Chinese Academy of Sciences, Beijing 100085, China
*Corresponding author
Abstract

Diclofenac sodium is a non-steroidal anti-inflammatory drug with good anti-inflammation effect. The addition of diclofenac sodium is prohibited from being added to the dietary as supplements for reducing the inflammation. At present, some literature has reported that diclofenac sodium in water, meat, milk and other Chinese drugs can be quantified by using high performance liquid chromatography, surface enhanced Raman and electrochemical methods; however, all the mentioned techniques normally require a relatively complex pretreatment process, complicated operation steps and time-consuming. It is necessary to develop a rapid and nondestructive method for determing diclofenac sodium in dietary supplements. This article developeda near-infrared hyperspectral imaging techniqueat 1 000~2 524 nm combined with chemometrics analysis method for determing diclofenac sodium concentration in the dietary supplements. In this study, eight spectral pretreatment methods were established by using partial least squares regression (PLSR) and principal component regression models (PCR) based on the full spectral wavelength. Furthermore, β coefficients were used to select the optimal bands in order to improve the accuracy and stability of the model. The multiple linear regression model (MLR) of diclofenac sodium was established at 1 130~1 147, 1 412~1 468, 1 658~1 709, 2 010~2 055, 2 122~2 178, 2 395~2 423 nm as the independent variable. Subsequently, the three models were compared, and results showed that multiple linear regression model established by standard normal variables pretreatment method had the best forecasting ability. The minimum predictive value of the model accuracy was 0.05%; the Pearson coefficient R2 of the predicted values was 0.992 5; the root means square error of prediction was 0.004 9, and the standard deviation of prediction was 0.004 9. Therefore, the study has developed the near-infrared hyperspectral imaging technique for rapid determination of diclofenac sodium as an anti-inflammatory drug inthe dietary supplements provides a theoretical basis. It is expected to further developed and extended to the rapid quantitative application of other prohibited added drugs.

Keyword: Near infrared hyperspectral image; Dietary supplements; Diclofenac sodium; Multiple linear regression model
引言

双氯芬酸钠(Diclofenac sodium)是一种非甾体抗炎药, 常被用于疼痛、 风湿性关节炎和某些非风湿性疾病, 其对哺乳动物有多重负面影响, 包括心毒性、 肝毒性、 肾毒性、 神经毒性、 基因毒性和血液毒性[1]

目前, 非甾体抗炎药在兽药中被广泛使用。 可以用液相色谱-串联质谱法(LC-MS/MS)测定牛奶[2]、 猪肉和鸡蛋中的双氯芬酸钠[3]。 从废水、 尿液、 牛乳和血浆中使用电膜萃取作为酸性化合物的双氯芬酸钠, 并采用高效液相色谱法进行定量分析[4]。 同时, 双氯芬酸钠在水体中降解性差, 在污水处理中不易被处理, 对水生生物如鱼类、 贻贝等具有潜在毒性[5]。 以AgMBA@SiO2-Ab为免疫探针, 采用基于表面增强拉曼散射(SERS)的免疫层析法可以快速、 定量、 超敏检测水样中的双氯芬酸[6]。 这些实验方法都要做较多前处理实, 比较耗时。 近红外光谱结合人工神经网络无损定量分析双氯芬酸钠粉体[7]的方法在一次检测中也需要大量的实验样品。

虽然近红外是一种有效的无损检测手段, 但是不能提供被测物质的空间信息及化学信息的变化。 相较之下, 近红外高光谱成像(near-infrared hyper spectral imaging, NIR-HSI)将计算机成像系统和传统的近红外技术结合, 可以同时采集待测物的空间信息和化学信息。 近红外高光谱成像技术在食品检测领域已有研究, 在近红外区间(990~1 700 nm)建立并评价自特征提取的深度学习模型用于无损检测掺假红肉产品[8]或鉴别转基因大豆。 利用NIR-HIS在990~1 700 nm结合光谱相似性测量方法[9]、 偏最小二乘法[10]、 波段比[11]方法分析了奶粉中非法添加三聚氰胺。 NIR-HSI用于研究了无损定量检测花生籽粒中的油和蛋白质含量以及鸭梨中检测可溶性固形物含量[12]。 尝试近红外高光谱成像技术与紫外分光光度法结合来估计大麦麦芽中酚类化合物的浓度[13]

本文主要是探索利用近红外高光谱成像(1 000~2 500 nm)无损、 快速检测缓解炎症保健食品中违禁添加的化学物质的方法, 阐述近红外高光谱成像技术在快速定量检测保健食品中违禁添加抗炎药物双氯芬酸钠的可能性。

1 实验部分
1.1 样品

实验用缓解炎症保健食品从Perth WA Australia代购, 没有任何化学预处理。 双氯芬酸钠标准品(99%从上海Macklin)购买。 保健食品和双氯芬酸钠混合物作为训练集的样本浓度(W/W)分别为0.01%, 0.02%, 0.04%, 0.06%, 0.08%, 0.10%, 0.20%, 0.40%, 0.80%, 1.00%, 2.00%, 4.00%, 6.00%, 8.00%, 10.00%, 12.00%, 14.00%, 16.00%, 18.00%和20.00%, 每个浓度样品各3组(编号1— 20), 共60个样本。 测试集的混合物浓度(W/W)为0.05%, 0.50%, 1.50%, 5.00%, 11.00%, 15.00%每个样品浓度各3组(编号CK1— 6), 共18个样本。 保健食品粉碎后, 样品浓度(W/W)低于0.02%的混合物称取10 g, 其他浓度样品混合物各称取6.7 g, 称好放入50 mL离心管中在振荡器上混合均匀。 将混合样品取出装满塑料培养皿(直径30 mm× 厚度10 mm)中, 轻轻振荡使得样品表面平整。 同一样品重复两次测量光谱数据。

1.2 高光谱成像系统

采用GaiaSorter-N25E室内近红外高光谱成像系统(四川双利合谱科技有限公司), 高光谱设备主要由四个部分组成, 包括短波红外高光谱相机、 光源、 样品置物台和计算机。 其中光源是由2套50W卤素灯光源组成, 两组光源被安置在平台两侧, 光源高度为25 cm, 安装角度为30° 。 短波红外高光谱相机包括芬兰Specim公司的Imspector系列成像光谱仪和MCT探测器, 波段范围为982~2 591 nm, 光谱分辨率为12 nm(288个波长)。 高光谱相机的曝光时间设置为8 ms, 样品放置在电机移动平台上, 移动范围9~27 cm, 在成像系统视场范围内对样品逐行扫描, 步进电机由相连的计算机控制, 扫描前进的电机速率为0.8 cm· s-1。 利用光谱图像软件实现了系统控制和数据采集。

此外, 为了获得较稳定和有可比性的模型数据, 还需要使用两个额外的图像: 一个暗电流图像(D)和一个白色参考图像(W)来校正原始获得的图像(R0)[14]。 反射率大约为0%的暗电流图像(D)是通过用不透明的遮光罩完全覆盖摄像机镜头获得的, 而漫反射系数为~99.9%的白色参考图像(W), 校正公示为

R=R0-DW-D(1)

所有的暗板, 白板都由系统自带, 通过高光谱软件获得校正光谱数据。

1.3 高光谱数据分析

对采集的高光谱图像由ENVI4.8软件(ITT Visual Information Solutions, Boulder, CO, USA)提取和计算感兴趣区域的平均光谱数据, 选择1 000~2 524 nm波段及特征波段的光谱作为定量分析的输入变量。

光谱数据包含的信息比较丰富, 大量的信息会包含各种各样的随机噪声, 相机暗电流等, 会对数据分析产生较大影响[15]。 在建立模型前对光谱数据进行预处理是有必要的, 可以减少噪声及外界的影响。 主要的预处理方式有移动平均法(moving average, MA), 高斯滤波(Gaussian filter, GF), 中值滤波(median filter, MF), 归一化(normalize), 卷积平滑(savitzky-golay smoothing, SG-Smoothing), 标准正态变量(standard normal variate, SNV), 基线处理(baseline), 多元散射校正(multiplicative scatter correction, MSC)。 数据的预处理和分析都使用The Unscrambler X10.4(CAMO Software AS, Norway)。

使用三种线性回归的模型, 包括偏最小二乘回归(partial least squares regression, PLSR), 主成分回归分析(principal component regression, PCR)及多元线性回归(multiple linear regression, MLR)模型。

(1) PLSR模型

建立PLSR模型, 将样本的光谱与违禁添加物的浓度联系起来。 当被测变量众多且高度共线(相关)时, PLSR成为构建模型的最稳健、 最可靠的化学计量方法。 通过PLSR找出自变量(X)与因变量(C)之间的基本关系, 从而将原来的预测因子简化为主成分因子(LVs)的新变量集, 该变量矩阵具有最佳的预测能力[16]。 这些LVs在统计上是独立的, 即不相关, 为了防止模型出现过拟合或欠拟合, 要选择最优的Lvs的数量[17], 在本文使用内部交叉验证(cross-validation, CV)过程中使用均方根(root-mean-square, RMS)的最小值来选择LVs的最优数量。 PLSR中自变量(X)与因变量(C)的基本关系可以用式(2)来表示

C=B1X1+B2X2++BnXn+B0(2)

式(2)中, C为双氯芬酸钠的浓度, B1Bn是272个波长对应的回归系数, X1Xn为每个浓度样本的光谱, B0是回归系数的截距。

(2) PCR模型

PCR分成两步, 首先对光谱矩阵进行主成分分析, 得到少数原始光谱矩阵的线性组合变量, 并将数据的最大方差投影到新的坐标, 选取出重要的主成分数, 进行多元线性回归。

(3) MLR模型

多元线性回归模型用于确定多个自变量的组合来共同估计因变量, 本研究需要选择好特征光谱波长或区间建立模型预测保健食品中混合的双氯芬酸钠的含量, MLR的公式如式(2)。

1.4 选择特征波段

高光谱图像中的信息量丰富, 存在高维的、 多共线性的预测准确性降低的问题。 因此, 找出特征波段, 利用有效的特征波段信息与双氯芬酸钠的含量建立关系, 提高模型准确性很有必要。 采用基于PLSR模型加权回归系数从全光谱范围中选择特征波长[12]。 加权回归系数的方法, 也称为β 系数方法, 用产生的绝对值大的回归系数作为最佳波段并建立MLR模型。

1.5 模型评价

通过计算以下参数来评估PLSR模型的预测效率: 决定系数(分别为 Rc2, Rcv2Rp2)、 训练均方根误差(RMSEC)、 交叉验证均方根误差(RMSECV)、 预测均方根误差(RMSEP)、 标准预测误差(SEP)以及偏差值(Bias)。 一个好的模型具有高R2值和低均方根误差(RMSE)和偏差值[17]。 参数计算如式(3)— 式(5)

RMSEC=1ni=1n(ycal-Ytrue)2(3)

RMSEP=1ni=1n(ypred-ytrue)2(4)

R2=1-i=1n(Ypi-Yti)2i=1n(Ypi-Ym)2(5)

式中, n是样品数, Ycal是样品的训练值, Ypi是样品的预测值, Yti是样品参考真实值, Ym是样品参考的平均值。

2 结果与讨论
2.1 双氯芬酸钠的近红外高光谱分析

提取双氯芬酸钠(Diclofenac)、 缓解炎症保健食品(KB)、 缓解炎症保健食品中不同含量的双氯芬酸钠混合物(编号1— 20)的平均原始谱图(提取面积为直径30 mm培养皿样品表面的ROI), 如图1所示。 从图1可以看出双氯芬酸钠的吸收峰与缓解炎症保健食品的吸收峰位置有明显区别, 即平均

图1 双氯芬酸钠(Diclofenac)、 缓解炎症保健食品(KB)、 缓解炎症保健食品中不同含量的双氯芬酸钠混合物(编号1— 20)的平均原始谱图Fig.1 Mean original spectra of Diclofenac Sodium, Anti-inflammatory dietary supplements (KB), different concentrations of diclofenac sodium compounds (No.1— 20) in inflammation-reducing dietary supplements

光谱图中双氯芬酸钠的吸收峰在1 141, 1 507和1 675 nm为XH(C, N, O)第一泛音、 伸缩振动及XH(C, N, O)合频, 2 161和2 407 nm为组合频吸收[18]。 缓解炎症保健食品与缓解炎症保健食品中掺有不同含量的双氯芬酸钠混合物的平均原始光谱无法区分。

图2中是三组双氯芬酸钠(Diclofenac)、 缓解炎症保健食品(KB)及缓解炎症保健食品中掺有不同含量的双氯芬酸钠混合物(编号1— 20)的平行样品在双氯芬酸钠的特征波长1 675 nm处的成像图。 双氯芬酸钠和缓解炎症保健食品的图像有一定程度的差异, 但两者混合物的成像图无法肉眼识别其中双氯芬酸钠的含量, 需要进一步的方法进行区分。

图2 1 675 nm处缓解炎症保健食品(KB)、 双氯芬酸钠(Diclofenac sodium)及缓解炎症保健食品中0.01%~20%含量的双氯芬酸钠高光谱成像图Fig.2 Hyperspectral images of 0.01%~20% Diclofenac sodium in anti-inflammatory dietary supplements (KB), anti-inflammatory dietary supplements and Diclofenac sodium (Diclofenac) at 1 675 nm

2.2 不同建模方法的比较分析

编号1— 20的120个样品中随机选择104个样品光谱作为训练集并使用内部交叉验证, 编号CK的36个样品中随机选择30个样品光谱作为测试集。 为了比较不同建模方法对实验结果的影响, 主要使用上述8种处理光谱数据并建立了PLSR, PCR和MLR三种模型, 获得了校正集、 验证集、 测试集模型的R2, RMSE等相关参数。

2.2.1 PLSR模型

基于以上8种预处理方式建立了PLSR模型, 表1显示了基于全光谱波长(272波长数)及不同的预处理方法获得的训练集决定系数 Rcal2、 测试集决定系 Rpred2以及RMSE等参数, 可以看出训练集的R2在0.979~0.988, RMSEC在0.007~0.009 5之间, 交叉验证集的R2在0.973 1~0.983 9之间, 测试集的R2在0.892 6~0.971 2之间, RMSEP且SEP的值都小于0.02, 说明了近红外高光谱全波长光谱基于不同预处理方法建立的PLSR模型较好。

表1 基于全光谱波长的PLSR模型 Table 1 PLSR model based on full spectral wavelength

其中, 经Normalize预处理建立的PLSR模型主成分因子数(LVs)是4, 测试集 Rpred2为0.971 2, RMSEP为0.009 5, SEP为0.008。 因此, 该PLSR模型精度最高。

2.2.2 PCR模型

全波长光谱作为自变量经过8种预处理后, 建立了PCR模型, 预测结果如表2, 可以看出光谱处理后模型的 Rcal2Rval2都在0.95以上, 尤其是经过MSC处理后可以减少噪声对模型的影响, 使得 Rcal2大于0.99。 其中, 平均原始光谱建立的模型 Rpred2为0.9073, RMSEP为0.018, 预测能力相对较好, 但是8种预处理后的预测模型的 Rpred2都在0.811 6~0.907 3之间, 可能是训练集拟合过度, 导致预测结果准确度相对偏低。 可见, PCR模型的预测能力相比于PLSR模型较弱。

表2 基于全波长的PCR模型 Table 2 PCR model based on full spectral wavelength

2.2.3 MLR模型

基于PLSR模型中β 回归系数的局部绝对值较大的波段为最佳波段(因变量)建立模型, 全波长的β 回归系数权值占比如图3, 根据双氯芬酸钠吸收峰的位置选择6个波段1 130~1 147, 1 412~1 468, 1 658~1 709, 2 010~2 055, 2 122~2 178和2 395~2 423 nm(51波长数)作为因变量, 经过8种预处理后模型的精度会有差异, 但模型的 Rcal2, Rval2都比较高。 MLR模型预测结果如表3, 根据表3可以看到 Rcal2Rval2都在0.99以上, 预测时相关系数r(Pearson)在0.969 0~0.992 8, 且大多数相关系数都在0.98以上, RMSE都小于0.05, 说明较优波段建立的MLR模型去除了一些冗杂的信息, 优于全变量建模, 提高了模型的准确性及预测能力。

图3 偏最小二乘回归(PLSR)模型中β 回归系数权值占比选择较优波段Fig.3 Selection of the optimal spectral bands by weight ratio of β regression coefficients in the partial least squares regression (PLSR) model

表3 基于最佳波段建立MLR模型 Table 3 MLR model based on optimal spectral band

光谱经SNV预处理后建立的MLR模型 Rcal2高于0.999 0, Rval2达到0.995 6, R2为0.992 5, SEP为0.004 9, 该模型的预测能力较佳。

2.3 预测结果的验证

表4显示了PLSR, MLR和PCR三种模型平均预测值与真实值, 其中MLR模型预测的双氯芬酸钠含量较低(0.05%)时, 平均预测值比真实值偏高, 但两者相差较小, 双氯芬酸钠含量较高时预测结果更接近真实值。 PLSR, PCR模型预测双氯芬酸钠含量低于0.5%时的预测值与真实值相差较大。 在高浓度时, 后两个模型预测能力相对MLR模型稍差。 所以, MLR模型预测不同浓度的双氯芬酸钠的准确性和重复性较好, 预测能力较强。

表4 PLSR, PCR, MLR模型预测值与真实值比较 Table 4 The predictive values of PLSR, PCR and MLR models compared with real value
3 结论

探讨了近红外高光谱成像技术在缓解炎症保健食品中添加不同含量抗炎类药物双氯芬酸钠的无损检测分析。 使用了8种不同的光谱预处理方法, 建立了全光谱PLSR和PCR模型, 利用β 系数方法选择最优波段1 130~1 147, 1 412~1 468, 1 658~1 709, 2 010~2 055, 2 122~2 178和2 395~2 423 nm, 经SNV预处理方法建立的MLR模型, 预测最低限为0.05%, 预测值与实测值的R2为0.992 5, RMSECP为0.004 9, SEP为0.004 9。 综上所述, 说明近红外高光谱成像技术可用于快速、 定量检测分析缓解炎症保健食品中违禁添加的双氯芬酸钠, 有巨大应用潜力。

参考文献
[1] Sathishkumar P, Meena RAA, Palanisami T, et al. , Science of The Total Environment, 2019, 9697(19): 34034. [本文引用:1]
[2] Dubreil-Cheneau E, Pirotais Y, Bessiral M, et al. J. Chromatogr A, 2011, 1218(37): 6292. [本文引用:1]
[3] Park J A, Abd El-Aty A M, Zheng W, et al. Biomed Chromatogr, 2018, 32(6): 4215. [本文引用:1]
[4] Davarani S S, Pourahadi A, Nojavan S, et al. Analytica Chimica Acta, 2012, 722: 55. [本文引用:1]
[5] Lonappan L, Brar S K, Das R K, et al. Environ. Int. , 2016, 96: 127. [本文引用:1]
[6] Deng D, Yang H, Liu C, et al. Sensors and Actuators B: Chemical, 2019, 283: 563. [本文引用:1]
[7] Wang B, Liu G, Dou Y, et al. J. Pharm. Biomed. Anal. , 2009, 50(2): 158. [本文引用:1]
[8] Al-Sarayreh M, Reis M M, Yan W Q, et al. Journal of Imaging, 2018, 4(5): 63. [本文引用:1]
[9] Fu X, Kim M S, Chao K, et al. Journal of Food Engineering, 2014, 124: 97. [本文引用:1]
[10] Huang Y, Min S, Duan J, et al. Food Chem. , 2014, 145: 278. [本文引用:1]
[11] Huang M, Kim M S, Delwiche S R, et al. Journal of Food Engineering, 2016, 181: 10. [本文引用:1]
[12] Cheng J H, Jin H, Xu Z, et al. Analytical Methods, 2017, 9(43): 6148. [本文引用:2]
[13] Tschannerl J, Ren J C, Jack F, et al. Food Chemistry, 2019, 270: 105. [本文引用:]
[14] Guo L, Yu Y, Yu H, et al. J. Sci. Food Agric. , 2019, 99(12): 5558. [本文引用:1]
[15] Chen S, Zhang F, Ning J, et al. Food Chem. , 2015, 172: 788. [本文引用:1]
[16] Wold S, Sjostrom M, Eriksson L. Chemometrics and Intelligent Laboratory Systems, 2001, (58): 109. [本文引用:1]
[17] Kand pal L M, Tewari J, Gopinathan N, et al. Analytical Chemistry, 2016, 88(22): 11055. [本文引用:2]
[18] Ozaki Y. Analytical Sciences, 2012, 28(6): 545. [本文引用:1]