应用高光谱图像检测鱼肉挥发性盐基总氮含量研究
邹金萍1, 章帅2, 董文韬2, 章海亮2,*
1.江西生物科技职业学院, 江西 南昌 330013
2.华东交通大学电气与自动化工程学院, 江西 南昌 330013
*通讯作者 e-mail: hailiang.zhang@163.com

作者简介: 邹金萍, 女, 1978年生, 江西生物科技职业学院副教授 e-mail: 2356255615@qq.com

摘要

鱼类产品的新鲜程度研究一直是重要的课题, 其中挥发性盐基总氮(TVB-N)是一项重要指标, 该指标已列入我国食品卫生标准, 一般在低温条件下, 鱼类挥发性盐基氮的量达到30 mg/100 g时, 即认为是肉质变质的标志。 传统的物理检测方法不能够实现定量检测, 化学检测法则耗时长, 且需要专业人员进行破坏式检测。 为了克服传统光谱检测技术无法检测分析外部空间属性的缺点, 该实验采用波长范围在900~1 700 nm高光谱成像结合化学计量法实现了三文鱼的TVB-N含量检测。 首先对从市场买的新鲜三文鱼按照背面和反面(腹部)进行分割处理, 背面和反面(腹部)再10等分, 每条三文鱼制作成20个样本, 一共100个样本, 其中75个样本用于校正集, 25个样本用于预测集。 然后用高光谱成像系统采集三文鱼鱼样本的光谱数据, 再通过蒸馏法测定三文鱼TVB-N的含量, 并建立其理化值样本, 然后分别采用最小二乘支持向量机(LS-SVM)和偏最小二乘(PLS)模型对100个样本光谱全波长数据进行三文鱼TVB-N建模分析。 LS-SVM模型和PLS模型预测决定系数( R2)分别为0.918和0.907, 预测均方根误差(RMSEP)分别为2.312%和2.751%。 为了进一步提高运算效率和优化模型, 对全谱数据利用连续投影算法(SPA)提取到8个特征波长(956, 1 013, 1 152, 1 210, 1 286, 1 301, 1 397和1 464 nm), 基于8个特征波长分别建立SPA-LS-SVM和SPA-PLS模型, 模型预测决定系数( R2)分别为0.903和0.901, RMSEP分别为2.761%和2.801%, SPA-LS-SVM模型的结果优于SPA-PLS。 最后SPA-LS-SVM模型因其可靠性和有效性而被选择为最适合TVB-N预测模型, 基于图像处理编程技术将高光谱图像中的每个像素转换成相应的TVB-N值并以不同颜色表示, 实现了三文鱼肉TVB-N含量的可视化, 可以很形象的表达三文鱼的TVB-N的含量分布情况。 实验说明, 可利用高光谱成像技术预测三文鱼的TVB-N含量预测, 这为水产品的自动加工和分类奠定了基础, 渔业可以从高光谱技术中获益。

关键词: 三文鱼; TVB-N含量; 最小二乘支持向量机(LS-SVM); 偏最小二乘(PLS); 可视化; 连续投影算法(SPA)
中图分类号:TP391.4 文献标志码:A
Application of Hyperspectral Image to Detect the Content of Total Nitrogen in Fish Meat Volatile Base
ZOU Jin-ping1, ZHANG Shuai2, DONG Wen-tao2, ZHANG Hai-liang2,*
1. Jiangxi Biotech Vocational College, Nanchang 330013, China
2. School of Electrical and Automation Engineering, East China JiaoTong University, Nanchang 330013, China
*Corresponding author
Abstract

For fish products, the study of freshness has always been an important topic. Among them, the total volatile base nitrogen (TVB-N) is an important indicator. This indicator has been listed in China food hygiene standards. Generally, under low temperature conditions, when the amount of volatile base nitrogen in fish reaches 30 mg/100 g, it is considered a sign of meat deterioration. Traditional physical detection methods cannot achieve quantitative detection, andchemical testing methods are time-consuming and require professionals to perform destructive testing. In order to overcome the shortcomings of traditional spectral detection techniques that can not detect and analyze external space properties, this paper uses a wavelength range of 900~1 700 nm. Hyperspectral imaging technology combined with stoichiometry that has achieved the detection of TVB-N content in salmon. First, the fresh salmon bought from the market is divided into back and abdomen, and the back and abdomen are divided into 10 equal parts, each salmon is made into 20 samples, a total of 100 samples, 75 of which are used for calibration set, and 25 samples are used for prediction set, then use the hyperspectral imaging system to collect the spectral data of the salmon fish sample, next determine the content of salmon TVB-N by distillation, and establish its physical and chemical value samples, after that use the least square support vector machine (LS-SVM) and partial least squares (PLS) model performs salmon TVB-N modeling analysis on 100 sample spectral full wavelength data. The prediction coefficient of determination ( R2) of the LS-SVM model and the PLS model are 0.918 and 0.907, respectively, and the root mean square error (RMSEP) of the prediction is 2.312% and 2.751%, respectively. In order to further improve the computational efficiency and optimize the model, 8 characteristic wavelengths (956, 1 013, 1 152, 1 210, 1 286, 1 301, 1 397, 1 464 nm) are extracted from the full spectrum data using the successive projections algorithm (SPA). For the LS-SVM and SPA-PLS models, the model prediction coefficient of determination ( R2) is 0.903 and 0.901, and the RMSEP is 2.761% and 2.801%, respectively. The results of the SPA-LS-SVM model are better than those of the SPA-PL. Finally, the SPA-LS-SVM model was selected as the most suitable TVB-N prediction model due to its reliability and effectiveness. Based on image processing programming technology, each pixel in the hyperspectral image was converted into a corresponding TVB-N value and used different colors to indicate the visual distribution of the TVB-N content of salmon meat, which can vividly express the distribution of TVB-N content of salmon. Experiments show that hyperspectral imaging technology can be used to predict the content of salmon TVB-N, which lays the foundation for the automatic processing and classification of aquatic products. Fisheries can benefit from hyperspectral technology.

Keyword: Hyperspectral imaging; Salmon fish; TVB-N; Partial least square (PLS); Least square support vector machine (LS-SVM); Visualizing; Successive projections algorithm (SPA)
引言

随着水产经济的快速发展, 消费鱼肉产品成为人们的一种日常习惯, 因此水产品的品质安全保障日益得到人们的关注, 比如鱼肉新鲜度准确判别对渔业生产者, 消费者和零售商来说, 都是一个很重要的问题, 不新鲜的鱼肉产品轻微影响口感, 严重一点影响消费者的身体健康安全[1]

具体到鱼肉产品新鲜度指标参数而言, 有各种成分含量参数、 物理特性如鱼肉肌肉弹性、 水分含量、 表面颜色变化和化学变化如微生物菌落总数、 K值含量以及挥发性盐基总氮(total volatile basic nitrogen, TVB-N)等[2, 3, 4]。 其中TVB-N指鱼、 肉类样品搅碎后经离心机高速旋转离心后静置一段时间, 上层浸液在弱碱性条件下能与水蒸汽一起蒸馏出来的总氮量。 一般在低温条件下, 肉, 鱼类挥发性盐基氮的量达到30 mg/100 g时, 即认为是肉质变质的标志[2]

采用化学方法检测鱼肉新鲜度参数, 通常都比较费时、 程序繁琐, 需要对鱼肉进行破坏处理, 且一般只能在实验室完成, 不能用于现场原位检测, 且需要接受过长时间专门培训的人员才能胜任。 物理方法检测鱼肉新鲜度参数往往又不够准确, 不能够数字化定量鱼肉新鲜度参数。 因此, 需要一种能够现场、 快速、 安全的检测方法[5]。 传统图像处理只能检测外部空间属性, 随着机器视觉技术发展, 对外部空间检测的精度越来越高, 但还是无法对其内部的品质进行准确的定量表达[17]。 近红外光谱检测虽然能检测内部的品质属性, 如三文鱼的TVB-N含量, 但缺乏检测分析外部空间属性的能力[18]。 高光谱成像检测同时集合了两种常规方法的特性[6], 在每个光谱波段上生成高光谱图像, 既获得了实验对象的光谱特性信息, 又获取了其外部的空间图像信息, 具有同时分析内外部属性的优点。 在国内外, 高光谱检测三文鱼的理化值已有一定的研究[3, 7, 8], 但是采用波长范围在900~1 700 nm的高光谱成像技术检测三文鱼TVB-N含量并同时进行可视化处理, 以此评价鱼肉产品新鲜度相关研究报道却很少。

本实验将100个鱼肉样本随机分为校正集75个样本和预测集25个样本。 首先获取三文鱼的高光谱信息和检测TVB-N的含量, 然后用LS-LVM和PLS建立模型, 最后采用matlab2010a编程对图像进行处理, 对三文鱼的TVB-N含量进行可视化表达。

1 实验部分
1.1 三文鱼肉样本

从加拿大蒙特利尔当地市场购买了五条三文鱼, 每条重约1 kg, 正负120 g误差, 并立即运到实验室。 新鲜三文鱼被屠宰, 斩首, 掏内脏, 剥皮, 收集, 然后用冷水清洗。 每条三文鱼按照背面和反面(腹部)进行分割处理, 背面和反面(腹部)各10等分, 每条三文鱼制作成20个样本, 用塑料薄膜包装在4 ℃下保存12 h, 拿出样本, 在室温条件下放置2 h, 以模拟供应链中的温度条件。

1.2 采集高光谱成像数据

图像数据是利用如图1所示的基于光谱仪的高光谱成像系统所获取。 整个系统主要包括一组CCD 摄像机(Hamamastsu), 一套150W的光纤卤素灯(SCHOTT DCRⅢ ), 一台ImSpector V10E高光谱摄像机(芬兰Specimen公司), 一组输送装置和计算机(HP, Inter Core i5-2320@3.00GHz)等部件组成。

图1 高光谱图像系统检测原理图Fig.1 Imaging system schematic diagram of hyperspectral

为了最大限度地减少背景噪声以及成像系统物理配置差异的影响, 需要将原始采集的高光谱图像(R0)校准到反射模式, 并采集黑板(B)和标准白板(W)图像数据用于校正分析。 黑板图像(~0%反射)是在用黑色盖帽完全盖住相机镜头后, 通过记录光谱图像获得的黑板数据。 白板参考图像数据是使用均匀的反光白色聚四氟乙烯(约99%反光)获得的数据。 校准图像(RC)由式(1)计算

RC=R0-BW-B×100%(1)

式(1)中, B为黑板, W为标准白板, R0为原始高光谱成像数据。

将100个三文鱼片放置在移动平台上, 然后以1.58 mm· s-1的调整速度逐行扫描到摄像机的视野区域, 进行高光谱成像采集, 平台与样本的垂直距离为40 cm, 两侧的线光源投射夹角为90° 。 采集到的100幅高光谱图像数据以原始格式生成、 记录和存储。

1.3 TVB-N含量测定

TVB-N含量采用蒸馏法测定[9], 具体为, 取10 g鱼肉, 90 mL高氯酸, 鱼肉捣碎并采用3 000转· min-1的离心机运行10 min。 在蒸馏液中加入50 mL 30%氢氧化钠, 再蒸馏5 min, 制得碱液。 将蒸馏碱液收集在含有50 mL硼酸水溶液(40 g· L-1)的锥形瓶中, 并将0.1 g甲基红和0.1 g溴甲酚绿溶解到100 mL 95%乙醇中, 形成混合指示剂。 随后, 用0.01 mL盐酸溶液滴定所得硼酸溶液。 测定TVB-N值, 根据盐酸消耗量以mg N/100 g表示, 重复测定三次, 取平均值, 结果如表1

表1 采用传统方法测量TVB-N含量(mg N/100 g) Table 1 Reference values of TVB-N content (mg N/100 g) measured by a traditional method
2 结果与讨论
2.1 鱼样本的光谱

图2显示了在900~1 700 nm波长范围内鱼肉样本的高光谱图像的平均反射光谱。 可以明显地看出, 在7~17 mg N/100 g范围内, 不同TVB-N值的鱼肉光谱, 显示出相似的趋势, 但光谱幅度存在一些差异, 这可能是由于鱼肉鲜度损失过程中主要化学成分的变化所致。 根据反射值, 一个显著的吸收峰位于约1 180 nm处, 可能与有机饲料成分的残留有关。

图2 不同TVB-N含量值三文鱼样本的光谱曲线图Fig.2 The reflectance spectra of salmon fish fillets at different TVB-N values

2.2 LS-SVM和PLS模型的建立

LS-SVM建模方法是一种经典的非线性光谱数据建模方法, 被广泛应用光谱分析领域, 其利用非线性映射函数和映射特征到高维空间, 采用拉格朗日乘子法计算各特征的偏微分, 以达到最优解[10, 11, 12]。 PLS是一种线性建模方法, 在化学计量分析中应用很多, PLS将光谱波长数据转变为维度更小的潜在因子变量[13]

采用LS-SVM和PLS建模后, 预测三文鱼TVB-N含量结果如表2, LS-SVM的校正集和预测集的决定系数分别为0.919和0.918, 预测均方根误差分别为2.292%和2.312%, PLS的校正集和预测集的决定系数分别为0.905和0.907, 预测均方根误差分别为2.742%和2.751%。 基于全波长建立的PLS和LS-SVM模型的校正集和预测集样本散点图如图3所示, 与PLS模型相比, LS-SVM模型的效果更为优秀, 可对鱼肉TVB-N含量分布进行检测。

表2 LS-SVM和PLS模型预测结果 Table 2 Prediction results of LS-SVM and PLS based on full spectral parameters

图3 三文鱼TVB-N含量PLS(a)和LS-SVM(b)全波长模型校正集和预测集散点图Fig.3 Predicted and measured TVB-N values for both the PLS (a) and LS-SVM (b) models under the whole spectral wavelengths range

2.3 连续投影算法提取特征波长

鱼片样品高光谱图像具有高维性、 冗余性和相邻波段间的多重共线性。 因此, 在多变量分析中, 剔除无用的或不必要的波长, 选择携带反映TVB-N含量变化的最有价值信息的最佳波长成为一个关键步骤。 SPA作为一种前向变量选择方法, 以解决最小冗余度下的共线性问题为目的, 被证明是多元校正框架下变量选择的有效工具和策略[13, 14, 15]

由于原始光谱的波段数量共有167个, 为了提高后续模型运算效率, 采用SPA算法提取特征波长, 提取出的8个特征波长如表3所示, 特征波长在完整光谱曲线上的具体位置如图4所示。 基于8个特征波长建立了SPA-PLS模型和SPA-LS-SVM模型, 其结果如表4所示。 分析表4可知, 基于特征波长建立的SPA-PLS和SPA-LS-SVM模型具有较高的预测集决定系数 Rp2, 分别为0.901和0.903, 预测均方根误差RMSEP分别为2.801%和2.761%, 且校正集决定系数和预测集决定系数数值较为接近, 过拟合与欠拟合现象均未出现。 与基于全波长建立的LS-SVM和PLS模型相比, 基于8个特征波长建立的SPA-LS-SVM和SPA-PLS模型预测精度变化不大, 但是极大的简化了模型, 并保留了模型的稳定性与准确性, 提高了模型的预测运行效率。

表3 应用SPA提取特征波长值 Table 3 Effective wavelengths selected by SPA

图4 采用SPA提取特征波长具体位置Fig.4 Position of selected effective wavelengths by SPA

表4 基于特征波长建立SPA-LS-SVM和SPA-PLS模型 Table 4 SPA-LS-SVM and SPA-PLS models for predicting TVB-N in salmon fillets by using the only 8 important wavelengths
2.4 鱼肉TVB-N含量的可视化

TVB-N主要是由于酶和微生物活性的影响而引起的蛋白质降解所产生的氨和胺, 这一重要指标的含量能够有效地反映出鲜度质量的损失。 因此, TVB-N分布的可视化有助于进一步解释与蛋白质分解有关的化合物的动态变化, 以指示新鲜度的损失程度[9, 16]

SPA-LS-SVM模型展现了其准确性高和运算速度快的特点, 选择为最适合TVB-N预测模型, 用来将高光谱图像中的每个像素转换成相应的TVB-N值并在鱼肉图片上以不同颜色展示。 图5显示了四个不同TVB-N值的可视化示例, 可以明显地观察到, 可视化图中的不同颜色反映了鱼肉样本中与图像像素的光谱变化相对应的TVB-N值。 同时, 鱼肉样品的TVB-N分布密度是不均匀和不对称的, 因为TVB-N包括含氮化合物(如鱼肉蛋白质)降解的成分也是不均匀和不对称的。 因此, TVB-N的分布有助于解释这些化学物质的降解速度, 本研究采用如下步骤对鱼肉TVB-N含量分布进行检测, 如图6所示。

图5 鱼样本TVB-N含量分布可视化图Fig.5 Visualization of the predicted TVB-N content for 4 fish samples in prediction set

图6 采用高光谱成像技术检测三文鱼TVB-N含量分布主要步骤Fig.6 Main steps of detection of salmon fish fillets TVB-N content using HIS

3 结论

通过高光谱图像技术实现了对鱼的TVB-N含量检测, 采取SPA算法提取8个最佳波长, 并作为输入到LS-SVM和PLS模型, 实验表明, 基于最佳波长的SPA-LS-SVM模型是最适合TVB-N检测模型, 其决定系数(R2)为0.903, RMSEP为2.761%。 采用MATLAB语言编程将高光谱图像中的每个像素通过最佳模型转换成相应的TVB-N值, 可以明显地观察到, 可视化的图中不同颜色反映了鱼肉样本中与图像像素的光谱变化相对应的TVB-N含量。 结果表明, 应用高光谱图像技术检测鱼肉TVB-N含量是可行的, 为下一步鱼肉TVB-N含量的定量分析和分类奠定了基础。

参考文献
[1] Wu L, Pu H, Sun D. Trends in Food Science & Technology, 2019, 83: 259. [本文引用:1]
[2] Qu J, Sun D, Cheng J, et al. LWT, 2017, 75: 529. [本文引用:2]
[3] Xu J, Riccioli C, Sun D. Journal of Food Engineering, 2016, 169: 259. [本文引用:2]
[4] WANG Shuo, XIE Jing, YANG Kai, et al(王硕, 谢晶, 杨凯, ). Chinese Journal of Food Science(中国食品学报), 2018, 18(5): 173. [本文引用:1]
[5] Li X, Sun C, Luo L, et al. Computers and Electronics in Agriculture, 2015, 112: 28. [本文引用:1]
[6] Cheng J, Sun D, Pu H. Food Chemistry, 2016, 197(A): 855. [本文引用:1]
[7] He H, Sun D. LWT, 2015, 62(1, Part 1): 11. [本文引用:1]
[8] Wu D, Sun D, He Y. Food Chemistry, 2014, 145: 417. [本文引用:1]
[9] Cheng J, Sun D, et al. Innovative Food Science & Emerging Technologies, 2014, 21: 179. [本文引用:2]
[10] Shao Y N, Zhao C J, Bao Y D, et al. Food and Bioprocess Technology, 2012, 5(1): 100. [本文引用:1]
[11] LIU Xue-mei, ZHANG Hai-liang(刘雪梅, 章海亮). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2014, 34(10): 2804. [本文引用:1]
[12] Li Y, Jing J. Chemometrics and Intelligent Laboratory Systems, 2014, 130: 45. [本文引用:1]
[13] Liu K, Chen X, Li L, et al. Analytica Chimica Acta, 2015, 858: 16. [本文引用:2]
[14] Dai Q, Cheng J, Sun D, et al. Journal of Food Engineering, 2015, 149: 97. [本文引用:1]
[15] Huang Z, Sha S, Rong Z, et al. Industrial Crops and Products, 2013, 43: 654. [本文引用:1]
[16] Dai Q, Cheng J, Sun D, et al. Food Chemistry, 2016, 197: 257. [本文引用:1]
[17] Jiang B, He J, Yang S, et al. Artificial Intelligence in Agriculture, 2019, 1: 1. [本文引用:1]
[18] Weng S Z, Zhu W X, Zhang X Y. et al. Artificial Intelligence in Agriculture, 2019, 3: 1. [本文引用:1]