高光谱成像的豆腐形成过程中组分含量变化检测
王承克, 张泽翔, 黄晓玮*, 邹小波*, 李志华, 石吉勇
江苏大学食品与生物工程学院, 农业装备工程学院, 江苏 镇江 212013
*通讯联系人 e-mail: huangxiaowei@ujs.edu.cn; zou_xiaobo@ujs.edu.cn

作者简介: 王承克, 1984年生, 江苏大学食品与生物工程学院副教授 e-mail: wangck@ujs.edu.cn

摘要

豆腐作为我国传统食品, 其生产已有两千多年的生产历史, 但目前市场上的豆腐还是以经验式小作坊生产为主, 难以保证豆腐质量和品质的均一性。 水分和蛋白质含量是影响豆腐品质的重要因素, 然而, 水分与蛋白质的传统检测方法过程繁琐, 耗时、 费力, 无法及时指导生产。 因此, 探索豆腐制备过程中水分和蛋白质分布的快速、 无损、 定量描述方法, 可为精确调控豆腐制备工艺提供科学依据。 应用高光谱成像技术结合化学计量学方法检测豆腐形成过程中豆浆、 热浆、 凝胶、 豆腐四种不同状态下水分与蛋白质含量变化并实现其含量分布可视化。 采集每种状态下120个样品在432~963 nm波段范围内的高光谱图像, 利用ENVI软件选取感兴趣区域并计算样品的平均光谱数据。 采用卷积平滑(savitzky-golay, SG)结合多元散射校正(multiplicative scatter correction, MSC)对原始光谱进行预处理, 消除光谱噪声影响。 用预处理后的光谱数据建立偏最小二乘回归(PLSR)和主成分回归(PCR)定量模型, 比较发现豆浆、 热浆、 凝胶、 豆腐样品的PCR模型对与水分和蛋白质的预测结果均低于PLSR模型。 选用PLSR模型作为最优模型, 采用连续投影算法(SPA)筛选豆浆、 热浆、 凝胶、 豆腐样品的特征波长, 分别选取13, 9, 8和9个特征波长建立基于特征波长下的PLSR模型。 结果表明: 与全波段下的PLSR 模型相比基于特征波长建立的SPA+PLSR模型的预测效果更好, 对水分的预测模型 RP达到0.84~0.96, 蛋白质的预测模型达到0.92~0.97。 基于预测效果更好的SPA+PLSR模型计算豆浆、 热浆、 凝胶、 豆腐图像中每个像素点的水分与蛋白质含量, 将样品中的水分与蛋白质分布用不同的颜色直观显示, 实现水分与蛋白质在不同状态下的分布。 验证了高光谱技术对豆腐形成中水分与蛋白质含量检测的可行性, 解决传统检测方法的缺陷, 为豆腐生产的工业化和智能化提供理论依据。

关键词: 豆腐; 高光谱成像技术; 分布可视化; 水分; 蛋白质
中图分类号:TS214.2 文献标志码:A
Detection of Component Content Changes During Tofu Formation Based on Hyperspectral Imaging Technology
WANG Cheng-ke, ZHANG Ze-xiang, HUANG Xiao-wei*, ZOU Xiao-bo*, LI Zhi-huang, SHI Ji-yong
School of Food and Biological Engineering, School of Agricultural Equipment Engineering, Jiangsu University, Zhenjiang 212013, China
*Corresponding authors
Abstract

Tofu was a traditional food in China in two thousand years. However, it is still mainly produced by individual workshop, and the security and uniformity of quality is difficult to guarantee. Water and protein content are important factors which affecting the quality of tofu. The traditional detection method for water and protein is complicated, time consuming and laborious. The detection results are often later than the production process which unable to guide tofu production in time. Therefore, it is necessary to develop a new method for quantitatively describing homogeneity of water and protein distribution in Tofu. It is also the a scientific basis for accurately regulating the production process of tofu. In this study, hyperspectral imaging technique combined with chemometrics method were used to detect the changes of water and protein content and distribution under four different conditions: soybean milk, hot soybean milk, gel and tofu. The hyperspectral image of 120 samples in each state was collected in the wavelength range of 432 to 963 nm. Use ENVI software to select the region of interest and calculate the average spectral data of the sample. The original spectrum was pre-processed by convolution smoothing (Savitzky-Golay, SG) as well as multiplicative scatter correction (MSC) to eliminate the influence of spectral noise. A partial least squares regression (PLSR) and principal component regression (PCR) quantitative model were established for the pre-processed spectral data. The prediction results of water and protein by using PCR model are lower than the PLSR model, therefore, the PLSR model is selected as the optimal model. The characteristic wavelengths of soybean milk, hot soybean milk, gel and tofu samples were selected by continuous projection algorithm (SPA), 13, 90, 8 and 9 characteristic wavelengths to establish the PLSR model based on the characteristic wavelengths. The results show that the SPA+PLSR model based on the characteristic wavelengths is better than the PLSR model under the full-band model. The prediction model Rp for for water is 0.84~0.96, and the prediction model Rp for protein is 0.92~0.97. Based on the SPA+PLSR model with better prediction effect, the water and protein contents of different states pixel in the image of soybean milk, hot soybean milk, gel and tofu, were calculated and the water and protein distributions in the sample were visualized with different colors. The feasibility of hyperspectral technology for detecting water and protein contents in tofu was verified, which could be used to solve the defects of traditional detection methods, as well as provided a theoretical basis for the industrialization and intelligence of tofu production.

Keyword: Tofu; Hyperspectral imaging technique; Distribution visualization; Water; Protein
引言

我国是豆腐的发源地。 在我国大豆食品中, 豆腐占据了一半的消费份额, 但目前市场上大部分豆腐仍由条件简陋的个体作坊经验式生产, 这种落后的加工方式使产品卫生没有保证, 产品质量不稳定, 不能满足现代社会的需要。 要规范豆腐生产行业, 首要任务就是监测豆腐生产过程。

豆腐是大豆蛋白在凝固剂作用下相互结合形成的具有三维网络结构的凝胶产品, 这一三维网络状结构主要由蛋白质和水分构成, 它们决定了豆腐的硬度、 弹性、 粘着性和持水性等组织结构特性[1]。 蛋白质和水分在凝胶过程中不同状态(豆浆、 热浆、 凝胶和豆腐)下的变化情况是豆腐加工中的关键, 与豆腐的品质特性密切相关[2], 监测它们在豆腐加工过程中含量的变化不仅关系到豆腐品质优劣, 还是豆腐加工技术能否实现自动化和智能化的关键。

目前, 水分和蛋白质含量的常规检测方法主要是直接干燥法和理化检测法, 这两种方法对样品有一定损坏性且费时费力, 不适合用于大量样本的在线检测。 近红外光谱技术基于对分子中C— H, N— H, O— H等基团的倍频和合频吸收, 检测过程不破坏样本, 适合用于由于水分、 蛋白质等含氢键物质发生变化的食品加工过程监控, 韩东海利用近红外光谱检测了腐乳白坯硬度, 偏最小二乘法得到的最优模型的建模相关系数r达到0.935; 邱燕燕研究了豆浆蛋白质、 脂肪及水分的近红外快速检测方法, 建立了复合凝固剂、 豆浆蛋白质浓度及凝固温度对凝固时间影响的数学模型[3], José Manuel Amigoa等利用近红外光谱技术监控白面包顶部、 中部和底部在凝固过程中硬度与空间纹理的相关性[4]。 但是近红外光谱只能单点检测, 难以实现豆腐凝胶过程的全面监测。 精确检测水分和蛋白质在豆腐制作过程中不同区域的含量差异, 是实现水分和蛋白质分布均匀性定量描述的前提。 上述方法无法实现水分和蛋白质均匀性的定量描述, 难以实现豆腐形成过程的全面检测。 高光谱图像技术具有波段多、 光谱分辨率高、 图谱合一、 检测过程不破坏样本等优点, 在食品工业中的应用也越来越广泛。 Adam Polak等利用高光谱图像技术监测蛋糕烘焙过程中水分和硬度的变化[5]; Nadya Vasquez等采用高光谱技术结合结构剖面分析对瑞士干酪成熟过程中的质构特性进行分析[6]。 这些研究都为高光谱技术监测豆腐凝结过程中水分和蛋白质含量变化监测提供了依据。

采用高光谱成像技术对豆腐形成过程中各阶段水分与蛋白质含量进行快速检测, 采用偏最小二乘回归(PLSR)和主成分回归(PCR)方法建立豆浆、 热浆、 凝胶、 豆腐的含水率与蛋白质定量分析模型, 并选用连续投影算法(SPA)来提取光谱中的特征波长。 最终实现其各阶段中含量分布可视化, 为豆腐生产的科学化、 工业化、 规模化提供理论依据。

1 实验部分
1.1 材料与试剂

东北大豆(市售), MgCl2凝固剂(食品级)。

1.2 仪器与设备

DHG-9240A电热鼓风干燥箱(上海一恒科学仪器有限公司)、 DF-101S集热式恒温加热磁力搅拌器(河南省予华仪器有限公司)、 C21-WK2102电磁炉(美的集团)、 HX-PB1058 破壁机(奥克斯集团)、 AB123电子天平(上海豪晟科学仪器有限公司)、 CT3食品物性测试仪(Brookfield公司)。

高光谱采集系统是由高光谱摄像机(ImSpector, V10E, 芬兰)、 150 W的光纤卤素灯(Fiber-Lite DC950Illuminator, DolanJenner Industries Inc, MA, 美国)、 移动平台(Zolix, SC30021A, 北京)、 SpectralCube软件(芬兰Spectral Imaging有限公司)和计算机等部件组成。

1.3 样品制备

圆润光滑、 大小均一、 无霉变的大豆, 清洗后添加3倍蒸馏水在常温条件下浸泡10~14 h, 沥干后称重加入1:5, 1:6, 1:7, 1:8, 1:9比例的水进行磨浆, 过滤后煮浆, 至豆浆沸腾3 min, 取1 000 mL豆浆冷却至80 ℃ 加入0.6 mol· L-1 MgCl2溶液点浆, 凝胶形成后恒温水浴20 min, 以900 g均匀压制20 min成型, 冷却制成豆腐。 选取过滤后的豆浆、 煮沸后的热浆、 凝胶和成品豆腐作为检测对象, 得到四种不同状态下(豆浆、 热浆、 凝胶、 豆腐)的实验样品, 每种状态下分别取120个样本进行高光谱扫描。

1.4 样品水分与蛋白质含量测定

1.4.1 含水率测定

参照GB 5009.3— 2016测定不同状态下的豆浆、 热浆、 凝胶和豆腐的含水率。 准确称取一定质量的液体或固体样品于恒重的玻璃培养皿中(液体中加入海砂), 放置于105 ℃ 的恒温鼓风干燥箱中干燥5 h, 取出后放置于干燥器中冷却30 min后称量。

M=m1-m2m1-m3×100%

式中, M为样品含水量, m1为培养皿与样品的质量, m2为培养皿与样品干燥后的质量, m3为培养皿的质量。

1.4.2 蛋白质含量测定

参照GB 5009.5— 2016测定不同状态下的豆浆、 热浆、 凝胶和豆腐的蛋白质含量。

1.5 豆腐质构特性测定

采用质构仪TPA模式对五种不同料液比的豆腐进行测定。 通过取样器在豆腐中部区域取样, 采用P36(直径为36 cm)铝制圆柱形探头对豆腐样本进行质构测定, 测试速率为1 mm· s-1, 返回速率为1 mm· s-1, 样品形变量为75%, 起始距离为30.00 cm, 循环次数为2 次, 测试时间为5 s, 起始压力5 g[7]

1.6 高光谱图像采集与校正

高光谱系统预热30 min后进行样品扫描, 将豆浆、 热浆、 凝胶、 豆腐四种样品分别用培养皿盛放于位移平台, 电控平台移动速度为90 μ m· s-1。 为减少光谱采集时由于光照强度不均匀以及暗电流的影响。 通过HIS Analyzer软件对光谱图像进行校正[8]。 校正公式为

R=IR-IBIW-IB

式中: R为校正后数据; IR为样本原始数据; IW为白板数据; IB为黑板数据。

2 结果与讨论
2.1 不同磨浆用水条件下豆浆、 热浆、 凝胶、 豆腐水分、 蛋白质含量及豆腐质构分析

由图1(a)可知, 随着磨浆时水用量的增加, 豆腐的蛋白质含量先升后降。 可能是由于当磨水用量较低时, 豆浆中蛋白质含量较高, 添加凝固剂后形成的凝胶结构却较为松散, 压制成豆腐后与其他结构相比不紧密, 从而蛋白质含量较低。 从硬度与弹性值较低能印证其结构松散。 豆腐水分含量先增后减, 是因为当水分添加过多时, 豆浆中固形物和蛋白质的质量浓度太低, 形成的豆腐保水性能降低, 水分含量减少。 当料液比为1:7时豆腐的水分含量最高, 料液比为1:6时蛋白质含量最高。 从图1(b)中看出, 豆腐质构特性中硬度、 咀嚼性、 胶着性、 弹性变化显著。 1:8时硬度与胶着性最高, 1:7时弹性最好, 回复性与凝聚性变化不显著。

图1 磨浆料液比对豆腐水分和蛋白质含量的影响(a), 料液比对豆腐质构特性的影响(b)Fig.1 Effect of material to liquid ratio on moisture and protein content of tofu (a), Effect of material to liqurd ratio on the texture properties of tofu (b)

2.2 平均光谱曲线

将ENVI提取的光谱信息经matlab处理后得到四种样品的平均光谱曲线。 图2为豆浆、 热浆、 凝胶、 豆腐四种样品的平均光谱反射曲线。 选取高光谱的波长范围为432~963 nm(含618个波段)。 其中豆浆与热浆样品的光谱曲线较为相似, 豆浆经加热后变为热浆的过程中, 水分含量逐渐降低, 相应的光谱强度也逐渐降低。 豆浆、 热浆、 凝胶样品在700~800与900~1 000 nm处各有一个吸收峰, 这是由水分子中O— H键倍频引起的[9]。 而豆腐样品光谱曲线中没有这两处峰, 可能是由于高光谱是对样品表面进行检测, 形成豆腐后水分被封锁在内部。

图2 不同状态下样品的光谱曲线
(a): 豆浆; (b): 热浆; (c): 凝胶; (d): 豆腐
Fig.2 Spectra of samples under different conditions
(a): Soybean milk; (b): Hot soybean milk; (c): Gel; (d): Tofu

2.3 含量预测模型

采用卷积平滑(savitzky-golay, SG)结合多元散射校正(multiplicative scatter correction, MSC)分别对四类样品的原始光谱进行预处理后利用The Unscrambler X软件进行PLSR、 PCR建模, 建立全波段(full-spectra, FS)下豆浆、 热浆、 凝胶、 豆腐的水分与蛋白质含量预测模型, 预测结果见表1

表1 PLSR和PCR模型对水分和蛋白质含量预测结果 Table 1 The prediction results of water and protein content by using PLSR and PCR models

从PCR模型的建模结果看, 对于热浆的蛋白质含量预测效果最好, 预测集RP达到0.904 5。 与豆浆、 热浆、 凝胶三种样品相比, 豆腐PCR模型的校正集与预测集RC结果较低, 模型的预测效果较差。 其中豆腐蛋白质含量预测的模型精确度最低, 校正集RC为0.705 9, 预测集RP为0.609 1, 可能是由于PCR模型没有训练出豆腐光谱数据集的特征, 导致模型发生欠拟合, 模型的校正集与预测集精度都降低。

从PLSR模型的建模结果看, 豆浆、 热浆、 凝胶、 豆腐四种样品均有较好的预测效果, RP结果均高于0.800 0, 其中对凝胶蛋白质豆腐水分与豆浆蛋白质含量预测模型的预测结果较低, 分别为0.817 5和0.827 4。 对比PCR与PLSR模型对豆浆、 热浆、 凝胶、 豆腐的水分与蛋白质含量预测结果, 发现PLSR模型的预测性能优于PCR模型对于这四类样品的预测结果都有所提高。 其中对于豆腐蛋白质含量的预测结果提升最大, 预测集RP由0.609 1提升到0.872 1。 通过比较, PLSR模型更适用于建立豆浆、 热浆、 凝胶、 豆腐的水分与蛋白质含量预测模型。 后续采用SPA提取特征波长建立PLSR模型与全波段PLSR模型进行比较。

2.4 筛选特征波长及建模结果

2.4.1 筛选特征波长

为简化PLSR模型, 提高运算效率, 采用SPA算法提取特征波长。 从图2中看出, 随波长数目的增加均方根误差(RMSE)不断减小, 当选取的波长数目过多时RMSE降低变缓且模型的复杂度随之增加, 因此需要选取适宜的波长数量。 豆浆、 热浆、 凝胶、 豆腐样品分别选取13, 9, 8和9个特征波长。 豆浆为40, 65, 81, 139, 213, 374, 468, 485, 501, 536, 567, 578和611 nm, 热浆54, 59, 85, 138, 261, 389, 454, 562和610 nm, 凝胶39, 227, 340, 415, 451, 500, 545和576 nm, 豆腐21, 29, 64, 125, 281, 348, 555, 610和617 nm。 其中豆浆与热浆样品筛选的特征波长比较接近, 波长的分布范围主要在水分子O— H键倍频引起的吸收带附近。

2.4.2 基于特征波长的PLSR模型

表2的结果中看出, 基于SPA算法筛选出的特征波长下PLSR模型的精准度与预测能力要高于全波段下PLSR模型。 其中对于豆浆、 热浆、 凝胶、 豆腐的蛋白质预测集RP结果都达到0.920 0以上, 热浆和凝胶对于蛋白质的预测值RP都达到了0.97。 SPA+PLSR模型对于豆浆蛋白质含量的预测结果提升最大, 由0.827 4升高到0.937 7。 综上所述, SPA方法能够作为一种有效的特征波长提取方法提高PLSR模型准确性, 因此后续选用SPA+PLSR模型对于豆浆、 热浆、 凝胶、 豆腐的组分含量进行可视化分析。

表2 基于特征波长的PLSR模型预测结果 Table 2 Prediction results of PLSR model using characteristic wavelengths
2.5 组分含量分布可视化

基于SPA+PLSR模型进行豆浆、 热浆、 凝胶、 豆腐组分含量预测, 然后将四种样品高光谱图像中每个像素点的光谱信息输入模型, 计算其水分与蛋白质含量值, 生成豆浆、 热浆、 凝胶、 豆腐四类样品的水分与蛋白质含量分布的可视化图像, 如图4所示。 其中不同的颜色代表不同的含量值。 从含量分布图中看出豆浆与热浆的水分含量随料液比增加而增大, 颜色由黄色逐渐变红。 蛋白质含量随之减少, 颜色由绿色逐渐变为蓝色。 1:7时豆腐中水分含量最高颜色深绿较多, 1:6时豆腐的蛋白质含量最高, 图中显示红色最深。 从分布图中能清晰看见豆腐的水分与蛋白质含量, 根据两者的含量分布图可以得知是哪种料液比的豆腐, 对比2.1检测结果知道其质构特性。 可见利用高光谱技术能有效实现对豆腐形成过程中水分与蛋白质含量检测并且可以实现可视化, 相比于传统的检测方法本方法能更直观地了解豆腐形成过程中组分含量的变化。

图3 SPA法提取特征波长((a): 豆浆; (c): 热浆; (e): 凝胶; (g): 豆腐)及波长分布((b): 豆浆; (d): 热浆; (f): 凝胶; (h): 豆腐)Fig.3 Characteristic wavelength ((a) soybean milk; (c) hot soybean milk; (e) gel; (g) tofu) and wavelength distribution ((b) soybean milk; (d) hot soybean milk; (f) gel; (h) tofu) selected by SPA method

图4 水分含量分布可视化图(a), 蛋白质含量分布可视化图(b)Fig.4 Visualization images of water-content distribution (a) and protein content distribution (b)

3 结论

以豆腐形成过程中四个关键点豆浆、 热浆、 凝胶、 豆腐为研究对象, 利用可见高光谱成像技术结合化学计量法建立了豆腐形成过程中水分与蛋白质含量变化定量模型, 并实现其含量分布可视化, 结果如下:

(1)PLSR与PCR模型比较, PLSR模型对于四种样品组分含量预测效果更好, 基于PLSR模型采用SPA算法筛选特征波长, 豆浆、 热浆、 凝胶、 豆腐样品分别选取13, 9, 8和9个特征波长。 SPA+PLSR模型对于蛋白质和水分含量的预测效果均有所提高。

(2)采用SPA+PLSR模型计算豆浆、 热浆、 凝胶、 豆腐样品图像每个像素点的水分与蛋白质含量, 然后绘制成各个状态下的水分与蛋白质分布可视化图, 直观反映豆腐形成过程中的水分与蛋白质的动态变化。

参考文献
[1] LI Jia-shuang, ZHAO Yue, ZHANG Liang, et al(李加双, 赵悦, 张良, ). The Food Industry(食品工业), 2018, 39(11): 234. [本文引用:1]
[2] LI Xiao-ya, XU Hui, JIANG Yang-juan, et al(李小雅, 许慧, 江杨娟, ). Food Science(食品科学), 2017, 38(6): 261. [本文引用:1]
[3] QIU Yan-yan, SUN Juan-juan, WEI Xiao-peng, et al(邱燕燕, 孙娟娟, 魏肖鹏, ). Journal of The Chinese Cereals and Oils Association(中国粮油学报), 2015, 30(10): 123. [本文引用:1]
[4] Amigo J M, Alvarez A d O, Engelsen M M, et al. Food Chemistry, 2016, 208: 318. [本文引用:1]
[5] Polak A, Coutts F K, Murray P, et al. IET Image Processing, 2019, 13(7): 1152. [本文引用:1]
[6] Vásquez N, Magán C, Oblitas J, et al. Journal of Food Engineering, 2018, 219: 8. [本文引用:1]
[7] CHEN Yang, LIN Zui-qi, XU Li, et al(陈洋, 林最其, 徐丽, ). Soybean Science(大豆科学), 2011, 30(5): 838. [本文引用:1]
[8] Munera S, Blasco J, Amigo J M, et al. Biosystems Engineering, 2019, 182: 54. [本文引用:1]
[9] Cheng W, Sun D-W, Pu H, et al. LWT—Food Science and Technology, 2016, 72: 329. [本文引用:1]