多位置可见/近红外光谱检测与种鸡蛋受精信息的关系研究
张伏1,2,3, 崔夏华1, 张亚坤1, 王永县1
1.河南科技大学农业装备工程学院, 河南 洛阳 471003
2.江苏大学现代农业装备与技术教育部重点实验室, 江苏 镇江 212013
3.机械装备先进制造河南省协同创新中心, 河南 洛阳 471003

作者简介: 张 伏, 1978年生, 河南科技大学农业装备工程学院教授 e-mail: zhangfu30@126.com

摘要

种鸡蛋孵化过程耗时、 耗能, 但种蛋由于未受精导致胚胎发育率不足100%, 种鸡蛋孵化早期快速判别, 可有效提高种蛋孵化效率和降低经济损失。 近红外光谱分析技术可实现快速、 无损检测, 用于判别研究孵化早期种鸡蛋受精信息, 但现有光谱检测方法未能满足孵化早期受精判别位置要求, 亟需构建采集数据时的检测位置与内部信息之间的关系。 该研究利用可见/近红外光谱检测系统采集种蛋壳漫反射光谱强度, 试验选用壳色相近、 表面无裂纹的181个新鲜种鸡蛋, 从中随机选择61个样本完成交叉验证。 为消除暗电流的影响, 进行光谱校正, 得出种蛋壳漫反射率, 发现受精蛋与未受精蛋的光谱曲线趋势相同, 受精蛋和无精蛋赤道处的光谱曲线均高于两端。 剔除光谱曲线两端噪声大、 信噪比低的波段, 选择440.27~874.6 nm作为有效光谱波段, 并采用Savitzkg-Golay(S-G)平滑法、 二阶导数法Second Derivative、 标准正态变量校正SNV、 变量标准化Normalization和多元散射校正MSC预处理法分别构建PCA-SVM判别模型。 通过对入孵后24, 48, 72, 96和120 h不同位置所采光谱数据, 与受精信息综合分析, 结果发现二阶导数法Second Derivative和多元散射校正MSC两种预处理方式在同一时间、 不同位置的训练集和验证集的判别准确率均相同, 说明这两种预处理方法对数据来源位置不敏感; 变量标准化Normalization预处理和S-G平滑法预处理验证集的判别准确率则随着时间的推移在一定范围内波动, 在种鸡蛋胚胎发育120h时的判别准确率可达91.71%; SNV预处理赤道处验证集判别准确率随着时间的推移呈现上升趋势, 对数据来源时间及位置敏感, 种鸡蛋胚胎发育越长判别效果越佳, 120 h赤道侧的判别准确率为91.16%。 且平滑处理、 标准正态变量校正和变量标准化三种预处理方式均存在赤道侧判别准确率高于种蛋端部的现象, 这主要是由于赤道侧较种鸡蛋两端表面平缓, 采集到的信息更多, 该研究为早期判别受精蛋与无精蛋的数据采集位置提供新思路和新方法。

关键词: 可见/近红外光谱; 漫反射; 种鸡蛋; 判别位置; 判别时间
中图分类号:O433.4 文献标志码:A
Relationship Between Visible/Near Infrared Spectral Data and Fertilization Information at Different Positions of Hatching Eggs
ZHANG Fu1,2,3, CUI Xia-hua1, ZHANG Ya-kun1, WANG Yong-xian1
1. College of Agricultural Equipment Engineering, Henan University of Science and Technology, Luoyang 471003, China
2. Key Laboratory of Modern Agricultural Equipment and Technology, Ministry of Education, Jiangsu University, Zhenjiang 212013, China
3. Collaborative Innovation Center of Machinery Equipment Advanced Manufacturing of Henan Province, Luoyang 471003, China
Abstract

It takes more time and energy for eggs to hatch, but the circumstances of hatching egg embryo growth are less than 100%. The early discrimination of hatching eggs can reduce the economic loss and improve the efficiency. The near-infrared spectral analysis technology used in detecting the early fertilization information of hatching eggs because of speed and harmless. However, the existing detection method can not meet the requirement of detecting position. The necessitated problem is to build the relationship between the detecting position and the internal information. The visible/near-infrared spectroscopy detection system was used to collect the diffuse reflectance spectrum intensity of eggshell. 181 fresh eggs with similar shell color and no surface cracks were selected for analysis, and 61 samples were randomly selected for cross-validation. In order to eliminate the influence of dark current, the diffuse reflectance of eggshell was obtained by spectral correction. It was found that the trend of the spectral curve of fertile egg and the infertile egg was the same, and the spectral curves of position 3 and 4 were higher than position 1 and 2. The effective spectral bands of 440.27~874.6 nm were selected for the study. SGolay smoothing, second derivative, SNV, normalize and MSC pretreatment method were used to construct the PCA-SVM discrimination model. Then the data after 24, 48, 72, 96 and 120 h was collected at different positions. The results showed that the accuracy of derivative was as same as the accuracy of MSC, which indicated that the two pretreatment methods were not sensitive to the change of position through the analysis of data and ertilization information. The accuracy of the validation set was fluctuated in a certain range, and the accuracy rate after 120 h was 91.71% when the pretreatment methods of Normalize and SGolay were used to reduce noise. The accuracy rate of SNV pretreatment at the equator showed an upward trend with time, and it was sensitive to the time and position. The longer the embryo development, the better the discrimination effect. The best discrimination accuracy rate was 91.16% at the equator after 120 h. Moreover, smoothing, SNV and normalize have the highest discrimination accuracy at equator, which was mainly because the equator’s surface is flat and more information was collected. This study provides a new idea and method for the early identification of the data acquisition position.

Keyword: Visible/near infrared spectroscopy; Diffuse reflection; Hatching egg; Judgement position; Judgement time
引言

种鸡蛋胚胎发育过程耗能、 耗时, 但其孵化率不足100%, 若能在孵化早期及时判别未受精种蛋, 可避免未受精种蛋失去食用价值造成的浪费和因其腐败霉变影响其他正常胚胎的发育[1]。 因此, 在种鸡蛋孵化早期及时判别受精情况, 具有重要意义。

目前, 种鸡蛋的无损检测法有敲击振动法、 光电学检测法、 高光谱图像法和计算机视觉法等, 利用敲击振动法检测种蛋时, 需对种蛋两次敲击检测, 且第二次检测时的判别效果较准确, 但此时无精蛋已不具有优质的食用价值[2, 3]; 光电学检测法虽在一定程度上解决了种蛋个体差异性大的问题, 但由于蛋壳颜色、 蛋壳厚度、 蛋黄颜色等因素会吸收或反射入射光中特定波长的光, 影响种蛋透光率的准确性, 存在误判的可能性[4, 5]; 计算机视觉法仅获取图像信息, 褐壳蛋蛋壳上的色素会使图像产生噪声, 此法对白壳种蛋的检测效果优于褐壳种蛋[6, 7, 8]; 高光谱图像检测法虽具有准确率高的优点, 但其成本高, 运算量大, 仅适于实验室研究用[10]

目前检测种鸡蛋受精信息所选择的位置并不单一、 确定。 潘磊庆等[11]采用高光谱图像技术分别对鸡种蛋胚胎的钝端、 中间、 锐端3个位置进行早期胚胎性别鉴定; 刘莹莹等[12]从种鸡蛋钝端采集图像, 建立新鲜度预测分级模型; 秦五昌等[13]采集种鸡蛋钝端数据研究入孵后鸡蛋品质的变化; Das等[14]利用黑白机器视觉系统从种蛋赤道侧透射, 采集孵化早期的种蛋图像, 经过处理后根据生命活力的差别判别剔除无精蛋。

利用近红外光谱分析技术对种蛋早期光谱数据采集位置进行研究, 从而实现在不损坏种蛋的前提下, 为受精蛋和无精种蛋检测与判别提供新思路和新方法。

1 实验部分
1.1 材料

试验样本为181个壳色相近、 表面无裂纹的新鲜种鸡蛋, 清理蛋壳表面, 采用0.1%新洁尔灭溶液消毒后将样本标号, 且分别对种蛋的锐端、 钝端和赤道的两相对位置标记为1, 2, 3和4。 样本集中放置在温度为37.8 ℃、 湿度为60%的孵化机中, 且孵化机的温度和湿度根据变温孵化法调节。 种鸡蛋测量位置见图1。

图1 种鸡蛋测量位置图
(a): 测量位置示意图; (b): 实际测量位置图
Fig.1 The positions for measurement
(a): Schematic diagram of measuring position; (b): Actual measurement position

1.2 仪器

试验用可见/近红外光谱检测系统见图2, 系统包括光源(150 W卤素灯)、 USB 4000光纤光谱仪(Ocean Optics)、 装有与光谱仪配套采集软件Spectrasuite的计算机和一根Y型光纤。 光源为入射光强度可调的便携式光源, 光谱仪的波长范围为345~1 041 nm, 计算机与光谱仪间通过数据线连接。 种鸡蛋孵化使用的是WQ-192孵化机(德州市通达孵化设备制造厂, 山东德州)。

图2 可见/近红外光谱检测系统
①: 光源; ②: Y型光纤; ③: 光纤光谱仪; ④: 计算机; ⑤: 数据线
Fig.2 The detection system of visible/near infrared spectroscopy
①: Light source; ②: Y-type fiber; ③: Fiber spectrometer; ④: Computer; ⑤: USB

1.3 方法

1.3.1 光谱采集

采集345~1 041 nm波长范围的种蛋样品表壳漫反射光谱, 采集位置为所标记的4个位置, 采集时将光纤探头紧贴样本表面, 避免除入射光外其他光源的影响。 每次采集光谱数据前设备预热30 min, 设置光谱采集软件的积分时间为4 ms, 积分次数为10次, 平滑度为5。 将探头紧贴校准白板, 调节光源使最大反射率为最大量程的80%, 而后在不漏光的情况下采集暗光谱。 光谱校正可有效消除暗电流的影响。 样本反射率计算公式为

R=I-IAIC-IA

式中, R为所测样本反射率; I为样本的反射光谱强度; IC为参考光谱; IA为暗光谱(无单位)。 从放入孵化机时开始, 每隔24 h采集一次光谱数据, 采集时待光谱曲线稳定后保存所测数据。

1.3.2 受精信息判别

对孵化10 d的种蛋照蛋, 初步判别受精信息, 孵化15 d时, 第2次照蛋, 对通过照蛋无法准确受精信息的种蛋破壳处理, 以壳内是否有血丝或胚胎为依据, 判别该样本的受精信息, 第2次照蛋及部分种蛋破壳结果见图3。 通常判别时间越早无精蛋的食用价值越大, 越能降低因种蛋不可食用造成的经济损失。 因此, 探索入孵120 h内的种蛋受精判别, 寻找光谱与位置信息的普遍规律很有意义。

图3 第2次照蛋及部分种蛋破壳结果
(a): 受精蛋; (b): 不确定种蛋; (c): 无精蛋
Fig.3 The photos of eggs-second candling and eggs broken
(a): Fertile egg; (b): Uncertain egg; (c): Infertile egg

2 结果与讨论
2.1 统计结果

对181个种蛋统计发现, 共有166个受精蛋, 15个无精蛋。 分析时随机选择61个样本交叉验证。 本试验受精蛋类别变量设为1, 无精蛋类别变量设为-1。

2.2 数据处理

光谱两端的噪声大, 信噪比低且信息少, 选取440.27~874.6 nm区域内的数据进行分析。

由图4和图5发现, 受精蛋和无精蛋光谱曲线的总趋势相同, 在500~700 nm间有3个明显的波峰, 且位置3和4的光谱曲线明显高于位置1和2。 建模前, 利用S-G平滑法、 二阶导数法(SD)、 标准正态变量校正SNV、 变量标准化Normalization(Nor)和多元散射校正MSC对原始光谱数据预处理, 将预处理后的数据完成主成分分析(principal component analysis)。 在实际应用中, 累计贡献率一般大于85%, 据此可决定主成分选取的个数。 种鸡蛋原始光谱数据主成分分析发现, 前2个主成分的累积贡献率为97%, 可准确反映光谱数据信息, 代表原始变量。

图4 样本平均原始光谱图Fig.4 The average raw NIR spectra of samples

图5 主成分得分Fig.5 Principal component scores

2.3 建模方法比较

采用PCA-SVM建模方法得出不同位置多种预处理方法训练集和验证集判别准确率, 不同位置的判别准确率见表1

表1 不同位置的判别准确率 Table 1 The accuracies ratio of different positions

对比发现SD和MSC的判别准确率无变化, 说明两种预处理方式对数据来源位置不敏感; 而SNV预处理的准确率随着位置的变化波动较大, 说明其对数据来源位置敏感, 因此在涉及样本多位置变化的实验时, 不建议使用二阶导数法和多元散射校正对所测数据预处理。 由表1发现, 不同位置的Nor预处理和S-G平滑预处理验证集的判别准确率则随着时间的推移在一定范围内波动, 在种鸡蛋胚胎发育120 h内对受精信息有效判别, 验证集的最佳判别准确率为91.71%, 而SNV预处理位置3的验证集判别准确率随着时间的推移逐渐上升, 位置4的验证集判别准确率虽有波动, 但总体上升, 种鸡蛋胚胎发育越长判别效果越佳, 见图6, 在种鸡蛋胚胎发育120 h内对受精信息有效判别, 判别准确率为91.16%, 数据采集位置为赤道处。 研究发现, 上述三种预处理方式均在赤道侧的判别准确率最佳, 这主要是由于赤道侧较种鸡蛋两端表面平缓, 可采集到更多的信息。

图6 SNV预处理的验证集判别准确率Fig.6 Validation set accuracy of SNV

3 结论

(1)基于可见/近红外光谱的受精蛋判别位置和判别时间, 通过对光谱数据的截取, 确定440.27~874.6 nm波段的光谱可实现对种鸡蛋的判别。

(2)入孵后不同位置、 不同预处理方式对模型判别准确率的影响。 发现二阶导数SD和多元散射校正MSC两种预处理方式对数据来源位置不敏感, 对判别准确率无影响; 变量标准化Nor对数据来源位置略敏感, 对准确率影响较小; 而S-G平滑和标准正态变量校正SNV两种预处理结果则对数据来源位置敏感, 对判别准确率的影响最大。 因此在涉及样本多位置变化的试验时, 不建议使用二阶导数SD和多元散射校正MSC对所测数据预处理。

(3)入孵后不同时间、 不同预处理方式对模型判别准确率的影响。 不同位置的Nor预处理和S-G平滑预处理验证集的判别准确率则随着时间的推移在一定范围内波动, 胚胎发育120 h内的判别准确率为91.71%, 而SNV预处理的判别准确率随着种鸡蛋胚胎发育时间越长判别效果越佳, 在120 h内的判别准确率为91.16%, 上述三种预处理方式在赤道侧判别准确率最高。

参考文献
[1] BI Xia-kun, ZHAO Jie-wen, LIN Hao, et al(毕夏坤, 赵杰文, 林颢, ). Food Science(食品科学), 2013, 34(22): 281. [本文引用:1]
[2] SUN Li, CAI Jian-rong, LI Ya-qi, et al(孙力, 蔡健荣, 李雅琪, ). Journal of Agricultural Science and Technology(中国农业科技导报), 2015, (5): 11. [本文引用:1]
[3] MEI Jin-hua, WANG Shi-quan, WANG Shu-cai(梅劲华, 王石泉, 王树才). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2011, 27(9): 334. [本文引用:1]
[4] CHEN Bin(陈斌). Journal of Jiangsu University of Science and Technology(江苏理工大学学报), 1996, 17(6): 1. [本文引用:1]
[5] Bamelis F R, Tona K, De Baerdemaeker J G, et al. British Poultry Science, 2002, 43(2): 204. [本文引用:1]
[6] MA Xiu-lian, YI Shu-juan(马秀莲, 衣淑娟). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2011, 42(5): 187. [本文引用:1]
[7] SUN Jun, LIU Bin, MAO Han-ping, et al(孙俊, 刘彬, 毛罕平, ). Food Science(食品科学), 2017, 38(6): 282. [本文引用:1]
[8] WU Lin-feng, YU Huai-xin, ZHU Zhi-hui(吴林峰, 余怀鑫, 祝志慧). Food & Machinery(食品与机械), 2019, 35(4): 152. [本文引用:1]
[9] ZHU Zhi-hui, LIU Ting, MA Mei-hu(祝志慧, 刘婷, 马美湖). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2015, 31(15): 285. [本文引用:1]
[10] Lawrence K C, Smith D P, Windham W R, et al. International Journal of Poultry Science, 2006, 5(10): 964. [本文引用:1]
[11] PAN Lei-qing, ZHANG Wei, YU Min-li, et al(潘磊庆, 张伟, 于敏莉, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2016, 32(1): 181. [本文引用:1]
[12] LIU Ying-ying, ZHONG Nan(刘莹莹, 钟南). Food & Machinery(食品与机械), 2017, 33(12): 103. [本文引用:1]
[13] QIN Wu-chang, TANG Xiu-ying, PENG Yan-kun, et al(秦五昌, 汤修映, 彭彦昆, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2017, 37(1): 200. [本文引用:1]
[14] Das K, Evans M D. Transactions of the ASAE, 1992, 34(4): 1335. [本文引用:1]