高光谱图像识别霉变花生的光谱特征分析与指数模型构建
乔小军, 蒋金豹*, 李辉, 亓晓彤, 袁德帅
中国矿业大学(北京) 地球科学与测绘工程学院, 北京 100083
*通讯联系人 e-mail: jjb@cumtb.edu.cn

作者简介: 乔小军, 1990年生, 中国矿业大学(北京)地球科学与测绘工程学院硕士研究生 e-mail: qiaoxj25@163.com

摘要

霉变花生极有可能含强致癌物质-黄曲霉素, 快速识别并分离霉变花生可从源头上阻止其进入食物链, 并降低人类摄入黄曲霉素的风险。 利用可见光-近红外高光谱数据, 通过光谱分析确定能有效识别霉变花生的光谱特征或指数模型。 共获取霉变花生样本253个, 健康花生247个, 并取其霉变(或健康)部位的均值光谱。 在对光谱进行连续统去除后, 首先对其求取了不同步长的一阶微分, 并在可分性较优的光谱区域计算了Area500~650指数; 其次, 用连续小波变换提取了光谱的形状和位置信息, 并利用Indexcwt指数识别霉变花生样本。 结果显示, 指数Area500~650的J-M距离为1.95, Indexcwt模型的J-M距离为1.99, 表明霉变和健康花生在构建的指数模型Area500~650和Indexcwt的特征空间可分性均较优。

关键词: 霉变花生; 高光谱; 光谱分析; 光谱指数
中图分类号:TP79 文献标志码:A
Spectral Analysis and Index Models to Identify Moldy Peanuts Using Hyperspectral Images
QIAO Xiao-jun, JIANG Jin-bao*, LI Hui, QI Xiao-tong, YUAN De-shuai
College of Geosciences and Surveying Engineering, China University of Mining and Technology, Beijing 100083, China
Abstract

Moldy peanuts are likely to contain a strong carcinogen-aflatoxin. Identifying and separating the moldy peanuts quickly can prevent aflatoxin entering the food chain at the source, and reduce the risk of human ingesting aflatoxin. The study is to determine spectral features or index models to identify moldy peanuts efficiently by spectral analysis in Visible and Near-Infrared (VIR) hyperspectral images. Totally 253 moldy peanuts samples and 247 healthy samples were selected to obtain hyperspectral images, and a mean spectrum was calculated from each peanut kernel to represent the moldy or healthy sample. The continuous continuum removal was carried out on the spectra pixel-by-pixel. The modified first-order differential with different step-length was conducted, and the index of Area500~650 was calculated among dominantly separable spectral region of 500~650 nm. Then, the continuous Wavelet transform was applied to extract the spectral information of shapes and locations. Also, the index of Indexcwt was proposed to extract mold information. Results showed that the J-M distance was 1.95 in Area500-650 and 1.99 in Indexcwt, which indicates that the performance of both Area500~650 and Indexcwt is good enough to separate the moldy peanuts from the healthy.

Keyword: Moldy peanuts; Hyperspectral image; Spectral analysis; Spectral index

引 言

2014年— 2015年, 全球花生产量达39.42百万吨[1]。 而花生在生长及存储过程中易受潮而发生霉变, 众所周知, 黄曲霉和寄生曲霉都会产生毒性很强的次生代谢产物— — 黄曲霉素 [2]。 黄曲霉素污染严重影响花生质量并对人类健康构成威胁。 到2003年底, 近100个国家已经制定了食物中黄曲霉素总含量的最大允许值[3]; 主要标准如下: 中国为40 ppb, 美国为20 ppb, 而欧盟更加严格只有4ppb[4]

目前定量检测黄曲霉素的方法普遍使用薄膜法(高效)和液相色谱法等。 这些方法能够提供准确的结果, 但费时、 不易操作[5], 且只能在事后进行检验。 因此, 迫切需要发展一种检测方法, 能够在生产过程中对霉变花生有效识别并分离, 以便阻止黄曲霉素进入食物链。 霉变花生极有可能含致癌物黄曲霉素(尤其是黄曲霉素B1), 在花生油提炼前如果能对其做到有效识别和分离, 将会大大减小人类通过食用油以及其他含花生食品摄入黄曲霉素的风险。 自20世纪60年代, Karl Norris[6]将近红外光谱技术用于谷物和种子以来, 高光谱技术在食品安全及检测中取得了较大的发展和应用。 成像光谱技术不仅可以获得被测物体的光谱, 并能在对应区域成像。 其中光谱维数据一般能以小于10 nm的光谱分辨率描述物质在不同波长处特有的吸收反射特性[7], 而空间维度则反映物体的形状或其他空间信息。 在实践生产中, 近红外光谱技术有着快速, 简易, 非破坏性和无需样品制备等优势[8]

然而, 受光照及成像环境等条件的影响, 高光谱图像中同种材料的光谱信号存在一定差异[9], 即同物异谱现象。 因此, 仅利用反射率的大小关系很难区分光谱相似的物质。 这样, 挖掘有利于区分相似地物的光谱特征显得尤为重要。 张兵等[10]也指出, 通过光谱分析确定物质识别的诊断性特征才是高光谱信息提取的核心, 比基于统计等方法更加可靠[11]。 因此, 拟利用可见光近红外(VIR)高光谱数据, 通过光谱分析确定能识别霉变信息的有效特征, 便于实践识别检测。

1 实验部分
1.1 试验材料

为验证用高光谱技术探测花生霉变信息的可靠性, 霉变花生选取自然状态下发霉, 而非试验诱导发霉; 具体地, 从市场同一批次花生中挑选了253个霉变及247个健康的花生作为试验样品。

1.2 图像数据获取

采用美国SOC710便携式高光谱成像光谱仪获取高光谱数据, 其为推扫式成像, 每次可获取696像元的一行数据。 成像光谱范围在370~1 040 nm(共128个波段), 光谱分辨率约为4.69 nm[12]。 每次扫描成像同时获取反射率参考板和暗电流数据。 于2016年5月30日12:30在中国矿业大学(北京)室外扫描成像。

1.3 图像数据预处理

利用反射率参考白板与暗电流数据可对高光谱图像进行辐射校正[13]。 同时利用5点加权平滑法对光谱数据进行了逐像元平滑。 具体的辐射校正、 光谱平滑公式请参阅文献[13, 14]。

1.4 高光谱图像处理与分析方法

1.4.1 连续统去除

连续统去除是光谱特征参量提取前常用一种的光谱处理方法, 先找到光谱曲线的外壳, 然后用每个波段的反射率除以该波段的外壳值[15]。 本工作利用连续统去除以增强光谱的吸收特性。

1.4.2 光谱一阶微分

光谱微分可以反映光谱曲线在某波长处的细微变化, 并有助于突出曲线的变化趋势。 一般较为常用的是光谱一阶微分, 其计算公式为式(1)[16]

ρ(λi)=Ri+1-Ri-1λi+1-λi-1(1)

式(1)中, ρ(λi)为光谱曲线在波长 λi处的一阶微分; Ri+1Ri-1分别为光谱曲线在波长 λi+1λi-1处的反射率, i为波段序数。

式(1)虽然可以详尽地反映2△ λ 内光谱曲线的微小变化, 但也不可避免地放大了高频噪声; 另一方面, 本文中花生光谱在大于2Δ λ 的波长区间的变化, 更有助于花生霉变信息提取。 因此, 对光谱微分进行了重新定义, 具体如式(2)所示

ρ(λi, step)=Ri+step-Ri-stepλi+step-λi-step(2)

式(2)中, ρ (λ i, step)为光谱曲线在波长为λ i、 步长为step时的一阶微分(i为波段序数, step=1, 2, 3, …); Ri+step, Ri-step分别为光谱曲线在波长λ i+step, λ i-step处的反射率。 当step取不同值时, 公式(2)便可反映任意波长尺度下的光谱曲线的变化。

1.4.3 连续小波变换

连续小波变换的实质是, 将母小波缩放、 平移为不同尺度的一系列小波函数, 然后利用小波函数与原始信号进行投影匹配, 最终得到一系列小波系数。 具体的关于小波变换的原理公式请参阅文献[17, 18]。 小波系数反映了小波函数与信号在波形上的相似程度[17], 因此本文利用连续小波变换提取光谱吸收特征的形状及位置信息, 并用其区分两类花生样本。

1.4.4 J-M距离

为了评估和验证本研究中构建的指数模型的可行性, 使用Jeffries-Matusita (J-M)距离度量了其对霉变花生和健康花生的可分性。 J-M距离是评价样本可分性(类间距离和类内离散度)较好的方法[19], 因其数值范围在0- 2内, 可定量且标准化地度量样本在特征空间的可分性并已成功用于光谱指数验证中[20]

较大数值的J-M是指在特征空间中样本具有良好的可分离性。 本工作用平方距离J-M来表示, 当0< J-M≤ 1.0时类别之间的特征不具备可分性, 1.0< J-M≤ 1.8时有一定可分性但具有一定的重叠度, 1.8< J-M≤ 2.0时可分性较优[21]

2 结果与讨论
2.1 数据处理流程

数据处理流程如图1所示。

图1 数据处理流程Fig.1 Flow chart of data processing

2.2 霉变信息光谱响应

从花生样品的霉变、 健康部位高光谱图像中选取一定比例的像元, 取其光谱均值代表这颗霉变或健康花生的光谱响应。 共获取了霉变光谱253个, 健康花生光谱247个, 图2为两类花生的光谱响应。 图2可见, 霉变和健康花生的光谱重叠度较高, 仅利用光谱反射率大小关系很难区分, 必须寻求更可靠的光谱特征进行识别。

图2 霉变和健康花生在可见光近红外波谱范围的光谱响应特征Fig.2 Spectral responses of contaminated and healthy peanuts in visible and Near-Infrared region

2.3 光谱一阶微分与Area500~650指数

尽管光谱曲线高度重叠, 但两类样品的光谱的形状和变化趋势不同。 用式(2)计算不同步长的一阶微分光谱, 以突出它们的光谱特征差异。 为确定式(2)中step的最优值, 利用J-M距离定量评价了一阶微分的可分性。 从图3可知, 随着步长step增大, 样本的可分性也在显著增大(尤其在500~650 nm范围内); 当step=4时, 可分性增幅缓慢, step=5时逐渐趋于稳定, 因此选择最优step为4。

图3 不同step值对应光谱一阶微分的J-M距离Fig.3 J-M distance of first derivation at different “ step”

由图4(b)所示, 当step=4时两类花生光谱基本完全可分; 同时, 比较图4(a)和图4(b), 可见一阶微分光谱的噪声显著减小。 为进一步放大霉变和健康花生的光谱可分性, 用具有显著性差异的波段500~650 nm构建了光谱指数Area500~650, 具体为

Area500~650=500650ρ(λi, step=4)dλ(3)

图4 步长参数step=1, 4时的一阶微分光谱曲线Fig.4 Spectral responses of first derivative when step=1 and step=4

式(3)中, ρ (λ i, step=4)为step=4 λ i波段处的一阶微分值; λ 为波长且λ ∈ [500, 650]。

2.4 连续小波变换及光谱指数构建

利用连续小波变换对像元光谱进行了处理, 具体选用了墨西哥帽(Mexihat)母小波, 尺度参数为16。 尺度参数一般用{21, 22, 23, 24, 25, …}, 经试验选择能与原始光谱拟合较好的尺度参数24=16。 霉变和健康花生的原始光谱高度混合, 但是图5中的小波系数在533 nm处和587~850 nm范围内具有明显的可区分性特征。 具体的诊断性特征为: (1)健康花生的小波系数在533 nm处为“ 吸收谷” , 而霉变花生没有峰值特性; (2)健康花生的小波系数在587~850 nm范围内, 有明显的“ 反射峰” 且与霉变花生差异较大。 针对以上小波系数特征, 构建如式(4)指数

Indexcwt=Indexvalleye-Indexpeak      (4)

式(4)中, Indexvalley=(cwt533-cwt518)(cwt533-cwt551), cwt为连续小波系数, 其下标为波长; Indexpeak=587850cwt(λ)dλ, λ为波长。

首先, 根据图5中的小波特征, 在533 nm处构建指数的思想是霉变和健康花生的Indexvalley取值符号相反, 便于突出差异性; 在587~850 nm, 指数Indexpeak可累积并放大健康花生与霉变花生的小波系数差异特征。 另外, 霉变和健康花生在850 nm之后的小波系数差异很小; 350~500 nm区域的小波特征虽然数值大小不同, 但两类花生样本有一定的重叠, 因此暂未考虑利用这两个光谱区域的小波特征。

图5 霉变和健康花生均值光谱的小波系数曲线图Fig.5 Wavelet coefficients plot of mean-spectra from contaminated and healthy peanuts

2.5 光谱指数及可分性验证

为验证指数的可分性, 计算了指数对两类花生的J-M距离。 step=4的一阶微分在所有波段的J-M距离如图3所示, 其中Band580(580 nm处的波段)的一阶微分J-M距离取得最大值1.88。 Band580可以用于霉变信息提取, 但由图3可知一阶微分在500~650 nm整个光谱区域都具有较好的可分性, 通过指数Area500~650能进一步增大类别差异和可分性, 如表1所示。 针对533和587~850 nm的小波特征构建的指数Indexvalley和Indexpeak虽具有一定可分性, 但指数Indexcwt的可分性更优, 其J-M距离达1.99(如表1)。

表1 各指数的类间J-M距离 Table 1 J-M distances of indexes between classes
3 结 论

通过获取VIR高光谱图像, 分析其光谱响应特征, 并利用改进的一阶微分和连续小波变换增强光谱响应差异, 最终构建指数模型识别霉变和健康花生。 主要结论如下:

(1)提出改进的一阶微分指数能在不同尺度提取光谱形状变化特征, 并对光谱特征分析和信息提取具有参考意义; 指数Area500~650的J-M距离达1.95, 表明其可分性能较优, 并能用于霉变花生识别。

(2)连续小波变换能有效捕获霉变和健康花生光谱在形状和位置上的特征差异; 利用小波系数特征构建的指数Indexcwt基本能完全区分两类花生样本, 其J-M距离为1.99。

针对可见光近红外高光谱图像识别霉变花生, 提出的两个指数模型均表现出较好的识别性能。 虽然Indexcwt的J-M距离优于Area500~650, 但差异不明显, 因此均可用于花生霉变信息提取; 另外, 两个模型的普适性有待更多试验和实践验证。

The authors have declared that no competing interests exist.

参考文献
[1] Qiao X, Jiang J, Qi X, et al. Food Chemistry, 2016, 220: 393. [本文引用:1]
[2] Wu F, Bhatnagar D, Bui-klimke T, et al. World Mycotoxin Journal, 2011, 4(1): 79. [本文引用:1]
[3] Wu F, Guclu H. PloS One, 2012, 7(9): e45151. [本文引用:1]
[4] Wu F, Stacy S L, Kensler T W. Toxicological Sciences, 2013, 135(1): 251. [本文引用:1]
[5] Wang W, Heitschmidt G W, Ni X, et al. Food Control, 2014 42: 78. [本文引用:1]
[6] Wu D, Sun D W. Innovative Food Science & Emerging Technologies, 2013, 19A: 15. [本文引用:1]
[7] Robles-Kelly Antonio, Huynh Cong Phuoc. Imaging Spectroscopy for Scene Analysis. Springer, 2013. [本文引用:1]
[8] Burns Donald A, Ciurczak Emil W. Hand book of Near-Infrared Analysis, 3rd ed. CRC Press, 2007. [本文引用:1]
[9] Zare A, Ho K C. IEEE Signal Processing Magazine, 2014, 31(1): 95. [本文引用:1]
[10] ZHANG Bing(张兵). Hyperspectral Image Classification and Target Detection(高光谱图像分类与目标探测). Beijing: Science Press(北京: 科学出版社), 2011. [本文引用:1]
[11] TONG Qing-xi, ZHANG Bing, ZHENG Lan-fen(童庆禧, 张兵, 郑兰芬). Hyperspectral Remote Sensing: Principle, Technology and Applications(高光谱遥感-原理技术与应用). Beijing: Higher Education Press(北京: 高等教育出版社), 2006. [本文引用:1]
[12] JIANG Jin-bao, QIAO Xiao-jun, HE Ru-yan, et al(蒋金豹, 乔小军, 何汝艳, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2016, 36(2): 379. [本文引用:1]
[13] Wu D, Sun D W. Innovative Food Science & Emerging Technologies, 2013, 19b: 1. [本文引用:2]
[14] Jiang J, Qiao X, He R. Journal of Food Engineering, 2016, 169: 284. [本文引用:1]
[15] Jiang J, Steven M D, H R, et al. International Journal of Greenhouse Gas Control, 2015, 37: 1. [本文引用:1]
[16] PU Rui-liang, GONG Peng (浦瑞良, 宫鹏). Hyperspectral Remote Sensing and Its Applications(高光谱遥感及其应用). Beijing: Higher Education Press(北京: 高等教育出版社), 2000. [本文引用:1]
[17] Burrus C S, Gopinath R A, Guo H. Introduction to Wavelets and Wavelet Transforms: a Primer, Upper Saddle River, NJ(USA): Prentice Hall, 1998. [本文引用:2]
[18] Cheng T, Rivard B, Sánchez-Azofeifa G A, et al. Remote Sensing of Environment, 2010, 114(4): 899. [本文引用:1]
[19] Adam E, Mutanga O. ISPRS Journal of Photogrammetry and Remote Sensing, 2009, 64(6): 612. [本文引用:1]
[20] Dian Yuanyong, Fang Shenghui, Le Yuan. [J] Indian Soc. Remote Sens. , 2014, 42(1): 61. [本文引用:1]
[21] JIANG Jin-bao, Michael D S, HE Ru-yan, et al(蒋金豹, Michael D S, 何汝艳, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2013, 29(12): 163. [本文引用:1]