微分光谱连续小波系数估测雅氏落叶松尺蠖危害下的落叶松失叶率
黄晓君1,2,3,4, 颉耀文1,*, 包玉海2,3, 包刚2,3, 青松2,3, 包玉龙2,3,4
1. 兰州大学资源环境学院, 甘肃 兰州 730000
2. 内蒙古师范大学地理科学学院, 内蒙古 呼和浩特 010022
3. 内蒙古自治区遥感与地理信息系统重点实验室, 内蒙古 呼和浩特 010022
4. 内蒙古自治区蒙古高原灾害与生态安全重点实验室, 内蒙古 呼和浩特 010022
*通讯联系人 e-mail: xieyw@lzu.edu.cn

作者简介: 黄晓君, 1984年生, 内蒙古师范大学地理科学学院讲师 e-mail: hxj3s@qq.com

摘要

害虫引起的林木失叶会严重威胁森林健康。 森林虫害遥感监测与评价中快速、 准确获取失叶信息十分重要。 基于此, 针对雅氏落叶松尺蠖引起的落叶松失叶灾象, 在蒙古国开展受害林木光谱测量和失叶率估测试验。 首先通过光谱实测数据的处理, 得到微分光谱反射率(DSR, 对光谱反射率求一阶导数)和微分光谱连续小波系数(DSR-CWC, 利用Biorthogonal, Coiflets, Daubechies和Symlets等4种小波系的36个母小波基函数对DSR进行连续小波变换), 分析DSR和DSR-CWC对失叶率的敏感性, 进而借助MATLAB的Findpeaks(Fp)函数自动寻找DSR和DSR-CWC的敏感波段并确定其对应的敏感特征, 然后利用连续投影算法(SPA)对敏感特征进行降维处理, 最后利用敏感特征建立偏最小二乘回归(PLSR)和支持向量机回归(SVMR)失叶率估测模型, 并与逐步多元线性回归(SMLR)模型进行比较。 研究结果表明: ①DSR-CWC与DSR相比, 对失叶率变化的敏感性更显著且敏感波段亦较多, 其敏感波段主要分布于三个吸收谷(440~515, 630~760和1 420~1 470 nm)和三个反射峰(516~620, 761~1 000和1 548~1 610 nm)范围内。 说明DSR-CWC能够增强光谱反射和吸收特征。 ②Fp与SPA结合模式(Fp-SPA)不仅能够快速、 客观选择敏感特征, 而且对特征有效降维, 是一种光谱敏感特征选择的有效方法。 ③4种小波系的最优母小波基分别为bior2.4, coif2, db1和sym6, 其中db1的失叶率估测性能最稳定, 精度最高。 ④对DSR进行连续小波变换能够提高失叶率估测精度, 在DSR-CWC中db1-PLSR模型(RM2=0.934 0, RMSEM=0.089 0)提高的最为显著, 比DSR-PLSR的RM2提高了0.047 5并且比DSR-PLSR的RMSEM降低了0.024 9。 ⑤利用DSR-CWC建立的PLSR和SVMR模型估测精度类似, 其精度优于SMLR模型。 可见, DSR-CWC比DSR失叶率估测更有潜力, 可为森林虫害遥感监测中提供重要参考。

关键词: 雅氏落叶松尺蠖; 落叶松失叶率; 微分光谱连续小波系数; Findpeaks函数; 连续投影算法
中图分类号:O433.4 文献标志码:A
Estimation of Leaf Loss Rate in Larch Infested with Erannis Jacobsoni Djak Based on Differential Spectral Continuous Wavelet Coefficient
HUANG Xiao-jun1,2,3,4, XIE Yao-wen1,*, BAO Yu-hai2,3, BAO Gang2,3, QING Song2,3, BAO Yu-long2,3,4
1. College of Earth and Environmental Sciences, Lanzhou University, Lanzhou 730000, China
2. College of Geographical Science, Inner Mongolia Normal University, Huhhot 010022, China
3. Inner Mongolia Key Laboratory of Remote Sensing & Geography Information System, Huhhot 010022, China
4. Inner Mongolia Key Laboratory of Disaster and Ecological Security on the Mongolia Plateau, Huhhot 010022, China
*Corresponding author
Abstract

Defoliation caused by insect pests severely threatens the health and safety of forests; the rapid and accurate acquisition of information regarding leaf loss is of considerable significance to the remote sensing monitoring and estimation of forest pests. Based on this, we conducted spectral measurements of infested trees and tested leaf loss rate estimation owing to larch defoliation caused by Erannis jacobsoni Djak in Mongolia. Differential spectral reflectance (DSR, first derivative of spectral reflectance) and continuous wavelet coefficient of differential spectral reflectance (DSR-CWC, continuous wavelet transform of DSR carried out using 36 mother wavelet basis functions of four wavelet families: biorthogonal, coiflets, daubechies and symlets) were obtained based on the processing of spectral measurement data. The sensitivity of DSR and DSR-CWC with respect to the estimation of leaf loss rate was analyzed, following which the sensitive bands of DSR and DSR-CWC were automatically identified using the Findpeaks (Fp) function of MATLAB and the sensitive features identified. Dimension reduction of the sensitive features was processed using a successive projections algorithm (SPA). Partial least squares regression (PLSR) and support vector machine regression (SVMR) models for estimating leaf loss rate were established based on these sensitive features and their effectiveness was compared with that of stepwise multiple linear regression (SMLR) models. The results showed that: ①DSR-CWC was determined to be more sensitive than DSR to changes in leaf loss rate in infested larch, with more sensitive bands, mainly distributed in three absorption valleys (440~515, 630~760 and 1 420~1 470 nm) and three reflection peaks (516~620, 761~1 000 and 1 548~1 610 nm). This finding reflects the fact that DSR-CWC can enhance spectral reflection and absorption characteristics. ②The use of the combination pattern of Fp and SPA (Fp-SPA) was an effective method for the selection of sensitive spectral features that could not only select these features quickly and objectively but also effectively reduce dimensions. ③The optimal mother wavelet bases for the four wavelet families respectivelywere bior2.4, coif2, db1, and sym6; db1 had the most stable performance and accuracy for leaf loss rate estimation. ④The continuous wavelet transform of DSR could improve the accuracy of leaf loss estimation; db1-PLSR (RM2=0.934 0, RMSEM=0.089 0) exhibited the most obvious improvement, achieving anRM2 that was 0.047 5 higher than that of DSR-PLSR and an RMSEM that was 0.024 9 lower than that of DSR-PLSR. ⑤The estimation accuracy of the PLSR and SVMR modelsestablished based on DSR-CWC was either similar to or better than that of the SMLR models. DSR-CWC thus estimated leaf loss rate more effectively than DSR did. It can be seen that DSR-CWC has more potential than DSR in estimating leaf loss rate, and it can provide important reference for remote sensing monitoring of forest pests.

Keyword: Erannis jacobsoni Djak; Leaf loss rate of larch; Differential spectral continuous wavelet coefficient; Findpeaks function; Continuous projection algorithm
引 言

森林虫害往往使林木失叶, 威胁森林健康安全[1]。 失叶率(leaf loss rate, LLR是指单位面积上整体树冠叶片损失量占全部叶片量的百分比)是表征森林失叶的参量, 是森林虫害监测重要指标。 因而快速、 准确获取林木失叶率信息在森林虫害监测和森林健康评价等方面有重要意义。

蒙古高原森林资源丰富, 但森林虫害频发, 其中蒙古国雅氏落叶松尺蠖(Erannis Jacobsoni Djak)是常见的严重危害落叶松的害虫, 是蒙古高原北部独有一年一代森林害虫, 其幼虫在6月— 7月暴食针叶, 使落叶松严重失叶, 导致成片落叶松林死亡。 多年来蒙古国大部落叶松林发生了雅氏落叶松尺蠖灾害, 使森林生态系统受到严重破坏。 更值得注意的是该虫逐年往东传播, 已经对我国大兴安岭森林生态系统安全造成威胁[2]。 在此背景下, 快速监测雅氏落叶松尺蠖灾害, 趁早掌握该虫发生发展规律, 为害虫防控提供重要依据是势在必行。 目前遥感是植物虫害监测的重要手段, 与传统人工调查相比有监测范围广、 效率高和成本低等优势[3]。 植物虫害光谱分析及建模是后续遥感大面积监测植物虫害的实验理论基础[4, 5]。 因此, 通过光谱分析技术, 研究雅氏落叶松尺蠖危害下落叶松失叶率估算显得尤为重要。

害虫引起的森林失叶遥感监测是很多学者关注的研究热点[3]。 目前在失叶遥感监测中以分类为主, 而失叶率估测很少见且精度有待提高[6]。 如Rahimzadeh-Bajgiran等通过Landsat遥感数据计算归一化差异水分指数、 增强型植被指数和归一化植被指数, 对云杉失叶进行了4级分类, 总体分类精度为70%左右[7]。 Hawrył o等利用Sentinel-2遥感数据计算几种植被指数, 采用K近邻(KNN)、 随机森林(RF)和支持向量机(SVM)等机器学习算法建立了失叶分类模型, 其总体准确率分别为78%, 75%和78%[6]。 Spruce等采用MODIS NDVI时间序列数据集, 对舞毒蛾引起的森林失叶进行了两级分类, 其总体分类准确率为79%[8]。 Philip A Townsend等借助Landsat遥感数据计算归一化差异红外指数和水分胁迫指数, 建立了失叶率估测模型, 其RMS误差估计值为14.9%[9]。 从参考文献发现森林失叶监测多集中在多光谱遥感应用上, 而高光谱遥感的应用鲜有报道。 高光谱与多光谱相比, 对植物结构和生理的细微变化有更强感知能力。 在植物虫害监测中有更大潜力, 利用高光谱估测受害林木失叶率, 可为森林失叶高光谱遥感监测提供有力实验依据, 并对森林虫害遥感监测的发展具有重要意义。

尽管现有学者利用地面高光谱数据来区分不同程度的害虫引起的林木失叶状况[10], 但失叶率高光谱估测尚未见报道。 一般来讲, 植物虫害高光谱检测模型的实现过程由光谱敏感性分析、 敏感光谱特征提取和高光谱检测模型构建等三部分组成[2]。 首先选择一种敏感性分析方法从高光谱高维数据中确定有意义的敏感波段。 敏感性分析方法有很多, 如: 相关性分析、 判别分析、 主成分分析、 方差分析、 敏感性分析、 遗传算法、 后向特征消去法和变量重要性分析等[2, 10, 11]。 然后从敏感波段中提取敏感光谱特征。 光谱特征形式有多种, 如: 光谱反射率、 微分光谱特征、 去除包络线光谱特征、 光谱小波特征和光谱植被指数等[12]。 敏感光谱特征确定之后可利用多元线性回归、 支持向量机、 偏最小二乘法和决策树等数理统计和数据挖掘算法实现植物虫害检测模型[11, 13, 14]。 本文针对雅氏落叶松尺蠖危害下落叶松失叶灾象, 通过微分光谱连续小波系数, 利用偏最小二乘回归和支持向量机回归算法, 构建失叶率估测模型, 揭示高光谱对失叶率估测的潜力, 旨在为利用高光谱遥感技术进行雅氏落叶松尺蠖灾害监测与预警提供参考。

1 实验部分
1.1 数据获取

在蒙古国杭爱省的Ikhtamir, Tsenkher和Battsengel等雅氏落叶松尺蠖灾区进行了光谱测量和失叶率估测的试验研究, 其中Ikhtamir和Tsenkher试验区作为建模训练区, 而Battsengel试验区作为模型验证区。

1.1.1 高光谱数据

采用ASD地物光谱仪对不同程度失叶的落叶松进行了光谱测量。 该光谱仪光谱分辨率为3 nm@350~1 000 nm和10 nm@1 000~2 500 nm; 采样间隔为1.4 nm@350~1 000 nm和2 nm@1 000~2 500 nm; 数据间隔为1 nm。 在整个测定过程中, 探头使用视场角为25° 且垂直向下, 高度要求离测定对象0.2 m左右, 所有光谱在晴朗无云的天气于北京时间10:30— 14:30期间测定(图1)。 每个样本树垂直方向上分为上、 中、 下3个层次, 然后各层次上选择典型一条树枝进行观测20次, 每样本树观测前后均使用参考白板对光谱进行校正, 将20× 3次的光谱反射率的平均值来代表一个样本树的冠层光谱反射率值。 从Ikhtamir和Tsenkher训练区分别采集26棵和20棵样本树的光谱曲线, 用于失叶率估测模型的建立; 从Battsengel验证区采集20棵样本树的光谱曲线, 用于模型精度的验证。

图1 落叶松树枝光谱测量Fig.1 Spectral measurement of larch branches

1.1.2 失叶率数据

现场失叶率估算是与光谱测量同时进行的, 即对光谱测量的3条树枝计算失叶率。 失叶率计算方法是首先在光谱测量范围(以光谱测量探头在树枝上的投影点为中心, 以0.09 m为半径的圆, 见图1)内记录损失和健康针叶数量; 然后通过式(1)分别计算3条树枝的失叶率, 再取平均值作为当前样本树的失叶率。

LLR=NlNh+Nl×100%(1)

式中LLR为树枝失叶率, NhNl分别为健康和损失的针叶计数。

1.2 光谱数据预处理

高光谱数据在获取的过程中难免受到背景和仪器噪声的干扰, 不可避免地产生异常光谱。 利用ViewSpecPro软件剔除异常光谱, 同时进行了平滑处理得到不同失叶率落叶松冠层预处理的光谱曲线。 然后采用ENVI软件对预处理的光谱反射率求一阶导数, 获得微分光谱反射率(记为DSR), 其目的为降低背景干扰, 净化光谱数据及突出光谱特征有用信息[2]

1.3 模型建立与验证

1.3.1 连续小波变换

连续小波变换是一种能同时将频域和时域局部化的线性变换方法, 利用母小波基将高光谱反射率数据在不同尺度和位置上变换成一系列连续小波能量系数。 这种系数可直接与全波段相对应, 能够提供植物冠层光谱吸收特征与反射特征的形状及位置的可解释信息[12]。 在光谱预处理的基础上, 利用连续小波对不同程度失叶的林木冠层微分光谱反射率进行变换, 获得微分光谱连续小波系数(记为DSR-CWC)。 在连续小波变换中采用了Biorthogonal, Coiflets, Daubechies和Symlets小波系的36种母小波基, 如: ①Biorthogonal: bior1.3, bior1.5, bior2.2, bior2.4, bior2.6, bior2.8, bior3.1, bior3.3, bior3.5, bior3.7, bior3.9, bior4.4, bior5.5和bior6.8等14个母小波基; ②Coiflets: coif1, coif2, coif3, coif4和coif5等5个母小波基; ③Daubechies: db1, db2, db3, db4, db5, db6, db7, db8, db9和db10等10个母小波基; ④Symlets: sym2, sym3, sym4, sym5, sym6, sym7和sym8等7个母小波基。 为避免太多的分解尺度, 笔者仅在21, 22, 23, 24, 25, 26, 27, 28, 29和210等10个尺度上[12], 采用MATLAB2016b软件完成了连续小波变换处理。

1.3.2 敏感连续小波特征提取

失叶率与DSR-CWC的决定系数R2值大于0.64(p< 0.000 1)对应的波段设为敏感波段[12]。 利用MATLAB软件的Findpeaks(Fp)函数[见式(2)]自动寻找R2峰值并确定敏感波段, 然后通过敏感波段位置, 分别提取10个尺度上的小波系数。

[P, L]=Findpeaks(x, minpeakheight’, h, minpeakdistance’, d)(2)

式中, x为决定系数R2和波段组成的矩阵, PR2峰值, LR2峰值相应的波段位置, hR2峰值的最小高度(设为0.64), d为相邻R2峰值间的最小波段间隔数(设为10 nm)。

在此基础上, 利用连续投影算法(SPA)对每个尺度的小波系数进行降维处理, 并确定敏感连续小波特征。 SPA是一种将可变共线最小化的前向循环选择方法, 从一个波长开始, 每次迭代时使用向量空间中的投影算法选择一个新波长, 直到预定波长数为止。 因而SPA以克服敏感波段间的共线性来选择重要波长, 能够建立稳定的模型。 SPA的实现步骤如下:

建模样本树数量和敏感波段波长数分别为mn, 则两者组成的微分光谱连续小波系数矩阵为Xm× n, 初始迭代向量为xk(0), 需要提取的连续小波特征个数(也就是连续小波系数个数)为t

①首次迭代: d=1, 从微分光谱连续小波系数矩阵中任选1列向量xj, 记为xk(0), 非选入列向量的集合记为Q

Q={j, 1jn, j{k(0), , k(d-1)}}

②计算xjQ中向量的投影向量

Pxj=xj-(xTj-xk(d-1))xk(d-1)(xTk(d-1)-xk(d-1))-1

③记录最大投影的序号

k(d)=arg(maxPxj), jQ

④最大投影作为下轮投影向量

xj=Pxj, jQ

d=d+1, 如果d< t, 回到②继续投影。

最终降维后的敏感小波系数为{xk(d)=0, …, t-1}。

1.3.3 失叶率估测模型

利用偏最小二乘回归(PLSR)和支持向量机回归(SVMR)算法建立失叶率估测模型, 并与逐步多元线性回归(SMLR)模型进行了比较。 PLSR是一种多元线性数据统计分析法, 旨在解决存在许多(可能相关的)预测变量和相对较少样本的情况。 在建模中它从自变量空间和因变量空间里寻求某些相关程度最大的成分线性组合, 以便更好地解释因变量的变异信息, 相当于普通线性回归、 主成分分析、 典型相关分析的组合。 SVMR是一种基于统计学习理论的模式识别方法。 利用统计学习理论的VC-维数和最小结构风险原理, 建立支持向量机。 它在保证数据逼近精度的同时能降低逼近函数的复杂度, 对有限样本和非线性问题方面特别有优势。 该模型以径向基函数(RBF)为核函数, 它能反映数据点和成本损失函数(正则化参数)之间的相似性。 另外, 考虑到正则项参数C和核参数g对模型性能的影响, 我们采用交叉验证确定最优参数Cg, 确保SVMR模型性能。

1.3.4 模型精度验证

为验证模型精度的可靠性, 训练数据与验证数据的采集选择在不同地区。 利用决定系数(R2)和均方根误差RMSE作为训练模型(记为 RC2和RMSEC)和验证模型(记为 RV2和RMSEV)精度评定的基础指标。 为验证模型精度更为客观, 利用训练与验证的平均决定系数[ RM2=0.5× ( RC2+ RV2)]和平均均方根误差[RMSEM=0.5× (RMSEC+RMSEV)]作为模型精度评价指标。 RM2的最大值为1, 其值越接近于1, 说明模型拟合程度越好, 估测精度越高; RMSEM的最小值为0, 其值越接近于0, 说明模型预测误差越小, 估测精度越高。

2 结果与讨论
2.1 DSR与DSR-CWC的失叶率敏感性对比

图2显示了在350~1 800 nm范围内不同失叶率林木冠层DSR和DSR-CWC的曲线, 其中DSR-CWC是采用bior2.4(26尺度)母小波基函数变换的。 从图2可知, 雅氏落叶松尺蠖引起的落叶松失叶, 导致DSR和DSR-CWC的变化。 对DSR而言, 在505~535和680~760 nm波段内出现峰, 而在550~590和600~620 nm波段内出现谷。 随失叶率增加, 峰的高度和谷的深度逐渐降低趋势[图2(a)]。 对DSR-CWC来讲, 在450~495, 545~588, 648~688, 738~784和1 130~1 160 nm波段内出现谷, 而在500~545和688~738 nm波段内出现峰。 当失叶率上升时, 峰的高度和谷的深度呈明显降低趋势[图2(b)]。 与DSR相比, 随失叶率减小DSR-CWC峰高度更高, 波谷深度更深, 不同失叶率对应的DSR-CWC差异更大, 也就是说DSR-CWC对不同失叶率的响应特征更为显著。 因此, 利用DSR-CWC与失叶率的关系估测失叶率是可行的。

图2 不同失叶率落叶松冠层的DSR曲线(a)和DSR-CWC曲线(b)Fig.2 (a) DSR curve and (b) DSR-CWC curve of different LLR for larch canopy

为进一步分析DSR-CWC对不同失叶率落叶松冠层的敏感性, 将DSR及DSR-CWC逐波段进行Pearson相关性分析, 得到各波长上的决定系数R2分布图(图3), 其中图3(b)表示了基于21~210尺度Biorthogonal, Coiflets, Daubechies和Symlets小波系36个母小波基的R2在350~1 800 nm波段上的分布(相邻母小波基之间小刻度表示尺度, 刻度间隔为2)。 由图可知, DSR及DSR-CWC与失叶率均存在显著相关。 对DSR来说, 在505~535, 550~590, 600~620, 680~760, 1 126~1 188, 1 276~1 340, 1 530~1 576, 1 730~1 768 nm波段内其R2均大于0.64, 其中560~580和713~718 nm波段内其R2达到0.8以上[图3(a)]。 这是因为560~580 nm波段对绿色有强反射, 当失叶率增加时, 落叶松针叶数量减少, 冠层绿色明显减弱进而使光谱的绿色反射逐渐衰减。 而713~718 nm为红边波段, 当失叶率上升时, 落叶松叶面积减少, 叶绿素含量下降, 红边波段色素吸收减弱导致其光谱反射增强。 对DSR-CWC而言, 在综合顾及10个尺度的前提下, 除了bior3.1其余母小波基函数的小波系数基本在可见光区(420~760 nm)和红外区的近红外反射肩(761~1 350 nm)、 近红外吸收谷(1 416~1 500 nm)、 中红外反射峰(1 501~1 795 nm)等波段内与失叶率均存在极显著相关, 其中3个吸收谷(440~515, 630~760和1 420~1 470 nm)和3个反射峰(516~620, 760~1 000和1 548~1 610 nm)波段内其R2达到0.8以上。 这是因为林木冠层反射率受叶色素、 叶片内部结构和水分含量等因子的控制, 如: 440~515和630~760 nm波段主要吸收叶绿素a、 b, 1 420~1 470 nm波段主要吸收针叶水分, 这些波段通常反射率较低, 但是当失叶率增加时, 林木叶绿素和水分含量随之减少, 致使这些波段的林木冠层反射率上升。 516~620 nm对绿色具有强反射特性, 当落叶松被雅氏落叶松尺蠖侵染时, 林木失叶率增加, 冠层颜色由绿色变红色, 导致该波段反射减弱。 761~1 000 nm波段光谱除了很小部分的吸收, 大部分为反射, 使得其反射率较高。 当落叶松受害程度加剧时, 针叶细胞结构被破坏, 失叶量增加, 叶面积减少, 致使该波段反射率降低。 1 548~1 610 nm波段反射率受1 450和1 940 nm的强吸收叶片水分特征的影响, 它是这两个吸收光谱位置中间形成的反射峰, 当林木失叶率增加时, 叶片水分下降, 使得1 450和1 940 nm的水分吸收减弱, 进而导致1 548~1 610 nm波段反射率相对上升。 连续小波变换能够增强上述三个反射峰和三个吸收谷光谱特征。 因此, 这些波段光谱反射率对应的DSR-CWC与失叶率存在了极显著相关性。 可见, DSR-CWC与DSR相比对失叶率的敏感性更明显, 可作为估测失叶率的重要指标。

图3 DSR(a)及DSR-CWC(b)与失叶率的相关关系图Fig.3 Correlation diagram between (a) DSR and LLR, and (b) DSR-CWC and LLR

2.2 基于Fp-SPA的敏感DSR-CWC提取

利用Fp和Fp-SPA提取的DSR和DSR-CWC的敏感波段如图4所示。 由图可知, 采用Fp自动获取的敏感波段数较多, 如DSR: 16个、 Biorthogonal的14个母小波基: 55~220个、 Coiflets的5个母小波基: 53~104个、 Daubechies的10个母小波基: 54~146个和Symlets的7个母小波基: 57~96个。 显然与DSR相比, DSR-CWC的敏感波段更多。 为压缩模型输入变量冗余和减少输入变量多重共线性, 在基于Fp的敏感波段提取的基础上, 利用SPA算法对其进一步处理, 获得最终敏感波段。 结果显示, DSR和DSR-CWC的最终敏感波段数为DSR: 4个、 Biorthogonal: 2~13个、 Coiflets: 2~17个、 Daubechies: 2~13个和Symlets: 1~13个。 降维处理后, DSR的敏感波段为714, 941, 1 296和1 759 nm, 而DSR-CWC的敏感波段更好捕捉到了光谱的吸收和反射特征, 如Biorthogonal的bior2.4的敏感波段为440, 454, 490, 518, 543, 599, 685, 717, 1 059, 1 151, 1 539, 1 552和1 748 nm, Coiflets的coif2的敏感波段为490, 526, 568, 642, 708, 718, 739, 780, 829, 971, 1 222, 1 433, 1 599, 1 749和1 757 nm, Daubechies的db2的敏感波段为470, 601, 688, 720, 756, 830, 920, 1 301, 1 548, 1 762和1 767 nm, Symlets的sym4的敏感波段为470, 518, 538, 567, 718, 738, 1 196, 1 221, 1 586和1 760 nm。 可见, 上述波段较好捕获了蓝光波段(440, 454和470 nm)和红光波段(642, 685, 688, 708, 717, 718, 720, 738, 739和756 nm)对叶绿素的强吸收特征、 绿光波段(518, 526, 538, 543, 567和568 nm)对叶绿素的反射特征、 近红外波段(780, 829, 830, 920和971 nm)对针叶细胞组织的强反射特征、 短波红外波段(1 433 nm)对针叶水分含量的吸收特征以及中红外波段(1 548, 1 552, 1 586和1 599 nm)的反射特征。 这与敏感性分析结果基本相吻合。 显然, Fp-SPA模式能够有效捕获可见光区、 近红外和中红外区的DSR-CWC的敏感波段。

图4 DSR和DSR-CWC的敏感波段分布Fig.4 Sensitive band distribution of DSR and DSR-CWC

2.3 失叶率估测模型及精度评价

从66棵样本树的光谱和失叶率数据中, 选取训练区的46棵样本树数据作为建模数据, 验证区的20棵样本树数据作为精度验证数据。 通过MATLAB软件平台, 利用DSR和4种小波系36个母小波基的DSR-CWC, 分别构建了PLSR和SVMR失叶率估测模型, 并与SMLR模型进行了估测精度比较(见表1)。 结果表明:

表1 不同模型估测精度比较 Table 1 Comparison of estimation accuracies among different models

在基于Biorthogonal小波系14个母小波基DSR-CWC的不同模型中利用bior2.4的PLSR(bior2.4-PLSR)模型估测精度最优( RM2=0.933 2, RMSEM=0.088 5), 与SMLR相比其 RM2提高了0.077 3, RMSEM降低了0.039 1。 在基于Coiflets小波系5个母小波基DSR-CWC的不同模型中采用coif2的SVMR(coif2-SVMR)模型估测精度最优( RM2=0.927 4, RMSEM=0.095 8), 与SMLR相比其 RM2提高了0.065 5, RMSEM降低了0.022 6。 在基于Daubechies小波系10个母小波基DSR-CWC的不同模型中运用db1的PLSR(db1-PLSR)模型估测精度最优( RM2=0.934 0, RMSEM=0.089 0), 与SMLR相比其 RM2提高了0.009 2, RMSEM降低了0.015 6。 在基于Symlets小波系7个母小波基DSR-CWC的不同模型中利用sym6的PLSR(sym6-PLSR)模型估测精度最优( RM2=0.922 5, RMSEM=0.095 8), 与SMLR相比其 RM2提高了0.061 8, RMSEM降低了0.027 5。

在PLSR和SVMR模型中, 利用DSR-CWC比DSR估测精度有明显提高, 具体表现为: bior2.4-PLSR, coif2-PLSR, db1-PLSR和sym6-PLSR的 RM2比DSR-PLSR分别提高了0.046 7, 0.033 9, 0.047 5和0.036 0, RMSEM分别降低了0.025 4, 0.017 0, 0.024 9和0.018 1; bior2.4-SVMR, coif2-SVMR, db1-SVMR和sym6-SVMR的 RM2比DSR-SVMR分别提高了0.019 6, 0.019 5, 0.025 1和0.009 6, RMSEM分别降低了0.020 0, 0.015 3, 0.018 8和0.012 6。

基于bior2.4, coif2, db1和sym6的PLSR和SVMR模型估测精度相对类似, 其 RM2均大于0.91, 其中db1-PLSR模型精度相比之下达到最高。 在36个母小波基中db1对PLSR, SVMR和SMLR 3种模型均表现出最好的估测效果, 说明db1为精度和稳定性兼备的最有估测潜力的母小波基。

为进一步揭示模型精度和稳定性, 利用DSR和DSR-CWC构建的不同模型建模集和验证集的估测值与实测值之间分别进行1:1直线拟合分析, 如图5所示。 由图5得知, 基于bior2.4, coif2, db1和sym6的DSR-CWC与DSR相比, 其PLSR和SVMR的建模集和验证集的大部分数据点分布在1:0.5和1:1.5直线范围内且较均匀分布在1:1直线两侧, 说明利用DSR-CWC建立的两种模型拟合效果均较好, 估测精度较高。 对DSR-CWC而言, PLSR和SVMR与SMLR相比, 分别在bior2.4, coif2, db1和sym6中建模集和验证集数据点均表现较好拟合效果, 而SMLR的验证集数据点离散程度较明显, 表明利用DSR-CWC构建的PLSR和SVMR模型比SMLR模型稳定性好并精度高。

图5 不同模型的1:1直线拟合效果比较Fig.5 Comparison of 1:1 Line fitting effects among different models

3 结 论

以受雅氏落叶松尺蠖危害的落叶松为研究对象, 利用66棵样本落叶松冠层光谱数据和失叶率数据, 通过Fp-SPA模式捕捉DSR和DSR-CWC的敏感特征建立PLSR和SVMR失叶率估测模型, 得出了以下结论:

(1)DSR-CWC与DSR相比对受害落叶松失叶率变化的敏感性更显著并且敏感波段更多。 除了bior3.1其余35个母小波基的DSR-CWC的敏感波段主要分布于三个吸收谷(440~515, 630~760和1 420~1 470 nm)和三个反射峰(516~620, 761~1 000和1 548~1 610 nm)波段范围内。 可见, 对雅氏落叶松尺蠖危害下的落叶松失叶, DSR-CWC能够较好挖掘叶色素、 叶片内部结构和水分含量变化引起的光谱响应特征。

(2)Fp-SPA模式是一种选择敏感光谱小波特征的有效方法。 它不仅能够快速、 客观选择敏感特征, 而且对特征有效降维, 即由上百个特征降维到几个关键特征, 故可减少模型计算量还能够提高模型稳定性。

(3)在基于DSR-CWC的估测失叶率中, Biorthogonal, Coiflets, Daubechies和Symlets等4种小波系的最优母小波基分别为bior2.4, coif2, db1和sym6, 其中db1比其余母小波基对PLSR, SVMR和SMLR模型均表现出较高估测精度, 且在1:1直线上其模型的建模集和验证集数据点拟合效果较好, 说明所有母小波基中db1的估测失叶率性能最为稳定。

(4)与DSR相比, DSR-CWC提高了失叶率估测精度。 在PLSR、 SVMR和SMLR三种模型中db1-PLSR对估测精度的提高最为明显, 在1:1直线上比DSR-PLSR表现出更好的拟合效果, db1-PLSR的 RM2和RMSEM分别为0.934 0和0.089 0, 比DSR-PLSR的 RM2提高了0.047 5, 比DSR-PLSR的RMSEM降低了0.024 9。 显然利用DSR-CWC估测失叶率更有潜力。

(5)基于DSR-CWC的PLSR和SVMR模型失叶率估测精度相对类似, 且优于SMLR模型, 尤其bior2.4-PLSR和coif2-SVMR较为明显。 bior2.4-PLSR与bior2.4-SMLR相比其 RM2提高了0.077 3, RMSEM降低了0.039 1, coif2-SVMR与coif2-SMLR相比其 RM2提高了0.065 5, RMSEM降低了0.022 6。 说明在雅氏落叶松尺蠖危害下, 利用DSR-CWC的PLSR和SVMR模型的失叶率估测精度具有较高可靠性, 对森林虫害监测具有参考价值。

参考文献
[1] White J, Wulder M, Brooks D, et al. Remote Sensing of Environment, 2005, 96(3-4): 340. [本文引用:1]
[2] HUANG Xiao-jun, XIE Yao-wen, BAO Yu-hai(黄晓君, 颉耀文, 包玉海). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2018, 38(3): 905. [本文引用:4]
[3] Rullansilva C D, Olthoff A E, Delgado d l M J A, et al. Forest Systems, 2013, 22(3): 377. [本文引用:2]
[4] Wulder M A, Dymond C C, White J C, et al. Forest Ecology & Management, 2006, 221(1-3): 27. [本文引用:1]
[5] Niemann K O, Quinn G, Stephen R, et al. Canadian Journal of Remote Sensing, 2015, 41(3): 191. [本文引用:1]
[6] Hawryło P, Bednarz B, We$\dot{Z}$yk P, et al. European Journal of Remote Sensing, 2018, 51(1): 194. [本文引用:2]
[7] Rahimzadeh-Bajgiran P, Weiskittel A, Kneeshaw D, et al. Forests, 2018, 9(6): 357. [本文引用:1]
[8] Spruce J P, Sader S, Ryan R E, et al. Remote Sensing of Environment, 2011, 115(2): 427. [本文引用:1]
[9] Townsend P A, Singh A, Foster J R, et al. Remote Sensing of Environment, 2012, 119(8): 255. [本文引用:1]
[10] Adelabu S, Mutanga O, Adam E, et al. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2013, 7(1): 177. [本文引用:2]
[11] Fassnacht F E, Latifi H, Ghosh A, et al. Remote Sensing of Environment, 2014, 140(1): 533. [本文引用:2]
[12] Cheng T, Rivard B, Sánchezazofeifa G A, et al. Remote Sensing of Environment, 2010, 114(4): 899. [本文引用:4]
[13] Lausch A, Heurich M, Gordalla D, et al. Forest Ecology & Management, 2013, 308(4): 76. [本文引用:1]
[14] Shi Y, Huang W J, González-Moreno P, et al. Remote Sensing, 2018, 10(4): 525. [本文引用:1]