基于多变量统计分析的冬小麦长势高光谱估算研究
王超, 王建明, 冯美臣, 肖璐洁, 孙慧, 谢永凯, 杨武德*
山西农业大学农学院, 山西 太谷 030801
*通讯联系人 e-mail: sxauywd@126.com

作者简介: 王 超, 1988年生, 山西农业大学博士后 e-mail: wcqxx2005@126.com

摘要

利用高光谱分析技术实现冬小麦长势的准确、 无损监测具有重要的实践意义。 基于连续两年的氮素运筹试验, 通过获取叶面积指数(LAI)、 地上干生物量(AGDB)、 地上鲜生物量(AGFB)、 植株含水量(PWC)、 叶绿素密度(CH.D)和氮素积累量(ANC)六个冬小麦长势指标及冬小麦冠层高光谱, 引入主成分分析法(PCA)构建可表征冬小麦长势的综合长势指标(CGI), 并结合偏最小二乘回归法(PLSR)构建CGI的高光谱估测模型。 结果表明, 除植株含水量外, 其他长势指标与所构建的CGI都达到极显著水平, 表明利用CGI可以表征各长势指标信息。 对比CGI和其他各长势指标的PLSR模型表现可知, CGI光谱监测模型表现最优( R2=0.802, RMSE=1.268, RPD=2.015), 也具有较高的预测精度和稳健度( R2=0.672, RMSE=1.732, RPD=1.489)。 表明基于PCA方法所构建的CGI可以表征冬小麦长势, 利用PLSR方法可以实现对冬小麦长势的准确监测, 且监测效果要优于单一的冬小麦长势指标。

关键词: 冬小麦; 长势; 高光谱; 主成分分析; 偏最小二乘回归
中图分类号:S512.1+1 文献标志码:A
Hyperspectral Estimation on Growth Status of Winter Wheat by Using the Multivariate Statistical Analysis
WANG Chao, WANG Jian-ming, FENG Mei-chen, XIAO Lu-jie, SUN Hui, XIE Yong-kai, YANG Wu-de*
College of Agronomy, Shanxi Agricultural University, Taigu 030801, China
Abstract

Accurate and non-destructive estimation on the growth status of winter wheat is of significance. The consecutive two-years experiments of nitrogen application in 2011—2012 and 2012—2013 were performed to obtain the canopy spectra and the six growth status indicators of winter wheat (Leaf area index, LAI; Above ground dry biomass, AGDB; Above ground fresh biomass, AGFB; Plant water content, PWC; Chlorophyll density, CH.D; Accumulated nitrogen content, ANC). The principle component analysis (PCA) was implemented to construct the comprehensive growth indicator (CGI), which could potentially represent the growth status of winter wheat. Furthermore, the method of partial least square (PLSR) was applied on constructing the hyperspectral prediction models of all growth indicators and validating the accuracy of CGI. The results showed that the constructed CGI significantly correlated with all the growth status indicators of winter wheat, excepting for the PWC. It indicated that the CGI could represent most of the information for the six indicators and the CGI also could be used to stand for the growth status of winter wheat. Moreover, the model performance of CGI and other six indicators were further compared, and it showed that the PLSR model of CGI performed best than other six indicators with R2=0.802, RMSE=1.268, RPD=2.015. The CGI model was validated and proved to be more accurate and robust ( R2=0.672, RMSE=1.732 and RPD=1.489). The study showed that the CGI constructed with the PCA method could represent the growth status of winter wheat and the CGI model based on the PLSR method could be used to estimate the growth status of winter wheat. It also indicated that the multivariate statistical analysis had great potential to be applied in the field of crops by using the hyperspectral technology.

Keyword: Winter wheat; Growth status; Hyperspectrum; PCA; PLSR
引 言

冬小麦是我国主要粮食作物之一, 实时掌握其长势对于水肥等田间管理具有重要的指导作用[1]。 作物长势的传统测定方法比较耗时、 费力, 且具有损伤性[2]。 近20年来, 高光谱分析技术已经广泛应用于农业领域, 为实时、 快速、 无损监测作物长势提供了有效的途径和手段[3]

地上生物量、 植株含水量、 叶面积指数等指标常用于表征作物长势状况[4]。 国内外学者利用高光谱在监测作物长势方面开展了一系列研究, 构建了对地上生物量、 植株含水量、 叶面积、 作物全氮含量、 叶绿素含量等长势指标的高光谱预测模型, 取得了较好的估测效果[5, 6, 7]。 当前, 国内外众多学者利用高光谱对作物的单一长势指标进行了较为准确的建模分析, 但是单一长势指标难以全面反映作物长势状况。 文献中虽然有对多个长势指标的高光谱监测与分析, 但也局限在对各指标进行单独监测, 并没有分析各长势指标之间的关系及如何结合各长势指标来实现表征冬小麦长势状况的表征[8, 9]。 作物各长势指标之间存在紧密的关系, 应用单一长势指标难以真实、 全面反映作物长势状况。 但是, 引入过多的长势指标势必又会造成数据冗余和信息重叠。 另外, 从高光谱与冬小麦长势的响应机理来看, 冠层高光谱是冬小麦长势的综合反映, 利用冠层高光谱来反演作物的单一长势指标, 并最终实现作物长势的光谱评估, 其结果的准确性、 针对性和实践应用性存在一定的局限性。 因此, 如何准确表征冬小麦长势状况是利用高光谱实现其准确监测的前提和难点, 寻找或者构建能够表征作物长势状况的参数具有重要的研究意义。

从作物生理角度来看, 各单一长势指标之间存在紧密的关系, 但仍具有各自独特的表征意义。 尝试利用统计学方法在保证不丢失原始变量信息的基础上, 实现多变量数据信息的融合, 可为探索构建综合长势指标提供有效的手段。 近年来, 多变量统计分析方法在光谱领域的广泛应用, 极大的促进了光谱学在农业领域的发展[10], 主成分分析法(principle component analysis, PCA)和偏最小二乘回归法(partial least square regression, PLSR)是应用比较广泛的两种多变量统计方法[11]。 基于连续两年的氮素运筹试验, 以表征冬小麦长势的叶面积指数、 地上干生物量、 地上鲜生物量、 植株含水量、 叶绿素密度和氮素积累量六个长势指标为基础, 尝试利用PCA方法构建能够表征冬小麦长势的综合长势指标(comprehensive growth indicator, CGI), 并结合PLSR方法定量分析冠层高光谱与CGI的关系和构建CGI的高光谱估算模型, 以实现冬小麦长势的高光谱估测。

1 实验部分
1.1 试验设计

本试验在山西农业大学农作物试验站进行(东经112° 33', 北纬37° 25'), 供试土壤类型为石灰性褐土, 物理性砂粒和粘粒含量分别为31.99%和68.01%, PH为7.57, 呈微碱性, 土壤耕作层理化性质为土壤全氮0.51 g· kg-1, 磷含量18.44 mg· kg-1, 钾含量236.91 mg· kg-1, 有机质含量22.01 g· kg-1, 肥力中等。 研究中供试氮肥为尿素(含N质量分数为46.4%)、 磷肥为过磷酸钙(含P2O5质量分数为12%)、 钾肥为氯化钾(含K2O质量分数为61.5%)。

试验1: 2011年9月— 2012年7月, 供试冬小麦品种为“ 京9549” , 采用随机区组设计, 设5个施氮水平, 分别为0, 75, 150, 225和300 kg· hm-2纯氮, 小区面积4 m× 7 m=28 m2, 行距为20 cm, 重复3次, 氮肥基追比为1∶ 1, 在拔节期追肥。 磷、 钾肥以基肥形式一次性施入, 其他田间管理相同。

试验2: 2012年9月— 2013年7月, 供试冬小麦品种为“ 长4738” 、 “ 晋农190” 、 “ 晋太9923” , 设5个施氮水平, 分别为0, 75, 150, 225和300 kg· hm-2纯氮, 本试验采用裂区区组设计, 主区为品种, 副区为施氮水平, 小区面积4 m× 7 m=28 m2, 行距为20 cm, 重复3次, 施肥、 灌溉等田间管理措施同试验1。

将试验2数据作为校正集, 用于构建冬小麦CGI指标及六个单一长势指标的高光谱估测模型, 并以试验1数据为验证集, 用于验证所构建CGI的准确性及各高光谱模型的表现。 校正集和验证集样本数分别为180个和58个, 共计238个样本。

1.2 数据处理与获取

1.2.1 冬小麦冠层光谱的测定

采用美国ASD公司生产的FieldSpec3型背挂式野外光谱仪获取冬小麦冠层高光谱数据。 波长范围为350~2 500, 350~1 000和1 000~2 500 nm, 光谱采样间隔分别为1.4和2 nm, 光谱分辨率分别为3和10 nm, 光纤视场角度为25° 。 冬小麦冠层高光谱的测定需选择天气晴朗、 无风或风速很小的天气条件。 测定时间为10:00— 14:00, 测定时光谱探头垂直向下, 距目标冠层的垂直高度为1 m。 每次测量获取10个光谱数据, 各小区选择3个测量样点, 测量过程中, 需用标准白板进行不间断校正。

1.2.2 冬小麦长势指标测定

叶面积指数(leaf area index, LAI)、 地上干生物量(above ground dry biomass, AGDB)、 地上鲜生物量(above ground fresh biomass, AGFB)、 植株含水量(plant water content, PWC)、 叶绿素密度(chlorophyll density, CH.D)和氮素积累量(accumulated nitrogen content, ANC)能够表征作物生理生化和长势结构, 与作物呼吸、 光合、 物质运转等生理代谢过程密切相关。 选择以上六个指标来表征冬小麦长势, 并作为构建综合长势指标的基础。

在获取冠层光谱的位置, 采集冬小麦植株样, 利用称重法获取AGFB和AGDB; 按照式(1)得到PWC

PWC(%)=AGFB-AGDBAGFB×100(1)

采用Li-3000C叶面积仪获取叶面积, 并换算为LAI; 参考Lichtenthal和Wellborn的方法测定CH.D; 采用微量凯氏定氮法测定ANC。

1.3 多变量统计分析方法

1.3.1 主成分分析法(PCA)

PCA是一种降维和提取重要信息的多变量统计方法, 其作用是在尽可能多的保留原始信息的基础上, 将多个指标简化为少量指标。 当所提取的变量信息的累积方差达到85%以上时, 一般认为所提取的变量信息基本可以表征原始变量信息, 则可以利用所提取的变量替代原始变量[12]

引入PCA, 根据提取主因子的解释总方差, 选择变量个数。 并基于主成分与各长势指标的矩阵及主因子矩阵和因子特征根(表1), 依据各主因子与各长势指标之间的公式, 求出各主因子PCi, 计算公式如式(2)

PCi=MVi1λiV1+MVi2λiV2++MVinλiVn(2)

式中, i: 第i个主因子, MV: 因子矩阵, n: 第n个变量, λ n: 第n个主因子的特征根。

表1 冬小麦各长势指标变量之间的相关关系 Table 1 Correlation among the six growth indicators of winter wheat

描述冬小麦长势的综合指标(CGI)为新因子变量, 主因子与新因子变量之间的定量计算公式为

CGI=λ1λ1+λ2++λnPC1++λnλ1+λ2++λnPCn(3)

1.3.2 偏最小二乘回归(PLSR)

PLSR综合了多元线性回归和主成分分析的优点, 是一种常用的多变量统计分析方法。 PLSR尤其适用于自变量个数远远多于样本个数和自变量之间存在较大共线性的情况。 PLSR方法应用于高光谱分析具有较大的应用潜力, 也得到众多学者的证实[13, 14]

1.4 模型评价

在本研究中, R2, RMSE(Wold, 1994)和RPD等统计参数用于综合评定模型表现。 其中, R2越接近于1, RMSE越小, 表明模型具有较高的预测精度。 RPD常用于评价模型的精度和稳健度, CHANG等[15]认为, 当RPD> 2时, 模型具有较好的预测能力; 当1.4< RPD< 2时, 模型具有中等预测能力, 但可以通过模型优化处理提高模型的表现; 当RPD< 1.4时, 表明模型的预测能力和普适性较差。

R2=1-i=1n(Yi-Y'i)/(n-p-1)i=1n(Yi-Y'i)2/(n-1)RMSE=1ni=1n(Yi-Y'i)2RPD=SDRMSE

式中, n表示样本数, Y'iYi分别是预测值和实测值, SD为实测值的标准差。

1.5 分析方法

以连续两年的冬小麦氮素运筹试验为基础, 利用PCA构建表征冬小麦CGI指标, 并结合PLSR方法构建冬小麦长势的高光谱监测模型。

1.6 数据处理

采用SPSS 20.0进行描述性统计分析和PCA分析, MATLAB 7.0用于PLSR分析。

2 结果与讨论
2.1 冬小麦各长势指标描述性统计分析

图1为冬小麦各长势指标所有样本数据的正态分布图, 可以看出, 冬小麦各长势指标呈近似正态分布, 符合统计学进一步数据分析的基本要求。 另外, 分析原始数据可知, 所有冬小麦长势指标的全距较大, 差异性明显, 基本可以表征冬小麦生育期内的长势状况, 为进一步构建CGI和实现冬小麦长势的光谱监测奠定了有效的数据基础。

图1 冬小麦各长势指标的正态分布情况Fig.1 Normal distribution of the growth status indicators of winter wheat

2.2 基于PCA的冬小麦长势综合指标(CGI)的构建

为了更好的描述和表征冬小麦长势状况, 本研究利用PCA方法, 基于表征冬小麦长势的六个单一长势指标, 尝试构建能够表征所有长势指标信息的CGI, 表1为冬小麦各长势指标间的相关关系结果。

表1可以看出, 除PWC与AGFB, AGDB, ANC的相关性较低外, 其他指标之间的相关性都达到了显著水平, 表明冬小麦各长势指标之间存在较大共性或相似性。 从统计学角度来说, 如直接使用上述六个长势指标对冬小麦长势进行综合评价, 势必会造成信息的重叠[16], 也会影响评价结果的准确性和客观性。 因此, 为了进一步明确各长势指标之间的关系和各指标对冬小麦长势的贡献, 以及实现冬小麦长势的综合评价, 基于六个长势指标和PCA方法尝试构建冬小麦综合长势指标。

对各冬小麦长势指标进行PCA分析, 并计算相关矩阵的特征根、 特征向量及特征根的累积贡献率, 结果如表2所示。 从表中可知, 当选择两个主成分因子时, 累积方差为87.29%, 认为前2个主成分可以表征所有长势指标的87.29%信息, 超过统计学上85%的设置标准。 另外, 表2显示第一主成分特征根为3.509, 贡献率占58.490%, 对应的特征向量中以AGFB和ANC最大, 表明第一主成分来自于AGFB和ANC的信息较多; 第二主成分中, 特征根为1.728, 贡献率占28.798%, 对应的特征向量中以PWC最大, 表明第二主成分中含有的PWC信息较多。

各主成分与各冬小麦长势指标存在线性关系, 权重系数是各长势指标相对应的特征向量, 基于主因子载荷矩阵和因子特征根(表2), 按照式(2), 可得到主成分与各长势指标之间的特征向量, 结果如表3所示。

表2 主成分因子的特征根、 解释总变量、 载荷矩阵 Table 2 Characteristic root, explained variance and the loading matrix of PCA
表3 主因子与冬小麦各长势指标的换算系数 Table 3 Coefficient between the PCs and the growth indicators of winter wheat

利用式(3), 构建描述冬小麦长势的CGI指标, 图2为所构建CGI数据的描述性统计分析结果, 可以看出所构建CGI数据呈近似正态分布。

图2 基于PCA方法所构建冬小麦综合长势指标的正态分布Fig.2 Normal distribution of the CGI constructed with the PCA method

为了体现CGI在表征其他各长势指标方面的准确性和代表性, 进一步分析了CGI与冬小麦各长势指标的关系, 结果如表4所示。

表4 CGI与冬小麦各长势指标的相关关系 Table 4 Correlation between the constructed CGI and six growth indicators of winter wheat

表4可以看出, CGI与PWC呈显著相关, 而与其他指标达到极显著相关水平。 其中, CGI与CH.D, LAI, AGFB的相关性达到0.82以上, 与AGDB和ANC的相关性也达到0.6以上, 表明所构建的CGI基本能够表征冬小麦各长势指标信息。

2.3 冬小麦长势指标的PLSR高光谱估算模型

为了定量体现CGI在表征冬小麦长势的表现, 本研究基于各长势指标和构建的CGI, 利用校正集数据构建CGI及各长势指标的PLSR光谱模型, 并使用验证集数据验证各模型的表现, 结果如表5所示。

表5 冬小麦各长势指标的PLSR光谱模型表现 Table 5 Estimated model performance of growth indicators based on the PLSR method

从表中可以看出, 冬小麦各长势指标中, LAI和AGFB的PLSR模型最差(R2< 0.531, RMSE> 1.773, RPD< 1.063), 经验证, 模型的预测精度和稳健度也较差(R2< 0.456, RMSE> 2.101, RPD< 1.018)。 AGDB、 ANC的PLSR模型要优于LAI和AGFB, 但监测模型的表现仍然较差(R2< 0.578, RMSE> 0.651, RPD< 1.171), 模型的验证精度也较低。 比较而言, PWC和CH.D则有较好的模型表现(R2> 0.658, RPD> 1.388), 经验证, 模型仍然取得了较高的预测精度(R2> 0.626, RPD> 1.374)。 综合对比CGI和其他各长势指标的PLSR模型的表现可知, CGI的估算模型表现最优(R2=0.802, RMSE=1.268, RPD=2.015), 验证模型也取得了较高的预测精度和稳健度(R2=0.672, RMSE=1.732, RPD=1.489)。 表明利用高光谱技术可以实现对用于表征冬小麦长势的CGI的准确监测, 且监测效果要优于各单一长势指标。 另外, 由于CGI来源于PCA方法和冬小麦各长势指标, 本文从统计学角度证实了CGI可最大程度的反映冬小麦各长势指标信息, 表明利用CGI用于表征冬小麦长势是可行的。

从数据结果来看, 基于CGI的冬小麦长势光谱监测模型要优于各单一长势指标, 利用另一年试验数据验证后也得到了较好结果, 表明CGI与光谱信息之间存在更为敏感的关系, 利用高光谱技术准确估测冬小麦CGI是可行的。 但是, 与植株含氮量、 植株含水量等其他单一长势指标相比, 其在具体表征作物养分盈亏, 从而指导田间水肥管理方面仍需进一步探索。 众多研究已经证实生物量、 叶面积指数及植株氮素与籽粒品质和产量之间的关系, 这种高相关关系使得CGI与籽粒产量和品质也存在较好的关系, 结合本文中利用高光谱技术监测CGI的表现优于其他单一长势指标的结果可知, 利用CGI进行冬小麦产量和品质的高光谱估测存在较大的应用潜力。 其次, 冬小麦CGI来源于各单一指标, 定量分析CGI与各长势指标之前的关系或分析各长势指标对CGI的贡献, 可以扩大CGI在指导具体田间管理方面的应用, 但仍需进一步定量化研究。 另外, 利用多变量统计方法构建CGI的不确定性因素较大, 故加大多年数据样本的收集, 对克服不确定因素影响和实现作物长势的准确监测与评价具有重要意义。 本研究结果虽然难以直接应用于生产实践, 但所提出的通过构建冬小麦综合长势指标来实现冬小麦长势光谱监测的思路和结果, 仍具有一定的理论和实践意义。

3 结 论

冬小麦冠层高光谱是作物长势信息的综合反映, 利用冠层高光谱估测单一长势指标难以准确反映冬小麦长势状况, 也限制了高光谱技术在冬小麦长势监测方面的广泛应用。 在基于六个冬小麦长势指标的基础上, 引入PCA构建能够表征各长势指标的综合长势指标CGI, 发现:

(1)除植株含水量外, 其他长势指标与所构建CGI都达到极显著水平, 表明利用CGI表征冬小麦各长势指标具有一定的准确性和可行性。

(2)对比CGI和其他各长势指标的PLSR模型表现可知, CGI指标的PLSR模型表现最优(R2=0.802, RMSE=1.268, RPD=2.015), 模型也具有较高的预测精度和稳健度(R2=0.672, RMSE=1.732, RPD=1.489), 表明基于PCA方法所构建的CGI能够表征冬小麦长势, 利用PLSR方法可以实现冬小麦长势的准确监测, 且监测效果要优于单一的长势指标。

The authors have declared that no competing interests exist.

参考文献
[1] HE Yong, PENG Ji-yu, LIU Fei, et al(何勇, 彭继宇, 刘飞, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2015, 31(3): 174. [本文引用:1]
[2] Zhao G M, Miao Y X, Wang H Y. et al. Field Crops Research, 2013, 154: 23. [本文引用:1]
[3] Hilker T, Lepine L, Coops N C. Agricultural and Forest Meteorology, 2012, 153: 124. [本文引用:1]
[4] Bajgain R, Kawasaki Y, Akamatsu Y, et al. Field Crops Research, 2015, 180: 221. [本文引用:1]
[5] Tian J, Philpot W D. Remote Sensing of Environment, 2015, 169: 280. [本文引用:1]
[6] Ali A M, Darvishzadeh R, Skidmore A K. Agricultural and Forest Meteorology, 2017, 236: 162. [本文引用:1]
[7] WANG Hong-bo, ZHAO Zi-qi, LIN Yi, et al(王宏博, 赵梓淇, 林毅, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2017, 37(5): 1489. [本文引用:1]
[8] Wang C, Feng M C, Yang W D, et al. PLoS One, 2017, 12(1): e0167679. [本文引用:1]
[9] Wang Y, Wang D J, Shi P H, et al. Plant Method, 2014, 10(36): 1. [本文引用:1]
[10] Yang X M, Xie H T, Drury C F, et al. European Journal of Soil Science, 2012, 63: 177. [本文引用:1]
[11] Zou X B, Zhao J W, Malcolm J W P, et al. Analytica Chimica Acta, 2010, 667: 14. [本文引用:1]
[12] CHU Xiao-li(褚小立). Molecular Spectroscopy Analytical Technology Combined with Chemometrics and Its Applications. Beijing: Chemical Industry Press (北京: 化学工业出版社), 2011. 56. [本文引用:1]
[13] Nawar S, Buddenbaum H, Hill J, et al. Soil Tillage Research, 2016, 155: 510. [本文引用:1]
[14] Serbin S P, Dillaway D N, Kruger E L, et al. Journal of Experimental Botany, 2012, 63: 489. [本文引用:1]
[15] Chang C W, Larid D A. Soil Science, 2002, 167(2): 110. [本文引用:1]
[16] YE Qin, JIANG Xue-qin, LI Xi-can, et al(叶勤, 姜雪芹, 李西灿, . ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2017, 48(3): 164. [本文引用:1]