可见光光谱的冬小麦苗期地上生物量估算
张领先1, 陈运强1, 李云霞1, 马浚诚2,*, 杜克明2, 郑飞翔2, 孙忠富2
1. 中国农业大学信息与电气工程学院, 北京 100083
2. 中国农业科学院农业环境与可持续发展研究所, 北京 100081
*通讯联系人 e-mail: majuncheng@caas.cn

作者简介: 张领先, 1970年生, 中国农业大学信息与电气工程学院教授 e-mail: zhanglx@cau.edu.cn

摘要

地上生物量是表征冬小麦苗期长势的重要参数之一, 对于监测冬小麦苗期长势, 预测产量具有重要的实际意义。 目前, 通过计算光谱指数进行生物量估算是冬小麦苗期地上生物量无损测量的主要方法, 但该方法需要一定的平台支撑, 在便捷性方面存在一定的不足。 为此, 利用可见光图像数据获取方便、 准确率高的特点, 基于冬小麦苗期冠层可见光图像数据开展冬小麦苗期地上生物量估算研究。 采用数码相机, 采集冬小麦苗期冠层可见光图像并利用Canopeo进行冬小麦冠层与背景的分割。 在获取冠层分割图像后, 提取了CC(canopy cover)、 ExG(excessg reen)、 ExR(excess red)、 ExGR(ExG-ExR)、 NGRDI(normalized green-red difference index)、 GLI(green leaf index)、 RGRI(red-green ratio index)和RGBVI(RGB vegetation index)共8个可见光图像特征。 利用相关性分析进行特征优选, 选择与冬小麦苗期地上生物量实测数据相关性较高的图像特征构建估算模型。 利用优选的图像特征, 分别构建偏最小二乘回归(PLSR)、 BP神经网络(BPNN)、 支持向量机回归(SVR)和随机森林(RF)模型, 开展冬小麦苗期地上生物量估算研究, 并定量分析特征数量和播种密度对估算模型准确率的影响。 结果表明, ExR, GLI和RGBVI与生物量实测数据相关性较低, 因此, 将这3个特征剔除。 CC, ExG, ExGR, NGRDI和RGRI与生物量实测数据的相关性较高, 其中CC, ExG和ExGR与生物量实测数据呈正相关, 而NGRDI和RGRI与生物量实测数据呈负相关。 利用优选的图像特征构建估算模型, 研究结果表明, 基于优选的5个图像特征, PLSR的估算准确率最高, 模型 R2为0.801 5, RMSE为0.0788 kg·m-2, 表明PLSR能够实现冬小麦苗期地上生物量的准确估算。 特征数量是影响估算模型准确率的因素之一, 随着特征数量的减少, 模型估算的准确率逐步下降。 利用不同播种密度数据集对估算模型进行测试, 结果表明, PLSR在不同的播种密度数据集上均取得了最高的估算准确率, 模型 R2分别为0.897, 0.827 9和0.788 6, RMSE分别为0.062, 0.072和0.079 1 kg·m-2, 表明PLSR估算的冬小麦苗期地上生物量数据与实测生物量数据之间具有良好的相关关系。 随着播种密度的增加, 所有估算模型的准确率均出现下降, 而PLSR的准确率下降程度最小。 由此可见, 基于可见光图像数据, 能够实现冬小麦苗期地上生物量的准确估算, 为冬小麦苗期田间管理提供参考。

关键词: 冬小麦; 苗期; 地上生物量; 可见光光谱; 估算
中图分类号:TN941.1 文献标志码:A
Estimating Above Ground Biomass of Winter Wheat at Early Growth Stages Based on Visual Spectral
ZHANG Ling-xian1, CHEN Yun-qiang1, LI Yun-xia1, MA Jun-cheng2,*, DU Ke-ming2, ZHENG Fei-xiang2, SUN Zhong-fu2
1. College of Information and Electrical Engineering, China Agricultural University, Beijing 100083, China
2. Institute of Environment and Sustainable Development in Agriculture, Chinese Academy of Agricultural Sciences, Beijing 100081, China
*Corresponding author
Abstract

Above ground biomass (AGB) is one of the most commonly used traits indicating the growth of winter wheat at early growth stages. It is of great practical significance to monitor the growth and to estimate the yield. The conventional methods involving destructive sampling and manual calculating of the dry weight to measure AGB are prohibitively time consuming and laborious. The non-destructive approach to estimate AGB of winter wheat is through the estimation of vegetation indices (VIs) and regression analysis, which heavily depends on tools such as Remote Sensing and LiDAR. Therefore, the method is subject to specialized knowledge and high-cost. An estimating method for above ground biomass of wheat winter at early growth stages was proposed by using the digital images of winter wheat canopy. The canopy images were captured by a digital camera. The image segmentation of vegetation was achieved by using Canopeo. Based on the segmented images, eight images features, i. e., CC (Canopy Cover), ExG (Excessgreen), ExR (Excess red), ExGR (ExG-ExR), NGRDI (Normalized Green-Red Difference Index), GLI (Green Leaf Index), RGRI (Red-Green Ratio Index) and RGBVI (RGB Vegetation Index), were extracted. Correlation analysis was conducted between pairs of the images features and the biomass measurements. The feature that were highly correlated to the biomass measurements were used to build the estimation model. Results showed that ExR, GLIand RGBVI were not correlated to biomass, resulting in the elimination in the following experiments. The left five features were highly correlated to the biomass measurements. Among the five selected features, CC, ExG and ExGR were positively correlated to biomass measurements while NGRDI and RGRI were negatively correlated to biomass measurements. Based on the selected features, four model, i. e., Partial least squares regression (PLSR), BP neural network (BPNN), Support vector machine regression (SVR) and Random forest (RF), were built to estimate the above ground biomass. The influences of the number of features and the sowing density on the estimating accuracy were analyzed quantitatively. Results showed PLSR achieved the best accuracy based on the selected five features, the R2 value was 0.801 5, and the RMSE was 0.078 8 kg·m-2, indicating that the PLSE was able to accurately estimate the above ground biomass of winter wheat at early growth stages. Thenumber of feature was proved to be an influence of factor. The accuracy of the model decreased with the reduction of the number of features. Experiments on the models by using different sowing density datasets were conducted as well. The results showed that PLSR outperformed the other three models over all the density datasets, the R2 values were 0.897, 0.827 9 and 0.788 6, and the RMSE values were 0.062, 0.072 and 0.079 1 kg·m-2, indicating that the PLSR the estimated above ground biomass had a goof agreement with the ground truth. With the increase of the sowing density, the accuracy of all the models decreased while the PLSR achieved the minimum reduction. In Summary, the above ground biomass can be estimated by using the digital images, which can provide support to the field management of winter wheat at early growth stages.

Keyword: Winter wheat; Early growth stages; Above ground biomass; Visible spectrum; Estimation
引 言

小麦在我国粮食作物中占有举足轻重的地位。 保障小麦优质高产对于我国粮食安全、 农民增收、 社会稳定以及农村经济发展有重要作用。 苗期是冬小麦生长和管理的重要时期之一, 苗期的长势对冬小麦产量形成具有重要的影响[1]。 因此, 实时掌握冬小麦苗期长势信息, 对长势较差的地块及时采取相应的农艺措施, 能够提高冬小麦分蘖能力, 从而提高产量。

地上生物量是表征冬小麦苗期长势的常用指标之一[2, 3, 4, 5]。 传统的冬小麦苗期地上生物量测量方法需要进行田间破坏性取样和室内分析处理, 不但效率低, 而且消耗大量的人力和物力[4, 5, 6]。 随着光谱技术的发展, 通过遥感获取冠层光谱数据并计算植被指数, 成为了目前生物量无损测量的主要方法之一[7, 8, 9]。 归一化植被指数(NDVI)是用来估算生物量的最常用植被指数[3, 10], 除此之外, 常用的植被指数还包括ENDVI[10]和GnyLi[11]等。 由于光谱数据采集需要一定的平台支撑, 导致该方法在使用成本和便捷性方面存在不足[5]

随着计算机视觉技术的发展, 基于数字图像处理从可见光图像中提取相应的数字特征, 能够对作物长势指标进行准确的拟合分析[12, 13, 14, 15]。 因此, 充分利用可见光图像易获取、 精度高的特点, 开展冬小麦地上生物量估算研究, 是对目前生物量无损测量方法的有益补充。 本研究旨在充分利用可见光图像数据, 通过提取冬小麦苗期冠层的可见光图像特征, 综合运用回归分析、 机器学习等方法估算冬小麦苗期地上生物量, 以期建立一种成本低、 便捷性高的估算方法。

1 实验部分
1.1 采样区设计

实验于2017年10月— 2018年6月在河南省双八镇商丘农林科学院田间试验基地进行。 试验用的冬小麦品种为国麦301, 播种时间为2017年10月14日, 共设置3个播种密度, 分别为120, 270和420株· m-2, 每个播种密度对应4个小麦试验区, 每个试验区大小为2.4 m× 5 m。 在每个试验区内随机设置3个相互不重叠、 大小为1m× 1m的图像采样区(用白色正方形方框标记), 并且试验区尽量分散[图1(a)]。

图1 冬小麦试验设置
(a): 图像采样区设置; (b): 图像采集设备
Fig.1 Winter wheat experiment setup
(a): Image collection areas; (b): Image collection device

1.2 可见光图像数据采集与处理

冬小麦苗期冠层可见光图像数据采用佳能600D数码相机采集。 将相机固定在三脚架上, 保持相机的高度在距离地面1.5 m处[图1(b)], 并且相机镜头始终垂直向下。 图像采集于晴天或少云天气, 采集时间为上午9:00— 11:00, 图像采集时保持闪光灯关闭并且不使用光学变焦。 采集的可见光图像原始分辨率为5 184× 3 456并保存为JPG格式。 在获取冬小麦苗期冠层图像后, 利用手动剪裁的方式, 将原始图像中图像采样区之外的部分删除, 并将图像的尺寸统一调整为1 000× 1 000。 从播种后第44天开始, 每隔3~8 d进行一次图像采集, 直到播种后第153 d。 共进行了17次图像采集, 获取612张冬小麦苗期冠层可见光图像。

1.3 可见光图像特征提取

冠层覆盖率(canopy cover, CC)是表征作物长势的常用图像特征之一, 可通过计算冠层部分像素数量占图像所有像素数量的比例得出。 研究表明, 冠层覆盖率与地上生物量等长势参数之间存在良好的线性关系[12, 16, 17, 18]。 因此, 选用冠层覆盖率作为冬小麦苗期地上生物量估算的特征之一, 除此之外, 本研究还采用了ExG(excess green)[19]、 ExR(excess red)[20]、 ExGR(ExG-ExR)[21]、 NGRDI(normalized green-red difference index)[22]、 GLI(green leaf index)[23]、 RGRI(red-green ratio index)[24]和RGBVI(RGB vegetation index)[25]等7个常用的颜色指数来构建冬小麦苗期地上生物量估算模型。 所采用的颜色指数定义如下。

ExG=2G-R-B(1)ExR=1.3R-G(2)ExGR=ExG-ExR(3)NGRDI=G-RG+R(4)GLI=2G-R-B2G+R+B(5)RGRI=RG(6)RGBVI=G2-(R×B)G2+(R×B)(7)

式中R, G, B分别代表RGB颜色空间的三个颜色分量标准化后的像素值。

由于采集的冬小麦苗期冠层图像中含有地面等背景噪声, 因此在提取图像特征前, 需要进行冠层图像分割, 实现植被与背景的分离。 考虑到方法的运行效率, 采用Canopeo[15]实现冠层图像分割同时计算冠层图像CC值。 Canopeo是一种基于RGB颜色空间冠层图像分割方法, 利用R/G, B/G和2G-R-B三个颜色特征, 能够实现冠层图像快速分割。 图像分割后, 从分割的冠层图像中提取上述8个图像特征。 由于在每个试验区内设置了3个图像采样区, 因此试验区的图像特征为该试验区内3个图像采样区图像特征的平均值。 本研究构建的估算模型的初始数据集共包含204个样本。

相关性分析是建立估算模型之前的基础步骤之一, 为选择对估算模型贡献率较高的图像特征, 开展颜色特征与冬小麦苗期地上生物量实测数据的相关性分析, 采用Pearson相关系数, 选择与生物量实测数据相关性高的图像特征构建估算模型。

1.4 冬小麦苗期地上生物量数据获取

冬小麦苗期地上生物量数据的采集与图像采集同时进行。 采用破坏性取样的方法, 在每个试验区内随机采集5株冬小麦, 进行烘干称重, 这5株冬小麦均不在图像采样区范围内。 将5株冬小麦的干重平均后乘以相应的植株密度, 从而获得该试验区的实测生物量数据。 试验共获取了204个生物量数据。

1.5 估算模型构建

选用目前常用的估算模型开展试验, 定量比较分析偏最小二乘回归(partial least squares regression, PLSR)[26]、 BP神经网络(BP neural network, BPNN)[27]、 支持向量机回归(support vector machine regression, SVR)[28]和随机森林(random forest, RF)[29]的估算准确率, 采用准确率较高方法构建冬小麦苗期地上生物量估算模型。

2 结果与讨论

利用Canopeo进行冬小麦苗期冠层图像分割, 部分分割结果如图2所示。

图2 冠层图像分割结果
(a): 原始图像; (b): 分割结果
Fig.2 Canopy image segmentation results
(a): Original images; (b): Segmentation results

在获取冬小麦冠层分割图像后, 提取图像的可见光图像特征并利用Pearson相关性分析进行特征优选。 将可见光图像颜色特征与冬小麦苗期地上生物量实测数据进行相关性分析, 分析结果见表1

表1 图像特征相关性分析 Table 1 Correlation analysis between images features and biomass

从表中可以看出, ExR, GLI和RGBVI与冬小麦苗期地上生物量实测数据的相关性较低, CC, ExG和ExGR与生物量实测数据呈正相关, 而NGRDI和RGRI与生物量实测数据呈负相关。 因此, 在构建估算模型时, 将ExR, GLI和RGBVI这3个特征剔除, 将选择的5个特征分为三个特征组: W, P和N。 特征组W包含全部5个图像特征, 特征组P包含CC, ExG和ExGR, 特征组N包含NGRDI和RGRI。

2.1 冬小麦苗期地上生物量估算

根据试验设置, 本研究构建的数据集共包含204个样本。 将构建的数据集划分为训练集和测试集, 其中训练集包含153个样本, 测试集包含51个样本。 利用训练数据集, 构建PLSR, SVR, BPNN和RF模型, 开展冬小麦苗期地上生物量估算研究。 采用线性回归分析进行估算模型的对比, 采用决定系数(coefficient of determination, R2)和均方根误差(root mean square error, RMSE)进行估算模型准确率定量评价。 基于不同特征组的估算结果如表2所示。

表2 基于不同特征组的估算结果对比 Table 2 Comparative results among different feature groups

从比较结果中可以看出, 基于特征组W的估算结果准确率最高, 其次是特征组P, 基于特征组N的估算结果准确率最低。 表明利用可见光图像特征构建的估算模型, 能够对冬小麦苗期地上生物量进行准确的估算。 特征数量是影响估算准确率的因素之一, 随着特征数量的减少, 模型估算的准确率逐步下降。

在基于特征组W的估算结果中[图3(a)], PLSR的估算准确率最高, 模型估算的冬小麦苗期地上生物量与实测数据之间具有良好的相关关系, 其R2为0.801 5, RMSE为0.078 8 kg· m-2。 其次是BPNN和SVR, 其R2分别为0.763 4和0.746, RMSE分别为0.096 1和0.068 2 kg· m-2。 RF的估算准确率最低, 其R2为0.668 4, RMSE为0.094 9 kg· m-2。 与基于特征组W的估算结果类似, 在基于特征组P的估算结果中[图3(b)], PLSR取得了最高的估算准确率, 其次是SVR和BPNN, 而RF的估算准确率最低。 在基于特征组N的估算结果中, SVR的估算准确率最高, 其次是PLSR和BPNN, RF的估算准确率最低。 从估算结果中可以看出, 随着样本数据量的减少, 估算模型的准确率均出现了下降, 由于SVR对于小样本数据具有良好的处理能力, 其准确率下降的程度较小。

图3 冬小麦苗期地上生物量估算结果
(a): 特征组W; (b): 特征组P; (c): 特征组N
Fig.3 Estimation results of above ground biomass of winter wheat at early stages
(a): Features group W; (b): Features group P; (c): Features group N

2.2 不同播种密度对冬小麦苗期地上生物量估算结果的影响

通过2.1估算结果可知, 基于特征组W的估算结果准确率最高, 因此, 重点分析基于特征组W的估算模型在不同播种密度下的估算效果。 根据冬小麦试验设置, 构建了3个数据集, D120, D270和D420, 评价不同播种密度对估算模型的影响。 构建的3个数据集分别与3个播种密度对应, 每个数据集包含17个样本。 估算模型在不同数据集的估算准确率定量评价结果如表3所示。

表3 不同估算模型结果比较 Table 3 Comparative results of different estimation models

图4 不同播种密度数据集估算结果
(a): D120; (b): D270; (c): D420
Fig.4 Estimation results by using different density datasets
(a): Dataset D120; (b): Dataset D270; (c): Dataset D420

从表中可以看出, 所有估算模型均对D120数据集有最优准确率, 其次是D270数据集, 而估算模型在D420数据集的准确率最低。 结果表明, 播种密度是影响基于可见光光谱的冬小麦苗期地上生物量估算准确率的重要因素之一。 随着播种密度的增加, 估算模型的准确率均出现下降。

在基于D120的估算结果中[图4(a)], PLSR的估算准确率最高, 其R2为0.897, RMSE为0.062 kg· m-2, 表明PLSR估算生物量数据与实测生物量数据间具有良好的相关关系。 在D270和D420的估算结果中[图4(b), (c)], PLSR同样取得了最高的准确率, 其R2分别为0.827 9和0.788 6, RMSE分别为0.072和0.079 1 kg· m-2。 随着播种密度的增加, 所有估算模型的准确率均出现下降, 而PLSR的准确率下降程度最小。 表明, PLSR能够充分利用可见光光谱特征, 实现冬小麦苗期地上生物量的准确估算。

3 结 论

基于冠层可见光图像, 开展了冬小麦苗期地上生物量估算研究。 利用冬小麦苗期冠层可见光图像数据, 提取了CC, ExG, ExR, ExGR, NGRDI, GLI, RGRI和RGBVI共8个可见光图像特征, 通过相关系分析, 选择了CC, ExG, ExGR, NGRDI和RGRI共5个与生物量实测数据相关性较高的特征。 基于选择的图像特征, 开展了冬小麦苗期地上生物量估算。 结果表明, 特征数量和播种密度是影响基于可见光光谱的冬小麦苗期地上生物量估算准确率的2个因素。 基于选择的5个图像特征CC, ExG, ExGR, NGRDI和RGRI, PLSR取得了最高估算准确率, 测试集R2为0.801 5, RMSE为0.078 8 kg· m-2。 基于构建的3个播种密度数据集, PLSR均取得了最优估算准确率, 其R2分别为0.897 0, 0.827 9和0.788 6, RMSE分别为0.062, 0.072和0.079 1 kg· m-2。 由此可见, 基于可见光光谱数据, 能够实现冬小麦苗期地上生物量的准确估算, 从而为冬小麦苗期田间管理提供参考。 后续研究可进一步探索图像采样区的自动提取方法, 同时也可将该方法和思路应用到其他作物长势参数的估算。

参考文献
[1] MAO Bo-hui, LI Min-zan, SUN Hong, et al(毛博慧, 李民赞, 孙红, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2017, 33(Supp. 1): 164. [本文引用:1]
[2] Eitel J U H, Magney T S, Vierling L A, et al. Field Crops Research, 2014, 159: 21. [本文引用:1]
[3] Schirrmann M, Hamdorf A, Garz A, et al. Computers and Electronics in Agriculture, 2016, 121: 374. [本文引用:2]
[4] Walter J, Edwards J, McDonald G, et al. Field Crops Research, 2018, 216: 165. [本文引用:2]
[5] Zhang L, Verma B, Stockwell D, et al. Expert Systems with Applications, 2018, 101: 213. [本文引用:3]
[6] CUI Ri-xian, LIU Ya-dong, FU Jin-dong(崔日鲜, 刘亚东, 付金东). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2015, 35(9): 2596. [本文引用:1]
[7] LIU Bing-feng, LI Jun, HE Jia, et al(刘冰峰, 李军, 贺佳, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2016, 47(3): 254. [本文引用:1]
[8] XU Xu, CHEN Guo-qing, WANG Liang, et al(徐旭, 陈国庆, 王良, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2015, 31(22): 169. [本文引用:1]
[9] Wang L, Zhou X, Zhu X, et al. Crop Journal, 2016, 4(3): 212. [本文引用:1]
[10] Rasmussen J, Ntakos G, Nielsen J, et al. European Journal of Agronomy, 2016, 74: 75. [本文引用:2]
[11] Gnyp M L, Bareth G, Li F, et al. International Journal of Applied Earth Observation and Geoinformation, 2014, 33(1): 232. [本文引用:1]
[12] Casadesús J, Villegas D. Journal of Integrative Plant Biology, 2014, 56(1): 7. [本文引用:2]
[13] González-Esquiva J M, Oates M J, García-Mateos G, et al. Computers and Electronics in Agriculture, 2017, 141: 15. [本文引用:1]
[14] Neumann K, Klukas C, Friedel S, et al. Plant, Cell and Environment, 2015, 38(10): 1980. [本文引用:1]
[15] Patrignani A, Ochsner T E. Agronomy Journal, 2015, 107(6): 2312. [本文引用:2]
[16] Bai G, Ge Y, Hussain W, et al. Computers and Electronics in Agriculture, 2016, 128: 181. [本文引用:1]
[17] Chung Y S, Choi S C, Silva R R, et al. Biomass and Bioenergy, 2017, 105: 207. [本文引用:1]
[18] Baresel J P, Rischbeck P, Hu Y, et al. Computers and Electronics in Agriculture, 2017, 140: 25. [本文引用:1]
[19] Woebbecke D M, Meyer G E, Von Bargen K, et al. Transactions of the American Society of Agricultural Engineers, 1995, 38(1): 259. [本文引用:1]
[20] Meyer G E, Hindman T W, Lakshmi K. Precision Agriculture and Biological Quality. 1998: 327. [本文引用:1]
[21] Meyer G E, Neto J C. Computers and Electronics in Agriculture, 2008, 62(2): 282. [本文引用:1]
[22] Gitelson A A, Kaufman Y J, Stark R, et al. Remote Sensing of Environment, 2002, 80(1): 76. [本文引用:1]
[23] Louhaichi M, Borman M M, Johnson D E. Geocarto International, 2001, 16(1): 65. [本文引用:1]
[24] WANG Xiao-qin, WANG Miao-miao, WANG Shao-qiang, et al(汪小钦, 王苗苗, 王绍强, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2015, 31(5): 152. [本文引用:1]
[25] Bendig J, Yu K, Aasen H, et al. International Journal of Applied Earth Observation and Geoinformation, 2015, 39: 79. [本文引用:1]
[26] Kusnierek K, Korsaeth A. Computers and Electronics in Agriculture, 2015, 117: 200. [本文引用:1]
[27] Wang L, Zhou X, Zhu X, et al. Crop Journal, 2016, 4: 212. [本文引用:1]
[28] Clevers J G P W, van der Heijden G W A M, Verzakov S, et al. Photogrammetric Engineering and Remote Sensing, 2007, 73(10): 1141. [本文引用:1]
[29] Breiman L. Mach. Learn, 2001, 45(1): 5. [本文引用:1]