改进的QGA-ELM算法水稻叶面积指数反演模型
苏中滨, 陆艺伟, 谷俊涛, 高睿, 马铮, 孔庆明*
东北农业大学电气与信息学院, 黑龙江 哈尔滨 150030
*通讯作者 e-mail: kkqqmmmm@126.com

作者简介: 苏中滨, 1965年生, 东北农业大学电气与信息学院教授 e-mail: 1248153626@qq.com

摘要

为了通过植被指数(VI)准确、 可靠的获取不同施肥梯度、 不同品种的水稻叶面积指数(LAI), 提出了一种基于改进的QGA-ELM算法应用于水稻LAI反演。 首先通过8折交叉验证确定极限学习机(ELM)最佳的隐含层神经元个数与隐含层激活函数类型, 再通过引入组合动态旋转角策略、 单点混沌交叉操作、 混沌变异操作、 确定性选择策略、 量子灾变操作对量子遗传算法(QGA)进行改进, 最后使用改进后的QGA算法优化ELM神经网络输入层到隐含层的连接权值和隐含层的阈值。 为了验证该模型普适性和有效性, 依次建立多元线性回归、 BP、 ELM、 QGA-ELM、 改进的QGA-ELM算法5种模型, 并在不同数据集上进行反演效果比较, 结果表明: (1)对比QGA-ELM算法和改进的QGA-ELM算法进化过程, 改进的算法能有效提升模型寻优能力, 避免算法早熟, 且能寻得更优结果。 (2)对比五种算法在不同数据集上的反演效果, 验证了NDVI, RVI与LAI之间主要为非线性关系, 且ELM神经网络模型反演效果要优于BP神经网络模型和多元线性回归模型。 (3)对比五种算法在不同数据集上的反演效果, 改进的QGA-ELM算法绝大部分情况下拥有最高的反演精度和最低的误差, 改进后的算法反演精度得到了明显提升, 泛化性能也得到了增强。 (4)改进的QGA-ELM算法在各种施肥梯度上均具有最高反演精度和最低误差, 且精度较高, 能为不同生长状况水稻LAI反演提供依据。 (5)五种模型对庆和香LAI反演精度均要高于龙稻18, 而改进的QGA-ELM算法在不同水稻品种上依然具有较高的反演精度, 且在不同水稻品种上反演精度相差极小, 远低于其他四种模型, 能很好适应不同水稻品种LAI反演要求, 极大提升模型的稳定性性, 为不同水稻品种反演提供参考意义。

关键词: 改进的QGA-ELM算法; 叶面积指数反演; 施肥梯度; 水稻品种
中图分类号:S431.11 文献标志码:A
Research on Rice Leaf Area Index Inversion Model Based on Improved QGA-ELM Algorithm
SU Zhong-bin, LU Yi-wei, GU Jun-tao, GAO Rui, MA Zheng, KONG Qing-ming*
Academy of Electric and Information, Northeast Agricultural University, Harbin 150030, China
*Corresponding author
Abstract

In order to accurately and reliably obtain LAI of rice of different fertilization gradients and varieties through vegetation index (VI), an improved QGA-ELM algorithm was proposed in this paper for LAI inversion of rice. This model firstly determined by 8 fold cross-validation extreme learning machine (ELM) optimal number of neurons in the hidden layer and hidden layer activation function types, and by introducing a dynamic rotation Angle combination strategy, single point chaos crossover operation and mutation operation, deterministic selection strategy, quantum catastrophe operations to improve the quantum genetic algorithm (QGA), finally using the improved QGA ELM algorithm optimization neural network input layer to hidden layer connection weights and threshold of the hidden layer. In order to validate the model, this paper, in turn, to establish multiple linear regression, BP, ELM, QGA-ELM, improved QGA-five ELM algorithm model, and compared the inversion effect on different data sets, the results show that: (1) Compare the QGA-ELM evolution algorithm and the improved QGA-ELM algorithm, in this paper, the improved algorithm can enhance the searching capability model and avoid precocious, algorithm and can find better results. (2) By comparing the inversion effects of five algorithms on different data sets, it is verified that the relationship between NDVI, RVI and LAI is mainly non-linear, and the inversion effect of ELM neural network model is better than that of BP neural network model and multiple linear regression model. (3) By comparing the inversion effects of the five algorithms on different data sets, the improved QGA-ELM algorithm in this paper has the highest inversion accuracy and the lowest error in most cases, and the improved algorithm has significantly improved the inversion accuracy and generalization performance. (4) The improved QGA-ELM algorithm has the highest inversion accuracy and the lowest error in all fertilization gradients, and the accuracy is higher, which can provide a basis for LAI inversion of rice under different growth conditions. (5) Five model for Qinghexiang LAI inversion precision are higher than the dragon rice 18, and the improved QGA-ELM algorithm on different rice varieties still has high inversion accuracy, and the inversion precision tiny difference on different rice varieties, is far lower than the other four kinds of models, can adapt to different rice varieties LAI inversion requirements, greatly improve model stability, provide a reference for different rice varieties of inversion.

Keyword: Improved QGA-ELM algorithm; Leaf area index inversion; Fertilizer gradient; Rice varieties
引言

叶面积指数(leaf area index, LAI)是作物生长监测的主要变量[1], 精确估算LAI可以为农作物的病虫害监测、 作物长势监测、 生物量估算以及作物估产提供重要依据[2]。 传统测量方法主要采用人工实地测量, 存在较多局限性[3]。 现阶段逐步使用NDVI、 RVI等与作物LAI相关度较高的植被指数(vegetation index, VI)进行反演研究[4]

目前, 常用的LAI反演方法有线性回归、 幂函数回归、 指数函数回归[4, 5, 6]。 但这些模型通常无法很好表现VI与LAI之间的非线性关系。 近年来, 随着人工智能的快速发展, 越来越多的智能算法应用到作物的LAI反演模型中, 并且能够很好的处理VI与LAI的非线性关系。 张宏鸣等[7]使用支持向量机(support vector machine, SVM)反演夏玉米LAI, 姚雄等[8]使用随机森林模型(random forest, RF)对林地LAI进行遥感估算, Wang等[9]使用BP神经网络(back propagation neural network, BPNN)估算不同生长阶段玉米LAI。 以上智能算法虽然都取得较高反演精度, 但也存在一些不容忽视的问题。 RF不能够做出超越训练集数据范围的预测, 还会因为某些特定噪声出现过度拟合[10]。 SVM核函数参数以及参数惩罚项的选择、 优化均对结果产生很大的影响[11]。 BP神经网络需要大量的训练样本, 且容易陷入局部最优, 训练速度慢[12]

鉴于以上问题, 拟寻找一种新的模型对作物LAI进行反演。 极限学习机(extreme learning machine, ELM)是一种单隐含层前馈型神经网络, 具有高效处理非线性数据回归问题等优点, 克服了一般神经网络学习速度慢, 易产生过拟合的问题[13], 目前尚未应用到作物LAI反演模型中。 量子遗传算法(quantum genetic algorithm, QGA)是量子计算与遗传算法相结合的产物, 是一种新发展起来的概率进化算法, 相对传统进化算法拥有更好的寻优效果[14]。 由于ELM神经网络输入层到隐含层连接权值以及隐含层阈值均是随机产生, 容易造成模型泛化能力不足、 稳定较差的问题; 其次, 为了进一步提升QGA算法的寻优能力, 对QGA算法引入组合动态旋转角策略及单点混沌交叉操作、 混沌变异操作、 确定性选择策略、 量子灾变操作。 最后使用改进的QGA算法优化ELM神经网络输入层到隐含层连接权值及隐含层阈值, 构建改进的QGA-ELM反演模型, 以此提升模型的反演精度、 泛化性能以及稳定性。

1 实验部分
1.1 田间试验方案

试验始于2018年5月, 地点为黑龙江省庆安县久宏现代农业园区, 试验区分为二块大田, 每块大田24个试验小区, 各小区间隔离处理, 分别种植庆和香和龙稻18两个品种。 针对每一水稻品种, 分别安排4种氮素肥料梯度, 各重复6次, 其中4种肥料梯度分别为: N0(0%-0 kg· ha-1)、 N1(50%-50kg)、 N2(100%-100 kg· ha-1)、 N3(150%-150 kg· ha-1), 结合氮素在水稻中的含量表现分别为: 严重缺少、 缺少、 适量、 过量4种情况; 分别在返青期、 拔节期和抽穗始期按40%, 30%和30%均匀施入各小区。 钾肥在拔节期和抽穗期分两次等量(共计75 kg· ha-1)均匀施入各小区。 各试验小区除施肥水平外, 所有管理模式同大田一致, 且试验期间无严重病虫害、 旱涝等极端灾害, 水稻处于完全自然生长。

1.2 试验数据的获取

数据采集范围为48个试验小区, 采集时间分别为2018年6月15日、 7月7日、 7月26日、 8月16日, 对应于水稻的返青分蘖期、 拔节孕穗期、 抽穗开花期、 灌浆结实期。 每次采集的试验数据分别为水稻的叶面积指数(LAI)和植被指数(NDVI, RVI)。 具体采集方法为:

分别在48个试验小区内设定一个100 cm× 100 cm的样方, 记录样方中的水稻株数。 再在每个样方中随机选取3株粳稻, 记录每株水稻的叶片总数和叶子的叶长、 叶宽信息, 用于计算单株水稻的叶面积。 最后, 计算出LAI值。 计算公式如式(1)

LAI=0.75ρi=1mj=1n(LijBij)m(1)

其中, 0.75为修正系数, ρ 为水稻种植密度, m为样方内的水稻植株数量, n为每株水稻的叶片数, Lij为水稻叶片长度, Bij最大叶宽。

与此同时, 在每一个样方中均匀采集30个水稻冠层叶片, 使用南京农业大学CGMD-402主动光源设备获取叶片中部NDVI和RVI值, 并分别取其平均值作为一个试验小区中有效NDVI和RVI值。

2 QGA算法的改进
2.1 使用组合动态旋转角策略

传统量子遗传算法使用固定大小旋转角, 且旋转角方向确定均通过查表比较实现, 这样就会造成算法后期寻优结果不稳定, 还会极大增加算法执行时间, 致使算法收敛速度和寻优效果均不理想。 因此, 为加快算法执行速度, 舍弃查找表, 直接通过比较当前二进制解与最优二进制解来确定旋转角大小以及旋转角方向。 定义二进制位角度如式(2)

θi=0xi=00.01πxi=1(2)

其中xi表示二进制解x中第i位的数值, θ i则表示该二进制位对应的角度。 旋转角定义如式(3)

Δθi=kθbesti-θi(3)

式(3)中, θ bestiθ i分别表示最优二进制解、 当前解中第i位对应的角度, k为调整系数, 定义如式(4)

k=1-nN×f(best)f(x)(4)

式(4)中, N为最大进化代数, n为当前进化代数, f(best)为最优解适应度值, f(x)为当前解适应度值。 f(best), f(x), n, N> 0。

2.2 引入混沌操作

由于生物进化是随机性加反馈, 且生物进化的随机性是由系统内部因素引起, 而不是外在环境的随机扰动所造成, 而混沌系统在其混沌域中表现为随机性, 它是确定系统内部随机性的反应, 不同于外在的随机特性[15]。 故将混沌操作加入到进化算法能有效改善算法寻优效果。 首先, 使用Logistic混沌序列x(n+1)=4x(n)(1-x(n)), n=0, 1, 2, …, N-1为每一代产生一个混沌值, 其中x(0)为一个(0, 1)上的随机数, 然后按混沌序列确定每代交叉位置, 并按适应度排序后相邻两个个体进行交叉操作, 构成单点混沌交叉。 最后, 设定变异率和随机阈值, 由混沌序列和随机阈值确定每代是否变异, 并由变异率确定变异个数, 随机生成变异位置, 翻转相应量子比特位完成变异操作, 构成混沌变异。

2.3 引入确定性选择策略

将原始种群Q、 经过量子旋转门旋转后的种群Q1、 再经单点混沌交叉后的种群Q2、 再经混沌变异后的种群Q3合并一起, 从中挑选出k个适应度最高的个体作为新的种群Q'参与下一代进化, 其中k为原始种群大小。

2.4 加入量子灾变操作

当种群连续进化5代最优解不变时, 将种群中适应度最小的k/2个个体进行随机重新生成, 其中k为原始种群大小, 以此达到对种群施加大的扰动效果, 增大种群寻得全局最优解的可能性。

综上, 改进的QGA-ELM算法流程如图1所示。

图1 改进的QGA-ELM算法流程图Fig.1 Flowchart of improved QGA-ELM algorithm

3 改进的QGA-ELM算法应用实例
3.1 交叉验证确定ELM网络拓扑结构

从192组数据中随机选择3/4数据作为训练集, 剩余1/4数据作为测试集, 由此得到训练集数据144组, 测试集数据48组。 再将192组数据按照施肥梯度进行划分, 分别为N0, N1, N2, N3各48组, 各占1/4。 再将192组数据按照水稻品种进行划分, 庆和香、 龙稻18各96组, 各占1/2。 经过以上划分, 分别组成训练集和测试集、 不同施肥梯度数据集合, 不同水稻品种数据集三种数据集, 供后面模型使用。 其中NDVI和RVI对应模型的输入, LAI对应模型的输出。 为了减少变量差异较大对模型性能的影响, 本文所有数据仿真前均进行了归一化操作, 仿真后均进行相应反归一化操作。

选取8折交叉验证方法, 其中隐含层节点个数设置为1到128, 隐含层激活函数分别设置为“ Sigmoidal” , “ Sine” 及“ Hardlim” 。 分别绘制隐含层节点个数与RMSE均值图、 隐含层节点个数与R2均值图如图2所示。

图2 隐含层节点个数与RMSE均值、 隐含层节点个数与R2均值Fig.2 Number of nodes in hidden layer vs mean values of RMSE and R2

从图2中可以看出, 隐含层函数为“ Hardlim” 的网络结构RMSE和R2均值均要优于“ Sigmoidal” , “ Sine” , 故隐含层函数选择“ Hardlim” 。 其次, 当隐含层函数为“ Hardlim” 时, RMSE值随隐含层节点个数波动极小, 忽略不计, 故直接取R2最大时隐含层对应的节点数。 由此, ELM神经网络最优的隐含层函数为“ Hardlim” , 最优的隐含层节点数为31。 此时R2, RMSE平均值分别为0.551 37, 1.119 8。

3.2 QGA-ELM算法和改进的QGA-ELM算法进化过程比较

分别执行改进的和未改进的QGA-ELM算法各10次, 并各取两者进化适应度最高的一次进化过程绘制图3, 其中适应度为8折交叉验证R2均值。

图3 进化过程对比图Fig.3 Comparison of evolutionary processes

从图3中给出的进化折线可以看出, 未经改进的QGA-ELM算法寻得最优适应度为0.693 8, 而改进的QGA-ELM算法寻得最优适应度为0.747 6, 寻优效果提升了7.75%↑ , 且进化过程中适应度的变化次数要多于未经改进的算法, 由此说明改进的算法能有效提升模型寻优能力, 避免算法早熟, 降低了模型陷入局部最优的概率, 且能寻得更优结果, 具有较高实用价值。

3.3 不同数据集上反演效果比较

为了检验改进的QGA-ELM模型的普适性和有效性, 依次建立多元线性回归、 BP、 ELM、 QGA-ELM、 改进的QGA-ELM五种模型, 并在不同数据集上进行反演效果比较, 其中多元线性回归参数方程为: LAI=-0.41-1.20NDVI+2.65RVI, BP采用单隐层结构, 隐层节点个数通过经验公式确定范围, 再通过交叉验证确定为7, 输入层到隐层、 隐层到输出层传递函数分别“ tansig” 、 “ purelin” , 最大迭代次数为2 000, 误差设定为0.000 01。

在图4中, 首行与第二行分别为五种模型在训练集、 测试集上的反演效果。 说明: (1)五种模型中, 无论是在训练集还是测试集上, 改进的QGA-ELM算法均拥有最高的反演精度和最低的误差。 (2)经QGA算法优化的ELM反演模型反演精度得到了很大提高, 而改进的QGA算法相对于未改进的QGA算法反演精度又得到了一定提高, 改进的QGA-ELM算法能够有效提升模型精度。 (3)BP模型和三种ELM模型在训练集和测试集上的反演精度均要高于多元线性回归模型, 说明VI与LAI之间存在较强非线性关系而非线性关系。 (4)在训练集上, 改进的QGA-ELM反演模型R2为0.781 9, RMSE为0.793 4, 在测试集上的R2为0.586 7, RMSE为1.057 2, 说明改进的反演模型拥有较高反演精度和较低误差以及较强的范化能力。

图4 训练集、 测试集反演效果比较Fig.4 Comparison of inversion results of training set and test set

在图5中, 四行分别为五种模型在水稻严重缺氮(N0)、 缺氮(N1)、 适量(N2)、 过量(N3)四种情况下的反演效果图。 由图5可知, 三种ELM模型在不同施肥梯度上的反演精度均整体上要高于多元线性回归和BP神经网络模型, 改进的QGA-ELM反演模型反演精度均要高于其他四种反演模型, 反演误差均要低于其他四种模型, 说明改进的QGA-ELM反演模型不仅精度得到了提高, 普适姓也得到了加强, 能为不同生长状况水稻LAI反演提供参考意义。

图5 不同施肥梯度反演效果比较Fig.5 Comparison of inversion effects of different fertilization gradients

在图6中, 第一行第二行分别为五种模型对庆和香、 龙稻18两品种的反演效果图。 由图6可知, (1)三种ELM模型在不同水稻品种上的反演精度均要高于多元线性回归和BP神经网络, 误差均要低于多元线性回归和BP神经网络, ELM算法在不同水稻品种上反演效果要优于多元线性回归和BP神经网络。 (2)前4种模型对庆和香LAI反演精度均要高于龙稻18, 误差均要低于龙稻18, 且差距明显, 说明不同算法反演精度对于水稻品种依赖过大, 实际应用中容易出现反演结果不稳定等情况, 而改进的QGA-ELM模型在两类水稻品种上反演精度相差极小, 且在庆和香上反演精度仅仅略低于QGA-ELM模型, 而在龙道18上远高于其他4中模型, 极大提升模型的普适性, 为不同水稻品种反演提供参考意义。

图6 不同水稻品种反演效果比较Fig.6 Comparison of inversion results of different rice varieties

4 结论

(1)验证了NDVI, RVI与LAI之间主要为非线性关系, 且ELM神经网络模型反演效果要优于BP神经网络模型和多元线性回归模型。 (2)改进的QGA-ELM算法多数情况下拥有最高的反演精度和最低的误差, 改进后的算法反演精度得到了明显提升, 泛化性能得到了增强。 (3)改进的QGA-ELM算法在各种施肥梯度上均具有最高反演精度和最低误差, 且精度较高, 能为不同生长状况水稻LAI反演提供依据。 (4)五种模型对庆和香LAI反演精度均要高于龙稻18, 而改进的QGA-ELM算法在不同水稻品种上依然具有较高的反演精度, 且在不同水稻品种上反演精度相差极小, 远低于其他四种模型, 能很好适应不同水稻品种LAI反演要求, 极大提升模型的稳定性性, 为不同水稻品种反演提供参考意义。

参考文献
[1] Qiao Kun, Zhu Wenquan, Xie Zhiying, et al. Remote Sensing, 2019, 11(6): 16. [本文引用:1]
[2] CHEN Zhong-xin, REN Jian-qiang, TANG Hua-jun, et al(陈仲新, 任建强, 唐华俊, ). Journal of Remote Sensing(遥感学报), 2016, 20(5): 748. [本文引用:1]
[3] ZHANG Man, MIAO Yan-long, QIU Rui-cheng, et al(张漫, 苗艳龙, 仇瑞承, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2019, 50(6): 12. [本文引用:1]
[4] Yu Yuanhe, Wang Jinliang, Liu Guangjie, et al. Journal of the Indian Society of Remote Sensing, 2019, 47(6): 967. [本文引用:2]
[5] Sha Zongyao, Wang Yuwei, Bai Yongfei, et al. Journal of Plant Ecology, 2019, 12(3): 395. [本文引用:1]
[6] WU Wei-bin, LI Jia-yu, ZHANG Zhen-bang, et al(吴伟斌, 李佳雨, 张震邦, ). Transactions of the Chinese Society for Agricultural Engineering(农业工程学报), 2018, 34(3): 195. [本文引用:1]
[7] ZHANG Hong-ming, LIU Wen, HAN Wen-ting, et al(张宏鸣, 刘雯, 韩文霆, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2019, 50(5): 251. [本文引用:1]
[8] YAO Xiong, YU Kun-yong, YANG Yu-jie, et al(姚雄, 余坤勇, 杨玉洁, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2017, 48(5): 159. [本文引用:1]
[9] Wang Lei, Wang Pengxin, Liang Shunlin, et al. Computers and Electronics in Agriculture, 2019, 160(3): 82. [本文引用:1]
[10] WANG Xuan-hui, ZHENG Xi-lai, HAN Zhong-zhi, et al(王轩慧, 郑西来, 韩仲志, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2018, 38(12): 3883. [本文引用:1]
[11] FU Cheng-hong, YANG Shu-min, ZHANG Yang(傅成红, 杨书敏, 张阳). Journal of Transportation Systems Engineering and Information Technology(交通运输系统工程与信息), 2019, 19(4): 130. [本文引用:1]
[12] LIU Fang, XU Long, MA Xiao-xun(刘方, 徐龙, 马晓迅). Chemical Industry and Engineering Progress(化工进展), 2019, 38(6): 2559. [本文引用:1]
[13] Huang G B, Zhu Q Y, Siew C K. Neurocomputing, 2006, 70(1-3): 489. [本文引用:1]
[14] MA Chun-hui, YANG Jie, CHENG Lin, et al(马春辉, 杨杰, 程琳, ). Rock and Soil Mechanics(岩土力学), 2019, 40(6): 2397. [本文引用:1]
[15] WU Xiang-xing, CHEN Zhong(吴祥兴, 陈忠). Introduction to Chaos(混沌学导论). Shanghai: Scientific & Technical Publishers(上海: 上海科学技术出版社), 1996. 21. [本文引用:1]