双模态光谱技术对种田土壤金属元素和有机质检测分析
王嘉滢1, 朱雨婷1, 白浩1, 陈柯铭1, 赵艳茹1,2,3, 吴婷婷1,2,3, 马国明4, 余克强1,2,3,*
1.西北农林科技大学机械与电子工程学院, 陕西 杨凌 712100
2.农业农村部农业物联网重点实验室, 陕西 杨凌 712100
3.陕西省农业信息感知与智能服务重点实验室, 陕西 杨凌 712100
4.宁夏润丰种业有限公司, 宁夏 银川 750000
*通讯作者 e-mail: keqiang_yu@nwafu.edu.cn; yuke406336022@163.com

作者简介: 王嘉滢, 女, 2002年生, 西北农林科技大学机械与电子工程学院硕士研究生 e-mail: WangJY0819@nwafu.edu.cn

摘要

精准评估土壤质量是保障育种质量先决条件之一, 对评估种子品质和精准施肥具有指导意义。 土壤成分含量是土壤质量评估的重要指标, 光谱技术已经被证实可以快速、 绿色地进行土壤成分检测。 然而单一模态光谱技术难以满足种田多种土壤成分含量检测的需求。 故运用原子激光诱导击穿光谱(LIBS)和分子可见-近红外光谱(VIS-NIR)技术结合化学计量学方法, 对宁夏润丰种业育种玉米田采集的288份土壤样本进行分析, 建立金属元素和土壤有机质(SOM)含量的预测模型, 并实现金属元素和SOM含量空间可视化分布。 首先, 利用共线双脉冲LIBS系统采集土壤样本的LIBS数据, 利用air-PLS对光谱数据进行基线矫正以减少试验误差。 选择的金属元素特征谱线查找于美国国家标准与技术研究院(National Institute of Standards and Technology, NIST)的标准原子光谱数据库。 基于国家标准土样的LIBS光谱与其金属元素含量真实值, 建立4种金属元素(Na、 K、 Mg、 Mn)的偏最小二乘回归模型(PLSR), 其中Mn含量的预测效果最好, $R_{\mathrm{p}}^{2}$达到0.813, RMSEP为0.155 g·kg-1。 另一方面, 采集可见-近红外光谱数据后, 利用SG卷积平滑(SGCS)、 一阶导数变换、 多元散射矫正(MSC)对光谱数据进行预处理, 并分别建立SOM含量的PLSR预测模型对三种预处理方法进行评价, 经MSC预处理后所建立的PLSR模型效果最好; 随后利用蒙特卡洛交叉验证法(MCCV)剔除SOM含量异常样本。 利用竞争自适应重加权采样法(CARS)和连续投影算法(SPA)选择特征波长, 分别建立SOM含量的PLSR预测模型对两种算法进行评价; 得出利用CARS算法选择的特征波长建立的预测模型性能有所提高。 用CARS算法选择的特征波长与SOM含量真实值, 分别建立PLSR和反向传播人工神经网络(BPNN)预测模型, 其中PLSR模型的效果最好, $R_{\mathrm{p}}^{2}$达到0.864, RMSEP为0.612 g·kg-1, RPDv为2.733。 最后, 利用国家标准土样所建立的PLSR模型预测玉米种田四种金属元素含量, 建立PLSR模型预测值和BPNN模型预测值的空间分布图。 研究结果表明, LIBS技术和可见-近红外光谱定量分析技术可以对种田土壤金属元素和SOM含量检测, 为土壤成分含量的检测和空间可视化分布提供了参考价值并对土壤科学合理地施肥具有指导意义。

关键词: 土壤有机质; 金属元素; 激光诱导击穿光谱; 可见-近红外光谱; 化学计量学方法
中图分类号:S237 文献标志码:A
Detecting the Metal Elements and Soil Organic Matter in Farmland by Dual-Modality Spectral Technologies
WANG Jia-ying1, ZHU Yu-ting1, BAI Hao1, CHEN Ke-ming1, ZHAO Yan-ru1,2,3, WU Ting-ting1,2,3, MA Guo-ming4, YU Ke-qiang1,2,3,*
1. College of Mechanical and Electronic Engineering, Northwest A&F University, Yangling 712100, China
2. Key Laboratory of Agricultural Internet of Things, Ministry of Agriculture, Yangling 712100, China
3. Shaanxi Key Laboratory of Agricultural Information Perception and Intelligent Service, Yangling 712100, China
4. Ningxia Runfeng Seed Industry Co., Ltd., Yinchuan 750000, China
*Corresponding author
Abstract

Accurate evaluation of soil quality is one of the prerequisites for ensuring breeding quality, which is of guiding significance for evaluating seed quality and precise fertilization. Soil composition content is an important indicator of soil quality assessment; spectral technology has been proven to detect soil composition quickly and greenly. However, due to the limitations of different spectral excitation principles, single-spectral technology cannot meet the needs of multiple soil composition content detection in breeding fields. This study used laser-induced breakdown spectroscopy (LIBS) and visible-near-infrared spectroscopy (VIS-NIR) combined with intelligent algorithms to analyze 288 soil samples collected from the breeding corn field of Ningxia Runfeng Seed Industry. The prediction models of metal elements and soil organic matter (SOM) content were established, and the spatial visualization distribution of metal elements and SOM content was realized. The specific research is: (1) Detection of metal elements in the maize breeding field. After collecting LIBS spectral data using a collinear double pulse LIBS system, air-PLS was used to correct the baseline of the spectral data and reduce the experimental error. The selected characteristic spectral lines of metal elements were searched in the standard atomic spectrum database of the National Institute of Standards and Technology (NIST). Combined with the LIBS spectrum of national standard soil samples and the true value of metal element content, a partial least squares regression (PLSR) model of four metal elements (Na, K, Mg, Mn) was established in national standard soil samples. Among them, the prediction effect of Mn content was the best, $R_{\mathrm{p}}^{2}$ reached 0.813,RMSEP was 0.155 g·kg-1; (2) Detection of SOM in maize breeding field. After collecting visible-near infrared spectral data, the spectral data were preprocessed by Savitzky-Golay Convolution Smoothing (SGCS), first derivative transformation, and Multivariate Scattering Correction (MSC), and the PLSR prediction model of SOM content was established to evaluate the three pretreatment methods. The PLSR model established after MSC pretreatment was the best. Subsequently, Monte Carlo cross-validation (MCCV) was used to eliminate the samples of abnormal SOM content. Competitive Adaptive Reweighed Sampling (CARS) and Successive Projections Algorithm (SPA) were used to select the characteristic wavelengths, and the PLSR prediction models of SOM content were established to evaluate the two algorithms. It was concluded that the prediction model's performance, established by the characteristic wavelengths selected by the CARS algorithm, was improved. And the characteristic wavelengths selected by the CARS algorithm and the true value of SOM content were combined to establish PLSR and back propagation neural network (BPNN) prediction models. The PLSR model had the best effect, with $R_{\mathrm{p}}^{2}$ of 0.864, RMSEP of 0.612 g·kg-1, and RPDv of 2.733. (3) Spatial visualization distribution of metal elements and SOM content in maize breeding field. The PLSR model established by national standard soil samples was used to predict the content of four metal elements in the maize breeding field, and the spatial distribution map of predicted value content was established. Finally, the SOM content spatial distribution map of the real value, PLSR model predicted value, and BPNN model predicted value was established. The results show that LIBS technology and visible-near infrared spectroscopy quantitative analysis technology can detect the content of metal elements and SOM in the soil of the breeding field, which provides a reference value for the detection and spatial visualization distribution of soil component content.

Keyword: SOM; Metal element; Laser-induced breakdown spectroscopy; Visible-near-infrared spectroscopy; Chemometrics methods
0. 引言

育种是保障国家粮食安全的核心, 通过育种技术可以提高作物产量、 改善作物品质和增强作物抗逆性[1, 2]。 土壤是育种工作开展的前提, 土壤成分含量的检测是土壤质量评估的基础。 微量金属元素在植物生长过程中扮演着许多角色, 例如Na元素是植物细胞的渗透调节物质, K元素参与植物的光合作用、 促进糖分的运输, Mg元素参与叶绿体的光合作用, Mn元素是许多酶的活化剂[3, 4], 但这些金属元素的含量过高或过低都可能对作物的生长、 产量等产生影响。 土壤有机质(soil organic matter, SOM)是评估土壤质量的重要指标, 含有多种营养元素促进植物生长[5]。 绘制土壤成分空间分布图是精准农业的基础之一, 根据土壤成分在空间上的分布可以实现定量施肥[6]。 因此, 准确检测土壤中的金属元素和土壤有机质含量, 并绘制空间可视化分布图, 对确保高效高质量的育种, 准确评估种子品质和精准施肥具有重要的指导意义。

传统的土壤微量金属元素和SOM含量的检测方法分别是光学检测法、 化学分析法。 这些传统检测方法虽然准确度高, 但步骤繁琐、 需要复杂的样品预处理、 破坏性大、 实时性差、 周期长[7]。 因此, 随着精准农业的需求, 寻求快速和绿色的检测方法至关重要。

原子激光诱导击穿光谱(laser-induced breakdown spectroscopy, LIBS)能够得到待测物中原子、 离子受激发而发射特征谱线信息[7, 9], 用于物质元素成分的分析; 分子可见-近红外光谱(visible-near-infrared spectroscopy, VIS-NIR)技术能获取待测物内部分子官能团振动的合频或倍频信息[8], 进而分析得到样品中有机分子的特征结构和含量信息, 将这两种模态的光谱技术相融合可以实现对物质原子成分和分子结构的多方面检测。 Tavares等[9]对土壤中K、 Ca、 Mg含量进行预测, 其建立的预测模型性能较好, 结果表明, 通过LIBS技术可以同时定量分析多种土壤金属元素。 Chen等[10]对比了单脉冲(single pulse, SP)LIBS和双脉冲(double pulse, DP)LIBS对土壤中Cu、 Ni、 Pb含量的检测性能, 结果表明, 与SP-LIBS相比, DP-LIBS可以提高光谱信号和测量精度。 Li等[11]利用竞争自适应重加权采样法(competitive adaptive reweighed sampling, CARS)、 UVE、 连续投影算法(successive projections algorithm, SPA)、 联合区间偏最小二乘法(synergy interval partial least square, SiPLS)这4种单一方法和两两组合的6种方法来提取特征波长, 得到SiPLS-UVE为其SOM含量预测的特征波长提取最优模型, 结果表明经过特征波长提取的光谱数据用于建模可以提高模型精度。

本研究将双模态的原子LIBS和分子VIS-NIR光谱技术相结合, 再辅以化学计量学等算法, 旨在建立土壤样本的四种金属元素(Na、 K、 Mg、 Mn)含量与SOM含量的预测模型, 并实现土壤金属元素、 SOM含量空间可视化分布, 为土壤成分含量检测设备研发、 农业按需种植和科学施肥等提供技术支撑。

1 实验部分
1.1 土壤样本采集与制备

土壤样本采样区域为宁夏银川润丰种业公司试验田(宁夏, 青铜峡市, 38° 06'57″N、 106° 08'16″E), 地处西北内陆, 东部季风区与西部干旱区域的交汇地带, 属中温带大陆性气候, 年降水量177.8 mm, 年平均气温9.8 ℃, 土壤类型为黄土, 种植作物为玉米, 采样区域的中间地势相较于上下两侧偏低。 图1为试验田航拍图和采样点分布图。 采样时间为2023年11月, 采用棋盘式采样法采集土壤, 采样深度为距表层约20 cm左右, 单次采集土壤质量为1 kg。 在玉米不同生长期, 3次采样, 将采集的288份土壤样本在室内晾干、 去杂等步骤后均匀分成2份。 一份用于LIBS光谱数据采集; 一份经过4分法分成2份, 分别用于采集可见-近红外光谱数据和重铬酸钾容量法测定SOM含量。

图1 土壤采集试验田及采样点分布
(a): 试验田; (b): 采样点
Fig.1 Soil collection experimental field and distribution map of sampling points
(a): Experimental field; (b): Soil sampling points

在采集LIBS光谱数据前, 将土壤样本烘干、 过筛(100目)、 过滤、 研磨, 最后得到土壤基体粉末。 为进一步去除粉末中的水分, 将土壤基体粉末置于烘箱中80 ℃烘干6 h得到粉末土壤样本。 将粉末土壤样本重新研磨, 并在压片机30 MPa 压力下保持5 mins制得重量约3 g、 直径约25 mm、 厚度约3 mm的圆饼状土壤压片。 在采集可见-近红外光谱数据前, 将土壤样本过1 mm孔筛后, 置于直径75 mm、 深度为10 mm的培养皿中装满, 并用钢尺将其表面刮平。

1.2 试验装置和光谱数据获取

1.2.1 LIBS试验装置及数据采集

LIBS系统装置如图2(a)所示, 包括中阶梯光栅光谱仪ARYELLE 200(Lasertechnik Berlin, 德国)、 增强电荷耦合器件(intensified charge coupled device, ICCD)探测器、 激光器TINY-200L(卓镭激光有限公司, 北京)、 激光器NASOR-900(卓镭激光有限公司, 北京)、 X-Y-Z 3D样品移动平台(天津三英精密仪器股份有限公司, 天津)、 收集镜、 聚焦透镜、 计算机等。 开始测量前, 为确保光谱仪和ICCD探测器的正常工作, 需调整激光器的能量、 聚焦镜头的位置以及设定延时脉冲装置的时间延迟。 数据采集具体流程: 将土壤压片样本放置在LIBS系统的XYZ样品移动平台上, 将激光器产生的脉冲激光束聚焦到土壤压片样本上, 诱导样本表面产生等离子体, 等离子体发射出的光, 通过光谱仪分光后被ICCD探测器记录, 利用LTB Sophi软件处理采集到的光谱数据, 包括谱线的识别、 背景的校正、 谱线强度的测量, 以识别和量化土壤样本中的元素。

图2 光谱数据采集装置示意图
(a): LIBS光谱系统; (b): 可见-近红外光谱采集系统
Fig.2 Schematic diagram of spectral data acquisition devices
(a): LIBS device; (b): Visible-near-infrared spectral acquisition device

1.2.2 可见-近红外光谱试验装置及数据采集

可见-近红外光谱试验装置示意图如图2(b)所示。 为保证光谱数据的准确性, 开始测量前, 需对光谱采集系统预热15 mins, 并对仪器进行暗电流校正和白板校正, 在400~1 200 nm采样间隔为1.4 nm, 重采样间隔为1 nm。 删去两端噪声较大的光谱区间, 保留475~1 100 nm波段, 每个样本采集5次光谱数据后取平均值。

1.2.3 特征波长选择和预测模型构建

将采集的全谱用于建模会导致训练速度下降, 并且光谱数据可能出现信息冗余和光谱重叠, 从而影响模型的准确性[12]。 连续投影算法(SPA)是一种前向循环选择算法, 可以消除变量间共线性; 竞争自适应重加权采样法(CARS)是一种集成蒙特卡洛抽样和偏最小二乘回归模型(partial least square regression, PLSR)回归系数的降维算法, 可以对无信息变量进行有效去除[13, 14]。 CARS和SPA被广泛应用于光谱信息的数据降维。

偏最小二乘回归(PLSR)能够很好地从土壤光谱信息估测土壤的理化信息[15]。 反向传播人工神经网络(back propagation neural network, BPNN)是一种通过模仿人的神经元激活和传输过程对误差进行反向传播训练, 而输出结果按照前向传播的多层前馈网络[16]。 本研究将R2 (R-squared)、 RMSE (root mean square error) 和RPD (ratio of performance to deviation)作为评价指标。 其中R2越接近1, 模型的预测能力越好; RMSE值越低, 模型的预测准确性越高; 在土壤科学中, RPD值小于1.4的模型被认为不适合预测, RPD值在1.4到2之间的模型被认为具有良好的预测能力, 而RPD值大于2的模型被认为具有优秀的预测能力[12]

2 结果与讨论
2.1 土壤样本的描述性统计

用重铬酸钾容量法进行化学分析的288份样本的测量结果, 采用SPSS 27进行Shapiro-Wilk测试, 结果如图3所示。 土壤样本的SOM含量的范围为6.79~25.86 g· kg-1, 均值为15.70 g· kg-1, 标准差为2.82 g· kg-1, K-S检验值是0.212(p> 0.05), 表明SOM含量数据符合正态分布。 宁夏青铜峡市的SOM含量平均值为14.9 g· kg-1, 与之相比, 本研究的土壤样本的SOM含量平均值略高。

图3 土壤有机质含量的统计结果Fig.3 Statistical description of SOM content in soil

2.2 土壤样本的光谱数据处理

2.2.1 土壤样本的LIBS光谱预处理

为了抑制背景干扰和噪声的影响, air-PLS多次迭代优化过程, 逐步拟合出光谱数据中的信号成分[17], 在迭代过程中, 算法会根据当前基线估计对数据进行加权, 以增强信号与基线的区分度。 为了避免过拟合, air-PLS引入了惩罚函数, 使得基线估计更加平滑。

图4为土壤样本在300~800 nm的预处理前后的平均激光诱导等离子光谱曲线。 土壤样本的光谱在经过air-PLS基线矫正后的谱线变得平滑, 光谱数据中的背景干扰和噪声被很好地去除。

图4 LIBS平均光谱预处理前后的曲线Fig.4 LIBS average spectra before and after spectral pretreatment

2.2.2 土壤样本的可见-近红外光谱预处理

为降低仪器和环境噪声、 土壤样本中散射效应的影响, 采用SG卷积平滑(Savitzky Golay convolution smoothing, SGCS)、 一阶导数变换、 多元散射矫正(multivariate scattering correction, MSC)对光谱数据进行预处理。 图5(a)— (d)分别为475~1 100 nm的原始可见-近红外光谱反射曲线、 SG卷积平滑后的光谱曲线、 一阶导数变换后的光谱曲线、 MSC后的光谱曲线。 表1为不同光谱预处理方法的PLSR模型性能评价。

图5 原始光谱曲线和预处理后的光谱对比
(a): 原始可见-近红外光谱曲线; (b): SG卷积平滑; (c): 一阶导数变换; (d): 多元散射校正
Fig.5 The original spectral curve and the spectral curve after different pretreatment methods
(a): Raw visible-near-infrared spectral curves; (b): SG convolution smoothing; (c): The first derivative transformation; (d): MSC

表1 不同光谱预处理方法的PLSR模型性能评价 Table 1 Performance evaluation of PLSR models with different spectral preprocessing methods

表1可知, 3种光谱预处理方法均可以提高模型性能。 经过MSC预处理的光谱数据的PLSR模型效果最好。 一阶导数法可以增强光谱的细节特征, 但不可避免地会加大噪声; MSC通过调整光谱的基线和斜率, 使其更接近于无散射或最小散射的条件, 可以减少由样品的物理属性(如粒度、 包装密度等)引起的散射效应, 本研究将MSC预处理后的光谱数据作为后续可见-近红外光谱的特征波长选择的输入。

2.2.3 土壤样本SOM含量的异常值剔除

为了降低光谱数据采集和SOM含量值测定过程中的误差对建模的影响, 采用蒙特卡洛交叉验证法(Monte carlo cross validation, MCCV)剔除异常样本。 蒙特卡洛迭代次数设置为2000次, 训练集与验证集的比例设置为3∶ 1, 判定异常的阈值设置为1.0 g· kg-1, 采用SPXY法划分样本集, 并采用PLSR模型对训练集进行训练, 将平均预测误差作为模型性能评估指标, 将平均预测误差大于2 g· kg-1的样本视为异常样本, 共剔除25个异常样本, 如图6所示。

图6 288份土壤样本的平均预测误差值Fig.6 The average prediction error of 288 soil samples

2.3 土壤样本中的金属元素谱线选择

将NIST库的元素谱线信息和实际采集的4种金属元素(Na、 K、 Mg、 Mn)的光谱信息相结合, 根据谱线发射强度、 自发跃迁概率、 激发能、 高能级和低能级的简并度, 选取Na Ⅰ 589.59 nm、 K Ⅰ 769.89 nm、 Mg Ⅰ 518.36 nm、 Mn Ⅰ 445.30 nm为元素特征谱线, 图7为4种金属元素的特征谱线图。 分别将Na特征谱线附近589.26~589.92 nm、 K特征谱线附近769.70~769.99 nm、 Mg特征谱线附近518.17~518.62 nm、 Mn特征谱线附近445.10~445.65 nm范围内的谱线信号用于后续建模。

图7 Na、 K、 Mg、 Mn4种金属元素的特征谱线
Ⅰ 表示元素的原子谱线
Fig.7 Characteristic spectral lines of Na, K, Mg, and Mn
Ⅰ : atomic spectral lines

2.4 土壤样本的可见-近红外光谱的特征波长选择

为了提高建模效率, 降低模型复杂度, 采用CARS和SPA算法对475~1 100 nm的光谱数据进行特征波长选择。 将经过MCCV、 MSC后的光谱数据和SOM含量作为CARS算法的输入, 在第19次迭代时, 即RMSECV取最小值0.639时, 选择出77个特征波长用于后续预测模型建立。 图8(a)为CARS选择特征波长的分布。

图8 特征波长的分布
(a): CARS; (b): SPA
Fig.8 Distribution of characteristic wavelengths
(a): CARS; (b): SPA

将经过MCCV、 MSC处理后的光谱数据和SOM含量作为SPA算法的输入, 选择RMSE值最小的变量子集作为特征波长, 最终, 选择了479、 484、 488、 640、 811、 874、 996、 1 005、 1 013和1 045 nm共10个特征波长。 图8(b)为SPA选择特征波长的分布。

表2可知, 不同特征波长选择算法建立的模型效果: CARS> SPA> 未选择。 该结果与筛选出的特征波长数量相关, SPA选择的波长较少, 一定程度上剔除了原始光谱中部分相关性较多的信息, 使得SPA选择后建立的模型的均方根误差高于原始光谱建立的模型。 与SPA相比, CARS选择的波长较多且分布较为均匀, 保留了原始数据中绝大部分重要信息, 模型达到了更好的效果; 在500~780nm的可见光波段, 光谱的吸收受有机质特性、 Fe2+、 Fe3+和Mn3+的影响, 这些因素同时也对土壤的反射光强度有影响。 CARS算法在可见光波段也提取了一些波长。 将CARS算法选择的特征波长用于后续SOM含量的建模。

表2 不同特征波长提取算法的PLSR模型评价 Table 2 Evaluation of PLSR models based on different feature wavelength extraction algorithms
2.5 土壤样本金属元素和SOM含量预测模型的建立

2.5.1 土壤样本金属元素预测模型的建立和分析

选取已知元素真实含量的11个国家标准土壤样本, 将标准土样和种田土样经过统一的光谱预处理后, 在同一实验条件下采集LIBS光谱, 每一个标准土样测量20次LIBS光谱数据, 根据220组标准土样的4种金属元素特征谱线附近的数据和已测定的元素含量真实值建立PLSR预测模型。 将288个种田土壤样本的四种金属元素光谱数据分别作为利用国家标准土壤样本建立的PLSR模型的输入, 得到288个种田土壤样本的不同金属元素的预测值。 图9为标准土样的不同金属元素的PLSR模型结果。

图9 4种金属元素的PLSR预测模型结果
(a): Na; (b): K; (c): Mg; (d): Mn
Fig.9 PLSR prediction results for different metal elements
(a): Na; (b): K; (c): Mg; (d): Mn

2.5.2 土壤样本SOM预测模型的建立和分析

根据SOM含量真实值和CARS算法选择的77个特征波长分别建立PLSR、 BPNN模型。 将2份种田土壤样本按照3∶ 1划分为训练集和验证集。 对于PLSR模型, 将主成分因子数设置为5。 对于BPNN模型, 在MATLAB 2022b软件建立了3层人工神经网络, 经试验确定输入层、 隐含层、 输出层神经元分别为77、 18、 1, 将迭代次数和训练精度设置为1 000、 0.01, 建立BPNN模型。 由图10可知, PLSR预测模型效果较好。

图10 模型的预测结果
(a): PLSR模型; (b): BPNN模型
Fig.10 Prediction results of different models
(a): PLSR model; (b): BPNN model

对于PLSR模型, 其训练集样本点在高值区域内的样本存在不同程度的低估, 而其中值区域内的样本则能够大致地分布在直线y=x的两侧; 对于BPNN模型, 其训练集样本点在低值区域的样本存在不同程度的高估, 而其中高值区域内的样本则能够大致地分布在直线y=x的两侧。 这种问题的产生主要是因为SOM含量真实值的高值较少, 大部分样点SOM含量都位于中值区域, 因此模型在中值区域拟合的效果较低、 高值区域更好。

PLSR效果比BPNN好的原因主要是因为PLSR能够有效利用光谱数据中的关键信息, 并且对数据分布适应性较强, 其通过自动提取与目标变量最相关的潜在变量来平衡不同区间的样本, 从而提升模型的预测精度; BPNN对输入特征较为依赖, 并且对数据分布较为敏感, SOM含量样本分布不均, BPNN可能会过度拟合中值样本, 从而对低、 高值样本的预测效果较差。

2.6 土壤四种金属元素和SOM含量的空间可视化分布

将栅格地图图像转化为灰度图, 并通过阈值分割和轮廓检测来识别二维图像中标定的取样点并记录其坐标, 将288个取样点的预测值一一对应于二维地图上的288个取样点坐标, 随后在 MATLAB 2022b利用已知样本点的值和其与未采样点的空间关系, 构建克里金系统并求解, 用得到的权重对数据值进行插值(克里金插值), 绘制出不同金属元素预测值的分布图。 四种金属元素含量预测值的分布图如图11(a)— (d)所示。 同绘制金属元素含量预测值的分布图的方法, 绘制出SOM含量真实值、 PLSR预测值、 BPNN预测值的分布图, 如图11(e)— (g)所示。

图11 4种金属元素的PLSR模型预测值、 SOM含量真实值和PLSR、 BPNN模型预测值的空间可视化分布
(a): Na; (b): K; (c): Mg; (d): Mn; (e): SOM实测值; (f): SOM的PLSR模型预测值; (g): SOM的BPNN模型预测值; (h): 采样点分布
Fig.11 Spatial visualization distribution of the predicted values of PLSR model, true value of SOM content, and predicted values of PLSR and BPNN models of four metal elements
(a): Na; (b): K; (c): Mg; (d): Mn; (e): SOM true value; (f): Predicted SOM value by PLSR model; (g): Predicted SOM value by BPNN model; (h): Distribution of sample points

由图11(e)— (g)可知, 采样区域的SOM含量集中在14~18 g· kg-1, 采样区域上下两侧SOM含量总体偏低, 采样区域的左上方土壤颜色较深, SOM含量最高。 本研究的采样区域中间的地势相较于上下两侧较低, 而斜坡上的水流的侵蚀作用会导致SOM流失, SOM在斜坡上的积累通常少于平坦地区; 水分是影响SOM分解和植物生长的关键因素, 水分充足的地区通常有较高的植被生产力, 一定程度上可以增加SOM含量, 所以采样区域的中间位置可能因为水分较多而有较高的SOM含量。

3 结论

利用双模态LIBS技术和VIS-NIR分析技术, 对玉米种田土壤金属元素和土壤有机质进行了检测。 基于国家标准土壤样本的四种金属元素特征谱线数据和已知金属元素含量真实值, 建立四种金属元素的PLSR模型, 并利用建立的PLSR模型预测玉米种田土壤样本的四种金属元素含量值, 其中Mn元素预测效果最好, Rp2=0.813, RMSEP=0.155 g· kg-1。 基于土壤样本的可见-近红外光谱数据和SOM含量真实值, 利用SPA、 CARS算法选择特征波长, 然后, 利用CARS算法选择的特征波长分别建立PLSR、 BPNN预测模型, 其中PLSR模型的效果最好, Rp2=0.864, RMSEP=0.612 g· kg-1, RPDv=2.733。 最后, 实现了四种金属元素和SOM含量真实值、 PLSR预测值、 BPNN预测值的空间可视化分布。 本研究结果对土壤金属元素和SOM含量的检测方法提供了参考, 形象可视化种田土壤养分的分布情况, 为解决土壤元素缺失问题提供合理的施肥方案。

参考文献
[1] LU Ying(卢莹). Molecular Plant Breeding(分子植物育种), 2024, 22(14): 4810. [本文引用:1]
[2] QI Xue-li, CHEN Yan-yan, WANG Yong-xia, et al(齐学礼, 陈艳艳, 王永霞, ). Current Research Status and Development Suggestions for Advanced Breeding Technologies in China( 中国作物育种先进技术的研发现状与发展建议). Molecular Plant Breeding(分子植物育种), 2024, (1): https://link.cnki.net/urlid/46.1068.S.20240102.1707.020. [本文引用:1]
[3] Hauer-Jakli M, Tränkner M. Frontiers in Plant Science, 2019, 10: 766. [本文引用:1]
[4] WANG Ren-jie, ZHU Fan, LIANG Hui-zi, et al(王仁杰, 朱凡, 梁惠子, ). Acta Ecologica Sinica(生态学报), 2020, 40(6): 2019. [本文引用:1]
[5] Wood S A, Tirfessa D, Baudron F. Agriculture, Ecosystems & Environment, 2018, 266: 100. [本文引用:1]
[6] LI Min-zan, ZHENG Li-hua, AN Xiao-fei, et al(李民赞, 郑立华, 安晓飞, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2013, 44(3): 73. [本文引用:1]
[7] Ren J, Zhao Y, Yu K. Computers and Electronics in Agriculture, 2022, 197: 106986. [本文引用:2]
[8] LI Jin-chang, HE Hong-yuan, ZHAO Xue-jun, et al(李锦昌, 何洪源, 赵雪珺, ). Applied Chemical Industry(应用化工), 2022, 51(11): 3369. [本文引用:1]
[9] Tavares T R, Mouazen A M, Nunes L C, et al. Soil and Tillage Research, 2022, 216: 105250. [本文引用:2]
[10] Chen G, Yang G, Ling Z, et al. Analytical Methods, 2021, 13(12): 1502. [本文引用:1]
[11] Li C, Zhao J, Li Y, et al. Forests, 2021, 12(12): 1809. [本文引用:1]
[12] ZHANG Hai-liang, XIE Chao-yong, TIAN Peng, et al(章海亮, 谢潮勇, 田彭, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2023, 43(7): 2226. [本文引用:2]
[13] CHENG Jie-hong, CHEN Zheng-guang, ZHANG Qing-hua(程介虹, 陈争光, 张庆华). Journal of Agricultural Science and Technology(中国农业科技导报), 2020, 22(1): 162. [本文引用:1]
[14] Zhou W, Xiao J, Li H, et al. Journal of Soils and Sediments, 2023, 23(6): 2506. [本文引用:1]
[15] WANG Si-nan, LI Rui-ping, WU Ying-jie, et al(王思楠, 李瑞平, 吴英杰, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2022, 53(5): 332. [本文引用:1]
[16] AN Bai-song, WANG Xue-mei, HUANG Xiao-yu, et al(安柏耸, 王雪梅, 黄晓宇, ). Earth and Environment(地球与环境), 2023, 51(2): 246. [本文引用:1]
[17] Ren J, Yang Z H, Zhao Y R, et al. Optics Express, 2022, 30(21): 37711. [本文引用:1]