不同粒径对土壤有机质含量可见-近红外光谱预测的影响
钟翔君1,2, 杨丽1,2,*, 张东兴1,2, 崔涛1,2, 和贤桃1,2, 杜兆辉1,2
1.中国农业大学工学院, 北京 100083
2.农业农村部土壤-机器-植物系统技术重点实验室, 北京 100083
*通讯作者 e-mail: yangli@cau.edu.cn

作者简介: 钟翔君, 1995年生,中国农业大学工学院博士研究生 e-mail: xjzhong1004@163.com

摘要

土壤有机质(SOM)是表征土壤肥力的重要指标, 实现其快速准确检测可为精准农业区域管理提供有效的数据支撑。 土壤粒径对SOM的光谱预测及仪器开发有很大的影响, 为了明确不同粒径对SOM预测的影响, 分别制备了1~2, 0.5~1, 0.25~0.5, 0.1~0.25和<0.1 mm五种均匀粒径及<1 mm混合粒径共计6种粒径土样并进行了可见-近红外(300~2 500 nm)光谱数据采集。 采用蒙特卡罗交叉验证分别剔除了不同粒径的异常样本, 结合Savitzky-Golay卷积平滑法对光谱数据进行平滑去噪处理, 比较了不同粒径样品的光谱反射率差异, 并对平滑后的原始光谱R进行倒数IR、 对数LR、 一阶导数FDR等3种光谱变换并分析与SOM含量的相关性, 基于竞争性自适应重加权算法(CARS)对光谱数据进行了特征波长提取, 并结合偏最小二乘回归(PLSR)分别建立了相应的SOM含量预测模型。 结果表明, 不同粒径土样的平均光谱反射率与变异系数随着粒径的减小逐渐增加, 且在大于540 nm波长范围内, 差异明显。 随着粒径的减小, SOM含量与光谱反射率在全波段范围的相关性变化幅度愈加明显, FDR变换可明显改变全波段范围与SOM含量的相关性。 通过CARS算法对FDR变换后的光谱数据进行特征波长提取, 筛选出特征波长数为全波段数量的13.1%, 降低了光谱数据重叠及无效信息干扰。 对比不同SOM预测模型的结果, FDR变换光谱的建模精度较好, 且粒径越小其模型的效果越好, 特别在粒径<0.1 mm时, 模型的$R^{2}_{p}$达到0.91, RMSEP为2.20 g·kg-1, RPD为3.33。 基于CARS特征变量构建的SOM含量预测模型中, 粒径<0.1 mm预测模型的效果最好, $R^{2}_{p}$为0.78, RMSEP为3.00 g·kg-1, RPD为2.00, 可以实现SOM含量的可靠预测, 且其他粒径下的模型仍有可优化的空间。 该研究可以为实现SOM田间动态预测及仪器设计提供理论及模型参考。

关键词: 土壤有机质; 粒径; 可见-近红外光谱; 竞争性自适应重加权算法; 偏最小二乘回归
中图分类号:S153.6 文献标志码:A
Effect of Different Particle Sizes on the Prediction of Soil Organic Matter Content by Visible-Near Infrared Spectroscopy
ZHONG Xiang-jun1,2, YANG Li1,2,*, ZHANG Dong-xing1,2, CUI Tao1,2, HE Xian-tao1,2, DU Zhao-hui1,2
1. College of Engineering, China Agricultural University, Beijing 100083, China
2. Key Laboratory of Soil-Machine-Plant System Technology of Ministry of Agriculture and Rural Affairs, Beijing 100083, China
*Corresponding author
Abstract

Soil organic matter is an important indicator that characterizes soil fertility information, and realizing its rapid and accurate detection can provide effective data support for precision agriculture regional management. The particle size of the soil has a great influence on the spectrum prediction of SOM content and instrument development. To analyze the impact of different particle sizes on SOM prediction, five soil samples with the uniform particle size of 1~2, 0.5~1, 0.25~0.5, 0.1~0.25, <0.1 mm, and mixed particle sizes of <1 mm were prepared, and the visible-near infrared (300~2 500 nm) spectral data was collected. Monte Carlo cross-validation was used to eliminate abnormal samples of different particle sizes, and the spectral data were smoothed and de-noised by the Savitzky-Golay convolution smoothing method. The spectral reflectance differences of samples with different particle sizes were compared, and three spectral transformations were performed on the smoothed original spectrum R, including reciprocal IR, logarithmic LR, and first derivative FDR. The correlation between SOM content and the reflectance of different transformed spectra was analyzed. The characteristic wavelength of the FDR transformed spectral data was extracted based on the Competitive Adaptive Reweighted Sampling (CARS) algorithm. Moreover, combined with the partial least squares regression (PLSR) to establish the corresponding prediction models of SOM content. The results show that the average spectral reflectance and coefficient of variation of soil samples with different particle sizes gradually increase with the decrease of particle size, and the difference is obvious in the wavelength range greater than 540 nm. With the decrease in particle size, the correlation between SOM content, particle size, and spectral reflectance in the whole band range become more obvious. FDR transformation can significantly change the correlation between SOM content and spectral reflectance. The CARS algorithm was used to extract the characteristic wavelengths from the FDR transformed spectral data, and the number of characteristic wavelengths was screened out and reduced to 13.1% of the total number of bands, which reduced the overlap of spectral data and the interference of invalid information. Comparing the results of different SOM prediction models, the FDR transformed spectrum had good modeling accuracy. Especially when the particle size was less than 0.1 mm, the model's $R^{2}_{p}$, RMSEP and RPD value was 0.91, 2.20 g·kg-1, and 3.33. Among the SOM content prediction models constructed based on CARS characteristic variables, the prediction model with particle size <0.1 mm has the best effect. Its $R^{2}_{p}$ reached 0.78, RMSEP was 3.00 g·kg-1, and RPD was 2.00, which can achieve reliable prediction of SOM content, and there is still room for optimization of models under other particle sizes. This research can provide a reference for the rapid and accurate prediction of SOM content in the field environment and the design of instruments.

Keyword: Soil organic matter; Particle sizes; Visible-near infrared spectroscopy; Competitive adaptive reweighted sampling; Partial least squares regression
引言

土壤有机质(soil organic matter, SOM)是表征土壤肥力的关键参数, 根据SOM含量进行变量播种[1, 2, 3, 4]或其他土壤改良作业对于挖掘土壤潜力、 提高作物产量[5, 6]具有重要意义。 传统以野外采样及实验室化学分析为主的SOM检测方法精度高, 但工作量大, 成本高, 检测效率低, 不适于精准农业大区域、 快速高效检测的需求[7]。 近年来, 可见光-近红外光谱分析技术因其无损、 简便、 高效等特点, 在估测SOM含量的研究探索上得到快速发展, 是土壤特性信息获取和研究的热点。

国内外许多学者对SOM与反射光谱之间的关系[8]、 光谱预处理方法[9, 10]及模型构建方法[11, 12]开展较多研究, 以实现SOM含量的高精度快速预测。 Dhawale等[13]通过对不同质地和有机质含量的土样近红外光谱进行数学变换和建模分析, 基于偏最小二乘回归(partial least squares regression, PLSR)建立了预测质地和有机质含量的光谱校准方法。 Mouazen等[14]通过对反射率数据进行不同预测模型的精度对比, 并确定了该土壤类型下预测效果最佳的模型。 Dotto等[15]比较了九种模型在七种不同预处理方法下的SOM预测精度。 于雷等[16]分析了不同形式的变换光谱与SOM含量的相关性, 确定连续统去除和PLSR建立的预测模型具有显著的预测效果。

为了适应精准农业土壤信息高效获取的要求, 需要针对田间复杂的作业环境开展SOM含量动态检测的研究, 并开发适于动态作业的SOM检测仪器。 由于土壤的光谱特性是多种土壤属性交互的综合反映, 土壤粒径会对光谱反射率产生很大影响[17], 进而影响田间SOM含量的动态获取, 为仪器的开发增加了难度。 但目前尚未有统一土壤粒径标准进行光谱预测, 通常为了获取较好的模型预测效果, 在测量光谱之前, 先将采集的土壤经过不同的处理[18, 19], 如经2 mm或1 mm网筛筛分后制备待测样本, 以降低土壤粒径对不同土壤属性预测的影响, 但不同土壤处理标准得到的预测结果间存在差异。 有些研究人员选取过一次筛网后的混合粒径范围的土样(< 2 mm或< 1 mm)进行光谱测量, 不能区分不同均匀粒径范围(如1~2和0.5~1 mm等)对预测结果的影响。

针对以上问题, 本工作通过对河北廊坊采集的砂壤土进行粒径分级, 配备1~2, 0.5~1, 0.25~0.5, 0.1~0.25和< 0.1 mm五种均匀粒径及< 1 mm的混合粒径范围的土样, 分析SOM含量和光谱反射率的关系, 并研究不同粒径土壤光谱预处理及建模方法对SOM含量的影响, 探究不同粒径下SOM含量特征波长筛选及提取方法, 并构建相应的SOM含量预测模型, 为实现SOM田间动态预测及仪器设计提供理论及模型参考。

1 实验部分
1.1 样本采集

以五点采样法在河北省廊坊市(39° 19'N, 116° 17'E)的农田区域中采集0~20 cm的耕层土壤, 该地区土壤类型主要为砂壤潮土。 采样时将表层的石块及动植物残体清除, 以保证样本的完整性。 将采集的样本充分混合并装入密封袋中, 作为该区域的待测土壤样品, 带回实验室进行下一步处理。

将田间采集的土样置于DHG-9123A恒温干燥箱中, 在40 ℃下烘干至恒重, 将土样研磨并依次过2, 1, 0.5, 0.25和0.1 mm筛网, 将不同筛网中剩余的土壤封存备用, 即得到粒径分别为1~2, 0.5~1, 0.25~0.5, 0.1~0.25和< 0.1 mm五种均匀粒径及< 1 mm混合粒径共计6种粒径土样。 由于< 0.1 mm的土样难以再次进行分级, 因此将粒径< 0.1 mm的土样作为均匀样品并用于后续处理。

图1 不同粒径的土壤样本
(a): 1~2 mm; (b): 0.5~1 mm; (c): 0.25~0.5 mm; (d): 0.1~0.25 mm; (e): < 1 mm; (f): < 0.1 mm
Fig.1 Soil samples with different particle sizes
(a): 1~2 mm; (b): 0.5~1 mm; (c): 0.25~0.5 mm; (d): 0.1~0.25 mm; (e): < 1 mm; (f): < 0.1 mm

为获取不同SOM含量梯度的样本, 将筛后的土样分别等量取30份, 并将前期实验室制备的高有机质含量的营养土(烘干、 研磨、 过筛)分别等比例加入对应制备好的粒径土样中, 共制备30份不同有机质梯度的土样, 为仪器设计提供完整梯度的SOM含量样本。 分别将土样以四分法分为两份, 主要用于实验室分析及光谱测试两部分。

1.2 土壤有机质含量测定

土壤有机质含量采用基于非色散红外吸收原理的TOC元素分析仪(vario TOC cube, 德国)进行测定, 测量时, 土壤中的有机物被高温燃烧氧化后经过光学传感器, 通过光强的变化测出气体的浓度, 进而实现总有机碳的分析, 如图2(a)所示。 为保证数据的有效性, 每个样本作5个重复, 均值乘以系数1.724作为最终土样有机质的有效值, 得到土壤有机质含量统计结果如表1所示。

图2 试验装置图
1: 电脑; 2: TOC; 3: 笔记本电脑; 4: 土攘样本; 5: 标准白板; 6: 光纤探头; 7: 多功能检测台; 8: NIR Quest; 9: QE Rro; 10: 光源(a): TOC分析仪装置; (b): 光谱采集装置
Fig.2 Test instrument diagram
1: PC; 2: TOC; 3: PC; 4: Soil samples; 5: Standard white plate; 6: Fiber probe; 7: Multifunctional testing platform; 8: NIR Quest; 9: QE Rro; 10: Light source (a): TOC analyzer; (b): Spectrum acquisition device

表1 土壤有机质含量统计 Table 1 Statistics of soil organic matter content
1.3 土壤光谱数据采集

采用海洋光学公司(Ocean Optics, Inc., 美国)的QE Pro高性能光谱仪及NIR Quest512-2.5近红外光谱仪采集土壤样品的光谱数据, 如图2(b)所示。 其中, NIR Quest512-2.5近红外光谱仪光学分辨率为9.0 nm, 积分时间为10 ms, 重复扫描次数为100次。 QE Pro高性能光纤光谱仪光学分辨率为1.7 nm, 积分时间为20 ms, 重复扫描次数为50次。 采用全光谱一分三型光纤, 反射光纤分别与对应的两个光谱仪连接进行平行测量, 入射光纤(光纤探头)与样品表面的采样距离为3 mm。 通过笔记本电脑的Ocean View软件获取样本300~2 500 nm波长范围反射光谱。

分别以四分法取样的方式, 将不同有机质含量的土壤样本置于直径40 mm、 高15 mm的培养皿中, 并用标准块将表面刮平待测(容重1.32 g· cm-3左右), 每个土壤样本作3个重复。 试验前, 用99%漫反射标准白板(Ocean Optics, Inc., 美国)对装置进行校正, 且为降低样本间环境误差, 每采集十个样本, 用标准白板校正一次。 为保证样品光谱数据的可靠性, 减小因采样位置不同造成光谱数据的差异, 试验时, 每个样本选取5个不同位置采集光谱, 每个位置连续采集3条光谱, 平均值作为该样本的反射光谱, 每个粒径范围共得到450条光谱数据。

1.4 土壤光谱数据预处理

考虑到光谱仪在低于380 nm和高于2 400 nm波长范围的光谱信噪比较低, 数据噪声大, 所以剔除这部分数据, 只保留380~2 400 nm波长范围作为样本的有效数据。 不同样本测量时的实际操作方式差异不可避免的会对测量结果产生影响, 需要对样本数据进行去异常值筛选。 通过蒙特卡洛交叉验证法(monte Carlo cross validation, MCCV)对异常样本进行筛选剔除, 得到1~2, 0.5~1, 0.25~0.5, 0.1~0.25, < 0.1及< 1 mm粒径土样的有效光谱数据分别为430, 422, 425, 424, 434及426组。

由于环境和仪器等因素易造成基线漂移, 对所有光谱数据采用Savitzky-Golay卷积平滑法进行平滑滤波处理, 增强光谱特征, 并将平滑后的光谱作为土样的原始光谱(R)作后续处理。 对光谱进行相应的数学变换可将光谱中的有效信息表现出来, 放大相应光谱特征。 因此, 对原始光谱(R)分别进行倒数(IR)、 对数(LR)、 以及一阶导数(FDR)等处理, 并分析不同变换光谱与SOM含量的响应关系。

1.5 基于CARS的SOM特征提取

竞争性自适应重加权算法(competitive adaptive reweighted sampling, CARS)[20]是指在采样时利用自适应重加权采样结合指数衰减函数, 对偏最小二乘回归(PLSR)模型的回归系数进行筛选, 去除绝对值较小系数所在波长, 基于交叉验证计算并筛选出交叉验证均方根误差小的波长集合, 该集合包含的变量即为最优特征变量组合。 根据1.4节中所述, 通过分析不同变换光谱(R, IR, LR, FDR)与SOM含量的响应关系结果, 选取与SOM含量相关性较高的光谱进行CARS特征变量提取。

1.6 模型建立与检验

采用光谱-理化值共生距离法(sample set partitioning based on joint x-y distance, SPXY)将70%样本分为建模集, 30%样本作为预测集。 首先, 对不同粒径的原始光谱(R)及变换光谱(IR, LR, FDR)采用偏最小二乘回归(PLSR)结合交叉验证, 建立不同粒径下不同光谱SOM含量预测模型, 并分析不同粒径对SOM含量预测的影响; 综合6个粒径的原始光谱(R)、 一阶导数(FDR)、 CARS特征变量数据作为自变量, SOM含量作为因变量, 分别构建基于PLSR的SOM含量预测模型, 分析不同模型的预测结果。 模型的评价指标主要有决定系数(R2)、 校正均方根误差(root mean square error of calibration, RMSEC)、 预测均方根误差(root mean square error of prediction, RMSEP)及相对分析误差(residual prediction deviation, RPD)等指标。 其中, 决定系数R2越接近1表明模型的预测结果越好, 均方根误差RMSEP和RMSEC越小越好。 相对分析误差RPD为预测集标准差与预测均方根误差RMSEP的比值, 当RPD≥ 2.0时表示模型有较高的可靠性与预测性能, 1.4< RPD< 2.0时表示模型较为可靠并可通过其他方法进行改进, RPD≤ 1.4时表示模型并不可靠。

2 结果与讨论
2.1 不同粒径土壤光谱特征分析

将每种粒径的土壤光谱数据分别按照粒径及波长进行运算, 得到土壤粒径与光谱反射率变化关系如图3所示。 从图3(a)中可以看出, 随着粒径的减小, 均匀粒径平均反射率及变异系数逐渐增加, 与Sun等[21]的结论类似。 混合粒径的平均反射率大于均匀粒径, 其变异系数值介于0.25~0.5和0.1~0.25 mm粒径之间。 从图3(b)中可以看出, 不同粒径土样光谱在不同波长范围内变化趋势类似, 且随波长呈现不同变化幅度。 在波长大于540 nm范围内, 平均反射率增幅明显, 且不同粒径样品间的差异也愈加显著, 在波长为1 410, 1 910及2 210 nm附近位置均出现不同幅度的水分吸收谷[14, 15]。 在波长970 nm左右, 由于仪器拼接使得该位置的反射率产生小幅度变化。

图3 土壤粒径与光谱反射率变化关系
(a): 不同土攘粒径反射率均值及变异系数; (b): 不同土壤粒径在不同波长反射率均值
Fig.3 Relationship between soil particle size and spectral reflectance
(a): Mean reflectance and variation coefficient of different soil particle sizes; (b): Mean reflectance of different soil particle sizes at different wavelengths

2.2 不同粒径SOM含量与光谱反射率相关性分析

为分析不同粒径下光谱变换反射率与SOM含量的相互关系, 对不同粒径SOM含量分别与平滑后的R, IR, LR及FDR等变换光谱进行相关性分析, 得到最大相关系数与其所在波长位置的结果如表2所示。 由表2可以看出, 粒径范围< 1 mm的混合土样的最大相关系数值高于均匀粒径土样, 且不同粒径SOM含量与不同变换光谱反射率的相关性水平存在显著差异, 其中FDR变换后SOM含量与光谱反射率的最大相关系数明显大于其他3种光谱变换。

表2 不同粒径下SOM含量与光谱反射率最大相关系数 Table 2 Maximum correlation coefficient between SOM content and spectral reflectance under different particle sizes

不同土壤粒径SOM含量与光谱变换反射率在不同波长的变化关系如图4所示。 由于R, IR, LR变换与SOM含量的相关性变化趋势类似, 所以只以R、 FDR的结果为参考进行分析。 从图中可以看出, R变换不同粒径土样的相关系数在不同波长下的变化趋势差异不大, 在近红外波长范围内的相关性明显高于可见光波长区域。 而随着粒径的减小, SOM含量与光谱反射率在全波段范围的相关性变化也愈加明显, 其中最大相关系数位于< 1 mm混合粒径, 粒径< 0.1 mm的均匀土样其SOM含量与不同变换光谱相关系数的变化率最高。 FDR变换后SOM含量与光谱反射率的相关性变化明显, 表明FDR变换可明显改变全波段范围与SOM含量的相关性[22], 且粒径越小, 相关性系数变化率越大, 其中均匀粒径< 0.1 mm和< 1 mm的混合粒径的相关系数变化范围明显大于其他粒径, 后续应用此光谱进行特征提取。 另外, 由于两台光谱仪在970 nm左右进行线性拼接, 所以导致在该波长范围内相关性系数值产生明显变化。

图4 不同粒径下SOM含量与光谱反射率相关性
(a): R变换SOM与反射率; (b): FDR变换SOM与反射率
Fig.4 Correlation between SOM content and reflectance of soil with different particle sizes
(a): SOM content and reflectance at R transform; (b): SOM content and reflectance at FDR transform

2.3 基于CARS的SOM含量特征提取

将6个粒径的FDR数据分别按照CARS算法进行特征变量筛选, 得到不同粒径下SOM含量的特征变量的分布情况如图5(a)所示, 从图中可以看出, 不同粒径筛选出的特征变量数及波长位置存在显著差异, 表明不同粒径对SOM含量预测在不同波长范围影响不同, 也证明了上述粒径在不同波长范围对光谱反射率及SOM相关性影响不同的结论。 另外, 不同粒径下的特征变量在某些波长范围内(如390~400和840~850 nm)接近重合, 表明在该波长范围内反射率对SOM含量较为敏感[23]。 为更加直观描述不同粒径下特征变量在不同波长的重合次数, 以波长为横坐标, 以相同波长位置特征变量重合的次数为纵坐标, 绘制如图5(b)所示分布图。 从图中可以看出, 不同粒径下特征变量在不同波长的重合次数差异明显。

图5 基于CARS的不同波长SOM含量特征变量分布
(a): 不同粒径下SOM含量特征变量在不同波长分布; (b): 不同粒径SOM含量特征变量在相同波长的重合次数
Fig.5 Variable distribution of SOM content characteristics at different wavelengths based on CARS
(a): Distribution of characteristic variables of SOM content in soil with different particle diameters at different wavelengths; (b): Overlap times of characteristic variables of SOM content under different particle sizes

依据上述分析, 将不同粒径下的特征变量按照变量集中位置与重合次数进行二次提取, 筛选出特征变量在不同粒径下分布较为集中的波长作为SOM含量预测的特征波长。 以图5(b)得到的在相同波长下不同粒径特征变量重合次数为4和5的波长为中心, 配合图5(a)中不同粒径特征变量分布较为集中的区域, 同时对不同粒径下特征变量分布较为集中的重合2和3次的波长进行筛选, 共筛选出162组特征波长, 特征波长数量降低至全波段数量的13.1%, 筛选出的特征波长分布结果如图6所示, 从图中可以看出, 特征波长大多集中于近红外区域[24]

图6 基于CARS筛选的SOM特征分布Fig.6 SOM characteristic variables distribution based on CARS method

2.4 不同粒径SOM含量预测模型构建与分析

采用SPXY法对不同粒径的样本进行划分, 将70%样本分为建模集, 30%样本作为预测集。 首先, 分别以不同粒径梯度下R, IR, LR及FDR等4种变换光谱反射率为自变量, SOM含量为因变量, 采用PLSR建立不同粒径下的SOM预测模型, 分析不同粒径及不同光谱变换形式对SOM含量预测的影响; 其次, 以筛选出的CARS特征变量数据以及全部粒径的原始光谱(R)、 一阶导数(FDR)作为自变量, SOM含量作为因变量, 构建PLSR预测模型。 模型结果如图7和图8所示。

图7 不同粒径下SOM含量PLSR预测模型构建与评价Fig.7 Construction and evaluation of SOM content models for different particle sizes

图8 不同PLSR模型预测值与实测值的比较
(a): 全部粒径R-PLSR模型; (b): 全部粒径FDR-PLSR模型; (c): 全部粒径CARS-PLSR模型; (d): 1~2 mm CARS-PLSR模型; (e): 0.5~1 mm CARS-PLSR模型; (f): 0.25~0.5 mm CARS-PLSR模型; (g): 0.1~0.25 mm CARS-PLSR模型; (h): < 0.1 mm CARS-PLSR模型; (i): < 1 mm CARS-PLSR模型
Fig.8 Comparisons of Predicted values and measured values of different PLSR models
(a): R-PLSR model of all particle sizes; (b): FDR-PLSR model of all particle sizes; (c): CARS-PLSR model of all particle sizes; (d): CARS-PLSR model for particle size of 1~2 mm; (e): CARS-PLSR model for particle size of 0.5~1 mm; (f): CARS-PLSR model for particle size of 0.25~0.5 mm; (g): CARS-PLSR model for particle size of 0.1~0.25 mm ; (h): CARS-PLSR model for particle size of < 0.1 mm; (i): CARS-PLSR model for particle size of < 1 mm

对比图7中不同模型的结果可以看出, 不同光谱变换形式、 不同粒径的建模效果均存在显著差异。 4种变换光谱的模型效果随粒径的变化趋势相似, 大致呈现出粒径越小其模型的效果越好的规律, 当粒径< 0.1 mm时, 模型效果最好。 当粒径由0.25~0.5 mm减小到0.1~0.25 mm时, 模型的效果没有明显的提高。 综合对比不同变换预测模型的评价指标, 基于FDR变换构建的预测模型(FDR-PLSR)效果最好[22], 在粒径< 0.1 mm时, 其 Rp2达到0.91, RMSEP为2.20 g· kg-1, RPD为3.33, 显著优于其他变换构建的模型, 可以对SOM含量实现很好的预测。 另外, 基于R变换构建的模型预测效果接近FDR变换, 而LR和IR变换构建的模型效果较差。 对于< 1 mm的混合粒径土样, 综合几个指标来看, FDR-PLSR模型的效果较好, 其 Rc2为0.78, RMSEC为2.85 g· kg-1, RPD为1.95, 可以实现该粒径的SOM含量预测, 且模型的效果可以进一步提高。

从图8中可以看出, 全部粒径R-PLSR模型、 FDR-PLSR模型的建模效果差异不大, 优于全部粒径下基于CARS特征变量构建的PLSR模型, 但是模型的精度和稳定性均仍需进一步的优化。 对于不同粒径构建的CARS-PLSR模型, 粒径< 0.1 mm预测模型的效果最好, Rc2为0.77, RMSEC为3.90 g· kg-1, Rp2为0.78, RMSEP为3.00 g· kg-1, RPD为2.00, 可以实现SOM含量的可靠预测。 此外, 其余粒径构建的CARS-PLSR模型虽然预测效果略低于< 0.1 mm粒径, 但模型的效果仍有可优化的空间。 相较于全波段构建的R-PLSR和FDR-PLSR预测模型(图7), 虽然CARS-PLSR模型的预测效果略低于前者, 但仍可以实现SOM含量的预测, 且极大地优化了模型的输入波长数量(波长数量降低至全波段数量的13.1%), 提高了运算效率[20, 23]

由于土壤光谱反射率受多种因素(如质地、 颜色等)的影响, 本研究中未针对这些影响因素开展研究, 在后续研究中, 需要考虑影响土壤光谱的其他因素及不同因素间的交互对建模精度的影响。 另外, 为了适应精准农业土壤信息高效获取的要求, 需要针对田间复杂的作业环境(光照、 作业速度等)开展SOM含量田间动态检测的研究, 对数据处理及建模方法进一步优化, 以实现田间SOM动态高精度检测。

3 结论

通过对田间采集的砂壤土进行粒径分析, 分别制备了1~2, 0.5~1, 0.25~0.5, 0.1~0.25和< 0.1 mm五种均匀粒径及< 1 mm的混合粒径范围的土壤, 比较了不同粒径样品的光谱反射率差异, 并对原始光谱R进行倒数IR、 对数LR、 一阶导数FDR等3种光谱变换, 分析了不同粒径SOM含量与不同变换光谱反射率的相关性, 基于CARS方法选取SOM含量的特征变量, 结合PLSR分别建立了相应的SOM含量预测模型。 主要结论如下:

(1)不同粒径土样平均光谱反射率随着粒径的减小逐渐增加, 其中粒径< 0.1 mm的均匀粒径和< 1 mm混合粒径的土样的平均反射率最大; 在不同波长范围内不同粒径土样的平均反射率呈现不同的变化幅度, 尤其波长大于540 nm范围, 粒径间的差异更加明显。

(2)随着粒径的减小, SOM含量与光谱反射率在全波段范围的相关性变化也愈加明显, 且FDR变换可明显改变全波段范围与SOM含量的相关性, 其中粒径< 1 mm和< 0.1 mm土样的相关系数变化幅度最为明显。

(3)不同光谱变换形式的建模效果存在显著差异, 且不同粒径的建模效果存在显著差异, 其中, FDR变换光谱的建模精度较好, 特别在粒径< 0.1 mm时, 其 Rp2达到0.91, RMSEP为2.20 g· kg-1, RPD为3.33, 表明该模型可以对SOM含量实现很好的预测。

(4)通过CARS算法对FDR光谱进行特征波长提取, 筛选出的特征波长数量降低至全波段数量的13.1%, 降低了光谱数据重叠及无效信息干扰。 基于CARS特征变量构建的SOM含量预测模型中, 粒径< 0.1 mm的模型效果最好, Rc2为0.77, RMSEC为3.90 g· kg-1, Rp2为0.78, RMSEP为3.00 g· kg-1, RPD为2.00, 可以实现SOM含量的可靠预测。 且其他粒径下构建的CARS-PLSR模型仍有可优化的空间, 可以进行SOM含量的预测。

参考文献
[1] YANG Li, YAN Bing-xin, ZHANG Dong-xing, et al(杨丽, 颜丙新, 张东兴, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2016, 47(11): 38. [本文引用:1]
[2] Ding Y, Yang L, Zhang D, et al. International Journal of Agricultural and Biological Engineering, 2021, 14(2): 151. [本文引用:1]
[3] He X T, Ding Y Q, Zhang D X, et al. Computers and Electronics in Agriculture, 2019, 162(7): 318. [本文引用:1]
[4] He X T, Ding Y Q, Zhang D X, et al. Computers and Electronics in Agriculture, 2019, 162(7): 309. [本文引用:1]
[5] Pan G X, Smith P, Pan W N. Agriculture, Ecosystems & Environment, 2009, 129(1-3): 344. [本文引用:1]
[6] Oldfield E E, Bradford M A, Wood S A. Soil, 2019, 30(5): 1. [本文引用:1]
[7] Kodaira M, Shibusawa S. Geoderma, 2013, 199: 64. [本文引用:1]
[8] Hong Y S, Yu L, Chen Y Y, et al. Remote Sensing, 2018, 10: 28. [本文引用:1]
[9] Lin Z D, Wang Y B, Wang R J, et al. Journal of Applied Spectroscopy, 2017, 84(3): 529. [本文引用:1]
[10] Gu X H, Wang Y C, Sun Q, et al. Computers and Electronics in Agriculture, 2019, 167: 105053. [本文引用:1]
[11] Nawar S, Mouazen A M. Catena, 2017, 151: 118. [本文引用:1]
[12] Liu S S, Shen H H, Chen S C, et al. Geoderma, 2019, 348: 37. [本文引用:1]
[13] Dhawale N M, Adamchuk V I, Prasher S O, et al. European Journal of Soil Science, 2015, 66(4): 661. [本文引用:1]
[14] Mouazen A M, Kuang B, Baerdemaeker J D, et al. Geoderma, 2010, 158: 23. [本文引用:2]
[15] Dotto A C, Dalmolin R, Caten A T, et al. Geoderma, 2018, 314: 262. [本文引用:2]
[16] YU Lei, HONG Yong-sheng, GENG Lei, et al(于雷, 洪永胜, 耿雷, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2015, 31(14): 103. [本文引用:1]
[17] Sun Z Q, Zhang J Q, Tong Z J, et al. Journal of Quantitative Spectroscopy & Radiative Transfer, 2014, 133: 1. [本文引用:1]
[18] Nawar S, Buddenbaum H, Hill J, et al. Soil & Tillage Research, 2016, 155: 510. [本文引用:1]
[19] Rodionov A, Pätzold S, Welp G, et al. Soil & Tillage Research, 2016, 163: 89. [本文引用:1]
[20] Bao Y, Meng X, Ustin S, et al. Catena, 2020, 195: 104703. [本文引用:2]
[21] Knadel M, Thomsen A, Schelde K, et al. Computers and Electronics in Agriculture, 2015, 114: 134. [本文引用:1]
[22] Gao L L, Zhu X C, Han Z Y, et al. Pedosphere, 2019, 29(6): 810. [本文引用:2]
[23] YU Lei, ZHU Ya-xing, HONG Yong-sheng, et al(于雷, 朱亚星, 洪永胜, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2016, 32(22): 138. [本文引用:2]
[24] LI Guan-wen, GAO Xiao-hong, XIAO Neng-wen, et al(李冠稳, 高小红, 肖能文, ). Acta Optica Sinica(光学学报), 2019, 39(9): 361. [本文引用:1]