基于数码相片和颜色空间转换的滨海土壤盐渍化定量估算
徐璐*, 王慧, 邱思怡, 练靖文, 王李娟
江苏师范大学地理测绘与城乡规划学院, 江苏 徐州 221116
*通讯作者

作者简介: 徐璐, 1987年生, 江苏师范大学地理测绘与城乡规划学院讲师 e-mail: luxa1023@jsnu.edu.cn

摘要

土壤盐渍化是土壤退化的重要原因之一, 快速精确地监测土壤盐渍化对农业可持续发展和生态环境保护有积极作用。 提出一种基于数码相片的滨海地区表层土壤盐分的定量估算方法, 旨在复杂天气状况下快捷方便的获取土壤盐分信息。 以江苏盐城沿海地区裸露地表土壤作为研究对象, 在晴天和多云天气下全天时采样和拍照获取52个土壤样本和相片。 土壤样品通过室内测试获取土壤电导率(EC), pH值和土壤含水量等参数。 利用RStudio软件对土壤相片进行处理, 首先从相片中提取RGB三种颜色参数, 再通过颜色空间转换关系计算另外5种颜色空间(HIS, CIEXYZ, CIELAB, CIELUV和CIELCH), 每个颜色空间有三个颜色参数, 加上RGB颜色空间共有18个颜色参数, 其中CIELAB, CIELUV和CIELCH中L参量表示的意义和数值相同, 因此6个颜色空间共有16个颜色参数。 土壤电导率与颜色参数相关分析结果表明, 相片颜色的纯度和亮度与土壤电导率之间的相关系数较高, 并达到了极显著水平, 相片颜色的色相与土壤电导率之间的相关性较低, 且未达到显著水平。 随机抽取70%的样本数据并用随机森林方法对土壤盐分含量进行建模, 采用留一法(LOOCV)进行交叉验证, 再用余下30%的样本数据进行精度检验, 重复100次以获取精度最高的模型。 最终获取估算土壤盐分的随机森林模型, 验证集数据的模型精度达到$R_{val}^{2}$=0.75, RMSEval=3.52, RPDval=2.02。 对颜色参数进行重要性分析发现, 颜色纯度对模型的重要性最大, 其次是颜色亮度, 色相的贡献较小。 综上, 利用数码相机获取表层土壤相片, 通过颜色空间转换得到的颜色参数为有效估算滨海土壤盐分含量提供一个新思路。 该研究对近地表参数定量估算提供了新视角, 将来结合无人机平台能够为精准农业和滨海生态环境的精准管理提供技术支持和有效手段。

关键词: 土壤盐渍化; 数码相机; 土壤颜色; 颜色空间; 随机森林
中图分类号:TP722.4 文献标志码:A
Coastal Soil Salinity Estimation Based Digital Images and Color Space Conversion
XU Lu*, WANG Hui, QIU Si-yi, LIAN Jing-wen, WANG Li-juan
School of Geography, Geomatics and Planning, Jiangsu Normal University, Xuzhou 221116, China
*Corresponding author
Abstract

Soil salinization is one of the most important reasons for soil degradation. Rapid and accurate monitoring of soil salinity has positive effects on sustainable agricultural development and ecological environment protection. This study proposed a new method of surface soil salinity estimation in coastal areas based on digital photographs to obtain soil salinity information quickly and conveniently under complicated weather conditions. 52 bare surface soil samples and photographs were collected under sunny and cloudy weather in the coastal area of Yancheng, Jiangsu province. Parameters such as soil electrical conductivity (EC), pH value and soil water content were measured in the lab. Using RStudio software for photo processing, firstly, three color components were extracted from RGB color space, then five color spaces (HIS, CIEXYZ, CIELAB, CIELUV, and CIELCH) were obtained from color space conversion. Three parameters were extracted from each color space. Hence there were 16 parameters from 6 color spaces for CIELAB, CIELUV, and CIELCH having the same parameter L. The correlation analysis of soil EC and color parameters indicated that the color purity and brightness were significantly correlated with soil EC, while color hue was insignificantly correlated with soil EC. Random forest and leave one out cross validation methods were used to establish soil EC estimation model with randomly 70% dataset, and the rest 30% dataset was used for validating. Repeated 100 times to get the optimal model, and finally, the accuracy of the best model reached $R_{val}^{2}$=0.75, RMSEval=3.52, RPDval=2.02. By analyzing the importance of color parameters, we found that color purity and color brightness contributed most to the model, and color hue contributed relatively little. To sum up, the color parameters obtained from digital images provided a new approach for soil salinity estimation effectively. Combined with the unmanned aerial vehicle, this study proposed a new perspective for quantitative assessment of surface parameters, which would provide technical support and effective means for the precise management of precision agriculture and coastal ecological environment in future.

Keyword: Soil salinity; Digital camera; Soilcolor; Color space; Random forest
引言

土壤盐渍化不仅影响农业可持续发展, 而且对生态环境也有一定的破坏, 是导致土壤退化的全球性问题之一[1]。 由于自然环境的变化和人为活动的影响, 土壤盐渍化程度和分布一直处于变化的状态, 因此精确监测土壤盐渍化的变化动态是科学管理和合理利用盐渍土的重要前提[2]。 传统的土壤盐渍化监测方法需要大量人力、 物力和时间成本, 而且采样的时间和地区都有一定的限制, 对土壤表面也有一定的破坏, 难以实现盐渍化监测的快速更新[1]。 利用遥感定量监测土壤盐渍化已经成为公认的方便快捷的新途径, 也是科学界比较重要的研究热点[3, 4]。 但是遥感仍然存在一定的局限性, 如受天气影响和反演地表参数的尺度较大等, 而近地表传感可以解决这些问题。

数码相机作为日常电子用品, 可以用于土壤信息的精确反演[5, 6, 7]。 Persson利用数码相机获取土壤相片, 经过颜色空间转换得到RGB和HSV等不同颜色参数, 并发现S和V变量与土壤含水量有较好的关系, 建立了较好的预测模型[7]。 吴才武等利用数码相机提取黑土表面的颜色信息, 然后定量化研究其与黑土有机质之间的关系, 发现R波段与土壤有机质有较高的相关性, 并建立了精度较高的预测模型[6]。 相比其他高精度的贵重仪器, 数码相机等电子产品的通用性和普遍性为科学研究的应用推广提供了良好的平台, 结合无人机技术的快速发展, 将会加快实现土壤精准监测和土地精细化管理, 为精准农业发展提供了技术支持。

1 实验部分
1.1 研究区概况

研究区位于江苏省盐城市大丰区(120.52° — 120.86° N, 33.03° — 33.5° E), 濒临黄海, 该区属于亚热带海洋季风气候, 受南北气流和海洋、 大陆双重气候的影响, 年降水量约为900~1 100 mm, 年平均气温约为13.7~14.8 ℃[8]。 海水倒灌导致地下水矿化度较高, 人类活动的不合理利用使得浅咸地下水上升至地表导致土壤加剧盐渍化。 如今土地利用类型以围垦用地, 建筑用地, 水产养殖用地和滨海滩涂等为主, 而且随着复垦和养殖用地的增加, 滩涂用地也越来越少, 茅草, 盐蒿, 芦苇和米草等群落也在逐渐减少。 图1展示了研究区和采样点位置。

图1 研究区和采样点分布图Fig.1 Study area and sampling points distribution

1.2 数据获取

1.2.1 相片数据获取

2018年6月22日— 24日, 天气多云转晴, 时有微风, 温度为18~33 ℃。 我们沿着海岸线一路考察, 选择不同状态的裸露地表进行采样, 同时拍照获取数码相片。 为了增加相片数据的复杂性以获得鲁棒性较强的模型, 我们选择在晴天和多云的状态下进行全天时拍照和采样, 最终共采集了52个样品。

本实验使用的拍照工具为6 000× 4 000像素的佳能760D相机。 首先选择一块无植被和其他杂物干扰的裸地, 根据相机的视场角和裸地面积调整相机的拍照高度, 并保持相机镜头垂直于地面进行拍摄。 自动模式下能够防止不正确的聚焦和曝光时间, 有助于在野外不同环境光背景下获取较稳定的相片质量[9]。 最后相片以“ JPG” 的格式保存, 方便后期软件处理。 由于边缘效应会导致相片边缘像素有形变, 本研究去除20%的相片边缘, 只保留中间部分的相片数据。 图2给出了各相片的拍照时间和平均亮度值。

图2 各采样点的拍照时间和平均亮度值Fig.2 Sampling time and mean brightness of sampling points

1.2.2 土壤数据获取

拍照完成后, 将视场内的表层土壤(小于5 cm)采集装入封口袋, 并放入保温箱以防止土壤水分蒸发, 同时使用GPS记录采样点的经纬度。 每天将采集样品进行称重获取土壤湿重, 之后在105℃烘箱中干燥24 h以获取土壤干重, 进而得到土壤含水量。

用2 mm筛子将烘干土样过筛, 并配制土水比为1:5的混合溶液, 充分混合后获取表层清液用来测量土壤理化性质。 土壤电导率(EC)和pH值数据通过电导率仪(DDS-307A)和pH计(PHSJ-3F)测量得到。 滨海盐土的主要盐分是NaCl, 其可溶性使得土壤含盐量与电导率之间有非常好的相关性[10], 因此本区域可以用电导率表示土壤盐渍化程度。 土壤的理化性质如表1所示。

表1 土壤理化属性数据描述 Table 1 Summary of soil physical and chemical properties
1.3 颜色空间

1.3.1 RGB和HIS

RGB颜色空间是最常用的颜色系统, 是由红(R)绿(G)蓝(B)三种基本色构成, 其相对应的光谱波段为700, 546和436 nm。 对于常用的8位图像, 每个基本色都有28=256个位阶, 其灰度值由黑(0)到白(255)变化[11]。 本研究中JPG格式的相片是基于RGB颜色系统的, 可以直接从相片的各像素中提取RGB的亮度值。

RGB三原色的亮度值具有高度相关性, HIS颜色空间则是去相关后的颜色空间, H代表色相, I代表强度或亮度, S代表饱和度。 该颜色空间可以由RGB颜色空间转换而来, 为了与其他颜色空间参数区分, 本文用HIS_H, HIS_I, HIS_S表示HIS颜色空间的三个参数。

1.3.2 CIEXYZ, CIELAB, CIELUV和CIELCH

1931年, 国际照明组织(CIE)通过指定光源为颜色系统制定了标准, 并提出CIEXYZ颜色系统。 这里的Y代表亮度值, X和Z是虚拟组分, 该系统经常作为其他颜色系统转换的中间媒介, 如CIELAB和CIELUV[11]

国际照明组织在1976年提出了新的CIELAB和CIELUV颜色空间, 都是有CIEXYZ颜色空间转换而来。 CIELAB中, L表示亮度, 取值范围是[0, 100], A表示从绿色到品红色的范围, B表示从蓝色到黄色的范围, 取值范围都是[-128, 127], 该颜色空间的三个参数用LAB_L, LAB_A和LAB_B表示。

CIELUV中的L的意义和取值范围都与CIELAB相同, U和V表示色度, 且取值范围是[-100, 100][12], 颜色空间的三个参数用LUV_L, LUV_U和LUV_V表示。

CIELCH颜色空间与CIELAB一致, 但是它采用了不用的表示方法, L表示亮度, C表示饱和度, H表示色相, 这里用LCH_L, LCH_C和LCH_H表示。

图3给出了不同颜色空间之间的转换关系, 各颜色空间之间的转换公式可参考文献[12]。 这里LAB_L, LUV_L和LCH_L都表示亮度且值相同, 因此数据分析时统一用LAB_L表示。 所有的颜色空间转换计算由“ colorscience” 软件包完成。

图3 不同颜色空间的变换关系Fig.3 Color space transformations

1.4 建模与评价

本研究采用随机森林算法进行建模, 随机森林是一种集成学习方法, 该算法会生成很多树, 每棵树都是通过自举抽样的样本数据训练得到的, 并用袋外样本进行精度验证, 随机森林的预测结果则是所有输出结果的平均情况[13]。 该算法的主要参数都用默认值, 即决策树个数(ntree=500)和节点数(mtry约为总变量数的1/3)。 利用随机选取的建模数据集(70%)进行建模, 采用留一交叉验证(LOOCV)进行精度校正, 然后用余下的验证数据集(30%)进行检验, 重复100次以确定最优模型参数。 此外, 选取决定系数(R2), 均方根误差(RMSE)和相对分析误差(RPD)作为模型精度检验指标, 其计算方法如下

R2=1-i=1n(Pi-Oi)2/i=1n(Pi-O̅)2

RMSE=1ni=1n(Oi-Pi)2

RPD=i=1n(Oi-O̅)2/(n×RMSE)

其中, Oi为观测数据, Pi为预测数据, O̅为观测平均值。

一般情况下, 预测能力较好的模型具有较高的R2和较低的RMSE。 有研究表明, RPD> 2 表明模型有较高的预测能力, 1.4< RPD< 2表明模型的预测能力有限, RPD< 1.4表明模型基本没有预测能力[14]。 统计分析和结果作图都是基于RStudio软件进行。

2 结果与讨论
2.1 土壤颜色参数与电导率的关系

从数码相片中获取图像的RGB空间的颜色参数之后, 经过上述颜色空间转换得到其他颜色空间参数。 将所有颜色空间的参数和电导率做相关分析, 结果如图4所示。 图中将所有颜色参数分成3组, 相关性较大的参数聚集成一组, 且只显示相关性达到极显著水平(p< 0.01)的值, 相关性未达到极显著水平的值不予显示。 可以看出, LAB_A, LAB_B, LUV_U, LUV_V, LCH_C和HIS_S之间的相关性较大, 且与其他参数的相关性基本都未达到极显著水平; LCH_H和HIS_H的相关性较大, HIS_H与其他参数相关性基本未达到极显著水平, 但LCH_H与LAB_A和LUV_U有一定的负相关关系; 余下的颜色参数(R, G, B, X, Y, Z, LAB_L, HIS_I)之间具有较高的相关性, 且与其他颜色参数都未达到显著水平。

图4 颜色空间参数与电导率之间的相关系数
× 表示参数间的相关性未达到极显著水平
Fig.4 Correlation coefficient between EC and parameters in various color spaces
× means the non-significant correlation

从颜色模型的角度分析, LAB_A, LAB_B, LUV_U, LUV_V, LCH_C和HIS_S都是表示颜色纯度的参数, 虽然在不同的颜色空间中有自己的值域, 但是经过转换后的参数之间的相关系数仍较高(r> 0.82, p< 0.001)。 HIS_H和LCH_H都是表示颜色色相的参数, 二者之间的相关系数为r=0.81 (p< 0.001)。 R, G, B, X, Y, Z, LAB_L和HIS_I都是表示颜色亮度的参数, 在不同的颜色空间也有自己的值域, 相关系数最小值为r=0.92(p< 0.001)。 可以理解为, 虽然各颜色空间的颜色表达不一样, 但是颜色三要素(纯度, 亮度, 色相)之间互相影响较小。

从电导率与颜色参数之间的相关关系可以看出, 电导率与所有表示颜色亮度参数的相关性都达到了极显著水平, 最小值是R参数与电导率之间的相关系数r=0.39(p=0.005)。 电导率与表示颜色纯度的参数也都达到了显著水平, 最小值是LAB_A与电导率之间的相关系数r=0.35(p=0.011)。 电导率与表示颜色色相参数(LCH_H和HIS_H)之间的相关性都没有达到显著水平, 相关系数分别为0.26(p=0.06)和0.05(p=0.72)。

2.2 模型构建与评价

经过转换后的颜色空间参数共16个, 将它们都作为自变量带入随机森林模型。 在52个数据中随机抽取70%作为训练数据集, 经留一法交叉验证, 并用余下的30%的检验数据集进行检验, 重复100次以确定最优模型参数。 最终得到的模型精度较高( Rcal2=0.82, RMSEcal=2.93, RPDcal=2.38), 而验证数据集也有较高精度的模型( Rval2=0.75, RMSEval=3.52, RPDval=2.02)。 图5给出了电导率观测值与预测值的散点图。

图5 土壤电导率的观测值与预测值对比Fig.5 Scatter diagram of observed and predicted EC

已有研究利用相机拍照获取颜色参数来构建土壤盐分模型。 Ren等[15]研究了东北地区典型的苏打盐碱土, 发现土壤盐分越大, 地表干燥后的裂纹就越大, 以此现象着手, 计算每个相片的灰色共生矩阵纹理特征, 基于此建立了精度很高的土壤盐分预测模型(R2=0.92)。 Xu等[5]研究了西部干旱区土壤盐分, 发现盐分有表聚现象, 泛白的盐分对日光有较高的反射率, 导致相片有较高的亮度值, 在获取相片数据RGB颜色空间参数后, 对相片的每一个像素进行深度分析, 建立了精度很高的土壤盐分预测模型(R2=0.90)。 与上述研究不同, 本文研究区位于东部滨海, 土壤盐分常常受到土壤水分的影响, 表1中可以看出滨海地区很少有地表干燥的土壤, 所以既无盐分表聚, 也无地表裂纹现象。 因此, 本文从颜色空间的角度探索一种新的土壤盐分反演途径, 在有土壤水分干扰的情况下, 获得了精度较好的模型。 除此之外, 获取相片时的光环境变化会对相片的RGB颜色空间有一定的影响, 最终对模型精度有一定的影响。

图6对各参数变量的重要性做了比较。 可以看出得分较高的前5个变量都是颜色纯度参数, 如LUV_U, HIS_S, LUV_V, LCH_C和LAB_B, 位于中间的8个变量是颜色亮度变量, 如HIS_I, R, Y, B, Z, X, G和LAB_L, 最后两个变量是色相参数, 也是与电导率相关性较小的两个个变量, 其中LCH_H与电导率的相关性最小, 在模型中的贡献也最小, 该结果与图4中电导率与颜色参数的相关系数结果一致。

图6 不同颜色空间参数的重要性比较Fig.6 The importance of variables in different color spaces

土壤颜色空间逐渐成为土壤研究方向的科研热点[16, 17]。 吴才武等[17]利用数码相机获取黑土表面颜色信息, 研究了不同颜色空间参数(RGB, CIELAB, CIELUV和CIELCH)及其数学变换形式, 并建立其与有机质含量之间的关系, 根据模型建立和检验的综合评价, 认为RGB颜色空间更能有效反演土壤有机质, 其次是CIELUV, CIELAB和CIELCH。 Fu等[16]在实验室内用手机拍照获取不同水分状态下的土壤相片, 反演复杂情况的土壤有机质含量, 通过5个颜色空间(RGB, HIS, CIELUV, CIELAB和CIELCH)的参数对比分析, 发现不同水分状态下土壤有机质含量与颜色参数的相关性不同, 认为土壤水分含量较少(< 10%)的情况下, R对土壤有机质有较好的预测能力。 土壤水分含量较高(> 10%)的情况下, LCH_H, LCH_C和LUV_U能够较好的预测土壤有机质含量。 以前的研究大多针对不同颜色参数与土壤属性之间的关系, 较少的认识到颜色参数间的属性归类, 而且颜色空间在土壤盐分预测方面的研究也较少。 本研究弥补了这一空白, 认为土壤颜色纯度是土壤含盐量估算的重要参数, 其次是土壤颜色亮度, 而土壤颜色色相对土壤含盐量的估算能力较小。

土壤颜色本身并不是土壤的功能属性, 却是反演土壤功能属性的重要参数。 本研究通过数码相机获取滨海土壤颜色参数, 并通过颜色空间转换获取了其他颜色参数, 通过多个颜色参数建立了土壤含盐量快速预测的新方法。 土壤颜色受多种因素的影响, 如土壤有机质, 土壤质地, 土壤铁含量, 土壤含水量等[5, 12], 而最终获取的土壤相片颜色又受到天气情况, 日照强度, 相机参数设置等因素影响[9]。 因此, 该模型是在众多因素影响下建立起来的鲁棒性较强的土壤盐分反演模型。

采样区聚集在东部滨海地区, 我们认为土壤有机质、 土壤铁含量和土壤质地等土壤背景参数基本相同, 并认为土壤含水量和含盐量是影响土壤相片颜色的主要因素, 这样得到的模型就可以忽略土壤含水量的影响。 同时为了模型具有更大的鲁棒性和普适性, 我们选择在不同天气情况下获取相片数据, 以此获取对天气因素免疫的土壤盐分模型。

作为颜色三要素之一的颜色纯度是模型中起主要作用的参数, 它们大都与土壤盐分有极显著的负相关关系, 具体物理联系尚不清楚。 土壤颜色亮度与土壤含水量、 周围光环境和相机曝光设置有一定的关系[7], 在天气多变的情况下, 选择自动曝光模式对相片亮度有较好的统一作用。 颜色色相是常用来分辨颜色的重要参数, 在模型中的作用却是最次要的, 可能是由于同一地区土壤颜色差异较小, 仅通过色彩差异不足以反演土壤盐分带来的变化。 本文仅仅通过颜色空间转换等方法来探索颜色参数对土壤盐分的反演过程, 各个颜色参数与土壤盐分的物理关系仍不明确, 需进一步实验研究。

3 结论

土壤颜色是表示土壤特征的重要参数, 人们经常用RGB颜色空间来表示土壤颜色, 其他颜色空间却常常被忽略。 本文探讨了不同颜色空间参数之间以及与土壤电导率之间的关联性, 并构建了基于颜色空间参数的土壤盐分估算模型。 常用的RGB颜色空间并不是预测土壤电导率的最佳参数, 经过颜色空间转换后的16个参数可分为三种类型, 颜色纯度参数, 颜色亮度参数和颜色色相参数。 结果表明, 颜色纯度和亮度参数与土壤盐分之间的相关性均能达到极显著相关, 颜色色相与土壤盐分的关系未达到显著相关。 在这些颜色参数的共同作用下, 建立了预测能力较强的土壤电导率估算模型( Rval2=0.75, RMSEval=3.52, RPDval=2.02), 并发现颜色纯度对土壤电导率建模的贡献较大, 其次是颜色亮度, 而颜色色相对土壤电导率的解释能力最小。 本研究为颜色参数在土壤学中的应用提供了新思路, 结合无人机的快速发展, 未来可快速获取地表信息, 为精准农业和土地管理提供了潜在的技术支持。

参考文献
[1] Metternicht G I, Zinck J A. Remote Sensing of Environment, 2003, 85(1): 1. [本文引用:2]
[2] Qadir M, Schubert S, Ghafoor A, et al. Land Degradation & Development, 2001, 12(4): 357. [本文引用:1]
[3] Zhang T-T, Qi J-G, Gao Y, et al. Ecological Indicators, 2015, 52: 480. [本文引用:1]
[4] Ivushkin K, Bartholomeus H, Bregt A K, et al. Remote Sensing of Environment, 2019, 231: 111260. [本文引用:1]
[5] Xu L, Zheng C, Wang Z, et al. Geoderma, 2019, 341: 68. [本文引用:3]
[6] WU Cai-wu, YANG Hao, XIA Jian-xin, et al(吴才武, 杨浩, 夏建新, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(4): 1222. [本文引用:2]
[7] Persson M. Vadose Zone Journal, 2005, 4(4): 1119. [本文引用:3]
[8] FANG Ren-jian, SHEN Yong-ming, SHI Hai-dong(方仁建, 沈永明, 时海东). Acta Ecologica Sinica(生态学报), 2015, (3): 641. [本文引用:1]
[9] Aitkenhead M, Donnelly D, Coull M, et al. Digital Soil Morphometrics, 2016: 89. [本文引用:2]
[10] WENG Yong-ling, GONG Peng(翁永玲, 宫鹏). Journal of Nanjing University·Natural Science(南京大学学报·自然科学版), 2006, (6): 602. [本文引用:1]
[11] Wyszecki G, Stiles W S. Color Science: Concepts and Methods, Quantitative Data and Formulae. Second Edition ed. New York: Wiley, 1982. [本文引用:2]
[12] Rossel R A V, Minasny B, Roudier P, et al. Geoderma, 2006, 133(3-4): 320. [本文引用:3]
[13] Breiman L. Machine Learning, 2001, 45(1): 5. [本文引用:1]
[14] Chang C W, Laird D A, Mausbach M J, et al. Soil Science Society of America Journal, 2001, 65(2): 480. [本文引用:1]
[15] Ren J, Li X, Zhao K, et al. Geoderma, 2016, 263: 60. [本文引用:1]
[16] Fu Y, Taneja P, Lin S, et al. Geoderma, 2020, 361: 114020. [本文引用:2]
[17] WU Cai-wu, YANG Yue, XIA Jian-xin(吴才武, 杨越, 夏建新). Chinese Journal of Soil Science(土壤通报), 2016, 47(4): 853. [本文引用:2]