作者简介: 刘 英, 女, 1982年生, 西安科技大学测绘科学与技术学院副教授 e-mail: liuying712100@163.com
随着我国“碳达峰、 碳中和”政策的提出, 矿区碳排放成为关注焦点, 然而目前缺少矿区土壤碳排放高光谱遥感探测的有效方法。 基于矿区实测土壤样品, 将6种光谱数学变换方法(R、
With the policy of “carbon peaking and carbon neutrality” put forward in China, carbon emissions in the mining area have become the focus of attention. The study was based on soil samples taken from the mine areas, combined with 6 mathematical transformation methods (R,
土壤作为陆地生态系统最大碳库, 是大气CO2重要的源和汇[1]。 土壤呼吸是土壤向大气排放CO2的主要途径, 土壤每年排放二氧化碳量约是化石燃料燃烧排放量的10倍[2]。 随着“ 30· 60” 双碳政策的提出, 如何维持土壤的碳源汇效应已经成为我国当前面临的重大环境需求, 因此准确监测土壤呼吸变化可为我国实现碳平衡提供科学依据。
我国煤炭资源丰富, 煤炭开采对矿区及周边环境造成了严重破坏, 如地表沉降、 植被生物量减少、 景观破碎化及碳汇能力下降等。 因此, 准确监测矿区土壤呼吸是评价矿区生态修复进程及土壤固碳能力大小的重要前提与基础。 任志胜[3]利用原点监测法对晋陕蒙矿区进行土壤呼吸速率测定, 结果表明复垦排土场的不同土体结构对土壤呼吸的影响较明显; 陈孝杨[4]利用钻探监测法探究矿区不同覆土厚度下土壤呼吸速率变化, 认为不同厚度土壤呼吸存在差异性; Pandey[5]认为土壤呼吸存在季节性特征, 土壤理化性质受采矿活动强度影响; Mukhopadhyay[6]使用原位观测法测量了复垦煤矿复垦区的土壤呼吸速率, 指出碳排放速率随着复垦年限的增加而加快, 也是陆地生态系统重要的碳源汇地区; Ahirwal[7, 8]通过密闭动态式法对复垦下的煤矿弃土进行土壤呼吸通量的长时序观测, 指出CO2通量受土壤水分与大气CO2浓度影响较大。 目前土壤碳排放速率的监测主要通过土壤呼吸测量仪器实地获取或进行长期原位野外监测, 此方法费时、 费力且易破坏地表结构, 同时难以实现大范围观测, 而卫星遥感手段有效地弥补了以上不足, 利用高光谱、 多光谱等遥感系统监测土壤碳排放的研究正在逐步展开。
利用高光谱技术, 相关学者通过构建半经验模型, 结合土壤温度、 土壤湿度及土壤理化性质指标等展开土壤碳排放监测[9]。 崔慧瑾等[10]指出不同变换下的光谱特征均与高粱作物土壤呼吸存在显著相关性; Liu等[11]基于无人机多光谱影像与光谱指数结合机器学习算法反演了矿区土壤碳排放速率; 毕银丽等[12]指出土壤有机碳的敏感波段范围是630~680 nm, 最敏感波段为655 nm; 综上所述, 多光谱技术已应用于多种生态系统土壤碳排放监测与反演模型构建, 但借助高光谱遥感技术对矿区土壤碳排放监测的研究鲜有报道, 且针对采矿活动下多种土地利用类型土壤碳排放遥感反演、 昼夜土壤碳排放监测及其光谱响应特征的研究并不常见。 因此, 如何利用高光谱遥感对露天矿区多种土地利用类型土壤碳排放进行光谱识别及构建反演模型值得探讨与关注。
以新疆红沙泉露天煤矿为研究对象, 利用实测的高光谱数据, 采用6种数学变换与光谱特征筛选相结合的方法, 探究新疆红沙泉露天煤矿不同土地利用类型下土壤碳排放的高光谱响应特征; 结合多种实测数据和光谱指数, 对比不同的机器学习方法得到最优土壤碳排放遥感反演模型, 以期为矿区生态修复、 卫星遥感及无人机多光谱土壤碳排放数据采集提供科学支持, 为红沙泉矿区兼顾低碳减排绿色发展和经济效益共赢提供决策支持, 实现土壤碳排放无损化监测。
红沙泉矿区位于新疆维吾尔自治区昌吉州奇台县以北78 km处(90.25° — 90.42° E, 44.41° — 44.52° N), 地势由东南向西北逐渐降低, 海拔高度为657~753 m。 年均降水量为106 mm, 年蒸发量为1 200~2 400 mm, 风力4~5级, 气候属于大陆干旱型荒漠气候[13, 14], 常年干燥少雨。 研究区域土壤中沙砾(粒径2~0.2 mm)的含量> 85%, 根据国际制[15]分类标准, 研究区域土质均属于砂土(砂质土壤)。 土壤pH值均大于7, 呈碱性。 该地区内植被类型单一, 植被稀疏低矮, 群落结构和生态系统结构脆弱。 矿区西端有干枯的河床由西南向东北, 存在以柽柳为主的大量自然生长的低矮植被; 矿区内有人工林和排土场2处复垦区域, 采矿区的南部大部分区域为裸地, 多为风沙土和裸岩石砾地; 矿区南端10 km处有一泉水点, 以泉水为源头形成向北径流, 流出约800 m后径流下渗或蒸发终结, 沿着径流两边植被茂密[16]。
土壤样品按照不同的土地利用类型土壤进行分区采集(表1), 各采样点间距设置为100 m, 主要针对植被根系土进行采样, 采集时间为晴朗白天上午9:00— 12:00。 同时, 还设置了4个区域的24 h采样点, 从当日上午9时至次日上午9时为一个连续周期, 每隔2 h采集一次土壤碳排放速率和土样。 每次获取0~10 cm表层土壤约500 g装入密封袋低温保存。 获得土壤样品后进行风干研磨过筛并去除草石等杂质, 用于后续实验室光谱数据的测量。
![]() | 表1 试验样地概况 Table 1 General situation of sample plot |
光谱数据采集使用FieldSpec 4型光谱仪在暗室进行, 波长范围为350~2 500 nm, 其中350~1 000 nm的采样间隔为1.4 nm, 1 000~2 500 nm采样间隔为2 nm。 对每个样品采集10条光谱曲线, 通过跳跃点校正后取算术平均值作为该样品的纯净光谱曲线, 并去除350~399与2 401~2 500 nm噪声波段, 最终保留400~2 400 nm数据用作分析。
土壤碳排放速率数据采集使用便携式CO2气体分析仪器(PP-Systems Amesbury USA), 测定时间为晴朗白天上午9:00— 12:00, 每个样地提前一天安置高10 cm、 直径为12 cm的土壤呼吸环一个。 初始采样时间设置为100 s, CO2浓度设置为100 ppm, 开始采样时间设置为12 s, 对每个采样点重复测量2次, 取平均值作为该样点土壤呼吸速率。 昼夜24 h土壤碳排放监测方法与上述一致, 测定土壤呼吸速率同时测定土壤温度(soil temperature, ST)、 土壤湿度(soil moisture, SM)。 研究区当日最高气温Tday与最低气温Tnight由中国气象数据网(http://data.cma.cn)获取。 光谱数据预处理在ViewSpec Pro 5.6与The Unscrambler X 10.4中进行, 数据分析及绘图在Origin2022b中进行, 数据集建模与验证集构建在MATLAB 2018中进行, 显著性分析在SPSS 20.0 中进行。
1.3.1 光谱变换
为了得到平稳的光谱反射率, 采用多项式平滑(Savitzky-Golay, SG)进行平滑滤波处理, 去除波段中的少量噪声(使用五点平滑)。 选取6种光谱数据预处理方法, 包括原始处理(R)、 倒数对数(Log(1/R))、 均方根(
1.3.2 光谱特征筛选
采用CC-SPA[19]联合算法进行优化筛选, 利用相关系数法(correlation coefficient, CC)得到初次筛选波段结果, 并将该结果作为自变量, 土壤碳排放速率为因变量, 利用连续投影算法(successive projections algorithm, SPA)进行二次筛选, 剔除特征性较弱波段, 留下特征性较强波段, 最终得到光谱特征波段。
1.3.3 土壤碳排放外部影响指标选择
根据前人的研究, 土壤温度、 土壤湿度、 植被覆盖状况、 土壤盐渍化程度等指标均对土壤碳排放有一定程度影响。 因此, 将实测点的ST、 SM、 归一化差异植被指数[20](normalized difference vegetation index, NDVI)、 比值植被指数[21](ratio vegetation index, RVI)、 土壤湿度监测指数[22](soil moisture monitoring index, SMMI)、 裸岩石砾地指数[17](new gravel land index, NGLI)、 土壤盐渍化指数[23](salinity index, SI-T)及表观热惯量[24](apparent thermal inertia, ATI)作为参数输入用于模型构建。 依据前期研究和实地调查, 研究区多裸岩石砾地且土壤含盐量较高, 而 NGLI可反映研究区土壤湿度的实际状况且能正确识别裸岩石砾地及露天采坑; SI-T可有效反演土壤盐渍化情况。 因此有针对性地加入这两个指数。 具体计算公式见表2。
![]() | 表2 外部影响指标计算公式 Table 2 Calculation formula of external impact indicators |
1.3.4 土壤碳排放遥感反演模型建立与检验
基于MATLAB 2018b与 The Unscramber X建立偏最小二乘[25](partial least squares regression, PLSR), 支持向量机[26](support vector machines, SVM), 随机森林[27](random forest, RF)和遗传优化神经网络[28](genetic algorithm-BP neural network, GA-BP)算法用于建立土壤碳排放遥感反演模型。
综合土地利用类型是将5个研究区的白天监测样本放在一起, 通过随机划分法, 将白天的74个土壤样品的70%作为训练集用于建模, 30%用于模型验证。 在评价出最优的模型后, 再使用24 h的样点中白天11:00的样本去评价模型的预测能力; 区分土地利用类型是将5个研究区的白天监测样本依据不同的土地利用类型区分开来, 使用相同的数据集划分方法、 建模策略以及精度评价指标。 综合土地利用类型旨在找到对土壤碳排放具有普遍性响应的特征波段, 并根据特征波段建立反演模型, 而区分土地利用类型在实验的设计上与综合土地利用类型一致, 仅使用的样点个数为单一区域的样点个数。
昼夜土壤温度、 湿度等不同, 土壤碳排放速率也会受到影响, 相应的昼夜土壤碳排放特征波段也会出现变化, 为探究这些变化的具体情况, 利用24 h监测点对不同土地利用类型土壤碳排放速率与光谱反射率进行相关性分析。 由于昼夜土壤样本数量有限, 故昼夜土壤碳排放不用于预测建模, 仅对特征波段筛选的差异进行分析。
评价指标选取可决系数(R2)、 均方根误差(root mean square error, RMSE)检验各模型拟合程度与预测精度。 R2越大、 RMSE越小, 代表模型拟合程度越高, 模型可信度更高。 评价指标计算公式如式(1)和式(2)
式(1)和式(2)中,
由图1可知, 5种土地利用类型的反射率曲线R[图2(a)]在400~2 400 nm范围内具有相似的变化趋势, 在1 400、 1 800和2 200 nm处有明显的吸收峰, 1 400和1 800 nm附近的吸收峰主要是由于大气中的水分吸收和游离水中的氢氧化物离子(OH)引起[29], 而2 200 nm附近的吸收峰与Al— OH和粘土矿物有关[30]。 经SG+
由图2可知, 5种不同土地利用类型土壤碳排放与R+SG、
2.3.1 综合土地利用类型
设置P=0.01显著性水平, 将2.2部分筛选得到的特征波段作为自变量X, 土壤碳排放速率作为因变量Y, 采用SPA算法进行二次筛选。 由图3(a)可知, 综合土地利用类型下土壤碳排放最佳特征波段主要分布在400~738、 988~1 363、 1 585~2 399 nm范围内, 相关系数r均大于0.8。 6种光谱变换得到的特征波段均主要集中于中红外范围(1 535~2 399 nm)占筛选出总波段数目的69.2%; 差异处主要集中于可见光与近红外范围, R+SG、
![]() | 图3 综合土地利用类型波段筛选结果(a), 区分土地利用类型波段筛选结果(b)Fig.3 Screening results of bands for comprehensive land use types (a), Screening results of bands for different land use types (b) |
2.3.2 区分土地利用类型
由图3(a)可知, 排土场除MSC未保留特征波段, 其余方法均筛选得到了特征波段, 集中在1 000~2 365 nm, 在400~680 nm内也有一定的分布; 人工林保留了3种变换下的土壤碳排放特征波段, 主要分布于1 911~2 398 nm; 南线、 红沙泉及柽柳类型仅有R+SG+1st通过了显著性水平为99%的特征筛选, 特征波段主要分布在406~421、 853~1 380及2 309~2 392 nm。 这表明土壤碳排放在红光波段敏感性较弱, 在近红外及短波红外波段敏感性较强。
2.3.3 昼夜土壤碳排放光谱特征的差异分析
2.3.1与2.3.2部分结果表明, 在R+SG+1st变换下特征波段在全波段均有分布, 因此选取R+SG+1st变换结合CC法筛选白天与夜晚的土壤碳排放速率特征波段, 显著性检验水平为P=0.01。 由图4可知, 原始的未变换光谱未筛选出特征波段; 而经过R+SG+1st变换后, 特征波段被有效地凸显出来; 人工林、 南线和柽柳的特征波段呈“ 零星式” 分布, 集中在近红外区, 夜晚特征波段主要集中于1 000 nm之后。
图5为区分土地利用类型下昼夜土壤碳排放的特征波段在波谱上的分布情况, 左上图表示二维平面内昼夜特征曲线, 右上图为白天与夜晚特征波段在每个光谱范围的波段平均位移距离。 由图5可知, 白天特征波段较夜晚在波长上有一定程度的“ 红移” 现象。 经分析后认为, 这种“ 红移” 现象是由于夜晚土壤温度相较于白天更低, 土壤呼吸随之发生变化, 导致处于可见光和近红外的特征波段的减少, 从而造成曲线上的“ 红移” 。 从灰底折线图的分析结果来看, 相同波段间的差值越大, 证明在该波段之前受昼夜影响的特征波段损失越多, 综合各光谱范围内的平均“ 红移” 距离发现, “ 红移” 距离最大处在近红外区间(NIR)与中红外(MIR)区间, 说明了该区间之前的特征波段受昼夜影响较大, 这样我们在进行夜间遥感监测时可利用特征波段集中的近红外和中红外来进行土壤呼吸的反演。 依据上述的结论, 我们利用高光谱遥感技术监测夜间的土壤呼吸成为可能, 为未来夜间遥感监测矿区土壤呼吸提供了可行性方案。
2.4.1 综合土地利用类型
将筛选的特征波段与土壤碳排放速率相结合, 利用PLSR、 SVM、 RF及GA-BP分别构建土壤碳排放速率回归模型。 四种模型建模效果存在差异性, 总体上SVM效果最好, 验证集平均值为0.623, 为0.15 gm-2· hr-1, 其次分别为RFR(R2=0.435, RMSE=0.185 gm-2· hr-1)、 PLSR(R2=0.408, RMSE=0.196 gm-2· hr-1), GA-BP模型效果较差(R2=0.272, RMSE=0.233 gm-2· hr-1)。 SG+
在原始波段反演模型中分别加入ST、 SM等土壤碳排放外部影响指标(p=0.01), 进一步判断模型精度有无提高, 最终建立基于最佳自变量组合的土壤碳排放最优遥感反演模型。 由图6可知, 加入不同的指标后SVM效果较好, 特别是加入RVI与NDVI后建模精度有显著提升(R2=0.813), 预测精度显著提升。 相较之下其余三个算法的精度偏低, 预测效果较差。
通过模型筛选结果, 可以表明基于SVM进行建模回归效果最好。 由表3可知, 在R+SG+1st-SVM中加入ST、 SM后预测集由0.696提升至0.765(R+SG+1st+ST+SM), RMSE=0.123 gm-2· hr-1, R2提升了9.9%; 在R+SG+1st+ST+SM-SVM中加入RVI与NDVI较R+SG+1st-ST+SM有显著提升, 预测集R2=0.813, RMSE=0.116 gm-2· hr-1, 预测集拟合R2=0.853。
![]() | 图6 添加不同特征因子后碳排放速率建模验证集R2Fig.6 R2 of carbon emission rate modeling verification set after adding different characteristic factors |
![]() | 表3 基于SVM的不同自变量组合方式结果对比 Table 3 Comparison of the results of different combinations of independent variables based on SVM |
2.4.2 区分土地利用类型
通过对各土地利用类型土壤进行特征波段与光谱指数的复合建模, 由表4可知, 对于排土场类型, 基于
![]() | 表4 不同土壤类型最佳建模方式结果 Table 4 Results of best modeling methods for different soil types |
土壤碳排放速率变化所引起的碳源汇效应决定了土壤内部有机碳、 无机碳的含量变化, 而采矿活动是影响矿区土壤碳呼吸速率变化的主要原因。 目前缺少可靠方法定量监测采矿扰动下土壤碳排放的光谱特征波段及反演模型的研究。 本研究不仅从荒漠化矿区全局出发, 对全区土壤碳排放进行了高光谱遥感监测, 同时也对受采矿活动影响的各土地利用类型土壤碳排放进行了监测, 并与自然状态下土壤碳排放作对比。 选取土壤碳排放最优反演模型和取得实际遥感数据, 获取最优特征波段并计算光谱指数实现区域范围内土壤呼吸速率反演, 可从宏观角度为卫星观测大尺度区域土壤碳排放遥感监测提供科学依据; 另一方面, 卫星监测范围过大难以精准监测矿区内不同土地利用类型下土壤碳排放, 本研究建立的不同土地利用类型下土壤碳排放最优遥感反演模型为无人机小尺度遥感监测提供了支持。 研究发现: 400~2 400 nm范围内, 南线与排土场复垦区土壤光谱特征与自然植被类型土壤的光谱特征存在显著差别, 土壤反射光谱曲线更加低平, 反射率更小, 这表明了采矿影响下土壤与自然状态土壤在光谱特征方面具有明显差异性。 这种现象可能与土壤复垦重建导致土壤内部粒径结构改变有关[10]; 而近几年来, 随着矿坑不断扩张, 南线裸地土壤受影响最大, 因此造成光谱特征发生明显变化。 排土场复垦区与受采矿活动影响区域一直为矿区土壤研究中的重要对象, 因此应着重研究复垦植被与纯裸地土壤碳排放的高光谱响应特征, 厘清复垦、 采矿对土壤碳排放的影响, 从而可为高光谱遥感定量反演土壤碳排放速率提供了理论基础。
经过SG平滑后的光谱反射率可以在一定程度上提高土壤碳排放模型的预测精度。 SG平滑有效减少或消除光谱噪声的影响并提高预测精度, 这在以往研究中被证实[9]。 基于一阶微分变换综合土壤碳排放最佳模型验证集R2与RMSE分别为0.813与0.126 gm-2· hr-1。 说明在光谱处理中一阶微分不仅可以减少基线效应, 消除背景噪声, 还可以增强光谱灵敏度信息, 提高模型效果。 通过SVM建立的土壤碳排放遥感反演模型为综合土壤类型的最优模型; 不同土壤类型中, 人工林、 柽柳同样由SVM建立的土壤碳排放遥感反演模型为最优模型, 而排土场、 南线及红沙泉为GA-BP模型。 SVM可以很好地预测土壤碳排放速率, 特别是对于碳排放速率较强的区域, Yang[31]表明SVM优于PLSR、 神经网络模型, 尤其更适用于小范围、 小样本点回归建模。 而GA-BP较于传统BP加入遗传寻优算法后也提高了模型最优阈值确定的准确性[32]。
在选取最佳自变量的方式上, 加入ST、 SM的回归模型较原始特征波段回归建模精度有显著提升。 加入土壤外部特征因子, 对估测碳排放速率精度有一定的改善。 研究表明土地覆盖类型是气候变化的重要因素[11], 可显著改变陆地生态系统中的碳通量大小及变化程度。 对于加入土壤碳排放外部影响指标来说, 排土场及人工林植被覆盖度较高, 因此引入NDVI、 RVI建模效果最好, 这与文献中的结论一致[33]; 南线为干旱型裸地、 红沙泉属于植被覆盖区且盐渍化严重, 该地物类型加入盐渍化指数SI-T建模效果最好, 可能由于该土壤含盐量较高, 限制了土壤内部微生物呼吸活性[9]; 柽柳属于自然生长型干旱区土壤, 土壤含水率在各地物中最低, 加入基于Red-NIR特征空间构建的土壤湿度监测指数SMMI建模效果最好。
探究荒漠化矿区土壤碳排放的高光谱数据响应特征, 并利用PLSR、 SVM、 RF与GA-BP分别建立全区土壤及5种不同土地利用类型土壤碳排放遥感反演模型, 进一步探讨了昼夜土壤碳排放敏感波段。 主要得到以下结论:
(1)光谱数据变换与光谱特征筛选方法可捕捉到更多表征土壤碳排放速率变化的光谱信息。 对于矿区综合土壤, 1st-ST+SM+NDVI+RVI-SVM土壤碳排放遥感反演模型最好, 可准确估测矿区土壤碳排放变化。 排土场土壤碳排放最优模型为
(2)昼夜光谱反射率与土壤碳排放存在差异性, 在夜晚, 可见光范围内的特征波段出现了大量的损失, 而近红外和中红外的特征波段基本不受影响。 排土场白天共识别251个特征波段, 主要分布于近红外; 夜间共188个, 集中于近红外及中红外; 人工林白天为10个特征波段, 夜晚为6个; 南线白天特征波段为21个特征波段, 夜晚共16个; 柽柳白天为8个特征波段, 夜晚为21个。
针对荒漠化矿区土壤碳排放遥感监测, 未来需进一步探究采矿活动对不同地类土壤内部物理结构及理化性质的影响机制, 通过构建多类型敏感因子及土壤物理参数可有望进一步提高碳排放反演模型精度。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|