小波变换的潮滩沉积物含水量预测
李雪莹1,2, 李宗民3,*, 陈光源4, 邱慧敏2, 侯广利2, 范萍萍2,*
1.中国石油大学(华东)地球科学与技术学院, 山东 青岛 266580
2.齐鲁工业大学(山东省科学院), 山东省科学院海洋仪器仪表研究所, 山东 青岛 266061
3.中国石油大学(华东)计算机科学与技术学院, 山东 青岛 266580
4.山东科技大学海洋科学与工程学院, 山东 青岛 266590
*通讯作者 e-mail: lizongmin@upc.edu.cn; fanpp_sdioi@126.com

作者简介: 李雪莹, 女, 1990年生, 中国石油大学(华东)地球科学与技术学院博士研究生 e-mail: 412973984@qq.com

摘要

潮滩沉积物水分的分布在空间和时间上会有很大的变化, 含水量的变化会导致沉积物中生源要素含量的变化。 因此, 实时、 准确、 快速的监测潮滩沉积物含水量, 对了解潮滩的各种特性, 掌握潮滩生源要素信息, 潮滩资源的开发有着重要意义。 采集青岛市东大洋村潮间带的沉积物115份, 分别测定新鲜样品、 风干4周、 风干8周样品的可见近红外光谱和含水量。 以db10小波基和sym6小波基对原始光谱进行小波变换, 采用偏最小二乘回归建立潮滩沉积物含水量模型。 通过10阶小波变换获取原始光谱的低频信息 An和高频信息 Dn( n=1, 2, …, 10), 通过原始光谱 S分别与高频信息 Dn做差值, 得到 S-Dn, 对 An, Dn S-Dn建立潮滩沉积物含水量模型, 并对模型结果进行分析。 原始光谱建立模型的Rp2为0.841, RMSEP为2.767, RPD值为2.481。 通过对db10小波基变换后的低频和高频信息分析, 无用信息主要集中在 D3 D4, 去除 D3 D4建立的含水量模型, 相比于原始光谱模型精度有明显提高,Rp2为0.878, RMSEP为2.501, RPD值为2.749; 通过sym6小波基变换后进行分析, 无用信息主要集中在 D5 D9, 去除D5和D9建立含水量模型与原始光谱模型相比, 精度也有一定提高,Rp2为0.87, RMSEP为2.475, RPD值为2.768。 因此通过小波变换对原始光谱划分低频信息和高频信息进行分析, 能够有效找到潮滩沉积物含水量的干扰信息, 实现特征信息提取, 从而建立准确度更高的潮滩沉积物含水量模型, 为潮滩沉积物含水量实时、 动态监测提供理论基础。

关键词: 潮滩沉积物; 小波变换; 含水量; 可见-近红外光谱
中图分类号:O657.3 文献标志码:A
Prediction of Tidal Flat Sediment Moisture Content Based on Wavelet Transform
LI Xue-ying1,2, LI Zong-min3,*, CHEN Guang-yuan4, QIU Hui-min2, HOU Guang-li2, FAN Ping-ping2,*
1. School of Geosciences, China University of Petroleum (Huadong), Qingdao 266580, China
2. Institute of Oceanographic Instrumentation, Qilu University of Technology (Shandong Academy of Sciences), Qingdao 266061, China
3. College of Computer Science and Technology, China University of Petroleum (Huadong), Qingdao 266580, China
4. College of Ocean Science and Engineering, Shandong University of Science and Technology, Qingdao 266590, China
*Corresponding authors
Abstract

The distribution of water in flat tidal sediments will change greatly in space and time, and the changes will lead to the changes of biogenic elements in sediments. Therefore, the tidal flat sediment water content data are monitored in real time, accurately and quickly, which is of great significance to understanding the tidal flat characteristics, grasp the information of tidal flat biogenic elements, and develop tidal flat resources. This paper collected 115 samples of intertidal sediments from Dongdayang village, Qingdao city. The visible near-infrared spectra and moisture content of fresh samples, air-dried for 4 weeks and 8 weeks were measured. The db10 and sym6 wavelet basis were used to transform the original spectrum, and partial least squares regression was used to establish the tidal flat sediment moisture content model. The low-frequency information An and high-frequency information Dn ( n=1, 2, …, 10) of the original spectrum were obtained by 10 order wavelet transform. S- Dn was calculated by the difference between the original spectrum S and Dn. The moisture content models were established using An, Dn and S- Dn, respectively, and the results were analyzed. The original spectrum model’sRP2, RMSEP and RPD were 0.841, 2.767 and 2.481. By analysing low-frequency and high-frequency information, after db10 wavelet basis transforms, the useless information was mainly concentrated in D3 and D4, and the accuracy of the moisture content model established by removing D3 and D4 was significantly improved,RP2 was 0.878, RMSEP was 2.501, RPD was 2.749. Through the analysis of sym6 wavelet basis transform, the useless information was mainly concentrated in D5 and D9, theRP2, RMSEP and RPD by removing D5 and D9 were 0.87, 2.475 and 2.768. Therefore, by analyzing the low-frequency and high-frequency information using wavelet transform, the interference information of sediment moisture content can be effectively found, and the feature information can be extracted. The more accurate the tidal flat sediment moisture content model is established, it provides a theoretical basis for real-time and dynamic monitoring of tidal flat sediment moisture content.

Keyword: Tidal flat sediment; Wavelet transform; Moisture content; Visible near infrared spectroscopy
引言

潮滩是海洋与陆地之间的交互地带, 是内外陆以及海动力共同作用的产物[1]。 潮滩沉积物包含自然灾害、 生源要素预测的关键信息[2]。 地表土壤含水量是地表与大气进行水和能量交换的必要途径[3], 受潮汐和波浪作用蒸发和降水的复杂水力学控制。 潮滩沉积物水分的分布在空间和时间上会有很大的变化[4], 含水量的变化会导致沉积物中生源要素含量的变化。 因此, 实时、 准确、 快速的监测潮滩沉积物含水量, 对了解潮滩的各种特性, 掌握潮滩生源要素信息, 潮滩资源的开发有着重要意义。

传统的土壤含水量获取采用烘干法、 时域反射仪法等[5], 沉积物含水量也可采用该方法。 传统方法虽然精准, 但是成本高, 且费时费力, 同时也无法快速、 实时获取含水量。 光谱技术具有快速、 无损等优点, 已广泛应用于多个领域。 水分对沉积物表面短波辐射的反射有很大的影响, 包括光谱的可见-近红外和短波红外区域[6]。 因此光谱能够动态、 实时、 快速的监测潮滩沉积物含水量, 有望成为潮滩沉积物含水量监测的主流技术。 目前基于光谱的土壤和沉积物含水量的测定已有一定的进展。 Ma等[7]基于近红外光谱对农田土壤含水量进行检测和分析, 找到黑土水分的特征吸收谷, 利用吸收谷的光谱特征参数预测黑土的含水量。 Shin等[8]分析了韩国海岸沉积物的矿物学特征及其与含水量相关的光谱特征, 提出了基于传统SAM模块的星载热发射和反射辐射计短波红外遥感方法进行含水量制图的方法。 Shin等[9]于两年后研究短波红外反射率与海滩含水量之间的关系, 发现最佳光谱带, 并根据选定的波带建立的回归模型的R2大于0.74, RMSE小于0.05。

本工作基于可见-近红外光谱, 以青岛市东大洋村潮间带的沉积物为例, 采用小波变换找到能够表征潮滩沉积物含水量的特征信息, 旨在消除具有复杂成分组成的潮滩沉积物的干扰和噪声信息, 建立准确度更高的潮滩沉积物含水量模型, 实现含水量反演, 为潮滩沉积物含水量实时、 动态监测提供科技支撑。

1 实验部分
1.1 试验材料

采集青岛市东大洋村潮间带的沉积物155份。 将采集的一部分样品立即测定可见-近红外反射光谱, 同时测定其含水量。 含水量测定采用烘干法, 110 ℃烘干, 烘干前后的重量差值与新鲜样品百分比即为水分含量。 另一部分放在实验室通风处风干, 分别风干4周和8周后, 采集可见-近红外反射光谱, 测定含水量, 不同条件下潮滩沉积物样品的含水量见表1。 将新鲜样品、 风干4周、 风干8周共计465个样品进行后续分析。

表1 潮滩沉积物水分含量(%)统计表 Table 1 The statistical results of moisture content (%) of tidal flat sediments
1.2 光谱数据采集

采用海洋光学QE65000光谱仪搭配DH-2000-BAL型光源采集沉积物样品的反射光谱, 采样间隔1 nm, 积分时间600 ms, 谱区范围200~1 000 nm。 通过QR400-7-UV-VIS型号的Y型光纤采集样品的反射光谱, 每个样品测定5次, 取平均光谱作为该样品的反射光谱。 删去样品的前段和后段受噪声影响的光谱, 保留220~970 nm光谱。

1.3 小波变换

在光谱分析中, 小波变换可用于数据压缩、 平滑、 滤除噪声等, 常用的小波基有Haar小波、 dbN小波、 Symlets小波。 小波变换是通过选择合适的小波基、 小波分解尺度, 对信号进行小波变换, 得到低频系数和高频系数, 然后进行小波逆变换, 得到重构的光谱数据[10]。 离散小波变换是对离散时间信号进行时频分析的一种数学方法, 其主要思想是多分辨率分析过程[11] 。 假设为小波母函数, 将其进行平移和伸缩得到如式(1)函数

Ψa, τ(t)=a-12Ψt-τa, a> 0, τR(1)

式(1)中, a为尺度参数, τ 为平移参数。 在离散小波变换中, a=2j, τ =2j k, j, kZ, 式(1)转换为如式(2)

Ψj, k(t)=2-12Ψ(2-jt-k), j, kZ(2)

M阶离散小波变换后, 有限长度离散信号S(t)可表达为

S(t)=AM+j=1MDj(t)(3)

式(3)中, AM=kAM, kφj, k, Dj(t)=kDj, kΨj, k(t), AM, kDj, k分别为原始信号的低频和高频系数。

小波基分别选用db10小波和Sym6小波。 通过小波变换获取原始光谱信号的高频和低频信息, 分析每个高频和低频以及S-Dj信息, 找到并去除干扰和噪声信息, 实现潮滩沉积物含水量光谱特征信息的提取。

1.4 建模方法及评价标准

建模方法采用偏最小二乘回归(partial least squares regression, PLSR), 在已知可见-近红外光谱数据和含水量数据的基础上, 通过PLSR建立潮滩沉积物含水量模型, 实现对未知沉积物样品含水量的预测。

样本分类采用SPXY算法以1:1比例划分建模集和预测集, 它是在Kennard-Stone算法基础上发展的, 计算如式(4)-式(6)

dx(p, q)=j=1N[xp(j)-xq(j)]2 p, q[1, N](4)

dy(p, q)=j=1N(yp-yq)2=|(yp-yq|p, q[1, N](5)

dxy(p, q)=dx(p, q)maxp, q[1, N]dx(p, q)+dy(p, q)maxp, q[1, N]dy(p, q)(6)

其中x为光谱数据, y为含水量数据。

评价标准采用建模集和预测集绝对系数 Rc2Rp2, 校正均方根误差RMSEC, 预测均方根误差RMSEP和相对分析误差RPD值, 当 Rc2, Rp2和RPD值越大, RMSEC和RMSEP越小, 则建立的潮滩沉积物含水量模型精度越高。

2 结果与讨论
2.1 基于原始光谱潮滩沉积物含水量预测结果

潮滩沉积物原始光谱以SPXY算法划分建模集(233个样本)和预测集(232个样本), 通过PLSR算法建立含水量模型。 图1为实测和预测含水量拟合图。 潮滩沉积物含水量模型的 Rc2为0.878, Rp2为0.841, RMSEC和RMSEP分别为3.043和2.767, RPD值为2.481, 模型精度较好。

图1 潮滩沉积物原始光谱含水量拟合图
(a): 建模集; (b): 预测集
Fig.1 Scatter plot of the measured against predicted moisture content using original spectra of tidal flat sediments
(a): Modeling set; (b): Prediction set

2.2 基于小波变换(db10小波基)潮滩沉积物含水量预测结果

将潮滩沉积物原始光谱以db10为小波基进行离散小波变换, 分别得到10阶低频信息和高频信息, 图2分别为所有样本平均光谱的低频An和高频信息Dn (n=1, 2, …, 10)。

图2 潮滩沉积物离散小波变换(db10小波基)低频信息和高频信息光谱图Fig.2 Low and high frequency information spectrograms of tidal flat sediment based on discrete wavelet transform (db10 wavelet basis)

由图2, 低频和高频信息均是随n增加而趋于平滑。 分别以原始光谱的低频信息An和高频信息Dn (n=1, 2, …, 10)建立含水量模型, 结果见表2

表2 db10小波基潮滩沉积物低频和高频信息建模结果 Table 2 Modeling results of low and high frequency informations of sediment based on db10 wavelet

表2, 低频信息An中, A4的预测结果最好, Rp2为0.837, RPD值为2.454, RMSEP为2.837, 但仍不如原始光谱预测结果。 由表3, 高频信息Dn结果均较差, 其中D4模型结果最差, 而A4光谱信息中不包含D4, 且模型结果最好, 可初步判定, D4为干扰信息。 为进一步确定D4是否为干扰信息, 分别将原始光谱S与高频信息Dn的差值S-Dn (n=1, 2, …, 10)作为光谱输入, 得到模型结果见表3

表3 db10小波基潮滩沉积物S-Dn光谱信息建模结果 Table 3 Modeling results of S-Dn spectral information of tidal flat sediment based on db10 wavelet

表3, S-D2, S-D3, S-D4, S-D5S-D6光谱信息模型预测结果均优于原始光谱模型结果, Rp2在0.845以上, RMSEP在2.72以下, RPD值在2.5以上。 其中S-D3S-D4模型结果基本一致, 且精度最高, Rc2分别为0.928和0.927, RMSEC分别为2.348和2.365, Rp2分别为0.870和0.873, RMSEP分别为2.5和2.495, RPD值分别为2.742和2.748。 由于S-D3S-D4结果明显高于其他S-D结果, 可判断D3D4含有的无用信息较多, 因此将原始光谱SD3, D4做差值, 去除D3D4高频信息, 得到S-D3-D4, 结果如表3所示。 相比于S-D3S-D4, S-D3-D4Rc2略低, 为0.924; RMSEC略高, 为2.397; 预测集中的 Rp2和RPD值略高, 分别为0.878和2.749; RMSEP略高, 为2.501。 S-D3, S-D4S-D3-D4三个光谱信息模型整体结果相差不大。

2.3 基于小波变换(sym6小波基)潮滩沉积物含水量预测结果

将潮滩沉积物原始光谱以sym6为小波基进行离散小波变换, 同样得到10阶低频信息An和高频信息Dn (n=1, 2, …, 10), 分别以光谱的低频信息和高频信息建立PLSR含水量模型。 为更直观看出AnDn的含水量模型结果, 将预测集 Rp2和RPD结果以折线图和柱状图表示, 见图3。

图3 sym6小波基潮滩沉积物高频和低频信息建模结果Fig.3 Modeling results of low and high frequency informations of sediment based on sym6 wavelet

由图3, 低频信息中, A4预测结果最好, 但仍差于原始光谱预测结果。 高频信息Dn (n=1, 2, …, 10)结果均较差, 其中D4模型结果最差, 与db10小波基结果一致。 为判定D4是否为主要干扰信息, 分别将原始光谱S与高频信息Dn (n=1, 2, …, 10)的差值作为光谱输入, 得到模型结果见表4

表4 sym6小波基潮滩沉积物S-Dn建模结果 Table 4 Modeling results of S-Dn spectral information of tidal flat sediment based on sym6 wavelet

表4, S-D4, S-D5, S-D6, S-D8, S-D9, S-D10光谱信息模型预测结果均优于原始光谱模型结果, Rp2在0.845以上, RMSEP在2.73以下, RPD值在2.5以上。 对比图4结果判定的D4为干扰信息, 虽然S-D4相比于原始光谱结果有所提高, 但是模型精度提高有限, 因此干扰信息有待于进一步讨论。 S-D9模型精度最高, Rc2为0.921, RMSEC为2.456, Rp2为0.869, RMSEP为2.497, RPD值为2.755; 其次为S-D5, Rc2为0.928, RMSEC为2.332, Rp2为0.867, RMSEP为2.542, RPD值为2.702。 S-D9S-D5模型结果最好, 可判定D5D9含有的干扰信息较多, 因此将原始光谱SD5D9做差值, 得到S-D5-D9, 模型结果略有提高, Rp2为0.87, RMSEP为2.475, RPD值为2.768。

3 结论

基于可见-近红外光谱技术, 采集青岛市东大洋村潮间带的沉积物, 分别以db10小波基和sym6小波基对原始光谱进行小波变换, 以偏最小二乘回归建立潮滩沉积物含水量模型。 通过10阶小波变换获取原始光谱的低频信息An和高频信息Dn (n=1, 2, …, 10), 通过原始光谱S分别与高频信息Dn做差值, 得到S-Dn, 对An, Dn, S-Dn建立潮滩沉积物含水量模型, 并对模型结果进行分析。 通过db10小波基变换后的低频和高频信息, 无用信息主要集中在D3D4, 去除D3D4建立的含水量模型, 相比于原始光谱模型精度有明显提高, Rp2为0.878, RMSEP为2.501, RPD值为2.749; 通过sym6小波基变换后的低频和高频信息, 无用信息主要集中在D5D9, 去除D5D9建立含水量模型与原始光谱模型相比, 精度也有一定提高, Rp2为0.87, RMSEP为2.475, RPD值为2.768。 通过小波变换对原始光谱划分低频信息和高频信息进行分析, 能够有效找到潮滩沉积物含水量的干扰信息, 实现提取特征信息, 从而建立准确度更高的潮滩沉积物含水量模型, 为潮滩沉积物含水量实时、 动态监测提供理论基础。

参考文献
[1] ZHANG Ying, ZHANG Dong, HU Ping-xiang(张鹰, 张东, 胡平香). Acta Oceanologica Sinica(海洋学报), 2008, 30(5): 29. [本文引用:1]
[2] Klemas V, Finkl C, Kabbara N. Journal of Coastal Research, 2014, 30(4): 685. [本文引用:1]
[3] Manage L P M, Greve M H, Knadel M, et al. Soil Science Society of America Journal, 2018, 82(6): 1333. [本文引用:1]
[4] Nolet C, Poortinga A, Roosjen P, et al. Plos One, 2014, 9: e112151. [本文引用:1]
[5] LI Xin-xing, LIANG Bu-wen, BAI Xue-bing, et al(李鑫星, 梁步稳, 白雪冰, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2020, 40(12): 59. [本文引用:1]
[6] Verpoorter C, Carrère, V, Combe J P. Journal of Geophysical Research Earth Surface, 2015, 119(10): 2098. [本文引用:1]
[7] Ma Y, Fan X. Asia-Pacific Journal of Chemical Engineering, 2020, 15(1): e2507. [本文引用:1]
[8] Shin H, Yu J, Kim J, et al. Remote Sensing Letters, 2015, 6(4-6): 488. [本文引用:1]
[9] Shin H, Yu J, Jeong Y, et al. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017, 10(10): 4512. [本文引用:1]
[10] Zhang F D, Liu J, Lin J, et al. Infrared Physics & Technology, 2019, 97: 224. [本文引用:1]
[11] Song J, Li G, Yang X . Journal of the Science of Food and Agriculture, 2019, 99(11): 4898. [本文引用:1]