紫外-可见吸收光谱结合化学计量学算法的水体总有机碳浓度快速检测
李煜1, 毕卫红1,2,*, 孙建成1, 贾亚杰1, 付广伟1, 王思远1, 王兵3
1.燕山大学信息科学与工程学院, 河北省特种光纤与光纤传感重点实验室, 河北 秦皇岛 066004
2.长春理工大学中山研究院, 广东 中山 528437
3.秦皇岛红燕光电科技有限公司, 河北 秦皇岛 066004
*通讯作者 e-mail: bwhong@ysu.edu.cn

作者简介: 李 煜, 1994年生, 燕山大学信息科学与工程学院博士研究生 e-mail: li_yu@stumail.ysu.edu.cn

摘要

总有机碳(TOC)指悬浮或溶解于水中有机物的含碳总量, 是以单位体积水体中含碳的质量来表示水中有机物的浓度, 通过总有机碳可以更全面反映水中有机污染物的总量。 总有机碳的监测能够推动我国实现“碳达峰”和“碳中和”的目标, 也对我国海洋地球碳循环的研究具有重要的意义。 目前, 国标法测量水质TOC主要采用高温催化氧化法和湿法氧化法, 这两种方法虽测量准确、 可解释性强, 但都具有测试方法复杂、 测量时间长、 易产生二次污染、 人力物力消耗巨大等缺点, 且仅能在实验室内完成, 无法进行TOC的原位在线测量。 因此发展水质TOC快速、 实时、 在线监测技术具有重要意义。 为此, 建立了TOC标准溶液浓度基于紫外吸收光谱的单波长检测模型, 针对物质种类更为复杂的真实水样分别使用ACO-PLS和SPA算法筛选特征波长, 对比S-G平滑处理、 最小最大归一化、 标准正态变换(SNV)、 消除常数偏移量、 导数校正等多种光谱预处理方法的效果, 经过粒子群算法优化的最小二乘支持向量机算法(PSO-LSSVM)建立快速检测模型。 结果表明, 选取不同数量特征波长, 经SNV算法预处理后的建模效果普遍优于其他预处理方法; 选用不同预处理算法, 最佳特征波长数量普遍为50个, 过多或过少的波长数量会使建模精度降低; 最佳建模参数为选用SNV预处理方法, 经ACO-PLS算法筛选50个特征波长组合并利用PSO-LSSVM算法建模, 最优模型结果训练集 Rc达到0.984 3, RMSEC为0.457 4, 验证集 Rp为0.974 5, RMSEP为0.481 1。 将最优光谱检测模型应用于新采集水样, 预测结果较为准确, 具有一定鲁棒性。 表明ACO-PLS算法可以有效选取特征波长, 结合PSO-LSSVM算法可以实现利用紫外-可见吸收光谱对水体中TOC的测量, 为水体TOC含量快速检测提供一种快速、 无污染的测量方案, 给相应传感器的研发提供了科学支持。

关键词: 总有机碳; 紫外-可见吸收光谱; 蚁群-偏最小二乘算法; 粒子群-最小二乘支持向量机
中图分类号:O657.3 文献标志码:A
Rapid Detection of Total Organic Carbon Concentration in Water Using UV-Vis Absorption Spectra Combined With Chemometric Algorithms
LI Yu1, BI Wei-hong1,2,*, SUN Jian-cheng1, JIA Ya-jie1, FU Guang-wei1, WANG Si-yuan1, WANG Bing3
1. School of Information Science and Engineering, The Key Laboratory for Special Fiber and Fiber Sensor of Hebei Province, Yanshan University, Qinhuangdao 066004, China
2. Zhongshan Institute of Changchun University of Science and Technology, Zhongshan 528437, China
3. Qinhuangdao Hongyan Photoelectric Technology Co., Ltd., Qinhuangdao 066004, China
*Corresponding author
Abstract

Total Organic Carbon (TOC) refers to the total amount of carbon contained in suspended or dissolved organic matter in water. It represents the concentration of organic matter in water by the mass of carbon contained in a unit volume of water. Total organic carbon can reflect more comprehensively the total amount of organic pollutants in the water. Monitoring total organic carbon can promote China to achieve the goals of “carbon peaking” and “carbon neutrality”, and it also has great significant meaning to the study of China's ocean earth carbon cycle. The national standard method for measuring water quality TOC mainly adopts the high-temperature catalytic oxidation method or wet oxidation method. Although the above two methods are accurate in measurement and have a high interpretability, they have disadvantages, such as complicated test methods, long measurement time, secondary pollution, and huge workforce and material resources waste. These methods can only be completed in the laboratory, so it is impossible to realize the in-situ online measurement of TOC. Therefore, it is -greatly significant for us to study the method of rapid and in-situ monitoring of TOC in water. This paper has established a single wavelength concentration detection model for TOC standard solution based on UV absorption spectra. Duo to more complex substance content of real water samples, ACO-PLS and SPA algorithms were used to select characteristic wavelengths and the performance of different spectral pretreatment methods, including S-G smoothing, min-max normalization, Standard Normal Variation (SNV), elimination of constant offset, derivative correction, were compared. The fast detection model of real water samples based on spectral absorption was established the least squares support vector machine algorithm (LSSVM) optimized by particle swarm optimization (PSO). The experimental results show that the modeling effect of SNV algorithm pretreatment is generally better than that of other pretreatment methods when a different numbers of characteristic wavelengths are selected. Moreover, the optimal number of characteristic wavelengths is generally 50 with different preprocessing algorithms because too many or too few wavelengths will reduce the modeling accuracy. The optimal modeling parameters are the SNV preprocessing method with 50 characteristic wavelength combinations selected by the ACO-PLS algorithm. The optimal PSO-LSSVM model result shows Rc=0.984 3, RMSEC=0.457 4, Rp=0.974 5, RMSEP=0.481 1. The optimal TOC detection was successfully applied to newly collected water, demonstrating the robustness of the model. ACO-PLS can effectively select the characteristic wavelength combination. Thus, the rapid determination of TOC in water quality based on UV-Vis absorption spectroscopy can be realized with the PSO-LSSVM algorithm, which provides a fast and pollution-free measurement scheme for TOC in water and provides theoretical support for the development of TOC sensors.

Keyword: TOC; UV-Vis; ACO-PLS; PSO-LSSVM
引言

水是万物之源, 近年来随着我国人口不断增加, 工业化和农业现代化的逐步推进, 经济水平不断提高, 大量废水污水排入河流或海洋中, 水体污染越来越严重, 水环境持续恶化, 严重危害了人民的生命健康。 我国主要水质污染类型是有机物污染[1], 用于表征水体中有机物含量的指标主要包括: 总有机碳(total organic carbon, TOC)、 化学需氧量(chemical oxygen demand, COD)等。 水体中TOC指水体中与有机物质相关的碳元素总称, 主要包括溶解或悬浮在水中的有机物, 以单位体积水体中含有机碳的质量来表示水中有机物的浓度, 通常以mg· L-1来表示, 是反映水中有机物总量的综合指标, 可以评价水体受有机物污染的程度。 目前, 国内外测量水质TOC有多种方法, 我国针对TOC标准测量方法采用燃烧/湿法氧化法[2, 3], 这两种方法虽测量精确, 但都存在操作较为复杂、 测试时间长、 使用化学试剂易产生二次污染等缺陷。 水质TOC的快速检测在水环境监管治理中具有重要价值, 并且对海洋碳循环的研究也具有重要的意义。 近年来国内外学者对TOC快速监测进行了大量研究, 电导法[4]、 化学发光法[5]、 离子色谱法[6]、 光谱法等是近年来发现的新型TOC检测方法, 其中光谱法因其具有检测快速、 无需添加化学试剂、 测量设备结构简单且维护成本较低等优势, 是目前优势比较明显的测定方法。

目前普遍使用紫外-可见吸收光谱对水体中有机物质含量进行表征, 同时采用主成分分析(principal component analysis, PCA)和连续投影算法(successive projections algorithm, SPA)进行特征提取。 Erwan Carré 等[7]选取240~400 nm吸收光谱波段采用偏最小二乘回归算法对污水处理厂排放水样COD含量进行建模, 测试集最佳决定系数 Rp2达到0.801; Li等[8]采用iPLS、 siPLS、 mwPLS算法选取紫外-可见吸收光谱对南京市前湖内水样COD含量进行建模, 最优检验集Rp达到0.833 4; 管理等[9]分别采用PCA和SPA算法对紫外-可见吸收光谱进行波长选择, 利用支持向量机(support vector machine, SVM)和最小二乘支持向量机(least squares support vector machines, LSSVM)算法对南京市内河流湖泊COD含量进行定量分析, 最佳相关系数R达到0.958; 黄平捷等[10]采用紫外-可见吸收光谱, 使用SPA算法结合SVM算法对饮用水中的典型有机物实现了较好的分类效果; Radzevicius等[11]采用紫外-可见吸收光谱, 使用主成分分析结合PLS算法对农场根菜类蔬菜清洗过程废水悬浮固体、 有机物质等进行了定量分析; Vallet等[12]采用多种光谱预处理方法, 使用PLS算法对法国山脉泉水的TOC、 NO3、 总磷进行定量分析, TOC验证集最优决定系数R2达到0.63。

本工作采用ACO-PLS算法筛选真实水样紫外-可见吸收光谱不同数量的特征波长, 并建立水样的特征波长与国标法测量的TOC浓度间的定量检测模型, 从而实现了水质TOC的快速、 准确测量。

1 实验部分
1.1 材料

总有机碳的国家标准物质为邻苯二甲酸氢钾(potassium hydrogen phthalate, KHP), 实验用标准物质购置于国防科技工业应用化学一级计量站。 首先配置1 000 mg· L-1的TOC标准液母液, 后经过无碳水按比例稀释至1~50 mg· L-1范围的实验样本, 1~10 mg· L-1按1 mg· L-1梯度稀释, 10~50 mg· L-1以5 mg· L-1梯度稀释, 共计18份。

真实实验水样分批次采集于2019年至2022年间, 采集地点包括河北省秦皇岛市、 河北省黄骅市、 山东省威海市、 天津市等地的海域、 河流入海口、 湖泊、 生活污水等, 水体样本共计362份。 样本TOC浓度范围为1.470~18.37 mg· L-1

1.2 样本数据采集

水质总有机碳浓度分析严格遵循GB 17378.4-2007及HJ 501-2009标准规范, 采用日本岛津TOC-L总有机碳分析仪测定。

水样紫外-可见吸收光谱采集采用荷兰Avantes公司的AvaSpec-2048型紫外-可见光纤光谱仪, 光源选用AvaLight-DH-S-BAL型氘/卤素组合光纤光源, 采用10 mm× 10 mm的石英比色皿作为样品池。 光谱采集系统参数设置为积分时间2 ms, 采样平均次数200次, 波长范围200~600 nm, 每个水样采集三次光谱取平均值。 受采集环境及仪器设备的影响, 虽每个水样光谱经过取平均值处理, 光谱曲线仍存在一定冗余信息及噪声, 为减少噪声及冗余信息的影响, 需对采集到的光谱数据进行光谱预处理。

1.3 光谱数据预处理

光谱分析中常用预处理方法一般为S-G多项式平滑、 一阶导数校正(1st Der)、 二阶导数校正(2st Der)、 标准正态变换(standard normal variate, SNV)、 最小最大归一化(min-max normalization)、 消除常数偏移量等。 S-G平滑可以较好消除仪器噪声造成的影响, 导数校正方法对消除基线漂移和增强小特征具有较好效果[13], SNV方法可以降低光的散射和基线漂移对测量光谱的影响[14]

1.4 ACO-PLS算法

意大利学者Dorigo受蚂蚁觅食行为的启发, 对觅食行为进行模拟得到蚁群优化算法(ant colony optimization, ACO)。 ACO算法模仿了蚂蚁群搜寻觅食路径的关键--信息素机制, 对比信息素浓度数值, 选取信息素浓度高路径行走, 不断迭代正反馈寻得最优结果[15, 16]。 本工作通过ACO-PLS算法选择特征波长, 具体实现过程如下: (1) 初始化蚁群参数及信息素浓度, 生成若干蚂蚁, 依据轮盘赌算法生成各蚂蚁个体所选择的对应特征波长; (2) 根据上一步中选择的特征波长利用经典PLS算法建模并计算目标函数值; (3) 根据所计算目标函数值F, 依据信息素理论加强和减弱对应特征波长信息素浓度; (4) 依据统计思想和信息素浓度再次为各蚂蚁个体选取特征波长, 信息素含量高使得该波长被选择概率更高; (5) 重复上述步骤(2)-(5)直至达到迭代次数且算法收敛即可选出最佳特征波长组合。

算法流程如图1所示。 过程中蚁群参数初始化后, 根据每个特征波长的信息素浓度及式(1)计算被选中概率Pi, 式中τ 为信息素浓度矩阵, 根据轮盘赌算法选择下个特征波长; 完成一轮迭代后, 各特征波长对应的信息素根据式(2)计算, 其中ρ 为信息素挥发系数, 其中F为目标函数, 根据式(3)计算。

图1 ACO-PLS算法流程图Fig.1 Flowchart of ACO-PLS

Pi=τi/i=1Nτi(1)

τn=(1-ρ)τn-1+ρF选中(1-ρ)τn-1未选中(2)

F=Q/(1+RMSECV) Q为常数(3)

1.5 PSO-LSSVM算法

1995年Eberhart和Kennedy两位学者根据鸟类族群觅食行为提出的粒子群优化算法(particle swarm optimization, PSO)。 LSSVM算法中惩罚因子c和径向基核函数中σ 2两个参数直接影响着模型建立的优劣[17, 18]。 本工作将cσ 2两个参数组合视为群体中粒子的位置坐标信息, 将其中第i个粒子的位置和速率分别表示为xi=(xi1, xi2), vi=(vi1, vi2), 每个粒子个体经过的最优位置记为pi=(pi1, pi2), 粒子群中全部粒子经过的全局最优位置记为pg=(pg1, pg2), 速率信息根据式(4)进行计算, 式中ω 为惯性因子, c1, c2为个体加速系数, δ 1, δ 2为[0, 1]区间的随机数, 位置信息根据式(5)进行计算, 算法流程如图2所示。

图2 PSO-LSSVM算法流程Fig.2 Flowchart of PSO-LSSVM

vij(t+1)=ωvijt+c1δ1(pijt-xijt)+c2δ2(pgjt-xijt)(4)

xij(t+1)=xijt+vij(t+1), j=1, 2, (5)

2 结果与讨论
2.1 标准溶液紫外-可见吸收光谱采集

实验测得所配置TOC标准溶液的紫外吸收光谱如图3所示。 图3可以看出获得的光谱数据图像平滑, 环境噪声干扰极小, 光谱曲线随浓度增大依次增高, TOC标准液样本对波长范围在200~310 nm波长处的光有明显的吸收作用, 最高吸收峰位于245 nm附近。

图3 TOC标准溶液的紫外吸收光谱Fig.3 UV absorption spectra of TOC standard solutions

水质总有机碳的标准物质为邻苯二甲酸氢钾, 分子式为HOOCC6H4COOK, 结构式如图4所示。 芳香族和杂芳香族化合物光谱在230~270 nm有吸收带, 由π 到π * 反键轨道跃迁和苯环振动相叠加产生, 称为B带; 在含有π 键的生色团羧基(-COOH)作用下与苯环相连, π -π 共轭产生更大的共轭体系, 在200~250 nm范围内产生E2带, 同时B带也会产生较大红移, 二者相互叠加; 同时吸收带会受溶剂影响, 水为极性溶剂会导致谱带峰型平滑, 精细结构消失, 故该标准液在200~310 nm区间内, 产生如图3所示的吸收谱线。

图4 邻苯二甲酸氢钾结构式Fig.4 Molecular structural formula of potassium acid phthalate

2.2 标准溶液单波长定量检测模型建立

分别采用250、 255、 260、 …、 290 nm等9个波长作为特征波长完成单波长检测模型建立, 所建立的标准液浓度与吸光度的一元回归检测模型如图5(a)-(i)所示。

图5 紫外吸收光谱单波长建模结果
(a): 250 nm; (b): 255 nm; (c): 260 nm; (d): 265 nm; (e): 270 nm; (f): 275 nm; (g): 280 nm; (h): 285 nm; (i): 290 nm
Fig.5 Single wavelength model performances of UV absorption spectra
(a): 250 nm; (b): 255 nm; (c): 260 nm; (d): 265 nm; (e): 270 nm; (f): 275 nm; (g): 280 nm; (h): 285 nm; (i): 290 nm

如图5可以看出, TOC标准溶液浓度与各单一波长吸光度间具有良好的正相关性, 选用280 nm的单波长检测模型最佳, 相关系数达到0.999 70, 对于标准溶液, 各紫外单波长模型均可较好反演标准液浓度与吸光度间关系, 只有290 nm处模型结果略差, 原因在于在290 nm处浓度变化导致的吸光度变化较小, 光谱仪检测的误差变大, 故此波长吸光度与TOC浓度间线性相关性变差。

2.3 真实水样紫外-可见吸收光谱采集

实验测得2019年-2022年不同地区不同TOC浓度共计362个样本的紫外-可见吸收光谱, 其中部分样本光谱如图6所示。 由图6可以看出, 水体中物质对光线吸收主要集中于200~450 nm, 其中220 nm附近存在明显的强吸收, 可能来自水体中硝酸根等无机物吸收或来源于水体中普遍存在的腐殖质等有机物质, 但由于水体种类各异, 所含物质繁多, 无法区分吸收峰所对应的物质及含量, 故采用数据驱动方式, 利用ACO-PLS算法进行特征波长筛选; 450~600 nm波段光谱吸光度基本不变, 该处对光的吸收基本由于产生浊度的物质对光的无差异散射导致, 所含信息较少且含有噪声信息, 将其舍去, 故特征波长选择及模型建立选用200~450 nm波段范围。

图6 部分水样紫外-可见吸收光谱Fig.6 UV-Vis absorption spectra of some water samples

2.4 真实水样TOC定量检测模型建立

为消除光谱数据本身的噪声采用不同预处理方法对光谱数据进行处理, 将预处理后光谱分别利用ACO-PLS算法、 SPA算法提取特征波长, 其中SPA算法特征波长个数选择系统最优个数, ACO-PLS算法分别设置提取10、 30、 50、 70个特征波长。

将上述算法获得的特征波长吸光度作为PSO-LSSVM算法的输入数据; 依照8:2比例, 随机分层选取290个样本作为训练集, 剩余72个样本作为验证集, 训练集样本TOC浓度范围为1.470~18.37 mg· L-1, 验证集TOC浓度范围为1.770~8.699 mg· L-1

不同光谱预处理方法结合不同特征波长提取算法建立的TOC定量检测模型采用相关系数(correlation coefficient, R)和均方根误差(root mean square error, RMSE)进行评价, 结果如表1-表7所示。 其中RMSEC和Rc分别为训练集均方根误差和相关系数, RMSEP和Rp分别为验证集均方根误差和相关系数。

表1 无预处理PSO-LSSVM定量检测模型结果 Table 1 Quantitative detection modeling results of PSO-LSSVM without preprocessing
表2 一阶导数预处理PSO-LSSVM定量检测模型结果 Table 2 Quantitative detection modeling results of PSO-LSSVM after first derivative preprocessing
表3 二阶导数预处理PSO-LSSVM定量检测模型结果 Table 3 Quantitative detection modeling results of PSO-LSSVM after second derivative preprocessing
表4 SG平滑预处理PSO-LSSVM定量检测模型结果 Table 4 Quantitative detection modeling results of PSO-LSSVM after SG smoothing preprocessing
表5 SNV预处理PSO-LSSVM定量检测模型结果 Table 5 Quantitative detection modeling results of PSO-LSSVM after SNV preprocessing
表6 消除常数偏移量预处理PSO-LSSVM定量检测模型结果 Table 6 Quantitative detection modeling results of PSO-LSSVM after eliminating constant offset preprocessing
表7 最小最大归一化预处理PSO-LSSVM定量检测模型结果 Table 7 Quantitative detection model results of PSO-LSSVM after min-max normalization preprocessing

表1-表7可以看出, 对比不同光谱预处理方法, 相同数量的特征波长经过SNV方法得到的建模结果普遍优于其他预处理方法的建模结果, 这是由于SNV方法一般用于降低光散射及基线漂移等因素对光谱的影响; 在本研究中对光谱测量的主要影响因素为水体浊度造成的光散射引起吸光度增加, 故SNV方法对利用紫外-可见吸收光谱检测真实水体总有机碳适用性较好; 对比特征波长提取算法, 在不同预处理方法下, 若ACO-PLS算法提取的特征波长数量与SPA算法提取的特征波长数相近, 可达到相近的建模效果, 能够较好地实现对真实水体紫外-可见吸收光谱特征波长的提取; 不同预处理方法, 最佳建模效果均采用ACO-PLS算法提取特征波长。 除不经过预处理的光谱最佳模型所提取特征数量为30个波长, 其余预处理方法下最佳建模方法提取特征波长个数均为50个, 这是由于真实水体中所含物质种类极多, 成分复杂, 较多的特征波长可提供更多的水中含碳量信息, 但过多特征仍存在冗余会使模型效果降低, 故最佳特征波长个数为50个左右。

表1-表7看出, 经SNV预处理算法后的紫外-可见吸收光谱利用ACO-PLS算法提取的50个特征波长, 作为PSO-LSSVM算法的输入数据, 所建立的水体总有机碳定量分析模型效果最佳。 最佳检测模型水体样本训练集和验证集中预测值和真实值对比如图7所示, 图中横坐标为样本序号, 纵坐标为总有机碳浓度值。 最佳检测模型水体样本训练集和验证集中预测值和真实值线性拟合图如图8所示。 最佳检测模型选取的50个特征波长如表8所示。

图7 训练集(a)和验证集(b)的预测值和真实值Fig.7 Predicted value and true value of train set (a) and test set (b)

图8 训练集(a)和验证集(b)中真实值与预测值线性拟合结果Fig.8 Linear fitting results between true value and predicted value in train set (a) and test set (b)

表8 ACO-PLS算法筛选的50个SNV预处理后光谱的特征波长 Table 8 50 feature wavelengths of SNV preprocessed spectra selected by ACO-PLS

如图7中可知, 训练集和验证集中预测值与真实值误差较小, 个别样本因水体环境情况复杂如含有微小生物含碳量分布不均匀导致误差较大, 对总体模型效果评价影响较小。 由图8可知, 训练集和验证集中TOC预测值和真实值相关系数R分别为0.984 3和0.974 5, 模型检测效果良好。

表8所示, 所筛选出的50个波长覆盖200~450 nm, 在220 nm附近虽然存在硝酸根离子等无机物吸收与共轭体系的有机物质在220 nm处吸收产生混淆干扰, 但采用数据驱动方式, 利用ACO-PLS算法筛选波长, 可以比人工更为科学地选择特征波长, 得到更好的检测模型。

2.5 重复性实验

为了验证TOC快速检测模型的稳定性和再现性, 进行了重复性试验, 再次采集河北省秦皇岛市海水、 河流入海口、 生活污水等共计12个样本, 测量其紫外-可见吸收光谱, 依照国家标准采用TOC-L总有机碳分析仪测定其真实TOC浓度, 将光谱数据分别带入最优的六个TOC检测模型中, 模型预测结果如图9所示。

图9 不同预处理方法检测模型的预测值与真实值与预测值线性拟合结果
(a): 无预处理; (b): 一阶导数预处理; (c): 平滑预处理; (d): SNV预处理; (e): 消除常数偏移量预处理; (f): 最小最大归一化预处理
Fig.9 Linear fitting results between true value and predicted value obtained by detection models based on different preprocessing methods
(a): No preprocessing; (b): 1st Der; (c): SG smoothing; (d): SNV; (e): Eliminating constant offset; (f): Min-max normalization

图9(a)-(f)展示了基于不同预处理方法最优的六个TOC检测模型的预测结果和国标法结果的关系, 图9(d)为经SNV预处理后的TOC检测模型效果, 效果优于无预处理和其他预处理方式模型的预测结果, 相关系数R=0.968 7, RMSE=0.487 4。 尽管真实水体如生活污水等会受季节及人类活动影响, 所含有机物质类别及比例有所变化, 但测量结果仍较为准确, 能实现对水体TOC的快速检测, 在后续工作中继续补充不同时间、 地点的真实水样样本可以提高模型的鲁棒性, 可以实现更为准确的测量。

3 结论

三年间采集多个省份地区的海域、 河流入海口、 湖泊等真实水样, 并测量其紫外-可见吸收光谱, 采用国标法测量其TOC浓度, 对光谱数据采用不同方法进行预处理; 利用ACO-PLS和SPA算法提取特征波长, 随机选取全部数据的80%作为训练集, 剩余20%的样本作为验证集, 建立PSO-LSSVM的TOC光谱法定量检测模型。 实验结果表明, SNV预处理算法在不同数量特征波长下具有更优的预处理效果, 更适用于真实水体中TOC紫外-可见吸收光谱的预处理; 在不同预处理算法下ACO-PLS算法普遍选取50个特征波长时建模效果最优; 最佳建模参数为选用SNV预处理方法, 经ACO-PLS算法筛选50个特征波长组合, 模型验证集相关系数Rp为0.9745, 验证集均方根误差RMSEP为0.481 1。 研究表明, SNV算法对水质TOC的紫外-可见吸收光谱有较好的预处理效果, 可一定程度降低真实水体紫外-可见吸收光谱因浊度因素造成的散射等因素造成影响, ACO-PLS可以较好提取紫外-可见光谱的特征波长, 50个左右特征波长数量可以代替全波段特征, 减少了冗余数据, 建模效果最佳, PSO-LSSVM算法所建立模型准确可靠, 利用紫外-可见吸收光谱法可以实现水质总有机碳的快速准确测量, 为目前环保领域的难点提供了解决方案, 给相应传感器的研发提供了科学支持。

参考文献
[1] YAN Xiao-han, WEN Wei, XIE Ying, et al(闫晓寒, 文威, 解莹, ). Environmental Science & Technology(环境科学与技术), 2020, 43(6): 169. [本文引用:1]
[2] Ministry of Environmental Protection of the People's Republic of China(中华人民共和国环境保护部). HJ501-2009. Water Quality-Determination of Total Organic Carbon-Combustion Oxidation Nondispersive Infrared Absorption Method(HJ501-2009. 水质总有机碳的测定燃烧氧化-非分散红外吸收法). Beijing: China Environmental Science Press(北京: 中国环境科学出版社), 2009: 12. [本文引用:1]
[3] General Administration of Quality Supervision, Inspection and Quarantine of the People's Republic of China(中华人民共和国国家质量监督检验检疫总局). GB 17378. 4-2007. The Specification for Marine Monitoring-Part 4: Seaawater Analysis(GB 17378. 4-2007, 海洋监测规范第4部分: 海水分析). Beijing: China Stand ards Press(北京: 中国标准出版社), 2007: 105. [本文引用:1]
[4] ZHANG Li-chen, ZHANG Peng-liang(张立琛, 张朋亮). Electronic Technology & Software Engineering(电子技术与软件工程), 2016, (15): 137. [本文引用:1]
[5] REN Guo-xing, MA Ran, ZHANG Shu-wei, et al(任国兴, 马然, 张曙伟, ). Ocean Technology(海洋技术), 2011, 30(3): 21. [本文引用:1]
[6] Stefánsson Andri, Gunnarsson I, Giroud N. Analytica Chimica Acta, 2007, 582(1): 69. [本文引用:1]
[7] Carré Erwan, Pérot Jean, Jauzein Vincent, et al. Water Science & Technology, 2017, 76(3): 633. [本文引用:1]
[8] Li Jingwei, Tong Yifei, Guan Li, et al. Optik, 2018, 174: 591. [本文引用:1]
[9] Guan Li, Tong Yifei, Li Jingwei, et al. RSC Advances, 2019, 9(20): 11296. [本文引用:1]
[10] HUANG Ping-jie, LI Yu-han, YU Qiao-jun, et al(黄平捷, 李宇涵, 俞巧君, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2020, 40(7): 2267. [本文引用:1]
[11] Radzevičius Algirdas, Dapkiene Midona, Sabiene Nomeda, et al. Applied Sciences, 2020, 10(24): 9072. [本文引用:1]
[12] Vallet Aurélien, Moiroux Fanny, Charlier Jean-Baptiste. Proceedings of Eurokarst 2018, Besançon, Advances in the Hydrogeology of Karst and Carbonate Reservoirs, 2020, 109. [本文引用:1]
[13] Shen Fei, Yang Danting, Ying Yibin, et al. Food and Bioprocess Technology, 2012, 5(2): 786. [本文引用:1]
[14] Luna Aderval S, da Silva Arnaldo P, Ferré Joan, et al. Spectrochimica Acta Part A: Molecular & Biomolecular Spectroscopy, 2013, 100: 109. [本文引用:1]
[15] YANG Rui-rui, WANG Ying(杨锐锐, 王颖). China Southern Agricultural Machinery(南方农机), 2018, 49(13): 38. [本文引用:1]
[16] GUO Zhi-ming, HUANG Wen-qian, PENG Yan-kun, et al(郭志明, 黄文倩, 彭彦昆, ). Chinese Journal of Analytical Chemistry(分析化学), 2014, 42(4): 513. [本文引用:1]
[17] WU Tong-yu, WU Shao-xiong(吴桐雨, 吴少雄). Statistics & Decision(统计与决策), 2018, 34(8): 21. [本文引用:1]
[18] HU Jin-qiu, GUO Fang, ZHANG Lai-bin(胡瑾秋, 郭放, 张来斌). Journal of Electronic Measurement and Instrument(电子测量与仪器学报), 2018, 32(2): 36. [本文引用:1]