水体COD激光诱导击穿光谱快速测量方法研究
赵贤德1,2, 陈肖2, 董大明2,*
1. 中国农业大学信息与电气工程学院, 北京 100083
2. 北京农业智能装备技术研究中心, 北京 100097
*通讯联系人 e-mail: dongdm@nercita.org.cn

作者简介: 赵贤德, 1984年生, 北京农业智能装备技术研究中心助理研究员 e-mail: zhaoxd@nercita.org.cn

摘要

水体化学需氧量(COD)是一个重要的水体质量指标, 一般用来衡量有机物的污染程度。 对COD的检测长期依赖采样后的实验室化学分析方法, 目前应用最普遍的是重铬酸钾氧化法与酸性高锰酸钾氧化法。 化学分析的方法操作复杂, 耗时费力, 且引入新的化学药剂, 造成二次污染, 因此, 急需一种能够实现水体COD快速测量的检测技术。 在前期研究基础上, 对水体COD的激光诱导击穿光谱检测方法进行深入探索, 重点是优化模型预测速度, 目的是研究激光诱导击穿光谱技术用于对水体COD的快速测量方法。 采集了不同COD浓度的99个水体样本, 分为训练集和测试集两组, 通过重铬酸钾氧化法测定各水样的COD值, 作为真实值, 利用实验室自建的激光诱导击穿光谱采集系统采集各水样波长在200~1 000 nm的光谱信息, 利用偏最小二乘算法建立训练集水样COD的定量化测量模型, 然后对测试集光谱数据进行预测, 将预测结果与实验室化学方法测定的真实值进行对比, 评估预测效果。 通过对原始光谱建立的预测模型进行分析, 发现在建模过程中, 大量的激光诱导击穿光谱数据与COD浓度相关性很差, 而这些无用数据参与计算, 浪费了计算资源, 延长了检测时间, 造成系统负载过大, 不利于便携式检测设备的开发。 重点研究贡献度最大的前几个主成分, 通过对COD测量原理和PLS模型载荷分析, 找到LIBS光谱中与水样COD浓度相关性最高的主要特征峰, 经过分析发现, 主要为来源于水中有机物中的C, H, O, N以及水中一些还原性离子元素的特征峰, 这些特征峰对COD的模型预测能力贡献最大, 而COD的定义正是衡量水体中这些元素的多少, 这与该研究分析结论相吻合。 为了实现检测速度的提升, 提取这些特征峰, 对光谱数据进行降维, 剔除大量无关或相关性较低的数据, 经过多次筛选和降维, 最终将原来参与计算的每条光谱的13 622个数据降到28个, 大大降低系统的运算量, 却依然能够保留不错的预测能力。 筛选出的28个特征波长最能反映水体COD浓度, 为水体COD便携式的多波段检测设备的研发, 实现对COD的快速测量奠定了基础。

关键词: 激光诱导击穿光谱; 化学需氧量; 测量; 偏最小二乘法
中图分类号:X832 文献标志码:A
Study of the Rapid Measurement of COD by Laser-Induced Breakdown Spectroscopy
ZHAO Xian-de1,2, CHEN Xiao2, DONG Da-ming2,*
1. College of Information and Electrical Engineering, China Agricultural University, Beijing 100083, China
2. Beijing Research Center of Intelligent Equipment for Agriculture, Beijing 100097, China
*Corresponding author
Abstract

Chemical Oxygen Demand (COD) is an important water quality parameter, which is generally used to reflect the degree of organic pollution. The detection of COD has long relied on laboratory chemical analysis methods after sampling. The most commonly used method is potassium dichromate oxidation and acid Potassium Permanganate oxidation. However, the chemical analysis methodsarecomplicated, time-consuming and labor-intensive. Moreover, the introduction of new chemicals by these methods causes secondary pollution. Therefore, there is an urgent need for a detection technique that enables rapid measurement of COD in water. Based on the previous research, the test method of COD by the laser-induced breakdown spectroscopy was explored in this paper. The focus was to optimize the model prediction speed in order to study therapid measurement of COD in waterbythe techniqueof laser-induced breakdown spectroscopy. We collected 99 water samples with different COD concentrations, and divided them into two groups: training set and testing set. The COD concentration of each water sample was measured by potassium dichromate oxidation method. And the spectral information of each water sample at the wavelengths of 200~1 000 nm was collected by the laser-induced breakdown spectroscopy acquisition system built by our laboratory. Partial least squares (PLS) algorithm was used to establish a quantitative measurement model for COD of training set samples and the spectral data of test set were predicted. The predicted results were compared with the real values measured by laboratory chemical methods to evaluate the predicted results. By analyzing the prediction model established by the original spectrum, it was found that a large number of laser-induced breakdown spectral data have poor correlation with COD concentration during the modeling process, and these useless data participated in the calculation, wasting computing resources, dragging the detection time, causing the system load to be too large, which was not conducive to the development of portable detection equipment. We focused on the first few principal components with the largest contribution. By analyzing the principle of COD measurement and the load of PLS model, we found the main characteristic peaks of LIBS spectrum which have the highest correlation with the concentration of COD in water. These characteristic peaks belong to C, H, O, N and some reductive ion elements in water. Most of C, H, O and N come from organic matter in water whose characteristic peaks have the greatest contribution to the prediction ability of COD model. The definition of COD reflects the amount of these elements in the water body, which is consistent with our analysis conclusion. In order to improve the detection speed, we extracted these characteristic peaks, and eliminated a large number of unrelated or low-correlation data. After many times of screening and dimensionality reduction, the original 13 622 data of each spectrum were reduced to 28, which greatly reduced the computational complexity of the system, but still retains good prediction ability. The 28 characteristic wavelengths selected are the best ones to reflect the concentration of COD in water, which lays a foundation for the development of portable multi-band detection equipment for COD in water and the rapid measurement of COD.

Keyword: Laser-induced breakdown spectroscopy; Chemical oxygen demand; Measurement; Partical least square
引 言

水是生命之源, 水源直接关系到人类的可持续发展。 水质污染成为人们越来越关注的问题, 而化学需氧量(chemical oxygen demand, COD)是评价水体有机物污染的一个重要指标。 目前, 在检测COD浓度时, 普遍应用的方法是高锰酸钾氧化法与重铬酸钾氧化法[1, 2]。 然而这两种方法都需使用化学试剂, 耗时久, 会产生二次污染, 并且不能实现实时检测水质的需求[3, 4]。 近年来, 有学者提出使用紫外光谱法和近红外光谱法测量水体COD[5], 这两种方法具有实时、 无损测量、 环境友好的优点, 但由于水体透过率差异大, 导致在同一光程下的量程范围较小, 因此很少用于实际的水质快速检测。

激光诱导击穿光谱(laser-induced breakdown spectroscopy, LIBS)是一种新型原子光谱分析技术, 此方法的工作原理是将一束高强度的激光聚焦在样品表面, 瞬时内将样品激发至等离子体态, 获取等离子体云团的发射谱线。 LIBS具有快速、 实时、 且无需样品预处理等优点。 几乎可以测量所有物质中的化学成分, 在目前的材料分析中具有广泛的应用[7, 8]。 LIBS在液态物质测量中的应用也逐渐获得了发展, 研究者们尝试了多种液态物质的LIBS测量方法, 如直接用光纤浸入液体测量[9], 在空气中直接击穿液滴测量[10], 或将液态转换为固态测量[11], 并不断提高检测的灵敏度和精度。 此外, LIBS的性质导致其主要用于元素测量, 但近几年来也有研究者结合化学计量学, 研究LIBS对分子的测量方法[12], 本课题组之前也研究了利用LIBS结合偏最小二乘法测量水体中COD的浓度[13], 主要分析不同的预处理后的建模效果, 并初步发现了LIBS光谱与COD相关性较高的特征波段。

在前期研究的基础上, 尝试利用LIBS实现水体COD的快速测量, 验证利用相关性较高的特征波段建模对COD浓度的预测能力, 并继续对特征波长进行筛选, 找到LIBS光谱对COD最相关的主要特征波长, 剔除大部分相关度低的数据, 实现对模型自变量的降维, 大大降低运算量, 有利于小型速测设备的研制和开发。

1 实验部分
1.1 样品

实验所需水样取自北京市朝阳区亮马河的不同河段, 选择污物和杂质较少的河段取水, 共取水样10组, 每个水样各取约500 mL, 水样运输过程中采用棕色瓶低温密封保存, 测试时间距离样本采回不超过48 h。

1.2 样品制备与化验

水样采回后, 静置1 h后, 取上清液, 用去离子水进行稀释, 每组水样稀释十个梯度, 10组水样得到100个不同浓度的被测样本, 并编号, 每个样本分成两份, 一份用于LIBS光谱法测量, 另一份送到清华大学环境质量检测中心进行化验, 化验采用的方法是利用重铬酸钾氧化法测定COD的值。 经过化验, 得到100个样本的COD浓度, 剔除一个明显的异常样本值, 最终得到99个有效样本浓度数据。 所有有效样本数据被分为两组, 训练集包括70个, 测试集包括29个, 两组样本数据的COD信息如表1所示。

表1 有效水体样本COD浓度信息 Table 1 COD concentration information of effective water samples
1.3 LIBS光谱采集

本实验光谱采集使用的LIBS采集系统为实验室自己搭建, 包括激光器、 光谱仪、 三维精密运动平台、 信号延时器。 激光器为镭宝公司(Beamtech)生产的型号为Dawa-200的Dawa Series Q-Switched Nd:YAG Laser System。 基频光波长1 064 nm, 脉冲激光输出的最大能量为200 mJ, 激光器的脉冲最高重复频率为20 Hz, 脉冲宽度为3~5 ns。 光谱仪采用Ocean Optics公司的HR2000+, 光谱范围为200~1 100 nm, 分辨率为0.2 nm, 信噪比250:1。 系统搭载有三维精密运动平台, 利用步进电机实现平台的三个轴向运动, 从而对样品的不同位置进行测量。 实验装置结构示意图如图1所示。 激光器出射功率设置为160 mJ。 光谱范围设置为200~1 000 nm, 积分时间设置为2 ms。 激光器触发和光谱采集之间的延时时间设置为3 μ s。 实验前用光谱仪采集背景光谱, 在后续的检测中均扣除背景。

图1 LIBS系统结构示意图Fig.1 The schematic diagram of LIBS system

测量过程是, 将水样滴于滤纸上, 静置3 min, 水样均匀浸润滤纸, 将该滤纸置于样品台。 激光器发出的激光经反射镜反射后由凸透镜聚焦在滤纸表面产生等离子体。 为避免滤纸表面的不均匀性对实验的干扰, 每个样本以重新取样的方式各测2次, 每次测量选择5个不同的位置, 两次总共得到不同位置的10条光谱, 然后对10条光谱取平均, 得到一条有效光谱。 99个水体样本全部测完, 共得到99条有效光谱。

2 结果与讨论
2.1 水体样本的LIBS光谱

实验采集的水体样本杂质较少, 因此LIBS系统采集到的LIBS光谱主要包含水体中常见离子和可溶性有机物等, 光谱谱峰相对比较简单, 如图2所示。

图2 水样LIBS光谱Fig.2 LIBS spectrum of water sample

对水样的LIBS光谱的谱峰进行了辨别, 发现主要为C(247.8 nm), H(656.4 nm), O(777.3 nm), N(742.3, 744.1, 746.7 nm)以及一些水中常见的Na(589.0, 589.6 nm), Mg(279.5 nm), Ca(393.4, 396.9 nm)等元素的谱线, 这些元素主要来自于溶解在水中的有机物分子, 和一些可溶性无机盐, 这些都可以对COD的浓度产生影响, 但主要影响因素还是水中的还原性有机物。 同时, LIBS光谱中还有一些分子的谱线, 比如CN(386.2, 387.1, 388.3 nm)和H2(422.7 nm), 这些分子片段主要来自于水中的有机物在被高能量激光激发时, 有机物分子的部分化学键没有完全被打断, 形成分子片段部分分子, 比如部分CN基团, 是由于被激发成等离子体的C和N元素在冷却过程中重新结合形成新的CN基团。 这些分子的LIBS特征峰能够间接反映水中的COD浓度。 但是经过对不同浓度COD水样的LIBS的特征峰的对比研究, 发现这些特征峰的峰强并不随着COD的浓度变化表现出相对应的变化, 主要是因为水体中COD是一个比较复杂的参数, 受水中多种因素综合影响, 单一的元素变化并不能完全代表水体中COD的变化。 因此利用化学计量学方法, 通过光谱数据建模, 对水体的COD进行分析。

2.2 LIBS光谱全波段PLSR分析

偏最小二乘回归(partial least squares regression, PLSR)是化学计量学中应用最广泛的一种多元校正方法, 它的优点在于对光谱进行分解的同时, 考虑数据与目标分析物的性质之间的关系。

对训练集的70个样本光谱基于光谱的全波段(200~890 nm)进行PLSR建模, 然后利用建好的模型对测试集的29个样本进行预测, 以评估模型的预测效果。 为了研究各个波长对模型的贡献大小, 从而筛选典型特征波段, 没有对LIBS光谱做任何预处理, 以防止预处理导致的单个波长特征的模糊和均匀, 更好的保留光谱的原始信息。

建模和预测的效果如表2所示, 利用全光谱建模, 此时主成分设为9, 训练集模型R2为0.969, RMSE为3.049, 测试集的R2为0.889, RMSE为6.391。 测试集的29个样本的真实值和预测值的拟合图如图3所示。

表2 全光谱PLS模型性能 Table 2 Performance of PLS model based on full spectrum

图3 预测集真值与预测值线性拟合图Fig.3 Linear fitting graph of truth value and prediction value of prediction set

通过对水体LIBS全光谱建模, 可以得到不错的预测效果。 但是全光谱计算量太大, 对处理系统的计算能力要求较高, 因此希望能够在保证一定准确率的前提下对模型输入量进行降维, 减少计算量, 便于将模型移植到便携式测量设备中, 以实现现场快速测量。 对全光谱模型进行研究, 如图4所示, 从主成分得分图可以看出, 主要的贡献度来自于前几个主成分, 分析了前5个主成分。 对各个主成分每个波长的回归系数进行了研究, 对结果影响比较大的波长所对应的回归系数较大, 从而可以找到水体中对COD浓度密切相关的特征波长, 对其中主要的特征波长进行了辨别, 如图5所示, 可以看到, 回归系数变化主要与C, H, O, N及一些离子相关, 基本与水体LIBS的特征峰吻合, 这也是原子发射光谱与近红外光谱的不同之处。

图4 模型PC1和PC2得分图Fig.4 The scores of PC1 and PC2 in the model

图5 前5个主成分各波长的回归系数Fig.5 The regression coefficients of the first five principal components at different wavelengths

在以上研究基础上, 根据各波长的载荷对水体COD的LIBS光谱进行了特征波段筛选, 剔除大量贡献度极小的数据, 保留相关度高的特征波长数据, 然后再次进行建模并对测试集数据的预测效果进行评估。

2.3 波段筛选后的PLSR分析

通过数据筛选, 主要选择了C, H, O, N, CN, H2及Na, Mg, Ca等特征波长数据, 最后将每条光谱的数据量由13 622降到877, 此时的模型预测效果如表3所示。 测试集数据的预测效果并没有下降, 如图6所示, 说明数据降维后, 并不影响测量效果, 对此时的回归系数进行分析, 继续对数据进行筛选。

表3 877个特征波长数据筛选后模型性能 Table 3 Model performance of 877 feature wavelength data after screening

图6 877个特征波长筛选后预测集真值与预测值线性拟合图Fig.6 Linear fitting of true and predicted value of 877 characteristic wavelengths after screening

经过再次筛选, 最终将参与建模的光谱波段定为28个, 主要是每个特征峰的最高峰位波长, 这28个特征波长分别是247.8, 279.5, 280.2, 386.1, 387.1, 388.3, 393.4, 396.8, 422.7, 589.0, 589.6, 656.4, 742.2, 744.1, 746.7, 777.1, 794.7, 818.4, 818.7, 821.0, 821.6, 824.2, 844.6, 854.2, 862.9, 868.0, 868.3, 868.6 nm。 然后利用这28个波长的数据建立PLSR模型, 主成分选择28个, 但实际效果最好的为18个, 利用建立的模型对29个测试集样本进行预测, 效果如表4所示, 从图7中也能看到, 28个特征波长筛选后预测集的真值与预测值线性拟合依然为强相关关性。 虽然均方根误差有所增大, 但依然在可接受的范围内。

表4 28个特征波长数据筛选后模型性能 Table 4 Model performance of 28 characteristic wavelengths data after screening

图7 28个特征波长筛选后预测集真值与预测值线性拟合图Fig.7 Linear fitting of true and predicted values of 28 sets of characteristic wavelengths after screening

3 结 论

研究了水体COD的LIBS光谱测量方法, 由于COD受影响因素众多, 并不能根据某单一元素的特征峰进行预测, 因此结合化学计量学方法分析, 发现水体COD主要与水体中有机物及一些无机还原性离子的特征峰相关性较强。 根据对特征元素特征波段的筛选和模型输入量的降维, 将每条光谱的13 622个数据降到28个, 仍然具有一定的预测能力, 这说明利用LIBS光谱对水体COD进行分析, 不仅可行, 而且具有很好的开发便携式现场快速测量设备的潜力。

参考文献
[1] Goh C P, Lim P E. Asean Journal on Science and Technology for Development, 2017, 25(2): 383. [本文引用:1]
[2] ZHANG Ji-hua(张继华). Environmental Science and Technology(环境科学与技术), 2004, 27(8): 37. [本文引用:1]
[3] YUAN Han-hong, HU Yan-ping, QI Hui-liang(袁汉鸿, 胡艳平, 戚惠良). Water Purification Technology(净水技术), 2005, 24(4): 67. [本文引用:1]
[4] LUO Guo-bing(罗国兵). Rock and Mineral Analysis(岩矿测试), 2013, 32(6): 860. [本文引用:1]
[5] Pan T, Chen Z, Chen J, et al. Analytical Methods, 2012, 4(4): 1046. [本文引用:1]
[6] Fortes F J, Moros J, Lucena P, et al. Analytical Chemistry, 2013, 85(2): 640. [本文引用:1]
[7] Zhang D C, Hu Z Q, Su Y B, et al. Optics Express, 2018, 26(14): 18794. [本文引用:1]
[8] Costa V C, Aquino F W B, Paranhos C M, et al. Polymer Testing, 2017, 59: 390. [本文引用:1]
[9] Hoehse M, Paul A, Gornushkin I, et al. Analytical & Bioanalytical Chemistry, 2012, 402(4): 1443. [本文引用:1]
[10] Janzen C, Fleige R, Noll R, et al. Spectrochimica Acta Part B, Atomic Spectroscopy, 2005, 60(7): 993. [本文引用:1]
[11] Bilge G, Sezer B, Boyaci I H, et al. Spectrochimica Acta Part B, Atomic Spectroscopy, 2018, 145. [本文引用:1]
[12] Mousavi S J, Farsani M H, Darbani S M R, et al. Applied Physics B, 2016, 122(5): 1. [本文引用:1]
[13] YE Song, GU Ya-hui, DU Xiao-fan, et al(叶松, 顾亚辉, 杜晓凡, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2017, 37(11): 3585. [本文引用:1]