光谱检测水体中磷酸三钠浓度的实验研究
孙小鹏, 马瑞峻*, 陈瑜*, 甄欢仪, 马创立
华南农业大学工程学院, 广东 广州 510642
*通讯联系人 e-mail: maruijun_mrj@163.com; chenyu219@126.com

作者简介: 孙小鹏, 1995年生, 华南农业大学工程学院硕士研究生 e-mail: 403752506@qq.com

摘要

以不同浓度的磷酸三钠溶液为研究对象, 探究紫外/可见吸收光谱用于检测水体中磷酸三钠溶液浓度的可行性。 使用不同光源和不同光程组合的3套吸光度测量装置采集不同浓度下磷酸三钠样液的光谱数据, 进而分别对三组实验数据采用不同预处理方法进行预处理, 偏最小二乘(PLS)模型结果表明三次实验均采用Savitzky-Golay(S-G)卷积平滑预处理方法效果最好; 接着采用蒙特卡洛交叉验证(MCCV)算法对校正集中奇异样本进行剔除, 对剔除奇异样本后的全波段数据建立PLS模型, 模型结果表明MCCV法有助于提高PLS模型的预测性能; 最后采用相关系数法三种实验选取的主要特征波长分别为214.099 8, 218.837 1和204.66 nm, 为了建立一个精度较高且具有普适性的模型, 依据以上三个主要特征波长选取磷酸三钠的特征波段为200~222 nm, 并建立相应特征波段PLS模型, 结果表明该模型可用于磷酸三钠溶液浓度的定量分析和预测。 所以采用光谱技术快速检测水体中磷酸三钠溶液浓度具有一定的可行性, 该研究为开发快速检测水体中无机磷浓度的仪器设备提供一定的理论基础。

关键词: 紫外/可见吸收光谱; 磷酸三钠; 无机磷浓度; 偏最小二乘法
中图分类号:O657.32 文献标志码:A
Experimental Study on Determination of Trisodium Phosphate Concentration in Water Based on Spectral Technique
SUN Xiao-peng, MA Rui-jun*, CHEN Yu*, ZHEN Huan-yi, MA Chuang-li
College of Engineering, South China Agricultural University, Guangzhou 510642, China
*Corresponding authors
Abstract

In this paper, different concentrations of trisodium phosphate solutions were used as research objects to explore the feasibility of UV/visible absorption spectra for detecting the concentration of trisodium phosphate solution in water. Three sets of absorbance measuring devices with different light sources and different optical path combinations were used to collect the spectral data of trisodium phosphate sample solution at different concentrations, and then the three groups of experimental data were pretreated by different pretreatment methods, the results of partial least squares (PLS) model showed that the best pretreatment method was Savitzky-Golay(S-G)convolution smoothing; then the method of Monte-Carlo cross validation (MCCV) was used to eliminate the singular samples in the calibration set, and the PLS model was established for the whole band data after the singular samples were removed, the results showed that MCCV method could improve the prediction performance of PLS models; finally, the main characteristic wavelengths of trisodium phosphate in three experiments were selected by correlation coefficient method, which were 214.099 8, 218.837 1 and 204.66 nm respectively, in order to establish a highly accurate and universal model for trisodium phosphate, the characteristic band of trisodium phosphate was selected from 200 to 222 nm based on the above three main characteristic wavelengths, and the corresponding characteristic band PLS models were established, the results showed that the model could be used quantitative analysis and prediction of trisodium phosphate concentration solution. Therefore, itis feasible to use hyperspectral technology to detect concentration of trisodium phosphate in water rapidly, and this study provides a theoretical basis for the development of instruments and equipment for the rapid detection of inorganic phosphorus concentration in water.

Keyword: UV/Visible absorption spectrum; Trisodium phosphate; Inorganic phosphorus concentration; Partial least square method
引言

磷是生物体也是水生生态系统重要的组成元素之一, 水生植物的生长虽说需要磷元素, 但并不是说水体中磷含量越多越好, 当其含量大于0.2 mg· L-1时将会引发一系列重大的环境问题, 如全球频发的海洋、 湖泊富营养化和赤潮、 蓝藻水华等, 进而污染天然水体并破坏生态平衡[1]。 长期以来, 我国农村农业生产中滥用化肥现象比较严重, 错误地认为肥料用的越多, 农作物的产量就会越高, 导致化肥利用率低, 农业面源污染严重; 另一方面, 农村污染防治意识薄弱, 含有高浓度磷的禽畜养殖废水和生活污水被肆意排放; 除此之外还有含磷工业废水的排放等, 这些都是导致我国水体污染问题较为严峻的原因。 所以为了有效的防止水体富营养化等问题的发生, 避免含高浓度磷的污水进入自然水体显得尤为重要。

研究表明水体中的磷主要是以各种磷酸盐的形式存在的[2], 对水体中磷形态的分析, 是将其他形式的磷酸盐分别通过消解、 提取等方式转化为正磷酸盐进行测定的。 目前国内主要测定方法有离子色谱法、 钼蓝比色法、 和连续流动分析法等。 其中离子色谱法[3]实验过程复杂且耗时, 不能满足快速检测的要求; 钼蓝比色法[4]虽然操作较为简单, 但其精度还有待提高; 连续流动分析法[5]检出限低, 精确度高, 但其测定样品成本高, 实验仪器十分昂贵, 且不宜大规模作常规分析用。 另外, 国外研究人员还采用富集与光催化和液体波导管分光光度法来[6, 7]检测海水中的无机磷, 但实验过程繁琐费时。

随着光谱技术的日益成熟, 越来越多的研究学者采用光谱技术对作物病害和水质评价等方面进行实验研究[8, 9], 而对于水体中无机磷的浓度研究却较少。 所以本研究采用吸收光谱, 结合偏最小二乘(partial least squares, PLS)模型来探究光谱技术检测水体中磷酸三钠浓度的可行性, 旨在为实现水体中无机磷浓度的快速检测提供理论依据。

1 实验部分
1.1 样品与装置

实验样品为纯度99.5%的磷酸三钠标准样品。 用分析天平称取1.226 g磷酸三钠(12个结晶水), 将称取好的样品放入烧杯中, 并加入适量蒸馏水溶解, 定容到1 000 mL容量瓶后摇匀, 配置初始浓度为100 mg· L-1(以P计)的磷酸三钠样液。 再次使用蒸馏水作为稀释剂, 配置浓度范围为0.01~100 mg· L-1共计65个实验样品。 其具体浓度配置为: 0.01, 0.05, 0.1~1.0(浓度梯度为0.1 mg· L-1), 1.5~10.0(浓度梯度为0.5 mg· L-1), 11.0~20.0(浓度梯度为1.0 mg· L-1), 22.0~50.0(浓度梯度为2.0 mg· L-1)和55.0~100.0 mg· L-1(浓度梯度为5.0 mg· L-1)。

为了增加实验结果的可靠性, 同时为了探究不同光源和不同光程对实验结果的影响, 采用3种实验装置进行实验。 3种实验装置及实验条件如下:

装置1: 将型号为Hamamatsu S10420的探测器、 型号为PHX-5W的脉冲氙灯和比色皿支架组合在一起。

装置2: 将型号为Hamamatsu S10420的探测器、 型号为ZWH-3000的氘卤灯和比色皿支架组合在一起。

采用上述两装置实验时, 比色皿光程均为100 mm, 选定波长范围为200~900 nm, 积分时间为9 ms, 平均次数为20, 平滑宽度为2, 仪器分辨率为1.1 nm(FWHM)。

装置3: 美国Ocean Optics海阳光学公司的便携式吸光度测量仪(型号为FLAME-CHEM-UV-VIS), 探测器为Sony ILX511B linear silicon CCD array, 光源为氘卤灯, 比色皿光程为10 mm。 积分时间为25 ms, 平均次数为20, 平滑宽度为2, 选定波长范围190~750 nm, 仪器分辨率为1.5 nm(FWHM)。

1.2 光谱数据处理与模型评估

1.2.1 样本集的划分与数据处理及建模

采用Kennard-Stone(K-S)样本划分方法, 基于样本光谱计算样本之间的欧氏距离, 在特征空间中, 按3:1的比例划分校正集(49个样本)和预测集(16个样本)。

为了消除光谱数据所包含的无关信息以及其他背景的干扰, 将实验所得光谱数据分别采用移动平均平滑(move smoothing)、 S-G卷积平滑、 一阶导数(1-Der)和二阶导数(2-Der)等预处理方法进行预处理并建立PLS模型, 通过对比分析模型结果确定最优预处理方法; 接着采用蒙特卡洛交叉验证(Monte-Carlo cross validation, MCCV)法剔除预处理之后校正集样本中的奇异样本; 最后采用相关系数法选取特征波长和特征波段, 建立特征波长和特征波段PLS模型, 并同全波段数据所建立的PLS模型进行对比分析。

1.2.2 模型评估

采用决定系数R2, 均方根误差RMSE和预测残差RPD对模型进行评估。 其中R2表示模型的拟合度, RMSE表示模型的预测能力, RPD体现模型的分辨能力和稳健性。 当RPD≥ 3时表示此模型预测能力较好[10]

样本集划分、 光谱数据预处理、 奇异样本剔除以及建模均在The Unscrambler X10.4和Matlab R2017b软件平台进行。

2 结果与讨论
2.1 光谱图与数据预处理

使用3种实验装置采集的不同浓度下磷酸三钠样液的原始吸收光谱如图1所示。

图1 三种实验装置磷酸三钠原始吸收光谱图
(a): 100 mm光程脉冲氙灯实验; (b): 100 mm光程氘卤灯实验; (c): 10 mm光程氘卤灯实验
Fig.1 Original absorption spectra of trisodium phosphatein by using three types experimental system
(a): Pulse xenon lamp with 100 mm optical path; (b): Deuterium halide lamp with 100 mm optical path; (c): Deuterium halide lamp with 10 mm optical path

由图1可知, 磷酸三钠在紫外区域(< 350 mm)出现明显吸收峰。 图1(b)在靠近380 nm处出现小的“ 吸收峰” 是因为该处是紫外区域与可见光区域的交界处, 可能是光源能量不同导致的; 图1(c)在700nm附近出现小的“ 吸收峰” 可能是因为该处靠近检测波长范围的末端, 光源不稳定、 背景噪声较大引起的; 图1(c)吸光度值在约240~300 nm范围内显著高于图1(a)和(b), 可能原因是随着实验进行时间的增加, 装置3的光源出现能量不稳定现象, 造成基线漂移, 使图1(c)的光谱曲线整体略向上抬高。 所以为了避免引入较多的无用信息, 对选定的紫外区域光谱数据(a实验和b实验选取波长范围为200~350 nm, 波长变量由1 543个减少到320个, c实验选取波长范围为190~350 nm, 波长变量由1 608个减少到428个)采用不同预处理方法进行处理。

不同预处理方法对光谱数据处理后PLS模型结果如表1所示, 通过对比分析可知, 三组实验数据均采用S-G卷积平滑预处理方法效果最好, 将预处理后的光谱数据用于后续的处理分析。 预处理后的吸收光谱图如图2所示。

表1 三种实验不同预处理方法PLS模型结果 Table 1 PLS model results of three types experiments with different pretreatment methods

图2 三种实验S-G预处理后磷酸三钠吸收光谱图
(a): 100 mm光程脉冲氙灯; (b): 100 mm光程氘卤灯; (c): 10 mm光程氘卤灯
Fig.2 Absorption spectra of trisodium phosphate after S-G pretreatment bu using three types experimental system
(a): Pulse xenon lamp with 100 mm optical path; (b): Deuterium halide lamp with 100 mm optical path; (c): Deuterium halide lamp with 10 mm optical path

2.2 MCCV奇异样本剔除

用光谱数据建立相关预测模型时, 光谱异常样本的存在会对预测模型的精度产生严重影响。 异常样本的产生主要与光谱仪本身、 实验测量时的环境因素和样品前处理不当等原因有关。

蒙特卡洛交叉验证算法(MCCV)[11]具有较高的识别奇异样本的能力, 并且可以在某种程度上降低由掩蔽效应带来的风险。 将三组实验校正集样本数据用蒙特卡洛随机取样(Monte Carlo sampling, MCS)法取80%的样本作校正集建立PLS回归模型, 余下的20%作预测集, 循环2 500次, 得到各样本的一组预测残差, 并求得各样本预测残差(residual)的均值(MEAN)与方差(STD), 作MEAN-STD图如图3所示。

图3 MCCV法均值-方差(MEAN-STD)分布图
(a): 100 mm光程脉冲氙灯实验; (b): 100 mm光程氘卤灯实验; (c): 10 mm光程氘卤灯实验
Fig.3 MEAN-STD distribution of MCCV method
(a): Experiment of pulse xenon lamp with 100 mm optical path; (b): Experiment of deuterium halide lamp with 100 mm optical path; (c): Experiment of deuterium halide lamp with 10 mm optical path

由图3可知, 有些样本偏离主体样本较为明显, 需要剔除掉。 图3(a)中剔除6个奇异样本, 样本编号分别为36, 43, 45, 47, 48和49; 图3(b)中剔除8个奇异样本, 样本编号分别为1, 17, 24, 26, 30, 47, 48和49; 图3(c)中剔除7个奇异样本, 样本编号分别为3, 39, 40, 45, 47, 48和49。 三种实验剔除奇异样本后实验样本由原来的65个分别减少到59个、 57个和58个。 剔除奇异样本前后PLS模型结果如表2所示。

表2 剔除奇异样本前后磷酸三钠全波段数据PLS模型预测结果 Table 2 PLS model results of all band data of trisodium phosphate before and after singular sample removed

表2可知, 三种实验剔除奇异样本前后全波段PLS模型结果的RPD值都在15以上, 均达到定量分析的要求。 剔除奇异样本后三种实验PLS模型的RMSEC值和RMSEP值均有不同程度的降低, 其中c实验PLS模型RMSEC值从1.909 5降低到0.869 6, RMSEP值从0.826 2降低到0.743 5, 降低最为显著; 而且可以看出剔除奇异样本后三种实验PLS模型的RMSEC与RMSEP之间的差值均有所降低。 所以经MCCV法剔除奇异样本后的PLS模型不仅建模样本量减少, 而且模型的准确性和稳定性更高。

2.3 特征波长选取及其PLS建模

相关系数法是将光谱矩阵中的每个波长对应的吸光度向量x与浓度矩阵中的待测组分浓度向量y进行相关性计算, 得到波长-吸光度相关系数图, 对应相关系数绝对值越大的波长处包含的信息越多。 三种实验相关系数图如图4所示。

图4 三种实验磷酸三钠吸光度与波长相关系数图
(a): 100 mm光程脉冲氙灯实验; (b): 100 mm光程氘卤灯实验; (c): 10 mm光程氘卤灯实验
Fig.4 The correlation coefficient between absorbance and wavelength of trisodium phosphate for three types experiments
(a): Pulse xenon lamp with 100 mm optical path; (b): Deuterium halide lamp with 100 mm optical path; (c): Deuterium halide lamp with 10 mm optical path

根据图4的相关系数图, 挑选出相关系数绝对值最大处和波峰处或波谷处所对应的波长为其特征波长, 三种实验选取的特征波长分别为214.099 8, 258.528 9 nm; 218.837 1, 309.760 6 nm和204.66, 316.17 nm。 并建立PLS模型, 结果如表3所示。

表3 磷酸三钠特征波长及其PLS模型结果 Table 3 Characteristic wavelengths of trisodium phosphate and its PLS model results

表3可知, 三种实验特征波长PLS模型的RPD值分别为6.009 8, 6.242 5和5.330 5; 对比表2表3可知, 虽然三种实验特征波长模型均满足定量分析的要求, 但是相对剔除奇异样本后全波段PLS模型来说, 三种实验特征波长模型的R2均降低, RMSE值均增加, 导致RPD值也降低, 这可能是因为参与建模波长变量数太少, 含有效信息的波长变量未被选取到, 导致特征波长PLS模型分辨能力和稳健性降低。

2.4 特征波段选取及其PLS建模

虽然三种实验选取的特征波长均为2个, 但从图1可以看出, 磷酸三钠在200~230 nm波段内出现明显吸收峰, 所以三种实验分别选择由相关系数法得到的214.099 8, 218.837 1和204.66 nm作为磷酸三钠的主要特征波长。 三种实验的实验对象均为磷酸三钠溶液, 理论上来说得到的特征波长应该是一致的, 但实验得到了三个不同的特征波长, 这可能是三种实验装置不同造成的。 并且, 由图1可以看出, 三种实验各自的最大吸收峰均发生了不同程度的偏移。 所以为了保证每个特征波长均被分析到, 从而建立一个精度较高且具有普适性的模型, 采用特征波段建模。

以三种实验选取的214.099 8, 218.837 1和204.66 nm主要特征波长为中心, 左右各取3nm波宽作为特征波段, 即211.730 2~216.942 5, 215.995 1~221.678 3和201.99~207.33 nm, 综合选取200~222 nm作为磷酸三钠的特征波段, 并建立PLS模型, 建模结果如表4所示。

表4 磷酸三钠特征波段PLS模型结果 Table 4 Characteristic band of trisodium phosphate and its PLS model results

表4可知, 三种实验特征波段PLS模型的RPD值分别为23.288 8, 17.568 8和13.428 5, RMSEP值均小于1, 模型均表现出较好的预测性能, 说明综合三种实验选取200~222 nm作为磷酸三钠的特征波段较为合适; 而且与全波段PLS模型相比, a实验和b实验的波长变量由320个减少到48个, c实验的波长变量由428个减少到61个, 特征波段PLS模型都仅使用约全波段15%的波长变量, 大大简化了模型, 减少建模所消耗的时间。

对比a实验和b实验, 当光程(100 mm)相同, 光源不同时, 特征波段PLS模型R2都在0.99以上, 但是a实验PLS模型的RMSEC值和RMSEP值相对于b实验来说均有所降低, 并且RPD值更高, 所以脉冲氙灯实验结果优于氘卤灯实验结果; 对比b实验和c实验, 当光程不同, 光源(氘卤灯)相同时, b实验特征波段PLS模型的RMSEP值相对于c实验来说降低了约27%, RPD值增加了约31%, 所以相对于10 mm光程比色皿实验来说, 100 mm光程比色皿实验模型的预测能力更高。

3 结论

(1)通过3种实验装置对不同浓度磷酸三钠溶液进行实验, 经S-G卷积平滑预处理和MCCV法剔除奇异样本后所建立的全波段、 特征波长和特征波段PLS模型均有较高的精度和预测性能。

(2)通过原始吸收光谱图和相关性分析得到214 nm附近是紫外可见吸收光谱检测磷酸三钠溶液浓度的一个主要特征波长, 选取200~222 nm作为磷酸三钠溶液的特征波段, 建立的特征波段PLS模型满足实际定量分析的要求, 且模型精度较高, 鲁棒性更好。

(3)不同光程和不同光源对磷酸三钠溶液浓度的测定都有一定程度的影响。 在200~222 nm特征波段内, 光程(100 mm)相同情况下, 使用脉冲氙灯作为光源对磷酸三钠溶液浓度测定的实验结果更优, 所建模型的精度更高; 光源(氘卤灯)相同情况下, 使用100 mm比10 mm光程比色皿对磷酸三钠溶液浓度测定的实验结果更优, 其模型分辨力更高。

(4)本研究为实现水体中磷酸三钠浓度的快速检测提供实验基础和理论参考, 但利用光谱技术对水体中其他无机磷的定量分析还有待进一步探究。

参考文献
[1] Read E K, Ivancic M, Hanson P, et al. Water Research, 2014, 62: 229. [本文引用:1]
[2] ZHANG Hong-tao, LU Yu-qi(张宏陶, 卢玉棋). Water Quality Analysis(水质分析大全). Chongqing: Chongqing Branch of Science and Technology Literature Press(重庆: 科学技术文献出版社重庆分社), 1989. 168. [本文引用:1]
[3] LIANG Yu-ying, JIANG Qi, LI Jin-qing, et al(梁钰莹, 江琦, 李锦清, ). The Food Industry(食品工业), 2018, 39(7): 237. [本文引用:1]
[4] CHEN Bin, DOU Ze-kun, LI Rong, et al(陈斌, 窦泽坤, 李蓉, ). Journal of Northwest University·Natural Science Edition(西北大学学报·自然科学版), 2018, 48(2): 209. [本文引用:1]
[5] LIU Jian-li, ZHANG Pei, SONG Bei, et al(刘建利, 张沛, 宋蓓, ). Chemical Research and Application(化学研究与应用), 2016, 28(7): 936. [本文引用:1]
[6] Li S X, Liang W J, Zheng F Y, et al. Sensors and Actuators B, 2016, 224: 48. [本文引用:1]
[7] Ehama M, Hashihama F, Kinouchi S, et al. Talanta, 2016, 153: 66. [本文引用:1]
[8] ZHANG De-rong, FANG Hui, HE Yong(张德荣, 方慧, 何勇). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(6): 1748. [本文引用:1]
[9] CHEN Jun-ying, XING Zheng, ZHANG Zhi-tao, et al(陈俊英, 邢正, 张智韬, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2019, 50(11): 200. [本文引用:1]
[10] Malley D F, Ronicke H, Findlay D L, et al. Journal of Paleolimnonogy, 1999, 21(3): 295. [本文引用:1]
[11] LIU Zhi-chao, CAI Wen-sheng, SHAO Xue-guang(刘智超, 蔡文生, 邵学广). Science in China·Series B: Chemistry(中国科学·B辑: 化学), 2008, 38(4): 316. [本文引用:1]