短程硝化过程的光谱特征波段选择与间隔偏最小二乘法建模
宋彧1,2, 李卫华1,2,*, 薛同站1,2, 余丽1,2, 申慧彦1,2
1.安徽建筑大学环境与能源工程学院, 安徽 合肥 230601
2.环境污染控制与废弃物资源化利用安徽省重点实验室, 安徽 合肥 230601
*通讯作者 e-mail: liweihua9@126.com

作者简介: 宋 彧, 女, 1998年生, 安徽建筑大学环境与能源工程学院硕士研究生 e-mail: 1614864418@qq.com

摘要

序批式活性污泥反应器(SBR)是目前应用较广的活性污泥处理装置。 通过SBR反应器处理人工模拟高氨氮废水研究短程硝化反应系统启动过程中硝酸盐氮和亚硝酸盐氮含量的变化, 利用紫外光谱采集所得数据为基础建立模型, 以期快速预测SBR反应器出水中硝酸盐氮、 亚硝酸盐氮含量。 采用实验室配置的不同浓度硝酸盐氮和亚硝酸盐氮混合溶液, 以三种不同波段选择的区间偏最小二乘法(iPLS)构建标准混合液的校正模型。 研究结果显示, 所建模型对混合液中硝酸盐氮和亚硝酸盐氮实测值与预测值相关性均较好。 测定反应器出水指标, 同样以三种不同波段选择的偏最小二乘法算法构建紫外光谱与硝酸盐氮和亚硝酸盐氮含量的模型。 利用校正集相关系数、 交叉验证均方根误差(RMSECV)、 预测集的相关系数以及预测均方根误差(RMSEP)评价指标来评价模型结果。 在iPLS、 siPLS、 biPLS三种模型中利用联合区间偏最小二乘法(siPLS)将全光谱分别等分为24、 19个区间时, 分别联合子区间[2 4]、 [3 8]建立的模型预测拟合结果最优, 其校正模型 r=0.939 3、 RMSECV=1.650 4, r=0.950 7、 RMSECV=0.442 1, 预测模型 r=0.999 2、 RMSEP=1.341 8, r=0.911 9、 RMSEP=2.677 0。 该模型对硝酸盐氮和亚硝酸盐氮的预测效果总体较好, 表明利用紫外光谱建立区间偏最小二乘法模型可以实现对短程硝化反应器出水硝氮和亚硝氮含量的快速预测。

关键词: 短程硝化; 硝酸盐氮; 亚硝酸盐氮; 紫外光谱; 联合区间偏最小二乘法; 波段选择
中图分类号:O657.32 文献标志码:A
Spectral Feature Band Selection and Interval Partial Least Squares Modeling of Short-Range Nitrification Process
SONG Yu1,2, LI Wei-hua1,2,*, XUE Tong-zhan1,2, YU Li1,2, SHEN Hui-yan1,2
1. School of Environment and Energy Engineering, Anhui Jianzhu University, Hefei 230601, China
2. Anhui Provincial Key Laboratory of Environmental Pollution Control and Resource Reuse, Anhui Jianzhu University, Hefei 230601, China
*Corresponding author
Abstract

Sequential Batch Reactor (SBR) is one of the most widely used active sludge treatment devices.In this experiment, the nitrate and nitrite nitrogen content changes during the startup process of the short-term nitrification reaction system were studied using an SBR reactor to treat artificially simulated high ammonia wastewater.A model was established based on the data collected usingultraviolet spectroscopy,aiming to rapidly predict the nitrate nitrogen and nitrite nitrogen content in the effluent of the SBR reactor. Using laboratory-prepared solutions with different concentrations of nitrate and nitrite nitrogen, a calibration model for standard mixtures was constructedusing the interval partial least squares(iPLS) for three different band selection methods. The research results show that the models built exhibit good correlations between the measured and predicted values for nitrate nitrogen and nitrite nitrogen in the mixed solution.To determine the reactor effluent parameters, models for ultraviolet spectroscopy and the nitrate and nitrite nitrogen content were constructed using partial least squares algorithms for three different band selections.The model results were evaluated using the calibration set correlation coefficient, the root mean square error of cross-validation (RMSECV), the correlation coefficient of the prediction set, and the root mean square error of prediction (RMSEP) evaluation metrics.Among the three models, the model built using the synergy interval partial least squares (siPLS) method, which divided the full spectrum into 24 and 19 intervals and established models for the combined sub-intervals[2 4] and [3 8], exhibited the best prediction and fitting results. Its calibration model had r=0.939 3 and RMSECV=1.650 4, and the prediction model had r=0.950 7 and RMSEP=0.442 1. This model showed an overall good prediction performance for nitrate nitrogen and nitrite nitrogen, indicating that establishing interval partial least squares models using ultraviolet spectroscopy can rapidly predict nitrate nitrogen and nitrite nitrogen content in the effluent of the short-term nitrification reactor.

Keyword: Shortcut nitrification; Nitrate; Nitrite; Ultraviolet spectrum; siPLS; Bands selection
引言

近年来随着工农业的快速发展, 对水资源的标准越来越高, 导致水环境问题日益凸显。 传统生物脱氮技术存在着低效、 高能耗、 污泥处理成本高等缺点。 为此, 新型生物脱氮技术不断开发, 短程硝化-厌氧氨氧化(PN/A)工艺在处理废水的应用并不多见, 而短程硝化做为组合工艺的预处理部分, 却极易受到运行条件如溶解氧、 温度、 pH等干扰[1, 2]。 短程硝化过程不易维护与运行, 需要一种可以快速确定硝酸盐氮和亚硝酸盐氮含量的方法来快速表征反应器的状况并及时调整其运行条件。 近年来, 文献报道关于测定这两种物质的方法。 Yaqoob等[3]采用流动注射法和荧光剂化学发光检测法测定淡水中的硝酸盐氮和亚硝酸盐。 孙浩等[4]研制了基于紫外光谱吸收原理的在线监测硝酸盐的传感器。 Shariati-Rad等[5]提出一种简单灵敏的分光光度法同时测定亚硝酸盐和硝酸盐, 此方法需要添加亚硝酸盐和硝酸盐与2, 4-二甲苯酚作为试剂在浓硫酸中发生反应。 此类方法都存在着需添加化学药剂或费用高等缺点, 无法广泛在实际应用。

硝酸盐氮和亚硝酸盐氮均存在特定的紫外特征吸收峰[4], 采集水样对于紫外光谱在特征波长处的特征吸收峰并建立与水样浓度的关系模型, 采用区间偏最小二乘法(iPLS)构建水样与紫外光谱的关系模型可以快速预测样品中二者的含量[6, 7]。 Nø rgaard等[7]采用结合PLS回归与近红外(NIR)光谱建立了乳清粉中结晶糖含量的定量分析模型, 认为反向区间偏最小二乘法(biPLS)模型的预测效果相较于全光谱模型更佳。 姚亮等[8]基于NIR光谱采用不同波段选择的iPLS建立污泥中糖原含量与近红外光谱的定量关系模型, 发现siPLS可以更好地优化模型并快速测定糖原含量。 通过不同波段选择建立iPLS模型得到的预测效果不同。 本研究分别采集硝酸盐氮和亚硝酸盐氮的标准混合溶液以及短程硝化反应器出水的紫外光谱, 对比三种不同波段选择的间隔偏最小二乘法建立的快速测定水样中二者含量的模型, 寻求最佳建模方式, 以实现短程硝化系统的稳定运行。

1 实验部分
1.1 试验装置与运行

活性污泥处理装置采用SBR反应器, 内径为16 cm, 外径22 cm, 高度为40.5 cm, 有效容积6 L。 温度通过水浴夹层控制在30~32 ℃, 桶壁设有取样口以供取样及排水, 运行时保持进水NH4+-N浓度在约180 mg· L-1, 为了保证反应器内的溶解氧浓度为0.3~0.5 mg· L-1, 反应曝气量设置为6 L· h-1。 反应器每天运行三个周期, 具体运行过程为进水(30 min)— 曝气搅拌(4 h)— 沉淀(30 min)— 排水(30 min)— 闲置(2.5 h)。

1.2 反应器进水

反应器进水采用人工配制, 微量元素按照1 mL· L-1浓度添加, 具体成分见表1表2所示。

表1 反应器进水水质 Table 1 Influent water quality of the reactor
表2 反应器微量元素组成和浓度 Table 2 Trace element composition and concentration of the reactor
1.3 常规分析

常规分析及检测方法见表3

表3 检测项目及方法 Table 3 Testing items and methods
1.4 紫外光谱建模原理

用于检测水样中硝酸盐氮、 亚硝酸盐氮的紫外光谱方法的准确性依赖于所建立的数学模型, 朗伯-比尔定律是使用紫外光谱建模的基础[9]。 其数学表达式如式(1)

A=log(1/t)=Kal(1)

式(1)中, A是吸光度; t为透射比, 即出射光强度(I)与入射光强度(I0)之比; K为摩尔吸光系数与吸收物质的性质及入射光波长有关; a是吸收物质浓度(mol· L-1); b是吸收层厚度(cm)。

理论上水中的物质分子可以吸收特定的紫外-可见光, 电子从基态被激发跃迁到激发态, 从而吸收入射光。 氮氧双键基团是生色团, 而硝酸盐氮和亚硝酸盐氮由于存在氮氧双键, 不饱和双键会出现n→ π * 的电子能级跃迁, 因此在210 nm附近存在特征吸收。 由于硝酸根和亚硝酸根的分子结构不同, 故特征吸收峰位也有所不同。 根据朗伯-比尔定律, 物质浓度与其吸光度具有良好的线性相关性, 通过光谱预处理和特征波长的选择等, 可以减少噪声和未知物的干扰, 构建稳健的紫外吸收光谱与物质浓度的预测模型[9]。 偏最小二乘(PLS)是化学计量学中常用的多元分析方法, 其原理是预测变量与实测变量投影到新的空间中, 并建立线性相关性, 以达到预测的目的[10]

1.5 紫外光谱分析仪器及校正模型建立方法

紫外光谱采集使用双光束紫外可见分光光度计(TU-1901), 以去离子水为背景, 反应器出水水样稀释20倍, 扫描速度适中, 扫描范围为190~400 nm。

用硝酸钾和亚硝酸钠配制浓度均为100 mg· L-1的硝酸盐氮和亚硝酸盐氮标准溶液, 按照表4稀释为不同浓度梯度的标准混合液, 再将反应器出水作为校正集水样分别采集紫外光谱。 先用校正集样品建立校正模型, 即待短程硝化反应器启动运行后, 每天采集两个运行周期的出水水样, 共计33个。 为了防止水样中未溶解性有机物对光谱扫描过程中产生干扰, 需将水样用0.45 μ m的滤膜过滤。 建模的实测值是按湿化学法分别测定水样中硝酸盐氮、 亚硝酸盐氮的浓度, 以iPLS、 biPLS、 siPLS等建立紫外光谱与水样浓度的校正模型。 用其余30个预测集样品作为验证集去验证模型的预测结果, 即采集紫外光谱数据并带入校正模型进行外部检验校正模型的预测效果。

表4 不同浓度梯度的标准混合溶液 Table 4 Standard mixture solutions for different concentration gradients
1.6 模型评价参数

交叉验证均方根误差(RMSECV)采用留一交叉验证(leave-one-sample-out cross-validation):

(1)从校正集中剔除一个样本用作验证集, 用校正集中的其余样本建立模型;

(2)根据式(2)计算RMSECV

$RMSECV=\sqrt{\frac{1}{n}\overset{n}{\mathop{\underset{i=1}{\mathop \sum }\, }}\, {{({{{\hat{y}}}_{i}}-{{y}_{i}})}^{2}}}$ (2)

式(2)中: n为校正集样品个数; ${{\hat{y}}_{i}}$为样品的模型预测值; yi为样品的模型真实值。

(3)重复N次(N为校正集样本个数), 直至每个样本都被作为验证集;

根据最低RMSECV值选择最优的模型, 最优模型通过预测集进行检验。 预测均方根误差(RMSEP)计算公式如式(3)

$RMSEP=\sqrt{\frac{1}{m}\overset{m}{\mathop{\underset{j=1}{\mathop \sum }\, }}\, {{({{{\hat{y}}}_{j}}-{{y}_{j}})}^{2}}}$ (3)

式(3)中: m为预测样品集的样品个数; ${{\hat{y}}_{j}}$为样品的模型预测值; yj为样品的模型真实值。

将采集的紫外光谱采用iPLS、 biPLS、 siPLS建立定量分析模型, RMSECV和RMSEP值越低, 表示模型预测准确度越高。 采用Matlab软件编写程序分析软件中的iPLS、 biPLS、 siPLS进行模型构建, 通过比较模型的校正集分类准确率和预测集分类准确率衡量模型的质量。

2 结果与讨论
2.1 短程硝化反应器的运行状态

SBR反应器历经80个周期成功启动短程硝化, 启动前期, 污泥中亚硝酸盐氧化菌(NOB)所占比例大于氨氧化菌(AOB), 导致亚硝酸盐氮积累率较低, 期间发现反应器出水带出少量解体污泥。 在启动中期, 控制溶解氧浓度约0.5 mg· L-1, 由于AOB菌群对氧的亲和力比NOB高, 在低氧环境中溶解氧优先被AOB菌利用, 致使NOB菌所能利用的溶解氧逐渐减少, AOB菌开始大量增值。 在启动后期, 反应器出水中硝酸盐氮浓度出现持续下降的趋势, 当反应器运行到第80个周期时亚硝酸盐氮积累率达到50.85%, 表明短程硝化反应已成功启动。 图1所示为启动过程中硝酸盐氮和亚硝酸盐氮浓度及亚硝酸盐氮积累率变化情况。

图1 反应器启动阶段无机盐氮的变化Fig.1 Variation of inorganic salt nitrogen during the reactor start-up phase

2.2 实验室配制标准溶液及反应器出水紫外光谱分析

2.2.1 标准溶液模型建立

(1)建立iPLS模型

依次采集表4中标准混合液的紫外吸收谱, 将吸收波段190~400 nm等分为20区间, 在每个子区间分别建立PLS模型, 结果如表5所示。

表5 硝酸盐氮和亚硝酸盐氮建模结果 Table 5 Modeling results of nitrate and nitrite nitrogen

由图2(a)和图3(a)可知当主成分数分别为4和4时对应的RMSECV最小, 所以建立模型时分别选4和4作为最佳主成分数。 图2(b)和图3(b)表示iPLS模型各区间对应的RMSECV值, RMSECV值最小时所对应的区间分别为第3区间和第3区间, 表明在此区间建立模型效果更好, 其波长范围均为212~223 nm, 此区间建立的PLS校正模型见图2(c)和图3(c)。 由图2(c)和图3(c)可知, 硝酸盐氮的相关系数r为1, RMSECV值为0.006 9; 亚硝酸盐氮的相关系数r为0.999 6, RMSECV值为0.020 5。

图2 硝酸盐氮分析的iPLS模型优化
(a): 不同主成分数对应的RMSECV; (b): iPLS模型各区间对应RMSECV值; (c): 硝酸盐氮混合液校正模型
Fig.2 The optimization of the iPLS model for nitrate nitrogen analysis
(a): RMSECV corresponding to different principal component scores; (b): RMSECV corresponding to each interal of the iPLS model; (c): Corrective modeling of nitrate nitrogen in mixed solutions

图3 亚硝酸盐氮分析的iPLS模型优化
(a): 不同主成分数对应的RMSECV; (b): iPLS模型各区间对应RMSECV值; (c): 亚硝酸盐氮混合液校正模型
Fig.3 The optimization of the iPLS model for nitrite nitrogen analysis
(a): RMSECV corresponding to different principal component scores; (b): RMSECV corresponding to each interal of the iPLS model; (c): Corrective modeling of nitrite nitroget in mixed solutions

(2)建立biPLS模型

biPLS模型是以特定数量的光谱子区间为基础, 对各个光谱区间逐个剔除建模结果最差的区间, 然后采用剩余子区间建立PLS模型, 重复这一过程, 直到最后一个子区间为止[8]。 本实验将光谱依次划分为19、 20、 …、 24个区间。

表6可知, 将全光谱划分为19个区间, 最佳区间为[1 2 3 9 14 15 17], 变量个数79, 主成分数为3时, 硝酸盐氮建模效果最好。 将全光谱划分为22个区间, 最佳区间[4 7], 主成分数为4, 变量个数20, 亚硝酸盐氮建模结果最佳。

表6 硝酸盐氮和亚硝酸盐氮biPLS建模结果 Table 6 biPLS modeling results of nitrate and nitrite nitrogen

图4(a, b)分别为标准溶液的硝酸盐氮和亚硝酸盐氮biPLS校正模型, 模型的相关系数r分别为1和1, RMSECV值分别为0.005 7和0.001 6。

图4 biPLS校正模型实测值与预测值散点图
(a): 硝酸盐氮实测值与预测值相关性; (b): 亚硝酸盐实测值与预测值相关性
Fig.4 Scatter plot of measured and predicted values for the biPLS calibration model
(a): Correlation between measured and predicted values of nitrate nitrogen; (b): Correlation between measured and predicled values of nitrite nitrogen

(3)建立siPLS模型

siPLS将多个子区间组合在一起, 建立PLS模型。 将紫外光谱同iPLS一样分割, 然后分别进行2或3个子区间的随机组合[11]。 本实验采用siPLS算法将水样的整体紫外光谱划分为19、 20、 …、 24个区间, 并对2、 3或4个所有可能的联合区间建立PLS模型, 由RMSECV的最小值确定最优模型的联合区间[12]

表7可知, 将全光谱划分为21个区间, 主成分数10, 联合4个区间[3 6 10 21]时, 硝酸盐氮建模效果最佳。 将全光谱划分为21个区间, 主成分数4, 联合4个区间[4 6 7 14]时, 亚硝酸盐氮建模结果最好。

表7 硝酸盐氮和亚硝酸盐氮siPLS校正模型结果 Table 7 siPLS modeling results of nitrate and nitrite nitrogen

图5为标准溶液的硝酸盐氮和亚硝酸盐氮siPLS校正模型, 模型的相关系数r分别为1和1, RMSECV值分别为0.002 9和0.001 2。

图5 siPLS校正模型实测值与预测值散点图
(a): 硝酸盐氮实测值与预测值相关性; (b): 亚硝酸盐实测值与预测值相关性
Fig.5 Scatter plot of measured and predicted values for the siPLS calibration model
(a): Correlation between measured and predicted values of nitrite nitrogen; (b): Correlation between measured and predicled values of nitrate nitrogen

三个模型结果说明, 采用不同波段选择的偏最小二乘法建立紫外光谱与混合液中硝酸盐氮和亚硝酸盐氮iPLS模型效果显著且可行。

2.2.2 短程硝化反应器出水模型建立

(1)建立iPLS模型(反应器出水)

在反应器启动过程中, 每天收集两个运行周期的水样, 共63个。 首先测定出水样品中的硝酸盐氮和亚硝酸盐氮的浓度同时采集相对应的紫外吸收谱, 从63个水样中随机抽取33个作为训练集。 将吸收波段190~400 nm等分为20个区间, 分别在各个子区间中建立PLS模型, 结果见表8

表8 硝酸盐氮和亚硝酸盐氮iPLS建模结果 Table 8 iPLS modeling results of nitrate and nitrite nitrogen

由图6(a)和图7(a)可以看出建模均方根误差最小时主成分数分别为2和7, 因此建立iPLS模型时分别选2和7为最佳主成分数。 图6(b)和图7(b)是硝酸盐氮和亚硝酸盐氮的iPLS校正模型, RMSECV值最小时所对应的区间分别为第2区间和第3区间, 波长范围分别为201~212、 212~223 nm。 如图6(c)和图7(c)所示, 硝酸盐氮的校正模型相关系数r为0.934 6, RMSECV值为1.714 2; 亚硝酸盐氮的校正模型相关系数r为0.910 2, RMSECV值为0.597 4。 分析认为反应器出水中物质的复杂性干扰了紫外光谱扫描和建立模型, 导致标准混合溶液和实际出水样品建立的校正模型入选光谱范围存在差异。

图6 硝酸盐氮分析iPLS模型优化
(a): 不同主成分数对应的RMSECV值; (b): iPLS模型各区间对应RMSECV值; (c): 硝酸盐氮校正模型
Fig.6 The optimisation of iPLS model for nitrate nitrogen analysis
(a): RMSECV corresponding to different principal component scores; (b): RMSECV corresponding to each interal of the iPLS model; (c): Corrective modeling of nitrate nitroget in mixed solutions

图7 亚硝酸盐氮分析的iPLS模型优化
(a): 不同主成分数对应的RMSECV值; (b): iPLS模型各区间对应RMSECV值; (c): 亚硝酸盐氮校正模型
Fig.7 The optimisation of iPLS model for nitrite nitrogen analysis
(a): RMSECV corresponding to different principal component scores; (b): RMSECV corresponding to each interal of the iPLS model; (c): Corrective modeling of nitrite nitroget in mixed solutions

(2)建立biPLS模型(反应器出水)

水样紫外光谱的划分方式与上述标准溶液的一致, 依次将光谱划分为19、 20、 …、 24个区间。 表9将全光谱等分为19个区间, 3为最佳主成分数, 区间[2]为最佳区间, 对应的波长范围202~213 nm, 此时硝酸盐氮校正模型的RMSECV值为1.706 9。 将全光谱等分为24个区间, 5为最佳主成分数, 最佳选择区间为[3 4 5 6 8 9 10 11 12 14 15 16 19 20 21 23 24], 对应的波长范围208~216、 217~225、 226~234、 235~243、 253~261、 262~270、 271~279、 280~288、 289~297、 307~315、 316~324、 325~333、 352~360、 361~368、 369~376、 385~392和393~400 nm, 此时亚硝酸盐氮校正模型的RMSECV值为0.455 3。

表9 硝酸盐氮和亚硝酸盐氮biPLS建模结果 Table 9 biPLS modeling results of nitrate and nitrite nitrogen

(3)建立siPLS模型(反应器出水)

siPLS建模时, 将全光谱划分为19、 20、 …、 24个区间, 并分别联合2、 3、 4个区间建立模型, 找到最佳建模方式。

表10为硝酸盐氮和亚硝酸盐氮的siPLS建模结果。 由表10可知将光谱划分成24个子区间, 4为最佳主成分数, 联合两个区间[2 4]时, 建立的siPLS模型最优。 而将光谱划分成24个子区间, 6为最佳主成分数, 联合四个区间[2 3 5 8]时, 建立的siPLS模型最优。

表10 硝酸盐氮和亚硝酸盐氮siPLS校正模型结果 Table 10 siPLS modeling results of nitrate and nitrite nitrogen

图8(a, b)为反应器出水的硝酸盐氮和亚硝酸盐氮siPLS校正模型, 模型的相关系数r分别为0.939 3和0.969 2, RMSECV值分别为1.650 4和0.366 2。

图8 siPLS校正模型实测值与预测值散点图
(a): 硝酸盐氮实测值与预测值相关性; (b): 亚硝酸盐实测值与预测值相关性
Fig.8 Scatter plot of measured and predicted values for the siPLS calibration model
(a): Correlation between measured and predicted values of nitrate nitrogen; (b): Correlation between measured and predicled values of nitrite nitrogen

表11为硝酸盐氮、 亚硝酸盐氮的siPLS预测模型结果。 将光谱划分成24个子区间, 4为最佳主成分数, 联合两个区间[2 4]时, siPLS所建的硝酸盐氮模型最优。 而将光谱划分成19个子区间, 最佳模型的主成分数为3, 联合两个区间[3 8]时, siPLS所建的亚硝酸盐氮模型最优。

表11 硝酸盐氮和亚硝酸盐氮siPLS预测模型结果 Table 11 Results of the siPLS prediction model for nitrate and nitrite nitrogen

图9(a, b)为反应器出水siPLS预测模型的相关性, 相关系数r分别为0.999 2和0.911 9, RMSEP值分别为1.341 8和2.677 0, 预测值与实测值之间误差较小, 这表明校正模型可以更加准确的预测反应器出水的硝酸盐和亚硝酸盐氮含量。 因此, 所建的siPLS校正模型可以用来预测未知水样中的硝酸盐氮和亚硝酸盐氮含量。 可能由于预测集数据中亚硝酸盐氮浓度较低, 导致亚硝酸盐氮预测模型相关性稍低[13]

图9 siPLS预测模型实测值与预测值散点图
(a): 硝酸盐氮实测值与预测值相关性; (b): 亚硝酸盐实测值与预测值相关性
Fig.9 Scatter plot of measured and predicted values from the siPLS prediction model
(a): Correlation between measured and predicted values of nitrate nitrogen; (b): Correlation between measured and predicled values of nitrite nitrogen

为了直观验证siPLS模型对短程硝化系统出水硝酸盐氮和亚硝酸盐氮含量的预测效果, 将其与iPLS模型、 biPLS模型进行比较。 运用不同波段选择的iPLS模型预测硝酸盐氮和亚硝酸盐氮含量, 结果见表12表13。 结果表明, 与其他模型相比siPLS模型对二者含量的预测效果最好。

表12 各iPLS模型预测硝酸盐氮含量的结果 Table 12 Prediction of nitrate content by each iPLS model
表13 各iPLS模型预测亚硝酸盐氮含量的结果 Table 13 Prediction of nitrite content by each iPLS model

传统的PLS模型可以运用全谱信息建立校正模型, 在预测反应器出水中硝酸盐氮和亚硝酸盐氮含量时存在较多冗余变量, 降低了模型的准确度与稳健性。 通常反应器出水中成分更为复杂。 然而iPLS模型只能提供一个子区间信息, 并不能为建立水样中硝酸盐氮和亚硝酸盐氮的预测模型提供足够信息。 biPLS是基于紫外光谱特征波段筛选的变量选择建模方法, 通常有较高的预测精度, 但同时具有贪婪搜索的强烈特征, 导致所选区间不足以指示待测物信息。 用siPLS建模时, 该方法可从光谱中最大限度地删除干扰信息, 保留有效信息[14], 从而相比其他建模方法, 预测效果较好。

3 结论

(1)采用三种不同波段选择的偏最小二乘法构建硝酸盐氮和亚硝酸盐氮混合液浓度与紫外光谱的数学模型, 所建模型的相关性均较好。 表明采用此类分析方法可以实现硝酸盐氮和亚硝酸盐氮的识别与定量分析, 为研究采用不同波段选择偏最小二乘法建立反应器出水中二者含量的iPLS模型提供依据。

(2)比较不同波段选择的偏最小二乘法建立的反应器出水硝酸盐氮和亚硝酸盐氮含量模型, 结果显示siPLS模型将光谱分别划分成24、 19个子区间, 主成分个数分别为4、 3, 联合子区间分别为[2 4]、 [3 8]建立的模型效果最佳, 变量个数分别为18和22, 校正模型的相关系数分别达到为0.939 3和0.950 7, RMSECV值分别为1.650 4、 0.442 1, 预测模型的相关系数分别为0.999 2和0.911 9, RMSEP值分别为1.341 8、 2.677 0, 预测值和实测值之间的误差较小。 表明采用紫外光谱建立联合区间偏最小二乘法模型可以实现对短程硝化反应器出水硝氮和亚硝氮含量的快速预测。

参考文献
[1] WANG Shu-ying, LI Lun, LI Ling-yun, et al(王淑莹, 李论, 李凌云, ). Journal of Beijing University of Technology(北京工业大学学报), 2011, 37(7): 1067. [本文引用:1]
[2] XU Ting, WANG Li, WU Jun(徐婷, 王丽, 吴军). Chinese Journal of Environmental Engineering(环境工程学报), 2016, 10(6): 2840. [本文引用:1]
[3] Yaqoob M, Folgado Biot B, Nabi A, et al. Luminescence, 2012, 27(5): 419. [本文引用:1]
[4] SUN Hao, GUO Hui, ZHAO Hui, et al(孙浩, 郭慧, 赵辉, ). Chinese Journal of Environmental Engineering(环境工程学报), 2016, 10(4): 2122. [本文引用:2]
[5] Shariati-Rad M, Irand oust M, Haghighi M. International Journal of Environmental Science and Technology, 2015, 12: 3837. [本文引用:1]
[6] Nørgaard L, Saudland A, Wagner J, et al. Applied Spectroscopy, 2000, 54(3): 413. [本文引用:1]
[7] Nørgaard L, Hahn M T, Knudsen L B, et al. International Dairy Journal, 2005, 15(12): 1261. [本文引用:2]
[8] YAO Liang, SHEN Hui-yan, LI Wei-hua, et al(姚亮, 申慧彦, 李卫华, ). Environmental Science and Technology(环境科学与技术), 2018, 41(7): 145. [本文引用:2]
[9] Guo Y, Liu C, Ye R, et al. Applied Sciences, 2020, 10(19): 6874. [本文引用:2]
[10] Skou P B, Berg T A, Aunsbjerg S D, et al. Applied Spectroscopy, 2017, 71(3): 410. [本文引用:1]
[11] Li J, Tong Y, Guan L, et al. Optik, 2018, 174: 591. [本文引用:1]
[12] Cai J, Chen Q, Wan X, et al. Food Chemistry, 2011, 126(3): 1354. [本文引用:1]
[13] HUANG Jian, HUANG Shan, ZHANG Hua, et al(黄健, 黄珊, 张华, ). China Environmental Science(中国环境科学), 2015, 35(7): 2014. [本文引用:1]
[14] Chen Q, Ding J, Cai J, et al. Journal of Food Science, 2012, 77(2): C222. [本文引用:1]