作者简介: 王艺霏, 女, 1999年生, 青岛理工大学环境与市政工程学院硕士研究生 e-mail: wangyf9905@163.com
喹诺酮类抗生素(QNs)因其高效的抗菌作用被广泛应用于疾病治疗和动物养殖, 过量使用的QNs随着污水排放在自然水体中累积, 导致自然水体中抗性细菌和抗性基因过量滋生, 对环境生态以及人类健康构成严重威胁。 传统的QNs检测方法的检测灵敏度高、 准确度好, 但时间消耗较久、 仪器设备价格昂贵、 现场检测较困难, 而荧光分析技术检测时间短, 尤其是三维荧光光谱技术能够在短时间内通过一次检测获得大量的目标物特征信息, 通过与数据统计及机器学习模型相结合, 利用数学手段可以在短时间内对多种QNs进行检测。 充分利用QNs的荧光光谱信息, 结合支持向量机回归(SVMR)分别创建以氧氟沙星(OFL)和诺氟沙星(NOR)为代表的QNs预测模型, 再将未知样品的荧光光谱信息代入到创建的模型中, 即可快速获得测定结果。 在构建模型的过程中将偏最小二乘-判别分析(PLS-DA)和SVMR这两种监督学习方式作比较, 发现SVMR具有良好的预测效果, 通过调整参数与核函数, 可使OFL和NOR在2~600 μg·L-1范围内具有良好的线性范围, 线性相关系数均为0.992 0, 最低检出限在0.064~0.080 μg·L-1之间。 将该方法应用到青岛市近岸海水和水库水的QNs检测, OFL在海水中的平均加标回收率为98.62%, 在水库水中的平均加标回收率为103.90%, NOR在海水中的平均加标回收率为104.01%, 在水库水中的平均加标回收率为105.89%, 两种QNs在实际水体中的标准偏差均不超过9.21%。 该方法检测速度快, 在3 min内即可完成对一个未知样品的定量分析, 可以快速筛查环境中是否存在QNs的风险因素。 创新性的采用SVMR与荧光光谱技术相结合的方法, 研发了一种可以用于实际水体中QNs现场快速检测的新方法, 为实现环境水体中QNs的现场快速检测提供了一种科学可靠的新思路。
Quinolone antibiotics (QNs) are extensively utilized in treating diseases and animal husbandry owing to their potent antimicrobial properties. However, the excessive utilization of QNs and their release into environmental water sources via wastewater results in their accumulation in natural aquatic ecosystems. The consequence of this phenomenon is the extensive propagation of bacteria that are resistant to antibiotics, as well as the proliferation of resistance genes in aquatic ecosystems. This poses a significant risk to both environmental ecology and human well-being. Traditional techniques employed in detecting QNs exhibit notable sensitivity and accuracy. However, these methods are characterized by their time-consuming nature, reliance on costly equipment, and the inherent difficulty of conducting on-site assessments. Fluorescence analysis technology necessitates a brief detection time, particularly in the case of three-dimensional fluorescence spectroscopy, which enables the acquisition of a substantial amount of target information within a limited timeframe. By integrating data statistics and machine learning models, mathematical methods can efficiently identify multiple QNs. In this study, the fluorescence spectroscopic information of QNs was extensively employed, and the support vector machine regression (SVMR) algorithm was utilized to develop prediction models for QNs, specifically ofloxacin (OFL) and norfloxacin (NOR). The fluorescence spectroscopic data of the unknown samples was subsequently fed into the developed models to obtain the determination outcomes efficiently. While constructing the model, a comparison was made between two supervised learning methods, i.e., PLS-DA and SVMR. It has been determined that SVMR exhibits a strong predictive capability. By manipulating parameters and kernel functions, it was possible to achieve a good linear range for determining OFL and NOR, spanning from 2 to 600 μg·L-1. The resulting linear correlation coefficients exceeded 0.992 0, and the detection limits were 0.064~0.080 μg·L-1. The validated method was proven applicable to real water samples, i.e., the recoveries were 98.62%~104.01% for seawater and 103.90%~105.89% for reservoir water. This method offers the advantage of rapid detection speed, allowing for the completion of quantitative analysis of an unknown sample within a mere 3 min. This rapid screening process identifies potential risk factors associated with QNs in the environment. This study employs a novel approach by integrating SVMR with fluorescence spectroscopy to develop a rapid detection method for QNs in real water samples. The proposed method offers a new and scientifically reliable solution for rapidly detecting QNs in environmental water.
喹诺酮类抗生素(quinolones, QNs)因抗菌谱广、 抗菌性强、 口服吸收性好、 组织渗透性佳等优势被广泛应用于人类医疗和动物养殖[1], 经过使用的抗生素废液以及生产过程中产生的抗生素废水, 会伴随着污水排放进入环境水体中。 然而, 由于QNs具有半衰期长、 难降解等特性[2, 3], 环境水体中逐渐富集的QNs会使水生生物产生氧化损伤并抑制其生长[4, 5], 同时影响人类的身体健康。 研究发现以氧氟沙星(ofloxacin, OFL)和诺氟沙星(norfloxacin, NOR)为代表的QNs在养殖场水样各类抗生素的占比中高达41.96%[6]。 在中原地区的一家医院污水中已检测到上述两种抗生素, 其检出浓度分别为1 384~1 880 ng·L-1(OFL)和434~588 ng· L-1(NOR)[7]。 此外, 在我国海河中已检测到OFL和NOR的浓度分别达到530 和650 ng·L-1[8], 可见QNs在环境中的污染程度较高。 因此需要发展简单、 快速、 灵敏的QNs的检测方法, 为更好的加强环境管理和污染物控制提供技术支撑。
目前, 针对QNs的检测常采用液相色谱-质谱法[9, 10, 11], 该方法具有灵敏度高、 准确性和重现性好等优点, 但是也存在一些不可避免的缺点, 如仪器价格昂贵、 不便于携带、 需在实验室进行操作等, 因此需要开发检测时间短、 设备便携、 可进行现场检测的分析方法。
荧光分析法操作简单、 检测速度快、 可用于现场检测, 而且可利用荧光探针与目标物之间的特异性识别来进行抗生素的定性和定量检测。 然而, 具有选择性的荧光探针通常存在价格昂贵、 合成复杂、 易受干扰等缺点, 使通过荧光探针进行喹诺酮类抗生素的检测受到一定的限制。 如果直接利用喹诺酮类抗生素自身的荧光光谱, 由于结构上的相似性, 会导致激发波长和发射波长在相近的范围内产生重叠, 难以实现单一物质的定性及定量分析。 为此, 研究采取“ 数学分离” 的方式来代替“ 化学分离” , 结合化学计量学方法对抗生素进行荧光检测。 王书涛教授课题组[12]用三维荧光光谱技术结合BLLS/RBL化学计量法用于检测水中氟甲喹、 恩诺沙星和左氧氟沙星。 该方法可以准确解析出三种光谱重叠的抗生素, 该方法定量准确, 回收率在98.46%~101.69%之间。 Osorio等[13]以激发-发射矩阵的形式收集了环丙沙星、 诺氟沙星和氟甲喹三种氟喹诺酮类抗生素光降解过程中的四向数据, 并采用偏最小二乘耦合残差三线性(U-PLS-RTL)建立模型。 采用基于三阶多元校准的分析方法对鱼类养殖水体中的QNs进行定量分析, 结果的RSD在1%~13%之间, 证明所建立模型具有较好的重现性。
本研究采用三维荧光光谱结合支持向量机回归(support vector machine regression, SVMR)算法, 建立水体中OFL和NOR的预测模型, 并将其应用于实际环境水样中OFL和NOR的同时检测。 与常用的偏最小二乘判别分析(PLS-DA)算法作比较, 寻找一种现场快速检测水中OFL和NOR的新方法。 其实验流程如图1所示。
支持向量机(support vector machine, SVM)是Vapnik[14]在20世纪90年代提出的一种以结构风险最小化为原则, 针对差异数据集求得隔离边缘最大化的算法。 对于给定的数据集T={(x1, y1 ), (x2, y2 ), …, (xN, yN)}, 其中xi∈ Rn, yi∈ {-1, +1}, i=1, 2, …, N 。 xi为第i个样本的特征向量, yi为xi的样本类别标签。 SVM的目的在于找到一个超平面wTx+b=0用于数观测值进行分类, 使得不同类之间最小间隔最大化, 其中w∈ Rn, b∈ R是两个未知参数。 在目标变量明确的情况下, 支持向量机可用于回归分析进行定量计算。 支持向量机回归的原理简单来说是将输入空间通过非线性映射到高维空间, 方程式如式(1)所示[15], 其中(x1, y1), …, (xi, yi)∈ RN× R, φ (xi)为将数据变换到高位特征空间的非线性映射, W和b为系数。
利用SVMR创建模型的关键在于结合数据变量自身特征对未知参数进行估计, 并对核函数选择及适用条件进行优化。 核函数包括线性核函数(Linear Kernal)、 多项式核函数(Polynomial Kernel)、 高斯核函数(又称径向基核函数, Radial Basis Function)、 拉普拉斯核函数(Laplacian Kernel)和Sigmoid核函数等, 如式(2)—式(6), 设X是输入空间, H是特征空间, 若有一个X到H的映射φ (x): X→ H使得对所有的x, z∈ X, 函数K(x, z)都满足条件K(x, z)=φ (x)· φ (z), 则称K(x, z)为核函数, φ (x)为映射函数, 式中φ (x)· φ (z)为φ (x)和φ (z)的内积, 不同核函数公式如下。 核函数的选择在SVM中起到至关重要的作用, 由于其他核函数在参数的确定上比较繁琐, 而线性核函数是最简单的核函数之一, 也是均方根误差(root mean square error, RMSE)最小的模型, 因此在利用SVM算法构建模型的过程中通常优先考虑线性核函数。
线性核函数
多项式核函数
高斯核函数
拉普拉斯核函数
Sigmoid核函数
SVM中参数优化要重点考虑最优惩罚参数C和不敏感度ε , 采用交叉验证的方法进行参数的调整, 以避免模型出现过拟合和欠拟合的现象。 与其他方法相比, SVM能够有效处理数据中的噪声和异常值, 提高模型的泛化能力, 适用性强, 不仅适用于小样本数据, 也可以通过引入核函数处理非线性问题, 具有较好的鲁棒性和可解释性[16]。 中国农业大学任雪芹课题组[17]首次将SVM用于区分四环素(tetracycline, TC)、 土霉素(oxytetracycline, OTC)、 强力霉素(doxycycline, DOX)和美他环素(methacycline, MTC)。 该传感器被成功应用于识别72个未知样品中的4种TCs, 且在1.0~150 μ mol· L-1的线性范围内对目标物测定的准确率为100%, 结果表明, SVM可以达到很好的分类和预测效果。 但目前没有用于喹诺酮类抗生素的分析。
偏最小二乘判别分析(partial least square-discrimination analysis, PLS-DA)是一种常见的线性分类方法, 旨在找到能够识别每个样本所属类别的数学模型[18], 其过程是将样品集中的每一类物质按照不同的赋值来进行统计分类, 利用预测集数据的靠近程度来表示其隶属关系。 陈卫院士课题组[19]利用三种不同的化学计量方法结合荧光光谱快速筛选牛奶中丹诺沙星(danofloxain, DANO)和氟甲喹(flumequine, FLU)。 在这项研究中采用主成分分析(principal component analysis, PCA)、 PLS-DA和PLS回归模型对13种牛奶的预测集进行分析, DANO和FLU的日间精密度分别为9.2%和6.2%, 表明此分析方法具有良好的准确性。 PLS-DA在提取数据特征的过程中具有良好效果, 适用于处理高维光谱数据[20]。 本工作也采用该算法来与SVM算法进行对比。
为了验证模型的性能, 除回收率之外通常采用决定系数R2和均方根误差 RMSE作为模型效果的评价指标。 R2越接近1, 代表模型相关性越强, 预测准确度越好。 RMSE越小, 代表模型预测准确度越高, 模型泛化能力越强。 R2和RMSE按照式(7)和式(8)计算。
式(7)和式(8)中, yi为目标物的真实测量值,
QNs的荧光光谱测量是在配备有氙灯的FluoroMax+高灵敏一体式荧光光谱仪(Horiba Instryments Incorporated, 日本)上进行的。 考虑到配备有氙灯的FluoroMax+高灵敏一体式荧光光谱仪不便于携带, 因此在实验初期使用了现场常见的RF-5301PC荧光分光光度计(日本岛津)进行了检测, 更换不同的激发波长对样品进行检测, 可以获得与FluoroMax+高灵敏一体式荧光光谱仪相同的检测结果。 因此, 尽管在实验过程中使用的是配备有氙灯的FluoroMax+高灵敏一体式荧光光谱仪, 但在现场仍然可以选择其他便携式小型光谱仪进行检测。 检测参数的设置如下: 激发和发射狭缝宽度为7 nm; 激发波长范围为260~380 nm; 发射波长范围400~520 nm; 步长均为5 nm。 所有样品的荧光检测均使用同一个容量为3.5 mL、 光程为10 mm的石英比色皿。 荧光数据均以Excel格式导出并保存。
氧氟沙星(OFL, 98%)和诺氟沙星(NOR, 98%)的分析标准品均由上海阿拉丁试剂公司提供, 环丙沙星(CIP, 98%)的分析标准品由上海迈瑞尔生化科技有限公司提供。 甲醇为色谱纯, 购买于德国默克公司。
称取1 mg氧氟沙星、 诺氟沙星和环丙沙星标准品, 用色谱级甲醇溶解并定容到100 mL的棕色容量瓶中, 得到浓度为10 mg· L-1储备液, 在4 ℃的冰箱内储存待用。 测试时, 分别移取适量的标准品储备液, 用超纯水稀释并配置成1 mg· L-1的QNs工作溶液, 再逐级稀释至所需浓度。 无论使用配备有氙灯的FluoroMax+高灵敏一体式荧光光谱仪或普通二维荧光光谱仪, 对一个样品通常在3 min内即可完成检测。
实际水样分别采集于青岛市近海海岸和丁家河水库, 并储存于4 ℃的冰箱中。 在进行荧光分析前需用0.22 μ m的滤膜对采集的水样过滤以去除悬浮杂质。
在分析物的线性范围内制备了含87个标准样本的校正集, 以OFL为例其矫校正集建立方法为: OFL每个浓度保留2个样本, 以20 μ g· L-1为增量逐渐上升至线性范围最高点, 将NOR作为干扰物, 以50 μ g· L-1为增量与不同浓度的OFL样本进行混合, 用于分析物校正模型的建立。 设计了两组实际环境水样的加标预测样本, 用于所提策略准确度的考察, 配置方法如下: 分别向进行预处理后的海水和水库水中加入不同浓度的混合标准品溶液制备得海水加标预测样本(P01—P03)和水库水加标预测样本(Q01—Q03)。 此外, 分别配制空白海水水样(P00)和水库水水样(Q00), 用于方法检出限的计算。 所设计的预测样本浓度见表1。 上述所有样品配制后均储存于棕色试剂瓶中, 充分摇匀并超声后进行三维荧光的检测, 每个样本最终可以得到一个激发发射矩阵数据。
![]() | 表1 两种喹诺酮类药物的预测浓度设计 Table 1 The designed Predictive concentrations of QNs1 and QNs2 in calibration set and prediction set |
数据统计及机器学习模型在The Unscrambler软件上进行, 使用PLS-DA和SVM算法分别从分类和定量的角度来进行数据分析。
PLS-DA的简要流程如下: (1)导入样品OFL、 NOR和CIP数据矩阵, 设定样品集的类别, 根据自身类别对每个样品进行赋值, 将分类变量转变成指标变量; (2)根据光谱数据矩阵和类别变量, 建立相应的PLS回归分析模型; (3)基于所建立的模型及未知样品的光谱数据, 获得未知样品预测值, 以此获得未知样品的所属类别; (4)利用从模型中获得的得分图、 载荷图、 解释方差和R2等数据来判断模型的准确度。
在进行SVM分析之前, 首先对样品数据使用聚类分析(cluster analysis)进行分类, 其判定依据选用K-means和Kendall′s, 再利用SVM算法来进行定量分析, 其流程如下: (1)导入完整的OFL与NOR混合数据; (2)利用SVM算法对OFL和NOR分别构建预测模型, 在模型的输入中, 预测部分选择QNs的荧光特征数据, 响应部分选择其浓度, SVM类型采用epsilon SVR, 核函数类型选用线性核函数, 即Kernel=Linear, C值设定为1, ε 值设置为0.1; (3)将预测集数据分别代入OFL和NOR的模型中, 计算模型准确度。
从图2中可以看出, OFL、 NOR和CIP均有两个荧光特征峰(即在检测范围内, 该物质荧光信号最高处), OFL的特征峰位于最佳激发/发射波长290/500和325/490的位置上, NOR的特征峰位于最佳激发/发射波长275/445和315/445的位置上, CIP的特征峰位于最佳激发/发射波长275/445和315/440的位置上。 然而, 在选定的荧光检测范围即激发波长260~380 nm、 发射波长400~520 nm内, 三种QNs的荧光信号存在明显的重叠现象, 直接利用荧光技术无法实现对三种QNs的同时解析, 因此通过添加算法并与荧光技术相结合达到快速同时测定环境水体中三种QNs的目的。 同时, 实验证明, OFL(激发波长290 nm、 发射波长500 nm处)和NOR(激发波长275 nm、 发射波长445 nm处)在2~600 μ g· L-1范围内线性关系良好, 其线性相关系数均为0.992, 最低检出限在0.064~0.080 μ g· L-1之间。
采用PLS-DA算法处理样品的三维荧光光谱数据以分析水体中OFL、 NOR和CIP的污染水平, 在图3(a)中可以看到利用该方法能够有效对水体中三种抗生素建立定性的PLS-DA模型, 然而, 当预测集导入模型后, 如图3(b)所示, 预测集在该PLS-DA模型中分析效果不佳, 可能是由于模型未能充分捕捉到预测集数据的关键特征信息, 亦或是模型出现过拟合的现象。 因此, 利用传统的PLS-DA算法来处理样品的三维荧光数据不能很好的分析OFL、 NOR和CIP。
在实验过程中发现, 由于NOR和CIP的荧光特征过于接近, 在后续的实验中决定只针对OFL和NOR进行定性定量分析。 在进行SVM分析之前, 先采用聚类分析(cluster analysis)将OFL和NOR进行区分, 如图4(a)所示, 当聚类分析的依据选用全联动和相关性时, 两种QNs可以很好的进行区分, 在实验中发现当聚类分析选择其他依据, 如图4(b)中选用平均联动和肯德尔指标(Kendall′s Tau)时, 仍能获得相同的分类结果, 可见该方法对OFL和NOR具有良好的定性能力。
将预测集数据代入对OFL和NOR分别建立的SVM模型, 从表2中可以得到, OFL的平均回收率和标准偏差为103.89%± 2.26%, 在青岛市近岸海水和丁家河水库水中OFL的平均回收率和标准偏差分别为98.62%± 1.95%和103.90%± 3.45%。 同时, 基于NOR数据的SVM模型对NOR预测的平均回收率和标准偏差为106.86%± 3.00%, 在青岛市近岸海水和丁家河水库水中NOR的平均回收率和标准偏差分别为104.01%± 5.22%和105.89%± 2.74%。
![]() | 表2 SVM算法解析超纯水、 海水和水库水中OFL、 NOR获得的浓度预测及回收率结果 Table 2 The prediction and recovery results of OFL, NOR for ultrapure water, sea water and reservoir samples |
提出了一种将SVMR结合荧光光谱技术对OFL和NOR进行检测的新方法, 通过荧光特征峰的相关数据建立针对两种QNs的检测模型。 模型预测结果的决定系数均高于0.992 2, 且均方根误差均低于9.21, 表明模型的拟合效果较好, 具有较高的预测准确性和可靠性, 两种QNs在青岛市近岸海水中回收率为96.38%~109.97%, 在丁家河水库水中回收率为100.71%~108.30%。 该方法具有快速、 简便、 经济的优势, 所研究的方法成功应用于真实环境水体中OFL和NOR的现场快速检测分析。 值得一提的是, 本方法目前虽然是利用的三维荧光数据, 但是只利用了三维荧光中特征峰的数据, 用样品特征峰数据代替三维数据矩阵, 利用的数据量远小于文献报道的其他算法测定抗生素的数据量。 因此, 本方法也适用于普通荧光光谱仪, 利用二维荧光数据可获得与三维荧光数据同样的效果。 本方法的适用性更强, 普及性更广, 为现场快速检测提供了一种经济高效的解决方案。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|