基于拉曼光谱的危险液体快速识别研究
南迪娜, 董力强, 傅文翔, 刘卫卫, 孔景临*
国民核生化灾害防护国家重点实验室, 北京 102205
*通讯作者 e-mail: jlkong@sina.com

作者简介: 南迪娜, 女, 1992年生, 军事科学院硕士研究生 e-mail: kim6860@163.com

摘要

快速准确识别不明危险液体在公共安全领域需求明显。 拉曼光谱技术因具有快速、 灵敏、 可非接触式检测等优点, 成为近年来此领域的研究热点。 以沙林、 梭曼、 塔崩、 维埃克斯、 芥子气等化学毒剂, 磷酸三甲酯、 磷酸三乙酯、 磷酸三丁酯、 甲基膦酸二甲酯、 甲基膦酸二异丙酯等化学毒剂模拟剂, 亚磷酸二甲酯、 亚磷酸三甲酯、 亚磷酸三乙酯、 甲基膦酰氯乙酯、 甲基膦酰二氯、 甲基膦酰二氟、 氯沙林、 二乙胺基磷酰氯、 2-二乙胺基乙硫醇、 硫二甘醇、 异丙醇、 频呐基醇、 甲基膦酸、 甲基膦酸异丙酯、 甲基膦酸频呐基酯等化学毒剂前体、 中间产物、 水解产物以及有毒工业化学品如邻二甲苯、 间二甲苯、 苯甲醚、 氯代苯、 乙酸乙酯、 乙酸乙烯酯、 乙酸苄酯、 甲醇、 乙醇、 乙腈、 丙酮、 1,1,1-三氯乙烷、 正己烷、 正丁醇、 四氯化碳等和汽油、 水等42种危险液体和常见溶剂为研究对象, 使用配备785 nm激光器的便携式拉曼光谱仪, 针对上述化合物建立了拉曼光谱检测方法, 获得了高信噪比的散射光谱数据, 对谱图特征进行了分析。 采用线性判别分析(LDA)、 二次判别分析(QDA)、 k近邻(kNN)、 朴素贝叶斯(NB)模型、 分类决策树(CT)、 支持向量机(SVM)6种模式识别算法对上述拉曼光谱数据进行识别归类。 研究结果表明, 支持向量机、 线性判别分析模型具有100%的识别准确率, 考虑到实际使用过程中非标准谱图、 仪器条件以及外界环境改变等因素会对支持向量机识别结果产生影响, 将线性判别分析模型确定为危险液体的快速识别方法。 全部测试过程在1~2 min内即可完成且不损耗样品, 成功实现水和危险品汽油与其他有毒液体的区分。 该研究揭示了具有指纹谱特征的拉曼光谱结合模式识别算法可用于化合物的快速筛查, 为及时发现通关夹带, 保证物流安全以及化学恐怖事件应急处置等提供了技术支撑。

关键词: 拉曼光谱; 化学危险品; 化学毒剂; 线性判别分析
中图分类号:O657.3 文献标志码:A
Fast Identification of Hazardous Liquids Based on Raman Spectroscopy
NAN Di-na, DONG Li-qiang, FU Wen-xiang, LIU Wei-wei, KONG Jing-lin*
State Key Laboratory of NBC Protection for Civilian, Beijing 102205, China
*Corresponding author
Abstract

Fast and accurate identification of unknown hazardous fluids are of pivotal interest in public security and safety. Raman spectroscopy is a fast and sensitive non-contacting measurement technology. Its virtues have it has become one of the important technologies in the public security field in recent years. In this study, the Raman spectra of forty-two dangerous and common liquids were measured: five chemical warfare agents (including sarin, soman, tabun, VX, and mustard gas), and their fifteen precursors, hydrolysates (including dimethyl hydrogen phosphite, trimethyl phosphite, triethyl phosphite, ethyl methylphosphonochloridoate, methylphosphonic dichloride, methylphosphonic difluoride, chlorosarin, bis(diethylamino)phosphoryl chloride, 2-(diethylamino)ethanethiol, thiodiglycol, isopropyl alcohol, 3,3-dimethyl-2-butanol, methylphosphonic acid, isopropyl methylphosphonate, and pinacolyl methylphosphonate), five chemical warfare agents simulants (including trimethyl phosphate, triethyl phosphate, tributyl phosphate, dimethyl methylphosphonate, and diisopropyl methylphosphonate), fifteen toxic industrial compounds (including o-xylene, m-xylene, anisole, chlorobenzene, ethyl acetate, vinyl acetate, benzyl acetate, methanol, ethanol, 1-butanol, acetonitrile, acetone, hexane, 1,1,1-trichloroethane, and carbon tetrachloride), gasoline, and water. Raman spectroscopy detection method for these compounds using a portable Raman spectrometer equipped with a 785 nm excitation laser was developed to obtain high SNR scattering spectrum data. Structural assignments to Raman bands observed in the spectrum were also proposed. Six pattern recognition algorithms, including linear discriminant analysis (LDA), quadratic discriminant analysis (QDA), k-nearest neighbor (kNN), naive bayesian (NB), classification tree (CT), and support vector machine (SVM) were studied to identify and classify Raman spectrum data. The results show that support vector machine and linear discriminant analysis model could realize the fast identification with a high recognition accuracy rate of 100%. However, considering the influence of non-standard spectrum, instrument conditions, and changes in the external environment on support vector machine recognition results, the linear discriminant analysis model seemed superior in identifying the aforementioned dangerous liquids. Meanwhile, all the testing process can be completed within 1~2 minutes without loss of samples. It can be concluded from this study that the combination of Raman spectroscopy with fingerprint characteristics and pattern recognition algorithm can be used for rapid screening of unknown compounds. Moreover, this method provides solutions for timely detection of customs clearance, guarantee of logistics security, and emergency response to chemical terrorist incidents.

Keyword: Raman spectroscopy; Hazardous chemicals; Chemical warfare agents; Linear discriminant analysis
引言

快速准确地识别化学毒剂、 有毒工业化学品等危险物质在重大活动安保、 交通运输、 海关物流、 司法物证、 反化学恐怖等公共安全领域需求明显。 这些化学危险品如可挥发、 强致死的神经性毒剂沙林、 梭曼等均为无色透明液体, 外观与水、 乙醇等常见液体无异, 具有被人员夹带、 谎报、 隐蔽投放到公共场所的风险。 要快速排查及准确识别此类液体样品, 一般都要开瓶采样进行现场检测或送实验室分析, 这种方式增加了执行任务人员的暴露风险且检测操作耗时。 拉曼光谱(Raman spectroscopy)技术凭借其快速、 灵敏、 非接触式操作、 仪器可便携化等优势成为现场快速检测领域的研究热点。 目前, 美国Wiley的Bio-Rad以及国内同方威视[1]等研究出版机构和拉曼光谱仪供应商等都建立了拉曼光谱数据库, 包含多种环境污染物、 易燃易爆及强腐蚀性化学危险品; 针对危险品识别的需求, 有研究通过实测谱图与数据库中正反向特征峰匹配分析危险液体[2], 或开发一些拉曼光谱识别方法[3]和软件[4]; 还有研究通过硬件改进, 互补式使用双波长激光器手持式拉曼系统实现危险品检测[5]。 上述拉曼光谱数据库均不包含化学毒剂等的光谱信息, 利用市售的数据库很难实现公共安全领域中危险液体的有效识别。 本研究较为系统地研究了多种化学毒剂及其前体或降解产物、 有毒工业化学品等危险液体的拉曼光谱检测方法, 获得了41种危险液体的高信噪比拉曼光谱数据并将其录入数据库, 再利用多种模式识别算法开展危险液体的识别研究, 通过线性判别分析(linear discriminant analysis, LDA)方法, 提出的谱图识别模型可对上述危险液体进行准确识别归类, 并能将其与水等无害物质快速区分。

1 实验部分
1.1 仪器与试剂

innoRam便携式拉曼光谱仪(美国BWTEK公司), 配备有785 nm激光器。

检测物包括沙林、 梭曼、 塔崩、 维埃克斯、 芥子气等化学毒剂; 磷酸三甲酯、 磷酸三乙酯、 磷酸三丁酯、 甲基膦酸二甲酯、 甲基膦酸二异丙酯等化学毒剂模拟剂; 亚磷酸二甲酯、 亚磷酸三甲酯、 亚磷酸三乙酯、 甲基膦酰氯乙酯、 甲基膦酰二氯、 甲基膦酰二氟、 氯沙林、 二乙胺基磷酰氯、 2-二乙胺基乙硫醇、 硫二甘醇、 异丙醇、 频呐基醇、 甲基膦酸、 甲基膦酸异丙酯、 甲基膦酸频呐基酯等化学毒剂前体、 中间产物、 水解产物; 邻二甲苯、 间二甲苯、 苯甲醚、 氯代苯、 乙酸乙酯、 乙酸乙烯酯、 乙酸苄酯、 甲醇、 乙醇、 乙腈、 丙酮、 1, 1, 1-三氯乙烷、 正己烷、 正丁醇、 四氯化碳等有毒工业化学品以及汽油和水。 其中磷酸三甲酯为分析纯, 购自中国医药集团上海化学试剂公司; 磷酸三乙酯、 乙酸乙酯为分析纯, 购自天津市福晨化学试剂厂; 磷酸三丁酯为分析纯, 购自天津市化学试剂; 甲基膦酸二甲酯为分析纯, 购自麦克林; 邻二甲苯、 间二甲苯、 苯甲醚、 氯代苯、 乙酸乙烯酯、 正丁醇纯度大于99.0%, 购自天津市光复精细化工研究所; 乙酸苄酯纯度大于99%, 购自北京百灵威科技有限公司; 甲醇、 乙腈为高效液相色谱纯度, 购自Sigma。 乙醇、 丙酮、 四氯化碳纯度大于99.5%, 购自北京化工厂; 1, 1, 1-三氯乙烷纯度大于96%, 购自阿拉丁; 正己烷纯度大于95.0%, 购自北京世纪红星化工有限公司; 水为市售娃哈哈纯净水。

1.2 方法

1.2.1 建立拉曼光谱检测方法

拉曼光谱仪开机后, 扫描空白光谱作为扣除的背景, 以消除仪器带来的噪声。 采集硅片的拉曼光谱并确认出峰波数为512 cm-1。 取适量样品至洁净透明玻璃瓶并放到样品池中, 设置激光功率为满值150 mW的10%~100%、 积分时间500~7 000 ms、 累积1~5次, 采集各条件下拉曼光谱并保存数据。

1.2.2 光谱数据分析

使用Matlab R2019a完成光谱数据分析。 将采集到的619个拉曼谱图截取200~3 000 cm-1范围的主要波段, 以1 cm-1间隔等距线性插值采样得到1× 2 801维样本数据, 将光谱进行离差标准化处理, 完成光谱样本预处理。 采用主成分分析方法对光谱数据进行降维压缩, 选择前7个主成分作为数据集样本, 以覆盖原始数据80%以上信息。 各样品随机分配70%谱图为训练集数据, 其余归入测试集。 利用训练集数据训练线性判别分析、 二次判别分析(quadratic discriminant analysis, QDA)、 k近邻(k-nearest neighbor, kNN)、 朴素贝叶斯(naive Bayesian, NB)模型、 分类决策树(classification tree, CT)、 支持向量机(support vector machine, SVM)6种模式识别算法的模型, 再用训练好的模型对测试集数据进行识别归类。

1.2.3 盲样测试

重新随机选取10个样品采集光谱, 用训练好的线性判别分析模型识别新测得的谱图, 以验证本研究检测及识别方法的可靠性。

2 结果与讨论
2.1 谱图分析

化学毒剂及其模拟剂、 化学毒剂前体、 中间产物、 水解产物和有毒工业化学品等18种代表物以及汽油、 水的拉曼光谱如图1所示。 文献报道G类神经性毒剂及其模拟剂因磷原子的存在而在700~750 cm-1范围产生特征性强峰[6, 7, 8, 9, 10]。 由图1(a)可见沙林、 梭曼、 塔崩的拉曼光谱在709~749 cm-1范围出现了该特征峰。 塔崩则在处于拉曼光谱沉默区的2 195 cm-1处, 因C& #x2261; N伸缩振动而表现出区别于其他毒剂的特征峰[11, 12]。 V类神经性毒剂维埃克斯[图1(a)]于740 cm-1的特征性强峰由P— C伸缩振动引起[13], 459 cm-1的峰对应于P— S伸缩振动或C— P— O的弯曲振动[13], 880 cm-1的峰由烷烃的C— C伸缩振动或C— H摇摆振动引起[13], 525 cm-1的峰以及1 439~1 457 cm-1的强峰分别归属于P— O弯曲振动模式和异丙基中的C— H弯曲振动模式[13]。 糜烂性毒剂芥子气[图1(a)]为对称的硫醚结构, 其654 cm-1的峰对应于硫醚结构中的C— S伸缩振动[13], 于1 290 cm-1的峰对应于烷烃结构中的C— C振动[12, 13], 235 cm-1的峰和731 cm-1的强峰由C— Cl振动引起[13]。 5种化学毒剂前体、 中间产物、 水解产物等样品的拉曼光谱见图1(b), 其中, 芥子气水解产物硫二甘醇于654 cm-1处的强峰对应于C— S— C的对称伸缩振动模式[13]。 化学毒剂模拟剂磷酸三甲酯、 磷酸三乙酯、 磷酸三丁酯的拉曼光谱[图1(c)]中除磷酸酯基团产生的强峰外, 1 450 cm-1附近的特征峰归属于烷烃基团的振动模式[14], 约1 100 cm-1处的峰由C— O的伸缩振动产生[13, 14, 15], 约3 000 cm-1处的谱峰由甲基中C— H的振动产生[14], 三者因分子中甲基所处环境不同导致该区域峰的峰形、 强度差异[7]。 有毒工业化学品苯甲醚、 氯代苯的分子结构中含有苯环, 其在拉曼光谱[图1(c)]中反映为约1 000 cm-1处的强峰。 1 581~1 599 cm-1的峰归属于苯环中C& #61; C的伸缩振动[16]。 氯代苯于698 cm-1处的特征峰则对应C— Cl的伸缩振动[6], 从而区别于其他样品。 汽油主要由C5— C12的脂肪烃、 环烷烃以及一定量芳香烃组成[17], 其拉曼光谱[图1(d)]反映了丰富的化学结构信息。 与之相对, 水[图1(d)]在测试的波数区间则没有拉曼信号。.

图1 化学危险品和水的拉曼光谱
(a): 沙林、 梭曼、 塔崩、 维埃克斯、 芥子气; (b): 异丙醇、 频呐基醇、 甲基膦酸异丙酯、 甲基膦酸频呐基酯、 硫二甘醇; (c): 磷酸三甲酯、 磷酸三乙酯、 磷酸三丁酯、 苯甲醚、 氯代苯; (d): 丙酮、 甲醇、 水、 乙醇、 汽油的拉曼光谱
Fig.1 Raman spectra of hazardous chemicals and water
Raman spectra of (a): sarin, soman, tabun, VX, and mustard gas; (b): isopropyl alcohol, 3, 3-dimethyl-2-butanol, isopropyl methylphosphonate, pinacolyl methylphosphonate, and thiodiglycol; (c): trimethyl phosphate, triethyl phosphate, tributyl phosphate, anisole, and chlorobenzene; (d): acetone, methanol, water, ethanol, and gasoline

由图1可见拉曼光谱反映了化合物的化学键构成, 是一种可用于化合物鉴别的指纹谱。 但由于分子振动的复杂性, 不是所有谱峰都易于归属, 仅靠拉曼光谱提供的信息难以准确判定化合物结构, 而利用化学计量学, 将模式识别方法与拉曼光谱结合是提高鉴别准确性的有效手段。

2.2 谱图识别

各样品的前3个主成分分布如图2所示。 由图可见, 拉曼光谱作为分子指纹谱, 具有丰富的化学键及其所处环境的信息, 可将不同类型的样品加以区分。 为比较模型的识别准确率, 使用线性判别分析、 二次判别分析、 k近邻、 朴素贝叶斯模型、 分类决策树、 支持向量机6种模式识别算法对180个测试集数据进行识别归类后, 识别结果列于表1

图2 各样品的前3个主成分分布Fig.2 Distribution of the first 3 principal components of the samples
表1 6种模式识别方式对测试集拉曼数据的识别准确率(%) Table 1 Recognition results of six pattern recognition algorithms(%)

表1可见, 支持向量机、 线性判别分析模型具有100%的最高识别准确率。 支持向量机是以各类样本间隔最大为原则, 其分类判别界面取决于类别边界的“ 支持向量” 。 线性判别分析则是以原始样本投影得到向量的类间距离最大、 类内方差最小为原则, 通过Fisher判别式对样本进行分类的模型, 其判别界面更取决于“ 类心” 。 当各样品多个训练集谱图中有个别因仪器影响或外界环境改变出现一定偏差的谱图时, 支持向量机模型在对未知样品识别时, 会因此对结果产生较大影响。 因数据库中该样品“ 类心” 无大偏差, 同样情况下线性判别分析模型的识别结果波动较小具有稳健性, 故本研究选取线性判别分析模型进行未知危险化学品的识别。 利用线性判别分析模型重复10次识别归类后, 其识别结果稳定于100%的准确率不变, 可见该模型具有高识别准确率及稳定性。 对重新采集的10个盲样谱图, 线性判别分析模型可以全部准确识别。 不同化合物即使元素组成相同, 基团或其所处环境的差异会使其具有不同的拉曼光谱特征。 拉曼光谱的分子指纹谱特点防止了线性判别分析模型可能过度拟合数据而导致分类识别结果准确率降低。

3 结论

以多种化学毒剂及其前体、 中间体、 水解产物、 模拟剂和有毒工业化学品等为研究对象, 建立了化学毒害物质拉曼光谱数据库。 在此基础上, 以不同模式识别方法对上述毒害物质以及常见液体如水、 乙醇、 汽油等进行了快速筛查研究。 结果表明, 外观均为无色透明液体的各类化合物散射光谱特征差异显著, 反映出拉曼光谱的指纹谱特征; 模式识别方法与拉曼光谱结合可有效鉴别危险液体, 其中线性判别分析模型的识别结果波动较小更具稳健性; 全部测试过程在较短时间内即可完成且不损耗样品, 保证了测试通量和遂行任务人员安全, 该研究可为与不明化学品筛查相关的公共安全问题提供技术支撑。

参考文献
[1] WANG Hong-qiu, ZHANG Li, WANG Lu, et al(王红球, 张丽, 王璐, ). J. Light Scattering(光散射学报), 2012, 24(4): 367. [本文引用:1]
[2] ZHANG Tao, HAO Feng-long, JIA Er-hui, et al(张涛, 郝凤龙, 贾二惠, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(11): 3372. [本文引用:1]
[3] LI Tian-shu, YAO Qi-feng, LI Hong, et al(李天舒姚齐峰李红, ). Infrared and Laser Eng(红外与激光工程). 2019, 48(7): 204. [本文引用:1]
[4] JIANG Xin, SHANG Zhao-cong, QIAN Yu-ting(蒋鑫, 商照聪, 钱玉婷). Shand ong Industrial Technology(山东工业技术), 2017, (19): 220. [本文引用:1]
[5] Christesen S D, Guicheteau J A, Curtiss J M, et al. Opt. Eng. , 2016, 55(7): 074103. [本文引用:1]
[6] Ortiz-Rivera W, Pacheco-Londono L C, Hernández-Rivera S P. Sensing and Imaging: An International Journal, 2010, 11(3): 131. [本文引用:2]
[7] Hoffmann J A, Miragliotta J A, Wang J, et al. Int. Soc. Opt. Eng. Photonics, 2012, 8373: 83732. [本文引用:2]
[8] Wang J, Duan G, Liu G, et al. J. Hazard. Mater. , 2016, 303: 94. [本文引用:1]
[9] Lafuente M, Pellejero I, Sebastián V, et al. Sens. Actuator A Chem. , 2018, 267: 457. [本文引用:1]
[10] Christesen S D, Jones J P, Lochner J M, et al. Appl. Spectrosc. , 2008, 62(10): 1078. [本文引用:1]
[11] Hakonen A, Rindzevicius T, Schmidt M S, et al. Nanoscale, 2015, 8(3): 1305. [本文引用:1]
[12] Choi S K, Jeong Y S, Koh Y J, et al. Bull. Kor. Chem. Soc. , 2019, 40(3): 279. [本文引用:2]
[13] Kondo T, Hashimoto R, Ohrui Y, et al. Forensic. Sci. Int. , 2018, 291: 23. [本文引用:9]
[14] Choi S K, Jeong Y S, Koh Y J, et al. Bull. Kor. Chem. Soc. , 2019, 40(6): 483. [本文引用:3]
[15] Galan-Freyle N J, Figueroa-Navedo A M, Pacheco-Londoño Y C, et al. Anal. Chem. , 2014, 2: 15. [本文引用:1]
[16] El Alami A, Lagarde F, Tamer U, et al. Vib. Spectrosc. , 2016, 87: 27. [本文引用:1]
[17] Wu X, Zhang S, Guo X, et al. Environ. Pollut. , 2019, 253: 731. [本文引用:1]