吡啶二甲酸结构异构体的太赫兹光谱分析
骆国防1, 齐济2, 刘雅丽2, 何明霞2, 黄华3, 曲秋红2,*, 张逸竹2,*
1.国网上海市电力公司电力科学研究院, 上海 200437
2.天津大学精密仪器与光电子工程学院, 天津 300072
3.国网上海市电力公司, 上海 200437
*通讯作者 e-mail: zhangyizhu@tju.edu.cn; quqiuhong114@126.com

作者简介: 骆国防, 1972年生, 国网上海市电力公司电力科学研究院高级工程师(专家) e-mai1: shdkylgf@163.com;齐 济, 1999年生, 天津大学精密仪器与光电子工程学院硕士研究生 e-mai1: miracle0706@tju.edu.cn;骆国防, 齐 济: 并列第一作者

摘要

在食品和药品生产过程中, 同分异构体的识别和区分是一个重要且复杂的问题, 尤其是在它们分子式相同但晶体结构不同的情况下。 吡啶二甲酸作为一种广泛应用于医药合成的关键中间体, 不同的异构体表现出不同的物理和化学性质, 对其进行有效区分尤为关键。 太赫兹光谱技术被视作检测同分异构体的新手段, 利用高分辨率太赫兹时域光谱仪对2,3-吡啶二甲酸、 2,4-吡啶二甲酸、 2,5-吡啶二甲酸、 3,4-吡啶二甲酸以及3,5-吡啶二甲酸进行测量, 揭示了它们在不同质量分数下的独特太赫兹吸收特征。 这些异构体的吸收特性在太赫兹波段有不同差异。 通过密度泛函理论计算, 对比了理论模拟与实验测量结果, 揭示了这些化合物的主要振动模式, 包括羧基和吡啶环的扭转振动、 键角弯曲以及它们的耦合作用。 研究展现了太赫兹光谱在物质鉴别方面的独特优势, 并指出其与红外光谱的显著区别。 研究结果不仅为理解吡啶二甲酸衍生物的太赫兹光谱特征提供了参考, 也展示了太赫兹光谱在化学物质分析和识别方面的应用潜力, 对医药中间体的合成和鉴别提供了新的依据。

关键词: 太赫兹时域光谱; 吡啶二甲酸; 密度泛函理论; 同分异构体
中图分类号:O433 文献标志码:A
Terahertz Spectroscopy of the Structural Isomers of Pyridine Dicarboxylic Acid
LUO Guo-fang1, QI Ji2, LIU Ya-li2, HE Ming-xia2, HUANG Hua3, QU Qiu-hong2,*, ZHANG Yi-zhu2,*
1. State Grid Shanghai Electric Power Research Institute, Shanghai 200437, China
2. School of Precision Instrument and Optoelectronic Engineering, Tianjin University, Tianjin 300072, China
3. State Grid Shanghai Electric Power Company, Shanghai 200437, China
*Corresponding authors

LUO Guo-fang and QI Ji: joint first authors

Abstract

In the production processes of food and pharmaceuticals, the identification and differentiation of stereoisomers constitute a crucial and complex issue, particularly when their molecular formulas are identical, but their crystal structures differ. Pyridine dicarboxylic acids serve as key intermediates widely used in pharmaceutical synthesis, where effective discrimination between different isomers is essential due to their varied physical and chemical properties. The technique of terahertz spectroscopy has emerged as a novel approach for detecting stereoisomers, employing high-resolution terahertz time-domain spectrometers to measure 2,3-pyridine dicarboxylic acid, 2,4-pyridine dicarboxylic acid, 2,5-pyridine dicarboxylic acid, 3,4-pyridine dicarboxylic acid, and 3,5-pyridine dicarboxylic acid, revealing their unique terahertz absorption features at different mass fractions. These isomers exhibit distinct absorption characteristics in the terahertz range. Through density functional theory calculations, a comparison between theoretical simulations and experimental measurements has been conducted, elucidating the primary vibrational modes of these compounds, encompassing the torsional vibrations of carboxyl groups and pyridine rings, bond angle bending, and their coupling effects. The research has demonstrated the unique advantages of terahertz spectroscopy in material identification, highlighting its significant differences from infrared spectroscopy. The findings not only offer insights into the terahertz spectral features of pyridine dicarboxylic acid derivatives but also showcase the potential applications of terahertz spectroscopy in the analysis and identification of chemical substances, providing new foundations for the synthesis and discrimination of pharmaceutical intermediates.

Keyword: Terahertz time-domain spectroscopy; Pyridine dicarboxylic acid; Density functional theory; Isomers
引言

在食品和药品的生产过程中, 同分异构体的形成是一个常见现象。 这些化合物虽具有相同的分子式, 但由于晶体结构的差异, 展现出不同的物理和化学特性。 因此, 采用高效的分析技术对含有同分异构体的晶体进行鉴别显得尤为关键。

吡啶二甲酸(Pyridine dicarboxylic acid, PDCA), 亦称二甲吡啶酸, 是一种有机化合物, 分子式为C7H5NO4。 它是吡啶的衍生物, 其结构特征在于吡啶环的两个位置被羧基所取代。 PDCA呈白色至淡黄色固态, 熔点较高, 且在水中表现出弱酸性。 作为医药合成的关键中间体, 其应用极为广泛[1]。 为确保药物生产的安全性要求对PDCA的异构体进行有效区分。 然而, 识别这些异构体的外部特征极具挑战性。 太赫兹光谱技术被视为研究这些异构体的有效工具[2, 3, 4]。 因此, 利用太赫兹光谱和计算对其结构异构体进行进一步研究在该领域显得尤为重要。

太赫兹(Terahertz, THz)光谱学, 覆盖0.1~10 THz频段的电磁波谱, 位于微波和红外(infrared, IR)范围之间[3], 对分子的构象性质及其周围环境具有高度敏感性, 在固体化学研究中已引起广泛关注[4]。 太赫兹波作用于物体可能源于各种分子间的相互作用模式, 例如平动、 转动和氢键拉伸[5], 这使得解析实验测得的太赫兹光谱特征的来源变得复杂。 在缺乏合适的理论框架的情况下, 确定光谱特征的来源并区分结构异构体是一个巨大的挑战。 太赫兹时域光谱技术已被证明是一种快速且有效的方法, 用于检测和定性区分同分异构体。 此外, 结合密度泛函理论(density functional theory, DFT)模拟物质的太赫兹光谱, 并将观测到的太赫兹吸收光谱特征与相应的振动模式相关联, 为异构体的定性分析提供了新的视角[6, 7, 8, 9, 10]

已有学者对吡啶羧酸类化合物进行了THz光谱的研究。 2, 6-PDCA在0.2~2.0 THz波段内的吸收光谱已被测得[11]。 对于2, 3-, 3, 4-, 3, 5-PDCAs, 有学者利用Material Studio软件中的CASTEP模块进行了模拟计算, 同时测得了低温环境中1~3 THz波段下的光谱。 本文采用太赫兹时域光谱(THz-TDS)对PDCA的五种异构体进行了光谱分析。 这些异构体展现了独特的太赫兹光谱特征, 可通过其特有的吸收光谱进行有效鉴别。 此外, 本文利用Gaussian16软件对以上五种PDCAs进行了振动分析, 并对样品进行了DFT计算, 对比和讨论了1~5 THz波段下的计算光谱与实验光谱。

1 实验部分
1.1 THz-TDS

采用日本Advantest公司的TAS7400SU太赫兹时域光谱仪对样品进行了测试, 该系统具有支持超宽带光谱分析(0.03~7 THz), 频域分辨率1.9 GHz/7.6 GHz, 支持多种材料的光谱分析, 配备干燥空气过滤单元, 测量结果不会受到水汽吸收影响。

1.2 样品情况

本研究中所使用的化合物包括: 2, 3-PDCA(百灵威公司, 纯度为99%)、 2, 4-PDCA(东京化成工业株式会社, 纯度高于98%)、 2, 5-PDCA(韶远试剂, 纯度不低于98%)、 3, 4-PDCA(百灵威公司, 纯度为98%)、 以及3, 5-PDCA(百灵威公司, 纯度为97.5%)。 这些化合物与聚乙烯(PE)混合并充分搅拌后, 分别按照10%和20%的比例制备成三个重量各为120 mg的样本。 样本在10兆帕(MPa)的压力下压制5 min, 形成直径约为10 mm, 厚度约为1 mm的薄片。 为确保实验结果的准确性与可重复性, 每次测量样品信号前均先测量一次参考信号(即空气)。 每个样品在不同位置进行三次压片操作, 分别记录每次操作的吸收数据。 所记录数据包括参考信号与样品信号的三次测量结果, 以便进行后续的数据分析和比较。

1.3 计算方法介绍

为了进一步实现对实验吸收峰的解析, 我们采用知名量子化学计算软件Gaussian16[12]对以上五种PDCA进行振动分析。 采用Gaussian软件配套的GaussView6.0完成对五种PDCA的分子建模。 计算时采用M06-2x泛函[13], 配合6-311g(d, p)基组[14], 同时, 引入Grimme所提出的零阻尼的D3色散校正[15, 16], 以进一步补充M06-2x泛函对弱相互作用的描述。 首先对建模分子进行分子优化, 收敛限为默认收敛限, 即分子最大受力小于0.000 450 a.u.、 根均方受力小于0.000 300 a.u.、 最大位移小于0.001 800 a.u.以及根均方位移小于0.001 200 a.u., 四者均达到收敛限后, 采用同样的计算参数对优化后分子进行振动分析, 将结果采用GaussView6.0进行分析, 结果并未出现虚频, 即可认为分子结构稳定。 振动谱绘制采用洛伦兹函数进行展宽, 半高全宽设为4 cm-1。 随后, 采用VEDA4软件[17]对分子振动分析结果进行势能分布(potential energy distribution, PED)分析, 对振动谱进行精准、 客观的指认。

2 结果与讨论
2.1 PDCA异构体样品的THZ-TDS光谱结果与分析

利用THz-TDS系统, 可以获取到样品的时域数据, 进行快速傅里叶变换(fast Fourier transform, FFT), 得到吡啶二甲酸异构体相应的频域信号, 并对其幅值进行归一化处理。 不同异构体在不同的频率上有着不同的吸收峰, 各个样品具体的峰值位置如表1所示。 这表明吡啶二甲酸异构体在太赫兹频段的分子振动有着明显的差异性, 进一步通过吸收系数和折射率可以更加直观地反映出这种差异, 并通过折射率的突变来确定峰值的真实性。 如图1所示。 在太赫兹频段下, 吡啶二甲酸异构体展示了不同的吸收特性, 这些特性随质量分数的增加而更加明显。

表1 20%质量分数PDCA的吸收峰位置 Table 1 The absorption peak position of 20% mass fraction pyridinic acid

图1 质量分数20%的PDCAs异构体吸收系数(红色实线)和折射率(蓝色虚线)
(a): 2, 3-PDCA; (b): 2, 4-PDCA; (c): 2, 5-PDCA; (d): 3, 4-PDCA; (e): 3, 5-PDCA
Fig.1 The absorption coefficient (red solid line) and refractive index (blue dashed line) of 20% mass fraction PDCA isomers
(a): 2, 3-PDCA; (b): 2, 4-PDCA; (c): 2, 5-PDCA; (d): 3, 4-PDCA; (e): 3, 5-PDCA

2.2 PDCA异构体的理论计算

五种PDCA优化后的稳定结构如图2所示。 对图2所示结构进行振动分析后, 绘制1.0~5.0 THz范围内的光谱图如图3所示。

图2 PDCAs的结构
(a): 2, 3-PDCA; (b): 2, 4-PDCA; (c): 2, 5-PDCA; (d): 3, 4-PDCA; (e): 3, 5-PDCA
Fig.2 Structure of PDCAs
(a): 2, 3-PDCA; (b): 2, 4-PDCA; (c): 2, 5-PDCA; (d): 3, 4-PDCA; (e): 3, 5-PDCA

图3 PDCAs的计算模拟结果
(a): 2, 3-PDCA; (b): 2, 4-PDCA; (c): 2, 5-PDCA; (d): 3, 4-PDCA; (e): 3, 5-PDCA
Fig.3 The simulation results of PDCAs
(a): 2, 3-PDCA; (b): 2, 4-PDCA; (c): 2, 5-PDCA; (d): 3, 4-PDCA; (e): 3, 5-PDCA

对于2, 3-PDCA, 计算得到3个特征振动, 位于2.37、 3.44和3.72 THz, 对应了实验测得的2.41、 3.47和3.94 THz三个吸收峰; 通过PED 分析, 2.37 THz处的吸收峰主要由O12— C10— C2— C1四个原子构成的二面角的扭转引起(占32%), 同时还包括N6— C5— C4— C3构成的二面角扭转等振动模式共同构成, 在分子中具象表现为吡啶环的变形振动和羧基的扭转振动的耦合; 3.44 THz主要由O16— C14— C1— C2构成的二面角扭转等振动构成, 主要表现为羧基的扭转振动; 3.72 THz处的振动模式C14— C1— N6构成键角的弯曲以及C10— C2— C3构成键角的弯曲振动, 在分子中表现为羧基在分子内的相对运动。

2, 4-PDCA得到3个特征振动, 位于1.31、 3.04和4.02 THz, 其中, 4.02 THz对应着3.88 THz, 而1.31和3.04 THz在实验中并未找到对应, 可能是由于测试光谱分辨率不足或计算中对分子间相互作用的忽略等系统误差所导致。 其中, 4.02 THz位置处的吸收峰主要包括C14— C3— C4构成的键角弯曲和C10— C1— N6构成的键角弯曲, 两种振动在此振动模式下中占比分别为40%和36%, 在分子中均表现为分子整体对称振动, 而由于吡啶环中氮原子的存在, 破坏了分子的对称性, 出现了可观测的偶极矩变化, 从而使得此振动模式可被太赫兹技术测量。

2, 5-PDCA得到3个特征振动, 分别位于1.58、 2.33和4.50 THz, 其中, 2.33和4.50 THz对应着实验测得的2.34和4.22 TIz。 2.33 THz振动下包含着两个特征吸收, 2.32和2.34 THz, 由于洛伦兹展宽而合并为一个吸收峰。 此吸收峰对应的振动模式振动较为复杂, 几乎覆盖了分子中的所有原子, 包含大量二面角的变化, 主要表现为破坏分子整体平面构型的变形振动, 且这两种振动模式在空间中表现出一定的互补趋势, 这可能是分子的几何对称性所导致的; 4.50 THz 主要表现为C14— C4— C5三个原子构成的二面角以及C10— C1— N6三个原子构成的二面角的弯曲振动, 这两种振动的贡献分别为39%和32%, 贡献比例的不同是由分子结构的对称性破缺所导致, 对分子整体则表现为分子平面内分子的变形振动。

3, 4-PDCA计算得到4个吸收峰, 分别为1.03、 2.85、 3.38 THz和4.87 THz, 分别对应着1.61、 2.82、 3.14和4.78 THz四个吸收峰。 1.03 THz处的吸收峰由O12— C10— C3— C2构成二面角的扭转和O16— C14— C2— C1构成二面角的扭转构成, 表现为两个羧基相位相反的扭转振动; 2.85 THz吸收峰仍带有大量O12— C10— C3— C2以及O16— C14— C2— C1构成二面角的扭转(合计约49%), 同时还有C10— C3— C4构成键角的弯曲振动, 具体表现为羧基连带吡啶环的扭转振动; 3.38 THz处的吸收峰主要由C1— N6— C5— C4构成二面角的扭转等模式构成, 主要表现为吡啶环在平面外的变形振动; 4.87 THz吸收峰的形成主要包括C14— C2向量相对于C1— C3— C2构成平面夹角的弯曲, 以及C10— C3向量相对于C2— C4— C3平面夹角的弯曲, 在分子中主要表现为羧基的扭转振动和吡啶环变形振动的耦合。

3, 5-PDCA得到2个有活性的吸收峰, 位于2.11和4.91 THz, 对应着实验测得的2.11和3.99 THz。 其中, 2.11 THz对应O12— C10— C2— C1二面角的扭转以及O16— C14— C4— C3二面角的扭转, 在分子中表现为羧基的扭转振动; 4.91 THz主要对应着C10— C2— C3构成的键角以及C14— C4— C5构成键角的弯曲, 表现为分子平面内的弯曲振动。

相关振动模式PED分析中涉及的原子如表2所示。 由表2可知, 太赫兹波段的吸收很难精准地指认至特定的化学键或单一的化学基团, 这是太赫兹光谱和红外光谱的重要差别, 由此可看出, 太赫兹光谱包含的物质信息相对于红外光谱更加复杂, 意味着太赫兹光谱在物质鉴别中指纹谱特性更为显著。

表2 各振动模式所涉及的原子 Table 2 Statistical table of atoms involved in each normal vibration mode

模拟计算得到的吸收峰的数量普遍少于实验测量, 这是由于密度泛函理论是以单分子为研究对象, 而实际测量的样品则是以固体等凝聚相状态存在, 即模拟过程中忽略了晶体物质中分子间的相互作用, 得到的吸收峰仅仅来源分子内的振动模式。 尽管周期性体系的量子化学计算更适用于晶体结构的模拟, 但在缺乏精确晶胞参数的情况下, 单分子模拟仍是一种可靠的替代方法。 此外, 常用于周期性体系模拟的泛函大多为广义梯度近似等纯泛函, 误差较大且选择有限。 而单分子体系计算的优势在于其可选择的泛函和基组搭配非常丰富, 能够轻松采用精度更高的杂化泛函甚至双杂化泛函结合三分裂价基组进行计算, 从而在一定程度上弥补了忽略分子间相互作用所带来的损失。 同时, 在吸收峰的指认过程中, 理论峰和实验峰存在一定的频率差异, 造成这种现象的原因是多种多样的, 一方面, 在测量过程中, 不可避免的与理想状态有所不同, 同时存在测量误差等系统误差; 另一方面, 在计算过程中, 也同样存在谐振近似误差、 基组完备性误差等多种计算误差, 导致计算结果与实际情况存在差异。

图4 PDCAs的振动模式图
(a): 2, 3-PDCA; (b): 2, 4-PDCA; (c): 2, 5-PDCA; (d): 3, 4-PDCA; (e): 3, 5-PDCA
Fig.4 Vibration mode diagram of PDCA
(a): 2, 3-PDCA; (b): 2, 4-PDCA; (c): 2, 5-PDCA; (d): 3, 4-PDCA; (e): 3, 5-PDCA

3 结论

针对相似度极高的同分异构体在医药化工领域鉴别困难的问题, 采用太赫兹时域光谱技术获得了五种PDCAs在1~5 THz范围内的指纹谱, 实现了对不同PDCAs同分异构体的快速、 精准地区分, 并通过量子化学的模拟和分析技术, 对特征吸收的吸收峰进行了指认和归属, 在很大程度上解释了太赫兹光谱技术区分PDCA的物理机理, 为同分异构体的检测分析提供了新的思路和方法。

参考文献
[1] Frisch M, Cahill C. Dalton Transactions, 2006, 39: 4679. [本文引用:1]
[2] Bawuah P, Zeitler J A. TRAC Trends in Analytical Chemistry, 2021, 139: 116272. [本文引用:1]
[3] Liu Q C, Deng H, Li H Z, et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2022, 283: 121722. [本文引用:2]
[4] Du S, Su M, Wang C, et al. Analytical Chemistry, 2022, 94(6): 2891. [本文引用:2]
[5] Hafez H A, Chai X, Ibrahim A, et al. Journal of Optics, 2016, 18(9): 093004. [本文引用:1]
[6] Castro-Camus E, Johnston M B. Chemical Physics Letters, 2008, 455: 289. [本文引用:1]
[7] Vereecken L, Pierloot K, Peeters J. The Journal of Chemical Physics, 1998, 108(3): 1068. [本文引用:1]
[8] Orio M, Pantazis D A, Neese F. Photosynthesis Research, 2009, 102(2-3): 443. [本文引用:1]
[9] Jursic B S. Journal of Molecular Structure: THEOCHEM, 2000, 507(1-3): 185. [本文引用:1]
[10] Popov A A, Kareev I E, Shustova N B, et al. Journal of the American Chemical Society, 2007, 129(37): 11551. [本文引用:1]
[11] Yu B L, Alimova A, Katz A, et al. THz Absorption Spectrum of Bacillus Spores. Proceedings of SPIE, Terahertz and Gigahertz Electronics and Photonics IV, 2005, 5727: 20. [本文引用:1]
[12] Frisch M J, Trucks G W, Schlegel H B, et al. Gaussian 16, Revision A. 03, Gaussian, Inc. , Wallingford CT, 2016. [本文引用:1]
[13] Zhao Y, Truhlar D G. Theoretical Chemistry Account, 2008, 120: 215 [本文引用:1]
[14] Krishnan R, Binkley J S, et al. The Journal of Chemical Physics, 1980, 72(1): 650. [本文引用:1]
[15] Grimme S, Antony J, Ehrlich S, et al. The Journal of Chemical Physics, 2010, 132: 154104. [本文引用:1]
[16] Grimme S, Ehrlich S, Goerigk L. Journal of Computational Chemistry, 2011, 32: 1456. [本文引用:1]
[17] Michal H Jamróz. Vibrational Energy Distribution Analysis VEDA 4, Warsaw, 2004-2010. [本文引用:1]