丹参酮ⅡA和隐丹参酮近红外光谱的2D-COS解析及其在丹参酮提取物近红外模型中应用
彭严芳1, 王君1, 吴志生2,*, 刘晓娜3, 乔延江2,*
1.湖北中医药大学药学院, 湖北 武汉 430065
2.北京中医药大学中药学院, 北京 100029
3.滨州医学院中西医结合医院, 山东 烟台 264003
*通讯作者 e-mail: yjqiao@263.net; wzs@bucm.edu.cn

作者简介: 彭严芳,女, 1987年生,湖北中医药大学药学院实验师 e-mail: pengyf0816@163.com

摘要

采用二维相关光谱(2D-COS)技术, 以氘代氯仿为溶剂, 解析了丹参酮ⅡA和隐丹参酮标准品的近红外光谱(NIR)。 丹参酮ⅡA和隐丹参酮二维相关切片谱在1 600~1 800, 1 900~2 230和2 300~2 400 nm处有特征吸收, 其中丹参酮ⅡA在1 640和2 140 nm处有不同于隐丹参酮的呋喃环双键一级倍频和组合频吸收, 1 696 nm为丹参酮ⅡA和隐丹参酮分子中甲基伸缩振动二级倍频, 1 726和1 740 nm处吸收为丹参酮ⅡA和隐丹参酮环己烯亚甲基伸缩振动二级倍频, 2 146和2 220 nm为丹参酮ⅡA和隐丹参酮苯环C—C伸缩振动与C—H伸缩振动的组合频, 2 300~2 400 nm处一系列峰为丹参酮ⅡA和隐丹参酮甲基伸缩振动与弯曲振动组合频吸收。 以丹参酮提取物为载体, 以丹参酮ⅡA和隐丹参酮光谱解析特征波段及组合间隔偏最小二乘(SiPLS)筛选特征波段分别建立偏最小二乘(PLS)定量模型, 模型的决定系数 R2均大于0.9, 校正均方根误差(root mean of square error of calibration, RMSEC)和交叉验证均方根误差(RMSECV), 预测均方根误差(RMSEP)均较小。 结果表明, 2D-COS技术解析特征波段与SiPLS波段筛选所建PLS模型均稳定。 2D-COS技术使近红外定量模型更具解释性, 可解析出结构差异特征吸收, 同一波段可实现结构类似物的同时定量测定。

关键词: 丹参酮ⅡA; 隐丹参酮; 近红外光谱; 二维相关光谱; 丹参酮提取物; 光谱解析
中图分类号:O657.3 文献标志码:A
NIR Band Assignment of Tanshinone ⅡA and Cryptotanshinone by 2D-COS Technology and Model Application Tanshinone Extract
PENG Yan-fang1, WANG Jun1, WU Zhi-sheng2,*, LIU Xiao-na3, QIAO Yan-jiang2,*
1. Pharmacy Faculty, Hubei University of Chinese Medicine, Wuhan 430065, China
2. School of Chinese Materia, Beijing University of Chinese Medicine, Beijing 100029, China
3. College of Integrated Traditional Chinese Medicine and Wastern Medicine, Binzhou Medical University, Yantai 264003, China
*Corresponding authors
Abstract

The near-infrared (NIR) band assignment of Tanshinone ⅡA and Cryptotanshinone were performed by 2D-COS technique in deuterated chloroform. According to the two-dimensional synchronous slice spectra of Tanshinone ⅡA and Cryptotanshinone, Tanshinone ⅡA and Cryptotanshinone have characteristic absorption at 1 600~1 800, 1 900~2 230, and 2 300~2 400 nm. Tanshinone ⅡA has characteristic bands at 1 640 and 2 140 nm which connected with the first double-frequency and combination frequency of furan ring double bond. 1 696 nm was the second double-frequency of methyl stretching vibration in Tanshinone ⅡA and Cryptotanshinone molecules, the absorption at 1 726 and 1 740 nm were the second double-frequency of Tanshinone ⅡA and Cryptotanshinone which connected with cyclohexene methylene stretching vibration, 2 146 and 2 220 nm were the combined frequency of Tanshinone ⅡA and Cryptotanshinone which linked with benzene ring C—C and C—H stretching vibration, a series of peaks at 2 300~2 400 nm were the combination frequencies of stretching vibration and bending vibration of methyl in Tanshinone ⅡA and Cryptotanshinone molecules. Taking Tanshinone Extract as a carrier, the characteristic band by 2D-COS and the band by synergy interval Partial Least Squares (SiPLS) were used to establish Partial Least Square (PLS) quantitative models. The coefficients of determination R2 were all greater than 0.9, the Root Mean of Square Error of Calibration (RMSEC) and Root Mean of Square Error of Cross-Validation (RMSECV), and the Root Mean of Square Error of Prediction (RMSEP) were very small. The results showed that the PLS model established by 2D-COS and SiPLS were both good. The quantitative model based on the 2D-COS technique was explanatory. 2D-COS can be used to analyze the characteristic absorption connected with a structural differences. The simultaneous quantitative determination of structural analogues can be realized in the same band.

Keyword: Tanshinone ⅡA; Cryptotanshinone; Near infrared spectroscopy; Two-dimensional correlation spectroscopy; Tanshinone extract; Spectral assignment
引言

中药过程质量控制是保证中药临床用药安全性和有效性的重要措施。 如何提高中药过程质量控制水平, 促进中药现代化、 国际化, 是中药发展需要解决的关键问题之一[1]。 近红外光谱(near infrared spectroscopy, NIR)作为一种快速无损, 实时可靠的过程分析技术, 已被广泛应用在工业, 农业, 食品, 医药诸多领域[2, 3, 4, 5, 6]。 然而, NIR吸收强度弱, 光谱重叠严重, 且NIR易受环境和样品状态等因素的影响[5], 使得NIR的应用需借助化学计量学手段进行变量筛选。 化学计量学变量筛选方法以结果为导向, 所选变量重现性和解释性差。 中药成分复杂, 如何从NIR中解析出与目标分析物结构相关的信息成为NIR在中药过程质量评价中需要解决的关键问题。 二维相关分析(tow-dimensional correlation spectroscopy, 2D-COS)最早用于核磁共振谱中, 后Noda提出广义的二维相关谱, 将外部扰动从声、 光、 电拓展到浓度、 温度、 pH值等, 使2D-COS广泛用于紫外-可见, 红外, 近红外, 拉曼光谱中[7]。 2D-COS同步谱中自相关峰表示被分析物随外部扰动变化的特征谱带, 交叉峰则表示待分析物中关联较大的官能团, 二维相关同步谱截取对角线可得二维同步切片谱, 从中可获取与被分析物结构相关的特征谱带[8, 9]

丹参酮提取物为唇形科植物丹参Salvia miltiorrhiza Bge.的干燥根及根茎经加工制成的提取物[10]。 主要含脂溶性二帖类和水溶性丹酚酸。 其药理活性主要有抗凝血、 抗血小板聚集、 调血脂、 抗炎、 抗肿瘤[11]。 目前对于丹参酮提取物的质量控制主要是依靠高效液相色谱法(high performance liquid chromatography, HPLC), 如郭龙[12]等采用一测多评法测定丹参酮提取物中二氢丹参酮Ⅰ 、 隐丹参酮、 丹参酮Ⅰ 和丹参酮Ⅱ A 4种丹参酮类成分含量。 2020版药典中丹参酮提取物含量测定也采用HPLC法测定丹参酮Ⅱ A和隐丹参酮。 HPLC法具有较好准确性, 但费时耗力, 不利于中药现代化生产中的质量控制。 本工作采用近红外光谱, 结合2D-COS解析丹参酮Ⅱ A和隐丹参酮近红外光谱特征波段, 并用于复杂体系丹参酮提取物近红外偏最小二乘(partial least square, PLS)定量模型中, 以快速测定丹参酮提取物中丹参酮Ⅱ A和隐丹参酮含量, 提高变量筛选的重现性和解释性。

1 实验部分
1.1 仪器与材料

仪器: 丹参酮Ⅱ A和隐丹参酮对照品采用XDS Rapid Liquid Analyzer近红外光谱仪检测(瑞士万通, 中国)。 光谱采集方式: 以透射模式采集光谱, 以仪器内部的空气为背景, 分辨率为0.6 nm, 扫描范围400~2 500 nm, 每个样品扫描32次, 每个样品平行测定3次, 取平均光谱, 二维相关分析软件2Dshige (c) Shigeaki Morita, Kwansei-Gakuin University, 2004—2005。 丹参酮提取物采用美国Thermo Nicolet公司的AntarisⅠ 傅里叶变换近红外光谱仪进行光谱采集, 采用积分球漫反射方式, 以仪器内部空气为背景, 光谱分辨率为8 cm-1, 在4 000~10 000 cm-1波数范围内进行扫描, 每个样品扫描32次, 每个样品重复测定三次, 将三次测定光谱进行平均后用于后续分析。 使用Unscrambler 9.7软件进行数据处理。 1100型高效液相色谱仪包括四元泵、 真空脱气机、 自动进样器、 柱温箱、 二极管阵列检测器(DAD)和HP数据处理工作站(美国Agilent公司)。

材料: 氘代氯仿购于美国剑桥CIL公司(纯度99.8%, 质谱级, 批号13H-456), 丹参酮Ⅱ A和隐丹参酮对照品购于中国食品药品检定研究院(批号110766-200619和110852-200806), 丹参酮提取物共50份, 分别购于西安宏森生物科技有限公司、 山西惠能达生物科技有限公司、 山西安盛生物科技股份有限公司、 西安昊轩生物科技有限公司、 南京泽朗科技有限公司。 甲醇(分析纯, 国药集团化学试剂有限公司), 磷酸(分析纯, 国药集团化学试剂有限公司), 乙腈(色谱纯, 德国默克公司)。

1.2 方法

分别取购买于不同厂家的丹参酮提取物约5 mg, 精密称定, 置10 mL量瓶中, 加甲醇使溶解, 并稀释至刻度, 用0.45 μm微孔滤膜过滤, 取续滤液得供试品溶液, 共50份。 以2015版药典为参考, 以HPLC测定丹参酮提取物中丹参酮Ⅱ A和隐丹参酮含量, 乙腈为流动相A, 以0.026%磷酸溶液为流动相B, 0~20 min内流动相A浓度由0%增加到60%, 20~50 min流动相A由60%增加到80%进行梯度洗脱, 检测波长为270 nm, 柱温为30 ℃, 流速0.8 mL· min-1, 进样量10 μL, 测得丹参酮Ⅱ A标准曲线为 y=44.77x-19.93(R2=0.999 9, n=11, 浓度范围为0.010 4~1.83 μg), 隐丹参酮标准曲线为y=46.95x-2.506(R2=0.999 9, n=11, 浓度范围为0.007 32~0.427 μg)。

分别秤取丹参酮Ⅱ A和隐丹参酮对照品用氘代氯仿配制成如表1所示浓度。 用于后续近红外光谱的采集。

表1 丹参酮Ⅱ A和隐丹参酮的氘代氯仿溶液浓度分布 Table 1 Concentration distribution of deuterated chloroform solution of tanshinone Ⅱ A and cryptotanshinone
2 结果与讨论
2.1 丹参酮Ⅱ A和隐丹参酮二维相关光谱分析

氘代氯仿及丹参酮Ⅱ A和隐丹参酮氘代氯仿溶液近红外原始光谱如图1所示, 由于氘代氯仿自身的强吸收, 使丹参酮Ⅱ A和隐丹参酮的特征吸收被掩盖, 无法从原始光谱中找出丹参酮Ⅱ A和隐丹参酮的特征吸收。

图1 氘代氯仿、 丹参酮Ⅱ A和隐丹参酮溶液近红外原始光谱图Fig.1 Original NIR spectra of deuterated chloroform, Tanshinone Ⅱ A and Cryptotanshinone solutions

采用2D-COS技术, 获取丹参酮Ⅱ A和隐丹参酮二维相关同步谱。 氘代氯仿、 丹参酮Ⅱ A和隐丹参酮二维相关同步谱截取对角线得二维同步切片谱如图2(a, b)。 由图2可知, 丹参酮Ⅱ A和隐丹参酮氘代氯仿溶液近红外二维同步切片谱分别在1 600~1 800, 1 900~2 230和2 300~2 400 nm这三个区域具有特征吸收。 丹参酮Ⅱ A和隐丹参酮分子结构如图3所示, 结合丹参酮Ⅱ A和隐丹参酮结构式, 同步切片谱中1 696 nm为甲基伸缩振动二级倍频, 1 726和1 740 nm处吸收为环己烯亚甲基伸缩振动二级倍频, 2 146和2 220 nm为苯环C—C伸缩振动与C—H伸缩振动的组合频, 2 300~2 400 nm处一系列峰为甲基伸缩振动与弯曲振动组合频吸收。 丹参酮Ⅱ A和隐丹参酮结构差异主要在于丹参酮Ⅱ A分子五元环为呋喃环, 而隐丹参酮分子中五元环为四氢呋喃环。 丹参酮Ⅱ A在1 640和2 140 nm处有呋喃环双键一级倍频和组合频吸收, 此处吸收为不同于隐丹参酮的吸收特征, 以上为丹参酮Ⅱ A和隐丹参酮特征波段归属[13]

图2 氘代氯仿、 丹参酮Ⅱ A和隐丹参酮二维同步切片谱(a)和切片谱局部放大图(b)Fig.2 Two-dimensional synchronous slice spectra of deuterated chloroform, Tanshinone Ⅱ A and Cryptotanshinone (a) and partialenlargeddetail of slice spectra (b)

图3 丹参酮Ⅱ A和隐丹参酮化学结构式Fig.3 Chemical structure of Tanshinone Ⅱ A and Cryptotanshinone

2.2 丹参酮提取物近红外定量分析模型的建立

2.2.1 光谱预处理方法筛选

采集所有不同批次丹参酮提取物粉末的近红外光谱, 采用K-S(kenston)样本划分方法, 分别选取2/3为校正集, 1/3为验正集, 用于建立丹参酮提取物NIR定量模型。 丹参酮提取物粉末近红外原始光谱如图4所示, 由图4可知光谱基线漂移严重, 吸收特征不明显。 平滑和归一化可以消除由光程差异所带来的光谱变动, 平滑可以提高信噪比, 导数法使重叠峰的分辨率提高, 标准正则变换则可消除固体颗粒散射的影响。 考察了不同近红外光谱预处理方法(包括原始光谱Raw, Savitzky-Golay平滑SG, 基线校正Baseline, 归一化Normalize, 标准正则变换SNV, 一阶导数加平滑SG 1st, 二阶导数加平滑SG 2nd)对PLS建模结果的影响。

图4 丹参酮提取物近红外原始光谱Fig.4 Original NIR spectra of Tanshinone Extract

结果如表2所示, 经归一化处理后隐丹参酮PLS模型预测结果最好, 交叉验证均方根误差(root mean of square error of cross validation, RMSECV)和预测均方根误差(root mean of square error of prediction, RMSEP)最低, 分别为0.004 1和0.001 8 g· g-1。 经二阶导数加平滑(SG 2nd)处理后丹参酮Ⅱ A的PLS模型预测结果最好, RMSECV和RMSEP分别为0.005 5和0.002 0 g· g-1

表2 丹参酮Ⅱ A和隐丹参酮不同预处理方法PLS模型预测结果(g· g-1) Table 2 Results of Tanshinone IIA and Cryptotanshinone PLS models based on different pretreatment methods (g· g-1)

2.2.2 2D-COS和SiPLS分别筛选特征波段建模比较

使用化学计量学手段筛选与特征指标相关性最好的光谱信息用于定量模型的建立, 可以提高模型的预测性能, 删除冗余变量。 组合间隔偏最小二乘法(synergy interval partial least squares, SiPLS)将全谱划分成不同间隔数的光谱子区间, 将各个子区间按一定窗口大小进行组合, 然后建立不同光谱子区间组合模式下的PLS模型, 以RMSECV和RMSEP为评价指标筛选最佳子区间的组合用于建模。 比较了SiPLS波段筛选方法与2D-COS光谱解析方法建模结果, 采用SiPLS进行波段筛选, 分别考察了窗口数目为10, 12, 14, …, 26, 28, 30, 组合数为3时的丹参酮Ⅱ A和隐丹参酮PLS定量模型。

丹参酮Ⅱ A经SiPLS变量筛选后, 当窗口数为10, 选取第4, 9和10号窗口进行组合, 对应波段如图5(a), 波长为1 723~1 561和1 135~1 000 nm, 潜变量数目为9时, PLS模型RMSECV和RMSEP最小, 预测性能最好。 隐丹参酮窗口数为10, 选取第1, 4和9号窗口进行组合, 对应波段如图5(b), 波长为2 500~2 177, 1 723~1 561和1 135~1 063 nm, 潜变量数目为9时所建模型预测性能最好。 2D-COS筛选波段丹参酮Ⅱ A和隐丹参酮 PLS模型预测性能与SiPLS筛选波段所建模型相当, 其中丹参酮Ⅱ A在1 600~1 800 nm建模预测性能最好, 这与结构中呋喃环特征吸收相关。 2D-COS和SiPLS分别筛选特征波段建模结果如表3所示。

图5 SiPLS筛选波段
(a): 丹参酮Ⅱ A; (b): 隐丹参酮
Fig.5 Selection bands of SiPLS
(a): Tanshinone Ⅱ A; (b): Cryptotanshinone

表3 不同波段筛选方法PLS模型结果(g· g-1) Table 3 PLS model results of different band screening methods (g· g-1)
3 结论

以氘代氯仿为溶剂, 采用2D-COS解析了丹参酮Ⅱ A和隐丹参酮标准品的NIR光谱, 两样品在1 600~1 800, 1 900~2 230和2 300~2 400 nm有与浓度相关的特征吸收。 丹参酮Ⅱ A在1 640和2 140 nm处有呋喃环中双键一级倍频和组合频吸收。 1 696 nm为丹参酮Ⅱ A和隐丹参酮分子中甲基伸缩振动二级倍频, 1 726和1 740 nm处吸收为丹参酮Ⅱ A和隐丹参酮环己烯亚甲基伸缩振动二级倍频, 2 146和2 220 nm为丹参酮Ⅱ A和隐丹参酮苯环C—C伸缩振动与C—H伸缩振动的组合频, 2 300~2 400 nm处一系列峰为丹参酮Ⅱ A和隐丹参酮甲基伸缩振动与弯曲振动组合频吸收。 采集丹参酮提取物近红外光谱, 考察复杂体系下, 2D-COS解析特征波段与SiPLS筛选波段PLS建模结果, 二者均具有良好的模型预测性能。 2D-COS解析的特征波段与结构密切相关, 其中1 600~1 800 nm处丹参酮Ⅱ A的PLS模型预测性能比SiPLS筛波段PLS模型更好, 表现出与分子结构相关的高度可解释性。 验证了2D-COS这一光谱特征解析方法所得特征吸收峰在中药复杂体系中NIR建模的适用性, 且与化学计量学特征波段筛选相比, 更具有解释性和稳定性, 为近红外特征波段的筛选提供了借鉴和指导。 同时, 对于丹参酮提取物中结构相似化合物丹参酮Ⅱ A和隐丹参酮, 2D-COS可解析出结构差异特征吸收, 一个波段可实现结构类似物的同时定量测定, 为中药生产工业化中专业用途NIR仪器的制造提供了可行性论证, 未来可以考虑将2D-COS用于NIR专业仪器制造光程的选取中。

参考文献
[1] XIAO Xiao-he, JIN Cheng, YAN Dan, et al(肖小河, 金城, 鄢丹, ). Chinese Traditional and Herbal Drugs(中草药), 2010, 41(4): 505. [本文引用:1]
[2] Chen Yong, Chen Ming, Zhang Siyu, et al. Vibrational Spectroscopy, 2020, 107(05): 103023. [本文引用:1]
[3] Hao Lin, Hao Jiang, Lin Jinjin, et al. Food Analytical Methods, 2021, 14: 1305. [本文引用:1]
[4] Yang Z, Xiao H, Zhang L, et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2019, 223: 117327. [本文引用:1]
[5] Du C, Dai S, Zhao A, et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2019, 222: 117267. [本文引用:2]
[6] Weiler F H, Grasel F, Lourega R V, et al. Microchemical Journal, 2019, 149: 103994. [本文引用:1]
[7] Noda I. Applied Spectroscopy, 1993, 47(9): 1329. [本文引用:1]
[8] Yeonju Park, SilaJin, Isao Noda, et al. Journal of Molecular Structure, 2020, 1217: 1305. [本文引用:1]
[9] Wang Shifang, Cheng Xu, Zheng Decong, et al. Analysis Sensors, 2020, 20(17): 4822. [本文引用:1]
[10] Chinese Pharmacopoeia Commission(中国药典委员会). Chinese Pharmacopoeia Vol. 1(中国药典, 一部). Beijing: Chemical Industry Press(北京: 化学工业出版社), 2020. [本文引用:1]
[11] WAN Xin-huan, WANG Yu-liang, ZHOU Chang-zheng, et al(万新焕, 王瑜亮, 周长征, ). Chinese Traditional and Herbal Drugs(中草药), 2020, 51(3): 788. [本文引用:1]
[12] GUO Long, XUE Zi-jing, LIU Ai-peng, et al(郭龙, 薛紫鲸, 刘爱朋, ). Modern Chinese Medicine(中国现代中药), 2019, 21(3): 357. [本文引用:1]
[13] Workman Jr J, Weyer L. Practical Guide to Interpretive Near-Infrared Spectroscopy. CRC Press, 2007. [本文引用:1]