作者简介: 李 运, 1993年生, 云南中医学院中药学院硕士研究生 e-mail: liyunsci@163.com
当今中药市场上掺假现象屡见不鲜, 不良商贩利用三七须根粉末假冒主根和剪口粉末, 严重影响三七的质量与药效。 通过傅里叶变换红外光谱(FTIR)结合化学计量学建立三七主根、 剪口和须根粉末鉴别及四种皂苷含量快速预测模型, 为快速三七质量控制提供基础。 采集三七主根、 剪口和须根红外光谱, 超高效液相色谱(UPLC)测量样品中三七皂苷R1、 人参皂苷Rg1、 人参皂苷Rb1和人参皂苷Rd含量。 采用纵坐标归一化及二阶导数对原始红外光谱进行预处理; Kennard-stone算法将60个样本分为2/3训练集与1/3预测集。 训练集数据结合支持向量机(SVM)判别建立三七主根、 剪口和须根粉末鉴别模型, 最佳核函数 c和 g采用交叉验证进行网格式搜索, 预测集数据用于对判别模型进行外部验证。 正交信号校正偏最小二乘回归(OSC-PLSR)建立三七中四种皂苷含量预测模型, 红外光谱采用一阶、 二阶导数及Savitsky-Golay平滑5点、 7点、 9点、 11点预处理。 60个样本分为2/3训练集与1/3预测集, 训练集数据建立OSC-PLSR模型, 预测集数据对OSC-PLSR模型的预测结果进行外部验证。 结果显示: (1)二阶导数可有效的分离原始谱图的叠合隐蔽谱峰, 并提高谱图的分辨率; (2)交叉验证网格式搜索计算出最佳核函数 c=2.828 43, g=4.882 81×10-4, 此时训练集判别正确率为100%; (3)SVM判别模型核函数设置为最佳核函数, 预测集数据外部验证正确率为100%, 所有样本均被正确鉴别; (4)三七皂苷R1、 人参皂苷Rg1、 人参皂苷Rb1和人参皂苷Rd最优含量预测模型预测值与UPLC检测值接近, 预测效果良好。 FTIR结合SVM判别能对三七主根、 剪口和须根粉末快速鉴别, 结合OSC-PLSR能对四种皂苷含量进行准确预测。 该方法准确可靠, 可为中药材三七提供快速有效的质量控制。
Phenomenon of adulterated traditional Chinese medicine (TCM) are still common in TCM market today. Unscrupulous traders used fibrous root powder pretending to be main root and rhizome powder of Panax notoginseng, and such behavior has serious influence on the quality and efficacy of Panax notoginseng. In this study, we have established a rapid method to discriminate the main root, rhizome and fibrous root powder and detect saponins content of Panax notoginseng in order to provide some research bases for rapid quality assessment of Panax notoginseng. A total of 60 Fourier transform infrared (FTIR) spectra of the main root, rhizome and fibrous root powder of Panax notoginseng were collected, and ultra-high performance liquid chromatography (UPLC) was used for measuring the content of notoginsenoside R1, ginsenoside Rg1, ginsenoside Rb1 and ginsenoside Rd of samples. The origin data of identify model were processed by ordinate normalization and second derivative, and 2/3 of the 60 individuals were selected to form the calibration set by using Kennard-stone algorithm as well as the other 1/3 were used as validation set. Calibration set data were used to establish the discriminant model of support vector machine (SVM) and the cross-validation was used for screening optimal parameters c and g, and validation set data were used to verify the results of SVM discriminant model for external validation. The origin data used to predict saponins content were calculated by first (1D) and second derivative (2D), Savitsky-Golay smoothing with five, seven, nine, and eleven points. 2/3 of the 60 individuals were selected to form the calibration set and the rest were used as validation set. The orthogonal signal correction-partial least squares regression (OSC-PLSR) model was established by calibration set and the validation set was utilized to verify the results of the model for external validation. Results showed that, (1) with second derivative processing, the overlapped peak of FTIR spectra were efficiently separated and the resolution of the spectra has been improved. (2) The optimal parameters c and g of support vector machine calculated by cross-validation were 2.828 43 and 4.882 81×10-4 respectively and the optimal accuracy rate of calibration set was 100%. (3) The parameter of support vector machine model was set as the optimal parameter and the accuracy rate of validation set was 100%, and all samples in validation set have been identified correctly. (4) The prediction content of greatest model of notoginsenoside R1, ginsenoside Rg1, ginsenoside Rb1 and ginsenoside Rd was close to the content measured by UPLC. The result indicated that, FTIR combined with support vector machine could effectively identify the main root, rhizome and fibrous root powder of Panax notoginseng. OSC-PLSR could accurately predict the content of four saponins of Panax notoginseng. In summary, the FTIR spectroscopy could provide a rapid and effective method for the quality control of Panax notoginseng.
中药悠久的药用历史中, 人们发现其不同部位存在药效差异。 现代分析化学研究表明, 中药不同部位化学成分种类及含量有较大差异[1, 2, 3]。 当今中药市场上, 不法商贩将非药用或低含量部分混入中药中以谋取不良利益。 例如: 将酸枣果壳掺入种子中粉碎作酸枣仁出售; 麻黄中混入大量地上茎等。 临床用药时, 掺假中药会降低治疗效果, 甚至导致毒副作用的产生。 这些不良现象严重影响了中药的质量及药用安全, 是中药质量标准化亟需解决的问题之一。
五加科(Araliaceae)人参属(Panax)植物三七(Panax notoginseng (Burk) F. H. Chen)为我国特有名贵药材, 药用历史悠久[4, 5]。 现代药理学研究表明, 三七总皂苷(PNS)是三七药效的主要物质基础, 具有抗糖尿病[6, 7]、 抗癌[8, 9]、 抗动脉粥样硬化[10, 11]、 脑神经保护[12]、 降血压[13]等诸多药理活性。 2015版中国药典记载中药三七为植物三七的干燥根和根茎; 质量控制按干燥品计算, 含人参皂苷Rg1、 人参皂苷Rb1、 三七皂苷R1的总量不得少于5%[14]。 现有皂苷类成分含量检测方法多为高效液相色谱法[15], 样品的前处理繁琐费时, 检测过程漫长, 不利于快速检测分析, 寻找一种三七皂苷含量快速检测分析方法具有重要的实用意义。
研究表明三七主根、 根茎和须根总皂苷含量存在较大差异, 其中根茎总皂苷含量最高, 须根含量最低[16]。 商品三七分为头子(主根)、 剪口(根茎)和须根; 其中主根价格最高, 须根价格最低。 三七主根、 剪口和须根形态分辨较为简单, 但粉末状态极难分辨[17]。 李建蕊等采用红外光谱对三七剪口、 主根、 筋条和绒根粉末进行分析, 发现不同部位红外光谱具有差异; 但是仅通过个别吸收峰差异进行鉴别, 主观性与专业性较强, 不利于推广使用。 一些不良商贩利用三七须根粉末假冒主根和剪口粉末, 严重影响了三七的质量与药效。 因此, 鉴别三七主根、 根茎和须根粉末并以皂苷含量为指标对其进行质量控制, 有利于保证三七药材的药效以及该产业的规范化发展。
红外光谱法是一种通过被测物中化合物振动时吸收特定波长红外光, 从而得到化合物官能团、 化学键的分析方法[18], 具有快速、 无损及高灵敏度的特点。 结合化学计量学方法, 红外光谱广泛应用于中药种类与产地鉴别[19, 20], 中药与食品指标性成分含量快速预测研究[21, 22]。 本实验采用傅里叶变换红外光谱(Fourier transform infrared spectroscopy, FTIR)结合化学计量学方法对三七主根、 剪口和须根粉末进行鉴别, 同时对三七皂苷R1, 人参皂苷Rg1、 人参皂苷Rb1和人参皂苷Rd含量进行预测, 以期为三七的快速质量控制提供基础。
Frontier型傅里叶变换红外光谱仪(配备DTGS检测器, 扫描范围: 4 000~400 cm-1, 扫描信号累加16次, 分辨率: 4 cm-1, Perkin Elmer公司); LC-30AD超高效液相色谱仪(配备二极管阵列紫外检测器、 二元梯度泵、 自动进样器, 岛津公司); Shim-pack XR-ODS III 色谱柱(75 mm× 2.0 mm, 1.6 μ m, 100 MPa); Milli-Q超纯水系统(Millipore公司); 超声仪; 粉碎机; 压片机; 80目筛盘。 KBr(分析纯); 甲醇、 乙腈(色谱纯, 赛默飞世尔公司); 标准品: 三七皂苷R1、 人参皂苷Rg1、 人参皂苷Rb1和人参皂苷Rd(中国药品生物制品检定所)。
样品采集于云南省昆明市寻甸县甸沙乡麦地新村, 海拔2 090 m, 经度: 103° 07'25.02″, 纬度: 25° 45'33.61″。 所有样品经由云南省农业科学院药用植物研究所张金渝研究员鉴定为人参属植物三七的全株。 新鲜样品清洗之后自然阴干, 主根、 剪口和须根分离后密封保存。 实验前将样品粉碎后过80目筛, 烘箱内50 ℃干燥恒重备用。
准确称取样品粉末(1.2± 0.2) mg及KBr粉末(150.0± 1.0) mg, 于玛瑙研钵中混合均匀并充分研磨, 研磨后粉末倒入模具中压制成均匀薄片。 同一样品扫描两次, 样品扫描前使用空白KBr压片扫描背景以去除二氧化碳和水的干扰。
流动相为超纯水(A)-乙腈(B), 流速: 0.35 mL· min-1, 柱温: 45 ℃, 进样量1 μ L, 参照中国药典三七含量测定部分设置检测波长为203 nm。 梯度洗脱程序: 0~3 min, 20%~24% B; 3~6 min, 24%~38% B; 6~12 min, 38%~56% B; 12~13 min, 56%~20% B; 13~14 min, 20% B。 准确称取样品粉末(40.0± 2.0) mg置于洁净试管中, 加入2.0 mL甲醇, 密封超声提取40 min。 提取结束后补充损失甲醇, 使用0.22 μ m有机微孔滤膜过滤提取液。 精密称取三七皂苷R1 0.7 mg, 人参皂苷Rg1 3.0 mg, 人参皂苷Rb1 3.2 mg, 人参皂苷Rd 0.8 mg, 加入1.6 mL甲醇配置成标准品母液, 将标准品母液按50%等梯度稀释6次, 得到7个浓度梯度的标准品溶液。 自动进样器吸取母液2与1 μ L, 其余梯度吸取1 μ L注入超高效液相色谱仪, 记录不同浓度梯度标准品峰面积, 并计算峰面积与标准品浓度的线性回归方程。 吸取1 μ L样品提取液注入超高效液相色谱仪, 按照梯度洗脱程序进行检测, 并记录203 nm色谱图。
使用EXCEL建立标准品溶液浓度与峰面积的线性回归方程, 结合样品色谱图中峰面积计算出对应皂苷含量。 参与支持向量机(support vector machines, SVM)判别分析的原始红外光谱使用OMNIC软件进行平均光谱、 纵坐标归一化、 二阶导数等预处理, 参与正交信号校正偏最小二乘回归模型建立的原始红外光谱进行平均光谱、 纵坐标归一化、 平滑、 一阶导数及二阶导数等预处理。 MATLAB 2014a软件对数据进行训练集与预测集的筛选并建立SVM判别模型; SIMCA-P+ 11.5软件建立正交信号校正偏最小二乘回归(orthogonal single collection partial least squares regression, OSC-PLSR)模型; ORIGIN 8.0软件作图。
三七主根、 剪口和须根的原始红外光谱见图1(a)。 由图可知, 三七不同部位的原始红外光谱相似, 共有峰主要集中在2 000~400 cm-1波段。 由于原始红外光谱的谱峰堆积, 分辨率较低, 难以对三七主根、 剪口和须根进行分类鉴别, 因此将原始红外光谱进行二阶导数处理。
![]() | 图1 三七主根、 剪口和须根的红外光谱图 (a): 原始红外光谱; (b): 二阶导数红外光谱Fig.1 Infrared spectra of main root, rhizome and fibrous root of Panax notoginseng (a): Original infrared spectra; (b): Second derivative infrared spectra |
通过对原始红外图谱进行二阶导数处理, 可以分离隐蔽的叠合谱峰, 有效提高谱图的分辨率[23, 24]。 三七主根、 剪口和须根的二阶导数红外光谱见图1(b)。 由图可知, 须根的二阶导数光谱在3 800~3 300 cm-1波段内有明显吸收峰, 主根和剪口在此波段吸收峰不明显; 2 000~400 cm-1波段, 三七主根、 剪口和须根吸收峰强度有较大差别。 3 800~3 300 cm-1波段主要归属于羟基伸缩振动吸收, 2 000~400 cm-1波段主要为C=C, C=O, C=N伸缩振动, C— H弯曲振动以及C— O伸缩振动等。 红外光谱记录了丰富的样品物理化学信息, 为三七主根、 剪口和须根粉末鉴别以及皂苷含量快速预测提供了理论依据。
对不同浓度梯度的标准品溶液进行检测, 得到标准品三七皂苷R1、 人参皂苷Rg1、 人参皂苷Rb1和人参皂苷Rd峰面积与浓度的回归系数分别为0.998 8, 0.999 9, 0.998 7和0.999 9, 回归系数均大于0.998 0, 线性关系良好。 精密度考察显示(n=6), 样品三七皂苷R1、 人参皂苷Rg1、 人参皂苷Rb1和人参皂苷Rd峰面积RSD分别为1.09%, 0.95%, 0.96%和1.83%, 表明该方法精密度良好。 稳定性考察显示(t=1 h, n=6), 以上指标峰面积RSD分别为1.44%, 1.98%, 1.51%和2.05%, 表明样品溶液在6 h内稳定。 样品测量所得各皂苷面积结合标准品线性回归方程计算出样品中各皂苷含量。 每个样品平行测定两次并取平均值, 皂苷含量结果见表1。 由表1可知, 剪口样品中四种皂苷以及总皂苷含量均最高, 总皂苷含量为主根的1.8倍, 须根的4.6倍。 按照国家药典对三七的质量控制标准计算, 每组20个样品中, 剪口与主根质量合格率为100%, 须根质量合格率仅为20%。
![]() | 表1 三七样品皂苷含量信息 Table 1 Saponins content information of Panax notoginseng samples |
采用台湾大学工业工程学研究所林智仁等[25]开发的libsvm-3.20工具箱建立SVM判别模型, 对三七主根、 剪口和须根粉末进行鉴别。 原始红外光谱二阶导数处理后的1 869个数据点作为X变量, 分类标签作为Y变量, 判别模型建立前, 将X变量标准化到[-1, 1]区间。 60个样本采用Kennard-stone算法筛选训练集(2/3)与预测集(1/3), 训练集数据建立判别模型, 预测集数据对模型精确度进行外部验证。
标准化的40个训练集数据代入libsvm-3.20工具箱建立SVM判别模型, 最佳核函数c和g采用交叉验证(cross validation)进行网格式搜索。 首先将log2c与log2g在[-20, 20]区间内粗略搜索, 根据交叉验证正确率缩小范围, log2c在[-5, 10]区间及log2g在[-5, -20]区间进行精细搜索, 计算出最佳核函数c=2.828 43, g=4.882 81× 10-4, 此时判别模型交叉验证正确率为100%。 将判别模型核函数设置为最佳核函数, 20个预测集数据对训练好的模型判别精确度进行外部验证, 20个样本全部被正确鉴别, 预测正确率为100%(图2)。 结果显示, 建立的SVM判别模型外推能力较强, 能够对三七主根、 剪口和须根粉末进行有效鉴别。
对原始红外光谱进行纵坐标归一化, 考察一阶(1D)、 二阶导数(2D)以及Savitsky-Golay平滑5点(SG5)、 7点(SG7)、 9点(SG9)、 11点(SG11)预处理对模型拟合能力及预测能力的影响, 并根据预测能力筛选最优模型。 预处理后的红外光谱数据作为X变量, 样品中三七皂苷R1、 人参皂苷Rg1、 人参皂苷Rb1和人参皂苷Rd含量作为对应预测模型的Y变量, 结合正交信号校正去除X变量中与Y变量相关性较低的数据。 采用Kennard-stone算法筛选不同预处理方法模型的训练集(2/3)与预测集(1/3); 训练集数据建立回归模型, 预测集数据对模型预测效果进行外部验证。
不同预处理OSC-PLSR模型采用1/7交叉验证(7-fold cross-validation)并以交叉验证均方根误差(root mean squares error of cross-validation, RMSECV)及相关系数
![]() | 表2 皂苷含量最佳预测模型参数 Table 2 The parameters of the best models of different saponins |
利用UPLC对三七样品中三七皂苷R1、 人参皂苷Rg1、 人参皂苷Rb1和人参皂苷Rd含量进行检测, 剪口样品中四种皂苷以及总皂苷含量均最高, 总皂苷含量为主根的1.8倍, 须根的4.6倍。 二阶导数红外光谱结合SVM建立判别模型对三七主根、 剪口和须根粉末进行鉴别, 预测集数据的判别正确率为100%, 20个预测样本均被正确鉴别。 红外光谱结合OSC-PLSR建立三七中四种皂苷含量预测模型, 考察1D, 2D以及SG5, SG7, SG9, SG11预处理对模型拟合能力及预测能力的影响, 并根据预测能力筛选最优模型。 结果显示, 最优模型拟合能力及预测能力均较好, 预测值与UPLC检测值接近。 红外光谱结合SVM判别能成功的对三七主根、 剪口和须根粉末进行鉴别, 结合OSC-PLSR能够成功地对三七主根、 剪口和须根中三七皂苷R1、 人参皂苷Rg1、 人参皂苷Rb1和人参皂苷Rd含量进行预测, 可作为三七快速质量控制的方法, 为三七产业健康规范发展提供了基础。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|