作者简介: 张馨之,女, 2003年生,天津工业大学化学工程与技术学院本科生 e-mail: 17868762272@163.com
中药材的质量影响药效及用药安全, 产地来源是其关键因素之一。 传统的中药材产地鉴别方法主要是性状鉴定和显微鉴定。 性状鉴定法依赖人工观察和经验, 容易造成误判。 显微鉴定法需要对中药材进行切片、 染色等处理, 步骤繁琐, 且不适用于珍稀中药材。 光谱分析由于快速、 无损的优势, 近年来在中药材产地鉴别中得到了越来越多的关注, 其中近红外光谱技术的应用最为广泛。 该综述总结了近10年基于近红外光谱的中药材产地鉴别技术研究情况。 对中药材进行地理区划并系统性总结了道地中药材在我国的分布情况和药材被鉴别研究的热度。 目前, 中药材产地鉴别研究主要集中在三七、 人参、 天麻、 铁皮石斛等名贵的、 易被产地造假的药材中。 在近10年中药材产地鉴别近红外光谱技术的应用中, 传统近红外光谱技术结合化学计量学依然是主流的方法; 二维近红外相关光谱技术虽然已被应用于食品、 农业等领域, 但近两年才被用于中药材产地鉴别中, 是该领域的新兴技术; 近红外高光谱技术可短时间内获取样品的光谱和图像信息, 可提高鉴别精度; 近红外光谱与紫外-可见光光谱技术联用可获取样品化学键的信息和化合物共轭关系, 与中红外光谱技术联用可得到更丰富的分子骨架信息, 与激光诱导击穿光谱技术联用获得分子振动和元素组成信息。 基于近红外光谱的多光谱联用技术实现多维信息互补, 有效克服单一光谱技术的局限性, 提高中药材产地鉴别效果。 总结了在中药材产地鉴别中使用的化学计量学方法, 有光谱预处理、 变量选择、 化学模式识别。 光谱预处理方法可分为平滑处理、 散射校正、 基线校正和尺度缩放, 用来消除噪声、 基线和背景等的影响。 通过变量选择, 去除冗余波长, 进一步提高模型的鉴别效果。 深度学习算法越来越多的被应用于中药材产地鉴别中。 本综述为中药材产地的快速准确鉴别提供方法参考。
The quality of traditional Chinese medicines (TCMs) significantly impacts their efficacy and medication safety, with the place of origin being one of the crucial factors. Traditional methods for identifying the origin of TCMs primarily include macroscopic identification and microscopic identification. The macroscopic identification methodsrely on manual observation and experience, which are prone to misjudgment. The microscopic identification methods require processes such as slicing and staining of the TCMs, which are cumbersome and not applicable to rare TCMs. In recent years, spectral analysis has attracted increasing attention in the identification of TCM origins due to its advantages of rapidness and non-destructiveness. Among these, near-infrared spectroscopy (NIR) is widely employed. Therefore, this review summarizes the research on the origin identification of TCMsusing NIR over the past 10 years. It conducts geographical zoning of TCMs and systematically summarizes the distribution of Dao-di herbs in China, as well as the research popularity of different TCMs for origin identification. Currently, research on the origin identification of TCMs mainly focuses on precious and easily counterfeited herbal medicines in terms of origin, such as Panax notoginseng, Panax ginseng, Gastrodia elata Blume, and Dendrobium officinale. In the application of NIR for origin identification of TCMs over the last decade, the combination of traditional NIR with chemometric methods has remained the mainstream approach. Although two-dimensional NIR correlation spectroscopy has been applied in various fields, including food, agriculture, and industry, its use for the origin identification of TCMs has been limited to the past two years, making it an emerging technology in this field. NIR hyperspectral imaging can simultaneously obtain spectral and image information of samples, thereby improving identification accuracy. The combination of NIR with ultraviolet-visible (UV-Vis) spectroscopy can obtain information on chemical bonds and conjugate relationships of compounds in samples. NIR combination with mid-infrared spectroscopy can provide more abundant information on molecular skeletons, and its combination with laser-induced breakdown spectroscopy (LIBS) can obtain information on molecular vibration and elemental composition. The multi-spectral hyphenated technology based on NIR achieves multi-dimensional information complementarity, effectively overcoming the limitations of single-spectral technology, and enhances the effectiveness of identifying the origin of TCMs. This review also summarizes the chemometric methods used in the origin identification of TCMs, including spectral pre-processing, variable selection, and chemical pattern recognition. Spectral pre-processing methods can be divided into smoothing, scattering correction, baseline correction, and scaling, which are often used to eliminate the influences of noise, baseline, and background. Variable selection methods remove redundant variables, further improving the accuracy of discrimination models. Deep learning algorithms are increasingly applied in the analysis of the origin identification of TCMs. This review provides a methodological framework for the rapid and accurate identification of the origin of TCMs.
中药作为中华民族传统医学的瑰宝, 有着数千年的文化积淀和民族智慧, 其质量直接关系到疗效与用药安全[1]。 中药材的有效成分受气候条件、 土壤特性、 地形地貌等因素影响显著, 同一药材因产地不同, 治疗效果有很大区别。 其中产在特定地域, 质量稳定, 经过中医临床长期应用优选出来的品质与疗效更好且具有较高知名度的中药材称之为道地药材。 道地药材因产量低、 药效好、 价格昂贵, 催生了以次充好、 产地造假的乱象[2]。 因此, 中药材产地鉴别技术的研究显得尤为重要。
传统的鉴别方法主要是性状鉴定和显微鉴定。 前者通过观察形态、 咀嚼口感、 嗅闻气味、 鉴尝味道、 掂量质地等来鉴别区分, 这种方法依赖鉴定者的感官主观经验, 容易受到个体差异的影响, 误判率高。 后者通过药材切片观察细胞形态和组织结构以区分中药材, 具有破坏性。 而光谱分析技术具有非破坏性、 检测快速、 高灵敏度等特点[3], 因此被众多学者应用于中药材产地鉴别中。
常见的用于中药材产地鉴别的光谱分析有近红外光谱(near-infrared spectroscopy, NIR)、 高光谱成像(hyperspectral imaging, HSI)、 激光诱导击穿光谱(laser-induced breakdown spectroscopy, LIBS)等, 近10年用于中药材产地鉴别的不同光谱分析技术文献数量如图1所示。 太赫兹光谱(Terahertz spectroscopy, THz)技术是一种新兴的光谱分析技术, 其在中药材产地鉴别中的可行性还需进一步被验证; 紫外-可见光光谱(ultraviolet-visible spectroscopy, UV-Vis)、 荧光光谱(fluorescence spectroscopy, FS)、 LIBS技术对药材样本前处理要求高, 产生一定程度的破坏性, 应用受到限制; 拉曼光谱(Raman spectroscopy, RS)中样品微量成分的信号弱, 易导致光谱的灵敏度不高; HSI技术设备价格相对较高, 且光谱图像易受药材样本形态的影响; NIR设备成本低, 维护简单, 无需对药材样品进行化学处理, 具有非破坏性、 适用性高等优点, 可以进行多成分同步分析, 特别适用中药材分析。 2007年, 国家中医药局着手制定《中药红外光谱分析方法通则》, 2025年江苏、 山东、 吉林等省相继提出基于近红外光谱法的中药材智能识别和在线检测系统实施标准。 然而, 鉴于近红外光谱技术在中药材产地溯源分析中缺乏总结, 本文进行了系统性的整理与归纳, 填补了这一空白。
本文综述了近红外光谱技术在中药材产地鉴别中的应用进展, 系统总结了道地药材在我国的分布情况和近10年中药材的鉴别研究现况, 并对用于中药材产地鉴别的近红外光谱技术和化学计量学方法进行分类与归纳。 为中药材产地更快速准确地鉴别分析提供参考。
我国幅员辽阔、 地形复杂、 气候多样, 孕育了丰富的中药资源。 中药材区划为中药材产地研究及中药资源的利用提供了科学依据[4]。 根据地理位置可划分为七大产区, 包括东北地区(黑龙江、 吉林、 辽宁)、 华北地区(北京、 天津、 河北、 山西、 内蒙古)、 华中地区(河南、 湖北、 湖南)、 华东地区(上海、 江苏、 浙江、 安徽、 福建、 江西、 山东)、 西北地区(陕西、 甘肃、 青海、 宁夏、 新疆)、 西南地区(重庆、 四川、 贵州、 云南、 西藏自治区)、 华南地区(广东、 广西、 海南、 香港、 澳门、 台湾)。
东北地区优势药材主要有吉林长白山的人参、 灵芝、 淫羊藿, 辽宁的鹿茸, 黑龙江的刺五加等[5]; 华北道地药材主要有河北邢台的酸枣仁、 山西长治的上党连翘、 内蒙古赤峰的防风等[6]。 华中地区的中药材主要有河南焦作的山药、 湖北蕲春县蕲艾、 湖南邵阳龙牙百合等; 华东地区的药材有覆盆子、 太子参、 白术、 金银花、 铁皮石斛等。 其中, 山东临沂平邑县为金银花的主产区, 是农业农村部命名的“ 中国金银花之乡” [7]。 安徽霍山地处大别山北麓, 为霍山铁皮石斛提供天然的附生基质, 促进其有效成分的合成。 霍山铁皮石斛[8]被国家质检总部批准为地理标志产品。 福建拓荣气候温暖湿润, 满足太子参喜阴耐湿特性, 素有“ 中国太子参之乡” 的美誉[9]。 浙江於潜因气候湿润、 土壤肥沃, 成为白术道地产区[10]; 西北地区药材主要有枸杞、 秦艽、 雪菊、 红花等。 其中, 宁夏干旱少雨, 强光照和紫外线利于枸杞中类胡萝卜素与甜菜碱的富集, 其枸杞属于《中华人民共和国药典》收录的道地药材[11], 药用价值较高。 新疆和田地区克里阳山区, 特别是昆仑山北麓一带为雪菊最佳产地[12], 被誉为“ 菊中之王” ; 西南地区主产的中药材有三七、 天麻、 茯苓、 重楼、 干姜等。 其中, 云南昭通市多阴蔽山地, 土壤腐殖质丰富, 所产的天麻中天麻素成分含量高, 质量极佳[13], 被视为道地药材; 华南地区著名的道地药材有广东的新会陈皮、 广西的罗汉果、 海南保亭的益智等[14]。 由此可见, 各地区因其独特的气候条件、 地理地貌形成了各自的道地药材。 对中药材进行地理区划, 为道地药材提供“ 身份认证” , 有利于建立道地药材数据库, 并为学者针对性研究中药材产地提供科学依据。
中药材是中华民族传承数千年的医学瑰宝, 一直以来, 中药材产地来源备受人们关注与研究。 随着近红外光谱技术被运用于中药材产地鉴别中, 越来越多的药材被鉴定分析。 通过对2015年— 2025年期间发表的中药材研究文献进行统计, 不同中药材被研究次数如图2(a)所示。 通过中药材天地网(www.zyctd.com)查得这些中药材对应的价格如图2(b)所示。 高研究频次、 高关注度的药材多是地域独特性强、 高药用价值、 产量少、 价格昂贵、 市场次品乱象严重的特征中药材。 例如, 三七是云南文山道地药材, 文山人有着几百年的种植技术传承和种植标准体系, 市场对其认可度高, 加之三七营养价值高, 价格昂贵, 市场需求量大, 因此在市场上易被冒充售卖, 三七产地鉴别研究热度最高; 人参、 天麻等名贵药材的生长依赖独特的气候环境, 价格昂贵, 疗效佳, 所以鉴别研究的热度较高; 铁皮石斛是药食同源药材, 受大众喜爱, 但野生铁皮石斛价格昂贵且资源濒危。 在国家关于药食同源物质试点政策支持下, 推动铁皮石斛产地、 生长环境的研究以及种植技术的投入, 研究的成熟度影响市场价格变化; 陈皮、 花椒等低地域特性、 市场掺假风险较低的常用药材被鉴别分析少。 因此形成了高/中价值-高关注、 低价值-低关注度的研究态势。
传统近红外光谱技术通过检测样品对红外光的吸收、 反射或透射性, 结合化学计量学方法, 实现对样品的定性分析。 因其快速高效、 绿色无损、 操作简单等优势被广泛应用于中药材产地鉴别中。
传统近红外光谱技术是中药材产地鉴别中主流的方法。 Ma等[15]采集来自甘肃、 青海、 四川和西藏蕨麻的完整药材和药粉的近红外光谱数据, 通过使用数学关系校准模型转换数据, 实现完整药材与其粉末之间的光谱转换。 Chen等[16]研究NIR光谱与随机子空间集成算法相结合来鉴别不同产地人参的可行性, 实验结果表现出高灵敏度和准确性。 不同产地的同一药材中主要成分含量存在差异, 近红外光谱图的含氢基团振动吸收可反映出差异信息。 龚圣等[17]建立随机森林模型分析附子近红外光谱中乌头类生物碱含量差异, 成功区分四川、 陕西、 云南的附子。 化学模式识别模型越稳定, 产地鉴别精度越高。 Pan等[18]通过提取特征变量使波数变量显著减少, 正交偏最小二乘判别模型鉴别不同产地太子参的精度得到有效提高。 崔萌等[19]对全国6个省份山里红采用3种方法对光谱预处理去除干扰信息, 并应用多种机器学习算法, 其中神经网络模型的稳定性最优, 产地鉴别的准确率最高。
综上所述, 在中药产地鉴别中, 传统近红外光谱技术可用于中药材粉末、 不同产地主要成分差异明显的药材的快速初次筛查。 鉴别精度依赖机器学习算法和化学模式识别模型, 通过选择最佳预处理和变量选择方法可提高鉴别准确性。 传统近红外光谱技术单次检测时间短, 也无需对药材样本进行复杂的化学处理。 手持式或小型设备可用于现场检测, 操作便捷, 检测高效。
通过传统方式获得的近红外光谱图为一维线性光谱图[20], 可对样品施加连续性扰动, 通过广义二维相关分析方程生成二维相关光谱(two-dimensional correlation spectroscopy, 2DCOS)。 根据协方差矩阵和Hilbert变换矩阵提取特征波长段得到同步、 异步、 综合2DCOS图像, 结合残差卷积神经网络(residual network, ResNet)模型, 由同步谱自动峰、 交叉峰和异步谱交叉峰差异解析一维光谱中无法区分的峰, 使得2DCOS提高了一维谱图的分辨率、 简化包含许多重叠峰的复杂谱图、 准确表征复杂高分子体系化学差异[21, 22]。
近两年来二维近红外相关光谱技术被学者应用于中药产地鉴别中, 是该领域的新兴技术。 比较分析同步、 异步2DCOS图像差异以区分不同产地药材。 Han等[23]鉴别云南省8个地区铁皮石斛时, 根据同步2DCOS图像自发峰、 交叉峰强度反映的多糖、 生物碱、 黄酮类等成分差异, 结合分类模型成功区分铁皮石斛的产地。 He等[24]基于全波段和三个波段的同步2DCOS图像, 建立ResNet模型识别草果产地。 当训练轮数为18时, 训练集和测试集的准确率都达到了100%, 该模型能够准确识别草果的地理来源。 同样在鉴别黄精[25]地理来源(云南、 广西、 四川)中, 基于同步2DCOS的ResNet模型识别准确率也高。
对比传统近红外光谱技术, 二维近红外相关光谱技术可得到成分间相互作用的动态规律, 能解决传统近红外光谱中重叠峰识别率低的问题, 结合ResNet模型识别图像可提高鉴别精度。 但也存在设备成本较高、 不适用现场检测的局限性。
高光谱成像技术能够同时获取光谱信息和图像信息, 并提供样品的全面分析[26]。 随着成像技术和光学传感器的发展, 融合了图像与光谱信息的近红外高光谱成像技术具有“ 图谱合一” [27]的特点, 通过对图像进行黑白校正、 分割处理建立光谱数据集, 再对数据集进行预处理、 筛选, 提高模型鉴别中药材产地准确率。
近红外高光谱成像技术短时间内获取大量光谱和空间信息, 实现快速成像和检测。 张婍等[28]对枸杞图像进行色相、 饱和度和明度(hue saturation value, HSV)色彩空间变换和纹理特征提取, 结合果形指数和百粒质量差异区分不同产地枸杞。 张璐等[29]对酸枣仁近红外高光谱图像采用分水岭算法进行目标分割识别, 自动提取聚集样本中单粒样本的感兴趣区域(region of interest, ROI)平均光谱, 避免手动提取出现失误。 Liu等[30]先对赤芍高光谱图像进行表面纹理特征提取, 再与经过预处理、 特征变量选择后的光谱数据融合建立产地鉴别模型, 增强芍药苷差异区分度, 提高鉴别准确率。
近红外高光谱成像技术通过高分辨成像, 可视化展示药材内部化学成分的空间分布, 弥补了传统近红外光谱技术不能反映被测物体整体特性的局限。 该技术适用识别不同产地中药材的微观纹理和颜色分布, 可应用于果实种子、 根茎类药材。 结合机器学习算法, 鉴别精度高于传统近红外光谱技术, 但存在实验仪器大、 不方便移动的缺点。 未来可利用该技术追踪同一产地的中药材生长过程有效成分的累积规律, 实现生长周期动态检测。
近红外光谱能够检测分子中化学键振动能级跃迁, 研究O— H、 N— H和C— H键伸缩振动的倍频吸收或组频吸收[31], 但对一些成分(无机物、 微量元素)的灵敏度不高。 近年来, 在中药材产地鉴别领域, 为了得到更高精度的物质结构信息和提高分析识别效率[32], 有不少学者探索出基于近红外光谱的多光谱联用技术, 实现信息互补, 推动分析精度与应用场景的革新。
UV-Vis检测电子跃迁吸收, 主要研究化合物结构中的共轭关系, NIR与UV-Vis联用同时获取样品化学成分共轭体系和分子振动信息。 通过对光谱进行低、 中、 高、 特征级融合并结合化学模式识别模型挖掘不同产地药材成分在两个光谱上表现的差异, 以此提高中药材产地鉴别的精确性。 Liu等[33]将NIR与UV-Vis数据进行特征融合, 结合偏最小二乘判别分析模型对云南五个产地的草果进行产地分析。 在鉴别云南省牛肝菌实验中, 陈凤霞等[34]对数据进行中级融合并建立化学模式识别模型, 发现数据融合后的产地鉴别效果高于单一数据鉴别。 相较于传统近红外光谱技术, NIR与UV-Vis技术联用, 可实现信息互补, 数据融合提高模型鉴别准确度, 操作灵活性增强。
中红外(mid infrared, MIR)光谱包含分子骨架振动信息, 与NIR联用可对药材中化学成分的结构进行深度解析。 在杜仲产地溯源中, 刘庭恺等[35]对采集的NIR、 MIR光谱先进行预处理得到差异明显的特征峰, 再借助化学计量学建模进一步对光谱峰型特征提取, 实现产地区分。 在三七[36]和滇黄精[37]产地溯源实验中, 都对NIR、 MIR光谱数据进行融合。 其中, 基于高级多传感器信息融合策略的随机森林模型能对三七产地取得较好的分类结果; 中级数据融合-主成分模型对滇黄精产地区分具有最佳性能, 且该模型的变量数量最少。 NIR与MIR技术联用可实现多信息互补, 化学结构解析能力增强, 鉴别准确率高于单一光谱。
LIBS可以获得样品中元素类型和成分含量的相关信息[38], 与NIR联用结合分子振动的信息和元素组成分析, 可实现不同产地的中药材成分差异的全方面解析, 突破了单一光谱的应用边界[39], 提升鉴别准确性。 Ping等[40]比较不同的NIR-LIBS数据融合模型和特征元素分析, 研究表明, 基于集成学习的融合模型优于中级数据融合模型的性能。 Fe、 Mg、 Na和Ca是区分不同来源人参的最重要元素。 NIR与LIBS二者联用可应用于检测药材中的微量元素, 鉴别精度高于传统NIR技术, 但仪器设备体积较大, 便携性受限。 未来该技术有望应用于研究元素富集对中药材有机成分的影响。
不同产地中药的近红外光谱重叠严重, 无法通过光谱直接进行鉴别, 需要结合化学计量学。 化学计量学和人工智能方法结合光谱分析用于中药材产地鉴别的过程如图3所示, 包括光谱预处理、 变量选择、 化学识别模型等步骤。
![]() | 图3 用于中药材产地鉴别的化学计量学与人工智能方法Fig.3 Chemometric and artificial intelligence methods for the origin identification of traditional Chinese medicines |
实验采集到的光谱可能会包含噪声、 基线、 光散射等干扰信息。 光谱预处理可以提升光谱质量, 使后续鉴别更加准确。 常见的光谱预处理方法可分为平滑处理(smoothing)、 散射校正(scattering correction)、 基线校正(baseline correction)和尺度缩放(scaling)[41]。 Chen等[42]采用标准正态变量消除散射效应和一阶导数去除信号的偏移, 后续构建的模型在训练集和测试集上都实现了100%的灵敏度和特异性。 不同光谱预处理方法消除的干扰不同, 合适的预处理组合可提高模型鉴别准确性。 余梅等[43]采用多种预处理方法, 分别进行1、 2、 3种预处理方法组合。 结果发现, 2种方法组合预处理后的模型准确性高于单一方法预处理后的模型。
近红外光谱往往含有成百上千的波长变量, 并不是所有变量都对鉴别有效, 需要通过变量选择去除冗余波长, 提高模型性能。 用于中药产地鉴别变量选择方法有竞争性自适应重加权采样(competitive adaptive reweighted sampling, CARS)[44]、 蒙特卡罗无信息变量消除(Monte Carlo-uninformative variable elimination, MC-UVE)[45]、 区间偏最小二乘法(interval partial least squares, iPLS)[46]等。 近年来, 群体智能优化算法也被引入到光谱变量选择[47]。 2024年, Gao等[32]将灰狼优化算法结合支持向量机区分不同产地山药。 这类算法全局搜索能力强, 运算效率快, 产地识别准确率高[48]。
在预处理和变量选择完成后, 要建立化学模式识别模型来区分中药材不同产地。 传统化学模式识别方法有K近邻(K-nearest neighbor, KNN)、 随机森林(random forest, RF)、 支持向量机(support vector machine, SVM)等。 随着人工智能化的发展, 深度学习算法, 如卷积神经网络(convolutional neural networks, CNN)、 递归神经网络(recursive neural network, RNN)等被应用于中药材产地鉴别中。 Xiao等[26]提出近红外高光谱分析的CNN模型, 通过交叉熵损失函数训练该模型, 结果发现, CNN识别性能优于传统化学模式识别模型。 Yan等[49]通过RNN模型的隐藏状态传递机制探讨近红外光谱波长之间的相关性, 结果表明其预测结果相比传统化学识别模型有所提高。 深度学习算法可自动学习数据从低阶到高阶的特性, 因其预测准确性高的优势在中药材产地鉴别中展现出强大的应用潜力。
近红外光谱技术凭借快速无损、 绿色便携等优势, 已成为中药材产地溯源的核心技术。 借助光谱预处理、 变量选择、 化学模式识别等化学计量学方法构建中药材的产地鉴别模型。 此外, 近红外光谱与紫外-可见光光谱、 中红外光谱、 激光诱导击穿光谱等多种光谱联用, 能够突破单一光谱信息的局限性, 显著提升中药材产地鉴别的准确率。
近红外光谱技术与人工智能算法的深度融合在中药材产地鉴别中有巨大潜力和应用价值。 通过构建中药材产地近红外光谱的大数据库, 开发自主智能鉴别系统, 可以实现海量数据的深度分析和挖掘。 研发便携式及手持式近红外检测设备, 推动现场快速检测技术的发展, 为中药材的流通环节提供实时监测手段, 可以最大限度地减少以次充好的市场乱象, 提升中药的国际影响力。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
[38] |
|
[39] |
|
[40] |
|
[41] |
|
[42] |
|
[43] |
|
[44] |
|
[45] |
|
[46] |
|
[47] |
|
[48] |
|
[49] |
|