NIRS法定量分析多年生苦荞叶片蛋白质与GABA含量
朱丽伟1, 周焱1, 蔡芳1, 邓娇1, 黄娟1, 张晓娜1, 张锦阁2, 陈庆富1,*
1. 贵州师范大学荞麦产业技术研究中心, 贵州 贵阳 550001
2. 贵州省农业科学院蚕业(辣椒)研究所, 贵州 贵阳 550009
*通讯联系人 e-mail: cqf1966@163.com

作者简介: 朱丽伟, 女, 1985年生, 贵州师范大学荞麦产业技术研究中心副教授 e-mail: liweib0401001@163.com

摘要

为满足多年生苦荞育种工作的需要, 采用近红外光谱分析技术结合定量偏最小二乘法对多年生苦荞叶片蛋白质和γ-氨基丁酸(GABA)含量进行了快速测定研究, 实验使用了222份多年生苦荞材料, 扫描光谱后测定其化学值。 研究发现样品蛋白质含量的平均值、 最大值和最小值含量分别是164, 331和121 mg·g-1; 样品GABA含量的平均值、 最大值和最小值含量分别是2.489, 3.968和1.439 mg·g-1。 蛋白质建模结果: 采用不同光谱区建模时, 建模集的平均决定系数( R2)、 校正标准差(SEP)和平均相对误差(RSD)分别是93.46%, 0.63和3.82%, 检验集的平均 R2, SEP和RSD分别是91.77%, 0.88和5.28%。 采用不同比例的建模样品和检验样品时, 建模集的平均 R2, SEP和RSD分别是93.55%, 0.63和3.82%, 检验集的平均 R2, SEP和RSD分别是92.18%, 0.87和5.20%。 采用4 000~9 000 cm-1光谱范围, 二阶导数(13)预处理光谱, 建模集与检验集的比例为4:1, 模型最优, 其建模集内部交叉 R2, SEP和RSD分别是93.57%, 0.55和3.38%, 检验集内部交叉 R2, SEP和RSD分别是93.35%, 0.73和4.40%。 GABA建模结果: 采用不同光谱区建模时, 建模集的平均 R2, SEP和RSD分别是86.28%, 0.21和8.30%, 检验集的平均 R2, SEP和RSD分别是84.35%, 0.22和8.76%。 采用不同比例的建模样品和检验样品时, 建模集的平均 R2, SEP和RSD分别是88.51%, 0.20和8.04%, 检验集的平均 R2, SEP和RSD分别是86.80%, 0.21和8.40%。 4 000~10 000 cm-1光谱范围, 原始光谱, 建模集与检验集的比例为4:1, 模型最优, 其建模集内部交叉 R2, SEP和RSD分别是93.28%, 0.15和6.10%, 检验集内部交叉 R2, SEP和RSD分别是91.49%, 0.17, 6.68%。 证明了使用近红外光谱技术定量测定多年生苦荞叶片蛋白质和GABA含量的可行性以及模型的稳定性。

关键词: 近红外光谱; 多年生苦荞; 模型; 蛋白质; γ-氨基丁酸
中图分类号:S123 文献标志码:A
Quantitative Analysis of Perennial Buckwheat Leaves Protein and GABA Using Near Infrared Spectroscopy
ZHU Li-wei1, ZHOU Yan1, CAI Fang1, DENG Jiao1, HUANG Juan1, ZHANG Xiao-na1, ZHANG Jin-ge2, CHEN Qing-fu1,*
1. Research Center of Buckwheat Industry Technology, Guizhou Normal University, Guiyang 550001, China
2. Research Institute of Silkworm and Pepper, Guizhou Academy of Agriculture Sciences, Guiyang 550009, China
*Corresponding author
Abstract

In order to aidthe buckwheat breeding work, quantitative identification models for testing the content of protein and γ-aminobutyric acid (GABA) in perennial buckwheat leaves were built by near-infrared reflectance spectroscopy (NIRS) with quantitative partial least squares (QPLS). NIR spectra of 222 buckwheat samples were collected, and calibration models were established based on the spectra and chemical values. It was found the average, maximum and minimum protein contents of the samples were 164, 331 and 121 mg·g-1, respectively; the mean, maximum and minimum GABA contents of the samples were 2.489, 3.968 and 1.439 mg·g-1, respectively. Protein modeling results were as follows: when using different spectral regions, themean coefficient of determination ( R2), standard error of calibration(SEC) and relative standard deviation(RSD) for the calibration set was 93.46%, 0.63 and 3.82% respectively, for the validation set, the mean R2, SEC and RSD was 91.77%, 0.88 and 5.28% respectively; when using different ratios of the modeling samples and testing samples, the R2, SEC and RSD for the calibration set was 93.55%, 0.63 and 3.82%, for the validation set, the mean R2, SEC and RSD was 92.18%, 0.87 and 5.20% respectively; when through second derivative (13) pretreatment, the wave number range of 4 000~9 000 cm-1 was appropriate for modeling (calibration sets:validation set=4:1), the R2, SEC and RSD for the calibration set was 93.57%, 0.55 and 3.38% respectively, for the validation set, the mean R2, SEC and RSD was 93.35%, 0.73 and 4.40% respectively. GABA modeling results were as follows: using different spectral regions, the mean R2, SEC and RSD for the calibration set was 86.28%, 0.21 and 8.30% respectively, for the validation set, the mean R2, SEC and RSD was 84.35%, 0.22 and 8.76% respectively; using different ratios of the modeling samples and testing samples, the mean R2, SEC and RSD for the calibration set was 88.51%, 0.20 and 8.04%, for the validation set, the mean R2, SEC and RSD was 86.80%, 0.21 and 8.40% respectively; no pretreatment, the wave number range of 4 000~10 000 cm-1 was appropriate for modeling (calibration sets:validation set=4:1), the R2, SEC and RSD for the calibration set was 93.28%, 0.15 and 6.10% respectively, for the validation set, the mean R2, SEC and RSD was 91.49%, 0.17 and 6.68% respectively. This study has demonstrated the feasibility and reliability of using NIRS to detect the content of protein and GABA in perennial buckwheat leaves.

Keyword: Near infrared spectroscopy; Perennial buckwheat; Models; Protein; GABA
引 言

荞麦是蓼科荞麦属一年生草本植物, 其储存蛋白质组分的氨基酸组成接近于联合国粮农组织推荐的标准营养蛋白, 具有很高的食用价值和医疗保健作用, 是重要的药食两用杂粮作物。 γ -氨基丁酸(GABA)是一种非蛋白质氨基酸, 具有调节血压与心率、 促进生长素分泌、 抗衰老等作用[1]。 多年生苦荞是贵州师范大学陈庆富团队通过选择杂交、 染色体加倍、 杂交和中间杂交等方法对多年生金荞麦育种的成果, 与栽培苦荞相比, 其植株健壮, 籽粒饱满大粒, 营养物质含量高, 再生力强, 收获割刈后可再次生长, 二次收获[2]。 研究团队对多年生苦荞父本金荞麦的叶片蛋白质、 GABA等物质进行研究, 发现其含量远高于籽粒, 且金荞麦叶发酵茶可提高小鼠免疫功能, 还具有防治急、 慢性炎症的功能[3, 4], 因此多年生苦荞的叶片具有极高的开发价值。

近红外光谱技术作为一种物理测试技术, 具有无损、 测定速度快、 可同时测定几个指标等优点。 目前蛋白质的测定方法主要是凯氏定氮法, GABA的测定方法有色谱法和分光光度法, 这些方法有预处理复杂、 耗时长、 污染环境等缺点, 因此研究一种能简便快速、 无污染测定蛋白质和GABA含量的方法具有重要的现实意义。

目前, 已有大量应用近红外光谱技术分析作物含水量、 淀粉、 蛋白质等的研究报告[5, 6, 7, 8]。 郭慧敏等利用红外技术建立的荞麦籽粒蛋白质预测模型, 发现用多元散射校正预处理6 803.9~6 094.2 cm-1区段的光谱, 建立模型最优, 其预测模型的决定系数为0.948 1, 交叉验证均方根为0.68[7]。 陈龙等研究使用近红外技术在线监测γ -氨基丁酸制备过程, 所建立模型的决定系数为86.32%[1]。 目前, 利用近红外光谱法研究荞麦叶片蛋白和GABA含量还未见报道。 本文利用傅里叶变换近红外漫反射光谱技术测定222份多年生苦荞叶片的近红外光谱, 采用偏最小二乘回归法对光谱数据进行分析, 构建荞麦蛋白质和GABA近红外分析模型, 为实现多年生苦荞叶片蛋白质和GABA含量的快速检测提供参考。

1 实验部分
1.1 材料

实验用的材料为2018年春季采收的多年生苦荞叶片。 为了得到更具代表性的样品, 种植了多个遗传性状已稳定的多年生苦荞自交系, 并于生长期多次采收不同部位叶片(上三叶, 中三叶和下三叶), 采收后先放于鼓风干燥机中105 ℃杀青30 min, 然后于80 ℃烘24 h。 烘干后的叶片用高速粉碎机粉碎后过100目筛, 待用。

1.2 方法

1.2.1 多年生苦荞叶片光谱采集

采用德国布鲁克光谱仪器公司生产的MPA傅立叶变换近红外光谱仪, 其分辨率设为4 cm-1, 扫描范围4 000~12 000 cm-1, 扫描次数64次。 采用漫反射扫描, 每份叶片样品分为3等份, 分别扫描光谱后单独存放。

1.2.2 多年生苦荞叶片中蛋白质含量测定

叶片中蛋白质含量参照国家标准《GB/T 5511— 2008谷物和豆类氮含量测定和粗蛋白含量计算凯氏定氮法》。

1.2.3 多年生苦荞叶片中GABA含量测定

GABA的测定参考程勇杰等的方法[8]。 先用酸水解法预处理样品。 准确称取0.100 0 g叶片粉末, 将称好的试样放于水解管, 加入6 mol· L-1盐酸15 mL, 置液氮中冷冻5 min, 接到真空泵抽真空后再吹入氮气, 重复3次后封口。 在恒温干燥箱中110 ℃水解24 h。 取出冷却, 打开水解管, 将水解液全部转移至50 mL容量瓶, 用去离子水定容, 吸取滤液1 mL于旋转蒸发仪中蒸干, 用1 mL pH 2.2柠檬酸钠缓冲液溶解, 过滤后取上清液进行测定。

1.2.3 数据分析与处理

采用中国农业大学开发的CAUNIRS近红外光谱分析软件, 利用定量偏最小二乘法建立多年生苦荞叶片的蛋白质和GABA定量分析模型。 采用内部交叉验证方法, 比较不同模型的决定系数(R2)、 校正标准差(SEC)和平均相对误差(RSD), 选择最佳模型。 当RSD小于10%时表明建模效果良好, 预测精度较高, 建立的模型可用于实际检测。

2 结果与讨论
2.1 多年生苦荞叶片蛋白质和GABA的含量

采用化学方法所测样品中蛋白质平均值为164.00 mg· g-1, 含量范围是121.000~331.000 mg· g-1; GABA的平均值为2.489 mg· g-1, 含量范围是1.439~3.968 mg· g-1, 基本涵盖了叶片蛋白质和GABA含量的变化范围, 且在比范围内分布比较均匀, 具有代表性。 剔除异常样品后, 剩余222份样品建模(图1和图2)。

图1 222份多年生苦荞叶片蛋白质含量Fig.1 Contents of protein inperennial buckwheat leaves in the 222 samples

图2 222份多年生苦荞叶片GABA含量Fig.2 Contents of GABA inperennial buckwheat leaves in the 222 samples

2.2 模型的建立

2.2.1 多年生苦荞叶片近红外光谱特征

图3为222份多年生苦荞叶片样品的原始近红外吸收光谱。 苦荞麦叶片中含有较多的蛋白质和GABA, 这些物质分子中都有常见的C— H和N— H等含氢基团, 在近红外光谱区有强烈的吸收峰。 由图3可见, 荞麦叶片的近红外光谱图存在多处吸收峰, 不同样品的光谱性状相似, 但吸收峰强度不同。

图3 222份多年生苦荞叶片近红外光谱叠加图Fig.3 Near infrared spectra of 222 perennial buckwheat leaves power

2.2.2 光谱范围的选择

根据频率不同, 近红外光谱可划分为低频、 合频和高频区, 从图3可看出, 10 000 cm-1以外的光谱噪声太大, 因此建模时剔除此区。 本试验尝试选择4 000~5 000, 4 000~6 000, 4 000~7 000, 4 000~8 000, 4 000~9 000, 4 000~10 000, 5 000~9 000, 5 000~8 000, 8 000~10 000 cm-1九个谱区建立模型。 建模样本总数为222份, 其中建模集样本数为178, 检验集样本数为44。

建立蛋白质的测定模型时, 选择4 000~6 000, 4 000~7 000, 4 000~8 000, 4 000~9 000, 4 000~10 000, 5 000~8 000 cm-1谱区建模效果较好, 建模集与检验集的决定系数均在90%以上, 8 000~10 000 cm-1光谱区建模效果较差。 九个谱区建模集和检验集的平均决定系数分别为93.46%和91.77%(表1)。 学者们运用近红外技术建立了测定稻米、 甘薯、 小麦蛋白质含量的近红外模型, 发现不同作物选定的最佳光谱区有差异, 不过均在4 000~10 000 cm-1范围内[9, 10, 11]。 郭慧敏报道荞麦面粉蛋白质的近红外优化光谱区间均为6 803.9~6 094.2 cm-1, 与本试验中光谱区间部分重叠[7]

表1 光谱区对近红外模型预测结果的影响(蛋白质) Table 1 Influence of spectral range on NIR prediction results(protein)

建立GABA测定模型时, 选择4 000~9 000和4 000~10 000 cm-1谱区建模效果较好, 建模集与检验集的决定系数均在90%以上, 相对误差均低于10%, 5 000~9 000和8 000~10 000 cm-1光谱区建模时, 建立模型的建模集与检验集的决定系数均低于85%, 相对误差高于10%, 模型不可用。 九个谱区建模集和检验集的平均决定系数分别为86.28%和84.35%(表2)。 张艳哲等报道活性米GABA的特征光谱区间为918~1 045 nm(9 569~10 893 cm-1)[10], 与本试验中GABA的光谱区间(4 000~10 000 cm-1)有部分重叠。

表2 光谱区对近红外模型预测结果的影响(GABA) Table 2 Influence of spectral range on NIR prediction results(GABA)

2.2.3 建模样品与检验样品比例的选择

为了进一步鉴定近红外光谱分析法检测荞麦蛋白质和GABA含量的可行性及稳定性, 随机选择不同比例的建模样品和检验样品, 进行模型建立和验证。 结果表明, 建模集与检验集样品比例为4:1时, 所建模型的建模集与检验集决定系数均大于94%, 效果较好。 采用不同样品建模, 蛋白质建模集的平均决定系数为93.55%, 检验集的平均决定系数为92.18%, 表明采用4 000~9 000 cm-1光谱范围内的近红外光谱信息所建立的荞麦叶蛋白质含量测定模型稳定可靠(表3)。

表3 建模样品对近红外模型预测结果的影响(蛋白质) Table 3 NIR prediction results of model for different samples(protein)

表4可以看出, 建模集与检验集样品比例为3:1和4:1时, 所建模型的建模集与检验集决定系数均大于91%, 效果较好。 采用不同样品建模, GABA建模集的平均决定系数为88.51%, 检验集决定系数平均为86.80%, 表明采用4 000~10 000 cm-1光谱范围内的近红外光谱信息所建立的荞麦叶片GABA含量测定模型稳定可靠(表4)。

表4 建模样品对近红外模型预测结果的影响(GABA) Table 4 NIR prediction results of model for different samples(GABA)

2.2.4 预处理方法的选择

为了进一步提高模型的决定系数、 降低主成分数并验证其稳定性, 采用不同的数学方法预处理光谱。 根据上述实验结果, 蛋白质建模时采用4 000~9 000 cm-1光谱区间, 建模集与检验集样品比例为4:1, 结果发现, 采用数学方法预处理光谱后, 模型的主成分数均有所下降, 如采用一阶导数(13)预处理光谱后, 模型主成分有原来的21下降至14。 采用不同预处理方法后建模, 蛋白质建模集的平均决定系数为94.44%, 检验集的平均决定系数为93.60%, 进一步证明采用近红外光谱技术建立的荞麦叶蛋白质含量测定模型的稳定可靠(表5)。

表5 光谱预处理方法及平滑点数对近红外模型的影响(蛋白质) Table 5 The influence of different pretreatment and smoothing methods on NIRS prediction results (protein)

根据上述研究结果, 建模时采用4 000~10 000 cm-1光谱区间, 建模集与检验集样品比例为4:1, 采用不同预处理方法后建模, 所建立模型的主成分数均下降明显, 如一阶导数(13)处理后, 主成分数由22降至13。 预处理光谱后, GABA建模集的平均决定系数为88.84%, 平均校正标准差和相对误差分别为0.19和7.75%, 检验集决定系数平均为85.26%, 平均校正标准差和相对误差分别为0.22和8.75%。 进一步证明采用此光谱范围近红外光谱信息所建立的荞麦叶GABA测定模型稳定可靠(表6)。

表6 光谱预处理方法及平滑点数对近红外模型的影响(GABA) Table 6 The influence of different pretreatment and smoothing methods on NIRS prediction results (GABA)
3 结 论

以粉碎的多年生苦荞叶片为研究对象, 利用化学法测定其蛋白质和GABA含量, 利用样品的近红外光谱结合定量偏最小二乘法建立了荞麦叶片蛋白质和GABA的预测模型。 从模型建模集和检验集的决定系数来看, 苦荞叶片中蛋白质和GABA含量都得到较好的预测效果。 蛋白质含量的最佳预测模型光谱范围为4 000~9 000 cm-1, 一阶导数(13)预处理光谱, 建模集与检验集的比例为4:1, 主成分为14时, 其建模集和检验集的决定系数分别为93.57%和93.35%。 GABA含量的最佳预测模型光谱范围为4 000~10 000 cm-1, 一阶导数(13)预处理光谱, 建模集与检验集的比例为4:1, 主成分为13时, 其建模集和检验集的决定系数分别为90.36%和86.32%。

理想的预测模型需要大量的种质资源, 尽管本试验选用大量多年生苦荞自交系的叶片样品来建模, 但所建模型的预测效果仍有待优化。 要想进一步优化预测模型, 提高模型的适用范围和预测效果, 需要进一步增加具有代表性的荞麦样品。 下一步试验可加入不同季节、 不同产地的金荞麦、 甜荞麦和苦荞麦的叶片样品, 进一步完善预测模型。

本试验所得的近红外光谱技术结合偏最小二乘法建立的预测模型可有效的预测多年生苦荞叶粉末样品蛋白质和GABA的含量, 辅助育种工作, 具有一定的实用价值。

参考文献
[1] CHEN Long, DING Guo-yu, HOU Yuan-yuan, et al(陈龙, 丁国钰, 侯媛媛, ). Acta Scientiarum Naturalium Universitatis Nankaiensis(南开大学学报·自然科学版), 2015, (6): 86. [本文引用:2]
[2] Chen Q F, Huang X Y, Li H Y, et al. Sustainability, 2018, 10(2): 536. [本文引用:1]
[3] HUANG Xiao-yan, HUANG Sha, CHEN Qing-fu(黄小燕, 黄莎, 陈庆富). Journal of Anhui Agricultural University(安徽农业大学学报), 2015, 42(6): 854. [本文引用:1]
[4] HUANG Xiao-yan, HUANG Sha, CHEN Qing-fu(黄小燕, 黄莎, 陈庆富). Modernization of Traditional Chinese Medicine-World Science and Technology(世界科学技术-中医药现代化), 2015, (5): 981. [本文引用:1]
[5] Sytar O, Bruckova K, Kovar M, et al. Journal of Central European Agriculture, 2017, 18(4): 864. [本文引用:1]
[6] Rebufa C, Pany I, Bombarda I. Food Chemistry, 2018, 261: 311. [本文引用:1]
[7] GUO Hui-min, YANG Xiu-shi, LIU San-cai, et al(郭慧敏, 杨修仕, 刘三才, ). Journal of Plant Genetic Resources(植物遗传资源学报), 2017, 18(3): 467. [本文引用:3]
[8] CHENG Yong-jie, CHEN Xiao-wei, ZHANG Sha-sha, et al(程勇杰, 陈小伟, 张沙沙, ). Science and Technology of Food Industry(食品工业科技), 2018, 39(6): 1. [本文引用:2]
[9] LIU Wen-li, YAN Yu-yu, WU Dong-hui, et al(刘文丽, 严虞虞, 吴东慧, ). The Food Industry(食品工业), 2019, 40(1): 212. [本文引用:1]
[10] ZHANG Yan-zhe, YU Jie, WANG Lei, et al(张艳哲, 于洁, 王磊, ). Journal of Agricultural Mechanization Research(农机化研究), 2016, 38(8): 141. [本文引用:2]