中红外光谱结合向量夹角直接定量三氯蔗糖
粟晖1,2, 潘浩然1,2, 姚志湘1,2,3,*, 黄晓程1,2, 刘柳1,2, 刘春水1,2
1. 广西科技大学生物与化学工程学院, 广西 柳州 545006
2. 广西科技大学广西糖资源绿色加工重点实验室, 广西 柳州 545006
3. 广西蔗糖产业协同创新中心, 广西 南宁 530004
*通讯联系人 e-mail: zxyao@gxust.edu.cn

作者简介: 粟晖, 女, 1971年生, 广西科技大学生物与化学工程学院教授 e-mail: suhui@gxust.edu.cn

摘要

多组分复杂体系的红外光谱由于成分多样、 谱带严重重叠、 背景干扰等导致谱图特征减弱, 且体系中的红外光谱往往不是各组分光谱的简单叠加, 需要借助于化学计量学技术以实现解析。 基于朗伯-比尔定律(Lambert-Beer law)并且随着衰减全反射(ATR)技术取样普及, 结合偏最小二乘回归法(PLS)、 人工神经网络(Artificial neural network, ANN)等化学计量法将数据进行累积、 特征提取以及校正建模等工作解决红外光谱中严重重叠和非线性等问题, 再采用二次测量定量分析已初步具有应用成效, 而有效增强信息量表达, 降低背景、 噪声干扰, 减少复杂的计算过程, 进而保证定量分析结果的可靠性, 则成为研究的主要方向。 通过讨论光通道和背景对光谱强度变化的影响, 结合向量角度转换提出一种新的近似线性定量方法。 经初步理论计算, 发现多组分混合物与该混合物中待测组分的相对含量二者间的向量夹角值存在一定的关系, 而该关系并不受批次制样的影响, 进一步通过高斯曲线模拟混合信号, 充分说明选择合适的波长范围, 二者在一定范围内存在线性相关性, 相关性不受测量条件变化的影响。 采用KBr压片法, 向待测样品中逐步加入待测组分得到混合样本, 分别得到待测组分光谱与混合样本光谱信号, 先将其进行一阶求导, 消除加性误差后, 再将其转化为空间向量角度, 消除批次制样中光程差异, 再以百分比定义待测物样品的含量, 所得到混合样的夹角值与其中所含参照品含量成简单线性关系, 即以计算结果夹角值与含量作标准曲线, 实现定量分析。 本测量方法用于三氯蔗糖(Sucralose, TGS)与三氯蔗糖-6-乙酸酯(4,1,6-trichloro sucrose-6-acetate, TGS-6-A)二者进行一定比例混合(双组分体系), 以及TGS-6-A的脱酰产物(多组分体系)中的TGS的含量定量分析, 在两种体系中定量均得到令人满意的结果, 所建立标准曲线的相关系数 r均达到0.995 0以上, 相对误差均低于8.0%, 所建立的分析方法对利用中红外透射光谱分析研究多组分样品具有重要的参考价值。

关键词: 中红外光谱; 向量角; 三氯蔗糖; 直接定量
中图分类号:O657.3 文献标志码:A
Mid-Infrared Spectral Combined Vectorial Angle Method for Direct quantifying the Content of Sucralose
SU Hui1,2, PAN Hao-ran1,2, YAO Zhi-xiang1,2,3,*, HUANG Xiao-cheng1,2, LIU Liu1,2, LIU Chun-shui1,2
1. College of Biological and Chemical Engineering, Guangxi University of Science and Technology, Liuzhou 545006, China
2. Guangxi Key Laboratory of Green Processing of Sugar Resources, Guangxi University of Science and Technology, Liuzhou 545006, China
3. The Coordination Innovative Center of Sugar Industry of Guangxi, Nanning 530004, China
*Corresponding author
Abstract

The diversity of components and interferences of spectral overlapping highly and background reduce the features of the mid-infrared of the complex mixtures. Furthermore, the mid-infrared spectrum of a multi-component complex sample is generally not a simple sum of spectra of the components. Chemometrics techniques are needed for quantitative interpretation of the mid-infrared spectra. The problems of serious overlap and nonlinearity in infrared spectra were solved by data accumulation, feature extraction and correction modeling from chemometrics methods such as PLS and ANN, etc. And bi-measurement quantitative analysis was applied preliminarily based on Lambert Bill’s law and the popularization of the sampling technology of ATR. Then how to reduce these disturbances and ensure the accuracy of the results effectively was the main direction of research. Based on evaluating the spectral intensity of optical channel and background, this study proposed a new approximate linear quantitation method combined with vector angle transformation. Through the preliminary theoretical calculation, it was found that there was a certain relationship between the multi-component mixture and the vector angle value of the relative content in the mixture, and the relationship was not influenced by the batch sampling. Further, the Gauss curve was used to simulate the mixed signal, which fully illustrated a linear correlation within a certain range if suitable wavelength range was selected, and the correlation was not affected by the change of the measurement conditions. The KBr compression method was used to get the mixed samples, into which the components were added step by step, and the spectral and mixed-sample spectral signals were obtained. The first order derivation was carried out to eliminate the additive error signals which were converted into the space vector angle to the elimination of light path difference in batch sampling, and then they converted the content into a percentage. The angle values of the mixed samples have simple linear relationships with the contents of the reference materials. Then the quantitative analysis was made by using the standard curve of the calculated result angle values and the contents. This method was utilized to determine the contents in samples of the mixing of TGS and TGS-6-A (two-component systems), and the deacylated products of TGS-6-A (multi-component systems) with satisfactory results. The established correlation coefficients ( r) of the standard curves were all above 0.995 0 and the relative errors were less than 8%. The result shows the established analytical method could meet the content analysis of multi-component samples. It has great reference value for the study of multi-component samples by mid-infrared transmission spectroscopy.

Keyword: Mid-infrared spectral; Vector angle; Sucralose; Direct quantitative
引言

红外光谱法是最常用的分子定性方法, 普遍认为定量能力有限, 近年来随着衰减全反射(attenuated total reflection, ATR)取样普及, 逐渐用于定量分析[1, 2, 3], 红外透射谱区的红外光在样品中的穿透最大可达到30 mm, 相对于漫反射技术(diffuse reflectance technique)所获取的光谱信息更加丰富, 但因无法避免克里斯坦森(Christiansen, 1884)效应存在[4, 5], 且还受到信息叠加严重的制约[6], 采用传统的KBr压片和涂布法红外透射光谱技术仍然鲜见定量应用报道。

在多元统计方法的帮助下, 近红外通过大量数据积累和建模工作, 采用二次测量定量, 已经实现了大量应用[7, 8]。 由于红外光谱产生原因是由红外区域内分子的振动吸收, 因而能量较弱、 光谱的解释性差、 检测限高, 很难做到直接定量分析。 中红外ATR定量分析和基于多元统计的二次定量表明红外光谱是具有定量能力的[9, 10]; 更进一步的其他光谱法, 基于比尔朗伯定律的吸光度值解决了直接光度吸收的非线性问题, Kubelka-Munk(KM)值近似出漫反射吸收的线性定量关系; 那么, 是否存在或者近似出一种新的线性关系能够反映红外光谱以及其他光谱中隐藏的定量关系呢?

Sanchez[11]和Eugenio[12]基于张量代数理论, 定义“ 阶数(Order)” 与“ 维数(Way)” 的概念, 将多变量分析归结为张量校正问题, 可用作复杂多组分化学体系中的直接定量解析。 姚志湘等[13]前期通过角度度量转化思路, 采用空间角讨论和评价多元正和分辨问题的合理性与准确性, 解决了偏最小二乘回归法(partial least-squares regression, PLS)中乘性误差对预测结果的干扰, 指出光谱方法中光程差不会影响光谱的形状, 推而广之, 这种固定关系可以引申成为一种新的定量关系。

本研究将讨论光通道和背景影响的光谱强度的变化情况, 以及蕴藏其中的定量的关系, 提出一种新的近似线性定量方法, 可采用KBr压片法直接定量三氯蔗糖合成产物。

1 基于角度转换的定量分析方法

红外光谱定量分析根据朗伯-比尔定律, 光被吸收的量正比于光程中产生光吸收的分子数目, 即仅考虑了分子对光的吸收。 吸光度A是摩尔吸收系数K、 光程b和吸光物质浓度c的函数[见式(1)]

A=Kbc(1)

对于KBr压片或者涂布法, 影响光能量检测除了样品内 n种组分物质光吸收(k=1nAk), 还受到克里斯坦森效应的影响, 即包括来自KBr压片自身和其中分散固体颗粒的散射(S), 光能量E按照吸光度的透过率对数值定义, 表示为式(2)

E=k=1nAk+S(2)

考虑不同批次压片, 由于制样存在光程差异, 所以第j次的E为式(3)

Ej=k=1n(Ak)j+SjEj=bj{k=1n(Kkckj)}+Sj(3)

在不同的波长位置i上, 保持同样关系。 以向量表示Ej= (Ei)j, Aj= (Ai)j, Sj= (Si)j, 于是用式(4)表达

(Ei)j=k=1n((Ak)i)j+(Si)j(4)

若KBr以及掺入样品的颗粒均匀, 散射表现为平坦谱线, 其1阶导数值非常小。 可以差分值代替即式(5)

ΔEj=bjk=1n{ΔKkckj}(5)

计算向量Δ Ej和定义Aa为标准品, Aa的摩尔系数Δ Ka的夹角余弦值D[见式(6)]

cos(D)=ΔEjΔKa|ΔEjΔKa|=bjk=1n{ΔKkckj}ΔKa|bj|k=1n{ΔKkckj}|ΔKa|=k=1n{ΔKkckj}ΔKak=1n{ΔKkckj}|ΔKa|(6)

若样品为二元混合组分只含有两种物质待测物a与确定物质b, 即此时有式(7)

cos(D)=(Kacaj+Kbcbj)ΔKa|Kacaj+KbcbjΔKa|(7)

以浓度x代替c, 若样品为多元混合组分, 此时定义物质待测物质a在样品中的浓度为xa, 此时物质b浓度换算为百分比浓度为xb=(1-xa), Kb=K(all-a)此时为式(7)可改变为

cos(D)=[Kaxaj+K(all-a)(1-xa)j]ΔKa|Kaxaj+K(all-a)(1-xa)jΔKa|(8)

根据(8)推测将a物质作为待测物, b物质作为除了物质a外的其他物质, 可推测出也同样符合该公式。 在式(8)中, 除保留了含下标j的相对浓度xj, 其他下标j的变量已经消除, 即测量值已经不受批次制样差异影响。 那么, 此D值是否与xj值存在定量关系? 通过两组高斯曲线模拟混合信号的D值与相对含量xj的关系, 模拟结果如图1所示。

图1 高斯曲线模拟混合信号的D值与相对含量xj的关系
(a): 两个源信号的加和; (b): 不同比例的两个源信号的系列加和; (c): D值与组成含量X的关系
Fig.1 The Relation between the D and the Relative Content xj of the Gaussian curve simulates mixed signal
(a): The addition of two source signal; (b): The series of addition for two sources signals in the different proportions; (c): The relation of the D value to the component radio X

图1(a)中虚线是两个源信号(高斯曲线)的差分值, 实线是源信号的加和值; 调整源信号配比, 得到图1(b)中不同源信号含量的叠加信号, 计算各个叠加信号与源信号1的D值, 图1(c)是D值与组成含量x的关系。

调整源信号1和2的位置改变源信号1和2的相关系数, 图1(c)中各条曲线是D值— x值关系, 分别对应了不同相关系数源信号构成的叠加信号。 可以看出D值与x值存在良好线性关系; 源信号相关度越大, D-x的线性关系越好, 范围越宽; 相关度变小, 则灵敏度变大, 而线性关系和范围降低。

从式(8)和简单的模拟案例可以推断出一个结论: 选择合适的波长范围, 混合物信号与被测物信号的夹角值D在一定范围内与混合物组成含量值存在线性相关性; 并且, 该相关性不受测量条件变化的影响。

从式(4)、 式(5)可以看出差分后, 加性误差项已经被消除; 另外, D值在xa等于1时始终为零, Dx存在线性关系, 可以表达为简单的线性方程, 即得到式(9)

Dkx(9)

选择合适的波长范围, 混合物信号与被测物信号的夹角值D在一定范围内与混合物组成含量值存在线性相关性; 并且, 该相关性不受测量条件变化的影响。

因此对于采用红外KBr压片或者涂膜法, 受到克里斯坦森效应的影响: 样品颗粒在本征吸收峰附近产生可观的附加散射消光, 致使表观吸收峰偏离实际位置, 将其进行一阶求导, 除去加性误差, 再将其转化为空间向量角度, 消除批次制样中光程b的差异, 以百分比定义待测物样品的含量, 样品D值与其中所含参照品含量成简单线性关系, 即以计算结果D值与含量作标准曲线, 实现定量分析。

2 实验部分
2.1 仪器与试剂

Frontier型傅里叶变换红外光谱仪(美国Perkin Elmer公司), Agilent 1200 型高效液相色谱仪(美国Agilent公司), WS70-1型远红外快速干燥箱, CP214型电子分析天平。

三氯蔗糖(TGS)对照品(99.99%, by HPLC), 三氯蔗糖-6-乙酸酯(TGS-6-A)对照品 (96.5%, by HPLC), KBr(AR), 脱酰样品(自制, 含有三氯蔗糖、 三氯蔗糖-6-乙酸酯、 少量的乙酸甲酯等其他副产物, 在此认为其为多组分样品)。

2.2 样品制备

制备TGS对照品、 TGS-6-A对照品的KBr压片: 分别准确称取对照品加入KBr, 混合均匀后压片, 编号分别为S0和S10;

制备双组分样品的KBr压片: 将TGS-6-A与TGS对照品分别按照质量比为1∶ 9, 2∶ 8, 3∶ 7, 4∶ 6, 5∶ 5, 6∶ 4, 7∶ 3, 8∶ 2, 9∶ 1混合, 再加入KBr, 进行压片, 依次编号S1— S9

制取脱酰(多组分)样品的KBr压片: 按照不同量添加TGS对照品至脱酰样品(原始TGS含量为19.45%, by HPLC)混合均匀后, 再将KBr加入混合均匀后, 压片, 制得系列压片样本17组样品, 选择其中12组建立标准曲线, 编号K1— K12, 剩余5组作为验证组, 编号L1— L5

2.3 红外光谱数据采集

采集TGS与TGS-6-A对照品以及系列样品压片样品中红外透射光谱, 光谱采集范围为450~4 000 cm-1, 分辨率为4 cm-1, 数据间隔为1 cm-1

2.4 数据处理方法

将光谱数据导入计算平台中(其中AB为系列样品组分二元(或多元)混合体系的混合光谱; a为组分TGS; A为组分TGS的光谱; b为其他组分; B为其他组分光谱)。

(1)针对组分ab特征峰位置不同, 选择信号区间范围, 并进行基线校正、 求导滤波降噪, 再求取差分。

(2)根据混合光谱AB包含的波长点数, 设置一定宽度建立移动窗口, 选择体系中组分a的光谱A, 从最小波数点开始, 在移动窗口内, 将移动窗口从该光谱A的左端向右移动, 分别计算光谱A与混合光谱AB的夹角, 得到系列夹角值θ ;

(3)分别计算组分a在不同配比值Ci下的光谱Ai与混合光谱AB的系列夹角θ i, 即计算系列D值(cosθ )与标准加入量的线性相关系数Cov, 并选择Cov最大的移动窗口位置时, 绘制该组分a的不同配比值Ci与系列D值的标准曲线;

(4)计算待测样品光谱与AD值, 代入(3)标准曲线中, 实现待测样品中所含组分a的定量分析。

3 结果与讨论
3.1 系列样本的红外光谱图

TGS对照品(S0)、 TGS-6-A对照品(S10)、 TGS-6-A加入TGS对照品的混合物样品(S)、 脱酰样品加入TGS对照品的混合样品的中红外光谱(K)见图2。

图2 系列样品的中红外谱图Fig.2 The FTMIR spectrogram of the samples

由系列中红外光谱图2可知, TGS-6-A与TGS特征集中于1 500~4 000 cm-1波数区域内, 选择该区域作为光谱区间。

3.2 双组分样本的TGS含量分析

依照2.4数据处理方法, 分别对系列S光谱一阶求导降噪并求取差分, 其中S0的差分谱图如图3所示。

图3 S0的一阶导数光谱曲线Fig.3 The first difference spectral curve of S0

设置区间波长(4 000~1 500 cm-1)的1/16宽度为移动窗口, 从最小波数点1 500 cm-1开始, 分别计算S1— S10与TGS对照品光谱S0的夹角余弦值Di。 TGS的不同配比值Ci与系列夹角Di的关系如表1所示。 取其中的S0, S1, S3, S5, S7, S9和S10, 计算系列Di值与标准加入量的线性相关系数Cov。 得到线性关系: Ci=-65.235Di+102.37, 相关系数r=0.996 9。

表1 双组分样品中TGS含量与夹角值结果 Table 1 The results of the TGS content and the angle of value in two-compooent samples

计算得到S2, S4, S6, S8中TGS预测含量及误差分析见表2所示。

表2 双组分预测含量与误差分析结果 Table 2 The results and error analysis of two-component samples

通过表2结果可得到该方法在测定双组分待测物含量时, 测定结果与高效液相色谱相比较, 预测结果较好, 相对误差低于± 2.50%~6.03%。

3.3 脱酰样品中TGS含量分析

参照3.2双组分含量分析方法设置区间, 计算12组脱酰样品(K1— K12)系列Di值, 结果如表3

表3 脱酰样品中TGS含量与夹角值结果 Table 3 The results of the TGS content and the angle of value in de-acylation samples

为了更加精确的计算结果, 对不同含量的待测样本计算角度值分别建立标准曲线, 当D值≥ 1.5时, 建立标准曲线1: Ci=-145.5Di+228.01, 相关系数r=0.997 8; 当D值< 1.5时, 建立标准曲线2: Ci=-57.09Di+97.886, 相关系数r=0.995 7, 将5组验证组样品(L1— L5)的D值分别代入相应曲线中预测含量, 并将结果与高效液相色谱作对比验证, 结果如表4

表4 脱酰样品预测含量与误差分析结果 Table 4 The results and error analysis of de-acylation samples

通过表4结果可得到5组验证组测定结果与高效液相色谱相比较, 预测结果较好, 相对误差在± 1.09%~7.10%。

3.4 合成样品中TGS含量分析

采用本模型对合成产品三氯蔗糖(粗产品)中的待测组分(三氯蔗糖)进行预测, 经高效液相色谱验证, 结果如表5所示。

表5 合成样品预测含量与误差分析结果 Table 5 The results and error analysis of products of synthetic

通过表5中可得知, 相对误差低于± 9.09%, 说明本模型方法应用于产品中的效果仍较满意, 可对含量作准确的测定。

4 结论

采用中红外透射光谱结合空间向量角度建立三氯蔗糖中间合成产品含量测定方法, 实验结果说明该方法在测定双组分以及脱酰(多组分)样品中三氯蔗糖含量时, 均可快速准确测定, 所建立标准曲线的相关系数r均可达到0.995 0以上, 相对误差均低于8.0%, 准确度较高。 该方法无需样品预处理、 方法简便无需大数据建模, 具有不依赖光谱特征响应、 检测限低、 适用范围广等特点, 对中红外透射光谱分析研究多组分样品具有重要的参考价值。

The authors have declared that no competing interests exist.

参考文献
[1] De C E S, Cassella R J. Talanta, 2016, 152: 33. [本文引用:1]
[2] Lee J, Nam Y S, Min J, et al. Journal of Forensic Sciences, 2016, 61(3): 815. [本文引用:1]
[3] Sato S, Kawaguchi T, Kaneko F. Macromolecular Symposia, 2016, 369(1): 114. [本文引用:1]
[4] Carlon H R. Applied Optics, 1980, 19(12): 3610. [本文引用:1]
[5] Pollard M J, Griffiths P R, Nishikida K. Applied Spectroscopy, 2007, 61(8): 860. [本文引用:1]
[6] Strasfeld D B, Ling Y L, Gupta R, et al. Journal of Physical Chemistry B, 2011, 113(47): 15679. [本文引用:1]
[7] Orlov A S, Mashukov V I, Rakitin A R, et al. Journal of Applied Spectroscopy, 2012, 79(3): 484. [本文引用:1]
[8] LIANG Qi-feng, LI Shan(梁奇峰, 李珊). The Food Industry(食品工业), 2015, (4): 283. [本文引用:1]
[9] ZHANG Xiu-ping, HE Shu-mei(张秀萍, 何书美). Journal of Analytical Science(分析科学学报), 2007, 23(4): 484. [本文引用:1]
[10] HUANG Li, LI Ling, FENG Ling, et al(黄丽, 李玲, 冯玲, ). Food Science(食品科学), 2015, 36(12): 205. [本文引用:1]
[11] Eugenio Sanchez, Bruce R Kowalski. Journal of Chemometrics, 2010, 2(4): 247. [本文引用:1]
[12] Eugenio Sanchez, Bruce R Kowalski. Journal of Chemometrics, 1988, 2(4): 265. [本文引用:1]
[13] YAO Zhi-xiang, SU Hui(姚志湘, 粟晖). SCIENTIA SINICA Chimica(中国科学: 化学), 2010, (10): 1564. [本文引用:1]