近红外无创血糖检测中基于差动式浮动基准测量的有效信号提取
韩广, 刘蓉*, 徐可欣
天津大学精密测试技术及仪器国家重点实验室, 天津 300072
*通讯联系人 e-mail: rongliu@tju.edu.cn

作者简介: 韩 广, 1987年生, 天津大学精密测试技术及仪器国家重点实验室博士研究生 e-mail: hanguang@tju.edu.cn

摘要

近红外光谱的相对测量对实现人体血糖浓度的在体高精度检测具有重要意义。 离体检测中常用的相似背景扣除以及双光路设计等方法不适合人体的复杂背景变化, 而基于位置的参考测量方法被认为是有希望实现在体参考测量的方法之一。 因此课题组提出差动式浮动基准参考测量方法来实现在体的相对测量。 差动式浮动基准参考测量方法是一种具有普适性的参考测量方法, 在实际应用中面临着径向检测距离的确定和差动检测信号中有效信号提取的问题。 在差动式浮动基准参考测量方法的基础上, 提出了基于NAS(net analyte signal)-VIP(variable importance in projection)-SPXY(sample set partitioning based on joint X-Y distances)-PLS(partial least square)的差动浮动基准测量方法, 在离体实验中验证了该方法的可行性。 结果表明经过该方法处理后, 模型的均方根误差明显降低, 相关系数也有了一定的提高。 对该方法在人体实验中的有效性进行了研究, 结果也表明该方法处理后所建模型的精密度和准确性有了明显改善。

关键词: 近红外光谱; 无创血糖检测; 差动浮动基准; 有效信号
中图分类号:O433.4 文献标志码:A
Extraction of Effective Signal in Non-Invasive Blood Glucose Sensing with Near-Infrared Spectroscopy
HAN Guang, LIU Rong*, XU Ke-xin
State Key Laboratory of Precision Measuring Technology and Instruments, Tianjin University, Tianjin 300072, China
Abstract

Relative measurement of near-infrared (NIR) spectroscopy is of great significance for the high precision detection of human blood glucose concentration in vivo. Although the similar background subtraction and double-beam design are frequently used in the in vitro experiments, they are not suitable for the human body detection because of the complex background variations. Reference measurement based on position is one of the most promising methods to realize in vivo reference measurement. The author proposes differential floating reference measurement method for in vivo reference measurement. The differential floating reference measurement is a universal method. However, it is difficult to determine the radial detection positions and extract the effective information from differential signals in practical use. To solve these problems, differential floating reference based on NAS (Net Analyte Signal)-VIP (Variable Importance in Projection)-SPXY (Sample set Partitioning based on joint X-Y distances)-PLS (Partial Least Square) method is proposed and the feasibility is investigated byin vitro and in vivo experiments, the results shows that the prediction accuracy and precision are improved through this method.

Keyword: Near-infrared spectroscopy; Non-invasive blood glucose sensing; Differential floating reference; Effective Signal
引 言

近红外无创血糖检测的难题之一是复杂而且无规律的背景变动[1, 2, 3]。 由于人体背景变动的复杂和无规律的特性, 传统的参考测量方法在人体很难实现, 需要寻找一种在体的参考测量方法。 课题组提出的浮动基准位置[4, 5]可以作为在体参考测量的参考位置, 但是, 该位置的存在性在人体还未得到充分验证; 且由于其具有波长特性和个体差异性, 如何应用浮动基准位置进行在体参考测量存在一定的困难。 张婉洁提出的差动式浮动基准参考测量方法在一定程度上解决了该问题, 因为该方法不需要准确找到浮动基准位置, 而是在浮动基位置两侧进行差动式测量, 在不同状态下和各个测量波长均适用。 但是, 该方法也存在一定的问题, 例如如何选择两个差动测量的位置和有效信号提取等。

目前, 针对优化建模数据和提取有效信号的多元校正模型方面, 通过光谱预处理的方法建立高精度的校正模型来提高预测精度和稳定性。 如Ozaki等[6]在1 600~1 730 nm波段, 采用区域正交信号校正(region orthogonal signal correction, ROSC)结合一定窗口偏最小二乘(region window partial least square, NWPLS)方法消除干扰信号对葡萄糖有效信号的影响, 所建立的交互验证均方根误差(root mean square error of cross validation, RMSECV)比OSC-PLS方法下降了7.37%。 黄政伟等[7]利用净信号处理(net analyte preprocessing, NAP)算法结合径向基偏最小二乘(radial basis functions partial least square, RBFPLS)回归建立的适合人体血糖测量的非线性建模方法进行NAP-RBFPLS处理后, 校正模型对预测集的预测精度有了很大提高。

在差动式浮动基准参考测量方法的基础上, 针对如何最大程度的获得准确性高的原始光谱数据, 选择合适的光谱预处理方法以及对处理后的光谱数据从参数选择上进行进一步优化的问题, 引入了净信号[8](net analyte signal, NAS)的方法作为光谱预处理方法来提取被测组分中的葡萄糖信息, 结合变量投影重要性方法[9](variable importance in projection, VIP)进行光谱变量的选择和光谱-理化值共生距离法[10](sample set partitioning based on joint X-Y distances, SPXY)用于样本集的划分。 为了说明上述方法的有效性, 采用PLS法进行建模分析。 分别进行离体和在体实验研究, 旨在进一步提高检测的精密度和准确度, 从而实现有效糖信号的提取。

1 净信号分析

净信号定义为唯一对应于被测成分的有用信号(下文中用k表示被测成分), 并与样本中其他所有干扰成分的响应所张成的空间正交。 通过正交投影的方式消除光谱中与待测成分无关的信息, 从而达到准确提取被测成分变化信息的目的。 图1示出为测量信号rk与成分k的净信号 rknet之间的关系。 图中所示平面为被测成分以外的其他干扰信号张成的子空间。

图1 净信号分析原理示意图Fig.1 Illustration of the theory of NAS

针对血糖测量来说, 葡萄糖即被测成分的光谱净信号正交于光源漂移、 温度变化等时变性因素及水、 脂肪、 蛋白质等生理成分所引起的光谱所张成的光谱子空间。 首先, 构建一个不包含被测成分信息的噪声子空间, 然后将葡萄糖k的光谱矩阵向该子空间进行投影, 垂直于子空间的信号即为被测成分葡萄糖k的净信号

rknet=(I-P-k)rk(1)

其中, rk为测量得到的信号, rknet为被测成分葡萄糖k对样本光谱的净贡献, I为相应的单位矩阵, P-k为投影矩阵。 常用秩消的方法消除成分k对光谱的贡献。 在经典模型下, 投影矩阵P-k=S-k S-k+。 其中, S-k=span(s1, s2, …, sk-1, sk+1, …, sm), si为成分i的校正因子(即成分在各个波长下的摩尔吸光系数ε i与光程长的乘积)。 在逆模型中, 投影矩阵P-k= R^-kR^-k+, 被测成分葡萄糖k的净信号为

rknet=(I-R^-kR^-k+)rk(2)

由于 rknet中不包含干扰信号, 它是单条光谱(单个样本)在所有波长下的信息表达, 根据张量理论, 可以用标量的形式(取范数)代替净信号向量, 并且不会丢失任何有用的信息, 即净信号向量的欧几里德范数nasnorm( rknet)正比于被分析成分k的浓度ck,

nasnorm(rknet)=k1ck+k0(3)

即净信号与葡萄糖浓度成线性关系, 并利用相关系数表示两者相关程度。

通过NAS来获得有用的葡萄糖信号, 然后结合VIP法和SPXY法分别进行光谱变量的选择和样本集的划分。

2 离体实验

基于AOTF分光的近红外光谱测量实验系统主要由光路系统、 光电检测、 电路放大、 光纤探头、 数据采集及驱动控制等部分组成。 波长范围为900~1 700 nm, 分辨率为5 nm, 重复性为± 0.05 nm, 吸光度准确度为± 0.004 Abs, 可实现高速微秒量级内波长切换(5 000个波长· s-1)。 光纤测头为两环同心圆结构, 光纤内环中心径向距离是0.6 mm, 外环中心径向距离是2 mm, 中心为入射光纤。

以3%Intralipid溶液作为人体组织的模拟液, 配置葡萄糖浓度范围为200~6000 mg· dL-1, 间隔为200 mg· dL-1, 同时补充了100和500~5 500 mg· dL-1, 间隔500 mg· dL-1共计37个样本溶液。 波长间隔为20 nm; 每个样本连续扫描8条光谱; 为消除时间相关的偶然因素影响, 随机顺序进行样本的光谱测量。 实验连续进行两天, 系统每天重新打开, 并在每一天的实验过程中尽量保持实验条件与测量环境相一致。

在离体实验中使用图2所示的光纤探头进行漫反射光的接收, 外环处接收到的光谱信号较弱, 利用外环处的光谱信息构建噪声子空间, 内环处的光谱信息作为测量信号。 通过主成分分解的方式消除光谱中的随机噪声, 获得重建后的测量信号矩阵和噪声子空间矩阵, 根据式(2)得到葡萄糖相对于噪声子空间的净信号。 以当天测得的光谱数据构造噪声子空间并提取净信号称作光源漂移小的情况, 以随机选择两天测得的光谱数据构造噪声子空间并提取净信号称作光源漂移大的情况, 前者提取的葡萄净信号为 rknet, 1, 后者为 rknet, 2。 全部36个样本(由于污染剔除葡萄糖浓度2 800 mg· dL-1的样本)建立PLS模型, 结果如表1所示。 并将每个样本的净信号向量代入式(3), 并建立回归曲线(剔除粗大误差点), 得到净信号范数nasnorm( rknet, 1)和nasnorm( rknet, 2), 结果如图3所示。

表1 不同光源漂移情况下的建模结果 Table 1 Modeling result of different light drift

图2 两环光纤探头示意图Fig.2 Illustration of the two-ring fiber probe

图3 净信号范数与葡萄糖浓度的关系 (光源漂移大小不同)Fig.3 The relationship between Nasnorm and glucose concentration (different light drift)

从中可以看出, 光源漂移大的情况相比于光源漂移小的情况, 其RMSEC和RMSECV分别下降了20.03%和46.98%, 相关系数也有所下降。 同时, 葡萄糖净信号范数与葡萄糖浓度的线性相关系数也从0.959 9下降到0.946 0。 实验中, 除光源偏移造成的干扰外, 还有检测器状态的改变、 测量条件的改变等其他影响, 使得构造的噪声子空间的稳健性受到一定程度的影响, 有必要对提取到的葡萄糖NAS做进一步的处理来提高建模的预测精度。

依次计算各波长xj下葡萄糖浓度值Y的VIP值大小, 结果如图4(a)所示; 选取VIP值大于1的波长, 共计16维, 如图4(b)所示。

图4 41个波长变量的投影重要性分析Fig.4 Analysis of VIPs of the 41 wavelengths

利用这16维波长变量建立PLS模型预测葡萄糖浓度, 校正集样本数同样为36个, 内部完全交互验证, 并与采用41维波长变量的建模结果进行对比, 结果如表2所示。

表2 采用VIP法处理前后的建模结果对比 Table 2 Comparison of the modeling results before and after VIP processing

从表中可以看出, 采用VIP法处理后的建模效果有所改善, 其RMSEC和校正相关系数基本不变, 但RMSECV降低了15.59%, 交互验证相关系数从0.908提高到了0.932, 相关性也有所提高, 建模精度有所提高。

在上述分析过程中, 并没有对样本集进行划分, 将全部样本用作校正集进行建模分析, 没有单独的预测集。 下面继续采用SPXY法对样本集进行划分, 并与通常采用的随机选取样本法(random sampling, RS)进行比较, 从PLS法建模结果进行判别, 从离体实验方面验证方法的有效性。

上述NAS-VIP法处理后的光谱数据, 共有36个样本。 建立PLS模型, 结果如表3所示, 采用SPXY法进行样本集划分后建立模型的效果有了大幅度提高, 其校正集中RMSEC和RMSECV分别降低了39.37%和7.00%, 相关系数也有所提高, 预测集中RMSEP降低了42.25%。 即采用SPXY法后不但内部完全交互验证的效果有所提高, 外部验证的预测精度也得到了改善。

表3 SPXY法和RS法划分样本集后所建模型结果 Table 3 Modeling results after sample set partition of SPXY and RS

综上所述, 离体实验验证了基于NAS-VIP-SPXY-PLS的差动浮动基准参考测量方法提取有效糖信号的可行性, 为人体实验提供了依据。

3 在体实验
3.1 方法

口服葡萄糖耐量实验(oral glucose tolerance test, OGTT)可以在较短时间内得到一个较宽范围内的血糖浓度变化, 并在血糖浓度变化的过程中采集所需的校正集样本, 用此方法获取实验模型数据。

6人次健康志愿者(其中男生3人, 女生3人, 平均年龄24岁)参与到本次OGTT实验中, 要求被测对象在实验前一天晚上10点后禁食。 实验分六天进行, 保持实验环境温度(25± 1)℃和湿度(60%± 5%)相对稳定, 所有实验在早上8点半开始, 同时保证个体生理变化状况的相对一致。 实验系统与离体实验相同, 其中人机接口和手掌固定装置如图5所示。

图5 手掌固定装置Fig.5 The device for palm fixing

3.2 结果与讨论

选择接收到的漫反射光强较弱的外环处的光谱信号用于构造式(2)中的噪声子空间, 内环处的光谱信号作为式(2)中的测量信号。

对6名健康志愿者采集的数据经上述处理后, 利用PLS建立校正模型, 建模结果如表4表9所示。 其中, 表4表6为3名女性志愿者的建模结果, 表7表9为3名男性志愿者的建模结果。 校正集和预测集个数划分情况如表10所示。

表4 志愿者1建模结果(女) Table 4 Modeling results of volunteer 1 (female)
表5 志愿者2建模结果(女) Table 5 Modeling results of volunteer 2 (female)
表6 志愿者3建模结果(女) Table 6 Modeling results of volunteer 3 (female)
表7 志愿者4建模结果(男) Table 7 Modeling results of volunteer 4 (male)
表8 志愿者5建模结果(男) Table 8 Modeling results of volunteer 5 (male)
表9 志愿者6建模结果(男) Table 9 Modeling results of volunteer 6 (male)
表1 0 校正集和预测集个数具体划分情况 Table 1 0 Division of calibration sets and prediction sets

从两方面对在体实验的建模结果进行分析: 表4表6的建模结果与表7表9进行对比, 可以看出, 经NAS-VIP-SPXY-PLS法处理后, 3名女性志愿者建模结果中RMSEC, RMSEP和校正相关系数与男性志愿者相当; 从每个被测对象来看, 经VIP法进行光谱变量选择后的建模效果比全光谱变量的建模效果好或相当, 光谱变量维数下降42%~80%, RMSEC最大下降35.32%(志愿者5), 采用SPXY法进行样本划分的建模效果比平时采用的RS建模效果好, 6名志愿者的RMSEP有不同程度的下降。

从上述分析可知, 虽然由于每个人手掌部位的组织参数不同, 且皮肤组织厚度也不同, 加之其他生理参数、 心理状态、 测量条件等的不同, 导致后续数据处理的建模效果稍有不同, 但是通过NAS-VIP-SPXY-PLS法对差动浮动基准参考测量方式得到的数据处理后, 建模质量有所提高。

采用Clarke Error Grid[11]分析来评价血糖浓度预测结果对临床的指导意义, 以静脉血糖浓度值作为参考值, 将上述经NAS-VIP-SPXY-PLS法处理后得到的6名志愿者共计36个血糖浓度值作为预测值, 利用Clarke Error Grid分析方法进行处理, 结果如图6所示: 血糖浓度预测值都落在了A区。 因此, 基于NAS-VIP-SPXY-PLS的差动浮动基准参考测量方法在提取有效糖信号方面具有较好的精密度和准确度。

图6 血糖浓度预测值Clarke Error Grid分析图Fig.6 Clarke error grid analysis of the prediction of blood glucose level

4 结 论

针对差动浮动基准参考测量方法应用于近红外无创血糖检测中存在的主要问题, 即有效糖信号的提取, 提出了基于NAS-VIP-SPXY-PLS的差动浮动基准参考测量方法, 并从离体实验及在体实验两方面进行了研究。 离体实验验证了基于NAS-VIP-SPXY-PLS的差动浮动基准参考测量方法在提取有效糖信号方面的可行性。 结果表明, 经此方法处理后模型的效果有了大幅度提高, 波长维数下降60.98%, 其校正集RMSEC和RMSECV分别降低了39.37%和7.00%, 相关系数也有所提高, 预测集RMSEP降低了42.25%。 在体实验方面, 三名女性志愿者与三名男性志愿者的建模效果相当, 从每个被测对象来看, 经VIP法进行光谱变量选择后的建模效果比全光谱变量的建模效果好或相当, 波长维数下降了42%以上, 采用SPXY法划分后的预测集中葡萄糖浓度参考值和预测值的相关系数普遍提高。 由此说明, 通过NAS-VIP-SPXY-PLS法对差动浮动基准参考测量方式得到的数据进行处理后, 建模质量有所提高。 最后采用Clarke Error Grid分析验证了该方法在提取与血糖浓度有关的有用信号上具有较高的准确度, 但鉴于对比的血糖值较少, 还需要进一步的研究。

The authors have declared that no competing interests exist.

参考文献
[1] Yadav J, Rani A, Singh V, et al. Biomedical Signal Processing and Control, 2015, 18: 214. [本文引用:1]
[2] Amaral C E F, Wolf B. Medical Engineering & Physics, 2008, 30(5): 541. [本文引用:1]
[3] Min X L, Liu R, Hu Y X, et al. Analytical Methods, 2014, 6(24): 9831. [本文引用:1]
[4] Min X L, Liu R, Xu K X, et al. Optics & Laser Technology, 2017, 91: 7. [本文引用:1]
[5] Han G, Yu X Y, Xu K X, et al. Applied Spectroscopy, 2017, 71(9): 2177. [本文引用:1]
[6] Du Y P, Liang Y Z, Kasemsumran S, et al. Analytical Sciences, 2004, 20(9): 1339. [本文引用:1]
[7] LI Qing-bo, HUANG Zheng-wei(李庆波, 黄政伟). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2014, 34(2): 494. [本文引用:1]
[8] Palermo R N, Short S M, Anderson C A, et al. Journal of Pharmaceutical Innovation, 2012, 7(2): 56. [本文引用:1]
[9] Zou X B, Zhao J W, Malcolm J W P, et al. Analytica Chimica Acta, 2010, 667(1-2): 14. [本文引用:1]
[10] Gani W, Limam M. Journal of Statistical Computation & Simulation, 2016, 86(1): 135. [本文引用:1]
[11] Clarke W L. Diabetes Technol. Ther. , 2005, 7(5): 776. [本文引用:1]