光电容积脉搏波的睡眠呼吸暂停综合征筛查方法
李肃义1, 姜珊1, 刘丽佳1, 熊文激2, 倪维广1,*
1. 吉林大学仪器科学与电气工程学院, 吉林 长春 130061
2. 吉林大学第一医院, 吉林 长春 130021
*通讯联系人 e-mail: niwg@jlu.edu.cn

作者简介: 李肃义, 女, 1972年生, 吉林大学仪器科学与电气工程学院教授 e-mail: lsy@jlu.edu.cn

摘要

睡眠呼吸暂停综合征(SAS)素有“睡眠杀手”之称。 由于其诊断金标准多导睡眠监测仪(PSG)的限制, 诊断率一直偏低。 由于呼吸暂停发生时会引发心率节奏的变化, 因此利用心电图(ECG)通过心率变异性(HRV)分析可以实现SAS的自动筛查。 但是, ECG-SAS方法所用电极穿戴繁琐、 材质致敏性较高, 影响睡眠安适度。 鉴于脉率变异性(PRV)分析与HRV分析高度相关, 并且光电容积脉搏波(PPG)信号相对ECG信号获取方式更加简单, 不仅电极不易致敏, 而且更易于穿戴, 对睡眠干扰小。 由此, 提出利用同步采集的PPG信号和ECG信号, 应用相同的建模方法, 比较二者的疾病识别能力。 应用反向传播(BP)神经网络, 分别建立PPG-SAS与ECG-SAS自动筛查模型, 并采用十折交叉验证法及受试者工作特征(ROC)曲线对模型进行对比与评估。 实验数据来源于MIT-BIH Polysomnographic Database, 共8 248个样本, 其中正常样本6 227例。 首先采用三层BP神经网络, 默认参数下建立PPG-SAS与ECG-SAS模型, 使用十折交叉验证法及ROC曲线进行模型分类准确性的对比; 然后依次改变影响分类性能的隐层节点数、 训练函数以及传递函数, 建立多个PPG-SAS与ECG-SAS模型, 从中选取各自的最优模型再进行对比。 通过比较识别率、 预测率以及ROC曲线面积, 采用默认参数的PPG-SAS模型优于ECG-SAS模型。 通过比较平均分类准确率, 隐层节点数为50、 训练函数为一步正割算法、 隐含层传递函数为双曲正切S型函数时, PPG-SAS模型得到的最高识别率与预测率分别为80.30%和80.13%; 隐层节点数为50、 训练函数为一步正割算法、 隐含层传递函数为径向基时, ECG-SAS模型的最高识别率与预测率分别为77.60%和77.67%。 以上实验结果均表明PPG信号的SAS分类能力较ECG信号更具优越性, 由此证明了PPG信号筛查SAS的可行性及可靠性, 为临床SAS病症的早期发现及诊断率提升奠定理论基础。

关键词: 睡眠呼吸暂停综合征; 光电容积脉搏波; 心电信号; 神经网络; 十折交叉验证法
中图分类号:TP391 文献标志码:A
A Screening Method for Sleep Apnea Syndrome Based on Photoplethysmographic
LI Su-yi1, JIANG Shan1, LIU Li-jia1, XIONG Wen-ji2, NI Wei-guang1,*
1. College of Instrumentation and Electrical Engineering, Jilin University, Changchun 130061, China
2. The First Clinical Hospital of Jilin University, Changchun 130021, China
*Corresponding author
Abstract

Sleep Apnea Syndrome (SAS) is known as the “sleep killer”. The diagnostic rate is low due to the limitations of the Polysomnography (PSG) diagnostic criteria. Studies have shown that heart rate rhythm changes when apnea occurs, so automatic screening of SAS can be achieved by measuring Electrocardiograph (ECG) signals based on Heart Rate Variability (HRV) analysis. However, the electrodes used in the ECG-SAS method are cumbersome, can easily cause skin allergy, and affect sleeping comfort. Due to Pulse Rate Variability (PRV) analysis being highly correlated with HRV analysis and photoplethysmography (PPG) signals being simpler to acquire than ECG signals, this study proposes using synchronously acquired PPG and ECG signals and applying the same modeling method to compare the recognition ability of the two methods. The benefits for acquiring PPG instead of ECG are that the electrode does not cause skin allergyand is easier to wear so that it has little interference with sleeping comfort. The Back-Propagation (BP) neural network is applied to establish the automatic screening models of PPG-SAS and ECG-SAS, respectively. The 10-fold cross validation method and the Receiver Operating Characteristic (ROC) curves are used to compare and to evaluate the models. The experimental data are from MIT-BIH Polysomnographic Data base that contains 8 248 samples, including 6 227 normal samples. First of all, we established PPG-SAS and ECG-SAS models using a three-layer BP neural network with the default parameters, and compare their classification performances through the 10-fold cross validation method and the ROC curves. And then, we successively adjusted the number of hidden layer nodes, training functions and transfer functions to establish corresponding PPG-SAS and ECG-SAS models, and compare the respective optimal models obtained by using the 10-fold cross validation method. Through the comparisons of the recognition and prediction accuracies and the area of the ROC curves, the results illustrate that the PPG-SAS model is better than the ECG-SAS model when default parameters were applied. By comparing the average classification performances, we obtained the optimal model of PPG-SAS with 50 hidden layer nodes, trained function based on one-step secant method, and transferred function based on hyperbolic tangent sigmoid. The optimal PPG-SAS model has the highest recognition accuracy of 80.30% and prediction accuracy of 80.13%. Similarly but with a different transfer function of radial basis, the optimalECG-SAS model has the highest recognition accuracy of 77.60% and prediction accuracy of 77.67%. The results showed that the optimal PPG-SAS model is better than the optimal ECG-SAS model. The above experimental results demonstrated that the SAS classification ability by using PPG signals is superior to that by using ECG signals, which proved the feasibility and reliability of the PPG-SAS screening method. Therefore, the PPG-SAS screening method will lay a theoretical foundation on early detection of SAS and improvement of its diagnostic rate.

Keyword: Sleep apnea syndrome; PPG; ECG; Neural networks; 10-fold cross-validation
引言

睡眠呼吸暂停综合征(sleep apnea syndrome, SAS)是一种常见的睡眠障碍性疾病, 可导致人嗜睡、 易怒、 注意力不集中, 增加2~7倍的车祸风险。 不仅能诱发高血压、 冠心病等心脑血管疾病, 还会引发慢性疾病, 严重时甚至可能导致“ 猝死” [1, 2, 3]。 由于SAS诊断的金标准多导睡眠监测仪(polysomnography, PSG)造价高、 过程复杂且需要专业的操作技术, 导致SAS的诊断率偏低, 据有关统计表明: 高达93%的女性和82%的男性患者未被确诊[4]。 因此国内外一直在积极地寻求检测方便、 价格低、 对睡眠干扰小的筛查方法来提升SAS诊断率。

呼吸暂停的发生会引起心率节奏的变化, 因此利用心电信号(electrocardiograph, ECG)通过心率变异性(heart rate variability, HRV)分析可实现SAS的筛查。 Chazal等[5]以PSD、 心率、 R波幅值等多个时域、 频域指标作为特征参数来进行SAS的自动检测; 由于SAS发作时心率波动是瞬时的、 高度非线性与非平稳的, 所以Mietus等[6]提出使用Hilbert变换来进行RR间期变化分析; Zywietz等[7]采用小波变换提取正常人与SAS患者的HRV频谱成分; Chazal等[8]基于RR间期系列与ECG的形态, 计算了88个有关特征参数, 提升了SAS的检测准确度; 2006年, 佟光明等[9]通过比较分析80例睡眠中心患者的HRV频域与时域指标, 并联合推导的呼吸曲线EDR实现了SAS的检测; 反向传播(back-propagation, BP)神经网络是一种按误差反向传播算法训练的多层前馈网络, 已经被成功应用于很多领域, 尤其适用于人体参数与复杂疾病的模型建立。 2011年, Acharya等[10]提出使用ECG的关联维数、 分形维数等5个非线性参数训练BP神经网络以进行SAS的自动分类; Lweesy等[11]尝试使用P波形态参数来训练BP神经网络。 2012年, Kesper等[12]通过分析HRV与EDR参数设计了SAS自动检测算法。 以上研究的分类准确率在65%~91%之间, 充分证明了ECG-SAS筛查模型的有效性。 但是, ECG-SAS筛查方法需要患者佩戴多个心电电极, 以氯化银为主的电极不仅会对皮肤有较高致敏性, 而且其布放的位置也会影响睡眠安适度[13]

动脉血管壁会随心脏节律性跳动而产生周期性波动, 当利用光电传感器进行照射时, 接收端接收到的交流信号会随之产生变化, 即光电容积脉搏波(photoplethysmography, PPG)[14]。 呼吸暂停的发生也会引起脉率节奏的相应变化, 并且基于PPG的脉率变异性(pulse rate variability, PRV)分析与基于ECG的HRV分析已被证实具有高度相关性[15, 16]。 另外, 与心电电极相比, 脉搏传感器可以布放在指端、 手腕、 耳垂等位置[17], 穿戴相对简单, 采集更加灵活, 所以, 利用PPG来进行SAS的筛查已成为可能[18]

本工作拟通过同步采集的PPG信号和ECG信号, 使用相同的分类方法, 分别建立PPG-SAS与ECG-SAS的自动筛查模型, 并且通过比较它们分类准确率来进一步验证PPG用于筛查SAS的可靠性与有效性。

1 实验部分
1.1 数据

实验数据来源于Boston’ s Beth Israel医院睡眠实验室提供的MIT-BIH Polysomnographic Database, 记录了年龄在32~56岁之间(平均年龄43岁), 体重在89~152 kg(平均体重119 kg)的16名受试者睡眠期间包括ECG、 EEG、 脉压、 呼吸信号、 PPG信号等在内的多个生理信号, 其采样频率为250 Hz, 每30 s的数据附有专家提供相关睡眠阶段和呼吸暂停的注释。 图1为同一患者同步的带有专家注释的归一化后的30 s PPG信号与ECG信号。 通过比较图1(a)(专家注释为SAS的PPG信号)与图1(c), 图1(b)(专家注释为SAS的ECG信号)与图1(d), 我们可以观察到图1(a)与图1(b)在SAS发生时, 峰峰间期均产生了改变, 尤其在3 000~5 000采样点时峰峰间期均偏大。 图1(c)与图1(d)为正常信号, 峰峰间期比较均匀。

图1 同步采集的PPG信号和ECG信号
(a): SAS的PPG信号; (b): SAS的ECG信号; (c): 正常的PPG信号; (d): 正常的ECG信号
Fig.1 The PPG and ECG signals collected synchronously
(a): PPG signal labeled as SAS; (b): ECG signal labeled as SAS; (c): PPG signal labeled as normal; (d): ECG signal labeled as normal

我们整理了数据库中伴有专家注释的所有PPG信号和ECG信号, 分别形成PPG-SAS与ECG-SAS实验样本集。 以PPG-SAS为例, 样本集由输入向量X与输出向量Y组成, 其中输入向量为PPG信号, 共8 248个, 每个7 500维, 输出向量为分类结果, 01代表患有SAS, 10代表正常, 其中正常样本6 227例, SAS样本2 021例。

1.2 SAS筛查模型的建立与优化

鉴于BP神经网络在ECG-SAS筛查模型中的成功应用, 应用BP分类器分别建立PPG-SAS与ECG-SAS的自动筛查模型。 主要实现步骤如下:

(1)数据归一化处理

为避免不同数量级数字间的影响, 对PPG与ECG原始数据分别采用式(1)进行归一化处理:

X˙=X-min(X)max(X)-min(X)(1)

其中X为原始数据, X˙为归一化后的数据。

(2)BP网络的建立

BP网络属于有监督的训练, 设每个节点输出值Y

Y=σi=1IWX+b(2)

其中, W为两节点间的连接权重, I为上一层节点个数, X为上一层节点的输出值, b为当前节点的阈值, σ 表示传递函数。

计算网络实际输出与期望输出之间的误差, 通过训练算法修正各层各节点间的权重及节点的阈值

WW-ηE(W, b)W-E(W, b)Wbb-ηE(W, b)b(3)

其中, η 为网络训练的学习率, c为动量因子。

BP网络建立的核心是设计与选取合适的网络结构、 传递函数、 训练函数以及性能函数等参数[19]

网络结构: 依据Kolmogorov定理, 三层BP神经网络即可实现任何函数在任何精度上的非线性映射。

传递函数: 包括隐含层传递函数与输出层传递函数。 常用的有双曲正切S型(tansig)、 S型(logsig)、 竞争型(compet)、 径向基(radbas)、 和三角形径向基(tribas)传递函数。

训练函数: BP网络的训练函数常用的学习算法有量化共轭梯度法(trainscg)、 自适应学习率动量梯度下降法(traingdx)、 Powell-Beale共轭梯度法(traincgb)、 Fletcher-Reeves共轭梯度法(traincgf)、 一步正割算法(trainoss)和自适应学习率梯度下降法(traingda)。

性能函数: 常用的性能函数有交叉熵函数(cross-entropy)和均方误差(mean squared error, MSE), 一般分类问题用cross-entropy来定义损失函数。

鉴于网络模型的主要参数对最终筛查效果有不同程度的影响, 依次改变隐层节点数、 传递函数及训练函数, 并通过对比模型训练时间与预测准确率, 进行不同参数下同步的PPG信号和ECG信号对SAS的分类效果的比较。

1.3 SAS筛查模型的评估

采用十折交叉验证法来评估PPG-SAS与ECG-SAS模型的分类性能。 将PPG信号与ECG信号分别从患病、 健康样本中各随机选取90%的数据(共7 423例)作为训练集, 10%的样本(共825例)作为测试集, 共进行10次, 按式(4)计算每一次的分类准确率

Accuracy=TP+TNTP+TN+FP+FN×100%(4)

其中TP(True Positive)代表检测为真阳, TN(True Negative)代表检测为真阴, FP(False Positive)代表检测假阳, FN(False Negative)代表检测为假阴。

最终通过对比这10次分类准确率的平均值, 来分析同步的PPG信号和ECG信号在同一模型下对SAS的筛查效果。

2 结果与讨论
2.1 默认参数下模型分类性能对比

利用随机分配的PPG与ECG样本, 分别建立BP分类模型。 分类模型默认的主要参数如下: 网络结构为3层; 隐层节点数为10; 训练函数使用trainscg; 隐含层传递函数采用tansig, 输出层采用softmax; 性能函数为cross-entropy。

采用十折交叉验证法, 分别计算了两种模型的识别率与预测率, 如表1所示。

表1 PPG-SAS, ECG-SAS模型的训练与测试分类结果 Table 1 Training and test classification results of PPG-SAS and ECG-SAS models

通过表1可知, PPG-SAS模型的平均识别率为79.06%, 预测率为78.68%; ECG-SAS模型分别为75.63%与75.49%, 由此可见在默认参数下, 利用同步采集的PPG信号与ECG信号预测SAS, PPG信号的准确率优于ECG信号的准确率。

图形可以更加直观地对比两种模型的预测效果, 图2为第5次实验的受试者工作特征(receiver operating characteristic, ROC)曲线, 曲线所占面积越大、 即曲线越靠近左上角, 其准确率就越高。 图2(a)为PPG-SAS模型的ROC曲线, 图2(b)为ECG-SAS模型的, 其中Class1为TP曲线, Class2为TN曲线。 直观对比二者所占面积, PPG-SAS的分类效果明显优于ECG-SAS的分类效果。

图2 ROC曲线
(a): PPG-SAS模型; (b): ECG-SAS模型
Fig.2 ROC curves
(a): PPG-SAS model; (b): ECG-SAS model

2.2 优化参数下模型分类性能对比

隐层节点数、 训练函数以及传递函数是影响网络分类性能的主要参数, 采用2.1中十折交叉验证时形成的PPG与ECG样本, 采用3层网络结构, 在不改变其他参数的基础上, 依次调整以上参数以评估模型的分类性能。

表2列出了两种模型的隐层节点数分别为10, 25, 50, 100, 300和500下输出的平均识别率、 预测率以及建模时间的对比。

表2 不同隐层节点数下两种模型的分类准确率与建模时间均值比较 Table 2 Comparisons of average classification accuracies and average modeling time between two models with different numbers of hidden units

通过表2可知, 识别率与预测率会随隐层节点数的增加略有增加, 但增加到一定程度时则会有所降低; 建模耗时会随隐层节点数的增加而大大增加。 综合考虑输出准确率与耗时, 将筛查模型的隐层节点数定为50。

保持隐层节点数为50不变, 改变训练函数, 表3列出了不同训练函数下取得的两个模型的平均识别率与预测率。

表3 不同训练函数下两种模型的平均分类准确率对比 Table 3 Comparisons of average classification accuracies between two models with different training functions

通过表3可知, 训练函数为trainoss函数时, PPG-SAS与ECG-SAS模型的分类准确率均更高, 其中PPG-SAS模型可达80%左右。

隐层节点数为50, 训练函数为trainoss, 由于处理的是分类问题, 所以输出层的传递函数固定为softmax, 改变隐含层的传递函数, 表4为两种模型在不同传递函数下的平均识别率与预测率对比结果。

表4 不同传递函数下的两种模型的平均分类准确率对比 Table 4 Comparisons of average classification accuracies between two models with different transfer functions

通过表4可知, ECG-SAS模型在隐含层传递函数为radbas及tribas时比PPG-SAS模型的分类准确率稍高, 但PPG-SAS模型在传递函数为tansig及logsig时, 分类准确率均超过了80%。

通过分析以上实验结果, 可以看到, 当使用同步采集的ECG与PPG信号进行SAS分类模型的建立时, 无论是使用默认参数的BP分类模型还是优化参数的模型, PPG-SAS模型分类效果均要优于ECG-SAS模型。

3 结论

根据HRV分析与SAS密切相关的原理, 利用ECG筛查SAS已被证实具有可行性及有效性。 但是, ECG的电极材质致敏性较高, 并且电极穿戴繁琐会对睡眠安适度造成影响。 鉴于PRV分析与HRV分析的高度相关性, 并且PPG传感器不易致敏且穿戴简单, 利用MIT-BIH Polysomnographic Database中同步采集的PPG信号和ECG信号, 应用相同的BP建模方法, 分别建立了PPG-SAS与ECG-SAS筛查模型, 采用十折交叉验证法评估了二者的分类准确率以探讨临床上使用PPG信号筛查SAS的可行性及可靠性。 在默认参数下, 得到ECG-SAS模型的平均识别率与预测率为75.63%与75.49%; PPG-SAS模型为79.06%与78.68%。 通过依次改变隐层节点数、 训练函数以及传递函数等影响网络分类性能的主要参数, 得到优化后的ECG-SAS模型的最高训练识别率和测试预测率分别为77.60%和77.67%, 而PPG-SAS模型则分别达到80.30%与80.13%。 结果表明, PPG-SAS模型优于ECG-SAS模型。 由此说明, 进一步深入研究这种简单易行的PPG-SAS筛查技术, 具有重要研究意义与广阔应用前景。 本工作仅研究了使用原始信号及较为经典的BP神经网络建立了分类模型。 鉴于信号预处理技术、 特征提取和分类算法对输出结果的重要影响, 并且人体与疾病的复杂性与不可预测性又非常适合应用深度学习技术来进行映射, 所以下一步的研究重点将基于深度学习理论设计特征提取及分类方法, 进行PPG-SAS模型的优化及准确率的提升, 为SAS临床的早期检测、 治疗效果评价及预后评估奠定基础。

The authors have declared that no competing interests exist.

参考文献
[1] Chang C C, Chuang H C, Lin C L, et al. Sleep Medicine, 2014, 15(4): 410. [本文引用:1]
[2] Yaggi H Klar, John Concato, Walter N Kernan, et al. The New England journal of medicine, 2005, 353(19): 2034. [本文引用:1]
[3] Selim B J, Junna M R, Morgenthaler T I. Sleep Medicine Clinics, 2014, 9(1): 37. [本文引用:1]
[4] Hang L W, Lin H H, Chiang Y W, et al. Applied Mathematics & Information Sciences, 2013, 7(1): 227. [本文引用:1]
[5] Chazal P D, Heneghan C, Sheridan E, et al. Computers in Cardiology, 2000, 27: 745. [本文引用:1]
[6] Mietus J E, Peng C K, ChIvanov P, et al. Computers in Cardiology, 2000, 27: 753. [本文引用:1]
[7] Zywietz C W, Von E V, Widiger B, et al. Methods of Information in Medicine, 2004, 43(1): 56. [本文引用:1]
[8] Chazal P D, Heneghan C, Sheridan E, et al. IEEE Transactions on Biomedical Engineering, 2003, 50(6): 686. [本文引用:1]
[9] TONG Guang-ming, GUO Ji-hong, HAN Fang, et al(佟光明, 郭继鸿, 韩芳, ). National Medical Journal of China(中华医学杂志), 2006, 86(122): 1545. [本文引用:1]
[10] Acharya U R, Chua E C, Faust O, et al. Physiological Measurement, 2011, 32(3): 287. [本文引用:1]
[11] Khaldon Lweesy, Luay Fraiwa, Natheer Khasawneh, et al. Journal of Medical Systems, 2011, 35: 723. [本文引用:1]
[12] Kesper K, Canisius S, Penzel T, et al. Medical & Biological Engineering & Computing, 2012, 50(2): 135. [本文引用:1]
[13] Poupard Laurent, Philippe Carole, Goldman Michael David, et al. Sleep and Breathing, 2012, 16(2): 419. [本文引用:1]
[14] Ahmet Resit Kavsaoglu, Kemal Polat, Mehmet Recep Bozkurt. Turkish Journal of Electrical Engineering & Computer Sciences, 2016, 24: 1782. [本文引用:1]
[15] Schäfer A, Vagedes J. International Journal of Cardiology, 2013, 166(1): 15. [本文引用:1]
[16] Bulte C S E, Keet S W M, Boer C, et al. European Journal of Anaesthesiology, 2013, 68(7): 775. [本文引用:1]
[17] Poh M Z, Swenson N C, Picard R W. IEEE Transactions Information Technology in Biomedicine, 2010, 14(3): 786. [本文引用:1]
[18] Li Y, Gao H, Ma Y. Medicine, 2017, 96(18): e6755. [本文引用:1]
[19] LI Jun-feng, WANG Yue-le, HU Sheng, et al(李俊峰, 汪月乐, 胡升, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2016, 36(10): 3261. [本文引用:1]