基于表面增强拉曼结合统计法分析鼻咽癌氧合血红蛋白
高飞1,*, 张明1, 孔德营2, 张剑明3
1.遵义医科大学物理学教研室, 贵州 遵义 563000
2.遵义医科大学生理学教研室, 贵州 遵义 563000
3.遵义市第一人民医院输血科, 贵州 遵义 563000
*通讯作者 e-mail: 594214027@qq.com

作者简介: 高 飞, 1984年生, 遵义医科大学物理学教研室讲师 e-mail: gaofeiaiqiao@163.com

摘要

近红外(NIR)表面增强拉曼散射(SERS)是一种极灵敏和高选择性的表面物质检测技术, 能够利用人体血液中氧合血红蛋白探测出相对应的NIR-SERS光谱, 联合多变量统计法对光谱数据进行检测分析。 首先筛选出合格的30例健康人与30例鼻咽癌患者氧合血红蛋白的NIR-SERS光谱, 经过比对光谱发现鼻咽癌患者氧合血红蛋白的平均NIR-SERS光谱在340、 479、 817、 1 127、 1 215、 1 347、 1 425和1 587 cm-1位置处, 谱峰的面积以及谱峰的强度相对较小, 尤其在479、 817和1 587 cm-1位置上更为明显。 此外, 当健康人氧合血红蛋白NIR-SERS光谱峰在335、 471、 1 338和1 429 cm-1位置处时, 鼻咽癌患者分别蓝移至在340、 479和1 347 cm-1处, 红移至1 425 cm-1处。 建立PCA-T(主成分分析与独立变量T检验联合)多变量统计算法诊断模型, 获得最显著差异的3个PCA得分: PC1、 PC3、 PC7, 并对这三个PCA得分作二维以及三维散点图, 将健康人与鼻咽癌患者划分至不同区域, 可以很好地辨别出健康人与患者。 为验证所构建的PCA-T分析法是否可靠, 使用工作特征曲线(ROC)进行评判, 由ROC曲线下面积0.858得知PCA-T分析法具有较高的可靠性。 经过谱峰归属表对照分析, 发现鼻咽癌患者氧合血红蛋白分子吡咯环、 乙烯基团等振动异常, 硌氨酸和苯丙氨酸的变化也比较明显。 很有可能是人体鼻咽部发生病变, 导致病人身体内氨基酸的代谢比较旺盛, 糖类的消耗升高等原因造成。 综上所述, 利用近红外激发表面增强拉曼散射光谱结合多元化统计分析法有可能准确、 有效、 快速地区分健康人与鼻咽癌氧合血红蛋白样本, 为后续NIR-SERS光谱技术在鼻咽癌或其他医学研究提供初步的实验依据, 同时可以成为临床早期癌症诊断的潜在高灵敏度和可靠的工具。

关键词: 鼻咽癌; 氧合血红蛋白; 统计; 诊断
中图分类号:O433.4 文献标志码:A
Analysis of Oxygen Hemoglobin in Nasopharyngeal Carcinoma Based on NIR-SERS With Statistical Methods
GAO Fei1,*, ZHANG Ming1, KONG De-ying2, ZHANG Jian-ming3
1. Department of Physics, Zunyi Medical University, Zunyi 563000, China
2. Department of Physiology, Zunyi Medical University, Zunyi 563000, China
3. Blood Transfusion Department, The First People's Hospital of Zunyi, Zunyi 563000, China
*Corresponding author
Abstract

Near-infrared (NIR) Surface Enhancement Raman scattering (SERS) is a highly sensitive and selective surface-matter detection technique that uses oxygenated hemoglobin in human blood to detect the corresponding NIR-SERS spectra. The spectral data were detected and analyzed using a combined multivariate statistical method. Firstly, the NIR-SERS spectra of oxygenated hemoglobin in 30 healthy subjects and 30 patients with nasopharyngeal carcinoma were screened, and it was found that the average NIR-SERS spectra of oxygenated hemoglobin in NPC patients were at the positions of 340, 479, 817, 1 127, 1 215, 1 347, 1 425, 1 587 cm-1. The area and intensity of the peaks were relatively small, especially at the positions of 479, 817 and 1 587 cm-1. In addition, when the NIR-SERS peaks of healthy individuals were at 335, 471, 1 338 and 1 429 cm-1, the red shift to 340, 479, 1 347 cm-1and blue shift to 1425 were observed in NPC patients.The multivariate statistical model of PCA-T (principal component analysis combined with independent variable t-test) was established to obtain the three most significant PCA scores: PC1, PC3, and PC7, two-dimensional and three-dimensional scatter plots were made for the three PCA scores, and the healthy people and NPC patients were divided into different regions. A working characteristic curve (ROC) was used to evaluate the reliability of the PCA-T analysis method and verify its reliability. The results showed that the vibrational changes of oxyhemoglobin molecules, such as pyrrole ring and vinyl group, were abnormal, and the changes of L-Phenylalanine were also significant. The nasopharynx of the human body likely has pathological changes, resulting in the patient's body's more vigorous metabolism of amino acids, increased sugar consumption, and other causes. In conclusion, the combination of near-infraredsurface-enhanced Tunku Abdul Rahman scattering spectroscopy with multivariate statistical analysis has the potential to accurately, effectively, and rapidly differentiate healthy human samples from those of nasopharyngeal carcinoma, this study provides a preliminary experimental basis for the application of NIR-SERS spectroscopy in nasopharyngeal carcinoma and other medical studies and may be a potentially sensitive and reliable tool for early clinical cancer diagnosis.

Keyword: Nasopharyngeal carcinoma; Oxyhemoglobin; Statistics; Diagnosis
引言

鼻咽癌, 最具侵袭性的头颈癌类型之一, 主要生长于鼻咽部上皮内膜, 与其他癌症类型相比, 具有独特的病理学特征[1, 2]。 根据国际癌症研究机构(IARC)公布的一份报告显示, 2020年全球新增加NPC(鼻咽癌)病例高达133 354例, 新增加死亡病例达80 008例, 其中超过70%的新增病例来自于东亚和东南亚[3]。 在我国南方以及西南地区等多地的发病率比较高[4]。 人的鼻咽位置比较隐蔽很不方便去检查, 很多患者容易忽视, 从而延误诊断和治疗, 鼻咽癌的初期症状更是复杂且缺乏特征, 即使发现一些症状到医院检查时, 绝大数患者已到中晚期[5]。 因此, 初期检查与诊断是医治鼻咽癌的关键时期。 常规的检查以及诊断的方法有内窥镜、 组织活检、 磁共振成像(MRI)检查、 头颈部计算机断层扫描(CT)检查等等[6], 虽然检查的方法比较多但依然存在时间长、 费用高、 甚至造成二次损伤等问题, 因此对鼻咽癌的早期检查以及诊断目前还存在一定的难度。

近红外(near-infrared, NIR)激发表面增强拉曼散射(excited surface-enhanced Raman scattering, SERS)光谱技术拥有独特的生物分子“ 指纹” 信息、 较高的非侵入性单分子检测灵敏度、 抗光漂白和光降解、 多重检测能力、 水的干扰可忽略等优点, 适合研究活性状态下的复杂生物系统[7]。 通过将分析物附着在等离子体SERS衬底上, 其固有的拉曼散射信号显著增强, 可用于定量分析和结构识别。 分析物显著的拉曼散射增强主要归因于等离子体衬底附近的强电磁场[8]。 电磁增强与等离子体纳米结构与电磁波的相互作用有关。 当纳米结构中自由电子的集体振荡频率与外界电磁辐射共振时, 限制在纳米结构表面的电场强度将增强, 这将强烈地影响近分子的极化率[9]。 因此, 位于等离子体纳米结构表面的分子的拉曼信号将显著增强。 通过将有机分子附着在等离子体纳米颗粒表面, 所获得的NIR-SERS光谱显示出高性能的生物传感多路复用能力[10]。 NIR-SERS作为一种检测等离子体纳米结构表面附近分子的技术越来越多的关注, 已经成为非常有价值的分子识别技术以及医学领域诊断疾病的重要方法[11]

本实验采用二维纳米银膜作为近红外表面增强拉曼散射的基底, 对鼻咽癌患者与健康人血液所提取的氧合血红蛋白样本进行光谱检测, 经过严格筛选分别得到2组NIR-SERS光谱(鼻咽癌患者与健康人各30例), 通过对比分析找出光谱强度以及面积上的差异性。 再结合主成分分析、 判别统计分析、 独立变量T检验等统计分析法, 构建NIR-SERS光谱诊断多变量统计算法模型, 将健康人与鼻咽癌患者划分至不同区域, 可以很好地辨别出健康人和鼻咽癌患者。 将两者样本进行光谱检测, 对比分析, 对鼻咽癌的筛查、 预后监测以及疗效诊断都具有参考价值。 通过氧合血红蛋白谱峰归属情况分析存在致癌的可能性因素, 为后续NIR-SERS光谱技术在鼻咽癌或其他医学研究提供初步的实验依据。

1 实验部分
1.1 样本

试验所需的血液样本取自遵义医科大学附属医院和遵义市第一人民医院, 收集血样前, 已经确认仅患有鼻咽癌但还未接受任何治疗。 经过多年的严格筛选最终选出30位鼻咽癌患者与30位健康人血液作为本次研究的样本。

1.2 方法

1.2.1 提取氧合血红蛋白

每次收集血样约3 mL, 以5 000 r· min-1离心5 min, 离心后将血样分为上层清液血浆和底层凝块红细胞两部分, 吸取凝块血红细胞约200 μ L, 移至新的无菌离心管中, 按1:9的比例加入去离子水, 再次离心, 吸取中间层氧合血红蛋白约500 μ L移至新的无菌离心管, 做好标记并放置冰箱4 ℃保存。

1.2.2 氧合血红蛋白NIR-SERS光谱测定

实验基底的制备是采用前期一样的静电二维纳米银膜的方法[12](该基底光谱重复性较高, 增强拉曼散射效应等优点), 取约50 μ L氧和血红蛋白样本均匀地涂在银膜基底上, 等待数分钟后会形成大约直径1 cm薄膜; 使用拉曼光谱仪进行检测, 以激光功率密度为103 W· cm-2, 光谱分辨率为10 cm-1, 波长为785 nm, 时间为16 s垂直照射在1 cm薄膜样品上进行测定。

1.2.3 数据处理

使用OriginPro 8.0进行NIR-SERS光谱检测分析, IBM SPSS Statistics 19, WPS Office等软件工具进行主成分分析、 判别统计分析、 独立变量T检验等。

2 结果与讨论
2.1 光谱综合分析

将所测得的NIR-SERS谱线在拉曼位移100~1 800 cm-1范围内依次排列, 可以很好地对比分析每个NIR-SERS光谱, 如图1(a)是30例健康人氧合血红蛋白NIR-SERS光谱并按照1至30的顺序依次排开, 所有光谱一致性较好, 峰强度也比较明显。 图1(b)是30例鼻咽癌氧合血红蛋NIR-SERS光谱并按照1— 30的顺序依次排开, 所有光谱一致性较好, 峰强度也比较明显。

图1 (a)、 (b)分别为30例健康人与30例鼻咽癌患者氧合血红蛋白NIR-SERS光谱Fig.1 (a) shows the oxygenated hemoglobin NIR-SERS spectra of 30 healthy subjects and (b) shows the oxygenated hemoglobin NIR-SERS spectra of 30 nasopharyngeal carcinoma patients

为了减少不同血样之间光谱强度的差异所带来的影响, 分别求出30例健康人与30例鼻咽癌患者氧合血红蛋白NIR-SERS光谱谱线平均值, 将2组平均值光谱线置于同一坐标中, 并沿着纵轴线上下平移分开, 可以获得直观的对比。 如图2(a、 b)分别表示30例健康人与30例鼻咽癌患者氧合血红蛋白的平均NIR-SERS光谱。 通过对比发现在340、 479、 817、 1 127、 1 215、 1 347、 1 425和1 587 cm-1位置处鼻咽癌患者平均NIR-SERS光谱的谱峰强度相对较小, 尤其是479、 817和1 587 cm-1位置处对比更为明显。 此外, 健康人平均NIR-SERS光谱在335、 471、 1 338和1 429 cm-1谱峰位置处, 鼻咽癌患者分别蓝移至在340、 479和1 347 cm-1处, 红移至1 425 cm-1处。

图2 健康人平均NIR-SERS光谱(a)与鼻咽癌患者平均NIR-SERS光谱(b)对比图Fig.2 Comparison of the mean NIR-SERS spectrum (a) of oxygenated hemoglobin in 30 healthy subjects with the mean NIR-SERS spectrum (b) of nasopharyngeal carcinoma

2.2 NIR-SERS光谱多变量统计分析

为了说明利用近红外激发拉曼光谱能够较好地区分正常人和鼻咽癌患者, 对健康人和患者的所有光谱数据进行多变量统计分析。 先算出健康人和鼻咽癌患者光谱谱峰归一化面积的PCs(主成分得分), 使用软件IBM SPSS Statistics 19计算获得8个PCs得分, 再利用独立变量T检验对这8个PCs进行显著性分析, 发现得分具有显著差异的是PC1、 PC3、 PC7。 图3(a)是健康人与鼻咽癌患者主成分得分PC1与PC3的二维散点图, 图中虚线方程YPC3=0.7XPC1-0.74很好地将健康人与鼻咽癌患者划分至不同区域。 健康人多数分布在虚线右下方, 鼻咽癌患者多数分布在虚线左上方。 图3(b)是健康人与鼻咽癌患者主成分得分PC3与PC7的二维散点图, 图中虚线方程YPC3=-0.85XPC7+0.2很好地将健康人与鼻咽癌患者划分至不同区域。 健康人多数分布在虚线的右上方, 鼻咽癌患者多数分布在虚线左下方。 图4是健康人与鼻咽癌患者主成分得分PC1、 PC3、 PC7的三维散点图, 健康人分布居于上方并且比较松散, 鼻咽癌患者分布居于下方并且比较集中。

图3 PC1与PC3的二维散点图(a)与PC3与PC7的二维散点图(b)Fig.3 Two-dimensional scatter plot (a) of PC1 and PC3 and two-dimensional scatter plot (b) of PC3 and PC7

图4 PC1、 PC3、 PC7的三维散点图Fig.4 Three-dimensional scatter plots of principal component scores PC1, PC3 and PC7 in healthy subjects and patients with nasopharyngeal carcinoma

图5是30例健康人与30例鼻咽癌患者主成分得分PC1、 PC3、 PC7的判别式得分单独组图。 从图5(a)中分析健康人判别式得分主要是分布在-1.5~3的区域, 若以“ 0” 为划分点, 则大于0的判别式得分占据多数; 图5(b)中分析中鼻咽癌患者判别式得分主要分布在-2.5~1的区域, 同样以“ 0” 位划分点, 则小于0的判别式得分占据多数。 从以上单独组图综合分析得出, 可以用“ 0” 作为区分健康人和鼻咽癌的分界线。 健康人与鼻咽癌患者判别式得分标准偏差分别是1.132与0.848, 鼻咽癌患者判别式得分标准偏差要明显小于健康人, 这正好跟图4中鼻咽癌患者分布比较集中, 健康人分布较松散相对应。

图5 (a)、 (b)分别为30例健康人与30例鼻咽癌判别式得分单独组图Fig.5 The discriminative plots of 30 healthy subjects (a) and 30 nasopharyngeal carcinoma patients (b) were assembled separately

ROC曲线是将特异性与灵敏度以图示法相结合, 由ROC曲线下方的面积(area under curve, AUC)来评估是否准确可靠[13]。 图6为基于统计分析法得出30例健康人与30例鼻咽癌患者光谱判别结果的ROC曲线图, 其中AUC=0.858, 由此可以判定该统计分析法具有较高的准确性及可靠性。

图6 ROC曲线图Fig.6 ROC curve based on statistical analysis

2.3 讨论

经研究发现鼻咽癌氧合血红蛋白NIR-SERS光谱在光谱形状以及谱峰强度上都发生了很大变化, 可能是身体发生癌变致使生物分子在结构上以及分子数量上产生变化, 致使鼻咽癌患者光谱与正常人相比存在很大的差异。 为揭示生物分子的变化机理, 对氧合血红蛋白拉曼谱峰的初步归属[14]进行对应分析, 光谱中471 cm-1谱峰可以归属为水合高铁血红蛋白吡咯环折叠振动, 817 cm-1谱峰可以归属为氧合血红蛋白分子吡咯环的对称呼吸振动, 1 127 cm-1谱峰可以归属为氧合血红蛋白分子吡咯半环的反对称伸缩振动, 1 215 cm-1谱峰可以归属为硌氨酸和苯丙氨酸的变化, 1 338 cm-1谱峰可以归属为氧合血红蛋白分子吡咯半环的对称伸缩振动, 1 429与1 587 cm-1谱峰可以归属为氧合血红蛋白分子乙烯基团对称伸缩的振动与反对称伸缩的振动。 导致鼻咽癌患者的氧合血红蛋白分子吡咯环、 乙烯基团等振动异常, 以及硌氨酸、 苯丙氨酸的变化原因比较复杂, 可能是由于患者鼻咽部发生癌变, 导致身体内蛋白质等多种物质的新陈代谢比较旺盛, 糖类以及氨基酸的消耗升高等原因造成。

3 结论

利用近红外激发表面增强拉曼散射光谱结合多变量统计分析法, 研究健康人与鼻咽癌患者血液中氧合血红蛋白, 结果发现两者存在较大的差异, 在氧合血红蛋白平均NIR-SERS光谱479、 817和1 587 cm-1处, 鼻咽癌患者的谱峰面积以及谱峰强度都明显小于健康人; 经过独立变量T检验与PCA分析法获得最显著差异的3个PCA得分: PC1、 PC3、 PC7, 并对这三个最具显著差异得分进行二维和三维散点图的主成分分析, 发现健康人与鼻咽癌患者可以划分至不同区域, 可以更进一步区分辨别出健康人与鼻咽癌患者。 根据归属对应分析, 发现鼻咽癌患者氧和血红蛋白分子吡咯环、 乙烯基团等振动异常, 硌氨酸和苯丙氨酸的变化也比较明显, 很有可能是人体鼻咽部发生病变, 导致身体内蛋白质等多种物质的新陈代谢比较旺盛, 糖类以及氨基酸的消耗升高等原因造成。

综上所述, NIR-SERS技术在近红外区域具有减少来自水和生物组织的背景干扰、 更深的组织穿透和减少光损伤等优点。 通过将近红外激发与SERS底物相结合, 可以实现对复杂样品(如生物组织或体液)中分析物的敏感和选择性检测。 利用近红外激发表面增强拉曼散射光谱结合多元化统计分析法有可能准确、 有效、 快速地区分健康人与鼻咽癌氧合血红蛋白样本, 为后续NIR-SERS光谱技术在鼻咽癌或其他医学研究提供初步的实验依据, 更有望发展成为鼻咽癌筛查以及临床诊断的辅助新器具。

参考文献
[1] Chan K C A, Woo K S J, King A, et al. The New England Journal of Medicine, 2017, 377: 513. [本文引用:1]
[2] Zhu Qianying, Zhao Gexin, Li Yan, et al. Medcomm, 2021, 2(2): 175. [本文引用:1]
[3] Daniela Jicman, Elena Niculet, Mihaela Lungu, et al. Experimental and Therapeutic Medicine, 2022, 23(2): 136. [本文引用:1]
[4] Luo Weiren. Theranostics, 2023, 13(5): 1607. [本文引用:1]
[5] Erkan Topkan, Efsun Somay, Busra Yilmaz, et al. BMC Cancer, 2023, 23: 651. [本文引用:1]
[6] Chen Yupei, Anthony TC Chan, Quynh-Thu Le, et al. Lancet , 2019, 394: 64. [本文引用:1]
[7] Stacey Laing, Lauren E Jamieson, Karen Faulds, et al. Nature Reviews Chemistry, 2017, 1(8): 0060. [本文引用:1]
[8] Zhang Yuying, Mi Xue, Tan Xiaoyue, et al. Theranostics, 2019, 9(2): 491. [本文引用:1]
[9] Li Yangyang, Wei Qiaolin, Ma Fei, et al. Acta Pharmaceutica Sinica B, 2018, 8(3): 349. [本文引用:1]
[10] Dai Xin, Fu Wenhao, Chi Huanyu, et al. Nature Communications, 2021, 12: 1292. [本文引用:1]
[11] Judith Langer, Dorleta Jimenez de Aberasturi, Javier Aizpurua, et al. ACS Nano, 2020, 14: 28. [本文引用:1]
[12] GAO Fei, XIONG Yang, ZHANG Ming, et al(高飞, 熊洋, 张明, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2017, 37(2): 441. [本文引用:1]
[13] Abe M, Kitagawa T, Kyogoku Y. The Journal of Chemical Physics, 1978, 69(10): 4526. [本文引用:1]
[14] Geβner R, Winter C, Rösch P, et al. ChemPhysChem, 2004, 5(8): 1159. [本文引用:1]