不同温度的牛血清白蛋白的太赫兹光谱研究
谈宏莹
燕山大学, 河北 秦皇岛 066004

作者简介: 谈宏莹, 1979年生, 燕山大学教师, 博士 e-mail: sumeertree@163.com

摘要

利用太赫兹时域光谱技术, 测量了加热到298, 308, 328和348 K的牛血清白蛋白(BSA)固体样本的低频光谱, 测量过程中获得了BSA样本的折射系数曲线、 吸收系数曲线。 由于BSA样本的THz折射系数和吸收系数光谱曲线存在重叠现象, 采用主成分分析法对BSA样本的折射系数、 吸收系数、 复介电系数虚部及介电损耗角正切, 共四个太赫兹光谱参数进行分析, 发现样本未变性前, 介电损耗角的正切与牛血清白蛋白样本的温度最相关, 相关系数达到99.76%。 采用模糊聚类方法区分变性前后的BSA固体样本, 建立不同温度的BSA模糊识别模型, 发现可以将未变性的样本与已经变性的样本区分开, 为检测不同温度蛋白质特性的太赫兹光谱法提供新的途径。

关键词: 太赫兹时域光谱; 牛血清白蛋白; 主成分分析; 模糊聚类; 模糊识别
中图分类号:O433.4 文献标志码:A
Investigation of Bovine Serum Albumin at Different Temperatures by Terahertz Time-Domain Spectroscopy
TAN Hong-ying
Yanshan University, Qinhuangdao 066004, China
Abstract

As the temperature changes, the stability of bovine serum albumin (BSA) molecules’ interior structure may change. We measured the low frequency spectra of BSA’s solid sample heated to 298, 308, 328 and 348 K based on the technology of Terahertz Time-Domain Spectroscopy. According to refractive index curve and absorption coefficient curve, the refractive index of samples at different temperatures changes obviously, showing that the interior structure of samples changes; as temperature goes up, samples’ absorptive capacity has an obvious increase, but the sample at 348 K has a sudden decrease in absorption coefficient on average, showing that the samples have a denaturation. At the main time, using the theory of THz-TDS, we can get the relation that BSA’s imaginary part of dielectric coefficient and dielectric loss tangent change with frequency. Using Principal Component Analysis to reduce dimensionality, when the first three principal components reach to 98.69% of the amount of information of original data, we found that compared to refractive index, absorption coefficient, imaginary part of dielectric coefficient, dielectric loss tangent is most relevant to the temperature of the samples of BSA, with correlation coefficient reaching 99.76%. Combine PCA and fuzzy recognition, build BSA’s recognition models, and we gain a method to judge BSA’s temperature.

Keyword: Terahertz time-domain spectroscopy (THz-TDS); Bovine serum albumin (BSA); Principal component analysis (PCA); Fuzzy classification; Fuzzy recognition
引 言

太赫兹(Terahertz, THz)通常是指频率为0.1~10 THz范围内的电磁波。 许多小分子生物分子间存在氢键, 比如氨基酸的羟基或氨基, 而氢键的形成与分解对生物分子的结构改变起关键作用[1, 2]。 THz频段能够明显体现分子间氢键的能级变化[3]。 THz技术已经在生物分子, 如蛋白质领域开展一系列研究[4, 5]。 如Martin等[6], 在THz波段对水和状态下的溶菌酶进行研究, 分析其分子动力学模型。 Yamauchi等[7], 获得了α -D-乳糖-水合物和β -D-乳糖混合物的透射性THz波段实验曲线, 得到了THz光谱可对乳糖异构体含量进行区分的结论。 Nibali等[8], 利用太赫兹吸收光谱获得生物分子水化耦合过程的解释。 这些研究表明, 蛋白质分子的水合过程, 温度变化及构造变化能够得到THz波段明显的特征吸收。

牛血清白蛋白(bovine serum albumin, BSA), 是牛血清中分离的球蛋白, 经常用于生化、 遗传、 医药等领域研究。 BSA固体受温度影响较大, 在一般温度时, 蛋白质分子发生可逆性伸展; 而到高温时, 蛋白质分子将发生不可逆转的变性[9, 10]。 本文针对加热到298, 308, 328和348 K温度下的BSA样本, 进行了太赫兹时域光谱(Terahertz time-domain spectroscopy, THz-TDS)测试, 观察随着温度升高, BSA固体样本THz光谱的变化, 并通过相关光学参数计算模型获得几种不同光学参数曲线。 同时, 采用主成分分析(principal component analysis, PCA)、 模糊聚类(fuzzy classification)以及模糊识别(fuzzy recognition)的方法, 对BSA固体样本的温度与THz光谱参数的相关性进行分析, 并建立BSA固体样本模糊识别模型, 以区分变性前后的BSA固体样本。

1 理论背景

样品的THz透射光谱T(f)可以表示为样本的电场强度与参考信号的电场强度的比值, 即

T(f)=Esam(f)Eref(f)(1)

其中, Esam(f)和Eref(f)分别为待测样本和参考样本的THz电场强度。

根据Dorney和Duvvillaret提出的THz光学参数计算模型, 并对THz时域信号进行傅里叶变换, 得到透射光谱的频域表达式,

T(ω)=4n~b(1+n~b)2exp-jωdn~b-1c(2)

其中, n~b为样品的复折射系数; c为样本的浓度, d为样本的厚度。

将透射光谱表达式写作幅值和幅角形式, 即

T(ω)=ρ(ω)exp[-(ω)](3)

对应式(2)和式(3), 并且假设样品的辐射吸收很小, 可以得到样品折射系数nb(ω )、 吸收系数ab(ω )和消光系数kb(ω )的表达式[11],

nb(ω)=φ(ω)cωd+1(4)ab(ω)=2ωckb(ω)=2dln4nb(ω)ρ(ω)[nb(ω)+1]2(5)kb(ω)=ln4nb(ω)ρ(ω)[nb(ω)+1]2cωd(6)

在获得样品的复折射系数后, 可以进一步获得样品的复介电系数、 介电损耗角的正切等参数。 复介电系数可以表示为,

ε* (ω)=n~2(ω)(7)

物质的复介电系数随着电场频率变化形成介电谱。 介电谱反映了物质与电磁波相互作用。 蛋白质分子的THz介电谱, 表现出电磁场与分子转动作用、 振动作用之间的响应[2]。 而复介电系数的虚部ε ″通常与电场的弛豫现象相关[12], 其表达式为,

ε(ω)=2n(ω)k(ω)(8)

介电损耗角的正切反映了电磁能量转化时的能量损耗[14]。 由于温度引起蛋白质分子侧链的动态变化, 与介电损耗角的正切的变化相关。 介电损耗角的正切可以表示为,

tanδ=ε'(ω)ε(ω)(9)

其中, ε '为复介电系数的实部。

利用PCA方法可以将高维空间中的数据映射到低维空间中, 从而实现数据压缩。 该方法通过求解原数据标准矩阵的协方差矩阵, 来获得与原数据矩阵相关矩阵。 设新变量F是与原变量矩阵相关的数据矩阵, 利用式(10)可以计算新变量的协方差,

Var(F)=i=1n(Fij-F̅j)2n(10)

利用拉格朗日条件极值, 获得协方差矩阵的前m个特征值, 以及对应的特征向量。 一般地, 当前m个主成分累计方差贡献率大于等于85%时, 就可以用前m个主成分代替原数据。

为了获得未知样本的正确归类情况, 采用模糊聚类方式对样本数据进行聚类分析。 首先利用平移、 极差变换公式, 对原数据进行预处理,

x'ik=xik-min1iN{xik}max1iN{xik}-min1iN{xik}xik(11)

其中, k∈ 1, 2, …, M

接着计算样本间的相似程度, 常用的欧式贴近度公式为[13],

d(X, Y)=1-1ni=1n(Xi-Yi)2(12)

最后采用基于择近原则的间接模糊识别方法, 确定样本归属。 即通过最小值确定[14],

d(X, Y)=k=1md(Xik, Yik)(13)

2 实验部分

本文的仪器设备, 选用的是德国BATOP公司的光纤耦合方式的THz-TDS光谱仪。 光源采用钛蓝宝石激光源, 光谱测试范围为0.05~1.5 THz。 动态范围大于50 dB, 频谱分辨率≤ 10 GHz。 光源产生两束激光脉冲, 一束称为泵浦光, 通过激发光电导天线常数THz脉冲; 一束称为探测光, 透过样品获得透射光谱, 并通过晶体检波器获得检测波形。

样品状态为无定形冻干粉末, 纯度> 95%。 制备固体蛋白质样品时, 将样品在在真空干燥箱中干燥20 min, 并量出10 mg的干燥样品, 并置于10 MPa的红外压片机下压制, 压制成为直径为13 mm, 厚度约为1 mm左右的圆形薄片。 为增加检测精度, 采用多次测量, 制作BSA圆形薄片共40个。

采用加热箱, 将BSA样品依次加热到常温下(298 K), 308, 328和348 K的设计温度, 控制实验环境相对湿度在5%以内。 样品放置在密闭透明的测试箱内进行测试。 测试箱采用透明有机玻璃制成, 尺寸为20 mm× 15 mm× 5 mm。 测试箱采用恒温控制装置。 在测试前采用N2冲洗5 min测试箱。

3 结果与讨论
3.1 BSA的THz光学参数

样品测试频率范围在0.01~1.5 THz, 实验获得BSA样本分别在298, 308, 328和348 K的温度下的THz折射系数曲线和THz吸收系数曲线分别如图1和图2所示。

图1 不同温度下BSA的折射系数Fig.1 The refractive index of BSA at different temperatures

图2 不同温度下BSA的吸收系数Fig.2 The absorption coefficient of BSA at different temperatures

从图1可以看出, 在低频范围内(0~1.4 THz), 加热到348 K的BSA固体平均折射系数明显低于其他温度的BSA固体平均折射系数。 已知蛋白质加热时, 可能导致蛋白质的二级或三级结构解构, 而且随着加热温度的升高, 蛋白质分子中的α -螺旋和β -折叠结构将会被破坏, 形成无规则卷曲结构。 因此实验观察到348 K温度时, BSA固体的折射系数平均值明显降低, 固体样品发生了热变性。

如图2所示, 随着温度升高, BSA固体样本的平均吸收系数减小, 而加热到348 K(75 ℃)时的BSA样本平均吸收系数最小, 说明BSA的二级结构或三级结构正在解构。 实验现象和文献[15]中提到的BSA会在80 ℃左右的加热条件下发生不可逆的变性过程一致。

3.2 BSA的THz光谱主成分分析

由于不同温度的BSA固体在THz波段的特征谱线存在的关系, 采用PCA分析样品的吸收系数、 折射系数、 复介电系数的虚部ε ″(ω )和介电损耗角正切tanδ 。 收集40个样品的0.01~0.15 THz的各项参数, 并构造特征数据表。 利用PCA方法将使样品维数从240维下降到3维。 图3— 图6分别是吸收系数、 折射系数、 复介电系数的虚部ε ″(ω )和介电损耗角正切tanδ 经主成分分析后前3个主成分的三维的散点得分图。

图3 样品吸收系数的PCA得分三维散点图Fig.3 The absorption coefficient of PCA 3D scatter plot

图4 样品折射系数的PCA得分三维散点图Fig.4 The Refractive index of PCA 3D scatter plot

图5 样品复介电系数的虚部的PCA得分三维散点图Fig.5 The Imaginary part of dielectric coefficient of PCA 3D scatter plot

图6 样品介电损耗角的正切的PCA得分三维散点图Fig.6 The dielectric loss tangent of PCA 3D scatter plot

图3— 图6中前三个主成分的累计方差贡献率分别达到原数据变量信息的99.88%, 99.92%, 99.80%和98.69%, 说明前三个主成分可以代表原始光谱。 同时, 计算得到温度与吸收系数的相关系数、 折射系数、 复介电系数的虚部ε ″(ω )和介电损耗角正切值分别为r=0.349 9, 0.851 5, 0.908 1和0.997 6。

综上, 四种温度下40个样品的吸收系数、 折射系数、 复介电系数的虚部、 介电损耗角的正切tanδ 在经过PCA分析后可以彼此分开, 即PCA方法能够对BSA的THz光谱参数形成较强的相似特征聚类功能。 同时比较温度与这四个参数相关系数大小, 温度与介电损耗角的正切tanδ 的相关性最高。 不过, 显然介电损耗角的正切主成分分量没有其他三个参数的分量高, 只是这个数据量不影响其与温度的密切相关性。

3.3 待测BSA样本的模糊归类结果

为了识别变性后的BSA固体与未变性的BSA固体样本, 本文采用主成分分析与模糊识别方式结合, 建立BSA固体识别标准模型。 选用与温度相关性最高的介电损耗角的正切tanδ 的主成分PC1作为标准模型数据源。 事先准备4个待识别的BSA样本, 其中之一是加热到358 K的变性样本, 标准数据源分别用代号X1— X4表示, 待识别的BSA样本用Y1— Y4表示。 经过PCA运算和对同类结果的指标值求出算术平均数, 建立标准模型库如表1中, 同时列入的还有待识别样本。

表1 标准模型库 Table 1 Standard model library

利用平移、 极差变换进行数据标准化, 并采用欧式贴近度公式计算距离, 最后用择近原则确定待识别样本归属。 仿真结果如表2所示。

表2 仿真结果 Table 2 Results of fuzzy simulation

表2中可以看到, 经过仿真后, Y4样本与标准库中的X4样本有相同的属性, Y4样本是已经变性的BSA固体。 而实验前该样本已被加热到80 ℃, 可见仿真模型可以用来检测变性的BSA固体, 同时验证了PCA与模糊识别方式结合, 是定性分析不同温度BSA分子有效方法。

4 结 论

实验测量了BSA在不同温度条件下的THz透射光谱, 获得了吸收系数、 折射系数THz光谱参数, 并分析了BSA固体结构随温度变化决定谱线变化的内因。 利用提取THz光谱参数公式及介电光谱相关理论, 并根据PCA提取样本特征信息, 发现介电损耗角的正切与温度相关性最好。 结合PCA和模糊模式识别方法, 利用择近原则和欧氏距离法, 建立模糊识别模型。 该模型可以准确识别已经变性的BSA固体样本。 研究结果将对THz光谱在BSA温度与结构分析中提供帮助。

The authors have declared that no competing interests exist.

参考文献
[1] Kawaguchi S, Kambara O, Ponseca C, et al. Spectroscopy, 2010, 24(1): 153. [本文引用:1]
[2] Chen T, Li Z, Mo W. Spectrochimica Acta Part A: Molecular and Bimolecular Spectroscopy, 2013, 106: 48. [本文引用:2]
[3] Williams M R, Aschaffenburg D J, Oforiokai B K, et al. Journal of Physical Chemistry B, 2013, 117(36): 10444. [本文引用:1]
[4] Nickel D V, Delaney S P, Bian H, et al. Journal of Physical Chemistry A, 2014, 118(13): 2442. [本文引用:1]
[5] Woods K N. BMC Biophysics, 2014, 7(1): 8. [本文引用:1]
[6] Martin D R, Matyushov D V. Journal of Physical Chemistry Letters, 2015, 6(3): 407. [本文引用:1]
[7] Yamauchi S, Hatakeyam S, Imai Y, et al. American Journal of Analytical Chemistry, 2013, 4(12): 756. [本文引用:1]
[8] Conti N V, Havenith M. Journal of the American Chemical Society, 2014, 136(37): 12800. [本文引用:1]
[9] Simion A M, Aprodu I, Dumitrascu L, et al. Journal of Food Science & Technology, 2015, 52(12): 8095. [本文引用:1]
[10] Tian Z Y, Song L N, Zhao Y, et al. Molecules, 2015, 20(9): 16491. [本文引用:1]
[11] Redosanchez A, Salvatella G, Galceran R, et al. Analyst, 2011, 136(8): 1733. [本文引用:1]
[12] Sun Y, Zhang Y, Pickwellmacpherson E. Biophysical Journal, 2011, 100(1): 225. [本文引用:1]
[13] Chau D, Dennis A R, Lin H, et al. Current Pharmaceutical Biotechnology, 2016, 17(2): 200. [本文引用:1]
[14] Qi N, Zhang Z, Xiang Y, et al. Medical Oncology, 2015, 32(1): 383. [本文引用:2]
[15] Briere L A K, Brand t J M, Medley J B. Journal of Thermal Analysis & Calorimetry, 2010, 102(1): 99. [本文引用:1]