基于拉曼光谱成像技术的铁质文物锈蚀产物定量模型研究
程枭翔1, 吴娜2, 刘薇2,*, 王克青2, 李辰元1, 陈坤龙1, 李延祥1,*
1.北京科技大学科技史与文化遗产研究院, 北京 100083
2.中国国家博物馆文保院, 北京 100079
*通讯作者 e-mail: liuwei.nwu@163.com; liyanxiang@metall.ustb.edu.cn

作者简介: 程枭翔, 1997年生,北京科技大学科技史与文化遗产研究院硕士研究生 e-mail: chengxiaoxiang1997@163.com

摘要

铁质文物是我国文化遗产的重要组成部分。 由于化学性质较为活泼, 铁质文物易发生腐蚀劣化。 锈蚀产物对铁质文物的稳定性有较大影响, 因此判断铁质文物锈蚀产物的组成特征, 对于铁质文物稳定性评估具有重要意义。 以赤铁矿(α-Fe2O3), 磁铁矿(Fe3O4), 四方纤铁矿(β-FeOOH)三种铁质文物的锈蚀产物为研究对象, 采用拉曼光谱成像结合主成分回归法(PCR)和偏最小二乘法(PLS), 同时结合多种预处理方法, 构建了两组二元混合锈蚀(α-Fe2O3+Fe3O4, α-Fe2O3+β-FeOOH)的定量模型。 结果表明, 对于α-Fe2O3+Fe3O4二元体系, PCR和PLS算法构建模型的定量效果基本一致, α-Fe2O3和Fe3O4的PLS定量模型结果均表明, 一阶导数+Savitsky-Golay(S-G)平滑(9)条件下建模效果最好。 对于α-Fe2O3+β-FeOOH二元体系, PLS方法所构建模型优于PCR方法, α-Fe2O3和β-FeOOH的PLS定量模型结果均表明, MSC+S-G平滑(5)条件下建模效果最好。 研究结果为定量评估铁质文物锈蚀产物的化学稳定性提供了有效方法。

关键词: 拉曼成像; 铁质文物; 锈蚀产物; 定量分析; 偏最小二乘法
中图分类号:O657.37 文献标志码:A
Research on Quantitative Model of Corrosion Products of Iron Artefacts Based on Raman Spectroscopic Imaging
CHENG Xiao-xiang1, WU Na2, LIU Wei2,*, WANG Ke-qing2, LI Chen-yuan1, CHEN Kun-long1, LI Yan-xiang1,*
1. Institute for Cultural Heritage and History of Science & Technology, University of Science and Technology Beijing, Beijing 100083, China
2. Institute of Conservation, National Museum of China, Beijing 100079, China
*Corresponding authors
Abstract

Iron artefacts are important part of the cultural heritage in China. Due to the high activity of iron, iron artefacts are prone to corrosion and deterioration. Corrosion products greatly influence the stability of iron cultural relics. Therefore, determining the composition of iron corrosion products is significant for evaluating iron artefacts' stability. In this study, pure chemical reagents were used to simulate three types of corrosion products commonly found on iron artefacts, including hematite (α-Fe2O3), magnetite (Fe3O4), and akaganeite (β-FeOOH). Raman spectroscopic imaging, combined with Principal Components Regression (PCR), Partial Least Squares (PLS) and multiple spectral pretreatment methods, were applied to establish quantitative models for two sets of a binary mixture of standard corrosion samples (α-Fe2O3+ Fe3O4, α-Fe2O3+β-FeOOH). The results indicate that, for α-Fe2O3+Fe3O4 mixed standard samples, the model effects of PCR and PLS algorithms are not much different. The quantitative model results show that the best spectral processing method of PCR modeling is first derivative +Savitsky-Golay (S-G) smoothing (9). For α-Fe2O3+β-FeOOH mixed standard samples, the model constructed by the PLS method is superior to the PCR method. The best PLS modelling spectral processing method is MSC+S-G smoothing (5). The research results provide an effective method for quantitatively evaluating the chemical stability of corrosion products of iron artefacts.

Keyword: Raman imaging; Iron artefacts; Corrosion products; Quantitative analysis; Partial least square
引言

铁质文物在埋藏和保存过程中极易发生锈蚀, 生成铁的氧化物、 氢氧化物等不同种类的锈蚀产物, 从而对文物本体造成破坏, 导致铁质文物蕴含信息的损失。 由于不同铁锈具有不同的物理化学性质, 对铁质文物的稳定性所造成的影响不同, 研究铁质文物锈蚀产物的种类及其稳定性对铁质文物保存状况的评估及有效保护具有重要意义。

当前, 基于铁质文物锈蚀产物的稳定性评估, 主要有铁锈的形貌观察[1]、 锈蚀产物定性定量分析[2, 3, 4]、 铁锈阴离子的比值R'系数[2]、 腐蚀函数[3]、 铁锈电化学还原能力的稳定比S系数[4]、 铁锈的保护能力指数(protection ability index, PAI)[5]等方法。 拉曼光谱技术因其检测方式微损或无损、 检测方便快捷, 在铁质文物锈蚀鉴定中有广泛应用[6], 但以定性分析为主, 主要目的是获得锈蚀产物的种类和分布情况。 然而, 定性分析结果无法反映铁质文物表面不同种类锈蚀产物的含量及其比值, 且定性分析大都采用单点扫描, 对于铁质文物而言, 锈蚀产物具有非均匀分布且种类多样等特点, 单点扫描结果较难全面反映锈蚀情况。

近年来, 有学者尝试采用拉曼光谱对文物样品进行定量检测[7, 8, 9, 10, 11, 12], 主要采用了两种拉曼定量方法, 一种是将一系列参考样品按不同比例混合, 获得系列混合样品的拉曼光谱, 建立校正曲线, 然后根据校正曲线计算实验光谱中每一项的光谱贡献, 从而获得待测混合样品中每种组分的含量; 另一种是先获取一系列参考样品的拉曼光谱, 然后将实验混合光谱分解为单组分光谱的总和, 再将实验混合光谱与参考光谱的线性组合进行拟合, 从而计算出混合光谱中各成分的比例。 两种方法均可实现混合物的半定量分析, 但也存在一定的局限性。 第一种方法需要利用混合参考样品建立校正曲线, 混合物的均匀性对校正曲线有一定影响; 第二种方法可避免建立校正曲线, 但需开发和应用适当的光谱分解和拟合算法或软件。 在铁质文物锈蚀产物中, 赤铁矿(α-Fe2O3)是一种比较稳定的锈蚀产物[13], 一般为铁质文物腐蚀过程中生成的副产物; 磁铁矿(Fe3O4)是一种相对稳定的锈蚀产物, 但学者们对其在腐蚀过程中的作用有不同认识, 有学者认为Fe3O4本身是一种相对稳定的腐蚀产物, 但由于具有导电性, 在腐蚀过程中有促进作用, 因此不具有保护作用[13]。 也有学者认为, Fe3O4具有良好的致密性和较高的热稳定性, 对文物有一定的保护作用[14]。 四方纤铁矿(β-FeOOH)被普遍认为是一种不稳定且对腐蚀过程有促进作用的锈蚀产物[15]

本研究以α-Fe2O3、 Fe3O4和β-FeOOH三种最常见且稳定性不同的铁质文物锈蚀为对象, 将这3种锈蚀产物组成两组二元混合物(α-Fe2O3+Fe3O4, α-Fe2O3+β-FeOOH), 采用拉曼光谱成像分析并结合偏最小二乘法(partial least squares, PLS)和主成分回归法(principle component regression, PCR)建立两种二元混合锈蚀的定量模型, 为下一步评估铁质文物化学稳定性提供有效方法。

1 实验部分
1.1 样品

采用麦克林(MACKLIN)公司生产的化学纯物质三氧化二铁(Hematite, Fe2O3, 99.9%)和四氧化三铁(Magnetite, Fe3O4, 99%)作为标准样品, 模拟铁质文物锈蚀产物赤铁矿和磁铁矿。 在实验室条件下合成β-FeOOH[16], 模拟铁质文物锈蚀产物四方纤铁矿(Akaganeite)。

1.2 方法

1.2.1 混合样品制备

按照不同配比分别混合赤铁矿(H)+磁铁矿(M)和赤铁矿(H)+四方纤铁矿(A)形成两组二元混合物标样, 每组共21个系列样品, 其配比情况见表1。 每个混合标样使用玛瑙研钵对混合后的样品进行5 min充分研磨, 确保标样的均匀性; 然后将研磨后的混合标样在10吨压力条件下压片, 确保标样的平整度。

表1 α-Fe2O3+Fe3O4/β-FeOOH混合标样配比情况 Table 1 The proportions of α-Fe2O3+Fe3O4/β-FeOOH mixed standard samples

1.2.2 光谱分析及模型评价方法

采用Thermo Scientific公司的TQ Analyst软件对混合标样的拉曼光谱进行预处理, 并分别建立PCR和PLS定量模型。 采用4种光谱预处理方法: 标准正态变换(standard normal variate, SNV)、 多元散射校正(multiplicative signal correction, MSC)、 导数、 SG滤波(Savitzky-Golay filter, SG), 并调整预处理方法以找到最佳模型。 采用软件推荐的光谱范围和波段建模, 其中对α-Fe2O3+Fe3O4二元混合标样建模时选择的谱峰范围和波段分别为220~237、 280~310和398~411 cm-1, α-Fe2O3+β-FeOOH标样选择的谱峰范围和波段分别为223~238、 307~561和812~1 073 cm-1

模型构建的质量可以用校正决定系数r2, 校正均方根误差(root mean squared error of calibration, RMSEC), 预测均方根误差(root mean squared error of prediction, RMSEP), 交叉验证均方根误差(root mean squared error of cross-validation, RMSECV)进行评价。 校正决定系数越接近于1, 表示准确性越高; RMSEC越小, 表示模型构建的越好, 但不表示预测样品的好坏; RMSEP越小, 表示样品的预测性越好; RMSEC和RMSEP的值差异越小, 表明模型越稳定。 RMSECV越小, 表示PLS的主因子数选择最优。 通过以上评价指标, 可以评价模型构建的优劣性和稳定性。

1.3 仪器

采用Horiba LabRAM HR Evolution (Jobin Yvon)拉曼光谱仪, 光谱仪焦距为800 mm, 装有Olympus BX41共聚焦显微镜, 配备Mä rzhä userWetzlarSCANplus自动XYZ载物台(75 mm×50 mm), 采用多级激光功率衰减片和研究级大芯片尺寸空冷CCD, Nd∶YAG激光器, 发射波长为 473 nm, 600 mm-1光栅, 激光功率约为100 mW, ND Filter: 0.1%, 物镜为Olympus 20x MPLN和50x MPLN LWD。 对于H+M混合标样, 光谱仪采集使用Olympus 20倍物镜, 光谱采集范围为100~1 200 cm-1, 曝光时间为75 s, 采集次数为2次, 光谱分辨率约2 cm-1。 对于H+A混合标样, 采用Olympus 50倍物镜, 曝光时间为90 s, 其他条件不变。

2 结果与讨论
2.1 拉曼光谱成像分析

分别对H+M和H+A两组混合样品进行拉曼光谱成像分析。 为减少标样混合可能存在的不均匀性和单点采集带来的数据误差, 采用拉曼成像功能进行光谱采集。 采用拉曼仪器自动化的XY平台, 采集数据点数为25, 步长为80, 利用拉曼仪器软件中拉曼面扫生成平均谱功能得到所测25个数据点的平均谱图。 H+M和H+A的每个标样面扫采集的区域为350 μm×300 μm, 采集时间分别为1 h 02 min 11 s和1 h 15 min 47 s, 系列样品所得的平均谱图如图1和图2所示。

图1 21个标样拉曼面扫平均谱图[赤铁矿(H)+磁铁矿(M)]Fig.1 Raman mapping average spectra of 21 standard samples [Hematite(H)+Magnetite(M)]

图2 21个标样拉曼面扫平均谱图[赤铁矿(H)+四方纤铁矿(A)]Fig.2 Raman mapping average spectra of 21 standard samples [Hematite(H)+Akaganeite(A)]

其中出峰位置225、 292和408 cm-1为赤铁矿(Hematite, α-Fe2O3)的特征峰, 665 cm-1为磁铁矿(Magnetite, Fe3O4)的特征峰, 315、 397 cm-1为四方纤铁矿(Akaganeite, β-FeOOH)的特征峰, 三种物质的出峰位置与文献[17]一致。 从图中的局部放大图可以看出, 随着某种锈蚀产物含量的增加, 其相应特征峰的峰高也有所增加。

2.2 H+M二元混合物标样定量分析模型的建立

2.2.1 PCR处理的结果

主成分回归法(principal components regression, PCR)采用正交变换对一系列可能相关变量的观测值进行线性变换, 从而投影为一系列线性不相关变量的值, 这些不相关变量称为主成分(principal components), 可通过主成分的线性回归分析对样品进行预测[18]。 本实验采用TQ Analyst软件中的PCR功能, 结合几种预处理方法, 对21个标样建模, 并得出模型评价指标的值, 表2对比了不同组合预处理方法的H+M混合标样的定量模型结果。

表2 PCR算法下不同组合预处理方法的H+M混合标样定量模型结果对比(赤铁矿) Table 2 Comparison of quantitative model results of H+M mixed standard samples for different combination of pretreatment methods (hematite) by PCR algorithm

表2可知, 建立H+M混合物中赤铁矿的PCR模型时, 采用二阶导数+S-G平滑(5)处理效果最好, 校正集决定系数为0.986 5, 预测集校正系数为0.993 2, RMSEC和RMSEP分别为4.88和4.99。 对于固体混合粉末而言, 该建模效果较好(图3)。 在同等处理条件下, 混合标样中磁铁矿的PCR模型的校正集决定系数为0.986 5, 预测集决定系数为0.9932, RMSEC和RMSEP分别为4.88和4.99(图4)。

图3 赤铁矿PCR的建模效果图Fig.3 Modelling effect of hematite based on PCR

图4 磁铁矿的PCR建模效果图Fig.4 Modelling effect of magnetite based on PCR

2.2.2 PLS处理的结果

偏最小二乘回归(partial least squares regression, PLS)通过投影预测变量和观测变量到一个新空间来寻找一个线性回归模型, 是一种常用的多元定量校正的经典建模方法[19]。 采用PLS方法, 结合多种预处理方法, 用上述21个标样摸索构建最佳模型, 表3对比了不同组合预处理方法的H+M混合标样的定量模型结果。

表3 PLS算法下不同组合预处理方法的H+M混合标样定量模型结果对比(赤铁矿) Table 3 Comparison of quantitative model results of H+M mixed standard samples for different combination of pretreatment methods (hematite) by PLS algorithm

表3H+M混合物中赤铁矿的PLS模型可以看出, 采用一阶导数+S-G平滑(9)建模效果最好, 其校正集决定系数为0.992 8, 预测集决定系数为0.978 1, RMSEC和RMSEP分别为3.56和6.71, 建模效果如图5所示。 在同等条件下, 由磁铁矿的模型可知, 校正集决定系数为0.993 4, 预测集决定系数为0.971 8, RMSEC和RMSEP分别为3.50和7.91, 建模效果如图6所示。 对于赤铁矿和磁铁矿, 主因子数分别为3个和4个, 由RMSECV和主因子数的关系图可知, 使用相应的主因子数足够建立H+M的PLS模型(如图7和图8所示)。

图5 赤铁矿的PLS建模效果图Fig.5 Modelling effect of hematite based on PLS

图6 磁铁矿的PLS建模效果图Fig.6 Modelling effect of magnetite based on PLS

图7 赤铁矿的RMSECV与因子数的关系图Fig.7 RMSECV calculated for hematite modelling

图8 磁铁矿的RMSECV与因子数的关系图Fig.8 RMSECV calculated for magnetite modeling

2.3 H+A二元混合物标样定量分析模型的建立

2.3.1 PCR处理的结果

采用TQ Analyst软件中的PCR功能, 结合SNV、 MSC、 S-G平滑、 一阶导数、 二阶导数预处理方法, 对21个标样建模, 并得出模型评价指标, 表4中对比了不同组合预处理方法的H+A混合标样的定量模型结果。

表4 PCR算法下不同组合预处理方法的H+A二元混合标样定量模型结果对比(赤铁矿) Table 4 Comparison of quantitative model results of H+A binary mixed standard samples for different combination of pretreatment methods (hematite) by PCR algorithm

表4可以看出, 在无预处理条件下, 建模效果相对较好, H+A混合标样的赤铁矿和四方纤铁矿的PCR模型结果均显示: 校正集决定系数和预测集决定系数分别为0.984 3和0.927 6, RMSEC和RMSEP分别为5.25和13.1。 建模效果分别见图9和图10所示。

图9 赤铁矿的PCR建模效果图Fig.9 Modelling effect of hematite based on PCR

图10 四方纤铁矿的PCR建模效果图Fig.10 Modelling effect of akaganeite based on PCR

2.3.2 PLS处理的结果

同样采用TQ Analyst软件中的PLS功能, 结合几种预处理方法, 对21个标样建模, 得出模型评价指标的值, 表5对比了不同组合预处理方法的H+A混合标样的定量模型结果。

表5 PLS算法下不同组合预处理方法的H+A二元混合标样定量模型结果对比(赤铁矿) Table 5 Comparison of quantitative model results of H+A binary mixed standard samples for different combination of pretreatment methods (hematite) by PLS algorithm

表5H+A混合物中赤铁矿的PLS模型可以看出, 采用MSC+S-G(5)平滑处理的效果最好, 赤铁矿和四方纤铁矿的建模结果均显示为: 校正集决定系数和预测集决定系数分别为0.981 7和0.994 5, RMSEC和RMSEP分别为5.67和9.05。 建模效果分别见图11和图12所示。 赤铁矿和四方纤铁矿的主因子数均为7, 由RMSECV和因子数的关系图(图13和图14)可知, 使用7个主因子数足够建立H+A的PLS模型。

图11 赤铁矿PLS建模效果图Fig.11 Modelling effect of hematite based on PLS

图12 四方纤铁矿PLS建模效果图Fig.12 Modelling effect of akaganeite based on PLS

图13 赤铁矿的RMSECV和因子数的关系图Fig.13 RMSECV calculated for hematite modelling

图14 四方纤铁矿的RMSECV和因子数的关系图Fig.14 RMSECV calculated for akaganeite modelling

2.4 建模效果比对分析

对比上述实验结果(表3表5), 对于H+M二元混合物标样来说, 在同等预处理条件下, 采用PCR和PLS方法建立模型的r2大都在0.9以上, 在最优建模条件下, 采用PLS和PCR方法建立的模型的r2R2均大于0.97, RMSEC和RMSEP比值均较小, 所建立模型较为准确且稳定。 对于H+A二元混合标样而言, 采用PCR方法在最优条件下的模型, r2=0.984 3, RMSEC=5.25, 但R2和RMSEP相对较大; 采用PLS算法在最优条件下建立的模型, r2=0.981 7, RMSEC=5.67, 但R2=0.994 5, RMSEP小于PCR方法建立模型的RMSEP值。 对于H+A模型, PLS方法优于PCR方法。 相比两种二元混合物模型, H+M建模效果及模型稳定性较H+A相对好, 可能有两个方面的原因, 一是H+M混合物在20倍物镜下获得拉曼数据, 检测区域更大, 样品代表性更好; 二是四方纤铁矿晶体中结合一定量水分子, 在研磨制样的过程中, 摩擦产热可能会失去部分水分子, 从而影响标样的质量。

在同一预处理条件下, RMSEP的数值比RMSEC的数值大, 分析认为RMSEC反映的是校正集样本拟合程度的好坏, 是校正集样本的观测值和预测值之间差异大小的反映; 而RMSEP反映的是验证集样本的情况, 是验证集样本真实值和预测值之间差异大小的反映。 在采用校正集样本拟合模型时, 为了获得更好的精度, 预处理过程中选择了更多的参数, 对模型在校正集上可能表现良好, 但在新数据上的预测性表现却可能很差, 从而导致RMSEP的数值比RMSEC的数值更大。

值得注意的是, 除在PCR算法处理下的H+A二元混合标样之外, 相比未经过预处理的模型, 通过SNV、 MSC、 求导、 S-G平滑等多种预处理方法组合, 其r2都有所提升, RMSEC数值也相应减小, 表明经过预处理的建模效果都有所改善。

3 结论

采用拉曼光谱成像技术的铁质文物锈蚀产物定量模型建立, 通过对拉曼光谱预处理条件的摸索和建模效果的对比可得出, 主成分回归法(PCR)和偏最小二乘法(PLS)均可用于铁质文物二元混合锈蚀产物(α-Fe2O3+ Fe3O4, α-Fe2O3+β-FeOOH)的定量模型构建。 对于α-Fe2O3+ Fe3O4混合标样, PCR和PLS建模效果基本一致; 对于α-Fe2O3+β-FeOOH混合标样, 采用PLS算法建模效果最优。

结合多种预处理方法比单一方法的光谱预处理更有效。 在模型最优条件下计算锈蚀产物的含量, 可以获得不同锈蚀的含量比值, 进而可利用含量比值来初步判断锈蚀产物的稳定性, 为铁质文物保存状况的评估和有效保护提供了有效方法。

致谢: 感谢中国国家博物馆文保院张然副研究馆员在铁锈样品实验室合成时提供的有益指导和大力帮助。 北京科技大学科技史与文化遗产研究院博士研究生郑逸轩, 闫立润在论文写作中予以建议, 在此一并致谢。

参考文献
[1] Crampton D, Holloway K, Fraczek J, et al. Lowa. Dept. of Transportation Office of Bridges and Structures, 2013. [本文引用:1]
[2] Grousset S, Kergourlay F, Neff D, et al. Journal of Analytical Atomic Spectrometry, 2015, 30(3): 721. [本文引用:2]
[3] Dubois F, Mendibide C, Pagnier T, et al. Corrosion Science, 2008, 50(12): 3401. [本文引用:2]
[4] Venerand a M, Aramendia J, Bellot-Gurlet L, et al. Corrosion Science, 2018, 133: 68. [本文引用:2]
[5] LUO Rui, WU Jun, LIU Xin-long, et al(罗睿, 吴军, 柳鑫龙, ). Journal of Chinese Society for Corrosion and Protection(中国腐蚀与防护学报), 2014, 34(6): 566. [本文引用:1]
[6] Monnier J, Dillmann P, Legrand L, et al. British Corrosion Journal, 2013, 45(5): 375. [本文引用:1]
[7] Monnier J, Bellot-Gurlet L, Baron D, et al. Journal of Raman Spectroscopy, 2011, 42(4): 773. [本文引用:1]
[8] Betancur A, Pérez F, Correa M, et al. Optica Puray Aplicada, 2012, 45(3): 269. [本文引用:1]
[9] Reig F, Adelantado J, Moreno M. Talanta, 2002, 58(4): 811. [本文引用:1]
[10] Shashoua Y, Degn Berthelsen M B, Nielsen O. Journal of Raman Spectroscopy, 2006, 37(10): 1221. [本文引用:1]
[11] Salpin F, Trivier F, Lecomte S, et al. Journal of Raman Spectroscopy, 2006, 37(12): 1403. [本文引用:1]
[12] Daher C, Pimenta V, Bellot-Gurlet L. Talanta, 2014, 129: 336. [本文引用:1]
[13] Hœrlé S, Mazaudier F, Dillmann P, et al. Corrosion Science, 2004, 46(6): 1431. [本文引用:2]
[14] Aramendia J, Gomez Nubla L, Bellot Gurlet L, et al. Journal of Raman Spectroscopy, 2014, 45(11-12): 1076. [本文引用:1]
[15] Li Shengxi, Hihara L. Journal of The Electrochemical Society, 2015, 162(9): C495. [本文引用:1]
[16] Watkinson D, Emmerson N. Environmental Science and Pollution Research, 2017, 24(3): 2138. [本文引用:1]
[17] Das S, Hendry M. Chemical Geology, 2011, 290(3-4): 101. [本文引用:1]
[18] CHU Xiao-li(褚小立). Molecular Spectroscopy Analytical Technology Combined With Chemometrics and Its Applications(化学计量学方法与分子光谱分析技术). Beijing: Chemical Industry Press(北京: 化学工业出版社), 2011. 311. [本文引用:1]
[19] LIU Yan-de, JIN Tan-tan, WANG Hai-yang(刘燕德, 靳昙昙, 王海阳). Optics and Precision Engineering(光学精密工程), 2015, 23(9): 2490. [本文引用:1]