作者简介: 孙宇桐, 1999年生, 北京建筑大学测绘与城市空间信息学院硕士研究生 e-mail: 210813J121019@stu.bucea.edu.cn
古代彩绘颜料的分析是科技考古与文物保护研究的重要内容, 对探索古代颜料技术发展和科学保护文物有着重要的学术价值和现实意义, 传统的颜料识别算法大多针对彩绘文物表面的纯净颜料, 对文物表面存在混合颜料的识别准确度较差。 化学分析需要对壁画表面进行取样, 易造成损伤。 高光谱是近年来发展迅速的新兴技术, 在物质识别上具有广泛应用, 提出一种基于高光谱分区间的混合颜料识别方法。 首先, 将未知颜料反射光谱进行一阶导数计算, 根据未知颜料一阶导数曲线的“凸起”确定特征子区间范围, 若子区间数量大于2, 则只保留“凸起”最明显的两个特征子区间; 其次, 通过KM模型将反射率转换为更符合线性混合特征的吸收散射比( K/S), 在特征子区间范围内, 对未知颜料与标准颜料的 K/S曲线进行最大最小值归一化, 运用光谱角余弦结合归一化欧氏距离的方法计算未知颜料与标准颜料K/S曲线的相似度, 每个特征子区间保留相似度最高的前三个结果; 最后, 在每个特征子区间的识别结果中依次取出标准颜料 K/S曲线, 不同特征子区间所取出的标准颜料 K/S曲线两两组合成子区间识别结果集合, 再根据狄利克雷分布函数得到的丰度矩阵, 生成1 000条不同丰度的模拟混合 K/S曲线, 将模拟混合 K/S曲线与未知颜料 K/S曲线再次进行相似度计算, 每个区间识别结果均保留一个最高值, 所有集合保留值中再次取最高, 该值对应的区间识别结果集合中的标准颜料即为未知颜料的最终识别结果。 实验选取石青、 石绿、 石黄、 朱砂颜料制作纯净颜料样本, 并将四种纯净颜料两两混合制作六组混合颜料样本, 样本绘制完成后使用高光谱成像仪采集样本的成像数据, 通过预处理后使用上述方法进行特征子区间的提取与识别。 实验发现, 仅石绿和朱砂混合样本中的朱砂出现识别错误, 该方法对混合颜料样本识别结果良好, 整体识别率为83.3%。 结果表明该方法可以对混合颜料进行识别, 对文物颜料分析具有实践意义。
The analysis of ancient painted pigments is an important content of technological archaeology and cultural relics conservation research, which has important academic value and practical significance for exploring the development of ancient pigment technology and scientific conservation of cultural murals. Most of the traditional pigment identification algorithms are aimed at the pure pigments on the surface of painted cultural murals, whose identification accuracy is relatively poor for the mixed pigments on the surface of cultural relics. At the same time, chemical analysis methods usually require sampling of the surface of murals, which can easily cause damage. Hyperspectral technology is an emerging technology that has developed rapidly in recent years and has wide application in material identification. A method of mixed pigment identification based on hyperspectral intervals is proposed. Firstly, the first-order derivative of the reflectance spectrum of the unknown pigment is calculated, and the characteristic subinterval range is determined according to the “bump” of the first-order derivative curve of the unknown pigment. If the number of subintervals exceeds 2, only the two most obvious “raised” subintervals will be retained. Secondly, the reflectance curves of the unknown pigment and the standard pigment are transformed to the absorption-scattering ratio ( K/S) using the KM model, which aligns more with the linear mixing characteristics. These K/S curves are normalized to[0, 1] within the characteristic subinterval range. We calculate the similarity between the K/S curves of the unknown pigment and the standard pigments using the Spectral Angle Cosine combined with the Normalized Euclidean Distance. The top three results with the highest similarity for each characteristic subinterval are selected. Finally, one standard pigment K/S curve is removed from the identification results for each characteristic subinterval. Different standard pigment K/S curves from different characteristic subintervals are combined individually to generate the collection of subinterval identification results. They are combined with the abundance matrix obtained from the Dirichlet distribution function to generate 1 000 simulated mixed K/S curves. The similarity between the simulated mixed K/S spectra and the unknown pigment K/S curves is calculated again. We select one standard pigment with the highest similarity value in each collection. The similarity is compared again, and only the pigment with the highest value is identified as the final pigment for the unknown pigment spectra. The pure pigment samples were made by selecting Azurite, Malachite, Orpiment, and Cinnabar pigments. Six sets of mixed pigment samples were made by mixing pure pigments one by one. After the samples were drawn, the imaging data was collected by a hyperspectral imager. The feature subintervals are extracted, and the pigments are recognized by the proposed method after pre-processing. All the results were identified correctly except the Cinnabar in the mixed samples of Malachite and Cinnabar. The overall recognition rate for the mixed pigment samples is 83.3%. The results show that this method can identify mixed pigments and has practical significance for analyzing cultural relics pigments.
中国是拥有五千年悠久历史的文明古国, 在漫长的岁月中, 壁画是中华民族最绚烂多彩的遗产之一, 在人类绘画史上有着重要的地位。 任何一幅壁画都离不开五颜六色的颜料, 对壁画文物颜料识别有助于了解古代绘画的技艺水平, 对文物保护工作具有重要意义。 如何准确识别出壁画表面的颜料是文物修复面临的首要问题。
目前壁画颜料识别方法有很多, 例如化学分析法、 拉曼光谱(Roman spectroscopy, RM)[1]、 扫描电镜分析(scanning electron microscope, SEM)[2]、 X射线荧光光谱(X-ray fluorescence spectrometer, XRF)[3]、 X射线衍射(diffraction of X-rays, XRD)[4]、 偏光显微分析(polarized light microscopy, PLM)[5]和激光诱导击穿光谱(laser-induced breakdown spectroscopy, LIBS)等, 这些鉴别方法大多需要对文物颜料进行取样, 易造成损伤。 由于古代壁画具有不可再生性, 无损识别技术逐渐成为文物颜料识别的重要手段。 其中, 基于可见光近红外的高光谱技术, 凭借其设备的便携性、 检测无损性、 光谱信息丰富性等[6]优点, 成为当前文物颜料识别领域的研究热点之一[7]。
20世纪80年代成像光谱技术的出现, 推动了高光谱遥感的迅速发展[8]。 成像光谱技术能够同时获得文物表面的图像和光谱信息, 实现对文物颜料的快速、 无损识别, 受到了国内外学者的广泛关注。 例如, Polak等使用支持向量机对实验室制作的样品和两幅己知的赝品上某几种指定颜料的分布情况进行分析[9]; Berns利用光谱信息对梵高的画作颜料进行识别[10]; Balas等使用最大似然对文艺复兴时期的一幅名画的复制品进行颜料分类[11]; Fazlali等利用光谱的反切导数对彩绘艺术品的颜料进行识别[12]。
国内光谱颜料识别起步较晚, 但发展迅速。 如武峰强等采用光谱特征拟合法识别了一幅古画的4种颜料成分[13]; 王伟超等[14]将光谱信息散度与统计流形引入光谱识别, 提高了颜料识别的精度; 李淼鑫等[15]通过提取光谱的峰值和曲线变化趋势特征, 对莫高窟典型洞窟的壁画颜料进行了识别; 李德辉等[16]通过构建红色系文物颜料高光谱识别指数, 实现对各红色系颜料的快速区分。 上述方法通过光谱线性特征和单色光谱特征峰的移动可以判断颜料的色系, 但较难对颜料混合后的光谱进行分析。
混合颜料的识别一直是文物颜料研究的重点与难点。 樊诚总结了不同色系颜料的光谱特征, 发现不同色系颜料的光谱曲线均存在陡而直的上升边, 且相同色系颜料的上升边位置存在细微差异。 由于一阶导数表征曲线的斜率, 导数曲线上的“ 凸起” 域对应组分颜料反射率光谱的上升边, 且上升边对应的“ 凸起” 在导数曲线上适用于加和性原理。 据此, 基于团队建立的矿物颜料光谱库, 提出一种混合颜料光谱分区间识别方法, 通过混合样本光谱和模拟壁画光谱的特征分析和识别准则, 实现混合颜料的识别。
Kubelka-Munk(KM)模型由Kubelka和Munk于1931年提出[17], 适用于半透明或者不透明介质。 KM模型假设光线在传到介质表面时大部分被完全散射, 小部分在介质中继续传播, 且这两种运动方向都垂直于界面。 假设介质厚度无限大, KM模型的公式可简化为
式(1)中, R∞ 为光谱反射率, f(R∞ )为吸收散射比, K和S分别为吸收系数和散射系数。
根据KM理论, 吸收系数和散射系数适用于加和性原理。 混合物中的每个成分都有唯一确定的吸收系数和散射系数, 彼此独立, 互不影响。
颜料识别采用计算未知颜料K/S曲线与标准颜料K/S曲线的相似度实现。 常用的匹配算法包括基于波形特征的匹配、 基于光谱编码的匹配和基于统计指标的匹配。 本文结合颜料K/S曲线光谱角余弦算法与归一化欧氏距离算法, 对未知颜料K/S曲线进行识别。
1.2.1 相似度计算方法
(1) 光谱角余弦
光谱角余弦计算两条曲线的相似性, 是将K/S曲线看作是n维空间的向量, 两个向量的广义夹角越小, 光谱角余弦越接近1, 说明越相似。 对于具有n个波段的K/S曲线x=(x1, x2, …, xn)和y=(y1, y2, …, yn), 光谱角余弦定义为
$SAC\left( x, y \right)=\frac{\overset{n}{\mathop{\mathop{\sum }_{i=1}}}\,{{x}_{i}}{{y}_{i}}}{\sqrt{\overset{n}{\mathop{\mathop{\sum }_{i=1}}}\,x_{i}^{2}}\sqrt{\overset{n}{\mathop{\mathop{\sum }_{i=1}}}\,y_{i}^{2}}}$(2)
式(2)中, xi和yi分别为未知K/S曲线和标准K/S曲线在第i波段的数值, n为K/S曲线波段数, 光谱角余弦越接近1, 两条曲线的形状越相似。
(2) 归一化欧氏距离
归一化欧氏距离是从幅度计算曲线的相似性, 主要描述了K/S曲线之间幅值的差异。 归一化欧氏距离越小, K/S曲线之间相似度越大, 对于具有n个波段的K/S曲线x=(x1, x2, …, xn)和y=(y1, y2, …, yn), 归一化欧氏距离的数学定义为
$Ed\left( x, y \right)=\sqrt{\frac{\overset{n}{\mathop{\mathop{\sum }_{i=1}}}\,{{({{x}_{i}}-{{y}_{i}})}^{2}}}{n}}$(3)
1.2.2 光谱角余弦与归一化欧氏距离结合
将光谱角余弦进行翻转, (1-SAC)与归一化欧氏距离有相同的取值范围, 经过实验验证, 对光谱角余弦和归一化欧氏距离分别赋以0.6和0.4的权重识别效果最好, 光谱角余弦-归一化欧氏距离计算相似度的公式可表示为
式(4)中, dSAC, Ed(x, y)的取值范围为[0, 1], 匹配原则为“ 值越小, 光谱曲线越相似” 。
基于KM理论的光谱分段识别方法, 根据未知颜料光谱一阶导数曲线的“ 凸起” 提取未知颜料K/S曲线的子区间; 采用式(4), 计算子区间范围内未知颜料与标准颜料K/S曲线的相似度; 子区间识别结果相互组合, 结合丰度矩阵生成模拟混合K/S曲线, 计算与未知颜料K/S曲线的相似度得到最终识别结果, 具体步骤如下:
(1) 获取未知颜料与标准颜料的光谱数据并进行预处理, 运用式(1), 将未知颜料光谱与标准颜料光谱转换为K/S曲线;
(2) 对未知颜料光谱进行一阶导数计算, 导数曲线具有明显“ 凸起” 的部分, 视作特征子区间的光谱范围, 按照该范围提取出未知颜料K/S曲线的特征子区间, 用于后续的分段识别;
(3) 若子区间数等于1, 则认为未知颜料为纯净颜料, 在全波段范围内运用dSAC, Ed(x, y)计算未知颜料与标准颜料K/S曲线的相似度, 相似度最高的标准颜料视为识别结果, 跳转到第7); 否则, 则保留两个“ 凸起” 最明显的子区间, 在子区间范围内, 对未知颜料与标准颜料的K/S曲线进行最大最小值归一化计算, 并运用dSAC, Ed(x, y)计算未知颜料与标准颜料K/S曲线在区间范围内的相似度, 每个子区间的识别结果保留相似度最高的前三种颜料;
(4) 从区间Ⅰ 保留的识别结果(ResultⅠ ={a1, a2, a3}), 和子区间Ⅱ 保留的识别结果(ResultⅡ ={b1, b2, b3})中依次取出一种颜料的K/S曲线, 两两组合成包含9个元素的识别结果集合(U1={a1, b1}, U2={a1, b2}, …, U9={a3, b3});
(5) 根据狄利克雷分布函数得到2× 1 000维的丰度矩阵A, 与区间识别结果集合中的2条标准颜料K/S曲线生成1 000条不同丰度混合而成的模拟混合K/S曲线, 再次运用dSAC, Ed(x, y)计算未知颜料K/S曲线与1 000条模拟混合K/S曲线的相似度, 保留相似度最高值。
(6) 对区间识别结果集合中的9个组合元素均进行步骤(5)的运算, 在保留的9个相似度中再次取最高值, 对应集合中的标准颜料为混合颜料的组成成分。
(7) 给出颜料识别结果。
从颜料标准样本库中选用壁画中常见的石青、 石绿、 石黄和朱砂, 制作纯净颜料样本, 再将四种纯净颜料按50∶ 50的质量比两两混合, 制作六组混合颜料样本。 按照如下步骤制作样本: 取出适量明矾颗粒, 用冷水浸泡, 明矾颗粒膨胀透明后缓慢加入少量沸水, 用玻璃棒搅拌至明胶完全溶解; 将颜料粉末放入调色碟中, 用滴管将胶液少量多次滴入到调色碟, 同时用手指研磨搅拌, 直至胶液与颜料粉末混合均匀; 最后用笔刷蘸满颜料, 在宣纸上绘制4 cm× 4 cm的正方形。 图2和图3分别为制作的4组纯净颜料样本和6组混合颜料样本, 使用实验室构建的标准颜料光谱库对制作的颜料样本进行分析。 光谱库中的标准颜料来源于姜思序堂、 天雅、 金源阳光三个品牌, 通过文献查阅、 颜料分析专家咨询, 首批选用了壁画中常见的矿物颜料96种、 植物颜料6种、 合成颜料13种与樱花牌墨汁1种, 为了解粒径的不同对于光谱的影响, 矿物颜料中包含7种不同粗细程度的石青和石绿颜料, 以及3种不同粗细程度的朱砂颜料。 对选择的116种颜料均用刷子进行1次、 2次、 3次绘制, 分别得到三种不同厚度的颜料样本, 作为颜料识别的参考样本。
![]() | 图2 纯净颜料样本 (a): 石青; (b): 石绿; (c): 石黄; (d): 朱砂Fig.2 Pure pigment samples (a): Azurite; (b): Malachite; (c): Orpiment; (d): Cinnabar |
采用美国Themis Vision System公司的VNIR400H型高光谱成像仪, 单景画幅大小为1 392像元× 1 000像元, 光谱分辨率为2.8 nm, 可覆盖400~1 000 nm波长的光谱范围, 包含了可见光与近红外一共1 040个波段。 对样本进行成像数据采集, 进行白板校正及降噪预处理后, 提取出4组纯净样本和6组混合样本的光谱曲线, 如图4所示。
2.3.1 一阶导数
特征波段选择采用一阶导数方法, 可以去除部分噪声对目标光谱的影响, 并有助于突出光谱曲线在某波长处细微的变化。 若λ 为波长, R为反射率, 一阶导数可用式(5)表示为
$R\left( {{\lambda }_{i}} \right)'=\frac{\text{d}R}{\text{d}\lambda }=\frac{\ \ \ \ {{R}_{{{\lambda }_{i+1}}}}\ \ \ -\ \ \ {{R}_{{{\lambda }_{i}}}}\ \ \ \ }{ \Delta \lambda }$(5)
2.3.2 最大最小值归一化
最大最小值归一化是将每个点减去所在变量列的最小值后, 除以所在变量列最大值与最小值的差。 很多情况下, 由于外界光照强度的不同, 同种物质的K/S曲线存在尺度上的变化。 因此, 对数据进行最大值最小值归一化可以减小数据尺度差异过大带来的影响, 如式(6)
${{R}_{N}}=\frac{R\ \ \ -\ \ \ {{R}_{\text{min}}}}{\ \ \ \ \ \ {{R}_{\text{max}}}\ \ \ -\ \ \ {{R}_{\text{min}}}\ \ \ \ \ }$ (6)
式(6)中, R为原始数据, Rmin为数据最小值, Rmax为数据最大值, RN为最大最小值归一化的数据, 取值范围为[0, 1]。
一般用于壁画分析的成像光谱仪的光谱范围都在可见近红外波段, 波长大约为400~1 000 nm, 以石黄和朱砂的混合光谱为例, 混合颜料的反射率光谱和一阶导数曲线如图5所示。
从图5可以看出, 在混合颜料的一阶导数曲线上, 有两个明显的“ 凸起” , 即430~560和561~865 nm区域, 表征着石黄与朱砂的混合光谱在相应波段范围反射率明显上升, 之后保持大概稳定或缓慢上升。 在后续分区间的识别计算中, 根据未知颜料光谱一阶导数曲线的“ 凸起” 确定出各个子区间的范围。 六组混合颜料的特征子区间如表1所示。
![]() | 表1 混合颜料样本特征子区间 Table 1 Mixed pigment samples characteristics interval |
在400~1 000 nm范围内, 六组混合样本都可提取出两个子区间, 在子区间范围内, 对混合颜料和标准颜料的K/S曲线用式(6)进行最大最小值归一化处理, 再按式(4)对处理后的光谱进行相似度计算, 六组混合颜料的区间识别结果如表2所示, 其中加粗颜料是与混合颜料真值一致的识别结果。
![]() | 表2 混合颜料样本的区间识别结果 Table 2 Interval identification results of mixed pigment samples |
通过将子区间的识别结果与已知真值对比分析, 可知每个子区间的识别结果均至少包含一个真值, 证明子区间可以有效提取出混合颜料中纯净颜料的特征。
根据Bioucas-Dias方法等的[18], 利用区间识别结果集合与丰度矩阵, 由线性光谱模型得到模拟混合K/S曲线。 区间识别结果集合U的大小为2n, 其中n为波段数; 丰度矩阵A的大小为2× 1 000, 由狄利克雷分布函数得到。 以石黄和朱砂的混合样本为例, 根据每个区间保留的三种识别结果, 可以得到九个区间识别结果集合。 按式(4)对每个子集生成的1 000条混合数据与混合颜料的K/S曲线进行识别计算, 相似度取最大值。 石黄和朱砂混合样本九个区间识别结果集合保留的最大相似度如表3所示。
![]() | 表3 石黄朱砂混合颜料样本识别结果集合保留的相似度 Table 3 Similarity of retention of endmember subsets of Orpiment and Cinnabar mixed pigment samples |
通过对表3的分析可知, 在所有保留的相似度中, 包含石黄和朱砂的区间识别结果集合的相似度最高, 说明石黄和朱砂是混合样本组分颜料的可能性最大。 六组混合样本的识别结果如表4所示。
![]() | 表4 混合颜料样本的最终识别结果 Table 4 Final identification results of mixed pigment samples |
通过分析六组混合样本的识别结果可以发现, 除石绿朱砂混合样本, 其余五组混合样本均识别正确。
为了验证提出方法的有效性, 对包含混合颜料与纯净颜料的模拟壁画进行颜料识别。 识别点位分布如图6, 识别结果如表5, 将各个点位的识别结果与模拟壁画各个区域的真值对比, 除橙色区域3中的朱砂颜料外, 全部识别正确。
![]() | 表5 模拟壁画颜料识别结果 Table 5 Identification results of pigment in a mural |
采用提出的识别方法对六组混合光谱进行识别, 分析了特征子区间对光谱识别的影响, 并对模拟壁画表面的颜料进行识别, 验证所提方法的普适性。 结论如下:
(1) 不同色系颜料的光谱曲线在不同的位置存在陡而直的上升边, 相同色系颜料光谱曲线的上升边位置存在细微差异, 因此, 对颜料光谱曲线的上升边位置进行分析即可实现其成分识别。 由于一阶导数表征曲线的斜率, 导数曲线上的“ 凸起” 域对应组分颜料反射率光谱的上升边, 且对混合颜料的导数曲线进行分析时发现, 组分颜料反射率光谱上升边对应的“ 凸起” 在导数曲线上符合加和性;
(2) 提取未知颜料的特征区间后, 在区间范围内对未知颜料进行识别, 通过将区间的识别结果与真值对比, 发现每个区间的识别结果均能准确识别出混合颜料的组分颜料, 证明所提特征区间有效包含了混合颜料中组分颜料的特征;
与传统的颜料识别方法相比, 分区间的颜料识别方法可以提取出混合颜料中组分颜料的特征, 并针对所提取的特征进行识别, 但是少数纯净颜料的一阶导数曲线有两个及以上“ 凸起” , 在识别时容易出现将纯净颜料误识别出多种组分颜料的情况, 需要新方法对未知颜料进行判断, 确定未知颜料是纯净颜料或混合颜料后, 采用不同的方法对其进行识别, 提高识别的精度。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|