基于卷积神经网络的古陶瓷窑口甄别
孙合杨1, 周越1,2, 黎思佳1,2, 李丽1, 闫灵通1, 冯向前1,*
1.中国科学院高能物理研究所, 北京 100049
2.中国科学院大学, 北京 100049
*通讯作者 e-mail: fengxq@ihep.ac.cn

作者简介: 孙合杨, 1991年生, 中国科学院高能物理研究所副研究员 e-mail: sunhy@ihep.ac.cn

摘要

古陶瓷作为中华文化的瑰宝, 自古以来不仅在国内受到追捧, 在国外同样被视若珍宝。 伴随着古代商贸的进行, 中国古陶瓷遍布全球各地, 辗转流传被私人或博物馆收藏, 还有部分古陶瓷经墓葬发掘以及沉船打捞后被收藏于博物馆, 这类古陶瓷的产地溯源一直以来都是陶瓷考古的重点, 对于研究古代商贸和文化交流有重要的意义。 通过便携式数码显微镜、 分光光度计、 X射线荧光等方法对从越窑后司岙、 越窑寺龙口、 龙泉枫洞岩窑、 耀州窑发掘出土的青釉瓷样品进行分析测量, 获得了来自四个窑青釉瓷样品的微观气泡尺寸分布特征、 紫外可见近红外光谱特征、 釉的成分数据。 将来自四个窑青釉瓷样品的这三种特征作为变量建立卷积神经网络分类模型进行训练和验证, 结果表明青釉瓷的微观气泡尺寸分布特征、 紫外可见近红外光谱特征以及瓷釉成分数据均有效, 但是不同特征的分类准确率差异非常明显。 三十次随机划分训练集与测试集的模型训练平均准确率: 微观气泡尺寸分布特征模型为75%, 紫外可见近红外光谱特征模型为89.2%, 成分数据模型为92.1%, 成分数据模型准确率最高且训练集与测试集准确率相差最小。 将基于不同特征训练好的模型参数保存进行融合后再训练发现基于紫外可见近红外光谱特征的模型与基于微观气泡尺寸分布特征模型融合后准确率提升至93.7%, 而将三种特征的模型融合后准确率提升至最高的97.4%。 五折交叉验证的结果表明多种特征融合后的模型可以有效避免出现单一特征模型对越窑后司岙以及越窑寺龙口样品交叉错判数较多的情况。 综合来看基于卷积神经网络探索更多的古陶瓷有效分类特征对于实现古陶瓷的精准溯源是可行的。

关键词: 卷积神经网络; 气泡; 紫外-可见-近红外光谱; X射线荧光; 青釉瓷
中图分类号:O433.4 文献标志码:A
Identification of Ancient Ceramic by Convolution Neural Network
SUN He-yang1, ZHOU Yue1,2, LI Si-jia1,2, LI Li1, YAN Ling-tong1, FENG Xiang-qian1,*
1. Institute of High Energy Physics, Chinese Academy of Sciences, Beijing 100049, China
2. University of Chinese Academy of Sciences, Beijing 100049, China
*Corresponding author
Abstract

As a treasure of Chinese culture, ancient ceramics have been sought at home and abroad since ancient times. With the development of ancient commerce and trade, ancient Chinese ceramics spread worldwide and were collected by private individuals or museums. Some were collected in museums after being excavated from tombs and salvaged from sunken ships. Tracing the origin of such ancient ceramics has always been the focus of ceramic archaeology, which is of great significance to studying ancient commerce and cultural exchanges. Using a portable digital microscope, spectrophotometer, X-ray fluorescence and other methods, the celadon porcelain samples excavated from Housi'ao, Silongkou, Fengdongyan and Yaozhou kilns were analyzed, and the data of the microbubble size distribution characteristics, ultraviolet, visible near-infrared spectrum characteristics and glaze composition of the celadon porcelain samples from these four kilns were obtained. The convolution neural network classification model was established by using these three features as variables for training and verification. The results show that the microbubble size distribution features, ultraviolet, visible near-infrared spectral features and glaze composition data of celadon porcelain are effective, but the difference in classification accuracy is very obvious.The average accuracy of model training of 30 randomly divided training sets and test sets: the model of microbubble size distribution features is 75%, the model of ultraviolet, visible near-infrared spectrum features is 89.2%, and the model of component data is 92.1%.The accuracy of the glaze composition data model is the highest, and the difference between the accuracy of training sets and test sets is the smallest. After saving the model parameters trained based on different features for fusion and retraining, it was found that the accuracy of the model after the fusion of ultraviolet, visible and near-infrared spectral features and microbubble size distribution features was improved to 93.7% and the accuracy of the model after the fusion of the three features was improved to the highest 97.4%. The results of the five-fold cross-validation show that the model, after the fusion of multiple features, can effectively avoid the case that the single feature model has many cross misjudgments on the samples from Housi'ao and Silongkou. In general, it is feasible to explore more effective classification features of ancient ceramics based on convolutional neural networks to trace the source of ancient ceramics accurately.

Keyword: Convolutional neural network; Bubble; UV-visible near infrared spectroscopy; X-ray fluorescence; Celadon
引言

中国古陶瓷一直以来都被视为是实用器与艺术的完美结合, 作为中国古代灿烂文化的载体, 具有极高的艺术价值和经济价值。 不仅在中国历朝历代受到追捧, 经由丝绸之路和海上丝绸之路被销往海外各国后, 更是享誉全世界。 贸易的繁荣使得中国各窑厂生产的陶瓷在全世界范围内流通。 纵观中国古陶瓷史, 各个窑场并不是孤立存在, 他们彼此之间或多或少会在烧制工艺以及产品风格类型上互相影响, 从古至今出于各种目的对于一些典型名窑的模仿更是从未停止过。 这些原因使得对流传至今的古陶瓷溯源、 断代极为困难。 在中国古陶瓷研究飞速发展的这几十年间, 除了烧制工艺[1]、 呈色机理[2, 3, 4]以及微观结构[5, 6, 7]等方面的研究外, 不同窑口产品对比、 同一窑口不同年代产品特征对比等产地溯源和年代甄别方面的研究一直都是重点[8, 9]。 由于古代窑场在制瓷时大多就地取材, 不同地域窑场所获取当地原料中各种元素的所占比例存在差异, 制瓷工艺的不同尤其是对于原料的处理不同也会造成陶瓷原料中元素含量的差异, 这些最终体现在烧制完成的古陶瓷中各种元素的含量不同, 基于此元素分析被广泛应用于不同窑口古陶瓷的甄别中。 在几种能元素定量分析的方法中, X射线荧光(XRF)由于其快速无损的特点被广泛应用于古陶瓷的产地窑口甄别中。 此外古陶瓷微观特征对于分类是否能够在溯源分类中起到作用一直以来也是人们关注的问题。 近年来光谱技术的发展使得紫外-可见-近红外光谱技术也开始逐渐应用于陶瓷分析中, 尤其是釉中不同价态金属元素对各个波段光的吸收研究, 而将其应用于古陶瓷甄别的相关研究也有进展[10]。 各种机器学习方法的成熟, 也使得处理大量数据、 提取不同特征、 准确分类成为可能[11]。 目前关于古陶瓷窑口甄别的研究多为通过改进算法来提高准确率。 本文以四个窑所生产的青釉瓷为研究对象, 将卷积神经网络应用于古陶瓷窑口甄别, 探索将古陶瓷紫外-可见-近红外光谱、 数码显微镜等可无损获取的古陶瓷特征应用于古陶瓷甄别的可行性, 并将其与XRF测得的成分数据融合, 建立多特征古陶瓷甄别模型, 来提高准确率。

1 实验部分
1.1 样品和数据采集

选取来自耀州窑、 龙泉枫洞岩窑、 寺龙口窑、 后司岙窑四个窑址所出土的106个古陶瓷样品(典型代表样品如图1, 样品信息如表1), 其中寺龙口窑、 后司岙窑同属越窑直线距离约3 km。 样品化学成分在美国EDAX 所生产的Eagle Ⅲ 型能量色散X射线荧光(EDXRF)光谱仪上完成测量, 共采集光谱106条, 典型光谱图如图2(a)。 所有样品的测量均在相同的实验条件下进行, 电压为40 kV, 电流为100 mA, 初级X射线束斑为1 mm。 所有古陶瓷样品的紫外-可见-近红外光谱数据均在Agilent Cary5000分光光度计上完成测量, 测量波长范围是200~2 500 nm, 间隔为1 nm, 扫描速度为600 nm· min-1, 共采集光谱126条。 采用Dino-lite AM4113便携式数码显微镜以约215倍的放大倍数对古陶瓷微观气泡特征进行图像采集, 每个样品不同位置采集4张图像, 来自龙泉枫洞岩窑典型代表样品釉中气泡的微观图像如图2(b)。

图1 越窑后司岙(a)、 龙泉枫洞岩窑(b)、 耀州窑(c)以及越窑寺龙口窑(d)典型代表样品Fig.1 Typical samples of Housi'ao Kiln (a), Fengdongyan Kiln (b), Yaozhou Kiln (c) and Silongkou Kiln (d)

表1 样品信息表 Table 1 Sample information

图2 典型样品的XRF光谱图和气泡特征图Fig.2 X-ray fluorescence spectra and microscopic image of typical samples

1.2 数据预处理

由于古陶瓷釉属于玻璃基质, 而玻璃在紫外-可见-近红外光谱曲线中的紫外波段吸收强烈, 信号受到的干扰因素多, 因此如图3(a)所示曲线平滑性差, 存在剧烈跳变, 噪声多等现象。 根据紫外波段光谱特点采用临近点比较法设置合理阈值对剧烈跳变点进行处理, 并结合临近点比较法设置宽度为15的窗口对紫外波段进行平滑以降低噪声提高信噪比, 并采用标准正态变换(SNV)来进一步消除由光程变化以及表面散射等因素带来的影响, 处理后的光谱如图3(b)所示, 噪声得到明显抑制, 将处理后的光谱数据作为模型训练的变量。

图3 典型样品紫外可见近红外光谱图Fig.3 UV-Vis-NIR spectrum of typical samples

对于X射线荧光光谱而言, 光谱中各元素特征峰的净峰面积与含量存在明确的对应关系, 以实验室研制的古陶瓷标准样为参考, 对仪器进行古陶瓷成分分析精准定量的标定, 并以此为基础解出古陶瓷中各种成分(Al2O3, SiO2, P2O5, K2O, CaO, TiO2, MnO, Fe2O3, Rb2O, SrO)的含量作为输入模型的变量。 对数码显微镜采集的古陶瓷微观图像中气泡的尺寸进行测量, 由于采集图像的放大倍数有所差别(主要集中于210~220倍), 图像所代表的实际面积并不相同, 对小气泡(半径小于0.1 mm)数量影响较大因此将不同尺寸区间(如0.05~0.06 mm)气泡数占总气泡数量的百分比作为特征, 而大气泡(半径大于0.1 mm)数量受放大倍数影响小, 因此将其在不同尺寸区间(如0.1~0.125 mm)内的数量作为特征进行模型训练。

1.3 样品集划分和建立模型

建模方法采用的是卷积神经网络(CNN), CNN是一种带有卷积计算的深度神经网络, 通过局部感受野、 权值共享、 池化层等来减少网络的参数个数, 缓解模型的过拟合问题。 将样品数据按照7∶ 3的比例划分为训练集和验证集对模型结构和参数进行优化, 对不同单一特征以及多特征模型进行了30次不同随机训练集和验证集划分的模型训练, 最后以五折交叉验证法对模型预测具体类别的效果进行评估, 其中模型的搭建、 训练与评估都是基于Python 3.7实现的。

2 结果与讨论
2.1 古陶瓷单一特征CNN模型

以气泡特征为基础的卷积神经网络模型30次训练结果如表2, 训练集平均精准度为75.0%, 验证集平均精准度为70.4%, 图4(a)是其中一次的训练结果, 训练集与验证集均收敛, 这说明古陶瓷微观气泡尺寸分布特征是一个有效的分类特征, 但是有效性不强。 五折交叉验证的混淆矩阵如图5(a)所示对于邻近窑址的寺龙口和后司岙样品错分比例较高。

表2 卷积神经网络30次训练准确率 Table 2 The results of training the CNN model 30 times

图4 古陶瓷单一特征模型
(a): 微观气泡特征; (b): 紫外可见近红外光谱特征; (c): 釉成分特征
Fig.4 Single feature model of ancient ceramics
(a): Microscopic bubble characteristics; (b): UV-visible near-infrared spectral characteristics; (c): Glaze composition characteristics

图5 古陶瓷单一特征模型混淆矩阵
(a): 微观气泡特征; (b): 紫外可见近红外光谱特征; (c): 釉成分特征
Fig.5 Confusion matrix for single feature model of ancient ceramics
(a): Microscopic bubble characteristics; (b): UV-visible near-infrared spectral characteristics; (c): Glaze composition characteristics

基于紫外-可见-近红外光谱数据的CNN模型30次训练平均准确率为89.2%验证集平均准确率为82.5%, 其中一次的训练结果如图4(b)所示, 与气泡特征相比紫外-可见-近红外光谱特征对分类准确率更高, 五折交叉验证的结果[图5(b)]也表明模型对于不同窑的分类准确率都有提升, 但对于邻近窑的后司岙和寺龙口样品分类错误率也是较高。

基于古陶瓷釉成分的CNN模型30次训练平均准确率达到了92.1%, 验证集平均准确率也达到了90.6%, 训练集与验证集的分类精准度相差更小。 具体一次的训练结果[图4(c)]较前两种模型收敛更迅速, 综合来看单一化学成分特征对古陶瓷分类最为有效, 五折交叉验证结果[图5(c)]中对于邻近窑样品的分类精准度有提升。

2.2 古陶瓷多特征CNN模型

以训练好的气泡特征、 光谱特征、 成分特征模型为基础进行融合, 将模型对应参数导入, 冻结相应部分, 添加分类层进行再训练。 气泡尺寸分布与紫外可见近红外光谱两种特征的模型进行融合时, 分类精准度达到了93.7%, 验证集精准度也达到了91.4%, 这比精准最高的单一成分特征模型效果更优。 将气泡、 紫外可见近红外光谱以及成分这三种特征的模型融合时, 训练集与验证集平均准确率高达97.4%与94.2%, 如图6所示由于融合模型是在原有训练好的模型基础上再训练, 因此收敛迅速, 图7多特征融合模型混淆矩阵对比单一特征模型混淆矩阵, 总体分类准确率有明显提升, 对邻近窑址的样品也能达到精准溯源分类的水平。

图6 多特征融合模型
(a): 气泡特征与紫外可见近红外光谱特征的模型融合; (b): 气泡特征、 紫外可见近红外光谱特征、 釉成分特征的模型融合
Fig.6 Multi-feature fusion model
(a): Model fusion of bubble characteristics and UV-Vis near-infrared spectral characteristics; (b): Model fusion of bubble characteristics, UV-Vis-NIR spectral characteristics and Glaze composition characteristics

图7 多特征融合模型混淆矩阵
(a): 气泡特征与紫外可见近红外光谱特征的模型融合; (b): 气泡特征、 紫外可见近红外光谱特征、 釉成分特征的模型融合
Fig.7 Confusion matrix of multi-feature fusion model
(a): Model fusion of bubble characteristics and UV-Vis near-infrared spectral characteristics; (b): Model fusion of bubble characteristics, UV-Vis-NIR spectral characteristics and Glaze composition characteristics

3 结论

基于不同的古陶瓷特征建立了卷积神经网络分类模型, 结果表明: (1)古陶瓷气泡尺寸分布特征、 紫外可见近红外光谱特征、 成分特征均是有效特征, 但是基于不同特征的模型分类准确率方面: 成分特征> 紫外可见近红外光谱特征> 气泡尺寸分布特征; (2)多种有效特征融合能有效提升分类精度, 分类特征越多准确率越高。 综合来看, 探索和量化更多的古陶瓷特征结合卷积神经网络建立分类模型对于实现古陶瓷精准溯源是可行的, 尤其是对于同一地区近邻窑址样品的区分, 这对沉船打捞或墓葬出土古陶瓷的产地精准溯源有重要意义。

参考文献
[1] Wood N, Li He. Archaeometry, 2015, 57(4): 617. [本文引用:1]
[2] Li Yuanqiu, Yang Yimin, Zhu Jian, et al. Ceramics International, 2016, 42(7): 8495. [本文引用:1]
[3] Shi Pei, Wang Fen, Wang Yi, et al. Ceramics International, 2017, 43(15): 11616. [本文引用:1]
[4] Wen Rui, Wang Dong, Wang Lihua, et al. Ceramics International, 2019, 45(8): 10589. [本文引用:1]
[5] Li Weidong, Luo Hongjie, Li Jianan, et al. Ceramics International, 2011, 37(2): 651. [本文引用:1]
[6] Jiang Xiaochenyang, Weng Yanjun, Wu Xiaohong, et al. Proceedings of the National Academy of Sciences, 2020, 117(12): 6446. [本文引用:1]
[7] Li Weidong, Li Jiazhi, Wu Jun, et al. Ceramics International, 2003, 29(8): 933. [本文引用:1]
[8] Wu Juan, Zhang Maolin, Hou Tiejun, et al. Ceramics International, 2015, 41(5): 6851. [本文引用:1]
[9] Li L, Feng S L, Feng X Q, et al. Nuclear Instruments & Methods in Physics Research Section B-Beam Interactions with Materials and Atoms, 2012, 292: 25. [本文引用:1]
[10] Huang Jizhong, Guan Yepeng. Sensors, 2021, 21(4): 1318. [本文引用:1]
[11] Sun Shiliang, Cao Zehui, Zhu Han, et al. IEEE Transactions on Cybernetics, 2020, 50(8): 3668. [本文引用:1]