基于Res-CAE深度学习实现高光谱图谱融合的国画重建
朱世豪1, 冯洁1,*, 李欣庭1, 孙丽存1, 刘洁2, 袁娉1, 杨仁翔1, 邓红杨1
1.云南师范大学物理与电子信息学院, 云南 昆明 650500
2.云南省博物馆, 云南 昆明 650214
*通讯作者 e-mail: fengjie_ynnu@126.com

作者简介: 朱世豪, 1997年生,云南师范大学物理与电子信息学院硕士研究生 e-mail: 377938599@qq.com

摘要

针对传统颜色再现方法存在实验数据预处理复杂且依赖人为主观光谱特征选择、 光谱反射率数据空间信息利用缺失的问题, 本研究提出基于深度学习的高光谱数据立方体协同分析方法。 通过构建残差-卷积自编码器(Res-CAE)深度网络模型, 实现对高光谱数据空间维度与光谱维度的多维信息协同学习与联合重建。 选择CAVE高光谱数据集作为Res-CAE的训练集数据, 而后根据实验需要选择爱色丽24色标准色卡、 自制中国画色卡、 训练集中随机场景、 训练集外随机场景和某国画在国际照明委员会标准观察者环境下的高光谱数据这五个场景作为测试集数据来对Res-CAE的重建效果进行测试。 对于测试结果在光谱方面使用色差、 均方根差进行评价, 在图像质量方面使用峰值信噪比、 结构相似性指数等评价标准进行评价, 同时将Res-CAE的实验结果与双线性插值法、 主成分分析法和Res-CAE的消融实验进行实验结果对比。 从实验分析可得出Res-CAE在色差、 重建图象质量、 重建时间等方面要好于其他方法。 以爱色丽24色标准色卡为例, Res-CAE的重建平均色差为0.694 5, 平均均方根差为0.009 2, 平均峰值信噪比为35.923 0, 结构相似性指数为0.995 6。 实验证明, Res-CAE可以很好的应用在颜色重建方面。

关键词: 高光谱数据; 颜色重建; 光谱反射率重建; 深度学习
中图分类号:O433 文献标志码:A
Reconstruction of Chinese Paintings Based on Hyperspectral Image Fusion Using Res-CAE Deep Learning
ZHU Shi-hao1, FENG Jie1,*, LI Xin-ting1, SUN Li-cun1, LIU Jie2, YUAN Ping1, YANG Ren-xiang1, DENG Hong-yang1
1. School of Physics and Electronic Information, Yunnan Normal University, Kunming 650500, China
2. Yunnan Museum New Branch, Kunming 650214, China
*Corresponding author
Abstract

Traditional color reproduction methods often suffer from complex preprocessing steps and reliance on subjective selection of spectral features. Moreover, the exclusive use of spectral reflectance data neglects spatial information, limiting reconstruction to isolated color points rather than full scenes. To overcome these limitations, this study proposes a deep learningbased method using a Residual-Convolutional Autoencoder (Res-CAE) to jointly extract and reconstruct spatial and spectral features from hyperspectral data cubes. The Res-CAE model was trained on the CAVE hyperspectral dataset and evaluated across five testing scenarios: a standard 24-color chart (X-Rite), a custom Chinese painting color chart, in-training and out-of-training random scenes, and a real Chinese painting scene captured under CIE standard observer conditions. Evaluation metrics included color difference (Δ E00), root mean square error (RMSE), peak signal-to-noise ratio (PSNR), and structural similarity index (SSIM). Experimental results demonstrate that Res-CAE outperforms traditional methods, such as bilinear interpolation and principal component analysis (PCA), in both color fidelity and image quality. On the 24-color chart, the model achieved an average Δ E00 of 0.694 5, RMSE of 0.009 2, PSNR of 35.92, and SSIM of 0.995 6. These results validate the effectiveness of Res-CAE in high-fidelity color reconstruction from hyperspectral data, offering practical value for digital preservation of traditional Chinese paintings.

Keyword: Hyperspectral data; Colorrecon struction; Spectral reflectance reconstruction; Deep learning
引言

随着文化自信的不断增强, 我国对高质量展示优秀传统文化的需求日益迫切。 其中, 绘画艺术作为重要的文化载体之一, 具有深厚的历史与艺术价值。 由于古画历经岁月沉蚀, 加之传统保护技术的局限[1], 画体的颜料容易在光照下发生褪色, 画体的纸张在温度与湿度波动时容易引发墨裂、 纸卷等损害。 在此基础上如有清洗、 补笔、 翻裱不当等人为因素, 也有可能引起原墨或颜料层松动或扩散等进一步损害[2, 3]。 这些情况会导致古画的寿命大大缩短。 因此古画本体在巡展中面临较大限制。 如何利用数字化技术更精美、 真实的将中国书画艺术展示在游客面前已成为目前亟待解决的问题。

目前针对颜色重建问题主要可以分为两种类型: 一种是通过彩色数码相机采集画作的颜色信息再经过图像处理相关技术生成一幅RGB图像, 这种方法操作简单但无法避免同色异谱现象, 重建结果色差大且容易受到人的主观感受影响[4]。 为了避免同色异谱现象, 研究者提出了另一种方法: 通过光谱成像系统测出目标物体的颜色在各个波段的光谱反射率数据然后再通过一些反射率重建算法来对颜色进行重建[5, 6, 7, 8], 这种基于反射率重建的方式尽管对采集设备的要求较高, 采集过程复杂, 但精度高、 色差小, 因此逐渐在颜色重建中获得应用。

高光谱数据重建在艺术品数字化再现和颜色复原方面具有重要意义, 多数传统方法如伪逆法、 主成分分析法、 多项式扩展法和BP神经网络等[9]方法需要进行人为的光谱预处理与特征选择等步骤, 这些步骤在特征选择时无法避免实验者的主观因素, 并且数据集中在光谱维度忽视了高光谱数据的空间维度信息[9]。 近年来, 深度学习如卷积神经网络(convolutional neural network, CNN)、 U-Net等神经网络在高光谱图像处理中的应用取得显著进展[10, 11, 12, 13, 14]。 本文提出了一种结合残差块的卷积自编码器(residual-convolutional auto-encoder, Res-CAE), 充分利用高光谱数据的空间和光谱信息, 通过深度学习模型对国画作品的高光谱数据的三维信息进行协同重建, 探索如何更有效的发挥高光谱数据图谱合一的特性。

1 基于高光谱数据立方体的深度学习

深度学习有很多不同的模型, 根据实验目的不同具有不同的功能, 比如图像分类、 序列预测、 目标检测等[15, 16, 17, 18]。 本研究的目标是对高光谱数据立方体的空间和光谱反射率信息进行重建, 因此选择了卷积自编码器(convolutional auto-encoder, CAE)作为基础模型。 CAE不仅适用于图像重建任务, 还具备一系列适合本研究的特点[19, 20, 21]

2 实验部分
2.1 数据集与实验环境

为了满足深度学习训练对多场景和多特征数据的需求, 选用了公开的CAVE高光谱数据集作为训练集, 该数据集由哥伦比亚大学视觉实验室提供, 网址为: https://cave.cs.columbia.edu/people。 CAVE数据集包含205个高光谱场景, 每个场景具有31个光谱通道, 光谱通道的波长范围为400~700 nm, 每个光谱通道以10 nm为采样间隔, 每张图像的空间分辨率为512× 512像素。 测试集包含五个不同场景: 场景1, 标准的爱色丽24色色卡, 用以测试模型对标准颜色的还原能力。 场景2, 自制国画颜料色卡。 在书画作品修复过程中, 常需进行“ 全色” 处理, 即对缺失或褪色区域进行颜色复原。 传统中国书画在全色时通常使用两类颜料: 一类为矿物颜料(“ 石色” ), 另一类为植物颜料(“ 水色” )。 根据云南省博物馆工作人员介绍, 他们对一副完成全色的国画进行实际修复中主要使用藤黄、 赭石、 花青这三种颜料作为三原色进行配色。 因此, 本实验也选取这三种颜料, 依据Kubelka-Munk理论进行不同配比的调配色试验, 并以“ 红星棉料牌宣纸” 为基底, 制作用于中国画色彩研究的自制色卡, 旨在验证所建模型在特定艺术风格下的表现能力。 场景3, 训练集中的某个场景, 用于评估模型在训练数据中的重建效果。 场景4, 训练集外的一个场景, 测试模型在未知数据上的泛化能力。 场景5是一幅中国画在国际照明委员会(International Commission on Illumination, CIE)标准观察环境下使用高光谱相机拍摄的实景图, 旨在测试模型对真实拍摄画作的重建效果。 以上场景选择覆盖了从标准色卡到真实图像的多种情况, 确保评价指标能够全面反映重建模型在不同场景下的性能。 测试集的光谱范围为390~1 000 nm, 包含256个通道。 在实验中, 将测试集的波段重新调整至400~700 nm, 以10 nm为间隔采样, 同时将图像的空间分辨率标准化为512× 512像素。

训练时使用Adam随机梯度下降算法优化损失函数, 优于高光谱数据较大所以将batchsize设置为5, 学习率设置为0.000 1, 训练epoch设置为100。

2.2 方法

实验采用的深度学习模型是卷积自编码器(CAE), 经典的CAE由编码器(Encoder)、 解码器(Decoder)和瓶颈层(Bottleneck)这三部分组成。 本实验选择在经典的CAE基础上增加残差层(Residual)用以更好的学习高光谱数据中的空间信息, 文中对本实验使用的自编码器简称为Res-CAE。 Res-CAE整体网络架构和内部模块细节如图1所示。

图1 Res-CAE结构示意图Fig.1 Schematic diagram of the Res-CAE architecture

Res-CAE的编码器部分(Encoder)由三个递进的模块(Module1、 2、 3)组成, 每个模块内都由一个卷积层(convolutional layer, Conv)、 一个批量归一化层(batch normalization layer, BN)、 一个残差层(residual block, Res)和一个最大池化层(max pooling layer, Pool)组成。 由于我们的任务是对高光谱数据立方体的光谱信息与空间信息进行学习与重建, 所以通过多层卷积捕捉空间特征, 并将反射率信息和空间信息融合在特征提取过程中, 这样可以让卷积层捕捉到图像的局部特征信息如边缘信息、 纹理信息、 灰度特征等。 并且通过多个卷积层的堆叠可以使神经网络学习到更高级别的抽象特征。 而在卷积层之后的批量归一化层则承担了稳定模型训练的任务, 归一化层对该模块内的卷积层输出的数据进行归一化, 这可以减少内部协变量偏移, 从而加速训练过程, 使得模型的训练过程更加稳定。

残差层优化梯度传播确保模型不会因为网络过深而导致梯度消失, 保证复杂的光谱与空间特征在深层网络中的传递, 这会帮助卷积层更好、 更有效的学习和保留输入数据的图像信息和光谱信息。 最后, 该模块则通过池化层来对前面输出的特征进行降采样, 这会使得前面提取的特征数据进一步压缩, 让卷积核提取的特征图像尺寸减小, 从而让模型在训练过程中更专注于主要特征例如空间信息和光谱信息, 而不是噪声或者其他信息。 选则最大池化层作为我们的池化函数。 它可以帮助我们降低特征图的尺寸, 从而减小我们的计算量和内存占用, 同时增加特征的不变性(例如对平移、 旋转的鲁棒性)。

设计三个不同模块的原因在于每个模块在Res-CAE中的作用可以看作是逐层提取不同级别的图像特征, 随着深度的增加, 卷积核数量的增加反映了模型捕捉特征的复杂性在提升。 这种递增的设计有助于在前面的模块中捕捉基本的光谱与空间特征, 而在后续模块中结合和提炼这些光谱与空间特征, 从而得到更高级的表示。 最终形成一个高维压缩表示, 也就是瓶颈层。 这是Res-CAE中的关键信息表示部分, 代表了输入数据的核心特征。

解码器(Decoder)负责将编码器生成的低维特征重建回原始数据, 通常被视为编码器的逆过程。 通过逐层的反卷积(deconvolution, De-Conv)、 上采样(Upsampling)和非线性激活(rectified linear unit, ReLU)操作, 解码器逐步恢复特征图的空间维度, 最终输出重建内容。 在本实验中, 解码器与编码器的对称结构匹配, 同样由三个模块组成。 解码器模块的参数设计与编码器保持对称性。 例如, 解码器模块1的反卷积层输入参数设置与编码器模块3的输出一致, 输出参数则与编码器模块3的输入匹配。 这样确保了解码器模块能够逆向解码编码器的特征数据, 从而还原高质量的重建图像。 解码器模块2与模块3的结构与此类似, 使整个解码过程稳定且精确。 解码器尾部则由Relu激活函数作为解码器的最后输出层, 它负责对解码器输出的特征进行非线性变换。 Relu函数可以将线性输出映射到非线性空间, 增强网络的表达能力, 从而帮助网络学习输入数据中复杂的特征。 该部分称为输出层, 该部分将重建后的数据映射回与输入数据相同的形态和尺寸。

本文提出的残差卷积自编码器(Res-CAE)模型, 以残差块和卷积层为基础构建了一种高效的三维特征提取架构。 模型通过多层卷积捕捉空间特征, 并将反射率信息和空间信息融合在特征提取过程中, 使得高光谱数据的重建结果不仅在光谱精度上不弱于传统方法, 同时在图像边缘和细节上也更为丰富。 该模型不仅在在光谱维度上对高光谱数据进行学习, 也突破了传统方法在高光谱数据中空间维度信息使用不足的情况, 充分利用了空间维度信息, 提升了重建的整体质量。

3 结果与讨论
3.1 基于标准色卡的颜色重建质量评价

为了验证本实验所用的卷积自编码器在颜色重建任务中的有效性, 我们选择了爱色丽24色标准色卡以及其他不同场景进行颜色重建与可视化再现。 采用色差(Δ E00)与均方根差(root mean square error, RMSE)作为评价指标, 重建结果如图2与表1表2所示。 从图2中可以看出, 卷积自编码器重建的光谱反射率曲线与标准光谱反射率曲线趋势一致, 并没有出现额外的波峰或波谷。 表1的均方根差(RMSE)的平均值为0.009 05, 表明重建的光谱反射率曲线与真实值之间的差异较小, 显示模型能够准确捕捉光谱反射率的主要变化趋势。 这些结果显示出卷积自编码器能够有效拟合高光谱反射率数据, 使重建的光谱反射率接近原始光谱反射率, 实现了光谱维度上的高质量重建。

图2 部分重建色块的反射率曲线对比Fig.2 Comparison of reflectance curves for selected reconstructed color patches

表1 Res-CAE重建后的爱色丽24色色卡的色差与均方根差值 Table 1 Color difference and RMSE values for the X-Rite color checker 24 reconstructed by Res-CAE
表2 不同方法对爱色丽色卡重建后的色差值Δ E00 Table 2 Color difference values for the X-Rite color checker reconstructed by different methods

表1展示了Res-CAE对爱色丽24色标准色卡的重建效果, 其中包含每个色块的色差(Δ E00)和均方根差(RMSE)。 从数据分析可知, 在24个色块中最大重建色差值为1.088, 最小重建色差值为0.349, 分析造成不同色块重建色差差异的原因是在高光谱数据立方体的各个通道中应呈现不同的灰度值, 灰度值变化幅度大的可供给Res-CAE学习的特征多, 重建色差小; 灰度值变化幅度小的可供给Res-CAE学习的特征少, 重建色差大。 以色差最大的色块21(中性灰)和色差最小的色块16(黄色)为例, 中性灰在不同光谱通道下灰度变化小, 可供给模型学习的特征少, 重建后的色差较大; 黄色颜色鲜亮, 在不同光谱通道下灰度变化大, 可供给模型学习的特征多, 重建后的色差较小。 其他色块的色差均小于1, 其中21个色块的色差位于0.5至1之间, 另有2个色块的色差小于0.5, 整体平均色差为0.694 5。 根据CIE的色差评定标准, 普通人眼对于色差小于1的区域基本无法分辨, 对于色差在1~2的颜色差异, 仅有敏感个体在特定环境下才可能察觉到。 这表明Res-CAE模型在颜色重建方面的性能优异, 能够较好地还原色卡的真实色彩。

3.2 不同方法的颜色再现比较

为了验证Res-CAE在颜色重建任务中的优越性, 将其与三种其他重建方法进行了对比实验。 对比方法包括两种传统的重建方法: 主成分分析法(principal component analysis, PCA)和双线性插值法(bilinear interpolation, Bilinear); 以及一种不包含残差层与批量归一化层的卷积自编码器(ablation study-CAE, AS-CAE), 该卷积自编码器作为Res-CAE的消融实验加入其中, 用以对比评估残差层与批归一化层对模型性能的贡献。

图3是不同方法对爱色丽色卡重建后的色差柱状图与RMSE折线图。 图3(a)展示了各方法在爱色丽24色标准色卡上的色差表现。 观察图3(a)可以发现, Res-CAE的重建色差在多数色块上略高于AS-CAE和双线性插值法, 但优于PCA。

图3 不同方法对爱色丽色卡重建后的色差柱状图与RMSE折线图
(a): 色差柱状图; (b): RMSE折线图
Fig.3 Color difference bar chart and RMSE line chart of reconstructed the X-Rite color checker using different methods
(a): Color difference bar chart; (b): RMSE line chart

表2的定量结果可以得出, Res-CAE的平均色差为0.694 5, 而AS-CAE的平均色差为0.545 1。 虽然Res-CAE的平均色差略高于AS-CAE, 但在所有色块重建结果中, AS-CAE重建的色块19的色差大于1, 而Res-CAE重建的色块21的色差大于1。 在颜色测量中, 一般认为色差小于1时, 人眼是无法分辨出差异的。 因此, Res-CAE可以承担颜色重建任务。

表3 不同方法对爱色丽色卡重建后的均方根差值 Table 3 RMSE values for the X-Rite color checker reconstructed by different methods

实验中PCA的平均色差高达19.032 8。 我们可以通过重建后的反射率曲线来进一步理解这种误差产生的原因。 如图4所示, 该图展示了部分色块的反射率曲线。 观察反射率曲线可以发现, PCA重建后的高光谱反射率曲线在410、 550、 670和700 nm等波段出现了显著的尖峰和弯折, 这种误差的出现是因为PCA在重建高光谱数据时, 通常只选择协方差变化最显著的几个通道作为主成分。 这相当于仅选择了某几个波段的单通道图像, 之后通过这些波段数据来重建400~700 nm范围内的颜色信息, 这种选择类似于窄带滤波器, 导致颜色重建过程中只使用了少数几个波段, 而非宽带滤波器或多通道的高光谱数据。 因此, 这种波段覆盖的局限性导致颜色重建的失真和较大的色差。

图4 部分色块的反射率重建曲线Fig.4 Reconstructed reflectance spectra for selected color patches

对于双线性插值法, 其色差均为0。 这是因为双线性插值法在图像重建中是通过相邻像素点的数值来进行线性插值。 由于我们在颜色重建任务中将双线性插值的缩放系数设置为1, 这使得插值后的图像像素值没有变化, 因而重建出的色差为0。 然而, 双线性插值法的一个缺点在于计算时间较长。 由于该方法逐像素计算, 处理高光谱数据立方体所需的反应时间是Res-CAE的4~5倍。 因此, 尽管双线性插值法的色差表现优异, 但它在时间效率上显著劣于其他方法, 不适合作为高效的颜色重建方案。 表4列出了四种方法在测试集中的四个场景下的重建时间。

表4 不同方法重建高光谱数据立方体的时间(s) Table 4 Reconstruction times for hyperspectral data cubes using different methods (s)

在图3(b)中, 展示了不同重建方法对爱色丽色卡的均方根差(RMSE)值。 可以观察到, PCA的均方根差在多数色块上都明显高于Res-CAE和AS-CAE。 这一结果表明, PCA重建的反射率曲线与真实反射率曲线间存在较大的差异, 而Res-CAE和AS-CAE在重建后的反射率曲线与真实曲线的拟合效果上表现更佳。

从上述结果可以看出, 在色差、 均方根差和可视化效果方面, 双线性插值法的表现优于其他三种方法, 表明其在颜色重建任务中的精度非常高。 然而, 表4展示了各方法在多个场景下进行高光谱数据立方体重建的时间消耗情况, 也揭示了双线性插值法的主要缺陷: 重建时间过长。 双线性插值法的每个场景重建通常需要50~60 s, 计算量庞大, 导致实际应用中难以接受。 相比之下, PCA的重建时间仅需1 s左右, 但其色差显著偏大, 难以满足精度要求。 而Res-CAE和AS-CAE的重建时间虽然比PCA稍长, 但在图像重建质量上, Res-CAE显示出更佳的优势。 因此, 综合考虑精度和效率, Res-CAE在实际应用中更具优势, 因为它在保持高质量重建效果的同时, 具有相对合理的计算时间。

3.3 多场景下的重建图像质量评价

在本实验中, 除了色差等颜色重建指标的对比之外, 还对重建图像的整体质量进行了客观评价。 因为实验的目标不仅仅是对高光谱数据进行精确的颜色重建, 还希望将数字化的中国画能够更加真实地展现。

图像质量评价指标能够全面反映重建图像的视觉效果, 特别是在颜色之外的图像细节和结构方面的还原效果。 采用峰值信噪比(peak signal-to-noise ratio, PSNR)、 结构相似性指数(structural similarity index, SSIM)、 梯度幅值(Gradient Magnitude)、 边缘强度(Edge Strength)这四个指标来对重建图像进行质量评价。

为了保证实验的多样性和可靠性, 在测试集的五种不同场景下对重建效果进行了测试。 图5是不同场景重建图像的PSNR、 SSIM雷达图和边缘强度、 梯度幅值的热力图。 图5(a)、 (b)展示了不同场景中重建图像的PSNR和SSIM指标雷达图。 雷达图的不同方向分别代表不同的重建方法, 圆心表示评价指标的最小值(0), 半径越大的同心圆代表指标数值越高, 表明该重建方法的效果越好。 从雷达图可以直观地看出, 不同方法在各评价指标上的性能分布差异: AS-CAE在训练集内的场景(场景1和场景3)的客观指标表现较好, 但在未训练过的数据上, 由于AS-CAE网络结构相对简单, 其各项质量指标下降明显。 Res-CAE在所有场景中的各项质量指标均表现良好, 尤其是在未训练过的数据场景上也表现出色, 这说明Res-CAE具备更好的泛化能力。 PCA由于只提取了高光谱数据的少数主成分通道, 导致重建后的图像仅能还原少数波段的信息, PCA的图像质量指标表现较差。 双线性插值法的评价指标数值较为优异, 显示其在还原整体图像质量方面效果不错, 但因计算耗时过长, 限制了其实用性。

图5 不同场景重建图像的PSNR、 SSIM雷达图、 边缘强度和梯度幅值热力图
(a): PSNR雷达图; (b): SSIM雷达图; (c): 边缘强度热力图; (d): 梯度幅值热力图
Fig.5 Radar charts of PSNR and SSIM, heatmaps of edge strength and gradient magnitude for reconstructed images of different scenes
(a): PSNR radar chart; (b): SSIM radar chart; (c): Edge strength heatmap; (d): Gradient heatmap

图5(c)和图5(d)深入分析了高光谱数据立方体在不同方法下的细节还原效果: AS-CAE在训练集内的场景(如场景1和场景3)能保持较好的梯度幅值, 但在训练集外的数据中, 梯度幅值显著下降, 在边缘强度上也呈现出同样的下降趋势, 这反映出AS-CAE在细节还原上的明显不足。 Res-CAE则有效的利用了空间维度信息, 在各场景下都具备较好的细节还原能力, 尤其是在训练集外的场景中优于AS-CAE。 如场景4和场景5, 从图5(c)和图5(d)可以看到场景4原始数据的边缘强度为6.9, 梯度幅值为0.023, Res-CAE重建后的数据分别为6.8和0.023。 这说明Res-CAE在未训练过的数据上表现同样优异, 表明Res-CAE的卷积-残差结构充分学习了高光谱数据的空间维度信息。 PCA的细节还原能力较差, 原因是其方法仅重构了少数波段, 导致细节信息无法完整还原。 双线性插值法虽然在梯度幅值和边缘强度方面表现优异, 但由于计算耗时极大, 实际应用价值受限。

为进一步对比Res-CAE在细节还原方面的表现, 我们对边缘强度与梯度幅值两个细节评价指标进行了放大可视化展示, 如图6所示。 从图6(a)可以看出, 即便是在训练集内的场景, AS-CAE在边缘细节的表现上依然欠佳, 无法有效还原细节。 这进一步验证了AS-CAE结构在复杂场景中对细节保持的不足。 而对于Res-CAE, 虽然在客观指标(边缘强度与梯度幅值)上与双线性插值法和原始数据存在一些差距, 但通过放大细节部分的可视化比较, 可以看到Res-CAE在保留边缘和细节方面达到了良好的效果, 特别是在满足图像主观视觉需求的同时也具备较好的重建效率。

图6 场景3(a)和场景5(b)的重建细节比较Fig.6 Comparison of reconstruction details for scene 3 (a) and scene 5 (b)

4 结论

根据高光谱数据立方体含有三维的空间信息与光谱信息结合深度学习数据特征提取强与学习能力强的特点, 对如何发挥高光谱数据图谱合一的优点做出探索。 利用深度学习对高光谱数据进行颜色重建并提出一种实验方法: 残差-卷积自编码器(Res-CAE)。 在爱色丽24色标准色卡的颜色重建实验中, Res-CAE展示出优异的颜色重建性能, 证明其在高光谱数据立方体颜色重建任务中的有效性。 此外, 考虑到本实验的目标是对中国画进行数字化再现, 我们没有停留在颜色重建的层面, 还进一步对Res-CAE重建后的高光谱数据立方体的图像质量和细节表现进行了评估和对比。 从图像质量评价指标来看, Res-CAE在重建质量和细节表现上达到了不错的效果。 然而, 由于高光谱相机的物理特性和模型在细节提升方面的局限, 重建后的数据立方体在某些细节上仍有提升空间。 未来的实验将致力于改进模型的细节还原能力, 以进一步提高重建的精度。 我们还将探索其他方法在高光谱数据颜色重建中的潜力, 以期为颜色数字化提供更全面的技术支持。

参考文献
[1] ZHOU Jie, DUAN Lian-ru(周杰, 段炼孺). Identification and Appreciation to Cultural Relics(文物鉴定与鉴赏), 2021, 198: 78. [本文引用:1]
[2] WANG Hong-mei(王红梅). Oriental Collection(东方收藏), 2021, (13): 76. [本文引用:1]
[3] XU Guo-bin, YU Yi-ming, LI Jie, et al(徐国彬, 于艺铭, 李洁, ). Laser & Optoelectronics Progress, 2022, 59(10): 81. [本文引用:1]
[4] CHENG Qing-biao, CHEN Guang-yun, WANG Da-wen, et al(程青彪, 陈广云, 王大文, ). Optical Instruments(光学仪器), 2022, 44(3): 68. [本文引用:1]
[5] Zhang L H, Liang D, Zhang D W, et al. Journal of the Optical Society of Korea, 2016, 20(4): 515. [本文引用:1]
[6] Wang K, Wang H, Wang Z, et al. Cluster Computing, 2019, 22(S1): 493. [本文引用:1]
[7] YAN Li-xia, WU Fan(闫丽霞, 吴凡). Computer Applications and Software(计算机应用与软件), 2014, 31(3): 207. [本文引用:1]
[8] ZHAO Hai, LI Hong-ning, CHEN Hao(赵海, 李宏宁, 陈豪). Acta Optica Sinica(光学学报), 2023, 43(9): 269. [本文引用:1]
[9] WANG Wen-ju, WANG Jiang-wei(王文举, 王江薇). Packaging Engineering(包装工程), 2020, 41(11): 254. [本文引用:2]
[10] Alvarez Gila A, Van de Weijer J, Garrote E. Proceedings of the 2017 IEEE International Conference on Computer Vision Workshops, 2017, 480. [本文引用:1]
[11] Arad B, Ben-Shahar O. Computer Vision—14th European Conference, ECCV 2016 Proceedings, PartVII14, Springer: 2016, 19. [本文引用:1]
[12] Cai Y, Lin J, Hu X, et al. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022, 17502. [本文引用:1]
[13] Cai Y, Lin J, Hu X, et al. Proceedings European Conference on Computer Vision, Springer, 2022, 686. [本文引用:1]
[14] Cai Y, Lin J, Lin Z, et al. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022, 745. [本文引用:1]
[15] Urban P, Rosen M R, Berns R S. Journal of the Optical Society of America A, 2009, 26(8): 1865. [本文引用:1]
[16] LIU Peng-fei, ZHAO Huai-ci, LI Pei-xuan(刘鹏飞, 赵怀慈, 李培玄). Infrared and Laser Engineering(红外与激光工程), 2020, 49(S1): 143. [本文引用:1]
[17] LI Xin-ting, ZHANG Feng, FENG Jie(李欣庭, 张峰, 冯洁). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2024, 44(1): 215. [本文引用:1]
[18] Li Y, Hu J, Zhao X, et al. Neurocomputing, 2017, 266: 29. [本文引用:1]
[19] Shi Z, Chen C, Xiong Z, et al. Proceedings of the IEEE Conference on Computer Visionand Pattern Recognition Workshops, 2018, 939. [本文引用:1]
[20] Hu X, Cai Y, Lin J, et al. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022, 17542. [本文引用:1]
[21] Huang T, Dong W, Yuan X, et al. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2021, 16216. [本文引用:1]