基于改进卷积神经网络和高光谱成像技术的同色墨水鉴别
姜林一, 代雪晶*, 李云鹏, 汤澄清
中国刑事警察学院, 辽宁 沈阳 110854
*通讯作者 e-mail: 1210724331@qq.com

作者简介: 姜林一, 2001年生, 中国刑事警察学院硕士研究生 e-mail: 1034329002@qq.com

摘要

随着文件伪造和经济纠纷案件的增多, 同色墨水的精准鉴别在司法鉴定中具有重要意义。 传统方法(如薄层色谱法、 拉曼光谱法)存在样本破坏、 耗时较长等局限性, 而高光谱成像技术(HSI)因其图谱合一、 无损检测等优势成为研究的热点。 然而, 现有基于“降维+聚类”的墨水分类方法难以充分挖掘高维数据的非线性特征, 浅层机器学习模型的表达能力有限, 易受信息损失和误差累积的影响。 为此, 提出了一种融合多尺度卷积与通道注意力机制的深度学习模型HI-CNN, 将其结合高光谱成像用于同色墨水的鉴别。 该模型通过多分支并行卷积提取不同尺度的光谱特征, 全面感受各个波段的光谱信息; 结合通道注意力机制动态增强判别性波段, 聚焦关键波段信息; 采用残差连接优化梯度传播, 避免梯度爆炸和梯度消失的问题, 减少误差累积, 提高训练效率。 实验基于UWA Writing Ink高光谱图像(WIHSI)数据集, 探究了最合适的训练数据划分和训练参数设置, 并设计消融实验验证了多分支并行卷积结构、 通道注意力机制和残差网络连接对模型性能提升的有效性, 最后将本文提出的模型与其他模型架构在当前数据集的性能表现进行对比。 实验结果表明, 多分支结构和通道注意力机制分别可提升4.6%和1.0%的准确率; 通过残差网络连接使训练周期缩短了34%。 在最具挑战的黑色墨水鉴别中, HI-CNN达到了98.07%的准确率(相比最优模型CAE-LR提升了5.3%); 蓝色墨水鉴别准确率达到99.06%, 总体优于现有方法。 该研究为同色墨水鉴别提供了一种准确、 高效的解决方案, 减少了司法文件检验对专业人员经验的依赖, 在司法鉴定领域具有重要应用价值, 推动同色墨水鉴别技术从经验依赖向科学量化的跨越式发展。

关键词: 高光谱成像; 墨水鉴别; 深度学习; 多尺度卷积; 通道注意力机制
中图分类号:DF794.2 文献标志码:A
Identification of Homochromy Inks Based on Improved Convolutional Neural Network and Hyperspectral Imaging Technology
JIANG Lin-yi, DAI Xue-jing*, LI Yun-peng, TANG Cheng-qing
Criminal Investigation Police University of China, Shenyang 110854, China
*Corresponding author
Abstract

With the increasing number of document forgery and economic dispute cases, the accurate identification of homochromy inks is of great significance in judicial expertise. Traditional methods (such as thin-layer chromatography and Raman spectroscopy) have limitations including sample destruction and time-consuming procedures. At the same time, hyperspectral imaging (HSI) has emerged as a promising alternative due to its advantages of image-spectrum integration and non-destructive detection. However, the existing ink classification methods based on “dimension reduction and clustering” are difficult to fully explore the nonlinear characteristics of high-dimensional data, and shallow machine learning models have limited expressive ability and are susceptible to information loss and error accumulation. Therefore, a deep learning model HI-CNN integrating multi-scale convolution and channel attention mechanism is proposed in this paper, and it is combined with hyperspectral imaging for the identification of homochromy inks. The model employs multi-branch parallel convolution to extract spectral features at different scales, comprehensively capturing spectral information across bands. And a channel attention mechanism dynamically enhances discriminative bands, focusing on key spectral information. Residual connection optimization gradient propagation is adopted to avoid gradient explosion and gradient vanishing, thereby reducing error accumulation and improving training efficiency. Experiments were conducted on the UWA Writing Ink Hyperspectral Image (WIHSI) dataset to determine the optimal training data partitioning and parameter settings. Ablation studies were designed to validate the effectiveness of the multi-branch parallel convolution structure, channel attention mechanism, and residual connections in improving model performance. Finally, the performance of the model proposed in this paper was compared with that of other model architectures on the current dataset. The experimental results show that the multi-branch structure and the channel attention mechanism improved the accuracy rates by 4.6% and 1.0% respectively, and the training cycle was shortened by 34% through the residual network connection. For the most challenging identification of the black ink, HI-CNN achieved an accuracy rate of 98.07% (an improvement of 5.3% compared to the optimal model CAE-LR). In comparison, for the identification of blue ink the accuracy rate reached 99.06%, which was generally superior to the existing methods. This study provided an accurate and efficient solution for identifying homochromy inks, thereby reducing reliance on professional expertise in forensic document examination. It had significant application value in the field of judicial expertise and promoted the leapfrog development of homochromy ink identification technology, transitioning from reliance on experience to scientific quantification.

Keyword: Hyperspectral imaging; Ink identification; Deep learning; Multi-scale convolution; Channel attention mechanism
引言

在司法鉴定领域, 文件检验对保障公民财产权益、 维护司法公正具有重要意义。 笔迹鉴定作为文件检验的核心技术之一, 广泛应用于民事和刑事案件的调查中, 如支票、 收据、 合同等关键文件的真伪鉴别。 然而, 仅依靠笔迹分析往往不足以全面判定文件的可信度, 因为书写材料的类型(如墨水成分)同样是影响鉴定结果的关键因素。 在实际案件中, 不法分子可能通过篡改文件内容(如修改票据金额、 合同条款等)进行欺诈或伪造。 例如, 黑色中性笔常被用于修改关键数字或文字, 以改变原始信息, 达到变造文件的目的。 由于司法鉴定通常要求检验过程无损、 高效, 并能提供可靠的证据支持, 因此, 如何在不破坏原始文件的前提下, 快速、 准确地识别同色墨水字迹之间的差异, 成为文件检验领域的重要挑战[1]。 近年来, 高光谱成像技术(hyperspectral imaging, HSI)因其非接触、 高分辨率和多波段分析能力, 在墨水分类与文件检验中展现出巨大潜力[2]。 相较于传统的光谱分析方法(如红外光谱、 拉曼光谱等), 高光谱技术能够获取多波段的高维光谱信息, 从而更精细地区分同一品牌不同批次的墨水。 特别是在黑色墨水的鉴定中, 由于同一厂商不同批次的墨水在化学成分上存在微小差异, 高光谱成像能够通过反射率或荧光特性的细微变化, 实现高精度的分类, 为司法鉴定提供更可靠的依据。

当前基于高光谱成像的同色墨水鉴别主要采用“ 降维+聚类” 两个阶段的处理, 常用主成分分析(principal component analysis, PCA)、 t-分布邻域嵌入算法(t-distributed stochastic neighbor embedding, t-SNE)等方法将高维光谱数据映射到低维空间, 再使用无监督的K-Means聚类、 层次聚类(hierarchical clustering analysis, HCA)或监督学习的线性判别分析(linear discriminant analysis, LDA)、 支持向量机(support vector machine, SVM)、 K近邻算法(K-nearest neighbors, KNN)以及偏最小二乘判别分析(partial least squares discriminant analysis, PLS-DA)等传统机器学习算法实现分类[3]。 韩嫚莉将PCA引入高光谱数据的处理[4], Devassy首次在中性笔高光谱数据的处理中使用了t-SNE 降维方法[5], 王书越等结合随机子空间和线性判别分析的方法在自制数据集上取得了较高的准确率[6], 但其性能依赖人工选择的感兴趣区域(region of interest, ROI), 提高了人工成本, 泛化能力不足。 以上这些方法通过光谱特征提取降低信号维度, 会造成其特征部分缺失或改变[7], 且传统机器学习方法(如SVM、 LDA)对高维数据的非线性特征表达能力不足, 难以捕捉光谱间的细微差异。 此外, 数据压缩过程与分类模型分离, 容易引入信息损失与误差累积问题[8]。 因此, 开发一种能处理更复杂数据、 识别不同高光谱信息之间细微差异的高效分类方法, 对提升同色墨水鉴别效率和准确性具有重要理论与应用价值。

近年来随着卷积神经网络等深度学习模型的发展和硬件迭代带来的算力提升, 使更多、 更复杂数据的处理成为可能。 与传统的机器学习方法相比, 深度学习能够自动提取特征, 无需人工干预, 使得对海量数据的处理变得更加高效[9]。 Khan提出使用卷积神经网络(CNN)来提取高光谱数据立方体的特征信息, 并在WIHSI公开数据库[10]实现了98.2%的蓝色墨水和88%的黑色墨水的识别精度[11], 结合光谱空间响应改进后分别将蓝色和黑色墨水的识别精度提高了1.4%和4.3%[12], Jaiswal提出了通过卷积自动编码器(CAE)然后进行逻辑回归(LR)进行分类的无监督特征提取(CAE-LR)架构, 将黑色墨水的识别准确率提升了0.44%[13]。 在此基础上, 本文提出了一种融合多尺度卷积与通道注意力机制的HI-CNN模型。 此模型中的多分支并行的卷积神经网络通过不同的感受野数量和大小, 可以提取多个维度的光谱特征[14], 通道注意力机制根据特征重要性的不同, 对不同通道上的特征赋予不同的权重, 突出重要特征, 抑制次要特征, 从而提高分类的精度[15]; 采用残差网络连接, 将特征提取与分类器训练统一于深度学习框架, 减少传统流程中的误差传递, 避免梯度消失, 提升训练效率。 在模型训练过程中加入学习率自动调整和早停机制, 避免模型出现过拟合问题。

1 实验部分
1.1 WIHSI数据集

实验基于国际权威的UWA Writing Ink高光谱图像库(WIHSI)。 该数据集包含70张手写文本的高光谱图像, 涵盖10种不同墨水(5种蓝色墨水和5种黑色墨水), 由7位不同书写者完成, 每位参与者使用每种墨水在白纸上书写标准英文句子“ The quick brown fox jumps over the lazy dog” 一遍, 如图1所示。 每幅高光谱图像的尺寸为752× 480像素, 包含33个光谱波段, 覆盖400~700 nm的可见光范围, 光谱分辨率为10 nm。 所有墨水均来自不同制造商, 以确保同一颜色类别内存在细微的光谱差异, 从而提高数据集的多样性和挑战性。

图1 WIHSI数据库结构组成Fig.1 Composition of the WIHSI database structure

1.2 数据预处理

1.2.1 高光谱数据提取

在基于高光谱成像的墨水分类任务中, 预处理阶段常需对高光谱图像进行分割, 以提取有效的墨水区域。 大津法(Otsu's Method)是一种基于灰度直方图的自适应阈值分割算法, 不易受图像亮度和对比度的影响[16]。 其核心思想是通过最大化类间方差(inter-class variance)来确定最佳分割阈值, 从而将图像分为前景(墨水笔迹)和背景(纸张)两部分。 对于基于高光谱成像的墨水数据, 设某波段图像的灰度级L, 像素总数为N, 灰度值的像素数为ni, 阈值可将像素分为两类: 灰度值大于t的为前景(墨水区域), 小于t的为背景(白纸区域)。 类间方差的计算如式(1):

σB2(t)=ω0(t)ω1(t)[μ0(t)-μ1(t)]2(1)

式(1)中, ω 0(t)为前景像素累积概率; ω 1(t)为背景像素累积概率; μ 0(t)为前景平均灰度; μ 1(t)为背景平均灰度。 遍历所有可能的t , 选择使 σB2(t)最大的t作为最佳分割阈值。

为了排除背景的干扰, 获得所有墨水像素的位置, 使用大津法确定图像最优二值化阈值, 获得每种墨水笔迹的掩膜图像如图2所示。

图2 编号002书写者五种黑色墨水样本经处理后得到的掩膜图像Fig.2 Mask images of five black ink samples from writer No.002 after processing

1.2.2 高光谱数据重塑

利用墨水笔迹的二值图像定位墨水像素的位置, 在五种蓝色墨水掩膜图像中获取了77 188个有效像素, 在五种黑色墨水掩膜图像中获取了87 761个有效像素, 制作十个数组分别储存十种墨水各个像素33个波段的光谱数据信息, 如图3所示。 为了通过卷积神经网络进行特征提取, 将获取的33个波段的光谱反射率按行优先排列的方式重塑为6× 6的二维反射率矩阵, 缺少的3个波段补零。

图3 提取编号003书写者某类墨水光谱数据后的处理过程Fig.3 The processing procedure after extracting the spectral data of a certain type of ink from writer number 003

1.3 HI-CNN模型

1.3.1 模型概述

针对基于高光谱成像的墨水数据的高维性, 提出了一种融合多尺度卷积与注意力机制的HI-CNN深度学习框架。 其输入为6× 6的高光谱反射率矩阵, 输出为5类墨水的概率分布。 模型通过以下核心设计实现高效分类: (1)多分支并行卷积, 用于提取不同尺度的光谱特征; (2)通道注意力标定, 用于动态增强判别性光谱通道; (3)通过残差跨层连接来优化梯度传播和防止梯度消失。 整体架构如式(2)

Y=Fcls(P(R(C(B1(X), B2(X), B3(X)))))(2)

式(2)中, Bi为并行卷积分支, C表示特征融合与压缩, R为残差连接, P为池化操作, Fcls为分类器。

1.3.2 多尺度特征提取

输入层将原始的6× 6光谱块(反射率矩阵)添加通道维, 随后馈送到三条独立的卷积通路, 其中分支1为细节特征通路, 架构如式(3)

F1=ReLU(BN(W3×3(2)* ReLU(BN(W3×3(1)* X))))(3)

式(3)中, W3×3(1)表示卷积核大小为3× 3, 步幅为1, W3×3(2)表示卷积核大小为3× 3, 步幅为2, * 表示卷积操作, 使用ReLU 作为激活函数, BN为批量归一化。 分支2为中等尺度通路, 结构与分支1类似, 但初始通道数为24, 最终输出F2R6× 6× 32, 满足‖ F20< ‖ F10的稀疏性约束。 分支3为上下文通路, 采用大核卷积捕获全局模式, 使用16个5× 5 的卷积核, ReLU作为激活函数, BN为批量归一化。 特征融合阶段如式(4)

Ffused=W1×1* Concat(F1, F2, F3)(4)

式(4)中, W1× 1使用32个1× 1小核将通道数降至32, 降低后续计算压力。

1.3.3 通道注意力机制

受视觉注意力启发, 设计轻量化通道重标定模块。 给定输入特征F, 经过双路池化并共享MLP映射得到通道权重A, 输出为通道加权结果。 表达式如式(5)

Fatt=AF(5)

式(5)中, ☉为点积, 该操作使模型聚焦于墨水化学成分敏感的光谱通道。

1.3.4 残差学习与分类器

为了确保梯度可直接回传至浅层, 防止出现梯度消失和模型退化问题, 使用残差连接将分支2的中等尺度特征通路与注意力输出融合, 将输出特征经过展平和丢弃法后使用全连接映射, Dropout层以概率0.5随机屏蔽神经元, 最后经Softmax函数输出五类分类概率的表达式如式(6)

$P(y=k \mid X)=\frac{\exp \left(z_{k}\right)}{\displaystyle\sum_{i=1}^{5} \exp \left(z_{i}\right)} \quad k=1, \cdots, 5$(6)

1.4 评价指标

为了量化模型性能并分析分类误差来源, 采用总体准确率(overall accuracy, OA)和混淆矩阵(confusion matrix)作为核心评价指标。 总体准确率(OA)反映模型对所有测试样本的整体分类能力, 表达式如式(7)

$\mathrm{OA}=\frac{\displaystyle\sum_{i=1}^{k} T P_{i}}{N}$(7)

式(7)中, TPi为第 i 类墨水正确分类的像素数, k为墨水类别总数, N为测试集总数。 OA值越接近1, 表明模型分类性能越强。 混淆矩阵通过行列交叉表直观展示分类细节, 其元素Cij表示真实类别为i的样本被预测为类别j的数量, 基于该矩阵可进一步计算类别精确率和类别召回率。 类别精确率(Precision): TPiTPi+FPi, 衡量模型对类别i的预测可靠性; 类别召回率(Recall): TPiTPi+FNi, 评估模型对类别i的覆盖能力。 F1得分为精确率与召回率的调和均值, 表达式如式(8)

$\mathrm{F} 1_{i}=2 \times \frac{\text { Precision }_{i} \times \text { Recall }_{i}~~~}{\text { Precision }_{i}+\text { Recall }_{i}~~~}$(8)

2 结果与讨论
2.1 软硬件平台配置

本实验使用搭载Windows11专业版操作系统的计算机进行, 如表1所示。 具体硬件环境包括AMD7700处理器、 RTX4070super显示卡、 32G运行内存等。 编程IDE为Trae, 环境解释器为python3.9.19, 环境依赖库包括Numpy, Pandas 等。

表1 实验的环境配置 Table 1 Experimental environment configuration
2.2 实验相关参数

WIHSI数据集包含7个不同个人书写的10类墨水的样本, 为了严格控制变量为墨水种类, 排除不同书写者对分类器的干扰, 第一次将所有样本随机取20%作为独立的测试集, 余下80%作为训练数据集。 第二次将编号007的书写者的所有样本作为测试集, 余下样本作为训练数据集, 在同样的环境下进行训练和测试。

损失函数使用多分类交叉熵, 优化器为Adam, 初始学习率设置为0.001, 通过ReduceLROnPlateau函数动态调整学习率并加入早停机制, 当验证集连续5个epoch没有改善时降低学习率, 连续10个epoch没有改善时停止训练, 训练轮次设置为100, 每次载入的批量大小为128, 损失函数的表达式如式(9)

$L=\frac{1}{N} \displaystyle\sum_{i} L_{i}=-\frac{1}{N} \displaystyle\sum_{i} \displaystyle\sum_{c=1}^{M} y_{i c} \log \left(p_{i c}\right)$(9)

2.3 HI-CNN模型结果

2.3.1 不同验证集比例对模型训练的影响

为确定最优验证集划分比例, 对比了30%、 20%和10%三种验证集占比对模型训练动态的影响。 通过监测训练过程中准确率和损失值的收敛特性, 可评估不同数据划分策略对模型泛化能力与训练效率的综合作用。 采用早停机制在验证损失连续10轮未下降时终止训练, 并以验证集最佳表现保存模型参数。 图4、 图5、 图6分别记录了30%、 20%和10%三种验证集占比下训练过程中模型的准确率和损失值, 其中蓝色曲线代表训练集, 黄色曲线代表验证集。 当验证集占训练数据集的30%时, 训练过程中验证集的准确率和损失率在40轮前波动较大, 在51轮后趋于平稳, 在第80轮时模型停止训练并保存为最佳模型参数; 当验证集占训练数据集的20%时, 训练过程中验证集的准确率和损失率在37轮前有波动, 在44轮后趋于平稳, 在第76轮时模型停止训练并保存为最佳模型参数; 当验证集占训练数据集的10%时, 训练过程中验证集的准确率和损失率在38轮前有波动, 在49轮后趋于平稳, 在第90轮时模型停止训练并保存为最佳模型参数。 由此可知, 验证集占比为20%达到最佳效果的轮次最少, 训练效率最高, 算力成本最低, 因此本研究的后续实验均使用该数据划分比例。

图4 验证集比例为30%的训练过程
(a): 训练集和验证集的准确率曲线; (b): 训练集和验证集的损失值曲线
Fig.4 Training process with a 30% validation set
(a): Accuracy curves of the training set and validation set; (b): Loss value curves of the training set and validation set

图5 验证集比例为20%的训练过程
(a): 训练集和验证集的准确率曲线; (b): 训练集和验证集的损失值曲线
Fig.5 Training process of model with 20% for validation set
(a): Accuracy curves of the training set and validation set; (b): Loss value curves of the training set and validation set

图6 验证集比例为10%的训练过程
(a): 训练集和验证集的准确率曲线; (b): 训练集和验证集的损失值曲线
Fig.6 Training process of model with 10% for validation set
(a): Accuracy curves of the training set and validation set; (b): Loss value curves of the training set and validation set

2.3.2 不同测试集划分方式对实验结果的影响

随机选取所有数据的20%作为测试样本时, 模型在五种黑色墨水的分类识别中的整体准确率为98.07%; 取编号007的书写者的样本作为测试集时, 模型在五种黑色墨水的分类识别中整体准确率为98.02%。 两者的分类识别准确率差别在0.05%以内, 因此不同书写者对于模型在光谱维度的学习没有关键性影响, 模型成功学习了不同种类墨水高光谱数据间的差别。

2.3.3 模型表现和可视化结果

为了评估模型性能, 统计测试样本并绘制了HI-CNN模型在测试数据集上分类的混淆矩阵如图7所示。 图7(a)和(b)分别为模型对五种蓝色墨水和五种黑色墨水分类的混淆矩阵, 根据其中的样本数计算每种墨水分类的整体准确率、 精确率、 召回率和F1得分, 统计其分类表现。 表2为五种蓝色墨水的分类表现, 04的预测为正例的样本里预测正确的比例最高, 各类F1得分均在0.98以上, 整体准确率> 0.99, 表现优秀。 表3为五种黑色墨水的分类表现, 01中预测为正例的样本里预测正确的比例最高, 01、 02、 05的F1得分在0.98以上, 整体准确率> 0.98, 也达到了较高水平。 如图8所示, (a)为用于提取墨水像素位置的二值掩膜图像, (b)为可视化后的分类结果, 经过对比可以发现模型分类效果良好, 具有一定的泛化能力, 能够应对两种场景下的同色不同种类墨水的分类。

图7 HI-CNN在测试数据集上分类的混淆矩阵
(a): 五种蓝色墨水分类的混淆矩阵; (b): 五种黑色墨水分类的混淆矩阵
Fig.7 Confusion matrices of HI-CNN classification for the test dataset
=(a): Confusion matrix of classification for five types of blue ink; (b): Confusion matrix of classification for five types of black ink

表2 五种蓝色墨水的分类表现 Table 2 Classification performance of five blue inks
表3 五种黑色墨水的分类表现 Table 3 Classification performance of five blackinks

图8 原二值掩膜图像及可视化分类结果
(a): 原二值掩膜图像; (b): 墨水分类结果
Fig.8 Original binary mask image and visualized classification results
(a): Original binary mask image; (b): Ink classification results

2.4 消融实验

为验证本文提出的HI-CNN模型中关键模块的有效性, 设计了系统性消融实验, 通过逐步移除或修改模型核心组件, 评估其对同色墨水分类性能的影响。 所有实验均基于相同的高光谱数据集(6× 6光谱矩阵输入)和训练参数(Adam优化器, 初始学习率0.001, 批量大小128), 实验结果取三次独立实验的平均值。

为了探究通道注意力模块的有效性, 设计实验移除通道注意力模块, 直接保留并行分支融合后的特征, 严格控制数据集划分比例及批量大小、 学习率等训练参数保持不变。 移除该模块后模型验证集准确率下降1.0%(从98.07%降至97.05%)。 原模型能显著增强部分波段的特征响应, 如图9所示。 因此, 通道注意力机制通过动态校准光谱特征的重要性, 有效提升了模型对同色墨水细微光谱差异的捕获能力。 为了探究残差连接的作用, 取消分支2的残差连接, 仅保留主路径特征。 模型收敛速度明显减缓, 达到相同验证准确率所需的训练周期增加116 s, 最终分类准确率下降0.5%。 残差连接的缺失导致深层特征图出现梯度弥散现象, 中高层特征响应强度降低。 这表明残差结构不仅缓解了梯度消失问题, 还通过跨层特征复用增强了模型对墨水混合光谱特征的鲁棒性。 为验证多分支结构的有效性, 设计两组实验。 第一组是仅保留单一分支(移除branch2和branch3, 仅使用branch1的3× 3卷积组合); 第二组统一所有分支卷积核为3× 3, 消除多尺度特征差异。 第一组和第二组的准确率分别下降4.6%和2.5%。 原模型的多分支结构在特征图中同时激活了局部细节(5× 5卷积捕获的宽光谱趋势)和上下文关联(3× 3卷积提取的精细纹理), 而单一分支模型仅能保留单一尺度特征。 多分支结构通过融合多尺度光谱特征, 广泛提升了模型对光谱特征的提取能力。 消融实验中, 不同模型架构在黑色墨水分类的具体表现如表4所示。

图9 测试集样本1的注意力权重热力图Fig.9 Heat map of attention weights for sample 1 in the test set

表4 消融实验中不同模型架构在黑色墨水分类的表现 Table 4 Performances of different model architectures for black ink classification with the ablation study

为验证不同模型架构在蓝色墨水分类中的表现, 在相同实验条件下对蓝色墨水数据进行了对比实验, 结果如表5所示。 从结果可以看出, 蓝色墨水的分类趋势与黑色墨水基本一致: 移除通道注意力模块后准确率下降0.9%, 取消残差连接后准确率下降0.4%, 而仅保留单一路径卷积时下降最为明显, 达到3.3%。 此外, 统一卷积核大小的模型也表现出约2.0%的性能损失。 该结果与黑色墨水的实验结论相吻合, 进一步证明了多分支卷积、 通道注意力和残差结构在提升模型泛化能力和稳定性方面的必要性。

表5 消融实验中不同模型架构在蓝色墨水分类的表现 Table 5 Performances of different model architectures for blue ink classification with the ablation study

消融实验表明, 通道注意力、 残差连接与多分支结构三者协同优化了高光谱数据的特征表达, 具体作用为: (1)通道注意力模块通过光谱维度自适应加权, 抑制冗余波段干扰; (2)残差连接保障了深层网络的稳定训练与特征复用; (3)多分支设计实现了光谱多尺度特征的互补增强。 三者缺失将导致模型对同色墨水的类内差异敏感度下降, 验证了本文模型架构设计的必要性。

2.5 对比实验

为了进一步评估模型性能, 将本文提出的算法模型与数据库中现有算法的进行对比(同架构算法取性能最优的为代表), 如表6所示。 由此可以看出, 本模型对黑色墨水的分类识别准确率比目前表现最好的CAE-LR提升了5.3%; 对于蓝色墨水的分类识别也达到了较高水平, 体现了模型具有一定的泛化能力。

表6 数据库中各种算法的性能表现 Table 6 Performances of various models for the database

表6的对比结果可以看出, 现有算法在蓝色墨水与黑色墨水的分类识别中存在差异, 其中蓝色墨水的分类准确率普遍高于黑色墨水。 这一现象主要源于黑色墨水在光谱维度上的区分度较低, 不同批次或厂商的黑色墨水在光谱反射特性上差异极为细微, 传统特征提取方法及浅层模型难以充分捕捉这些细微差异, 因而导致分类性能下降。 相比之下, 蓝色墨水在特定波段具有较为显著的光谱差异, 因而更容易被传统算法识别。 值得注意的是, 本文提出的HI-CNN模型在蓝色与黑色墨水上的分类准确率差异明显缩小。 这主要得益于多尺度卷积结构能够同时提取局部细节与全局光谱特征, 通道注意力机制可自适应地强化关键判别波段, 而残差连接则保障了深层网络的稳定训练与特征复用。 上述设计协同作用, 显著增强了模型在低差异光谱数据中的特征表达能力, 使其在蓝色与黑色墨水的分类任务中均能保持较高且稳定的识别精度。

除分类准确率外, 为全面评估不同算法在实际应用中的可行性, 进一步对比了各模型的计算复杂度与推理用时。 结果表明, 传统的聚类与MVES方法尽管计算复杂度较低, 但在大规模数据处理场景下难以满足精度要求; 深度学习方法虽然在准确率上具有优势, 但部分模型(如Autoencoder)在训练与推理阶段耗时较长, 影响了实际应用效率。 相比之下, 本文提出的HI-CNN模型在保证高分类精度的同时, 得益于多分支并行结构与残差优化机制, 在计算复杂度上保持适中水平, 且单次推理用时明显低于Autoencoder和传统CNN, 兼顾了性能与效率, 这进一步验证了本模型在司法鉴定应用场景中的实用性与优势

3 结论

提出了一种基于多尺度特征融合和高光谱成像技术的墨水分类网络架构(HI-CNN), 通过集成多尺度卷积模块、 通道注意力机制与残差网络连接, 实现了对高维高光谱数据的深层特征解析。 该架构中, 多尺度并行卷积层通过差异化感受野同步捕捉光谱曲线的局部细微波动与全局趋势特征; 通道注意力模块则通过动态权重分配强化关键鉴别波段的响应强度; 残差连接的引入有效缓解了深层网络梯度衰减问题, 使模型在20层的深度下仍保持高效收敛特性。 在UWA书写墨水高光谱数据集(WIHSI)的实验表明: HI-CNN在墨水分类识别中展现出显著优势, 其黑色墨水的鉴别准确率分别达到98.07%, 较现有最优模型(CAE-LR)提升了5.3个百分点; 在精确率、 召回率及F1得分等关键指标上均达到较高水平。 尽管该模型在同色系异源墨水鉴别中表现卓越, 但是仍需关注其当前局限性。 实验数据的光谱覆盖范围局限于400~700 nm可见光波段, 模型的泛化能力仍有提升空间。 未来可建立充分涵盖不同书写压力、 纸张渗透性等现实变量的波段范围更广的光谱数据集, 提升模型在复杂场景下的表现能力, 推动基于高光谱成像的技术鉴别同色墨水从经验依赖向科学量化的跨越式发展。

参考文献
[1] Mariotti K C, Ortiz R S, Ferrão M F. Science & Justice, 2023, 63(3): 387. [本文引用:1]
[2] ZHOU Yi-han, CUI Lan, ZHANG Cheng, et al(周奕含, 崔岚, 张程, ). Laser & Optoelectronics Progress(激光与光电子学进展), 2025, 62(16): 1. [本文引用:1]
[3] LI Shuo, CUI Lan, FU Pei(李硕, 崔岚, 付沛). Chinese Journal of Inorganic Analytical Chemistry(中国无机分析化学), 2024, 14(6): 826. [本文引用:1]
[4] HAN Man-li, HOU Wei-min, SUN jing-guo, et al(韩嫚莉, 侯卫民, 孙靖国, ). Journal of University of Electronic Science and Technology of China(电子科技大学学报), 2019, 48(1): 117. [本文引用:1]
[5] Devassy B M, George S. Forensic Science International, 2020, 311(6): 110194. [本文引用:1]
[6] WANG Shu-yue, YANG Yu-zhu, HE Wei-wen, et al(王书越, 杨玉柱, 何伟文, ). Journal of Instrumental Analysis(分析测试学报), 2021, 40(10): 1489. [本文引用:1]
[7] CHEN Xin-gang, ZHANG Wen-xuan, MA Zhi-peng, et al(陈新岗, 张文轩, 马志鹏, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2025, 45(4): 932. [本文引用:1]
[8] Mantripragada K, Dao P D, He Y, et al. PLoS One, 2022, 17(7): e0269174. [本文引用:1]
[9] López-Baldomero A B, Buzzelli M, Moronta-Montero F, et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2025, 335: 125916. [本文引用:1]
[10] Khan Z, Shafait F, Mian A. Pattern Recognition, 2015, 48(11): 3615. [本文引用:1]
[11] Khan M J, Yousaf A, Abbas A, et al. Journal of Electronic Imaging, 2018, 27(5): 053001. [本文引用:1]
[12] Khan M J, Khurshid K, Shafait F. Proceedings of 2019 International Conference on Document Analysis and Recognition (ICDAR), 2019, 1097. [本文引用:1]
[13] Jaiswal G, Sharma A, Yadav S K. Computers and Electrical Engineering, 2022, 99: 107770. [本文引用:1]
[14] DENG Liang-jian, RAN Ran, WU Xiao, et al(邓良剑, 冉燃, 吴潇, ). Journal of Image and Graphics(中国图象图形学报), 2023, 28(1): 17. [本文引用:1]
[15] CHEN Wen-hao, HE Jing, LIU Gang(陈文豪, 何敬, 刘刚). Laser & Optoelectronics Progress(激光与光电子学进展), 2022, 59(18): 1811001. [本文引用:1]
[16] BAO Cheng-xiao, JIANG Wei, WANG Yu-xiao(包丞啸, 姜威, 王玉潇). Optical Technology(光学技术), 2019, 45(6): 756. [本文引用:1]
[17] Luo Zhipei, Shafait F, Mian A. Proceedings of 2015 13th International Conference on Document Analysis and Recognition (ICDAR), 2015, 496. [本文引用:1]
[18] Abbas A, Khurshid K, Shafait F. Proceedings of 2017 14th International Conference on Document Analysis and Recognition (ICDAR), 2017, 1229. [本文引用:1]