基于MTF变换的拉曼光谱和卷积神经网络的海水微塑料识别方法研究
张蔚1,2, 冯巍巍2,3,*, 蔡宗岐2, 王焕卿2, 闫奇1, 王清2,3
1.哈尔滨工程大学烟台研究院, 山东 烟台 264000
2.中国科学院海岸带环境过程与生态修复重点实验室(烟台海岸带研究所), 山东 烟台 264003
3.中国科学院大学, 北京 100049
*通讯作者 e-mail: wwfeng@yic.ac.cn

作者简介: 张 蔚, 1995年生,哈尔滨工程大学烟台研究院与中国科学院烟台海岸带研究所联合培养硕士研究生e-mail: ausf@hrbeu.edu.cn

摘要

微塑料作为一种新型污染物, 引起的污染问题在当今越发受到研究人员的关注。 拉曼光谱有着无损样品, 光谱特征峰位有代表性, 便于识别样品种类的优点, 一直以来是生物化学分析领域热门的检测方法之一。 深度学习近年在特征提取、 目标检测等领域的发展成就引人瞩目。 针对准确高效的微塑料检测方法问题, 探索了基于马尔可夫变迁场(MTF)变换的拉曼光谱和卷积神经网络的微塑料识别可行性。 采集了11种微塑料样品的拉曼光谱, 每种样品采集100条光谱, 并通过光谱平移、 添加噪声、 光谱叠加等方式数据强化扩充了光谱数据集, 利用MTF将一维拉曼光谱数据转换为彩色二维图像, 获得二维图像形式的光谱数据集。 设计一种主体为多个小尺寸卷积核的卷积神经网络(SSMKB-CNN)模型, 包括1个输入层、 6个卷积层、 2个池化层、 1个平坦层、 2个全连接层与1个输出层。 选择Dropout与带权重衰减的自适应矩估计优化器以避免过拟合现象, 采用阶梯式学习速率保证模型充分习得数据深层特征。 分类性能的评价标准采用混淆矩阵、 精确率、 召回率、 F1分数与整体准确率。 模型的分类结果与基于二维图像光谱数据集的AlexNet、 VGG16和ResNet50三个深度卷积神经网络模型和基于一维光谱数据集的随机森林(RF)、 K-最邻近(KNN)和三种核函数(rbf、 Linear、 Poly)的支持向量机(SVM)机器学习分类器的分类结果进行对比。 通过分析训练曲线及混淆矩阵的分类结果, 四种CNN模型的损失与准确曲线走势平稳, 均能达到良好的训练效果, 其中提出的SSMKB-CNN模型准确率达到了97.04%, 综合精确率、 召回率和F1分数分别为97.05%、 95.06%和97.02%, 均明显优于用于比较的另外三种经典神经网络模型以及三种机器学习分类器。 一轮训练时长为9 s, 训练时间少于三种CNN模型, 综合分类性能最佳。 实验结果表明, 基于结合MTF变换的拉曼光谱的SSMKB-CNN模型能够准确高效地提取光谱特征并作出种类预测, 利用拉曼光谱实现微塑料样品的定性识别, 可以为海水中微塑料实际样品的准确客观的识别技术提供方法新思路参考。

关键词: 马尔可夫变迁场; 拉曼光谱; 微塑料; 神经网络
中图分类号:O433.4 文献标志码:A
Study on Recognition of Marine Microplastics Using Raman Spectra Combined With MTF and CNN
ZHANG Wei1,2, FENG Wei-wei2,3,*, CAI Zong-qi2, WANG Huan-qing2, YAN Qi1, WANG Qing2,3
1. Yantai Research Institute of Harbin Engineering University, Yantai 264000, China
2. CAS Key Laboratory of Coastal Environmental Processes and Ecological Remediation, Yantai Institute of Coastal Zone Research, Chinese Academy of Sciences, Yantai 264003, China
3. University of Chinese Academy of Sciences, Beijing 100049, China
*Corresponding author
Abstract

In recent years, seawater pollution caused by microplastic waste has caught more and more attention. Raman spectroscopy, a non-destructive detection technique, has representative spectral characteristic peaks, making it easier to identify unknown samples. It has always been one of the popular detection methods in biochemical analysis. Deep learning has made remarkable achievements in feature extraction, target detection, and other fields. The feasibility of Raman spectroscopy based on the Markov transition field (MTF) combined with a convolution neural network (CNN)was explored for the accurate and efficient detection of microplastics. The Raman spectra of eleven types of microplastic samples were collected, and 100 spectra were collected for each sample; then, the spectral dataset was expanded through data augmentation. The one-dimensional Raman spectral data was converted into two-dimensional images using a Markov transition field to obtain a two-dimensional image spectral dataset. A small-sized multiple-kernel-based convolutional neural network (SSMKB-CNN) model with continuous small-scale convolutional kernels is designed, including one input layer, six convolutional layers, two pooling layers, one flattened layer, two fully-connected layers, and one output layer. The classification performance of the model is compared with the classification results of AlexNet, VGG16, and ResNet50 deep convolution neural network models based on a two-dimensional MTF image spectral dataset, along withthree classical machine learning classifiers based on a one-dimensional spectral dataset, including K-nearest neighbors (KNN), random forest (RF) and support vector machine (SVM)with three kernel functions (rbf, Linear and Poly). It could be seen from the training curves and the classification confusion matrix that the loss and accuracy curves of the four CNN models are stable and can achieve a good training effect. The accuracy rate of the proposed SSMKB-CNN model reaches 97.04%, and the macroprecision rate, recall rate, and F1-score are 97.05%, 95.06%, and 97.02%, respectively, which is superior to the other three CNN models used for comparison and the three machine learning classifiers. Each training epochconsumes 9 seconds, less than the three CNN models. Overall, the proposed SSMKB-CNN model has the best classification performance. The experimental results show that the Raman spectrum and SSMKB-CNN model combined with MTF can accurately and efficiently extract spectral features and make precise predictions, and the qualitative identification of microplastic samples using the Raman spectrum is realized. It can provide a method reference for the recognition technology of actual microplastic contaminants in seawater.

Keyword: Markov transition field; Raman spectrum; Microplastics; Convolutional neural network
引言

近年来陆续有报道声称在海洋及生物(海龟与鸟类等)体内发现微小塑料聚合物, 表明微塑料污染威胁越发严重[1]。 直径< 5 mm的塑料微粒被称作微塑料[2], 微小的体积使得塑料更加容易随着海流扩散, 据报道, 近到中国近海[3], 远到极地海域[4]均发现了微塑料的分布。 微塑料有较大的相对表面积, 更容易吸附有毒物质, 被生物摄入不仅会导致消化问题, 还会顺着食物链富集, 危害生物的生存与生态的稳定[5]。 微塑料的成分种类检测是研究微塑料的基础环节, 而微塑料微小的尺寸使其鉴别起来较为困难, 因此, 寻找一种准确高效的微塑料检测方法具有重要意义。 常见的微塑料检测方法有目视法、 气相色谱-质谱法(gas chromatography-mass spectrometry, GC-MS)、 红外光谱法(Fourier transform infrared spectrum, FTIR)与拉曼光谱法(Raman spectrum)。 目视法的结果易受主观因素影响, 检测周期较长, 对近似透明的待测样品检测效果有限[6]; GC-MS法检测周期长的同时, 由于塑料聚合物不耐热, 该方法会毁坏微塑料样品, 影响检测结果[7]; FTIR容易受水成分影响, 适合较大尺寸样品, 对于特定尺寸的小样品检测效果有限[8]; 拉曼光谱是一种无损检测技术, 保证了样品完整性, 也没有样品前处理要求, 能够避免光谱的破坏或污染[9]。 人工智能技术发展迅速, 研究者们也尝试使用神经网络模型来提取光谱特征。 赵勇等[10]设计了一种一维卷积神经网络(convolutional neural network, CNN)模型, 使用拉曼光谱来判别肺炎支原体菌株的种类, 在添加高强度噪声的条件下模型准确率仍能达到92.5%; Fan等[11]使用格拉姆角场(Gramian Angular field, GAF)方法将复杂表面肌电信号转化为图像形式, 提出一种CNN模型, 提取图像形式的时序信号中涉及瞬时值的高级语义特征用于图像分类, 实现了肌电模式识别; Liu等[12]将原始拉曼光谱一维数据通过格拉姆角和场(Gramian Angular summation field, GASF)方法转换为二维图像, 结合CNN实现了海洋单细胞微生物的快速鉴定; Ng等[13]使用红外光谱训练CNN模型用于土壤中的微塑料污染检测。 马尔可夫变迁场(Markov transition field, MTF)是一种常用于一维时序信号分析的序列信号可视化技术, 能够将原始一维光谱数据转化为二维图像数据。 本文基于拉曼光谱数据, 提出一种结合MTF的多个小尺寸卷积核的卷积神经网络(small-sized multiple-kernel-based convolutional neural network, SSMKB-CNN)分类模型, 将其应用到微塑料种类检测问题。 采集11种微塑料样品的拉曼光谱数据, 通过数据增强扩充拉曼光谱数据集, 利用MTF将拉曼光谱信息映射于二维光谱图像数据集用于模型训练测试, 将训练分类结果与多种传统机器学习分类器和经典CNN模型进行对比, 分类结果表明, 提出的SSMKB-CNN基于包含更丰富的光谱特征信息的二维光谱数据的分类准确率显著优于基于一维光谱数据的机器学习算法, 同时低模型复杂度使得该模型训练时间也少于其他经典CNN模型, 检测结果客观准确, 证明提出方法的有效性, 为海水微塑料识别提供一种新思路。

1 实验部分
1.1 基于拉曼光谱的微塑料检测系统与光谱采集及增强

拉曼光谱微塑料检测系统由显微镜, 激光器, 拉曼光谱仪与数据处理端组成, 图1为检测系统示意图。 激发光源波长785 nm, 最大功率为535 mW。 激发光源由激光器射出, 经显微镜聚焦照射在样品上, 测得的光谱数据由光纤传输至光谱模块进行光谱采集处理并转换, 转换后的拉曼光谱数据传输到数据处理端, 由计算机进行光谱数据处理保存。 选用光谱仪型号为QE65 Pro, Ocean Optics, 光谱仪积分时长设为1 000 ms, 平均宽度为2, 平均次数为2。 深度学习有着数据饥饿特性, 足够的训练数据可以使神经网络全面地获得数据的内部特征, 提高其泛化能力, 并在一定程度上防止过度拟合, 而每类微塑料的光谱数量相比于一条光谱的特征点数要少一个数量级。 考虑到通过手动采集获得大量的样品光谱数据存在客观难度, 需要较长准备周期, 在处理这个问题时, 设计了一种有效的光谱数据增强方法。 数据增强的方法有: 将光谱数据向左、 右平移一、 二个特征点位; 向原始光谱中添加期望为0, 方差为10的高斯噪声; 同种微塑料的光谱以一组和为1的随机系数相乘并叠加获得新的同种光谱; 当前种类微塑料光谱的系数设为0.75, 和为0.25的剩余系数分配给不同微塑料光谱进行叠加。

图1 微塑料拉曼光谱检测系统示意图Fig.1 Schematic diagram of microplastic Raman spectra detection system

1.2 基于MTF生成二维光谱图像

典型的一维信号有语音信号、 振动信号和心电图信号等类似的时序信号。 分析该类信号时, 常利用特定的预处理和特征筛选降维方法去除噪音并提取主要成分, 这些方法一定程度上有利于提升光谱的辨识度, 但是部分有用特征信息也会被消除, 影响模型的分类性能。 采用MTF将原始的一维光谱转换为二维图像光谱数据。 MTF的操作步骤具体为[14]:

(1) 数据离散化。 给定一条光谱数据X, 总长度为n, 将该光谱分为Q个部分, 光谱数据中的数据点Xiqi对应。 第一与最后一个分位点分别对应着光谱数据中的最小值与最大值。

(2) 建立马尔可夫转移矩阵, 计算转移概率。 根据数据的分布, 通过一阶马尔可夫链计算分区之间的转移概率, 基于转移概率生成一个Q× Q大小的转移概率矩阵P, 如式(1)所示, p(i, j)表示当前位于qi的数据点x可能转移到qj的概率。

(3) 引入MTF, 记作一个n× n大小的矩阵M, 形如式(2), 矩阵元素Mij表示从分位区qiqj转移的概率。

(4) 尺寸压缩。 如直接基于n× n大小的矩阵M生成图片, 数据量过大。 为提高训练运算效率, 需要将原始大小的矩阵M压缩降维。 设定预期的图像尺寸长宽为m。 对光谱中每一个长度为m的序列的转换概率进行聚合运算, 即对每个非重叠的m× m大小的窗口使用模糊核(blurring kernel)进行像素(概率)平均运算, 获得新的m× m大小的MTF图像。

以ABS为例, 分区设置为8, 生成二维光谱数据的流程如图2所示。

P=p{xtqi|xt+1qi}p{xtqi|xt+1qj}p{xtqj|xt+1qi}p{xtqj|xt+1qj}(1)

M=mi, jx1qi, x1qjmi, jx1qi, xnqjmi, jxnqi, x1qjmi, jxnqi, xnqj(2)

图2 MTF生成二维光谱图像过程示意图
(a): 原始光谱; (b): 分位处理后的光谱; c): 转移矩阵; (d): 转移概率矩阵; (e): ABS拉曼光谱的256× 256大小的MTF图像
Fig.2 Schematic diagram of MTF process
(a): Original spectrum; (b): Spectra after quantile processing; (c): Markov transfer matrix; (d): Transfer probability matrix; (e): MTF image of ABS Raman spectrum, image size=256× 256

1.3 卷积神经网络结构

提出了一种多个小尺寸卷积核的卷积神经网络SSMKB-CNN, 包含一个输入层(input layer, Input), 6层卷积层(convolution layer, Conv), 2层最大池化层(max-pooling layer, Pool), 一层平坦层(flatten), 全连接层(fully-connected layer, Dense)和1层输出层(output layer, Output), 图3为模型结构示意图。 输入端接受转换后的3通道256× 256像素大小的MTF图像数据集, 输出端11个节点对应11种微塑料的预测结果。 Conv1层选用8个5× 5大小的卷积核, 步长设置为2, 能够有效提取特征, 实现数据降维从而加速训练过程。 Conv2到Conv6五个卷积层采用了小尺寸3× 3的卷积核, 步长设置为1, 细致提取数据特征。 Pool1与Pool2两个最大池化层池化核大小与步长均设置为2, 保证分别在三次卷积提取操作后数据的进一步降维, 加快训练进程。 全连接层第一层包含256个神经元, 第二层有64个神经元, 均添加了Dropout功能, 来减少过拟合效应, 其中Dropout率设为0.5。 选择了带权重衰减(weight decay)的自适应矩估计(adaptive moment estimation, Adam)作为优化器来优化模型训练过程, 衰减率设为0.001, 目的同样是避免过拟合出现。 激活函数选择带泄露的修正线性单元函数LeakyReLU(rectified linear units), 避免训练过程中出现梯度爆炸或梯度消失。 损失函数(loss function)选择了多分类任务常用的交叉熵(cross entropy)损失函数。 任务总共训练500轮, 采用阶梯式学习速率(step learning rate), 初始学习速率设为0.001, 每经过100轮训练, 学习速率变为上一阶段的0.8倍。

图3 SSMKB-CNN模型及训练数据结构示意图Fig.3 Schematic diagram of SSMKB-CNN model and training data structure

1.4 评价指标

模型性能可通过训练曲线(training curves), 包含损失曲线和准确曲线, 与准确率(Accuracy)衡量。 同时混淆矩阵(confusion matrix), 精准率(Precision), 召回率(Recall)与F1分数(F1-Score)也是评估分类表现的重要方法与指标。 分类任务常使用0或N表示非, 使用1或P表示是, 以区分两个不同的样本, 一个预测可能有四种情况: 预测是样本为是样本、 预测是样本为非样本、 预测非样本为是样本和预测非样本为非样本, 概括为真正类(true positive, TP)、 假非类(false negative)、 假正类(false positive)和真非类(true negative)。

精确率, 召回率, F1分数与准确率的计算方法如式(3)— 式(6)所示。

Precision=1ni=1nTPiTPi+FPi(3)

Recall=1ni=1nTPiTPi+FNi(4)

F1⁃score=1ni=1n2×Precisioni×RecalliPrecisioni+Recalli(5)

Accuracy=1ni=1nTPi+TNiTPi+FNi+FPi+TNi(6)

其中n表示总共的待预测种类, i表示当前种类。

图4 多分类任务的混淆矩阵示意图Fig.4 Schematic diagram of multi-classification confusion matrix

1.5 实验环境与技术路线

硬件条件如下: 中央处理器(Central Processing Unit, CPU): IntelCore(TM)i9-10900KF CPU@3.70GHz; 图形处理器(Graphics Processing Unit, GPU): NVIDIA GeForce RTX 3090; 内存32 GB。 软件环境: Windows 10 64位, 英伟达统一计算架构(NVIDIA Compute Unified Device Architecture, CUDA)版本11.3, 英伟达深度神经网络库(NVIDIA CUD ADeep Neural Network Library, cuDNN)版本8.2.1。 编程语言为Python3.6.12, 深度学习框架为pytorch 1.10.2。

基于拉曼光谱MTF变换图像数据集的SSMKB-CNN分类模型应用于微塑料种类检测的技术路线如图5所示。 首先使用拉曼光谱仪采集11种微塑料样品的拉曼光谱原始数据, 通过数据增强扩展数据集规模以满足深度学习对数据规模的需求, 数据集以6∶ 2∶ 2的比例划分为训练集、 验证集与测试集。 增强后的光谱数据经MTF变换为二维图像形式的光谱数据集, 模型利用图像训练集按预设参数设置训练, 训练过程中模型参数不断优化。 训练完成后基于测试集的分类表现评估模型对微塑料种类的识别性能。

图5 研究技术路线图Fig.5 Technology Roadmap of the research

2 结果与讨论
2.1 光谱数据集的制作

实验共采集了11种微塑料拉曼光谱, 分别是丙烯腈-丁二烯-苯乙烯共聚物(acrylonitrile butadiene styrene, ABS), 聚对苯二甲酸丁二醇酯(polybutylece terephthalate, PBT), 聚碳酸酯(polycarbonate, PC), 聚乙烯(polyethylene, PE), 聚醚砜树脂(polyether sulfones, PES), 聚对苯二甲酸乙二酯(polyethylene terephthalate, PET), 聚甲醛(polyoxymethylene, POM), 聚丙烯(polypropylene, PP), 聚苯硫醚(polyphenylene sulfide, PPS), 聚苯乙烯(polystyrene, PS)和聚氯乙烯(polyvinyl chloride, PVC), 光谱如图6所示, 单条光谱有1 015个特征点, 特征点处的波数有对应的光谱强度, 微塑料的拉曼特征峰基本位于波数500~3 200 cm-1之间。 增强后的一维光谱数据集经MTF变换为光谱图像数据集, 以6∶ 2∶ 2的比例划分为训练集(training set), 验证集(validation set)与测试集(testing set), 模型使用训练集的数据样本训练拟合, 训练过程中不断更新模型的权重参数。 验证集则用于及时评估每轮训练后模型的性能, 确认模型拟合状态。 训练完成后, 通过模型在测试集上的表现鉴定最终模型的分类泛化能力。

图6 微塑料样品的拉曼光谱Fig.6 Raman spectra of microplastic samples

2.2 SSMKB-CNN分类效果与分析

SSMKB-CNN的训练曲线如图7所示, 可以看出模型损失值与验证的准确曲线走势平稳, 没有出现骤降或持续下降现象, 训练精度达到了99.98%, 验证精度稳定在96%~97%附近, 说明模型训练效果良好。 为保证模型评估的客观性, 基于未参与训练过程的剩余20%数据集进行分类测试。

图7 SSMKB-CNN模型的损失与准确曲线Fig.7 Loss and accuracy curves of the SSMKB-CNN model

由SSMKB-CNN的测试集分类结果混淆矩阵表明, POM的精确率达到了100%, 意味着所有的POM的样品均由模型正确判断为真, 而PES的召回率达到了99%, 说明绝大部分的PES样品成功被模型检出。 F1分数则将精确率与召回率进行平均考虑, 用于衡量模型整体性能, POM的F1分数最高, 为99%。 精确率和F1分数同时达到了98%及以上的微塑料有四种, 分别为ABS、 PES、 POM与PPS, 而召回率在98%及以上的微塑料也有四种, 包括PBT、 PC、 PES和POM, 三项指标均达到98%及以上的微塑料共有两种(PES与POM)。 模型总体分类准确率达到了97.05%, 平均精确率为97.05%, 平均召回率为97.06%, 平均F1分数为97.02%。 分类结果表明该CNN模型有良好的分类性能。

图8 SSMKB-CNN模型的分类结果混淆矩阵Fig.8 Classification confusion matrix of SSMKB-CNN model

图9 AlexNet(a)、 VGG16(b)和ResNet50(c)的训练曲线与分类混淆矩阵Fig.9 Training curves and confusion matrices of (a) AlexNet, (b) VGG16 and (c) ResNet50 models

2.3 分类器性能对比

为了进一步验证本研究提出的基于MTF的SSMKB-CNN模型有效性, 与不同模型进行了分类性能对比, 选择了AlexNet、 VGG16与ResNet50三种CNN模型, 以及使用一维光谱数据集的机器学习算法, 包括随机森林(random forest, RF)、 K-最邻近(K-nearest neighbors, KNN)、 支持向量机(support vector machine, SVM)三种分类器, 其中SVM分别测试了rbf, Linear与Poly三种核函数。 AlexNet、 VGG16与ResNet50是几种知名且成功的深度神经网络模型, 具有网络架构深, 网络参数多, 网络结构复杂的特点, 有着相对更长的训练周期。

表1 基于两种数据集的不同模型的分类结果 Table 1 Classification results of different models based on two data sets

表2给出AlexNet、 VGG16、 ResNet50和SSMKB-CNN训练用时数据, 由表可知本研究提出的CNN模型训练用时最少, 模型训练一轮用时9 s, 训练总用时1 h 29 min。 更多的卷积池化核有助于深层特征信息的提取, 但同时更频繁的降维操作也可能导致部分数据信息的丢失。 用于比较的三种CNN模型在训练过程中, 训练准确率均能近似达到100%并且趋势稳定, ResNet50和VGG16的分类效果较为接近, 准确率分别为94.14%与94.23%。 VGG16取得了三种CNN模型中最高的平均精确率(94.41%)、 召回率(94.22%)和F1分数(94.22%), ResNet50的平均精确率、 召回率与F1分数略低于VGG16, 分别为94.33%、 94.13%与94.15%。 AlexNet的分类精度达到了为93.36%, 其平均精确率为93.63%, 召回率为93.36%, F1分数为93.35%。 在基于一维数据的机器学习方法中, 分类效果最佳的是核函数为Linear的SVM分类器, 准确率达到了95.36%, 精确率为95.39%, 召回率为95.37%, F1分数为95.36%。 RF有着94.73%的准确率, 其精确率与召回率分别为94.81%与94.77%。 KNN的分类效果次之, 其准确率为92.55%, F1分数为92.49%, 精确率和召回率分别为92.71%和92.51%。 核函数为rbf的SVM准确率欠佳, 为85.09%, 其平均精确率、 召回率和F1分数分别为89.38%、 86.31%和86.29%。 核函数为Poly的SVM准确率仅有77.45%, 平均准确率达到了83.73%, 但平均召回率和F1分数仅分别为77.70%与78.33%。 SVM的分类结果整体上呈现精确率优于召回率的特点, RF与KNN算法的指标则更为均衡。 不同分类模型测试性能结果表明, 本研究提出的SSMKB-CNN模型比经典的深度神经网络和机器学习分类器设置了连续小尺寸多卷积的网络结构, 全连接层设置轻量节点, 使得模型复杂度低的同时保证了模型的特征提取能力, 具有相当程度的优势, 训练过程更快, 微塑料分类准确率能够达到97.05%, 整体性能优于上述用于比较的CNN模型与基于一维数据的分类器模型。

表2 不同神经网络模型的训练时长 Table 2 Training time of different neural network models
3 结论

作为近年来越发受到关注的一种新型污染物, 微塑料来源多样, 分布广泛, 容易携带有毒物质, 可直接或间接被生物摄入体内, 损害生物机能, 比一般塑料带来的污染更加广泛严重。 传统的微塑料检测方法存在各种各样的限制与短板, 例如检测周期长, 检测结果缺乏客观性等, 寻找一种准确高效的微塑料检测方法具有重要意义。 拉曼光谱法是一种无损检测方法, 物质成分信息记录在光谱数据中。 近年来深度学习技术发展迅速, 在特征识别、 目标检测、 图像处理等众多领域取得瞩目成就。 受二者技术启发, 提出了一种基于MTF的拉曼光谱和CNN的海水微塑料鉴别方法, 使用激光拉曼光谱仪采得11种微塑料的拉曼光谱, 通过数据增强扩充光谱数据集, 使用MTF变换将转换为包含特征数据的彩色二维图像, 获得微塑料拉曼光谱的MTF图像数据集, 包括PE, PET等11种常见的微塑料样品。 提出一种SSMKB-CNN模型, 首先进行大尺寸大步长的卷积核的卷积操作以初步提取光谱特征并减少数据量, 再连续使用小尺寸单步长卷积核进行深度特征提取。 混淆矩阵结果表明, SSMKB-CNN模型训练准确率达到了100%, 在测试集上的分类准确率为97.04%, 其中POM的精确率为100%, 分类性能优于AlexNet、 VGG16与ResNet50的同时训练时间也少于上述三种经典深度神经网络模型, 且训练精度也由于基于一维光谱数据集的机器学习分类器, 有着兼顾准确与轻量的特点, 分类结果客观, 为微塑料样品快速检测方法提供新的思路与技术参考。

参考文献
[1] Lin C, Chiu M, Kuo M. Polymers, 2022, 14(1) 198. [本文引用:1]
[2] Thompson R C, Olsen Y, Mitchell R P, et al. Science, 2004, 304(5672): 838. [本文引用:1]
[3] Zhang C, Zhou H, Cui Y, et al. Environ. Pollut. , 2019, 244: 827. [本文引用:1]
[4] Kanhai L K, Gardfeldt K, Krumpen T, et al. Sci. Rep. , 2020, 10(1): 5004. [本文引用:1]
[5] Schmid C, Cozzarini L, Zambello E. Marine Pollution Bulletin, 2021, 162: 111820. [本文引用:1]
[6] Hidalgo-Ruz V, Gutow L, Thompson R C, et al. Environmental Science & Technology, 2012, 46(6): 3060. [本文引用:1]
[7] Primpke S, Fischer M, Lorenz C, et al. Analytical and Bioanalytical Chemistry, 2020, 412(30): 8283. [本文引用:1]
[8] Cabernard L, Roscher L, Lorenz C, et al. Environmental Science & Technology, 2018, 52(22): 13279. [本文引用:1]
[9] Ding J, Yu M, Zhu L, et al. Photodiagnosis and Photodynamic Therapy, 2020, 32: 102048. [本文引用:1]
[10] ZHAO Yong, HE Meng-yuan, WANG Bo-lin, et al(赵勇, 何梦园, 王泊林, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2022, 42(5): 1439. [本文引用:1]
[11] Fan J, Wen J, Lai Z. Sensors, 2023, 23(5): 2715. [本文引用:1]
[12] Liu Y, Xu J, Tao Y, et al. The Analyst, 2020, 145(9): 3297. [本文引用:1]
[13] Ng W, Minasny B, McBratney A. Science of The Total Environment, 2020, 702: 134723. [本文引用:1]
[14] Cui L, Zhang C, Zhang Q, et al. Aerospace, 2021, 8(12): 374. [本文引用:1]