基于高光谱成像技术的赤潮藻种鉴别和浓度测量方法
沈英, 吴盼, 黄峰*, 郭翠霞
福州大学机械工程及自动化学院, 福建 福州 350116
*通讯作者 e-mail: huangf@fzu.edu.cn

作者简介: 沈 英, 女, 1982年生, 福州大学机械工程及自动化学院教授 e-mail: yshen@fzu.edu.cn

摘要

赤潮是一种由海洋藻类引发的水质污染, 部分赤潮藻有毒性, 对海洋渔业发展有严重危害。 快速、 准确地鉴定赤潮藻种及其细胞浓度对污染的控制和治理具有重要意义。 传统的显微镜检测和基因测序等方法时效性低, 遥感检测易受到环境干扰导致精度低, 荧光光谱检测因设备昂贵无法大范围推广, 高光谱成像(HSI)技术为赤潮藻种提供了一种快速、 无损的检测方法。 搭建了HSI检测系统, 针对福建地区常见的甲藻(强壮前沟藻)、 硅藻(中肋骨条藻和三角褐指藻)和针胞藻(赤潮异湾藻)构建了大量高光谱样本库, 分别采用2种分类方法和3种回归方法建立藻种鉴别和细胞浓度测量模型, 并比较了7种光谱预处理(标准化、 归一化、 多元散射校正、 变量标准化、 Savitzky-Golay平滑、 基于SG的一阶导数、 基于SG的二阶导数)和2种波段提取方法(遗传算法和连续投影算法)对建模精度的影响。 结果表明: 基于SG的二阶导数(SG+2nd)预处理方法可以提高波段筛选和建模的准确率, 遗传算法(GA)所提取特征波段更具代表性和有效性。 SG+2nd-GA组合所提取特征波段(644.7、 547.8、 562.6、 829.4、 832 nm)与所选藻类中特定色素的吸收光谱波段相对应, 再结合支持向量机(SVM)或反向传播神经网络(BPNN)建模实现了利用高光谱成像技术有效鉴别强壮前沟藻、 赤潮异湾藻、 中肋骨条藻、 三角褐指藻。 在细胞浓度测量中, 支持向量回归(SVR)建模效果优于多元线性回归(MLR)和偏最小二乘算法(PLS), 四种藻SG+2nd-GA-SVR细胞浓度预测模型的决定系数( R2)均大于0.98。 其中强壮前沟藻和中肋骨条藻模型浓度预测范围分别在1.05×103~1.05×104和1.13×104~2.38×105 cells·mL-1, 最低测量浓度达到该藻种发生赤潮时的基准浓度。 三角褐指藻模型浓度预测范围为1.06×105~4.36×106 cells·mL-1, 最低测量浓度低于现有光谱技术对其测量的浓度。 本研究为快速、 准确、 无损探测赤潮提供了新方法。

关键词: 赤潮; 高光谱成像; 藻种鉴别; 浓度测量
中图分类号:X55 文献标志码:A
Identification of Species and Concentration Measurement of Microalgae Based on Hyperspectral Imaging
SHEN Ying, WU Pan, HUANG Feng*, GUO Cui-xia
College of Mechanical Engineering and Automation, Fuzhou University, Fuzhou 350116, China
*Corresponding author
Abstract

Algal bloom, a water pollution caused by marine algae, may threaten the development of fisheries due to some toxic algal species. Rapid and accurate identification of red tide algal species and their cell concentrations is important for pollution control and management. Traditional detection methods such as microscope and gene sequencing have low timeliness, remote sensing is susceptible to environmental interference resulting in low accuracy, and fluorescence spectroscopy is too expensive for widespread use. Hyperspectral imaging (HSI) technology provides a rapid and non-destructive method for detecting red tide algae species. In this study, a HSI detection system was built to establish a large amount of hyperspectral sample libraries constituted of dinophyta ( Amphidinium carterae), bacillariophyta ( Skeletonema costatumand Phaeodactylum tricornutum) and raphidophyceae ( Heterosigma akashiwo). Two classification methods and three regression methods were used to construct models for algal species identification and cell concentration measurement, respectively, and the effects of seven spectral pretreatment methods (Autoscaling, Normalization, Multiplicative Scatter Correction, Standard Normalized Variate, Savitzky-Golay Smoothing, First Derivative Based on Savitzky-Golay, and Second Derivative Based on Savitzky-Golay) and two band extraction methods (Genetic Algorithms and Successive Projections Algorithm) on the accuracy of modelling were investigated. The results showed that the Second Derivative Based on Savitzky-Golay (SG+2nd) pretreatment method can improve the accuracy of band extraction and modelling, and that the feature bands selected by the genetic algorithm (GA) are more representative and effective. The feature bands (644.7, 547.8, 562.6, 829.4, 832 nm) extracted SG+2nd-GA correspond to the absorption spectral bands of specific pigments in the selected algae, combined with Support Vector Machine (SVM) or Back Propagation Neural Network (BPNN) modellingrealized the effective identification of dinophyta, bacillariophyta and raphidophyceae using HSI technology. Compared to Multiple Linear Regression (MLR) and Partial Least Squares (PLS) algorithms, Support Vector Regression (SVR) modelling achieved higher accuracy incell concentration measurements. The coefficients of determination ( R2) of the four algal SG+2nd-GA-SVR cellconcentrations prediction models were all greater than 0.98. Among them, the predicted concentrations of A. carterae e and S. costatumranged from 1.05×103~1.05×104 and 1.13×104~2.38×105 cells·mL-1, with the lowest measured concentrations reaching the benchmark concentrations for this algae species in the event of red tide. The predicted concentrations of P. tricornutum ranged from 1.06×105~4.36×106 cells·mL-1, with the lowest measured concentrations being lower than those of existing spectroscopic techniques. This study provides a new method for rapid, accurate, non-destructive algal blooms detection.

Keyword: Algal blooms; Hyperspectral imaging; Species identification; Concentration measurement
引言

赤潮作为一种全球性的海洋灾害, 严重阻碍了海洋生态和经济的发展[1]。 随着全球, 特别是我国近海赤潮频发, 确定赤潮类型和浓度从而科学有效地防治和减小赤潮危害, 已成为海洋环境保护的重要课题。

目前, 赤潮检测的方法主要有: 观察法、 遥感检测和光谱检测。 传统的人工观察操作过程复杂, 对操作人员专业性要求高。 遥感检测受海面鱼鳞光、 天气等自然环境的影响检测精度低。 光谱技术主要包括吸收光谱、 荧光光谱和高光谱成像(hyperspectral imaging, HSI)技术。 吸收光谱技术测量范围广, 但灵敏度低, 抗干扰能力差。 荧光光谱技术灵敏度高, 但检测设备价格昂贵[2]。 HSI是一种对图像和光谱进行融合的技术, 具有较高的检测精度, 为微藻种类鉴别和细胞浓度检测提供了一种快速、 准确的测量方法。

赤潮藻细胞内含有多种色素, 不同色素种类和比例都会引起赤潮藻吸收光谱和荧光光谱的变化。 基于此利用支持向量机(support vector machine, SVM)成功鉴别了海洋卡盾藻(Chattonella marina)、 东海原甲藻(Prorocentrum donghaiense)和球形棕囊藻(Phaeocystis globasa)[1]。 但由于某些赤潮藻种所含色素种类相近而难以区分, 如甲藻、 硅藻和针胞藻, 利用光谱技术对其进行鉴别的研究鲜有报道。

光谱也广泛运用于浓度测量中, 但受到浓度大小和范围的限制, 在低浓度赤潮藻检测中运用较少, 而多用于高浓度经济微藻的检测。 如Ballardo等[3]利用非线性模型测量四种微藻的细胞浓度, 其中三角褐指藻(Phaeodactylum tricornutum)测量浓度在1.00× 106~1.67× 107 cells· mL-1, 远高于该藻种发生赤潮时的基准浓度(1.00× 104 cells· mL-1)[4]。 同时, 模型测量浓度范围也会影响光谱检测的准确性, 模型浓度范围变化越大, 检测准确性越低。 Guijarro等[5]利用偏最小二乘(partial least squares, PLS)法建立栅藻(Scenedesmus)浓度预测模型时发现浓度范围在2× 106~3× 106 cells· mL-1时, 模型的预测值与观测值最接近, 而此时最高浓度仅为最低浓度的1.5倍, 浓度范围小。

针对甲藻、 硅藻和针胞藻的光谱检测困难, 且低细胞浓度藻液的光谱预测模型精度较低的问题, 搭建HSI系统, 采集了大量甲藻(强壮前沟藻)、 硅藻(中肋骨条藻和三角褐指藻)和针胞藻(赤潮异湾藻)的光谱数据, 对比了不同光谱预处理手段、 波段筛选算法与建模方法的交互影响及其对藻种鉴别和藻细胞浓度测量的影响。

1 实验部分
1.1 藻种和培养条件

选择福建省周边海域常见的4种赤潮藻为检测样本, 分别为强壮前沟藻(Amphidinium carterae)、 赤潮异湾藻(Heterosigma akashiwo)、 中肋骨条藻(Skeletonema costatum)和三角褐指藻, 由厦门大学近海海洋环境科学实验室提供, 使用F/2培养基培养, 盐度为30~35 g· L-1, pH为8.0, 温度控制在22 ℃, 光照强度为6 300 lux, 光照周期为14L∶ 10D。

1.2 高光谱检测系统搭建和数据采集

1.2.1 样本制备和生物量测量

取指数增长期的藻种(104~106 cells· mL-1)加入人工海水进行稀释, 每个藻种设置不少于10个浓度梯度(稀释1、 2、 3、 4、 5、 6、 7、 8、 9、 10倍), 稀释到接近赤潮发生时的基准浓度。 藻细胞浓度用血球计数板和浮游植物计数框在显微镜下获得[6]。 每个浓度设置不少于5个平行样本, 每个样本采集两次取平均, 4个藻种样本总数为398。

1.2.2 光谱采集系统搭建

搭建的高光谱采集系统如图1所示, 包括双利合谱GaiaField-V10E高光谱相机(Dualix Instruments Co., Ltd., China)、 卤素光源、 背景板、 培养皿、 暗箱和电脑。 其中, 高光谱相机波长范围在386.2~1 034.9 nm, 光谱分辨率为2.8 nm, 曝光时间为15.2 ms; 背景板材质为米白色植绒布; 卤素光源由50 W卤素灯和直流稳压控制器组成。 为了避免其他外部光源的影响, 整个高光谱系统置于暗箱中。 将藻液样品充分搅拌均匀, 用移液枪取样5 mL放入直径为35 mm培养皿中, 通过高光谱数据采集系统采样。

图1 高光谱成像系统示意图Fig.1 The schematic diagram of the hyperspectral imaging detection system

1.2.3 高光谱数据校正和提取

为了减少系统误差和外部环境的不利影响, 采用式(1)[7]获得校正后的高光谱图像反射率

${{R}_{\text{ci}}}=\frac{\ \ \ \ \text{Sampl}{{\text{e}}_{\text{ci}}}\ \ -\ \ \text{Dar}{{\text{k}}_{\text{ci}}}\ \ \ \ }{\ \ \text{Whit}{{\text{e}}_{\text{ci}}}\ \ -\ \ \text{Dar}{{\text{k}}_{\text{ci}}}\ \ \ \ }$(1)

式(1)中, Rci为校正后的光谱, Sampleci为原始高光谱图像, Whiteci和Darkci分别为反射率99%标准白板图像和盖上镜头盖获得的暗电流图像。

原始高光谱图像通过式(1)校正后, 用ENVI 5.1(ITT Visual Information Solutions, United States)选取藻液所在区域作为感兴趣区域(平均大小为以70 pixel为直径的圆), 计算感兴趣区域光谱反射率的平均值作为样本的光谱反射率。 对获取的所有样本的光谱反射率数据, 采用SPXY算法(sample set partitioning based on joint x-y distances, SPXY)[8]按照2∶ 1的比例划分建模集和预测集。 化学计量学算法和数字图像处理技术主要由Matlab2018a(The MathWorks, Natick, MA, USA)、 Unscrambler version10.4(CAMO PROCESS AS, Norway)、 OriginPro 2021(OriginLab, Northampton, MA, USA)软件实现。

1.3 预测模型建立

光谱预测模型建立包括光谱数据预处理、 特征波段提取和模型建立三个步骤。

1.3.1 光谱数据预处理

高光谱图像采集过程受光源电压不稳定、 光线不均匀、 仪器精度等因素的影响[7]。 采集的光谱往往带有不同程度的噪声, 在提取特征波段进行建模时, 这种噪声的影响可能会导致建模效果差、 鲁棒性低。 光谱预处理可以减少噪声对特征波段提取以及建模的影响, 从而提高预测模型的精度。 表1所示为筛选的7种预处理方法及其特点。

表1 所选光谱预处理方法及其特点 Table 1 The selected spectral pretreatment methods and their characteristics

1.3.2 特征波段选择

高光谱数据量庞大, 有效地去除背景信息, 提取代表微藻信息的特征波段, 有利于提高效率和准确率。 采用2种特征波段提取方法, 分别是遗传算法(genetic algorithms, GA)和连续投影算法(successive projections algorithm, SPA)。

GA借鉴生物界自然选择和遗传机制的原理, 利用选择、 交叉和变异运算的相互配合, 不断地遗传迭代, 共同完成搜索空间的全局和局部搜索。 使目标函数值较优的变量被保留, 较差的变量被淘汰, 最终得到最优结果。 GA算法采用PLS交互验证的预测值和实际值的相关系数作为适应度函数[9], 迭代次数为100次。

SPA则致力于减少数据冗余和共线性问题。 它始于一个波长, 并为接下来的每一次迭代合并一个新的波长, 直到达到指定数量的波长。 最后在总体方差无显著性差异的情况下, 选择均方根误差最小时对应的波段作为特征波段[10]

1.3.3 建模

由于不同波段和类型的光谱特征有所不同, 且检测对象的目标特性也不尽相同, 因此, 两者间的关系具有不确定性。 光谱建模算法各有优势, 需要针对不同的应用对象, 选择合适的算法。 本研究采用两种分类方法和三种回归模型分别进行藻种鉴别和浓度测量, 不同建模方法的特点如表2所示。

表2 所选光谱建模方法及其特点 Table 2 The selected spectral modelling methods and their characteristics

1.3.4 模型评估

藻种鉴别模型利用准确率(accuracy)进行评价, 而浓度测量模型则通过决定系数(coefficient ofdetermination, R2)、 平均绝对误差(mean absolute error, MAE)和平均相对误差(mean absoluterelative error, MARE)来评价, R2、 MAE和MARE的值可由式(2)、 式(3)和式(4)[6]计算得到

${{R}^{2}}=1-\frac{\ \ \ \ \overset{n}{\mathop{\mathop{\sum }_{i=1}}}\, {{(\ {{y}\ _{\text{true}, i}}\ \ -\ \ {{y}\ _{\text{pre}, i}}\ \ \ )}\ ^{2}}\ \ \ \ \ \ }{\ \ \ \overset{n}{\mathop{\mathop{\sum }_{i=1}}}\, {{\ (\ {{y}\ _{\text{true}, i}}\ \ -\ \ {{y}\ _{\text{mean}}}\ \ \ )\ }^{2}}\ \ \ \ }$(2)

式(2)中, yture, i为第i个样品的真值, ypre, i为第i个样品的模型预测值, ymean所有样品真值的平均值, n为样品个数。

$MAE=\frac{1}{n}\overset{n}{\mathop{\underset{i=1}{\mathop \sum }\, }}\, \left| {{{{\hat{y}}}}_{i}}-{{y}_{i}} \right|$ (3)

$\text{MARE}=\frac{1}{n}\overset{n}{\mathop{\underset{i=1}{\mathop \sum }\, }}\, \left| \frac{{{{{\hat{y}}}}_{i}}-{{y}_{i}}}{{{y}_{i}}} \right|$(4)

式中, n为样本个数, yi为第i个样本真值, ${{{\hat{y}}}_{i}}$为第i个样本预测值, MAE和MARE都大于0, 其值越小, 表示模型预测结果越好。

2 结果与讨论
2.1 藻种分析

赤潮发生时赤潮藻会消耗水中的溶解氧, 导致动物窒息性死亡, 造成经济损失, 影响海洋渔业的发展。 如表3所示, 强壮前沟藻(甲藻)、 赤潮异湾藻(针胞藻)、 中肋骨条藻(硅藻)和三角褐指藻(硅藻)对生态环境的影响各不相同。 所以, 通过光谱分析来实现藻种鉴别具有重要意义。

表3 四种赤潮藻的生物和光谱信息 Table 3 Biological and spectral informations of the four red tide algae species

图2(a)— (d)分别显示了强壮前沟藻(细胞浓度在 1.05× 103~1.05× 104 cells· mL-1之间)、 赤潮异湾藻(细胞浓度在1.05× 104~2.51× 105 cells· mL-1之间)、 中肋骨条藻(细胞浓度在1.13× 104~2.38× 105 cells· mL-1之间)和三角褐指藻(细胞浓度在1.06× 105~4.36× 106 cells· mL-1之间)的原始光谱曲线。 如图2(a)和(c)所示, 强壮前沟藻和中肋骨条藻的光谱曲线形状相似, 在400~450和685~710 nm分别存在一个较大的反射谷和反射峰。 可能的原因是强壮前沟藻和中肋骨条藻色素种类和比例相似(见表3), 受到叶绿素a(Chla)和叶绿素c(Chlc)的叠加作用在400~450 nm形成一个较大的反射谷[16], 而685~710 nm的反射峰是赤潮水体的特征反射峰[17]。 如图2(b)和(d)所示, 赤潮异湾藻和三角褐指藻的光谱曲线形状相似。 可能的原因是赤潮异湾藻与三角褐指藻色含有大量Chla使得光谱曲线在440和675 nm波段附近形成反射谷外, 且都含有大量岩藻黄素使得光谱曲线在489~491 nm处有反射谷(见表3)。 所以, 采用原始光谱很难将这四个种类的赤潮藻区分开, 需要建立模型来表示藻种光谱信息与藻种类别之间的关系, 以达到鉴别藻种的目的。

图2 原始光谱曲线
(a): 强壮前沟藻; (b): 赤潮异湾藻; (c): 中肋骨条藻; (d): 三角褐指藻
Fig.2 The original hyperspectral spectra
(a): Amphidinium carterae; (b): Heterosigma akashiwo; (c): Skeletonema costatum; (d): Phaeodactylum tricornutum

2.2 藻种鉴别结果分析

将原始光谱(Raw)数据和经过7种预处理(见表1)后的数据用两种波段筛选方法(分别是GA和SPA)提取特征波段, 然后采用SVM和反向传播神经网络(back propagation neural network, BPNN)进行建模, 其结果如图3所示。 由图3(a)可知基于Savitzky-Golay平滑的二阶导数结合GA(SG+2nd-GA)的组合方法在采用SVM和BPNN两种建模方法时都获得了100%的准确率, 由图3(b)可知SG+2nd-SPA组合方法在采用SVM和BPNN两种建模方法时也分别取得了98.5%和96.2%的准确率。 结果表明恰当的预处理方法可以提升波段筛选的准确率, 从而提高建模的精度。 采用SG+2nd的预处理方法可以提高波段筛选和建模的准确率, 适用于低浓度具有相似光谱曲线的赤潮藻种鉴别。

图3 四种赤潮藻经(a)GA和(b)SPA提取特征波段的鉴别的结果Fig.3 Identification results of four red tide algae species with (a) GA and (b) SPA based on selected characteristic selecting wavelengths

从图3中还可以看出波段筛选方法对模型准确率有关键性的影响, 采用GA波段筛选方法时, 不同的预处理与建模方法对模型预测精度的影响较小(准确率在93.9%~100.0%之间), 而采用SPA波段筛选方法时, 不同预处理与建模方法对模型预测精度的影响较大(准确率在18.9%~100.0%之间)。 为了进一步分析原因, 表4列出了基于不同预处理算法GA和SPA提取出的特征波段。 由表4可知, GA提取的特征波段位于450.6~837.2 nm之间, 主要集中在450.6~494.0和552.7~644.7 nm, 这些波段位于藻细胞中不同色素对光的吸收波段范围内(见表3)。 而SPA提取的特征波段位于386.2~1 032.1 nm之间, 部分位于386.2~393.3和1 032.1 nm, 这些波段在高光谱相机光谱探测范围的两端, 受噪声影响大, 不适合作为代表藻种信息的特征波段。 上述结果表明GA提取的特征波段更具代表性和有效性, 而SPA提取的部分特征波段受噪声影响大不利于建模。

表4 不同预处理算法处理后GA和SPA所提取的特征波段 Table 4 Feature bands extraction results of GA and SPA based on different pretreatment methods

特征波段的代表性和有效性是影响藻种鉴别准确率的关键。 如表4所示, SG+2nd-GA提取的特征波段为547.8、 562.6、 644.7、 829.4和832.0 nm, 这可能与不同微藻细胞内色素种类和比例有关。 其中547.8 nm可能与岩藻黄素吸收有关, 岩藻黄素是赤潮异湾藻、 中肋骨条藻和三角褐指藻主要色素之一, 而在强壮前沟藻中不存在(见表3)。 562.6 nm波段则是受到Chla的影响[2]。 644.7 nm可能是同时受到Chla和Chlc的影响[18]。 829.4和832.0 nm是由于藻液中水的O— H键的作用[18]。 波段出现稍微偏移的原因可能是: (1)不同藻种色素种类和比例不同; (2)同藻种不同生长周期色素含量不同; (3)同藻种不同个体色素含量不同[19]。 综上所述, SG+2nd-GA提取的波段是各藻种中不同色素对光吸收的特征波段, 所以能够100%成功鉴别强壮前沟藻、 赤潮异湾藻、 中肋骨条藻和三角褐藻。

2.3 藻细胞浓度预测模型结果分析

根据前面的描述, SG+2nd-GA的组合方式对4种赤潮藻的光谱曲线降噪和筛选特征波段具有一定的优势。 图4标记了4个藻种SG+2nd-GA处理后的特征波段, 其中, 强壮前沟藻的特征波段是577.4、 667.4、 669.9、 672.5和675.0 nm, 赤潮异湾藻的特征波段是654.8、 667.4、 672.5和675.0 nm, 中肋骨条藻的特征波段是669.9、 672.5和675.0 nm, 三角褐指藻的特征波段是652.3、 680.1和695.3 nm。 不同色素对特定波长处的光吸收度是进行浓度预测的可靠指标, 利用叶绿素在684 nm处对光的吸收度曾被用来测量近头状尖胞藻(Pseudokirchneriella subcapitata(Korschikov)Hindá k)的细胞浓度, 且模型预测R2达到0.999 8[20]。 四种赤潮藻的浓度预测模型波段主要集中在红光区域(620~780 nm), 该区域是Chla的主要吸收光谱范围。 其中强壮前沟藻、 赤潮异湾藻和中肋骨条藻都选择675 nm作为特征波段之一, 这与许多学者认为Chla在675 nm处有光谱吸收峰相一致[2, 21]。 此外, 577.4 nm[如图4(a) 所示]作为强壮前沟藻细胞浓度特征波段, 可能与强壮前沟藻富含有Chlc有关[16], 根据2.2中特征波段出现微偏移可能的原因, 对四种赤潮藻浓度进行预测时选择的波段还与Ballardo等[3]使用677 nm处的吸收系数预测三角褐指藻的浓度相符合。

图4 SG+2nd预处理后4种微藻的光谱曲线(红点标记处为GA所选特征波段)
(a): 强壮前沟藻; (b): 赤潮异湾藻; (c): 中肋骨条藻; (d): 三角褐指藻
Fig.4 Spectral curves of the four microalgal species with the SG+2nd pretreatment (the highlighted bands were selected with GA)
(a): Amphidinium carterae; (b): Heterosigma akashiwo; (c): Skeletonema costatum; (d): Phaeodactylum tricornutum

进行藻种浓度测量时, 浓度范围与测量误差是考量模型价值的重要因素。 如表5所示, 应用了三种建模方法(分别是多元线性回归(multiple linear regression, MLR)、 PLS和支持向量回归(support vector regression, SVR))对四种赤潮藻建立浓度预测模型, 结果表明四种赤潮藻的SVR建模集和预测集R2均大于0.98。 其中, 强壮前沟藻和中肋骨条藻模型浓度预测范围分别在1.05× 103~1.05× 104和1.13× 104~2.38× 105 cells· mL-1, 最低浓度达到该藻种发生赤潮时的基准浓度。 相比商业型藻种(如小球藻、 螺旋藻等), 赤潮藻的细胞浓度较低, 且叶绿素含量也较低, 造成光谱反射率波动范围小, 建模难度大, 且建模精度将随着细胞浓度的下降而急剧下降, 这也是应用光谱测量手段探测初期赤潮遇到的瓶颈。 Ballardo等[3]应用分光光度计实现了三角褐指藻藻种浓度的预测, 达到的最低预测浓度为1.37× 106 cells· mL-1, 而本工作应用高光谱探测的手段实现对该藻种最低浓度1.06× 105 cells· mL-1的预测, 说明本文提出的SG+2nd-GA-SVR建模方法具有一定的先进性。

表5 SG+2nd-GA处理后不同建模方法细胞浓度预测结果 Table 5 Cell concentration prediction results of different modelling methods based on SG+2nd pretreatment and GA wavelength selection

表5所示, SVR非线性建模方法, 效果优于MLR和PLS线性建模效果。 可能的原因是微藻细胞浓度预测模型主要建立微藻细胞内色素浓度与吸收系数之间的关系。 由于“ 包络效用” 使色素浓度与赤潮藻吸收系数之间并不是简单的线性关系, 而是一种复杂的非线性变化[21], 如Chl a与光谱反射率之间存在幂指数关系[22]

3 结论

采用高光谱测量手段对强壮前沟藻、 赤潮异湾藻、 中肋骨条藻和三角褐指藻四种赤潮藻种进行鉴别和细胞浓度测量。 比较了7种预处理方法和2种数据降维方法, 结果表明SG+2nd-GA的组合方式对这四种赤潮藻的光谱曲线降噪和特征波段提取具有一定的优势, 通过提取5个波段与SVM或BPNN结合能100%鉴别这四种微藻。 藻细胞模型浓度预测结果表明色素是判断赤潮浓度的一个重要因素。 此外, SG+2nd-GA-SVR在三种浓度预测模型中预测结果最好, 四种藻预测模型R2均大于0.98, 其中强壮前沟藻和中肋骨条藻最低预测浓度达到该藻种发生赤潮时的基准浓度, 三角褐指藻突破了现有光谱技术对其预测的最低浓度。 本研究所建立的高光谱反射系统藻种鉴别和浓度预测方法, 为快速、 无损探测赤潮提供了新方法, 为赤潮监测和防治提供了新依据。

参考文献
[1] QI Xiao-li, WU Zhen-zhen, ZHANG Chuan-song, et al(齐晓丽, 吴珍珍, 张传松, 等). Periodical of Ocean University of China[中国海洋大学学报(自然科学版)], 2016, 46(12): 73. [本文引用:2]
[2] Liu J Y, Zeng L H, Ren Z H. Applied Spectroscopy Reviews, 2021, 56(3): 171. [本文引用:3]
[3] Santos-Ballardo D U, Rossi S, Hernández V, et al. Aquaculture, 2015, 448: 87. [本文引用:3]
[4] State Oceanic Administration(国家海洋局). HY/T 069—2005 (2005), Technical Specification for Red Tide Monitoring(HY/T 069—2005, 赤潮监测技术规程), 2005. [本文引用:1]
[5] Martínez-Guijarro R, Pachés M, Ferrer J, et al. Environmental Technology & Innovation, 2018, 10: 122. [本文引用:1]
[6] Liu J Y, Zeng L H, Ren Z H, et al. Algal Research, 2020, 45: 101739. [本文引用:2]
[7] Li X L, Chen K, He Y. Algal Research, 2020, 45: 101680. [本文引用:2]
[8] Galvao R K H, Araujo M C U, Jose G E, et al. Talanta, 2005, 67(4): 736. [本文引用:1]
[9] Leardi R, González A L. Chemometrics and Intelligent Laboratory Systems, 1998, 41(2): 195. [本文引用:1]
[10] Shao Y N, Li Y, Jiang L J, et al. Water Research, 2016, 104: 432. [本文引用:1]
[11] Baig H S, Saifullah S M, Dar A. Harmful Algae, 2006, 5(2): 133. [本文引用:1]
[12] Jack Rensel J E, Haigh N, Tynan T J. Harmful Algae, 2010, 10(1): 98. [本文引用:1]
[13] Li C Q, Zhu B B, Chen H, et al. Journal of Coastal Research, 2009, 25(3): 651. [本文引用:1]
[14] Morais K C C, Conceição D, Vargas J V C, et al. Renewable Energy, 2021, 163: 138. [本文引用:1]
[15] Chao Rodríguez Y, Domínguez Gómez J A, Sánchez-Carnero N, et al. Algal Research, 2017, 26: 463. [本文引用:1]
[16] Clementson L A, Wojtasiewicz B. Data in Brief, 2019, 24: 103875. [本文引用:2]
[17] ZHAO Dong-zhi(赵冬至). Research Corpus of Redtide Monitoring and Evaluation in Bohai(渤海赤潮灾害监测与评估研究文集). Beijing: Ocean Press(北京: 海洋出版社), 2000. 118. [本文引用:1]
[18] Challagulla V, Walsh K B, Subedi P. Bioenergy Research, 2014, 7(1): 306. [本文引用:2]
[19] ZHU Hong-yan, SHAO Yong-ni, JIANG Lu-lu, et al(朱红艳, 邵咏妮, 蒋璐璐, 等). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2016, 36(1): 75. [本文引用:1]
[20] Rodrigues L H R, Arenzon A, Raya-Rodriguez M T, et al. Journal of Environmental Chemistry and Ecotoxicology, 2011, 3(8): 225. [本文引用:1]
[21] Catlett D, Siegel D A. Journal of Geophysical Research: Oceans, 2018, 123(1): 246. [本文引用:2]
[22] Bricaud A, Claustre H, Ras J, et al. Journal of Geophysical Research: Oceans, 2004, 109(C11). doi: DOI:10.1029/2004JC002419. [本文引用:1]