混合光谱曲线的Fast ICA盲源解混及影响因子研究
戴佳乐, 汪金花*, 李孟倩, 韩秀丽, 缪若梵
华北理工大学矿业工程学院, 河北 唐山 063210
*通讯作者 e-mail: jinhua66688@126.com

作者简介: 戴佳乐, 1997年生, 华北理工大学矿业工程学院硕士研究生 e-mail: daijiale@stu.ncst.edu.cn

摘要

混合物高光谱分析是矿物无损检测的关键技术。 文中将混合物350~2 500 nm区间光谱反射率变化看作时域变化的一维序列信号, 将混合物光谱分离转变为时域信号的盲源分离问题。 为了分析混合光谱解混速度和准确度的影响因子, 采用Fast ICA数学模型对混合物实测高光谱反射曲线进行了盲源解混试验, 从解混过程的白化方式、 初始权阵, 源光谱高斯性3个方面分析了光谱解混的结果, 为混合物光谱检测的后期分析提供了研究基础。 选取化学纯氧化铜和氧化亚铜混合物、 碱式碳酸铜和氢氧化铜混合物为试验对象, 采用解混性能指数PI、 光谱均方根误差和光谱角距离作为评价指标, 开展了源光谱高斯性与 g函数、 ZCA和PCA白化方式、 及单位权、 随机权、 指定权3种初始权对解混光谱结果影响的对比实验。 实验结果表明: Fast ICA算法在未知混合矿物高光谱先验信息的基础上, 能够有效分离出混合物组分源光谱, 样本分离精度PI值均小于0.18, 光谱盲源解混的效果显著。 解混后光谱曲线与源光谱曲线在特征趋势上保持一致, 具有相同的吸收位置和特征峰, 但是存在一定尺度的差异。 另外, 源光谱的高斯性与解混 g函数的选取会直接影响解混结果, 亚高斯区间曲线分离精度优于超高斯部分。 依据高斯性进行分段解混结果的吸收特征会更加突出, 与源光谱反射率数值差异也随之增大; 光谱预处理的白化方式会对解混结果精度产生微小影响, 经过ZCA白化后解混结果的分离精度、 光谱的准确度均略高于PCA白化; 在Fast ICA模型3种初始权解混结果对比发现, 以初次迭代结果计算的指定权进行迭代解混时, 其分离精度、 解混准确度及解混时间均为最佳, 解混过程更易收敛。 结果表明, 根据全波段高斯性来选取g函数解混效果最优, 分离指数PI小于0.14, 光谱角距离在0.1左右, ZCA白化比PCA白化对解混光谱的影响更小, ZCA白化后的两组混合物解混的分离指数在0.1左右, 而PCA白化的分离指数PI均高于0.13, 当指定权作初始权时有助于提高牛顿迭代中收敛速度, 使解混光谱更接近组分已知光谱, 指定权的解混时间低于0.2 s, 其他两种定权方式均在0.3 s以上。

关键词: 混合光谱解混; Fast ICA盲源解混; 高斯性; 白化; 初始权
中图分类号:O657.3 文献标志码:A
Research on Fast ICA Blind Separation Algorithm of Mixed Hyperspectral and Influencing Factors
DAI Jia-le, WANG Jin-hua*, LI Meng-qian, HAN Xiu-li, MIAO Ruo-fan
College of Mining Engineering, North China University of Science and Techonlogy, Tangshan 063210, China
*Corresponding author
Abstract

Hyperspectral analysis of mixtures is a key technology for nondestructive testing of minerals. The spectral reflectance variation of mixtures in the 350 nm to 2 500 nm interval is regarded as a one-dimensional sequence signal with time-domain variation, and the mixture spectral separation is transformed into a blind source separation problem of time-domain signals in the paper. In order to analyze the influencing factors of the speed and accuracy of mixture spectral demixing, a blind source demixing test was conducted on the measured hyperspectral reflectance curve of the mixture using Fast ICA mathematical model, and the results of spectral demixing were analyzed from three aspects of the demixing process: the whitening mode, the initial power array, and the Gaussianity of the source spectrum, which provided a research basis for the later analysis of the mixture spectral detection. The chemically pure copper oxide and cuprous oxide mixtures, alkaline copper carbonate and copper hydroxide mixtures were selected as test objects. The source spectral Gaussianity was compared with the g-function, ZCA and PCA whitening methods, and three initial weights of unitary, random and specified weights on the unmixing spectral results using the unmixing performance index PI, the root mean square error of the spectrum and the angular distance of the spectrum as evaluation indexes. The experimental results show that the Fast ICA algorithm can effectively separate the mixture component source spectra based on unknown hyperspectral a priori information of mixed minerals. The sample separation accuracy PI values are all less than 0.18, and the effect of spectral blind source unmixing is remarkable. The spectral curves after unmixing are consistent with the source spectral curves in terms of characteristic trends, with the same absorption positions and characteristic peaks, but there are certain scale differences. In addition, the Gaussianity of the source spectrum and the selection of the unmixing g function directly affect the value of the unmixing results, and the separation accuracy of the sub-Gaussian interval curve is better than that of the super-Gaussian part. The absorption characteristics of the segmental demixing results based on Gaussianity are prominent, and the difference with the reflectance values of the source spectra increases; the whitening method of spectral preprocessing has a small impact on the accuracy of the demixing results, and the separation accuracy and spectral accuracy of the demixing results are slightly higher after ZCA whitening than PCA whitening; the comparison of the demixing results of the three initial weights of the Fast ICA model shows that the initial iterations with In the comparison of the three initial weights of the Fast ICA model, it was found that the separation accuracy, demixing accuracy and demixing time were the best and the demixing process was easier to converge when the specified weights calculated by the first iteration were used for the iterative demixing. The results show that the g-function is selected according to the full-band Gaussian performance to demix the best. The separation index PI is less than 0.14, the spectral angular distance is about 0.1, ZCA whitening has less effect on the demixing spectrum than PCA whitening, the separation index of the two groups of mixtures after ZCA whitening is about 0.1, and the separation index PI of PCA whitening is higher than 0.13 when the designation right is used as the initial weight, it helps to improve the convergence speed in the Newton iteration, so that the unmixing spectrum is closer to the known spectrum of the components, the unmixing time of the specified weight is less than 0.2 seconds, and the other two weighting methods are more than 0.3 seconds.

Keyword: Spectral mixing; Spectral fast ICA blind source de-mixing; Gaussianity; Whitening mode; Initial weight
引言

高光谱检测[1]是物质定性识别的重要手段, 具有无损、 快速、 环保的特点, 混合光谱的定性识别和定量解算是高光谱分析的核心技术。 当高光谱检测目标是纯净物质时, 通常是实测光谱与已知光谱库进行拟合匹配, 就能够确定检测目标的属性。 当检测目标是混合物时, 光谱匹配[2]方法不够准确检测混合物成分。 混合物的光谱曲线通常是每种成分物质的光谱线性组合, 受到每种成分物质的粒径[3]、 湿度等多种因素影响。 比值导数法[4]是常用的一种混合光谱解混方法, 一般可以实现单个波段的光谱解混。 汪金花[5]等采用比值导数法对混凝土水化产物进行光谱解混, 通过分析分度结果验证了比值导数解混模型对混凝土水化产物光谱检测有效, 但检测实际水化产物光谱受到多种因素影响, 解混后丰度存在偏差。 盲源分离算法属于成分分析法[6], 主要是利用数据统计特征进行成分识别方法。 仅根据输入观测信号的统计特性, 恢复出信源的各个独立成分, 该方法在语音增强、 通信系统、 生物医学、 地震勘测和信息安全等领域具有广泛的应用。 一些研究尝试利用盲源解混算法来解决图像像元混合光谱的分离问题, 取得较好的分离效果。 赵春晖[7]等对高光谱图像端元光谱分解过程, 根据正交子空间投影具有分离感兴趣信号与不感兴趣信号的特点, 将像元投影到全部地物端元构成的正交子空间上, 构建了一种改进的多端元解混算法, 提高了反演端元的丰度正确性, 降低了解混的时间。 林娜[8]构建了基于核方法的KLSOSP、 KFCLS高光谱线性解混算法, 利用增加核函数的核主成分分析、 核分离变换算法对含多种矿物地区的多端元高光谱图像进行解混, 有利于提高混合像元解混速度和精度。 Fast ICA算法是盲源分离一种经典模型, 具有运行简单快速特点。 一些研究对Fast ICA算法进试验分析和算法优化。 杨蕾[9]等对壁画混合颜料光谱信息进行解混分析时, 构建了一种聚类优化的Fast ICA解混算法, 避免随机选取初始值对混合颜料光谱信息解混的影响。 吴微[10]等在Fast ICA算法基础上, 提出了基于迭代的白化算法, 解决了超定含噪盲源分离不稳定的问题。 孙婷婷[11]等在对超高斯地震信号去噪以及分解过程中, 提出基于峰度的ICA分离算法, 采用峰度作为高斯性的判度标准以此调整g函数, 降低了解混算法迭代次数。 将夕平[12]等在对解混岩矿组分信息时, 应用了Fast ICA、 Robust ICA算法, 发现Fast ICA 对初始值、 迭代步长比较敏感, Fast ICA峭度目标函数会直接影响分离信号的质量。

针对混合光谱检测的不确性问题, 利用Fast ICA分解算法实现混合光谱的解混分离, 突破混合矿物光谱检测的先验条件限制, 为混合光谱分析提供一种更为高效、 无损的分析方法, 并对分离算法模型进行验证。 文中假设混合高光谱是350~2 500 nm区间时域变化的一维序列信号, 那么混合光谱的源光谱分离问题就转换成了时域信号的盲源分离问题。 运用Fast ICA数学模型对实测混合物的高光谱反射曲线进行了盲源解混试验, 分析算法的白化方式、 初始权阵, 源光谱高斯性对解混速度、 准确度的影响。

1 Fast ICA盲源解混
1.1 Fast ICA解混模型

盲源分离算法属于成分分析法, 主要利用数据统计特征进行成分识别。 盲源分离算法不需要输入大量的先验知识, 仅需要依靠混合光谱数据集的统计特性, 解混出源信号的各个成分。 ICA算法是通过对分离矩阵的估计, 使得输出信号逼近输入信号, 这种方法是建立在LMM约束端元与丰度之间相互独立的基础之上。 Fast ICA(fast independent component analysis)算法[13]是在源信号统计独立条件下, 对混合信号盲源分离的一种方法, 有解混收敛速度快、 分离效果好的优点。 设某种混合物的高光谱反射率曲线, 是构成组分的源光谱按照一定比例的线性混合, 那么混合物光谱混合模型可定义为,

mv=As+ε(1)

式(1)中, mvRt× 1表示一个混合光谱向量, 其中t为光谱波段数; ARt× u表示各个组分光谱向量, u表示组分个数; sRu× 1表示组分丰度矩阵。 ε Rt× 1表示噪声, t维高斯随机噪声或模型误差, 或不确定性因子。

根据光谱曲线的实际物理意义, 每个组分光谱向量需要满足非负性的约束条件, 一个样本组分混合的丰度矩阵需要同时满足非负性以及和为1的约束条件。

Sij=1, i, j, Sij> 0(2)

在实际生产中, 一种混合物光谱曲线可以近似看作多个独立成份光谱的加性组合。 大量统计实验发现[14], 混合物光谱一般比组分源光谱更加接近高斯分布, 或者说组分源光谱的非高斯性比混合光谱的非高斯性更加强。 根据这一观点, 盲源解混时可以以非高斯性作为分离效果的度量。 当解混结果的非高斯性达到最大时, 认为实现了混合光谱的最佳分离。 Fast ICA盲源分离过程就是应用了这一观点, 通过牛顿不动点迭代法不断迭代计算, 修正解混矩阵, 直到分离信号具有最大化非高斯性。

Fast ICA解混约束法则为,

J(S)=maxi=1pci{E[Gi(S)]-E[Gi(v)]}2(3)

式(3)中, c为常数, v是高斯随机变量, S为丰度矩阵。

实际迭代计算过程是寻找一个最优方向权值W, 使得该方向上分离信号的非高斯性最大, 进而求解组分源光谱基向量A。 权值的迭代计算见式(4),

Wk+1=W-E[Zg(WTkZ)]+βWkE[Zg'(WTkZ)]+β(4)

式(4)中, k为迭代次数, β =E[WTZg(WTZ)]为一个恒定值, g为分段线性函数。

1.2 盲源解混影响因素

混合光谱解混过程中需要关注几个因素。 源光谱的高斯性, 实测光谱的均值白化预处理方式, 解混过程初始权值设定方法等, 解混过程中这些因素变化可能直接影响解混结果准确性。

(1)光谱高斯性

在Fast ICA光谱解混算法时, 其解混约束法则要求解混方向上的非高斯性最大。 解混时选取分线性函数g是根据源光谱高斯性来选取。 一个源信号yi的高斯性通常是用峭度衡量, 定义为:

kurt(yi)=cum[yi4(t)]=E{yi4(t)}-3(E{yi2(t)})2(5)

当cum[yi4(t)]=0是高斯信号, cum[yi4(t)]< 0, 则是亚高斯信号, 如果cum[yi4(t)]> 0, 则是超高斯信号。 解混时式(4)中g分线性函数一般是依据源光谱的峭度和偏度来进行设定。 当源信号峭度为超高斯和亚高斯时, g取tanh; 当源信号全为超高斯或对稳定性有要求时, guexp -u22; 源信号全为亚高斯时, gu3; 当源信号为偏态分布信号时, gu2u为一个具有零均值和单位方差的高斯随机变量。

矿物光谱曲线不是一个简单周期信号, 由于物质本身的结构、 颜色、 粒径不同, 光谱在350~2 500 nm区间呈现起伏变化, 可能出现多个峰值, 也可能比较平缓。 因此, 整个全波部高斯性与局部高斯性会出现不同, 需要根据具体情况来确定盲源解混过程的函数g

(2)白化方式

应用Fast ICA进行解混, 要求输入数据经过归一化、 白化处理。 归一化是对原始数据中心化, 处理后光谱转化为零均值向量。 白化是对信号施加一个线性变换使其变为白色信号处理过程, 白色信号是指它的各分量相关性较低, 且所有特征具有相同的方差, 其协方差矩阵为单位矩阵。 混合光谱取不同波段反射率值存在明显差异, 有的波段吸收峰值高, 有的波段吸收谷的值小。 为了保证解混的精度, 要进行归一化和白化处理, 除去冗余信息。

表1 盲源解混高斯性与g函数的选取 Table 1 Blind source unmixing g function determination

目前, 常用白化方式有PCA(principal component analysis, PCA)白化和ZCA(zero-phase component analysis, ZCA)白化。 对输入数据X进行白化处理, 见式(6)和式(7)

ZPCA=S-12UTX(6)

ZZCA=S-12UTU(7)

式(6)和式(7)中, U为数据协方差矩阵的特征向量, S为特征值矩阵。 PCA白化对数据降维同时, 也去除数据间相关性。 ZCA白化主要是去除了数据间的相关性, 变换数据与原始数据相似。 同一种数据经过PCA白化和ZCA白化后数据是不一样, 不可避免地会影响盲源解混分离出结果的精度和准确性。

(3)初始权确定

由Fast ICA算法约束函数可知, 初始权矩阵W直接已知量直接参与盲源分离的迭代运算。 因此, 如何确定初始权矩阵, 不仅会影响盲源解混的计算速度, 还有可能影响解混结果的准确性。 目前有3种初始权。 一些研究认为初始权矩阵最终会通过牛顿迭代达到收敛值, 对分离结果影响程度不大, 所以常任意设定一个随机矩阵作为初始权矩阵。 有些研究认为盲源信号中所有组分的源信号理论上相等, 通常设定单位矩阵为初始权矩。 最多应用研究是采用牛顿迭代的初始权, 见式(8)。 通常根据初次确定组分的丰度矩阵, 计算下一次迭代的权重。 这种方法的解混收敛速度往往较慢, 但解混结果更贴近源光谱。

Wi, j{0}=1(|Si, j{0}|+eps)(8)

式(8)中, Si, j{1}为第1次迭代的丰度矩阵, eps是趋近0的常数值。

2 实验部分
2.1 实验数据

选择矿物作为主要实验样本, 实测高光谱曲线可以更好地反映光谱特征, 因此在矿物种类精细识别, 以及矿物成分定量反演等方面有突出优势。 矿物光谱混合具有线性混合的特点。 相对于其他谱段, 矿物吸收系数较高, 利用线性解混技术可以对矿物进行定性和定量识别。 本文主要选择铜的矿物, 含铜矿物主要有一价铜, 二价铜, 都是含铜矿物因此光谱曲线有一定相似性, 作为混合光谱解混实验最具代表性。

选取铜矿物的化学纯样本进行混合实验, 化学纯较为纯净不含任何杂质, 在解混中不会带来其他影响因素。 不同含铜矿物的成分有区别, 在光谱曲线中的吸收位置也有区别。 第一类样本是铜的氧化物, 氧化铜(CuO)、 氧化亚铜(Cu2O); 第二类样本是铜的碳酸盐矿物, Cu2(OH)CO3和Cu(OH)2化学纯粉末。 样本A是氧化铜和氧化亚铜混合物, 样本B是碱式碳酸铜和氢氧化铜混合物。 按照总质量不变, 变化两种物质体积的占比来制作混合样品, 每类样本共制成12组不同比例的样品, 见表2。 首先, 用千分位精密电子天平称取两种粉末, 导入量杯用电动搅拌棒进行充分混合, 将混合物倒入黑色纸盒, 震荡至样本表面平整, 然后使用ASD光谱仪进行光谱数据采集。

表2 试验A组和B组样本的物质摩尔质量配比 Table 2 Molar mass ratio of samples from test group A and group B

测量光谱时, 选择在室内自然光下测量, 保持矿物探头垂直于样本并且保持2 mm左右的距离。 为了保证均匀采样, 降低测量误差, 采用“ 蛇形” 采样的方法。 在样品表面选取60点, 每个点采集一条光谱曲线。 样品光谱最终是60条光谱数据的平均值。 采集光谱数据经过平滑, 归一化后曲线, 作为盲源解混的基础数据。 图1是按比例制作混合物的光谱曲线。 从图中可以看出, 混合物的光谱曲线反射幅值始终位于两条源光谱曲线之间, 按照比例有规律的渐变。 如图1(a)中深紫色曲线为氧化亚铜, 在550 nm时有吸收谷, 在2 200 nm位置有一个羟基吸收出现的吸收谷; 浅黄色曲线为氧化铜, 吸收位置与氧化亚铜大部分相似, 但在850 nm时有Cu2+吸收位置。 图1(b)中灰色的曲线是Cu(OH)2, 在650 nm表现出铜离子的吸收谷, 在1 450 nm波段处有水离子的吸收位置, 在1 900 nm的吸收位置也是因为水和羟基的吸收, 2 200和2 400 nm的有碳酸根振动吸收。 图中红色光谱曲线是Cu2(OH)2CO3, 与Cu(OH)2吸收位置相似, 但对应位置的吸收深度明显不同。

图1 混合光谱曲线
(a): Cu(OH)2与Cu2(OH)2CO3混合光谱曲线; (b): CuO与Cu2O混合光谱曲线
Fig.1 Mixed spectral curve
(a): Cu(OH)2 and Cu2(OH)2CO3 mixed spectral curve; (b) CuO and Cu2O mixed spectral curve

2.2 实验方案

实验通过混合光谱的解混试验, 研究混合光谱进行Fast ICA算法解混时, 光谱高斯性、 白化方式和初始权3个影响因子对解混结果精准性的影响。 具体技术路线如图2所示。

图2 Fast ICA盲源解混影响因子试验方案Fig.2 Fast ICA experimental protocol for blind-source unmixing of influencing factors

(1)光谱高斯性分析试验。 矿物的光谱曲线在不同波段表现出不一样的高斯性。 选择A、 B组不同高斯性的波段光谱数据, 按照光谱高斯性设定解混迭代的g函数, 开展混合光谱盲源解混试验。 按照光谱曲线的明显吸收位置将Cu(OH)2与Cu2(OH)2CO3混合光谱曲线分为三段, 见图1(b); CuO与Cu2O混合光谱曲线分为两段, 见图1(a)。 曲线分段部分的波谱高斯性统计结果, 见表3。 从表中可以得出, 一个光谱曲线每一段的高斯性是不一样的, 如Cu(OH)2与Cu2(OH)2CO3混合光谱曲线整体计算结果是亚高斯, 350~673 nm区间是亚高斯, 673~1 539 nm区间是超高斯, 1 878~2 500 nm是高斯。

表3 光谱曲线分段高斯统计特征 Table 3 Spectral curve piecewise Gaussian statistical characteristics

(2)白化方式分析试验。 Fast ICA盲源解混时, 首先需要对数据进行白化预处理, 选取PCA和ZCA两种白化方式对混合光谱进行盲源解混试验, 对比不同白化方式对解混光谱准确性和分离精度的影响。

(3)初始权因子分析试验。 Fast ICA盲源解混时, 需要设定基向量初始权。 选取单位矩阵、 随机矩阵和选权迭代权3种方式作为试验初始权, 开展混合光谱的盲源解混试验, 对比3种条件下光谱解混分离精度和解混时间。

2.3 评价指标

本文选取的评价指标与盲源分离算法一致, 在信号学中这三种指标应用广泛, 光谱解混试验的结果采用: 解混性能指数PI, 分解后光谱相似度的光谱角距离指标DSAM和解混光谱曲线精度指标XRMSE, 并且增加解混时间指标, 具体数学公式如下。

(1)解混性能指数PI是表示混合光谱分离性能指标, 当解混完全时PI=0。 实际上当PI接近10-2时说明该算法分离性能好。

PI=1n(n-1)i=1n{i=1n|gik|maxj|gij|-1+k=1n|gki|maxj|gji|-1}(9)

式(9)中, gij为解混后全局矩阵C=AS的元素; maxj|gij|表示C的第i行中绝对值最大值; maxj|gji|表示第j列元素绝对值最大值。

(2)光谱角度匹配距离DSAM表示为

DSAM=arccosRT1R2(RT1R1)12(RT2R2)12(10)

式(10)中, R1R2是两个光谱向量, T为矩阵转置运算。 光谱角度匹配距离是计算光谱间的角度评价两个光谱之间的相似性。 输出结果值越小表示两个光谱越匹配, 相似度越高; 反之, 表示两个光谱距离越大, 相似度越小。

(3)均方根误差XRMSE表示为

XRMSE=1Nλ[R(λ)-R^(λ)2](11)

式(11)中, N为光谱采样波段数, λ 为采样波段, R(λ )为单一颜料反射率。 XRMSE用来评价实际值与解混值之间的误差水平, 均方根误差RMSE数值越接近于0, 表明端元丰度反演的误差越小, 精度越高; 反之, 均方根误差RMSE数值越大, 表明反演的误差越大, 精度越低。

3 结果与讨论
3.1 光谱高斯性对混合光谱解混的影响

图3是样本A和B根据源函数高斯选取相应g函数后, 得出混合物光谱盲源解混后光谱曲线。 图3(a—d)是B样本的全波段和分段解混的结果, 图3(e—g)是A样本的全波段和分段解混的结果。 从图中可以看出, Fast ICA算法解混出的曲线与已知源光谱变化趋势整体一致, 分解出组分光谱的特有吸收位置、 波动变化与源光谱一致, 说明算法能够有效分离混合物中的组分光谱。 但是分离出光谱曲线与源光谱曲线存在反射数值差异, 有一定尺度缩放。 如图3(c)是样本A-Ⅱ 段解混结果, 该区间光谱统计特征为超高斯, 其解混结果与源光谱曲线反射率相差明显, 特别是1 400 nm位置解混出吸收位置反射率数值接近源光谱的2倍。 图3(d)样本A-Ⅲ 段解混结果, 统计特征为高斯性, 解混后曲线整体吸收特征尺度变化更大。 图3(f)样本B-Ⅰ 也是超高斯光谱统计特征, 解混结果光谱反射率发生明显拉伸变化。 综上说明, 光谱曲线解混时, 其统计高斯性与合理选取g函数, 会直接影响光谱解混结果。 试验时可以灵活调整g函数, 来有效突出局部波段的吸收特征, 增加其需要识别波段区间的峰值变化幅度。

图3 光谱曲线的整体解混与分段解混Fig.3 Overall and piecewise unmixing of spectral curves

表4是样本A和B根据源函数高斯选取相应g函数解混过程的指标。 从表中可以发现, 样本A和B盲源全波段分离指数PI均小于0.12, 两个样本分段分离指数PI数值均大于全波段, 说明全波段分离试验效果更优, 可作为以后混合物光谱解混首选方案。 进一步可以看出, 亚高斯分段解混指标明显不如整波段解混结果, 但是对于超高斯分段样本A-Ⅱ , 其分段解混光谱曲线与源光谱的光谱角距离变小了, 分别为0.078 7和0.084 20, 说明当需要解混局部超高斯细小特征时, 可以尝试分段解混方法。 两类样本不同高斯性的解混时间都是0.2 s左右, 没有明显差异。 推测可能参与解混样本个数较少, 未能体现在计算时间上。

表4 光谱整体与分段解混性能指标 Table 4 Spectral overall and segmented demixing performance indicators

独立性度量源于中心极限定理。 它可以用来检验一个统计量是否服从中心极限定理中关于假设检验问题所要求的正态分布假设。 本文利用该结论构造出一个新的分离准则, 并证明了在此准则下, 分离后的信号服从高斯分布。 按照这一思路, 可衡量分离结果, 当它的非高斯性到达最大值后, 可视为达到最佳的分离。 在Fast ICA光谱解混算法时, 其解混约束法则要求解混方向上的非高斯性最大。 解混时选取分线性函数g是根据源光谱高斯性来选取。 高斯性的不同目标函数中所选择的g函数也不相同, 因此解混结果也有差别。

3.2 白化方式对混合光谱解混的影响

在Fast ICA解混时, 白化处理是必要的。 白化处理主要是通过计算混合光谱的特征值及特征向量, 进行数据变换达到降维的目的。 简单的白化方式可以有效地去除冗余数据, 但是会直接影响到最后的解混效果。 图4为混合物光谱经过PCA和ZCA白化处理后, 进行盲源解混出组分光谱与源光谱对比图。 从图中可以看出, 经过白化处理后的解混光谱与源光谱在反射率数值上存在一定的差距。 从图4(a)可以看出氧化亚铜解混后明显的吸收位置依然存在, PCA和ZCA两种白化方式带来解混结果的差别较小; 图4(b)氧化铜解混后的曲线的铜离子的吸收峰与原始的对应在反射率值上差异较大。 图4(c)碱式碳酸铜源光谱在1 400 nm处没有吸收峰, 解混光谱曲线在此处均出现一个小的吸收谷, 相比PCA白化后的解混曲线这个吸收位置更突出, 与氢氧化铜发生混淆; ZCA白化的解混曲线在此特征不明显。 图4(d)中氢氧化铜的解混曲线在1 400、 1 950和2 350 nm处的吸收峰位置都一一对应, 两种白化方式上有略微的差距, 但不明显。

图4 不同白化方式解混结果光谱曲线Fig.4 Spectral curves of different whitening methods unmixed

表5为混合物光谱经过PCA和ZCA白化处理后, 进行盲源解混特征指标。 从表中可以看出, 总体上两种白化处理都可以实现混合光谱盲源分离, 但是ZCA白化处理比PCA白化对解混结果产生影响更小。 从分离指数上来看, 样本A和B经过ZCA白化解混分离PI指数分别为0.133 3和0.110 9, PCA白化的PI值为0.132 3和0.136 5, 对于样本B的ZCA白化影响更小; 从解混后光谱拟合来看, ZCA的解混光谱与源光谱的光谱角距离更小, 精度略高于PCA白化解混结果。 比如样本A经过PCA白化解混出的氧化铜的光谱角距离是0.132 6, 经过ZCA白化为0.121 6, 结合图4(a)氧化铜的解混曲线ZCA白化后的解混反射率值结果优于PCA白化的。

表5 不同白化方式解混解果性能指标 Table 5 Performance indicators of different whitening methods
3.3 初始权对混合光谱解混的影响

初始权是含牛顿迭代的ICA解混算法的一个影响因子, 试验按照3种方式设定初始权: (1)设定随机的初始权W; (2)设置初始权为单位矩阵。 (3)选择初次迭代之后的W矩阵作为下一次的初始权。 图5是样本A和B选取不同初始权条件下, 解混光谱曲线。 从图中可以看出, 初始权选取方式会直接影响光谱解混结果, 解混后光谱反射率会产生微小变化。 图5(a)中氧化亚铜的解混曲线与原始曲线在重要吸收位置是相吻合的, Cu+、 水的吸收峰较为明显; 图5(b)中3种权值条件下解混氧化铜特征位置相似, 区分不明显; 图5(c)氢氧化铜在1 450、 1 950、 2 350 nm处的吸收位置较为明显解混之后的曲线吸收位置未变, 图5(d)指定权值解混碱式碳酸铜的解混曲线与源光谱基本完全重合, 效果最优。 综合分析, 3种权值条件下解混光谱不会影响盲源解混出组分光谱的主要吸收位置, 但是在反射数值上有区别, 大部分情况下, 指定权解混出光谱反射率与源光谱最为接近。

图5 不同初始权解混结果光谱曲线Fig.5 Spectral curves of different initial weight unmixing results

表6是样本A和B选取不同初始权条件下, 解混结果性能指标。 从表中可以发现三种不同的初始权选择对分离精度PI值有明显影响。 样本A在单位权、 随机权和指定权情况下分离指数分别是0.132 8、 0.126 3和0.122 1, 样本B的分离指数分别是0.199 6、 0.112 3和0.098 3, 说明样本在指定权的分离效果最好, 单位权的分离效果最低。 从光谱角距离上看出, 不同的物质的光谱角距离与三种权的选择也有关联, 大部分解混光谱的光谱角距离表现出: 单位权情况下距离值最大, 随机权其次, 指定权最小, 但是氧化亚铜指定权解混结果略高。 在解混时间上, 指定权的用时最少, 只有0.2 s多, 因为提前计算好了参与迭代的数值, 所以牛顿迭代中收敛速度更快。 而单位权解混用时最长达到0.3 s, 因为迭代的起始点相同, 要达到收敛需要进行多次迭代。

表6 不同初始权解混解果性能指标 Table 6 Performance indicators of different initial weight unmixing results
4 结论

针对混合矿物光谱检测过程中光谱分离解混问题, 文中使用Fast ICA算法开展了混合矿物的光谱盲源分离, 并分析了影响Fast ICA算法的三种影响因素, 得出以下结论, 为混合物光谱检测的后期分析提供了研究基础。

(1)将混合物350~2 500 nm的光谱曲线看作时域变化的一维序列信号, 采用Fast ICA数学模型盲源解混混合物实测高光谱反射曲线效果显著, 能够有效地分离出混合物所含组分物质的光谱曲线, 解混出组分光谱很好地保留了已知源光谱吸收特征和变化趋势, 但是吸收反射率数值存在尺度的拉伸变化。

(2)混合物实测高光谱反射曲线Fast ICA盲源解混的结果, 会受到混合物本身组分光谱的高斯性影响, 也会受到解混过程的白化方式、 初始权阵的影响, 这些因素选取方式不会影响解混光谱总体吸收特征, 会给解混后光谱的反射率数值带来微小变化。

(3)以化学纯的氧化铜和氧化亚铜、 碱式碳酸铜和氢氧化铜、 两类混合物为研究对象, 开展解混过程的白化方式、 初始权阵, 源光谱高斯性3个方面分析, 根据全波段高斯性来选取g函数解混效果最优, ZCA白化比PCA白化对解混光谱的影响更小, 当指定权作初始权时有助于提高牛顿迭代中收敛速度, 使解混光谱更接近组分已知光谱。

光谱盲源解混过程会受到算法白化方式、 初始权阵, 成分光谱高斯性等多种因素的干扰, 直接影响解混过程的速度和解混曲线峰值的准确度, 但对解混后光谱主要吸收特征影响较小。

参考文献
[1] CHENG Gong-wei, ZHAO Si-ying, NI Cai-ying(陈功伟, 赵思颖, 倪才英). Journal of University of Chinese Academy of Sciences(中国科学院大学学报) , 2019, 36(4): 560. [本文引用:1]
[2] YAN Shou-xun, ZHANG Bing, ZHAO Yong-chao, et al(燕守勋, 张兵, 赵永超, ). Remote Sensing Technology and Application(遥感技术与应用) , 2004, (1): 52. [本文引用:1]
[3] YANG Xiao-li, WAN Xiao-xia(杨晓莉, 万晓霞). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2017, 37(7): 2158. [本文引用:1]
[4] Pece Sherovski, Goran Stojkovic, Natasha Ristovska. Analytical Biochemistry, 2018, 558: 35. [本文引用:1]
[5] WU Bing, WANG Jin-hua, ZHANG Bo, et al(吴兵, 汪金花, 张博, ). Journal of Materials Science & Engineering(材料科学与工程学报), 2021, 39(5): 814. [本文引用:1]
[6] ZHAN Xian-da, BAO Zheng(张贤达, 保铮). Acta Electronica Sinica(电子学报), 2001, (S1): 1766. [本文引用:1]
[7] ZHAO Chun-hui, CUI Shi-ling, ZHAO Gen-ping(赵春晖, 崔士玲, 赵艮平). Journal of Harbin Engineering University(哈尔滨工程大学学报), 2015, 36(9): 1281. [本文引用:1]
[8] LIN Na, YANG Wu-nian, WANG Bin(林娜, 杨武年, 王斌). Geomatics and Information Science of Wuhan University(武汉大学学报信息科学版) , 2017, 42(3): 355. [本文引用:1]
[9] YANG Lei, WANG Hui-qin, WANG Ke, et al(杨蕾, 王慧琴, 王可, ). Acta Optica Sinica(光学学报), 2020, 40(5): 0530001. [本文引用:1]
[10] WU Wei, ZHANG Fan, ZHOU Zhi-jun, et al(吴微, 张帆, 周志军, ). Journal of Information Engineering University(信息工程大学学报), 2016, 17(6): 681. [本文引用:1]
[11] SUN Ting-ting, CUI Shao-hua(孙婷婷, 崔少华). Journal of Hebei Normal University(Natural Science)[河北师范大学学报(自然科学版)], 2020, (3): 209. [本文引用:1]
[12] JIANG Xi-ping, YU Han-wen, WU Fang, et al(蒋夕平, 于瀚文, 吴芳, ). Journal of Basic Science and Engineering(应用基础与工程科学学报), 2015, 23(5): 992. [本文引用:1]
[13] Raghavendra Sharma. Materials Today: Proceedings, 2020, 29(Part 2): 536. [本文引用:1]
[14] GAN Yu-quan, LIU Wei-hua, FENG Xiang-peng, et al(甘玉泉, 刘伟华, 冯向朋, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(4): 1118. [本文引用:1]
[15] Palsson B, Sigurdsson J, Sveinsson J R, et al. IEEE Access, 2018, 6: 25646. [本文引用:1]