基于模型驱动的深度解混算法研究文献综述

 2022-11-29 16:20:58

高光谱成像包含数百个连续窄波段的光谱信息,已被广泛应用于遥感领域。由于成像传感器的空间分辨率有限,高光谱图像(Hyperspectral image)中的许多像素在往往中包含来自多种材料的反射。高光谱解混的目的是将混合像素分解为组成光谱或端元的集合,以及它们相应的丰度。这已成为提高信息系统效用的一个重要过程。现阶段使用端元识别方法,例如顶点分量分析(Vertex component analysis),来确定HSI中的端元[2],或直接从谱库[3]中获得所有可能的端元。因此,丰度估计可以被看作是一个回归问题,其中包含与分解有关的各种约束,如非负性和稀疏性。为了解决约束回归问题,人们提出了许多迭代优化算法,这些算法不仅容易实现,而且可以更好地对病态模型进行正则化。全约束最小二乘(Fully constrained least squares)提出了一种线性解混算法,该算法对丰度施加非负约束和和为一约束[4]。稀疏性约束是基于一个混合像素总是只包含少数几个组成端元的事实。特别是如果光谱库包含非常大量的光谱特征。许多稀疏性约束的线性回归算法可用于丰度估计[3],如匹配追踪(Matching pursuit)、正交匹配追踪(Orthogonal match pursuit)、迭代收缩阈值算法(Iterative shrinkage threshold algorithm)[5]、[6]。

当同时估计端元和丰度时,称为盲解混。非负矩阵分解(Nonnegative matrix decomposition)是一种广泛使用的盲解混工具,这得益于它在数据部件表示的固有优势[7]。NMF目标函数的非凸性,导致求解NMF容易陷入局部最优。为了处理这个问题,研究者已经提出了一些NMF的变体,其中大多数将一系列约束嵌入到丰度和/或端元估计中,并将光谱-空间信息联合加入到NMF模型中[8]–[11]。为了解决将3-D HSI转换为2-D矩阵时的信息丢失问题,可以使用非负张量分解(NTF)来进行盲解混[12]、[13]。NMF和NTF的求解主要基于迭代优化算法,如Lagrange乘子。交替方向乘子法[14]和自适应半阈值算法[15]。一般来说,与这些算法相关的主要困难是收敛性与正确解的接近程度以及收敛速度。

上述传统的解混方法依赖于光谱混合模型和相关的模型推理算法。在过去的几年中,人们对引入神经网络(neural network),特别是对深度神经网络(Deep neural network)产生了浓厚的兴趣。用于HSI处理[16]–[19],基于神经网络的解混方法可分为有监督和无监督两类,分别对应于丰度估计和盲解混。对于有监督的设置,为了产生预测丰度的函数,将光谱与其在像素处的相应丰度配对来训练NN[20]。训练样本的丰度可以通过其他丰度估计方法或现场调查/分析获得。NNS和DNNS具有从监督数据中学习复杂函数的强大能力,而这些函数不容易用常规方法推导。对于基于NN的盲解混,采用编码器-解码器结构,可以同时获得端元特征和分数丰度[21]。它不需要任何监督信息,克服了基于神经网络的丰度估计方法利用监督数据的问题。根据表征学习理论,盲解混过程可以解释为寻找一组低维表征(即丰度),它们用相应的基(即端元)重构数据。

NNS的一个显著缺点是网络拓扑选择。网络架构的设计通常需要大量的试验和调参[22]。另一个众所周知的缺点是,NNS更接近于黑箱机制,而不是问题本身。因此,很难将关于现有问题的先验经验纳入其中。此外,神经网络通过误差反向传播算法进行训练,该算法易于实现,但需要使用许多经验未知的技巧。这些缺点也导致学习函数的泛化能力和精度严重依赖于训练样本的数量和质量。

与NNS相比,传统的基于模型的方法具有明确的物理意义。例如,完全指定的概率图模型对联合分布中的所有潜在变量进行决策,其中定义了变量之间的关系和条件分布的函数形式。对于解混问题,光谱混合模型在贝叶斯框架下有明确的物理解释。虽然这些模型都是对现实的反映、交互机制和环境的简化。而且,推理算法往往难以得到最优解。另一方面,基于神经网络的方法对物理模型的假设很少,作为灵活的函数逼近器,从数据中学习,而不是手工指定函数。在显式构造的模型中,隐变量的结构和形式以及它们之间的关系与特定的语义相联系。不幸的是,定义一个好的模型来描述这些关系是困难的,在复杂的感知领域,如计算机视觉。神经网络完全绕过了精确建模物理机制的困难,但它们并不总是可以捕捉到实际应用的本质。

最近,一些文章结合并利用了这两种趋势。深度展开技术将模型及其相关的迭代推理算法传递到NN体系结构[23],[24]。它将迭代展开为分层结构,以获得新的类NN结构,该结构可以容易地被优化以学习推理功能。受模型启发的神经网络具有几个独特的性质:I)用很少的层就可以达到给定的精度水平;II)该体系结构具有相当清晰的解释;III)避免了精确建模的要求;以及IV)将领域知识融入到网络体系结构中是很容易的。

参考文献:

[1] J. M. Bioucas-Dias, A. Plaza, N. Dobigeon, M. Parente, Q. Du, P. Gader, and J. Chanussot, “Hyperspectral unmixing overview: Geometrical, statistical, and sparse regression-based approaches,” IEEE J. Sel. Topics Appl. Earth Observ. Remote Sens., vol. 5, no. 2, pp. 354–379, Apr. 2012.

[2] J. Nascimento and J. Bioucas-Dias, “Vertex component analysis: a fast algorithm to unmix hyperspectral data,” IEEE Trans. Geosci. Remote Sens., vol. 43, no. 4, pp. 898–910, Apr. 2005. [3] M.-D. Iordache, J. Bioucas-Dias, and A. Plaza, “Sparse unmixing of hyperspectral data,” IEEE Trans. Geosci. Remote Sens., vol. 49, no. 6, pp. 2014–2039, June 2011.

[4] D. C. Heinz and Chein-I-Chang, “Fully constrained least squares linear spectral mixture analysis method for material quantification in hyperspectral imagery,” IEEE Trans. Geosci. Remote Sens., vol. 39, no. 3, pp. 529–545, Mar. 2001.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。