利用随机矩阵理论来确定一个高光谱图像中端元的数量
摘要
在混合像元分解过程中,确定光谱图像中一些光谱端元的数量是一个重要的步骤,低估或高估了这个数字可能在无监督方法中导致不正确的分解。在这篇论文中我们将利用随机矩阵理论最近的发展来讨论一个新的确定端元数量的方法。这种方法比其他现有的方法监督和计算的成本更低。
我们把这些方法运用到合成图像中,包括由Chein-I Chang发明的一个标准测试图像,在高斯独立噪声试验中可以取得较好的实验结果。
关键字—混合像元分解,随机矩阵理论,高斯独立噪声。
1.简介
在处理包括化学分解,在一个嘈杂的情况下提取语音信号,分解矿物和分离环境]等等在内的许多不同类型的数据的过程中,在一个图像中确定端元的数量是非常重要的。
线性混合模型是用于不混合高光谱图像的一个常用的模型,相关介绍见参看文献[ 6]。该模型假定图像中的每个像素是由一个线性结合―端‖组成。在数学上,对于任意的像元i,有1ip,当p1时,p是光谱带的数量,表示为:
K
xiavijj1jni (1)
其中,aij表示端元vj在混合像元xi中的比例,ni表示一些噪声函数,而K代表端元数量。假设我们按照参考文献[ 1]和[ 5]中的方法来确定高斯噪声。 在分解图像时,第一步是确定场景中包含的端元或结构的数量。这一步又叫做图象的虚拟维度。对数字K的一个不正确的估计,可对许多分解方法的准确性造成严重损害,事实上,当端元不包括在图像中时,算法是不会被执行的。 有一些现有的测定方法来确定图象的虚拟维度。大多数这些方法是使用 协方差矩阵S的特征值来观测的,此时S被定义为:
S1NN_i_iT(xi1x)(xx) (2)
_其中N表示图像中的像素数,xR表示图像中所有像素的光谱向量的平均值,而这个矩阵的特征值是用来区分是由于信号还是由于噪声产生的。这个公式并不仅仅用于高光谱混合像的元分解过程中,还运用于信号化学混合物或其他混合物分解过程中。
在理想的情况下,由于信号的特征值和由于噪声特征值之间应该有一个明确的区分。然而,现实的情况是,在一个小信号特征值和一个大的噪声特征值之间是非常难以区分的。为了解决这个问题几种方法便应运而生。
在参考文献[ 5]中吴等人提供了确定端元数量的一些方法,其中的一个方法是信息标准(汽车工业)和最小描述长,度通过减少一些函数对矩阵S特征值的依赖来确定K的值,其中最重要的是要观测协方差矩阵。这两种方法都是假设噪声符合独立同分布和高斯分布的。对高光谱图像来说这些噪声的假设是不恰当的,而且这一点被视为这些方法的缺点。吴等人还对盖尔圆半径-基本方法(假设只有独立同分布噪声)和信号子空间估计进行了研究。其次,文章还研究了在假设白噪声为零的情况下的尼曼—皮尔森检测方法。所有这些研究用的方法只使用矩阵S的特征值或者是非观测下的协方差矩阵的特征值。在所有情况下,不需要知道端元向量,而这一点就是此监测方法的独到之处。
从参考文献[5]的实际和合成实验的描述中,作者认为最好的方法是尼曼—皮尔森和盖尔圆半径-基本方法,而符合严格的噪音的假设(即高斯噪声和独立同分布)的方法表现最差。这些方法中有的对用户定义的数值的影响是非常显著的。
在化学分解领域,kritchman和Nadler已经在哪些特征值是由噪音产生和由信号产生的随机矩阵理论方面取得了一些新的研究成果。这种方法的优点是不需要用户设置参数,而且这种方法在寻找噪声和信号特征之间的阈值时,比其他方法要优秀。当今形成的随机矩阵理论原则,在化学分解方面是非常有用的。 化学分离方法不直接适用于高光谱图像,但这种方法允许我们,而且我们将尝试让它适合高光谱的情况。在本文,我们提出了一种利用随机矩阵理论的新方法来确定噪声和信号特征值之间的阈值。在第3节显示一些实验结果之前,第2节中我们将介绍我们的模型,然后在第4节得出结论。
2 .模型公式
在随机矩阵理论中,已经完成了对一个随机矩阵的最大特征值的研究。在我们假设高斯噪声时,最大特征值的观测噪声可以被认为是在一个随机矩阵中的最大特征值。根据参考文献[ 13]中Johnstone所说的,一个随机矩阵的最大特征值应满足的条件是: (2pN,ps()N,p) (3)
其中是高斯噪声的方差,代表显著水平,s()可以通过反相特雷西分布来确定(在参考文献[ 1]中α=0.5%)。对于p,N→ ,p/N=c,c为定值且为实值数据,便可得出下式:
11(N-N212p-) (4) 2
N,p (N,p1N(N1p121P12) (5)
1N1212)3请注意,这些函数不依赖于一些端元的数量K的值。
然后, 如果把不确定观测协方差矩阵的特征值按降序排列,即
12...p,K的定义是这样的:
当jZ,1jK时
j(2N,ps()N,p)
在数学上,最合理的近似噪声是所有噪声特征值的平均值,在参考文献[ 1]中给出的是:
2REF 1pKpjK1j (6)
kritchman和纳德勒发现这种近似值在他们运用到化学分解上时是非常小的,于是他们考虑一个新的噪声估计,描述为:
2012REFKN (7)
然而,在高光谱的情况下,N是远大于K的,因此分母是趋近于1的。kritchman和纳德勒也衍生出了其他噪声近似,但他们的实验是基于假定N是非
常小的数的。由于高光谱图像的像素数N是非常大的数,因此在实验中我们就应该考虑2REF的影响。
我们的方法运用在高光谱图像中是有许多优点的。首先,在这种情况下,N相对于p是非常大的数,因此N,p在公式(5)中就变得非常小,所以公式(3)
的右边受置信区间的选择的影响不明显。这是在对比由吴等人测试的几种方法得出的结论,而且用户定义的阈值对实验结果有很大的影响。其次,这种方法计算效率比参考文献[ 5]中运用的其他方法更高。其中一些需要解决一种优化问题,即计算特征向量或计算一个超大矩阵的特征值。随机矩阵理论方法只需要对协方差矩阵的特征值进行观测。
3.实验
图.1根据指令创建合成图像见参考文献[14]
张等人对标准化算法测试建立了一个综合测试数据集。这个数据集是一个大小为200×200像素的图像, 把纯像素,混合像素和子像素元素插入到一个背景中(见图1)。本图像含有五种矿物质和一个背景(来自五个矿物)。吴等人使用该数据集测试一些审查方法来确定图像中端元的数量。在这个图像中有五行板(每一行都与一种矿物有关)和五列板(每一列代表不同大小或混合的场景)。
第一列包含4×4纯像素,第二列包含2×2像素,第三列包含2×2混合像素,第四和第五列包含子像素元素。对混合像素,每个像素在面板上有一个是这行矿物组成的一半的值;对于其他四个像素中的每一个,其余的一半来自其他四个矿物中的一个。对于子像素元素,第四列的像素值是这一行所含矿物质的一半,而另一半是由背景值组成的;对于第五列的像素值是由25%的矿物值和75%的背景组成的。然后再把zero-centered,独立同分布,加性高斯噪声添加到图像中。 我们使用以下矿物创建了第一个数据集:明矾石;水铵长石;方解石;高岭石;和白云母(从喷气推进实验室光谱库[ 15]摘出)。背景是指所有五种矿物(参见文献[ 5])。我们还编译了另一个合成的数据集,它是由五到二十种矿物组成的。端元数量K的值是随机选择的,每一个像素的端元的选择也是随机的,唯一的限制是在选择时加入积极和综合的情况。然后,通过迭代方法,测试可能是在做了许多不同的―图像‖的情况下进行的,知道K和每个部分都有不同的迭代,每个迭代都是从一个均匀分布中随机选择的。我们也在这些图像中选择的p,N和的值。
公式(3)中的随机矩阵,在公式(6)中加上噪声便可得到下面的公式:
f(p,K)<1 对于信号的特征值,此时
pf(p,K)jk1jN,pK((pK)s()N,p) (8)
为了检验这一公式,当5≤K≤20时,我们编制了一个测试图像可见参考文献[ 14]和一套合成图像的各种端元数量K的值。对于每一个K,由一百种不同的图像生成,且由均匀分布来确定其值。对于这些测试图像,我们使用噪声标准偏差0:001,即信噪比500∶1,使用其在参考文献[ 5]中的定义。这是典型的现代机载传感器所用的信噪比。
1997时,在内华达州我们还在AVIRIS飞行现场收集赤铜矿来测试我们的
公式。这个数据集还可以在网上查到。该图像包含空间像素的大小为350×350,有189个谱带。吴等人确定了这个场景中的端元数量是在22和28之间。
这个公式的有效性综合数据在图2中给出。只有三个合成图像显示清晰,但同样的行为观测是由所有合成图像生成的。对于合成图像,直线f(p,K)1表示信号和噪声特征值之间较好的阈值,这个值是从随机矩阵的行为中得到的。但赤铜矿场景有不同的表现。
对于合成数据,这是假定噪声是高斯噪声且独立同分布的,而且是和信号无关的。一个简单的实验显示:合成图像的噪声方差在某种程度上取决于谱带数,而综合图像特别是在振幅方面更加接近于赤铜矿的图像(如图2)。实验证明我们对噪声的假设对赤铜矿图像是符合现实结果的。然而,随机矩阵理论可以调整不同的噪声环境,进一步的工作重点将放在如何做这些调整方面。
本文提出了随机矩阵理论在合成图像的高光谱图像中的一种成功应用。
图2。利用随机矩阵理论来确定高光谱数据的阈值,在方程(8)显示的合成图像和赤铜矿场景中的应用。对于清晰度,合成图像以低噪音显示(标准差=0.001)。
4.结论
我们得出了一个新的和创新的方法来确定高光谱图像中的端元数量。我们的方法是使用随机矩阵理论来区分信号和噪声对协方差特征值的观测值的影响,而这种方法经计算是非常有效的。该方法对用户定义的阈值的影响是不明显的,而且在模拟图像中运行良好。初步实验表明,噪声的假设需要根据实际图像来调整,但随机矩阵理论允许不同的噪声假设。
5. 参考文献
[1] S. Kritchman, B. Nadler, ―Determining the number ofcomponents in a factor model from limited noisy data,‖Chemometrics and Intelligent Laboratory
Systems, vol.94, pp. 19–32, 2008. [2] H-M. Park, H-Y. Jung, T-W. Lee, S-Y. Lee, ―Subbandbased blind signal separation for noisy speech recognition,‖Electronic letters, vol. 35, pp. 2011–2012, 1999.
[3] F.A. Kruse, ―Identification and mapping of minerals in drill core using hyperspectral image analysis of infrared reflectance spectra,‖ International journal of remote sensing, vol. 17(9), pp. 1623–1632, 1996.
[4] D. Gillis, J. Bowles, E.J. Ientilucci, D.W. Messinger, ―A generalised linear mixing model for hyperspectral imagery,‖Proc. of SPIE, vol. 6966, pp. 1–11, 2008.
[5] C-C. Wu, W. Liu, C-I. Chang, ―Exploration of methods for estimation of number of endmembers in hyperspectral imagery,‖ Proc. of SPIE, vol. 7(43), pp. 1–11, 2006.
[6] H. Horwitz, R. Nalepka, P. Hyde, J. Morgenstern, ―Estimating the
proportions of objects within a single resolution element of a multispectral scanner,‖ in Proceedings of the 7th International Symposium on Remote Sensing of Environment, Ann Arbor, Michigan, 1971, pp. 1307–1320.
[7] D.C. Heinz, C-I. Chang, ―Fully Constrained Least Squares Linear Spectral Mixture Analysis Method for Material Quantification in Hyperspectral Imagery,‖ IEEE Transactions on Geoscience and Remote Sensing,vol. 39(3), pp. 529–545, 2001.、
[8] H. Akaike, ―A new look at the statistical model identification,‖ IEEE Tran. Automatica Control, vol. AC-19, pp. 716–723, 1974.
[9] J. Rissanen, ―Modeling by shortest data description,‖Automatica, vol. 14, pp. 465–471, 1978.
[10] H.T.Wu, J.F. Yang, F.K. Chen, ―Source number estimators using
transformed Gerschgorin radii,‖ IEEE Tras.on Signal Process., vol. 43(6), pp. 1325–1333, 1995.
[11] J. Dias, J. Nascimento, ―Estimation of signal subspace on hyperspectral data,‖ Proc. of SPIE, vol. 5982, pp.191–198, 2005.
[12] J.C. Harsanyi, W. Farrand, C-I. Chang, ―Detection of subpixel spectral signatures in hyperspectral image sequences,‖ASPRS, pp. 236–247, 1994. [13] I.M. Johnstone, ―On the distribution of the largest eigenvalue in principal components analysis,‖ The Annals of Statistics, vol. 29(2), pp. 295–327, 2001. [14] Y.C.C. Chang, H. Ren, C-I. Chang, R.S. Rand, ―How to design synthetic images to validate and evaluate hyperspectral imaging algorithms,‖ Proc. of SPIE, vol. 6966,pp. 69661P–1, 2008.
[15] C.I. Grove, S. Hook, E. Paylor, ―Laboratory reflectance spectra of 160 minerals, 0.4 to 2.5 micrometers,‖ JPLPublications, vol. 92–2, 1992
因篇幅问题不能全部显示,请点此查看更多更全内容