技术领域
[0001] 本发明属于模式识别领域,涉及一种基于特有像素提取和自适应邻域聚类的波段选择方法。
相关背景技术
[0002] 高光谱图像包含丰富的地物信息,能够反映地物目标在光谱、像素等多维度上的特征,在智慧农业、环境保护、灾害检测、军事侦察等领域有广泛应用。然而,高光谱图像具有数据量大、波段间相关性高、冗余信息多等特点,导致以高光谱图像为输入的下游任务时间复杂度较高,并且受到“维度灾难”影响,制约了分类等下游任务技术发展与性能提升。高光谱图像数据降维技术作为应对上述局限性的关键技术,通常分为特征提取和波段选择两类,其中,波段选择从波段集合中选出一定数量的最优波段组合,代替全波段数据执行下游任务。基于聚类的波段选择技术将所有波段划分为若干聚簇,从每个簇中选出一个或多个波段组合为最优波段集合,从而筛选出原始波段中表征能力强、相关性低的关键波段。
[0003] 孙根云等人(《高光谱影像逆近邻密度峰值聚类的波段选择算法》,测绘学报,2024,53(1):8‑19.)基于波段近邻与逆近邻关系构建有向图,并基于波段间平均欧式距离和相似度构造增强型局部密度,进而综合增强型局部密度、距离信息、信息熵挑选波段子集。然而,该方法仅关注于波段级的相似性评估,忽略了像素级相似度评估对波段相关性的影响,无法充分体现单波段图像特有信息,导致对波段图像判别性分析能力较弱,影响后续波段选择与下游任务性能。
[0004] 现有基于聚类的高光谱波段选择方法大多数忽略了对波段图像的像素级处理,从而导致波段间相似度评估结果不准确,对波段图像判别性分析能力较弱。
具体实施方式
[0063] 现结合实施例、附图对本发明作进一步描述:
[0064] 本发明是通过以下技术方案实现的,基于特有像素提取和自适应邻域聚类的波段选择方法,以高光谱图像数据集Indian Pines为例阐述提出方法进行波段选择的具体步骤,但本发明的技术内容不限于所述的范围。高光谱图像数据集Indian Pines由220个光谱反射波段组成,每个波段图像像素为145×145。该数据集共包含16中地物实例的像素级类别标签信息,以用于分类验证波段选择方法性能。
[0065] 通过提取波段特有像素增强波段间判别性分析能力,并利用自适应邻域聚类构建结构最优的波段间相似度图,从而实现对波段相关性的准确评估,其具体步骤如下:
[0066] 步骤一、输入Indian Pines数据立方体 波段选择目标数目c,低秩自表示模型正则化参数α,自适应邻域聚类近邻数k与正则化参数λ。根据增强密度峰值聚类、最大方差主成分分析、信息熵排序等方法分别预先从H中选出c个波段,取多个方法预选波段并集组成波段预选集合
[0067] 所述高光谱数据立方体H维度为a×b×l,其中a和b分别表示单一波段高光谱图像的长和宽,l为光谱波段数目。
[0068] 步骤二、基于上一步的波段预选集合 建立低秩自表示模型提取单波段图像 特有像素信息 并拉伸为1×n的行向量,其中n=a×b,从而将p个波段特有信息转换为数据矩阵
[0069] 针对每一幅维度为a×b的高光谱图像,建立低秩自表示模型提取单波段图像低秩本质信息,其低秩自表示模型表示如下:
[0070]
[0071] s.d.Hi=HiZi+Ei
[0072] 其中, 为单波段图像低秩信息,
[0073] 为单波段图像特有像素信息。将Ei拉伸为1×n的行向量,其中n=a×b,从而将p个波段构成的特有像素信息转换为数据矩阵 其中矩阵的每一行表示第i个波段高光谱图像的特有像素信息。
[0074] 步骤三、基于上一步的波段特有像素信息矩阵X,构建基于自适应邻域聚类的波段选择目标函数表示如下:
[0075]
[0076] 其中,xi,xj分别表示第i个和第j个光谱图像特有像素; 为图相似度矩阵,为图拉普拉斯矩阵, 为度矩阵; 为软标签矩阵,c为类别数,本发明将其设定为最终选择的波段数。上述最小化问题中,前两项共同构成了邻域相似图构建模型,第三项用于根据构建的拉普拉斯图求解样本类别,进而用于相似度图的更新,从而实现自适应邻域聚类。我们采用一种二步交替优化的算法求解上述问题。
[0077] (4)固定软标签矩阵F,更新相似度矩阵W
[0078] 当软标签矩阵F固定时,优化问题等价于:
[0079]
[0080]
[0081] 将上述问题中求矩阵迹项展开为2范数的形式,可以模型进一步转化为:
[0082]
[0083] 其中, 从而,优化问题转变为:
[0084]
[0085] 使用拉格朗日乘子法求解上述优化问题,其拉格朗日函数为:
[0086]
[0087] 其中,φ≥0,ξ≥0。根据其KKT条件可以得到闭式解为:
[0088]
[0089] 其中,(·)+=max(·,0)。进一步,将dij按照升序排列,可以根据wi约束求得:
[0090]
[0091] 其中,k为近邻点数目。从而,可以得到相似度图W的解为:
[0092]
[0093] (5)固定相似度矩阵W,更新软标签矩阵F
[0094] 当相似度矩阵W固定时,优化问题等价于谱聚类问题:
[0095]
[0096] s.t.FTF=I
[0097] 此时,求解矩阵L的前c个最小特征值对应的特征向量,组合而成矩阵F的最优解。
[0098] (6)通过步骤(4)和步骤(5)对相似度矩阵W和软标签矩阵F的交替更新,实现了高光谱波段自适应邻域聚类,最终根据F得到高光谱波段的类别划分。进而,从每个聚簇中选出距离聚簇中心最近的波段,将所有波段组合得到最优波段集合,即为波段选择结果。
[0099] 具体实施例中,初始化波段聚类软标签矩阵 结合上一步构建的数据矩0
阵X,初始化波段间自适应距离评估矩阵D,其中
[0100] 更新波段间拉普拉斯相似度矩阵W,定义t为迭代次数,则:
[0101]
[0102] 其中,t
[0103] 步骤四、基于上一步的相似度矩阵W ,计算度矩阵 与拉普拉斯矩阵t对L 执行特征值分解,将其最小的k个特征值对应的特征向量组
t
合,从而得到软标签矩阵F。
[0104] 步骤五、重复执行步骤三与步骤四直到算法结果稳定,输出最终波段标签矩阵对F按行执行k‑means聚类获得波段类别。根据波段类别划分结果,从每个聚簇中选取距离聚簇中心最近的一个波段,组合构成最优波段集合。至此,本发明提出的方法完成了高光谱图像数据集Indian Pines上的波段选择任务。
[0105] 为验证本发明波段选择方法在高光谱图像数据集Indian Pines上的有效性,选取支持向量机SVM分类器执行地物分类任务,训练样本比例设为10%,采用分类准确率ACC作为评估指标,取十次重复实验的平均结果作为实验结果。Baseline是采用原始全波段图像作为分类器输入数据时的实验结果,Our Method是采用本发明波段选择方法选出的最优波段子集作为分类器输入数据时的实验结果。图2是SVM分类器在本文方法所选最优波段集合上的预测结果图,所选波段数目为30。图3是SVM分类器在全波段和本文方法所选最优波段集合上的预测精度对比图,波段数目取值为3到30,步长为3。从对比图中可以看出,本发明的波段选择方法结合分类方法能够得到较高的分类准确率,在提取波段数目大于等于12时,对应的SVM分类精度高于使用全波段图像的分类精度。
[0106] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明公开的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。