技术领域
[0001] 本发明属于雷达信号处理技术领域,涉及一种基于最优Wavelet包基字典学习及分布式压缩感知的Video-SAR图像实时压缩重构方法,主要用于解决海量Video-SAR图像给数据的储存和传输带来的巨大压力。
相关背景技术
[0002] 视频合成孔径雷达(Video Synthetic Aperture Radar,Video-SAR)是美国国防部先进研究项目局(Defense Advanced Research Projects Agency,DARPA)在2012年5月发布的,目标是研发一种工作在太赫兹频段的高分辨率全动态Video-SAR,能够穿透云、尘等对地面场景目标进行成像、探测和跟踪,且可借助云、尘等来保护自身不受敌方攻击。对于Video-SAR,高数据量、高数据率的远距离无线传输技术极大地限制了传输带宽,需要在图像允许的失真范围内进行压缩,使得压缩后的数据率满足存储和下传的要求,因此研究SAR图像的压缩具有很大的现实意义。
[0003] 压缩感知(Compressed Sensing,CS)是近年来信号处理领域内的一个研究热点,与传统的数据采样定理不同,在目标信号或图像具有一定稀疏性的前提下,压缩感知保证可以用远少于乃奎斯特采样定理所需的采样数以很高的概率精确重建出目标信号或图像,其采样数目与目标的稀疏度关系密切。许多研究人员已经将压缩感知理论应用到高分辨率SAR数据处理领域,实现有效的图像压缩和精确的图像重构。例如,利用基小波的Contourlet变换和分块DCT变换对SAR图像稀疏表征,并进行随机观测获得低维数据,有效缓解系统的存储压力和信道的传输负担。
[0004] 即便如此,针对SAR图像的压缩感知研究仍处于起步阶段,主要涉及如下问题:
[0005] 第一,待压缩SAR图像的稀疏表征问题,由于SAR图像本身是不稀疏的,无法直接使用压缩感知对SAR图像进行压缩重构。目前,常用的方式是使用事先设定的变换矩阵。例如,基于DCT变换作为稀疏基,但是容易出现块效应,小波基作为稀疏基不能很好的保留SAR图像中的边缘和纹理信息。
[0006] 第二,对SAR图像数据压缩时需要先对SAR原始图像做去相干斑嗓声抑制处理,使得SAR图像的相关性增加,有利于提高压缩比。但是抑制处理会影响SAR图像的质量,如对图像分辨率及孤立点目标都有影响。
[0007] 第三,SAR图像非常巨大,数据流速率很高,因此对于压缩的实时性提出了更高的要求。
[0008] 第四,SAR图像中背景区域和目标区域富含细节纹理及边缘有用信息,不同程度的压缩,会影响其峰值信噪比(PSNR)及SAR图像质量,因此提高重构的误差是非常必要的。
具体实施方式
[0067] 需要说明的是,本发明的方法仅对实数有效,对于Video-SAR复值图像需要按实部和虚部分解为两个矩阵,然后用本发明的方法分别对实部矩阵和虚部矩阵进行编解码,实现对Video-SAR复值图像的压缩重构。
[0068] 如图1所示,为本发明一种基于最优Wavelet包基字典学习及分布式压缩感知的Video-SAR图像实时压缩方法的流程图,该方法包括的具体步骤如下:
[0069] 步骤S1:首先对Video-SAR图像(帧数是K,图像的大小为m×n,K,m,n均为正整数)的每一帧进行对数变换,使相干斑噪声由乘性噪声变为加性噪声,然后将变换后Video-SAR图像的每一帧xi,i=1,2,3......K,展开成一维数组Mi,构建基于鲁棒主成分分析(Robust Principal Component Analysis,Robust-PCA)的Video-SAR图像相干斑抑制的模型(L,S)如下:
[0070]
[0071] 式中,L和S是待估计的低秩矩阵和稀疏矩阵; argmin是极小化计算式,μ是抑制中的正则化参数(一个非常小的正常数);||L||*为矩阵L的核范数,等于矩阵L所有奇异值之和;||S||1为矩阵S的l1范数,等于矩阵S所有非零元素的绝对值之和;||·||F为矩阵的Frobenius范数,等于矩阵所有非零元素的绝对值平方和的平方根。其中,Video-SAR图像的每一帧是局部区域的相邻或相似信息,由一维数组Mi合并得到数据矩阵M是近似低秩的。利用估计的低秩矩阵L和稀疏矩阵S加权得到Video-SAR图像相干斑噪声抑制后的数据矩阵M′=L+mean(S),这里mean(S)表示矩阵S的均值。
[0072] 物理意义就是将M分解成低秩矩阵和稀疏矩阵之和,得到相干斑噪声抑制后的矩阵M′。
[0073] 步骤S2:针对步骤S1获得Video-SAR图像相干斑抑制后的数据矩阵M′,利用小波分解,计算出小波包库中的最优Wavelet包基。
[0074] 利用小波分解得到的小波包库,寻找Video-SAR图像的最优Wavelet包基的方法如下:
[0075] a、对步骤S1计算得到的M′的每一列进行三层db3Wavelet包分解,得到K个小波包分解树;
[0076] b、计算得到小波包分解树的第p层,第q个节点β=(p,q),0≤p≤2q,0≤q≤3的稀疏度
[0077] c、对小波包分解树的每个节点的稀疏度取平均,得到 由此得到一个综合Wavelet包树;
[0078] d、以平均稀疏度Tβ作为信息代价函数值,采取从上而下逐点比较的方法搜索最优Wavelet包基。
[0079] 根据上述算法,得到的最优Wavelet包基,如图2所示,该树对应的该Video-SAR图像的最优Wavelet包基。图2是由小波分解树得到的,A,D分别代表低频和高频。
[0080] 步骤S3:利用给定的Video-SAR帧图像M′,基于KSVD(K奇异值分解,K Singular Value Decomposition)训练学习得到稀疏字典D,并以步骤S2获得的最优Wavelet包基作为初始字典更新。
[0081] 基于KSVD字典训练的模型如下:
[0082]
[0083] 式中,λ2是字典训练中的正则化参数(一个非常小的正常数),||·||F为矩阵的Frobenius范数,等于矩阵所有非零元素的绝对值平方和的平方根,矩阵Θ是M′在字典D下的稀疏表示,Θi是系数矩阵Θ的第i列,||Θi||0表示向量Θi的l0范数,等于向量的非零元素个数。
[0084] 其中,KSVD字典更新的具体过程如下:
[0085] a、先固定字典D(这里的D是要求解的,利用步骤S2作为初始字典更新迭代),通过求解K次正交匹配追踪算法(Orthogonal Matching Pursuit,OMP),计算出M′的最佳系数矩阵Θ(Θi是其第i列);
[0086]
[0087] Mi′是M′的第i列,T0是事先设定的稀疏度,||·||0为向量的l0范数,等于向量非零元素的个数,||·||2为向量的l2范数。
[0088] OMP算法可参考文献:J.Tropp,“Greed is good:algorithmic results for sparse approximation,”Information Theory,IEEE Transactions on,vol.50,no.10,pp.2231–2242,2004。
[0089] b、接着按列更新字典,根据均方误差最小原则,通过奇异值(SVD)分解,更新D的每一列和该列对应的系数矩阵,需要做K次奇异值分解。
[0090] 例如更新D的第k列Dk过程如下:
[0091]
[0092] 式中,Ωk是选取系数Θk不为零对应的列,(·)T表示转置。
[0093] 通过步骤S3训练得到的稀疏字典D可以作为同类SAR图像的稀疏表征基,能够很好地保留SAR图像的细节纹理信息,且将其存储于计算机,在下次压缩时直接调用存储的同类型的稀疏基,减少运算量。
[0094] 步骤S4:将Video-SAR图像相干斑抑制后的数据矩阵M′按目标陆地、海洋场景不同分为L组,第l组第一帧作为关键帧Keyl(1≤l≤L),当然也可以选取图像组里的任意一帧作为关键帧,每组的其他帧作为非关键帧 (2≤j≤K/L),对Keyl以较高采样率(如80%采样)实现CS压缩编码 对 和Keyl之间的帧差以较低采样率(如30%采样)实现CS压缩编码 和 是CS压缩编码的结果,其中 为分组后的第l组第j帧(1≤l≤L,1≤j≤K/L), 是是其对应的观测矩阵。
[0095] 步骤S5:对每组的关键帧采用步骤S3训练的字典D和压缩感知算法直接进行重构,对于非关键帧的帧差,利用帧差的结构相似性,为了加快重构速度、提高重构的精度,采用步骤S3训练的字典D和分布式压缩感知算法进行重构,实现对Video-SAR图像组的非关键帧粗解码。
[0096] 其中,构建的基于稀疏字典D的Video-SAR图像组的关键帧解码模型 如下:
[0097]
[0098] 式中, 是第l组关键帧的观测矩阵,λ是关键帧粗解码中的正则化参数(一个非常小的正常数),||·||2和||·||1分别表示向量的l2和l1范数, 是第l组关键帧的稀疏表示。
[0099] 关键帧解码模型可参考文献:A.Beck and M.Teboulle,“A fast iterative shrinkage-thresholding algorithm for linear inverse problems,”SIAM Journal on Imaging Sciences,vol.2,no.1,pp.183–202,2009。
[0100] 构建的基于稀疏字典D的Video-SAR图像组的非关键帧帧差粗解码模型如下:
[0101]
[0102]
[0103] 式中, 是第l组非关键帧帧差的观测矩阵, 是第l组非关键帧帧差的稀疏表示。
[0104] 利用分布式压缩感知算法重构得到 则Video-SAR图像组的非关键帧粗解码为
[0105] 非关键帧帧差粗解码可参考文献:Baron D,Wakin M B,Duarte M F,et al,Distributed compressed sensing[J],2005。
[0106] 步骤S6:利用步骤S5获得高采样率下重构后的关键帧Keyi,使用Canny算子进行边缘检测G,得到边缘指示函数 对Video-SAR图像组的非关键帧 进行高分辨率细解码,并以步骤S5获得非关键帧 的粗解码为细解码的初始值。
[0107] 其中,构建基于稀疏字典D的Video-SAR图像组的非关键帧细解码模型 如下[0108]
[0109] 式中, 表示图像 的TV范数,即 是图像 关于x方向的梯度, 是图像 关于y方向的梯度,λ和μ是非关键帧细解码中的正则化参数(正常数),图像的边缘指示函数 用平移τ后的Heaviside函数 近似,
[0110]
[0111] 其中Heaviside函数 为 ε和τ是事先设定的正常数。
[0112] Bregman迭代格式求解非关键帧细解码模型如下,
[0113]
[0114]
[0115]
[0116]
[0117]
[0118]
[0119] 其中 是图像 第k+1次估计更新,dx是图像 关于x方向的梯度, 是dx第k+1次估计更新,dy是图像 关于y方向的梯度, 是dy第k+1次估计更新,d是图像 边缘指示函数与 的差,dk+1是d第k+1次估计更新, 和 是迭代过程中引入的中间变量。以步骤S5获得非关键帧 的粗解码为细解码的初始值,γ和γ1是正标量参数。上述细解码模型中关于
的优化问题可以转化为线性方程组的求解问题,关于 的优化问题解析解可以用TV范数阈值算子表示,d(k+1)的优化问题解析解可以用软阈值算子表示。
[0120] 步骤S7:利用步骤S5重构的关键帧和S6获取的细解码非关键帧最终生成重构后的Video-SAR图像。图3所示为步骤S5和S6进行Video-SAR图像分布式粗细编解码的示意图。
[0121] 结合图4为基于最优Wavelet包基字典学习及分布式压缩感知的Video-SAR图像关键帧80%采样和非关键帧帧差30%采样的原图4(a)及恢复重构图4(b),图5为基于最优Wavelet包基字典学习及分布式压缩感知的Video-SAR图像关键帧80%采样和非关键帧帧差30%采样的重构性能(PSNR)示意图。从视觉效果上看,在较低的采样率下,本发明重构SAR图像的边缘细节清楚,能够实现较高的峰值信噪比。
[0122] 以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内。
[0123] 本发明说明书中未作详细描述的内容属本领域技术人员的公知技术。