首页 / 一种适用于水下图像传输的语义信源编译码方法及系统

一种适用于水下图像传输的语义信源编译码方法及系统实质审查 发明

技术领域

[0001] 本发明属于水声信号处理技术领域,具体涉及一种适用于水下图像传输的语义信源编译码方法及系统。

相关背景技术

[0002] 近年来,随着人类对海洋战略地位和海洋科学研究价值认识的深化,世界各国都加大了对海洋的研究,其中,水下通信技术的发展具有重大意义。由于海水具有较高的介电常数和电导率,电磁波在海水中衰减严重,因而难以用于水下远距离信息传输。声波是目前已知的唯一能在水下进行远距离传播的信息载体,特别是低频声波在海水中传播距离可达到数百公里以上。在水下,相较于电磁波通信,水声通信具有传输距离远、传输速率较高、使用方便、灵活等优点。因而,水声通信在水下设备遥控、海洋环境监测以及水下信息化作战等方面得到了广泛的应用,对国防、经济和科技的发展起到重要作用。
[0003] 如今,军事、海洋探测等领域对水下图像可靠、快速传输需求迫切,尤其是远距离图像传输。但是,当前的远程水声通信难以达到此需求,主要有以下两点原因:一方面,远程水声通信可用带宽窄、通信速率低,而传统的JPEG等信源编译码方法压缩率不够高,压缩后的比特数仍然很大,难以在水下有效传输;另一方面,水声信道具有多途时延扩展长、环境噪声高以及多普勒频移影响大等特点,实现可靠通信十分困难,而传统的信源编译码方法抗误码性能较差,难以适应复杂多变的水声信道。
[0004] 因此,为了能够在水下实现图像的可靠、快速传输,亟需探索一种兼具高压缩率和高抗误码性能的信源编译码方法。近几年,在无线通信领域,通过深度学习网络构建的语义通信系统在高压缩率和高抗误码性能上具有显著优势,成为当前的研究热点。但是,目前在水下尚少见到相关研究。

具体实施方式

[0039] 本发明提出了一种适用于水下图像传输的语义信源编译码方法,用于在水下实现图像的快速、可靠传输,所述方法包括:
[0040] 步骤1)训练阶段,基于矢量量化的变分自编码器(VQ_VAE)模型对图像进行训练,使得网络学习提取出图像的重要语义信息,并将其量化为0/1序列;
[0041] 本方法主要基于CNN网络进行设计,网络结构如图1所示。此网络整体采用编码器‑解码器架构,编码器首先通过卷积层对原始图像进行语义信息的提取,之后再通过矢量量化层将提取到的浮点数的语义信息量化为0/1比特;本发明将对原始图像进行语义信息的提取和矢量量化合称为语义信源编码。解码器首先对0/1比特进行去矢量量化操作,恢复图像的语义信息,之后再通过转置卷积层根据语义信息实现图像的重构,本发明将对0/1比特进行语义信息恢复和矢量量化统称为语义信源译码。
[0042] 本文采用Adam算法作为模型训练的优化器,该算法策略可以表示为:
[0043]
[0044] 其中mt和vt分别为一阶动量项和二阶动量项,gt表示损失函数L对模型参数θ的梯‑8度值,β1和β2为指数衰减率,默认取值为0.9和0.999,正则化项ε的默认取值为1×10 , 和分别为各自的修正值。
[0045] 步骤2)在训练完成后,将所提的语义信源编译码方法用于水下图像传输的系统框图如图3所示。对于要发送的图像,先通过语义信源编码对原始图像进行语义信息的提取,之后再将提取到的浮点数的语义信息量化为0/1比特;
[0046] 步骤3)将步骤2)获得的0/1比特,经过传统的BPSK(二进制相移键控Binary Phase Shift Keying)、QAM(正交振幅调制QuadratureAmplitude Modulation)等任意的调制方法调制为复数域符号后,发送至等效的符号域水声信道;需要说明,调制包括采用各阶调幅、调频、调相、正交幅度调制和多载波调制中的至少一种调制方式对0/1比特进行调制。BPSK和QAM仅为举例,并不限制。
[0047] 优选的,所述信道均衡包括采用线性均衡、频域均衡、时间反转和DFE均衡中的至少一种均衡方式。例如DFE(decision feedback equalization判决反馈均衡器,仅为举例,并不限制。
[0048] 信号经过符号域水声信道的作用会产生失真,函数如下:
[0049]
[0050] 其中 表示卷积,而x(n),y(n)以及w(n)分别表示发送信号,接收信号以及加性高斯白噪声,h(n)表示水声信道冲激响应,而Y(k),X(k),H(k)以及W(k)分别对应频域的表示。
[0051] 在接收端,对经过符号域水声信道存在一定程度失真的信号完成同步和解调后,需要先经过包括DFE均衡在内的任意的信道均衡方法以抵抗多途干扰,并输出0/1比特。
[0052] 步骤4)将步骤3)获得的0/1比特输入神经网络的解码端,经过语义信源译码,完成图片重构。
[0053] 下面结合附图和实施例对本发明的技术方案进行详细的说明。
[0054] 实施例1
[0055] 本发明的实施例1提出了一种适用于水下图像传输的语义信源编译码方法,包括以下步骤:
[0056] (一)基于矢量量化的变分自编码器(VQ_VAE)模型对图片进行训练:
[0057] 本发明的语义信源编译码部分采用矢量量化的变分自编码器(VQ_VAE)模型,整体为编码器‑解码器架构,具体的网络结构如图1所示。语义信源编码部分主要由两个跨步卷积层和一个矢量量化层组成,其中,跨步卷积层的窗口大小为4x4,步幅为2。在编码端,网络先通过跨步卷积层对原始图片进行语义信息的提取,之后再通过矢量量化层将提取到的浮点数的语义信息量化为0/1比特。语义信源译码部分主要由一个去矢量量化层和两个转置卷积层组成,其中,转置卷积层窗口大小同样为4x4,步幅仍为2。在解码端,网络先对0/1比特进行去矢量量化操作,恢复出图片的语义信息,之后再根据语义信息实现图片的重构。
[0058] (二)将发送图片通过语义信源编码为0/1序列:
[0059] 在训练完成后,对于要发送的图片,先通过语义信源编码将图片编码为0/1序列,即通过神经网络先对原始图片进行语义信息的提取,之后再量化为0/1比特。
[0060] (三)对步骤(二)中获得的0/1序列,通过任意的BPSK、QAM等调制方法调制为复数域符号后,发送至等效的符号域水声信道。由于信号经过水声信道的作用会产生一定程度的失真,所以,在接收端,在对失真的信号完成同步和解调后,需要采用包括DFE在内的任意均衡方法以抵抗多途干扰,并输出0/1比特。
[0061] (四)将步骤(三)获得的0/1比特输入网络的解码端,通过语义信源译码部分完成图片的重构。
[0062] 实施例2
[0063] 如图1所示,本发明的实施例2采用水声通信系统作为应用背景,通过仿真验证说明本发明的有效性。具体包括:
[0064] 步骤1,基于矢量量化的变分自编码器(VQ_VAE)架构对图片进行训练。
[0065] 具体的网络模型及参数如图1所示:网络选用的数据集为自建的从ImageNet数据集中选取的海上船只的图片集,其中,训练集共6318张,验证集共253张,每张图片宽度和高度均设置为88。隐藏层通道数为256,残差块通道数为64,量化维度为256,量化码本大小为1024,残差块层数为4。本实施例设定的压缩比为2.6%,即原始图片经过语义信源编码后的比特数为原始图片比特数的2.6%。
[0066] 此外,本发明还将所提方法与JPEG压缩算法对相同图片在不同压缩比下的压缩效果进行了对比,并采用计算机视觉领域常用的结构相似性指数(SSIM)计算压缩后的图片和原始图片的相似性,作为压缩效果的衡量指标,结果如图2所示。可以看出,在相同的压缩比下,所提方法的SSIM值更高;在相同的SSIM值下,所提方法的压缩比更低、压缩率更高;因而,本发明所提方法可以在压缩率更高的情况下,达到更好的恢复效果。本实例的网络模型的压缩率为2.6%,在相近的图片恢复效果下(SSIM指标相近),JPEG的压缩率为4.1%。
[0067] 步骤2,在训练完成后,将发送图片通过语义信源编码为0/1。发送的原始图片如图4所示,此图片宽度和高度均为88,有R、G、B三个通道,初始大小为185856bit,经过语义信源编码为4840bit。
[0068] 步骤3,将步骤2得到的0/1序列,通过传统的BPSK调制后,发送至等效的符号域水声信道,在接收端完成同步和解调后,经过传统的DFE均衡方法抵抗多途干扰后输出0/1序列。
[0069] 所选用的水声信道为实测的水声信道,其信道冲激响应如图5所示。发送的信道经过信道卷积后,再额外添加一定大小的高斯噪声。信噪比范围为[3,18]dB。这里的信噪比定义为:
[0070]
[0071] 信号在经过加噪信道后会产生一定的误码,之后经过传统的DFE均衡以降低误码率,经过DFE均衡后的误码率随信噪比的变化曲线如图6所示。
[0072] 步骤4,经过语义信源译码,完成图片恢复。如图7所示,当信噪比为8dB时,此时误码率为1.6%,经过语义信源译码后恢复的图像虽然存在一定的失真,但是仍能看出图像的主要内容,实现了图像的有效重构。
[0073] 进一步地,计算在同等条件下采用JPEG压缩的图像经过水声信道后的图像恢复结果。对于所发送的图像,所提方法采用2.6%的压缩率,JPEG方法采用4.1%的压缩率,均经过图5的水声信道,添加相同SNR的噪声后,图像恢复结果对比如图7所示。由图可看出,JPEG方法只有当信噪比高于15dB(0误码)时才可恢复图像,且存在明显的“悬崖效应”,即存在一定误码、信噪比低于15dB时,图像恢复效果会出现断崖式下降;而所提方法在信噪比8dB(误比特率为1.6%)时仍可较好恢复图像,且不存在“悬崖效应”。综上,与传统的JPEG压缩方法相比,所提的语义信源编译码方法可在更高压缩率下具备更高的抗误码性能,更适合水下远程图像传输。
[0074] 实施例3
[0075] 本发明的实施例3提出了一种适用于水下图像传输的语义信源编译码系统,基于实施例1的方法实现,包括:部署在发送端的语义信源编码模块和调制输出模块;以及部署在接收端的同步解调模块、信道均衡模块和语义信源译码模块;其中,
[0076] 语义信源编码模块,用于对待传输的原始图像依次进行语义信息的提取,及对提取的浮点数的语义信息进行量化,输出0/1比特;
[0077] 调制输出模块,用于将0/1比特进行调制,得到的复数域符号发送至等效的符号域水声信道进行传输;
[0078] 同步解调模块,用于对接收的信号进行同步和解调;
[0079] 信道均衡模块,用于对解调后的信号进行信道均衡,输出0/1比特;
[0080] 信源译码模块,用于对0/1比特进行经去矢量量化和语义信息恢复,根据语义信息实现图像的重构。
[0081] 最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

当前第1页 第1页 第2页 第3页
相关技术
信源相关技术
图像传输相关技术
王海斌发明人的其他相关专利技术