首页 / 一种基于卷积自编码的潜在风沙源识别方法

一种基于卷积自编码的潜在风沙源识别方法实质审查 发明

技术领域

[0001] 本发明涉及风沙源识别技术领域,尤其涉及一种基于卷积自编码的潜在风沙源识别方法。

相关背景技术

[0002] 潜在风沙源区域是指受到风、水两营力作用的、间歇性出露沙体的地区,潜在风沙源是导致沙尘暴和其他风沙灾害的主要原因之一,故潜在风沙源的控制和管理有助于减轻水土流失、预防风沙灾害。
[0003] 近年来,随着RS(遥感技术)、GIS技术(地理信息系统)的长足发展,利用高分辨率的环境遥感信息资料,对区域河谷微地貌特征以及潜在风沙源进行更深入的研究,成为重要的研究方向之一。
[0004] 同时,随着人工智能、深度学习算法的不断发展与优化,深度学习算法与遥感技术结合的方式提取所需信息,已成为当前的重要手段。神经网络对深层次隐含结构特征的学习能力,使其在河谷微地貌特征提取及潜在风沙源识别领域引起了广泛的关注。
[0005] 已有研究证明,深度玻尔兹曼、深度置信网络等神经网络模型在复杂地质环境的异常识别中表现不俗。然而,由于风沙活动强烈的区域,如河谷微地貌特征不断演化,导致潜在风沙源时空表征不稳定,时空变化特征提取困难,潜在风沙源时空分布特征识别参数训练难度较大,准确率较低。
[0006] 总之,目前缺乏综合考虑复杂的地质背景空间差异且训练较为准确的河谷微地貌特征提取及潜在风沙源识别方法。

具体实施方式

[0049] 为了使本发明实施例公开的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明实施例进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明实施例,并不用于限定本发明实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。
[0050] 需要说明的是,术语“包括”和“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0051] 相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0052] 如图1和图2所示,一种基于卷积自编码的潜在风沙源识别方法,包括以下步骤:
[0053] S1、获取研究区域的遥感影像;
[0054] 在步骤S1中,由USGS获取研究区域的遥感影像,且遥感影像的可见光波段、近红外波段以及短波红外波段的空间分辨率均为30m,全色波段的空间分辨率为15m。
[0055] 如图3‑图5所示,本实施例中,选择的研究区域是雅鲁藏布江曲水—泽当段,下载研究区域的Landsat 8数据,该研究区域涉及两幅条带号不同、行编号相同的遥感影像,条带号分别为137、138,行编号为040。
[0056] S2、对遥感影像进行预处理,并将预处理后的遥感影像,作为卷积自编码器训练所用的输入数据;
[0057] 步骤S2具体包括以下步骤:
[0058] S21、通过ENVI软件对输入数据依次进行如下预处理:辐射定标、大气校正、边缘裁剪、图像融合、图像镶嵌、影像裁剪(裁剪出所需的研究区域遥感影像)、归一化水体指数运算(NDWI);
[0059] 其中由于进行了归一化水体指数运算,对绿波段和近红外波段进行了处理,故使得预处理后的遥感影像包含的波段数量为1;
[0060] S22、通过ArcGIS软件进行影像的再次裁剪,将由步骤S21预处理后的遥感影响裁剪为大小均为2250×1154的四幅图像。
[0061] 本实施例所用软件为ENVI 5.3和ArcGIS10.2。
[0062] S3、通过量化曲线确定卷积自编码器神经网络模型的卷积核尺寸,以训练卷积自编码器神经网络模型;
[0063] 步骤S3具体包括以下步骤:
[0064] S31、针对每个输入数据,利用多个不同的卷积核尺寸构建多个卷积自编码器神经网络模型,并利用样本数据进行训练,得到训练结果;
[0065] S32、对训练结果进行处理,用各个等级的重构值所占的面积比评价训练结果的拟合优度,并计算面积比得到量化曲线;
[0066] 步骤S32具体包括以下步骤:
[0067] 将重构值分为不同的等级,计算各等级重构值与总体的比值大小,再利用各个等级的重构值所占的比值评价训练结果的拟合优度,并对比值进行统计分析得到量化曲线;
[0068]
[0069] 式中,R为重构值与总体的比值;L为各等级重构值的面积;T为总体的面积;
[0070] S33、将卷积核尺寸位于曲线拐点之后和曲线总和最小作为评估标准,对量化曲线进行筛选,选取卷积核尺寸。
[0071] 如图4所示,在步骤S33中,由于卷积核尺寸大于25时,卷积自编码器神经网络模型不是欠拟合的。故为了避免过多的卷积核尺寸导致过拟合和增加计算复杂性的情况的发生,同时为了确保选择的卷积核尺寸在曲线拐点以后且相加之和最小,故选取的卷积核尺寸为50×50。
[0072] S4、构建卷积自编码器神经网络模型,将经步骤S2预处理后的遥感影像输入卷积自编码器神经网络模型进行训练,并利用训练完毕的卷积自编码器神经网络模型对研究区域进行共性特征提取及背景重建;
[0073] 步骤S4具体包括以下步骤:
[0074] S41、针对多个年份的研究区域数据,分别构建多个卷积自编码器神经网络模型;
[0075] S42、基于步骤S3设置卷积自编码器神经网络模型的模型参数;
[0076] S43、将经步骤S2预处理后的遥感影像输入卷积自编码器神经网络模型中进行训练直至收敛,得到重构数据,其中卷积自编码器神经网络模型由编码器和解码器组成,编码器用于将输入的数据映射到低维表示空间,解码器用于将编码映射回原始数据空间,并尽可能的还原原始数据,通过最小化重构误差,优化网络参数,使得能够有效的提取数据中的关键特征,以此实现背景重建。
[0077] 在步骤S4中,针对多个年份的研究区域数据,分别构建多个卷积自编码器神经网络模型,并利用对应的研究区域内的样本数据进行训练直至收敛。
[0078] 在本实施例中,卷积自编码器神经网络模型的输入层接收到的输入数据,对其进行编码和解码。在编码过程中,在卷积层对输入数据进行卷积操作,提取特征。在池化层,对卷积后的特征进行下采样,减小特征图尺寸,同时保留主要特征。在解码过程中,经过反卷积层,对编码器输出的低维特征进行反卷积操作,得到上采样的特征图,在输出层中,对解码器输出的特征进行反卷积操作,还原最初的特征。
[0079] S5、通过计算每个卷积自编码器神经网络模型(CAE模型)的输入数据与卷积自编码器神经网络模型重构背景之间的差值,得到样本异常得分,并将样本异常值映射到样本所在地理位置,生成表达整个研究区域的空间结构异常分布图;
[0080] 步骤S5所述的卷积自编码器神经网络模型的输入数据为经步骤S2预处理后的遥感影像;
[0081] 使用卷积自编码方式对数据进行训练,在训练过程中,设置卷积尺寸的大小以及模型的迭代次数,由于每个卷积自编码器神经网络模型的输入四张影像基于同一背景,故不同卷积自编码器神经网络模型之间的数据是并行处理的,而同一卷积自编码器神经网络模型的分块数据并不是并行处理的,所以将它们一起作为学习样本进行处理。
[0082] 步骤S5所述的样本异常得分的计算公式如下:
[0083]
[0084] 式中,l为样本异常得分;xk为遥感影像原始数据值;xk′为卷积自编码器神经网络模型输出数据中的数据值;n为元素个数。
[0085] S6、对空间结构异常分布图进行分析,识别时间、空间尺度下的潜在风沙源,通过对空间异常结构分布图进行分析,识别潜在风沙源分布特征及变化趋势,从而有效提高河谷微地貌特征提取及潜在风沙源识别的准确性。
[0086] 在步骤S6中,识别出的年际尺度上空间特征的异常得分高于设定值的区域为潜在风沙源区域。空间结构异常是空间结构不稳定的区域,也就是潜在风沙源区域,如图5所示,其中红色表示该区域是不稳定、易变程度最大的沙体区域;其次为黄色区域,该区域的不稳定和易变程度次于红色区域。通过对其进行分析,探究不同时间段内同一区域潜在风沙源的空间分布特点及趋势变化,识别在年际尺度上空间特征不稳定的拥有较高异常值的区域,即易变潜在风沙源区域。
[0087] 因此,本发明采用上述基于卷积自编码的潜在风沙源识别方法,将遥感影像与卷积自编码器相结合,兼顾不同时间遥感影像间的空间分布特征,从而有效提高河谷微地貌特征提取及潜在风沙源识别的准确性,为复杂地质条件下利用遥感影像进行异常识别提供了较为实用可靠的科学方法。
[0088] 最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

当前第1页 第1页 第2页 第3页
相关技术
潜风沙相关技术
积编码相关技术
武可聪发明人的其他相关专利技术