技术领域
[0001] 本发明涉及多元地球化探异常识别领域、人工智能应用领域,尤其涉及一种基于图注意力自编码的多元地球化学异常识别方法。
相关背景技术
[0002] 多元地球化学异常的识别是矿产资源勘探的重要内容之一,其异常信息有助于地质学家进行潜在矿藏的判断。地球化探异常具有较强的空间异质性,必须考虑地球化探元素自身的空间异质性。传统的分形/多重分析、克里金方法、空间因素分析等异常识别方法考虑了空间近邻样本的相关性,在化探异常识别中表现突出。近年来,凭借对于复杂空间特征具有良好、自动化的学习能力,卷积神经网络被引入地球化探异常识别得研究领域中并取得了较高得精度。但受限于卷积层结构的限制,模型的入数据必须是基于采样点插值后的栅格数据;这会造成数据的二次误差,也限制了模型在自然环境(不规则)中的应用。此外,提取空间结构特征的卷积窗口只能为矩形,且不具有旋转不变性,这与真实环境中元素特征分布状况不符,也限制了卷积层对空间特征提取的能力。因此,需要对现有的卷积自编码进行改进和扩展,解决上述问题以提高其多元化探背景学习和异常识别的能力。
具体实施方式
[0019] 为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
[0020] 请参考图1,本发明的基于图注意力自编码的多元地球化学异常识别方法包括以下步骤:
[0021] S1、根据研究区的地质和成矿环境,选择与探测矿产异常合适相关的地球化学元素浓度数据,并进行归一化,最终处理结果如图2;本实施例以探测矿产为Fe例,与其异常合适相关的地球化学元素为Cu‑Zn‑Mn‑Pb‑Fe2O3;
[0022] S2、利用Moran'I指数对地球化学元素的空间相关性和聚集性进行定性衡量,并选择既能保留足够空间异质性又能含有足够多背景样本的阈值拐点处作为K近邻算法的最佳K值;
[0023] S3、基于确定的K值,利用K近邻算法,遍历所有采样点,对距离K以内的近邻采样点进行连边建立,构成多元地球化学拓扑图;其中采样点转变为拓扑图的节点,采样点采集的多元地球化学元素浓度作为节点属性向量;
[0024] S4、构建如图3中所示的图注意力自编码模型,并将S3中构建的得到多元地球化学拓扑图输入其中进行模型训练,观察重构损失,当输入数据和输出数据之间的误差不再变化时停止训练,得到训练完备的图注意力自编码器模型,损失函数具体如下:
[0025]
[0026] N为图中节点个数(采样点个数),F为节点的特征个数, 为第i个节点(采样点)的第k个原始特征(元素数值), 为第i个节点的第k个重构特征(元素背景值)。
[0027] S5、如图3所示,再次将S3中构建的得到多元地球化学拓扑图输入至S4训练完成的模型中,输出得到此地区的多元地球化探背景值;
[0028] S6、计算每个化探样本原始数据和重构背景值之间的欧式距离作为异常值,公式如下:
[0029]
[0030] F为节点的特征个数, 为第i个节点(采样点)的第k个原始特征(元素数值),为第i个节点的第k个重构特征(元素背景值)。
[0031] 并将异常值映射到样本所在的地理位置获得最终的区域化探异常识别图,如图4所示。
[0032] 采用ROC曲线对已知矿点区域的异常地图进行评价;当ROC曲线下方面积与整图面积比(AUC)大于0.5时,证明模型可用,AUC越接近1模型性能越好。本研究所构建的图注意力自编码模型的AUC值为0.797,如图5所示,优于其他化探异常识别方法。
[0033] 本发明将图学习引入化探异常识别中,提出了顾及真实采样点和不规则成矿区的图注意力自编码模型;使得网络模型直接以真实的地球化学采样点数据为输入数据,避免了插值带来的二次误差,也使得模型可以在不规则的区域应用,提高了地球化学模型的实用性。此外,本发明构建的自编码中负责空间提取的结构为图注意力层,可以对多元地球化学拓扑图中采样点的属性特征和结构特征进行提取;和常用的卷积层相比,它具有旋转不变性,能够较好的提取不同区域、不同结构的空间特征,为复杂地质和成矿环境下利用多元化探数据进行异常识别和矿藏判别提供了高效的方法。
[0034] 上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护范围之内。