技术领域
[0001] 本发明涉及数据库构建技术领域,具体涉及一种自然资源数据库构建方法及系统。
相关背景技术
[0002] 自然资源数据包括土地资源、森林资源、草地资源、水资源、气候资源、矿产资源、海洋资源、能源资源和其他资源。自然资源数据库是为满足用户的需要,按照一定的数据模型在计算机系统中组织、存储和使用的互相联系的自然资源数据集合。
[0003] 现有技术中在构建自然资源数据库时,对多源资源数据整合分析是通过人为方式进行,具有较强主观性的同时效率也低,从而导致自然资源数据库构建的可信度和效率难以保障,导致最终对自然资源数据库进行数据应用的效果较差。
具体实施方式
[0052] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0053] 如图1所示,本发明提供了一种自然资源数据库构建方法,包括以下步骤:
[0054] 采集多源自然资源数据,以及与多源自然资源数据具有地理关联性的地理空间数据;
[0055] 通过多源自然资源数据和地理空间数据,利用神经网络,进行资源分析模型的建立,得到用于根据多源自然资源数据和地理空间数据获得资源分析结果的资源分析模型;
[0056] 将多源自然资源数据和地理空间数据,以及获得的资源分析结果组合构建为自然资源数据库;
[0057] 其中,将资源分析模型与自然资源数据库进行动态更新关联。
[0058] 本发明构建了资源分析模型,对多源自然资源数据和地理空间数据进行分析整合,获得资源分析结果,将多源自然资源数据和地理空间数据、资源分析结果一同组合构建成自然资源数据库,从而使得自然资源数据库中直接包含有资源分析数据,可直接进行数据应用或解读,实现了提升数据应用效果的自然资源数据库,而非是单一记录作用的自然资源数据库。
[0059] 本发明在构建自然资源数据库采用模型化数据分析整合方式,提升了数据处理效率,同时采用统一模型进行数据分析整合,数据处理的标准性得以提高,从而保证了构建出的自然资源数据库标准性、可信度更高。
[0060] 进一步的,本发明为了在自然资源数据库中数据更新情况下更高效的获得资源分析结果,对资源分析模型进行了迁移学习,以随自然资源数据库中数据更新进行动态关联,在自然资源数据库意见建立完成后,其中,当自然资源数据库中仅存在多源自然资源数据进行更新时,此时地理空间数据是不发生变化的,若利用多源自然资源数据和地理空间数据,或者说利用资源分析模型来,来获得资源分析结果,对地理空间数据的分析处理过程是多余的,只会造成资源分析模型的运算负担,延长运算时长,所以本发明将多源自然资源数据和地理空间数据与资源分析结果间的映射关系的资源分析模型迁移为封装地理空间数据与资源分析结果间的映射关系的第一资源分析迁移模型,实现仅根据更新后的多源自然资源数据对自然资源数据库中资源分析结果进行更新,在实现资源分析结果更新同时提升数据分析效率,从而实现自然资源数据库的快速高效率更新。
[0061] 同样的,当自然资源数据库中地理空间数据进行更新时,此时多源自然资源数据是不发生变化的,若利用多源自然资源数据和地理空间数据,或者说利用资源分析模型来,来获得资源分析结果,对多源自然资源数据的分析处理过程是多余的,只会造成资源分析模型的运算负担,延长运算时长,所以本发明将多源自然资源数据和地理空间数据与资源分析结果间的映射关系的资源分析模型迁移为封装地理空间数据与资源分析结果间的映射关系的第二资源分析迁移模型,实现仅根据更新后的地理空间数据对自然资源数据库中资源分析结果进行更新,在实现资源分析结果更新同时提升数据分析效率,从而实现自然资源数据库的快速高效率更新。
[0062] 而且,本发明在将资源分析模型迁移训练为第一资源分析迁移模型和第二资源分析迁移模型时,以第一资源分析迁移模型和第二资源分析迁移模型的输出与资源分析模型输出间的差异为损失函数,从而使得第一资源分析迁移模型和第二资源分析迁移模型具有资源分析模型的输出性能,能够根据单类别数据(多源自然资源数据或地理空间数据)获得由多源自然资源数据和地理空间数据共同分析出的资源分析结果,即实现减少数据处理量,依旧获得同样的准确分析结果。因此,本发明可利用第一资源分析迁移模型和第二资源分析迁移模型进行资源的准确分析,同时实现资源的高效分析,提升自然资源数据库的更新效率。
[0063] 本发明中资源分析可包含多种类别的分析,比如资源数量和品质的分析:主要包括自然资源的种类、数量、分布情况,以及资源的质量、品质、纯度等指标的分析,可持续利用能力的分析:主要包括资源的重生产能力、可再生能力、科技承受力等指标的分析,以评估资源的可持续利用情况。经济价值的分析:主要包括资源的市场价值、商品价值、生产力价值等指标的分析,以评估资源在经济发展中的价值和贡献。生态环境的分析:主要包括资源的生态环境保护情况、生态系统稳定性、生物多样性等指标的分析,以评估资源的生态价值和保护情况。社会效益的分析:主要包括资源的社会利益、人民生活质量、文化价值等指标的分析,以评估资源对社会的贡献和影响程度。
[0064] 因此,资源分析结果包含资源数量和品质的分析结果、可持续利用能力的分析结果,经济价值的分析结果,生态环境的分析结果以及社会效益的分析结果,等等。
[0065] 多源自然资源数据包括:水体资源数据、森林资源数据、土地资源数据、矿产资源数据、气候资源数据,以及旅游资源数据。
[0066] 土地资源:包括耕地、林地、草地、建设用地等。
[0067] 森林资源:包括天然林和人工林,以及森林覆盖率和木材蓄积量等指标。草地资源:分为天然牧草地和人工牧草地,以及其他草地。
[0068] 水资源:包括地表水和地下水,以及水质状况和水资源总量。
[0069] 气候资源:涉及气候条件、气象灾害等信息。
[0070] 矿产资源:包括金属矿产、非金属矿产和能源矿产等。
[0071] 海洋资源:包括海洋生物资源、海洋矿产资源和海洋能源等。
[0072] 能源资源:包括煤炭、石油、天然气等传统能源,以及太阳能、风能等可再生能源;
[0073] 旅游资源:包括人为旅游资源(人文建筑)和天然旅游资源(奇山、奇水)。
[0074] 地理空间数据包括:空间位置数据、生态环境数据、社会经济数据、人口数据,以及遥感影像数据。
[0075] 本发明构建了资源分析模型,对多源自然资源数据和地理空间数据进行分析整合,获得资源分析结果,将多源自然资源数据和地理空间数据、资源分析结果一同组合构建成自然资源数据库,从而使得自然资源数据库中直接包含有资源分析数据,可直接进行数据应用或解读,实现了提升数据应用效果的自然资源数据库,而非是单一记录作用的自然资源数据库,具体如下:
[0076] 资源分析模型的构建方法包括:
[0077] 神经网络以多源自然资源数据和地理空间数据为输入,以资源分析结果为输出进行训练,得到封装多源自然资源数据和地理空间数据与资源分析结果间的映射关系的资源分析模型;
[0078] 资源分析模型为:
[0079] Goal=BP(Resource_data,Space_data);
[0080] 式中,Goal为资源分析结果,Resource_data为表征多源自然资源数据的数据向量,Space_data为表征地理空间数据的数据向量,BP为神经网络。
[0081] 资源分析模型损失函数为资源分析模型的输出与真实值之间的误差。
[0082] 将资源分析模型与自然资源数据库进行动态更新关联的方法包括:
[0083] 将资源分析模型以多源自然资源数据为输入,以资源分析结果为输出进行训练,以将封装多源自然资源数据和地理空间数据与资源分析结果间的映射关系的资源分析模型迁移为封装多源自然资源数据与资源分析结果间的映射关系的第一资源分析迁移模型;
[0084] 第一资源分析迁移模型为:
[0085] Goal=BP(Resource_data);
[0086] 式中,Goal为资源分析结果,Resource_data为表征多源自然资源数据的数据向量,BP为神经网络;
[0087] 将资源分析模型以地理空间数据为输入,以资源分析结果为输出进行训练,以将封装多源自然资源数据和地理空间数据与资源分析结果间的映射关系的资源分析模型迁移为封装地理空间数据与资源分析结果间的映射关系的第二资源分析迁移模型;
[0088] 第二资源分析迁移模型为:
[0089] Goal=BP(Space_data);
[0090] 式中,Goal为资源分析结果,Space_data为表征地理空间数据的数据向量,BP为神经网络。
[0091] 本发明为了在自然资源数据库中数据更新情况下更高效的获得资源分析结果,对资源分析模型进行了迁移学习,以随自然资源数据库中数据更新进行动态关联,在自然资源数据库意见建立完成后,其中,当自然资源数据库中仅存在多源自然资源数据进行更新时,此时地理空间数据是不发生变化的,若利用多源自然资源数据和地理空间数据,或者说利用资源分析模型来,来获得资源分析结果,对地理空间数据的分析处理过程是多余的,只会造成资源分析模型的运算负担,延长运算时长,所以本发明将多源自然资源数据和地理空间数据与资源分析结果间的映射关系的资源分析模型迁移为封装地理空间数据与资源分析结果间的映射关系的第一资源分析迁移模型,实现仅根据更新后的多源自然资源数据对自然资源数据库中资源分析结果进行更新,在实现资源分析结果更新同时提升数据分析效率,从而实现自然资源数据库的快速高效率更新。
[0092] 同样的,当自然资源数据库中地理空间数据进行更新时,此时多源自然资源数据是不发生变化的,若利用多源自然资源数据和地理空间数据,或者说利用资源分析模型来,来获得资源分析结果,对多源自然资源数据的分析处理过程是多余的,只会造成资源分析模型的运算负担,延长运算时长,所以本发明将多源自然资源数据和地理空间数据与资源分析结果间的映射关系的资源分析模型迁移为封装地理空间数据与资源分析结果间的映射关系的第二资源分析迁移模型,实现仅根据更新后的地理空间数据对自然资源数据库中资源分析结果进行更新,在实现资源分析结果更新同时提升数据分析效率,从而实现自然资源数据库的快速高效率更新。
[0093] 当自然资源数据库中多源自然资源数据进行更新时,利用第一资源分析迁移模型的输出对自然资源数据库中资源分析结果进行更新;
[0094] 当自然资源数据库中地理空间数据进行更新时,利用第二资源分析迁移模型的输出对自然资源数据库中资源分析结果进行更新;
[0095] 当自然资源数据库中多源自然资源数据和地理空间数据均进行更新时,利用资源分析模型的输出对自然资源数据库中资源分析结果进行更新。
[0096] 而对于在多源自然资源数据和地理空间数据均发生变化或者说均更新的情况下,则利用原始的资源分析模型对其进行配置参数测算,确保资源分析结果的准确性。
[0097] 确定多源自然资源数据更新的方法包括:
[0098] 将自然资源数据库中当前时刻的多源自然资源数据与自然资源数据库中前一时刻的多源自然资源数据进行相似度计算,并将相似度低于预设阈值的当前时刻的多源自然资源数据标记为多源自然资源数据更新;
[0099] 确定地理空间数据更新的方法包括:
[0100] 将自然资源数据库中当前时刻的地理空间数据与自然资源数据库中前一时刻的地理空间数据进行相似度计算,并将相似度低于预设阈值的当前时刻的地理空间数据标记为地理空间数据更新。
[0101] 相似度计算的函数包括欧式距离、相关系数,以及核函数。
[0102] 第一资源分析迁移模型在训练时的损失函数为:
[0103] Loss1=||BP(Resource_data)‑BP(Resource_data,Space_data)||1;
[0104] 式中,Loss1为第一资源分析迁移模型在训练时的损失函数,BP(Space_data)为第一资源分析迁移模型的输出,BP(Resource_data,Space_data)为资源分析模型的输出,||BP(Resource_data)‑BP(Resource_data,Space_data)||1为L1范数式;
[0105] 第二资源分析迁移模型在训练时的损失函数为:
[0106] Loss1=||BP(Space_data)‑BP(Resource_data,Space_data)||1;
[0107] 式中,Loss2为第二资源分析迁移模型在训练时的损失函数,BP(Space_data)为第二资源分析迁移模型的输出,BP(Resource_data,Space_data)为资源分析模型的输出,||BP(Resource_data)‑BP(Resource_data,Space_data)||1为L1范数式。
[0108] 而且,本发明在将资源分析模型迁移训练为第一资源分析迁移模型和第二资源分析迁移模型时,以第一资源分析迁移模型和第二资源分析迁移模型的输出与资源分析模型输出间的差异为损失函数,从而使得第一资源分析迁移模型和第二资源分析迁移模型具有资源分析模型的输出性能,能够根据单类别数据(多源自然资源数据或地理空间数据)获得由多源自然资源数据和地理空间数据共同分析出的资源分析结果,即实现减少数据处理量,依旧获得同样的准确分析结果。因此,本发明可利用第一资源分析迁移模型和第二资源分析迁移模型进行资源的准确分析,同时实现资源的高效分析,提升自然资源数据库的更新效率。
[0109] 在自然资源数据库中将多源自然资源数据和地理空间数据,以及获得的资源分析结果进行数据归一化处理。
[0110] 神经网络可选择BP神经网络,BP(backpropagation)神经网络是由Rumelhart和McClelland为首的科学家提出的概念,是一种按照误差逆向传播算法训练的多层前馈神经网络,是应用最广泛的神经网络模型之一。
[0111] BP神经网络具有任意复杂的模式分类能力和优良的多维函数映射能力,,仅通过自身的训练,学习某种规则,在给定输入值时得到最接近期望输出值的结果,即确定输入输出之间映射关系,经过反复学习训练,能对类似样本的输入信息,自行处理输出误差最小的经过非线形转换的信息,得到输出信息。
[0112] 利用BP神经网络的函数映射属性,本发明把BP神经网络运用至资源分析过程中,训练BP神经网络学习出多源自然资源数据和地理空间数据,以及资源分析结果之间的映射关系,从而能够根据多源自然资源数据和地理空间数据,来获得的资源分析结果。
[0113] 迁移学习是一种机器学习方法,就是把为任务A开发的模型作为初始点,重新使用在为任务B开发模型的过程中。就是通过使用一个适用于不同但是相关的任务的模型,以一种有利的方式缩小可能模型的搜索范围,因此,本发明将其用于确定出资源分析结果,实现减少数据处理量。
[0114] 如图2所示,本发明提供了一种自然资源数据库构建系统,应用于的一种自然资源数据库构建方法,系统包括:
[0115] 数据采集单元,用于采集多源自然资源数据,以及与多源自然资源数据具有地理关联性的地理空间数据;
[0116] 模型构建单元,用于通过多源自然资源数据和地理空间数据,利用神经网络,进行资源分析模型的建立,得到用于根据多源自然资源数据和地理空间数据获得资源分析结果的资源分析模型;
[0117] 数据库构建单元,用于将多源自然资源数据和地理空间数据,以及获得的资源分析结果组合构建为自然资源数据库;
[0118] 其中,将资源分析模型与自然资源数据库进行动态更新关联。
[0119] 本发明通过神经网络构建资源分析模型,使得根据多源自然资源数据和地理空间数据获得资源分析结果,建立统一客观的分析模型,提高了自然资源数据库的数据整合分析效率以及精准性,从而提高了在通过自然资源数据库进行数据应用的效果。
[0120] 以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。