技术领域
[0001] 本发明涉及一种数据集成方法,具体是一种区域地理空间数据集成方法。
相关背景技术
[0002] 地理空间数据不同于一般的事务管理的数据,由于对空间现象理解不同,对空间对象的定义、表达、存储方式亦有不同,给地理空间数据集成带来了极大的不便,解决多格式数据交换一直是近年来GIS应用系统开发中需要解决的重要问题。目前实现数据集成的方式大致有三种。
[0003] 一、外部数据交换模式外部数据交换是指直接读写其它软件的内部格式、外部格式或由其转出某种标准格式。它是一种间接数据交换格式,其它数据格式经专门的数据转换程序进行格式转换后,复制到当前系统中的数据库或文件中。这是当前GIS系统数据交换的主要方法,目前国内基本上还是采用这种方法。当前公认的几种重要空间数据格式有:ESRI公司的ARCiINF OCoverage,ArcShapeFile,E00格式;AutoDesk的DXF格式、DWG格式;MAPINFO的MIF,MID格式:Intergraph的DNG格式等等。
[0004] 实现外部数据交换的最初的方法是在不同GIS系统间采用中间数据格式。如ArcInfo的E00格式、MapInfo的MIF格式以及标准图形交换格式DXF等。中间数据格式实质上起到了一个数据桥梁的作用,通过这个桥梁可以实现软件之间的数据转换。应该看到,单机环境下用数据转换的方法实现数据共享有着明显的优势,如可以快速、准确地实现用户的需要,达到数据共享的目的。用户甚至可以在系统内设置有关的转换参数后,对海量GIS数据进行批量转换。从技术实现的难度上来讲,用户只需要做一些有限的参数设置就可以达到自己的目的,转换过程不需要用户千预。但是,由于不同的GIS软件数据模型的不同,导致对地理实体的描述也不一致,因而转换后的数据不能准确地表达原数据的信息,空间数据转换容易造成数据信息丢失,有时还会造成空间数据精度损失等等。
[0005] 二、直接数据访问模式直接数据访问是指在一个GIS软件中实现对其它软件格式的直接访问,即把一个系统的内部数据文件直接转换成另一个系统的内部数据文件。用户可以使用单个GIS软件存取多种数据格式。直接数据访问不仅避免了冗繁的数据转换,而且在一个GIS软件中访问某种软件的数据格式不要求用户拥有该数据格式的宿主软件,更不需要该软件运行。直接数据访问提供了一种更为经济实用的数据交换模式。目前使用直接数据访问模式实现数据交换的GIS软件主要有两个,即:Intergraph推出的GeoMedia系列软件和中国科学院地理信息产业发展中心研制的SuperMap。
[0006] 直接存取方法在本质上也属于数据转换的方法。GIS系统对不属于本系统格式的空间数据进行直接读取时,事实上也存在一个数据转换的过程。因此,用这种方式实现数据集成也包含数据转换的一些弊病。直接存取的方式在实现时会有空间数据丢失、精度损失刊数据表达歧义性的情况。空间数据格式开放的程度不同,使直接存取方法中出现一些特殊的和不可克服的弊病。如对于GIS系统升级的情况,通常会对空间数据格式进行修改,而且有时这种升级是全方位的,系统会对空间数据结构做一些彻底的、根本性的修改。这时基于直接读取方式的数据集成方式就显得无能为力,系统必须重写已经实现的数据存取模块。
具体实施方式
[0012] 下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
[0013] 请参阅图1,一种区域地理空间数据集成方法,包括以下步骤:一、地理本体及地理本体建模;
1)地理本体的基本概念:地理本体是指特定地理空间信息领域概念化模型或学科感知世界的明确的形式化规范说明。所谓的信息领域,是指共享同一数字地理信息语言和空间要素定义的人群。相同的信息领域共享相同的世界观和抽象模型、要素表达和元数据。也就是说,地理本体是与特定地理空间信息领域相关联的。概念化模型不同于通常意义上的概念模型,指的是人们对地理现实世界的多个抽象层次,包括地理认知世界、地理概念世界、地理空间世界、地理尺度世界及地理投影世界,等同于所谓的学科感知世界。因此,地理本体既可以是地理认知模型或概念模型的显式形式化,也可以是逻辑层次或表达层次上地理模型明确的形式化说明。
[0014] 2)地理本体构成:一个完整的地理本体应由概念或类、概念之间的关系、公理和实例四个组成部分或元语构成。地理本体用于表示地理领域中的各种不同种类的事物,这些具有相同属性的地理实体或现象的集合在地理本体中被表示为“地理概念”或“地理类型”。地理关系指地理领域中不同的地理概念之间某种性质的联系。地理概念之间的关系包括两大类,即语义关系和空间关系。在地理本体中,公理指地理学领域中公认的地理规律、地学知识以及施加于地理概念及地理概念之间关系之上的一些规则或约束条件,以便进行地理推理,并保证地理本体的一致性和完整性,是地理本体的一个重要组成部分。地理实例是指地理本体中概念或类的具体例子,也称为个体,如“长江”是“河流”概念的一个实例。
[0015] 2)地理本体建模:地理本体建模是指根据特定的目的和应用需要,将地理领域中非形式化的地理知识(包括地理学家的经验知识、文本形式的地理学知识等)和地理空间模型通过一定的形式化方法来明确描述领域中各种概念(类)及其之间的关系、实例和公理,从而建立形式化地理本体的过程。
[0016] 二、基于地理本体的空间数据集成;1)基于地理本体的空间数据集成方法:地理本体集成是基于地理本体的空间数据集成方法的核心和关键;采用所有本体都向某个标准本体集成的方案(图1),即通过比较数据生产者地理本体与数据使用者地理本体中的概念之间的关系,并根据一定的规则在这两个本体的概念之间建立映射关系。
[0017] ①地理概念语义关系的确定:地理本体集成是以不同本体中概念之间的语义映射关系为基础的,概念之间语义关系的确定至关重要。概念内涵是在概念层次上区别不同地理概念的关键,因此,地理本体集成中概念语义关系的确定也是以概念内涵的比较为基础的。本体集成中来自两个不同本体的地理概念之间的语义关系主要有等价关系、父概念/子概念关系(包含关系或上义/下义关系)、交叉关系和不交叉关系四种;②地理概念的集成规则:对于上述四种语义关系,有以下几种集成规则:等价关系的集成规则;父概念/子概念关系的集成规则;交叉关系的集成规则。
[0018] 在本体集成时,用户可以根据具体情况选择不同的集成规则,相应地可以产生不同的数据集成结果。
[0019] 2)集成过程中的数据抽取与转换:地理本体集成的最终目的是将数据生产者的地理空间数据集成到数据使用者的地理空间数据库中,从而服务于各种应用任务。而地理本体的集成只是实现了概念层次上的语义关系映射,即定义了源本体中各个概念与目标本体(标准地理本体)中各个概念的语义等价、包含或包含于、交叉和不交叉关系,并没有实现空间数据的集成。
[0020] 地理本体是独立于地理空间数据集的,即地理本体和空间数据是分别存储的。因此,根据语义映射关系来实现底层空间数据的抽取和转换,从而最终实现地理空间数据的集成,必须在地理本体与相应空间数据集之间建立关联。存在两个层次的关联关系:地理本体与空间数据集之间的关联关系及地理概念或类型与类或子类之间的关联关系。
[0021] 有两种途径可以建立本体和数据集之间的关联关系:一是在地理空间数据集的元数据中明确指出其对应的地理本体名称或存储路径;二是在地理本体中明确指出使用该本体的地理空间数据集或要素类。地理概念或类型与类或子类的关联关系也在地理本体中定义。地理概念用概念名、内涵、外延、自然语言定义和标识码CID来描述,其中标识码的作用就在于建立地理概念与相应地理空间数据集或要素类中各个类或子类之间的关联关系。
[0022] 在建立这两个层次的关联关系后,源地理本体的概念与目标地理本体的概念之间的映射关系就确定了。源地理空间数据集的各个要素被抽取和转换到目标地理空间数据库的哪个要素类或子类中是由集成的约束条件规定的。
[0023] 上面对本专利的较佳实施方式作了详细说明,但是本专利并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本专利宗旨的前提下作出各种变化。