首页 / 无源数据库

无源数据库无效专利 发明

技术内容

技术领域 本发明涉及一种存取和检索的方法,具体地是指一种新的数据库架构技术 和实现方法。 背景技术 随着目前计算机和网络信息技术的迅猛发展,现有的办公和生活中已经越 来越离不开对于计算机和网络的使用,各种大量的信息和数据通过网络或是单 机运行,实现了数据的共享和远程传输。 传统的数据库主要是面向查询或数据仓库的,包括有层次、网状和关系数 据库等数据管理方法,虽然可在一定程度上解决数据存取和检索的问题,但是 建立并应用这类商用的数据库仍存在一定的缺陷,为了实现存储和查询海量的 数据,需要配置大量的存储设备,而且,随着数据量增大到一定程度,将导致 数据查询性能的严重下降,无法满足实时响应、快速存取和检索的要求, 因此,在对数据库中的数据进行管理的同时,还需要针对数据进行有效地 分类存取以及借助高效的检索方法和软件。 发明内容 本发明的目的在于提出了一种新的网络数据库系统架构技术,为无源数据 库(Unsource Database,简称:UDB),将描述数据与原始数据相分离,并建 立多级数据存储和查询机制,有效提高了数据的存储和查询效率,适用于需要 以较低成本实现对海量数据进行管理的场合。 本发明无源数据库,包括数据采集模块、数据库集群以及查询接口,数据 库集群中包括若干个数据库,数据采集模块和查询接口与若干个数据库分别链 接,通过数据库集群分类存放经由数据采集模块收集的各类数据,通过查询接 口向数据库集群提取数据信息。 其中,数据采集模块设置有数据采集配置数据库、FTP/HTTP客户端以及本 地采集文件缓存,各种业务系统通过FTP/HTTP客户端与数据采集模块链接,数 据采集配置数据库和本地采集文件缓存中的数据由客户端经过用户数据过滤后 再压缩输出至各个数据库进行分类地保存。 数据库集群包括若干个数据库、数据入库接口、滑动查询窗口以及索引数 据库,通过数据入库接口实现数据采集模块与各数据库之间的链接,数据采集 模块的分类数据资料通过数据入库接口存放于各数据库中,索引数据库内保存 无源数据库UDB的常用的查询描述数据,索引数据库通过滑动查询窗口向数据 库提取数据资料。 数据查询接口包括查询分析器和数据查询模块,查询分析器分别与索引数 据库和门户网站portal链接,查询分析器通过门户网站portal接受数据查询请求, 然后预先定位数据所归属的数据库的统一资源定位器(URL)。 数据查询模块(UniReader)包括任务分发器、分布搜索引擎以及各子数据 库,其中,任务分发器将待查询的若干子任务通知给各分布搜索引擎,分布搜 索引擎与各子数据库链接,进行数据搜索,将结果返回给任务分发器。 所述子数据库可以通过普通关系数据库、文件数据库和脱机数据库中任选 一种或多种存储方式进行存储。 与现有技术相比,在本发明无源数据库的优点如下: (1)UDB系统采用实时采集技术,解决了对海量数据的采集和分析存储难 题,成为集中管理海量LOG记录的基础; (2)灵活的原始数据适配方案,便于增加新的数据管理需求,同时并不需 要额外的开发工作,从而减小了系统维护、升级的成本; (3)实用的线性查询速度,不因数据量增加而改变查询时间,解决传统数 据库因为数据量增大而查询性能严重降低的问题,在海量数据的情况下,可以 以较低的成本和恒定的速度完成数据的查询操作。 (4)UDB系统根据运维工作的特点,实现了″一点查询、全程服务″的功能。 为使本发明更加容易理解,下面将结合附图进一步阐述本发明无源数据库 的具体实施例。 附图说明 图1是本发明无源数据库的系统总体结构示意图; 图2是本发明无源数据库的数据采集模块结构示意图; 图3是本发明无源数据库的数据集群结构示意图; 图4是本发明无源数据库的数据查询接口; 图5是本发明无源数据库的数据查询模块结构示意图。 具体实施方式 下面结合说明书附图来进一步说明本发明的具体实施方式。 本发明无源数据库(Unsource Database,简称:UDB)可以跨平台的支持多 种系统,包括Windows、UNIX、Solaris、Linux(Redhat,Fedora,FreeBSD)、 HPUX、IBM AIX等。应用软件为UDB系统软件。 以下对该无源数据库的系统结构作进一步描述。 参照图1所示,本发明无源数据库包括数据采集模块1、数据库集群2以及 查询接口3,数据库集群2中包括若干个数据库20,数据采集模块1和查询接 口3与若干个数据库20分别链接,通过数据库集群2分类存放经由数据采集模 块1收集的各类数据,通过查询接口3向数据库集群2提取所要的数据信息。 参照图2所示,其中,数据采集模块1与短消息数据库(MMS Log),网络 数据库(WAP Log),KJava Log等等各种业务系统相链接,对各种原始文件进行 采集和整理,由于各种业务系统的数据是分散存放的,因此需要分别制定采集 算法和登录参数,并实现集中采集的功能。参照图2所示,数据采集模块1设 置有数据采集配置数据库10、FTP/HTTP客户端12、本地采集文件缓存14以及 数据过滤模块16,各种业务系统通过FTP/HTTP客户端12与数据采集模块1链 接,该FTP/HTTP客户端12将采集的各种数据资料通过设定的采集算法分配至 指定的数据采集配置数据库10和本地采集文件缓存14进行保存,并保持库存 资源与客户端之间的数据互通。数据采集配置数据库10和本地采集文件缓存14 中的数据由客户端经过数据过滤模块16对数据进行过滤后再压缩输出至各个数 据库20进行分类地保存。 参照图3所示,数据库集群2包括若干个数据库20、数据入库接口21、滑 动查询窗口22以及索引数据库23,通过数据入库接口21实现数据采集模块1 与各数据库20之间的链接,数据采集模块1的分类数据资料通过数据入库接口 21存放于各数据库20中,索引数据库23内保存无源数据库UDB的常用的查询 描述数据,索引数据库23通过滑动查询窗口22向数据库20提取数据资料,取 得基础数据查询和海量数据保存的两个需求的均衡。 参照图4所示,数据查询接口3包括功能模块:查询分析器30和数据查询 模块(UniReader)32,查询分析器30分别与索引数据库23和门户网站portal链 接,查询分析器30通过门户网站portal接受数据查询请求,然后预先定位数据 所归属的数据库的统一资源定位器(URL,Uniform Resource Locator),通过集 中配置的索引数据库23查询所需数据库的URL以及具体数据库的查询方案。 参照图5所示,数据查询模块(UniReader)32的功能模块包括:任务分发器 320、分布搜索引擎322以及各子数据库324,其中,任务分发器320将每个查 询任务根据总体存储策略计算出需要多个子系统324协同工作的若干子任务, 并通知给各分布搜索引擎322;分布搜索引擎322在指定端口侦听搜索任务,并 转换成本地查询方案,通过本地查询方案进行数据搜索,将结果返回给任务分 发器320;子数据库324可以根据平台的特性以多种方式存储数据,包括普通关 系数据库、文件数据库、脱机数据库如磁带以及其他补充的存储方案如目录服 务。数据查询模块32的任务分发器320需要接收从查询分析器30所查找到的 子数据库324的URL,通知驻留在各个子数据库主机上的分布搜索引擎322所需 查找的查询条件;分布搜索引擎322收到通知后,将通过子数据库324查找所 需数据,并将查找结果返回数据查询模块32。 首先,查询索引数据库23,搜索常用的查询描述数据,然后将查询结果返 回给数据查询模块32,由数据查询模块32的任务分发器320对待查询任务进行 分解,然后通过分布搜索引擎322对各子数据库324进行索引,实现对数据库 群的统一查询,并向查询分析器30返回查询结果,然后门户网站portal再将查 询结果进行归一化,并返回给查询用户。 以上所揭露的仅为本发明无源数据库的较佳实施例而已,当然不能以此来 限定本发明之权利范围,因此依本发明申请专利范围所作的等同变化,仍属本 发明所涵盖的范围。

相关技术
舒波发明人的其他相关专利技术