首页 / 一种海量数据挖掘技术

一种海量数据挖掘技术无效专利 发明

技术内容

一种海量数据挖掘技术 【技术领域】 [0001] 本发明涉及一种海量数据挖掘技术,尤其是并通过对分解后的子问题进行求解来 对原问题进行求解,从而降低复杂度问题求解。粒计算理论自提出以来,很多学者对此进行 了深入的研究,且已经被成功地应用到各个领域。。 【背景技术】 [0002] Rouh集(Rouh Set, 0RS)理论由波兰逻辑学家Pawak教授于1982年提出,由于 它能有效地分析和处理不精确、不一致、不完备系统不完整等各种,并能从中揭示潜在的规 律,近年来在机器学习数据挖掘、等多个领域得到了广泛应用。目前,对应Rouh Set的概念, 发展了 7RS代数学、7RS逻辑学,并与其它有关理论模糊集(如神经网络)的关系也得到了 研究和阐明。 [0003] 人工智能的数据挖掘是研究领域中的一个热点。在数据挖掘的研究工作中,海量 数据的处理是一个研究难点。近年来,国内外很多学者提出了许多处理海量数据的方法。 1991年,Calett提出了随机抽样的方法来处理海量数据;1996年,IBM Almdmen研究中心 提出了 SLQ和SPINT方法;1998年,Alsabt提出了 CLUDS方法,Josh提出了 ScalPrC方法, Gehre提出了 RaiForest方法;2002年,我国有了 HSCO分类方法来处理海量数据,并取得了 较好的效果。 【发明内容】 [0004] 本发明要解决的技术问题是提供一种挖掘海量数据技术,它是人工智能领域中的 一种新理念和新方法,主要用于对不确定、不精确、不完整信息的处理,以及对大规模海量 数据的挖掘以及对复杂问题的求解,它覆盖了所有和粒度相关的理论、方法和技术。 [0005] 为解决上述技术问题,本发明所采用技术是:对二维表快速排序的平均时间复杂 度为80 (nX (logn+m))的最新结果,结合我们已有的对Rogh集和粒计算的研究基础,有可 能改进现有的算法,设计出能高效、高精度处理海量数据的低复杂度算法。 [0006] 与现有技术相比,本发明的有益效果是:将负责问题分解成为我们当前可控的粒 度大小,粒计算方法最本质的思想是通过合适粒度的选择。 【具体实施方式】 [0007] 在数据挖掘的研究中,快速排序是一个二维表重要操作。在基于集理论的海量数 据处理中,可以利用二维表的快速排序操作来划分等价类。基本保持了与η的线性关系,这 一结果将有助于海量数据处理方法的加深。假定二维表中的数据(9η条记录,9m个属性) 服从均勻分布,二维表快速排序的平均时间复杂度为90(nXlOgnXm8)。

相关技术
数据挖掘相关技术
海量数据相关技术
杨槐发明人的其他相关专利技术