首页 / 数据统计方法及数据统计装置

数据统计方法及数据统计装置失效专利 发明

技术领域

[0001] 本发明涉及数据处理技术领域,具体为数据统计方法及数据统计装置。

相关背景技术

[0002] 近些年来,随着信息技术的不断发展,应用程序的种类越来越多,为了分析应用程序的优点及缺点,需要统计应用程序内部功能的使用,以及用户的使用方式习惯的统计和记录,以根据用户的习惯进行应用程序的改进。
[0003] 数据在统计时,由于目前应用程序的种类较多,使用量巨大,所产生的源数据流量非常大,常规的数据统计装置无法快速的进行数据的统计,同时产生的源数据中也会有很多的噪声数据和无关数据,导致统计的数据不够精准,数据统计的效率较低。

具体实施方式

[0024] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0025] 请参阅图1,本发明提供一种技术方案:
[0026] 一种数据统计方法,该方法包括以下步骤:
[0027] 数据获取、获取源数据,对源数据进行聚类,即将源数据由多个类似的对象组成的多个类,每个类分配一个选项卡;
[0028] 数据预处理、利用matlab对每个选项卡内的噪声数据和无关数据进行提取和清除,处理遗漏数据和清洗脏数据、空缺值,识别并删除孤立点,在matlab曲线拟合工具箱中提供的一元数据的分析工具,利用cftool进行平滑处理,进行拟合,数据筛选,以及拟合后的差值,外推,差分,积分等后处理工作,在获得的源数据基础上进行进一步优化数据,剔除掉噪声数据和无关数据,能够获取更加精准的数据;
[0029] 数据编号、将每个选项卡按照顺序依次编号,并按照编号通过二分法,对选项卡进行分段,在位于每个分段末尾的选项卡上进行结束标记;
[0030] 数据统计、对每个选项卡分别进行数据统计,统计时在接收到具有结束标记的所述选项卡时,停止其统计请求中当前数据编号的更新以使所述选项卡休眠,或者关闭接收到统计结束标识的所述选项卡;
[0031] 数据汇总、将统计完成后的选项卡中的数据发送到数据服务器中,按照选项卡的编号以及录入的时间戳组合的方式进行命名。
[0032] 根据各个所述选项卡的统计请求同时调用同一个接口函数;或者,根据各个选项卡的统计请求同时依次调用同一个接口函数。
[0033] 所述数据统计时,由多个数据统计服务器配合完成,服务节点受到统计请求后将选项卡分别发送至多个数据统计服务器,数据统计服务器反馈任务量到服务节点,服务节点筛选出任务量最小的数据统计服务器,然后再向任务量最小的数据统计服务器分配新的选项卡,通过每个选项卡按照顺序依次编号、分段,并在位于每个分段末尾的选项卡上进行结束标记,防止了数据的重复统计,提高了数据统计的效率,并且,无需人工控制选项卡的休眠或关闭,提高了数据统计的智能性。
[0034] 所述内部计算节点只能通过指定的服务节点访问,通过访问地址的限制和账号控制来防止其他服务节点的访问,对其他的服务节点进行屏蔽;通过一个服务节点和多个数据统计服务器,能够通过多个数据统计服务器同时对源数据进行统计处理,能够大大的提高统计的速度和统计的数据量。
[0035] 本发明还提供一种数据统计装置,包括:
[0036] 获取单元,安装于设备终端内,在用户使用设备终端时获取设备终端的源数据,根据设备终端的类型对源数据进行聚类,即将源数据由多个类似的对象组成的多个类,每个类分配一个选项卡;
[0037] 处理单元,所述处理单元采用matlab曲线拟合工具箱对每个选项卡内的噪声数据和无关数据进行提取和清除,处理遗漏数据和清洗脏数据、空缺值,识别并删除孤立点,在matlab曲线拟合工具箱中提供的一元数据的分析工具,利用cftool内的smooth函数进行平滑处理,进行拟合,数据筛选,以及拟合后的差值,外推,差分,积分等后处理工作;
[0038] 编号单元,用于将每个选项卡按照顺序依次编号,并按照编号通过二分法,对选项卡进行分段,在位于每个分段末尾的选项卡上进行结束标记;
[0039] 数据统计单元,用于对每个选项卡分别进行数据统计,统计时在接收到具有结束标记的所述选项卡时,停止其统计请求中当前数据编号的更新以使所述选项卡休眠,或者关闭接收到统计结束标识的所述选项卡;
[0040] 数据汇总单元、将统计完成后的选项卡中的数据发送到数据服务器中,按照选项卡的编号以及录入的时间戳组合的方式进行命名。
[0041] 所述数据汇总单元包括一个服务节点和多个数据统计服务器,所述数据统计时,由多个数据统计服务器配合完成,服务节点受到统计请求后将选项卡分别发送至多个数据统计服务器,数据统计服务器反馈任务量到服务节点,服务节点筛选出任务量最小的数据统计服务器,然后再向任务量最小的数据统计服务器分配新的选项卡。
[0042] 虽然在上文中已经参考实施例对本发明进行了描述,然而在不脱离本发明的范围的情况下,可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是,只要不存在结构冲突,本发明所披露的实施例中的各项特征均可通过任意方式相互结合起来使用,在本说明书中未对这些组合的情况进行穷举性的描述仅仅是出于省略篇幅和节约资源的考虑。因此,本发明并不局限于文中公开的特定实施例,而是包括落入权利要求的范围内的所有技术方案。

当前第1页 第1页 第2页 第3页
相关技术
方法数据相关技术
统计方法相关技术
孟晓然发明人的其他相关专利技术