分类方法及装置 【技术领域】 [0001] 本发明涉及机器学习技术,尤其涉及一种分类方法及装置。 【背景技术】 [0002] 在机器学习中,可以利用大量已知的训练样本,构建分类模型即分类器,进而利用所构建的分类器对未知的数据进行预测。分类器可以应用在很多场景,例如,由于因网络作弊而产生的垃圾页面越来越多,严重影响了搜索引擎的检索效率和用户体验,因此,反作弊已经成为搜索引擎所面临的最重要的挑战之一,可以将利用已标注的正常数据和作弊数据,构建一个分类器,以对网络数据进行识别。现有技术中,可以利用所构建的一个分类器,对数据进行预测,以获得分类结果。 [0003] 然而,采用单一的分类器,其所预测的数据的分类结果的准确率不高。 【发明内容】 [0004] 本发明的多个方面提供一种分类方法及装置,用以提高分类结果的准确率。 [0005] 本发明的一方面,提供一种分类方法,包括: [0006] 将待预测的数据分别输入M个目标分类器,以获得所述M个目标分类器中每个目标分类器所输出的预测结果,M为大于或等于2的整数,所述每个目标分类器之间相互独立; [0007] 根据所述每个目标分类器所输出的预测结果和所述每个目标分类器的预测权重,获得所述数据的分类结果。 [0008] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述将待预测的数据分别输入M个目标分类器,以获得所述M个目标分类器中每个目标分类器所输出的预测结果之前,还包括: [0009] 利用M个训练样本集中每个训练样本集,分别构建1个目标分类器,所述每个训练样本集中所包含的训练样本不完全相同;或者 [0010] 利用1个训练样本集,采用M个分类算法中每个分类算法,分别构建1个目标分类器。 [0011] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述每个目标分类器所输出的预测结果和所述每个目标分类器的预测权重,获得所述数据的分类结果之前,还包括: [0012] 根据所述每个目标分类器的分类准确率,获得所述每个目标分类器的第一权重值; [0013] 根据第一指定时间和所述每个目标分类器的构建时间,获得所述每个目标分类器的第二权重值; [0014] 根据所述第一权重值和所述第二权重值,获得所述每个目标分类器的预测权重。 [0015] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述将待预测的数据分别输入M个目标分类器,以获得所述M个目标分类器中每个目标分类器所输出的预测结果之前,还包括: [0016] 确定待更新的N个候选分类器,N为大于或等于M的整数; [0017] 根据所述N个候选分类器中每个候选分类器的分类准确率,获得所述每个候选分类器的第三权重值; [0018] 根据第二指定时间和所述每个候选分类器的构建时间,获得所述每个候选分类器的第四权重值; [0019] 根据所述第三权重值和/或所述第四权重值,从所述N个候选分类器中删除P个候选分类器,以获得所述M个目标分类器,P为大于或等于1,且小于或等于N-2的整数。 [0020] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述将待预测的数据分别输入M个目标分类器,以获得所述M个目标分类器中每个目标分类器所输出的预测结果之前,还包括: [0021] 确定所构建的1个新的候选分类器; [0022] 根据所述新的候选分类器的分类准确率,获得所述新的候选分类器的第五权重值; [0023] 根据第三指定时间和所述新的候选分类器的构建时间,获得所述每个候选分类器的第六权重值; [0024] 根据所述第五权重值和/或所述第六权重值,将待更新的Q个候选分类器与所述新的候选分类器,作为所述M个目标分类器。 [0025] 本发明的另一方面,提供一种分类装置,包括: [0026] 分类单元,用于将待预测的数据分别输入M个目标分类器,以获得所述M个目标分类器中每个目标分类器所输出的预测结果,M为大于或等于2的整数,所述每个目标分类器之间相互独立; [0027] 处理单元,用于根据所述每个目标分类器所输出的预测结果和所述每个目标分类器的预测权重,获得所述数据的分类结果。 [0028] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还包括构建单元,用于 [0029] 利用M个训练样本集中每个训练样本集,分别构建1个目标分类器,所述每个训练样本集中所包含的训练样本不完全相同;或者 [0030] 利用1个训练样本集,采用M个分类算法中每个分类算法,分别构建1个目标分类器。 [0031] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述处理单元,还用于 [0032] 根据所述每个目标分类器的分类准确率,获得所述每个目标分类器的第一权重值; [0033] 根据第一指定时间和所述每个目标分类器的构建时间,获得所述每个目标分类器的第二权重值;以及 [0034] 根据所述第一权重值和所述第二权重值,获得所述每个目标分类器的预测权重。 [0035] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还包括第一更新单元,用于 [0036] 确定待更新的N个候选分类器,N为大于或等于M的整数; [0037] 根据所述N个候选分类器中每个候选分类器的分类准确率,获得所述每个候选分类器的第三权重值; [0038] 根据第二指定时间和所述每个候选分类器的构建时间,获得所述每个候选分类器的第四权重值;以及 [0039] 根据所述第三权重值和/或所述第四权重值,从所述N个候选分类器中删除P个候选分类器,以获得所述M个目标分类器,P为大于或等于1,且小于或等于N-2的整数。 [0040] 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还包括第二更新单元,用于 [0041] 确定所构建的1个新的候选分类器; [0042] 根据所述新的候选分类器的分类准确率,获得所述新的候选分类器的第五权重值; [0043] 根据第三指定时间和所述新的候选分类器的构建时间,获得所述每个候选分类器的第六权重值;以及 [0044] 根据所述第五权重值和/或所述第六权重值,将待更新的Q个候选分类器与所述新的候选分类器,作为所述M个目标分类器。 [0045] 由上述技术方案可知,本发明实施例通过将待预测的数据分别输入M个目标分类器,以获得所述M个目标分类器中每个目标分类器所输出的预测结果,M为大于或等于2的整数,所述每个目标分类器之间相互独立,使得能够根据所述每个目标分类器所输出的预测结果和所述每个目标分类器的预测权重,获得所述数据的分类结果,由于M个目标分类器中每个目标分类器之间是相互独立的,使得能够充分利用每个目标分类器的分类能力得到数据的分类结果,从而提高了分类结果的准确率。 [0046] 另外,采用本发明提供的技术方案,采用本发明提供的技术方案,使得数据的分类结果不再单独依赖于任何一个目标分类器的预测结果,而是综合考虑M个目标分类器中每个目标分类器的预测结果,这样,能够有效提高分类结果的准确率。 [0047] 另外,采用本发明提供的技术方案,采用本发明提供的技术方案,通过动态更新候选分类器的数量,即删除不满足分类需求的候选分类器,或者增加新的候选分类器,以获得能够正常工作的分类系统即M个目标分类器,这样,能够避免现有技术中由于利用重新标注的训练样本重新构建目标分类器替换原来的目标分类器而导致的无法充分利用原来的目标分类器的问题,能够有效提高目标分类器的利用率。 【附图说明】 [0048] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。 [0049] 图1为本发明一实施例提供的分类方法的流程示意图; [0050] 图2为本发明另一实施例提供的分类装置的结构示意图; [0051] 图3为本发明另一实施例提供的分类装置的结构示意图; [0052] 图4为本发明另一实施例提供的分类装置的结构示意图; [0053] 图5为本发明另一实施例提供的分类装置的结构示意图。 【具体实施方式】 [0054] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本发明保护的范围。 [0055] 另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。 [0056] 图1为本发明一实施例提供的分类方法的流程示意图,如图1所示。 [0057] 101、将待预测的数据分别输入M个目标分类器,以获得所述M个目标分类器中每个目标分类器所输出的预测结果,M为大于或等于2的整数,所述每个目标分类器之间相互独立。 [0058] 所谓的目标分类器,中“目标”二字,在此处的意思就是,“当前所需要使用的”,也就是说,目标分类器,就是当前所需要使用的分类器,并不是一个具有特别功能限定的特殊分类器。 [0059] 本实施例中所涉及的M个目标分类器可以构成一个集成的分类系统,每个目标分类器之间相互独立。 [0060] 102、根据所述每个目标分类器所输出的预测结果和所述每个目标分类器的预测权重,获得所述数据的分类结果。 [0061] 需要说明的是,101和102的执行主体可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的分类引擎,本实施例对此不进行特别限定。 [0062] 可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行限定。 [0063] 这样,通过将待预测的数据分别输入M个目标分类器,以获得所述M个目标分类器中每个目标分类器所输出的预测结果,M为大于或等于2的整数,所述每个目标分类器之间相互独立,使得能够根据所述每个目标分类器所输出的预测结果和所述每个目标分类器的预测权重,获得所述数据的分类结果,由于M个目标分类器中每个目标分类器之间是相互独立的,使得能够充分利用每个目标分类器的分类能力得到数据的分类结果,从而提高了分类结果的准确率。 [0064] 可选地,在本实施例的一个可能的实现方式中,在101之前,还需要进一步利用一些训练样本,进行训练,以分别构建M个目标分类器中每个目标分类器。 [0065] 例如,具体可以利用M个训练样本集中每个训练样本集,分别构建1个目标分类器,所述每个训练样本集中所包含的训练样本不完全相同。 [0066] 或者,再例如,具体还可以利用1个训练样本集,采用M个分类算法中每个分类算法,分别构建1个目标分类器。其中,每个分类算法都有其关注的分类方向。 [0067] 需要说明的是,每个训练样本集中所包含的训练样本,可以为经过标注的已知样本,这样,可以直接利用这些已知样本进行训练,以构建目标分类器;或者还可以一部分为经过标注的已知样本,另一部分为没有经过标注的未知样本,那么,则可以先利用已知样本进行训练,以构建初始分类器,然后,再利用初始分类器对未知样本进行预测,以获得分类结果,进而则可以根据未知样本的分类结果,对未知样本进行标注,以形成已知样本,作为新增加的已知样本,利用新增加的已知样本,以及原始的已知样本重新进行训练,以构建新的分类器,直到所构建的分类器或已知样本满足目标分类器的截止条件为止,如分类准确率大于或等于预先设置的准确率阈值或已知样本的数量大于或等于预先设置的数量阈值等,本实施例对此不进行特别限定。 [0068] 如果采用单一目标分类器,其性能要求极高例如,分类准确率需要超过99.9%,构建的难度很大。而一个集成的分类系统即包含M个目标分类器的分类系统,对于每个目标分类器的要求不需要特别苛刻,例如,只需要每个目标分类器大于或等于80%即可,这是非常容易达到的,因此,能够有效降低目标分类器构建的难度。 [0069] 可选地,在本实施例的一个可能的实现方式中,在102之前,还可以进一步包括根据所述每个目标分类器的分类准确率,获得所述每个目标分类器的第一权重值,以及根据第一指定时间和所述每个目标分类器的构建时间,获得所述每个目标分类器的第二权重值,进而则可以根据所述第一权重值和所述第二权重值,获得所述每个目标分类器的预测权重。 [0070] 其中,目标分类器的分类准确率即目标分类器所输出的预测结果的准确率,是指能够被正确分类的数据占总数据的百分比。一般来说,可以将测试样本输入分类器,以获得测试样本的测试结果。所述测试样本是一些已知类型的数据,与训练样本类似,只不过是用途不同,训练样本用于构建分类器,而测试样本是用于测试所构建好的分类器。将测试样本的测试结果与该测试样本的已知类型相比较,二者一致,说明测试结果是正确的,即数据被正确分类,二者不一致,说明测试结果是错误的,即数据没有被正确分类。 [0071] 需要说明的是,“根据所述每个目标分类器的分类准确率,获得所述每个目标分类器的第一权重值”与“根据第一指定时间和所述每个目标分类器的构建时间,获得所述每个目标分类器的第二权重值”的执行可以没有固定顺序,可以先执行“根据所述每个目标分类器的分类准确率,获得所述每个目标分类器的第一权重值”,再执行“根据第一指定时间和所述每个目标分类器的构建时间,获得所述每个目标分类器的第二权重值”,或者还可以执行“根据所述每个目标分类器的分类准确率,获得所述每个目标分类器的第一权重值”,同时执行“根据第一指定时间和所述每个目标分类器的构建时间,获得所述每个目标分类器的第二权重值”,或者还可以先执行“根据第一指定时间和所述每个目标分类器的构建时间,获得所述每个目标分类器的第二权重值”,再执行“根据所述每个目标分类器的分类准确率,获得所述每个目标分类器的第一权重值”,本实施例对此不进行特别限定[0072] 具体地,具体可以根据所述每个目标分类器的分类准确率,利用公式(1),获得所述每个目标分类器的第一权重值。 [0073] 公式(1) [0074] 其中, [0075] w1i为第i个目标分类器的第一权重值,可以记为准确率权重值; [0076] pi为第i个目标分类器的分类准确率; [0077] n为目标分类器的数量即M。 [0078] 可以看出,目标分类器的分类准确率越高,目标分类器的第一权重值则越大;反之,目标分类器的分类准确率越低,目标分类器的第一权重值则越小。 [0079] 具体地,具体可以根据第一指定时间和所述每个目标分类器的构建时间,利用公式(2),获得所述每个目标分类器的第二权重值。 [0080] 公式(2) [0081] w2i为第i个目标分类器的第二权重值,可以记为时间权重值; [0082] Ti为第一指定时间与第i个目标分类器的构建时间之间的差值; [0083] n为目标分类器的数量即M。 [0084] 其中,所述第一指定时间可以为执行当前操作的一个时间值,或者还可以为预计未来执行某个操作的一个时间值,本实施例对此不进行特别限定。 [0085] 可以看出,目标分类器的构建时间距离第一指定时间越远,目标分类器的第二权重值则越大;反之,目标分类器的构建时间距离第一指定时间越近,目标分类器的第二权重值则越小。 [0086] 这样,获得了第一权重值和第二权重值之后,则可以根据所述第一权重值和所述第二权重值,获得所述每个目标分类器的预测权重。例如,可以将第一权重值和第二权重值求算数平均值,即可获得目标分类器的预测权重。或者,再例如,可以利用预先设置的第一权重值所对应的加权因子和预先设置的第二权重值所对应的加权因子,将第一权重值和第二权重值求加权平均值,即可获得目标分类器的预测权重。其中,第一权重值所对应的加权因子与第二权重值所对应的加权因子的设置,可以根据分类需求,进行灵活设置,本实施例对此不进行特别限定。这种方法,同时兼顾了目标分类器的分类准确率和目标分类器的构建时间的影响,能够进一步提高分类结果的准确率。 [0087] 可选地,在本实施例的一个可能的实现方式中,在101之前,还可以进一步执行更新操作,以更新候选分类器的数量,即删除不满足分类需求的候选分类器,或者增加新的候选分类器,最后动态生成M个目标分类器,以供执行101和102。更新操作的具体实现方法可以为如下所述。 [0088] 具体地,具体可以确定待更新的N个候选分类器,N为大于或等于M的整数,进而根据所述N个候选分类器中每个候选分类器的分类准确率,获得所述每个候选分类器的第三权重值,以及根据第二指定时间和所述每个候选分类器的构建时间,获得所述每个候选分类器的第四权重值。然后,则可以根据所述第三权重值和/或所述第四权重值,从所述N个候选分类器中删除P个候选分类器,以获得所述M个目标分类器,P为大于或等于1,且小于或等于N-2的整数。 [0089] 可以理解的是,所述每个候选分类器的第三权重值的获取方法可以参考每个目标分类器的第一权重值的获取方法,详细描述可以参见前述相关内容,此处不再赘述。类似地,所述每个候选分类器的第四权重值的获取方法可以参考每个目标分类器的第二权重值的获取方法,详细描述可以参见前述相关内容,此处不再赘述。其中,所述第二指定时间可以为执行当前操作的一个时间值,或者还可以为预计未来执行某个操作的一个时间值,本实施例对此不进行特别限定。 [0090] 例如,将第三权重值小于预先设置的准确率阈值如0.5,的候选分类器,从所述N个候选分类器中删除。 [0091] 或者,再例如,将第四权重值小于预先设置的时间阈值如0.6,的候选分类器,从所述N个候选分类器中删除。 [0092] 或者,再例如,将第三权重值小于预先设置的准确率阈值如0.5,且第四权重值小于预先设置的时间阈值如0.6,的候选分类器,从所述N个候选分类器中删除。 [0093] 具体地,具体可以确定所构建的1个新的候选分类器,进而根据所述新的候选分类器的分类准确率,获得所述新的候选分类器的第五权重值,以及根据第三指定时间和所述新的候选分类器的构建时间,获得所述每个候选分类器的第六权重值。然后,则可以根据所述第五权重值和/或所述第六权重值,将待更新的Q个候选分类器与所述新的候选分类器,作为所述M个目标分类器。 [0094] 可以理解的是,所述新的候选分类器的第五权重值的获取方法可以参考每个目标分类器的第一权重值的获取方法,详细描述可以参见前述相关内容,此处不再赘述。类似地,所述新的候选分类器的第六权重值的获取方法可以参考每个目标分类器的第二权重值的获取方法,详细描述可以参见前述相关内容,此处不再赘述。其中,所述第三指定时间可以为执行当前操作的一个时间值,或者还可以为预计未来执行某个操作的一个时间值,本实施例对此不进行特别限定。 [0095] 例如,将第五权重值大于或等于预先设置的准确率阈值如0.5,的候选分类器,作为所述M个目标分类器中的一个目标分类器。 [0096] 或者,再例如,将第六权重值大于或等于预先设置的时间阈值如0.6,的候选分类器,作为所述M个目标分类器中的一个目标分类器。 [0097] 或者,再例如,将第五权重值大于或等于预先设置的准确率阈值如0.5,且第六权重值大于或等于预先设置的时间阈值如0.6,的候选分类器,作为所述M个目标分类器中的一个目标分类器。 [0098] 通过实验验证,可以得到如下结论:随着所使用的目标分类器的数量即M取值的增加,分类结果的准确率逐渐增大。 [0099] 这样,通过动态更新候选分类器的数量,即删除不满足分类需求的候选分类器,或者增加新的候选分类器,以获得能够正常工作的分类系统即M个目标分类器,这样,能够避免现有技术中由于利用重新标注的训练样本重新构建目标分类器替换原来的目标分类器而导致的无法充分利用原来的目标分类器的问题,能够有效提高目标分类器的利用率。 [0100] 本实施例中,通过将待预测的数据分别输入M个目标分类器,以获得所述M个目标分类器中每个目标分类器所输出的预测结果,M为大于或等于2的整数,所述每个目标分类器之间相互独立,使得能够根据所述每个目标分类器所输出的预测结果和所述每个目标分类器的预测权重,获得所述数据的分类结果,由于M个目标分类器中每个目标分类器之间是相互独立的,使得能够充分利用每个目标分类器的分类能力得到数据的分类结果,从而提高了分类结果的准确率。 [0101] 另外,采用本发明提供的技术方案,采用本发明提供的技术方案,使得数据的分类结果不再单独依赖于任何一个目标分类器的预测结果,而是综合考虑M个目标分类器中每个目标分类器的预测结果,这样,能够有效提高分类结果的准确率。 [0102] 另外,采用本发明提供的技术方案,采用本发明提供的技术方案,通过动态更新候选分类器的数量,即删除不满足分类需求的候选分类器,或者增加新的候选分类器,以获得能够正常工作的分类系统即M个目标分类器,这样,能够避免现有技术中由于利用重新标注的训练样本重新构建目标分类器替换原来的目标分类器而导致的无法充分利用原来的目标分类器的问题,能够有效提高目标分类器的利用率。 [0103] 需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。 [0104] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。 [0105] 图2为本发明另一实施例提供的分类装置的结构示意图,如图2所示。本实施例的分类装置可以包括分类单元21和处理单元22。其中,分类单元21,用于将待预测的数据分别输入M个目标分类器,以获得所述M个目标分类器中每个目标分类器所输出的预测结果,M为大于或等于2的整数,所述每个目标分类器之间相互独立;处理单元22,用于根据所述每个目标分类器所输出的预测结果和所述每个目标分类器的预测权重,获得所述数据的分类结果。 [0106] 需要说明的是,本实施例所提供的分类装置可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(Software Development Kit,SDK)等功能单元,或者还可以为位于网络侧服务器中的分类引擎,本实施例对此不进行特别限定。 [0107] 可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行限定。 [0108] 可选地,在本实施例的一个可能的实现方式中,如图3所示,本实施例所提供的分类装置还可以进一步包括构建单元31,可以用于利用M个训练样本集中每个训练样本集,分别构建1个目标分类器,所述每个训练样本集中所包含的训练样本不完全相同,或者还可以用于利用1个训练样本集,采用M个分类算法中每个分类算法,分别构建1个目标分类器。 [0109] 可选地,在本实施例的一个可能的实现方式中,所述处理单元22,还可以进一步用于根据所述每个目标分类器的分类准确率,获得所述每个目标分类器的第一权重值;根据第一指定时间和所述每个目标分类器的构建时间,获得所述每个目标分类器的第二权重值;以及根据所述第一权重值和所述第二权重值,获得所述每个目标分类器的预测权重。 [0110] 可选地,在本实施例的一个可能的实现方式中,如图4所示,本实施例所提供的分类装置还可以进一步包括第一更新单元41,可以用于确定待更新的N个候选分类器,N为大于或等于M的整数;根据所述N个候选分类器中每个候选分类器的分类准确率,获得所述每个候选分类器的第三权重值;根据第二指定时间和所述每个候选分类器的构建时间,获得所述每个候选分类器的第四权重值;以及根据所述第三权重值和/或所述第四权重值,从所述N个候选分类器中删除P个候选分类器,以获得所述M个目标分类器,P为大于或等于 1,且小于或等于N-2的整数。 [0111] 可选地,在本实施例的一个可能的实现方式中,如图5所示,本实施例所提供的分类装置还可以进一步包括第二更新单元51,可以用于确定所构建的1个新的候选分类器; 根据所述新的候选分类器的分类准确率,获得所述新的候选分类器的第五权重值;根据第三指定时间和所述新的候选分类器的构建时间,获得所述每个候选分类器的第六权重值; 以及根据所述第五权重值和/或所述第六权重值,将待更新的Q个候选分类器与所述新的候选分类器,作为所述M个目标分类器。 [0112] 需要说明的是,图1对应的实施例中方法,可以由本实施例提供的分类装置实现。 详细描述可以参见图1对应的实施例中的相关内容,此处不再赘述。 [0113] 本实施例中,通过分类单元将待预测的数据分别输入M个目标分类器,以获得所述M个目标分类器中每个目标分类器所输出的预测结果,M为大于或等于2的整数,所述每个目标分类器之间相互独立,使得处理单元能够根据所述每个目标分类器所输出的预测结果和所述每个目标分类器的预测权重,获得所述数据的分类结果,由于M个目标分类器中每个目标分类器之间是相互独立的,使得能够充分利用每个目标分类器的分类能力得到数据的分类结果,从而提高了分类结果的准确率。 [0114] 另外,采用本发明提供的技术方案,采用本发明提供的技术方案,使得数据的分类结果不再单独依赖于任何一个目标分类器的预测结果,而是综合考虑M个目标分类器中每个目标分类器的预测结果,这样,能够有效提高分类结果的准确率。 [0115] 另外,采用本发明提供的技术方案,采用本发明提供的技术方案,通过动态更新候选分类器的数量,即删除不满足分类需求的候选分类器,或者增加新的候选分类器,以获得能够正常工作的分类系统即M个目标分类器,这样,能够避免现有技术中由于利用重新标注的训练样本重新构建目标分类器替换原来的目标分类器而导致的无法充分利用原来的目标分类器的问题,能够有效提高目标分类器的利用率。 [0116] 所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。 [0117] 在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。 [0118] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。 [0119] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。 [0120] 上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。 [0121] 最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。