首页 / 模型检测方法及装置

模型检测方法及装置实质审查 发明

技术领域

[0001] 本说明书实施例涉及计算机技术领域,特别涉及一种模型检测方法及装置。

相关背景技术

[0002] 随着计算机技术和互联网技术的迅速发展,近年来以神经网络为核心的深度学习也在蓬勃发展,在许多原本人类擅长的任务上表现的异乎寻常的出色,因此被应用到广告、推荐、应用画像生产等越来越多的领域。与此同时,深度学习在多领域的应用所带来的影响和问题也被人们广泛地关注。复杂的机器学习模型输入到输出之间的函数关系很难被理解,机器学习本身模型存在“黑盒”的特点。模型的“黑盒”特点可能会让模型存在不可预知的风险或做出带有偏见的决策,使得人们难以预估其产生不良影响的可能性,一旦出现问题,将会产生巨大的不良影响。
[0003] 现有技术中,通常会在模型部署后,模型发布前利用测试集对模型进行测试,根据模型预测准确度对模型进行评估和调整。然而这种测试方法仅能在模型发布前进行较为简单的模型测试,在模型发布后模型预测准确度较低。因此,亟需一种较为有效的方法以解决上述问题。

具体实施方式

[0050] 在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0051] 在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0052] 应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
[0053] 首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0054] 黑盒模型(black‑box model):以深度学习、集成学习为代表的模型。模型内部涉及到高维数学空间内的复杂变换,运行机制难以为人们所理解,因此很难估计输入特征与模型预测之间的关系以及特征之间的相互作用。
[0055] 白盒模型(white‑box model):以线性模型或简单的决策树为代表的模型,虽然模型表达能力有限,准确性不高,但是能够很清晰的展现每个特征对于模型预测的影响程度,具有很强的可解释性,容易为人们所理解其决策机制。
[0056] 事后模型解释(post‑hoc model interpretability):与模型无关的可解释方法,不对黑盒模型做侵入式改造,通过度量特征变化对于模型响应的敏感程度作为特征的贡献度。
[0057] 表征(representation):使用具有大量参数的深度学习模型,通过自监督的训练方式,将高维稠密或稀疏的样本数据投影压缩到特定纬度的向量,该向量即为样本的表征。这种方法能够成功地保留数据内在的模式,应用到下游任务中通常具有较高的准确率。
[0058] 向量召回:又名向量检索,即在高维向量空间内,快速检索到与查询样本向量最为邻近的一批样本。
[0059] 倾向性得分匹配(Propensity Score Matching):从大量数据样本中筛选出具有共同特征的干预组和对照组样本,除去干预变量,使得两组的样本尽可能相似的一种统计分析技术。
[0060] 近年来以神经网络为核心的深度学习蓬勃发展,在许多原本人类擅长的任务上表现的异乎寻常的出色,因此被应用到了越来越多的领域,如广告、推荐等。与此同时,深度学习应用所带来的影响和问题也被人们广泛地关注。深度学习本身所具有的黑盒特点,使得人们难以预估其产生不良影响的可能性,所以一旦出现问题,将会产生巨大的不良影响。在此背景下,学界和工业界致力于通过模型可解释技术得到黑盒算法的解释结果。对模型的决策进行解释,针对错误结果的解释也可以用于指导模型进行调整,进而帮助算法的生产方与应用方进行自查自纠,促使算法在应用的过程中更加的透明。
[0061] 现有技术中,由于事后解释方法不涉及对原有黑盒模型进行改造,通用性较强,成本也低,因此为大家广泛采用。较为常见的一种事后解释方法是局部代理模型解释,但是该方法容易受到代理数据分布漂移的影响,因而会得到错误的解释结果。此外,为了提高模型预测的准确度,通常还会在模型部署后,模型发布之前构建测试集对模型的预测能力进行测试,然而这种测试方法仅能基于预先准备的测试集对模型进行测试,无法直接基于测试结果对模型进行有针对性的调整,测试结果的可读性以及可解释性较低,模型发布后,预测能力则相对较低。且一般模型开发者,不具有在模型发布之前通过模型解释的方法对模型进行检测的检测条件,搭建检测环境将会耗费大量等资源,诸多因素导致模型开发者无法在模型发布之前对模型进行检测。
[0062] 因此,本说明书一实施例提供了一种模型检测方法,从而解决上述问题。图1是本说明书一个实施例提供的一种模型检测方法的示意图,如图1所示;在待发布预测模型发布之前,通过构建检测模型的方式在待发布预测模型进行发布之前对待发布预测模型进行模型检测。在训练待发布预测模型发布的数据集合中选择目标对象,并确定目标对象的属性信息和行为数据。基于目标对象的属性信息和行为数据构建训练样本对和测试样本对。构建待发布预测模型关联的检测模型,结合待发布预测模型,将检测模型作为白盒模型进行训练,即,基于待发布预测模型和检测模型对训练样本对进行处理,根据待发布预测模型和检测模型分别对应的处理结果对检测模型进行调参,直至获得满足训练停止条件的目标检测模型。
[0063] 将测试样本对分别输入至目标检测模型和待发布预测模型,获得目标检测模型对应的检测数据,以及待发布预测模型对应的发布数据。其中,检测数据中包含检测特征数据、检测类别数据和检测概率数据,发布数据中包含发布类别数据和发布概率数据。根据检测数据中包含的检测类别数据和检测概率数据,以及发布数据中包含的发布类别数据和发布概率数据,确定待发布预测模型和检测模型之间的预测相似信息。在预测相似信息满足检测条件的情况下,基于检测数据中包含的检测特征数据读取测试样本对关联的测试行为数据,并基于测试行为数据生成待发布预测模型的发布检测信息;在预测相似信息不满足检测条件的情况下,则在数据集合中选择候选对象,并将候选对象作为目标对象,执行上述确定目标对象的属性信息和行为数据等步骤。
[0064] 在消费者用户画像标签预测的场景下,消费者可以为购物平台的用户。确定购物平台对应的包含用户名以及用户行为数据的用户集合,将用户集合作为样本空间,在用户集合中选择参考用户,作为待解释样本。确定参考用户的行为明细数据,其中,行为明细数据可以是购买了考研数学100题、购买了笔记本、购买了考研课程等针对商品的行为数据。在用户行为明细数据中提取考研数学、笔记本等特征数据作为用户行为特征。根据参考用户的用户行为特征,通过向量相似召回、倾向性得分匹配等技术在样本空间中进行采样,获得与参考用户关联的目标用户组成目标用户集,根据目标用户集中用户的行为明细数据,以及用户的用户画像构建局部代理样本集,局部代理样本集中的样本对包含在用户行为明细数据中提取出的低维可读的专家知识,以及与专家知识对应的样本标签。按照9:1的比例将局部代理样本集划分为训练集和测试集。测试集中的测试样本对中包含低维可读的专家知识、具有复杂特征的高维表征,以及样本标签。
[0065] 构建线性模型或决策树等白盒模型,并确定白盒模型的损失函数。基于包含低维可读的专家知识的训练集对白盒模型进行训练。训练完成后,基于测试集对白盒模型和黑盒模型进行测试。在测试集中选择测试样本,将测试样本中低维可读的专家知识输入至白盒模型进行预测,获得白盒模型针对测试样本的预测类别和预测概率;将测试样本中具有复杂特征的高维表征输入至黑盒模型进行预测,获得黑盒模型针对测试样本的预测类别和预测概率。根据黑盒模型针对测试样本的预测类别和预测概率,以及白盒模型针对测试样本的预测类别和预测概率进行忠实度评价。
[0066] 基于黑盒模型针对测试样本的预测类别,以及白盒模型针对测试样本的预测类别计算预测准确率;基于黑盒模型针对测试样本的预测概率,以及白盒模型针对测试样本的预测概率计算损失值。预测准确率越高,且损失值越小,则忠实度越高,表示黑盒模型和白盒模型的预测结果越相近,白盒模型的预测越接近黑盒模型的预测。可以设定准确率阈值,作为对预测准确率大小的判断,设定损失值阈值,作为对损失值大小的判断。若忠实度低于忠实度阈值,则重新在用户集合中选择参考用户,并基于选择的参考用户重复执行上述步骤,直到忠实度大于等于忠实度阈值,即可生成可解释报告。
[0067] 此外,现有技术中,针对模型的开发人员,无法在模型发布前通过模型解释的方式对模型的预测能力以及预测准确度进行测试,导致模型发布后一旦出现预测错误的问题,无法基于出现的错误对模型进行有针对性的调整;在模型为推荐模型的情况下,针对模型发布的平台中,平台对应的商户,商户无法在推荐模型为商户对应的客户推荐商品后,获知推荐模型的推荐原理,从而无法有针对性的对商品进行更新;针对商户对应的客户,在客户接收到平台推荐的商品后,无法获知推荐该商品的原因,在客户有获知推荐模型的商品推荐依据的情况下,无法为客户提供具有可读性的推荐模型的模型解释信息。
[0068] 实际应用中,在黑盒模型发布前,开发人员可以基于可解释报告确定黑盒模型的预测原理。根据可解释报告中每个特征的贡献度,以及黑盒模型的测试结果对黑盒模型进行适当调整再进行发布,从而使得发布的黑盒模型具有较强的预测能力,降低出现预测错误的可能性。开发人员能够在模型发布前通过模型解释的方式对模型的预测能力以及预测准确度进行测试,从而降低推荐模型发布后出现预测错误的概率。
[0069] 电商领域中,在用户为电商平台的商户或者为商户对应的客户的情况下,黑盒模型可以是推荐模型,针对电商平台的商户,商户可以在推荐模型为商户对应的客户推荐商品后,获知推荐模型的推荐原理,从而有针对性的对商品进行更新,包括但不限于商品上新、商品下架、商品升级等;商户对应的客户,在客户接收到电商平台推荐的商品后,能够获知电商平台推荐该商品的原因,为客户提供具有可读性的推荐模型的模型解释信息。
[0070] 此外,本说明书一个实施例提供的模型检测方法还可以应用于商品推荐、车辆推荐、音视频推荐、直播间推荐等推荐场景。在推荐模型发布之前,通过构建检测模型的方式在推荐模型进行发布之前对推荐模型进行模型检测。在训练推荐模型发布的数据集合中选择目标对象,并确定目标对象的属性信息和行为数据。基于目标对象的属性信息和行为数据构建训练样本对和测试样本对。构建推荐模型关联的检测模型,将检测模型作为白盒模型进行训练,即,基于训练样本对训练推荐模型关联的检测模型,获得满足训练停止条件的目标检测模型。
[0071] 将测试样本对分别输入至目标检测模型和推荐模型,获得目标检测模型对应的检测数据,以及推荐模型对应的发布数据。其中,检测数据中包含检测特征数据、检测类别数据和检测概率数据,发布数据中包含发布类别数据和发布概率数据。根据检测数据中包含的检测类别数据和检测概率数据,以及发布数据中包含的发布类别数据和发布概率数据,确定推荐模型和检测模型之间的预测相似信息。在预测相似信息满足检测条件的情况下,基于检测数据中包含的检测特征数据读取测试样本对关联的测试行为数据,并基于测试行为数据生成推荐模型的发布检测信息;在预测相似信息不满足检测条件的情况下,则在数据集合中选择候选对象,并将候选对象作为目标对象,执行上述确定目标对象的属性信息和行为数据等步骤。直到预测相似信息满足检测条件,则推荐模型可以进行发布,用于执行推荐任务。在发布时可以将推荐模型和目标检测模型一同发布,进而在接收到用户的推荐请求时,根据用户的行为数据为用户进行商品推荐、车辆推荐、音视频推荐以及直播间推荐,在用户存在获取模型解释需求时,基于目标检测模型对应的模型解释,生成模型解释报告反馈至用户,进而提高推荐模型输出的推荐结果的可解释性。
[0072] 通过基于目标对象的属性信息和行为数据构建训练样本对和测试样本对,并基于训练样本对训练待发布预测模型关联的检测模型,获得满足训练停止条件的目标检测模型;利用测试样本对对目标检测模型和待发布预测模型进行测试,获得目标检测模型对应的检测数据,以及待发布预测模型对应的发布数据;根据检测数据和发布数据,确定待发布预测模型和检测模型之间的预测相似信息;在预测相似信息满足检测条件的情况下,基于检测数据读取测试样本对关联的测试行为数据,并基于测试行为数据生成待发布预测模型的发布检测信息。
[0073] 此外,在检测服务使用方部署了待发布预测模型之后,在待发布预测模型发布之前,可以将待发布预测模型交由检测服务提供方,通过构建检测模型的方式在待发布预测模型发布之前对待发布预测模型进行模型检测。在待发布预测模型发布前,结合检测模型针对测试样本的检测数据,确定待发布预测模型和检测模型之间的预测相似信息,进而生成待发布预测模型的发布检测信息,并反馈至检测服务使用方,进而由检测服务使用方对待发布预测模型进行发布前的检测和调整,提高待发布预测模型的预测能力。基于测试样本对关联的测试行为数据生成待发布预测模型的发布检测信息,从而提高发布检测信息的可读性和可解释性。
[0074] 需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
[0075] 在本说明书中,提供了一种模型检测方法,本说明书同时涉及一种模型检测装置,一种模型检测方法,一种模型检测装置,另一种模型检测方法,另一种模型检测装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,在下面的实施例中逐一进行详细说明。
[0076] 参见图2,图2是本说明书一个实施例提供的一种模型检测方法的流程图,具体包括以下步骤。
[0077] 步骤S202:基于目标对象的属性信息和行为数据构建训练样本对和测试样本对,并基于待发布预测模型和检测模型对所述训练样本对进行处理,根据所述待发布预测模型和所述检测模型分别对应的处理结果对所述检测模型进行调参,直至获得满足训练停止条件的目标检测模型。
[0078] 具体的,目标对象可以是用户,也可以是消费者;相应的,属性信息即为目标对象的类别信息,属性信息也可以是目标对象的用户画像标签;行为数据即为目标对象在进行操作时所产生的操作数据;训练样本对即为以目标对象的属性信息为标签,以目标对象的行为数据为样本构建的用于进行模型训练的样本对;测试样本对即为以目标对象的属性信息为标签,以目标对象的行为数据为样本构建的用于对模型的预测能力和预测精准度进行测试的样本对;待发布预测模型是指用于进行目标对象的用户画像标签预测的机器学习模型,待发布预测模型是一个黑盒模型;相应的,检测模型即为用于在待发布预测模型进行发布前,对其进行检测的模型,检测模型可以是线性模型或决策树模型等白盒模型;待发布预测模型对应的处理结果是指将训练样本对中的训练样本输入至待发布预测模型进行处理后,基于待发布预测模型的输出以及待发布预测模型的损失函数计算获得的损失值;相应的,检测模型对应的处理结果是指将训练样本对中的训练样本输入至检测模型进行处理后,基于检测模型的输出以及检测模型的初始损失函数计算获得的损失值;目标检测模型即为基于训练样本对训练检测模型后,获得的满足训练停止条件的机器学习模型;训练停止条件可以根据模型训练需求设定,可以是达到预设的预测精准度、完成设定数量的训练次数等,本实施例对此不做任何限定。需要说明的,本实施例中的待发布预测模型可以为任意有监督机器学习模型,包括但不限于用于推荐、用户画像预测等机器学习模型。
[0079] 基于此,确定用于进行模型训练的目标对象,获取目标对象的属性信息和行为数据。以目标对象的属性信息为标签,以目标对象的行为数据为样本分别构建训练样本对和测试样本对。并基于待发布预测模型和检测模型对训练样本对进行处理,将训练样本对中的训练样本输入至待发布预测模型,获得预测信息,并基于预测信息和训练样本对中的样本标签以及待发布预测模型的损失函数计算预测损失值,将预测损失值作为待发布预测模型对应的处理结果。将训练样本对中的训练样本输入至检测模型,获得检测信息,并基于检测信息和训练样本对中的样本标签以及检测模型的初始损失函数计算检测损失值,将检测损失值作为检测模型对应的处理结果。基于检测模型的损失函数对预测损失值和检测损失值进行计算,根据计算结果确定全局损失值,并基于全局损失值对检测模型进行调参,直至获得满足训练停止条件的目标检测模型。用于后续对待发布预测模型进行检测。在训练检测模型时,将训练样本对中的训练样本分别输入至检测模型和待发布预测模型,进而将基于训练样本确定的检测模型的初始损失值,以及基于训练样本确定的待发布预测模型的损失值融入检测模型的损失函数,计算检测模型针对训练样本的损失值,从而实现以检测模型拟合待发布预测模型,使得检测模型与待发布预测模型在目标对象维度具有相同的预测能力。
[0080] 实际应用中,目标对象可以是多种场景下的用户。在购物场景下,目标对象即为商品用户,属性信息即为目标对象的类别属性,包括但不限于研究生、本科生、家庭主妇、农民、博主等,行为数据即为目标对象对商品的购买、推荐、分享等行为;在游戏场景下,目标对象即为游戏用户、属性信息包括但不限于游戏主播、资深玩家、临时玩家等,相应的,行为数据可以是游戏用户登录游戏的时间、玩游戏的时长等信息;在网站、论坛场景下,目标对象即为网站、论坛的用户,即,内容发布或浏览者;在音视频应用程序中,目标对象即为用户,属性信息可以是音频收听者或创作者、视频观看者或创作者,相应的,行为数据可以是用户对音视频的收听、浏览信息,包括但不限于收听的音频类型、观看的视频类型等。
[0081] 进一步的,在确定目标对象的属性信息和行为数据时,现有技术中通常是基于参考对象的参考行为数据添加高斯噪声,进而确定目标对象,这种方式的本质是在参考对象的参考行为数据的多个维度添加高斯噪声,获得的目标对象实质上是微扰样本,并非客观存在的对象。然而这种目标对象的确定方式,在后续进行模型解释时,容易得到虚假的模型解释,偏离客观实际,因此,在选择目标对象时,可以基于客观存在的数据集合选择,进而获得与参考对象关联的客观存在的目标对象,具体实现如下:
[0082] 在数据集合中选择参考对象的参考行为数据;按照采样策略在所述数据集合中选择与所述参考行为数据关联的关联行为数据,其中,所述关联行为数据对应关联对象;将所述关联对象作为所述目标对象,以及将所述关联行为数据作为所述行为数据,并加载所述目标对象的属性信息。
[0083] 具体的,数据集合是指包含对象,以及对象对应的行为数据的数据集;对象可以是用户,相应的,数据集合则可以是用户以及用户行为数据组成的数据集合;用户可以为应用程序、网站、论坛、银行对应的用户,用户可以理解为消费者;参考对象是指在数据集合中选择的任意一个对象,相应的,参考行为数据即为数据集合中存储的,参考对象对应的行为数据;在购物应用程序场景下,数据集合即为购物应用程序的用户,以及用户的行为数据组成的数据集,行为数据包括但不限于用户对商品的购买、分享等行为对应的数据;采样策略可以是向量相似召回、倾向性得分匹配等采样技术,用于基于参考对象的参考行为数据在数据集合中选择与参考对象邻近的关联对象;关联行为数据即为数据集合中存储的,关联对象对应的行为数据。
[0084] 基于此,在数据集合中选择参考对象,以及确定与参考对象对应的参考行为数据。按照采样策略中向量相似召回、倾向性得分匹配等采样技术在数据集合中选择与参考行为数据中,参考特征信息关联的关联行为数据,将关联行为数据对应的关联对象作为目标对象,以及将关联行为数据作为行为数据,并加载表示目标对象的属性信息。
[0085] 举例说明,在消费者用户画像标签预测的场景下,在消费者为购物应用程序的用户时,用户画像标签的预测即为应用程序用户的用户画像预测。数据集合即为购物应用程序的用户,以及用户的行为数据组成的数据集合。图3是本说明书一个实施例提供的一种模型检测方法应用于用户画像生成的示意图;图3中(a)示出了在数据集合中选择目标对象,图中●表示用户0,□表示数据集合中包含的用户,Δ表示目标用户。在数据集合中选择用户0作为参考对象,并在数据集合中确定用户0对应的用户0行为数据,在用户0行为数据中进行特征提取,提取出日用品、学生用品等参考特征信息,进而基于参考特征信息,采用向量相似召回、倾向性得分匹配等采样技术在数据集合中选择与用户0邻近的用户1、用户2等用户作为目标用户,确定目标用户‑用户1、用户2等用户的行为数据和属性信息。用户1购买了铅笔、画板、绘画书籍,则用户1的用户画像可以是美术生;用户2购买了蜡笔、铅笔、橡皮、拼音本,则用户2的用户画像可以是小学生。
[0086] 实际应用中,在消费者为论坛的用户时,用户画像标签的预测即为论坛用户的用户画像预测,用户包括论坛内容创作者,论坛浏览者。数据集合即为论坛的用户,以及用户的行为数据组成的数据集合。在数据集合中选择用户A作为参考对象,并在数据集合中确定用户A对应的用户A行为数据,在用户A行为数据中进行特征提取,提取出生活常识、学术文章等参考特征信息,进而基于参考特征信息,采用向量相似召回、倾向性得分匹配等采样技术在数据集合中选择与用户A邻近的用户B、用户C等用户作为目标用户,确定目标用户,即,用户B、用户C等用户的行为数据和属性信息。用户B发布了学术文章,评论了学术文章,则用户B的用户画像可以是学者;用户C针对学术文章提出问题,解答问题,则用户C的用户画像可以是学生。
[0087] 综上所述,在数据集合中选择参考对象,并基于参考对象的参考行为数据在数据集合中选择目标对象,进而使得目标对象来自于客观存在的实际数据集合,进而在后续进行预测时避免出现虚假的模型解释。
[0088] 进一步的,在确定目标对象的属性信息和行为数据之后,为了对用于进行模型解释的白盒模型进行训练,需要构建训练样本,现有技术中,通常是直接基于通过对参考行为数据添加高斯噪声后获得的行为数据构建训练样本,并训练白盒模型,然而只进行模型训练无法保证白盒模型的预测能力以及模型解释能力,因此还需要构建测试样本对进行模型测试,具体实现如下:
[0089] 根据所述目标对象的行为数据确定样本数据,并根据所述目标对象的属性信息确定所述样本数据对应的样本标签;基于所述样本数据和所述样本标签构建样本对集合;按照预设的比例在所述样本对集合中选择训练样本对和测试样本对。
[0090] 具体的,样本数据是指用于构建样本对的数据,样本数据可以是目标对象的行为数据,也可以是对目标对象的行为数据进行预处理后,获得的包含目标对象的行为特征的数据;相应的,样本标签即为根据样本数据,为其分配的标签,用于进行后续的模型训练;样本对集合是指基于目标对象的多条行为数据构建的样本对组成的集合;训练样本对是指在样本对集合中选择的用于后续进行模型训练的样本对;测试样本对是指在样本对集合中选择的用于后续对训练完成的模型进行测试的样本对。具体实施时,可以按照预设的比例在样本对集合中选择训练样本对和测试样本对,也可以按照预设的划分比例将样本对集合划分为训练样本集合对和测试样本集合。
[0091] 基于此,将目标对象的行为数据作为样本数据,或者在目标对象的行为数据中选择特征数据,并将特征数据作为样本数据。根据目标对象的属性信息确定样本数据对应的样本标签。基于样本数据和样本标签构建样本对集合。按照预设的比例在样本对集合中选择训练样本对和测试样本对,或者按照预设的划分比例将样本对集合划分为训练样本对集合和测试样本对集合,训练样本对集合中存储训练样本对,测试样本对集合中存储测试样本对。
[0092] 沿用上例,用户1购买了铅笔、画板、绘画书籍,则用户1的用户画像可以是美术生。则可以将用户1的行为数据:购买了铅笔、画板、绘画书籍,作为样本数据,将用户1的用户画像:美术生,作为样本标签,构成样本对;用户2购买了蜡笔、铅笔、橡皮、拼音本,则用户2的用户画像可以是小学生。将用户2的行为数据:购买了蜡笔、铅笔、橡皮、拼音本作为样本数据,将用户2的用户画像:小学生,作为样本标签,构成样本对。基于全部目标用户的属性信息和行为数据构建样本对集合。并按照预设的比例9:1在样本对集合中选择训练样本对和测试样本对,训练样本对的数量为测试样本对数量的9倍,或者按照9:1的比例将样本对集合划分为训练样本对集合和测试样本对集合。
[0093] 实际应用中,在消费者为论坛的用户时,用户B发布了学术文章,评论了学术文章,则用户B的用户画像可以是学者;用户C针对学术文章提出问题,解答问题,则用户C的用户画像可以是学生。可以将用户B的行为数据:发布了学术文章,评论了学术文章,作为样本数据,将用户B的用户画像:学者,作为样本标签;将用户C的行为数据:针对学术文章提出问题,解答问题作为样本数据,将用户C的用户画像:学生,作为样本标签。进而分别构成样本对。基于全部目标用户的属性信息和行为数据构建样本对集合。并按照预设的比例8:1在样本对集合中选择训练样本对和测试样本对,训练样本对的数量为测试样本对数量的8倍,或者按照8:1的比例将样本对集合划分为训练样本对集合和测试样本对集合。
[0094] 综上所述,按照预设的比例在样本对集合中选择训练样本对和测试样本对,进而在基于训练样本对训练检测模型后,还可以基于测试样本对对训练完成的检测模型进行预测。
[0095] 进一步的,在确定数据集合之后,可以直接基于数据集合训练用于执行预测任务的待发布预测模型,现有技术中通常是基于数据集合训练待发布预测模型并部署后,即可直接进行发布,然而待发布预测模型本质上为黑盒模型,不具有模型解释的能力,因此还需要在模型训练完成后构建白盒模型‑检测模型,用于对黑盒模型的预测进行模型解释,具体实现如下:
[0096] 根据所述数据集合包含的对象数据构建发布预测模型训练集;利用所述发布预测模型训练集对初始待发布预测模型进行训练,直至获得满足模型训练停止条件的待发布预测模型。
[0097] 基于此,发布预测模型训练集即为用于对构建完成的初始待发布预测模型进行模型训练的数据集,训练集中包含训练样本以及与训练样本对应的样本标签。在数据集合中选择对象数据,将对象数据作为训练样本,并根据数据集合中对象数据的属性信息确定训练样本的样本标签,由训练样本和样本标签组成训练样本对,进而组成发布预测模型训练集。利用发布预测模型训练集对初始待发布预测模型进行训练,直至获得满足模型训练停止条件的待发布预测模型,用于后续结合目标检测模型执行预测任务。
[0098] 综上所述,基于数据集合构建发布预测模型训练集,并进行模型训练获得满足模型训练停止条件的待发布预测模型,进而在后续执行预测任务时,结合目标检测模型给出模型解释,提高待发布预测模型的可解释性。
[0099] 进一步的,在确定目标对象的行为数据和属性信息后,即可构建白盒模型,以及白盒模型的损失函数,现有技术中通常是基于微扰样本构建损失函数,由于微扰样本并非客观存在的样本,因此构建的损失函数也无法达到预计的模型训练效果,在后续进行模型解释时,获得的模型解释与实际情况存在较大偏差,因此本实施例提出根据参考行为数据与行为数据之间的映射关系,以及待发布预测模型的损失函数和预设正则项构建检测模型的损失函数,具体实现如下:
[0100] 根据所述参考行为数据与所述行为数据之间的映射关系、所述待发布预测模型的损失函数和预设正则项构建所述检测模型的损失函数;所述基于待发布预测模型和检测模型对所述训练样本对进行处理,根据所述待发布预测模型和所述检测模型分别对应的处理结果对所述检测模型进行调参,直至获得满足训练停止条件的目标检测模型,包括:将所述训练样本对中的训练样本输入至所述待发布预测模型,获得预测信息,并基于所述预测信息和所述训练样本对中的样本标签计算预测损失值,将所述预测损失值作为所述待发布预测模型对应的处理结果;将所述训练样本对中的训练样本输入至所述检测模型,获得检测信息,并基于所述检测信息和所述训练样本对中的样本标签计算检测损失值,将所述检测损失值作为所述检测模型对应的处理结果;基于所述检测模型的损失函数对所述预测损失值和所述检测损失值进行计算,根据计算结果确定全局损失值,并基于所述全局损失值对所述检测模型进行调参,直至获得满足训练停止条件的目标检测模型。
[0101] 具体的,映射关系是指参考对象和目标对象之间的映射关系,是基于参考对象的参考行为数据,以及目标对象的目标行为数据确定的;检测模型的损失函数为基于映射关系以及待发布预测模型的损失函数构建的检测模型的损失函数,用于对检测模型进行模型训练;预测信息是指将训练样本输入至待发布预测模型进行预测后,待发布预测模型输出的信息;预测损失值是基于待发布预测模型的损失函数计算得到的损失值;检测信息是指将训练样本输入至检测模型进行预测后,检测模型输出的信息;检测损失值是基于检测模型的损失函数计算得到的损失值,用于对检测模型进行调参,并继续进行训练;相应的,全局损失值是指基于检测模型的损失函数对预测损失值和检测损失值进行计算获得的损失值,表示检测模型对应的损失值,用于对检测模型进行调参。
[0102] 基于此,基于参考对象的参考行为数据和目标对象的行为数据,计算参考对象和目标对象之间的欧几里得距离,并基于欧几里得距离确定行为数据的权重。根据欧几里得距离和权重确定参考行为数据与行为数据之间的映射关系,并基于映射关系、待发布预测模型的损失函数和预设正则项构建检测模型的损失函数。将训练样本对中的训练样本输入至待发布预测模型,获得预测信息,并基于预测信息和训练样本对中的样本标签以及待发布预测模型的损失函数计算预测损失值,将预测损失值作为待发布预测模型对应的处理结果。同时将训练样本对中的训练样本输入至检测模型,获得检测信息,并基于检测信息和训练样本对中的样本标签以及检测模型的初始损失函数计算检测损失值,将检测损失值作为检测模型对应的处理结果。基于检测模型的损失函数对预测损失值和检测损失值进行计算,根据计算结果确定全局损失值,并基于全局损失值对检测模型进行调参,直至获得满足训练停止条件的目标检测模型。
[0103] 也就是说,在对检测模型进行训练时,将训练样本对中的训练样本分别输入至检测模型和待发布预测模型,进而将基于训练样本确定的检测模型的初始损失值,以及基于训练样本确定的待发布预测模型的损失值融入检测模型的损失函数,实现在利用损失函数对检测模型进行调参时,可以融合待发布预测模型的影响,使得检测模型能够学习到待发布预测模型的预测能力,并以此为基础计算检测模型的损失值,从而实现以检测模型拟合待发布预测模型,使得检测模型具有与待发布预测模型在目标对象维度具有相同的预测能力。在基于待发布预测模型进行信息预测的同时,检测模型能够提供待发布预测模型的进行信息预测时的模型解释信息。其中,欧几里得距离通过下述公式(1)确定:
[0104]
[0105] 其中,X0表示参考对象; 表示第i个目标对象, 为目标对象 在第j维特征上的取值,m表示特征纬度数目; 表示参考对象和目标对象之间的的欧几里得距离。
[0106] 行为数据的权重通过下述公式(2)确定:
[0107]
[0108] 其中,πi表示第i个目标对象的行为数据的权重;exp表示以自然常数e为底的指数函数,σ表示标准化系数;依据欧几里得距离的远近分配不同的权重,即欧几里得距离越近的样本权重越大,反之欧几里得距离越远的样本权重越低。
[0109] 损失函数为下述公式(3):
[0110]
[0111] 其中,n为目标对象的数量;g表示检测模型;f表示待发布预测模型;Ω(g)表示检测模型参数量的复杂度,为正则项;G表示检测模型的函数空间;θ表示检测模型的特征权重;表示参考对象的对象表征; 表示参考行为数据特征;λ表示正则化系数。
[0112] 实际应用中,结合检测模型的损失函数,对检测模型进行训练,实现基于检测模型拟合待发布预测模型。基于训练样本对训练待发布预测模型关联的检测模型时,将训练样本对中的训练样本输入至检测模型,获得检测模型的预测结果,以及将训练样本对中的训练样本输入至待发布预测模型,获得待发布预测模型的预测结果。基于检测模型的预测结果以及训练样本对中的样本标签,计算检测模型对应的损失值;基于待发布预测模型的预测结果以及训练样本对中的样本标签,计算待发布预测模型对应的损失值。基于检测模型对应的损失值和待发布预测模型对应的损失值计算检测模型针对训练样本的全局损失值。进而基于全局损失值对检测模型进行调参,以此类推,直至获得满足训练停止条件的目标检测模型,在模型训练过程中使得检测模型具有与待发布预测模型在目标对象维度具有相同的预测能力。在基于待发布预测模型进行信息预测的同时,检测模型能够提供待发布预测模型的进行信息预测时的模型解释信息。。
[0113] 综上所述,根据参考行为数据与行为数据之间的映射关系,构建检测模型的损失函数,进而对检测模型进行训练,进而获得的目标检测模型具有较强的模型解释能力,通过目标检测模型进行模型解释,提高模型解释的准确性。
[0114] 步骤S204:利用所述测试样本对对所述目标检测模型和所述待发布预测模型进行测试,获得所述目标检测模型对应的检测数据,以及所述待发布预测模型对应的发布数据。
[0115] 具体的,在上述基于目标对象的属性信息和行为数据构建训练样本对和测试样本对,并基于训练样本对训练待发布预测模型关联的检测模型,获得满足训练停止条件的目标检测模型之后,即可利用测试样本对对目标检测模型和待发布预测模型进行测试,获得目标检测模型对应的检测数据,以及待发布预测模型对应的发布数据,其中,检测数据是指将测试样本对中包含的测试样本输入至目标检测模型后,模型输出的预测数据、根据测试样本对中的标签确定的模型预测结果的准确度,以及目标检测模型在预测过程中确定的测试样本对中测试样本的特征数据;相应的,发布数据即为将测试样本对中包含的测试样本输入至待发布预测模型后,模型输出的预测数据、根据测试样本对中的标签确定的模型预测结果的准确度。
[0116] 基于此,在基于目标对象的属性信息和行为数据构建训练样本对和测试样本对,并基于训练样本对训练待发布预测模型关联的检测模型,获得满足训练停止条件的目标检测模型后,利用测试样本对对目标检测模型和待发布预测模型进行测试,分别将测试样本对中的测试样本输入至目标检测模型和待发布预测模型进行预测,获得目标检测模型对应检测数据,以及待发布预测模型对应的发布数据。
[0117] 实际应用中,目标检测模型为白盒模型,在将测试样本对中的测试样本输入至目标检测模型进行预测时,能够确定测试样本对应的预测特征数据,以及每个预测特征数据的权重,权重越大,则表示测试样本的预测类别与预测特征数据越相近。
[0118] 进一步的,现有技术中,在进行模型解释时,通常是采用事后模型解释的方法,通过度量特征变化对于模型响应的敏感程度作为特征的贡献度,然而这种模型解释方式仅能在获得模型的预测结果后进行事后归因解析,无法降低模型的预测错误率。因此可以在模型发布前,基于目标检测模型进行模型发布前的测试,具体实现如下:
[0119] 利用所述测试样本对对所述目标检测模型进行测试,获得所述目标检测模型对应的检测特征数据、检测类别数据和检测概率数据,将所述检测特征数据、所述检测类别数据和所述检测概率数据作为所述检测数据;利用所述测试样本对对所述待发布预测模型进行测试,获得所述待发布预测模型对应的发布类别数据和发布概率数据,将所述发布类别数据和所述发布概率数据作为所述发布数据。
[0120] 具体的,检测特征数据通过目标检测模型对测试样本进行预测,在预测过程中确定的与测试样本相关的行为特征数据;检测类别数据是指通过目标检测模型对测试样本进行预测,输出的预测结果,即,通过目标检测模型预测得到的样本类别;检测概率数据即为通过目标检测模型对测试样本进行预测的预测准确度;相应的,发布类别数据是指通过待发布预测模型对样本数据进行预测,输出的预测结果,即,通过待发布预测模型预测得到的样本类别;发布概率数据是指通过待发布预测模型对测试样本进行预测的预测准确度。
[0121] 基于此,利用测试样本对对目标检测模型进行测试,获得目标检测模型在预测过程中产生的检测特征数据,以及对测试样本进行预测,后基于预测结果确定的检测类别数据和检测概率数据,将检测特征数据、检测类别数据和检测概率数据作为检测数据。利用测试样本对对待发布预测模型进行测试,获得待发布预测模型对应的发布类别数据和发布概率数据,将发布类别数据和发布概率数据作为发布数据。
[0122] 沿用上例,在用户2对应的样本对被确定为测试样本对的情况下,将用户2对应的行为数据:购买了蜡笔、铅笔、橡皮、拼音本作为测试样本输入至目标检测模型,以及输入至待发布预测模型。获得目标检测模型输出的预测类别:学生,并基于目标检测模型输出的预测类别和样本标签:小学生计算预测准确度,记录目标检测模型在预测过程中涉及的特征数据学生、教师、家长等。将预测类别、特征数据和预测准确度作为目标检测模型针对用户2的检测数据。以及获得待发布预测模型输出的预测类别:高中生,并基于待发布预测模型输出的预测类别和样本标签:小学生计算预测准确度,将预测类别:高中生和预测准确度作为发布数据。
[0123] 综上所述,利用测试样本对对目标检测模型进行测试,获得目标检测模型对应的检测特征数据、检测类别数据和检测概率数据;利用测试样本对对待发布预测模型进行测试,获得待发布预测模型对应的发布类别数据和发布概率数据,进而后续基于检测数据和发布数据进行后续的模型解释,从而实现在待发布预测模型进行发布前进行模型测试,提高模型的预测错误率。
[0124] 步骤S206:根据所述检测数据和所述发布数据,确定所述待发布预测模型和所述检测模型之间的预测相似信息。
[0125] 具体的,在上述利用测试样本对对目标检测模型和待发布预测模型进行测试,获得目标检测模型对应的检测数据,以及待发布预测模型对应的发布数据之后,即可根据检测数据和发布数据,确定待发布预测模型和检测模型之间的预测相似信息,其中,预测相似信息用于表示目标检测模型和待发布预测模型之间预测能力的相似程度,预测相似信息基于目标检测模型的预测类别以及预测准确度,待发布预测模型的预测类别以及预测准确度综合确定。
[0126] 基于此,根据检测数据中包含的预测类别数据和预测准确度,以及发布数据中包含的预测类别数据和预测准确度,确定待发布预测模型和检测模型之间的预测相似信息,用于基于预测相似信息对目标检测模型和待发布预测模型之间预测能力的相似程度进行判断。
[0127] 实际应用中,可以根据检测数据中包含的预测类别数据和预测准确度,以及发布数据中包含的预测类别数据和预测准确度计算目标检测模型和待发布预测模型对应的准确度和损失值,基于准确度和损失值确定预测相似信息,准确度大于预设准确度阈值且损失值小于预设损失值阈值的情况下,则表示目标检测模型和待发布预测模型之间预测能力相似。
[0128] 进一步的,现有技术中,在实现模型的事后解释之后,可以根据生成的解释数据对模型进行更新,然而这种模型解释方式仅能在模型发布后,实现模型解释,即便根据解释数据确定模型存在预测错误的问题,也无法避免模型预测错误带来的不良影响,因此,本实施例中利用测试样本对对目标检测模型和待发布预测模型进行测试,获得目标检测模型对应的检测数据,以及待发布预测模型对应的发布数据之后即可根据检测数据和发布数据对目标检测模型和待发布预测模型之间预测结果的相似程度,进而对待发布预测模型进行发布前的测试,具体实现如下:
[0129] 根据所述检测数据包含的所述检测类别数据,以及所述发布数据包含的所述发布类别数据计算预测概率值;根据所述检测数据包含的所述检测概率数据,以及所述发布数据包含的所述发布概率数据计算预测损失值;基于所述预测概率值和所述预测损失值确定所述待发布预测模型和所述检测模型之间的预测相似信息。
[0130] 具体的,预测概率值表示待发布预测模型的预测类别和检测模型的预测类别之间的相似程度,预测概率值越高,表示目标检测模型的预测结果和待发布预测模型的预测结果之间越相似;预测损失值表示待发布预测模型的预测准确度和检测模型的预测准确度之间的差异程度,预测损失值越低,表示目标检测模型的预测结果和待发布预测模型的预测结果之间越相似。
[0131] 基于此,根据检测数据包含的检测类别数据,以及发布数据包含的发布类别数据计算预测概率值。根据检测数据包含的检测概率数据,以及发布数据包含的发布概率数据计算预测损失值。基于预测概率值和预测损失值之间的差值确定待发布预测模型和检测模型之间的预测相似信息。在预测概率值大于预设的概率阈值,且预测损失值小于预设的损失值阈值的情况下,确定待发布预测模型和检测模型之间的预测相似信息满足检测条件。
[0132] 实际应用中,预测概率值通过下述公式(4)确定:
[0133]
[0134] 其中,yg表示目标检测模型对应的检测类别数据;yf表示待发布预测模型对应的发布类别数据。
[0135] 预测损失值通过下述公式(5)确定:
[0136]
[0137] 其中,pj表示目标检测模型对应的检测概率数据;qj表示待发布预测模型对应的发布概率数据。
[0138] 沿用上例,将用户2对应的行为数据:购买了蜡笔、铅笔、橡皮、拼音本作为测试样本输入至目标检测模型,以及输入至待发布预测模型。获得目标检测模型输出的预测类别:学生,并基于目标检测模型输出的预测类别和样本标签:小学生计算出预测准确度0.06。以及获得待发布预测模型输出的预测类别:高中生,并基于待发布预测模型输出的预测类别和样本标签:小学生计算出预测准确度0.05,将预测类别。采用上述公式(4)计算预测概率值,以及采用上述公式(5)计算预测损失值。将预测概率值和预测损失值作为预测相似信息。
[0139] 综上所述,于预测概率值和预测损失值确定待发布预测模型和检测模型之间的预测相似信息,进而在确定待发布预测模型的预测类别和检测模型的预测类别之间的相似程度较高,目标检测模型的预测结果和待发布预测模型的预测结果之间较为相似的情况下进行模型的发布,进而实现对待发布预测模型进行发布前的测试,提高后续执行预测任务的预测准确度,降低预测错误的概率。
[0140] 步骤S208:在所述预测相似信息满足检测条件的情况下,基于所述检测数据读取所述测试样本对关联的测试行为数据,并基于所述测试行为数据生成所述待发布预测模型的发布检测信息。
[0141] 具体的,在上述根据检测数据和发布数据,确定待发布预测模型和检测模型之间的预测相似信息之后,即可在预测相似信息满足检测条件的情况下,基于检测数据读取测试样本对关联的测试行为数据,并基于测试行为数据生成待发布预测模型的发布检测信息,其中,检测条件可以是预设检测阈值,在确定预测相似信息对应的相似度大于预设检测阈值时,则表示预测相似信息满足检测条件,反之则预测相似信息不满足检测条件;测试行为数据是指与测试样本对中测试样本对应的行为数据、测试样本对应的特征数据;发布检测数据即为根据测试样本对中测试样本对待发布预测模型进行检测获得的检测报告,通过对检测报告进行分析即可确定待发布预测模型是否存在预测缺陷,可以基于发布检测信息对待发布预测模型进行调整或更新。
[0142] 基于此,在根据检测数据和发布数据,确定待发布预测模型和检测模型之间的预测相似信息后,即可判断预测相似信息是否满足检测条,在预测相似信息满足检测条件的情况下,基于检测数据读取测试样本对关联的测试行为数据,并基于测试行为数据生成待发布预测模型的发布检测信息;在预测相似信息不满足检测条件的情况下则选择候选对象作为目标对象,并执行步骤S202,直到预测相似信息满足检测条件。
[0143] 进一步的,在实际应用中,进行模型解释一般是在模型发布到实际的生产环境之后,在模型完成预测任务后,对本次预测任务进行模型解释,然而这种模型解释方式提供的模型解释针对用户是不可见的,无法向用户提供具体的模型解释数据,因此在进行模型发布时,可以将待发布预测模型和目标检测模型一同发布在生产环境中,使得作为黑盒模型的待发布预测模型在输出用户属性信息的同时,能够基于作为白盒模型的目标检测模型确定模型解释信息,并将用户属性信息和模型解释信息一同反馈给用户,具体实现如下:
[0144] 在所述待发布预测模型和所述目标检测模型发布完成的情况下,获取待检测用户的用户行为数据;将所述用户行为数据输入至所述待发布预测模型进行处理,获得用户属性信息;将所述用户行为数据输入至所述目标检测模型进行处理,根据处理结果确定所述待发布预测模型对应的模型解释信息;根据所述用户属性信息生成所述待检测用户对应的用户画像,并针对所述用户画像添加所述模型解释信息。
[0145] 具体的,待检测用户可以是待发布预测模型和目标检测模型发布完成后,使用待发布预测模型和目标检测模型的用户;在电商领域、短视频领域等服务行业中,检测用户可以是服务方,也可以是被服务方,在电商领域中,待检测用户可以是入驻电商平台的商家,也可以是购买商品的买家;相应的用户行为数据即为待检测用户的行为数据,例如针对商品的购买等行为、针对文章的评论等行为;用户属性信息即为待发布预测模型基于用户行为数据进行预测,获得的用户画像标签或用户角色;模型解释信息是指基于目标检测模型确定的,对待检测用户的用户行为数据进行预测处理的过程中生成的信息,表示目标检测模型输出用户属性信息的依据以及推导过程;用户画像是指通过待发布预测模型和目标检测模型对用户行为数据进行预测,确定的待检测用户的用户角色或用户类型。
[0146] 基于此,在待发布预测模型和目标检测模型发布完成的情况下,获取待检测用户的用户行为数据。将用户行为数据输入至待发布预测模型进行处理,获得待发布预测模型输出的用户属性信息。将用户行为数据输入至目标检测模型进行处理,根据处理结果确定待发布预测模型对应的模型解释信息,根据用户属性信息生成待检测用户对应的用户画像,并针对用户画像添加模型解释信息,将用户画像以及模型解释信息一同反馈至待检测用户,从而便于待检测用户获知模型的预测与推理过程。
[0147] 沿用上例,在待发布预测模型和目标检测模型发布完成的情况下,即可面向用户投入使用。在为购物应用程序的商品买家,即,用户,预测用户画像时,获取购物应用程序的用户小李,确定用户小李在购物应用程序产生的行为数据,包括但不限于购买的商品类型、商品属性、购买时间、购买频次等数据。进而基于用户小李的行为数据进行用户画像的预测,将小李的行为数据“购买考研数学一千题”、“购买考研数学课程”、“购买铅笔”进行处理后输入至待发布预测模型,获得待发布预测模型输出的用户画像:“研究生”;以及将小李的行为数据输入至目标检测模型,在目标检测模型基于小李的行为数据进行预测时记录在预测过程中,目标检测模型确定的可能与小李的用户画像相关的“考研数学”、“手写笔”、“笔记本”等属性特征,并将与属性特征对应的行为数据“购买考研数学一千题”、“购买考研数学课程”作为通过目标检测模型确定的,与发布预测模型的预测结果对应的模型解释信息,模型解释信息,用于表示基于用户小李的行为数据进行用户画像预测时的预测过程。
[0148] 此外,针对电商平台的卖家,即,入驻电商平台的商户。商户可以在待发布预测模型为商品买家小李进行用户画像的预测后,确定小李对应的模型解释信息:“购买考研数学一千题”、“购买考研数学课程”、以及与小李的用户画像相关的“考研数学”、“手写笔”、“笔记本”等属性特征。商户可以根据小李对应的模型解释信息确定小李为即将考研的学生,因此可以对店铺中与考研相关的商品:“考研数学课程”、“考研数学书籍”、“手写笔”、“笔记本”等考研用品添加库存,或者引进新的与考研相关的商品,从而提高商品销售数量,为买家提高更好的服务,以及提高店铺在电商平台的知名度。
[0149] 综上所述,在待发布预测模型和目标检测模型发布完成的情况下,即可分别基于在待发布预测模型和目标检测模型对待检测用户的用户行为数据进行预测处理,确定用户画像的同时确定模型解释信息,进而提高模型预测的可解释性,以及模型预测结果的可读性。
[0150] 进一步的,在目标检测模型对测试样本进行处理的过程中,确定的检测数据中包含目标检测模型给出的多个特征数据,其中存在与测试样本对应的样本标签正相关的特征数据,也存在与样本标签负相关的特征数据,因此需要在特征数据中选择正相关的目标检测特征数据,进而对应目标检测特征数据的特征维度的测试行为数据,具体实现如下:
[0151] 对所述检测数据包含的所述检测特征数据进行排序,根据排序结果选择目标检测特征数据;在所述测试样本对关联的目标行为数据中,选择对应所述目标检测特征的特征维度的测试行为数据。
[0152] 具体的,目标检测特征数据是指根据检测数据包含的每个检测特征数据的特征贡献度,对检测特征数据进行排序,基于排序结果选择的检测特征数据,可以是按照特征贡献度从大到小进行排序,选择排序前三名的检测特征数据作为目标检测特征数据;也可以是选择特征贡献度大于预设特征贡献度阈值的检测特征数据作为目标检测特征数据。
[0153] 基于此,对检测数据包含的检测特征数据进行排序,根据排序结果选择目标检测特征数据,或者确定检测数据包含的检测特征数据的特征贡献度,并选择特征贡献度大于预设特征贡献度阈值的检测特征数据作为目标检测特征数据。在测试样本对关联的目标行为数据中,选择对应目标检测特征数据的特征维度的测试行为数据。
[0154] 沿用上例,在目标检测模型对测试样本进行预测处理的过程中,涉及到多个具有不同特征贡献度的检测特征数据。将用户2对应的行为数据:购买了蜡笔、铅笔、橡皮、拼音本作为测试样本输入至目标检测模型,在目标检测模型对用户2的行为数据进行预测的过程中,会基于用户2的行为数据确定多个可能与行为数据相关的检测特征数据。如图3中(b)所示,检测特征数据包括正相关的检测特征数据:学生、教师、家长,以及负相关的检测特征数据:厨师、工人、园艺师等。每个检测特征数据句对应一个特征贡献度,表示检测特征数据与用户2的用户画像的相关程度。进而根据特征贡献度对检测特征数据进行排序,选择设定数量的,特征贡献度较高的检测特征数据作为目标检测特征数据。进而选择用户2的行为数据中,与目标检测特征数据的特征维度对应的行为数据“购买了拼音本”。以便于后续基于确定的用户2的行为数据生成模型解释数据,用于对预测结果进行解释。
[0155] 综上所述,在测试样本对关联的目标行为数据中,选择对应目标检测特征数据的特征维度的测试行为数据,实现在测试样本对中选择与待发布预测模型对应的发布信息相关度较高的测试行为数据,进而生成发布检测信息,从而提高发布检测信息的准确性。
[0156] 进一步的,采用一个测试样本对待发布预测模型和目标检测模型进行测试无法避免偶然性的发生,因此为了避免偶然性,可以基于至少两个测试样本对测试待发布预测模型和目标检测模型,具体实现如下:
[0157] 基于至少两个测试样本对分别对应的发布检测信息生成发布检测信息集合;对所述发布检测信息集合中包含的发布检测信息进行聚合,根据聚合结果确定所述待发布预测模型对应的目标发布检测信息。
[0158] 具体的,发布检测信息集合即为每个测试样本对应的发布检测信息组成的信息集合;聚合可以理解为对发布检测信息集合中包含的发布检测信息进行统计聚合;目标发布检测信息即为对发布检测信息集合中的发布检测信息进行聚合后生成的包含模型解释信息的模型预测报告。
[0159] 基于此,在测试样本对为至少两个的情况下,分别将每个测试样本对输入至检测模型进行预测,获得每个测试样本对应的发布检测信息。基于至少两个测试样本对分别对应的发布检测信息生成发布检测信息集合。对发布检测信息集合中包含的发布检测信息进行聚合,根据聚合结果确定待发布预测模型对应的目标发布检测信息,其中,对发布检测信息集合中包含的发布检测信息进行聚合可以通过下述公式(6)实现:
[0160]
[0161] 其中,中 表示第i个测试样本在第k个检测特征数据维度对应的特征贡献度,表示特征贡献度的正数值; 表示基于至少两个测试样本对应的发布检测信息确定的目标发布检测信息。
[0162] 沿用上例,基于目标检测模型分别对用户4、用户5、用户6的测试样本进行预测,获得每个用户的发布检测信息。按照发布检测信息中检测特征数据的特征贡献度,在发布检测信息中选择设定数量的特征贡献度较大的特征:“考研”、“手写笔”、“笔记本”,并生成用户4、用户5、用户6的群体模型解释数据。
[0163] 综上所述,基于至少两个测试样本对测试待发布预测模型和目标检测模型,从而避免偶然性的发生,提高测试结果的可信度。
[0164] 图4是本说明书一个实施例提供的一种模型检测方法的处理过程流程图,如图4所示,在消费者用户画像标签预测的场景下,消费者可以为音视频应用程序的用户。确定音视频应用程序对应的包含用户名以及用户行为数据的用户集合,将用户集合作为样本空间,在用户集合中选择用户H,作为待解释样本。确定用户H的行为明细数据,其中,行为明细数据可以是收听了80年代影视金曲、播放了古典音乐、收藏的钢琴曲等针对音视频的行为数据。在用户行为明细数据中提取80年代、影视金曲、古典音乐等特征数据作为用户行为特征。用户行为特征也可以理解为专家知识,专家知识即为表示用户喜好的知识。
[0165] 根据用户H的用户行为特征,通过向量相似召回、倾向性得分匹配等技术在样本空间中进行采样,获得与用户H关联的用户组成用户子集,根据用户子集中用户的行为明细数据,以及用户的用户画像构建局部代理样本集,局部代理样本集中的样本对包含在用户行为明细数据中提取出的低维可读的专家知识,以及与专家知识对应的样本标签。按照9:1的比例将局部代理样本集划分为训练集和测试集。测试集中的测试样本对中包含低维可读的专家知识、具有复杂特征的高维表征,以及样本标签。
[0166] 构建线性模型或决策树等白盒模型,并确定白盒模型的损失函数,损失函数可以通过上述公式(3)确定。基于包含低维可读的专家知识的训练集对白盒模型进行训练。训练完成后,基于测试集对白盒模型和黑盒模型进行测试。在测试集中选择测试样本,将测试样本中低维可读的专家知识输入至白盒模型进行预测,获得白盒模型针对测试样本的预测类别和预测概率;将测试样本中具有复杂特征的高维表征输入至黑盒模型进行预测,获得黑盒模型针对测试样本的预测类别和预测概率。根据黑盒模型针对测试样本的预测类别和预测概率,以及白盒模型针对测试样本的预测类别和预测概率进行忠实度评价。
[0167] 基于黑盒模型针对测试样本的预测类别,以及白盒模型针对测试样本的预测类别计算预测准确率;基于黑盒模型针对测试样本的预测概率,以及白盒模型针对测试样本的预测概率计算损失值,其中,预测准确率的计算可以通过上述公式(4)实现,损失值的计算可以通过上述公式(5)实现。预测准确率越高,且损失值越小,则忠实度越高,表示黑盒模型和白盒模型的预测结果越相近,白盒模型的预测越接近黑盒模型的预测。可以设定准确率阈值,作为对预测准确率大小的判断,设定损失值阈值,作为对损失值大小的判断。若忠实度低于忠实度阈值,则重新在用户集合中选择用户,并将选择的用户作为用户H重复执行上述步骤,直到忠实度大于等于忠实度阈值,即可生成可解释报告。
[0168] 根据白盒模型对测试样本进行预测过程中确定的行为特征,按照行为特征对应的贡献度选择设定数量的,贡献度较高的行为特征,进而基于确定的行为特征确定与行为特征相关的用户行为数据,作为可解释报告中的参考内容。在进行群体解释时,在用户集合中继续选择与用户H关联的用户组成新的用户子集,分别以用户子集中每个用户的行为数据为样本进行黑盒模型和白盒模型的预测,获得每个用户对应的可解释报告。通过上述公式(6)对每个可解释报告,进行统计聚合,将聚合结果作为新的用户子集这一用户群体的可解释结果。
[0169] 综上所述,本实施例通过从真实的样本分布中进行采样得到局部代理样本集,其数据分布严格符合真实分布,因此得到的解释结果是较为接近客观实际情况的,保证了局部解释的准确性。采用了专家知识特征进行模型解释,与黑盒模型的原始输入特征进行了解耦,提升了通用性。可解释结果基于下游任务的专家知识生成,因此具有很好的可读性,方便人们直观的判断解释的合理与否,进而对于黑盒模型的透明性做出比较准确的评估与改进,最大程度上发掘黑盒模型的决策偏好及缺陷,并给出相应的优化方案。此外,在下游任务的黑盒模型解释,对于生产链路无需进行改造,迁移性和通用性较强。
[0170] 进一步的,现有技术中,通常是在模型发布完成,真实的生产环境中进行模型解释,然而这种情况下,即便模型出现预测错误,造成的不良影响也无法挽回,只能在模型出现预测错误后对模型进行调整,因此,本实施例提出在待发布预测模型发布之前,对待发布预测模型是否满足发布条件进行判断,若不满足,则有针对性的对待发布预测模型进行更新,具体实现如下:
[0171] 在基于所述发布检测信息确定所述待发布预测模型不满足发布条件的情况下,向所述待发布预测模型的模型维护方发送提示信息;基于所述模型维护方针对所述提示信息提交的模型更新请求,对所述待发布预测模型进行更新;在更新后的待发布预测模型满足发布条件的情况下,基于更新后的待发布预测模型执行发布任务。
[0172] 具体的,模型维护方可以是待发布预测模型的开发者;提示信息是指用于告知模型维护方,当前待发布预测模型存在的问题;模型更新请求是模型维护方针对当前待发布预测模型存在的问题对待发布预测模型进行调整后,基于调整获得待发布预测模型提交的计算机请求,用于实现对当前待发布预测模型进行更新;发布任务是指在更新后的待发布预测模型满足发布条件并进行发布后,能够完成的测试任务,包括但不限于用户画像预测、图像预测等。
[0173] 基于此,在生成发布检测信息后,基于发布检测信息对待发布预测模型是否满足发布条件进行判断,即,基于发布检测信息确定是否出现模型预测错误的问题,若是,则表示待发布预测模型不满足发布条件。在基于发布检测信息确定待发布预测模型不满足发布条件的情况下,向待发布预测模型的模型维护方发送提示信息,用于告知模型维护方,当前待发布预测模型存在的问题,由模型维护方基于提示信息生成与待发布预测模型对应的调整信息;并基于调整信息提交模型更新请求,对待发布预测模型进行更新;在更新后的待发布预测模型满足发布条件的情况下,基于更新后的待发布预测模型执行发布任务。
[0174] 沿用上例,在生成的发布检测信息中包含“红外线笔”这一特征数据时,表示预测样本用户2存在是讲师的可能,而待发布预测模型并未融入这一特征数据。可以基于“红外线笔”‑“讲师”这一对特征数据生成提示信息,并发送至待发布预测模型的模型维护人员。由模型维护人员对待检测模型进行重新训练或参数更新。进而在后续的模型预测过程中融入“红外线笔”对应“讲师”这一对特征,从而实现待检测模型的优化,基于更新后的待发布预测模型执行发布任务。在待发布预测模型发布前,开发人员可以基于可发布检测信息确定待发布预测模型的预测原理。根据发布检测信息中每个特征的贡献度,以及待发布预测模型的测试结果对待发布预测模型进行适当调整再进行发布,从而使得发布的待发布预测模型具有较强的预测能力,降低出现预测错误的概率。
[0175] 综上所述,在待发布预测模型发布之前,对待发布预测模型是否满足发布条件进行判断,若不满足,则由模型维护方有针对性的对待发布预测模型进行更新,从而降低模型发布后出现预测错误的概率。
[0176] 进一步的,在基于目标检测模型确定检测数据,以及基于待发布预测模型确定发布数据后,存在基于检测数据和发布数据确定的预测相似信息不满足检测条件的情况,表示待发布预测模型和目标检测模型之间预测结果的相似度较低,因此需要重新确定目标检测模型以及进行后续的测试,具体实现如下:
[0177] 在所述预测相似信息不满足检测条件的情况下,确定候选对象,并将所述候选对象作为所述目标对象,执行所述基于目标对象的属性信息和行为数据构建训练样本对和测试样本对的步骤。
[0178] 基于此,候选对象是指在数据集合中选择的任一对象。在预测相似信息不满足检测条件的情况下,表示待发布预测模型的预测类别和检测模型的预测类别之间的相似程度较低,待发布预测模型的预测准确度和检测模型的预测准确度之间的差异程度较大。在数据集合中重新选择候选对象,并将候选对象作为目标对象,执行步骤S202。
[0179] 沿用上例,在预测相似信息中包含的预测概率值小于预测概率阈值0.8,预测损失值大于预测概率值0.2的情况下,表示待发布预测模型的预测类别和检测模型的预测类别之间的相似程度较低,且目标检测模型的预测结果和待发布预测模型的预测结果之间相似度较低,因此确定目标检测模型的预测能力和待发布预测模型的预测能力之间差异较大。此时可以在数据集合中重新选择目标对象、进行检测模型的训练,以及预测相似信息的确定,直到预测相似信息满足检测条件,待发布预测模型和目标检测模型即可进行发布。
[0180] 综上所述,在基于检测数据和发布数据确定的预测相似信息不满足检测条件的情况下,重新确定目标检测模型以及进行后续的测试,从而提高待发布预测模型和目标检测模型之间预测结果的相似度,使得目标检测模型逐渐拟合待发布预测模型。
[0181] 与上述方法实施例相对应,本说明书还提供了模型检测装置实施例,图5是本说明书一个实施例提供的一种模型检测装置的结构示意图。如图5所示,该装置包括:
[0182] 训练模块502,被配置为基于目标对象的属性信息和行为数据构建训练样本对和测试样本对,并基于待发布预测模型和检测模型对所述训练样本对进行处理,根据所述待发布预测模型和所述检测模型分别对应的处理结果对所述检测模型进行调参,直至获得满足训练停止条件的目标检测模型;
[0183] 测试模块504,被配置为利用所述测试样本对对所述目标检测模型和所述待发布预测模型进行测试,获得所述目标检测模型对应的检测数据,以及所述待发布预测模型对应的发布数据;
[0184] 确定模块506,被配置为根据所述检测数据和所述发布数据,确定所述待发布预测模型和所述检测模型之间的预测相似信息;
[0185] 生成模块508,被配置为在所述预测相似信息满足检测条件的情况下,基于所述检测数据读取所述测试样本对关联的测试行为数据,并基于所述测试行为数据生成所述待发布预测模型的发布检测信息。
[0186] 一个可选地实施例,所述训练模块502,还被配置为:
[0187] 在数据集合中选择参考对象的参考行为数据;按照采样策略在所述数据集合中选择与所述参考行为数据关联的关联行为数据,其中,所述关联行为数据对应关联对象;将所述关联对象作为所述目标对象,以及将所述关联行为数据作为所述行为数据,并加载所述目标对象的属性信息。
[0188] 一个可选地实施例,所述训练模块502,进一步被配置为:
[0189] 根据所述目标对象的行为数据确定样本数据,并根据所述目标对象的属性信息确定所述样本数据对应的样本标签;基于所述样本数据和所述样本标签构建样本对集合;按照预设的比例在所述样本对集合中选择训练样本对和测试样本对。
[0190] 一个可选地实施例,所述训练模块502,还被配置为:
[0191] 根据所述参考行为数据与所述行为数据之间的映射关系,构建所述检测模型的损失函数;所述基于所述训练样本对训练待发布预测模型关联的检测模型,获得满足训练停止条件的目标检测模型,包括:将所述训练样本对包含的训练样本输入至所述检测模型,获得预测属性信息;利用所述损失函数对所述训练样本对包含的预测标签和预测属性信息进行损失值计算,获得检测损失值;基于所述检测损失值对所述检测模型进行调参,直至获得满足训练停止条件的目标检测模型。
[0192] 一个可选地实施例,所述确定模块506,还被配置为:
[0193] 根据所述参考行为数据与所述行为数据之间的映射关系、所述待发布预测模型的损失函数和预设正则项构建所述检测模型的损失函数;将所述训练样本对中的训练样本输入至所述待发布预测模型,获得预测信息,并基于所述预测信息和所述训练样本对中的样本标签计算预测损失值,将所述预测损失值作为所述待发布预测模型对应的处理结果;将所述训练样本对中的训练样本输入至所述检测模型,获得检测信息,并基于所述检测信息和所述训练样本对中的样本标签计算检测损失值,将所述检测损失值作为所述检测模型对应的处理结果;基于所述检测模型的损失函数对所述预测损失值和所述检测损失值进行计算,根据计算结果确定全局损失值,并基于所述全局损失值对所述检测模型进行调参,直至获得满足训练停止条件的目标检测模型。
[0194] 一个可选地实施例,所述训练模块502,进一步被配置为:
[0195] 利用所述测试样本对对所述目标检测模型进行测试,获得所述目标检测模型对应的检测特征数据、检测类别数据和检测概率数据,将所述检测特征数据、所述检测类别数据和所述检测概率数据作为所述检测数据;利用所述测试样本对对所述待发布预测模型进行测试,获得所述待发布预测模型对应的发布类别数据和发布概率数据,将所述发布类别数据和所述发布概率数据作为所述发布数据。
[0196] 一个可选地实施例,所述生成模块508,进一步被配置为:
[0197] 根据所述检测数据包含的所述检测类别数据,以及所述发布数据包含的所述发布类别数据计算预测概率值;根据所述检测数据包含的所述检测概率数据,以及所述发布数据包含的所述发布概率数据计算预测损失值;基于所述预测概率值和所述预测损失值确定所述待发布预测模型和所述检测模型之间的预测相似信息。
[0198] 一个可选地实施例,所述生成模块508,进一步被配置为:
[0199] 对所述检测数据包含的所述检测特征数据进行排序,根据排序结果选择目标检测特征数据;在所述测试样本对关联的目标行为数据中,选择对应所述目标检测特征的特征维度的测试行为数据。
[0200] 一个可选地实施例,所述生成模块508,还被配置为:
[0201] 基于至少两个测试样本对分别对应的发布检测信息生成发布检测信息集合;对所述发布检测信息集合中包含的发布检测信息进行聚合,根据聚合结果确定所述待发布预测模型对应的目标发布检测信息。
[0202] 一个可选地实施例,所述生成模块508,还被配置为:
[0203] 在基于所述发布检测信息确定所述待发布预测模型不满足发布条件的情况下,向所述待发布预测模型的模型维护方发送提示信息;基于所述模型维护方针对所述提示信息提交的模型更新请求,对所述待发布预测模型进行更新;在更新后的待发布预测模型满足发布条件的情况下,基于更新后的待发布预测模型执行发布任务。
[0204] 一个可选地实施例,所述训练模块502,还被配置为:
[0205] 根据所述数据集合包含的对象数据构建发布预测模型训练集;利用所述发布预测模型训练集对初始待发布预测模型进行训练,直至获得满足模型训练停止条件的待发布预测模型。
[0206] 一个可选地实施例,所述生成模块508,还被配置为:
[0207] 在所述预测相似信息不满足检测条件的情况下,确定候选对象,并将所述候选对象作为所述目标对象,执行所述基于目标对象的属性信息和行为数据构建训练样本对和测试样本对的步骤。
[0208] 综上所述,在待发布预测模型进行发布前,结合检测模型针对测试样本的检测数据,确定待发布预测模型和检测模型之间的预测相似信息,进而生成待发布预测模型的发布检测信息,实现了对待发布预测模型进行发布前的检测,提高待发布预测模型的预测能力;基于测试样本对关联的测试行为数据生成待发布预测模型的发布检测信息,从而提高发布检测信息的可读性和可解释性。
[0209] 上述为本实施例的一种模型检测装置的示意性方案。需要说明的是,该模型检测装置的技术方案与上述的模型检测方法的技术方案属于同一构思,模型检测装置的技术方案未详细描述的细节内容,均可以参见上述模型检测方法的技术方案的描述。
[0210] 参见图6,图6是本说明书一个实施例提供的一种模型检测方法的流程图,模型检测方法,应用于检测服务提供方,具体包括以下步骤。
[0211] 步骤S602:接收检测服务使用方提交的携带待发布预测模型和数据集合的模型检测请求;
[0212] 步骤S604:基于所述数据集合的属性信息和行为数据构建训练样本对和检测样本对,并基于待发布预测模型和检测模型对所述训练样本对进行处理,根据所述待发布预测模型和所述检测模型分别对应的处理结果对所述检测模型进行调参,直至获得满足训练停止条件的目标检测模型;
[0213] 步骤S606:利用所述检测样本对对所述目标检测模型和所述待发布预测模型进行检测,获得所述目标检测模型对应的检测数据,以及所述待发布预测模型对应的发布数据;
[0214] 步骤S608:根据所述检测数据和所述发布数据,确定所述待发布预测模型和所述检测模型之间的预测相似信息;
[0215] 步骤S610:在所述预测相似信息满足检测条件的情况下,基于所述检测数据读取所述检测样本对关联的检测行为数据,并基于所述检测行为数据生成所述待发布预测模型的发布检测信息,反馈至所述检测服务使用方。
[0216] 现有技术中,由于事后解释方法不涉及对原有黑盒模型进行改造,通用性较强,成本也低,因此为大家广泛采用。为了提高模型预测的准确度,通常会在模型发布之前构建测试集对模型的预测能力进行测试,然而这种测试方法仅能基于预先准备的测试集对模型进行测试,无法直接基于测试结果对模型进行有针对性的调整,测试结果的可读性以及可解释性较低,模型发布后,预测能力则相对较低。且一般模型开发者,不具有在模型发布之前通过模型解释的方法对模型进行检测的检测条件,搭建检测环境将会耗费大量等资源,诸多因素导致模型开发者无法在模型发布之前对模型进行检测。
[0217] 具体实施时,在检测服务使用方部署了待发布预测模型之后,待发布预测模型发布之前,可以将待发布预测模型交由检测服务提供方,通过构建检测模型的方式在待发布预测模型进行发布之前对待发布预测模型进行模型检测。在训练待发布预测模型的数据集合中选择属性信息和行为数据。基于属性信息和行为数据构建训练样本对和测试样本对。构建待发布预测模型关联的检测模型,将检测模型作为白盒模型进行训练,即,基于训练样本对训练待发布预测模型关联的检测模型,获得满足训练停止条件的目标检测模型。
[0218] 将测试样本对分别输入至目标检测模型和待发布预测模型,获得目标检测模型对应的检测数据,以及待发布预测模型对应的发布数据。其中,检测数据中包含检测特征数据、检测类别数据和检测概率数据,发布数据中包含发布类别数据和发布概率数据。根据检测数据中包含的检测类别数据和检测概率数据,以及发布数据中包含的发布类别数据和发布概率数据,确定待发布预测模型和检测模型之间的预测相似信息。在预测相似信息满足检测条件的情况下,基于检测数据中包含的检测特征数据读取测试样本对关联的测试行为数据,并基于测试行为数据生成待发布预测模型的发布检测信息;在预测相似信息不满足检测条件的情况下,则在数据集合中选择候选对象,并将候选对象作为目标对象,执行上述确定目标对象的属性信息和行为数据等步骤。直至预测相似信息满足检测条件,将预测相似信息满足检测条件的目标检测模型对应的发布检测信息反馈至检测服务使用方,以便于检测服务使用方基于发布检测信息对待发布预测模型进行评估以及参数调整。
[0219] 综上所述,在待发布预测模型进行发布前,结合检测模型针对测试样本的检测数据,确定待发布预测模型和检测模型之间的预测相似信息,进而生成待发布预测模型的发布检测信息,并反馈至检测服务使用方,进而对待发布预测模型进行发布前的检测和调整,提高待发布预测模型的预测能力;基于测试样本对关联的测试行为数据生成待发布预测模型的发布检测信息,从而提高发布检测信息的可读性和可解释性。
[0220] 与上述方法实施例相对应,本说明书还提供了模型检测装置实施例,模型检测装置应用于检测服务提供方图。7是本说明书一个实施例提供的一种模型检测装置的结构示意图。如图7所示,该装置包括:
[0221] 接收模块702,被配置为接收检测服务使用方提交的携带待发布预测模型和数据集合的模型检测请求;
[0222] 训练模块704,被配置为基于所述数据集合的属性信息和行为数据构建训练样本对和检测样本对,并基于待发布预测模型和检测模型对所述训练样本对进行处理,根据所述待发布预测模型和所述检测模型分别对应的处理结果对所述检测模型进行调参,直至获得满足训练停止条件的目标检测模型;
[0223] 测试模块706,被配置为利用所述检测样本对对所述目标检测模型和所述待发布预测模型进行检测,获得所述目标检测模型对应的检测数据,以及所述待发布预测模型对应的发布数据;
[0224] 确定模块708,被配置为根据所述检测数据和所述发布数据,确定所述待发布预测模型和所述检测模型之间的预测相似信息;
[0225] 反馈模块710,被配置为在所述预测相似信息满足检测条件的情况下,基于所述检测数据读取所述检测样本对关联的检测行为数据,并基于所述检测行为数据生成所述待发布预测模型的发布检测信息,反馈至所述检测服务使用方。
[0226] 综上所述,在待发布预测模型进行发布前,结合检测模型针对测试样本的检测数据,确定待发布预测模型和检测模型之间的预测相似信息,进而生成待发布预测模型的发布检测信息,并反馈至检测服务使用方,进而对待发布预测模型进行发布前的检测和调整,提高待发布预测模型的预测能力;基于测试样本对关联的测试行为数据生成待发布预测模型的发布检测信息,从而提高发布检测信息的可读性和可解释性。
[0227] 上述为本实施例的一种模型检测装置的示意性方案。需要说明的是,该用模型检测装置的技术方案与上述的模型检测方法的技术方案属于同一构思,模型检测装置的技术方案未详细描述的细节内容,均可以参见上述模型检测方法的技术方案的描述。
[0228] 参见图8,图8是本说明书一个实施例提供的另一种模型检测方法的流程图,模型检测方法,应用于检测服务使用方,具体包括以下步骤。
[0229] 步骤S802:通过模型检测界面提交数据集合和待发布预测模型,并发送至检测服务提供方;
[0230] 步骤S804:接收所述检测服务提供方反馈的发布检测信息,并在所述模型检测界面展示所述发布检测信息,其中,所述发布检测信息由所述检测服务提供方基于检测模型对所述待发布预测模型进行解释获得,所述检测模型由所述检测服务提供方基于所述数据集合和所述待发布预测模型对初始检测模型进行训练获得。
[0231] 实际应用中,在检测服务使用方部署了待发布预测模型之后,待发布预测模型发布之前,可以将待发布预测模型交由检测服务提供方,通过构建检测模型的方式在待发布预测模型进行发布之前对待发布预测模型进行模型检测。由检测服务提供方基于数据集合训练与待发布预测模型对应的检测模型,并基于检测模型对待发布预测模型进行解释获得发布检测信息,并将发布检测信息反馈至检测服务使用方,以便于检测服务使用方基于发布检测信息对待发布预测模型进行评估以及参数调整。
[0232] 综上所述,在检测服务使用方部署了待发布预测模型之后,待发布预测模型发布之前,将待发布预测模型交由检测服务提供方进行模型检测,基于检测服务提供方反馈的发布检测信息对待发布模型进行调整,进而提高待发布预测模型的预测能力,发布检测信息同时也具有较强的可读性和可解释性。
[0233] 与上述方法实施例相对应,本说明书还提供了模型检测装置实施例,图9是本说明书一个实施例提供的另一种模型检测装置的结构示意图,模型检测装置,应用于检测服务使用方。如图9所示,该装置包括:
[0234] 发送模块902,被配置为通过模型检测界面提交数据集合和待发布预测模型,并发送至检测服务提供方;
[0235] 展示模块904,被配置为接收所述检测服务提供方反馈的发布检测信息,并在所述模型检测界面展示所述发布检测信息,其中,所述发布检测信息由所述检测服务提供方基于检测模型对所述待发布预测模型进行解释获得,所述检测模型由所述检测服务提供方基于所述数据集合和所述待发布预测模型对初始检测模型进行训练获得。
[0236] 综上所述,在检测服务使用方部署了待发布预测模型之后,待发布预测模型发布之前,将待发布预测模型交由检测服务提供方进行模型检测,基于检测服务提供方反馈的发布检测信息对待发布模型进行调整,进而提高待发布预测模型的预测能力,发布检测信息同时也具有较强的可读性和可解释性。
[0237] 上述为本实施例的另一种模型检测装置的示意性方案。需要说明的是,该用模型检测装置的技术方案与上述的模型检测方法的技术方案属于同一构思,模型检测装置的技术方案未详细描述的细节内容,均可以参见上述模型检测方法的技术方案的描述。
[0238] 图10是根据本说明书一个实施例提供的一种计算设备1000的结构框图。该计算设备1000的部件包括但不限于存储器1010和处理器1020。处理器1020与存储器1010通过总线1030相连接,数据库1050用于保存数据。
[0239] 计算设备1000还包括接入设备1040,接入设备1040使得计算设备1000能够经由一个或多个网络1060通信。这些网络的示例包括公用交换电话网(PSTN,Public SwitchedTelephone Network)、局域网(LAN,LocalAreaNetwork)、广域网(WAN,WideAreaNetwork)、个域网(PAN,Personal Area Network)或诸如因特网的通信网络的组合。接入设备1040可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC,network interface controller))中的一个或多个,诸如IEEE802.11无线局域网(WLAN,Wireless LocalAreaNetwork)无线接口、全球微波互联接入(Wi‑MAX,Worldwide Interoperability for MicrowaveAccess)接口、以太网接口、通用串行总线(USB,Universal Serial Bus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC,Near Field Communication)接口,等等。
[0240] 在本申请的一个实施例中,计算设备1000的上述部件以及图10中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图10所示的计算设备结构框图仅仅是出于示例的目的,而不是对本申请范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
[0241] 计算设备1000可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(PC,Personal Computer)的静止计算设备。计算设备1000还可以是移动式或静止式的服务器。其中,处理器1020用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述方法的步骤。
[0242] 上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述方法的技术方案的描述。
[0243] 本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述方法的步骤。
[0244] 上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述方法的技术方案的描述。
[0245] 本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述方法的步骤。
[0246] 上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述方法的技术方案的描述。
[0247] 上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0248] 所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据专利实践的要求进行适当的增减,例如在某些地区,根据专利实践,计算机可读介质不包括电载波信号和电信信号。
[0249] 需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
[0250] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0251] 以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

当前第1页 第1页 第2页 第3页