技术领域
[0001] 本申请涉及人工智能技术领域,特别是涉及一种标签确定方法。
相关背景技术
[0002] 在图领域,社区发现是一个非常热门且广泛的话题,在真实的社交网络中,有些用户之间连接非常紧密,有些用户之间的连接较为稀疏,连接紧密的用户群体可以看做一个社区,社区发现算法是一种数据挖掘技术,主要用于检测图形或网络结构中的相关社区,可以通过标签传播算法确定社区中各个节点的标签。标签传播算法的基本思想是将一个节点的邻居节点的标签中出现次数最多的标签作为该节点自身的标签。给每个节点添加标签以代表它所属的社区,并通过标签的传播形成同一标签的社区结构。在用一个唯一的标签初始化每个节点之后,该算法会重复地将一个节点的标签社群化为该节点的相邻节点中出现频率最高的标签。当每个节点的标签在其相邻节点中出现得最频繁时,标签传播算法停止计算,并确定社区中各个节点的标签信息。
[0003] 当前确定不同社区中各个节点的标签信息时,往往需要额外的服务器作为中间方协调并计算结果,若使用明文计算节点的标签信息,则存在泄露数据隐私的风险,且标签计算效率较低,标签计算成本较高。因此,如何在两个社区存在相同节点的情况下,对两个社区中的无标签节点进行标签信息计算,并再标签信息计算的过程中降低泄露数据隐私的风险,提高标签信息的确定效率,降低标签信息的计算成本,是需要解决的问题。
具体实施方式
[0056] 为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0057] 本申请实施例提供的标签确定方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与标签确定系统104进行通信。数据存储系统可以存储标签确定系统104需要处理的数据。数据存储系统可以集成在标签确定系统104上,也可以放在云上或其他网络服务器上。在标签确定系统104中业务参与方根据参与方拓扑结构确定参与方权重矩阵,并根据参与方权重矩阵确定参与方无标签数据的参与方概率传播矩阵,且根据参与方权重矩阵确定参与方矩阵传输因子,将参与方矩阵传输因子发送至业务发起方;业务发起方获取参与方矩阵传输因子,根据发起方拓扑结构确定发起方权重矩阵,根据发起方权重矩阵对发起方无标签数据进行传播因子计算,确定发起方概率传播矩阵,根据参与方矩阵传输因子和发起方权重矩阵确定发起方联合矩阵因子,并根据发起方权重矩阵确定发起方矩阵和向量;业务参与方根据参与方权重矩阵确定参与方矩阵和向量,将参与方矩阵和向量发送至业务发起方;业务发起方获取参与方矩阵和向量,根据发起方矩阵和向量和参与方矩阵和向量确定联合矩阵和向量,将联合矩阵和向量发送至业务参与方,并根据联合矩阵和向量和发起方权重矩阵确定发起方分块概率矩阵;业务参与方获取联合矩阵和向量,根据联合矩阵和向量和参与方权重矩阵确定参与方分块概率矩阵,并将参与方分块概率矩阵中的参与方传输概率矩阵发送至业务发起方,且根据参与方概率传播矩阵和参与方分块概率矩阵确定参与方更新概率矩阵;业务发起方获取参与方传输概率矩阵,并根据参与方传输概率矩阵和发起方概率传播矩阵,确定发起方更新概率矩阵;业务发起方根据发起方更新概率矩阵和标签数据矩阵确定发起方无标签数据的目标标签,业务参与方根据参与方更新概率矩阵和标签数据矩阵确定参与方无标签数据的目标标签,通过通信网络将发起方无标签数据的目标标签和参与方无标签数据的目标标签发送至终端102。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。标签确定系统104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0058] 在一个实施例中,如图2所示,提供了一种标签确定方法,上述标签确定方法由标签确定系统执行,标签确定系统包括业务发起方和业务参与方。
[0059] 需要说明的是,标签确定系统中业务发起方的发起方数据集和业务参与方的参与方数据集拥有完全相同的特征空间,业务发起方维护发起方社区中的节点,业务参与方维护参与方社区中的节点。发起方数据集为DA,且 其中numA表示业务发起方数据量,lA代表业务发起方的发起方有标签定的数据量,uA代表业务发起方的发起方无标签数据的数据量,CA表示业务发起方的发起方标签范围。参与方数据集为DB,且 其中numB表示业务参与方数据量,lB代表业务
参与方的参与方有标签数据的数据量,uB代表业务参与方的参与方无标签数据的数据量,CB表示业务参与方的参与方标签范围。业务发起方和业务参与方之间具有至少一个相交的数据节点,且数据发起方和数据参与方的数据节点间关系无法通过线下的方式协商整理被获知,故所有的节点关系全部存于原始的数据拓扑图中,业务发起方和业务参与方彼此之间互不暴露数据节点的具体信息,具体信息包括特征值与标签值。
[0060] 本实施例中,该方法包括以下步骤:
[0061] S210、业务参与方根据参与方拓扑结构确定参与方权重矩阵,并根据参与方权重矩阵确定参与方无标签数据的参与方概率传播矩阵,且根据参与方权重矩阵确定参与方矩阵传输因子,将参与方矩阵传输因子发送至业务发起方。
[0062] 需要说明的是,业务参与方可以通过参与方服务器执行标签确定方法,业务发起方可以通过发起方服务器执行标签确定方法。业务发起方需要确定发起方数据集中的发起方无标签数据的标签信息时,可以联合业务参与方,对业务发起方和业务参与方数据进行隐私求交,确定业务发起方和业务参与方的联合数据交集DP,DP=DAB,业务发起方的发起方全量数据中除联合数据集交集DP之外的发起方独有数据为DAP,业务参与方的参与方全量数据中除数据集交集DP之外的参与方独有数据为DBP。其中,DA=DAP∪DAB且DB=DBP∪DAB且 业务发起方联合业务参与方对联合数据交集DP中的有标
签数据进行隐私求交,确定有标签数据交集,并确定有标签数据交集中的标签数据编号,业务发起方根据有标签数据交集和发起方有标签数据生成发起方标签数据列表;业务参与方根据有标签数据交集和参与方有标签数据生成参与方标签数据列表。业务发起方联合业务参与方进行数据重排,将发起方数据集中的发起方全量数据和参与方数据集中的参与方全量数据进行序号排列,生成数据排列名单 且数据排列名单在业务发起方和业务参与方之间共享,nA表示发起方数据集中的发起方全量数据,nB表示参与方数据集中的参与方全量数据。进行序号排列时,发起方全量数据和参与方全量数据排序次序依次是:业务发起方独有标签数据 DP中业务发起方独有标签数据 DP中业务发起方和业务参与方共有标签数据 DP中业务参与方独有标签数据 业务参与方独有标签数据
业务发起方未标签数据 DP中的发起方无标签数据和DP中的参与方无标签数据 以及参与方无标签数据 其中,
即:
其中,A表示业
务发起方,B表示业务参与方。
[0063] 数据排列名单中的数据排列顺序依次为:业务发起方发起方全量数据中独有的发起方标签数据 数据集交集DP中业务发起方独有的发起方标签数据 数据集交集DP中业务发起方和业务参与方共有的标签数据 数据集交集DP中业务参与方独有的参与方标签数据 业务参与方参与方全量数据中独有的标签数据 发起方全量数据中的发起方无标签数据 数据集交集DP中业务发起方的无标签数据和业务参与方的无标签数据 参与方全量数据中的参与方无标签数据 业务发起方获取发起方本地数据关系矩阵MA,业务参与方获取参与方本地数据关系矩阵MB。
[0064] 示例性的,业务发起方的发起方拓扑结构如图3所示,业务参与方的参与方拓扑结构如图4所示,业务发起方和业务参与方的节点连接关系图如图5所示。业务发起方与业务参与方仅拥有己方的数据关系以及标签数据,彼此并不知道对方的数据类型以及数据关系。相较于中心化关系图,业务发起方的节点节点2和节点3,以及业务参与方的节点节点5,节点9和节点10是重叠点,且互相之间连接关系。其中节点2是业务发起方仅有的标签数据点,节点5是业务参与方单独拥有的数据点,节点3为业务发起方和业务参与方都拥有数据标签。可通过隐私计算的方式,在不暴露业务发起方的发起方数据,业务参与方的参与方数据,业务发起方内部数据关系,以及业务参与方内部数据关系的情况下,完成构建业务发起方和业务参与方双方的全局社区网络。
[0065] 业务参与方根据参与方本地数据关系矩阵MB确定参与方拓扑结构,根据参与方拓扑结构确 定参与方 权重矩阵 。示例性的 ,参与方 权重矩阵 可以包括 :和 其中,
lPC为联合数据交集DP中的业务参与方和业务发起方共有
的有标签数据,lPB为联合数据交集DP中的参与方有标签数据,uC为联合数据交集DP中的无标签数据。根据参与方权重矩阵对参与方无标签数据 对应的数据点p执行传播因子计算,确定参与方无标签数据的参与方概率传播矩阵TB,且 从
参与方权重矩阵中确定参与方矩阵传输因子 和 将参与方矩阵传输因子发
送至业务发起方。
[0066] S220、业务发起方获取参与方矩阵传输因子,根据发起方拓扑结构确定发起方权重矩阵,根据发起方权重矩阵对发起方无标签数据进行传播因子计算,确定发起方概率传播矩阵,根据参与方矩阵传输因子和发起方权重矩阵确定发起方联合矩阵因,并根据发起方权重矩阵确定发起方矩阵和向量。
[0067] 具体的,业务发起方获取参与方发送的参与方矩阵传输因子 和并根据发起方拓扑结构确定发起方权重矩阵,发起方权重矩阵可以包括:
和 其中
lPA为联合数据交集DP中的发起方有
标签数据。根据发起方权重矩阵对发起方无标签数据 执行传播因子计算,生成发起方概率传播矩阵TA,且 其中,
[0068] 业务发起方根据参与方矩阵传输因子 和发起方权重矩阵中的发起方矩阵因子 生成发起方联合矩阵因子 与 并根据发起
方权重矩阵确定发起方矩阵和向量SA。其中
即位置均为0,取值为0,
均非0或者仅一个值为0,一个非零,则维持非零值不变。
[0069] S230、业务参与方根据参与方权重矩阵确定参与方矩阵和向量,将参与方矩阵和向量发送至业务发起方。
[0070] 具体的,业务参与方从参与方权重矩阵中确定参与方求和矩阵 并对参与方求和矩阵按行求和确定参与方矩阵和向量SB。其中,
并将参与方矩阵和向量SB发送至业务发起方。
[0071] S240、业务发起方获取参与方矩阵和向量,根据发起方矩阵和向量和参与方矩阵和向量确定联合矩阵和向量,将联合矩阵和向量发送至业务参与方,并根据联合矩阵和向量和发起方权重矩阵确定发起方分块概率矩阵。
[0072] 具体的,业务发起方获取参与方矩阵和向量,根据发起方矩阵和向量SA和参与方矩阵和向量SB确定联合矩阵和向量S,即S=SA+SB,并将联合矩阵和向量发送至业务参与方。业务发起方根据联合矩阵和向量S和发起方权重矩阵确定发起方分块概率矩阵方分块概率矩阵中的矩阵元素为业务发起方根据联合
矩阵中的矩阵元素和联合矩阵和向量S的比值。
[0073] S250、业务参与方获取联合矩阵和向量,根据联合矩阵和向量和参与方权重矩阵确定参与方分块概率矩阵,并将参与方分块概率矩阵中的参与方传输概率矩阵发送至业务发起方,且根据参与方概率传播矩阵和参与方分块概率矩阵确定参与方更新概率矩阵。
[0074] 具体的,业务参与方从参与方权重矩阵中确定参与方目标矩阵 和并根据联合矩阵和向量和参与方目标矩阵 和 确定参与方分块概
率矩,参与方分块概率矩阵为: 和 且参与方分块概率矩阵中的矩阵元素为
参与方目标矩阵中的矩阵元素和联合矩阵和向量的比值。业务参与方将参与方分块概率矩阵中的参与方传输概率矩阵 发送至业务发起方,根据参与方分块概率矩阵对参与方概率传播矩阵TB进行更新,确定参与方更新概率矩阵 和
其中,
[0075] S260、业务发起方获取参与方传输概率矩阵,并根据参与方传输概率矩阵和发起方概率传播矩阵,确定发起方更新概率矩阵。
[0076] 具体的,业务发起方获取参与方传输概率矩阵 根据参与方传输概率矩阵对发起方概率传播矩阵TA进行更新,确定发起方更新概率矩阵 和 其中,
[0077] S270、业务发起方根据发起方更新概率矩阵和标签数据矩阵确定发起方无标签数据的目标标签,业务参与方根据参与方更新概率矩阵和标签数据矩阵确定参与方无标签数据的目标标签。
[0078] 其中,标签数据矩阵是指根据业务发起方和业务参与方的标签数据确定的矩阵。
[0079] 上述标签确定方法中,业务发起方根据发起方数据集以及业务参与方发送至业务发起方的交流数据,确定发送至业务发起方的交流数据。业务参与方根据参与方数据集,以及业务发起方发送至业务参与方的交流数据,确定业务参与方的交流数据,业务发起方根据发起方数据集和参与方交流数据确定发起方分块概率矩阵,并对发起方分块概率矩阵进行更新,确定发起方更新概率矩阵,根据发起方更新概率矩阵和标签数据矩阵确定发起方无标签数据的目标标签;业务参与方根据参与方数据集和发起方交流数据确定参与方分块概率矩阵,并对参与方分块概率矩阵进行更新,确定参与方更新概率矩阵,根据参与方更新概率矩阵和标签数据矩阵确定参与方无标签数据的目标标签。解决了在计算发起方无标签数据和参与方无标签数据的标签信息时,需要额外的中间服务器作为中间方协调并计算标签信息,存在泄露数据隐私的风险,同时需要多次调用同态加密方法计算无标签数据的标签信息,且业务发起方和业务参与方之间需要线下协商数据关系,导致标签计算效率较低,标签计算成本较高的问题。上述方案,能够在业务参与方和业务发起方之间存在共有节点的情况下,对两个社区中的无标签节点进行标签信息计算,并再标签信息计算的过程中降低泄露数据隐私的风险,提高标签信息的确定效率,降低标签信息的计算成本。
[0080] 在一个实施例中,如图6所示,业务发起方根据发起方更新概率矩阵和标签数据矩阵确定发起方无标签数据的目标标签,包括:
[0081] S310、业务发起方根据发起方更新概率矩阵确定发起方第一传输参数,并将发起方第一传输参数发送至业务参与方,并获取业务参与方发送的参与方第一传输参数。
[0082] 业务发起方确定随机参数γ,根据随机参数γ和发起方更新概率矩阵中的确定发起方第一传输参数R0,并将发起方第一传输参数R0发送至业务参与方,并获取业务参B与方发送的参与方第一传输参数E。其中,
[0083] S320、业务发起方根据参与方第一传输参数确定发起方第二传输参数,并将发起方第二传输参数发送至业务参与方,且获取业务参与方发送的参与方第二传输参数。
[0084] 业务发起方根据参与方传输参数和随机参数γ确定发起方第二传输参数R1,R1=BE/γ,并将发起方第二传输参数R1发送至业务参与方,且获取业务参与方发送的参与方第二传输参数R2,R3,R4,R5。
[0085] S330、业务发起方根据参与方第二传输参数和发起方更新概率矩阵确定发起方标签参数,以及发起方第三传输参数,并将发起方第三传输参数发送至业务参与方。
[0086] 具体的,业务发起方根据参与方第二传输参数R2,R3,R4,R5和发起方更新概率矩阵AA AC中的 确定发起方标签参数R 和R ,以及发起方第三传输参数R6、R7和R8,并将发起方第AA AC
三传输参数R6、R7和R8发送至业务参与方。其中,R 、R 、R6、R7和R8的计算公式如公式(1)、公式(2)、公式(3)、公式(4)和公式(5)所示。
[0087]
[0088]
[0089]
[0090]
[0091]
[0092] S340、业务发起方根据发起方标签参数,以及标签数据矩阵确定发起方目标参数,将发起方目标参数中的发起方传输标签发送给业务参与方,并获取业务参与方发送的参与方传输标签。
[0093] 具体的,业务发起方根据发起方标签参数RAA和RAC,以及标签数据矩阵YAB确定发起AA AC AC AC方目标参数Y 和Y ,从发起方目标参数中确定发起方传输标签Y ,将发起方传输标签Y 发BB
送给业务参与方,并获取业务参与方发送的参与方传输标签Y 。
[0094] S350、业务发起方根据发起方目标参数和参与方传输标签确定发起方无标签数据的目标标签。
[0095] 具体的,业务发起方根据发起方目标参数和参与方传输标签之和确定发起方无标签数据的候选标签,根据发起方无标签数据的候选标签的置信度,从发起方无标签数据的候选标签确定发起方无标签数据的目标标签。
[0096] 上述方案,根据发起方更新概率矩阵确定发起方第一传输参数,根据根据参与方第一传输参数确定发起方第二传输参数,根据获取的参与方第二传输参数和发起方更新概率矩阵确定确定发起方标签参数和发起方第三传输参数,根据发起方标签参数和标签数据矩阵确定发起方目标参数,根据发起方目标参数和参与方传输标签确定发起方无标签数据的目标标签,在保护业务发起方和业务参与方双方数据集合安全性的前提下,根据业务发起方和业务参与方之间的数据交流确定发起方无标签数据的目标标签,提高了在计算无标签数据的标签信息时的数据安全性,降低了对标签信息的计算成本,避免了资源浪费问题。
[0097] 在一个实施例中,业务发起方根据发起方目标参数和参与方传输标签确定发起方无标签数据的目标标签,包括:
[0098] 业务发起方根据发起方目标参数和参与方传输标签的数据和确定发起方无标签数据的候选标签,并确定发起方无标签数据的候选标签的发起方候选标签概率;业务发起方根据发起方候选标签概率从发起方无标签数据的候选标签确定发起方无标签数据的目标标签。
[0099] 其中,标签概率是指某一个候选标签出现的次数与所有候选标签出现次数的比值。
[0100] 具体的,业务发起方根据发起方目标参数YAA和参与方传输标签YBB的数据和确定uA uA AA BB发起方无标签数据的候选标签Y ,Y =Y +Y 。确定发起方无标签数据的候选标签的发起方候选标签概率,业务发起方根据发起方候选标签概率从发起方无标签数据的候选标签确
1A 1B uA uB T AA AA 1A AC AC 1A
定发起方无标签数据的目标标签。其中,YAB=[Y Y Y Y ],Y =R ×Y ,Y =R ×Y 。
[0101] 根据发起方无标签数据的候选标签的标签概率,从发起方无标签数据的候选标签中确定发起方无标签数据的目标标签,可以提高发起方无标签数据的目标标签的计算效率和可靠性。
[0102] 在一个实施例中,如图7所示,业务参与方根据参与方更新概率矩阵和标签数据矩阵确定参与方无标签数据的目标标签,包括:
[0103] S410、业务参与方获取发起方第一传输参数,根据发起方第一传输参数确定参与方第一传输参数,并将参与方传输参数发送至业务发起方。
[0104] 具体的,业务参与方获取发起方第一传输参数R0,根据发起方第一传输参数R0确定B B参与方第一传输参数E, 将参与方传输参数E 发送至业务发起
方。
[0105] S420、业务参与方获取发起方第二传输参数,根据发起方第二传输参数和参与方更新概率矩阵确定参与方第二传输参数,并将参与方第二传输参数发送给业务发起方。
[0106] 具体的,业务参与方业务参与方获取发起方第二传输参数R1,根据发起方第二传输参数R1和参与方更新概率矩阵确定参与方第二传输参数R2,R3,R4,R5,并将参与方第二传输参数R2,R3,R4,R5发送给业务发起方。
[0107] S430、业务参与方获取发起方第三传输参数,根据发起方第三传输参数和参与方更新概率矩阵确定参与方标签参数。
[0108] 具体的,业务参与方获取发起方第三传输参数R6、R7和R8,根据发起方第三传输参BB BD BB BD数R6、R7和R8,以及参与方更新概率矩阵确定参与方标签参数R 和R 。其中,R 和R 的计算公式如公式(6)和公式(7)所示:
[0109]
[0110]
[0111] S440、业务参与方根据参与方标签参数,以及标签数据矩阵确定参与方目标参数,从参与方目标参数中确定参与方传输标签,将参与方传输标签发送至业务发起方。
[0112] 具体的,业务参与方根据参与方标签参数RBB和RBD,以及标签数据矩阵YAB确定参与BB BD BB BB方目标参数Y 和Y ,从参与方目标参数中确定参与方传输标签Y ,将参与方传输标签Y 发lA lB uA uB T BB BB lB BD BD lB
送至业务发起方。其中,YAB=[Y Y Y Y ],Y =R ×Y ,Y =R ×Y 。
[0113] S450、业务参与方获取发起方传输标签,根据参与方目标参数和发起方传输标签确定参与方无标签数据的目标标签。
[0114] 具体的,业务参与方获取发起方传输标签YAC,根据参与方目标参数YBD和发起方传AC输标签Y 之和确定参与方无标签数据的目标标签。
[0115] 上述方案,在保护业务发起方和业务参与方双方数据集合安全性的前提下,根据业务发起方和业务参与方之间的数据交流确定参与方无标签数据的目标标签,提高了在计算参与方无标签数据的标签信息时的数据安全性,降低了对标签信息的计算成本,避免了资源浪费问题。
[0116] 在一个实施例中,业务参与方获取发起方传输标签,根据参与方目标参数和发起方传输标签确定参与方无标签数据的目标标签,包括:
[0117] 业务参与方根据参与方目标参数和参与方传输标签的数据和确定参与方无标签数据的候选标签,并确定参与方无标签数据的候选标签的参与方候选标签概率;业务参与方根据参与方候选标签概率从参与方无标签数据的候选标签确定参与方无标签数据的目标标签。
[0118] 具体的,业务参与方根据参与方目标参数YBD和发起方传输标签YAC的数据和确定uB uB AC BD参与方无标签数据的候选标签Y ,Y =Y +Y 。确定参与方无标签数据的候选标签的发起方候选标签概率,业务参与方根据参与方候选标签概率从参与方无标签数据的候选标签确定参与方无标签数据的目标标签。
[0119] 上述方案,根据参与方无标签数据的候选标签的标签概率,从参与方无标签数据的候选标签中确定参与方无标签数据的目标标签,可以提高参与方无标签数据的目标标签的计算效率和可靠性。
[0120] 在一个实施例中,业务参与方获取发起方第二传输参数,根据发起方第二传输参数和参与方更新概率矩阵确定参与方第二传输参数,并将参与方第二传输参数发送给业务发起方,包括:
[0121] 业务参与方获取发起方第二传输参数,根据发起方第二传输参数和参与方更新概率矩阵确定发起方参数计算因子;根据发起方参数计算因子和参与方更新概率矩阵确定参与方第二传输参数,并将参与方第二传输参数发送给业务发起方。
[0122] 具体的,业务参与方获取发起方第二传输参数R1,根据发起方第二传输参数R1和参与方更新概率矩阵确定发起方参数计算因子E, 根据发起方参数计算因子E和参与方更新概率矩阵确定参与方第二传输参数R2,R3,R4,R5。其中,[0123] 上述方案,根据发起方第二传输参数和参与方更新概率矩阵确定发起方参数计算因子,根据发起方参数计算因子和参与方更新概率矩阵确定参与方第二传输参数,能够使得参与方第二传输参数可以包含发起方数据相关信息和参与方数据相关信息,以使业务发起方根据参与方第二传输参数确定参与方无标签数据的目标标签时,可以获取到准确度较高的参与方无标签数据的目标标签。
[0124] 在一个实施例中,业务参与方根据参与方拓扑结构确定参与方权重矩阵,包括:
[0125] 业务参与方根据参与方本地数据关系矩阵确定参与方拓扑结构;业务参与方根据参与方拓扑结构确定参与方拓扑边长度,并根据参与方拓扑边长度和权重计算系数确定参与方拓扑边权重,且根据参与方拓扑边权重确定参与方权重矩阵。
[0126] 上述方案,根据参与方拓扑结构确定参与方拓扑边长度,并根据参与方拓扑边长度和权重计算系数确定参与方拓扑边权重,根据参与方拓扑边权重确定参与方权重矩阵,可以提高参与方拓扑边权重的计算效率和精确度,以进一步的提高参与方权重矩阵的可靠性。
[0127] 在一个实施例中,根据发起方拓扑结构确定发起方权重矩阵,包括:
[0128] 业务发起方根据发起方本地数据关系矩阵确定发起方拓扑结构;业务发起方根据发起方拓扑结构确定发起方拓扑边长度,并根据发起方拓扑边长度和权重计算系数确定发起方拓扑边权重,且根据发起方拓扑边权重确定发起方权重矩阵。
[0129] 上述方案,根据发起方拓扑结构确定发起方拓扑边长度,根据发起方拓扑边长度和权重计算系数确定发起方拓扑边权重,根据发起方拓扑边权重确定发起方权重矩阵,可以提高发起方拓扑边权重的计算效率和精确度,以进一步的提高发起方权重矩阵的可靠性。
[0130] 在一个实施例中,如图8所示,业务发起方根据发起方更新概率矩阵和标签数据矩阵YAB确定发起方无标签数据的目标标签,业务参与方根据参与方更新概率矩阵和标签数据矩阵YAB确定参与方无标签数据的目标标签之前,还包括:
[0131] S510、业务发起方对发起方数据集和参与方数据集进行隐私求并,确定业务发起方和业务参与方的标签数据集合。
[0132] 其中,标签数据集合可以用CAB表示。
[0133] S520、根据发起方数据集的数据量、参与方数据集的数据量和标签数据集合确定标签数据矩阵。
[0134] 具体的,根据发起方数据集的数据量nA、参与方数据集的数据量nB和标签数据集合lA lB uA uB TCAB确定标签数据矩阵YAB。YAB∈(nA+nB)×CAB,且YAB=[Y Y Y Y ]。
[0135] 上述方案,根据发起方数据集的数据量、参与方数据集的数据量和标签数据集合确定标签数据矩阵,可以提高标签数据矩阵的计算效率和准确度。
[0136] 在一个实施例中,业务发起方获取参与方矩阵传输因子,根据发起方拓扑结构确定发起方权重矩阵,根据发起方权重矩阵对发起方无标签数据进行传播因子计算,确定发起方概率传播矩阵,根据参与方矩阵传输因子和发起方权重矩阵确定发起方联合矩阵因子,并根据发起方权重矩阵确定发起方矩阵和向量,包括:
[0137] 业务发起方获取参与方矩阵传输因子,根据发起方拓扑结构确定发起方权重矩阵,根据发起方权重矩阵对发起方无标签数据进行传播因子计算,确定发起方概率传播矩阵;业务发起方根据参与方矩阵传输因子和发起方权重矩阵确定发起方联合矩阵因子,并从发起方权重矩阵中确定发起方求和矩阵;业务发起方对发起方求和矩阵按行求和确定发起方矩阵和向量。
[0138] 具体的,业务发起方获取参与方矩阵传输因子 和 根据参与方矩阵传输因子 和发起方权重矩阵中的发起方矩阵因子
生成发起方联合矩阵因子 与 业务发起方获取根据发起
方拓扑结构确定发起方权重矩阵,根据发起方权重矩阵对发起方无标签数据进行传播因子计算,确定发起方概率传播矩阵。从发起方权重矩阵中确定定发起方求和矩阵,发起方求和矩阵包括 对发起方求和矩阵按行求和确定发起方矩阵和向量
SA,即
[0139] 上述方案,提供了一种发起方矩阵和向量的计算方法,根据参与方矩阵传输因子和发起方权重矩阵确定发起方联合矩阵因子,并从发起方权重矩阵中确定发起方求和矩阵,对发起方求和矩阵按行求和确定发起方矩阵和向量,提高了发起方联合矩阵因子的计算效率。
[0140] 示例性的,在上述实施例的基础上,标签确定方法包括:
[0141] 业务发起方联合业务参与方进行发起方数据和参与方数据的隐私求交,确定业务发起方和业务参与方的联合数据交集DP,业务发起方的发起方全量数据中除联合数据集交集DP之外的发起方独有数据为DAP,业务参与方的参与方全量数据中除数据集交集DP之外的参与方独有数据为DBP。
[0142] 业务发起方联合业务参与方对联合数据交集DP中的有标签数据进行隐私求交,确定有标签数据交集,并确定有标签数据交集中的标签数据编号,业务发起方根据有标签数据交集和发起方有标签数据生成发起方标签数据列表;业务参与方根据有标签数据交集和参与方有标签数据生成参与方标签数据列表。
[0143] 业务发起方联合业务参与方进行数据重排,将发起方全量数据和参与方全量数据中的数据执行序号排列,生成数据排列名单 且数据排列名单在业务发起方和业务参与方之间共享。
[0144] 数据排列名单中的数据排列顺序依次为:业务发起方发起方全量数据中独有的发起方标签数据 数据集交集DP中业务发起方独有的发起方标签数据 数据集交集DP中业务发起方和业务参与方共有的标签数据 数据集交集DP中业务参与方独有的参与方标签数据 业务参与方参与方全量数据中独有的标签数据 发起方全量数据中的发起方无标签数据 数据集交集DP中业务发起方的无标签数据和业务参与方的无标签数据 参与方全量数据中的参与方无标签数据 业务发起方和业务参与方分别对参与方数据集和发起方数据集进行隐私求并,确定业务发起方和业务参与方的标签数据集合,根据标签数据集合生成标签数据矩阵。业务发起方根据发起方拓扑结构确定发起方拓扑边权重,业务参与方根据参与方拓扑结构确定参与方拓扑边权重。业务发起方根据数据排列名单整理发起方拓扑边权重,确定发起方权重矩阵;业务参与方根据数据排列名单整理参与方拓扑边权重,确定参与方权重矩阵。
[0145] 业务发起方根据发起方拓扑边权重对发起方无标签数据 执行传播因子计算,生成发起方概率传播矩阵。业务参与方根据参与方拓扑边权重对参与方无标签数据 执行传播因子计算,生成参与方概率传播矩阵。
[0146] 业务参与方根据参与方权重矩阵确定参与方矩阵传输因子,并将矩阵传输因子发送至业务发起方。业务发起方根据参与方矩阵传输因和发起方权重矩阵中的发起方矩阵因子生成发起方联合矩阵因子。业务发起方从发起方权重矩阵中确定发起方求和矩阵,并对发起方求和矩阵按行求和确定发起方矩阵和向量。
[0147] 业务参与方从参与方权重矩阵中确定参与方求和矩阵,并对参与方求和矩阵按行求和确定参与方矩阵和向量,并将参与方矩阵和向量发送至业务发起方。业务发起方获取参与方矩阵和向量,并对发起方矩阵和向量和参与方矩阵和向量进行求和,确定联合矩阵和向量,并将联合矩阵和向量发送至业务参与方。
[0148] 业务发起方从发起方权重矩阵中确定发起方目标矩阵,并根据联合矩阵和向量和发起方目标矩阵确定发起方分块概率矩阵。业务参与方从参与方权重矩阵中确定参与方目标矩阵,并根据联合矩阵和向量和参与方目标矩阵确定参与方分块概率矩阵。业务参与方从参与方分块概率矩阵中确定参与方传输概率矩阵,并将参与方传输概率矩阵发送至业务发起方。业务发起方根据发起方概率传播矩阵和参与方传输概率矩阵确定发起方更新概率矩阵;业务参与方根据参与方概率传播矩阵和参与方分块概率矩阵确定参与方更新概率矩阵。
[0149] 业务发起方确定随机参数,根据随机参数和发起方更新概率矩阵中的,确定发起方第一传输参数,并将发起方第一传输参数发送至业务参与方;业务参与方根据发起方第一传输参数确定参与方第一传输参数,并将参与方第一传输参数发送至业务发起方;业务发起方根据参与方传输参数和随机参数确定发起方第二传输参数,并将发起方第二传输参数发送至业务参与方;业务参与方根据发起方第二传输参数和参与方更新概率矩阵确定参与方第二传输参数,并将参与方第二传输参数发送给业务发起方;业务发起方根据参与方第二传输参数和发起方更新概率矩阵确定发起方标签参,以及发起方第三传输参数,并将发起方第三传输参数发送至业务参与方;业务参与方根据发起方第三传输参数确定参与方标签参数。业务发起方根据发起方标签参数,以及标签数据矩阵确定发起方目标参数,从发起方目标参数中确定发起方传输标签,将发起方传输标签发送给业务参与方;业务参与方根据参与方标签参数,以及标签数据矩阵确定参与方目标参数,从参与方目标参数中确定参与方传输标签,将参与方传输标签发送至业务发起方。业务发起方获取参与方传输标签,根据发起方目标参数和参与方传输标签确定发起方无标签数据的目标标签;业务参与方获取发起方传输标签,根据参与方目标参数和发起方传输标签确定参与方无标签数据的目标标签。
[0150] 上述标签确定方法中,业务发起方根据发起方数据集,以及业务参与方发送至业务发起方的交流数据,确定发送至业务发起方的交流数据。业务参与方根据参与方数据集,以及业务发起方发送至业务参与方的交流数据,确定业务参与方的交流数据,业务发起方根据发起方数据集和参与方交流数据确定发起方分块概率矩阵,并对发起方分块概率矩阵进行更新,确定发起方更新概率矩阵,根据发起方更新概率矩阵和标签数据矩阵确定发起方无标签数据的目标标签;业务参与方根据参与方数据集和发起方交流数据确定参与方分块概率矩阵,并对参与方分块概率矩阵进行更新,确定参与方更新概率矩阵,根据参与方更新概率矩阵和标签数据矩阵确定参与方无标签数据的目标标签。解决了在计算发起方无标签数据和参与方无标签数据的标签信息时,需要额外的中间服务器作为中间方协调并计算标签信息,存在泄露数据隐私的风险,同时需要多次调用同态加密方法计算无标签数据的标签信息,且业务发起方和业务参与方之间需要线下协商数据关系,导致标签计算效率较低,标签计算成本较高的问题。上述方案,能够在业务参与方和业务发起方之间存在共有节点的情况下,对两个社区中的无标签节点进行标签信息计算,并再标签信息计算的过程中降低泄露数据隐私的风险,提高标签信息的确定效率,降低标签信息的计算成本。
[0151] 应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0152] 以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0153] 以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。