首页 / 平台奖励信息确定方法、装置、设备以及存储介质

平台奖励信息确定方法、装置、设备以及存储介质实质审查 发明

技术领域

[0001] 本申请实施例涉及计算机技术领域,尤其涉及一种平台奖励信息确定方法、装置、设备以及存储介质。

相关背景技术

[0002] 随着网络技术的快速发展,智能终端可以集成越来越多的功能,提供越来越多的互联网应用程序。用户可以通过应用程序体验相关平台提供的不同服务,提高生活体验。由于应用程序的数量众多,相关平台为了提升用户留存率以及用户活跃时长,往往会设置有奖励机制。例如,通过向用户提供奖品、积分或者优惠券等,增加用户的粘性,提高用户的参与度。
[0003] 相关技术中不同平台根据其运营目标设置有不同的用户奖励机制。其中,一些平台通过设置简单的用户匹配规则,直接向大范围的用户发放各种奖励,其与目标群体的匹配度较差,导致奖励效果无法达到预期,效率较低;一些平台通过判断用户等级高低等方式提供奖励,无法同时满足新用户和追求利益的高等级用户的潜在需求;一些平台通过利用算法预测用户的转化率,并向转化率较高的用户下发奖励,然而,存在转化率较高的用户不需要奖励,其匹配度依然较差,导致下发的奖励无法达到预期奖励效果。

具体实施方式

[0031] 下面结合附图和实施例对本申请实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请实施例,而非对本申请实施例的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请实施例相关的部分而非全部结构。
[0032] 本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0033] 本申请实施例提供的平台奖励信息确定方法,可以通过使用目标回归模型计算目标用户群体中每个目标用户的奖励得分,确定可达到预期奖励效果的目标用户名单,并且为目标用户名单配置其群体标识符对应的最优奖励,可以为操作平台提供准确的平台奖励信息,有利于提高奖励效率,达到预期奖励效果。该方法可以应用于需要进行大规模奖励下发的应用平台,以社交娱乐类平台为示例,相关应用场景可以包括视频直播、语音聊天、短视频等,前述罗列的几种应用场景仅是示例性和解释性的,在实际应用中,还可以在其他场景下的实时通信中用到该平台奖励信息确定方法,本申请实施例对此不作限定。
[0034] 图1为本申请实施例提供的一种平台奖励信息确定方法的流程图。该平台奖励信息确定方法应用于后台服务器,其中,平台奖励信息包括需要下发奖励的目标用户和对应的奖励内容,如图1所示,包括如下步骤:
[0035] 步骤S101、获取预设收益目标对应的目标用户群体,基于设置的对应预设收益目标的目标回归模型,计算目标用户群体中的每个目标用户对应的奖励得分。
[0036] 其中,开发人员根据不同目标用户群体的用户行为、用户价值、用户需求等特性,可以对应设置不同的收益目标。在一个实施例中,目标用户群体可以是累计注册时间较短的新用户,新用户通常处于成长期,需要对于相关应用产品进行探索和熟悉,例如,了解产品功能、界面和操作流程。因而,考虑到新用户主要着重于为应用带来新的流量和关注度,对于新用户的预设收益目标可以是提高其在线时长、上线频率等。在一个实施例中,目标用户群体可以是累计注册时间较长的老用户,老用户是已经对应用有一定了解和熟悉度的用户,访问频率相对较高,可能会倾向于深入探索和使用其高级功能或特色服务。因而,考虑到老用户主要着重于为应用带来稳定的流量和收入,对于老用户的预设收益目标可以是提高其付费金额、服务订阅数量等。当然,前述设置的预设收益目标以及目标用户群体仅为示例性描述,开发人员还可以根据实际应用场景的运营目标以及用户特性进行适应性设置,在此本申请不作限定。此外,每个预设收益目标可以设置有对应的目标回归模型,该目标回归模型可以是预先基于样本用户群体的特征信息和历史收益信息进行构建的线性回归模型,通过结合样本用户群体的特征信息、接受奖励前的收益信息以及接受奖励后的收益信息等进行函数关系拟合,可以用于预测目标用户接受奖励后收益的提升程度。通过目标回归模型计算每个目标用户对应的奖励得分,该奖励得分可以用于表征目标用户接受奖励后相比于接收奖励前的收益增量,奖励得分越高,目标用户接受奖励后的收益增幅越大。
[0037] 步骤S102、基于满足奖励得分大于第一预设阈值的目标用户构建目标用户名单。
[0038] 其中,第一预设阈值可以用于判断对目标用户下发奖励是否可以产生预期的收益,具体可以由开发人员根据实际应用场景的运营目标以及收益需求进行适应性设置,在此本申请不作限定。若目标用户的奖励得分小于或等于第一预设阈值,可以视为对该目标用户下发奖励,可能产生的收益较低,无法达到预期奖励效果。若目标用户的奖励得分大于第一预设阈值,可以视为对该目标用户下发奖励,可能产生的收益较高,可以达到预期奖励效果。因而,可以从目标用户群体中筛选出奖励得分大于第一预设阈值的目标用户,进而构建得到目标用户名单,该目标用户名单可以是覆盖需要下发奖励的所有目标用户。
[0039] 步骤S103、根据目标用户群体的群体标识符进行查询,确定对应目标用户群体预先配置的最优奖励。
[0040] 其中,群体标识符可以是用于区分对应不同收益目标的目标用户群体,例如,用于区分新用户群体和老用户群体,又例如,用于区分不同年龄段、不同地区等其他维度的用户群体,在此本申请不作限定。本申请实施例中,每个目标用户群体可以对应设置有试验用户群体,对于试验用户群体可以预先设置线上AB试验进行不同奖励的投放测试。在一个实施例中,可以对试验用户群体分批投放不同类型的奖励,例如,积分、优惠券、红包等,也可以对试验用户群体分批投放不同数量或不同金额的同种类型奖励,并将统计不同批次投放奖励后对应得到的累计收益进行比对,确定符合试验用户群体的最优奖励。在一个实施例中,可以预先存储有群体标识符与最优奖励的映射关系,用于记录与每个群体标识符对应的目标用户群体匹配度最高的最优奖励,其中,映射关系可以是通过字典、哈希表等形式存储,在此本申请不作限定。由此,根据目标用户群体的群体标识符查询存储的映射关系,可以确定该群体标识符对应的最优奖励,最大程度确保奖励的投放效果。
[0041] 步骤S104、将目标用户名单和最优奖励反馈至操作平台,以使操作平台通过下发系统向目标用户名单中的用户下发最优奖励。
[0042] 其中,后台服务器通过步骤S101‑步骤S103的相关计算得到每个预设收益目标对应的平台奖励信息后,可以将该平台奖励信息反馈至操作平台,其中,平台奖励信息包括目标用户名单和最优奖励。在一个实施例中,可以设置有多个预设收益目标,后台服务器可以计算得到每个预设收益目标对应的目标用户群体的平台奖励信息,并将得到的平台奖励信息反馈至操作平台。在一个实施例中,考虑到用户的数量流动和成长变化,每个预设收益目标对应的目标用户群体的成员组成可能会有变化,因而,可以设置有周期时间节点,每当达到设定周期时间节点的情况下,后台服务器可以计算得到每个预设收益目标对应的目标用户群体的平台奖励信息,并将得到的平台奖励信息反馈至操作平台,其中,周期时间节点可以是每日、每周等。在一个实施例中,操作平台接收到目标用户名单和最优奖励后,可以定时将该目标用户名单和最优奖励传输至下发系统,完成向目标用户名单中的用户下发最优奖励。在一个实施例中,操作平台接收到目标用户名单和最优奖励后,可以将目标用户名单和最优奖励进行可视化展示,以方便运营人员根据实际业务情况进行平台奖励信息的核对,并判断是否向目标用户名单下发最优奖励。操作平台在接收到运营人员的确认操作的情况下,可以将目标用户名单和最优奖励传输至下发系统,完成向目标用户名单中的用户下发最优奖励。
[0043] 上述,通过获取预设收益目标对应的目标用户群体,基于设置的对应预设收益目标的目标回归模型,计算目标用户群体中的每个目标用户对应的奖励得分;基于满足奖励得分大于第一预设阈值的目标用户构建目标用户名单;根据目标用户群体的群体标识符进行查询,确定对应目标用户群体预先配置的最优奖励;将目标用户名单和最优奖励反馈至操作平台,以使操作平台通过下发系统向目标用户名单中的用户下发最优奖励。上述方案中,通过基于设置的目标回归模型计算目标用户群体中的每个目标用户对应的奖励得分,可以有效评估每个目标用户的预期奖励效果;通过基于满足奖励得分大于第一预设阈值的目标用户构建目标用户名单,可以合理筛选出能够产生较好奖励效果的目标用户,提高奖励效率;通过根据目标用户群体的群体标识符匹配基于AB试验结果确定的最优奖励,可以有效提供与目标用户群体的匹配度最高的奖励,保障目标用户的奖励效果,有利于提高平台收益。
[0044] 图2为本申请实施例提供的一种包含构建目标回归模型的过程的平台奖励信息确定方法的流程图。如图2所示,包括如下步骤:
[0045] 步骤S201、获取预设收益目标对应的样本用户群体,对样本用户群体进行预设分组处理,确定已接受奖励的处理组用户和未接受奖励的对照组用户。
[0046] 其中,样本用户群体可以是与预设收益目标相匹配的已有用户群体中抽样得到的。该预设分组处理可以是根据用户历史是否已接受奖励的划分标准,从样本用户群体中按照预设规则分出已接受奖励的处理组用户和未接受奖励的对照组用户。在一个实施例中,可以按照预设数量比例直接从样本用户群体中抽取处理组用户和对照组用户。在一个实施例中,可以先将样本用户群体划分为已接受奖励的处理组用户和未接受奖励的候选对照组用户,然后通过计算倾向性评分、相似度等指标从候选对照组用户中筛选出与每个处理组用户的特征最相似的用户,从而得到与处理组用户相匹配的对照组用户。
[0047] 步骤S202、基于处理组用户对应的第一特征信息和第一收益信息,以及对照组用户对应的第二特征信息和第二收益信息,构建目标回归模型,其中,目标回归模型用于输出目标用户的奖励得分。
[0048] 其中,第一特征信息可以是描述每个处理组用户的属性、行为、偏好、需求等的关键特征数据,例如,用户在30天、14天、7天等不同时间范围内累计的活跃行为或消费行为、用户地理位置、用户性别等,具体可以由开发人员根据预设收益目标需要参考的相关用户特征进行适应性设置,在此本申请不作限定。第一收益信息可以是每个处理组用户已接受奖励的情况下的收益统计数据,例如,付费金额、上线时长等。第二特征信息可以是描述每个处理组用户的属性、行为、偏好、需求等的关键特征数据,该第二特征信息的特征类型与第一特征信息相同。第二收益信息可以是每个对照组用户未接受奖励的情况下的收益统计数据。因而,处理组用户对应的第一特征信息和第一收益信息,以及对照组用户对应的第二特征信息和第二收益信息,可以有效表征用户接受奖励前后的收益增量变化。在一个实施例中,可以结合XGBoost(Extreme Gradient Boosting,极限梯度提升)、LightGBM(Light Gradient Boosting Machine,轻量梯度增强机)等算法,基于处理组用户对应的第一特征信息和第一收益信息,以及对照组用户对应的第二特征信息和第二收益信息,构建对应的目标回归模型,该目标回归模型可以是单线性回归模型、双重线性回归模型等,在此本申请不作限定。其中,该目标回归模型可以输出目标用户的奖励得分,该奖励得分可以用于表征目标用户接受奖励后相比于接收奖励前的收益增量,奖励得分越高,目标用户接受奖励后的收益增幅越大。
[0049] 在一个实施例中,构建的目标回归模型可以是双重线性回归模型,具体过程如下:
[0050] 根据处理组用户对应的第一特征信息和第一收益信息,构建第一回归模型;
[0051] 根据对照组用户对应的第二特征信息和第二收益信息,构建第二回归模型;
[0052] 将第一回归模型与第二回归模型作差得到目标回归模型。
[0053] 其中,第一回归模型可以用于预测目标用户接收奖励的情况下产生的第一收益,第二回归模型可以用于预测目标用户未接受奖励的情况下产生的第二收益。通过将第一回归模型与第二回归模型作差可以得到目标回归模型,可以理解为该目标回归模型利用第一收益与第二收益的收益差值信息计算得到奖励得分,该奖励得分可以用于表征目标用户目标用户接受奖励后相比于接收奖励前的收益增量。
[0054] 示例的,目标回归模型的函数表达式如下:
[0055] m1(x)=f(X0,Y0)
[0056] m2(x)=f(X1,Y1)
[0057] τ=m1(x)‑m2(x)
[0058] 其中,m1(x)为基于处理组用户对应的第一特征信息和第一收益信息进行构建得到的第一回归模型,m2(x)为基于对照组用户对应的第二特征信息和第二收益信息进行构建得到的第二回归模型,τ为奖励得分,x为目标用户的输入特征信息。相比于单线性回归模型,双重线性回归模型的精度更高,可以更好地捕捉非线性信号,更有利于准确预测用户的奖励得分。
[0059] 步骤S203、获取预设收益目标对应的目标用户群体,基于设置的对应预设收益目标的目标回归模型,计算目标用户群体中的每个目标用户对应的奖励得分。
[0060] 步骤S204、基于满足奖励得分大于第一预设阈值的目标用户构建目标用户名单。
[0061] 步骤S205、根据目标用户群体的群体标识符进行查询,确定对应目标用户群体预先配置的最优奖励。
[0062] 步骤S206、将目标用户名单和最优奖励反馈至操作平台,以使操作平台通过下发系统向目标用户名单中的用户下发最优奖励。
[0063] 上述,通过从样本用户群体中分出已接受奖励的处理组用户和未接受奖励的对照组用户,可以有效梳理出用户接受奖励前后的收益变化数据,为构建目标回归模型提供可靠的参考数据;通过利用处理组用户和对照组用户分别对应的特征信息和收益信息构建目标回归模型,可以有效确定特性信息与收益变化的对应关系,得到准确预测目标用户接受奖励后的收益变化程度的目标回归模型。
[0064] 图3为本申请实施例提供的一种包含分组确定处理组用户和对照组用户的过程的平台奖励信息确定方法的流程图。如图3所示,包括如下步骤:
[0065] 步骤S301、获取预设收益目标对应的样本用户群体,基于设置的倾向性模型计算样本用户群体中的每个样本用户的倾向性评分。
[0066] 其中,倾向性模型可以是基于PSM(Propensity Score Matching,倾向得分匹配)算法预先设置的,该倾向性模型可以是多元概率比回归模型、逻辑回归模型等,在此本申请不作限定。该倾向性评分可以用于表征每个样本用户接受奖励的概率。
[0067] 步骤S302、将样本用户群体中的多个样本用户划分为已接受奖励的处理组用户和未接受奖励的候选对照组用户。
[0068] 步骤S303、从候选对照组用户中筛选出每个处理组用户对应的倾向性评分最接近的对照组用户。
[0069] 其中,对照组用户的倾向性评分与处理组用户的倾向性评分越接近,该对照组用户与处理组用户的特征相似程度越高。
[0070] 步骤S304、基于处理组用户对应的第一特征信息和第一收益信息,以及对照组用户对应的第二特征信息和第二收益信息,构建目标回归模型,其中,目标回归模型用于输出目标用户的奖励得分。
[0071] 步骤S305、获取预设收益目标对应的目标用户群体,基于设置的对应预设收益目标的目标回归模型,计算目标用户群体中的每个目标用户对应的奖励得分。
[0072] 步骤S306、基于满足奖励得分大于第一预设阈值的目标用户构建目标用户名单。
[0073] 步骤S307、根据目标用户群体的群体标识符进行查询,确定对应目标用户群体预先配置的最优奖励。
[0074] 步骤S308、将目标用户名单和最优奖励反馈至操作平台,以使操作平台通过下发系统向目标用户名单中的用户下发最优奖励。
[0075] 上述,通过基于计算得到的倾向性评分进行处理组用户和对照组用户的匹配,可以提高处理组用户与对照组用户的特征相似程度,两者对应的特征信息和收益信息可以更有效反映特征接近的用户接受奖励前后的收益变化,有利于为构建目标回归模型提供更准确的基础数据。
[0076] 图4为本申请实施例提供的一种包含建立群体标识符与最优奖励的映射关系的过程的平台奖励信息确定方法的流程图。如图4所示,包括如下步骤:
[0077] 步骤S401、基于设置的AB试验确定预设收益目标对应的多个目标试验用户的最优奖励。
[0078] 其中,通过设置的AB试验可以对多个目标试验用户进行分批下发不同的奖励,并统计得到目标试验用户接受奖励后产生的收益,可以确定匹配于预设收益目标的最优奖励。具体下发的奖励类型、用户分批方式以及收益统计方式可以由开发人员根据实际应用场景的收益需求以及测试需求进行适应性设置,在此本申请不作限定。
[0079] 步骤S402、建立预设收益目标对应的群体标识符与最优奖励的映射关系。
[0080] 其中,每个预设收益目标设置有对应的群体标识符,该群体标识符可以用于标识与预设收益目标相匹配的目标用户群体。该映射关系可以用于记录每个群体标识符对应关联的最优奖励,便于后续平台正式运营过程中查询目标用户群体对应的最优奖励。
[0081] 步骤S403、获取预设收益目标对应的目标用户群体,基于设置的对应预设收益目标的目标回归模型,计算目标用户群体中的每个目标用户对应的奖励得分。
[0082] 步骤S404、基于满足奖励得分大于第一预设阈值的目标用户构建目标用户名单。
[0083] 步骤S405、根据目标用户群体的群体标识符进行查询,确定对应目标用户群体预先配置的最优奖励。
[0084] 步骤S406、将目标用户名单和最优奖励反馈至操作平台,以使操作平台通过下发系统向目标用户名单中的用户下发最优奖励。
[0085] 上述,通过设置的AB试验确定多个目标试验用户的最优奖励,可以有效确定与目标用户群体匹配度最高的最优奖励;通过建立群体标识符与最优奖励的映射关系,可以准确存储不同目标用户群体和最优奖励的对应关系,有利于提高平台下发奖励的效率。
[0086] 图5为本申请实施例提供的一种包含确定目标试验用户的过程的平台奖励信息确定方法的流程图。如图5所示,包括如下步骤:
[0087] 步骤S501、获取预设收益目标对应的试验用户群体,基于预先构建的对应预设收益目标的目标回归模型,计算试验用户群体中每个试验用户对应的奖励得分。
[0088] 其中,为了更有效统计不同奖励对于试验用户的收益影响大小,可以预先使用目标回归模型计算每个试验用户对应的奖励得分,评估每个试验用户接受奖励后的收益变化水平。
[0089] 步骤S502、从试验用户群体中筛选出满足奖励得分大于第二预设阈值的多个目标试验用户。
[0090] 其中,第二预设阈值可以用于判断对试验用户下发奖励是否可以产生预期的收益,具体可以由开发人员根据实际应用场景的运营目标以及收益需求进行适应性设置,在此本申请不作限定。若试验用户的奖励得分大于第二预设阈值,可以视为该试验用户接受奖励后对应的收益增幅较大,可以有利于统计确定下发不同奖励对应的收益差异。
[0091] 步骤S503、基于设置的AB试验确定预设收益目标对应的多个目标试验用户的最优奖励。
[0092] 步骤S504、建立预设收益目标对应的群体标识符与最优奖励的映射关系。
[0093] 步骤S505、获取预设收益目标对应的目标用户群体,基于设置的对应预设收益目标的目标回归模型,计算目标用户群体中的每个目标用户对应的奖励得分。
[0094] 步骤S506、基于满足奖励得分大于第一预设阈值的目标用户构建目标用户名单。
[0095] 步骤S507、根据目标用户群体的群体标识符进行查询,确定对应目标用户群体预先配置的最优奖励。
[0096] 步骤S508、将目标用户名单和最优奖励反馈至操作平台,以使操作平台通过下发系统向目标用户名单中的用户下发最优奖励。
[0097] 上述,通过基于目标回归模型计算每个试验用户对应的奖励得分,并筛选出满足奖励得分大于第二预设阈值的多个目标试验用户,可以有利于筛选出奖励效果较好的目标试验用户进行AB试验,有利于更准确统计下发不同奖励的收益差距,合理评估不同奖励的奖励效果。
[0098] 图6为本申请实施例提供的一种包含基于AB试验确定最优奖励的过程的平台奖励信息确定方法的流程图。如图6所示,包括如下步骤:
[0099] 步骤S601、将预设收益目标对应的多个目标试验用户按照预设比例划分为非奖励组和预设数量的多个奖励组,向每个奖励组配置不同的奖励。
[0100] 其中,为了有效验证是否下发奖励以及下发不同奖励对于目标试验用户的收益影响,可以将多个目标试验用户按照预设比例随机划分为非奖励组和预设数量的多个奖励组。其中,预设比例可以是每个组别的人数占比,例如,设置有两个奖励组和一个非奖励组,预设比例可以是4:4:2,则每个奖励组分配有40%的目标试验用户,非奖励组分配有20%的目标试验用户。此外,每个奖励组配置有不同的奖励,组别之间互相独立,可以用于验证不同奖励的奖励效果。当然,前述预设比例以及分组数量仅为示例性描述,开发人员可以根据实际应用场景的测试需求以及奖励类型进行适应性调整,在此本申请不作限定。
[0101] 步骤S602、统计预设时间范围内非奖励组以及每个奖励组分别对应的累计收益。
[0102] 其中,向每个奖励组的目标试验用户下发对应的奖励后,可以统计预设时间范围内每个组别累计产生的收益,该预设时间范围可以是一周、两周、一个月等,在此本申请不作限定。例如,预设收益目标为提高付费金额,可以统计非奖励组和每个奖励组在预设时间范围内产生的累计付费金额,又例如,预设收益目标为提高活跃度,可以统计非奖励组和每个奖励组在预设时间范围内的累计上线时长。
[0103] 步骤S603、根据统计得到的累计收益确定满足收益最大化的最优奖励。
[0104] 其中,统计得到非奖励组和奖励组的累计收益后,可以进行累计收益比对确定最优奖励。在一个实施例中,设置有奖励组A1、奖励组B1和非奖励组C1,统计得到奖励组A1对应的累计收益为a1,奖励组B1对应的累计收益为b1,非奖励组C1对应的累计收益为c1,若分配目标试验用户的预设比例为1:1:1,可以直接将累计收益a1、累计收益b1以及累计收益c1进行比对。其中,在累计收益a1和累计收益b1均大于累计收益c1的情况下,若累计收益a1大于累计收益b1,可以将奖励组A1对应配置的奖励确定为最优奖励,若累计收益a1小于累计收益b1,可以将奖励组B1对应配置的奖励确定为最优奖励。在累计收益a1和累计收益b1均小于累计收益c1的情况下,可以视为设置的奖励无法达到预期奖励效果。在一个实施例中,设置有奖励组A2、奖励组B2和非奖励组C2,统计得到奖励组A2对应的累计收益为a2,奖励组B2对应的累计收益为b2,非奖励组C2对应的累计收益为c2,若分配目标试验用户的预设比例为4:4:2,为了平衡不同组别的用户数量差异,可以将累计收益a2、累计收益b2以及两倍的累计收益c2进行比对。其中,在累计收益a2和累计收益b2均大于两倍的累计收益c2的情况下,若累计收益a2大于累计收益b2,可以将奖励组A2对应配置的奖励确定为最优奖励,若累计收益a2小于累计收益b2,可以将奖励组B2对应配置的奖励确定为最优奖励。在累计收益a2和累计收益b2均小于两倍的累计收益c2的情况下,可以视为设置的奖励无法达到预期奖励效果。
[0105] 步骤S604、建立预设收益目标对应的群体标识符与最优奖励的映射关系。
[0106] 步骤S605、获取预设收益目标对应的目标用户群体,基于设置的对应预设收益目标的目标回归模型,计算目标用户群体中的每个目标用户对应的奖励得分。
[0107] 步骤S606、基于满足奖励得分大于第一预设阈值的目标用户构建目标用户名单。
[0108] 步骤S607、根据目标用户群体的群体标识符进行查询,确定对应目标用户群体预先配置的最优奖励。
[0109] 步骤S608、将目标用户名单和最优奖励反馈至操作平台,以使操作平台通过下发系统向目标用户名单中的用户下发最优奖励。
[0110] 上述,通过设置非奖励组以及多个奖励组进行下发不同奖励的在线测试,可以有效统计下发不同奖励的收益数据,合理比对下发不同奖励对应的收益提升效果,有利于准确得到与目标试验用户匹配度最高的最优奖励,
[0111] 图7为本申请实施例提供的一种平台奖励信息确定装置的结构框图,该装置配置为执行上述实施例提供的平台奖励信息确定方法,具备执行方法相应的功能模块和有益效果。如图7所示,该装置包括:
[0112] 获取模块101,配置为获取预设收益目标对应的目标用户群体;
[0113] 奖励得分计算模块102,配置为基于设置的对应预设收益目标的目标回归模型,计算目标用户群体中的每个目标用户对应的奖励得分;
[0114] 用户名单构建模块103,配置为基于满足奖励得分大于第一预设阈值的目标用户构建目标用户名单;
[0115] 奖励匹配模块104,配置为根据目标用户群体的群体标识符进行查询,确定对应目标用户群体预先配置的最优奖励;
[0116] 奖励信息反馈模块105,配置为将目标用户名单和最优奖励反馈至操作平台,以使操作平台通过下发系统向目标用户名单中的用户下发最优奖励。
[0117] 上述,通过获取预设收益目标对应的目标用户群体,基于设置的对应预设收益目标的目标回归模型,计算目标用户群体中的每个目标用户对应的奖励得分;基于满足奖励得分大于第一预设阈值的目标用户构建目标用户名单;根据目标用户群体的群体标识符进行查询,确定对应目标用户群体预先配置的最优奖励;将目标用户名单和最优奖励反馈至操作平台,以使操作平台通过下发系统向目标用户名单中的用户下发最优奖励。上述方案中,通过基于设置的目标回归模型计算目标用户群体中的每个目标用户对应的奖励得分,可以有效评估每个目标用户的预期奖励效果;通过基于满足奖励得分大于第一预设阈值的目标用户构建目标用户名单,可以合理筛选出能够产生较好奖励效果的目标用户,提高奖励效率;通过根据目标用户群体的群体标识符匹配基于AB试验结果确定的最优奖励,可以有效提供与目标用户群体的匹配度最高的奖励,保障目标用户的奖励效果,有利于提高平台收益。
[0118] 在一个可能的实施例中,还包括:
[0119] 第二获取模块,配置为获取预设收益目标对应的样本用户群体;
[0120] 分组模块,配置为对样本用户群体进行预设分组处理,确定已接受奖励的处理组用户和未接受奖励的对照组用户;
[0121] 模型构建模块,配置为基于处理组用户对应的第一特征信息和第一收益信息,以及对照组用户对应的第二特征信息和第二收益信息,构建目标回归模型,其中,目标回归模型用于输出目标用户的奖励得分。
[0122] 在一个可能的实施例中,分组模块,配置为:
[0123] 基于设置的倾向性模型计算样本用户群体中的每个样本用户的倾向性评分;
[0124] 将样本用户群体中的多个样本用户划分为已接受奖励的处理组用户和未接受奖励的候选对照组用户;
[0125] 从候选对照组用户中筛选出每个处理组用户对应的倾向性评分最接近的对照组用户。
[0126] 在一个可能的实施例中,模型构建模块,还配置为:
[0127] 根据处理组用户对应的第一特征信息和第一收益信息,构建第一回归模型;
[0128] 根据对照组用户对应的第二特征信息和第二收益信息,构建第二回归模型;
[0129] 将第一回归模型与第二回归模型作差得到目标回归模型。
[0130] 在一个可能的实施例中,还包括:
[0131] 最优奖励确定模块,配置为基于设置的AB试验确定预设收益目标对应的多个目标试验用户的最优奖励;
[0132] 映射关系建立模块,配置为建立预设收益目标对应的群体标识符与最优奖励的映射关系。
[0133] 在一个可能的实施例中,还包括:
[0134] 第三获取模块,配置为获取预设收益目标对应的试验用户群体;
[0135] 第二奖励得分计算模块,配置为基于预先构建的对应预设收益目标的目标回归模型,计算试验用户群体中每个试验用户对应的奖励得分;
[0136] 试验用户筛选模块,配置为从试验用户群体中筛选出满足奖励得分大于第二预设阈值的多个目标试验用户。
[0137] 在一个可能的实施例中,最优奖励确定模块,还配置为:
[0138] 将预设收益目标对应的多个目标试验用户按照预设比例划分为非奖励组和预设数量的多个奖励组,向每个奖励组配置不同的奖励;
[0139] 统计预设时间范围内非奖励组以及每个奖励组分别对应的累计收益;
[0140] 根据统计得到的累计收益确定满足收益最大化的最优奖励。
[0141] 图8为本申请实施例提供的一种平台奖励信息确定设备的结构示意图,如图8所示,该设备包括处理器201、存储器202、输入装置203和输出装置204;设备中处理器201的数量可以是一个或多个,图8中以一个处理器201为例;设备中的处理器201、存储器202、输入装置203和输出装置204可以通过总线或其他方式连接,图8中以通过总线连接为例。存储器202作为一种计算机可读存储介质,可配置为存储软件程序、计算机可执行程序以及模块,如本申请实施例中的平台奖励信息确定方法对应的程序指令/模块。处理器201通过运行存储在存储器202中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的平台奖励信息确定方法。输入装置203可配置为接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置204可包括显示屏等显示设备。
[0142] 本申请实施例还提供一种包含计算机可执行指令的非易失性存储介质,计算机可执行指令在由计算机处理器执行时配置为执行一种上述实施例描述的平台奖励信息确定方法,其中,包括:获取预设收益目标对应的目标用户群体,基于设置的对应预设收益目标的目标回归模型,计算目标用户群体中的每个目标用户对应的奖励得分;基于满足奖励得分大于第一预设阈值的目标用户构建目标用户名单;根据目标用户群体的群体标识符进行查询,确定对应目标用户群体预先配置的最优奖励;将目标用户名单和最优奖励反馈至操作平台,以使操作平台通过下发系统向目标用户名单中的用户下发最优奖励。
[0143] 值得注意的是,上述平台奖励信息确定装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不配置为限制本申请实施例的保护范围。
[0144] 在一些可能的实施方式中,本申请提供的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码配置为使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的方法中的步骤,例如,计算机设备可以执行本申请实施例所记载的平台奖励信息确定方法。程序产品可以采用一个或多个可读介质的任意组合实现。

当前第1页 第1页 第2页 第3页
相关技术
奖励信息相关技术
存储介质相关技术
黄锐发明人的其他相关专利技术