首页 / 一种基于多源异构数据的活跃客户筛选方法及系统

一种基于多源异构数据的活跃客户筛选方法及系统公开 发明

技术领域

[0001] 本发明涉及客户筛选技术领域,尤其涉及一种基于多源异构数据的活跃客户筛选方法及系统。

相关背景技术

[0002] 多源异构数据即不同数据源、格式和类型的数据,通过利用多源异构数据,能够对客户行为和特征进行综合分析,从而筛选出高活跃度客户;以电商平台为例,仅以下单量衡量客户的活跃度是非常片面的,因为这无法全面反映客户的潜在价值,客户可能会通过电商平台中预先集成的社交模块,将使用过的好物推荐给好友。
[0003] 换言之,不同的业务目标需要关注不同的客户行为,这也就需要为每种客户行为设置不同的权重;因此,“如何根据权重,动态定义活跃客户”是本发明所需要解决的技术问题。

具体实施方式

[0017] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0018] 在实施例1中,图1示出了本发明实施例提供的基于多源异构数据的活跃客户筛选方法实现流程,以下进行详述,如下:S100:获取多源异构数据中的所有指标,确定每个指标的数据来源,并根据所述数据来源,计算出每个指标中客户的互动率,创建与指标一一对应的枝节点,并将所述枝节点挂载到预先构建完成的根节点中,其中每位客户对应一个根节点。
[0019] 确定出客户筛选所需要用到的指标,例如,下单量、评论量和推荐次数等,并确定每个指标的数据来源,其中数据来源可以为单个平台或多个平台,也可以为单个平台中的多个模块;确定出客户在一段时间内的互动率,互动率也就是点赞频率、评论频率和分享频率等。
[0020] 为客户的每个指标均创建一个枝节点,并将互动率同步到枝节点中,为每个客户创建一个根节点,并将每个指标所对应的枝节点挂载到根节点中。
[0021] 例如,客户甲经常在某平台下单和评论,但并未进行其他操作,根据客户甲在一段时间内的下单次数和评论次数,确定出客户的互动率,并生成两个枝节点,将互动率上传到对应的枝节点中,并将枝节点挂载到与客户甲所对应的根节点中。
[0022] S200:采集客户的注册信息,并将所述注册信息上传到对应的根节点中,整合枝节点和根节点,生成筛选树,并向所述筛选树中插入由数据来源生成的标签。
[0023] 在预设平台中,采集客户的注册信息,其中注册信息应包括客户的年龄和偏好等,将注册信息上传到客户所对应的根节点中,将每位客户所对应的根节点和枝节点进行整合,得到筛选树,并插入标签;其中,插入标签的好处是能够快速回溯出数据来源,并确定出原始数据。
[0024] S300:整合所有客户的筛选树,生成筛选森林,搭建所述筛选森林的数据接口,将预设的对照表写入到所述筛选森林中,其中所述对照表至少包括每个指标的权重值,经由所述权重值和互动率,计算出每个筛选树的活跃值,配置出活跃值与倾斜角度的对应关系,并倾斜所述筛选树。
[0025] 整合所有的筛选树,生成筛选森林,并在筛选森林中搭建出数据接口,通过数据接口,将实时数据写入筛选森林中,确定每个指标的权重值,根据每个指标的权重值和互动率,确定出每个筛选树的活跃值。
[0026] 整合所有客户的活跃值,确定出活跃值的波动范围,并将活跃值划分为多个区间,为每个区间确定一个倾斜角度,将客户的筛选树调整到对应的倾斜角度。
[0027] S400:获取筛选要求,从所述筛选森林中,遍历出目标树,并将所述目标树定义为活跃客户,整合所有活跃客户的指标和注册信息,生成筛选表单,并将所述筛选表单发送到预设终端。
[0028] 确定筛选要求,其中筛选要求可以为客户数量和活跃值等,利用筛选要求,从筛选森林中选取出目标树,将目标树中的指标和注册信息写入到模板中,生成筛选表单,将筛选表单发送到预设终端,其中预设终端可以为筛选组织者终端。
[0029] 在实施例2中,图2示出了本发明实施例提供的基于多源异构数据的活跃客户筛选方法实现流程,以下对S100进行详述,如下:S101:经由所述数据来源,采集每个指标的实时数据,并对所述实时数据进行预处理。
[0030] 从数据来源处,读取出每个指标的实时数据,并进行预处理,其中预处理的具体步骤包括:对实时数据进行清洗、格式转换和标准化等。
[0031] S102:构建时间窗口,统计出所述时间窗口内客户的互动次数,并计算出互动频率。
[0032] 确定初始时间和结束时间,并构建时间窗口,统计出时间窗口内,客户在每个指标内的互动次数;根据结束时间和初始时间的差值,结合互动次数,计算出互动频率,其中每个指标都对应一个互动频率。
[0033] 在实施例3中,图2示出了本发明实施例提供的基于多源异构数据的活跃客户筛选方法实现流程,以下对S100继续进行详述,如下:S103:利用所述实时数据,对所有的枝节点进行动态更新。
[0034] 利用实时数据对枝节点中的互动率进行动态更新。
[0035] S104:以时间为横坐标,互动频率为纵坐标,绘制出变化趋势图,识别出高互动期和低互动期。
[0036] 根据时间窗口中,时间与互动频率的对应关系,以时间为横坐标,互动频率为纵坐标,绘制变化趋势图,在变化趋势图中确定出分界值,并在变化趋势图中,找出互动率大于分界值的部分,将该部分所对应的时间段确定为高互动期,反之,则确定为低互动期。
[0037] 在实施例4中,图3示出了本发明实施例提供的基于多源异构数据的活跃客户筛选方法实现流程,以下对S200进行详述,如下:S201:配置出所述指标间的相互关系,并生成平衡因子。
[0038] 配置出指标间的相互关系,其中平衡因子也就是影响互动率的因素。
[0039] S202:将所述平衡因子嵌入到筛选树中,调整所述筛选树中的权重值。
[0040] 确定每个指标中,互动率的影响因素,并利用此影响因素,对每个指标的权重值进行调整,其中影响因素包括:客户的年龄、性别和区域等;换言之,不同年龄段的客户的点赞频率、评价频率和下单频率等必然不同,通过向每个筛选树中补入平衡因子,能够消除偏差,更为公正地评估每位客户的真实行为倾向。
[0041] 在实施例5中,图4示出了本发明实施例提供的基于多源异构数据的活跃客户筛选方法实现流程,以下对S300进行详述,如下:S301:基于每个指标的权重值和互动率,计算出每个指标的分值,并将所述分值上传到对应的枝节点中。
[0042] 将每个指标的权重值与互动率相乘,计算出每个指标的分值,其中分值用于表征客户在该指标中的活跃程度。
[0043] S302:叠加所述筛选树内所有枝节点中的分值,得到筛选树的活跃值。
[0044] 对客户对应的所有指标的分值进行叠加,得到筛选树的活跃值。
[0045] 在实施例6中,图4示出了本发明实施例提供的基于多源异构数据的活跃客户筛选方法实现流程,以下对S300继续进行详述,如下:S303:配置出每个指标的活跃阈值,将所述分值大于活跃阈值的客户定义为高频客户,并将所述高频客户整合到筛选表单中。
[0046] 在每个指标中,确定出活跃阈值,如果指标所对应的分值大于活跃阈值,则将该客户定义为高频客户,并将高频客户整合到筛选表单中;在实际生活中,高频客户也就是非常喜爱评论或是点赞的客户;通过确定高频客户,能够识别出核心受众,从而提高筛选结果的使用效率。
[0047] S304:构建以所述分值为基础的推送机制。
[0048] 构建推送机制,并根据分值进行推送,其中推送机制为:当分值大于预设的设定值,则向对应的客户推送推广信息。
[0049] 在实施例7中,图5示出了本发明实施例提供的基于多源异构数据的活跃客户筛选方法实现流程,以下对S400进行详述,如下:S401:整合每位客户的指标和注册信息,生成多维度画像,并将客户聚类为若干个类别;
根据客户的指标和注册信息,生成多维度画像,其中多维度画像可以为包含有互动率的行为画像,也可以为包含有客户浏览内容和关键词的兴趣画像等;根据兴趣画像,将客户聚类为若干个类别,如:时尚用品类别和生活用品类别等,其中类别用于表征客户的潜在偏好。
[0050] S402:基于指标内的实时数据,优化所述多维度画像,遍历出类别之间的关联,并构建关联网络。
[0051] 确定客户所对应的类别间的关联,并根据此关联,构建关联网络;关联也就是指标间的相互关系,利用此相互关系,每个指标所对应的权重值进行调整;例如,可根据行为画像,对每个指标所对应的权重值进行调整。
[0052] 图6示出了本发明实施例提供的基于多源异构数据的活跃客户筛选系统的组成结构框图,所述基于多源异构数据的活跃客户筛选系统1包括:挂载模块11,用于获取多源异构数据中的所有指标,确定每个指标的数据来源,并根据所述数据来源,计算出每个指标中客户的互动率,创建与指标一一对应的枝节点,并将所述枝节点挂载到预先构建完成的根节点中,其中每位客户对应一个根节点;
插入模块12,用于采集客户的注册信息,并将所述注册信息上传到对应的根节点中,整合枝节点和根节点,生成筛选树,并向所述筛选树中插入由数据来源生成的标签;
倾斜模块13,用于整合所有客户的筛选树,生成筛选森林,搭建所述筛选森林的数据接口,将预设的对照表写入到所述筛选森林中,其中所述对照表至少包括每个指标的权重值,经由所述权重值和互动率,计算出每个筛选树的活跃值,配置出活跃值与倾斜角度的对应关系,并倾斜所述筛选树;
发送模块14,用于获取筛选要求,从所述筛选森林中,遍历出目标树,并将所述目标树定义为活跃客户,整合所有活跃客户的指标和注册信息,生成筛选表单,并将所述筛选表单发送到预设终端。
[0053] 图7示出了本发明实施例提供的基于多源异构数据的活跃客户筛选系统的组成结构框图,所述挂载模块11包括:预处理单元111,用于经由所述数据来源,采集每个指标的实时数据,并对所述实时数据进行预处理;
计算单元112,用于构建时间窗口,统计出所述时间窗口内客户的互动次数,并计算出互动频率;
更新单元113,用于利用所述实时数据,对所有的枝节点进行动态更新;
绘制单元114,用于以时间为横坐标,互动频率为纵坐标,绘制出变化趋势图,识别出高互动期和低互动期。
[0054] 图8示出了本发明实施例提供的基于多源异构数据的活跃客户筛选系统的组成结构框图,所述插入模块12包括:生成单元121,用于配置出所述指标间的相互关系,并生成平衡因子;
调整单元122,用于将所述平衡因子嵌入到筛选树中,调整所述筛选树中的权重值。
[0055] 图9示出了本发明实施例提供的基于多源异构数据的活跃客户筛选系统的组成结构框图,所述倾斜模块13包括:上传单元131,用于根据每个指标的权重值和互动率,计算出每个指标的分值,并将所述分值上传到对应的枝节点中;
得到单元132,用于叠加所述筛选树内所有枝节点中的分值,得到筛选树的活跃值;
整合单元133,用于配置出每个指标的活跃阈值,将所述分值大于活跃阈值的客户定义为高频客户,并将所述高频客户整合到筛选表单中;
推送单元134,用于构建以所述分值为基础的推送机制。
[0056] 图10示出了本发明实施例提供的基于多源异构数据的活跃客户筛选系统的组成结构框图,所述发送模块14包括:聚类单元141,用于整合每位客户的指标和注册信息,生成多维度画像,并将客户聚类为若干个类别;
遍历单元142,用于根据指标内的实时数据,优化所述多维度画像,遍历出类别之间的关联,并构建关联网络。
[0057] 其中挂载模块11主要用于完成步骤S100,插入模块12主要用于完成步骤S200,倾斜模块13主要用于完成步骤S300,发送模块14主要用于完成步骤S400;预处理单元111主要用于完成步骤S101,计算单元112主要用于完成步骤S102,更新单元113主要用于完成步骤S103,绘制单元114主要用于完成步骤S104;
生成单元121主要用于完成步骤S201,调整单元122主要用于完成步骤S202;
上传单元131主要用于完成步骤S301,得到单元132主要用于完成步骤S302,整合单元133主要用于完成步骤S303,推送单元134主要用于完成步骤S304;
聚类单元141主要用于完成步骤S401,遍历单元142主要用于完成步骤S402。
[0058] 以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0059] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
[0060] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页 第1页 第2页 第3页