首页 / 一种客户推荐成交预测方法及系统

一种客户推荐成交预测方法及系统实质审查 发明

技术领域

[0001] 本发明涉及数据分析技术领域,更具体地,涉及一种客户推荐成交预测方法及系统。

相关背景技术

[0002] 房地产行业作为一个重要的支柱行业,其发展对经济社会的发展具有重要意义。然而,随着国内房地产市场的增长,竞争激烈,传统营销手段已经不能有效满足市场的需求,为推动市场的发展,对客户群的识别和购买意向进行分析有利于精准营销。
[0003] 为促进客户推荐成交,目前有面向房地产客户群的识别和营销方法,提出利用客户成交预测模型来预测客户的成交概率,具体地,根据客户的客户ID、访问楼盘ID、访问及浏览记录、成交情况等客户行为数据,选取LightGBM预测模型对客户成交概率预测,输出客户的成交概率。然而该方法选用的客户行为数据杂乱且存在大量噪声,且未考虑不同客户行为特征对成交的影响程度不同,将客户行为数据直接输入预测模型所得到的成交预测概率准确性较低,进而影响营销效果。

具体实施方式

[0011] 附图仅用于示例性说明,不能理解为对本发明的限制;对于本领域技术人员来说,附图中某些公知说明可能省略是可以理解的。
[0012] 下面结合附图和实施例对本发明的技术方案做进一步的说明。
[0013] 实施例1本实施例提出一种客户推荐成交预测方法,如图1所示,为本实施例的客户推荐成
交预测方法的流程图。
[0014] 本实施例提出的客户推荐成交预测方法中,包括以下步骤:S100、采集客户的历史特征数据,对采集的特征数据进行预处理,得到匹配相应客
户编码和房产编码的训练样本集;
S200、对所述训练样本集中影响推荐成交概率的特征变量进行显著性校验,筛选
显著特征变量;
S300、以所述显著特征变量为自变量,以是否推荐成交为因变量,构建基于二元逻
辑回归算法的推荐成交概率预测模型,并将所述训练样本集输入推荐成交概率预测模型中进行训练;
S400、将目标客户的历史特征数据输入完成训练的所述推荐成交概率预测模型
中,得到推荐成交预测概率。
[0015] 本实施例中,对影响推荐成交概率的特征变量进行显著性校验,筛选显著特征变量用于进一步构建基于二元逻辑回归算法的推荐成交概率预测模型,有利于过滤样本数据中的噪声,有利于提高推荐成交预测概率的准确性,进一步提高营销推广的针对性和有效性。
[0016] 在一可选实施例中,所述历史特征数据包括满意度数据、行为数据、个人基本数据和房产数据中的一种或多种。
[0017] 其中,所述满意度数据包括以调查问卷链接形式采集的满意度特征;所述满意度特征包括物业服务满意度、销售服务满意度、签约沟通满意度、签约服务满意度和交付服务满意度中的一种或多种;所述行为数据包括从客户端接口获取的行为特征;所述行为特征包括是否订阅、
订阅次数、是否转发文章、转发文章篇数、是否报备、报备次数、是否推荐成交、推荐成交次数、报备时生命周期,和首次推荐成交时生命周期中的一种或多种;
所述个人基本数据包括从客户端接口获取的客户基本特征;所述客户基本特征包
括ID、年龄、性别和籍贯中的一种或多种;
所述房产数据包括从销售端接口获取的客户所持有的房产特征;所述房产特征包
括房价、付款方式、产品类型、面积和户型中的一种或多种。
[0018] 作为示例性说明,在一具体实施过程中,所选取的历史特征数据如下表1所示。
[0019] 表1 历史特征数据示例
[0020] 由于历史特征数据为通过调研问卷链接、客户端接口、销售端接口直接采集,其采集的数据存在大量冗余信息,将其直接输入预测模型中进行推荐成交概率预测将影响预测结果准确率。对此,本实施例对由大量冗余信息组成的训练样本进行显著性校验,筛选样本中影响推荐成交概率的特征变量作为显著特征变量,进一步构建及更新推荐成交概率预测模型,以提高预测结果准确率。
[0021] 进一步地,在一可选实施例中,对采集的数据进行预处理,包括以下步骤:S110、对不同客户设置客户编码和房产编码;
S120、将采集的特征数据与相应的客户编码和房产编码进行关联匹配,组成由若
干条样本数据组成的训练样本集;
S130、对所述训练样本集进行噪声剔除。
[0022] 本实施例中,根据客户ID设置客户编码,根据客户所持有房产设置房产编码,再将采集的特征数据与该客户的客户编码和房产编码进行关联匹配,得到关于该客户的一条样本数据,形成训练样本集。
[0023] 示例性地,在S130步骤中对训练样本进行噪声剔除时,可选地基于预设规则策略进行噪声剔除,或基于clean‑label算法等进行自动数据清洗。
[0024] 在一可选实施例中,对所述训练样本集中影响推荐成交概率的特征变量进行显著性校验,筛选显著特征变量的步骤包括:S210、根据所述特征变量的变量类型选择校验方法,得到特征变量的显著性值;其
中,对连续变量采用Mann‑Whitney U检验方法,对分类变量采用皮尔逊卡方检验方法;
S220、将特征变量的显著性值小于预设阈值的特征变量作为显著特征变量保留在
训练样本集中,删除所述训练样本集中其他特征变量。
[0025] 需要说明的是,连续变量为在一定区间内可以任意取值的变量,而分类变量为定值变量,表现为互不相容的类别或属性。
[0026] 本实施例中,根据不同变量类型采取不同的显著性检验方法,针对“订阅次数”、“转发文章篇数”、“年龄”、“房价”、“面积”和满意度等连续变量采用Mann‑Whitney U检验方法,针对“是否订阅”、“是否转发文章”、“性别”、“付款方式”、“产品类型”和“户型”等分类变量采用皮尔逊卡方检验方法。
[0027] 作为示例性说明,S220步骤中的预设阈值设置为0.05,当特征变量的显著性值小于0.05时,表示该特征变量对推荐成交概率预测模型的因变量有显著影响,可以作为显著特征变量纳入模型自变量。
[0028] 进一步地,在一可选实施例中,所述基于二元逻辑回归算法的推荐成交概率预测模型的表达式为:;

其中,P为推荐成交预测概率;为显著特征变量的线性组合, 表示第n个显著特
征变量的取值, 为偏置项, 表示第n个显著特征变量的回归系数;n为经过筛选的显著特征变量的总数量。
[0029] 当推荐成交预测概率P大于预测分类标准值,则预测结果为该客户愿意推荐成交,否则预测结果为该客户不愿意推荐成交。
[0030] 进一步地,在一可选实施例中,所述方法还包括以下步骤:S310、利用ROC曲线(Receiver Operating Characteristic Curve,接收者操作特
性曲线)对所述推荐成交概率预测模型的预测效果进行判断:
当ROC曲线下面积大于预设阈值时,表示当前所述推荐成交概率预测模型的预测
效果满足要求,并将当前所述推荐成交概率预测模型输出的预测结果作为推荐成交预测概率输出;
否则,对所述推荐成交概率预测模型的回归系数利用最大似然估计法进行调整,
将所述训练样本集输入推荐成交概率预测模型中重新训练,更新所述推荐成交概率预测模型。
[0031] 其中,ROC曲线是通过绘制不同分类阈值下的真正率(True Positive Rate,TPR)和假正率(False Positive Rate,FPR)得到的曲线。其中,TPR衡量的是分类器在所有实际为正例的样本中正确识别出的比例,而FPR衡量的是分类器在所有实际为负例的样本中错误地识别为正例的比例ROC曲线图中,其纵轴为TPR,横轴为FPR。曲线上每个点都对应一个不同的分类阈
值,通过调整阈值,可以得到不同的TPR和FPR组合,从而在ROC曲线上确定不同的点。而ROC曲线下的面积(Area Under the Curve,AUC)是评估模型性能的一个重要指标,其中,AUC值越接近1,说明模型的性能越好。
[0032] 作为示例性说明,S310步骤中的预设阈值设置为0.6 0.75。~
[0033] 可选地,S310步骤中的预设阈值设置为0.75,即当AUC大于0.75时,判断当前推荐成交概率预测模型的预测能力满足要求。
[0034] 作为示例性说明,当AUC小于或等于预设阈值时,对所述推荐成交概率预测模型的回归系数、偏置项等参数结合对数似然损失函数,使用梯度下降算法等优化算法进行优化训练,更新所述推荐成交概率预测模型。
[0035] 在具体实施过程中,采集数据并组成训练样本集后,对影响推荐成交概率的特征变量进行显著性校验,得到如下表2所示的特征变量非参数检验结果。
[0036] 表2 特征变量非参数检验结果
[0037] 由此可见,最终筛选的显著特征变量包括:总体满意度、投诉处理满意度、维修服务满意度、销售服务满意度、房屋质量满意度、推荐意愿、是否推荐过、性别、年龄、房产数量、房价、面积、报备时生命周期、是否订阅、报备次数、是否转发文章。
[0038] 将显著特征变量作为自变量,将是否推荐成交作为因变量,将包含显著特征变量的训练样本集输入基于二元逻辑回归算法的推荐成交概率预测模型中进行训练,得到完成训练的推荐成交概率预测模型。
[0039] 在一具体实施过程中,得到如下表3所示的参数估计结果。
[0040] 表3 预测模型参数估计结果
[0041] 进一步地,以总体满意度、投诉处理满意度、维修服务满意度、销售服务满意度、房屋质量满意度、推荐意愿、是否推荐过、性别、年龄、房产数量、房价、面积、报备时生命周期、是否订阅、报备次数、是否转发文章作为显著特征变量,输入基于二元逻辑回归算法的推荐成交概率预测模型中,构建得到推荐成交概率预测模型,其表达式为:Logit(P)= =‑0.49×R+0.27×(G==2)‑0.0242×N‑2.64×10‑8+0.00311×M‑
0.0045×TJ+0.0117×(TJG==1)‑1.93×(DY==1)‑0.0148×Z+0.271×TS+0.248×WX+0.329×X+0.406×FZ;
其中Logit(P)表示二元逻辑回归函数。
[0042] 最后将实际的客户满意度、客户个人基本数据、房产数据和客户行为数据参数代入模型,即可进行客户推荐成交意向度的实时预测。
[0043] 进一步地利用ROC曲线对模型的预测效果进行判断,得到如图2所示的ROC曲线示意图,其AUC=0.9299>0.75,表明当前模型预测能力较好,可直接应用于推荐成交概率预测。
[0044] 本实施例充分利用所积累的客户历史数据,预测客户推荐成交意向度,定位推荐成交高意向的客户名单,能够增加营销推广的针对性和有效性,减少推广的成本,提高成交转化率。
[0045] 实施例2本实施例提出一种客户推荐成交预测系统,应用实施例1提出的客户推荐成交预
测方法,如图3所示,为本实施例的客户推荐成交预测系统的架构图。
[0046] 本实施例提出的客户推荐成交预测系统中,包括:数据采集模块,用于采集客户的历史特征数据;
数据处理模块,用于对采集的特征数据进行预处理,得到匹配相应客户编码和房
产编码的训练样本集;
数据筛选模块,用于对所述训练样本集中影响推荐成交概率的特征变量进行显著
性校验,筛选显著特征变量;
预测模块,其上搭载有基于二元逻辑回归算法的推荐成交概率预测模型,用于将
目标客户的历史特征数据输入完成训练的所述推荐成交概率预测模型中,输出推荐成交预测概率;
所述推荐成交概率预测模型利用所述训练样本集训练得到,其中,模型以所述显
著特征变量为自变量,以是否推荐成交为因变量。
[0047] 可以理解,本实施例的系统对应于上述实施例1的方法,上述实施例1中的可选项同样适用于本实施例,故在此不再重复描述。
[0048] 实施例3本实施例提出一种计算机设备,包括存储器和处理器,所述存储器中存储有计算
机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如实施例1提出的客户推荐成交预测方法的步骤。
[0049] 实施例4本实施例提出一种存储介质,其上存储有计算机可读指令,其中,所述计算机可读
指令被处理器执行时实现实施例1提出的客户推荐成交预测方法的步骤。
[0050] 示范性地,所述存储介质包括但不限于U盘、移动硬盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0051] 示范性地,所述指令、程序、代码集或指令集可采用常规编程语言实现。
[0052] 示范性地,所述处理器包括但不限于智能手机、个人计算机、服务器、网络设备等,用于执行实施例1所述的客户推荐成交预测方法的全部或部分步骤。
[0053] 附图中的用语仅用于示例性说明,不能理解为对本发明的限制;显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对
本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

当前第1页 第1页 第2页 第3页