技术领域
[0001] 本发明涉及房地产互联网技术领域,尤其涉及一种房地产客户成交时间预测方法、装置及存储介质。
相关背景技术
[0002] 随着互联网的兴起,线上选房这类选购方式已渐渐融入到房地产交易中,但是由于线上选房主动权全权被购房者单方面掌控,如何找准时间对客户进行精准营销,是当前房地产商需要解决的问题。每个客户都有其购买意向最为强烈的一个时间段,这个时间段也是最容易成交的时间段,进而对其进行推荐和营销,从而达到降低营销成本的同时促进提高成交率的目的。
具体实施方式
[0029] 为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0030] 实施例一:
[0031] 为了解决房地产传统推荐营销过程中,地产商由于无法准确获知未成交的潜在客户,在哪个时间段其成交意向最为强烈,因此只能盲目地进行营销,在联系客户时,客户往往都是不感兴趣,或者近段时间未考虑买房等情况发生,因此在客户成交意向较弱的时间段进行盲目了营销,不但不能促进成交,还提高了地产商营销投入,同时还可能由于打扰了客户正常工作生活,给客户带来了不好的体验。综上,如何预测潜在的未成交客户购买意向较为强烈的时间段,进而进行精准营销,是地产商继续解决的问题,从而提高成交率的转化,降低营销成本。
[0032] 本实施例提供一种房地产客户成交时间预测方法,根据已成交客户的浏览行为数据和客档数据,对客户进行聚类(将已成交客户浏览行为和客档数据相似的客户聚为一类),再根据聚类结果对未成交客户进行分类,由分类结果匹配该类别下已成交客户的成交时间间隔,预测该未成交客户的成交时间,在此时间点前后分配置业顾问主动联系该客户,从而达到缩短成交时间、降低营销成本的目的。
[0033] 请参见图1,该房地产客户成交时间预测方法主要包括如下步骤:
[0034] S101、获取待预测客户的模型输入信息,其中模型输入信息是基于对客户线上行为数据和/或客档信息进行处理得到。
[0035] 待预测客户可以是本项目的未成交客户,或者是存在购房需求的任意客户,具体可以根据实际需求灵活设置。为了保证预测结果的有效性,避免对不必要的客户进行预测,例如针对不可能成交的客户预测其成交时间是没有实质意义的,故在本发明的其他实施例中,在对待预测客户进行预测之前,利用LightGBM模型预测待预测客户的成交概率,并将其成交概率与设定阈值进行比较,并判定待预测客户的成交概率达到设定阈值。以筛选出成交概率大于等于设定阈值的潜在客户进行预测。
[0036] 其中,LightGBM预测模型可通过选取30000条成交客户记录作为正样本,按照下采样选取同样的未成交客户作为负样本,数据按照7:3分为训练数据和测试数据,对模型进行训练和测试得到。输入一个未成交客户数据,模型输出客户的成交概率值。若成交概率大于60%,则可将其作为待预测客户,以预测其成交时间间隔。
[0037] 在预测客户成交概率时,可以选取如下数据:客户ID、访问楼盘ID、访问天数、总访问页面数、总浏览时长、总浏览次数、访问楼盘数量、是否访问户型、是否夜间访问、平均每日访问时长、平均每日点击次数、平均每日访问页面数量、单日最大点击次数、单日最大浏览时长、距今未访问天数、房贷计算器使用次数、是否成交等。
[0038] S102、输入到KNN分类模型,确定待预测客户所属的客户类型,作为目标客户类型;其中KNN分类模型是利用K-means聚类结果进行训练测试得到的,其中K-means聚类过程通过对若干已成交客户的模型输入信息进行聚类处理,将若干已成交客户聚类为若干客户类型。
[0039] 待预测客户的模型输入信息,主要是基于该客户的线上行为数据以及客档信息两方面的数据。在将其输入到KNN分类模型之前,需要对其进行预处理,以满足模型输入需求。
[0040] 其中,客户线上行为数据包括:浏览次数、浏览最多的楼盘停留时长、浏览户型总数量、关注楼盘总时长、每日浏览频率;
[0041] 客档信息包括:客户年龄、买房用途、买房类别、看房时长;其中买房用途包括自住、投资;买房类别包括刚需、改善、投资。
[0042] 对待预测客户的模型输入信息进行预处理,包括使用z分数将模型输入信息进行数据标准化:首先求出各指标的算术平均值(数学期望)xi和标准差si;然后对各指标进行标准化处理:zij=(xij-xi)/si;其中:zij为标准化后的指标值;xij为实际指标值;最后将逆指标前的负号调整为正。
[0043] KNN分类模型是利用K-means聚类结果进行训练测试得到的,取已成交客户的行为数据、客档数据,利用聚类分析中的“手肘法”,用于确定超参数K,避免局部最优;对客户类别判断,并进行k-means聚类,对客户打上类别标签。
[0044] 具体的,(1)选择K个点作为初始质心;(2)将每个点指派到最近的质心,形成K个簇;(3)重新计算每个簇的质心;重复步骤(2)~(3)直到簇不发生变化或达到最大迭代次数;将客户聚为Q1、Q2、......、QK。
[0045] 随机选取K-means聚类中70%和30%的已成交客户,分别作为训练数据和测试数据,利用递推关系计算不同K值下对应模型的准确性,以确定KNN分类模型的最佳K值,从而得到KNN分类模型。应当说明单的是,k-means聚类模型中的超参数K,与KNN分类模型临近点个数取值K的值并不一定相同,两者无必然关系。
[0046] 将待预测客户的模型输入信息输入到KNN分类模型,通过计算待预测客户的模型输入信息与KNN分类模型中各训练数据之间的距离;选取距离最近的K个点,根据该K个点各自所属的客户类型,确定出现频率最高的客户类型,以作为待预测客户所属的客户类型。
[0047] 例如,基于待预测客户的模型输入信息,将其输入到KNN分类模型,得到其最接近的5个点分别为已成交客户A、B、C、D、E,假设根据聚类结果得知客户A属于Q1、客户B属于Q2、客户C属于Q1、客户D属于Q3、客户E属于Q4,那么出现频率最高的客户类型为Q1,从而确定待预测客户所属的客户类型为Q1。
[0048] S103、根据聚类结果中属于目标客户类型的已成交客户,确定目标客户类型的成交时间间隔;成交时间间隔为模型输入信息最早产生时刻与和成交时刻之间的时间间隔。
[0049] 具体的,获取聚类结果中属于目标客户类型的已成交客户各自的成交时间间隔,筛选出现频率最高的成交时间间隔,作为目标客户类型的成交时间间隔。
[0050] 例如,在确定了待预测客户所属的客户类型为Q1时,根据聚类结果,获取聚类结果属于Q1的所有已成交客户的成交时间间隔,假设聚类结果为Q1的所有已成交客户中,成交时间间隔为45天的人数最多,即出现频率最高,从而确定Q1类型的客户的成交时间间隔为45天。
[0051] S104、根据目标客户类型的成交时间间隔,预测待预测客户的成交时间。
[0052] 在获知目标客户类型出现频率最高的成交时间间隔,表明该类客户在该时间段的和成交概率最高,成交意向最强,而待预测客户属于该目标客户类型,进而将目标客户类型的成交时间间隔,作为待预测客户的成交时间间隔;或者在目标客户类型的成交时间间隔的基础上,设定时间范围,作为待预测客户的成交时间间隔。例如,目标客户类型的成交时间间隔为45天,设定时间范围为±5天,也即待预测客户的成交时间间隔为40~50天。进一步地,还可以将待预测客户的成交时间间隔发送给相应的置业顾问,通知置业顾问在该成交时间间隔达到时,主动向客户进行推荐营销。
[0053] 为未成交客户成交时间的预测提供了有效手段;同时在进行成交时间预测之前,通过LightGBM模型预测客户成交概率,筛选出成交概率较高的未成交客户作为待预测客户,可以极大提高模型的准确性。通过实际数据测试,最终测得本客户成交时间预测方案的准确性高达72%,对地产商精准营销提供了可靠的技术支撑,有利于提高成交转化,降低营销成本。
[0054] 本发明提供的房地产客户成交时间预测方法,通过获取待预测客户的模型输入信息,其中模型输入信息是基于对客户线上行为数据和/或客档信息进行处理得到;输入到KNN分类模型,确定待预测客户所属的客户类型,作为目标客户类型;其中KNN分类模型是利用K-means聚类结果进行训练测试得到的,其中K-means聚类过程通过对若干已成交客户的模型输入信息进行聚类处理,将若干已成交客户聚类为若干客户类型;根据聚类结果中属于目标客户类型的已成交客户,确定目标客户类型的成交时间间隔;成交时间间隔为模型输入信息最早产生时刻与和成交时刻之间的时间间隔;根据目标客户类型的成交时间间隔,预测待预测客户的成交时间;有利于进行针对性地精准营销,提高成交率的转化,降低营销成本。
[0055] 实施例二:
[0056] 本实施例在上述实施例一的基础上,提供一种房地产客户成交时间预测装置,用于实现上述房地产客户成交时间预测方法的至少部分步骤,请参见图2,该装置主要包括获取模块21、分类模块22以及处理模块23,其中:
[0057] 获取模块21用于获取待预测客户的模型输入信息,其中模型输入信息是基于对客户线上行为数据和/或客档信息进行处理得到。
[0058] 分类模块22用于输入到KNN分类模型,确定待预测客户所属的客户类型,作为目标客户类型;其中KNN分类模型是利用K-means聚类结果进行训练测试得到的,其中K-means聚类过程通过对若干已成交客户的模型输入信息进行聚类处理,将若干已成交客户聚类为若干客户类型。
[0059] 处理模块23用于根据聚类结果中属于目标客户类型的已成交客户,确定目标客户类型的成交时间间隔;成交时间间隔为模型输入信息最早产生时刻与和成交时刻之间的时间间隔;并根据目标客户类型的成交时间间隔,预测待预测客户的成交时间。
[0060] 进一步地,分类模块22用于计算所述待预测客户的模型输入信息与KNN分类模型中各训练数据之间的距离;选取距离最近的K个点,根据该K个点各自所属的客户类型,确定出现频率最高的客户类型,以作为待预测客户所属的客户类型。
[0061] 进一步地,处理模块23用于获取聚类结果中属于所述目标客户类型的已成交客户各自的成交时间间隔,筛选出现频率最高的成交时间间隔,作为所述目标客户类型的成交时间间隔。
[0062] 本实施例还提供一种存储介质,该存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上所述的房地产客户成交时间预测方法的步骤。
[0063] 显然,本领域的技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(ROM/RAM、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
[0064] 以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。