首页 / 微观标的物画像评估模型系统

微观标的物画像评估模型系统无效专利 发明

技术领域

[0001] 本发明涉及微观标的物画像评估模型系统,尤其涉及多维度数据分类标 准、标的物画像、标的物详情展示、标的物成交概率预测模型以及成交价格 预测模型。

相关背景技术

[0002] 目前对金融领域不良资产(土地/房产)的微观标的物画像的维度很不统 一、画像的数据来源也比较缺乏。对于网络司法拍卖标的物成交概率的预测 模型以及成交价格预测模型尚未开发。

具体实施方式

[0012] 维度梳理,不良资产标的物包括以下11种类型:
[0013]NO. 类别
1 房产(住宅/商业/工业/其他)
2 土地
3 机动车
4 债权
5 股权
6 林权
7 矿权
8 工程
9 机械设备
10 船舶
11 其他资产
[0014] 建立标的物画像模型
[0015] 标的详情
[0016] 用户可查看单个标的物的详细情况,标的详情分为两种展示方式,一种 是标的物画像,可显示标的物基本信息,以及关联的指标分析数据,另一种 为自定义画像,用户可自定义需要展现的关联信息。在自定义画像中,展现 的信息如下:
[0017] 基本信息
[0018] 标的名称、标的图片、标的类型、拍卖阶段、建筑面积、拍卖时间、
[0019] 价格指标
[0020] 起拍价、评估价、成交价、起拍折扣率、溢价率,可按总价或单价查看。
[0021] 补充信息
[0022] 特别提醒、法院公告、尽调信息
[0023] 关联信息
[0024] 可上传我的备注、以及相关的附件
[0025] 其他关联信息包括从数据分析、趋势分析、研究报告、新闻资讯等多维 度数据库调用关联数据计算出与该标的物有关的数据。
[0026] 数据分析
[0027] 平均起拍折扣率、成交溢价率、变现折扣率
[0028] 趋势分析
[0029] 供需模型趋势、近6个月市场热度、价格指数
[0030] 研究报告
[0031] 研究机构数量、研究关注度、研究报告数量
[0032] 统计模型介绍
[0033] 我们首先使用Logistic模型对标的是否能够竞标成功进行建模,对于 上述定性数据,我们引入虚拟变量来建模。而对于拍卖成功标的的溢价率, 我们使用样本选择模型。
[0034] 虚拟变量:
[0035] 在计量经济学中虚拟变量又称为哑变量,用来描述定性变量,取值为0 或1。当定性变量有多个取值,比如我们的标的所在城市级别,分别为一线、 二线和三线及以下,此时我们引入两个虚拟变量。假设我们考虑使用起拍折 扣和标的所在城市级别来对资产拍卖溢价率进行回归,记样本的溢价率为y, 连续变量起拍折扣为x1,而两个表示城市级别的虚拟变量为x2和x3。两个 虚拟变量分别表示是否为一线,是否为二线,则所有样本中,属于一线的样 本x2取值为1,x3取值为0;如果属于二线的样本x3、x3取值分别为0、1; 而三线及其以下则取0、0,即不属于一线并且也不属于二线。我们的回归方 程即为y=β0+β1x1+β2x2+β3x3+∈.。
[0036] 在上述例子中,当我们把两个虚拟变量引入模型时,实际上是在考虑不 同城市级别之间的差异,其中基准为三线及其以下城市,而两个虚拟变量回 归出来的系数β2和β3分别表示:较于基准(三线及其以下城市)标的处于一 线城市或者二线城市对被解释变量(比如竞拍成功概率或者拍卖溢价率)的 影响有什么差异。
[0037] Logistic回归是一种广义线性回归模型,用来研究因变量y为二分类或 多分类观察结果(比如是否拍卖成功,成功为1,否则为0)与与自变量X之 间关系。假设我们依然考虑起拍折扣和标的所在城市级别对能否拍卖成功的 影响,则X=[1n×1,x1,x2,x3],其中1n×1表示截距项,回归模型写为
[0038]
[0039] P(y=0|X)=1-P(y=1|X)   (2)
[0040] 模型参数β可以使用最大似然方法估计,得到估计 之后,重新带入方程 则可以得到对y取值概率的预测。
[0041] 样本选择模型用来解决在抽样过程中无法避免的样本缺失问题,有效的 矫正样本选择性的偏差。假设我们有感兴趣的被解释变量y1观测到了N个样 本,而其中只有N1个有观测值,另外N0=N-N1个未被观测到。我们假设y2是一 个影响y1能否被观测到的变量,另外有一个二元的选择变量D,模型可以描述 为:
[0042] y1i=Xiβ+∈1i 当y2i>0时   (3)
[0043] y1i=未观测到 当y2i≤0时
[0044] y2i=Ziα+∈2i   (4)
[0045] Di=1 当y2i>0时
[0046] Di=0 当y2i≤0时
[0047] 我们的例子中溢价率即为变量y1,是否拍卖成功为二元变量D,上式中(3) 式称为结果方程,(4)式为选择方程。
[0048] 样本选择模型有许多不同的估计方法,本文使用极大似然方法估计模型 参数。我们假设两个扰动项有联合分布
[0049]
[0050] 就可以得到模型的极大似然函数,其中ρ和σ作为分布参数被估计出来。 在得到所有参数的估计:(结果方程系数),(选择方程系数)和 (分 布参数)之后,我们模型中溢价率可以被估计为:
[0051]
[0052] 其中:
[0053]
[0054] 而 是在给定参数 下的正态密度函数。从(5)式中可以 看出我们估计出的是条件溢价率,即在竞拍成功的前提下预测出得溢价率。
[0055] 假设我们现在有三个新的样本需要使用两个模型预测成交概率和溢价 率,即得到式(1)、(2)和(5)的值,表1为样本信息。
[0056] 表1待预测样本数据
[0057]  资产ID 起拍折扣 资产类别 城市级别
资产一 526180607400 80.99% 住宅 三线及以上
资产二 526446607182 100% 住宅 一线
资产三 527148464999 64% 工业 二线
[0058] 我们记起拍折扣为x1,城市级别虚拟变量为x2、x3分别表示是否为住宅和是 否为工业,假设资产类别共有:住宅工业和商业,我们以商业为基准,引入 两个虚拟变量x4、x5,此时模型的解释变量为X=[1n×1,x1,x2,x3,x4,x5]。
[0059] 我们记每个样本点Xi=(1,xi1,xi2,xi3,xi4,xi5),i=1,2,3,则我们的待预测样 本可记为X=[X1′,X2′,X3′],以上样本数据的解释变量取值为:
[0060]
[0061] 根据以上模型和方法,我们首先使用Logistic模型预测拍卖成功概率。
[0062] Step1:模型参数β可以使用最大似然方法估计,假设得到估计
[0063]
[0064] Step2:将带 和X入式(1)得到:
[0065]
[0066]
[0067]
[0068] Step3:由上步得到的概率判断:资产二和资产三的拍卖成功概率都在半 数以上,将其预测为拍卖成功;而资产一被我们的模型预测为拍卖不成功。
[0069] 然后我们使用样本选择模型来预测,假设我们结果方程中 X=[1n×1,x1,x2,x3],而选择方程中Z=[1n×1,x1,x4,x5],以上样本即为 X=[X1′,X2′,X3′],Z=[Z1′,Z2′,Z3′],即为:
[0070]
[0071]
[0072] 样本选择模型预测算法:
[0073] Step1:假设我们估计出来β=(0.5,-2,1,1),α=(0.5,-2, 1,1)(选择方程系数)和(ρ=0.2,σ=1);
[0074] Step2:将 Z和 代入(6)式计算  以第一个样本为例:
[0075] Step2.1:计算
[0076] Step2.2:计算定积分比值:
[0077]
[0078] 其中:
[0079]
[0080] 得到
[0081] Step3:将带 X和 入式(5)得到样本在拍卖成功的条 件下的溢价率:
[0082]
[0083]
[0084]
[0085] 标的详情页面内容与分类样例(图6)
[0086]
[0087]
[0088]
[0089]
[0090]
[0091]
[0092]
[0093]
[0094]
[0095]
[0096]
[0097]
[0098]
[0099]
[0100]
[0101]
[0102]
[0103]
[0104]
[0105]
[0106]
[0107]
[0108]
[0109]
[0110]
[0111]
[0112]
[0113]
[0114]
[0115] 补充信息
[0116] 增加报名人数,设置提醒人数,围观人数和竞价次数四个字段,需要提 交的表格中有这些字段才能有具体数据,预留可扩展数据接口,供模型分析 因子维护调用。
[0117] 其他可扩展信息包括非结构化数据抓取的关联因子,从宏观、行业、产 业、区域等多维度数据库调用关联数据做计算,维护权重因子的配比。
[0118] 模型估计结果
[0119] 土地和房屋拍卖数据的建模使用2016年数据,分别有701和7547个样 本。Logistic模型估计结果在表附1.1中,样本选择模型的结果在表附1.2 中。在样本选择模型中,鉴于计算方便,在本部分数据中的溢价率使用公式: 成交价/拍卖价格,所以预测出的溢价率需减去1,便得到真正的溢价率。
[0120] 附表1.1Logistic回归结果
[0121]
[0122]
[0123] 注:显著性符号,‘***’0.001;‘**’0.01;‘*’0.05;‘.’ 0.1
[0124] 附表1.1的模型中,不显著的变量已经被剔除。起拍折扣和资产类别对 土地标的和房屋标的的拍卖成功概率都是有显著影响的。首先起拍折扣对两 类标的的拍卖成功概率都是显著的,说明在均值意义上起拍概率越低的资产 拍卖成功的概率越大。
[0125] 从表格中可以看出,我们模型中使用商业类资产作为基准,在土地标的 结果中住宅类和农业的系数都是显著的,说明作为土地拍卖标的,住宅类资 产比商业类有跟大的概率(就平均意义而言)拍卖成功,而相反农业类与工 业类相比则有跟小的概率;而对房屋标的住宅类资产比商业类显著的有更高 的成交概率。但数据显示其他类的标的比起商业类没有显著差异。
[0126] 附表1.2中的样本选择模型中选择方程跟Logistic模型结果类似,结 果方程中可以看出变量对土地资产的拍卖溢价率的解释力度并不是很显著, 而房屋资产的结果十分显著。受现阶段数据的限制,模型的解释力度并不是 很强,仍有待改进。
[0127] 附表1.2样本选择模型估计结果
[0128]
[0129]
[0130] 注:显著性符号,‘***’0.001;‘**’0.01;‘*’0.05;‘.’ 0.1
[0131] 在预测部分,我们随机将样本分为80%的训练样本,用来得到模型参数的 估计,和20%的测试数据用来做预测。
[0132] Logistic模型预测结果,参见附图2土地拍卖成功概率估计图,附图3 房屋拍卖成功概率估计图。
[0133]
[0134] 附表2.1 Logistic模型拍卖成功概率预测结果
[0135]  土地标的 房屋标的
预测准确度 77.86% 77.6%
[0136] 模型估计结果样本选择模型预测溢价率
[0137] 在溢价率预测部分,我们求得的是条件溢价率+1(见(3)式),所以在 20%的测试样本集内,用来计算预测偏差平方和的是测试集中拍卖成功、有溢 价率数据的样本,土地标的和房屋标的相应的样本数量分别是30和342。
[0138] 参见附图4土地标的溢价率估计图,附图5房屋标的溢价率估计图。
[0139] 附表3.1样本选择模型溢价率预测结果
[0140]  土地标的(样本量30) 房屋标的(样本量342)
预测偏差平方和 47.5523 7.887873
[0141] 以上述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通 技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰, 这些改进和润饰也应视为本发明的保护范围。

当前第1页 第1页 第2页 第3页