首页 / 一种参数估计方法

一种参数估计方法实质审查 发明

技术领域

[0001] 本发明涉及信息技术、经济金融计算技术领域,特别涉及一种参数估计方法。

相关背景技术

[0002] 目前,在金融、经济行业,需要对用户进行信用评估,在信用评估等问题中,需要将一些连续型变量如年龄、收入等离散化,然后对不同的离散值分别赋予不同的得分,最后根据得分来评估一个人的信用值。如何对变量进行离散化,是一个很有重要的问题。一个好的
离散化对信用建模有重要的影响。
[0003] 传统的离散化通常考虑单个变量和信用之间的相关性,采用融合临近值的方法去离散化,实际上离散化的过程就是一个分箱的过程,而分箱的过程,可以使用分段常数函数
这一数学模型来刻画,但目前而言,对于参数的估计往往由于函数的设置,导致精度误差过
大,现在亟需一种误差精度较小的参数估计方法。

具体实施方式

[0066] 以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0067] 需说明的是,当部件被称为“固定于”或“设置于”另一个部件,它可以直接在另一个部件上或者间接在该另一个部件上。当一个部件被称为是“连接于”另一个部件,它可以是直接或者间接连接至该另一个部件上。
[0068] 需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0069] 此外,需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之
间存在任何这种实际的关系或者顺序,“多个”的含义是两个或两个以上,除非另有明确具
体的限定。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确
列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
[0070] 尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换
和变型,本发明的范围由所附权利要求及其等同物限定。
[0071] 实施例1:
[0072] 根据图1所示,本发明实施例提供了一种参数估计方法,包括:
[0073] 追溯并采集用户数据,基于预设的group lasso技术和用户数据,对用户进行信用评级,构建信用评级模型;group lasso表示分组最小角回归算法;
[0074] 基于预设的fused lasso技术,对所述信用评级模型进行预测,生成对应的预测模型;fused lasso惩罚的最小一乘回归算法;
[0075] 优化所述预测模型,确定对应的优化结果。
[0076] 上述技术方案的工作原理和有益效果为:
[0077] 本发明实施例提供了一种参数估计方法,通过追溯并采集用户数据,基于预设的group lasso技术和用户数据,对用户进行信用评级,构建信用评级模型,通过对用户的信
用变量的采集,从而生成对应的信用评级模型,基于预设的fused lasso技术,对所述信用
评级模型进行预测,生成对应的预测模型;优化所述预测模型,确定对应的优化结果,优化
后的预测模型,速率更高,对于变量的处理更加精确,减少了工作的时间。
[0078] 本发明通过对用户的信用进行评级是以特征分组的形式,从而能够得到更加清楚的用户特征,因此,构建的信用评级模型也更加准确。而fused lasso技术又能实现预测,让预测和信用评级相融合,从而提高分箱回归过程中的准确率和处理效率。
[0079] 实施例2:
[0080] 根据图2所示,本技术方案提供了一种实施例,所述追溯并采集用户数据,基于预设的group lasso技术和用户数据,对用户进行信用评级,构建信用评级模型,包括:
[0081] 通过预设的区块链,追溯并采集不同节点的用户数据;
[0082] 对所述用户数据进行认证,基于预设的group lasso技术,对认证后的数据进行特征分组,确定分组特征;其中,
[0083] 所述分组特征至少包括文字属性、图像属性和音频属性;
[0084] 基于所述分组特征,识别对应的用户;
[0085] 通过每个用户对应的用户数据,对用户进行信用评级,构建信用评级模型。
[0086] 上述技术方案的工作原理和有益效果为:
[0087] 本技术方案通过追溯并采集用户数据,基于预设的group lasso技术和用户数据,对用户进行信用评级,构建信用评级模型,通过预设的区块链,追溯并采集不同节点的用户
数据;,区块链上的用户数据,不仅对用户的评定更加全面,并且保密性也更高,对所述用户数据进行认证,基于预设的group lasso技术,对认证后的数据进行特征分组,确定分组特
征,对不同类型的用户数据进行分类,类如按照职业分类、按照年龄特征等,对用户的信用
值可以进行不同的评定,分组特征至少包括文字属性、图像属性和音频属性;基于所述分组
特征,识别对应的用户;通过每个用户对应的用户数据,对用户进行信用评级,构建信用评
级模型,通过信用评级模型,对用户进行信用评定,减少金融或者经济行业信贷等活动时的
风险。
[0088] 实施例3:
[0089] 根据图3所示,本技术方案提供了一种实施例,所述对所述用户数据进行认证,基于预设的group lasso技术,对认证后的数据进行特征分组,确定分组特征,包括:
[0090] 基于预设的神经网络和group lasso技术,通过认证后的用户数据,构建对应的稀疏模型;
[0091] 基于所述稀疏模型,计算对应的损失函数;
[0092] 通过预设的神经网络和所述group lasso技术,获取惩罚项;
[0093] 将所述惩罚项叠加至损失函数上,对所述稀疏模型进行优化,利用优化后的稀疏模型,对认证后的数据进行特征分组,确定分组特征。
[0094] 上述技术方案的工作原理和有益效果为:
[0095] 本技术方案对所述用户数据进行认证,基于预设的group lasso技术,对认证后的数据进行特征分组,确定分组特征,基于预设的神经网络和group lasso技术,通过认证后
的用户数据,构建对应的稀疏模型,不同的认证数据连接变化的研究,可以通过稀疏连接矩
阵进行计算,从而获取到用户数据之间固有的连接结构,基于所述稀疏模型,计算对应的损
失函数,损函函数用于描述稀疏模型的损失量,通过预设的神经网络和所述group lasso技
术,获取惩罚项,惩罚项用于对预备生成的模型选择一个合适的复杂度,将所述惩罚项叠加
至损失函数上,对所述稀疏模型进行优化,利用优化后的稀疏模型,对认证后的数据进行特
征分组,确定分组特征,也就是对数据进行区分,由于区块链中的数据过于庞大和复杂,需
要筛选和区分,减轻后续工作的复杂度和难度,提高工作效率。
[0096] 实施例4:
[0097] 本技术方案提供了一种实施例,所述通过每个用户对应的用户数据,对用户进行信用评级,构建信用评级模型,包括:
[0098] 获取每个用户对应的用户数据,基于所述用户数据,对对应的用户进行用户画像刻画,并获取对应的用户画像信息;
[0099] 获取信用评级指标,通过对所述用户画像信息和信用评级指标,对用户进行信用评级,并计算对应的信用差集;其中,
[0100] 所述信用差集用于将用户的隐含信用指标的信用值和外部评价指标的信用值作差得到的差集;
[0101] 基于预设的Logistic模型,对所述信用差集进行处理,分类估算用户的信用违约的风险概率;
[0102] 对所述风险概率进行回归分析,生成对应的概率矩阵,基于所述Logistic模型和概率矩阵,构建信用评级模型。
[0103] 上述技术方案的工作原理和有益效果为:
[0104] 本技术方案通过每个用户对应的用户数据,对用户进行信用评级,构建信用评级模型,获取每个用户对应的用户数据,基于所述用户数据,对对应的用户进行用户画像刻
画,并获取对应的用户画像信息,通过用户画像的刻画,提高用户的精准度描述,不仅对于
用户的统计更加获取信用评级指标,通过对所述用户画像信息和信用评级指标,对用户进
行信用评级,并计算对应的信用差集;所述信用差集用于将用户的隐含信用指标的信用值
和外部评价指标的信用值作差得到的差集,通过信用差值计算,可以从外界和自身模型两
方面对用户的信用度进行评定,提高对用户的信用度的评价精度,基于预设的Logistic模
型,对所述信用差集进行处理,分类估算用户的信用违约的风险概率,对所述风险概率进行
回归分析,生成对应的概率矩阵,基于所述Logistic模型和概率矩阵,构建信用评级模型。
[0105] 实施例5:
[0106] 本技术方案提供了一种实施例,所述基于预设的fused lasso技术,对所述信用评级模型进行预测,生成对应的预测模型,包括:
[0107] 基于预设的贝叶斯算法,选择关于信用评级模型的惩罚因子;其中,
[0108] 所述惩罚因子至少包括第一惩罚因子和第二惩罚因子;
[0109] 基于预设的fused lasso技术,通过所述惩罚因子对所述信用评级模型的预测过程进行约束,生成约束条件;
[0110] 基于所述约束条件,生成对应的预测模型。
[0111] 上述技术方案的工作原理和有益效果为:
[0112] 本技术方案基于预设的fused lasso技术,对所述信用评级模型进行预测,生成对应的预测模型,包括:基于预设的贝叶斯算法,选择关于信用评级模型的惩罚因子;其中,所述惩罚因子至少包括第一惩罚因子和第二惩罚因子;基于预设的fused lasso技术,通过所
述惩罚因子对所述信用评级模型的预测过程进行约束,生成约束条件;基于所述约束条件,
生成对应的预测模型。
[0113] 实施例6:
[0114] 本技术方案提供了一种实施例,所述基于预设的贝叶斯算法,选择关于信用评级模型的惩罚因子,包括:
[0115] 基于预设的贝叶斯算法,获取关于信用评级模型的贝叶斯信息指数,并基于所述贝叶斯信息指数,计算对应的第一惩罚因子;
[0116] 通过对信用评级模型中样本内误差的统计,确定误差统计结果;
[0117] 对所述信用评级模型进行预测,确定预测结果;
[0118] 通过所述预测结果和误差统计结果,计算对应的赤池信息指数,并基于所述赤池信息指数,计算对应的第二惩罚因子。
[0119] 上述技术方案的工作原理和有益效果为:
[0120] 本技术方案基于预设的贝叶斯算法,选择关于信用评级模型的惩罚因子,包括:基于预设的贝叶斯算法,获取关于信用评级模型的贝叶斯信息指数,并基于所述贝叶斯信息
指数,计算对应的第一惩罚因子;通过对信用评级模型中样本内误差的统计,确定误差统计
结果;对所述信用评级模型进行预测,确定预测结果;通过所述预测结果和误差统计结果,
计算对应的赤池信息指数,并基于所述赤池信息指数,计算对应的第二惩罚因子。
[0121] 实施例7:
[0122] 本技术方案提供了一种实施例,作为本技术方案的一种实施例,所述基于所述约束条件,生成对应的预测模型,包括:
[0123] 获取信用评级模型中的样本,确定对应的变量数据;
[0124] 获取变量数据之间的次序,基于所述次序,计算变量之间的皮尔逊相关系数;
[0125]
[0126] 其中,r代表变量之间的皮尔逊相关系数,xi代表第i个变量数据,代表变量数据x的均值,xi,xj∈X,X代表信用评级模型的变量集合,xj代表第j个变量数据,代表变量数据
y的均值,i=1,2,…,n,n代表变量集合中的变量数据总个数,j=1,2,…,n,i≠j;
[0127] 当所述皮尔逊相关系数大于等于预设阈值,基于所述约束条件和变量数据,生成对应的预测模型;
[0128] 当所述皮尔逊相关系数小于预设阈值,对所述变量数据进行归一化处理,再计算归一化处理后变量数据的皮尔逊相关系数。
[0129] 上述技术方案的工作原理和有益效果为:;
[0130] 本技术方案基于所述约束条件,生成对应的预测模型,包括:获取信用评级模型中的样本,确定对应的变量数据;获取变量数据之间的次序,基于所述次序,计算变量之间的
皮尔逊相关系数r,当所述皮尔逊相关系数大于等于预设阈值,基于所述约束条件和变量数
据,生成对应的预测模型;当所述皮尔逊相关系数小于预设阈值,对所述变量数据进行归一
化处理,再计算归一化处理后变量数据的皮尔逊相关系数。相关系数r是通过样本数据计算
而得,其值受到样本抽样的随机性、样本的数量等影响,因此需要考察样本相关系数的可靠
性,即进行显著性检验。
[0131] 实施例8:
[0132] 本技术方案提供了一种实施例,所述当所述皮尔逊相关系数大于等于预设阈值,基于所述约束条件和变量数据,生成对应的预测模型,包括:
[0133] 当所述皮尔逊相关系数大于等于预设阈值,通过所述约束条件,计算变量数据之间的融合函数;
[0134]
[0135] 其中,f代表变量数据之间的融合函数,γ1代表约束条件的第一正则参数,Y代表信用评级模型的变量集合X生成的向量,YK代表信用评级模型的变量集合X生成的向量中第
K个元素,YK‑1代表信用评级模型的变量集合X生成的向量中第K‑1个元素,K=1,2,…,P,P代表信用评级模型的变量集合X生成的向量中元素的总个数;
[0136] 基于所述约束条件和变量数据,生成对应的预测模型;
[0137]
[0138] 其中,τ代表预测模型,δ代表变量数据的数据向量,Y代表代表信用评级模型的变量集合X生成的向量,R代表关于变量集合的表示系数,γ2代表约束条件的第二正则参数。
[0139] 上述技术方案的工作原理和有益效果为:;
[0140] 本技术方案当所述皮尔逊相关系数大于等于预设阈值,基于所述约束条件和变量数据,生成对应的预测模型,当所述皮尔逊相关系数大于等于预设阈值,通过所述约束条
件,计算变量数据之间的融合函数f;基于所述约束条件和变量数据,生成对应的预测模型
τ;
[0141] 实施例9:
[0142] 本技术方案提供了一种实施例,所述优化所述预测模型,确定对应的优化结果,之前还包括:
[0143] 通过所述预测模型,获取不同样本数据的变量分箱;
[0144] 基于所述变量分箱,对样本数据进行评分预测,并生成对应的评分预测数据;
[0145] 基于所述变量分箱,对样本数据进行风控策略效果评估,并生成对应的风控策略评估数据;
[0146] 通过评分预测数据和风控策略评估数据,判断所述预测模型是否需要优化。
[0147] 上述技术方案的工作原理和有益效果为:
[0148] 本技术方案通过优化所述预测模型,确定对应的优化结果,之前还包括通过所述预测模型,获取不同样本数据的变量分箱;基于所述变量分箱,对样本数据进行评分预测,
并生成对应的评分预测数据;基于所述变量分箱,对样本数据进行风控策略效果评估,并生
成对应的风控策略评估数据;通过评分预测数据和风控策略评估数据,判断所述预测模型
是否需要优化。
[0149] 实施例10:
[0150] 本技术方案提供了一种实施例,所述优化所述预测模型,确定对应的优化结果,包括:
[0151] 获取评分预测数据和风控策略评估数据,对评分预测数据和风控策略评估数据进行综合分析,确定分析结果;
[0152] 基于所述分析结果,判断所述预测模型风险系数是否低于预设的风险阈值,生成判断结果;
[0153] 当所述判断结果为所述预测模型风险系数低于预设的风险阈值时,优化所述预测模型,确定对应的优化结果;
[0154] 当所述判断结果为所述预测模型风险系数高于预设的风险阈值时,定期检测所述预测模型是否需要优化。
[0155] 上述技术方案的工作原理和有益效果为:;
[0156] 本技术方案优化所述预测模型,确定对应的优化结果,获取评分预测数据和风控策略评估数据,对评分预测数据和风控策略评估数据进行综合分析,确定分析结果;基于所
述分析结果,判断所述预测模型风险系数是否低于预设的风险阈值,生成判断结果;当所述
判断结果为所述预测模型风险系数低于预设的风险阈值时,优化所述预测模型,确定对应
的优化结果;当所述判断结果为所述预测模型风险系数高于预设的风险阈值时,定期检测
所述预测模型是否需要优化。
[0157] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实
施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机
可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形
式。
[0158] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流
程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序
指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产
生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实
现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0159] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指
令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或
多个方框中指定的功能。
[0160] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或
其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一
个方框或多个方框中指定的功能的步骤。
[0161] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围
之内,则本发明也意图包含这些改动和变型在内。

当前第1页 第1页 第2页 第3页
相关技术
参数估计相关技术
贾金柱发明人的其他相关专利技术