首页 / 低收入人口动态监测量化模型

低收入人口动态监测量化模型实质审查 发明

技术领域

[0001] 本发明涉及政务大数据,特别涉及低收入人口动态监测量化模型。

相关背景技术

[0002] 随着信息化技术的在政务领域的不断应用实践,相关政务部门积累了大量的数据资产。但政务部门对积累的低收入人口数据的应用更多是侧重于数据展示,即通过对数据加工处理后在应用系统前端做展示。这种应用方式存在以下不足:
[0003] 1)、不能够让沉淀的低收入人口数据资产价值得到充分利用;
[0004] 2)、无法让使用者快速定位到低收入人口重要的数据;
[0005] 3)、无法加强低收入人口动态监测,从而无法更加精准、及时、有效做好社会救助工作。
[0006] 当前有企业提出了解决上述低收入人口问题的一些方法。这些解决方案要么片面,只局限于某一个点,比如只针对已经认定为低收入人口的异常情况进行分析处理;要么无法做到精准识别帮扶低收入人口,比如基于手机信令数据预测低收入人群的方法,只能识别到某个区域范围的人群的特征,无法精准识别到每个家庭的特征,从而无法实现精准扶贫。
[0007] 如何构建了一个更加全面化、体系化、精准化的低收入人口动态监测模型是政务领域必须认真研究解决的技术难题。

具体实施方式

[0067] 以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0068] 实施例1
[0069] 如图1所示,本发明揭示了低收入人口动态监测量化模型的制作流程以及动态监测流程,数据建模和动态监测单元,其中数据建模的具体步骤如下:
[0070] S101:从政务部门信息中心采集家庭历史数据记录,家庭历史数据记录包括家庭成员信息、家庭各项收入、家庭各项开支、家庭各项财产、低收入人口政策法规相关指标。
[0071] S102:对家庭历史数据记录进行清洗处理,对家庭历史数据记录进行清洗加工,具体为:
[0072] (1)对单条数据记录存在空值的数据,用均线高频值来填充或者直接删除;
[0073] (2)在做多数据源融合时,列数据单位不统一时,需要转换为统一;
[0074] (3)对于不合理的数据记录进行删除或修正,比如年龄为150岁;
[0075] (4)对于不唯一的数据记录,进行删除;
[0076] (5)按不同维度汇总复合指标。
[0077] S103:剔除不满足低收入人口政策法规设定条件的数据记录,低收入人口政策法规是国家、省、市等各行政区规定的被纳入低收入人口监测范围的硬性条件。
[0078] S104:确定家庭困难程度的特征因素,特征因素是基于家庭成员信息、家庭各项收入、家庭各项开支、家庭各项财产、低收入人口政策法规相关指标,结合专家意见和数据统计分析来确定;使用的数据统计分析方法包括:相关系数、卡方检验、信息增益等。
[0079] S105:构建多元线性回归模型,构建的多元线性回归模型如下:
[0080] y=β0+β1x1+…+βjxj+βnxn;
[0081] 其中,y表示家庭困难程度的得分值,xj表示第j个特征因素,βj表示第j个特征因素对应的回归系数,j=1,2,…n,n表示影响因素的个数。
[0082] S106:从家庭历史数据记录中抽样,并给样本按家庭困难程度打分,家庭困难程度打分标准是家庭越困难得分越高,所打的分值要和所属家庭属性对应分数区间相匹配,具体为:
[0083] 正常家庭对应分数区间(‑∞,0];
[0084] 低保边缘家庭对应分数区间为(0,1.5];
[0085] 低保家庭对应分数区间为(1.5,3];
[0086] 特困家庭对应分数区间为(3,+∞)。
[0087] S107:对所述抽样样本数据记录进行预处理,预处理是对样本值进行标准化处理,具体处理过程如下:
[0088] 对抽样样本构建样本矩阵Z:
[0089]
[0090] 其中zmn表示第n个特征因素下的第m个样本值。
[0091] 计算每一列的平均值,则有,
[0092]
[0093] 计算每一列的方差,则有,
[0094]
[0095] 通过如下公式对数据进行标准化处理:
[0096]
[0097] 则得到处理后的,可以标准化后的矩阵:
[0098]
[0099] S108:把预处理的样本按8:2的比例划分为训练集和测试集,划分方式是随机划分。
[0100] S109:通过训练集对多元线性回归模型求回归系数,将训练集代入到多元线性回归模型中,则有一下方程表达式:
[0101]
[0102] 可以简写为:Y=Xβ;
[0103] 其中Y表示家庭贫困程度得分值矩阵,X表示特征因素量化值矩阵,β表示待求解的回归系数矩阵;在Y和X矩阵是已知的情况下可以通过如下公式求得β矩阵:
[0104] β=(XTX)‑1XTY。
[0105] S110:通过测试集对所述多元线性回归进行拟合度检验,拟合度是用来评估模型与实际数据之间的符合程度,拟合度的计算公式如下:
[0106]2
[0107] 其中R用来评估回归模型拟合度的指标, 表示真实观测值,yi表示通过回归模型的预测值,表示实际观测值的平均值;
[0108] R2接近于1时,表示模型的拟合度较高,预测效果较好;
[0109] 当R2的值接近于0时,表示模型的拟合度较低,预测效果较差。
[0110] 当多元线性回归模型的拟合度小于0.7时,表示多元线性回归模型未通过拟合度检验,对元线性回归模型修正后进行重新训练;
[0111] 当多元线性回归模型的拟合度大于等于0.7,表示多元线性回归模型通过拟合度检验,完成对于多元线性回归模型的训练。
[0112] S111:把回归系数代入回归模型得到低收入人口量化模型,即把S109求得的β0,β1,…,Rn值带入到S105多元线性回归模型即可。
[0113] 通过上述流程,即可基于常规的地方性要求,搭建符合自身地区数值的模型框架,由家庭成员信息、家庭各项收入、家庭各项开支、家庭各项财产、低收入人口政策法规相关指标,以及地区性的专家意见和过去的数据经验作为因素标准,例如在一些地区具有的区域性差别,从而在不同区域性上能够符合当地的经济观念,使整体的模型更具有泛用性。
[0114] 再使用以上因素构建多元性回归模型,划分对应的基数区间,在建立标准化矩阵后对其进行拟合度检验,形成对模型的正确性验证,并形成循环;仅当正确性验证通过后,才正式完成整体模型的构建,以得到符合当地区域下的贫困人口的数据模型。
[0115] 实施例2
[0116] 如图2所示,基于数据建模形成的动态监测单元的具体流程如下:
[0117] S201:定时从政务部门信息中心采集家庭新增或变更数据记录,即设定采集频率,定时从实时动态监测S111量化模型中的特征因素量化值变动。
[0118] S202:对家庭实时数据记录进行清洗加工,具体为:
[0119] 1)对单条数据记录存在空值的数据,用均线高频值来填充或者直接删除;
[0120] 2)在做多数据源融合时,列数据单位不统一时,需要转换为统一;
[0121] 3)对于不合理的数据记录进行删除或修正,比如年龄为150岁;
[0122] 4)对于不唯一的数据记录,进行删除;
[0123] 5)按不同维度汇总复合指标。
[0124] S203:判断是否满足低收入人口政策法规设定的条件,低收入人口政策法规是国家、省、市等各行政区规定的被纳入低收入人口监测范围的硬性条件;
[0125] S203A1:若满足低收入人口政策法规设定的条件,对家庭实时数据记录进行预处理,预处理步骤为S107流程;
[0126] S203A2:低收入人口量化模型计算出家庭困难程度得分,即把S203A1预处理的记录代入到S111的低收入人口量化模型,得出家庭困难程度得分。
[0127] S203B1:若家庭困难程度得分为0,不符合S203的低收入人口政策法规设定的条件家庭,可以认为是正常家庭,直接给0分。
[0128] S204:根据家庭困难程度得分对低收入人口进行分类打标签,基于S203A2计算得到的家庭困难程度得分对应的标签分数区间来打标签:
[0129] 家庭困难程度得分在区间(‑∞,0]时,低收入人口分类标签为正常家庭;
[0130] 家庭困难程度得分在区间(0,1.5]时,低收入人口分类标签为低保边缘家庭;
[0131] 家庭困难程度得分在区间(1.5,3]时,低收入人口分类标签为低保家庭;
[0132] 家庭困难程度得分在区间(3,+∞)时,低收入人口分类标签为特困家庭;
[0133] S205:判断低收入人口分类标签是否变动,分为两类情况:
[0134] 低收入人口之前没有打过分类标签,S204步骤是第一次打标签;
[0135] 低收入人口打过分类标签,S204步骤打的标签和之前不一样;
[0136] S205A:若低收入人口分类标签发生变动,记录到低收入人口分类标签变动表中并产生预警,即将产生的变动的分类标签记录到数据库的物理表中,同时产生一条预警记录,通知政务人员,进行重点监控;
[0137] S205B:若低收入人口分类标签未发生变动,根据低收入人口分类标签及相关政策发放低保金额。
[0138] 实施例2进一步根据原有的模型,建立了动态数据的获取和标签设置,因此设定有预警记录和数据库,以储存过去的数据结论,并对比到实时的数据结论,通过不断的交叉式分析获得某一个家庭在一段时间内的动态情况,且本实施例在实时流程中,不会对原有的模型产生较大的改变。
[0139] 最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页 第1页 第2页 第3页