技术领域
[0001] 本发明涉及人才管理技术领域,尤其涉及一种人才评价模型构建方法及基于该构建方法训练出的评价模型进行人才评价的方法及系统。
相关背景技术
[0002] 目前的人才推荐平台一般应用基于相似度的算法进行职位推荐或岗位推荐,例如中国发明专利申请CN201610333304公开的一种人才推荐平台和中国发明专利申请CN201610272595公开的一种基于大数据的人才能力评价模型系统及方法,都是在获取到人才信息后,基于用人单位与人才信息之间的相似度进行匹配,从而实现人才推荐的。这种方式,只能够实现基于用人单位的需求和人才信息之间的符合度去评价人才的能力水平,而不能实现对人才本身的能力的客观评价,这是因为:人的能力是一种客观存在的属性,而不同用人单位或者同一用人单位不同职位之间的需求是不统一的,因此,基于用人单位的需求与人才信息直接的符合度进行评价的方式,就不能客观体现人才的能力水平。因此,提供一个能够被整个相应领域认可的指标和评价方法,以实现对人才的能力的客观评价,已成为业内亟待解决的问题。一种能够广泛适用的客观的人才评价标准和方法。
具体实施方式
[0023] 下面结合附图对本发明的实施方式作详细的说明。
[0024] 本发明旨在提供一种广泛适用的人才评价方法,其核心构思在于通过为相应领域的人才配置统一的评价标准指标系统,并对配置的评价标准指标系统进行数值化,之后,基于评价标准指标系统和数值化标准采集获取训练集,并通过训练集对选定的模型进行训练,得到评价模型。然后,就可以应用得到的评价模型对未知实例进行分析计算,得到人才的分类等级。由于针对同一领域的人才,配置的评价标准指标系统和数值化标准是统一的,因此对同一领域的人才的评价是客观的,避免了基于不同的企业标准进行评价有失客观公正的不良。图1示出了一种基于softmax模型对人才进行评价的方法,在本发明实施例中,选用的评价模型是softmax模型,评价对象为对IT人才进行评价,如图1所示,在本发明实施例中方法可以具体实现为:
[0025] 步骤S101:确定IT人才评价标准指标系统以及其相关子要素。
[0026] 本发明实施例中,根据IT行业对人才的综合要求和实际情况,确定的IT人才评价标准指标系统主要由五大要素组成,分别可以为“基本属性”、“技术水平”、“外语水平”、“商务素质”和“人才行为”。为每个要素指定相应的子要素集如下:
[0027] 为“基本属性”分配的子要素为包括“学习经历”和“工作经历”;为“技术水平”分配的子要素为包括“高级程序设计”、“数据库概念和应用”、“操作系统原理”、“计算机网络和技术”、“软件工程”、“IT认证和等级考试”;为“外语水平”分配的子要素为包括“英语”、“日语”、“法语”、“韩语”、“俄语”、“拉丁语”等;为“商务素质”分配的子要素为包括“沟通能力”、“职业性格”、“知识产权等相关法律熟知程度”、“团队合作意识”;为“人才行为”分配的子要素为包括“登陆实习系统频率”、“在线实验频率”、“在线实验报告得分”、“实验完成数量”、“实验完成比率”、“课程完成数量”、“课程完成比率”。其中,“人才行为”主要是指求职者的行为数据,本发明实施例以该行为数据为求职者的在线学习的行为数据为例进行说明,在其他实施例中该行为数据也可以是其他的子要素集,只要能够表征求职者的行为数据即可,例如与相应的在线学习系统的相应行为配套。
[0028] 步骤S102:确定IT人才评价标准指标系统的各子要素的属性数值化标准。
[0029] 对步骤S101中确定的各个要素的子要素组成的子要素集,通过调研和参考等级考试的考试指标等方式,建立映射函数,以实现对人才实例子要素属性的数值化。其中,调研主要是指进行数据收集,获取不同子要素属性对应的各种等级考试以及其考试指标,例如通过网络爬虫进行数据收集、通过调查问卷的方式获取数据信息、通过特定的APP客户端获取用户数据信息等。而建立映射函数以实现对人才实例子要素属性的数值化,主要是指建立标准等级考试的分数到子要素属性的数值的映射,标准等级考试的类型及其对应的考试分数通过数据收集获取,而子要素属性的数值可以根据需求设定为一个统一的数值标准,例如某人TOEFL考试的成绩60分以下,则可以设定对应的英语能力为1分(即该子要素属性的数值映射为1),TOEFL考试的成绩为61-70分,则可以设定对应的英语能力为2分,...,TOEFL考试成绩为105分以上,则可以设定对应的英语能力为5分,而IELTS的成绩为7分以上则对应的英语能力设定为5分等等。这样,通过调研和参考等级考试的考试指标等方式,为不同的子要素属性配置标准数值,就可以实现避免不同的考试评分系统对子要素属性值的影响,实现对配置的子要素的评价标准的一致化,而各个子要素属性的具体映射值的设置,可以根据需求随意设定,只要使得相应的子要素属性是基于统一标准的即可,本发明实施例不对具体映射值进行限制。
[0030] 需要说明的是,这里的建立标准等级考试的分数与子要素属性的数值之间的映射,可以是根据调研获取到的信息和设定的数值化标准,建立匹配规则进行存储,以在获取到某求职者的子要素属性值时,通过匹配规则存储的映射关系,将获取到的子要素信息转化为标准的子要素数值,也可以是根据两者之间的映射关系,例如基于调研得到的等级考试的考试指标成绩值与确定的子要素标准数值之间的映射关系,选用合适的数学映射函数实现两者之间的映射,本发明实施例对建立映射函数实现子要素属性的数值化的具体实现方式不进行限制,只要能够实现将采集的人才子要素信息映射为统一的标准数值即可。
[0031] 步骤S103:根据IT人才评价标准,采集人才信息,打上分类标签。
[0032] 在为IT人才配置了上述评价标准指标系统和子要素属性的数值化标准后,就可以根据上述指标系统中的子要素集,对IT人才的信息进行采集,例如通过网络爬虫、调查问卷和专用的app客户端等方式进行信息采集,并根据采集到的信息和配置的各个子要素属性的数值化标准,生成训练集。其中,根据采集到的信息和配置的各个子要素属性的数值化标准生成训练集的过程为:将采集到的IT人才评价标准指标系统中的所有子要素属性变量的值通过步骤S102中的映射转化为统一的数值,并将转化后的子要素属性的数值集合标记为x,缺失值由该变量的中位数代替,其中,缺失值是指数据采集过程中由于数据来源不一致或者数据不完整等原因而造成的没有获取到该样本相应子要素属性的数值的情况,而中位数则是指采集到的该子要素属性的所有有效取值的集合的中值,例如,采集了四个人才样本,四个人的年龄分别为18、null、22、23,缺失值就是null,而中位数就是22。将集合中的子要素属性变量的个数标记为n,将各个子要素对应的人才等级分类标记为y,y的分类标准根据IT人才的实际求职情况、薪资待遇等确定(该标准可以参考人力资源系统中已有的分类标准),例如可以将y配置为等级1、2、3、4、5,1表示最好的人才,5表示最差的人才,由此,即可根据采集的子要素变量和子要素变量对应的人才等级分类生成训练集,即可将人才信息的训练集标记为{(x(1),y(1)),…,(x(m),y(m))},其中 表示x(i)是n+1维向量,x(i)表示第i个人才样本的属性向量(即第i个人才样本对应的采集到的子要素信息的集合),恒为1, (j=1,2,…,n)表示第i个人才样本中的第j个子要素属性变量的取值,j表示第j个子要素属性;y的可选值集合的个数标记为k(例如在将y划分为包括等级1、2、3、4、5的例子中,y的可选值就为1、2、3、4、5,其形成的集合的个数k就为5)。其中,将x(i)定义为n+1维向量,而 恒为1,这样,就可以在x的所有属性的线性组合的基础上增加一个不受x的属性影响的偏置值,提高通过模型进行人才等级分类预测的准确率。
[0033] 步骤S104:训练softmax模型。
[0034] 训练是指根据已知数据寻找模型参数的过程,最终搜索到的映射被称为训练出来的模型。而Softmax模型的本质就是将一个n维的任意实数向量V1压缩(映射)成另一个k维的实数向量V2,其中,生成的另一个实数向量中的每个元素取值都介于(0,1)之间。本发明实施例即是基于步骤S103中确定的训练样本集,训练出softmax模型,以用于对人才的等级分类进行预测。其中,设定的softmax模型如式(1)所示,模型参数为 该式表示该人才在x属性的情况下,根据参数值为 的模型,可以预测到把这个人才分到相应的等级y的概率。由于已知步骤S103中的训练样本集的属性向量x(i)和每个属性向量对应的y,即每个训练样本集中的人才已经对应了y标签,比如训练样本集中某个样本对应的y为2,即在训练样本集中的y为一个已知的确定值,因此基于样本集中的属性向量x(i)和y就可以对式(1)的模型进行训练,以调整模型参数 使得y取得相应得确定值如2得概率越大越好,而y取得其他可选值的概率越小越好,由此训练出得模型参数就可以使得实际未知样例得预测结果更加精准。
[0035]
[0036] 可见使用训练集训练模型的目的在于调整模型参数,使模型的准确率逐步提高。在具体实现中,可以选用现有技术中的训练技术对模型进行训练,例如可以使用梯度下降法或者L-BFGS算法等技术训练式(1)中的模型参数。在优选实施例中,还通过最小化代价函数来计算梯度,进行模型参数的优化,如下式所示,得到的最小化代价函数J(θ)为:
[0037]
[0038] 其中,1{表达式}为指数函数,如果表达式为真,则1{表达式}等于1,否则1{表达式}等于0。通过该最小化代价函数就可以对模型参数进行优化。其中,优化算法的具体优化过程和原理可以参照现有技术,本发明实施例对此不进行赘述,本领域技术人员应当理解的是,本发明可以选用多种现有的优化算法对模型参数进行优化,而最小化代价函数进行优化只是一个具体实例,不视为对选用的优化算法的限制。
[0039] 步骤S105:基于softmax模型,预测IT人才的等级分类。
[0040] 在训练出softmax模型之后,即式(1)的模型后,获取待评价的IT人才的各个子要素对应的变量值(即未知的人才样例),将子要素的变量取值代入式(1)的softmax模型,即可得到该人才的子要素集对应的人才分类标准y的所有取值的概率,取由式(1)所示的softmax模型得到的y(i)∧的所有取值中概率最大的取值作为该IT人才的标记(即等级分类标记),如下式所示为:
[0041]
[0042] 其中, 表示令 取得最大值的j,而得到的j即对应了分类标准y的可选值的编号,由此,就可以通过j得到更符合该IT人才的分类标准值。由于softmax模型得到的是所有取值中概率最大的取值,因此,该取值作为IT人才的标记,更符合客观实际,对人才的等级划分更精准可靠,具有更高的参考价值。而且由此也可以看出,通过softmax模型进行预测,实现非常简单。
[0043] 图2示意性地显示了本发明一种实现方式下的人才评价系统的框架结构。如图2所示,该系统2包括存储模块20、评价标准配置模块21、评价标准转化模块22、模型训练模块23和等级预测模块25。其中,评价标准配置模块21用于配置人才评价标准指标系统以及其映射关系存储至存储模块20,并且还配置评价模型存储至存储模块20,其中,人才评价标准指标系统包括基本要素,每个基本要素中对应包括有多个子要素属性,映射关系包括将各个子要素属性对应的社会信息(即现实中各个子要素属性对应的各种评价信息)映射为标准化的数值,以及将各个人才的取标准化数值后的子要素属性向量映射为一个符合设定标准的人才等级分类标记。评价标准转化模块22用于根据映射关系生成各个人才样例的子要素属性的标准化数值向量集合和人才分类标记存储至存储模块20,其中,每个人才的子要素属性向量集对应了一个与之匹配的人才等级分类标记,即形成了一个对值。模型训练模块23用于根据评价标准转化模块22中形成的属性向量集和人才等级分类标记的对值生成训练集,并根据训练集对评价模型进行训练生成模型参数,输出训练好的评价模型。等级预测模块25用于根据训练模型(即训练好的评价模型)生成待评价人才的等级分类预测值输出。
其中,如图2所示,该系统还包括信息采集模块24,用于根据人才评价标准指标系统采集相应的人才信息,从而得到人才样例信息存储。在具体实现中,用户或管理员可以通过评价标准配置模块21的用户接口设置人才评价标准指标系统及其映射关系和评价模型,并由评价标准配置模块21将接收到的配置信息存储,例如通过数据库存储。之后,评价标准转化模块
22将获取信息采集模块24采集的人才样例信息,根据映射关系对人才样例信息进行转化将其映射为标准数值存储,即获取各个人才样例的与子要素属性对应的采集数据,根据设置的映射关系,将其映射为子要素属性标准数值,从而得到各人才样本的子要素向量集,之后再根据映射关系和子要素属性的标准数值,得到该人才样例对应的人才等级分类标记存储。之后,模型训练模块23就会根据人才样本的向量集和各个人才样本对应的等级评价标准生成训练集,以基于模型(如softmax模型)进行训练,训练出模型参数,从而得到训练出的模型。最后,在对某个人才进行评价时,只需获取该待评价人才的子要素信息(例如通过数据采集模块或者通过用户输入),就可以将待评价人才的子要素信息代入训练出的模块,实现对该人才的分类等级的预测。在基于softmax模型进行训练时,输出的预测结果为该人才的子要素信息对应的等级分类的所有取值的概率,此时通过获取最大概率值,即可得到该人才的等级标记。以模型为softmax模型为例,本发明实施例系统中的各模块的具体实现过程可参照前文方法部分的叙述,在此不再赘述。其中,在具体实施例中,人才可以是IT人才,也可以是其他行业领域的人才,以IT人才为例,人才评价标准指标系统可以是由基本属性、技术水平、外语水平、商务素质以及人才行为五大要素组成,每个要素包括有相应的子要素集,为“基本属性”分配的子要素为包括“学习经历”和“工作经历”;为“技术水平”分配的子要素为包括“高级程序设计”、“数据库概念和应用”、“操作系统原理”、“计算机网络和技术”、“软件工程”、“IT认证和等级考试”;为“外语水平”分配的子要素为包括“英语”、“日语”、“法语”、“韩语”、“俄语”、“拉丁语”等;为“商务素质”分配的子要素为包括“沟通能力”、“职业性格”、“知识产权等相关法律熟知程度”、“团队合作意识”;为“人才行为”分配的子要素为包括“登陆实习系统频率”、“在线实验频率”、“在线实验报告得分”、“实验完成数量”、“实验完成比率”、“课程完成数量”、“课程完成比率”。
[0044] 以上所述的仅是本发明的一些实施方式。对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。