技术领域
[0001] 本发明涉及亲子关系评价技术领域,具体涉及一种亲子关系评价方法及装置。
相关背景技术
[0002] 亲子关系是青少年发展的关键因素之一,良好的亲子关系对青少年身心健康、社会适应和学业成就等方面的健康发展具有关键影响。因此,准确评价亲子关系的质量对于更好地理解青少年发展以及更有效地开展指导干预至关重要。然而,现有的亲子关系评价方法主要为量表、观察法和访谈法等传统方法,存在一定局限性,例如受访者主观记忆的偏差、评价者的主观判断和时间成本的限制,并且评价结果也不够准确。
具体实施方式
[0045] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0046] 根据本发明实施例,提供了一种亲子关系评价方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0047] 在本实施例中提供了一种亲子关系评价方法,可用于移动终端,如手机、平板电脑等,图1是根据本发明实施例的亲子关系评价方法的流程图,如图1所示,该流程包括如下步骤:
[0048] 步骤S101,获取目标对象的多个目标文本,多个目标文本均记载了目标对象与家人之间的故事。
[0049] 具体地,目标对象可以是学生,多个目标文本可以是学生的多篇作文,该多篇作文记载了学生与自己家人(爸爸、妈妈、爷爷、奶奶、兄弟姐妹)之间的日常故事。本公开实施例主要通过多个目标文本,进而确定目标对象与家人之间的亲子关系。
[0050] 步骤S102,对每个目标文本依次进行清洗和分词处理,得到目标词语。
[0051] 在一种可选的实施方式中,对每个目标文本依次进行清洗和分词处理,得到目标词语,包括:
[0052] 步骤a1,删除每个目标文本与评价亲子关系不相关联的无效词语。
[0053] 步骤a2,对删除处理之后的每个目标文本进行分词处理,并过滤停用词。
[0054] 具体地,对所收集的每个目标文本进行清洗,删除无关内容等无效作答数据。同时对文档进行分词处理,去除停用词。
[0055] 通过执行该实施方式,有利于准确计算每个目标文本的情感极性。
[0056] 步骤S103,利用自然语言模型对目标词语进行词性标注,得到基于目标文本的多个意见词,多个意见词包括形容词、副词和动词。
[0057] 具体地,意见词是指作文中出现的形容词、副词和动词等影响情感极性的词。使用自然语言处理中的自然语言模型BERT对作文中的词语进行词性标注,从中抽取出形容词、副词和动词,形成意见词集合O={o1,o2,…,on}。
[0058] 步骤S104,获取每个意见词对应的词向量。
[0059] 在一具体示例中,可以通过标准词典查询每个意见词对应的词向量。
[0060] 具体地,将GloVe词向量存储为标准字典,标准字典的键是词,值是词对应的m维词向量。对于意见词集合O中的每个意见词oi,在GloVe词向量字典中查找相应的向量ei可表示为ei=(ei1,ei2,…,eim)。
[0061] 步骤S105,基于每个意见词对应的词向量,计算每个目标文本的情感极。
[0062] 在一具体示例中,基于每个意见词对应的词向量,计算每个目标文本的情感极性,通过如下公式计算:
[0063] S=softmax(Wv+b),
[0064] 其中,W为权重矩阵,b为偏置,情感极性取值为S={积极,中性,消极},v为每个意见词对应的词向量。
[0065] 因此,通过该方式计算每个意见词对应的词向量,可获知每个目标文本的情感极性是积极或中性或消极,进而有利于提高了亲子关系评价的客观性和科学性。
[0066] 步骤S106,计算每个目标文本的主题分布结果和主题词语分布结果。
[0067] 具体地,获取了M篇目标文本,记为G1,G2,…,GM,其中每篇文档Gi(i=1,…,M)的单词记为Dij(j=1,…,Ni),Ni为单词数;主题记为T1,T2,…,TK,K为主题数。
[0068] 在一种可选的实施方式中,计算每个目标文本的主题分布和主题词语分布,通过如下公式计算:
[0069]
[0070]
[0071] 其中, 为每个目标文本的主题分布结果,Gi为第i个目标文本,Tk为第k个主题数,α为文本Gi服从的狄利克雷函数Dirichlet的分布参数,表示文本与主题分布的稀疏性,β为主题Tk服从的狄利克雷函数Dirichlet的分布参数,表示主题与词分布的稀疏性,n为目标文本数量, 为每个目标文本的主题词语分布结果,Dj为第j个主题词语,Ni为单词数量。
[0072] 步骤S107,根据每个目标文本的主题分布结果和主题词语分布结果,确定每个目标文本的主题词,以得到目标对象与家人之间的亲子关系的关注点。
[0073] 具体地,根据每个目标文本的主题分布结果和主题词语分布结果,可以对每个目标文本的主题中词的概率进行排序,找到每个主题可能的关键词。在此基础上,选取每个主题下的排序靠前的词,取并集作为目标对象多个目标文本中的主题词,用以反映学生对亲子关系的关注点。
[0074] 本公开实施例提供的亲子关系评价方法,将目标对象的目标文本作为评价亲子关系的依据,对每个目标文本依次进行清洗和分词处理,得到目标词语;利用自然语言模型对目标词语进行词性标注,得到基于目标文本的多个意见词,多个意见词包括形容词、副词和动词;获取每个意见词对应的词向量;基于每个意见词对应的词向量,计算每个目标文本的情感极性(包括亲子关系中的“积极、中性、消极”的三分类评价);计算每个目标文本的主题分布结果和主题词语分布结果;根据每个目标文本的主题分布结果和主题词语分布结果,确定每个目标文本的主题词,以得到目标对象与家人之间的亲子关系的关注点,进而降低了问卷、访谈等传统亲子关系测评方式的社会期望效应,提高了亲子关系评价的客观性和准确性。同时,本发明还能够为改善亲子关系提供方向性的指导。
[0075] 在本实施例中还提供了一种亲子关系评价装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
[0076] 本实施例提供一种亲子关系评价装置,如图2所示,包括:
[0077] 文本获取模块21,用于获取目标对象的多个目标文本,多个目标文本均记载了目标对象与家人之间的故事;
[0078] 词语确定模块22,用于对每个目标文本依次进行清洗和分词处理,得到目标词语;
[0079] 词语标注模块23,用于利用自然语言模型对目标词语进行词性标注,得到基于目标文本的多个意见词,多个意见词包括形容词、副词和动词;
[0080] 词向量获取模块24,用于获取每个意见词对应的词向量;
[0081] 情感极性确定模块25,用于基于每个意见词对应的词向量,计算每个目标文本的情感极性;
[0082] 主题分布计算模块26,用于计算每个目标文本的主题分布结果和主题词语分布结果;
[0083] 亲子关系评价模块27,用于根据每个目标文本的主题分布结果和主题词语分布结果,确定每个目标文本的主题词,以得到目标对象与家人之间的亲子关系的关注点。
[0084] 在一种可选的实施方式中,词语确定模块22,包括:
[0085] 删除子模块,用于删除每个目标文本与评价亲子关系不相关联的无效词语;过滤子模块,用于对删除处理之后的每个目标文本进行分词处理,并过滤停用词。
[0086] 在一种可选的实施方式中,词向量获取模块24,包括:
[0087] 获取子模块,用于通过标准词典查询每个意见词对应的词向量。
[0088] 在一种可选的实施方式中,情感极性确定模块25基于每个意见词对应的词向量,计算每个目标文本的情感极性,通过如下公式计算:
[0089] S=softmax(Wv+b),
[0090] 其中,W为权重矩阵,b为偏置,情感极性取值为S={积极,中性,消极},v为每个意见词对应的词向量。
[0091] 在一种可选的实施方式中,词语标注模块23计算每个目标文本的主题分布和主题词语分布,通过如下公式计算:
[0092]
[0093]
[0094] 其中, 为每个目标文本的主题分布结果,Gi为第i个目标文本,Tk为第k个主题数,α为文本Gi服从的狄利克雷函数的分布参数,表示文档‑主题分布的稀疏性,β为主题Tk服从的狄利克雷函数的分布参数,表示主题‑词分布的稀疏性,n为目标文本数量, 为每个目标文本的主题词语分布结果,Dj为第j个主题词语,Ni为单词数量。
[0095] 上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
[0096] 本实施例中的亲子关系评价装置是以功能单元的形式来呈现,这里的单元是指ASIC(Application Specific Integrated Circuit,专用集成电路)电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
[0097] 本发明实施例还提供一种计算机设备,具有上述的亲子关系评价装置。
[0098] 请参阅图3,图3是本发明可选实施例提供的一种计算机设备的结构示意图,如图3所示,该计算机设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在计算机设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个计算机设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图3中以一个处理器10为例。
[0099] 处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
[0100] 其中,所述存储器20存储有可由至少一个处理器10执行的指令,以使所述至少一个处理器10执行实现上述实施例示出的方法。
[0101] 存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0102] 存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
[0103] 该计算机设备还包括通信接口30,用于该计算机设备与其他设备或通信网络通信。
[0104] 本发明实施例还提供了一种计算机可读存储介质,上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
[0105] 虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。