技术领域
[0001] 本发明涉及智慧养老技术领域,具体的,涉及一种应用于养老照护服务的智慧语义识别系统。
相关背景技术
[0002] 当前,人口老龄化日趋严重,这对老年人的照护服务带来了巨大的压力,特别是在对失能失智老人的照护过程中,如何提高照护效率、减轻照护人员的压力、并且帮助照护人
员提供更加专业的照护服务,进而确保照护质量,是目前对老年人开展照护服务过程中面
临的主要问题;
[0003] 当前在老年人的照护服务过程中,大多依靠个人经验,采用传统的手工记录方式来开展照护服务工作,虽然伴随着智慧养老产业的发展,针对这一问题也出现了一些相关
的技术方案,但技术应用较为粗浅,总结起来可分为照护机器人和手持照护执行终端两种
类型;
[0004] 养老照护机器人主要是采用计算机视觉、室内导航、语音识别等技术手段,为老年人提供生活提醒、安全监测、文化娱乐、交流互动等服务;在照护机器人中也采用了语音识
别的技术,根据老人的语音来开展相应的服务,但这个语音识别技术主要是基于日常交流
常用词汇,提供给老年人使用,且缺少对方言的支撑,需要老年人采用相对标准的普通话和
相对固定的话术来表达意愿,通过对老年人说出来的语音进行识别并给出反应,实现与老
年人的娱乐互动作用,更多的是提供娱乐交流服务;
[0005] 手持照护执行系统是目前在养老护理过程中使用的主要工具,其用户为照护人员,一般部署在手机等移动终端上,帮助照护人员按照提前制定的照护计划进行老年人照
护工作,并记录照护执行的结果,目前的手持照护执行系统基本上不具备语音记录和识别
分析功能,而是采用计算机网络和软件开发技术,通过在页面中手动输入来记录结果,是一
个记录工具,无法为照护人员的日常照护工作提供知识辅助;
[0006] 经检索,申请公布号为CN111489745A的一种应用于人工智能的汉语语音识别系统,该发明的语音识别系统采用基于CNN的深层的卷积神经网络作为网络系统,并采用梅尔
倒频谱算法将语音文件直接转换为语谱图像作为网络系统的输入,在输出端通过解码处
理,实现整个系统的端到端训练,将声音波形信号直接转录为中文普通话拼音序列;在语言
系统上采用马尔可夫系统,同时客户端通过指令集优化和算法加速提高人声语音识别的处
理速度,较现有技术的语音识别系统具有更快的运算处理速度和准确的语音、语境识别能
力;
[0007] 但是上述现有的养老服务存在如下问题:现有技术方案只能为照护人员提供固定结果的记录工具,无法为照护人员提供专业指导和异常数据的记录分析功能,从而也无法
帮助照护人员提高服务质量,减轻照护压力;
[0008] 难以适应不同年龄阶层的照护人员使用,特别是对于年龄较大、文化水平较低、方言较重的照护人员使用难度较大;
[0009] 没有过程数据积累,无法做到照护过程的回溯和照护经验的累积,对用户提升照护服务能力没有帮助;
[0010] 为此,我们提出了一种应用于养老照护服务的智慧语义识别系统。
具体实施方式
[0044] 下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的
实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都
涉及本发明保护的范围。
[0045] 实施例1
[0046] 如图1所示,一种应用于养老照护服务的智慧语义识别系统,该识别系统包括语义知识库、语音识别算法、语义分析和辅助决策;
[0047] 语义知识库,用于在语音识别过程中为计算机的自动解译提供可转换的知识信息;
[0048] 语音识别算法,用于对照护人员输入的语音音频进行识别,将其转换成计算机能识别的语义信息;
[0049] 语义分析和辅助决策,用于对语音识别的结果进行分析,以判断其准确性,并筛选能用于辅助决策的信息,最后根据语义分析筛选的决策分析信息,生成辅助照护信息。
[0050] 作为本发明进一步的技术方案,所述语义知识库的内容包括:
[0051] 保存方言和普通话音频特征对应关系的语音特征库;
[0052] 保存普通话和语义文本之间的对应关系,以及语音内容类别关键字的语义特征库;
[0053] 保存照护知识信息,以及照护知识关键字词条的老人护理知识库。
[0054] 作为本发明进一步的技术方案,所述语音特征库所包含的方言和普通话音频特征对应关系包括:
[0055] 基于不同地方方言的语音索引;
[0056] 根据某一种地方方言的语音索引确定对应的普通话音频特征。
[0057] 作为本发明进一步的技术方案,所述语音特征库所包含的照护知识信息包括:
[0058] 根据不同长者照护日常所需确定照护方法;
[0059] 根据不同长者日常营养需求确定定制化营养食谱信息;
[0060] 根据不同长者日常文化休闲需求确定对应的健康护理信息;
[0061] 根据长者所表现的症状确定长者身体和精神状态的知识信息。
[0062] 作为本发明进一步的技术方案,所述语音识别算法包括:
[0063] 根据不同方言自动提取方言音频特征;
[0064] 根据输入的语音自动识别方言和普通话,确定对应关系;
[0065] 根据提取的音频特征自动识别对应的语义文本信息;
[0066] 对于无法识别的结果,自动判断追加普通话特征标注信息,确定方言和普通话对应关系。
[0067] 作为本发明进一步的技术方案,所述语义分析和辅助决策包括:
[0068] 根据识别出的语义文本自动识别语音内容类别;
[0069] 根据语音内容类别,确定语音内容的处理流程,自动流转语音内容信息;
[0070] 根据识别的语音内容,确定照护过程情况,记录照护过程信息;
[0071] 根据需要提供照护辅助的语音内容信息,自动筛选对应的照护知识信息,生成反馈信息,辅助护理人员做好照护工作。
[0072] 其流程如图1所示。
[0073] 根据图1的流程所示,在照护人员通过移动终端等照护设备录入语音后,系统结合语义知识库自动对语音音频进行解码,将其转换为语义文本信息,并对转换后的语义信息
进行分析筛选,对于无法收敛的语义信息,认为其是新增的语义信息,加入知识库;对于可
以收敛但不需要进行帮助的语音信息,则将其作为行为记录类别,保存到数据库中;对于可
以收敛但需要进行帮助的语音信息,则通过辅助决策算法,挖掘有用的帮助信息,生成辅助
信息反馈给用户。
[0074] 语义知识库用于语音解译过程中,为语音识别算法提供语音特征提取和语义搜索辅助。知识库采用关系型数据库进行存储,包括音频特征库、语义特征库、护理知识库三部
分内容,其中音频特征库保存的是方言与普通话的音频特征对比信息;语义特征库保存的
是普通话音频特征和语义文本之间的对应信息,并包括语音内容类别关键字特征内容;护
理知识库保存的照护知识信息,其中包括照护知识的关键字特征内容。
[0075] 语音识别算法用于对照护人员输入的语音音频进行识别,将其转换成语音文本信息。语音识别算法的逻辑流程如图2所示:
[0076] 语音特征提取过程是以参数形式来表示语音波形的过程,包括分帧预处理、频域转换、滤波、特征提取运算等步骤。其中分帧预处理的时间窗口设置为帧长的三分之一,即
每一次分帧都偏移该帧三分之二的位置,将其作为获取下一帧的起始位置。频域转化采用
快速傅里叶变换算法,设N为总帧数,n为某一帧的序号,F(m)为第m个输出,S(n)为第n帧的
输入信息,则按照下面的公式一计算频域输出内容:
[0077]
[0078] 在计算出F(m)后,为了适应人类的感知能力,采用梅尔滤波器将傅里叶频域中的数据转换为梅尔频率,实现滤波过程,通过公式二和公式三计算音频特征,得到特征频谱数
据。
[0079]
[0080] 其中
[0081]
[0082]
[0083] 最后从特征频谱数据中根据公式四提取频谱图的主要频率V,作为最终的语音特征
[0084]
[0085] 在语义知识库的音频特征库中,保存的就是通过上述计算得到的语音特征序列,其中包含了常用的普通话和地方方言的语音特征,并针对不同地区方言的应用需求,建立
方言检索信息,并将方言和普通话做了对应关系,然后通过人工标注的方式,为每一段普通
话语音特征标注实际表达的语义信息,从而形成语义特征库。
[0086] 在提取语音特征的基础上,结合语音特征库的内容进行搜索,查找特征序列后验概率最大的结果,进而完成语音特征匹配过程,得到语音所对应的语义信息。设一段语音经
过特征提取后得到的特征序列为v={v1,v2,v3,…,vn},其中vi是某一帧的语音特征向量,i
=1,2,…,n,n为语音特征向量总数,特征库中对应的语义文本序列为W={w1,w2,w3,…,
wm},其中wi为某一个文本信息,i=1,2,…,m,m为语义文本总数。通过公式五计算后验概率
最大的组合。
[0087]
[0088] 其中P(V|W)为语音特征库中的对应序列,P(W)用来判断一个语言序列是否为正常语句的概率,通过公式六和公式七计算得到:
[0089]
[0090] 语义分析和辅助决策是在语音识别的基础上,根据语音识别得到的文本内容进行分析,为护理人员的日常照护提供辅助知识。其中语义分析和辅助是通过关键字匹配,得到
语音内容的类别,根据不同类别进行不同的处理。设语音内容为M,关键字匹配收敛值为K,
设定的收敛范围S,匹配得到的关键字为q,不同类别的关键字集合Q={Q1,Q2},Q1代表是行
为记录的关键字序列;Q2代表护理知识关键字序列。则对语音内容的处理按下列方式处理:
[0091] 如果:Smin
[0092] 如果:q∈Q1
[0093] 则将语音内容M保存到行为记录数据库中。
[0094] 如果:q∈Q2
[0095] 则根据照护知识库中的关键字特征,查找对应的照护信息并生成反馈信息。
[0096] 否则:
[0097] 返回需用户确认的提示信息。
[0098] 否则:
[0099] 对语音特征追加对应的普通话信息,加入语音特征库。
[0100] 实施例2
[0101] 在实施例1的基础上,本实施例以德清县某颐养院数字化项目为例,针对颐养院综合信息管理系统的照护系统,部署了养老照护服务的智慧语义系统,语音系统通过服务器
搭建,并在德清县某颐养院随机抽取50名老人,通过系统对50名老人的德清方言“日常护
理”、“助餐”、“助浴”、“跌倒”、“高血压”、“糖尿病”、“送餐”、“活动”、“娱乐”、“下棋”、“康复”等常用词汇进行训练,并将其和对应的普通话进行关联;
[0102] 关联完成后,照护人员日常照护中通过语音记录照护过程,解决了照护人员手动输入效率低、输入内容不规范、照护内容记录不完整、以及普通话不标准等问题,实现了照
护人员日常照护过程的语音记录过程,并将其记录内容自动识别为文字信息,通过管理人
员校验审核后,作为老人日常照护的档案存入数据库,为管理人员对照护过程和照护质量
监管提供了数据基础。
[0103] 同时,在依据现有语义的基础上,每3个月增加一次新的方言词汇录入,通过系统进行训练,并将其和对应的普通话进行关联。
[0104] 实施例3
[0105] 在实施例1的基础上,张大爷入住颐养院的时候填写个人资料,上传体检报告等内容,其中个人的健康状况和生活习惯中录入了“糖尿病”、“喜欢走路”、“微胖”等关键字,录入系统后根据系统中设置的知识库进行匹配,建议其食谱为低糖、低热量食物为主,主要包
括蔬菜、低糖水果(如蓝莓、草莓、桃子、西瓜、苹果、梨、桔子、柚子等)、以及鱼、虾、瘦肉、鸡蛋、牛奶等高蛋白食物,依据其日常营养需求确定定制化营养食谱信息。
[0106] 实施例4
[0107] 在实施例1的基础上,王阿姨入住颐养院后,某日照护人员在对其进行日常护理,测量血压发现血压高于正常值,在照护终端中通过语音录入“王**,**月**日测量血压高
压**,低压**,心率**”等护理信息,系统在自动识别语音内容,并进行语义分析后,将识别
出的血压、心率等数据记录到王阿姨的日常健康档案中,并结合系统的知识库,就高血压这
一症状,针对王阿姨入院填写的基础信息中有“高血压”这一资料,系统给出“请确认是否未
及时服用降压药或刚活动结束,如已服用降压药并未活动,则先静卧15分钟后复查”这一护
理建议,协助护理人员及时进行正确处置。
[0108] 综上,在长者护理过程中采用语音识别技术进行过程记录和护理辅助,相比当前单纯文字记录的方式能够更好的记录照护过程详细信息,减少信息缺漏,有利于照护过程
的追溯和经验知识积累。
[0109] 在语音识别记录识别过程中针对方言进行的算法改进,能够适应不同地区、不同年龄阶段的护理人员的语音记录过程,有效提高照护工作的普适性。
[0110] 通过对识别内容的分析和辅助决策,帮助护理人员有效的解决文化水平不高、护理知识缺乏等问题,提高护理质量,减少护理事故发生。
[0111] 效益方面,当前普遍采用的文字记录和手持端手工输入的记录方式,一方面极大增加了护理人员的工作强度和难度,同时因为缺乏相应的知识库支撑,使得护理人员在面
临照护问题的时候往往难以采用最有效的方法去解决,甚至导致护理事故的发生,基于本
发明开发的照护终端则能有效的避免上述问题,为养老机构和相关的护理单位降本增效提
供有益的帮助,在当前养老市场不断扩大的情况下,能够带来显著的经济和社会效益。
[0112] 需要说明的是,在本发明思路的主导下,可能出现的替代方案主要有基于移动端软件的手动输入方案和基于监控探头的视频记录方案。
[0113] 其中前者通过手动输入问题或记录照护过程,来实现照护过程中护理知识的获取,以及照护过程追溯的目的,但这种方式依赖于护理人员的知识水平,能够做到准确的用
文字描述问题并快速输入,对于目前大多数养老机构雇佣的护理人员来说,因为年龄较大、
且知识水平欠缺,难以做到,且记录过程也存在较大的随机性,故此方案虽可替代,但在效
率、精确性、以及普适性等方面均存在不够细致准确、效率低下和普适性低的问题。
[0114] 通过监控探头的视频记录照护过程的方案可有效的记录照护过程中发生的具体事项,但存在隐私泄露等问题,不具备推广价值,同时视频记录的方式无法获取照护的辅助
信息,对指导护理人员更好的开展护理工作帮助较少,应用效果较差。
[0115] 以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。