技术领域
[0001] 本发明涉及通信技术领域,尤其涉及一种基于知识图谱的电网来电业务处理方法、装置及存储介质。
相关背景技术
[0002] 随着无线通信技术日新月异的发展和社会服务意识水平的不断提高,用户对客服人员的服务效率、服务模式和服务质量都提出了越来越高的要求。
[0003] 目前,客服人员与用户之间的通信一般通过客户服务系统进行电话沟通实现。在电话沟通方式中,客户服务系统根据用户的电话请求,为用户自动分配可以进行服务的客服人员,但是自动分配的客服人员有可能不是负责处理该用户的问题的客服人员,需要更换客服人员,从而导致客服效率较低,用户体验较差。
[0004] 在语音系统中,对于客服行业预测用户来电咨询的业务类别,存在两个问题:
[0005] (1)传统方法采用对用户历史时间内最临近的行为特征作为依据,再使用预测算法实现类别的划分,缺少对历史时间中多行为多类别因素的分析,导致预测结果存在偏差,无法准确分析用户来电咨询意图,影响客服通话过程的服务质量,服务质量不佳。
[0006] (2)缺少实时更新多行为权重信息能力,导致预测结果不符合当下实际需求。
[0007] 目前电力企业针对客户服务(95598)业务开展了多方位的研究,但主要围绕客户标签的应用方面,缺乏对客服业务自身管理方面的研究。而电力95598业务量巨大,人力资源成本占了很大份额,如何提高其运营效率成为管理者亟侍解决的问题。
[0008] 另一方面,客服中心的高效管理要求根据工作量来调用电话客服中心的资源,而准确的客服业务来电预测是重中之重。当前,客服中心的来电量预测主要由管理工作人员凭经验结合简单的模型预测来做,存在着工作量大、因人而异的随意性问题,往往导致预测准确性不够,为随后的电话值班人员精细管理带来诸多问题。
[0009] 因此,提出一种基于知识图谱的电网来电业务处理方法、装置及存储介质,来解决现有技术存在的困难,是本领域技术人员亟需解决的问题。
具体实施方式
[0054] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0055] 在本申请中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0056] 本发明可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
[0057] 参照图1所示,本发明公开了一种基于知识图谱的电网来电业务处理方法,包括以下步骤:
[0058] S1、来电号码获取步骤:获取来电号码;
[0059] S2、知识图谱获取步骤:获取预设的知识图谱,预设的知识图谱基于电网语料进行自然语言处理模型构建,对自然语言进行电网知识抽取,并将抽取结果存入图结构数据库,基于历史来电号码的业务类型,建立历史来电号码与图结构数据库映射关系;
[0060] S3、来电业务判断步骤:判断来电号码是否为历史来电号码,若为是,则进入S4,反之,则进入S5;
[0061] S4、历史来电分类接待步骤:基于历史来电号码的业务类型查找对应图结构数据库映射关系,进行历史来电号码的业务分类接待;
[0062] S5、新来电接待步骤:根据新来电咨询用语,基于预设的知识图谱进行业务分类,进行新来电号码的业务接待。
[0063] 进一步的,S2中的预设的知识图谱构建步骤包括:
[0064] S201、收集电网相关内容整理电网语料;
[0065] S202、根据电网语料构建并训练自然语言处理模型;
[0066] S203、基于自然语言处理模型进行电网知识抽取,并将抽取结果存入图结构数据库;
[0067] S204、获取历史来电号码的业务类型,建立历史来电号码与图结构数据库的映射关系。
[0068] 更进一步的,S201、收集电网相关内容整理电网语料的具体内容为:
[0069] 构建专业名词类字典,包括电网机构、电网专业、问答术语、属性特征、对象关系字典;收集并整理电网理论知识类文档、电网调度类操作日志、电网调度类预案类文档和安全操作规范,生成电网文本类语料;整理电网同义词语料,确定电网领域的属性同义词和替换类同义词。
[0070] 进一步的,S203的具体内容为:
[0071] 获取待处理的电网业务相关数据,将其分为业务结构化关系型数据和业务非结构化文本类数据;
[0072] 基于Spark处理业务结构化关系型数据,进行知识抽取并将抽取结果存入图结构数据库;
[0073] 基于自然语言处理模型处理业务非结构化文本类数据,进行知识抽取并将抽取结果存入图结构数据库。
[0074] 进一步的,在S204中还包括以下内容:
[0075] (1)提取历史来电号码行为的时间特征信息,并对该特征信息进行清洗与预处理,保证数据的有效性;
[0076] (2)针对步骤(1)提取到相应特征信息,通过schedule定时计算不同业务类别下所有行为特征项影响因子占比R(x);
[0077] (3)针对时间序列内用户多行为多类别信息,得出对应用户咨询问题类别的特征权重计算方法;
[0078] (4)通过步骤(3)计算出历史时间段内多类别行为特征,并将相同业务类别下不同行为累加求和,得出不同业务类别下多行为特征表示矩阵;
[0079] (5)将历史不同业务类别下多行为特征表示矩阵与图结构数据库建立映射关系,得到历史来电号码与图结构数据库的映射关系,实现基于历史来电号码行为信息预测来电询问的业务类别。
[0080] 更进一步的,步骤(2)统计历史时间内用户行为类别与咨询问题类别相同的数据个数k,所有用户历史行为特征个数s,历史不同业务类别下行为特征影响因子R(x),其中R(x)=k/s,通过schedule定时计算影响因子。
[0081] 更进一步的,步骤(3)的具体步骤为:
[0082] ①通过步骤(1)提取到的时间序列特征数据,将其对应的行为业务类别进行标注;
[0083] ②对历史时间段内的多行为特征进行统计分析,提取多行为时间序列特征拟合正态分布曲线的特征数据;
[0084] ③基于正态分布计算的多行为时间序列特征计算方法:
[0085] a.正态分布方差项计算方法:以每天为行为的时间周期划分,挑选历史连续时间段内每天业务行为预测准确率p(x,t),多行为时间序列的正态方差项计算公式具体如下:
[0086]
[0087] 式(1)中n为历史时间段的天数,x表示某业务类别的历史行为,t表示某时间点,p(x,t)为历史某一行为某天预测正确的概率,是历史时间段内某一行为预测正确概率的均值;
[0088] b.正态分布期望差项计算方法:根据提取到的时间序列特征数据,通过时间序列权重计算函数,得出特征对应业务类别的权重信息;其中基于时间序列行为正态分布期望差计算公式如下:
[0089]
[0090] 式(2)中t(n)为当前时间的时间戳,t(x,t)表示x业务类别的历史时间节点,T(x,t)公式是计算x业务类别的历史行为时间节点距离当前时间有z个周期;
[0091] c.基于正态分布计算多行为时间序列特征加权计算公式如下:
[0092]
[0093] 式(3)中V(x,t)是基于正态分布计算公式得出,其中k为缩放因子调节,用于调整2
计算结果范围,δ(x,t)为正态分布方差项,T(x,t)为正态分布期望差项。
[0094] 进一步的,S3、来电业务判断步骤的具体内容为:
[0095] 将来电号码与历史来电号码数据库进行比对,若当前来电号码在历史来电号码数据库中查询到,则判断当前来电号码为历史来电号码,进入S4;
[0096] 若当前来电号码在历史来电号码数据库中未查询到,则判断当前来电号码为新来电号码,则进入S5。
[0097] 更进一步的,在当前来电号码业务接待完成后,将当前来电号码存入历史来电号码数据库,更新历史来电号码数据库,同时建立当前来电号码与图结构数据库映射关系,更新预设的知识图谱。
[0098] 与图1所述方法对应的,本发明还公开了一种基于知识图谱的电网来电业务处理装置,用于对图1所述方法的实现,具体结构参见图2所示,包括:来电号码获取模块、知识图谱获取模块、来电业务判断模块、历史来电分类接待模块和新来电接待模块;
[0099] 来电号码获取模块,用于获取来电号码;
[0100] 知识图谱获取模块,与来电号码获取模块的输出端连接,用于获取预设的知识图谱,预设的知识图谱基于电网语料进行自然语言处理模型构建,对自然语言进行电网知识抽取,并将抽取结果存入图结构数据库,基于历史来电号码的业务类型,建立历史来电号码与图结构数据库映射关系;
[0101] 来电业务判断模块,与知识图谱获取模块的输出端连接,用于判断来电号码是否为历史来电号码,若为是,则进入历史来电分类接待模块,反之,则进入新来电接待模块;
[0102] 历史来电分类接待模块,与来电业务判断模块的第一输出端连接,用于基于历史来电号码的业务类型查找对应图结构数据库映射关系,进行历史来电号码的业务分类接待;
[0103] 新来电接待模块,与来电业务判断模块的第二输出端连接,用于根据新来电咨询用语,基于预设的知识图谱进行业务分类,进行新来电号码的业务接待。
[0104] 进一步的,来电业务判断模块包括:来电号码输入单元、查询单元、历史来电号码数据库、分类单元和更新单元;
[0105] 来电号码输入单元,用于输入当前来电号码;
[0106] 历史来电号码数据库,与查询单元的输入/输出端连接,用于存储历史来电号码;
[0107] 查询单元,与来电号码输入单元的输出端连接,用于通过历史来电号码数据库查询当前来电号码是否存储于历史来电号码数据库中;
[0108] 分类单元,与查询单元的输出端连接,用于将当前来电号码分为历史来电号码和新来电号码;
[0109] 更新单元,与分类单元的输出端连接,用于将新来电号码存入历史来电号码数据库,更新历史来电号码数据库。
[0110] 更进一步的,更新单元还用于在来电业务结束后,建立当前来电号码与图结构数据库映射关系,更新预设的知识图谱。
[0111] 本发明还公开了一种存储介质,存储介质包括存储的指令,其中,在指令运行时控制存储介质所在的设备执行上述任一项所述的一种基于知识图谱的电网来电业务处理方法。
[0112] 本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0113] 专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现。
[0114] 为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0115] 对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。