技术领域
[0001] 本发明涉及一种对来电意图进行识别的技术。
相关背景技术
[0002] 目前通过拨打电话进行商品或者服务的推销者在拨打电话寻找潜在的购买者时基本上是随机拨打,并不了解被推销者对自己推销的商品或者服务是否有需求。同时被推销者在接电话之前对这类营销电话的大概内容也并不清楚,即便现在来电显示已经可以进行相关提示,例如可以提示用户当前来电为骚扰电话,或者可以对陌生号码进行简单标识,诸如“推销”、“中介”、“快递”等,但是,用户通常仍需在接听电话并进行一两句沟通以后才能对推销者的目的有一定的了解从而知道自己是否有需求。
[0003] 显然,现有的来电提示方式仍不能真正满足用户的使用需求。大部分用户即使看到了提示,也不能清楚判断其是否具有相应的需求,往往仍需接听来电并简单沟通后才能决定是否继续此次通话。此外,有些用户看到来电提示之后直接挂断该来电,也可能错失其真正需求的信息。
具体实施方式
[0026] 在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
[0027] 在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的程序指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人计算机(PC)、笔记本电脑、平板电脑、智能手机等。
[0028] 所述计算机设备例如包括用户设备与网络设备。其中,所述用户设备包括但不限于个人计算机(PC)、笔记本电脑、移动终端等,所述移动终端包括但不限于智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
[0029] 需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
[0030] 本文后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。
[0031] 这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
[0032] 应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
[0033] 这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
[0034] 还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
[0035] 下面结合附图对本发明作进一步详细描述。
[0036] 图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务器12的框图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0037] 如图1所示,计算机系统/服务器12以通用计算设备的形式表现。计算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
[0038] 总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
[0039] 计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
[0040] 存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图1未示出,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
[0041] 具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
[0042] 计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模块通信。应当明白,尽管图1中未示出,可以结合计算机系统/服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
[0043] 处理单元16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理。
[0044] 例如,存储器28中存储有用于执行本发明的各项功能和处理的计算机程序,处理单元16执行相应计算机程序时,本发明在网络端实现对来电意图的识别。
[0045] 以下将详细描述本发明在服务器实现对来电意图的识别的具体功能/步骤。
[0046] 图2示出根据本发明的一个实施例,其中具体示出一种对来电意图进行识别的方法流程图。
[0047] 该识别方法由网络端来执行。然而,本领域技术人员应能理解,尽管对来电意图的识别是由网络端来执行的,但是由于整个通话过程是在用户端进行的,故本发明的识别方法还需要用户端的辅助。在此,用户端典型地如手机,网络端典型地如服务器。如无特别说明,本说明书中网络端与服务器等同使用。
[0048] 如图2所示,在步骤S1中,针对一个经初步识别的来电号码,服务器对其多次通话内容分别进行语音识别;在步骤S2中,服务器将每次语音识别的内容匹配行业关键词库,以获得相匹配的一个或多个行业,其中,所述行业关键词库包括多个行业及其分别对应的一个或多个行业关键词;在步骤S3中,服务器根据所述每次语音识别的内容,确定其中每个行业分别所对应的一个或多个意图标签;在步骤S4中,服务器综合所述多次通话内容所对应的各行业的权重以及其中每个行业的各意图标签的权重,以确定所述来电号码所对应的行业及其意图标签。
[0049] 具体地,在步骤S1中,针对一个经初步识别的来电号码,服务器对其多次通话内容分别进行语音识别。
[0050] 在此,经初步识别的来电号码包括但不限于已被识别为骚扰电话的来电号码、已识别有初步标识的来电号码等。前者例如仅提示用户为骚扰电话的来电号码,后者例如已被标识为如“中介”、“推销”等的来电号码。本发明意在对这些通常意义上的骚扰电话进一步提供细化意图标签,以使得接听该来电号码的用户能够根据其具体需求决定是否接听该来电,而非仅基于“中介”、“推销”等标识盲目拒绝该来电,或者浪费时间接听后发现并不符合自身的需求。
[0051] 此外,还需说明的是,本发明所指“骚扰电话”并不包括“诈骗电话”等具有非法意图的电话,这些具有非法意图的电话应当被如运营商过滤,并不在本发明的讨论范围之内。
[0052] 当用户接听经初步识别的来电号码之后,用户设备将记录用户的此次通话,并将通话内容上传至服务器。
[0053] 在此,为了更好的保护用户隐私,用户设备可以仅记录单方的通话内容,例如仅记录来电方的通话内容。对于如“中介”、“推销”等的来电,通常来电方的通话内容中已经包含了足够的信息来确定其来电意图。
[0054] 本发明也考虑了其他的隐私保护方案。例如,用户设备可以仅记录不在当前接听用户的通讯录或通话记录中的电话号码的通话内容。也即,该来电号码应为陌生号码。
[0055] 对于一个经初步识别的来电号码,服务器将对其多次通话内容进行语音识别。为了更准确且更精细化地识别一个来电号码的意图,服务器需要对其多次通话内容进行分析来确定最可能的意图。一次通话内容意指从用户接听来电到此次通话被挂断中产生的通话内容。
[0056] 其中,对通话内容的语音识别意在将音频的通话内容转化为文字的通话内容。语音识别已为成熟技术,本发明在此不做具体描述。任何现有的或将来的语音识别技术如可应用于本发明,均应被包含于此。
[0057] 经语音识别的内容可以是文字形式的通话内容,也可以是对该文字形式的通话内容的进一步处理,如从其提取关键词集。在此,一个关键词集可以是从一次通话内容中提取的所有关键词。
[0058] 在步骤S2中,服务器将每次语音识别的内容匹配行业关键词库,以获得相匹配的一个或多个行业。
[0059] 在此,网络端还包括一个行业关键词库,其中包括多个行业以及每个行业所对应的一个或多个行业关键词。
[0060] 例如,服务器可以将一个经初步识别的来电号码的各关键词集分别在该行业关键词库中进行匹配查询,以获得相匹配的一个或多个行业。
[0061] 可替代地,服务器也可以直接将文字形式的通话内容与各行业关键词进行匹配,以获得相匹配的一个或多个行业。
[0062] 行业关键词到行业的映射可以示例性地如下所示:
[0063] “买房、租房、房子、地产、房价、户型…”->“房地产行业”
[0064] “汽车、买车、试驾、4S店”->“汽车行业”
[0065] “投资、理财、黄金、白银、股票”->“投资理财行业”
[0066] 在步骤S3中,服务器根据每次语音识别的内容,确定其中每个行业分别所对应的一个或多个意图标签。
[0067] 在通过每次通话内容确定来电号码所对应的行业之后,本发明还进一步确定相应行业下的具体意图标签,以使得用户能够精确知晓该来电号码的意图。
[0068] 根据本发明的一个优选实施例,网络端可以建立一个意图标签库,其中包括各行业以及每个行业所对应的意图标签。服务器可以将每次语音识别内容,例如关键词集或文字形式的通话内容,按照在步骤S2中所识别的行业,匹配查询其中各行业所对应的意图标签,以获得所识别的各行业下的意图标签。
[0069] 具体如,对于一次通话内容“请问您对黄金投资有兴趣吗”,经识别其对应的行业为“投资理财”,服务器进一步对该通话内容在“投资理财”所对应的各意图标签中进行匹配查询,以获得相匹配的意图标签,如“黄金投资”。其中,“投资理财”行业所对应的意图标签可以诸如“黄金投资”、“白银投资”、“股票投资”、“外汇投资”等。
[0070] 根据本发明的一个优选实施例,网络端可以针对各具体行业构建相应的意图规则。
[0071] 例如,每个行业可以设定一组核心关键词,当服务器对一条通话内容中相应于特定行业匹配到一个或多个核心关键词,所匹配的核心关键词对应的意图标签即可以作为该条通话内容的意图标签。
[0072] 具体地,例如,对于“投资理财”行业,其意图规则可以示例性如下:
[0073] “黄金”->“黄金投资”
[0074] “白银”->“白银投资”
[0075] “股票”->“股票投资”
[0076] “外汇”->“外汇投资”
[0077] 据此,当服务器从通话内容中在“投资理财”行业下匹配到核心关键词如“黄金”,则可以按照以上意图规则确定相应的意图标签为“黄金投资”。
[0078] 可替代地,意图标签也可以是由核心关键词实时生成的。例如,仍按上例,当从通话内容中在“投资理财”行业下匹配到核心关键词如“黄金”,服务器按照“行业”+“核心关键词”生成相应的意图标签,如“黄金投资”。
[0079] 又如,服务器按照每个行业的特定特性,例如每个行业均使用有特定关键词,从经语音识别的通话内容中提取与该(等)特定关键词相对应的信息,以获得相应的一个或多个意图标签。
[0080] 具体地,例如,当从通话内容中检测到特定关键词后,服务器从其上下文中提取与该特定关键词相对应的信息来作为意图标签。这可以被认为是一种通过语义分析来提取意图标签的方式。
[0081] 举例来说,当前通话内容所对应的行业已确定为“房地产”,当检测到特定关键词如“户型”、“开发商”后,服务器搜索上下文获得如“两居室”、“万科”,并将“两居室”和“万科”作为意图标签。优选地,行业“房地产”也可以一并作为意图标签。
[0082] 在此,服务器可以根据各特定关键词所对应的表达方式来提取其具体内容信息。例如,在“房地产”行业下,当检测到特定关键词“面积”时,服务器可以从其下文中提取XX平米作为相应的信息,从而获得意图标签“房地产”和“XX平米”。
[0083] 上述分别通过核心关键词和特定关键词来获得意图标签的方式可以结合来获得通话内容的意图标签。例如,服务器根据核心关键词获得意图标签“黄金投资”,根据特定关键词“黄金价格”获得意图标签“276.39”。
[0084] 在步骤S4中,服务器综合多次通话内容所对应的各行业的权重以及其中每个行业的各意图标签的权重,以确定所述来电号码所对应的行业及其意图标签。
[0085] 在此,对于一次通话内容而言,其可以对应有一个或多个行业,其中每个行业又可以对应有一个或多个意图标签。服务器可以进一步确定其中各行业以及意图标签的权重。优选地,权重基于词频来确定。
[0086] 例如,对于通话内容T1,其对应行业H1和H2,其中H1的权重可以根据T1在H1下所匹配到的各行业关键词的词频来确定,如H1所对应的行业关键词C1和C2的词频分别为3、2,则H1的权重可以为(3+2)*0.1=0.5,同样方式确定H2的权重为0.1。意图标签的权重同样可以根据对应核心关键词和/或特定关键词的频次来确定。例如,H1对应有意图标签Y1和Y2,Y1由核心关键词获取,则Y1的权重可以基于该核心关键词的词频来确定,如0.2,Y2由特定关键词获取,则Y1的权重可以基于该特定关键词或其对应信息的词频来确定,如0.1。
[0087] 对于一个经初步识别的来电号码N1,假设记录有其50次通话内容,服务器可以对每次通话内容均按照以上方式确定相应的行业权重和意图标签权重。进而,服务器综合这50次通话内容所确定的行业及其权重以及其中各行业的意图标签及其权重。例如,服务器从中确定综合后权重最高的行业,如相同行业的权重相加后,H1的权重最高,进而确定H1的各意图标签中综合后权重最高的意图标签,如Y1的权重最高,据此,服务器可以确定该来电号码N1的行业H1及其意图标签Y1。
[0088] 优选地,为了能够更准确地识别来电意图,只有当排名最高的意图标签的权重远高于次位的意图标签的权重时,例如,前者的权重至少要为后者权重的10倍以上(该比例可以根据应用需求来设置),服务器才可确定该权重最高的意图标签为号码N1的意图标签。
[0089] 之后,如果有用户收到该号码N1的来电,服务器则可以将意图标签Y1提供给用户,如图3所示,此时来电界面可以显示有Y1(如黄金理财),以更精确地提示用户,供用户参照Y1并根据其具体需求来决定是否接听该来电。在此,由于意图标签中通常包括了行业,故提示用户来电意图时,服务器可以仅提供意图标签。
[0090] 进一步地,对于按照Y1提示接听该N1来电的用户,可以认为其对意图标签Y1感兴趣,进而向其推送与意图标签Y1相关的信息。
[0091] 图4示出根据本发明的一个实施例,其中具体示出一种对来电意图进行识别装置的示意图。
[0092] 该识别装置40位于网络侧,其典型地可以装置于一台或多台服务器中。然而,本领域技术人员应能理解,尽管对来电意图的识别是由网络端来执行的,但是由于整个通话过程是在用户端进行的,故本发明对来电意图的识别还需要用户端的辅助。在此,用户端典型地如手机,网络端典型地如服务器。如无特别说明,本说明书中网络端与服务器等同使用。
[0093] 如图4所示,识别装置40包括语音识别装置41、行业匹配装置42、标签确定装置43和意图确定装置44。
[0094] 针对一个经初步识别的来电号码,语音识别装置41对其多次通话内容分别进行语音识别;行业匹配装置42将每次语音识别的内容匹配行业关键词库,以获得相匹配的一个或多个行业,其中,所述行业关键词库包括多个行业及其分别对应的一个或多个行业关键词;标签确定装置43根据所述每次语音识别的内容,确定其中每个行业分别所对应的一个或多个意图标签;意图确定装置44综合所述多次通话内容所对应的各行业的权重以及其中每个行业的各意图标签的权重,以确定所述来电号码所对应的行业及其意图标签。
[0095] 具体地,针对一个经初步识别的来电号码,语音识别装置41对其多次通话内容分别进行语音识别。
[0096] 在此,经初步识别的来电号码包括但不限于已被识别为骚扰电话的来电号码、已识别有初步标识的来电号码等。前者例如仅提示用户为骚扰电话的来电号码,后者例如已被标识为如“中介”、“推销”等的来电号码。本发明意在对这些通常意义上的骚扰电话进一步提供细化意图标签,以使得接听该来电号码的用户能够根据其具体需求决定是否接听该来电,而非仅基于“中介”、“推销”等标识盲目拒绝该来电,或者浪费时间接听后发现并不符合自身的需求。
[0097] 此外,还需说明的是,本发明所指“骚扰电话”并不包括“诈骗电话”等具有非法意图的电话,这些具有非法意图的电话应当被如运营商过滤,并不在本发明的讨论范围之内。
[0098] 当用户接听经初步识别的来电号码之后,用户设备将记录用户的此次通话,并将通话内容上传至服务器。
[0099] 在此,为了更好的保护用户隐私,用户设备可以仅记录单方的通话内容,例如仅记录来电方的通话内容。对于如“中介”、“推销”等的来电,通常来电方的通话内容中已经包含了足够的信息来确定其来电意图。
[0100] 本发明也考虑了其他的隐私保护方案。例如,用户设备可以仅记录不在当前接听用户的通讯录或通话记录中的电话号码的通话内容。也即,该来电号码应为陌生号码。
[0101] 对于一个经初步识别的来电号码,语音识别装置41将对其多次通话内容进行语音识别。为了更准确且更精细化地识别一个来电号码的意图,识别装置40需要对其多次通话内容进行分析来确定最可能的意图。一次通话内容意指从用户接听来电到此次通话被挂断中产生的通话内容。
[0102] 其中,对通话内容的语音识别意在将音频的通话内容转化为文字的通话内容。语音识别已为成熟技术,本发明在此不做具体描述。任何现有的或将来的语音识别技术如可应用于本发明,均应被包含于此。
[0103] 经语音识别的内容可以是文字形式的通话内容,也可以是对该文字形式的通话内容的进一步处理,如从其提取关键词集。在此,一个关键词集可以是从一次通话内容中提取的所有关键词。
[0104] 随后,行业匹配装置42将每次语音识别的内容匹配行业关键词库,以获得相匹配的一个或多个行业。
[0105] 在此,网络端还包括一个行业关键词库,其中包括多个行业以及每个行业所对应的一个或多个行业关键词。
[0106] 例如,行业匹配装置42可以将一个经初步识别的来电号码的各关键词集分别在该行业关键词库中进行匹配查询,以获得相匹配的一个或多个行业。
[0107] 可替代地,行业匹配装置42也可以直接将文字形式的通话内容与各行业关键词进行匹配,以获得相匹配的一个或多个行业。
[0108] 行业关键词到行业的映射可以示例性地如下所示:
[0109] “买房、租房、房子、地产、房价、户型…”->“房地产行业”
[0110] “汽车、买车、试驾、4S店”->“汽车行业”
[0111] “投资、理财、黄金、白银、股票”->“投资理财行业”
[0112] 接着,标签确定装置43根据每次语音识别的内容,确定其中每个行业分别所对应的一个或多个意图标签。
[0113] 在通过每次通话内容确定来电号码所对应的行业之后,本发明还进一步确定相应行业下的具体意图标签,以使得用户能够精确知晓该来电号码的意图。
[0114] 根据本发明的一个优选实施例,网络端可以建立一个意图标签库,其中包括各行业以及每个行业所对应的意图标签。标签确定装置43可以将每次语音识别内容,例如关键词集或文字形式的通话内容,按照由行业匹配装置42所识别的行业,匹配查询其中各行业所对应的意图标签,以获得所识别的各行业下的意图标签。
[0115] 具体如,对于一次通话内容“请问您对黄金投资有兴趣吗”,经行业匹配装置42识别其对应的行业为“投资理财”,标签确定装置43进一步对该通话内容在“投资理财”所对应的各意图标签中进行匹配查询,以获得相匹配的意图标签,如“黄金投资”。其中,“投资理财”行业所对应的意图标签可以诸如“黄金投资”、“白银投资”、“股票投资”、“外汇投资”等。
[0116] 根据本发明的一个优选实施例,标签确定装置43可以针对各具体行业构建相应的意图规则。
[0117] 例如,每个行业可以设定一组核心关键词,当标签确定装置43对一条通话内容中相应于特定行业匹配到一个或多个核心关键词,所匹配的核心关键词对应的意图标签即可以作为该条通话内容的意图标签。
[0118] 具体地,例如,对于“投资理财”行业,其意图规则可以示例性如下:
[0119] “黄金”->“黄金投资”
[0120] “白银”->“白银投资”
[0121] “股票”->“股票投资”
[0122] “外汇”->“外汇投资”
[0123] 据此,当标签确定装置43从通话内容中在“投资理财”行业下匹配到核心关键词如“黄金”,则可以按照以上意图规则确定相应的意图标签为“黄金投资”。
[0124] 可替代地,意图标签也可以是由核心关键词实时生成的。例如,仍按上例,当从通话内容中在“投资理财”行业下匹配到核心关键词如“黄金”,标签确定装置43按照“行业”+“核心关键词”生成相应的意图标签,如“黄金投资”。
[0125] 又如,标签确定装置43按照每个行业的特定特性,例如每个行业均使用有特定关键词,从经语音识别的通话内容中提取与该(等)特定关键词相对应的信息,以获得相应的一个或多个意图标签。
[0126] 具体地,例如,当从通话内容中检测到特定关键词后,标签确定装置43从其上下文中提取与该特定关键词相对应的信息来作为意图标签。这可以被认为是一种通过语义分析来提取意图标签的方式。
[0127] 举例来说,当前通话内容所对应的行业已确定为“房地产”,当检测到特定关键词如“户型”、“开发商”后,标签确定装置43搜索上下文获得如“两居室”、“万科”,并将“两居室”和“万科”作为意图标签。优选地,行业“房地产”也可以一并作为意图标签。
[0128] 在此,标签确定装置43可以根据各特定关键词所对应的表达方式来提取其具体内容信息。例如,在“房地产”行业下,当检测到特定关键词“面积”时,标签确定装置43可以从其下文中提取XX平米作为相应的信息,从而获得意图标签“房地产”和“XX平米”。
[0129] 上述分别通过核心关键词和特定关键词来获得意图标签的方式可以结合来获得通话内容的意图标签。例如,标签确定装置43根据核心关键词获得意图标签“黄金投资”,根据特定关键词“黄金价格”获得意图标签“276.39”。
[0130] 随后,意图确定装置44综合多次通话内容所对应的各行业的权重以及其中每个行业的各意图标签的权重,以确定所述来电号码所对应的行业及其意图标签。
[0131] 在此,对于一次通话内容而言,其可以对应有一个或多个行业,其中每个行业又可以对应有一个或多个意图标签。意图确定装置44可以进一步确定其中各行业以及意图标签的权重。优选地,权重基于词频来确定。
[0132] 例如,对于通话内容T1,其对应行业H1和H2,其中H1的权重可以根据T1在H1下所匹配到的各行业关键词的词频来确定,如H1所对应的行业关键词C1和C2的词频分别为3、2,则H1的权重可以为(3+2)*0.1=0.5,同样方式确定H2的权重为0.1。意图标签的权重同样可以根据对应核心关键词和/或特定关键词的频次来确定。例如,H1对应有意图标签Y1和Y2,Y1由核心关键词获取,则Y1的权重可以基于该核心关键词的词频来确定,如0.2,Y2由特定关键词获取,则Y1的权重可以基于该特定关键词或其对应信息的词频来确定,如0.1。
[0133] 对于一个经初步识别的来电号码N1,假设记录有其50次通话内容,意图确定装置44可以对每次通话内容均按照以上方式确定相应的行业权重和意图标签权重。进而,意图确定装置44综合这50次通话内容所确定的行业及其权重以及其中各行业的意图标签及其权重。例如,意图确定装置44从中确定综合后权重最高的行业,如相同行业的权重相加后,H1的权重最高,进而确定H1的各意图标签中综合后权重最高的意图标签,如Y1的权重最高,据此,意图确定装置44可以确定该来电号码N1的行业H1及其意图标签Y1。
[0134] 优选地,为了能够更准确地识别来电意图,只有当排名最高的意图标签的权重远高于次位的意图标签的权重时,例如,前者的权重至少要为后者权重的10倍以上(该比例可以根据应用需求来设置),意图确定装置44才可确定该权重最高的意图标签为号码N1的意图标签。
[0135] 识别装置40还可以包括一标签提示装置(未示出)。在意图确定装置44确定号码N1的意图标签之后,如果有用户收到该号码N1的来电,标签提示装置则可以将意图标签Y1提供给用户,如图3所示,此时来电界面可以显示有Y1(如黄金理财),以更精确地提示用户,供用户参照Y1并根据其具体需求来决定是否接听该来电。在此,由于意图标签中通常包括了行业,故提示用户来电意图时,标签提示装置可以仅提供意图标签。
[0136] 本发明可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0137] 计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0138] 计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
[0139] 可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0140] 需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
[0141] 对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。