首页 / 基于复杂任务分析的对话方法及系统

基于复杂任务分析的对话方法及系统实质审查 发明

技术领域

[0001] 本发明关于一种对话方法,特别关于一种基于复杂任务分析的对话方法。

相关背景技术

[0002] 随着科技的进步和经济的繁荣,人们每天都可以接收到海量的信息,其中,各式各样的新闻占据了相当高的比例。然而,现代生活步调十分紧凑,身处其中的现代人在繁忙的日常中,难以有效率地获得对自己有用有益的信息。
[0003] 近年来,聊天机器人提供了现代人获取所求信息的管道。如同虚拟助理一般,用户可以通过语音或文字向聊天机器人提出询问,例如天气、股价等,聊天机器人便依据该询问搜寻当时天气、股价等并响应使用者。然而,此一问一答式的对话方法在信息提供效率方面及全面性仍有所不足。

具体实施方式

[0013] 以下在实施方式中详细叙述本发明的详细特征以及优点,其内容足以使本领域技术人员了解本发明的技术内容并据以实施,且根据本说明书所揭露的内容、权利要求书及附图,本领域技术人员可轻易地理解本发明相关的目的及优点。以下的实施例进一步详细说明本发明的观点,但非以任何观点限制本发明的范畴。
[0014] 请参考图1,图1为依据本发明一实施例所绘示的基于复杂任务分析的对话系统的功能方框图,其中,所谓复杂任务指关联于多个子任务的任务。举例来说,“准备结婚”可以关联于“场地租借”、“预购礼服”、“喜帖设计”等子任务,因此“准备结婚”为复杂任务的一种。如图1所示,对话系统1包含关键词汇撷取装置11、对话装置13、内存15及自然语言处理装置17,其中自然语言处理装置17可以通过有线或无线的方式连接于关键词汇撷取装置11、对话装置13及内存15。
[0015] 关键词汇撷取装置11用于取得关键词汇,并提供给自然语言处理装置17。自然语言处理装置17基于内存15中所存的数据,对关键词汇撷取装置11所取得的关键词汇执行复杂任务分析:判断关键词汇所关联的目标复杂任务,并取得与此目标复杂任务具有连接关系的多个目标子任务;针对每一目标子任务,查找匹配的一或多个商品服务数据;以及借由对话装置13输出匹配于每一目标子任务的一或多个商品服务数据所对应的输出信息。在输出所述输出信息之后,对话装置13可以从外部接收到响应所述输出信息的响应信息,自然语言处理装置17便可依据此响应信息选择性地调整知识图谱中的目标复杂任务及目标子任务中的一或多者。
[0016] 以下为系统中各装置的一或多个实施态样的说明。于一实施态样中,关键词汇撷取装置11包含彼此相连的语音输入元件及语音识别器。语音输入元件例如为麦克风等收音器,用于接收语音信号,其中,所谓语音信号例如由用户发出的声音波形所形成。于此实施态样中,语音信号的输入可以作为触发行为。当语音输入元件接收到语音信号的输入时,语音识别器便会受触发而对语音信号进行语音识别,以从语音信号中撷取出关键词汇。于另一实施态样中,关键词汇撷取装置11包含键盘、鼠标或/及触摸板等输入元件及处理器,其中输入元件可以受敲击、点击、滑动等动作触发而判断接收到动作所对应的信息,处理器再分析此信息以取得。于又一实施态样中,关键词汇撷取装置11在呈现文章(例如网络新闻文章、博客文章等)的网页处于被浏览状态的时间超过预设时间时,会从文章取得关键词汇,所述关键词汇例如为文章的标题、文章的主题标签(hashtag)等。具体来说,关键词汇撷取装置11可以由计算机中的进行网页管控的处理器来实现,当呈现文章的网页位于显示画面的最上层时,关键词汇撷取装置11便判断该文章处于被浏览状态并进行计时,而当呈现该文章的网页位于显示画面的最上层的时间超过预设时间时,便执行关键词汇的撷取。
[0017] 如前所述,对话装置13可以输出对应于所述多个商品服务数据的输出信息,且可以接收响应所述输出信息的响应信息。进一步来说,对话装置13包含用以输出信息的输出元件及用以输入信息的输入元件。输出元件例如为显示器,可以将信息以文字或图片的形式呈现于显示器的画面上,或者例如为扬声器,可以将信息以声音的形式输出。输入元件例如为键盘、鼠标、触摸板,可以受敲击、点击、滑动等动作触发而判断接收到动作所对应的信息。举另一例子来说,输入元件可以为麦克风等收音器,用于接收语音信号以作为响应信息。举又一例子来说,输入元件可以包含摄影机或是兼具收音器与摄影机,可以拍摄嘴部影像以辨认嘴形,进而判断或辅助辨识语音。
[0018] 于另一实施态样中,输出元件及输入元件可以触控屏幕实现。于又一实施态样中,输出元件及输入元件可以有线或无线连接接口实现,有线或无线连接接口可以连接于外部装置(例如手机、平板、个人计算机等),以传送对应于所述多个商品服务数据的短信、e‑mail、聊天室信息等。特别来说,对话装置13除了输出元件及输入元件,可以还包含自然语言产生模块,此模块可以中央处理器、微控制器、可编程逻辑控制器或其他处理器实现,或是上述处理器所运行的软件。自然语言产生模块可以依据商品服务数据产生符合自然语言的文字或声音等信息,再由输出元件输出。
[0019] 内存15可以由一或多个非挥发性存储媒介(例如闪存、只读存储器、磁性内存等)组成,存储复杂任务分析所需的数据。如图1所示,内存15可以包含知识图谱151及商品服务数据库153。知识图谱151可以包含多个预存复杂任务及多个预存子任务,每个预存子任务与所述多个预存复杂任务中的至少一者之间具有连接关系。知识图谱151可以基于多个新闻语料、博客语料建构而成。进一步来说,知识图谱151可以借由分析新闻文章、博客文章等中的字词,建立多个复杂任务与多个子任务之间的连接关系。其中,知识图谱151的建立方式及举例将于后说明。
[0020] 除了知识图谱151,内存15也可包含商品服务数据库153。商品服务数据库153存储了多个商品服务数据,其中每个商品服务数据可以具有所匹配的预存子任务的标签。进一步来说,除了匹配的预存子任务的标签,商品服务数据也可具有所属消费需求模式(例如特权模式、可靠模式及期望模式)的标签。
[0021] 自然语言处理装置17可以包含一或多个中央处理器、微控制器、可编程逻辑控制器或其他处理器。自然语言处理装置17可以对关键词汇撷取装置11取得的关键词汇执行复杂任务分析以及商品服务数据的匹配。进一步来说,复杂任务分析以及商品服务数据的匹配可以分别由不同的中央处理器、微控制器、可编程逻辑控制器或其他处理器来执行,也可以为由处理器所运行的多个软件。
[0022] 特别来说,对话装置13可以与前述关键词汇撷取装置11共享输入元件。关键词汇撷取装置11可以从输入元件接收用户对话,从中撷取关键词汇,再将关键词汇提供至自然语言处理模块17。自然语言处理模块17基于内存15中所存的数据对关键词汇执行复杂任务分析以判断关键词汇关联于哪些复杂任务以及匹配的商品服务数据,并借由对话装置13的输出元件输出商品服务数据所对应的信息。在输出所述信息之后,输入元件可以从外部接收到下一轮对话的响应信息,自然语言处理装置17便可依据此响应信息选择性地调整知识图谱中的目标复杂任务及目标子任务中的一或多者。
[0023] 进一步来说,内存15所存的知识图谱151可以由自然语言处理装置17或是其他处理器中的两个子模块所建置。所述两个子模块包含相关子任务检测子模块(related subtask identification)及复杂任务名称生成子模块(complex task name generation),可以分别由两个处理器实现,或是由同一处理器所运行的软件。相关子任务检测子模块可以利用句法分析工具将新闻、微网志(microblog)、小区问答服务(community question answering,CQA)等内容中的语句切割为若干词汇和词组,然后采用简单的样板规则抽取子任务的候选配对。相关子任务检测子模块持续收集大量博客语料,来训练具有语意概念的词汇向量(Word2Vector),然后扩展成子任务向量(Subtask2Vector)。复杂任务名称生成子模块则可以利用包含相关子任务的CQA及microblog来生成复杂任务名称,特别是利用主题‑事件为主的复杂任务模型(Topic‑event‑based complex task model)生成包含子任务的复杂任务结构,并以多个复杂任务结构形成知识图谱151。
[0024] 请一并参考图1、图2A及图2B,其中图2A为依据本发明一实施例所绘示的基于复杂任务分析的对话系统1的知识图谱151的示意图,图2B则为依据本发明另一实施例所绘示的基于复杂任务分析的对话系统1的知识图谱151的示意图。图2A示例性地绘示知识图谱151中的其中一个预存复杂任务CT1及与此预存复杂任务CT1具有连接关系的预存子任务ST1、ST3及ST5。于图2A的实施例中,预存复杂任务CT1与其预存子任务ST1、ST3及ST5呈树状结构,其中每个预存子任务与单一预存复杂任务具有连接关系。图2B的知识图谱151则呈现较为复杂的分布结构,其中预存子任务可以同时与多个预存复杂任务具有连接关系。如图2B所示,知识图谱151存储有预存复杂任务CT2及CT4,其中预存复杂任务CT2与预存子任务ST2、ST4、ST6及ST8具有连接关系,而预存复杂任务CT4则与预存子任务ST2及ST4具有连接关系。于图2B所示的实施例中,与同一预存子任务ST2具有连接关系的预存复杂任务CT2及CT4可以分别具有对应于预存子任务ST2的历史使用比例,其中预存复杂任务CT2的历史使用比例指示当次复杂任务分析之前,在预存子任务ST2作为输入关键词时,预存复杂任务CT2被决定为目标复杂任务的机率,预存复杂任务CT4的历史使用比例也同理。
[0025] 于一实施例中,知识图谱151中的每个预存复杂任务都具有消费需求模式比例;而于另一实施例中,知识图谱151中的每个预存子任务都具有消费需求模式比例。其中,消费需求模式比例例如以标签的方式存储。进一步来说,消费需求模式比例指示多个消费需求模式之间的比例,所述多个消费需求模式包含特权(Special‑privilege)模式、可靠模式及期望模式。特别来说,消费需求模式基于马斯洛的需求层次理论(Maslow’s hierarchy of needs)而定义。进一步而言,特权模式的定义同于马斯洛的需求层次理论中的生理需求(Physiological needs),可靠模式的定义同于需求层次理论中的安全需求(Safety needs),而期望模式则合并了需求层次理论中的爱与归属需求(Belongingness and love needs)、尊严需求(Esteem needs)及自我实现需求(Self‑actualization needs)。举例来说,以预存复杂任务“准备结婚”而言,其消费需求模式比例可以为:特权模式占7.8%,可靠模式占26.7%,而期望模式占65.5%。举另个例子来说,以预存子任务“购买手机”而言,其消费需求模式比例可以为:特权模式占51.1%,可靠模式占38.5%,而期望模式占10.4%。
[0026] 请参考图3,图3为依据本发明一实施例所绘示的基于复杂任务分析的对话方法的流程图。如图3所示,基于复杂任务分析的对话方法包含步骤S11:取得关键词汇;步骤S12:依据知识图谱,判断关键词汇关联于目标复杂任务,并取得与目标复杂任务具有连接关系的多个目标子任务;步骤S13:针对每一目标子任务,查找匹配的一或多个商品服务数据;步骤S14:输出匹配于每一目标子任务的一或多个商品服务数据所对应的输出信息;步骤S15:
接收响应输出信息的响应信息;以及步骤S16:依据响应信息选择性地调整知识图谱中的目标复杂任务及目标子任务中的一或多者。
[0027] 请一并参考图1及图3,图3所示的对话方法可适用于图1所示的对话系统1,以下示例性地描述图1的对话系统1执行图3的对话方法,然而本发明并不限制图3的对话方法仅适用于图1所示对话系统1。
[0028] 于步骤S11中,对话系统1的关键词汇撷取装置11可取得关键词汇。进一步来说,关键词汇撷取装置11可以受关联于语意信息的触发行为触发,并从语意信息撷取出关键词汇。于一实施态样中,所述语意信息为语音输入,所述触发行为为所输入的语音信号;于另一实施态样中,所述语意信息为文章,所述触发行为为呈现所述文章的网页处于被浏览状态的时间超过预设时间的情况;于又一实施态样中,所述语意信息为用户输入的对话,所述触发行为为输入的动作。
[0029] 于步骤S12中,对话系统1的自然语言处理装置17可以依据知识图谱151,判断关键词汇关联于目标复杂任务,并取得与所述目标复杂任务具有连接关系的多个目标子任务。进一步来说,自然语言处理装置17可以判断关键词汇中是否符合知识图谱151中所存的多个预存复杂任务及多个预存子任务的其中一者,称为符合者,并据以决定目标复杂任务,再将与目标复杂任务具有连接关系的预存子任务作为目标子任务。更进一步来说,自然语言处理装置17可以判断关键词汇中是否有同于预存复杂任务或预存子任务的字词。当符合者为预存复杂任务的其中之一时,自然语言处理装置17便将此符合者作为目标复杂任务;而当符合者为预存子任务的其中之一时,自然语言处理装置17便会将与此符合者具有连接关系的预存复杂任务作为目标复杂任务。在决定目标复杂任务后,自然语言处理装置17会再依据知识图谱151,将与目标复杂任务具有连接关系的预存子任务作为目标子任务。
[0030] 以图2A所示的知识图谱151为例,当关键词汇中包含字词“准备结婚”时,自然语言处理装置17便会判断关键词汇关联于预存复杂任务CT1,将其作为目标复杂任务,并取得与此目标复杂任务具连接关系的预存子任务ST1、ST3及ST5,并将此三个预存子任务ST1、ST3及ST5作为目标子任务;而当关键词汇中包含字词“场地租借”时,自然语言处理装置17便会判断关键词汇关联于预存子任务ST1,并将与预存子任务ST1具有连接关系的预存复杂任务CT1作为目标复杂任务,再将与其具有连接关系的预存子任务ST1、ST3及ST5作为目标子任务。
[0031] 另外,当符合者为预存子任务,而知识图谱中与此符合者具有连接关系的预存复杂任务为多个的时候,自然语言处理装置17可以选择这些预存复杂任务(候选复杂任务)中具有最高历史使用比例的一者来作为目标复杂任务。以图2B所示的知识图谱151为例,当关键词汇中包含字词“机票”时,自然语言处理装置17会判断关键词汇关联于预存子任务ST2,而与预存子任务ST2具有连接关系者包含预存复杂任务CT2及CT4,因此自然语言处理装置17便可以判断预存复杂任务CT2及CT4中何者具有较高的历史使用比例,并将其作为目标复杂任务。于另一实施态样中,自然语言处理装置17也可通过对话装置13输出预存复杂任务CT2及CT4的选项(例如输出两个选项的按钮图标),并将被触发者(例如被点击的按钮图标)作为目标复杂任务。或者,自然语言处理装置17可以随机选择预存复杂任务CT2或CT4来作为目标复杂任务。
[0032] 于步骤S13中,自然语言处理装置17针对每一目标子任务,查找匹配的一或多个商品服务数据。进一步来说,自然语言处理装置17可以从内存15中的商品服务数据库153查找匹配于目标子任务的商品服务数据。如前所述,商品服务数据库153中的每个商品服务数据可以具有所匹配的预存子任务的标签。自然语言处理装置17便可以搜寻标签的方式取得匹配于目标子任务的商品服务数据。另外,当商品服务数据库153中没有匹配者时,自然语言处理装置17还可以从网络搜寻结果摘要(search result snippet)或博客文章(blog article)中查找匹配的商品服务数据。
[0033] 于步骤S14中,自然语言处理装置17通过对话装置13输出匹配于每一目标子任务的一或多个商品服务数据所对应的输出信息。其中,输出信息可以为文字或声音等的形式。举例来说,自然语言处理装置17可以将商品服务数据所对应的品牌、样式、价格等信息或订购网址以聊天室信息、短信或email的方式输出。于步骤S15及S16中,自然语言处理装置17可以通过对话装置13接收响应输出信息的响应信息,并依据响应信息选择性地调整知识图谱中的目标复杂任务及目标子任务中的一或多者。特别来说,用户可以借由对话装置13输入系统所选择的商品服务数据是否合宜的响应信息。
[0034] 举例来说,商品服务数据所对应的输出信息除了商品服务数据的品牌、样式、价格等信息或订购网址,也可包含对此商品服务所对应的目标子任务的推荐是否有需要的选项。当自然语言处理装置17接收到不需要的响应信息时,自然语言处理装置17便可以另存删除此目标子任务与目标复杂任务之间的连接关系的知识图谱,作为属于提供不需要的响应信息的用户的专用知识图谱,借此提供定制化知识图谱的功能。而当自然语言处理装置17所接收到特定目标子任务的不需要响应信息达到特定数量时,便会将知识图谱151中的目标子任务与目标复杂任务之间的连接关系删除。另外,当自然语言处理装置17同时接收到多个目标子任务所对应的不需要信息时,自然语言处理装置17可以判断于先前步骤S12所判断的目标复杂任务有误,而重新判断目标复杂任务,并将原选择的目标复杂任务所具有的历史使用比例调低。
[0035] 除了以所属预存子任务的标签来查找匹配的商品服务数据,自然语言处理装置17还可以基于消费需求模式比例来查找匹配于目标子任务的商品服务数据,以使所提供的商品服务数据可以更贴近消费者心理。如前所述,知识图谱151中的预存复杂任务或是预存子任务可以具有消费需求模式比例。于每个预存子任务都具有消费需求模式比例的实施例中,自然语言处理装置17在查找到具有目标子任务标签的商品服务数据后,可以再依据目标子任务的消费需求模式比例中比例最高的消费需求模式来筛选商品服务数据。举例来说,当目标子任务的消费需求模式中可靠模式的比例最高时,自然语言处理装置17便会选择具有目标子任务标签又具有可靠模式标签的商品服务数据。或者,自然语言处理装置17可以依据消费需求模式比例中各消费需求模式的比例高低来决定呈现商品服务数据的顺序。
[0036] 而于每个预存复杂任务具有消费需求模式比例的实施例中,自然语言处理装置17可以设定每个目标子任务具有目标复杂任务所具有的消费需求模式比例,并通过对话装置13输出对应于每个目标子任务的消费需求模式比例的输出信息。自然语言处理装置17可以通过对话装置13接收响应于包含消费需求模式比例的输出信息的响应信息,并依据此响应信息选择性地调整目标子任务中的一或多者的消费需求模式比例。特别来说,自然语言处理装置17可以目标复杂任务的消费需求模式比例作为各目标子任务的默认消费需求模式比例,再提供用户通过对话装置13来调整各目标子任务的消费需求模式比例的管道。接着,自然语言处理装置17再依据经选择性调整后的目标子任务的消费需求模式比例来筛选商品服务数据,筛选或呈现商品服务数据的方式如前列每个预存子任务都具有消费需求模式比例的实施例所述,于此不再赘述。或者,自然语言处理装置17可以直接基于目标复杂任务的消费需求模式比例来查找具有目标子任务标签又具有此消费需求模式比例中比例最高的模式的标签的商品服务数据,或据此消费需求模式比例来决定商品服务数据的呈现顺序。借由上述基于心理需求提供适当的商品服务信息的方式,可以提升广告推荐和商品服务销售成功的机会。
[0037] 借由上述结构,本案所揭示的基于复杂任务分析的对话方法及系统,可以基于单一语意信息自动化地找出相关联的多个子任务,并提供对应的信息,借此提升信息提供的多元性,且使得使用者可以有效率地获取有益的信息。
[0038] 【符号说明】
[0039] 1               对话系统
[0040] 11              关键词汇撷取装置
[0041] 13              对话装置
[0042] 15              内存
[0043] 151             知识图谱
[0044] 153             商品服务数据库
[0045] 17              自然语言处理装置
[0046] CT1、CT2、CT4    预存复杂任务
[0047] ST1~ST6、ST8    预存子任务。

当前第1页 第1页 第2页 第3页
相关技术
分析对话相关技术
复杂任务相关技术
卢文祥发明人的其他相关专利技术