技术领域
[0001] 本公开涉及一种响应于用户的请求而执行与智能体相关的处理的智能体控制装置。
相关背景技术
[0002] 在日本特开2018‑189984号公报中,公开了一种语音对话智能体,其接受输入语音信号,而对所述输入语音信号实施语音识别处理,并基于语音识别处理的结果和智能体信息,决定要利用哪一个智能体来实施基于该输入语音信号的处理。
[0003] 如下的情况是不希望出现的,即,在一个智能体正在执行通话或结算处理等从服务特性的观点和安全性的观点出发需求持续性的功能的过程中,因其他智能体被启动,而导致之前的对话暂时中断或者结束。
具体实施方式
[0028] [第一实施方式]
[0029] 如图1以及图2所示,第一实施方式的智能体系统10被构成为,包括车辆12、本公司服务器14和其他公司服务器16。在车辆12上,搭载有作为智能体控制装置的主机(head unit)20、通信装置22、触摸面板24、扬声器26和话筒28。车辆12的通信装置22、本公司服务器14以及其他公司服务器16分别经由网络N而互相连接。
[0030] 本公司服务器14为,作为车辆12的制造商的本公司所保有的服务器。本公司服务器14为了实现作为本公司的服务的本公司智能体的功能,而具有对用户U的发声的意图进行推断的功能。在本公司智能体中,具有通话、结算、取得天气/新闻、取得车辆信息、检索目的地、请求救援等功能。本公司智能体为一个智能体的一个示例。
[0031] 其他公司服务器16为,并非车辆12的制造商的其他公司所保有的服务器。其他公司服务器16为了实现作为其他公司的服务的其他公司智能体的功能,而具有对用户U的发声的意图进行推断的功能。在其他公司智能体中,具有提供音乐、有声读物、通话、取得天气/新闻等功能。其他公司智能体为其他智能体的一个示例。另外,也可以由本公司智能体和其他公司智能体来实现同种功能。
[0032] (车辆)
[0033] 如图2所示,主机20被构成为,包括CPU(Central Processing Unit,中央处理器)20A、ROM(Read Only Memory,只读存储器)20B、RAM(Random Access Memory,随机存取存储器)20C、储存器20D、通信I/F(Inter Face,接口)20E以及输入输出I/F20F。CPU20A、ROM20B、RAM20C、储存器20D、通信I/F20E以及输入输出I/F20F经由内部总线20G而以能够相互通信的方式进行连接。CPU20A为处理器的一个示例,RAM20C为存储器的一个示例。
[0034] CPU20A为中央运算处理单元,其执行各种程序或对各部分进行控制。即,CPU20A从ROM20B或者储存器20D中读取程序,并将RAM20C作为工作区来执行程序。
[0035] ROM20B对各种程序以及各种数据进行存储。在本实施方式的ROM20B中,存储有用于对主机20进行控制的控制程序。
[0036] RAM20C作为工作区而临时性地对程序或者数据进行存储。
[0037] 作为存储部的储存器20D由HDD(Hard Disk Drive:硬盘驱动器)或者SSD(Solid State Drive:固态硬盘)构成,并对各种程序以及各种数据进行存储。本实施方式的储存器20D对处理程序100和中断可否列表110进行存储。
[0038] 处理程序100为,用于对本公司智能体以及其他公司智能体进行控制的程序。
[0039] 如图3所示,中断可否列表110为,对本公司智能体的各功能的执行中的该功能的中断的可否进行了规定的列表。在中断可否列表110中,在为本公司智能体的被需求持续性的功能的情况下,被规定为即使请求了其他公司智能体也不可中断正在执行的功能。例如,在被执行的本公司智能体的功能为“通话”的情况下以及“结算”的情况下,被规定为将该功能的中断设为不可以的“不可”。
[0040] 此外,例如在被执行的本公司智能体的功能为“取得天气/新闻”的情况下以及“取得车辆信息”的情况下,被规定为将该功能的中断设为可以的“可”。另外,在被执行的本公司智能体的功能为“检索目的地”的情况下,被规定为即使请求了其他智能体也使之保留并设为可以使其在该功能结束后执行的“保留”。
[0041] 如图2所示,通信I/F20E为,用于与通信装置22进行连接的接口。该接口例如使用了基于CAN协议的通信标准。通信I/F20E与外部总线20H相连接。
[0042] 输入输出I/F20F为,用于与搭载于车辆12上的触摸面板24、扬声器26以及话筒28进行通信的接口。另外,触摸面板24、扬声器26以及话筒28也可以与内部总线20G直接连接。
[0043] 通信装置22为,用于与本公司服务器14以及其他公司服务器16进行通信的无线通信模块。该无线通信模块例如使用了5G、LTE、Wi‑Fi(注册商标)等通信标准。通信装置22与网络N相连接。
[0044] 触摸面板24被设置在仪表板上,并兼具作为显示部的液晶显示器、和作为输入部的触摸板的作用。
[0045] 扬声器26被设置在仪表板、中央控制台、前柱、前围板等上,且为用于对与本公司智能体以及其他公司智能体相关的语音进行输出的装置。
[0046] 话筒28被设置在车辆12的前柱或前围板等上,且为对作为车辆12的乘员的用户U所发出的语音进行收音的装置。
[0047] 如图4所示,在本实施方式的主机20中,CPU20A通过执行处理程序100,来作为请求部200、第一执行部220、第二执行部230、设定部240以及管理部250而发挥功能。
[0048] 请求部200具有在预定的契机请求智能体的运行的功能。在此,在“预定的契机”中,具有用户U对于话筒28的发声、被设置于转向装置等上的未图示的PTT(Push‑To‑Talk:一键通)开关的按下等。在基于用户U的发声的语音信息中包含有本公司智能体用的唤醒字的情况下,请求部200将该语音信息发送至本公司服务器14以请求本公司智能体的运行。此外,在基于用户U的发声的语音信息中包含有其他公司智能体用的唤醒字的情况下,请求部
200将该语音信息发送至其他公司服务器16以请求其他公司智能体的运行。
[0049] 第一执行部220具有使本公司智能体运行的功能。第一执行部220根据从发送了基于发声的语音信息的本公司服务器14提供的意图信息,来执行本公司智能体的功能。
[0050] 第二执行部230具有使其他公司智能体运行的功能。第二执行部230根据从发送了基于发声的语音信息的其他公司服务器16提供的意图信息,来执行其他公司智能体的功能。
[0051] 设定部240具有参照中断可否列表110来对与各智能体的运行可否相关的可否信息进行设定的功能。本实施方式的可否信息为,作为能够设定为开启(ON)、关闭(OFF)的标记的占有标记,且设定部240会基于中断可否列表110中所规定的本公司智能体中的每个功能各自的中断的可否,来分别对占有标记进行设定。具体而言,设定部240在本公司智能体的某个功能为不可中断的情况下,在本公司智能体的该功能的运行开始时将占有标记设定为开启,并在该功能结束时将占有标记设定为关闭。
[0052] 管理部250具有对各智能体的运行进行管理的功能。本实施方式的管理部250以如下的方式进行管理,即,当在本公司智能体的运行过程中从请求部200而具有关于其他公司智能体的运行的请求、且占有标记为开启的情况下,并不响应关于其他公司智能体的运行的请求,而使本公司智能体继续。
[0053] (控制的流程)
[0054] 使用图5以及图6的顺序图,而对在本实施方式的智能体系统10中所执行的处理的流程进行说明。主机20中的处理通过CPU20A作为上述的请求部200、第一执行部220、第二执行部230、设定部240以及管理部250而发挥功能来实现。
[0055] 在图5的步骤S10中,用户U朝向主机20发声。例如,用户U发声出“Agent,给X打电话”、“Assistant,播放音乐”等,来向智能体发出请求。
[0056] 在步骤S11中,主机20实施由用户U的发声所产生的语音的语音识别。
[0057] 在步骤S12中,主机20基于由语音识别所生成的语音信息,来对要启动本公司智能体以及其他公司智能体中的哪一方进行检测。例如,在发声的语音中存在有“Agent”的唤醒字的情况下,主机20将本公司智能体检测作为要启动的智能体。此外,在发声的语音中存在有“Assistant”的唤醒字的情况下,主机20将其他公司智能体检测作为要启动的智能体。
[0058] 在步骤S13中,主机20实施占有标记是否为关闭的判断。主机20在判断为占有标记并不为关闭、即为开启的情况下,进入步骤S14。另一方面,在主机20判断为占有标记为关闭的情况下,进入步骤S15。
[0059] 在步骤S14中,主机20将针对智能体的请求废弃。然后,智能体的执行处理结束。
[0060] 在步骤S15中,主机20对在步骤S12中被检测出的智能体的服务器发送语音信息。图5为发出与本公司智能体相关的请求的示例,在用户U发声出“Agent,给X打电话”的情况下,“给X打电话”这样的内容的语音信息会被发送至本公司服务器14。
[0061] 在步骤S16中,本公司服务器14基于所接收到的语音信息来进行语音识别,并执行意图提取。例如,从“给X打电话”的语音信息中提取出给X打电话的意图。
[0062] 在步骤S17中,本公司服务器14将被提取出的意图作为意图信息而发送至主机20。
[0063] 在步骤S18中,主机20开始本公司智能体的运行。即,当主机20从本公司服务器14接收到给X打电话的这样的意图信息时,启动通话功能,并参照从本公司服务器14取得的、或者被存储在储存器20D中的X的联系方式来给X打电话。由此,通过主机20而开始进行通话。
[0064] 在步骤S19中,主机20对中断可否列表110进行参照。例如像图3所示的那样,在本公司智能体正进行通话的情况下,取得将本公司智能体的中断设为不可以的“不可”的信息。
[0065] 在图5的步骤S20中,主机20实施本公司智能体是否为不可中断的判断。在主机20判断为本公司智能体为不可中断的情况下,进入步骤S21。另一方面,在主机20判断为本公司智能体并不是不可中断的情况下,进入图6的步骤S22。
[0066] 在步骤S21中,主机20将占有标记设定为开启。
[0067] 图6的步骤S22至步骤S26的处理与上述的步骤S10至步骤S14的处理相同。
[0068] 在步骤S27中,主机20实施本公司智能体是否已结束的判断。在主机20判断为本公司智能体并未结束的情况下,即,在本公司智能体尚在运行过程中的情况下,返回至步骤S22。另一方面,在主机20判断为本公司智能体已结束的情况下,进入步骤S28。
[0069] 在步骤S28中,主机20将占有标记设定为关闭。然后,智能体的执行处理结束。
[0070] 当在步骤S25中被判断为占有标记为关闭的情况下,在步骤S29中,主机20对在步骤S24中被检测出的智能体的服务器发送语音信息。图6为发出与其他公司智能体相关的请求的示例,在用户U发声出“Assistant,播放音乐”的情况下,“播放音乐”这样的内容的语音信息会被发送至其他公司服务器16。
[0071] 在步骤S30中,其他公司服务器16基于所接收到的语音信息而实施语音识别,并执行意图提取。例如,从“播放音乐”的语音信息中提取出播放音乐的意图。
[0072] 在步骤S31中,其他公司服务器16将被提取出的意图作为意图信息发送至主机20。
[0073] 在步骤S32中,主机20开始其他公司智能体的运行。在这种情况下,正在运行过程中的本公司智能体会被中断并结束。例如,当主机20从其他公司服务器16接收到播放音乐这样的意图信息时,会使运行过程中的本公司智能体结束,并播放从其他公司服务器16所接收到的音乐。
[0074] (第一实施方式的总结)
[0075] 本实施方式的主机20设为,作为多个智能体而能够使本公司智能体以及其他公司智能体运行。在主机20中,规定了对于所执行的本公司智能体的各功能的中断可否的中断可否列表110被存储在储存器20D中。此外,在本实施方式中,请求部200在由发声、PTT开关的操作等所产生的预定的契机下请求智能体的运行,设定部240伴随着本公司智能体的运行,而参照中断可否列表110来对与其他公司智能体的运行可否相关的可否信息进行设定以作为占有标记。而且,管理部250以如下方式进行管理,即,当在本公司智能体的运行过程中具有关于其他公司智能体的运行的请求、且占有标记为开启的情况下,使本公司智能体继续。
[0076] 根据本实施方式的主机20,能够对在本公司智能体的运行过程中其他公司智能体被启动从而导致本公司智能体发生中断的情况进行抑制。
[0077] 在此,当在本公司智能体执行通话的过程中伴随着其他公司智能体的请求而导致通话发生中断的情况下,会话会被强制性地中断。此外,当在本公司智能体执行结算的过程中伴随着其他公司智能体的请求而导致结算处理发生中断的情况下,存在发生结算故障的可能性。与此相对,在本实施方式的主机20中被形成为,在本公司智能体中的被需求持续性的通话和结算等功能的执行过程中,使该功能不被中断。即,根据本实施方式,可以对在本公司智能体执行通话过程中通话被中断、或在结算处理过程中结算处理被中断的情况进行抑制。
[0078] 另外,根据本实施方式,通过将占有标记设置为可否信息,能够通过占有标记的开启、关闭来一并地对不同功能的智能体进行管理。
[0079] [第二实施方式]
[0080] 第一实施方式采用如下方式,即,在占有标记为开启的情况下,新的智能体的运行请求被废弃。与此相对,第二实施方式被形成为,在占有标记为开启的情况下,对新的智能体的运行请求进行保留。以下,对与第一实施方式的不同之处进行说明。另外,关于其他的结构,与第一实施方式相同,从而省略详细的说明。
[0081] 本实施方式的管理部250为,当在本公司智能体的运行过程中从请求部200而具有关于其他公司智能体的运行的请求、且占有标记为开启的情况下,对关于其他公司智能体的运行的请求进行保留并使本公司智能体继续。然后,管理部250在被继续运行的本公司智能体结束之后,使请求正处于保留状态的其他公司智能体运行。
[0082] 在本实施方式的智能体系统10中所执行的处理的与第一实施方式的不同之处如图7所示的那样。即,代替图6的步骤S26至步骤S28的处理,而执行步骤S40至步骤S42的处理。
[0083] 当在步骤S25中判断为占有标记并不为关闭的情况下,在步骤S40中,主机20将针对智能体的请求保留。
[0084] 在步骤S41中,主机20实施本公司智能体是否已结束的判断。在主机20判断为本公司智能体并未结束的情况下,即,在本公司智能体尚在运行中的情况下,返回至步骤S22。另一方面,在主机20判断为本公司智能体已结束的情况下,进入步骤S42。
[0085] 在步骤S42中,主机20将占有标记设定为关闭。然后,进入步骤S29。
[0086] 另外,在步骤S40中被保留的针对智能体的请求被反映在步骤S29至步骤S32中。由此,在步骤S32中,开始被保留的其他公司智能体的运行。
[0087] (第二实施方式的总结)
[0088] 第二实施方式的主机20被形成为,即使当在本公司智能体的运行过程中无法运行其他公司智能体的情况下,也不将其他公司智能体的运行请求废弃而是对其进行保留。因此,根据本实施方式,在本公司智能体结束之后,不必再次实施其他公司智能体的请求就能够使其他公司智能体运行。
[0089] [第三实施方式]
[0090] 第一实施方式采用如下方式,即,针对所运行的本公司智能体的每个功能来分别对该功能的中断的可否进行判断。与此相对,第三实施方式为,根据本公司智能体的运行状况,来对正在运行过程中的功能的中断的可否进行判断。以下,对与第一实施方式的不同之处进行说明。另外,关于其他的结构,与第一实施方式相同,从而省略详细的说明。
[0091] 本实施方式的中断可否列表110为,对针对与本公司智能体的运行状况相应的级别的本公司智能体的中断的可否进行了规定的列表。如图8所示,在中断可否列表110中,针对本公司智能体每个功能而对运行状况、与各运行状况相对应的级别、和与级别建立了关联的不可中断的信息进行了规定。
[0092] 例如,在本公司智能体的功能为“购物”的情况下,正在结算处理过程中被规定为将处理的中断设为不可以的级别A、正在采购手续过程中被规定为将其他公司智能体的运行设为保留的级别B、正在物品检索过程中被规定为将处理的中断设为可以的级别C。此外,例如在本公司智能体的功能为“辅助驾驶”的情况下,正处于警告状态被规定为将处理的中断设为不可以的级别A、正处于危险预告状态被规定为对其他公司智能体的运行进行保留的级别B、正处于通常状态被规定为将处理的中断设为可以的级别C。
[0093] 在本实施方式中,将根据本公司智能体的运行状况而发生变动的级别设为可否信息。而且,设定部240以在运行过程中的本公司智能体的级别超过被设定的阈值级别的情况下使其他公司智能体不可运行的方式进行设定,且以在成为阈值级别以下的情况下使其他公司智能体能够运行的方式进行设定。
[0094] 在本实施方式中被设定为,级别A为最高,级别B、级别C按照顺序而级别变低,且级别B被设定作为阈值。因此,在本实施方式中被形成为,在超过级别B的情况下,即,在成为级别A的情况下,其他公司智能体不可运行。
[0095] (控制的流程)
[0096] 使用图9以及图10的顺序图,来对在本实施方式的智能体系统10中所执行的处理的流程进行说明。
[0097] 图9的步骤S50至步骤S52的处理与上述的步骤S10至步骤S12的处理相同,步骤S53至步骤S56的处理与上述的步骤S15至步骤S18的处理相同。
[0098] 在步骤S57中,主机20对中断可否列表110进行参照。例如在本公司智能体正在进行购物的情况下,取得与物品检索、采购手续、结算处理的各执行状况相应的级别的信息。
[0099] 在步骤S58中,主机20对与本公司智能体的运行状况相应的级别进行设定。
[0100] 图10的步骤S59至步骤S61的处理与上述的步骤S22至步骤S24的处理相同。
[0101] 在步骤S62中,主机20实施所设定的级别是否为级别C的判断。在主机20判断为所设定的级别并不是级别C的情况下,进入步骤S63。另一方面,在主机20判断为所设定的级别为级别C的情况下,进入步骤S67。
[0102] 在步骤S63中,主机20实施所设定的级别是否为级别A的判断。在主机20判断为所设定的级别并不是级别A的情况下,进入步骤S65。另一方面,在主机20判断为所设定的级别为级别A的情况下,进入步骤S64。
[0103] 在步骤S64中,主机20将针对智能体的请求废弃。然后,进入步骤S58。即,主机20实施与运行状况相应的级别的再设定。
[0104] 当在步骤S62中被判断为并不是级别C、且在步骤S63中被判断为并不是级别A的情况下,即,在判断为是级别B的情况下,在步骤S65中,主机20对针对智能体的请求进行保留。
[0105] 在步骤S66中,主机20实施请求保留时中的本公司智能体的事件是否已结束的判断。在主机20判断为本公司智能体的事件并未结束的情况下,进入步骤S58。即,主机20实施与运行状况相应的级别的再设定。另一方面,在主机20判断为本公司智能体的事件已结束的情况下,进入步骤S67。
[0106] 图10的步骤S67至步骤S70的处理与上述的步骤S29至步骤S32的处理相同。
[0107] (第三实施方式的总结)
[0108] 第三实施方式的智能体控制装置的特征在于,通过根据本公司智能体的运行状况而发生变动的级别,来对其他公司智能体的运行的可否进行设定。即,根据本实施方式,能够根据智能体正在运行的功能的运行状况来对中断的可否进行管理。
[0109] [附注]
[0110] 虽然在上述各实施方式中,基于被存储在中断可否列表110中的本公司智能体的运行的可否来对其他公司智能体的运行进行控制,但是并不限定于此。即,也可以将其他公司智能体的运行的可否存储在中断可否列表110中,并基于其他公司智能体的运行可否,来对本公司智能体的运行进行控制。
[0111] 第二实施方式以及第三实施方式的主机20被形成为,能够对其他公司智能体的请求进行保留,并在本公司智能体结束了的阶段将被保留的请求作为语音信息而发送至其他公司服务器16。然而并不限定于此,也可以形成为,在主机20将其他公司智能体的请求废弃了的情况下,在本公司智能体结束了的阶段向用户U再次询问请求,也就是说,再次请求发声。
[0112] 另外,也可以将在上述实施方式中CPU20A读取软件(程序)并执行的各种处理由CPU以外的各种处理器来执行。作为这种情况下的处理器,可例示出FPGA(Field‑Programmable Gate Array:现场可编程门阵列)等在制造之后能够改变电路结构的PLD(Programmable Logic Device:可编程逻辑器件)以及ASIC(Application Specific Integrated Circuit:特殊应用集成电路)等为了执行特定的处理而具有专门被设计的电路结构的处理器、即专用电路等。此外,既可以将上述的受理处理由这些各种处理器中的一个来执行,也可以由同种类或不同种类的两个以上的处理器的组合(例如,多个FPGA、以及CPU和FPGA的组合等)来执行。此外,更具体而言,这些各种的处理器的硬件性的结构为,对半导体元件等电路元件进行组合的电路。
[0113] 此外,在上述实施方式中,以各程序被预先存储(安装)在计算机可读取的非临时性的记录介质中的方式来进行了说明。例如,主机20中的处理程序100被预先存储在储存器20D中。然而并不限定于此,各程序也可以被记录在CD‑ROM(Compact Disc Read Only Memory:只读光盘存储器)、DVD‑ROM(Digital Versatile Disc Read Only Memory:数字通用光盘只读存储器)以及USB(Universal Serial Bus:通用串行总线)存储器等非临时性的记录介质中的方式而被提供。此外,程序也可以设为经由网络而从外部装置被下载的形态。
[0114] 在上述实施方式中所说明的处理的流程也是一个示例,也可以在不脱离主旨的范围内删除不必要的步骤,或者追加新的步骤,或者对处理顺序进行替换。