CN113689849A - 智能体控制装置、智能体控制方法以及记录有程序的记录介质 - Google Patents

智能体控制装置、智能体控制方法以及记录有程序的记录介质 Download PDF

Info

Publication number
CN113689849A
CN113689849A CN202110372236.8A CN202110372236A CN113689849A CN 113689849 A CN113689849 A CN 113689849A CN 202110372236 A CN202110372236 A CN 202110372236A CN 113689849 A CN113689849 A CN 113689849A
Authority
CN
China
Prior art keywords
agent
company
voice
notification
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110372236.8A
Other languages
English (en)
Other versions
CN113689849B (zh
Inventor
藤木健司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Publication of CN113689849A publication Critical patent/CN113689849A/zh
Application granted granted Critical
Publication of CN113689849B publication Critical patent/CN113689849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本公开提供一种智能体控制装置、智能体控制方法以及记录有程序的记录介质。智能体控制装置为能够运行多个智能体的装置,并具备:输出部,其将被运行的所述智能体的信息对于报知部而进行输出;变更部,其按照每个所述智能体而使对于所述报知部的报知形式进行变更。

Description

智能体控制装置、智能体控制方法以及记录有程序的记录 介质
技术领域
本发明涉及一种根据用户的请求而执行与智能体相关的处理的智能体控制装置、智能体控制方法以及记录有程序的记录介质。
背景技术
在日本特开2018-189984号公报中公开了一种语音对话智能体,其受理输入语音信号,并针对于所述输入语音信号而实施语音识别处理,且基于语音识别处理的结果和智能体信息来决定通过哪个智能体而实施基于该输入语音信号的处理。
在此,在存在多个智能体的情况下,如果各个智能体的说话形式、音质等相同,则用户会不知道正在呼叫哪个智能体,从而在需要进行与智能体的对话的情况下会产生无法顺利进行等问题。
发明内容
本公开的目的在于,提供一种在存在多个智能体的情况下,用户能够对呼叫的智能体进行确定,从而能够抑制与智能体的对话变得不成立的情况的智能体控制装置、智能体控制方法以及记录有程序的记录介质。
第一方式为一种智能体控制装置,其能够运行多个智能体,并具备:输出部,其将被运行的所述智能体的信息对于报知部而进行输出;变更部,其按照每个所述智能体而使对于所述报知部的报知形式进行变更。
第一方式的智能体控制装置被设为能够运行多个智能体。在该智能体控制装置中,通过输出部将被运行的智能体的信息对于报知部而进行输出,从而使在与用户之间实施对话成为可能。而且,在该智能体控制装置中,通过使变更部按照每个智能体而使对于报知部的报知形式进行变更,从而用户能够对所呼叫的智能体进行确定。由此,能够抑制与智能体的对话变得不成立的情况。
第二方式的智能体控制装置为,在第一方式的智能体控制装置中,所述报知部包括扬声器,所述变更部按照每个所述智能体而对语音形式进行变更。
第二方式的智能体控制装置通过语音而对用户提供智能体的信息。所提供的语音由变更部按照每个智能体的语音形式而被进行变更。在此,“语音形式”包括:男性女性的区别、语音的声调、以及说话形式等。根据该智能体控制装置,通过利用语音而对智能体进行识别,从而能够对驾驶中的用户提供不损害驾驶中的安全的对话。
第三方式的智能体控制装置为,在第二方式的智能体控制装置中,关于所述语音形式,用户能够从多个形式中选择一个形式。
根据第三方式的智能体控制装置,由于用户能够选择喜欢的语音形式,从而能够抑制在进行对话的情况下由不习惯的语音形式而产生的不快感。
第四方式的智能体控制装置为,在第一至第三方式中的任意一个方式的智能体控制装置中,所述报知部包括显示装置,所述变更部按照每个所述智能体而使对各个所述智能体进行确定的确定图像发生变化。
第四方式的智能体控制装置对用户而提供对智能体进行确定的确定图像。被提供的确定图像通过变更部而被变更为每个智能体的确定图像。在此,“确定图像”包括:对应于智能体的标识的图像、色彩的图像、以及闪烁、滑入等动态的图像。根据该智能体控制装置,即使在由语音进行的对话中断之时也能够对智能体进行识别。
根据本公开,在存在多个智能体的情况下,用户能够对所呼叫的智能体进行确定,从而能够抑制与智能体的对话变得不成立的情况。
附图说明
图1为表示第一实施方式所涉及的智能体系统的示意结构的图。
图2为表示第一实施方式的车辆的硬件结构的方框图。
图3为表示第一实施方式的设定数据的内容的图。
图4为表示第一实施方式的主机的功能结构的框图。
图5为表示第一实施方式的智能体系统中的设定模式的处理的流程的顺序图。
图6为表示第一实施方式的智能体系统中的启动处理的流程的顺序图。
图7为表示第二实施方式的智能体系统中的启动处理的流程的顺序图。
图8为表示第二实施方式的智能体系统中的启动处理的流程的顺序图,并且为图7的后续的图。
具体实施方式
[第一实施方式]
如在图1以及图2中所示的那样,第一实施方式的智能体系统10以包括车辆12、本公司服务器14以及其他公司服务器16的方式而构成。在车辆12上搭载有作为智能体控制装置的主机20、通信装置22、触摸面板24、扬声器26以及话筒28。触摸面板24以及扬声器26分别为报知部的一个示例。车辆12的通信装置22、本公司服务器14以及其他公司服务器16分别经过网络N而被相互连接。
本公司服务器14为,作为车辆12的制造商的本公司所保有的服务器。本公司服务器14具有对用户U的发声的意图进行推断的功能,以实现作为本公司的服务的本公司智能体的功能。在本公司智能体中,具有通话、结算、取得天气/新闻、取得车辆信息、汽车导航、请求救援等功能。
其他公司服务器16为,并非车辆12的制造商的其他公司所保有的服务器。其他公司服务器16具有对用户U的发声的意图进行推断的功能,以实现作为其他公司的服务的其他公司智能体的功能。在其他公司智能体中,具有提供音乐、有声读物、通话、取得天气/新闻等功能。另外,也可以通过本公司智能体和其他公司智能体来实现同种的功能。
(车辆)
如图2中所示,主机20以包括CPU(Central Processing Unit,中央处理器)20A、ROM(Read Only Memory,只读存储器)20B、RAM(Random Access Memory,随机存取存储器)20C、存储器20D、通信I/F(Inter Face,接口)20E以及输入输出I/F20F的方式而构成。CPU20A、ROM20B、RAM20C、存储器20D、通信I/F20E以及输入输出I/F20F经过内部总线20G而以能够通信的方式被相互连接。
CPU20A为中央运算处理单元,其执行各种程序、或对各个部分进行控制。也就是说,CPU20A从ROM20B或者存储器20D读取程序,并且将RAM20C作为工作区域而执行程序。CPU20A为处理器的一个示例。
ROM20B存储有各种程序以及各种数据。在本实施方式的ROM20B中,存储有用于控制主机20的控制程序。
RAM20C作为工作区域而临时性地对程序或者数据进行存储。
作为存储部的存储器20D由HDD(Hard Disk Drive,硬盘存储器)或者SSD(SolidState Drive,固态驱动器)而构成,并且存储有各种程序以及各种数据。本实施方式的存储器20D存储有处理程序100、形式数据110以及设定数据120。
处理程序100为用于对本公司智能体以及其他公司智能体进行控制的程序。
形式数据110为存储有本公司智能体以及其他公司智能体的语音形式和显示形式的数据。语音形式为表示从扬声器26被输出的语音的类别的数据,其包括男性女性的区别、语音的声调以及说话方式等。作为本实施方式的语音形式,例如具有作为男性的声音的音质不同的男性A、男性B以及男性C,以及作为女性的声音的音质不同的女性A、女性B以及女性C的总计六种类型的数据。
此外,显示形式为与在触摸面板24上所显示的确定图像相关的数据,其包括对应于智能体的标识的图像、色彩的图像、以及闪烁、滑入等动态的图像。在本实施方式的确定图像中,具有表示本公司智能体的本公司标识以及表示其他公司智能体的其他公司标识。
设定数据120为,存储有针对于本公司智能体而被设定的语音形式以及显示形式、以及针对于其他公司智能体而被设定的语音形式以及显示形式的数据。在设定数据120中被存储的语音形式以及显示形式通过用户U而被选择并被设定。
如图3中所示,例如,在设定数据120中,在本公司智能体中,设定了“男性C”的语音形式和“本公司标识”闪烁的显示形式,并且在其他公司智能体中,设定了“女性A”的语音形式和“其他公司标识”滑入的显示形式。
如图2中所示,通信I/F20E为用于与通信装置22进行连接的接口。该接口例如使用基于CAN协议的通信标准。通信I/F20E相对于外部总线20H而被进行连接。
输入输出I/F20F为,用于与车辆12所搭载的触摸面板24、扬声器26以及话筒28进行通信的接口。另外,触摸面板24、扬声器26以及话筒28也可以相对于内部总线20G而被直接连接。
通信装置22为用于与本公司服务器14以及其他公司服务器16进行通信的无线通信模块。该无线通信模块例如使用5G、LTE、Wi-Fi(注册商标)等通信标准。通信装置22相对于网络N而被连接。
触摸面板24被设置在仪表板等处,并且兼用为作为显示装置的液晶显示器、和作为输入装置的触摸屏。
扬声器26被设置在仪表板、中央控制台、前柱、车厢前壁等处,并且为用于输出与本公司智能体以及其他公司智能体相关的语音的装置。
话筒28被设置在车辆12的前柱或车厢前壁等处,并且为对作为车辆12的乘员的用户U所发出的语音进行收音的装置。
如图4中所示,在本实施方式的主机20中,CPU20A通过执行处理程序100,从而作为请求部200、第一执行部220、第二执行部230、输出部240、变更部250以及设定部260来发挥功能。
请求部200具有在规定的契机时请求智能体的运行的功能。在此,在“规定的契机”中,具有用户U的对于话筒28的发声、以及被设置在转向盘等上的PPT(Push-to-talk:随按即说)开关的按下等。请求部200在由用户U的发声所实现的语音信息中包含本公司智能体用的唤醒词的情况下,将该语音信息向本公司服务器14进行发送,从而请求本公司智能体的运行。此外,请求部200在由用户U的发声而实现的语音信息中包含其他公司智能体用的唤醒词的情况下,将该语音信息向其他公司服务器16进行发送,从而请求其他公司智能体的运行。
第一执行部220具有执行本公司智能体的功能。第一执行部220以从发送了由发声而实现的语音信息的本公司服务器14所提供的意图信息为基础,从而执行本公司智能体的功能。
第二执行部230具有执行其他公司智能体的功能。第二执行部230以从发送了由发声而实现的语音信息的其他公司服务器16所提供的意图信息为基础,从而执行其他公司智能体的功能。
输出部240具有将被执行的智能体的信息对于作为报知部的触摸面板24以及扬声器26而进行输出的功能。例如,输出部240在本公司智能体实施汽车导航功能中的目的地搜索的情况下,将被检索的目的地的地图信息向触摸面板24进行输出,并且将使目的地的文本信息语音化了的数据向扬声器26进行输出。此外,例如,输出部240在其他公司智能体实施音乐提供的情况下,将提供的乐曲的艺人以及标题向触摸面板24进行输出,并且将乐曲数据向扬声器26进行输出。
在触摸面板24上显示有,基于与智能体的信息一起从设定数据120被读出的显示形式的、智能体的标识。此外,针对与用户U实施对话的语音,而从扬声器26输出基于从设定数据120被读出的语音形式的语音。
变更部250具有按照每个智能体而使对于触摸面板24以及扬声器26的报知形式发生变更的功能。具体而言,变更部250在某个智能体被启动了的情况下,参照设定数据120来对与各个智能体相对应的语音形式以及显示形式进行变更。
设定部260具有对用户U从被存储在形式数据110中的多个形式中所选择的一个形式进行设定的功能。具体而言,在转移至设定模式的情况下,设定部260受理由用户U进行的语音形式以及显示形式的选择,并且将所受理的语音形式以及显示形式存储至设定数据120中。
另外,本公司智能体的语音形式以及显示形式能够从本公司服务器14作为形式信息而取得。而且,其他公司智能体的语音形式以及显示形式能够从其他公司服务器16作为形式信息而取得。
(控制的流程)
使用图5以及图6的顺序图而对在本实施方式的智能体系统10中被执行的处理的流程进行说明。主机20中的处理通过由CPU20A作为上述的请求部200、第一执行部220、第二执行部230、输出部240、变更部250以及设定部260来发挥功能,从而被实现。
首先,对于设定各个智能体的语音形式以及显示形式的设定模式的处理进行说明。
在图5的步骤S10中,本公司服务器14将与本公司智能体相关且涉及语音形式以及显示形式的形式信息向主机20进行发送。
在步骤S11中,其他公司服务器16将与其他公司智能体相关且涉及语音形式以及显示形式的形式信息向主机20进行发送。
从各个服务器所取得的语音形式以及显示形式被存储在形式数据110中。另外,语音形式以及显示形式并非必须在设定模式下从各个服务器取得,也可以预先存储在形式数据110中,还可以和智能体的应用程序一起从各个服务器取得。
然后,在步骤S12中,当用户U对触摸面板24实施操作时,在步骤S13中,主机20基于用户U的选择操作,从而设定语音形式以及显示形式。所设定的各个形式被存储在设定数据120中。
接下来,对于各个智能体的启动处理进行说明。
在车辆12启动了的情况下,在图6的步骤S20中,主机20读入各个智能体的语音形式以及显示形式。
在步骤S21中,用户U朝向主机20而进行发声。例如,用户U以发声为“Agent,给X先生/女士打电话”、“Assistant,放音乐”等的形式,而对智能体实施请求。
在步骤S22中,主机20实施对于由用户U的发声而产生的语音的语音识别。
在步骤S23中,主机20基于由语音识别而得到的语音信息,来对要启动的本公司智能体以及其他公司智能体中的任意一方进行检测。例如,主机20在发声的语音中存在“Agent”的唤醒词的情况下,将本公司智能体作为要启动的智能体而检测出。此外,主机20在发声的语音中存在“Assistant”的唤醒词的情况下,将其他公司智能体作为要启动的智能体而检测出。
在于步骤S23中检测出本公司智能体的情况下,转移至步骤S24~步骤S28的处理。
在步骤S24中,主机20对于在步骤S23中所检测出的智能体的服务器而发送语音信息。例如,在用户U发声为“Agent,给X先生/女士打电话”的情况下,将“给X先生/女士打电话”的内容的语音信息向本公司服务器14进行发送。
在步骤S25中,本公司服务器14基于所接收到的语音信息而实施语音识别,从而执行意图提取。例如,从“给X先生/女士打电话”的语音信息中提取给X先生/女士打电话的这一意图。
在步骤S26中,本公司服务器14将所提取的意图作为意图信息而向主机20进行发送。
在步骤S27中,主机20对本公司智能体的形式而进行设定。也就是说,主机20参照设定数据120而对本公司智能体的语音形式以及显示形式进行设定。
在步骤S28中,主机20开始本公司智能体的运行。也就是说,主机20当从本公司服务器14接收到给X先生/女士打电话的这一意图信息时,将启动通话功能,并且参照从本公司服务器14所取得或者被存储在存储器20D中的X先生/女士的联络方式而给X先生/女士打电话。由此,在主机20中开始进行通话。
另外,在参照了图3的设定数据120的结果为运行本公司智能体时,指导等对话的语音将会通过“男性C”的音质而从扬声器26被输出,并且本公司标识将会在触摸面板24上以闪烁的形式而被显示。
另一方面,在图6的步骤S23中检测出其他公司智能体的情况下,转移至步骤S29~步骤S33的处理。
在步骤S29中,主机20对于在步骤S23中被检测出的智能体的服务器而发送语音信息。例如,在用户U发声为“Assistant,放音乐”的情况下,将“放音乐”这一内容的语音信息向其他公司服务器16进行发送。
在步骤S30中,其他公司服务器16基于接收到的语音信息而实施语音识别,从而执行意图提取。例如,从“放音乐”的语音信息中提取出播放音乐的这一意图。
在步骤S31中,其他公司服务器16将被提取出的意图作为意图信息而向主机20进行发送。
在步骤S32中,主机20对其他公司智能体的形式进行设定。也就是说,主机20参照设定数据120而对其他公司智能体的语音形式以及显示形式进行设定。
在步骤S33中,主机20开始其他公司智能体的运行。也就是说,主机20当从其他公司服务器16接收到播放音乐的这一意图信息时,将会启动播放器并对从其他公司服务器16接收到的音乐进行播放。
另外,在参照了图3的设定数据120的结果为运行其他公司智能体时,指导等对话的语音将会通过“女性A”的音质而从扬声器26被输出,并且其他公司标识将会在触摸面板24上以滑入的形式而被显示。
(第一实施方式的总结)
本实施方式的主机20设为能够运行多个智能体。在主机20中,通过由输出部240将被运行的智能体的信息对于触摸面板24以及扬声器26而进行输出,从而使得在与用户U之间实施对话成为可能。而且,在本实施方式中,通过由变更部250按照每个智能体而使对于触摸面板24以及扬声器26的报知形式发生变更,从而用户U能够对所呼叫的智能体进行确定。因此,根据本实施方式,能够抑制与智能体的对话变得不成立的情况。
此外,本实施方式以语音的方式而对于用户U提供智能体的信息。被提供的语音通过变更部250而被变更为每个智能体的语音形式。根据本实施方式,通过利用语音而对智能体进行识别,从而能够对于驾驶中的用户U而提供不会损害驾驶中的安全的对话。
此外,根据本实施方式,由于用户U能够选择喜欢的语音形式,因而能够抑制在进行对话的情况下由不习惯的语音形式而产生的不快感。
更进一步,本实施方式的主机20以图像的方式而对于用户U提供智能体的信息。被提供的图像通过变更部250而被变更为每个智能体的标识等确定图像。根据本实施方式,即使在由语音进行的对话中断之时也能够对智能体进行识别。
[第二实施方式]
在第一实施方式中,本公司智能体和其他公司智能体是被独立地运行的。相对于此,第二实施方式为,在本公司智能体的运行过程中其他公司智能体被运行的方式。以下,对于与第一实施方式的不同点而进行说明。另外,对于其它的结构,由于与第一实施方式相同因而省略详细的说明。
在本实施方式的智能体系统10中被执行的启动处理为,如图7以及图8所示的处理。
在车辆12启动了的情况下,在图7的步骤S40中,主机20读入各个智能体的语音形式以及显示形式。
在步骤S41中,用户U朝向主机20而进行发声。例如,用户U以发声为“Agent,想去Y”的方式而对于智能体来实施请求。
在步骤S42中,主机20实施对于由用户U的发声而产生的语音的语音识别。
在步骤S43中,主机20基于由语音识别而得到的语音信息,从而对要启动的本公司智能体以及其他公司智能体中的任意一方进行检测。在步骤S41的发声的示例中,由于在发声的语音中存在着“Agent”的唤醒词,从而主机20将本公司智能体作为要启动的智能体而检测出。
在步骤S44中,主机20对于在步骤S43中被检测出的智能体的服务器而发送语音信息。在“Agent,想去Y”的这一发声中,“想去Y”的这一内容的语音信息将向本公司服务器14被发送。
在步骤S45中,本公司服务器14基于接收到的语音信息而实施语音识别,从而执行意图提取。例如,从“想去Y”的语音信息中提取出去往Y的路径引导的意图。
在步骤S46中,本公司服务器14将被提取出的意图作为意图信息而向主机20进行发送。
在步骤S47中,主机20对本公司智能体的形式进行设定。也就是说,主机20参照设定数据120而对本公司智能体的语音形式以及显示形式进行设定。
在步骤S48中,主机20开始本公司智能体的运行。也就是说,主机20在从本公司服务器14接收到进行去往Y的路径引导的这一意图信息时,将启动汽车导航功能并且将从本公司服务器14所取得的Y的位置信息设定为车辆12的目的地。由此,在主机20中开始实施向目的地Y的导航。
另外,在参照了图3的设定数据120的结果为运行本公司智能体时,指导等对话的语音将会以“男性C”的音质而从扬声器26被输出,并且本公司标识将会在触摸面板24上以闪烁的形式而被显示。
在此,本公司智能体执行汽车导航功能的过程中用户U启动了其他公司智能体的情况下,将会执行以下的处理。
在图8的步骤S49中,用户U朝向主机20而进行发声。例如,用户U以发声为“Assistant,告诉我Y附近的餐厅”的方式而对于智能体来实施请求。
在步骤S50中,主机20实施对于由用户U的发声而产生的语音的语音识别。
在步骤S51中,主机20基于由语音识别而得到的语音信息,来对要启动的本公司智能体以及其他公司智能体中的任意一方进行检测。在步骤S49的发声的示例中,由于在发声的语音中存在有“Assistant”的唤醒词,从而主机20将其他公司智能体作为要启动的智能体而检测出。
在步骤S52中,主机20针对于在步骤S51中被检测出的智能体的服务器发送语音信息。在“Assistant,告诉我Y附近的餐厅”这一发声中,“告诉我Y附近的餐厅”这一内容的语音信息将向其他公司服务器16被发送。
在步骤S53中,其他公司服务器16基于接收到的语音信息而实施语音识别,从而执行意图提取。例如,从“告诉我Y附近的餐厅”的语音信息中,提取出提供存在于Y附近的餐厅的信息这一意图。
在步骤S54中,其他公司服务器16将被提取出的意图作为意图信息而向主机20进行发送。
在步骤S55中,主机20实施对于接收到的意图是否与当前正在运行中的本公司智能体的功能具有关联的判断。在主机20判断为所接收到的意图与当前正在运行中的本公司智能体的功能具有关联的情况下,前进至步骤S56。另一方面,在主机20判断为所接收到的意图与目前正在运行中的本公司智能体的功能没有关联的情况下,前进至步骤S57。
在步骤S56中,主机20运行其他公司智能体以作为本公司智能体。在本实施方式中,当主机20从其他公司服务器16接收到提供存在于Y附近的餐厅的信息这一与向目的地Y的导航相关的意图信息时,使从其他公司服务器16接收到的餐厅的信息在触摸面板24上进行显示。此时,指导等对话的语音将会以“男性C”的音质而从扬声器26被输出,并且本公司标识将会在触摸面板24上以闪烁的形式而被显示。因此,用户U能够识别为,在与本公司智能体的对话之中取得了餐厅的信息。
另一方面,在步骤S55中判断为所接收到的意图与目前正在运行中的本公司智能体的功能没有关联的情况下,在步骤S57中,主机20对其他公司智能体的形式进行设定。例如,在接收到播放音乐的这一与导航无关的意图信息的情况下,主机20参照设定数据120而对其他公司智能体的语音形式以及显示形式进行设定。
在步骤S58中,主机20开始其他公司智能体的运行。主机20当从其他公司服务器16接收到播放音乐的这一意图信息时,将启动播放器并对从其他公司服务器16接收到的音乐进行播放。
在本实施方式中,在经由处于运行中的本公司智能体而运行其他公司智能体的情况下,语音形式以及显示形式不会发生变化。具体而言,在本实施方式中,在运行与处于运行中的本公司智能体的功能相关联的某其他公司智能体的功能的情况下,通过本公司智能体的语音形式而实施对话,并且本公司智能体的显示形式将会被显示在触摸面板24上。
具有如下情况,即,用户U只要能够接受所需要的服务,则不过问是由哪个智能体所提供。还具有如下情况,即,如本实施方式的示例那样,在向目的地的导航的流程之中查询了目的地附近的餐厅信息的情况下,如果每次对话时语音形式和显示形式都发生变化则反而会感觉出不适感。因此,通过如本实施方式的那样,在经由本公司智能体而运行其他公司智能体的情况下将语音形式以及显示形式固定,从而能够抑制在每次对话时智能体被切换的不适感。
另外,也可以使语音形式按照每个智能体而为固定,而仅使显示形式发生变化。在该情况下,能够在对话中抑制智能体被切换的不适感的同时,使用户U知晓实际上所启动着的智能体。
此外,虽然在本实施方式中,例示了经由本公司智能体而运行其他公司智能体的情况,但并非被限定于此,还可以构成为,在经由其他公司智能体而运行本公司智能体的情况下也将语音形式以及显示形式固定。
[备注]
虽然在上述各个实施方式中,对作为语音形式而从扬声器26被输出的语音的类别进行了改变,但并未被限定于此,也可以按照每个智能体而改变声音的发出方向。例如,也可以设为本公司智能体从右侧的扬声器26输出语音、而其他公司智能体从左侧的扬声器26输出语音。
另外,在上述实施方式中由CPU20A读入软件(程序)而执行的各种处理也可以由CPU以外的各种处理器来执行。作为在该情况下的处理器,可例示出具有FPGA(Field-Programmable Gate Array)等能够在生产后变更电路结构的PLD(Programmable LogicDevice)、以及ASIC(Application Specific Integrated Circuit)等为了执行特定的处理从而被专门设计的电路结构的作为处理器的专用电路等。此外,上述的处理既可以通过这些各种处理器之中的一个来执行,也可以通过同种或者不同种的两个以上的处理器的组合(例如,多个FPGA、以及CPU和FPGA的组合等)来执行。此外,这些各种处理器的硬件上的结构更具体而言为,对半导体元件等电路元件进行组合而成的电路。
此外,在上述实施方式中,各个程序以被预先存储(安装)在计算机可读取的非临时记录介质中的方式而进行了说明。例如,主机20中的处理程序100被预先存储在存储器20D中。但并未被限定于此,各个程序也可以通过被存储在CD-ROM(Compact Disc ReadOnly Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)以及USB(Universal Serial Bus)存储器等非临时记录介质中的方式而被提供。而且,程序也可以设为经过网络而从外部装置被下载的方式。
在上述实施方式中所说明的处理的流程也为一个示例,可以在不脱离主旨的范围内进行删除不必要的步骤、追加新的步骤、或者替换处理顺序。

Claims (7)

1.一种智能体控制装置,其能够运行多个智能体,并具备:
输出部,其将被运行的所述智能体的信息对于报知部而进行输出;
变更部,其按照每个所述智能体而使对于所述报知部的报知形式进行变更。
2.如权利要求1所述的智能体控制装置,其中,
所述报知部包括扬声器,
所述变更部按照每个所述智能体而对语音形式进行变更。
3.如权利要求2所述的智能体控制装置,其中,
关于所述语音形式,用户能够从多个形式中选择一个形式。
4.如权利要求1至3中的任意一项所述的智能体控制装置,其中,
所述报知部包括显示装置,
所述变更部按照每个所述智能体而使对各个所述智能体进行确定的确定图像发生变化。
5.如权利要求1至4中的任意一项所述的智能体控制装置,其中,
在第一智能体的运行过程中第二智能体被运行的情况下、并且在所述第二智能体中被运行的功能与处于运行中的所述第一智能体的功能相关联的情况下,所述变更部不变更为所述第二智能体的报知形式而是对所述第一智能体的报知形式进行维持。
6.一种智能体控制方法,其为能够运行多个智能体的智能体控制装置中的智能体控制方法,所述智能体控制方法使计算机执行如下处理,所述处理包括:
将被运行的所述智能体的信息对于报知部而进行输出的处理;
按照每个所述智能体而使对于所述报知部的报知形式进行变更的处理。
7.一种非临时性的记录介质,其记录有对能够运行多个智能体的智能体控制装置进行控制的程序,其中,
所述程序用于使计算机执行如下处理,所述处理包括:
将被运行的所述智能体的信息对于报知部而进行输出的处理;
按照每个所述智能体而使对于所述报知部的报知形式进行变更的处理。
CN202110372236.8A 2020-05-18 2021-04-07 智能体控制装置、智能体控制方法以及记录有程序的记录介质 Active CN113689849B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-087038 2020-05-18
JP2020087038A JP7318587B2 (ja) 2020-05-18 2020-05-18 エージェント制御装置

Publications (2)

Publication Number Publication Date
CN113689849A true CN113689849A (zh) 2021-11-23
CN113689849B CN113689849B (zh) 2023-11-17

Family

ID=78512771

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110372236.8A Active CN113689849B (zh) 2020-05-18 2021-04-07 智能体控制装置、智能体控制方法以及记录有程序的记录介质

Country Status (3)

Country Link
US (1) US11636857B2 (zh)
JP (1) JP7318587B2 (zh)
CN (1) CN113689849B (zh)

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11194804A (ja) * 1997-12-26 1999-07-21 Hitachi Ltd インテリジェント機器および機器制御装置
JP2005149480A (ja) * 2003-10-21 2005-06-09 Zenrin Datacom Co Ltd 音声認識を用いた情報入力を伴う情報処理装置
CN1985497A (zh) * 2004-10-26 2007-06-20 松下电器产业株式会社 信息输出装置、信息输出控制方法及信息输出控制程序
US20120260288A1 (en) * 2011-04-11 2012-10-11 Sony Corporation Information processing apparatus, information processing method, and program
WO2014020835A1 (ja) * 2012-07-31 2014-02-06 日本電気株式会社 エージェント制御システム、方法およびプログラム
WO2014203495A1 (ja) * 2013-06-19 2014-12-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声対話方法、及び機器
KR101574064B1 (ko) * 2014-11-20 2015-12-03 (주)지플러스 상황 설정별 예약 실행 시스템 및 그 예약 실행 방법
US20160065671A1 (en) * 2014-09-03 2016-03-03 Commvault Systems, Inc. Consolidated processing of storage-array commands by a snapshot-control media agent
CN106571141A (zh) * 2015-10-12 2017-04-19 三星电子株式会社 处理基于语音代理的控制命令的设备和方法及代理器装置
WO2018067402A1 (en) * 2016-10-03 2018-04-12 Google Inc. Selection of computational agent for task performance
CN108701142A (zh) * 2016-02-26 2018-10-23 索尼公司 信息处理系统、客户终端、信息处理方法和记录介质
US20190066672A1 (en) * 2017-08-28 2019-02-28 Roku, Inc. Media System with Multiple Digital Assistants
CN110880319A (zh) * 2018-09-06 2020-03-13 丰田自动车株式会社 语音交互装置、语音交互装置的控制方法以及存储程序的非暂时性记录介质
WO2020070878A1 (ja) * 2018-10-05 2020-04-09 本田技研工業株式会社 エージェント装置、エージェント制御方法、およびプログラム
CN111016820A (zh) * 2018-10-09 2020-04-17 本田技研工业株式会社 智能体系统、智能体控制方法及存储介质
CN111092988A (zh) * 2018-10-24 2020-05-01 本田技研工业株式会社 控制装置、智能体装置以及计算机可读存储介质
US20200143810A1 (en) * 2018-11-06 2020-05-07 Honda Motor Co.,Ltd. Control apparatus, control method, agent apparatus, and computer readable storage medium

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9965553B2 (en) * 2013-05-29 2018-05-08 Philip Scott Lyren User agent with personality

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11194804A (ja) * 1997-12-26 1999-07-21 Hitachi Ltd インテリジェント機器および機器制御装置
JP2005149480A (ja) * 2003-10-21 2005-06-09 Zenrin Datacom Co Ltd 音声認識を用いた情報入力を伴う情報処理装置
CN1985497A (zh) * 2004-10-26 2007-06-20 松下电器产业株式会社 信息输出装置、信息输出控制方法及信息输出控制程序
US20120260288A1 (en) * 2011-04-11 2012-10-11 Sony Corporation Information processing apparatus, information processing method, and program
WO2014020835A1 (ja) * 2012-07-31 2014-02-06 日本電気株式会社 エージェント制御システム、方法およびプログラム
US20160322048A1 (en) * 2013-06-19 2016-11-03 Panasonic Intellectual Property Corporation Of America Voice interaction method, and device
WO2014203495A1 (ja) * 2013-06-19 2014-12-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声対話方法、及び機器
US20160065671A1 (en) * 2014-09-03 2016-03-03 Commvault Systems, Inc. Consolidated processing of storage-array commands by a snapshot-control media agent
KR101574064B1 (ko) * 2014-11-20 2015-12-03 (주)지플러스 상황 설정별 예약 실행 시스템 및 그 예약 실행 방법
CN106571141A (zh) * 2015-10-12 2017-04-19 三星电子株式会社 处理基于语音代理的控制命令的设备和方法及代理器装置
CN108701142A (zh) * 2016-02-26 2018-10-23 索尼公司 信息处理系统、客户终端、信息处理方法和记录介质
WO2018067402A1 (en) * 2016-10-03 2018-04-12 Google Inc. Selection of computational agent for task performance
US20190066672A1 (en) * 2017-08-28 2019-02-28 Roku, Inc. Media System with Multiple Digital Assistants
CN110880319A (zh) * 2018-09-06 2020-03-13 丰田自动车株式会社 语音交互装置、语音交互装置的控制方法以及存储程序的非暂时性记录介质
WO2020070878A1 (ja) * 2018-10-05 2020-04-09 本田技研工業株式会社 エージェント装置、エージェント制御方法、およびプログラム
CN111016820A (zh) * 2018-10-09 2020-04-17 本田技研工业株式会社 智能体系统、智能体控制方法及存储介质
CN111092988A (zh) * 2018-10-24 2020-05-01 本田技研工业株式会社 控制装置、智能体装置以及计算机可读存储介质
US20200143810A1 (en) * 2018-11-06 2020-05-07 Honda Motor Co.,Ltd. Control apparatus, control method, agent apparatus, and computer readable storage medium

Also Published As

Publication number Publication date
JP7318587B2 (ja) 2023-08-01
US11636857B2 (en) 2023-04-25
CN113689849B (zh) 2023-11-17
JP2021182057A (ja) 2021-11-25
US20210358494A1 (en) 2021-11-18

Similar Documents

Publication Publication Date Title
CN110166896B (zh) 语音提供方法、语音提供系统和服务器
JP4292646B2 (ja) ユーザインタフェース装置、ナビゲーションシステム、情報処理装置及び記録媒体
CN111661068B (zh) 智能体装置、智能体装置的控制方法及存储介质
CN104978015B (zh) 具有语种自适用功能的导航系统及其控制方法
JP7272293B2 (ja) エージェント装置、エージェントシステム及びプログラム
JP7338493B2 (ja) エージェント装置、エージェントシステム及びプログラム
US20200319841A1 (en) Agent apparatus, agent apparatus control method, and storage medium
CN111660955A (zh) 车载智能体系统、车载智能体系统的控制方法及存储介质
JP6281202B2 (ja) 応答制御システム、およびセンター
JP2014219617A (ja) 音声案内システム及び音声案内方法
US11790907B2 (en) Agent device, agent system, and recording medium
CN113689849A (zh) 智能体控制装置、智能体控制方法以及记录有程序的记录介质
US11663035B2 (en) Agent control device
CN111559317B (zh) 智能体装置、智能体装置的控制方法及存储介质
JP2004301875A (ja) 音声認識装置
CN111724778B (zh) 车载装置、车载装置的控制方法及存储介质
CN111667823B (zh) 智能体装置、智能体装置的控制方法及存储介质
JP2019159559A (ja) 情報提供装置
JP2013250132A (ja) 車載装置、車載情報システム
JP6555113B2 (ja) 対話装置
CN113160824A (zh) 信息处理系统、信息处理装置及程序
JP2019212168A (ja) 音声認識システムおよび情報処理装置
CN113682320B (zh) 智能体控制装置
WO2015111256A1 (ja) 音声調整システム、サーバ及び車載装置
CN111739524B (zh) 智能体装置、智能体装置的控制方法及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant