CN113168418A - 对话装置、对话方法和对话程序 - Google Patents
对话装置、对话方法和对话程序 Download PDFInfo
- Publication number
- CN113168418A CN113168418A CN201880099189.0A CN201880099189A CN113168418A CN 113168418 A CN113168418 A CN 113168418A CN 201880099189 A CN201880099189 A CN 201880099189A CN 113168418 A CN113168418 A CN 113168418A
- Authority
- CN
- China
- Prior art keywords
- dialog
- dialogue
- script
- information
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 28
- 238000010586 diagram Methods 0.000 claims abstract description 132
- 238000013515 script Methods 0.000 claims abstract description 118
- 238000012545 processing Methods 0.000 claims abstract description 67
- 238000013461 design Methods 0.000 claims abstract description 36
- 230000007704 transition Effects 0.000 claims description 40
- 230000000694 effects Effects 0.000 claims description 5
- 230000002452 interceptive effect Effects 0.000 description 34
- 238000010276 construction Methods 0.000 description 31
- 230000006870 function Effects 0.000 description 26
- 230000008569 process Effects 0.000 description 7
- 230000006399 behavior Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 201000003231 brachydactyly type D Diseases 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24547—Optimisations to support specific applications; Extensibility of optimisers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2423—Interactive query statement specification based on a database schema
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24537—Query rewriting; Transformation of operators
Abstract
按照对话脚本与用户进行对话的对话装置(1)具有:对话设计部,其取得对话中的多个处理状态和表示多个处理状态之间的关系的关系信息,根据多个处理状态和关系信息,构建记述设计出的对话功能整体的图;以及对话执行部,其根据在实际对话时动态地取得的信息(B1、B2),搜索记述设计出的对话功能整体的图中的多个处理状态中的、在实际对话中出现的处理状态,动态地决定包含通过搜索而得到的处理状态在内的对话脚本。
Description
技术领域
本发明涉及按照对话脚本执行对话的对话装置、以及为了按照对话脚本执行对话而使用的对话方法和对话程序。
背景技术
具备对话型HMI(Human Machine Interface:人机接口)的导航装置、家电设备等电气设备正在普及。在这样的电气设备中,按照表示事先设计出的对话处理流程的对话脚本进行针对来自用户的询问的响应、对用户的提问等。在按照对话脚本执行对话的对话装置中,安装有对话中的处理状态(例如,等待输入状态、检索中的状态等状态)、表示处理状态之间的迁移的迁移信息等设计信息即对话功能信息。对话功能信息能够通过例如状态图、流程图等的表示状态迁移的图来记述。
此外,提出有能够实现对话装置的设计和维护管理中的省力化等的各种装置和方法(例如,参照专利文献1、2)。
现有技术文献
专利文献
专利文献1:日本特开2001-324993号公报
专利文献2:日本特表2008-512789号公报
发明内容
发明要解决的课题
但是,由于AI(Artificial Intelligence:人工智能)、IoT(Internet of Things:物联网)等的普及,要求对话装置有高级对话功能,该高级对话功能使用从传感器提供的检测信号、在Web(例如,互联网)上提供的信息、表示与对话装置进行对话的用户的喜好的信息(例如,个人信息)等各种各样的信息。因此,在对话装置中,应考虑的条件显著增加,其结果是,对话脚本非常复杂。
但是,上述现有的对话装置存在如下课题:为了实现使用各种各样的信息的高级对话功能,需要以人工的方式进行复杂的对话脚本的生成和修改。
本发明正是为了解决上述现有的课题而完成的,其目的在于,提供一种能够动态地决定满足各种条件的对话脚本并按照该对话脚本执行高级对话的对话装置,以及能够动态地决定满足各种条件的对话脚本并按照该对话脚本执行高级对话的对话方法和对话程序。
用于解决课题的手段
本发明的一个方式的对话装置按照对话脚本与用户进行对话,其特征在于,所述对话装置具有:对话设计部,其取得对话中的多个处理状态和表示所述多个处理状态之间的关系的关系信息,根据所述多个处理状态和所述关系信息,构建记述设计出的对话功能整体的图;以及对话执行部,其根据在实际对话时动态地取得的信息,搜索记述所述设计出的对话功能整体的所述图中的所述多个处理状态中的、在所述实际对话中出现的处理状态,动态地决定包含通过所述搜索而得到的所述处理状态在内的所述对话脚本。
本发明的其他方式的对话方法用于按照对话脚本执行对话,其特征在于,所述对话方法具有以下步骤:取得对话中的多个处理状态和表示所述多个处理状态之间的关系的关系信息,根据所述多个处理状态和所述关系信息,构建记述设计出的对话功能整体的图;以及根据在实际对话时动态地取得的信息,搜索记述所述设计出的对话功能整体的所述图中的所述多个处理状态中的、在所述实际对话中出现的处理状态,动态地决定包含通过所述搜索而得到的所述处理状态在内的所述对话脚本。
发明效果
本发明的对话装置能够动态地决定满足各种条件的对话脚本并根据该对话脚本进行高级对话。
此外,如果使用本发明的对话方法或对话程序,则能够动态地决定满足各种条件的对话脚本并根据该对话脚本进行高级对话。
附图说明
图1是示意性示出本发明实施方式1的对话装置的结构的框图。
图2是示出实施方式1的对话装置的硬件结构的例子的图。
图3是示出实施方式1的对话装置的动作的流程图。
图4是示出由实施方式1的对话装置的对话设计部取得的状态列表的例子的图。
图5是示出作为由实施方式1的对话装置的对话设计部取得的构建条件的出现顺序的例子的图。
图6是示出作为由实施方式1的对话装置的对话设计部取得的构建条件的迁移信息的例子的图。
图7是示出由实施方式1的对话装置的对话设计部根据状态列表构建出的完全有向图的例子的图。
图8是示出由实施方式1的对话装置的对话设计部构建出的完全有向图和根据完全有向图生成的状态图的例子的图。
图9是示出图8中的状态图的图。
图10是示出由实施方式1的对话装置的对话执行部取得的搜索条件的例子的图。
图11是示出由实施方式1的对话装置的对话执行部取得的对话脚本的例子的图。
图12是示出由实施方式1的对话装置的对话执行部取得的对话脚本的其他例子的图。
图13是示出由实施方式1的对话装置的对话设计部取得的状态列表和根据状态列表构建出的完全有向图的例子的图。
图14是示出图13的情形#1的情况下的对话脚本的例子的图。
图15是示出图13的情形#2的情况下的对话脚本的例子的图。
图16是示出图13的情形#3的情况下的对话脚本的例子的图。
图17是示意性示出本发明实施方式2的对话装置的结构的框图。
图18是示出实施方式2的对话装置的动作的流程图。
图19是示意性示出本发明实施方式3的对话装置的结构的框图。
图20是示出实施方式3的对话装置的动作的流程图。
具体实施方式
以下,参照附图说明本发明实施方式的对话装置、对话方法和对话程序。以下的实施方式仅是一例,能够在本发明的范围内进行各种变更。
《1》实施方式1
《1-1》实施方式1的结构
图1是示意性示出本发明实施方式1的对话装置1的结构的框图。对话装置1是能够实施实施方式1的对话方法的装置。如图1所示,对话装置1具有对话设计部10和对话执行部20。对话装置1按照对话脚本执行与用户的对话。对话装置1可以具有半导体存储装置或硬盘驱动器等存储装置31。此外,对话装置1也可以具有输出装置32,该输出装置32具有显示画面。
对话设计部10具有:状态列表输入部11,其取得作为对话中的多个处理状态的多个状态A1作为状态列表;以及构建条件输入部12,其取得作为表示多个状态A1之间的关系的关系信息的构建条件A2。此外,对话设计部10具有:状态图构建部13,其根据多个状态A1和构建条件A2,构建作为记述设计出的对话功能整体的图的状态图A3即状态迁移图;以及状态图输出部14,其输出构建出的状态图A3。状态图A3存储于存储装置31。此外,状态图A3也可以显示到输出装置32的显示画面。
构建条件A2是多个状态A1之间的迁移关系、多个状态A1的迁移的顺序关系、为了表示多个状态之间的迁移关系而将多个状态A1之间连结的迁移线的限制条件等表示状态图的静态结构的条件。状态图构建部13根据迁移信息、顺序信息、限制条件等,构建记述对话功能整体的状态图A3。
在实施方式1中,说明记述对话功能整体的图为状态图的情况。但是,记述对话功能整体的图只要是能够表示对话功能的行为即处理状态的迁移的图即可,也可以是其他形式的图。例如,记述对话功能整体的图可以是行为树(Behavior Tree)、活动图(ActivityDiagram)、时序图(Sequence Diagram)、XML(Extensible Markup Language:可扩展标记语言)图和曲线图(例如,有向图)中的任意一个。
对话执行部20具有:对话输入部21,其取得在实际对话时动态地取得的信息即外部信息B1;以及搜索条件输入部22,其取得与表示在状态图A3中要穿过的状态的路径相关的搜索条件B2。对话执行部20具有对话脚本搜索部23,该对话脚本搜索部23搜索状态图A3的多个状态A1中的、作为在实际对话中出现的处理状态的状态,动态地决定包含通过搜索而得到的状态和将得到的状态之间连结的迁移线在内的对话脚本B3。此外,对话执行部20具有对话脚本执行部24,该对话脚本执行部24按照对话脚本B3执行对话。
外部信息B1是用于决定由对话设计部10构建出的状态图的多个状态中的、在执行对话处理时要穿过的状态的路径的信息。外部信息B1例如可以包含从用户界面(UI)33提供的用户操作信息、由作为在计算机中执行的软件程序的应用34提供的信息、经由互联网35等网络提供的信息和从外部的数据库36提供的信息中的1个以上的信息。用户操作信息例如包含语音输入、触摸面板上的触摸操作、来自键盘的输入等。
搜索条件B2是用于搜索在表示对话功能整体的状态图A3上要穿过的路径的动态条件。换言之,搜索条件B2是对话脚本中包含的处理状态需要满足的条件。
图2是示出实施方式1的对话装置1的硬件结构的例子的图。如图2所示,对话装置1例如具有作为存储装置的存储器52和作为执行存储器52中存储的程序的运算处理部的处理器51,存储装置存储作为软件的程序即实施方式1的对话程序。对话装置1例如是计算机。实施方式1的对话程序从存储信息的存储介质经由介质信息读取装置(未图示)或经由能够与互联网等连接的通信接口(未图示)而存储到存储器52。此外,对话装置1具有接收用户的语音的麦克风、鼠标、键盘等作为用户操作部的输入装置53。此外,对话装置1具有显示图像的显示装置、输出语音的语音输出部等输出装置54。此外,对话装置1也可以具有数据库等存储各种信息的辅助存储装置55。辅助存储装置55也可以是存在于能够经由通信接口(未图示)连接的云上的存储装置。
图1所示的对话设计部10和对话执行部20能够通过执行存储器52中存储的程序的处理器51来实现。此外,图1所示的对话设计部10和对话执行部20的一部分也可以通过执行存储器52中存储的程序的处理器51来实现。此外,图1所示的存储装置31和数据库部36也可以是辅助存储装置55的一部分。
《1-2》实施方式1的动作
接着,对实施方式1的对话装置1的动作进行说明。在以下的说明中,说明对话装置1是导航装置的例子。但是,对话装置1也可以是具有对话型HMI的家电设备等除了导航装置以外的电气设备。
图3是示出实施方式1的对话装置1的动作的流程图。步骤ST101~ST103是由对话装置1的对话设计部10执行的处理。步骤ST104~ST107是由对话装置1的对话执行部20执行的处理。
图4是示出由对话装置1的对话设计部10取得的状态列表101的例子的图。图5是示出作为由对话装置1的对话设计部10取得的构建条件102的出现顺序的例子的图。图6是示出作为由对话装置1的对话设计部10取得的构建条件103的迁移信息的例子的图。
首先,在步骤ST101中,对话设计部10的状态列表输入部11取得为了实现对话功能所需的状态(图1中的A1)的列表即状态列表101。在此,对话的状态表示在对话脚本中设备正在执行的处理的处理状态。对话的状态例如是“字幕的显示中”、“引导语音的输出中”、“语音识别信息的取入中”等。状态列表101例如能够根据由设备的设计者预先准备的功能规格书等对话的设计信息得到。状态列表101也可以由设计者在设计对话功能时随时变更。
在接下来的步骤ST102中,对话设计部10的构建条件输入部12取得构建条件102、103(图1中的A2)。图4所示的状态列表101中包含的状态S1~S6是用于实现对话功能的状态的例子。
图5所示的构建条件102示出图4所示的状态S1~S6的对话功能中的出现顺序。出现顺序通过在功能规格书的阶段中明确决定的状态排列来表示。图5所示的出现顺序是用于表示在设定任何对话脚本的情况下都必须使用的对话功能的状态的出现顺序。出现顺序例如是“在响起蜂鸣音后开始语音识别”、“在显示字幕A后显示字幕B”等信息。
此外,在图5的构建条件102中,在状态S2与S3之间、状态S4与S5之间没有指定出现顺序。构建条件102中的状态S2与S3、状态S4与S5具有可以先执行任意一个的关系(即,自由顺序的关系)。另外,图5中的构建条件102包含开始点“Initial”和结束点“Final”作为状态列表101中没有的状态。这些状态是表示状态图的开始和结束的特殊状态。根据需要适当地追加开始点“Initial”和结束点“Final”。此外,也可以适当地追加多个开始点“Initial”和多个结束点“Final”。此外,结束点“Final”的出现顺序无需是状态图中的最后。
图6所示的构建条件103指定与状态图中的将状态之间连结的迁移线有关的限制。图6中的构建条件103规定有从某一状态向其他状态的在对话脚本中必然发生的迁移。图6中的构建条件103的内容赋予在功能规格书的生成阶段决定的结构限制。在构建条件103中定义的条件(即,条件ID)C1包含“对话脚本中的处理必然穿过从Initial向状态S1的迁移线”即“必然从状态S1起开始对话脚本”。此外,在构建条件103中定义的条件C2包含“对话脚本中的处理必然穿过从状态S6向Final的迁移线”即“必然穿过状态S6而结束对话脚本”。
在接下来的步骤ST103中,状态图构建部13通过对在步骤ST101中得到的状态列表101使用在步骤ST102中得到的构建条件102、103,生成状态图(图1中的A3)。图7是示出由对话设计部10的状态图构建部13根据状态列表101构建出的完全有向图的例子201的图。图8是示出由状态图构建部13构建出的完全有向图(即,用实线和虚线描绘的图)和根据完全有向图生成的状态图(即,用实线描绘的曲线图)的例子202的图。图9是示出图8中的状态图(即,用实线描绘的曲线图)的例子203的图。根据图7~图9说明对话设计部10的状态图构建部13中的处理内容。
首先,如图7所示,状态图构建部13将构建条件102用于状态列表101,生成状态图,在该状态图中,状态沿着从Initial朝向Final的方向的迁移线移动。例如,如图7所示,状态图201被构建成以下的完全有向图:设状态图201的各状态为节点,将节点之间连结的迁移线为边,处理状态从顺序编号(Seq.)小的节点朝向顺序编号(Seq.)大的节点移动。即,在状态图201中,赋予从顺序早的状态S1向除此以外的状态S2~S6的迁移线。此外,赋予从顺序次早的状态S2、S3向除了状态S1以外的状态S4~S6的迁移线。另外,被赋予相同的顺序编号(Seq.)的状态作为1个组的状态如1个状态那样进行处理。状态图201被定义成嵌套状态。在状态图201中,对剩余的状态也同样地赋予迁移线。通过以上的处理,能够得到作为完全有向图的状态图201。
接着,状态图构建部13对得到的状态图201使用构建条件103。当使用构建条件103的条件C1“对话脚本中的处理必然穿过从Initial向S1的迁移线”时,从Initial起的迁移线中的、除了朝向状态S1的迁移线(即,图8中的实线的迁移线)以外的迁移线(即,图8中的虚线的迁移线)全部被舍弃(即,全部不采用)。
同样地,当使用条件C2“对话脚本中的处理必然穿过从S6向Final的迁移线”时,不穿过状态S6与Final之间的迁移线而到达Final的迁移线全部被舍弃(即,全部不采用)。
图8是示出由对话装置1的对话设计部10构建出的完全有向图202(即,在图8中用实线和虚线描绘的曲线图)和根据完全有向图202生成的状态图(即,在图8中用实线描绘的曲线图)的例子的图。图9是示出状态图203(即,图8中的用实线描绘的曲线图)的图。即,图9示出去除图8的完全有向图202中的虚线的迁移线而得到的情形。
通过以上说明的图3的步骤ST101~ST103的处理,对话设计部10中的状态图203的自动构建完成。在图3的步骤ST104~ST107中,对话执行部20根据在步骤ST103之前的处理中生成的状态图203,取得实际执行的对话脚本,按照对话脚本执行对话。
首先,在步骤ST104中,对话执行部20取得在启动对话处理时从外部动态地得到的外部信息。外部信息例如是“道路正处于拥堵”、“要下雨”、“副驾驶席的同乘者正在睡觉”这样的在操作使用对话装置1的设备时动态地赋予的信息。即,外部信息可以包含使用对话装置1的设备周边的环境或状况的信息。
在接下来的步骤ST105中,对话执行部20取得用于在状态图A3(例如,图9所示的状态图)上搜索路径的搜索条件B2。搜索条件B2能够在生成功能规格书时决定。
图10是示出由对话装置1的对话执行部20取得的搜索条件111(即,图1中的B2)的例子的图。在图10中,搜索条件111包含进行条件使用判断的使用条件和在满足使用条件的情况下路径要穿过的条件。使用条件例如是“如果汽油剩余量小于10升”、“如果下雨”、“如果副驾驶席的同乘者正在睡觉”等在步骤ST104中取得的条件是否符合的判断条件。
是在满足使用条件的情况下在状态图A3中的路径搜索中使用的条件。该条件例如是“穿过状态‘○○’”、“穿过最短的路径”这样的表示基于图结构的搜索方法的条件。此外,在路径搜索中使用的条件是事先对各状态或迁移线赋予模态信息或分数等参数,“穿过驾驶员的认知负荷最少(视觉信息量最小、不发出声音等)的状态”、“穿过分数最大的状态”这样的表示基于参数优化的搜索方法的条件。在图10的条件(即,条件ID)D1中,搜索出以下对话脚本:在满足使用条件“参数P1的值比阈值θ1大”的情况下,穿过状态S3和状态S5。在图10的条件D2中,以在满足使用条件“参数P2的值与阈值θ1相等”的情况下穿过最短的路径的方式(即,以要穿过的状态的数量最小的方式),搜索对话脚本。
在接下来的步骤ST106中,对话执行部20对在步骤ST103之前的处理中生成的状态图使用在步骤ST104、ST105中取得的搜索条件进行路径的搜索。
图11是示出由对话装置1的对话执行部20取得的对话脚本204的例子的图。图12是示出由对话装置1的对话执行部20取得的对话脚本的其他例子的图。图11和图12是对状态图203(图9所示)使用搜索条件111的各条件D1、D2(图10所示)的例子。另外,在图11和图12中,虚线部分表示在搜索时舍弃的迁移线和状态。当将搜索条件D1用于状态图203时,如图11中实线所示取得对话脚本204。另一方面,当将搜索条件D2用于状态图203时,如图12中实线所示取得对话脚本205。
在最后的步骤ST107中,对话执行部20读入在步骤ST106之前的处理中取得的对话脚本,按照该对话脚本执行对话。对话执行部20的对话处理可以通过状态图的运行时间即运行时间模块执行,也可以由从对话脚本转换而成的程序执行。
图13是示出由对话装置1的对话设计部10取得的状态列表121和根据状态列表构建出的状态图122的例子的图。图14是示出图13的情形#1的情况下的对话脚本123的例子的图。图15是示出图13的情形#2的情况下的对话脚本124的例子的图。图16是示出图13的情形#3的情况下的对话脚本125的例子的图。
状态列表121包含对话装置1开始语音识别之前的对话功能中出现的多个状态(即,处理状态)。状态列表121例如包含引导语音的输出“Guidance1”、“Guidance2”、字幕的显示“Telop1”、“Telop2”、蜂鸣音的输出“Beep”、语音识别的开始“RecogStart”、开始点“Initial”和结束点“Final”。
对话设计部10通过将各种构建条件用于状态列表121,取得状态图122。例如,当在状态图122中使用与动态地变化的周围状况对应的搜索条件来搜索路径时,能够动态地得到适于周围状况的对话脚本。在图14~图16所示的对话脚本123~125的路径中,粗线路径是作为状态图122中的搜索结果而取得的对话脚本。
例如,图14所示的对话脚本123的路径是穿过状态图122中的全部状态的路径。图14所示的对话脚本123的路径表示未发生特殊状况的通常状况下的对话脚本(即,通常时的对话脚本)的路径。
在图15所示的对话脚本124的路径中,字幕的输出次数比图14所示的通常时的对话脚本123中的字幕的输出次数少1次,引导语音的输出次数比图14所示的通常时的对话脚本123中的引导语音的输出次数少1次。即,图15所示的对话脚本124的路径是比图14所示的通常时的对话脚本123的路径快捷的路径。图15所示的对话脚本124的路径例如是在用户是习惯使用导航装置的驾驶员的情况下采用的路径。图15所示的对话脚本124的路径能够作为仅最小限度的对话的对话脚本使用。
图16所示的对话脚本125的路径不穿过引导语音或蜂鸣音的输出处理。图16所示的对话脚本125的路径例如能够作为在同乘者正在睡觉的状况下避免发出声音的处理的对话脚本使用。
《1-3》实施方式1的效果
如以上说明的那样,如果使用实施方式1的对话装置1、对话方法或对话程序,则能够动态地决定满足各种条件的对话脚本并根据该对话脚本进行高级对话。此外,不要求对话脚本生成中的人工作业。
《1-4》实施方式1的变形例
另外,在实施方式1中,构建条件输入部12可以取得迁移关系、顺序关系、迁移线的限制条件等记述有状态图的结构本身的条件作为输入。此外,在实施方式1中,构建条件输入部12也可以取得状态或迁移线的重要度等不直接表示状态图的结构的构建条件作为输入。
此外,在实施方式1中,构建条件输入部12也可以取得表示状态图的结构的设计图案或状态图的模板等事先对某一程度的状态图的结构进行定义而得到的构建条件作为输入。此外,在实施方式1中,构建条件输入部12还可以取得模板与具体构建条件的组合作为输入。另外,在实施方式2中说明使用对话模板的例子。
此外,对话输入部21能够由应用34等接收各种信息作为输入。例如,在导航装置中,能够接收来自应用34的车内信息作为输入。该情况下的车内信息可以包含通过检测车速、制动器的状态、方向盘的转向、驾驶员的属性信息、驾驶员的状态而取得的感测数据等。
此外,在将对话装置1用于导航装置的情况下,对话输入部21能够接收车辆的周边状况的信息等作为输入。车辆的周边状况的信息可以包含例如包含正在行驶的地点的地图信息、正在行驶的地点周边的拥堵信息、车辆周边的外部气温等。
此外,在将对话装置1用于作为家电设备的空调的情况下,对话输入部21能够接收室温或室内的人数、外部气温等动作环境的信息作为输入。此外,在将对话装置1用于作为家电设备的空调的情况下,对话输入部21能够接收室内的人正在睡觉、室内的人正在用餐等与用户的行动或状态相关的信息作为输入。此外,在将对话装置1用于作为家电设备的空调的情况下,对话输入部21还能够采用根据用户操作的历史信息从状态图适当地获取最佳路径(即,对话脚本)的方法。另外,在实施方式3中说明使用用户操作历史的装置。
此外,对话脚本搜索部23可以仅选择一个搜索条件而用于搜索,也可以选择多个搜索条件或它们组合而成的搜索条件而用于搜索。在对话脚本搜索部23使用将多个搜索条件组合而成的搜索条件进行搜索的情况下,可能存在搜索条件之间产生矛盾的情况。对话脚本搜索部23通过预先对搜索条件设定优先级,能够适当地执行搜索。例如,对话脚本搜索部23通过按照优先级从高到低的顺序依次应用搜索条件,并在产生矛盾的时刻,结束或跳过使用此时的搜索条件,能够适当地执行搜索。
此外,对话脚本搜索部23可以在搜索中使用在曲线图理论中使用的通常算法。在这样的搜索中,例如可以使用非专利文献1所示的组合集合的检索算法。
非专利文献1:MINATO,Shin-ichi.“Zero-suppressed BDDs for setmanipulation in combinatorial problems.In:Proceedings of the 30thinternational Design Automation Conference”、ACM、1993.pp.272-277.
《2》实施方式2
图17是示意性示出本发明实施方式2的对话装置2的结构的框图。对话装置2是能够实施实施方式2的对话方法的装置。在图17中,针对与图1所示的结构要素相同或者对应的结构要素,标注与图1所示的标号相同的标号。实施方式2的对话装置2在以下方面与实施方式1的对话装置1不同:替代实施方式1中的对话设计部10的构建条件输入部12,具有对话设计部10a的模板输入部15。模板输入部15从模板存储部37的数据库中取得模板37a。但是,实施方式2的对话装置2也可以在实施方式1中的对话设计部10的构建条件输入部12的基础上,还具有对话设计部10a的模板输入部15。
在实施方式2中,对话设计部10a的模板输入部15取得对话的模板37a以事先按照每个对话脚本准备。例如,作为模板的状态图或状态图的一部分,准备回答为“是”或“否”的对话、回答为多个选择项中的1个以上的选择项对话等与使用对话装置的设备无关地成为某一程度上公共的处理的对话。后段的状态图构建部13通过将由状态列表输入部11取得的状态列表嵌入模板A2a来构建状态图A3。关于上述以外的内容,实施方式2的对话装置2与实施方式1的对话装置1相同。
图18是示出实施方式2的对话装置2的动作的流程图。如图18所示,实施方式2的对话装置2的步骤ST201、ST204~ST207的动作与实施方式1的对话装置1的步骤ST101、ST104~ST107的动作相同。实施方式2的对话装置2的步骤ST202和ST203的动作与实施方式1的对话装置1的步骤ST102和ST103的动作不同。
在实施方式2中,在步骤ST201中,状态列表输入部11取得状态列表以后,在步骤ST202中,模板输入部15取得对话的模板37a。在此,对话的模板37a事先准备并作为数据库存储到模板存储部37。对话的模板37a可以以人工的方式构建,也可以从设计图案中选定。或者,对话的模板37a也可以是过去的对话功能开发中的设计数据等现有的数据。并且,也可以将适当地编辑现有的数据而得到的数据作为对话的模板37a使用并作为数据库存储到模板存储部37。
在步骤ST203中,状态图构建部13通过对在步骤ST202中取得的模板A2a嵌入在步骤ST201中取得的状态来生成状态图A3。嵌入状态的位置或顺序等信息可以与作为构建条件而事先赋予给各状态的出现顺序等信息进行对照来以自动的方式进行,也可以是以人工的方式适当地嵌入的方法。从步骤ST204起的处理与实施方式1中的从步骤ST104起的处理相同。
如以上说明的那样,如果使用实施方式2的对话装置2、对话方法或对话程序,则能够动态地决定满足各种条件的对话脚本并根据该对话脚本进行高级对话。
此外,通过利用对话的模板,可自动地执行以往全部以人工的方式构建出的状态图的大部分构建,因此可削减设计的工时。此外,非专业技术人员的用户能够容易地设计对话。
《3》实施方式3
图19是示意性示出本发明实施方式3的对话装置3的结构的框图。对话装置3是能够实施实施方式3的对话方法的装置。在图19中,针对与图1所示的结构要素相同或者对应的结构要素,标注与图1所示的标号相同的标号。实施方式3的对话装置3在以下方面与实施方式1的对话装置1不同:替代实施方式1中的对话执行部20而具有对话执行部20a,该对话执行部20a具有操作历史取得部25和操作历史存储部26,该操作历史存储部26存储操作历史26a。
在实施方式3中,对话执行部20a可以具有操作历史取得部25,该操作历史取得部25从对话输入部21、搜索条件输入部22和对话脚本执行部24取得用户的操作历史。操作历史取得部25将用户通过对话输入部21对由对话脚本执行部24执行的对话脚本B4进行输入操作而得到的内容以及此时的搜索条件与对话脚本一起作为操作历史信息B5记录到操作历史存储部26。在搜索对话脚本时,在出现类似的搜索条件的情况下,搜索以再现用户以前的对话响应的方式通过用户的操作历史进行加权而得到的路径。关于其他结构,实施方式3的对话装置3与实施方式1的对话装置1相同。
图20是示出实施方式3的对话装置3的动作的流程图。如图20所示,实施方式3的对话装置3的步骤ST201~ST205的动作与实施方式1的对话装置1的步骤ST101~ST105的动作相同。实施方式3的对话装置3的步骤ST306~ST308的动作与实施方式1的对话装置1的步骤ST106和ST107的动作不同。
在实施方式3中,在步骤ST308中,对话执行部20a将用户在执行对话处理时进行的操作、对话脚本的搜索条件与此时的对话脚本关联起来,作为操作历史26a存储到操作历史存储部26。例如,对话执行部20a准备以对话脚为关键词的表,作为该表的记录,存储操作内容(例如,选择出的状态)、搜索条件(例如,参数的值)等。
在步骤ST306中,对话执行部20a的对话脚本搜索部23使用过去的对话的步骤ST308中存储的操作历史26a搜索对话脚本。在实施方式3中,除了上述以外的步骤与实施方式1的步骤相同。
如以上说明的那样,如果使用实施方式3的对话装置3、对话方法或对话程序,则能够动态地决定满足各种条件的对话脚本并根据该对话脚本进行高级对话。
此外,在实施方式3中,能够提供适于预测用户有可能进行的操作的对话脚本。即,如果使用实施方式3的对话装置3、对话方法或对话程序,则能够实现可以供用户更加自在地操作的对话功能。例如,在不使用操作历史的情况下,作为搜索条件,作为对话提供“在温度为‘25’度的情况下,降低空调的设定温度”这样的操作指示和“在温度为‘25’度的情况下,打开窗”这样的操作指示。但是,在实施方式3中,在蓄积有表示在温度为25度的情况下打开窗的操作历史时,对话执行部20a能够以使促使在温度达到25度的情况下打开窗的对话脚本优先的方式生成对话脚本。
《4》变形例
在实施方式1~3中说明的结构能够适当地相互组合。此外,图2所示的硬件结构能够用于实施方式2、3。
标号说明
1、2、3:对话装置;10、10a:对话设计部;11:状态列表输入部;12:构建条件输入部;13:状态图构建部;14:状态图输出部;15:模板输入部;20、20a:对话执行部;21:对话输入部;22:搜索条件输入部;23:对话脚本搜索部;24:对话脚本执行部;25:操作历史取得部;26:操作历史存储部;26a:操作历史信息;31:存储装置;32:输出装置;33:用户界面(UI);34:应用;35:互联网(网络);36:数据库;37:模板存储部;37a:模板;A1:状态;A2:构建条件;A2a:模板;A3状态图;B1:外部信息;B2:搜索条件;B3:对话脚本;B4:已执行的对话脚本;B5:操作历史信息。
Claims (11)
1.一种对话装置,其按照对话脚本与用户进行对话,其特征在于,所述对话装置具有:
对话设计部,其取得对话中的多个处理状态和表示所述多个处理状态之间的关系的关系信息,根据所述多个处理状态和所述关系信息,构建记述设计出的对话功能整体的图;以及
对话执行部,其根据在实际对话时动态地取得的信息,搜索记述所述设计出的对话功能整体的所述图中的所述多个处理状态中的、在所述实际对话中出现的处理状态,动态地决定包含通过所述搜索而得到的所述处理状态在内的所述对话脚本。
2.根据权利要求1所述的对话装置,其特征在于,
记述所述设计出的对话功能整体的所述图包含状态图、行为树、活动图、时序图、XML图和曲线图中的任意一个。
3.根据权利要求1或2所述的对话装置,其特征在于,
所述关系信息包含表示所述多个处理状态之间的迁移的迁移信息和表示所述多个处理状态各自的出现顺序的顺序信息,
所述对话设计部根据所述迁移信息和所述顺序信息,构建记述所述设计出的对话功能整体的所述图。
4.根据权利要求1或2所述的对话装置,其特征在于,
所述关系信息包含记述预先确定的对话功能的模板,
所述对话设计部根据所述模板,构建记述所述设计出的对话功能整体的所述图。
5.根据权利要求4所述的对话装置,其特征在于,
所述对话装置还具有模板存储部,该模板存储部预先存储所述模板。
6.根据权利要求1~5中的任意一项所述的对话装置,其特征在于,
在所述实际对话时动态地取得的所述信息包含从用户界面提供的用户操作信息、从应用提供的信息、经由网络提供的信息和从数据库提供的信息中的1个以上的信息。
7.根据权利要求1~6中的任意一项所述的对话装置,其特征在于,
在所述实际对话时动态地取得的所述信息包含搜索条件,该搜索条件是所述对话脚本中包含的所述处理状态需要满足的条件。
8.根据权利要求1~7中的任意一项所述的对话装置,其特征在于,
所述对话执行部具有:
对话脚本执行部,其按照所述对话脚本执行所述实际对话;
操作历史存储部;
操作历史取得部,其将操作历史信息保存到所述操作历史存储部,该操作历史信息是将在由所述对话脚本执行部执行所述实际对话时取得的所述信息与在所述实际对话时使用的所述对话脚本中的操作历史关联起来而得到的;以及
对话脚本搜索部,其根据所述操作历史存储部中保存的所述操作历史信息,从表示所述对话功能整体的所述图中搜索在所述实际对话中出现的处理状态,动态地决定包含通过所述搜索而得到的所述处理状态在内的所述对话脚本。
9.根据权利要求1~8中的任意一项所述的对话装置,其特征在于,
所述对话装置还具有存储装置,该存储装置存储由所述对话设计部构建的记述所述设计出的对话功能整体的所述图,
所述对话执行部根据所述存储装置中存储的记述所述设计出的对话功能整体的所述图,动态地决定所述对话脚本。
10.一种对话方法,用于按照对话脚本执行对话,其特征在于,所述对话方法具有以下步骤:
取得对话中的多个处理状态和表示所述多个处理状态之间的关系的关系信息,根据所述多个处理状态和所述关系信息,构建记述设计出的对话功能整体的图;以及
根据在实际对话时动态地取得的信息,搜索记述所述设计出的对话功能整体的所述图中的所述多个处理状态中的、在所述实际对话中出现的处理状态,动态地决定包含通过所述搜索而得到的所述处理状态在内的所述对话脚本。
11.一种对话程序,用于使计算机按照对话脚本执行对话,其特征在于,所述对话程序使所述计算机执行以下处理:
取得对话中的多个处理状态和表示所述多个处理状态之间的关系的关系信息,根据所述多个处理状态和所述关系信息,构建记述设计出的对话功能整体的图;以及
根据在实际对话时动态地取得的信息,搜索记述所述设计出的对话功能整体的所述图中的所述多个处理状态中的、在所述实际对话中出现的处理状态,动态地决定包含通过所述搜索而得到的所述处理状态在内的所述对话脚本。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/043897 WO2020110249A1 (ja) | 2018-11-29 | 2018-11-29 | 対話装置、対話方法、及び対話プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113168418A true CN113168418A (zh) | 2021-07-23 |
Family
ID=67844802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880099189.0A Pending CN113168418A (zh) | 2018-11-29 | 2018-11-29 | 对话装置、对话方法和对话程序 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210256024A1 (zh) |
JP (1) | JP6570792B1 (zh) |
CN (1) | CN113168418A (zh) |
DE (1) | DE112018008093T5 (zh) |
WO (1) | WO2020110249A1 (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105659316A (zh) * | 2013-11-25 | 2016-06-08 | 三菱电机株式会社 | 对话控制装置和对话控制方法 |
CN105845137A (zh) * | 2016-03-18 | 2016-08-10 | 中国科学院声学研究所 | 一种语音对话管理系统 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005170265A (ja) * | 2003-12-12 | 2005-06-30 | Matsushita Electric Ind Co Ltd | 情報提供装置 |
US7983247B2 (en) * | 2006-05-31 | 2011-07-19 | Microsoft Corporation | Metadata collection |
JP5181533B2 (ja) * | 2007-05-21 | 2013-04-10 | トヨタ自動車株式会社 | 音声対話装置 |
US8630961B2 (en) * | 2009-01-08 | 2014-01-14 | Mycybertwin Group Pty Ltd | Chatbots |
JP5393732B2 (ja) * | 2011-06-29 | 2014-01-22 | ヤフー株式会社 | 対話ルール変更装置、対話ルール変更方法及び対話ルール変更プログラム |
JP5619930B2 (ja) * | 2013-02-15 | 2014-11-05 | ヤフー株式会社 | 対話スクリプト操作命令実行装置、対話スクリプト操作命令実行方法、およびプログラム |
US9189742B2 (en) * | 2013-11-20 | 2015-11-17 | Justin London | Adaptive virtual intelligent agent |
JP6621593B2 (ja) * | 2015-04-15 | 2019-12-18 | シャープ株式会社 | 対話装置、対話システム、及び対話装置の制御方法 |
US10831800B2 (en) * | 2016-08-26 | 2020-11-10 | International Business Machines Corporation | Query expansion |
US20180129484A1 (en) * | 2016-11-04 | 2018-05-10 | Microsoft Technology Licensing, Llc | Conversational user interface agent development environment |
KR102338990B1 (ko) * | 2017-01-23 | 2021-12-14 | 현대자동차주식회사 | 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법 |
US10956480B2 (en) * | 2018-06-29 | 2021-03-23 | Nuance Communications, Inc. | System and method for generating dialogue graphs |
-
2018
- 2018-11-29 JP JP2019515999A patent/JP6570792B1/ja active Active
- 2018-11-29 WO PCT/JP2018/043897 patent/WO2020110249A1/ja active Application Filing
- 2018-11-29 DE DE112018008093.5T patent/DE112018008093T5/de active Pending
- 2018-11-29 CN CN201880099189.0A patent/CN113168418A/zh active Pending
-
2021
- 2021-05-04 US US17/307,191 patent/US20210256024A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105659316A (zh) * | 2013-11-25 | 2016-06-08 | 三菱电机株式会社 | 对话控制装置和对话控制方法 |
CN105845137A (zh) * | 2016-03-18 | 2016-08-10 | 中国科学院声学研究所 | 一种语音对话管理系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2020110249A1 (ja) | 2020-06-04 |
US20210256024A1 (en) | 2021-08-19 |
JP6570792B1 (ja) | 2019-09-04 |
DE112018008093T5 (de) | 2021-08-26 |
JPWO2020110249A1 (ja) | 2021-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8370808B2 (en) | Apparatus and a method for generating a test case | |
CN107256706B (zh) | 一种计算设备及其存储介质 | |
US9875741B2 (en) | Selective speech recognition for chat and digital personal assistant systems | |
JP5234160B2 (ja) | 車両用装置および情報表示システム | |
JP5040925B2 (ja) | 情報抽出規則作成支援システム、情報抽出規則作成支援方法及び情報抽出規則作成支援プログラム | |
KR20070022393A (ko) | 차량 및 다른 복합 장비용 대화식 매뉴얼 시스템 및 방법 | |
KR20080092327A (ko) | 혼합 주도형 문법의 생성 방법, 혼합 주도형 문법의 자동 생성 방법 및 머신 판독 가능 저장 장치 | |
JP2005018114A (ja) | プログラム保守支援装置、プログラム保守支援方法、およびプログラム | |
JP2001022779A (ja) | 対話型情報検索装置、コンピュータを用いた対話型情報検索方法及び対話型情報検索処理を行うプログラムを記録したコンピュータ読取り可能な媒体 | |
KR102527107B1 (ko) | 음성에 기반하여 기능을 실행하기 위한 방법 및 이를 지원하는 사용자 전자 장치 | |
JP2008145769A (ja) | 対話シナリオ生成システム,その方法およびプログラム | |
CN102246227A (zh) | 用于从数据元模型生成有声用户接口编码的方法和系统 | |
US20140343947A1 (en) | Methods and systems for managing dialog of speech systems | |
CN113168418A (zh) | 对话装置、对话方法和对话程序 | |
EP2437185A2 (en) | Search support device, search support method and computer-readable storage medium | |
CN104424227B (zh) | 内容检索装置及内容检索方法 | |
JP2002149764A (ja) | 旅行計画作成装置および旅行計画作成サービスシステム | |
JP4682322B2 (ja) | 対話情報処理装置及び対話情報処理方法 | |
CN113470649A (zh) | 语音交互方法及装置 | |
CN115087960A (zh) | 增强拓扑图相关应用的可访问性 | |
JP3581044B2 (ja) | 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体 | |
JP5206675B2 (ja) | 構造化文書変換装置 | |
JP2009187225A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP6040819B2 (ja) | 情報処理装置及びプログラム | |
Garzon et al. | Model-based personalization within an adaptable human-machine interface environment that is capable of learning from user interactions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |