CN113342925A - 接口提供装置、接口提供方法以及程序 - Google Patents
接口提供装置、接口提供方法以及程序 Download PDFInfo
- Publication number
- CN113342925A CN113342925A CN202010895530.2A CN202010895530A CN113342925A CN 113342925 A CN113342925 A CN 113342925A CN 202010895530 A CN202010895530 A CN 202010895530A CN 113342925 A CN113342925 A CN 113342925A
- Authority
- CN
- China
- Prior art keywords
- keyword
- interface providing
- usability
- response
- interface
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 230000004044 response Effects 0.000 claims abstract description 159
- 238000012790 confirmation Methods 0.000 description 52
- 238000012545 processing Methods 0.000 description 46
- 238000004891 communication Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 16
- 230000009471 action Effects 0.000 description 14
- 239000003795 chemical substances by application Substances 0.000 description 13
- 238000003825 pressing Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 230000002452 interceptive effect Effects 0.000 description 5
- 239000004973 liquid crystal related substance Substances 0.000 description 5
- 101150058395 US22 gene Proteins 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 101150114976 US21 gene Proteins 0.000 description 2
- 101150021263 US31 gene Proteins 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000001028 reflection method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Abstract
实施方式涉及接口提供装置、接口提供方法以及程序。提供如下接口提供装置、接口提供方法以及程序:能够提供受理用于使来自系统的反问语句更适当的反馈输入的接口。实施方式的接口提供装置具有确定部和生成部。确定部从包含提问文本和响应文本的对话数据确定关键词。生成部生成用于显示接口的显示信息,该接口受理与关键词的有用度有关的输入。
Description
本申请以日本专利申请2020-025085(申请日:2/18/2020)为基础,从该申请享有优先权。本申请通过参照该申请,包含该申请的全部内容。
技术领域
本发明的实施方式涉及接口提供装置、接口提供方法以及程序。
背景技术
已知用户与系统通过声音、文本来进行交流的对话系统。对话系统例如能够回答来自用户的提问,或者执行从用户请求的动作,由此期待各种场面下的有效利用。
在对话系统中,有通过一问一答形式、使用预先定义的命令的命令形式来进行与用户的对话的比较简单的对话系统。在此,如果为不限于一问一答形式、命令形式的更复杂的对话系统,则用户的发言的自由度高,所以期待有效利用的范围变得更广。
但是,在这样的更复杂的对话系统中,有时在用户的发言所包含的提问、指示中产生意思模糊、不足。在该情况下,需要从系统对用户进行反问,有时在得到为了进行适当的回答、动作所需的信息之前需要经过多次的交流。
发明内容
本发明要解决的课题在于提供一种提供受理反馈输入的用户接口的接口提供装置、接口提供方法以及程序,该反馈输入用于使针对用户的发言的来自对话系统的反问更适当。
根据实施方式,接口提供装置具有确定部和生成部。
确定部从包含对信息进行请求的提问文本和针对该提问文本的响应文本的对话数据确定关键词。生成部生成用于显示用户接口的显示信息,该用户接口受理与所请求的信息的检索中的关键词的有用度关联的反馈输入。
根据上述结构的接口提供装置,能够提供受理发言反馈输入的用户接口,该反馈输入用于使针对用户的发言的来自对话系统的反问更适当。
附图说明
图1是例示第1实施方式的接口提供装置的功能结构的框图。
图2是例示第1实施方式的接口提供装置的硬件结构的框图。
图3是示出由第1实施方式的接口提供装置进行的处理动作的第1例子的流程图。
图4是示出由第1实施方式的接口提供装置进行的处理动作的第2例子的流程图。
图5是示出包括由第1实施方式的接口提供装置提供的用户接口的显示画面的一个例子的图。
图6是示出由第1实施方式的接口提供装置提供的用户接口的另一例子的图。
图7是示出经由图5所示的用户接口输入的反馈的反映后的显示画面的一个例子的图。
图8是例示第2实施方式的接口提供装置的功能结构的框图。
图9是示出由第2实施方式的接口提供装置进行的处理动作的一个例子的流程图。
图10是示出包括由第2实施方式的接口提供装置提供的用户接口的显示画面的一个例子的图。
图11是示出经由图10所示的用户接口输入的反馈的反映后的显示画面的一个例子的图。
图12是例示第3实施方式的接口提供装置的功能结构的框图。
图13是示出由第3实施方式的接口提供装置进行的处理动作的一个例子的流程图。
图14A是示出第3实施方式的接口提供装置中的针对关键词的加权的第1例子的图。
图14B是示出第3实施方式的接口提供装置中的针对关键词的加权的第2例子的图。
图14C是示出第3实施方式的接口提供装置中的针对关键词的加权的第3例子的图。
图15是示出包括由第3实施方式的接口提供装置提供的用户接口的显示画面的一个例子的图。
图16是例示第4实施方式的接口提供装置的功能结构的框图。
图17是示出由第4实施方式的接口提供装置进行的处理动作的一个例子的流程图。
图18是示出包括由第4实施方式的接口提供装置提供的用户接口的显示画面的一个例子的图。
(附图标记说明)
100、200、300、400:接口提供装置;101:对话显示生成部;102:关键词确定部;103:接口生成部;104:有用度更新部;105:确认用响应生成部;106:有用度存储部;201:对话处理部;301:接口生成部;302:有用度更新部;401:有用度更新部;402:确认用响应生成部;403:有用度存储部;600、601、602、603:反馈输入接口;1001:CPU;1002:RAM;1003:ROM;1004:辅助存储装置;1005:输入装置;1006:输出装置;1007:通信装置。
具体实施方式
以下,参照附图,说明本发明的实施方式。此外,以后,对与已说明的要素相同或者类似的要素附加相同或者类似的附图标记,关于重复的说明,基本上省略。例如,在存在多个相同或者类似的要素的情况下,既存在为了不区分各要素地进行说明而使用共同的附图标记的情况,也存在为了区分各要素地进行说明而对该共同的附图标记使用分支编号的情况。
实施方式的接口提供装置提供用户接口,该用户接口受理用于使针对用户的发言的来自对话系统的反问更适当的反馈输入。在允许自由度高的用户发言的对话系统中,当在来自用户的请求、指示中存在意思模糊的点的情况下,对用户以何种方式进行反问变得重要。在此,不仅在反问语句中简单地询问追加的条件,还能够例示能够成为追加的条件的词(关键词)。在此,将这样的词还称为例示词。与反问语句所包含的例示词相应地,用户的之后的回话发生改变,所以重要的是将哪个例示词用于反问。经由上述用户接口而输入的反馈用于应在反问中使用的例示词的有用度的调整。
实施方式的接口提供装置为个人计算机、智能手机等计算机,能够在与对话系统之间进行信息的交流。接口提供装置既可以为对话系统的一部分,也可以包括对话系统。此外,在此,接口这样的用语包括用于在用户与接口提供装置之间交流信息的画面、显示、操作、方法、设备等,还称为用户接口或者反馈输入接口。
另外,在此,用语“用户”能够包括顾客等利用对话系统侧的用户(还称为“普通用户”)以及系统的操作者、管理者等提供对话系统侧的用户(还称为“管理用户”)这两方。
(1)第1实施方式
(1-1)结构
图1是概略地示出第1实施方式的接口提供装置100的功能结构的框图。
接口提供装置100例如为由管理对话系统的系统管理者使用的计算机,作为处理功能部而具备对话显示生成部101、关键词确定部102、接口生成部103、有用度更新部104以及确认用响应生成部105。接口提供装置100能够还具备有用度存储部106。
对话显示生成部101生成用于显示用户与系统之间的对话的交流的显示信息。由对话显示生成部101生成的显示信息既可以包含当前实际地进行的对话的交流,也可以包含作为日志而积蓄的过去的对话的交流。对话的交流至少包括用户的发言语句和系统的响应语句,但除此之外,在为通过声音来交流的对话系统的情况下,也可以包括用户和系统的发言声音、系统根据用户的请求而进行了信息的检索的结果等。在第1实施方式中,特别是,对话显示生成部101获取包含表示对信息进行请求的用户的发言语句的文本(还称为“提问文本”)和表示针对该文本的来自系统的响应语句的文本(还称为“响应文本”)的对话数据,根据该对话数据,生成用于显示上述交流的显示信息。响应语句能够包含用于限定从用户请求的信息的检索对象的反问语句(还称为“反问文本”)。反问语句能够包含用于限定从用户请求的信息的检索对象的例示词。
关键词确定部102从对话显示生成部101接收用户发言语句和系统响应语句,确定这些语句中的关键词。对于关键词的确定,能够应用使用预先登记的词典等的规则库的方法、从“告诉我…”等周边的措词确定关键词的统计库的方法等各种方法。例如,作为规则库的方法的一个例子,能够使用参照预先准备的关键词列表而从语句中进行定位的方法。另外,也可以使用在进行关键词定位时预先学习的词汇分散表达等,将关键词列表的同义词也包括在内进行定位。或者,也可以使用统计性地学习在关键词周边何种措词多,使用学习的模型来进行关键词的确定等统计性地确定的手法。另外,关于系统响应语句中的关键词的确定,还存在知晓在生成响应语句时何处为关键词的情况,所以还能够有效利用该信息。或者,关键词确定部102也可以将规则库的方法与统计库的方法进行组合而使用。
接口生成部103生成反馈输入接口,该反馈输入接口从用户受理与所请求的信息的检索中的关键词的有用度关联的反馈输入。接口生成部103另外与由上述对话显示生成部101生成的显示信息协作地生成用于与上述对话的交流一起显示反馈输入接口的显示信息。特别是在第1实施方式中,接口生成部103生成用于与由关键词确定部102确定的关键词分别关联起来显示反馈输入接口的显示信息。
有用度更新部104根据经由上述反馈输入接口受理的反馈输入,计算各关键词的有用度并进行更新。更具体而言,有用度更新部104根据反馈输入来计算各关键词的有用度,生成或者更新将计算出的有用度与各关键词对应起来的关键词有用度数据。关键词有用度数据保存于后述有用度存储部106。有用度的更新可以通过与输入好的反馈的次数相应地使有用度的值线性地增加的方法、使用对数(log)等非线性地增加方法、每预定的次数而阶梯性地增加的方法等各种方法来实现。
确认用响应生成部105生成用于确认反馈输入的反映的响应文本,并生成用于显示该响应文本的显示信息。更具体而言,确认用响应生成部105参照更新后的关键词有用度数据,将具有更高的有用度的关键词用作例示词而生成反问文本,并生成用于显示该文本的显示信息。确认用响应生成部105能够响应于由有用度更新部104更新关键词有用度数据或者响应于请求确认用响应文本的生成或显示的输入而进行上述生成处理。生成的反问文本既可以对应于在反馈输入时与接口一起显示的对话的条件,也可以对应于从管理用户等明确地指定的条件。
有用度存储部106存储由有用度更新部104生成或者更新的关键词有用度数据。
另外,在关键词有用度数据中,各关键词的有用度也可以与使用该关键词的对话的条件对应起来。在此,作为对话的条件,包括对话场景的状态、用户此前输入的信息、针对用户的请求的检索结果等。由此,关于特定的关键词,管理与对话的条件对应的多个有用度。或者,有用度也可以作为表示该关键词是否普遍有用的不取决于对话的条件的信息来管理。在该情况下,即使在特定的条件下进行反馈输入,也能够作为与特定的关键词有关的不取决于条件的有用度而更新。关键词有用度数据也可以与各关键词关联地包含不取决于条件的有用度(以下,还称为“总体有用度”)和取决于条件的有用度(以下,还称为“局部有用度”)这两方。
在对话系统根据当前的对话的条件来进行信息的检索的情况下,确认用响应生成部105也可以不仅有效利用关键词有用度数据,还有效利用在检索结果之中哪个关键词被何种程度多地使用等信息来生成反问语句。另外,在关键词有用度数据包含总体有用度和局部有用度这两方的情况下,也可以将两方的值进行组合来判定是否应将关键词用于反问语句。
图2概略地示出了第1实施方式的接口提供装置100的硬件结构例。如图2所示,接口提供装置100具备CPU(Central Processing Unit,中央处理单元)1001、RAM(RandomAccess Memory,随机存取存储器)1002、ROM(Read Only Memory,只读存储器)1003、辅助存储装置1004、输入装置1005、输出装置1006以及通信装置1007。
接口提供装置100的上述处理功能通过由CPU1001将存储于ROM1003或者辅助存储装置1004的程序展开到RAM1002并执行该程序来实现。CPU1001为硬件处理器的一个例子。硬件处理器不限于CPU1001等通用处理器,也可以为ASIC(Application SpecificIntegrated Circuit,专用集成电路)或者FPGA(Field-Programmable Gate Array,现场可编程门阵列)等专用处理器。
辅助存储装置1004具备非易失性地存储数据的计算机可读取的存储介质,例如可以为HDD(Hard Disk Drive,硬盘驱动器)或者SDD(Solid State Drive,固态驱动器)。辅助存储装置1004作为包括有用度存储部106的存储部而进行动作。
输入装置1005例如具备键盘、鼠标、操纵杆、麦克风等。输出装置1006例如具备液晶显示器、有机EL显示器等显示装置、扬声器等。输入装置1005和输出装置1006例如也可以为将液晶面板等显示设备与触摸板等输入设备进行组合而成的一体型的触摸面板型装置。
通信装置1007针对外部装置进行无线或者有线通信。通信装置1007例如具备LAN(Local Area Network,局域网)端口,例如使用LAN缆线连接于通信网络,经由通信网络在与外部的装置之间收发数据。通信装置1007例如可以具备无线LAN模块或者蓝牙(Bluetooth(注册商标))模块等无线模块。通信装置1007另外能够包括USB端口等外部接口。
以下,特别在如下状况下说明第1实施方式:接口提供装置100将普通用户与系统之间的对话日志作为对话数据而读入,确定该对话数据所包含的关键词,关于各关键词的有用度而提供受理来自管理用户的反馈输入的反馈输入接口。由接口提供装置100生成的显示信息例如被输出到作为输出装置1006的显示器,变换为包括反馈输入接口的显示画面并显示给管理用户。管理用户针对所显示的反馈输入接口,例如用作为输入装置1005的鼠标进行点击操作,从而能够进行用于表示该关键词是否适当的反馈输入。但是,并不限于这样的状况,既可以接口提供装置100使用管理用户与系统之间的对话数据,也可以反馈输入接口受理来自普通用户的输入。另外,显示画面也可以显示于能够与接口提供装置100进行通信的其它装置。
(1-2)动作
接下来,说明第1实施方式的接口提供装置100的动作。
图3是概略地示出接口提供装置100的处理动作的第1例子的流程图。如图3所示,接口提供装置100首先在步骤S101中等待对话数据的输入。对话数据的输入可以通过任意的方法来进行。例如,对话数据既可以从USB等外置存储介质取入到接口提供装置100,也可以从网络上的数据库服务器等读出。当受理对话数据的输入时(步骤S101:是),进入到后续的步骤。
在步骤S102中,接口提供装置100利用对话显示生成部101,根据接收到的对话数据,生成用于将对话的交流显示给管理用户的显示信息并进行输出。显示信息例如由输出装置1006接收,变换为显示画面并进行显示。
另外,在步骤S103中,接口提供装置100利用关键词确定部102,从接收到的对话数据所包含的用户发言语句以及系统响应语句确定关键词。此外,步骤S102和S103既可以同时并行地实施,也可以按照任意的顺序实施。
接着,在步骤S104中,接口提供装置100利用接口生成部103,生成用于与所显示的对话数据中的被确定的各关键词关联起来显示反馈输入接口的显示信息,并进行输出。由接口生成部103生成的显示信息依然由输出装置1006接收,作为显示画面而显示。
接着,在步骤S105中,接口提供装置100等待经由反馈输入接口的来自管理用户的反馈输入(“反馈”)、或者反映了反馈而调整关键词的有用度之后的确认用响应语句的显示请求(“响应显示”)。
在从管理用户受理了反馈输入的情况(步骤S105:反馈)下,在步骤S106中,有用度更新部104根据反馈输入,关于对应的关键词而更新存储于有用度存储部106的有用度数据的值。在受理了确认用响应语句的显示请求的情况(步骤S105:响应显示)下,在步骤S107中,确认用响应生成部105参照存储于有用度存储部106的最新的有用度数据,生成作为例示词而包含与有用度相应的关键词的系统响应语句,为了显示而输出。在任意的情况下都返回到步骤S105,等待来自用户的接下来的操作。
此外,虽然未特别明确,但处理流程可以依照任意的结束条件而结束。
这样,在图3所示的处理中,从用户分别受理反馈输入和反映了更新后的有用度的确认用响应语句的显示请求,但也可以在进行反馈输入的同时显示反映了更新后的有用度的系统响应语句。
图4是作为这样的处理动作的一个例子而概略地示出接口提供装置100的处理动作的第2例子的流程图。
在步骤S101~S104中,进行与第1例子同样的处理。即,等待对话数据的输入(步骤S101),当接收到对话数据时,生成用于对用户显示对话的交流的显示数据并输出(步骤S102),从对话数据中的用户发言语句以及系统响应语句确定关键词(步骤S103),生成如与各关键词关联起来显示反馈输入接口那样的显示信息,并进行输出(步骤S104)。
接着,在步骤S115中,接口提供装置100等待来自管理用户的反馈输入,在受理了反馈输入的情况(步骤S115:是)下,在步骤S116中,有用度更新部104根据反馈输入,更新对应的关键词的有用度。接着,在步骤S117中,确认用响应生成部105参照更新后的关键词有用度数据,生成作为例示词而包含与有用度相应的关键词的系统响应语句,为了显示而输出。之后返回到步骤S115,再次等待来自用户的反馈输入。也可以对图4所示的流程图进一步追加如图3所示的根据确认用响应语句的显示请求来输出响应语句的动作。
接下来,参照图5~图7,说明对话系统的管理者(管理用户)进行在来自系统的反问语句中使用的关键词的有用度的调整的具体例。在此,设为对话系统是回答银行经常有的提问(FAQ:Frequently Asked Questions)的对话系统而进行说明。
图5示出对管理用户显示的显示画面的一个例子。显示画面501利用接口提供装置100根据来自由管理用户指定的某个时期的对话日志的对话数据而生成,显示于例如液晶显示器等输出装置1006。显示画面501包括表示对话系统的代理人物AG、表示普通用户的用户人物US、对话系统的响应语句AG11~AG13、用户的发言语句US11~US12以及受理确认用响应语句的显示请求的响应显示按钮510。响应语句AG11为在对话系统的启动时显示的初始响应语句,不是进行用户的请求的限定的反问语句,所以也可以省略针对管理用户的显示。
另外,显示画面501包括与用下划线强调显示的各关键词(在该例中,“投资信托”、“手续”、“接收”以及“种类”)关联起来的反馈输入接口600。在该例中,反馈输入接口600包括拇指朝着上方的手的形状的“好!”按钮601和拇指朝着下方的手的形状的“不好!”按钮602。此外,为了简化图,参照附图标记600、601、602在全图中仅对一部分附加。
“好!”按钮601能够对用于表示关键词适当的反馈输入使用。“不好!”按钮602能够对用于表示关键词不适当的反馈输入使用。管理用户作为反馈输入而例如按压这些按钮601或者602,从而能够进行有用度的调整。也可以构成为多次按压这些按钮。在该情况下,也可以将表示按压几次的数字显示于各按钮的周边。
接口提供装置100将按压几次哪个按钮的信息与显示中的对话的条件一起获取,进行有用度的更新。例如,接口提供装置100能够在有用度更新部104的控制之下,以当“好!”按钮被按压1次时使对应的关键词的有用度的值“+1”、当“不好!”按钮被按压两次时使有用度的值“-2”的方式更新。或者,在如上所述关键词有用度数据包含总体有用度和局部有用度这两方的情况下,也可以当“好!”按钮被按压1次时使与此时的对话的条件对应的局部有用度“+1”,并且使不取决于条件的总体有用度“+0.1”。
此外,图5的显示仅仅是例示,作为输入接口600的显示方法,考虑各种方法。例如在图5中,使两个按钮601以及602在各关键词的旁边并排地显示,但也可以通过突出、反转等来使关键词强调显示。另外也可以不始终显示,而仅在关键词通过点击等指定时显示按钮601以及602。另外,也可以仅显示“好!”按钮601和“不好!”按钮602中的任意一方。关于各按钮的形状,只要知晓该关键词是适当还是不适当,就可以是任意的。
图6作为反馈输入接口600的其它显示例而示出能够代替按钮601以及602来使用的滑动条603。滑动条603与用户发言语句US12中的关键词“种类”关联起来,受理与把手6031的位置相应的反馈输入。管理用户通过使把手6031左右滑动(例如,在想要增高有用度的情况下向右方滑动),能够调整关键词的有用度。
图7示出在图5的显示画面501,用户发言语句US12中的关键词“种类”的“好!”按钮601被按压之后进而响应显示按钮510被按压时的显示画面的一个例子。显示画面5011能够响应于这些按钮被按压这一情况,根据由接口提供装置100生成的显示信息,依然显示于液晶显示器等。
显示画面5011在其左侧包括反馈输入前的对话AG11~AG13以及US11~US12,在其右侧包括在反馈反映后生成的确认用响应语句AG14~16。US12中的“好!”按钮601以及响应显示按钮510表示被按压,所以颜色发生变化地显示。
在该例中,由管理用户进行了关键词“种类”为适当这样的反馈输入,所以有用度更新部104将“种类”的有用度更新为更高的值,确认用响应生成部105参照更新后的有用度数据,生成作为反问语句的响应语句AG15,该反问语句作为例示词而包含关键词“种类”。相对于反馈输入前的响应语句AG12,在响应语句AG15中,除了关键词“手续”以及“接收”之外,作为例示词而还包含“种类”。例示词的出现顺序既可以基于有用度的高低,也可以被设定成特定的关键词(例如“手续”以及“接收”)始终在特定的位置处被使用。
响应语句所包含的例示词的数量可以任意地设定。例如,既可以抽取有用度的值为特定的阈值以上的关键词,将它们全部作为例示词而包含,也可以从有用度从高到低的顺序抽取特定的数量的关键词。此外,在该例中,响应显示按钮510被按压,从而所显示的系统响应语句全部在相同的条件下再次生成,但响应语句AG14以及AG16未受到更新后的有用度的影响,所以显示与反馈输入前的响应语句AG11以及AG13相同的内容。
这样,能够直接反馈关键词各自的有用度,另外能够确认其结果,所以系统管理者能够容易地进行响应语句所包含的关键词的有用度的调整。
如上所述,关键词“种类”的有用度既可以不论条件如何都一律被调整,也可以仅关于请求与“投资信托”有关的信息这样的条件下的“种类”而调整有用度。依然如上所述,也可以调整总体有用度和局部有用度这两方。
反映了反馈的确认用响应语句的显示请求可以通过各种方法来实施。在图7中示出了在进行了反馈之后按压响应显示按钮510从而显示确认用响应语句的方法,但也可以如关于图4的流程图而叙述那样,当进行反馈时自动地显示确认用响应语句。
另外,例如也可以将点击图7的响应语句AG12视为显示请求,显示与该响应语句AG12的条件对应的确认用响应语句AG15。或者,也可以管理用户任意地指定对话的条件,显示适合该条件的响应语句。
作为确认用响应语句的显示的方式,也考虑各种方法。在图7中,在反馈输入前的系统响应语句AG11、AG12、AG13的旁边显示有确认用响应语句AG14、AG15、AG16,但既可以直接盖写原来的响应语句,也可以在其它视窗显示确认用响应语句。另外,也可以如图7那样仅在存在例示词的变更的地方成为粗字,或者改变存在变更的响应语句的背景而显示等,使存在变更的部位易于理解。
(1-3)效果
在允许自由度高的用户发言的对话系统中,如上所述,为了顺利地推进与用户的对话,重要的是在来自系统的反问语句中包含怎样的关键词。为了进行该判断,例如,还考虑生成如根据对话的状况来选择最佳的关键词那样的模型而应用的方法,但对话系统的管理者能够定制哪个关键词适当的方法被认为特别有用。
根据第1实施方式的接口提供装置100,提供对用户的发言语句、系统的响应语句所包含的关键词分别提供在信息的检索中关键词是否适当的反馈的反馈输入接口。系统管理者能够经由所显示的接口容易地反馈哪个关键词适当。由此,在来自系统方的反问语句中对用户例示的关键词对于对话的进行是有用的,所以能够进行与用户的更顺利的对话。
(2)第2实施方式
在第1实施方式中,举出接口提供装置作为对话数据而读入过去的对话日志来进行关键词的调整的例子而进行了说明,但也可以设为能够在实际地与对话系统进行对话时进行关键词的调整。另外,在第1实施方式中,在动作确认时显示对话的历史等特定的条件下的系统响应语句,但也可以设为能够一边实际地进行对话,一边进行动作确认。
第2实施方式的接口提供装置在与对话系统的对话中,针对用户发言语句和系统响应语句所包含的关键词显示反馈输入接口。然后,另外在以某种程度进行反馈而更新关键词有用度数据之后,管理用户自身与对话系统进行对话,从而还能够调整反问语句所包含的关键词。
(2-1)结构
图8是概略地示出第2实施方式的接口提供装置200的功能结构的框图。
接口提供装置200例如为由管理对话系统的系统管理者使用的计算机,作为处理功能部而具备对话处理部201、关键词确定部102、接口生成部103以及有用度更新部104。接口提供装置200能够还具备有用度存储部106。此外,关键词确定部102、接口生成部103、有用度更新部104以及有用度存储部106与第1实施方式相同,所以附加与图1相同的编号,省略详细的说明。
对话处理部201接收来自用户的发言语句,生成针对该发言语句的响应语句并进行输出。在第2实施方式中,输入发言语句的用户以及输入反馈的用户都可以为管理用户,但并不限于此。另外,来自用户的发言语句既可以为针对用户经由麦克风等输入的发言声音而进行声音辨识的结果,也可以为用户经由键盘等而进行文本输入的发言语句。系统的响应语句不仅可以通过文本来显示,还可以输出通过声音合成变换为声音的响应语句。
关于从接收到的用户的发言语句以何种方式生成系统响应语句,能够采用针对发言语句的文本解析、基于文本解析结果的知识检索、基于文本解析结果、知识检索结果、预先准备的对话场景的系统行动选择、来自选择出的行动的响应语句生成等在各个模块中现有的技术。另外也可以集中地进行上述模块的全部或者一部分的处理。
对话处理部201另外当在系统响应语句中包含例示词时,参照存储于有用度存储部106的最新的有用度数据。因此,每当进行来自用户的反馈输入而有用度数据被更新时,响应语句中所包含的例示词也能够变化。
关键词确定部102针对由对话处理部201进行的对话的交流而进行关键词的确定。在图8中,作为不同的功能部而示出了对话处理部201和关键词确定部102,但也可以在对话处理部201中实施关键词确定部102的处理。
第2实施方式的接口提供装置200能够具备与参照图2而关于第1实施方式说明的硬件结构同样的硬件结构。
(2-2)动作
接下来,说明第2实施方式的接口提供装置200的动作。
图9是概略地示出接口提供装置200的处理动作的一个例子的流程图。其中,步骤S103、S104、S106与第1实施方式相同,所以附加与图3相同的编号,省略详细的说明。
首先,在步骤S201中,接口提供装置200等待来自用户的输入。在此,作为来自用户的输入,设想当前的对话中的发言语句(“发言语句”),如果显示有反馈输入接口,则设想经由该接口的反馈(“反馈”),或者如果关键词有用度数据被更新,则设想用于动作确认的发言语句(“确认对话”)。
在接收到当前的对话中的发言语句的情况(步骤S201:发言语句)下,转移到步骤S202。在步骤S202中,接口提供装置200利用对话处理部201对接收到的发言语句进行对话处理,生成响应语句并进行输出。接着,在步骤S103中,利用关键词确定部102从用户发言语句以及系统响应语句确定关键词,在步骤S104中,利用接口生成部103生成针对各关键词的反馈输入接口并进行输出。步骤S202和步骤S103的处理顺序既可以相反,也可以同时并行地实施。之后,返回到步骤S201,再次等待用户输入。
当在步骤S201中接收到反馈输入的情况(步骤S201:反馈)下,转移到步骤S106,与第1实施方式同样地,有用度更新部104更新存储于有用度存储部106的关键词有用度数据。之后,再次返回到步骤S201。
当在步骤S201中接收到用于动作确认的发言语句的情况(步骤S201:确认对话)下,转移到步骤S203,对话处理部201参照更新后的最新的关键词有用度数据,进行对话处理,生成响应语句并进行输出。之后,再次返回到步骤S201。
在此,关于当前的对话、动作确认用的对话,也可以当在对话的中途进行了反馈等其它输入的情况下,也存储此时的对话的状态,以在接下来受理了发言时接着存储的对话的状态的形式推进对话。另外,也可以在任意一方的对话开始的情况下,结束另一方的对话。例如,也可以在动作确认用的对话开始的情况下,结束当前的对话。另外,对话处理部201既可以当在进行当前的对话时关键词有用度数据被更新时,每次都进行反映了更新后的有用度数据的响应,也可以在保持开始对话时的关键词有用度数据的状态下推进对话。
接下来,参照图10~图11,说明对话系统的管理者(管理用户)一边与系统进行对话一边进行关键词的调整的具体例。在此,设为对话系统是回答银行的FAQ的对话系统而进行说明。
图10示出在管理用户与系统进行对话的状态下对该管理用户显示的显示画面的一个例子。显示画面502利用接口提供装置200从当前进行的对话的用户发言语句以及系统响应语句而生成,依然显示于液晶显示器等。显示画面502大致分割为两部分,左侧的显示画面5021用于当前的对话的显示用,右侧的显示画面5022用于动作确认的显示用。
显示画面5021包括用户人物US、代理人物AG、用户发言语句US21~US22、系统响应语句AG21~AG22以及对话开始按钮511。在图10中,对话开始按钮511为激活,在显示画面5021,另外还显示对用户催促发言的消息栏512。显示画面5021另外包括与被确定的各关键词(在此为“银行账户”、“开设”、“解约”、“转账”)关联起来显示的作为反馈输入接口600的“好!”按钮601以及“不好!”按钮602。显示画面5022包括动作确认按钮513。在该状态下,管理用户既可以依照消息512而输入接下来的发言语句,也可以经由反馈输入接口600进行反馈输入。
在显示画面5021,在用户发言语句US21中输入了“告诉我银行账户”,针对于此,大量的FAQ系统的项目对应于“银行账户”,需要进一步限定检索对象,所以显示来自系统的反问语句AG21“发现了50件。有期望追加的条件吗?例如有开设、解约等。”。作为针对该反问语句的回话的用户发言语句US22“关于转账”包含未包含于前一个反问语句AG21的关键词“转账”。从用户US得到“银行账户”以及“转账”这样的关键词,但依然需要限定检索对象,所以显示针对用户发言语句US22进一步询问追加的条件的反问语句AG22。
图11示出在图10的显示画面502作为反馈输入而US22内的关键词“转账”的“好!”按钮601被按压,之后进而动作确认按钮513被按压而进行了用于动作确认的对话时的显示画面的一个例子。在显示画面502中,动作确认按钮513改变为激活,在其右侧的显示画面5022显示有用于动作确认的新的对话AG31~AG32以及US31。在发言语句US31中输入了“想要知道银行账户”,针对于此,根据反映了反馈的有用度数据,在响应语句AG32中,出现“转账”这样的例示词。由此,管理用户能够确认针对“转账”而进行了是适当的关键词这样的反馈的结果被反映。
以上,设为通过按压动作确认按钮513来将确认用的对话显示于相邻的画面而进行了说明,但并不限定于该动作例。与第1实施方式的动作例同样地,在第2实施方式中既可以当针对关键词进行反馈时自动地开始动作确认用的对话,也可以在不同的视窗显示动作确认用的对话。
(2-3)效果
这样,根据第2实施方式的接口提供装置200,在用户与对话系统的对话中针对用户发言语句以及系统响应语句而显示反馈输入接口。由此,用户能够一边与系统进行对话,一边输入反馈来进行关键词的有用度的调整,另外还能够在任意的定时,与参照更新后的关键词有用度的对话系统进行对话,进行动作确认。
(3)第3实施方式
在第1以及第2实施方式中,设为特别是系统管理者对用户发言语句、系统响应语句的关键词分别提供是否适当的反馈。
第3实施方式的接口提供装置提供使得能够反映来自普通用户的反馈、使普通用户能够输入通过对话得到的检索结果、对话自身是否适当的反馈的反馈输入接口。
(3-1)结构
图12是概略地示出第3实施方式的接口提供装置300的功能结构的框图。
第3实施方式的接口提供装置300例如为由利用对话系统的普通用户使用的个人计算机、智能手机等计算机、或者设置于公共场所的数字标牌。
接口提供装置300作为处理功能部而具备对话处理部201、关键词确定部102、接口生成部301以及有用度更新部302。接口提供装置300能够还具备有用度存储部106。此外,对话处理部201、关键词确定部102以及有用度存储部106与第1或者第2实施方式相同,所以附加与图1或者图8相同的编号,省略详细的说明。
接口生成部301生成用于从普通用户受理反馈输入的显示反馈输入接口的显示信息。第3实施方式的反馈输入接口例如与通过由普通用户与系统进行对话而得到的检索结果关联起来,受理该检索结果是否适当的反馈输入。反馈输入接口与第1或者第2实施方式同样地,能够应用各种显示方法。
有用度更新部302根据经由根据上述显示信息显示的反馈输入接口受理的反馈输入,更新关键词有用度数据。有用度更新部302例如计算在直至达到检索结果为止的对话中使用的各关键词的有用度,更新关键词有用度数据。关于使反馈以何种方式反映到关键词的有用度将在后面叙述。
第3实施方式的接口提供装置300能够具备与参照图2关于第1实施方式说明的硬件结构同样的硬件结构。
(3-2)动作
接下来,说明第3实施方式的接口提供装置300的动作。
图13是概略地示出接口提供装置300的处理次序的一个例子的流程图。其中,步骤S103、S201、S202、S203与第1或者第2实施方式相同,所以附加与图3、图9相同的编号,省略详细的说明。
首先,在步骤S201中,接口提供装置300等待发言语句、反馈输入或者用于动作确认的发言语句(确认对话)。
在接收到用户发言语句的情况(步骤S201:发言语句)下,转移到步骤S202利用对话处理部201,对接收到的发言语句进行对话处理,生成响应语句并进行输出。接着,在步骤S103中,利用关键词确定部102从用户发言语句以及系统响应语句确定关键词。
接着,在步骤S301中,利用接口生成部301生成用于与通过由普通用户与对话处理部201进行对话而得到的检索结果关联起来显示反馈输入接口的显示信息,并进行输出。在此,反馈输入接口既可以针对每1次交流而显示,也可以在得到检索结果之后显示。另外,也可以在如系统尚对用户进行询问那样的对话的中途的状态下,针对显示中的检索结果而不显示反馈输入接口,仅针对最后得到的检索结果而显示。反馈输入接口也可以与对话所包含的关键词关联起来显示。
当在步骤S201中接收到反馈输入的情况(步骤S201:反馈)下,在步骤S302中,利用有用度更新部302,关于在此前的对话中使用的各关键词而计算反映了反馈的有用度,更新存储于有用度存储部106的关键词有用度数据。
此外,由关键词确定部102进行的关键词的确定也可以如步骤S103所示在对话处理时进行,但不限于此。例如,也可以在受理了反馈输入时(例如在紧接着步骤S302之前),从此前的对话抽取关键词来计算有用度。
在此,作为使反馈以何种方式反映到关键词的有用度的手法,能够采用各种手法,参照图14A~14C,说明其几个例子。
图14A作为第1例子而示出将未包含于反问语句的关键词的有用度作为高的有用度而处置的手法的一个例子。显示画面503包括用户发言语句US41~US42和系统响应语句AG41。在用户发言语句US42中输入了“想要知道(投资信托的)种类”,针对于此,前一个反问语句AG41未包含“种类”。如该关键词“种类”那样,关于用户发言语句所包含的关键词中的在系统响应语句中作为例示词而未包含的关键词,能够根据该关键词而得到目标结果,所以被认为重要。因而,在针对如图14A那样的检索结果而输入了反馈的情况下,能够使反馈强烈地反映到“虽然包含于用户发言语句,但不包含于前一个反问语句的关键词”的有用度。所谓的强烈地反映,作为一个例子能够包括使关键词“种类”的有用度大幅增加(例如“+2”)、使用户发言内所包含的其它关键词的有用度比其小幅增加(例如“+1”)、或者仅调整关键词“种类”的有用度等。
图14B作为第2例子而示出将大幅减少了检索结果的关键词的有用度设为高的有用度而处置的手法的一个例子。显示画面504包括用户发言语句US51~US53和系统响应语句AG51~AG52。在该例中,针对用户发言语句US51的“想要知道银行账户”这样的请求,系统AG为了限定检索对象而输出反问语句AG51“开设?解约?”。针对于此,用户发言语句US52回话“关于开设”,从而系统AG将检索对象从60件限定为40件。但是,依然需要限定检索对象,所以系统AG输出反问语句AG52“外币存款?我的号码?”。针对于此,用户发言语句US53回话“关于我的号码”,从而系统AG将检索对象从40件限定为2件。
这样,以何种程度限定检索结果也被认为是该关键词重要到何种程度的指标。因而,在如图14B那样的针对检索结果而输入了反馈的情况下,能够进行与检索结果的限定情形相应的反映。在该例中,“开设”这样的关键词对从60件向40件的限定做出贡献,相对于此,“我的号码”这样的关键词对从40件向2件的限定做出贡献,所以使反馈的结果强烈地反映到“我的号码”。限定的贡献度既可以根据限定后的件数来判断,也可以根据限定前后的比率来判断。另外,在图14B的例子中,既可以仅更新“我的号码”的有用度,也可以进行与限定的贡献度相应的加权来更新“开设”以及“我的号码”这两方的有用度。
图14C作为第3例子而示出将从对话的停滞恢复的关键词的有用度设为高的有用度而处置的手法的一个例子。显示画面505包括用户发言语句US61~US64和系统响应语句AG61~AG63。在该例中,在系统的反问语句中未包含适当的例示词,所以用户不知道说什么好,对话停滞。对从对话的停滞起的恢复做出贡献的关键词也可以说成是对于顺利地推进对话重要的关键词。因而,在如图14C那样的针对检索结果而输入了反馈的情况下,能够使反馈的结果强烈地反映到这样的关键词。对于对话有无停滞的判断,例如能够将用户无法回答的状况持续、跨过特定的次数或者特定的时间而处于相同的对话状态、检索对象的限定失败等用作指标。
图14A~14C的例子所示的反馈反映方法也可以组合使用。例如,当在与反馈输入的检索结果有关的此前的对话中,包括“虽然包含于用户发言语句,但不包含于前一个反问语句的关键词”、“检索结果的限定成功的关键词”、“对从对话的停滞起的恢复做出贡献的关键词”中的两个以上的关键词的情况下,也可以进行与各条件相应的加权而更新有用度。
图15示出第3实施方式的接口提供装置300的具体的动作例。图15所示的显示画面506例如显示于普通用户使用的计算机的显示装置上。显示画面506包括代理人物AG、用户人物US、系统响应语句AG71~AG73、用户发言语句US71~US72、对话开始按钮511、动作确认按钮512、以及表示作为反馈输入的对象的检索结果的方框5061。在方框5061内,作为从用户请求的信息的检索结果而示出了与“投资信托的种类”有关的Q&A。另外,在方框5061中显示反馈输入接口601以及602。
普通用户通过按压按钮601或者602,能够输入显示于方框5061的检索结果是否适当的反馈。在针对检索结果而输入了经由“好!”按钮601的反馈的情况下,利用如在上述中参照图14A~14C而例示出那样的方法,有用度被反映到关键词。例如,根据针对检索结果的反馈输入,对话所包含的关键词“种类”的有用度被更新为更高的值。由此,根据动作确认时的对话、接下来的对话,作为在系统响应语句中例示的关键词,容易包含“种类”。
关键词有用度的更新既可以与第1以及第2实施方式同样地,使用与对话的条件相应的方法,也可以使用不取决于对话的条件的方法。
此外,在第3实施方式中,既可以使得能够针对如图15的系统响应语句AG72、AG73那样的每个检索结果而进行反馈输入,也可以在本次的对话作为整体如何这样的意思下提供针对对话整体的反馈。在该情况下,例如如果为图15的显示画面506,则也可以在对话开始按钮511的旁边显示反馈输入接口。这样的反馈输入接口既可以始终显示,也可以仅在对话结束时显示。另外也可以与针对各检索结果的反馈输入接口一起显示。进而,也可以如第1以及第2实施方式那样,与针对各关键词的反馈输入接口组合地显示。也可以使得能够切换各接口的显示的开启关闭。
(3-3)效果
这样,根据第3实施方式的接口提供装置300,提供能够从普通用户受理通过对话得到的检索结果、对话自身是否适当的反馈输入的接口。经由该接口输入的反馈作为对话所包含的关键词的有用度而被反映,适当地被调整并被更新。由此,能够将来自普通用户的反馈反映到应包含于来自系统的反问语句的例示词的调整。
此外,上述第3实施方式的接口提供装置300不限于由普通用户使用的计算机。接口提供装置300也可以为能够与由普通用户使用的计算机进行通信的对话系统的管理者管理的服务器计算机等。另外由接口提供装置300生成的反馈输入接口不仅可以受理来自普通用户的反馈输入,而且还可以受理来自管理用户的反馈输入。由接口提供装置300生成的反馈输入接口能够显示于由进行反馈输入的普通用户或者管理用户使用的显示装置上。
(4)第4实施方式
在第1~第3实施方式中,根据反馈调整在来自系统的反问语句中用作例示词的关键词的有用度。但是,作为来自系统的反问语句所包含的例示词,例如不仅能够使用“请告诉我食物”、“地点在哪?”等关键词,还能够使用关键词的属性(或者范畴)的名称。在此,将这样的关键词的属性(或者范畴)称为“词槽(slot)”。
第4实施方式的接口提供装置在针对关键词、检索结果等而输入了反馈的情况下,更新词槽的有用度,从而使系统管理者等用户能够调整应包含于系统响应语句的词槽的有用度。
(4-1)结构
图16是概略地示出第4实施方式的接口提供装置400的功能结构的框图。
第4实施方式的接口提供装置400例如为由管理对话系统的系统管理者使用的计算机,作为处理功能部而具备对话显示生成部101、关键词确定部102、接口生成部103、有用度更新部401、以及确认用响应生成部402。接口提供装置400能够还具备有用度存储部403。此外,对话显示生成部101、关键词确定部102以及接口生成部103与第1实施方式相同,所以附加与图1相同的编号,省略详细的说明。
有用度更新部401在经由反馈输入接口而受理了针对关键词的反馈输入的情况下,根据反馈来更新该关键词的词槽的有用度。词槽的有用度与各词槽对应起来,作为词槽有用度数据而保存于后述有用度存储部403。有用度的更新可以通过根据输入良好的反馈的次数而使有用度的值线性地增加的方法、使用对数(log)等非线性地增加的方法、针对每预定的次数而阶梯性地增加的方法等各种方法实现。
确认用响应生成部402与关于第1实施方式而说明的确认用响应生成部105同样地,生成特定的条件下的反问响应文本,生成用于显示的显示信息并进行输出。此时,确认用响应生成部402参照词槽有用度数据,决定用哪个词槽进行询问,也就是说将哪个词槽的名称用作例示词。在应对响应语句使用的词槽的决定中,不仅可以使用词槽有用度数据,还可以使用词槽所包含的关键词候补的数量、在检索结果之中通过从用户接收针对该词槽的关键词而以何种程度限定等其它指标。
有用度存储部403存储词槽有用度数据。另外,如关于关键词有用度数据而进行说明那样,词槽有用度数据也既可以作为与对话的条件相应的有用度而被管理,也可以作为不取决于对话的状态的有用度而被管理。
第4实施方式的接口提供装置400能够具备与参照图2关于第1实施方式说明的硬件结构同样的硬件结构。
(4-2)动作
接下来,说明第4实施方式的接口提供装置400的动作。
图17是概略地示出接口提供装置400的处理动作的一个例子的流程图。其中,步骤S101、S102、S103、S104、S105与第1实施方式相同,所以附加与图3相同的编号,省略详细的说明。
首先,在步骤S101中,接口提供装置400等待对话数据的输入。当受理对话数据的输入时(步骤S101:是),进入到后续的步骤。在步骤S102中,接口提供装置400利用对话显示生成部101根据接收到的对话数据,生成用于将对话的交流显示于管理用户的显示信息并进行输出。另外,在步骤S103中,接口提供装置400利用关键词确定部102从接收到的对话数据所包含的用户发言语句以及系统响应语句确定关键词。
接着,在步骤S104中,接口提供装置400利用接口生成部103生成用于与所显示的对话数据中的被确定的各关键词关联起来显示反馈输入接口的显示信息,并进行输出。在步骤S105中,接口提供装置400等待反馈输入或者确认用响应语句的显示请求。
当在步骤S105中受理了反馈输入的情况(步骤S105:反馈)下,进入到步骤S401。在步骤S401中,接口提供装置400利用有用度更新部401,响应于经由反馈输入接口进行了针对关键词的反馈,更新该关键词的词槽的有用度。之后返回到步骤S105,等待来自用户的接下来的操作。
当在步骤S105中受理了确认用响应语句的显示请求的情况(步骤S105:响应显示)下,进入到步骤S402。在步骤S402中,接口提供装置400利用确认用响应生成部402,参照更新后的词槽有用度数据,将被指定的条件下的有用度高的词槽的名称用作例示词,生成响应语句并进行输出。之后依然返回到步骤S105,等待来自用户的接下来的操作。
图18示出第4实施方式的接口提供装置400的具体的动作例。图18所示的显示画面507包括进行餐馆的引导的对话系统AG和用户US的对话日志(AG81~AG83以及US81~US82)。
在该例中,用户发言语句US81内的“意大利式”以及US82内的“便宜”作为关键词而被确定,与各自关联起来显示反馈输入接口600。其中,与US82内的关键词“便宜”关联起来的“好!”按钮601被点击,即进行了关键词“便宜”有用这样的反馈输入。然后,之后响应于响应显示按钮510被按压,在显示画面507的右侧显示有确认响应语句AG81、AG83、AG84。
在图18中,在进行反馈输入之前,在紧接着用户发言语句US82“便宜的话哪里都可以”之前的系统响应语句AG82中,关于“有期望的地点吗?”和“地点”进行询问。但是,在反馈反映后,如系统响应语句AG84所示关于“价格”进行询问。这样,根据第4实施方式的接口提供装置400,对关键词进行反馈,从而调整关键词的词槽的有用度。此外,在该例中,响应显示按钮510被按压,从而所显示的系统响应语句全部在相同的条件下再次生成,但响应语句AG81以及AG83未受到更新后的有用度的影响,所以显示有与反馈输入前的响应语句AG81以及AG83相同的内容。
在图18的动作例中,对关键词进行了反馈,但也可以如第3实施方式那样,对检索结果、对话自身进行反馈,根据该反馈来更新词槽有用度。另外,也可以使得能够反馈给用户发言语句、系统响应语句所包含的词槽名自身。在该情况下,关键词确定部102确定用户发言语句、系统响应语句内的词槽名,接口生成部103针对由关键词确定部102确定的词槽名而生成用于显示反馈输入接口的显示信息。
(4-3)效果
这样,根据第4实施方式的接口提供装置400,在经由反馈输入接口受理了针对关键词、检索结果等的反馈输入时,更新该关键词的词槽的有用度。由此,系统管理者等能够调整作为例示词而包含于来自系统的反问语句的词槽。
根据以上叙述的至少一个实施方式的接口提供装置以及接口提供方法,能够提供能够受理与用户和系统的对话中的关键词的有用度关联的反馈输入的反馈输入接口。能够根据经由该反馈输入而输入的反馈,以关键词为单位调整其有用度,所以能够使针对用户的发言的来自系统的反问更适当。
[其它实施方式]
此外,本发明并不限定于上述实施方式。例如,也可以通过将实施方式的接口提供装置100、200、300、400所具备的各功能部分散配置于多个装置,由这些装置相互进行协作,从而进行处理。作为一个例子,有用度存储部106、403、输入装置1005以及输出装置1006的各个装置既可以与接口提供装置100、200、300、400一体地设置,也可以设置于能够经由网络访问的其它装置。
另外,各处理功能部也可以通过使用电路而实现。电路既可以为实现特定的功能的专用电路,也可以为如处理器那样的通用电路。
进而,以上说明的各处理的流程并不限定于所说明的次序,既可以调换几个步骤的顺序,也可以同时并行地实施几个步骤。另外,以上说明的一连串的处理无需在时间上连续地执行,也可以在任意的定时执行各步骤。
另外,进而,上述实施方式也可以组合使用。例如,关键词有用度数据和词槽有用度数据既可以组合使用,进而也可以组合总体有用度或者局部有用度的概念。另外,普通用户用的反馈输入接口与管理用户用的反馈输入接口并排地生成,分别输出到不同的显示装置。
以上记载的手法还能够作为能够使计算机(计算机)执行的程序(软件单元),例如保存于磁盘(软盘(floppy(注册商标))、硬盘等)、光盘(CD-ROM、DVD、MO等)、半导体存储器(ROM、RAM、闪存存储器等)等记录介质(存储介质),另外利用通信介质传送而分发。此外,在保存于介质方的程序中,还包括在计算机内构成使计算机执行的软件单元(不仅包括执行程序,还包括表格、数据构造)的设定程序。实现上述装置的计算机读入记录于记录介质的程序,另外根据情况,利用设定程序来构建软件单元,由该软件单元控制动作,从而执行上述处理。此外,在本说明书中所称的记录介质不限于分发用,包括设置于计算机内部或者经由网络连接的设备的磁盘、半导体存储器等存储介质。
除此之外,关于各流程的各步骤的开始条件、结束条件等,也能够在不脱离本发明的要旨的范围进行各种变形而实施。
说明了本发明的几个实施方式,但这些实施方式是作为例子而提示的,未意图限定发明的范围。这些新的实施方式能够以其它各种方式被实施,能够在不脱离发明的要旨的范围进行各种省略、置换、变更。这些实施方式及其变形包含于发明的范围、要旨,并且包含于专利权利要求书所记载的发明及与其均等的范围。
此外,能够将上述实施方式总结成以下的技术方案。
技术方案1
一种接口提供装置,具备:
确定部,从包含对信息进行请求的提问文本和针对所述提问文本的响应文本的对话数据确定关键词;以及
第1生成部,生成用于显示用户接口的显示信息,该用户接口受理与所述信息的检索中的所述关键词的有用度关联的反馈输入。
技术方案2
根据上述技术方案1,接口提供装置还具备:
更新部,根据所述反馈输入来计算所述有用度,生成或者更新有用度数据,该有用度数据将计算出的有用度与所述关键词或者表示所述关键词的属性的名称对应起来;以及
第2生成部,参照所述有用度数据,将具有更高的有用度的关键词或者表示其属性的所述名称用作例示词,生成用于限定所述信息的检索对象的响应文本。
技术方案3
根据上述技术方案2,所述第2生成部生成所述响应文本,作为针对所述对话数据中的所述提问文本或者新输入的提问文本的反问。
技术方案4
根据上述技术方案2,所述更新部在所述有用度数据中将所述有用度进一步与使用各关键词的对话的条件对应起来,所述第2生成部关于作为所述响应文本的响应对象的前一个提问文本而判定对话的条件,将与判定出的条件对应的关键词或者表示其属性的名称中的、具有更高的有用度的关键词或者表示其属性的名称用作所述例示词,生成所述响应文本。
技术方案5
根据上述技术方案2,所述第2生成部将所述有用度的值为特定的阈值以上的关键词或表示其属性的名称、或者按照所述有用度的值从高到低的顺序抽取的特定的数量的关键词或表示其属性的名称用作所述例示词,生成所述响应文本。
技术方案6
根据上述技术方案2,所述更新部在所述反馈输入与包含于所述对话数据中的所述提问文本但不包含于所述响应文本的关键词的有用度关联地被输入的情况下,对该有用度的值进行加权,生成或者更新所述有用度数据。
技术方案7
根据上述技术方案2,所述更新部在所述反馈输入与使所述检索对象的数量在其前后减少到特定的比率或者特定的值以下的响应文本所包含的关键词的有用度关联地被输入的情况下,对该有用度的值进行加权,生成或者更新所述有用度数据。
技术方案8
根据上述技术方案2,所述更新部在所述反馈输入与在所述检索对象的限定停滞特定的次数以上之后使所述检索对象的数量在其前后减少到特定的比率或者特定的值以下的响应文本所包含的关键词的有用度关联地被输入的情况下,对该有用度的值进行加权来生成或者更新所述有用度数据。
技术方案9
根据上述技术方案1至8,所述第1生成部作为所述显示信息而生成用于将所述用户接口与所述对话数据一起与各关键词或者所述信息的检索结果关联起来显示的显示信息。
技术方案10
根据上述技术方案1至9,所述第1生成部以受理作为表示有用还是无用的2值或者作为表示有用的程度的多值而与所述关键词的有用度关联的所述反馈输入的方式,生成所述显示信息。
技术方案11
根据上述技术方案1至10,所述确定部使用规则库或者统计库的方法来确定所述关键词。
技术方案12
根据上述技术方案2,所述第2生成部响应于由所述更新部生成或更新所述有用度数据或者响应于输入了新的提问文本,生成所述响应文本。
技术方案13
一种接口提供方法,具备:
从包含对信息进行请求的提问文本和针对所述提问文本的响应文本的对话数据确定关键词;以及
生成用于显示用户接口的显示信息,该用户接口受理与所述信息的检索中的所述关键词的有用度关联的反馈输入。
技术方案14
一种记录介质,记录有使计算机执行由上述技术方案1至12中的任意一项所记载的装置的各部分进行的处理的程序。
Claims (14)
1.一种接口提供装置,具备:
确定部,从包含对信息进行请求的提问文本和针对所述提问文本的响应文本的对话数据确定关键词;以及
第1生成部,生成用于显示用户接口的显示信息,该用户接口受理与所述信息的检索中的所述关键词的有用度关联的反馈输入。
2.根据权利要求1所述的接口提供装置,还具备:
更新部,根据所述反馈输入来计算所述有用度,生成或者更新有用度数据,该有用度数据将计算出的有用度与所述关键词或者表示所述关键词的属性的名称对应起来;以及
第2生成部,参照所述有用度数据,将具有更高的有用度的关键词或者表示其属性的所述名称用作例示词,生成用于限定所述信息的检索对象的响应文本。
3.根据权利要求2所述的接口提供装置,其中,
所述第2生成部生成所述响应文本,作为针对所述对话数据中的所述提问文本或者新输入的提问文本的反问。
4.根据权利要求2所述的接口提供装置,其中,
所述更新部在所述有用度数据中将所述有用度进一步与使用各关键词的对话的条件对应起来,
所述第2生成部关于作为所述响应文本的响应对象的前一个提问文本而判定对话的条件,将与判定出的条件对应的关键词或者表示其属性的名称中的具有更高的有用度的关键词或者表示其属性的名称用作所述例示词来生成所述响应文本。
5.根据权利要求2所述的接口提供装置,其中,
所述第2生成部将所述有用度的值为特定的阈值以上的关键词或表示其属性的名称、或者按照所述有用度的值从高到低的顺序抽取的特定的数量的关键词或表示其属性的名称用作所述例示词来生成所述响应文本。
6.根据权利要求2所述的接口提供装置,其中,
所述更新部在所述反馈输入与包含于所述对话数据中的所述提问文本但不包含于所述响应文本的关键词的有用度关联地被输入的情况下,对该有用度的值进行加权来生成或者更新所述有用度数据。
7.根据权利要求2所述的接口提供装置,其中,
所述更新部在所述反馈输入与使所述检索对象的数量在其前后减少到特定的比率或者特定的值以下的响应文本所包含的关键词的有用度关联地被输入的情况下,对该有用度的值进行加权来生成或者更新所述有用度数据。
8.根据权利要求2所述的接口提供装置,其中,
所述更新部在所述反馈输入与在所述检索对象的限定停滞特定的次数以上之后使所述检索对象的数量在其前后减少到特定的比率或者特定的值以下的响应文本所包含的关键词的有用度关联地被输入的情况下,对该有用度的值进行加权来生成或者更新所述有用度数据。
9.根据权利要求1至8中的任意一项所述的接口提供装置,其中,
所述第1生成部作为所述显示信息而生成用于将所述用户接口与所述对话数据一起与各关键词或者所述信息的检索结果关联起来显示的显示信息。
10.根据权利要求1至9中的任意一项所述的接口提供装置,其中,
所述第1生成部以受理作为表示有用还是无用的2值或者作为表示有用的程度的多值而与所述关键词的有用度关联的所述反馈输入的方式,生成所述显示信息。
11.根据权利要求1至10中的任意一项所述的接口提供装置,其中,
所述确定部使用规则库或者统计库的方法来确定所述关键词。
12.根据权利要求2所述的接口提供装置,其中,
所述第2生成部响应于由所述更新部生成或更新所述有用度数据或者响应于输入了新的提问文本,生成所述响应文本。
13.一种接口提供方法,具备:
从包含对信息进行请求的提问文本和针对所述提问文本的响应文本的对话数据确定关键词;以及
生成用于显示用户接口的显示信息,该用户接口受理与所述信息的检索中的所述关键词的有用度关联的反馈输入。
14.一种记录介质,记录有用于使计算机作为如下单元发挥功能的程序:
确定单元,从包含对信息进行请求的提问文本和针对所述提问文本的响应文本的对话数据确定关键词;以及
生成单元,生成用于显示用户接口的显示信息,该用户接口受理与所述信息的检索中的所述关键词的有用度关联的反馈输入。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020025085A JP7196122B2 (ja) | 2020-02-18 | 2020-02-18 | インタフェース提供装置、インタフェース提供方法およびプログラム |
JP2020-025085 | 2020-02-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113342925A true CN113342925A (zh) | 2021-09-03 |
CN113342925B CN113342925B (zh) | 2024-06-11 |
Family
ID=77273067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010895530.2A Active CN113342925B (zh) | 2020-02-18 | 2020-08-31 | 接口提供装置、接口提供方法以及程序 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11705122B2 (zh) |
JP (1) | JP7196122B2 (zh) |
CN (1) | CN113342925B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101553816A (zh) * | 2006-11-20 | 2009-10-07 | 株式会社爱可信 | 信息显示装置、信息显示程序以及信息显示系统 |
US20100121973A1 (en) * | 2008-11-12 | 2010-05-13 | Yuliya Lobacheva | Augmentation of streaming media |
US20110288937A1 (en) * | 2010-05-24 | 2011-11-24 | Manoogian Iii John | Scaling persona targeted advertisements |
US8204751B1 (en) * | 2006-03-03 | 2012-06-19 | At&T Intellectual Property Ii, L.P. | Relevance recognition for a human machine dialog system contextual question answering based on a normalization of the length of the user input |
US8719005B1 (en) * | 2006-02-10 | 2014-05-06 | Rusty Shawn Lee | Method and apparatus for using directed reasoning to respond to natural language queries |
US20140351228A1 (en) * | 2011-11-28 | 2014-11-27 | Kosuke Yamamoto | Dialog system, redundant message removal method and redundant message removal program |
CN106503030A (zh) * | 2015-09-03 | 2017-03-15 | 卡西欧计算机株式会社 | 对话控制装置、对话控制方法 |
US20170169101A1 (en) * | 2015-12-15 | 2017-06-15 | 24/7 Customer, Inc. | Method and apparatus for managing natural language queries of customers |
US20180011687A1 (en) * | 2014-12-25 | 2018-01-11 | Hitachi Maxell, Ltd. | Head-mounted display system and operating method for head-mounted display device |
US9900632B1 (en) * | 2016-12-30 | 2018-02-20 | Echostar Technologies L.L.C. | Viewing suggestions based on closed-captioned content from multiple tuners |
US20180090133A1 (en) * | 2016-09-29 | 2018-03-29 | Toyota Jidosha Kabushiki Kaisha | Keyword generation apparatus and keyword generation method |
CN108170792A (zh) * | 2017-12-27 | 2018-06-15 | 北京百度网讯科技有限公司 | 基于人工智能的问答引导方法、装置和计算机设备 |
US20190243900A1 (en) * | 2017-03-03 | 2019-08-08 | Tencent Technology (Shenzhen) Company Limited | Automatic questioning and answering processing method and automatic questioning and answering system |
WO2019202787A1 (ja) * | 2018-04-17 | 2019-10-24 | 株式会社Nttドコモ | 対話システム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9978365B2 (en) * | 2008-10-31 | 2018-05-22 | Nokia Technologies Oy | Method and system for providing a voice interface |
CN114756648A (zh) | 2016-05-06 | 2022-07-15 | 索尼公司 | 信息处理系统和信息处理方法 |
KR102225984B1 (ko) * | 2018-09-03 | 2021-03-10 | 엘지전자 주식회사 | 음성 인식 서비스를 제공하는 서버 |
KR102608953B1 (ko) * | 2018-09-06 | 2023-12-04 | 삼성전자주식회사 | 전자 장치 및 그의 제어방법 |
JP2020123131A (ja) | 2019-01-30 | 2020-08-13 | 株式会社東芝 | 対話システム、対話方法、プログラム、及び記憶媒体 |
US10997373B2 (en) * | 2019-04-09 | 2021-05-04 | Walmart Apollo, Llc | Document-based response generation system |
-
2020
- 2020-02-18 JP JP2020025085A patent/JP7196122B2/ja active Active
- 2020-08-31 US US17/007,567 patent/US11705122B2/en active Active
- 2020-08-31 CN CN202010895530.2A patent/CN113342925B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8719005B1 (en) * | 2006-02-10 | 2014-05-06 | Rusty Shawn Lee | Method and apparatus for using directed reasoning to respond to natural language queries |
US8204751B1 (en) * | 2006-03-03 | 2012-06-19 | At&T Intellectual Property Ii, L.P. | Relevance recognition for a human machine dialog system contextual question answering based on a normalization of the length of the user input |
CN101553816A (zh) * | 2006-11-20 | 2009-10-07 | 株式会社爱可信 | 信息显示装置、信息显示程序以及信息显示系统 |
US20100121973A1 (en) * | 2008-11-12 | 2010-05-13 | Yuliya Lobacheva | Augmentation of streaming media |
US20110288937A1 (en) * | 2010-05-24 | 2011-11-24 | Manoogian Iii John | Scaling persona targeted advertisements |
US20140351228A1 (en) * | 2011-11-28 | 2014-11-27 | Kosuke Yamamoto | Dialog system, redundant message removal method and redundant message removal program |
US20180011687A1 (en) * | 2014-12-25 | 2018-01-11 | Hitachi Maxell, Ltd. | Head-mounted display system and operating method for head-mounted display device |
CN106503030A (zh) * | 2015-09-03 | 2017-03-15 | 卡西欧计算机株式会社 | 对话控制装置、对话控制方法 |
US20170169101A1 (en) * | 2015-12-15 | 2017-06-15 | 24/7 Customer, Inc. | Method and apparatus for managing natural language queries of customers |
US20180090133A1 (en) * | 2016-09-29 | 2018-03-29 | Toyota Jidosha Kabushiki Kaisha | Keyword generation apparatus and keyword generation method |
US9900632B1 (en) * | 2016-12-30 | 2018-02-20 | Echostar Technologies L.L.C. | Viewing suggestions based on closed-captioned content from multiple tuners |
US20190243900A1 (en) * | 2017-03-03 | 2019-08-08 | Tencent Technology (Shenzhen) Company Limited | Automatic questioning and answering processing method and automatic questioning and answering system |
CN108170792A (zh) * | 2017-12-27 | 2018-06-15 | 北京百度网讯科技有限公司 | 基于人工智能的问答引导方法、装置和计算机设备 |
WO2019202787A1 (ja) * | 2018-04-17 | 2019-10-24 | 株式会社Nttドコモ | 対話システム |
Also Published As
Publication number | Publication date |
---|---|
CN113342925B (zh) | 2024-06-11 |
JP2021131594A (ja) | 2021-09-09 |
US11705122B2 (en) | 2023-07-18 |
US20210256972A1 (en) | 2021-08-19 |
JP7196122B2 (ja) | 2022-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11997055B2 (en) | Chat management system | |
RU2690199C1 (ru) | Управление поставщиками данных для диалога | |
KR102164428B1 (ko) | 선택 가능한 그래픽 요소를 통해 자동화된 에이전트를 사용하여 대화를 초기화 | |
US20180285595A1 (en) | Virtual agent for the retrieval and analysis of information | |
JP6517352B2 (ja) | 翻訳情報の提供方法及びシステム | |
US12013887B2 (en) | Contextual estimation of link information gain | |
US20140115456A1 (en) | System for accessing software functionality | |
US10936288B2 (en) | Voice-enabled user interface framework | |
US11544089B2 (en) | Initializing a conversation with an automated agent via selectable graphical element | |
US10154144B2 (en) | Adjustable interactive voice response system and methods of using same | |
KR20200032893A (ko) | 챗봇 서비스를 위한 커뮤니케이션 정보 처리 시스템 및 그 제어 방법 | |
US11228681B1 (en) | Systems for summarizing contact center calls and methods of using same | |
US11763074B2 (en) | Systems and methods for tool integration using cross channel digital forms | |
Cox et al. | Tlk or txt? Using voice input for SMS composition | |
CN113342925A (zh) | 接口提供装置、接口提供方法以及程序 | |
Feng et al. | Speech-based navigation and error correction: a comprehensive comparison of two solutions | |
JP7205962B1 (ja) | 自動対話のためのシステム | |
US11442601B2 (en) | Computer desktop that dynamically adapts to a live multi-channel audio stream, such as for use with wireless telecommunications customer service agents | |
Telner et al. | Conversational Advisors–Are These Really What Users Prefer? User Preferences, Lessons Learned and Design Recommended Practices | |
KR20240042964A (ko) | 음성 명령의 키워드 분석을 통한 관련 영상데이터 선정 및 송출방법 | |
Choudhary et al. | Conversational Advisors–Are These Really What Users Prefer? User Preferences, Lessons Learned and Design Recommended Practices | |
Remington | Spoken language interface for a network management system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |