CN111506712B - 对话系统、对话方法、程序以及存储介质 - Google Patents

对话系统、对话方法、程序以及存储介质 Download PDF

Info

Publication number
CN111506712B
CN111506712B CN201910849865.8A CN201910849865A CN111506712B CN 111506712 B CN111506712 B CN 111506712B CN 201910849865 A CN201910849865 A CN 201910849865A CN 111506712 B CN111506712 B CN 111506712B
Authority
CN
China
Prior art keywords
question
keyword
answer
response
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910849865.8A
Other languages
English (en)
Other versions
CN111506712A (zh
Inventor
吉田尚水
藤村浩司
岩田宪治
小林优佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN111506712A publication Critical patent/CN111506712A/zh
Application granted granted Critical
Publication of CN111506712B publication Critical patent/CN111506712B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供能够更容易地构建的对话系统、对话方法、程序以及存储介质。实施方式的对话系统包括处理部。处理部当被输入包含一个以上的单词的第1文章时,将该单词中的至少一部分设定为第1查询关键词。处理部从包含多个包含提问以及回答的提问回答对的提问回答集选定包含第1查询关键词的一个以上的提问回答对。处理部在所选定的提问回答对的数量为1时,输出表示该提问回答对所包含的回答的第1响应,在数量为第1阈值以上时,输出包括从所选定的提问回答对抽取出的第1提问关键词以及第2提问关键词的第2响应。

Description

对话系统、对话方法、程序以及存储介质
本申请以日本专利申请2019-014417(申请日2019年1月30日)为基础,从该申请享受优先权。本申请通过参照该申请,包含该申请的全部内容。
技术领域
本发明的实施方式涉及对话系统、对话方法、程序以及存储介质。
背景技术
有通过与用户的对话对来自用户的询问输出回答的对话系统。期待开发能够更容易地构建该对话系统的技术。
发明内容
本发明的实施方式提供能够更容易地构建的对话系统、对话方法、程序以及存储介质。
根据本发明的实施方式,对话系统包括处理部。所述处理部当由用户输入包含一个以上的单词的第1文章时,将所述一个以上的单词中的至少一部分设定为第1查询关键词。所述处理部从包含多个包含提问和针对所述提问的回答的提问回答对的提问回答集选定包含所述第1查询关键词的一个以上的所述提问回答对。所述处理部在所选定的所述提问回答对的数量为1时,输出表示所选定的所述提问回答对所包含的所述回答的第1响应,在所述数量为第1阈值以上时,输出第2响应,该第2响应包括从所选定的所述提问回答对的一个提问回答对所包含的多个提问关键词抽取出的第1提问关键词和从所选定的所述提问回答对的另一个提问回答对所包含的其它多个提问关键词抽取出的第2提问关键词。
根据上述结构,能够更容易地构建对话系统。
附图说明
图1是例示第1实施方式的对话系统的示意图。
图2是例示提问回答集的表。
图3是例示场景模板的表。
图4是例示任务用场景的表。
图5是例示实施方式的对话系统的处理的流程图。
图6是例示第1实施方式的变形例的对话系统的示意图。
图7是例示第1实施方式的变形例的对话系统的处理的流程图。
图8是例示第1实施方式的变形例的对话系统的处理的流程图。
图9是例示第2实施方式的对话系统的示意图。
图10是例示第2实施方式的对话系统的处理的流程图。
图11是示出第2实施方式的对话系统的动作的示意图。
图12是例示第2实施方式的变形例的对话系统的示意图。
图13是说明第2实施方式的对话系统的动作的示意图。
图14是例示实施方式的对话装置的结构的示意图。
附图标记说明
1、1a、2、2a:对话系统;3:对话装置;10:处理部;11:受理部;12:设定部;13:选定部;14:生成部;21:第1存储部;22:第2存储部;23:第3存储部;24:第4存储部;30:处理部;31:取出部;32:抽取部;33:生成部;40:处理部;41:取出部;42:抽取部;43:生成部;91:CPU;92:输入部;93:输出部;94:ROM;95:RAM;96:存储部;97:通信装置;98:总线;110:提问回答集;110a~110K:提问回答对;111a~111K:ID;112a~112K:提问;113a~113K:回答;114a~114K:提问关键词;120:通用模型;121a~121d:场景模板;122a~122d:回答候补数;131~133:任务用场景;Ns:阈值;TX1~TX6:文章;US:用户。
具体实施方式
以下,参照附图,说明本发明的各实施方式。
在本申请说明书和各图中,对与已经说明的要素同样的要素附加相同的附图标记,适当地省略详细的说明。
(第1实施方式)
图1是例示第1实施方式的对话系统的示意图。
如图1所示,第1实施方式的对话系统1包括处理部10。在图1所示的例子中,对话系统1还包括第1存储部21以及第2存储部22。
处理部10受理从用户输入的文章。处理部10针对所输入的文章输出响应。用户根据来自处理部10的响应,将接下来的文章输入到处理部10。处理部10根据此前的与用户的对话来输出针对接下来的文章的响应。由此,在用户与对话系统1之间实现对话。
第1存储部21存储提问回答集。提问回答集包含多个提问回答对。各个提问回答对包含提问和针对该提问的回答。第2存储部22存储用于生成从处理部10输出的响应的通用的场景。处理部10一边参照第1存储部21以及第2存储部22,一边生成针对所输入的文章的响应。
例如,从用户输入的文章包含询问。在此,将从用户输入到处理部10的文章称为“查询文章”。处理部10当受理了查询文章时,参照第1存储部21的提问回答集。处理部10调查与查询文章关联的提问是否处于提问回答集。处理部10当发现关联的提问时,向用户输出表示针对该提问的回答的响应。
处理部10在存在多个关联的提问时,输出用于将这些提问缩小为一个的响应(反问)。用户针对该响应输入包含用于缩小提问的信息(关键词)的其它查询文章。例如,交替地重复由用户进行的查询文章的输入和来自处理部10的响应,直至提问被缩小为一个。用户通过针对对话系统的响应进行回答,能够得到包含用户想要的信息的一个回答。通过使用对话系统1,从而用户即使不知道适当的检索方法,用户也能够得到一个回答。
为了将基于查询文章的响应从对话系统输出到用户,需要场景。有为了自动地生成场景而使用概念词典的方法。概念词典例如包含属性、属性值以及替换表达。在使用了概念词典的对话系统中,处理部当被输入查询文章时,根据概念词典和回答候补的数量,自动地生成场景。通过场景的自动生成,不需要由人(例如系统管理者)制作场景。
另一方面,为了使用概念词典,系统管理者需要对提问回答集所包含的所有的提问分别赋予一个以上的属性和各属性的属性值。在使用概念词典的情况下,能够削减场景的制作所需的时间,但概念词典的制作需要时间。另外,将什么作为属性、将什么作为属性值取决于系统管理者。在用户的询问中,还需要决定判断是否提及属性值的方法。因而,对于系统管理者要求专业知识,对系统管理者的负担大。
因此,期待开发能够更容易地构建能够与用户对话的对话系统的技术。
在实施方式的对话系统1中,处理部10当由用户输入包含一个以上的单词的查询文章时,将该一个以上的单词中的至少一部分设定为关键词(查询关键词)。处理部10从提问回答集选定包含查询关键词的提问回答对。通过将查询关键词用于选定,从而不需要如向提问回答集赋予属性以及属性值那样的事先准备。
进而,处理部10在所选定的提问回答对的数量为1时,输出表示该一个提问回答对的回答的第1响应。例如,第1响应包括所选定的提问回答对所包含的提问以及回答。第1响应也可以包括记载有回答的网页的URL。用户通过参照第1响应,能够确认针对询问的回答。
处理部10在所选定的提问回答对的数量为2以上时,输出第2响应。第2响应包括从所选定的提问回答对的一个提问回答对所包含的多个关键词(提问关键词)抽取出的提问关键词和从所选定的提问回答对的另一个提问回答对所包含的其它多个提问关键词抽取出的其它提问关键词。第2响应所包含的这些提问关键词与查询关键词不同。用户通过参照第2响应,能够知道为了缩小提问回答对将怎样的关键词包含于接下来的查询文章为好。
另外,能够使用通用的词典自动地生成与上述所选定的提问回答对的数量相应的场景。因此,能够减轻系统管理者的场景制作所需的负担。
例如,用户将包含第2响应所包含的任意的提问关键词的其它查询文章输入到处理部10。处理部10将该其它查询文章所包含的一个以上的单词中的至少一部分设定为其它查询关键词。处理部10使用该其它查询关键词,从所选定的两个以上的提问回答对进一步选定其一部分。其结果,在所选定的提问回答对的数量为1时,处理部10输出第1响应。在所选定的提问回答对的数量为2以上时,处理部10再次输出第2响应。
根据实施方式,例如,能够不使用概念词典地实现关于提问回答集的与用户的对话。另外,根据实施方式,在两个以上的提问回答对被选定时,显示包括提问关键词的响应。由此,用户能够知晓将包含怎样的关键词的查询文章输入到对话系统1为好。其结果,用户更加容易地得到想要的回答。能够提高对话系统1的便利性。
处理部10具备包括电路(处理电路)的中央运算处理装置。第1存储部21以及第2存储部22分别包括存储装置。存储装置例如包括硬盘驱动器(HDD)、网络附属存储(NAS)、嵌入式多媒体卡(eMMC)、固态驱动器(SSD)以及固态混合动力驱动器(SSHD)中的至少任意个。也可以是一个存储装置作为第1存储部21以及第2存储部22这两方发挥功能。处理部10、第1存储部21以及第2存储部22既可以包含于一个计算机,也可以经由有线、无线或者网络相互连接。
具体地说明实施方式的对话系统1。
图2是例示提问回答集的表。
图3是例示场景模板的表。
图4是例示任务用场景的表。
第1存储部21例如存储图2所示的提问回答集110。提问回答集110包含多个提问回答对110a~110K。提问回答对110a~110K分别包含识别提问回答对的ID111a~111K、提问112a~112K以及针对提问的回答113a~113K。
对于提问回答对110a~110K分别关联有提问关键词114a~114K。提问关键词114a~114K例如包含于提问回答集110。或者,提问关键词114a~114K也可以与提问回答集110不同地存储于第1存储部21或者其它存储部。
从提问112a~112K分别抽取提问关键词114a~114K。也可以从一个提问抽取多个提问关键词。例如,由对话系统1的外部的处理装置从提问112a~112K抽取提问关键词114a~114K。或者,提问关键词114a~114K也可以由系统管理者赋予给提问112a~112K。
提问回答集也可以包含多个提问回答对以及多个提问关键词以外的信息。例如,提问回答集也可以包含未设定对应的回答的提问。提问回答集也可以包含一个提问与一个回答未配对的、一个以上的提问与一个以上的回答的组合。例如,提问回答集包含两个提问与作为针对两个提问的共同的回答而设定的一个回答的组合。在这些情况下,处理部10例如仅根据多个提问回答对来执行与用户的对话。处理部10不将多个提问回答对以外的信息用于与用户的对话。
在提问回答集中,也可以一个回答包含多个条件和针对各条件的详细的回答。在该情况下,能够将多个条件和多个详细的回答汇总地视为一个回答。
第2存储部22例如存储图3所示的通用模型120。通用模型120包括多个场景模板121a~121c。场景模板121a~121c被作用任务用场景的基础。任务用场景包含具体的信息,被用作从处理部10输出的响应。对场景模板121a~121c分别设定回答候补数122a~122c。根据回答候补数来决定要使用的场景模板。
场景模板121a~121c被通用地记述以不取决于用户的询问。具体而言,场景模板121a~121c分别包含<空白>。在<空白>中,如后所述,在生成任务用场景时,适用提问、回答或者提问关键词。
通用模型120也可以如场景模板121d那样包含不包含空白的定型场景。定型场景对应于寒暄、感谢、道歉等。
处理部10例如包括受理部11、设定部12、选定部13以及生成部14。
受理部11受理从用户输入的查询文章。查询文章例如通过用户的键盘、触摸面板等的操作而输入。或者,查询文章也可以根据用户的发声而生成。例如,麦克风对用户的发声进行录音,识别声音。查询文章通过声音识别而生成。
设定部12根据查询文章设定查询关键词。例如,设定部12将包含一个以上的单词的查询文章整体作为一个查询关键词。选定部13从提问回答集选定包含查询关键词的一个以上的提问回答对。生成部14根据所选定的提问回答对的数量生成任务用场景。生成部14将所生成的任务用场景输出到监视器、扬声器、打印机等外部的装置。这些装置以使用户能够识别的方式输出任务用场景。
作为具体的一个例子,将图3所示的通用模型120中的Ns设为3。Ns是为了在多个提问回答对被选定时根据所选定的提问回答对的数量切换来自对话系统1的响应而设定的。例如,用户将“余额确认”输入到对话系统1。受理部11受理该查询文章。设定部12将该查询文章作为查询关键词。即,“余额确认”成为查询关键词。选定部13参照第1存储部21的提问回答集,选定包含该查询关键词的提问回答对。所选定的提问回答对所包含的回答为针对来自用户的询问的回答的候补。
生成部14对所选定的提问回答对的数量进行计数。所选定的提问回答对的数量对应于回答候补的数量。在图2所示的提问回答集的提问112a、112b、112c以及112K中,只有提问112a包含“余额确认”的提问关键词。因而,所选定的提问回答对的数量为1。生成部14在通用模型120中参照与回答候补数为1对应的场景模板121a。生成部14将提问112a“想要确认存款账户的余额”代入到<空白1>。生成部14将回答113a“为了进行余额确认…”代入到<空白2>。由此,如图4所示,生成“您的提问是‘想要进行存款账户的余额确认’吧。‘为了进行余额确认…’”的任务用场景131。
作为另一个例子,用户将“申请”输入到对话系统1。设定部12将“申请”作为查询关键词。在图2所示的提问回答集中,提问112b和提问112K这两个提问包含“申请”。所选定的提问回答对的数量为2。生成部14在通用模型120中参照与回答候补数为2对应的场景模板121b。生成部14将提问112b“想要申请存款账户”代入到<空白3a>。生成部14将提问112K“想要申请贷款”代入到<空白3b>。由此,生成“您的提问是‘想要申请存款账户’?还是‘想要申请贷款’?”的任务用场景132。
作为又一个例子,用户将“存款账户”输入到对话系统1。在图2所示的提问回答集中,提问112a、112b以及112c这3个提问包含“存款账户”。所选定的提问回答对的数量为3。生成部14在通用模型120中,参照与回答候补数为3对应的场景模板121c。另外,生成部14从与提问112a~112c分别对应的提问关键词114a~114c抽取与查询关键词不同的提问关键词。生成部14将提问112a的提问关键词“余额确认”代入到<空白4a>。生成部14将提问112b的提问关键词“申请”代入到<空白4b>。生成部14将提问112c的提问关键词“注销”代入到<空白4c>。由此,生成“有追加的关键词吗?关于‘余额确认’、关于‘申请’、关于‘注销’等。”的任务用场景133。
在所选定的提问回答对的数量为0时,生成部14在通用模型120中参照与回答候补数为0对应的场景模板121d。场景模板121d为不包含空白的定型场景。生成部14将场景模板121d直接作为任务用场景。
这样,处理部10根据由用户输入的查询文章、提问回答集110以及通用模型120,自动地生成任务用场景。生成部14将所生成的任务用场景作为针对用户的询问的响应而输出。
图5是例示实施方式的对话系统的处理的流程图。
受理部11受理由用户输入的查询文章(步骤S101)。设定部12将查询文章中的至少一部分设定为查询关键词(第1查询关键词)(步骤S102)。选定部13选定包含第1查询关键词的提问回答对(步骤S103)。生成部14对所选定的提问回答对的数量N进行计数(步骤S104)。
生成部14判断N是否为0(步骤S105)。在N为0时,生成部14输出定型响应(步骤S106)。定型响应对应于定型场景。在N不为0时,生成部14判断N是否为1(步骤S107)。在N为1时,生成部14生成第1响应(步骤S108)。第1响应示出所选定的提问回答对所包含的回答。第1响应例如为图4所示的任务用场景131。
在N不为1时,生成部14判断N是否为Ns以上(步骤S109)。在N为Ns以上时,生成部14关于所选定的提问回答对的一个提问回答对,选定与第1查询关键词不同的提问关键词(第1提问关键词)。生成部14关于所选定的提问回答对的另一个提问回答对,选定与第1查询关键词不同的其它提问关键词(第2提问关键词)。第1提问关键词以及第2提问关键词互不相同。生成部14生成包括第1提问关键词以及第2提问关键词的第2响应(步骤S110)。第2响应例如为图4所示的任务用场景133。
在N小于Ns时,生成部14生成包括N个提问回答对各自所包含的N个提问的第3响应(步骤S111)。例如,生成部14生成包括N个提问回答对的一个提问回答对所包含的第1提问和N个提问回答对的另一个提问回答对所包含的第2提问的第3响应。第3响应例如为图4所示的任务用场景132。在生成第1响应~第3响应中的任意的响应之后,生成部14输出所生成的响应(步骤S112)。
在输出响应之后,处理部10判断对话是否结束(步骤S113)。例如,处理部10测定在输出响应之后经过的时间。当在保持未由用户输入其它查询文章的状态下经过时间超过阈值时,处理部10判断为对话结束。也可以从用户向对话系统1输入表示对话结束的文章。处理部10当受理了该文章时,判断为对话结束。当在满足这些结束的条件之前受理部11受理了接下来的查询文章时,处理部10再次执行上述处理。
在生成部14将响应输出到监视器的情况下,生成部14也可以以能够在显示于监视器的图形用户界面(GUI)上选择提问、关键词等的方式输出。例如,在生成部14生成了第2响应时,以能够在GUI上选择第1提问关键词以及第2提问关键词的方式输出。当用户在GUI上点击第1提问关键词或者第2提问关键词时,所点击的关键词作为接下来的查询文章而输入到处理部10。例如,在生成部14生成了第3响应时,以能够在GUI上选择第1提问以及第2提问的方式输出。当用户在GUI上点击第1提问或者第2提问时,所点击的提问作为接下来的查询文章而输入到处理部10。
根据图2~图5所示的例子,在多个提问回答对被选定时,根据所选定的提问回答对的数量,生成第2响应或者第3响应。第2响应包含与查询关键词不同的多个提问关键词。因此,用户能够知晓在接下来的查询文章中包含怎样的关键词为好。第3响应包括所选定的提问回答对所包含的多个提问。因此,用户能够直接地确认所选定的提问回答对所包含的提问。通过这些响应,用户更加容易地得到想要的回答。
(变形例)
图6是例示第1实施方式的变形例的对话系统的示意图。
在变形例的对话系统1a中,在由用户询问之前,事先生成任务用模型。任务用模型包含提问回答集所包含的提问关键词、包含各提问关键词的提问回答对的数量以及多个任务用场景。
任务用模型由处理部30生成。例如,对话系统1a包括处理部30。处理部30将所生成的任务用模型存储于第3存储部23。处理部30具备包括电路的中央运算处理装置。也可以是一个装置作为处理部10以及处理部30这两方发挥功能。第3存储部23包括存储装置。存储装置例如包括HDD、NAS、eMMC、SSD以及SSHD中的至少任意个。也可以是一个存储装置作为第1存储部21~第3存储部23发挥功能。
在对话系统1a中,处理部30包括取出部31、抽取部32以及生成部33。处理部10包括受理部11、设定部12以及选定部13。
图7是例示第1实施方式的变形例的对话系统的处理的流程图。
图7的流程图例示制作任务用模型时的处理。
取出部31参照第1存储部21的提问回答集,从多个提问回答对取出一个提问回答对(步骤S121)。抽取部32抽取针对该一个提问回答对登记的提问关键词(步骤S122)。生成部33判断抽取出的提问关键词是否登记于任务用模型(步骤S123)。
在未登记时,生成部33参照第2存储部22的通用模型。生成部33检索与回答候补数为1对应的场景模板。生成部33将选择出的提问回答对的提问以及回答分别代入到该场景模板的多个空白,生成任务用场景(步骤S124)。生成部33将抽取出的提问关键词、包含该提问关键词的提问回答对的数量、以及所生成的任务用场景对应起来追加到第3存储部23的任务用模型(步骤S125)。
在步骤S123中,在抽取出的提问关键词登记于任务用模型时,生成部33更新任务用模型(步骤S126)。具体而言,生成部33在任务用模型中,对包含抽取出的提问关键词的提问回答对的数量加上1。生成部33比较加上1之后的提问回答对的数量和阈值Ns。
在提问回答对的数量小于Ns时,生成部33检索与回答候补数为2以上且小于Ns对应的场景模板。生成部33将包含抽取出的提问关键词的多个提问回答对的多个提问分别代入到该场景模板的多个空白,生成任务用场景。
在提问回答对的数量为Ns以上时,生成部33从包含抽取出的提问关键词的提问回答对所包含的各提问抽取其它提问关键词。生成部33检索与回答候补数为Ns以上对应的场景模板。生成部33将抽取出的多个其它提问关键词分别代入到该场景模板的多个空白,生成任务用场景。生成部33将所生成的任务用场景和更新后的提问回答对的数量登记于任务用模型。
在步骤S125或者S126之后,处理部30判断是否从提问回答集取出所有提问回答对(步骤S127)。在存在未取出的提问回答对时,处理部30再次执行步骤S121。在步骤S121中,取出部31取出多个提问回答对的另一个提问回答对。以后从多个提问回答对的另一个提问回答对抽取其它提问关键词。反复执行步骤S121~S126的处理,直至取出提问回答集所包含的所有提问回答对。
图8是例示第1实施方式的变形例的对话系统的处理的流程图。
图8的流程图例示对查询文章进行响应时的处理。
受理部11受理由用户输入的查询文章(步骤S141)。设定部12将查询文章设定成查询关键词(步骤S142)。选定部13根据查询关键词选定响应(步骤S143)。具体而言,选定部13访问第3存储部23。选定部13判断任务用模型是否包含查询关键词。
当在任务用模型中包含查询关键词时,选定部13从任务用模型选定与查询关键词对应的任务用场景。当在任务用模型中不包含查询关键词时,选定部13在第2存储部22的通用模型中,选定与回答候补数为0对应的场景模板(定型场景)作为任务用场景。与回答候补数为0对应的场景模板也可以作为任务用场景而事先登记于任务用模型。选定部13输出所选定的响应(步骤S144)。处理部10判断对话是否结束(步骤S145)。
根据变形例的对话系统1a,在处理部10受理查询文章之前,生成包括多个任务用场景的任务用模型。因此,处理部10无需在受理了查询文章之后根据该查询文章生成任务用场景。例如,能够降低受理了查询文章之后的处理部10的处理负荷。
(第2实施方式)
图9是例示第2实施方式的对话系统的示意图。
在第2实施方式的对话系统2中,处理部10在生成响应时,除了参照第1存储部21以及第2存储部22之外,还参照第4存储部24。也可以对话系统2包括第4存储部24。第4存储部24存储用于从文章抽取关键词的模型或者规则。
对话系统2还包括处理部40。处理部40例如包括取出部41以及抽取部42。取出部41访问第1存储部21,从提问回答集取出一个提问回答对。抽取部42依照存储于第4存储部24的模型或者规则,从提问回答对抽取提问关键词。抽取部42将抽取出的提问关键词例如存储于第1存储部21。处理部40具备包括电路的中央运算处理装置。也可以是一个装置作为处理部10以及处理部40这两方发挥功能。第4存储部24包括存储装置。存储装置例如包括HDD、NAS、eMMC、SSD以及SSHD中的至少任意个。也可以一个存储装置作为第1存储部21、第2存储部22以及第4存储部24发挥功能。
当受理部11受理了包含一个以上的单词的查询文章时,设定部12依照存储于第4存储部24的模型或者规则,抽取一个以上的单词的一部分。设定部12将抽取出的单词设定成查询关键词。即,设定部12从查询文章抽取查询关键词。也可以从查询文章抽取多个查询关键词。
例如,关键词的抽取基于构成文章的各单词的词类。在该情况下,第4存储部24存储词素解析模型或者词素解析规则。设定部12通过对文章进行词素解析,从而将文章分割为多个单词,推测各单词的词类。设定部12将特定的词类的单词作为关键词。作为特定的词类,例如使用名词以及动词。关于作为名词之一的复合名词,设定部12既可以将复合名词中的各名词作为关键词登记,也可以将复合名词整体作为一个关键词登记,也可以将它们组合而登记。设定部12进而也可以抽取无法分类为任意词类的单词(未知词)作为关键词。
图10是例示第2实施方式的对话系统的处理的流程图。
图10示出处理部40从提问回答集抽取提问关键词时的处理。图10所示的处理例如在由用户输入查询文章时被执行。
取出部41从提问回答集取出多个提问回答对的一个提问回答对(步骤S201)。抽取部42从取出的提问回答对的提问抽取提问关键词(步骤S202)。抽取部42将抽取出的提问关键词登记于第1存储部21(步骤203)。取出部41判断是否取出提问回答集所包含的所有提问回答对(步骤S204)。在存在未取出的提问回答对时,取出部41再次执行步骤S201。在步骤S201中,取出部41从提问回答集取出多个提问回答对的另一个提问回答对。以后,从多个提问回答对的另一个提问回答对抽取其它提问关键词。反复执行步骤S201~S203的处理,直至从提问回答集所包含的所有提问回答对抽取提问关键词。
处理部10使用从提问回答集抽取出的提问关键词,执行与图5所示的流程图同样的处理。例如,在步骤S102中,设定部12抽取由用户输入的查询文章的一部分,设定成一个以上的查询关键词。在步骤S103中,选定部13选定包含抽取出的一个以上的查询关键词中的至少一个查询关键词的提问回答对。
第2根据实施方式,查询文章的一部分被抽取,并被设定成查询关键词。根据该方法,相比于查询文章整体被设定成一个查询关键词的情况,更加容易地选定包含与用户的询问对应的提问的提问回答对。由此,用户更加容易地得到想要的回答。能够提高对话系统2的便利性。
另外,根据第2实施方式,在由用户输入查询文章时,从提问回答集抽取提问关键词。因此,即使在提问回答集频繁地被更新的情况下,也根据最新的提问回答集所包含的提问关键词选定提问回答对。例如,能够使用最新的提问回答集所包含的提问关键词输出响应。由此,用户更加容易地得到想要的回答。
在步骤S103中,选定部13也可以除了选定包含与查询关键词相同的提问关键词的提问回答对,还选定包含与查询关键词类似的提问关键词的提问回答对。选定部13计算一个以上的查询关键词的各个查询关键词与从提问回答集抽取出的多个提问关键词的各个提问关键词之间的类似度。在一个查询关键词与一个提问关键词之间的类似度为预先设定的阈值以上时,该一个查询关键词被判断为该一个提问关键词的替换表达。选定部13将包含与查询关键词类似的提问关键词的提问回答对判断为实质上包含查询关键词,选定该提问回答对。
例如,某个提问关键词的读法与某个查询关键词的读法相同。作为一个例子,该提问关键词中的至少一部分按照平假名以及片假名的一方记载,该查询关键词中的至少一部分按照平假名以及片假名的另一方记载。在该情况下,该提问关键词为该查询关键词的替换表达。作为另一个例子,提问关键词以及查询关键词包含相同的汉字,但包含不同的送假名。在该情况下,该提问关键词也为该查询关键词的替换表达。
提问关键词以及查询关键词包含相同的汉字,因词类的不同而送假名不同时,该提问关键词也被判断为是该查询关键词的替换表达。例如,在提问关键词为“转账(用日文表达:振り込み)”,查询关键词为“转账(用日文表达:振り込む)”时,提问关键词被判断为是该查询关键词的替换表达。
在类似度的决定中,例如使用编辑距离。选定部13将关键词彼此之间的编辑距离作为类似度。
也可以使用事先制作出的替换表达词典来决定类似度。替换表达词典包括多个关键词的组。各组包括多个关键词。各组所包含的多个关键词为相互类似的替换表达。例如,选定部13将一个组所包含的关键词彼此之间的类似度设为1,将其它关键词彼此之间的类似度设为0。
也可以使用事先学习的分散表达模型来决定类似度。分散表达模型记述有单词的分散表达。选定部13根据各关键词的矢量彼此之间的余弦类似度或者距离,决定类似度。
通过选定包含与查询关键词类似的提问关键词的提问回答对,从而更加容易地选定包含与用户的询问对应的提问的提问回答对。由此,用户更加容易地得到想要的回答。
图11是示出第2实施方式的对话系统的动作的示意图。
图11示出基于用户US和对话系统2的对话。例如,对话系统2当检测到用户US时,输出文章TX1“请输入提问”。用户US将文章TX2“关于存款账户”输入到对话系统2。对话系统2将文章TX2(查询文章)分解为多个单词,推测各单词的词类。对话系统2根据词类从文章TX2抽取“存款账户”作为查询关键词。对话系统2从提问回答集选定作为提问关键词而登记有“存款账户”的提问回答对。
作为一个例子,对话系统2选定包含“存款账户”以及“申请”的提问关键词的提问回答对、包含“存款账户”以及“注销”的提问关键词的提问回答对、及包含“存款账户”以及“余额确认”的提问关键词的提问回答对这3个提问回答对。对话系统2根据该选定结果输出文章TX3“有追加的关键词吗?关于申请、关于注销、关于余额确认等”。文章TX3对应于第2响应。
在文章TX3中,与提问关键词对应的单词也可以以能够与其它单词区分的方式输出。例如,在从对话系统2输出的响应显示于监视器的情况下,与提问关键词对应的单词相比于其它单词更粗地、被附加下划线地或者被着色地显示。也可以与提问关键词对应的单词以能够点击的方式显示。也可以当用户US点击与提问关键词对应的单词时,包含该提问关键词的接下来的文章自动地被输入到对话系统2。在从对话系统2输出的响应作为声音而输出的情况下,与提问关键词对应的单词相比于其它单词,音量大或者缓慢地读出。
用户US根据文章TX3将文章TX4“申请(用日文表达:申込)”输入到对话系统2。对话系统2根据文章TX4将“申请(用日文表达:申込)”设定为查询关键词。对话系统2使用基于文章TX4的查询关键词,进一步选定先选定的提问回答对的一部分。例如,基于文章TX4的查询关键词“申请(用日文表达:申込)”与提问关键词“申请(用日文表达:申し込み)”类似。对话系统2从上述3个提问回答对选定包含“存款账户”以及“申请(用日文表达:申し込み)”的提问关键词的提问回答对。提问回答对的数量被缩小为一个,所以对话系统2输出表示该提问回答对所包含的回答的文章TX5“您的提问是‘想要申请存款账户’吧。‘账户的申请…’”。文章TX5对应于第1响应。
抽取部42也可以在从提问回答集抽取提问关键词时,决定表示各提问关键词的重要性的评分。选定部13根据评分选定提问回答对。
关于提问关键词的评分,包含该提问关键词的提问回答对的数量越少,则设定得越高。评分高的关键词不怎么包含于提问回答集,对于提问回答对的选定是有用的。设定部12通过提问回答集中的出现频度、提问回答集中的逆文档频度或者bm25等手法来决定各提问关键词的评分。例如,设定部12计算包含该提问关键词的提问回答对的数量相对于提问回答集所包含的提问回答对的总数的比例。设定部12将该比例的倒数(逆文档频度)作为评分。或者,设定部12也可以将根据该比例而设定的数值作为评分。例如,设定部12也可以利用对数函数将比例的倒数进行变换,将得到的数值作为评分。
作为具体的一个例子,提问回答集如图2所示由4个提问回答对110a、110b、110c以及110K构成。在该提问回答集中,包含“存款账户”的提问回答对为3个。“存款账户”的评分被设定为3/4的倒数即4/3。同样地,“余额确认”的评分被设定为1/4的倒数即4/1。“申请”的评分被设定为2/4的倒数即4/2。
选定部13当选定包含查询关键词的提问回答对时,关于所选定的各提问回答对,参照与查询关键词对应的提问关键词的评分。对包含与查询关键词对应的提问关键词的提问回答对赋予对该提问关键词设定的评分。选定部13针对每个提问回答对计算评分的合计。选定部13从包含查询关键词的提问回答对选定评分的合计超过阈值(第2阈值)的提问回答对。生成部14根据评分的合计超过阈值的提问回答对的数量生成响应。
例如,设定部12将由用户输入的查询文章的一部分设定为第1查询关键词,将查询文章的另一部分设定为第2查询关键词。选定部13对包含与第1查询关键词对应的提问关键词的一个以上的提问回答对赋予对该提问关键词设定的评分。选定部13对包含与第2查询关键词对应的其它提问关键词的一个以上的提问回答对赋予对该其它提问关键词设定的评分。选定部13选定赋予的评分超过阈值的一个以上的提问回答对。
通过根据评分选定提问回答对,能够缩小提问回答对的数量。另外,能够通过基于评分的选定来抑制用户想要的回答从选定中落下。因此,用户更加容易地得到想要的回答。
处理部10也可以判定查询文章是否为否定句。例如,设定部12在设定查询关键词时,判断查询文章是否为否定句。当由设定部12判断为查询文章是否定句时,选定部13选定不包含该查询关键词的提问回答对。
例如,在对话系统2输出文章TX3之后,用户输入“不是注销和余额确认”这样的查询文章。设定部12从该查询文章抽取“注销”以及“余额确认”作为查询关键词。进而,设定部12判断为该查询文章是否定句。选定部13根据该判断结果,从先选定的3个提问回答对选定不包含“注销”以及“余额确认”的提问关键词的提问回答对。其结果,对话系统2输出文章TX5。
为了判断查询文章是否为否定句,设定部12例如参照事先制作出的规则。作为一个例子,规则如“当在查询文章中包含“并非”、“不是”或者“以外”时,查询文章为否定句”等那样记述。设定部12通过判断查询文章是否满足规则中记述的条件,判定查询文章是否为否定句。
设定部12也可以参照事先制作出的模型。例如,模型为人工神经网络模型或者递归神经网络模型。事先使用学习数据来学习模型。学习数据包含多个配对数据。各配对数据包含文章和表示该文章为否定形式的信息。模型被学习成当输入否定句时输出表示是否定句的信息。
(变形例)
图12是例示第2实施方式的变形例的对话系统的示意图。
在变形例的对话系统2a中,在由用户询问之前,事先生成任务用模型。任务用模型由处理部40生成。例如,对话系统2a包括处理部40。处理部40将所生成的任务用模型存储于第3存储部23。
在对话系统2a中,处理部40包括取出部41、抽取部42以及生成部43。处理部10包括受理部11、设定部12以及选定部13。
取出部41访问第1存储部21,从提问回答集取出一个提问回答对。抽取部42依照存储于第4存储部24的模型或者规则,从提问回答对抽取提问关键词。抽取部42将抽取出的提问关键词例如存储于第1存储部21。生成部43根据抽取出的提问关键词生成任务用场景,更新任务用模型。由生成部43进行的处理与图7所示的流程图的步骤S123~S126相同。
处理部10使用任务用模型,输出针对由用户输入的查询文章的响应。对话系统2a中的处理部10的处理与图8所示的流程图相同。
根据变形例的对话系统2a,与对话系统1a同样地,在处理部10受理查询文章之前,生成包括多个任务用场景的任务用模型。因此,例如,能够降低受理了查询文章之后的处理部10的处理负荷。
在对话系统2a中,抽取部42也可以在从提问回答集抽取提问关键词时,决定表示各提问关键词的重要度的评分。选定部13根据评分从任务用模型选定任务用场景。
作为一个例子,设定部12从由用户输入的查询文章抽取两个查询关键词(第1查询关键词以及第2查询关键词)。任务用模型包括包含与第1查询关键词对应的第1提问关键词的任务用场景和包含与第2查询关键词对应的第2提问关键词的任务用场景。在任务用模型中,未包括包含第1提问关键词以及第2提问关键词这两方的任务用场景。
在该例中,选定部13在选定一个任务用场景时,比较第1提问关键词的评分和第2提问关键词的评分。选定部13选定包含评分更高的提问关键词的任务用场景。选定部13将所选定的任务用场景作为响应而输出。
图13是说明第2实施方式的对话系统的动作的示意图。
图13的上层例示出用户与对话系统的对话。图13的中层例示出提问回答集。图13的下层例示出任务用模型。
提问回答集例如由图13所示的6个提问回答对构成。各提问包含“网上银行”、“海外”、以及“汇款”中的任意的提问关键词。在提问回答集中,未包含全部包括“网上银行”、“海外”以及“汇款”的提问。在该情况下,处理部40生成与“网上银行”的提问关键词对应的任务用场景、与“海外”的提问关键词对应的任务用场景以及与“汇款”的提问关键词对应的任务用场景。
在为了生成任务用场景而从提问回答集抽取提问关键词时,抽取部42决定各提问关键词的评分。在图13的例子中,包含“网上银行”的提问(回答候补)为两个。包含“海外”的提问为3个。包含“汇款”的提问为1个。将相对于所选定的提问回答对的数量(6)的包含各查询关键词的提问的数量作为评分。“网上银行”的评分为6/2。“海外”的评分为6/3。“汇款”的评分为6/1。
用户US如图13所示将“能够通过网上银行向海外汇款吗?”输入到对话系统2a。设定部12从该查询文章抽取“网上银行”、“海外”以及“汇款”作为查询关键词。选定部13从任务用模型抽取与“网上银行”、“海外”以及“汇款”中的任意的提问关键词对应地生成的任务用场景。
选定部13将多个任务用场景的一个任务用场景作为响应而输出。选定部13为了从多个任务用场景选定一个任务用场景,比较与各任务用场景对应的提问关键词的评分。评分的比较结果,判断为“汇款”的评分最高。选定部13将与“汇款”对应的任务用场景作为响应而输出。
图14是例示实施方式的对话装置的结构的示意图。
上述各实施方式的对话系统例如由图14所示的对话装置3实现。对话装置3作为一个例子,由与一般的计算机(信息处理装置)同样的硬件结构实现。对话装置3包括CPU(Central Processing Unit,中央处理单元)91、输入部92、输出部93、ROM(Read OnlyMemory,只读存储器)94、RAM(Random Access Memory,随机存取存储器)95、存储部96、通信装置97以及总线98。各部由总线98连接。
CPU91与预先存储于ROM94或者存储部96的各种程序协作而执行各种处理,集中地控制构成对话装置3的各部的动作。CPU91在处理中将RAM95的预定区域用作工作区域。CPU91与预先存储于ROM94或者存储部96的程序协作,实现输入部92、输出部93以及通信装置97等。
输入部92例如包括键盘、麦克风以及触摸面板中的至少任意个。输入部92受理从用户输入的信息作为指示信号,将该指示信号输出到CPU91。输出部93例如包括监视器、扬声器以及打印机中的至少任意个。输出部93根据从CPU91输出的信号输出各种信息。
ROM94以无法改写的方式存储用于对话装置3的控制的程序以及各种设定信息等。RAM95为SDRAM(Synchronous Dynamic Random Access Memory,同步动态随机存取存储器)等易失性的存储介质。RAM95作为CPU91的工作区域发挥功能。具体而言,作为临时存储对话装置3使用的各种变量以及参数等的缓冲器等发挥功能。
存储部96为闪存存储器等基于半导体的存储介质、能够磁性地或者光学地记录的存储介质等能够改写的记录装置。存储部96存储用于对话装置3的控制的程序以及各种设定信息等。存储部96作为第1存储部21~第4存储部24发挥功能。通信装置97用于与外部的设备进行通信来进行信息的收发。
实施方式也可以包括以下的技术方案。
(技术方案1)
一种对话系统,具备处理部,
该处理部当由用户输入包含一个以上的单词的第1文章时,将所述一个以上的单词中的至少一部分设定为第1查询关键词,
从包含多个包含提问和针对所述提问的回答的提问回答对的提问回答集选定包含所述第1查询关键词的一个以上的所述提问回答对,
在所选定的所述提问回答对的数量为1时,输出表示所选定的所述提问回答对所包含的所述回答的第1响应,在所述数量为第1阈值以上时,输出第2响应,该第2响应包括从所选定的所述提问回答对的一个提问回答对所包含的多个提问关键词抽取出的第1提问关键词和从所选定的所述提问回答对的另一个提问回答对所包含的其它多个提问关键词抽取出的第2提问关键词。
(技术方案2)
根据技术方案1所记载的对话系统,其中,
所述处理部当在输出所述第2响应之后受理了包含所述第1提问关键词以及所述第2提问关键词的一方的第2文章时,输出表示包含所述第1提问关键词以及所述第2提问关键词的所述一方的所述提问回答对所包含的所述回答的响应。
(技术方案3)
根据技术方案1或者2所记载的对话系统,其中,
所述第1阈值为3以上,
所述处理部在所述数量为2以上且小于所述第1阈值时,输出包括所选定的所述提问回答对各自所包含的多个所述提问的第3响应。
(技术方案4)
根据技术方案1~3中的任意一项所记载的对话系统,其中,
所述处理部在所述提问回答对的选定中,
根据所述第1查询关键词与所述提问回答集的多个所述提问所包含的多个提问关键词之间的各自的类似度,从所述多个提问关键词抽取与所述第1查询关键词类似的第1类似关键词,
从所述提问回答集选定包含所述第1查询关键词以及所述第1类似关键词中的至少任意关键词的一个以上的所述提问回答对。
(技术方案5)
根据技术方案1~4中的任意一项所记载的对话系统,其中,
所述处理部在所述第1查询关键词的设定中,
将所述第1文章分割为所述一个以上的单词,
推测所述一个以上的单词各自的词类,
将所述一个以上的单词所包含的动词、名词以及未知词的一个设定为所述第1查询关键词。
(技术方案6)
一种对话系统,具备处理部,
该处理部当由用户输入包含多个单词的第1文章时,将所述多个单词的一部分设定为第1查询关键词,将所述多个单词的另一部分设定为第2查询关键词,
参照第1存储部,该第1存储部存储有包含多个包含提问和针对所述提问的回答的提问回答对的提问回答集,对多个所述提问所包含的多个提问关键词分别设定有评分,
对包含与所述第1查询关键词对应的所述多个提问关键词的一个提问关键词的一个以上的所述提问回答对赋予对所述多个提问关键词的所述一个提问关键词设定的评分,对包含与所述第2查询关键词对应的所述多个提问关键词的另一个提问关键词的一个以上的所述提问回答对赋予对所述多个提问关键词的另一个提问关键词设定的评分,
选定赋予的评分超过第2阈值的一个以上的所述提问回答对,
在所选定的所述提问回答对的数量为1时,输出表示所选定的所述提问回答对所包含的所述回答的第1响应,在所述数量为第1阈值以上时,输出第2响应,该第2响应包括从所选定的所述提问回答对的一个提问回答对所包含的多个提问关键词抽取出的第1提问关键词和从所选定的所述提问回答对的另一个提问回答对所包含的多个其它提问关键词抽取出的第2提问关键词。
(技术方案7)
一种对话方法,
当由用户输入包含一个以上的单词的第1文章时,将所述一个以上的单词中的至少一部分设定为第1查询关键词,
从包含多个包含提问和针对所述提问的回答的提问回答对的提问回答集选定包含所述第1查询关键词的一个以上的所述提问回答对,
在所选定的所述提问回答对的数量为1时,输出表示所选定的所述提问回答对所包含的所述回答的第1响应,在所述数量为第1阈值以上时,输出第2响应,该第2响应包括从所选定的所述提问回答对的一个提问回答对所包含的多个提问关键词抽取出的第1提问关键词和从所选定的所述提问回答对的另一个提问回答对所包含的其它多个提问关键词抽取出的第2提问关键词。
(技术方案8)
一种程序,使处理部执行如下步骤:
当由用户输入包含一个以上的单词的第1文章时,将所述一个以上的单词中的至少一部分设定为第1查询关键词,
从包含多个包含提问和针对所述提问的回答的提问回答对的提问回答集选定包含所述第1查询关键词的一个以上的所述提问回答对,
在所选定的所述提问回答对的数量为1时,输出表示所选定的所述提问回答对所包含的所述回答的第1响应,在所述数量为第1阈值以上时,输出第2响应,该第2响应包括从所选定的所述提问回答对的一个提问回答对所包含的多个提问关键词抽取出的第1提问关键词和从所选定的所述提问回答对的另一个提问回答对所包含的其它多个提问关键词抽取出的第2提问关键词。
(技术方案9)
一种存储介质,
存储有技术方案8所记载的程序。
根据以上说明的各实施方式,能够更容易地构建能够与用户对话的对话系统。根据各实施方式,能够提供用户更加容易地得到想要的回答的对话系统、对话方法、程序以及存储介质。
上述各种数据的处理例如基于程序(软件)来执行。例如,计算机存储该程序,读出该程序,从而进行上述各种信息的处理。
上述各种信息的处理也可以作为能够使计算机执行的程序而记录于磁盘(柔性磁盘以及硬盘等)、光盘(CD-ROM、CD-R、CD-RW、DVD-ROM、DVD±R、DVD±RW等)、半导体存储器、或者其它记录介质。
例如,记录于记录介质的信息能够由计算机(或者嵌入式系统)读出。在记录介质中,记录形式(存储形式)是任意的。例如,计算机从记录介质读出程序,使CPU基于该程序执行记述于程序的指示。在计算机中,程序的获取(或者读出)也可以经由网络进行。
也可以在基于从记录介质安装到计算机(或者嵌入式系统)的程序在计算机上运行的各种软件中,实施上述信息的处理中的至少一部分。该软件例如包括OS(操作系统)等。该软件例如也可以包括在网络上进行动作的中间件等。
实施方式的记录介质存储有能够使计算机执行上述各种信息的处理的程序。在实施方式的记录介质中,还包括利用LAN或者因特网等下载程序而存储的记录介质。也可以基于多个记录介质进行上述处理。
实施方式的计算机包括一个或者多个装置(例如个人计算机等)。实施方式的计算机也可以包括由网络连接的多个装置。
以上,参照具体例,说明了本发明的实施方式。但是,本发明的实施方式并不限定于这些具体例。例如,关于对话系统所包含的处理部、存储部等各要素的具体结构,只要能够通过由本领域技术人员从公知的范围适当地选择而同样地实施本发明,得到同样的效果,就包含于本发明的范围。
另外,在技术上能够实现的范围组合各具体例中的任意两个以上的要素的例子也只要包含本发明的要旨,就包含于本发明的范围。
除此之外,作为本发明的实施方式,以上述对话系统、对话方法、程序以及存储介质为基础,本领域技术人员能够适当地设计变更而实施的所有的对话系统、对话方法、程序以及存储介质也只要包含本发明的要旨,就属于本发明的范围。
除此之外,在本发明的思想范畴,只要是本领域技术人员就能够想到各种变更例以及修正例,理解为这些变更例以及修正例也属于本发明的范围。
说明了本发明的几个实施方式,但这些实施方式是作为例子而提示的,未意图限定发明的范围。这些新的实施方式能够以其它各种方式被实施,能够在不脱离发明的要旨的范围进行各种省略、置换、变更。这些实施方式及其变形包含于发明的范围、要旨,并且包含于专利权利要求书所记载的发明及与其均等的范围。

Claims (8)

1.一种对话系统,具备处理部,
该处理部当由用户输入包含一个以上的单词的第1文章时,将所述一个以上的单词中的至少一部分设定为第1查询关键词,
从包含多个组合的提问回答集选定包含所述第1查询关键词的一个以上的提问回答对,所述组合是包含提问和针对所述提问的回答的所述提问回答对以及与所述提问回答对关联起来的多个提问关键词的组合,
在所选定的所述提问回答对的数量为1时,输出表示所选定的所述提问回答对所包含的所述回答的第1响应,
在所述数量为第1阈值以上时,从与所选定的所述提问回答对的一个提问回答对关联起来的所述多个提问关键词抽取出与所述第1查询关键词不同的第1提问关键词,从与所选定的所述提问回答对的另一个提问回答对关联起来的其它所述多个提问关键词抽取出与所述第1查询关键词不同的第2提问关键词,输出包含所述第1提问关键词和所述第2提问关键词的第2响应,
所述处理部在生成所述第1响应和所述第2响应时,使用分别包含空白的多个场景模板,
所述第1响应通过在所述多个场景模板的一个场景模板的所述空白处填入被选定的所述提问回答对所包含的所述回答来生成,
所述第2响应通过在所述多个场景模板的另一个场景模板的所述空白处填入所述第1提问关键词和所述第2提问关键词来生成。
2.根据权利要求1所述的对话系统,其中,
所述处理部当在输出所述第2响应之后受理了包含所述第1提问关键词以及所述第2提问关键词的一方的第2文章时,输出表示包含所述第1提问关键词以及所述第2提问关键词的所述一方的所述提问回答对所包含的所述回答的响应。
3.根据权利要求1或者2所述的对话系统,其中,
所述第1阈值为3以上,
所述处理部在所述数量为2以上且小于所述第1阈值时,输出包括所选定的所述提问回答对各自所包含的多个所述提问的第3响应。
4.根据权利要求1或者2所述的对话系统,其中,
所述处理部在所述提问回答对的选定中,
根据所述第1查询关键词与所述提问回答集的多个所述提问所包含的多个提问关键词之间的各自的类似度,从所述多个提问关键词抽取与所述第1查询关键词类似的第1类似关键词,
从所述提问回答集选定包含所述第1查询关键词以及所述第1类似关键词中的至少任意关键词的一个以上的所述提问回答对。
5.根据权利要求1或者2所述的对话系统,其中,
所述处理部在所述第1查询关键词的设定中,
将所述第1文章分割为所述一个以上的单词,
推测所述一个以上的单词各自的词类,
将所述一个以上的单词所包含的动词、名词以及未知词的一个设定为所述第1查询关键词。
6.一种对话系统,具备处理部,
该处理部当由用户输入包含多个单词的第1文章时,将所述多个单词的一部分设定为第1查询关键词,将所述多个单词的另一部分设定为第2查询关键词,
参照第1存储部,第1存储部存储有包含多个组合的提问回答集,对多个提问关键词分别设定有评分,所述组合是包含提问和针对所述提问的回答的提问回答对以及与所述提问回答对关联起来的所述多个提问关键词的组合,
对包含与所述第1查询关键词对应的所述多个提问关键词的一个提问关键词的一个以上的所述提问回答对赋予对所述多个提问关键词的所述一个提问关键词设定的评分,对包含与所述第2查询关键词对应的所述多个提问关键词的另一个提问关键词的一个以上的所述提问回答对赋予对所述多个提问关键词的另一个提问关键词设定的评分,
选定所赋予的评分超过第2阈值的一个以上的所述提问回答对,
在所选定的所述提问回答对的数量为1时,输出表示所选定的所述提问回答对所包含的所述回答的第1响应,
在所述数量为第1阈值以上时,从与所选定的所述提问回答对的一个提问回答对关联起来的所述多个提问关键词抽取出与所述第1查询关键词不同的第1提问关键词,从与所选定的所述提问回答对的另一个提问回答对关联起来的其它所述多个提问关键词抽取出与所述第1查询关键词不同的第2提问关键词,输出包含所述第1提问关键词和所述第2提问关键词的第2响应,
所述处理部在生成所述第1响应和所述第2响应时,使用分别包含空白的多个场景模板,
所述第1响应通过在所述多个场景模板的一个场景模板的所述空白处填入被选定的所述提问回答对所包含的所述回答来生成,
所述第2响应通过在所述多个场景模板的另一个场景模板的所述空白处填入所述第1提问关键词和所述第2提问关键词来生成。
7.一种对话方法,
使处理部执行:
当由用户输入包含一个以上的单词的第1文章时,将所述一个以上的单词中的至少一部分设定为第1查询关键词,
从包含多个组合的提问回答集选定包含所述第1查询关键词的一个以上的提问回答对,所述组合是包含提问和针对所述提问的回答的所述提问回答对以及与所述提问回答对关联起来的多个提问关键词的组合,
在所选定的所述提问回答对的数量为1时,输出表示所选定的所述提问回答对所包含的所述回答的第1响应,
在所述数量为第1阈值以上时,从与所选定的所述提问回答对的一个提问回答对关联起来的所述多个提问关键词抽取出与所述第1查询关键词不同的第1提问关键词,从与所选定的所述提问回答对的另一个提问回答对关联起来的其它所述多个提问关键词抽取出与所述第1查询关键词不同的第2提问关键词,输出包含所述第1提问关键词和所述第2提问关键词的第2响应,
在生成所述第1响应和所述第2响应时,使所述处理部使用分别包含空白的多个场景模板,
所述第1响应通过在所述多个场景模板的一个场景模板的所述空白处填入被选定的所述提问回答对所包含的所述回答来生成,
所述第2响应通过在所述多个场景模板的另一个场景模板的所述空白处填入所述第1提问关键词和所述第2提问关键词来生成。
8.一种存储有程序的存储介质,所述程序使处理部执行:
当由用户输入包含一个以上的单词的第1文章时,将所述一个以上的单词中的至少一部分设定为第1查询关键词,
从包含多个组合的提问回答集选定包含所述第1查询关键词的一个以上的提问回答对,所述组合是包含提问和针对所述提问的回答的所述提问回答对以及与所述提问回答对关联起来的多个提问关键词的组合,
在所选定的所述提问回答对的数量为1时,输出表示所选定的所述提问回答对所包含的所述回答的第1响应,
在所述数量为第1阈值以上时,从与所选定的所述提问回答对的一个提问回答对关联起来的所述多个提问关键词抽取出与所述第1查询关键词不同的第1提问关键词,从与所选定的所述提问回答对的另一个提问回答对关联起来的其它所述多个提问关键词抽取出与所述第1查询关键词不同的第2提问关键词,输出包含所述第1提问关键词和所述第2提问关键词的第2响应,
在生成所述第1响应和所述第2响应时,使所述处理部使用分别包含空白的多个场景模板,
所述第1响应通过在所述多个场景模板的一个场景模板的所述空白处填入被选定的所述提问回答对所包含的所述回答来生成,
所述第2响应通过在所述多个场景模板的另一个场景模板的所述空白处填入所述第1提问关键词和所述第2提问关键词来生成。
CN201910849865.8A 2019-01-30 2019-09-10 对话系统、对话方法、程序以及存储介质 Active CN111506712B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019014417A JP2020123131A (ja) 2019-01-30 2019-01-30 対話システム、対話方法、プログラム、及び記憶媒体
JP2019-014417 2019-01-30

Publications (2)

Publication Number Publication Date
CN111506712A CN111506712A (zh) 2020-08-07
CN111506712B true CN111506712B (zh) 2023-11-07

Family

ID=71732636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910849865.8A Active CN111506712B (zh) 2019-01-30 2019-09-10 对话系统、对话方法、程序以及存储介质

Country Status (3)

Country Link
US (1) US11282521B2 (zh)
JP (1) JP2020123131A (zh)
CN (1) CN111506712B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022521040A (ja) * 2019-02-25 2022-04-05 フォルシアクラリオン・エレクトロニクス株式会社 ハイブリッド音声対話システム及びハイブリッド音声対話方法
JP7196122B2 (ja) 2020-02-18 2022-12-26 株式会社東芝 インタフェース提供装置、インタフェース提供方法およびプログラム
JP2022047291A (ja) 2020-09-11 2022-03-24 株式会社東芝 情報処理装置、方法、及びプログラム
US11921712B2 (en) * 2020-10-05 2024-03-05 MeetKai, Inc. System and method for automatically generating question and query pairs
CN113553412B (zh) * 2021-06-30 2023-07-25 北京百度网讯科技有限公司 问答处理方法、装置、电子设备和存储介质
CN113506585A (zh) * 2021-09-09 2021-10-15 深圳市一号互联科技有限公司 一种语音通话的质量评估方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012248161A (ja) * 2011-05-31 2012-12-13 Oki Electric Ind Co Ltd 対話型検索システム及びプログラム、並びに、対話シナリオ生成システム及びプログラム
CN106663125A (zh) * 2014-08-21 2017-05-10 国立研究开发法人情报通信研究机构 提问句生成装置以及计算机程序
WO2018066489A1 (ja) * 2016-10-07 2018-04-12 国立研究開発法人情報通信研究機構 ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム
CN107949841A (zh) * 2015-08-31 2018-04-20 国立研究开发法人情报通信研究机构 提问应答系统的训练装置以及该训练装置用的计算机程序
CN108153800A (zh) * 2016-12-06 2018-06-12 松下知识产权经营株式会社 信息处理方法、信息处理装置以及程序

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4162223B2 (ja) * 2003-05-30 2008-10-08 日本電信電話株式会社 自然文検索装置、その方法及びプログラム
JP4075067B2 (ja) * 2004-04-14 2008-04-16 ソニー株式会社 情報処理装置および情報処理方法、並びに、プログラム
JP2005352534A (ja) * 2004-06-08 2005-12-22 Fujitsu Ltd マルチベンダサポートシステム及びサポート方法
CN102903008B (zh) * 2011-07-29 2016-05-18 国际商业机器公司 用于计算机问答的方法及系统
JP5857090B2 (ja) * 2014-05-26 2016-02-10 ソフトバンク株式会社 情報検索装置、情報検索プログラム、及び情報検索システム
US11055745B2 (en) * 2014-12-10 2021-07-06 Adobe Inc. Linguistic personalization of messages for targeted campaigns
US9471668B1 (en) * 2016-01-21 2016-10-18 International Business Machines Corporation Question-answering system
US10901992B2 (en) * 2017-06-12 2021-01-26 KMS Lighthouse Ltd. System and method for efficiently handling queries
JP6998680B2 (ja) * 2017-06-13 2022-01-18 株式会社野村総合研究所 対話型業務支援システムおよび対話型業務支援プログラム
JP7132090B2 (ja) * 2018-11-07 2022-09-06 株式会社東芝 対話システム、対話装置、対話方法、及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012248161A (ja) * 2011-05-31 2012-12-13 Oki Electric Ind Co Ltd 対話型検索システム及びプログラム、並びに、対話シナリオ生成システム及びプログラム
CN106663125A (zh) * 2014-08-21 2017-05-10 国立研究开发法人情报通信研究机构 提问句生成装置以及计算机程序
CN107949841A (zh) * 2015-08-31 2018-04-20 国立研究开发法人情报通信研究机构 提问应答系统的训练装置以及该训练装置用的计算机程序
WO2018066489A1 (ja) * 2016-10-07 2018-04-12 国立研究開発法人情報通信研究機構 ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム
CN108153800A (zh) * 2016-12-06 2018-06-12 松下知识产权经营株式会社 信息处理方法、信息处理装置以及程序

Also Published As

Publication number Publication date
US11282521B2 (en) 2022-03-22
JP2020123131A (ja) 2020-08-13
CN111506712A (zh) 2020-08-07
US20200243082A1 (en) 2020-07-30

Similar Documents

Publication Publication Date Title
CN111506712B (zh) 对话系统、对话方法、程序以及存储介质
US10410625B2 (en) Machine learning dialect identification
KR102417045B1 (ko) 명칭을 강인하게 태깅하는 방법 및 시스템
US7925506B2 (en) Speech recognition accuracy via concept to keyword mapping
US7831911B2 (en) Spell checking system including a phonetic speller
EP2317508B1 (en) Grammar rule generation for speech recognition
US7742922B2 (en) Speech interface for search engines
CN111177359A (zh) 多轮对话方法和装置
JP7111154B2 (ja) 回答選択装置、回答選択方法、回答選択プログラム
US20090158175A1 (en) Communication support method, system, and server device
JP2007517338A (ja) サーチ品質の改善システムおよび改善方法
CN101952824A (zh) 计算机执行的对数据库中的文献进行索引和检索的方法以及信息检索系统
EP2672395A1 (en) Transliteration device, program, recording medium, and method
KR101410601B1 (ko) 유머 발화를 이용하는 음성 대화 시스템 및 그 방법
CN110287286B (zh) 短文本相似度的确定方法、装置及存储介质
JP2015219582A (ja) 対話方法、対話装置、対話プログラム及び記録媒体
US9223833B2 (en) Method for in-loop human validation of disambiguated features
US11630951B2 (en) Language autodetection from non-character sub-token signals
CN109002454B (zh) 一种确定目标单词的拼读分区的方法和电子设备
WO2022143349A1 (zh) 一种确定用户意图的方法及装置
JP7319504B2 (ja) 対話システム、対話方法、プログラム、及び記憶媒体
CA2981426A1 (en) System and methods for improving accuracy of speech recognition
Allauzen et al. Voice query refinement
US20230418873A1 (en) Query interpreter training with adversarial table perturbations
JP7485986B2 (ja) 情報処理方法、情報処理装置、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant