CN101510197A - 信息检索系统 - Google Patents

信息检索系统 Download PDF

Info

Publication number
CN101510197A
CN101510197A CNA2008101763599A CN200810176359A CN101510197A CN 101510197 A CN101510197 A CN 101510197A CN A2008101763599 A CNA2008101763599 A CN A2008101763599A CN 200810176359 A CN200810176359 A CN 200810176359A CN 101510197 A CN101510197 A CN 101510197A
Authority
CN
China
Prior art keywords
user
information
dialogue
attribute
scheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008101763599A
Other languages
English (en)
Inventor
村田稔树
北村美穗子
介弘达哉
山本刚史
福岛直士
下畑纱遥利
池野笃司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Publication of CN101510197A publication Critical patent/CN101510197A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供信息检索系统。用户发话解析单元针对多个属性分别向用户提出提问语句,根据来自用户的回答语句,对针对各个所述属性的属性值进行解析。用户数据保持单元保持将所述多个属性和针对各个所述属性的用户的属性值对应起来的用户数据,作为解析结果。匹配单元针对所有属性,在从用户的回答得到的所述属性值的取得比例在规定值以上的情况下,从多个对象数据中选出与各个所述属性和各个所述属性值相匹配的至少一个对象数据候选。对话控制单元向用户侧输出所选出的各个所述对象数据候选。

Description

信息检索系统
技术领域
本发明涉及信息检索系统中所包含的装置、应用于信息检索系统的方法、以及存储了程序的存储介质。
背景技术
随着信息化社会的发展,从存在于网络上的大量且多样的信息中查找必要信息的信息解析技术、信息检索技术不限于信息产业,而成为与通信、媒介、广告、内容、流通等灵活应用信息的所有产业强化竞争力直接联系的重要课题。
作为检索存在于网络上的信息的信息解析/信息检索系统,例如,谷歌(Google,注册商标)和雅虎(Yahoo,注册商标)等各种系统已经实用化。
在这些信息解析/信息检索系统中,一般从所输入的关键字的命中件数多的信息开始从上到下顺序介绍。因此,用户为了检索希望的信息,需要正确地输入信息关键字,但是,有时不清楚输入什么样的关键字更好。
因此,作为解决这种课题的技术,例如考虑采用关键字自动扩展技术和推荐系统等,其中,该关键字自动扩展技术显示与输入关键字一起使用的关键字,该推荐系统根据大多数用户口头相传的信息来例如介绍商品。
但是,上述这种技术介绍大多数用户推荐的代表性的信息,不一定能介绍各个用户的个性化的具体信息。
因此,提出了如下的信息解析/信息检索技术:其能够与用户之间相互对话,在该对话中反复进行逐渐深入的询问,由此提取出用户真正希望的需要和价值观,来检索该用户潜在意向的信息。这里所谓的潜在意向是指,人自身没有明确地意识到,也无法明确地对他人进行说明,但是却模糊地存在着的希望、要求或期待,也可称为潜在要求或真正的希望。
如上所述,在对用户的潜在意向进行解析来检索与该潜在意向对应的信息的系统中,需要从与用户相互的对话中,正确地提取与系统的属性信息相匹配的用户潜在意向信息。
在日本特开2003-036271号公报中记载了涉及对话型信息检索方法的技术,在该方法中,蓄积具有由多个属性及其属性值构成的数据结构的数据,输入用户希望取得的目标属性、用于缩小数据范围的关键属性、以及关键属性的属性值,使用关键属性和关键属性的属性值来检索目标属性的属性值,输出检索结果。
而且,日本特开2003-036271号公报记载的技术在检索目标属性的属性值之前,根据所输入的关键属性和关键属性的属性值,计算目标属性的属性值的分布程度,进行控制以使仅在分布程度收敛于规定范围内的情况下输出检索结果。
但是,在现在提出的信息解析/信息检索技术中,从与用户的对话中提取用户的潜在意向,所以,需要反映与用户之间的对话结果和检索对象数据之间的匹配结果,来决定之后应该提问什么样的内容(属性)。
但是,日本特开2003-036271号公报记载的技术在检索目标属性的属性值之前,计算目标属性的属性值的分布程度,所以,虽然在检索前进行某种程度的缩小输入条件,但是,由于不参照关键属性的属性值和目标属性的属性值之间的匹配结果,所以,无法将匹配结果反映给之后的提问。其结果是,产生在对话中无法推荐不匹配的其他属性(检索对象数据)的问题。并且,产生无法考虑针对某个属性的用户的优先级和决断状况的问题。
因此,寻求如下的信息检索装置、方法以及程序匹配管理装置:能够在与用户的对话中,准确地判断用户的优先级和当前的匹配状况,取得最佳的匹配结果,能够参照该匹配结果,获得准确的检索结果。
在日本特开2000-276487号公报中记载了现有的关于对话型信息检索系统的技术。在日本特开2000-276487号公报中记载了如下技术:当对话次数变多时,缩小范围所需要的时间变多,且误识别变多,所以对对话次数进行优化。
但是,现在提出的信息解析/信息检索技术如上所述,以检索用户潜在意向的信息为目的,所以需要探听出用户本来潜在意向的内容。
该情况下,如果仅从用户探听出信息检索所需要的信息,则无法探出本来的用户潜在意向。例如,在某人和与其会话的人之间建立了信赖关系的情况下,某人才说出心里话。并且,当在展开会话的过程中换到其他话题时,才会坦率地说出之前话题的潜在意向。
为了在上述系统中进行这种行动,在与用户的对话中存在如下问题:如何进行对话?提出什么样的话题?与用户之间如何形成信赖感和安全感?
因此,寻求如下的对话管理装置、方法、程序、以及潜在意向提取系统:能够在用户和系统之间顺畅地展开对话,且能够在展开对话的过程中,给用户带来安全感和信赖感,由此提取用户本来的潜在意向。
在日本特开2000-276487号公报中记载了如下技术:蓄积过去发生的事例,从所蓄积的事例中检索与本次发生的事例类似的事例。
但是,上述日本特开2000-276487号公报记载的技术参照区域本体(ontology),根据事例语句的类似度进行聚类(cluster)并蓄积事例语句,求出与所输入的检索语句类似的事例语句的类似度,根据该类似度来检索聚类后的类似的事例语句。其中,在该区域本体中存储有蓄积事例和与存在于作为检索对象的区域中的术语和术语之间的关系有关的知识。
即,在上述日本特开2000-276487号公报记载的技术中,仅公开了一种从所蓄积的过去的事例语句中检索与当前的检索语句类似的事例语句的方法,所以,在从与用户展开的丰富多彩的对话中进行信息提取的情况下,产生无法进行适当的信息提取的问题。
因此,寻求能够从与用户展开的丰富多彩的对话中提取适当信息的信息提取装置、方法以及程序。
以往,作为对人类的发话(speech)进行解析来识别(提取)谓语和与其对应的语格要素并使用他们进行应答的装置,有日本特开2007-206888号公报记载的应答生成装置。在该现有装置中,针对用户的发话“……制作了居室的全部,包括餐具柜等。”,实现系统(装置)的发话“制作了餐具柜?”这样的应答。在日本特开2007-206888号公报记载的装置中,系统的发话候选准备多个,所以,能够随机选择,或者(针对根据发话候选的生成方法而分类的组)自由设定优先级来选择。此外,这里所谓的“发话”不仅包括用户发出声音进行交谈,还包括从键盘的输入。可以是通过麦克风等输入单元所输入的用户说出的语句,或是用户通过键盘等输入单元输入的语句、自然语言(用户所说的完整的语句)以及书面语言(由用户输入的不完整的语句)中的任一种。对于“对话”、“回答”等也同样,涵盖了用户发声的交谈以及键盘输入式的对话和回答等。
但是,作为对话型的信息检索装置,专利申请人研究、开发了阶梯(laddering)型检索装置。即,研究、开发了如下装置:该装置在与用户的对话中,反复进行逐渐深入的询问,由此引出用户的需要和价值观,来查找出与所引出的信息相匹配的服务和内容等。为了适当地引出用户的需要和价值观,要求利用自然的对话使用户抱有亲近感(亲切感)。
但是,上述现有装置是识别(提取)谓语和与其对应的语格要素并使用他们进行应答的方法,应答的生成方法是限制性的,无法有效地表现出亲近感。
并且,在现有装置中,谓语和语格要素仅保留中心语,在应答中不使用修饰语句。与谓语组合的语格要素在一个候选中仅使用一个。因此,无法充分地保证对话的自然性。
并且,在阶梯型检索装置中,准备几个以获得来自用户的信息为目的的发话(对用户询问的类别),需要系统主导性地改变话题,但是,在现有装置中,来自系统的发话是“对来自用户的发话进行承接的应答”或“单纯的附和”,对怎样使系统主导性地改变话题没有公开也未给出启示。
并且,在现有装置中,仅利用用户使用过的词汇,应答变得单调。
并且,在现有装置中,当既不存在谓语也不存在语格要素时,单独出现单纯的附和(“噢”或“真的?”),亲近感的表现并不强烈。
因此,寻求能够充分地表现出对人的亲近感并能够实现自然的对话(应答)的对话系统、方法以及程序。
发明内容
本发明的一个方式涉及信息检索装置、方法以及存储了程序的存储介质,例如可以应用于在对话型的信息检索系统中,利用匹配结果来决定与之后进行的对话有关的应答的信息检索装置、方法以及存储了程序的存储介质。
本发明的一个方式涉及对话管理装置、方法、存储了程序的存储介质以及潜在意向提取系统,例如可以应用于在信息检索系统中,从用户和系统的对话中提取用户潜在意向的对话管理装置、方法、存储了程序的存储介质以及潜在意向提取系统。
本发明的一个方式涉及信息提取装置、方法以及存储了程序的存储介质,例如可以应用于在信息检索系统中,从输入信息中提取规定的信息的信息提取系统。
本发明的一个方式涉及对话系统、方法以及程序,例如可以应用于对话型的信息检索系统。
本发明的第1方式是一种信息检索装置,该信息检索装置包含:
用户发话解析单元,其通过与用户的对话,针对多个属性分别向用户提出提问语句,根据用户针对该提问语句的回答语句,对针对各个所述属性的属性值进行解析;
用户数据保持单元,其保持用户数据,作为所述用户发话解析单元的解析结果,在所述用户数据中将所述多个属性和针对各个所述属性的用户的属性值对应起来;
匹配单元,其参照所述用户数据,针对所有属性,在从用户的回答得到的所述属性值的取得比例在规定值以上的情况下,从多个对象数据中选出与该用户数据的各个所述属性和各个所述属性值相匹配的至少一个对象数据候选;以及
对话控制单元,其向用户侧输出由所述匹配单元选出的各个所述对象数据候选。
本发明的第2方式是一种信息检索方法,该信息检索方法包含:
(a)通过与用户的对话,针对多个属性分别向用户提出提问语句,根据用户针对该提问语句的回答语句,对针对各个所述属性的属性值进行解析;
(b)保持用户数据,作为(a)中的解析结果,在所述用户数据中将所述多个属性和针对各个所述属性的用户的属性值对应起来;
(c)参照所述用户数据,针对所有属性,在从用户的回答得到的所述属性值的取得比例在规定值以上的情况下,从多个对象数据中选出与该用户数据的所述各个属性和各个所述属性值相匹配的至少一个对象数据候选;以及
(d)向用户侧输出在(c)中选出的各个所述对象数据候选。
本发明的第3方式是一种计算机可读取的存储介质,该存储介质包含可以使计算机执行信息检索指令的程序,其中,该指令包含:
(a)通过与用户的对话,针对多个属性分别向用户提出提问语句,根据用户针对所述提问语句的回答语句,对针对各个所述属性的属性值进行解析;
(b)保持将所述多个属性和针对各个所述属性的用户的属性值对应起来的用户数据,作为(a)中的解析结果;
(c)参照所述用户数据,针对所有属性,在从用户的回答得到的所述属性值的取得比例在规定值以上的情况下,从多个对象数据中选出与所述用户数据的各个所述属性和各个所述属性值相匹配的至少一个对象数据候选;以及
(d)向用户侧输出在(c)中选出的各个所述对象数据候选。
本发明的第4方式是一种对话管理装置,该对话管理装置包含:
对话方案数据库,其存储多个对话方案;
方案选择单元,其从所述对话方案数据库中选择与从信息请求单元所请求的信息有关的对话方案;
应答生成单元,其根据由所述方案选择单元所选择的所述对话方案,生成与所述所请求的信息有关的应答语句,将该应答语句提供给用户终端;
行动决定单元,其从回答语句解析单元接受属性和针对所述属性的属性值作为回答语句解析结果,根据所述属性和所述属性值,从所述对话方案数据库中检索符合应答条件的至少一个所述对话方案,按照各个所述对话方案决定之后的行动,其中,回答语句解析单元对针对所述应答语句的用户回答语句进行解析;以及
对话控制单元,其按照由所述行动决定单元所决定的之后的行动,进行与用户之间的对话控制。
本发明的第5方式是一种对话管理方法,该对话管理方法包含:
(a)从对话方案数据库中选择与从信息请求单元所请求的信息有关的对话方案;
(b)根据在(a)中所选择的所述对话方案,生成与所述所请求的信息有关的应答语句,将所述应答语句提供给用户终端;
(c)从回答语句解析单元接受属性和针对所述属性的属性值作为回答语句解析结果,根据所述属性和所述属性值,从所述对话方案数据库中检索符合应答条件的至少一个所述对话方案,按照各个所述对话方案决定之后的行动,其中,所述回答语句解析单元对针对所述应答语句的用户回答语句进行解析;以及
(d)按照在(c)中所决定的之后的行动,进行与用户之间的对话控制。
本发明的第6方式是一种计算机可读取的存储介质,该存储介质包含可以使计算机执行对话管理指令的程序,其中,该指令包含:
(a)从对话方案数据库中选择与从信息请求单元所请求的信息有关的对话方案;
(b)根据在(a)中所选择的所述对话方案,生成与所述所请求的信息有关的应答语句,将所述应答语句提供给用户终端;
(c)从对针对所述应答语句的用户回答语句进行解析的回答语句解析单元接受属性和针对所述属性的属性值作为回答语句解析结果,根据所述属性和所述属性值,从所述对话方案数据库中检索符合应答条件的至少一个所述对话方案,按照各个所述对话方案决定之后的行动;以及
(d)按照在(c)中所决定的之后的行动,进行与用户之间的对话控制。
本发明的第7方式是一种潜在意向提取系统,其根据与用户之间相互的对话信息来提取用户的潜在意向,该潜在意向提取系统包含:
对话管理装置,其对用户的用户终端提供应答语句,接受针对所述应答语句的回答语句,按照规定的对话方案进行与用户的对话;
回答语句解析装置,其对从所述用户终端接受的用户回答语句进行解析;以及
对话信息蓄积装置,其按照每个用户蓄积每个所述对话方案的对话信息,
其中,所述对话管理装置包含:
对话方案数据库,其存储多个对话方案;
方案选择单元,其从所述对话方案数据库中选择与从信息请求单元所请求的信息有关的对话方案;
应答生成单元,其根据由所述方案选择单元所选择的所述对话方案,生成与所述所请求的信息有关的应答语句,将该应答语句提供给用户终端;
行动决定单元,其从回答语句解析单元接受属性和针对所述属性的属性值作为回答语句解析结果,根据所述属性和所述属性值,从所述对话方案数据库中检索符合应答条件的至少一个所述对话方案,按照各个所述对话方案决定之后的行动,其中,回答语句解析单元对针对所述应答语句的用户回答语句进行解析;以及
对话控制单元,其按照由所述行动决定单元所决定的之后的行动,进行与用户之间的对话控制。
本发明的第8方式是一种信息提取装置,该信息提取装置包含:
知识数据库,其系统地对多个领域的多个术语的关系进行分类;
输入单元,其取入输入信息;
信息提取单元,当检测出所述输入信息中所包含的提取对象的属性时,所述信息提取单元使用所述知识数据库中的与所述属性有关的领域的知识,提取所述输入信息中包含的针对所述属性的属性值;以及
提取信息存储单元,其将由所述信息提取单元提取出的所述属性和该属性的所述属性值对应起来进行存储。
本发明的第9方式是一种信息提取方法,该信息提取方法包含:
(a)取入输入信息;
(b)当检测出所述输入信息中所包含的提取对象的属性时,使用知识数据库中的与所述属性有关的领域的知识,提取所述输入信息中包含的针对所述属性的属性值;以及
(c)将在(b)中提取出的所述属性和该属性的所述属性值对应起来进行存储。
本发明的第10方式是一种计算机可读取的存储介质,该存储介质包含可以使计算机执行信息提取指令的程序,其中,该指令包含:
(a)取入输入信息;
(b)当检测出所述输入信息中所包含的提取对象的属性时,使用知识数据库中的所述属性的领域的知识,提取所述输入信息中包含的针对所述属性的属性值;以及
(c)将在(b)中所提取的所述属性和所述属性的所述属性值对应起来进行存储。
本发明的第11方式是一种对话系统,其在人和作为与人之间的界面的装置之间接收和发送自然语言语句的数据,来进行与人的对话,所述对话系统包含:
解析部,其对人的发话进行解析;
对象部位认定部,其利用所述解析结果,认定用于从人的发话中提取系统发话用的要素的对象部位;以及
提取部,其根据所述对象部位,从人的发话中提取要素,以使系统发话成为适当的长度。
本发明的第12方式是一种在对话系统和作为与人之间的界面装置之间接收和发送自然语言语句的数据,来进行与人的对话的对话方法,
所述对话系统包括:解析部、对象部位认定部、以及提取部,
所述对话方法包含:
所述解析部对人类的发话进行解析;
所述对象部位认定部利用所述解析结果,认定用于从人的发话中提取系统发话用的要素的对象部位;以及
所述提取部根据所述对象部位,从人的发话中提取要素,以使系统发话成为适当的长度。
本发明的第13方式是一种计算机可读取的存储介质,该存储介质包含可以使计算机执行对话指令的程序,其中,该指令包含:
对人的发话进行解析;
利用所述解析结果,认定用于从人的发话中提取所述计算机发话用的要素的对象部位;以及
根据所述对象部位,从人的发话中提取要素,以使所述计算机发话成为适当的长度。
根据本发明的第1方式~第3方式,在与用户的对话中,能够准确地判断用户优先级和当前的匹配状况,能够取得最佳的匹配结果,参照该匹配结果,能够获得准确的检索结果。
根据本发明的第4~第7方式,在用户和系统之间顺利地展开对话,在对话的扩展中,给用户带来安心感和信赖感,能够提取用户本来的潜在意向。
根据本发明的第8~第10方式,能够从与用户之间展开的丰富多彩的对话中提取适当的信息。
根据第11~第13方式的发明,根据人的发话中的表达等,来变更重复回复中利用部位的选定和重复回复的长度(词语数量)等,所以,能够充分的表现出对人的亲近感,能够实现自然的对话(应答)。
附图说明
图1是示出本发明的第1实施方式的匹配管理装置的内部结构的结构图。
图2是示出本发明的第1实施方式的阶梯型检索系统的整体结构的结构图。
图3是示出本发明的第1实施方式的阶梯检索引擎的结构的结构图。
图4A和图4B是示出本发明的第1实施方式的用户数据的结构的结构图。
图5A和图5B是示出本发明的第1实施方式的对象数据的结构的结构图。
图6A和图6B是示出本发明的第1实施方式的领域知识的结构的结构图。
图7是示出本发明的第1实施方式的匹配管理处理的流程图。
图8是示出本发明的第1实施方式的提问语句的显示例的图。
图9是示出本发明的第1实施方式的提问语句的显示例的图。
图10A到图10C是说明本发明的第1实施方式的属性判定规则的说明图。
图11是在本发明的第1实施方式的提问语句的显示例中显示发话解析和显示匹配结果的显示例的图。
图12是示出本发明的第2实施方式的对话控制单元的内部结构的结构图。
图13是示出本发明的第2实施方式的对话控制单元的内部结构的结构图。
图14是示出本发明的第2实施方式的对话方案数据库的结构的结构图。
图15A和图15B是示出本发明的第2实施方式的对话控制处理的流程图。
图16A和图16B是示出本发明的第2实施方式的行动决定处理的流程图。
图17是示出本发明的第2实施方式的对话语句的结构例的图。
图18A和图18B是示出本发明的第2实施方式的方案结构的结构图。
图19A和图19B是示出本发明的第2实施方式的方案结构的结构图。
图20是说明本发明的第2实施方式的通过阶梯对话引擎进行的阶梯对话的概略过程的说明图。
图21A和图21B是显示在本发明的第2实施方式的用户终端(浏览器)上的显示画面例。
图22是示出本发明的第3实施方式的信息提取装置的内部结构的结构图。
图23A和图23B是说明本发明的第3实施方式的本体的结构的结构图。
图24是示出本发明的第3实施方式的检索对象数据的信息提取处理的流程图。
图25A和图25B是示出本发明的第3实施方式的检索对象数据的结构例的图。
图26是示出本发明的第3实施方式的用户输入语句的信息提取处理的流程图。
图27是示出本发明的第3实施方式的用户输入语句的结构例的图。
图28是示出本发明的第3实施方式的属性和所参照的本体之间的关系的图。
图29是示出第4实施方式的对话系统的主要结构的功能框图。
图30是示出第4实施方式的对话系统的动作的流程图。
图31是示出针对用户发话“人と接しながら自分が人間として成長できる仕事がしたい(想从事与人接触同时能够使自己作为社会人成长的工作)”的语素解析结果的说明图。
图32是示出针对用户发话“人と接しながら自分が人間として成長できる仕事がしたい(想从事与人接触同时能够使自己作为社会人成长的工作)”的句法解析结果(句法树)的说明图。
图33是示出第4实施方式的对象部位认定部内置的认定用特殊表现列表的说明图。
图34是示出第4实施方式的提取部内置的提取用特殊表现列表的说明图。
图35是示出第5实施方式的对话系统的主要结构的功能框图。
图36是示出第6实施方式的对话系统的主要结构的功能框图。
图37是示出第7实施方式的对话系统的主要结构的功能框图。
图38是示出第8实施方式的对话系统的主要结构的功能框图。
具体实施方式
(A)第1实施方式
下面,参照附图,详细地说明本发明的信息检索装置、方法以及程序的第1实施方式。
在第1实施方式中,例示出应用于如下的信息解析/信息检索系统的情况:该信息解析/信息检索系统利用本发明的信息检索装置、方法以及程序,例如采用阶梯型检索服务,从用户潜在意向的信息和检索对象信息中提取规定的属性和属性值,检索并介绍与用户潜在意向的信息相匹配的信息。这里所谓的潜在意向仍然是指,人自身没有明确地意识到,也无法明确地对他人进行说明,但是却模糊地存在着的希望、要求或期待,也可称为潜在要求或真正的希望。
(A-1)第1实施方式的结构
(A-1-1)阶梯型检索系统的整体结构的说明
首先,以下参照附图说明应用本发明的信息检索装置、方法以及程序的阶梯型检索系统的整体概况。
图2是说明第1实施方式的阶梯型检索系统9的整体概况的整体概况图。并且,图3是示出实现阶梯型检索系统9的阶梯检索引擎1的结构的结构图。
在图2中,第1实施方式的阶梯型检索系统9构成为具有:具备阶梯对话引擎1的阶梯型检索服务站点3;提供各种服务的服务站点2(2-1~2-n:n为正整数);以及存在于网络上的Web信息4,三者能够通过网络连接在一起。
用户界面(UI)单元90具有Web服务器901,该Web服务器901能够访问用户U1操作的用户终端(浏览器),并提供阶梯型检索服务。并且,用户界面(UI)单元90根据需要具有语音合成/识别部902,在来自用户U1的信息是语音信息的情况下,能够利用语音实现对话。
阶梯对话引擎1对用户U1提问,并解析用户U1针对该各问题的回答,由此来进行与用户U1之间的对话,解析用户U1真正希望的潜在意向。
并且,阶梯对话引擎1取得服务站点2提供的信息或Web信息4作为检索对象信息,从这些服务站点2的信息或Web信息4中提取属性和与该属性对应的属性值,检索具有与来自用户U1的应答信息对应的属性值的信息,对用户U1介绍具有与用户U1的潜在意向对应的属性值的信息。
这里,阶梯(laddering)是指,在与对方的对话中,通过反复进行逐渐深入的询问,来引出对方的需要和价值观的手法。
作为阶梯对话引擎1进行的与用户之间的对话的种类,例如可以应用如下的询问类型等:系统针对用户使其回答“YES/NO”的形式、“从选择项中选择”的形式的提问类型;使用户自由回答的提问类型;同意用户的回答或改变说法由此来促使用户自发发言的提问类型。
在图2中,阶梯对话引擎1具有:知识获得功能部12,其通过网络获得用于从服务站点2或Web信息4中查找进行对话用的信息或用户U1的潜在意向的知识信息;以及术语知识/领域知识DB(数据库)13,其存储由该知识获得功能部12获得的知识信息。
并且,阶梯对话引擎1具有不同领域对话方案DB 14,该不同领域对话方案DB 14根据可以通过网络连接的服务站点2的种类,按照各个领域存储进行对话用的方案。
并且,阶梯对话引擎1具有阶梯对话控制功能部11,该阶梯对话控制功能部11一边参照术语知识/领域知识DB 13和不同领域对话方案DB14,一边进行与用户U1之间的对话。
此时,阶梯对话控制功能部11进行“深入”、“改变说法”、“信息提供”、“概括”等处理,其中,“深入”是指为了明确用户的潜在意向而提出更深入的问题,或者进行用于确认用户的潜在意向的提问等的问话;“改变说法”是指对用户的回答改变说法,或者进行为了促动用户发言而发出带有感情色彩的问话;“信息提供”是指为了给用户带来满足感和期待感而对用户提供各种信息;“概括”是指概括过去听到的信息而再次利用。
并且,阶梯对话引擎1具有检索对象分析功能部15,该检索对象分析功能部15根据各服务站点2的检索对象数据21来分析检索对象数据,阶梯对话引擎1具有检索对象分析结果DB16,该检索对象分析结果DB16存储经该检索对象分析功能部15分析的检索对象分析结果。
阶梯对话引擎1从检索对象分析结果DB 16中,提取与经阶梯对话控制功能部11解析的用户U1的回答解析结果(从用户U1引出的信息)相匹配的信息,并把该匹配状况提供给阶梯对话控制功能部11。
各种服务站点2-1~2-n是通过网络对用户提供各种信息的服务站点。
作为各种服务站点2-1~2-n,有各种各样的企业/团体等的服务领域(service domain),例如有面向转职者的职业介绍领域、住宅信息介绍领域、各种购物站点的领域、旅行计划/个人导航领域、广播/电影等的内容产业领域等企业提供的领域站点(domain site);以及例如所谓的博客或SNS(社会网络站点)等社区站点;行政机关等领域站点;调查/咨导(例如医疗、保健、福利和问卷调查等)的企业/团体提供的领域站点等。
Web信息4是存在于网络上的Web信息,是阶梯对话引擎1可以通过网络访问的信息。
接着,参照图3说明阶梯对话引擎1的内部结构。
在图3中,阶梯对话引擎1至少具有:对话管理单元10、匹配单元20、匹配对象分析单元30、方案管理单元50、对译结果概括单元60、领域知识获得单元70、用户发话解析单元80以及用户界面(UI)单元90。
对话管理单元10控制阶梯对话引擎1中的处理。对话管理单元10对希望进行检索的用户U1反复提出各种问题,蓄积用户对这些提问的回答(对话内容),并且,汇总该所蓄积的对话记录,由此,引出用户真正潜在意向的信息,检索与该潜在意向的信息相匹配的信息和内容,向用户U1进行介绍。
作为对话管理单元10的主要功能,至少具有:对话控制部101,其对用户U1提问,根据来自用户U1的回答的解析结果,进行之后的对话,来执行对话控制;行动决定部102,其根据对话涉及的方案对用户U1提问,根据来自用户U1的回答进行方案的变更等;方案选择部103,其针对与用户U1的对话,从方案管理单元50中选择没有不谐调感的方案;以及应答生成部104,其根据由方案选择部103选择出的方案,生成针对来自用户U1的回答的应答语句。
匹配单元20从对话管理单元10接受由对话管理单元10解析的用户U1的回答解析结果(从用户U1引出的信息),与从服务站点2取得的信息进行匹配。
作为匹配单元20的主要功能,至少具有:分配器201,其对匹配器202提供从对话控制部101接受的用户U1的回答解析结果,对领域知识获得单元70提供由匹配器202匹配的信息;匹配器202,其进行对象数据和个人登记数据之间的匹配处理、以及用户U1的回答解析结果和服务站点2的检索信息之间的匹配处理;以及设定器203,其根据用户U1的回答解析结果来决定从服务站点2检索的对象。
匹配对象分析单元30将匹配对象数据(即与用于向用户U1提问的属性相关的信息)和个人登记数据转换为规定的数据格式,并且,使用对话结果和领域知识等,对该匹配对象数据和个人登记数据进行扩展处理。
作为匹配对象分析单元30的主要功能,至少具有:对象数据DB 303,其存储表示属性的匹配对象的对象数据;个人登记数据DB 304,其存储用户U1的个人登记数据;转换器301,其将存储在对象数据DB 303和个人登记数据DB 304中的对象数据和个人登记数据转换为规定的数据格式;以及增强器302,其根据领域知识和对话结果的记录信息,将由转换器301转换为规定数据格式后的数据,转换为扩展为类似的数据或关联数据等的数据。
领域知识获得单元70通过Web从服务站点2或其他Web信息4,取得在服务站点2上提供的领域信息或知识信息。
领域知识获得单元70具有:领域知识编辑器701,其通过Web取得与检索对象的领域有关的领域知识信息(即术语),将该所取得的领域知识信息(以下也简称为领域知识)提供给匹配对象分析单元30,并将其转换为规定的数据格式;以及领域知识DB 702,其将被转换为规定的数据格式的领域知识,存储为系统的集合体(以下也称为本体(ontology))。
方案管理单元50参照领域知识DB 702,生成各个领域的方案并进行管理。方案管理单元50具有方案编辑器501,该方案编辑器501参照领域知识DB 702,生成用于与用户U1之间进行对话的方案,根据对话管理单元10的行动决定部102的控制,变更方案或进行方案的编集。该方案编辑器501能够针对与用户之间交互的对话方案,与匹配对象分析单元30的增强器302协作,生成基于扩展后内容的对象数据的对话方案。并且,通过方案选择部103来选择方案编辑器501生成的对话方案。
对话结果概括单元60具有:记录DB 601,其存储在系统和用户U1的对话中交换的记录;记录器602,其接受对话控制部101的控制,读出存储在记录DB 601中的记录信息,将其提供给对话控制部101;以及概括器603,其使用扩展/对象数据和扩展/个人数据,进行针对用户U1的回答的概括处理。
用户发话解析单元80通过对话控制部101输入用户U1的回答,根据该所输入的用户U1的回答信息,对用户潜在意向的信息进行解析。并且,用户发话解析单元80将解析后的用户潜在意向的解析信息提供给对话控制部101。
如图3所示,作为用户发话解析单元80的主要功能,至少具有:潜在意向解析部801、表达标准化部802、句法解析部803、语素解析部804、辞典转换器805、潜在意向解析用辞典806以及翻译用辞典807。
潜在意向解析用辞典806存储潜在意向解析所需要的各种信息。在图3中,为了便于说明,示出潜在意向解析用辞典806为单一辞典的情况,但是,潜在意向解析用辞典806有意地存储潜在意向解析所需要的信息,例如语素(对日语的语素也称形态素)信息、句法信息、标准化信息等。并且,翻译用辞典807存储翻译信息。
辞典转换器805参照翻译用辞典807和潜在意向解析用辞典806,根据需要对存储在潜在意向解析用辞典806中的信息进行翻译处理。
语素解析部804从对话控制部101取得用户U1的应答信息或服务站点2等的检索对象信息,参照潜在意向解析用辞典,对这些用户U1的应答信息或服务站点2等的检索对象信息进行语素解析。
句法解析部803参照潜在意向解析用辞典806,根据语素解析部804的语素解析结果,对用户U1的回答信息或服务站点2等的检索对象信息进行句法解析。
表达标准化部802参照潜在意向解析用辞典806和领域知识DB702,对句法解析部803进行的句法解析结果进行标准表达化。
潜在意向解析部801参照潜在意向解析用辞典806和领域知识DB702,提取用户U1的应答信息中所包含的用户潜在意向的潜在意向信息。由该潜在意向解析部801提取出的用户的潜在意向信息经由对话控制部101,存储在匹配对象分析单元30的个人登记数据DB 304中。
(A-1-2)关于匹配管理装置
接着,参照附图,详细地说明第1实施方式的匹配管理装置。
并且,以下以服务站点2是面向转职者的职业介绍领域站点的情况为例,进行说明。
第1实施方式的匹配管理装置优选作为如下功能来实现:在上述阶梯对话引擎1中,以匹配单元20为中心,使对话管理单元10、用户发话解析单元80和匹配对象分析单元30协作。
当然,在上述阶梯对话引擎1中,对话管理单元10通过软件处理来实现与各种单元20~90的协作,一边基于阶梯手法与用户相互对话,一边介绍与用户潜在意向对应的信息,所以,后述的匹配管理处理的实现部位没有特别限定。
图1是示出第1实施方式的匹配管理装置18的结构的结构图。在图1中,第1实施方式的匹配管理装置18如下这样实现:至少使匹配器202、评价值计算单元21、属性选择单元22、对话管理单元10、用户发话解析单元80、对象数据数据库(DB)303、个人登记数据数据库(DB)304、领域知识数据库(DB)702协作。
并且,匹配器202、评价值计算单元21、属性选择单元22相当于上述阶梯对话引擎1的匹配单元20的功能结构,例如,优选评价值计算单元21和属性选择单元22发挥分配器201的功能。
个人登记数据DB 304是保持用户的个人登记数据的数据库。图4A和图4B是示出保持在个人登记数据DB 304中的用户数据的结构例的结构图。如图4A和图4B所示,用户数据的项目由“属性名”、“属性值”、“方案优先级”以及“用户优先级”构成。
“属性名”是用于进行信息检索的属性的名称,“属性值”是针对该属性的用户的属性值。“方案优先级”示出在进行对话的对话方案中所设定的对用户提问的顺序。在图4A和图4B中,数字越大优先级越高。“用户优先级”是从用户的回答得到的其属性的优先级。在图4A和图4B中,数字越大用户的优先级越高。并且,在用户数据中嵌入有通过与用户的对话而取得的属性值。
对象数据DB 303是保持通过网络从服务站点2取得的检索对象数据的数据库。
图5A和图5B是示出保持在对象数据DB 303中的对象数据的结构例的结构图。在图5A和图5B中,是作为转职信息的对象数据的结构例,作为其结构,例如由用于识别对象数据的“ID”、“工作地点”、“职业种类”、“行业种类”等构成。
领域知识DB 702是保持领域知识的数据库。图6A和图6B是示出保持在领域知识DB 702中的领域知识的结构例的结构图。如图6A和图6B所示,领域知识由系统地对与多个术语有关的知识进行分类的本体构成。
例如,图6A是工作地点本体的例子,图6B是行业种类本体的例子。在图6A中,例如关于属性“工作地点”,示出在作为上位概念的“日本(国)”的下位概念中链接“关西(地方)”和“关东(地方)”的情况。并且,示出将“关西(地方)”作为上位概念,链接“京都府(都道府县)”和“大阪府(都道府县)”作为其下位概念的情况。这样,在图6A和图6B中保持的知识构成为,利用亲子关系链接上位概念的术语和下位概念的术语。
评价值计算单元21根据匹配器202的匹配结果,计算评价值。作为该评价值计算单元21计算评价值的方法,计算在用户数据中设置了属性值的比例(用户的特性比例),作为评价值。
属性选择单元22根据匹配器202的匹配结果、用户数据和评价值,决定最适当地缩小数据范围所需要的用户希望条件的项目,将该决定出的项目提供给对话管理单元10。由此,对话管理单元10能够对用户进行与由属性选择单元22所决定的项目有关的提问。这里,通过动作来详细说明属性选择单元22决定项目的方法。
属性选择单元22参照用户数据,例如在用户数据中没有嵌入属性值的情况下,将没有嵌入属性值的属性中优先级高的属性名提供给对话管理单元10。能够针对该优先级高的属性名对用户进行提问,能够取得属性值。并且,作为优先级,有方案优先级和用户优先级,但是方案优先级优先。
并且,属性选择单元22参照用户数据,在用户数据中嵌入有某种程度的属性值的情况下,将用户数据中子孙最多的属性名提供给对话管理单元10。
并且,在匹配的对象数据少的情况下,属性选择单元22以可以有一个不匹配的对象数据这样的条件进行匹配,将评价值最高的对象数据中不匹配的属性名提供给对话管理单元10。通过动作来详细说明该处理。
(A-2)第1实施方式的动作
接着,参照附图说明第1实施方式的匹配管理处理。图7是示出第1实施方式的匹配管理处理的流程图。
首先,属性选择单元22向对话管理单元10请求希望取得的属性(步骤S101)。此时,关于属性选择单元22对对话管理单元10请求的初始属性,可以是作为默认值预先设定的属性,或者,也可以是参照领域知识DB 702随机选择的本体的属性。
对话管理单元10接受来自属性选择单元22的请求,为了从用户取得与所请求的属性有关的属性值,生成提问该属性的属性值的提问语句,对用户提出该提问语句(步骤S102)。
图8是在用户的浏览器(用户终端上)显示来自对话管理单元10的提问语句时的显示例501A。在图8中,例示出向用户提问的属性是“工作地点”的情况。
在图8的提问语句的显示例501A中,至少具有提问语句502A、回答按钮503A、工作地点选择显示部504A、意图显示部505A、优先级赋予显示部506A、以及匹配结果显示部507A。
提问语句502A是显示从阶梯对话引擎1提供的提问语句的部分,用户对该提问语句进行回答。在用户进行回答的情况下,从显示在工作地点选择显示部504A上的工作地点中选择期望的工作地点。这里,示出选择了“大阪市”的情况。
并且,在显示例501A中具有意图显示部505A和优先级提供给显示部506A,以在检索转职目的地时,把握该属性(即“工作地点”)对用户的重要程度如何的潜在意向。
在该意图显示部505A中显示例如“不确定”、“都可以”等用于了解用户对该属性的潜在意向的信息。并且,在优先级赋予显示部506A中,用户能够针对该属性选择优先级。另外,优先级的设定方法没有特别限定,可以应用各种方法,但是,这里,例如优先级“3”是“普通水平”,值越大,在检索转职目的地时,该属性的优先级越高。
并且,图9是与图8不同的提问语句的显示例。在图9所示的显示例701A中,具有用户针对提问语句702A输入自然语言的输入部703A。该情况下,用户在输入部703A中输入针对提问语句702A的回答后,选择回答按钮704A,由此,回送回答语句。另外,在图9所示的显示例中,具有发话解析结果显示部705A和匹配结果显示部706A。
当用户对图8或图9所例示的提问语句进行回答后,该回答语句被提供给对话管理单元10(步骤S103)。进而,将回答语句从对话管理单元10提供给用户发话解析单元80,通过用户发话解析单元80进行回答语句解析(步骤S104)。由此,将回答语句中所包含的属性和该属性的属性值对应起来存储在用户数据中(步骤S105)。
将属性和该属性的属性值存储在用户数据中后,属性选择单元22参照用户数据(步骤S106),判断存储在该用户数据中的属性值的比例是否在阈值以上(步骤S107)。
当存储在用户数据中的属性值的比例小于阈值的情况下,属性选择单元22参照属性判定规则222,进行与存储在用户数据中的属性值的评价值相对应的属性选择处理(步骤S108)。
图10A到图10C是说明属性判定规则222的说明图。图10A示出属性判定规则222的结构例,图10B是属性判定规则222的检验项目的定义内容,并且,图10C是属性判定规则222的执行处理的定义内容。
在图10A中,规则是在符合条件1~条件9这9个条件的情况下,分别执行对应的执行处理(处理1~处理6)。在图10A中,“○”是符合检验项目的情况,“×”是不符合检验项目的情况,“—”表示不确定的情况。
作为属性判定规则222的检验项目,如图10B所示,由C1~C6这6种构成。C1是指设置了属性值的用户的特性比例在阈值(filed_property_ratio)以上,C2是指匹配的目标数在阈值(matched_targrt_count)以上,C3是指用户数据中方案的优先级在规定优先级(property_priority)以上、状态在规定水平(status_Level)以下的特性,C4是指FIXED以外的所有用户数据的属性值不具有子孙,C5是指状态水平(status_Level)在1以下,C6是指规定优先级(property_priority)为1。
并且,作为执行处理,如图10C所示,由处理1~处理6这6种构成。处理1是进行希望条件的填空的处理,其内容是如下处理:从用户数据中选择状态水平(status_Level)在1以下的、方案的优先级最高的特性。处理2是进行希望条件的缩小范围的处理,其内容是如下处理:在用户数据中选择具有子孙最多的属性值的特性。处理3是进行希望条件的放宽的处理,其内容是如下处理:增加不匹配的属性的数量(unmatched Count),再次调出数据匹配功能,选择评价值最高的目标数据中的不匹配的特性。处理4是对于模糊的回答再次进行提问的处理,其内容是如下处理:增加状态水平(status_Level)而再次进行参照属性判定规则222的判定处理。处理5是还考虑优先级低的属性的处理,其内容是如下处理:减少优先级(property_priorty)而再次进行参照属性判定规则222的判定处理。处理6是无法行行缩小范围的处理,其内容是如下处理:重新进行与用户的对话。
在步骤S108中进行属性选择单元22执行的属性选择处理,当选择了属性时(步骤S109),返回步骤S101,对用户提出与所选择的属性有关的提问语句。
另一方面,当在步骤S107中设置在用户数据中的属性值的比例在阈值以上的情况下,通过匹配器202,从对象数据DB 303中检索与用户数据相匹配的对象数据(步骤S110)。
当通过匹配器202进行匹配时,对话管理单元10参照记录在用户数据中的用户优先级,选择与用户优先级高的属性相匹配的匹配结果,将该匹配结果优先提供给用户进行显示(步骤S111)。
用户从所显示的匹配结果中选择期望的对象数据。然后,对话管理单元10从对象数据DB 303中调出由用户选择的对象数据的详细数据,将该对象数据提供给用户进行显示(步骤S112)。
例如,图11是与图9所例示的显示例对应的显示例。在图11的发话解析结果显示部805A中,是针对用户以自然语言输入的“如果可能,希望是关西。”这样的输入(参照图9)的发话解析结果。即,在图11中,针对图9的回答即“如果可能”这样的输入,属性选择单元22解析为其用户优先级为2,在发话解析显示部805A上显示该解析结果。
并且,在匹配结果显示部806A中,显示检索到21件匹配的对象数据,其中,按照用户优先级从高到低的顺序显示为A株式会社、B株式会社、株式会社D、……。
(A-3)第1实施方式的效果
如上所述,根据第1实施方式,能够发挥以下效果。
根据第1实施方式,能够可靠地判断用户优先级和当前的匹配状况,以少量的提问数得到最佳的匹配结果。
根据第1实施方式,即使目标数据没有完全与条件相匹配,但只要适合率高,则也能够询问用户在该条件下是否也可以,能够得到用户意想不到的良好结果。
根据第1实施方式,通过在阶层型知识数据库中提出上位概念、下位概念和类似概念,能够自由地进行条件的缩小范围和放宽,能够调整匹配结果。
根据第1实施方式,用户可以对某些条件回答“不确定”、“都可以”等,能够考虑该条件发现准确的候选。
(A-4)其他实施方式
(A-4-1)在第1实施方式中,作为服务站点的一例,例示了面向转职者的职业介绍站点,但是不限于此,能够广泛应用存在于网络上的信息。
此外,作为网络上的信息,可以将文本数据、图像数据、动态图像数据、音频数据等作为检索对象数据。
(A-4-2)第1实施方式中说明的阶梯检索引擎、匹配管理装置所实现的各种结构要件的功能通过软件处理来实现。例如,作为硬件结构,构成为例如具有CPU、ROM、RAM等,通过使CPU使用处理所需要的数据来执行存储在ROM中的处理程序,由此实现各种结构要件的功能。
(A-4-3)第1实施方式中说明的匹配管理装置不限于搭载在物理上的同一装置上,各种结构要件也可以搭载在分散的装置上。即,可以分散配置各种结构要件。
(B)第2实施方式
下面,参照附图,详细地说明本发明的对话管理装置、方法、程序以及潜在意向提取系统的第2实施方式。
在第2实施方式中,例示出应用于如下的信息解析/信息检索系统的情况:该信息解析/信息检索系统利用本发明的对话管理装置、方法、程序以及潜在意向提取系统,例如采用阶梯型检索服务,从用户潜在意向的信息和检索对象信息中提取规定属性和属性值,检索并介绍与用户潜在意向的信息相匹配的信息。
(B-1)第2实施方式的结构
(B-1-1)阶梯型检索系统的整体结构的说明
关于应用了本发明的对话管理装置、方法、程序以及潜在意向提取系统的阶梯型检索系统,在第1实施方式中进行了说明。下面,对与第1实施方式相同的结构,标注相同的参照标号并省略说明。
(B-1-2)关于对话管理装置
接着,参照附图详细地说明第2实施方式的对话管理装置。并且,以下以服务站点2是面向转职者的职业介绍领域站点的情况为例,进行说明。
第2实施方式的对话管理装置优选在上述阶梯型检索系统9中,作为对话管理单元10的功能来实现。
当然,在上述阶梯型检索系统9中,对话管理单元10通过软件处理来实现与各种单元20~90的协作,一边基于阶梯手法与用户相互对话,一边介绍与用户的潜在意向对应的信息,所以,后述的信息提取处理的实现部位没有特别限定。
图12和图13是示出第2实施方式的对话管理单元10的结构的结构图。图12是对话管理单元10A在外部具有用户个人信息时的结构图,图13是对话管理单元10B在内部具有用户个人信息时的结构图。以下,在无特别区分时,把对话管理单元10A和10B统称为对话管理单元10。
如图12和图13所示,第2实施方式的对话管理装置10至少具有:对话控制部101、行动决定部102、方案选择部103以及应答生成部104。
图12所示的对话管理装置10A至少与Web服务器901、输入语句解析模块(用户发话解析单元)80B、对话记录(记录DB)601以及匹配单元20协作。并且,图13所示的对话管理装置10B至少与Web服务器901、输入语句解析模块(用户发话解析单元)80B、对话记录601协作。
对话控制部101对对话管理装置10实现的功能进行控制,并控制与外部模块(例如Web服务器901、输入语句解析模块80B、对话记录601、匹配单元20等)之间的协作处理。对话控制部101基本上在行动决定部102、方案选择部103、应答生成部104与外部模块之间进行信息的接收和发送。
具体而言,对话控制部101针对方案选择部103进行基于请求信息或回答语句判定的方案请求处理;针对应答生成部104进行应答语句生成的请求处理;针对输入语句解析模块80B进行输入语句解析请求处理;针对行动决定部102进行回答语句判定的请求处理;针对应答生成部104进行对话写入的请求处理。
方案选择部103从匹配单元20接受匹配单元20希望取得的信息的请求时,从对话方案1031中选择用于取得该信息的方案(以下也称为最佳方案)。
并且,方案选择部103将所选择的方案提供给对话控制部101。此时,对话控制部101将从方案选择部103取得的方案保持为当前方案1011,并且,将该方案提供给应答生成部104。
这里,关于从用户取得与哪个属性有关的信息的判断,设为例如在匹配单元20中,根据检索对象数据和用户的回答数据之间的匹配结果来进行判断。
在对话方案1031中,例如针对匹配单元20请求的所有信息,预先设定用于取得该信息的方案。并且,该对话方案1031可以应用相当于图3所示的方案管理单元50所具有的对话方案的方案。
图14是示出存储多个对话方案1031的对话方案DB 518的结构的结构图。如图14所示,对话方案DB 518具有通常方案组51、特别方案组52和应答语句组53。
通常方案组51是用于在与用户U1的对话中引出用户希望要件的方案的集合体。在该通常方案组51中,预先设定有针对与检索对象有关的领域的所有属性的方案。
特别方案组52是用于在与用户之间的阶梯对话中应对来自用户的不规则的发话(例如,用户进行了与方案的发话有关的提问的情况等)、或流畅地进行与用户之间的对话的方案的集合体。例如有“说明方案”、“确认方案”、以及用户“贴近方案”、用户“确认方案”等。并且,还存在当用户发话的动作不存在于通常方案中的情况下所执行的“默认方案”。
应答语句组53是在通常方案、特别方案中利用的应答语句例,也称为应答语句种子。应答语句组53预先设定有进行应答的应答语句,或设定有具有变量的模板。
另外,对话方案DB 518记叙了以存储在图3所示的领域知识DB702中的信息为基础的信息的方案。
并且,对话方案DB 518内的方案可以利用由增强器302等扩展信息后的扩展/个人数据的内容,来生成应答语句。即,可以保持置换为类似术语等的方案。
应答生成部104经由对话控制部101接受方案后,根据该方案的应答语句种子,生成对用户进行应答的应答语句。
这里,作为应答生成部104生成应答语句的方法,例如,可以应用参照图14的应答语句组53并按照该应答语句组53来生成应答语句的方法。此时,在应答语句由具有变量的模板构成的情况下,将从用户取得的实际数据代入变量来完成应答语句。
并且,应答生成部104将所生成的应答语句提供给对话控制部101。此时,对话控制部101将所生成的应答语句提供给Web服务器901,发送到用户U1。
行动决定部102经由对话控制部101接受来自用户的回答即用户输入语句解析结果后,根据该输入解析结果,决定之后的对话行动,将该所决定的之后的行动提供给对话控制部101。此时,对话控制部101进行控制,以按照由行动决定部102决定的行动来进行之后的行动。
这里,作为行动决定部102决定的行动,有以下3个行动。第1,对匹配单元20提供信息,结束当前方案1011。第2,继续当前方案1011。第3,执行阶梯特别处理。
作为该阶梯特别处理,是指如下的处理:在由于来自用户的不规则的发话(例如,用户进行与方案的发话有关的提问的情况等)而使通常的方案难以继续的情况下,或在为了顺利地进行与用户之间的对话希望特别的应答而不是当前方案(用于收集用户需要的信息的方案)的情况下,选择与当前方案不同的方案,来继续对话。
(B-2)第2实施方式的动作
接着,参照附图说明第2实施方式的对话管理处理。图15A和图15B是示出第2实施方式的对话管理处理的流程图。图12、图15A和图15B中所示的步骤编号是分别对应的编号。
首先,从匹配单元20将希望取得的信息的请求提供给对话控制部101后(步骤S1),对话控制部101对方案选择部103进行基于请求信息的方案请求(步骤S2)。
此时,将存储在对话方案DB 518中的对话方案1031读入方案存储器1021。
例如,在匹配单元20请求的信息是“希望职业种类”的情况下,方案选择部103从对话方案1031中选择与“希望职业种类”有关的方案,将该方案提供给对话控制部101(步骤S3)。
将由方案选择部103选择的方案提供给对话控制部101后,对话控制部101将该方案保持为当前方案1011,并且,将当前方案的应答语句种子提供给应答生成部104,进行应答语句生成请求(步骤S4)。
在应答生成部104中,根据该请求信息的方案内的应答语句种子,生成应答语句,将该所生成的应答语句提供给对话控制部101(步骤S5)。
例如,此时,作为与“希望职业种类”有关的应答语句,应答生成部104根据应答语句种子,生成“有希望的职业种类吗?”这样的应答语句。
然后,对话控制部101将由应答生成部104生成的应答语句提供给Web服务器901(步骤S6),对用户U1的用户终端提问。
之后,从用户U1经由Web服务器901将针对询问的回答语句提供给对话控制部101后(步骤S7),对话控制部101将来自该用户U1的回答语句和当前方案提供给输入语句解析模块80B,进行该回答语句的解析请求(步骤S8)。
在输入语句解析模块80B中,对所输入的用户U1的回答语句进行解析,将其解析结果提供给对话控制部101(步骤S9)。
另外,关于输入语句解析模块80B中的输入语句解析方法,例如利用系统地对信息的知识进行分类后的领域知识(本体)来进行。例如,在用户U1针对应答语句的回答语句是“没有特别希望的”的情况下,输入语句解析模块80B将“没有”这样的解析结果提供给对话控制部101。
从输入语句解析模块80B接受回答语句解析结果后,对话控制部101将该回答语句解析结果和当前方案提供给行动决定部102,请求回答语句判定(步骤S10)。
于是,在行动决定部102中,根据回答语句解析结果和当前方案来决定之后的行动,将该所决定的行动提供给对话控制部101(步骤S11)。即,行动决定部102决定是对匹配单元20提供信息并结束当前方案,还是继续进行方案,或是进行阶梯特别处理。
这里,参照附图详细说明行动决定部102的行动决定处理。
图16A和图16B是示出行动决定部102的行动决定处理的流程图。并且,图17例示出用户U1和系统之间的阶梯对话的内容。
如图17所示,假设对话管理单元10为了对用户引出“转职理由”,对用户提问“为什么希望转职?”这样的应答语句,作为其回答,得到了“公司倒闭了。”这样的回答。然后,从输入语句解析模块80B向行动决定部102提供给“转职理由(属性名):公司倒闭(属性值)”,作为回答解析结果。
在图16A和图16B中,在系统起动时,在方案存储器1021上安装图14所示的对话方案DB 518的对话方案1031。
然后,将回答解析结果提供给行动决定部102后,行动决定部102根据所接受的回答解析结果,从方案存储器1021中检索特别方案(步骤S301)。
这样,行动决定部102在通常方案的检索前进行特别方案的检索,由此,可以选择给用户带来信赖感和安全感的特别方案(“贴近方案”),或者,可以选择与用户突然进行了无关的提问的情况对应的特别方案(“说明方案”)。
在存在与回答解析结果相匹配的特别方案的情况下(步骤S302),选择该匹配的特别方案,行动决定部102将该特别方案提供给对话控制部101。由此,通过对话控制部101的控制,执行该匹配的特别方案的应答语句动作(步骤S303)。
这里,具体说明行动决定部102的方案的进行处理。
图18A和图18B是特别方案的例子。另外,图18A是贴近方案的例子,图18B是确认方案的例子。
如图18A和图18B所示,各方案构成为具有“方案关键”、“优先级”、“应答语句条件”、“应答语句动作”。
这里,在图18A和图18B中,对一个方案定义一组或多组的“应答语句条件”和“应答语句动作”。而且,将“应答语句条件”和“应答语句动作”分别对应起来,在符合某个“应答语句条件”的情况下,执行与该应答语句条件对应的应答语句动作。
“方案关键”是方案的识别信息。
“应答语句动作”定义了符合“应答语句条件”的情况下的动作。在图18A和图18B中,作为动作例,示出定义了以预先设定的一个应答语句进行应答的情况。但是,不限于该情况,还定义了多个应答语句的应答,定义了使用过去从用户取得的用户个人数据的、由带变量的模板构成的应答语句,定义了用于使用户选择选择项的带选择项的应答语句,定义了是继续应答还是到此结束的应答语句继续信息,定义了在到此结束的情况下之后调出的其他方案的信息,定义了方案的优先顺序的变更和匹配的重要度的变更。
“应答语句条件”是用于执行应答语句动作的条件。在图18A和图18B中,例示了与用户的属性值对应的情况。但是不限于此,也可以将从其他方案中调出的情况作为条件,或者将过去取得的用户个人数据或扩展后的信息是否符合属性值作为条件,而不将本次从用户取得的信息是否符合属性值作为条件。
通常方案的“优先级”决定在请求了匹配单元20所请求的多个信息(属性名)的情况下、或不存在匹配单元20的情况下所执行的属性名方案的优先顺序。
例如,图19A的转职理由方案的优先级为10,(B)希望的职业种类方案的优先级为8。该情况下,如果没有来自匹配单元的信息请求,则在希望的职业种类方案之前执行转职理由方案。这样,能够在方案内定义以什么样的顺序对用户进行提问。(进而,如(B)-1的例子那样,能够在应答语句动作内改写优先级。)
另一方面,特别方案的“优先级”决定在特别方案内以哪个特别方案的顺序进行发话。(在通常方案和特别方案中,“优先级”的定义不同。)
例如,在图18A和图18B的情况下,作为系统发话,先生成贴近方案,然后生成确认方案。(成为“那真遗憾。所以你才考虑转职的吧。”这样的方案发话。)
例如,将回答语句解析结果“转职理由(属性名):公司倒闭(属性值)”提供给行动决定部102后,行动决定部102检索将属性名“转职理由”、属性值“公司倒闭”作为应答语句条件的特别方案。这里,设为检索到图18A和图18B所例示的2个特别方案(贴近方案、确认方案)(图16A和图16B的S41)。于是,行动决定部102向对话控制部101通知2个特别方案。
对话控制部101接受特别方案后,按照基于该特别方案的优先级的优先顺序,将特别方案的应答语句种子提供给应答生成部104(图1、图15A和图15B的S13)。
应答生成部104根据来自对话控制部101的应答语句种子生成应答语句,将该应答语句提供给对话控制部101(图1的S14)。然后,通过执行贴近方案,对用户U1提出“那真遗憾。”这样的应答语句,并且,通过执行确认方案,对用户U1提出“所以你才考虑转职的吧。”这样的应答语句(S42)。
另一方面,在步骤S302中在没有与回答解析结果相匹配的特别方案的情况下,或者在执行特别方案的应答语句动作后,行动决定部102检索是否具有与属性名X(在该例子中为转职理由)相匹配的通常方案(步骤S304)。
然后,在存在与回答解析结果相匹配的通常方案的情况下(步骤S305),选择该匹配的通常方案,行动决定部102将该通常方案提供给对话控制部101。由此,通过对话控制部101的控制,执行该匹配的通常方案的应答语句动作(步骤S306)。
这里,说明通常方案的方案进行处理。图19A和图19B是通常方案的例子。各方案构成为具有“优先级”、“应答语句条件”、“应答语句动作”。并且,这是以从方案(A)跳到另一方案(B)时的方案结构为例而示出的。
例如,行动决定部102检索将属性名“转职理由”、属性值“公司倒闭”作为应答语句条件的通常方案。这里,设为检索到图19A所例示的通常方案。于是,行动决定部102向对话控制部101通知图19A所示的通常方案的应答语句动作为“跳到希望的职业种类方案”。
于是,对话控制部101对方案选择部103请求“希望的职业种类”方案(图1的S15)。然后,方案选择部103将“希望的职业种类”方案提供给对话控制部101后,将“希望的职业种类”方案保持为当前方案,并且,将新的跳后方案的应答语句种子提供给应答生成部104,通过执行深入方案,向用户U1提出“以前从事什么样的工作?”这样的应答语句(S43)。
如图19A所示,通过从用户的发话得到的属性值,进一步跳到针对该内容进行深入挖掘的另一方案,由此,能够实现“深入”。
另一方面,在步骤S305中当不存在与回答解析结果相匹配的属性名“X(转职理由)”的通常方案的情况下,行动决定部102针对所有的属性名,检索是否存在与应答语句条件相匹配的通常方案(步骤S307)。
然后,在存在与回答解析结果相匹配的通常方案的情况下(步骤S308),选择该匹配的通常方案,行动决定部102将该通常方案提供给对话控制部101。由此,通过对话控制部101的控制,进行从属性名为“X(转职理由)”的通常方案向属性名为“Y”的另一通常方案转变的处理(步骤S309)。
另一方面,在步骤S308中当不存在与回答解析结果相匹配的通常方案的情况下,或者执行了步骤S306的通常方案的动作的应答语句动作后,行动决定部102将作为默认方案设定的特别方案提供给对话控制部101(步骤S310)。
该情况下,根据行动决定部102所决定的默认的特别方案,对话控制部101与方案选择部103和应答生成部104协作,向用户U1发送例如“非常抱歉,请从以下的选择项中选择。”这样的应答语句(S45)。
由此,在没有完全适用的方案等情况下,将特别方案作为默认方案,由此,能够提出某些回应,或转移到其他的提问。
另外,在行动决定部102中,在符合表示结束的方案的应答语句条件的情况下,将表示该意思的内容提供给对话控制部101,将与该方案有关的应答语句和回答语句写入对话记录601,结束该方案(步骤S12)。另外,在对话记录601中,在每个方案结束时进行写入。因此,即使在从某个方案跳到其他方案的情况下,也能够写入之前的方案的应答语句和回答语句。
另外,在上述中,如图1所示例示了个人信息数据存在于对话管理装置10外部的情况,但是,在如图13所示个人信息数据存在于对话管理装置10内部的情况下,也同样动作。
但是,如图13所示,在个人信息数据存在于对话管理装置10内部的情况下,对向对话控制部101请求的信息(即引出属性值的数据)标注优选顺序,按照该优选顺序,对对话控制部101进行请求。
图20是说明阶梯对话引擎1进行的阶梯对话的概略进行的说明图。
如图20所示,在用户和系统之间的对话中,对最初的提问Q1(关于性格)、提问Q2(关于经历)、…、提问Qn(n为正整数)(关于将来)的内容进行展开,由此,能够获得主要提问的回答以外的个人数据(S51、S52),通过引出用户U1的潜在意向信息,在用户U1的扩展个人数据314中嵌入各属性的属性值(S53)。由此,进行个人的属性值和雇人侧要求的属性值之间的匹配,能够输出匹配度高的雇人数据(S54)。并且,通过概括器603,根据扩展个人数据生成简历作为职务履历书(S55)。
图21A和图21B是显示在用户U1的用户终端(浏览器)上的显示画面例。如图21A和图21B所示,在显示画面中,在提问显示部91上显示从阶梯对话引擎1给出的当前的提问,在回答显示部92上显示用户U1回答的内容。在对话记录显示部93上显示在此之前相互对话的内容。并且,在工作条件显示部94上显示在阶梯对话中由对话引擎1检测出的条件、即用户U1输入的条件。而且,在雇人列表显示部95上显示由阶梯对话引擎1检索到的雇人需求。
另外,图21A和图21B所示的显示画面是例示,除了图21A和图21B所示的显示画面以外,例如可以进行如下的显示。
(a)如果用户对所显示的公司名不满意,则追溯对话记录进行消除来显示。例如,当用户附加标记并点击时,标记以后的对话被取消,而再次从标记位置进行对话。
(b)当点击所显示的公司名时,作为该公司雇人条件的用户数据被强调显示。例如,在该公司的雇人条件为“职业种类:SE”、用户数据为“希望职业种类:SE”的情况下,用户数据的希望职业种类被强调显示。即,能够简单地知道各公司的雇人条件。
(c)还具有“放宽条件”按钮,用户观看当前所显示的公司列表,在条件缩小得过于严格的情况下,按压该按钮。按压该按钮后,系统进行放宽条件的提问。
在上述中说明了“深入”、“确认”、“贴近”的例子,但是,也可以如下所述进行“改变说法”、“信息提供”和“概括”。
例如在执行“改变说法”的情况下,领域知识例如是“提升职业技能(上位概念)”-“希望取得资格(下位概念)”的结构的情况下,当从用户的发话中取得“希望取得资格”这样的属性值时,参照该上位概念的值,应答“希望提升职业技能,是吗?”,由此能够实现“改变说法”。
并且,例如在执行“信息提供”的情况下,像领域知识为“巡回销售(route sales):访问确定顾客的企业”那样,能够对各值记叙其含义。而且,例如,在用户进行了“巡回销售是什么样的工作?”这样的发话的情况下,对“是什么样的工作?”进行发话解析,发话解析向对话控制转交“说明要求:巡回销售”这样的结果,由此,执行特别方案的说明方案,取得在本体中记述的巡回销售的含义,进行“巡回销售是访问确定顾客的销售。”这样的应答,由此能够实现“信息提供”。
并且,例如在执行“概括”的情况下,能够保持用户的发话履历并进行概括。在对话中途引用并出示其结果,由此能够顺利地进行对话。
(B-3)第2实施方式的效果
如上所述,根据第2实施方式,具有对话控制部、行动决定部、方案选择部和应答生成部,这些结构要件实现协作,由此,能够在用户和系统之间的阶梯对话中,展开根据用户的回答来探出潜在意向的对话。
(B-4)其他实施方式
(B-4-1)在第2实施方式中,作为服务站点的一例,例示了面向转职者的职业介绍站点,但是不限于此,能够广泛应用存在于网络上的信息。
并且,作为网络上的信息,可以将文本数据、图像数据、动态图像数据、音频数据等作为检索对象数据。
(B-4-2)第2实施方式中说明的阶梯检索引擎、对话管理装置所实现的各种结构要件的功能通过软件处理来实现。例如,作为硬件结构,构成为例如具有CPU、ROM和RAM等,通过使CPU使用处理所需要的数据来执行存储在ROM中的处理程序,由此实现各种结构要件的功能。
(B-4-3)第2实施方式中说明的对话管理装置不限于搭载在物理上上的同一装置上,各种结构要件也可以搭载在分散的装置上。即,可以分散配置各种结构要件。
(C)第3实施方式
下面,参照附图,详细地说明本发明的信息提取装置、方法以及程序的第3实施方式。
在第3实施方式中,例示出应用于如下的信息解析/信息检索系统的情况:该信息解析/信息检索系统利用本发明的信息提取装置、方法以及程序,例如采用阶梯型检索服务,从用户潜在意向的信息和检索对象信息中提取规定属性和属性值,检索并介绍与用户潜在意向的信息相匹配的信息。
(C-1)第3实施方式的结构
(C-1-1)阶梯型检索系统的整体结构的说明
关于应用了本发明的信息提取装置、方法以及程序的阶梯型检索系统,在第1实施方式中进行了说明。下面,对与第1实施方式相同的结构,标注相同的参照标号并省略说明。
对话管理单元10控制阶梯检索引擎1中的处理。对话管理单元10对希望进行检索的用户U1反复提出各种问题,根据用户U1对该问题的回答,引出用户真正潜在意向的信息,同时,检索与该潜在意向的信息相匹配的信息和内容,向用户U1进行介绍。
(C-1-2)关于信息提取处理
接着,参照附图详细地说明第3实施方式的信息提取装置。并且,以下以服务站点2是面向转职者的职业介绍领域站点的情况为例,进行说明。
第3实施方式的信息提取处理是如下的处理:取得服务站点2或Web信息4提供的信息(以下也称为检索对象数据),从该检索对象数据中把属性和该属性的属性值作为组进行提取,并且取得用户U1的应答信息,从该用户U1的应答信息中提取属性和该属性的属性值的组。
第3实施方式的信息提取装置优选在上述阶梯检索引擎1中,作为用户发话解析单元80和领域知识获得单元70的功能来实现。
当然,在上述阶梯检索引擎1中,对话管理单元10通过软件处理来实现与各种单元20~90的协作,一边基于阶梯手法与用户相互对话,一边介绍与用户的潜在意向对应的信息,所以,后述的信息提取处理的实现部位没有特别限定。
图22是示出第3实施方式的信息提取装置1100的结构的结构图。
如图22所示,第3实施方式的信息提取装置1100构成为至少具有:检索对象数据1110、用户输入语句1120、输入单元1130、信息提取方法切换单元1140、信息提取单元1150、领域知识DB 1160、信息存储单元1170、对象数据DB 1180以及个人登记数据DB 1190。
检索对象数据1110是通过网络从服务站点2作为检索对象取得的信息和从Web上取得的检索对象的Web信息4。该检索对象数据1110可以是开始与用户U1的对话后从服务站点2等取得的数据,或者也可以是预先存储在数据库中的数据。
用户输入语句1120是通过对话管理单元10的控制对用户U1提出的询问信息、和用户U1针对该询问信息的应答信息。用户输入语句1120从用户终端取得并由对话控制部101提供。另外,也可以临时存储在存储单元中。
输入单元1130取入检索对象数据1110或用户输入语句1120,将其提供给信息提取方法切换单元1140。检索对象数据1110或用户输入语句1120例如一句一句地被取入输入单元1130,一句一句地进行后述的信息提取处理。当然,也可以将多个语句取入输入单元1130,连续对多个语句进行信息提取处理。
信息提取方法切换单元1140从输入单元1130接受检索对象数据1110或用户输入语句1120后,根据该所输入的检索对象数据1110或用户输入语句1120,决定信息提取方法。
这里,作为信息提取方法,能够应用以下3种方法。
第1种信息提取方法使用存储在领域知识DB 1160中的领域知识信息,基于字符串匹配或语素解析后的匹配。
第2种信息提取方法是,进行句法解析处理,在是规定的语句结构的情况下,根据该语句结构进行解析而提取信息。例如,在来自用户U1的应答信息为“工作地点(主格)考虑东京(宾格)”那样,处于“(主格)=(宾格)”的关系的语句结构的情况下,仅提取该语句结构。由此,能够将“工作地点(主格)”和“东京(宾格)”对应起来。
第3种信息提取方法是,例如在提问语句是否定句或疑问句的情况下,提取回答语句中所包含的“是(YES)”、“不(NO)”、“哪个都不是”、“哪个都可以”、“什么都可以”等、表示用户针对询问的意图的信息。
并且,作为决定信息提取方法的方法,能够应用以下3个模式。另外,关于以下3个模式的决定方法,不是固定地设定在信息提取方法切换单元1140中,而是在一个语句的信息提取处理中,根据属性和属性值的结构来切换信息提取方法。
第1模式是预先决定与属性对应的信息提取方法的方法。该情况下,信息提取方法切换单元1140从所输入的检索对象数据1110或用户输入语句1120中检测属性,根据该属性来决定信息提取方法。
第2模式是预先将某个信息提取方法决定为默认方法的方法。该情况下,信息提取方法切换单元1140对所有属性决定默认的信息提取方法。
第3模式是通过属性值的结构要素来决定信息提取方法的方法。该情况下,信息提取方法切换单元1140判断从所输入的检索对象数据1110或用户输入语句1120提取出的属性值的结构要素,根据该属性值的结构要素来决定信息提取方法。并且,在信息提取方法切换单元1140起初以第1模式或第2模式进行动作的情况下,也可以根据属性值的结构要素的判断结果决定为第3模式。
信息提取单元1150通过由信息提取方法切换单元1140决定的信息提取方法,参照存储在领域知识DB 1160中的本体,同时从所输入的检索对象数据1110或用户输入语句1120中提取属性和属性值。并且,信息提取单元1150根据提取的属性的种类,决定要参照的本体,使用该本体提取属性值。
并且,信息提取单元1150也可以与增强器302协作,提取扩展后的信息。即,信息提取单元1150可以还针对作为提取对象的属性和属性值,提取类似的字符串或关联的字符串等的扩展后的字符串。
并且,信息提取单元1150虽然能够从用户输入语句1120中提取属性值,但是,在不清楚该属性值所属的属性的情况下,判断为具有模糊性,将表示该意思的内容提供给对话控制部101。对话控制部101接受到表示该意思的内容后,能够生成询问用户U1该属性值属于哪个属性的询问,并向用户U1发送。
领域知识DB 1160相当于上述的领域知识DB702,将多个领域知识作为本体的集合体进行存储。
图23A和图23B例示出领域知识的本体的集合体的结构。例如,图23A是“地名本体”的例子,图23B是“制度本体”的例子。
图23A的“地名本体”将“地名”作为最上位概念,作为其下位概念的字符串,链接有“关西地方”、“关东地方|首都圈”、“中部地方”,“地名”和“关西地方”、“关东地方|首都圈”、“中部地方”为亲子关系。进而,在“关西地方”的下位概念的字符串上链接有“大阪府”,“关西地方”和“大阪府”为亲子关系。这里,“关东地方|首都圈”的表述意味着“关东地方”和“首都圈”是同等的字符串。其他字符串的关系也同样通过链接来构成亲子关系。
信息存储单元1170将通过信息提取单元1150从检索对象数据中提取出的属性和属性值存储在对象数据DB 1180中,将从用户输入语句1120中提取出的属性和属性值存储在个人登记数据DB 1190中。
对象数据DB 1180相当于上述匹配对象分析单元30的对象数据DB303。并且,个人登记数据DB 1190相当于匹配对象分析单元30的个人登记数据DB 304。
(C-2)第3实施方式的动作
接着,参照附图详细说明第3实施方式的信息提取处理的动作。
图24是示出第3实施方式的信息提取装置1100从检索对象数据中提取属性和属性值时的处理的流程图。
在图24中,首先,通过输入单元1130读入检索对象数据1110后(步骤S1010),信息提取方法切换单元1140根据所输入的检索对象数据1110来决定信息提取方法。
信息提取方法切换单元1140检测所输入的检索对象数据1110中包含的开始标签(步骤S1020)。另外,在没有检测出开始标签的情况下,在检索对象数据1110是最后的数据时,结束处理,在除此之外时,返回步骤S1010,进行处理(步骤S1030)。
当在步骤S1020中检测出开始标签时,信息提取方法切换单元1140针对该开始标签以后的数据进行语素解析处理、句法解析处理、表达标准化处理,检测是否包含属性(步骤S1040)。
其中,语素解析处理、句法解析处理和表达标准化处理可以应用基于用户发话解析单元80的语素解析部804、句法解析部803和表达标准化部802的处理。另外,语素解析处理、句法解析处理和表达标准化处理可以广泛应用现有技术,这里省略说明。
然后,在检测出属性后,信息提取方法切换单元1140根据该属性决定信息提取方法(步骤S1050)。
这里,信息提取方法切换单元1140可以根据上述3个模式的信息提取方法的决定模式,来决定信息提取方法。
例如,图25A和图25B示出检索对象数据的例子,是由面向转职者的职业介绍站点提供的信息。该情况下,属性例如有“企业名”、“工作内容”、“工作地点”、“工作时间”、“休息日/假日”、“工资/奖金”、“待遇/福利”等左栏的记载事项。作为这些属性的属性值,有“×××株式会社”、“伴随事业扩大、保有权增强……”等右栏的记载事项。
例如,在根据提取出的属性而设定了信息提取方法的情况下,例如检测出属性“工作地点”时,信息提取方法切换单元1140决定预先在该属性“工作地点”中设定的字符串匹配和语素解析结果的匹配方法。
于是,信息提取单元1150通过由信息提取方法切换单元1140所决定的信息提取方法,从检索对象数据1110中将针对属性的属性值作为组进行提取(步骤S1060),将该属性和属性值的组存储在对象数据DB1180中(步骤S1070)。
例如,在使用了图25A和图25B的上述例子的情况下,针对属性“工作地点”,通过匹配提取出“东京都内”、“虎门”、“八王子等”,将各个属性值“东京都内”、“虎门”、“八王子等”分别与属性“工作地点”对应起来,并存储在对象数据DB 1180中。
在检测出结束标签为止(步骤S1080),读入检索对象数据1110(步骤S1090),反复进行属性值的提取处理。并且,检测出结束标签后(步骤S1080),暂时清除要提取的属性和信息提取方法(步骤S1095),返回步骤S1010,反复进行处理。
接着,说明第3实施方式的信息提取装置1100从用户输入语句1120中提取属性和属性值时的处理。
图26是示出信息提取装置1100从用户输入语句1120中提取属性和属性值时的处理的流程图。另外,在图26中,示出用户输入语句1120为一句时的处理,但是,针对所有用户输入语句1120,重复同样的处理。
在图26中,首先,通过输入单元1130读入用户输入语句1120(步骤S2010)。
此时,在该用户输入语句1120是针对问题的应答信息的情况下,该问题旨在向用户打听某个属性,对话管理单元10可以对信息提取方法切换单元1140提供是针对哪个属性的问题的应答信息(即属性指定)。
在存在该属性指定的情况下(步骤S2020),信息提取方法切换单元1140决定由对话管理单元10所指定的属性(步骤S2030),决定与该属性对应的信息提取方法(步骤S2040)。该情况下,信息提取方法切换单元1140能够根据上述3个模式的信息提取方法的决定模式,来决定信息提取方法。
另一方面,在没有属性指定的情况下(步骤S2020),信息提取方法切换单元1140设置为所有的属性为提取对象(步骤S2050),提取用户输入语句1120中所包含的属性,决定默认的信息提取方法(步骤S2060)。
作为该属性的提取方法,例如可以应用如下的方法:在用户输入语句1120中包含标签的情况下,通过检测该标签来判断属性,或者,针对用户输入语句1120中所包含的属性,通过字符串匹配等匹配处理来判断属性。
并且,在图26的步骤S2060中,例示了使用默认的信息提取方法的情况,但是,也可以设置全部3个模式的信息提取方法,还可以按照规定的顺序设置要使用的信息提取方法,直到提取出属性。
信息提取单元1150根据由信息提取方法切换单元1140决定的信息提取方法,来提取属性值(步骤S2070)。
此时,信息提取单元1150根据提取出的属性的种类,决定参照的本体,使用该本体来提取属性值。
图27是示出用户输入语句1120的例子的图。图28是示出信息提取单元1150参照的本体和属性之间的关系的图。
例如,在图27中,Q3是属性“待遇/福利”的提问,A3是其应答。该情况下,信息提取单元1150根据图28的关系,参照与属性“待遇/福利”对应的“制度本体”(图23B)。
然后,信息提取单元1150根据A3的“希望双休日。”的用户U1的应答信息,参照图23B所示的“制度本体”,提取与字符串“双休日”相匹配的“完全双休日制”作为属性值。
这样,信息提取单元1150参照与属性对应的本体,提取属性值。
在上述例子中,信息提取方法以使用字符串的匹配或语素解析结果的匹配为例示出,这里还例示其他例子。
例如,在图27中,Q4是属性“希望的职业种类”的提问,A4是其应答。信息提取单元1150参照与属性“希望的职业种类”对应的“职业种类本体”。
该情况下,信息提取方法切换单元1140对A4的“感兴趣的工作是与专利有关的工作。”进行解析后,识别到包含名词和动词的语句结构。因此,对A4进行句法解析,在A4是规定的语句结构(例如,“(主格)是(宾格)”这样的语句结构)的情况下,信息提取方法切换单元1140将信息提取方法从字符串等的匹配方法切换为使用了句法解析结果的方法。信息提取单元1150接受该切换后,根据A4的语句结构,解析为“感兴趣的工作(主格)”=“与专利有关的工作(宾格)”,提取与宾格的字符串“与专利有关”相匹配的“专利关联”作为属性值。
并且,例如,在图27中,Q5是针对属性“希望的职业种类”的深入的提问,A5是其应答。
Q5是“希望是专利许可交涉么?”这样的疑问句。该情况下,信息提取单元1150提取作为A5的应答的“不”,关于属性“希望的职业种类”,在“专利关联”中选择“专利许可交涉”以外的职业种类,作为用户U1的意图。
并且,信息提取单元1150对不清楚符合哪个属性的属性值的模糊的属性值,判断为其具有模糊性(步骤S2080),并将该具有模糊性的信息提供给对话管理单元10。由此,能够通过对话管理单元10的控制,向用户U1呈现具有模糊性的信息,由用户U1来选择(步骤S2090)。
例如,在图27中,Q6和A6是在此之前的对话中用户U1进行了“东京”这样的应答的情况。该情况下,用户U1应答了属性值“东京”,但是并不清楚该“东京”是指“工作地点”还是指“住址”。
因此,信息提取单元1150向对话管理单元10通知该“东京”是具有模糊性的属性值。对话管理单元10接受该通知,提出Q6那样“之前提到的东京是现在的工作地点还是住址”的、询问属性值“东京”的属性的询问。然后,信息提取单元1150从针对Q6的询问的应答A6“是当前的工作地点”中,提取属性“工作地点”,由此,取得属性“工作地点”和属性值“东京”的组。
如上所述,信息存储单元1170将信息提取单元1150提取出的用户输入语句1120的属性和属性值的组存储在个人登记数据DB 1190中(步骤S2100)。
如上所述,通过信息提取装置1100,将从检索对象数据1110和用户输入语句1120提取出的属性和属性值的组分别存储在对象数据DB 1180和个人登记数据DB 1190中。然后,接受对话管理单元10的控制,通过匹配单元20进行匹配处理,由此能够检索用户U1潜在意向的对象信息,并向用户U1介绍该检索信息。
(C-3)第3实施方式的效果
如上所述,根据第3实施方式,通过具有信息提取方法切换单元,由此能够适当地切换与输入信息的结构对应的信息提取方法。因此,通过该与输入信息的结构对应的信息提取方法,即使是丰富多彩地展开的对话,也能够适当地提取对话所包含的信息。
(C-4)其他实施方式
(C-4-1)在第3实施方式中,作为服务站点的一例,例示了面向转职者的职业介绍站点,但是不限于此,能够广泛应用于存在于网络上的信息。
并且,作为网络上的信息,可以将文本数据、图像数据、动态图像数据、音频数据等作为检索对象数据。
(C-4-2)第3实施方式中说明的阶梯检索引擎、信息提取装置所实现的各种结构要件的功能通过软件处理来实现。例如,作为硬件结构,构成为例如具有CPU、ROM、RAM等,通过使CPU使用处理所需要的数据来执行存储在ROM中的处理程序,由此实现各种结构要件的功能。
(C-4-3)第3实施方式中说明的信息提取装置不限于物理上搭载于同一装置上,各种结构要件也可以搭载在分散的装置上。即,可以分散配置各种结构要件。
并且,语言不限于日语,可以广泛地应用于英语、中文等外语。
(D)第4实施方式
下面,参照附图详细地说明本发明的对话系统、方法以及程序的第4实施方式。关于可以应用本发明的对话系统、方法以及程序的阶梯型检索系统,在第1实施方式中进行了说明。
(D-1)第4实施方式的结构
图29是示出第4实施方式的对话系统3010的主要结构的功能框图。图29示出将用户发话作为输入而生成系统发话的结构部分。
对话系统3010例如可以构筑为阶梯型检索装置等更大型装置的一部分。并且,对话系统3010也可以通过在PC(个人计算机)或服务器等通用的信息处理装置中安装对话程序(包含固定数据等)来构筑。无论如何,在功能上都可以用图29的结构表示。对话程序的安装不限于基于经由通信网络下载的方法,也可以是经由计算机可读取记录介质的方法。例如,如果是用作具有检索并提供转职公司的功能的阶梯型检索装置的一部分的情况,则在提供站点的Web服务器上搭载对话系统3010,其中,该站点用于提供转职公司。
在图29中,第4实施方式的对话系统3010具有:解析部3011、对象部位认定部3012、提取部3013以及变形部3014。对象部位认定部3012、提取部3013以及变形部3014构成重复回复应答生成部3015。
在对话系统3010中输入有由自然语言语句构成的用户发话。例如,用户将显示在用户终端即个人计算机上的Web网页上的、输入到发话语句输入用区域中的自然语言语句(文本)输入到对话系统3010中。并且,例如,该对话系统3010的搭载装置也可以具有键盘等的输入装置,来取入用户发话。并且,例如,也可以对用户终端的麦克风或该对话系统3010的搭载装置的麦克风捕捉到的语音(语音信号)进行识别处理,来取入用户发话。
解析部3011对用户发话进行语素解析和句法解析,按照单词(语素)进行区分,弄清语句的结构。语素解析和句法解析可以应用已知的解析方法。
对象部位认定部3012认定在用户发话中可以判断为适合进行重复回复的部位。在后述的动作说明中说明了判断基准和判断方法,如下列举几个判断基准。将用户发话中靠近末尾的“谓语+其目的语或主语”作为对象部位(的候选)。将用户发话中靠近末尾的“名词+其修饰语”作为对象部位(的候选)。将用户发话中的包含“無理(难以办到)”、“困る(为难)”、“したい(想)”、“できない(不能)”等的意思/主观表达或与其类似的表达的几个词语作为对象部位(的候选)。将不是意思/主观表达本身而记载了“困る(为难)”、“したい(想)”的内容的部位作为对象部位(的候选)。在存在多个对象部位(的候选)的情况下,对象部位认定部3012按照预先确定的规则,将其缩小范围到1个对象部位。通过动作说明来理解具体方法。
提取部3013从对象部位认定部3012认定的用户发话中的对象部位及其附近,提取(选择)由于重复回复而成为自然长度的部分(句法树中的子树)。如由动作说明中后述那样,没有大幅偏离由表达的种类所决定的标准长度(例如3个词语)的词语数量(4个词语或2个词语)是被允许的。另外,也可以设定上限的词语数量而不是标准长度,来保证重复回复的自然长度(在短的情况下,不执行不合理地增加)。在提取部3013提取出的部分(句法树中的子树)长且是不能允许的长度的情况下,进行缩短。在缩短中,按照规定的规则,删除目的语或主语,或者删除修饰语。
在提取部3013获得的重复回复用部分符合规定规则的情况下,变形部3014对表达进行变形(或整形)。例如,变换时态或变换为敬语表达。并且,如果在提取出名词(句子)的情况下,附加“ですね?(是……吧?)”或“ですね。(是……吧。)”。
经变形部3014处理后的重复回复用部分(自然语言语句)成为系统发话。系统发话例如加在显示在用户终端即个人计算机上的Web网页上进行显示。并且,例如该对话系统3010的搭载装置也可以具有显示装置,来显示系统发话。此外,例如也可以对由文本数据构成的系统发话实施语音合成,从用户终端的扬声器或该对话系统3010的搭载装置的扬声器发出系统发话的语音(语音信号)。
另外,解析部3011、对象部位认定部3012、提取部3013以及变形部3014例如由如下硬件资源来实现:该硬件资源包含专用的控制设备、或执行程序的处理器(CPU)、存储由该处理器执行的程序和数据的RAM(Random Access Memory,随机存取存储器)、ROM、HDD等存储设备。
并且,在上述说明中,按照不同功能进行了说明,但是并不需要按照各部分明确地分离和独立地准备要实现的硬件的物理结构。例如,存储对象部位认定部3012的程序的HDD可以与存储解析部3011的解析用辞典数据的HDD共用,此外也可以利用实现其他功能的装置的一部分。此外,构成该对话系统3010的一部分也可以配置在利用网络连接的其他场所。
(D-2)第4实施方式的动作
接着,参照附图说明具有以上各部的第4实施方式的对话系统3010的动作(第4实施方式的对话方法)。图30是示出第4实施方式的对话系统3010的动作的流程图。
第4实施方式的对话系统3010在输入用户发话后,开始图30所示的处理,依次执行由解析部3011进行的语素解析/句法解析(S3100)、由对象部位认定部3012进行的对象部位认定(S3101)、由提取部3013进行的提取(S3102)、由变形部3014进行的变形(整形)(S3103),来形成系统发话。以下,详细叙述各步骤S3100、S3101、S3102、S3103的处理。
解析部3011通过公知的解析方法进行语素解析和句法解析(S3100)。图31示出针对用户发话“人と接しながら自分が人間として成長できる仕事がしたい(想从事与人接触同时能够使自己作为社会人成长的工作)”的语素解析结果,图32示出针对该语素解析结果的句法解析结果(句法树)。
对象部位认定部3012利用内置的图33所示的认定用特殊表达列表来认定重复回复的对象部位(S3101)。
如图33所示,认定用特殊表达列表规定了小组名称、具体的特殊表达和提取中心。
关于第1行L3011,在用户发话中包含有“したい(想)”、“希望する(希望)”、……等特殊表达(在列表中以现在形、原形等记述,但是,以其他形式包含在用户发话中也符合;其他行也同样)的情况下,属于“意思表达”的小组,表示将该以“したい(想)”、“希望する(希望)”等作为谓语的主要部分的核心名词处于提取中心。图32的解析结果例包含“したい(想)”,所以,符合该情况,将主要部分的核心名词即“仕事(工作)”作为提取中心。
关于第2行L3012,在用户发话中包含有“困る(为难)”、“無理(难以办到)”、“できる(能够)”、……等特殊表达的情况下,属于“主观表达”的小组,表示该“困る(为难)”、“無理(难以办到)”、“できる(能够)”等之前的相关要素中的核心名词处于提取中心。图32的解析结果例包含“できる(能够)”,所以,符合该情况,将之前的相关要素中的核心名词即“成長(成长)”作为提取中心。并且,如果用户发话为“…残業が少ないところでないと困ります(……不是加班少的地方就会很为难)”,则将“ところ(地方)”作为提取中心。
关于第3行L3013,在用户发话中包含有“気づく(注意)”、“
Figure A200810176359D0057083917QIETU
する(经验)”、……等特殊表达的情况下,属于“活动表达”的小组,表示该“気づく(注意)”、“
Figure A200810176359D0057083917QIETU
する(经验)”等特殊表达(核心用语)本身处于提取中心。例如,如果用户发话为“…活かせる仕事だつて気づいたんです(……已经注意到这是充分利用我的经验的工作)”,则将“気づく(注意)”作为提取中心。
关于第4行L3014,在用户发话中包含有“ある(有)”、“ない(没有)”、……等特殊表达的情况下,属于“有无表达”的小组,表示将该“ある(有)”、“ない(没有)”等特殊表达作为谓语的主要部分的核心名词处于提取中心。例如,如果用户发话为“…伸びているところの方が社内の勢いがありそうだから(……因为不断发展的人在公司内部有气势)”,则将“勢い(气势)”作为提取中心。
对象部位认定部3012确认在图33的认定用特殊表达列表中的“具体的特殊表达”中所记载的表达是否存在于上述解析结果中。在存在的情况下,对象部位认定部3012将相当于特殊表达列表中的相应行的“提取中心”的解析结果(用户发话)的部位认定为对象部位。在存在多个所认定的对象部位的情况下,在句法解析结果中,选择离主句的谓语部最近的部位。即,鉴于句法解析结果中的距离来进行选择,而不是根据所出现的文字串的距离来进行选择。在图32的句法解析结果中,在与特殊表达列表的核对中,存在特殊表达“たい(想)”所涉及的对象部位“仕事(工作)”和特殊表达“できる(能够)”所涉及的对象部位“成長(成长)”,但是,由图32可知,与主句的谓语部“したい(想)”距离短的对象部位是“仕事(工作)”,所以,对象部位“仕事(工作)”占据提取中心。
提取部3013利用内置的图34所示的提取用特殊表达列表,来提取重复回复中利用的用户发话部分(S3102)。基本上,提取部3013取出将对象部位认定部3012认定的、对象部位的提取中心的词语(组)作为根的子树(作为句法解析结果形成的树状的一组),由此来提取重复回复中利用的用户发话部分。提取部3013判别所取出的用户发话部分是否在上限词语数量以内,其中,该上限词语数量是基于提取用特殊表达列表中的后述的词语数量标准而确定的,在处于该上限词语数量以内的情况下,直接将所取出的用户发话部分作为提取结果,当不在该上限词语数量以内的情况下,按照提取用特殊表达列表中的后述的提取(要素选择)规则,从所取出的用户发话部分中削减一部分表达,使其成为上限词语数量以下,将削减后的用户发话部分作为提取结果。
如图34所示,提取用特殊表达列表规定了小组名称、词语数量标准和提取规则。
第1行L3021记述了,属于“意思表达”小组的规定部位的词语数量标准为5,在所取出的用户发话部分(子树)的词语数量比基于该词语数量标准而确定的上限个数多的情况下,如下所述进行词语数量削减。削减应用如下的方法:第1,删除针对提取中心(参照图33)的修饰要素中远离(提取中心)的修饰要素;第2,在远近相同的情况下,删除主格、宾格等语格要素以外的词语;第3,在语格要素方面也相同的情况下,删除出现字符串上的远的一方。以单词或子树的枝作为最小单位来进行这里所述的删除,按照第1~3的规则反复进行削减,直到处于上限个数以内。例如,当设上限个数为词语数量标准+1词语时,“意思表达”小组的上限词语数量为6个词语。
针对图32的句法解析结果,如上所述,“仕事(工作)”为提取中心并成为根,所以,在重复回复用的用户发话部分(子树)的取出中,取出“自分が人間として成長できる仕事(能够使自己作为社会人成长的工作)”(7个词语)。超过作为上限个数的6个,所以,进行一部分的删除。这里,“自分が(自己)”和“人間として(作为社会人)”相对于“仕事(工作)”的远近处于相同水平,但是,通过删除语格要素以外的要素这样的第2规则,保留が格(主格)的“自分が(自己)”,删除“人間として(作为社会人)”。由此,词语数量为5,在作为上限个数的6以内,所以,将进行了该删除后的阶段作为提取结果。即,“自分が成長できる仕事(能够使自己成长的工作)”成为提取结果。该提取结果不是用户发话的连续的一部分,而是连接了2个部位的结果。
以上,假设了无法允许偏离词语数量标准的情况中的词语个数多的情况,在少于词语数量标准的情况下,也可以进行追加(对图34的各行均同样)。追加规则与删除时的规则对称即可。例如应用如下方法:第1,追加针对提取中心(参照图33)的修饰要素中接近(提取中心)的修饰要素;第2,在远近相同的情况下,优先追加主格、宾格等语格要素;第3,在语格要素方面也相同的情况下,追加出现字符串上近的一方。
提取用特殊表达列表的第2行L3022记述了,属于“主观表达”小组的规定部位的词语数量标准为2,在所取出的用户发话部分(子树)的词语数量比基于该词语数量标准而确定的上限个数多的情况下,删除针对提取中心(参照图33)的修饰要素中远离(提取中心)的修饰要素。但是,以下两种情况为例外。在修饰要素中存在用言的情况下,例外地不删除相当于其主格和宾格的要素。在删除的结果为仅有核心名词的情况下,不进行删除,保持词语数量超出的状态,将其作为提取结果。
如果用户发话为“…残業が少ないところでないと困ります(……不是加班少的地方就会很为难)”,则如上所述,将“ところ(地方)”作为提取中心,首先取出“残業が少ないところ(加班少的地方)”(4个词语)作为重复回复用的用户发话部分(子树)。子树的词语数量超过上限个数,所以,由于“残業が(加班)”远而要删除,但是相对于“残業が(加班)”,存在“少ない(少)”这样的用言,所以,不删除“残業が(加班)”。为了在基于词语数量而确定的上限数量以内,只能将“残業が少ない(加班少)”全部删除,但是,这样成为仅有核心名词“ところ(地方)”,所以,准许该超出词语数量的情况,将“残業が少ないところ(加班少的地方)”作为最终的提取结果。
提取用特殊表达列表的第3行L3023记述了,属于“活动表达”小组的规定部位的词语数量标准为1,仅将被认定为提取中心(参照图33)的核心用言作为提取结果。
例如,在用户发话为“…活かせる仕事だつて気づいたんです(……已经注意到这是充分利用我的经验的工作)”,并将“気づく(注意)”作为提取中心的情况下,无法特意分割“気づく(注意)”,所以,仅将该核心用言作为提取结果,不执行削减。
提取用特殊表达列表的第4行L3024记述了,属于“有无表达”小组的规定部位的词语数量标准为2,在所取出的用户发话部分(子树)的词语数量比基于该词语数量标准而确定的上限个数多的情况下,删除针对提取中心(参照图33)的修饰要素中远离(提取中心)的修饰要素。
例如,如果用户发话为“…伸びているところの方が社内の勢いがありそうだから(……因为不断发展的人在公司内部似乎有气势”,并将“勢い(气势)”作为提取中心,则取出“社内の勢い(公司内部的气势)”(3个词语)作为重复回复用的用户发话部分(子树)。“社内の勢い(公司内部的气势)”(3个词语)在上限个数(3个词语)以内,所以,原样将“社内の勢い(公司内部的气势)”作为提取结果。另外,没有记载句法树,但是,“伸びているところの方が(不断发展的人)”与“ありそう(似乎有……)”有直接关系,所以,从提取中心“勢い(气势)”来看,“伸びているところの方が(不断发展的人)”在提取对象以外。
变形部3014按照以下的内部记录的变形规则等,对提取部3013所提取的提取结果的字符串进行变形(整形)(S3103)。例如,预先准备用于变换为敬语的对应表,在标题匹配时进行变形(变换)。作为例子,准备并应用将“気づく(注意)”变换为“気づかれる(注意)”(尊敬语),将“自分(自己)”变换为“ご自分(自己)”(礼貌语)这种对应表。除此之外,例如在提取结果以名词(句子)结束的情况下,附加“ですね?(是……吧?)”或“ですね。(是……吧。)”。最后,实施一般的语素生成(与语素解析相反的步骤),以应用不会使人感到奇怪的自然的日语形式输出。
另外,当对象部位认定部3012和提取部3013的处理结束时,在无法提取的情况下,不进行重复回复应答的系统发话。
(D-3)第4实施方式的效果
根据第4实施方式,预先准备认定用特殊表达列表,探寻用户发话中的意思/主观表达,优先在应答(系统发话)中利用意思/主观表达或其周边的要素,所以,能够有效地表现出对用户的亲近感。
此外,根据第4实施方式,与现有装置不同,不仅提取谓语和语格要素的中心语,还判断优先利用的部位,决定在应答中利用哪个词语或其周边要素,在此之上,删除(追加)要素以符合事前设定的标准的长度,所以,系统应答的长度为自然的长度,能够保证对话的自然度。
此外,根据第4实施方式,通过变形部3014对从用户发话中取出的部分应用变形(换说法处理),使其成为最终的重复回复的系统发话,所以,能够防止应答单调或不自然。
如上所述,有效地表现出亲近感,并且,保证了对话的自然度,其结果是,对话很活跃,容易从用户收集信息。
(E)第5实施方式
接着,参照附图详细地说明本发明的对话系统、方法以及程序的第5实施方式。
图35是示出第5实施方式的对话系统3010A的主要结构的功能框图,对与第4实施方式的图29相同、对应的部分标注相同标号进行表示。
第5实施方式的对话系统3010A在第4实施方式的对话系统3010的结构的基础上,还具有下一话题选择部3020和话题数据库3021。
在话题数据库(话题DB)3021中存储有对话方案信息和系统发话等。例如,在介绍转职公司的检索装置中组装了对话系统3010A的情况下,针对各项目,分层存储与工作希望地点、希望年收入、工作时间(包含可允许的加班时间)、星期几工作等多个项目有关的系统发话(例如,针对询问工作希望地点的系统发话,如果用户发话中希望关东地方,则转移到在更小区域中引出希望的系统发话),并且,存储某个项目内的系统发话的转移方法(对话方案)、以及当某个项目的信息收集结束时,转移到哪个项目的系统发话的转移方法(对话方案)等。
在第5实施方式中,对象部位认定部3012在无法认定对象部位的情况下,向下一话题选择部3020通知表示该意思的内容,并且,在提取部3013也无法进行提取的情况下,向下一话题选择部3020通知表示该意思的内容。下一话题选择部3020在对象部位认定或提取没有成功的情况下,按照话题数据库3021的存储内容,取出系统发话(下一话题)并输出。
根据第5实施方式,能够发挥与第4实施方式相同的效果,并且还发挥能够通过系统的主导来转换话题的效果。换言之,在仅有重复回复应答时,可能出现不转换到其他话题的情况,但是,该第5实施方式能够避免该情况。
(F)第6实施方式
接着,参照附图详细地说明本发明的对话系统、方法以及程序的第6实施方式。
图36是示出第6实施方式的对话系统3010B的主要结构的功能框图,对与第4实施方式的图29相同、对应的部分标注相同标号进行表示。
第6实施方式的对话系统3010B在第4实施方式的对话系统3010的结构的基础上,在重复回复应答生成部3015B内具有换说法部3030。
换说法部3030内置同义语句辞典,如果提取出的用户发话部分的全部或一部分语句能够替换为其他的表达,则进行替换,将提取出的用户发话部分置换为内容相同的其他表达。同义语句辞典例如是使某个语句和其换说法语句成对的数据库。例如,是将“うまく回る(顺利进行)”作为索引,能够获得“スム—スに進む(顺利进行)”作为替换语句的数据库。通过查找该数据库,在从用户发话中提取出“仕事がうまく回る(工作顺利进行)”这样的短句的情况下,对其改变说法,成为“仕事はスム—スに進んでいる(工作顺利进行)”。
变形部3014在换说法部3030没有动作的情况下,对提取部3013的提取结果执行变形处理,在换说法部3030动作的情况下,对从换说法部3030输出的作为提取结果的换说法字符串执行变形处理。
根据第6实施方式,能够发挥与第4实施方式相同的效果,并且,还能够对用户使用的表达进行改变说法来形成系统发话,能够防止重复回复应答的单调。
(G)第7实施方式
接着,参照附图详细地说明本发明的对话系统、方法以及程序的第7实施方式。
图37是示出第7实施方式的对话系统3010C的主要结构的功能框图,对与第4实施方式的图29相同、对应的部分标注相同标号进行表示。
第7实施方式的对话系统3010C在第4实施方式的对话系统3010的结构的基础上,在重复回复应答生成部3015C内具有短句附加部3040。
短句附加部3040内置用于取出附加用短句(随声附和)的数据库,根据提取部3013的提取结果的内容(或原本的用户发话内容),从“そうですか(是吗)”、“つらいですね(好难过啊)”、“大変でしたね(不得了)”、“よかつたですね(好棒啊)”等附加用短句中选择适当的短句。例如,“そうですか(是吗)”作为不考虑感情而附加的通用的短句来利用。例如,将“できない(无法)”、“~られない(……不能)”等词条和“つらいですね(好难过啊)”这样的短句成对地保存在数据库中,如果在提取部3013提取出的结果中存在该数据库的词条,则选择与其成对的短句并发送到变形部3014C。并且,例如,也可以在图33的认定用特殊表达列表中的小组中设置子组(如果是主观表达,则“できる(能够)”是相应的肯定主观表达;“困る(为难)”、“無理(难以办到)”是相应的否定主观表达),在用于取出附加用短句(随声附和)的数据库的标题侧利用子组名。
在短句附加部3040中的用于取出附加用短句(随声附和)的数据库中,还存储附加位置信息,该附加位置信息规定是在附加对象的重复回复应答的前面附加还是在附加对象的重复回复应答的末尾附加,短句附加部3040将选择短句和附加位置信息发送到变形部3014C。例如,“そうで寸か(是吗)”规定为在重复回复应答的前面附加,“つらいですね(好难过啊)”规定为在重复回复应答的末尾附加。
变形部3014C在变形处理后的重复回复应答的前面或末尾添加从短句附加部3040发送来的短句(随声附和),作为系统发话输出。
根据第7实施方式,能够发挥与第4实施方式相同的效果,并且能够将从多种短句中选择的短句(随声附和)放入重复回复应答中,所以,能够更强烈地发挥亲近感。
(H)第8实施方式
接着,参照附图详细地说明本发明的对话系统、方法以及程序的第8实施方式。
图38是示出第8实施方式的对话系统3010D的主要结构的功能框图,对与第4实施方式的图29相同、对应的部分标注相同标号进行表示。
第8实施方式的对话系统3010D在第4实施方式的对话系统3010的结构的基础上,在重复回复应答生成部3015D内具有系统发话确认部3050。并且,第8实施方式的对话系统3010D的构成要素还有系统发话履历数据库(系统发话履历DB)3051。
系统发话履历数据库3051至少存储刚才的系统发话。例如,能够将存储对话(系统发话和用户发话)履历的数据库用作第8实施方式的系统发话履历数据库3051。
从对象部位认定部3012D向系统发话确认部3050提供要被认定为对象部位的要素词语(参照图33的提取中心)的信息。系统发话确认部3050确认要被认定为对象部位的要素词语是否与存在于系统发话履历数据库3051中的刚才的系统发话所包含的词语一致。在刚才的系统发话中包含有要被认定为对象部位的要素词语的情况下,系统发话确认部3050向对象部位认定部3012D进行通知,将该要素词语从对象部位的认定候选中排除。
例如,在要被认定为对象部位的要素词语的候选为1个的情况下,当从对象部位的认定候选中排除该要素词语时,针对本次的用户发话不进行重复回复应答。并且,例如,在要被认定为对象部位的要素词语的候选为多个的情况下,当从对象部位的认定候选中排除一部分要素词语时,从剩余的认定候选中选择一个。
根据第8实施方式,能够发挥与第4实施方式相同的效果,并且将重复回复应答的候选与过去的系统发话进行比较,所以,能够防止由于重复回复应答而使相同内容的系统发话重复,能够实现自然的对话。
(I)其他实施方式
在所述实施方式的说明中言及了各种变形实施方式,但是,可以进一步列举以下所例示的变形实施方式。
所述各实施方式的技术特征如果可以组合起来应用,则也可以组合起来应用。
在第4实施方式中,示出利用包含图33所示的具体的特殊表达在内的认定用特殊表达列表,同时认定重复回复的对象部位的情况,但是,除此之外,也可以利用属性和属性值等来认定重复回复的对象部位。例如,可以利用属于时间属性或地域属性的表达来认定重复回复的对象部位。在用户发话为“残業は2時間以内でお願いします(希望加班在2小时以内)”或“30分以内の残業が良いです(可以加班30分钟以内)”时,可以利用时间属性来认定对象部位,使得“2時間以内(2小时以内)”、“30分以内(30分钟以内)”成为重复回复的对象部位的认定候选。关于属性值,也可以预先确定图33那样的提取中心、图34那样的词语数量标准和提取规则。
在第5实施方式中,示出在没有得到重复回复的情况下将系统发话切换为下一话题的情况,但是,在得到重复回复的情况下,也可以将系统发话切换为下一话题。例如,可以对重复回复应答的连续次数进行计数,当连续次数达到规定次数时,将下一次的系统发话切换为下一话题。该情况下,可以在下一话题之前附加重复回复应答,作为系统发话。
在第6实施方式中,示出改变说法的候选为1个的情况,但是,也可以对同一改变说法前的词语准备多个改变说法词语的候选。该情况下,改变说法时应用最早进行的改变说法词语的候选即可。
在第7实施方式中,示出在短句附加条件成立时一直附加短句的情况,但是,也可以根据附加的连续次数和附加比例等,来决定在短句附加条件成立时是否附加短句。例如,在连续进行了2次短句的附加后的下一次的系统发话中不附加短句。
在第8实施方式中,示出在对象部位的要素词语候选包含于刚才的系统发话中的情况下将该要素词语从候选中排除的情况,但是,也可以在该要素词语包含于过去几次系统发话中的情况下,从候选中排除该要素词语。
在所述实施方式中,对使用日语的情况进行了说明,但是,本发明不限于此,例如也可以应用英语等其他语言。
在所述实施方式中,使用日本的地名等,但是,本发明不限于此,例如也可以应用美国等其他国家的地名。
检索系统可以包含第1~第8实施方式的至少2个实施方式。

Claims (29)

1.一种信息检索装置,该信息检索装置包含:
用户发话解析单元,其通过与用户的对话,针对多个属性分别向用户提出提问语句,根据用户针对该提问语句的回答语句,对针对各个所述属性的属性值进行解析;
用户数据保持单元,其保持用户数据,作为所述用户发话解析单元的解析结果,在所述用户数据中将所述多个属性和针对各个所述属性的用户的属性值对应起来;
匹配单元,其参照所述用户数据,针对所有属性,在从用户的回答得到的所述属性值的取得比例在规定值以上的情况下,从多个对象数据中选出与该用户数据的各个所述属性和各个所述属性值相匹配的至少一个对象数据候选;以及
对话控制单元,其向用户侧输出由所述匹配单元选出的各个所述对象数据候选。
2.根据权利要求1所述的信息检索装置,其中,
所述匹配单元包括:
评价值计算部,其在所述属性值的取得比例小于规定值的情况下,计算所述用户数据中的针对所述所有属性的各个所述属性值的评价值;以及
属性选择部,其参照规定的属性判定规则,进行与所述评价值计算部的评价值计算结果对应的属性选择处理。
3.根据权利要求2所述的信息检索装置,其中,
所述属性选择部从进行优先级高的属性开始依次选择进行与用户之间的对话的对话方案。
4.根据权利要求1所述的信息检索装置,其中,
所述对话控制单元从与所述用户的输出优先级高的属性相匹配的所述对象数据候选开始依次进行输出。
5.根据权利要求1所述的信息检索装置,其中,通过对话管理装置进行与用户的对话,该对话管理装置包含:
对话方案数据库,其存储多个对话方案;
方案选择单元,其从所述对话方案数据库中选择与从信息请求单元所请求的信息有关的对话方案;
应答生成单元,其根据由所述方案选择单元所选择的所述对话方案,生成与所述所请求的信息有关的应答语句,将该应答语句提供给用户终端;
行动决定单元,其从回答语句解析单元接受属性和针对所述属性的属性值作为回答语句解析结果,根据所述属性和所述属性值,从所述对话方案数据库中检索符合应答条件的至少一个所述对话方案,按照各个所述对话方案决定之后的行动,其中,回答语句解析单元对针对所述应答语句的用户回答语句进行解析;以及
对话控制单元,其按照由所述行动决定单元所决定的之后的行动,进行与用户之间的对话控制。
6.根据权利要求5所述的信息检索装置,其中,
在对话管理装置中,各个所述对话方案具有:通常方案,其引出与所述属性有关的用户的属性值;以及特别方案,其用于在与用户的对话中应对来自用户的不规则发话、或顺利地进行与用户的对话。
7.根据权利要求5所述的信息检索装置,其中,
在对话管理装置中,各个所述对话方案对所述属性、所述应答条件、表示符合所述应答条件时随后执行的动作的应答动作进行定义。
8.根据权利要求6所述的信息检索装置,其中,
在对话管理装置中,各个所述对话方案的应答动作包含应答语句继续信息,该应答语句继续信息具有用于继续或结束该对话方案的应答、或者调出其他对话方案的信息。
9.根据权利要求5所述的信息检索装置,其中,
在对话管理装置中,所述行动决定单元根据所述属性和所述属性值从所述对话方案数据库中检索符合应答条件的至少一个所述对话方案时,从所述特别方案中进行检索,然后从所述通常方案中进行检索。
10.根据权利要求5所述的信息检索装置,其中,
在对话管理装置中,对所述对话方案的各个所述应答动作赋予优先级,在所述行动决定单元检索了多个所述对话方案的情况下,所述对话控制单元按照赋予所述应答动作的所述优先级,执行所述各对话方案的所述应答动作。
11.根据权利要求1所述的信息检索装置,其中,通过潜在意向提取系统根据与用户之间相互的对话信息来提取用户的潜在意向,所述潜在意向提取系统包含:
对话管理装置,其对用户的用户终端提供应答语句,接受针对所述应答语句的回答语句,按照规定的对话方案进行与用户的对话;
回答语句解析装置,其对从所述用户终端接受的用户回答语句进行解析;以及
对话信息蓄积装置,其按照每个用户蓄积每个所述对话方案的对话信息,
其中,所述对话管理装置包含:
对话方案数据库,其存储多个对话方案;
方案选择单元,其从所述对话方案数据库中选择与从信息请求单元所请求的信息有关的对话方案;
应答生成单元,其根据由所述方案选择单元所选择的所述对话方案,生成与所述所请求的信息有关的应答语句,将该应答语句提供给用户终端;
行动决定单元,其从回答语句解析单元接受属性和针对所述属性的属性值作为回答语句解析结果,根据所述属性和所述属性值,从所述对话方案数据库中检索符合应答条件的至少一个所述对话方案,按照各个所述对话方案决定之后的行动,其中,回答语句解析单元对针对所述应答语句的用户回答语句进行解析;以及
对话控制单元,其按照由所述行动决定单元所决定的之后的行动,进行与用户之间的对话控制。
12.根据权利要求1所述的信息检索装置,其中,通过信息提取装置根据来自用户的回答语句得到属性,所述信息提取装置包含:
知识数据库,其系统地对多个领域的多个术语的关系进行分类;
输入单元,其取入输入信息;
信息提取单元,当检测出所述输入信息中所包含的提取对象的属性时,所述信息提取单元使用所述知识数据库中的与所述属性有关的领域的知识,提取所述输入信息中包含的针对所述属性的属性值;以及
提取信息存储单元,其将由所述信息提取单元提取出的所述属性和该属性的所述属性值对应起来进行存储。
13.根据权利要求12所述的信息检索装置,其中,
在所述的信息提取装置中,所述信息提取单元具有信息提取方法决定部,所述信息提取方法决定部根据规定的指定信息来决定从所述输入信息中提取所述属性值的提取方法。
14.根据权利要求13所述的信息检索装置,其中,
在所述的信息提取装置中,所述信息提取单元通过所述知识数据库中的与所述属性有关的领域知识和构成所述输入信息的字符串或形态解析结果之间的匹配,来提取针对所述属性的所述属性值。
15.根据权利要求13所述的信息检索装置,其中,
在所述的信息提取装置中,在所述输入信息是由具有所述属性和所述属性值的对应关系的规定语句结构构成的情况下,所述信息提取单元通过所述输入信息的句法解析,提取所述规定的语句结构。
16.根据权利要求13所述的信息检索装置,其中,
在所述信息提取装置中,所述信息提取单元提取所述输入信息中所包含的表示用户的意图的信息。
17.根据权利要求1所述的信息检索装置,其中,通过对话系统进行与用户的对话,该对话系统在人和作为与人之间的界面的装置之间接收和发送自然语言语句的数据,来进行与人的对话,所述对话系统包含:
解析部,其对人的发话进行解析;
对象部位认定部,其利用所述解析结果,认定用于从人的发话中提取系统发话用的要素的对象部位;以及
提取部,其根据所述对象部位,从人的发话中提取要素,以使系统发话成为适当的长度。
18.根据权利要求17所述的信息检索装置,其中,
所述对话系统还包含变形部,所述变形部将所提取的人的发话要素变形为自然的形式,作为系统发话。
19.根据权利要求17所述的信息检索装置,其中,
在对话系统中,根据人的发话中所使用的特定表达的种类的不同,所述对象部位认定部认定的对象部位不同。
20.根据权利要求17所述的信息检索装置,其中,
在对话系统中,根据人的发话中所使用的特定表达的种类的不同,所述提取部的提取方法不同。
21.根据权利要求17所述的信息检索装置,其中,
所述对话系统还包含下一话题选择部,所述下一话题选择部在所述对象部位认定部的对象部位认定未成功的情况下,或所述提取部的提取未成功的情况下,从话题数据库中取出与下一话题有关的系统发话并输出。
22.根据权利要求17所述的信息检索装置,其中,
所述对话系统还包含换说法部,所述换说法部将由所述提取部提取出的要素词语变换为其他表达。
23.根据权利要求17所述的信息检索装置,其中,
所述对话系统还包含短句附加部,在由所述提取部提取出的要素词语或人的发话中包含成为随声附和的触发的词语的情况下,所述短句附加部生成与其相称的随声附和的短句,
其中,在根据所述提取部的提取结果而确定的系统应答中附加随声附和短句,作为最终的系统应答。
24.根据权利要求17所述的信息检索装置,其中,
所述对话系统还包含系统发话确认部,所述系统发话确认部确认所述对象部位认定部要认定的对象部位的词语是否与之前几次的系统发话中所包含的词语一致,
其中,所述对象部位认定部在认定对象部位时,询问所述系统发话确认部,在与之前几次的系统发话中所包含的词语一致的情况下,不将其作为对象部位。
25.一种信息检索系统,所述信息检索系统包含:
信息检索装置;
对话管理装置;
信息提取装置;以及
对话系统,
其中,
所述信息检索装置包含:
用户发话解析单元,其通过与用户之间的对话,针对多个属性分别向用户提出提问语句,根据用户针对该提问语句的回答语句,对针对各个所述属性的属性值进行解析;
用户数据保持单元,其保持用户数据,作为所述用户发话解析单元的解析结果,在所述用户数据中将所述多个属性和针对各个所述属性的用户的属性值对应起来;
匹配单元,其参照所述用户数据,针对所有属性,在从用户的回答得到的所述属性值的取得比例在规定值以上的情况下,从多个对象数据中选出与该用户数据的各个所述属性和各个所述属性值相匹配的至少一个对象数据候选;以及
对话控制单元,其向用户侧输出由所述匹配单元选出的各个所述对象数据候选,
所述对话管理装置包含:
对话方案数据库,其存储多个对话方案;
方案选择单元,其从所述对话方案数据库中选择与从信息请求单元所请求的信息有关的对话方案;
应答生成单元,其根据由所述方案选择单元所选择的所述对话方案,生成与所述所请求的信息有关的应答语句,将该应答语句提供给用户终端;
行动决定单元,其从回答语句解析单元接受属性和针对所述属性的属性值作为回答语句解析结果,根据所述属性和所述属性值,从所述对话方案数据库中检索符合应答条件的至少一个所述对话方案,按照各个所述对话方案决定之后的行动,其中,回答语句解析单元对针对所述应答语句的用户回答语句进行解析;以及
对话控制单元,其按照由所述行动决定单元所决定的之后的行动,进行与用户之间的对话控制,
所述信息提取装置包含:
知识数据库,其系统地对多个领域的多个术语的关系进行分类;
输入单元,其取入输入信息;
信息提取单元,当检测出所述输入信息中所包含的提取对象的属性时,所述信息提取单元使用所述知识数据库中的与所述属性有关的领域的知识,提取所述输入信息中包含的针对所述属性的属性值;以及
提取信息存储单元,其将由所述信息提取单元提取出的所述属性和该属性的所述属性值对应起来进行存储,
所述对话系统包含:
解析部,其对人的发话进行解析;
对象部位认定部,其利用所述解析结果,认定用于从人的发话中提取系统发话用的要素的对象部位;以及
提取部,其根据所述对象部位,从人的发话中提取要素,以使系统发话成为适当的长度。
26.一种信息检索方法,该信息检索方法包含:
(a)通过与用户的对话,针对多个属性分别向用户提出提问语句,根据用户针对该提问语句的回答语句,对针对各个所述属性的属性值进行解析;
(b)保持用户数据,作为(a)中的解析结果,在所述用户数据中将所述多个属性和针对各个所述属性的用户的属性值对应起来;
(c)参照所述用户数据,针对所有属性,在从用户的回答得到的所述属性值的取得比例在规定值以上的情况下,从多个对象数据中选出与该用户数据的所述各个属性和各个所述属性值相匹配的至少一个对象数据候选;以及
(d)向用户侧输出在(c)中选出的各个所述对象数据候选。
27.根据权利要求26所述的信息检索方法,其中,通过以下的对话管理方法进行与用户的对话,所述对话管理方法包含:
(a)从对话方案数据库中选择与从信息请求单元所请求的信息有关的对话方案;
(b)根据在(a)中所选择的所述对话方案,生成与所述所请求的信息有关的应答语句,将所述应答语句提供给用户终端;
(c)从回答语句解析单元接受属性和针对所述属性的属性值作为回答语句解析结果,根据所述属性和所述属性值,从所述对话方案数据库中检索符合应答条件的至少一个所述对话方案,按照各个所述对话方案决定之后的行动,其中,所述回答语句解析单元对针对所述应答语句的用户回答语句进行解析;以及
(d)按照在(c)中所决定的之后的行动,进行与用户之间的对话控制。
28.根据权利要求26所述的信息检索方法,其中,通过信息提取方法根据来自用户的回答语句得到属性,所述信息提取方法包含:
(a)取入输入信息;
(b)当检测出所述输入信息中所包含的提取对象的属性时,使用知识数据库中的与所述属性有关的领域的知识,提取所述输入信息中包含的针对所述属性的属性值;以及
(c)将在(b)中提取出的所述属性和该属性的所述属性值对应起来进行存储。
29.根据权利要求26所述的信息检索方法,其中,通过对话方法在对话系统和作为与人之间的界面装置之间接收和发送自然语言语句的数据,来进行与人的对话,
所述对话系统包括:解析部、对象部位认定部、以及提取部,
所述对话方法包含:
所述解析部对人类的发话进行解析;
所述对象部位认定部利用所述解析结果,认定用于从人的发话中提取系统发话用的要素的对象部位;以及
所述提取部根据所述对象部位,从人的发话中提取要素,以使系统发话成为适当的长度。
CNA2008101763599A 2008-02-15 2008-11-20 信息检索系统 Pending CN101510197A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2008034743 2008-02-15
JP2008034999 2008-02-15
JP2008034743A JP2009193448A (ja) 2008-02-15 2008-02-15 対話システム、方法及びプログラム
JP2008036342 2008-02-18
JP2008036356 2008-02-18

Publications (1)

Publication Number Publication Date
CN101510197A true CN101510197A (zh) 2009-08-19

Family

ID=41002599

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008101763599A Pending CN101510197A (zh) 2008-02-15 2008-11-20 信息检索系统

Country Status (2)

Country Link
JP (1) JP2009193448A (zh)
CN (1) CN101510197A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050295A (zh) * 2014-07-01 2014-09-17 彩带网络科技(北京)有限公司 一种交互方法及系统
CN104321765A (zh) * 2012-06-29 2015-01-28 国际商业机器公司 对专家会话构建器的扩展
CN104391904A (zh) * 2014-11-14 2015-03-04 北京中海纪元数字技术发展股份有限公司 面向住户调查的用户终端数据快速录入方法及系统
CN106446106A (zh) * 2016-09-14 2017-02-22 深圳市贝克数据有限公司 目标用户智能检索匹配方法
CN106503156A (zh) * 2016-10-24 2017-03-15 北京百度网讯科技有限公司 基于人工智能的人机交互方法及装置
CN106716408A (zh) * 2014-09-22 2017-05-24 甲骨文国际公司 语义文本搜索
CN107562770A (zh) * 2016-07-01 2018-01-09 松下知识产权经营株式会社 信息处理方法以及记录介质
CN108153915A (zh) * 2018-01-29 2018-06-12 赵宇航 一种基于互联网的教育信息快速获取方法
CN108304291A (zh) * 2017-01-12 2018-07-20 株式会社日立制作所 测试输入信息检索装置和方法
CN108885872A (zh) * 2016-04-11 2018-11-23 三菱电机株式会社 应答生成装置、对话控制系统以及应答生成方法
CN109063215A (zh) * 2018-10-16 2018-12-21 成都四方伟业软件股份有限公司 数据检索方法及装置
CN109791551A (zh) * 2016-09-28 2019-05-21 株式会社东芝 信息处理系统、信息处理装置、信息处理方法、及存储介质
CN110033762A (zh) * 2017-11-28 2019-07-19 丰田自动车株式会社 语音对话设备、语音对话方法和程序
CN111741104A (zh) * 2020-06-18 2020-10-02 腾讯科技(深圳)有限公司 应答消息的确定方法、配置方法、装置、设备及存储介质
CN113557545A (zh) * 2019-03-11 2021-10-26 株式会社博报堂Dy控股集团 中介装置、系统以及计算机程序

Families Citing this family (141)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
JP2014048443A (ja) * 2012-08-31 2014-03-17 Nippon Telegr & Teleph Corp <Ntt> 音声合成システム、音声合成方法及び音声合成プログラム
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN104969289B (zh) 2013-02-07 2021-05-28 苹果公司 数字助理的语音触发器
JP2014229180A (ja) * 2013-05-24 2014-12-08 学校法人東京電機大学 内省支援装置、内省支援方法、内省支援プログラム、対話装置、対話方法および対話プログラム
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101959188B1 (ko) 2013-06-09 2019-07-02 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
JP2015173857A (ja) * 2014-03-17 2015-10-05 株式会社東芝 電子機器及び情報処理方法
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
JP6295869B2 (ja) * 2014-07-23 2018-03-20 トヨタ自動車株式会社 応答生成装置、応答生成方法及びプログラム
JP6390264B2 (ja) 2014-08-21 2018-09-19 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
JP6287754B2 (ja) * 2014-10-21 2018-03-07 トヨタ自動車株式会社 応答生成装置、応答生成方法及び応答生成プログラム
JP2016080981A (ja) * 2014-10-21 2016-05-16 トヨタ自動車株式会社 応答生成装置、応答生成方法及び応答生成プログラム
JP6299563B2 (ja) * 2014-11-07 2018-03-28 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
JP6643077B2 (ja) * 2015-12-22 2020-02-12 株式会社アイ・ビジネスセンター 対話システムおよびプログラム
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770427A1 (en) 2017-05-12 2018-12-20 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
JP6943158B2 (ja) 2017-11-28 2021-09-29 トヨタ自動車株式会社 応答文生成装置、方法及びプログラム並びに音声対話システム
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
JP6835755B2 (ja) * 2018-01-25 2021-02-24 日本電信電話株式会社 日本語名詞句抽出装置、日本語名詞句抽出方法および日本語名詞句抽出プログラム
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
JP7252690B2 (ja) * 2018-04-04 2023-04-05 節夫 鶴田 会話処理装置、会話処理システム、会話処理方法及びプログラム
JP6773074B2 (ja) * 2018-05-01 2020-10-21 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11288459B2 (en) 2019-08-01 2022-03-29 International Business Machines Corporation Adapting conversation flow based on cognitive interaction
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104321765A (zh) * 2012-06-29 2015-01-28 国际商业机器公司 对专家会话构建器的扩展
CN104050295A (zh) * 2014-07-01 2014-09-17 彩带网络科技(北京)有限公司 一种交互方法及系统
CN106716408B (zh) * 2014-09-22 2021-09-10 甲骨文国际公司 语义文本搜索
CN106716408A (zh) * 2014-09-22 2017-05-24 甲骨文国际公司 语义文本搜索
CN104391904B (zh) * 2014-11-14 2018-10-12 北京中海纪元数字技术发展股份有限公司 面向住户调查的用户终端数据快速录入方法及系统
CN104391904A (zh) * 2014-11-14 2015-03-04 北京中海纪元数字技术发展股份有限公司 面向住户调查的用户终端数据快速录入方法及系统
CN108885872A (zh) * 2016-04-11 2018-11-23 三菱电机株式会社 应答生成装置、对话控制系统以及应答生成方法
CN107562770A (zh) * 2016-07-01 2018-01-09 松下知识产权经营株式会社 信息处理方法以及记录介质
CN106446106B (zh) * 2016-09-14 2019-03-22 深圳市贝克数据有限公司 目标用户智能检索匹配方法
CN106446106A (zh) * 2016-09-14 2017-02-22 深圳市贝克数据有限公司 目标用户智能检索匹配方法
CN109791551A (zh) * 2016-09-28 2019-05-21 株式会社东芝 信息处理系统、信息处理装置、信息处理方法、及存储介质
CN106503156B (zh) * 2016-10-24 2019-09-03 北京百度网讯科技有限公司 基于人工智能的人机交互方法及装置
CN106503156A (zh) * 2016-10-24 2017-03-15 北京百度网讯科技有限公司 基于人工智能的人机交互方法及装置
CN108304291B (zh) * 2017-01-12 2021-01-08 株式会社日立制作所 测试输入信息检索装置和方法
CN108304291A (zh) * 2017-01-12 2018-07-20 株式会社日立制作所 测试输入信息检索装置和方法
CN110033762A (zh) * 2017-11-28 2019-07-19 丰田自动车株式会社 语音对话设备、语音对话方法和程序
CN110033762B (zh) * 2017-11-28 2023-04-07 丰田自动车株式会社 语音对话设备、语音对话方法和程序
CN108153915A (zh) * 2018-01-29 2018-06-12 赵宇航 一种基于互联网的教育信息快速获取方法
CN108153915B (zh) * 2018-01-29 2020-06-23 成都嗨学洛子教育科技有限公司 一种基于互联网的教育信息快速获取方法
CN109063215A (zh) * 2018-10-16 2018-12-21 成都四方伟业软件股份有限公司 数据检索方法及装置
CN113557545A (zh) * 2019-03-11 2021-10-26 株式会社博报堂Dy控股集团 中介装置、系统以及计算机程序
CN113557545B (zh) * 2019-03-11 2024-04-05 株式会社博报堂Dy控股集团 中介装置、系统以及计算机程序
CN111741104A (zh) * 2020-06-18 2020-10-02 腾讯科技(深圳)有限公司 应答消息的确定方法、配置方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JP2009193448A (ja) 2009-08-27

Similar Documents

Publication Publication Date Title
CN101510197A (zh) 信息检索系统
JP6218057B1 (ja) 自動応答サーバー装置、端末装置、応答システム、応答方法、およびプログラム
KR101883185B1 (ko) 머신러닝을 활용한 정해진 시나리오로 고객과 상담하는 로봇 자동 상담 방법 및 시스템
JP4880258B2 (ja) 信頼性スコアを使用した自然言語コール・ルーティングのための方法および装置
US7840400B2 (en) Dynamic natural language understanding
US11823074B2 (en) Intelligent communication manager and summarizer
CN110489538A (zh) 基于人工智能的语句应答方法、装置及电子设备
US20070100823A1 (en) Techniques for manipulating unstructured data using synonyms and alternate spellings prior to recasting as structured data
CN103593412B (zh) 一种基于树形结构问题的应答方法及系统
US20140195449A1 (en) System and method for automatic building of business contacts temporal social network using corporate emails and internet
Hlava The taxobook: Principles and practices of building taxonomies, part 2 of a 3-part series
US20200184018A1 (en) Electronic communication system with drafting assistant and method of using same
CN113468300B (zh) 一种基于微信交互的智能消息处理系统及方法
CN114153955B (zh) 一种融合闲聊和常识的多技能任务型对话系统构建方法
Lamontagne et al. Textual reuse for email response
CN116070599A (zh) 智能化题库生成及辅助管理系统
JP2013190985A (ja) 知識応答システム、方法およびコンピュータプログラム
CN112395885B (zh) 短文本语义理解模板生成方法、语义理解处理方法及装置
Vuorikari et al. Exploratory analysis of the main characteristics of tags and tagging of educational resources in a multi-lingual context
JP6067616B2 (ja) 発話生成手法学習装置、発話生成手法選択装置、発話生成手法学習方法、発話生成手法選択方法、プログラム
Tian et al. Semantic similarity measure of natural language text through machine learning and a keyword‐aware cross‐encoder‐ranking summarizer—A case study using UCGIS GIS &T body of knowledge
CN117633196B (zh) 问答模型构建方法及项目问答方法
CN116578682B (zh) 一种法务服务的智能咨询方法及系统
CN117453895B (zh) 一种智能客服应答方法、装置、设备及可读存储介质
Buizza Subject analysis and indexing: an “Italian version” of the analytico-synthetic model

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20090819