CN101656800A - 自动应答装置及方法、会话情节编辑装置、会话服务器 - Google Patents
自动应答装置及方法、会话情节编辑装置、会话服务器 Download PDFInfo
- Publication number
- CN101656800A CN101656800A CN200910167065A CN200910167065A CN101656800A CN 101656800 A CN101656800 A CN 101656800A CN 200910167065 A CN200910167065 A CN 200910167065A CN 200910167065 A CN200910167065 A CN 200910167065A CN 101656800 A CN101656800 A CN 101656800A
- Authority
- CN
- China
- Prior art keywords
- sentence
- user
- answer
- instructions
- orders
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供自动应答装置及方法、会话情节编辑装置、会话服务器。其中,自动应答装置以及自动应答方法,准备会话情节,接受用户发话,根据所述会话情节决定与该接受的用户发话对应的回答句子,向用户提示该决定的回答句子,对用户发话自动进行应答,所述会话情节是与在设想用户发话时的用户发话对应的输入句子、和作为与该输入句子对应的自动应答的回答的回答句子的集合。所述会话情节的数据具有以输入句子作为态射、以与该输入句子对应的回答句子作为对象的、可以通过状态迁移图表现输入句子和回答句子的数据结构。
Description
技术领域
本发明涉及自动应答装置、会话情节编辑装置、会话服务器、自动应答系统以及自动应答方法,更详细而言,涉及可以按照会话情节(seenario)自动地输出对用户的发话进行应答的回答来使得与用户的会话确立的自动应答装置、自动应答系统以及自动应答方法、生成以及编辑在该自动应答装置以及自动应答系统中使用的会话情节的会话情节编辑装置、用于该自动应答装置以及自动应答系统的会话服务器。
背景技术
特开2002-366190号公报中公开了当取得用户的发话时输出与该发话内容对应的回答的自动会话装置。在这种有关自动会话装置中,一般的方式是使用将用户的发话和与之对应的回答作为一对来存储的数据库,通过检索该数据库,输出与用户的发话对应的回答。
但是,在以一一对应的关系输出与用户的发话对应的回答的有关自动会话装置的方式中,难以通过自动会话装置实现:关于某个话题在用户与自动会话装置之间确立自然的会话;或者循序渐进地向用户讲述预先准备的有故事性的内容(例如制度结构的说明、急救治疗的内容等)。
作为这种用于确立自然流程的会话的技术,提出了一边对用户发话进行应答,一边使用实现按照预先准备的会话流程的会话内容的情节,但是,为了生成情节,必须由具有专门知识的KB(knowledge base:知识库)技术人员来进行。
另外,随着通信网络以及网络通信设备的普及发展,经由网络来进行商品或服务的流通的情况也有所增长。与此相伴,也经由网络在顾客和服务提供者之间进行了顾客对应服务(根据顾客的希望来提供回答或建议的服务、例如支持服务等)。
作为经由网络的顾客对应服务的一个形态,有在主页上登载的FAQ形式的服务、或基于离线方式的E-mail对应的服务,但存在无法进行实时对应,从而不能满足客户要求的问题。因此,Vital Information Inc股份有限公司,在标题“Talisma CIM”中公开了具有实时性的谈话方式的顾客对应服务。该顾客对应服务是,被称为代理人的操作员利用被称为在线Q&A检索系统(Talisma Knowledge Management)的数据库,通过谈话方式针对来自顾客的疑问进行应答等的服务。
但是,在基于上述有关方式的顾客对应服务中,数据库专家针对每个业务准备并提供谈话操作员用的数据库的成本需要与现有的电话对应用的电话本(annual)程度相同,因而关于节约运行成本中的人工费用,无法发挥较大优越性。
发明内容
本发明的目的在于提供:在应答用户发话的同时,实现按照预先准备的会话情节的流程的会话内容的自动应答装置、自动应答系统以及自动应答方法;即使不具有专门知识也可以生成、编辑该自动应答装置以及自动应答系统中使用的会话情节的会话情节编辑装置;用于该自动应答装置以及自动应答系统的会话服务器。
另外,本发明的目的在于提供:可以在抑制谈话操作员或用于准备谈话操作员使用的数据库的成本的增大的同时,实时地对顾客进行应答来给予顾客满足感的自动应答装置、自动应答系统、自动应答方法、会话情节编辑装置以及会话服务器。
本发明的第1方式的主旨是一种自动对用户的发话进行应答的自动应答装置,其具备:接受用户发话的输入部;和输出部,其以用户能够识别的形态输出与通过所述输入部接受的用户发话对应的回答句子,其中,根据会话情节来决定所述回答句子,所述会话情节是与在设想用户发话时的用户发话对应的输入句子、和作为与该输入句子对应的自动应答装置的回答的回答句子的集合,所述会话情节的数据具有以输入句子作为态射、以与该输入句子对应的回答句子作为对象的、能够通过状态迁移图来表现输入句子和回答句子的数据结构。
根据本发明的第1方式,可以提供在应答用户发话的同时,实现按照预先准备的会话情节的流程的会话内容的自动应答装置。
另外,所述会话情节包含:将与预定内容的用户发话以外的全部用户发话对应的输入句子记载为一个态射的情节,在该情节中,将与全部用户发话对应的输入句子与某个回答句子对应起来。
根据所述结构,可以定义能够覆盖无限的用户发话的回答句子。
另外,所述会话情节包含将用户无言的状态记载为态射的情节,在该情节中,将与用户的无言状态这样的用户发话对应的输入句子和回答句子对应起来。
根据所述结构,即使是用户的无言状态也可以继续会话。
另外,所述会话情节包含:复合多个态射从而记载为一个态射的情节,在该情节中,多个态射的最后的态射所对应的回答句子、和将多个态射复合而得的一个态射所对应的回答句子相同。
根据所述结构,可以制作在尊重对方的发话的同时,引入想要坚持的自己(自动会话系统)的发话的会话流程。
另外,所述会话情节包含:记载了作为不使对象迁移的单位元的态射的情节,在该情节中,将与预定的用户发话对应的输入句子、和与前一次对用户输出的回答句子相同的回答句子对应起来。
根据所述结构,可以制作与对方(用户)的发话无关地,坚持自己(自动会话系统)的发话的会话流程。
另外,所述会话情节包含记载了不使对象迁移的单位元的情节,所述单位元通过复合具有循环的结合关系的多个态射以及对象而构成,在该情节中,由输入句子和回答句子形成了闭环。
根据所述结构,可以制作在闭合的会话流程中持续催促对方(用户)的发话的会话流程。
另外,在第1方式的自动应答装置中,还具备:会话处理单元,其发送通过所述输入部接受的用户发话,同时接收与该发送的用户发话对应的所述回答句子和动作控制信息,所述动作控制信息是记载了与该回答句子对应的动作、也就是使自动应答装置执行的动作的信息;以及动作控制单元,其从所述会话处理单元接收所述动作控制信息,按照该接收到的动作控制信息执行动作。
根据所述结构,可以在向用户提示回答句子的同时,执行与该回答句子对应的动作。
另外,上述自动应答装置可以进一步具备浏览器单元,其接收内容的数据,并使用户能够阅览该接收到的内容,所述动作控制单元,使所述浏览器单元执行由所述接收到的动作控制信息确定的处理。
根据所述结构,通过自动会话,用户可以进行各种内容的阅览、或阅览中的会话、市场信息的取得等。
另外,上述自动应答装置可以进一步具备电话单元,其执行IP电话的拨号、接听、通话,所述动作控制信息是使所述电话单元执行从用户向对方的电话的连接、继续、以及结束的信息,所述动作控制单元使所述电话单元执行由所述接收到的动作控制信息确定的处理。
根据所述结构,可以自动地进行用户与对方的电话的转接。
另外,上述自动应答装置具备:会话装置,其包含所述输入部、所述输出部、所述会话处理单元、和动作处理单元;
以及会话服务器,其从所述会话装置接收用户发话,根据所述会话情节检索以及决定与所述接收到的用户发话对应的回答句子,将该决定的回答句子发送到所述会话装置,所述会话服务器,当检索的结果为,判断出所述会话情节中没有与从所述用户接受的用户发话对应的回答句子时,为了从专家得到与所述用户发话对应的回答而发送用户发话,接收与该发送的用户发话对应的专家的回答内容,将该接收到的专家的回答内容发送到所述会话装置,发送存储了与所述用户发话对应的输入句子、专家的回答内容和回答句子的会话日志,接收根据该发送的会话日志而生成的会话情节,然后存储。
根据所述结构,即使不通过谈话操作员,也可以应对来自顾客的查询或疑问等,同时也可以应答系统无法回答的未知的疑问或复杂的疑问等。
另外,可以提供在抑制谈话操作员或用于谈话操作员使用的数据库准备的成本的增大的同时,实时地对顾客进行应答来给予满足感的顾客对应服务。
本发明的第2方式的主旨是一种会话情节编辑装置,其具备:输入部,其为了生成会话情节,能够使操作员输入输入句子、回答句子、以及与在设想用户对该回答句子发话时的用户发话对应的输入句子,该输入部取得来自操作员的输入并输出输入信息,所述会话情节是与在设想用户对自动应答用户的发话的自动应答装置发话时的用户发话对应的输入句子、和作为与该输入句子对应的所述自动应答装置的回答的回答句子的集合;
与所述输入部相连的编辑部,其接收从所述输入部输出的输入信息,根据该接收到的输入信息进行作为会话情节的数据的生成以及编辑,输出生成及编辑中以及生成及编辑完成后的会话情节的数据;
与所述编辑部相连的会话情节保持部,其将从所述编辑部输出的会话情节的数据,与输入句子和回答句子对应起来存储,其中,所述会话情节的数据具有以输入句子作为态射、以与该输入句子对应的回答句子作为对象的、能够以状态迁移图表现输入句子和回答句子的数据结构;
以及与所述编辑部相连的输出部,其以操作员能够识别的形态输出从所述编辑部输出的生成及编辑中以及生成及编辑完成后的会话情节的数据的内容,其中,所述输出部,在所述会话情节的生成及编辑中以及生成及编辑完成后,以能够浏览回答句子的迁移目的地、并且能够浏览回答句子的引用源的形态,向操作员提示能够将所述会话情节的输入句子和回答句子作为状态迁移来理解的形态的状态迁移图。
根据本发明的第2方式,可以提供在对用户发话进行应答的同时,能够生成、编辑会话情节的会话情节编辑装置,所述会话情节实现按照预先准备的会话流程的会话内容。
例如,本发明具有以下优点。
·可以以系统的回答为对象、以用户发话为态射,即可以将会话作为状态迁移来理解。
·可以浏览系统的回答的迁移目的地(通过迁移目的地的信息,读出状态迁移)
·可以浏览系统的回答的引用源(通过引用源的信息,读出“复合或单位源”)
·可以浏览系统的回答的回答列(通过回答列,读出情节)
另外,上述会话情节编辑装置,可以进一步具备动态知识生成单元,其生成对所述会话情节进行再构成而得的数据、即动态知识,以使所述自动应答装置能够从所述会话情节中更高速且高效率地检索与输入句子对应的态射以及与该态射对应的对象。
根据所述结构,可以高速地检索相当于输入的态射、以及与该态射对应的对象,可以输出作为对象的回答句子。
本发明的第3方式的主旨是一种会话服务器,其具备:意思解释词典部,其存储意思解释词典,该意思解释词典用于进行与在设想用户对自动应答用户的发话的自动应答装置发话时的用户发话对应的回答句子的改写;
会话情节存储部,其存储会话情节的数据,所述会话情节是与用户发话对应的输入句子、以及作为与该输入句子对应的所述自动应答装置的回答的回答句子的集合;
以及与所述意思解释词典部和会话情节存储部相连,能够与所述自动应答装置通信的回答处理部,该回答处理部从所述自动应答装置取得用户发话,参照所述意思解释词典部存储的意思解释词典来取得用户发话的同义词或同义句,检索在所述会话情节存储部中存储的会话情节的数据,决定与该取得的同义词或同义句对应的输入句子,参照所述意思解释词典部,生成为了与用户发话对应而对与该决定的输入句子对应的回答句子进行改写后的回答句子,将该改写后的回答句子和动作控制信息发送到所述自动应答装置,所述动作控制信息是记载了与该回答句子对应的动作、也就是使所述自动应答装置执行的动作的信息。
根据本发明的第3方式,可以提供用于自动应答装置的会话服务器,该自动应答装置,在对用户发话进行应答的同时,实现按照预先准备的会话情节的流程的会话内容。
本发明的第4方式的主旨是一种自动应答系统,其具备:自动对用户发话进行应答的自动应答装置,其向用户提示根据会话情节决定的、与用户发话对应的回答句子;以及会话情节编辑装置,其为了所述自动应答装置而生成所述会话情节,所述会话情节是与在设想用户发话时的用户发话对应的输入句子、和作为对该输入句子的回答的回答句子的集合,所述会话情节的数据具有以输入句子作为态射、以与该输入句子对应的回答句子作为对象的、能够以状态迁移图表现输入句子和回答句子的数据结构。
根据本发明的第4方式,可以提供在对用户发话进行应答的同时,实现按照预先准备的会话情节的流程的会话内容的自动应答系统。
另外,上述自动应答系统可以进一步具备会话服务器,其从所述自动应答装置接收用户发话,根据通过所述会话情节编辑装置生成的会话情节,决定与所述接收到的输入句子对应的回答句子,并将该决定的回答句子发送到所述自动应答装置。
根据所述结构,可以根据会话情节决定作为与发话内容对应的答复的回答、和动作控制信息,并将回答以及动作控制信息输出到自动应答装置,所述动作控制信息是记载了与该回答对应的动作、也就是使自动应答装置执行的动作的信息。
另外,上述自动应答系统中,所述会话服务器,当判断出在所述会话情节中没有与从所述用户接受的用户发话对应的回答句子时,为了从专家获得与所述用户发话对应的回答而发送用户发话,接收与该发送的用户发话对应的专家的回答内容,将该接收到的专家的回答内容发送到所述会话装置,发送存储了与所述用户发话对应的输入句子、专家的回答内容、回答句子的会话日志,接收根据该发送的会话日志而生成的会话情节,然后存储。
根据所述结构,即使不通过谈话操作员,也可以应对来自顾客的查询或疑问等,同时也可以应对系统无法回答的未知的疑问或复杂的疑问。
另外,可以提供能够在抑制谈话操作员或用于准备谈话操作员使用的数据库的成本的增大的同时,实时地对顾客进行应答来提供满足感的的顾客对应服务。
另外,上述自动应答系统可以进一步具备:专家侧终端装置,其从所述会话服务器接收从用户接受的用户发话,接受与该接收到的用户发话对应的专家的回答,将专家的回答内容发送到所述会话服务器;以及会话日志数据库,其从所述会话服务器接收包含所述用户发话以及从所述专家侧终端装置发送的专家的回答内容的会话日志,并进行存储,所述会话情节编辑装置,根据所述会话日志数据库中存储的会话日志,生成基于用户发话以及与该用户发话对应的专家的回答内容的会话情节,并将该生成的会话情节发送到所述会话服务器。
根据所述结构,即使对于系统无法回答的顾客的疑问等,也可以向用户提供利用了专家的知识等的回答,并且将专家的回答内容作为会话情节而进行反馈,由此可以暂时减少系统无法回答的状态的发生。
本发明的第5方式的主旨是一种自动对用户的发话进行应答的自动应答系统,其具备会话情节编辑装置、会话装置和会话服务器,
所述会话情节编辑装置包含:
第1输入部,其为了生成会话情节,能够使操作员输入输入句子、回答句子和与在设想用户对该回答句子发话时的用户发话对应的输入句子,所述会话情节是与在设想用户发话时的用户发话对应的输入句子、和作为与该输入句子对应的回答的回答句子的集合,该第1输入部取得来自操作员的输入并输出输入信息;
与所述第1输入部相连的编辑部,其接收从所述第1输入部输出的输入信息,根据该接收到的输入信息,进行作为会话情节的数据的生成以及编辑,输出生成及编辑中以及生成及编辑完成后的会话情节的数据;
与所述编辑部相连的会话情节保持部,其将从所述编辑部输出的会话情节的数据与输入句子和回答句子对应起来存储,其中,所述会话情节的数据具有以输入句子作为态射、以与该输入句子对应的回答句子作为对象的、能够通过状态迁移图表现输入句子和回答句子的数据结构;以及
与所述编辑部相连的第1输出部,其以操作员能够识别的形态输出从所述编辑部输出的生成及编辑中以及生成及编辑完成后的会话情节的数据的内容,其中,所述第1输出部,在所述会话情节的生成及编辑中以及生成及编辑完成后,以能够浏览回答句子的迁移目的地、且能够浏览回答句子的引用源的形态,向操作员提示能够将所述会话情节的输入句子和回答句子作为状态迁移来理解的形态的状态迁移图,该状态迁移图包含回答列,
所述会话装置包含:
第2输入部,其取得用户发话,输出该用户发话;
与所述输入部相连的会话处理部,其接收从所述第2输入部输出的用户发话,并发送该接收到的用户发话,接收回答句子以及与该回答句子对应的动作控制信息,输出该接收到的回答句子以及动作控制信息;
与所述会话处理部相连的动作控制部,其根据从所述会话处理部输出的动作控制信息,执行所指定的动作;以及
与所述会话处理部以及所述动作控制部相连的第2输出部,其以用户能够识别的形态输出从所述会话处理部输出的回答句子、或通过所述动作控制部指定的回答句子,
所述会话服务器包含:
意思解释词典部,其存储用于进行与用户发话对应的回答句子的改写的意思解释词典;
会话情节存储部,其存储通过所述会话情节编辑装置生成以及编辑的会话情节的数据;以及
与所述意思解释词典部和会话情节存储部相连,能够与所述会话装置通信的回答处理部,其从所述会话装置取得用户发话,参照所述意思解释词典部存储的意思解释词典来取得用户发话的同义词或同义句,检索在所述会话情节存储部中存储的会话情节的数据,决定与该取得的同义词或同义句对应的输入句子,参照所述意思解释词典部,生成为了与用户发话对应而对与该决定的输入句子对应的回答句子进行改写后的回答句子,将该改写后的回答句子和动作控制信息发送到所述会话装置,所述动作控制信息是记载了与该回答句子对应的动作、也就是使所述会话装置执行的动作的信息,
所述会话服务器与所述会话处理部相连。
根据本发明的第5方式,可以提供在对用户发话进行应答的同时,实现按照预先准备的会话情节的流程的会话内容的自动应答系统。
本发明的第6方式的主旨是一种自动应答方法,其包含以下步骤:
准备会话情节,该会话情节是与在设想用户发话时的用户发话对应的输入句子、和作为与该输入句子对应的自动回答的回答句子的集合,其中,所述会话情节的数据具有以输入句子作为态射、以与该输入句子对应的回答句子作为对象的、能够通过状态迁移图表现输入句子和回答句子的数据结构;
接受用户发话;
根据所述会话情节,决定与该接受的用户发话对应的回答句子;
向用户提示该决定的回答句子;
自动对用户发话进行应答。
根据本发明的第6方式,可以提供在对用户发话进行应答的同时,实现按照预先准备的会话情节的流程的会话内容的自动应答方法。
另外,在上述自动应答方法中,准备所述会话情节的步骤包含以下工序:
为了生成所述会话情节,使操作员输入输入句子、回答句子、和与在设想用户对该回答句子发话时的用户发话对应的输入句子,并取得来自操作员的输入;
根据从该操作员取得的输入信息,进行作为会话情节的数据的生成以及编辑;
将生成及编辑中以及生成及编辑完成后的会话情节的数据,与输入句子和回答句子对应起来存储;以及
以操作员能够识别的形态,输出生成及编辑中以及生成及编辑完成后的会话情节的数据的内容,
其中,在向操作员输出会话情节的工序中,以能够浏览回答句子的迁移目的地、且能够浏览回答句子的引用源的形态,向操作员提示能够将所述会话情节的输入句子和回答句子作为状态迁移来理解的形态的状态迁移图。
根据所述结构,例如有以下优点。
·可以以系统的回答为对象、以用户发话为态射,即可以将会话作为状态迁移来理解。
·可以浏览系统的回答的迁移目的地(通过迁移目的地的信息,读出状态迁移)
·可以浏览系统的回答的引用源(通过引用源的信息,读出“复合或单位源”)
·可以浏览系统的回答的回答列(通过回答列,读出情节)
附图说明
图1是表示自动会话系统的结构例的框图。
图2是表示会话装置的一个结构例的框图。
图3是表示会话服务器的一个结构例的框图。
图4是表示会话情节编辑装置的一个结构例的框图。
图5是表示与谈话的范围相当的会话情节的例子的状态迁移图。
图6是表示将图5的会话情节作为数据来表现的例子的图。
图7是表示包含态射的复合的会话情节的例子的状态迁移图。
图8是表示将图7的会话情节作为数据来表现的例子的图。
图9是表示进行基于NULL功能的强制回答的会话情节的例子的状态迁移图。
图10是表示将图9的会话情节作为数据来表现的例子的图。
图11是表示通过引用功能,对用户发话进行“固执回答”的会话情节的例子的状态迁移图。
图12是表示将图11的会话情节作为数据来表现的例子的图。
图13是表示通过“通过复合构成的单位元”构建了“闭环回答”的会话情节的例子的状态迁移图。
图14是表示将图13的会话情节作为数据来表现的例子的图。
图15是在态射的复合中结合法则成立的会话情节的例子的状态迁移图。
图16是表示将图15的会话情节作为数据来表现的例子的图。
图17是表示会话情节编辑装置的编辑画面例的图。
图18是表示会话情节保持部以及会话情节存储部的数据结构例的图。
图19是表示用于通过会话编辑装置生成会话情节数据的输入画面例的图。
图20接续图19,是表示用于通过会话编辑装置生成会话情节数据的输入画面例的图。
图21接续图20,是表示用于通过会话编辑装置生成会话情节数据的输入画面例的图。
图22接续图21,是表示用于通过会话编辑装置生成会话情节数据的输入画面例的图。
图23接续图22,是表示用于通过会话编辑装置生成会话情节数据的输入画面例的图。
图24是表示会话情节编辑装置的变形结构例的功能框图。
图25是回答处理部的功能框图。
图26是表示字符串和从该字符串提取出的形态素的关系的图。
图27是表示“发话句子的类型”、和表示该发话句子的类型的两字符的字母、以及与该发话句子的类型对应的发话句子的例子的图。
图28是表示句子的类型和用于判定该类型的词典的关系的图。
图29是表示会话数据库存储的数据的数据结构的一例的概念图。
图30是表示某话题确定信息和其它话题确定信息的关联的图。
图31是表示话题标题(也称为“第二形态素信息”)的数据结构例的图。
图32是用于说明回答句子的数据结构例的图。
图33是表示与某话题确定信息对应的话题标题、回答句子、下一计划指定信息的具体例的图。
图34是用于说明计划空间的概念图。
图35是表示计划的例子的图。
图36是表示另一计划的例子的图。
图37是表示计划会话处理的具体例的图。
图38是表示会话控制部的主处理的一例的流程图。
图39是表示计划会话控制处理的一例的流程图。
图40接续图39,是表示计划会话控制处理的一例的流程图。
图41是表示基本控制状态的图。
图42是表示谈话空间会话控制处理的一例的流程图。
图43是表示指导系统的结构例的框图。
图44是表示用户终端装置的结构例的功能框图。
图45是表示会话服务器选择装置的结构例的功能框图。
图46是表示在用户终端装置的输出部显示的画面例的图。
图47是表示在用户终端装置的输出部显示的画面例的图。
图48是表示在用户终端装置的输出部显示的画面例的图。
图49是表示在用户终端装置的输出部显示的画面例的图。
图50是表示在用户终端装置的输出部显示的画面例的图。
图51是表示在用户终端装置的输出部显示的画面例的图。
图52是表示在用户终端装置的输出部显示的画面例的图。
图53是表示在用户终端装置的输出部显示的画面例的图。
图54是表示在用户终端装置的输出部显示的画面例的图。
图55是表示在用户终端装置的输出部显示的画面例的图。
图56是表示在用户终端装置的输出部显示的画面例的图。
图57是表示电话转接系统的结构例的框图。
图58是表示用户终端装置的结构例的功能框图。
图59是表示从用户向对方通过本电话转接系统拨号时的动作例的时序图。
图60是表示有从对方向用户的来电时的本电话转接系统的动作例的时序图。
图61是表示顾客对应系统的结构例的框图。
图62是表示第4实施方式的会话服务器的结构例的功能框图。
图63是表示会话服务器根据会话情节,接收可以回答时的用户发话的情况下的、顾客对应系统的动作例的时序图。
图64是表示会话服务器判定为没有适合于会话情节的回答,向专家侧终端装置请求回答时的、顾客对应系统的动作例的时序图。
图65是表示顾客对应系统进行会话日志的分析时的动作例的时序图。
具体实施方式
以下,参照附图说明本发明的实施方式。
(第1实施方式)
第1实施方式提出了,根据预先准备的会话情节对用户的发话等进行应答来输出回答的自动会话系统、以及生成、编辑会话情节的会话情节编辑装置。
(1.自动会话系统、会话情节编辑装置的结构例)
以下,说明自动会话系统、会话情节编辑装置的结构例。图1是表示自动会话系统1的结构例的框图。自动会话系统1由会话装置10、与会话装置10连接的会话服务器20、以及生成、编辑会话服务器20所使用的会话情节的会话情节编辑装置30构成。
会话装置10,当用户输入发话时,将其发话内容发送到会话服务器20。会话服务器20当取得发话内容时,根据会话情节决定回答和动作控制信息,并且将回答以及动作控制信息输出到会话装置10,该回答是对发话内容的答复,该动作控制信息是记载了与该回答对应的动作、即由会话装置10执行的动作的信息。会话情节编辑装置30生成、编辑会话情节40,并且输出已生成的、或者已编辑好的会话情节。所输出的会话情节40被存储在会话服务器20中。
以下,详细描述各个上述装置。
(1.1.会话装置)
会话装置10具有以下功能:取得用户的发话(用户发话)作为输入,将该输入内容(以下称为输入句子)发送到会话服务器20,接收从会话服务器20答复的回答以及动作控制信息,根据接收内容执行与回答的输出以及动作控制信息对应的动作。
会话装置10是具备运算处理装置(CPU)、主存储器(RAM)、读出专用存储器(ROM)、输入输出装置(I/O)、在必要时具备硬盘装置等外部存储装置的信息处理装置、或者包含这种信息处理装置的器具、玩具等,例如是计算机、便携电话机、所谓的互联网家电、或者机器人等装置。在会话装置10的所述ROM或者硬盘装置等中存储了程序,将该程序加载到主存储器上,由CPU执行该程序,由此实现会话装置。另外,上述程序也不一定存储在信息处理装置内的存储装置中,也可以从外部装置(例如ASP(应用程序服务提供商的服务器等))提供,将其加载到主存储器上。
图2是表示会话装置10的一个结构例的框图。会话装置10具有:输入部11、与输入部11连接的会话处理部12、与会话处理部12连接的动作控制部13、与会话处理部12以及动作控制部13连接的输出部14。另外,会话处理部12可以与会话服务器20通信。
输入部11具有取得用户的发话内容(输入句子),将其变换成电气信号等会话处理部12可以处理的信号来进行传递的功能。输入部11例如是键盘、指点设备、触摸面板、麦克风的某一个或者它们的组合。
会话处理部12将从输入部11取得的输入句子发送到会话服务器20,请求会话服务器20发送与输入句子对应的回答句子、以及与该回答句子对应的动作控制信息。另外,会话处理部12,当从会话服务器20接收回答句子以及与该回答句子对应的动作控制信息时,将回答句子传递到输出部14来使其输出,同时将动作控制信息传递到动作控制部13。
动作控制部13根据从会话处理部12传递来的动作控制信息,执行所指定的动作。若所指定的动作是执行输出部14的显示(例如,再生所指定的动作),则使输出部14执行该动作。另外,当所指定的动作是与从会话服务器20取得的回答句子不同的回答句子的输出(例如,从会话服务器20取得的回答句子是“说什么呢?”),不同的回答句子是“请说点什么吧!”)时,使输出部14输出这样的回答句子。
输出部14具有以用户可理解的形态输出回答句子的功能。关于以何种形态输出回答句子,在本发明中没有限制。输出部14,例如在将回答句子作为字符信息提供给用户的情况下,是液晶显示装置等,另外,在将回答句子作为声音信息提供给用户的情况下,是人工声音生成装置以及扬声器。
(1.2.会话服务器)
会话服务器20是具有根据会话情节决定回答和动作控制信息,并将回答以及动作控制信息输出到会话装置10的功能的装置,所述回答是针对发话内容的答复,所述动作控制信息是记载了与该回答对应的动作、也就是使会话装置10执行的动作的信息。
会话服务器20是具备运算处理装置(CPU)、主存储器(RAM)、读出专用存储器(ROM)、输入输出装置(I/O)、在必要时具备硬盘装置等外部存储装置的信息处理装置等,例如是计算机、工作站、服务器装置等。在会话服务器20的所述ROM或者硬盘装置等中存储了程序,通过将该程序加载到主存储器上、由CPU对其进行执行,来实现会话服务器。另外,上述程序也不一定存储在信息处理装置内的存储装置中,也可以是从外部装置(例如ASP(应用程序服务提供商的服务器等))提供,将其加载到主存储器中的结构。
会话装置10和会话服务器20可以通过有线或无线相连,另外也可以经由LAN、无线LAN、因特网等通信网(也可以组合多个通信网)相连。另外,会话装置10和会话服务器20可以不一定是个别独立的装置,即使是通过同一装置实现会话装置10和会话服务器20的结构,本发明也成立。
图3是表示会话服务器20的一个结构例的框图。会话服务器20具有:可以和会话装置10通信的回答处理部21;与回答处理部21相连的意思解释词典部23以及会话情节存储部22。
回答处理部21从会话装置10取得输入句子,根据在会话情节存储部22中存储的会话情节选择或决定与该输入句子对应的回答句子,将所决定的回答句子和与该回答句子对应的动作控制信息发送到会话装置10。另外,回答处理部21参照意思解释词典部23存储的意思解释词典,取得输入句子的同意词或同意句,基于该同意词或同意句选择或决定回答句子。
意思解释词典部23具有存储意思解释词典的功能,该意思解释词典用于进行与输入句子对应的回答句子的改写(基于同意词的扩展等)。意思解释词典相当于具有辞典(thesaurus)那样的功能的数据库。
会话情节存储部22具有存储通过会话情节编辑装置30生成或编辑的会话情节40的功能。在后面描述会话情节40的说明。
(1.3.会话情节编辑装置)
会话情节编辑装置30具有以下功能:新生成由所述会话服务器20使用的会话情节,或者变更已生成的会话情节,生成追加内容或者进行内容的一部分的删除而修正后的会话情节。
会话情节编辑装置30是具备运算处理装置(CPU)、主存储器(RAM)、读出专用存储器(ROM)、输入输出装置(I/O)、在必要时具备硬盘装置等外部存储装置的信息处理装置等,例如是计算机、工作站等。在会话情节编辑装置30的所述ROM或者硬盘装置等中存储了程序,通过将该程序加载到主存储器上、由CPU对其进行执行,来实现会话情节编辑装置30。另外,上述程序也可以不一定存储在信息处理装置内的存储装置中,也可以是从外部装置(例如ASP(应用程序服务提供商的服务器等))提供,将其加载到主存储器上的结构。
图4是表示会话情节编辑装置30的一个结构例的框图。会话情节编辑装置30具有:输入部31、与输入部31相连的编辑部32、与编辑部32相连的输出部34以及会话情节保持部33。
输入部31具有以下功能:取得会话情节编辑装置30的使用者(操作员)的输入,将其变换为电气信号等编辑部32可以处理的信号来传递。输入部31例如是键盘、指点设备、触摸面板、麦克风的某一个或它们的组合。
输出部34具有以操作员可识别的形态输出编辑中或编辑完成后的会话情节的内容的功能。输出部34例如是液晶显示器装置等。
编辑部32具有根据从输入部31输入的内容,进行作为会话情节的数据的生成、以及其编辑(追加、变更、删除)的功能。此外,通过使输出部34显示编辑中的会话情节的内容,操作员可以实时地掌握会话情节的内容。另外,编辑部32将编辑完成后的会话情节的数据输出到会话情节保持部33。
另外,编辑部32也可以具有以下功能:检查在生成的会话情节中是否遵守了适当的状态迁移关系,在发生违反的情况下,生成向操作员通知发生了违反、违反发生的输入句子或回答句子的消息等,使输出部进行显示等。
另外,编辑部32可以进一步具有相当于会话服务器20的意思解释词典部23的意思解释词典部,编辑部32可以具有以下功能:使用该意思解释词典部,当会话情节中存在重复的意思内容的输入句子或回答句子时,对它们进行整理或者综合,或者促使操作员进行整理、综合。
会话情节保持部33具有将从编辑部32取得的会话情节的数据,以随后可以读取的形态进行存储或保持的功能。会话情节保持部33中存储的会话情节的数据,根据需要或者在预定的时刻等,被送到会话服务器20的会话情节存储部22。从会话情节保持部33到会话情节存储部22的会话情节的转发,可以以经由存储介质的形态来进行,也可以经由通信网、通信电缆来进行。
(1.3.1.关于会话情节)
在此说明会话情节40。本发明中的会话情节具有以下特征。
(1)以回答句子为“对象”,以用户发话(输入句子)为“态射”(morphism)。
通过具有该特征,可以通过“状态迁移图”表现会话情节决定的会话流程。本发明的会话情节,通过使用后述的“其它”功能,可以输出与全部输入句子(用户发话)对应的回答句子。另外,通过后述的“计时器”发话,可以应对用户的“无言”(无输入)(可以将无言作为态射来处理)。
图5是表示会话情节的例子的状态迁移图。图中,椭圆框X1、X2、X3、X4分别是回答句子,它们相当于“对象”。图中在箭头附近显示的句子是输入句子,它们相当于“态射”。图中<其它>表示来自X1的态射“喜欢”以及“不喜欢”以外的输入句子。图中<timer>表示在用户无言的状态下经过了预定期间的状态。另外,“<其它>|<timer>”这样的标记表示“其它”或“timer”。
在图5所示的例子中,使得“想吃点什么”这样的“态射”迁移到作为回答句子X1、即“你喜欢拉面吗”的“对象”。在回答句子X1的输出后,在第1态射“不喜欢”发生的情况下,迁移到回答句子X4“遗憾!换个话题吧”。另一方面,在回答句子X1的输出后,在第2态射“喜欢”发生的情况下,迁移到回答句子X3“那么,向你介绍美味的店”。另一方面,在回答句子X1的输出后,在第1以及第2态射以外的态射发生的情况下、或者在用户无言的状态下经过了一定期间的情况下,迁移到回答句子X2“拉面,喜欢?不喜欢?”。
当将上述图5的会话情节作为数据来表现时,作为一例而成为图6那样的内容。在此“X1(发话A)X2”是回答列,记载了X1的回答状态通过发话A迁移到X2的回答状态。
(2)在态射中可以定义复合
通过该特征,可以接受从主情节分支的发话,并且即使分支也可以返回开始(主情节)。因此,会话情节的生成者可以构建自己构思的会话流程“故事”,使会话系统进行遵照该故事的会话。
图7是表示包含态射的复合的会话情节的例子的状态迁移图。图中的记号以及标记遵照图5。在此例的会话情节中,在回答句子X1“你喜欢拉面吗?”的输出后,在第1态射“不喜欢”发生的情况下,迁移到回答句子X3“是么?拉面很美味啊”。另一方面,在第1态射以外的态射发生的情况下、或者在用户无言的状态下经过了一定期间的情况下,迁移到回答句子X2“向你介绍真正美味的店”。
在上述回答句子X3“是么?拉面很美味啊”的输出后,仅规定了一个态射<其它>|<timer>,通过某个输入句子(用户发话)或者经过一定期间而迁移到回答句子X2“向你介绍真正美味的店”。
因为可以使用包含这样的态射的复合的会话情节的例子,所以在本发明中可以在尊重对方的发话的同时,引入想要坚持的自己的发话。
此外,当将上述图7的会话情节作为回答列来表现时,成为图8那样的内容。在此,X2是X2的引用。被引用的X2的引用源是X2,在形式上相当于在对象X1和X2之间决定了态射“(不喜欢)X3(<其它>|<timer>)”。该态射是态射“不喜欢”和态射“<其它>|<timer>”的复合。
(3)可以定义单位元
在本发明的会话情节中可以定义单位元。所谓“单位元”,是指不使对象迁移的态射。由于可以定义单位元,以下情况成为可能。
(A)可以对用户发话进行“强制回答”。
图9是表示进行强制回答的会话情节的例子的状态迁移图。在此例中,在回答句子X1“我喜欢拉面。拉面才是美食的本质”的输出时,规定了附加了NULL的第1态射<其它>,不管是什么样的输入句子(用户发话)都忽视输入句子地进行“我喜欢拉面。拉面才是美食的本质”的强制输出。另一方面,在回答句子X1“我喜欢拉面。拉面才是美食的本质”的输出后,通过第2态射<timer>而迁移到回答句子X2“向你介绍真正美味的店”。
在此例中,将忽视对方的发话的情况标记为“NULL”。在图9所示的例子中,由于忽视全部发话,因此对<其它>附加了NULL,但也可以仅忽视“不喜欢”。
此外,在将上述图9的会话情节作为回答列来表现时,成为图10那样的内容。在此,X1是X1的引用。被引用的X1与引用源X1具有相同的迁移目的地。这意味着X1和X1同形,这种情况下的态射“(<其它>)”是从X1到X1的态射,是单位元。
(B)可以对用户发话进行“固执回答”。
图11是表示对用户发话进行“固执回答”的会话情节的例子的状态迁移图。在图11的例子中,在回答句子X1“拉面,喜欢?不喜欢?”的输出后,发生了第1态射“不喜欢”的情况下,迁移到回答句子X3“是么?拉面很美味啊”。另一方面,在回答句子X 1的输出后,发生了第2态射“喜欢”的情况下,迁移到回答句子X2“向你介绍真正美味的店”。另一方面,在回答句子X1的输出后,发生了第1以及第2态射以外的态射的情况下、或者在用户无言的状态下经过了一定期间的情况下,再次返回回答句子X1“拉面喜欢?不喜欢?”。于是,可以强制性地使用户从“喜欢”或“不喜欢”两项中选择一项。
此外,当将上述图11的会话情节作为回答列来进行表现时,成为图12那样的内容。在此,X1是X1的引用。被引用的X1和引用源X1具有相同的迁移目的地。这意味着X1和X1同形,这种情况下的态射“(<其它>|<timer>)”也相当于从X1到X1的态射,因此称为单位元。
(C)通过“通过复合而构成的单位元”可以构建“闭环回答”。
通过具备该特征,可以在闭合的循环(loop)中催促对方的发话。图13是表示通过“通过复合而构成的单位元”构建了“闭环回答”的会话情节的例子的状态迁移图。在此例中,通过回答句子X1、X2、X3、X4构建了闭环,通过该闭环可以控制会话的流程。当将上述图13的会话情节作为回答列来表现时,成为图14那样的内容。在此情况下也相当于从X1到X1的态射。
将(<其它>|<timer>)X2(<其它>|<timer>)
X3(<其它>|<timer>)X4(<其它>|<timer>)称为单位元。这种情况下的单位元构成了“闭环”。
以上,结束了“项目(3)可以定义单位元”的说明。
(4)在态射的复合中,结合法则成立
通过该特征,对于与某态射对应的回答列S,可以构建沿不同的两条路径的回答列S1和S2,而且可以将它们作为等同的回答列来处理。此时,当设S是与某问题相关的回答列时,S1和S2是提供与S对应的不同解释的回答列,提供了与问题解决相关的信息。由于具有该特征,因此在本发明的会话情节中,可以应对有逻辑的用户发话
图15中表示在态射的复合中结合法则成立的会话情节的例子的状态迁移图。此外,当将上述图15的会话情节作为回答列来表现时,成为图16那样的内容。在此,X2、X4分别是X2、X4的引用。在形式上,下式成立。
(提示)X3(是××)X4(<其它>|<timer>)
=(是××)X4(<其它>|<timer>)
=(提示)X3(<其它>|<timer>)
(5)描绘交换图
通过该特征,可以定义用于到达任意对象的态射。因此,可以在情节中设定目标,并且可以进行情节整体的掌握。
(6)其它
本发明,在“可以以输入句子作为对象、以回答句子作为态射来处理的谈话的范围”内,检索的结构完全不同,因此无法与“可以以输入句子作为态射、以回答句子作为对象来处理的谈话的范围”进行同样的处理。在本发明中不处理前者那样的谈话的范围。
(1.4.会话情节编辑装置的定位)
在此,关于本发明的会话情节编辑装置30的定位进行汇总。
(1)关于具有对象和态射的会话情节,可以列举出以下特征。
·以回答句子为对象、以输入句子为态射(状态迁移)
·在尊重输入句子的同时,引入想要坚持的回答句子(维持文理:复合)
·与输入句子无关地说定回答句子(强制回答:单位元)
·反复催促对方,直到说出需要的发话为止(固执回答:单位元)
·在闭合的循环中催促输入句子(闭环:单位元)
·进行与解决问题相关的会话(解决问题:结合法则)
·进行面向目标的会话(有目标的会话:交换图)
此外,通过回答列也可以整理上述特征。会话情节编辑装置30具有通过回答列来表现上述会话情节的特征的功能。
通过利用上述会话情节,会话服务器20进行简单的检索即可。即,会话服务器将当前的状态作为会话情节的对象(回答句子)来掌握,在发生了利用者发话的情况下,会话服务器20在进行意思解析的同时检索最佳的态射(输入句子),接下来的状态成为与检索到的态射(输入句子)对应的对象(回答句子)。
此外,上述的会话情节不仅作为状态迁移图或以此为基础的数据(图6、8、10等)来表现,也可以使用图17所示那样的大纲编辑器(outline editor)那样的GUI来生成、编辑。
(2.会话情节编辑装置的动作例)
接着,对上述会话情节编辑装置30的动作例进行说明。
本实施方式的会话情节编辑装置30,关于多个不同主题(会话的主题),可以确立与用户的会话。图18是表示会话情节保持部33以及会话情节存储部22(以下简称为会话情节保持部33)存储的会话情节的数据结构例的图。
会话情节保持部33可以针对每个与谈话的范围或主题(会话主题)201对应的域20000保持独立的会话情节数据。例如,可以具有与“天气”域和“咖啡豆”域分别相关的会话情节数据,当用户进行与天气相关的发话时,会话服务器20、更详细来说是回答处理部21,将作为“天气”域的会话情节数据优先,搜索与输入句子(也称用户发话)对应的回答句子(也称系统回答句子、系统发话),输出对用户发话进行应答的系统发话。另一方面,当用于进行与“咖啡豆”相关的发话时,回答处理部21将作为“咖啡豆”域的会话情节数据优先,搜索与用户发话对应的系统发话,输出对用户发话进行应答的系统发话。
各域20000具有:用户发话句子210和、作为与用户发话句子对应的自动会话系统的回答而准备的系统发话句子220。在图18所示的例子中,记录了用户发话句子210-1和与其关联的系统发话句子220-1,同时记录了应答该系统发话220-1在设想用户发话时的用户发话句子210-2,记录了作为与该用户发话句子210-2对应的自动会话系统的回答而准备的系统发话句子220-2。
例如,上述会话情节成为以下这样的用户和系统的会话。
用户发话句子210-1:“好天气啊”
系统发话句子220-1:“喜欢好天气吗?”
用户发话句子210-1:“是的,喜欢啊”
系统发话句子220-1:“不喜欢雨天吗?”
图18所示的会话情节表示了最简单的形态的会话情节。在本自动会话系统可以处理的会话情节中,为了可以应对用户对同一系统发话做出不同的反应而返回用户发话的情况,也可以对一个系统发话句子准备多个用户发话句子。
会话情节编辑装置30具有以下功能:生成由在会话情节保持部33中存储的新的域20000、和该域20000用户发话句子210、系统发话句子220构成的会话情节数据,使其存储在会话情节保持部33中。
(3.会话情节的输入例)
接着,说明会话情节的输入例。图19到图23是表示关于某域20000输入了会话情节的情况下的输入画面的迁移的一例的图。
图19表示通过会话情节编辑装置30生成的输入界面画面的一例。在此,以域20000是关于“咖啡豆”的域来进行说明。
会话情节编辑装置30、更详细来说是编辑部32,生成成为输入界面的窗口30000,使输出部34对其进行显示。在窗口30000中设置了显示区域301,通过由操作员操作输入部31,在此输入用户发话句子以及系统发话句子。在图19的例子中显示了域名302,是等待接受该域20000中存储的会话情节的输入的状态。
图20是输入了作为该域20000中存储的会话情节的开始的用户发话句子401的状态的画面例。
在实际执行自动会话的情况下,会话服务器20的回答处理部21,当用户发话与在此记载的用户发话句子401“关于咖啡豆”一致、或者是可以视为与其相同的发话内容时,作为提取对用户发话进行应答的系统发话句子的域20000,从会话情节存储部22中选择将域名302设为“咖啡豆”的域20000,并使该域20000优先来选择系统发话句子。
作为会话情节的输入者的操作员,进行与上述用户发话句子401对应的回答、即系统发话句子的输入。图21表示通过操作员输入了针对用户发话句子401“关于咖啡豆”的系统发话句子501的状态的窗口30000的显示例。在此例中假定记载了以下会话情节:针对“关于咖啡豆”这样的用户发话句子401,自动会话系统发出作为“关于味道的特征进行回答”“摩卡”、“蓝山”、“乞力马扎罗”中,想知道哪个?”这样的疑问的系统发话句子501。
接着,作为会话情节的输入者的操作员,针对上述系统发话句子501输入预想的用户发话句子。图22表示针对所述系统发话句子501输入了预想的用户发话句子601的状态的窗口30000的显示例。在此例中,假定针对“关于味道的特征进行回答。“摩卡”、“蓝山”、“乞力马扎罗”中,想知道哪个?”这样的系统发话句子501,预想用户进行了“蓝山”这样的回答,由用户输入了用户发话句子601“蓝山”。
接着,作为会话情节的输入者的操作员,输入与上述用户发话句子601对应的系统发话句子。图23表示输入了与所述用户发话句子601对应的系统发话句子701的状态的窗口30000的显示例。会话情节的输入者输入系统发话701来作为用户发话句子601的回答。
通过这样的会话情节,自动会话系统在用户想知道咖啡豆蓝山时,可以返回其回答。此外,从此以后,会话情节的输入者也可以继续输入用户发话句子、系统发话句子,以使用户与自动会话系统的会话持续。
如上述那样输入的会话情节(用户发话句子和系统发话句子的集合),通过编辑部32被写入会话情节保持部33并存储。该会话情节被转移到会话服务器20的会话情节存储部22。此外,在被转移到会话情节存储部22的情况下,也可以进行会话情节的变换、移植,以便成为与会话服务器20适应的会话情节。
会话服务器20的回答处理部21,也参照会话情节存储部22中存储的新的会话情节,以便可以输出与用户发话对应的情节回答。
(4.变形例)
本实施方式即使如下这样变形也成立。
(1)会话情节编辑装置的变形例
图24是变形例涉及的会话情节编辑装置30X的功能框图。会话情节编辑装置30X基本上具有与前面所述的会话情节编辑装置30相同的结构,不同点是具有与会话情节保持部33相连的动态知识生成部35。此外,关于相同的结构要素赋予相同的参照符号,省略它们的说明。
动态知识生成部35具有根据在会话情节保持部33中存储的会话情节40生成动态知识40X的功能。动态知识40X是为了使会话服务器20可以更高速且高效率地检索作为态射的输入句子以及作为其对象的回答句子,而根据作为回答列的会话情节40再构成的数据。
根据该变形例,可以降低会话服务器20的处理负荷,可以进行高速的回答句子的答复。
(5.会话服务器的结构的另一个例子)
本发明的会话服务器20、回答处理部21即使采用下述的结构,也可以实现本发明。该结构可以通过对在此引用的美国专利申请公开第2007/0094007号说明书、美国专利申请公开第2007/0094008号说明书、美国专利申请公开第2007/0094005号说明书、或者美国专利申请公开第2007/0094004号说明书中记载的会话控制装置进行适当变更来实现。
(5.1.句子解析部)
接着,参照图25说明句子解析部400的结构例。
句子解析部400解析通过会话装置10的输入部11或声音识别部200确定的字符串。该句子解析部400在本实施方式中如图25所示,具有字符串确定部410、形态素提取部420、形态素数据库430、输入种类判定部440和发话种类数据库450。字符串确定部410按照每一个短语来划分通过输入部11以及声音识别部200确定的一连串的字符串。所谓一个短语,表示以不破坏文法的意思的程度尽可能细分字符串而得到的一个划分句子。具体而言,字符串确定部410,在一连串字符串中有某一定以上的时间间隔时,在该部分划分字符串。字符串确定部410将该划分而得的各字符串输出到形态素提取部420以及输入种类判定部440。此外,以下说明的“字符串”表示每一个短语的字符串。
(5.1.1.形态素提取部)
形态素提取部420,根据通过字符串确定部410划分而得的一个短语的字符串,从该一个短语的字符串中提取出构成字符串的最小单位的各形态素,作为第一形态信息。在此,所谓形态素,在本实施方式中假定表示字符串中出现的词结构的最小单位。作为该词结构的最小单位,列举出例如名词、形容词、动词等词类。
各形态素如图26所示,在本实施方式中可以表现为m1、m2、m3、...。图26是表示字符串和从该字符串中提取出的形态素的关系的图。如图26所示,从字符串确定部410输入了字符串的形态素提取部420,将该输入的字符串、和在形态素数据库430中预先存储的形态素群(该形态素群,关于属于各个词类的各形态素,准备了记载有该形态素的词条·读法·词类·活用形等的形态素词典)进行对照。进行了该对照的形态素提取部420从该字符串中提取出与预先存储的形态素群的某个一致的各形态素(m1、m2、...)。除了该提取出的各形态素的要素(n1、n2、n3、...),列举出例如助动词等。
该形态素提取部420将提取出的各形态素作为第一形态素信息而输出到话题确定信息检索部320。此外,第一形态素信素不需要被构造化。在此所谓“构造化”,是指根据词类等对字符串中包含的形态素分类排列,例如是指将作为发话句子的字符串变换为像“主语+宾语+谓语”等那样按照预定的顺序排列形态素而形成的数据。当然,即使使用构造化后的第一形态素信息,也不会妨碍实现本实施方式。
(5.1.2.输入种类判定部)
输入种类判定部440,根据通过字符串确定部410确定的字符串,判定发话内容的种类(发话种类)。该发话种类是确定发话内容的种类的信息,在本实施方式中例如表示图27所示的“发话句子的类型”。图27是表示“发话句子的类型”、表示该发话句子的类型的两字符的字母、以及与该发话句子的类型对应的发话句子的例子的图。
在此,“发话句子的类型”在本实施方式中如图27所示,由陈述句(D;Declaration)、时间句(T;Time)、场所句(L;Location)、否定句(N;Negation)等构成。该由各类型构成的句子由肯定句或疑问句构成。所谓“陈述句”,表示表达利用者的意见或想法的句子。该陈述句,在本实施方式中如图27所示,举出例如“我喜欢佐藤”等句子。所谓“场所句”,表示伴随场所的概念的句子。所谓“时间句”,表示伴随时间的概念的句子。所谓“否定句”,表示对陈述句进行否定时的句子。关于“发话句子的类型”的例句,如图27所示那样。
为了由输入种类判定部440判定“发话句子的类型”,输入种类判定部440在本实施方式中如图28所示,使用用于判定是陈述句的定义表现辞典、用于判定是否定句的否定表现辞典等。具体来说,从字符串确定部410输入了字符串的输入种类判定部440,根据所输入的字符串,将该字符串与发话种类数据库450中存储的各辞典进行对照。进行了该对照的输入种类判定部440,从该字符串中提取出与各辞典有关的要素。
该输入种类判定部440根据所提取出的要素判定“发话句子的类型”。例如,输入种类判定部440,在字符串中包含关于某现象进行了陈述的要素时,将包含该要素的字符串判定为陈述句。输入种类判定部440将判定出的“发话句子的类型”输出到回答取得部380。
(5.2.会话数据库)
接着,参照图29说明会话数据库500存储的数据的数据结构例。图29是表示会话数据库500存储的数据的结构例的概念图。
会话数据库500如图29所示,预先存储了多个用于确定话题的话题确定信息810。另外,各个话题确定信息810可以与其它话题确定信息810相关联,例如在图29所示的例子中,当确定话题确定信息C(810)时,确定与该话题确定信息C(810)相关联的其它话题确定信息A(810)、话题确定信息B(810)、话题确定信息D(810)来存储。
具体来说,话题确定信息810,在本实施方式中表示与从利用者输入时预想的输入内容、或者向利用者的回答句子具有关联性的“关键字”。
与话题确定信息810对应地存储了一个或多个话题标题820。话题标题820通过由一个字符、多个字符串或它们的组合组成的形态素构成。与各话题标题820对应地存储了向利用者的回答句子830。另外,表示回答句子830的种类的多个回答种类与回答句子830相对应。在各回答句子830中对应地存储有动作控制方法835。
接着,说明某话题确定信息810和其它话题确定信息810的关联。图30是表示某话题确定信息810A和其它话题确定信息810B、810C1~810C4、810D1~810D3...的关联的图。此外,在以下的说明中,所谓“相关联地存储”是指当读取某信息X时可以读取与该信息X关联的信息Y。例如,把在信息X的数据中存储了用于读出信息Y的信息(例如表示信息Y的存储目的地地址的指针、信息Y的存储目的地物理存储器地址、逻辑地址等)的状态,设为“信息Y与信息X“相关联地存储””。
在图30所示的例子中,话题确定信息,在与其它话题确定信息之间,可以将上位概念、下位概念、同义词、反义词(本图的例子中省略)相关联地存储。在本图所示的例子中,作为与话题确定信息810A(=“电影”)对应的上位概念的话题确定信息,与话题确定信息810A相关联地存储了话题确定信息810B(=“娱乐”),例如相对于话题确定信息(“电影”)被存储在上一层次中。
另外,与话题确定信息810A相关联地存储了与话题确定信息810A(=“电影”)对应的下位概念的话题确定信息810C1(=“导演”)、话题确定信息810C2(=“主演”)、话题确定信息810C3(=“发行公司”)、话题确定信息810C4(=“上映时间”)以及话题确定信息810D1(=“七武士”)、话题确定信息810D2(=“乱”)、话题确定信息810D3(=“保镖”)、...。
另外,与话题确定信息810A关联了同义词900。在此例中,表示作为话题确定信息810A即关键字“电影”的同义词,而存储了“作品”、“内容”、“影院”的情况。通过确定这样的同义词,在发话中未包含关键字“电影”,但在发话句子等中包含“作品”、“内容”、“影院”的情况下,可以认为在发话句子等中包含话题确定信息810A来进行处理。
回答处理部21通过参照会话数据库500的存储内容,当确定某个话题确定信息810时,可以高速地检索·提取与该话题确定信息810相关联地存储的其它话题确定信息810以及该话题确定信息810的话题标题820、回答句子830等。
接着,参照图31说明话题标题820(也称为“第二形态素信息”)的数据结构例。图31是表示话题标题820的数据结构例的图。
话题确定信息810D1、810D2、810D3、...分别具有多个不同的话题标题8201、8202、...、话题标题8203、8204、...、话题标题8205、8206、...。在本实施方式中,如图31所示,各个话题标题820是由第一确定信息1001、第二确定信息1002和第三确定信息1003构成的信息。在此,第一确定信息1001,在本实施方式中,表示构成话题的主要的形态素。作为第一确定信息1001的例子举出例如构成句子的主语。另外,第二确定信息1002,在本实施方式中表示与第一确定信息1001具有密切的关联性的形态素。该第二确定信息1002举出例如宾语。而且,第三确定信息1003,在本实施方式中,表示表示关于某对象的动作的形态素、或修饰名词等的形态素。该第三确定信息1003,举出例如动词、副词或形容词。此外,第一确定信息1001、第二确定信息1002、第三确定信息1003各自的意思没必要限定于上述内容,即使对第一确定信息1001、第二确定信息1002、第三确定信息1003赋予别的意思(别的词类),只要根据它们可以掌握句子的内容,本实施方式就成立。
例如,在主语为“七武士”、形容词为“有趣”的情况下,如图31所示,话题标题(第二形态素信息)8202由作为第一确定信息1001的形态素“七武士”和作为第三确定信息1003的形态素“有趣”构成。此外,在该话题标题8202中不包含与第二确定信息1002对应的形态素,作为第二确定信息1002而存储了用于表示没有相应的形态素的记号“*”。
此外,该话题标题8202(七武士;*;有趣),有“七武士有趣”的意思。在构成该话题标题820的括号内,以下成为从左起第一确定信息1001、第二确定信息1002、第三确定信息1003的顺序。另外,在话题标题820中没有从第一到第三确定信息中包含的形态素时,关于该部分示为“*”。
此外,构成上述话题标题820的确定信息不像上述第一到第三确定信息那样限定于三个,例如也可以进一步具有其它确定信息(第四确定信息、以及第四以上)。
接着,参照图32说明回答句子830。回答句子830如图32所示,在本实施方式中,为了进行与从利用者发出的发话句子的类型对应的回答,分类为陈述(D;Declaration)、时间(T;Time)、场所(L;Location)、否定(N;Negation)等类型(回答种类),针对每个类型准备回答句子。另外,设肯定句为“A”,设疑问句为“Q”。
参照图33说明话题确定信息810的数据结构例。图33表示与某个话题确定信息810“佐藤”对应的话题标题820、回答句子830的具体例。
与话题确定信息810“佐藤”对应了多个话题标题(820)1-1、1-2、...。与各个话题标题(820)1-1、1-2、...对应地存储了回答句子(830)1-1、1-2、...。针对每个回答种类840而准备了回答句子830。
当话题标题(820)1-1为(佐藤;*;喜欢){这是提取出“喜欢佐藤”中包含的形态素而得的话题标题}时,与该话题标题(820)1-1对应的回答句子(830)1-1列举出(DA;陈述肯定句“我也喜欢佐藤”)、(TA;时间肯定句“我喜欢击球时的佐藤”)等。后述的回答取得部380,一边参照输入种类判定部440的输出,一边取得与该话题标题820对应的一个回答句子830。
在各回答句子中,与该回答句子对应地确定了指定针对用户发话优先输出的回答句子(称为“下一回答句子”)的信息、即下一计划指定信息840。下一计划指定信息840,若是可以确定下一回答句子的信息,则可以是任何信息,例如是可以从会话数据库500中存储的全部回答句子中确定至少一个回答句子的回答句子ID等。
此外,在本实施方式中,下一计划指定信息840,作为以回答句子单位确定下一回答句子的信息(例如回答句子ID)而进行说明,但下一计划指定信息840也可以是以话题标题820、话题确定信息810单位确定下一回答句子(在这种情况下,作为下一回答句子而指定了多个回答句子,因此称为下一回答句子群。但是,实际上作为回答句子被输出的,成为在该回答句子群中包含的某个回答句子)的信息。例如,即使作为下一计划指定信息而使用话题标题ID、话题确定信息ID,本实施方式也成立。
(5.3.会话控制部)
在此,返回图25,说明会话控制部300的结构例。
会话控制部300具有以下功能:控制回答处理部21内的各结构要素(声音识别部200、句子解析部400、会话数据库500、输出部600、声音识别词典存储部700)间的数据的收发、以及自身与会话装置的数据的收发,并且进行对用户发话应答的回答句子的决定、输出。
会话控制部300,在本实施方式中如图25所示,具有管理部310、计划会话处理部320、谈话空间会话控制处理部330和CA会话处理部340。以下,对这些结构要素进行说明。
(5.3.1.管理部)
管理部310具有存储谈话履历,并且根据需要进行更新的功能。管理部310具有根据来自话题确定信息检索部350、省略句补充部360、话题检索部370、回答取得部380的请求,将所存储的谈话履历的全部或一部分传递到所述各部的功能。
(5.3.2.计划会话处理部)
计划会话处理部320具有执行计划,使得在与用户之间确立遵从计划的会话的功能。所谓“计划”是指按照预定的顺序向用户提供预定的回答。以下,说明计划会话处理部320。
计划会话处理部320具有根据用户发话按照预定的顺序输出预定的回答的功能。
图34是用于说明计划的概念图。如图34所示,在计划空间1401中预先准备了多个计划1、计划2、计划3、计划4等各种计划1402。所谓计划空间1401,是指在会话数据库500中存储的多个计划1402的集合。回答处理部21在装置启动时或会话开始时,选择预先决定用于开始的计划,或者根据各用户发话的内容,从计划空间1401中选择适当的某个计划1402,使用所选择的计划1402进行与用户发话对应的回答句子的输出。
图35是表示计划1402的结构例的图。计划1402具有回答句子1501、与之关联的下一计划指定信息1502。下一计划指定信息1502,是确定在该计划1402中包含的回答句子1501之后,向用户输出的包含预定的回答句子(称为下一候补回答句子)的计划1402的信息。在此例中,计划1具有在计划1执行时由回答处理部21输出的回答句子A(1501)、与该回答句子A(1501)关联的下一计划指定信息1502。下一计划指定信息1502,是确定具有作为针对回答句子A(1501)的下一候补回答句子的回答句子B(1501)的计划1402的信息“ID:002”。同样地,针对回答句子B(1501)也决定了下一计划指定信息1502,在输出了回答句子B(1501)的情况下,指定包含下一候补回答句子的计划2(1402)。于是,计划1402,通过下一计划指定信息1502连锁地连接,实现向用户输出一连串的连续内容这样的计划会话。即,将想要传达给用户的内容(说明句子、指导句子、问卷(questionnaire)等)分割成多个回答句子,并且预先决定各回答句子的顺序,作为计划而准备好,由此可以根据用户的发话,按顺序向用户提供这些回答句子。此外,如果通过下一计划指定信息1502指定的计划1402中包含的回答句子1501,是对之前的回答句子的输出进行应答的用户发话,则不一定需要立即输出,在用户和回答处理部21之间,该计划也可以间隔关于别的话题的会话后,输出通过下一计划指定信息1502指定的计划1402中包含的回答句子1501。
此外,图35所示的回答句子1501对应于图33所示的回答句子830中的某一个回答句子字符串,另外,图35所示的下一计划指定信息1502对应于图33所示的下一计划指定信息840。
此外,计划1402的连接不限于图35所示的一维排列。图36是表示具有与图35不同的连接方式的计划1402的例子的图。在图36所示的例子中,计划1(1402),为了可以指定成为下一候补回答句子的两个回答句子1501、即1402,而具有两个下一计划指定信息1502。作为具有输出了某个回答句子A(1501)的情况下的下一候补回答句子的计划1402,为了确定具有回答句子B(1501)的计划2(1402)、以及具有回答句子C(1501)的计划3(1402)这两个计划1402,设置了两个次计划指定信息1502。此外,回答句子B、回答句子C是选择性的、择一的,在输出一方的情况下不输出另一方,该计划1(1402)结束。于是,计划1402的连接不限于一维排列的形态,即使是树形图的连接、网状的连接也可以。
此外,不限定各计划具有几个下一候补回答句子。另外,针对成为话的结尾的计划1402,也可以不存在下一计划指定信息1502。
图37表示某一连串的计划1402的具体例。该一连串的计划14021~14024对应于用于向用户通知与危机管理相关的信息的4个回答句子15011~15014。4个回答句子15011~15014全体构成一段连贯的话(说明文章)。各计划14021~14024分别具有“1000-01”“1000-2”“1000-3”“1000-4”这样的ID数据17021~17024。此外,ID数据中的连字符以后的号码是表示输出顺序的信息。另外,各计划14021~14024分别具有下一计划指定信息15021~15024。下一计划指定信息15024的内容是“1000-0F”这样的数据,但该连字符以后的号码“0F”是表示接下来输出的预定计划不存在,该回答句子是一连串的话(说明文章)的结尾的信息。
在此例中,当用户发话为“请教大地震发生时的危机管理”时,计划会话处理部320开始执行该一连串的计划。即,当计划会话处理部320接受用户发话“请教大地震发生时的危机管理”时,计划会话处理部320检索计划空间1401,调查是否存在具有与用户发话“请教大地震发生时的危机管理”对应的回答句子15011的计划1402。在此例中,假定与“请教大地震发生时的危机管理”对应的用户发话字符串17011对应于计划14021。
计划会话处理部320,当发现计划14021时,取得该计划14021中包含的回答句子15011,将该回答句子15011作为对用户发话的回答来输出,同时通过下一计划指定信息15021确定下一候补回答句子。
然后,在回答句子15011的输出后,经由输入部11或声音识别部200等接受用户发话时,计划会话处理部320进行计划14022的执行。即,计划会话处理部320判定是否执行通过下一计划指定信息15021指定的计划14022,即是否输出第2个回答句子15012。具体来说,计划会话处理部320,将与该回答句子15012对应的用户发话字符串(也称为例句)17012或者话题标题820(在图37中省略图示)与接受的用户发话进行比较,判定它们是否一致。在一致的情况下,输出第2个回答句子15012。另外,在包含第2个回答句子15012的计划14022中记载了下一计划指定信息15022,因此确定下一候补回答句子。
同样地,根据此后继续进行的用户发话,计划会话处理部320可以依次转移到计划14023、计划14024来进行第3个回答句子15013、第4个回答句子15014的输出。此外,第4个回答句子15014是最终回答句子,当第4个回答句子15014的输出完成时,计划会话处理部320结束计划执行。
于是,通过依次执行计划14021~14024,可以按照既定的顺序向用户提供预先准备的会话内容。
(5.3.3.谈话空间会话控制处理部)
返回图25,继续会话控制部300的结构例的说明。
谈话空间会话控制处理部330具有话题确定信息检索部350、省略句补充部360、谈话检索部370和回答取得部380。所述管理部310控制会话控制部300的全体。
所谓“谈话履历”,是确定用户和回答处理部21间的会话的话题或主题的信息,谈话履历是包含后述的“关注话题确定信息”“关注话题标题”“利用者输入句子话题确定信息”“回答句子话题确定信息”中的至少某一个的信息。另外,在谈话履历中包含的“关注话题确定信息”“关注话题标题”“回答句子话题确定信息”不限于通过之前的会话确定的信息,也可以是在过去的预定期间中成为“关注话题确定信息”“关注话题标题”“回答句子话题确定信息”的信息,或者是它们的累积的记录。以下,对构成谈话空间会话控制处理部330的所述各部进行说明。
(5.3.3.1.话题确定信息检索部)
话题确定信息检索部350将通过形态素提取部420提取出的第一形态素信息与各话题确定信息进行对照,从各话题确定信息中检索与构成第一形态素信息的形态素一致的话题确定信息。具体来说,话题确定信息检索部350,当从形态素提取部420输入的第一形态素信息由“佐藤”以及“喜欢”这两个形态素构成时,将输入的第一形态素信息与话题确定信息群进行对照。
进行了该对照的话题确定信息检索部320,当关注话题标题820focus(为了与到前一次为止检索出的话题标题、其它话题标题区别,而标记为820focus)中包含构成第一形态素信息的形态素(例如“佐藤”)时,向回答取得部380输出该关注话题标题820focus。另一方面,当关注话题标题820focus中不包含构成第一形态素信息的形态素时,话题确定信息检索部350根据第一形态素信息,决定利用者输入句子话题确定信息,将输入的第一形态素信息以及利用者输入句子话题确定信息输出到省略句补充部360。此外,“利用者输入句子话题确定信息”,是指相当于第一形态素信息中包含的形态素内、与利用者作为话题的内容相对应的形态素的话题确定信息,或者是相当于第一形态素信息中包含的形态素内、有可能与利用者作为话题的内容相对应的形态素的话题确定信息。
(5.3.3.2.省略句补充部)
省略句补充部360,利用到前一次为止检索到的话题确定信息810(以下称为“关注话题确定信息”)以及在前一次的回答句子中包含的话题确定信息810(以下称为“回答句子话题确定信息”),对所述第一形态素信息进行补充,由此生成多个种类的补充后的第一形态素信息。例如,在用户发话为“喜欢”这样的句子时,省略句补充部360将关注话题确定信息“佐藤”包含在第一形态素信息“喜欢”中,生成补充后的第一形态素信息“佐藤、喜欢”。
即,当将第一形态素信息设为“W”、将关注话题确定信息或回答句子话题确定信息的集合设为“D”时,省略句补充部360在第一形态素信息“W”中包含集合“D”的要素来生成补充后的第一形态素信息。
由此,使用第一形态素信息构成的句子为省略句,在作为日语无法理解等情况下,省略句补充部360可以使用集合“D”,将该集合“D”的要素(例如“佐藤”)包含在第一形态素信息“W”中。结果,省略句补充部360可以作出对第一形态素信息“喜欢”进行补充后的第一形态信息“佐藤、喜欢”。此外,补充后的第一形态信息“佐藤、喜欢”对应于“喜欢佐藤”这样的用户发话。
即,省略句补充部360,即使在利用者的发话内容是省略句等情况下,也可以使用集合“D”来补充省略句。结果,省略句补充部360,即使由第一形态素信息构成的句子是省略句,也可以使该句子成为适当的日语。
另外,省略句补充部360根据所述集合“D”检索与补充后的第一形态素信息一致的话题标题820。当发现与补充后的第一形态素信息一致的话题标题820时,省略句补充部360将该话题标题820输出到回答取得部380。回答取得部380可以根据通过省略句补充部360检索到的适当的话题标题820,输出最适合于利用者的发话内容的回答句子830。
此外,省略句补充部360不仅限于在第一形态素信息中包含集合“D”的要素。该省略句补充部360也可以根据关注话题标题,在提取出的第一形态素信息中包含在构成该话题标题的第一确定信息、第二确定信息或第三确定信息的某一个中包含的形态素。
(5.3.3.3.话题检索部)
话题检索部370,当未通过省略句补充部360确定话题标题810时,将第一形态素信息、和与利用者输入句子话题确定信息对应的各话题标题810进行对照,从各话题标题810中检索最适合于第一形态素信息的话题标题810。
具体来说,从省略句补充部360输入了检索命令信号的话题检索部370,根据在所输入的检索命令信号中包含的利用者输入句子话题确定信息以及第一形态素信息,从与该利用者输入句子话题确定信息对应的各话题标题中检索最适合于该第一形态素信息的话题标题810。话题检索部370将该检索到的话题标题810作为检索结果信号,输出到回答取得部380。
先前披露的图33表示与某话题确定信息810(=“佐藤”)对应的话题标题820、回答句子830的具体例。如图33所示,例如话题检索部370,由于在所输入的第一形态素信息“佐藤、喜欢”中包含话题确定信息810(=“佐藤”),因此确定该话题确定信息810(=“佐藤”),然后,将与该话题确定信息810(=“佐藤”)对应的各话题标题(820)1-1、1-2、...和所输入的第一形态素信息“佐藤、喜欢”进行对照。
话题检索部370根据其对照结果,从各话题标题(820)1-1~1-2中确定与所输入的第一形态素信息“佐藤、喜欢”一致的话题标题(820)1-1(佐藤:*;喜欢)。话题检索部340将检索到的话题标题(820)1-1(佐藤;*;喜欢)作为检索结果信号,输出到回答取得部380。
(5.3.3.4.回答取得部)
回答取得部380根据通过省略句补充部360、或者话题检索部370检索出的话题标题820,取得与该话题标题820对应的回答句子830。另外,回答取得部380根据通过话题检索部370检索出的话题标题820,将与该话题标题820对应的各回答种类、和通过输入种类判定部440判定出的发话种类进行对照。进行了该对照的回答取得部380从各回答种类中检索与判定出的发话种类一致的回答种类。
在图33所示的例子中,回答取得部350,当通过话题检索部370检索出的话题标题是话题标题1-1(佐藤;*;喜欢)时,从与该话题标题1-1对应的回答句子1-1(DA、TA等)中,确定与通过输入种类判定部440判定出的“发话句子的类型”(例如DA)一致的回答种类(DA)。确定了该回答种类(DA)的回答取得部380,根据所确定的回答种类(DA),取得与该回答种类(DA)对应的回答句子1-1(“我也喜欢佐藤。”)。
在此,上述“DA”、“TA”等中的“A”表示肯定形式。因此,在发话种类以及回答种类中包含“A”时,表示关于某事情进行肯定。另外,在发话种类以及回答种类中也可以包含“DQ”、“TQ”等种类。该“DQ”、“TQ”等中的“Q”表示关于某事情的疑问。
当回答种类由上述疑问形式(Q)构成时,与该回答种类对应的回答句子由肯定形式(A)构成。作为以该肯定形式(A)生成的回答句子,列举出对疑问事项进行回答的句子等。例如,当发话句子是“你对投币游戏机进行过操作吗?”时,关于该发话句子的发话种类成为疑问形式(Q)。与该疑问形式(Q)对应的回答句子,列举出例如“我对投币游戏机进行过操作”(肯定形式(A))。
另一方面,当发话种类由肯定形式(A)构成时,与该回答种类对应的回答句子由疑问形式(Q)构成。作为以该疑问形式(Q)生成的回答句子,列举出对发话内容反问的疑问句、或者询问特定事情的疑问句等。例如,当发话句子是“我爱好玩投币游戏机”时,关于该发话句子的发话种类成为肯定形式(A)。与该肯定形式(A)对应的回答句子,列举出例如“不爱好玩弹子机吗?”(询问特定事情的疑问句(Q))。
回答取得部380将所取得的回答句子830作为回答句子信号,输出到管理部310。从回答取得部380输入了回答句子信号的管理部310,将所输入的回答句子信号输出到输出部600。
(5.3.3.5.CA会话处理部)
CA会话处理部340具有以下功能:在针对用户发话,在计划会话处理部320以及谈话空间会话控制处理部330的任意一个中都没有决定回答句子的情况下,根据用户发话的内容输出可以继续与用户的会话的回答句子。
以上,结束了回答处理部21的结构例的说明。
(5.4.会话控制方法)
具有上述结构的回答处理部21通过以下这样进行动作来实现会话控制方法。说明本实施方式的回答处理部21、更详细而言是会话控制部300的动作。
图38是表示会话控制部300的主处理的一例的流程图。该主处理是每当会话控制部300接受用户发话时执行的处理,通过进行该主处理,进行与用户发话对应的回答句子的输出。会话装置10和会话服务器20(回答处理部21)间的会话(对话)确立。
进入主处理时,会话控制部300、更详细而言是计划会话处理部320,首先执行计划会话控制处理(S1801)。计划会话控制处理是执行计划的处理。
图39、图40是表示计划会话控制处理的一例的流程图。以下,参照图39、图40说明计划会话控制处理的例子。
当开始计划会话控制处理时,计划会话处理部320首先进行基本控制状态信息检查(S1901)。基本控制状态信息,将计划1402的执行是否结束作为基本控制状态信息,存储在预定的存储区域中。
基本控制状态信息具有记载计划的基本控制状态的作用。
图41是表示关于被称为情节的类型的计划而产生的4个基本控制状态的图。以下说明各个状态。
(1)结束
该基本控制状态是用户发话与执行中的计划1402一致、更详细而言是与计划1402所对应的话题标题820或例句一致的情况。在这种情况下,计划会话处理部320结束该计划1402,转移到与通过下一计划指定信息1502指定的回答句子1501对应的计划1402。
(2)放弃
该基本控制状态,是当判断出用户发话内容是请求了计划1402的结束的情况下,或者判定为用户的关心转移到了执行中的计划以外的事项的情况下设定的基本控制状态。在基本控制状态信息表示放弃的情况下,计划会话处理部320检索在成为放弃对象的计划1402以外是否存在与用户发话对应的计划1402,在存在的情况下开始该计划1402的执行,在不存在的情况下结束计划的执行。
(3)维持
该基本控制状态,是在用户发话不对应于与执行中的计划1402对应的话题标题820(参照图33)或例句1701(参照图37),并且判断出用户发话不对应于基本控制状态“放弃”的情况下,在基本控制状态信息中记载的基本控制状态。
当是该基本控制状态的情况下,计划会话处理部320在接受用户发话时,首先研究是否重新开始正保留·中止的计划1402,当用户会话不适合于重新开始计划1402时,例如用户发话不对应于与计划1402对应的话题标题802或例句1702时,开始其它计划1402的执行、或者进行后述的谈话空间会话控制处理(S1902)等。当用户发话适合于重新开始计划1402时,根据所存储的下一计划指定信息1502进行回答句子1501的输出。
当基本控制状态为“维持”时,计划会话处理部320检索其它计划1402,以便可以输出与该计划1402对应的回答句子1501以外的回答,或者进行后述的谈话空间会话控制处理等,但在用户发话再次成为与计划1402相关的发话时,重新开始该计划1402的执行。
(4)继续
该状态,是在用户发话不对应于执行中的计划1402中包含的回答句子1501、并且判断出用户发话内容不对应于基本控制状态“放弃”、并且从用户发话解释出的用户的意图不明确的情况下所设定的基本控制状态。
当基本控制状态为“继续”时,计划会话处理部320在接受用户发话时,首先研究是否重新开始正保留·中止的计划1402,当用户发话不适合于重新开始计划1402时,进行后述的CA会话控制处理等,以便可以输出用于从用户引出其它发话的回答句子。
返回图39,继续说明计划会话控制处理。
参照了基本控制状态信息的计划会话处理部320,判定基本控制状态信息表示的基本控制状态是否是“结束”(S1902)。当判定出基本控制状态是“结束”时(S1902,是),计划会话处理部320在基本控制状态信息表示的执行中的计划1402中判定回答句子1501是否是最终回答句子(S1903)。
当判定为已输出最终回答句子1501时(S1903,是),计划会话处理部320,由于在该计划1402中已经全部传达完应该向用户回答的内容,因此为了判定是否开始新的别的计划1402,检索在计划空间中是否存在与用户发话对应的计划1402(S1904)。当该检索的结果是未发现与用户发话对应的计划1402时(S1905,否),由于不存在应该向用户提供的计划1402,因此计划会话处理部320直接结束计划会话控制处理。
另一方面,当该检索的结果是发现了与用户发话对应的计划1402时(S1905,是),计划会话处理部320转移到该计划1402(S1906)。这是由于,存在应该向用户提供的计划1402,因此开始该计划1402的执行(输出计划1402中包含的回答句子1501)。
然后,计划会话处理部320输出该计划1402的回答句子1501(S1908)。所输出的回答句子1501成为对用户发话的回答,计划会话处理部320提供想要向用户传达的信息。
回答句子输出处理(S1908)后,计划会话处理部320结束计划会话控制处理。
另一方面,在先前输出的回答句子1501是否是最终的回答句子1501的判定(S1903)中,当先前输出的回答句子1501不是最终的回答句子1501时(S1903,否),计划会话处理部320转移到与先前输出的回答句子1501相连的回答句子1501、即通过下一计划指定信息1502确定的回答句子1501所对应的计划1402(S1907)。
此后,计划会话处理部320输出在对应的计划1402中包含的回答句子1501,进行对用户发话的回答(S1908)。所输出的回答句子1501成为对用户发话的回答,计划会话处理部320提供想传达给用户的信息。在回答句子输出处理(S1908)后,计划会话处理部320结束计划会话控制处理。
在S1902的判定处理中,当基本控制状态信息不是“结束”时(S1902,否),计划会话处理部320判定基本控制状态信息表示的基本控制状态是否是“放弃”(S1909)。当判定为基本控制状态是“放弃”时(S1909,是),由于不存在应该继续的计划1402,因此计划会话处理部320为了判定是否存在应该开始的新的别的计划1402,在计划空间1401内检索是否存在与用户发话对应的计划1402(S1904)。此后,与在先描述的S1903(是)中的处理同样地,计划会话处理部320执行从S1905到S1908的处理。
另一方面,在基本控制状态信息表示的基本控制状态是否是“放弃”的判定(S1909)中,当判定为基本控制状态不是“放弃”时(S1909,否),计划会话处理部320进一步进行基本控制状态信息表示的基本控制状态是否是“维持”的判定(S1910)。
当基本控制状态信息表示的基本控制状态是“维持”时(S1910,是),计划会话处理部320,关于正保留·停止的计划1402调查用户是否再次表示出关心,当表示出关心时进行动作,重新开始临时保留·停止的计划1402地进行动作。即,计划会话处理部320检查保留·停止中的计划1402(图40;S2001),判定用户发话是否对应于保留·停止中的该计划1402(S2002)。
当判定为用户发话对应于该计划1402时(S2002,是),计划会话处理部320转移到与该用户发话对应的计划1402(S2003)。此后,执行回答句子输出处理(图39;S1908)以便输出在该计划1402中包含的回答句子1501。通过如此进行动作,计划会话处理部320根据用户发话可以重新开始已保留·中断的计划1402,可以将在预先准备的计划1402中包含的内容全部传递给用户。
另一方面,在前面的S2002(参照图40)中判定出保留·停止中的计划1402不对应于用户发话时(S2002,否),计划会话处理部320为了判定是否存在应该开始的新的别的计划1402,在计划空间1401内检索是否存在与用户发话对应的计划1402(图39;S1904)。此后,与在先描述的S1903(是)中的处理同样地,计划会话处理部320执行从S1905到S1909的处理。
在S1910的判定中,当基本控制状态信息表示的基本控制状态不是“维持”时(S1910,否),意味着基本控制状态信息表示的基本控制状态是“继续”。在这种情况下,计划会话处理部320不进行回答句子的输出而结束计划会话控制处理。
以上,结束了计划会话控制处理的说明。
返回图38,继续说明主处理。
当结束计划会话控制处理(S1801)时,会话控制部300开始谈话空间会话控制处理(S1802)。但是,在计划会话控制处理(S1801)中进行了回答句子输出的情况下,会话控制部300不进行谈话空间会话控制处理(S1802)以及在后面说明的CA会话控制处理(S1803)的任何一个,进行基本控制信息更新处理(S1904)来结束主处理。
图42是表示本实施方式的谈话空间会话控制处理的一例的流程图。
首先,输入部11进行取得来自利用者的发话内容的步骤(步骤S2201)。具体而言,输入部11取得构成利用者的发话内容的声音。输入部11将所取得的声音作为声音信号,输出到声音识别部200。此外,输入部11也可以不取得来自利用者的声音,而取得从利用者输入的字符串(例如以文本形式输入的字符数据)。在这种情况下,输入部11不是麦克风,而成为键盘或触摸面板等字符输入装置。
接着,声音识别部200进行根据通过输入部11取得的发话内容确定与发话内容对应的字符串的步骤(步骤S2202)。具体而言,从输入部11输入了声音信号的声音识别部200,根据所输入的声音信号确定与该声音信号对应的单词假设(候补)。声音识别部200取得与所确定的单词假设(候补)对应的字符串,将所取得的字符串作为字符串信号输出到会话控制部300,更详细而言输出到谈话空间会话控制部330。
然后,字符串确定部410进行将通过声音识别部200确定的一连串字符串按照每一句来划分的步骤(步骤S2203)。具体而言,从管理部310输入了字符串信号(或者形态素信号)的字符串确定部410,在该输入的一连串字符串中存在某一定以上的时间间隔时,在该部分划分字符串。字符串确定部410将该划分而得的各字符串输出到形态素提取部420以及输入种类判定部440。此外,字符串确定部410,当所输入的字符串是从键盘输入的字符串时,优选在标点或空格等所在的部分划分字符串。
此后,形态素提取部420进行根据通过字符串确定部410确定的字符串,提取构成字符串的最小单位的各形态素作为第一形态素信息的步骤(步骤S2204)。具体而言,从字符串确定部410输入了字符串的形态素提取部420,将所输入的字符串、和在形态素数据库430中预先存储的形态素群进行对照。此外,该形态素群,在本实施方式中,关于属于各个词类的各形态素,准备了记载有该形态素的标题词·读法·词类·活用形等的形态素辞典。
进行了该对照的形态素提取部420,从所输入的字符串中提取出与预先存储的形态素群中包含的各形态素一致的各形态素(m1、m2、...)。形态素提取部420将提取出的各形态素作为第一形态素信息,输出到话题确定信息检索部350。
接着,输入种类判定部440进行根据构成通过字符串确定部410确定的一句的各形态素,判定“发话句子的类型”的步骤(步骤S2205)。具体而言,从字符串确定部410输入了字符串的输入种类判定部440,根据所输入的字符串,将该字符串和在发话种类数据库450中存储的各辞典进行对照,从该字符串中提取出与各辞典相关的要素。提取出该要素的输入种类判定部440,根据提取出的要素,判定该要素属于哪个“发话句子的类型”。输入种类判定部440将判定出的“发话句子的类型”(发话种类)输出到回答取得部380。
然后,话题确定信息检索部350进行将通过形态素提取部420提取出的第一形态素信息、和关注话题标题820focus进行比较的步骤(步骤S2206)。
当构成第一形态素信息的形态素和关注话题标题820focus一致时,话题确定信息检索部350将该话题标题820输出到回答取得部380。另一方面,当构成第一形态素信息的形态素和话题标题820不一致时,话题确定信息检索部350将所输入的第一形态素信息以及利用者输入句子话题确定信息作为检索命令信号,输出到省略句补充部360。
此后,省略句补充部360进行根据从话题确定信息检索部350输入的第一形态素信息,将关注话题确定信息以及回答句子话题确定信息包含在所输入的第一形态素信息中的步骤(步骤S2207)。具体而言,当将第一形态素信息设为“W”,将关注话题确定信息以及回答句子话题确定信息的集合设为“D”时,省略句补充部360在第一形态素信息“W”中包含话题确定信息“D”的要素,生成补充后的第一形态素信息,并将该补充后的第一形态素信息、和与集合“D”关联的全部话题标题820进行对照,检索是否存在与补充后的第一形态素信息一致的话题标题820。当存在与补充后的第一形态素信息一致的话题标题820时,省略句补充部360将该话题标题820输出到回答取得部380。另一方面,当未发现与补充后的第一形态素信息一致的话题标题820时,省略句补充部360将第一形态素信息和利用者输入句子话题确定信息传递给话题检索部370。
接着,话题检索部370进行将第一形态素信息和利用者输入句子话题确定信息进行对照,从各话题标题820中检索适合于第一形态素信息的话题标题820的步骤(步骤S2208)。具体而言,从省略句补充部360输入了检索命令信号的话题检索部370,根据在所输入的检索命令信号中包含的利用者输入句子话题确定信息以及第一形态素信息,从与该利用者输入句子话题确定信息对应的各话题标题820中检索适合于该第一形态素信息的话题标题820。话题检索部370将作为该检索结果而得到的话题标题820作为检索结果信号,输出到回答取得部380。
接着,回答取得部380根据通过话题确定信息检索部350、省略句补充部360或者话题检索部370检索出的话题标题820,将通过句子解析部400判定出的利用者的发话种类、和与话题标题820对应的各回答种类进行对照,进行回答句子830的选择(步骤S2209)。
具体而言,以下这样来进行回答句子830的选择。即,从话题检索部370输入了检索结果信号、并从输入种类判定部440输入了“发话句子的类型”的回答取得部380,根据与所输入的检索结果信号对应的“话题标题”和所输入的“发话句子的类型”,从与该“话题类型”对应的回答种类群中确定与“发话句子的类型”(DA等)一致的回答种类。
接着,回答取得部380经由管理部310,将在步骤S2209中取得的回答句子830输出到输出部600(步骤S2210)。从管理部310取得了回答句子的输出部600输出所输入的回答句子830。
以上,结束了谈话空间会话控制处理的说明,返回图38重新开始主处理的说明。
会话控制部300,当结束谈话空间会话控制处理时,执行CA会话控制处理(S1803)。但是,在计划会话控制处理(S1801)以及谈话空间会话控制处理(S1801)中进行了回答句子输出的情况下,会话控制部300不进行CA会话控制处理(S1803),进行基本控制信息更新处理(S1804)来结束主处理。
CA会话控制处理(S1803)是判定用户发话是“正在说明某事”、“正在确认某事”、“正在进行非难或攻击”、还是“这些以外”,输出与用户发话的内容以及判定结果对应的回答句子的处理。通过进行该CA会话控制处理,即使在计划会话控制处理以及谈话空间会话控制处理的任何一个中都无法输出适合于用户发话的回答句子,也可以输出不中断与用户的会话的流程地继续的、比如“相连”的回答句子。
然后,会话控制部300进行基本控制信息更新处理(S1804)。在该处理中,会话控制部300、更详细而言是管理部310,在计划会话处理部320进行了回答句子输出的情况下,将基本控制信息设定为“结束”,在计划会话处理部320停止了回答句子输出的情况下,将基本控制信息设定为“放弃”,在谈话空间会话控制处理部330进行了回答句子输出的情况下,将基本控制信息设定为“维持”,在CA会话处理部340进行了回答句子输出的情况下,将基本控制信息设定为“继续”。
在该基本控制信息变更处理中设定的基本控制信息,在所述计划会话控制处理(S1810)中被参照,在计划的继续或重新开始中被利用。
以上,通过每当接受用户发话时执行主处理,回答处理部21可以根据用户发话执行预先准备的计划,并且针对计划中未包含的话题也可以进行适宜的应答。
(6.第2实施方式)
接下来,说明本发明的第2实施方式。
本实施方式提出了使用所述自动会话系统1的指导系统。在此,所谓“指导系统”,是指对用户进行与信息或内容等相关的指导、引导、辅助等服务的系统。
(6.1.指导系统的基本结构)
首先,说明本指导系统的基本结构。图43是表示指导系统的结构例的框图。图43所示的指导系统具有:与通信网120连接的用户终端装置110、与通信网120连接的媒体服务器100、与通信网120连接的会话服务器选择装置130。此外,会话服务器选择装置130所使用的会话情节40,与所述自动会话系统1同样,可以通过会话情节编辑装置30来编辑。
(6.1.1.用户终端装置)
用户终端装置110与媒体服务器100连接,是可以使用户阅览从媒体服务器100提供的内容,同时作为所述会话装置10来工作的装置。
用户终端装置110通过具备运算处理装置(CPU)、主存储器(RAM)、读出专用存储器(ROM)、输入输出装置(I/O)、以及在必要时具备硬盘装置等外部存储装置的信息处理装置来实现。这种信息处理装置,例如是具备网络通信功能的PC(个人计算机)、便携电话机、便携游戏机。在此所说的PC,包含被称为“网络笔记本(NetBook)”的产品。网络笔记本(NetBook)也被称为Nettop,是比较廉价、体积小、重量轻的、具备作为个人计算机(笔记本个人计算机/台式个人计算机)的最低限度的功能的产品。
图44中揭示了表示用户终端装置110的结构例的功能框图。用户终端装置110具有:通信控制部112、与通信控制部112连接的浏览器部111、与通信控制部112连接的会话处理部12、与会话处理部12以及浏览器部111连接的动作控制部13、与会话处理部连接的输入部11、与会话处理部12以及浏览器部111连接的输出部14。此外,针对与所述会话装置10相同的结构要素赋予了相同的参照符号,因此省略这些结构要素的说明。此外,会话处理部12相当于本发明的第1处理部,动作控制部13相当于本发明的第2处理单元。
通信控制部112具有经由通信网120,与会话服务器选择装置130以及媒体服务器100进行数据收发的功能。具体而言,通信控制部112进行预定协议的执行、数据与电气信号的相互变换等。此外,当用户终端装置110是通过无线通信与通信网120进行连接的装置(例如便携电话机等)时,通信控制部112进行无线信号的接收、解调、调制、发送。
相当于本发明的阅览单元的浏览器部111具有从媒体服务器100接收内容(例如动画文件、HTML文件等Web文件等)的数据,以用户可以阅览的方式对接收到的内容进行解释、再生、显示、执行等的功能,例如是互联网阅览软件(Web浏览器)。
(6.1.2.会话服务器选择装置)
会话服务器选择装置130是具有多个会话服务器20,根据来自用户终端装置110的请求或状况,选择某个会话服务器20来使其工作,与用户终端装置110协同工作,作为自动会话系统1而工作的装置。
会话服务器选择装置130通过具备运算处理装置(CPU)、主存储器(RAM)、读出专用存储器(ROM)、输入输出装置(I/O)、以及在必要时具备硬盘装置等外部存储装置的信息处理装置来实现。信息装置是PC、工作站、服务器等。会话服务器选择装置130也可以是通过网络连接多个信息处理装置而构成的装置。
图45是表示会话服务器选择装置130的结构例的功能框图。会话服务器选择装置130具有:具有多个会话服务器20的会话服务器集合部131、和会话服务器选择部132。多个会话服务器20具有各自独立的意思解释辞典部23、会话情节22(参照图3),分别准备用于处理关于固有的话题的会话。在会话服务器20中准备了用于处理一般话题的会话服务器20,首先,开始选择该会话服务器20(为了区别,设为称为通用会话服务器20的会话服务器)来启动,进行与用户的会话,根据在该会话中出现的话题,启动与该话题适合的别的会话服务器20,交接与用户的会话处理地进行动作。
会话服务器选择部132,根据来自用户终端装置110、更详细来说是动作控制部13的请求或指示,使会话服务器集合部131具有的会话服务器20选择性地启动(使所指定的会话服务器20新启动,使此前已启动的会话服务器20停止)。
用户终端装置110、更详细来说是动作控制部13,根据动作控制信息,将会话服务器20的选择请求或指示发送到会话服务器选择装置130。例如,当作为用户发话的输入句子是“想知道天气情况”时,作为其回答句子而准备了“那么,说说天气吧”,针对该回答句子,准备使得在会话情节存储部22中存储了以天气为话题的会话情节40的会话服务器20启动的意思的动作控制信息即可。
(6.1.3.媒体服务器)
媒体服务器100是经由通信网120将可以通过用户终端装置110、更详细来说是浏览器部111阅览的内容发送到用户终端装置110的装置。
(6.2.动作)
接着,说明上述指导系统的动作例。
当用户终端装置110启动时,会话处理部12请求会话服务器选择装置130启动通用会话服务器20。会话服务器选择装置130根据该请求使通用会话服务器20启动,等待接受来自用户的输入句子。
图46表示在会话服务器选择装置130使通用会话服务器20启动,等待接受来自用户的输入句子的状态下,在用户终端装置110的输出部14(在此例中设为液晶显示装置)上显示的画面例。如图所示,在作为输出部14的液晶显示装置的显示区域1000内生成了窗口1100,在窗口1100内显示了相当于通用会话服务器20的人物1200。在人物1200上附加了字符显示框1300,在该字符显示框内作为字符串而显示了回答句子。此外,在此说明的例子中,回答句子作为字符串而被输出,但也可以代替字符串的显示,或者在字符串的显示的同时,通过基于人工声音的声音输出将回答句子提供给用户。
在显示区域1000内的右下方还设有启动人物显示区域1400。在启动人物显示区域1400中,在会话服务器选择装置130中启动了通用会话服务器20以外的会话服务器20的情况下,显示与该会话服务器20(为了区别,称为激活会话服务器20)对应的人物。
在图46的状态下,假定在用户终端装置110中将用户发话“想看料理节目”输入了输入部11。用户终端装置110向该时刻通过会话服务器选择装置130启动的通用会话服务器20请求与用户发话“想看料理节目”对应的回答句子。通用会话服务器20,作为回答句子而选择“好的”,并发送到用户终端装置110。另外,在该回答句子“好的”上附加了动作控制信息,该动作控制信息记载了:向会话服务器选择装置130请求启动会话服务器集合部131具有的会话服务器20中、处理与料理节目有关的话题的会话服务器20。
接收到上述回答句子以及动作控制信息的用户终端装置110,使字符显示框1300显示回答句子,同时向会话服务器选择装置130发送请求使通过动作控制信息指定的、处理与料理节目有关的话题的会话服务器20启动的消息。
会话服务器选择装置130应答该消息,使所指定的会话服务器20启动,成为激活会话服务器20。针对以后的用户发话的回答句子的决定,代替从前的通用会话服务器20而由该激活会话服务器20处理。在此,激活会话服务器20从该会话服务器20的会话情节存储部22中选择与在先的用户发话“想看料理节目”对应的回答句子“想看什么料理节目?”,并与该回答句子中设定的动作控制信息一起发送到用户终端装置110。此例中,假定动作控制信息记载了使作为该激活会话服务器20的人物而预先设定的人物图像显示在启动人物显示区域1400中的命令。
图47是表示在接收到上述回答句子“想看什么料理节目?”以及该动作控制信息的用户终端装置110的输出部14上显示的画面例。在该画面中,在启动人物显示区域1400中显示作为激活会话服务器20的人物而预先设定的人物1500的图像,同时在该人物1500上附加的字符显示框1600中显示作为回答句子的“想看什么料理节目?”这样的字符串。
此后的用户发话通过该激活会话服务器20来处理,控制回答句子的输出,另外,通过在回答句子上附加的动作控制信息,控制用户终端装置110中的动作等。
此后,在通过与指导系统的会话而决定了想看的料理节目时,将指定该料理节目的动作控制信息从激活会话服务器20发送到用户终端装置110,在用户终端装置110中,根据该动作控制信息,动作控制部13控制浏览部111从媒体服务器100下载该料理节目的数据,通过浏览部111对所下载的料理节目的数据进行再生,由此,用户受指导系统指导,进行希望的内容的视听。
(6.2.1.CM视听中的动作)
在用户正在通过用户终端装置110对来自媒体服务器100的CM(商业消息)进行视听的情况下,本指导系统也起作用。
图48是表示用户正在使用用户终端装置110对CM进行视听时的画面例的图。在此例中,假定用户正在通过用户终端装置110在再生区域1700中显示与某内容相关的商品(在此例中,是电视剧的DVD)的CM。此时,与该商品相关的会话服务器20正在作为激活会话服务器20而启动,因此,在启动人物显示区域1400中显示与该激活会话服务器20对应的人物1500。
假定在图48的状态下,在用户终端装置110中向输入部11输入了用户发话“这部电视剧什么时候播放?”。用户终端装置110向激活会话服务器20请求与用户发话“这部电视剧什么时候播放?”对应的回答句子。激活会话服务器20参照其会话情节存储部22,选择“预定从下月初开始在上午时间段播放。”来作为回答句子,并发送到用户终端装置110。另外,在该回答句子“预定从下月初开始在上午时间段播放。”上附加了动作控制信息,该动作控制信息记载了下载并再生该电视剧的介绍节目的数据的意思的命令。
所述回答句子以及动作控制信息,从激活会话服务器20被发送到用户终端装置110,在用户终端装置110中,根据该动作控制信息,动作控制部13控制浏览器部111从媒体服务器100下载该介绍节目的数据,浏览器部111对该下载的介绍节目的数据进行再生,由此,用户受指导系统指导来进行希望的内容的视听。
图49是表示在接收到回答句子以及动作控制信息的用户终端装置110的输出部14显示的画面例的图。在字符显示框1600中显示回答句子“预定从下月初开始在上午时间段播放。”,同时在窗口1100内生成的再生区域1800中再生所述介绍节目。
(6.2.2.节目间的动作)
在用户结束对节目(内容)进行视听后直到开始下一节目(内容)的视听为止的期间、即节目间,本指导系统也起作用。
图50是表示节目间的用户终端装置110的画面例的图。在窗口1100内列举出接下来可以视听的节目的介绍画面,同时在启动人物显示区域1400中显示与在节目间启动的激活会话服务器20对应的人物1500。
在此例中,激活会话服务器20输出回答句子“之前的节目怎么样?”。这是通过使用动作控制信息的<timer>等,不等待用户发话而输出的回答句子。
与此相对,用户作为应答而进行用户发话,由此可以使人物1500和用户的会话确立,将用户引导到某个信息(例如商品的宣传地点),或者进行与商品有关的问卷调查,来取得市场信息等。
(6.2.3.节目视听过程中的动作)
本指导系统,在用户正在视听节目(内容)的情况下也起作用。
图51是表示节目视听过程中的用户终端装置110的画面例的图。在窗口1100内生成了视听中的节目画面1900,同时在启动人物显示区域1400中显示与在节目中启动的激活会话服务器20对应的人物1500。
在此,假定用户对节目中的出演人物的衣服(在此假定是大衣)有兴趣,向指导系统进行了疑问。即,假定用户对输入部11输入了用户发话“这件大衣真漂亮”。与之对应,会话服务器选择装置130、更详细而言是激活会话服务器20向用户终端装置110返回回答句子“介绍邮购商店吗?”,当输出用户终端装置110的回答句子时,用户进一步接着输入用户发话“拜托”。激活会话服务器20与其对应地选择回答句子“那么,请看左侧的画面”,同时将在该回答句子中设定的动作控制信息发送到用户终端装置110。该动作控制信息设定了访问销售包含所述大衣的商品的销售地点、使地点画面显示在输出部14的命令。
接收到所述回答句子以及动作控制信息的用户终端装置110显示回答句子“那么,请看左侧的画面”,同时访问所指定的销售地点,显示该地点的销售页面来促使用户阅览。
图52是表示从图51所示的画面显示发生迁移,进行了所述回答句子以及销售地点的显示的状态的画面例。在该画面例中,缩小视听中的节目画面1900,在其下方新生成了显示邮购地点的画面的显示区域1950。另外,在字符显示框1600中显示了上述回答句子。
于是,通过指导系统可以创造新的销售机会。
(6.2.4.内容导航器)
本指导系统也作为内容导航器而工作。所谓内容导航器,是进行取得用于获得用户需要的知识的内容的支援的系统。用于获得用户需要的知识的内容,是所谓的电子化学习(E learning)那样的录制了讲课或讲座的动画等。
在此,说明作为对介绍料理食谱的内容进行介绍的内容导航器而工作时的、本指导系统的动作。
首先,假定用户在将用户终端装置110放置在厨房中启动的状态下,开始准确料理。在此,用户想要制作甜辣猪肉,但无法清楚地记起其食谱,因此尝试利用本指导系统来对甜辣猪肉的食谱进行视听。
图53是表示在将用户终端装置110放置在厨房中启动的状态下,在输出部14中显示的画面例的图。在窗口1100中显示了处理与料理食谱有关的话题的会话服务器20所对应的人物2000。为了调用该人物、即在会话服务器选择装置130中,使处理与料理食谱有关的话题的会话服务器20成为激活会话服务器20,只要预先对通用会话服务器20输入用户发话“想使用料理食谱”,使会话服务器选择装置130进行会话服务器20的切换即可。
在此状态下,当用户向用户终端装置110输入用户发话“请告知甜辣猪肉的食谱”时,已成为激活会话服务器20的处理与料理食谱有关的话题的会话服务器20从其会话情节存储部22中选择与所述用户发话“请告知甜辣猪肉的食谱”对应的回答句子,与其中设定的动作控制信息一起发送到用户终端装置110。该动作控制信息是取得介绍甜辣猪肉食谱的动画文件来再生的指令。
所述回答句子以及动作控制信息,从激活会话服务器20被发送到用户终端装置110,在用户终端装置110中,动作控制部13根据该动作控制信息控制浏览器部111,使其从该数据的存储场所(可以是媒体服务器100,也可以其它任何装置)下载该动画文件的数据,由浏览器部111再生所下载的动画文件的数据,由此,用户受指导系统指导,进行希望的食谱的视听。
图54是表示正在通过本指导系统进行料理食谱的动画的再生的画面例的图。在窗口1100内生成料理食谱的动画再生区域2100,在此显示用户所要求的料理食谱的动画。此外,根据本指导系统,用户通过用户发话“在这里停止一会”、“重复”等,可以使动画文件暂停或者进行再生的重复。
(6.2.5.互动·字幕)
本指导系统可以在节目的视听中,使用户享受与指导系统进行的与视听中的节目有关的会话。
首先,作为前提而假定用户决定了与本指导系统进行会话来视听的节目。由此,本指导系统以开始了该节目的再生(视听)作为条件,使处理与该节目有关的会话的会话服务器作为激活会话服务器20来启动。该激活会话服务器20具有处理与该节目有关的情节。例如在进行该节目的预先设定的情节的再生时如下这样动作:输出成为与该情景有关的会话的契机的回答句子,进行与用户的会话。若用户对于该成为契机的回答句子发话,则输出与之对应的回答句子等。此外,激活会话服务器20可以如下这样动作:不仅对用户的发话输出回答句子,在视听中的节目中显示字幕(telop)的情况下,即使没有用户的发话,也可以将与该字幕对应的注释作为回答句子来输出。
图55是表示在视听中的节目中显示了字幕的情况下的画面例的图。在显示区域1000内的窗口中生成了视听中的节目的节目显示区域2150。在该节目中显示了字幕2200。另一方面,在节目显示区域2150的右方显示了与启动中的会话服务器20对应的人物2300。
图56是表示针对字幕的内容,输出了作为注释的回答句子的画面例的图。在人物2300的上方生成显示回答句子的字符显示框2400,显示作为与节目的内容(在此是字幕的内容)有关的注释的回答句子。用户可以针对该回答句子进行发话。用户发话被指导系统取得,针对该用户发话,指导系统进一步生成回答句子,由此,在用户和指导系统之间,对节目进行视听同时的会话确立。
(7.第3实施方式:电话转接系统)
本自动会话系统1也可以作为电话转接系统来利用。该电话转接系统,是在用户向他人打电话时,由电话转接系统向对方拨打电话,在对方接听时转接到用户,另一方面,在从他人向用户拨打了电话的情况下,通知用户是谁打来的电话,当用户接听电话的情况下,将来自对方的电话与用户接通的系统。
图57是表示上述电话转接系统的结构例的框图。电话转接系统具有:与通信网3002连接的用户终端装置3000、与通信网3002连接的会话服务器20。成为用户的通话对象的对方电话机3001与通信网3002相连。
用户终端装置3000是作为IP电话的电话机而工作,同时也作为本发明的会话装置10而工作的信息处理装置,例如是PC、IP电话机等。图58中披露了表示用户终端装置3000的结构例的功能框图。用户终端装置3000具有:可以与通信网3002连接的通信控制部3010、与通信控制部3010连接的IP电话部3020,与通信控制部3010以及IP电话部3020连接的会话控制部3030、与会话控制部3030以及IP电话部3020连接的声音输入部3050、与IP电话部3020连接的声音输出部3040。
相当于本发明的电话单元的IP电话部3020,具有作为IP电话的终端机而执行拨号、接听、通话的功能,例如是Skype(Skype公司注册商标)的应用程序。
相当于本发明的会话控制单元的会话控制部3030,是相当于会话装置10的结构要素,即是具有会话输入部12、动作控制部13、输入部11、输出部14的结构要素。但是,输入部11、输出部14也可以置换为声音输入部3050、声音输出部3040。会话控制部3030,当从用户取得表示想要向某个对象打电话的用户发话时,向会话服务器20请求其回答句子。会话服务器20,将与所述用户发话对应的回答句子以及在其上附加的动作控制信息发送到用户终端装置3000、更详细而言是会话控制部3030。在该回答句子上附加的动作控制信息具有指示IP电话部3030向所述对象的电话号码进行呼叫的内容。当对方的通话机3001应答了所述呼叫时,会话控制部3030从IP电话部3020取得对方的应答声音信号,通过声音识别将声音信号置换为输入句子,向会话服务器20请求与之对应的回答句子。会话服务器20根据该输入句子决定回答句子,与动作控制信息一起发送到用户终端装置3000、更详细而言是会话控制部3030。当所述输入句子识别出是用户请求的对方时,在其回答句子上附加的动作控制信息,具有指示IP电话部3020维持通话的内容。
当接到从某个对方对用户的来电时,IP电话部3020确立与对方的通话机的通话,将来自对方的声音信号传递到会话控制部3030。会话控制部3030将声音信号变换为输入句子,向会话服务器20请求与之对应的回答句子。会话服务器20,将从该对方询问用户是否接听电话的回答句子作为与所述输入句子对应的回答,发送到用户终端装置3000、更详细而言是会话控制部3030。会话控制部3030使输出部14输出该回答句子,催促用户的下一次发话。在用户发话后,会话控制部3030向会话服务器20请求与该用户发话对应的回答句子。若用户发话是接听电话的内容,则会话服务器20把附加了动作控制信息的回答句子发送到用户终端装置3000、更详细而言是会话控制部3030,该动作控制信息的内容是命令IP电话部3020开始用户与对方的通话。会话控制部3030、更详细而言是动作控制部13,命令IP电话部3020开始用户与对方的通话。
另一方面,若用户发话的内容是不接听电话,则会话服务器20把附加了动作控制信息的回答句子发送到用户终端装置3000、更详细而言是会话控制部3030,该动作控制信息的内容是命令IP电话部3020结束用户和对方的通话。会话控制部3030、更详细而言是动作控制部13命令IP电话部3020切断来自对方的连接。
声音输入部3050是将声音变换为电气信号的结构要素,例如是麦克风。声音输出部3040是将电气信号变换为声音的结构要素,例如是扬声器。
(7.1.动作例)
说明上述电话转接系统的动作例。
(7.1.1.呼叫)
图59是表示通过本电话转接系统从用户向对方拨号时的动作例的时序图。
首先,当拨号时,用户向用户终端装置3000输入表示向对方拨号的发话(S5010)。用户终端装置3000向会话服务器20请求与该用户发话对应的回答句子,从会话服务器20取得回答句子以及动作控制信息(S5020)。动作控制信息的内容是执行向对方目的地的电话号码的呼叫,通过该动作控制信息,用户终端装置3000向通话机进行呼叫(S5030)。对方根据该呼叫开始通话,进行署名的发话(S5040)。通过用户终端装置3000取得该发话内容,用户终端装置3000向会话服务器20请求与该用户发话对应的回答句子,从会话服务器20取得回答句子以及动作控制信息(S5050)。此时的动作控制信息的内容是将回答句子的内容变换为声音信号,并使其发送到通话机3001。按照该动作控制信息,用户终端装置3000通过声音向通话机3001发送回答句子的内容(S5060)。
假定对方发出了表示接听电话的回答。该发话被发送到用户终端装置3000(S5070)。向会话服务器20请求与该发话对应的回答句子,并且从会话服务器20取得回答句子以及动作控制信息(S5080)。用户终端装置3000向对方、用户输出表示接通电话的回答句子(S5090,S5100)。另外,作为动作控制信息,确定了开始用户与对方的通话,维持用户终端装置3000与通话机3001的通话连接(S5110),完成电话转接系统的转接。
此外,若步骤S5070中的对方的回答的内容是不接听电话,则在与之对应的回答句子上附加的动作控制信息中,决定了结束用户终端装置3000和通话机的连接,据此,用户终端装置3000结束通话地进行动作。
(7.1.2.来电)
图60是表示当接到从对方向用户的来电时的本电话转接系统的动作例的时序图。
首先,从通话机3001对用户终端装置3000来电,登记有拨号者名的发话被发送到用户终端装置3000(S6010)。用户终端装置3000向会话服务器20请求与该发话对应的回答句子,从会话服务器20取得回答句子以及动作控制信息(S6020)。回答句子是表示正在转接电话的对方用的回答句子、和将对方的名称通知给给用户的用户用的回答句子,用户终端装置3000将各个回答句子输出到对方以及用户(S6030,S6040)。在此,假定用户进行了表示不接听电话的发话(S6050)。用户终端装置3000向会话服务器20请求与该发话对应的回答句子,从会话服务器20取得回答句子以及动作控制信息(S6020)。该回答句子的内容是通知用户未接听电话,动作控制信息的内容是开始留言消息的录音以及此后的结束通话。用户终端装置3000将回答句子发送到通话机3001,同时按照动作控制信息执行留言消息的录音以及此后的通话结束。
此外,若步骤S6050中的用户的发话内容是表示接听电话的内容,则与之对应的回答句子上附加的动作控制信息为,用户终端装置3000和通话机3001的通信的维持,按照该动作控制信息开始用户和对方的通话。
(8.第4实施方式:顾客对应系统)
接着,说明本发明的第4实施方式。第4实施方式提出了顾客对应系统。
(8.1.结构例)
以下,对作为本发明的实施方式之一的顾客对应系统进行说明。顾客对应系统是对于经由网络接收到的来自顾客的疑问或查询,经由网络发送回答或信息的系统。
图61是表示本实施方式的顾客对应系统的结构例的框图。
顾客对应系统10000由作为可以与广域通信网(WAN)11000连接的用户侧终端机而工作的会话装置10、与广域通信网11000连接的会话服务器20A、与局域通信网(LAN)12000连接的专家侧终端装置13000、会话情节编辑装置30、会话日志数据库(简称为DB)14000、以及会话日志分析装置15000构成。此外,会话服务器20A可以经由局域通信网12000与专家侧终端装置13000、会话情节编辑装置30、会话日志DB14000以及会话日志分析装置15000通信。
另外,在上述结构例中成为会话服务器20A、专家侧终端装置13000、会话情节编辑装置30、会话日志DB14000以及会话日志分析装置15000经由局域通信网12000通信的结构,但即使是这些装置经由所述广域通信网11000或其它广域通信网进行通信的结构,本发明也成立。
此外,在此所说的“专家”,是指起到针对来自用户的疑问或查询进行回答的作用的人,也不一定是具有专门知识的人。
以下,说明上述顾客对应系统10000的结构要素。
(8.1.1.会话装置)
相当于本发明的第1单元的会话装置10,是用户(顾客)作为用户发话(输入句子)而将疑问或查询等发送到会话服务器20A,从会话服务器20A接收其回答句子的装置。本顾客对应系统的会话装置10是具有与第1实施方式的会话装置20相同的结构的装置,因此省略其详细的结构例的说明。
(8.1.2.会话服务器)
相当于本发明的第2单元的会话服务器20A具有以下功能:针对从会话装置10发送的用户发话,根据会话情节40决定回答句子,将所决定的回答句子以及与该回答句子对应的动作控制信息发送到该会话装置10的功能;在无法从会话情节中发现与用户发话对应的回答句子的情况下,为了使专家回答与该用户发话对应的回答,将用户发话的内容发送到专家侧终端装置13000,据此接收从专家侧终端装置13000发送的回答内容,将接收到的回答内容发送到会话装置10的功能;将所述用户发话、回答句子、来自专家侧终端装置13000的回答内容,按照它们的时间序列进行存储,将存储的内容(称为“会话日志”)发送到会话日志DB14000的功能;接收从会话情节编辑装置30发送的会话情节40,并且在已存储了该会话内容的会话情节40中进行追加或者置换的功能。
会话服务器20A通过具备运算处理装置(CPU)、主存储器(RAM)、读出专用存储器(ROM)、输入输出装置(I/O)以及必要时具备硬盘装置等外部存储装置的信息处理装置来实现。信息处理装置是PC、工作站、服务器等。会话服务器20A也可以经由网络连接多个信息处理装置而构成。
图62是表示会话服务器20A的结构例的功能框图。此外,本实施方式中的会话服务器20A具有与前面所述的会话服务器20相同的结构要素,因此针对这些相同的结构要素赋予相同的参照符号,省略它们的详细说明。
会话服务器20A具有:回答处理部21、与回答处理部21连接的回答中继部24以及日志收集部、与回答处理部21连接的意思解释词典部23以及会话情节存储部22、与会话情节存储部22连接的会话情节更新部26。
回答处理部21、意思解释词典部23以及会话情节存储部22,是与第1实施方式的会话服务器20的上述各部具有相同功能的结构要素,因此省略它们的说明。但是在回答处理部21中附加了向回答中继部24以及日志收集部25传递用户发话、回答句子、回答内容,或者取得用户发话、回答句子、回答内容的功能。
回答中继部24具有以下功能:进行与专家侧终端装置13000的通信,把从回答处理部21取得的用户发话的内容发送到专家侧终端装置13000,据此接收从专家侧终端装置发送的回答内容,并将接收到的回答内容传递给回答处理部21。
日志收集部25具有以下功能:从回答处理部21取得由回答处理部21取得的用户发话、以及来自专家侧终端装置13000的回答内容、以及回答处理部21发送到会话装置10的回答句子,将这些数据作为会话日志发送到会话日志DB14000。此外,发送会话日志的时刻可以是由会话服务器20A决定的任意时刻,也可以是从会话日志DB14000接收到发送请求的时刻,也可以是其它时刻(例如操作员执行会话日志发送处理时)。
会话情节更新部26具有在会话情节存储部22中存储的会话情节40中追加新的会话情节40、或者置换一部分或全部的功能。例如,通过会话情节编辑装置30生成由作为用户发话的疑问、和与之对应的专家回答内容构成的新的会话情节(为了区别,称为“追加会话情节”),会话情节更新部26从会话情节编辑装置30接收该追加会话情节,追加到已存储在会话情节存储部22中的会话情节40中来存储。在该处理后,会话服务器20A再次接受作为所述用户发话的疑问时,会话处理部21可以根据追加会话情节部分,将与所述回答内容相同内容的回答句子发送到会话装置10。
以上,结束了会话服务器20A的结构例的说明。
返回图61,继续说明顾客对应系统10000的结构要素。
(8.1.3.专家侧终端装置)
相当于本发明的第3单元的专家侧终端装置13000是具有以下功能的装置:接收从会话服务器20A发送(转发)来的用户发话,向作为专家侧终端装置13000的操作者的专家提示用户发话的内容,促使输入其回答,在输入了回答的情况下,将作为回答内容的数据发送到会话服务器20A。
专家侧终端装置13000,只要是可以执行用户发话的接收、回答内容的发送的装置,则可以是任何装置。例如,专家侧终端装置13000是个人计算机、移动通信机(便携电话机),专用终端装置等。
(8.1.4.会话情节编辑装置)
相当于本发明的第5单元的会话情节编辑装置30是与第1实施方式中的会话情节编辑装置30相同的装置,因此在此省略结构的详细说明。但是,本实施方式中的会话情节编辑装置30还具备以下功能:从会话日志DB14000取得会话日志,尤其取得包含从专家侧终端装置13000发送的回答内容的会话日志,对其进行编辑后作为会话情节40而输出,发送到会话服务器20A,进行会话情节的追加·更新。
(8.1.5.会话日志DB)
相当于本发明的第4单元的会话日志DB14000是具有接收从会话服务器20A发送的会话日志,并对其进行存储的功能的装置。会话日志DB14000,通过具备运算处理装置(CPU)、主存储器(RAM)、读出专用存储器(ROM)、输入输出装置(I/O),以及在必要时具备硬盘装置等外部存储装置的信息处理装置来实现。信息处理装置是PC、工作站、服务器等。会话日志DB可以通过网络连接多个信息处理装置来构成。
(8.1.6.会话日志分析装置)
会话日志分析装置15000从会话日志DB14000接收会话日志,并对会话日志进行分析,由此进行会话倾向统计(例如,每个疑问的访问数的统计数据)的生成。
以上,结束了顾客对应系统10000的结构例的说明。
(8.2.顾客对应系统的动作)
接下来,说明上述顾客对应系统10000的动作。
(8.2.1.会话服务器可以根据会话情节进行回答时的动作)
图63是表示接受会话服务器20A可以根据会话情节进行回答时的用户发话时的、顾客对应系统10000的动作例的时序图。
首先,用户从会话装置10访问会话服务器,在确立通信后向会话装置10输入用户发话(此例中假定是某个疑问)。会话装置10将用户发话发送到会话服务器20(S3010)。接收到用户发话的会话服务器20A,根据在会话情节存储部22中存储的会话情节,提取回答句子以及与该回答句子对应的动作控制信息(S3020)。会话服务器20A将提取出的回答句子以及动作控制信息发送到会话装置10(S3030)。会话装置10显示接收到的回答句子,向用户提供回答内容(S3040)。用户从回答内容得到与疑问对应的回答。
另一方面,会话服务器20A取得所述用户发话、回答句子作为会话日志(S3050),将该会话日志发送到会话日志DB14000(S3060)。会话日志DB14000存储接收到的会话日志(S3070)。
(8.2.2.会话服务器向专家侧终端装置请求回答时的动作)
图64是表示会话服务器20A判定出没有与会话情节相适合的回答,向专家侧终端装置13000请求回答时的、顾客对应系统10000的动作例的时序图。
用户从会话装置10访问会话服务器20A,在确立通信后向会话装置10输入用户发话(此例中也假定为某个疑问)。会话装置10将用户发话发送到会话服务器20A(S3110)。假定接收到用户发话的会话服务器20A根据在会话情节存储部22中存储的会话情节40,检索回答句子以及与该回答句子对应的动作控制信息(S3120),但判断出在存储的会话情节40中没有适当的回答句子。会话服务器20A与专家侧终端装置13000确立通信,将先前的步骤S3110中从会话装置10接收到的用户发话发送到专家侧终端装置13000(S3130),请求在专家侧终端装置13000等待的专家对作为该用户发话的疑问进行回答。
专家侧终端装置13000,当接收用户发话时显示其内容(例如,在液晶显示装置上显示作为用户发话的内容的文本)(S3140)。专家针对用户发话的内容,通过参照自己的知识或另外准备的数据库,来准备与疑问对应的回答,并将回答输入到专家侧终端装置13000(S3150)。当进行回答的输入时,专家侧终端装置13000将回答作为数据,发送到会话服务器20A(S3160)。
从专家侧终端装置13000接收到作为回答的数据的会话服务器20A,将接收到的回答发送到会话装置10(S3170)。会话装置10显示接收到的回答句子来向用户提供回答内容(S3180)。用户从回答内容得到与疑问对应的回答。
另一方面,会话服务器20A作为会话日志而取得所述用户发话、回答(S3190),将该会话日志发送到会话日志DB14000(S3200)。会话日志DB14000存储接收到的会话日志(S3210)。
此后,会话日志DB14000把在步骤S3200中发送的会话日志、即把从专家侧终端装置13000发送的回答、和与之成对的用户发话(疑问)作为内容的会话日志发送到会话情节编辑装置30(S3220)。接收到会话日志的会话情节编辑装置30根据该会话日志生成会话情节40(S3230)。此外,该会话情节40的生成,可以通过会话情节编辑装置30的操作员来进行,也可以另外将自动编辑程序安装在会话情节编辑装置30中,通过该自动编辑程序来进行会话情节的生成。
会话情节编辑装置30将先前的步骤S3230中生成的会话情节40发送到会话服务器(S3240)。接收到会话情节40的会话服务器20A,将接收到的会话情节40存储在自己的会话情节存储部22中,进行会话情节的更新(S3250)。由此,当再次接受与在步骤S3110中发送的用户发话相同的疑问时,会话服务器20A从会话情节40中提取回答句子以及动作控制信息,可以不请求专家的回答而向用户提供回答。
(8.2.3.会话日志解析)
接下来,说明会话日志解析的动作例。
图65是表示顾客对应系统10000进行会话日志的分析时的动作例的时序图。
首先,会话日志分析装置15000向会话日志DB14000发送会话日志的发送请求(S3310)。会话日志DB14000向会话日志分析装置15000发送会话日志(S3320)。会话日志分析装置15000对接收到的会话日志进行分析处理(S3330),输出其分析结果(S3340)。将分析结果用作用户的关心事项、或用户的每个属性的反应等可以用于销售的信息。
以上,结束了顾客对应系统10000的动作的说明。
Claims (15)
1.一种自动对用户的发话进行应答的自动应答装置,其特征在于,
具备:
接受用户发话的输入部;和
输出部,其以用户能够识别的形态输出与通过所述输入部接受的用户发话对应的回答句子,
根据会话情节来决定所述回答句子,所述会话情节是与在设想用户发话时的用户发话对应的输入句子、和作为与该输入句子对应的自动应答装置的回答的回答句子的集合,
所述会话情节的数据具有以输入句子作为态射、以与该输入句子对应的回答句子作为对象的、能够通过状态迁移图来表现输入句子和回答句子的数据结构。
2.根据权利要求1所述的自动应答装置,其特征在于,
所述会话情节包含:将与预定内容的用户发话以外的全部用户发话对应的输入句子记载为一个态射的情节,
在该情节中,将与全部用户发话对应的输入句子和某个回答句子对应起来。
3.根据权利要求1或2所述的自动应答装置,其特征在于,
所述会话情节包含:将用户无言的状态记载为态射的情节,
在该情节中,将与用户的无言状态这样的用户发话对应的输入句子和回答句子对应起来。
4.根据权利要求1或2中任意一项所述的自动应答装置,其特征在于,
所述会话情节包含:复合多个态射从而记载为一个态射的情节,
在该情节中,多个态射的最后的态射所对应的回答句子、和将多个态射复合而得的一个态射所对应的回答句子相同。
5.根据权利要求1或2中任意一项所述的自动应答装置,其特征在于,
所述会话情节包含:记载了作为不使对象迁移的单位元的态射的情节,
在该情节中,将与预定的用户发话对应的输入句子、和与前一次对用户输出的回答句子相同的回答句子对应起来。
6.根据权利要求1或2中任意一项所述的自动应答装置,其特征在于,
所述会话情节包含记载了不使对象迁移的单位元的情节,所述单位元通过复合具有循环的结合关系的多个态射以及对象而构成,
在该情节中,由输入句子和回答句子形成了闭环。
7.根据权利要求1所述的自动应答装置,其特征在于,
所述自动应答装置还具备:
会话处理单元,其发送通过所述输入部接受的用户发话,同时接收与该发送的用户发话对应的所述回答句子和动作控制信息,所述动作控制信息是记载了与该回答句子对应的动作、也就是使自动应答装置执行的动作的信息;以及
动作控制单元,其从所述会话处理单元接收所述动作控制信息,按照该接收到的动作控制信息执行动作。
8.根据权利要求7所述的自动应答装置,其特征在于,
所述自动应答装置还具备浏览器单元,其接收内容的数据,并使用户能够阅览该接收到的内容,
所述动作控制单元,使所述浏览器单元执行由所述接收到的动作控制信息确定的处理。
9.根据权利要求7所述的自动应答装置,其特征在于,
所述自动应答装置还具备电话单元,其执行IP电话的拨号、接听、通话,
所述动作控制信息是使所述电话单元执行从用户向对方的电话的连接、继续、以及结束的信息,
所述动作控制单元使所述电话单元执行由所述接收到的动作控制信息确定的处理。
10.根据权利要求7所述的自动应答装置,其特征在于,
所述自动应答装置具备:
会话装置,其包含所述输入部、所述输出部、所述会话处理单元、和动作处理单元;以及
会话服务器,其从所述会话装置接收用户发话,根据所述会话情节检索以及决定与所述接收到的用户发话对应的回答句子,将该决定的回答句子发送到所述会话装置,
所述会话服务器,当检索的结果为,判断出所述会话情节中没有与从所述用户接受的用户发话对应的回答句子时,
为了从专家得到与所述用户发话对应的回答而发送用户发话,
接收与该发送的用户发话对应的专家的回答内容,
将该接收到的专家的回答内容发送到所述会话装置,
发送存储了与所述用户发话对应的输入句子、专家的回答内容和回答句子的会话日志,
接收根据该发送的会话日志而生成的会话情节,然后存储。
11.一种会话服务器,其特征在于,
具备:
意思解释词典部,其存储意思解释词典,该意思解释词典用于进行与在设想用户对自动应答用户的发话的自动应答装置发话时的用户发话对应的回答句子的改写;
会话情节存储部,其存储会话情节的数据,所述会话情节是与用户发话对应的输入句子、以及作为与该输入句子对应的所述自动应答装置的回答的回答句子的集合;以及
与所述意思解释词典部和会话情节存储部相连,能够与所述自动应答装置通信的回答处理部,该回答处理部从所述自动应答装置取得用户发话,参照所述意思解释词典部存储的意思解释词典来取得用户发话的同义词或同义句,检索在所述会话情节存储部中存储的会话情节的数据,决定与该取得的同义词或同义句对应的输入句子,参照所述意思解释词典部,生成为了与用户发话对应而对与该决定的输入句子对应的回答句子进行改写后的回答句子,将该改写后的回答句子和动作控制信息发送到所述自动应答装置,所述动作控制信息是记载了与该回答句子对应的动作、也就是使所述自动应答装置执行的动作的信息。
12.一种自动应答系统,其特征在于,
具备:
自动对用户发话进行应答的自动应答装置,其向用户提示根据会话情节决定的、与用户发话对应的回答句子;以及
会话情节编辑装置,其为了所述自动应答装置而生成所述会话情节,
所述会话情节是与在设想用户发话时的用户发话对应的输入句子、和作为对该输入句子的回答的回答句子的集合,
所述会话情节的数据具有以输入句子作为态射、以与该输入句子对应的回答句子作为对象的、能够以状态迁移图表现输入句子和回答句子的数据结构。
13.根据权利要求12所述的自动应答系统,其特征在于,
所述自动应答系统还具备会话服务器,其从所述自动应答装置接收用户发话,根据通过所述会话情节编辑装置生成的会话情节,决定与所述接收到的输入句子对应的回答句子,并将该决定的回答句子发送到所述自动应答装置。
14.根据权利要求13所述的自动应答系统,其特征在于,
所述会话服务器,当判断出在所述会话情节中没有与从所述用户接受的用户发话对应的回答句子时,
为了从专家获得与所述用户发话对应的回答而发送用户发话,
接收与该发送的用户发话对应的专家的回答内容,
将该接收到的专家的回答内容发送到所述会话装置,
发送存储了与所述用户发话对应的输入句子、专家的回答内容、回答句子的会话日志,
接收根据该发送的会话日志而生成的会话情节,然后存储。
15.根据权利要求14所述的自动应答系统,其特征在于,
所述自动应答系统还具备:
专家侧终端装置,其从所述会话服务器接收从用户接受的用户发话,接受与该接收到的用户发话对应的专家的回答,将专家的回答内容发送到所述会话服务器;以及
会话日志数据库,其从所述会话服务器接收包含所述用户发话以及从所述专家侧终端装置发送的专家的回答内容的会话日志,并进行存储,
所述会话情节编辑装置,根据所述会话日志数据库中存储的会话日志,生成基于用户发话以及与该用户发话对应的专家的回答内容的会话情节,并将该生成的会话情节发送到所述会话服务器。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008212190 | 2008-08-20 | ||
JP2008212190 | 2008-08-20 | ||
JP2008-212190 | 2008-08-20 | ||
JP2009-150147 | 2009-06-24 | ||
JP2009-150146 | 2009-06-24 | ||
JP2009150147A JP5829000B2 (ja) | 2008-08-20 | 2009-06-24 | 会話シナリオ編集装置 |
JP2009150146 | 2009-06-24 | ||
JP2009150146A JP5897240B2 (ja) | 2008-08-20 | 2009-06-24 | 顧客対応システム、並びに会話サーバ |
JP2009150147 | 2009-06-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101656800A true CN101656800A (zh) | 2010-02-24 |
CN101656800B CN101656800B (zh) | 2013-07-24 |
Family
ID=41710876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200910167065.4A Expired - Fee Related CN101656800B (zh) | 2008-08-20 | 2009-08-19 | 自动应答装置及方法、会话情节编辑装置、会话服务器 |
Country Status (2)
Country | Link |
---|---|
JP (2) | JP5829000B2 (zh) |
CN (1) | CN101656800B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104424352A (zh) * | 2013-08-22 | 2015-03-18 | 乐金信世股份有限公司 | 向用户终端提供代理服务的系统和方法 |
CN107567706A (zh) * | 2015-05-05 | 2018-01-09 | 意大利电信股份公司 | 通信网络中的订户会话重新分发 |
CN110659091A (zh) * | 2018-06-29 | 2020-01-07 | 国际商业机器公司 | 会话代理对话流用户界面 |
CN111243587A (zh) * | 2020-01-08 | 2020-06-05 | 北京松果电子有限公司 | 语音交互方法、装置、设备及存储介质 |
CN112650846A (zh) * | 2021-01-13 | 2021-04-13 | 北京智通云联科技有限公司 | 一种基于问句框架的问答意图知识库构建系统及方法 |
CN113225244A (zh) * | 2020-02-06 | 2021-08-06 | 富士胶片商业创新有限公司 | 信息处理装置以及记录媒体 |
CN113609273A (zh) * | 2021-08-12 | 2021-11-05 | 云知声(上海)智能科技有限公司 | 一种机器话术配置方法、装置、电子设备和存储介质 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013072887A (ja) * | 2011-09-26 | 2013-04-22 | Toshiba Corp | 対話装置 |
WO2014020835A1 (ja) * | 2012-07-31 | 2014-02-06 | 日本電気株式会社 | エージェント制御システム、方法およびプログラム |
JP2015129793A (ja) * | 2014-01-06 | 2015-07-16 | 株式会社デンソー | 音声認識装置 |
JP6255274B2 (ja) * | 2014-02-19 | 2017-12-27 | シャープ株式会社 | 情報処理装置、音声対話装置、および制御プログラム |
JP2015184563A (ja) * | 2014-03-25 | 2015-10-22 | シャープ株式会社 | 対話型家電システム、サーバ装置、対話型家電機器、家電システムが対話を行なうための方法、当該方法をコンピュータに実現させるためのプログラム |
JP6271361B2 (ja) * | 2014-07-18 | 2018-01-31 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
KR20160136837A (ko) * | 2015-05-21 | 2016-11-30 | 라인 가부시키가이샤 | 메신저를 통한 컨텐츠 제공 방법과 시스템 및 기록 매체 |
JP2017146782A (ja) * | 2016-02-17 | 2017-08-24 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US20190354884A1 (en) * | 2016-11-25 | 2019-11-21 | Kabushiki Kaisha Toshiba | Knowledge construction and utilization system and program |
JP2018159729A (ja) * | 2017-03-22 | 2018-10-11 | 株式会社東芝 | 対話システム構築支援装置、方法、及びプログラム |
US11126920B2 (en) | 2017-05-12 | 2021-09-21 | Fujitsu Limited | Interaction scenario display control method and information processing apparatus |
US11514903B2 (en) | 2017-08-04 | 2022-11-29 | Sony Corporation | Information processing device and information processing method |
JP6695850B2 (ja) * | 2017-12-27 | 2020-05-20 | ヤフー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
CN110570866A (zh) * | 2019-09-11 | 2019-12-13 | 百度在线网络技术(北京)有限公司 | 语音技能创建方法、装置、电子设备和介质 |
JP7405467B2 (ja) * | 2020-04-24 | 2023-12-26 | 合同会社EasyDialog | 支援装置、会話制御装置及びプログラム |
JP7575044B2 (ja) | 2020-10-21 | 2024-10-29 | 学校法人早稲田大学 | 情報再生プログラム、情報再生方法、情報処理装置及びデータ構造 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040098253A1 (en) * | 2000-11-30 | 2004-05-20 | Bruce Balentine | Method and system for preventing error amplification in natural language dialogues |
CN101075435A (zh) * | 2007-04-19 | 2007-11-21 | 深圳先进技术研究院 | 一种智能聊天系统及其实现方法 |
CN101122972A (zh) * | 2007-09-01 | 2008-02-13 | 腾讯科技(深圳)有限公司 | 一种虚拟宠物聊天系统、方法及虚拟宠物问答服务器 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3378595B2 (ja) * | 1992-09-30 | 2003-02-17 | 株式会社日立製作所 | 音声対話システムおよびその対話進行制御方法 |
JPH1125174A (ja) * | 1997-07-02 | 1999-01-29 | Nec Corp | ヘルプデスクシステムにおける回答自動送付方式、回答 自動送付方法および回答自動送付プログラムを記録した 記録媒体 |
JP3178426B2 (ja) * | 1998-07-29 | 2001-06-18 | 日本電気株式会社 | 自然言語対話システム及び自然言語対話プログラム記録媒体 |
EP1125279B1 (en) * | 1998-10-02 | 2008-01-09 | International Business Machines Corporation | System and method for providing network coordinated conversational services |
US6314402B1 (en) * | 1999-04-23 | 2001-11-06 | Nuance Communications | Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system |
JP2001236401A (ja) * | 2000-02-24 | 2001-08-31 | Nec Eng Ltd | ヘルプデスクシステムにおける回答装置及び回答方法並びにその制御プログラムを記録した記録媒体 |
JP2001273310A (ja) * | 2000-03-27 | 2001-10-05 | Livlib Co Ltd | インターネットおよびイントラネットを介した各種問合せ回答サービスシステム |
JP3654850B2 (ja) * | 2000-05-17 | 2005-06-02 | 松下電器産業株式会社 | 情報検索システム |
JP2002169818A (ja) * | 2000-12-04 | 2002-06-14 | Sanyo Electric Co Ltd | ユーザ支援装置およびシステム |
JP4336808B2 (ja) * | 2000-11-30 | 2009-09-30 | 富士通株式会社 | 音声対話プログラム生成システム及び記録媒体 |
JP3450823B2 (ja) * | 2000-12-01 | 2003-09-29 | 株式会社ナムコ | 模擬会話システム、模擬会話方法、および情報記憶媒体 |
US6882723B1 (en) * | 2001-03-05 | 2005-04-19 | Verizon Corporate Services Group Inc. | Apparatus and method for quantifying an automation benefit of an automated response system |
JP2002287791A (ja) * | 2001-03-21 | 2002-10-04 | Global Data System Co Ltd | 専門家システムを用いた音声認識基盤の知能型対話装置及びその方法 |
JP2002324019A (ja) * | 2001-04-24 | 2002-11-08 | Sony Communication Network Corp | 仮想世界演出方法、仮想世界演出システム、これらにて利用可能なユーザ端末、サーバ、およびコンピュータプログラム |
JP2004054883A (ja) * | 2001-11-13 | 2004-02-19 | Equos Research Co Ltd | 車載用エージェントシステム及び対話型操作制御システム |
JP4132962B2 (ja) * | 2002-05-16 | 2008-08-13 | パイオニア株式会社 | 対話型情報提供装置、対話型情報提供プログラム、及びそれを記憶した記憶媒体 |
JP3945356B2 (ja) * | 2002-09-17 | 2007-07-18 | 株式会社デンソー | 音声対話装置及びプログラム |
US7606714B2 (en) * | 2003-02-11 | 2009-10-20 | Microsoft Corporation | Natural language classification within an automated response system |
JP2004355386A (ja) * | 2003-05-29 | 2004-12-16 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答システムにおける質問会話中継方法及び装置、質問会話中継プログラム、質問会話中継プログラムを記録した記録媒体 |
JP4408665B2 (ja) * | 2003-08-11 | 2010-02-03 | 富士通株式会社 | 音声認識用発話データ収集装置、音声認識用発話データ収集方法、及びコンピュータプログラム |
JP2006133296A (ja) * | 2004-11-02 | 2006-05-25 | Matsushita Electric Ind Co Ltd | 音声対話装置 |
JP2006277519A (ja) * | 2005-03-30 | 2006-10-12 | Toshiba Corp | 対話装置、対話シナリオ編集装置、対話方法及びプログラム |
JP4849662B2 (ja) * | 2005-10-21 | 2012-01-11 | 株式会社ユニバーサルエンターテインメント | 会話制御装置 |
JP2007114621A (ja) * | 2005-10-21 | 2007-05-10 | Aruze Corp | 会話制御装置 |
JP2008052449A (ja) * | 2006-08-23 | 2008-03-06 | Synapse Communications Kk | 対話型エージェントシステム及び方法 |
-
2009
- 2009-06-24 JP JP2009150147A patent/JP5829000B2/ja active Active
- 2009-06-24 JP JP2009150146A patent/JP5897240B2/ja active Active
- 2009-08-19 CN CN200910167065.4A patent/CN101656800B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040098253A1 (en) * | 2000-11-30 | 2004-05-20 | Bruce Balentine | Method and system for preventing error amplification in natural language dialogues |
CN101075435A (zh) * | 2007-04-19 | 2007-11-21 | 深圳先进技术研究院 | 一种智能聊天系统及其实现方法 |
CN101122972A (zh) * | 2007-09-01 | 2008-02-13 | 腾讯科技(深圳)有限公司 | 一种虚拟宠物聊天系统、方法及虚拟宠物问答服务器 |
Non-Patent Citations (1)
Title |
---|
黄民烈等: "对话管理中基于槽特征有限状态自动机的方法研究", 《计算机学报》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104424352A (zh) * | 2013-08-22 | 2015-03-18 | 乐金信世股份有限公司 | 向用户终端提供代理服务的系统和方法 |
CN104424352B (zh) * | 2013-08-22 | 2017-10-13 | 乐金信世股份有限公司 | 向用户终端提供代理服务的系统和方法 |
CN107567706A (zh) * | 2015-05-05 | 2018-01-09 | 意大利电信股份公司 | 通信网络中的订户会话重新分发 |
CN110659091A (zh) * | 2018-06-29 | 2020-01-07 | 国际商业机器公司 | 会话代理对话流用户界面 |
CN111243587A (zh) * | 2020-01-08 | 2020-06-05 | 北京松果电子有限公司 | 语音交互方法、装置、设备及存储介质 |
US11798545B2 (en) | 2020-01-08 | 2023-10-24 | Beijing Xiaomi Pinecone Electronics Co., Ltd. | Speech interaction method and apparatus, device and storage medium |
CN113225244A (zh) * | 2020-02-06 | 2021-08-06 | 富士胶片商业创新有限公司 | 信息处理装置以及记录媒体 |
CN113225244B (zh) * | 2020-02-06 | 2024-06-11 | 富士胶片商业创新有限公司 | 信息处理装置以及计算机可读存储介质 |
CN112650846A (zh) * | 2021-01-13 | 2021-04-13 | 北京智通云联科技有限公司 | 一种基于问句框架的问答意图知识库构建系统及方法 |
CN113609273A (zh) * | 2021-08-12 | 2021-11-05 | 云知声(上海)智能科技有限公司 | 一种机器话术配置方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN101656800B (zh) | 2013-07-24 |
JP2010073192A (ja) | 2010-04-02 |
JP5829000B2 (ja) | 2015-12-09 |
JP2010073191A (ja) | 2010-04-02 |
JP5897240B2 (ja) | 2016-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101656800B (zh) | 自动应答装置及方法、会话情节编辑装置、会话服务器 | |
EP2157571B1 (en) | Automatic answering device, automatic answering system, conversation scenario editing device, conversation server, and automatic answering method | |
CN101656799A (zh) | 自动会话系统以及会话情节编辑装置 | |
US10923115B2 (en) | Dynamically generated dialog | |
US8346563B1 (en) | System and methods for delivering advanced natural language interaction applications | |
US8260616B2 (en) | System and method for audio content generation | |
US20140122083A1 (en) | Chatbot system and method with contextual input and output messages | |
MX2014004889A (es) | Sistema y metodo para el manejo del contenido de audio. | |
US20150024351A1 (en) | System and Method for the Relevance-Based Categorizing and Near-Time Learning of Words | |
CN106575292A (zh) | 用于跨应用填写表单的命名实体的概念识别和捕获 | |
CN104508629A (zh) | 人工智能脚本工具 | |
US20240070434A1 (en) | Conversational knowledge base | |
EP3610375B1 (en) | Platform selection for performing requested actions in audio-based computing environments | |
US20080281579A1 (en) | Method and System for Facilitating The Learning of A Language | |
JP5420874B2 (ja) | デジタルストーリー提供システム、デジタルストーリー提供方法、及びこの方法をコンピュータシステムに実行させるためのコンピュータプログラム | |
JP2002236681A (ja) | 日常言語コンピューティングシステムおよびその方法 | |
US20140201611A1 (en) | Contextual mapping based learning by converting information | |
WO2018169711A1 (en) | Systems and methods for multi-user word processing | |
US20090013284A1 (en) | Systems and Methods for Communicating Information | |
De León | Moving to Responsive Web Design: Bring existing static sites into today's multi-device world with responsive web design | |
KR20140016785A (ko) | 가상친구 대화시스템 및 그의 운용방법 | |
Liu | Knowledge Graph Driven Conversational Virtual Museum Guide | |
CN117151157B (zh) | 基于ai机器人教学平台的教学方法、装置、计算机设备及存储介质 | |
JP5378717B2 (ja) | 会話制御システム、並びに端末装置 | |
Caponi | Web augmentation for coordinating conversational and visual experencies on the Web |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C53 | Correction of patent of invention or patent application | ||
CB02 | Change of applicant information |
Address after: Tokyo, Japan Applicant after: Universal Entertainment Corp. Address before: Tokyo, Japan Applicant before: Aruze Corp. |
|
COR | Change of bibliographic data |
Free format text: CORRECT: APPLICANT; FROM: ARUZE CORP. TO: GLOBAL ENTERTAINMENT CORPORATION |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130724 |