CN107846350A

CN107846350A - 一种语境感知网络聊天的方法、计算机可读介质和系统

Info

Publication number: CN107846350A
Application number: CN201710672575.1A
Authority: CN
Inventors: 郭立帆; 汪灏弘
Original assignee: TCL Corp
Current assignee: TCL Corp
Priority date: 2016-09-19
Filing date: 2017-08-08
Publication date: 2018-03-27
Anticipated expiration: 2037-08-08
Also published as: US20180082184A1; CN107846350B

Abstract

本发明公开了一种语境感知网络聊天的方法、计算机可读介质和系统。所述语境感知网络聊天的方法包括接收用户的语音；将所述用户的语音转化为准备回答的问题；确定准备回答的所述问题的问题类型；根据语境感知神经会话模式至少生成一个对应所述问题的答案；验证通过语境感知神经会话模式生成的答案；向用户传达验证后的所述答案；所述语境感知神经会话模式会考虑所述问题的语境信息，并且将所述问题的所述语境信息分解为多个高维向量。

Description

一种语境感知网络聊天的方法、计算机可读介质和系统

技术领域

本发明涉及计算机信息领域，特别涉及一种语境感知网络聊天的方法、计算机可读介质和系统。

背景技术

随着电子商务的出现，在电子商务网址上访问到满足消费者需要和商业需求的信息变得至关重要。导航指引的菜单和通过大部分商业网址提供的关键词搜索有很多限制，如他们往往因为冗长和呆板的反应会击溃和阻挠用户。在特定的网址上的用户兴趣常常随着鼠标点击次数的增加呈指数型的减少。因此，缩短交互的路径来提供有用的信息是关键。

许多电子商务网址尝试通过提供关键词搜索能力来解决问题，然而，关键词搜索引擎常常需要用户知道领域特定术语。不幸的是，关键词搜索不允许用户精确地描述用户需求，更为重要的是，关键词搜索缺乏对搜索词和语句的语义意思的理解。例如，关键词搜索通常无法理解“夏天的衣服(summer dress)”，应该会在女士衣服下搜索“裙子(dress)”，与之相反的是，“礼服衬衣”很可能是在男士衣服下搜索“衬衣”，“衬衣”的搜索常常会显示几十或者几百个项目，而这些项目对于有特定风格和模式的人来说是无用的。

由于上述所说的限制，当前的解决方案是自然语言(多种形式)对话，即，网络聊天。网络聊天应用于各种领域，例如，呼叫中心/路由应用，邮件路由，信息检索和数据访问，和电话银行等等，最近网络聊天在访问大量用户数据中越来越受欢迎。

然而，根据现有技术，现有的网络聊天技术通常限制于具特定领域和应用(例如预定飞机票)并且需要手动输入规则。进一步来说，在用户和机器人之间真实的对话中，用户的语境相当多是复杂且不断变化的，因此，语境感知和主动式技术网络聊天系统是急需应用于网络聊天系统。

本发明公开的方法及其系统用于解决现有技术中的一个或者多个问题。

发明内容

本发明提供了一种语境感知网络聊天的方法，所述语境感知网络聊天的方法包括接收用户的语音；将所述用户的语音转化为准备回答的问题；确定准备回答的所述问题的问题类型；根据语境感知神经会话模式至少生成一个对应所述问题的答案；验证通过语境感知神经会话模式生成的答案；向用户传递验证后的所述答案；所述语境感知神经会话模式考虑到所述问题的语境信息，并且将所述问题的所述语境信息分解为多个高维度向量。

本发明还提供了一种具有计算机程序的非暂时性计算机可读介质，当由处理器执行时，执行语境感知网络聊天的方法，其特征在于，所述方法包括：接收用户的语音；将所述用户的语音转化为准备回答的问题；确定准备回答的所述问题的问题类型；根据语境感知神经会话模式至少生成一个对应所述问题的答案；验证通过语境感知神经会话模式生成的答案；向用户传递验证后的所述答案；其中，所述语境感知神经会话模式考虑到所述问题的语境信息，并且将所述问题的所述语境信息分解为多个高维度向量。

本发明还提供了一种语境感知网络聊天的系统，所述语境感知网络聊天的系统包括问题获取模块用于接收用户的语音，并将所述用户的语音转化为准备回答的问题；问题确定模块用于确定准备回答的所述问题的问题类型；语境感知神经会话模块用于根据语境感知神经会话模式至少生成一个对应所述问题的答案；证据验证模块用于验证通过语境感知神经会话模式生成的答案；答案传递模块向用户传递验证后的所述答案。

本依据本发明充分公开的权利要求书、说明书、以及附图，本领域技术人员将充分理解本发明的其他方面内容。

以下附图仅仅是用于解释本发明的具体实施例，并不限制本发明的范围。

附图说明

图1为本发明具体实施方式的工作环境示意图；

图2为本发明具体实施方式的计算系统的结构框图；

图3为本发明具体实施方式的语境感知网络聊天的系统；

图4为本发明具体实施方式的语境感知网络聊天的方法的流程图；

图5为本发明具体实施方式的神经会话模式。

具体实施方式

为了便于理解本发明，下面参照相关附图对本发明进行更全面的描述。下面将结合本发明实施例的附图，对本发明实施例的技术方案进行清楚，完整地描述。除非另外指出，在各图中相同的参考数字用于相同的部件。显然，描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于所描述的本发明的实施例，本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

机器人系统是企业众多任务中至关重要的一项，机器人系统与它的供应商和伙伴必须清晰的交流，不仅仅是比喻还有字面意思，与客户进行持续性的对话，这是维持客户关系的关键。具有信息搜索和任务导向对话特征的交流是商业应用五大语族的核心：客户服务，咨询台，网址导航，引导销售，和技术支持。

消费服务对应于消费者关于产品和服务常见问题，例如，询问如何申请车贷和房贷。咨询台对应内部员工问题：例如，对应HR问题。网址导航向客户指引复杂网址相关部分。“网址礼宾”对于帮助人们确定信息或者服务对应在公司网址哪一个地方是十分有用的。引导销售可提供在销售过程中回答问题和指引，尤其是，向新消费者售卖复杂商品。技术支持对应技术问题，例如诊断机器的问题。

在商业中，清晰的交流是获取、服务和维系客户的关键。公司常常向潜在客户普及他们产品和服务，与此同时，通过清楚了解他们客户需求增强客户满意度和客户维系。虽然，客户常常对通过网址无效的搜索感到沮丧，并且延迟许多天后才邮件回应。因此，对于客户询问能准确和及时的回答是最为理想的。

现有网络聊天系统着重于训练问题和回答的配对和向单个客户推荐最有可能的回答，但是没有考虑到语境信息。语境信息涉及到有关于文本理解的信息，例如，在文本中命名事件的身份：人，地点，书，等等。在文本中命名事件的信息：生日，地理位置，发布日期，等等，解释信息：主题，关键字，和衡量标准，日期等等。

也就是说，传统的网络聊天仅仅处理用户和交流，但是在回答用户时，没有将交流对话放入语境中，在许多应用中只考虑用户和交流是不够的，例如，应用暂时语境，旅游交流系统可以提供不同于夏天假日推荐的冬天假日推荐，类似的，在客户对话系统中，确定何时向用户传递什么内容。因此在特定情况下非常需要在会话系统中融入语境信息。

根据应用于神经机器翻译的神经网络将序列映射到序列，改善英语对法语，英语对德语的翻译任务。因为普通的递归神经网络(RNNs)容许梯度消失，采用变形的长短期记忆(LSTM)的递归神经网络，此外，提出机器人和会话代理。然而，大多数系统需要具有许多步骤的相对复杂加工流水线，并且相对应的方法没有考虑到所述用户的语境的改变。

本发明根据神经会话模式提供了一种语境感知网络聊天方法，所述方法考虑到将语境特征。所述神经会话模式可以终端对终端训练，因此，可以显著性减少的手动输入规则的需求。本发明提供的语境感知网络聊天的方法可以将语境信息融入神经会话模式中，这可以使网络聊天在与用户交流的时候意识到语境。与每个词相关中所述语境实值输入向量以简化训练过程。将从所述语境中学习所述向量用于传递模式化的语句的语境信息。

图1为本发明具体实施方式的工作环境示意图100。如图1所示，环境100包括用户终端102，服务器104，用户106，和网络110，其中也可以包括其他设备。

所述用户终端102指具有一定运算能力的任何合适的用户移动终端，比如可穿戴设备(例如智能手表，智能手环)，移动电话，智能电话，平板电脑，个人电脑(PC)，服务器电脑，笔记本电脑，掌上电脑(PDA)等。

所述服务器104包括任何合适的服务器计算机或若干个向用户106提供个性化内容的服务器计算机。例如，所述服务器104可提供云端计算机服务器。所述服务器104也可能在其他服务器和用户用户终端102之间促进交流、存储数据、处理数据。所述用户用户终端102，和服务器104可以通过一个或多个交流网络110相互交流，比如有线网络，电话网络，和/或卫星网络，等。

所述用户106通过用户终端102实现搜索和检索各种内容以及其他兴感趣的活动，或者说，如果所述移动用户终端102使用语音识别引擎，移动感应器，或深度相机，所述用户可以通过语音，手势或肢体语言去控制所述用户终端102。所述用户106可能是单个用户或者若干用户，比如家庭成员。

可以在任何适合计算电路平台中实施所述用户用户终端102，和/或服务器104。图2为能够实现用户终端102和/或服务器104具体实施的计算系统的结构框图。

如图2所示，计算机系统200包括处理器202，存储介质204，显示器206，通讯模块208，数据库214以及外围设备212。其中某些设备可被省略，也可以包括其他设备。

处理器202可以包括任何合适的一个或多个处理器。甚至，处理器202可以包括用于多线程或并行处理的多个核心。存储介质204可以包括内存模块，比如ROM，RAM，闪存模块，以及大容量存储器，比如CD-ROM和硬盘等。存储介质204存储有计算机程序，当处理器202执行这些计算机程序时，可以实现各种方法步骤。

具体的，外围设备212包括各种传感器和I/O设备，比如键盘和鼠标等。通讯模块208包括用于通过交流网络建立连接的网络交互设备。数据库214包括用于存储某种数据的一个或多个数据库和用于完成在存储数据中的某种操作的已存储数据库，如数据库搜索。

返回到图1，所述用户终端102和/或服务器104通过使用语境感知网络聊天的系统，图3为本发明具体实施方式的语境感知网络聊天的系统。如图3所示语境感知网络聊天的系统300包括问题获取模块301，问题确定模块302，语境感知神经会话模块303，证据验证模块304，并且答案传递模块305。

所述问题获取模块301可用于接收用户的问题，可通过各种方式获取所述用户的问题，例如，文本，语音，手语，在具体实施中，所述问题获取模块301可以通过语音识别引擎用于接收用户语音和向对应的问题传输客户的语音。

所述问题确定模块302可用于分析问题和确定问题类型。分析所述问题涉及到推导所述问题的语义意义(问题实际意义是什么)。所述问题确定模块302可用于通过推导所述问题嵌入多少部分或意义来分析问题。问题的特征可用于问答匹配学习。

特别是，所述问题确定模块302可用于识别定型词(LAT)。定型词类型是指问题中的一个词或者名词短语，所述词或者名词短语是用于在完全没有试图理解其语义情况下指定回答类型。一个决定备选答案是否为LAT的例子是一种重要的分数类型和关键错误的共同来源。例如，指定问题“推荐我一些餐厅”，所述问题分析模块302可用于分析语句语法和推断回答问题的地点。

所述语境感知神经会话模块303可用于根据语境感知神经会话模式生成对应问题的答案序列，换言之，使用来自于问题分析来的数据以生成备选答案。特别是即使所述语境没有出现，当接收到问题时，所述语境感知神经会话模块303可用于识别所述问题的语境信息。例如，如输入情感感知神经会话模式，所述语境感知神经会话模块303可用于增加时间和事件等等。

更甚是，所述语境感知神经会话模块303可用于推断问题的答案即使在训练集中证据很难出现，这些都是非常重要的，这是因为所述训练数据没有包括关于每个用户的每个属性的详细信息。所述语境感知神经会话模块303可用于根据不同事件生成的会话内容学习事件表示，在生成相似回答的事件中可以有相似的嵌入。因此，在所述向量空间周围的所述训练数据可以增加情感感知神经会话模式的生成能力。

所述证据有效模块304用于证实通过语境感知神经会话模块303生成的所述答案。虽然生成所述答案，但是用户不一定接受所述答案。因此，证据有效模块304可以用于计算质量控制的置信度分数。在具体实施例中，在所述问题和所述答案之间的KL距离上计算所述置信度分数，然后在0和1之间归一化。

例如，可提供预决定置信度分数作为标准，如果所计算的置信度分数大于所述预定的置信度分数，则认为对应的答案是有效的，所述答案传递模块305用于向所述用户传递有效答案。如果已计算的置信度分数小于所预定的置信度分数，则认为对应的答案是无效的。然后所述语境感知神经会话模块303会生成新的答案直至答案是有效的为止。另外，所述有效答案可用于训练后续问题。

本发明还提供一种语境感知网络聊天的方法。为了考虑到所述语境信息，所述语境感知网络聊天的方法形成具有语境的回答，可以用嵌入的向量代表每个事件。例如，将影响答案的内容和类型的事件信息编码(例如，天气，交通)，图4为本发明具体实施方式的语境感知网络聊天的方法流程图。

如图4所示，首先，接收用户语音(S402)。所述用户的语音是实时或者录制的，并且通过麦克风接收所述用户的语音然后转化为数字格式或者数据文件。也可以以数字格式的数据或者数据文件形式接收所述用户的语音。可以用任何合适的方法接收语音。

进一步，将所述用户的语音转化为准备回答的问题(S404)。即，通过用户用他/她的语音提出所述问题，在一具体实施例中，将所述用户的声音识别为文本并通过分析所述文本获取所述问题。或者分析所述用户的语音数据来获取所述问题或更多问题。在另一具体实施例中，用其他方式接收将要回答的所述问题，例如，文本，手语，不仅仅限于语音。

然后，分析准备回答的问题用户来确定问题的类型(S406)。例如，准备回答的问题可以与时间，地点或位置等等有关。通过推导准备回答的问题中嵌入多少部分或意义来分析所述准备回答的问题。在一具体实施例中，通过识别定型词(LAT)决定所述问题的类型。例如，指定问题“向我推荐一些餐厅”，分析语句语法，并推断准备回答的问题与地点有关。

在确定问题类型之后，根据语境感知神经会话模块至少生成一个回答所述问题的答案(S408)。即，根据来自于步骤S406的数据生成备选答案。根据语境感知神经会话模块生成准备回答的问题的答案序列，所述答案按照一定顺序排列，例如偏好顺序。

尤其是，当通过语境感知神经会话模块接收问题时，所述语境感知神经会话模块识别所述语境信息即使没有语境出现。例如，当输入语境感知神经会话模式时，所述语境感知神经会话模块303可用于增加时间和事件等等。

图5为本发明具体实施方式的神经会话模式。如图5所示，在语句中的每个标记与事件级别表示v_i∈R^k*1有关，在标准的序列对序列模块中(SEQ2SEQ)，可以用源LSTM将一个语句S编码为向量表示h_S。然后，对于目标端的每个特征，可以组合所述表示来获取隐藏单元，并且在之前的时间步骤，当前时间步骤中所述单词表示和语境嵌入v_i中通过目标LSTM生成所述表示。

所述语境感知神经会话模块可增加编码所述事件信息v_i的隐藏层，从而使回答具有语境感知。所有包括事件i的会话可以共享所述嵌入v_i。在训练期间向每个神经部分逆传播单词预测错误来学习{v_i}。

此外，所述语境感知会话模式能够推断问题的回答即使证据在训练集中并不容易出现，其中，所述语境感知会话模式与所述训练数据一样重要，所述训练数据没有包括关于每个用户的每个属性的详细信息。所述语境感知会话模式可以根据不同事件生成的会话内容来学习事件表示。并且生成相似回答的事件倾向于有相似的插入，因此，在所述向量空间周边的所述训练数据可以增加模式的生成能力。

例如，考虑在冬季生成问答对“推荐一些好玩的地方”和“我觉得塔霍湖不错”，在训练过程中所述语境感知会话模式可以加时间，地点，人物和其他语境信息作为输入，可以嵌入考虑了语境信息的餐厅表示进入语境感知会话模式中。然后，在冬天，所述“美国塔霍湖”是比较好的回答。在所述测试过程中，当所述问题中问道餐厅，“在塔霍湖的B.J餐厅如何”，所述语境感知神经会话模式可以检测到这个问题在夏天提出，并且当注意到“塔霍湖”不是最接近当前语境时，推荐比B.J餐厅更好的结果。

然后将所述步骤S408转化为通过考虑到语境EC＝{ec₁,ec₂,…,ec_m}，得到回答语句或者给定的输入语句X＝{x₁,x₂,…,x_n}的回答Y＝{y₁,y₂,…,y_n}，其中，x代表问题中的一个单词，并且y代表答案中的一个单词。将寻找所述答案语句Y的问题转化为通过最大化概率P(y_t|y_t-1,…,y₁,ec)预测y的值。采用神经网络来学习没有利用手动输入规则的语句表示。

典型的神经会话模式每次可以提供具有每个输入门、记忆门和输出门的语句，其中分别定义为i_t，f_t,和o_t。x_t指的是时间步骤t中关于单个文本单元的向量，h_t指通过x_t和h_t-1组合在时间步骤t中由LSTM模型计算的向量，c_t指在时间步骤t中所述单元格状态向量，并且θ是指所述sigmoid函数。然而，每个时间步骤t的所述向量表示h_t如下所示：

c_t＝f_tc_t-1+i_tl_t (2)

其中W是指已学习和已训练的因素，并且W_i,W_f,W_o,W_l∈R^K*2K。

不同于序列对序列生成任务，每个输入X与已预测的输出序列：Y＝{y₁,y₂,…,y_n}配对，输出和按顺序预测的标记分布可以用softmax函数表示的：

其中f(h_t-1,e_yt)指在h_t-1和e_yt的激活函数。每个语句都可以用一个特殊的语句结束符EOS。因此，在解码过程中，当预测到EOS标记时，结束所述解码算法。在每个时间步骤中，对单词预测采用是贪心法或集束搜索。

通过证据验证模块验证所述语境感知神经会话模式生成的答案(S410)。虽然生成了所述答案，所述用户不能接受所述答案。因此，可以提供质量控制的置信度分数。在一具体实施例中，在问题和答案之间计算在归一化KL距离(在0和1之间)中的所述置信度分数。所述KL距离的计算是本领域普通技术人员容易得到的，因此不在这里解释。

例如，提供预定置信度作为标准，并且根据所述答案的已计算置信度分数决定所述答案是否有效(S411)。如果所述已计算的置信度分数大于所述预定的置信度分数，则考虑对应的答案是有效的并将所述有效答案传给所述用户(S412)。如果所述计算置信度分数比预定置信度分数小，所述对应答案视为无效，重复所述步骤S408和S410和S411直至所述答案确定为有效。另外，所述有效答案可用于训练未来答案。

本发明所述方法和语境感知网络聊天系统可以考虑语境信息后回应所述用户或者回答问题。为了实现更多问题、答案和语境的精准表示，可以向所述语境感知神经会话模式输入所述语境信息。即，在系统级将所述语境信息输入到网络聊天中。所述语境感知神经会话模式可以同时学习所述语境和问答配对，利用语境感知神经会话模式，训练所述问答配对无需人工输入规则，并将所述语境信息分解至多个高维向量，例如，人物，和机构，客体，代理，突发事件，目的，事件，地点，表现形式，概念/抽象概念，关系等等。

通过分析问题中的所述语境后，用更好答案匹配所述用户的问题。即，所述网络聊天可向用户提供更多相关答案，并所述用户可以在不同语境中寻找他们所需的服务和产品，明显地改善了用户体验。没有手动输入规则也可以将本发明提供的方法和语境感知网络聊天的系统应用于各种有趣应用中。

另外，本发明提供的方法和语境感知网络聊天的系统可以为考虑采用语境信息的方法和系统提供总的学习框架。嵌入语境表示的已学习单词可以用于将来其他任务中，在将来，在推荐系统中代表语境信息的高维向量可以用于个性化。

本实例的技术将进一步理解，本实施例中公开的各种说明模块和方法步骤可以在电子硬件，计算机软件，或软硬件上实现，为了更为清晰的说明软硬件的互换性，以上主要从功能方面描述了各种说明性单元和步骤。是否能在软硬件上实现所述功能取决于全系统上的具体应用和加载的设计限制。技术人员可以在每个具体应用中应用各种方法实现所述功能，但是这种实施应该解释为在本发明保护范围内。

本所公开实施例的描述用于向本领域普通技术人员说明本发明。对所述实施例的各种修改对本领域普通技术人员是显而易见的，并且在本发明实施例中给出的一般性原则在不脱离本发明的精神或者范围的情况下，也可以应用于其他实施例中。因此，本发明不限于所述实施例中，但是适用于与本实施例所公开的原则和新特征相一致的最广领域。

Claims

1.一种语境感知网络聊天的方法，其特征在于，所述方法包括：

接收用户的语音；

将所述用户的语音转化为准备回答的问题；

确定准备回答的所述问题的问题类型；

根据语境感知神经会话模式至少生成一个对应所述问题的答案；

验证通过语境感知神经会话模式生成的所述答案；

向用户传达验证后的所述答案；

其中，所述语境感知神经会话模式会考虑所述问题的语境信息，并且将所述问题的所述语境信息分解为多个高维向量。

2.根据权利要求1所述的语境感知网络聊天的方法，其特征在于，确定准备回答的所述问题的问题类型包括：

识别准备回答的所述问题的定型词。

3.根据权利要求1所述的语境感知网络聊天的方法，其特征在于，根据语境感知神经会话模式至少生成一个对应于所述问题的答案包括：

提供输入语句X＝{x₁,x₂,…,x_n}，通过考虑到语境EC＝{ec₁,ec₂,…,ec_m}得到回答语句Y＝{y₁,y₂,…,y_n}，其中，x表示在所述输入语句中的词，y代表在回答语句中的词，所述回答语句Y代表答案，并且所述输入语句X代表准备回答的问题。

4.根据权利要求3所述的语境感知网络聊天的方法，其特征在于，提供所述输入语句X＝{x₁,x₂,…,x_n}，通过考虑到语境EC＝{ec₁,ec₂,…,ec_m}得到回答语句Y＝{y₁,y₂,…,y_n}包括：

通过最大化概率P(y_t|y_t-1,…,y₁,ec)来预测y的值。

5.根据权利要求4所述的语境感知网络聊天的方法，其特征在于，通过最大化概率P(y_t|y_t-1,…,y₁,ec)来预测y的值包括：

通过所述语境感知神经会话模式，提供具有输入门为i_t、记忆门为f_t，输出门o_t的输入语句；及

通过以下步骤计算单位时间步骤t的向量表示为h_t

C_t＝f_tc_t-1+i_tl_t

其中W_i,W_f,W_o,W_l∈R^K*2K，W是指已学习和已训练因素，x_t是指在时间步骤t中单个文本单元的向量，h_t指通过x_t和h_t-1组合在时间步骤t中由长短期记忆模型计算的向量，c_t指在时间步骤t中所述单元格状态向量，θ是指所述sigmoid函数。

6.根据权利要求5所述的语境感知网络聊天的方法，其特征在于，包括：

根据softmax函数计算输出分布和按顺序预测的标记分布：

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <mrow> <mi>Y</mi> <mo>|</mo> <mi>X</mi> </mrow> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>&Pi;</mi> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>n</mi> <mi>y</mi> </msub> </msubsup> <mi>p</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mi>t</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>x</mi> <mn>2</mn> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>x</mi> <mi>t</mi> </msub> <mo>,</mo> <msub> <mi>y</mi> <mn>1</mn> </msub> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msub> <mi>y</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>&Pi;</mi> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>n</mi> <mi>y</mi> </msub> </msubsup> <mfrac> <mrow> <mi>exp</mi> <mrow> <mo>(</mo> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>h</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>e</mi> <mrow> <mi>y</mi> <mi>t</mi> </mrow> </msub> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>&Sigma;</mi> <msup> <mi>y</mi> <mo>&prime;</mo> </msup> </msub> <mi>exp</mi> <mrow> <mo>(</mo> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>h</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>e</mi> <msup> <mi>y</mi> <mo>&prime;</mo> </msup> </msub> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>

其中，f(h_t-1,e_yt)指在h_t-1和e_yt之间的激活函数。

7.根据权利要求6所述的语境感知网络聊天的方法，其特征在于，

当预测到EOS标记时，结束所述输入语句的解码。

8.根据权利要求1所述的语境感知网络聊天的方法，其特征在于，所述验证通过语境感知神经会话模式生成的答案包括：

计算通过所述语境感知神经会话模式生成的答案的置信度分数，其中所述置信度分数是问题和答案之间的归一化KL距离。

9.一种具有计算机程序的非暂时性计算机可读介质，当由处理器执行时，执行语境感知网络聊天的方法，其特征在于，所述方法包括：

接收用户的语音；

将所述用户的语音转化为准备回答的问题；

确定准备回答的所述问题的问题类型；

验证通过语境感知神经会话模式生成的答案；

向用户传递验证后有效的答案；

其中，所述语境感知神经会话模式考虑到所述问题的语境信息，并且将所述问题的所述语境信息分解为多个高维向量。

10.根据权利要求9所述的具有计算机程序的非暂时性计算机可读介质，其特征在于，所述确定准备回答的所述问题的问题类型包括：

识别准备回答的所述问题的定型词。

11.根据权利要求9所述的具有计算机程序的非暂时性计算机可读介质，其特征在于，根据所述语境感知神经会话模式至少生成一个对应于所述问题的答案包括：

假设输入语句X＝{x₁,x₂,…,x_n}，通过考虑到语境EC＝{ec₁,ec₂,…,ec_m}得到回答语句Y＝{y₁,y₂,…,y_n}，其中，x表示在所述输入语句中的词，y代表在回答语句中的词，所述回答语句Y代表答案，并且所述输入语句X代表准备回答的问题。

12.根据权利要求11所述的具有计算机程序的非暂时性计算机可读介质，其特征在于，所述提供输入语句X＝{x₁,x₂,…,x_n}，通过考虑到语境EC＝{ec₁,ec₂,…,ec_m}寻找回答语句Y＝{y₁,y₂,…,y_n}包括：

通过最大化概率P(y_t|y_t-1,…,y₁,ec)来预测y的值。

13.根据权利要求12所述的具有计算机程序的非暂时性计算机可读介质，其特征在于，所述通过最大化概率P(y_t|y_t-1,…,y₁,ec)来预测y的值包括：

通过以下步骤计算单位时间步骤t的向量表示为h_t

c_t＝f_tc_t-1+i_tl_t

其中W_i,W_f,W_o,W₁∈R^K*2K，W是指已学习和已训练因素，x_t是指在时间步骤t中关于单个文本单元的向量，h_t指通过x_t和h_t-1组合在时间步骤t中由长短期记忆模型计算的向量，c_t指在时间步骤t中所述单元格状态向量，并且θ是指所述sigmoid函数；

根据softmax函数计算输出和按顺序预测的标记分布：

其中，f(h_t-1,e_yt)指在h_t-1和e_yt之间的激活函数。

14.根据权利要求9所述的具有计算机程序的非暂时性计算机可读介质，其特征在于，所述验证通过语境感知神经会话模式生成的答案包括：

15.一种语境感知网络聊天的系统，其特征在于，所述系统包括：

问题获取模块：用于接收用户的语音，并将所述用户的语音转化为准备回答的问题；

问题确定模块：用于确定准备回答的所述问题的问题类型；

语境感知神经会话模块：用于根据语境感知神经会话模式至少生成一个对应所述问题的答案；

证据验证模块：用于验证通过语境感知神经会话模式生成的答案；

答案传递模块：用于向用户传递验证后有效的答案。

16.根据权利要求书15所述的语境感知网络聊天的系统，其特征在于，所述问题确定模块包括：

识别准备回答的所述问题的定型词。

17.根据权利要求书15所述的语境感知网络聊天的系统，其特征在于，所述语境感知神经会话模块包括：

18.根据权利要求书17所述的语境感知网络聊天的系统，其特征在于，所述语境感知神经会话模块包括：

通过最大化概率P(y_t|y_t-1,…,y₁,ec)来预测y的值。

19.根据权利要求书18所述的语境感知网络聊天的系统，其特征在于，所述语境感知神经会话模块包括：

通过以下步骤计算单位时间步骤t的向量表示为h_t

c_t＝f_tc_t-1+i_tl_t

其中W_i,W_f,W_o,W_l∈R^K*2K，W是指已学习和已训练因素，x_t是指在时间步骤t中关于单个文本单元的向量，h_t指通过x_t和h_t-1组合在时间步骤t中由长短期记忆模型计算的向量，c_t指在时间步骤t中所述单元格状态向量，并且θ是指所述sigmoid函数；

根据softmax函数计算输出和按顺序预测的标记分布：

其中，f(h_t-1,e_yt)指在h_t-1和e_yt之间的激活函数。

20.根据权利要求书15所述的语境感知网络聊天的系统，其特征在于，所述证据验证模块包括：