CN115146124A - 问答系统应答方法及其装置、设备、介质、产品 - Google Patents
问答系统应答方法及其装置、设备、介质、产品 Download PDFInfo
- Publication number
- CN115146124A CN115146124A CN202210806707.6A CN202210806707A CN115146124A CN 115146124 A CN115146124 A CN 115146124A CN 202210806707 A CN202210806707 A CN 202210806707A CN 115146124 A CN115146124 A CN 115146124A
- Authority
- CN
- China
- Prior art keywords
- sequence
- user
- sentence
- sample
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本申请涉及问答系统应答方法及其装置、设备、介质、产品,所述方法包括:获取当前会话的聊天记录中的用户语句序列,用户语句序列中包含用户在先提交的顺序连续的多个对话语句;根据用户语句序列的序列标注信息,确定出所述用户语句序列中的数个对话语句构成精选语句序列;根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图;将所述目标提问意图相对应的答案文本输出至当前会话中。本申请通过自动精选用户提交的在先对话语句,避免为用户真实意图的识别引入噪声信息,可提升问答系统中对用户真实意图的识别能力,从而精准理解用户意图进行准确的答复,可以提升问答系统的用户体验,降低后台运营成本,适于电商平台的独立站使用。
Description
技术领域
本申请涉及电商信息技术领域,尤其涉及一种问答系统应答方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。
背景技术
在问答系统中,一问一答的对话形式足以解决很多问题,但很多时候用户的当前输入可能不足以反映其意图,例如寒喧式的语句或者助词式的表达等,这种情况下,需要结合前文才能理解用户的真实意图,所以需要借助多轮问答,才能识别用户意图,进一步还可以引导用户表达出完整的信息,然后判断用户的深层意图。
对于以上的需求,目前常规的解决方案是将用户的当前输入和前N轮输入拼接在一起,然后输入到意图识别模型中。这种方式中,N的设定依赖于人工的经验,一方面经验不一定可靠(设定太小可能遗漏信息,设定太大则会引入过多噪声信息),另一方面也缺乏灵活性。此外,由于用户的前N轮输入中可能包含了无助于理解其意图的冗余、噪声信息,最终影响意图识别模型的效果。同时,这种方法需要重新训练意图识别模型,当意图识别模型的实现方式是相似度匹配时,还需要刷新向量索引库中所有相似问的向量,其更新迭代成本是较高的。
由此可见,在问答系统中如何高效地识别用户的真实意图,关系到问答系统的智能化程度的高低,关于识别用户真实意图的解决方案,仍有探索的空间。
发明内容
本申请的目的在于解决上述问题而提供一种问答系统应答方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品、
适应本申请的各个目的,采用如下技术方案:
一个方面,适应本申请的目的之一而提供一种问答系统应答方法,包括:
获取当前会话的聊天记录中的用户语句序列,所述用户语句序列中包含用户在先提交的顺序连续的多个对话语句;
根据所述用户语句序列的序列标注信息,确定出所述用户语句序列中的数个对话语句构成精选语句序列;
根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图;
将所述目标提问意图相对应的答案文本输出至当前会话中。
可选的,获取当前会话的聊天记录中的用户语句序列,所述用户语句序列中包含用户在先提交的顺序连续的多个对话语句,包括:
接收用户在当前会话中提交的最后一个对话语句,将其添加到当前会话的聊天记录中;
基于最后一个对话语句回溯当前会话的聊天记录,倒序获取用户的多个对话语句;
将所述顺序连续的多个对话语句进行文本格式化预处理后构造为用户语句序列。
可选的,根据所述用户语句序列的序列标注信息,确定出所述用户语句序列中的数个对话语句构成精选语句序列,包括:
构造所述用户语句序列相对应的编码向量序列;
采用预设的序列标注模型,对所述编码向量序列进行序列标注,获得序列标注信息,所述序列标注信息包含对用户语句序列中各个对话语句的二分类结果;
根据所述序列标注信息查询所述用户语句序列,提取其中二分类结果表征正向类型的对话语句构造为精选语句序列。
可选的,采用预设的序列标注模型的步骤之前,包括:
调用数据集中的单个训练样本,所述训练样本为样本语句序列,包括语义不相关的第一样本语句和第二样本语句,其中多个第一样本语句之间语义相连贯,所述数据集中关联该训练样本设置有标签序列,标签序列中对应样本语句序列包含区分第一样本语句和第二样本语句的二值化标签;
构造所述单个训练样本的编码向量序列,所述编码向量序列中包含区分各个样本语句对应的向量的分隔符;
将所述编码向量序列输入序列标注模型进行解码实现序列标注,获得序列标注信息,所述序列标注信息包含对样本语句序列中各个样本语句的二分类结果;
根据所述单个训练样本的标签序列计算所述序列标注信息的损失值,根据该损失值对序列标注模型实施梯度更新,在序列标注模型未收敛时从数据集中调用下一训练样本将序列标注模型训练于收敛状态。
可选的,调用数据集中的单个训练样本的步骤之前,包括:
从预采集的对话数据中提取训练样本,获得其相对应的样本语句序列,其中包括语义连贯的多个第一样本语句;
选取与所述对话数据语义不相关的文本中获取多个第二样本语句,第二样本语句的数量在与第一样本语句总量相对应的数值区间随机取整数值;
按照自大到小的概率分布确定各个所述第二样本语句在样本语句序列中的插入顺序并插入到所述样本语句序列的相应位置,构造出数据集中的所述训练样本。
可选的,根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图,包括:
构造所述精选语句序列的嵌入向量序列;
采用预设的意图识别模型,对所述嵌入向量序列进行特征提取后进行分类映射,获得映射到预设的知识库中各个提问意图的分类概率;
将分类概率最大的提问意图作为目标提问意图。
可选的,根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图,包括:
构造所述精选语句序列的嵌入向量序列;
采用预设的意图识别模型,对所述嵌入向量序列进行特征提取获得深层语义向量;
计算所述深层语义向量与预设的知识库中的各个提问意图的深层语义向量的向量相似度,将相似度最大的提问意图确定为目标提问意图。
可选的,将所述目标提问意图相对应的答案文本输出至当前会话中,包括:
查询获取预设的知识库中与所述目标提问意图相映射的答案集,随机抽取出答案集中的一个答案文本;
将所述答案文本推送至所述用户的终端设备以显示到会话界面中;
在所述终端设备回复确认信息后将所述答案文本添加到当前会话的聊天记录中。
另一方面,适应本申请的目的之一而提供一种问答系统应答装置,包括:语句调用模块、语句精选模块、意图识别模块,以及自动应答模块,其中,所述语句调用模块,用于获取当前会话的聊天记录中的用户语句序列,所述用户语句序列中包含用户在先提交的顺序连续的多个对话语句;所述语句精选模块,用于根据所述用户语句序列的序列标注信息,确定出所述用户语句序列中的数个对话语句构成精选语句序列;所述意图识别模块,用于根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图;所述自动应答模块,用于将所述目标提问意图相对应的答案文本输出至当前会话中。
又一方面,适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的问答系统应答方法的步骤。
又一方面,适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的问答系统应答方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
又一方面,适应本申请的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请任意一种实施例中所述问答系统应答方法的步骤。
相对于现有技术,本申请具有多方面优势,包括但不限于:
首先,本申请在判定问答系统中的当前会话的目标提问意图时,以用户在先提交的顺序连续的多个对话语句构成的用户语句序列为输入,先根据这个用户语句序列的序列标注信息精选出其中的部分对话语句构选精选语句序列,然后再根据精选语句序列进行提问意图识别,确定出能够代表用户真实意图的目标提问意图,然后根据目标提问意图进行应答,通过以上过程,能够智能地确定用于识别目标提问语句所需的对话语句的数量,可以去除当前会话的聊天记录中的噪声信息,从而有效而准确地确定出用户的真实意图,在真实意图的基础上提供答案文本,能够确保问答系统的对话交互的正常进行。
其次,本申请由于具备动态确定精选语句序列中的对话语句的数量的能力,在使用意图识别模型进行真实意图识别的场景中,精选语句序列可以一起编码构成输入,提供给意图识别模型进行目标提问意图的识别,因而,无需适应精选语句序列中的对话语句数量对意图识别模块进行重新训练或其他改造,即可利用意图识别模型原有的能力实现意图识别,由此也无需动辄就对知识库中的先验知识例如提问意图等更新语义向量,可以大幅降低问答系统的运维成本。
此外,将本申请的技术方案应用于基于独立站的电商平台中,能够进一步提升其客服系统的智能化程度,提升电商平台的后台服务能力,改善终端消费者用户的使用体验,降低人工客服成本。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的问答系统应答方法的典型实施例的流程示意图。
图2为本申请实施例中计算相似总分的流程示意图。
图3为本申请实施例中训练序列标注模型的流程示意图。
图4为本申请实施例中构造训练样本的流程示意图。
图5为本申请实施例中利用一种意图识别模型做分类映射确定目标提问意图的流程示意图。
图6为本申请实施例中利用另一意图识别模型提取深层语义向量通过相似匹配确定目标提问意图的流程示意图。
图7为本申请的问答系统应答装置的原理框图;
图8为本申请所采用的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的一种问答系统应答方法,可被编程为计算机程序产品,部署于客户端或服务器中运行而实现,例如,本申请的示例性应用场景中,可以在电商平台的服务器中部署实现,藉此可以通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程进行人机交互而执行该方法。
请参阅图1,本申请的问答系统应答方法在其典型实施例中,包括如下步骤:
步骤S1100、获取当前会话的聊天记录中的用户语句序列,所述用户语句序列中包含用户在先提交的顺序连续的多个对话语句;
问答系统可以体现为多种表现形式,例如客服系统、聊天机器人等。电商平台中一般都配置相应的客服系统,以便为平台用户提供相应的问答服务。基于独立站的跨境电商平台,广泛使用此类客服系统。
用户可以在其终端设备调用问答系统的会话界面,启动人机之间的会话,即当前会话,当用户向会话界面输入对话语句并提交到服务器之后,问答系统根据对话语句进行用户意图识别,根据识别出来的目标提问意图确定其相应的答案文本,以该答案文本应答该对话语句,输出并显示到所述会话界面中,完成一轮问答。一个会话中通常包含多轮问答。
同时,用户提交的对话语句,也会被存储到由服务器负责维护的当前会话相对应的聊天记录中。自然地,该聊天记录是与用户相关联的。用户可以在不同时间先后启动多个会话,这些会话相对应的聊天记录均可存储于相关数据库中以备调用。由于用户每次会话通常是基于一个或多个独立意图进行对话,因而,每个会话相对应的聊天记录所包含的信息内容相对较具独立性。当然,在一些情况下,由于同一问题未能在单个会话中得到解决,用户可能先后通过多个会话才解决所述的问题,因而,也存在多个对话围绕同一意图展开的情况。这个情况下,在先的会话可以看成是当前会话的一部分,其对应的历史聊天记录也可以看成当前会话的聊天记录的一部分。
不难理解,在当前会话的聊天记录中,存在连续多轮问答相对应的对话语句,其中由用户产生的对话语句一般是用户表达需求、意图、意见相对应的提问语句,由问答系统产生的对话语句则是对提问语句应答的答案文本。用户产生的多个对话语句可以更全面综合地表达用户的真实意图,因而,一个实施例中,可以将当前会话的聊天记录中,用户在先提交的全部对话语句构造为用户语句序列,以便基于该用户语句序列进行用户意图的识别。
另一实施例中,可以按照如下过程获取所述的用户语句序列,该过程包括如下步骤:
步骤S1110、接收用户在当前会话中提交的最后一个对话语句,将其添加到当前会话的聊天记录中;
问答系统的应答逻辑以用户提交对话语句作为触发条件,因而,响应于用户在当前会话中提交的每一个对话语句,具体是响应人机聊天过程中的每一个最后的对话语句的提交事件,而启动本申请的应答逻辑。为存档的需要,问答系统会将每一个由用户提交的对话语句添加到当前会话相对应的聊天记录中。
步骤S1120、基于最后一个对话语句回溯当前会话的聊天记录,倒序获取用户的多个对话语句;
在一个会话产生的聊天记录中,最后一个对话语句未必能全面体现用户的真实意图,因而,可以从当前会话的聊天记录中,从用户的最后一个对话语句开始,沿时间轴往前回溯,按照时间上的倒序获取用户的多个对话语句来综合表征用户意图。所述的多个对话语句,可以是在时间上连贯的多轮问答中提取的属于用户提交的对话语句,这些对话语句也可以视为顺序上连续的多个对话语句。对于所获取的用户的对话语句的数量上限,既可以是当前对话中用户提交的全量对话语句,也可以是回溯获取预定数量的多个对话语句,可以灵活设定。
步骤S1130、将所述顺序连续的多个对话语句进行文本格式化预处理后构造为用户语句序列。
从聊天记录中获取的属于用户提交的所述多个对话语句,由于用户在输入时容易带入助词、赘字、表情符、标点符号等冗余信息,因而,可以对各个对话语句进行格式预处理,包括但不限于去除停用词、去除标点符号、去除表情符、修正错别字等等任意之一或任意多项的结合,实现数据清洗,以使其语句更易被计算机识别。经过以上数据清洗的所述多个对话语句,可以按照时序顺序,也即多轮问答的顺序,将各个对话语句按序组织构造为用户语句序列,以便基于该用户语句序列进行用户意图的识别。
根据以上的多种实施例,不难理解,对于本申请判别用户意图所需,可以从当前会话的聊天记录中获取用户在先提交的多个顺序连续的对话语句构造为用户语句序列,作为挖掘用户真实意图的基础素材。
步骤S1200、根据所述用户语句序列的序列标注信息,确定出所述用户语句序列中的数个对话语句构成精选语句序列;
所述用户语句序列中的各个对话语句,在表达用户意图的信息量方面是不一致的,其中:有些对话语句可能与用户的提问意图完全无关,例如纯感叹词或无特定意义的纯表情符等。有些对话语句可能需要结合在一起才能表达一个完整的提问意图,例如以下三个语句共同表示关于购买某个具体型号手机相对应的真实意图:“我想要买那个新出的手机”、“那个黑色6.1寸屏的”、“不要那个老款”。有些对话语句可能夹杂与真实意图无关的信息,例如“你早点寄给我才能早点带出去玩”。综上种种,表明用户语句序列中不同的对话语句,其各自对用户的提问意图所承载的信息量不同,因而,需要加以识别。
一种实施例中,本申请可以借助序列标注任务,对所述用户语句序列中的各个对话语句是否适合充当意图识别所需的精选对话语句进行标注,从而获得对应表示用户语句序列中的各个对话语句是否属于精选对话语句的预测标签序列,作为序列标注信息。通过序列标注信息中的各个标签,将表示属于精选对话语句从所述用户语句序列中提取出来,按照对话顺序重新构造为精选语句序列,即可构成判别用户意图的有效基础素材,进一步识别用户的提问意图。
一种实施例中,可以采用预先训练至收敛状态的序列标注模型来对精选语句序列中的各个对话语句执行序列标注任务,通过序列标注任务获得序列标注信息,根据序列标注信息识别并提取出用户语句序列中的精选语句序列。所述序列标注模型可以采用足量的训练样本预先训练至收敛状态,所述训练样本可以是一个样本语句序列,其中包括多个样本语句,每个样本语句按照预定的标签结构标注其是否属于精选对话语句以便构成对应的标签。在训练过程中,采用相应的标签序列监督所述训练样本的预测结果,对模型实施梯度更新,使模型通过迭代训练达至收敛状态。
一种实施例中,可以从问答系统的历史会话中采集有效的会话相对应的聊天记录,提取其中的时间上连贯的用户提交的对话语句构造出样本语句序列,并且向其中随机插入噪声对话语句,然后,根据对话语句是否属于噪声而添加标注相应的标签,从而完成对训练样本的构造和标注,可用于实施对所述序列标注模型的训练。
一种实施例中,所述序列标注模型所采用的神经网络架构,可以是LSTM+CRF,其中,LSTM为长短期记忆网络,CRF为条件随机场网络,LSTM对输入的文本进行序列化的特征提取和编码获得序列化的向量表示,CRF则根据序列化的向量表示执行相应的标注任务,从而获得所述的序列标注信息。不难理解,其中LSTM也可以是其他适于处理序列信息的基于循环神经网络(RNN,Recurrent Neural Network)的基础模型,例如Bert、Transformer编码器等。
当完成对用户语句序列的序列标注并获得相应的序列标注信息后,序列标注信息中包含对用户语句序列中各个对话语句是否属于精选对话语句的对应标签,由此,可将所述精选对话语句从用户语句序列中提取出来,仍按照各个对话语句的时间顺序进行有序组织,构造为精选语句序列。
不难理解,在序列标注模型习得的识别精选语句的先验知识的帮助下,针对包罗万象的用户语句序列中的对话语句,可以去伪存真,将对识别意图无帮助的对话语句过滤掉,保留对识别意图有帮助的精选对话语句,确保本申请识别用户提问意图所依赖的基础素材能够有效提供精炼的关键信息,以便得到更为准确的意图识别结果。
步骤S1300、根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图;
获得所述的精选语句序列之后,可以根据精选语句序列进行意图识别,其目的在于识别出与精选语句序列中各个对话语句所提供的语义信息相匹配的提问意图,即目标提问意图。
问答系统中配备有知识库,知识库中包含有大量的提问意图及其对应的答案集,每个提问意图通常设置一个标准问句和多个相似问句,每个答案集中相应包含多个答案文本。提问意图与答案集的对应关系,是问题与答案之间的关系。
一种实施例中,可以借助预先训练至收敛状态的文本特征提取模型搭建的双塔模型架构,通过两个塔分别提取所述精选语句序列和知识库中单个提问意图的标准问句或相似问句的特征向量,然后计算两个特征向量之间的相似度,由此获得所述精选语句序列与各个标准问句或相似问句的相似度,确定其中相似度最高的标准问句或相似问句相对应的提问意图为目标提问意图。
另一实施例中,采用单个预先训练至收敛状态的文本特征提取模型,预先为各个提问意图中的标准问句和相似问句提取特征向量,在需要识别意图时,再利用所述文本特征提取模型提取精选语句序列的特征向量,再利用提问意图中各个特征向量分别与精选语句序列的特征向量计算相似度,确定其中相似度最高的标准问句或相似问句相对应的提问意图为目标提问意图。
再一实施例中,利用基于文本特征提取模型后接分类器搭建出意图分类模型,事先采用对应的训练样本将所述意图分类模型训练至收敛状态,使其习得根据给定的由多个对话语句构成的语句序列获得分类结果,所述分类结果表征映射到知识库中的各个提问意图相对应的分类概率,将其中分类概率最大的提问意图确定为目标提问意图。
所述的文本特征提取模型,可以是基于CNN、RNN实现的神经网络基础模型及其演进版本,例如Bert、FastCNN、LSTM、Transformer、BART等,其适于为文本形式的输入编码嵌入向量,再在嵌入向量的基础上完成对文本的深层语义信息的提取,从而获得相应的特征向量。
根据以上不同实施方式可知,根据所述精选语句序列,可以提取出其中的多个精选对话语句的深层语义信息,实现对其中与意图相对应的信息语义的挖掘,在此基础上,可确保准确获得精选语句序列所指向的目标提问意图。
步骤S1400、将所述目标提问意图相对应的答案文本输出至当前会话中。
当确定出所述的目标提问意图之后,利用知识库中提问意图与答案集之间的对应关系,便可获得目标提问意图相对应的答案集,然后,从答案集中选择一个答案文本,输出至当前会话,即可完成对用户最后一个对话语句的答复。
一种实施例中,可按照如下过程实现本步骤,包括:
步骤S1410、查询获取预设的知识库中与所述目标提问意图相映射的答案集,随机抽取出答案集中的一个答案文本;
在先确定出目标提问意图之后,便可从问答系统的知识库中,根据提问意图与答案集的映射对应关系,确定出该目标提问意图相对应的答案集。如前所述,答案集中包括一个或多个答案文本,同一答案集中的多个答案文本通常是以为同表达式表达同一意思,因而,可以随机选择其中的一个答案文本用于回复用户。
步骤S1420、将所述答案文本推送至所述用户的终端设备以显示到会话界面中;
对于被选中的答案文本,可以将其推送至所述用户的终端设备,以便由终端设备将其解析显示到所述当前会话的会话界面中,使用户可以从该会话界面中读取该答案文本,完成一轮人机对话。
步骤S1430、在所述终端设备回复确认信息后将所述答案文本添加到当前会话的聊天记录中。
当终端设备接收到所述的答案文本之后,会通过后台向服务器回复确认标识,根据该确认标识可知终端设备已经成功接收所述的答案文本,该答案文本已经构成有效的聊天记录中的一个基本单位,因而,可以将所述答案文本添加到当前会话相对应的聊天记录中,以备后用。
通过以上实施例可知,由于所述答案文本是综合用户在最近多轮问答中提交的对话语句而优选出的,因而,其文意能够更好地匹配用户的真实提问意图,使用户获得满意的答复结果。
根据以上实施例可以知晓,本申请具有多方面优势,包括但不限于:
首先,本申请在判定问答系统中的当前会话的目标提问意图时,以用户在先提交的顺序连续的多个对话语句构成的用户语句序列为输入,先根据这个用户语句序列的序列标注信息精选出其中的部分对话语句构选精选语句序列,然后再根据精选语句序列进行提问意图识别,确定出能够代表用户真实意图的目标提问意图,然后根据目标提问意图进行应答,通过以上过程,能够智能地确定用于识别目标提问语句所需的对话语句的数量,可以去除当前会话的聊天记录中的噪声信息,从而有效而准确地确定出用户的真实意图,在真实意图的基础上提供答案文本,能够确保问答系统的对话交互的正常进行。
其次,本申请由于具备动态确定精选语句序列中的对话语句的数量的能力,在使用意图识别模型进行真实意图识别的场景中,精选语句序列可以一起编码构成输入,提供给意图识别模型进行目标提问意图的识别,因而,无需适应精选语句序列中的对话语句数量对意图识别模块进行重新训练或其他改造,即可利用意图识别模型原有的能力实现意图识别,由此也无需动辄就对知识库中的先验知识例如提问意图等更新语义向量,可以大幅降低问答系统的运维成本。
此外,将本申请的技术方案应用于基于独立站的电商平台中,能够进一步提升其客服系统的智能化程度,提升电商平台的后台服务能力,改善终端消费者用户的使用体验,降低人工客服成本。
在本申请任意实施例的基础上,请参阅图2,根据所述用户语句序列的序列标注信息,确定出所述用户语句序列中的数个对话语句构成精选语句序列,包括:
步骤S1210、构造所述用户语句序列相对应的编码向量序列;
对于所述用户语句序列S=[A,B,C,D,…],可以先利用预设词表,对其中的各个对话语句A,B,C,D,…分别进行词嵌入,编码出各个对话语句相对应的句向量,例如,对于对话语句A获得的句向量形式如:A=[a1,a2…]。
然后,适应序列标注模型的入参要求所需,利用各个对话语句的句向量,构造出编码向量序列。沿用以上示例,获得形式如下的编码向量序列:
[a1,a2,…<sep>,b1,b2,…<sep>,c1,c2,…<sep>,d1,d2,…]
以上示例的编码向量序列中,分隔符<sep>是适应序列标注模型的输入格式要求而提供的,用于分隔不同对话语句,对于个别对输入有对齐格式要求的基础模型例如Bert模型,可以在以上示例的编码向量序列的前端部分插入所述基础模型所要求的补齐标识,例如Bert模型中的padding标识。对于一些基础模型例如LSTM模型,则无需提供所述的补齐标识。
步骤S1220、采用预设的序列标注模型,对所述编码向量序列进行序列标注,获得序列标注信息,所述序列标注信息包含对用户语句序列中各个对话语句的二分类结果;
如前所述,本申请的序列标注模型事先被训练至收敛状态,因而习得对编码向量序列进行序列标注的能力,序列标注模型中,通常采用Bert、LSTM之类的文本特征提取模型对编码向量序列进行特征提取,获得其深层语义信息相对应的特征表示,然后通过CRF之类的条件随机场模型,映射到各个对话语句相对应的二分类空间,获得每个对话语句相对应的二分类结果,所有的二分类结果便构成序列标注模型获得的与所述用户语句序列相对应的序列标注信息。序列标注信息与用户语句序列中的各对话语句一一对应提供二分类结果,通过这种位置映射关系,便可根据序列标注信息确定用户语句序列中的每一个对话语句是属于何种类别的标签。具体而言,每个对话语句相对应的二分类结果中,包含相应的对话语句映射到正向类别和负向类别相对应的分类概率,分类概率最大的类别即为对话语句相对应的类别,其中正向类别表示相应的对话语句被预测为精选对话语句,可以作为意图识别所需的基础素材,负向类别表示相应的对话语句被预测为冗余或噪声语句,不能作为意图识别所需的基础素材。
步骤S1230、根据所述序列标注信息查询所述用户语句序列,提取其中二分类结果表征正向类型的对话语句构造为精选语句序列。
由于序列标注信息中的二分类结果,与所述用户语句序列中的对话语句存在一一对应映射关系,不难理解,根据序列标注信息中二分类结果所指向的类别,便可确定各个对话语句相对应的类别标签,据此,便可将用户语句序列中属于正向类别的对话语句确定为精选对话语句,至于属于负向类别的对话语句,可以弃置。将所有精选对话语句按照原来的对话顺序有序组织,便可构造出精选语句序列。
根据以上实施例,通过对用户语句序列构造其相对应的编码向量序列,利用预先训练的序列标注模型所习得的识别精选对话语句的能力,可以快速高效地识别出用户语句序列中的精选对话语句,这些精选对话语句与用户的真实提问意图之间是强关联的,同时,原来用户语句序列中的冗余或噪声语句已经被弃置,因而,确保精选对话语句高度凝练地包含用户真实提问意图相对应的表达内容,根据精选语句序列进行意图识别,可使用户提问意图的识别更为精准。
同理可知,借助序列标注模型对用户语句序列进行对话语句的精选,无需另行人工设置所需精选的对话语句数量,无需改造意图识别模型,便可为意图识别模型获得标准化的输入,无需改造原有的问答系统,可大幅降低问答系统的维护和升级成本。
在本申请任意实施例的基础上,请参阅图3,采用预设的序列标注模型的步骤之前,包括:
步骤S2100、调用数据集中的单个训练样本,所述训练样本为样本语句序列,包括语义不相关的第一样本语句和第二样本语句,其中多个第一样本语句之间语义相连贯,所述数据集中关联该训练样本设置有标签序列,标签序列中对应样本语句序列包含区分第一样本语句和第二样本语句的二值化标签;
为了训练本申请的序列标注模型,可以预备一个数据集,然后逐个调数据集中的各个训练样本输入所述的序列标注模型对其进行训练,并采用与训练样本相对应的提供的标签序列作为监督标签计算当次迭代训练的损失值,根据损失值对序列标注模型实施梯度更新。
所述数据集中的训练样本,被构造为样本语句序列,所述的样本语句序列,由多个对话语句构成,其中,所述多个对话语句中,可以包含彼此语义不相关的第一样本语句和第二样本语句,例如“我要买手机壳”与“我要去喝酒”。可以视第一样本语句为用于表达用户意图相对应的对话语句,视第二样本语句为起干扰作用的冗余或噪声语句,以此选择样本语句。同一训练样本中通常可以包含多个第一样本语句和少量的第二样本语句,以突出第一样本语句用于表达意图的作用。不难理解,同一训练样本中,多个第一样本语句之间,采用语义相连贯的对话语句,更有助于塑造其表达用户意图的性质。但是多个第二样本语句之间则可以是彼此在语义上完全不相连贯的任意内容的语句。
一个实施例中,所述第一样本语句和第二样本语句均可从任意问答系统例如电商客服系统的聊天记录中选取,将同一会话中的所有由相应的用户提交的对话语句,按照顺序整理为第一样本语句,而从其他用户或同一用户其他内容不相关的会话中随机提取对话语句作为第二样本语句,将各个第二样本语句随机分布式插入多个第一样本语句构成新的排列集合,即获得一个训练样本的样本语句序列。
与训练样本相对应提供的标签序列,作为监督标签使用,所述序列标签中,包含对所述训练样本的样本语句序列中每一个样本语句是否应属精选对话语句的二值化标签,例如,对于样本语句序列:S′=[x1,A,B,x2,C,D,…],其中x1和x2表示第二样本语句,A,B,C,D,…表示第一样本语句,其对应的标签序列可以表示为:L=[0,1,1,0,1,1,…]。其中1表示相应的对话语句为第一样本语句,由于是优选的语句而可用做精选对话语句,属于正向类别;0表示相应的对话语句为第二样本语句,由于是起干扰作用的语句而不能用做精选对话语句,属于负向类别。
步骤S2200、构造所述单个训练样本的编码向量序列,所述编码向量序列中包含区分各个样本语句对应的向量的分隔符;
与本申请将序列标注模型用于线上推理的阶段相对应,在训练的阶段,也需按照相应的规则对各个用于训练的训练样本的样本语句序列进行编码,获得其相应的编码向量序列。例如,对于示例性的样本语句序列S′=[x1,A,B,x2,C,D,…],其相应的编码向量序列示例为:
[x11,x12…<sep>,a1,a2,…<sep>,b1,b2,…<sep>,x21,x22…<sep>,c1,c2,…〈sep〉,d1,d2,…]
其中,向量[x11,x12…]和向量[x21,x22…]对应第二样本语句x1和x2,向量[a1,a2…]、[b1,b2…]、[b1,b2…]、[b1,b2…]分别对应第一样本语句A,B,C,D。
与前文同理,以上示例的编码向量序列中,分隔符<sep>是适应序列标注模型的输入格式要求而提供的,用于分隔不同对话语句,对于个别对输入有对齐格式要求的基础模型例如Bert模型,可以在以上示例的编码向量序列的前端部分插入所述基础模型所要求的补齐标识,例如Bert模型中的padding标识。对于一些基础模型例如LSTM模型,则无需提供所述的补齐标识。
步骤S2300、将所述编码向量序列输入序列标注模型进行解码实现序列标注,获得序列标注信息,所述序列标注信息包含对样本语句序列中各个样本语句的二分类结果;
同理,编码向量序列被输入序列标注模型之后,先通过文本特征提取模型进行特征提取和解码,获得其深层语义相对应的特征向量,然后,在条件随机场的作用下,获得相应的序列标注信息,所述序列标注信息中,同理包含样本语句序列中各个对话语句相对应的标签,该标签可以采用条件随机场输入的二分类概率分布的形式表示,也可转换为二值化结果即以1或0表示,可灵活处理。
步骤S2400、根据所述单个训练样本的标签序列计算所述序列标注信息的损失值,根据该损失值对序列标注模型实施梯度更新,在序列标注模型未收敛时从数据集中调用下一训练样本将序列标注模型训练于收敛状态。
当获得单个训练样本相对应的序列标注信息后,利用该训练样本相对应的标签序列作为监督标签,便可计算出序列标注信息相对应的交叉熵损失,获得相应的损失值。然后,利用一个判断序列标注模型是否达到收敛状态的预设阈值,判断所述损失值是否达到该预设阈值,当其达到预设阈值时,表示序列标注模型已经达到收敛状态,可以终止训练任务,否则,表示序列标注模型并未收敛,此时,可根据该损失值对序列标注模型实施梯度更新,修正其权重参数,使其进一步逼近收敛,然后,从数据集中调用下一训练样本,继续对序列标注模型实施迭代训练,以此类推,直至将序列标注模型训练至收敛状态,便可将序列标注模型用于本申请中实施线上推理应用。
根据以上实施例可知,序列标注模型可以将对多个对话语句的识别转换为序列任务,因而可以不受所输入的样本语句序列中的对话语句数量的限制,但却能从整个样本语句序列中识别出精选语句序列,可进一步用于实施意图识别。在序列标注模型的训练过程中,可以从历史对话数据中选材用于构造训练样本,根据对话数据的时序关系组织第一样本语句,根据不同会话、不同用户组织第一样本语句所需结合的第二样本语句,从而构造出训练样本,并且,可以根据不同样本语句的来源而自动生成标签序列,全程无需人工干预,数据集的构造效率非常高,可以大大降低序列标注模型的实现成本,并且在问答系统的历史聊天记录的帮助下,也能够确保序列标注模型获得精准识别精选对话语句的能力,使其所选取的精选语句序列更具备表示用户真实提问意图,从而指导意图识别模型准确识别出用户的真实意图。
在本申请任意实施例的基础上,请参阅图4,调用数据集中的单个训练样本的步骤之前,包括:
步骤S3100、从预采集的对话数据中提取训练样本,获得其相对应的样本语句序列,其中包括语义连贯的多个第一样本语句;
所述对话数据可以从问答系统的历史聊天记录中提取,例如,从所服务的电商平台的独立站的客服系统的历史聊天记录中提取,以便采用这些训练样本训练获得相应的序列标注模型后,可以利用相应的独立站的商品信息的语义集中性,来确保序列标注模型所识别出的精选语句序列能够用于更精准地识别出用户真实意图。
从独立站的历史聊天记录中提取所述训练样本的原理,可参阅前一实施例所述,即采用同一用户的同一会话中时序连贯的多个对话语句甚至是全量对话语句作为第一样本语句,各个训练样本均可基于各个相应的会话预备第一样本语句。
步骤S3200、选取与所述对话数据语义不相关的文本中获取多个第二样本语句,第二样本语句的数量在与第一样本语句总量相对应的数值区间随机取整数值;
进而,可以采用其他用户的会话或相同用户的其他会话中产生的对话语句作为第二样本语句,或者随机从不同于当前训练样本的其他训练样本中获取第一样本语句作为当前训练样本的第二样本语句,一般理解,这样的第二样本语句与当前训练样本的第一样本语句在语义上是不相关的,即两者指向的意图各不相同,或者第二样本语句并不能完整表达某种用户意图,而第一样本语句则可以表达用户意图。
为了保持第一样本语句占据必要的信息份量,可以对同一训练样本中的第二样本语句的数量进行约束,使同一训练样本中,第二样本语句的总量不高于第一样本语句的总量,例如,在训练样本中第一样本语句总量M确定的情况下,按照如下公式确定训练样本的第二样本语句的总量N:
N=Floor(a*M)
其中,a取随机数,且服从(0,2)均匀分布,函数Floor表示向下取整。
根据以上原理可知,不难理解,一个训练样本中第二样本语句的数量始终被约束在(0,2M)的数值区间,并且为整数值,合理地约束了第一样本语句与第二样本语句的数量关系,避免过多的第二样本语句构成对有限的第一样本语句造成信息过度干扰,可确保模型训练时更易于收敛。
步骤S3300、按照自大到小的概率分布确定各个所述第二样本语句在样本语句序列中的插入顺序并插入到所述样本语句序列的相应位置,构造出数据集中的所述训练样本。
为了利用多个第一样本语句和多个第二样本语句构造获得训练样本,可以对各个第一样本语句与第二样本语句的排列关系进行重构,具体可先为训练样本中的全量样本语句获取归一化的随机权重,使其中各个样本语句的权重之和为1,例如采用Softmax()函数进行归一化获取所述的随机权重,从而使每个样本语句均有一个对应的分布概率,然后,按照自大到小的概率分布原则,根据分布概率自大到小,将各个样本语句重新排列,便可完成相应的训练样本的构造。
根据以上实施例可知,通过约束第二样本语句相对于第一样本语句的数量,以及约束第一样本语句与第二样本语句的排列关系,可以泛化训练样本,将这些训练样本用于训练所述的序列标注模型,可以将序列标注模型快速训练至收敛状态,降低训练成本,取得显著的训练成效。
在本申请任意实施例的基础上,请参阅图5,根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图,包括:
步骤S1311、构造所述精选语句序列的嵌入向量序列;
所述精选语句序列,可以按照本实施例选型的意图识别模型中的文本特征提取模型的入参所需,构造为嵌入向量序列,具体可以是针对精选语句序列中的各个对话语句进行独立分词并编制句向量,然后再将各个句向量按照聊天记录中的出现顺序拼接为嵌入向量序列,适应模型输入所需,可以在不同句向量之间插入分隔符。
步骤S1312、采用预设的意图识别模型,对所述嵌入向量序列进行特征提取后进行分类映射,获得映射到预设的知识库中各个提问意图的分类概率;
本实施例的意图识别模型,是一个分类模型,其由文本特征提取模型后接多分类器构成,其中文本特征提取模型选取诸如Bert、LSTM之类的适于提取文本深层语义信息的基础模型,由文本特征模型从所述嵌入向量序列中提取获得深层语义向量后,将其输入至多分类器中进行全连接并做分类映射,映射到分别对应知识库中的各个提问意图的类别中,生成各个类别相对应的分类概率。
当然,所述分类模型事先已经训练于收敛状态,使其习得根据输入的嵌入向量序列获得其相对应的分类结果的能力。
步骤S1313、将分类概率最大的提问意图作为目标提问意图。
不难理解,所述意图识别模型针对所述嵌入向量序列所获得的分类结果中,分类概率最大的类别所对应的提问意图,便是与精选语句序列相对应的真实提问意图,因而,将这个提问意图直接确定为目标提问意图,便可根据目标提问意图确定出相对应的答案文本。
根据以上实施例可知,本申请精选而得的精选语句序列,可以提供给意图识别模型进行分类映射,有效识别出用户真实意图,由于精选语句序列是从用户的当前会话的历史聊天记录的多个对话语句精选而得的,其语义表示更为凝练,因而,本实施例的意图识别模型通过分类映射便可快速确定出目标提问意图,实现对用户意图的精准判别,进而确定出有效的答案文本,使人机对话更具成效。
在本申请任意实施例的基础上,请参阅图6,根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图,包括:
步骤S1321、构造所述精选语句序列的嵌入向量序列;
所述精选语句序列,可以按照本实施例选型的意图识别模型中的文本特征提取模型的入参所需,构造为嵌入向量序列,具体可以是针对精选语句序列中的各个对话语句进行独立分词并编制句向量,然后再将各个句向量按照聊天记录中的出现顺序拼接为嵌入向量序列,适应模型输入所需,可以在不同句向量之间插入分隔符。
步骤S1322、采用预设的意图识别模型,对所述嵌入向量序列进行特征提取获得深层语义向量;
本实施例的意图识别模型,可以是仅包括文本特征提取模型,所述文本特征提取模型预先被接入分类器训练至收敛状态,使其习得从嵌入向量序列中准确提取出其深层语义信息的相对应的深层语义向量的能力。所述文本特征提取模型可以是前一实施例中的文本特征提取模型,但在线上推理阶段无需再携带多分类器。
在需要基于精选语句序列进行意图识别时,先采用本实施例的意图识别模型对其进行特征表示,通过提取其深层语义信息获得其相应的深层语义向量。同理,问答系统的知识库中的各个提问意图的标准问句及相似问句,也均采用本实施例的意图识别模型,事先提取其相应的深层语义向量并进行关联存储以备调用。
步骤S1323、计算所述深层语义向量与预设的知识库中的各个提问意图的深层语义向量的向量相似度,将相似度最大的提问意图确定为目标提问意图。
在需要确定所述精选语句序列相对应的目标提问意图时,利用所述精选语句序列的深层语义向量与所述知识库中各个提问意图,具体是提问意图中的标准问句和相似问句的深层语义向量计算数据距离,将数据距离转换为相似度表示,并且一种实施例中还可以将属于同一提问意图的各个相似度取均值获得单个相似度,由此便可获得精选语句序列与知识库中各个提问意图相映射的相似度。不难理解,其中,最大相似度所对应的提问意图,即是与精选语句序列相对应的目标提问意图。
在计算两个深层语义向量的数据距离时,可以采用余弦相似度算法、欧氏距离算法、皮尔逊相关系数算法、杰卡德系数算法等任意一种算法进行计算。
根据以上实施例,本申请精选而得的精选语句序列,可以经由本实施例的意图识别模型提取深层语义向量之后,与知识库中的各个提问意图的深层语义向量进行相似匹配,获得相似度最大的提问意图作为用户的目标提问意图。同理,由于精选语句序列是从用户的当前会话的历史聊天记录的多个对话语句精选而得的,其语义表示更为凝练,因而,在本实施例意图识别模型进行精准特征表示的帮助下,通过相似匹配可快速确定出目标提问意图,实现对用户意图的精准判别,进而确定出有效的答案文本,使人机对话更具成效。
请参阅图7,适应本申请的目的之一而提供一种问答系统应答装置,是对本申请的问答系统应答方法的功能化体现,该装置包括:语句调用模块1100、语句精选模块1200、意图识别模块1300,以及自动应答模块1400,其中,所述语句调用模块1100,用于获取当前会话的聊天记录中的用户语句序列,所述用户语句序列中包含用户在先提交的顺序连续的多个对话语句;所述语句精选模块1200,用于根据所述用户语句序列的序列标注信息,确定出所述用户语句序列中的数个对话语句构成精选语句序列;所述意图识别模块1300,用于根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图;所述自动应答模块1400,用于将所述目标提问意图相对应的答案文本输出至当前会话中。
在本申请任意实施例的基础上,所述语句调用模块1100,包括:最后接收单元,用于接收用户在当前会话中提交的最后一个对话语句,将其添加到当前会话的聊天记录中;回溯调用单元,用于基于最后一个对话语句回溯当前会话的聊天记录,倒序获取用户的多个对话语句;格式处理单元,用于将所述顺序连续的多个对话语句进行文本格式化预处理后构造为用户语句序列。
在本申请任意实施例的基础上,所述语句精选模块1200,包括:编码处理单元,用于构造所述用户语句序列相对应的编码向量序列;序列标注单元,用于采用预设的序列标注模型,对所述编码向量序列进行序列标注,获得序列标注信息,所述序列标注信息包含对用户语句序列中各个对话语句的二分类结果;提取构造单元,用于根据所述序列标注信息查询所述用户语句序列,提取其中二分类结果表征正向类型的对话语句构造为精选语句序列。
在本申请任意实施例的基础上,先于所述序列标注单元,包括:样本调用模块,用于调用数据集中的单个训练样本,所述训练样本为样本语句序列,包括语义不相关的第一样本语句和第二样本语句,其中多个第一样本语句之间语义相连贯,所述数据集中关联该训练样本设置有标签序列,标签序列中对应样本语句序列包含区分第一样本语句和第二样本语句的二值化标签;编码构造模块,用于构造所述单个训练样本的编码向量序列,所述编码向量序列中包含区分各个样本语句对应的向量的分隔符;序列预测模块,用于将所述编码向量序列输入序列标注模型进行解码实现序列标注,获得序列标注信息,所述序列标注信息包含对样本语句序列中各个样本语句的二分类结果;迭代更新模块,用于根据所述单个训练样本的标签序列计算所述序列标注信息的损失值,根据该损失值对序列标注模型实施梯度更新,在序列标注模型未收敛时从数据集中调用下一训练样本将序列标注模型训练于收敛状态。
在本申请任意实施例的基础上,先于所述样本调用模块,包括:样本提取模块,用于从预采集的对话数据中提取训练样本,获得其相对应的样本语句序列,其中包括语义连贯的多个第一样本语句;噪声引用模块,用于选取与所述对话数据语义不相关的文本中获取多个第二样本语句,第二样本语句的数量在与第一样本语句总量相对应的数值区间随机取整数值;噪声预置模块,用于按照自大到小的概率分布确定各个所述第二样本语句在样本语句序列中的插入顺序并插入到所述样本语句序列的相应位置,构造出数据集中的所述训练样本。
在本申请任意实施例的基础上,所述意图识别模块1300,包括:编码处理单元,用于构造所述精选语句序列的嵌入向量序列;意图分类单元,用于采用预设的意图识别模型,对所述嵌入向量序列进行特征提取后进行分类映射,获得映射到预设的知识库中各个提问意图的分类概率;目标确定单元,用于将分类概率最大的提问意图作为目标提问意图。
在本申请任意实施例的基础上,所述意图识别模块1300,包括:编码处理单元,用于构造所述精选语句序列的嵌入向量序列;特征提取单元,用于采用预设的意图识别模型,对所述嵌入向量序列进行特征提取获得深层语义向量;相似匹配单元,用于计算所述深层语义向量与预设的知识库中的各个提问意图的深层语义向量的向量相似度,将相似度最大的提问意图确定为目标提问意图。
在本申请任意实施例的基础上,所述自动应答模块1400,包括:查询抽取单元,用于查询获取预设的知识库中与所述目标提问意图相映射的答案集,随机抽取出答案集中的一个答案文本;推送显示单元,用于将所述答案文本推送至所述用户的终端设备以显示到会话界面中;数据存档单元,用于在所述终端设备回复确认信息后将所述答案文本添加到当前会话的聊天记录中。
为解决上述技术问题,本申请实施例还提供计算机设备。如图8所示,该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种商品搜索类目识别方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本申请的问答系统应答方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图7中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本申请的问答系统应答装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本申请任一实施例的问答系统应答方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被一个或多个处理器执行时实现本申请任一实施例所述方法的步骤。
本领域普通技术人员可以理解实现本申请上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等计算机可读存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请通过自动精选用户提交的在先对话语句,避免为用户真实意图的识别引入噪声信息,可提升问答系统中对用户真实意图的识别能力,从而精准理解用户意图进行准确的答复,可以提升问答系统的用户体验,降低后台运营成本,适于电商平台的独立站使用。
Claims (10)
1.一种问答系统应答方法,其特征在于,包括:
获取当前会话的聊天记录中的用户语句序列,所述用户语句序列中包含用户在先提交的顺序连续的多个对话语句;
根据所述用户语句序列的序列标注信息,确定出所述用户语句序列中的数个对话语句构成精选语句序列;
根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图;
将所述目标提问意图相对应的答案文本输出至当前会话中。
2.根据权利要求1所述的问答系统应答方法,其特征在于,获取当前会话的聊天记录中的用户语句序列,所述用户语句序列中包含用户在先提交的顺序连续的多个对话语句,包括:
接收用户在当前会话中提交的最后一个对话语句,将其添加到当前会话的聊天记录中;
基于最后一个对话语句回溯当前会话的聊天记录,倒序获取用户的多个对话语句;
将所述顺序连续的多个对话语句进行文本格式化预处理后构造为用户语句序列。
3.根据权利要求1所述的问答系统应答方法,其特征在于,根据所述用户语句序列的序列标注信息,确定出所述用户语句序列中的数个对话语句构成精选语句序列,包括:
构造所述用户语句序列相对应的编码向量序列;
采用预设的序列标注模型,对所述编码向量序列进行序列标注,获得序列标注信息,所述序列标注信息包含对用户语句序列中各个对话语句的二分类结果;
根据所述序列标注信息查询所述用户语句序列,提取其中二分类结果表征正向类型的对话语句构造为精选语句序列。
4.根据权利要求3所述的问答系统应答方法,其特征在于,采用预设的序列标注模型的步骤之前,包括:
调用数据集中的单个训练样本,所述训练样本为样本语句序列,包括语义不相关的第一样本语句和第二样本语句,其中多个第一样本语句之间语义相连贯,所述数据集中关联该训练样本设置有标签序列,标签序列中对应样本语句序列包含区分第一样本语句和第二样本语句的二值化标签;
构造所述单个训练样本的编码向量序列,所述编码向量序列中包含区分各个样本语句对应的向量的分隔符;
将所述编码向量序列输入序列标注模型进行解码实现序列标注,获得序列标注信息,所述序列标注信息包含对样本语句序列中各个样本语句的二分类结果;
根据所述单个训练样本的标签序列计算所述序列标注信息的损失值,根据该损失值对序列标注模型实施梯度更新,在序列标注模型未收敛时从数据集中调用下一训练样本将序列标注模型训练于收敛状态。
5.根据权利要求4所述的问答系统应答方法,其特征在于,调用数据集中的单个训练样本的步骤之前,包括:
从预采集的对话数据中提取训练样本,获得其相对应的样本语句序列,其中包括语义连贯的多个第一样本语句;
选取与所述对话数据语义不相关的文本中获取多个第二样本语句,第二样本语句的数量在与第一样本语句总量相对应的数值区间随机取整数值;
按照自大到小的概率分布确定各个所述第二样本语句在样本语句序列中的插入顺序并插入到所述样本语句序列的相应位置,构造出数据集中的所述训练样本。
6.根据权利要求1所述的问答系统应答方法,其特征在于,根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图,包括:
构造所述精选语句序列的嵌入向量序列;
采用预设的意图识别模型,对所述嵌入向量序列进行特征提取后进行分类映射,获得映射到预设的知识库中各个提问意图的分类概率;
将分类概率最大的提问意图作为目标提问意图。
7.根据权利要求1所述的问答系统应答方法,其特征在于,根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图,包括:
构造所述精选语句序列的嵌入向量序列;
采用预设的意图识别模型,对所述嵌入向量序列进行特征提取获得深层语义向量;
计算所述深层语义向量与预设的知识库中的各个提问意图的深层语义向量的向量相似度,将相似度最大的提问意图确定为目标提问意图。
8.一种问答系统应答装置,其特征在于,包括:
语句调用模块,用于获取当前会话的聊天记录中的用户语句序列,所述用户语句序列中包含用户在先提交的顺序连续的多个对话语句;
语句精选模块,用于根据所述用户语句序列的序列标注信息,确定出所述用户语句序列中的数个对话语句构成精选语句序列;
意图识别模块,用于根据所述精选语句序列进行提问意图识别,确定其相对应的目标提问意图;
自动应答模块,用于将所述目标提问意图相对应的答案文本输出至当前会话中。
9.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210806707.6A CN115146124A (zh) | 2022-07-08 | 2022-07-08 | 问答系统应答方法及其装置、设备、介质、产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210806707.6A CN115146124A (zh) | 2022-07-08 | 2022-07-08 | 问答系统应答方法及其装置、设备、介质、产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115146124A true CN115146124A (zh) | 2022-10-04 |
Family
ID=83413017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210806707.6A Pending CN115146124A (zh) | 2022-07-08 | 2022-07-08 | 问答系统应答方法及其装置、设备、介质、产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115146124A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116610790A (zh) * | 2023-07-18 | 2023-08-18 | 阿里健康科技(中国)有限公司 | 应答数据的获取方法、装置、设备和介质 |
CN117474043A (zh) * | 2023-12-27 | 2024-01-30 | 湖南三湘银行股份有限公司 | 一种基于训练模型的智能问答系统 |
-
2022
- 2022-07-08 CN CN202210806707.6A patent/CN115146124A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116610790A (zh) * | 2023-07-18 | 2023-08-18 | 阿里健康科技(中国)有限公司 | 应答数据的获取方法、装置、设备和介质 |
CN116610790B (zh) * | 2023-07-18 | 2023-10-10 | 阿里健康科技(中国)有限公司 | 应答数据的获取方法、装置、设备和介质 |
CN117474043A (zh) * | 2023-12-27 | 2024-01-30 | 湖南三湘银行股份有限公司 | 一种基于训练模型的智能问答系统 |
CN117474043B (zh) * | 2023-12-27 | 2024-04-02 | 湖南三湘银行股份有限公司 | 一种基于训练模型的智能问答系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112732911A (zh) | 基于语义识别的话术推荐方法、装置、设备及存储介质 | |
CN115146124A (zh) | 问答系统应答方法及其装置、设备、介质、产品 | |
CN111666400B (zh) | 消息获取方法、装置、计算机设备及存储介质 | |
CN110781277A (zh) | 文本识别模型相似度训练方法、系统、识别方法及终端 | |
CN111177310A (zh) | 电力服务机器人智能场景会话方法及装置 | |
CN113268610B (zh) | 基于知识图谱的意图跳转方法、装置、设备及存储介质 | |
CN116579339B (zh) | 任务执行方法和优化任务执行方法 | |
CN111858854B (zh) | 一种基于历史对话信息的问答匹配方法及相关装置 | |
CN111831801B (zh) | 一种人机对话方法及系统 | |
CN108628908B (zh) | 分类用户提问-回答界限的方法、装置和电子设备 | |
CN114972823A (zh) | 数据处理方法、装置、设备及计算机介质 | |
CN112632244A (zh) | 一种人机通话的优化方法、装置、计算机设备及存储介质 | |
CN111858898A (zh) | 基于人工智能的文本处理方法、装置及电子设备 | |
CN115292463A (zh) | 一种基于信息抽取的联合多意图检测和重叠槽填充的方法 | |
CN112463942A (zh) | 文本处理方法、装置、电子设备及计算机可读存储介质 | |
CN110633475A (zh) | 基于计算机场景的自然语言理解方法、装置、系统和存储介质 | |
CN111782793A (zh) | 智能客服处理方法和系统及设备 | |
CN111858875A (zh) | 智能交互方法、装置、设备及存储介质 | |
CN111368066B (zh) | 获取对话摘要的方法、装置和计算机可读存储介质 | |
CN115617975B (zh) | 针对少样本多轮对话的意图识别方法及装置 | |
CN110795531B (zh) | 一种意图识别方法、装置及存储介质 | |
CN112579666A (zh) | 智能问答系统和方法及相关设备 | |
CN112883183B (zh) | 构建多分类模型的方法、智能客服方法和相关装置及系统 | |
CN115688758A (zh) | 一种语句意图识别方法、装置和存储介质 | |
CN108897888B (zh) | 语音客服培训场景下的人机对练方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |