CN114328878A

CN114328878A - 一种信息回复方法、装置、介质

Info

Publication number: CN114328878A
Application number: CN202111675265.8A
Authority: CN
Inventors: 尤翔远; 刘子星; 沈懿忱; 周玉立; 梁嘉楠
Original assignee: Shuiyou Information Technology Co ltd
Current assignee: Shuiyou Information Technology Co ltd
Priority date: 2021-12-31
Filing date: 2021-12-31
Publication date: 2022-04-12

Abstract

本申请公开了一种信息回复方法、装置、介质，包括：获取用户输入的问题信息；调用语义相似度模型对问题信息进行向量化处理以获取向量信息，以便于完成后续的查找和处理工作，其中，语义相似度模型为根据历史对话训练的模型。从问题匹配库中查找与向量信息相似的历史问题信息，并获取与历史问题信息所对应的历史回答信息和/或参考文档，以为回复用户问题提供参考。根据历史回答信息和/或参考文档生成回复信息，以回复客户提问。由此可见，本申请所提供的信息回复方法，通过获取与问题信息相似的历史问答数据以生成回复信息，无需人工查找文档和回复，提高回复消息的速度并降低所需要的人力，从而以降低客户等待时间和提高客户的咨询体验。

Description

一种信息回复方法、装置、介质

技术领域

本申请涉及神经网络领域，特别是涉及一种信息回复方法、装置、介质。

背景技术

当在线客服(例如：财税线上客服)收到用户在线咨询的问题后，通常会根据自己对问题的理解到文档中查找答案，并将文档编辑后发送给用户。但这一过程会要消耗大量的人力，效率较低；且客服查找资料的速度较慢，导致客户等待时间过长，会影响客户的咨询体验。

由此可见，如何提供一种高效快速的信息回复方法，以降低客户等待时间和提高客户的咨询体验，是本领域技术人员亟需解决的问题。

发明内容

本申请的目的是提供一种信息回复方法、装置、介质，以为用户提供更好的咨询体验和降低人力的消耗。

为解决上述技术问题，本申请提供了一种信息回复方法，包括：

获取用户输入的问题信息；

调用语义相似度模型对所述问题信息进行向量化处理以获取向量信息，所述语义相似度模型为根据历史对话训练的模型；

从问题匹配库中查找与所述向量信息相似的历史问题信息，并获取与所述历史问题信息所对应的历史回答信息和/或参考文档；

根据所述历史回答信息和/或所述文档生成回复信息。

优选的，所述获取用户输入的问题信息包括：

获取所述问题信息；

对所述问题信息进行清洗和过滤，以获取用户关键问题。

优选的所述问题匹配库为根据历史问题信息、所述历史回答信息和所述参考文档预先构建的数据库，具体为：

对所述历史问题信息进行处理，以获取历史用户关键问题；

对所述历史问题信息、所述历史用户关键问题、所述历史回答信息和所述参考文档进行向量化处理以获取历史问题向量、历史关键问题向量、历史回答向量和/或参考文档向量；

计算各所述历史关键问题向量、所述历史回答向量间的相似度，并根据所述相似度确定各向量间的对应关系；

根据所述对应关系构建所述问题匹配库。

优选的，所述根据所述历史回答和所述参考文档生成回复信息包括：

将所述问题信息和所述参考文档输入阅读理解模型中，以生成所述回复信息。

优选的，所述阅读理解模型为根据所述问题匹配库中信息训练得到的模型，具体为：

获取所述问题匹配库中的所述历史关键问题向量、所述历史回答向量、所述参考文档向量；

将所述历史关键问题向量、所述历史回答向量、所述参考文档向量输入所述阅读理解模型以完成模型训练任务。

优选的，所述计算各所述历史关键问题向量、所述历史回答向量间的相似度，并根据所述相似度确定各向量间的对应关系，具体为：

计算各所述历史关键问题向量、所述历史回答向量间的余弦相似度，确定所述历史关键问题向量、所述历史回答向量的对应关系。

优选的，根据所述历史回答和所述参考文档生成回复信息的步骤后，还包括：

判断所述回复信息与所述问题信息的相似度是否大于阈值；

若大于所述阈值，将所述问题信息发送至所述用户；

若不大于所述阈值，则将用户转接至人工客服。

为解决上述技术问题，本申请还提供一种信息回复装置，其特征在于，包括：

第一获取模块，用于获取用户输入的问题信息；

第二获取模块，用于调用语义相似度模型对所述问题信息进行向量化处理以获取向量信息，所述语义相似度模型为根据历史对话训练的模型；

查找模块，用于从问题匹配库中查找与所述向量信息相似的历史问题信息，并获取与所述历史问题信息所对应的历史回答和/或参考文档；

生成模块，用于根据所述问题信息、所述历史回答信息和/或所述参考文档生成回复信息。

为解决上述技术问题，本申请还提供一种信息回复装置，包括存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现所述的信息回复方法的步骤。

为解决上述技术问题，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现所述的信息回复方法的步骤。

本申请提供了一种信息回复方法，包括：获取用户输入的问题信息；调用语义相似度模型对问题信息进行向量化处理以获取向量信息，以便于完成后续的查找和处理工作，其中，语义相似度模型为根据历史对话训练的模型。从问题匹配库中查找与向量信息相似的历史问题信息，并获取与历史问题信息所对应的历史回答信息和/或参考文档，以为回复用户问题提供参考。根据历史回答信息和/或参考文档生成回复信息，以回复客户提问。由此可见，本申请所提供的信息回复方法，通过获取与问题信息相似的历史问答数据以生成回复信息，无需人工查找文档和回复，提高回复消息的速度并降低所需要的人力，从而以降低客户等待时间和提高客户的咨询体验。

此外，本申请还提供了一种信息回复装置和介质，与上述方法对应，效果同上。

附图说明

为了更清楚地说明本申请实施例，下面将对实施例中所需要使用的附图做简单的介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例所提供的一种信息回复方法的流程图；

图2为本申请实施例所提供的一种信息回复装置的结构图；

图3为本申请实施例所提供的另一种信息回复装置的结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下，所获得的所有其他实施例，都属于本申请保护范围。

本申请的核心是提供一种信息回复方法、装置、介质。

为了使本技术领域的人员更好地理解本申请方案，下面结合附图和具体实施方式对本申请作进一步的详细说明。

图1为本申请实施例所提供的一种信息回复方法的流程图，如图1所示，该方法包括：

S10：获取用户输入的问题信息。

可以理解的是，本申请所提供的信息回复方法可以用于自动回复系统，也可以用于辅助查询系统，以为人工客服提供技术支持。当用于自动回复系统时，通过用户发送的消息直接获取问题信息；当用于辅助查询系统时，可以通过用户发送的消息直接获取问题信息，也可以由人工客服将问题消息复制至自动回复系统。本实施例以应用于自动回复系统的应用场景为例，对信息回复方法进行说明。

在具体实施中，系统获取到的问题信息中通常包括有效信息和无效信息，例如：用户问题信息为：“您好，跟您问一下有人给我们开了一张600块钱的普票，业务反馈丢失，需要怎么处理呢”，其中，有效信息为“600元普票丢失，怎么处理”，其他信息为无效信息。将全部信息输入后续的语义相似度模型中会因为数据过多，导致模型处理速度降低且使获取到的向量信息不准确，因此可以对获取到的问题信息进行预处理以去除问题信息中的无效信息。

可以理解的是，获取问题信息后还可以对问题信息进行初步处理，根据问题信息判断用户的意图是否为与客服闲聊并判断用户是否指定与人工客服沟通，若是，将用户转接至人工客服。

进一步的，为了防止误操作增加人工客服的无效工作量，当检测到用户与人工客服沟通的步骤后，还需要用户执行确定转接人工客服的操作。

S11：调用语义相似度模型对问题信息进行向量化处理以获取向量信息，语义相似度模型为根据历史对话训练的模型。

在具体实施中，由于历史文档数据过多，且数据类型较复杂，单纯依靠文本比对效率较低，且无法准确查找到与问题信息匹配的数据，为了解决这一问题，可以将用户所发送的问题信息和历史问题信息均向量化，并根据向量信息对问题信息查找历史问题信息，将与查找到的历史问题信息对应的历史回答作为回复用户的消息。

调用语义相似度模型对获取到的问题信息进行处理以获取向量信息，可以理解的是，本实施例中对语义相似度模型的类型不做限定，可以为romfomer-sim模型、simbert模型或simCSE模型，其中由于基于无监督对比学习的simCSE模型能够使用本领域历史问答数据和历史参考文档数据进行训练，相关性更强，所以采用simCSE模型作为语义相似度模型。

可以理解的是，为了提高语义相似度模型的准确率，在训练过程中，将历史用户问题信息作为训练数据对模型进行训练。

S12：从问题匹配库中查找与向量信息相似的历史问题信息，并获取与历史问题信息所对应的历史回答信息和/或参考文档。

可以理解的是，被解决的历史问题中，部分问题可以由客服人员依据自身知识自主回答，部分问题为客服人员查看参考文档后才能回答。因此，在获取历史回答时，若存在与历史回答相对应的参考文档，还需要同时获取参考文档，以更好的解决用户发送的问题。

问题匹配库为根据历史问题信息、历史回答信息和参考文档预先构建的数据库，在构建问题匹配库时，为了便于后续查询，可以对历史问题信息、历史回答信息和参考文档均进行向量处理，将所获得的向量信息存入问题匹配库中；也可以仅对历史问题信息进行向量化处理，由于历史问题信息和历史回答消息、参考文档间均存在对应关系，因此找到与问题信息的向量信息相似的历史问题信息即可获得历史回答信息和参考文档。

需要注意的是，通过将历史问题信息向量化以获得历史向量信息后，计算向量信息和历史向量信息间的余弦相似度，当余弦相似度高于预设值时，则确定该历史向量信息所对应的历史回答信息与获取到的用户问题消息相对应。

S13：根据历史回答信息和/或参考文档生成回复信息。

可以理解的是，若获取到的历史回答消息存在与其对应的参考文档，则根据历史回答信息和参考文档生成回复信息，若不存在参考文档，则根据历史回答信息生成回复消息。

需要注意的是，可以将历史回答信息和/或参考文档直接拼接后作为回复信息发送给用户，也可以对历史回答信息和/或参考文档进行处理，例如：将历史回答信息和/或参考文档向量化，使用阅读理解模型根据处理得到的向量化信息生成回复信息。

进一步的，为了防止回复信息不能满足用户需求，还需要计算回复信息与用户发送的问题信息的相似度，通常为余弦相似度，若相似度小于预设相似度，则表明该回复信息不能满足用户需求，则将用户转接至人工客服。

在具体实施中，通过以语义相似度模型获取历史问答信息中的有效信息，不需要通过人工标注，减少人力资源的浪费。

在本实施例中提供了一种信息回复方法，包括：获取用户输入的问题信息；调用语义相似度模型对问题信息进行向量化处理以获取向量信息，以便于完成后续的查找和处理工作，其中，语义相似度模型为根据历史对话训练的模型。从问题匹配库中查找与向量信息相似的历史问题信息，并获取与历史问题信息所对应的历史回答信息和/或参考文档，以为回复用户问题提供参考。根据历史回答信息和/或参考文档生成回复信息，以回复客户提问。由此可见，本申请所提供的信息回复方法，通过获取与问题信息相似的历史问答数据以生成回复信息，无需人工查找文档和回复，提高回复消息的速度并降低所需要的人力，从而以降低客户等待时间和提高客户的咨询体验。

在具体实施中，由于咨询问题的客户所发送的信息中除包含有效信息外，还包含大量的无效信息，例如：“在吗”、“您好”等，若对有效信息和无效信息均进行向量化操作，会降低处理效率，延长回复消息的时间。

为了解决这一问题，在上述实施例的基础上，获取用户输入的问题信息包括：

获取问题信息；

对问题信息进行清洗和过滤，以获取用户关键问题。

根据历史对话信息可以看出，用户所发送的内容多出现在对话的前三句中，因此，可以过滤前三句信息以减少无效信息。

获取所述问题信息后，根据预设的正则表达式和关键词对数据进行筛选，过滤用户的闲聊内容和与系统(例如：税务信息查询系统)无关的问题，以减少无效数据的量，提高回复用户的速度。此外，还可以对问题信息的文本长度进行设定，过滤掉不满足预设文本长度的问题信息，例如：当预设文本长度为5时，将用户发送的文本长度小于5的问题过滤掉。

可以理解的是，在训练语义识别模型时，还需要在完成数据筛选后，将历史问答消息中用户所发送的问题信息和客服人员的回答信息整合，形成一问一答得形式，以便于对语义识别模型进行训练。

在本实施例中，通过对用户所发送的问题信息进行清洗和过滤，减少需要处理的数据量，提高回复用户信息的效率。

在具体实施中，为了方便查找历史回答信息和参考文档，需要构建包含历史问题信息、历史回答信息和参考文档的问题匹配库。在上述实施例的基础上，构建问题匹配库的步骤具体为：

对历史问题信息进行处理，以获取历史用户关键问题；

对历史问题信息、历史用户关键问题、历史回答信息和/或参考文档进行向量化处理以获取历史问题向量、历史关键问题向量、历史回答向量和/或参考文档向量；

计算各历史关键问题向量、历史回答向量间的相似度，并根据相似度确定各向量间的对应关系；

根据对应关系构建问题匹配库。

在具体实施中，对获取到的历史用户问题信息进行筛选和清洗，以尽可能去除无效数据，获取历史用户关键问题，并将历史用户关键问题向量化以生成历史关键问题向量。

进一步的，为了便于查找，需要对历史回答信息和参考文档均进行向量化处理以获得历史回答向量和/或参考文档向量，其中，对参考文档进行向量化处理的过程中，需要将参考文档划分为不同段落，并将各段落向量化。通过计算各历史回答向量和各参考文档向量间的相似度(例如：余弦相似度)，找到和各历史回答最相似的文档段落，并记录历史回答和参考文档的对应关系，形成{对话，用户关键问题，历史回答信息，参考文档}的映射表。本实施例中的参考文档包括：税务文件和文章等。

可以理解的是，历史记录中客服人员对用户的回答可能为引用相关参考文档中的信息，也可能为客服人员自行判断或根据自身知识储备写出的回答信息，这种情况下，可能不存在与客服回答相对应的参考文档，在这种情况下，可以根据历史用户关键问题和历史回答信息的对应关系，生成{对话，用户关键问题，历史回答信息，参考文档＝None}形式的映射表

进一步的，为了提高使用问题匹配库时当前用户问题信息与历史信息匹配的效率，还可以将历史关键问题向量使用算法(例如：hnsw算法、fasis算法等空间向量计算方法)构建向量空间。

在具体实施中，可以利用获取到的映射表对语义分析模型进行训练，将{用户关键问题，历史回答信息，参考文档}作为训练数据，相较于传统方案，采用语义分析模型获取历史问题向量、历史关键问题向量、历史回答向量和/或参考文档向量，无需人工标注问题信息，减少构建问题匹配库过程所耗费的人力。

在本实施例中，通过历史问题向量、历史关键问题向量、历史回答向量和参考文档向量构建问题匹配库，提高查找和匹配历史回答信息和参考文档的效率。

在具体实施中，可以将历史回答信息和/或参考文档直接拼接后作为回复信息发送给用户，也可以对历史回答信息和/或参考文档进行处理后生成能够更好的解决用户问题的回复信息。

在上述实施例的基础上，根据历史回答和参考文档生成回复信息包括：

将问题信息和历史回答、参考文档输入阅读理解模型中，以生成回复信息。其中，阅读理解模型为根据问题匹配库中信息训练得到的模型，具体为：

获取问题匹配库中的历史关键问题向量、历史回答向量、参考文档向量；

将历史关键问题向量、历史回答向量、参考文档向量输入阅读理解模型以完成模型训练任务。

在具体实施中，将问题信息和历史回答、参考文档组成数据对，并将数据对输入阅读理解模型中以生成回复信息。例如：当用户问题为“有人给我们开了一张600块钱的普票，业务反馈丢失，需要怎么处理呢”时，其关键问题为：“增值税专用发票，丢失，怎样处理”，则获取问题匹配库中与其对应的文档：“《国家税务总局关于简化增值税发票领用和使用程序有关问题的公告》(国家税务总局公告2014年第19号)规定：“三、简化丢失专用发票的处理流程……”，将文档和用户问题均输入阅读理解模型中，以生成回复信息。

在具体实施中，本实施例所使用的阅读理解模型为bert为基础的阅读理解模型，其下游任务被修改为生成式任务。在模型训练过程中，可以将{用户关键问题，历史回答信息，文档}作为训练数据，以提高模型的准确性。可以理解的是，本实施例所提供的阅读理解模型适用于存在参考文档的情况和不存在参考文档的情况。

本实施例中，使用阅读理解模型根据问题信息和历史回答信息、参考文档进行处理以生成回复信息，使回复信息能够更好地解答用户的问题，提高用户满意度。

在数据挖掘中，经常需要计算样本之间的相似度，常用的相似度计算方法包括：欧式计算法、切比雪夫计算法，余弦相似度计算法等。

在上述实施例的基础上，计算各历史关键问题向量、历史回答向量间的相似度，并根据相似度确定各向量间的对应关系，具体为：

计算各历史关键问题向量、历史回答向量间的余弦相似度，确定历史关键问题向量、历史回答向量的对应关系。

余弦相似性通过测量两个向量的夹角的余弦值来度量它们之间的相似性。余弦值的范围在[-1,1]之间，值越趋近于1，代表两个向量的方向越接近；越趋近于-1，他们的方向越相反；接近于0，表示两个向量近乎于正交。在本实施例中，用于计算余弦相似的向量为文本中的词频向量。

在本实施例中，根据历史关键问题向量、历史回答向量中各关键词的出现频率建立两个向量，通过计算向量的余弦值判断历史关键问题向量、历史回答向量的相似性，从而确定历史关键问题向量、历史回答向量的对应关系。

在具体实施中，由于用户问题多种多样，生成的回复信息可能不能满足用户需求，影响用户的体验感。

为了解决这一问题，在上述实施例的基础上，根据历史回答和参考文档生成回复信息的步骤后，还包括：

判断回复信息与问题信息的相似度是否大于阈值；

若大于阈值，将问题信息发送至用户；

若不大于阈值，则将用户转接至人工客服。

可以理解的是，本实施例中所采用的相似度计算方法为余弦相似度计算法，能够有效的体现文本的相似程度。若相似度小于预设相似度，则表明该回复信息不能满足用户需求，则将用户转接至人工客服。

进一步的，当向用户发送回复信息后，若用户对回复信息不满意，可以将用户转接至人工客服。

在本实施例中，通过计算回复信息与用户发送的问题信息的相似度，判断该回复信息是否能够满足用户需求，若不能，将用户转接至人工客服，提高用户的使用体验。

在上述实施例中，对于信息回复方法进行了详细描述，本申请还提供信息回复装置对应的实施例。需要说明的是，本申请从两个角度对装置部分的实施例进行描述，一种是基于功能模块的角度，另一种是基于硬件的角度。

图2为本申请实施例所提供的一种信息回复装置的结构图，如图2所示，信息回复装置，包括：

第一获取模块10，用于获取用户输入的问题信息；

第二获取模块11，用于调用语义相似度模型对问题信息进行向量化处理以获取向量信息，语义相似度模型为根据历史对话训练的模型；

查找模块12，用于从问题匹配库中查找与所述向量信息相似的历史问题信息，并获取与所述历史问题信息所对应的历史回答信息和/或参考文档；

生成模块13，用于根据问题信息、历史回答信息和/或参考文档生成回复信息。

由于装置部分的实施例与方法部分的实施例相互对应，因此装置部分的实施例请参见方法部分的实施例的描述，这里暂不赘述。

本实施例提供了一种信息回复装置，包括：获取用户输入的问题信息；调用语义相似度模型对问题信息进行向量化处理以获取向量信息，以便于完成后续的查找和处理工作，其中，语义相似度模型为根据历史对话训练的模型。从问题匹配库中查找与向量信息相似的历史问题信息，并获取与历史问题信息所对应的历史回答信息和/或参考文档，以为回复用户问题提供参考。根据历史回答信息和/或参考文档生成回复信息，以回复客户提问。由此可见，本实施例所提供的信息回复装置，通过获取与问题信息相似的历史问答数据以生成回复信息，无需人工查找文档和回复，提高回复消息的速度并降低所需要的人力，从而以降低客户等待时间和提高客户的咨询体验。

图3为本申请另一实施例提供的信息回复装置的结构图，如图3所示，该信息回复装置包括：存储器20，用于存储计算机程序；

处理器21，用于执行计算机程序时实现如上述实施例获取用户问题信息的方法的步骤。

本实施例提供的信息回复装置可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。

其中，处理器21可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器21可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable LogicArray，PLA)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称中央处理器(CentralProcessing Unit，CPU)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器21可以集成有图像处理器(Graphics Processing Unit，GPU)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器21还可以包括人工智能(Artificial Intelligence，AI)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器20可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。本实施例中，存储器20至少用于存储以下计算机程序201，其中，该计算机程序被处理器21加载并执行之后，能够实现前述任一实施例公开的信息回复方法的相关步骤。另外，存储器20所存储的资源还可以包括操作系统202和数据203等，存储方式可以是短暂存储或者永久存储。其中，操作系统202可以包括Windows、Unix、Linux等。数据203可以包括但不限于历史回答信息、参考文档等。

在一些实施例中，信息回复装置还可包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。

本领域技术人员可以理解，图3中示出的结构并不构成对信息回复装置的限定，可以包括比图示更多或更少的组件。

本申请实施例提供的信息回复装置，包括存储器和处理器，处理器在执行存储器存储的程序时，能够实现如下方法：获取用户输入的问题信息；

根据所述历史回答信息和/或所述文档生成回复信息。

最后，本申请还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。

可以理解的是，如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上对本申请所提供的信息回复方法、装置、介质进行了详细介绍。说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是，在本说明书中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims

1.一种信息回复方法，其特征在于，包括：

获取用户输入的问题信息；

根据所述问题信息、所述历史回答信息和/或所述参考文档生成回复信息。

2.根据权利要求1所述的信息回复方法，其特征在于，所述获取用户输入的问题信息包括：

获取所述问题信息；

对所述问题信息进行清洗和过滤，以获取用户关键问题。

3.根据权利要求1所述的信息回复方法，其特征在于，所述问题匹配库为根据所述历史问题信息、所述历史回答信息和所述参考文档预先构建的数据库，具体为：

对所述历史问题信息进行处理，以获取历史用户关键问题；

对所述历史问题信息、所述历史用户关键问题、所述历史回答信息和/或所述参考文档进行向量化处理以获取历史问题向量、历史关键问题向量、历史回答向量和/或参考文档向量；

根据所述对应关系构建所述问题匹配库。

4.根据权利要求3所述的信息回复方法，其特征在于，所述根据所述历史回答和所述参考文档生成回复信息包括：

5.根据权利要求4所述的信息回复方法，其特征在于，所述阅读理解模型为根据所述问题匹配库中信息训练得到的模型，具体为：

6.根据权利要求3所述的信息回复方法，其特征在于，所述计算各所述历史关键问题向量、所述历史回答向量间的相似度，并根据所述相似度确定各向量间的对应关系，具体为：

7.根据权利要求1所述的信息回复方法，其特征在于，在所述根据所述历史回答和/或所述参考文档生成回复信息的步骤后，还包括：

判断所述回复信息与所述问题信息的相似度是否大于阈值；

若大于所述阈值，将所述问题信息发送至所述用户；

若不大于所述阈值，则将所述用户转接至人工客服。

8.一种信息回复装置，其特征在于，包括：

第一获取模块，用于获取用户输入的问题信息；

9.一种信息回复装置，其特征在于，包括存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至7任一项所述的信息回复方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的信息回复方法的步骤。