CN113792129A

CN113792129A - 一种智能会话方法、装置、计算机设备及介质

Info

Publication number: CN113792129A
Application number: CN202111087558.4A
Authority: CN
Inventors: 齐秀
Original assignee: Ping An Puhui Enterprise Management Co Ltd
Current assignee: China Unicom Online Information Technology Co Ltd
Priority date: 2021-09-16
Filing date: 2021-09-16
Publication date: 2021-12-14

Abstract

本发明涉及人工智能领域，公开了一种智能会话方法、装置、计算机设备及介质，方法包括：接收来自客户端的描述信息，并基于描述信息生成待识别的目标文本；将目标文本输入预先训练的专题抽取模型中，输出描述信息的专题结果；专题抽取模型基于多个专题结果训练生成，每个专题结果基于多条文本数据中的最长公共字符串生成；查询与描述信息的专题结果所关联的问题集合，并将问题集合发送到所述客户端，以使客户端在显示界面进行展示；当接收到客户端返回的针对问题集合的选择指令时，基于选择指令确定出目标问题；查询目标问题的答案，并将答案发送到所述客户端，以使客户端展示至所述显示界面。本申可提升智能客服的可信度，并提升用户的体验度。

Description

一种智能会话方法、装置、计算机设备及介质

技术领域

本发明涉及人工智能技术领域，特别涉及一种智能会话方法、装置、计算机设备及介质。

背景技术

近年来，智能客服或机器人客服发展的如火如荼，其中自然语言理解是智能客服或机器人客服最重要的一部分，让机器识别自然语言已经成为研究人员研究的热点。随着深度学习以及强化学习等技术的发展，研究人员越发渴望让机器能精确的识别自然语言。

现有技术中，智能客服或机器人客服主要基于关键词的匹配进行检索用户的问题，检索请求由用户以关键词的形式发出，而后匹配数据库中保存的问题，以关键词共现为命中条件返回检索结果。由于不同语义的语句中可能包含相同的关键词，从而使得检索到的答案与用户的问题出现不匹配情况，从而降低了机器理解自然语言的准确度。

发明内容

基于此，有必要针对机器理解自然语言的准确度低的问题，提供一种智能会话方法、装置、计算机设备及介质。

一种智能会话方法，方法包括：接收来自客户端的描述信息，并基于所述描述信息生成待识别的目标文本；将目标文本输入预先训练的专题抽取模型中，输出描述信息的专题结果；其中，专题抽取模型基于多个专题结果训练生成，每个专题结果基于多条文本数据中的最长公共字符串生成；查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示；当接收到客户端返回的针对所述问题集合的选择指令时，基于所述选择指令确定出目标问题；查询所述目标问题的答案，并将所述答案发送到所述客户端，以使所述客户端展示至所述显示界面。

在其中一个实施例中，基于描述信息生成待识别的目标文本，包括：确定描述信息的目标语义；基于目标语义生成符合预设规则的标准描述文本，并将标准描述文本确定为待识别的目标文本。

在其中一个实施例中，描述信息包括文字信息或语音信息；确定描述信息的目标语义，包括：当描述信息为文字信息时，获取文字信息中每个文字的笔画图像后得到笔画图像集合；计算笔画图像集合中每个笔画图像的矩阵参数；根据每个笔画图像的矩阵参数得到每个笔画图像的语义向量；基于每个笔画图像的语义向量确定出文字信息的目标语义；或者，当描述信息为语音信息时，将语音信息划分为多个音频数据段；逐一计算多个音频数据段中每个音频数据段对应的语义向量；基于每个音频数据段对应的语义向量确定出语音信息的目标语义。

在其中一个实施例中，按照以下步骤生成预先训练的专题抽取模型，包括：基于前缀树算法创建模型训练样本；采用卷积神经网络构建专题抽取模型；将模型训练样本数据输入专题抽取模型中进行训练，输出损失值；当损失值小于预设阈值时，生成专题抽取模型。

在其中一个实施例中，基于前缀树算法创建模型训练样本，包括：采集历史文本样本；其中，历史文本样本中存在多条文本数据；采用前缀树算法针对多条文本数据进行建模生成目标前缀树；统计目标前缀树上子节点或组合子节点的出现频次；根据子节点或组合子节点的出现频次确定出最长公共字符串，并将最长公共字符串确定为专题结果；继续执行采集历史文本样本的步骤，直到专题结果的数量到达预设数量时生成专题结果集合；预处理专题结果集合后生成模型训练样本。

在其中一个实施例中，当损失值小于预设阈值时，生成专题抽取模型，包括：当损失值大于等于预设阈值时，继续执行将模型训练样本数据输入专题抽取模型中进行训练的步骤；直到损失值小于预设阈值时，停止训练。

在其中一个实施例中，查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示，包括：采用关键字匹配算法从历史问题库中查询描述信息的专题结果所关联的问题集合；获取问题集合中各问题的优先级；基于优先级的高低顺序将各问题发送到所述客户端，以使所述客户端在显示界面进行展示；其中，获取问题集合中各问题的优先级，包括：获取问题集合中各问题指示的设置时刻；计算各问题指示的设置时刻与当前时刻的时长，得到各问题的设置时长；根据各问题的设置时长确定各问题的优先级。

一种智能会话装置，装置包括：目标文本生成模块，用于接收来自客户端的描述信息，并基于所述描述信息生成待识别的目标文本；专题结果输出模块，用于将目标文本输入预先训练的专题抽取模型中，输出描述信息的专题结果；其中，专题抽取模型基于多个专题结果训练生成，每个专题结果基于多条文本数据中的最长公共字符串生成；问题集合查询模块，用于查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示；目标问题确定模块，用于当接收到客户端返回的针对所述问题集合的选择指令时，基于所述选择指令确定出目标问题；答案展示模块，用于查询所述目标问题的答案，并将所述答案发送到所述客户端，以使所述客户端展示至所述显示界面。

一种计算机设备，包括存储器和处理器，存储器中存储有计算机可读指令，计算机可读指令被处理器执行时，使得处理器执行上述智能会话方法的步骤。

一种存储有计算机可读指令的介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述智能会话方法的步骤。

上述智能会话方法、装置、设备和介质，智能会话装置首先接收来自客户端的描述信息，并基于所述描述信息生成待识别的目标文本，然后将目标文本输入预先训练的专题抽取模型中，输出描述信息的专题结果；其中，专题抽取模型基于多个专题结果训练生成，每个专题结果基于多条文本数据中的最长公共字符串生成；其次查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示，再当接收到客户端返回的针对所述问题集合的选择指令时，基于所述选择指令确定出目标问题；最后查询所述目标问题的答案，并将所述答案发送到所述客户端，以使所述客户端展示至所述显示界面。由于本申请通过抽取出多条文本数据中公用的最长字符串作为专题结果进行模型训练，使得训练后的模型可以识别出待识别文本中的专题结果，同时根据专题结果可以查询到多个相关联的问题集合提供给用户选择，通过用户主动的二次选择可以使得反馈给用户的答案更加符合实际要求，从而提升了智能客服的可信度，并提升了用户的体验度。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1为本申请一个实施例中提供的智能会话方法的实施环境图；

图2为本申请一个实施例中计算机设备的内部结构示意图；

图3为本申请一个实施例中提供的智能会话方法的方法示意图；

图4为本申请一个实施例中提供的将多条文本数据建模后生成前缀树的示意图；

图5是本申请实施例提供的一种智能会话装置的装置示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

可以理解，本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件，但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。

图1为一个实施例中提供的智能会话方法的实施环境图，如图1所示，在该实施环境中，包括服务端110以及客户端120。

服务端110可以为服务器，该服务器具体可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器，例如为部署专题抽取模型的服务器设备。当需要进行智能会话时，服务端110接收来自客户端120的描述信息，并基于描述信息生成待识别的目标文本，服务端110将目标文本输入预先训练的专题抽取模型中，输出描述信息的专题结果，服务端110查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端120，以使所述客户端120在显示界面进行展示，服务端110当接收到客户端120返回的针对所述问题集合的选择指令时，服务端110基于所述选择指令确定出目标问题，服务端110查询目标问题的答案，并将所述答案发送到所述客户端120，以使所述客户端120展示至所述显示界面。

需要说明的是，客户端120可为智能手机、平板电脑、笔记本电脑、台式计算机等，但并不局限于此。服务端110以及客户端120可以通过蓝牙、USB(Universal Serial Bus，通用串行总线)或者其他通讯连接方式进行连接，本发明在此不做限制。

图2为一个实施例中计算机设备的内部结构示意图。如图2所示，该计算机设备包括通过系统总线连接的处理器、介质、存储器和网络接口。其中，该计算机设备的介质存储有操作系统、数据库和计算机可读指令，数据库中可存储有控件信息序列，该计算机可读指令被处理器执行时，可使得处理器实现一种智能会话方法。该计算机设备的处理器用于提供计算和控制能力，支撑整个设备的运行。该计算机设备的存储器中可存储有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器执行一种智能会话方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解，图2中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。其中，介质为一种可读的存储介质。

下面将结合附图3-附图4，对本申请实施例提供的智能会话方法进行详细介绍。该方法可依赖于计算机程序实现，可运行于基于冯诺依曼体系的智能会话装置上。该计算机程序可集成在应用中，也可作为独立的工具类应用运行。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

请参见图3，为本申请实施例提供了一种智能会话方法的流程示意图。如图3所示，本申请实施例的方法可以包括以下步骤：

S101，接收来自客户端的描述信息，并基于所述描述信息生成待识别的目标文本；

其中，客户端可以是电脑或者手机等用户终端设备，与此同时，用户终端设备中安装有智能会话的应用程序。描述信息包括文字信息和语音信息。待识别的目标文本是根据用户输入到客户端中的语音信息或者文字信息生成的。当输入的为语音时，通过语音转换文字组件将语音转换后生成目标文本。

在一种可能的实现方式中，当进行专题抽取的智能会话时，用户首先打开电脑或者手机，然后启动电脑或者手机上安装的智能会话应用程序，用户通过点击该应用程序的文字输入框输入描述信息，当描述信息全部输入成功后，用户通过点击“确定”或者“发送”按钮，当客户端检测到用户触发了“确定”或者“发送”按钮时，客户端获取用户输入的描述信息，并将该描述信息发送到服务端，服务端基于接收到的描述信息生成目标文本。

具体的，当描述信息为文字信息时，在基于描述信息生成待识别目标文本时，服务端首先获取文字信息中每个文字对应的笔画图像得到笔画图像集合，然后计算笔画图像集合中每个笔画图像的矩阵参数，再根据每个笔画图像的矩阵参数得到每个笔画图像的语义向量，其次基于每个笔画图像的语义向量确定出文字信息的目标语义，最后基于目标语义生成符合预设规则的标准描述文本，并将标准描述文本确定为待识别的目标文本。

在另一种可能的实现方式中，当进行专题抽取的智能会话时，用户首先打开电脑或者手机，然后启动电脑或者手机上安装的智能会话应用程序，用户通过点击该应用程序的语音录入功能，用户通过讲话时，语音录入功能实时录取来自用户的音频信息，当音频信息录入结束后，客户端获取音频信息，并将音频信息发送至服务端，服务端调用语音转换文字组件将接收到的音频信息转换为文字，生成目标文本。

具体的，当描述信息为语音信息时，在基于描述信息生成待识别目标文本时，首先接收输入的音频数据，然后将音频数据划分为多个音频数据段，再逐一计算多个音频数据段中每个音频数据段对应的语义向量，其次基于每个音频数据段对应的语义向量确定出语音信息的目标语义，最后基于目标语义生成符合预设规则的标准描述文本，并将标准描述文本确定为待识别的目标文本。

进一步地，在逐一计算每个音频数据段中所关联的文字时，首先获取每个音频数据段中的声音参数，其中，声音参数包括语音的频率、振幅以及相位，然后根据声音参数判断该语音为地方方言还是标准普通话，当为标准普通话时，根据声音参数从文字库获取每个声音参数的文字，计算该文字的语义向量。当为地方方言时，通过分析音频数据段确定方言类型，最后加载该类型对应的方言库，并从方言库中匹配该语音中每个声音参数对应的文字，计算该文字的语义向量。

S102，将目标文本输入预先训练的专题抽取模型中，输出描述信息的专题结果；其中，专题抽取模型基于多个专题结果训练生成，每个专题结果基于多条文本数据中的最长公共字符串生成；

其中，预先训练的专题抽取模型是可以识别出待识别目标文本的所属专题结果的数学模型。目标专题结果是多个问题可以归属的一个类型名。

通常，在训练专题抽取模型时，首先采集历史文本样本，该历史文本样本中存在预设数量的文本数据，然后采用前缀树算法针对多条文本数据进行建模生成目标前缀树，统计目标前缀树上子节点或组合子节点的出现频次，并根据子节点或组合子节点的出现频次确定出最长公共字符串，并将最长公共字符串确定为专题结果，继续执行采集历史文本样本的步骤，直到抽取的专题结果到达预设数量时，生成模型训练样本，采用卷积神经网络创建专题抽取模型，并将模型训练样本数据输入专题抽取模型中进行训练后输出损失值，当损失值或者训练次数到达预设损失值阈值以及预设训练次数时，生成预先训练的专题抽取模型。其中预设数量的文本数据中每条文本数据为用户咨询的每一条历史问题，记为query。

具体的，在采用前缀树算法针对预设数量的文本数据中每条文本数据(query)进行建模后抽取专题结果时，具体可分为以下几个步骤：

第一步：对于每个query,我们使用树的形式将其进行建模，首先将每个query拆解成字符的形式生成多个query的字符。其中，树的根节点不包含字符，除根节点之外每一个节点都只包含一个字符及其出现的频次。

第二步：从多个query的字符中确定出目标query的字符作为树的主干路，将目标query的字符连接起来生成主干路，然后从剩余query中逐个遍历每个query得到其字符，如果字符在主干路中存在，则将对应点的字符的值频次+1，如果不存在，则将对应新的节点添加至其主干路的分支路中。

第三步：抽取最长公共字串作为专题结果。如图4所示，投资账户-期货，投资账户-股票，投资账户-基金，其最长公共字符串“投资账户”出现了3次，“投”、“投资”、“投资账”也都出现了3次，最终我们可以通过频次筛选以及选取最长长度的条件，抽取大于一定频次的最长公共字串“投资账户”作为专题结果。

在本申请实施例中，首先基于前缀树算法创建模型训练样本，再采用卷积神经网络构建专题抽取模型，然后将模型训练样本数据输入专题抽取模型中进行训练，输出损失值，最后当损失值小于预设阈值时，生成专题抽取模型。

具体的，基于前缀树算法创建模型训练样本时，首先采集历史文本样本；其中，历史文本样本中存在多条文本数据，再采用前缀树算法针对多条文本数据进行建模生成目标前缀树，然后统计目标前缀树上子节点或组合子节点的出现频次，再根据子节点或组合子节点的出现频次确定出最长公共字符串，并将最长公共字符串确定为专题结果，最后继续执行采集历史文本样本的步骤，直到专题结果的数量到达预设数量时生成专题结果集合，并预处理专题结果集合后生成模型训练样本。

具体的，在预处理专题结果集合后生成模型训练样本时，当抽取的专题结果到达预设数量时，需要进行专题筛选才能生成模型训练样本。抽取到的专题可能会存在专题无法成词等情况，这里可以再通过分词工具对专题进行进一步筛选，对抽取专题进行分词，如果分词结果中存在单字，则该专题无效，例如“app上”，分词之后结果为“app”,“上”故其为无效专题。

进一步地，当损失值大于等于预设阈值时，继续执行将模型训练样本数据输入专题抽取模型中进行训练的步骤；直到损失值小于预设阈值时，停止训练。

在一种可行的实现方式中，将目标文本输入预先训练的专题抽取模型中，输出描述信息的专题结果。

S103，查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示；

其中，显示界面为客户端上的显示屏，问题集合是根据专题结果从历史问题库中通过关键字匹配获取的多个问题文本，该问题文本中具备与目标专题结果相同的多个字符。

在本申请实施例中，首先采用关键字匹配算法从历史问题库中查询描述信息的专题结果所关联的问题集合，然后获取问题集合中各问题的优先级，最后基于优先级的高低顺序将各问题发送到所述客户端，以使所述客户端在显示界面进行展示。

具体的，在获取问题集合中各问题的优先级时，首先获取问题集合中各问题指示的设置时刻，然后计算各问题指示的设置时刻与当前时刻的时长，得到各问题的设置时长，最后根据各问题的设置时长确定各问题的优先级。

在一种可能的实现方式中，当基于步骤S102得到专题结果后，加载历史问题库，采用关键字匹配算法从历史问题库中查询与该目标专题结果相同的多个历史问题，并将查询到的多个历史问题文本展示在客户端的界面上。

优选的，关键字匹配算法优先选用KMP算法实现。

具体的，将查询到的多个历史问题文本展示在客户端的界面上时，首先获取多个历史问题文本中每个历史问题文本的优先级，并按照优先级的高低顺序在显示界面上逐一或者批量展示历史问题文本。

进一步地，在获取多个历史问题文本中每个历史问题文本的优先级时，首先获取查询到的多个历史问题文本中每个问题文本指示的采集时间，然后根据指示的采集时间距离当前时刻的时长确定各历史问题文本的优先级。

S104，当接收到客户端返回的针对所述问题集合的选择指令时，基于所述选择指令确定出目标问题；

其中，选择指令是用户通过触发显示界面展示的问题而生成的命令。

通常，基于步骤S103可在显示界面展示查询到的历史问题文本，当用户看到展示的问题文本与自己想咨询的问题语义相同时，用户可以通过点击展示的问题生成触发指令。

在一种可能的实现方式中，当接收到用户针对显示界面展示的某个问题的触发指令时，通过该指令确定出用户触发的问题生成目标问题。当全部问题展示结束后，在预设时间段中没有收到用户针对显示界面的触发指令后，说明获取的问题集合中不存在用户咨询的问题，此时连接人工客服通道，并将步骤S101中的待识别目标文本发送至人工系统，当接收到人工系统的回复后，获取回复信息并将回复信息发送至显示界面进行展示。

S105，查询所述目标问题的答案，并将所述答案发送到所述客户端，以使所述客户端展示至所述显示界面。

在一种可能的实现方式中，在基于步骤S104确定出目标问题时，将该目标问题作为参数生成答案查询的数据库sql查询语言，执行该数据库SQL查询语言后，从问答知识库中查询该问题所对应的目标答案，最后将该目标答案通过有线或者无线的方式发送至客户端进行展示。

其中，问答知识库为用户预先根据每一个问题而设置的答案，问答知识库中存在全部常见问题关联的答案。

需要说明的是，本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中

在本申请实施例中，智能会话装置首先接收来自客户端的描述信息，并基于所述描述信息生成待识别的目标文本，然后将目标文本输入预先训练的专题抽取模型中，输出描述信息的专题结果；其中，专题抽取模型基于多个专题结果训练生成，每个专题结果基于多条文本数据中的最长公共字符串生成；其次查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示，再当接收到客户端返回的针对所述问题集合的选择指令时，基于所述选择指令确定出目标问题；最后查询所述目标问题的答案，并将所述答案发送到所述客户端，以使所述客户端展示至所述显示界面。由于本申请通过抽取出多条文本数据中公用的最长字符串作为专题结果进行模型训练，使得训练后的模型可以识别出待识别文本中的专题结果，同时根据专题结果可以查询到多个相关联的问题集合提供给用户选择，通过用户主动的二次选择可以使得反馈给用户的答案更加符合实际要求，从而提升了智能客服的可信度，并提升了用户的体验度。

下述为本发明装置实施例，可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节，请参照本发明方法实施例。

请参见图5，其示出了本发明一个示例性实施例提供的智能会话装置的结构示意图，应用于服务器。该智能会话装置可以通过软件、硬件或者两者的结合实现成为设备的全部或一部分。该装置1包括目标文本生成模块10、专题结果输出模块20、问题集合查询模块30、目标问题确定模块40、答案展示模块50。

目标文本生成模块10，用于接收来自客户端的描述信息，并基于所述描述信息生成待识别的目标文本；

专题结果输出模块20，用于将目标文本输入预先训练的专题抽取模型中，输出描述信息的专题结果；其中，专题抽取模型基于多个专题结果训练生成，每个专题结果基于多条文本数据中的最长公共字符串生成；

问题集合查询模块30，用于查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示；

目标问题确定模块40，用于当接收到客户端返回的针对所述问题集合的选择指令时，基于所述选择指令确定出目标问题；

答案展示模块50，用于查询所述目标问题的答案，并将所述答案发送到所述客户端，以使所述客户端展示至所述显示界面。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

在一个实施例中，提出了一种计算机设备，设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：接收来自客户端的描述信息，并基于所述描述信息生成待识别的目标文本；将目标文本输入预先训练的专题抽取模型中，输出描述信息的专题结果；其中，专题抽取模型基于多个专题结果训练生成，每个专题结果基于多条文本数据中的最长公共字符串生成；查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示；当接收到客户端返回的针对所述问题集合的选择指令时，基于所述选择指令确定出目标问题；查询所述目标问题的答案，并将所述答案发送到所述客户端，以使所述客户端展示至所述显示界面。

在一个实施例中，处理器执行基于描述信息生成待识别的目标文本时，具体执行以下操作：确定描述信息的目标语义；基于目标语义生成符合预设规则的标准描述文本，并将标准描述文本确定为待识别的目标文本。

在一个实施例中，处理器执行确定描述信息的目标语义时，具体执行以下操作：当描述信息为文字信息时，获取文字信息中每个文字的笔画图像后得到笔画图像集合；计算笔画图像集合中每个笔画图像的矩阵参数；根据每个笔画图像的矩阵参数得到每个笔画图像的语义向量；基于每个笔画图像的语义向量确定出文字信息的目标语义；或者，当描述信息为语音信息时，将语音信息划分为多个音频数据段；逐一计算多个音频数据段中每个音频数据段对应的语义向量；基于每个音频数据段对应的语义向量确定出语音信息的目标语义。

在一个实施例中，处理器执行以下步骤生成预先训练的专题抽取模型，具体执行以下操作：基于前缀树算法创建模型训练样本；采用卷积神经网络构建专题抽取模型；将模型训练样本数据输入专题抽取模型中进行训练，输出损失值；当损失值小于预设阈值时，生成专题抽取模型。

在一个实施例中，处理器执行基于前缀树算法创建模型训练样本时，具体执行以下操作：采集历史文本样本；其中，历史文本样本中存在多条文本数据；采用前缀树算法针对多条文本数据进行建模生成目标前缀树；统计目标前缀树上子节点或组合子节点的出现频次；根据子节点或组合子节点的出现频次确定出最长公共字符串，并将最长公共字符串确定为专题结果；继续执行采集历史文本样本的步骤，直到专题结果的数量到达预设数量时生成专题结果集合；预处理专题结果集合后生成模型训练样本。

在一个实施例中，处理器执行当损失值小于预设阈值时，生成专题抽取模型时，具体执行以下操作：当损失值大于等于预设阈值时，继续执行将模型训练样本数据输入专题抽取模型中进行训练的步骤；直到损失值小于预设阈值时，停止训练。

在一个实施例中，处理器执行查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示时，具体执行以下操作：采用关键字匹配算法从历史问题库中查询描述信息的专题结果所关联的问题集合；获取问题集合中各问题的优先级；基于优先级的高低顺序将各问题发送到所述客户端，以使所述客户端在显示界面进行展示；其中，获取问题集合中各问题的优先级，包括：获取问题集合中各问题指示的设置时刻；计算各问题指示的设置时刻与当前时刻的时长，得到各问题的设置时长；根据各问题的设置时长确定各问题的优先级。

在一个实施例中，提出了一种存储有计算机可读指令的介质，该计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：接收来自客户端的描述信息，并基于所述描述信息生成待识别的目标文本；将目标文本输入预先训练的专题抽取模型中，输出描述信息的专题结果；其中，专题抽取模型基于多个专题结果训练生成，每个专题结果基于多条文本数据中的最长公共字符串生成；查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示；当接收到客户端返回的针对所述问题集合的选择指令时，基于所述选择指令确定出目标问题；查询所述目标问题的答案，并将所述答案发送到所述客户端，以使所述客户端展示至所述显示界面。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性介质，或随机存储记忆体(RandomAccess Memory，RAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种智能会话方法，其特征在于，所述方法包括：

接收来自客户端的描述信息，并基于所述描述信息生成待识别的目标文本；

将所述目标文本输入预先训练的专题抽取模型中，输出所述描述信息的专题结果；其中，所述专题抽取模型基于多个专题结果训练生成，每个专题结果基于多条文本数据中的最长公共字符串生成；

查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示；

当接收到客户端返回的针对所述问题集合的选择指令时，基于所述选择指令确定出目标问题；

查询所述目标问题的答案，并将所述答案发送到所述客户端，以使所述客户端展示至所述显示界面。

2.根据权利要求1所述的方法，其特征在于，所述基于所述描述信息生成待识别的目标文本，包括：

确定所述描述信息的目标语义；

基于所述目标语义生成符合预设规则的标准描述文本，并将所述标准描述文本确定为待识别的目标文本。

3.根据权利要求2所述的方法，其特征在于，所述描述信息包括文字信息或语音信息；

所述确定所述描述信息的目标语义，包括：

当所述描述信息为文字信息时，获取所述文字信息中每个文字的笔画图像后得到笔画图像集合；

计算所述笔画图像集合中每个笔画图像的矩阵参数；

根据每个笔画图像的矩阵参数得到每个笔画图像的语义向量；

基于所述每个笔画图像的语义向量确定出所述文字信息的目标语义；

或者，

当所述描述信息为语音信息时，将所述语音信息划分为多个音频数据段；

逐一计算所述多个音频数据段中每个音频数据段对应的语义向量；

基于所述每个音频数据段对应的语义向量确定出所述语音信息的目标语义。

4.根据权利要求1所述的方法，其特征在于，按照以下步骤生成预先训练的专题抽取模型，包括：

基于前缀树算法创建模型训练样本；

采用卷积神经网络构建专题抽取模型；

将所述模型训练样本数据输入所述专题抽取模型中进行训练，输出损失值；

当所述损失值小于预设阈值时，生成专题抽取模型。

5.根据权利要求4所述的方法，其特征在于，所述基于前缀树算法创建模型训练样本，包括：

采集历史文本样本；其中，所述历史文本样本中存在多条文本数据；

采用前缀树算法针对所述多条文本数据进行建模生成目标前缀树；

统计所述目标前缀树上子节点或组合子节点的出现频次；

根据所述子节点或组合子节点的出现频次确定出最长公共字符串，并将所述最长公共字符串确定为专题结果；

继续执行所述采集历史文本样本的步骤，直到所述专题结果的数量到达预设数量时生成专题结果集合；

预处理所述专题结果集合后生成模型训练样本。

6.根据权利要求4所述的方法，其特征在于，所述当所述损失值小于预设阈值时，生成专题抽取模型，包括：

当所述损失值大于等于预设阈值时，继续执行所述将所述模型训练样本数据输入所述专题抽取模型中进行训练的步骤；

直到所述损失值小于预设阈值时，停止训练。

7.根据权利要求1所述的方法，其特征在于，所述查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示，包括：

采用关键字匹配算法从历史问题库中查询所述描述信息的专题结果所关联的问题集合；

获取所述问题集合中各问题的优先级；

基于所述优先级的高低顺序将所述各问题发送到所述客户端，以使所述客户端在显示界面进行展示；

所述获取所述问题集合中各问题的优先级，包括：

获取所述问题集合中各问题指示的设置时刻；

计算所述各问题指示的设置时刻与当前时刻的时长，得到各问题的设置时长；

根据所述各问题的设置时长确定所述各问题的优先级。

8.一种智能会话装置，其特征在于，所述装置包括：

目标文本生成模块，用于接收来自客户端的描述信息，并基于所述描述信息生成待识别的目标文本；

专题结果输出模块，用于将所述目标文本输入预先训练的专题抽取模型中，输出所述描述信息的专题结果；其中，所述专题抽取模型基于多个专题结果训练生成，每个专题结果基于多条文本数据中的最长公共字符串生成；

问题集合查询模块，用于查询与所述描述信息的专题结果所关联的问题集合，并将所述问题集合发送到所述客户端，以使所述客户端在显示界面进行展示；

目标问题确定模块，用于当接收到客户端返回的针对所述问题集合的选择指令时，基于所述选择指令确定出目标问题；

答案展示模块，用于查询所述目标问题的答案，并将所述答案发送到所述客户端，以使所述客户端展示至所述显示界面。

9.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如权利要求1至7中任一项权利要求所述智能会话方法的步骤。

10.一种存储有计算机可读指令的介质，其特征在于，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述智能会话的步骤。