CN112231453B

CN112231453B - 一种智能问答方法、装置、计算机设备及存储介质

Info

Publication number: CN112231453B
Application number: CN202011090438.5A
Authority: CN
Inventors: 李正兴; 邱东洋; 王智圣; 程任清; 魏重强; 蒋话
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-10-13
Filing date: 2020-10-13
Publication date: 2024-02-27
Anticipated expiration: 2040-10-13
Also published as: CN112231453A

Abstract

本申请实施例公开了一种智能问答方法、装置、计算机设备及存储介质。本申请实施例通过获取待检索的原始问题信息；从智能问答系统的知识库中提取与原始问题信息匹配的多个参考问题信息；确定处理单元的内核数量，根据内核数量创建多个处理进程；通过多个处理进程并行地对多个参考问题信息进行处理，得到每个参考问题信息与原始问题信息之间的相似度信息；基于相似度信息从多个参考问题信息中确定需要检索的目标问题信息，检索得到目标问题信息的答案信息；根据目标问题信息的答案信息输出原始问题信息对应的答案信息。该方案可以提高智能问答的效率。

Description

一种智能问答方法、装置、计算机设备及存储介质

技术领域

本申请涉及计算机技术领域，具体涉及一种智能问答方法、装置、计算机设备及存储介质。

背景技术

随着信息技术的高速发展，智能问答系统的应用越来越普遍。智能问答系统以一问一答形式，精确的定位用户所需要的提问知识，通过与用户进行交互，能够对海量无序语料信息进行划分和整理并建立系统的知识结构，提供高效准确的信息检索服务，满足各个领域的快速、精确地获取信息需求。在智能问答系统中，可以通过人工智能技术中的一种或多种深度学习模型和机器学习算法对用户输入的查询信息进行处理，从而输出查询结果。

相关技术中，智能问答系统中涉及模型推理计算，模型推理计算属于计算密集型任务，因而将模型推理计算集中在中央处理器(CPU，Central Processing Unit/Processor)上的一个处理器内核上通过多线程与多协程进行计算处理。

在对相关技术的研究和实践中，本申请的发明人发现，现有技术中，利用多核中央处理器中的一个处理器内核处理任务，使得中央处理器的一个处理器内核负载过大，造成计算阻塞，从而影响对问题信息的检索效率，导致智能问答的效率较低。

发明内容

本申请实施例提供一种智能问答方法、装置、计算机设备及存储介质，可以提高智能问答的效率。

本申请实施例提供了一种智能问答方法，包括：

获取待检索的原始问题信息；

从智能问答系统的知识库中提取与所述原始问题信息匹配的多个参考问题信息；

确定处理单元的内核数量，根据所述内核数量创建多个处理进程；

通过多个处理进程并行地对多个参考问题信息进行处理，得到每个参考问题信息与原始问题信息之间的相似度信息；

基于所述相似度信息从多个参考问题信息中确定需要检索的目标问题信息，以及检索得到所述目标问题信息的答案信息；

根据所述目标问题信息的答案信息输出所述原始问题信息对应的答案信息。

相应的，本申请实施例还提供了一种智能问答装置，包括：

获取模块，用于获取待检索的原始问题信息；

提取模块，用于从智能问答系统的知识库中提取与所述原始问题信息匹配的多个参考问题信息；

确定模块，用于确定处理单元的内核数量，根据所述内核数量创建多个处理进程；

处理模块，用于通过多个处理进程并行地对多个参考问题信息进行处理，得到每个参考问题信息与原始问题信息之间的相似度信息；

检索模块，用于基于所述相似度信息从多个参考问题信息中确定需要检索的目标问题信息，以及检索得到所述目标问题信息的答案信息；

输出模块，用于根据所述目标问题信息的答案信息输出所述原始问题信息对应的答案信息。

在一些实施例中，所述处理模块，包括：

创建子模块，用于为每个参考问题信息创建相应的计算任务，得到多个计算任务；

第一确定子模块，用于确定第一数量和第二数量，所述第一数量为处理进程的个数，所述第二数量为计算任务的个数；

第一分配子模块，用于若所述第一数量大于等于所述第二数量，则将所述第二数量的计算任务分别分配至不同的处理进程进行并行相似计算处理。

在一些实施例中，所述第一分配子模块，具体用于：

将每一计算任务分别分配至相应的目标处理进程，其中，一个计算任务对应一个目标处理进程；对于每一个目标处理进程，根据相似度模型和已分配的计算任务对应的待处理信息集合，计算每一参考问题信息与原始问题信息之间的相似度值，所述待处理信息集合包括所述参考问题信息以及所述原始问题信息。

在一些实施例中，所述处理模块，还包括：

第二确定子模块，用于若所述第一数量小于所述第二数量，则根据所述第一数量从计算任务中确定当前需要处理的当前计算任务、以及等待处理的待处理计算任务；

第二分配分配子模块，用于将当前计算任务分配至相应的目标处理进程进行处理，其中，一个当前计算任务对应一个目标处理进程；

处理子模块，用于当检测到目标处理进程处理完计算任务时，将待处理计算任务分配至目标处理进程进行相似计算处理。

在一些实施例中，所述第二确定子模块，具体用于：

获取每一计算任务的生成时间；从多个计算任务中，提取生成时间与当前时间的时间差值最大的所述第一数量的计算任务，得到当前计算任务；从多个计算任务中，提取除当前计算任务以外的计算任务，得到待处理计算任务。

在一些实施例中，所述处理模块，还包括：

第一获取子模块，用于获取每一待处理计算任务的计算时长；

移除子模块，用于将计算时长大于预设计算时长的待处理任务进行移除。

在一些实施例中，所述处理子模块，具体用于：

获取所有待处理计算任务的计算时长；根据所述计算时长对所有待处理计算任务进行排序，得到所有待处理计算任务的排序序列；按照所述排序序列将待处理任务分配至空闲的目标处理进程中进行相似计算处理。

在一些实施例中，所述提取模块，包括：

采集子模块，用于采集所述原始问题信息的特征信息；

筛选模块，用于从样本数据库中筛选出与所述特征信息相似度大于预设阈值的样本特征信息，得到多个目标特征信息，所述样本数据库中包括多个样本特征信息以及每个样本特征信息对应的样本问题信息；

第二获取子模块，用于获取目标特征信息对应的目标问题信息，得到与所述原始问题信息匹配成功的多个参考问题信息。

在一些实施例中，所述检索模块，包括：

比较子模块，用于对每一参考问题信息与原始问题信息的相似度值互相之间进行比较，得到比较结果；

第三确定子模块，用于根据所述比较结果确定与所述原始问题信息相似度值最大的参考问题信息，得到需要检索的目标问题信息。

在一些实施例中，该装置，还包括：

第四确定子模块，用于基于绑定关系确定每个处理进程绑定的处理内核，所述绑定关系包括处理进程与处理内核之间的绑定。

相应的，本申请实施例还提供了一种计算机设备，包括存储器，处理器及存储在储存器上并可在处理器上运行的计算机程序，其中，所述处理器执行本申请实施例任一提供的智能问答方法中的步骤。

相应的，本申请实施例还提供了一种存储介质，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行如上所述的智能问答方法中的步骤。

本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在存储介质中。终端的处理器从存储介质读取该计算机指令，处理器执行该计算机指令，使得该终端执行上述方面的各种可选实现方式中提供的智能问答方法。

本申请实施例通过获取待检索的原始问题信息；从智能问答系统的知识库中提取与原始问题信息匹配的多个参考问题信息；确定处理单元的内核数量，根据内核数量创建多个处理进程；通过多个处理进程并行地对多个参考问题信息进行处理，得到每个参考问题信息与原始问题信息之间的相似度信息；基于相似度信息从多个参考问题信息中确定需要检索的目标问题信息，检索得到目标问题信息的答案信息；根据目标问题信息的答案信息输出原始问题信息对应的答案信息。该方案可以将智能问答系统中，基于待检索的原始问题确定的多个计算任务分别分配至不同的处理进程进行并行处理，加快任务处理速度，从而提高智能问答的效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的智能问答系统的场景示意图。

图2为本申请实施例提供的一种智能问答方法的流程示意图。

图3为本申请实施例提供的另一种智能问答方法的流程示意图。

图4为本申请实施例提供的一种智能问答方法的智能问答交互界面示意图。

图5为本申请实施例中提供的一种智能问答方法的问题答案展示界面示意图。

图6为本申请实施例提供的一种智能问答装置的结构框图。

图7为本申请实施例提供的另一种智能问答装置的结构框图。

图8为本申请实施例提供的另一种智能问答装置的结构框图。

图9为本申请实施例提供的计算机设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供一种智能问答方法、装置、存储介质及终端。具体地，本申请实施例提供适用于计算机设备的智能问答装置。其中，该计算机设备可以为终端或服务器等设备，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请实施例在此不做限制。

请参阅图1，图1为本申请实施例所提供的智能问答系统的场景示意图，包括终端，终端可以连接通信网络，该通信网络，可以包括无线网络以及有线网络，其中无线网络包括无线广域网、无线局域网、无线城域网、以及无线个人网中的一种或多种的组合。网络中包括路由器、网关等等网络实体。

该智能问答系统可以包括终端或服务器等设备，如图1所示，终端获取待检索的原始问题信息，然后从智能问答系统的知识库中提取与原始问题信息匹配的多个参考问题信息，确定设备中处理单元的内核数量，根据内核数量创建多个处理进程，通过多个处理进程并行地对多个参考问题信息进行相似计算处理，得到每个参考问题信息与原始问题信息之间的相似度信息，然后基于相似度信息从多个参考问题信息中确定需要检索的目标问题信息，检索目标问题信息的答案信息，最后根据目标问题信息的答案信息输出原始问题信息对应的答案信息。该方案可以提高智能问答的效率。

需要说明的是，图1所示的智能问答系统的场景示意图仅仅是一个示例，本申请实施例描述的智能问答系统以及场景是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域普通技术人员可知，随着智能问答系统的演变和新业务场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

基于上述问题，本申请实施例提供第一种智能问答方法、装置、计算机设备及存储介质，可以有效提高服务器的智能问答速度。以下分别进行详细说明。需说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

本申请各个实施例中的智能问答方法，可以使用人工智能技术从智能问答系统的知识库中检索到原始问题信息对应的答案信息。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

具体的，本申请各个实施例中的智能问答方法，可以使用人工智能技术中的自然语言处理技术以及机器学习技术。比如，从智能问答系统的知识库中检索到原始问题信息对应的答案信息，使用了自然语言处理技术。又比如，在智能问答系统中基于训练模型进行计算，使用了机器学习技术。

自然语言处理(Nature Language processing，NLP))是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

本申请实施例提供一种智能问答方法，该方法可以由终端或服务器执行，本申请实施例以智能问答方法由终端执行为例来进行说明。

如图2所示，图2为本申请实施例提供的一种智能问答方法的流程示意图。该智能问答方法的具体流程可以如下：

101、获取待检索的原始问题信息。

在本申请实施例中，问题信息可以表示问题内容，是使用自然语言表达的问题，该问题内容可以是由文字和/或符号组成的一条文本语句。比如，问题内容可以为“这个游戏怎么玩？”等等。该问题内容还可以包括字母、数字等，比如，问题内容可以为“游戏a怎么玩？”等。

其中，原始问题信息则可以为当前需要检索的问题内容，比如，原始问题信息可以为用户当前输入的问题信息，用户可以通过语音或者文本的方式，在终端的输入界面输入原始问题信息。

例如，当检测到用户输入语句“这个游戏怎么玩？”时，可以获取到用户需要检索的原始问题信息为：“这个游戏怎么玩？”。

在一实施例中，终端可以安装语音识别应用，用户可以通过语音方式说出问题，终端可以通过该语音识别应用对用户输入的语音进行识别，得到原始问题信息。

在一实施例中，终端可以提供输入界面，用户可以在输入界面输入问题。

102、从智能问答系统的知识库中提取与原始问题信息匹配的多个参考问题信息。

其中，智能问答系统是将积累的无序语料信息，进行有序和科学的整理，并建立基于知识的分类模型，这些分类模型可以指导新增加的语料咨询和服务信息，提高信息处理的自动性，基于对常见问题及其解答，整理为规范的问答库形式，以支撑各种形式问题的智能问答。

其中，智能问答系统的知识库可以包括多个样本问句和多个样本答案，一个样本问句可以对应一个样本答案，也可以对应多个样本答案。其中，样本问句可以为预先设定的问句，样本答案则可以为与样本问句关联的答案。

比如，知识库中可以包括：样本问句A、样本问句B、样本问句C以及样本问句D，样本答案A、样本答案B、样本答案C以及样本答案D，其中，样本问句A对应样本答案A，样本问句B对应样本答案B，样本问句C对应样本答案C，样本问句D对应样本答案D。

其中，参考问题信息可以为与原始问题信息相似的问题信息。为了从智能问答系统的知识库中检索出与原始问题信息最匹配的答案信息，可以先从智能问答系统的知识库的多个样本问题信息中匹配出与原始问题信息相似的参考问题信息。具体的，可以通过将原始问题信息与知识库中的样本问题信息进行匹配，根据匹配成功的样本问题信息可以从知识库中确定该原始问题信息的参考问题信息。

在一些实施例中，从知识库中查找出与原始问题信息相似的参考问题信息，为了保证参考问题信息与原始问题信息的相似性。步骤从智能问答系统的知识库中提取与所述原始问题信息匹配的多个参考问题信息，可以包括：

采集原始问题信息的特征信息；

从样本数据库中筛选出与所述特征信息相似度大于预设阈值的样本特征信息，得到多个目标特征信息；

获取目标特征信息对应的目标问题信息，得到与原始问题信息匹配成功的多个参考问题信息。

其中，多个参考问题信息可以为至少两个参考问题信息。

其中，特征信息为表征问题信息特点的信息，特征信息可以包括多种，比如，特征信息可以包括关键词、语义或者词性等等。通过不同的特征提取方式可以得到不同的特征信息，例如，可以对原始问题信息进行关键词提取预处理，可以得到原始问题信息的特征信息为关键词；或者可以对原始问题信息进行语义分析预处理，可以得到原始问题信息的特征信息为语义；又或者可以对原始问题信息进行词性判断预处理，可以得到原始问题信息的特征信息为词性等。在本申请实施例中，可以通过任一特征提取方式对原始问题信息进行特征提取，进而得到在该特征提取方式下原始问题信息的特征信息。

在自然语言中，意义最小的单位是单词，其次是句子，再是段落，最后是一整篇文章。自然语言处理中，可以包括多种特征提取方式，比如，可以通过提取单词的方式进行文本特征提取。

具体的，通过自然语言处理技术中的语句预处理来提取原始问题信息的特征信息可以为：采集原始问题信息中包含的多个单词，确认每个单词在该原始问题信息中出现的次数，可以得到每个单词的出现频率，基于原始问题信息中每个单词的出现频率，可以得到原始问题信息对应的特征信息。

在本申请实施例中，通过自然语言处理技术中的语句预处理来提取原始问题信息的特征信息，从而从样本数据库中查询出与原始问题信息相似的参考问题信息，可以缩小检索范围，进而提高查询效率。

其中，样本数据库中可以包括多个样本特征信息以及每个样本特征信息对应的样本问题信息，也即样本数据库包括多个样本特征信息和多个样本问题信息，以及样本特征信息与样本问题信息之间的关联关系。

其中，样本问题信息可以为智能问答系统中预先设定的问题信息，在不同应用场景的智能问题系统中，样本问题信息可能存在不同。比如，在游戏应用场景中的智能问答系统中，样本问题信息可以为预测用户对游戏可能进行检索为问题信息。获取每一样本问题信息的特征信息，比如，特征信息可以为关键词，则可以提取样本问题信息对应的关键词信息，建立每一样本问题信息与该样本问题信息的关键词信息之间的关联关系，将所有样本问题信息以及样本问题信息的特征信息进行存储，可以得到样本数据库。

在一实施例中，为了提升匹配效率，在确定原始问题信息的特征信息，可以将样本数据库中的样本特征信息与原始问题信息的特征信息进行相似度比对，得到每个样本特征信息与原始问题信息的特征信息的相似度值。然后筛选出与原始问题信息的特征信息的相似度值大于预设阈值的样本特征信息。然后基于样本特征信息与样本问题信息的关联关系，从数据库中找到大于预设阈值的样本特征信息对应的问题信息，即得到原始问题信息的参考问题信息，其中，在样本数据库中，至少可以包括两个与原始问题信息相似的参考问题信息。通过将原始问题信息的特征信息与样本数据库中的样本特征信息进行匹配，可以快速查找出与原始问题信息相似的参考问题信息，提高问题信息的匹配效率。

103、确定处理单元的内核数量，根据内核数量创建多个处理进程。

其中，处理单元可以为具有计算处理功能的单元或模块，比如，设备中央处理器(CPU，Central Processing Unit/Processor)。CPU是电子计算机的主要设备之一，电脑中的核心配件。其功能主要是解释计算机指令以及处理计算机软件中的数据。电脑中所有操作都由CPU负责读取指令，对指令译码并执行指令的核心部件。在一些实施例中，处理器还可以为图形处理器(Graphics Processing Unit，GPU)，张量处理单元(TPU，是一种定制化的ASIC芯片，专门用于机器学习工作负载)等等其他处理器。

其中，内核数量指的是中央处理器的内核的个数，可以为一个或者多个等。

核心(Core)又称为内核，是CPU最重要的组成部分。CPU中心那块隆起的芯片就是核心，是由单晶硅以一定的生产工艺制造出来的，CPU所有的计算、接受/存储命令、处理数据都由核心执行。各种CPU核心都具有固定的逻辑结构，一级缓存、二级缓存、执行单元、指令级单元和总线接口等逻辑单元都会有科学的布局。

例如，处理器可以为单核处理器，则表示处理器包括一个内核；又或者，处理器可以为四核处理器，则表示处理器可以包括四个内核。

其中，处理进程可以表示的是程序的运行，具体的，处理进程可以用来对程序中的任务进行处理。进程(Process)是计算机中的程序关于某数据集合上的一次运行活动，是系统进行资源分配和调度的基本单位，是操作系统结构的基础。

在一实施例中，在确定处理单元的内核数量后，可以根据内核数量确定处理进程数量，处理进程数量可以小于或者等于内核数量，比如，处理单元的内核数量可以为4，那么处理进程数量可以为4，则可以创建4个处理进程，相关技术中，在智能问答系统中仅通过一个处理单元的内核上创建的处理进程对智能问答任务进行处理，而在本申请实施例中，通过在处理单元的不同内核上分别创建处理进程，可以通过多个处理单元内核上的处理进程对智能问答的多个任务并行进行处理，可以提高处理单元中每个内核的资源利用率，同时，提高智能问答的任务处理效率。

在一些实施例中，在步骤根据所述内核数量创建多个处理进程之后，还可以包括：

获取每一处理单元内核的内核标识以及每一处理进程的进程标识；

基于内核标识与进程标识，将处理单元内核与处理进程对应进行绑定。

其中，内核标识可以用来区分同一处理单元的不同内核，在同一处理单元中，不同的内核可以对应不同的内核标识。比如，处理单元可以包括4个内核，这4个内核的内核标识可以分别为：1、2、3、4。

其中，进程标识(PID)，也即处理进程的编号。在程序运行时，每个进程都有一个编号，即PID。PID是可以重用，当进程终止并被回收以后，其PID就可以为其它进程所用。进程的PID由系统内核根据延迟重用算法生成，以确保新进程的PID不同于最近终止进程的PID。

其中，延迟重用算法指的是，当处理进程处理完任务后，释放存储空间，则系统会将该处理进程对应的进程标识进行回收，并将回收的进程标识存储至进程标识库，在进程标识库中的所有进程标识按照回收时间进行排序。当需要创建新的处理进程时，则从该进程标识库中获取回收时间最早的进程标识，作为新的处理进程的进程标识，以确保新进程的PID不同于最近终止进程的PID，防止将新进程误认为是使用同一个ID的已经终止的前进程。

在确定内核的内核标识，以及处理进程的进程标识后，可以将处理进程绑定至内核上，比如，处理单元可以包括4个内核，这4个内核的内核标识分别为：1、2、3、4；处理进程可以包括4个，这4个处理进程的进程标识可以分别为：5、6、7、8，基于内核标识与进程标识将处理进程与内核进行绑定：将处理进程5绑定在内核1上，将处理进程6绑定在内核2上，将处理进程7绑定在内核3上，将处理进程8绑定在内核4上等，将处理进程与内核进行绑定，表示处理进程在处理任务过程中可以利用该处理进程绑定的内核中的资源来执行任务处理操作。

当然，在一实施例中。还可以将一个处理进程与多个内核进行绑定，当与处理进程绑定的其中一个内核处于负载繁忙状态时，可以选择其他绑定的内核来协助执行任务处理。

在相关技术中，在对参考问题信息进行相似计算处理时，仅利用处理单元的一个内核进行处理，当计算量较大时，通过一个内核进行处理会导致该内核出现计算阻塞，影响计算处理的效率，同时，其他内核处于空闲状态，造成了处理单元中的内核资源浪费。因此，本申请方案提出创建多个处理进程，将每个处理进程与处理单元的内核进行绑定，可以通过多个处理进程并行处理计算任务，以实现处理单元的多个内核资源的共同使用，保证处理单元的内核资源的高效利用率，进而提高计算处理的效率。

104、通过多个处理进程并行地对多个参考问题信息进行处理，得到每个参考问题信息与原始问题信息之间的相似度信息。

在一些实施例中，步骤通过多个处理进程并行地对多个参考问题信息进行处理，可以包括：

为每个参考问题信息创建相应的计算任务，得到多个计算任务；

确定第一数量和第二数量；其中，第一数量可以为处理进程的个数，第二数量可以为计算任务的个数。

若第一数量大于等于第二数量，则将第二数量的计算任务分别分配至不同的处理进程进行并行相似计算处理。

其中，计算任务可以是计算参考问题信息与原始问题信息的相似度，则每个参考问题信息对应的计算任务可以是计算该参考问题信息与原始问题信息的相似度。通过计算原始问题信息与每一参考问题信息的相似度，可以从多个参考问题信息中确定与原始问题信息最相似的问题信息，以便于后续检索出与原始问题信息最匹配的答案信息，提高问题检索的准确性。

例如，原始问题信息可以为：“今天天气如何”，参考问题信息可以为：“今天下雨了吗”，“今天出太阳了吗”，“今天起风了吗”等，则基于原始问题信息与参考问题信息可以得到计算任务：计算“今天天气如何”与“今天下雨了吗”的相似度，计算“今天天气如何”与“今天出太阳了吗”的相似度，计算“今天天气如何”与“今天起风了吗”的相似度。

在一实施例中，当第一数量大于或者等于第二数量时，也即处理进程的个数大于或者等于计算任务的个数，则可以将第二数量的计算任务分别分配至不同的处理进程进行并行相似计算处理。

例如，第一数量可以为4，第二数量可以为3，则表示处理进程的数量大于计算任务的数量，此时，可以将3个计算任务分别分配至不同的处理进程进行并行计算处理。

在一些实施例中，步骤将第二数量的计算任务分别分配至不同的处理进程进行并行相似计算处理，可以包括：

将每一计算任务分别分配至相应的目标处理进程；

对于每一目标处理进程，根据相似度模型和已分配的计算任务对应的待处理信息集合，计算每一参考问题信息与原始问题信息之间的相似度值。

其中，一个计算任务可以对应一个目标处理进程，比如，计算任务可以包括：第一计算任务、第二计算任务和第三计算任务，处理进程可以包括：第一处理进程、第二处理进程、第三处理进程和第四处理进程，则可以将第一计算任务分配至第一处理进程，将第二计算任务分配至第二处理进程，将第三计算任务分配至第三处理进程，则可以确定第一计算任务、第二计算任务、第三计算任务对应的目标处理进程分别为第一处理进程、第二处理进程、第三处理进程。

其中，相似度模型，是将多个样本问题信息组合和相应的相似度作为训练集，通过多任务迭代训练对基础语言模型的模型参数进行调整后得到的。其中，样本问题信息组合指的是原始问题信息与参考问题信息组成的问题信息组合。

其中，基础语言模型，是预训练的语言模型，也即预先用大量的数据及训练好的模型，在实际使用时，可以根据不同的模型需求，使用训练集对预训练的语言模型进行模型微调，得到实际需要的模型。

在一实施例中，基础语言模型可以为BERT(BERT-base)模型。BERT模型是基于中文维基百科数据训练得到，属于通用领域的预训练语言模型。为了使得模型更加匹配原始问题信息，可以在BERT模型上加入训练集继续进行训练。其中，训练集中可以包括多个样本问题信息组合和相应的相似度。

其中，待处理信息集合包括一个参考问题信息和原始问题信息。通过该待处理信息集合对应的目标处理进程，将待处理信息集合添加至相似度模型中进行训练，可以得到该待处理信息集合中的参考问题信息与原始问题信息的相似度值。

例如，待处理信息集合可以包括：第一信息集合(“今天天气如何”，“今天下雨了吗”)，第二信息集合(“今天天气如何”，“今天出太阳了吗”)，第三信息集合(“今天天气如何”，“今天起风了吗”)，将每一信息集合分别在对应的目标处理进程中进行相似度模型训练，可以得到每个处理进程的处理结果，也即每个参考问题信息与原始问题信息的相似度值。

在一些实施例中，步骤通过多个处理进程并行地对多个参考问题信息进行处理，还可以包括：

若第一数量小于第二数量，则根据第一数量从计算任务中确定当前需要处理的当前计算任务、以及等待处理的待处理计算任务；

将当前计算任务分配至相应的目标处理进程进行处理，其中，一个当前计算任务对应一个目标处理进程；

当检测到目标处理进程处理完计算任务时，将待处理计算任务分配至目标处理进程进行相似计算处理。

其中，相似计算处理是指计算原始问题信息与参考问题信息的相似度值。

当第一数量小于第二数量时，也即处理进程的个数小于计算任务的个数，无法同时将第二数量的计算任务分别分配至不同的处理进程进行并行相似计算处理，可以先将第一数量的计算任务分配至不同的处理进程进行并行相似计算处理，然后将剩余等待处理的任务确定为待处理任务。通过将第一数量的计算任务分配至第一数量的处理进程并行进行相似计算处理，可以避免将多个计算任务分配至处理进程时出现任务分配不均的情况，提高任务分配效率。

在一些实施例中，步骤根据第一数量从计算任务中确定当前需要处理的当前计算任务、以及等待处理的待处理计算任务，可以包括：

获取每一计算任务的生成时间；

从多个计算任务中，提取生成时间与当前时间的时间差值最大的所述第一数量的计算任务，得到当前计算任务；

从多个计算任务中，提取除当前计算任务以外的计算任务，得到待处理计算任务。

其中，计算任务的生成时间可以为该计算任务对应的待处理信息集合的创建时间，也即参考问题信息与原始问题信息进行组合的时间。

进一步的，根据计算任务的生成时间，确定当前需要处理的当前计算任务，以及等待处理的待处理计算任务。

为了便于理解，现以表1为例，进行举例说明。

/>

表1

在表1中，计算任务可以包括：计算任务A、计算任务B、计算任务C、计算任务D和计算任务E，每一计算任务右侧对应该计算任务的生成时间。比如，当前处理进程的个数可以为3，计算任务的个数可以为5，则可以确定当前可处理的计算任务(也即当前计算任务)的数量为3，从所有计算任务中，提取生成时间距离当前时间最远(也即生成时间最早)的3个计算任务，即可以得到当前计算任务，通过表2中的每一计算任务的生成时间，可以确定当前计算任务可以为：计算任务A、计算任务B和计算任务C，则剩余的计算任务D和计算任务E为待处理计算任务，通过任务生成的时间顺序来确定当前计算任务和待处理计算任务，可以对生成时间最早的计算任务先进行处理。当然，还可以通过其他方式来确定当前计算任务与待处理计算任务，不限定与上述方式。

在确定当前计算任务后，则可以将当前计算任务分配至不同的目标处理进程进行相似计算处理，在每一目标处理进程处理计算任务时，实时检测目标处理进程的处理进度，当检测到一个目标处理进程完成计算任务的处理后，则可以将一个待处理计算任务分配至该目标处理进程进行处理。

例如，当前计算任务1、当前计算任务2和当前计算任务3分别在其对应的目标处理进程1、目标处理进程2和目标处理进程3上进行处理，当检测到目标处理进程1处理完当前计算任务1时，则可以将一个待处理计算任务分配至目标处理进程1上进行相似计算处理，保证处理进程的任务处理效率。

在一些实施例中，在步骤将待处理计算任务分配至目标处理进程进行相似计算处理之前，还可以包括：

获取每一待处理计算任务的计算时长；

将计算时长大于预设计算时长的待处理任务进行移除。

其中，计算时长指的是处理完成一个计算任务所需要耗费的时间。待处理计算任务的计算时长与该该待处理计算任务对应的原始问题信息和参考问题信息的长度特征有关，其中，长度特征表示原始问题信息和参考问题信息的文本长度，可以用来衡量原始问题信息与参考问题信息对应计算任务的难易程度。原始问题信息和参考问题信息的文本长度越长，则可以表示计算该原始问题信息和该参考问题信息的时间越长。

在一实施例中，预设关系表中可以存储有样本问题信息集合的长度特征，以及样本计算时长，不同的样本问题信息集合的长度特征可以对应不同的样本计算时长。其中，预设关系表中的样本问题信息集合的长度特征与不同样本计算时长的对应关系，可以通过处理进程处理多次不同长度特征的样本问题信息集合所需要的处理时长，得到每一样本问题信息集合的长度特征对应的计算时长，并进行存储。

具体的，可以从预设关系表中获取每一待处理计算任务的待处理问题信息的长度特征对应的计算时长，比如，待处理计算任务可以包括待处理计算任务D和待处理计算任务E，可以分别获取待处理计算任务D和待处理计算任务E的长度特征，然后基于长度特征，从预设关系表中匹配出待处理计算任务D和待处理计算任务E分别对应的计算时长。

在确定每一待处理计算任务的计算时长后，可以将每一计算时长与预设计算时长进行比较，由于计算时长太长会影响后续计算任务的进度，因此，可以将计算时长超过预设计算时长的待处理计算任务进行清除，也即将该超时计算任务从待处理计算任务的任务列表中进行移除，后续不再对该超时计算任务进行处理，以将计算资源提前留给后续更多计算耗时短的计算任务，可以提高任务处理效率。

在一些实施例中，步骤将待处理计算任务分配至目标处理进程进行相似计算处理，可以包括：

获取所有待处理计算任务的计算时长；

根据计算时长对所有待处理计算任务进行排序，得到所有待处理计算任务的排序序列；

按照所述排序序列将待处理任务分配至空闲的目标处理进程中进行相似计算处理。

首先，获取每一待处理计算任务中的待处理问题信息集合的长度特征，然后根据每一待处理计算任务的长度特征，从预设关系表中确定与每一待处理计算任务的长度特征匹配的样本长度特征，获取样本长度特征对应的计算时长，可以得到每一待处理计算任务的计算时长。

进一步的，可以根据待处理计算任务的计算时长，对待处理计算任务进行排序，比如，可以按照计算时长由长到短的规则进行排序，得到待处理任务的排序序列。

在确定待处理计算任务的排序序列之后，则可以基于该排序序列依次将待处理计算任务进行处理。

例如，待处理任务可以包括待处理任务D和待处理任务E，若从预设关系库中，获取到待处理任务D对应的计算时长可以为1分钟，待处理任务E的计算时长可以为0.5分钟，按照计算时长由长到短的规则进行排序得到待处理计算任务的排序序列为：待处理计算任务D，待处理计算任务E。当检测到一个目标处理进程处理完计算任务后，可以先将待处理计算任务D分配至该目标处理进程进行处理，然后等待其他目标处理进程处理完其他计算任务后，再将待处理计算任务E分配至其他目标处理进程进行处理，可以缩短当前原始问题信息对应的所有计算任务的耗时，可以更快输出检索结果。

在一些实施例中，在步骤通过多个处理进程并行地对多个参考问题信息进行相似计算处理之前，还可以包括：

基于绑定关系确定每个处理进程绑定的处理内核。

其中，绑定关系可以包括处理进程与处理内核之间的绑定，一个处理进程可以绑定一个处理内核，或者一个处理进程可以绑定多个处理内核，具体说明可以参见上述步骤，在此不多做赘述。

基于此，在一些实施例中，步骤通过多个处理进程并行地对多个参考问题信息进行相似计算处理，可以包括：

通过多个处理进程以及处理进程绑定的处理内核，并行地对多个参考问题信息进行相似计算处理。

例如，处理进程1绑定处理内核1，处理进程2绑定处理内核2，则可以通过处理进程1和处理内核1对处理进程1对应的参考问题信息和原始问题信息进行相似计算处理，通过处理进程2和处理内核2对处理进程2对应的参考问题信息和原始问题信息进行相似计算处理。

105、基于相似度信息从多个参考问题信息中确定需要检索的目标问题信息，以及检索得到目标问题信息的答案信息。

其中，相似度信息可以包括每一参考问题信息与原始问题信息的相似度值。

在一些实施例中，步骤基于相似度信息从多个参考问题信息中确定需要检索的目标问题信息，可以包括：

对每一参考问题信息与原始问题信息的相似度值互相之间进行比较；

基于与所述原始问题信息相似度值最大的参考问题信息，得到需要检索的目标问题信息。

在智能问答系统的知识库中，包括有多个样本问题信息与多个答案信息，其中，不同的样本问题信息可以对应不同的答案信息。当接收到原始问题信息后，可以从多个样本问题信息与原始问题信息信息进行匹配，通过计算原始问题信息与样本问题信息的相似度，确定知识库中与原始问题信息最相似的目标问题信息，然后在智能问答系统的知识库中确定该目标问题信息对应的答案信息，得到原始问题信息的答案信息，可以从智能问答系统的知识库中检索出与原始问题信息最匹配的答案信息，提高智能问答的准确性。

其中，目标问题信息可以为最终需要进行检索的问题信息。具体的，从原始问题信息对应的多个参考问题信息中，提取与原始问题信息相似度最大的参考问题信息，即可以得到原始问题信息对应的目标问题信息。

例如，参考问题信息可以包括：参考问题信息A、参考问题信息B和参考问题信息C，通过上述处理可以得到参考问题信息A与原始问题信息的相似度值可以为0.7，参考问题信息B与原始问题信息的相似度值可以为0.8，参考问题信息C与原始问题信息的相似度值可以为0.9，则可以确定参考信息C为目标问题信息。

进一步的，可以从知识库中，检索目标信息C对应的答案信息，即可以得到原始问题信息的答案信息。

106、根据目标问题信息的答案信息输出原始问题信息对应的答案信息。

当根据目标问题信息的答案信息确定原始问题信息的答案信息后，可以输出该原始问题信息的答案信息。比如，可以将该答案信息以问答形式显示在用户输入界面，以使用户得到原始问题信息的答案。

本申请实施例公开了一种智能问答方法，通过获取待检索的原始问题信息；从智能问答系统的知识库中提取与原始问题信息匹配的多个参考问题信息；确定处理单元的内核数量，根据内核数量创建多个处理进程；通过多个处理进程并行地对多个参考问题信息进行相似计算处理，得到每个参考问题信息与原始问题信息之间的相似度信息；基于相似度信息从多个参考问题信息中确定需要检索的目标问题信息，检索目标问题信息的答案信息；根据目标问题信息的答案信息输出原始问题信息对应的答案信息。以此，通过处理单元的多个处理内核创建多个处理进程，将多个计算任务分别分配至多个处理进程并行处理，加快任务处理速度，从而提高问题检索效率本申请方案，该方案可以提高智能问答的效率。

根据上述介绍的内容，下面将举例来进一步说明本申请的智能问答方法。在本实施例中，将以该智能问答装置具体集成在终端中为例进行说明。请参考图3，图3为本申请实施例提供的另一种智能问答方法的流程示意图。具体流程可以如下：

201、终端获取用户输入的原始问题语句。

在本申请实施例中，智能问答方法可以应用于应用程序内的智能问答系统，应用程序可以为多种类型的应用程序，比如，该应用程序可以为游戏应用等。

其中，原始问题语句为用户输入的待查询问题。用户可以在应用程序的交互界面输入原始问题语句。

请参考图4，图4为本申请实施例提供的一种智能问答方法的智能问答交互界面示意图。图4展示的是游戏应用内的智能问答交互界面，用户输入原始问题语句“amk怎么玩”。其中，用户可以通过键盘输入界面输入原始问题语句，或者该游戏应用可以支持语音功能，用户可以通过语音输入原始问题语句等方式。

202、终端从智能问答系统的知识库中，查找与原始问题语句匹配的多个候选问题语句。

当终端检测到用户在智能问答交互界面输入的原始问题语句后，则可以根据用户输入的原始问题语句，从智能问答系统的知识库中，查找与该原始问题语句相似的问题语句，可以得到候选问题语句。

其中，智能问答系统的知识库可以包括多个样本问题语句，多个样本问题语句可以为与应用程序相关的问题语句，预先存储在该应用程序对应的智能问答系统的知识库中。

其中，粗排模型可以为智能问答系统中预先训练好的模型，通过粗排模型对原始问题语句和知识库中的样本问题语句进行匹配处理，可以从知识库中提取出和原始问题语句相似的至少一个候选问题语句。

例如，用户输入的原始问题语句可以为“amk怎么玩”，通过粗排模型对原始问题语句和知识库中的样本问题语句进行匹配处理，可以得到候选问题语句可以为：“akm使用技巧”，“akm如何操作”，“akm怎么玩比较好”。

203、终端基于原始问题语句与多个候选问题语句构建多个问题语句组合。

其中，问题语句组合可以是原始问题语句与候选问题语句的组合，比如，原始问题语句可以为“amk怎么玩”，选问题语句可以为：“akm使用技巧”，“akm如何操作”，“akm怎么玩比较好”，则基于原始问题语句与候选问题语句得到的问题语句组合可以为：“amk怎么玩，akm使用技巧”，“amk怎么玩，akm如何操作”，“amk怎么玩，akm怎么玩比较好”。

204、终端获取处理器的内核数量，并根据内核数量创建多个工作进程。

其中，终端可以通过获取处理器的属性信息，通过处理器的属性信息确定处理器的内核个数，得到处理器的内核数量。

在本申请实施例中，由于不同的处理器内核可以并行运行，因此，可以根据多个处理器内核创建多个工作进程，每一工作进程可以用来处理不同的系统任务，通过在不同的处理器内核中不同的工作进程，使得多个工作进程并行地运行不同的系统任务，可以提高任务处理效率，同时提高多核处理器的每一处理器内核的资源利用率。

例如，终端获取到处理器的属性信息中，处理器内核个数可以为8，则可以确定处理器的内核数量可以为8，进一步的，可以在每一处理器内核上创建一个工作进程，得到每一处理器内核对应的工作进程，具体的，处理器内核可以包括内核1、内核2、内核3、内核4、内核5、内核6、内核7和内核8，每一处理器内核分别对应创建的工作进程可以包括：工作进程1、工作进程2、工作进程3、工作进程4、工作进程5、工作进程6、工作进程7和工作进程8。

205、终端将多个问题语句组合分配至不同的工作进程进行相似计算处理，得到每一问题语句组合的相似度值。

其中，相似计算处理可以用于计算问题语句组合中的不同问题语句之间的相似度值，具体的，可以通过相似度模型进行计算处理，相似度模型的具体说明可参考上述实施例，在此不多做赘述。

对每一问题语句组合进行相似计算处理可以是一个计算处理任务，那么基于多个问题语句组合可以得到多个计算处理任务，计算处理任务可以由工作进程来执行处理。那么，在本申请实施例中，为了保证计算任务的处理效率，可以将不同的计算任务分配至不同的工作进程并行进行处理。

例如，问题语句组合可以包括：第一组合(“amk怎么玩，akm使用技巧”)，第二组合(“amk怎么玩，akm如何操作”)，第三组合(“amk怎么玩，akm怎么玩比较好”)，则可以确定计算任务的数量为3，工作进程可以包括：工作进程1、工作进程2、工作进程3、工作进程4、工作进程5、工作进程6、工作进程7和工作进程8，则可以将每个问题语句组合的计算任务分配至不同的工作进程进行相似计算处理：将第一组合分配至工作进程1进行相似计算处理，将第二组合分配至工作进程2进行相似计算处理，将第三组合分配至工作进程3进行相似计算处理。

在一些实施例中，将多个计算任务分配至多个工作进程进行相似计算处理时，可以包括多种方式，比如，还可以根据每一计算任务的预计计算时长和每一工作进程绑定的处理器内核的负载情况，将预计计算时长较长的计算任务分配至负载较小的处理器内核对应的工作进程进行相似计算处理。其中，处理器内核的负载情况可以表示该处理器内核当前处理中的数据处理量，处理中的数据处理量越大，则表示处理器内核的负载越大。通过上述分配方式，可以保证每一处理器内核负载均衡，避免出现计算堵塞。

具体的，通过相似度模型和问题语句组合对应的工作进程对问题语句组合中的问题语句进行相似计算处理，可以得到每一问题语句组合中原始问题语句与候选问题语句的相似度值。

例如，问题语句组合包括：第一组合(“amk怎么玩，akm使用技巧”)，第二组合(“amk怎么玩，akm如何操作”)，第三组合(“amk怎么玩，akm怎么玩比较好”)，通过相似度模型和工作进程1对第一组合进行相似计算处理，可以得到第一组合中原始问题语句和候选问题语句的相似度值可以为0.5，通过相似度模型和工作进程2对第二组合进行相似计算处理，可以得到第二组合中原始问题语句和候选问题语句的相似度值可以为0.6，通过相似度模型和工作进程1对第一组合进行相似计算处理，可以得到第一组合中原始问题语句和候选问题语句的相似度值可以为0.8。

206、终端根据每一问题语句组合的相似度值，确定相似度值最大的问题语句组合中的候选问题语句，得到目标问题语句。

在确定每一问题语句组合中原始问题语句与候选问题语句的相似度值后，可以基于相似度值确定与原始问题语句最相似的目标问题语句。

例如，第一组合(“amk怎么玩，akm使用技巧”)中，原始问题语句与候选问题语句的相似度值可以为0.5，第二组合(“amk怎么玩，akm如何操作”)中，原始问题语句与候选问题语句的相似度值可以为0.6，第三组合(“amk怎么玩，akm怎么玩比较好”)中，原始问题语句与候选问题语句的相似度值可以为0.8，则可以确定第三组合中的候选问题语句为与原始问题语句最相似的问题语句，则可以确定目标问题语句为：“akm怎么玩比较好”。

207、终端从智能问答系统的知识库中检索目标问题语句对应的答案语句，并基于目标问题语句对应的答案语句输出原始问题语句的答案语句。

其中，智能问答系统的知识库中，还可以预先存储有多个问题答案，样本问题语句可以与问题答案相关联，一个样本问题语句可以对应一个问题答案。

当确定目标问题语句为“akm怎么玩比较好”后，可以从知识库中，查询问句：“akm怎么玩比较好”对应的问题答案，比如，通过查询可以得到目标问题对应的问题答案可以为“AKM是没有固定使用技巧的，只要勤于练习，都有任何机会成为最强”。同时，终端可以将查询到的目标问题语句的问题答案输出至智能问答系统的交互界面进行展示，以供用户参考。

请参考图5，图5为本申请实施例中提供的一种智能问答方法的问题答案展示界面示意图。图5中，基于用户输入的原始问题语句，通过智能问答系统中的模型进行相应处理，最终得到原始问题语句对应的问题答案，可以通过对话形式展示在应用程序中的智能问答系统的交互界面。

本申请实施例公开了一种智能问答方法，通过获取用户输入的原始问题语句，然后从智能问答系统的知识库中，查找与原始问题语句匹配的多个候选问题语句，进一步的，基于原始问题语句与多个候选问题语句构建多个问题语句组合，然后获取处理器的内核数量，并根据内核数量创建多个工作进程，以此可以将多个问题语句组合分配至不同的工作进程进行相似计算处理，得到每一问题语句组合的相似度值，进一步的，根据每一问题语句组合的相似度值，确定相似度值最大的问题语句组合中的候选问题语句，得到目标问题语句，最后从智能问答系统的知识库中检索目标问题语句对应的答案语句，并基于目标问题语句对应的答案语句输出原始问题语句的答案语句，可以智能问答系统中针对用户输入的查询问题的查询效率，快速输出用户想要的答案信息。

为便于更好的实施本申请实施例提供的智能问答方法，本申请实施例还提供一种基于上述智能问答方法的智能问答装置。其中名词的含义与上述智能问答方法中相同，具体实现细节可以参考方法实施例中的说明。

请参阅图6，图6为本申请实施例提供的一种智能问答装置的结构框图，该智能问答装置可以应用于诸如智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等终端，以及诸如可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器，该装置包括：

获取模块301，用于获取待检索的原始问题信息；

提取模块302，用于从智能问答系统的知识库中提取与原始问题信息匹配的多个参考问题信息；

确定模块303，用于确定处理单元的内核数量，根据内核数量创建多个处理进程；

处理模块304，用于通过多个处理进程并行地对多个参考问题信息进行处理，得到每个参考问题信息与原始问题信息之间的相似度信息；

检索模块305，用于基于相似度信息从多个参考问题信息中确定需要检索的目标问题信息，以及检索得到目标问题信息的答案信息；

输出模块306，用于根据目标问题信息的答案信息输出原始问题信息对应的答案信息。

在一些实施例中，请参考图7，图7为本申请实施例提供的另一种智能问答装置的结构框图，处理模块304，可以包括：

创建子模块3041，用于为每个参考问题信息创建相应的计算任务，得到多个计算任务；

第一确定子模块3042，用于确定第一数量和第二数量，第一数量为处理进程的个数，第二数量为计算任务的个数；

第一分配子模块3043，用于若第一数量大于等于第二数量，则将第二数量的计算任务分别分配至不同的处理进程进行并行相似计算处理。

在一些实施例中，第一分配子模块3043，具体可以用于：

将每一计算任务分别分配至相应的目标处理进程，其中，一个计算任务对应一个目标处理进程；对于每一个目标处理进程，根据相似度模型和已分配的计算任务对应的待处理信息集合，计算每一参考问题信息与原始问题信息之间的相似度值，待处理信息集合包括参考问题信息以及原始问题信息。

在一些实施例中，请参考图8，图8为本申请实施例提供的另一种智能问答装置的结构框图，处理模块304，还可以包括：

第二确定子模块3044，用于若第一数量小于第二数量，则根据第一数量从计算任务中确定当前需要处理的当前计算任务、以及等待处理的待处理计算任务；

第二分配子模块3045，用于将当前计算任务分配至相应的目标处理进程进行处理，其中，一个当前计算任务对应一个目标处理进程；

处理子模块3046，用于当检测到目标处理进程处理完计算任务时，将待处理计算任务分配至目标处理进程进行相似计算处理。

在一些实施例中，第二确定子模块3044，具体可以用于：

获取每一计算任务的生成时间；从多个计算任务中，提取生成时间与当前时间的时间差值最大的第一数量的计算任务，得到当前计算任务；从多个计算任务中，提取除当前计算任务以外的计算任务，得到待处理计算任务。

在一些实施例中，处理模块304，还可以包括：

在一些实施例中，处理子模块3046，具体可以用于：

获取所有待处理计算任务的计算时长；根据计算时长对所有待处理计算任务进行排序，得到所有待处理计算任务的排序序列；按照排序序列将待处理任务分配至空闲的目标处理进程中进行相似计算处理。

在一些实施例中，提取模块302，可以包括：

采集子模块，用于采集原始问题信息的特征信息；

筛选模块，用于从样本数据库中筛选出与特征信息相似度大于预设阈值的样本特征信息，得到多个目标特征信息，样本数据库中包括多个样本特征信息以及每个样本特征信息对应的样本问题信息；

第二获取子模块，用于获取目标特征信息对应的目标问题信息，得到与原始问题信息匹配成功的多个参考问题信息。

在一些实施例中，检索模块305，可以包括：

比较子模块，用于对每一参考问题信息与原始问题信息的相似度值互相之间进行比较；

第三确定子模块，用于基于与原始问题信息相似度值最大的参考问题信息，得到需要检索的目标问题信息。

在一些实施例中，该装置，还包括：

第四确定子模块，用于基于绑定关系确定每个处理进程绑定的处理内核，绑定关系包括处理进程与处理内核之间的绑定。

本申请实施例公开了一种智能问答装置，通过获取模块301获取待检索的原始问题信息，提取模块302从智能问答系统的知识库中提取与原始问题信息匹配的多个参考问题信息，确定模块303确定处理单元的内核数量，根据内核数量创建多个处理进程，处理模块304通过多个处理进程并行地对多个参考问题信息进行处理，得到每个参考问题信息与原始问题信息之间的相似度信息，检索模块305基于相似度信息从多个参考问题信息中确定需要检索的目标问题信息，以及检得到目标问题信息的答案信息，输出模块306根据目标问题信息的答案信息输出原始问题信息对应的答案信息。可以提高智能问答的效率。

本申请实施例还提供一种计算机设备，如图9所示，其示出了本申请实施例所涉及的服务器的结构示意图，具体来讲：

该计算机设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图9中示出的计算机设备结构并不构成对计算机设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器401是该计算机设备的控制中心，利用各种接口和线路连接整个计算机设备的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行计算机设备的各种功能和处理数据，从而对计算机设备进行整体检测。可选的，处理器401可包括一个或多个处理核心；可选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据服务器的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。

计算机设备还包括给各个部件供电的电源403，可选的，电源403可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

计算机设备还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，计算机设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，计算机设备中的处理器401会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的应用程序，从而实现前述实施例提供的各种方法步骤，如下：

获取待检索的原始问题信息；

从智能问答系统的知识库中提取与原始问题信息匹配的多个参考问题信息；

确定处理单元的内核数量，根据内核数量创建多个处理进程；

通过多个处理进程并行地对多个参考问题信息进行相似计算处理，得到每个参考问题信息与原始问题信息之间的相似度信息；

基于相似度信息从多个参考问题信息中确定需要检索的目标问题信息，以及检索目标问题信息的答案信息；

根据目标问题信息的答案信息输出原始问题信息对应的答案信息。

本申请实施例通过获取待检索的原始问题信息；从智能问答系统的知识库中提取与原始问题信息匹配的多个参考问题信息；确定处理单元的内核数量，根据内核数量创建多个处理进程；通过多个处理进程并行地对多个参考问题信息进行相似计算处理，得到每个参考问题信息与原始问题信息之间的相似度信息；基于相似度信息从多个参考问题信息中确定需要检索的目标问题信息，检索得到目标问题信息的答案信息；根据目标问题信息的答案信息输出原始问题信息对应的答案信息。该方案可以将智能问答系统中，基于待检索的原始问题确定的多个计算任务分别分配至不同的处理进程进行并行处理，加快任务处理速度，从而提高智能问答的效率。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本申请实施例所提供的任一种智能问答方法中的步骤。例如，该指令可以执行如下步骤：

获取待检索的原始问题信息；从智能问答系统的知识库中提取与原始问题信息匹配的多个参考问题信息；确定处理单元的内核数量，根据内核数量创建多个处理进程；通过多个处理进程并行地对多个参考问题信息进行相似计算处理，得到每个参考问题信息与原始问题信息之间的相似度信息；基于相似度信息从多个参考问题信息中确定需要检索的目标问题信息，检索目标问题信息的答案信息；根据目标问题信息的答案信息输出原始问题信息对应的答案信息。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

其中，该存储介质可以包括：只读存储器(ROM，Read O多ly Memory)、随机存取记忆体(RAM，Ra多dom Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本申请实施例所提供的任一种智能问答方法中的步骤，因此，可以实现本申请实施例所提供的任一种智能问答方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。终端的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该终端执行上述方面的各种可选实现方式中提供的智能问答方法。

以上对本申请实施例所提供的智能问答方法、装置、计算机设备及存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种智能问答方法，其特征在于，包括：

获取待检索的原始问题信息；

通过多个处理进程并行地对多个参考问题信息进行处理，得到每个参考问题信息与原始问题信息之间的相似度信息，包括：若第一数量小于第二数量，则根据所述第一数量从计算任务中确定当前需要处理的当前计算任务、以及等待处理的待处理计算任务，所述第一数量为处理进程的个数，所述第二数量为为每个参考问题信息创建的相应计算任务的个数；将当前计算任务分配至相应的目标处理进程进行处理，其中，一个当前计算任务对应一个目标处理进程；根据每一待处理计算任务的待处理问题信息的长度特征；从预设关系表中确定与每一待处理计算任务的长度特征匹配的样本长度特征；从预设关系表中获取样本长度特征对应的计算时长，得到每一待处理计算任务的计算时长；将计算时长大于预设计算时长的待处理任务进行移除；当检测到目标处理进程处理完计算任务时，将待处理计算任务分配至目标处理进程进行相似计算处理；

2.根据权利要求1所述的方法，其特征在于，所述通过多个处理进程并行地对多个参考问题信息进行处理，还包括：

确定第一数量和第二数量，所述第一数量为处理进程的个数，所述第二数量为计算任务的个数；

若所述第一数量大于等于所述第二数量，则将所述第二数量的计算任务分别分配至不同的处理进程进行并行相似计算处理。

3.根据权利要求2所述的方法，其特征在于，所述将所述第二数量的计算任务分别分配至不同的处理进程进行并行相似计算处理，包括：

将每一计算任务分别分配至相应的目标处理进程，其中，一个计算任务对应一个目标处理进程；

对于每一个目标处理进程，根据相似度模型和已分配的计算任务对应的待处理信息集合，计算每一参考问题信息与原始问题信息之间的相似度值，所述待处理信息集合包括所述参考问题信息以及所述原始问题信息。

4.根据权利要求1所述的方法，其特征在于，所述根据所述第一数量从计算任务中确定当前需要处理的当前计算任务、以及等待处理的待处理计算任务，包括：

获取每一计算任务的生成时间；

5.根据权利要求1所述的方法，其特征在于，所述将待处理计算任务分配至目标处理进程进行相似计算处理，包括：

获取所有待处理计算任务的计算时长；

根据所述计算时长对所有待处理计算任务进行排序，得到所有待处理计算任务的排序序列；

6.根据权利要求1所述的方法，其特征在于，所述从智能问答系统的知识库中提取与所述原始问题信息匹配的多个参考问题信息，包括：

采集所述原始问题信息的特征信息；

从样本数据库中筛选出与所述特征信息相似度大于预设阈值的样本特征信息，得到多个目标特征信息，所述样本数据库中包括多个样本特征信息以及每个样本特征信息对应的样本问题信息；

获取目标特征信息对应的目标问题信息，得到与所述原始问题信息匹配成功的多个参考问题信息。

7.根据权利要求1所述的方法，其特征在于，所述相似度信息包括每一参考问题信息与原始问题信息的相似度值；

所述基于所述相似度信息从多个参考问题信息中确定需要检索的目标问题信息，包括：

对每一参考问题信息与原始问题信息的相似度值互相之间进行比较，得到比较结果；

根据所述比较结果确定与所述原始问题信息相似度值最大的参考问题信息，得到需要检索的目标问题信息。

8.根据权利要求1-7任一项所述的方法，其特征在于，在通过多个处理进程并行地对多个参考问题信息进行处理之前，还包括：

基于绑定关系确定每个处理进程绑定的处理内核，所述绑定关系包括处理进程与处理内核之间的绑定；

所述通过多个处理进程并行地对多个参考问题信息进行相似计算处理，包括：

通过多个处理进程以及处理进程绑定的处理内核，并行地对多个参考问题信息进行处理。

9.一种智能问答装置，其特征在于，包括：

获取模块，用于获取待检索的原始问题信息；

处理模块，用于通过多个处理进程并行地对多个参考问题信息进行处理，得到每个参考问题信息与原始问题信息之间的相似度信息，包括：若第一数量小于第二数量，则根据所述第一数量从计算任务中确定当前需要处理的当前计算任务、以及等待处理的待处理计算任务，所述第一数量为处理进程的个数，所述第二数量为为每个参考问题信息创建的相应计算任务的个数；将当前计算任务分配至相应的目标处理进程进行处理，其中，一个当前计算任务对应一个目标处理进程；根据每一待处理计算任务的待处理问题信息的长度特征；从预设关系表中确定与每一待处理计算任务的长度特征匹配的样本长度特征；从预设关系表中获取样本长度特征对应的计算时长，得到每一待处理计算任务的计算时长；将计算时长大于预设计算时长的待处理任务进行移除；当检测到目标处理进程处理完计算任务时，将待处理计算任务分配至目标处理进程进行相似计算处理；

10.一种计算机设备，包括存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现如权利要求1至8任一项所述的智能问答方法中的步骤。

11.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至8任一项所述的智能问答方法中的步骤。