CN113850387A - 专家系统知识库构建方法、问答方法、系统、装置及介质 - Google Patents

专家系统知识库构建方法、问答方法、系统、装置及介质 Download PDF

Info

Publication number
CN113850387A
CN113850387A CN202111060316.6A CN202111060316A CN113850387A CN 113850387 A CN113850387 A CN 113850387A CN 202111060316 A CN202111060316 A CN 202111060316A CN 113850387 A CN113850387 A CN 113850387A
Authority
CN
China
Prior art keywords
question
knowledge base
expert system
knowledge
expert
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111060316.6A
Other languages
English (en)
Inventor
周攀
丁艳
周小军
梁思妍
黄文�
彭荣荣
曾珍
高思凯
刘勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhongfu Hengsheng Technology Co ltd
Original Assignee
Shenzhen Zhongfu Hengsheng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhongfu Hengsheng Technology Co ltd filed Critical Shenzhen Zhongfu Hengsheng Technology Co ltd
Priority to CN202111060316.6A priority Critical patent/CN113850387A/zh
Publication of CN113850387A publication Critical patent/CN113850387A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种专家系统知识库构建方法、问答方法、系统、装置及介质,构建方法包括:获取预设的第一问答信息,第一问答信息包括多个第一问题描述以及第一问题描述对应的问题类型和第一答复内容;对第一问题描述进行特征提取,得到问题特征向量;根据问题特征向量、问题类型以及第一答复内容确定训练数据集,进而将训练数据集输入到预先构建的深度神经网络中进行训练,得到训练好的知识推理模型;根据知识推理模型周期性获取专家知识数据,进而根据专家知识数据构建专家系统知识库。本发明提高了专家系统知识库的构建效率和更新效率,降低了对系统的算力要求,从而降低了专家系统构建成本,提高了问答沟通效率,可广泛应用于人工智能技术领域。

Description

专家系统知识库构建方法、问答方法、系统、装置及介质
技术领域
本发明涉及人工智能技术领域,尤其是一种专家系统知识库构建、识别方法、系统、装置及介质。
背景技术
专家系统是一个智能计算机程序系统,其内部含有大量的某个领域专家水平的知识与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。也就是说,专家系统是一个具有大量的专门知识与经验的程序系统,它应用人工智能技术和计算机技术,根据某领域一个或多个专家提供的知识和经验,进行推理和判断,模拟人类专家的决策过程,以便解决那些需要人类专家处理的复杂问题,简而言之,专家系统是一种模拟人类专家解决领域问题的计算机程序系统。
专家系统通常由人机交互界面、知识库、推理机、解释器、综合数据库、知识获取等6个部分构成。其中尤以知识库与推理机相互分离而别具特色。专家系统的体系结构随专家系统的类型、功能和规模的不同,而有所差异。
专家系统知识库是专家系统的核心之一,其主要功能是存储和管理专家系统中的知识,主要包括来自书本上的知识和各领域专家在长期的工作实践中所获得的经验知识。目前绝大多数的专家系统知识库都是通过知识工程师与人类专家进行沟通得到,知识工程师从人类专家获得知识,并把它们编码到专家系统中。现有技术存在以下缺点:知识库内容体系更新周期慢,无法及时得到行业补充;推理机需要庞大的算力支撑,计算成本较高;人机交互接口都是采用传统的文字输入进行检索,沟通效率低,不利于在智能终端设备上进行应用与推广。
发明内容
本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
为此,本发明实施例的一个目的在于提供一种专家系统知识库构建方法,该方法可以提高专家系统知识库的构建效率以及更新效率。
本发明实施例的另一个目的在于提供一种高效的专家系统知识库问答方法。
为了达到上述技术目的,本发明实施例所采取的技术方案包括:
第一方面,本发明实施例提供了一种专家系统知识库构建方法,包括以下步骤:
获取预设的第一问答信息,所述第一问答信息包括多个第一问题描述以及所述第一问题描述对应的问题类型和第一答复内容;
对所述第一问题描述进行特征提取,得到问题特征向量;
根据所述问题特征向量、所述问题类型以及所述第一答复内容确定训练数据集,进而将所述训练数据集输入到预先构建的深度神经网络中进行训练,得到训练好的知识推理模型;
根据所述知识推理模型周期性获取专家知识数据,进而根据所述专家知识数据构建专家系统知识库。
进一步地,在本发明的一个实施例中,所述对所述第一问题描述进行特征提取,得到问题特征向量这一步骤,其具体包括:
对所述第一问题描述进行分词处理,得到第一词组;
通过Word2ve模型确定所述第一词组中各个词的词嵌入向量,进而根据所述词嵌入向量确定所述第一词组的词组向量;
对所述词组向量进行归一化处理,得到所述问题特征向量。
进一步地,在本发明的一个实施例中,所述根据所述问题特征向量、所述问题类型以及所述第一答复内容确定训练数据集这一步骤,其具体包括:
根据所述问题特征向量确定训练样本;
根据所述问题类型确定一级标签,并根据所述第一答复内容确定二级标签;
根据所述训练样本对应的一级标签以及二级标签确定训练数据集。
进一步地,在本发明的一个实施例中,所述将所述训练数据集输入到预先构建的深度神经网络中进行训练这一步骤,其具体包括:
将所述训练数据集输入到所述深度神经网络,得到问题类型预测结果和答复内容预测结果;
根据所述问题类型预测结果、所述答复内容预测结果、所述一级标签和所述二级标签确定训练的损失值;
根据所述损失值对所述深度神经网络的参数进行更新。
进一步地,在本发明的一个实施例中,所述根据所述知识推理模型周期性获取专家知识数据,进而根据所述专家知识数据构建专家系统知识库这一步骤,其具体包括:
以预设的周期获取第三问题描述,并根据所述知识推理模型对所述第三问题描述进行推理和分类,得到专家知识数据以及所述专家知识数据的知识类型;
根据所述专家知识数据和所述知识类型构建或更新专家系统知识库。
第二方面,本发明实施例提供了一种专家系统知识库问答方法,包括以下步骤:
获取用户语音信息,并对所述用户语音信息进行语音识别,得到第二问题描述;
通过如第一方面所述的专家系统知识库构建方法所得到的专家系统知识库对所述第二问题描述进行匹配检索,得到第二答复内容;
或,
通过如第一方面所述的专家系统知识库构建方法所得到的知识推理模型对所述第二问题描述进行推理,得到第二答复内容。
第三方面,本发明实施例提供了一种专家系统知识库构建系统,包括:
问答信息获取模块,用于获取预设的第一问答信息,所述第一问答信息包括多个第一问题描述以及所述第一问题描述对应的问题类型和第一答复内容;
特征提取模块,用于对所述第一问题描述进行特征提取,得到问题特征向量;
模型训练模块,用于根据所述问题特征向量、所述问题类型以及所述第一答复内容确定训练数据集,进而将所述训练数据集输入到预先构建的深度神经网络中进行训练,得到训练好的知识推理模型;
知识库构建模块,用于根据所述知识推理模型周期性获取专家知识数据,进而根据所述专家知识数据构建专家系统知识库。
第四方面,本发明实施例提供了一种专家系统知识库问答系统,包括:
语音识别模块,用于获取用户语音信息,并对所述用户语音信息进行语音识别,得到第二问题描述;
匹配检索模块,用于通过如第一方面所述的专家系统知识库构建方法所得到的专家系统知识库对所述第二问题描述进行匹配检索,得到第二答复内容;
或,
模型推理模块,用于通过如第一方面所述的专家系统知识库构建方法所得到的知识推理模型对所述第二问题描述进行推理,得到第二答复内容。
第五方面,本发明实施例提供了一种专家系统知识库构建装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现第一方面所述的专家系统知识库构建方法。
第六方面,本发明实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行第一方面所述的专家系统知识库构建方法或者第二方面所述的专家系统知识库问答方法。
本发明的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到:
本发明实施例先获取预设的第一问答信息,该第一问答信息包括多个第一问题描述以及对应的问题类型和第一答复内容,然后对第一问题描述进行特征提取,得到问题特征向量,再根据问题特征向量、问题类型以及第一答复内容确定用于深度神经网络训练的训练数据集,训练得到知识推理模型,从而可以根据知识推理模型获取专家知识数据,进而根据专家知识数据构建专家系统知识库。本发明实施例通过机器学习自动获取专家知识数据,提高了专家系统知识库的构建效率和更新效率;通过深度神经网络训练知识推理模型,降低了对系统的算力要求,从而降低了专家系统的构建成本;通过语音识别获取用户的问题描述,提高了专家系统知识库的问答沟通效率,可以在智能终端设备上进行应用和推广,提高了用户的体验感。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面对本发明实施例中所需要使用的附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员来说,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
图1为本发明实施例提供的一种专家系统知识库构建方法的步骤流程图;
图2为本发明实施例提供的一种专家系统知识库问答方法的步骤流程图;
图3为本发明实施例提供的一种专家系统知识库构建系统的结构框图;
图4为本发明实施例提供的一种专家系统知识库问答系统的结构框图;
图5为本发明实施例提供的一种专家系统知识库构建装置的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
在本发明的描述中,多个的含义是两个或两个以上,如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。此外,除非另有定义,本文所使用的所有的技术和科学术语与本技术领域的技术人员通常理解的含义相同。
参照图1,本发明实施例提供了一种专家系统知识库构建方法,具体包括以下步骤:
S101、获取预设的第一问答信息,第一问答信息包括多个第一问题描述以及第一问题描述对应的问题类型和第一答复内容。
具体地,本发明实施例按照规定格式整理好问题和对应的答复内容,形成第一问答信息。第一问答信息除包括问题类型和答复内容外,还可以包括问题题干、问题的相似度阀值、补充问法以及意图优先级等内容。
S102、对第一问题描述进行特征提取,得到问题特征向量。
具体地,本发明实施例对第一问题描述进行分词处理,然后根据各个词的词嵌入向量得到问题特征向量,该问题特征向量可用于后续模型训练。步骤S102具体包括以下步骤:
S1021、对第一问题描述进行分词处理,得到第一词组;
S1022、通过Word2ve模型确定第一词组中各个词的词嵌入向量,进而根据词嵌入向量确定第一词组的词组向量;
S1023、对词组向量进行归一化处理,得到问题特征向量。
具体地,本发明实施例对每个问题描述进行分词处理,得到组成该问题描述的词组。例如问题描述是“如何快速查询往期账单”,经过分词处理后可以得到词组“如何,快速,查询,往期,账单”。此处,可以采用的分词算法有多种,例如在一些实施例中,可以采用基于词典的分词算法,先把问题描述按照词典切分成词,再寻找词的最佳组合方式;在一些实施例中,也可以采用基于字的分词算法,先把语句分成一个个字,再将字组合成词,寻找最优的组合方式。将问题描述进行分词处理后,可以通过预先建立的Word2ve模型来确定词组中每个词对应的词嵌入向量,当然,在一些实施例中,词嵌入向量可以通过将词映射到一个具有统一的较低维度的向量空间中得到,生成这种映射的策略包括神经网络、单词共生矩阵的降维、概率模型以及可解释的知识库方法等。以“如何快速查询往期账单”的问题描述为例,首先一一确定该问题描述中各个词对应的词嵌入向量,其中,词“如何”对应的词向量为(0,5,1,1),词“快速”对应的词向量为(0,0,0,1),词“查询”对应的词向量为(4,2,3,1),词“往期”对应的词向量为(0,1,0,1),词“账单”对应的词向量为(1,0,0,4)。在确定到词组“如何,快速,查询,往期,账单”中每个词对应的词嵌入向量后,可以对这些词嵌入向量进行累加,累加后的向量可以记为词组向量。词组“如何,快速,查询,往期,账单”对应的词组向量为(5,8,4,8),对词组向量进行归一化处理,即可得到的该问题描述对应的问题特征向量。归一化处理时,可以设定词组对应的向量中元素和为1,则问题描述“如何快速查询往期账单”可以通过向量(0.2,0.32,0.16,0.32)来表示。可以理解的是,参照上述的方式,可以确定所有第一问题描述对应的问题特征向量。
S103、根据问题特征向量、问题类型以及第一答复内容确定训练数据集,进而将训练数据集输入到预先构建的深度神经网络中进行训练,得到训练好的知识推理模型。
进一步作为可选的实施方式,根据问题特征向量、问题类型以及第一答复内容确定训练数据集这一步骤,其具体包括:
A1、根据问题特征向量确定训练样本;
A2、根据问题类型确定一级标签,并根据第一答复内容确定二级标签;
A3、根据训练样本对应的一级标签以及二级标签确定训练数据集。
具体地,本发明实施例中,将第一问题描述对应问题类型作为一级标签,将第一问题描述对应的第一答复内容作为二级标签,从而形成训练数据集用于后续的多标签训练,这样训练得到的知识推理模型既可以识别问题描述的问题类型,也可以输出对应的答复内容,便于后续专家知识数据的分类以及专家系统知识库的构建。
进一步作为可选的实施方式,将训练数据集输入到预先构建的深度神经网络中进行训练这一步骤,其具体包括:
B1、将训练数据集输入到深度神经网络,得到问题类型预测结果和答复内容预测结果;
B2、根据问题类型预测结果、答复内容预测结果、一级标签和二级标签确定训练的损失值;
B3、根据损失值对深度神经网络的参数进行更新。
具体地,将训练数据集中的数据输入到初始化后的深度神经网络后,可以得到模型输出的预测结果,即问题类型预测结果和答复内容预测结果,可以根据问题类型预测结果、答复内容预测结果和前述的一级标签以及二级标签来评估模型预测的准确性,从而对模型的参数进行更新。本发明实施例中,模型预测结果的准确性可以通过损失函数(LossFunction)来衡量,损失函数是定义在单个训练数据上的,用于衡量一个训练数据的预测误差,具体是通过单个训练数据的标签和模型对该训练数据的预测结果确定该训练数据的损失值。而实际训练时,一个训练数据集有很多训练数据,因此一般采用代价函数(CostFunction)来衡量训练数据集的整体误差,代价函数是定义在整个训练数据集上的,用于计算所有训练数据的预测误差的平均值,能够更好地衡量出模型的预测效果。对于一般的机器学习模型来说,基于前述的代价函数,再加上衡量模型复杂度的正则项即可作为训练的目标函数,基于该目标函数便能求出整个训练数据集的损失值。常用的损失函数种类有很多,例如0-1损失函数、平方损失函数、绝对损失函数、对数损失函数、交叉熵损失函数等均可以作为机器学习模型的损失函数,在此不再一一阐述。本发明实施例中,可以从中任选一种损失函数来确定训练的损失值。基于训练的损失值,采用反向传播算法对模型的参数进行更新,迭代几轮即可得到训练好的知识推理模型。具体地迭代轮数可以预先设定,或者在测试集达到精度要求时认为训练完成。
S104、根据知识推理模型周期性获取专家知识数据,进而根据专家知识数据构建专家系统知识库。
具体地,现有技术中大多通过知识工程师从人类专家获得知识数据,进行编码后加入到专家系统知识库,然而这种方法需要采集大量的样本,效率低下。本发明实施例通过训练好的知识推理模型可以自动获取专家知识数据,从而可以提高专家系统知识库的构建效率。步骤S104具体包括以下步骤:
S1041、以预设的周期获取第三问题描述,并根据知识推理模型对第三问题描述进行推理和分类,得到专家知识数据以及专家知识数据的知识类型;
S1042、根据专家知识数据和知识类型构建或更新专家系统知识库。
具体地,通过触发器设定周期,以该周期在对应领域的问题数据库中获取第三问题描述,然后通过知识推理模型对第三问题描述进行问题类型的分类以及答复内容的推理,然后将得到的答复内容和该问题描述作为专家知识数据,根据问题类型确定知识类型,进而可以根据专家知识数据和知识类型构建或者更新专家系统知识库。
可以理解的是,当首次执行上述操作时即可构成完成专家系统知识库,后续可按照预设的周期重复上述步骤,对该专家系统知识库进行更新,以扩充其内容。
在本发明的一种实施方式中,可以通过开源的微信对话开放平台完成专家系统知识库的构建和更新,具体过程为:将前述得到专家知识数据通过微信对话开放平台导入;在微信对话开放平台上校验录入的专家知识数据,确认无误后可以开始专家系统知识库的构建;构建完成后可生成相应的API接口,便于后续对专家系统知识库的调用。
以上对本发明实施例的专家系统知识库构建方法进行了说明,可以理解的是,本发明实施例通过机器学习自动获取专家知识数据,提高了专家系统知识库的构建效率和更新效率;通过深度神经网络训练知识推理模型,降低了对系统的算力要求,从而降低了专家系统的构建成本。
参照图2,本发明实施例提供了一种专家系统知识库问答方法,具体包括以下步骤:
S201、获取用户语音信息,并对用户语音信息进行语音识别,得到第二问题描述;
S202、通过如前述的专家系统知识库构建方法所得到的专家系统知识库对第二问题描述进行匹配检索,得到第二答复内容;
或,
S203、通过如前述的专家系统知识库构建方法所得到的知识推理模型对第二问题描述进行推理,得到第二答复内容。
具体地,以移动终端设备作为人机交互设备为例,通过终端设备上的语音采集设备(如麦克风,拾音器)采集用户语音信息;通过终端设备内置的语音识别算法识别用户问题,转为文字,得到第二问题描述;将该问题描述作为参数调用微信对话开放平台生成的API接口,为保证用户数据的安全性,调用接口时可采用加密算法加密用户身份信息和问题内容,如用户问题以及身份信息采用xml数据包格式进行封装,采用PKCS7算法进行加解密;将接口返回的答复内容显示在终端设备上。
可以理解的是,当第二问题描述可以在构建的专家系统知识库中匹配到对应的专家知识数据时,可直接输出第二答复内容;当匹配不到或者匹配度过低时,可通过知识推理模型对第二问题描述进行模型推理,得到第二答复内容,同时将该组数据加入到专家系统知识库。
本发明实施例通过语音识别获取用户的问题描述,提高了专家系统知识库的问答沟通效率,可以在智能终端设备上进行应用和推广,提高了用户的体验感。
应该认识到,本发明实施例所提供的专家系统知识库构建方法和问答方法,为中小企业和个人提供了一种全新的建设行业知识库的途径,极大的降低了门槛和成本,提升了用户的交互体验。本发明实施例可以适用于教育教学、智能客服以及人工智能的数据标注等场景,与现有技术相比,本发明实施例还具有以下优势:
1)降低成本:本发明实施例可通过成熟的第三方开源平台实现,极大的降低了技术成本和硬件成本;
2)体验更佳:采用语音交互,使得问答更为高效,便于专家系统知识库在移动终端设备上进行推广与应用。
可以理解的是,上述专家系统知识库构建方法实施例中的内容均适用于本专家系统知识库问答方法实施例中,本专家系统知识库问答方法实施例所具体实现的功能与上述专家系统知识库构建方法实施例相同,并且达到的有益效果与上述专家系统知识库构建方法实施例所达到的有益效果也相同。
参照图3,本发明实施例提供了一种专家系统知识库构建系统,包括:
问答信息获取模块,用于获取预设的第一问答信息,第一问答信息包括多个第一问题描述以及第一问题描述对应的问题类型和第一答复内容;
特征提取模块,用于对第一问题描述进行特征提取,得到问题特征向量;
模型训练模块,用于根据问题特征向量、问题类型以及第一答复内容确定训练数据集,进而将训练数据集输入到预先构建的深度神经网络中进行训练,得到训练好的知识推理模型;
知识库构建模块,用于根据知识推理模型周期性获取专家知识数据,进而根据专家知识数据构建专家系统知识库。
可以理解的是,上述专家系统知识库构建方法实施例中的内容均适用于本专家系统知识库构建系统实施例中,本专家系统知识库构建系统实施例所具体实现的功能与上述专家系统知识库构建方法实施例相同,并且达到的有益效果与上述专家系统知识库构建方法实施例所达到的有益效果也相同。
参照图4,本发明实施例提供了一种专家系统知识库问答系统,包括:
语音识别模块,用于获取用户语音信息,并对用户语音信息进行语音识别,得到第二问题描述;
匹配检索模块,用于通过如前述的专家系统知识库构建方法所得到的专家系统知识库对第二问题描述进行匹配检索,得到第二答复内容;
或,
模型推理模块,用于通过如前述的专家系统知识库构建方法所得到的知识推理模型对第二问题描述进行推理,得到第二答复内容。
可以理解的是,上述专家系统知识库构建方法实施例中的内容均适用于本专家系统知识库问答系统实施例中,本专家系统知识库问答系统实施例所具体实现的功能与上述专家系统知识库构建方法实施例相同,并且达到的有益效果与上述专家系统知识库构建方法实施例所达到的有益效果也相同。
参照图5,本发明实施例提供了一种专家系统知识库构建装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当上述至少一个程序被上述至少一个处理器执行时,使得上述至少一个处理器实现如前述的一种专家系统知识库构建方法。
可以理解的是,上述专家系统知识库构建方法实施例中的内容均适用于本专家系统知识库构建装置实施例中,本专家系统知识库构建装置实施例所具体实现的功能与上述专家系统知识库构建方法实施例相同,并且达到的有益效果与上述专家系统知识库构建方法实施例所达到的有益效果也相同。
本发明实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,该处理器可执行的程序在由处理器执行时用于执行上述的专家系统知识库构建方法或者上述的专家系统知识库问答方法。
本发明实施例的一种计算机可读存储介质,可执行本发明方法实施例所提供的专家系统知识库构建方法或者专家系统知识库问答方法,可执行本发明方法实施例的任意组合实施步骤,具备本发明方法实施例相应的功能和有益效果。
本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1或图2所示的方法。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或上述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,上述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例上述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印上述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得上述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.一种专家系统知识库构建方法,其特征在于,包括以下步骤:
获取预设的第一问答信息,所述第一问答信息包括多个第一问题描述以及所述第一问题描述对应的问题类型和第一答复内容;
对所述第一问题描述进行特征提取,得到问题特征向量;
根据所述问题特征向量、所述问题类型以及所述第一答复内容确定训练数据集,进而将所述训练数据集输入到预先构建的深度神经网络中进行训练,得到训练好的知识推理模型;
根据所述知识推理模型周期性获取专家知识数据,进而根据所述专家知识数据构建专家系统知识库。
2.根据权利要求1所述的一种专家系统知识库构建方法,其特征在于,所述对所述第一问题描述进行特征提取,得到问题特征向量这一步骤,其具体包括:
对所述第一问题描述进行分词处理,得到第一词组;
通过Word2ve模型确定所述第一词组中各个词的词嵌入向量,进而根据所述词嵌入向量确定所述第一词组的词组向量;
对所述词组向量进行归一化处理,得到所述问题特征向量。
3.根据权利要求1所述的一种专家系统知识库构建方法,其特征在于,所述根据所述问题特征向量、所述问题类型以及所述第一答复内容确定训练数据集这一步骤,其具体包括:
根据所述问题特征向量确定训练样本;
根据所述问题类型确定一级标签,并根据所述第一答复内容确定二级标签;
根据所述训练样本对应的一级标签以及二级标签确定训练数据集。
4.根据权利要求3所述的一种专家系统知识库构建方法,其特征在于,所述将所述训练数据集输入到预先构建的深度神经网络中进行训练这一步骤,其具体包括:
将所述训练数据集输入到所述深度神经网络,得到问题类型预测结果和答复内容预测结果;
根据所述问题类型预测结果、所述答复内容预测结果、所述一级标签和所述二级标签确定训练的损失值;
根据所述损失值对所述深度神经网络的参数进行更新。
5.根据权利要求1至4中任一项所述的一种专家系统知识库构建方法,其特征在于,所述根据所述知识推理模型周期性获取专家知识数据,进而根据所述专家知识数据构建专家系统知识库这一步骤,其具体包括:
以预设的周期获取第三问题描述,并根据所述知识推理模型对所述第三问题描述进行推理和分类,得到专家知识数据以及所述专家知识数据的知识类型;
根据所述专家知识数据和所述知识类型构建或更新专家系统知识库。
6.一种专家系统知识库问答方法,其特征在于,包括以下步骤:
获取用户语音信息,并对所述用户语音信息进行语音识别,得到第二问题描述;
通过如权利要求1至5中任一项所述的专家系统知识库构建方法所得到的专家系统知识库对所述第二问题描述进行匹配检索,得到第二答复内容;
或,
通过如权利要求1至5中任一项所述的专家系统知识库构建方法所得到的知识推理模型对所述第二问题描述进行推理,得到第二答复内容。
7.一种专家系统知识库构建系统,其特征在于,包括:
问答信息获取模块,用于获取预设的第一问答信息,所述第一问答信息包括多个第一问题描述以及所述第一问题描述对应的问题类型和第一答复内容;
特征提取模块,用于对所述第一问题描述进行特征提取,得到问题特征向量;
模型训练模块,用于根据所述问题特征向量、所述问题类型以及所述第一答复内容确定训练数据集,进而将所述训练数据集输入到预先构建的深度神经网络中进行训练,得到训练好的知识推理模型;
知识库构建模块,用于根据所述知识推理模型周期性获取专家知识数据,进而根据所述专家知识数据构建专家系统知识库。
8.一种专家系统知识库问答系统,其特征在于,包括:
语音识别模块,用于获取用户语音信息,并对所述用户语音信息进行语音识别,得到第二问题描述;
匹配检索模块,用于通过如权利要求1至5中任一项所述的专家系统知识库构建方法所得到的专家系统知识库对所述第二问题描述进行匹配检索,得到第二答复内容;
或,
模型推理模块,用于通过如权利要求1至5中任一项所述的专家系统知识库构建方法所得到的知识推理模型对所述第二问题描述进行推理,得到第二答复内容。
9.一种专家系统知识库构建装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1至5中任一项所述的一种专家系统知识库构建方法。
10.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于执行如权利要求1至6中任一项所述的方法。
CN202111060316.6A 2021-09-10 2021-09-10 专家系统知识库构建方法、问答方法、系统、装置及介质 Pending CN113850387A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111060316.6A CN113850387A (zh) 2021-09-10 2021-09-10 专家系统知识库构建方法、问答方法、系统、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111060316.6A CN113850387A (zh) 2021-09-10 2021-09-10 专家系统知识库构建方法、问答方法、系统、装置及介质

Publications (1)

Publication Number Publication Date
CN113850387A true CN113850387A (zh) 2021-12-28

Family

ID=78973826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111060316.6A Pending CN113850387A (zh) 2021-09-10 2021-09-10 专家系统知识库构建方法、问答方法、系统、装置及介质

Country Status (1)

Country Link
CN (1) CN113850387A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115617954A (zh) * 2022-11-17 2023-01-17 清华大学 问答方法、装置、电子设备及存储介质
CN116128057A (zh) * 2022-11-01 2023-05-16 宝钢工程技术集团有限公司 一种关于连铸仿真计算的知识库建立方法
TWI813448B (zh) * 2022-09-20 2023-08-21 世界先進積體電路股份有限公司 專家系統及專家方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI813448B (zh) * 2022-09-20 2023-08-21 世界先進積體電路股份有限公司 專家系統及專家方法
CN116128057A (zh) * 2022-11-01 2023-05-16 宝钢工程技术集团有限公司 一种关于连铸仿真计算的知识库建立方法
CN115617954A (zh) * 2022-11-17 2023-01-17 清华大学 问答方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN113850387A (zh) 专家系统知识库构建方法、问答方法、系统、装置及介质
CN111444340A (zh) 文本分类和推荐方法、装置、设备及存储介质
CN110188272A (zh) 一种基于用户背景的社区问答网站标签推荐方法
CN111078847A (zh) 电力用户意图识别方法、装置、计算机设备和存储介质
CN116414990B (zh) 一种车辆故障诊断与预防方法
CN110597966A (zh) 自动问答方法及装置
CN114818703B (zh) 基于BERT语言模型和TextCNN模型的多意图识别方法及系统
CN112016313A (zh) 口语化要素识别方法及装置、警情分析系统
CN115795038B (zh) 基于国产化深度学习框架的意图识别方法和装置
CN112632248A (zh) 问答方法、装置、计算机设备和存储介质
CN112836346A (zh) 基于cn和pca的电机故障诊断方法、电子设备及介质
CN117217277A (zh) 语言模型的预训练方法、装置、设备、存储介质及产品
CN114528835A (zh) 基于区间判别的半监督专业术语抽取方法、介质及设备
CN115146124A (zh) 问答系统应答方法及其装置、设备、介质、产品
CN110782221A (zh) 一种面试智能评测系统及方法
CN118037261A (zh) 基于知识图谱的输变电设备运维方法、装置、设备及介质
CN117828024A (zh) 一种插件检索方法、装置、存储介质及设备
CN113486174A (zh) 模型训练、阅读理解方法、装置、电子设备及存储介质
CN112287084A (zh) 一种基于集成学习的问答方法及系统
CN115545035B (zh) 一种文本实体识别模型及其构建方法、装置及应用
CN110287396A (zh) 文本匹配方法及装置
CN115062769A (zh) 基于知识蒸馏的模型训练方法、装置、设备及存储介质
CN114548325A (zh) 基于对偶对比学习的零样本关系抽取方法和系统
CN114333770A (zh) 自动发音评估方法、装置、设备及存储介质
CN118228718B (zh) 编码器处理方法、文本处理方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination