CN116737911A

CN116737911A - 基于深度学习的高血压问答方法及系统

Info

Publication number: CN116737911A
Application number: CN202311016091.3A
Authority: CN
Inventors: 李斯琦
Original assignee: Health Hope (beijing) Technology Co ltd
Current assignee: Health Hope (beijing) Technology Co ltd
Priority date: 2023-08-14
Filing date: 2023-08-14
Publication date: 2023-09-12

Abstract

本发明提供一种基于深度学习的高血压问答方法及系统，包括获取用户的语音或者文字的问答信息，通过语义解析模型并对所述问答信息进行语义解析，并基于语义解析的结果对所述问答信息进行分类，确定所述问答信息所属类别；基于所述问答信息以及所述问答信息所属类别，从预设的知识图谱或者问答知识库中，检索与所述问答信息相匹配的候选答案信息；对所述候选答案信息进行抽取，并计算所述候选答案信息的置信度，基于所述置信度从所述候选答案信息中筛选出目标答案信息，其中，所述目标答案信息包括置信度最高的候选答案信息。本发明的方法能够精准识别用户意图，给出专业的高血压医疗解答。

Description

基于深度学习的高血压问答方法及系统

技术领域

本发明涉及深度学习技术，尤其涉及一种基于深度学习的高血压问答方法及系统。

背景技术

以往通过搜索引擎获取知识的方式，浪费用户大量的时间。特别在医疗疾病询问的领域，信息源鱼龙混杂，用户辨别能力有限，存在被误导的可能性。传统的问答社区需人工编辑答案，用户等待时间较长，伴随着NLP、知识图谱等人工智能技术的发展，以问答的形式为用户提供即时的健康信息服务成为可能。

发明内容

本发明实施例提供一种基于深度学习的高血压问答方法及系统，能够至少解决现有技术中的部分问题，也即能够解决在医疗疾病询问的领域，信息源鱼龙混杂，用户辨别能力有限，存在被误导的可能性，传统的问答社区需人工编辑答案，用户等待时间较长的问题。

本发明实施例的第一方面，

提供一种基于深度学习的高血压问答方法，包括：

获取用户的语音或者文字的问答信息，通过语义解析模型并对所述问答信息进行语义解析，并基于语义解析的结果对所述问答信息进行分类，确定所述问答信息所属类别；

基于所述问答信息以及所述问答信息所属类别，从预设的知识图谱或者问答知识库中，检索与所述问答信息相匹配的候选答案信息；

对所述候选答案信息进行抽取，并计算所述候选答案信息的置信度，基于所述置信度从所述候选答案信息中筛选出目标答案信息，其中，所述目标答案信息包括置信度最高的候选答案信息。

在一种可选的实施方式中，

所述获取用户的语音或者文字的问答信息，通过语义解析模型并对所述问答信息进行语义解析，并基于语义解析的结果对所述问答信息进行分类，确定所述问答信息所属类别包括：

通过所述语义解析模型的前编码器对所述问答信息进行编码，并结合预设的随机上下文语义表示，根据所述语义解析模型的随机屏蔽机制随机屏蔽所述问答信息中的部分词语，获取编码结果；

基于所述编码结果，通过所述语义解析模型的多头注意力机制，结合所述语义解析模型的全连接网络与残差连接机制，逐层计算所述编码结果的上下文语义表示；

根据所述语义解析模型的多层网络，通过分类函数，基于所述编码结果以及所述编码结果的上下文语义表示进行分类，确定所述问答信息所属类别。

在一种可选的实施方式中，

所述逐层计算所述编码结果的上下文语义表示之后，所述方法还包括：

获取所述问答信息的历史上下文信息，并将所述历史上下文信息进行融合，确定融合历史上下文信息；

使用注意力机制，结合当前问答信息和所述融合历史上下文信息，计算当前问答信息在所述融合历史上下文信息中的问答权重。

在一种可选的实施方式中，

所述基于所述问答信息以及所述问答信息所属类别，从预设的知识图谱或者问答知识库中，检索与所述问答信息相匹配的候选答案信息包括：

基于高血压领域的知识图谱，建立实体、关系和属性的结构化表示；

使用预设的知识图谱中的实体和关系进行语义匹配，将问答信息转化为对应的实体和关系表示；

通过图匹配算法或图神经网络模型进行匹配和推理，检索与所述问答信息相匹配的候选答案信息。

在一种可选的实施方式中，

所述基于所述问答信息以及所述问答信息所属类别，从预设的知识图谱或者问答知识库中，检索与所述问答信息相匹配的候选答案信息还包括：

使用基于词向量的模型将问答信息和预设问答知识库中的文本表示为向量；

使用欧氏距离的度量方式，计算问答信息向量与预设问答知识库中文本向量之间的相似度；

根据相似度进行匹配，检索与所述问答信息相匹配的候选答案信息。

本发明实施例的第二方面，

提供一种基于深度学习的高血压问答系统，包括：

第一单元，用于获取用户的语音或者文字的问答信息，通过语义解析模型并对所述问答信息进行语义解析，并基于语义解析的结果对所述问答信息进行分类，确定所述问答信息所属类别；

第二单元，用于基于所述问答信息以及所述问答信息所属类别，从预设的知识图谱或者问答知识库中，检索与所述问答信息相匹配的候选答案信息；

第三单元，用于对所述候选答案信息进行抽取，并计算所述候选答案信息的置信度，基于所述置信度从所述候选答案信息中筛选出目标答案信息，其中，所述目标答案信息包括置信度最高的候选答案信息。

在一种可选的实施方式中，

所述第一单元还用于：

在一种可选的实施方式中，

所述系统还包括第四单元，所述第四单元用于：

在一种可选的实施方式中，

所述第二单元还用于：

在一种可选的实施方式中，

所述第二单元还用于：

本发明实施例的第三方面，

提供一种电子设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为调用所述存储器存储的指令，以执行前述所述的方法。

本发明实施例的第四方面，

提供一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现前述所述的方法。

本发明实施例的方法用户可以通过语音或者文字的形式询问自己的高血压相关问题，通过语音识别技术将用户语音转化为计算机可识别的文本信息，通过语义理解模型识别问题信息的领域和意图，获得语义信息，并通过知识图谱+专业问答知识库返回针对该问题的答案。精准识别用户意图，给出专业的高血压医疗解答。

附图说明

图1为本发明实施例基于深度学习的高血压问答方法的流程示意图；

图2为本发明实施例基于深度学习的高血压问答系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图1为本发明实施例基于深度学习的高血压问答方法的流程示意图，如图1所示，所述方法包括：

S101.获取用户的语音或者文字的问答信息，通过语义解析模型并对所述问答信息进行语义解析，并基于语义解析的结果对所述问答信息进行分类，确定所述问答信息所属类别；

S102.基于所述问答信息以及所述问答信息所属类别，从预设的知识图谱或者问答知识库中，检索与所述问答信息相匹配的候选答案信息；

S103.对所述候选答案信息进行抽取，并计算所述候选答案信息的置信度，基于所述置信度从所述候选答案信息中筛选出目标答案信息，其中，所述目标答案信息包括置信度最高的候选答案信息。

本发明实施例提供一种新型的智能问答系统，该系统能够满足用户对特定高血压医疗领域的问答需求，能够识别出用户的口语化表达并且匹配正确的答案。基于知识图谱+问答知识库的系统框架，包含知识图谱、词向量、卷积神经网络、语言模型等内容。其中，知识图谱是一种基于图的数据结构，由节点和边组成，把所有不同种类的信息连接在一起而得到的一个关系网络，提供了从“关系”的角度去分析问题的能力。词向量是指连续空间的词向量模型，是一种通过训练单词的向量对上下文向量进行预测或用上下文向量预测训练单词的向量表示方法。卷积神经网络是指由输入向量生成局部卷积神经元，并且生成过程中的权值信息被每个局部卷积神经元所共享的神经网络模型。

示例性地，本申请实施例的流程如下：

（1）信息获取理解：用户通过语音或文字的形式询问高血压问题，框架采用自然语言技术对问题进行深层次的理解，包括意图分析、命名实体识别、依存句法分析、词义消歧等。问句分类将用户提问归入不同的类别，使系统能够针对不同问题类型采用不同的答案反馈机制得到候选答案集合。问题焦点提取主要完成用户问题的信息需求的精确定位，包括相关信息或对话题起到描述性的作用，比如血压数值、症状、特殊人群、饮食种类等。

（2）信息检索及答案生成：根据问句理解得到的查询表示，信息检索模块负责从知识图谱、高血压疾病问答知识库中检索相关信息，问答知识库涵盖30万+的高血压专业知识，知识来源于医典文献，并由专业医疗团队进行审核。基于信息检索得到的检索信息，答案生成模块主要实现候选答案的抽取和答案的置信度计算，最终返回简洁性、正确性的答案。

（3）构建分析模型：采用开源框架TensorFlow进行网络构建及模型训练。TensorFlow是谷歌开源的机器学习框架，在用于深度学习研究时，可以方便构建自己的模型，同时自动计算反向梯度，在计算的各个环节都减少代码难度。基于CNN的语义表示学习是通过CNN对句子进行扫描，抽取特征，选择特征，最后组合成句子的表示向量。该模型通过多层交叠的卷积和最大池化操作，最终将句子表示为一个固定长度的向量。该架构可以通过在模型顶层增加一个分类器用于多种有监督的自然语言处理任务上。

在一种可选的实施方式中，

示例性地，可以使用TensorFlow构建一个基于CNN的语义表示学习模型，该模型将输入的问答信息作为句子序列，通过卷积和最大池化操作抽取特征，并将其组合成固定长度的句子表示向量。

还可以构建一个多层的语义解析模型，包括前编码器、随机屏蔽机制、多头注意力机制、全连接网络和残差连接机制。通过前编码器对问答信息进行编码，结合预设的随机上下文语义表示，并使用随机屏蔽机制随机屏蔽部分词语，获取编码结果。然后使用多头注意力机制和全连接网络逐层计算编码结果的上下文语义表示。

在语义解析模型的顶层增加一个分类器，该分类器利用编码结果以及编码结果的上下文语义表示进行分类，确定问答信息所属类别；

使用训练数据集对语义表示学习模型和语义解析模型进行训练。通过反向传播和优化算法更新模型参数，以提高模型在分类任务上的性能。

在一种可选的实施方式中，

在上述步骤中，获取问答信息的历史上下文信息，并将其进行融合，以确定融合后的历史上下文信息。这可以通过将历史上下文信息作为序列输入到一个循环神经网络（如LSTM）中，并使用最后一个隐藏状态或注意力机制得到一个表示整个历史上下文的向量。

利用注意力机制，结合当前问答信息和融合后的历史上下文信息，计算当前问答信息在历史上下文中的权重。这可以通过计算当前问答信息与历史上下文信息之间的相似度或相关性来实现。常用的注意力机制有加性注意力、点积注意力和多头注意力等。

假设历史上下文信息经过融合后的表示为 H，当前问答信息的表示为 Q。为了计算当前问答信息在历史上下文中的权重，可以使用加性注意力机制，其计算过程如下：

计算注意力分数：使用一个全连接层将融合历史上下文信息 H 和当前问答信息Q 进行映射，得到注意力分数 A：A = softmax(W[H;Q] + b)，

其中，W 和 b 是可学习的参数，[H; Q] 表示将融合历史上下文信息和当前问答信息在某个维度上拼接。

计算加权表示：将融合历史上下文信息 H 和注意力分数 A 进行加权求和，得到当前问答信息在历史上下文中的加权表示 R：R = sum(H * A)，

其中，* 表示按元素相乘，sum 表示按维度求和。

通过上述公式，可以计算出当前问答信息在历史上下文中的加权表示 R，用于后续的意图识别或其他任务。

假设我们有一个对话历史上下文，其中包含三个问答信息：

历史上下文：["什么是高血压？", "高血压有哪些症状？", "如何控制高血压？"]

当前问答信息： "高血压的危害有哪些？"

首先，通过语义解析模型对历史上下文进行编码得到H，对当前问答信息进行编码得到Q，然后，使用上述公式计算注意力分数A，并得到加权表示 R。

这样，我们就可以利用融合历史上下文信息和当前问答信息的加权表示 R 进行后续的意图识别或其他任务。

在一种可选的实施方式中，

基于高血压领域的知识，建立实体、关系和属性的结构化表示。可以使用图数据库或图表示学习方法来构建知识图谱。实体可以表示高血压相关的疾病、症状、治疗方法等，关系可以表示它们之间的联系，属性可以表示实体的特征或描述信息。

根据预设的知识图谱中的实体和关系，将问答信息转化为对应的实体和关系表示。可以使用自然语言处理技术，如命名实体识别和关系抽取，将问答信息中的关键词识别为实体，识别实体之间的语义关系。

基于建立的知识图谱和转化后的实体关系表示，使用图匹配算法或图神经网络模型进行匹配和推理，检索与问答信息相匹配的候选答案信息。可以考虑使用图遍历算法、子图匹配算法或基于图神经网络的模型，如Graph Convolutional Networks (GCN)、GraphAttention Networks (GAT)等。

其中，建立知识图谱表示可以包括：定义实体类型、关系类型和属性类型，构建实体-关系-属性三元组。使用图数据库或图表示学习方法，如Neo4j、DGL等，构建知识图谱。

其中，问答信息转化为实体和关系表示可以包括：使用命名实体识别技术，如NER模型，识别问答信息中的实体。使用关系抽取技术，如RE模型，抽取问答信息中实体之间的关系。

可以使用子图匹配算法，如Subgraph Isomorphism、Graph Edit Distance等，匹配问答信息中的实体和关系与知识图谱中的对应部分。

其中，构建图神经网络模型，如GCN、GAT等，利用知识图谱中的实体和关系作为节点和边的特征，进行图表示学习和推理。

假设我们有一个知识图谱表示高血压领域的实体、关系和属性，其中包含实体类型（疾病、症状、治疗方法等）、关系类型（引起、治疗、具有症状等）和属性类型（描述、特征等）。知识图谱中的实体包括"高血压"、"头痛"、"降压药"等，关系包括"具有症状"、"治疗"等。

问答信息："我有头痛的症状，应该怎么办？"

建立知识图谱表示：实体类型：疾病（高血压）、症状（头痛）、治疗方法（降压药）；关系类型：具有症状、治疗；属性类型：描述、特征等。

问答信息转化为实体和关系表示：问答信息中的实体："头痛"关系："具有症状"。

图匹配和推理：使用子图匹配算法或图神经网络模型，将问答信息中的实体和关系与知识图谱中的对应部分进行匹配和推理。

例如，通过图匹配算法，在知识图谱中找到具有症状为"头痛"的实体，即找到相关的疾病，如"高血压"。作为候选答案返回给用户。

另一种方法是使用图神经网络模型，通过构建图神经网络，将知识图谱中的实体和关系作为节点和边的特征，学习得到图的表示向量。然后，将问答信息中的实体和关系转化为对应的节点和边，计算其在图中的表示向量，通过相似度计算或分类函数，判断其与知识图谱中的哪些实体相关联。

在一种可选的实施方式中，

示例性地，文本表示为向量可以使用Word2Vec模型将问题和答案文本表示为向量。相似度计算：对于给定的问答信息，将其表示为向量。计算问答信息向量与预设问答知识库中每个问题向量的欧氏距离。

匹配和检索：设置相似度阈值为0.5。筛选出与问答信息相似度高于阈值的问题，作为候选答案。返回候选答案的对应答案作为最终答案。

例如，对于输入的问答信息："我有头痛的症状，应该怎么办？"

将该问答信息表示为向量。

计算与知识库中问题1的相似度：similarity = sqrt(sum((问答信息向量 - 问题1向量)^2))，相似度为0.6，大于设定的相似度阈值0.5。返回答案1作为候选答案。

本发明实施例的第二方面，

提供一种基于深度学习的高血压问答系统，图2为本发明实施例基于深度学习的高血压问答系统的结构示意图，包括：

在一种可选的实施方式中，

所述第一单元还用于：

在一种可选的实施方式中，

所述系统还包括第四单元，所述第四单元用于：

在一种可选的实施方式中，

所述第二单元还用于：

在一种可选的实施方式中，

所述第二单元还用于：

本发明实施例的第三方面，

提供一种电子设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

本发明实施例的第四方面，

本发明可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于执行本发明的各个方面的计算机可读程序指令。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于深度学习的高血压问答方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取用户的语音或者文字的问答信息，通过语义解析模型并对所述问答信息进行语义解析，并基于语义解析的结果对所述问答信息进行分类，确定所述问答信息所属类别包括：

3.根据权利要求2所述的方法，其特征在于，所述逐层计算所述编码结果的上下文语义表示之后，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，所述基于所述问答信息以及所述问答信息所属类别，从预设的知识图谱或者问答知识库中，检索与所述问答信息相匹配的候选答案信息包括：

5.根据权利要求4所述的方法，其特征在于，所述基于所述问答信息以及所述问答信息所属类别，从预设的知识图谱或者问答知识库中，检索与所述问答信息相匹配的候选答案信息还包括：

6.一种基于深度学习的高血压问答系统，其特征在于，包括：

7.根据权利要求6所述的系统，其特征在于，所述第一单元还用于：

8.根据权利要求7所述的系统，其特征在于，所述系统还包括第四单元，所述第四单元用于：

9.根据权利要求6所述的系统，其特征在于，所述第二单元还用于：

10.根据权利要求6所述的系统，其特征在于，所述第二单元还用于：