CN116737911A - 基于深度学习的高血压问答方法及系统 - Google Patents
基于深度学习的高血压问答方法及系统 Download PDFInfo
- Publication number
- CN116737911A CN116737911A CN202311016091.3A CN202311016091A CN116737911A CN 116737911 A CN116737911 A CN 116737911A CN 202311016091 A CN202311016091 A CN 202311016091A CN 116737911 A CN116737911 A CN 116737911A
- Authority
- CN
- China
- Prior art keywords
- question
- answer information
- information
- answer
- semantic analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010020772 Hypertension Diseases 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000013135 deep learning Methods 0.000 title claims abstract description 15
- 238000004458 analytical method Methods 0.000 claims abstract description 65
- 238000012216 screening Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 44
- 230000007246 mechanism Effects 0.000 claims description 33
- 230000004927 fusion Effects 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 13
- 238000003062 neural network model Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 7
- 238000005259 measurement Methods 0.000 claims description 6
- 239000008155 medical solution Substances 0.000 abstract description 3
- 208000024891 symptom Diseases 0.000 description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 206010019233 Headaches Diseases 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 231100000869 headache Toxicity 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 239000002220 antihypertensive agent Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 229940030600 antihypertensive agent Drugs 0.000 description 1
- 229940127088 antihypertensive drug Drugs 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于深度学习的高血压问答方法及系统,包括获取用户的语音或者文字的问答信息,通过语义解析模型并对所述问答信息进行语义解析,并基于语义解析的结果对所述问答信息进行分类,确定所述问答信息所属类别;基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息;对所述候选答案信息进行抽取,并计算所述候选答案信息的置信度,基于所述置信度从所述候选答案信息中筛选出目标答案信息,其中,所述目标答案信息包括置信度最高的候选答案信息。本发明的方法能够精准识别用户意图,给出专业的高血压医疗解答。
Description
技术领域
本发明涉及深度学习技术,尤其涉及一种基于深度学习的高血压问答方法及系统。
背景技术
以往通过搜索引擎获取知识的方式,浪费用户大量的时间。特别在医疗疾病询问的领域,信息源鱼龙混杂,用户辨别能力有限,存在被误导的可能性。传统的问答社区需人工编辑答案,用户等待时间较长,伴随着NLP、知识图谱等人工智能技术的发展,以问答的形式为用户提供即时的健康信息服务成为可能。
发明内容
本发明实施例提供一种基于深度学习的高血压问答方法及系统,能够至少解决现有技术中的部分问题,也即能够解决在医疗疾病询问的领域,信息源鱼龙混杂,用户辨别能力有限,存在被误导的可能性,传统的问答社区需人工编辑答案,用户等待时间较长的问题。
本发明实施例的第一方面,
提供一种基于深度学习的高血压问答方法,包括:
获取用户的语音或者文字的问答信息,通过语义解析模型并对所述问答信息进行语义解析,并基于语义解析的结果对所述问答信息进行分类,确定所述问答信息所属类别;
基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息;
对所述候选答案信息进行抽取,并计算所述候选答案信息的置信度,基于所述置信度从所述候选答案信息中筛选出目标答案信息,其中,所述目标答案信息包括置信度最高的候选答案信息。
在一种可选的实施方式中,
所述获取用户的语音或者文字的问答信息,通过语义解析模型并对所述问答信息进行语义解析,并基于语义解析的结果对所述问答信息进行分类,确定所述问答信息所属类别包括:
通过所述语义解析模型的前编码器对所述问答信息进行编码,并结合预设的随机上下文语义表示,根据所述语义解析模型的随机屏蔽机制随机屏蔽所述问答信息中的部分词语,获取编码结果;
基于所述编码结果,通过所述语义解析模型的多头注意力机制,结合所述语义解析模型的全连接网络与残差连接机制,逐层计算所述编码结果的上下文语义表示;
根据所述语义解析模型的多层网络,通过分类函数,基于所述编码结果以及所述编码结果的上下文语义表示进行分类,确定所述问答信息所属类别。
在一种可选的实施方式中,
所述逐层计算所述编码结果的上下文语义表示之后,所述方法还包括:
获取所述问答信息的历史上下文信息,并将所述历史上下文信息进行融合,确定融合历史上下文信息;
使用注意力机制,结合当前问答信息和所述融合历史上下文信息,计算当前问答信息在所述融合历史上下文信息中的问答权重。
在一种可选的实施方式中,
所述基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息包括:
基于高血压领域的知识图谱,建立实体、关系和属性的结构化表示;
使用预设的知识图谱中的实体和关系进行语义匹配,将问答信息转化为对应的实体和关系表示;
通过图匹配算法或图神经网络模型进行匹配和推理,检索与所述问答信息相匹配的候选答案信息。
在一种可选的实施方式中,
所述基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息还包括:
使用基于词向量的模型将问答信息和预设问答知识库中的文本表示为向量;
使用欧氏距离的度量方式,计算问答信息向量与预设问答知识库中文本向量之间的相似度;
根据相似度进行匹配,检索与所述问答信息相匹配的候选答案信息。
本发明实施例的第二方面,
提供一种基于深度学习的高血压问答系统,包括:
第一单元,用于获取用户的语音或者文字的问答信息,通过语义解析模型并对所述问答信息进行语义解析,并基于语义解析的结果对所述问答信息进行分类,确定所述问答信息所属类别;
第二单元,用于基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息;
第三单元,用于对所述候选答案信息进行抽取,并计算所述候选答案信息的置信度,基于所述置信度从所述候选答案信息中筛选出目标答案信息,其中,所述目标答案信息包括置信度最高的候选答案信息。
在一种可选的实施方式中,
所述第一单元还用于:
通过所述语义解析模型的前编码器对所述问答信息进行编码,并结合预设的随机上下文语义表示,根据所述语义解析模型的随机屏蔽机制随机屏蔽所述问答信息中的部分词语,获取编码结果;
基于所述编码结果,通过所述语义解析模型的多头注意力机制,结合所述语义解析模型的全连接网络与残差连接机制,逐层计算所述编码结果的上下文语义表示;
根据所述语义解析模型的多层网络,通过分类函数,基于所述编码结果以及所述编码结果的上下文语义表示进行分类,确定所述问答信息所属类别。
在一种可选的实施方式中,
所述系统还包括第四单元,所述第四单元用于:
获取所述问答信息的历史上下文信息,并将所述历史上下文信息进行融合,确定融合历史上下文信息;
使用注意力机制,结合当前问答信息和所述融合历史上下文信息,计算当前问答信息在所述融合历史上下文信息中的问答权重。
在一种可选的实施方式中,
所述第二单元还用于:
基于高血压领域的知识图谱,建立实体、关系和属性的结构化表示;
使用预设的知识图谱中的实体和关系进行语义匹配,将问答信息转化为对应的实体和关系表示;
通过图匹配算法或图神经网络模型进行匹配和推理,检索与所述问答信息相匹配的候选答案信息。
在一种可选的实施方式中,
所述第二单元还用于:
使用基于词向量的模型将问答信息和预设问答知识库中的文本表示为向量;
使用欧氏距离的度量方式,计算问答信息向量与预设问答知识库中文本向量之间的相似度;
根据相似度进行匹配,检索与所述问答信息相匹配的候选答案信息。
本发明实施例的第三方面,
提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
本发明实施例的第四方面,
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
本发明实施例的方法用户可以通过语音或者文字的形式询问自己的高血压相关问题,通过语音识别技术将用户语音转化为计算机可识别的文本信息,通过语义理解模型识别问题信息的领域和意图,获得语义信息,并通过知识图谱+专业问答知识库返回针对该问题的答案。精准识别用户意图,给出专业的高血压医疗解答。
附图说明
图1为本发明实施例基于深度学习的高血压问答方法的流程示意图;
图2为本发明实施例基于深度学习的高血压问答系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本发明实施例基于深度学习的高血压问答方法的流程示意图,如图1所示,所述方法包括:
S101.获取用户的语音或者文字的问答信息,通过语义解析模型并对所述问答信息进行语义解析,并基于语义解析的结果对所述问答信息进行分类,确定所述问答信息所属类别;
S102.基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息;
S103.对所述候选答案信息进行抽取,并计算所述候选答案信息的置信度,基于所述置信度从所述候选答案信息中筛选出目标答案信息,其中,所述目标答案信息包括置信度最高的候选答案信息。
本发明实施例提供一种新型的智能问答系统,该系统能够满足用户对特定高血压医疗领域的问答需求,能够识别出用户的口语化表达并且匹配正确的答案。基于知识图谱+问答知识库的系统框架,包含知识图谱、词向量、卷积神经网络、语言模型等内容。其中,知识图谱是一种基于图的数据结构,由节点和边组成,把所有不同种类的信息连接在一起而得到的一个关系网络,提供了从“关系”的角度去分析问题的能力。词向量是指连续空间的词向量模型,是一种通过训练单词的向量对上下文向量进行预测或用上下文向量预测训练单词的向量表示方法。卷积神经网络是指由输入向量生成局部卷积神经元,并且生成过程中的权值信息被每个局部卷积神经元所共享的神经网络模型。
示例性地,本申请实施例的流程如下:
(1)信息获取理解:用户通过语音或文字的形式询问高血压问题,框架采用自然语言技术对问题进行深层次的理解,包括意图分析、命名实体识别、依存句法分析、词义消歧等。问句分类将用户提问归入不同的类别,使系统能够针对不同问题类型采用不同的答案反馈机制得到候选答案集合。问题焦点提取主要完成用户问题的信息需求的精确定位,包括相关信息或对话题起到描述性的作用,比如血压数值、症状、特殊人群、饮食种类等。
(2)信息检索及答案生成:根据问句理解得到的查询表示,信息检索模块负责从知识图谱、高血压疾病问答知识库中检索相关信息,问答知识库涵盖30万+的高血压专业知识,知识来源于医典文献,并由专业医疗团队进行审核。基于信息检索得到的检索信息,答案生成模块主要实现候选答案的抽取和答案的置信度计算,最终返回简洁性、正确性的答案。
(3)构建分析模型:采用开源框架TensorFlow进行网络构建及模型训练。TensorFlow是谷歌开源的机器学习框架,在用于深度学习研究时,可以方便构建自己的模型,同时自动计算反向梯度,在计算的各个环节都减少代码难度。基于CNN的语义表示学习是通过CNN对句子进行扫描,抽取特征,选择特征,最后组合成句子的表示向量。该模型通过多层交叠的卷积和最大池化操作,最终将句子表示为一个固定长度的向量。该架构可以通过在模型顶层增加一个分类器用于多种有监督的自然语言处理任务上。
在一种可选的实施方式中,
所述获取用户的语音或者文字的问答信息,通过语义解析模型并对所述问答信息进行语义解析,并基于语义解析的结果对所述问答信息进行分类,确定所述问答信息所属类别包括:
通过所述语义解析模型的前编码器对所述问答信息进行编码,并结合预设的随机上下文语义表示,根据所述语义解析模型的随机屏蔽机制随机屏蔽所述问答信息中的部分词语,获取编码结果;
基于所述编码结果,通过所述语义解析模型的多头注意力机制,结合所述语义解析模型的全连接网络与残差连接机制,逐层计算所述编码结果的上下文语义表示;
根据所述语义解析模型的多层网络,通过分类函数,基于所述编码结果以及所述编码结果的上下文语义表示进行分类,确定所述问答信息所属类别。
示例性地,可以使用TensorFlow构建一个基于CNN的语义表示学习模型,该模型将输入的问答信息作为句子序列,通过卷积和最大池化操作抽取特征,并将其组合成固定长度的句子表示向量。
还可以构建一个多层的语义解析模型,包括前编码器、随机屏蔽机制、多头注意力机制、全连接网络和残差连接机制。通过前编码器对问答信息进行编码,结合预设的随机上下文语义表示,并使用随机屏蔽机制随机屏蔽部分词语,获取编码结果。然后使用多头注意力机制和全连接网络逐层计算编码结果的上下文语义表示。
在语义解析模型的顶层增加一个分类器,该分类器利用编码结果以及编码结果的上下文语义表示进行分类,确定问答信息所属类别;
使用训练数据集对语义表示学习模型和语义解析模型进行训练。通过反向传播和优化算法更新模型参数,以提高模型在分类任务上的性能。
在一种可选的实施方式中,
所述逐层计算所述编码结果的上下文语义表示之后,所述方法还包括:
获取所述问答信息的历史上下文信息,并将所述历史上下文信息进行融合,确定融合历史上下文信息;
使用注意力机制,结合当前问答信息和所述融合历史上下文信息,计算当前问答信息在所述融合历史上下文信息中的问答权重。
在上述步骤中,获取问答信息的历史上下文信息,并将其进行融合,以确定融合后的历史上下文信息。这可以通过将历史上下文信息作为序列输入到一个循环神经网络(如LSTM)中,并使用最后一个隐藏状态或注意力机制得到一个表示整个历史上下文的向量。
利用注意力机制,结合当前问答信息和融合后的历史上下文信息,计算当前问答信息在历史上下文中的权重。这可以通过计算当前问答信息与历史上下文信息之间的相似度或相关性来实现。常用的注意力机制有加性注意力、点积注意力和多头注意力等。
假设历史上下文信息经过融合后的表示为 H,当前问答信息的表示为 Q。为了计算当前问答信息在历史上下文中的权重,可以使用加性注意力机制,其计算过程如下:
计算注意力分数:使用一个全连接层将融合历史上下文信息 H 和当前问答信息Q 进行映射,得到注意力分数 A:A = softmax(W[H;Q] + b),
其中,W 和 b 是可学习的参数,[H; Q] 表示将融合历史上下文信息和当前问答信息在某个维度上拼接。
计算加权表示:将融合历史上下文信息 H 和注意力分数 A 进行加权求和,得到当前问答信息在历史上下文中的加权表示 R:R = sum(H * A),
其中,* 表示按元素相乘,sum 表示按维度求和。
通过上述公式,可以计算出当前问答信息在历史上下文中的加权表示 R,用于后续的意图识别或其他任务。
假设我们有一个对话历史上下文,其中包含三个问答信息:
历史上下文:["什么是高血压?", "高血压有哪些症状?", "如何控制高血压?"]
当前问答信息: "高血压的危害有哪些?"
首先,通过语义解析模型对历史上下文进行编码得到H,对当前问答信息进行编码得到Q,然后,使用上述公式计算注意力分数A,并得到加权表示 R。
这样,我们就可以利用融合历史上下文信息和当前问答信息的加权表示 R 进行后续的意图识别或其他任务。
在一种可选的实施方式中,
所述基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息包括:
基于高血压领域的知识图谱,建立实体、关系和属性的结构化表示;
使用预设的知识图谱中的实体和关系进行语义匹配,将问答信息转化为对应的实体和关系表示;
通过图匹配算法或图神经网络模型进行匹配和推理,检索与所述问答信息相匹配的候选答案信息。
基于高血压领域的知识,建立实体、关系和属性的结构化表示。可以使用图数据库或图表示学习方法来构建知识图谱。实体可以表示高血压相关的疾病、症状、治疗方法等,关系可以表示它们之间的联系,属性可以表示实体的特征或描述信息。
根据预设的知识图谱中的实体和关系,将问答信息转化为对应的实体和关系表示。可以使用自然语言处理技术,如命名实体识别和关系抽取,将问答信息中的关键词识别为实体,识别实体之间的语义关系。
基于建立的知识图谱和转化后的实体关系表示,使用图匹配算法或图神经网络模型进行匹配和推理,检索与问答信息相匹配的候选答案信息。可以考虑使用图遍历算法、子图匹配算法或基于图神经网络的模型,如Graph Convolutional Networks (GCN)、GraphAttention Networks (GAT)等。
其中,建立知识图谱表示可以包括:定义实体类型、关系类型和属性类型,构建实体-关系-属性三元组。使用图数据库或图表示学习方法,如Neo4j、DGL等,构建知识图谱。
其中,问答信息转化为实体和关系表示可以包括:使用命名实体识别技术,如NER模型,识别问答信息中的实体。使用关系抽取技术,如RE模型,抽取问答信息中实体之间的关系。
可以使用子图匹配算法,如Subgraph Isomorphism、Graph Edit Distance等,匹配问答信息中的实体和关系与知识图谱中的对应部分。
其中,构建图神经网络模型,如GCN、GAT等,利用知识图谱中的实体和关系作为节点和边的特征,进行图表示学习和推理。
假设我们有一个知识图谱表示高血压领域的实体、关系和属性,其中包含实体类型(疾病、症状、治疗方法等)、关系类型(引起、治疗、具有症状等)和属性类型(描述、特征等)。知识图谱中的实体包括"高血压"、"头痛"、"降压药"等,关系包括"具有症状"、"治疗"等。
问答信息:"我有头痛的症状,应该怎么办?"
建立知识图谱表示:实体类型:疾病(高血压)、症状(头痛)、治疗方法(降压药);关系类型:具有症状、治疗;属性类型:描述、特征等。
问答信息转化为实体和关系表示:问答信息中的实体:"头痛"关系:"具有症状"。
图匹配和推理:使用子图匹配算法或图神经网络模型,将问答信息中的实体和关系与知识图谱中的对应部分进行匹配和推理。
例如,通过图匹配算法,在知识图谱中找到具有症状为"头痛"的实体,即找到相关的疾病,如"高血压"。作为候选答案返回给用户。
另一种方法是使用图神经网络模型,通过构建图神经网络,将知识图谱中的实体和关系作为节点和边的特征,学习得到图的表示向量。然后,将问答信息中的实体和关系转化为对应的节点和边,计算其在图中的表示向量,通过相似度计算或分类函数,判断其与知识图谱中的哪些实体相关联。
在一种可选的实施方式中,
所述基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息还包括:
使用基于词向量的模型将问答信息和预设问答知识库中的文本表示为向量;
使用欧氏距离的度量方式,计算问答信息向量与预设问答知识库中文本向量之间的相似度;
根据相似度进行匹配,检索与所述问答信息相匹配的候选答案信息。
示例性地,文本表示为向量可以使用Word2Vec模型将问题和答案文本表示为向量。相似度计算:对于给定的问答信息,将其表示为向量。计算问答信息向量与预设问答知识库中每个问题向量的欧氏距离。
匹配和检索:设置相似度阈值为0.5。筛选出与问答信息相似度高于阈值的问题,作为候选答案。返回候选答案的对应答案作为最终答案。
例如,对于输入的问答信息:"我有头痛的症状,应该怎么办?"
将该问答信息表示为向量。
计算与知识库中问题1的相似度:similarity = sqrt(sum((问答信息向量 - 问题1向量)^2)),相似度为0.6,大于设定的相似度阈值0.5。返回答案1作为候选答案。
本发明实施例的第二方面,
提供一种基于深度学习的高血压问答系统,图2为本发明实施例基于深度学习的高血压问答系统的结构示意图,包括:
第一单元,用于获取用户的语音或者文字的问答信息,通过语义解析模型并对所述问答信息进行语义解析,并基于语义解析的结果对所述问答信息进行分类,确定所述问答信息所属类别;
第二单元,用于基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息;
第三单元,用于对所述候选答案信息进行抽取,并计算所述候选答案信息的置信度,基于所述置信度从所述候选答案信息中筛选出目标答案信息,其中,所述目标答案信息包括置信度最高的候选答案信息。
在一种可选的实施方式中,
所述第一单元还用于:
通过所述语义解析模型的前编码器对所述问答信息进行编码,并结合预设的随机上下文语义表示,根据所述语义解析模型的随机屏蔽机制随机屏蔽所述问答信息中的部分词语,获取编码结果;
基于所述编码结果,通过所述语义解析模型的多头注意力机制,结合所述语义解析模型的全连接网络与残差连接机制,逐层计算所述编码结果的上下文语义表示;
根据所述语义解析模型的多层网络,通过分类函数,基于所述编码结果以及所述编码结果的上下文语义表示进行分类,确定所述问答信息所属类别。
在一种可选的实施方式中,
所述系统还包括第四单元,所述第四单元用于:
获取所述问答信息的历史上下文信息,并将所述历史上下文信息进行融合,确定融合历史上下文信息;
使用注意力机制,结合当前问答信息和所述融合历史上下文信息,计算当前问答信息在所述融合历史上下文信息中的问答权重。
在一种可选的实施方式中,
所述第二单元还用于:
基于高血压领域的知识图谱,建立实体、关系和属性的结构化表示;
使用预设的知识图谱中的实体和关系进行语义匹配,将问答信息转化为对应的实体和关系表示;
通过图匹配算法或图神经网络模型进行匹配和推理,检索与所述问答信息相匹配的候选答案信息。
在一种可选的实施方式中,
所述第二单元还用于:
使用基于词向量的模型将问答信息和预设问答知识库中的文本表示为向量;
使用欧氏距离的度量方式,计算问答信息向量与预设问答知识库中文本向量之间的相似度;
根据相似度进行匹配,检索与所述问答信息相匹配的候选答案信息。
本发明实施例的第三方面,
提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
本发明实施例的第四方面,
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
本发明实施例的方法用户可以通过语音或者文字的形式询问自己的高血压相关问题,通过语音识别技术将用户语音转化为计算机可识别的文本信息,通过语义理解模型识别问题信息的领域和意图,获得语义信息,并通过知识图谱+专业问答知识库返回针对该问题的答案。精准识别用户意图,给出专业的高血压医疗解答。
本发明可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本发明的各个方面的计算机可读程序指令。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于深度学习的高血压问答方法,其特征在于,包括:
获取用户的语音或者文字的问答信息,通过语义解析模型并对所述问答信息进行语义解析,并基于语义解析的结果对所述问答信息进行分类,确定所述问答信息所属类别;
基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息;
对所述候选答案信息进行抽取,并计算所述候选答案信息的置信度,基于所述置信度从所述候选答案信息中筛选出目标答案信息,其中,所述目标答案信息包括置信度最高的候选答案信息。
2.根据权利要求1所述的方法,其特征在于,所述获取用户的语音或者文字的问答信息,通过语义解析模型并对所述问答信息进行语义解析,并基于语义解析的结果对所述问答信息进行分类,确定所述问答信息所属类别包括:
通过所述语义解析模型的前编码器对所述问答信息进行编码,并结合预设的随机上下文语义表示,根据所述语义解析模型的随机屏蔽机制随机屏蔽所述问答信息中的部分词语,获取编码结果;
基于所述编码结果,通过所述语义解析模型的多头注意力机制,结合所述语义解析模型的全连接网络与残差连接机制,逐层计算所述编码结果的上下文语义表示;
根据所述语义解析模型的多层网络,通过分类函数,基于所述编码结果以及所述编码结果的上下文语义表示进行分类,确定所述问答信息所属类别。
3.根据权利要求2所述的方法,其特征在于,所述逐层计算所述编码结果的上下文语义表示之后,所述方法还包括:
获取所述问答信息的历史上下文信息,并将所述历史上下文信息进行融合,确定融合历史上下文信息;
使用注意力机制,结合当前问答信息和所述融合历史上下文信息,计算当前问答信息在所述融合历史上下文信息中的问答权重。
4.根据权利要求1所述的方法,其特征在于,所述基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息包括:
基于高血压领域的知识图谱,建立实体、关系和属性的结构化表示;
使用预设的知识图谱中的实体和关系进行语义匹配,将问答信息转化为对应的实体和关系表示;
通过图匹配算法或图神经网络模型进行匹配和推理,检索与所述问答信息相匹配的候选答案信息。
5.根据权利要求4所述的方法,其特征在于,所述基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息还包括:
使用基于词向量的模型将问答信息和预设问答知识库中的文本表示为向量;
使用欧氏距离的度量方式,计算问答信息向量与预设问答知识库中文本向量之间的相似度;
根据相似度进行匹配,检索与所述问答信息相匹配的候选答案信息。
6.一种基于深度学习的高血压问答系统,其特征在于,包括:
第一单元,用于获取用户的语音或者文字的问答信息,通过语义解析模型并对所述问答信息进行语义解析,并基于语义解析的结果对所述问答信息进行分类,确定所述问答信息所属类别;
第二单元,用于基于所述问答信息以及所述问答信息所属类别,从预设的知识图谱或者问答知识库中,检索与所述问答信息相匹配的候选答案信息;
第三单元,用于对所述候选答案信息进行抽取,并计算所述候选答案信息的置信度,基于所述置信度从所述候选答案信息中筛选出目标答案信息,其中,所述目标答案信息包括置信度最高的候选答案信息。
7.根据权利要求6所述的系统,其特征在于,所述第一单元还用于:
通过所述语义解析模型的前编码器对所述问答信息进行编码,并结合预设的随机上下文语义表示,根据所述语义解析模型的随机屏蔽机制随机屏蔽所述问答信息中的部分词语,获取编码结果;
基于所述编码结果,通过所述语义解析模型的多头注意力机制,结合所述语义解析模型的全连接网络与残差连接机制,逐层计算所述编码结果的上下文语义表示;
根据所述语义解析模型的多层网络,通过分类函数,基于所述编码结果以及所述编码结果的上下文语义表示进行分类,确定所述问答信息所属类别。
8.根据权利要求7所述的系统,其特征在于,所述系统还包括第四单元,所述第四单元用于:
获取所述问答信息的历史上下文信息,并将所述历史上下文信息进行融合,确定融合历史上下文信息;
使用注意力机制,结合当前问答信息和所述融合历史上下文信息,计算当前问答信息在所述融合历史上下文信息中的问答权重。
9.根据权利要求6所述的系统,其特征在于,所述第二单元还用于:
基于高血压领域的知识图谱,建立实体、关系和属性的结构化表示;
使用预设的知识图谱中的实体和关系进行语义匹配,将问答信息转化为对应的实体和关系表示;
通过图匹配算法或图神经网络模型进行匹配和推理,检索与所述问答信息相匹配的候选答案信息。
10.根据权利要求6所述的系统,其特征在于,所述第二单元还用于:
使用基于词向量的模型将问答信息和预设问答知识库中的文本表示为向量;
使用欧氏距离的度量方式,计算问答信息向量与预设问答知识库中文本向量之间的相似度;
根据相似度进行匹配,检索与所述问答信息相匹配的候选答案信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311016091.3A CN116737911A (zh) | 2023-08-14 | 2023-08-14 | 基于深度学习的高血压问答方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311016091.3A CN116737911A (zh) | 2023-08-14 | 2023-08-14 | 基于深度学习的高血压问答方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116737911A true CN116737911A (zh) | 2023-09-12 |
Family
ID=87904744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311016091.3A Pending CN116737911A (zh) | 2023-08-14 | 2023-08-14 | 基于深度学习的高血压问答方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116737911A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117891929A (zh) * | 2024-03-18 | 2024-04-16 | 南京华飞数据技术有限公司 | 改进型深度学习算法的知识图谱智能问答信息识别方法 |
-
2023
- 2023-08-14 CN CN202311016091.3A patent/CN116737911A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117891929A (zh) * | 2024-03-18 | 2024-04-16 | 南京华飞数据技术有限公司 | 改进型深度学习算法的知识图谱智能问答信息识别方法 |
CN117891929B (zh) * | 2024-03-18 | 2024-05-17 | 南京华飞数据技术有限公司 | 改进型深度学习算法的知识图谱智能问答信息识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109271505B (zh) | 一种基于问题答案对的问答系统实现方法 | |
CN110364251B (zh) | 一种基于机器阅读理解的智能交互导诊咨询系统 | |
Zhu et al. | Knowledge-based question answering by tree-to-sequence learning | |
CN110377715A (zh) | 基于法律知识图谱的推理式精准智能问答方法 | |
CN112015868B (zh) | 基于知识图谱补全的问答方法 | |
CN111563149B (zh) | 一种用于中文知识图谱问答系统的实体链接方法 | |
CN111914556B (zh) | 基于情感语义转移图谱的情感引导方法及系统 | |
CN111400461B (zh) | 智能客服问题匹配方法及装置 | |
CN111984766A (zh) | 缺失语义补全方法及装置 | |
CN112380325A (zh) | 基于联合知识嵌入模型和事实记忆网络的知识图谱问答系统 | |
CN116127095A (zh) | 一种序列模型与知识图谱结合的问答方法 | |
CN115048447B (zh) | 一种基于智能语义补全的数据库自然语言接口系统 | |
CN113962219A (zh) | 面向电力变压器知识检索和问答的语义匹配方法及系统 | |
CN111125316B (zh) | 一种融合多损失函数及注意力机制的知识库问答方法 | |
CN111339269A (zh) | 模板自动生成的知识图谱问答训练及应用服务系统 | |
CN115599899B (zh) | 基于飞行器知识图谱的智能问答方法、系统、设备及介质 | |
CN113569023A (zh) | 一种基于知识图谱的中文医药问答系统及方法 | |
CN116991869A (zh) | 一种基于nlp语言模型自动生成数据库查询语句的方法 | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
CN112115242A (zh) | 一种基于朴素贝叶斯分类算法的智能客服问答系统 | |
CN112632250A (zh) | 一种多文档场景下问答方法及系统 | |
CN116992007B (zh) | 基于问题意图理解的限定问答系统 | |
CN116737911A (zh) | 基于深度学习的高血压问答方法及系统 | |
CN116955562A (zh) | 一种基于人工智能技术的智能客服系统 | |
CN116561264A (zh) | 一种基于知识图谱的智能问答系统的构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |