CN111274373A - 一种基于知识图谱的电子病历问答方法及系统 - Google Patents

一种基于知识图谱的电子病历问答方法及系统 Download PDF

Info

Publication number
CN111274373A
CN111274373A CN202010047420.0A CN202010047420A CN111274373A CN 111274373 A CN111274373 A CN 111274373A CN 202010047420 A CN202010047420 A CN 202010047420A CN 111274373 A CN111274373 A CN 111274373A
Authority
CN
China
Prior art keywords
question
sentence
word
knowledge graph
medical record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010047420.0A
Other languages
English (en)
Other versions
CN111274373B (zh
Inventor
崔立真
柏欣雨
何伟
鹿旭东
郭伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202010047420.0A priority Critical patent/CN111274373B/zh
Publication of CN111274373A publication Critical patent/CN111274373A/zh
Application granted granted Critical
Publication of CN111274373B publication Critical patent/CN111274373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本公开公开了一种基于知识图谱的电子病历问答方法及系统,包括构建基于电子病历数据的知识图谱,根据历史问题查询信息,统计关键词的种类和数量,构建提问语句模板;对获取的问句进行基于字的标注和字的嵌入,以问句中每个字的字嵌入向量构成句子表示矩阵,对句子表示矩阵使用双向长短期记忆模型和条件随机场进行序列标注,输出词标注结果和其对应的标签;将词标注结果和其对应的标签与提问语句模板进行匹配,得到SPARQL语句生成模板,将标注的词语和其对应的标签填入SPARQL语句生成模板中,生成SPARQL查询语句;将SPARQL查询语句输入知识图谱中进行查询,得到答案。可以更好地描述患者和医疗事件之间的关系,可以快速准确地帮助用户查询出所需的电子病历信息。

Description

一种基于知识图谱的电子病历问答方法及系统
技术领域
本公开涉及知识图谱和医学自然语言处理技术领域,特别是涉及一种基于知识图谱的电子病历问答方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
在社会高速发展的今天,数据量的飞速增长使信息越来越多,人们对信息的精准度要求也越来越高。传统的信息检索方法基于关键词检索经常不能理解用户真正想要表达的内容,返回的排序后的相关文档,仍需用户手动从中检索出答案。区别于传统的关键词检索,问答系统的输入是自然语言问题,返回的是简洁而准确的答案。问答系统具有解读用户的检索语句的能力,可以快速准确地帮助用户获取目标信息。在此背景下,针对不同领域的问答系统和语义搜索成为了研究热点。
医疗电子病历是记录病人信息的主要媒介,对电子病历的查询和分析,在医疗卫生管理和临床科研中有着广泛的用途。传统的关键词检索难以从海量的文本数据中找到医学工作者真正关注的电子病历信息,对于不熟悉SPARQL等形式化查询语言的医学工作者来说,从电子病历信息中搜索自己感兴趣的信息成为了一项几乎无法完成的任务。
发明内容
为了解决上述问题,本公开提出了一种基于知识图谱的电子病历问答方法及系统,针对结构化电子病历特点构建了知识图谱,并依照构建的知识图谱中的RDF关系对问题进行解析,依据从问题中解析的实体和构建属于该问题的SPARQL语句,从知识图谱中查询答案。
为了实现上述目的,本公开采用如下技术方案:
第一方面,本公开提供一种基于知识图谱的电子病历问答方法,包括:
构建基于电子病历数据的知识图谱,根据历史问题查询信息,统计关键词的种类和数量,构建提问语句模板;
对获取的问句进行基于字的标注和字的嵌入,以问句中每个字的字嵌入向量构成句子表示矩阵,对句子表示矩阵使用双向长短期记忆模型和条件随机场进行序列标注,输出词标注结果和其对应的标签;
将词标注结果和其对应的标签与提问语句模板进行匹配,得到SPARQL语句生成模板,将标注的词语和其对应的标签填入SPARQL语句生成模板中,生成SPARQL查询语句;
将SPARQL查询语句输入知识图谱中进行查询,得到答案。
作为可能的一些实现方式,将电子病历构建成基于资源描述框架的数据表示模型的知识图谱,以患者、疾病、药物、化验、就诊、治疗和检查字段作为知识图谱的主体,以描述事件主客体关系和时序关系作为知识图谱的属性,以知识图谱中主体和属性关系作为基本的模式描述数据之间的关系。
作为可能的一些实现方式,所述构建提问语句模版,通过分析历史问题的内容对其进行关键词标注,统计关键词的种类和数量,构建提问语句模版;
根据知识图谱中主体和属性关系,对获取的问句采用BIO标注法进行基于字的标注。
作为可能的一些实现方式,对获取的问句进行字的嵌入过程包括:
将问句进行字符级别分割后训练word2vec模型,利用训练好的word2vec模型将问句转化为文本向量,计算问句中每个字的字嵌入向量。
作为可能的一些实现方式,对句子表示矩阵使用双向长短期记忆模型包括:
句子表示矩阵经过前向LSTM后,每个字符所在的位置得到融合上文信息的隐藏层表示向量;经过后向LSTM后,每个字符所在的位置得到融合下文信息的隐藏层表示向量;将上文和下文信息的隐藏层表示向量进行拼接,每个字符得到融合上下文的表示向量。
作为可能的一些实现方式,使用条件随机场包括:
对融合上下文的表示向量,根据问句中的顺序组成序列,使用条件随机场从所有可能的标签序列中选取概率最高的序列中的词标注结果作为输出。
作为可能的一些实现方式,使用条件随机场具体包括:
获取需要学习的标签转移概率矩阵,通过模型预测序列标签,得到预测某一标签路径分数;
通过Softmax函数对标签路径分数进行归一化,得到预测该标签路径的概率值;
基于极大似然估计法,使标签路径概率最大化;根据维特比算法,从所有路径中选择概率值最高的作为最佳路径输出。
第二方面,本公开提供一种基于知识图谱的电子病历问答系统,包括:
知识图谱和提问语句模板构建模块,被配置为构建基于电子病历数据的知识图谱,根据历史问题查询信息,统计关键词的种类和数量,构建提问语句模板;
字的标注和嵌入模块,被配置为对获取的问句进行基于字的标注和字的嵌入,以问句中每个字的字嵌入向量构成句子表示矩阵,对句子表示矩阵使用双向长短期记忆模型和条件随机场进行序列标注,输出词标注结果和其对应的标签;
查询语言生成模块,被配置为将词标注结果和其对应的标签与提问语句模板进行匹配,得到SPARQL语句生成模板,将标注的词语和其对应的标签填入SPARQL语句生成模板中,生成SPARQL查询语句;
查询模块,被配置为将SPARQL查询语句输入知识图谱中进行查询,得到答案。
第三方面,本公开提供一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成一种基于知识图谱的电子病历问答方法所述的步骤。
第四方面,本公开提供一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成一种基于知识图谱的电子病历问答方法所述的步骤。
与现有技术相比,本公开的有益效果为:
本公开将电子病历数据构建成基于RDF的数据表示模型的知识图谱,可以更好地描述患者和医疗事件之间的关系;
本公开能够把自然语言查询语句自动转换为SPARQL查询语句,可以快速准确地帮助用户查询出所需的电子病历信息。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1为实施例一中基于知识图谱的电子病历问答方法的流程示意图;
图2是实施例一中双向长短期记忆网络(Bi-LSTM)+条件随机场(CRF)模型示意图。
具体实施方式:
下面结合附图与实施例对本公开做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例1
一种基于知识图谱的电子病历问答方法,包括以下步骤:
(1)构建基于电子病历数据的知识图谱;
(2)设计提问语句模板和标注提问数据;
(3)对获取到的问题进行解析和标注;
(4)将步骤(3)提取出的实体填入提问语句模板,生成完整SPARQL查询语句;
(5)使用步骤(4)得到的SPARQL查询语句进行查询,得到最后答案。
下面结合图1中的方法流程图对本公开方法进行详细描述,具体包括:
步骤一:构建基于电子病历数据的知识图谱
资源描述框架(Resource Description Framework,RDF)是一个使用XML语法来表示的资料模型,用来描述Web资源的特性,及资源与资源之间的关系。将电子病历构建成基于RDF的数据表示模型的知识图谱,可以清晰地表示临床检查、诊断、治疗等多种事件类型以及事件的时序关系。
根据现有的电子病历数据和医疗事件之间的特点,构建了患者、疾病、药物、化验、就诊、治疗、检查等主体以及描述事件主客体关系和时序关系的属性作为基本的模式来描述数据之间的关系。
步骤二:设计提问语句模板和标注提问数据
根据医生感兴趣的查询统计信息,构建了1800条示例问题,并通过分析问题的内容对问题进行了关键词标注。
如问题“有哪些男患者做了平均血红蛋白浓度结果大于237.74,并且同时又检查了平均血小板体积并且大于6.45?”中,标注了包括问题类别“哪些”、检索对象“患者”、事件“平均血红蛋白浓度”和“平均血小板体积”、时间关系“同时”、指标“大于237.74”和“大于6.45”、患者性别“男”等。
依据分析和标注出的这些关键词的种类和数量,可构建出相应提问语句模板。如刚才的问题提取出了一个问题类别、两个事件、两个指标等,就可以依据这些构建出一个列举类两事件问题的查询语句模板。
进一步的,根据知识图谱中的主体和属性关系,对自然语言问句采用BIO标注法进行基于字的标注,如把问题“有哪些男患者做了平均血红蛋白浓度结果大于237.74,并且同时又检查了平均血小板体积并且大于6.45?”中的“男”被标注为“B-gender”,“同”被标注为“B-concurrent”,“时”被标注为“I-concurrent”。
步骤三:对获取到的问题进行解析和标注
本步骤首先将自然语言问句进行字符级的嵌入。将自然语言问句进行字符级别分割后训练word2vec模型,训练好的word2vec模型用于将自然语言问句转化为文本向量,从而进行字的嵌入,计算出问句中每个字的字嵌入向量xt
进一步的,对于每个自然语言问句,其中的每个词都得到了低维的向量表示xt,则一个含m个词的句子以矩阵表示为X=(x1,…,xt,…,xm),完成由原始问句的输入到实值矩阵的表示。
进一步的,对构造的词表示向量和句子表示矩阵,使用双向长短期记忆模型和条件随机场进行序列标注。
长短期记忆模型(LSTM)是一种特殊的RNN模型,通过引入门机制来控制信息传递的方式,从而使得网络能够建立起长距离的时序关系。LSTM适合建模序列性质的数据,本实施例中的自然语言问句的逐个字向量表示是典型的序列数据。由于本实例中的消化内镜报告数据同时受其上下文的影响,为了同时考虑上下文特征,本实例基于双向LSTM来建模从上文到下文和从下文至上文的信息。
进一步的,由字嵌入表示得到的句子表示矩阵X经过前向LSTM后,每个字符所在的位置都得到融合上文信息的隐藏层的表示向量
Figure BDA0002369924940000081
经过后向LSTM后,每个字符位置都得到融合下文信息的隐藏层的表示向量
Figure BDA0002369924940000082
最后将上文和下文隐藏层向量进行拼接,即
Figure BDA0002369924940000083
最终每个字符都得到融合上下文的表示向量ht
进一步的,问句中每一个字符经过上下文编码后得到对应的向量表示,经过解码可以预测其对应的标签。最简单的解码层就是线性层加Softmax,但这种方式忽略了序列相邻标签之间的强依赖关系,因此需要额外加条件随机场(CRF)来帮助解码时找到最佳的标签路径。
条件随机场本质上是学习一个标签之间的概率转移矩阵,假设由上下文编码得到的句子表示再经过线性层操作后得到输出矩阵P∈R7×k,其中7是句子的长度,k表示标签的总数量,矩阵中元素Pi,j表示句子中第i个字符被预测为第j个标签的分数。
引入需要学习的标签转移概率矩阵T,此矩阵中元素Ti,j代表从第i个标签转移到第j个标签的分数,则结构化识别任务可进一步形式化成,给定输入矩阵X的情况,模型预测序列标签y=(y1,y2,…y7),因此得到预测某一标签路径的分数
Figure BDA0002369924940000084
其中,转移矩阵T∈R(k+2)×(k+2)是模型需要学习的参数,原有标签的总数量是k;增加特殊标签来表示提问语句的开始和结束,因此转移矩阵变成大小为k+2的方阵。
进一步的,在模型训练阶段,公式(1)中得到预测一种可能的标签路径的分数,通过Softmax函数对所有标签路径分数进行归一化,得到预测该标签路径的概率值如公式(2)所示,再基于极大似然估计使正确的标签路径概率最大化,最终的目标函数如公式(3)所示。
Figure BDA0002369924940000091
L=log(p(y|X)) (3)
进一步的,在模型预测阶段,如公式(4)所示,模型从所有可能路径中选择概率值最高的作为最佳路径y*输出,此过程可以根据维特比算法高效计算出最佳路径。
Figure BDA0002369924940000092
进一步的,使用人工规则对预测结果进行修正。由于问句的提问词较为固定,有许多在问句中常见且表示相同的意思。如“前”“之前”“以前”均表示相同的“before”时间关系属性,“哪些”“哪个”“有谁”均表示相同的问题类别。使用人工规则可以使标注效果显著提高这些同义词和近义词的识别和标注效果。
步骤四:将解析的问题填入提问语句模板,生成完整SPARQL查询语句。
依据标注的词语和标签的关系与模板进行匹配,取匹配度最高的模板作为提问语句的SPARQL语句生成模板,依照词语和标签的关系自动填写模板中的值,即得到最终的SPARQL语句。
如问题“有哪些男患者做了免疫球蛋白M且检验提示正常?”,可标注出问题类别“哪些”、对象“患者”、对象性别“男”、事件“免疫球蛋白M”、指标“正常”,依据这些关键词可以匹配列举类单事件模板,将这些标注好的关键词填入对应的SPARQL语句生成模板,即生成完整的SPARQL语句。
步骤五:使用SPARQL查询语句进行查询,得到最后答案。
将自然语言问题生成的SPARQL查询语句输入知识图谱中查询,即可得到符合要求的电子病历信息的编号,即为查询到的最终答案。
实施例2
一种基于知识图谱的电子病历问答系统,包括:
用于构建电子病历知识图谱模块;
用于构建提问语句模板模块;
用于对提问语句解析和标注模块;
用于生成SPARQL查询语句模块;
用于查询知识图谱,生成答案的模块。
实施例3
本公开提供一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成一种基于知识图谱的电子病历问答方法所述的步骤。
实施例4
本公开提供一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成一种基于知识图谱的电子病历问答方法所述的步骤。
本公开的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的网关、代理服务器、系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行实施例一中所述的具有心智功能的智能健康分析方法。为了简洁,在此不再赘述。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
计算机可读存储介质可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
结合实施例一中的方法步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤;其中方法中涉及到深度学习相关算法,可以使用GPU去加速算法的训练和预测过程。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims (10)

1.一种基于知识图谱的电子病历问答方法,其特征在于,包括:
构建基于电子病历数据的知识图谱,根据历史问题查询信息,统计关键词的种类和数量,构建提问语句模板;
对获取的问句进行基于字的标注和字的嵌入,以问句中每个字的字嵌入向量构成句子表示矩阵,对句子表示矩阵使用双向长短期记忆模型和条件随机场进行序列标注,输出词标注结果和其对应的标签;
将词标注结果和其对应的标签与提问语句模板进行匹配,得到SPARQL语句生成模板,将标注的词语和其对应的标签填入SPARQL语句生成模板中,生成SPARQL查询语句;
将SPARQL查询语句输入知识图谱中进行查询,得到答案。
2.如权利要求1所述的一种基于知识图谱的电子病历问答方法,其特征在于,
将电子病历构建成基于资源描述框架的数据表示模型的知识图谱,以患者、疾病、药物、化验、就诊、治疗和检查字段作为知识图谱的主体,以描述事件主客体关系和时序关系作为知识图谱的属性,以知识图谱中主体和属性关系作为基本的模式描述数据之间的关系。
3.如权利要求1所述的一种基于知识图谱的电子病历问答方法,其特征在于,所述构建提问语句模版,通过分析历史问题的内容对其进行关键词标注,统计关键词的种类和数量,构建提问语句模版;
根据知识图谱中主体和属性关系,对获取的问句采用BIO标注法进行基于字的标注。
4.如权利要求1所述的一种基于知识图谱的电子病历问答方法,其特征在于,对获取的问句进行字的嵌入过程包括:
将问句进行字符级别分割后训练word2vec模型,利用训练好的word2vec模型将问句转化为文本向量,计算问句中每个字的字嵌入向量。
5.如权利要求1所述的一种基于知识图谱的电子病历问答方法,其特征在于,对句子表示矩阵使用双向长短期记忆模型包括:
句子表示矩阵经过前向LSTM后,每个字符所在的位置得到融合上文信息的隐藏层表示向量;经过后向LSTM后,每个字符所在的位置得到融合下文信息的隐藏层表示向量;将上文和下文信息的隐藏层表示向量进行拼接,每个字符得到融合上下文的表示向量。
6.如权利要求1所述的一种基于知识图谱的电子病历问答方法,其特征在于,使用条件随机场包括:
对融合上下文的表示向量,根据问句中的顺序组成序列,使用条件随机场从所有可能的标签序列中选取概率最高的序列中的词标注结果作为输出。
7.如权利要求6所述的一种基于知识图谱的电子病历问答方法,其特征在于,使用条件随机场具体包括:
获取需要学习的标签转移概率矩阵,通过模型预测序列标签,得到预测某一标签路径分数;
通过Softmax函数对标签路径分数进行归一化,得到预测该标签路径的概率值;
基于极大似然估计法,使标签路径概率最大化;根据维特比算法,从所有路径中选择概率值最高的作为最佳路径输出。
8.一种基于知识图谱的电子病历问答系统,其特征在于,包括:
知识图谱和提问语句模板构建模块,被配置为构建基于电子病历数据的知识图谱,根据历史问题查询信息,统计关键词的种类和数量,构建提问语句模板;
字的标注和嵌入模块,被配置为对获取的问句进行基于字的标注和字的嵌入,以问句中每个字的字嵌入向量构成句子表示矩阵,对句子表示矩阵使用双向长短期记忆模型和条件随机场进行序列标注,输出词标注结果和其对应的标签;
查询语言生成模块,被配置为将词标注结果和其对应的标签与提问语句模板进行匹配,得到SPARQL语句生成模板,将标注的词语和其对应的标签填入SPARQL语句生成模板中,生成SPARQL查询语句;
查询模块,被配置为将SPARQL查询语句输入知识图谱中进行查询,得到答案。
9.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项方法所述的步骤。
10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项方法所述的步骤。
CN202010047420.0A 2020-01-16 2020-01-16 一种基于知识图谱的电子病历问答方法及系统 Active CN111274373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010047420.0A CN111274373B (zh) 2020-01-16 2020-01-16 一种基于知识图谱的电子病历问答方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010047420.0A CN111274373B (zh) 2020-01-16 2020-01-16 一种基于知识图谱的电子病历问答方法及系统

Publications (2)

Publication Number Publication Date
CN111274373A true CN111274373A (zh) 2020-06-12
CN111274373B CN111274373B (zh) 2021-06-11

Family

ID=71001085

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010047420.0A Active CN111274373B (zh) 2020-01-16 2020-01-16 一种基于知识图谱的电子病历问答方法及系统

Country Status (1)

Country Link
CN (1) CN111274373B (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111506722A (zh) * 2020-06-16 2020-08-07 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备
CN111914074A (zh) * 2020-07-16 2020-11-10 华中师范大学 基于深度学习与知识图谱的限定领域对话生成方法及系统
CN111930909A (zh) * 2020-08-11 2020-11-13 付立军 一种面向地质智能问答的数据自动化序列标注识别方法
CN112002411A (zh) * 2020-08-20 2020-11-27 杭州电子科技大学 一种基于电子病历的心脑血管病知识图谱问答方法
CN112035627A (zh) * 2020-07-27 2020-12-04 深圳技术大学 自动问答方法、装置、设备及存储介质
CN112101034A (zh) * 2020-09-09 2020-12-18 沈阳东软智能医疗科技研究院有限公司 一种判别医学实体的属性的方法、装置及相关产品
CN112182252A (zh) * 2020-11-09 2021-01-05 浙江大学 基于药品知识图谱的智能用药问答方法及其设备
CN112184341A (zh) * 2020-11-10 2021-01-05 电子科技大学 一种基于档案网络的美食推荐方法
CN112328808A (zh) * 2020-11-03 2021-02-05 四川长虹电器股份有限公司 基于知识图谱的问答方法、装置、电子设备及存储介质
CN112634889A (zh) * 2020-12-15 2021-04-09 平安国际智慧城市科技股份有限公司 基于人工智能的电子病例录入方法、装置、终端及介质
CN112650857A (zh) * 2020-12-28 2021-04-13 上海卓繁信息技术股份有限公司 一种新型咨询方法、装置和电子设备
CN112735475A (zh) * 2020-12-25 2021-04-30 北京博瑞彤芸科技股份有限公司 一种通过语音搜索疾病知识的方法和系统
CN112905884A (zh) * 2021-02-10 2021-06-04 北京百度网讯科技有限公司 生成序列标注模型的方法、设备、介质及程序产品
CN112966119A (zh) * 2021-02-25 2021-06-15 青岛海信网络科技股份有限公司 一种信息获取方法、设备及介质
CN112989002A (zh) * 2021-03-31 2021-06-18 中国工商银行股份有限公司 一种基于知识图谱的问答处理方法、装置及设备
CN113157888A (zh) * 2021-04-20 2021-07-23 北京邮电大学 支持多知识来源的询问答复方法、装置和电子设备
CN113535917A (zh) * 2021-06-30 2021-10-22 山东师范大学 基于旅游知识图谱的智能问答方法及系统
CN113593709A (zh) * 2021-07-30 2021-11-02 江先汉 一种疾病编码方法、系统、可读存储介质及装置
CN113764112A (zh) * 2021-09-16 2021-12-07 山东大学第二医院 一种在线医疗问答方法
CN114462358A (zh) * 2020-11-09 2022-05-10 中移(上海)信息通信科技有限公司 人机对话方法、装置、电子设备及计算机存储介质
CN114637819A (zh) * 2022-02-17 2022-06-17 北京邮电大学 一种基于时序知识图谱的复杂问答查询方法和装置
CN115132303A (zh) * 2022-04-28 2022-09-30 腾讯科技(深圳)有限公司 生理标签预测方法、模型训练方法、装置、设备及介质
CN115168603A (zh) * 2022-06-27 2022-10-11 天翼爱音乐文化科技有限公司 一种彩铃业务流程自动反馈应答方法、装置及存储介质
CN116340365A (zh) * 2023-05-17 2023-06-27 北京创新乐知网络技术有限公司 一种缓存数据的匹配方法、匹配装置及终端设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8429179B1 (en) * 2009-12-16 2013-04-23 Board Of Regents, The University Of Texas System Method and system for ontology driven data collection and processing
CN105868313A (zh) * 2016-03-25 2016-08-17 浙江大学 一种基于模板匹配技术的知识图谱问答系统及方法
CN107247736A (zh) * 2017-05-08 2017-10-13 广州索答信息科技有限公司 一种基于知识图谱的厨房领域问答方法及系统
CN108182262A (zh) * 2018-01-04 2018-06-19 华侨大学 基于深度学习和知识图谱的智能问答系统构建方法和系统
CN109493166A (zh) * 2018-10-23 2019-03-19 深圳智能思创科技有限公司 一种针对电子商务导购场景任务型对话系统的构建方法
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及系统
CN110209787A (zh) * 2019-05-29 2019-09-06 袁琦 一种基于宠物知识图谱的智能问答方法及系统
CN110600121A (zh) * 2019-08-15 2019-12-20 浙江工业大学 一种基于知识图谱病因初步诊断方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8429179B1 (en) * 2009-12-16 2013-04-23 Board Of Regents, The University Of Texas System Method and system for ontology driven data collection and processing
CN105868313A (zh) * 2016-03-25 2016-08-17 浙江大学 一种基于模板匹配技术的知识图谱问答系统及方法
CN107247736A (zh) * 2017-05-08 2017-10-13 广州索答信息科技有限公司 一种基于知识图谱的厨房领域问答方法及系统
CN108182262A (zh) * 2018-01-04 2018-06-19 华侨大学 基于深度学习和知识图谱的智能问答系统构建方法和系统
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及系统
CN109493166A (zh) * 2018-10-23 2019-03-19 深圳智能思创科技有限公司 一种针对电子商务导购场景任务型对话系统的构建方法
CN110209787A (zh) * 2019-05-29 2019-09-06 袁琦 一种基于宠物知识图谱的智能问答方法及系统
CN110600121A (zh) * 2019-08-15 2019-12-20 浙江工业大学 一种基于知识图谱病因初步诊断方法

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111506722A (zh) * 2020-06-16 2020-08-07 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备
CN111506722B (zh) * 2020-06-16 2024-03-08 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备
CN111914074A (zh) * 2020-07-16 2020-11-10 华中师范大学 基于深度学习与知识图谱的限定领域对话生成方法及系统
CN112035627A (zh) * 2020-07-27 2020-12-04 深圳技术大学 自动问答方法、装置、设备及存储介质
CN112035627B (zh) * 2020-07-27 2023-11-17 深圳技术大学 自动问答方法、装置、设备及存储介质
CN111930909A (zh) * 2020-08-11 2020-11-13 付立军 一种面向地质智能问答的数据自动化序列标注识别方法
CN111930909B (zh) * 2020-08-11 2023-09-12 付立军 一种面向地质智能问答的数据自动化序列标注识别方法
CN112002411A (zh) * 2020-08-20 2020-11-27 杭州电子科技大学 一种基于电子病历的心脑血管病知识图谱问答方法
CN112101034A (zh) * 2020-09-09 2020-12-18 沈阳东软智能医疗科技研究院有限公司 一种判别医学实体的属性的方法、装置及相关产品
CN112101034B (zh) * 2020-09-09 2024-02-27 沈阳东软智能医疗科技研究院有限公司 一种判别医学实体的属性的方法、装置及相关产品
CN112328808A (zh) * 2020-11-03 2021-02-05 四川长虹电器股份有限公司 基于知识图谱的问答方法、装置、电子设备及存储介质
CN112182252A (zh) * 2020-11-09 2021-01-05 浙江大学 基于药品知识图谱的智能用药问答方法及其设备
CN114462358A (zh) * 2020-11-09 2022-05-10 中移(上海)信息通信科技有限公司 人机对话方法、装置、电子设备及计算机存储介质
CN112184341A (zh) * 2020-11-10 2021-01-05 电子科技大学 一种基于档案网络的美食推荐方法
CN112634889B (zh) * 2020-12-15 2023-08-08 深圳平安智慧医健科技有限公司 基于人工智能的电子病例录入方法、装置、终端及介质
CN112634889A (zh) * 2020-12-15 2021-04-09 平安国际智慧城市科技股份有限公司 基于人工智能的电子病例录入方法、装置、终端及介质
CN112735475B (zh) * 2020-12-25 2023-02-21 北京博瑞彤芸科技股份有限公司 一种通过语音搜索疾病知识的方法和系统
CN112735475A (zh) * 2020-12-25 2021-04-30 北京博瑞彤芸科技股份有限公司 一种通过语音搜索疾病知识的方法和系统
CN112650857A (zh) * 2020-12-28 2021-04-13 上海卓繁信息技术股份有限公司 一种新型咨询方法、装置和电子设备
CN112905884B (zh) * 2021-02-10 2024-05-31 北京百度网讯科技有限公司 生成序列标注模型的方法、设备、介质及程序产品
CN112905884A (zh) * 2021-02-10 2021-06-04 北京百度网讯科技有限公司 生成序列标注模型的方法、设备、介质及程序产品
CN112966119A (zh) * 2021-02-25 2021-06-15 青岛海信网络科技股份有限公司 一种信息获取方法、设备及介质
CN112989002B (zh) * 2021-03-31 2022-08-23 中国工商银行股份有限公司 一种基于知识图谱的问答处理方法、装置及设备
CN112989002A (zh) * 2021-03-31 2021-06-18 中国工商银行股份有限公司 一种基于知识图谱的问答处理方法、装置及设备
CN113157888A (zh) * 2021-04-20 2021-07-23 北京邮电大学 支持多知识来源的询问答复方法、装置和电子设备
CN113535917A (zh) * 2021-06-30 2021-10-22 山东师范大学 基于旅游知识图谱的智能问答方法及系统
CN113593709B (zh) * 2021-07-30 2022-09-30 江先汉 一种疾病编码方法、系统、可读存储介质及装置
CN113593709A (zh) * 2021-07-30 2021-11-02 江先汉 一种疾病编码方法、系统、可读存储介质及装置
CN113764112A (zh) * 2021-09-16 2021-12-07 山东大学第二医院 一种在线医疗问答方法
CN114637819A (zh) * 2022-02-17 2022-06-17 北京邮电大学 一种基于时序知识图谱的复杂问答查询方法和装置
CN115132303A (zh) * 2022-04-28 2022-09-30 腾讯科技(深圳)有限公司 生理标签预测方法、模型训练方法、装置、设备及介质
CN115168603B (zh) * 2022-06-27 2023-04-07 天翼爱音乐文化科技有限公司 一种彩铃业务流程自动反馈应答方法、装置及存储介质
CN115168603A (zh) * 2022-06-27 2022-10-11 天翼爱音乐文化科技有限公司 一种彩铃业务流程自动反馈应答方法、装置及存储介质
CN116340365A (zh) * 2023-05-17 2023-06-27 北京创新乐知网络技术有限公司 一种缓存数据的匹配方法、匹配装置及终端设备
CN116340365B (zh) * 2023-05-17 2023-09-08 北京创新乐知网络技术有限公司 一种缓存数据的匹配方法、匹配装置及终端设备

Also Published As

Publication number Publication date
CN111274373B (zh) 2021-06-11

Similar Documents

Publication Publication Date Title
CN111274373B (zh) 一种基于知识图谱的电子病历问答方法及系统
US11182562B2 (en) Deep embedding for natural language content based on semantic dependencies
CN111613339B (zh) 一种基于深度学习的相似病历查找方法与系统
CN110297908B (zh) 诊疗方案预测方法及装置
US10593423B2 (en) Classifying medically relevant phrases from a patient's electronic medical records into relevant categories
US10553308B2 (en) Identifying medically relevant phrases from a patient's electronic medical records
US9606990B2 (en) Cognitive system with ingestion of natural language documents with embedded code
US20210042344A1 (en) Generating or modifying an ontology representing relationships within input data
Khelif et al. An Ontology-based Approach to Support Text Mining and Information Retrieval in the Biological Domain.
US20210406640A1 (en) Neural Network Architecture for Performing Medical Coding
Cao et al. Automatic ICD code assignment based on ICD’s hierarchy structure for Chinese electronic medical records
US11748562B2 (en) Selective deep parsing of natural language content
CN116992002A (zh) 一种智能护理方案应答方法及系统
CN117854715B (zh) 基于问诊分析的智能助诊系统
US11409950B2 (en) Annotating documents for processing by cognitive systems
CN116994689A (zh) 医疗数据的特征化处理方法、装置、设备、介质及产品
Tran et al. A comparative study of question answering over knowledge bases
Zhu et al. The DR-KGQA system for automatically answering medication related questions in Chinese
Renner et al. Challenges in Using a Graph Database to Represent and Analyze Mappings of Cancer Study Data Standards
CN116644719B (zh) 一种用于临床证据文献元素编码方法及其在糖尿病视网膜病变中的应用
US11574017B2 (en) Sub-question result merging in question and answer (QA) systems
El-Kass Integrating semantic web and unstructured information processing environments: a visual rule-based approach
Dubey Towards Complex Question Answering over Knowledge Graphs.
EP3832665A1 (en) Generating or modifying an ontology representing relationships within input data
Pereira Consulta e Visualização de Dados Semânticos

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant