CN111611398B - 一种基于知识图谱的临床表现联想方法、装置、设备及介质 - Google Patents

一种基于知识图谱的临床表现联想方法、装置、设备及介质 Download PDF

Info

Publication number
CN111611398B
CN111611398B CN202010254094.0A CN202010254094A CN111611398B CN 111611398 B CN111611398 B CN 111611398B CN 202010254094 A CN202010254094 A CN 202010254094A CN 111611398 B CN111611398 B CN 111611398B
Authority
CN
China
Prior art keywords
medical symptom
association
term
node
medical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010254094.0A
Other languages
English (en)
Other versions
CN111611398A (zh
Inventor
武学鸿
李敏
李建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202010254094.0A priority Critical patent/CN111611398B/zh
Publication of CN111611398A publication Critical patent/CN111611398A/zh
Application granted granted Critical
Publication of CN111611398B publication Critical patent/CN111611398B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于知识图谱的临床表现联想方法、装置、设备及介质,其方法为:获取由患者提供的历史临床表现信息,语料标注为医学症状术语;以患者提供的历史临床表现信息和对应的医学症状术语,训练BiLSTM‑Attention原始模型得到术语规范模型;以医学症状术语和语义关系分别作为节点和边构建医学症状知识图谱;将患者实时提供的临床表现信息输入术语规范模型得到对应的医学症状术语,在医学症状知识图谱中找到对应的待联想的医学症状术语节点,再以该待联想的医学症状术语节点为起点并基于联想可靠性进行联想,将符合要求的联想路径终点所示的医学症状术语作为目标医学症状输出。本发明可为进一步临床诊疗决策提供可靠、全面、准确的服务。

Description

一种基于知识图谱的临床表现联想方法、装置、设备及介质
技术领域
本发明涉及智慧医疗领域,具体涉及一种基于知识图谱的临床表现联想方法、装置及介质。
背景技术
人类具有对事物的感知与联想能力,通常给定一个具体的客观事物的实体,在特定场景下我们可能联想到相关的一系列事物,例如给定一个动物,考虑其同类时候,人类基于对客观世界的认知可以联想到给定动物的同类很多其他动物。
基于人类对事物的感知与联想能力,以及智慧医疗领域对机器智能化的要求,有必要提供一种通过机器实现临床表现的联想方法,为进一步临床诊疗决策提供可靠、全面、准确的服务。
发明内容
针对现有技术存在的技术问题,本发明提供一种基于知识图谱的临床表现联想方法、装置及介质,为进一步临床诊疗决策提供可靠、全面、准确的服务。
为实现上述技术目的,本发明采用如下技术方案:
一种基于知识图谱的临床表现联想方法,包括以下步骤:
步骤1,获取大量由患者提供的历史临床表现信息,语料标注为医学症状术语;
步骤2,以患者提供的历史临床表现信息和对应的医学症状术语,分别作为BiLSTM-Attention原始模型的编码信息和解码信息,训练BiLSTM-Attention原始模型,得到术语规范模型;
步骤3,以预选的每个医学症状术语均作为节点,以不同医学症状术语之间的语义关系为边,构建医学症状知识图谱;其中,每种类型的语义关系具有对应的联想可靠性;
步骤4,获取患者实时提供的临床表现信息,作为编码信息输入术语规范模型得到对应的医学症状术语;
步骤5,根据步骤4得到的医学症状术语,在医学症状知识图谱中找到对应的待联想的医学症状术语节点,再以该待联想的医学症状术语节点为起点、基于医学症状知识图谱中的联想可靠性进行联想;然后选择联想可靠性大于预设值的联想路径,将联想路径终点所示的医学症状术语作为目标医学症状输出。
在更优的技术方案中,患者提供的每个临床表现信息,对应得到一个或多个医学症状术语;医学症状术语的类型为症状类型或者描述类型,其中描述类型包括程度、性质、规律、形态、事件、体位和/或颜色。
在更优的技术方案中,在步骤5之前还包括:判断步骤4得到的医学症状术语中,是否包括症状类型的医学症状术语:若包括,则执行步骤5;否则将患者实时提供的临床表现信息视为无效信息,提醒患者重新提供临床表现信息,并返回执行步骤4。
在更优的技术方案中,医学症状术语之间的语义关系,包括:父子关系、扩展关系、组成关系、临床表现关系、描述关系、减轻关系、加重关系、诱发关系。
在更优的技术方案中,在父子关系中:由子节点a联想到父节点p的联想可靠性为R(a,p)=1,由父节点p联想到子节点a的联想可靠性为R(p,a)=β,β表示可靠性衰减参数;
在同一父节点p的每两个子节点a、b之间:若两个子节点a、b均与父节点p之间存在扩展关系,则两个子节点a、b之间的联想可靠性为R(a,b)=x+(1-x)*αn,x为基础得分,α为属性差异的衰减指数,n为两个子节点a、b之间的描述属性差异个数;否则两个子节点a、b之间的联想可靠性为R(a,b)=0;
在临床表现关系中:设节点d所示的医学症状术语可进一解释节点c所示的医学症状术语,则节点之间的联想可靠性为:R(c,d)=u,R(d,c)=v,u为临床表现关系的可靠性参数,v为临床表现关系反向推理的可靠性参数;
在组成关系中:设节点e可由若干个节点e1…ei…组合得到,则节点e与每个节点ei之间的联想可靠性为:R(e,ei)=1,R(ei,e)=0。
在更优的技术方案中,联想路径s→t的联想可靠性计算方法为:R(s,t)=R(s,m1)*R(m1,m2)*…*R(ml,t),s为待联想的医学症状术语所示的节点,且s、t分别为联想路径s→t的起点和终点,m1,m2,…,ml为联想路径的中间节点。
在更优的技术方案中,当起点s与终点t之间存在多条联想路径时,取联想可靠性最大的联想路径作为该起点s至终点t的联想可靠性:
R(s,t)=maxRj(s,t),
Rj(s,t)表示起点s至终点t的第j条联想路径。
本发明还提供一种基于知识图谱的临床表现联想装置,包括:
语料标注模块,用于:获取大量由患者提供的历史临床表现信息,语料标注为医学症状术语;
术语规范模型构建模块,用于:以患者提供的历史临床表现信息和对应的医学症状术语,分别作为BiLSTM-Attention原始模型的编码信息和解码信息,训练BiLSTM-Attention原始模型,得到术语规范模型;
医学症状知识图谱构建模块,用于:以预选的每个医学症状术语均作为节点,以不同医学症状术语之间的语义关系为边,构建医学症状知识图谱;其中,每种类型的语义关系具有对应的联想可靠性;
医学症状术语实时提取模块,用于:获取患者实时提供的临床表现信息,输入术语规范模型得到对应的医学症状术语;
目标医学症状联想模块,用于:根据医学症状术语实时提取模块得到的医学症状术语,在医学症状知识图谱中找到对应的待联想的医学症状术语节点,再以该待联想的医学症状术语节点为起点、基于医学症状知识图谱中的联想可靠性进行联想;然后选择联想可靠性大于预设值的联想路径,将联想路径终点所示的医学症状术语作为目标医学症状输出。
本发明还提供一种设备,包括处理器和存储器;其中:所述存储器用于存储计算机指令;所述处理器用于执行所述存储器存储的计算机指令,具体执行上述任一技术方案所述的方法。
本发明还提供一种计算机存储介质,用于存储程序,所述程序被执行时,用于实现上述任一技术方案所述的方法。
有益效果
本发明通过步骤1至步骤3得到术语规范模型和医学症状知识图谱,可应用在人智能领域,具体的在AI医疗临床辅助决策领域,为临床医生提供智能辅助决策支持:实时获取患者提供的临床表现信息,经过本发明步骤4和步骤5处理,即可得到与患者提供的临床表现信息对应的目标医学症状输出,使得临床医生得到除患者提供的临床表现信息之外更多关联的医学症状,有利于临床医生根据多医学症状从不同诊断方向或诊断范围进行临床诊断,减少漏诊、误诊情况的发生。
同时本发明得到的术语规范模型,可以直接获取患者提供的临床表现信息,省略了临床医生从中提取医学症状的术语转换环节,提高临床诊断效率;而且由于术语规范模型是通过大量训练样本训练得到,因此可保证其在使用时所输出的是规范的医学症状术语,进而符合医学症状知识图谱的要求,从而获得更完整、准确的目标医学症状。
另外发明得到的医学症状知识图谱,不仅可提供联想输出的目标医学症状,而且还提供了完整的解释性路径,让每一个分析结果均具备可解释性。
附图说明
图1为本发明实施例所述方法的流程图;
图2为本发明实施中医学症状本体语义网络示意图;
图3为本发明实施例构建的医学症状知识图谱示意图;
图4为本发明实施例所述父子关系示例图;
图5为本发明实施例所述拓展关系示例图;
图6为本发明实施例所述临床表现关系示例图;
图7为本发明实施例所述组合关系示例图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例以本发明的技术方案为依据开展,给出了详细的实施方式和具体的操作过程,对本发明的技术方案作进一步解释说明。
参见图1所示,本发明实施例公开的一种基于知识图谱的临床表现联想方法,包括以下步骤:
步骤1,获取大量由患者提供的历史临床表现信息,语料标注为医学症状术语;
如表1所示,患者提供的临床表现信息,可以为“偶有咳嗽”“腹痛逐渐加重”等,均是不符合医学规范术语的口语化描述,因此需要先将患者提供的临床表现信息转换为标准的医学症状术语,为实现本发明智能化联想,本实施例采用循环神经网络与注意力机制结合(即本文中所述的BiLSTM-Attention)的方法训练一个具备自动编解码能力的术语规范模型。
训练获取术语规范模型的训练样本,则通过获取大量由患者提供的历史临床表现信息,然后本实施例通过人工对这些历史临床表现信息进行语料标注,即从中提取医学症状术。
其中,患者提供的每个临床表现信息,包括在该步骤1的历史临床表现信息和后续步骤5实时提供的临床表现信息,均对应得到一个或多个医学症状术语;医学症状术语的类型为症状类型或者描述类型,其中描述类型包括程度、性质、规律、颜色、形态、事件、体位等。
语料标注示例如表1所示:
表1语料标注示例
Figure BDA0002436603840000041
Figure BDA0002436603840000051
步骤2,以患者提供的历史临床表现信息和对应的医学症状术语,分别作为BiLSTM-Attention原始模型的编码信息和解码信息,训练BiLSTM-Attention原始模型,得到术语规范模型。
步骤3,以预选的每个医学症状术语均作为节点,以不同医学症状术语之间的语义关系为边,构建医学症状知识图谱;其中,每种类型的语义关系具有对应的联想可靠性。
医学症状术语中的症状类型,在临床方面的表达相对复杂,含有大量的约束属性与条件,即症状类型的医学症状术语,与描述类型的医学症状术语有着各种语义关系,如图2所示。在本实施例中,不同医学症状术语之间的语义关系,包括:父子关系SubClassOf、扩展关系ComplexOf、组成关系Contain、临床表现关系ClinicalFeature(类似于采用更详细的医学症状术语来进一步解释当前专业性更强的医学症状术语)、描述关系、减轻关系、加重关系(减轻和加重关系,即导致症状减轻或加重的因素,如事件等)、诱发关系(即诱发症状产生的原因,如事件、体位等)等。
本实施例以呼吸系统症状、泌尿系统症状、消化系统症状几个概念为例建立医学症状知识图谱,如图3所示,覆盖了其中大部分医学症状术语和语义关系的定义与应用。“呼吸系统症状”是属于“症状”这个顶级抽象的概念,因此它们之间采用TypeOf语义关系关联;“咳嗽”与“呼吸系统症状”两个概念之间存在父子关系,因此采用SubClassOf语义关系;“剧烈咳嗽”与“咳嗽”之间除了父子关系以外,还存在一种扩展关系,即ComplexeOf,想要表达的是“剧烈咳嗽”的本质/原子就是“咳嗽”,“剧烈咳嗽”具有描述属性“剧烈”,采用语义关系DescribedBy表达;“尿路刺激征”是一个综合性的症状概念,它是由多个概念组合而成,分别是“尿痛”、“尿急”、“尿频”因此它们之间存在Contain的语义关系;“呕血”是一个专业的临床表现术语,但是在临床中患者描述时往往不会直接描述为“呕血”,而是描述为“呕吐物为咖啡色”,因此它们之间存在ClinicalFeature的语义关系。
为进一步方便地分析医学症状知识图谱、清晰表达不同医学症状术语之间的关系、以及增强知识表达能力,本实施例将症状类型的医学症状术语所示的实体进一步分为以下几种类型:原子实体、复合实体以及组合实体:
原子实体:即不可分割的最小粒度的医学症状术语,如图3中的“咳嗽”。
复合实体:即对原子实体的扩展,与原子实体之间存在ComplexOf关系,同时与其他概念之间存在一个或者多个的DescribedBy描述关系,如图3中的“剧烈咳嗽”,其与“咳嗽”存在扩展关系,是对“咳嗽”这一原子实体的扩展表示。
组合实体:即由一个以上医学症状术语组合形成的医学症状术语,如图3中的“尿路刺激征”,其通过Contain语义关系与“尿痛”、“尿急”、“尿频”形成组合逻辑。
在本实施例中,每种类型的语义关系具有对应的联想可靠性,即由一个医学症状术语联想到另一个医学症状术语的概率,在知识图谱中表现为由其中一个节点a联想到另一个节点b的概率,表示为R(a,b),且0≤R(a,b)≤1。R(a,b)=1表示由节点a联想到节点b完全可靠,R(a,b)=0时表示由节点a联想到节点b完全不可靠,如当节点a与节点b是同一医学症状术语时,其自身联想是完全可靠的。以下对几种语义关系对应的联想可靠性进行定义:
(1)在父子关系中:由子节点a联想到父节点p的联想可靠性为R(a,p)=1,由父节点p联想到子节点a的联想可靠性为R(p,a)=β,β表示可靠性衰减参数,本实施例取β=0.5。
例如,“剧烈咳嗽”与“咳嗽”的语义关系为<”剧烈咳嗽”subClassOf”咳嗽”>,即“剧烈咳嗽”为“咳嗽”的子节点,因此由“剧烈咳嗽”联想到“咳嗽”完全可靠。
同时由子联想父具有传递性,即多级关联也是完全可靠的,例如,“剧烈咳嗽”联想到“呼吸系统症状”完全可靠。
(2)在同一父节点p的每两个子节点a、b之间:若两个子节点a、b均与父节点p之间存在扩展关系,则两个子节点a、b之间的联想可靠性为R(a,b)=x+(1-x)*αn,x为基础得分,α为属性差异的衰减指数,且有0≤x≤1,0≤α≤1,n为两个子节点a、b之间的描述属性差异个数;否则两个子节点a、b之间的联想可靠性为R(a,b)=0;本实施例取x=0.5,α=0.5。
在两个子节点a、b均与父节点p之间存在扩展关系的联想可靠性公式可得,由于0≤x≤1,0≤α≤1,因此属性差异个数n越大,联想可靠性超低。
例如,“呕吐”和“呕血”均为“消化系统症状”的子节点,但与“消化系统症状”均不存在扩展关系,因此R(a,b)=0,由“呕吐”不会联想到“呕血”;
例如,见图5所示,“剧烈咳嗽”和“刺激性咳嗽”均为“咳嗽”的子节点,同时均为“咳嗽”的扩展描述,又“剧烈咳嗽”有1个描述属性“剧烈”,“刺激性咳嗽”有1个描述属性“刺激性”,且两个描述属性不同,故n=2,因此R(a,b)=0.5+(1-0.5)*0.52=0.625,由“剧烈咳嗽”联想到“刺激性咳嗽”的联想可靠性为0.625。
(3)在临床表现关系中:设节点d所示的医学症状术语可进一解释节点c所示的医学症状术语,则节点之间的联想可靠性为:R(c,d)=u,R(d,c)=v,u为临床表现关系的可靠性参数,v为临床表现关系反向推理的可靠性参数;本实施例取u=0.8,v=0.6。
例如,见图6所示,“呕吐物为咖啡色”是对“呕血”的正向推理解释,因此由“呕血”联想到“呕吐物为咖啡色”的联想可靠性为0.8,由“呕吐物为咖啡色”联想到“呕血”的联想可靠性为0.6。
(4)在组成关系中:设节点e可由若干个节点e1…ei…组合得到,则节点e与每个节点ei之间的联想可靠性为:R(e,ei)=1,R(ei,e)=0。
例如,见图7所示,“尿路刺激症”是由“尿急”“尿频”“尿痛”三个医学症状术语组合得到的医学症状术语,“尿路刺激症”同时表现为“尿急”“尿频”“尿痛”三个医学症状,即<尿路刺激症contain尿急>,<尿路刺激症contain尿频>,<尿路刺激症contain尿痛>,因此由“尿路刺激症”联想到“尿急”“尿频”“尿痛”任意一个的联想可靠性均为1,由“尿急”“尿频”“尿痛”任意一个联想到“尿路刺激症”的联想可靠性均为0。但是,如果同时给定“尿急”“尿频”“尿痛”全部,此时联想到“尿路刺激症”的联想可靠性为1。
步骤4,获取患者实时提供的临床表现信息,作为编码信息输入术语规范模型得到对应的医学症状术语;
在执行步骤5之前还包括:判断步骤4得到的医学症状术语中,是否包括症状类型的医学症状术语:若包括,则执行步骤5;否则将患者实时提供的临床表现信息视为无效信息,提醒患者重新提供临床表现信息,并返回执行步骤4;
步骤5,根据步骤4得到的医学症状术语,在医学症状知识图谱中找到对应的待联想的医学症状术语节点,再以该待联想的医学症状术语节点为起点、基于医学症状知识图谱中的联想可靠性进行联想;然后选择联想可靠性大于预设值的联想路径,将联想路径终点所示的医学症状术语作为目标医学症状输出。
根据以上各种语义关系的联想可靠性定义,联想路径s→t的联想可靠性计算方法为:R(s,t)=R(s,m1)*R(m1,m2)*…*R(ml,t),s为待联想的医学症状术语所示的节点,且s、t分别为联想路径s→t的起点和终点,m1,m2,…,ml为联想路径的中间节点。
由“呼吸系统症状”联想到“剧烈咳嗽”可靠性计算为:如图4所示,设“呼吸系统症状”为节点s,“剧烈咳嗽”为节点t,“呼吸系统症状”与“剧烈咳嗽”之间还包括1个中间节点m1“咳嗽”,因此有R(s,t)=R(s,m1)*R(m1,t)=0.5*0.5=0.25。
当起点s与终点t之间存在多条联想路径时,取联想可靠性最大的联想路径作为该起点s至终点t的联想可靠性:
R(s,t)=maxRj(s,t),
Rj(s,t)表示起点s至终点t的第j条联想路径。
例如,患者提供的临床表现信息为“呕吐且吐出的物质为咖啡色样”,应用训练生成的术语规范模型,将患者提供的信息转换为医学症状术语规范{“呕吐”:”症状”,”咖啡色”:”颜色”},依据该规范术语,结合临床表现知识图谱,从知识图谱中找到对应的节点,及如图3中所示可找到“呕吐咖啡色物”所在节点,以该节点作为起始节点,寻找到其他症状节点的路径,分别有:基于<呕吐咖啡色物SubClassOf呕吐>可以联想到“呕吐”症状,并且可靠性为1;基于<呕血ClinicalFeature呕吐咖啡色物>可以联想到“呕血”,且可靠性为0.6;基于<呕吐咖啡色物SubClassOf呕吐>以及<呕吐SubClassOf消化系统症状>可以联想到“消化系统症状”,且可靠性为1。
当然在这个过程中也存在多路径情况,如由“呕吐咖啡色物”联想到“呕血”,再由“呕血”联想到“消化系统症状”,在该路径情况下,计算联想到“消化系统症状”的可靠性为0.6,低于由“呕吐咖啡色物”联想到“呕吐”,再由“呕吐”联想到“消化系统症状”的可靠性值1。
本发明实施例在构建知识图谱时,基于临床表现本体语义网络的设计,结合权威医学知识教材,主要有《实用诊断学》、《实用内科学》等,采用自然语言处理算法从书本教材中抽取医学症状术语以及不同医学症状术语之间的语义关系,并采用三元组的形式表达,进而使用所有抽取得到的三元组构建医学症状知识图谱,具体可采用目前通用的ApacheJena,Neo4j,protégé等技术构建本发明的医学症状知识图谱。本发明构建的知识图谱涵盖1659个概念实体为医学症状术语,以及8954条语义关系,其中一级概念如表2所示:
表2临床表现一级概念实体
Figure BDA0002436603840000081
Figure BDA0002436603840000091
本发明在构建第一级临床表现概念实体的时候,考虑了多个维度的症状概念体系,如从系统划分维度,如血液系统、消化系统、呼吸系统等;同时也考虑从部位来对症状概念进行划分如,口腔、鼻部、皮肤、耳部等等。多维度的症状概念划分方式也符合客观事实的认知,在考虑更丰富的概念表达方面,本发明也将一些特定的或者归纳性概念的症状单独划分,例如感觉异常、一般症状等。当然临床表现的知识图谱不仅仅限于现有的规模,后续的研究还将持续的扩展与丰富临床表现的概念体系,与知识图谱规模。
基于已经构建的具备一定规模的临床表现知识图谱,结合实体联想的推理逻辑,本发明已经可以计算出任意一个给定概念实体的联想结果,通过程序推理分析,提供了相应的联想服务,当然最终联想的效果与知识图谱的规模、完整性及基于语义关系构建的概率模型有关。下表3将参考图3,基于部分源实体示例,给出了其联想分析结果。
表3实体联想的分析结果
Figure BDA0002436603840000092
结合在构建了临床表现知识图谱同时,本发明也分析并形成临床表现概念实体的联想推理逻辑。通过对上表分析,可以看到对于给定一个“咳嗽”实体,机器考虑到“剧烈咳嗽”可靠性为0.5,主要是基于父子关系进行联想,子关系与层级有关,层级越多可靠性越低;由“尿路刺激征”进行联想,基于父子关系联想到父节点“泌尿系统症状”可靠性为1,基于组合关系联想到“尿频”、“尿急”、“尿痛”可靠性皆为1;由“呕血”进行联想时,“呕血”与”呕吐”之间在图谱中并没有直接关系,但是先联想到“呕吐咖啡色物”基于临床表现关系,其可靠性为0.8,再由“呕吐咖啡色物”的父亲联想到“呕吐”可靠性为1,那么最终由“呕血”联想到“呕吐”的可靠性为0.8。
本发明实施例通过步骤1至步骤3得到术语规范模型和医学症状知识图谱,可应用在人智能领域,具体的在AI医疗临床辅助决策领域,为临床医生提供智能辅助决策支持:实时获取患者提供的临床表现信息,经过本发明步骤4和步骤5处理,即可得到与患者提供的临床表现信息对应的目标医学症状输出,使得临床医生得到除患者提供的临床表现信息之外更多关联的医学症状,有利于临床医生根据多医学症状从不同诊断方向或诊断范围进行临床诊断,减少漏诊、误诊情况的发生。
同时本实施例得到的术语规范模型,可以直接获取患者提供的临床表现信息,省略了临床医生从中提取医学症状的术语转换环节,提高临床诊断效率;而且由于术语规范模型是通过大量训练样本训练得到,因此可保证其在使用时所输出的是规范的医学症状术语,进而符合医学症状知识图谱的要求,从而获得更完整、准确的目标医学症状。
另外实施例得到的医学症状知识图谱,仅仅可提供联想输出的目标医学症状,可且还提供了完整的解释性路径,让每一个分析结果均具备可解释性。
本发明还提供一种基于知识图谱的临床表现联想装置实施例,与前述联想方法实施例对应,包括:。
语料标注模块,用于:获取大量由患者提供的历史临床表现信息,语料标注为医学症状术语;
术语规范模型构建模块,用于:以患者提供的历史临床表现信息和对应的医学症状术语,分别作为BiLSTM-Attention原始模型的编码信息和解码信息,训练BiLSTM-Attention原始模型,得到术语规范模型;
医学症状知识图谱构建模块,用于:以预选的每个医学症状术语均作为节点,以不同医学症状术语之间的语义关系为边,构建医学症状知识图谱;其中,每种类型的语义关系具有对应的联想可靠性;
医学症状术语实时提取模块,用于:获取患者实时提供的临床表现信息,输入术语规范模型得到对应的医学症状术语;
目标医学症状联想模块,用于:根据医学症状术语实时提取模块得到的医学症状术语,在知识图谱中找到对应的待联想的医学症状术语节点,再以该待联想的医学症状术语节点为起点、基于医学症状知识图谱中的联想可靠性进行联想;然后选择联想可靠性大于预设值的联想路径,将联想路径终点所示的医学症状术语作为目标医学症状输出。
本发明还提供一种设备,包括处理器和存储器;其中:所述存储器用于存储计算机指令;所述处理器用于执行所述存储器存储的计算机指令,具体执行上述方法实施例中所述的方法。
本发明还提供一种计算机存储介质,用于存储程序,所述程序被执行时,用于实现上述方法实施例中所述的方法。
以上实施例为本申请的优选实施例,本领域的普通技术人员还可以在此基础上进行各种变换或改进,在不脱离本申请总的构思的前提下,这些变换或改进都应当属于本申请要求保护的范围之内。

Claims (9)

1.一种基于知识图谱的临床表现联想方法,其特征在于,包括以下步骤:
步骤1,获取大量由患者提供的历史临床表现信息,语料标注为医学症状术语;
步骤2,以患者提供的历史临床表现信息和对应的医学症状术语,分别作为BiLSTM-Attention原始模型的编码信息和解码信息,训练BiLSTM-Attention原始模型,得到术语规范模型;
步骤3,以预选的每个医学症状术语均作为节点,以不同医学症状术语之间的语义关系为边,构建医学症状知识图谱;其中,每种类型的语义关系具有对应的联想可靠性,即由一个医学症状术语联想到另一个医学症状术语的概率,在知识图谱中表现为由其中一个节点a联想到另一个节点b的概率;
步骤4,获取患者实时提供的临床表现信息,作为编码信息输入术语规范模型得到对应的医学症状术语;
步骤5,根据步骤4得到的医学症状术语,在医学症状知识图谱中找到对应的待联想的医学症状术语节点,再以该待联想的医学症状术语节点为起点、基于医学症状知识图谱中的联想可靠性进行联想;然后选择联想可靠性大于预设值的联想路径,将联想路径终点所示的医学症状术语作为目标医学症状输出;
其中,联想路径s→t的联想可靠性计算方法为:R(s,t)=R(s,m1)*R(m1,m2)*…*R(ml,t),s为待联想的医学症状术语所示的节点,且s、t分别为联想路径s→t的起点和终点,m1,m2,…,ml为联想路径的中间节点。
2.根据权利要求1所述的方法,其特征在于,患者提供的每个临床表现信息,对应得到一个或多个医学症状术语;医学症状术语的类型为症状类型或者描述类型,其中描述类型包括程度、性质、规律、形态、事件、体位和/或颜色。
3.根据权利要求2所述的方法,其特征在于,在步骤5之前还包括步骤,判断步骤4得到的医学症状术语中,是否包括症状类型的医学症状术语:若包括,则执行步骤5;否则将患者实时提供的临床表现信息视为无效信息,提醒患者重新提供临床表现信息,并返回执行步骤4。
4.根据权利要求2所述的方法,其特征在于,医学症状术语之间的语义关系,包括:父子关系、扩展关系、组成关系、临床表现关系、描述关系、减轻关系、加重关系、诱发关系。
5.根据权利要求4所述的方法,其特征在于,
在父子关系中:由子节点a联想到父节点p的联想可靠性为R(a,p)=1,由父节点p联想到子节点a的联想可靠性为R(p,a)=β,β表示可靠性衰减参数;
在同一父节点p的每两个子节点a、b之间:若两个子节点a、b均与父节点p之间存在扩展关系,则两个子节点a、b之间的联想可靠性为R(a,b)=x+(1-x)*αn,x为基础得分,α为属性差异的衰减指数,n为两个子节点a、b之间的描述属性差异个数;否则两个子节点a、b之间的联想可靠性为R(a,b)=0;
在临床表现关系中:设节点d所示的医学症状术语可进一解释节点c所示的医学症状术语,则节点之间的联想可靠性为:R(c,d)=u,R(d,c)=v,u为临床表现关系的可靠性参数,v为临床表现关系反向推理的可靠性参数;
在组成关系中:设节点e可由若干个节点e1…ei…组合得到,则节点e与每个节点ei之间的联想可靠性为:R(e,ei)=1,R(ei,e)=0。
6.根据权利要求1所述的方法,其特征在于,当起点s与终点t之间存在多条联想路径时,取联想可靠性最大的联想路径作为该起点s至终点t的联想可靠性:
R(s,t)=maxRj(s,t),
Rj(s,t)表示起点s至终点t的第j条联想路径。
7.一种基于知识图谱的临床表现联想装置,其中特征在于,包括:
语料标注模块,用于:获取大量由患者提供的历史临床表现信息,语料标注为医学症状术语;
术语规范模型构建模块,用于:以患者提供的历史临床表现信息和对应的医学症状术语,分别作为BiLSTM-Attention原始模型的编码信息和解码信息,训练BiLSTM-Attention原始模型,得到术语规范模型;
医学症状知识图谱构建模块,用于:以预选的每个医学症状术语均作为节点,以不同医学症状术语之间的语义关系为边,构建医学症状知识图谱;其中,每种类型的语义关系具有对应的联想可靠性,即由一个医学症状术语联想到另一个医学症状术语的概率,在知识图谱中表现为由其中一个节点a联想到另一个节点b的概率;
医学症状术语实时提取模块,用于:获取患者实时提供的临床表现信息,输入术语规范模型得到对应的医学症状术语;
目标医学症状联想模块,用于:根据医学症状术语实时提取模块得到的医学症状术语,在医学症状知识图谱中找到对应的待联想的医学症状术语节点,再以该待联想的医学症状术语节点为起点、基于医学症状知识图谱中的联想可靠性进行联想;然后选择联想可靠性大于预设值的联想路径,将联想路径终点所示的医学症状术语作为目标医学症状输出;
其中,联想路径s→t的联想可靠性计算方法为:R(s,t)=R(s,m1)*R(m1,m2)*…*R(ml,t),s为待联想的医学症状术语所示的节点,且s、t分别为联想路径s→t的起点和终点,m1,m2,…,ml为联想路径的中间节点。
8.一种设备,其特征在于,包括处理器和存储器;其中:所述存储器用于存储计算机指令;所述处理器用于执行所述存储器存储的计算机指令,具体执行如权利要求1-6任一所述的方法。
9.一种计算机存储介质,其特征在于,用于存储程序,所述程序被执行时,用于实现如权利要求1-6任一所述的方法。
CN202010254094.0A 2020-04-02 2020-04-02 一种基于知识图谱的临床表现联想方法、装置、设备及介质 Active CN111611398B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010254094.0A CN111611398B (zh) 2020-04-02 2020-04-02 一种基于知识图谱的临床表现联想方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010254094.0A CN111611398B (zh) 2020-04-02 2020-04-02 一种基于知识图谱的临床表现联想方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN111611398A CN111611398A (zh) 2020-09-01
CN111611398B true CN111611398B (zh) 2023-04-07

Family

ID=72201507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010254094.0A Active CN111611398B (zh) 2020-04-02 2020-04-02 一种基于知识图谱的临床表现联想方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN111611398B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100399B (zh) * 2020-09-09 2023-12-22 杭州凡闻科技有限公司 基于知识体系的知识图谱模型的创建方法及图谱检索方法
CN113010685B (zh) * 2021-02-23 2022-12-06 安徽讯飞医疗股份有限公司 医学术语标准化方法、电子设备和存储介质
CN113077873B (zh) * 2021-05-06 2022-11-22 井颐医疗信息技术(杭州)有限公司 一种中医临床决策支持系统及方法
CN115101164A (zh) * 2022-06-24 2022-09-23 杭州华卓信息科技有限公司 一种药物推荐方法和系统
CN117198547B (zh) * 2023-09-01 2024-04-30 湖北中医药大学 中医临床科研知识智能提取方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145120A (zh) * 2018-07-02 2019-01-04 北京妙医佳信息技术有限公司 医学健康领域知识图谱的关系抽取方法及系统
CN110223742A (zh) * 2019-06-14 2019-09-10 中南大学 中文电子病历数据的临床表现信息抽取方法和设备
CN110362690A (zh) * 2019-07-04 2019-10-22 北京爱医生智慧医疗科技有限公司 一种医学知识图谱构建方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180350459A1 (en) * 2017-06-05 2018-12-06 University Of Florida Research Foundation, Inc. Methods and apparatuses for implementing a semantically and visually interpretable medical diagnosis network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145120A (zh) * 2018-07-02 2019-01-04 北京妙医佳信息技术有限公司 医学健康领域知识图谱的关系抽取方法及系统
CN110223742A (zh) * 2019-06-14 2019-09-10 中南大学 中文电子病历数据的临床表现信息抽取方法和设备
CN110362690A (zh) * 2019-07-04 2019-10-22 北京爱医生智慧医疗科技有限公司 一种医学知识图谱构建方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨建梁等.从电子文件到知识图谱:电子文件知识服务新途径.《档案学通讯》.2020,(第2期),第10-19页. *

Also Published As

Publication number Publication date
CN111611398A (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
CN111611398B (zh) 一种基于知识图谱的临床表现联想方法、装置、设备及介质
CN113707297B (zh) 医疗数据的处理方法、装置、设备及存储介质
CN111292848B (zh) 一种基于贝叶斯估计的医疗知识图谱辅助推理方法
Duarte et al. Data quality evaluation of electronic health records in the hospital admission process
WO2021139231A1 (zh) 基于神经网络模型的分诊方法、装置和计算机设备
CN116682553A (zh) 一种融合知识与患者表示的诊断推荐系统
CN111785387B (zh) 一种使用Bert做疾病标准化映射分类的方法及系统
CN112541066A (zh) 基于文本结构化的医技报告检测方法及相关设备
CN116910213A (zh) 一种基于深度强化学习的自动问答系统
Guo et al. Purpose Driven DIKW Modeling and Analysis of Meteorology and Depression
CN116628219A (zh) 一种基于知识图谱的问答方法
CN118245580A (zh) 基于知识图谱搜索输出问诊建议策略的方法、介质和设备
CN111783473B (zh) 医疗问答中最佳答案的识别方法、装置和计算机设备
CN116913459A (zh) 基于深度卷积网络控制门模型的用药推荐方法及系统
CN117493504A (zh) 一种基于生成式预训练语言模型的医疗事件抽取方法
CN116469534A (zh) 医院叫号管理系统及其方法
CN115062628A (zh) 一种基于知识图谱的医患交流对话自动模拟方法
CN114596962A (zh) 一种基于问答式问卷的疾病风险评估方法及存储介质
CN114334125A (zh) 诊断预测方法及相关装置、电子设备和存储介质
Kovas et al. Using Level-Based Multiple Reasoning in a Web-Based Intelligent System for the Diagnosis of Farmed Fish Diseases
Zhang et al. Medical Q&A statement NER based on ECA attention mechanism and lexical enhancement
CN111524564A (zh) 一种肺炎临床辅助监测方法及系统
Deasy et al. Impact of novel aggregation methods for flexible, time-sensitive EHR prediction without variable selection or cleaning
Gufar et al. A rule based expert system for syncope prediction
Gleber et al. Diagnostic reasoning in the age of artificial intelligence: Synergy or opposition?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant