CN112131400A - 一种辅助门诊助手的医疗知识图谱的构建方法 - Google Patents

一种辅助门诊助手的医疗知识图谱的构建方法 Download PDF

Info

Publication number
CN112131400A
CN112131400A CN202010955614.0A CN202010955614A CN112131400A CN 112131400 A CN112131400 A CN 112131400A CN 202010955614 A CN202010955614 A CN 202010955614A CN 112131400 A CN112131400 A CN 112131400A
Authority
CN
China
Prior art keywords
type
concept
disease
relationship
medical knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010955614.0A
Other languages
English (en)
Inventor
刘峥嵘
王岩
张国强
姚姣
许可
杨志宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ouying Information Technology Co Ltd
Original Assignee
Beijing Ouying Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ouying Information Technology Co Ltd filed Critical Beijing Ouying Information Technology Co Ltd
Priority to CN202010955614.0A priority Critical patent/CN112131400A/zh
Publication of CN112131400A publication Critical patent/CN112131400A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本公开的实施例提供了一种辅助门诊助手的医疗知识图谱的构建方法、系统、设备和计算机可读存储介质。所述方法包括对所需的概念类型和关系类型进行定义;基于已存的疾病列表,获取半结构化文本信息,通过完成定义的概念类型和关系类型对所述半结构化文本信息进行分析,提取所需的概念类型和关系类型;根据所述所需的概念类型和关系类型,构建医疗知识图谱。以此方式,可以根据患者的具体情况安排需要拍摄的影像和检查,提升了患者在门诊候诊流程的效率和体验。

Description

一种辅助门诊助手的医疗知识图谱的构建方法
技术领域
本公开的实施例一般涉及医疗领域,并且更具体地,涉及一种辅助门诊助手的医疗知识图谱的构建方法、系统、设备和计算机可读存储介质。
背景技术
在医院门诊现场的高峰期,经常会有大批的患者在医生诊室门口等候。为了便于提升门诊效率,医院经常会安排一个门诊助手在现场协助,这个门诊助手通常要承担两个职能:初步判断患者病情的严重程度,以便合理分诊;提前安排一些需要拍摄的影像和检查的工作。
为了提升患者在门诊候诊流程的效率和体验,市场上也推出了很多的智能设备,例如门诊叫号系统、智能问诊系统和临床辅助决策系统等。
但是,上述系统均不能根据患者具体情况提示现场所需的影像和检查。
发明内容
本公开旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,在本公开的第一方面,提供了一种辅助门诊助手的医疗知识图谱的构建方法。该方法包括:
对所需的概念类型和关系类型进行定义;
基于已存的疾病列表,获取半结构化文本信息,通过完成定义的概念类型和关系类型对所述半结构化文本信息进行分析,提取所需的概念类型和关系类型;
根据所述所需的概念类型和关系类型,构建医疗知识图谱。
进一步地,
所述概念类型,用于定义同一大类概念;
所述关系类型,用于定义不同的概念类型之间的特定关系。
进一步地,所述对所需的概念类型和关系类型进行定义包括:
通过术语集对所述所需的概念类型和关系类型进行定义。
进一步地,所述术语集包括完整的疾病、症状和/或检查的概念列表。
进一步地,所述基于已存的疾病列表,获取半结构化文本信息包括:
基于已存的疾病列表,从医疗数据资源上获取所述半结构化文本信息。
进一步地,所述医疗知识图谱为闭环结构。
进一步地,所述闭环结构包括:
疾病->检查->结果->疾病闭环结构;
疾病->检验->结果->疾病闭环结构;
疾病->解剖结构->临床所见->疾病闭环结构。
在本公开的第二方面,提出了一种辅助门诊助手的医疗知识图谱的构建系统,包括:
定义模块,用于对所需的概念类型和关系类型进行定义;
分析提取模块,用于基于已存的疾病列表,获取半结构化文本信息,通过完成定义的概念类型和关系类型对所述半结构化文本信息进行分析,提取所需的概念类型和关系类型;
构建模块,用于根据所述所需的概念类型和关系类型,构建医疗知识图谱。
在本公开的第三方面,提出了一种设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如根据本公开的上述方法。
在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本公开的上述方法。
本申请实施例提供的一种辅助门诊助手的医疗知识图谱的构建方法,通过对所需的概念类型和关系类型进行定义,基于已存的疾病列表,获取半结构化文本信息,通过完成定义的概念类型和关系类型对所述半结构化文本信息进行分析,提取所需的概念类型和关系类型,根据所述所需的概念类型和关系类型,构建医疗知识图谱,实现了门诊助手的工作智能化,同时大大提升患者在门诊候诊流程的效率和体验。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1是本申请的一个实施例可以应用于其中的示例性系统架构图;
图2是根据本申请的辅助门诊助手的医疗知识图谱的构建方法的一个实施例的流程图;
图3是用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图;
图4是根据本申请的不同概念类型之间的关系类型示意图;
图5是根据本申请的百度百科词条搜索结果示意图;
图6是根据本申请实施例的一种辅助门诊助手的医疗知识图谱的构建方法的一个应用场景示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1示出了可以应用本申请的辅助门诊助手的医疗知识图谱的构建方法或辅助门诊助手的医疗知识图谱的构建装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如模型训练类应用、视频识别类应用、网页浏览器应用、社交平台软件等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
当终端101、102、103为硬件时,其上还可以安装有视频采集设备。视频采集设备可以是各种能实现采集视频功能的设备,如摄像头、传感器等等。用户可以利用终端101、102、103上的视频采集设备来采集视频。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的数据处理的后台服务器。后台服务器可以对接收到的数据进行分析等处理,并可以将处理结果反馈给终端设备。
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。特别地,在目标数据不需要从远程获取的情况下,上述系统架构可以不包括网络,而只包括终端设备或服务器。
如图2所示,是本申请实施例一种辅助门诊助手的医疗知识图谱的构建方法的流程图。从图2中可以看出,本实施例的辅助门诊助手的医疗知识图谱的构建方法,包括以下步骤:
S210,对所需的概念类型和关系类型进行定义。
通过术语集对所需要的概念类型和关系类型进行定义,所述术语集包括完整的疾病、症状和/或检查的概念列表。
可选地,所述术语集包括ICD-9、OMAHA和/或SNOMED等医疗术语集。
进一步地,所述术语集中包含了大量的原子概念(语义上没有修饰词,不能再拆分的概念)、“疾病”和“解剖”的基本概念等。例如,将“膝关节急性疼痛”拆分为“膝关节”、“急性”和“疼痛”三种基本信息。可选地,根据临床所见性质、严重程度、事件、事件范围、基本所见和/或运动能力所见对获取的信息进行拆分。所述获取的信息包括患者访问时录入的自然语言信息。
所述概念类型,用于定义同一大类概念。例如,“半月板损伤”是一种具体的“疾病”,“膝关节疼痛”是一种“临床所见”。在这里,“半月板损伤”和“膝关节疼痛”都是具体的概念,而“疾病”和“临床所见”则是概念类型。
可选地,所述临床所见是在临床中,能够不用通过特定的测量流程,就能够获得的患者的症状、畸形和患者能够主诉表达的痛苦和不适。
可选地,对所述概念类型的设计如下表所示:
Figure BDA0002678487490000071
所述关系类型,用于定义不同的概念类型之间的特定关系。
可选地,对所述关系类型的设计如下表所示:
Figure BDA0002678487490000081
可选地,在不同的概念类型之间,存在某些特定的关系类型。例如,在“疾病”和“检查”这两个概念类型之间,可以形成“相关检查”的关系,这种关系,是本发明构建的医疗知识图谱的可解释性的主要体现。可告知患者在这类疾病下,患者可能所需的检查有哪些。
可选地,所述概念类型和关系类型如图4所示。
需要说明的是,本发明中所有的概念都是围绕“疾病”为核心。即,在关系的拓扑结构中,“疾病”是处于最核心的位置。
S220,基于已存的疾病列表,获取半结构化文本信息,通过完成定义的概念类型和关系类型对所述半结构化文本信息进行分析,提取所需的概念类型和关系类型。
其中,已存的疾病列表包括需要构建的医疗知识图谱中所需的所有疾病名称。
可选地,所述疾病列表中的疾病超过10000种。
可选地,根据所述疾病列表中存有的疾病名称,从医疗数据资源中获取相应的半结构化文本信息,并将所述半结构化文本信息进行存储形成语料库。所述医疗数据资源包括在线的医疗相关百科词条、学术论文、会议、期刊和/或教科书等。所述在线的医疗相关百科词条包括百度百科,搜狗百科等。
优选地,通过如图5所示的百度百科,获取相应的半结构化文本信息。因为已经包含了类似“病因”、“临床表现”等具体的子类目,甚至还有更细的子类目。所以在这类语料上进行实体和关系抽取,获取相应的半结构化文本信息,会有更好的效果。
可选地,所述实体包括疾病名、症状描述、使用药物、手术名称和/或医疗设备等;所述关系包括疾病和哪些症状有关、手术会使用到哪些设备和/或药物不适用于哪些人群等。例如,所述实体之间的关系为:疾病->症状,人群->罹患疾病,年龄+手术->手术风险。
可选地,从所述语料库中抽取出多个疾病的相关语料进行标注,所述多个疾病涵盖不同的科室,所述多个可根据实际情况进行设定,一般抽取的疾病不少于500。
可选地,根据已定义的概念类型和关系类型通过各类标注工具对所述疾病进行实体和关系标注。所述标注工具包括brat、标注精灵等。
例如,根据已定义的概念类型和关系类型对“半月板损伤”词条中的“外伤后立即产生剧烈的疼痛”进行标注,标注结果为:[1,2]是T06事件,[8,12]是T07临床所见。即,该句的第1~2个字(“外伤”),表示一个事件,该句的8~12个字(“剧烈的疼痛”),表示一个临床所见。
可选地,在所述半结构化文本中,所有的信息都和词条本身相关。即,所述词条中标注的概念,都与该词条名的概念直接相关。例如,“半月板损伤”这个词条中“外伤后立即产生剧烈的疼痛”,其中,“外伤”(发现的概念)和“半月板损伤”(词条本身的概念)这两个概念之间,会构成一个关系。“剧烈的疼痛”(发现的概念)和“半月板损伤”(词条本身的概念)这两个概念之间,也会构成一个关系。
可选地,将标注结果作为训练数据,通过预设算法进行模型训练,得到模型。所述预设算法包括条件随机场算法(conditional random field)等机器学习算法。
进一步地,将所述模型应用于更广泛的语料中,能够识别出更多新的概念,同时,因为词条中标注的概念,都与该词条名的概念直接相关,所以新的概念和词条本身的关系,也同样会被抽取出来。即,自动化的完成概念和关系的抽取。
S230,根据所述所需的概念类型和关系类型,构建医疗知识图谱。
根据所述所需的概念类型和关系类型,构建闭环结构的医疗知识图谱。
可选地,所述闭环结构的医疗知识图谱包括:
疾病->检查->结果->疾病闭环结构,用于为特定疾病的患者提供开具查体和影像的逻辑依据;
疾病->检验->结果->疾病闭环结构,用于为特定疾病的患者提供开具实验室检查的逻辑依据;
疾病->解剖结构->临床所见->疾病闭环结构,用于为特定疾病的发病部位和临床表现的逻辑依据。
因为实际应用场景的复杂多变,所以在应用过程中可能会出现非闭环结构(数据质量差),导致向患者反馈的信息出现错误,因此需要对所述非闭环结构进行增补。即,对不闭环的边进行增补。
以所述疾病->检查->结果->疾病闭环结构为例。如图6所示,呈现了一个检查相关的概念循环,其中每个椭圆形中包含了一个具体的概念及其类别。“前交叉韧带损伤”这个疾病,与“前抽屉试验”这个概念之间有“相关检查”的关系;“前抽屉试验”和“前抽屉试验阳性”之间有“评价结果”的关系;“前抽屉试验阳性”和“前交叉韧带损伤”之间有“结果提示”的关系。
通过给定具体的遍历路径(如相关检查->评价结果->结果提示->相关检查),来判断是否存在不闭环的边。对于不闭环的边,形成需要增补的概念和关系,
因为本发明构建的医疗知识图谱是以疾病为中心,所以如果出现不必环边,原因只能为“T02评价结果”缺失或“T03检查”缺失中的一种。
若“T03检查”存在,但是“T02评价结果”缺失时:
a)“T03检查”概念与百科词条相对应。按照步骤S220的补充概念和关系的方法,获得这些检查类词条(如,“前抽屉试验”的百科词条)。
b)在检查类词条中选择一部分作为标注集合,标注方式同步骤S220中的概念抽取环节。所述标注集合包括大量关于评价结果的标注信息。可选地,通常在检查类词条中选择1/10作为标注集合
c)将新增的标注加入步骤S220的概念抽取环节的标注集中,重新训练模型。
d)将增强后的模型,应用于所有的检查类词条,得到“T02评价结果”的快速批量补充。
若“T02评价结果”存在,但是“T03检查”缺失时:
a)若“T02评价结果”的文本中,包含了“T03检查”。如,“前抽屉试验阳性”中就自然包含了“前抽屉试验”。则通过固定的“包含规则”,将评价结果中,评价的部分(如,阳性)去掉,留下来具体的检查。
b)若“T02评价结果”的文本中,不包含“T03检查”。此时,应用“同现规则”进行检查的提取。如,在“通过膝关节X光检查,显示患者膝关节间隙变窄”这句话中,检查和评价结果在一句话中共同出现。则构建这个规则。即,扫描所有的语料,确定检查和评价结果中应有的关系。
c)将以上两种情况的关系,补充到图谱中去。
下面给出根据本发明一个具体实施例的应用方法,如图6所示:
(一)获取患者输入的自然语言,应用本图谱的设备可以将自然语言中的文本去匹配知识图谱中的概念。系统获得患者输入的自然语言“患者感觉膝关节疼痛有一个月以上”,将所述患者和“膝关节”、“疼痛”、“一个月以上”三个概念相匹配。
(二)在图谱中找到两个不同的通路,分别简介指向“膝关节骨关节炎”和“半月板损伤两种疾病”。
(三)所述“膝关节骨关节炎”,多发生于“老年”和“中年”;所述“半月板损伤”多发生于“膝关节外伤”事件之后。因此,应用本图谱的程序,进一步采集患者是否为中老年,采集患者是否有外伤。即向患者发送相关提示信息,如“是否存在膝关节外伤”。若患者确定存在膝关节外伤,则增加“半月板”损伤的证据数。
(四)根据证据数量,向患者提示可能的疾病排序。在本实施例中,“半月板损伤”为首选的疾病。
(五)根据构建的医疗知识图谱,向患者发送做“膝关节核磁”的提示信息。
进一步地,在与患者的交互过程中,能够根据“半月板损伤”与“膝关节外伤”之间存在的关系,向患者发送“半月板损伤多发于膝关节外伤之后”的解释信息。
本实施例的辅助门诊助手的医疗知识图谱的构建方法,通过对概念类型和关系类型进行定义,以机器学习方法和规则方法为主,借助半结构化开放性语料,形成具有初步门诊助手能力的知识图谱,大幅提升了患者在门诊候诊流程的效率和体验。
本申请实施例还提出了一种辅助门诊助手的医疗知识图谱的构建系统,包括:
定义模块,用于对所需的概念类型和关系类型进行定义;
分析提取模块,用于基于已存的疾病列表,获取半结构化文本信息,通过完成定义的概念类型和关系类型对所述半结构化文本信息进行分析,提取所需的概念类型和关系类型;
构建模块,用于根据所述所需的概念类型和关系类型,构建医疗知识图谱。
本申请实施例还提出了一种设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述的辅助门诊助手的医疗知识图谱的构建方法。
此外,本申请实施例还提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的辅助门诊助手的医疗知识图谱的构建方法。
下面参考图3,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。图3示出的终端设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图3所示,计算机系统包括中央处理单元(CPU)301,其可以基于存储在只读存储器(ROM)302中的程序或者从存储部分308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有系统操作所需的各种程序和数据。CPU301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
以下部件连接至I/O接口305:包括键盘、鼠标等的输入部分306;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分307;包括硬盘等的存储部分308;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也基于需要连接至I/O接口305。可拆卸介质311,诸如磁盘、光盘、磁光盘、半导体存储器等等,基于需要安装在驱动器310上,以便于从其上读出的计算机程序基于需要被安装入存储部分308。
特别地,基于本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分309从网络上被下载和安装,和/或从可拆卸介质311被安装。在该计算机程序被中央处理单元(CPU)301执行时,执行本申请的方法中限定的上述功能。
需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分,所述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括知识图谱定义单元、知识图谱分析单元、知识图谱构建单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:对所需的概念类型和关系类型进行定义;基于已存的疾病列表,获取半结构化文本信息,通过完成定义的概念类型和关系类型对所述半结构化文本信息进行分析,提取所需的概念类型和关系类型;根据所述所需的概念类型和关系类型,构建医疗知识图谱。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种辅助门诊助手的医疗知识图谱的构建方法,其特征在于,包括:
对所需的概念类型和关系类型进行定义;
基于已存的疾病列表,获取半结构化文本信息,通过完成定义的概念类型和关系类型对所述半结构化文本信息进行分析,提取所需的概念类型和关系类型;
根据所述所需的概念类型和关系类型,构建医疗知识图谱。
2.根据权利要求1所述的方法,其特征在于,
所述概念类型,用于定义同一大类概念;
所述关系类型,用于定义不同的概念类型之间的特定关系。
3.根据权利要求2所述的方法,其特征在于,所述对所需的概念类型和关系类型进行定义包括:
通过术语集对所述所需的概念类型和关系类型进行定义。
4.根据权利要求3所述的方法,其特征在于,所述术语集包括完整的疾病、症状和/或检查的概念列表。
5.根据权利要求4所述的方法,其特征在于,所述基于已存的疾病列表,获取半结构化文本信息包括:
基于已存的疾病列表,从医疗数据资源上获取所述半结构化文本信息。
6.根据权利要求5所述的方法,其特征在于,所述医疗知识图谱为闭环结构。
7.根据权利要求6所述的方法,其特征在于,所述闭环结构包括:
疾病->检查->结果->疾病闭环结构;
疾病->检验->结果->疾病闭环结构;
疾病->解剖结构->临床所见->疾病闭环结构。
8.一种辅助门诊助手的医疗知识图谱的构建系统,其特征在于,包括:
定义模块,用于对所需的概念类型和关系类型进行定义;
分析提取模块,用于基于已存的疾病列表,获取半结构化文本信息,通过完成定义的概念类型和关系类型对所述半结构化文本信息进行分析,提取所需的概念类型和关系类型;
构建模块,用于根据所述所需的概念类型和关系类型,构建医疗知识图谱。
9.一种设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1~7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~7中任一项所述的方法。
CN202010955614.0A 2020-09-11 2020-09-11 一种辅助门诊助手的医疗知识图谱的构建方法 Pending CN112131400A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010955614.0A CN112131400A (zh) 2020-09-11 2020-09-11 一种辅助门诊助手的医疗知识图谱的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010955614.0A CN112131400A (zh) 2020-09-11 2020-09-11 一种辅助门诊助手的医疗知识图谱的构建方法

Publications (1)

Publication Number Publication Date
CN112131400A true CN112131400A (zh) 2020-12-25

Family

ID=73845463

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010955614.0A Pending CN112131400A (zh) 2020-09-11 2020-09-11 一种辅助门诊助手的医疗知识图谱的构建方法

Country Status (1)

Country Link
CN (1) CN112131400A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239238A (zh) * 2021-06-17 2021-08-10 上海海洋大学 一种面向半结构化领域数据的知识图谱自动构建方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829728A (zh) * 2018-05-10 2018-11-16 杭州依图医疗技术有限公司 一种医学术语库的存储方法和装置
CN110085307A (zh) * 2019-04-04 2019-08-02 华东理工大学 一种基于多源知识图谱融合的智能导诊方法和系统
US20190252074A1 (en) * 2016-10-25 2019-08-15 Koninklijke Philips N.V. Knowledge graph-based clinical diagnosis assistant
CN110968650A (zh) * 2019-10-30 2020-04-07 清华大学 基于医生协助的医疗领域知识图谱构建方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190252074A1 (en) * 2016-10-25 2019-08-15 Koninklijke Philips N.V. Knowledge graph-based clinical diagnosis assistant
CN108829728A (zh) * 2018-05-10 2018-11-16 杭州依图医疗技术有限公司 一种医学术语库的存储方法和装置
CN110085307A (zh) * 2019-04-04 2019-08-02 华东理工大学 一种基于多源知识图谱融合的智能导诊方法和系统
CN110968650A (zh) * 2019-10-30 2020-04-07 清华大学 基于医生协助的医疗领域知识图谱构建方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113239238A (zh) * 2021-06-17 2021-08-10 上海海洋大学 一种面向半结构化领域数据的知识图谱自动构建方法
CN113239238B (zh) * 2021-06-17 2024-03-15 上海海洋大学 一种面向半结构化领域数据的知识图谱自动构建方法

Similar Documents

Publication Publication Date Title
US10910100B2 (en) System and method for generating descriptions of abnormalities in medical images
US10628476B2 (en) Information processing apparatus, information processing method, information processing system, and storage medium
JP5455470B2 (ja) 医用画像読影システム
US20090048866A1 (en) Rules-Based System For Routing Evidence and Recommendation Information to Patients and Physicians By a Specialist Based on Mining Report Text
Báez et al. The Chilean Waiting List Corpus: a new resource for clinical named entity recognition in Spanish
US11488693B2 (en) Abstracting information from patient medical records
EP2922018A1 (en) Medical information analysis program, medical information analysis device, and medical information analysis method
US20180032676A1 (en) Method and system for context-sensitive assessment of clinical findings
CN110471941B (zh) 自动定位判断依据的方法、装置及电子设备
Li et al. Improvement and multi-population generalizability of a deep learning-based chest radiograph severity score for COVID-19
US11322229B2 (en) System and method of documenting clinical trials
CN112131400A (zh) 一种辅助门诊助手的医疗知识图谱的构建方法
JP5578889B2 (ja) 読影レポート作成支援装置、及び、読影レポート作成支援方法
US20240006039A1 (en) Medical structured reporting workflow assisted by natural language processing techniques
CN111400759A (zh) 访视时间表生成方法及装置、存储介质、电子设备
US20180039761A1 (en) Method and system for automatically adding connectors during generation of a report
WO2023070157A1 (en) Methods and systems for automated analysis of medical images with injection of clinical ranking
Moreno-García et al. Assessing the clinicians’ pathway to embed artificial intelligence for assisted diagnostics of fracture detection.
Wu et al. Chest imagenome dataset
CN113793677A (zh) 一种电子病历管理方法、装置、存储介质及电子设备
Buendía et al. An annotation approach for radiology reports linking clinical text and medical images with instructional purposes
Dai et al. Evaluating a Natural Language Processing–Driven, AI-Assisted International Classification of Diseases, 10th Revision, Clinical Modification, Coding System for Diagnosis Related Groups in a Real Hospital Environment: Algorithm Development and Validation Study
Ribeiro et al. Explainable AI in Deep Learning-based Detection of Aortic Elongation on Chest X-ray Images
US20230368899A1 (en) Systems and methods to process electronic images with automatic protocol revisions
US20240331879A1 (en) Automated alerting system for relevant examinations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination