CN113488180B - 一种临床指南知识建模方法及系统 - Google Patents

一种临床指南知识建模方法及系统 Download PDF

Info

Publication number
CN113488180B
CN113488180B CN202110857537.XA CN202110857537A CN113488180B CN 113488180 B CN113488180 B CN 113488180B CN 202110857537 A CN202110857537 A CN 202110857537A CN 113488180 B CN113488180 B CN 113488180B
Authority
CN
China
Prior art keywords
module
information
knowledge
clinical
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110857537.XA
Other languages
English (en)
Other versions
CN113488180A (zh
Inventor
吴思竹
崔佳伟
钱庆
修晓蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Medical Information CAMS
Original Assignee
Institute of Medical Information CAMS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Medical Information CAMS filed Critical Institute of Medical Information CAMS
Priority to CN202110857537.XA priority Critical patent/CN113488180B/zh
Publication of CN113488180A publication Critical patent/CN113488180A/zh
Application granted granted Critical
Publication of CN113488180B publication Critical patent/CN113488180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种临床指南知识建模方法及系统,包括:获取临床指南数据集;对临床指南数据集进行文本解析,并生成文档层信息;基于文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并生成模块层信息;对模块层信息中的模块内容进行知识化处理,获得知识层信息,知识层信息表征临床指南的知识图谱信息;构建文档层信息、模块层信息和知识层信息之间的关联关系,生成关联关系库,并对关联关系库进行可视化展示,得到跨层多维关联模型。实现了对不同版本的临床指南进行规范和整合,便于对指南信息的关联关系和内容逐层展示,满足了对临床指南知识的应用需求,提升了临床指南知识建模的实用性。

Description

一种临床指南知识建模方法及系统
技术领域
本发明涉及信息处理技术领域,特别是涉及一种临床指南多层次知识建模方法及系统。
背景技术
临床指南又称为临床时间指南或者医疗指南,是对医学证据的系统综述和对治疗利弊的评估基础上给出的实践建议,包含针对特定临床问题的指导意见,用以协助医护人员和患者在特定的临床背景和情境下做出适当的选择。
但是,目前重大疾病的临床指南知识组织体系杂乱、来源众多,即使同一指南随着更新结构也会发生变化,而且大多指南仅以长文本形式组织疾病诊断内容,致使医生不仅难以系统的学习、理解临床指南知识,更为医生有针对性的查阅带来阻碍。现有的针对临床指南进行的知识模型的表示主要是以支持计算机解析处理为主,模型结构复杂,使用繁琐,指南内容解释粒度单一,且主要依据人工进行信息抽取,效率低,对指南内容知识的可追溯性差且缺乏扩展性,因此,现有的临床指南对应的知识模型实用性较差无法更好满足实际的应用需求。
发明内容
针对于上述问题,本发明提供一种临床指南知识建模方法及系统,提升了临床指南知识建模的实用性,满足了对临床指南知识的应用需求。
为了实现上述目的,本发明提供了如下技术方案:
一种临床指南知识建模方法,包括:
获取临床指南数据集,所述临床指南数据集中包括不同来源的临床指南,以及同一来源对应的不同版本的临床指南;
对所述临床指南数据集进行文本解析,并基于解析结果生成文档层信息,所述文档层信息表征基于时间维度和来源维度构建的临床指南库,所述临床指南库中包括至少一个临床指南;
基于所述文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并基于所述层级结构和所述模块内容,生成模块层信息,所述模块内容表征临床指南中最小层级下所包含的文本内容;
对所述模块层信息中的模块内容进行知识化处理,获得知识层信息,所述知识层信息表征临床指南的知识图谱信息;
构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库,并对所述关联关系库进行可视化展示,得到跨层多维关联模型。
可选地,所述获取临床指南数据集,包括:
获取与目标类型相匹配的不同来源的临床指南以及同一来源对应的不同版本的临床指南的初始信息;
对所述初始信息进行结构和格式化处理,获得临床指南数据集。
可选地,所述基于所述文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并基于所述层级结构和所述模块内容,生成模块层信息,包括:
基于所述文档层信息,构建同一来源不同版本的临床指南框架;
根据所述临床指南框架,建立模块内容的关联映射规则,存储模块内容和模块各层级结构;
以模块为单位对各个来源的临床指南的模块内容进行整合,并基于整合后的模块内容和各级模块标题信息进行模块内容映射,获得模块层信息。
可选地,所述对所述模块层信息中的模块内容进行知识化处理,获得知识层信息,包括:
对所述模块层信息中的模块内容进行预处理,获得预处理后的模块内容;
对各个所述预处理后的模块内容进行信息抽取,获得与临床指南对应的知识实体、关系和属性值;
将所述临床指南对应的知识实体、关系和属性值进行知识图谱表示,获得知识图谱信息。
可选地,所述构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库,并对所述关联关系库进行可视化展示,得到跨层多维关联模型,包括:
构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库;
利用思维导图模式生成所述关联关系库中的信息的逐层展示信息;
基于所述逐层展示信息,生成跨层多维关联模型,以使得通过所述跨层多维关联模型获得临床指南的层级展示信息、上下文信息、不同版本整合信息和更新信息。
一种临床指南知识建模系统,包括:
获取单元,用于获取临床指南数据集,所述临床指南数据集中包括不同来源的临床指南,以及同一来源对应的不同版本的临床指南;
第一生成单元,用于对所述临床指南数据集进行文本解析,并基于解析结果生成文档层信息,所述文档层信息表征基于时间维度和来源维度构建的临床指南库,所述临床指南库中包括至少一个临床指南;
第二生成单元,用于基于所述文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并基于所述层级结构和所述模块内容,生成模块层信息,所述模块内容表征临床指南中最小层级下所包含的文本内容;
处理单元,用于对所述模块层信息中的模块内容进行知识化处理,获得知识层信息,所述知识层信息表征临床指南的知识图谱信息;
构建单元,用于构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库,并对所述关联关系库进行可视化展示,得到跨层多维关联模型。
可选地,所述获取单元包括:
获取子单元,用于获取与目标类型相匹配的不同来源的临床指南以及同一来源对应的不同版本的临床指南的初始信息;
处理子单元,用于对所述初始信息进行结构和格式化处理,获得临床指南数据集。
可选地,所述第一生成单元包括:
第一构建子单元,用于基于所述文档层信息,构建同一来源不同版本的临床指南框架;
建立子单元,用于根据所述临床指南框架,建立模块内容的关联映射规则,存储模块内容和模块各层级结构;
映射子单元,用于以模块为单位对各个来源的临床指南的模块内容进行整合,并基于整合后的模块内容和各级模块标题信息进行模块内容映射,获得模块层信息。
可选地,所述处理单元包括:
预处理子单元,用于对所述模块层信息中的模块内容进行预处理,获得预处理后的模块内容;
抽取子单元,用于对各个所述预处理后的模块内容进行信息抽取,获得与临床指南对应的知识实体、关系和属性值;
表示子单元,用于将所述临床指南对应的知识实体、关系和属性值进行知识图谱表示,获得知识图谱信息。
可选地,所述构建单元包括:
第二构建子单元,用于构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库;
第一生成子单元,用于利用思维导图模式生成所述关联关系库中的信息的逐层展示信息;
第二生成子单元,用于基于所述逐层展示信息,生成跨层多维关联模型,以使得通过所述跨层多维关联模型获得临床指南的层级展示信息、上下文信息、不同版本整合信息和更新信息。
相较于现有技术,本发明提供了一种临床指南知识建模方法及系统,包括:获取临床指南数据集;对临床指南数据集进行文本解析,并生成文档层信息;基于文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并生成模块层信息;对模块层信息中的模块内容进行知识化处理,获得知识层信息,知识层信息表征临床指南的知识图谱信息;构建文档层信息、模块层信息和知识层信息之间的关联关系,生成关联关系库,并对关联关系库进行可视化展示,得到跨层多维关联模型。实现了对不同版本的临床指南进行规范和整合,便于对指南信息的关联关系和内容逐层展示,满足了对临床指南知识的应用需求,提升了临床指南知识建模的实用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种临床指南知识建模方法的流程示意图;
图2为本发明实施例提供的一种目标疾病临床指南多层次知识模型图;
图3为本发明实施例提供的一种肾细胞癌临床指南知识模型构建的示意图;
图4为本发明实施例提供的一种临床指南知识建模系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在本发明实施例中提供了一种临床指南知识建模方法,该方法能够实现对不同来源以及同一来源不同版本的临床指南的系统、规范和高效组织整合与揭示,将临床指南知识由粗入细、从整体到局部进行组织关联和层层展示,支持同一临床指南知识上下文情景回溯,不同来源、不同版本、不同时间指南的整合与比对,有效促进医生进行系统而快速的临床指南知识学习和认知理解,推动指南知识集成和语义化应用。提升了临床指南知识建模的准确性,满足了对临床指南知识的应用需求。
参见图1,为本发明实施例提供的一种临床指南知识建模方法的流程示意图,该方法可以包括以下步骤:
S101、获取临床指南数据集。
其中,临床指南数据集中包括不同来源的临床指南,以及同一来源对应的不同版本的临床指南。具体的,在获取临床指南数据集可以通过以下方式实现:获取与目标类型相匹配的不同来源的临床指南以及同一来源对应的不同版本的临床指南的初始信息;对所述初始信息进行结构和格式化处理,获得临床指南数据集。
其中,目标类型是指确定的疾病类型,即根据疾病类型,确定临床指南的来源和版本,收集包括不同来源的临床指南,每类来源不同时间版本的临床指南。结构和格式化处理是指由于不同版本或者文本格式不同,不便于后续处理,则需要先进行格式化统一等处理。
S102、对临床指南数据集进行文本解析,并基于解析结果生成文档层信息。
其中,所述文档层信息表征基于时间维度和来源维度构建的临床指南库,所述临床指南库中包括至少一个临床指南。即文档层主要实现临床指南的结构化,包括某某疾病特点和某某疾病临床指南特点等信息。重点存储清晰的指南来源、时间、版本等信息及解析后的临床指南容,构建时间维度和来源维度的临床指南库,为提供临床指南全文,便于学习过程中的知识溯源。
S103、基于所述文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并基于所述层级结构和所述模块内容,生成模块层信息。
所述模块内容表征临床指南中最小层级下所包含的文本内容。模块层结合疾病临床指南主题内容特点,解析结构各版本临床指南的层级和结构,抽取主题架构模块,明确临床指南各模块的层级关系。在此基础上,集成多源临床指南框架模块,构建综合临床指南多层知识模型和建立模块库以及模块关系库。
S104、对所述模块层信息中的模块内容进行知识化处理,获得知识层信息。
其中,知识层信息表征临床指南的知识图谱信息。即知识层信息是指以语义关联网为基础的知识层,其构建目的是对综合临床指南各模块内容进行语义维度的知识化处理,将人类可读的临床指南文档变成机器可读,辅助临床医生快速、高效明晰指南知识及知识间的逻辑关系,以及更高层次的临床指南知识查询和知识推荐等。
S105、构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库,并对所述关联关系库进行可视化展示,得到跨层多维关联模型。
在本发明实施例中整合知识层信息、模块层信息和文档层信息不同维度,建立跨层关联关系,包括归属、层级、实体语义关系等。以思维导图的方式将临床指南内容进行逐层展示,形成指南学习和理解的上下文语境,临床指南中的知识可以帮助临床从业人员快速捕捉内容中的关键点和关联,模块形成知识点理解的语境,文档全文作为溯源和理解的基础,从而使得临床从业人员可以从宏观到微观、从整体到局部对临床指南内容进行逐层浏览和学习,同时支持各模块详细内容和知识溯源,便于快速学习特定疾病临床指南模块的内容。需要说明的是,本发明实施例中提供的跨层多维关联模型是可以进行信息可视化展示的模型,即可以进行层级之间的信息展示。
本发明实施例提供了一种临床指南知识建模方法,包括:获取临床指南数据集;对临床指南数据集进行文本解析,并生成文档层信息;基于文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并生成模块层信息;对模块层信息中的模块内容进行知识化处理,获得知识层信息,知识层信息表征临床指南的知识图谱信息;构建文档层信息、模块层信息和知识层信息之间的关联关系,生成关联关系库,并对关联关系库进行可视化展示,得到跨层多维关联模型。实现了对不同版本的临床指南进行规范和整合,便于对指南信息的关联关系和内容逐层展示,满足了对临床指南知识的应用需求,提升了临床指南知识建模的实用性。
参见图2,为本发明实施例提供的一种目标疾病临床指南多层次知识模型图,需要说明的是,在后续描述中为了便于说明目标疾病以某某疾病代替,文档层信息简称为文档层、模块层信息简称为模块层、知识层信息简称为知识层。
文档层主要实现临床指南的结构化,首先,根据疾病类型,确定临床指南的来源和版本,收集包括不同来源的临床指南,每类来源不同时间版本的临床指南。调用Spire.PDF、Spire.Doc、PDFBox和PDFPlumber等工具将非结构化的、PDF格式的临床指南进行文档解析,将其变成结构化文档。为最大限度地保留临床指南内容和保障指南的易读性,去除页眉和页尾等无关信息,将指南中的图表转储为PNG格式,各模块的标题及其正文部分转储为TXT格式。
进行临床指南的分类分级组织和结构化存储,重点存储清晰的指南来源、时间、版本等信息及解析后的临床指南内容。构建时间维度和来源维度的临床指南库,提供临床指南全文,便于学习过程中的知识溯源。
在本发明实施例的一种可能的实施方式中,所述基于所述文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并基于所述层级结构和所述模块内容,生成模块层信息,包括:基于所述文档层信息,构建同一来源不同版本的临床指南框架;根据所述临床指南框架,建立模块内容的关联映射规则,存储模块内容和模块各层级结构;以模块为单位对各个来源的临床指南的模块内容进行整合,并基于整合后的模块内容和各级模块标题信息进行模块内容映射,获得模块层信息。
具体的,模块层结合疾病临床指南主题内容特点,解析结构各版本临床指南的层级和结构,抽取主题框架模块,明确临床指南各模块的层级关系。在此基础上,集成多源临床指南框架模块,构建综合临床指南多层次知识模型和建立指南模块库以及模块关系库。
在一种实施方式中,首先构建同一来源不同版本临床指南的框架模块。一般来说,同一来源不同版本的临床指南,其行文结构差别不大,不会随着更新发生巨大变化。设计实现这类临床指南框架的提取和解析规则,建立模块内容间的关联映射规则,存储模块和模块各层级关系。然后,综合不同来源临床指南框架模块内容特点,结合临床专家意见,制定该疾病综合临床指南多层次知识模型和各级模块标题、模块内容间的映射规则,以模块为单位进行各来源临床指南各模块的知识特征差异辨别及知识整合,自动构建该疾病的综合临床指南并以思维导图的形式呈现综合临床指南的内容。保证综合临床指南的易理解性以及指南内容的可获取性,设定模块层级不超过6级。
基于临床指南各模块标题进行临床指南模块自动映射,如存在多映射情况,则选择正向匹配单词数最多的标题作为映射对象。同时暂存未匹配到映射对象的单元,等待已映射单元完成更新标注和人工校对后,再对无映射单元进行后续补充标注和整合。
在本发明的一种实施方式中,所述对所述模块层信息中的模块内容进行知识化处理,获得知识层信息,包括:对所述模块层信息中的模块内容进行预处理,获得预处理后的模块内容;对各个所述预处理后的模块内容进行信息抽取,获得与临床指南对应的知识实体、关系和属性值;将所述临床指南对应的知识实体、关系和属性值进行知识图谱表示,获得知识图谱信息。
具体的,以语义关联网为基础的知识层,其构建目的是对综合临床指南各模块内容进行语义维度的知识化处理,将人类可读的临床指南文档变成机器可读,辅助临床医生快速、高效明晰指南知识及知识间的逻辑关系,以及更高层次的临床指南知识查询和知识推荐等。
根据临床指南多层次知识模型的构建目的,以及该疾病的特点和临床指南描述的主要内容,在了解指南核心概念、主要知识类别基础上,定义重要实体、属性和语义关系类别,复用已有医学词表资源如UMLS、SNOMED CT、NCI叙词表、MeSH等,采用基于规则或深度学习的方法,对定义的实体(包括医学实体、等级特征、时间特征和数量特征则需基于各特征在指南中的表达形式进行识别和抽取)、关系和属性进行知识抽取。构建缩略语-全称映射词典解决缩略语表达问题。最终构建临床指南模块知识语义关联网,从语义维度揭示出指南中的核心知识点以及知识点之间的关联,实现不同来源、版本见临床指南知识的关联和比较。
具体的,整合知识层—模块层—文档层不同维度,建立跨层关联关系,包括归属、层级、实体语义关系等。以思维导图的方式将临床指南内容进行逐层展示,形成指南学习和理解的上下文语境,临床指南中的知识可以帮助临床从业人员快速捕捉内容中的关键点和关联,模块形成知识点理解的语境,文档全文作为溯源和理解的基础,从而使得临床从业人员可以从宏观到微观、从整体到局部对临床指南内容进行逐层浏览和学习,同时支持各模块详细内容和知识溯源,便于快速学习特定疾病临床指南模块的内容。
本发明是实施例提供的一种临床指南知识建模方法,是根据医生及临床从业人员的认知习惯和思维方式,通过机器学习和处理的从整体到局部、从宏观到微观的临床指南多层次知识建模与图谱化表示方法。实现了从时间、层级和语义三个维度,文档、模块和知识点三个粒度,对不同来源以及同一来源不同版本的临床指南的系统、规范和高效的组织整合。通过语境-知识结合进行临床指南知识组织和表示。既能最大限度地保持原有临床指南的内容和体系结构,增强重点理解、加强碎片知识语义扩展和知识回溯。将临床指南知识进行可视化展示。面向层级关系的思维导图、面向语义关系的图谱等,对临床指南知识进行充分、直观的揭示与整合,符合医生及临床从业人员认知习惯和思维方式的,便于临床医生及相关人员快速学习和掌握临床指南知识。
下面以肾细胞癌临床指南知识模型构建为例对本发明提供的临床指南知识建模方法进行说明,其中,参见图3,为本发明实施例提供的一种肾细胞癌临床指南知识模型构建的示意图。为了便于描述将分别以文档层、模块层和知识层进行说明。
文档层:
选择临床指南知识资源:选择较为通用且具有权威性的肾细胞癌临床指南,NCCN肾癌临床指南和EAU肾细胞癌临床指南作为数据源,共14本。NCCN肾癌临床指南,平均一年发布四版,最新版为2020.V2;EAU肾细胞癌临床指南,一年发布一版,最新版为2018。
PDF文档解析:NCCN肾癌临床指南解析出的内容可分为三部分,第一部分是以图为主要形式的要点总结部分,去除页头和页尾等无关信息后转储为PNG格式;第二部分是更新说明部分,虽然这部分以文字为主要内容,但由于存在较多特殊格式,为保障阅读效果,故转储为DOCX格式;第三部分是以文字为主要内容的肾细胞癌临床知识部分,转储为TXT格式。EAU肾细胞癌临床指南解析出的内容也可分为三部分,第一部分是以表格为主要内容的更新说明部分,转储为CSV格式;第二部分是肾细胞癌临床知识,主要内容为文字,中间穿插表格和图片,其中文字部分转储为TXT格式,表格和图片内容分别抽取后存储为CSV格式和PNG格式文件;第三部分为肾细胞癌临床知识中各章节要点总结部分,以表格为主要内容,转储为CSV格式。针对肾细胞癌临床指南文档中的文字、图片内容,选择调用Java开源工具Spire.PDF、Spire.Doc和PDFBox,对于指南文档中的表格,选择调用Python开源库PDFPlumber。
构建基于时间维度的临床指南文本库。建立文本库建设规范,重点存储清晰的指南来源、时间、版本等信息及解析后的临床指南内容。
模块层:
NCCN肾癌临床指南模块解构和模块库构建。将指南PDF文档、经人工审核确定解析正确的指南模块、模块内容来源存储于数据库中。其中NCCN肾癌临床指南模块190个,模块内容来源指南名称、指南版本、模块详细层级路径、模块名称。
NCCN肾癌临床指南中涵盖的肾细胞癌临床知识可梳理为三层,第一层涵盖6个模块。具体包括:
(1)概述(Overview):涵盖肾细胞癌流行病学、风险因素、预后决定因素以及转移部位说明等内容。
(2)初始评估(Initial Evaluation):说明肾细胞癌的基本症状以及诊断所需基本操作和方法。
(3)分期(Staging):包括肾细胞癌的TNM分期系统、AJCC预后分组系统和组织学分级系统。
(4)局限性肾细胞癌的治疗(Treatment of Localized RCC):包括局限性肾细胞癌的治疗和局限性肾细胞癌治疗后的随访两部分,局限性肾细胞癌的治疗部分又可细分为治疗方法概述、一期(T1a)肾细胞癌治疗、一期(T1b)肾细胞癌治疗和二、三期肾细胞癌治疗,局限性治疗后的随访部分又可分为随访介绍、一期(T1a)肾细胞癌主动监测期间的随访、一期(T1b)肾细胞癌消融术治疗后的随访和一至三期肾细胞癌肾切除术后的随访。
(5)复发或四期肾细胞癌的治疗(Management of Relapsed or Stage IV RCC):包括四期肾细胞癌的初始治疗,预后模型,复发或四期肾细胞癌的系统。
治疗,复发、四期和手术不可切除性肾细胞癌的随访四部分,其中复发或四期肾细胞癌的系统治疗又可细分为药物治疗概述、透明细胞性肾细胞癌的一线治疗、透明细胞性肾细胞癌的后续治疗和非透明细胞性肾细胞癌的系统治疗。
(6)支持治疗(Supportive Care):介绍转移后的肾细胞癌治疗方法。
然后,进行EAU肾癌临床指南模块解构和模块库构建。EAU肾细胞癌临床指南模块96个。模块内容来源指南名称、指南版本、模块详细层级路径、模块名称。EAU肾细胞癌临床指南中涵盖的肾细胞癌临床知识可梳理为四层,第一层涵盖6个模块,对应的,第一层模块内容如下:
(1)流行病学、病因学和病理学(Epidemiology,Aetiology and Pathology):说明肾细胞癌的流行病学、风险因素、组织学分类,并简要介绍除肾细胞癌以外的肾肿瘤类型。
(2)分期和分类系统(Staging and Classification Systems):包含肾细胞癌的TNM分期系统和解剖学分类系统说明。
(3)诊断评估(Diagnostic Evaluation):从症状、影像检查和肾肿瘤活检3个方面介绍肾细胞癌的诊断方法。
(4)治疗(Treatment):分别围绕肾细胞癌的4个发展时期展开治疗方法阐述,包括局限性肾细胞癌,局部进展期肾细胞癌,进展、转移性肾细胞癌,复发性肾细胞癌。
(5)预后(Prognosis):分类概述肾细胞癌的预后影响因素,包括解剖学因素、组织学因素、临床因素和分子因素,并简要介绍一些预后系统。
再进行同一数据源不同版本临床指南之间各模块进行更新内容识别、标注和整合。
基于肾细胞癌临床指南更新说明内容的书写规律,如部分指南用带“remove”的句式阐述旧版指南中删除的内容,用带“modified”的句式阐述新版指南中修改的内容,或用单独的表格将新版指南中新增的内容单独列举出来等。通过制定指南更新说明解读规则和更新内容标注模式,实现指南中变化内容的自动定位与识别。对于无法通过指南更新说明识别、定位的指南更新内容,以及跨指南版本的指南内容比较,从指南模块、句子等粒度逐级进行映射与相似度计算,实现不同版本指南之间的更新内容发现。利用指南模块内容中所含各级标题,实现两版本指南间的模块粒度映射。对于匹配上的指南模块,结合文本相似度计算和正序限定遍历方法,对各模块内的句子进行匹配,标识出其中新增、修改或删除的内容。对于两版本指南中未能映射上的模块,则需基于模块内容匹配进行人工审核的补充标注。
构建肾细胞癌综合临床指南多层次知识模式。结合临床专家意见,确定肾细胞癌综合临床指南体系框架,第一层模块内容如下:
(1)流行病学与病理学(Epidemiology and Pathology):涵盖肾细胞癌疾病的流行病学概述、分期以及不同维度的分类,如组织学分类、解剖学分类等。
(2)检查与诊断(Examination and Diagnosis):包括肾细胞癌的初始评估、临床表现、影像检查和活检。
(3)治疗与用药(Treatment and Medication):围绕不同类型肾细胞癌,从疾病进展、治疗方法等分类角度进行组织。
(4)预后与随访(Prognosis and Follow-up):随访内容主要包括不同肾细胞癌进展阶段的随访内容、频率和持续时间,预后部分涵盖肾细胞癌预后的影响因素以及相关预后系统。
NCCN肾癌临床指南和EAU肾细胞癌临床指南各模块之间的映射规则制定:基于肾细胞癌综合临床指南多层次知识模型,结合专家意见制定NCCN肾癌临床指南和EAU肾细胞癌临床指南各模块之间的映射规则,对指南文本进行抽取、拆分和整合,实现指南文本的结构化处理,实现肾细胞癌临床指南层级维度的结构化梳理。参见表1,为肾细胞癌临床指南与模块层映射关系表,需要说明的是表1中仅示出了部分。
表1肾细胞癌临床指南与模块层映射关系表(部分)
知识层:
针对结构化后获取的指南模块内容,在进行文本清洗、分句分词、基于规则和逆序扫描的缩略语识别等数据预处理的基础上,引入知识模型的知识层架构和肾细胞癌临床指南的语言特点,结合NCIt 词典、UMLS词典和自建的规则库、属性词典,设计指南知识抽取方案,对临床指南各模块内容进行知识化处理。
设定知识层内共包含6类实体,分别为“肾肿瘤”、“临床表现”、“治疗方法”、“治疗药物”、“检查方法”和“疾病(除肾肿瘤)”;12类语义关系:有…检查方法、有…治疗药物、有…治疗方法、有…并发疾病、有…临床表现、是…检查方法、是…治疗药物、是…治疗方法、是…并发疾病、是…相关…、是…下位类、是…属性;以及针对“肾肿瘤”类实体的“预后分组”、“病理分类”和“临床分类”三个属性,并基于深度学习的方法进行信息抽取。将识别、抽取出的指南知识实体、关系和属性值以三元组的形式存储于基于Java的开源图形数据库Neo4j中进行图谱化表示,用于实现肾细胞癌临床指南知识层面的揭示与表达。
在肾细胞癌临床指南图谱化表示过程,可以通过不同的颜色表示不同层级的实体,也可以通过不同颜色表示不同的实体类别。例如,红色的圆代表概念的一级实体类目,蓝色的圆代表概念的二级实体类目,黄色的圆代表NCCN和EAU指南文本中均识别到的实体,黄色的菱形代表仅在NCCN指南中识别到的实体,黄色的正方形代表仅在EAU指南中识别到的实体,紫色的圆代表属性类别,橙色的圆代表属性值,各点间的连线代表实体间的语义关系,用关系名称缩写进行标识,能够辅助用户快速明晰指南中关键内容。从图中可知,此模块内容围绕病理类型为“Distant”、预后分组为“Stage IV”的肾细胞癌展开阐述,其中“Drug”的“Single Drug”类目下包含三种药物,一种源于NCCN肾癌临床指南指南,一种源于EAU肾细胞癌临床指南,另一种为两指南共有;在临床表现部分,“Sign or Symptom”类目下共涵盖三种症状或体征,同为一种源于NCCN指南,一种源于EAU指南,另一种为两指南共有,在“Clinical Test Result”类目下则仅存在一种临床测试结果,为两指南共有。
文档-模块-知识的关联关系构建和图谱展示:
基于文档层存储的时间维度和来源维度信息、同源临床指南和不同源临床指南模块结构和层级关系、综合肾细胞癌临床指南模块结构和层级关系,以及各指南知识碎片化提取的知识之间的关系,构建和整理文档、模块和知识层之间的关联关系,形成关联关系库,并结合可视化技术进行关联展示。
基于前述实施例,本发明实施例还提供了一种临床指南知识建模系统,参见图4,包括:
获取单元10,用于获取临床指南数据集,所述临床指南数据集中包括不同来源的临床指南,以及同一来源对应的不同版本的临床指南;
第一生成单元20,用于对所述临床指南数据集进行文本解析,并基于解析结果生成文档层信息,所述文档层信息表征基于时间维度和来源维度构建的临床指南库,所述临床指南库中包括至少一个临床指南;
第二生成单元30,用于基于所述文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并基于所述层级结构和所述模块内容,生成模块层信息,所述模块内容表征临床指南中最小层级下所包含的文本内容;
处理单元40,用于对所述模块层信息中的模块内容进行知识化处理,获得知识层信息,所述知识层信息表征临床指南的知识图谱信息;
构建单元50,用于构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库,并对所述关联关系库进行可视化展示,得到跨层多维关联模型。
进一步地,所述获取单元包括:
获取子单元,用于获取与目标类型相匹配的不同来源的临床指南以及同一来源对应的不同版本的临床指南的初始信息;
处理子单元,用于对所述初始信息进行结构和格式化处理,获得临床指南数据集。
进一步,所述第一生成单元包括:
第一构建子单元,用于基于所述文档层信息,构建同一来源不同版本的临床指南框架;
建立子单元,用于根据所述临床指南框架,建立模块内容的关联映射规则,存储模块内容和模块各层级结构;
映射子单元,用于以模块为单位对各个来源的临床指南的模块内容进行整合,并基于整合后的模块内容和各级模块标题信息进行模块内容映射,获得模块层信息。
进一步地,所述处理单元包括:
预处理子单元,用于对所述模块层信息中的模块内容进行预处理,获得预处理后的模块内容;
抽取子单元,用于对各个所述预处理后的模块内容进行信息抽取,获得与临床指南对应的知识实体、关系和属性值;
表示子单元,用于将所述临床指南对应的知识实体、关系和属性值进行知识图谱表示,获得知识图谱信息。
可选地,所述构建单元包括:
第二构建子单元,用于构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库;
第一生成子单元,用于利用思维导图模式生成所述关联关系库中的信息的逐层展示信息;
第二生成子单元,用于基于所述逐层展示信息,生成跨层多维关联模型,以使得通过所述跨层多维关联模型获得临床指南的层级展示信息、上下文信息、不同版本整合信息和更新信息。
本发明实施例提供了一种临床指南知识建模系统,包括:获取单元获取临床指南数据集;第一生成单元对临床指南数据集进行文本解析,并生成文档层信息;第二生成单元基于文档层信息,确定每一版本临床指南对层级结构和每一层级对应的模块内容,并生成模块层信息;处理单元对模块层信息中的模块内容进行知识化处理,获得知识层信息,知识层信息表征临床指南的知识图谱信息;构建单元构建文档层信息、模块层信息和知识层信息之间的关联关系,生成关联关系库,并对关联关系库进行可视化展示,得到跨层多维关联模型。实现了对不同版本的临床指南进行规范和整合,便于对指南信息的关联关系和内容逐层展示,满足了对临床指南知识的应用需求,提升了临床知识建模的实用性。
基于前述实施例,本申请的实施例提供一种计算机可读存储介质,计算机可读存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如上任一项的临床指南知识建模方法的步骤。
本发明实施例还提供了一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现的临床指南知识建模方法的步骤。
需要说明的是,上述处理器或CPU可以为特定用途集成电路(ApplicationSpecific Integrated Circuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、数字信号处理装置(Digital Signal Processing Device,DSPD)、可编程逻辑装置(Programmable Logic Device,PLD)、现场可编程门阵列(Field Programmable GateArray,FPGA)、中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器中的至少一种。可以理解地,实现上述处理器功能的电子器件还可以为其它,本申请实施例不作具体限定。
需要说明的是,上述计算机存储介质/存储器可以是只读存储器(ReadOnlyMemory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是包括上述存储器之一或任意组合的各种终端,如移动电话、计算机、平板设备、个人数字助理等。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (4)

1.一种临床指南知识建模方法,其特征在于,包括:
获取临床指南数据集,所述临床指南数据集中包括不同来源的临床指南,以及同一来源对应的不同版本的临床指南,所述获取临床指南数据集,包括:获取与目标类型相匹配的不同来源的临床指南以及同一来源对应的不同版本的临床指南的初始信息;对所述初始信息进行结构和格式化处理,获得临床指南数据集;
对所述临床指南数据集进行文本解析,并基于解析结果生成文档层信息,所述文档层信息表征基于时间维度和来源维度构建的临床指南库,所述临床指南库中包括至少一个临床指南;
基于所述文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并基于所述层级结构和所述模块内容,生成模块层信息,所述模块内容表征临床指南中最小层级下所包含的文本内容,其中,所述基于所述文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并基于所述层级结构和所述模块内容,生成模块层信息,包括:基于所述文档层信息,构建同一来源不同版本的临床指南框架;根据所述临床指南框架,建立模块内容的关联映射规则,存储模块内容和模块各层级结构;以模块为单位对各个来源的临床指南的模块内容进行整合,并基于整合后的模块内容和各级模块标题信息进行模块内容映射,获得模块层信息,所述模块内容表征临床指南中最小层级下所包含的文本内容;
对所述模块层信息中的模块内容进行知识化处理,获得知识层信息,所述知识层信息表征临床指南的知识图谱信息,其中,所述对所述模块层信息中的模块内容进行知识化处理,获得知识层信息,包括:对所述模块层信息中的模块内容进行预处理,获得预处理后的模块内容;对各个所述预处理后的模块内容进行信息抽取,获得与临床指南对应的知识实体、关系和属性值;将所述临床指南对应的知识实体、关系和属性值进行知识图谱表示,获得知识图谱信息;
构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库,并对所述关联关系库进行可视化展示,得到跨层多维关联模型。
2.根据权利要求1所述的方法,其特征在于,所述构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库,并对所述关联关系库进行可视化展示,得到跨层多维关联模型,包括:
构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库;
利用思维导图模式生成所述关联关系库中的信息的逐层展示信息;
基于所述逐层展示信息,生成跨层多维关联模型,以使得通过所述跨层多维关联模型获得临床指南的层级展示信息、上下文信息、不同版本整合信息和更新信息。
3.一种临床指南知识建模系统,其特征在于,包括:
获取单元,用于获取临床指南数据集,所述临床指南数据集中包括不同来源的临床指南,以及同一来源对应的不同版本的临床指南,其中,所述获取单元包括:获取子单元,用于获取与目标类型相匹配的不同来源的临床指南以及同一来源对应的不同版本的临床指南的初始信息;处理子单元,用于对所述初始信息进行结构和格式化处理,获得临床指南数据集;
第一生成单元,用于对所述临床指南数据集进行文本解析,并基于解析结果生成文档层信息,所述文档层信息表征基于时间维度和来源维度构建的临床指南库,所述临床指南库中包括至少一个临床指南;
第二生成单元,用于基于所述文档层信息,确定每一版本临床指南对应的层级结构和每一层级对应的模块内容,并基于所述层级结构和所述模块内容,生成模块层信息,所述模块内容表征临床指南中最小层级下所包含的文本内容,其中,所述第二生成单元包括:第一构建子单元,用于基于所述文档层信息,构建同一来源不同版本的临床指南框架;建立子单元,用于根据所述临床指南框架,建立模块内容的关联映射规则,存储模块内容和模块各层级结构;映射子单元,用于以模块为单位对各个来源的临床指南的模块内容进行整合,并基于整合后的模块内容和各级模块标题信息进行模块内容映射,获得模块层信息;
处理单元,用于对所述模块层信息中的模块内容进行知识化处理,获得知识层信息,所述知识层信息表征临床指南的知识图谱信息,其中,所述处理单元具体包括:预处理子单元,用于对所述模块层信息中的模块内容进行预处理,获得预处理后的模块内容;抽取子单元,用于对各个所述预处理后的模块内容进行信息抽取,获得与临床指南对应的知识实体、关系和属性值;表示子单元,用于将所述临床指南对应的知识实体、关系和属性值进行知识图谱表示,获得知识图谱信息;
构建单元,用于构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库,并对所述关联关系库进行可视化展示,得到跨层多维关联模型。
4.根据权利要求3所述的系统,其特征在于,所述构建单元包括:
第二构建子单元,用于构建所述文档层信息、所述模块层信息和所述知识层信息之间的关联关系,生成关联关系库;
第一生成子单元,用于利用思维导图模式生成所述关联关系库中的信息的逐层展示信息;
第二生成子单元,用于基于所述逐层展示信息,生成跨层多维关联模型,以使得通过所述跨层多维关联模型获得临床指南的层级展示信息、上下文信息、不同版本整合信息和更新信息。
CN202110857537.XA 2021-07-28 2021-07-28 一种临床指南知识建模方法及系统 Active CN113488180B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110857537.XA CN113488180B (zh) 2021-07-28 2021-07-28 一种临床指南知识建模方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110857537.XA CN113488180B (zh) 2021-07-28 2021-07-28 一种临床指南知识建模方法及系统

Publications (2)

Publication Number Publication Date
CN113488180A CN113488180A (zh) 2021-10-08
CN113488180B true CN113488180B (zh) 2023-07-18

Family

ID=77943268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110857537.XA Active CN113488180B (zh) 2021-07-28 2021-07-28 一种临床指南知识建模方法及系统

Country Status (1)

Country Link
CN (1) CN113488180B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114398402A (zh) * 2021-12-31 2022-04-26 北京华彬立成科技有限公司 结构化信息提取和检索方法、装置、电子设备和存储介质
CN114400099A (zh) * 2021-12-31 2022-04-26 北京华彬立成科技有限公司 疾病信息挖掘和检索方法、装置、电子设备和存储介质
CN117151442B (zh) * 2023-10-31 2024-01-23 中国医学科学院医学信息研究所 一种基于思维导图的人口健康领域科学数据管理生成方法

Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004042985A1 (de) * 2003-10-17 2005-05-12 Dvz Systemhaus Gmbh Verfahren zur temporären Zusammenführung verteilter, digitaler, medialer Informationen für Diagnose und Therapie
CN102129527A (zh) * 2011-04-20 2011-07-20 中国医学科学院医学信息研究所 传染病信息知识服务系统
CN104383726A (zh) * 2012-07-30 2015-03-04 博雅干细胞科技有限公司 富血小板血浆的提取方法和提取的富血小板血浆
CA2902105A1 (en) * 2014-08-28 2016-02-28 Radicalogic Technologies, Inc. Dba Rl Solutions System and method for health care data integration
US9384264B1 (en) * 2015-12-07 2016-07-05 Ephesoft Inc. Analytic systems, methods, and computer-readable media for structured, semi-structured, and unstructured documents
CN106845371A (zh) * 2016-12-31 2017-06-13 中国科学技术大学 一种城市路网机动车尾气排放遥感监控系统
WO2017099454A1 (ko) * 2015-12-08 2017-06-15 전자부품연구원 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치
CN107357924A (zh) * 2017-07-25 2017-11-17 为朔医学数据科技(北京)有限公司 一种精准医学知识图谱构建方法和装置
CN108417275A (zh) * 2018-03-13 2018-08-17 中国科学院重庆绿色智能技术研究院 一种临床指南知识的表征模型及方法
CN110222201A (zh) * 2019-06-26 2019-09-10 中国医学科学院医学信息研究所 一种专病知识图谱构建方法及装置
CN209464641U (zh) * 2018-12-06 2019-10-08 武汉维斯第医用科技股份有限公司 用于富血小板血浆的提取分离工具
CN110362690A (zh) * 2019-07-04 2019-10-22 北京爱医生智慧医疗科技有限公司 一种医学知识图谱构建方法及装置
CN110415831A (zh) * 2019-07-18 2019-11-05 天宜(天津)信息科技有限公司 一种医疗大数据云服务分析平台
CN111221983A (zh) * 2020-01-15 2020-06-02 北京百度网讯科技有限公司 时序知识图谱生成方法、装置、设备和介质
CN111370127A (zh) * 2020-01-14 2020-07-03 之江实验室 一种基于知识图谱的跨科室慢性肾病早期诊断决策支持系统
JP2020154992A (ja) * 2019-03-22 2020-09-24 株式会社東芝 支援システム、プログラム、及び記憶媒体
CN112100288A (zh) * 2020-09-15 2020-12-18 北京百度网讯科技有限公司 用于输出信息的方法、装置、设备以及存储介质
CN112270965A (zh) * 2020-11-16 2021-01-26 苏州系统医学研究所 医学文本表型信息的语义结构化处理方法
CN112579755A (zh) * 2020-12-22 2021-03-30 冯启鹏 基于人工智能和云计算的信息应答方法及信息互动平台
CN112908487A (zh) * 2021-04-19 2021-06-04 中国医学科学院医学信息研究所 一种临床指南更新内容的自动识别方法及系统
WO2021139283A1 (zh) * 2020-06-16 2021-07-15 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9665633B2 (en) * 2014-02-19 2017-05-30 Snowflake Computing, Inc. Data management systems and methods
US11232139B2 (en) * 2018-06-29 2022-01-25 Lucid Software, Inc. Custom interactions with visualizations
US20200210872A1 (en) * 2018-12-31 2020-07-02 Steven H Dayan System and method for determining cosmetic outcome evaluation
US20200286596A1 (en) * 2019-03-04 2020-09-10 International Business Machines Corporation Generating and managing clinical studies using a knowledge base
US11113300B2 (en) * 2019-05-29 2021-09-07 Babylon Partners Limited System and method for enabling interoperability between a first knowledge base and a second knowledge base
US11100173B2 (en) * 2019-06-18 2021-08-24 Lucid Software, Inc. Autolayout of visualizations based on graph data

Patent Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004042985A1 (de) * 2003-10-17 2005-05-12 Dvz Systemhaus Gmbh Verfahren zur temporären Zusammenführung verteilter, digitaler, medialer Informationen für Diagnose und Therapie
CN102129527A (zh) * 2011-04-20 2011-07-20 中国医学科学院医学信息研究所 传染病信息知识服务系统
CN104383726A (zh) * 2012-07-30 2015-03-04 博雅干细胞科技有限公司 富血小板血浆的提取方法和提取的富血小板血浆
CA2902105A1 (en) * 2014-08-28 2016-02-28 Radicalogic Technologies, Inc. Dba Rl Solutions System and method for health care data integration
US9384264B1 (en) * 2015-12-07 2016-07-05 Ephesoft Inc. Analytic systems, methods, and computer-readable media for structured, semi-structured, and unstructured documents
WO2017099454A1 (ko) * 2015-12-08 2017-06-15 전자부품연구원 마인드맵 기반 키워드 검색 방법 및 이를 위한 장치
CN106845371A (zh) * 2016-12-31 2017-06-13 中国科学技术大学 一种城市路网机动车尾气排放遥感监控系统
CN107357924A (zh) * 2017-07-25 2017-11-17 为朔医学数据科技(北京)有限公司 一种精准医学知识图谱构建方法和装置
CN108417275A (zh) * 2018-03-13 2018-08-17 中国科学院重庆绿色智能技术研究院 一种临床指南知识的表征模型及方法
CN209464641U (zh) * 2018-12-06 2019-10-08 武汉维斯第医用科技股份有限公司 用于富血小板血浆的提取分离工具
JP2020154992A (ja) * 2019-03-22 2020-09-24 株式会社東芝 支援システム、プログラム、及び記憶媒体
CN110222201A (zh) * 2019-06-26 2019-09-10 中国医学科学院医学信息研究所 一种专病知识图谱构建方法及装置
CN110362690A (zh) * 2019-07-04 2019-10-22 北京爱医生智慧医疗科技有限公司 一种医学知识图谱构建方法及装置
CN110415831A (zh) * 2019-07-18 2019-11-05 天宜(天津)信息科技有限公司 一种医疗大数据云服务分析平台
CN111370127A (zh) * 2020-01-14 2020-07-03 之江实验室 一种基于知识图谱的跨科室慢性肾病早期诊断决策支持系统
CN111221983A (zh) * 2020-01-15 2020-06-02 北京百度网讯科技有限公司 时序知识图谱生成方法、装置、设备和介质
WO2021139283A1 (zh) * 2020-06-16 2021-07-15 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备
CN112100288A (zh) * 2020-09-15 2020-12-18 北京百度网讯科技有限公司 用于输出信息的方法、装置、设备以及存储介质
CN112270965A (zh) * 2020-11-16 2021-01-26 苏州系统医学研究所 医学文本表型信息的语义结构化处理方法
CN112579755A (zh) * 2020-12-22 2021-03-30 冯启鹏 基于人工智能和云计算的信息应答方法及信息互动平台
CN112908487A (zh) * 2021-04-19 2021-06-04 中国医学科学院医学信息研究所 一种临床指南更新内容的自动识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
临床指南结构化研究;崔佳伟等;《中华医学图书情报杂志》;全文 *

Also Published As

Publication number Publication date
CN113488180A (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
CN113488180B (zh) 一种临床指南知识建模方法及系统
US20200381087A1 (en) Systems and methods of clinical trial evaluation
US10878962B2 (en) System and method for extracting oncological information of prognostic significance from natural language
Chang et al. The use of SNOMED CT, 2013-2020: a literature review
CN109192255B (zh) 病历结构化方法
CN106415555B (zh) 用于病理学报告与放射学报告的相关联的系统和方法
CN114026651A (zh) 结构化患者数据记录的自动生成
US8600772B2 (en) Systems and methods for interfacing with healthcare organization coding system
US20200234801A1 (en) Methods and systems for healthcare clinical trials
CN112908487B (zh) 一种临床指南更新内容的自动识别方法及系统
Martinez et al. Cross-hospital portability of information extraction of cancer staging information
US11875884B2 (en) Expression of clinical logic with positive and negative explainability
CN114664463A (zh) 一种全科医生诊疗辅助系统
CN114625829A (zh) 文本信息提取方法、装置、介质及电子设备
US10318092B2 (en) Medical records visualization system for displaying related medical records in clusters with marked interrelationships on a time line
Tannier et al. Development and validation of a natural language processing algorithm to pseudonymize documents in the context of a clinical data warehouse
Hong et al. A computational framework for converting textual clinical diagnostic criteria into the quality data model
Gaizauskas et al. Task-oriented extraction of temporal information: The case of clinical narratives
Champion et al. Tactical clinical text mining for improved patient characterization
Diomaiuta et al. A novel system for the automatic extraction of a patient problem summary
Zexian et al. Using clinical narratives and structured data to identify distant recurrences in breast cancer
CN111724873B (zh) 一种数据处理方法及装置
Elkin et al. A formal representation for messages containing compositional expressions
CN114400099A (zh) 疾病信息挖掘和检索方法、装置、电子设备和存储介质
D'Avolio et al. Facilitating clinical outcomes assessment through the automated identification of quality measures for prostate cancer surgery

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant