CN107818815A - 电子病历的检索方法及系统 - Google Patents
电子病历的检索方法及系统 Download PDFInfo
- Publication number
- CN107818815A CN107818815A CN201711043286.1A CN201711043286A CN107818815A CN 107818815 A CN107818815 A CN 107818815A CN 201711043286 A CN201711043286 A CN 201711043286A CN 107818815 A CN107818815 A CN 107818815A
- Authority
- CN
- China
- Prior art keywords
- health record
- electronic health
- entity key
- condition
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明实施例提供一种电子病历的检索方法及系统,属于电子病历技术领域,解决了现有技术中针对病情发展的检索效率低的问题。所述方法包括:根据预设关键词,parser分析器,抽取规则模板,获取多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息;将所述时间属性作为主索引,建立数据库;获取病历检索条件;根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本,并显示所述电子病历文本的相关信息。本发明实施例适用于检索电子病历文本的过程。
Description
技术领域
本发明涉及电子病历技术领域,具体地涉及一种电子病历的检索方法及系统。
背景技术
根据医院及实验室的科研需求出发,用户常常需要根据实际病情的发展和治疗经过查询病例内容。但是现有的系统,通常是根据关键字搜索与之匹配的病例,但想要进一步挖掘内容之间的联系,即病情的发展,则需要用户多次检索操作,或者需要用户在系统外通过人工的方式组织整理才能得到最终需要的检索结果,检索效率低。
发明内容
本发明实施例的目的是提供一种电子病历的检索方法及系统,解决了现有技术中针对病情发展的检索效率低的问题。
为了实现上述目的,本发明实施例提供一种电子病历的检索方法,包括:
根据预设关键词,parser分析器,抽取规则模板,获取多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息,所述指定电子病历文本为同一患者整体病程的电子病历文本,所述属性信息包括时间属性;
将所述时间属性作为主索引,建立数据库,所述数据库中包括每个时间属性对应的实体关键词及所述实体关键词的属性信息,以及对应的电子病历文本;
获取病历检索条件,所述病历检索条件包括时间信息条件和实体关键词信息条件,所述时间信息包括时间点和时间段,所述实体关键词信息包括实体关键词和属性信息;
根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本,并显示所述电子病历文本的相关信息。
进一步地,所述方法还包括:
对每个指定电子病历文本中的每个电子病历文本进行预处理,获取每个电子病历文本的句子集;
根据子主题分类模型和每个电子病历文本的句子集,得到每个电子病历文本对应的子主题内容块。
进一步地,所述根据预设关键词,parser分析器,抽取规则模板,获取多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息包括:
根据parser分析器以及每个电子病历文本对应的子主题内容块,得到每个电子病历文本对应的子主题内容块中的句子的浅层句法分析结果;
根据预设关键词,所述浅层句法分析结果以及所述抽取规则模板,对每个电子病历文本对应的子主题内容块进行信息抽取,得到每个电子病历文本对应的子主题内容块中的实体关键词及所述实体关键词的属性信息。
进一步地,所述数据库中还包括将所述预设关键词按照预设类型划分得到的实体关键词表,所述实体关键词表包括实体关键词及所述实体关键词的属性信息。
进一步地,所述根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本包括:
当所述实体关键词信息条件的个数大于等于两个时,根据所述实体关键词表,判断所述实体关键词信息条件对应的实体关键词信息是否属于同一个实体关键词表;
当所述实体关键词信息属于同一个实体关键词表时,判断所述实体关键词信息是否均属于实体关键词;
若所述实体关键词信息均属于实体关键词,且所述实体关键词信息条件的检索关系为同时满足时,确定所述实体关键词信息条件的并集;
在所述数据库中查找同时满足所述实体关键词信息条件的并集与所述时间信息条件的电子病历文本。
进一步地,当所述时间信息条件为时间段条件时,所述根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本包括:
获取所述实体关键词信息条件对应的开始时间和结束时间;
分别选取所述实体关键词信息条件对应的开始时间中的最小值,以及结束时间中的最大值,作为目标时间信息条件;
在所述数据库中查找同时满足所述目标时间信息条件和实体关键词信息条件的电子病历文本。
本发明实施例还提供一种电子病历的检索系统,所述系统包括:
关键词获取单元,用于根据预设关键词,parser分析器,抽取规则模板,获取多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息,所述指定电子病历文本为同一患者整体病程的电子病历文本,所述属性信息包括时间属性;
数据库建立单元,用于将所述时间属性作为主索引,建立数据库,所述数据库中包括每个时间属性对应的实体关键词及所述实体关键词的属性信息,以及对应的电子病历文本;
条件获取单元,用于获取病历检索条件,所述病历检索条件包括时间信息条件和实体关键词信息条件,所述时间信息包括时间点和时间段,所述实体关键词信息包括实体关键词和属性信息;
查找单元,用于根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本;
结果显示单元,用于显示所述电子病历文本的相关信息。
进一步地,所述系统还包括:
预处理单元,用于对每个指定电子病历文本中的每个电子病历文本进行预处理,获取每个电子病历文本的句子集;
子主题内容块确定单元,用于根据子主题分类模型和每个电子病历文本的句子集,得到每个电子病历文本对应的子主题内容块。
进一步地,所述关键词获取单元包括:
句法分析模块,用于根据parser分析器以及每个电子病历文本对应的子主题内容块,得到每个电子病历文本对应的子主题内容块中的句子的浅层句法分析结果;
信息抽取模块,用于根据预设关键词,所述浅层句法分析结果以及所述抽取规则模板,对每个电子病历文本对应的子主题内容块进行信息抽取,得到每个电子病历文本对应的子主题内容块中的实体关键词及所述实体关键词的属性信息。
进一步地,所述数据库中还包括将所述预设关键词按照预设类型划分得到的实体关键词表,所述实体关键词表包括实体关键词及所述实体关键词的属性信息。
进一步地,所述查找单元包括:
第一判断模块,用于当所述实体关键词信息条件的个数大于等于两个时,根据所述实体关键词表,判断所述实体关键词信息条件对应的实体关键词信息是否属于同一个实体关键词表;
第二判断模块,用于当所述实体关键词信息属于同一个实体关键词表时,判断所述实体关键词信息是否均属于实体关键词;
并集确定模块,用于若所述实体关键词信息均属于实体关键词,且所述实体关键词信息条件的检索关系为同时满足时,确定所述实体关键词信息条件的并集;
第一查找模块,用于在所述数据库中查找同时满足所述实体关键词信息条件的并集与所述时间信息条件的电子病历文本。
进一步地,当所述时间信息条件为时间段条件时,所述查找单元包括:
获取模块,用于获取所述实体关键词信息条件对应的开始时间和结束时间;
目标时间确定模块,用于分别选取所述实体关键词信息条件对应的开始时间中的最小值,以及结束时间中的最大值,作为目标时间信息条件;
第二查找模块,用于在所述数据库中查找同时满足所述目标时间信息条件和实体关键词信息条件的电子病历文本。
通过上述技术方案,根据预设关键词,parser分析器,抽取规则模板,获取多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息,然后将所述时间属性作为主索引,建立数据库,当获取到病历检索条件时,在所述数据库中查找同时满足所述病历检索条件中的时间信息条件和实体关键词信息条件的电子病历文本,并显示所述电子病历文本的相关信息。本发明实施例解决了现有技术中针对病情发展的检索效率低的问题,实现了在海量数据中查找有用信息的效率大幅提升。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1是本发明实施例提供的一种电子病历的检索方法的流程示意图;
图2是本发明实施例提供的查找策略示意图;
图3是本发明实施例提供的一种电子病历的检索系统的结构示意图;
图4是本发明实施例提供的另一种电子病历的检索系统的结构示意图;
图5是本发明实施例提供的又一种电子病历的检索系统的结构示意图;
图6是本发明实施例提供的再又一种电子病历的检索系统的结构示意图;
图7是本发明实施例提供的另一种电子病历的检索系统的结构示意图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
图1是本发明实施例提供的一种电子病历的检索方法的流程示意图。本发明实施例基于MapReduce计算框架,使用分布式计算集群进行处理,如图1所示,所述方法包括如下步骤:
步骤101、根据预设关键词,parser分析器,抽取规则模板,获取多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息,所述指定电子病历文本为同一患者整体病程的电子病历文本,所述属性信息包括时间属性。
其中,在获取结构化信息的同时根据预设关键词将实体关键词及其属性抽取出来,所述预设关键词可以包括疾病、症状、手术、用药等。
步骤102、将所述时间属性作为主索引,建立数据库,所述数据库中包括每个时间属性对应的实体关键词及所述实体关键词的属性信息,以及对应的电子病历文本。
将步骤101中抽取出的实体关键词对应的时间属性作为主索引,建立数据库,且在所述数据库中,根据时间属性可以调取出对应的电子病历文本。
步骤103、获取病历检索条件,所述病历检索条件包括时间信息条件和实体关键词信息条件,所述时间信息包括时间点和时间段,所述实体关键词信息包括实体关键词和属性信息。
其中,所述时间信息包括时间点,例如某一天出现某一病症的情况,也可以为时间段,例如某一病症持续某一时间段。对于实体关键词信息包括实体关键词,例如检索某一病症,或者某一药品,还可以为实体关键词的属性信息,例如某一病症出现的部位。
步骤104、根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本,并显示所述电子病历文本的相关信息。
根据所述病历检索条件,使用SQL语言,在所述数据库中进行查找,将查找到的电子病历文本的相关信息进行显示,其中,可以显示所述电子病历文本的原文,也可以显示所述电子病历文本的摘要信息,这里不做限定。
通过上述实施例,利用时间信息为检索条件,从而在数据库中查询与所述时间信息相关的病情发展情况,解决了现有技术中针对病情发展的检索效率低的问题,实现了在海量数据中查找有用信息的效率大幅提升。
为了便于理解本发明实施例,下面详细描述每一个步骤的具体实现方式。
在步骤101获取所述多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息之前,还要对所述多个指定电子病历文本进行处理,包括对每个指定电子病历文本中的每个电子病历文本进行预处理,获取每个电子病历文本的句子集;以及根据子主题分类模型和每个电子病历文本的句子集,得到每个电子病历文本对应的子主题内容块。其中,所述对每个指定电子病历文本中的每个电子病历文本进行预处理,获取每个电子病历文本的句子集包括:
1)提取每个指定电子病历文本中的每个电子病历文本中的正文。
2)消除所述正文中存在的噪声信息。
其中,所述噪声信息包括但不限于转义字符、多余的标点以及格式信息。对于转义字符的处理是将转义字符转换为原来的格式,对于多余的标点直接过滤掉,对于格式信息,例如对于json格式的电子病历,原有的表格信息可能变为空白,则直接将空白处转换为切分符。对于其它噪声信息的处理可以参照例如预先设置的规则表进行处理。
3)利用切分符将所述正文进行切分,得到每个电子病历文本的句子集。
其中,在句子切分过程中,除了采用通用的句子切分所需的句号、叹号和问号等一级切分符外,为了解决整篇病历中无这类切分符而导致无法做句子切分的问题,本实施例还增加了二级切分符,如:分号,并遵循一级切分符的优先级大于二级切分符的优先级的原则,根据文本的组织形式自适应的选择句子切分粒度,获得最终的句子集。
首先利用一级切分符将所述正文进行切分,得到待切分句子集,然后利用二级切分符对所述待切分句子集进行二次切分,得到所述正文对应的句子集,其中所述一级切分符的优先级高于所述二级切分符的优先级。
另外,利用两个等级的切分符,可以尽量保证切分后的句子单元的细化度,而又不会损害语义的完整性,如果以逗号或顿号切分,可能会损害句子的语义。
另外,所述根据子主题分类模型和每个电子病历文本的句子集,得到每个电子病历文本对应的子主题内容块。所述子主题分类模型中包括预设学习算法和分类器,在本发明的一种实施方式中,可以通过预设学习算法将句子集中的每个句子的信息转换为特征向量,然后利用分类器和句子集中的每个句子对应的特征向量,得到每个电子病历文本的子主题内容块。例如根据特征提取算法,将所述句子集中的每个句子的信息转换为特征向量,其中,所述信息包括术语、数量词、所属病历类型、子主题关键词和句子位置信息,或者根据深度学习算法,将所述句子集中的每个句子的信息转换为特征向量。本发明实施例中并不限定使用哪一种方式得到每个句子的特征向量。在本发明的一种实施方式中,分类器包括朴素贝叶斯分类器和svm分类器,根据朴素贝叶斯分类器(或svm分类器)、所述预设子主题类型和每个句子对应的特征向量,确定所述句子集中的每个句子的子主题类型。然后对所述句子集中具有相同子主题类型的相邻句子进行平滑处理,得到每个电子病历文本对应的子主题内容块。
对于步骤101,所述根据预设关键词,parser分析器,抽取规则模板,获取多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息主要包括浅层句法分析和信息抽取两部分。
对于第一部分根据parser分析器以及每个电子病历文本对应的子主题内容块,得到每个电子病历文本对应的子主题内容块中的句子的浅层句法分析结果,具体包括分词、关键词标注和句法分析三个步骤:
1)对每个电子病历文本对应的子主题内容块中的句子进行分词;
2)根据预设关键词,对每个电子病历文本对应的子主题内容块中的句子进行关键词标注;
3)根据所述parser分析器,对每个电子病历文本对应的子主题内容块中的句子进行句法分析,方便后续信息抽取的准确性。
对于第二部分,所述根据预设关键词,所述浅层句法分析结果以及所述抽取规则模板,对每个电子病历文本对应的子主题内容块进行信息抽取,得到每个电子病历文本对应的子主题内容块中的实体关键词及所述实体关键词的属性信息,其中的信息抽取主要包括否定判断,属性抽取,关键词补全和关键词归一。具体的处理方式是:
1)判定每个电子病历文本对应的子主题内容块中的否定词的作用范围,也就是判断每个电子病历文本对应的子主题内容块中是否存在否定词,并识别否定词的作用范围。
2)识别每个电子病历文本对应的子主题内容块中的属性信息,即是识别每个电子病历文本对应的子主题内容块中与实体关键词相关的属性信息。
3)根据所述浅层句法分析结果,确定每个电子病历文本对应的子主题内容块中的关键词边界,也就是根据所述浅层句法分析结果,优化分词和关键词标注的结果,确定关键词边界。
4)矫正每个电子病历文本对应的子主题内容块中标注的关键词,即是对同义词归一,将描述意思相同的关键词进行统一表述。
对于步骤102中建立的数据库中还包括将所述预设关键词按照预设类型划分得到的实体关键词表,所述实体关键词表包括实体关键词及所述实体关键词的属性信息。例如,按照疾病类型将所有表示疾病的实体关键词及其属性信息归为一类,按照症状类型将所有表示症状的实体关键词及其属性信息归为一类等等。
对于步骤104,所述根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本。对于病历检索条件之间的关系存在同时满足例如“且”或“与”的关系,还存在“或”的关系,以及由时间信息条件将实体关键词信息条件进行关联的关系。具体的处理方式如下所述:
1)首先,判断实体关键词信息条件的个数是否大于等于两个,当个数小于两个时,即为1个或者0个实体关键词信息条件,则直接将该1个实体关键词信息条件与时间信息条件进行关联,或者直接根据时间信息条件得到满足条件的电子病历文本。
2)当所述实体关键词信息条件的个数大于等于两个时,根据所述实体关键词表,判断所述实体关键词信息条件对应的实体关键词信息是否属于同一个实体关键词表。例如,当所述实体关键词信息条件的个数为两个时,判断这两个条件是否属于同一个实体关键词表,如属于疾病的关键词表。若不属于同一个实体关键词表,则按照给定的条件、条件之间的关系以及与时间信息条件的关联进行查询,得到满足条件的电子病历文本。例如当一个属于疾病的关键词表的肾结石,另一个属于药物的关键词表的排石颗粒,二者的关系为“与”,时间信息条件为“一周”,则将按照上述条件查找符合要求的电子病历文本。
3)当所述实体关键词信息属于同一个实体关键词表时,判断所述实体关键词信息是否均属于实体关键词。即当所述实体关键词信息条件中的实体关键词信息属于同一个实体关键词表时,判断实体关键词信息是否均属于实体关键词,例如,当判断实体关键词信息均属于疾病类型的实体关键词表时,再判断是否均属于疾病名称。另一方面,若判断实体关键词信息不同时属于疾病名称时,例如,一个是疾病名称,一个是疾病名称对应的属性信息时,则将实体关键词信息条件,按照给定的条件之间的关系以及与时间信息条件之间的关联进行查找,得到符合条件的电子病历文本。
4)若所述实体关键词信息均属于实体关键词,且所述实体关键词信息条件的检索关系为同时满足时,确定所述实体关键词信息条件的并集。例如,实体关键词信息均属于疾病名称,且检索关系为同时满足时,例如检索关系为“与”,则确定满足上述多个疾病名称的并集。
5)在所述数据库中查找同时满足所述实体关键词信息条件的并集与所述时间信息条件的电子病历文本。
根据上述实体关键词信息条件的并集与时间信息条件,得到符合要求的电子病历文本。
对于步骤104,当所述时间信息条件为时间段条件时,对于时间段都会有开始时间和结束时间,对于多个实体关键词信息条件得到的多个对应时间段,为了保证检索范围的全面性,避免出现漏查的情况,就要选择最大的时间范围作为最终目标时间信息条件,所述根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本具体包括:
1)获取所述实体关键词信息条件对应的开始时间和结束时间;
2)分别选取所述实体关键词信息条件对应的开始时间中的最小值,以及结束时间中的最大值,作为目标时间信息条件。
为了保证最大的时间范围,则需要获取所有实体关键词信息条件对应的开始时间和结束时间,选择所有开始时间中的最小值作为最终时间范围的开始时间,选择所有结束时间中的最大值作为最终时间范围的结束时间,从而将最终时间范围的开始时间和结束时间作为目标时间信息条件。
3)在所述数据库中查找同时满足所述目标时间信息条件和实体关键词信息条件的电子病历文本。
根据所述目标时间信息条件和实体关键词信息条件,查找满足要求的电子病历文本。
在本发明的一种实施方式中,当出现重复的查询条件时,则进行去重处理,例如“头痛”与“头痛”,则直接查询一个“头痛”就可以了。
为了便于理解本发明实施例,下面举例说明,若想要查找病情发展为有“发热”症状,进行“阿米卡星”抗感染治疗后,“无发热”的电子病历文本,则获取的病历检索条件为:
症状名称=发热,且,是否阳性=是;
时间间隔>1天;
药品名称=阿米卡星;
时间间隔>1天;
症状名称=发热,且,是否阳性=否。
则根据上述病历检索条件,得到的查找策略如图2所示,即构建出了以病情的发展为查询条件,从而得到符合查询要求的电子病历文本。
相应的,图3是本发明实施例提供的一种电子病历的检索系统的结构示意图,如图3所示,所述系统包括:
关键词获取单元31,用于根据预设关键词,parser分析器,抽取规则模板,获取多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息,所述指定电子病历文本为同一患者整体病程的电子病历文本,所述属性信息包括时间属性;
数据库建立单元32,用于将所述时间属性作为主索引,建立数据库,所述数据库中包括每个时间属性对应的实体关键词及所述实体关键词的属性信息,以及对应的电子病历文本;
条件获取单元33,用于获取病历检索条件,所述病历检索条件包括时间信息条件和实体关键词信息条件,所述时间信息包括时间点和时间段,所述实体关键词信息包括实体关键词和属性信息;
查找单元34,用于根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本;
结果显示单元35,用于显示所述电子病历文本的相关信息。
通过上述技术方案,根据预设关键词,parser分析器,抽取规则模板,获取多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息,然后将所述时间属性作为主索引,建立数据库,当获取到病历检索条件时,在所述数据库中查找同时满足所述病历检索条件中的时间信息条件和实体关键词信息条件的电子病历文本,并显示所述电子病历文本的相关信息。本发明实施例解决了现有技术中针对病情发展的检索效率低的问题,实现了在海量数据中查找有用信息的效率大幅提升。
进一步地,如图4所示,所述系统还包括:
预处理单元36,用于对每个指定电子病历文本中的每个电子病历文本进行预处理,获取每个电子病历文本的句子集;
子主题内容块确定单元37,用于根据子主题分类模型和每个电子病历文本的句子集,得到每个电子病历文本对应的子主题内容块。
进一步地,如图5所示,所述关键词获取单元31包括:
句法分析模块311,用于根据parser分析器以及每个电子病历文本对应的子主题内容块,得到每个电子病历文本对应的子主题内容块中的句子的浅层句法分析结果;
信息抽取模块312,用于根据预设关键词,所述浅层句法分析结果以及所述抽取规则模板,对每个电子病历文本对应的子主题内容块进行信息抽取,得到每个电子病历文本对应的子主题内容块中的实体关键词及所述实体关键词的属性信息。
进一步地,所述数据库中还包括将所述预设关键词按照预设类型划分得到的实体关键词表,所述实体关键词表包括实体关键词及所述实体关键词的属性信息。
进一步地,如图6所示,所述查找单元34包括:
第一判断模块341,用于当所述实体关键词信息条件的个数大于等于两个时,根据所述实体关键词表,判断所述实体关键词信息条件对应的实体关键词信息是否属于同一个实体关键词表;
第二判断模块342,用于当所述实体关键词信息属于同一个实体关键词表时,判断所述实体关键词信息是否均属于实体关键词;
并集确定模块343,用于若所述实体关键词信息均属于实体关键词,且所述实体关键词信息条件的检索关系为同时满足时,确定所述实体关键词信息条件的并集;
第一查找模块344,用于在所述数据库中查找同时满足所述实体关键词信息条件的并集与所述时间信息条件的电子病历文本。
进一步地,,当所述时间信息条件为时间段条件时,如图7所示,所述查找单元34包括:
获取模块345,用于获取所述实体关键词信息条件对应的开始时间和结束时间;
目标时间确定模块346,用于分别选取所述实体关键词信息条件对应的开始时间中的最小值,以及结束时间中的最大值,作为目标时间信息条件;
第二查找模块347,用于在所述数据库中查找同时满足所述目标时间信息条件和实体关键词信息条件的电子病历文本。
本发明实施例中的电子病历的检索系统中的各个单元,用以执行与上文实施例所描述的电子病历的检索方法相应的步骤,以获得与上述电子病历的检索方法相同或相似的技术效果,故关于本实施例中的电子病历的检索系统更多的细节可以参照上文实施例的电子病历的检索方法的描述,相同内容在此不加以赘述。
在本发明的一种实施方式中,所述电子病历的检索系统应用于分布式计算集群,该集群至少包括3台服务器,扩展方便,适用于海量数据场景。
以上结合附图详细描述了本发明实施例的可选实施方式,但是,本发明实施例并不限于上述实施方式中的具体细节,在本发明实施例的技术构思范围内,可以对本发明实施例的技术方案进行多种简单变型,这些简单变型均属于本发明实施例的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施例对各种可能的组合方式不再另行说明。
本领域技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得单片机、芯片或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
此外,本发明实施例的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施例的思想,其同样应当视为本发明实施例所公开的内容。
Claims (12)
1.一种电子病历的检索方法,其特征在于,包括:
根据预设关键词,parser分析器,抽取规则模板,获取多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息,所述指定电子病历文本为同一患者整体病程的电子病历文本,所述属性信息包括时间属性;
将所述时间属性作为主索引,建立数据库,所述数据库中包括每个时间属性对应的实体关键词及所述实体关键词的属性信息,以及对应的电子病历文本;
获取病历检索条件,所述病历检索条件包括时间信息条件和实体关键词信息条件,所述时间信息包括时间点和时间段,所述实体关键词信息包括实体关键词和属性信息;
根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本,并显示所述电子病历文本的相关信息。
2.根据权利要求1所述的电子病历的检索方法,其特征在于,所述方法还包括:
对每个指定电子病历文本中的每个电子病历文本进行预处理,获取每个电子病历文本的句子集;
根据子主题分类模型和每个电子病历文本的句子集,得到每个电子病历文本对应的子主题内容块。
3.根据权利要求2所述的电子病历的检索方法,其特征在于,所述根据预设关键词,parser分析器,抽取规则模板,获取多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息包括:
根据parser分析器以及每个电子病历文本对应的子主题内容块,得到每个电子病历文本对应的子主题内容块中的句子的浅层句法分析结果;
根据预设关键词,所述浅层句法分析结果以及所述抽取规则模板,对每个电子病历文本对应的子主题内容块进行信息抽取,得到每个电子病历文本对应的子主题内容块中的实体关键词及所述实体关键词的属性信息。
4.根据权利要求1所述的电子病历的检索方法,其特征在于,所述数据库中还包括将所述预设关键词按照预设类型划分得到的实体关键词表,所述实体关键词表包括实体关键词及所述实体关键词的属性信息。
5.根据权利要求4所述的电子病历的检索方法,其特征在于,所述根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本包括:
当所述实体关键词信息条件的个数大于等于两个时,根据所述实体关键词表,判断所述实体关键词信息条件对应的实体关键词信息是否属于同一个实体关键词表;
当所述实体关键词信息属于同一个实体关键词表时,判断所述实体关键词信息是否均属于实体关键词;
若所述实体关键词信息均属于实体关键词,且所述实体关键词信息条件的检索关系为同时满足时,确定所述实体关键词信息条件的并集;
在所述数据库中查找同时满足所述实体关键词信息条件的并集与所述时间信息条件的电子病历文本。
6.根据权利要求1所述的电子病历的检索方法,其特征在于,当所述时间信息条件为时间段条件时,所述根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本包括:
获取所述实体关键词信息条件对应的开始时间和结束时间;
分别选取所述实体关键词信息条件对应的开始时间中的最小值,以及结束时间中的最大值,作为目标时间信息条件;
在所述数据库中查找同时满足所述目标时间信息条件和实体关键词信息条件的电子病历文本。
7.一种电子病历的检索系统,其特征在于,所述系统包括:
关键词获取单元,用于根据预设关键词,parser分析器,抽取规则模板,获取多个指定电子病历文本中每个电子病历文本的实体关键词及所述实体关键词的属性信息,所述指定电子病历文本为同一患者整体病程的电子病历文本,所述属性信息包括时间属性;
数据库建立单元,用于将所述时间属性作为主索引,建立数据库,所述数据库中包括每个时间属性对应的实体关键词及所述实体关键词的属性信息,以及对应的电子病历文本;
条件获取单元,用于获取病历检索条件,所述病历检索条件包括时间信息条件和实体关键词信息条件,所述时间信息包括时间点和时间段,所述实体关键词信息包括实体关键词和属性信息;
查找单元,用于根据所述病历检索条件,在所述数据库中查找同时满足所述时间信息条件和实体关键词信息条件的电子病历文本;
结果显示单元,用于显示所述电子病历文本的相关信息。
8.根据权利要求7所述的电子病历的检索系统,其特征在于,所述系统还包括:
预处理单元,用于对每个指定电子病历文本中的每个电子病历文本进行预处理,获取每个电子病历文本的句子集;
子主题内容块确定单元,用于根据子主题分类模型和每个电子病历文本的句子集,得到每个电子病历文本对应的子主题内容块。
9.根据权利要求8所述的电子病历的检索系统,其特征在于,所述关键词获取单元包括:
句法分析模块,用于根据parser分析器以及每个电子病历文本对应的子主题内容块,得到每个电子病历文本对应的子主题内容块中的句子的浅层句法分析结果;
信息抽取模块,用于根据预设关键词,所述浅层句法分析结果以及所述抽取规则模板,对每个电子病历文本对应的子主题内容块进行信息抽取,得到每个电子病历文本对应的子主题内容块中的实体关键词及所述实体关键词的属性信息。
10.根据权利要求7所述的电子病历的检索系统,其特征在于,所述数据库中还包括将所述预设关键词按照预设类型划分得到的实体关键词表,所述实体关键词表包括实体关键词及所述实体关键词的属性信息。
11.根据权利要求10所述的电子病历的检索系统,其特征在于,所述查找单元包括:
第一判断模块,用于当所述实体关键词信息条件的个数大于等于两个时,根据所述实体关键词表,判断所述实体关键词信息条件对应的实体关键词信息是否属于同一个实体关键词表;
第二判断模块,用于当所述实体关键词信息属于同一个实体关键词表时,判断所述实体关键词信息是否均属于实体关键词;
并集确定模块,用于若所述实体关键词信息均属于实体关键词,且所述实体关键词信息条件的检索关系为同时满足时,确定所述实体关键词信息条件的并集;
第一查找模块,用于在所述数据库中查找同时满足所述实体关键词信息条件的并集与所述时间信息条件的电子病历文本。
12.根据权利要求7所述的电子病历的检索系统,其特征在于,当所述时间信息条件为时间段条件时,所述查找单元包括:
获取模块,用于获取所述实体关键词信息条件对应的开始时间和结束时间;
目标时间确定模块,用于分别选取所述实体关键词信息条件对应的开始时间中的最小值,以及结束时间中的最大值,作为目标时间信息条件;
第二查找模块,用于在所述数据库中查找同时满足所述目标时间信息条件和实体关键词信息条件的电子病历文本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711043286.1A CN107818815B (zh) | 2017-10-30 | 2017-10-30 | 电子病历的检索方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711043286.1A CN107818815B (zh) | 2017-10-30 | 2017-10-30 | 电子病历的检索方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107818815A true CN107818815A (zh) | 2018-03-20 |
CN107818815B CN107818815B (zh) | 2022-05-20 |
Family
ID=61603512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711043286.1A Active CN107818815B (zh) | 2017-10-30 | 2017-10-30 | 电子病历的检索方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107818815B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109599186A (zh) * | 2018-11-21 | 2019-04-09 | 金色熊猫有限公司 | 数据处理方法、装置及介质 |
CN109684356A (zh) * | 2018-11-28 | 2019-04-26 | 心医国际数字医疗系统(大连)有限公司 | 基于否定检出的病历检索方法及系统 |
CN109800285A (zh) * | 2019-01-17 | 2019-05-24 | 无锡慧方科技有限公司 | 一种灵活的病历数据抽取方法、系统及数据库服务器 |
CN110674285A (zh) * | 2019-09-18 | 2020-01-10 | 国网安徽省电力有限公司芜湖供电公司 | 一种电力调度台账智能检索系统及方法 |
CN110968677A (zh) * | 2019-12-20 | 2020-04-07 | 南京医睿科技有限公司 | 文本寻址的方法及装置、介质和电子设备 |
CN111143422A (zh) * | 2019-12-31 | 2020-05-12 | 医渡云(北京)技术有限公司 | 数据检索方法、数据检索装置、存储介质及电子设备 |
CN111785386A (zh) * | 2020-06-30 | 2020-10-16 | 安徽科大讯飞医疗信息技术有限公司 | 时间区间段的划分方法、相关设备及可读存储介质 |
CN112287094A (zh) * | 2020-12-30 | 2021-01-29 | 北京伯仲叔季科技有限公司 | 相似病例文本检索系统 |
CN113192584A (zh) * | 2021-03-30 | 2021-07-30 | 深圳市圣格灵科技有限公司 | 一种远程病案查阅系统 |
CN113643778A (zh) * | 2021-10-14 | 2021-11-12 | 山东大学齐鲁医院 | 基于电子病历资料的院内心脏骤停筛选方法及系统 |
CN115376643A (zh) * | 2022-10-26 | 2022-11-22 | 神州医疗科技股份有限公司 | 病例自定义检索方法、装置、电子设备和计算机可读介质 |
CN116719926A (zh) * | 2023-08-10 | 2023-09-08 | 四川大学 | 基于智慧医疗的先天性心脏病报告数据筛选方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101034410A (zh) * | 2007-04-16 | 2007-09-12 | 浙江大学 | 一种医疗事件索引模型及基于该模型的电子病历系统 |
CN101441686A (zh) * | 2008-11-26 | 2009-05-27 | 复旦大学附属中山医院 | 基于自然语言编写的医疗文档的信息抽提及格式转换系统 |
CN103605760A (zh) * | 2013-11-25 | 2014-02-26 | 方正国际软件有限公司 | 病历查询方法和病历查询系统 |
CN106909783A (zh) * | 2017-02-24 | 2017-06-30 | 北京交通大学 | 一种基于时间线的病历文本医学知识发现方法 |
-
2017
- 2017-10-30 CN CN201711043286.1A patent/CN107818815B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101034410A (zh) * | 2007-04-16 | 2007-09-12 | 浙江大学 | 一种医疗事件索引模型及基于该模型的电子病历系统 |
CN101441686A (zh) * | 2008-11-26 | 2009-05-27 | 复旦大学附属中山医院 | 基于自然语言编写的医疗文档的信息抽提及格式转换系统 |
CN103605760A (zh) * | 2013-11-25 | 2014-02-26 | 方正国际软件有限公司 | 病历查询方法和病历查询系统 |
CN106909783A (zh) * | 2017-02-24 | 2017-06-30 | 北京交通大学 | 一种基于时间线的病历文本医学知识发现方法 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109599186A (zh) * | 2018-11-21 | 2019-04-09 | 金色熊猫有限公司 | 数据处理方法、装置及介质 |
CN109684356A (zh) * | 2018-11-28 | 2019-04-26 | 心医国际数字医疗系统(大连)有限公司 | 基于否定检出的病历检索方法及系统 |
CN109800285A (zh) * | 2019-01-17 | 2019-05-24 | 无锡慧方科技有限公司 | 一种灵活的病历数据抽取方法、系统及数据库服务器 |
CN110674285A (zh) * | 2019-09-18 | 2020-01-10 | 国网安徽省电力有限公司芜湖供电公司 | 一种电力调度台账智能检索系统及方法 |
CN110968677B (zh) * | 2019-12-20 | 2023-03-14 | 医渡云(北京)技术有限公司 | 文本寻址的方法及装置、介质和电子设备 |
CN110968677A (zh) * | 2019-12-20 | 2020-04-07 | 南京医睿科技有限公司 | 文本寻址的方法及装置、介质和电子设备 |
CN111143422B (zh) * | 2019-12-31 | 2023-04-25 | 医渡云(北京)技术有限公司 | 数据检索方法、数据检索装置、存储介质及电子设备 |
CN111143422A (zh) * | 2019-12-31 | 2020-05-12 | 医渡云(北京)技术有限公司 | 数据检索方法、数据检索装置、存储介质及电子设备 |
CN111785386A (zh) * | 2020-06-30 | 2020-10-16 | 安徽科大讯飞医疗信息技术有限公司 | 时间区间段的划分方法、相关设备及可读存储介质 |
CN111785386B (zh) * | 2020-06-30 | 2024-04-05 | 讯飞医疗科技股份有限公司 | 时间区间段的划分方法、相关设备及可读存储介质 |
CN112287094A (zh) * | 2020-12-30 | 2021-01-29 | 北京伯仲叔季科技有限公司 | 相似病例文本检索系统 |
CN113192584A (zh) * | 2021-03-30 | 2021-07-30 | 深圳市圣格灵科技有限公司 | 一种远程病案查阅系统 |
CN113643778A (zh) * | 2021-10-14 | 2021-11-12 | 山东大学齐鲁医院 | 基于电子病历资料的院内心脏骤停筛选方法及系统 |
CN115376643A (zh) * | 2022-10-26 | 2022-11-22 | 神州医疗科技股份有限公司 | 病例自定义检索方法、装置、电子设备和计算机可读介质 |
CN116719926A (zh) * | 2023-08-10 | 2023-09-08 | 四川大学 | 基于智慧医疗的先天性心脏病报告数据筛选方法及系统 |
CN116719926B (zh) * | 2023-08-10 | 2023-10-20 | 四川大学 | 基于智慧医疗的先天性心脏病报告数据筛选方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107818815B (zh) | 2022-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107818815A (zh) | 电子病历的检索方法及系统 | |
CN109472033B (zh) | 文本中的实体关系抽取方法及系统、存储介质、电子设备 | |
CN107562732A (zh) | 电子病历的处理方法及系统 | |
CN109920540A (zh) | 辅助诊疗决策系统的构建方法、装置及计算机设备 | |
CN113707300B (zh) | 基于人工智能的搜索意图识别方法、装置、设备及介质 | |
CN106649742A (zh) | 数据库维护方法和装置 | |
WO2022222943A1 (zh) | 科室推荐方法、装置、电子设备及存储介质 | |
CN107545023B (zh) | 文本型指标的提取方法和装置 | |
CN106886567A (zh) | 基于语义扩展的微博突发事件检测方法及装置 | |
CN114528413B (zh) | 众包标注支持的知识图谱更新方法、系统和可读存储介质 | |
CN107480435A (zh) | 一种应用于临床数据的自动搜索机器学习系统及方法 | |
CN110752027B (zh) | 电子病历数据推送方法、装置、计算机设备和存储介质 | |
CN116343980A (zh) | 一种基于智慧医疗复诊随访数据处理方法及系统 | |
CN111104481A (zh) | 一种识别匹配字段的方法、装置及设备 | |
CN117420998A (zh) | 一种客户端ui交互组件生成方法、装置、终端及介质 | |
CN112434126B (zh) | 一种信息处理方法、装置、设备和存储介质 | |
EP4167122A1 (en) | Extracting key value pairs using positional coordinates | |
CN111538813B (zh) | 一种分类检测方法、装置、设备及存储介质 | |
CN108733733B (zh) | 基于机器学习的生物医学文本分类方法、系统和存储介质 | |
CN115757720A (zh) | 基于知识图谱的项目信息搜索方法、装置、设备和介质 | |
CN107391638A (zh) | 规则关联模型的新概念发现方法及装置 | |
CN108763258A (zh) | 文档主题参数提取方法、产品推荐方法、设备及存储介质 | |
CN113468307A (zh) | 文本处理方法、装置、电子设备及存储介质 | |
CN112541085B (zh) | 问卷的结构化方法、问卷的结构化装置及存储介质 | |
CN116091253B (zh) | 医保风控数据采集方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20190109 Address after: 100089 Floor 3 309, Building 28, 44 North Third Ring Road, Haidian District, Beijing Applicant after: Beijing Confucius Health Technology Co., Ltd. Address before: 100082 Beijing Haidian District Gaolizhang Road No. 1 Courtyard 2 Floor 201-148 Applicant before: Beijing Kang master Technology Co., Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |