CN115376643A - 病例自定义检索方法、装置、电子设备和计算机可读介质 - Google Patents
病例自定义检索方法、装置、电子设备和计算机可读介质 Download PDFInfo
- Publication number
- CN115376643A CN115376643A CN202211319466.9A CN202211319466A CN115376643A CN 115376643 A CN115376643 A CN 115376643A CN 202211319466 A CN202211319466 A CN 202211319466A CN 115376643 A CN115376643 A CN 115376643A
- Authority
- CN
- China
- Prior art keywords
- case
- field
- retrieval
- text
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013499 data model Methods 0.000 claims abstract description 45
- 201000010099 disease Diseases 0.000 claims abstract description 45
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 45
- 238000004364 calculation method Methods 0.000 claims abstract description 11
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 230000004044 response Effects 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 13
- 238000003745 diagnosis Methods 0.000 claims description 10
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 5
- 239000003814 drug Substances 0.000 claims description 5
- 230000000474 nursing effect Effects 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 208000012895 Gastric disease Diseases 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 208000018556 stomach disease Diseases 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/322—Trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Animal Behavior & Ethology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开涉及病例检索领域,提供了一种病例自定义检索系统、方法、电子设备和计算机可读介质。主要目的在于克服关键词不能穷举的问题,对目标专病进行检索。该系统包括:病例提取子系统,用于基于病例文本,提取病例文本中包含的特征信息,将特征信息归档到通用数据模型中对应字段的值域中;病例检索字段关联子系统,用于基于指定疾病关键词,生成检索字段,对检索字段进行关联词扩充,得到检索字段的推荐列表;病例匹配度计算子系统,用于基于条件树进行检索字段的推荐列表的文本内容与通用数据模型中对应字段的值域内容的匹配度计算,输出语义匹配度;病例输出子系统,用于响应于语义匹配度高于阈值,输出目标病例集合。
Description
技术领域
本公开涉及病例检索领域,尤其涉及病例自定义检索方法、装置、电子设备和计算机可读介质。
背景技术
在医院场景中,会把电子病例存在病例库中,现有的病例检索平台,只能提供简单的关键词检索与内容反馈,如姓名查询,疾病名称查询。医疗人员针对同一疾病的不同阶段的检索需求不同,另外,当医疗人员进行病例检索时,通常会伴随着一系列的检索行为,且这些检索行为往往伴随着很强的关联性。
目前病例检索平台无法克服关键词不能穷举的问题,无法对指定时间段和关键词下的所有专病进行检索。
发明内容
有鉴于此,本公开实施例提供了一种病例自定义检索方法、装置、电子设备和计算机可读介质,以解决现有技术中病例检索平台无法克服关键词不能穷举的问题和无法对指定时间段和关键词下的所有专病进行检索的问题。
本公开实施例的第一方面,提供了一种病例自定义检索系统,包括:病例提取子系统,用于基于病例文本,提取所述病例文本中包含的特征信息,将所述特征信息归档到通用数据模型中对应字段的值域中;病例检索字段关联子系统,用于基于指定疾病关键词,生成检索字段,对所述检索字段进行关联词扩充,得到所述检索字段的推荐列表;病例匹配度计算子系统,用于基于条件树进行所述检索字段的推荐列表的文本内容与所述通用数据模型中对应字段的值域内容的匹配度计算,输出语义匹配度;病例输出子系统,用于响应于所述语义匹配度高于阈值,输出目标病例集合。
在一种可能的实施方式中,所述特征信息包括以下一项或多项:患者身份信息区块,检验信息区块,专病名称区块,手术操作信息区块,药物使用记录区块,器械使用记录区块,护理信息区块,当前治疗阶段区块,患者身体指标区块。
在一种可能的实施方式中,所述病例提取子系统,包括:提取模块,用于提取所述病例文本中的特征信息;分类模块,用于按照所述特征信息的分类,匹配所述通用数据模型中的对应字段;归档模块,用于响应于匹配到所述对应字段,将所述特征信息归档到所述通用数据模型中对应字段的值域;新建模块,用于响应于未匹配到所述对应字段,创立新建对应字段,将所述特征信息归档到所述通用数据模型中所述新建对应字段的值域。
在一种可能的实施方式中,所述病例检索字段关联子系统包括:字段生成模块,用于基于指定疾病关键词,生成疾病关键词检索列表;相关词推荐模块,用于基于知识图谱库,对所述疾病关键词检索列表中的文本进行相关词推荐,生成关于疾病关键词检索字段的推荐列表。
在一种可能的实施方式中,所述病例匹配度计算子系统,包括:匹配模块,用于响应于检测到生成所述检索字段的推荐列表,对所述检索字段的推荐列表中的相关词集合和所述通用数据模型中对应字段的值域进行双向匹配,得到匹配词集合;文本相似度计算模块,用于基于所述匹配词集合,计算文本相似度,得到文本相似度集合;语义匹配度输出模块,用于输出文本相似度的最高值为语义匹配度。
在一种可能的实施方式中,所述病例输出子系统,包括:排序模块,用于响应于所述语义匹配度高于阈值,将所述文本相似度集合中的文本相似度由高到低排序;展示模块,用于基于文本相似度排序,展示预设个数的文本相似度对应匹配词的病例,为目标病例集合。
在一种可能的实施方式中,所述病例输出子系统还包括:时间段模块,用于基于指定时间段,对所述目标病例集合中的时间段进行匹配;移除模块,用于响应于匹配结束,将所述时间段与所述指定时间段不匹配的病例从所述目标病例集合中移除;时间段目标病例集合输出模块,用于响应于移除完成,输出时间段目标病例集合。
在一种可能的实施方式中,所述时间段包括:绝对时间范围,指定诊疗事件前后的时间范围,两个诊疗事件之间的时间范围和不限时间范围。
在一种可能的实施方式中,所述条件树为以树状图为基础的条件组合。
在一种可能的实施方式中,所述条件树包括字段节点和关系,所述字段节点包括:人口统计信息字段,就诊年龄字段,诊断信息字段。
在一种可能的实施方式中,所述关系包括且,或,跳转,分叉,循环。
本公开实施例的第二方面,提供了一种病例自定义检索方法,包括:基于病例文本,提取所述病例文本中包含的特征信息,将所述特征信息归档到通用数据模型中对应字段的值域中;基于指定疾病关键词,生成检索字段,对所述检索字段进行关联词扩充,得到所述检索字段的推荐列表;基于条件树进行所述检索字段的推荐列表的文本内容与所述通用数据模型中对应字段的值域内容的匹配度计算,输出语义匹配度;响应于所述语义匹配度高于阈值,输出目标病例集合。
在一种可能的实施方式中,所述特征信息包括以下一项或多项:患者身份信息区块,检验信息区块,专病名称区块,手术操作信息区块,药物使用记录区块,器械使用记录区块,护理信息区块,当前治疗阶段区块,患者身体指标区块。
在一种可能的实施方式中,所述基于病例文本,提取所述病例文本中包含的特征信息,将所述特征信息归档到通用数据模型中对应字段的值域中,包括:
提取所述病例文本中的特征信息;按照所述特征信息的分类,匹配所述通用数据模型中的对应字段;响应于匹配到所述对应字段,将所述特征信息归档到所述通用数据模型中对应字段的值域;响应于未匹配到所述对应字段,创立新建对应字段,将所述特征信息归档到所述通用数据模型中所述新建对应字段的值域。
在一种可能的实施方式中,所述基于指定疾病关键词,生成检索字段,对所述检索字段进行关联词扩充,得到所述检索字段的推荐列表,包括:基于指定疾病关键词,生成疾病关键词检索列表;基于知识图谱库,对所述疾病关键词检索列表中的文本进行相关词推荐,生成关于疾病关键词检索字段的推荐列表。
在一种可能的实施方式中,所述所述基于条件树进行所述检索字段的推荐列表的文本内容与所述通用数据模型中对应字段的值域内容的匹配度计算,输出语义匹配度,包括:响应于检测到生成所述检索字段的推荐列表,对所述检索字段的推荐列表中的相关词集合和所述通用数据模型中对应字段的值域进行双向匹配,得到匹配词集合;基于所述匹配词集合,计算文本相似度,得到文本相似度集合;输出文本相似度的最高值为语义匹配度。
在一种可能的实施方式中,所述响应于所述语义匹配度高于阈值,输出目标病例集合,包括:响应于所述语义匹配度高于阈值,将所述文本相似度集合中的文本相似度由高到低排序;基于文本相似度排序,展示预设个数的文本相似度对应匹配词的病例,为目标病例集合。
在一种可能的实施方式中,所述响应于所述语义匹配度高于阈值,输出目标病例集合,还包括:基于指定时间段,对所述目标病例集合中的时间段进行匹配;响应于匹配结束,将所述时间段与所述指定时间段不匹配的病例从所述目标病例集合中移除;响应于移除完成,输出时间段目标病例集合。
在一种可能的实施方式中,所述时间段包括:绝对时间范围,指定诊疗事件前后的时间范围,两个诊疗事件之间的时间范围和不限时间范围。
在一种可能的实施方式中,所述条件树为以树状图为基础的条件组合。
在一种可能的实施方式中,所述条件树包括字段节点和关系,所述字段节点包括:人口统计信息字段,就诊年龄字段,诊断信息字段。
在一种可能的实施方式中,所述关系包括且,或,跳转,分叉,循环。
本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可以在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本公开实施例与现有技术相比存在的有益效果是:首先,基于病例文本,提取所述病例文本中包含的特征信息,将所述特征信息归档到通用数据模型中对应字段的值域中。之后,基于指定疾病关键词,生成检索字段,对所述检索字段进行关联词扩充,得到所述检索字段的推荐列表。然后,基于条件树进行所述检索字段的推荐列表的文本内容与所述通用数据模型中对应字段的值域内容的匹配度计算,输出语义匹配度。最后,响应于所述语义匹配度高于阈值,输出目标病例集合。本公开提供的方法及装置对检索字段进行关联词扩充,解决了关键词不能穷举的问题,设置不同的时间段,可以对指定时间段和关键词下的专病进行检索。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是根据本公开的病例自定义检索系统的结构示意图;
图2是根据本公开的病例自定义检索方法的流程示意图;
图3是适于用来实现本公开的一些实施例的电子设备的结构示意图具体实施方式。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面将参考附图并结合实施例来详细说明本公开。
如背景技术所述,目前病例检索平台无法克服关键词不能穷举的问题,无法对指定时间段和关键词下的专病进行检索。
为了解决上述技术问题,本发明实施例提供了一种病例自定义检索系统。
图1是根据本公开的病例自定义检索系统的结构示意图,如图1所示,所述系统包括:病例提取子系统、病例检索字段关联子系统、病例匹配度计算子系统和病例输出子系统。
其中:病例提取子系统,用于基于病例文本,提取所述病例文本中包含的特征信息,将所述特征信息归档到通用数据模型中对应字段的值域中;
病例检索字段关联子系统,用于基于指定疾病关键词,生成检索字段,对所述检索字段进行关联词扩充,得到所述检索字段的推荐列表;
病例匹配度计算子系统,用于基于条件树进行所述检索字段的推荐列表的文本内容与所述通用数据模型中对应字段的值域内容的匹配度计算,输出语义匹配度;
病例输出子系统,用于响应于所述语义匹配度高于阈值,输出目标病例集合。
上述为本公开系统结构示意图,可以用于执行本公开方法实施例。对于本公开系统结构示意图中未披露的细节,请参照本公开方法实施例。本系统对应的方法流程示意图如图2所示,所述方法包括:
步骤S1:基于病例文本,提取所述病例文本中包含的特征信息,将所述特征信息归档到通用数据模型中对应字段的值域中。
在一些实施例中,所述特征信息包括以下一项或多项:患者身份信息区块,检验信息区块,专病名称区块,手术操作信息区块,药物使用记录区块,器械使用记录区块,护理信息区块,当前治疗阶段区块,患者身体指标区块。
在一些实施例中,所述基于病例文本,提取所述病例文本中包含的特征信息,将所述特征信息归档到通用数据模型中对应字段的值域中,包括:提取所述病例文本中的特征信息;按照所述特征信息的分类,匹配所述通用数据模型中的对应字段;响应于匹配到所述对应字段,将所述特征信息归档到所述通用数据模型中对应字段的值域;响应于未匹配到所述对应字段,创立新建对应字段,将所述特征信息归档到所述通用数据模型中所述新建对应字段的值域。
步骤S2:基于指定疾病关键词,生成检索字段,对所述检索字段进行关联词扩充,得到所述检索字段的推荐列表。
在一些实施例中,所述基于指定疾病关键词,生成检索字段,对所述检索字段进行关联词扩充,得到所述检索字段的推荐列表,包括:基于指定疾病关键词,生成疾病关键词检索列表;基于知识图谱库,对所述疾病关键词检索列表中的文本进行相关词推荐,生成关于疾病关键词检索字段的推荐列表。例如,知识图谱关联为:检索胃病,会出现和胃病相关的所有专病。
步骤S3:基于条件树进行所述检索字段的推荐列表的文本内容与所述通用数据模型中对应字段的值域内容的匹配度计算,输出语义匹配度。
在一些实施例中,所述基于条件树进行所述检索字段的推荐列表的文本内容与所述通用数据模型中对应字段的值域内容的匹配度计算,输出语义匹配度,包括:响应于检测到生成所述检索字段的推荐列表,对所述检索字段的推荐列表中的相关词集合和所述通用数据模型中对应字段的值域进行双向匹配,得到匹配词集合;基于所述匹配词集合,计算文本相似度,得到文本相似度集合;输出文本相似度的最高值为语义匹配度。
步骤S4:响应于所述语义匹配度高于阈值,输出目标病例集合。
在一些实施例中,所述响应于所述语义匹配度高于阈值,输出目标病例集合,包括:响应于所述语义匹配度高于阈值,将所述文本相似度集合中的文本相似度由高到低排序;基于文本相似度排序,展示预设个数的文本相似度对应匹配词的病例,为目标病例集合。在一些实施例中,基于指定时间段,对目标病例集合中的时间段进行匹配;响应于匹配结束,将时间段与所述指定时间段不匹配的病例从目标病例集合中移除;响应于移除完成,输出时间段目标病例集合。
在一些实施例中,所述响应于所述语义匹配度高于阈值,输出目标病例集合,还包括:基于指定时间段,对所述目标病例集合中的时间段进行匹配;响应于匹配结束,将所述时间段与所述指定时间段不匹配的病例从所述目标病例集合中移除;响应于移除完成,输出时间段目标病例集合。
在一些实施例中,所述时间段包括:绝对时间范围,指定诊疗事件前后的时间范围,两个诊疗事件之间的时间范围和不限时间范围。
在一些实施例中,所述条件树为以树状图为基础的条件组合。
在一些实施例中,所述条件树包括字段节点和关系,所述字段节点包括:人口统计信息字段,就诊年龄字段,诊断信息字段。
在一些实施例中,所述关系包括且,或,跳转,分叉,循环。
下面参考图3,其示出了适于用来实现本公开的一些实施例的电子设备。图3示出的服务器仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图3所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM)中的程序或者从存储装置加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有电子设备操作所需的各种程序和数据。处理装置、ROM以及RAM 403通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
通常,以下装置可以连接至I/O接口:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信装置。通信装置可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图3中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从ROM被安装。在该计算机程序被处理装置执行时,执行本公开的一些实施例的方法中限定的上述功能。
需要说明的是,本公开的一些实施例上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述装置中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:基于病例文本,提取所述病例文本中包含的特征信息,将所述特征信息归档到通用数据模型中对应字段的值域中;基于指定疾病关键词,生成检索字段,对所述检索字段进行关联词扩充,得到所述检索字段的推荐列表;基于条件树进行所述检索字段的推荐列表的文本内容与所述通用数据模型中对应字段的值域内容的匹配度计算,输出语义匹配度;响应于所述语义匹配度高于阈值,输出目标病例集合。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括病例提取子系统、病例检索字段关联子系统、病例匹配度计算子系统和病例输出子系统。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,病例提取子系统还可以被描述为“用于基于病例文本,提取所述病例文本中包含的特征信息,将所述特征信息归档到通用数据模型中对应字段的值域中的系统”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (24)
1.一种病例自定义检索系统,其特征在于,包括:
病例提取子系统,用于基于病例文本,提取所述病例文本中包含的特征信息,将所述特征信息归档到通用数据模型中对应字段的值域中;
病例检索字段关联子系统,用于基于指定疾病关键词,生成检索字段,对所述检索字段进行关联词扩充,得到所述检索字段的推荐列表;
病例匹配度计算子系统,用于基于条件树进行所述检索字段的推荐列表的文本内容与所述通用数据模型中对应字段的值域内容的匹配度计算,输出语义匹配度;
病例输出子系统,用于响应于所述语义匹配度高于阈值,输出目标病例集合。
2.根据权利要求1所述的病例自定义检索系统,其特征在于,所述特征信息包括以下一项或多项:患者身份信息区块,检验信息区块,专病名称区块,手术操作信息区块,药物使用记录区块,器械使用记录区块,护理信息区块,当前治疗阶段区块,患者身体指标区块。
3.根据权利要求2所述的病例自定义检索系统,其特征在于,所述病例提取子系统,包括:
提取模块,用于提取所述病例文本中的特征信息;
分类模块,用于按照所述特征信息的分类,匹配所述通用数据模型中的对应字段;
归档模块,用于响应于匹配到所述对应字段,将所述特征信息归档到所述通用数据模型中对应字段的值域;
新建模块,用于响应于未匹配到所述对应字段,创立新建对应字段,将所述特征信息归档到所述通用数据模型中所述新建对应字段的值域。
4.根据权利要求1所述的病例自定义检索系统,其特征在于,所述病例检索字段关联子系统包括:
字段生成模块,用于基于指定疾病关键词,生成疾病关键词检索列表;
相关词推荐模块,用于基于知识图谱库,对所述疾病关键词检索列表中的文本进行相关词推荐,生成关于疾病关键词检索字段的推荐列表。
5.根据权利要求1所述的病例自定义检索系统,其特征在于,所述病例匹配度计算子系统,包括:
匹配模块,用于响应于检测到生成所述检索字段的推荐列表,对所述检索字段的推荐列表中的相关词集合和所述通用数据模型中对应字段的值域进行双向匹配,得到匹配词集合;
文本相似度计算模块,用于基于所述匹配词集合,计算文本相似度,得到文本相似度集合;
语义匹配度输出模块,用于输出文本相似度的最高值为语义匹配度。
6.根据权利要求5所述的病例自定义检索系统,其特征在于,所述病例输出子系统,包括:
排序模块,用于响应于所述语义匹配度高于阈值,将所述文本相似度集合中的文本相似度由高到低排序;
展示模块,用于基于文本相似度排序,展示预设个数的文本相似度对应匹配词的病例,为目标病例集合。
7.根据权利要求6所述的病例自定义检索系统,其特征在于,所述病例输出子系统还包括:
时间段模块,用于基于指定时间段,对所述目标病例集合中的时间段进行匹配;
移除模块,用于响应于匹配结束,将所述时间段与所述指定时间段不匹配的病例从所述目标病例集合中移除;
时间段目标病例集合输出模块,用于响应于移除完成,输出时间段目标病例集合。
8.根据权利要求7所述的病例自定义检索系统,其特征在于,所述时间段包括:绝对时间范围,指定诊疗事件前后的时间范围,两个诊疗事件之间的时间范围和不限时间范围。
9.根据权利要求1所述的病例自定义检索系统,其特征在于,所述条件树为以树状图为基础的条件组合。
10.根据权利要求9所述的病例自定义检索系统,其特征在于,所述条件树包括字段节点和关系,所述字段节点包括:人口统计信息字段,就诊年龄字段,诊断信息字段。
11.根据权利要求10所述的病例自定义检索系统,其特征在于,所述关系包括且,或,跳转,分叉,循环。
12.一种病例自定义检索方法,其特征在于,包括:
基于病例文本,提取所述病例文本中包含的特征信息,将所述特征信息归档到通用数据模型中对应字段的值域中;
基于指定疾病关键词,生成检索字段,对所述检索字段进行关联词扩充,得到所述检索字段的推荐列表;
基于条件树进行所述检索字段的推荐列表的文本内容与所述通用数据模型中对应字段的值域内容的匹配度计算,输出语义匹配度;
响应于所述语义匹配度高于阈值,输出目标病例集合。
13.根据权利要求12所述的病例自定义检索方法,其特征在于,所述特征信息包括以下一项或多项:患者身份信息区块,检验信息区块,专病名称区块,手术操作信息区块,药物使用记录区块,器械使用记录区块,护理信息区块,当前治疗阶段区块,患者身体指标区块。
14.根据权利要求13所述的病例自定义检索方法,其特征在于,所述基于病例文本,提取所述病例文本中包含的特征信息,将所述特征信息归档到通用数据模型中对应字段的值域中,包括:
提取所述病例文本中的特征信息;
按照所述特征信息的分类,匹配所述通用数据模型中的对应字段;
响应于匹配到所述对应字段,将所述特征信息归档到所述通用数据模型中对应字段的值域;
响应于未匹配到所述对应字段,创立新建对应字段,将所述特征信息归档到所述通用数据模型中所述新建对应字段的值域。
15.根据权利要求12所述的病例自定义检索方法,其特征在于,所述基于指定疾病关键词,生成检索字段,对所述检索字段进行关联词扩充,得到所述检索字段的推荐列表,包括:
基于指定疾病关键词,生成疾病关键词检索列表;
基于知识图谱库,对所述疾病关键词检索列表中的文本进行相关词推荐,生成关于疾病关键词检索字段的推荐列表。
16.根据权利要求12所述的病例自定义检索方法,其特征在于,所述基于条件树进行所述检索字段的推荐列表的文本内容与所述通用数据模型中对应字段的值域内容的匹配度计算,输出语义匹配度,包括:
响应于检测到生成所述检索字段的推荐列表,对所述检索字段的推荐列表中的相关词集合和所述通用数据模型中对应字段的值域进行双向匹配,得到匹配词集合;
基于所述匹配词集合,计算文本相似度,得到文本相似度集合;
输出文本相似度的最高值为语义匹配度。
17.根据权利要求16所述的病例自定义检索方法,其特征在于,所述响应于所述语义匹配度高于阈值,输出目标病例集合,包括:
响应于所述语义匹配度高于阈值,将所述文本相似度集合中的文本相似度由高到低排序;
基于文本相似度排序,展示预设个数的文本相似度对应匹配词的病例,为目标病例集合。
18.根据权利要求17所述的病例自定义检索方法,其特征在于,所述响应于所述语义匹配度高于阈值,输出目标病例集合,还包括:
基于指定时间段,对所述目标病例集合中的时间段进行匹配;
响应于匹配结束,将所述时间段与所述指定时间段不匹配的病例从所述目标病例集合中移除;
响应于移除完成,输出时间段目标病例集合。
19.根据权利要求18所述的病例自定义检索方法,其特征在于,所述时间段包括:绝对时间范围,指定诊疗事件前后的时间范围,两个诊疗事件之间的时间范围和不限时间范围。
20.根据权利要求12所述的病例自定义检索方法,其特征在于,所述条件树为以树状图为基础的条件组合。
21.根据权利要求20所述的病例自定义检索方法,其特征在于,所述条件树包括字段节点和关系,所述字段节点包括:人口统计信息字段,就诊年龄字段,诊断信息字段。
22.根据权利要求21所述的病例自定义检索方法,其特征在于,所述关系包括且,或,跳转,分叉,循环。
23.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可以在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求12至22中任一项所述方法的步骤。
24.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求12至22中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211319466.9A CN115376643A (zh) | 2022-10-26 | 2022-10-26 | 病例自定义检索方法、装置、电子设备和计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211319466.9A CN115376643A (zh) | 2022-10-26 | 2022-10-26 | 病例自定义检索方法、装置、电子设备和计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115376643A true CN115376643A (zh) | 2022-11-22 |
Family
ID=84073718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211319466.9A Pending CN115376643A (zh) | 2022-10-26 | 2022-10-26 | 病例自定义检索方法、装置、电子设备和计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115376643A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100312798A1 (en) * | 2007-12-28 | 2010-12-09 | Koninklijke Philips Electronics N.V. | Retrieval of similar patient cases based on disease probability vectors |
CN107818815A (zh) * | 2017-10-30 | 2018-03-20 | 北京康夫子科技有限公司 | 电子病历的检索方法及系统 |
CN107958007A (zh) * | 2016-10-18 | 2018-04-24 | 浙江格林蓝德信息技术有限公司 | 病例信息检索方法及装置 |
CN110517785A (zh) * | 2019-08-28 | 2019-11-29 | 北京百度网讯科技有限公司 | 相似病例的查找方法、装置及设备 |
CN111292818A (zh) * | 2020-01-17 | 2020-06-16 | 同济大学 | 一种针对电子病历描述的查询重构方法 |
CN112507075A (zh) * | 2020-12-11 | 2021-03-16 | 北京目人生殖医学科技有限公司 | 一种病例数据搜索方法、系统、设备及存储介质 |
CN113821730A (zh) * | 2021-11-23 | 2021-12-21 | 北京嘉和海森健康科技有限公司 | 一种医疗信息推送方法、装置及电子设备 |
-
2022
- 2022-10-26 CN CN202211319466.9A patent/CN115376643A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100312798A1 (en) * | 2007-12-28 | 2010-12-09 | Koninklijke Philips Electronics N.V. | Retrieval of similar patient cases based on disease probability vectors |
CN107958007A (zh) * | 2016-10-18 | 2018-04-24 | 浙江格林蓝德信息技术有限公司 | 病例信息检索方法及装置 |
CN107818815A (zh) * | 2017-10-30 | 2018-03-20 | 北京康夫子科技有限公司 | 电子病历的检索方法及系统 |
CN110517785A (zh) * | 2019-08-28 | 2019-11-29 | 北京百度网讯科技有限公司 | 相似病例的查找方法、装置及设备 |
CN111292818A (zh) * | 2020-01-17 | 2020-06-16 | 同济大学 | 一种针对电子病历描述的查询重构方法 |
CN112507075A (zh) * | 2020-12-11 | 2021-03-16 | 北京目人生殖医学科技有限公司 | 一种病例数据搜索方法、系统、设备及存储介质 |
CN113821730A (zh) * | 2021-11-23 | 2021-12-21 | 北京嘉和海森健康科技有限公司 | 一种医疗信息推送方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190114318A1 (en) | Method And Apparatus For Outputting Information | |
CN111522927B (zh) | 基于知识图谱的实体查询方法和装置 | |
WO2022143069A1 (zh) | 一种文本聚类方法、装置、电子设备及存储介质 | |
CN115757400B (zh) | 数据表处理方法、装置、电子设备和计算机可读介质 | |
CN113688256B (zh) | 临床知识库的构建方法、装置 | |
US20210004406A1 (en) | Method and apparatus for storing media files and for retrieving media files | |
CN112309565B (zh) | 用于匹配药品信息和病症信息的方法、装置、电子设备和介质 | |
US10586069B2 (en) | Networking devices for storing profiles longitudinally | |
CN112115697A (zh) | 用于确定目标文本的方法、装置、服务器以及存储介质 | |
US11557381B2 (en) | Clinical trial editing using machine learning | |
CN109493928B (zh) | 基于条件树的患者数据筛选方法、系统、设备及存储介质 | |
CN112667773A (zh) | 基于知识图谱的数据获取方法及相关设备 | |
CN116756125B (zh) | 描述信息生成方法、装置、电子设备和计算机可读介质 | |
CN115620886B (zh) | 一种数据审核方法和装置 | |
CN115376643A (zh) | 病例自定义检索方法、装置、电子设备和计算机可读介质 | |
CN113220896B (zh) | 多来源知识图谱生成方法、装置、终端设备 | |
CN112650830B (zh) | 关键词提取方法、装置、电子设备和存储介质 | |
CN115587593A (zh) | 信息抽取方法、装置、电子设备和计算机可读介质 | |
CN112445789A (zh) | 用于将目标文本转化成结构化数据的方法和装置 | |
CN113609309A (zh) | 知识图谱构建方法、装置、存储介质及电子设备 | |
CN117453752B (zh) | 基于检索配置表数据模型的医院临床数据检索方法及装置 | |
CN110674224A (zh) | 实体数据的处理方法、装置、设备及计算机可读存储介质 | |
CN117971827B (zh) | 数据表关联方法、装置、电子设备和计算机可读介质 | |
CN111930704B (zh) | 业务报警设备控制方法、装置、设备和计算机可读介质 | |
CN113760905A (zh) | 数据库索引处理方法、装置、电子设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20221122 |
|
RJ01 | Rejection of invention patent application after publication |