CN112434511A - 医学数据的处理方法、装置及存储介质 - Google Patents
医学数据的处理方法、装置及存储介质 Download PDFInfo
- Publication number
- CN112434511A CN112434511A CN202011477569.9A CN202011477569A CN112434511A CN 112434511 A CN112434511 A CN 112434511A CN 202011477569 A CN202011477569 A CN 202011477569A CN 112434511 A CN112434511 A CN 112434511A
- Authority
- CN
- China
- Prior art keywords
- test
- original
- information
- inspection
- name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims description 13
- 238000012360 testing method Methods 0.000 claims abstract description 446
- 238000007689 inspection Methods 0.000 claims abstract description 167
- 238000010606 normalization Methods 0.000 claims abstract description 86
- 238000012545 processing Methods 0.000 claims abstract description 51
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000004458 analytical method Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 4
- 210000000265 leukocyte Anatomy 0.000 description 27
- 210000004369 blood Anatomy 0.000 description 25
- 239000008280 blood Substances 0.000 description 25
- 210000003608 fece Anatomy 0.000 description 9
- 238000004820 blood count Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000012795 verification Methods 0.000 description 7
- 238000002558 medical inspection Methods 0.000 description 6
- 210000002700 urine Anatomy 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 4
- 238000010339 medical test Methods 0.000 description 4
- 108010075254 C-Peptide Proteins 0.000 description 3
- 238000009534 blood test Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 235000012054 meals Nutrition 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 108010059993 Vancomycin Proteins 0.000 description 2
- 210000004051 gastric juice Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- MYPYJXKWCTUITO-LYRMYLQWSA-N vancomycin Chemical compound O([C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1=C2C=C3C=C1OC1=CC=C(C=C1Cl)[C@@H](O)[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@H]3C(=O)N[C@H]1C(=O)N[C@H](C(N[C@@H](C3=CC(O)=CC(O)=C3C=3C(O)=CC=C1C=3)C(O)=O)=O)[C@H](O)C1=CC=C(C(=C1)Cl)O2)=O)NC(=O)[C@@H](CC(C)C)NC)[C@H]1C[C@](C)(N)[C@H](O)[C@H](C)O1 MYPYJXKWCTUITO-LYRMYLQWSA-N 0.000 description 2
- 229960003165 vancomycin Drugs 0.000 description 2
- MYPYJXKWCTUITO-UHFFFAOYSA-N vancomycin Natural products O1C(C(=C2)Cl)=CC=C2C(O)C(C(NC(C2=CC(O)=CC(O)=C2C=2C(O)=CC=C3C=2)C(O)=O)=O)NC(=O)C3NC(=O)C2NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(CC(C)C)NC)C(O)C(C=C3Cl)=CC=C3OC3=CC2=CC1=C3OC1OC(CO)C(O)C(O)C1OC1CC(C)(N)C(O)C(C)O1 MYPYJXKWCTUITO-UHFFFAOYSA-N 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 238000004159 blood analysis Methods 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开涉及医学数据的处理方法、医学数据的处理装置及计算机可读存储介质,方法包括:获取原始医学数据,原始医学数据包含原始检验信息;提取原始检验信息;解析出关联于原始检验信息的检验项目;基于原始检验标本名称结合原始检验信息所对应的检验名称,解析出关联于原始检验信息的检验标本名称;基于关联于所述原始检验信息的检验标本名称,得到原始检验信息中检验项目和/或原始检验标本名称的归一化结果。方法还包括:根据第一归一化结果和第二归一化结果,得到关于原始检验信息的归一化结果。通过本公开的各实施例能够原始医学数据中对检验项目和检验标本进行统一地归一化处理,从而提升医学数据处理的能力。
Description
技术领域
本公开涉及医学数据智能处理技术领域,具体涉及一种医学数据的处理方法、医学数据的处理装置及计算机可读存储介质。
背景技术
针对包含医学检验信息的医学数据处理,需要同时明确检验项目和检验标本。同样的检验项目可以在多种检验标本中进行检测,不同检验标本的检验结果的医学意义大不相同。由于存在医学数据需求方对检验的命名规则不统一、人工书写习惯不同,包含医学检验信息的原始医院数据形式多样,需要对其进行归一化处理。
发明内容
本公开意图提供一种医学数据的处理方法、医学数据的处理装置及计算机可读存储介质,能够实现对原始医学数据中对检验项目和检验标本进行统一地归一化处理,从而提升医学数据处理的能力。
根据本公开的方案之一,提供一种医学数据的处理方法,包括:
获取原始医学数据,所述原始医学数据包含原始检验信息;
提取所述原始检验信息;
解析出关联于所述原始检验信息的检验项目;
基于原始检验标本名称结合所述原始检验信息所对应的检验名称,解析出关联于所述原始检验信息的检验标本名称;
基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验信息中检验项目和/或原始检验标本名称的归一化结果。
在一些实施例中,其中,所述解析出关联于所述原始检验信息的检验项目,包括:
将所述原始检验信息的检验项目对照标准检验信息表;
筛选出标准检验信息表中匹配于所述原始检验信息的检验项目的标准检验项目;
基于标准检验项目与所述原始检验信息的检验项目的相似度排序,构建检验项目表。
在一些实施例中,其中,所述基于原始检验标本名称结合所述原始检验信息所对应的检验名称,解析出关联于所述原始检验信息的检验标本名称,包括:
解析出符合所述检验名称的检验标本名称;
基于解析出的检验标本名称与所述检验名称的相似度排序,构建检验标本表。
在一些实施例中,其中,基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验信息中检验项目的归一化结果,包括:
解析所述检验标本表中的检验标本名称;
基于解析结果,生成目标检验项目作为所述原始检验信息的检验项目的归一化结果。
在一些实施例中,其中,基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验标本名称的归一化结果,包括:
解析所述检验项目表中的检验项目;
基于解析结果,生成目标检验标本作为所述原始检验信息的检验标本的归一化结果。
根据本公开的方案之一,提供医学数据的处理装置,包括:
获取单元,其配置为用于获取包含原始检验信息的原始医学数据;
提取模块,其配置为用于提取所述原始检验信息;
第一解析模块,其配置为用于解析出关联于所述原始检验信息的检验项目;
第二解析模块,其配置为用于结合所述原始检验信息所对应的检验名称,解析出关联于所述原始检验信息的检验标本名称;
归一处理模块,其配置为用于基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验信息中检验项目和/或原始检验标本名称的归一化结果。
在一些实施例中,其中,
所述第一解析模块,进一步配置为用于:
将所述原始检验信息的检验项目对照标准检验信息表;
筛选出标准检验信息表中匹配于所述原始检验信息的检验项目的标准检验项目;
基于标准检验项目与所述原始检验信息的检验项目的相似度排序,构建检验项目表;
所述第二解析模块,进一步配置为用于:
解析出符合所述检验名称的检验标本名称;
基于解析出的检验标本名称与所述检验名称的相似度排序,构建检验标本表。
在一些实施例中,其中,所述归一处理模块,进一步配置为用于:
解析所述检验标本表中的检验标本名称;
基于解析结果,生成目标检验项目作为所述原始检验信息的检验项目的归一化结果。
在一些实施例中,其中,所述归一处理模块,进一步配置为用于:
解析所述检验项目表中的检验项目;
基于解析结果,生成目标检验标本作为所述原始检验信息的检验标本的归一化结果。
根据本公开的方案之一,提供一种医学数据的处理方法,用于对原始医学数据中原始检验信息的归一化处理,所述原始检验信息包含原始检验名称、原始检验标本名称和原始检验项目;所述方法包括:根据第一归一化结果和第二归一化结果,得到关于所述原始检验信息的归一化结果;
所述第一归一化处理包括:
基于所述原始检验名称和原始检验标本名称,解析出关联于所述原始检验信息的检验标本名称;
基于所述关联于所述原始检验信息的检验标本名称,从待选检验项目中得到关于所述原始检验项目的第一归一化结果;
所述第二归一化处理包括:
基于所述第一归一化结果和原始检验名称,从所述关联于所述原始检验信息的检验标本名称得到关于所述原始检验标本的第二归一化结果。
根据本公开的方案之一,提供计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,实现:
根据上述的医学数据的处理方法。
本公开的各种实施例的医学数据的处理方法、医学数据的处理装置及计算机可读存储介质,通过获取原始医学数据,所述原始医学数据包含原始检验信息;提取所述原始检验信息;解析出关联于所述原始检验信息的检验项目;结合所述原始检验信息所对应的检验名称,解析出关联于所述原始检验信息的检验标本名称;基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验信息中检验项目和/或原始检验标本名称的归一化结果,从而能够将包含医学检验信息的医学数据作为输入,提取其中检验名称、检验项目、原始检验标本名称,通过解析其中相关联的信息,从检验名称、检验项目、检验标本三个来源中提取与标准检验信息相符的检验项目和检验标本,进行统一地归一化处理,效果能达到90%的准召率,从而提升医学研究、医疗诊治的精确性和效率。
应当理解,前面的大体描述以及后续的详细描述只是示例性的和说明性的,并非对所要求保护的本公开的限制。
附图说明
在未必按照比例绘制的附图中,不同视图中相似的附图标记可以表示相似的构件。具有字母后缀的相似附图标记或具有不同字母后缀的相似附图标记可以表示相似构件的不同实例。附图通常作为示例而非限制地图示各种实施例,并且与说明书和权利要求书一起用于解释所公开的实施例。
图1示出本公开实施例涉及的医学数据的处理方法的一种流程图;
图2示出本公开实施例涉及的医学数据的处理装置的一种架构图;
图3示出本公开实施例涉及的医学数据的处理方法的另一种流程图。
具体实施方式
为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。
为了保持本公开实施例的以下说明清楚且简明,本公开省略了已知功能和已知部件的详细说明。
本公开涉及关于医学数据的处理,用于医学检验信息对应标准医学信息的归一化处理。针对包含医学检验信息的医学数据处理,需要同时明确检验项目和检验标本。检验项目包括诸如“白细胞计数”、“潜血检查”、“C肽”等,检验标本包括诸如“血”、“小便”、“粪便”、“胃液”等。同样的检验项目可以在多种检验标本中进行检测,不同检验标本的检验结果的医学意义大不相同。例如,针对同样是“隐血测试”的检验项目,可以在“尿”、“便”、“脑脊液”等多种标本中进行该项检测,然而在这些不同标本下做“隐血测试”的医学意义完全不同。由于存在医学数据需求方对检验的命名规则不统一、人工书写习惯不同,包含医学检验信息的原始医院数据形式多样,需要对其进行归一化处理。
作为方案之一,如图1所示,本公开的实施例提供了一种医学数据的处理方法,包括:
S101:获取原始医学数据,所述原始医学数据包含原始检验信息;
S102:提取所述原始检验信息;
S103:解析出关联于所述原始检验信息的检验项目;
S104:基于原始检验标本名称结合所述原始检验信息所对应的检验名称,解析出关联于所述原始检验信息的检验标本名称;
S105:基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验信息中检验项目和/或原始检验标本名称的归一化结果。
本公开的发明构思之一,旨在将包含医学检验信息的医学数据作为输入,提取其中检验名称、检验项目、原始检验标本名称。通过解析其中相关联的信息,从检验名称、检验项目、检验标本三个来源中提取与标准检验信息相符的检验项目和检验标本,进行统一地归一化处理。例如可以实现为,从检验名称、原始检验标本中推断出可能的标本名称,一方面,结合推断的标本和检验项目的具体内容,推断检验项目。另一发面,结合检验项目的内容,推断检验标本。
本公开所涉及的检验名称,可以对应于本领域技术人员通晓以及临床通称的各种检验套餐所标定的名称。
本公开各实施例中的医学数据,其所属的数据源并不需要特别加以限定,可以是历史数据,也可以是当前实时的数据。从数据格式上,可以是病历文本数据、视频数据、音频数据等等,只要能够通过识别手段,例如文本识别(例如,NLP识别,OCR识别等方式)提取其中的内容,以识别其中能够包含的检验信息,语音识别、视频图像识别等方式识别其中记载的医学检验信息,抑或是通过字符拆分、词句拆分等方式识别的检验信息内容等。以标准检验信息为参考,这些检验信息包含有但可以不限于检验套餐、检验项目、检验标本。具体应用场景中,本公开的医学数据也可以是包含于病历、诊断书、检验报告,其中包含有多个或者多种检验信息,可以用于人工、机器等通过标注或者解析方式进行相关医学信息的记录、判读。
举例来说,本公开各实施例涉及的原始医学数据为病历数据,或者检验检测报告数据等,其中包含的原始检验信息包括检验套餐,即该通过检验套餐名称标识本公开的检验名称,以及检验项目和检验标本。例如,检验套餐记录为“血常规(急诊)”,检验项目记录为“白细胞计数”,原始检验标本记录为“粪便”。
在一些实施例中,本公开的所述解析出关联于所述原始检验信息的检验项目,包括:
将所述原始检验信息的检验项目对照标准检验信息表;
筛选出标准检验信息表中匹配于所述原始检验信息的检验项目的标准检验项目;
基于标准检验项目与所述原始检验信息的检验项目的相似度排序,构建检验项目表。
具体的,结合上述示例,原始检验信息中记录的检验项目为“白细胞计数”,将该检验项目对照标准检验信息表,筛选出标准检验信息表中匹配于原始检验信息的检验项目“白细胞计数”的标准检验项目。本实施例中标准检验信息表可以采用国际、国家、地区统一的关于医学检验的信息目录。在匹配过程中,可以参照标准检验信息表中与“白细胞计数”语义关联、文字描述、文本描述相似的检验项目进行匹配。例如,针对“白细胞计数”,在标准信息表中可以通过智能识别等方式选出诸如“白细胞(WBC)”等含有“白细胞”字符的检验项目。在选出匹配于原始检验信息中检验项目的基础上,对这些标准检验项目与原始检验信息中检验项目的相似度进行确定,例如可以依据两者字符上的交集程度作为相似度的确定标准。具体的,针对上述“白细胞计数”根据相似度可以建立检验项目表:
“1.白细胞团计数
2.白细胞(WBC)
……”
在一些实施例中,本公开的所述基于原始检验标本名称结合所述原始检验信息所对应的检验名称,解析出关联于所述原始检验信息的检验标本名称,包括:
解析出符合所述检验名称的检验标本名称;
基于解析出的检验标本名称与所述检验名称的相似度排序,构建检验标本表。
具体的,继续结合上述示例,原始检验信息中记录的检验套餐为“血常规(急诊)”,原始检验标本为“粪便”。本实施例旨在能够结合所述原始检验信息所对应的检验名称,从而至少能够借助于原始检验信息的检验名称中提供的信息,解析出能够关联于原始检验信息的检验标本名称。为了能够得到最为完善的本实施例的检验标本名称,可以进一步基于原始检验标本名称结合所述原始检验信息所对应的检验名称,解析出本实施例的关联于原始检验信息的检验标本名称,其中可以包含有原始检验标本名称。具体可以是,将检验套餐与原始检验标本结合起来,通过AI智能识别和分析,解析检验套餐与原始检验标本之间的医学关联。例如,结合检验套餐所标定的“血常规(急诊)”内容,解析可能涉及的标本可以包括“静脉血”、“便”等标本名称,其中“便”可以涵盖“大便”、“小便”。当然,也可以进一步结合将该原始检验标本对照标准检验信息表,筛选出标准检验信息表中匹配于检验标本名称“便”的标准检验标本名称。本实施例中标准检验信息表可以采用国际、国家、地区统一的关于医学检验的信息目录。在匹配过程中,可以参照标准检验信息表中与“便”语义关联、文字描述、文本描述相似的检验项目进行匹配。例如,针对“便”、“静脉血”等,在标准信息表中可以通过智能识别等方式选出含有这些字符的检验项目,只要符合检验套餐的标本名称都可以作为待选目标。在选出匹配于原始检验信息中检验标本的基础上,对这些得出的检验标本与检验套餐所标定的含义,以及原始检验标本的相似度进行确定,例如可以依据两者字符上的交集程度作为相似度的确定标准。具体的,针对“血常规(急诊)”检验套餐并含检验标本为“粪便”,根据相似度可以建立检验标本表:
“1.静脉血
2.便
……”
通过上述实施方式,能够至少实现本公开发明构思之一在于,包含医学检验信息的医学数据作为输入,提取其中检验名称、检验项目、原始检验标本名称,通过解析其中相关联的信息,从检验名称、检验项目、检验标本三个来源中提取与标准检验信息相符的检验项目和检验标本,也就是从检验套餐、原始检验标本中获取可能的标本。
进一步的,本公开的基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验信息中检验项目的归一化结果,包括:
解析所述检验标本表中的检验标本名称;
基于解析结果,生成目标检验项目作为所述原始检验信息的检验项目的归一化结果。
具体的,本公开的目标之一旨在结合可能的标本和检验项目具体内容,推断检验项目。
继续结合上述示例,通过AI识别和处理本公开各实施例中的检验项目表和检验标本表,即将
“1.白细胞团计数
2.白细胞(WBC)
……”
与
“1.静脉血
2.便
……”
两者结合起来,对检验项目进行分析处理,按照医学概念并对两者文本、字符内容进行处理,得到归一化结果。结合临床知识,可以得到归一化结果作为本公开的目标医学数据:
“检验套餐:血常规(急诊)
检验项目:白细胞(WBC)”
再如,针对检验标本表中包含有“血”、“餐后两小时血”,并且检验项目表对应为“万古霉素”、“C肽”的情形,结合两者的数据信息以及医学概念,通过本公开各实施例的处理方法,即可以得到关于检验项目的归一后的检验项目,对应于上述分别为“万古霉素血药浓度”、“C肽(2小时)”。本实施例得到的这些归一后检验项目就是符合统一标准的检验项目名称。
进一步的,本公开的基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验标本名称的归一化结果,包括:
解析所述检验项目表中的检验项目;
基于解析结果,生成目标检验标本作为所述原始检验信息的检验标本的归一化结果。
优选的,本公开可以在解析所述检验项目表中的检验项目的基础上,结合本公开各实施例的生成目标检验项目作为所述原始检验信息的检验项目的归一化结果,得到原始检验信息的检验标本的归一化结果。
具体的,本公开的目标之一旨在结合检验项目的内容,推断检验标本。
继续结合上述示例,通过AI识别和处理本公开各实施例中的检验项目表和检验标本表,即将
“1.白细胞团计数
2.白细胞(WBC)
……”
与
“1.静脉血
2.便
……”
两者结合起来,对检验标本进行分析处理,按照医学概念并对两者文本、字符内容进行处理,得到归一化结果。结合临床知识,可以得到归一化结果作为本公开的目标医学数据:
“检验套餐:血常规(急诊)
检验标本:静脉血”
进一步结合上述针对检验项目的归一化结果,本实施例即可得到关于检验项目和检验标本统一处理的归一化结果:
“检验套餐:血常规(急诊)
检验标本:静脉血
检验项目:白细胞(WBC)”
再如,针对检验标本表中包含有“便”、“尿”,并且检验项目表对应为“胃液潜血检查(急)”、“8小时尿白蛋白”的情形(其中下划线并非检验项目表中需要特别呈现,而是为了后文描述所做标记),结合两者的数据信息以及医学概念,通过本公开各实施例的处理方法,尤其针对检验项目表中带有下划线的文字、字符进行解析,即可以得到关于检验标本的归一后的检验标本,对应于上述分别为“胃液”、“8小时尿”。本实施例得到的这些归一后检验标本就是符合统一标准的检验标本名称。
作为本公开的方案之一,如图2所示,本公开还提供了一种医学数据的处理装置,包括:
获取单元,其配置为用于获取包含原始检验信息的原始医学数据;
提取模块,其配置为用于提取所述原始检验信息;
第一解析模块,其配置为用于解析出关联于所述原始检验信息的检验项目;
第二解析模块,其配置为用于结合所述原始检验信息所对应的检验名称,解析出关联于所述原始检验信息的检验标本名称;
归一处理模块,其配置为用于基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验信息中检验项目和/或原始检验标本名称的归一化结果。
在一些实施例中,本公开的获取单元,可以为输入设备、屏幕截取装置、文本识别装置等,旨在实现能够获取基于原始录入的文本而生成;和/或基于AI算法识别而生成包含原始检验信息的原始医学数据。
在一些实施例中,本公开的提取模块,可以通过文本识别装置、语音识别装置、视频图像识别装置等辅助实现。
在一些实施例中,本公开的所述第一解析模块,进一步配置为用于:
将所述原始检验信息的检验项目对照标准检验信息表;
筛选出标准检验信息表中匹配于所述原始检验信息的检验项目的标准检验项目;
基于标准检验项目与所述原始检验信息的检验项目的相似度排序,构建检验项目表。
例如,结合前文所述内容,针对“白细胞计数”,在标准信息表中可以通过智能识别等方式选出诸如“白细胞(WBC)”等含有“白细胞”字符的检验项目。在选出匹配于原始检验信息中检验项目的基础上,对这些标准检验项目与原始检验信息中检验项目的相似度进行确定,例如可以依据两者字符上的交集程度作为相似度的确定标准。具体的,针对上述“白细胞计数”根据相似度可以建立检验项目表:
“1.白细胞团计数
2.白细胞(WBC)
……”。
在一些实施例中,本公开的所述第二解析模块,进一步配置为用于:
解析出符合所述检验名称的检验标本名称;
基于解析出的检验标本名称与所述检验名称的相似度排序,构建检验标本表。
例如,结合前文所述内容,针对“便”、“静脉血”等,在标准信息表中可以通过智能识别等方式选出含有这些字符的检验项目,只要符合检验套餐的标本名称都可以作为待选目标。在选出匹配于原始检验信息中检验标本的基础上,对这些得出的检验标本与检验套餐所标定的含义,以及原始检验标本的相似度进行确定,例如可以依据两者字符上的交集程度作为相似度的确定标准。具体的,针对“血常规(急诊)”检验套餐并含检验标本为“粪便”,根据相似度可以建立检验标本表:
“1.静脉血
2.便
……”。
在一些实施例中,本实施例的所述归一处理模块,进一步配置为用于:
解析所述检验标本表中的检验标本名称;
基于解析结果,生成目标检验项目作为所述原始检验信息的检验项目的归一化结果。
在一些实施例中,本实施例的所述归一处理模块,进一步配置为用于:
解析所述检验项目表中的检验项目;
基于解析结果,生成目标检验标本作为所述原始检验信息的检验标本的归一化结果。
作为方案之一,如图3所示,本公开的实施例提供了一种医学数据的处理方法,用于对原始医学数据中原始检验信息的归一化处理,所述原始检验信息包含原始检验名称、原始检验标本名称和原始检验项目;所述方法包括;
所述第一归一化处理包括:
S201:基于所述原始检验名称和原始检验标本名称,解析出关联于所述原始检验信息的检验标本名称;
S202:基于所述关联于所述原始检验信息的检验标本名称,从待选检验项目中得到关于所述原始检验项目的第一归一化结果;
所述第二归一化处理包括:
S203:基于所述第一归一化结果和原始检验名称,从所述关联于所述原始检验信息的检验标本名称得到关于所述原始检验标本的第二归一化结果;
S204:根据第一归一化结果和第二归一化结果,得到关于所述原始检验信息的归一化结果。
结合前述内容和示例,在一些实施例中,本公开的基于所述原始检验名称和原始检验标本名称,解析出关联于所述原始检验信息的检验标本名称,包括:
解析出符合原始检验名称的检验标本名称;
基于解析出的检验标本名称与所述检验名称的相似度排序,构建检验标本表。
具体的,继续结合上述示例,原始检验信息中记录的检验套餐为“血常规(急诊)”,原始检验标本为“粪便”。本实施例旨在能够结合所述原始检验信息所对应的检验名称,从而至少能够借助于原始检验信息的检验名称中提供的信息,解析出能够关联于原始检验信息的检验标本名称。为了能够得到最为完善的本实施例的检验标本名称,可以进一步基于原始检验标本名称结合所述原始检验信息所对应的检验名称,解析出本实施例的关联于原始检验信息的检验标本名称,其中可以包含有原始检验标本名称。具体可以是,将检验套餐与原始检验标本结合起来,通过AI智能识别和分析,解析检验套餐与原始检验标本之间的医学关联。例如,结合前述内容,针对“血常规(急诊)”检验套餐并含检验标本为“粪便”,结合检验套餐所标定的“血常规(急诊)”内容,根据相似度可以建立检验标本表:
“1.静脉血
2.便
……”
在一些实施例中,本公开实施例的待选检验项目,可以是存在于检验项目表中,结合前述内容,检验项目表的构建方式,包括:
将所述原始检验信息的检验项目对照标准检验信息表;
筛选出标准检验信息表中匹配于所述原始检验信息的检验项目的标准检验项目;
基于标准检验项目与所述原始检验信息的检验项目的相似度排序,构建检验项目表。
在一些实施例中,本公开的基于所述第一归一化结果和原始检验名称,从所述关联于所述原始检验信息的检验标本名称得到关于所述原始检验标本的第二归一化结果。
具体来说,本公开的发明构思之一,旨在通过获取原始医学数据,所述原始医学数据包含原始检验信息;提取所述原始检验信息;解析出关联于所述原始检验信息的检验项目;结合所述原始检验信息所对应的检验名称,解析出关联于所述原始检验信息的检验标本名称;基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验信息中检验项目和/或原始检验标本名称的归一化结果,从而能够将包含医学检验信息的医学数据作为输入,提取其中检验名称、检验项目、原始检验标本名称,通过解析其中相关联的信息,从检验名称、检验项目、检验标本三个来源中提取与标准检验信息相符的检验项目和检验标本,进行统一地归一化处理,效果能达到90%的准召率,从而提升医学研究、医疗诊治的精确性和效率。
具体来说,本公开的发明构思之一,旨在通过根据第一归一化结果和第二归一化结果,得到关于所述原始检验信息的归一化结果;所述第一归一化处理包括:基于所述原始检验名称和原始检验标本名称,解析出关联于所述原始检验信息的检验标本名称;基于所述关联于所述原始检验信息的检验标本名称,从待选检验项目中得到关于所述原始检验项目的第一归一化结果;所述第二归一化处理包括:基于所述第一归一化结果和原始检验名称,从所述关联于所述原始检验信息的检验标本名称得到关于所述原始检验标本的第二归一化结果,从而能够将包含医学检验信息的医学数据作为输入,提取其中检验名称、检验项目、原始检验标本名称,通过解析其中相关联的信息,从检验名称、检验项目、检验标本三个来源中提取与标准检验信息相符的检验项目和检验标本,进行统一地归一化处理,效果能达到90%的准召率,从而提升医学研究、医疗诊治的精确性和效率。
作为本公开的方案之一,本公开还提供了一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,主要实现根据上述的医学数据的处理方法,至少包括:
获取原始医学数据,所述原始医学数据包含原始检验信息;
提取所述原始检验信息;
解析出关联于所述原始检验信息的检验项目;
结合所述原始检验信息所对应的检验名称,解析出关联于所述原始检验信息的检验标本名称;
基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验信息中检验项目和/或原始检验标本名称的归一化结果。
作为本公开的方案之一,本公开还提供了一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,主要实现根据上述的医学数据的处理方法,用于对原始医学数据中原始检验信息的归一化处理,所述原始检验信息包含原始检验名称、原始检验标本名称和原始检验项目;所述处理方法至少包括:根据第一归一化结果和第二归一化结果,得到关于所述原始检验信息的归一化结果;
所述第一归一化处理包括:
基于所述原始检验名称和原始检验标本名称,解析出关联于所述原始检验信息的检验标本名称;
基于所述关联于所述原始检验信息的检验标本名称,从待选检验项目中得到关于所述原始检验项目的第一归一化结果;
所述第二归一化处理包括:
基于所述第一归一化结果和原始检验名称,从所述关联于所述原始检验信息的检验标本名称得到关于所述原始检验标本的第二归一化结果。
在一些实施例中,执行算机可执行指令处理器可以是包括一个以上通用处理设备的处理设备,诸如微处理器、中央处理单元(CPU)、图形处理单元(GPU)等。更具体地,该处理器可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、运行其他指令集的处理器或运行指令集的组合的处理器。该处理器还可以是一个以上专用处理设备,诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、片上系统(SoC)等。
在一些实施例中,计算机可读存储介质可以为存储器,诸如只读存储器(ROM)、随机存取存储器(RAM)、相变随机存取存储器(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、电可擦除可编程只读存储器(EEPROM)、其他类型的随机存取存储器(RAM)、闪存盘或其他形式的闪存、缓存、寄存器、静态存储器、光盘只读存储器(CD-ROM)、数字通用光盘(DVD)或其他光学存储器、盒式磁带或其他磁存储设备,或被用于储存能够被计算机设备访问的信息或指令的任何其他可能的非暂时性的介质等。
在一些实施例中,计算机可执行指令可以实现为多个程序模块,多个程序模块共同实现根据本公开中任何一项所述的医学影像的显示方法。
本公开描述了各种操作或功能,其可以实现为软件代码或指令或者定义为软件代码或指令。显示单元可以实现为在存储器上存储的软件代码或指令模块,其由处理器执行时可以实现相应的步骤和方法。
这样的内容可以是可以直接执行(“对象”或“可执行”形式)的源代码或差分代码(“delta”或“patch”代码)。这里描述的实施例的软件实现可以通过其上存储有代码或指令的制品提供,或者通过操作通信接口以通过通信接口发送数据的方法提供。机器或计算机可读存储介质可以使机器执行所描述的功能或操作,并且包括以可由机器(例如,计算显示设备、电子系统等)访问的形式存储信息的任何机制,例如可记录/不可记录介质(例如,只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光存储介质、闪存显示设备等)。通信接口包括与硬连线、无线、光学等介质中的任何一种接口以与其他显示设备通信的任何机制,例如存储器总线接口、处理器总线接口、因特网连接、磁盘控制器等。通信接口可以通过提供配置参数和/或发送信号来配置以准备通信接口,以提供描述软件内容的数据信号。可以通过向通信接口发送一个或多个命令或信号来访问通信接口。
本公开的实施例的计算机可执行指令可以组织成一个或多个计算机可执行组件或模块。可以用这类组件或模块的任何数量和组合来实现本公开的各方面。例如,本公开的各方面不限于附图中示出的和本文描述的特定的计算机可执行指令或特定组件或模块。其他实施例可以包括具有比本文所示出和描述的更多或更少功能的不同的计算机可执行指令或组件。
以上描述旨在是说明性的而不是限制性的。例如,上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本公开。这不应解释为一种不要求保护的公开的特征对于任一权利要求是必要的意图。相反,本公开的主题可以少于特定的公开的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本公开的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。
以上实施例仅为本公开的示例性实施例,不用于限制本公开,本公开的保护范围由权利要求书限定。本领域技术人员可以在本公开的实质和保护范围内,对本公开做出各种修改或等同替换,这种修改或等同替换也应视为落在本公开的保护范围内。
Claims (10)
1.医学数据的处理方法,包括:
获取原始医学数据,所述原始医学数据包含原始检验信息;
提取所述原始检验信息;
解析出关联于所述原始检验信息的检验项目;
基于原始检验标本名称结合所述原始检验信息所对应的检验名称,解析出关联于所述原始检验信息的检验标本名称;
基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验信息中检验项目和/或原始检验标本名称的归一化结果。
2.根据权利要求1所述的方法,其中,所述解析出关联于所述原始检验信息的检验项目,包括:
将所述原始检验信息的检验项目对照标准检验信息表;
筛选出标准检验信息表中匹配于所述原始检验信息的检验项目的标准检验项目;
基于标准检验项目与所述原始检验信息的检验项目的相似度排序,构建检验项目表。
3.根据权利要求2所述的方法,其中,所述基于原始检验标本名称结合所述原始检验信息所对应的检验名称,解析出关联于所述原始检验信息的检验标本名称,包括:
解析出符合所述检验名称的检验标本名称;
基于解析出的检验标本名称与所述检验名称的相似度排序,构建检验标本表。
4.根据权利要求3所述的方法,其中,基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验信息中检验项目的归一化结果,包括:
解析所述检验标本表中的检验标本名称;
基于解析结果,生成目标检验项目作为所述原始检验信息的检验项目的归一化结果。
5.根据权利要求3所述的方法,其中,基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验标本名称的归一化结果,包括:
解析所述检验项目表中的检验项目;
基于解析结果,生成目标检验标本作为所述原始检验信息的检验标本的归一化结果。
6.医学数据的处理装置,包括:
获取单元,其配置为用于获取包含原始检验信息的原始医学数据;
提取模块,其配置为用于提取所述原始检验信息;
第一解析模块,其配置为用于解析出关联于所述原始检验信息的检验项目;
第二解析模块,其配置为用于结合所述原始检验信息所对应的检验名称,解析出关联于所述原始检验信息的检验标本名称;
归一处理模块,其配置为用于基于所述关联于所述原始检验信息的检验标本名称,得到所述原始检验信息中检验项目和/或原始检验标本名称的归一化结果。
7.根据权利要求6所述的装置,其中,
所述第一解析模块,进一步配置为用于:
将所述原始检验信息的检验项目对照标准检验信息表;
筛选出标准检验信息表中匹配于所述原始检验信息的检验项目的标准检验项目;
基于标准检验项目与所述原始检验信息的检验项目的相似度排序,构建检验项目表;
所述第二解析模块,进一步配置为用于:
解析出符合所述检验名称的检验标本名称;
基于解析出的检验标本名称与所述检验名称的相似度排序,构建检验标本表。
8.根据权利要求7所述的装置,其中,
所述归一处理模块,进一步配置为用于:
解析所述检验标本表中的检验标本名称;
基于解析结果,生成目标检验项目作为所述原始检验信息的检验项目的归一化结果;
或者
所述归一处理模块,进一步配置为用于:
解析所述检验项目表中的检验项目;
基于解析结果,生成目标检验标本作为所述原始检验信息的检验标本的归一化结果。
9.医学数据的处理方法,用于对原始医学数据中原始检验信息的归一化处理,所述原始检验信息包含原始检验名称、原始检验标本名称和原始检验项目;所述方法包括:根据第一归一化结果和第二归一化结果,得到关于所述原始检验信息的归一化结果;
所述第一归一化处理包括:
基于所述原始检验名称和原始检验标本名称,解析出关联于所述原始检验信息的检验标本名称;
基于所述关联于所述原始检验信息的检验标本名称,从待选检验项目中得到关于所述原始检验项目的第一归一化结果;
所述第二归一化处理包括:
基于所述第一归一化结果和原始检验名称,从所述关联于所述原始检验信息的检验标本名称得到关于所述原始检验标本的第二归一化结果。
10.一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,实现:
根据权利要求1至5中任一项所述的医学数据的处理方法;或者
根据权利要求9所述的医学数据的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011477569.9A CN112434511A (zh) | 2020-12-15 | 2020-12-15 | 医学数据的处理方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011477569.9A CN112434511A (zh) | 2020-12-15 | 2020-12-15 | 医学数据的处理方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112434511A true CN112434511A (zh) | 2021-03-02 |
Family
ID=74691746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011477569.9A Pending CN112434511A (zh) | 2020-12-15 | 2020-12-15 | 医学数据的处理方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112434511A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115543929A (zh) * | 2022-11-27 | 2022-12-30 | 成都成电金盘健康数据技术有限公司 | 一种基于区域医疗健康信息交互服务的验证方法和系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107066791A (zh) * | 2016-12-19 | 2017-08-18 | 银江股份有限公司 | 一种基于病人检验结果的辅助疾病诊断方法 |
CN110085314A (zh) * | 2019-04-11 | 2019-08-02 | 上海翼依信息技术有限公司 | 医学检验数据的智能分析方法、系统以及设备 |
CN110598116A (zh) * | 2019-09-19 | 2019-12-20 | 上海腾程医学科技信息有限公司 | 检验项目推荐方法及装置、终端设备、存储介质 |
CN111125311A (zh) * | 2019-12-24 | 2020-05-08 | 医渡云(北京)技术有限公司 | 检验信息归一处理的方法、装置、存储介质及电子设备 |
CN111145848A (zh) * | 2019-12-31 | 2020-05-12 | 天津开心生活科技有限公司 | 临床试验中的不良反应事件检测方法、装置、介质与设备 |
US20200342056A1 (en) * | 2019-04-26 | 2020-10-29 | Tencent America LLC | Method and apparatus for natural language processing of medical text in chinese |
-
2020
- 2020-12-15 CN CN202011477569.9A patent/CN112434511A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107066791A (zh) * | 2016-12-19 | 2017-08-18 | 银江股份有限公司 | 一种基于病人检验结果的辅助疾病诊断方法 |
CN110085314A (zh) * | 2019-04-11 | 2019-08-02 | 上海翼依信息技术有限公司 | 医学检验数据的智能分析方法、系统以及设备 |
US20200342056A1 (en) * | 2019-04-26 | 2020-10-29 | Tencent America LLC | Method and apparatus for natural language processing of medical text in chinese |
CN110598116A (zh) * | 2019-09-19 | 2019-12-20 | 上海腾程医学科技信息有限公司 | 检验项目推荐方法及装置、终端设备、存储介质 |
CN111125311A (zh) * | 2019-12-24 | 2020-05-08 | 医渡云(北京)技术有限公司 | 检验信息归一处理的方法、装置、存储介质及电子设备 |
CN111145848A (zh) * | 2019-12-31 | 2020-05-12 | 天津开心生活科技有限公司 | 临床试验中的不良反应事件检测方法、装置、介质与设备 |
Non-Patent Citations (2)
Title |
---|
唐子惠: "《医学人工智能导论》", vol. 2020, 30 April 2020, 上海科学技术出版社, pages: 68 - 70 * |
金雅妮;王华珍;王硕;刘骏龙;: "医学检验知识的图谱构建与应用", 福建电脑, no. 02, pages 1 - 7 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115543929A (zh) * | 2022-11-27 | 2022-12-30 | 成都成电金盘健康数据技术有限公司 | 一种基于区域医疗健康信息交互服务的验证方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107908635B (zh) | 建立文本分类模型以及文本分类的方法、装置 | |
CN107451068A (zh) | 用例运行方法、装置、计算设备及存储介质 | |
CN112560400B (zh) | 医学数据的处理方法、装置及存储介质 | |
CN114625732A (zh) | 基于结构化查询语言sql的查询方法和系统 | |
CN113808758B (zh) | 一种检验数据标准化的方法、装置、电子设备和存储介质 | |
CN109544376A (zh) | 一种基于数据分析的异常病例识别方法及计算设备 | |
CN111444718A (zh) | 一种保险产品需求文档处理方法、装置及电子设备 | |
CN113139365A (zh) | 临床试验受试者招募方法及设备 | |
CN114416714A (zh) | 数据治理系统 | |
CN112749277A (zh) | 医学数据的处理方法、装置及存储介质 | |
CN112434511A (zh) | 医学数据的处理方法、装置及存储介质 | |
CN116168793A (zh) | 体检数据的处理分析方法及相关设备 | |
CN115311216A (zh) | 抗核抗体的荧光图片的判读方法及装置、设备及存储介质 | |
CN111755090A (zh) | 病历查找方法、病历查找装置、存储介质与电子设备 | |
CN106919501A (zh) | 基于缺陷模式的静态分析方法和工具 | |
CN115618841A (zh) | 一种文档导出方法、装置、设备及存储介质 | |
CN111063445A (zh) | 基于医疗数据的特征提取方法及装置、设备和介质 | |
Kim et al. | Representation of nursing terminologies in UMLS | |
CN115457586A (zh) | 一种病例信息提取方法、装置、设备和存储介质 | |
CN112712868A (zh) | 医学数据的分析方法、装置及存储介质 | |
CN112434528A (zh) | 医学数据的处理方法、装置及存储介质 | |
CN114373173A (zh) | 数据处理方法、装置、终端设备及存储介质 | |
CN112434529A (zh) | 医学数据的处理方法、装置及存储介质 | |
CN114443852A (zh) | 病历质控方法、系统及相应设备和存储介质 | |
CN113658009A (zh) | 理赔信息处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |