CN112434528A - 医学数据的处理方法、装置及存储介质 - Google Patents
医学数据的处理方法、装置及存储介质 Download PDFInfo
- Publication number
- CN112434528A CN112434528A CN202011477566.5A CN202011477566A CN112434528A CN 112434528 A CN112434528 A CN 112434528A CN 202011477566 A CN202011477566 A CN 202011477566A CN 112434528 A CN112434528 A CN 112434528A
- Authority
- CN
- China
- Prior art keywords
- test
- name
- original
- information
- inspection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 238000003672 processing method Methods 0.000 title description 12
- 238000012360 testing method Methods 0.000 claims abstract description 302
- 238000007689 inspection Methods 0.000 claims abstract description 114
- 238000012545 processing Methods 0.000 claims abstract description 49
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000000605 extraction Methods 0.000 claims abstract description 6
- 230000011218 segmentation Effects 0.000 claims description 19
- 238000004140 cleaning Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 abstract description 5
- 102000009027 Albumins Human genes 0.000 description 15
- 108010088751 Albumins Proteins 0.000 description 15
- 210000004369 blood Anatomy 0.000 description 10
- 239000008280 blood Substances 0.000 description 10
- 210000002700 urine Anatomy 0.000 description 10
- 238000012795 verification Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 206010003445 Ascites Diseases 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000019771 cognition Effects 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000003908 liver function Effects 0.000 description 4
- 238000009534 blood test Methods 0.000 description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010339 medical test Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 241000714260 Human T-lymphotropic virus 1 Species 0.000 description 2
- 108010048233 Procalcitonin Proteins 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- CWCXERYKLSEGEZ-KDKHKZEGSA-N procalcitonin Chemical compound C([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)[C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCSC)NC(=O)[C@H]1NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@@H](N)CSSC1)[C@@H](C)O)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 CWCXERYKLSEGEZ-KDKHKZEGSA-N 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 210000004051 gastric juice Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000002558 medical inspection Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开涉及医学数据的处理方法、医学数据的处理装置及计算机可读存储介质,方法包括:获取原始医学数据,所述原始医学数据包含原始检验信息;提取所述原始检验信息所包含的检验项目;解析所述检验项目;在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称。处理装置包括:获取单元;提取模块;解析模块;检验标本确定模块,其配置为在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称。通过本公开的各实施例能够实现通过数据信息解决检验标本缺失的问题,从而提升医学数据处理的能力。
Description
技术领域
本公开涉及医学数据智能处理技术领域,具体涉及一种医学数据的处理方法、医学数据的处理装置及计算机可读存储介质。
背景技术
针对包含医学检验信息的医学数据处理,需要同时明确检验项目和检验标本。同样的检验项目可以在多种检验标本中进行检测,不同检验标本的检验结果的医学意义大不相同。由于存在医学数据管理不规范,以及医学数据记录、书写方式不同或者数据可能遗失,将面临检验标本缺失的问题。
发明内容
本公开意图提供一种医学数据的处理方法、医学数据的处理装置及计算机可读存储介质,能够实现通过数据信息解决检验标本缺失的问题,从而提升医学数据处理的能力。
根据本公开的方案之一,提供一种医学数据的处理方法,包括:
获取原始医学数据,所述原始医学数据包含原始检验信息;
提取所述原始检验信息所包含的检验项目;
解析所述检验项目;
在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称。
在一些实施例中,其中,所述提取所述原始检验信息所包含的检验项目,包括:
提取预处理后的所述原始检验信息所包含的检验项目;
所述预处理,至少包括以下方式之一:
字符转换;
字符正则匹配;
字符清洗。
在一些实施例中,其中,所述解析所述检验项目,包括:
对所述检验项目做分词处理;
判断分词处理后的检验项目中是否包含有关于检验标本名称的信息。
在一些实施例中,其中,所述在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称,包括:
基于所述检验名称解析关于检验标本名称的信息;
结合所述检验项目,基于预设规则提取所述检验名称所包含的检验标本名称。
在一些实施例中,其中,还包括:
基于提取的所述检验名称所包含的检验标本名称,更新所述原始医学数据。
在一些实施例中,其中,还包括:
在所述检验项目包含关于检验标本名称的情况下,基于所述检验项目得到检验标本名称;
基于该检验标本名称,更新所述原始医学数据。
根据本公开的方案之一,提供医学数据的处理装置,包括:
获取单元,其配置为用于获取包含原始检验信息的原始医学数据;
提取模块,其配置为用于提取所述原始检验信息所包含的检验项目;
解析模块,其配置为用于解析所述检验项目;
检验标本确定模块,其配置为在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称。
在一些实施例中,其中,所述检验标本确定模块,进一步配置为用于:
基于所述检验名称解析关于检验标本名称的信息;
结合所述检验项目,基于预设规则提取所述检验名称所包含的检验标本名称。
在一些实施例中,其中,所述检验标本确定模块,进一步配置为用于:
基在所述检验项目包含关于检验标本名称的情况下,基于所述检验项目得到检验标本名称。
根据本公开的方案之一,提供医学数据的处理方法,包括:
获取包含原始检验信息的原始医学数据,所述原始检验信息包括原始检验名称和原始检验项目;
解析所述原始检验名称;
在解析到所述原始检验名称包含有关于检验项目的信息的情况下,至少基于所述原始检验名称和解析到的关于检验项目的信息,得到检验标本名称。
根据本公开的方案之一,提供计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,实现:
根据上述的医学数据的处理方法。
本公开的各种实施例的医学数据的处理方法、医学数据的处理装置及计算机可读存储介质,通过获取原始医学数据,所述原始医学数据包含原始检验信息;提取所述原始检验信息所包含的检验项目;解析所述检验项目;在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称,从而能够至少在检验项目不包含关于检验标本名称的情况下,通过提取、解析原始检验信息所包含的检验项目,结合其中关于检验标本的信息,基于医学认知建立的规则,舍弃异常检查结果,确定出符合原始医学数据检验目的的检验样本,将其作为原始医学数据可能缺失的信息部分,通过实际检测,效果能够解决98%以上检验标本缺失的问题,从而提升医学研究、医疗诊治的精确性和效率。
应当理解,前面的大体描述以及后续的详细描述只是示例性的和说明性的,并非对所要求保护的本公开的限制。
附图说明
在未必按照比例绘制的附图中,不同视图中相似的附图标记可以表示相似的构件。具有字母后缀的相似附图标记或具有不同字母后缀的相似附图标记可以表示相似构件的不同实例。附图通常作为示例而非限制地图示各种实施例,并且与说明书和权利要求书一起用于解释所公开的实施例。
图1示出本公开实施例涉及的医学数据的处理方法的一种流程图;
图2示出本公开实施例涉及的医学数据的处理装置的一种架构图;
图3示出本公开实施例涉及的医学数据的处理方法的另一种流程图。
具体实施方式
为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。
为了保持本公开实施例的以下说明清楚且简明,本公开省略了已知功能和已知部件的详细说明。
本公开涉及关于医学数据的处理,用于医学检验信息,尤其是检验标本可能存在缺失的解决方案。针对包含医学检验信息的医学数据处理,需要同时明确检验项目和检验标本。检验项目包括诸如“白细胞计数”、“潜血检查”、“白蛋白”等,检验标本包括诸如“血”、“便”、“尿”、“胃液”、“腹水”等。同样的检验项目可以在多种检验标本中进行检测,不同检验标本的检验结果的医学意义大不相同。例如,针对同样是“隐血测试”的检验项目,可以在“尿”、“便”、“脑脊液”等多种标本中进行该项检测,然而在这些不同标本下做“隐血测试”的医学意义完全不同。由于存在医学数据管理不规范,以及医学数据记录、书写方式不同或者数据可能遗失,将面临检验标本缺失的问题。在这种情况下,需要考虑对可能缺失的检验标本及其相关信息进行完善化处理。
作为方案之一,如图1所示,本公开的实施例提供了一种医学数据的处理方法,包括:
S101:获取原始医学数据,所述原始医学数据包含原始检验信息;
S102:提取所述原始检验信息所包含的检验项目;
S103:解析所述检验项目;
S104:在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称。
本公开的发明构思之一,旨在能够至少在检验项目不包含关于检验标本名称的情况下,通过提取、解析原始检验信息所包含的检验项目,结合其中关于检验标本的信息,基于医学认知建立的规则,舍弃异常检查结果,确定出符合原始医学数据检验目的的检验样本,将其作为原始医学数据可能缺失的信息部分。针对电子病历所记载的医学数据,以及其中所包含的医学检验信息而言,能够通过电子病历中的其他来源信息来解决标本信息缺失的问题。
本公开所涉及的检验名称,可以对应于本领域技术人员通晓以及临床通称的各种检验套餐所标定的名称。
本公开各实施例中的医学数据,其所属的数据源并不需要特别加以限定,可以是历史数据,也可以是当前实时的数据。从数据格式上,可以是病历文本数据、视频数据、音频数据等等,只要能够通过识别手段,例如文本识别(例如,NLP识别,OCR识别等方式)提取其中的内容,以识别其中能够包含的检验信息,语音识别、视频图像识别等方式识别其中记载的医学检验信息,抑或是通过字符拆分、词句拆分等方式识别的检验信息内容等。以标准检验信息为参考,这些检验信息包含有但可以不限于检验套餐、检验项目、检验标本。具体应用场景中,本公开的医学数据也可以是包含于病历、诊断书、检验报告,其中包含有多个或者多种检验信息,可以用于人工、机器等通过标注或者解析方式进行相关医学信息的记录、判读。以标准的病历数据为例,本公开涉及的原始医学数据中,包含的原始检验信息至少同时包含检验项目来源。
举例来说,本公开各实施例涉及的原始医学数据为病历数据,或者检验检测报告数据等,其中包含的原始检验信息包括检验套餐,即该通过检验套餐名称标识本公开的检验名称,以及检验项目和检验标本。例如,检验套餐记录为“肝功能常规”,检验项目记录为“白蛋白”,原始检验标本的记录存在缺失,或者不确定的情况。
在一些实施例中,本公开的所述提取所述原始检验信息所包含的检验项目,包括:
提取预处理后的所述原始检验信息所包含的检验项目;
所述预处理,至少包括以下方式之一:
字符转换;
字符正则匹配;
字符清洗。
具体的,结合上述示例,原始检验信息中记录的检验项目为“白蛋白”。在本实施例中,可以通过将该检验项目“白蛋白”与标准检验信息表对照的方式,对原始检验信息进行预处理,从而将原始检验信息中可能存在的无关信息、干扰信息等这一类与检验标本没有医学概念、诊断逻辑交集的信息进行统一或者清洗。本实施例中标准检验信息表可以采用国际、国家、地区统一的关于医学检验的信息目录。例如,在实际临床诊断和记录中,存在针对检验项目进行试剂剂量的描述,检验单位的描述,以及各种字符之间的混用情况。本实施例中,可以在AI识别和处理的基础上,对原始检验信息进行预处理来解决上述情况可能带来的问题。其中:
1)字符转换,可以实现为诸如字符、字母大小写的转换,罗马数字和阿拉伯数字的转换,中文数字序号与阿拉伯数字的转换等。
以大小写转换为例说明,例如针对原始检验信息包含的原始检验项目为“粪便分析(Rt+OB)”,通过本实施例的预处理方法,可以将该原始检验项目中大写字符统一转换为小写字符,转换后检验项目为“粪便分析(rt+ob)”;
又以罗马数字和阿拉伯数字转换为例说明,例如针对原始检验信息包含的原始检验项目为“人T细胞白血病病毒I+II型DNA”,通过本实施例的预处理方法,可以将该原始检验项目中罗马数字字符统一转换为阿拉伯数字字符,转换后检验项目为“人T细胞白血病病毒1+2型DNA”;
2)字符正则匹配,可以实现为诸如针对检验项目中存在的剂量、单位等描述,通过正则匹配的方式进行清洗。
以正则匹配清洗剂量、单位为例说明,例如针对原始检验信息包含的原始检验项目为“降钙素原:2.22ng/ml(参考值:0-0.05)”,通过本实施例,可以针对该原始检验项目进行清洗剂量、单位的预处理,清洗后检验项目为“降钙素原:(参考值:0-0.05)”。做该处理的有益效果在于,一方面能够使得本公开的处理方法更精准地关注于检测项目的分析,对于“2.22ng/ml”这个检验的结果,对本实施例的匹配没有帮助;另一方面,在有些检验项目自身带有存在歧义、含义不清的字符的情况下,例如带有英文字母,就能够消除英文的单位可能会对匹配检测项造成的干扰;
3)字符清洗,可以实现为针对无关词和特殊符号进行清洗。
以清洗无关词和特殊符号为例说明,例如针对原始检验信息包含的原始检验项目为“★钠”,通过本实施例的预处理方法,可以将该原始检验项目中“★”这一类与匹配检测项无关无用的字符进行清洗,清洗后检验项目为“钠”。
具体的适用于何种预处理方式,可以根据实际提取出的原始检验信息的实际内容、构成方式、信息格式等情况而相应采用适配的预处理方式。
在一些实施例中,本公开的所述解析所述检验项目,包括:
对所述检验项目做分词处理;
判断分词处理后的检验项目中是否包含有关于检验标本名称的信息。
具体的,继续结合上述示例,原始检验信息中记录的检验套餐为“肝功能常规”,检验项目记录为“白蛋白”。本实施例中,可以通过AI识别和处理的方式,更进一步基于分词模型的方式,对检验项目进行分词处理。例如,针对检验项目“白蛋白”,分词处理认为其中不包含有任何关联于检验标本的分词结果,那么将该检验项目作为本公开的在所述检验项目不包含关于检验标本名称的情况。又如,针对检验项目“尿隐血”这样记录信息,经过分词处理,则认为其中包含了可能存在的检验标本,那么得到的分词结果为“尿隐血”,本文以下划线方式呈现分词结果,并非实际处理过程中需要的实际呈现方式。
在一些实施例中,本公开的所述在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称,包括:
基于所述检验名称解析关于检验标本名称的信息;
结合所述检验项目,基于预设规则提取所述检验名称所包含的检验标本名称。
具体的,继续结合上述示例,原始检验信息中记录的检验套餐为“肝功能常规”,检验项目记录为“白蛋白”。本公开涉及到预设规则可以由专业人工确定的医学概念或者医学逻辑诊断规则而定,也可以由神经网络架构建立的深度学习模型确定,旨在能够结合检验项目和检验套餐来确定检验标本。具体针对上述示例,检验项目“白蛋白”中不含有任何检验标本信息,也不含有任何直接能够确定出的检验标本信息,那么通过本公开的处理方法,将检验项目“白蛋白”与检验套餐“肝功能常规”结合,可以通过AI识别和处理判定出,脑脊液、血液、腹水等检验标本都可以进行白蛋白的检验,由于检验套餐中提及并明确包含了“肝功能”信息,通过本公开的处理方法即可以确定该原始医学数据所包含的原始检验信息所应当对应的检验标本,即“静脉血”。
又如一种示例,原始检验信息所包含的检验套餐为“腹水生化常规”,检验项目为“白蛋白”,“白蛋白”中不含有任何检验标本信息,也不含有任何直接能够确定出的检验标本信息,那么通过本公开的处理方法,将检验项目“白蛋白”与检验套餐“腹水生化常规”结合,可以通过AI识别和处理判定出,脑脊液、血液、腹水等检验标本都可以进行白蛋白的检验,由于检验套餐中提及并明确包含了“腹水”信息,通过本公开的处理方法即可以确定该原始医学数据所包含的原始检验信息所应当对应的检验标本,即“腹水”。
在上述内容的基础上,本领域技术人员可以理解的是,基于检验套餐中所包含的检验标本信息,以其明确描述为最佳实现方式。针对一些检验套餐中所包含的信息不能够明确指代、表征检验标本信息的情况,在本公开的一些实施例中,可以引入相应的基于神经网络架构的推理模型,对检验套餐进行合理地推理,从而得到符合医学规则的检验标本信息。
在一些实施例中,旨在对原始医学数据进行合理化补充、完善的目的,本公开的处理方法,还包括:
基于提取的所述检验名称所包含的检验标本名称,更新所述原始医学数据。
具体的,针对无论直接从检验项目中提取的检验标本名称,还是结合检验套餐根据医学规则得出的检验标本名称,本实施例将其作为更新原始医学数据的标本信息,从而输出准确、完善的医学数据来表征相应完整的医学检验信息。
在一些实施例中,本公开的处理方法,还包括:
在所述检验项目包含关于检验标本名称的情况下,基于所述检验项目得到检验标本名称;
基于该检验标本名称,更新所述原始医学数据。
具体的,继续结合上述示例,针对检验项目“尿隐血”这样记录信息,经过分词处理,则认为其中包含了可能存在的检验标本,那么得到的分词结果为“尿隐血”。在这种情况,则认为检验项目名称包含了“尿”这一信息,提及了标本信息,检验项目中明确的确定了原始检验信息中的检验标本,并且符合医学规则,即使在检验套餐信息缺失的情况,就能够得到正确的标本信息。
作为本公开的方案之一,如图2所示,本公开还提供了一种医学数据的处理装置,包括:
获取单元,其配置为用于获取包含原始检验信息的原始医学数据;
提取模块,其配置为用于提取所述原始检验信息所包含的检验项目;
解析模块,其配置为用于解析所述检验项目;
检验标本确定模块,其配置为在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称。
在一些实施例中,本公开的获取单元,可以为输入设备、屏幕截取装置、文本识别装置等,旨在实现能够获取基于原始录入的文本而生成;和/或基于AI算法识别而生成包含原始检验信息的原始医学数据。
在一些实施例中,本公开的提取模块,可以通过文本识别装置、语音识别装置、视频图像识别装置等辅助实现。
进一步的,本公开的提取模块,可以配置为:
提取所述原始检验信息所包含的检验项目,包括:
提取预处理后的所述原始检验信息所包含的检验项目;
所述预处理,至少包括以下方式之一:
字符转换;
字符正则匹配;
字符清洗。
在一些实施例中,本公开的所述解析模块,进一步配置为用于:
对所述检验项目做分词处理;
判断分词处理后的检验项目中是否包含有关于检验标本名称的信息。
例如,可以通过AI识别和处理的方式,更进一步基于分词模型的方式,对检验项目进行分词处理。例如,针对检验项目“白蛋白”,分词处理认为其中不包含有任何关联于检验标本的分词结果,那么将该检验项目作为本公开的在所述检验项目不包含关于检验标本名称的情况。又如,针对检验项目“尿隐血”这样记录信息,经过分词处理,则认为其中包含了可能存在的检验标本,那么得到的分词结果为“尿隐血”,本文以下划线方式呈现分词结果,并非实际处理过程中需要的实际呈现方式。
在一些实施例中,本实施例的检验标本确定模块,进一步配置为用于:
基于所述检验名称解析关于检验标本名称的信息;
结合所述检验项目,基于预设规则提取所述检验名称所包含的检验标本名称。
在一些实施例中,本实施例的检验标本确定模块,进一步配置为用于:
在所述检验项目包含关于检验标本名称的情况下,基于所述检验项目得到检验标本名称。
在一些实施例中,本实施例还可以包括更新模块,其配置为用于:
基于检验标本名称,更新所述原始医学数据,该检验标本名称来自:结合所述检验项目,基于预设规则提取所述检验名称所包含的检验标本名称;或者
基于检验标本名称,更新所述原始医学数据,该检验标本名称来自:结合所述检验项目,基于所述检验项目得到检验标本名称。
作为方案之一,如图3所示,本公开的实施例提供了一种医学数据的处理方法,包括:
S201:获取包含原始检验信息的原始医学数据,所述原始检验信息包括原始检验名称和原始检验项目;
S202:解析所述原始检验名称;
S203:在解析到所述原始检验名称包含有关于检验项目的信息的情况下,至少基于所述原始检验名称和解析到的关于检验项目的信息,得到检验标本名称。
本公开的发明构思另一方面旨在能够至少在原始检验信息中原始检验标本信息可能出现缺失、待定等情形下,结合对原始检验名称的解析,在能够从检验名称中获取相关于检验项目的基础上,分析出关于检验标本的信息,基于医学认知建立的规则,舍弃异常检查结果,确定出符合原始医学数据检验目的的检验样本,将其作为原始医学数据可能缺失的信息部分。针对电子病历所记载的医学数据,以及其中所包含的医学检验信息而言,能够通过电子病历中的其他来源信息来解决标本信息缺失的问题。
具体的结合前述示例,在临床检验中,检验套餐和检验项目相互会存在层级概念,从检验套餐的描述中可以包含有一种或者多种检验项目的名称,例如检验套餐是多项检验项目的总称,比如检验套餐本身为“血常规、尿常规、凝血系列”等。在这种场景下,本实施例能够实现至少基于所述原始检验名称和解析到的关于检验项目的信息,得到检验标本名称,得到目标检验标本名称。当然,也进一步优选的,可以结合前述内容,通过从“检验套餐”名称中提取与“标本信息”相关的信息、“检验项目”中提取的“标本信息”、“检验项目”名称中提取与“标本信息”相关的信息等,以这三种信息结合起来的方式得到本实施例的目标检验标本名称。在实际临床检验过程中,结合医学知识通过上述多维度信息结合处理的方式,能够很大程度优化目标检验标本名称的输出准确率,从而提升医学数据处理的精准率。
具体来说,本公开的发明构思之一,旨在通过获取原始医学数据,所述原始医学数据包含原始检验信息;提取所述原始检验信息所包含的检验项目;解析所述检验项目;在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称,从而能够至少在检验项目不包含关于检验标本名称的情况下,通过提取、解析原始检验信息所包含的检验项目,结合其中关于检验标本的信息,基于医学认知建立的规则,舍弃异常检查结果,确定出符合原始医学数据检验目的的检验样本,将其作为原始医学数据可能缺失的信息部分,通过实际检测,效果能够解决98%以上检验标本缺失的问题,从而提升医学研究、医疗诊治的精确性和效率。
具体来说,本公开的发明构思之一,旨在通过获取包含原始检验信息的原始医学数据,所述原始检验信息包括原始检验名称和原始检验项目;解析所述原始检验名称;在解析到所述原始检验名称包含有关于检验项目的信息的情况下,至少基于所述原始检验名称和解析到的关于检验项目的信息,得到检验标本名称,从而至少在原始检验信息中原始检验标本信息可能出现缺失、待定等情形下,结合对原始检验名称的解析,在能够从检验名称中获取相关于检验项目的基础上,分析出关于检验标本的信息,基于医学认知建立的规则,舍弃异常检查结果,确定出符合原始医学数据检验目的的检验样本,将其作为原始医学数据可能缺失的信息部分。针对电子病历所记载的医学数据,以及其中所包含的医学检验信息而言,能够通过电子病历中的其他来源信息来解决标本信息缺失的问题。通过实际检测,效果能够解决98%以上检验标本缺失的问题,从而提升医学研究、医疗诊治的精确性和效率。
作为本公开的方案之一,本公开还提供了一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,主要实现根据上述的医学数据的处理方法,至少包括:
获取原始医学数据,所述原始医学数据包含原始检验信息;
提取所述原始检验信息所包含的检验项目;
解析所述检验项目;
在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称。
作为本公开的方案之一,本公开还提供了一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,主要实现根据上述的医学数据的处理方法,至少包括:
获取包含原始检验信息的原始医学数据,所述原始检验信息包括原始检验名称和原始检验项目;
解析所述原始检验名称;
在解析到所述原始检验名称包含有关于检验项目的信息的情况下,至少基于所述原始检验名称和解析到的关于检验项目的信息,得到检验标本名称。
在一些实施例中,执行算机可执行指令处理器可以是包括一个以上通用处理设备的处理设备,诸如微处理器、中央处理单元(CPU)、图形处理单元(GPU)等。更具体地,该处理器可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、运行其他指令集的处理器或运行指令集的组合的处理器。该处理器还可以是一个以上专用处理设备,诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、片上系统(SoC)等。
在一些实施例中,计算机可读存储介质可以为存储器,诸如只读存储器(ROM)、随机存取存储器(RAM)、相变随机存取存储器(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、电可擦除可编程只读存储器(EEPROM)、其他类型的随机存取存储器(RAM)、闪存盘或其他形式的闪存、缓存、寄存器、静态存储器、光盘只读存储器(CD-ROM)、数字通用光盘(DVD)或其他光学存储器、盒式磁带或其他磁存储设备,或被用于储存能够被计算机设备访问的信息或指令的任何其他可能的非暂时性的介质等。
在一些实施例中,计算机可执行指令可以实现为多个程序模块,多个程序模块共同实现根据本公开中任何一项所述的医学影像的显示方法。
本公开描述了各种操作或功能,其可以实现为软件代码或指令或者定义为软件代码或指令。显示单元可以实现为在存储器上存储的软件代码或指令模块,其由处理器执行时可以实现相应的步骤和方法。
这样的内容可以是可以直接执行(“对象”或“可执行”形式)的源代码或差分代码(“delta”或“patch”代码)。这里描述的实施例的软件实现可以通过其上存储有代码或指令的制品提供,或者通过操作通信接口以通过通信接口发送数据的方法提供。机器或计算机可读存储介质可以使机器执行所描述的功能或操作,并且包括以可由机器(例如,计算显示设备、电子系统等)访问的形式存储信息的任何机制,例如可记录/不可记录介质(例如,只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光存储介质、闪存显示设备等)。通信接口包括与硬连线、无线、光学等介质中的任何一种接口以与其他显示设备通信的任何机制,例如存储器总线接口、处理器总线接口、因特网连接、磁盘控制器等。通信接口可以通过提供配置参数和/或发送信号来配置以准备通信接口,以提供描述软件内容的数据信号。可以通过向通信接口发送一个或多个命令或信号来访问通信接口。
本公开的实施例的计算机可执行指令可以组织成一个或多个计算机可执行组件或模块。可以用这类组件或模块的任何数量和组合来实现本公开的各方面。例如,本公开的各方面不限于附图中示出的和本文描述的特定的计算机可执行指令或特定组件或模块。其他实施例可以包括具有比本文所示出和描述的更多或更少功能的不同的计算机可执行指令或组件。
以上描述旨在是说明性的而不是限制性的。例如,上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本公开。这不应解释为一种不要求保护的公开的特征对于任一权利要求是必要的意图。相反,本公开的主题可以少于特定的公开的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本公开的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。
以上实施例仅为本公开的示例性实施例,不用于限制本公开,本公开的保护范围由权利要求书限定。本领域技术人员可以在本公开的实质和保护范围内,对本公开做出各种修改或等同替换,这种修改或等同替换也应视为落在本公开的保护范围内。
Claims (10)
1.医学数据的处理方法,包括:
获取原始医学数据,所述原始医学数据包含原始检验信息;
提取所述原始检验信息所包含的检验项目;
解析所述检验项目;
在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称。
2.根据权利要求1所述的方法,其中,所述提取所述原始检验信息所包含的检验项目,包括:
提取预处理后的所述原始检验信息所包含的检验项目;
所述预处理,至少包括以下方式之一:
字符转换;
字符正则匹配;
字符清洗。
3.根据权利要求2所述的方法,其中,所述解析所述检验项目,包括:
对所述检验项目做分词处理;
判断分词处理后的检验项目中是否包含有关于检验标本名称的信息。
4.根据权利要求1所述的方法,其中,所述在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称,包括:
基于所述检验名称解析关于检验标本名称的信息;
结合所述检验项目,基于预设规则提取所述检验名称所包含的检验标本名称。
5.根据权利要求4所述的方法,其中,还包括:
基于提取的所述检验名称所包含的检验标本名称,更新所述原始医学数据。
6.根据权利要求1至5中任一项所述的方法,其中,还包括:
在所述检验项目包含关于检验标本名称的情况下,基于所述检验项目得到检验标本名称;
基于该检验标本名称,更新所述原始医学数据。
7.医学数据的处理装置,包括:
获取单元,其配置为用于获取包含原始检验信息的原始医学数据;
提取模块,其配置为用于提取所述原始检验信息所包含的检验项目;
解析模块,其配置为用于解析所述检验项目;
检验标本确定模块,其配置为在所述检验项目不包含关于检验标本名称的情况下,基于所述原始检验信息包含的检验名称得到检验标本名称。
8.根据权利要求7所述的装置,其中,所述检验标本确定模块,进一步配置为用于:
基于所述检验名称解析关于检验标本名称的信息;
结合所述检验项目,基于预设规则提取所述检验名称所包含的检验标本名称。
9.医学数据的处理方法,包括:
获取包含原始检验信息的原始医学数据,所述原始检验信息包括原始检验名称和原始检验项目;
解析所述原始检验名称;
在解析到所述原始检验名称包含有关于检验项目的信息的情况下,至少基于所述原始检验名称和解析到的关于检验项目的信息,得到检验标本名称。
10.一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,实现:
根据权利要求1至6中任一项所述的医学数据的处理方法;或者
根据权利要求9所述的医学数据的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011477566.5A CN112434528A (zh) | 2020-12-15 | 2020-12-15 | 医学数据的处理方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011477566.5A CN112434528A (zh) | 2020-12-15 | 2020-12-15 | 医学数据的处理方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112434528A true CN112434528A (zh) | 2021-03-02 |
Family
ID=74692657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011477566.5A Withdrawn CN112434528A (zh) | 2020-12-15 | 2020-12-15 | 医学数据的处理方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112434528A (zh) |
-
2020
- 2020-12-15 CN CN202011477566.5A patent/CN112434528A/zh not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108831559B (zh) | 一种中文电子病历文本分析方法与系统 | |
CN111144210B (zh) | 图像的结构化处理方法及装置、存储介质及电子设备 | |
CN107451068A (zh) | 用例运行方法、装置、计算设备及存储介质 | |
CN113808758B (zh) | 一种检验数据标准化的方法、装置、电子设备和存储介质 | |
CN112560400B (zh) | 医学数据的处理方法、装置及存储介质 | |
CN109299467B (zh) | 医学文本识别方法及装置、语句识别模型训练方法及装置 | |
CN111444718A (zh) | 一种保险产品需求文档处理方法、装置及电子设备 | |
CN113139365A (zh) | 临床试验受试者招募方法及设备 | |
CN113435200A (zh) | 实体识别模型训练、电子病历处理方法、系统及设备 | |
CN112749277B (zh) | 医学数据的处理方法、装置及存储介质 | |
CN111341405B (zh) | 医用数据处理系统及方法 | |
CN114141325A (zh) | 一种面向医学实验室的医学检验报告单智能解读管理平台 | |
CN112434511A (zh) | 医学数据的处理方法、装置及存储介质 | |
CN112434528A (zh) | 医学数据的处理方法、装置及存储介质 | |
CN113962197A (zh) | 医疗化验单标准化方法、装置、电子设备及存储介质 | |
CN112434529A (zh) | 医学数据的处理方法、装置及存储介质 | |
US20220122694A1 (en) | Systems and methods for smart testing of genetic materials | |
CN112712868A (zh) | 医学数据的分析方法、装置及存储介质 | |
CN115344665A (zh) | 病案文本的处理方法和装置、电子设备以及计算机可读存储介质 | |
CN113869124A (zh) | 基于深度学习的血细胞形态学分类方法及系统 | |
CN111007268A (zh) | 一种酶标仪检测板有效性的检测方法 | |
US20220034919A1 (en) | System and Method of Automatically Preparing and Analyzing Urine Samples for Identifying Cancer Cells | |
CN113722421A (zh) | 一种合同审计方法和系统,及计算机可读存储介质 | |
CN108983994B (zh) | 一种lims系统中海洋生物鉴定智能输入和标准化输出系统 | |
EP4297039A1 (en) | Data processing method, device and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210302 |