CN116364296A - 标准检查项目名称确认方法、装置、设备、介质及产品 - Google Patents
标准检查项目名称确认方法、装置、设备、介质及产品 Download PDFInfo
- Publication number
- CN116364296A CN116364296A CN202310179714.2A CN202310179714A CN116364296A CN 116364296 A CN116364296 A CN 116364296A CN 202310179714 A CN202310179714 A CN 202310179714A CN 116364296 A CN116364296 A CN 116364296A
- Authority
- CN
- China
- Prior art keywords
- inspection
- item name
- inspection item
- standard
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007689 inspection Methods 0.000 title claims abstract description 396
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000012790 confirmation Methods 0.000 title claims abstract description 8
- 238000013145 classification model Methods 0.000 claims abstract description 24
- 238000012549 training Methods 0.000 claims description 26
- 238000010200 validation analysis Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 101100153581 Bacillus anthracis topX gene Proteins 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- 101150041570 TOP1 gene Proteins 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 210000001015 abdomen Anatomy 0.000 description 1
- 230000003187 abdominal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000000941 bile Anatomy 0.000 description 1
- 210000000013 bile duct Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 208000016644 chronic atrophic gastritis Diseases 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 208000000718 duodenal ulcer Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开是关于一种标准检查项目名称确认方法、装置、设备、介质及产品,包括:将待标准化的检查项目名称数据输入到预训练的多分类模型中,获取预测标准检查项目名称的概率值,检查项目名称数据包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据;当概率值低于预设阈值时,将待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,获取预测标准检查项目名称候选集;基于预测标准检查项目名称候选集,获取待标准化的检查项目名称数据的标准检查项目名称,本申请通过多分类模型进行标准检查项目名称预测,对于不符合阈值,利用多维度的规则模型加权预测,获取标准检查项目名称。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种标准检查项目名称确认方法、装置、设备、介质及产品。
背景技术
在医院的数据治理过程中,对于来自PACS系统中的检查数据,其检查项目名称没有统一的规范标准,因此存在各式各样的写法。考虑到不同的检查报告其书写内容有很大的差别,所以需要对不同的检查报告的项目名称进行标准化,然后根据具体的标准化后的检查,再次进行后续的数据后结构化治理工作。
因此在对检查报告数据进行治理时,首先需要治理的就是检查名称的标准化工作,针对类似的术语名称标准化目前有几种方式,第一种是人工方式,根据提供的真实数据,通过专业人员,依据专业知识来进行判断;第二种是基于人工整理的数据标准化规则,通过开发人员进行规则开发,来预测判断术语的标准化;第三种是基于文本之间的相似度,利于深度学习算法来构建词向量信息,来计算待标准化文本与标准化名称之间的相似度,根据相似度值选择相似度值结果最高的作为标准名称。
目前现有的技术,通过人工判断来构建同义词词典,耗费时间较长,同时对于不再词典中的对应关系,则不能找到具体的标准实体,会漏掉部分标准化的检查项目。对于涉及到人工整理的规则,则需要人工浏览大量的数据,耗时耗力,而且对于同一个检查标准化,因为涉及到的文本内容较多,如果设定的规则较多,还容易出现规则冲突情况;对于使用者深度学习算法,计算待标准化检查项目名称和标准项目名称集合之间的相似度方法,该方法思路很好,但是也存在一定的局限性,就是医疗数据的不像开放域数据那样容易获得,因此,在使用文本相似度方法在处理医疗领域数据标准化时取得的效果不佳。
发明内容
为克服相关技术中存在的问题,本公开提供一种标准检查项目名称确认方法、装置、设备、介质及产品。
根据本公开实施例的第一方面,提供一种标准检查项目名称确认方法,包括:
将待标准化的检查项目名称数据输入到预训练的多分类模型中,获取预测标准检查项目名称的概率值,所述检查项目名称数据包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据;
当所述概率值低于预设阈值时,将所述待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,获取预测标准检查项目名称候选集;
基于所述预测标准检查项目名称候选集,获取所述待标准化的检查项目名称数据的标准检查项目名称;
其中,所述多维度规则匹配模型基于如下方式预先训练好的:
获取多个训练样本的数据集,所述数据集包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据、标准检查项目名称;
以所述检查类型、所述检查项目名称和所述检查参数为特征,所述标准检查项目名称为标签,训练获取第一匹配模型;
以所述检查所见描述数据、所述检查结论描述数据为特征,所述标准检查项目名称为标签,训练获取第二匹配模型;
对所述第一匹配模型和所述第二匹配模型赋权,获取所述多维度规则匹配模型。
在一些实施例中,多分类模型是通过如下方式训练的,包括:
获取多个训练样本的数据集,所述数据集包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据、标准检查项目名称;
以所述检查类型、所述检查项目名称、所述检查参数、所述检查所见描述数据及所述检查结论描述数据为特征,所述标准检查项目名称为标签,训练获取所述多分类模型。
在一些实施例中,还包括:
当所述概率值高于预设阈值时,将所述预测标准检查项目名称输出为所述标准检查项目名称。
在一些实施例中,基于所述预测标准检查项目名称候选集,获取所述待标准化的检查项目名称数据的标准检查项目名称,包括:
筛选出所述预测标准检查项目名称候选集中权重最高的预测标准检查项目名称,将所述权重最高的预测标准检查项目名称输出为所述标准检查项目名称。
根据本公开实施例的第二方面,提供一种标准检查项目名称确认装置,包括:
第一输入模块,用于将待标准化的检查项目名称数据输入到预训练的多分类模型中,获取预测标准检查项目名称的概率值,所述检查项目名称数据包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据;
第二输入模块,用于当所述概率值低于预设阈值时,将所述待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,获取预测标准检查项目名称候选集;
获取模块,基于所述预测标准检查项目名称候选集,获取所述待标准化的检查项目名称数据的标准检查项目名称;
其中,所述多维度规则匹配模型基于如下方式预先训练好的:
获取多个训练样本的数据集,所述数据集包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据、标准检查项目名称;
以所述检查类型、所述检查项目名称和所述检查参数为特征,所述标准检查项目名称为标签,训练获取第一匹配模型;
以所述检查所见描述数据、所述检查结论描述数据为特征,所述标准检查项目名称为标签,训练获取第二匹配模型;
对所述第一匹配模型和所述第二匹配模型赋权,获取所述多维度规则匹配模型。
在一些实施例中,还包括:
第一输出模块,用于当所述概率值高于预设阈值时,将所述预测标准检查项目名称输出为所述标准检查项目名称。
在一些实施例中,还包括:
第二输出模块,用于筛选出所述预测标准检查项目名称候选集中权重最高的预测标准检查项目名称,将所述权重最高的预测标准检查项目名称输出为所述标准检查项目名称。
本申请第三方面的实施例提供了一种电子设备,包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现本申请上述的第一方面的实施例所提供的标准检查项目名称确认方法的步骤。
本申请第四方面的实施例提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行时实现本申请上述的第一方面的实施例所提供的标准检查项目名称确认方法的步骤。
本申请第五方面的实施例提供了一种计算机程序产品,当所述计算机程序产品中的指令由移动终端的处理器执行时,使得移动终端能够执行实现本申请上述的第一方面的实施例所提供的标准检查项目名称确认方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:本申请将待标准化的检查项目名称数据输入到多分类模型中,其预测结果达到指定阈值后的结果,能够精准的输出标准检查项目名称,若预测结果达不到指定阈值后,可以将该待标准化的检查项目名称数据输入到多维度规则匹配模型中加权进行候选集预测,选取候选集中top1作为标准检查项目名称的输出,对不符合阈值的预测结果也能够精准的输出标准检查项目名称。该种方式不需要像深度学习算法那样需要大量的临床数据数据构建词向量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种标准检查项目名称确认方法的流程图。
图2是根据一示例性实施例示出的一种标准检查项目名称确认装置的框图。
图3是根据一示例性实施例示出的一种电子设备的内部结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种标准检查项目名称确认方法的流程图,如图1所示,包括以下步骤:
S101,将待标准化的检查项目名称数据输入到预训练的多分类模型中,获取预测标准检查项目名称的概率值,所述检查项目名称数据包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据。
具体的,通过将待标准化的检查项目名称数据输入到预训练的多分类模型中,获取预测标准检查项目名称的概率值,而该概率值为0-1之间。
其中,检查类别名称,一般是指检查所属类别,如“B超”,“CT”,“核磁报告”,“超声”,“X线”等;
检查项目名称,是指的具体检查名称,理论上应该包括了检查类型检查部位以及检查的参数信息,而医生在实际上很少按照此标准来书写,例如“胸部CT检查”,通常医生会写成“腹腔CT”。
检查参数,一般包括检查的部位,“头部”、“胸部”、“腹部”、“左腿”等等;
检查所见描述数据,是指在检查过程中,所见、测量等结果,如“检查所见肝脏形态大小正常,肝实质内可见多发圆片状低密度影,肝内外胆管无扩涨,胆囊状行态密度正常”。
检查结论描述数据,是指根据检查仪器所产生的结果,所见及测量结果所得的结论性描述,如“慢性萎缩性胃炎伴糜烂,胃窦胃角为主,十二指肠溃疡A1期,建议治疗后复查”。
在一些实施例中,多分类模型是通过如下方式训练的,包括:
获取多个训练样本的数据集,所述数据集包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据、标准检查项目名称;
以所述检查类型、所述检查项目名称、所述检查参数、所述检查所见描述数据及所述检查结论描述数据为特征,所述标准检查项目名称为标签,训练获取所述多分类模型。
具体的,通过多个包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据、标准检查项目名称的数据集作为样本,以检查类型、检查项目名称、检查参数、检查所见描述数据及检查结论描述数据为特征,标准检查项目名称为标签,训练获取多分类模型,当将待标准化的检查项目名称数据输入到预训练的多分类模型中时,会输出预测标准检查项目名称的概率值,例如输出“胸部CT检查”的概率为“0.9”。
S102,当所述概率值低于预设阈值时,将所述待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,获取预测标准检查项目名称候选集。
具体的,当输出的预测标准检查项目名称的概率值(例如为0.75)低于预设阈值(例如预设阈值为0.8),则表明此时预测的标准检查项目名称可能存在误差,需要将待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,进行重新预测,通过将该待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,会获取预测标准检查项目名称候选集,例如包括“胸部CT检查”,“胸部核磁共振检查”,“胸部彩超”。其中,多维度规则匹配模型基于如下方式预先训练好的:
获取多个训练样本的数据集,所述数据集包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据、标准检查项目名称;
以所述检查类型、所述检查项目名称和所述检查参数为特征,所述标准检查项目名称为标签,训练获取第一匹配模型;
以所述检查所见描述数据、所述检查结论描述数据为特征,所述标准检查项目名称为标签,训练获取第二匹配模型;
对所述第一匹配模型和所述第二匹配模型赋权,获取所述多维度规则匹配模型。
S103,基于所述预测标准检查项目名称候选集,获取所述待标准化的检查项目名称数据的标准检查项目名称。
具体的,当通过将待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中时会获取一组标准检查项目名称候选集,从标准检查项目名称候选集中获取标准检查项目名称。
在一些实施例中,基于所述预测标准检查项目名称候选集,获取所述待标准化的检查项目名称数据的标准检查项目名称,包括:
筛选出所述预测标准检查项目名称候选集中权重最高的预测标准检查项目名称,将所述权重最高的预测标准检查项目名称输出为所述标准检查项目名称。
具体的,由于多维度规则匹配模型是通过第一匹配模型和第二匹配模型加权获取的,因此在获取预测标准检查项目名称候选集时是通过将待标准化的检查项目名称数据输入到第一匹配模型中获取候选集1,输入到第二匹配模型中获取候选集2,然后最终候选集=候选集1*权重1+候选集2*权重2,从而获取最终的预测标准检查项目名称候选集。结合具体实施例,若最终的预测标准检查项目名称候选集包括,“胸部CT检查”的权值为0.9,“胸部核磁共振检查”的权值为0.6,“胸部彩超”的权值为0.5,则将“胸部CT检查”输出为所述标准检查项目名称。
在一些实施例中,还包括,当所述概率值高于预设阈值时,将所述预测标准检查项目名称输出为所述标准检查项目名称。
具体的,若当输出的预测标准检查项目名称的概率值(例如为0.9)高于预设阈值(例如预设阈值为0.8),则直接预测标准检查项目名称输出为标准检查项目名称。例如“胸部CT检查”的概率为“0.9”。则直接输出“胸部CT检查”为标准检查项目名称。
为了进一步阐述本发明的技术思想,现结合具体的应用场景,对本发明的技术方案进行说明。
1)首先收集现有的带有检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据,标准检查项目名称的数据集;
2)利用1)中的检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据作为特征,标准检查项目名称作为分类标签,训练一个多分类模型;
3)利用1)中的检查类型、检查项目名称、检查参数作为特征,标准检查项目名称作为分类标签,构建第一匹配模型;
4)利用1)中的检查所见描述数据、检查结论描述数据,利用NLP技术进行实体抽取;
5)利用4)中的所获得的实体抽取结果为特征,标准检查项目名称作为分类标签,构建第二匹配模型;
6)对于输入新的待标准化的检查项目名称数据(包括了检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据),利用2)中的多分类模型进行检查项目预测,得到预测的概率值;
7)根据多分类模型预测分类结果的概率值,与提前设定好的阈值相比,如果预测概率值大于阈值,则输出该预测的标准检查项目名称,如果小于该阈值则需要进行下一步的处理;8)对于小于阈值的预测标准检查项目名称输入到多维度规则匹配模型中,,即将待标准化的检查项目名称数据中的检查类型、检查项目名称、检查参数输入到3)中的第一匹配模型中,给出标准名称候选集1;
9)将待标准化的检查项目名称数据中的检查所见描述数据、检查结论描述数据进行实体抽取,将抽取后的结果输入到4)中的第二匹配模型中,给出标准名称候选集2;
10)将8)和9)中的候选集1和候选集2,分别进行权重1和权重2的加权,通过下面计算方式获取到最后的候选集,最终候选集=候选集1*权重1+候选集2*权重2,将最终候选集中预测结果中的权值top1作为标准检查项目名称。
11)完成最终的检查项目名称预测。
图2是根据一示例性实施例示出的一种标准检查项目名称确认装置框图。参照图2,该装置包括第一输入模块201,第二输入模块202和获取模块203。
第一输入模块201,用于将待标准化的检查项目名称数据输入到预训练的多分类模型中,获取预测标准检查项目名称的概率值,所述检查项目名称数据包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据;
第二输入模块202,用于当所述概率值低于预设阈值时,将所述待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,获取预测标准检查项目名称候选集;
获取模块203,基于所述预测标准检查项目名称候选集,获取所述待标准化的检查项目名称数据的标准检查项目名称;
其中,所述多维度规则匹配模型基于如下方式预先训练好的:
获取多个训练样本的数据集,所述数据集包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据、标准检查项目名称;
以所述检查类型、所述检查项目名称和所述检查参数为特征,所述标准检查项目名称为标签,训练获取第一匹配模型;
以所述检查所见描述数据、所述检查结论描述数据为特征,所述标准检查项目名称为标签,训练获取第二匹配模型;
对所述第一匹配模型和所述第二匹配模型赋权,获取所述多维度规则匹配模型。
在一些实施例中,还包括:
第一输出模块,用于当所述概率值高于预设阈值时,将所述预测标准检查项目名称输出为所述标准检查项目名称。
在一些实施例中,还包括:
第二输出模块,用于筛选出所述预测标准检查项目名称候选集中权重最高的预测标准检查项目名称,将所述权重最高的预测标准检查项目名称输出为所述标准检查项目名称。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
在一个实施例中,提供了一种电子设备,该电子设备可以是终端,其内部结构图可以如图3所示。该电子设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、近场通信(NFC)或其他技术实现。该计算机程序被处理器执行时以实现一种标准检查项目名称确认方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的标准检查项目名称确认装置可以实现为一种计算机程序的形式,计算机程序可在如图3所示的电子设备上运行。电子设备的存储器中可存储组成该标准检查项目名称确认装置的各个程序模块。
该电子设备中的存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现根据上述任意一个实施例所述的标准检查项目名称确认方法。例如实现标准检查项目名称确认方法,包括:将待标准化的检查项目名称数据输入到预训练的多分类模型中,获取预测标准检查项目名称的概率值,所述检查项目名称数据包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据;当所述概率值低于预设阈值时,将所述待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,获取预测标准检查项目名称候选集;基于所述预测标准检查项目名称候选集,获取所述待标准化的检查项目名称数据的标准检查项目名称。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:将待标准化的检查项目名称数据输入到预训练的多分类模型中,获取预测标准检查项目名称的概率值,所述检查项目名称数据包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据;当所述概率值低于预设阈值时,将所述待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,获取预测标准检查项目名称候选集;基于所述预测标准检查项目名称候选集,获取所述待标准化的检查项目名称数据的标准检查项目名称。
在一个实施例中,提供了一种计算机程序产品,当计算机程序产品中的指令由移动终端的处理器执行时,使得移动终端能够执行以下步骤:将待标准化的检查项目名称数据输入到预训练的多分类模型中,获取预测标准检查项目名称的概率值,所述检查项目名称数据包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据;当所述概率值低于预设阈值时,将所述待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,获取预测标准检查项目名称候选集;基于所述预测标准检查项目名称候选集,获取所述待标准化的检查项目名称数据的标准检查项目名称。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成的,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,比如静态随机存取存储器(Static Random Access Memory,SRAM)和动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个的技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种标准检查项目名称确认方法,其特征在于,包括:
将待标准化的检查项目名称数据输入到预训练的多分类模型中,获取预测标准检查项目名称的概率值,所述检查项目名称数据包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据;
当所述概率值低于预设阈值时,将所述待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,获取预测标准检查项目名称候选集;
基于所述预测标准检查项目名称候选集,获取所述待标准化的检查项目名称数据的标准检查项目名称;
其中,所述多维度规则匹配模型基于如下方式预先训练好的:
获取多个训练样本的数据集,所述数据集包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据、标准检查项目名称;
以所述检查类型、所述检查项目名称和所述检查参数为特征,所述标准检查项目名称为标签,训练获取第一匹配模型;
以所述检查所见描述数据、所述检查结论描述数据为特征,所述标准检查项目名称为标签,训练获取第二匹配模型;
对所述第一匹配模型和所述第二匹配模型赋权,获取所述多维度规则匹配模型。
2.如权利要求1所述的标准检查项目名称确认方法,其特征在于,多分类模型是通过如下方式训练的,包括:
获取多个训练样本的数据集,所述数据集包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据、标准检查项目名称;
以所述检查类型、所述检查项目名称、所述检查参数、所述检查所见描述数据及所述检查结论描述数据为特征,所述标准检查项目名称为标签,训练获取所述多分类模型。
3.如权利要求1所述的标准检查项目名称确认方法,其特征在于,还包括:
当所述概率值高于预设阈值时,将所述预测标准检查项目名称输出为所述标准检查项目名称。
4.如权利要求1所述的标准检查项目名称确认方法,其特征在于,基于所述预测标准检查项目名称候选集,获取所述待标准化的检查项目名称数据的标准检查项目名称,包括:
筛选出所述预测标准检查项目名称候选集中权重最高的预测标准检查项目名称,将所述权重最高的预测标准检查项目名称输出为所述标准检查项目名称。
5.一种标准检查项目名称确认装置,其特征在于,包括:
第一输入模块,用于将待标准化的检查项目名称数据输入到预训练的多分类模型中,获取预测标准检查项目名称的概率值,所述检查项目名称数据包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据;
第二输入模块,用于当所述概率值低于预设阈值时,将所述待标准化的检查项目名称数据输入到预训练的多维度规则匹配模型中,获取预测标准检查项目名称候选集;
获取模块,基于所述预测标准检查项目名称候选集,获取所述待标准化的检查项目名称数据的标准检查项目名称;
其中,所述多维度规则匹配模型基于如下方式预先训练好的:
获取多个训练样本的数据集,所述数据集包括检查类型、检查项目名称、检查参数、检查所见描述数据、检查结论描述数据、标准检查项目名称;
以所述检查类型、所述检查项目名称和所述检查参数为特征,所述标准检查项目名称为标签,训练获取第一匹配模型;
以所述检查所见描述数据、所述检查结论描述数据为特征,所述标准检查项目名称为标签,训练获取第二匹配模型;
对所述第一匹配模型和所述第二匹配模型赋权,获取所述多维度规则匹配模型。
6.如权利要求1所述的标准检查项目名称确认装置,其特征在于,还包括:
第一输出模块,用于当所述概率值高于预设阈值时,将所述预测标准检查项目名称输出为所述标准检查项目名称。
7.如权利要求1所述的标准检查项目名称确认装置,其特征在于,还包括:
第二输出模块,用于筛选出所述预测标准检查项目名称候选集中权重最高的预测标准检查项目名称,将所述权重最高的预测标准检查项目名称输出为所述标准检查项目名称。
8.一种电子设备,其特征在于,包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现根据权利要求1-4中任一所述的标准检查项目名称确认方法。
9.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行根据权利要求1-4中任一项所述的标准检查项目名称确认方法。
10.一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令由移动终端的处理器执行时,使得移动终端能够执行根据权利要求1-4中任一项所述的标准检查项目名称确认方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310179714.2A CN116364296B (zh) | 2023-02-17 | 2023-02-17 | 标准检查项目名称确认方法、装置、设备、介质及产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310179714.2A CN116364296B (zh) | 2023-02-17 | 2023-02-17 | 标准检查项目名称确认方法、装置、设备、介质及产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116364296A true CN116364296A (zh) | 2023-06-30 |
CN116364296B CN116364296B (zh) | 2023-12-26 |
Family
ID=86911436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310179714.2A Active CN116364296B (zh) | 2023-02-17 | 2023-02-17 | 标准检查项目名称确认方法、装置、设备、介质及产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116364296B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190287018A1 (en) * | 2018-03-19 | 2019-09-19 | YourAnswer International Pty Ltd. | Categorization for a global taxonomy |
CN110956253A (zh) * | 2018-09-26 | 2020-04-03 | 微软技术许可有限责任公司 | 针对头衔标准化的与语言无关的机器学习模型 |
CN111259144A (zh) * | 2020-01-16 | 2020-06-09 | 中国平安人寿保险股份有限公司 | 多模型融合文本匹配方法、装置、设备和存储介质 |
CN111552890A (zh) * | 2020-04-30 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 基于名称预测模型的名称信息处理方法、装置、电子设备 |
CN111694823A (zh) * | 2020-05-15 | 2020-09-22 | 平安科技(深圳)有限公司 | 机构标准化方法、装置、电子设备及存储介质 |
CN111816319A (zh) * | 2020-07-16 | 2020-10-23 | 山东大学 | 逐步筛选的泌尿系统重疾指标确定方法及风险预测系统 |
CN112287089A (zh) * | 2020-11-23 | 2021-01-29 | 腾讯科技(深圳)有限公司 | 用于自动问答系统的分类模型训练、自动问答方法及装置 |
CN112420150A (zh) * | 2020-12-02 | 2021-02-26 | 沈阳东软智能医疗科技研究院有限公司 | 医学影像报告的处理方法、装置、存储介质及电子设备 |
CN112818691A (zh) * | 2021-02-01 | 2021-05-18 | 北京金山数字娱乐科技有限公司 | 命名实体识别模型训练方法及装置 |
CN114036929A (zh) * | 2021-11-22 | 2022-02-11 | 江苏科技大学 | 一种基于多模型特征融合的全简称匹配的方法 |
WO2022041730A1 (zh) * | 2020-08-28 | 2022-03-03 | 康键信息技术(深圳)有限公司 | 医疗领域意图识别方法、装置、设备及存储介质 |
WO2022041728A1 (zh) * | 2020-08-28 | 2022-03-03 | 康键信息技术(深圳)有限公司 | 医学领域意图识别方法、装置、设备及存储介质 |
CN114186070A (zh) * | 2021-12-08 | 2022-03-15 | 上海柯林布瑞信息技术有限公司 | 基于人工智能模型的医学术语归一化方法、装置 |
WO2022206599A1 (zh) * | 2021-04-02 | 2022-10-06 | 北京京东拓先科技有限公司 | 分诊方法及装置、计算机可存储介质 |
CN115358233A (zh) * | 2022-07-06 | 2022-11-18 | 中国科学院自动化研究所 | 语言命名实体识别方法、语言识别装置、电子设备及介质 |
-
2023
- 2023-02-17 CN CN202310179714.2A patent/CN116364296B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190287018A1 (en) * | 2018-03-19 | 2019-09-19 | YourAnswer International Pty Ltd. | Categorization for a global taxonomy |
CN110956253A (zh) * | 2018-09-26 | 2020-04-03 | 微软技术许可有限责任公司 | 针对头衔标准化的与语言无关的机器学习模型 |
CN111259144A (zh) * | 2020-01-16 | 2020-06-09 | 中国平安人寿保险股份有限公司 | 多模型融合文本匹配方法、装置、设备和存储介质 |
CN111552890A (zh) * | 2020-04-30 | 2020-08-18 | 腾讯科技(深圳)有限公司 | 基于名称预测模型的名称信息处理方法、装置、电子设备 |
CN111694823A (zh) * | 2020-05-15 | 2020-09-22 | 平安科技(深圳)有限公司 | 机构标准化方法、装置、电子设备及存储介质 |
CN111816319A (zh) * | 2020-07-16 | 2020-10-23 | 山东大学 | 逐步筛选的泌尿系统重疾指标确定方法及风险预测系统 |
WO2022041730A1 (zh) * | 2020-08-28 | 2022-03-03 | 康键信息技术(深圳)有限公司 | 医疗领域意图识别方法、装置、设备及存储介质 |
WO2022041728A1 (zh) * | 2020-08-28 | 2022-03-03 | 康键信息技术(深圳)有限公司 | 医学领域意图识别方法、装置、设备及存储介质 |
CN112287089A (zh) * | 2020-11-23 | 2021-01-29 | 腾讯科技(深圳)有限公司 | 用于自动问答系统的分类模型训练、自动问答方法及装置 |
CN112420150A (zh) * | 2020-12-02 | 2021-02-26 | 沈阳东软智能医疗科技研究院有限公司 | 医学影像报告的处理方法、装置、存储介质及电子设备 |
CN112818691A (zh) * | 2021-02-01 | 2021-05-18 | 北京金山数字娱乐科技有限公司 | 命名实体识别模型训练方法及装置 |
WO2022206599A1 (zh) * | 2021-04-02 | 2022-10-06 | 北京京东拓先科技有限公司 | 分诊方法及装置、计算机可存储介质 |
CN114036929A (zh) * | 2021-11-22 | 2022-02-11 | 江苏科技大学 | 一种基于多模型特征融合的全简称匹配的方法 |
CN114186070A (zh) * | 2021-12-08 | 2022-03-15 | 上海柯林布瑞信息技术有限公司 | 基于人工智能模型的医学术语归一化方法、装置 |
CN115358233A (zh) * | 2022-07-06 | 2022-11-18 | 中国科学院自动化研究所 | 语言命名实体识别方法、语言识别装置、电子设备及介质 |
Non-Patent Citations (2)
Title |
---|
丁玥;王涓;卢卫;荣垂田;杜小勇;: "面向多源关系数据的融合", 中国科学:信息科学, no. 05 * |
赵青;王丹;徐书世;张晓桐;王晓曦;: "中文医疗实体的弱监督识别方法", 哈尔滨工程大学学报, no. 03 * |
Also Published As
Publication number | Publication date |
---|---|
CN116364296B (zh) | 2023-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101405695B (zh) | 启用图形设计器重用的声明性定义 | |
CN107729532A (zh) | 一种简历匹配方法及计算设备 | |
CN112860841B (zh) | 一种文本情感分析方法、装置、设备及存储介质 | |
CN112863683B (zh) | 基于人工智能的病历质控方法、装置、计算机设备及存储介质 | |
CN110797101B (zh) | 医学数据处理方法、装置、可读存储介质和计算机设备 | |
US11468989B2 (en) | Machine-aided dialog system and medical condition inquiry apparatus and method | |
CN110222330B (zh) | 语义识别方法及装置、存储介质、计算机设备 | |
CN112257578B (zh) | 人脸关键点检测方法、装置、电子设备及存储介质 | |
US20220059200A1 (en) | Deep-learning systems and methods for medical report generation and anomaly detection | |
CN117290694B (zh) | 问答系统评估方法、装置、计算设备及存储介质 | |
WO2020049404A2 (en) | Visualization of social determinants of health | |
CN111611390B (zh) | 一种数据处理方法及装置 | |
CN115409111A (zh) | 命名实体识别模型的训练方法和命名实体识别方法 | |
CN116364296B (zh) | 标准检查项目名称确认方法、装置、设备、介质及产品 | |
CN111062193B (zh) | 医疗数据标注方法及装置、存储介质、电子设备 | |
CN117332766A (zh) | 流程图生成方法、装置、计算机设备和存储介质 | |
CN115827877B (zh) | 一种提案辅助并案的方法、装置、计算机设备和存储介质 | |
US20160217393A1 (en) | Information extraction | |
CN108229572B (zh) | 一种参数寻优方法及计算设备 | |
CN115952266A (zh) | 问题生成方法、装置、计算机设备和存储介质 | |
Hong et al. | Reverse designs of doubly reinforced concrete beams using Gaussian process regression models enhanced by sequence training/designing technique based on feature selection algorithms | |
Loy et al. | Are you normal? the problem of confounded residual structures in hierarchical linear models | |
US20230162046A1 (en) | Method and system for anomaly detection and report generation | |
CN112528500B (zh) | 一种场景图构造模型的评估方法及评估设备 | |
CN111444170B (zh) | 基于预测业务场景的自动机器学习方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |