CN118471423A - 医疗影像报告质控方法、装置、设备及介质 - Google Patents
医疗影像报告质控方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN118471423A CN118471423A CN202410597966.1A CN202410597966A CN118471423A CN 118471423 A CN118471423 A CN 118471423A CN 202410597966 A CN202410597966 A CN 202410597966A CN 118471423 A CN118471423 A CN 118471423A
- Authority
- CN
- China
- Prior art keywords
- disease
- description information
- inspected
- medical
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003908 quality control method Methods 0.000 title claims abstract description 29
- 201000010099 disease Diseases 0.000 claims abstract description 340
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 340
- 239000013598 vector Substances 0.000 claims abstract description 183
- 238000007689 inspection Methods 0.000 claims abstract description 101
- 238000012937 correction Methods 0.000 claims abstract description 35
- 230000015654 memory Effects 0.000 claims description 21
- 238000000034 method Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 230000004927 fusion Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 238000013135 deep learning Methods 0.000 abstract description 4
- 230000006872 improvement Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 9
- 206010005963 Bone formation increased Diseases 0.000 description 6
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 5
- 201000005202 lung cancer Diseases 0.000 description 5
- 208000020816 lung neoplasm Diseases 0.000 description 5
- 230000005786 degenerative changes Effects 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000024121 nodulation Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 210000002517 zygapophyseal joint Anatomy 0.000 description 3
- 208000031481 Pathologic Constriction Diseases 0.000 description 2
- 208000037919 acquired disease Diseases 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 201000010934 exostosis Diseases 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 201000010930 hyperostosis Diseases 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000036262 stenosis Effects 0.000 description 2
- 208000037804 stenosis Diseases 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 208000035977 Rare disease Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- Bioethics (AREA)
- Biomedical Technology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Computer Hardware Design (AREA)
- Multimedia (AREA)
- Computer Security & Cryptography (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请公开了一种基于模型知识增强的医疗影像报告质控方法、装置、设备及介质。利用预先构建的医疗数据库,将疾病实体的字符向量与预测疾病名称进行匹配,并获取相应的影像描述信息,以通过该影像描述信息进行知识增强,为后续模型确定待质检描述信息以及检查结论是否一致提供知识基础。通过预先训练的纠错模型,结合检查结论、待质检描述信息和预测疾病名称对应的影像描述信息,确定待质检医疗影像报告的质检结果。这种基于深度学习的纠错模型能够自动识别和纠正报告中的错误和不一致之处,提高了质检的准确性和客观性。同时,质检结果可以清晰地指示检查结论与待质检描述信息是否一致,为医疗影像报告的质量管理和改进提供了有力的支持。
Description
技术领域
本申请涉及数字信号处理及深度学习技术领域,尤其涉及一种基于模型知识增强的医疗影像报告质控方法、装置、设备及介质。
背景技术
在现代医疗领域,医学影像报告作为一种重要的诊断工具,它的准确性对于疾病的诊断和治疗计划的制定至关重要。随着医学技术的发展,人工智能在医学影像报告的质量控制上开始发挥越来越重要的作用。尽管如此,现有技术在提高检查所见和检查结论一致性的准确率方面仍存在不足。
为了解决这一问题,相关技术中提供了一种基于人工智能技术的医学影像报告质控系统。该系统主要包括以下几个模块:报告获取与语料制作模块、检错模型构建模块、检错模块、纠错模型构建模块、纠错模块以及提醒模块。报告获取与语料制作模块负责按照预设规则批量抽样各种原始医学影像报告,并对这些报告进行特征分析和数据处理,最终制作成报告语料库。检错模型构建模块用于预先搭建多个并行的检错模型。这些模型会接收处理过的报告语料库作为输入,通过训练学习影像报告的规律,从而获得能够准确检测错误的检错模型。检错模块负责对需要质量检查的影像报告进行数据处理,并将处理后的报告送入已训练好的检错模型中进行错误预测,最后输出可能的错误词汇。纠错模型构建模块在检错模型的基础上加入纠错算法,进一步训练出多个纠错模型。纠错模块将待检查的报告输入到训练好的纠错模型中,输出包含可能错误词汇及其纠正建议的综合错词集。提醒模块针对症状词、方位词和内容冲突词提供提醒信息,帮助用户注意到报告中可能存在的问题。这些模块通过对医学影像报告的批量抽样、特征分析、错误检测和错误纠正等步骤,旨在提高医学影像报告的准确率和可靠性。然而,尽管上述系统能够有效地识别和纠正影像报告中的内部错误,例如拼写错误、术语使用不当等,但它们往往无法准确判断影像学描述与诊断名称之间的一致性。
基于此,如何进一步提高检查所见和检查结论一致性的准确率是一个亟待解决的问题。
发明内容
本申请提供了一种基于模型知识增强的医疗影像报告质控方法、装置、设备及介质,用于解决现有无法准确判断影像学描述与诊断名称之间的一致性的问题。
第一方面,本申请提供了一种基于模型知识增强的医疗影像报告质控方法,所述方法包括:
获取待质检医疗影像报告的待质检描述信息、以及所述待质检医疗影像报告对应的检查结论中包含的疾病实体;
从预先构建的医疗数据库中,确定所述疾病实体的字符向量所对应的预测疾病名称、以及所述预测疾病名称对应的影像描述信息;其中,所述医疗数据库包括各疾病名称、所述各疾病名称分别对应的字符向量、所述各疾病名称分别对应的影像描述信息;
通过预先训练的纠错模型,基于所述检查结论、所述待质检描述信息以及所述预测疾病名称对应的影像描述信息,确定所述待质检医疗影像报告的质检结果;其中,所述质检结果用于指示所述检查结论与所述待质检描述信息是否一致。
第二方面,本申请还提供了一种基于模型知识增强的医疗影像报告质控装置,所述装置包括:
获取单元,用于获取待质检医疗影像报告的待质检描述信息、以及所述待质检医疗影像报告对应的检查结论中包含的疾病实体;
确定单元,用于从预先构建的医疗数据库中,确定所述疾病实体的字符向量所对应的预测疾病名称、以及所述预测疾病名称对应的影像描述信息;其中,所述医疗数据库包括各疾病名称、所述各疾病名称分别对应的字符向量、所述各疾病名称分别对应的影像描述信息;
处理单元,用于通过预先训练的纠错模型,基于所述检查结论、所述待质检描述信息以及所述预测疾病名称对应的影像描述信息,确定所述待质检医疗影像报告的质检结果;其中,所述质检结果用于指示所述检查结论与所述待质检描述信息是否一致。
第三方面,本申请提供了一种计算机设备,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述所述基于模型知识增强的医疗影像报告质控方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述基于模型知识增强的医疗影像报告质控方法的步骤。
本申请的有益效果如下:
1、通过获取待质检医疗影像报告的待质检描述信息和对应的检查结论中的疾病实体,这种方法有助于将关注点集中在医疗影像报告中的关键疾病信息上,显著提高质检的效率和准确性。
2、利用预先构建的医疗数据库,将疾病实体的字符向量与预测疾病名称进行匹配,并获取相应的影像描述信息,以通过该影像描述信息进行知识增强,为后续模型确定待质检描述信息以及检查结论是否一致提供知识基础。
3、通过预先训练的纠错模型,结合检查结论、待质检描述信息和预测疾病名称对应的影像描述信息,确定待质检医疗影像报告的质检结果。这种基于深度学习的纠错模型能够自动识别和纠正报告中的错误和不一致之处,提高了质检的准确性和客观性。同时,质检结果可以清晰地指示检查结论与待质检描述信息是否一致,为医疗影像报告的质量管理和改进提供了有力的支持。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种基于模型知识增强的医疗影像报告质控过程示意图;
图2为本申请实施例提供的具体的基于模型知识增强的医疗影像报告质控流程示意图;
图3为本申请实施例供的具体的基于模型知识增强的医疗影像报告质控流程的示例图;
图4为本申请实施例提供的一种基于模型知识增强的医疗影像报告质控装置的结构示意图;
图5是本申请可选实施例提供的一种计算机设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
为了进一步提高检查所见和检查结论一致性的准确率,本申请提供了一种基于模型知识增强的医疗影像报告质控方法方法、装置、设备及介质。
实施例1:
本申请提供了一种基于模型知识增强的医疗影像报告质控方法,图1为本申请实施例提供的一种基于模型知识增强的医疗影像报告质控过程示意图,该过程包括:
S101:获取待质检医疗影像报告的待质检描述信息、以及所述待质检医疗影像报告对应的检查结论中包含的疾病实体。
在本申请中,该基于模型知识增强的医疗影像报告质控方法应用于计算机设备,该计算机设备可以是智能终端,比如,电脑、机器人等,也可以是服务器,比如,应用服务器,业务服务器等。
医疗影像报告中的描述信息和基于该医疗影响报告确定的检查结论是医疗诊断的关键部分,它们必须正确地反映患者的状况,以便基于该状况对患者采取适当的治疗。基于此,在本申请中,可以对医疗影像报告的描述信息与该医疗影像报告对应的检查结论的一致性进行检查。示例的,可以获取需要进行质检的医疗影像报告(记为待质检医疗影像报告)的描述信息(记为待质检描述信息),这些描述信息可能包括病灶的大小、位置、形态等详细描述,是医生进行诊断的重要参考。同时还要获取该待质检医疗影像报告对应的检查结论。然后对该检查结论进行实体识别,获取该检查结论中包含的疾病实体。这些疾病实体可能涉及患者所患的具体病症、病理类型等关键信息。通过实体识别技术,我们可以准确地从检查结论中提取出这些关键信息,为后续的一致性检查提供基础。
值得注意的是,获取待质检医疗影像报告的描述信息和检查结论的方式有多种。一方面,我们可以直接从医疗信息系统中提取这些信息,这种方式效率高且准确度高。另一方面,也可以通过人工的方式录入这些信息,特别是在一些信息系统尚不完善的情况下。此外,实体识别的方法也多种多样,可以根据实际情况选择适合的实体识别模型或算法,如OCR(Optical Character Recognition,光学字符识别)算法等。当然,也可以通过人工标注的方式进行实体识别,虽然这种方式效率较低,但准确性相对较高。
S102:从预先构建的医疗数据库中,确定所述疾病实体的字符向量所对应的预测疾病名称、以及所述预测疾病名称对应的影像描述信息;其中,所述医疗数据库包括各疾病名称、所述各疾病名称分别对应的字符向量、所述各疾病名称分别对应的影像描述信息。
为了提高检查所见和检查结论一致性的准确率,在本申请中,可以构建一个综合性的医疗数据库,以通过该医疗数据库进行知识增强,为后续模型确定待质检描述信息以及检查结论是否一致提供知识基础。在这个医疗数据库中包括广泛的疾病名称,比如覆盖从常见病到罕见病的所有可能性。该医疗数据库中还包括每种疾病名称对应的字符向量。对于医疗数据库中的每一个疾病名称,可以通过特定的算法,比如,Bert模型,从该疾病名称中提取该疾病特征对应的字符向量。此外,该医疗数据库中还可以包括每种疾病名称对应的影像描述信息。这些影像描述信息基于医学影像学的知识,详细介绍了该疾病在影像学上的特征,如CT、MRI或X光影像中的常见表现。
在一种可能的实施方式中,通过如下方式构建所述医疗数据库:
从预先构建的医学知识图谱中,获取各疾病名称和所述各疾病名称分别对应的影像描述信息;
通过第一文本向量编码模型编码所述各疾病名称,获取所述各疾病名称分别对应的字符向量;
将所述各疾病名称、所述各疾病名称分别对应的字符向量、所述各疾病名称分别对应的影像描述信息对应保存在所述医疗数据库中。
为了构建医疗数据库,在本申请中,需要从预先构建的医学知识图谱中获取疾病名称与影像描述信息之间的对应关系。其中,该医学知识图谱是一个包含了大量医学领域实体(如疾病、症状、药物等)、关系、属性等信息的图状数据结构,通过访问该医学知识图谱,可以检索到各种疾病的名称以及与之相关的影像描述信息。然后通过对获取到的各种疾病名称进行编码,获取各种疾病名称分别对应的字符向量。将各种疾病名称、各种疾病名称分别对应的字符向量以及各种疾病名称分别对应的影像描述信息对应保存到医疗数据库中。
其中,可以通过文本向量编码模型(记为第一文本向量编码模型),如稠密向量编码模型(如Word2Vec、BERT、Embedding模型等)、稀疏向量编码模型(如One-hot Encoding编码器、BoW模型等)等,对各种疾病名称进行编码。例如,依次将各种疾病名称输入到稠密向量编码模型中。通过该稠密向量编码模型对输入的疾病名称进行处理,获取该疾病名称对应的字符向量。
其中,不同疾病名称分别对应的字符向量不同。
需要说明的是,在实际操作过程中,可能还需要考虑医疗数据的更新和维护问题。随着医学知识的不断更新和发展,医学知识图谱和第一文本向量编码模型也需要定期更新,以确保医疗数据库中的信息始终保持最新和准确。此外,为了保护患者的隐私和数据安全,还需要采取相应的安全措施来防止数据的泄露和滥用。
当基于上述实施例获取到了待质检医疗影像报告对应的检查结论中包含的疾病实体后,可以将识别出的疾病实体转换为字符向量。然后在预先构建的医疗数据库中,对该疾病实体对应的字符向量进行检索,找到与之匹配的疾病名称。从该医疗数据库中,获取该预测疾病名称对应的影像描述信息。
在一种可能的实施方式中,通过第一文本向量编码模型编码所述疾病实体,以得到所述疾病实体的第一字符向量。
在一种可能的实施方式中,确定所述疾病实体的字符向量,包括:
通过第二文本向量编码模型编码所述疾病实体,以得到所述疾病实体的第二字符向量;其中,所述第二文本向量编码模型与所述第一文本向量编码模型不同。
考虑到检查结论中可能存在表述差异或术语不统一的情况,导致通过第一文本向量编码模型获取到的第一字符向量无法在医疗数据库中找到最匹配的字符向量。基于此,在本申请中,还可以采用与第一文本向量编码模型不同的文本向量编码模型(记为第二文本向量编码模型)对获取到的疾病实体进行编码,获取疾病实体的字符向量(记为第二字符向量),以尽可能从检查结论中提取不同方面的语义信息,从而提高后续从医疗数据库中确定预测疾病名称的准确性。示例性的,当基于上述实施例获取到医疗影像报告对应的检查结论中的疾病实体后,将获取到的疾病实体输入到第二文本向量编码模型中。通过该第二文本向量编码模型,对输入的疾病实体进行编码,获取到该疾病实体的第二字符向量。
例如,如果第一文本向量编码模型是稠密向量编码模型,如Embedding模型,那么第二文本向量编码模型可以稀疏向量编码模型,如BM25算法,这些方法能够提供丰富的语义信息和上下文相关性。
当基于上述实施例获取到疾病实体的字符向量后,从预先构建的医疗数据库中,确定该疾病实体的字符向量所对应的预测疾病名称、以及预测疾病名称对应的影像描述信息包括如下几种情况:
情况1、该疾病实体的字符向量仅包括第一字符向量。
当基于上述实施例获取到各疾病实体分别对应的第一字符向量后,可以针对获取到的每个疾病实体,将该疾病实体的第一字符向量分别与医疗数据库中各疾病名称分别对应的字符向量进行匹配,确定该第一字符向量分别与医疗数据库中各疾病名称分别对应的字符向量之间的相似度。其中,该相似度可以通过余弦相似度、欧式距离、汉明距离等方式进行表示,具体实施过程中,可以根据实际需求进行灵活设置,在此不做具体限定。然后根据计算得到的相似度,对疾病名称进行排序,将相似度最高的K个疾病名称确定为该疾病实体对应的第一预测疾病名称。其中,K为大于0的正整数,如可以设定K=3,即选择相似度最高的前三个疾病名称。从医疗数据库中获取各第一预测疾病名称分别对应的影像描述信息。
例如,假设K为3,待质检医疗影像报告中识别出的疾病实体的第一字符向量为V1,医疗数据库中存储的疾病名称及其对应的字符向量分别为{A1:V_A1,A2:V_A2,...,An:V_An}。通过计算相似度,确定V1与V_A3、V_A5、V_A8的相似度最高。因此,选择A3、A5、A8作为第一预测疾病名称,并从医疗数据库中获取A3、A5、A8分别对应的影像描述信息。
需要说明的是,在设置K的值时,可以根据实际需求调整K的值。如果K设置得过大,可能会导致引入过多的不相关疾病名称;如果K设置得过小,可能会忽略一些潜在的相关疾病名称。
通过计算相似度来确定最可能的预测疾病名称,可以有效避免检查结论中的疾病实体可能存在表述差异或术语不统一的情况,提高质检的准确性和效率。此外,获取这些预测疾病名称对应的影像描述信息,可以为后续的纠错模型提供丰富的参考数据。
情况2、该疾病实体的字符向量包括第一字符向量和第二字符向量。
在一种示例中,若该疾病实体的字符向量包括第一字符向量和第二字符向量的情况下,可以针对获取到的每个疾病实体,将该疾病实体的第一字符向量分别与医疗数据库中各疾病名称分别对应的字符向量进行匹配,确定该第一字符向量分别与医疗数据库中各疾病名称分别对应的字符向量之间的相似度(记为第一相似度)。并将该疾病实体的第二字符向量分别与医疗数据库中各疾病名称分别对应的字符向量进行匹配,确定该第二字符向量分别与医疗数据库中各疾病名称分别对应的字符向量之间的相似度(记为第二相似度)。然后根据计算得到的相似度(包括第一相似度以及第二相似度),对疾病名称进行排序,将相似度最高的K个疾病名称确定为该疾病实体对应的预测疾病名称。其中,K为大于0的正整数。
在另一种示例中,考虑到医疗数据库中各疾病名称分别对应的字符向量均是通过第一文本向量编码向量确定的,该第一字符向量与医疗数据库中各疾病名称分别对应的字符向量之间的第一相似度,一般会大于该第二字符向量与医疗数据库中各疾病名称分别对应的字符向量之间的第二相似度,导致确定的预测疾病名称均是第一相似度最高的疾病名称所对应的,从而忽略一些与待检索疾病实体在描述上略有差异但实际上属于同一疾病的情况。因为文本向量编码模型在将文本转化为向量时,可能会受到词汇选择、句式结构等因素的影响,导致相似的文本在向量空间中的距离并不完全接近。基于此,为了更准确地确定预测疾病名称,在本申请中,可以考虑结合第一相似度和第二相似度,并引入其他辅助信息或策略。例如,可以设置不同的权重来平衡第一相似度和第二相似度的影响,或者结合医学领域的知识库、专家系统等资源来进行辅助判断。此外,还可以考虑使用更复杂的模型或算法,如深度学习模型、集成学习等,来综合利用第一相似度和第二相似度进行预测。
在一种可能的实施方式中,若所述疾病实体的字符向量包括所述第一字符向量以及所述第二字符向量,所述从预先构建的医疗数据库中,确定所述疾病实体的字符向量所对应的预测疾病名称、以及所述预测疾病名称对应的影像描述信息,包括:
对于任一所述疾病实体,确定该疾病实体的第一字符向量与所述医疗数据库中所述各疾病名称分别对应的字符向量之间的第一相似度;确定第一相似度最高的M个疾病名称;其中,所述M为大于0的正整数;
对于任一所述疾病实体,确定该疾病实体的第二字符向量与所述医疗数据库中所述各疾病名称分别对应的字符向量之间的第二相似度;确定第二相似度最高的P个疾病名称;其中,所述P为大于0的正整数;
通过倒数排序融合算法,将所述M个疾病名称和所述P个疾病名称进行排序;将排名最高的N个疾病名称确定为所述预测疾病名称;其中,0<N<Min(M,P)的正整数,Min(M,P)表征所述M和所述P中的最小值。
若该疾病实体的字符向量包括第一字符向量和第二字符向量的情况下,可以针对获取到的每个疾病实体,将该疾病实体的第一字符向量分别与医疗数据库中各疾病名称分别对应的字符向量进行匹配,确定该第一字符向量分别与医疗数据库中各疾病名称分别对应的字符向量之间的第一相似度。然后根据计算得到的第一相似度,对各疾病名称进行排序,获取第一相似度最高的M个疾病名称。其中,M为大于0的正整数。同时,将该疾病实体的第二字符向量分别与医疗数据库中各疾病名称分别对应的字符向量进行匹配,确定该第二字符向量分别与医疗数据库中各疾病名称分别对应的字符向量之间的第二相似度。然后根据计算得到的第二相似度,对各疾病名称进行排序,获取第二相似度最高的P个疾病名称。其中,P为大于0的正整数。然后通过倒数排序融合算法,将确定的M个疾病名称和P个疾病名称进行排序,将排序最高的N个疾病名称确定为预测疾病名称。其中,0<N<Min(M,P)的正整数,Min(M,P)表征所述M和所述P中的最小值。
需要说明的是,在设置M、P和N的值时,可以根据实际需求调整M、P和N的值。如果M、P和N设置得过大,可能会导致引入过多的不相关疾病名称;如果M、P和N设置得过小,可能会忽略一些潜在的相关疾病名称。
例如,该倒数排序融合算法可以通过如下公式表示:
其中,RRFscore(d∈D)表示d最终的得分,D是包括确定的M个疾病名称和P个疾病名称的集合,d是D中的一个疾病名称,R包括第一相似度排名结果和第二相似度排名结果,r(d)表示d在r中的排名,Q是一个超参数,通常默认设置为60。
假设获取到了某一疾病实体“肺癌”对应的第一字符向量和第二字符向量。然后将“肺癌”的第一字符向量与医疗数据库中各疾病名称分别对应的字符向量进行匹配,计算它们之间的第一相似度。假设数据库中有以下疾病名称及其对应的字符向量:
疾病名称A,字符向量VA
疾病名称B,字符向量VB
疾病名称C,字符向量VC
...
通过计算第一相似度,得到与“肺癌”的第一字符向量最相似的疾病名称及其第一相似度,例如:
疾病名称B,第一相似度0.85
疾病名称C,第一相似度0.80
疾病名称D,第一相似度0.75
假设设定M=3,那么就选择相似度最高的前三个疾病名称作为候选,即疾病名称B、C和D。
同时,将“肺癌”的第二字符向量与医疗数据库中各疾病名称分别对应的字符向量进行匹配,计算它们之间的第二相似度。使用上述相同的医疗数据库,得到与“肺癌”的第二字符向量最相似的疾病名称及其第二相似度,例如:
疾病名称A,第二相似度0.78
疾病名称C,第二相似度0.75
疾病名称E,第二相似度0.72
假设设定P=3,那么就选择第二相似度最高的前三个疾病名称作为另一个候选集,即疾病名称A、C和E。
现在获取到两组候选疾病名称:第一组是B、C、D,第二组是A、C、E。采用倒数排序融合算法来综合这两组结果,即将每个疾病名称在两组中的排名取倒数,然后求和,最后选择总和最小的N个疾病名称作为预测结果。
假设采用倒数排序融合算法计算后得到以下结果:
疾病名称C:在两个列表中都有出现,且排名都较靠前,因此其总倒数排名和最小。
疾病名称B:只在第一组中出现,但其排名最靠前,因此其总倒数排名和也较小。
疾病名称A:只在第二组中出现,但其排名较靠前。
假设N=2,那么就选择总倒数排名和最小的两个疾病名称作为预测疾病名称,即疾病名称C和疾病名称B。
S103:通过预先训练的纠错模型,基于所述检查结论、所述待质检描述信息以及所述预测疾病名称对应的影像描述信息,确定所述待质检医疗影像报告的质检结果;其中,所述质检结果用于指示所述检查结论与所述待质检描述信息是否一致。
为了提高检查所见和检查结论一致性的准确率,在本申请中,预先训练有纠错模型,通过该纠错模型识别并纠正医疗影像报告中的错误或不一致之处。当基于上述实施例获取到各预测疾病名称分别对应的影像描述信息、待质检描述信息以及检查结论后,可以将各预测疾病名称分别对应的影像描述信息、待质检描述信息以及检查结论输入到预先训练的纠错模型中。通过该纠错模型对输入的各预测疾病名称分别对应的影像描述信息、待质检描述信息以及检查结论进行处理,生成待质检医疗影像报告的质检结果。其中,该质检结果用于指示该检查结论与待质检描述信息是否一致。
在一种可能的实施方式中,所述质检结果包括以下一种或多种内容:所述检查结论与所述待质检描述信息是否一致,所述检查结论中是否存在疾病漏报,以及所述检查结论是否正确。
当基于上述实施例将各预测疾病名称分别对应的影像描述信息、待质检描述信息以及检查结论输入到预先训练的纠错模型中后,该纠错模型可以识别输入数据中的逻辑一致性和不一致性,对各预测疾病名称分别对应的影像描述信息和待质检描述信息进行交叉验证,以及评估检查结论的完整性。该纠错模型通过对比待质检描述信息和检查结论,确定两者是否匹配,从而在质检结果中输出检查结论与待质检描述信息是否一致的结论。该纠错模型通过分析各预测疾病名称分别对应的影像描述信息以及该待质检描述信息,确定该检查结论是否遗漏了关键的影像所见。示例性的,该纠错模型将待质检描述信息分别与各预测疾病名称分别对应的影像描述信息进行匹配,如果存在与该待质检描述信息匹配的影像描述信息,说明检查结论正确、依据充分且不存在疾病漏报,则输出检查结论与待质检描述信息一致的质检结果;如果不存在与该待质检描述信息匹配的影像描述信息,说明检查结论存在错误、依据不充分、存在疾病漏报等问题,则输出检查结论与待质检描述信息不一致的质检结果。
本申请的有益效果如下:
1、通过获取待质检医疗影像报告的待质检描述信息和对应的检查结论中的疾病实体,这种方法有助于将关注点集中在医疗影像报告中的关键疾病信息上,显著提高质检的效率和准确性。
2、利用预先构建的医疗数据库,将疾病实体的字符向量与预测疾病名称进行匹配,并获取相应的影像描述信息,以通过该影像描述信息进行知识增强,为后续模型确定待质检描述信息以及检查结论是否一致提供知识基础。
3、通过预先训练的纠错模型,结合检查结论、待质检描述信息和预测疾病名称对应的影像描述信息,确定待质检医疗影像报告的质检结果。这种基于深度学习的纠错模型能够自动识别和纠正报告中的错误和不一致之处,提高了质检的准确性和客观性。同时,质检结果可以清晰地指示检查结论与待质检描述信息是否一致,为医疗影像报告的质量管理和改进提供了有力的支持。
实施例2:
图2为本申请实施例提供的具体的基于模型知识增强的医疗影像报告质控流程示意图,该流程包括:
S201:获取待质检医疗影像报告的待质检描述信息、以及待质检医疗影像报告对应的检查结论。
图3为本申请实施例供的具体的基于模型知识增强的医疗影像报告质控流程的示例图。获取待质检医疗影像报告的待质检描述信息“各部脑实质未见异常密度灶;椎缘及椎小关节可见骨质增生,T7椎体上缘可见“许莫氏”结节形成”以及检查结论“脊柱退行性改变,建议随诊复查”。
S202:对检查结论进行实体提取,获取该检查结论中包含的疾病实体。
如图3所示,获取该检查结论中包含的疾病实体“脊柱退行性改变”。
S203:通过第一文本向量编码模型编码疾病实体,以得到疾病实体的第一字符向量。
如图3所示,通过稠密向量编码模型编码疾病实体“脊柱退行性改变”,以得到该疾病实体的embedding model。
S204:通过第二文本向量编码模型编码疾病实体,以得到疾病实体的第二字符向量;其中,第二文本向量编码模型与第一文本向量编码模型不同。
如图3所示,通过稀疏向量编码模型编码疾病实体“脊柱退行性改变”,以得到该疾病实体的稀疏n-gram索引。
S205:对于任一疾病实体,确定该疾病实体的第一字符向量与医疗数据库中各疾病名称分别对应的字符向量之间的第一相似度;确定第一相似度最高的M个疾病名称;其中,M为大于0的正整数。
在一种可能的实施方式中,通过如下方式构建医疗数据库:
从预先构建的医学知识图谱中,获取各疾病名称和各疾病名称分别对应的影像描述信息;
通过第一文本向量编码模型编码各疾病名称,获取各疾病名称分别对应的字符向量;
将各疾病名称、各疾病名称分别对应的字符向量、各疾病名称分别对应的影像描述信息对应保存在医疗数据库中。
如图3所示,获取到第一相似度最高的M个疾病名称分别为“许莫氏结节”、“椎间隙狭窄”。
S206:对于任一疾病实体,确定该疾病实体的第二字符向量与医疗数据库中各疾病名称分别对应的字符向量之间的第二相似度;确定第二相似度最高的P个疾病名称;其中,P为大于0的正整数。
如图3所示,获取到第二相似度最高的P个疾病名称分别为“脊柱边缘骨质增生”和“关节退变”。
S207:通过倒数排序融合算法,将M个疾病名称和P个疾病名称进行排序;将排名最高的N个疾病名称确定为预测疾病名称;其中,0<N<Min(M,P)的正整数,Min(M,P)表征M和P中的最小值。
如图3所示,通过倒数排序融合算法,将“许莫氏结节”、“椎间隙狭窄”、“脊柱边缘骨质增生”和“关节退变”进行排序,获取到排名最高的两个疾病名称分别为“许莫氏结节”和“脊柱边缘骨质增生”。
S208:从该医疗数据库中获取预测疾病名称对应的影像描述信息。
S209:通过预先训练的纠错模型,基于检查结论、待质检描述信息以及预测疾病名称对应的影像描述信息,确定待质检医疗影像报告的质检结果;其中,质检结果用于指示检查结论与待质检描述信息是否一致。
其中,质检结果包括以下一种或多种内容:检查结论与待质检描述信息是否匹配,检查结论中的依据是否充分、检查结论中是否存在疾病漏报,以及检查结论是否正确。
如图3所示,将待质检描述信息“各部脑实质未见异常密度灶;椎缘及椎小关节可见骨质增生,T7椎体上缘可见“许莫氏”结节形成”、检查结论“脊柱退行性改变,建议随诊复查”、以及“许莫氏结节”和“脊柱边缘骨质增生”分别对应的影像描述信息输入到预先训练的纠错模型。通过该纠错模型,对输入的待质检描述信息“各部脑实质未见异常密度灶;椎缘及椎小关节可见骨质增生,T7椎体上缘可见“许莫氏”结节形成”、检查结论“脊柱退行性改变,建议随诊复查”、以及“许莫氏结节”和“脊柱边缘骨质增生”分别对应的影像描述信息进行处理,获得检查结论与待质检描述信息一致的质检结果。
实施例3:
基于同样的发明构思,本申请还提供了一种基于模型知识增强的医疗影像报告质控装置,图4为本申请实施例提供的一种基于模型知识增强的医疗影像报告质控装置的结构示意图,所述装置包括:
获取单元41,用于获取待质检医疗影像报告的待质检描述信息、以及所述待质检医疗影像报告对应的检查结论中包含的疾病实体;
确定单元42,用于从预先构建的医疗数据库中,确定所述疾病实体的字符向量所对应的预测疾病名称、以及所述预测疾病名称对应的影像描述信息;其中,所述医疗数据库包括各疾病名称、所述各疾病名称分别对应的字符向量、所述各疾病名称分别对应的影像描述信息;
处理单元43,用于通过预先训练的纠错模型,基于所述检查结论、所述待质检描述信息以及所述预测疾病名称对应的影像描述信息,确定所述待质检医疗影像报告的质检结果;其中,所述质检结果用于指示所述检查结论与所述待质检描述信息是否一致。
在某些可能的实施方式中,通过如下方式构建所述医疗数据库:
从预先构建的医学知识图谱中,获取各疾病名称和所述各疾病名称分别对应的影像描述信息;
通过第一文本向量编码模型编码所述各疾病名称,获取所述各疾病名称分别对应的字符向量;
将所述各疾病名称、所述各疾病名称分别对应的字符向量、所述各疾病名称分别对应的影像描述信息对应保存在所述医疗数据库中。
在某些可能的实施方式中,所述确定单元42,具体用于通过第一文本向量编码模型编码所述疾病实体,以得到所述疾病实体的第一字符向量。
在某些可能的实施方式中,所述确定单元42,具体用于通过第二文本向量编码模型编码所述疾病实体,以得到所述疾病实体的第二字符向量;其中,所述第二文本向量编码模型与所述第一文本向量编码模型不同。
在某些可能的实施方式中,所述确定单元42,具体用于对于任一所述疾病实体,确定该疾病实体的字符向量与所述医疗数据库中所述各疾病名称分别对应的字符向量之间的相似度;将相似度最高的K个疾病名称确定为预测疾病名称;从所述医疗数据库中获取各所述预测疾病名称分别对应的影像描述信息;其中,所述K为大于0的正整数。
在某些可能的实施方式中,所述确定单元42,具体用于若所述疾病实体的字符向量包括所述第一字符向量以及所述第二字符向量,对于任一所述疾病实体,确定该疾病实体的第一字符向量与所述医疗数据库中所述各疾病名称分别对应的字符向量之间的第一相似度;确定第一相似度最高的M个疾病名称;其中,所述M为大于0的正整数;对于任一所述疾病实体,确定该疾病实体的第二字符向量与所述医疗数据库中所述各疾病名称分别对应的字符向量之间的第二相似度;确定第二相似度最高的P个疾病名称;其中,所述P为大于0的正整数;通过倒数排序融合算法,将所述M个疾病名称和所述P个疾病名称进行排序;将排名最高的N个疾病名称确定为所述预测疾病名称;其中,0<N<Min(M,P)的正整数,Min(M,P)表征所述M和所述P中的最小值。
在某些可能的实施方式中,所述质检结果包括以下一种或多种内容:所述检查结论与所述待质检描述信息是否匹配,所述检查结论中的依据是否充分、所述检查结论中是否存在疾病漏报,以及所述检查结论是否正确。
本实施例中的基于模型知识增强的医疗影像报告质控装置是以功能模块的形式来呈现,这里的模块是指专用集成电路(Application Specific Integrated Circuit,简称ASIC),执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
实施例4:
请参阅图5,图5是本申请可选实施例提供的一种计算机设备的结构示意图,如图5所示,该计算机设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在计算机设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个计算机设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,存储器20存储有可由至少一个处理器10执行的指令,以使至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据一种小程序落地页的展现的计算机设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该计算机设备还包括输入装置30和输出装置40。处理器10、存储器20、输入装置30和输出装置40可以通过总线或者其他方式连接,图5中以通过总线连接为例。
输入装置30可接收输入的数字或字符信息,以及产生与该计算机设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等。输出装置40可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。上述显示设备包括但不限于液晶显示器,发光二极管,显示器和等离子体显示器。在一些可选的实施方式中,显示设备可以是触摸屏。
实施例6:
在上述各实施例的基础上,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有可由处理器执行的计算机程序,当程序在处理器上运行时,使得处理器执行时实现如下步骤:
获取待质检医疗影像报告的待质检描述信息、以及所述待质检医疗影像报告对应的检查结论中包含的疾病实体;
从预先构建的医疗数据库中,确定所述疾病实体的字符向量所对应的预测疾病名称、以及所述预测疾病名称对应的影像描述信息;其中,所述医疗数据库包括各疾病名称、所述各疾病名称分别对应的字符向量、所述各疾病名称分别对应的影像描述信息;
通过预先训练的纠错模型,基于所述检查结论、所述待质检描述信息以及所述预测疾病名称对应的影像描述信息,确定所述待质检医疗影像报告的质检结果;其中,所述质检结果用于指示所述检查结论与所述待质检描述信息是否一致。
由于上述计算机可读存储介质解决问题的原理与基于模型知识增强的医疗影像报告质控方法相似,因此上述计算机可读存储介质的实施可以参见方法的实施例1-2,重复之处不再赘述。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种基于模型知识增强的医疗影像报告质控方法,其特征在于,所述方法包括:
获取待质检医疗影像报告的待质检描述信息、以及所述待质检医疗影像报告对应的检查结论中包含的疾病实体;
从预先构建的医疗数据库中,确定所述疾病实体的字符向量所对应的预测疾病名称、以及所述预测疾病名称对应的影像描述信息;其中,所述医疗数据库包括各疾病名称、所述各疾病名称分别对应的字符向量、所述各疾病名称分别对应的影像描述信息;
通过预先训练的纠错模型,基于所述检查结论、所述待质检描述信息以及所述预测疾病名称对应的影像描述信息,确定所述待质检医疗影像报告的质检结果;其中,所述质检结果用于指示所述检查结论与所述待质检描述信息是否一致。
2.如权利要求1所述的方法,其特征在于,通过如下方式构建所述医疗数据库:
从预先构建的医学知识图谱中,获取各疾病名称和所述各疾病名称分别对应的影像描述信息;
通过第一文本向量编码模型编码所述各疾病名称,获取所述各疾病名称分别对应的字符向量;
将所述各疾病名称、所述各疾病名称分别对应的字符向量、所述各疾病名称分别对应的影像描述信息对应保存在所述医疗数据库中。
3.如权利要求1所述的方法,其特征在于,确定所述疾病实体的字符向量,包括:
通过第一文本向量编码模型编码所述疾病实体,以得到所述疾病实体的第一字符向量。
4.如权利要求3所述的方法,其特征在于,确定所述疾病实体的字符向量,包括:
通过第二文本向量编码模型编码所述疾病实体,以得到所述疾病实体的第二字符向量;其中,所述第二文本向量编码模型与所述第一文本向量编码模型不同。
5.如权利要求3或4所述的方法,其特征在于,所述从预先构建的医疗数据库中,确定所述疾病实体的字符向量所对应的预测疾病名称、以及所述预测疾病名称对应的影像描述信息,包括:
对于任一所述疾病实体,确定该疾病实体的字符向量与所述医疗数据库中所述各疾病名称分别对应的字符向量之间的相似度;将相似度最高的K个疾病名称确定为预测疾病名称;从所述医疗数据库中获取各所述预测疾病名称分别对应的影像描述信息;其中,所述K为大于0的正整数。
6.如权利要求4所述的方法,其特征在于,若所述疾病实体的字符向量包括所述第一字符向量以及所述第二字符向量,所述从预先构建的医疗数据库中,确定所述疾病实体的字符向量所对应的预测疾病名称、以及所述预测疾病名称对应的影像描述信息,包括:
对于任一所述疾病实体,确定该疾病实体的第一字符向量与所述医疗数据库中所述各疾病名称分别对应的字符向量之间的第一相似度;确定第一相似度最高的M个疾病名称;其中,所述M为大于0的正整数;
对于任一所述疾病实体,确定该疾病实体的第二字符向量与所述医疗数据库中所述各疾病名称分别对应的字符向量之间的第二相似度;确定第二相似度最高的P个疾病名称;其中,所述P为大于0的正整数;
通过倒数排序融合算法,将所述M个疾病名称和所述P个疾病名称进行排序;将排名最高的N个疾病名称确定为所述预测疾病名称;其中,0<N<Min(M,P)的正整数,Min(M,P)表征所述M和所述P中的最小值。
7.如权利要求1所述的方法,其特征在于,所述质检结果包括以下一种或多种内容:所述检查结论与所述待质检描述信息是否匹配,所述检查结论中的依据是否充分、所述检查结论中是否存在疾病漏报,以及所述检查结论是否正确。
8.一种基于模型知识增强的医疗影像报告质控装置,其特征在于,所述装置包括:
获取单元,用于获取待质检医疗影像报告的待质检描述信息、以及所述待质检医疗影像报告对应的检查结论中包含的疾病实体;
确定单元,用于从预先构建的医疗数据库中,确定所述疾病实体的字符向量所对应的预测疾病名称、以及所述预测疾病名称对应的影像描述信息;其中,所述医疗数据库包括各疾病名称、所述各疾病名称分别对应的字符向量、所述各疾病名称分别对应的影像描述信息;
处理单元,用于通过预先训练的纠错模型,基于所述检查结论、所述待质检描述信息以及所述预测疾病名称对应的影像描述信息,确定所述待质检医疗影像报告的质检结果;其中,所述质检结果用于指示所述检查结论与所述待质检描述信息是否一致。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述权利要求1-7任一所述基于模型知识增强的医疗影像报告质控方法的步骤。
10.一种计算机可读存储介质,其特征在于,其存储有可由计算机设备执行的计算机程序,当所述程序在计算机设备上运行时,使得所述计算机设备执行如上述权利要求1-7任一所述基于模型知识增强的医疗影像报告质控方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410597966.1A CN118471423A (zh) | 2024-05-14 | 2024-05-14 | 医疗影像报告质控方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410597966.1A CN118471423A (zh) | 2024-05-14 | 2024-05-14 | 医疗影像报告质控方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118471423A true CN118471423A (zh) | 2024-08-09 |
Family
ID=92155306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410597966.1A Pending CN118471423A (zh) | 2024-05-14 | 2024-05-14 | 医疗影像报告质控方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118471423A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118969171A (zh) * | 2024-10-14 | 2024-11-15 | 智慧眼科技股份有限公司 | 一种放射学报告获取方法、装置、电子设备及存储介质 |
CN119626439A (zh) * | 2024-12-03 | 2025-03-14 | 中国医学科学院阜外医院 | 医学检查报告的处理方法和装置、存储介质及电子设备 |
-
2024
- 2024-05-14 CN CN202410597966.1A patent/CN118471423A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118969171A (zh) * | 2024-10-14 | 2024-11-15 | 智慧眼科技股份有限公司 | 一种放射学报告获取方法、装置、电子设备及存储介质 |
CN119626439A (zh) * | 2024-12-03 | 2025-03-14 | 中国医学科学院阜外医院 | 医学检查报告的处理方法和装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110827941B (zh) | 电子病历信息校正方法及系统 | |
US8214224B2 (en) | Patient data mining for quality adherence | |
WO2020214683A1 (en) | Computer-implemented natural language understanding of medical reports | |
CN108565019A (zh) | 多学科适用的临床检查组合推荐方法及装置 | |
EP4511747A1 (en) | Training of text and image models | |
CN118471423A (zh) | 医疗影像报告质控方法、装置、设备及介质 | |
Searle et al. | Experimental evaluation and development of a silver-standard for the MIMIC-III clinical coding dataset | |
CN112635011A (zh) | 疾病诊断方法、疾病诊断系统和可读存储介质 | |
US20220004706A1 (en) | Medical data verification method and electronic device | |
CN112541066A (zh) | 基于文本结构化的医技报告检测方法及相关设备 | |
CN111985241B (zh) | 医学信息查询方法、装置、电子设备及介质 | |
CN110866836A (zh) | 计算机执行的医疗保险立案审核方法和装置 | |
CN112530550A (zh) | 影像报告生成方法、装置、计算机设备和存储介质 | |
CN113707304B (zh) | 分诊数据处理方法、装置、设备及存储介质 | |
Parciak et al. | Schema matching with large language models: an experimental study | |
CN114238639A (zh) | 一种医学术语标准化框架的构建方法、装置、电子设备 | |
Rodin et al. | Multitask and multimodal neural network model for interpretable analysis of x-ray images | |
CN117672440A (zh) | 基于神经网络的电子病历文本信息抽取方法及系统 | |
CN117809794A (zh) | 基于跨视图语义对齐的医学报告生成方法、系统及终端 | |
WO2025129758A1 (zh) | 结构化数据的实体纠错方法、装置、设备及介质 | |
CN116631614A (zh) | 治疗方案生成方法、装置、电子设备及存储介质 | |
Cui et al. | Intelligent recommendation for departments based on medical knowledge graph | |
Yan et al. | Med-hvl: Automatic medical domain hallucination evaluation for large vision-language models | |
Amador-Domínguez et al. | A case-based reasoning model powered by deep learning for radiology report recommendation | |
Jin et al. | Orthodoc: Multimodal large language model for assisting diagnosis in computed tomography |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |