CN112420150A - 医学影像报告的处理方法、装置、存储介质及电子设备 - Google Patents
医学影像报告的处理方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN112420150A CN112420150A CN202011401966.8A CN202011401966A CN112420150A CN 112420150 A CN112420150 A CN 112420150A CN 202011401966 A CN202011401966 A CN 202011401966A CN 112420150 A CN112420150 A CN 112420150A
- Authority
- CN
- China
- Prior art keywords
- entity
- information
- candidate
- attribute
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title abstract description 9
- 238000013145 classification model Methods 0.000 claims abstract description 116
- 238000000034 method Methods 0.000 claims abstract description 53
- 238000012545 processing Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims description 63
- 238000002372 labelling Methods 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 15
- 230000000007 visual effect Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 7
- 230000001788 irregular Effects 0.000 abstract description 7
- 210000004072 lung Anatomy 0.000 description 43
- 238000003745 diagnosis Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 239000002184 metal Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000002271 resection Methods 0.000 description 8
- 208000002352 blister Diseases 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 5
- 201000009267 bronchiectasis Diseases 0.000 description 4
- 239000002131 composite material Substances 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 206010067182 Bronchial wall thickening Diseases 0.000 description 3
- 210000000621 bronchi Anatomy 0.000 description 3
- 230000010339 dilation Effects 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 210000003456 pulmonary alveoli Anatomy 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000008719 thickening Effects 0.000 description 3
- 238000002834 transmittance Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 210000000038 chest Anatomy 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 210000001370 mediastinum Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 210000000115 thoracic cavity Anatomy 0.000 description 1
- 210000003437 trachea Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H15/00—ICT specially adapted for medical reports, e.g. generation or transmission thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开涉及一种医学影像报告的处理方法、装置、存储介质及电子设备。该方法包括:标注影像所见数据中的实体信息和属性信息;将所有实体信息输入实体分类模型,得到实体分类模型输出的候选实体信息,将候选实体信息的实体名称作为候选实体名称;将所有候选实体信息的属性信息输入属性分类模型,得到属性分类模型输出的分别对应于各候选实体信息的候选属性信息;将每一候选实体名称与该候选实体名称对应的候选属性信息进行关联展示。采用这种方法,可以将冗长、复杂且描述顺序无规律的影像所见数据转换为简洁且候选实体名称与候选属性信息相关联的数据,便于用户直观的获取到影像所见数据中的有效数据,从而提升用户获取有效信息的效率。
Description
技术领域
本公开涉及计算机技术领域,具体地,涉及一种医学影像报告的处理方法、装置、存储介质及电子设备。
背景技术
完整的医学影像报告由三部分组成,第一部分是影像检查部位,如胸部、肺部、肝部等;第二部分是影像所见数据,即影像师根据从影像图像中观察到的信息而记录的详细的文字报告信息;第三部分是诊断结论数据,即主治医生根据影像所见数据给予病人的诊断结果。
相关技术中,由于影像所见数据是影像师根据从影像图像中观察到的全部信息而详细记录的文字报告,因此影像所见数据冗长、复杂且描述顺序无规律。这导致主治医生从影像所见数据中获取有效数据的效率很低。
发明内容
本公开的目的是提供一种医学影像报告的处理方法、装置、存储介质及电子设备,以避免相关技术中存在的问题。
为了实现上述目的,本公开实施例的第一部分,提供一种医学影像报告的处理方法,所述医学影像报告包括影像所见数据,所述方法包括:
标注所述影像所见数据中的实体信息和属性信息,所述实体信息包括实体名称和实体内容,所述实体内容中包括至少一条所述属性信息;
将所有所述实体信息输入实体分类模型,得到所述实体分类模型输出的候选实体信息,将所述候选实体信息的所述实体名称作为候选实体名称;
将所有所述候选实体信息的所述属性信息输入属性分类模型,得到所述属性分类模型输出的分别对应于各所述候选实体信息的候选属性信息;
将每一所述候选实体名称与该候选实体名称对应的所述候选属性信息进行关联展示。
可选地,所述实体分类模型包括对应不同实体名称的实体二分类模型,所述实体分类模型用于:
针对每一所述实体信息,将所述影像所见数据中与该实体信息相关联的句子输入与该实体信息的所述实体名称对应的所述实体二分类模型,得到所述实体二分类模型输出的表征该实体信息是否为所述候选实体信息的结果;
所述实体二分类模型的训练过程包括:
获取历史医学影像报告,所述历史医学影像报告包括历史影像所见数据以及历史结论数据,该历史影像所见数据标注有第一实体信息,该历史结论数据标注有第二实体信息;
对该历史影像所见数据中与所述第一实体信息关联的句子添加分类标签,该分类标签用于表征该历史结论数据中是否存在与该第一实体信息的实体名称相同的所述第二实体信息;
将该历史影像所见数据中的标注有所述分类标签的句子作为训练样本训练得到与所述第一实体信息的所述实体名称对应的所述实体二分类模型。
可选地,所述属性分类模型包括对应不同属性名称的属性二分类模型,所述属性分类模型用于:
针对每一所述属性信息,将所述影像所见数据中与该属性信息相关联的句子输入与该属性信息的所述属性名称对应的所述属性二分类模型,得到所述属性二分类模型输出的表征该属性信息是否为所述候选属性信息的结果;
所述属性二分类模型的训练过程包括:
获取历史医学影像报告,所述历史医学影像报告包括历史影像所见数据以及历史结论数据,该历史影像所见数据标注有第一属性信息,该历史结论数据标注有第二属性信息;
对该历史影像所见数据中与所述第一属性信息关联的句子添加分类标签,该分类标签用于表征该历史结论数据中是否存在与该第一属性信息的属性名称相同的所述第二属性信息;
将该历史影像所见数据中的标注有所述分类标签的句子作为训练样本训练得到与所述第一属性信息的所述属性名称对应的所述属性二分类模型。
可选地,所述将每一所述候选实体名称与该候选实体名称对应的所述候选属性信息进行关联展示,包括:
在多个所述候选实体信息的所述候选属性信息之间的相似度大于预设阈值的情况下,将该多个所述候选实体信息的所述候选实体名称合并为综合候选实体名称,所述综合候选实体名称为该多个所述候选实体信息的所述候选实体名称的总称;
将所述综合候选实体名称与该多个所述候选实体信息的所述候选属性信息进行关联展示。
可选地,所述标注所述影像所见数据中的实体信息和属性信息,包括:
将所述影像所见数据输入命名实体识别模型,得到所述命名实体识别模型输出的实体信息和属性信息标注结果;
其中,所述命名实体识别模型是通过如下方式进行训练得到的:
将已标注的影像所见数据作为所述命名实体识别模型的训练样本数据,其中,所述已标注的影像所见数据是根据与影像检测部位对应的实体标签集和与该实体标签集对应的属性标签集进行标注的;
根据所述训练样本数据训练得到所述命名实体识别模型。
可选地,所述命名实体识别模型还用于,在所述影像所见数据中的同一数据段中识别到采用预设关联词关联的多个所述实体信息的情况下,将该数据段中的所述属性信息作为共享属性信息标注给该多个所述实体信息。
可选地,所述方法还包括:
响应于用户的选择操作,确定用户从所述候选实体名称中选择的目标实体名称,以及从所述目标实体名称的所述候选属性信息中选择的目标属性信息;
根据所述目标实体名称以及所述目标属性信息在所述医学影像报告中生成结论数据。
本公开实施例的第二部分,提供一种医学影像报告的处理装置,所述医学影像报告包括影像所见数据,所述装置包括:
标注模块,被配置为用于标注所述影像所见数据中的实体信息和属性信息,所述实体信息包括实体名称和实体内容,所述实体内容中包括至少一条所述属性信息;
第一执行模块,被配置为用于将所有所述实体信息输入实体分类模型,得到所述实体分类模型输出的候选实体信息,将所述候选实体信息的所述实体名称作为候选实体名称;
第二执行模块,被配置为用于将所有所述候选实体信息的所述属性信息输入属性分类模型,得到所述属性分类模型输出的分别对应于各所述候选实体信息的候选属性信息;
展示模块,被配置为用于将每一所述候选实体名称与该候选实体名称对应的所述候选属性信息进行关联展示。
可选地,所述实体分类模型包括对应不同实体名称的实体二分类模型,所述实体分类模型用于:
针对每一所述实体信息,将所述影像所见数据中与该实体信息相关联的句子输入与该实体信息的所述实体名称对应的所述实体二分类模型,得到所述实体二分类模型输出的表征该实体信息是否为所述候选实体信息的结果;
所述实体二分类模型的训练过程包括:
获取历史医学影像报告,所述历史医学影像报告包括历史影像所见数据以及历史结论数据,该历史影像所见数据标注有第一实体信息,该历史结论数据标注有第二实体信息;
对该历史影像所见数据中与所述第一实体信息关联的句子添加分类标签,该分类标签用于表征该历史结论数据中是否存在与该第一实体信息的实体名称相同的所述第二实体信息;
将该历史影像所见数据中的标注有所述分类标签的句子作为训练样本训练得到与所述第一实体信息的所述实体名称对应的所述实体二分类模型。
可选地,所述属性分类模型包括对应不同属性名称的属性二分类模型,所述属性分类模型用于:
针对每一所述属性信息,将所述影像所见数据中与该属性信息相关联的句子输入与该属性信息的所述属性名称对应的所述属性二分类模型,得到所述属性二分类模型输出的表征该属性信息是否为所述候选属性信息的结果;
所述属性二分类模型的训练过程包括:
获取历史医学影像报告,所述历史医学影像报告包括历史影像所见数据以及历史结论数据,该历史影像所见数据标注有第一属性信息,该历史结论数据标注有第二属性信息;
对该历史影像所见数据中与所述第一属性信息关联的句子添加分类标签,该分类标签用于表征该历史结论数据中是否存在与该第一属性信息的属性名称相同的所述第二属性信息;
将该历史影像所见数据中的标注有所述分类标签的句子作为训练样本训练得到与所述第一属性信息的所述属性名称对应的所述属性二分类模型。
可选地,所述展示模块包括:
合并子模块,被配置为用于在多个所述候选实体信息的所述候选属性信息之间的相似度大于预设阈值的情况下,将该多个所述候选实体信息的所述候选实体名称合并为综合候选实体名称,所述综合候选实体名称为该多个所述候选实体信息的所述候选实体名称的总称;
展示子模块,被配置为用于将所述综合候选实体名称与该多个所述候选实体信息的所述候选属性信息进行关联展示。
可选地,所述标注模块包括:
输入子模块,被配置为用于将所述影像所见数据输入命名实体识别模型,得到所述命名实体识别模型输出的实体信息和属性信息标注结果;
其中,所述命名实体识别模型是通过如下方式进行训练得到的:
将已标注的影像所见数据作为所述命名实体识别模型的训练样本数据,其中,所述已标注的影像所见数据是根据与影像检测部位对应的实体标签集和与该实体标签集对应的属性标签集进行标注的;
根据所述训练样本数据训练得到所述命名实体识别模型。
可选地,所述命名实体识别模型还用于,在所述影像所见数据中的同一数据段中识别到采用预设关联词关联的多个所述实体信息的情况下,将该数据段中的所述属性信息作为共享属性信息标注给该多个所述实体信息。
可选地,所述装置还包括:
响应模块,被配置为用于响应于用户的选择操作,确定用户从所述候选实体名称中选择的目标实体名称,以及从所述目标实体名称的所述候选属性信息中选择的目标属性信息;
生成模块,被配置为用于根据所述目标实体名称以及所述目标属性信息在所述医学影像报告中生成结论数据。
本公开实施例的第三部分,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一部分中任一项所述方法的步骤。
本公开实施例的第四部分,提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现上述第一部分中任一项所述方法的步骤。
采用上述技术方案,至少能够达到如下技术效果:
通过标注影像所见数据中的实体信息和属性信息,并将所有实体信息输入实体分类模型,得到该实体分类模型输出的候选实体信息,将候选实体信息的实体名称作为候选实体名称。将所有候选实体信息的属性信息输入属性分类模型,得到该属性分类模型输出的分别对应于各候选实体信息的候选属性信息。将每一候选实体名称与该候选实体名称对应的候选属性信息进行关联展示。如此,可以将冗长、复杂且描述顺序无规律的影像所见数据转换为简洁且候选实体名称与候选属性信息相关联的数据,便于用户直观的获取到影像所见数据中的有效数据,从而提升用户获取有效信息的效率。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据本公开一示例性实施例示出的一种医学影像报告的处理方法的流程图。
图2是根据本公开一示例性实施例示出的一种实体标签集。
图3是根据本公开一示例性实施例示出的一种影像所见数据的实体信息标注结果。
图4是根据本公开一示例性实施例示出的一种影像所见数据的属性信息标注结果。
图5是根据本公开一示例性实施例示出的一种候选实体名称与候选属性信息关联展示的示意图。
图6是根据本公开一示例性实施例示出的一种历史结论数据的实体信息标注结果。
图7是根据本公开一示例性实施例示出的一种历史结论数据的属性信息标注结果。
图8是根据本公开一示例性实施例示出的另一种候选实体名称与候选属性信息关联展示的示意图。
图9是根据本公开一示例性实施例示出的一种医学影像报告的处理装置的框图。
图10是根据本公开一示例性实施例示出的一种电子设备的框图。
图11是根据本公开一示例性实施例示出的另一种电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
完整的医学影像报告由三部分组成,第一部分是影像检查部位,如胸部、肺部、肝部等;第二部分是影像所见数据,即影像师根据从影像图像中观察到的信息而记录的详细的文字报告信息;第三部分是诊断结论数据,即主治医生根据影像所见数据给予病人的诊断结果。
相关技术中,由于影像所见数据是影像师根据从影像图像中观察到的全部信息而详细记录的文字报告,因此影像所见数据非常冗长。并且由于每一影像师有自己独特的记录习惯,因此影像所见数据中对影像图像的各局部描述对象的描述顺序并无固定规律,例如,影像师可能从上到下依次对影像图像进行描述,也可能从左到右或者从右到左依次对影像图像进行描述,亦可能按照其它顺序对影像图像进行描述,还可能对影像图像进行无顺序描述等。正因为影像所见数据冗长、复杂且描述顺序无规律,所以这导致主治医生从影像所见数据中获取有效信息的效率很低。
此外,相关技术中,主治医生根据影像所见数据,将其得出的诊断结果通过手写或者键盘输入的方式写入医学影像报告中。这种手写或者键盘输入的方式效率低,并且容易出现因主治医生误输入文字而导致的诊断结论错误的问题。
有鉴于此,本公开实施例提供一种医学影像报告的处理方法、装置、存储介质及电子设备,以解决相关技术中存在的问题,提升用户获取影像所见数据中的有效信息的效率。
图1是根据本公开一示例性实施例示出的一种医学影像报告的处理方法的流程图,该方法可以应用于终端设备,也可以应用于服务器,如图1所示,该方法可以包括以下步骤:
S11、标注影像所见数据中的实体信息和属性信息,所述实体信息包括实体名称和实体内容,所述实体内容中包括至少一条所述属性信息。
首先应当说明的是,本公开实施例中的医学影像报告为包括影像所见数据且不包括诊断结论数据的非完整医学影像报告,即为影像师根据影像图像而出具的用于主治医生得出诊断结论的中间医学影像报告。容易理解的是,每一医学影像报告对应一个病患的一个影像检查部位。本公开的影像所见数据为一个医学影像报告中的影像所见数据。此外,医学影像报告中除了上述三部分信息之外,还包括患者的基本信息,例如姓名、性别、年龄等,而在本公开的具体实施例中未示出医学影像报告中的患者基本信息。
影像所见数据中包括一条或多条实体信息,每一条实体信息包括实体名称和实体内容。每一实体信息的实体内容包括一条或多条属性信息。
值得说明的是,由于人体不同部位包含的实体名称大相径庭,因此一种可实现的实施方式,可以根据影像检查部位对应的实体标签集标注影像所见数据中的实体信息,从而得到一条或多条实体信息。
另一种可实现的实施方式,可以根据专病相应的实体标签集标注影像所见数据中的实体信息,从而得到一条或多条实体信息。其中,专病是指专门的病种。
同时,由于医学属性体系的标准化建立,即不同部位或不同病种可以采用同样的属性分类方式,因此,对实体信息的实体内容中的属性信息进行标注时,可以采用统一的医学属性标签集进行标注。另外也可以采用与各实体信息的实体名称对应的属性标签集进行标注。对此本公开不做具体的限制。
示例地,假设医学影像报告如表1所示:
表1
若采用如图2所示的实体标签集标注表1所示的医学影像报告中的影像所见数据,则可以得到如图3所示的实体信息标注结果。具体地,如图3所示,第一条实体信息的实体名称为:肺大泡;实体内容为:右肺大泡切除术后,术区可条片状金属影。第二条实体信息的实体名称为:胸廓对称性;实体内容为:右剩余肺膨胀良好。
进一步地,采用统一的医学影像属性标签集标注表1所示的医学影像报告中的影像所见数据,可以得到如图4所示的属性信息标注结果。具体地,如图4所示,上述第一条实体信息包括如下四条属性信息:第一条属性信息的属性名称为:方位;属性内容为:右。第二条属性信息的属性名称为:手术;属性内容为:切除术后。第三条属性信息的属性名称为:形状;属性内容为:条片状。第四条属性信息的属性名称为:金属影;属性内容为:金属影。
S12、将所有所述实体信息输入实体分类模型,得到所述实体分类模型输出的候选实体信息,将所述候选实体信息的所述实体名称作为候选实体名称。
将影像报告的影像所见数据中的所有实体信息输入实体分类模型,可以得到该实体分类模型输出的候选实体信息。其中,不限制候选实体信息的具体数量。
S13、将所有所述候选实体信息的所述属性信息输入属性分类模型,得到所述属性分类模型输出的分别对应于各所述候选实体信息的候选属性信息。
在确定候选实体信息之后,将所有候选实体信息的属性信息输入属性分类模型,可以得到该属性分类模型输出的分别对应于各候选实体信息的候选属性信息。即属性分类模型针对每一候选实体信息,从该候选实体信息的属性信息中选出候选属性信息,得到该候选实体信息对应的候选属性信息。
S14、将每一所述候选实体名称与该候选实体名称对应的所述候选属性信息进行关联展示。
在确定每一候选实体信息的候选属性信息之后,将该候选实体信息的候选实体名称与该候选实体信息的候选属性信息进行关联展示。示例地,可以按照如图5所示的方式关联展示候选实体名称与对应的候选属性信息。
采用上述方法,通过标注影像所见数据中的实体信息和属性信息,并将所有实体信息输入实体分类模型,得到该实体分类模型输出的候选实体信息,将候选实体信息的实体名称作为候选实体名称。将所有候选实体信息的属性信息输入属性分类模型,得到该属性分类模型输出的分别对应于各候选实体信息的候选属性信息。将每一候选实体名称与该候选实体名称对应的候选属性信息进行关联展示。如此,可以将冗长、复杂且描述顺序无规律的影像所见数据转换为简洁且候选实体名称与候选属性信息相关联的数据,便于用户直观的获取到影像所见数据中的有效数据,从而提升用户获取有效信息的效率。
一种可能的实施方式,在将每一候选实体名称与该候选实体名称对应的候选属性信息进行关联展示时,可以将各候选实体名称按照顺序进行排列,例如按照候选实体名称的首字母进行顺序排列。
可选地,所述实体分类模型包括对应不同实体名称的实体二分类模型,所述实体分类模型用于:
针对每一所述实体信息,将所述影像所见数据中与该实体信息相关联的句子输入与该实体信息的所述实体名称对应的所述实体二分类模型,得到所述实体二分类模型输出的表征该实体信息是否为所述候选实体信息的结果;
其中,所述实体二分类模型的训练过程包括:
获取历史医学影像报告,所述历史医学影像报告包括历史影像所见数据以及历史结论数据,该历史影像所见数据标注有第一实体信息,该历史结论数据标注有第二实体信息;对该历史影像所见数据中与所述第一实体信息关联的句子添加分类标签,该分类标签用于表征该历史结论数据中是否存在与该第一实体信息的实体名称相同的所述第二实体信息;将该历史影像所见数据中的标注有所述分类标签的句子作为训练样本训练得到与所述第一实体信息的所述实体名称对应的所述实体二分类模型。
其中,历史医学影像报告为完整的医学影像报告,包括影像检查部位、影像所见数据,以及诊断结论数据。
示例地,历史医学影像报告可以如表2所示:
表2
针对表2所示的历史医学影像报告,该历史医学影像报告的影像所见数据即为历史影像所见数据,该历史影像所见数据标注有第一实体信息,具体可以如图3所示。该历史医学影像报告的诊断结论数据即为历史结论数据,该历史结论数据标注有第二实体信息,具体可以如图6所示。
在实体二分类模型的训练过程中,历史影像所见数据中与第一实体信息关联的句子是指按照关联句子的计算窗口sen_window=n(n为大于等于0的整数)来确定的每一第一实体信息的关联句子。
示例地,当n为1的情况下,将第一实体信息所在的句子、该第一实体信息所在句子的前一相邻句子,以及该第一实体信息所在句子的后一相邻句子一起作为历史影像所见数据中与该第一实体信息关联的句子。
具体地,参见图3,假设历史影像所见数据中的第一实体信息的实体名称为肺大泡,实体内容为右肺大泡切除术后,术区可条片状金属影。历史影像所见数据中与肺大泡实体信息(即第一实体信息)关联的句子可以为“右肺大泡切除术后,术区可条片状金属影,右剩余肺膨胀良好。余两肺亮度增高,肺纹理增著,紊乱。”。
当n为2的情况下,将第一实体信息所在的句子、该第一实体信息所在句子的前两个句子,以及该第一实体信息所在句子的后两个句子一起作为历史影像所见数据中与该第一实体信息关联的句子。
具体地,参见图3,历史影像所见数据中与空腔实体信息关联的句子可以为“右肺大泡切除术后,术区可条片状金属影,右剩余肺膨胀良好。余两肺亮度增高,肺纹理增著,紊乱。两肺多个大小不等无壁及薄膜空腔,最大位于左下肺背段,大小约7.2×3.8cm。两肺可见多发结节影、条索状模糊影及树芽征,两侧支气管增厚,左上肺舌段支气管稍扩张。两肺门及纵膈可见多发小淋巴结影。”。
进一步地,假设分类标签1表征历史结论数据中存在与第一实体信息的实体名称相同的第二实体信息,分类标签0表征历史结论数据中不存在与第一实体信息的实体名称相同的第二实体信息。
那么参见图3和图6,由于表2所示的历史结论数据中存在第二实体信息,其实体名称为:肺大泡,实体内容为:右肺大泡切除术后。因此,可以针对历史影像所见数据中与肺大泡实体信息(即第一实体信息)关联的句子“右肺大泡切除术后,术区可条片状金属影,右剩余肺膨胀良好。余两肺亮度增高,肺纹理增著,紊乱。”添加分类标签1。
再示例地,参见图3和图6,假设第一实体信息为肺野透亮度实体信息,那么由于历史结论数据中不存在实体名称为肺野透亮度的第二实体信息,因此,可以针对历史影像所见数据中与肺野透亮度实体信息(即第一实体信息)关联的句子“右肺大泡切除术后,术区可条片状金属影,右剩余肺膨胀良好。余两肺亮度增高,肺纹理增著,紊乱。两肺多个大小不等无壁及薄膜空腔,最大位于左下肺背段,大小约7.2×3.8cm。”添加分类标签0。
更进一步地,将该历史影像所见数据中的标注有分类标签的句子作为训练样本训练得到与第一实体信息的实体名称对应的实体二分类模型。具体地,针对与实体名称肺大泡对应的实体二分类模型,采用多个历史医学影像报告中与肺大泡实体信息相关联的具有分类标签的句子训练得到该与实体名称肺大泡对应的实体二分类模型。例如,其中的一个训练样本可以为,添加标签1的关联句子“右肺大泡切除术后,术区可条片状金属影,右剩余肺膨胀良好。余两肺亮度增高,肺纹理增著,紊乱。”。
同理地,针对与肺野透亮度对应的实体二分类模型,采用多个历史医学影像报告中与肺野透亮度实体信息相关联的、且具有分类标签的句子训练得到与肺野透亮度对应的实体二分类模型。例如,其中的一个训练样本可以为,添加标签0的关联句子“右肺大泡切除术后,术区可条片状金属影,右剩余肺膨胀良好。余两肺亮度增高,肺纹理增著,紊乱。两肺多个大小不等无壁及薄膜空腔,最大位于左下肺背段,大小约7.2×3.8cm。”。
采用这种方法,利用大量的历史医学影像报告中与第一实体信息相关联的、且具有分类标签的句子,可以训练得到与第一实体信息的实体名称对应的实体二分类模型。利用各训练好的实体二分类模型可以对影像所见数据中的各实体信息进行二分类处理,筛选出该影像所见数据对应的候选实体信息。
基于前述实体分类模型的训练过程,容易理解的是,候选实体信息是指从影像所见数据对应的实体信息(即第一实体信息)中选择出的能够作为影像报告的结论数据部分中的实体信息(即第二实体信息)的候选项。
可选地,基于与上述实体分类模型同样的原理,所述属性分类模型包括对应不同属性名称的属性二分类模型,所述属性分类模型用于:
针对每一所述属性信息,将所述影像所见数据中与该属性信息相关联的句子输入与该属性信息的所述属性名称对应的所述属性二分类模型,得到所述属性二分类模型输出的表征该属性信息是否为所述候选属性信息的结果;
其中,所述属性二分类模型的训练过程包括:
获取历史医学影像报告,所述历史医学影像报告包括历史影像所见数据以及历史结论数据,该历史影像所见数据标注有第一属性信息,该历史结论数据标注有第二属性信息;对该历史影像所见数据中与所述第一属性信息关联的句子添加分类标签,该分类标签用于表征该历史结论数据中是否存在与该第一属性信息的属性名称相同的所述第二属性信息;将该历史影像所见数据中的标注有所述分类标签的句子作为训练样本训练得到与所述第一属性信息的所述属性名称对应的所述属性二分类模型。
由于该属性二分类模型与前述实体二分类模型的训练过程相类似,因而此处不再详细赘述。
关于对历史影像所见数据中与第一属性信息关联的句子添加分类标签的实施方式,可参见图4与图7,具体地,针对图4所示历史影像所见数据中属性名称为方位,属性内容为右的属性信息,根据图7可知,历史结论数据中存在属性名称为方位的第二属性信息,因此,可以对历史影像所见数据中与该属性信息关联的句子“右肺大泡切除术后,术区可条片状金属影,右剩余肺膨胀良好。余两肺亮度增高,肺纹理增著,紊乱。”添加分类标签1。
可选地,上述步骤S14所述将每一所述候选实体名称与该候选实体名称对应的所述候选属性信息进行关联展示,具体还可以包括:
在多个所述候选实体信息的所述候选属性信息之间的相似度大于预设阈值的情况下,将该多个所述候选实体信息的所述候选实体名称合并为综合候选实体名称,所述综合候选实体名称为该多个所述候选实体信息的所述候选实体名称的总称;将所述综合候选实体名称与该多个所述候选实体信息的所述候选属性信息进行关联展示。
容易理解的是,若多个候选实体信息的候选属性信息完全相同的情况下,可以将该多个候选实体信息的候选实体名称合并为一个综合候选实体名称,并将该综合候选实体名称与该多个候选实体信息的相同候选属性信息进行关联展示。
示例地,假设两个候选实体信息。其中第一个候选实体信息的实体名称为:支气管壁增厚;实体内容为:左肺侧支气管壁增厚。第二个候选实体信息的实体名称为:支气管扩张;实体内容为:左肺侧支气管扩张。那么该两个候选实体信息中的属性信息即(属性名称:方位;属性内容:左肺侧)完全相同,此种情况下,可将该两个候选实体信息的候选实体名称支气管壁增厚和支气管扩张合并成一个综合候选实体名称“支气管增厚并支扩”,并将该综合候选实体名称“支气管增厚并支扩”与属性信息(属性名称:方位,属性内容:左肺侧)关联展示。
采用这种方式,将多个候选实体信息进行合并展示,有利于用户在更短的时间内获取到更多的有效信息,如此进一步提升了用户获取影像所见数据中的有效信息的效率。
应当说明的是,若多个候选实体信息的候选属性信息并不完全相同的情况下,也可以将该多个候选实体信息的候选实体名称合并为一个综合候选实体名称,并将该综合候选实体名称与该多个候选实体信息的相同部分候选属性信息进行关联展示。
可选地,上述任一种医学影像报告的处理方法还可以包括以下步骤:
响应于用户的选择操作,确定用户从所述候选实体名称中选择的目标实体名称,以及从所述目标实体名称的所述候选属性信息中选择的目标属性信息;根据所述目标实体名称以及所述目标属性信息在所述医学影像报告中生成结论数据。
在步骤S14将每一所述候选实体名称与该候选实体名称对应的所述候选属性信息进行关联展示之后,用户可以基于关联展示的候选实体名称与候选属性信息进行选择。具体地,候选实体名称与候选属性信息进行关联展示的页面可以如图8所示。响应于用户的选择操作,例如响应于用户点击选中如图8中所示的圆形框,可以确定用户从候选实体名称中选择的目标实体名称,以及从目标实体名称的候选属性信息中选择的目标属性信息。基于用户选中的目标实体名称以及目标属性信息可以在该医学影像报告中生成结论数据,从而得到完整的医学影像报告。
采用这种方法,通过点击选中关联展示页面中的候选实体名称与候选属性信息,并确认生成结论数据后即可自动生成医学影像报告中的结论数据。这种方式无需主治医生根据影像所见数据,将其得出的诊断结果通过手写或者键盘输入的方式写入医学影像报告中,因而可以避免因主治医生误输入文字而导致的诊断结论错误的问题,并提升生成结论数据的效率。
此外,一种可能的实施方式,在确定用户从候选实体名称中选择目标实体名称,以及从目标实体名称的候选属性信息中选择目标属性信息之后,若选中的多个目标实体名称的目标属性信息相同,则可以将该多个目标实体名称合并为一个综合目标实体名称,并根据该综合目标实体名称以及该相同的目标属性信息生成结论数据。
可选地,上述步骤S11所述标注所述影像所见数据中的实体信息和属性信息,具体可以包括:
将所述影像所见数据输入命名实体识别模型,得到所述命名实体识别模型输出的实体信息和属性信息标注结果;
其中,所述命名实体识别模型是通过如下方式进行训练得到的:
将已标注的影像所见数据作为所述命名实体识别模型的训练样本数据,其中,所述已标注的影像所见数据是根据与影像检测部位对应的实体标签集和与该实体标签集对应的属性标签集进行标注的;根据所述训练样本数据训练得到所述命名实体识别模型。
命名实体识别(Named Entity Recognition,简称NER)也称为实体识别、实体分块或者实体提取,是信息提取的一个子任务,旨在将文本中的命名实体定位并分类为预先定义的类别。在本公开的实施例中,预先定义的类别为影像检测部位对应的实体标签集以及与该实体标签集对应的属性标签集。其中实体标签集可以为图2所示的实体标签集。
一种可实现的实施方式,将根据与影像检测部位对应的实体标签集和与该实体标签集对应的属性标签集进行标注后的多个影像所见数据作为命名实体识别模型的训练样本数据。根据该训练样本数据训练得到命名实体识别模型。
将待标注的影像所见数据输入训练好的命名实体识别模型,可以得到该训练好的命名实体识别模型输出的实体信息和属性信息标注结果。
可选地,所述命名实体识别模型还用于,在所述影像所见数据中的同一数据段中识别到采用预设关联词关联的多个所述实体信息的情况下,将该数据段中的所述属性信息作为共享属性信息标注给该多个所述实体信息。
其中,预设关联词可以为和、与、以及、并、且、和…都…、与…均…等等关联词。同一数据段是指没有用标点符号或空格符号分割开的连续文字段。
示例地,假设影像所见数据中的同一数据段为:两肺支气管增厚并支扩。那么该同一数据段中存在两个实体信息,其中一个实体信息为支气管壁增厚,另一个实体信息为支气管扩张,如此可以将该同一数据段中的属性信息“肺部”作为共享属性信息标注给支气管壁增厚实体信息和支气管扩张实体信息。
采用这种方式,可以避免在标注实体信息的属性信息过程中,将与该实体信息不相邻但属于该实体信息的属性信息漏标注。因而这种属性标注方式,可以提升属性标注结果的准确性,进而可以提升采用本公开医学影像报告的处理方法得到的候选实体名称与候选属性信息的结果的准确率。
可选地,所述命名实体识别模型还用于,针对每一实体信息,标注该实体信息的阴阳属性信息。具体地,根据该实体信息的实体内容中是否存在否定词来确定该实体信息的阴阳属性信息。例如,在该实体信息的实体内容中存在否定词的情况下,确定该实体信息的阴阳属性信息的属性内容为阴性。在该实体信息的实体内容中不存在否定词的情况下,确定该实体信息的阴阳属性信息的属性内容为阳性。
本领域技术人员容易理解的是,阴阳性表征是否存在某症状,而某症状是否存在在很大程度上会影响诊断结果,因此,每一实体信息的阴阳属性信息是很重要的属性信息。而采用上述确定每一实体信息的阴阳属性信息的方式,能够保障从影像所见数据中得出的简洁的候选实体名称以及候选属性信息能准确表征原影像所见数据的含义。
一种可能的情况,在历史医学影像包括中,结论数据中可能包括影像所见数据中不包括的实体信息。因而一种可实现的实施方式,可以在实体分类模型和属性分类模型中分别增加实体推测子模型和属性推测子模型。该实体推测子模型用于根据标注后的影像所见数据中的实体信息推测该影像所见数据中不存在的候选实体信息。该属性推测子模型用于根据标注后的影像所见数据中的属性信息推测该影像所见数据中不存在的候选属性信息。
其中,实体推测子模型是根据大量的完整的目标类型历史医学影像报告进行训练得到,目标类型历史医学影像报告为结论数据中包括影像所见数据中不包括的实体信息的历史医学影像报告。具体地,在实体推测子模型的训练过程中,使用针对结论数据中包括而影像所见数据中不包括的每一实体信息进行负采样的方式训练得到实体推测子模型。采用同样的方式也可以得到属性推测子模型,此处不再赘述。
经过发明人实验,采用本公开上述医学影像报告的处理方法对测试样本数据集进行测试,得到了如表3所示的测试结果。
/ | P | R | F |
候选实体名称 | 0.85 | 0.84 | 0.85 |
候选属性信息 | 0.92 | 0.94 | 0.9292 |
表3
表3中,准确率(P值)表示的是预测为正的样本中有多少是真正的样本。
召回率(R值)表示的是样本中的正例有多少被预测正确了。
F值是P和R值出现矛盾的情况下,为综合考虑P和R而设置的值,最常见的F值计算方法是F-Measure,特殊情况下F值计算方法是F=2PR/(P+R)。
如表3所示,采用本公开的上述技术方案,得到的简洁的关联展示的候选实体名称以及候选属性信息,可以较准确的表征原冗长、复杂且描述顺序无规律的影像所见数据。
应当说明的是,在不违背本公开发明原理的情况下,上述各实施例之间可以任意组合,对此本公开不做具体限制。
基于同一发明构思,本公开实施例还提供一种医学影像报告的处理装置,如图9所示,该装置800包括:
标注模块810,被配置为用于标注所述影像所见数据中的实体信息和属性信息,所述实体信息包括实体名称和实体内容,所述实体内容中包括至少一条所述属性信息;其中,所述医学影像报告包括影像所见数据。
第一执行模块820,被配置为用于将所有所述实体信息输入实体分类模型,得到所述实体分类模型输出的候选实体信息,将所述候选实体信息的所述实体名称作为候选实体名称;
第二执行模块830,被配置为用于将所有所述候选实体信息的所述属性信息输入属性分类模型,得到所述属性分类模型输出的分别对应于各所述候选实体信息的候选属性信息;
展示模块840,被配置为用于将每一所述候选实体名称与该候选实体名称对应的所述候选属性信息进行关联展示。
采用这种装置,通过标注影像所见数据中的实体信息和属性信息,并将所有实体信息输入实体分类模型,得到该实体分类模型输出的候选实体信息,将候选实体信息的实体名称作为候选实体名称。将所有候选实体信息的属性信息输入属性分类模型,得到该属性分类模型输出的分别对应于各候选实体信息的候选属性信息。将每一候选实体名称与该候选实体名称对应的候选属性信息进行关联展示。如此,可以将冗长、复杂且描述顺序无规律的影像所见数据转换为简洁且候选实体名称与候选属性信息相关联的数据,便于用户直观的获取到影像所见数据中的有效数据,从而提升用户获取有效信息的效率。
可选地,所述实体分类模型包括对应不同实体名称的实体二分类模型,所述实体分类模型用于:
针对每一所述实体信息,将所述影像所见数据中与该实体信息相关联的句子输入与该实体信息的所述实体名称对应的所述实体二分类模型,得到所述实体二分类模型输出的表征该实体信息是否为所述候选实体信息的结果;
所述实体二分类模型的训练过程包括:
获取历史医学影像报告,所述历史医学影像报告包括历史影像所见数据以及历史结论数据,该历史影像所见数据标注有第一实体信息,该历史结论数据标注有第二实体信息;
对该历史影像所见数据中与所述第一实体信息关联的句子添加分类标签,该分类标签用于表征该历史结论数据中是否存在与该第一实体信息的实体名称相同的所述第二实体信息;
将该历史影像所见数据中的标注有所述分类标签的句子作为训练样本训练得到与所述第一实体信息的所述实体名称对应的所述实体二分类模型。
可选地,所述属性分类模型包括对应不同属性名称的属性二分类模型,所述属性分类模型用于:
针对每一所述属性信息,将所述影像所见数据中与该属性信息相关联的句子输入与该属性信息的所述属性名称对应的所述属性二分类模型,得到所述属性二分类模型输出的表征该属性信息是否为所述候选属性信息的结果;
所述属性二分类模型的训练过程包括:
获取历史医学影像报告,所述历史医学影像报告包括历史影像所见数据以及历史结论数据,该历史影像所见数据标注有第一属性信息,该历史结论数据标注有第二属性信息;
对该历史影像所见数据中与所述第一属性信息关联的句子添加分类标签,该分类标签用于表征该历史结论数据中是否存在与该第一属性信息的属性名称相同的所述第二属性信息;
将该历史影像所见数据中的标注有所述分类标签的句子作为训练样本训练得到与所述第一属性信息的所述属性名称对应的所述属性二分类模型。
可选地,所述展示模块840包括:
合并子模块,被配置为用于在多个所述候选实体信息的所述候选属性信息之间的相似度大于预设阈值的情况下,将该多个所述候选实体信息的所述候选实体名称合并为综合候选实体名称,所述综合候选实体名称为该多个所述候选实体信息的所述候选实体名称的总称;
展示子模块,被配置为用于将所述综合候选实体名称与该多个所述候选实体信息的所述候选属性信息进行关联展示。
可选地,所述标注模块810包括:
输入子模块,被配置为用于将所述影像所见数据输入命名实体识别模型,得到所述命名实体识别模型输出的实体信息和属性信息标注结果;
其中,所述命名实体识别模型是通过如下方式进行训练得到的:
将已标注的影像所见数据作为所述命名实体识别模型的训练样本数据,其中,所述已标注的影像所见数据是根据与影像检测部位对应的实体标签集和与该实体标签集对应的属性标签集进行标注的;
根据所述训练样本数据训练得到所述命名实体识别模型。
可选地,所述命名实体识别模型还用于,在所述影像所见数据中的同一数据段中识别到采用预设关联词关联的多个所述实体信息的情况下,将该数据段中的所述属性信息作为共享属性信息标注给该多个所述实体信息。
可选地,所述装置800还包括:
响应模块,被配置为用于响应于用户的选择操作,确定用户从所述候选实体名称中选择的目标实体名称,以及从所述目标实体名称的所述候选属性信息中选择的目标属性信息;
生成模块,被配置为用于根据所述目标实体名称以及所述目标属性信息在所述医学影像报告中生成结论数据。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图10是根据一示例性实施例示出的一种电子设备700的框图。如图10所示,该电子设备700可以包括:处理器701,存储器702。该电子设备700还可以包括多媒体组件703,输入/输出(I/O)接口704,以及通信组件705中的一者或多者。
其中,处理器701用于控制该电子设备700的整体操作,以完成上述的医学影像报告的处理方法中的全部或部分步骤。存储器702用于存储各种类型的数据以支持在该电子设备700的操作,这些数据例如可以包括用于在该电子设备700上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器702可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件703可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器702或通过通信组件705发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口704为处理器701和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件705用于该电子设备700与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G、4G、NB-IOT、eMTC、或其他5G等等,或它们中的一种或几种的组合,在此不做限定。因此相应的该通信组件705可以包括:Wi-Fi模块,蓝牙模块,NFC模块等等。
在一示例性实施例中,电子设备700可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的医学影像报告的处理方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的医学影像报告的处理方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器702,上述程序指令可由电子设备700的处理器701执行以完成上述的医学影像报告的处理方法。
图11是根据一示例性实施例示出的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器。参照图11,电子设备1900包括处理器1922,其数量可以为一个或多个,以及存储器1932,用于存储可由处理器1922执行的计算机程序。存储器1932中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理器1922可以被配置为执行该计算机程序,以执行上述的医学影像报告的处理方法。
另外,电子设备1900还可以包括电源组件1926和通信组件1950,该电源组件1926可以被配置为执行电子设备1900的电源管理,该通信组件1950可以被配置为实现电子设备1900的通信,例如,有线或无线通信。此外,该电子设备1900还可以包括输入/输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM等等。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的医学影像报告的处理方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器1932,上述程序指令可由电子设备1900的处理器1922执行以完成上述的医学影像报告的处理方法。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的医学影像报告的处理方法的代码部分。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
Claims (10)
1.一种医学影像报告的处理方法,其特征在于,所述医学影像报告包括影像所见数据,所述方法包括:
标注所述影像所见数据中的实体信息和属性信息,所述实体信息包括实体名称和实体内容,所述实体内容中包括至少一条所述属性信息;
将所有所述实体信息输入实体分类模型,得到所述实体分类模型输出的候选实体信息,将所述候选实体信息的所述实体名称作为候选实体名称;
将所有所述候选实体信息的所述属性信息输入属性分类模型,得到所述属性分类模型输出的分别对应于各所述候选实体信息的候选属性信息;
将每一所述候选实体名称与该候选实体名称对应的所述候选属性信息进行关联展示。
2.根据权利要求1所述的方法,其特征在于,所述实体分类模型包括对应不同实体名称的实体二分类模型,所述实体分类模型用于:
针对每一所述实体信息,将所述影像所见数据中与该实体信息相关联的句子输入与该实体信息的所述实体名称对应的所述实体二分类模型,得到所述实体二分类模型输出的表征该实体信息是否为所述候选实体信息的结果;
所述实体二分类模型的训练过程包括:
获取历史医学影像报告,所述历史医学影像报告包括历史影像所见数据以及历史结论数据,该历史影像所见数据标注有第一实体信息,该历史结论数据标注有第二实体信息;
对该历史影像所见数据中与所述第一实体信息关联的句子添加分类标签,该分类标签用于表征该历史结论数据中是否存在与该第一实体信息的实体名称相同的所述第二实体信息;
将该历史影像所见数据中的标注有所述分类标签的句子作为训练样本训练得到与所述第一实体信息的所述实体名称对应的所述实体二分类模型。
3.根据权利要求1所述的方法,其特征在于,所述属性分类模型包括对应不同属性名称的属性二分类模型,所述属性分类模型用于:
针对每一所述属性信息,将所述影像所见数据中与该属性信息相关联的句子输入与该属性信息的所述属性名称对应的所述属性二分类模型,得到所述属性二分类模型输出的表征该属性信息是否为所述候选属性信息的结果;
所述属性二分类模型的训练过程包括:
获取历史医学影像报告,所述历史医学影像报告包括历史影像所见数据以及历史结论数据,该历史影像所见数据标注有第一属性信息,该历史结论数据标注有第二属性信息;
对该历史影像所见数据中与所述第一属性信息关联的句子添加分类标签,该分类标签用于表征该历史结论数据中是否存在与该第一属性信息的属性名称相同的所述第二属性信息;
将该历史影像所见数据中的标注有所述分类标签的句子作为训练样本训练得到与所述第一属性信息的所述属性名称对应的所述属性二分类模型。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述将每一所述候选实体名称与该候选实体名称对应的所述候选属性信息进行关联展示,包括:
在多个所述候选实体信息的所述候选属性信息之间的相似度大于预设阈值的情况下,将该多个所述候选实体信息的所述候选实体名称合并为综合候选实体名称,所述综合候选实体名称为该多个所述候选实体信息的所述候选实体名称的总称;
将所述综合候选实体名称与该多个所述候选实体信息的所述候选属性信息进行关联展示。
5.根据权利要求1所述的方法,其特征在于,所述标注所述影像所见数据中的实体信息和属性信息,包括:
将所述影像所见数据输入命名实体识别模型,得到所述命名实体识别模型输出的实体信息和属性信息标注结果;
其中,所述命名实体识别模型是通过如下方式进行训练得到的:
将已标注的影像所见数据作为所述命名实体识别模型的训练样本数据,其中,所述已标注的影像所见数据是根据与影像检测部位对应的实体标签集和与该实体标签集对应的属性标签集进行标注的;
根据所述训练样本数据训练得到所述命名实体识别模型。
6.根据权利要求5所述的方法,其特征在于,所述命名实体识别模型还用于,在所述影像所见数据中的同一数据段中识别到采用预设关联词关联的多个所述实体信息的情况下,将该数据段中的所述属性信息作为共享属性信息标注给该多个所述实体信息。
7.根据权利要求1-3中任一项所述的方法,其特征在于,所述方法还包括:
响应于用户的选择操作,确定用户从所述候选实体名称中选择的目标实体名称,以及从所述目标实体名称的所述候选属性信息中选择的目标属性信息;
根据所述目标实体名称以及所述目标属性信息在所述医学影像报告中生成结论数据。
8.一种医学影像报告的处理装置,其特征在于,所述医学影像报告包括影像所见数据,所述装置包括:
标注模块,被配置为用于标注所述影像所见数据中的实体信息和属性信息,所述实体信息包括实体名称和实体内容,所述实体内容中包括至少一条所述属性信息;
第一执行模块,被配置为用于将所有所述实体信息输入实体分类模型,得到所述实体分类模型输出的候选实体信息,将所述候选实体信息的所述实体名称作为候选实体名称;
第二执行模块,被配置为用于将所有所述候选实体信息的所述属性信息输入属性分类模型,得到所述属性分类模型输出的分别对应于各所述候选实体信息的候选属性信息;
展示模块,被配置为用于将每一所述候选实体名称与该候选实体名称对应的所述候选属性信息进行关联展示。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011401966.8A CN112420150B (zh) | 2020-12-02 | 2020-12-02 | 医学影像报告的处理方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011401966.8A CN112420150B (zh) | 2020-12-02 | 2020-12-02 | 医学影像报告的处理方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112420150A true CN112420150A (zh) | 2021-02-26 |
CN112420150B CN112420150B (zh) | 2023-11-14 |
Family
ID=74830466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011401966.8A Active CN112420150B (zh) | 2020-12-02 | 2020-12-02 | 医学影像报告的处理方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112420150B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779248A (zh) * | 2021-08-30 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 数据分类模型训练方法、数据处理方法及存储介质 |
WO2023009054A1 (zh) * | 2021-07-29 | 2023-02-02 | 脸萌有限公司 | 用于对象属性分类模型训练的方法、设备和存储介质 |
CN116364296A (zh) * | 2023-02-17 | 2023-06-30 | 中国人民解放军总医院 | 标准检查项目名称确认方法、装置、设备、介质及产品 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447183A (zh) * | 2018-11-27 | 2019-03-08 | 东软集团股份有限公司 | 模型训练方法、装置、设备以及介质 |
CN109583440A (zh) * | 2017-09-28 | 2019-04-05 | 北京西格码列顿信息技术有限公司 | 结合影像识别与报告编辑的医学影像辅助诊断方法及系统 |
CN109858562A (zh) * | 2019-02-21 | 2019-06-07 | 腾讯科技(深圳)有限公司 | 一种医学影像的分类方法、装置和存储介质 |
CN110335259A (zh) * | 2019-06-25 | 2019-10-15 | 腾讯科技(深圳)有限公司 | 一种医学影像识别方法、装置和存储介质 |
CN111026799A (zh) * | 2019-12-06 | 2020-04-17 | 安翰科技(武汉)股份有限公司 | 胶囊内窥镜检查报告文本结构化方法、设备及介质 |
CN111382801A (zh) * | 2020-03-16 | 2020-07-07 | 北京推想科技有限公司 | 一种医学影像分类方法、装置、设备及存储介质 |
CN111444686A (zh) * | 2020-03-16 | 2020-07-24 | 上海联影智能医疗科技有限公司 | 医学数据标注方法、装置、存储介质及计算机设备 |
CN111553883A (zh) * | 2020-03-31 | 2020-08-18 | 杭州依图医疗技术有限公司 | 一种医学影像的处理方法及装置、计算机设备及存储介质 |
CN111933251A (zh) * | 2020-06-24 | 2020-11-13 | 安徽影联云享医疗科技有限公司 | 一种医学影像标注方法及系统 |
-
2020
- 2020-12-02 CN CN202011401966.8A patent/CN112420150B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583440A (zh) * | 2017-09-28 | 2019-04-05 | 北京西格码列顿信息技术有限公司 | 结合影像识别与报告编辑的医学影像辅助诊断方法及系统 |
CN109447183A (zh) * | 2018-11-27 | 2019-03-08 | 东软集团股份有限公司 | 模型训练方法、装置、设备以及介质 |
CN109858562A (zh) * | 2019-02-21 | 2019-06-07 | 腾讯科技(深圳)有限公司 | 一种医学影像的分类方法、装置和存储介质 |
CN110335259A (zh) * | 2019-06-25 | 2019-10-15 | 腾讯科技(深圳)有限公司 | 一种医学影像识别方法、装置和存储介质 |
CN111026799A (zh) * | 2019-12-06 | 2020-04-17 | 安翰科技(武汉)股份有限公司 | 胶囊内窥镜检查报告文本结构化方法、设备及介质 |
CN111382801A (zh) * | 2020-03-16 | 2020-07-07 | 北京推想科技有限公司 | 一种医学影像分类方法、装置、设备及存储介质 |
CN111444686A (zh) * | 2020-03-16 | 2020-07-24 | 上海联影智能医疗科技有限公司 | 医学数据标注方法、装置、存储介质及计算机设备 |
CN111553883A (zh) * | 2020-03-31 | 2020-08-18 | 杭州依图医疗技术有限公司 | 一种医学影像的处理方法及装置、计算机设备及存储介质 |
CN111933251A (zh) * | 2020-06-24 | 2020-11-13 | 安徽影联云享医疗科技有限公司 | 一种医学影像标注方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023009054A1 (zh) * | 2021-07-29 | 2023-02-02 | 脸萌有限公司 | 用于对象属性分类模型训练的方法、设备和存储介质 |
CN113779248A (zh) * | 2021-08-30 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 数据分类模型训练方法、数据处理方法及存储介质 |
CN116364296A (zh) * | 2023-02-17 | 2023-06-30 | 中国人民解放军总医院 | 标准检查项目名称确认方法、装置、设备、介质及产品 |
CN116364296B (zh) * | 2023-02-17 | 2023-12-26 | 中国人民解放军总医院 | 标准检查项目名称确认方法、装置、设备、介质及产品 |
Also Published As
Publication number | Publication date |
---|---|
CN112420150B (zh) | 2023-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112420150B (zh) | 医学影像报告的处理方法、装置、存储介质及电子设备 | |
US9465920B2 (en) | Providing assistance with reporting | |
RU2711305C2 (ru) | Связывание отчета / изображения | |
US20160335403A1 (en) | A context sensitive medical data entry system | |
CN106407666A (zh) | 一种电子病历信息的生成方法、装置及系统 | |
US10290101B1 (en) | Heat map based medical image diagnostic mechanism | |
WO2021073157A1 (zh) | 图像管理显示方法、装置、计算机设备及存储介质 | |
US10521909B2 (en) | Information processing system, information processing method, and program | |
US20210279637A1 (en) | Label collection apparatus, label collection method, and label collection program | |
EP2657866A1 (en) | Creating a radiology report | |
CN111986182A (zh) | 辅助诊断方法、系统、电子设备及存储介质 | |
CN115831379A (zh) | 知识图谱补全方法、装置、存储介质及电子设备 | |
CN110471941B (zh) | 自动定位判断依据的方法、装置及电子设备 | |
JP2024502516A (ja) | データ注釈方法、装置、システム、デバイスおよび記憶媒体 | |
CN109299214B (zh) | 文本信息提取方法、装置、介质及电子设备 | |
US20170169192A1 (en) | Inserting structured content in itemized reports | |
JP2009128968A (ja) | 表記ゆれ解析装置 | |
CN116796020A (zh) | 一种内窥镜图像存储方法、装置、电子设备及存储介质 | |
CN113409280B (zh) | 医学影像的处理方法、标注方法和电子设备 | |
CN112819925B (zh) | 病灶标注的处理方法、装置、电子设备和介质 | |
CN109299294B (zh) | 应用中的资源搜索方法、装置、计算机设备和存储介质 | |
Cuff et al. | Statistical analysis of surgical pathology data using the R program | |
US20240029251A1 (en) | Medical image analysis apparatus, medical image analysis method, and medical image analysis program | |
CN116564483A (zh) | 医学影像报告生成方法、装置、计算机设备 | |
JP7138634B2 (ja) | 患者病歴に敏感な構造化所見オブジェクトレコメンデーションのためのシステム及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |