CN113517057A - 基于数据表示和神经网络的医疗图像信息识别存储方法 - Google Patents

基于数据表示和神经网络的医疗图像信息识别存储方法 Download PDF

Info

Publication number
CN113517057A
CN113517057A CN202111064148.8A CN202111064148A CN113517057A CN 113517057 A CN113517057 A CN 113517057A CN 202111064148 A CN202111064148 A CN 202111064148A CN 113517057 A CN113517057 A CN 113517057A
Authority
CN
China
Prior art keywords
medical image
dnn network
feature matrix
feature
dnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111064148.8A
Other languages
English (en)
Other versions
CN113517057B (zh
Inventor
庄如
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong Jianfeng Machinery Co ltd
Original Assignee
Nantong Jianfeng Machinery Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong Jianfeng Machinery Co ltd filed Critical Nantong Jianfeng Machinery Co ltd
Priority to CN202111064148.8A priority Critical patent/CN113517057B/zh
Publication of CN113517057A publication Critical patent/CN113517057A/zh
Application granted granted Critical
Publication of CN113517057B publication Critical patent/CN113517057B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Abstract

本发明涉及数据识别技术领域,具体涉及一种基于数据表示和神经网络的医疗图像信息识别存储方法。方法包括:获取将第一医疗图像集和第三医疗图像集输入到第二DNN网络得到的特征矩阵构建的第一特征矩阵集合,计算第一医疗图像集中各第一医疗图像对应的特征矩阵的第一分布密度和第二分布密度,根据L2范式及分布密度,计算两个DNN网络的特征重叠程度,进而得到第二DNN网络的合理性指标,根据计算结果判断是否将该DNN网络存储在区块链上。本发明提供了一种能够较为准确地计算DNN网络合理性的方法,解决了常规方法不能准确地衡量神经网络的准确率的问题,能够实现将准确率相对较高的神经网络存储在区块链上以实现共享。

Description

基于数据表示和神经网络的医疗图像信息识别存储方法
技术领域
本发明涉及数据识别技术领域,具体涉及一种基于数据表示和神经网络的医疗图像信息识别存储方法。
背景技术
随着医疗技术的进步,各医院纷纷利用先进的医疗设备来诊断疾病,例如利用X射线等透视成像设备、内窥镜成像设备或者核磁共振设备等,将病人的病情以图像数据的方式可视化出来,辅助医师更加快速准确的诊断出病情和确定治疗方案。
随着人工智能技术的发展,不断出现了利用各种各样的神经网络来根据医疗图像数据诊断病情的诊断方法。最常用的技术利用神经网络分割医疗图像数据,获得图像上器官的病灶区域。由于不同医院的医疗图像数据涉及到病人隐私问题,不能共享,再加上医疗图像数据标注困难,需要专业人员进行标注,导致每个医院可用于神经网络训练的数据集不会太多,使得每个医院的神经网络不能都具有较高的准确率。
为了让医院获得准确的神经网络用于医疗图像数据分析,通常的做法是判断哪个医院训练的神经网络准确率高,然后将这个神经网络共享出去,供其他医院使用;或者每个医院共享出各自训练的神经网络,然后通过联邦学习或者是其他训练方法融合不同神经网络的参数,进而获得准确率更高的神经网络。但是不管怎么样都涉及一个问题:如何确认医院所共享出来的神经网络是正确的、可信的,或者说如何从所有医院共享的神经网络中获得一个或几个准确率最高、特征学习最好的神经网络。这个问题的常规解决方法是通过神经网络在测试集上的准确率来衡量神经网络的准确率,但是医院可能存在恶意篡改自己训练的神经网络的准确率、医院训练神经网络的训练集的规模和数据集特征分布存在差异等问题,使得常规方法不能准确地衡量神经网络的准确率,无法将准确率相对较高的神经网络存储在区块链上以实现共享。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种基于数据表示和神经网络的医疗图像信息识别存储方法,所采用的技术方案具体如下:
本发明一个实施例提供了一种基于数据表示和神经网络的医疗图像信息识别存储方法,该方法包括以下步骤:
获取医疗图像;所述医疗图像包括第一医疗图像、第二医疗图像和第三医疗图像;每个所述医疗图像拥有各自对应的标签图像;获取将第一医疗图像集输入到第二DNN网络得到的特征矩阵、将第三医疗图像集输入到第二DNN网络得到的特征矩阵;所述第二DNN网络是基于第二医疗图像集训练得到的;以所述特征矩阵与所述标签图像差值的L2范数的负指数作为所述特征矩阵对应的准确率;
根据将第一医疗图像集输入到第二DNN网络得到的特征矩阵和将第三医疗图像集输入到第二DNN网络得到的特征矩阵构建第一特征矩阵集合;
计算第一医疗图像集中各第一医疗图像对应的特征矩阵在第一特征矩阵集合中的第一分布密度;
计算第一医疗图像集中各第一医疗图像对应的特征矩阵在第二特征矩阵集合中的第二分布密度,所述第二特征矩阵集合为根据第一医疗图像集中各第一医疗图像在第三DNN网络测试得到的特征矩阵和第二医疗图像集中各第二医疗图像在第三DNN网络测试得到的特征矩阵构建的,所述第三DNN网络是基于第三医疗图像集训练得到的;
计算各第一医疗图像在第二DNN网络和第三DNN网络测试得到的特征矩阵的第一L2范式距离;根据各第一医疗图像对应的第一L2范式距离、第一分布密度和第二分布密度,计算第二DNN网络和第三DNN网络的特征重叠程度;
根据第二DNN网络和第三DNN网络的特征重叠程度计算第二DNN网络的合理性指标;
根据第二DNN网络的合理性指标判断是否将第二DNN网络存储在区块链上。
优选的,采用如下计算公式计算各第一医疗图像对应的特征矩阵在第一特征矩阵集合中对应的第一分布密度:
Figure 308028DEST_PATH_IMAGE002
其中,x为任一第一医疗图像对应的特征矩阵,
Figure 100002_DEST_PATH_IMAGE003
为特征矩阵x在第一特征矩阵集合中对应的分布密度,
Figure 676528DEST_PATH_IMAGE004
为特征矩阵x对应于第二DNN网络的准确率,
Figure 100002_DEST_PATH_IMAGE005
为第一特征矩阵集合中与特征矩阵x距离在预设距离范围内的特征矩阵的集合,y为
Figure 520201DEST_PATH_IMAGE005
中任一特征矩阵,
Figure 765413DEST_PATH_IMAGE006
为特征矩阵y对应于第二DNN网络的准确率,
Figure 100002_DEST_PATH_IMAGE007
为特征矩阵x和特征矩阵y之间的第二L2范式距离。
优选的,根据各第一医疗图像对应的第一L2范式距离、第一分布密度和第二分布密度,采用如下公式计算第二DNN网络和第三DNN网络的特征重叠程度:
Figure 100002_DEST_PATH_IMAGE009
其中,
Figure 460531DEST_PATH_IMAGE010
为第二DNN网络和第三DNN网络的特征重叠程度,
Figure 100002_DEST_PATH_IMAGE011
为第一医疗图像集中的图像个数,z为第一医疗图像集中任一医疗图像,
Figure 900873DEST_PATH_IMAGE012
表示第一医疗图像集,
Figure 100002_DEST_PATH_IMAGE013
为医疗图像z在第二DNN网络测试得到的特征矩阵,
Figure 248153DEST_PATH_IMAGE014
Figure 318037DEST_PATH_IMAGE013
在第一特征矩阵集合中的分布密度,
Figure 100002_DEST_PATH_IMAGE015
为医疗图像z在第三DNN网络测试得到的特征矩阵,
Figure 81376DEST_PATH_IMAGE016
为特征矩阵
Figure 530769DEST_PATH_IMAGE015
在第二特征矩阵集合中的分布密度。
优选的,根据所述的第二DNN网络和第三DNN网络特征重叠程度计算第二DNN网络的合理性指标的方法包括:
对特征矩阵集合中准确率大于设定准确阈值的各特征矩阵进行聚类,得到多个聚类结果,将特征矩阵对应的准确率之和最大的聚类结果记为第一集合,所述特征矩阵集合包括各第一医疗图像在第二DNN网络测试得到的特征矩阵、各第三医疗图像在第二DNN网络测试得到的特征矩阵、各第一医疗图像在第三DNN网络测试得到的特征矩阵和各第二医疗图像在第三DNN网络测试得到的特征矩阵;
将所述第一医疗图像对应的特征矩阵与第一集合的交集记为第一交集;
利用第一交集中各特征矩阵的准确率更新第二DNN网络和第三DNN网络特征重叠程度;
根据更新后的第二DNN网络和第三DNN网络特征重叠程度计算第二DNN网络的合理性。
优选的,采用如下计算公式更新后的第二DNN网络和第三DNN网络特征重叠程度:
Figure 378727DEST_PATH_IMAGE018
其中,
Figure 100002_DEST_PATH_IMAGE019
表示第一交集中的任一特征矩阵,
Figure 100829DEST_PATH_IMAGE020
表示特征矩阵
Figure 61219DEST_PATH_IMAGE019
的准确率,
Figure 448557DEST_PATH_IMAGE010
表示更新前的第二DNN网络和第三DNN网络特征重叠程度,
Figure 100002_DEST_PATH_IMAGE021
表示更新后的第二DNN网络和第三DNN网络特征重叠程度,
Figure 84867DEST_PATH_IMAGE022
为第一交集。
本发明具有如下有益效果:本发明中第二DNN网络是基于第二医疗图像训练得到的,第三DNN网络是基于第三医疗图像训练得到的,本发明根据各第一医疗图像对应的第一L2范式距离、第一分布密度和第二分布密度特征矩阵的分布密度计算了第二DNN网络与第三DNN网络的特征重叠程度,各第一医疗图像对应的第一L2范式距离反映的是第二DNN网络和第三DNN网络的相似性程度高低,各第一医疗图像对应的特征矩阵在第一特征矩阵集合中的第一分布密度反映的是第二DNN网络中各特征矩阵的相似性程度高低,各第一医疗图像对应的特征矩阵在第二特征矩阵集合中的第二分布密度反映的是第三DNN网络中各特征矩阵的相似性程度高低;第二DNN网络的合理性指标可以通过其与其它DNN网络的相似性程度以及其对应的各特征矩阵的相似性程度体现出来,当第二DNN网络和其它DNN网络的相似性越高,且第二DNN网络对应的特征矩阵集合中各特征矩阵的相似性越高时,说明第二DNN网络训练的越好,合理性越高。本发明提供了一种能够较为准确地计算DNN网络合理性的方法,解决了常规方法不能准确地衡量神经网络的准确率的问题,能够实现将准确率相对较高的神经网络存储在区块链上以实现共享。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种基于数据表示和神经网络的医疗图像信息识别存储方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于数据表示和神经网络的医疗图像信息识别存储方法进行详细说明如下。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于数据表示和神经网络的医疗图像信息识别存储方法的具体方案。
基于数据表示和神经网络的医疗图像信息识别存储方法的实施例
针对常规方法不能准确地衡量神经网络的准确率以至于无法将准确率较高的神经网络进行存储共享的问题,本实施例提出了基于区块链的神经网络分布式存储方法,如图1所示,本实施例的基于数据表示和神经网络的医疗图像信息识别存储方法包括以下步骤:
步骤S1,获取将第一医疗图像集输入到第二DNN网络得到的特征矩阵、将第三医疗图像集输入到第二DNN网络得到的特征矩阵;所述第二DNN网络是基于第二医疗图像集训练得到的。
需要说明的是:本实施例中引入了医院a、医院b、医院c,医院a的医疗图像集对应第一医疗图像集,医院b的医疗图像集对应第二医疗图像集,医院c的医疗图像集对应第三医疗图像集,DNN网络a是基于医院a的医疗图像集训练出来的,DNN网络b是基于医院b的医疗图像集训练出来的,DNN网络c是基于医院c的医疗图像集训练出来的。DNN网络b对应第二DNN网络,DNN网络c对应第三DNN网络。本实施例中每个特征矩阵对应一个医疗图像,这个医疗图像来自于某个医院,虽然这个图像不能共享存储在区块链上,但是可以根据每个特征矩阵获得这个特征矩阵对应的医疗图像的ID编号的。
本实施例中对于每个医院,构建一个语义分割网络,本发明使用现有的SegNet网络等现有的结构。将医院所有带标签的医疗图像数据作为数据集,80%的数据集作为训练集,其余20%的数据集作为测试集;利用训练集训练出语义分割网络的参数,并计算出每个医院训练出的语义分割网络在每个医院测试集上的准确率。本发明中后续用DNN网络来指代这个语义分割网络。
每个医院训练出DNN网络的参数后,每个医院新生成一个区块,将训练的DNN网络存储进区块中,每个医院将各自产生的存有DNN网络的区块连接在临时区块链上。
医院a从区块链上读取出所有DNN网络,这些DNN网络不包含医院a自身所训练的DNN网络。将这些DNN网络记为集合S。
获取S中任意一个DNN网络n,将医院a的医疗图像集中的每个医疗图像输入DNN网络中,获取该DNN网络的编码器输出的特征图,将该特征图称为每个图像的特征矩阵,除此之外,每个图像输入DNN网络后,获取该DNN网络的输出结果,将输出结果和对应的标签图像做差,然后再求差值的L2范数x,将
Figure DEST_PATH_IMAGE023
作为每个图像在该DNN网络上的准确率。
本实施例中医院a的医疗图像集上的每个图像在该DNN网络上对应一个特征矩阵和一个准确率。特征矩阵用于描述该神经网络在每个图像上所提取出的特征,准确率用于描述该特征是否准确。假设医院a的医疗图像集中的第i个图像输入DNN网络获得的特征矩阵表示为
Figure 123843DEST_PATH_IMAGE024
, 准确率表示为
Figure DEST_PATH_IMAGE025
。医院a将n和i取所有值时获得的特征矩阵和准确率存储在新生成的区块中,并连接在临时区块链上。其他医院也和医院a一样获取别的医院的DNN网络在自己的医疗图像集上所获得的特征矩阵和准确率,同时将这些特征矩阵和准确率存储在临时区块链上。至此临时区块链上存储了某个医院的DNN网络在其他医院医疗图像集上提取的特征矩阵和准确率。
医院a获取出DNN网络b在其他(不是医院b的)所有医院的医疗图像集上提取的特征矩阵和对应的准确率,DNN网络b是基于医院b的医疗图像集训练出来的。
步骤S2,根据将第一医疗图像集输入到第二DNN网络得到的特征矩阵和将第三医疗图像集输入到第二DNN网络得到的特征矩阵构建第一特征矩阵集合。
本实施例中,将DNN网络b在其他(不是医院b的)所有医院的医疗图像集上提取的特征矩阵的集合作为第一特征矩阵集合。
具体地,医院a从临时区块链上获取出了DNN网络b在其他(不是医院b的)所有医院的医疗图像集上提取的特征矩阵和对应的准确率,将这些特征矩阵作为第一特征矩阵集合,并记为
Figure 989338DEST_PATH_IMAGE026
步骤S3,计算各第一医疗图像对应的特征矩阵在第一特征矩阵集合中的第一分布密度。
具体地,x为任一第一医疗图像对应的特征矩阵,获取第一特征矩阵集合中与x距离最近的K个特征矩阵
Figure DEST_PATH_IMAGE027
,特征矩阵x和
Figure 207962DEST_PATH_IMAGE027
中的一个特征矩阵y的第二L2范式距离表示为
Figure 459209DEST_PATH_IMAGE028
。特征矩阵x的分布密度表示为
Figure DEST_PATH_IMAGE029
,其中,
Figure 649486DEST_PATH_IMAGE030
表示特征矩阵x和特征矩阵y之间第二L2范式距离,距离越小,
Figure DEST_PATH_IMAGE031
越大,表示第一特征矩阵集合中特征矩阵分布越集中。
Figure 391658DEST_PATH_IMAGE032
表示y属于
Figure 760279DEST_PATH_IMAGE027
中的一个特征矩阵。
Figure DEST_PATH_IMAGE033
为特征矩阵x对应的准确率,
Figure 513867DEST_PATH_IMAGE034
为特征矩阵y对应的准确率。
Figure DEST_PATH_IMAGE035
用于表征特征矩阵x处的特征分布是否密集。
至此医院a获得了各第一医疗图像对应的特征矩阵在第一特征矩阵集合
Figure 160224DEST_PATH_IMAGE026
中的分布密度。
步骤S4,计算各第一医疗图像对应的特征矩阵在第二特征矩阵集合中的分布密度,所述第二特征矩阵集合为根据各第一医疗图像在第三DNN网络测试得到的特征矩阵和各第二医疗图像在第三DNN网络测试得到的特征矩阵构建的,所述第三DNN网络是基于第三医疗图像集训练得到的;
本实施例中,医院a同样从临时区块链上获取出了DNN网络c在其他(不是医院c的)所有医院的医疗图像集上提取的特征矩阵和对应的准确率,将这些特征矩阵作为第二特征矩阵集合,并记为
Figure 724280DEST_PATH_IMAGE036
对于医院c的DNN网络c,医院a仍然可以采用步骤S3中的方法,计算出各第一医疗图像对应的特征矩阵在第二特征矩阵集合
Figure 133309DEST_PATH_IMAGE036
中的分布密度。
步骤S5,根据第一医疗图像在第一特征矩阵集合和第二特征矩阵集合中的第一L2范式距离及分布密度,计算第二DNN网络和第三DNN网络的特征重叠程度。
在第一医疗图像集中任取一医疗图像z, 该医疗图像在DNN网络b上提取的特征矩阵
Figure DEST_PATH_IMAGE037
属于第一特征矩阵集合
Figure 541429DEST_PATH_IMAGE026
,特征矩阵
Figure 693275DEST_PATH_IMAGE037
在第一特征矩阵集合
Figure 626684DEST_PATH_IMAGE026
中的分布密度为
Figure 957347DEST_PATH_IMAGE038
;另外,医疗图像z在DNN网络c上提取的特征矩阵
Figure DEST_PATH_IMAGE039
属于第二特征矩阵集合
Figure 713557DEST_PATH_IMAGE036
,特征矩阵
Figure 151317DEST_PATH_IMAGE039
在第二特征矩阵集合
Figure 12002DEST_PATH_IMAGE036
中的分布密度为
Figure 191530DEST_PATH_IMAGE040
DNN网络b的合理性可通过其与其它DNN网络的相似性程度和自身对应的各特征矩阵的相似程度体现出来,当DNN网络b和其它DNN网络的相似程度越高,且DNN网络b对应的特征矩阵集合中各特征矩阵的相似程度越高时,说明DNN网络b合理性越高。本实施例中DNN网络b和DNN网络c的特征重叠程度可以根据这两个DNN网络的差异程度、特征矩阵在第一特征矩阵集合和第二特征矩阵集合中的密集程度表示。DNN网络b和DNN网络c的差异可以通过各第一医疗图像在DNN网络b和DNN网络c上测试得到的特征矩阵的第一L2范式距离反映出来,距离越小,分布就越密集,密集程度就越大。医疗图像z对应的特征矩阵在第一特征矩阵集合中的分布密度可以反映出各第一医疗图像在DNN网络b上测试得到的特征矩阵的密集程度的大小,医疗图像z对应的特征矩阵在第二特征矩阵集合中的分布密度可以反映出各第一医疗图像在DNN网络c上测试得到的特征矩阵的密集程度的大小。计算DNN网络b和DNN网络c的特征重叠程度公式为:
Figure 391960DEST_PATH_IMAGE009
其中,
Figure DEST_PATH_IMAGE041
为第二DNN网络和第三DNN网络的特征重叠程度,可用于表征DNN网络b与DNN网络c能否在相同的医疗图像上提取到特征分布一致性;
Figure 265842DEST_PATH_IMAGE042
为第一医疗图像集中的图像个数,z为第一医疗图像集中任一医疗图像,
Figure DEST_PATH_IMAGE043
表示第一医疗图像集。
步骤S6,根据第二DNN网络和第三DNN网络的特征重叠程度计算第二DNN网络的合理性指标。
医院a从临时区块链上读取出所有医院的DNN网络在其他所有医院(除了自己医院)的医疗图像集上所提取到的特征矩阵,每个特征矩阵都对应一个准确率。
筛选出准确率大于阈值的特征矩阵,对这些特征矩阵进行均值漂移聚类,获取多个聚类结果,计算每个聚类结果中所有特征矩阵对应的准确率之和,获取和最大的聚类结果S1。这个聚类结果S1表示特征矩阵的分布密集,且准确率之和较大,是所有医院的数据集中数据特征的主要分布情况,S1中的特征矩阵是合理的、重要的、需要被学习到的。
第一医疗图像集中的每个图像在DNN网络b和DNN网络c都对应两个特征矩阵,其中所有图像对应的所有特征矩阵中的某一部分可能在集合S1中,将这部分特征矩阵记为集合
Figure 371247DEST_PATH_IMAGE044
本实施例中,当DNN网络b和DNN网络c具有较高的重叠特征
Figure DEST_PATH_IMAGE045
时,说明这两个DNN网络的学习的特征一致,可以相互替换的,即DNN网络b可以取代DNN网络c。
集合
Figure 3566DEST_PATH_IMAGE044
中的一个特征矩阵为q,其准确率为
Figure 685434DEST_PATH_IMAGE046
,对DNN网络b和DNN网络c的重叠特征进行更新。
本实施例中,更新后的DNN网络b和DNN网络c的特征重叠程度可以根据更新前的DNN网络b和DNN网络c的特征重叠程度及集合
Figure 101547DEST_PATH_IMAGE044
中各特征矩阵对应的准确率来反映,如果更新前的DNN网络b和DNN网络c的特征重叠程度越大,说明DNN网络b和DNN网络c的学习到的特征越一致。如果集合
Figure 552471DEST_PATH_IMAGE044
中的各特征矩阵对应的准确率之和越大,说明DNN网络b和DNN网络c的重叠特征越是重要的,合理的,计算更新后的DNN网络b和DNN网络c的特征重叠程度公式为
Figure DEST_PATH_IMAGE047
Figure DEST_PATH_IMAGE048
越大,说明对于DNN网络b和c而言,DNN网络b是合理的。根据DNN网络b和DNN网络c的特征重叠程度的计算方法,可以计算出DNN网络b和其它DNN网络的特征重叠程度,通过求和的方式计算出DNN网络b的合理性指标,具体计算公式为
Figure 673059DEST_PATH_IMAGE049
,其中,Rb表示DNN网络b的合理性指标,除了DNN网络b之外的其他DNN网络的集合,本实施例中为DNN网络c和DNN网络a的集合;总的来说,如果DNN网络b和其他所有网络具有较多的重叠特征,而且这些重叠特征又是重要的、合理的情况下,DNN网络b的合理性为
Figure DEST_PATH_IMAGE050
才会大,这样的DNN网络能够学习到其他DNN网络的特征,而且还是正确的、重要的特征,那么这个DNN网络的准确率才会高。
步骤S7,根据第二DNN网络的合理性判断是否将第二DNN网络存储在区块链上。
基于上述步骤可以得到DNN网络b的合理性指标,通过类似的方法也可以获得其他DNN网络的合理性指标,比如DNN网络a的合理性指标和DNN网络c的合理性指标;为了实现对准确率较高的DNN网络的共享,本实施例将合理性指标最高的DNN网络存储在区块链上,也即当DNN网络b的合理性指标大于DNN网络a的合理性指标和DNN网络c的合理性指标时,将DNN网络b存储在区块链上以实现共享,所有医院可以利用该合理性指标较高的DNN网络b来进行医疗图像分析。
本实施例根据各第一医疗图像对应的第一L2范式距离、第一分布密度和第二分布密度计算了第二DNN网络与第三DNN网络的特征重叠程度,各第一医疗图像对应的第二L2范式距离反映的是第二DNN网络和第三DNN网络的相似性程度高低,各第一医疗图像对应的特征矩阵在第一特征矩阵集合中的第一分布密度反映的是第二DNN网络中各特征矩阵的相似性程度高低,各第一医疗图像对应的特征矩阵在第二特征矩阵集合中的第二分布密度反映的是第三DNN网络中各特征矩阵的相似性程度高低;第二DNN网络的合理性指标可以通过其与其它DNN网络的相似性程度以及其对应的各特征矩阵的相似性程度体现出来,当第二DNN网络和其它DNN网络的相似性越高,且第二DNN网络对应的特征矩阵集合中各特征矩阵的相似性越高时,说明第二DNN网络训练的越好,合理性越高。本实施例提供了一种能够较为准确地计算DNN网络合理性的方法,解决了常规方法不能准确地衡量神经网络的准确率的问题,能够实现将准确率相对较高的神经网络存储在区块链上以实现共享。

Claims (5)

1.一种基于数据表示和神经网络的医疗图像信息识别存储方法,其特征在于,该方法包括以下步骤:
获取医疗图像;所述医疗图像包括第一医疗图像、第二医疗图像和第三医疗图像;每个所述医疗图像拥有各自对应的标签图像;获取将第一医疗图像集输入到第二DNN网络得到的特征矩阵、将第三医疗图像集输入到第二DNN网络得到的特征矩阵;所述第二DNN网络是基于第二医疗图像集训练得到的;以所述特征矩阵与所述标签图像差值的L2范数的负指数作为所述特征矩阵对应的准确率;
根据将第一医疗图像集输入到第二DNN网络得到的特征矩阵和将第三医疗图像集输入到第二DNN网络得到的特征矩阵构建第一特征矩阵集合;
计算第一医疗图像集中各第一医疗图像对应的特征矩阵在第一特征矩阵集合中的第一分布密度;
计算第一医疗图像集中各第一医疗图像对应的特征矩阵在第二特征矩阵集合中的第二分布密度,所述第二特征矩阵集合为根据第一医疗图像集中各第一医疗图像在第三DNN网络测试得到的特征矩阵和第二医疗图像集中各第二医疗图像在第三DNN网络测试得到的特征矩阵构建的,所述第三DNN网络是基于第三医疗图像集训练得到的;
计算各第一医疗图像在第二DNN网络和第三DNN网络测试得到的特征矩阵的第一L2范式距离;根据各第一医疗图像对应的第一L2范式距离、第一分布密度和第二及分布密度,计算第二DNN网络和第三DNN网络的特征重叠程度;
根据第二DNN网络和第三DNN网络的特征重叠程度计算第二DNN网络的合理性指标;
根据第二DNN网络的合理性指标判断是否将第二DNN网络存储在区块链上。
2.根据权利要求1所述的一种基于数据表示和神经网络的医疗图像信息识别存储方法,其特征在于,采用如下计算公式计算各第一医疗图像对应的特征矩阵在第一特征矩阵集合中对应的第一分布密度:
Figure 878767DEST_PATH_IMAGE002
其中,x为任一第一医疗图像对应的特征矩阵,
Figure DEST_PATH_IMAGE003
为特征矩阵x在第一特征矩阵集合中对应的分布密度,
Figure 385972DEST_PATH_IMAGE004
为特征矩阵x对应的准确率,
Figure DEST_PATH_IMAGE005
为第一特征矩阵集合中与特征矩阵x距离在预设距离范围内的特征矩阵的集合,y为
Figure 444451DEST_PATH_IMAGE005
中任一特征矩阵,
Figure 87922DEST_PATH_IMAGE006
为特征矩阵y对应的准确率,
Figure DEST_PATH_IMAGE007
为特征矩阵x和特征矩阵y之间的第二L2范式距离。
3.根据权利要求1所述的一种基于数据表示和神经网络的医疗图像信息识别存储方法,其特征在于,根据各第一医疗图像对应的第一L2范式距离、第一分布密度和第二分布密度,采用如下公式计算第二DNN网络和第三DNN网络的特征重叠程度:
Figure DEST_PATH_IMAGE009
其中,
Figure 485406DEST_PATH_IMAGE010
为第二DNN网络和第三DNN网络的特征重叠程度,
Figure DEST_PATH_IMAGE011
为第一医疗图像集中的图像个数,z为第一医疗图像集中任一医疗图像,
Figure 745486DEST_PATH_IMAGE012
表示第一医疗图像集,
Figure DEST_PATH_IMAGE013
为医疗图像z在第二DNN网络测试得到的特征矩阵,
Figure 106191DEST_PATH_IMAGE014
为特征矩阵
Figure 604168DEST_PATH_IMAGE013
在第一特征矩阵集合中的分布密度,
Figure DEST_PATH_IMAGE015
为医疗图像z在第三DNN网络测试得到的特征矩阵,
Figure 906974DEST_PATH_IMAGE016
为特征矩阵
Figure 123191DEST_PATH_IMAGE015
在第二特征矩阵集合中的分布密度。
4.根据权利要求1所述的一种基于数据表示和神经网络的医疗图像信息识别存储方法,其特征在于,根据第二DNN网络和第三DNN网络特征重叠程度计算第二DNN网络的合理性指标的方法包括:
对特征矩阵集合中准确率大于设定准确阈值的各特征矩阵进行聚类,得到多个聚类结果,将特征矩阵对应的准确率之和最大的聚类结果记为第一集合,所述特征矩阵集合包括各第一医疗图像在第二DNN网络测试得到的特征矩阵、各第三医疗图像在第二DNN网络测试得到的特征矩阵、各第一医疗图像在第三DNN网络测试得到的特征矩阵和各第二医疗图像在第三DNN网络测试得到的特征矩阵;
将所述各第一医疗图像对应的特征矩阵与第一集合的交集记为第一交集;
利用第一交集中各特征矩阵的准确率更新第二DNN网络和第三DNN网络特征重叠程度;
根据更新后的第二DNN网络和第三DNN网络特征重叠程度计算第二DNN网络的合理性指标。
5.根据权利要求4所述的一种基于数据表示和神经网络的医疗图像信息识别存储方法,其特征在于,采用如下计算公式计算更新后的第二DNN网络和第三DNN网络特征重叠程度:
Figure 5697DEST_PATH_IMAGE018
其中,
Figure DEST_PATH_IMAGE019
表示第一交集中的任一特征矩阵,
Figure 889339DEST_PATH_IMAGE020
表示特征矩阵
Figure 97467DEST_PATH_IMAGE019
的准确率,
Figure 535401DEST_PATH_IMAGE010
表示更新前的第二DNN网络和第三DNN网络特征重叠程度,
Figure DEST_PATH_IMAGE021
表示更新后的第二DNN网络和第三DNN网络特征重叠程度,
Figure 736444DEST_PATH_IMAGE022
为第一交集。
CN202111064148.8A 2021-09-10 2021-09-10 基于数据表示和神经网络的医疗图像信息识别存储方法 Active CN113517057B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111064148.8A CN113517057B (zh) 2021-09-10 2021-09-10 基于数据表示和神经网络的医疗图像信息识别存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111064148.8A CN113517057B (zh) 2021-09-10 2021-09-10 基于数据表示和神经网络的医疗图像信息识别存储方法

Publications (2)

Publication Number Publication Date
CN113517057A true CN113517057A (zh) 2021-10-19
CN113517057B CN113517057B (zh) 2021-12-10

Family

ID=78063209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111064148.8A Active CN113517057B (zh) 2021-09-10 2021-09-10 基于数据表示和神经网络的医疗图像信息识别存储方法

Country Status (1)

Country Link
CN (1) CN113517057B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111180061A (zh) * 2019-12-09 2020-05-19 广东工业大学 融合区块链与联邦学习的共享医疗数据智能辅助诊断系统
CN111539402A (zh) * 2020-07-13 2020-08-14 平安国际智慧城市科技股份有限公司 基于深度学习的车道线检测方法、装置、终端及存储介质
CN112132198A (zh) * 2020-09-16 2020-12-25 建信金融科技有限责任公司 数据处理方法、装置、系统和服务器
CN112446310A (zh) * 2020-11-19 2021-03-05 杭州趣链科技有限公司 基于区块链的年龄识别系统、方法及装置
CN112765677A (zh) * 2020-12-30 2021-05-07 杭州溪塔科技有限公司 一种基于区块链的联邦学习方法、装置和系统
CN113568978A (zh) * 2021-08-01 2021-10-29 青岛农业大学 一种基于区块链中双链技术的数据共享系统及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111180061A (zh) * 2019-12-09 2020-05-19 广东工业大学 融合区块链与联邦学习的共享医疗数据智能辅助诊断系统
CN111539402A (zh) * 2020-07-13 2020-08-14 平安国际智慧城市科技股份有限公司 基于深度学习的车道线检测方法、装置、终端及存储介质
CN112132198A (zh) * 2020-09-16 2020-12-25 建信金融科技有限责任公司 数据处理方法、装置、系统和服务器
CN112446310A (zh) * 2020-11-19 2021-03-05 杭州趣链科技有限公司 基于区块链的年龄识别系统、方法及装置
CN112765677A (zh) * 2020-12-30 2021-05-07 杭州溪塔科技有限公司 一种基于区块链的联邦学习方法、装置和系统
CN113568978A (zh) * 2021-08-01 2021-10-29 青岛农业大学 一种基于区块链中双链技术的数据共享系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张利华: "基于双区块链的医疗记录安全存储与共享方案", 《计算机工程与科学》 *
邢丹: "边缘计算环境下基于区块链和联邦学习的医疗健康数据共享模型", 《医学信息学杂志》 *

Also Published As

Publication number Publication date
CN113517057B (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
CN108784655A (zh) 针对医疗患者的快速评估和后果分析
CN112614133B (zh) 一种无锚点框的三维肺结节检测模型训练方法及装置
CN110111885B (zh) 属性预测方法、装置、计算机设备及计算机可读存储介质
CN107292103A (zh) 一种预测图像生成方法及装置
CN114782394A (zh) 一种基于多模态融合网络的白内障术后视力预测系统
Shamrat et al. Analysing most efficient deep learning model to detect COVID-19 from computer tomography images
CN114005514B (zh) 医学影像诊断方法、系统及装置
Khan et al. A novel approach to predict brain cancerous tumor using transfer learning
Baskar et al. An Accurate Prediction and Diagnosis of Alzheimer’s Disease using Deep Learning
CN116452592B (zh) 脑血管病ai认知功能评测模型的构建方法、装置及系统
CN115858820B (zh) 一种基于医疗知识图谱的预测方法、装置、电子设备和存储介质
CN113517057B (zh) 基于数据表示和神经网络的医疗图像信息识别存储方法
CN116844733A (zh) 一种基于人工智能的医疗数据完整性分析方法
CN107845106A (zh) 利用改进的nndr策略的医学图像配准方法
CN116705300A (zh) 基于体征数据分析的医疗决策辅助方法、系统及存储介质
CN112200810A (zh) 多模态的自动化脑室分割系统及其使用方法
CN110610766A (zh) 基于症状特征权重推导疾病概率的装置和存储介质
Agrawal et al. BRR‐Net: A tandem architectural CNN–RNN for automatic body region localization in CT images
CN113990454A (zh) 基于联邦学习和特征提取的恶意行为识别方法
Kandel Deep Learning Techniques for Medical Image Classification
Juan et al. Integration of genetic programming and tabu search mechanism for automatic detection of magnetic resonance imaging in cervical spondylosis
CN114693753B (zh) 基于纹理保持约束的三维超声弹性配准方法及装置
Rajput et al. Identification of Pneumonia in Chest X-Ray Images using Bio-Inspired Optimization Based LSTM
CN115050479B (zh) 多中心研究的数据质量评价方法、系统及设备
Jabbar et al. Bone age assessment based on deep learning architecture

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant