CN116167411A - 分解卷积模型的训练方法、病变区域预测方法和相关设备 - Google Patents
分解卷积模型的训练方法、病变区域预测方法和相关设备 Download PDFInfo
- Publication number
- CN116167411A CN116167411A CN202111393248.5A CN202111393248A CN116167411A CN 116167411 A CN116167411 A CN 116167411A CN 202111393248 A CN202111393248 A CN 202111393248A CN 116167411 A CN116167411 A CN 116167411A
- Authority
- CN
- China
- Prior art keywords
- model
- low
- training
- decomposition
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 102
- 238000000034 method Methods 0.000 title claims abstract description 90
- 230000003902 lesion Effects 0.000 title claims abstract description 79
- 238000001228 spectrum Methods 0.000 claims abstract description 81
- 238000004364 calculation method Methods 0.000 claims abstract description 50
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 33
- 230000008569 process Effects 0.000 claims abstract description 29
- 238000001514 detection method Methods 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims description 119
- 239000013598 vector Substances 0.000 claims description 47
- 230000003595 spectral effect Effects 0.000 claims description 24
- 238000010606 normalization Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 241000486463 Eugraphe sigma Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本公开提供了一种分解卷积模型的训练方法、病变区域预测方法和相关设备,在模型训练过程中,卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对训练数据做两次卷积运算,单次卷积的计算复杂度降低,实现模型参数的减少。并且,对两个低秩矩阵的值进行谱标准化,从而确保两个低秩矩阵不会出现过大奇异值,有效提高泛化能力,保证训练所得分解卷积模型的理想性能。应用时,分解卷积模型部署在计算资源有限的本体硬件设备上,分解卷积模型提取病例图像的特征图,并由目标检测模型对特征图进行处理,从而识别到病例图像上的病变区域和病变信息,病例数据保密性高,且识别精准。
Description
技术领域
本公开涉及模型训练技术领域,特别涉及一种分解卷积模型的训练方法、病变区域预测方法和相关设备。
背景技术
AI医学影像辅助诊断是利用人工智能在图像处理上的能力,实现诸如病灶检测、目标脏器分割、风险程度评估、病灶类型分类、器官、组织标记定位与分割等功能技术,以满足病灶识别与标记、疾病类型分类、影像三维重建乃至放疗靶区自动勾画等临床辅助需求,为医生阅片和勾画提供辅助和参考。在医疗显示设备上部署AI医学影像辅助诊断系统将成为未来产品的新趋势。但由于医疗显示设备计算资源有限,而AI医学影像辅助诊断所依赖的卷积网络模型计算开销大,使得二者的结合成为两难。
发明内容
本公开目的在于:提供了一种分解卷积模型的训练方法、病变区域预测方法和相关设备,其基于谱标准化分解卷积层训练得到的分解卷积模型计算开销小,能够部署在有限计算资源的硬件设备上,且具有理想的性能。
为达上述目的,本公开采用以下技术方案:一种分解卷积模型的训练方法,包括:
获取训练数据;
将所述训练数据输入卷积神经网络进行模型训练,在训练过程中,所述卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对所述训练数据做两次卷积运算,并对两个所述低秩矩阵的值进行谱标准化;
循环迭代模型训练的步骤,直至模型收敛,得到分解卷积模型。
本公开还提供了一种病变区域预测方法,包括:
获取病例图像;
将所述病例图像输入分解卷积模型进行特征提取,得到所述病例图像对应的特征图,其中,所述分解卷积模型由如上任一所述的分解卷积模型的训练方法训练得到;
将所述特征图输入目标检测模型,识别并标示出所述病例图像上的病变区域和病变信息。
本公开还提供了一种分解卷积模型的训练装置,包括:
第一获取模块,用于获取训练数据;
训练模块,用于将所述训练数据输入卷积神经网络进行模型训练,在训练过程中,所述卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对所述训练数据做两次卷积运算,并对两个所述低秩矩阵的值进行谱标准化;
循环模块,用于循环迭代模型训练的步骤,直至模型收敛,得到分解卷积模型。
本公开还提供了一种病变区域预测装置,包括:
第二获取模块,用于获取病例图像;
提取模块,用于将所述病例图像输入分解卷积模型进行特征提取,得到所述病例图像对应的特征图,其中,所述分解卷积模型由如上任一所述的分解卷积模型的训练方法训练得到;
识别模块,用于将所述特征图输入目标检测模型,识别并标示出所述病例图像上的病变区域和病变信息。
本公开还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本公开中提供的一种分解卷积模型的训练方法、病变区域预测方法和相关设备,在模型训练过程中,卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对训练数据做两次卷积运算,单次卷积的计算复杂度降低,实现模型参数的减少。并且,对两个低秩矩阵的值进行谱标准化,从而确保两个低秩矩阵不会出现过大奇异值,有效提高泛化能力,保证训练所得分解卷积模型的理想性能。应用时,分解卷积模型部署在计算资源有限的本体硬件设备上,分解卷积模型提取病例图像的特征图,并由目标检测模型对特征图进行处理,从而识别到病例图像上的病变区域和病变信息,病例数据保密性高,且识别精准。
附图说明
图1是本公开一实施例中分解卷积模型的训练方法的步骤示意图;
图2是本公开一实施例中病变区域预测方法的步骤示意图;
图3是本公开一实施例中分解卷积模型的训练装置的整体结构框图;
图4是本公开一实施例中病变区域预测装置的整体结构框图;
图5是本公开一实施例的计算机设备的结构示意框图。
本公开目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本公开的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本公开进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本公开,并不用于限定本公开。
参照图1,本公开一实施例中提供了一种分解卷积模型的训练方法,其中,包括:
S1:获取训练数据;
S2:将所述训练数据输入卷积神经网络进行模型训练,在训练过程中,所述卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对所述训练数据做两次卷积运算,并对两个所述低秩矩阵的值进行谱标准化;
S3:循环迭代模型训练的步骤,直至模型收敛,得到分解卷积模型。
优选的,两个所述低秩矩阵根据所述谱标准化分解卷积层对应的标准卷积层的权重矩阵按照所述标准卷积层的卷积核参数分解得到。
本实施例中,训练系统获取用户输入或预存的训练数据,然后将训练数据输入预先构建好网络架构的卷积神经网络中进行模型训练。与现有技术的常规卷积神经网络相比,本实施例的卷积神经网络使用谱标准化分解卷积层替代了现有的标准卷积层(即现有的常规卷积神经网络中的标准卷积层全部替换成谱标准化分解卷积层,则得到本实施例的卷积神经网络)。具体地,谱标准化分解卷积层包含两个低秩矩阵,这两个低秩矩阵是根据谱标准化分解卷积层对应的标准卷积层的权重矩阵,按照标准卷积层的卷积核参数分解得到。在模型训练的过程中,卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对训练数据做了两次卷积运算(卷积运算的逻辑与常规的卷积操作相同),从而起到降低计算开销的作用(计算开销包括训练系统对应的硬件设备的内存和CPU/GPU)。卷积神经网络的网络结构引入分解卷积后,卷积的前向推理和后向传播梯度更新都基于两个低秩矩阵。对于分解卷积的两个低秩矩阵,在模型训练中很容易出现过高奇异值,使得卷积权重被奇异值方向所控制,这不利于泛化性能。良好的泛化性能,是权重趋向于零,但不等于零;而过高奇异值,会出现偏大的权重,影响到泛化性能。因此,谱标准化分解卷积层在训练过程中还会对两个低秩矩阵的值进行谱标准化,以确保这两个低秩矩阵不会出现过大奇异值,从而帮助提高泛化性能,保证训练后所得的分解卷积模型的理想性能。训练系统循环迭代模型训练的步骤,直至模型收敛时停止模型训练,得到所需的分解卷积模型(本实施例中分解卷积模型的训练逻辑与现有模型训练的逻辑相同,区别只在于谱标准化分解卷积层对训练数据的处理逻辑,因此对谱标准化分解卷积层的处理逻辑之外的训练动作不做详述)。
本实施例在模型训练过程中,卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对训练数据做两次卷积运算,单次卷积的计算复杂度降低,实现模型参数的减少。并且,对两个低秩矩阵的值进行谱标准化,从而确保两个低秩矩阵不会出现过大奇异值,有效提高泛化能力,保证训练所得分解卷积模型的理想性能。
进一步的,所述卷积核参数包括卷积核的输入通道数ci、输出通道数co以及卷积核大小k×k;
所述权重矩阵的大小为m×n,其中,m=ci×k,n=co×k;
两个所述低秩矩阵分别为低秩矩阵P和低秩矩阵Q,其中,所述低秩矩阵P的大小为m×r,所述低秩矩阵Q的大小为r×n,r表征所述低秩矩阵P和所述低秩矩阵Q的秩,r<<min{m,n}。
本实施例中,假设2D标准卷积层的权重矩阵W大小为m×n,其中,m=ci×k,n=co×k,ci表征卷积核的输入通道数,co表征卷积层的输出通道数,k×k表征卷积核大小。假设输入特征图Fi,大小为ci×hi×wi;及其输出特征图Fo,大小为co×ho×wo;标准卷积的前向计算过程可表示为:其中表示循环卷积过程。考虑循环卷积过程的单次卷积,其计算复杂度为o(cicok2)。将权重矩阵W分解为两个低秩矩阵P和低秩矩阵Q,即W≈P×Q,其中,低秩矩阵P的大小为m×r,低秩矩阵Q的大小为r×n,r表征低秩矩阵P和低秩矩阵Q的秩,r<<min{m,n},即低秩矩阵P和低秩矩阵Q的秩r远小于m和n的最小值,起到大幅度降低模型参数的作用。在将2D标准卷积层的权重矩阵分解为两个低秩矩阵后,得到本实施例的谱标准化分解卷积层;在前向推理过程中,利用谱标准化分解卷积层的两个低秩矩阵分两次完成卷积操作,从而起到降低计算开销的作用。具体地,谱标准化分解卷积层将标准卷积层k×k卷积核的依次运算分解为两个1×k卷积核的两次运算,其中,低秩矩阵Q重组为卷积核r×ci×1×k,矩阵P重组为co×1×k×r,然后分别进行一次卷积操作。分解卷积的前向计算过程表示为:谱标准化分解卷积层的单次卷积的计算复杂度为:o(cikr+cokr)。由此可以看出,谱标准化分解卷积层的计算复杂度相比于标准卷积层的计算复杂度大幅减少。
进一步的,所述对两个所述低秩矩阵的值进行谱标准化的步骤,包括:
S201:获取两个所述低秩矩阵的乘积矩阵,并计算所述乘积矩阵的谱范数;
本实施例中,矩阵的奇异值对应着矩阵隐含的重要信息,且重要性与奇异值大小呈正相关。奇异值分解将矩阵A分解成若干个秩一矩阵之和,如下式:其中等式右边每一项前的系数σ就是奇异值,u和v分别表示对应奇异值的左右列向量。每个矩阵都可以表示为一系列秩为1的小矩阵之和,奇异值则衡量这些秩1矩阵对矩阵的贡献,越大的奇异值贡献越大。谱范数就是一个矩阵的最大奇异值,即σmax,谱范数所对应的秩1矩阵包含了矩阵A中最重要的信息。
在模型训练的过程中,训练系统首先计算低秩矩阵P和低秩矩阵Q的乘积矩阵W,然后通过对乘积矩阵W进行奇异值分解,得到乘积矩阵W的谱范数(谱范数即最大奇异值)。有了谱范数后,就可以根据该谱范数对低秩矩阵P和低秩矩阵Q中的值进行谱标准化。具体地,谱标准化的计算公式为:σ表征谱范数,P表征低秩矩阵的值,表征谱标准化后低秩矩阵P的值,Q表征低秩矩阵的值,表征谱标准化后低秩矩阵Q的值。在将两个低秩矩阵的值进行谱标准化后,能够确保这两个低秩矩阵不会出现过大的奇异值,从而帮助提高泛化性能,有效提高训练后得到的分解卷积模型的模型性能。
进一步的,所述计算所述乘积矩阵的谱范数的步骤,包括:
S2011:分别计算对应所述乘积矩阵的奇异值的左列向量和右列向量,其中,对应所述乘积矩阵的奇异值的左列向量的第一计算式为:un←W·vn-1,对应所述乘积矩阵的奇异值的右列向量的第二计算式为:vn←W·un,n为幂迭代次数,W表征所述乘积矩阵,u表征所述左列向量,v表征所述右列向量;
本实施例中,训练系统采用幂迭代法来近似求解乘积矩阵W的谱范数,相比于上述通过对乘积矩阵W进行奇异值分解得到谱范数,能够降低计算开销,降低模型训练的应用硬件设备的资源压力。具体地,训练系统调用第一计算式和第二计算式,分别计算对应乘积矩阵的奇异值的左列向量和右列向量。其中,第一计算式为:un←W·vn-1,第二计算式为vn←W·un,n为幂迭代次数,W表征乘积矩阵,u表征左列向量,v表征右列向量;当n等于1时,vn-1可以是一个随机向量(比如从高斯分布中采样得到)。然后,调用第三计算式,并将上述的左列向量和右列向量代入第三计算式中,通过迭代,计算得到谱范数的近似值σ,即最大奇异值。
参照图2,本公开一实施例还提供了一种病变区域预测方法,其中,包括:
A1:获取病例图像;
A2:将所述病例图像输入分解卷积模型进行特征提取,得到所述病例图像对应的特征图,其中,所述分解卷积模型由如上任一所述的分解卷积模型的训练方法训练得到;
A3:将所述特征图输入目标检测模型,识别并标示出所述病例图像上的病变区域和病变信息。
本实施例中,预测系统获取用户输入的病例图像(比如Chest X-ray,胸部X射线照片),然后将病例图像输入分解卷积模型中进行特征提取,得到病例图像对应的特征图。其中,分解卷积模型由上述的分解卷积模型的训练方法训练得到,其模型参数少,计算复杂度低,但仍保持有理想的模型性能。预测系统将特征图输入目标检测模型中进行处理,从而识别出病例图像上的病变区域,并在病例图像上将病变区域标示出来。其中,目标检测模型使用病例图像作为训练数据(作为训练数据的病例图像标注有病例信息),通过深度学习训练得到,训练后的目标检测模型可以识别出输入图像中的病变区域和病变信息(比如疾病种类以及对应的患病概率)。优选的,分解卷积模型和目标检测模型部署在本地硬件设备上,比如医疗显示设备;由于分解卷积模型的模型参数少,能够大幅度降低计算复杂度,从而适用于计算资源有限的本地硬件设备。并且,模型部署在本地硬件设备上,能够保证病例数据的安全性,以及避免网络传输的不稳定性,提高对病例图像中病变区域和病变信息的识别速度。
进一步的,其中,所述将所述特征图输入目标检测模型,识别并标示出所述病例图像上的病变区域和病变信息的步骤之后,包括:
A4:根据所述病变信息搜索对应的治疗信息,并将所述治疗信息与所述病变区域进行关联;
A5:将标示有所述治疗信息、所述病变信息和所述病变区域的病例图像输出到医疗显示设备的显示界面进行展示。
本实施例中,预测系统根据预测得到的病变信息通过联网搜索或者在本地数据库进行搜索,从而获取与该病变信息对应的治疗信息(比如治疗手段,治疗药物,以及治愈概率等信息),并将该治疗信息与病变区域进行关联。然后,预测系统将标示有治疗信息、病变信息和病变区域的病例图像出书到医疗显示设备的显示界面进行展示,为医生阅片提供辅助和参考。
参照图3,本公开一实施例还提供了一种分解卷积模型的训练装置,其中,包括:
第一获取模块1,用于获取训练数据;
训练模块2,用于将所述训练数据输入卷积神经网络进行模型训练,在训练过程中,所述卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对所述训练数据做两次卷积运算,并对两个所述低秩矩阵的值进行谱标准化;
循环模块3,用于循环迭代模型训练的步骤,直至模型收敛,得到分解卷积模型。
优选的,两个所述低秩矩阵根据所述谱标准化分解卷积层对应的标准卷积层的权重矩阵按照所述标准卷积层的卷积核参数分解得到。
优选的,所述卷积核参数包括卷积核的输入通道数ci、输出通道数co以及卷积核大小k×k;
所述权重矩阵的大小为m×n,其中,m=ci×k,n=co×k;
两个所述低秩矩阵分别为低秩矩阵P和低秩矩阵Q,其中,所述低秩矩阵P的大小为m×r,所述低秩矩阵Q的大小为r×n,r表征所述低秩矩阵P和所述低秩矩阵Q的秩,r<<min{m,n}。
进一步的,所述训练模块2,包括:
计算单元,用于获取两个所述低秩矩阵的乘积矩阵,并计算所述乘积矩阵的谱范数;
进一步的,所述计算单元,包括:
第一计算子单元,用于分别计算对应所述乘积矩阵的奇异值的左列向量和右列向量,其中,对应所述乘积矩阵的奇异值的左列向量的第一计算式为:un←W·vn-1,对应所述乘积矩阵的奇异值的右列向量的第二计算式为:vn←W·un,n为幂迭代次数,W表征所述乘积矩阵,u表征所述左列向量,v表征所述右列向量;
本实施例中,分解卷积模型的训练装置中各模块、单元、子单元用于对应执行与上述分解卷积模型的训练方法中的各个步骤,其具体实施过程在此不做详述。
参照图4,本公开一实施例还提供了一种病变区域预测装置,其中,包括:
第二获取模块4,用于获取病例图像;
提取模块5,用于将所述病例图像输入分解卷积模型进行特征提取,得到所述病例图像对应的特征图,其中,所述分解卷积模型由如上任一所述的分解卷积模型的训练方法训练得到;
识别模块6,用于将所述特征图输入目标检测模型,识别并标示出所述病例图像上的病变区域和病变信息。
进一步的,病变区域预测装置还包括:
搜索模块7,用于根据所述病变信息搜索对应的治疗信息,并将所述治疗信息与所述病变区域进行关联;
展示模块8,用于将标示有所述治疗信息、所述病变信息和所述病变区域的病例图像输出到医疗显示设备的显示界面进行展示。
本实施例中,病变区域预测装置的训练装置中各模块用于对应执行与上述病变区域预测方法中的各个步骤,其具体实施过程在此不做详述。
本实施例提供的一种分解卷积模型的训练装置和病变区域预测装置,在模型训练过程中,卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对训练数据做两次卷积运算,单次卷积的计算复杂度降低,实现模型参数的减少。并且,对两个低秩矩阵的值进行谱标准化,从而确保两个低秩矩阵不会出现过大奇异值,有效提高泛化能力,保证训练所得分解卷积模型的理想性能。应用时,分解卷积模型部署在计算资源有限的本体硬件设备上,分解卷积模型提取病例图像的特征图,并由目标检测模型对特征图进行处理,从而识别到病例图像上的病变区域和病变信息,病例数据保密性高,且识别精准。
参照图5,本公开实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储卷积神经网络等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种分解卷积模型的训练方法和一种病变区域预测方法。
上述处理器执行上述分解卷积模型的训练方法的步骤:
S1:获取训练数据;
S2:将所述训练数据输入卷积神经网络进行模型训练,在训练过程中,所述卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对所述训练数据做两次卷积运算,并对两个所述低秩矩阵的值进行谱标准化;
S3:循环迭代模型训练的步骤,直至模型收敛,得到分解卷积模型。
优选的,两个所述低秩矩阵根据所述谱标准化分解卷积层对应的标准卷积层的权重矩阵按照所述标准卷积层的卷积核参数分解得到。
进一步的,所述卷积核参数包括卷积核的输入通道数ci、输出通道数co以及卷积核大小k×k;
所述权重矩阵的大小为m×n,其中,m=ci×k,n=co×k;
两个所述低秩矩阵分别为低秩矩阵P和低秩矩阵Q,其中,所述低秩矩阵P的大小为m×r,所述低秩矩阵Q的大小为r×n,r表征所述低秩矩阵P和所述低秩矩阵Q的秩,r<<min{m,n}。
进一步的,所述对两个所述低秩矩阵的值进行谱标准化的步骤,包括:
S201:获取两个所述低秩矩阵的乘积矩阵,并计算所述乘积矩阵的谱范数;
进一步的,所述计算所述乘积矩阵的谱范数的步骤,包括:
S2011:分别计算对应所述乘积矩阵的奇异值的左列向量和右列向量,其中,对应所述乘积矩阵的奇异值的左列向量的第一计算式为:un←W·vn-1,对应所述乘积矩阵的奇异值的右列向量的第二计算式为:vn←W·un,n为幂迭代次数,W表征所述乘积矩阵,u表征所述左列向量,v表征所述右列向量;
上述处理器执行上述病变区域预测方法的步骤:
A1:获取病例图像;
A2:将所述病例图像输入分解卷积模型进行特征提取,得到所述病例图像对应的特征图,其中,所述分解卷积模型由如上任一所述的分解卷积模型的训练方法训练得到;
A3:将所述特征图输入目标检测模型,识别并标示出所述病例图像上的病变区域和病变信息。
进一步的,其中,所述将所述特征图输入目标检测模型,识别并标示出所述病例图像上的病变区域和病变信息的步骤之后,包括:
A4:根据所述病变信息搜索对应的治疗信息,并将所述治疗信息与所述病变区域进行关联;
A5:将标示有所述治疗信息、所述病变信息和所述病变区域的病例图像输出到医疗显示设备的显示界面进行展示。
本公开一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种分解卷积模型的训练方法和一种病变区域预测方法,所述分解卷积模型的训练方法具体为:
S1:获取训练数据;
S2:将所述训练数据输入卷积神经网络进行模型训练,在训练过程中,所述卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对所述训练数据做两次卷积运算,并对两个所述低秩矩阵的值进行谱标准化;
S3:循环迭代模型训练的步骤,直至模型收敛,得到分解卷积模型。
优选的,两个所述低秩矩阵根据所述谱标准化分解卷积层对应的标准卷积层的权重矩阵按照所述标准卷积层的卷积核参数分解得到。
进一步的,所述卷积核参数包括卷积核的输入通道数ci、输出通道数co以及卷积核大小k×k;
所述权重矩阵的大小为m×n,其中,m=ci×k,n=co×k;
两个所述低秩矩阵分别为低秩矩阵P和低秩矩阵Q,其中,所述低秩矩阵P的大小为m×r,所述低秩矩阵Q的大小为r×n,r表征所述低秩矩阵P和所述低秩矩阵Q的秩,r<<min{m,n}。
进一步的,所述对两个所述低秩矩阵的值进行谱标准化的步骤,包括:
S201:获取两个所述低秩矩阵的乘积矩阵,并计算所述乘积矩阵的谱范数;
进一步的,所述计算所述乘积矩阵的谱范数的步骤,包括:
S2011:分别计算对应所述乘积矩阵的奇异值的左列向量和右列向量,其中,对应所述乘积矩阵的奇异值的左列向量的第一计算式为:un←W·vn-1,对应所述乘积矩阵的奇异值的右列向量的第二计算式为:vn←W·un,n为幂迭代次数,W表征所述乘积矩阵,u表征所述左列向量,v表征所述右列向量;
所述病变区域预测方法具体为:
A1:获取病例图像;
A2:将所述病例图像输入分解卷积模型进行特征提取,得到所述病例图像对应的特征图,其中,所述分解卷积模型由如上任一所述的分解卷积模型的训练方法训练得到;
A3:将所述特征图输入目标检测模型,识别并标示出所述病例图像上的病变区域和病变信息。
进一步的,其中,所述将所述特征图输入目标检测模型,识别并标示出所述病例图像上的病变区域和病变信息的步骤之后,包括:
A4:根据所述病变信息搜索对应的治疗信息,并将所述治疗信息与所述病变区域进行关联;
A5:将标示有所述治疗信息、所述病变信息和所述病变区域的病例图像输出到医疗显示设备的显示界面进行展示。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本公开所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、第一物体或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、第一物体或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、第一物体或者方法中还存在另外的相同要素。
以上所述仅为本公开的优选实施例,并非因此限制本公开的专利范围,凡是利用本公开说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本公开的专利保护范围内。
Claims (10)
1.一种分解卷积模型的训练方法,其中,包括:
获取训练数据;
将所述训练数据输入卷积神经网络进行模型训练,在训练过程中,所述卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对所述训练数据做两次卷积运算,并对两个所述低秩矩阵的值进行谱标准化;
循环迭代模型训练的步骤,直至模型收敛,得到分解卷积模型。
2.根据权利要求1所述的分解卷积模型的训练方法,其中,两个所述低秩矩阵根据所述谱标准化分解卷积层对应的标准卷积层的权重矩阵按照所述标准卷积层的卷积核参数分解得到。
3.根据权利要求2所述的分解卷积模型的训练方法,其中,所述卷积核参数包括卷积核的输入通道数ci、输出通道数co以及卷积核大小k×k;
所述权重矩阵的大小为m×n,其中,m=ci×k,n=co×k;
两个所述低秩矩阵分别为低秩矩阵P和低秩矩阵Q,其中,所述低秩矩阵P的大小为m×r,所述低秩矩阵Q的大小为r×n,r表征所述低秩矩阵P和所述低秩矩阵Q的秩,r<<min{m,n}。
6.一种病变区域预测方法,其中,包括:
获取病例图像;
将所述病例图像输入分解卷积模型进行特征提取,得到所述病例图像对应的特征图,其中,所述分解卷积模型由权利要求1—5中任一所述的分解卷积模型的训练方法训练得到;
将所述特征图输入目标检测模型,识别并标示出所述病例图像上的病变区域和病变信息。
7.一种分解卷积模型的训练装置,其中,包括:
第一获取模块,用于获取训练数据;
训练模块,用于将所述训练数据输入卷积神经网络进行模型训练,在训练过程中,所述卷积神经网络的谱标准化分解卷积层根据自身的两个低秩矩阵对所述训练数据做两次卷积运算,并对两个所述低秩矩阵的值进行谱标准化;
循环模块,用于循环迭代模型训练的步骤,直至模型收敛,得到分解卷积模型。
8.一种病变区域预测装置,其中,包括:
第二获取模块,用于获取病例图像;
提取模块,用于将所述病例图像输入分解卷积模型进行特征提取,得到所述病例图像对应的特征图,其中,所述分解卷积模型由权利要求1—5中任一所述的分解卷积模型的训练方法训练得到;
识别模块,将所述特征图输入目标检测模型,识别并标示出所述病例图像上的病变区域和病变信息。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其中,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述分解卷积模型的训练方法的步骤以及实现权利要求6所述病变区域预测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述分解卷积模型的训练方法的步骤以及实现权利要求6所述病变区域预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111393248.5A CN116167411A (zh) | 2021-11-23 | 2021-11-23 | 分解卷积模型的训练方法、病变区域预测方法和相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111393248.5A CN116167411A (zh) | 2021-11-23 | 2021-11-23 | 分解卷积模型的训练方法、病变区域预测方法和相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116167411A true CN116167411A (zh) | 2023-05-26 |
Family
ID=86418686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111393248.5A Pending CN116167411A (zh) | 2021-11-23 | 2021-11-23 | 分解卷积模型的训练方法、病变区域预测方法和相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116167411A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116503671A (zh) * | 2023-06-25 | 2023-07-28 | 电子科技大学 | 基于有效秩张量近似的残差网络压缩的图像分类方法 |
-
2021
- 2021-11-23 CN CN202111393248.5A patent/CN116167411A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116503671A (zh) * | 2023-06-25 | 2023-07-28 | 电子科技大学 | 基于有效秩张量近似的残差网络压缩的图像分类方法 |
CN116503671B (zh) * | 2023-06-25 | 2023-08-29 | 电子科技大学 | 基于有效秩张量近似的残差网络压缩的图像分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020215557A1 (zh) | 医学影像解释方法、装置、计算机设备及存储介质 | |
CN111291755B (zh) | 对象检测模型训练及对象检测方法、装置、计算机设备和存储介质 | |
CN109255392B (zh) | 基于非局部神经网络的视频分类方法、装置及设备 | |
CN111275703B (zh) | 图像检测方法、装置、计算机设备和存储介质 | |
WO2020010602A1 (zh) | 一种非线性非负矩阵分解人脸识别构建方法、系统及存储介质 | |
CN113688912B (zh) | 基于人工智能的对抗样本生成方法、装置、设备及介质 | |
US11682110B2 (en) | Modularized adaptive processing neural network (MAP-NN) for low-dose CT | |
Yang et al. | A sparse logistic regression framework by difference of convex functions programming | |
CN116167411A (zh) | 分解卷积模型的训练方法、病变区域预测方法和相关设备 | |
CN110083842A (zh) | 译文质量检测方法、装置、机器翻译系统和存储介质 | |
CN112529029B (zh) | 信息处理方法、装置及存储介质 | |
CN109101984B (zh) | 一种基于卷积神经网络的图像识别方法及装置 | |
CN110929730A (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
CN113657479A (zh) | 一种新型多尺度深宽结合的病理图片分类方法、系统及介质 | |
CN114419691B (zh) | 人脸衰老图像的生成方法、模型训练方法、设备和介质 | |
CN113779498B (zh) | 离散傅里叶矩阵重构方法、装置、设备和存储介质 | |
CN113850826B (zh) | 基于图像分割的心脏图像处理方法、装置、设备及介质 | |
CN112801908B (zh) | 图像去噪方法、装置、计算机设备和存储介质 | |
CN111488888B (zh) | 图像特征提取方法以及人脸特征生成设备 | |
CN112686320A (zh) | 图像分类方法、装置、计算机设备及存储介质 | |
CN110264435B (zh) | 低剂量mip图像的增强方法、装置、计算机设备和存储介质 | |
CN116167410A (zh) | 分解卷积模型、病变区域识别方法和相关设备 | |
CN112669408A (zh) | 多模态实景地图图像生成方法、装置、计算机设备和介质 | |
CN118334752B (zh) | 融合3dcnn与注意力机制的行为识别模型训练方法和系统 | |
US20230026961A1 (en) | Low-dimensional manifold constrained disentanglement network for metal artifact reduction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |