CN112712893B

CN112712893B - 一种提升计算机临床辅助诊断效果的方法

Info

Publication number: CN112712893B
Application number: CN202110010241.4A
Authority: CN
Inventors: 张伯政; 吴军; 高希余; 樊昭磊; 何彬彬
Original assignee: Zhongyang Health Technology Group Co ltd
Current assignee: Zhongyang Health Technology Group Co ltd
Priority date: 2021-01-04
Filing date: 2021-01-04
Publication date: 2023-01-20
Anticipated expiration: 2041-01-04
Also published as: CN112712893A

Abstract

一种提升计算机临床辅助诊断效果的方法，采用多步训练，每一步训练过程中都将当前模型参数中绝对值较大的部分参数进行固化，并且对其他未固化参数进行重新初始化，解决了单次随机初始化造成的模型效果偏差，使得在当前数据状态以及模型状态都不发生变化的前提下，计算机临床辅助诊断模型训练效果得到进一步的提升。在计算机临床辅助诊断模型中内部的子连接结构视作子模型，在多个子模型间进行Boosting增强训练，充分利用了当前深度学习中参数的冗余特性，没有对模型增加计算，提升了计算机临床辅助诊断模型的参数利用率。在保证运算量完全不变的前提下，提升了计算机临床辅助诊断系统的诊断效果。

Description

一种提升计算机临床辅助诊断效果的方法

技术领域

本发明涉及医疗信息处理技术领域，具体涉及一种提升计算机临床辅助诊断效果的方法。

背景技术

计算机临床辅助诊断，在降低临床误诊率以及提升临床诊疗效率中发挥着很大的作用，在当今的医疗信息化领域有着举足轻重的地位。而当今计算机临床辅助诊断系统，多以深度学习技术为基础，设计一种可以使得基于深度学习的计算机临床辅助诊断系统效果提升的方法，显得尤为重要。

现有的提升计算机临床辅助诊断系统效果的方法主要分两种：

对数据端做提升：使用数据强化方法，例如对输入的病历、检查检验等数据添加噪声(例如无意义文字、符号、空格、制表符等)，增加辅助诊断系统训练的病例数量，对训练所使用的病例的数据进行清洗等等。其中对输入的病历、检查检验等数据添加噪声的方法其主要作用是降低过学习，提升系统的泛化性能以及适应能力，并不能够直接提升系统的准确率。而增加训练所用的病例数据以及对病例数据进行清洗等方法，又由于计算机临床辅助诊断领域所需的数据成本较高，数据清洗的成本也非常高，所以该方法虽然能够提升模型的效果，但其成本较高可行性较差。

对模型端做提升：使用模型的增强方法，比如使用Boosting、Bagging等集成学习方法，或者重新设计更好的临床辅助诊断模型等等。其中使用集成学习的模型效果提升方法使得模型的总参数量成倍增加，同时模型所需要的运算量也在成倍增加，这无疑增加了计算机临床辅助诊断系统的部署成本，提高了医院的使用门槛，使得医疗机构尤其是基层医疗机构的使用变得困难。而重新设计更好的模型则是一个费时费力的实验探索工作，时间成本和人员成本开销巨大。

综上所述，如何在现有的数据环境和模型环境不变的情况下，设计一种能够明显提升计算机临床辅助诊断系统效果的方法，是当前计算机临床辅助诊断领域研究的关键。

发明内容

本发明为了克服以上技术的不足，提供了一种在保证运算量完全不变的前提下，提升计算机临床辅助诊断系统诊断效果的方法。

本发明克服其技术问题所采用的技术方案是：

一种提升计算机临床辅助诊断效果的方法，包括如下步骤：

a)获取临床诊疗数据，由多个临床诊疗数据组成数据集；

b)定义计算机临床辅助诊断模型，将计算机临床辅助诊断模型的参数进行随机初始化，将随机初始化后的可训练参数表示为矩阵集合{P₁,P₂,P₃,...,P_n}，n为所有可训练的参数的个数；

c)设置寻优迭代次数为M，设置迭代计数变量k，使用2值初始化k；

d)将模型在当前的数据集上进行首次训练，直到进行到early-stop时停止首次训练过程；

e)使用排序算法，对步骤d)首次训练完成后的可训练参数矩阵集合中的每个矩阵的所有数值依照其绝对值大小进行排序，将每个矩阵中绝对值最大的

的参数变为不可训练参数；

f)对模型中剩余的可训练的参数重新进行随机初始化；

g)将模型在当前的自动诊断的数据集上进行第k次训练，直到进行到early-stop时停止第k次训练过程；

h)使用排序算法，对步骤g)中训练完成后的可训练参数矩阵集合中的每个矩阵的所有可训练参数的所有数值并依照其绝对值大小进行排序，将每个矩阵中可训练参数的所有数值中绝对值最大的

的参数变为不可训练参数；

i)使用公式k＝k+1来更新k的值，如果k大于M则所有的训练停止，完成所有的训练；

j)完成所有的训练后，参数矩阵集合中的所有参数矩阵为最终输出的模型参数矩阵，以输出的模型参数矩阵为参数定义步骤b)中的计算机临床辅助诊断模型；

k)利用步骤j)中得到的计算机临床辅助诊断模型对输入的数据进行辅助诊断。步骤a)中获取的临床诊疗数据中将主诉、年龄、性别、检查检验数据作为输入数据，使用其对应的主要诊断作为输出数据。

步骤b)中计算机临床辅助诊断模型为一个神经网络，其输入主诉、年龄、性别、检查检验数据，其输出各种诊断的概率分布。

步骤c)中M取值大于等于2。

步骤k)中输入的数据包括主诉、现病史、年龄、性别、检查检验数据。

本发明的有益效果是：采用多步训练，每一步训练过程中都将当前模型参数中绝对值较大的部分参数进行固化，并且对其他未固化参数进行重新初始化，解决了单次随机初始化造成的模型效果偏差，使得在当前数据状态以及模型状态都不发生变化的前提下，计算机临床辅助诊断模型训练效果得到进一步的提升。在计算机临床辅助诊断模型中内部的子连接结构视作子模型，在多个子模型间进行Boosting增强训练，充分利用了当前深度学习中参数的冗余特性，没有对模型增加计算，提升了计算机临床辅助诊断模型的参数利用率。在保证运算量完全不变的前提下，提升了计算机临床辅助诊断系统的诊断效果。

具体实施方式

下面对本发明做进一步说明。

一种提升计算机临床辅助诊断效果的方法，包括如下步骤：

a)获取临床诊疗数据，由多个临床诊疗数据组成数据集。

b)定义计算机临床辅助诊断模型，将计算机临床辅助诊断模型的参数进行随机初始化，将随机初始化后的可训练参数表示为矩阵集合{P₁,P₂,P₃,...,P_n}，n为所有可训练的参数的个数。

c)设置寻优迭代次数为M，设置迭代计数变量k，使用2值初始化k。

d)将模型在当前的数据集上进行首次训练，直到进行到early-stop时停止首次训练过程。

的参数变为不可训练参数。即其虽然传导而且计算梯度，但在以后的训练中，这些不可训练参数不再进行更新。

f)对模型中剩余的可训练的参数重新进行随机初始化。

g)将模型在当前的自动诊断的数据集上进行第k次训练，直到进行到early-stop时停止第k次训练过程。

i)使用公式k＝k+1来更新k的值，如果k大于M则所有的训练停止，完成所有的训练。

j)完成所有的训练后，参数矩阵集合中的所有参数矩阵为最终输出的模型参数矩阵，以输出的模型参数矩阵为参数定义步骤b)中的计算机临床辅助诊断模型。

k)利用步骤j)中得到的计算机临床辅助诊断模型对输入的数据进行辅助诊断。能够获得比常规训练方法训练出的计算机临床辅助诊断模型更为准确的结果。通过本发明所提出的提升计算机临床辅助诊断效果的方法，采用多步训练，每一步训练过程中都将当前模型参数中绝对值较大的部分参数进行固化，并且对其他未固化参数进行重新初始化，解决了单次随机初始化造成的模型效果偏差，使得在当前数据状态以及模型状态都不发生变化的前提下，计算机临床辅助诊断模型训练效果得到进一步的提升。其本质原理是使用Boosting方法，在计算机临床辅助诊断模型中内部的子连接结构视作子模型，在多个子模型间进行Boosting增强训练，充分利用了当前深度学习中参数的冗余特性，没有对模型增加计算，提升了计算机临床辅助诊断模型的参数利用率。在保证运算量完全不变的前提下，提升了计算机临床辅助诊断系统的诊断效果。

进一步的，步骤a)中获取的临床诊疗数据中将主诉、年龄、性别、检查检验数据作为输入数据，使用其对应的主要诊断作为输出数据。

进一步的，步骤b)中计算机临床辅助诊断模型为一个神经网络，其输入主诉、年龄、性别、检查检验数据，其输出各种诊断的概率分布。

进一步的，步骤c)中M取值大于等于2。

进一步的，步骤k)中输入的数据包括主诉、现病史、年龄、性别、检查检验数据。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种提升计算机临床辅助诊断效果的方法，其特征在于，包括如下步骤：

a)获取临床诊疗数据，由多个临床诊疗数据组成数据集；

e)使用排序算法，对步骤d)首次训练完成后的可训练参数矩阵集合中的所有数值依照其绝对值大小进行排序，将绝对值最大的

的参数变为不可训练参数；

f)对模型中剩余的可训练的参数重新进行随机初始化；

h)使用排序算法，对步骤g)中训练完成后的可训练参数矩阵集合中的所有可训练参数的所有数值依照其绝对值大小进行排序，将可训练参数的所有数值中绝对值最大的

的参数变为不可训练参数；

k)利用步骤j)中得到的计算机临床辅助诊断模型对输入的数据进行辅助诊断。

2.根据权利要求1所述的提升计算机临床辅助诊断效果的方法，其特征在于：步骤a)中获取的临床诊疗数据中将主诉、年龄、性别、检查检验数据作为输入数据，使用其对应的主要诊断作为输出数据。

3.根据权利要求2所述的提升计算机临床辅助诊断效果的方法，其特征在于：步骤b)中计算机临床辅助诊断模型为一个神经网络，其输入主诉、年龄、性别、检查检验数据，其输出各种诊断的概率分布。

4.根据权利要求1所述的提升计算机临床辅助诊断效果的方法，其特征在于：步骤c)中M取值大于等于2。

5.根据权利要求1所述的提升计算机临床辅助诊断效果的方法，其特征在于：步骤k)中输入的数据包括主诉、现病史、年龄、性别、检查检验数据。