CN113555110A - 一种训练多疾病转诊模型的方法及设备 - Google Patents

一种训练多疾病转诊模型的方法及设备 Download PDF

Info

Publication number
CN113555110A
CN113555110A CN202110800315.4A CN202110800315A CN113555110A CN 113555110 A CN113555110 A CN 113555110A CN 202110800315 A CN202110800315 A CN 202110800315A CN 113555110 A CN113555110 A CN 113555110A
Authority
CN
China
Prior art keywords
decision
referral
class
model
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110800315.4A
Other languages
English (en)
Other versions
CN113555110B (zh
Inventor
何兰青
熊健皓
赵昕
和超
张大磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Eaglevision Medical Technology Co Ltd
Beijing Airdoc Technology Co Ltd
Original Assignee
Shanghai Eaglevision Medical Technology Co Ltd
Beijing Airdoc Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Eaglevision Medical Technology Co Ltd, Beijing Airdoc Technology Co Ltd filed Critical Shanghai Eaglevision Medical Technology Co Ltd
Priority to CN202110800315.4A priority Critical patent/CN113555110B/zh
Publication of CN113555110A publication Critical patent/CN113555110A/zh
Priority to PCT/CN2021/129729 priority patent/WO2023284192A1/zh
Application granted granted Critical
Publication of CN113555110B publication Critical patent/CN113555110B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Epidemiology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种训练多疾病转诊模型的方法及设备,该方法包括:获取训练集,其包括多个样本中每个样本的决策轮廓和转诊标签,以及多种转诊分类中每种转诊分类的决策模板;获取机器学习模型,其被配置为根据决策轮廓、决策模板和多个决策权重确定转诊结果,其中,根据决策轮廓和决策模板得到多个距离分量并根据多个决策权重计算决策距离,根据决策距离输出相应样本的转诊结果;利用训练集对机器学习模型进行训练,基于转诊结果和转诊标签对多个决策权重进行调整,得到多疾病转诊模型。本发明可以根据决策轮廓中不同元素对转诊结果的贡献差异,提升模型的转诊分类性能。

Description

一种训练多疾病转诊模型的方法及设备
技术领域
本发明涉及疾病转诊技术领域,具体来说涉及基于决策模板法的疾病转诊技术领域,更具体地说,涉及一种训练多疾病转诊模型的方法及设备。
背景技术
随着计算机技术的进步和医疗数据的累积,通过各种机器学习方法已经可以实现对多种疾病高效的辅助诊断和预测。分类模型是一种最典型的机器学习模型,可以对数据样本进行分类,例如逻辑回归模型,会输出输入的样本属于某个类别的概率,再通过比较概率与阈值的大小确定样本是否属于某个类别;Softmax回归是将逻辑回归扩展到多个类别的分类模型,输出属于各个类别的概率,一般以概率最大的类别作为样本的分类结果。在医疗应用的场景中,会以某种疾病阳性作为一个类别。基于分类模型,可以实现一套多病种转诊系统,即将样本输入分类器模型进行多种疾病的判断,当分类器将样本分类为某个疾病阳性时,则进行转诊作进一步诊断;若分类器将样本分类为无疾病,则不进行转诊。
多病种转诊系统需要融合多个分类器模型,即使限定系统的输入为单模态,例如图像,对不同的病种,可以有不同的分类器进行判断,即便对某一种疾病,也可以有不同版本的分类器。如果输入为多模态,那么在不同模态下也会有不同的分类器。系统中包含的每个分类器,都会对某种或某几种疾病给出分类的输出,需要收集这些输出,并给出最终结果,即是否转诊和转诊的原因。
利用现有的决策模板法计算转诊结果时,决策轮廓中所有元素对转诊结果的影响是相同的,导致转诊结果不够准确。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,提供一种训练多疾病转诊模型的方法及设备。
本发明的目的是通过以下技术方案实现的:
根据本发明的第一方面,提供一种训练多疾病转诊模型的方法,包括:获取训练集,其包括多个样本中每个样本的决策轮廓和转诊标签,以及多种转诊分类中每种转诊分类的决策模板;获取机器学习模型,其被配置为根据决策轮廓、决策模板和多个决策权重确定转诊结果,其中,根据决策轮廓和决策模板得到多个距离分量并根据多个决策权重计算决策距离,根据决策距离输出相应样本的转诊结果;利用训练集对机器学习模型进行训练,基于转诊结果和转诊标签对多个决策权重进行调整,得到多疾病转诊模型。本发明对现有技术进行改进,构建相应的机器学习模型,利用样本训练机器学习模型对多个决策权重的值进行调整,利用调整后的多个决策权重,可以实现对相应的距离分量采用相应的决策权重进行加权求和,从而根据决策轮廓中不同元素对转诊结果的贡献差异,提升模型的转诊分类性能。
在本发明的一些实施例中,基于转诊结果和转诊标签计算损失值并根据所述损失值对所述可学习的决策权重进行调整。
在本发明的一些实施例中,所述多种转诊分类包括单一类,其中,所述单一类为一种疾病对应的转诊分类。
在本发明的一些实施例中,单一类对应的决策模块是按照以下方式获得的:将具有该单一类对应的转诊标签的所有样本的决策轮廓求平均,得到该单一类的决策模板。
在本发明的一些实施例中,所述多种转诊分类包括复合类,其中,所述复合类为至少两种疾病的复合转诊分类。由于一些疾病本身存在共性,疾病分类器在分类时可能存在错分的情况,因此,可以将多种疾病复合在一起,形成复合类。增加复合类后,可以同时判断是否可能存在多种潜在疾病的可能。
在本发明的一些实施例中,所述多种转诊分类包括复合类,其中,所述复合类为错分比例达到预设阈值的至少两种疾病的复合转诊分类。
在本发明的一些实施例中,复合类对应的决策模板是按照以下方式获得的:将该复合类所包含的疾病下彼此被错分的所有样本的决策轮廓求平均,得到该复合类的决策模板。若对疾病被错分的程度不加甄别组成复合类,会增加计算量,导致输出结果的时延增加,而且,一些疾病被错分的程度可能较小,复合类的出现反而可能导致对这些疾病分类的准确率的下降。因此,在一些潜在疾病难于被区分时,才将其复合形成复合类,同时输出样本可能患有的多种疾病对应的转诊结果,便于更准确地将患者转诊至进一步对疾病进行确诊或者诊断的医疗部门或者医疗机构
在本发明的一些实施例中,所述机器学习模型为预定义的数学函数模型或者分类神经网络模型。
在本发明的一些实施例中,在计算损失值时,根据相应类别的样本被错分的程度为每种类别的样本设置相应的惩罚调节参数。由此,以降低相应类别的样本被错分的概率。本发明可以根据被错分的情况,针对不同的疾病设置不同的惩罚调节参数,从而针对性地训练模型减少对某些疾病错分的概率,从而更精准地提供转诊建议。
在本发明的一些实施例中,所述损失值可以按照以下公式计算:
Figure BDA0003164353330000031
其中,i表示样本xi的序号i,ln表示自然对数,e表示常数e,
Figure BDA0003164353330000032
表示第一惩罚调整参数,nc表示第二惩罚调节参数,
Figure BDA0003164353330000033
表示样本xi的决策轮廓DP(xi)与其转诊标签yi对应的转诊分类的决策模板
Figure BDA0003164353330000034
之间的决策距离,
Figure BDA0003164353330000035
或者
Figure BDA0003164353330000036
DP(x)表示样本x的决策轮廓,DTc表示第c类的决策模板,ai,j表示决策轮廓与决策模板中第i行第j列的元素间的距离分量对应的决策权重,yk=c表示第k个样本属于第c类,di,j(xk)表示第i个分类器预测第k个样本属于第j类的概率,Nc表示训练集中属于第c类的样本数。
根据本发明的第二方面,提供一种用于训练多疾病转诊模型的设备,包括:数据获取模块,用于获取训练集,其包括多个样本中每个样本的决策轮廓和转诊标签,以及多种转诊分类中每种转诊分类的决策模板;模型获取模块,用于获取机器学习模型,该机器学习模型被配置为根据决策轮廓、决策模板和多个决策权重确定转诊结果,其中,根据决策轮廓和决策模板得到多个距离分量并根据多个决策权重计算决策距离,根据决策距离输出相应样本的转诊结果;模型训练模块,用于利用训练集对机器学习模型进行训练,训练时基于转诊结果和转诊标签对多个决策权重进行调整,得到多疾病转诊模型。
根据本发明的第三方面,提供一种用于多疾病转诊的系统,包括:数据获取模块,用于获取用户的决策轮廓和多种转诊分类中每种转诊分类的决策模板;多疾病转诊模型,用于根据决策轮廓、决策模板和多个决策权重确定转诊结果,输出该用户的转诊结果,其中所述多疾病转诊模型是根据第一方面所述的方法或者第二方面所述的设备训练得到的。
根据本发明的第四方面,提供一种电子设备,包括:一个或多个处理器;以及存储器,其中存储器用于存储一个或多个可执行指令;所述一个或多个处理器被配置为经由执行所述一个或多个可执行指令以实现第一方面所述方法的步骤。
附图说明
以下参照附图对本发明实施例作进一步说明,其中:
图1为决策轮廓的示意图;
图2为根据本发明实施例的训练多疾病转诊模型的方法的流程示意图。
具体实施方式
为了使本发明的目的,技术方案及优点更加清楚明白,以下结合附图通过具体实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如在背景技术部分提到的,利用现有的决策模板法计算转诊结果时,决策轮廓中所有元素对结果的影响是相同的,导致转诊结果不够准确。因此,本发明对现有技术进行改进,构建相应的机器学习模型,利用样本训练机器学习模型对多个决策权重的值进行调整,利用调整后的多个决策权重,可以实现对相应的距离分量采用相应的决策权重进行加权求和,从而根据决策轮廓中不同元素对转诊结果的贡献差异,提升模型的转诊分类性能。
为了说明本发明的技术方案,此处先对一些现有的术语概念进行说明。
1)决策轮廓(也可称决策轮廓矩阵):假定系统包括对c-1种疾病进行转诊的功能,加上健康无疾病的情况,共c个类别,同时有L个分类器,对样本x可以得到L个分类输出。这些分类输出整合为一个Lxc矩阵,即样本x的决策轮廓:
Figure BDA0003164353330000051
其中,di,j(x)表示第i个分类器预测样本属于第j类的概率。决策轮廓的一行对应一个分类器的输出,如图1所示的横框标识出的数据即为分类器Di(x)的输出。决策轮廓的一列对应所有分类器对某一类的输出,如图1所示的竖框标识出的数据即为分类器D1…DL对第j类的输出。
若某个分类器i不输出类别j的概率,则在DP(x)中对应元素di,j(x)始终为0。举例而言,如果系统只由若干个二分类器组成,则DP(x)是一个稀疏矩阵。
Figure BDA0003164353330000052
这是一个可以对三种疾病进行转诊,包含针对每种疾病的二分类器的系统。如果系统中还包含独立判断是否为正常无疾病类别的二分类器,则样本的决策轮廓形如:
Figure BDA0003164353330000053
2)决策模板(也可称决策模板矩阵):即将训练集中标签为某一类别的所有样本的决策轮廓取平均:
Figure BDA0003164353330000054
其中,Ni表示训练集中属于第i类的样本数,yj=i表示第j个样本属于第i类,
Figure BDA0003164353330000055
即表示对属于第i类的所有样本求和,DP(xj)表示第j个样本的决策轮廓。
由此可以得到某个样本的决策轮廓与各个类别决策模板间的距离:
Figure BDA0003164353330000061
其中,Distance(A,B)表示A、B两个矩阵间的距离,较常用的有欧式距离、马氏距离等。D(x)每一项的大小,可以作为样本属于每一类别的可能性度量,从而得到样本x最终的分类结果,即决策模板法。
例如,系统中有四个二分类器,1号分类器给出样本是否为无疾病正常样本的概率,2、3、4号分类器分别给出样本有三种疾病的概率。对某个样本,四个分类器给出的分数分别为0.6、0.1、0.2、0.3,则这个样本的决策轮廓为:
Figure BDA0003164353330000062
训练集中所有同标签样本的决策轮廓的均值即为该类别的决策模板。假设无疾病正常类别的决策模板为:
Figure BDA0003164353330000063
那么上述样本与正常类别的距离即为:
Figure BDA0003164353330000064
以此类推求得Distance(DP(x),DTi),得到D(x)。
用上述方法,可以得到样本的决策轮廓和相应转诊类别的决策模板。但从以上计算方式可看出,现有技术中决策轮廓中相应的元素对诊断结果的贡献是相同的,没有考虑不同位置元素贡献度的差异。因为不同分类器、不同类别敏感程度的差异,矩阵中某个位置的元素对距离的贡献不应该是相同的,所以并不合适使用欧氏距离。马氏距离虽然考虑了不同位置元素贡献度的差异,但只使用了整体样本的分布特性,并没有纳入类别的信息。因此,计算二者的距离时,本发明提出可学习权重的方法,对此设置了可学习的决策权重。本发明在纳入样本类别信息后,将距离计算转变为一个机器学习问题。
根据本发明的一个实施例,参见图2,提供一种训练多疾病转诊模型的方法,包括:步骤S1、S2、S3。为了更好地理解本发明,下面结合具体的实施例针对每一个步骤分别进行详细说明。
步骤S1:获取训练集,其包括多个样本中每个样本的决策轮廓和转诊标签,以及多种转诊分类中每种转诊分类的决策模板。
根据本发明的一个实施例,在构建训练集时,选择多个正常人和多个患者作为样本的数据来源。将正常人的特征数据输入到多个训练好的疾病分类器中,得到多个输出结果,将多个输出结果按照预定顺序组织为该正常人对应的样本的决策轮廓。为正常人添加表示无疾病的转诊标签。将患者的特征数据输入到多个训练好的疾病分类器中,得到多个输出结果,将多个输出结果按照预定顺序组织为该患者对应的样本的决策轮廓。根据该患者所患的疾病为患者添加相应疾病对应的转诊标签。某一转诊分类的决策模板为训练集中转诊标签为该转诊类别的所有样本的决策轮廓取平均。
步骤S2:获取机器学习模型,其被配置为根据决策轮廓、决策模板和多个决策权重确定转诊结果,其中,根据决策轮廓和决策模板得到多个距离分量并根据多个决策权重计算决策距离,根据决策距离输出相应样本的转诊结果。
根据本发明的一个可选实施例,所述机器学习模型为预定义的数学函数模型。在该数学函数模型中,距离可以采用不同的距离定义。
例如,基于L2距离来改进时,该预定义的数学函数模型被配置为按照以下公式计算决策距离:
Figure BDA0003164353330000071
其中,DP(x)表示样本x的决策轮廓,DTc表示第c类的决策模板,ai,j表示决策轮廓与决策模板中第i行第j列的元素间的距离分量对应的决策权重,yk=c表示第k个样本属于第c类,di,j(xk)表示第i个分类器预测第k个样本属于第j类的概率,Nc表示训练集中属于第c类的样本数。其中,
Figure BDA0003164353330000072
即为决策轮廓与决策模板中第i行第j列的元素间的距离分量。假设所有的ai,j=1,该式即为L2范数下的矩阵距离(L2距离),但矩阵不同位置的元素对分类的贡献大小不是相同的,具体每个元素有多大贡献需要从数据中学习,因此设置决策权重ai,j为可学习参数。
又例如,基于L1距离来改进时,该预定义的数学函数模型被配置为按照以下公式计算决策距离:
Figure BDA0003164353330000081
Figure BDA0003164353330000082
其中,
Figure BDA0003164353330000083
即为决策轮廓与决策模板中第i行第j列的元素间的距离分量。
根据本发明的一个可选实施例,所述机器学习模型为分类神经网络模型。例如,先把决策轮廓与决策模板中第i行第j列的元素间的距离分量计算出来,作为分类神经网络模型的输入,模型的权重参数即为可学习的决策权重,训练分类神经网络模型学习不同距离分量的贡献,最终得到的分类神经网络模型中的权重参数即为多个决策权重。
步骤S3:利用训练集对机器学习模型进行训练,基于转诊结果和转诊标签对多个决策权重进行调整,得到多疾病转诊模型。
根据本发明的一个实施例,基于转诊结果和转诊标签计算损失值并根据所述损失值对所述可学习的决策权重进行调整。训练的目的是基于转诊结果和转诊标签对多个决策权重进行调整以最小化分类损失。分类损失可以采用Softmax损失(Softmax Loss)。将Distance(DP(x),DTc)作为输入,以样本的真实标签作为监督信息,可以进行Softmax回归,根据本发明的一个实施例,损失值可以按照以下方式计算:
Figure BDA0003164353330000084
其中,Distance(DP(x),DTy)表示样本x与其转诊标签y的决策距离,Distance(DP(x),DTc)表示样本x与所有类别的决策距离。训练的目的,即是求得使Softmax Loss最小的参数ai,j
根据本发明的一个实施例,可以根据错分的严重程度,对SoftmaxLoss中的项进行加权。某种疾病特别严重,则该疾病样本和被错分为该疾病的样本产生的Loss会被放大,若某些疾病彼此容易错分,且分错的后果较轻,可以适当减小这些错分样本的Loss。损失值还可以按照以下公式计算:
Figure BDA0003164353330000091
其中,i表示样本xi的序号i,ln表示自然对数,e表示常数e,
Figure BDA0003164353330000092
表示第一惩罚调整参数,nc表示第二惩罚调节参数,
Figure BDA0003164353330000093
表示样本xi的决策轮廓DP(xi)与其转诊标签yi对应的转诊分类的决策模板
Figure BDA0003164353330000094
之间的决策距离。
Figure BDA0003164353330000095
越大,yi类样本被错分为其他类别时惩罚越大,nc越小,其他样本被错分为c类时惩罚越大。如果yi类样本被错分较多,例如,达到30%(被错分的程度严重),希望减少这种错分的情况,则可以将
Figure BDA0003164353330000096
设置为2,nc设置为0.5,更能确保该类不容易被错分;此处仅为示意,用户在训练模型时可以根据错分的程度视情况自定义配置。应当理解的是,若
Figure BDA0003164353330000097
nc都等于1,则相当于此公式计算的损失值等于前一实施例计算的Softmax Loss。该实施例的技术方案至少能够实现以下有益技术效果:本发明可以针对不同的疾病设置不同的惩罚调节参数,从而针对性地训练模型减少对某些疾病错分的概率,从而更精准地提供转诊建议。
根据本发明的一个实施例,在训练时,可将所有的样本分批次用于对机器学习模型的训练,或者将所有的样本作为整体用于对机器学习模型的训练。
常规地,将每种疾病作为一个转诊分类。根据本发明的一个实施例,所述多种转诊分类包括单一类,其中,所述单一类为一种疾病对应的转诊分类。单一类对应的决策模块是按照以下方式获得的:将具有该单一类对应的转诊标签的所有样本的决策轮廓求平均,得到该单一类的决策模板。
由于一些疾病本身存在共性,疾病分类器在分类时可能存在错分的情况,因此,可以将多种疾病复合在一起,形成复合类。根据本发明的一个实施例,所述多种转诊分类包括复合类,其中,所述复合类为至少两种疾病的复合转诊分类。假设系统支持保留复数的转诊原因,以增加两种疾病的复合类为例,可以对决策模板进行以下改进:使用距离可学习的决策模板法,对全体训练集进行重新分类。收集训练集中错分的样本和本身有并发标注(即有多个疾病标签)的样本,标注为特殊的复合类。例如训练集中标注为疾病1,但被错分为疾病2的样本,会和标注为疾病2,被错分为疾病1的,以及本身有疾病1、2两种标注的样本合到一起,组成1、2的复合类别。这是因为疾病1、2之间混淆样本的决策轮廓分布与本身有疾病1、2两种标注的样本应该具有共性,无法通过类别1、2的决策模板得到准确的分类,同时系统给这二者1、2的复合结果都是可接受的,因此将二者复合。类别的复合操作不包括无疾病的正常类别,只对有疾病的情况进行复合。于是训练集的类别数从c类变为
Figure BDA0003164353330000101
转化为新的训练集。对新的训练集再进行决策模板的建模和决策距离对应的决策权重的学习,得到支持复合类别的决策模板法。最终的系统包括若干个分类器,
Figure BDA0003164353330000102
个类别的决策模板,和一组决策距离参数,样本输入系统后,系统会给出
Figure BDA0003164353330000103
种结果,无疾病不转诊,或转诊,转诊原因包括c-1类单疾病和
Figure BDA0003164353330000104
类两种疾病组合。该实施例的技术方案至少能够实现以下有益技术效果:增加复合类后,可以同时判断是否可能存在多种潜在疾病的可能。
若对疾病被错分的程度不加甄别组成复合类,会增加计算量,导致输出结果的时延增加,而且,一些疾病被错分的程度可能较小,复合类的出现反而可能导致对这些疾病分类的准确率的下降。因此,可以进一步改进,根据本发明的一个实施例,所述复合类为错分比例达到预设阈值的至少两种疾病的复合转诊分类。错分比例的定义可以根据实际需要自定义设置。例如,错分比例可以定义为复合类对应的多种转诊类别下彼此错分的样本数量除以训练集中所有被错分的样本数量。或者,错分比例可以定义为复合类对应的多种疾病下彼此错分的样本数量除以复合类对应的多种转诊类别下的所有样本的数量。根据本发明的一个实施例,复合类对应的决策模板是按照以下方式获得的:将该复合类所包含的转诊类别下彼此被错分的所有样本的决策轮廓求平均,得到该复合类的决策模板。该实施例的技术方案至少能够实现以下有益技术效果:该实施例在一些潜在疾病难于被区分时,才将其复合形成复合类,同时输出样本可能患有的多种疾病对应的转诊结果,便于更准确地将患者转诊至进一步对疾病进行确诊或者诊断的医疗部门或者医疗机构。
本发明可以应用于二分类器和/或多分类器的场景,下面简单举例说明。
根据本发明的一个实施例,假设有两个用于疾病分类的二分类器(疾病分类模型),分别给出病例样本有糖尿病的概率和有高血压的概率。如果全是单一类,这时整个数据可以划分为三个转诊类别:无疾病、糖尿病、高血压。如果需要形成复合类,这时整个数据可以划分为四个转诊类别:无疾病、糖尿病、高血压、糖尿病和高血压。某个样本经过这两个分类器,得到患糖尿病概率d1,高血压概率d2。则该样本决策轮廓为
Figure BDA0003164353330000111
上述四个类别样本的决策轮廓均值即为该类别决策模板,按前文方法得到样本与四个类别决策模板的距离D(x),带入Softmax Loss中。调节可优化参数ai,j,优化训练集的Softmax Loss到最小。
根据本发明的一个实施例,本发明可以组合二分类器和多分类器的数据形成决策模板。例如,一个分类器给出是样本属于正常、糖尿病前、中、后期的概率分别为d0、d1、d2、d3,另一个分类器给出样本属于高血压的概率为d4,则样本决策轮廓为:
Figure BDA0003164353330000112
优化的过程类似前一个实施例,此处不再赘述。
根据本发明的一个实施例,提供一种用于训练多疾病转诊模型的设备,包括:数据获取模块,用于获取训练集,其包括多个样本中每个样本的决策轮廓和转诊标签,以及多种转诊分类中每种转诊分类的决策模板;模型获取模块,用于获取机器学习模型,该机器学习模型被配置为根据决策轮廓、决策模板和多个决策权重确定转诊结果,其中,根据决策轮廓和决策模板得到多个距离分量并根据多个决策权重计算决策距离,根据决策距离输出相应样本的转诊结果;模型训练模块,用于利用训练集对机器学习模型进行训练,训练时基于转诊结果和转诊标签对多个决策权重进行调整,得到多疾病转诊模型。
根据本发明的一个实施例,提供一种用于多疾病转诊的系统,包括:数据获取模块,用于获取用户的决策轮廓和多种转诊分类中每种转诊分类的决策模板;多疾病转诊模型,用于根据决策轮廓、决策模板和多个决策权重确定转诊结果,输出该用户的转诊结果,其中所述多疾病转诊模型是根据训练多疾病转诊模型的方法或者用于训练多疾病转诊模型的设备训练得到的。可选的,该多疾病转诊模型可以被配置为:计算决策轮廓和每个转诊分类对应的决策模板的决策距离,得到多个决策距离,取最小决策距离对应的转诊分类作为转诊结果。或者,可选的,该多疾病转诊模型可以被配置为:计算决策轮廓和每个转诊分类对应的决策模板的决策距离,得到多个决策距离;根据多个决策距离进行Softmax分类计算,取计算得到的最大概率值对应的转诊分类作为转诊结果。
需要说明的是,虽然上文按照特定顺序描述了各个步骤,但是并不意味着必须按照上述特定顺序来执行各个步骤,实际上,这些步骤中的一些可以并发执行,甚至改变顺序,只要能够实现所需要的功能即可。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以包括但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (14)

1.一种训练多疾病转诊模型的方法,其特征在于,包括:
获取训练集,其包括多个样本中每个样本的决策轮廓和转诊标签,以及多种转诊分类中每种转诊分类的决策模板;
获取机器学习模型,其被配置为根据决策轮廓、决策模板和多个决策权重确定转诊结果,其中,根据决策轮廓和决策模板得到多个距离分量并根据多个决策权重计算决策距离,根据决策距离输出相应样本的转诊结果;
利用训练集对机器学习模型进行训练,基于转诊结果和转诊标签对多个决策权重进行调整,得到多疾病转诊模型。
2.根据权利要求1所述的方法,其特征在于,基于转诊结果和转诊标签计算损失值并根据所述损失值对所述可学习的决策权重进行调整。
3.根据权利要求1所述的方法,其特征在于,所述多种转诊分类包括单一类,其中,所述单一类为一种疾病对应的转诊分类。
4.根据权利要求3所述的方法,其特征在于,单一类对应的决策模块是按照以下方式获得的:
将具有该单一类对应的转诊标签的所有样本的决策轮廓求平均,得到该单一类的决策模板。
5.根据权利要求3所述的方法,其特征在于,所述多种转诊分类包括复合类,其中,所述复合类为至少两种疾病的复合转诊分类。
6.根据权利要求3所述的方法,其特征在于,所述多种转诊分类包括复合类,其中,所述复合类为错分比例达到预设阈值的至少两种疾病的复合转诊分类。
7.根据权利要求5或6所述的方法,其特征在于,复合类对应的决策模板是按照以下方式获得的:
将该复合类所包含的疾病下彼此被错分的所有样本的决策轮廓求平均,得到该复合类的决策模板。
8.根据权利要求1至7任一项所述的方法,其特征在于,所述机器学习模型为预定义的数学函数模型或者分类神经网络模型。
9.根据权利要求2所述的方法,其特征在于,在计算损失值时,根据相应类别的样本被错分的情况,为每种类别的样本设置相应的惩罚调节参数。
10.根据权利要求9所述的方法,其特征在于,所述损失值按照以下公式计算:
Figure FDA0003164353320000021
其中,i表示样本xi的序号i,ln表示自然对数,e表示常数e,
Figure FDA0003164353320000022
表示第一惩罚调整参数,nc表示第二惩罚调节参数,
Figure FDA0003164353320000023
表示样本xi的决策轮廓DP(xi)与其转诊标签yi对应的转诊分类的决策模板
Figure FDA0003164353320000024
之间的决策距离,
Figure FDA0003164353320000025
或者
Figure FDA0003164353320000026
DP(x)表示样本x的决策轮廓,DTc表示第c类的决策模板,ai,j表示决策轮廓与决策模板中第i行第j列的元素间的距离分量对应的决策权重,yk=c表示第k个样本属于第c类,di,j(xk)表示第i个分类器预测第k个样本属于第j类的概率,Nc表示训练集中属于第c类的样本数。
11.一种用于训练多疾病转诊模型的设备,包括:
数据获取模块,用于获取训练集,其包括多个样本中每个样本的决策轮廓和转诊标签,以及多种转诊分类中每种转诊分类的决策模板;
模型获取模块,用于获取机器学习模型,该机器学习模型被配置为根据决策轮廓、决策模板和多个决策权重确定转诊结果,其中,根据决策轮廓和决策模板得到多个距离分量并根据多个决策权重计算决策距离,根据决策距离输出相应样本的转诊结果;
模型训练模块,用于利用训练集对机器学习模型进行训练,训练时基于转诊结果和转诊标签对多个决策权重进行调整,得到多疾病转诊模型。
12.一种用于多疾病转诊的系统,其特征在于,包括:
数据获取模块,用于获取用户的决策轮廓和多种转诊分类中每种转诊分类的决策模板;
多疾病转诊模型,用于根据决策轮廓、决策模板和多个决策权重确定转诊结果,输出该用户的转诊结果,其中所述多疾病转诊模型是根据权利要求1至10任一项所述的方法或者权利要求11所述的设备训练得到的。
13.一种计算机可读存储介质,其特征在于,其上包含有计算机程序,所述计算机程序可被处理器执行以实现权利要求1至11中任一项所述方法的步骤。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;以及
存储器,其中存储器用于存储一个或多个可执行指令;
所述一个或多个处理器被配置为经由执行所述一个或多个可执行指令以实现权利要求1至11中任一项所述方法的步骤。
CN202110800315.4A 2021-07-15 2021-07-15 一种训练多疾病转诊模型的方法及设备 Active CN113555110B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110800315.4A CN113555110B (zh) 2021-07-15 2021-07-15 一种训练多疾病转诊模型的方法及设备
PCT/CN2021/129729 WO2023284192A1 (zh) 2021-07-15 2021-11-10 一种训练多疾病转诊模型的方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110800315.4A CN113555110B (zh) 2021-07-15 2021-07-15 一种训练多疾病转诊模型的方法及设备

Publications (2)

Publication Number Publication Date
CN113555110A true CN113555110A (zh) 2021-10-26
CN113555110B CN113555110B (zh) 2024-06-25

Family

ID=78103193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110800315.4A Active CN113555110B (zh) 2021-07-15 2021-07-15 一种训练多疾病转诊模型的方法及设备

Country Status (2)

Country Link
CN (1) CN113555110B (zh)
WO (1) WO2023284192A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115147668A (zh) * 2022-09-06 2022-10-04 北京鹰瞳科技发展股份有限公司 疾病分类模型的训练方法、疾病分类的方法及相关产品
WO2023284192A1 (zh) * 2021-07-15 2023-01-19 北京鹰瞳科技发展股份有限公司 一种训练多疾病转诊模型的方法及设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100049551A1 (en) * 2008-08-22 2010-02-25 Scully Timothy J Computer system for applying proactive referral model to long term disability claims
WO2016061864A1 (zh) * 2014-10-20 2016-04-28 深圳市前海安测信息技术有限公司 一种医院双向转诊系统、方法和平台
CN106127228A (zh) * 2016-06-16 2016-11-16 北方工业大学 一种基于决策模板分类器融合的遥感图像船舶检测候选区鉴别方法
CN108520780A (zh) * 2018-03-07 2018-09-11 中国科学院计算技术研究所 一种基于迁移学习的医学数据处理和系统
CN108766559A (zh) * 2018-05-22 2018-11-06 合肥工业大学 用于智能疾病筛查的临床决策支持方法及系统
CN110767300A (zh) * 2019-12-26 2020-02-07 四川大学华西医院 一种数据处理方法、装置以及系统、存储介质
CN111081379A (zh) * 2019-12-02 2020-04-28 中南大学 一种疾病概率决策方法及其系统
CN111091900A (zh) * 2019-11-25 2020-05-01 中电健康云科技有限公司 一种基于区块链智能合约的医疗分级诊疗方法及系统
CN112365974A (zh) * 2020-11-06 2021-02-12 上海梅斯医药科技有限公司 一种临床辅助决策支持系统的学习实现方法和系统
WO2021120936A1 (zh) * 2019-12-19 2021-06-24 浙江大学 一种基于多任务学习模型的慢病预测系统
WO2023284192A1 (zh) * 2021-07-15 2023-01-19 北京鹰瞳科技发展股份有限公司 一种训练多疾病转诊模型的方法及设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3701197B2 (ja) * 2000-12-28 2005-09-28 松下電器産業株式会社 分類への帰属度計算基準作成方法及び装置
US7774143B2 (en) * 2002-04-25 2010-08-10 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Methods for analyzing high dimensional data for classifying, diagnosing, prognosticating, and/or predicting diseases and other biological states
US20100183202A1 (en) * 2006-11-06 2010-07-22 Fujifilm Ri Pharma Co., Ltd. Brain-image diagnosis supporting method, program, and recording medium
CN107492099B (zh) * 2017-08-28 2021-08-20 京东方科技集团股份有限公司 医学图像分析方法、医学图像分析系统以及存储介质
CN108231194A (zh) * 2018-04-04 2018-06-29 苏州医云健康管理有限公司 一种疾病诊断系统
CN111079824A (zh) * 2019-12-13 2020-04-28 杭州电子科技大学 一种通过比较向量距离对癫痫进行分类的方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100049551A1 (en) * 2008-08-22 2010-02-25 Scully Timothy J Computer system for applying proactive referral model to long term disability claims
WO2016061864A1 (zh) * 2014-10-20 2016-04-28 深圳市前海安测信息技术有限公司 一种医院双向转诊系统、方法和平台
CN106127228A (zh) * 2016-06-16 2016-11-16 北方工业大学 一种基于决策模板分类器融合的遥感图像船舶检测候选区鉴别方法
CN108520780A (zh) * 2018-03-07 2018-09-11 中国科学院计算技术研究所 一种基于迁移学习的医学数据处理和系统
CN108766559A (zh) * 2018-05-22 2018-11-06 合肥工业大学 用于智能疾病筛查的临床决策支持方法及系统
CN111091900A (zh) * 2019-11-25 2020-05-01 中电健康云科技有限公司 一种基于区块链智能合约的医疗分级诊疗方法及系统
CN111081379A (zh) * 2019-12-02 2020-04-28 中南大学 一种疾病概率决策方法及其系统
WO2021120936A1 (zh) * 2019-12-19 2021-06-24 浙江大学 一种基于多任务学习模型的慢病预测系统
CN110767300A (zh) * 2019-12-26 2020-02-07 四川大学华西医院 一种数据处理方法、装置以及系统、存储介质
CN112365974A (zh) * 2020-11-06 2021-02-12 上海梅斯医药科技有限公司 一种临床辅助决策支持系统的学习实现方法和系统
WO2023284192A1 (zh) * 2021-07-15 2023-01-19 北京鹰瞳科技发展股份有限公司 一种训练多疾病转诊模型的方法及设备

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
FIXLER DE, ET AL: "Age at referral and mortality from critical congenital heart disease", PEDIATRICS, vol. 134, no. 01, pages 2895 - 2899 *
于兴;陈剑惠;杜怀斌;杜大林;阳荣升;王开进;田中;王小忠;王伟;方瑞;李青;苏伟;曹念东;涂德刚;黄蓉;余立军;廖海军;: "双向转诊医疗风险控制量表模型在社区卫生服务临床工作中的应用", 中国全科医学, vol. 26, no. 31, pages 158 - 162 *
周颖,等: "基于随机森林的医联体双向转诊智能决策研究与应用", 计算技术与自动化, vol. 11, no. 01, pages 1633 - 1639 *
张琪;周琳;陈亮;张晋昕;温兴煊;何贤英;: "决策树模型用于结核病治疗方案的分类和预判", 中华疾病控制杂志, vol. 15, no. 05, pages 1 - 4 *
杨应雷,等: "加权决策模板业务感知算法", 计算机工程与应用, vol. 53, no. 02, 31 December 2017 (2017-12-31), pages 118 - 123 *
王妍妍;王艳宁;王敏;: "决策树与神经网络结合的入侵检测系统模型研究", 燕山大学学报, vol. 02, no. 01, pages 122 - 128 *
陈羽中,等: "基于深度学习人工智能辅助诊断慢性病的应用实践", 人工智能, vol. 01, no. 03, pages 80 - 90 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023284192A1 (zh) * 2021-07-15 2023-01-19 北京鹰瞳科技发展股份有限公司 一种训练多疾病转诊模型的方法及设备
CN115147668A (zh) * 2022-09-06 2022-10-04 北京鹰瞳科技发展股份有限公司 疾病分类模型的训练方法、疾病分类的方法及相关产品
CN115147668B (zh) * 2022-09-06 2022-12-27 北京鹰瞳科技发展股份有限公司 疾病分类模型的训练方法、疾病分类的方法及相关产品

Also Published As

Publication number Publication date
WO2023284192A1 (zh) 2023-01-19
CN113555110B (zh) 2024-06-25

Similar Documents

Publication Publication Date Title
US11790171B2 (en) Computer-implemented natural language understanding of medical reports
US11423538B2 (en) Computer-implemented machine learning for detection and statistical analysis of errors by healthcare providers
AU2020260078B2 (en) Computer-implemented machine learning for detection and statistical analysis of errors by healthcare providers
Dejaeger et al. Data mining techniques for software effort estimation: a comparative study
Böken On the appropriateness of Platt scaling in classifier calibration
US20220092478A1 (en) Combining data driven models for classifying data
CN113555110A (zh) 一种训练多疾病转诊模型的方法及设备
US20220121902A1 (en) Method and apparatus for quality prediction
CN113012774B (zh) 病案自动编码方法、装置、电子设备及存储介质
US11763945B2 (en) System and method for labeling medical data to generate labeled training data
CN118016279A (zh) 基于人工智能的多模态技术在乳腺癌领域的分析诊疗平台
CN115018006A (zh) 一种基于Dempster-Shafer框架的分类方法
US20210358317A1 (en) System and method to generate sets of similar assessment papers
El-Bashbishy et al. Pediatric diabetes prediction using deep learning
Ketpupong et al. Applying text mining for classifying disease from symptoms
CN116129182A (zh) 一种基于知识蒸馏和近邻分类的多维度医疗图像分类方法
Zhan et al. Reliability-based cleaning of noisy training labels with inductive conformal prediction in multi-modal biomedical data mining
Ojetunmibi et al. Pneumonia disease detection and classification system using naive Bayesian technique
Zhu et al. Naïve Bayes classifier based on reliability measurement for datasets with noisy labels
JP2020057264A (ja) 計算機システム及びデータ分類の分析方法
US20240331137A1 (en) Clinic-driven multi-label classification framework for medical images
Fuglsang-Damgaard et al. Fairness-Oriented Interpretability of Predictive Algorithms
CN117079821B (zh) 一种患者住院事件预测方法
EP3855452A1 (en) Tumor classification
US20240005099A1 (en) Integrated synthetic labeling optimization for machine learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant