CN109829490A - 修正向量搜索方法、目标分类方法及设备 - Google Patents
修正向量搜索方法、目标分类方法及设备 Download PDFInfo
- Publication number
- CN109829490A CN109829490A CN201910058642.XA CN201910058642A CN109829490A CN 109829490 A CN109829490 A CN 109829490A CN 201910058642 A CN201910058642 A CN 201910058642A CN 109829490 A CN109829490 A CN 109829490A
- Authority
- CN
- China
- Prior art keywords
- vector
- modification
- modification vector
- output vector
- amendment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种修正向量搜索方法、目标分类方法及设备,所述修正向量搜索方法包括利用机器学习模型对多个样本进行分类得到多个输出向量,所述机器学习模型为多分类模型,所述输出向量中包括多个数值,分别用于表示所述样本属于相应类别的置信度;利用当前的修正向量分别对所述多个输出向量进行修正得到多个修正输出向量;分别确定各个修正输出向量对应的单分类结果,并根据所述单分类果和所述样本的唯一标签确定当前的修正向量的性能值;根据所述性能值调整所述修正向量。
Description
技术领域
本发明涉及医疗图像处理领域,具体涉及一种修正向量搜索方法、目标分类方法及设备。
背景技术
利用机器学习算法和模型对目标进行识别是一种高效的方式,也是诸如自动驾驶、智能摄像、机器人等众多领域的底层技术。
机器学习中的多标签数据是指一个数据有多种特征,使用这种多标签数据可以训练出多分类模型,这种模型将可以对一个数据进行识别而输出一个用于表达该数据属于多种类别的结果。作为一个举例,医学图像通常可以反应出多种疾病类型,例如眼底图像可以体现出血管瘤、眼底出血、青光眼等多种眼部疾病,当利用多分类模型对一张眼底图像识别时,输出结论可以是血管瘤和眼底出血这两个结论。但是一些场景下,训练好的多分类模型会被要求只输出可能性最高的结论,尽可能的提高敏感性。
面对上述需求,现有技术是训练多分类模型输出用于表达各种结果可能性的置信度信息,例如模型输出一个向量,其中包括n个数值,第1个数值表达被识别目标属于第1类别的置信度、第n个数值表达被识别目标属于第n类别的置信度,然后取其中最高数值对应的类别为最终的识别结果。很多待识别数据中的多种特征的明显程度比较接近,这使得多分类模型输出的置信度最高的类别并不一定是预期的结果,这种处理方式的识别正确率比较低,也即多分类模型在面对单分类任务时的性能比较差。
发明内容
有鉴于此,本发明提供一种修正向量搜索方法,包括:
利用机器学习模型对多个样本进行分类得到多个输出向量,所述机器学习模型为多分类模型,所述输出向量中包括多个数值,分别用于表示所述样本属于相应类别的置信度;
利用当前的修正向量分别对所述多个输出向量进行修正得到多个修正输出向量;
分别确定各个修正输出向量对应的单分类结果,并根据所述单分类果和所述样本的唯一标签确定当前的修正向量的性能值;
根据所述性能值调整所述修正向量。
可选地,反复执行所述方法,以迭代调整所述修正向量,直至达到设定搜索条件为止。
可选地,在首次执行所述方法时,在所述利用当前的修正向量分别对所述多个输出向量进行修正得到多个修正输出向量的步骤中,所述当前的修正向量为预设向量。
可选地,所述分别确定各个修正输出向量对应的单分类结果,包括:
分别比较各个修正输出向量的多分类结果的置信度;
分别确定各个修正输出向量对应的置信度最高的分类结果。
可选地,所述根据所述单分类果和所述样本的唯一标签确定当前的修正向量的性能值,包括:
分别将各个修正输出向量对应的单分类果与相应样本的唯一标签进行比对以确定各个单分类结果是否正确;
确定正确的单分类结果的数量作为所述性能值。
可选地,所述根据所述性能值调整所述修正向量,包括:
判断所述性能值是否大于或等于历史最大性能值,所述历史最大性能值是在本次执行所述方法之前执行所述方法的过程中所确定的最大性能值,在首次执行所述方法时,所述历史最大性能值为预设值;
当所述性能值大于或等于所述历史最大性能值时,基于所述当前的修正向量和设定调整量得到新的修正向量。
可选地,当所述性能值小于所述历史最大性能值时,基于所述历史最大性能值对应的修正向量和设定调整量得到新的修正向量。
可选地,所述基于所述最大性能值对应的修正向量和设定调整量得到新的修正向量,包括:
获取所述最大性能值对应的修正向量和当前的设定调整量;
增大所述当前的设定调整量;
利用增大后的设定调整量对所述最大性能值对应的修正向量进行调整得到新的修正向量。
可选地,所述修正向量中包括与所述输出向量中相应的多个数值,分别用于修正所述输出向量中相应的数值。
可选地,在调整所述修正向量时调整所述多个数值中的一个。
本发明还提供了一种目标分类方法,包括:
利用机器学习模型对目标进行分类得到输出向量,所述机器学习模型为多分类模型,所述输出向量中包括多个数值,分别用于表示所述目标属于相应类别的置信度;
利用上述修正向量搜索方法得到的修正向量对所述输出向量进行修正得到修正输出向量;
确定所述修正输出向量对应的单分类结果。
相应地,本发明还提供了一种修正向量搜索设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求上述修正向量搜索方法。
相应地,本发明还提供了一种目标分类设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述目标分类方法。
根据本发明修正向量搜索方案,利用多分类模型对大量样本进行分类得到输出向量,利用修正向量对输出向量进行修正,根据修正后的输出向量确定单分类结果,将单分类结果与样本的唯一标签进行比对可以量化修正向量的优化效果,根据优化效果对修正向量进行调整可以得到有助于提高单分类结果正确率的修正向量,由此可以提高多分类模型执行单分类任务的性能。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的一种修正向量搜索方法的流程图;
图2为本发明实施例中的修正向量迭代搜索方法的流程图;
图3为本发明实施例中的修正向量搜索装置的结构示意图;
图4为本发明实施例中的一种目标分类方法的流程图;
图5为本发明实施例中的目标分类装置的结构示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本发明实施例提供了一种修正向量搜索方法,该方法可以由计算机和服务器等电子设备执行。在本方法中使用了机器学习模型识别数据,所述机器学习模型可以是各种类型和结构的神经网络。
本发明实施例中的机器学习模型为多分类模型。在使用多分类模型搜索修正向量之前,应当先使用大量的多分类训练样本对其进行训练,使其具有一定的多分类能力。多分类训练样本有多个标签,也即表示一个样本可以同时属于多种类别。经过训练后的多分类模型将输出用于表达识别目标属于各种标签类别的置信度数据。
作为一个举例,多分类模型可以输出一个向量[x,y,z],其中x表示该样本属于A类的置信度、y表示该样本属于B类的置信度、z表示该样本属于C类的置信度。
如图1所示,本发明实施例提供的修正向量搜索方法包括如下步骤:
S11A,利用多分类模型对多个样本进行分类得到多个输出向量,输出向量中包括多个数值,分别用于表示样本属于相应类别的置信度。此步骤中所使用的用于搜索修正向量的样本与上述多分类样本不同,用于搜索修正向量的样本只有一个标签,也即表示样本只属于一个类别,但样本可以具有多种类别的特征,而标签对应的特征最明显。
例如利用多分类模型对1000个样本进行识别,对每个样本有一个输出向量PA,则1000个样本对应1000个输出向量PA1……PA1000。假设PA1=[x1,y1,z1],则表示第1个样本属于A类的置信度为x1、第1个样本属于B类的置信度为y1、第1个样本属于C类的置信度为z1,……,PA1000=[x1000,y1000,z1000]表示第1000个样本属于A类的置信度为x1000、第1000个样本属于B类的置信度为y1000、第1000个样本属于C类的置信度为z1000。
样本可以是文字数据、声音数据、图像数据等能够被机器学习模型读取的数据,具体取决于应用场景,本发明方案不对样本的类型进行限定。
S12A,利用当前的修正向量分别对多个输出向量进行修正得到多个修正输出向量。修正向量PB是一个可被调整的向量,其初始值可以是人为设定的,也可以是根据先验信息确定的。修正向量可以包括至少一个数值,例如修正向量PB=[Δx];修正向量也可以包括多个数值,例如其数值数量与输出向量中的数值数量相同,并且数值相互对应,例如PB=[Δx,Δy,Δz]。
可以将修正视为对两个向量的融合处理,具体的修正计算方式有多种,作为一个举例,可以采用数值相加的方式进行修正,对第1000个样本对应的输出向量进行修正可以得到:
修正输出向量PC1=[x1+Δx,y1+Δx,z1+Δx]……
PC1000=[x1000+Δx,y1000+Δx,z1000+Δx]。
或者修正输出向量PC1=[x1+Δx,y1+Δy,z1+Δz]……
PC1000=[x1000+Δx,y1000+Δy,z1000+Δz]。
S13A,分别确定各个修正输出向量对应的单分类结果,并根据单分类果和样本的唯一标签确定当前的修正向量的性能值。作为一个举例,取修正输出向量中的最高值指示的类别,可以将多分类结果转化为一个单分类结果,假设第1个样本对应的修正输出向量[x1+Δx,y1+Δy,z1+Δz]的三个数值中x1+Δx为最高值,则确定第1个样本的识别结果为A类,如果该样本的标签为A类,则识别结果与标签一致,表示这个单分类结果是正确的;假设y1+Δy或z1+Δz为最高值,则表示这个单分类结果是错误的。确定全部1000个样本的单分类结果后,可以统计出其中正确的单分类结果的数量,这个数量可以表达当前的修正向量的性能。
在其它实施例中,也可以采用其它数值表达修正向量的性能,例如使用1000个样本的单分类结果的正确率等等。
S14A,根据性能值调整修正向量。针对较低的性能值和较高的性能值,可以采取不同的调整策略。以上述性能值计算方式为例,对于1000个样本而言性能值的最大值为1000,表示1000个样本的单分类结果全部正确,但通常情况下机器学习模型的识别准确率无法达到100%,进行修正可以提高正确率但通常也无法达到100%,所以面对大量样本时该性能值通常不等于最大值。因此可以设定几个阈值形成几个分数段,当处在不同的分数段时采取不同的调整方式。
当性能值较高时,表示当前的修正向量使得单分类结果的正确率处于较高的水平,在此情况下可以基于当前的修正向量PB做进一步调整,例如以较小的调整量增大或减小Δx和/或Δy和/或Δz;当性能值较低时,表示当前的修正向量PB使得单分类结果的正确率很低,也即当前的PB所带来的优化效果与预期效果相差很大,在此情况下可以放弃当前的PB,重新确定修正向量,例如在备选数值中选取新的数值替换Δx和/或Δy和/或Δz,或者仍以当前的PB为基础,以较大的调整量增大或减小Δx和/或Δy和/或Δz。
根据本发明实施例提供的修正向量搜索方法,利用多分类模型对大量样本进行分类得到输出向量,利用修正向量对输出向量进行修正,根据修正后的输出向量确定单分类结果,将单分类结果与样本的唯一标签进行比对可以量化修正向量的优化效果,根据优化效果对修正向量进行调整可以得到有助于提高单分类结果正确率的修正向量,由此可以提高多分类模型执行单分类任务的性能。
本发明实施例提供了一种修正向量迭代搜索方法,该方法可以由计算机和服务器等电子设备执行。
在执行本方法之前需要初始化修正向量PB、初始化性能值和初始化调整量a1。在本实施例中修正向量PB初始为[0,0,0],其中的三个数值与机器学习模型的输出向量中的数值相对应,分别用于修正所述输出向量中相应的数值。数值数量为3只是为了清楚地说明而做的举例,本发明不对向量中的数值数量进行限定,实际取决于多分类模型输出向量的情况。
在本发明实施例中性能值初始为0,该数值是为了在迭代搜索修正向量过程中比较不同的修正向量所产生的优化效果,实际应用中可以设置其它能够反映优化效果差异的初始值。
调整量a1用于调整修正向量PB,其初始值可根据输出向量中的数值范围进行设置。在本实施例中每次调整修正向量时只调整其中多个数值中的一个数值。
如图2所示,修正向量迭代搜索方法包括如下步骤:
S11B,判断是否达到设定搜索条件,当达到设定搜索条件时执行步骤S19B,否则执行步骤S12B。搜索条件可以包括搜索时间、迭代次数、当前性能值的大小或者它们的结合等各种条件。设定搜索条件是为了在合理的情况下终止迭代,例如当迭代次数较多、总耗时较长或者当前的性能值已经满足预期时即可终止迭代,输出当前的修正向量PB。
S12B,利用机器学习模型对多个样本进行分类得到多个输出向量PA,具体可参照上述步骤S11A。每一次迭代执行所使用的样本是相同的。
S13B,利用当前的修正向量PB分别对多个输出向量PA进行修正得到多个修正输出向量PC,修正方式可参照上述实施例中的步骤S12A。需要说明的是,首次执行此步骤时当前的修正向量为[0,0,0]。
由于本实施例中的初始修正向量为[0,0,0],在首次执行此步骤时,修正输出向量和输出向量是一致的。在后续迭代过程中,当修正向量被调整后,输出向量与修正输出向量不相同。
S14B,确定修正输出向量PC的单分类结果。具体地,分别比较各个修正输出向量的多分类结果的置信度,并分别确定各个修正输出向量对应的置信度最高的分类结果,具体确定方式可参照上述实施例中的步骤S13A。
S15B,基于单分类结果确定当前的修正向量PB的性能值。具体地,分别将各个修正输出向量对应的单分类果与相应样本的标签进行比对以确定各个单分类结果是否正确,并确定正确的单分类结果的数量作为当前的修正向量的性能值。在首次执行此步骤时,由于修正输出向量和输出向量一致,在此步骤中统计的就是单分类结果正确的输出向量的数量。例如有N个样本,首次执行此步骤时确定单分类结果正确的输出向量数量为M1个,则初始修正向量[0,0,0]的性能值为M1。
S16B,判断当前的性能值是否大于或等于历史最大性能值,如果成立则执行步骤S17B,否则执行步骤S18B。在首次执行此步骤时,历史最大性能值即性能值的初始值0,此时M1必然大于或等于0。在后续迭代过程中,历史最大性能值将被更新,例如第2次执行本方法时历史最大性能值为M1,而第2次执行步骤S15B时计算得到对应当前修正向量的性能值则不一定大于或等于M1。
S17B,基于当前的修正向量和设定调整量得到新的修正向量,之后返回步骤S11B。例如在迭代过程的第i次计算得到对应第i个修正向量的性能值Mi为历史最大性能值,假设当前为迭代过程的第j次,对应第j个修正向量的性能值Mj如果大于或等于Mi,则采纳Mj,基于Mj进行调整得到新的修正向量Mj+1。
例如在首次执行此步骤时,则利用调整量a1对初始修正向量[0,0,0]进行调整得到新的修正向量,新的修正向量可以是[0±a1,0,0]或者[0,0±a1,0]或者[0,0,0±a1]。
S18B,基于历史最大性能值对应的修正向量和设定调整量得到新的修正向量,之后返回步骤S11B。例如在迭代过程的第i次计算得到对应第i个修正向量的性能值Mi为历史最大性能值,假设当前为迭代过程的第j次,对应第j个修正向量的性能值Mj如果小于Mi,则不采纳Mj,而是仍基于Mi和设定调整量a1进行调整得到新的修正向量Mj+1。
作为一个优选的实施方式,本实施例在步骤S18B中将首先增大调整量a1的值,并利用增大后的调整量a1进行调整得到新的修正向量。
S19B,输出当前的修正向量PB。例如在第i次迭代后,确定了当前的修正向量PBi,此时返回步骤S11B,如果判定终止迭代,则最终得到的修正向量即为PBi。
根据本发明实施例提供的修正向量迭代搜索方法,首先设定初始的修正向量,基于初始的修正向量开始对其进行调整,每次执行本方法时都根据当前的修正向量对机器学习模型的输出向量进行修正,并进一步根据修正结果确定其性能值,当得到历史最大性能值时,基于当前的修正向量做进一步调整,否则放弃当前的修正向量,取具有历史最大性能值对应的修正向量并做进一步调整,以此方式反复迭代调整修正向量可以找到一个最优的修正向量,由此可以在允许的搜索条件下最大程度提高多分类模型执行单分类任务的性能。
实际应用本方案时,本方法通常会迭代执行数千次甚至可以迭代数万次,在上述说明中主要阐述了首次执行的情况,下面进一步举例解释后续迭代过程的步骤S17B和步骤S18B的优选实时方式。
在一个优选的实施例中,如上述举例机器学习模型的输出向量[x,y,z]有3个数值,修正向量[Δx,Δy,Δz]也有3个数值。当第i次执行步骤S17B选择调整Δx、Δy、Δz这3个数值中的一个数值时,具体将根据Δx、Δy、Δz这三个数值在此前被调整的顺序选择最早被调整的数值进行调整。作为一个具体举例,假设第i-1次执行本方法时执行了步骤S17B,调整了Δx,如果第i次执行本方法时又要执行步骤S17B,将调整Δy。以此类推,如果第i+1次执行本方法时又要执行步骤S17B,将调整Δz,之后重新按照Δx、Δy、Δz的调整顺序进行调整。
类似地,每次执行步骤S18B时也将按照此前的调整顺序调整不同的数值。每次调整不同的数值对于步骤S18B而言更为重要,虽然在上述实施例中执行步骤S18B时会增大调整量a1,但如果每次都调整相同的数值可能会导致搜索效率下降。
例如当第i次迭代要执行步骤S18B时,说明当前的修正向量没能带来更好的结果,此时要放弃当前的修正向量而获取之前最优性能值对应的修正向量,并进行调整。如果第i次选择调整Δx,在第i+1次迭代又要执行步骤S18B,由此说明调整Δx也未能取得更好的效果,如果第i+1仍选择调整Δx,其效果显然不如调整Δy或者Δz更明显。
在本发明的其它可选实施例中,也可以结合迭代次数设置进入步骤S18B的条件。例如在第i次执行本方法时,在步骤S16B中判定当前的性能值小于历史最大性能值,此时可以进一步判断第i-1、i-2等之前的多次的步骤S16B是否也是同样的结论,当此前多次判定结论都是小于历史最大性能值,则执行步骤S18B,否则执行步骤S17B。
本发明实施例提供了一种修正向量搜索设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述修正向量搜索方法。
本发明实施例提供了一种修正向量搜索装置,如图3所示,该装置包括:
多分类模型31,用于对多个样本进行分类得到多个输出向量,所述输出向量中包括多个数值,分别用于表示所述样本属于相应类别的置信度;
修正单元32,用于利用当前的修正向量分别对所述多个输出向量进行修正得到多个修正输出向量;
性能确定单元33,用于分别确定各个修正输出向量对应的单分类结果,并根据所述单分类果和所述样本的唯一标签确定当前的修正向量的性能值;
调整单元34,用于根据所述性能值调整所述修正向量。
本发明实施例提供了一种目标分类方法,基于上述修正向量搜索方案所确定的修正向量对目标进行分类,该方法可以由计算机和服务器等电子设备执行。在本方法中使用了机器学习模型识别数据,所述机器学习模型可以是各种类型和结构的神经网络。
如图4所示,目标分类方法包括如下步骤:
S21A,利用多分类模型对目标进行分类得到输出向量,该输出向量中包括多个数值,分别用于表示所述目标属于相应类别的置信度。作为一个举例,目标可以是一幅眼底图像,该图像中可能具有多种疾病特征,假设该图像最多属于3种类别,分别是健康、糖网和豹纹状眼底,输出向量为[0.4,0.5,0.6],表示该图像属于健康类的置信度是0.4、该图像属于糖网类的置信度是0.5、该图像属于豹纹状眼底类的置信度是0.6。
S22A,利用预先确定的修正向量对输出向量进行修正得到修正输出向量。预先根据上述修正向量搜索方案找到对应该应用场景的最优修正向量,在此步骤中对输出向量进行修正。作为一个举例,假设预先确定最优的修正向量为[0.2,0.3,0.4],对输出向量进行修正的方式为数值相加,则修正输出向量为[0.6,0.8,1.0],修正后的结果表示该图像属于健康类的置信度是0.6、该图像属于糖网类的置信度是0.8、该图像属于豹纹状眼底类的置信度是1.0。
S23A,确定修正输出向量对应的单分类结果。将修正输出向量指示的多分类结果转化为一个单分类结果,具体转化方式有多种。作为一个举例,可以取修正输出向量中的最高值指示的类别,取数值1.0指示的类别,则单分类结果为该图像属于豹纹状眼底类。
根据本发明实施例提供的目标分类方案,利用多分类模型对目标进行分类得到输出向量,之后利用预先确定的修正向量对输出向量进行修正,根据修正后的输出向量确定单分类结果,其中的修正向量能够提高单分类结果的正确率,由此可以提高多分类模型执行单分类任务的性能。
本发明实施例提供了一种目标分类设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述目标分类方法。
本发明实施例提供了一种目标分类装置,如图5所示,该装置包括:
多分类模型51,用于对目标进行分类得到输出向量,所述输出向量中包括多个数值,分别用于表示所述目标属于相应类别的置信度;
修正单元52,利用根据上述修正向量搜索方法得到的修正向量对所述输出向量进行修正得到修正输出向量;
分类结果确定单元53,确定所述修正输出向量对应的单分类结果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (13)
1.一种修正向量搜索方法,其特征在于,包括:
利用机器学习模型对多个样本进行分类得到多个输出向量,所述机器学习模型为多分类模型,所述输出向量中包括多个数值,分别用于表示所述样本属于相应类别的置信度;
利用当前的修正向量分别对所述多个输出向量进行修正得到多个修正输出向量;
分别确定各个修正输出向量对应的单分类结果,并根据所述单分类果和所述样本的唯一标签确定当前的修正向量的性能值;
根据所述性能值调整所述修正向量。
2.根据权利要求1所述的方法,其特征在于,反复执行所述方法,以迭代调整所述修正向量,直至达到设定搜索条件为止。
3.根据权利要求2所述的方法,其特征在于,在首次执行所述方法时,在所述利用当前的修正向量分别对所述多个输出向量进行修正得到多个修正输出向量的步骤中,所述当前的修正向量为预设向量。
4.根据权利要求1或2所述的方法,其特征在于,所述分别确定各个修正输出向量对应的单分类结果,包括:
分别比较各个修正输出向量的多分类结果的置信度;
分别确定各个修正输出向量对应的置信度最高的分类结果。
5.根据权利要求1或2所述的方法,其特征在于,所述根据所述单分类果和所述样本的唯一标签确定当前的修正向量的性能值,包括:
分别将各个修正输出向量对应的单分类果与相应样本的唯一标签进行比对以确定各个单分类结果是否正确;
确定正确的单分类结果的数量作为所述性能值。
6.根据权利要求2所述的方法,其特征在于,所述根据所述性能值调整所述修正向量,包括:
判断所述性能值是否大于或等于历史最大性能值,所述历史最大性能值是在本次执行所述方法之前执行所述方法的过程中所确定的最大性能值,在首次执行所述方法时,所述历史最大性能值为预设值;
当所述性能值大于或等于所述历史最大性能值时,基于所述当前的修正向量和设定调整量得到新的修正向量。
7.根据权利要求6所述的方法,其特征在于,当所述性能值小于所述历史最大性能值时,基于所述历史最大性能值对应的修正向量和设定调整量得到新的修正向量。
8.根据权利要求7所述的方法,其特征在于,所述基于所述最大性能值对应的修正向量和设定调整量得到新的修正向量,包括:
获取所述最大性能值对应的修正向量和当前的设定调整量;
增大所述当前的设定调整量;
利用增大后的设定调整量对所述最大性能值对应的修正向量进行调整得到新的修正向量。
9.根据权利要求1-8中任一项所述的方法,其特征在于,所述修正向量中包括与所述输出向量中相应的多个数值,分别用于修正所述输出向量中相应的数值。
10.根据权利要求9所述的方法,其特征在于,在调整所述修正向量时调整所述多个数值中的一个。
11.一种目标分类方法,其特征在于,包括:
利用机器学习模型对目标进行分类得到输出向量,所述机器学习模型为多分类模型,所述输出向量中包括多个数值,分别用于表示所述目标属于相应类别的置信度;
利用根据权利要求1-10中任一项所述的方法得到的修正向量对所述输出向量进行修正得到修正输出向量;
确定所述修正输出向量对应的单分类结果。
12.一种修正向量搜索设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-10中任意一项所述的修正向量搜索方法。
13.一种目标分类设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求11所述的目标分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910058642.XA CN109829490B (zh) | 2019-01-22 | 2019-01-22 | 修正向量搜索方法、目标分类方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910058642.XA CN109829490B (zh) | 2019-01-22 | 2019-01-22 | 修正向量搜索方法、目标分类方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109829490A true CN109829490A (zh) | 2019-05-31 |
CN109829490B CN109829490B (zh) | 2022-03-22 |
Family
ID=66860491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910058642.XA Active CN109829490B (zh) | 2019-01-22 | 2019-01-22 | 修正向量搜索方法、目标分类方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109829490B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114864093A (zh) * | 2022-07-04 | 2022-08-05 | 北京鹰瞳科技发展股份有限公司 | 基于眼底图像进行疾病预测的装置、方法及存储介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030138065A1 (en) * | 2002-01-23 | 2003-07-24 | Mills Diane G. | Power and confidence ordered low complexity soft turbomud with voting system |
CN103456167A (zh) * | 2013-09-17 | 2013-12-18 | 重庆大学 | 基于关键区域的良好驾驶技术参数获取方法 |
CN107633009A (zh) * | 2017-08-14 | 2018-01-26 | 东南大学 | 一种基于标记置信度的弱监督文档分类方法 |
CN107809583A (zh) * | 2017-10-25 | 2018-03-16 | 努比亚技术有限公司 | 拍照处理方法、移动终端及计算机可读存储介质 |
CN108009589A (zh) * | 2017-12-12 | 2018-05-08 | 腾讯科技(深圳)有限公司 | 样本数据处理方法、装置和计算机可读存储介质 |
CN108229519A (zh) * | 2017-02-17 | 2018-06-29 | 北京市商汤科技开发有限公司 | 图像分类的方法、装置及系统 |
CN108615044A (zh) * | 2016-12-12 | 2018-10-02 | 腾讯科技(深圳)有限公司 | 一种分类模型训练的方法、数据分类的方法及装置 |
CN108875532A (zh) * | 2018-01-25 | 2018-11-23 | 南京理工大学 | 一种基于稀疏编码和长度后验概率的视频动作检测方法 |
CN108871552A (zh) * | 2018-06-22 | 2018-11-23 | 哈尔滨工业大学(深圳) | 一种基于声源识别的噪声监测方法与系统 |
CN108897829A (zh) * | 2018-06-22 | 2018-11-27 | 广州多益网络股份有限公司 | 数据标签的修正方法、装置和存储介质 |
CN109064462A (zh) * | 2018-08-06 | 2018-12-21 | 长沙理工大学 | 一种基于深度学习的钢轨表面缺陷检测方法 |
CN109086825A (zh) * | 2018-08-03 | 2018-12-25 | 北京邮电大学 | 一种基于模型自适应选择的多分类模型融合方法 |
CN109145965A (zh) * | 2018-08-02 | 2019-01-04 | 深圳辉煌耀强科技有限公司 | 基于随机森林分类模型的细胞识别方法和装置 |
CN109214410A (zh) * | 2018-07-10 | 2019-01-15 | 上海斐讯数据通信技术有限公司 | 一种提升多标签分类正确率的方法及系统 |
-
2019
- 2019-01-22 CN CN201910058642.XA patent/CN109829490B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030138065A1 (en) * | 2002-01-23 | 2003-07-24 | Mills Diane G. | Power and confidence ordered low complexity soft turbomud with voting system |
CN103456167A (zh) * | 2013-09-17 | 2013-12-18 | 重庆大学 | 基于关键区域的良好驾驶技术参数获取方法 |
CN108615044A (zh) * | 2016-12-12 | 2018-10-02 | 腾讯科技(深圳)有限公司 | 一种分类模型训练的方法、数据分类的方法及装置 |
CN108229519A (zh) * | 2017-02-17 | 2018-06-29 | 北京市商汤科技开发有限公司 | 图像分类的方法、装置及系统 |
CN107633009A (zh) * | 2017-08-14 | 2018-01-26 | 东南大学 | 一种基于标记置信度的弱监督文档分类方法 |
CN107809583A (zh) * | 2017-10-25 | 2018-03-16 | 努比亚技术有限公司 | 拍照处理方法、移动终端及计算机可读存储介质 |
CN108009589A (zh) * | 2017-12-12 | 2018-05-08 | 腾讯科技(深圳)有限公司 | 样本数据处理方法、装置和计算机可读存储介质 |
CN108875532A (zh) * | 2018-01-25 | 2018-11-23 | 南京理工大学 | 一种基于稀疏编码和长度后验概率的视频动作检测方法 |
CN108871552A (zh) * | 2018-06-22 | 2018-11-23 | 哈尔滨工业大学(深圳) | 一种基于声源识别的噪声监测方法与系统 |
CN108897829A (zh) * | 2018-06-22 | 2018-11-27 | 广州多益网络股份有限公司 | 数据标签的修正方法、装置和存储介质 |
CN109214410A (zh) * | 2018-07-10 | 2019-01-15 | 上海斐讯数据通信技术有限公司 | 一种提升多标签分类正确率的方法及系统 |
CN109145965A (zh) * | 2018-08-02 | 2019-01-04 | 深圳辉煌耀强科技有限公司 | 基于随机森林分类模型的细胞识别方法和装置 |
CN109086825A (zh) * | 2018-08-03 | 2018-12-25 | 北京邮电大学 | 一种基于模型自适应选择的多分类模型融合方法 |
CN109064462A (zh) * | 2018-08-06 | 2018-12-21 | 长沙理工大学 | 一种基于深度学习的钢轨表面缺陷检测方法 |
Non-Patent Citations (3)
Title |
---|
CE LIU 等: "Self-Correction Method for Automatic Data Annotation", 《2017 4TH IAPR ASIAN CONFERENCE ON PATTERN RECOGNITION (ACPR)》 * |
卫保国 等: "一种基于标记修正和样本更新的目标跟踪算法", 《计算机应用研究》 * |
张志华: "图像显著目标计算方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114864093A (zh) * | 2022-07-04 | 2022-08-05 | 北京鹰瞳科技发展股份有限公司 | 基于眼底图像进行疾病预测的装置、方法及存储介质 |
CN114864093B (zh) * | 2022-07-04 | 2022-11-01 | 北京鹰瞳科技发展股份有限公司 | 基于眼底图像进行疾病预测的装置、方法及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109829490B (zh) | 2022-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106295807B (zh) | 一种信息处理的方法及装置 | |
CN109523029B (zh) | 自适应双自驱动深度确定性策略梯度强化学习方法 | |
CN105224959B (zh) | 排序模型的训练方法和装置 | |
CN108499107B (zh) | 虚拟现实中虚拟角色的控制方法、装置及存储介质 | |
CN110135582B (zh) | 神经网络训练、图像处理方法及装置、存储介质 | |
CN112052948B (zh) | 一种网络模型压缩方法、装置、存储介质和电子设备 | |
CN110472594A (zh) | 目标跟踪方法、信息插入方法及设备 | |
CN109583594A (zh) | 深度学习训练方法、装置、设备及可读存储介质 | |
CN110428046A (zh) | 神经网络结构的获取方法及装置、存储介质 | |
CN109514553A (zh) | 一种机器人移动控制的方法、系统及设备 | |
CN105678381A (zh) | 一种性别分类网络训练方法、性别分类方法及相关装置 | |
CN109857865A (zh) | 一种文本分类方法及系统 | |
CN108255059B (zh) | 一种基于模拟器训练的机器人控制方法 | |
CN109829490A (zh) | 修正向量搜索方法、目标分类方法及设备 | |
CN108549899A (zh) | 一种图像识别方法及装置 | |
CN113051363A (zh) | 题库智能知识点标注系统 | |
CN109961160A (zh) | 一种基于潮流参数的电网未来运行趋势预估方法及系统 | |
CN109871893B (zh) | 基于循环时域保持生成的行为预测方法和装置 | |
CN111695623A (zh) | 基于模糊聚类的大规模电池储能系统成组建模方法、系统、设备及可读存储介质 | |
CN116739147A (zh) | 基于bim的智能能耗管理与动态碳排放计算联合方法及系统 | |
CN114880932B (zh) | 一种电网运行环境模拟方法、系统、设备及介质 | |
CN115222773A (zh) | 单点运动学习方法及装置 | |
CN111639804B (zh) | 培育空间的监控方法、设备、存储介质和生长柜 | |
CN113822441A (zh) | 决策模型训练方法、装置、终端设备及存储介质 | |
CN113392867A (zh) | 一种图像识别方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |