CN109389220A - 神经网络模型的处理方法、装置、电子设备以及存储介质 - Google Patents
神经网络模型的处理方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN109389220A CN109389220A CN201811143319.4A CN201811143319A CN109389220A CN 109389220 A CN109389220 A CN 109389220A CN 201811143319 A CN201811143319 A CN 201811143319A CN 109389220 A CN109389220 A CN 109389220A
- Authority
- CN
- China
- Prior art keywords
- probability
- sample data
- label
- default
- mark
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请是关于一种神经网络模型的处理方法、装置、电子设备以及存储介质。在本申请实施例中,每一个样本数据的标注标签为一个,也即,样本数据为单标签数据集,通过本申请实施例的方法,使用单标签数据集可以训练出目标多标签分类模型,之后当需要预测本身含有多个标签的数据的标签时,通过目标多标签分类模型就可以得到该数据的多个标签。相比于相关技术,本申请无需工作人员需要依次人工标注样本数据是否属于标签体系中的每一个分类标签,降低了人工成本且提高了效率。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种神经网络模型的处理方法、装置、电子设备以及存储介质。
背景技术
当前,深度学习在视频图像、语音识别以及自然语言处理等相关领域得到了广泛应用。卷积神经网络作为深度学习的一个重要分支,由于其超强的拟合能力以及端到端的全局优化能力,使得图像分类任务在应用卷积神经网络之后,预测精度大幅提升。
基于卷积神经网络的单标签的分类技术可以对一个输入的图像输出一个分类标签。然而,在真实的应用场景中,图片中往往包括多个物体,我们期望能够对图片输出多个分类标签,例如,图像中包括猫、狗和酒瓶,我们期望能够对图片输出猫、狗和酒瓶共三个分类标签,但是基于卷积神经网络的单标签的分类技术却不能解决这个问题。只能是工作人员人为观察图像,并对图像人工标注,以得到图像的多个分类标签。
然而,当标签体系中的分类标签非常多时,工作人员需要依次人工标注图像是否属于标签体系中的每一个分类标签,耗时较长,且人工成本较高。
发明内容
为克服相关技术中存在的问题,本申请提供一种神经网络模型的处理方法、装置、电子设备以及存储介质。
根据本申请实施例的第一方面,提供一种神经网络模型的处理方法,所述方法包括:
获取样本数据、样本数据的一个标注标签以及预设标签分类模型;
使用所述样本数据以及所述样本数据的标注标签对所述预设标签分类模型训练,得到弱多标签分类模型;
使用所述弱多标签分类模型和所述样本数据的标注标签确定所述样本数据分别属于预设标签集中的每一个预设标签的第一概率,所述预设标签集中包括所述标注标签;
使用所述样本数据和所述第一概率对所述弱多标签分类模型训练,得到目标多标签分类模型。
在一个可选的实现方式中,所述使用所述弱多标签分类模型和所述样本数据的标注标签确定所述样本数据分别属于预设标签集中的每一个预设标签的第一概率,包括:
使用所述弱多标签分类模型预测所述样本数据分别属于所述预设标签集中每一个预设标签的第二概率;
将所述样本数据属于所述标注标签的概率设置为第三概率;
通过所述第二概率与所述第三概率,得到所述样本数据分别属于每一个预设标签的第一概率。
在一个可选的实现方式中,所述将所述第二概率与所述第三概率合并,得到所述样本数据分别属于每一个预设标签的第一概率,包括:
在所述预设标签集中,使用所述第三概率替换所述样本数据属于与所述标注标签相同的预设标签的第二概率;
将所述样本数据分别属于每一个预设标签的替换后的概率确定为所述第一概率。
在一个可选的实现方式中,所述使用所述第三概率替换所述样本数据属于与所述标注标签相同的预设标签的第二概率,包括:
在多个第二概率中去除低于预设阈值的第二概率;
如果剩余的第二概率对应的预设标签包括所述标注标签,则使用所述第三概率替换所述样本数据属于所述标注标签的第二概率。
在一个可选的实现方式中,所述将所述样本数据分别属于每一个预设标签的替换后的概率确定为所述第一概率,包括:
将替换后的剩余的第二概率确定为所述第一概率;
或者,如果剩余的第二概率对应的预设标签不包括所述标注标签,则将剩余的第二概率和所述第三概率确定为所述第一概率。
根据本申请实施例的第二方面,提供一种神经网络模型的处理装置,所述装置包括:
获取模块,用于获取样本数据、样本数据的一个标注标签以及预设标签分类模型;
第一训练模块,用于使用所述样本数据以及所述样本数据的标注标签对所述预设标签分类模型训练,得到弱多标签分类模型;
确定模块,用于使用所述弱多标签分类模型和所述样本数据的标注标签确定所述样本数据分别属于预设标签集中的每一个预设标签的第一概率,所述预设标签集中包括所述标注标签;
第二训练模块,用于使用所述样本数据和所述第一概率对所述弱多标签分类模型训练,得到目标多标签分类模型。
在一个可选的实现方式中,所述确定模块包括:
预测单元,用于使用所述弱多标签分类模型预测所述样本数据分别属于所述预设标签集中每一个预设标签的第二概率;
设置单元,用于将所述样本数据属于所述标注标签的概率设置为第三概率;
合并单元,用于通过所述第二概率与所述第三概率,得到所述样本数据分别属于每一个预设标签的第一概率。
在一个可选的实现方式中,所述合并单元包括:
替换子单元,用于在所述预设标签集中,使用所述第三概率替换所述样本数据属于与所述标注标签相同的预设标签的第二概率;
确定子单元,用于将所述样本数据分别属于每一个预设标签的替换后的概率确定为所述第一概率。
在一个可选的实现方式中,所述替换子单元具体用于:
在多个第二概率中去除低于预设阈值的第二概率;如果剩余的第二概率对应的预设标签包括所述标注标签,则使用所述第三概率替换所述样本数据属于所述标注标签的第二概率。
在一个可选的实现方式中,所述确定子单元具体用于:
将替换后的剩余的第二概率确定为所述第一概率;或者,如果剩余的第二概率对应的预设标签不包括所述标注标签,则将剩余的第二概率和所述第三概率确定为所述第一概率。
根据本申请实施例的第三方面,提供一种电子设备,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行如第一方面所述的神经网络模型的处理方法。
根据本申请实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行如第一方面所述的神经网络模型的处理方法。
根据本申请实施例的第五方面,提供一种计算机程序产品,当所述计算机程序产品中的指令由终端的处理器执行时,使得所述终端能够执行如第一方面所述的神经网络模型的处理方法。
本申请的实施例提供的技术方案可以包括以下有益效果:
在本申请实施例中,获取样本数据、样本数据的一个标注标签以及预设标签分类模型;使用样本数据以及样本数据的标注标签对预设标签分类模型训练,得到弱多标签分类模型;使用弱多标签分类模型和样本数据的标注标签确定样本数据分别属于预设标签集中的每一个预设标签的第一概率;预设标签集中包括标注标签;使用样本数据和第一概率对弱多标签分类模型训练,得到目标多标签分类模型。
在本申请实施例中,每一个样本数据的标注标签为一个,也即,样本数据为单标签数据集,通过本申请实施例的方法,使用单标签数据集可以训练出目标多标签分类模型,之后当需要预测本身含有多个标签的数据的标签时,通过目标多标签分类模型就可以得到该数据的多个标签。相比于相关技术,本申请无需工作人员需要依次人工标注样本数据是否属于标签体系中的每一个分类标签,降低了人工成本且提高了效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是根据一示例性实施例示出的一种神经网络模型的处理方法的流程图。
图2是根据一示例性实施例示出的一种神经网络模型的处理装置的框图。
图3是根据一示例性实施例示出的一种用于电子设备的框图。
图4是根据一示例性实施例示出的一种用于电子设备的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种神经网络模型的处理方法的流程图,如图1所示,该方法包括以下步骤。
在步骤S101中,获取样本数据、样本数据的一个标注标签以及预设标签分类模型;
在本申请实施例中,技术人员事先可以在本地设置一个或多个样本数据,对于任意一个样本数据,技术人员可以标注该样本数据的标注标签,然后将该样本数据与标注的该样本数据的标注标签组成对应表项,并存储在样本数据与标注标签之间的对应关系中,对于其他每一个样本数据,同样执行上述操作。
如此,在本申请实施例中,可以获取在样本数据与标注分类之间的对应关系中存储的样本数据,并在样本数据与标注分类之间的对应关系中查找与获取的样本数据相对应的标注标签,并作为获取的样本数据的标注标签。
其次,技术人员事先可以在本地设置预设标签分类模型,例如inception-v3等,如此,在本步骤中,可以直接获取事先在本地设置的预设标签分类模型。
在步骤S102中,使用样本数据以及样本数据的标注标签对预设标签分类模型训练,得到弱多标签分类模型;
在本申请实施例中,在对预设标签分类模型训练的过程中,往往需要多轮训练,每一轮训练之后都需要更新得到的最新的分类模型的损失函数;
其中,损失函数可以参见如下公式:
Lossn=p*log(pn’)+α*(1-p)*log(1-pn’),p∈{0,1};
在上述公式中,p包括样本数据属于标注标签的概率;
其中,由于样本数据的标注标签是技术人员人工对样本数据标注的,因此,样本数据属于标注标签的概率往往较高,例如,可以为100%等。
pn’包括使用每一轮训练得到的最新的分类模型来预测样本数据分别属于每一个预设标签的概率;n为预设标签的编号。
#classes包括:对每一个样本数据的标注标签去重复后,剩余的不同的标注标签的数量;
技术人员事先可以人工观察每一个样本数据可能属于的预设标签,η包括每一个样本数据可能属于的预设标签的数量之间的平均值;
iters包括在对预设标签分类模型训练的过程中所需训练的轮数。
iters_done包括在对预设标签分类模型训练的过程中已训练完成的轮数;
在步骤S103中,使用弱多标签分类模型和样本数据的标注标签确定样本数据分别属于预设标签集中的每一个预设标签的第一概率;
其中,预设标签集中包括该标注标签;
本步骤可以通过如下流程实现,包括:
1031、使用弱多标签分类模型预测样本数据分别属于预设标签集中每一个预设标签的第二概率;
将样本数据输入弱多标签分类模型中,然后弱多标签分类模型会输出的样本数据分别属于每一个预设标签的第二概率。
1032、将样本数据属于标注标签的概率设置为第三概率;
在本申请实施例中,样本数据的标注标签是人工事先对样本数据标注的,人工标注的准确度往往较高,如此,样本数据属于标注标签的可能性往往较大,如此,将样本数据属于标注标签的概率也往往较大,例如100%等。
1033、通过第二概率与第三概率,得到样本数据分别属于每一个预设标签的第一概率。
例如,将第二概率与第三概率合并,得到样本数据分别属于每一个预设标签的第一概率。
在本步骤可以通过如下流程实现,包括:
11)、在预设标签集中,使用第三概率替换样本数据属于与标注标签相同的预设标签的第二概率;
在本申请实施例中,预设标签为多个标签,标注标签往往是预设标签中的一小部分标注标签。
如此,对于样本数据的任意一个标注标签,由于样本数据属于该标注标签的第三概率往往会大于使用弱多标签分类模型预测得到的样本数据属于与该标注标签相同的预设标签的第二概率,且样本数据的标注标签是人工事先对样本数据标注的,人工标注的准确度往往较高,如此,为了提高样本数据属于与该标注标签相同的预设标签的第一概率的准确度,进而提高训练得到的目标多标签分类模型的分类准确度,可以在预设标签中查找与该标注标签相同的预设标签,然后将样本数据属于该预设标签的概率由第二概率替换为第三概率。对于其他每一个标注标签,同样执行上述操作。
在另一实施例中,对于任意一个预设标签,如果使用弱多标签分类模型预测得到的样本数据属于该预设标签的第二概率低于预设阈值,则说明样本数据不属于该预设标签,如果使用弱多标签分类模型预测得到的样本数据属于该预设标签的第二概率高于或等于预设阈值,则说明样本数据属于该预设标签。
如此,为了提高训练得到的目标多标签分类模型的分类准确度,可以在多个第二概率中去除低于预设阈值的第二概率;预设阈值可以为50%、51%或52%等等。
如果剩余的第二概率对应的预设标签包括标注标签,则使用第三概率替换样本数据属于标注标签的第二概率。
例如,样本数据的标注标签为猫,样本属于猫的第三概率为100%,预设标签包括猫、狗、老虎以及狮子,使用弱多标签分类模型预测得到的样本数据属于猫的第二概率为75%,属于狗的第二概率为23%,属于老虎的第二概率为55%,以及属于狮子的第二概率为88%,预设阈值为50%。
样本数据属于狗的第二概率23%小于预设阈值50%,如此可以去除样本数据属于狗的第二概率23%,剩余的第二概率包括属于猫的第二概率75%,属于老虎的第二概率55%,以及属于狮子的第二概率88%,然后使用样本属于猫的第三概率100%替换属于猫的第二概率75%。
12)、将样本数据分别属于每一个预设标签的替换后的概率确定为第一概率。
在一个实施例中,可以将替换后的剩余的第二概率确定为第一概率;例如,在上述例子中,将样本属于猫的第三概率100%,属于老虎的第二概率55%,以及属于狮子的第二概率88%作为第一概率;
或者,如果剩余的第二概率对应的预设标签不包括标注标签,则将剩余的第二概率和第三概率确定为第一概率。
例如,样本数据的标注标签为猫,样本数据属于猫的第三概率为100%,预设标签包括猫、狗、老虎以及狮子,使用弱多标签分类模型预测得到的样本数据属于猫的第二概率为25%,属于狗的第二概率为23%,属于老虎的第二概率为55%,以及属于狮子的第二概率为88%,预设阈值为50%。
样本数据属于狗的第二概率23%小于预设阈值50%,如此可以去除样本数据属于狗的第二概率23%,样本数据属于猫的第二概率25%小于预设阈值50%,如此可以去除样本数据属于猫的第二概率23%,剩余的第二概率包括属于老虎的第二概率55%以及属于狮子的第二概率88%,然后使用样本属于猫的第三概率100%,属于老虎的第二概率55%以及属于狮子的第二概率88%确定为第一概率。
在步骤S104中,使用样本数据和第一概率对弱多标签分类模型训练,得到目标多标签分类模型。
在本申请实施例中,在对弱多标签分类模型训练的过程中,往往需要多轮训练,每一轮训练之后都需要更新得到的最新的分类模型的损失函数。
其中,损失函数可以参见如下公式:
在上述公式中,p包括样本数据属于标注标签的概率。
其中,由于样本数据的标注标签是技术人员人工对样本数据标注的,因此,样本数据属于标注标签的概率往往较高,例如,可以为100%等。
pn’包括使用每一轮训练得到的最新的分类模型来预测样本数据分别属于每一个预设标签的概率;n为预设标签的编号。
技术人员事先可以人工观察每一个样本数据可能属于的预设标签,η包括每一个样本数据可能属于的预设标签的数量之间的平均值。
在本申请实施例中,获取样本数据、样本数据的一个标注标签以及预设标签分类模型;使用样本数据以及样本数据的标注标签对预设标签分类模型训练,得到弱多标签分类模型;使用弱多标签分类模型和样本数据的标注标签确定样本数据分别属于预设标签集中的每一个预设标签的第一概率;预设标签集中包括标注标签;使用样本数据和第一概率对弱多标签分类模型训练,得到目标多标签分类模型。
在本申请实施例中,每一个样本数据的标注标签为一个,也即,样本数据为单标签数据集,通过本申请实施例的方法,使用单标签数据集可以训练出目标多标签分类模型,之后当需要预测本身含有多个标签的数据的标签时,通过目标多标签分类模型就可以得到该数据的多个标签。相比于相关技术,本申请无需工作人员需要依次人工标注样本数据是否属于标签体系中的每一个分类标签,降低了人工成本且提高了效率。
图2是根据一示例性实施例示出的一种神经网络模型的处理装置。参照图2,该装置包括:
获取模块11,用于获取样本数据、样本数据的一个标注标签以及预设标签分类模型;
第一训练模块12,用于使用所述样本数据以及所述样本数据的标注标签对所述预设标签分类模型训练,得到弱多标签分类模型;
确定模块13,用于使用所述弱多标签分类模型和所述样本数据的标注标签确定所述样本数据分别属于预设标签集中的每一个预设标签的第一概率,所述预设标签集中包括所述标注标签;
第二训练模块14,用于使用所述样本数据和所述第一概率对所述弱多标签分类模型训练,得到目标多标签分类模型。
在一个可选的实现方式中,所述确定模块13包括:
预测单元,用于使用所述弱多标签分类模型预测所述样本数据分别属于所述预设标签集中每一个预设标签的第二概率;
设置单元,用于将所述样本数据属于所述标注标签的概率设置为第三概率;
合并单元,用于通过所述第二概率与所述第三概率,得到所述样本数据分别属于每一个预设标签的第一概率。
在一个可选的实现方式中,所述合并单元包括:
替换子单元,用于在所述预设标签集中,使用所述第三概率替换所述样本数据属于与所述标注标签相同的预设标签的第二概率;
确定子单元,用于将所述样本数据分别属于每一个预设标签的替换后的概率确定为所述第一概率。
在一个可选的实现方式中,所述替换子单元具体用于:
在多个第二概率中去除低于预设阈值的第二概率;如果剩余的第二概率对应的预设标签包括所述标注标签,则使用所述第三概率替换所述样本数据属于所述标注标签的第二概率。
在一个可选的实现方式中,所述确定子单元具体用于:
将替换后的剩余的第二概率确定为所述第一概率;或者,如果剩余的第二概率对应的预设标签不包括所述标注标签,则将剩余的第二概率和所述第三概率确定为所述第一概率。
在本申请实施例中,获取样本数据、样本数据的一个标注标签以及预设标签分类模型;使用样本数据以及样本数据的标注标签对预设标签分类模型训练,得到弱多标签分类模型;使用弱多标签分类模型和样本数据的标注标签确定样本数据分别属于预设标签集中的每一个预设标签的第一概率;预设标签集中包括标注标签;使用样本数据和第一概率对弱多标签分类模型训练,得到目标多标签分类模型。
在本申请实施例中,每一个样本数据的标注标签为一个,也即,样本数据为单标签数据集,通过本申请实施例的方法,使用单标签数据集可以训练出目标多标签分类模型,之后当需要预测本身含有多个标签的数据的标签时,通过目标多标签分类模型就可以得到该数据的多个标签。相比于相关技术,本申请无需工作人员需要依次人工标注样本数据是否属于标签体系中的每一个分类标签,降低了人工成本且提高了效率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本申请的执行主体可以是电子设备,如图3所示,电子设备300可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。如图4所示,电子设备400可以是服务器等。
参照图3,电子设备300可以包括以下一个或多个组件:处理组件302,存储器304,电力组件306,多媒体组件308,音频组件310,输入/输出(I/O)的接口312,传感器组件314,以及通信组件316。
处理组件302通常控制电子设备300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件302可以包括一个或多个处理器320来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件302可以包括一个或多个模块,便于处理组件302和其他组件之间的交互。例如,处理组件302可以包括多媒体模块,以方便多媒体组件308和处理组件302之间的交互。
存储器304被配置为存储各种类型的数据以支持在设备300的操作。这些数据的示例包括用于在电子设备300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件306为电子设备300的各种组件提供电力。电源组件306可以包括电源管理系统,一个或多个电源,及其他与为电子设备300生成、管理和分配电力相关联的组件。
多媒体组件308包括在所述电子设备300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件308包括一个前置摄像头和/或后置摄像头。当设备300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件310被配置为输出和/或输入音频信号。例如,音频组件310包括一个麦克风(MIC),当电子设备300处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器304或经由通信组件316发送。在一些实施例中,音频组件310还包括一个扬声器,用于输出音频信号。
I/O接口312为处理组件302和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件314包括一个或多个传感器,用于为电子设备300提供各个方面的状态评估。例如,传感器组件314可以检测到设备300的打开/关闭状态,组件的相对定位,例如所述组件为电子设备300的显示器和小键盘,传感器组件314还可以检测电子设备300或电子设备300一个组件的位置改变,用户与电子设备300接触的存在或不存在,电子设备300方位或加速/减速和电子设备300的温度变化。传感器组件314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件314还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件314还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件316被配置为便于电子设备300和其他设备之间有线或无线方式的通信。电子设备300可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件316还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器304,上述指令可由电子设备300的处理器320执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
参照图4,电子设备400包括处理组件422,其进一步包括一个或多个处理器,以及由存储器432所代表的存储器资源,用于存储可由处理组件422的执行的指令,例如应用程序。存储器432中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件422被配置为执行指令,以执行上述方法。
电子设备400还可以包括一个电源组件426被配置为执行电子设备400的电源管理,一个有线或无线网络接口450被配置为将电子设备400连接到网络,和一个输入输出(I/O)接口458。电子设备400可以操作基于存储在存储器432的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本申请实施例还提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如图1所述的神经网络模型的处理方法。
本申请实施例还提供一种计算机程序产品,当所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如图1所述的神经网络模型的处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
A6、一种神经网络模型的处理装置,所述装置包括:
获取模块,用于获取样本数据、样本数据的一个标注标签以及预设标签分类模型;
第一训练模块,用于使用所述样本数据以及所述样本数据的标注标签对所述预设标签分类模型训练,得到弱多标签分类模型;
确定模块,用于使用所述弱多标签分类模型和所述样本数据的标注标签确定所述样本数据分别属于预设标签集中的每一个预设标签的第一概率,所述预设标签集中包括所述标注标签;
第二训练模块,用于使用所述样本数据和所述第一概率对所述弱多标签分类模型训练,得到目标多标签分类模型。
A7、根据A6所述的装置,所述确定模块包括:
预测单元,用于使用所述弱多标签分类模型预测所述样本数据分别属于所述预设标签集中每一个预设标签的第二概率;
设置单元,用于将所述样本数据属于所述标注标签的概率设置为第三概率;
合并单元,用于通过所述第二概率与所述第三概率,得到所述样本数据分别属于每一个预设标签的第一概率。
A8、根据A7所述的装置,所述合并单元包括:
替换子单元,用于在所述预设标签集中,使用所述第三概率替换所述样本数据属于与所述标注标签相同的预设标签的第二概率;
确定子单元,用于将所述样本数据分别属于每一个预设标签的替换后的概率确定为所述第一概率。
A9、根据A8所述的装置,所述替换子单元具体用于:
在多个第二概率中去除低于预设阈值的第二概率;如果剩余的第二概率对应的预设标签包括所述标注标签,则使用所述第三概率替换所述样本数据属于所述标注标签的第二概率。
A10、根据A9所述的装置,所述确定子单元具体用于:
将替换后的剩余的第二概率确定为所述第一概率;或者,如果剩余的第二概率对应的预设标签不包括所述标注标签,则将剩余的第二概率和所述第三概率确定为所述第一概率。
Claims (10)
1.一种神经网络模型的处理方法,其特征在于,所述方法包括:
获取样本数据、样本数据的一个标注标签以及预设标签分类模型;
使用所述样本数据以及所述样本数据的标注标签对所述预设标签分类模型训练,得到弱多标签分类模型;
使用所述弱多标签分类模型和所述样本数据的标注标签确定所述样本数据分别属于预设标签集中的每一个预设标签的第一概率,所述预设标签集中包括所述标注标签;
使用所述样本数据和所述第一概率对所述弱多标签分类模型训练,得到目标多标签分类模型。
2.根据权利要求1所述的方法,其特征在于,所述使用所述弱多标签分类模型和所述样本数据的标注标签确定所述样本数据分别属于预设标签集中的每一个预设标签的第一概率,包括:
使用所述弱多标签分类模型预测所述样本数据分别属于所述预设标签集中每一个预设标签的第二概率;
将所述样本数据属于所述标注标签的概率设置为第三概率;
通过所述第二概率与所述第三概率,得到所述样本数据分别属于每一个预设标签的第一概率。
3.根据权利要求2所述的方法,其特征在于,所述将所述第二概率与所述第三概率合并,得到所述样本数据分别属于每一个预设标签的第一概率,包括:
在所述预设标签集中,使用所述第三概率替换所述样本数据属于与所述标注标签相同的预设标签的第二概率;
将所述样本数据分别属于每一个预设标签的替换后的概率确定为所述第一概率。
4.根据权利要求3所述的方法,其特征在于,所述使用所述第三概率替换所述样本数据属于与所述标注标签相同的预设标签的第二概率,包括:
在多个第二概率中去除低于预设阈值的第二概率;
如果剩余的第二概率对应的预设标签包括所述标注标签,则使用所述第三概率替换所述样本数据属于所述标注标签的第二概率。
5.根据权利要求4所述的方法,其特征在于,所述将所述样本数据分别属于每一个预设标签的替换后的概率确定为所述第一概率,包括:
将替换后的剩余的第二概率确定为所述第一概率;
或者,如果剩余的第二概率对应的预设标签不包括所述标注标签,则将剩余的第二概率和所述第三概率确定为所述第一概率。
6.一种神经网络模型的处理装置,其特征在于,所述装置包括:
获取模块,用于获取样本数据、样本数据的一个标注标签以及预设标签分类模型;
第一训练模块,用于使用所述样本数据以及所述样本数据的标注标签对所述预设标签分类模型训练,得到弱多标签分类模型;
确定模块,用于使用所述弱多标签分类模型和所述样本数据的标注标签确定所述样本数据分别属于预设标签集中的每一个预设标签的第一概率,所述预设标签集中包括所述标注标签;
第二训练模块,用于使用所述样本数据和所述第一概率对所述弱多标签分类模型训练,得到目标多标签分类模型。
7.根据权利要求6所述的装置,其特征在于,所述确定模块包括:
预测单元,用于使用所述弱多标签分类模型预测所述样本数据分别属于所述预设标签集中每一个预设标签的第二概率;
设置单元,用于将所述样本数据属于所述标注标签的概率设置为第三概率;
合并单元,用于通过所述第二概率与所述第三概率,得到所述样本数据分别属于每一个预设标签的第一概率。
8.根据权利要求7所述的装置,其特征在于,所述合并单元包括:
替换子单元,用于在所述预设标签集中,使用所述第三概率替换所述样本数据属于与所述标注标签相同的预设标签的第二概率;
确定子单元,用于将所述样本数据分别属于每一个预设标签的替换后的概率确定为所述第一概率。
9.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行如权利要求1-5任一项所述的神经网络模型的处理方法。
10.一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行执行如权利要求1-5任一项所述的神经网络模型的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811143319.4A CN109389220A (zh) | 2018-09-28 | 2018-09-28 | 神经网络模型的处理方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811143319.4A CN109389220A (zh) | 2018-09-28 | 2018-09-28 | 神经网络模型的处理方法、装置、电子设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109389220A true CN109389220A (zh) | 2019-02-26 |
Family
ID=65418321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811143319.4A Pending CN109389220A (zh) | 2018-09-28 | 2018-09-28 | 神经网络模型的处理方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109389220A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147852A (zh) * | 2019-05-29 | 2019-08-20 | 北京达佳互联信息技术有限公司 | 图像识别的方法、装置、设备及存储介质 |
CN110428052A (zh) * | 2019-08-01 | 2019-11-08 | 江苏满运软件科技有限公司 | 深度神经网络模型的构建方法、装置、介质及电子设备 |
CN110458245A (zh) * | 2019-08-20 | 2019-11-15 | 图谱未来(南京)人工智能研究院有限公司 | 一种多标签分类模型训练方法、数据处理方法及装置 |
CN111143609A (zh) * | 2019-12-20 | 2020-05-12 | 北京达佳互联信息技术有限公司 | 兴趣标签的确定方法、装置、电子设备及存储介质 |
CN112036166A (zh) * | 2020-07-22 | 2020-12-04 | 大箴(杭州)科技有限公司 | 一种数据标注方法、装置、存储介质及计算机设备 |
CN112149733A (zh) * | 2020-09-23 | 2020-12-29 | 北京金山云网络技术有限公司 | 模型训练、质量确定方法、装置、电子设备及存储介质 |
CN112328823A (zh) * | 2020-11-25 | 2021-02-05 | Oppo广东移动通信有限公司 | 多标签分类模型的训练方法、装置、电子设备及存储介质 |
CN113222050A (zh) * | 2021-05-26 | 2021-08-06 | 北京有竹居网络技术有限公司 | 图像分类方法、装置、可读介质及电子设备 |
-
2018
- 2018-09-28 CN CN201811143319.4A patent/CN109389220A/zh active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147852A (zh) * | 2019-05-29 | 2019-08-20 | 北京达佳互联信息技术有限公司 | 图像识别的方法、装置、设备及存储介质 |
US11263483B2 (en) | 2019-05-29 | 2022-03-01 | Beijing Dajia Internet Information Technology Co., Ltd. | Method and apparatus for recognizing image and storage medium |
CN110428052A (zh) * | 2019-08-01 | 2019-11-08 | 江苏满运软件科技有限公司 | 深度神经网络模型的构建方法、装置、介质及电子设备 |
CN110458245A (zh) * | 2019-08-20 | 2019-11-15 | 图谱未来(南京)人工智能研究院有限公司 | 一种多标签分类模型训练方法、数据处理方法及装置 |
CN111143609A (zh) * | 2019-12-20 | 2020-05-12 | 北京达佳互联信息技术有限公司 | 兴趣标签的确定方法、装置、电子设备及存储介质 |
CN111143609B (zh) * | 2019-12-20 | 2024-03-26 | 北京达佳互联信息技术有限公司 | 兴趣标签的确定方法、装置、电子设备及存储介质 |
CN112036166A (zh) * | 2020-07-22 | 2020-12-04 | 大箴(杭州)科技有限公司 | 一种数据标注方法、装置、存储介质及计算机设备 |
CN112149733A (zh) * | 2020-09-23 | 2020-12-29 | 北京金山云网络技术有限公司 | 模型训练、质量确定方法、装置、电子设备及存储介质 |
CN112149733B (zh) * | 2020-09-23 | 2024-04-05 | 北京金山云网络技术有限公司 | 模型训练、质量确定方法、装置、电子设备及存储介质 |
CN112328823A (zh) * | 2020-11-25 | 2021-02-05 | Oppo广东移动通信有限公司 | 多标签分类模型的训练方法、装置、电子设备及存储介质 |
CN113222050A (zh) * | 2021-05-26 | 2021-08-06 | 北京有竹居网络技术有限公司 | 图像分类方法、装置、可读介质及电子设备 |
CN113222050B (zh) * | 2021-05-26 | 2024-05-03 | 北京有竹居网络技术有限公司 | 图像分类方法、装置、可读介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109389220A (zh) | 神经网络模型的处理方法、装置、电子设备以及存储介质 | |
US10061762B2 (en) | Method and device for identifying information, and computer-readable storage medium | |
CN109389162B (zh) | 样本图像筛选方法和装置、电子设备及存储介质 | |
CN104378441B (zh) | 日程创建方法和装置 | |
CN109447125B (zh) | 分类模型的处理方法、装置、电子设备及存储介质 | |
CN110781957A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN105528403B (zh) | 目标数据识别方法及装置 | |
CN109670077A (zh) | 视频推荐方法、装置和计算机可读存储介质 | |
CN104077563A (zh) | 人脸识别方法和装置 | |
CN108563683A (zh) | 标签添加方法、装置及终端 | |
CN110069624A (zh) | 文本处理方法及装置 | |
CN111046927B (zh) | 标注数据的处理方法、装置、电子设备及存储介质 | |
CN113609380B (zh) | 标签体系更新方法、搜索方法、装置以及电子设备 | |
CN109409414B (zh) | 样本图像确定方法和装置、电子设备及存储介质 | |
CN113936697B (zh) | 语音处理方法、装置以及用于语音处理的装置 | |
CN111275089B (zh) | 一种分类模型训练方法及装置、存储介质 | |
CN109447124B (zh) | 图像分类方法、装置、电子设备及存储介质 | |
CN111428806A (zh) | 图像标签确定方法、装置、电子设备及存储介质 | |
CN112784151A (zh) | 一种确定推荐信息的方法及相关装置 | |
CN109145151B (zh) | 一种视频的情感分类获取方法及装置 | |
US11922725B2 (en) | Method and device for generating emoticon, and storage medium | |
CN112784700B (zh) | 人脸图像显示的方法、装置及存储介质 | |
CN110147426A (zh) | 一种查询文本的分类标签确定方法及相关装置 | |
CN105912398A (zh) | 内存检测方法及装置 | |
CN107566594A (zh) | 联系人信息的显示方法、显示装置及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190226 |