CN112465042A - 一种分类网络模型的生成方法及装置 - Google Patents
一种分类网络模型的生成方法及装置 Download PDFInfo
- Publication number
- CN112465042A CN112465042A CN202011391282.4A CN202011391282A CN112465042A CN 112465042 A CN112465042 A CN 112465042A CN 202011391282 A CN202011391282 A CN 202011391282A CN 112465042 A CN112465042 A CN 112465042A
- Authority
- CN
- China
- Prior art keywords
- network model
- classification
- sample data
- classification network
- weight value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012545 processing Methods 0.000 claims abstract description 53
- 238000003860 storage Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 description 18
- 238000004891 communication Methods 0.000 description 17
- 230000000875 corresponding effect Effects 0.000 description 11
- 238000004590 computer program Methods 0.000 description 7
- 238000010606 normalization Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012886 linear function Methods 0.000 description 3
- 208000032612 Glial tumor Diseases 0.000 description 2
- 206010018338 Glioma Diseases 0.000 description 2
- 206010037660 Pyrexia Diseases 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例提供了一种分类网络模型的生成方法及装置,以解决现有分类网络模型性能差问题。具体包括:获取原始样本数据,将原始样本数据分成第一样本数据和第二样本数据;将第一样本数据输入到第一分类网络模型进行分类处理,以确定第一样本数据的类型;确定第一分类准确率,在第一分类准确率小于第一阈值的情况下,获取参考权重值;根据参考权重值,调整第一分类网络模型中网络层的权重值,以确定调整后的第一分类网络模型;根据第一样本数据,重新训练调整后的第一分类网络模型,直到第一分类准确率大于或等于第一阈值为止。
Description
技术领域
本公开涉及本公开涉及数据处理技术领域,具体而言,涉及一种分类网络模型的生成方法及装置。
背景技术
在大多数场景下,对于获取到的原始样本数据,通常需要通过分类模型对原始样本数据进行分类处理,但是对于样本失衡的场景,由于原始样本数据失衡,则采集到的原始样本数据通常较少。由于原始样本数据较少,则原始样本数据的均衡性可能较差。这样,再使用分类模型对均衡性较差的原始样本数据进行分类识别时,识别的准确率较低。
发明内容
本公开提供了一种分类网络模型的生成方法及装置,以解决现有的分类网络模型性能差的问题。
为达到上述目的,本公开采用如下技术方案:
第一方面,本公开提供了一种分类网络模型的生成方法,该方法包括以下步骤:分类网络模型的生成装置获取原始样本数据,将原始样本数据分成第一样本数据和第二样本数据;将第一样本数据输入到第一分类网络模型进行分类处理,以确定第一样本数据的类型;第一样本数据为全分类样本数据;确定第一分类准确率,分类准确率用于表征第一分类网络模型处理第一样本数据的准确率;在第一分类准确率小于第一阈值的情况下,获取参考权重值,参考权重值为根据第二样本数据以及第二分类网络模型确定出的,第二分类网络模型用于确定第二样本数据的类型;第二样本数据为稀疏分类样本数据;根据参考权重值,调整第一分类网络模型中网络层的权重值,以确定调整后的第一分类网络模型。
本公开提供一种分类网络模型的生成方法,针对样本失衡的场景下,对采集到的样本数据进行分类,分成第一样本数据(全分类样本数据)和第二样本数据(稀疏分类样本数据),通过使用稀疏分类样本数据对第二分类网络模型进行训练,直至第二分类网络模型的分类结果达到预设条件,达到预设条件后,再讲第二分类网络模型对应的权重值作为校正参数来对第一分类网络模型进行校正,以使第一分类网络模型的分类结果满足预设条件,通过将数据量更低的数据(稀疏分类样本数据)训练得到的分类网络模型的权重参数作为校正系数,来提高相对数据量较多的数据(全分类样本数据)训练得到的分类网络模型,从而提高全分类样本数据训练得到第一分类网络模型的分类准确率。进一步提升在样本失衡场景下原始样本数据的分类结果。提高第一分类网络模型的性能。
第二方面,本公开提供了一种不均衡样本的分类网络模型的生成方法,方法包括:获取不均衡样本的原始数据;将原始数据输入分类网络模型,得到与原始数据对应的分类结果。
第三方面,本公开提供了一种分类网络模型生成装置,该装置包括收发模块和处理模块。具体的,收发模块,用于获取原始样本数据,将原始样本数据分成第一样本数据和第二样本数据。处理模块,用于将第一样本数据输入到第一分类网络模型进行分类处理,以确定第一样本数据的类型;第一样本数据为全分类样本数据。处理模块,还用于确定第一分类准确率,分类准确率用于表征第一分类网络模型处理第一样本数据的准确率。处理模块,还用于在第一分类准确率小于第一阈值的情况下,获取参考权重值,参考权重值为根据第二样本数据以及第二分类网络模型确定出的,第二分类网络模型用于确定第二样本数据的类型;第二样本数据为稀疏分类样本数据。处理模块,还用于根据参考权重值,调整第一分类网络模型中网络层的权重值,以确定调整后的第一分类网络模型。处理模块,还用于根据第一样本数据,重新训练调整后的第一分类网络模型,直到第一分类准确率大于或等于第一阈值为止。
第四方面,提供一种分类网络模型生成装置,包括:处理器;用于存储该处理器可执行指令的存储器。其中,该处理器被配置为执行指令,以实现如上述第一方面或第一方面的任一种可能实现方式的分类网络模型的生成方法。
第五方面,本公开提供一种计算机可读存储介质,包括指令。当指令在计算机上运行时,使得计算机执行如上述第一方面提供的不均衡样本的分类网络模型的生成方法。
第六方面,本公开提供一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行如第一方面提供的不均衡样本的分类网络模型的生成方法。
需要说明的是,上述计算机指令可以全部或者部分存储在第一计算机可读存储介质上。其中,第一计算机可读存储介质可以与接入网设备的处理器封装在一起的,也可以与接入网设备的处理器单独封装,本公开对此不作限定。
本公开中第二方面、第三方面、第四方面、第五方面以及第六方面的描述,可以参考第一方面的详细描述;并且,第二方面、第三方面、第四方面、第五方面以及第六方面的描述的有益效果,可以参考第一方面的有益效果分析,此处不再赘述。
在本公开中,上述分类网络模型的名字对设备或功能模块本身不构成限定,在实际实现中,这些设备或功能模块可以以其他名称出现。只要各个设备或功能模块的功能和本公开类似,属于本公开权利要求及其等同技术的范围之内。
本公开的这些方面或其他方面在以下的描述中会更加简明易懂。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本公开实施例中一种分类网络模型的生成方法的流程示意图之一;
图2是根据本公开实施例中一种分类网络模型的生成方法的流程示意图之二;
图3是根据本公开实施例中一种分类网络模型的生成方法的流程示意图之三;
图4是根据本公开实施例中一种分类网络模型生成装置的结构示意图之一;
图5是根据本公开实施例中一种分类网络模型生成装置结构示意图;
图6是根据本公开实施例提供的分类网络模型的生成方法的计算机程序产品的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本公开的描述中,除非另有说明,“多个”的含义是两个或两个以上。
目前,有很多分类算法被应用,其中,贝叶斯方法用于分类难以准确地得到数据的分布概率,决策树方法用于分类需要依赖数据的特征寻找最佳属性的集合,遗传规划方法用于分类难以确定合适的适应度函数以引导分类器的进化过程。并且,目前多数分类算法将不平衡数据作为平衡数据进行处理,往往导致对于数量较多的样本具有较高的分类准确率,对于数量较少的样本分类准确率很低,而数量较少的样本极有可能是分类过程中重要的样本,因此会导致训练得到的分类网络模型的性能较差。
为此,本申请实施例提供分类网络模型的生成方法。具体的,本实施例基于分类网络模型,结合相关网络中的权重值对待分类网络模型进行校正,以使其能够适应少数类型样本的分类。
本实施公开的分类网络模型的生成方法可以由分类网络模型生成装置来执行,该装置可以由软件和/或硬件的方式实现。
参见图1和图3,本实施例提供的分类网络模型的生成方法包括:
S110、分类网络模型生成装置获取原始样本数据,将原始样本数据分成第一样本数据和第二样本数据。
其中,分类网络模型生成装置获取到原始样本数据,原始样本数据可以为任意类型的样本数据,例如可以为图像训练样本、文字训练样本或语音训练样本等,其中也包括标注后的样本。
对原始的样本数据进行归一化处理,将处理后的数据分类成第一样本数据和第二样本数据。归一化处理的常用方法为:线性函数归一化,零均值归一化。
线性函数归一化:对原始数据进行线性变换,使得结果映射到[0,1]范围,实现对原始数据的等不缩放。线性函数归一化公式如下所示。其中,X为训练样本数据,Xmax和Xmin分别表示数据最大值、最小值,Xnorm为映射后结果。
零均值归一化:将原始数据映射到均值为0,标准差为1的分布上。其中,X为训练样本数据,μ为原始特征的均值,σ为标准差,Z为映射后结果。零均值归一化公式定义如下所示。
归一化处理后,将原始的样本数据分成第一样本数据和第二样本数据。具体的,本公开中的第一样本数据为全分类样本数据,第二样本数据为稀疏分类样本数据。
全分类样本数据的组成是按照训练样本数据包含的数据类别,对于每个数据类别中的数据进行随机采样,将随机采样的结果按照一定比例组成。稀疏分类样本数据的组成为60%的稀疏分类数据和40%的其他类别数据;示例性的,对于临床医学中脑胶质瘤的样本数据较少,感冒,发烧对应的样本数据较多,则稀疏分类样本数据中60%的稀疏分类数据可以为脑胶质瘤的数据,或医学场景下的其他疾病样本数据,40%的其他类别数据可以为感冒、发烧等数据易获取的其他疾病样本数据。
S120、分类网络模型生成装置将第一样本数据输入到第一分类网络模型进行分类处理,以确定第一样本数据的类型;第一样本数据为全分类样本数据。
本步骤中,第一分类网络模型包括1个输入层、n个隐藏层和1个输出层。将第一样本数据输入到第一分类网络模型进行分类生成分类结果。其中,第一分类网络模型的初始权重值为随机数。在一具体的实施例中,结合上述描述,第一分类网络模型是全分类网络模型,第一样本数据为全分类样本数据,第一分类准确率为全分类准确率,第一分类网络模型中网络层的权重值为全分类权重值。通过将全分类样本数据输入到全分类网络模型中进行分类生成全分类样本数据的分类结果。
S130、分类网络模型生成装置确定第一分类准确率。
该分类准确率用于表征第一分类网络模型处理第一样本数据的准确率。
本步骤中,得到全分类样本数据的分类结果后,将分类结果与全分类样本数据的实际分类结果进行对比,从而确定出第一分类网络模型的第一分类准确率,并获取得到该分类结果对应的第一分类网络的第一分类网络模型中网络层的权重值。
可选的,第一分类准确率可以采用F1-Score方式计算得出,也可通过其它方式计算,本公开对此不作限制。
S1401、分类网络模型生成装置在第一分类准确率大于或等于第一阈值的情况下,分类网络模型生成装置输出第一分配网络模型,并获取第一分类网络模型中网络层的权重值。
本步骤中,如图3所示,通过判断第一分类准确率是否符合预设要求,若符合,即确定第一分类准确率大于或等于第一阈值,输出第一分类网络模型,并获取第一分类网络模型中网络层的权重值。其中,第一阈值为一个比例数值,在0-1之间,根据实际的应用场景可适应性修改,本公开对此不作限制。在一具体的实施例中,判断全分类准确率大于或等于第一阈值,输出全分类网络模型和全分类权重值。本公开场景的第一阈值为0.8。
S1402、分类网络模型生成装置在第一分类准确率小于第一阈值的情况下,获取参考权重值,参考权重值为根据第二样本数据以及第二分类网络模型确定出的,第二分类网络模型用于确定第二样本数据的类型;第二样本数据为稀疏分类样本数据。
本步骤中,通过判断第一分类准确率是否符合预设要求,若不符合,即确定第一分类准确率小于第一阈值,则要获取校正参数,其中,校正参数为参考权重值。
进一步的,如图2所示,S1402包括:
S14021、分类网络模型生成装置根据第二样本数据训练第二分类网络模型,直到第二分类准确率大于或等于第二阈值为止。
本步骤中,第二分类网络模型包括1个输入层、n个隐藏层和1个输出层,第二分类网络模型的权重值为随机初始化参数。通过第二样本数据在第二分类网络模型进行分类,分类结束后,计算出第二分类网络模型的第二分类准确率。其中,第二分类准确率采用F1-Score方式计算得出,也可通过其它方式计算,本公开对此不作限制。
计算出第二分类准确率后,判断第二分类准确率是否大于或等于第二阈值,若大于第二阈值,则流程结束。若小于第二阈值,则继续使用第二样本数据对第二分类网路模型进行训练,直到第二分类准确率大于或等于第二阈值为止。其中,第二分类网络模型是稀疏分类网络模型,第二样本数据为稀疏分类样本数据,第二分类准确率为稀疏分类准确率,参考权重值为稀疏分类权重值。其中,第二阈值为大于或等于90%,本公开对此不作限制。
S14022、分类网络模型生成装置获取训练好的模型中网络层的权重值,并将网络层的权重值作为参考权重值。
本步骤中,得到训练好的第二分类网络模型后,获取第二分类网路模型中网络层的权重值,并将该权重值作为参考权重值来校正第一分类网络模型。
S150、分类网络模型生成装置根据参考权重值,调整第一分类网络模型中网络层的权重值,以确定调整后的第一分类网络模型。
进一步的,S150包括:根据参考权重值,从参考权重值中选取N1个权重值替换到第一分类网络模型中网络层的权重值,以确定调整后的第一分类网络模型,N1为正整数。
本步骤中,从参考权重值中随机选取N1个权重值,将N1个权重值替换到对应位置的第一分类网络模型中网络层的权重值,使用更新后的权重值,重新对第一分类网络模型进行训练,将第一样本数据输入到该第一分类网络模型中,并获取此时第一分类网络模型的分类准确率。其中,分类准确率采用F1-Score方式计算得出,也可通过其它方式计算,本公开对此不作限制。
在一具体的实施例中,用稀疏分类权重值替换对应位置的全分类权重值,使用更新后的权重值,重新对全分类网络模型进行训练,将全分类样本数据输入到该全分类网络模型中,并获取此时全分类网络模型的分类准确率。
S160、分类网络模型生成装置根据第一样本数据,重新训练调整后的第一分类网络模型,直到第一分类准确率大于或等于第一阈值为止。
进一步的,S160包括:
在调整后的第一分类网络模型的第一分类准确率小于第一阈值时,从参考权重值中选取N2个权重值替换到第一分类网络模型中网络层的权重值,以确定再次调整后的第一分类网络模型,N2小于N1。
本步骤中,重新训练调整后的第一分类网络模型,在第一分类准确率小于第一阈值的情况下,从参考权重值中选取N2个权重值替换第一分类网络模型中网络层的权重值;再次训练,再次获取对应的第一分类准确率。其中,N2小于N1。
将再次训练之后获取到第一分类准确率与第一阈值进行比较,若还是小于目标阈值,则再次进行权重值替换,每次替换的个数是上一个替换个数下调5%的结果,按照5%的结果向上取整。然后开始新一轮的第一分类网络模型训练,直到分类准确率大于第一阈值,则流程结束。在分类准确率大于第一阈值时,输出对应的第一分类网络模型和第一分类网络模型的权重值。本公开对下调数据不做限定,对替换的次数不做限定;达成对应效果即可。
上述实施例提供的技术方案至少带来以下有益效果:针对样本失衡的场景下,对采集到的样本数据进行分类,分成第一样本数据(全分类样本数据)和第二样本数据(稀疏分类样本数据),通过使用稀疏分类样本数据对第二分类网络模型进行训练,直至第二分类网络模型的分类结果达到预设条件,达到预设条件后,再讲第二分类网络模型对应的权重值作为校正参数来对第一分类网络模型进行校正,以使第一分类网络模型的分类结果满足预设条件,通过将数据量更低的数据(稀疏分类样本数据)训练得到的分类网络模型的权重参数作为校正系数,来提高相对数据量较多的数据(全分类样本数据)训练得到的分类网络模型,从而提高全分类样本数据训练得到第一分类网络模型的分类准确率。进一步提升在样本失衡场景下原始样本数据的分类结果。提高第一分类网络模型的性能。
上述主要从方法的角度对本公开实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本公开能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
图4是根据一示例性实施例示出的一种分类网络模型的生成装置的结构示意图,该分类网络模型生成装置可以用于执行图1所示的不均衡样本的分类网络模型的生成方法。作为一种可实现方式,该装置可以包括收发模块410和处理模块420。
收发模块410,用于获取原始样本数据,将原始样本数据分成第一样本数据和第二样本数据。例如,结合图1,收发模块410可以用于执行S110。
处理模块420,用于将第一样本数据输入到第一分类网络模型进行分类处理,以确定第一样本数据的类型;第一样本数据为全分类样本数据。例如,结合图1,处理模块420可以用于执行S120。
处理模块420,还用于确定第一分类准确率,分类准确率用于表征第一分类网络模型处理第一样本数据的准确率。例如,结合图1,处理模块420可以用于执行S130。
处理模块420,还用于在第一分类准确率小于第一阈值的情况下,获取参考权重值,参考权重值为根据第二样本数据以及第二分类网络模型确定出的,第二分类网络模型用于确定第二样本数据的类型;第二样本数据为稀疏分类样本数据。例如,结合图1,处理模块420可以用于执行S1402。
处理模块420,还用于根据参考权重值,调整第一分类网络模型中网络层的权重值,以确定调整后的第一分类网络模型。例如,结合图1,处理模块420可以用于执行S150。
处理模块420,还用于根据第一样本数据,重新训练调整后的第一分类网络模型,直到第一分类准确率大于或等于第一阈值为止。例如,结合图1,处理模块420可以用于执行S160。
进一步的,还包括:
处理模块420,还用于根据第二样本数据训练第二分类网络模型,直到第二分类准确率大于或等于第二阈值为止。例如,结合图2,处理模块420可以用于执行S14021。
收发模块410,还用于获取训练好的模型中网络层的权重值,并将网络层的权重值作为参考权重值。例如,结合图2,处理模块420可以用于执行S14022。
进一步的,处理模块420,还用于在第一分类准确率大于或等于第一阈值的情况下,输出第一分配网络模型和第一分类网络模型中网络层的权重值。例如,结合图3,处理模块420可以用于执行S1401。
进一步的,处理模块420,还用于根据参考权重值,从参考权重值中选取N1个权重值替换到第一分类网络模型中网络层的权重值,以确定调整后的第一分类网络模型,N1为正整数。例如,结合图1,处理模块420可以用于执行S150。
进一步的,处理模块420,还用于在调整后的第一分类网络模型的第一分类准确率小于第一阈值时,从参考权重值中选取N2个权重值替换到第一分类网络模型中网络层的权重值,以确定再次调整后的第一分类网络模型,N2小于N1;其中,N2小于N1。例如,结合图1,处理模块420可以用于执行S160。
其中,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,其作用在此不再赘述。
当然,本公开实施例提供的分类网络模型生成装置包括但不限于上述模块,例如分类网络模型生成装置还可以包括存储单元430。存储单元430可以用于存储该写分类网络模型生成装置的程序代码,还可以用于存储写分类网络模型生成装置在运行过程中生成的数据,如写请求中的数据等。
图5为本公开实施例提供的一种分类网络模型生成装置的结构示意图,如图5所示,该分类网络模型生成装置可以包括:至少一个处理器51、存储器52、通信接口53和通信总线54。
下面结合图5对分类网络模型生成装置的各个构成部件进行具体的介绍:
其中,处理器51是分类网络模型生成装置的控制中心,可以是一个处理器,也可以是多个处理元件的统称。例如,处理器51是一个中央处理器(Central Processing Unit,CPU),也可以是特定集成电路(Applicati on Specific Integrated Circuit,ASIC),或者是被配置成实施本公开实施例的一个或多个集成电路,例如:一个或多个DSP,或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,FPGA)。
在具体的实现中,作为一种实施例,处理器51可以包括一个或多个CPU,例如图5中所示的CPU0和CPU1。且,作为一种实施例,分类网络模型生成装置可以包括多个处理器,例如图5中所示的处理器51和处理器55。这些处理器中的每一个可以是一个单核处理器(Single-CPU),也可以是一个多核处理器(Multi-CPU)。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
存储器52可以是只读存储器(Read-Only Memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(Random Access Memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器52可以是独立存在,通过通信总线54与处理器51相连接。存储器52也可以和处理器51集成在一起。
在具体的实现中,存储器52,用于存储本公开中的数据和执行本公开的软件程序。处理器51可以通过运行或执行存储在存储器52内的软件程序,以及调用存储在存储器52内的数据,执行空调器的各种功能。
通信接口53,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如无线接入网(Radio Access Network,RAN),无线局域网(Wireless Local Area Networks,WLAN)、终端、云端等。通信接口53可以包括获取单元实现获取功能,以及发送单元实现发送功能。
通信总线54,可以是工业标准体系结构(Industry Standard Archite cture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Archi tecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
作为一个示例,结合图5,分类网络模型生成装置中的收发模块410实现的功能与图5中的通信接口53的功能相同,处理模块420实现的功能与图5中的处理器51的功能相同,存储单元430实现的功能与图5中的存储器52的功能相同。
本公开另一实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行上述方法实施例所示的方法。
在一些实施例中,所公开的方法可以实施为以机器可读格式被编码在计算机可读存储介质上的或者被编码在其它非瞬时性介质或者制品上的计算机程序指令。
图6示意性地示出本公开实施例提供的计算机程序产品的概念性局部视图,计算机程序产品包括用于在计算设备上执行计算机进程的计算机程序。
在一个实施例中,计算机程序产品是使用信号承载介质610来提供的。信号承载介质610可以包括一个或多个程序指令,其当被一个或多个处理器运行时可以提供以上针对图2描述的功能或者部分功能。因此,例如,参考图2中所示的实施例,S11和S12的一个或多个特征可以由与信号承载介质610相关联的一个或多个指令来承担。此外,图6中的程序指令也描述示例指令。
在一些示例中,信号承载介质610可以包含计算机可读介质611,诸如但不限于,硬盘驱动器、紧密盘(CD)、数字视频光盘(DVD)、数字磁带、存储器、只读存储记忆体(read-only memory,ROM)或随机存储记忆体(random access memory,RAM)等等。
在一些实施方式中,信号承载介质610可以包含计算机可记录介质612,诸如但不限于,存储器、读/写(R/W)CD、R/W DVD、等等。
在一些实施方式中,信号承载介质610可以包含通信介质613,诸如但不限于,数字和/或模拟通信介质(例如,光纤电缆、波导、有线通信链路、无线通信链路、等等)。
信号承载介质610可以由无线形式的通信介质613(例如,遵守IEEE 802.61标准或者其它传输协议的无线通信介质)来传达。一个或多个程序指令可以是,例如,计算机可执行指令或者逻辑实施指令。
在一些示例中,诸如针对图2描述的写数据装置可以被配置为,响应于通过计算机可读介质611、计算机可记录介质612、和/或通信介质613中的一个或多个程序指令,提供各种操作、功能、或者动作。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全分类部或者部分功能。
在本公开所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全分类部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本公开实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全分类部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本公开各个实施例方法的全分类部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何在本公开揭露的技术范围内的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种分类网络模型的生成方法,其特征在于,包括:
获取原始样本数据,将所述原始样本数据分成第一样本数据和第二样本数据;
将所述第一样本数据输入到第一分类网络模型进行分类处理,以确定所述第一样本数据的类型;
确定第一分类准确率,所述分类准确率用于表征所述第一分类网络模型处理所述第一样本数据的准确率;
在所述第一分类准确率小于第一阈值的情况下,获取参考权重值,所述参考权重值为根据所述第二样本数据以及第二分类网络模型确定出的,所述第二分类网络模型用于确定所述第二样本数据的类型;
根据所述参考权重值,调整所述第一分类网络模型中网络层的权重值,以确定调整后的第一分类网络模型;
根据所述第一样本数据,重新训练所述调整后的第一分类网络模型,直到第一分类准确率大于或等于所述第一阈值为止。
2.根据权利要求1所述的生成方法,其特征在于,所述获取参考权重值,包括:
根据第二样本数据训练第二分类网络模型,直到第二分类准确率大于或等于所述第二阈值为止;
获取训练好的模型中网络层的权重值,并将所述网络层的权重值作为所述参考权重值。
3.根据权利要求1所述的生成方法,其特征在于,所述确定第一分类准确率,包括:
在所述第一分类准确率大于或等于第一阈值的情况下,输出所述第一分类网络模型,并获取所述第一分类网络模型中网络层的权重值。
4.根据权利要求1所述的生成方法,其特征在于,所述根据所述参考权重值,调整所述第一分类网络模型中网络层的权重值,以确定调整后的第一分类网络模型,包括:
根据所述参考权重值,从所述参考权重值中选取N1个权重值替换到所述第一分类网络模型中网络层的权重值,以确定调整后的第一分类网络模型,所述N1为正整数。
5.根据权利要求4所述的生成方法,其特征在于,所述根据所述第一样本数据,重新训练所述调整后的第一分类网络模型,包括:
在所述调整后的第一分类网络模型的第一分类准确率小于所述第一阈值时,从所述参考权重值中选取N2个权重值替换到所述第一分类网络模型中网络层的权重值,以确定再次调整后的第一分类网络模型,所述N2小于N1。
6.一种不均衡样本的分类网络模型的生成方法,其特征在于,所述方法包括:
获取不均衡样本的原始数据;
将所述不均衡样本的原始数据输入分类网络模型,得到与所述不均衡样本的原始数据对应的分类结果;
其中,所述分类网络模型为采用如权利要求1至5中任一项所述的分类网络模型的生成方法得到的模型。
7.一种分类网络模型生成装置,其特征在于,包括:
收发模块,用于获取原始样本数据,将所述原始样本数据分成第一样本数据和第二样本数据;
处理模块,用于将所述第一样本数据输入到第一分类网络模型进行分类处理,以确定所述第一样本数据的类型;
处理模块,还用于确定第一分类准确率,所述分类准确率用于表征所述第一分类网络模型处理所述第一样本数据的准确率;
处理模块,还用于在所述第一分类准确率小于第一阈值的情况下,获取参考权重值,所述参考权重值为根据所述第二样本数据以及第二分类网络模型确定出的,所述第二分类网络模型用于确定所述第二样本数据的类型;
处理模块,还用于根据所述参考权重值,调整所述第一分类网络模型中网络层的权重值,以确定调整后的第一分类网络模型;
处理模块,还用于根据所述第一样本数据,重新训练所述调整后的第一分类网络模型,直到第一分类准确率大于或等于所述第一阈值为止。
8.根据权利要求7所述的生成装置,其特征在于,包括:
所述处理模块,还用于根据第二样本数据训练第二分类网络模型,直到第二分类准确率大于或等于所述第二阈值为止;
所述收发模块,还用于获取训练好的模型中网络层的权重值,并将所述网络层的权重值作为所述参考权重值。
9.一种分类网络模型生成装置,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至5中任一项所述分类网络模型的生成方法及如权利要求6中所述的一种不均衡样本的分类网络模型的生成方法。
10.一种存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1至5中任一项所述分类网络模型的生成方法及如权利要求6中所述的一种不均衡样本的分类网络模型的生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011391282.4A CN112465042B (zh) | 2020-12-02 | 2020-12-02 | 一种分类网络模型的生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011391282.4A CN112465042B (zh) | 2020-12-02 | 2020-12-02 | 一种分类网络模型的生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112465042A true CN112465042A (zh) | 2021-03-09 |
CN112465042B CN112465042B (zh) | 2023-10-24 |
Family
ID=74805311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011391282.4A Active CN112465042B (zh) | 2020-12-02 | 2020-12-02 | 一种分类网络模型的生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112465042B (zh) |
Citations (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930301A (zh) * | 2012-10-16 | 2013-02-13 | 西安电子科技大学 | 基于特征权重学习与核稀疏表示的图像分类方法 |
CN103955702A (zh) * | 2014-04-18 | 2014-07-30 | 西安电子科技大学 | 基于深度rbf网络的sar图像地物分类方法 |
CN105930878A (zh) * | 2016-06-24 | 2016-09-07 | 山东大学 | 一种基于差分切片能量图和稀疏编码的微表情识别方法 |
CN106555788A (zh) * | 2016-11-11 | 2017-04-05 | 河北工业大学 | 基于模糊处理的深度学习在液压装备故障诊断中的应用 |
CN106845478A (zh) * | 2016-12-30 | 2017-06-13 | 同观科技(深圳)有限公司 | 一种字符置信度的二次车牌识别方法及装置 |
WO2018090657A1 (zh) * | 2016-11-18 | 2018-05-24 | 同济大学 | 基于BP_Adaboost模型的信用卡用户违约的预测方法及系统 |
CN108205707A (zh) * | 2017-09-27 | 2018-06-26 | 深圳市商汤科技有限公司 | 生成深度神经网络的方法、装置和计算机可读存储介质 |
CN108846410A (zh) * | 2018-05-02 | 2018-11-20 | 湘潭大学 | 基于稀疏自动编码深度神经网络的电能质量扰动分类方法 |
CN108875772A (zh) * | 2018-03-30 | 2018-11-23 | 浙江大学 | 一种基于堆叠稀疏高斯伯努利受限玻尔兹曼机和强化学习的故障分类模型及方法 |
CN108875933A (zh) * | 2018-05-08 | 2018-11-23 | 中国地质大学(武汉) | 一种无监督稀疏参数学习的超限学习机分类方法及系统 |
CN108957418A (zh) * | 2018-05-30 | 2018-12-07 | 西安电子科技大学 | 一种基于循环神经网络模型的雷达目标识别方法 |
CN109145749A (zh) * | 2018-07-23 | 2019-01-04 | 长安大学 | 一种跨数据集的面部表情识别模型构建及识别方法 |
CN109214401A (zh) * | 2017-06-30 | 2019-01-15 | 清华大学 | 基于层次化自动编码器的sar图像分类方法及装置 |
CN109522949A (zh) * | 2018-11-07 | 2019-03-26 | 北京交通大学 | 目标识别模型建立方法及装置 |
CN109581339A (zh) * | 2018-11-16 | 2019-04-05 | 西安理工大学 | 一种基于头脑风暴自动调整自编码网络的声呐识别方法 |
CN109583501A (zh) * | 2018-11-30 | 2019-04-05 | 广州市百果园信息技术有限公司 | 图片分类、分类识别模型的生成方法、装置、设备及介质 |
CN109800875A (zh) * | 2019-01-08 | 2019-05-24 | 华南理工大学 | 基于粒子群优化和降噪稀疏编码机的化工故障检测方法 |
CN109800754A (zh) * | 2018-12-06 | 2019-05-24 | 杭州电子科技大学 | 一种基于卷积神经网络的古字体分类方法 |
CN109816002A (zh) * | 2019-01-11 | 2019-05-28 | 广东工业大学 | 基于特征自迁移的单一稀疏自编码器弱小目标检测方法 |
CN109902722A (zh) * | 2019-01-28 | 2019-06-18 | 北京奇艺世纪科技有限公司 | 分类器、神经网络模型训练方法、数据处理设备及介质 |
KR102002549B1 (ko) * | 2019-01-23 | 2019-07-22 | 주식회사 솔리드웨어 | 다단계 분류모델 생성 방법 및 그 장치 |
CN110046706A (zh) * | 2019-04-18 | 2019-07-23 | 腾讯科技(深圳)有限公司 | 模型生成方法、装置及服务器 |
EP3518152A1 (en) * | 2018-01-29 | 2019-07-31 | Panasonic Intellectual Property Corporation of America | Information processing method and information processing system |
JP2019133628A (ja) * | 2018-01-29 | 2019-08-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理方法及び情報処理システム |
CN110162993A (zh) * | 2018-07-17 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 脱敏处理方法、模型训练方法、装置和计算机设备 |
CN110210560A (zh) * | 2019-05-31 | 2019-09-06 | 北京市商汤科技开发有限公司 | 分类网络的增量训练方法、分类方法及装置、设备及介质 |
CN110288002A (zh) * | 2019-05-29 | 2019-09-27 | 江苏大学 | 一种基于稀疏正交神经网络的图像分类方法 |
CN110391955A (zh) * | 2019-07-22 | 2019-10-29 | 平安科技(深圳)有限公司 | 网络数据预处理方法、装置、设备及可读存储介质 |
CN110457469A (zh) * | 2019-07-05 | 2019-11-15 | 中国平安财产保险股份有限公司 | 基于长短期记忆网络的信息分类方法、装置、计算机设备 |
CN110472667A (zh) * | 2019-07-19 | 2019-11-19 | 广东工业大学 | 基于反卷积神经网络的小目标分类方法 |
CN110503186A (zh) * | 2019-07-19 | 2019-11-26 | 北京三快在线科技有限公司 | 商品排序神经网络模型训练方法、装置、电子设备 |
WO2019232873A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 文字模型训练方法、文字识别方法、装置、设备及介质 |
WO2019232851A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 语音区分模型训练方法、装置、计算机设备及存储介质 |
CN111126481A (zh) * | 2019-12-20 | 2020-05-08 | 湖南千视通信息科技有限公司 | 一种神经网络模型的训练方法及装置 |
CN111128391A (zh) * | 2019-12-24 | 2020-05-08 | 北京推想科技有限公司 | 一种信息处理设备、方法和存储介质 |
CN111160582A (zh) * | 2019-12-31 | 2020-05-15 | 科大讯飞(苏州)科技有限公司 | 设备故障识别方法、装置及计算机可读存储介质 |
CN111444951A (zh) * | 2020-03-24 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 样本识别模型的生成方法、装置、计算机设备和存储介质 |
CN111444952A (zh) * | 2020-03-24 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 样本识别模型的生成方法、装置、计算机设备和存储介质 |
CN111445388A (zh) * | 2019-12-27 | 2020-07-24 | 珠海大横琴科技发展有限公司 | 一种图像超分辨重建模型训练方法、船只跟踪方法及装置 |
CN111553381A (zh) * | 2020-03-23 | 2020-08-18 | 北京邮电大学 | 基于多网络模型的网络入侵检测方法、装置及电子设备 |
CN111611835A (zh) * | 2019-12-23 | 2020-09-01 | 珠海大横琴科技发展有限公司 | 一种船只检测方法及装置 |
US20200285943A1 (en) * | 2019-03-04 | 2020-09-10 | International Business Machines Corpration | Optimizing Hierarchical Classification with Adaptive Node Collapses |
CN111709493A (zh) * | 2020-07-10 | 2020-09-25 | 腾讯科技(深圳)有限公司 | 对象分类方法、训练方法、装置、设备及存储介质 |
CN111709485A (zh) * | 2020-06-19 | 2020-09-25 | 腾讯科技(深圳)有限公司 | 医学影像处理方法、装置和计算机设备 |
WO2020194077A1 (en) * | 2019-03-22 | 2020-10-01 | International Business Machines Corporation | Unification of models having respective target classes with distillation |
CN111753954A (zh) * | 2020-06-05 | 2020-10-09 | 深圳大学 | 一种稀疏化损失函数的超参数优化方法 |
-
2020
- 2020-12-02 CN CN202011391282.4A patent/CN112465042B/zh active Active
Patent Citations (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930301A (zh) * | 2012-10-16 | 2013-02-13 | 西安电子科技大学 | 基于特征权重学习与核稀疏表示的图像分类方法 |
CN103955702A (zh) * | 2014-04-18 | 2014-07-30 | 西安电子科技大学 | 基于深度rbf网络的sar图像地物分类方法 |
CN105930878A (zh) * | 2016-06-24 | 2016-09-07 | 山东大学 | 一种基于差分切片能量图和稀疏编码的微表情识别方法 |
CN106555788A (zh) * | 2016-11-11 | 2017-04-05 | 河北工业大学 | 基于模糊处理的深度学习在液压装备故障诊断中的应用 |
WO2018090657A1 (zh) * | 2016-11-18 | 2018-05-24 | 同济大学 | 基于BP_Adaboost模型的信用卡用户违约的预测方法及系统 |
CN106845478A (zh) * | 2016-12-30 | 2017-06-13 | 同观科技(深圳)有限公司 | 一种字符置信度的二次车牌识别方法及装置 |
CN109214401A (zh) * | 2017-06-30 | 2019-01-15 | 清华大学 | 基于层次化自动编码器的sar图像分类方法及装置 |
CN108205707A (zh) * | 2017-09-27 | 2018-06-26 | 深圳市商汤科技有限公司 | 生成深度神经网络的方法、装置和计算机可读存储介质 |
EP3518152A1 (en) * | 2018-01-29 | 2019-07-31 | Panasonic Intellectual Property Corporation of America | Information processing method and information processing system |
JP2019133628A (ja) * | 2018-01-29 | 2019-08-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理方法及び情報処理システム |
CN108875772A (zh) * | 2018-03-30 | 2018-11-23 | 浙江大学 | 一种基于堆叠稀疏高斯伯努利受限玻尔兹曼机和强化学习的故障分类模型及方法 |
CN108846410A (zh) * | 2018-05-02 | 2018-11-20 | 湘潭大学 | 基于稀疏自动编码深度神经网络的电能质量扰动分类方法 |
CN108875933A (zh) * | 2018-05-08 | 2018-11-23 | 中国地质大学(武汉) | 一种无监督稀疏参数学习的超限学习机分类方法及系统 |
CN108957418A (zh) * | 2018-05-30 | 2018-12-07 | 西安电子科技大学 | 一种基于循环神经网络模型的雷达目标识别方法 |
WO2019232851A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 语音区分模型训练方法、装置、计算机设备及存储介质 |
WO2019232873A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 文字模型训练方法、文字识别方法、装置、设备及介质 |
CN110162993A (zh) * | 2018-07-17 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 脱敏处理方法、模型训练方法、装置和计算机设备 |
CN109145749A (zh) * | 2018-07-23 | 2019-01-04 | 长安大学 | 一种跨数据集的面部表情识别模型构建及识别方法 |
CN109522949A (zh) * | 2018-11-07 | 2019-03-26 | 北京交通大学 | 目标识别模型建立方法及装置 |
CN109581339A (zh) * | 2018-11-16 | 2019-04-05 | 西安理工大学 | 一种基于头脑风暴自动调整自编码网络的声呐识别方法 |
CN109583501A (zh) * | 2018-11-30 | 2019-04-05 | 广州市百果园信息技术有限公司 | 图片分类、分类识别模型的生成方法、装置、设备及介质 |
WO2020108474A1 (zh) * | 2018-11-30 | 2020-06-04 | 广州市百果园信息技术有限公司 | 图片分类、分类识别模型的生成方法、装置、设备及介质 |
CN109800754A (zh) * | 2018-12-06 | 2019-05-24 | 杭州电子科技大学 | 一种基于卷积神经网络的古字体分类方法 |
CN109800875A (zh) * | 2019-01-08 | 2019-05-24 | 华南理工大学 | 基于粒子群优化和降噪稀疏编码机的化工故障检测方法 |
CN109816002A (zh) * | 2019-01-11 | 2019-05-28 | 广东工业大学 | 基于特征自迁移的单一稀疏自编码器弱小目标检测方法 |
KR102002549B1 (ko) * | 2019-01-23 | 2019-07-22 | 주식회사 솔리드웨어 | 다단계 분류모델 생성 방법 및 그 장치 |
CN109902722A (zh) * | 2019-01-28 | 2019-06-18 | 北京奇艺世纪科技有限公司 | 分类器、神经网络模型训练方法、数据处理设备及介质 |
US20200285943A1 (en) * | 2019-03-04 | 2020-09-10 | International Business Machines Corpration | Optimizing Hierarchical Classification with Adaptive Node Collapses |
WO2020194077A1 (en) * | 2019-03-22 | 2020-10-01 | International Business Machines Corporation | Unification of models having respective target classes with distillation |
CN110046706A (zh) * | 2019-04-18 | 2019-07-23 | 腾讯科技(深圳)有限公司 | 模型生成方法、装置及服务器 |
CN110288002A (zh) * | 2019-05-29 | 2019-09-27 | 江苏大学 | 一种基于稀疏正交神经网络的图像分类方法 |
CN110210560A (zh) * | 2019-05-31 | 2019-09-06 | 北京市商汤科技开发有限公司 | 分类网络的增量训练方法、分类方法及装置、设备及介质 |
CN110457469A (zh) * | 2019-07-05 | 2019-11-15 | 中国平安财产保险股份有限公司 | 基于长短期记忆网络的信息分类方法、装置、计算机设备 |
CN110503186A (zh) * | 2019-07-19 | 2019-11-26 | 北京三快在线科技有限公司 | 商品排序神经网络模型训练方法、装置、电子设备 |
CN110472667A (zh) * | 2019-07-19 | 2019-11-19 | 广东工业大学 | 基于反卷积神经网络的小目标分类方法 |
CN110391955A (zh) * | 2019-07-22 | 2019-10-29 | 平安科技(深圳)有限公司 | 网络数据预处理方法、装置、设备及可读存储介质 |
CN111126481A (zh) * | 2019-12-20 | 2020-05-08 | 湖南千视通信息科技有限公司 | 一种神经网络模型的训练方法及装置 |
CN111611835A (zh) * | 2019-12-23 | 2020-09-01 | 珠海大横琴科技发展有限公司 | 一种船只检测方法及装置 |
CN111128391A (zh) * | 2019-12-24 | 2020-05-08 | 北京推想科技有限公司 | 一种信息处理设备、方法和存储介质 |
CN111445388A (zh) * | 2019-12-27 | 2020-07-24 | 珠海大横琴科技发展有限公司 | 一种图像超分辨重建模型训练方法、船只跟踪方法及装置 |
CN111160582A (zh) * | 2019-12-31 | 2020-05-15 | 科大讯飞(苏州)科技有限公司 | 设备故障识别方法、装置及计算机可读存储介质 |
CN111553381A (zh) * | 2020-03-23 | 2020-08-18 | 北京邮电大学 | 基于多网络模型的网络入侵检测方法、装置及电子设备 |
CN111444952A (zh) * | 2020-03-24 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 样本识别模型的生成方法、装置、计算机设备和存储介质 |
CN111444951A (zh) * | 2020-03-24 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 样本识别模型的生成方法、装置、计算机设备和存储介质 |
CN111753954A (zh) * | 2020-06-05 | 2020-10-09 | 深圳大学 | 一种稀疏化损失函数的超参数优化方法 |
CN111709485A (zh) * | 2020-06-19 | 2020-09-25 | 腾讯科技(深圳)有限公司 | 医学影像处理方法、装置和计算机设备 |
CN111709493A (zh) * | 2020-07-10 | 2020-09-25 | 腾讯科技(深圳)有限公司 | 对象分类方法、训练方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
DIEHL, P. U等: "Fast-classifying, high-accuracy spiking deep networks through weight and threshold balancing", 《2015 INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS》, pages 1 - 8 * |
田敏: "基于迁移学习的医学文献内图像多标签分类", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》, no. 6, pages 054 - 18 * |
Also Published As
Publication number | Publication date |
---|---|
CN112465042B (zh) | 2023-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI689871B (zh) | 梯度提升決策樹(gbdt)模型的特徵解釋方法和裝置 | |
WO2020082734A1 (zh) | 文本情感识别方法、装置、电子设备及计算机非易失性可读存储介质 | |
WO2019218748A1 (zh) | 一种保险业务风险预测的处理方法、装置及处理设备 | |
CN110364185B (zh) | 一种基于语音数据的情绪识别方法、终端设备及介质 | |
CN111784699B (zh) | 一种对三维点云数据进行目标分割方法、装置及终端设备 | |
CN112183326A (zh) | 人脸年龄识别模型训练方法及相关装置 | |
CN111326169A (zh) | 一种语音质量的评价方法及装置 | |
CN109815988A (zh) | 模型生成方法、分类方法、装置及计算机可读存储介质 | |
CN115082920A (zh) | 深度学习模型的训练方法、图像处理方法和装置 | |
CN115456089A (zh) | 一种分类模型的训练方法、装置、设备和存储介质 | |
CN111815209A (zh) | 应用于风控模型的数据降维方法及装置 | |
CN115577798A (zh) | 基于随机加速梯度下降的半联邦学习方法及装置 | |
CN116451081A (zh) | 数据漂移的检测方法、装置、终端及存储介质 | |
CN113220883B (zh) | 一种文本分类方法、装置及存储介质 | |
CN114239949A (zh) | 一种基于双阶段注意力机制的网站访问量预测方法及系统 | |
US20220019938A1 (en) | Unbalanced sample classification method and apparatus | |
CN112465042A (zh) | 一种分类网络模型的生成方法及装置 | |
CN112818114B (zh) | 信息的分类方法、检测方法、计算设备及存储介质 | |
CN108229572B (zh) | 一种参数寻优方法及计算设备 | |
CN115641201A (zh) | 数据异常检测方法、系统、终端设备及存储介质 | |
US20220284353A1 (en) | Methods and apparatus to train a machine learning model | |
CN113641823A (zh) | 文本分类模型训练、文本分类方法、装置、设备及介质 | |
CN112131409A (zh) | 核保方法、装置、设备、系统及存储介质 | |
CN113705626A (zh) | 异常生活保障申请家庭的识别方法、装置及电子设备 | |
EP3605354A1 (en) | Artificial intelligence-enabled search for a storage system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |