CN108460415B - 一种语种识别方法 - Google Patents
一种语种识别方法 Download PDFInfo
- Publication number
- CN108460415B CN108460415B CN201810168230.7A CN201810168230A CN108460415B CN 108460415 B CN108460415 B CN 108460415B CN 201810168230 A CN201810168230 A CN 201810168230A CN 108460415 B CN108460415 B CN 108460415B
- Authority
- CN
- China
- Prior art keywords
- data
- feature vector
- domain
- classifier
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种语种识别方法,包括使用神经网络为源域数据提取源域特征向量,为目标域数据提取目标域特征向量;基于源域特征向量和目标域特征向量,进行共有特征捕捉以及差异性特征捕捉;将捕捉到的源域共有特征向量输入第一分类器得到第一分类结果;将捕捉的源域差异特征向量输入至第二分类器得到第二分类结果;基于源域共有特征向量和源域差异特征向量进行特征融合,将获取的源域融合特征向量输入至第三分类器得到第三分类结果;根据第一分类结果、第二分类结果和第三分类结果,对神经网络、第一分类器、第二分类器和第三分类器进行训练。该方法能够不对目标域数据进行标注,生成质量较高的伪标签。
Description
技术领域
本发明涉及深度学习技术领域,具体而言,涉及一种语种识别方法。
背景技术
迁移学习可以利用已知领域中有标签的训练样本(可称为源域数据)训练分类模型来对目标领域的数据(可称为目标域数据)进行标定,而并不要求源域数据和目标域数据具有相同的数据分布。迁移学习实际上是通过找寻待标定数据和已知标签数据之间的联系,例如采用核函数的方式将源域和目标域数据映射到同一空间中,在该空间下源域数据和目标域数据拥有相同的分布,从而可以利用该空间表示的有标签的源域样本数据训练分类器来对目标领域进行标定。
已有的迁移学习方法中,存在一种利用伪标签指导目标域数据分类的网络模型。当前一般利用初始卷积神经网络(Convolutional Neural Network,CNN)生成伪标签。这种方法中,如果要生成质量较高的伪标签,则需要对一部分目标域数据进行标注;如果没有对部分目标域数据进行标注,则会造成生成的伪标签质量不高的问题,进而利用少量目标域数据引导迁移学习难度较大。
发明内容
有鉴于此,本发明实施例的目的在于提供一种语种识别方法,能够不对目标域数据进行标注,生成质量较高的伪标签。
第一方面,本发明实施例提供了一种语种识别方法,该方法包括:
获取带有标签的源域数据以及不带标签的目标域数据;
将所述源域数据以及所述目标域数据输入同一神经网络,为所述源域数据提取源域特征向量,并为所述目标域数据提取目标域特征向量;
基于所述源域特征向量以及所述目标域特征向量,对所述源域数据和所述目标域数据进行共有特征捕捉以及差异性特征捕捉;并
将捕捉的源域数据的源域共有特征向量输入第一分类器,得到第一分类结果;以及将捕捉的源域数据的源域差异特征向量输入至第二分类器,得到第二分类结果;
基于所述源域共有特征向量和所述源域差异特征向量,对所述源域数据进行特征融合,并将获取的源域数据的源域融合特征向量输入至第三分类器,得到第三分类结果;
根据所述第一分类结果、第二分类结果以及第三分类结果,分别对所述神经网络、所述第一分类器、所述第二分类器以及所述第三分类器进行本轮训练;
经过对所述神经网络、所述第一分类器、所述第二分类器以及所述第三分类器进行多轮训练,得到伪标签生成模型。
第二方面,本发明实施例提供了一种伪标签生成方法,该方法包括:
将目标数据输入至本申请第一方面提供的伪标签生成模型训练方法训练得到的伪标签生成模型中,分别使用第一分类器、第二分类器以及第三分类器得到所述目标数据的第七分类结果、第八分类结果以及第九分类结果;
当所述第七分类结果、第八分类结果以及第九分类结果一致时的分类结果作为所述目标数据的伪标签。
第三方面,本发明实施例提供了一种语种识别装置,该装置包括:
获取模块:用于获取带有标签的源域数据以及不带标签的目标域数据;
第一处理模块,用于将所述源域数据以及所述目标域数据输入同一神经网络,为所述源域数据提取源域特征向量,并为所述目标域数据提取目标域特征向量;
第二处理模块,用于基于所述源域特征向量以及所述目标域特征向量,对所述源域数据和所述目标域数据进行共有特征捕捉以及差异性特征捕捉;并
分类模块,用于将捕捉的源域数据的源域共有特征向量输入第一分类器,得到第一分类结果;以及将捕捉的源域数据的源域差异特征向量输入至第二分类器,得到第二分类结果;
第三处理模块,用于基于所述源域共有特征向量和所述源域差异特征向量,对所述源域数据进行特征融合,并将获取的源域数据的源域融合特征向量输入至第三分类器,得到第三分类结果;
训练模块,用于根据所述第一分类结果、第二分类结果以及第三分类结果,分别对所述神经网络、所述第一分类器、所述第二分类器以及所述第三分类器进行本轮训练;
经过对所述神经网络、所述第一分类器、所述第二分类器以及所述第三分类器进行多轮训练,得到伪标签生成模型。
第四方面,本申请实施例提供了一种伪标签生成装置,该装置包括:
输入模块,用于将目标数据输入至本申请实施例第一方面提供的伪标签生成模型训练方法训练得到的伪标签生成模型中,分别使用第一分类器、第二分类器以及第三分类器得到所述目标数据的第七分类结果、第八分类结果以及第九分类结果;
伪标签确定模块,用于将所述第七分类结果、第八分类结果以及第九分类结果一致时的分类结果作为所述目标数据的伪标签。
本申请实施例所提供的一种语种识别方法中,在对分类模型进行训练的时候,利用神经网络提取源域数据的源域特征向量和目标域数据的目标域特征向量之后,能够基于源域特征向量和目标域特征向量,分别使用共有特征提取层、差异特征提取层和融合特征提取层,对源域数据和目标域数据进行共有特征、差异特征和融合特征的捕捉,并使用分类器对进行共有特征捕捉、差异特征捕捉和融合特征捕捉后生成的特征向量的分类结果,对分类模型进行训练,使得模型的三个分支分别能够学习到源域数据和目标域数据的共有特征、差异特征以及融合特征,在为目标域数据生成伪标签的时候,三个分支能够在不同的特征空间下为目标域数据提取特征向量,然后基于在不同特征空间下为目标域数据提取的特征向量对目标域数据进行分类,然后综合三个分支对同一目标域数据的分类结果,确定对目标域数据的分类结果,得到目标域数据准确度更高的伪标签。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种伪标签生成模型训练方法的流程图;
图2示出了本申请实施例所提供的伪标签生成模型训练方法中,第一分类损失确定操作的具体方法的流程图;
图3示出了本申请实施例所提供的伪标签生成模型训练方法中,第二分类损失确定操作的具体方法的流程图;
图4示出了本申请实施例所提供的伪标签生成模型训练方法中,第三分类损失确定操作的具体方法的流程图;
图5示出了本申请实施例所提供的一种伪标签生成方法的流程图;
图6示出了本申请实施例所提供的一种伪标签生成模型训练装置的结构示意图;
图7示出了本申请实施例所提供的一种伪标签生成装置的结构示意图;
图8示出了本申请实施例所提供的一种计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
与现有技术不同,本申请实施例利用同一神经网路为源域数据提取源域特征向量,并为目标域数据提取目标域特征向量后,将提取的源域特征向量和目标域特征向量输入至三个模型分支,使得三个模型分支分别能够学习到源域数据和目标域数据的共有特征、差异特征以及融合特征,在为目标域数据生成伪标签的时候,三个分支能够在不同的特征空间下为目标域数据提取特征向量,并基于在不同特征空间下为目标域数据提取的特征向量对目标域数据进行分类,然后综合三个分支对同一目标域数据的分类结果,确定对目标域数据的分类结果,得到目标域数据准确度更高的伪标签。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种伪标签生成模型训练方法进行详细介绍,该方法用于对各种数据的伪标签生成模型的训练,所得的伪标签生成模型能够生成对应数据伪标签。
参见图1所示,本申请实施例所提供的伪标签生成模型训练方法包括:
S101:获取带有标签的源域数据以及不带标签的目标域数据。
在具体实现的时候,源域数据为带有标签的数据,目标域数据为不带有标签的数据。源域数据和目标域数据具有一定的共性,又有一定的差异性。标签是对源域数据的分类结果的预先标注。
源域数据和目标域数据可以是图像、视频、语言等可以采用神经网络学习进行分类的数据。
例如当源域数据和目标域数据均为图像数据时,源域数据可以是已经确诊了病情的清晰的医学影像图片,在该清晰的医学影像图片所标注的病灶的位置以及疾病的名称即为源域数据的标签;目标域数据可以是未确诊病情的不清晰的医学影像图片。训练所得的分类模型,能够对未标注病灶位置和未确诊的疾病名称的不清晰医学影像图片进行分类,得到该不清晰医学影像图片中是否有病灶,且在医学影像图片中有病灶的前提下,确定病灶的位置。
又例如,当源域数据和目标域数据均为语言数据时,源域数据为法语词汇,目标域数据为西班牙语词汇,由于法语和西班牙语同属于拉丁语系,因此两者之间具有部分共同的特征;但两者属于两种不同的语言,因此又具有一定的差异。使用能够识别的法语对西班牙语的特征进行学习,从而能够识别西班牙语。
又例如,源域数据和目标域数据为语言数据时,要对某些词汇或者话术进行情感分析;源域数据为已经标注了情感标签的词汇,目标域数据是未标注情感标签的话术。
S102:将源域数据以及目标域数据输入同一神经网络,为源域数据提取源域特征向量,并为目标域数据提取目标域特征向量。
在具体实现的时候,神经网络可以采用卷积神经网络(Convolutional NeuralNetwork,CNN)来为源域数据提取源域特征向量,为目标域数据提取目标域特征向量。
源域数据为携带有标签的数据,该标签用于指示源域数据的正确分类结果;目标域数据为不携带标签的数据。在将源域数据和目标域数据输入同一个神经网络后,该神经网络对源域数据以及目标域数据进行共享参数的特征学习。在这个过程中,由于神经网络对源域数据进行有监督学习,而对目标域数据进行无监督学习,在使用同一神经网络对源域数据和目标域数据进行共享参数的学习过程中,会不断调整神经网络中所使用的参数,从而在对神经网络训练的过程中,让神经网络的参数受到源域数据影响的同时,还会受到目标域数据的影响,进而使得神经网络在对源域数据和目标域数据进行特征学习后,对每个源域数据进行特征提取所得到的源域特征向量会受到目标域数据的干扰,使得为源域数据所提取的源域特征向量会具有部分目标域数据的特征;同样的,在对每个目标域数据进行特征提取所得到的目标域特征向量会受到源域数据的干扰,使得为目标域数据提取目标域向量会具有部分源域数据的特征,最终实现源域数据和目标域数据的域间混合。
S103:基于源域特征向量以及目标域特征向量,对源域数据和目标域数据进行共有特征捕捉。
在具体实现的时候,由于要使得分类模型学习到源域数据和目标域数据的共有特征和差异特征,因此,需要在对分类模型进行训练的时候,使用两个训练分支来对源域数据和目标域数据的共有特征和差异特征分别进行捕捉。
在具体实现的时候,可以采用如下步骤一一至步骤一四对应的方式对源域数据和目标域数据进行共有特征捕捉:
步骤一一:将源域特征向量以及目标域特征向量输入至共有特征捕捉层,使用共有特征捕捉层提取源域数据的源域共有特征向量和目标域数据的目标域共有特征向量;
步骤一二:将源域共有特征向量和目标域共有特征向量进行梯度反向处理;
步骤一三:将进行梯度反向处理的源域共有特征向量和目标域共有特征向量输入至第一域分类器;
步骤一四:根据第一域分类器对源域共有特征向量和目标域共有特征向量分别表征的源域数据和目标域数据的域分类结果,对神经网络以及共有特征捕捉层的参数进行调整。
在具体实现的时候,共有特征捕捉层为一全连接层,可以为在神经网络的基础上加设的一层特征汇聚层,能够将神经网络输出的特征进行维度变换。共有特征捕捉层在对当前源域特征向量进行处理后,能够得到当前源域特征向量对应的源域共有特征向量;共有特征捕捉层在当前目标域特征向量进行处理后,能够得到当前目标域特征向量对应的目标域共有特征向量。
由于在使用源域数据和目标域数据对神经网络和共有特征捕捉层进行训练的过程,实际上是要将源域数据和目标域数据进行域混合的过程。使用神经网络和共有特征捕捉层对源域数据进行特征提取所获得的源域共有特征向量要受到目标域数据中特征的影响,也即,使得源域特征向量向目标域数据的特征接近;同时,使用神经网络和共有特征捕捉层对目标域数据进行特征提取所获取的目标域共有特征向量受到源域数据中特征的影响,也即,使得目标域共有特征向量向源域数据的特征接近。因此,为了实现对源域数据和目标域数据的域混合,在为目标域数据中的每个目标域数据提取目标域共有特征向量,并为源域数据中的每个源域数据提取源域共有特征向量后,要将目标域共有特征向量和源域共有特征向量进行梯度反向处理,然后将经过梯度反向处理的目标域共有特征向量和源域共有特征向量输入至第一域分类器,使用第一域分类器对目标域共有特征向量和源域共有特征向量进行域分类。
域分类的结果正确,也即第一域分类器能够正确对源域共有特征向量和目标域共有特征向量进行正确分类的概率越大,则说明域混合的程度越小;域分类的结果错误的概率越大,也即域分类器对源域共有特征向量和目标域共有特征向量进行分类正确的概率越小,说明域混合的程度越大,因此,要基于第一域分类器对目标域共有特征向量和源域共有特征向量分别表征的源域数据和目标域数据进行分类的结果,对神经网络和共有特征捕捉层进行参数调整。
具体地,根据第一域分类器对源域共有特征向量和目标域共有特征向量分别表征的源域数据和目标域数据的域分类结果,对神经网络以及共有特征捕捉层的参数进行调整,具体可以通过执行如下第一域分类损失确定操作来实现。该第一域分类损失确定操作如下述步骤二一至步骤二三:
步骤二一:确定当前源域共有特征向量和目标域共有特征向量分别表征的源域数据和目标域数据的本次域分类的域分类损失。
此处,通过域分类是损失来表征域混合的程度。源域数据的域分类损失,可以通过在基于源域共有特征向量和目标域共有特征向量对源域数据和目标域数据进行域分类的过程中,分类结果为被分到目标域中的源域数据的数量来表征。目标域数据的域分类损失可以通过在基于源域共有特征向量和目标域共有特征向量对源域数据和目标域数据进行域分类的过程中,分类结果为被分到源域中的目标域数据的数量来表征。在使用第一域分类器对源域共有特征向量以及目标域共有特征向量分别表征的源域数据和目标域数据进行域分类后,就能够获得域分类结果,然后按照域分类结果,以及源域数据和目标域数据正确的域归属,确定源域数据合目标域数据分别对应的域分类损失。
步骤二二:针对最近预设次数的域分类损失之间的差别不小于预设差别阈值,生成第一反馈信息,并基于第一反馈信息对神经网络和共有特征捕捉层进行参数调整。
此处,使用预设差别阈值来对域混合的程度进行约束。第一域分类器中预先存储有源域共有特征向量和目标域共有特征向量分别归属的域的分布,当最近预设次数的域分类损失之间的差别不小于预设差别阈值时,则认为域分类还未达到稳定的状态,也就是说,在某次域分类中,第一域分类器能正确区分源域共有特征向量和目标域共有特征向量分别所属的域,某次域分类中,域分类器又不能正确区分源域共有特征向量和目标域共有特征向量分别所属的域,域混合程度还不稳定,那么,需要对神经网络和共有特征捕捉层的参数进行调整,因此会生成域分类损失差别过大的第一反馈信息,并反馈给神经网络和共有特征捕捉层。神经网络和共有特征捕捉层在接收到该域分类损失差别过大的第一反馈信息后,分别对自身的参数进行调整,使得域分类的结果趋于稳定。
步骤二三:基于调整后的参数,使用神经网络以及共有特征捕捉层为源域数据提取新的源域共有特征向量,并为目标域数据提取新的目标域共有特征向量,并执行域分类损失确定操作,直至差别大于预设差别阈值,完成基于第一域分类器对神经网络以及共有特征捕捉层的本轮训练。
基于第一域分类器对神经网络的训练,是要根据第一域分类器的对源域共有特征向量和目标域共有特征向量的分类结果所确定的域分类损失维持在一定的值上,尽可能分不清楚目标域数据和源域数据到底是属于源域还是属于目标域,提取两者的共有特征。
此处,需要注意的是,当最近预设次数的域分类损失之间的差别小于预设差别阈值时,也会生成域分类损失合适的反馈信息,并将之反馈给神经网络和共有特征捕捉层。神经网络和共有特征捕捉层在接收到该域分类损失合适的反馈信息后,还会对自身的参数进行幅度较小的调整,力求梯度下降到局部最优。
另外,还可以采取另外一种方式,来根据第一域分类器对源域共有特征向量和目标域共有特征向量分别表征的源域数据和目标域数据的域分类结果,对神经网络以及共有特征捕捉层的参数进行调整。该方式如下述步骤三一至步骤三三所示:
步骤三一:确定当前源域共有特征向量和目标域共有特征向量分别表征的源域数据和目标域数据的本次域分类的域分类损失;
步骤三二:针对域分类结果错误的情况,生成第三反馈信息,并基于第三反馈信息对神经网络以及共有特征捕捉层进行参数调整;
步骤三三:基于调整后的参数,使用神经网络和差异特征捕捉层为源域数据提取新的源域共有特征向量,并为目标域数据提取新的目标域共有特征向量,并执行该域分类损失确定操作。
S104:将捕捉的源域数据的源域共有特征向量输入第一分类器,得到第一分类结果。
得到基于源域数据和目标域数据的共有特征的第一个分支下,对源域数据进行分类的第一分类结果。
此处,分类器能够基于源域数据的源域共有特征向量对源域数据进行分类,最终得到源域数据的分类结果。
S105:基于源域特征向量以及目标域特征向量,对源域数据和目标域数据进行差异特征捕捉。
在具体实现的时候,采用区别于上述S103的另外一个分支对源域数据和目标域数据进行差异特征捕捉。
在具体实现的时候,可以采用步骤四一至步骤四三对应的方式对源域数据和目标域数据进行差异特征捕捉:
步骤四一:将源域特征向量以及目标域特征向量输入差异特征捕捉层,使用差异特征捕捉层提取获取源域差异特征向量和目标域差异特征向量。
步骤四二:将源域差异特征向量和目标域差异特征向量输入至第二域分类器。
步骤四三:根据第二域分类器对源域差异特征向量和目标域差异特征向量分别表征的源域数据和目标域数据的域分类结果,对神经网络以及差异特征捕捉层的参数进行调整。
在具体实现的时候,差异特征捕捉层为一全连接层,可以为在神经网络的基础上加设的一层特征汇聚层,能够将神经网络输出的特征进行维度变换。差异特征捕捉层在对当前源域特征向量进行处理后,能够得到当前源域特征向量对应的源域差异特征向量;差异特征捕捉层在当前目标域特征向量进行处理后,能够得到当前目标域特征向量对应的目标域差异特征向量。
在不对源域特征向量和目标域特征向量进行梯度反向处理,而是将两者直接输入差异特征捕捉层,并将差异特征捕捉层分别输出的源域数据的源域差异特征向量和目标域数据的目标域差异特征向量输入至第二域分类器,使用第二域分类器对源域差异特征向量以及目标域差异特征向量分别表征的源域数据和目标域数据进行域分类,所得到的域分类损失越小,才能够尽可能区分出源域数据和目标域数据所属的域,使得神经网络以及差异特征捕捉层能够学习到源域数据和目标域数据之间的差异特征,拉远两者之间的距离。
具体地,根据第一域分类器对源域差特征向量和目标域差异特征向量分别表征的源域数据和目标域数据的域分类结果,对神经网络以及差异特征捕捉层的参数进行调整,具体可以通过执行如下第二域分类损失确定操作来实现。该第二域分类损失确定操作如下述步骤五一至步骤五三:
步骤五一:确定当前源域差异特征向量和目标域差异特征向量分别表征的源域数据和目标域数据的本次域分类的域分类损失。
此处,通过域分类损失来表征源域差异特征向量和目标域差异特征向量进行域混合的程度。此处的源域数据的域分类损失可以通过在基于源域差异特征向量和目标域差异特征向量对源域数据和目标域数据进行分类的过程中,分类结果为目标域数据的源域数据的数量来表征。目标域数据的域分类损失可以通过在基于源域差异特征向量和目标域差异特征向量对源域数据和目标域数据进行分类的过程中,分类结果为源域数据的目标域数据的数量来表征。在使用第二域分类器对源域差异特征向量以及目标域差异特征向量分别表征的源域数据和目标域数据进行域分类后,就能够获得域分类结果,然后按照域分类结果,确定源域数据和目标域数据分别对应的域分类损失。
步骤五二:针对域分类结果错误的情况,生成第二反馈信息,并基于第二反馈信息对神经网络以及差异特征捕捉层进行参数调整。
此处,由于要保证域分类结果的正确性,只有域分类结果是正确的,才会拉远源域数据和目标域数据之间的距离,也才能提取到源域数据和目标域数据之间的差异性数据,因此要在域分类结果错误的时候,生成第二反馈信息,并基于第二反馈信息对神经网络和差异特征捕捉层进行参数调整。
步骤五三:基于调整后的参数,使用神经网络和差异特征捕捉层为源域数据提取新的源域差异特征向量,并为目标域数据提取新的目标域差异特征向量,并执行第二域分类损失确定操作。
直至域分类结果正确,或者域分类结果的正确率达到预设的阈值。
另外,还可以采用另外一种方法来根据第二域分类器对源域差异特征向量和目标域差异特征向量分别表征的源域数据和目标域数据的域分类结果,对神经网络以及差异特征捕捉层的参数进行调整。该方法如下述步骤六一至步骤六三所示:
步骤六一:确定当前源域差异特征向量和目标域差异特征向量分别表征的源域数据和目标域数据的本次域分类的域分类损失;
步骤六二:针对最近预设次数的域分类损失之间的差别不小于预设差别阈值,生成第四反馈信息,并基于第四反馈信息对神经网络、差异特征捕捉层进行参数调整;
步骤六三:基于调整后的参数,使用神经网络以及差异特征捕捉层为源域数据提取新的源域差异特征向量,并为目标域数据提取新的目标域差异特征向量,并执行域分类损失确定操作,直至差别大于预设差别阈值,完成基于第二域分类器对神经网络以及差异特征捕捉层的本轮训练。
S106:将捕捉的源域数据的源域差异特征向量输入至第二分类器,得到第二分类结果;
得到基于源域数据和目标域数据的差异特征的第二个分支下,对源域数据进行分类的第一分类结果。
S107:基于源域共有特征向量和源域差异特征向量,对源域数据进行特征融合,并将获取的源域数据的源域融合特征向量输入至第三分类器,得到第三分类结果。
在具体实现的时候,特征融合,是要将源域数据和目标域数据的差异特征、源域数据和目标域数据的共有特征进行融合。然后使用进行特征融合后形成的源域融合特征向量对第三个分支进行训练,其中第三个分支是要基于源域数据和目标域数据的差异特征和共有特征,对源域数据进行分类。
具体地,在对伪标签生成模型的第三个分支进行训练的时候,在基于源域共有特征向量和源域差异特征向量进行融合时,还需将目标域共有特征向量和目标域差异特征向量进行融合,辅助模型的训练。
此处,目标域共有特征向量是基于源域特征向量和目标域特征向量,对源域数据和目标域数据进行共有特征捕捉时,所获得的目标域数据的目标域共有特征向量;目标域差异特征向量是基于源域特征向量和目标域特征向量,对源域数据和目标域数据进行差异特征捕捉时,所获得的目标域数据的目标域差异特征向量。
可以采用下述步骤七一直步骤七三对应的方式对源域数据和目标域数据进行特征融合:
步骤七一:将源域共有特征向量和源域差异特征向量进行拼接,形成第一拼接向量。
步骤七二:将目标域共有特征向量和目标域差异特征向量进行拼接,形成第二特征向量。
在具体实现的时候,将源域共有特征向量和源域差异特征向量进行拼接的方式有两种,其中一种是横向拼接,例如,源域共有特征向量为1*128,源域差异特征向量为1*128,则将两者进行拼接,所形成的第一拼接向量为:1*256。另一种是纵向拼接,例如,源域共有特征向量为1*128,源域差异特征向量为1*128,则将两者进行拼接,所形成的第一拼接向量为:2*128。
所形成的第一拼接向量Ds满足下述公式(1):
第二特征向量在拼接形成第二拼接向量的情况与上述类似,因此不再赘述。
第二拼接向量Dt满足下述公式(2):
步骤七三:将第一拼接向量和第二拼接向量输入至融合特征捕捉层,并使用融合特征捕捉层为第一拼接向量提取源域融合特征向量。
此处,融合特征捕捉层为一全连接层,可以为在神经网络的基础上加设的一层特征汇聚层,能够将第一拼接向量和第二拼接向量进行维度变换。融合特征捕捉层在对当前第一拼接向量和第二拼接向量进行处理后,能够得到当前源域特征向量对应的源域融合特征向量,和当前第二拼接向量对应的目标域融合特征向量。
在得到源域融合特征向量后,将其输入至第三分类器,得到对源域数据的第三分类结果。
S108:根据第一分类结果、第二分类结果以及第三分类结果,分别对神经网络、第一分类器、第二分类器以及第三分类器进行本轮训练。
在具体实现的时候,在根据第一分类结果、第二分类结果以及第三分类结果,分别对神经网络、第一分类器、第二分类器以及第三分类器进行本轮训练的时候,要基于第一分类结果分别对神经网络和第一分类器进行训练、基于第二分类结果分别对神经网络和第二分类器进行训练,以及基于第三分类结果分别对神经网络和第三分类器进行训练。
具体地,采用如下方法根据第一分类结果,分别对神经网络、第一分类器进行本轮训练:
执行以下第一分类损失确定操作,直至第一分类损失不大于预设的第一分类损失阈值;
参见图2所示,第一分类损失确定操作包括:
S201:根据源域数据的第一分类结果,以及源域数据的标签,计算第一分类损失;
S202:将第一分类损失与预设的第一分类损失阈值进行比对;
S203:检测源域数据的第一分类损失是否不大于预设的第一分类损失阈值;如果否,则跳转至S204;如果是,则跳转至S206。
S204:调整神经网络的参数、共有特征捕捉层的参数以及第一分类器的参数。
S205:基于调整后的参数,使用神经网络、共有特征捕捉层、以及第一分类器重新获得源域数据的第一分类结果;跳转至201。
S206:完成对神经网络、共有特征捕捉层以及第一分类器的本轮训练。
直至源域数据的第一分类损失不大于预设的第一分类损失阈值。
此处,用第一分类损失来表征神经网络、共有特征提取层以及第一分类器在训练过程中受到源域数据和目标域数据的共有特征影响的程度。使得第一分类损失不大于预设的第一分类损失阈值,是要在神经网络受到目标域数据中的特征的影响,但这个影响被限制在一定的范围内,不能影响神经网络对源域数据进行分类的准确性。
一般地,第一分类损失可以为第一分类器对源域数据的源域共有特征向量进行分类的正确率,可以基于第一分类器对源域数据的分类结果以及源域数据的标签计算得到。
类似的,采用如下方法根据第二分类结果,分别对神经网络、第二分类器进行本轮训练:
执行以下第二分类损失确定操作,直至第二分类损失不大于预设的第一分类损失阈值;
参见图3所示,第二分类损失确定操作包括:
S301:根据源域数据的第二分类结果,以及源域数据的标签,计算第二分类损失;
S302:将第二分类损失与预设的第二分类损失阈值进行比对;
S303:检测源域数据的第二分类损失是否不大于预设的第二分类损失阈值;如果否,则跳转至S304;如果是,则跳转至S306。
S304:调整神经网络的参数、差异特征捕捉层的参数以及第二分类器的参数。
S305:基于调整后的参数,使用神经网络、差异特征捕捉层以及第二分类器重新获得源域数据的第二分类结果;跳转至S301。
S306:完成对神经网络、差异特征捕捉层以及第二分类器的本轮训练。
直至源域数据的第二分类损失不大于预设的第二分类损失阈值。
此处,用第二分类损失来表征神经网络、差异特征提取层以及第二分类器在训练过程中受到源域数据和目标域数据的差异特征影响的程度。使得第二分类损失不大于预设的第二分类损失阈值,是要在神经网络受到目标域数据中的特征的影响,但这个影响被限制在一定的范围内,不能影响第二分类器对源域数据进行分类的准确性。
一般地,第二分类损失可以为第二分类器对源域数据的源域共有特征向量进行分类的正确率,可以基于第二分类器对源域数据的分类结果以及源域数据的标签计算得到。
采用如下方法根据第三分类结果,分别对神经网络、第三分类器进行本轮训练:
执行以下第三分类损失确定操作,直至第三分类损失不大于预设的第三分类损失阈值;
参见图4所示,第三分类损失确定操作包括:
S401:根据源域数据的第三分类结果,以及源域数据的标签,计算第三分类损失;
S402:将第三分类损失与预设的第三分类损失阈值进行比对;
S403:检测源域数据的第三分类损失是否不大于预设的第三分类损失阈值;如果否,则跳转至S404;如果是,则跳转至S406。
S404:调整神经网络的参数、融合特征捕捉层的参数以及第二分类器的参数。
S405:基于调整后的参数,使用神经网络、融合特征捕捉层以及第三分类器重新获得源域数据的第三分类结果;跳转至S401。
S406:完成对神经网络、融合特征捕捉层以及第三分类器的本轮训练。
此处,用第三分类损失来表征神经网络、融合特征提取层以及第三分类器在训练过程中受到源域数据和目标域数据的共有特征和差异特征共同影响的程度。使得第三分类损失不大于预设的第三分类损失阈值,是要在神经网络受到目标域数据中的特征的影响,但这个影响被限制在一定的范围内,不能影响第三分类器对源域数据进行分类的准确性。
一般地,第三分类损失可以为第三分类器对源域数据的源域融合特征向量进行分类的正确率,可以基于第三分类器对源域数据的分类结果以及源域数据的标签计算得到。
此处,需要注意的是,由于融合特征捕捉层的输入来源于共有特征捕捉层和差异特征捕捉层,因此在本轮对神经网络的参数、融合特征捕捉层的参数以及第三分类器的参数进行调整的同时,还会同步调整共有特征捕捉层的参数和差异特征捕捉层的参数。
S109:经过对神经网络、第一分类器、第二分类器以及第三分类器进行多轮训练,得到伪标签生成模型。
在具体实现的时候,多轮训练,是指在每一轮的多次训练中为神经网络分别输入的源域数据和目标域数据目是不变的;而在不同轮的训练中,为神经网络和目标神经网络所输入的源域数据和目标域数据以是不同的。
除第一轮以外,其他轮训练中,所使用的初始神经网络、共有特征提取层、差异特征提取层、融合特征提取层、第一分类器、第二分类器以及第二分类器为上一轮训练完成时所得到的神经网络、共有特征提取层、差异特征提取层、融合特征提取层、第一分类器、第二分类器以及第二分类器,并最终将经过多轮训练的神经网络、共有特征提取层、差异特征提取层、融合特征提取层、第一分类器、第二分类器以及第三分类器作为所得到的分类模型。
本申请实施例所提供的分类模型训练方法中,在对分类模型进行训练的时候,利用神经网络提取源域数据的源域特征向量和目标域数据的目标域特征向量之后,能够基于源域特征向量和目标域特征向量,分别使用共有特征提取层、差异特征提取层和融合特征提取层,对源域数据和目标域数据进行共有特征、差异特征和融合特征的捕捉,并使用分类器对进行共有特征捕捉、差异特征捕捉和融合特征捕捉后生成的特征向量的分类结果,对分类模型进行训练,使得模型的三个分支分别能够学习到源域数据和目标域数据的共有特征、差异特征以及融合特征,在为目标域数据生成伪标签的时候,三个分支能够在不同的特征空间下为目标域数据提取特征向量,然后基于在不同特征空间下为目标域数据提取的特征向量对目标域数据进行分类,然后综合三个分支对同一目标域数据的分类结果,确定对目标域数据的分类结果,得到目标域数据准确度更高的伪标签。
另外,在本申请实施例中,为了进一步得到更加准确的伪标签生成模型,在基于源域特征向量以及目标域特征向量,对源域数据和目标域数据进行共有特征捕捉以及差异性特征捕捉的时候,除了能够捕捉到源域数据的源域共有特征向量和源域差异特征向量之外,还能够捕捉到目标域数据的目标域共有特征向量和目标域差异特征向量。
然后将目标域共有特征向量输入至第一分类器,得到第四分类结果,将目标域差异特征向量输入至第二分类器得到第五分类结果,以及对源域数据和目标域数据进行特征融合,获取目标域数据的目标域融合特征向量,并将目标域融合特征向量输入第三分类器,得到第六分类结果。
由于第四分类结果、第五分类结果和第六分类结果都是对目标域数据的分类结果,理论上应当是一致的。因此在三者不一致时,需要调整神经网络、第一分类器、第二分类器以及第三分类器的参数,使得对目标域数据的第四分类结果、第五分类结果和第六分类结果趋于一致,从而对伪标签生成模型进行进一步的训练,力求梯度下降到局部最优,同时提高伪标签生成模型在生成伪标签时的准确度。
此处,对源域数据和目标域数据进行特征融合,获取目标域数据的目标域融合特征向量的过程,和对源域数据和目标域数据进行特征融合,获取源域数据的源域融合特征向量的过程类似,在此不再赘述。
参见图5所示,本申请实施例还提供一种为标签生成方法,该方法包括:
S501:将目标数据输入至本申请实施例的伪标签生成模型训练方法训练得到的伪标签生成模型中,分别使用第一分类器、第二分类器以及第三分类器得到目标数据的第七分类结果、第八分类结果以及第九分类结果;
S502:当第七分类结果、第八分类结果以及第九分类结果一致时的分类结果作为目标数据的伪标签。
使用本申请实施例所提供的伪标签生成模型训练方法训练得到的伪标签生成模型,生成目标数据的伪标签的准确度更高。
另外,该方法还包括:将通过伪标签生成模型确定出伪标签的第一目标数据确定为源数据,将对应的伪标签确定为源数据的标签;以及
将通过伪标签生成模型未确定出伪标签的第二目标数据确定为目标数据;
将确定的源数据及对应的标签、确定的目标数据输入伪标签生成模型继续对伪标签生成模型进行训练。
训练的过程与上述为标签生成模型的训练过程类似,在此不再赘述。这样可以在所得到的伪标签生成模型基础之上,对伪标签生成模型进行进一步训练,以得到更加精确的为标签生成模型。
基于同一发明构思,本发明实施例中还提供了与伪标签生成模型训练方法对应的伪标签生成模型训练装置,由于本发明实施例中的装置解决问题的原理与本发明实施例上述伪标签生成模型训练方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参见图6所示,本申请实施例提供的伪标签生成模型训练装置包括:
获取模块10:用于获取带有标签的源域数据以及不带标签的目标域数据;
第一处理模块20,用于将源域数据以及目标域数据输入同一神经网络,为源域数据提取源域特征向量,并为目标域数据提取目标域特征向量;
第二处理模块30,用于基于源域特征向量以及目标域特征向量,对源域数据和目标域数据进行共有特征捕捉以及差异性特征捕捉;并
分类模块40,用于将捕捉的源域数据的源域共有特征向量输入第一分类器,得到第一分类结果;以及将捕捉的源域数据的源域差异特征向量输入至第二分类器,得到第二分类结果;
第三处理模块50,用于基于源域共有特征向量和源域差异特征向量,对源域数据进行特征融合,并将获取的源域数据的源域融合特征向量输入至第三分类器,得到第三分类结果;
训练模块60,用于根据第一分类结果、第二分类结果以及第三分类结果,分别对神经网络、第一分类器、第二分类器以及第三分类器进行本轮训练;经过对神经网络、第一分类器、第二分类器以及第三分类器进行多轮训练,得到伪标签生成模型。
可选地,第二处理模块30用于采用如下方式对源域数据和目标域数据进行共有特征捕捉:
将源域特征向量以及目标域特征向量输入至共有特征捕捉层,使用共有特征捕捉层提取源域数据的源域共有特征向量和目标域数据的目标域共有特征向量;
将源域共有特征向量和目标域共有特征向量进行梯度反向处理;
将进行梯度反向处理的源域共有特征向量和目标域共有特征向量输入至第一域分类器;
根据第一域分类器对源域共有特征向量和目标域共有特征向量分别表征的源域数据和目标域数据的域分类结果,对神经网络以及共有特征捕捉层的参数进行调整。
可选地,第二处理模块30用于采用如下方式对源域数据和目标域数据进行差异性特征捕捉:
将源域特征向量以及目标域特征向量输入差异特征捕捉层,使用差异特征捕捉层提取获取源域差异特征向量和目标域差异特征向量;
将源域差异特征向量和目标域差异特征向量输入至第二域分类器;
根据第二域分类器对源域差异特征向量和目标域差异特征向量分别表征的源域数据和目标域数据的域分类结果,对神经网络以及差异特征捕捉层的参数进行调整。
可选地,第三处理模块50,还用于基于捕捉的目标域数据的目标域共有特征向量和目标域数据的目标域差异特征向量,对目标域数据进行特征融合;以及
采用如下方式对源域数据和目标域数据进行特征融合:
将源域共有特征向量和源域差异特征向量进行拼接,形成第一拼接向量;以及,
将目标域共有特征向量和目标域差异特征向量进行拼接,形成第二特征向量;
将第一拼接向量和第二拼接向量输入至融合特征捕捉层,并使用融合特征捕捉层为第一拼接向量提取源域融合特征向量。
可选地,训练模块60用于采用如下方法根据第一分类结果,分别对神经网络、第一分类器进行本轮训练:
执行以下第一分类损失确定操作,直至第一分类损失不大于预设的第一分类损失阈值;
第一分类损失确定操作包括:
根据第一分类结果,以及源域数据的标签,计算第一分类损失;
将第一分类损失与预设的第一分类损失阈值进行比对;
如果第一分类损失大于预设的第一分类损失阈值,则调整神经网络的参数、共有特征捕捉层的参数、以及第一分类器的参数。
可选地,训练模块60用于采用如下方法根据第二分类结果,分别对神经网络、第二分类器进行本轮训练:
执行以下第二分类损失确定操作,直至第二分类损失不大于预设的第二分类损失阈值;
第二分类损失确定操作包括:
根据第二分类结果,以及源域数据的标签,计算第二分类损失;
将第二分类损失与预设的第二分类损失阈值进行比对;
如果第二分类损失大于预设的第二分类损失阈值,则调整神经网络的参数、差异特征捕捉层的参数、以及第二分类器的参数。
可选地,训练模块60用于采用如下方法根据第三分类结果,分别对神经网络、第三分类器进行本轮训练:
执行以下第三分类损失确定操作,直至第三分类损失不大于预设的第三分类损失阈值;
第三分类损失确定操作包括:
根据第三分类结果,以及源域数据的标签,计算第三分类损失;
将第三分类损失与预设的第三分类损失阈值进行比对;
如果第三分类损失大于预设的第三分类损失阈值,则调整神经网络的参数、融合特征捕捉层的参数、以及第三分类器的参数。
可选地,分类模块40,还用于将捕捉的目标域数据的目标域共有特征向量输入第一分类器,得到第四分类结果;
将捕捉的目标域数据的目标域差异特征向量输入第二分类器,得到第五分类结果;
第三处理模块50,还用于对源域数据和目标域数据进行特征融合,获取目标域数据的目标域融合特征向量,并将目标域融合特征向量输入第三分类器,得到第六分类结果。
训练模块60还用于在第四分类结果、第五分类结果以及第六分类结果不一致时,调整神经网络、第一分类器、第二分类器以及第三分类器的参数。
本发明又一实施例还提供一种伪标签生成装置,参见图7所示,本发明实施例所提供的伪标签生成装置包括:
输入模块70,用于将目标数据输入至本申请实施例提供的伪标签生成模型训练方法训练得到的伪标签生成模型中,分别使用第一分类器、第二分类器以及第三分类器得到目标数据的第七分类结果、第八分类结果以及第九分类结果;
伪标签确定模块80,用于将第七分类结果、第八分类结果以及第九分类结果一致时的分类结果作为目标数据的伪标签。
可选地,还包括:辅助训练模块90,用于将通过伪标签生成模型确定出伪标签的第一目标数据确定为源数据,将对应的伪标签确定为源数据的标签;以及
将通过伪标签生成模型未确定出伪标签的第二目标数据确定为目标数据;
将确定的源数据及对应的标签、确定的目标数据输入伪标签生成模型继续对伪标签生成模型进行训练。
对应于图1中的伪标签生成模型训练方法,本发明实施例还提供了一种计算机设备,如图8所示,该设备包括存储器1000、处理器2000及存储在该存储器1000上并可在该处理器2000上运行的计算机程序,其中,上述处理器2000执行上述计算机程序时实现上述伪标签生成模型训练方法的步骤。
具体地,上述存储器1000和处理器2000能够为通用的存储器和处理器,这里不做具体限定,当处理器2000运行存储器1000存储的计算机程序时,能够执行上述伪标签生成模型训练方法,从而解决需要对目标域数据进行标注的问题,进而达到不对目标域数据进行标注,生成质量较高的伪标签的效果。
对应于图1中的伪标签生成模型训练方法,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述伪标签生成模型训练方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述伪标签生成模型训练方法,从而解决需要对目标域数据进行标注的问题,进而达到不对目标域数据进行标注,生成质量较高的伪标签的效果。
本发明实施例所提供的伪标签生成模型训练方法及伪标签生成方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (6)
1.一种语种识别方法,其特征在于,该方法包括:
获取带有标签的源域数据以及不带标签的目标域数据,其中,所述源域数据为第一语言数据,所述目标域数据为第二语言数据,所述标签为第一语言数据所属的语种;
将所述源域数据以及所述目标域数据输入同一神经网络,为所述源域数据提取源域特征向量,并为所述目标域数据提取目标域特征向量;
基于所述源域特征向量以及所述目标域特征向量,对所述源域数据和所述目标域数据进行共有特征捕捉以及差异性特征捕捉;并
将捕捉的源域数据的源域共有特征向量输入第一分类器,得到第一分类结果;以及将捕捉的源域数据的源域差异特征向量输入至第二分类器,得到第二分类结果;
基于所述源域共有特征向量和所述源域差异特征向量,对所述源域数据进行特征融合,并将获取的源域数据的源域融合特征向量输入至第三分类器,得到第三分类结果;
根据所述第一分类结果、第二分类结果以及第三分类结果,分别对所述神经网络、所述第一分类器、所述第二分类器以及所述第三分类器进行本轮训练;
经过对所述神经网络、所述第一分类器、所述第二分类器以及所述第三分类器进行多轮训练,得到伪标签生成模型;
将目标数据输入至所述伪标签生成模型中,分别使用第一分类器、第二分类器以及第三分类器得到所述目标数据的三个分类结果;
将三个分类结果一致时的分类结果,确定为所述目标数据的伪标签,其中所述伪标签为所述目标数据的语种;
采用如下方式对所述源域数据和所述目标域数据进行共有特征捕捉:
将所述源域特征向量以及所述目标域特征向量输入至共有特征捕捉层,使用所述共有特征捕捉层提取所述源域数据的源域共有特征向量和所述目标域数据的目标域共有特征向量;
将所述源域共有特征向量和所述目标域共有特征向量进行梯度反向处理;
将进行梯度反向处理的所述源域共有特征向量和所述目标域共有特征向量输入至第一域分类器;
根据所述第一域分类器对所述源域共有特征向量和所述目标域共有特征向量分别表征的所述源域数据和所述目标域数据的域分类结果,对所述神经网络以及所述共有特征捕捉层的参数进行调整;
采用如下方式对所述源域数据和所述目标域数据进行差异性特征捕捉:
将所述源域特征向量以及所述目标域特征向量输入差异特征捕捉层,使用所述差异特征捕捉层提取获取所述源域差异特征向量和所述目标域差异特征向量;
将所述源域差异特征向量和所述目标域差异特征向量输入至第二域分类器;
根据所述第二域分类器对所述源域差异特征向量和所述目标域差异特征向量分别表征的所述源域数据和所述目标域数据的域分类结果,对所述神经网络以及所述差异特征捕捉层的参数进行调整;
基于捕捉的目标域数据的目标域共有特征向量和目标域数据的目标域差异特征向量,对所述目标域数据进行特征融合;
采用如下方式对所述源域数据和所述目标域数据进行特征融合:
将所述源域共有特征向量和所述源域差异特征向量进行拼接,形成第一拼接向量;以及,
将所述目标域共有特征向量和所述目标域差异特征向量进行拼接,形成第二拼接向量;
将所述第一拼接向量和所述第二拼接向量输入至融合特征捕捉层,并使用所述融合特征捕捉层为所述第一拼接向量提取所述源域融合特征向量。
2.根据权利要求1所述的方法,其特征在于,采用如下方法根据所述第一分类结果,分别对所述神经网络、所述第一分类器进行本轮训练:
执行以下第一分类损失确定操作,直至第一分类损失不大于预设的第一分类损失阈值;
所述第一分类损失确定操作包括:
根据所述第一分类结果,以及所述源域数据的标签,计算第一分类损失;
将所述第一分类损失与预设的第一分类损失阈值进行比对;
如果所述第一分类损失大于预设的第一分类损失阈值,则调整所述神经网络的参数、所述共有特征捕捉层的参数、以及所述第一分类器的参数。
3.根据权利要求1所述的方法,其特征在于,采用如下方法根据所述第二分类结果,分别对所述神经网络、所述第二分类器进行本轮训练:
执行以下第二分类损失确定操作,直至第二分类损失不大于预设的第二分类损失阈值;
所述第二分类损失确定操作包括:
根据所述第二分类结果,以及所述源域数据的标签,计算第二分类损失;
将所述第二分类损失与预设的第二分类损失阈值进行比对;
如果所述第二分类损失大于预设的第二分类损失阈值,则调整所述神经网络的参数、所述差异特征捕捉层的参数、以及所述第二分类器的参数。
4.根据权利要求1所述的方法,其特征在于,采用如下方法根据所述第三分类结果,分别对所述神经网络、所述第三分类器进行本轮训练:
执行以下第三分类损失确定操作,直至第三分类损失不大于预设的第三分类损失阈值;
所述第三分类损失确定操作包括:
根据所述第三分类结果,以及所述源域数据的标签,计算第三分类损失;
将所述第三分类损失与预设的第三分类损失阈值进行比对;
如果所述第三分类损失大于预设的第三分类损失阈值,则调整所述神经网络的参数、所述融合特征捕捉层的参数、以及所述第三分类器的参数。
5.根据权利要求1-4任一项所述的方法,其特征在于,该方法还包括:将捕捉的目标域数据的目标域共有特征向量输入所述第一分类器,得到第四分类结果;
将捕捉的目标域数据的目标域差异特征向量输入所述第二分类器,得到第五分类结果;
对所述源域数据和所述目标域数据进行特征融合,获取目标域数据的目标域融合特征向量,并将所述目标域融合特征向量输入所述第三分类器,得到第六分类结果;
在所述第四分类结果、所述第五分类结果以及所述第六分类结果不一致时,调整所述神经网络、所述第一分类器、所述第二分类器以及所述第三分类器的参数。
6.根据权利要求1所述的方法,其特征在于,该方法还包括:
将通过所述伪标签生成模型确定出伪标签的第一目标数据确定为源数据,将对应的伪标签确定为源数据的标签;以及
将通过所述伪标签生成模型未确定出伪标签的第二目标数据确定为目标数据;
将确定的源数据及对应的标签、确定的目标数据输入所述伪标签生成模型继续对所述伪标签生成模型进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810168230.7A CN108460415B (zh) | 2018-02-28 | 2018-02-28 | 一种语种识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810168230.7A CN108460415B (zh) | 2018-02-28 | 2018-02-28 | 一种语种识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108460415A CN108460415A (zh) | 2018-08-28 |
CN108460415B true CN108460415B (zh) | 2021-06-15 |
Family
ID=63217603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810168230.7A Active CN108460415B (zh) | 2018-02-28 | 2018-02-28 | 一种语种识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108460415B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033089B (zh) * | 2018-09-06 | 2021-01-26 | 北京京东尚科信息技术有限公司 | 情感分析方法和装置 |
CN109447149B (zh) | 2018-10-25 | 2021-11-02 | 腾讯医疗健康(深圳)有限公司 | 一种检测模型的训练方法、装置及终端设备 |
CN109523526B (zh) | 2018-11-08 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 组织结节检测及其模型训练方法、装置、设备和系统 |
CN111860823B (zh) * | 2019-04-30 | 2024-06-11 | 北京市商汤科技开发有限公司 | 神经网络训练、图像处理方法及装置、设备及存储介质 |
US20200394458A1 (en) * | 2019-06-17 | 2020-12-17 | Nvidia Corporation | Weakly-supervised object detection using one or more neural networks |
CN110704619B (zh) * | 2019-09-24 | 2022-06-10 | 支付宝(杭州)信息技术有限公司 | 文本分类方法、装置及电子设备 |
CN111191004B (zh) * | 2019-12-27 | 2023-09-22 | 咪咕文化科技有限公司 | 文本标签提取方法、装置及计算机可读存储介质 |
CN111291823B (zh) * | 2020-02-24 | 2023-08-18 | 腾讯科技(深圳)有限公司 | 分类模型的融合方法、装置、电子设备及存储介质 |
CN112633385A (zh) * | 2020-12-25 | 2021-04-09 | 华为技术有限公司 | 一种模型训练的方法、数据生成的方法以及装置 |
CN113030197B (zh) * | 2021-03-26 | 2022-11-04 | 哈尔滨工业大学 | 一种气体传感器漂移补偿方法 |
CN113158051B (zh) * | 2021-04-23 | 2022-11-18 | 山东大学 | 一种基于信息传播和多层上下文信息建模的标签排序方法 |
CN113378895B (zh) * | 2021-05-24 | 2024-03-01 | 成都欧珀通信科技有限公司 | 一种分类模型生成方法、装置、存储介质及电子设备 |
CN113762466B (zh) * | 2021-08-02 | 2023-06-20 | 国网河南省电力公司信息通信公司 | 电力物联网流量分类方法及装置 |
CN113947807B (zh) * | 2021-12-21 | 2022-03-22 | 北京至真互联网技术有限公司 | 一种基于无监督的眼底影像异常识别方法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101794396A (zh) * | 2010-03-25 | 2010-08-04 | 西安电子科技大学 | 基于迁移网络学习的遥感图像目标识别系统及方法 |
JP2013229656A (ja) * | 2012-04-24 | 2013-11-07 | Nippon Telegr & Teleph Corp <Ntt> | メール処理方法及びシステム |
CN104318214A (zh) * | 2014-10-27 | 2015-01-28 | 中国科学院自动化研究所 | 一种基于结构化词典域转移的交叉视角人脸识别方法 |
US9122664B2 (en) * | 2007-10-29 | 2015-09-01 | International Business Machines Corporation | Method for automatically creating transforms |
EP2993618A1 (en) * | 2014-09-04 | 2016-03-09 | Xerox Corporation | Domain adaptation for image classification with class priors |
CN105469109A (zh) * | 2015-11-19 | 2016-04-06 | 中国地质大学(武汉) | 一种用于遥感图像分类的基于类心对齐的迁移学习方法 |
CN105894074A (zh) * | 2016-04-15 | 2016-08-24 | 大连声鹭科技有限公司 | 一种防伪条形码标签、防伪条形码标签信息采集器、采集方法及防伪验证系统 |
CN106157375A (zh) * | 2016-07-06 | 2016-11-23 | 南京大学 | 一种三维模型部件类别自动标注方法 |
CN106469560A (zh) * | 2016-07-27 | 2017-03-01 | 江苏大学 | 一种基于无监督域适应的语音情感识别方法 |
CN106599922A (zh) * | 2016-12-16 | 2017-04-26 | 中国科学院计算技术研究所 | 用于大规模数据标定的迁移学习方法及系统 |
CN106980876A (zh) * | 2017-03-13 | 2017-07-25 | 南京邮电大学 | 一种基于鉴别性样本属性学习的零样本图像识别方法 |
WO2018020277A1 (en) * | 2016-07-28 | 2018-02-01 | Google Llc | Domain separation neural networks |
CN107704926A (zh) * | 2017-11-23 | 2018-02-16 | 清华大学 | 一种大数据跨领域分析的深度迁移学习方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8069182B2 (en) * | 2006-04-24 | 2011-11-29 | Working Research, Inc. | Relevancy-based domain classification |
US20170220951A1 (en) * | 2016-02-02 | 2017-08-03 | Xerox Corporation | Adapting multiple source classifiers in a target domain |
-
2018
- 2018-02-28 CN CN201810168230.7A patent/CN108460415B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9122664B2 (en) * | 2007-10-29 | 2015-09-01 | International Business Machines Corporation | Method for automatically creating transforms |
CN101794396A (zh) * | 2010-03-25 | 2010-08-04 | 西安电子科技大学 | 基于迁移网络学习的遥感图像目标识别系统及方法 |
JP2013229656A (ja) * | 2012-04-24 | 2013-11-07 | Nippon Telegr & Teleph Corp <Ntt> | メール処理方法及びシステム |
EP2993618A1 (en) * | 2014-09-04 | 2016-03-09 | Xerox Corporation | Domain adaptation for image classification with class priors |
CN104318214A (zh) * | 2014-10-27 | 2015-01-28 | 中国科学院自动化研究所 | 一种基于结构化词典域转移的交叉视角人脸识别方法 |
CN105469109A (zh) * | 2015-11-19 | 2016-04-06 | 中国地质大学(武汉) | 一种用于遥感图像分类的基于类心对齐的迁移学习方法 |
CN105894074A (zh) * | 2016-04-15 | 2016-08-24 | 大连声鹭科技有限公司 | 一种防伪条形码标签、防伪条形码标签信息采集器、采集方法及防伪验证系统 |
CN106157375A (zh) * | 2016-07-06 | 2016-11-23 | 南京大学 | 一种三维模型部件类别自动标注方法 |
CN106469560A (zh) * | 2016-07-27 | 2017-03-01 | 江苏大学 | 一种基于无监督域适应的语音情感识别方法 |
WO2018020277A1 (en) * | 2016-07-28 | 2018-02-01 | Google Llc | Domain separation neural networks |
CN106599922A (zh) * | 2016-12-16 | 2017-04-26 | 中国科学院计算技术研究所 | 用于大规模数据标定的迁移学习方法及系统 |
CN106980876A (zh) * | 2017-03-13 | 2017-07-25 | 南京邮电大学 | 一种基于鉴别性样本属性学习的零样本图像识别方法 |
CN107704926A (zh) * | 2017-11-23 | 2018-02-16 | 清华大学 | 一种大数据跨领域分析的深度迁移学习方法 |
Non-Patent Citations (2)
Title |
---|
A Novel Model of Selecting High Quality Pseudo-Relevance Feedback Documents using Classification Approach for Query Expansion;Aditi Sharan等;《2015 IEEE Workshop on Computational Intelligence》;20151231;第1-5页 * |
基于集成半监督学习的标签噪声研究;金龙;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20131215(第S2期);第I140-91页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108460415A (zh) | 2018-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108460415B (zh) | 一种语种识别方法 | |
CN108304876B (zh) | 分类模型训练方法、装置及分类方法及装置 | |
CN112990432B (zh) | 目标识别模型训练方法、装置及电子设备 | |
Piao et al. | Depth-induced multi-scale recurrent attention network for saliency detection | |
US10169683B2 (en) | Method and device for classifying an object of an image and corresponding computer program product and computer-readable medium | |
CN113688889A (zh) | 异常检测方法、装置、电子设备及计算机可读存储介质 | |
CN111401928B (zh) | 基于图数据确定文本的语义相似度的方法及装置 | |
CN112464809A (zh) | 一种人脸关键点检测方法、装置、电子设备及存储介质 | |
CN110414541B (zh) | 用于识别物体的方法、设备和计算机可读存储介质 | |
CN110096617B (zh) | 视频分类方法、装置、电子设备及计算机可读存储介质 | |
Wang et al. | Rethinking the learning paradigm for dynamic facial expression recognition | |
KR102103511B1 (ko) | 코드 생성 장치 및 방법 | |
CN113870254B (zh) | 目标对象的检测方法、装置、电子设备及存储介质 | |
CN114241505A (zh) | 化学结构图像的提取方法、装置、存储介质及电子设备 | |
KR20220094967A (ko) | 우울증 진단을 위한 인공지능 연합학습 방법 및 시스템 | |
US11423262B2 (en) | Automatically filtering out objects based on user preferences | |
CN117409419A (zh) | 图像检测方法、设备及存储介质 | |
CN111753684B (zh) | 一种利用目标姿势进行生成的行人重识别方法 | |
CN110879832A (zh) | 目标文本检测方法、模型训练方法、装置及设备 | |
CN114139641B (zh) | 基于局部结构传递的多模态表征学习方法和系统 | |
CN113033525B (zh) | 图像识别网络的训练方法、电子设备及存储介质 | |
CN115311550A (zh) | 遥感影像语义变化检测方法、装置、电子设备及存储介质 | |
Huang et al. | Deep Multimodal Fusion Autoencoder for Saliency Prediction of RGB‐D Images | |
CN115705758A (zh) | 活体识别方法、装置、电子设备和存储介质 | |
CN112733959A (zh) | 肺部影像分类方法、分类网络确定方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 101-8, 1st floor, building 31, area 1, 188 South Fourth Ring Road West, Fengtai District, Beijing Applicant after: Guoxin Youyi Data Co., Ltd Address before: 100070, No. 188, building 31, headquarters square, South Fourth Ring Road West, Fengtai District, Beijing Applicant before: SIC YOUE DATA Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |