CN114494709A - 特征提取模型的生成方法、图像特征提取方法和装置 - Google Patents
特征提取模型的生成方法、图像特征提取方法和装置 Download PDFInfo
- Publication number
- CN114494709A CN114494709A CN202210096198.2A CN202210096198A CN114494709A CN 114494709 A CN114494709 A CN 114494709A CN 202210096198 A CN202210096198 A CN 202210096198A CN 114494709 A CN114494709 A CN 114494709A
- Authority
- CN
- China
- Prior art keywords
- image
- sample
- level
- feature extraction
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Abstract
本公开涉及一种特征提取模型的生成方法、图像特征提取方法和装置,所述方法包括:获取多个候选图像;基于特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树,其中,所述聚类树中包含多个层级下的聚类;基于所述多个候选图像和所述聚类树,生成目标样本对,其中,所述目标样本对包括图像样本对和特征样本对,所述图像样本对为基于两个不同的候选图像形成的,所述特征样本对为基于所述候选图像的特征和所述聚类的聚类中心的特征形成的;基于所述目标样本对,对特征提取模型进行训练。由此可以在基于对比学习进行分类时,学习到不同粒度下的局部语义,提高该特征提取模型的准确性和稳定性。
Description
技术领域
本公开涉及图像处理领域,具体地,涉及一种特征提取模型的生成方法、图像特征提取方法和装置。
背景技术
自然图像数据集中存在层级语义结构,以动物图像分类为例,例如拉布拉多犬、贵宾犬对应的图像可以归类为“犬”的类别,而“犬”、“猫”、“猴子”等类别可以进一步归类为“哺乳动物”的类别。
然而,相关技术中,基于对比学习的自监督学习无法对上述层级语义结构进行建模,从而在基于对比学习进行分类时,仅能够同一粒度的不同的样本图像学习局部语义,使得不同图像的特征在特征空间互相远离,对存在不同差异的每一样本图像的处理是相同的,难以适用于上述存在更高等级的场景。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种特征提取模型的生成方法,所述方法包括:
获取多个候选图像;
基于特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树,其中,所述聚类树中包含多个层级下的聚类;
基于所述多个候选图像和所述聚类树,生成目标样本对,其中,所述目标样本对包括图像样本对和特征样本对,所述图像样本对为基于两个不同的候选图像形成的,所述特征样本对为基于所述候选图像的特征和所述聚类的聚类中心的特征形成的;
基于所述目标样本对,对特征提取模型进行训练。
第二方面,本公开提供一种图像特征提取方法,所述方法包括:
接收待处理图像;
将所述待处理图像输入特征提取模型,获得所述特征提取模型输出的特征图像,其中,所述特征提取模型为基于第一方面所述的特征提取模型的生成方法生成的。
第三方面,本公开提供一种特征提取模型的生成装置,所述装置包括:
获取模块,用于获取多个候选图像;
确定模块,用于基于特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树,其中,所述聚类树中包含多个层级下的聚类;
生成模块,用于基于所述多个候选图像和所述聚类树,生成目标样本对,其中,所述目标样本对包括图像样本对和特征样本对,所述图像样本对为基于两个不同的候选图像形成的,所述特征样本对为基于所述候选图像的特征和所述聚类的聚类中心的特征形成的;
训练模块,用于基于所述目标样本对,对特征提取模型进行训练。
第四方面,提供一种图像特征提取装置,所述装置包括:
接收模块,用于接收待处理图像;
提取模块,用于将所述待处理图像输入特征提取模型,获得所述特征提取模型输出的特征图像,其中,所述特征提取模型为基于第一方面所述的特征提取模型的生成方法生成的。
第五方面,提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现第一方面所述方法的步骤。
第六方面,提供一种电子设备,包括:
存储装置,其上存储有至少一个计算机程序;
至少一个处理装置,用于执行所述存储装置中的所述至少一个计算机程序,以实现第一方面所述方法的步骤。
通过上述技术方案,在基于候选图像生成特征提取模型时,并非直接基于候选图像进行样本对的确定,而是基于当前的特征提取模型和候选图像生成包含多个层级的聚类树,从而可以对候选图像的层级语义进行表征,可以在基于对比学习进行分类时,学习到不同粒度下的局部语义,提高该特征提取模型的准确性,为后续进行图像分类、图像识别等提供准确的数据支持。并且,在本公开的方案中,在生成样本对时,可以基于聚类树和候选图像进行确定,获得的样本对中可以包含图像样本对和特征样本对,从而可以进一步提高对特征提取模型进行生成所用样本对的准确性、全面性和多样性,在一定程度上提高特征提取模型的训练数据的准确性和有效性,从而提高特征提取模型的训练效率和稳定性,扩展特征提取模型的应用范围。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:
图1是根据本公开的一种实施方式提供的特征提取模型的生成方法的流程图;
图2是根据本公开的一种实施方式提供的聚类树的示意图;
图3是根据本公开的一种实施方式提供的特征提取模型的生成装置的框图;
图4示出了适于用来实现本公开实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1所示,为根据本公开的一种实施方式提供的特征提取模型的生成方法的流程图,所述方法可以包括:
在步骤11中,获取多个候选图像。其中,该候选图像可以是用于对特征提取模型训练的数据集中的全部图像。
在步骤12中,基于特征提取模型和多个候选图像,确定多个候选图像对应的聚类树,其中,所述聚类树中包含多个层级下的聚类。
在该步骤中,可以通过对候选图像进行层级聚类,从而可以在不同的粒度下对候选图像的特征进行聚类,以便于对候选图像进行不同分类层级的划分。
示例地,所述基于特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树的示例性实现方式可以包括:
基于所述特征提取模型对所述多个候选图像进行特征提取,获得每一所述候选图像对应的样本特征。示例地,可以各个候选图像输入当前的特征提取模型,从而可以通过该特征提取模型输出每一候选图像对应的样本特征。
基于每一目标特征进行聚类,生成多个聚类和每一聚类的聚类中心,所述目标特征初始为所述样本特征。
作为示例,可以基于自下而上的聚类方式进行聚类。如该目标特征初始为各个候选图像对应的样本特征,从而可以基于样本特征之间的距离进行聚类,该距离的计算可以使用曼哈顿距离、欧几里得或者皮尔逊相似度进行计算,本公开对此不作限定。由此,可以基于该候选图像对应的样本特征进行聚类,获得S个聚类中心,S用于表示基于样本特征进行聚类所得的聚类簇的数量。为便于说明,该层可以记为S层。
之后,将每一所述聚类的聚类中心作为新的目标特征,进行层级聚类直至获得的聚类树的层级达到预设层级。
相应地,可以基于该S个聚类中心继续进行聚类,获得M个新的聚类中心,M小于S。为便于描述,包含M个新的聚类中心的层级可以记为M层。此时形成的聚类树的深度为2,即最底层包含S个聚类中心,上一层级包含M个聚类中心。若预设层级为3,此时可以基于M个聚类中心再次进行聚类,获得L个更高层级的聚类中心,L小于M。此时聚类树的层级达到预设层级,结束聚类获得聚类完成的聚类树。为便于描述,包含该L个更高层级的聚类中心的层级可以记为L层,如图2所示。
由上述可知,可以通过用于训练的多张候选图像的特征进行聚类,以获得包含多个层级的聚类树,则可以基于该聚类树对候选图像的层级语义进行表征,便于提高该候选图像的特征的全面性和准确性。
在步骤13中,基于多个候选图像和聚类树,生成目标样本对,其中,目标样本对包括图像样本对和特征样本对,所述图像样本对为基于两个不同的候选图像形成的,所述特征样本对为基于所述候选图像的特征和所述聚类的聚类中心的特征形成的。
其中,对比学习的学习过程中无需用户进行标注,而是基于样本图像构建样本对,从而基于各个样本对进行学习。在该实施例中,在基于候选图像进行样本对的确定时,一方面,可以基于候选图像本身进行样本对的构建,另一方面,如上文所述,聚类树中包含多个层级下的聚类,每一层级下的聚类中心可以该对层级的分类特征进行表征,则可以进一步地基于候选图像的特征和聚类的聚类中心的特征确定样本对,提高样本对的准确性和多样性。
在步骤14中,基于目标样本对,对特征提取模型进行训练。
示例地,可以基于目标样本对基于本领域常用的对比学习的学习方式进行训练,获得训练完成的特征提取模型。
由此,通过上述技术方案,在基于候选图像生成特征提取模型时,并非直接基于候选图像进行样本对的确定,而是基于当前的特征提取模型和候选图像生成包含多个层级的聚类树,从而可以对候选图像的层级语义进行表征,可以在基于对比学习进行分类时,学习到不同粒度下的局部语义,提高该特征提取模型的准确性,为后续进行图像分类、图像识别等提供准确的数据支持。并且,在本公开的方案中,在生成样本对时,可以基于聚类树和候选图像进行确定,获得的样本对中可以包含图像样本对和特征样本对,从而可以进一步提高生成特征提取模型所用样本对的准确性、全面性和多样性,在一定程度上提高特征提取模型的训练数据的准确性和有效性,从而提高生成的特征提取模型的训练效率和稳定性,扩展特征提取模型的应用范围。
在一种可能的实施例中,步骤13中基于多个候选图像和聚类树,生成目标样本对的示例性实现方式如下,该步骤可以包括:
基于所述候选图像生成样本图像集和候选对比图像集,其中,所述候选对比图像集中的图像和所述样本图像集中的图像不同,所述候选对比图像集对应的图像数量大于所述样本图像集对应的图像数量。
其中,可以从候选图像中随机选择W张图像作为样本图像添加至样本图像集X,从候选图像中除该W张图像之外的图像中选择Q张图像作为候选对比图像添加至候选对比图像集H,其中W和Q为正整数,W小于Q。
针对所述样本图像集中的每一样本图像,基于所述候选对比图像集中的候选对比图像和所述聚类树中每一层级下的聚类的聚类中心,确定所述样本图像在每一层级下的对比样本集,所述对比样本集中的对比样本包含目标对比图像和目标对比聚类中心的特征。
其中,如上文所述,在生成特征提取模型时需要构建样本对,每一样本对中可以包含两张图像,或者两个特征向量。其中,样本图像集中的每一样本图像用于生成目标样本对。而在聚类树的每一层级下的特征语义的粒度不同,则在实施例中,在基于样本图像生成目标样本对时,可以针对聚类树中的每一层级,确定该样本图像在该层级下对应的对比图像和对比聚类中心,从而可以针对每一层级进行单独分析和确定,提高样本图像对应的对比样本集的准确性。
之后,针对所述样本图像集中的每一样本图像,根据所述样本图像和所述样本图像在每一层级下的对比样本集,生成每一层级下所述样本图像对应的负样本对,并将所述负样本对确定为所述目标样本对。
示例地,针对样本图像集中的每一样本图像,根据所述样本图像和所述样本图像在每一层级下的对比样本集,可以将该样本图像和该层级下的对比样本集中的多个对比样本分别形成负样本对,该多个对比样本可以为对比样本集中的部分或全部样本。示例地,针对样本图像X1,其在S层下的对比样本集DS中包含对比样本K个,则可以从K个对比样本中选择部分或全部,与该样本图像X1形成负样本对,示例地,(X1,DS1),(X1,DS2),……,(X1,DSK)等K对负样本对。针对样本图像X1,其在M层下的对比样本集DM中包含对比样本J个,则可以从J个对比样本中选择部分或全部,与该样本图像X1形成负样本对,示例地,(X1,DM1),(X1,DM2),……,(X1,DMJ)等J对负样本对。针对其他层级和其他样本图像生成目标样本对的方式与上文所述类似,在此不再赘述。
由此,通过上述技术方案,在确定出样本图像集和候选对比图像集后,可以基于聚类树在每一层级下从该候选对比图像集中选择与样本图像集对应的对比样本,基于聚类树在每一层级下确定与样本图像对应的对比聚类中心,从而可以在对样本图像的对比样本进行准确筛选的同时,可以针对每一层级进行对比样本的确定,从而可以使得基于目标样本对对特征提取模型进行训练时,能够学习不同层级下的语义特征,使得基于特征提取模型进行特征提取时不同图像的特征可以在不同的层级的特征空间分布不同,提高特征提取模型的准确性。
在一种可能的实施例中,所述基于所述候选对比图像集中的候选对比图像和所述聚类树中每一层级下的聚类的聚类中心,确定所述样本图像在每一层级下的对比样本集的示例性实现方式如下,该步骤包括:
确定所述样本图像在所述聚类树中每一层级下所属的层级聚类中心。
作为示例,可以基于特征提取模型对该样本图像进行特征提取,从而可以针对聚类树中的每一层级,将该样本图像的特征与该层级下的各个聚类中心进行距离计算,并将对应距离最小的聚类中心确定为该样本图像在该层级下所属的层级聚类中心。
针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述候选对比图像集中的候选对比图像,确定所述样本图像在所述层级下对应的所述目标对比图像。
作为示例,该步骤可以通过如下方式实现:
针对所述聚类树中的每一层级,确定所述样本图像在所述层级下的层级聚类中心与所述候选对比图像集中的每一候选对比图像之间的图像相似度。其中,可以将每一候选对比图像输入特征提取模型,获得候选对比图像的特征。之后基于该候选对比图像的特征和该层级聚类中心计算图像相似度,其中可以基于余弦相似度进行计算。其中,该图像相似度可以表征该候选对比图像与该样本图像在该层级下属于同一聚类的概率。
之后,若图像相似度大于第一阈值,则表示该样本图像和该候选对比图像之间的相似度较高,该样本图像和该候选对比图像在该层级下属于同一聚类的概率比较高,此时将该候选对比图像作为该样本图像的对比样本是不合适的。因此,在该实施例中,可以忽略该图像相似度大于第一阈值的候选对比图像,将图像相似度小于或等于第一阈值的候选对比图像作为目标对比图像。
作为另一示例,针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述候选对比图像集中的候选对比图像,确定所述样本图像在所述层级下对应的所述目标对比图像的步骤的实现方式如下,可以包括:
针对所述聚类树中的每一层级,确定所述样本图像在所述层级下的层级聚类中心与所述候选对比图像集中的每一候选对比图像之间的图像相似度。其中,计算图像相似度的方式已在上文进行描述,在此不再赘述。
在确定出图像相似度后,可以基于所述图像相似度进行随机采样,在所述随机采样的结果为拒绝时,将所述候选对比图像确定为所述样本图像在所述层级下的目标对比图像。
示例地,该图像相似度为p,随机采样可以是以p作为输入,从而以p的概率输出1,以1-p的概率输出0,确定输出为1时表示接受,输出为0时表示拒绝。其中,在随机采样结果为接受时,则表示该样本图像与候选对比图像在该层级下属于同一聚类,在随机采样结果为拒绝时,则表示该样本图像与候选对比图像在该层级下不属于同一聚类。在该实施例中,确定与样本图像对应的对比样本,即确定与该样本图像不同的样本,即可以将随机采样的结果为拒绝的候选对比图像确定为目标对比图像。示例地,基于图像相似度p进行随机采样,若采样结果为0,则将所述候选对比图像确定为所述样本图像在所述层级下的目标对比图像。
由此,通过上述技术方案,可以针对聚类树中的每一层级,通过确定候选对比图像与样本图像在该层级下所属的层级聚类中心的相似度,以确定样本图像在该层级下对应的目标对比图像,从而可以避免将与样本图像属于同一聚类的候选对比图像作为其对比样本,保证确定出的对比样本的准确性,从而提高特征提取模型的准确性。并且,以图像相似度作为概率进行一次随机采样,以根据采样结果确定对比样本,也可以通过引入随机采样以增加对比样本选择的灵活性。
针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述聚类树中的各个聚类中心,确定与所述样本图像在所述层级下对应的所述目标对比聚类中心。
作为示例,该步骤可以通过如下方式实现:
示例地,针对聚类树中的每一层级,除该样本图像在所述层级下所属的所述层级聚类中心之外的其他聚类中心与该层级聚类中心均不同,则可以直接将该层级下除该层级聚类中心之外的其他聚类中心均确定为该层级下对应的目标聚类中心。
示例地,如图2所示聚类树,样本图像X1在S层所属的层级聚类中心为S1,样本图像X1在M层所属的层级聚类中心为M1,样本图像X1在L层所属的层级聚类中心为L1,则针对S层,可以将S层中除S1之外的其他聚类中心(即S2-S17)作为该S层对应的目标对比聚类中心;针对M层,可以将M层中除M1之外的其他聚类中心(即M2-M7)作为该M层对应的目标对比聚类中心;针对L层,可以将L层中除L1之外的其他聚类中心(即L2和L3)作为该L层对应的目标对比聚类中心。
作为另一示例,所述针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述聚类树中的各个聚类中心,确定与所述样本图像在所述层级下对应的所述目标对比聚类中心的示例性实现方式如下,该步骤可以包括:
针对所述聚类树中除最高层级之外的每一层级,确定所述样本图像在所述层级下的层级聚类中心对应的父聚类中心、和所述层级下除所述层级聚类中心之外的候选聚类中心之间的特征相似度。
如图2所示的聚类树,最高层级为L层,则以S层为例,样本图像X1在S层所属的层级聚类中心为S1,该层级聚类中心S1对应的父聚类中心为M1,该S层的候选聚类中心为S2-S17,则可以基于S2-S17中的每一个中心的特征与M1进行相似度计算,其中相似度可以为余弦相似度,对此不做限定。其中确定出的特征相似度越高,则表示该样本图像所属的层级聚类中心和该候选聚类中心之间同属于一个父聚类的概率越大。
基于所述特征相似度进行随机采样,在所述随机采样的结果为拒绝时,将所述候选聚类中心确定为与所述样本图像所述层级下对应的目标对比聚类中心。
其中,随机采样的方式与上文所述类似,在此不再赘述。在随机采样结果为接受时,则表示该样本图像所属的层级聚类中心与候选聚类中心属于同一个父聚类,在随机采样结果为拒绝时,则表示该样本图像所属的层级聚类中心与候选聚类中心不属于同一个父聚类。在该实施例中,确定与样本图像对应的对比样本,即确定与该样本图像不同的样本,即可以将随机采样的结果为拒绝的候选聚类中心为目标对比聚类中心。示例地,基于特征相似度p’进行随机采样,若采样结果为0,则将所述候选对比聚类中心确定为所述样本图像在所述层级下的目标对比聚类中心。
由此,通过上述技术方案,可以通过对各个层级下除样本图像所属的层级聚类中心之外的候选对比聚类中心进行进一步地分析,以从该候选对比聚类中心中确定出目标对比聚类中心,从而有效增加样本图像对应的对比样本的准确度和数量,提高对比学习过程中负样本对的准确性。另外,以特征相似度作为概率进行一次随机采样,以根据采样结果确定对比样本,能够通过引入随机采样以增加对比样本选择的灵活性,进一步提高对比样本的全面性。
针对所述聚类树中的最高层级,对所述最高层级下除所述样本图像对应的层级聚类中心之外的候选聚类中心进行采样,在所述采样的结果为拒绝时,将所述候选聚类中心确定为所述样本图像在所述层级下对应的目标对比聚类中心。
接上述示例,如图2所示,针对最高层级L层,可以将该对所述最高层级下除所述样本图像X1对应的层级聚类中心L1之外的候选聚类中心进行均匀采样,在所述采样的结果为拒绝时,将所述候选聚类中心确定为所述样本图像在所述层级下对应的目标对比聚类中心。示例地,可以以概率0.5进行均匀采样,从而从候选聚类中心选择出相应的目标对比聚类中心,从而保证目标对比聚类中心确定灵活性的同时,保证目标聚类中心的准确性,以提高确定出的负样本对的可靠性和有效性。
可选地,所述基于所述多个候选图像和所述聚类树,生成目标样本对的示例性实现方式还可以包括:
针对所述样本图像集中的每一样本图像,基于所述样本图像对应的变换图像以及所述样本图像在所述聚类树每一层级下所属的层级聚类中心,生成所述样本图像对应的正样本对。
作为示例,可以针对每一样本图像,通过不同的随机变换得出该样本图像的不同视角下的变换图像,从而可以该变换图像和样本图像对应的样本对作为正样本对。
作为另一示例,针对所述样本图像集中的每一样本图像,确定所述样本图像在所述聚类树中每一层级下所属的层级聚类中心。其中,确定各个层级聚类中心的方式已在上文进行详述,在此不再赘述。之后,则可以将样本图像的特征与S1的中心特征作为正样本对,将样本图像的特征与M1的中心特征作为正样本对,将样本图像的特征与L1的中心特征作为正样本对,即确定出该样本图像在各个层级下对应的特征正样本对。
由此,通过上述技术方案,可以快速生成样本图像对应的正样本对,并且在生成正样本对的过程中,也可以基于不同层级下的聚类中心生成不同的样本,对正样本对中的层级语义进行表征和构建,提高对比学习过程中正样本对中的特征准确性,为提高特征提取模型的学习准确度提供数据支持。
在一种可能的实施例中,所述基于所述目标样本对,对特征提取模型进行训练的示例性实现方式如下,该步骤可以包括:
基于所述目标样本对和所述目标样本对的样本标签,确定所述特征提取模型的目标损失。
作为示例,可以基于目标样本对中的正样本对和负样本对,通过本领域中常用的对比学习损失函数,确定出该目标损失。作为另一示例,在确定目标损失时,可以针对每一层级分别进行损失计算,从而确定最终的目标损失,可以通过如下公式确定该目标损失Loss:
其中,n用于表示聚类树中的层级个数;
Ni(q)用于表示样本图像q在第i个层级下的对比样本集;
k用于表示样本图像q对应的对比样本集中的对比样本;
sim()用于表示相似度计算;exp()用于表示指数计算;
k+用于表示样本图像q对应的正样本对中的变换图像;
ki +用于表示样本图像q在第i个层级下的正样本对中的层级聚类中心。
若未满足迭代结束条件,则基于所述目标损失对所述特征提取模型的参数进行更新,获得更新后的特征提取模型。
所述迭代结束条件为所述目标损失小于或等于损失阈值,或者所述特征提取模型的迭代次数大于次数阈值。损失阈值和次数阈值可以基于实际应用场景进行设置,本公开对此不进行限定。其中,可以基于目标损失以梯度下降法对特征提取模型的参数进行更新,在此不再赘述。
基于更新后的特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树;
基于所述多个候选图像和新确定出的聚类树,生成新的目标样本对,以基于新的目标样本对,对特征提取模型进行训练,直至满足所述迭代结束条件,获得训练完成的特征提取模型。
其中,确定上述步骤的具体实现方式均已在上文进行描述,在此不再赘述。在该实施例中,在对特征提取模型更新后,可以基于该更新后的特征提取模型对多个候选图像进行特征提取,以确定新的聚类树,从而确定下一轮次下的训练样本。由此,可以在特征提取模型的训练过程中,通过不断更新特征提取模型,并基于更新后的特征提取模型重新生成聚类树,并确定新的训练样本,从而可以提高聚类树和训练样本的准确性,并且可以有效提高特征提取模型的训练效率。
本公开还提供一种图像特征提取方法,所述方法可以包括:
接收待处理图像;
将所述待处理图像输入特征提取模型,获得所述特征提取模型输出的特征图像,其中,所述特征提取模型为基于上文任一所述的特征提取模型的生成方法生成的。所述特征图像可以用于对待处理图像进行图像识别、图像分类等。由此,通过上述技术方案,在该特征提取模型的生成过程中,可以学习到不同粒度下的局部语义,保证该特征提取模型的准确性,从而提高该特征图像中特征的准确性和全面性,为后续进行图像分类、图像识别等提供准确的数据支持。
本公开还提供一种特征提取模型的生成装置,如图3所示,所述装置包括:
获取模块100,用于获取多个候选图像;
确定模块200,用于基于特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树,其中,所述聚类树中包含多个层级下的聚类;
生成模块300,用于基于所述多个候选图像和所述聚类树,生成目标样本对,其中,所述目标样本对包括图像样本对和特征样本对,所述图像样本对为基于两个不同的候选图像形成的,所述特征样本对为基于所述候选图像的特征和所述聚类的聚类中心的特征形成的;
训练模块400,用于基于所述目标样本对,对特征提取模型进行训练。
可选地,所述生成模块包括:
第一生成子模块,用于基于所述候选图像生成样本图像集和候选对比图像集,其中,所述候选对比图像集中的图像和所述样本图像集中的图像不同,所述候选对比图像集对应的图像数量大于所述样本图像集对应的图像数量;
第一确定子模块,用于针对所述样本图像集中的每一样本图像,基于所述候选对比图像集中的候选对比图像和所述聚类树中每一层级下的聚类的聚类中心,确定所述样本图像在每一层级下的对比样本集,所述对比样本集中的对比样本包含目标对比图像和目标对比聚类中心的特征;
第二生成子模块,用于针对所述样本图像集中的每一样本图像,根据所述样本图像和所述样本图像在每一层级下的对比样本集,生成每一层级下所述样本图像对应的负样本对,并将所述负样本对确定为所述目标样本对。
可选地,所述基第一确定子模块包括:
第二确定子模块,用于确定所述样本图像在所述聚类树中每一层级下所属的层级聚类中心;
第三确定子模块,用于针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述候选对比图像集中的候选对比图像,确定所述样本图像在所述层级下对应的所述目标对比图像;
第四确定子模块,用于针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述聚类树中的各个聚类中心,确定与所述样本图像在所述层级下对应的所述目标对比聚类中心。
可选地,所述第三确定子模块包括:
第五确定子模块,用于针对所述聚类树中的每一层级,确定所述样本图像在所述层级下的层级聚类中心与所述候选对比图像集中的每一候选对比图像之间的图像相似度;
第六确定子模块,用于基于所述图像相似度进行随机采样,在所述随机采样的结果为拒绝时,将所述候选对比图像确定为所述样本图像在所述层级下的目标对比图像。
可选地,所述第四确定子模块包括:
第七确定子模块,用于针对所述聚类树中除最高层级之外的每一层级,确定所述样本图像在所述层级下的层级聚类中心对应的父聚类中心、和所述层级下除所述层级聚类中心之外的候选聚类中心之间的特征相似度;
第八确定子模块,用于基于所述特征相似度进行随机采样,在所述随机采样的结果为拒绝时,将所述候选聚类中心确定为与所述样本图像所述层级下对应的目标对比聚类中心。
可选地,所述生成模块还包括:
第三生成子模块,用于针对所述样本图像集中的每一样本图像,基于所述样本图像对应的变换图像以及所述样本图像在所述聚类树每一层级下所属的层级聚类中心,生成所述样本图像对应的正样本对。
可选地,所述训练模块包括:
第九确定子模块,用于基于所述目标样本对和所述目标样本对的样本标签,确定所述特征提取模型的目标损失;
更新子模块,用于若未满足迭代结束条件,则基于所述目标损失对所述特征提取模型的参数进行更新,获得更新后的特征提取模型;
第十确定子模块,用于基于更新后的特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树;
第四生成子模块,用于基于所述多个候选图像和新确定出的聚类树,生成新的目标样本对,以基于新的目标样本对,对特征提取模型进行训练,直至满足所述迭代结束条件,获得训练完成的特征提取模型,所述迭代结束条件为所述目标损失小于或等于损失阈值,或者所述特征提取模型的迭代次数大于次数阈值。
本公开还提供一种图像特征提取装置,所述装置包括:
接收模块,用于接收待处理图像;
提取模块,用于将所述待处理图像输入特征提取模型,获得所述特征提取模型输出的特征图像,其中,所述特征提取模型为基于上文所述的特征提取模型的生成方法生成的。
下面参考图4,其示出了适于用来实现本公开实施例的电子设备600的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取多个候选图像;基于特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树,其中,所述聚类树中包含多个层级下的聚类;基于所述多个候选图像和所述聚类树,生成目标样本对,其中,所述目标样本对包括图像样本对和特征样本对,所述图像样本对为基于两个不同的候选图像形成的,所述特征样本对为基于所述候选图像的特征和所述聚类的聚类中心的特征形成的;基于所述目标样本对,对特征提取模型进行训练。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收待处理图像;将所述待处理图像输入特征提取模型,获得所述特征提取模型输出的特征图像,其中,所述特征提取模型为基于特征提取模型的生成方法生成的。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“获取多个候选图像的模块”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,示例1提供了一种特征提取模型的生成方法,其中,所述方法包括:
获取多个候选图像;
基于特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树,其中,所述聚类树中包含多个层级下的聚类;
基于所述多个候选图像和所述聚类树,生成目标样本对,其中,所述目标样本对包括图像样本对和特征样本对,所述图像样本对为基于两个不同的候选图像形成的,所述特征样本对为基于所述候选图像的特征和所述聚类的聚类中心的特征形成的;
基于所述目标样本对,对特征提取模型进行训练。
根据本公开的一个或多个实施例,示例2提供了示例1的方法,其中,所述基于所述多个候选图像和所述聚类树,生成目标样本对,包括:
基于所述候选图像生成样本图像集和候选对比图像集,其中,所述候选对比图像集中的图像和所述样本图像集中的图像不同,所述候选对比图像集对应的图像数量大于所述样本图像集对应的图像数量;
针对所述样本图像集中的每一样本图像,基于所述候选对比图像集中的候选对比图像和所述聚类树中每一层级下的聚类的聚类中心,确定所述样本图像在每一层级下的对比样本集,所述对比样本集中的对比样本包含目标对比图像和目标对比聚类中心的特征;
针对所述样本图像集中的每一样本图像,根据所述样本图像和所述样本图像在每一层级下的对比样本集,生成每一层级下所述样本图像对应的负样本对,并将所述负样本对确定为所述目标样本对。
根据本公开的一个或多个实施例,示例3提供了示例2的方法,其中,所述基于所述候选对比图像集中的候选对比图像和所述聚类树中每一层级下的聚类的聚类中心,确定所述样本图像在每一层级下的对比样本集,包括:
确定所述样本图像在所述聚类树中每一层级下所属的层级聚类中心;
针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述候选对比图像集中的候选对比图像,确定所述样本图像在所述层级下对应的所述目标对比图像;
针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述聚类树中的各个聚类中心,确定与所述样本图像在所述层级下对应的所述目标对比聚类中心。
根据本公开的一个或多个实施例,示例4提供了示例3的方法,其中,所述针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述候选对比图像集中的候选对比图像,确定所述样本图像在所述层级下对应的所述目标对比图像,包括:
针对所述聚类树中的每一层级,确定所述样本图像在所述层级下的层级聚类中心与所述候选对比图像集中的每一候选对比图像之间的图像相似度;
基于所述图像相似度进行随机采样,在所述随机采样的结果为拒绝时,将所述候选对比图像确定为所述样本图像在所述层级下的目标对比图像。
根据本公开的一个或多个实施例,示例5提供了示例3的方法,其中,所述针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述聚类树中的各个聚类中心,确定与所述样本图像在所述层级下对应的所述目标对比聚类中心,包括:
针对所述聚类树中除最高层级之外的每一层级,确定所述样本图像在所述层级下的层级聚类中心对应的父聚类中心、和所述层级下除所述层级聚类中心之外的候选聚类中心之间的特征相似度;
基于所述特征相似度进行随机采样,在所述随机采样的结果为拒绝时,将所述候选聚类中心确定为与所述样本图像所述层级下对应的目标对比聚类中心。
根据本公开的一个或多个实施例,示例6提供了示例2的方法,其中,所述基于所述多个候选图像和所述聚类树,生成目标样本对,还包括:
针对所述样本图像集中的每一样本图像,基于所述样本图像对应的变换图像以及所述样本图像在所述聚类树每一层级下所属的层级聚类中心,生成所述样本图像对应的正样本对。
根据本公开的一个或多个实施例,示例7提供了示例1的方法,其中,所述基于所述目标样本对,对特征提取模型进行训练,包括:
基于所述目标样本对和所述目标样本对的样本标签,确定所述特征提取模型的目标损失;
若未满足迭代结束条件,则基于所述目标损失对所述特征提取模型的参数进行更新,获得更新后的特征提取模型;
基于更新后的特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树;
基于所述多个候选图像和新确定出的聚类树,生成新的目标样本对,以基于新的目标样本对,对特征提取模型进行训练,直至满足所述迭代结束条件,获得训练完成的特征提取模型,所述迭代结束条件为所述目标损失小于或等于损失阈值,或者所述特征提取模型的迭代次数大于次数阈值。
根据本公开的一个或多个实施例,示例8提供了一种图像特征提取方法,所述方法包括:
接收待处理图像;
将所述待处理图像输入特征提取模型,获得所述特征提取模型输出的特征图像,其中,所述特征提取模型为基于示例1-7中任一示例所述的特征提取模型的生成方法生成的。
根据本公开的一个或多个实施例,示例9提供了一种特征提取模型的生成装置,所述装置包括:
获取模块,用于获取多个候选图像;
确定模块,用于基于特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树,其中,所述聚类树中包含多个层级下的聚类;
生成模块,用于基于所述多个候选图像和所述聚类树,生成目标样本对,其中,所述目标样本对包括图像样本对和特征样本对,所述图像样本对为基于两个不同的候选图像形成的,所述特征样本对为基于所述候选图像的特征和所述聚类的聚类中心的特征形成的;
训练模块,用于基于所述目标样本对,对特征提取模型进行训练。
根据本公开的一个或多个实施例,示例10提供了一种图像特征提取装置,所述装置包括:
接收模块,用于接收待处理图像;
提取模块,用于将所述待处理图像输入特征提取模型,获得所述特征提取模型输出的特征图像,其中,所述特征提取模型为基于示例1-7中任一示例所述的特征提取模型的生成方法生成的。
根据本公开的一个或多个实施例,示例11提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现示例1-8中任一示例所述方法的步骤。
根据本公开的一个或多个实施例,示例12提供了一种电子设备,包括:
存储装置,其上存储有至少一个计算机程序;
至少一个处理装置,用于执行所述存储装置中的所述至少一个计算机程序,以实现示例1-8中任一示例所述方法的步骤。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
Claims (12)
1.一种特征提取模型的生成方法,其特征在于,所述方法包括:
获取多个候选图像;
基于特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树,其中,所述聚类树中包含多个层级下的聚类;
基于所述多个候选图像和所述聚类树,生成目标样本对,其中,所述目标样本对包括图像样本对和特征样本对,所述图像样本对为基于两个不同的候选图像形成的,所述特征样本对为基于所述候选图像的特征和所述聚类的聚类中心的特征形成的;
基于所述目标样本对,对特征提取模型进行训练。
2.根据权利要求1所述的方法,其特征在于,所述基于所述多个候选图像和所述聚类树,生成目标样本对,包括:
基于所述候选图像生成样本图像集和候选对比图像集,其中,所述候选对比图像集中的图像和所述样本图像集中的图像不同,所述候选对比图像集对应的图像数量大于所述样本图像集对应的图像数量;
针对所述样本图像集中的每一样本图像,基于所述候选对比图像集中的候选对比图像和所述聚类树中每一层级下的聚类的聚类中心,确定所述样本图像在每一层级下的对比样本集,所述对比样本集中的对比样本包含目标对比图像和目标对比聚类中心的特征;
针对所述样本图像集中的每一样本图像,根据所述样本图像和所述样本图像在每一层级下的对比样本集,生成每一层级下所述样本图像对应的负样本对,并将所述负样本对确定为所述目标样本对。
3.根据权利要求2所述的方法,其特征在于,所述基于所述候选对比图像集中的候选对比图像和所述聚类树中每一层级下的聚类的聚类中心,确定所述样本图像在每一层级下的对比样本集,包括:
确定所述样本图像在所述聚类树中每一层级下所属的层级聚类中心;
针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述候选对比图像集中的候选对比图像,确定所述样本图像在所述层级下对应的所述目标对比图像;
针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述聚类树中的各个聚类中心,确定与所述样本图像在所述层级下对应的所述目标对比聚类中心。
4.根据权利要求3所述的方法,其特征在于,所述针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述候选对比图像集中的候选对比图像,确定所述样本图像在所述层级下对应的所述目标对比图像,包括:
针对所述聚类树中的每一层级,确定所述样本图像在所述层级下的层级聚类中心与所述候选对比图像集中的每一候选对比图像之间的图像相似度;
基于所述图像相似度进行随机采样,在所述随机采样的结果为拒绝时,将所述候选对比图像确定为所述样本图像在所述层级下的目标对比图像。
5.根据权利要求3所述的方法,其特征在于,所述针对所述聚类树中的每一层级,基于所述样本图像在所述层级下所属的所述层级聚类中心、和所述聚类树中的各个聚类中心,确定与所述样本图像在所述层级下对应的所述目标对比聚类中心,包括:
针对所述聚类树中除最高层级之外的每一层级,确定所述样本图像在所述层级下的层级聚类中心对应的父聚类中心、和所述层级下除所述层级聚类中心之外的候选聚类中心之间的特征相似度;
基于所述特征相似度进行随机采样,在所述随机采样的结果为拒绝时,将所述候选聚类中心确定为与所述样本图像所述层级下对应的目标对比聚类中心。
6.根据权利要求2所述的方法,其特征在于,所述基于所述多个候选图像和所述聚类树,生成目标样本对,还包括:
针对所述样本图像集中的每一样本图像,基于所述样本图像对应的变换图像以及所述样本图像在所述聚类树每一层级下所属的层级聚类中心,生成所述样本图像对应的正样本对。
7.根据权利要求1所述的方法,其特征在于,所述基于所述目标样本对,对特征提取模型进行训练,包括:
基于所述目标样本对和所述目标样本对的样本标签,确定所述特征提取模型的目标损失;
若未满足迭代结束条件,则基于所述目标损失对所述特征提取模型的参数进行更新,获得更新后的特征提取模型;
基于更新后的特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树;
基于所述多个候选图像和新确定出的聚类树,生成新的目标样本对,以基于新的目标样本对,对特征提取模型进行训练,直至满足所述迭代结束条件,获得训练完成的特征提取模型,所述迭代结束条件为所述目标损失小于或等于损失阈值,或者所述特征提取模型的迭代次数大于次数阈值。
8.一种图像特征提取方法,其特征在于,所述方法包括:
接收待处理图像;
将所述待处理图像输入特征提取模型,获得所述特征提取模型输出的特征图像,其中,所述特征提取模型为基于权利要求1-7中任一项所述的特征提取模型的生成方法生成的。
9.一种特征提取模型的生成装置,其特征在于,所述装置包括:
获取模块,用于获取多个候选图像;
确定模块,用于基于特征提取模型和所述多个候选图像,确定所述多个候选图像对应的聚类树,其中,所述聚类树中包含多个层级下的聚类;
生成模块,用于基于所述多个候选图像和所述聚类树,生成目标样本对,其中,所述目标样本对包括图像样本对和特征样本对,所述图像样本对为基于两个不同的候选图像形成的,所述特征样本对为基于所述候选图像的特征和所述聚类的聚类中心的特征形成的;
训练模块,用于基于所述目标样本对,对特征提取模型进行训练。
10.一种图像特征提取装置,其特征在于,所述装置包括:
接收模块,用于接收待处理图像;
提取模块,用于将所述待处理图像输入特征提取模型,获得所述特征提取模型输出的特征图像,其中,所述特征提取模型为基于权利要求1-7中任一项所述的特征提取模型的生成方法生成的。
11.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1-8中任一项所述方法的步骤。
12.一种电子设备,其特征在于,包括:
存储装置,其上存储有至少一个计算机程序;
至少一个处理装置,用于执行所述存储装置中的所述至少一个计算机程序,以实现权利要求1-8中任一项所述方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210096198.2A CN114494709A (zh) | 2022-01-26 | 2022-01-26 | 特征提取模型的生成方法、图像特征提取方法和装置 |
PCT/CN2023/071358 WO2023143016A1 (zh) | 2022-01-26 | 2023-01-09 | 特征提取模型的生成方法、图像特征提取方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210096198.2A CN114494709A (zh) | 2022-01-26 | 2022-01-26 | 特征提取模型的生成方法、图像特征提取方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114494709A true CN114494709A (zh) | 2022-05-13 |
Family
ID=81477089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210096198.2A Pending CN114494709A (zh) | 2022-01-26 | 2022-01-26 | 特征提取模型的生成方法、图像特征提取方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114494709A (zh) |
WO (1) | WO2023143016A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023143016A1 (zh) * | 2022-01-26 | 2023-08-03 | 北京字跳网络技术有限公司 | 特征提取模型的生成方法、图像特征提取方法和装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117577563B (zh) * | 2024-01-16 | 2024-04-12 | 东屹半导体科技(江苏)有限公司 | 一种半导体划片机的优化控制方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5522790B2 (ja) * | 2010-07-16 | 2014-06-18 | 日本放送協会 | テンプレート画像生成装置およびテンプレート画像生成プログラム |
CN111476309B (zh) * | 2020-04-13 | 2023-05-23 | 抖音视界有限公司 | 图像处理方法、模型训练方法、装置、设备及可读介质 |
CN113569895A (zh) * | 2021-02-20 | 2021-10-29 | 腾讯科技(北京)有限公司 | 图像处理模型训练方法、处理方法、装置、设备及介质 |
CN113836338A (zh) * | 2021-07-21 | 2021-12-24 | 北京邮电大学 | 细粒度图像分类方法、装置、存储介质及终端 |
CN114494709A (zh) * | 2022-01-26 | 2022-05-13 | 北京字跳网络技术有限公司 | 特征提取模型的生成方法、图像特征提取方法和装置 |
-
2022
- 2022-01-26 CN CN202210096198.2A patent/CN114494709A/zh active Pending
-
2023
- 2023-01-09 WO PCT/CN2023/071358 patent/WO2023143016A1/zh unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023143016A1 (zh) * | 2022-01-26 | 2023-08-03 | 北京字跳网络技术有限公司 | 特征提取模型的生成方法、图像特征提取方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2023143016A1 (zh) | 2023-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109961032B (zh) | 用于生成分类模型的方法和装置 | |
CN112200173B (zh) | 多网络模型训练方法、图像标注方法和人脸图像识别方法 | |
CN112364829B (zh) | 一种人脸识别方法、装置、设备及存储介质 | |
WO2023143016A1 (zh) | 特征提取模型的生成方法、图像特征提取方法和装置 | |
CN112883968B (zh) | 图像字符识别方法、装置、介质及电子设备 | |
CN112650841A (zh) | 信息处理方法、装置和电子设备 | |
CN113449070A (zh) | 多模态数据检索方法、装置、介质及电子设备 | |
CN113033707B (zh) | 视频分类方法、装置、可读介质及电子设备 | |
CN110674813B (zh) | 汉字识别方法、装置、计算机可读介质及电子设备 | |
CN110097004B (zh) | 面部表情识别方法和装置 | |
CN115359400A (zh) | 视频识别方法、装置、介质及电子设备 | |
CN111460214B (zh) | 分类模型训练方法、音频分类方法、装置、介质及设备 | |
CN114187557A (zh) | 确定关键帧的方法、装置、可读介质及电子设备 | |
CN113191257A (zh) | 笔顺检测方法、装置和电子设备 | |
CN113051400A (zh) | 标注数据确定方法、装置、可读介质及电子设备 | |
CN112669816A (zh) | 模型的训练方法、语音识别方法、装置、介质及设备 | |
CN111797263A (zh) | 图像标签生成方法、装置、设备和计算机可读介质 | |
CN111382365A (zh) | 用于输出信息的方法和装置 | |
CN113033682B (zh) | 视频分类方法、装置、可读介质、电子设备 | |
CN114625876B (zh) | 作者特征模型的生成方法、作者信息处理方法和装置 | |
CN116503849B (zh) | 异常地址识别方法、装置、电子设备与计算机可读介质 | |
CN113033681A (zh) | 视频分类方法、装置、可读介质及电子设备 | |
CN113140012A (zh) | 图像处理方法、装置、介质及电子设备 | |
CN114140613A (zh) | 图像检测方法、装置、电子设备及存储介质 | |
CN115186723A (zh) | 训练数据集构建方法、装置、电子设备及计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |