CN110209851A - 模型训练方法、装置、电子设备及存储介质 - Google Patents

模型训练方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110209851A
CN110209851A CN201910498011.XA CN201910498011A CN110209851A CN 110209851 A CN110209851 A CN 110209851A CN 201910498011 A CN201910498011 A CN 201910498011A CN 110209851 A CN110209851 A CN 110209851A
Authority
CN
China
Prior art keywords
hash codes
picture
probability distribution
training sample
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910498011.XA
Other languages
English (en)
Other versions
CN110209851B (zh
Inventor
何轶
李�根
李磊
周浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Volcano Engine Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201910498011.XA priority Critical patent/CN110209851B/zh
Publication of CN110209851A publication Critical patent/CN110209851A/zh
Application granted granted Critical
Publication of CN110209851B publication Critical patent/CN110209851B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本公开实施例提供了一种模型训练方法、装置、电子设备及存储介质,包括:获取训练样本图片;基于训练样本图片对初始的模型进行训练,直至模型输出的各训练样本图片的哈希码概率分布满足预设条件;其中模型是以图片为输入、以图片的哈希码概率分布为输出的模型,图片的哈希码后验概率分布为图片被哈希到各候选哈希码的概率。在本公开实施例中,对初始的模型进行训练结束的条件为图片的哈希码概率分布满足预设条件,该特征表征了不同图片的哈希码不相同的概率大于预设值,并且由于图片的哈希码是根据图片的哈希码概率分布确定出的,进而可以保证不同的图片对应于不同的哈希码。

Description

模型训练方法、装置、电子设备及存储介质
技术领域
本公开涉及图片处理技术领域,具体而言,本公开涉及一种模型训练方法、装置、电子设备及存储介质。
背景技术
随着数码摄像设备的普及,数码图片数量急速增长,面对海量的图片数据,如何将海量图片数据进行储存以及对其进行快速的计算,是目前图片处理领域需要面临的问题,而基于哈希码技术学习的图片检索算法,将高维的图片数据用低维的“0”和“1”哈希码表示,大降低了海量数据对于存储空间的要求。凭借哈希算法在海量图片检索中表现出的计算高效性和低内存可行性,哈希码技术的应用越来越受大家关注,而好的哈希码的衡量标准除了希望同一图片的变换前后的图片鲁棒外,还希望不同图片所对应的哈希码不同,但是,现有技术中不同的图片还有可能对应于相同的哈希码。
发明内容
本公开的目的旨在至少能解决上述的技术缺陷之一,提升用户的使用体验。本公开采用的技术方案如下:
第一方面,本公开实施例提供了一种模型训练方法,该方法包括:
获取训练样本图片;
基于训练样本图片对初始的模型进行训练,直至模型输出的各训练样本图片的哈希码概率分布满足预设条件;
其中,模型是以图片为输入、以图片的哈希码概率分布为输出的模型,图片的哈希码概率分布为图片被哈希到各候选哈希码的概率。
第一方面可选的实施例中,在一次训练过程中,通过模型得到各训练样本图片的哈希码概率分布之后,还包括:
根据各训练样本图片的哈希码概率分布,得到哈希码先验概率分布,哈希码先验概率分布包括各候选哈希码的先验概率;
确定每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量,并得到差异量总和,差异量总和为每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量的和;
其中,预设条件包括至少两次相邻训练所对应的差异量总和的差值小于预设值。
第一方面可选的实施例中,确定每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量,并得到差异量总和,包括:
计算先验概率分布的第一熵,以及各训练样本图片的哈希码概率分布的第二熵;
根据第一熵和各个第二熵,得到各训练样本图片对应的相对熵;
将各训练样本图片对应的相对熵的相加,得到差异量总和。
第一方面可选的实施例中,确定各候选哈希码的先验概率,包括:
针对一种候选哈希码,基于各训练样本图片的哈希码概率中对应于候选哈希码的概率,以及各训练样本图片在训练样本图片集合中的出现概率,确定候选哈希码对应于各训练样本图片的先验概率;
根据候选哈希码对应于各训练样本图片的先验概率,确定候选哈希码所对应的先验概率。
第二方面,本公开实施例提供了一种图片的哈希码确定方法,该方法包括:
获取待处理图片;
通过模型得到待处理图片的哈希码概率分布,其中,模型是通过第一方面中任一项的方法训练得到的;
基于待处理图片的哈希码概率分布,确定待处理图片中的哈希码。
第三方面,本公开实施例提供了一种模型训练装置,该装置包括:
训练样本图片获取模块,用于获取训练样本图片;
模型训练模块,用于基于训练样本图片对初始的模型进行训练,直至模型输出的各训练样本图片的哈希码概率分布满足预设条件;
其中,模型是以图片为输入、以图片的哈希码概率分布为输出的模型,图片的哈希码概率分布为图片被哈希到各候选哈希码的概率。
第三方面可选的实施例中,模型训练模块还用于:
在一次训练过程中,通过模型得到各训练样本图片的哈希码概率分布之后,根据各训练样本图片的哈希码概率分布,得到哈希码先验概率分布,哈希码先验概率分布包括各候选哈希码的先验概率;以及确定每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量,并得到差异量总和,差异量总和为每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量的和;
其中,预设条件包括至少两次相邻训练所对应的差异量总和的差值小于预设值。
第三方面可选的实施例中,模型训练模块在确定每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量,并得到差异量总和时,具体用于:
计算先验概率分布的第一熵,以及各训练样本图片的哈希码概率分布的第二熵;根据第一熵和各个第二熵,得到各训练样本图片对应的相对熵;将各训练样本图片对应的相对熵的和作为差异量总和。
第三方面可选的实施例中,模型训练模块在确定各候选哈希码的先验概率时,具体用于:
针对一种候选哈希码,基于各训练样本图片的哈希码概率中对应于候选哈希码的概率,以及各训练样本图片在训练样本图片集合中的出现概率,确定候选哈希码对应于各训练样本图片的先验概率;以及根据候选哈希码对应于各训练样本图片的先验概率,确定候选哈希码所对应的先验概率。
第四方面,本公开实施例还提供了一种图片的哈希码确定装置,该装置包括:
待处理图片获取模块,用于获取待处理图片;
图片处理模块,用于通过模型得到待处理图片的哈希码概率分布,其中,该模型是通过第一方面中任一项的方法训练得到的;
哈希码确定模块,用于基于待处理图片的哈希码概率分布,确定待处理图片的哈希码。
第五方面,本公开提供了一种电子设备,该电子设备包括处理器和存储器;
存储器,用于存储计算机操作指令;
处理器,用于通过调用计算机操作指令,执行如本公开实施例的第一方面或第二方面的任一实施例中所示的方法。
第六方面,本公开提供了一种计算机可读存储介质,该计算机可读存储介质存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如本公开实施例的第一方面或第二方面的任一实施例中所示的方法。
本公开实施例提供的技术方案带来的有益效果是:
在本公开实施例中,可以基于训练样本图片对初始的模型进行训练,并且训练结束的条件为模型输出的各训练样本图片的哈希码概率分布满足预设条件,由于该特征表征了不同图片的哈希码是不相同的概率大于预设值,并且由于图片的哈希码是根据图片的哈希码概率分布确定出的,进而在基于得出的图片的哈希码概率分布确定图片的哈希码时,可以保证不同的图片对应于不同的哈希码。
附图说明
为了更清楚地说明在本公开的实施例中的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍。
图1为本公开的实施例中一种模型训练方法的流程示意图;
图2为本公开的实施例中一种图片的哈希码确定方法的流程示意图;
图3为本公开的实施例中一种模型训练装置的结构示意图;
图4为本公开的实施例中一种图片的哈希码确定装置的结构示意图;
图5为本公开的实施例中一种电子设备的结构示意图。
具体实施方式
下面详细描述本公开的实施例,该实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开的技术感,而不能解释为对本公开的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本公开的说明书中使用的措辞“包括”是指存在该特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组合。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。
为了更好的说明本公开实施例的方案,下面首先对本公开的实施例涉及的相关技术术语进行介绍和解释:
哈希码概率分布:指的是在考虑到图片本身因素,希望尽可能保留图片中的信息时,图像被哈希到各候选哈希码的概率,且所有的候选哈希码的概率之和为1。在实际应用中,哈希码通常可以为K比特的二进制序列,可以存在2k种不同的哈希码,即2k种候选哈希码。
在一示例中,假如哈希码通常可以为2比特的二进制序列,此时存在4种不同的哈希码,即候选哈希码code1、候选哈希码code2、候选哈希码code3和候选哈希码code4,哈希码概率分布指的是输入至模型的图片被哈希到code1、code2、code3和code4中的每一种哈希码的概率。如可以将图片X输入至模型,此时从模型中输出图片X所对应的哈希码为code1的概率为0.3、为code2的概率为0.2、为code3的概率为0.4、为code4的概率为0.1。
哈希码先验概率分布,指的是在考虑到图片本身因素之前,图像被哈希到各候选哈希码的置信程度的概率分布,即根据以往经验和分析得到的图像被哈希到各候选哈希码的概率。
本公开的实施例提供了一种模型训练方法,如图1所示,该方法可以包括:
步骤S110,获取训练样本图片。
其中,训练样本图片即用于训练初始的模型的图片,训练样本图片的数量及来源可以根据实际需要配置,本公开实施例不做具体的限定。
步骤S120,基于训练样本图片对初始的模型进行训练,直至模型输出的各训练样本图片的哈希码概率分布满足预设条件;
其中,该模型可以是神经网络模型,且该模型是以图片为输入、以图片的哈希码概率分布为输出的模型,图片的哈希码概率分布为图片被哈希到各候选哈希码的概率。
也就是说,将一张图片输入该模型后,可以输出该图片的哈希码概率分布,即该图片被哈希到各候选哈希码的概率。
在实际应用中,在获取训练样本图片后,可以将训练样本图片输入初始的模型,得到各训练样本图片的哈希码概率分布;进一步的,判断各训练样本图片的哈希码概率分布是否满足预设条件,若不满足预设条件,则说明基于当前的模型得到的图片的哈希码概率分布不满足实际需求,此时可以调节当前模型的参数,再次分别将各训练样本图片输入到调节参数后的模型,并再次判断得到的各训练样本图片的哈希码概率分布是否满足预设条件,若仍不满足预设条件,则再次调节模型的参数,并重复上述执行步骤,直至得到的各训练样本图片的哈希码概率分布满足预设条件,此时说明基于当前模型得到的原始图片的概率分布的鲁棒性满足实际需求。
其中,在调节模型的参数时,可以按照预设的调节方式调节模型的参数值。比如,预设的调节方式可以为每次按照预设的步长调节模型的参数。
在本公开实施例中,可以基于训练样本图片对初始的模型进行训练,并且训练结束的条件为模型输出的各训练样本图片的哈希码概率分布满足预设条件,由于该特征表征了不同图片的哈希码是不相同的概率大于预设值,并且由于图片的哈希码是根据图片的哈希码概率分布确定出的,进而在基于得出的图片的哈希码概率分布确定图片的哈希码时,可以保证不同的图片对应于不同的哈希码。
在本公开可选的实施例中,在一次训练过程中,通过模型得到各训练样本图片的哈希码概率分布之后,还包括:
根据各训练样本图片的哈希码概率分布,得到哈希码先验概率分布,哈希码先验概率分布包括各候选哈希码的先验概率;
确定每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量,并得到差异量总和,差异量总和为每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量的和;
其中,满足预设条件包括至少两次相邻训练所对应的差异量总和的差值小于预设值。
在实际应用中,在基于模型得到各训练样本图片的哈希码概率分布之后,由于哈希码概率分布是图片被哈希到各候选哈希码的概率,因此可以基于得到的各训练样本图片中各候选哈希码的先验概率,确定哈希码先验概率分布。
进一步的,在得到哈希码先验概率分布之后,可以确定每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量,然后基于每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量,可以得到本次训练时所对应的差异量总和,然后可以确定本次训练时所对应的差异量总和确定是否满足预设条件。
此外,在实际应用中,模型输出的各训练样本图片的哈希码概率分布满足预设条件包括至少相邻两次训练所对应的差异量总和的差值小于预设值,也就是说,每对初始的模型进行训练一次时,将会得到一个差异量总和,此时可以将当前训练的得到的差异量总和与上一次训练得到的差异量总和做差,并判断得到的差值的绝对值是否满足预设值,若满足预设值,则说明当前模型的精度可以满足需求,则可以停止训练;若不满足预设值,则说明当前模型的精度不满足需求,则需要继续基于训练样本图片对该模型进行训练,直至至少两次相邻训练所对应的差异量总和的差值小于预设值。
其中,预设值的取值可以根据实际需要预先配置,本公开实施例不做限定,如想要模型的精度足够高,则可以将预设值的取值设置的足够小。
在本公开可选的实施例中,确定每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量,并得到差异量总和,包括:
计算先验概率分布的第一熵,以及各训练样本图片的哈希码概率分布的第二熵;
根据第一熵和各个第二熵,得到各训练样本图片对应的相对熵;
将各训练样本图片对应的相对熵的相加,得到差异量总和。
在实际应用中,确定每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量时,可以基于哈希码先验概率分布进行求熵运算,得到第一熵,以及对各训练样本图片的哈希码概率分别进行求熵运算,得到各训练样本图片对应的第二熵,然后将得到的第一熵分别与各训练样本图片对应的第二熵进行求差运算,得到对应于各训练样本图片的相对熵,最后将对应于各训练样本图片的相对熵相加,得到差异量总和。
在实际应用中,可以通过下列公式确定每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量:
H=H(P(c))-H(PI(c))
其中,H表示每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量(即各训练样本图片对应的相对熵),H(P(c))表示先验概率分布的第一熵,H(PI(c))表示各训练样本图片的哈希码概率分布的第二熵。
在一示例中,假设训练样本图片包括图片A、图片B和图片C,在基于训练样本图片对初始的模型进行训练时,将图片A、图片B和图片C分别输入该模型,得到图片A哈希码概率分布、图片B哈希码概率分布和图片C的哈希码概率分布,此时可以基于图片A、图片B和图片C的哈希码概率分布,确定出哈希码先验概率分布;然后分别对哈希码先验概率分布、图片A的哈希码概率分布、图片B的哈希码概率分布和图片C的哈希码概率分布进行求熵运算,得到哈希码先验概率分布所对应的第一熵,图片A对应的第二熵、图片B对应的第二熵和图片C对应的第二熵;进一步的,将哈希码先验概率分布所对应的第一熵分别与图片A对应的第二熵、图片B对应的第二熵和图片C对应的第二熵代入上述公式,分别得到图片A、图片B和图片C对应的相对熵,然后将各训练样本图片对应的相对熵的相加,得到此次训练对应的差异量总和,然后将此时训练对应的差异量总和与上一次训练对应的差异量总和做差,判断差值是否小于预设值,若不小于,则继续重复上述训练的步骤,直至两次相邻训练所对应的差异量总和的差值小于预设值。
在本公开可选的实施例中,确定各候选哈希码的先验概率,包括:
针对一种候选哈希码,基于各训练样本图片的哈希码概率中对应于候选哈希码的概率,以及各训练样本图片在训练样本图片集合中的出现概率,确定候选哈希码对应于各训练样本图片的先验概率;
根据候选哈希码对应于各训练样本图片的先验概率,确定候选哈希码所对应的先验概率。
其中,各训练样本图片在训练样本图片集合中出现的概率是相同的,比如训练样本图片集合中包括10张训练样本图片,此时对于该训练样本图片集合中的任意一张训练样本图片所对应的出现概率均为1/10。
在实际应用中,可以通过下列公式确定各候选哈希码的先验概率:
其中,P(c)表示某一种候选哈希码的先验概率,PI(c)表示训练样本图片被哈希到某一种候选哈希码的概率,P(I)表示训练样本图片在训练样本图片集合中的出现概率,n表示训练样本图片集合中有n张训练样本图片。
也就是说,针对候选哈希码集合中任一种候选哈希码,在确定任一种候选哈希码所对应的先验概率时,可以将各训练样本图片对应于该候选哈希码的后验概率与各训练样本图片在训练样本图片集合中出现的概率相乘,得到该候选哈希码对应于每张样本图片的先验概率,然后将对应于各训练样本图片的先验概率相加,将得到的和作为该候选哈希码所对应的先验概率。
在一示例中,假如候选哈希码集合中包括候选哈希码code1和候选哈希码code2,训练样本图片包括图片A和图片B,图片A针对code1和code2的后验概率分别为0.3和0.7,图片B针对code1和code2的后验概率分别为0.5和0.5。在确定code1所对应的先验概率时,可以将图片A针对code1的后验概率(0.3)与图片A的出现概率相乘,得到图片A对应的积,并将图片B针对code1后验概率(0.5)与图片B的出现概率相乘,得到图片B对应的积,然后将图片A对应的积和图片B对应的积相加,将得到的和作为code1所对应的先验概率;相应的,在确定code2所对应的先验概率时,可以将图片A针对code2的后验概率(0.7)与图片A的出现概率相乘,得到图片A对应的积,并将图片B针对code2后验概率(0.5)与图片B的出现概率相乘,得到图片B对应的积,然后将图片A对应的积和图片B对应的积相加,将得到的和作为code2所对应的先验概率。
基于此,本公开实施例该提供了一种图片的哈希码确定方法,如图2所示,该方法包括:
步骤S210,获取待处理图片。
步骤S220,通过模型得到待处理图片的哈希码概率分布,其中,模型是通过上述实施例中模型训练方法训练得到的。
在实际应用中,在确定待处理图片的哈希码时,可以将待处理图片输入至训练后的模型,得到该待处理图片的哈希码概率分布,即该图片所对应的哈希码为预设候选哈希码集合中各候选哈希码概率。
其中,该模型可以是神经网络模型,而训练该神经网络模型的具体实现方式,可参见上述实施例的描述,在此就不再赘述。
步骤S230,基于待处理图片的哈希码概率分布,确定待处理图片的哈希码。
在实际应用中,待处理图片的哈希码可以根据待处理图片的哈希码概率分布确定,而如何根据待处理图片的哈希码概率分布确定待处理图片的哈希码,可以根据实际需要配置,本公开实施例不做限定。
比如,为了可以保证后续在基于哈希码运算时得出的结果更加精准,可以选取待处理图片的哈希码概率分布中概率较高的前N种候选哈希码作为待处理的哈希码;而为了可以提高效率,则可以选取待处理图片的哈希码概率分布中概率最高的候选哈希码作为待处理图片的哈希码。
基于与图1中所示方法相同的原理,本公开的实施例中还提供了一种模型训练装置30,如图3所示,该模型训练装置30可以包括训练样本图片获取模块310和模型训练模块320,其中:
训练样本图片获取模块310,用于获取训练样本图片;
模型训练模块320,用于基于训练样本图片对初始的模型进行训练,直至模型输出的各训练样本图片的哈希码概率分布满足预设条件;
其中,模型是以图片为输入、以图片的哈希码概率分布为输出的模型,图片的哈希码概率分布为图片被哈希到各候选哈希码的概率。
本公开可选的实施例中,模型训练模块还用于:
在一次训练过程中,通过模型得到各训练样本图片的哈希码概率分布之后,根据各训练样本图片的哈希码概率分布,得到哈希码先验概率分布,哈希码先验概率分布包括各候选哈希码的先验概率;以及确定每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量,并得到差异量总和,差异量总和为每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量的和;
其中,预设条件包括至少两次相邻训练所对应的差异量总和的差值小于预设值。
本公开可选的实施例中,模型训练模块在确定每个训练样本图片的哈希码概率分布和哈希码先验概率分布的差异量,并得到差异量总和时,具体用于:
计算先验概率分布的第一熵,以及各训练样本图片的哈希码概率分布的第二熵;根据第一熵和各个第二熵,得到各训练样本图片对应的相对熵;将各训练样本图片对应的相对熵的相加,得到差异量总和。
本公开可选的实施例中,模型训练模块在确定各候选哈希码的先验概率时,具体用于:
针对一种候选哈希码,基于各训练样本图片的哈希码概率中对应于候选哈希码的概率,以及各训练样本图片在训练样本图片集合中的出现概率,确定候选哈希码对应于各训练样本图片的先验概率;以及根据候选哈希码对应于各训练样本图片的先验概率,确定候选哈希码所对应的先验概率。
本公开实施例的模型训练装置可执行本公开的实施例所提供的一种模型训练方法,其实现原理相类似,本公开各实施例中的模型训练装置中的各模块所执行的动作是与本公开各实施例中的模型训练方法中的步骤相对应的,对于模型训练装置的各模块的详细功能描述具体可以参见前文中所示的对应的模型训练方法中的描述,此处不再赘述。
基于与图2中所示方法相同的原理,本公开的实施例中还提供了一种种图片的哈希码确定装置40,如图4所示,该图片的哈希码确定装置40可以包括待处理图片获取模块410、图片处理模块420和哈希码确定模块430,其中:
待处理图片获取模块410,用于获取待处理图片;
图片处理模块420,用于通过模型得到待处理图片的哈希码概率分布,其中,模型是通过上述中所示的模型训练方法训练得到的;
哈希码确定模块430,用于基于待处理图片的哈希码概率分布,确定待处理图片的哈希码。
本公开实施例的图片的哈希码确定装置可执行本公开的实施例所提供的一种图片的哈希码确定方法,其实现原理相类似,本公开各实施例中的图片的哈希码确定装置中的各模块所执行的动作是与本公开各实施例中的图片的哈希码确定方法中的步骤相对应的,对于图片的哈希码确定装置的各模块的详细功能描述具体可以参见前文中所示的对应的图片的哈希码确定方法中的描述,此处不再赘述。
基于与本公开的实施例中所示的方法相同的原理,本公开的实施例中还提供了一种电子设备,该电子设备可以包括但不限于:处理器和存储器;存储器,用于存储计算机操作指令;处理器,用于通过调用计算机操作指令执行实施例所示的方法。
基于与本公开的实施例中所示的方法相同的原理,本公开的实施例中还提供了一种计算机可读存储介质,该计算机可读存储介质存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述实施例所示的方法,在此不再赘述。
本公开的实施例中的方案,下面参考图5,其示出了一种适用于实现本公开实施例的电子设备500的结构示意图,该电子设备500可以为终端设备或服务器。其中,终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例所示的方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种模型训练方法,其特征在于,包括:
获取训练样本图片;
基于所述训练样本图片对初始的模型进行训练,直至所述模型输出的各训练样本图片的哈希码概率分布满足预设条件;
其中,所述模型是以图片为输入、以图片的哈希码概率分布为输出的模型,图片的哈希码概率分布为图片被哈希到各候选哈希码的概率。
2.根据权利要求1所述的方法,其特征在于,在一次训练过程中,通过所述模型得到各训练样本图片的哈希码概率分布之后,还包括:
根据各训练样本图片的哈希码概率分布,得到哈希码先验概率分布,所述哈希码先验概率分布包括各候选哈希码的先验概率;
确定每个训练样本图片的哈希码概率分布和所述哈希码先验概率分布的差异量,并得到差异量总和,所述差异量总和为每个训练样本图片的哈希码概率分布和所述哈希码先验概率分布的差异量的和;
其中,所述预设条件包括至少两次相邻训练所对应的差异量总和的差值小于预设值。
3.根据权利要求2所述的方法,其特征在于,所述确定每个训练样本图片的哈希码概率分布和所述哈希码先验概率分布的差异量,并得到差异量总和,包括:
计算所述先验概率分布的第一熵,以及各训练样本图片的哈希码概率分布的第二熵;
根据所述第一熵和各个第二熵,得到各训练样本图片对应的相对熵;
将各训练样本图片对应的相对熵的相加,得到所述差异量总和。
4.根据权利要求2所述的方法,其特征在于,确定各候选哈希码的先验概率,包括:
针对一种候选哈希码,基于各训练样本图片的哈希码概率中对应于所述候选哈希码的概率,以及各训练样本图片在训练样本图片集合中的出现概率,确定所述候选哈希码对应于各训练样本图片的先验概率;
根据所述候选哈希码对应于各训练样本图片的先验概率,确定所述候选哈希码所对应的先验概率。
5.一种图片的哈希码确定方法,其特征在于,包括:
获取待处理图片;
通过模型得到所述待处理图片的哈希码概率分布,其中,所述模型是通过权利要求1至4中任一项所述的方法训练得到的;
基于所述待处理图片的哈希码概率分布,确定所述待处理图片的哈希码。
6.一种模型训练装置,其特征在于,包括:
训练样本图片获取模块,用于获取训练样本图片;
模型训练模块,用于基于所述训练样本图片对初始的模型进行训练,直至所述模型输出的各训练样本图片的哈希码概率分布满足预设条件;
其中,所述模型是以图片为输入、以图片的哈希码概率分布为输出的模型,图片的哈希码概率分布为图片被哈希到各候选哈希码的概率。
7.根据权利要求6所述的装置,其特征在于,所述模型训练模块还用于:
根据各训练样本图片的哈希码概率分布,得到哈希码先验概率分布;以及确定每个训练样本图片的哈希码概率分布和所述哈希码先验概率分布的差异量,并得到差异量总和,所述差异量总和为每个训练样本图片的哈希码概率分布和所述哈希码先验概率分布的差异量的和;
其中,所述预设条件包括至少两次相邻训练所对应的差异量总和的差值小于预设值。
8.一种图片的哈希码确定装置,其特征在于,包括:
待处理图片获取模块,用于获取待处理图片;
图片处理模块,用于通过模型得到所述待处理图片的哈希码概率分布,其中,所述模型是通过权利要求1至4中任一项所述的方法训练得到的;
哈希码确定模块,用于基于所述待处理图片的哈希码概率分布,确定所述待处理图片的哈希码。
9.一种电子设备,其特征在于,包括:
处理器和存储器;
所述存储器,用于存储计算机操作指令;
所述处理器,用于通过调用所述计算机操作指令,执行权利要求1至5中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现权利要求1至5中任一项所述的方法。
CN201910498011.XA 2019-06-10 2019-06-10 模型训练方法、装置、电子设备及存储介质 Active CN110209851B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910498011.XA CN110209851B (zh) 2019-06-10 2019-06-10 模型训练方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910498011.XA CN110209851B (zh) 2019-06-10 2019-06-10 模型训练方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110209851A true CN110209851A (zh) 2019-09-06
CN110209851B CN110209851B (zh) 2021-08-20

Family

ID=67791620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910498011.XA Active CN110209851B (zh) 2019-06-10 2019-06-10 模型训练方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110209851B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915689A (zh) * 2020-07-16 2020-11-10 北京字节跳动网络技术有限公司 用于生成目标函数的方法、装置、电子设备和计算机可读介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256082A (zh) * 2018-01-22 2018-07-06 北京邮电大学 一种基于深度多相似度哈希的多标签图像检索方法
CN109522432A (zh) * 2018-09-21 2019-03-26 重庆大学 一种融合自适应相似度和贝叶斯框架的图像检索方法
WO2020010691A1 (zh) * 2018-07-12 2020-01-16 北京奇虎科技有限公司 从图像中提取哈希码的方法、装置及图像检索方法、装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256082A (zh) * 2018-01-22 2018-07-06 北京邮电大学 一种基于深度多相似度哈希的多标签图像检索方法
WO2020010691A1 (zh) * 2018-07-12 2020-01-16 北京奇虎科技有限公司 从图像中提取哈希码的方法、装置及图像检索方法、装置
CN109522432A (zh) * 2018-09-21 2019-03-26 重庆大学 一种融合自适应相似度和贝叶斯框架的图像检索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周书仁 等: "《融合多尺度特征的深度哈希图像检索方法》", 《计算机科学与探索》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915689A (zh) * 2020-07-16 2020-11-10 北京字节跳动网络技术有限公司 用于生成目标函数的方法、装置、电子设备和计算机可读介质
WO2022012178A1 (zh) * 2020-07-16 2022-01-20 北京字节跳动网络技术有限公司 用于生成目标函数的方法、装置、电子设备和计算机可读介质
CN111915689B (zh) * 2020-07-16 2023-11-24 抖音视界有限公司 用于生成目标函数的方法、装置、电子设备和计算机可读介质

Also Published As

Publication number Publication date
CN110209851B (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
CN110399848A (zh) 视频封面生成方法、装置及电子设备
CN111414543B (zh) 用于生成评论信息序列的方法、装置、电子设备和介质
CN110213573B (zh) 一种视频质量评估方法、装置和电子设备
CN111459364B (zh) 图标更新方法、装置和电子设备
CN106897003A (zh) 用于显示地图信息的方法、装置和系统
CN109815365A (zh) 用于处理视频的方法和装置
CN110502665A (zh) 视频处理方法和装置
CN109769127A (zh) 视频同步发布方法、装置、电子设备及可读存储介质
CN110213614A (zh) 从视频文件中提取关键帧的方法和装置
CN110032978A (zh) 用于处理视频的方法和装置
CN109889893A (zh) 视频处理方法、装置及设备
CN110321447A (zh) 重复图像的确定方法、装置、电子设备及存储介质
CN110347875A (zh) 一种视频场景分类方法、装置、移动终端及存储介质
CN109446199A (zh) 单元格数据处理方法和装置
CN110188782A (zh) 图像相似性确定方法、装置、电子设备及可读存储介质
CN113256339B (zh) 资源投放的方法、装置、存储介质及电子设备
CN109819042A (zh) 用于提供软件开发工具包的方法和装置
CN110209851A (zh) 模型训练方法、装置、电子设备及存储介质
CN113392018A (zh) 流量分发方法、装置、存储介质及电子设备
CN111797665B (zh) 用于转换视频的方法和装置
CN111798251A (zh) 房源数据的验证方法、装置和电子设备
CN110414625A (zh) 确定相似数据的方法、装置、电子设备及存储介质
CN111209432A (zh) 信息获取的方法、装置、电子设备及计算机可读介质
CN110765238A (zh) 数据加密查询方法及装置
CN110046670A (zh) 特征向量降维方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: Tiktok vision (Beijing) Co.,Ltd.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20230726

Address after: 100190 1309, 13th floor, building 4, Zijin Digital Park, Haidian District, Beijing

Patentee after: Beijing volcano Engine Technology Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: Douyin Vision Co.,Ltd.

TR01 Transfer of patent right