CN113220922B - 图像搜索方法、装置和电子设备 - Google Patents
图像搜索方法、装置和电子设备 Download PDFInfo
- Publication number
- CN113220922B CN113220922B CN202110628560.1A CN202110628560A CN113220922B CN 113220922 B CN113220922 B CN 113220922B CN 202110628560 A CN202110628560 A CN 202110628560A CN 113220922 B CN113220922 B CN 113220922B
- Authority
- CN
- China
- Prior art keywords
- visual
- depolarization
- degree
- candidate image
- query information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 230000000007 visual effect Effects 0.000 claims abstract description 162
- 230000028161 membrane depolarization Effects 0.000 claims abstract description 99
- 238000003062 neural network model Methods 0.000 claims description 67
- 238000004422 calculation algorithm Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 description 15
- 238000012549 training Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000007476 Maximum Likelihood Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 239000002344 surface layer Substances 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000010287 polarization Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本公开实施例公开了图像搜索方法、装置和电子设备。该方法的一具体实施方式包括:获取用于搜索图像的目标查询信息;基于候选图像与所述目标查询信息的去偏相关度,生成所述目标查询信息对应的目标查询结果;其中,去偏相关度通过第一步骤生成,所述第一步骤包括:根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率;基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度。由此,提供了一种新的图像搜索方式。
Description
技术领域
本公开涉及互联网技术领域,尤其涉及一种图像搜索方法、装置和电子设备。
背景技术
随着互联网的发展,用户越来越多的使用电子设备实现各种功能。例如,用户可以通过电子设备搜索图像。
在用户通过电子设备搜索图像的时候,用户可以输入与期望得到的图像对应的信息(例如文字、语音等)。然后,电子设备通过可以通过本地或者与其它电子设备的交互,进行图像搜索,得到搜索结果。再后电子设备可以将包括多个图像的搜索结果,展示给用户。可以理解,搜索结果可以展示图像的缩略图等。最后,用户可以选取一个或多个图像,进行进一步的动作(例如发送给其它用户等)。
发明内容
提供该公开内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该公开内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开实施例提供了一种图像搜索方法,该方法包括:获取用于搜索图像的目标查询信息;基于候选图像与所述目标查询信息的去偏相关度,生成所述目标查询信息对应的目标查询结果;其中,去偏相关度通过第一步骤生成,所述第一步骤包括:根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率;基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度。
第二方面,本公开实施例提供了一种信息生成方法,该方法包括:根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率;基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度。
第三方面,本公开实施例提供了一种图像搜索装置,包括:获取单元,用于获取用于搜索图像的目标查询信息;生成单元,用于基于候选图像与所述目标查询信息的去偏相关度,生成所述目标查询信息对应的目标查询结果;其中,去偏相关度通过第一步骤生成,所述第一步骤包括:根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率;基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度。
第四方面,本公开实施例提供了一种图像搜索装置,包括:确定模块,用于根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率;生成模块,用于基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度。
第五方面,本公开实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面或者如第二方面所述的方法。
第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或者如第二方面所述的方法的步骤。
本公开实施例提供的图像搜索方法、装置和电子设备,通过采用去偏相关度确定目标查询结果。由于去偏相关度中去除了视觉吸引可能引起的相关偏差,可以使得去偏相关度能够较为准确地表征候选图像与目标查询信息之间的相关性,因而可以提高所确定目标查询结果的准确率,使得用户通过较少操作次数和较少查询时间即可获取期望得到的图片,从而节省因用户操作次数而耗费的计算量和通信量。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1是根据本公开的图像搜索方法的一个实施例的流程图;
图2是根据本公开的第一步骤的示例性流程图;
图3是根据本公开的图像搜索方法的一个应用场景的示意图;
图4是根据本公开的第三步骤的示例性流程图;
图5是根据本公开的第三步骤的可选的实现方式的示意图;
图6是根据本公开的信息生成方法的一个实施例的流程图;
图7是根据本公开的图像搜索装置的一个实施例的结构示意图;
图8是根据本公开的信息生成装置的一个实施例的结构示意图;
图9是本公开的一个实施例的图像搜索方法可以应用于其中的示例性系统架构;
图10是根据本公开实施例提供的电子设备的基本结构的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
请参考图1,其示出了根据本公开的图像搜索方法的一个实施例的流程。如图1所示该图像搜索方法,包括以下步骤:
步骤101,获取用于搜索图像的目标查询信息。
在本实施例中,图像搜索方法的执行主体(例如服务器)可以获取用于搜索图像的目标查询信息。
在本实施例中,上述目标查询信息的具体形式可以是各种各样的,在此不做限定。
作为示例,目标查询信息可以包括以下至少一项但不限于:文字信息、图像信息、语音信息。
在本实施例中,目标查询信息是从上述执行主体本地获取的,也可以是从其它电子设备接收的。
步骤102,基于候选图像与目标查询信息的去偏相关度,生成目标查询信息对应的目标查询结果。
在本实施例中,上述执行主体可以根据候选图像与目标查询信息的去偏相关度,生成目标查询信息对应的目标查询结果。
在这里,候选图像可以是预先设置可以用于展示的图像。
在这里,去偏相关度可以用于表征查询信息与候选图像之间的、去除了视觉特征影响的实际相关度。
在这里,基于去偏相关度生成目标查询结果的具体方式,可以根据实际应用场景设置,在此不做限定。
在一些实施例中,上述执行主体可以根据候选图像的去偏相关度,选取预设第一数目个候选图像作为待展示图像;然后,基于得到的待展示图像,生成目标查询信息对应的目标查询结果。
在一些实施例中,步骤102可以包括:基于去偏相关度,选取第一预设数目个候选图像作为待展示图像;基于选取的待展示图像的以下至少一项:视觉吸引度、展示位置影响度和去偏相关度,确定候选图像的预估选中概率;根据各个待展示图像的预估选中概率,生成所述目标查询结果。
在这里,预估选中概率可以用于表征本次搜索过程中待展示图像被选中的概率。
需要说明的是,基于去偏相关度,从候选图像中选取待展示图像,可以通过去偏相关度的较高准确性,选取出较为准确的待展示图像,从而,可以提高所生成的目标查询结果的准确性。
在本实施例中,上述去偏相关度通过第一步骤生成。第一步骤可以通过图2包括步骤201和步骤202。
步骤201,根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率。
在本实施例中,用户选中日志,可以是用户通过各种方式选取图像的历史记录。作为示例,如果用户通过点击的方式选中图像,用户选中日志可以是用户点击日志。
在本实施例中,用户选中日志可以包括历史查询信息、历史展现候选图像和用户选中的候选图像。
在这里,历史查询信息可以是用户在已经发生的搜索过程中采用的用于搜索图像的信息。
在这里,历史展现候选图像,可以是在已经发生的搜索过程中展现给用户的候选图像。
在这里,后验选中概率可以是在已经发生的搜索过程中,候选图像被选中的频率。
在本实施例中,后验选中概率可以指示候选图像与历史查询信息之间的表层相关性。可以理解,可能受其他因素的影响,使得表层相关性与(候选图像与历史查询信息的)真正相关性之间,具有一些差异。
步骤202,基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度。
在本实施例中,视觉吸引度可以用于表征候选图像的视觉特征作为选取考虑因素时被选中的概率。
在这里,视觉特征可以用于指示图像在视觉上的特征。需要说明的是,视觉特征作为较为依赖与主观的事物,可以采用视觉吸引度进行一定程度的表征。
在一些应用场景中,请参考图3,对于查询信息“嘿嘿嘿”,图3中示出了若干个查询信息“嘿嘿嘿”相关的候选图像。这些候选图像中的视觉特征,可以是不同的。例如,候选图像301中示出了猫图像,候选图像302示出了卡通图像,候选图像303示出了小女孩图像。候选图像301、候选图像302和候选图像303之间图像内容是不同的,作为示例,可能猫图像在视觉特征上更吸引人,所以候选图像301对应的视觉吸引度,可能大于候选图像302对应的视觉吸引度,也大于候选图像303对应的视觉吸引度。
在本实施例中,步骤202可以通过各种方式实现,在此不做限定。
可选的,可以通过各种方式,预先标注候选图像的视觉吸引度。
作为示例,可以采用人工标注的方式,预先确定视觉吸引度。
作为示例,可以预先训练视觉吸引度确定模型,确定候选图像的视觉吸引度。
可选的,后验选中概率与上述两者之间的关系,可以根据实际应用场景设置,在此不做限定。
作为示例,可以将上述后验选中概率,可以是视觉吸引度和去偏相关度的乘积。
需要说明的是,本实施例提供的图像搜索方法,通过采用去偏相关度确定目标查询结果。由于去偏相关度中去除了视觉吸引可能引起的相关偏差,可以使得去偏相关度能够较为准确地表征候选图像与目标查询信息之间的相关性,因而可以提高所确定目标查询结果的准确率,使得用户通过较少操作次数和较少查询时间即可获取期望得到的图片,从而节省因用户操作次数而耗费的计算量和通信量。
在一些实施例中,上述步骤202,可以包括:根据预设的后验选中概率与去偏相关度、展示位置影响度和视觉吸引度这三者之间的关系,确定候选图像与历史查询信息的去偏相关性。
在这里,展示位置影响度可以用于表征位置对于用户是否会选中候选图像的影响程度。
在这里,上述执行主体可以预先获取后验选中概率与上述三者之间的关系。可选的,后验选中概率与上述三者之间的关系,可以根据应用场景设置,在此不做限定。
在一些应用场景中,以P1表示后验选中概率。以P2表示去偏相关度。以P3表示展示位置影响度。以P4表示视觉吸引度。以*表示乘号。
作为示例,P1=P3*P2+(1-P3)*P4*P2
作为示例,P1=P3*P2*P4
作为示例,P1=P3+(1-P3)*P4*P2
需要说明的是,通过引入展示位置影响度,确定去偏相关度。可以从候选图像与搜索信息之间的表层相关性中,进一步去除展示位置待来的相关性偏差,得到更为准确的去偏相关度,进而,可以确定更为准确的目标查询结果。
在一些实施例中,上述步骤根据预设的后验选中概率与去偏相关度、位置影响度和视觉吸引度这三者之间的关系,生成候选图像与历史查询信息的去偏相关度,可以包括:在最大期望算法的迭代步骤中,以去偏相关度和展示位置影响度为隐变量,根据候选图像的预设视觉相关度,以用户选中日志为观测数据,生成待定去偏相关度和待定展示位置相关度。
在这里,最大期望算法(Expectation-maximization algorithm,EM),也可以称为期望最大化算法,通常可以用于在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐性变量。
在一些应用场景中,最大期望算法经过两个步骤交替进行计算:第一步是计算期望(E步骤),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M步骤),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。一轮EM步骤可以称为一次迭代步骤。经过多次迭代步骤,可以求取隐变量。
在这里,上述预设视觉相关度,可以通过各种方式求取。
作为示例,可以人工预先标注预设视觉相关度。
在这里,以去偏相关度和展示位置相关度为隐变量,以预设视觉吸引度为已知量,进行EM算法的迭代步骤的具体过程,本领域技术人员可以根据本申请记载的内容实现,在此不再赘述。
需要说明的是,通过EM算法求取去偏相关度和展示位置影响度,可以提高所确定的去偏相关度和展示位置影响度的准确度。
在一些实施例中,上述预设视觉吸引度可以通过第二步骤生成。在这里,第二步骤可以包括:将候选图像的图像特征导入第一神经网络模型,得到候选图像的预设视觉吸引度。
在这里,上述第一神经网络模型可以用于表征图像特征与候选图像的视觉吸引度之间的对应关系。
可选的,可以将确定候选图像的视觉吸引度的第二步骤,与确定去偏相关度的过程区分开。
作为示例,可以获取图像样本,然后给标注人员一次性展示多个图像样本,供标注人员选取,例如一次性展示多个图像样本,供标注人员选取两个。然后,以标注人员的选取次数和图像的总展示次数的比值为样本标签。再后,基于图像样本和样本标签,训练初始第一神经网络,得到第一神经网络模型。
需要说明的是,通过第一神经网络模型,可以快速求取视觉吸引度,并且,未展示过的新的候选图像,第一神经网络可以根据训练结果,确定新的候选图像的视觉吸引度。
在一些应用场景中,可以将确定候选图像的视觉吸引度的第二步骤,与采用EM算法确定去偏相关度的过程联系起来。
在一些实施例中,上述第一神经网络模型可以通过第三步骤生成。参考图4,图4示出了第三步骤的流程。第三步骤可以包括图4示出的步骤401、步骤402、步骤403和步骤404。
步骤401,根据迭代步骤生成的待定去偏相关度和待定展示位置影响度,生成第一待定视觉吸引度。
在这里,可以利用预先设置的后验选中概率与上述三者(去偏相关度、展示位置影响度和视觉吸引度)之间的关系,生成待定去偏相关度、待定展示位置影响度对应的第一待定视觉吸引度。
需要说明的是,由于单个迭代步骤中的去偏相关度和展示位置影响度不是EM算法最终确定的结果,因此,单个步骤中的去偏相关度和展示位置影响度之前,前缀待定以与EM算法最终确定的结果区分开。
步骤402,基于第一待定视觉吸引度,生成候选图像的标签。
在一些应用场景中,可以以第一待定视觉吸引度为候选图像的标签。以第一待定视觉吸引为标签,可以将第一神经网络模型的训练作为回归任务,即第一神经网络模型预测得到的第二待定视觉吸引度也为程度表征值,然后将第一神经网络模型向第二待定视觉吸引度靠近第一待定视觉吸引度方向进行训练。
步骤403,将候选图像的图像特征导入更新前的第一神经网络模型,得到候选图像的第二待定视觉吸引度。
在这里,将候选图像的图像特征导入更新前的第一神经网络模型,得到候选图像的第二待定视觉吸引度。
步骤404,根据第二待定视觉吸引度和候选图像的标签,调整更新前的第一神经网络模型的参数,得到的更新后的第一神经网络模型。
在这里,上述将第二待定视觉吸引度和候选图像的标签(即步骤402生成的标签),计算损失值;然后,利用损失值调整更新前的第一神经网络模型的参数,得到更新后的第一神经网络模型。
可选的,可以在基于每次迭代步骤生成的待定去偏相关度和待定展示位置影响度,调整第一神经网络模型。
在这里,基于步骤404得到的更新后的第一神经网络模型,可以理解为EM算法中的一轮迭代步骤对应。
在一些应用场景中,可以将候选图像的图像特征导入步骤404中得到的第一神经网络模型,得到EM下一轮迭代算法中用到的预设视觉吸引度。
需要说明的是,通过利用EM迭代步骤中生成的待定去偏相关度和待定展示位置影响度,确定候选图像的待定第一视图吸引度;然后,利用第一视觉吸引度生成图像标签;再后,基于候选图像和图像标签,对更新前的第一神经网络模型进行训练,得到的第一神经网络模型。由此,可以随着采用EM算法进行各个迭代的步骤,更新第一神经网络模型。
一方面,从图像样本数量来说,可以采用较少的候选图像,通过在迭代步骤中更新图像标签,实现复用图像样本多次对第一神经网络模型训练,减少获取以及处理图像样本的成本。另一方面,从与EM算法的配合程度来说,EM算法的迭代和神经网络模型互相确定对方需要的参数,迭代步骤的生成结果用于训练神经网络模型,训练得到的神经网络模型进一步用于下一步的迭代步骤,可以实现迭代步骤和神经网络模型以对方为提升基础,两者的准确率均实现逐步提高。
在一些实施例中,步骤402所述基于第一待定视觉吸引度,生成候选图像的标签,可以包括:根据第一待定视觉吸引度和预设视觉吸引度阈值,生成候选图像的标签,其中,标签指示候选图像为正样本或者负样本。
在一些实施例中,步骤404所述根据所述第二待定视觉吸引度和候选图像的标签,调整更新前的第一神经网络模型的参数,得到更新后的第一神经网络模型,可以包括:根据第二视觉特征吸引度,确定候选图像的预测结果,其中,预测结果指示候选图像为正样本或者负样本;根据预测结果和候选图像的标签,调整更新前的第一神经网络模型的参数,得到更新后的第一神经网络模型。
在一些应用场景中,可以将大于预设视觉吸引度阈值的第一待定视觉吸引度对应的标签,设置为1。将不大于预设视觉吸引度阈值的第一待定视觉吸引度对应的标签,设置为0。在这里,根据预设视觉吸引度阈值,将候选图像的标签区分为0或者1,即将候选图像区分为正负样本。
由此,可以将第一神经网络的训练作为分类任务进行。在训练第一神经网络模型的时候,第一神经网络模型的输出可以是程度表征值(可以理解为渐变值)而不是是非值(可以理解为0或者1),程度表征值可以指示对正负样本的预测正确还是错误。由此,可以利用分类任务的方式,对第一神经网络模型进行训练。随着分类任务训练的进行,第一神经网络模型的分类准确度提高,分类任务训练的过程中得到程度表征值的准确度也在提高。
需要说明的是,采用将第一神经网络的训练转换为分类任务的方式,首先,可以减少损失函数计算的计算量,提高计算速度。
其次,采用将第一神经网络的训练转换为分类任务的方式,在第一神经网络模型的训练与EM算法的迭代步骤联合进行的时候,迭代步骤中生成的第一待定视觉吸引度的准确度可能较低,以第一待定视觉吸引度为回归目标进行第一神经网络的训练,可能由于目标不准确,可能导致模型的误差较大。
将第一待定视觉吸引度进行两极化得到正负样本的方式,可以使得候选图像的标签在迭代步骤得到的结果不能保证准确度(例如是70分还是80分)的情况下,得到方向准确的标签(例如是正样本还是负样本),保证模型更新的方向正确,由此可以不断提高模型的准确率。从而,可以与迭代步骤联合训练的过程中,可以提高所训练的模型准确率,由此,可以得到较为准确的视觉吸引度。
请参考图5,其示出了通过EM算法和第一神经网络模型确定去偏相关度、展示位置影响度和视觉吸引度的示例性过程。
在图5中,EM算法示出了第i+1轮迭代的过程。第i+1轮迭代中,输入可以包括P_2(i)、P_3(i)和P_4(i);其中,P_2(i)表示第i轮的去偏相关度,P_3(i)表示第i轮的展示位置相关度,P_4(i)表示第i轮的视觉吸引度。第i+1轮迭代中,输出可以包括P_2(i+1)和P_3(i+1);P_2(i+1)表示第i+1轮的去偏相关度,P_3(i+1)表示第i+1轮的展示位置相关度。
然后,可以根据P_2(i+1)和P_3(i+1),得到P’_4(i+1),P’_4(i+1)可以表示第i+1轮的待定视觉吸引度(即图4中的第一待定视觉吸引度)。然后,可以利用P’_4(i+1),生成候选图像的标签。
再后,候选图像可以用于更新第一神经网络模型(请参考步骤403和步骤404),即图5中所示,候选图像导入更新前模型,以根据候选图像和标签,调整更新前模型。
再后,将候选图像导入到更新后的模型中,生成P_4(i+1);P_4(i+1)表示第i+1轮的视觉吸引度。
最后,将P_2(i+1)、P_3(i+1)和P_4(i+1)应用到EM算法的第i+2轮迭代中。
在一些实施例中,上述步骤根据预设的后验选中概率与去偏相关度、位置影响度和视觉吸引度这三者之间的关系,生成候选图像与历史查询信息的去偏相关度,可以包括:采用最大期望算法,以去偏相关度、展示位置影响度和视觉吸引度为隐变量,以用户选中日志作为观测数据,确定去偏相关度、展示位置影响度和视觉吸引度。
需要说明的是,通过采用最大期望算法,确定去偏相关度、展示位置影响度和视觉吸引度,可以实现快速确定去偏相关度、展示位置影响度和视觉吸引度这三者。
请参考图6,其示出了根据本公开的信息生成方法的一个实施例的流程。信息生成方法可以由服务器等电子设备执行。如图6所示该信息生成方法,包括以下步骤:
步骤601,根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率。
在本实施例中,用户选中日志,可以是用户通过各种方式选取图像的历史记录。作为示例,如果用户通过点击的方式选中图像,用户选中日志可以是用户点击日志。
在本实施例中,用户选中日志可以包括历史查询信息、历史展现候选图像和用户选中的候选图像。
在这里,历史查询信息可以是用户在已经发生的搜索过程中采用的用于搜索图像的信息。
在这里,历史展现候选图像,可以是在已经发生的搜索过程中展现给用户的候选图像。
在这里,后验选中概率可以是在已经发生的搜索过程中,候选图像被选中的频率。
在本实施例中,后验选中概率可以指示候选图像与历史查询信息之间的表层相关性。可以理解,可能受其他因素的影响,使得表层相关性与(候选图像与历史查询信息的)真正相关性之间,具有一些差异。
步骤602,基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度。
在本实施例中,步骤602可以通过各种方式实现,在此不做限定。
可选的,可以通过各种方式,预先标注候选图像的视觉吸引度。
作为示例,可以采用人工标注的方式,预先确定视觉吸引度。
作为示例,可以预先训练视觉吸引度确定模型,确定候选图像的视觉吸引度。
可选的,后验选中概率与上述两者之间的关系,可以根据实际应用场景设置,在此不做限定。
作为示例,可以将上述后验选中概率,可以是视觉吸引度和去偏相关度的乘积。
需要说明的是,本实施例提供的信息生成方法,通过采用去偏相关度确定目标查询结果。由于去偏相关度中去除了视觉吸引可能引起的相关偏差,可以使得去偏相关度能够较为准确地表征候选图像与目标查询信息之间的相关性。
需要说明的是,图6所示实施例的技术细节和实现效果,可以参考对于图2所示流程的说明,在此不再赘述。
在一些实施例中,所述步骤602,可以包括:根据预设的后验选中概率与去偏相关度、展示位置影响度和视觉吸引度这三者之间的关系,生成候选图像与历史查询信息的去偏相关度。
在一些实施例中,所述根据预设的后验选中概率与去偏相关度、展示位置影响度和视觉吸引度这三者之间的关系,生成候选图像与历史查询信息的去偏相关度,包括:在最大期望算法的迭代步骤中,以去偏相关度和展示位置影响度为隐变量,根据候选图像的预设视觉吸引度,以用户选中日志作为观测数据,生成待定去偏相关度和待定展示位置影响度。
在一些实施例中,预设视觉吸引度通过第二步骤生成,其中,第二步骤包括:将候选图像的图像特征导入第一神经网络模型,得到候选图像的预设视觉吸引度,其中,第一神经网络模型用于表征图像特征与候选图像的视觉吸引度之间的对应关系。
在一些实施例中,所述第一神经网络模型通过第三步骤生成,其中,第三步骤包括:根据迭代步骤生成的待定去偏相关度和待定展示位置影响度,生成第一待定视觉吸引度;基于第一待定视觉吸引度,生成候选图像的标签;将候选图像的图像特征导入更新前的第一神经网络模型,得到候选图像的第二待定视觉吸引度;根据所述第二待定视觉吸引度和候选图像的标签,调整更新前的第一神经网络模型的参数,得到更新后的第一神经网络模型。
在一些实施例中,根据第一待定视觉吸引度和预设视觉吸引度阈值,生成候选图像的标签,其中,标签指示候选图像为正样本或者负样本;以及所述根据所述第二待定视觉吸引度和候选图像的标签,调整更新前的第一神经网络模型的参数,得到更新后的第一神经网络模型,包括:根据第二视觉特征吸引度,确定候选图像的预测结果,其中,预测结果指示候选图像为正样本或者负样本;根据预测结果和候选图像的标签,调整更新前的第一神经网络模型的参数,得到更新后的第一神经网络模型。
在一些实施例中,所述根据预设的后验选中概率与去偏相关度、展示位置影响度和视觉吸引度这三者之间的关系,生成候选图像与历史查询信息的去偏相关度,包括:采用最大期望算法,以去偏相关度、展示位置影响度和视觉吸引度为隐变量,以用户选中日志作为观测数据,确定去偏相关度、展示位置影响度和视觉吸引度。
需要说明的是,上述信息生成方法的可选的实现方式,可以参考图像搜索方法中相关说明,在此不再赘述。
进一步参考图7,作为对上述各图所示方法的实现,本公开提供了一种图像搜索装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图7所示,本实施例的图像搜索装置包括:获取单元701和生成单元702。其中,获取单元,用于获取用于搜索图像的目标查询信息;生成单元,用于基于候选图像与所述目标查询信息的去偏相关度,生成所述目标查询信息对应的目标查询结果;其中,去偏相关度通过第一步骤生成,所述第一步骤包括:根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率;基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度。
在本实施例中,图像搜索装置的获取单元701和生成单元702的具体处理及其所带来的技术效果可分别参考图1对应实施例中步骤101和步骤102的相关说明,在此不再赘述。
在一些实施例中,所述步骤基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度,可以包括:根据预设的后验选中概率与去偏相关度、展示位置影响度和视觉吸引度这三者之间的关系,生成候选图像与历史查询信息的去偏相关度。
在一些实施例中,所述根据预设的后验选中概率与去偏相关度、展示位置影响度和视觉吸引度这三者之间的关系,生成候选图像与历史查询信息的去偏相关度,包括:在最大期望算法的迭代步骤中,以去偏相关度和展示位置影响度为隐变量,根据候选图像的预设视觉吸引度,以用户选中日志作为观测数据,生成待定去偏相关度和待定展示位置影响度。
在一些实施例中,预设视觉吸引度通过第二步骤生成,其中,第二步骤包括:将候选图像的图像特征导入第一神经网络模型,得到候选图像的预设视觉吸引度,其中,第一神经网络模型用于表征图像特征与候选图像的视觉吸引度之间的对应关系。
在一些实施例中,所述第一神经网络模型通过第三步骤生成,其中,第三步骤包括:根据迭代步骤生成的待定去偏相关度和待定展示位置影响度,生成第一待定视觉吸引度;基于第一待定视觉吸引度,生成候选图像的标签;将候选图像的图像特征导入更新前的第一神经网络模型,得到候选图像的第二待定视觉吸引度;根据所述第二待定视觉吸引度和候选图像的标签,调整更新前的第一神经网络模型的参数,得到更新后的第一神经网络模型。
在一些实施例中,根据第一待定视觉吸引度和预设视觉吸引度阈值,生成候选图像的标签,其中,标签指示候选图像为正样本或者负样本;以及所述根据所述第二待定视觉吸引度和候选图像的标签,调整更新前的第一神经网络模型的参数,得到更新后的第一神经网络模型,包括:根据第二视觉特征吸引度,确定候选图像的预测结果,其中,预测结果指示候选图像为正样本或者负样本;根据预测结果和候选图像的标签,调整更新前的第一神经网络模型的参数,得到更新后的第一神经网络模型。
在一些实施例中,所述根据预设的后验选中概率与去偏相关度、展示位置影响度和视觉吸引度这三者之间的关系,生成候选图像与历史查询信息的去偏相关度,包括:采用最大期望算法,以去偏相关度、展示位置影响度和视觉吸引度为隐变量,以用户选中日志作为观测数据,确定去偏相关度、展示位置影响度和视觉吸引度。
进一步参考图8,作为对上述各图所示方法的实现,本公开提供了一种信息生成装置的一个实施例,该装置实施例与图6所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图8所示,本实施例的图像搜索装置包括:确定模块801和生成模块802。其中,确定模块,用于根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率;生成模块,用于基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度。
在本实施例中,信息生成装置的确定模块801和生成模块802的具体处理及其所带来的技术效果可分别参考图1对应实施例中步骤601和步骤602的相关说明,在此不再赘述。
请参考图9,图9示出了本公开的一个实施例的图像搜索方法可以应用于其中的示例性系统架构。
如图9所示,系统架构可以包括终端设备901、902、903,网络904,服务器905。网络904用以在终端设备901、902、903和服务器905之间提供通信链路的介质。网络904可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备901、902、903可以通过网络904与服务器905交互,以接收或发送消息等。终端设备901、902、903上可以安装有各种客户端应用,例如网页浏览器应用、搜索类应用、新闻资讯类应用。终端设备901、902、903中的客户端应用可以接收用户的指令,并根据用户的指令完成相应的功能,例如根据用户的指令在信息中添加相应信息。
终端设备901、902、903可以是硬件,也可以是软件。当终端设备901、902、903为硬件时,可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当终端设备901、902、903为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器905可以是提供各种服务的服务器,例如接收终端设备901、902、903发送的信息获取请求,根据信息获取请求通过各种方式获取信息获取请求对应的展示信息。并展示信息的相关数据发送给终端设备901、902、903。
需要说明的是,本公开实施例所提供的图像搜索方法可以由终端设备执行,相应地,图像搜索装置可以设置在终端设备901、902、903中。此外,本公开实施例所提供的图像搜索方法还可以由服务器905执行,相应地,图像搜索装置可以设置于服务器905中。
应该理解,图9中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图10,其示出了适于用来实现本公开实施例的电子设备(例如图9中的终端设备或服务器)的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图10示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图10所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储装置1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中,还存储有电子设备1000操作所需的各种程序和数据。处理装置1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
通常,以下装置可以连接至I/O接口1005:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置1006;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置1007;包括例如磁带、硬盘等的存储装置1008;以及通信装置1009。通信装置1009可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图10示出了具有各种装置的电子设备,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置1009从网络上被下载和安装,或者从存储装置1008被安装,或者从ROM 1002被安装。在该计算机程序被处理装置1001执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取用于搜索图像的目标查询信息;基于候选图像与所述目标查询信息的去偏相关度,生成所述目标查询信息对应的目标查询结果;其中,去偏相关度通过第一步骤生成,所述第一步骤包括:根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率;基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率;基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取目标查询信息的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
Claims (13)
1.一种图像搜索方法,其特征在于,包括:
获取用于搜索图像的目标查询信息;
基于候选图像与所述目标查询信息的去偏相关度,生成所述目标查询信息对应的目标查询结果;其中,
去偏相关度通过第一步骤生成,所述第一步骤包括:
根据历史的目标查询信息对应的用户选中日志,确定候选图像的后验选中概率;
基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史的目标查询信息的去偏相关度;
其中,去偏相关度用于表征查询信息与候选图像之间的、去除视觉特征影响的实际相关度;视觉吸引度用于表征候选图像的视觉特征作为选取考虑因素时被选中的概率。
2.根据权利要求1所述的方法,其特征在于,所述基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度,包括:
根据预设的后验选中概率与去偏相关度、展示位置影响度和视觉吸引度这三者之间的关系,生成候选图像与历史查询信息的去偏相关度。
3.根据权利要求2所述的方法,其特征在于,所述根据预设的后验选中概率与去偏相关度、展示位置影响度和视觉吸引度这三者之间的关系,生成候选图像与历史查询信息的去偏相关度,包括:
在最大期望算法的迭代步骤中,以去偏相关度和展示位置影响度为隐变量,根据候选图像的预设视觉吸引度,以用户选中日志作为观测数据,生成待定去偏相关度和待定展示位置影响度。
4.根据权利要求3所述的方法,其特征在于,预设视觉吸引度通过第二步骤生成,其中,第二步骤包括:
将候选图像的图像特征导入第一神经网络模型,得到候选图像的预设视觉吸引度,其中,第一神经网络模型用于表征图像特征与候选图像的视觉吸引度之间的对应关系。
5.根据权利要求4所述的方法,其特征在于,所述第一神经网络模型通过第三步骤生成,其中,第三步骤包括:
根据迭代步骤生成的待定去偏相关度和待定展示位置影响度,生成第一待定视觉吸引度;
基于第一待定视觉吸引度,生成候选图像的标签;
将候选图像的图像特征导入更新前的第一神经网络模型,得到候选图像的第二待定视觉吸引度;
根据所述第二待定视觉吸引度和候选图像的标签,调整更新前的第一神经网络模型的参数,得到更新后的第一神经网络模型。
6.根据权利要求5所述的方法,其特征在于,所述基于第一待定视觉吸引度,生成候选图像的标签,包括:
根据第一待定视觉吸引度和预设视觉吸引度阈值,生成候选图像的标签,其中,标签指示候选图像为正样本或者负样本;以及
所述根据所述第二待定视觉吸引度和候选图像的标签,调整更新前的第一神经网络模型的参数,得到更新后的第一神经网络模型,包括:
根据第二视觉特征吸引度,确定候选图像的预测结果,其中,预测结果指示候选图像为正样本或者负样本;
根据预测结果和候选图像的标签,调整更新前的第一神经网络模型的参数,得到更新后的第一神经网络模型。
7.根据权利要求2所述的方法,其特征在于,所述根据预设的后验选中概率与去偏相关度、展示位置影响度和视觉吸引度这三者之间的关系,生成候选图像与历史查询信息的去偏相关度,包括:
采用最大期望算法,以去偏相关度、展示位置影响度和视觉吸引度为隐变量,以用户选中日志作为观测数据,确定去偏相关度、展示位置影响度和视觉吸引度。
8.根据权利要求1所述的方法,其特征在于,所述基于候选图像与所述目标查询信息的去偏相关度,生成所述目标查询信息对应的目标查询结果,包括:
基于去偏相关度,选取第一预设数目个候选图像作为待展示图像;
基于选取的待展示图像的以下至少一项:视觉吸引度、展示位置影响度和去偏相关度,确定候选图像的预估选中概率;
根据各个待展示图像的预估选中概率,生成所述目标查询结果。
9.一种信息生成方法,其特征在于,包括:
根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率;
基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度;
其中,去偏相关度用于表征查询信息与候选图像之间的、去除视觉特征影响的实际相关度;视觉吸引度用于表征候选图像的视觉特征作为选取考虑因素时被选中的概率。
10.一种图像搜索装置,其特征在于,包括:
获取单元,用于获取用于搜索图像的目标查询信息;
生成单元,用于基于候选图像与所述目标查询信息的去偏相关度,生成所述目标查询信息对应的目标查询结果;其中,
去偏相关度通过第一步骤生成,所述第一步骤包括:
根据历史的目标查询信息对应的用户选中日志,确定候选图像的后验选中概率;
基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史的目标查询信息的去偏相关度;
其中,去偏相关度用于表征查询信息与候选图像之间的、去除视觉特征影响的实际相关度;视觉吸引度用于表征候选图像的视觉特征作为选取考虑因素时被选中的概率。
11.一种信息生成装置,其特征在于,包括:
确定模块,用于根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率;
生成模块,用于基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度;
其中,去偏相关度用于表征查询信息与候选图像之间的、去除视觉特征影响的实际相关度;视觉吸引度用于表征候选图像的视觉特征作为选取考虑因素时被选中的概率。
12.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法或者如权利要求9所述的方法。
13.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的方法或者如权利要求9所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110628560.1A CN113220922B (zh) | 2021-06-04 | 2021-06-04 | 图像搜索方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110628560.1A CN113220922B (zh) | 2021-06-04 | 2021-06-04 | 图像搜索方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113220922A CN113220922A (zh) | 2021-08-06 |
CN113220922B true CN113220922B (zh) | 2024-02-02 |
Family
ID=77082989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110628560.1A Active CN113220922B (zh) | 2021-06-04 | 2021-06-04 | 图像搜索方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113220922B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114237785A (zh) * | 2021-11-17 | 2022-03-25 | 维沃移动通信有限公司 | 图像生成方法、装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1723456A (zh) * | 2002-12-19 | 2006-01-18 | 英国电讯有限公司 | 图像搜索 |
CN102419755A (zh) * | 2010-09-28 | 2012-04-18 | 阿里巴巴集团控股有限公司 | 一种搜索结果的排序方法和装置 |
CN108334644A (zh) * | 2018-03-30 | 2018-07-27 | 百度在线网络技术(北京)有限公司 | 图像识别方法和装置 |
CN108984672A (zh) * | 2018-06-29 | 2018-12-11 | 努比亚技术有限公司 | 图片查找方法、终端及计算机可读存储介质 |
CN110211112A (zh) * | 2019-05-31 | 2019-09-06 | 华中科技大学 | 一种基于过滤选择性搜索的铸缺陷检测方法 |
CN110674400A (zh) * | 2019-09-18 | 2020-01-10 | 北京字节跳动网络技术有限公司 | 排序方法、装置、电子设备及计算机可读存储介质 |
CN112740202A (zh) * | 2018-11-21 | 2021-04-30 | 谷歌有限责任公司 | 使用内容标签执行图像搜索 |
CN112749333A (zh) * | 2020-07-24 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 资源搜索方法、装置、计算机设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9058611B2 (en) * | 2011-03-17 | 2015-06-16 | Xerox Corporation | System and method for advertising using image search and classification |
-
2021
- 2021-06-04 CN CN202110628560.1A patent/CN113220922B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1723456A (zh) * | 2002-12-19 | 2006-01-18 | 英国电讯有限公司 | 图像搜索 |
CN102419755A (zh) * | 2010-09-28 | 2012-04-18 | 阿里巴巴集团控股有限公司 | 一种搜索结果的排序方法和装置 |
CN108334644A (zh) * | 2018-03-30 | 2018-07-27 | 百度在线网络技术(北京)有限公司 | 图像识别方法和装置 |
CN108984672A (zh) * | 2018-06-29 | 2018-12-11 | 努比亚技术有限公司 | 图片查找方法、终端及计算机可读存储介质 |
CN112740202A (zh) * | 2018-11-21 | 2021-04-30 | 谷歌有限责任公司 | 使用内容标签执行图像搜索 |
CN110211112A (zh) * | 2019-05-31 | 2019-09-06 | 华中科技大学 | 一种基于过滤选择性搜索的铸缺陷检测方法 |
CN110674400A (zh) * | 2019-09-18 | 2020-01-10 | 北京字节跳动网络技术有限公司 | 排序方法、装置、电子设备及计算机可读存储介质 |
CN112749333A (zh) * | 2020-07-24 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 资源搜索方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
Learning to Personalize Trending Image Search Suggestion;Chun-Che Wu;《ACM》;第[1]-[11]页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113220922A (zh) | 2021-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110619078B (zh) | 用于推送信息的方法和装置 | |
CN112650841A (zh) | 信息处理方法、装置和电子设备 | |
CN111461967B (zh) | 图片处理方法、装置、设备和计算机可读介质 | |
CN109902726B (zh) | 简历信息处理方法及装置 | |
CN113220922B (zh) | 图像搜索方法、装置和电子设备 | |
CN112241761B (zh) | 模型训练方法、装置和电子设备 | |
CN111026849A (zh) | 数据处理方法和装置 | |
CN116072108A (zh) | 模型生成方法、语音识别方法、装置、介质及设备 | |
CN113033552B (zh) | 文本识别方法、装置和电子设备 | |
CN111680754B (zh) | 图像分类方法、装置、电子设备及计算机可读存储介质 | |
CN113592607A (zh) | 产品推荐方法、装置、存储介质及电子设备 | |
CN116416018A (zh) | 内容输出方法、装置、计算机可读介质及电子设备 | |
CN111368204A (zh) | 内容推送方法、装置、电子设备及计算机可读介质 | |
CN113191257A (zh) | 笔顺检测方法、装置和电子设备 | |
CN113283115B (zh) | 图像模型生成方法、装置和电子设备 | |
CN111797263A (zh) | 图像标签生成方法、装置、设备和计算机可读介质 | |
CN111563797A (zh) | 房源信息的处理方法、装置、可读介质及电子设备 | |
CN112214695A (zh) | 信息处理方法、装置和电子设备 | |
CN113177174B (zh) | 特征构建方法、内容显示方法及相关装置 | |
CN112860999B (zh) | 信息推荐方法、装置、设备和存储介质 | |
CN112766285B (zh) | 图像样本生成方法、装置和电子设备 | |
CN114625876B (zh) | 作者特征模型的生成方法、作者信息处理方法和装置 | |
CN111581305B (zh) | 特征处理方法、装置、电子设备和介质 | |
CN112948108B (zh) | 请求处理方法、装置和电子设备 | |
CN115964566A (zh) | 内容推荐方法、装置、介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |