CN111027622A - 图片标签生成方法、装置、计算机设备及存储介质 - Google Patents

图片标签生成方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111027622A
CN111027622A CN201911252540.8A CN201911252540A CN111027622A CN 111027622 A CN111027622 A CN 111027622A CN 201911252540 A CN201911252540 A CN 201911252540A CN 111027622 A CN111027622 A CN 111027622A
Authority
CN
China
Prior art keywords
label
picture
scene
tag
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911252540.8A
Other languages
English (en)
Other versions
CN111027622B (zh
Inventor
朱圣晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201911252540.8A priority Critical patent/CN111027622B/zh
Publication of CN111027622A publication Critical patent/CN111027622A/zh
Application granted granted Critical
Publication of CN111027622B publication Critical patent/CN111027622B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种图片标签生成方法、装置、计算机设备及存储介质。属于图片处理技术领域。所述方法由终端执行,所述方法包括:获取待分类的目标图片;通过场景分类模型对目标图片进行处理,获得目标图片的场景标签;通过对象分类模型对目标图片进行处理,获得目标图片中包含各个对象分别对应的对象标签;根据场景标签和对象标签,生成目标图片的图片分类标签。本申请生成目标图片的图片分类标签中包含生成的场景标签和对象标签,通过多种标签对目标图片进行描述,当用户需要查看目标图片时,查询的关键词中包含多个标签中的任何一个便可以查询到目标图片,从而增加了查找目标图片的准确性,提高了用户查找目标图片的效率。

Description

图片标签生成方法、装置、计算机设备及存储介质
技术领域
本申请涉及图片处理技术领域,特别涉及一种图片标签生成方法、装置、计算机设备及存储介质。
背景技术
随着科技的快速发展,终端中可以存储用户拍摄的视频、图片等数据,相应的,用户可以通过终端查看这些视频、图片。
其中,随着用户使用终端的次数越来越多,用户在终端中存储的图片也会越来越多。相关技术中,为了方便用户查看图片,许多终端中都已经提供了图片分类功能,终端可以对用户存储的图片进行识别并标记,生成该图片的图片标签,按照该图片标签对图片进行分类。例如,终端可以将图片识别结果作为图片标签对该图片进行标记,当用户在搜索框中输入关键词后,终端可以根据该关键词搜索到与该关键词相同图片标签的图片,并展示在终端中,从而提高用户查看图片的效率。
对于上述的图片分类方式,如果用户输入的关键词与终端中对图片标记的标签不同时,可能导致图片查找失败,导致用户查看图片的效率较低。
发明内容
本申请实施例提供了一种图片标签生成方法、装置、计算机设备及存储介质,可以提高用户查找图片的效率。所述技术方案如下:
一个方面,本申请实施例提供了一种图片标签生成方法,所述方法由终端执行,所述方法包括:
获取待分类的目标图片;
通过场景分类模型对所述目标图片进行处理,获得所述目标图片的场景标签,所述场景标签用于描述所述目标图片中的场景信息;
通过对象分类模型对所述目标图片进行处理,获得所述目标图片中包含各个对象分别对应的对象标签,所述对象标签用于描述对应的对象;
根据所述场景标签和所述对象标签,生成所述目标图片的图片分类标签。
另一方面,本申请实施例提供了一种图片标签生成装置,所述装置用于终端中,所述装置包括:
图片获取模块,用于获取待分类的目标图片;
场景标签获取模块,用于通过场景分类模型对所述目标图片进行处理,获得所述目标图片的场景标签,所述场景标签用于描述所述目标图片中的场景信息;
对象标签获取模块,用于通过对象分类模型对所述目标图片进行处理,获得所述目标图片中包含各个对象分别对应的对象标签,所述对象标签用于描述对应的对象;
标签生成模块,用于根据所述场景标签和所述对象标签,生成所述目标图片的图片分类标签。
另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包含处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的图片标签生成方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的图片标签生成方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
本申请通过终端获取待分类的目标图片;通过场景分类模型对目标图片进行处理,获得目标图片的场景标签,场景标签用于描述目标图片中的场景信息;通过对象分类模型对目标图片进行处理,获得目标图片中包含各个对象分别对应的对象标签,对象标签用于描述对应的对象;根据场景标签和对象标签,生成目标图片的图片分类标签。即目标图片的图片分类标签中包含生成的场景标签和对象标签,通过多种标签对目标图片进行描述,当用户需要查看目标图片时,查询的关键词中包含多个标签中的任何一个便可以查询到目标图片,从而增加了查找目标图片的准确性,提高了用户查找目标图片的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一示例性实施例提供的一种图片分类方法的方法流程图;
图2是本申请一示例性实施例提供的一种图片分类方法的方法流程图;
图3是本申请一示例性实施例涉及的一种终端的设置界面的界面示意图;
图4是本申请一示例性实施例涉及的一种相册界面的界面示意图;
图5是本申请一示例性实施例涉及的一种目标图片进行识别时的示意图;
图6是本申请一示例性实施例提供的图片标签生成装置的结构框图;
图7是本申请一个示例性实施例提供的终端的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
本申请提供的方案,可以用于人们在日常生活中使用终端时,将图片存储在终端中的现实场景中,为了便于理解,下面首先对本申请实施例涉及的一些名词以及应用场景进行简单介绍。
Top1结果:当存在多个识别结果时,一个维度上获取多个识别结果中识别结果最好的一个识别结果。比如,多个识别结果有各自的识别准确度以及识别效率,根据识别准确度获取多个识别结果中识别结果最好的一个识别结果;或者,根据识别效率获取多个识别结果中识别结果最好的一个识别结果。
TopN结果:当存在N个(N大于等于2)识别结果时,N个识别结果中任意一个识别结果符合要求,将N个识别结果都进行获取。比如,N个识别结果有各自的识别准确度,其中,如果任意一个识别结果的识别准确度高于预设门限值,则将N个识别结果都进行获取。
随着科技的发展,越来越多的终端出现在人们的日常生活中,人们可以通过终端进行工作、娱乐、学习等。其中,用户可以在终端中存储图片,并在想要查看这些图片时,利用终端进行查看。比如,终端中拥有的相册应用可以对图片进行查看,用户可以选择相应的图片在终端中展示。目前,大多数终端中的相册应用也会提供有图片搜索功能,即,通过用户输入关键词来搜索图片。这一功能的实现首先依赖于对图片的分类能力,对图片进行分类后,将分类结果以标签的形式与图片关联,用户可以通过搜索标签来搜索对应的图片。
可选的,上述终端是具有图片分类功能的终端。比如,该终端可以是手机、平板电脑、电子书阅读器、智能眼镜、智能手表、MP4(Moving Picture Experts Group AudioLayer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑、膝上型便携计算机和台式计算机等等。
其中,终端可以对自身存储的图片进行分类。比如,终端中可以预先设置有图片分类模型,当终端中存储某个图片时,终端可以利用自身的图片分类模型对图片进行分类。相关技术中,终端采用的图片分类模型,对于每张图片进行分类时,大多数是得到一个分类结果,即,一张图片与该图片的分类结果是一一对应的。比如,终端对图片进行分类时,可以按照该图片整体的场景进行分类,比如:对于某个展示卧室的图片,通过图片分类模型进行识别后,可能得到“室内”的分类结果,那么终端可以根据该分类结果,将“室内”作为该图片的标签,与该图片关联起来,从而将该图片归为“室内”的类别中。当用户需要查看该图片时,用户可以通过输入“室内”关键词,在相册应用中进行搜索,从而找到该图片。
对于上述的图片分类方式,处于“室内”类别的图片还可能包含其他类型的特征,比如“床”、“衣柜”等特征,或者,该“室内”的类型也可以用“屋内”代替,如果用户按照自身对图片的描述进行搜索,可能使用“床”、“衣柜”、“屋内”等关键词进行搜索,此时终端则并不会显示出该图片,造成用户查找图片失败,降低用户查找该图片的效率等问题。
为了提高用户查找图片的效率,本申请提供了一种解决方案,可以实现在用户输入的关键词不是终端通过图片分类模型得到的分类结果时,也查找出用户想要查找的图片。请参考图1,其示出了本申请一示例性实施例提供的一种图片分类方法的方法流程图。该方法可以由上述具有图片分类功能的终端执行。如图1所示,该图片标签生成方法可以包括以下几个步骤:
步骤101,获取待分类的目标图片。
其中,待分类的目标图片可以是终端中已经存储的、未分类过的图片。比如,用户使用终端下载了一张图片,此时该图片可以是待分类的目标图片,或者,用户使用终端拍摄了一张图片,此时该图片也可以是待分类的目标图片。或者,用户使用终端进行了截屏操作得到了截图,该截图也可以是待分类的目标图片。相应的,终端下载图片后,或者,终端拍摄图片后,或者,终端截屏后,均可以视为终端获取到了待分类的目标图片。
步骤102,通过场景分类模型对目标图片进行处理,获得目标图片的场景标签,场景标签用于描述目标图片中的场景信息。
其中,场景信息可以指目标图片所展示出的场景,比如,对于某个待分类的目标图片,其展示出的场景可能是“室内”、“床边”、“机舱”等信息,终端可以通过场景分类模型对待分类的目标图片进行分析、识别等处理,获取该待分类的目标图片的场景信息,并将得到的场景信息作为该待分类的目标图片的场景标签。可选的,场景分类模型可以预先由运维人员或者程序开发成员训练后设置在终端中的。
在一种可能实现的方式中,该场景分类模型可以按照一定数量的图片以及各个图片对应的场景标签(可以是人为设置的一个或者多个标签)进行训练的机器学习模型,当对该场景分类模型输入一个图片后,该场景分类模型可以输出该图片对应的场景标签。可选的,该场景分类模型输出的场景标签可以是一个也可以是多个。
步骤103,通过对象分类模型对目标图片进行处理,获得目标图片中包含各个对象分别对应的对象标签,对象标签用于描述对应的对象。
其中,一张目标图片中可能包含有多个物体,本申请实施例中,终端还可以将待分类的目标图片输入至对象分类模型中,通过该对象分类模型对目标图片进行分析、识别等处理,获取目标图片中各个物体的对象标签。比如,一张目标图片中包含有“树”、“狗”、“草”等物体,终端可以通过该对象分类模型从该目标图片中获取到该目标图片的各个物体的名称信息,将得到的名称信息均作为该目标图片的对象标签。即,上述举例中的待分类的目标图片的对象标签可以是“树”、“狗”、“草”等。可选的,该对象分类模型也可以预先由运维人员或者程序开发成员训练后设置在终端中的。
在一种可能实现的方式中,该对象分类模型也可以按照一定数量的图片以及各个图片对应的场景标签(可以是人为设置的一个或者多个标签)进行训练的机器学习模型,当对该对象分类模型输入一个图片后,该对象分类模型可以输出该图片对应的对象标签。可选的,该对象分类模型输出的对象标签可以是一个也可以是多个。
步骤104,根据场景标签和对象标签,生成目标图片的图片分类标签。
可选的,终端可以将上述获取到的场景标签以及对象标签分别与该待分类的目标图片进行关联,从而可以利用场景标签以及对象标签共同对该目标图片进行描述。即,该目标图片属于场景标签对应的类别,也属于对象标签对应的类别,当用户输入的关键词与图片分类标签中的任何一个标签匹配时,都可以得到该目标图片。
综上所述,本申请通过终端获取待分类的目标图片;通过场景分类模型对目标图片进行处理,获得目标图片的场景标签,场景标签用于描述目标图片中的场景信息;通过对象分类模型对目标图片进行处理,获得目标图片中包含各个对象分别对应的对象标签,对象标签用于描述对应的对象;根据场景标签和对象标签,生成目标图片的图片分类标签。即目标图片的图片分类标签中包含生成的场景标签和对象标签,通过多种标签对目标图片进行描述,当用户需要查看目标图片时,查询的关键词中包含多个标签中的任何一个便可以查询到目标图片,从而增加了查找目标图片的准确性,提高了用户查找目标图片的效率。
在一种可能实现的方式中,为了提高对目标图片的查询效率,增加目标图片的图片分类标签的准确度,本申请实施例还提供了一种图片标签生成方法。当上述终端通过对象分类模型对目标图片进行处理,获得目标图片中包含各个对象分别对应的对象标签后,终端还可以对获取到的对象标签进行同级扩展以及父级扩展,增加目标图片的标签数量。下面以终端对上述对象标签进行同级扩展和父级扩展为例,对上述图1所示的方案进行介绍。
请参考图2,其示出了本申请一示例性实施例提供的一种图片标签生成方法的方法流程图。该方法可以由上述具有图片分类功能的终端执行。如图2所示,该图片标签生成方法可以包括以下几个步骤:
步骤201,获取待分类的目标图片。
其中,终端可以对本地存储的未分类的图片主动执行图片分类,也就是说,终端检测到有未分类的图片时,比如,通过图像采集组件新拍摄获得一张未分类的图片时,将该未分类的图片获取为待分类的目标图片。
可选的,上述终端可以提供图片分类功能,当用户激活该功能后,终端可以主动获取终端中存储的未分类的图片,此时获取到的每个图片都可以是目标图片。例如,终端在设置应用中提供有激活该图片分类功能对应的图片分类控件,用户可以通过点击该图片分类控件,激活或者关闭终端中的图片分类功能,当用户激活图片分类功能后,终端可以获取相册应用中待分类的各个图片。请参考图3,其示出了本申请一示例性实施例涉及的一种终端的设置界面的界面示意图。如图3所示,在设置界面300中包含了图片分类框301,开关控件302,用户可以点击该开关控件302,激活或者关闭图片分类功能,可选的,在用户激活图片分类功能后,当用户使用终端存储一张图片时(比如,拍摄了一张图片,下载了一张图片等),终端便可以获取到该图片,将该图片作为待分类的目标图片。
在一种可能实现的方式中,用户也可以选择终端中存储的图片,对选择的图片进行编辑(其中,包括对选择的图片生成图片分类标签等),从而使得终端获取到用户选择的图片,将选择的图片作为待分类的目标图片。请参考图4,其示出了本申请一示例性实施例涉及的一种相册界面的界面示意图。如图4所示,在终端界面400中,包含了各个选择的图片401,图片分类控件402,用户可以点击其中的图片分类控件402,对选择的图片进行图片分类,此时终端可以将用户选择的图片作为待分类的目标图片。本申请实施例对于上述如何获取到待分类的目标图片的方式并不加以限定。
步骤202,通过场景分类模型对目标图片进行处理,获得目标图片的场景标签,场景标签用于描述目标图片中的场景信息。
可选的,终端中提前设置有场景分类模型,当终端获取到待分类的目标图片之后,终端可以将该目标图片输入至场景分类模型中,通过该场景分类模型获取目标场景的场景标签。在一种可能实现的方式中,终端也可以将待分类的目标图片发送给具有场景分类模型的其它计算机设备,并接收其它计算机设备返回的场景标签,也可以获得目标图片的场景标签。
比如,图片一展示的场景是“海边”,当终端获取到待分类的目标图片是该图片一后,终端可以通过场景分类模型对图片一进行分析识别,得到该图片一对应的场景信息——“海边”,将“海边”作为该图片一的场景标签。
可选的,上述场景分类模型在得到场景标签时,还可以得到该场景标签对应的置信度,表示此次对图片一的识别准确度。即,在一种可能实现的方式中,终端通过场景分类模型对目标图片进行处理,获得第一场景标签以及第一置信度,第一置信度是第一场景标签的置信度。比如,仍以上述待分类的目标图片是图片一为例,终端通过场景分类模型可以得到“海边”这个场景标签,以及“海边”对应的识别准确度(比如,90%),终端可以利用得到的场景标签以及识别准确度对该场景标签进行筛选,确定是否将该场景标签作为该图片一的场景标签。
可选的,终端中可以预先设置有第一阈值,该第一阈值是用于对上述场景标签进行筛选的,当终端得到某个目标图片的场景标签以及对应的置信度时,终端可以根据该第一阈值对得到的场景标签进行筛选。在一种可能实现的方式中,当第一置信度高于第一阈值时,将第一场景标签获取为场景标签。比如,终端该设置的第一阈值为85%,当终端得到某个场景标签的置信度高于85%时,终端可以将该场景标签获取为对应的目标图片的场景标签。
其中,上述场景标签的置信度可以是场景分类模型对目标图片进行处理时,对应场景标签输出的置信度。可选的。该置信度表示目标图像与输出的场景标签相对应的概率。
例如,终端中对图片一通过上述场景分类模型后,得到该图片一对应的“海边”场景标签以及对应的置信度90%,那么终端可以将该“海边”场景标签的置信度90%与第一阈值85%进行比较,得知图片一的“海边”场景标签的置信度是高于第一阈值的,终端可以将“海边”作为该图片一的场景标签。相反的,如果终端得到该图片一的“海边”场景标签对应的置信度是80%,则终端并不会将“海边”作为该图片一的场景标签。
可选的,场景分类模型对某个图片进行分析识别后,得到的场景标签可能存在多个,终端也可以得到多个场景标签。比如,以上述待分类的目标图片是图片二为例,终端通过场景分类模型可以得到“海边”、“天空”、“大海”三个场景标签,以及“海边”、“天空”、“大海”三个场景标签各自对应的识别准确度90%,80%,88%,终端也可以对得到的各个场景标签分别进行筛选,得到符合条件的“海边”、“大海”这两个场景标签,终端可以将“海边”、“大海”这两个标签都作为该图片一的场景标签。可选的,如果终端得到的各个场景标签对应的置信度均低于第一阈值,则该图片也可以没有场景标签。可选的,本申请实施例中,场景标签的获取也可以采用Top1结果,即,从场景分类模型得到的多个场景标签中,取其中置信度最高的一个场景标签作为目标图片的场景标签,本申请实施例对此并不加以限定。
可选的,终端在得到目标图片的场景标签后,还可以对该目标图片的场景标签进行扩展,获取场景标签的同级标签。其中,该场景标签的同级标签与该场景标签描述的场景信息相同,且表述方式不同的标签。比如,终端可以根据该图片的场景标签获取多个可以描述该图片场景的场景标签,对于上述图片一来说,如果得到的场景标签是“大海”,终端可以根据该场景标签得到其他描述与场景标签“大海”相同的,表述方式不同的标签为“海”、“海洋”、“海水”、“大洋”等标签,并将得到的多个场景标签都作为该目标图片的场景标签。
可选的,终端还可以将“海”、“海洋”、“海水”、“大洋”等场景标签的置信度设置与“大海”的相同。例如,大海的置信度为90%,终端通过上述方式获取到“海”、“海洋”、“海水”、“大洋”等其他多个场景标签时,将此次获取的多个场景标签的置信度也设置为90%。如果以“大海(0.9)”的形式表示图片一的场景标签,那么,在得到多个场景标签后,图片一的场景标签可以表示为:大海(0.9)、海(0.9)、海洋(0.9)、海水(0.9)、大洋(0.9)。
步骤203,通过对象分类模型对目标图片进行处理,获得目标图片中包含各个对象分别对应的对象标签,对象标签用于描述对应的对象。
可选的,该对象分类模型也可以是终端中预先设置好的,当终端获取到待分类的目标图片之后,终端可以将该目标图片输入至对象分类模型中,通过该对象分类模型获取目标图片中各个对象各自的对象标签。在一种可能实现的方式中,终端也可以将待分类的目标图片发送给具有对象分类模型的其它计算机设备,并接收其它计算机设备返回的对象标签,也可以获得目标图片中各个对象各自的对象标签。本申请实施例对此并不加以限定。
比如,图片一中包含的各个对象分别是“大海”、“狗”、“人”、“船”,当终端获取到待分类的目标图片是该图片一后,终端可以通过对象分类模型对图片一进行分析识别,得到用于描述该图片一包含的各个对象对应的对象标签——“大海”、“狗”、“人”、“船”,将“大海”、“狗”、“人”、“船”作为该图片一的对象标签。
可选的,终端可以通过对象分类模型对目标图片进行处理,获得对象标签集合,对象标签集合是各个对象分别对应的对象标签组成的集合,对象标签集合中还包含各个对象分别对应的对象标签的置信度;当第一对象标签的置信度高于第二阈值时,将第一对象标签获取为第一标签集合,第一对象标签是对象标签集合中的任意一个对象标签;将第一标签集合中包含的各个对象标签均获取为对象标签。
其中,上述对象标签的置信度可以是对象分类模型对目标图片进行处理时,对应对象标签输出的置信度。可选的。该置信度表示输出的对象标签与该目标图片中的对象相对应的概率。
在一种可能实现的方式中,对于上述对象分类模型在识别目标图片的过程中,对象分类模型可以按照各个对象对目标图片进行分割,得到多个识别区域,获取各个识别区域中包含的单独对象的识别结果,进而得到多个识别结果。比如,请参考图5,其示出了本申请一示例性实施例涉及的一种目标图片进行识别时的示意图。如图5所示,在目标图片500中包含了多个识别区域501。其中,多个识别区域501可以是对象分类模型对目标图片进行划分生成的,对象分类模型可以根据对目标图片的划分结果,对各个识别区域中的对象进行识别,得到描述各个识别区域各自的对象标签。例如,以目标图图片是上述的图片一为例,对象分类模型可以将图片一分割为4个识别区域,并对各个识别区域进行识别,得到“大海”、“狗”、“人”、“船”4个对象标签。其中,该4个对象标签组成的集合便是对象标签集合。
可选的,对象分类标签在得到各个识别区域的对象标签时,还可以得到各个对象标签的置信度。比如,对象分类模型得到“大海”、“狗”、“人”、“船”4个对象标签时,也得到有这4个对象标签各自的置信度:85%、95%、90%、80%。
可选的,终端中可以预先设置有第二阈值,该第二阈值是用于对上述对象标签进行筛选的,当终端得到某个目标图片的对象标签以及对应的置信度时,终端可以根据该第二阈值对得到的对象标签进行筛选。在一种可能实现的方式中,当第一对象标签的置信度高于第二阈值时,将第一对象标签添加至第一标签集合中。比如,终端该设置的第二阈值为88%,当对象分类模型得到的目标图片的多个对象标签中任意一个对象标签的置信度高于88%时,终端可以将该对象标签添加至第一标签集合中。例如,对于上述对象分类模型得到图片一的“大海”、“狗”、“人”、“船”这4个对象标签,终端可以按照第二阈值对这4个对象标签进行筛选,将其中高于第二阈值的对象标签添加至第一标签集合中。如果这4个对象标签各自的置信度分别为:85%、95%、90%、80%。那么,第一标签集合中的对象标签是“狗”、“人”。
可选的,终端将第一标签集合中的各个对象标签均获取为目标图片的对象标签。即,如果目标图片是该图片一,则终端获取的对象标签分别为狗(0.95),人(0.9)。可选的,本申请实施例中,对象标签的获取也可以采用Top1结果,即,从对象分类模型得到的多个对象标签中,取其中置信度最高的一个对象标签作为目标图片的对象标签,本申请实施例对此并不加以限定。
可选的,终端在将第一标签集合中的各个对象标签均获取为目标图片的对象标签之前,还可以检测第一标签集合中是否存在相同名称的对象标签;当第一标签集合中存在相同名称的对象标签时,按照相同名称的对象标签各自的置信度,对相同名称的对象标签进行去重处理。
例如,如果对象分类模型对上述图片一的进行识别,得到的对象标签中包含狗(0.95),狗(0.92)两个名称相同的对象标签,这两个对象标签也都可以通过上述第二阈值的筛选,存在于第一标签集合中,此时终端可以依次检测第一标签集合中每个对象标签是否存在有其他相同名称的对象标签,当终端检测到时,可以将其中置信度最高的对象标签保留,将其他相同名称的对象标签剔除。即,对于上述狗(0.95),狗(0.92)两个名称相同的对象标签,终端可以将狗(0.95)这个对象标签保留在第一标签集合中,将狗(0.92)这个对象标签从第一标签集合中剔除。
步骤204,获取对象标签的同级标签,同级标签是与对象标签描述的对象相同,且表述方式不同的标签。
可选的,终端可以对获取到的目标图片的对象标签进行语义解析,获取与对象标签表示相同语义的目标词语;将包含目标词语的标签作为对象标签的同级标签。例如,仍以目标图片是图片一为例,当终端将第一标签集合中的各个对象标签获取为图片一的对象标签后,得到图片一的对象标签分别是狗(0.95),人(0.9)。终端可以对各个对象标签进行语义解析,获取与各个对象标签表示相同语义的目标词语,比如,终端可以对“狗(0.95)”这个对象标签进行语义解析,获取与各个对象标签表示相同语义的目标词语为:狗狗、小狗、汪星人,将包含目标词语的标签作为对象标签的同级标签,并将“狗(0.95)”这个对象标签的置信度获取为各个同级标签的置信度,即得到狗狗(0.95)、小狗(0.95)、汪星人(0.95)多个同级标签。相应的,对于对象标签人(0.9),终端也可以做类似的步骤,此处不再赘述。
在一种可能实现的方式中,终端也可以提前设置有标签库,该标签库中存储有各个同级标签,终端可以通过查询标签库中与对象标签相同的目标标签;将标签库中与目标标签同级的其它标签获取为该对象标签的同级标签。请参考表1,其示出了申请实施例涉及的一种标签库的结构示意表。
同级标签一 狗,狗狗,小狗,汪星人
同级标签二 猫,咪咪,小猫,喵星人
同级标签三 草,绿草,小草
…… ……
表1
如表1所示,其中包含了各个同级标签。当终端获取到上述图片一的对象标签包含狗(0.95)这一对象标签时,终端也可以查询到表一中的目标标签“狗”,并获取与狗处于同一级别的其他标签,将其它标签获取为该对象标签的同级标签。
步骤205,获取对象标签的父级标签,父级标签是用于指示对象标签描述的物体所属类别的标签;
可选的,终端可以对获取到的目标图片的对象标签进行语义解析,获取对象标签所属的类别名称;将类别名称获取为对象标签的父级标签。例如,仍以目标图片是图片一为例,当终端将第一标签集合中的各个对象标签获取为图片一的对象标签后,得到图片一的对象标签分别是狗(0.95),人(0.9)。终端可以对各个对象标签进行语义解析,获取对象标签所属的类别名称,比如,终端可以对“狗(0.95)”这个对象标签进行语义解析,获取该对象标签所属的类别名称为:宠物、动物、犬类,相应的,终端可以将获取的对象标签所属的类别名称作为对象标签的父级标签,并将“狗(0.95)”这个对象标签的置信度获取为各个父级标签的置信度,即得到宠物(0.95)、动物(0.95)、犬类(0.95)多个父级标签。相应的,对于对象标签人(0.9),终端也可以做类似的步骤,此处不再赘述。
在一种可能实现的方式中,终端在上述设置的标签库中还包含有各个同级标签对应的父级标签,终端可以通过查询标签库中与对象标签相同的目标标签;将标签库中目标标签对应的父级标签获取为该对象标签的父级标签。请参考表2,其示出了申请实施例涉及的一种标签库的结构示意表。
Figure BDA0002309428630000131
表2
如表2所示,其中包含了各个同级标签以及各个父级标签。当终端获取到上述图片一的对象标签包含狗(0.95)这一对象标签时,终端也可以查询到表一中的目标标签“狗”,并获取狗的父级标签,将标签库中的父级标签获取为该对象标签的父级标签。
步骤206,将场景标签、对象标签、同级标签以及父级标签,作为目标图片的图片分类标签。
可选的,对于一个目标图片,终端可以将获取到的该目标图片的场景标签、对象标签、同级标签以及父级标签作为目标图片的图片分类标签,利用场景标签、对象标签、同级标签以及父级标签将该目标图片进行分类。例如,对于上述图片一,终端获取到的场景标签为大海(0.9),海洋(0.9),终端获取到的对象标签为狗(0.95),树(0.92),终端获取到的同级标签为狗狗(0.95),汪星人(0.95),大树(0.92),终端获取到的父级标签为宠物(0.95),植物(0.92)。那么,对于图片一来说,这些标签都作为描述图片一,终端可以按照各个标签对图片一进行归类等。
可选的,终端还可以根据场景标签、对象标签、同级标签以及父级标签构建标签库;即,终端可以将上述得到的标签进行统计,得到标签库,从而根据标签库获取父级标签、同级标签。即,上述步骤204可以变为将标签库中与对象标签同级的其它标签获取为同级标签。上述步骤205可以变为将标签库中的目标标签获取为父级标签,目标标签是标签库中与对象标签具有父级关系的标签。可选的,对应上述终端中设置有标签库的实现方式,终端可以按照周期对该标签库进行更新,将标签库中没有的标签添加至标签库中。
可选的,当用户需要查找目标图片时,用户可以输入关键词,相应的,终端可以接收输入的关键词;将关键词分别与场景标签以及对象标签进行匹配;将匹配到场景标签以及对象标签各自对应的图片进行展示。相应的,如果终端对对象标签进行了同级扩展和父级扩展,终端也可以将关键词分别与场景标签、对象标签、同级标签以及父级标签进行匹配,将匹配到场景标签以及对象标签各自对应的图片进行展示。比如,对于上述图片一,终端获取到的场景标签为大海(0.9),海洋(0.9),终端获取到的对象标签为狗(0.95),树(0.92),终端获取到的同级标签为狗狗(0.95),汪星人(0.95),大树(0.92),终端获取到的父级标签为宠物(0.95),植物(0.92)。用户如果想要查找狗的图片,也还可以输入“汪星人”、“狗狗”等关键词,也可以查找到目标图片。如果用户凭借自身对图片一的记忆,输入关键词“大海”,终端也可以查找到图片一。
可选的,终端可以对查找到的图片按照标签的置信度排序展示。例如,用户输入关键词“狗”,当图片一的图片分类标签中包含对象标签狗(0.95),图片二的图片分类标签中包含对象标签狗(0.9),终端可以按照图片一、图片二的顺序进行展示。
在一种可能实现的方式中,终端还可以将场景标签与对象标签进行组合,生成句式标签,句式标签用于描述目标图片的语句;并将场景标签,对象标签以及句式标签,作为目标图片的图片分类标签。例如,对于上述图片一,终端获取到的场景标签为大海(0.9),海洋(0.9),终端获取到的对象标签为狗(0.95),树(0.92),终端获取到的同级标签为狗狗(0.95),汪星人(0.95),大树(0.92),终端获取到的父级标签为宠物(0.95),植物(0.92)。此时,终端还可以将场景标签“大海”与对象标签“狗狗”进行组合,得到一个句式标签,例如:“大海中的狗狗”;或者,终端将场景标签“海洋”与对象标签“宠物”进行组合,得到一个句式标签,例如:“海洋中游泳的宠物”等等;或者,终端将场景标签“大海”与对象标签“植物”进行组合,得到一个句式标签,例如:“大海边上的植物”等等。当终端获取到多个对象标签和场景标签后,可以将各个标签组合为句式标签,并将这些句式标签也作为描述图片一的类别之一的标签,即,终端可以将场景标签,对象标签以及生成的句式标签,分别作为图片一的图片分类标签。
综上所述,本申请通过终端获取待分类的目标图片;通过场景分类模型对目标图片进行处理,获得目标图片的场景标签,场景标签用于描述目标图片中的场景信息;通过对象分类模型对目标图片进行处理,获得目标图片中包含各个对象分别对应的对象标签,对象标签用于描述对应的对象;根据场景标签和对象标签,生成目标图片的图片分类标签。即目标图片的图片分类标签中包含生成的场景标签和对象标签,通过多种标签对目标图片进行描述,当用户需要查看目标图片时,查询的关键词中包含多个标签中的任何一个便可以查询到目标图片,从而增加了查找目标图片的准确性,提高了用户查找目标图片的效率。
另外,终端将生成的句式标签作为目标图片的图片分类标签之一,当用户输入某个语句形式的关键词时,终端也可以获取与语句具有相同语义的句式标签,获取该句式标签对应的目标图片,避免了终端从用户输入的语句中解析关键词,根据关键词获取对应的场景标签或者对象标签的步骤,提高了搜索目标图片的效率。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图6,其示出了本申请一示例性实施例提供的图片标签生成装置的结构框图。该图片标签生成装置可以用于上述终端中,以执行图1或者图2所示实施例提供的方法中由终端执行的全部或者部分步骤。该图片标签生成装置600可以包括:图片获取模块601,场景标签获取模块602,对象标签获取模块603以及标签生成模块604。
所述图片获取模块601,用于获取待分类的目标图片;
所述场景标签获取模块602,用于通过场景分类模型对所述目标图片进行处理,获得所述目标图片的场景标签,所述场景标签用于描述所述目标图片中的场景信息;
所述对象标签获取模块603,用于通过对象分类模型对所述目标图片进行处理,获得所述目标图片中包含各个对象分别对应的对象标签,所述对象标签用于描述对应的对象;
所述标签生成模块604,用于根据所述场景标签和所述对象标签,生成所述目标图片的图片分类标签。
综上所述,本申请通过终端获取待分类的目标图片;通过场景分类模型对目标图片进行处理,获得目标图片的场景标签,场景标签用于描述目标图片中的场景信息;通过对象分类模型对目标图片进行处理,获得目标图片中包含各个对象分别对应的对象标签,对象标签用于描述对应的对象;根据场景标签和对象标签,生成目标图片的图片分类标签。即目标图片的图片分类标签中包含生成的场景标签和对象标签,通过多种标签对目标图片进行描述,当用户需要查看目标图片时,查询的关键词中包含多个标签中的任何一个便可以查询到目标图片,从而增加了查找目标图片的准确性,提高了用户查找目标图片的效率。
可选的,所述标签生成模块604,包括:第一获取单元,第二获取单元以及第一标签生成单元;
所述第一获取单元,用于获取所述对象标签的同级标签,所述同级标签是与所述对象标签描述的对象相同,且表述方式不同的标签;
所述第二获取单元,用于获取所述对象标签的父级标签,所述父级标签是用于指示所述对象标签描述的物体所属类别的标签;
所述第一标签生成单元,用于将所述场景标签、所述对象标签、所述同级标签以及所述父级标签,作为所述目标图片的图片分类标签。
可选的,所述第一获取单元,用于,
对所述对象标签进行语义解析,获取与所述对象标签表示相同语义的目标词语;
将包含所述目标词语的标签作为所述对象标签的同级标签。
可选的,所述第二获取单元,用于,
对所述对象标签进行语义解析,获取所述对象标签所属的类别名称;
将所述类别名称获取为所述对象标签的父级标签。
可选的,所述场景标签获取模块602,包括:第三获取单元和第四获取单元;
所述第三获取单元,用于通过所述场景分类模型对所述目标图片进行处理,获得所述第一场景标签以及第一置信度,所述第一置信度是所述第一场景标签的置信度;
所述第四获取单元,用于当所述第一置信度高于第一阈值时,将所述第一场景标签获取为所述场景标签。
可选的,所述对象标签获取模块603,包括:集合获取单元,标签添加单元以及第五获取单元;
所述集合获取单元,用于通过所述对象分类模型对所述目标图片进行处理,获得对象标签集合,所述对象标签集合是所述各个对象分别对应的对象标签组成的集合,所述对象标签集合中还包含所述各个对象分别对应的对象标签的置信度;
所述标签添加单元,用于当第一对象标签的置信度高于第二阈值时,将所述第一对象标签获取为第一标签集合,所述第一对象标签是所述对象标签集合中的任意一个对象标签;
所述第五获取单元,用于将所述第一标签集合中包含的各个对象标签均获取为所述对象标签。
可选的,所述装置还包括:检测模块和去重模块;
所述检测模块,用于在所述第五获取单元将所述第一标签集合中包含的各个对象标签均获取为所述对象标签之前,检测所述第一标签集合中是否存在相同名称的对象标签;
所述去重模块,用于当所述第一标签集合中存在相同名称的对象标签时,按照所述相同名称的对象标签各自的置信度,对所述相同名称的对象标签进行去重处理。
可选的,所述标签生成模块604,包括:标签组合单元和第二标签生成单元;
所述标签组合单元,用于将所述场景标签与所述对象标签进行组合,生成句式标签,所述句式标签用于描述所述目标图片的语句;
所述第二标签生成单元,用于将将所述场景标签,所述对象标签以及所述句式标签,作为所述目标图片的图片分类标签。
可选的,所述装置还包括:
构建模块,用于根据所述场景标签、所述对象标签、所述同级标签以及所述父级标签构建标签库;
所述获取所述对象标签的同级标签,包括:
将所述标签库中与所述对象标签同级的其它标签获取为所述同级标签;
所述获取所述对象标签的父级标签,包括:
将所述标签库中的目标标签获取为所述父级标签,所述目标标签是所述标签库中与所述对象标签具有父级关系的标签。
可选的,所述装置还包括:
接收模块,用于接收输入的关键词;
匹配模块,用于将所述关键词分别与所述场景标签以及所述对象标签进行匹配;
展示模块,用于将匹配到所述场景标签以及所述对象标签各自对应的图片进行展示。
请参考图7,其示出了本申请一个示例性实施例提供的终端的结构示意图,如图7所示,该终端包括处理器710、存储器720、显示组件730和传感器组件740,显示组件730用于显示终端中前台运行的程序的界面,传感器组件740用于采集各个传感器数据。所述存储器720中存储有至少一条指令,所述指令由所述处理器710加载并执行以实现如上各个实施例所述的图像识别结果过滤方法中,由终端执行的部分或者全部步骤。
本申请实施例还提供了一种计算机可读介质,该计算机可读介质存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的图片标签生成方法中,由终端执行的全部或部分步骤。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的图片标签生成方法中,由终端执行的全部或部分步骤。
需要说明的是:上述实施例提供的图片标签生成装置在执行上述图片标签生成方法时,仅以上述各实施例进行举例说明,实际程序中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请可选的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (13)

1.一种图片标签生成方法,其特征在于,所述方法由终端执行,所述方法包括:
获取待分类的目标图片;
通过场景分类模型对所述目标图片进行处理,获得所述目标图片的场景标签,所述场景标签用于描述所述目标图片中的场景信息;
通过对象分类模型对所述目标图片进行处理,获得所述目标图片中包含各个对象分别对应的对象标签,所述对象标签用于描述对应的对象;
根据所述场景标签和所述对象标签,生成所述目标图片的图片分类标签。
2.根据权利要求1所述的方法,其特征在于,所述根据所述场景标签和所述分类标签,生成所述目标图片的图片分类标签,包括:
获取所述对象标签的同级标签,所述同级标签是与所述对象标签描述的对象相同,且表述方式不同的标签;
获取所述对象标签的父级标签,所述父级标签是用于指示所述对象标签描述的物体所属类别的标签;
将所述场景标签、所述对象标签、所述同级标签以及所述父级标签,作为所述目标图片的图片分类标签。
3.根据权利要求2所述的方法,其特征在于,所述获取所述对象标签的同级标签,包括:
对所述对象标签进行语义解析,获取与所述对象标签表示相同语义的目标词语;
将包含所述目标词语的标签作为所述对象标签的同级标签。
4.根据权利要求2所述的方法,其特征在于,所述获取所述对象标签的父级标签,包括:
对所述对象标签进行语义解析,获取所述对象标签所属的类别名称;
将所述类别名称获取为所述对象标签的父级标签。
5.根据权利要求1所述的方法,其特征在于,所述通过场景分类模型对所述目标图片进行处理,获得所述目标图片的场景标签,包括:
通过所述场景分类模型对所述目标图片进行处理,获得所述第一场景标签以及第一置信度,所述第一置信度是所述第一场景标签的置信度;
当所述第一置信度高于第一阈值时,将所述第一场景标签获取为所述场景标签。
6.根据权利要求1所述的方法,其特征在于,所述通过对象分类模型对所述目标图片进行处理,获得所述目标图片中包含各个对象分别对应的对象标签,包括:
通过所述对象分类模型对所述目标图片进行处理,获得对象标签集合,所述对象标签集合是所述各个对象分别对应的对象标签组成的集合,所述对象标签集合中还包含所述各个对象分别对应的对象标签的置信度;
当第一对象标签的置信度高于第二阈值时,将所述第一对象标签添加至第一标签集合,所述第一对象标签是所述对象标签集合中的任意一个对象标签;
将所述第一标签集合中包含的各个对象标签均获取为所述对象标签。
7.根据权利要求6所述的方法,其特征在于,在所述将所述第一标签集合中包含的各个对象标签均获取为所述对象标签之前,所述方法还包括:
检测所述第一标签集合中是否存在相同名称的对象标签;
当所述第一标签集合中存在相同名称的对象标签时,按照所述相同名称的对象标签各自的置信度,对所述相同名称的对象标签进行去重处理。
8.根据权利要求1所述的方法,其特征在于,所述根据所述场景标签和所述对象标签,生成所述目标图片的图片分类标签,包括:
将所述场景标签与所述对象标签进行组合,生成句式标签,所述句式标签用于描述所述目标图片的语句;
将所述场景标签,所述对象标签以及所述句式标签,作为所述目标图片的图片分类标签。
9.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据所述场景标签、所述对象标签、所述同级标签以及所述父级标签构建标签库;
所述获取所述对象标签的同级标签,包括:
将所述标签库中与所述对象标签同级的其它标签获取为所述同级标签;
所述获取所述对象标签的父级标签,包括:
将所述标签库中的目标标签获取为所述父级标签,所述目标标签是所述标签库中与所述对象标签具有父级关系的标签。
10.根据权利要求1至9任一所述的方法,其特征在于,所述方法还包括:
接收输入的关键词;
将所述关键词分别与所述场景标签以及所述对象标签进行匹配;
将匹配到所述场景标签以及所述对象标签各自对应的图片进行展示。
11.一种图片标签生成装置,其特征在于,所述装置用于终端中,所述装置包括:
图片获取模块,用于获取待分类的目标图片;
场景标签获取模块,用于通过场景分类模型对所述目标图片进行处理,获得所述目标图片的场景标签,所述场景标签用于描述所述目标图片中的场景信息;
对象标签获取模块,用于通过对象分类模型对所述目标图片进行处理,获得所述目标图片中包含各个对象分别对应的对象标签,所述对象标签用于描述对应的对象;
标签生成模块,用于根据所述场景标签和所述对象标签,生成所述目标图片的图片分类标签。
12.一种计算机设备,其特征在于,所述计算机设备包含处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至10任一所述的图片标签生成方法。
13.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至10任一所述的图片标签生成方法。
CN201911252540.8A 2019-12-09 2019-12-09 图片标签生成方法、装置、计算机设备及存储介质 Active CN111027622B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911252540.8A CN111027622B (zh) 2019-12-09 2019-12-09 图片标签生成方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911252540.8A CN111027622B (zh) 2019-12-09 2019-12-09 图片标签生成方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN111027622A true CN111027622A (zh) 2020-04-17
CN111027622B CN111027622B (zh) 2023-12-08

Family

ID=70205020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911252540.8A Active CN111027622B (zh) 2019-12-09 2019-12-09 图片标签生成方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN111027622B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625674A (zh) * 2020-06-01 2020-09-04 联想(北京)有限公司 一种图片处理方法及装置
CN113505259A (zh) * 2021-06-28 2021-10-15 惠州Tcl云创科技有限公司 基于智能识别的媒体文件标签方法、装置、设备及介质
CN113642595A (zh) * 2020-05-11 2021-11-12 北京金山数字娱乐科技有限公司 一种基于图片的信息提取方法及装置
JP2022126678A (ja) * 2021-08-17 2022-08-30 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 画像を検索するための方法、装置、システム、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120158686A1 (en) * 2010-12-17 2012-06-21 Microsoft Corporation Image Tag Refinement
WO2017054676A1 (zh) * 2015-09-30 2017-04-06 努比亚技术有限公司 图像处理装置、终端和方法
CN108846351A (zh) * 2018-06-08 2018-11-20 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备和计算机可读存储介质
CN109033237A (zh) * 2018-07-04 2018-12-18 奇酷互联网络科技(深圳)有限公司 图片搜索方法、装置、可读存储介质及终端
CN109063562A (zh) * 2018-06-29 2018-12-21 Oppo广东移动通信有限公司 图像处理方法和装置、电子设备、计算机可读存储介质
CN109871460A (zh) * 2019-01-23 2019-06-11 深圳市酷开网络科技有限公司 一种图片查找方法、智能终端及存储介质
CN110083729A (zh) * 2019-04-26 2019-08-02 北京金山数字娱乐科技有限公司 一种图像搜索的方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120158686A1 (en) * 2010-12-17 2012-06-21 Microsoft Corporation Image Tag Refinement
WO2017054676A1 (zh) * 2015-09-30 2017-04-06 努比亚技术有限公司 图像处理装置、终端和方法
CN108846351A (zh) * 2018-06-08 2018-11-20 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备和计算机可读存储介质
CN109063562A (zh) * 2018-06-29 2018-12-21 Oppo广东移动通信有限公司 图像处理方法和装置、电子设备、计算机可读存储介质
CN109033237A (zh) * 2018-07-04 2018-12-18 奇酷互联网络科技(深圳)有限公司 图片搜索方法、装置、可读存储介质及终端
CN109871460A (zh) * 2019-01-23 2019-06-11 深圳市酷开网络科技有限公司 一种图片查找方法、智能终端及存储介质
CN110083729A (zh) * 2019-04-26 2019-08-02 北京金山数字娱乐科技有限公司 一种图像搜索的方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642595A (zh) * 2020-05-11 2021-11-12 北京金山数字娱乐科技有限公司 一种基于图片的信息提取方法及装置
CN111625674A (zh) * 2020-06-01 2020-09-04 联想(北京)有限公司 一种图片处理方法及装置
CN113505259A (zh) * 2021-06-28 2021-10-15 惠州Tcl云创科技有限公司 基于智能识别的媒体文件标签方法、装置、设备及介质
JP2022126678A (ja) * 2021-08-17 2022-08-30 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 画像を検索するための方法、装置、システム、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
JP7393475B2 (ja) 2021-08-17 2023-12-06 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 画像を検索するための方法、装置、システム、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム

Also Published As

Publication number Publication date
CN111027622B (zh) 2023-12-08

Similar Documents

Publication Publication Date Title
US11423076B2 (en) Image similarity-based group browsing
CN111027622B (zh) 图片标签生成方法、装置、计算机设备及存储介质
US9633045B2 (en) Image ranking based on attribute correlation
US9218364B1 (en) Monitoring an any-image labeling engine
Zhang et al. Object class detection: A survey
KR101516712B1 (ko) 의미론적 시각 검색 엔진
CN110245564B (zh) 一种行人检测方法、系统及终端设备
US9037600B1 (en) Any-image labeling engine
CN107003977A (zh) 用于组织存储在移动计算设备上的照片的系统、方法和装置
US10007864B1 (en) Image processing system and method
JP2018169972A (ja) 検索結果による学習が可能な対象検出装置、検出モデル生成装置、プログラム及び方法
Bouchakwa et al. A review on visual content-based and users’ tags-based image annotation: methods and techniques
CN116975340A (zh) 信息检索方法、装置、设备、程序产品及存储介质
CN112015966A (zh) 一种图像搜索方法、装置、电子设备及存储介质
Mathews et al. Choosing basic-level concept names using visual and language context
Raghu et al. Object detection and localization using sparse-FCM and optimization-driven deep convolutional neural network
Juyal et al. Multilabel image classification using the CNN and DC-CNN model on Pascal VOC 2012 dataset
CN114357022A (zh) 一种基于事件关系发现的媒体内容关联挖掘方法
CN113821679A (zh) 一种视频帧定位方法、电子设备及计算机可读存储介质
Meng et al. Enhancing multimedia semantic concept mining and retrieval by incorporating negative correlations
Marasović et al. Person classification from aerial imagery using local convolutional neural network features
CN110580299B (zh) 生成对象的推荐语的配图的方法、系统、设备及存储介质
Kumar et al. A Comprehensive Review of Deep Learning Approaches for Animal Detection on Video Data.
Setia et al. Feature selection for automatic image annotation
CN114863525A (zh) 一种人脸数据集的构建方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant