CN110516099A - 图像处理方法和装置 - Google Patents
图像处理方法和装置 Download PDFInfo
- Publication number
- CN110516099A CN110516099A CN201910794758.XA CN201910794758A CN110516099A CN 110516099 A CN110516099 A CN 110516099A CN 201910794758 A CN201910794758 A CN 201910794758A CN 110516099 A CN110516099 A CN 110516099A
- Authority
- CN
- China
- Prior art keywords
- image
- pairing
- style
- feature
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Abstract
本申请实施例公开了图像处理方法和装置。该方法的一具体实施方式包括:获取目标图像的特征;获取该目标图像的风格,以及在该风格的图像相关信息集合中,查找与该目标图像的特征最相似的特征,其中,该图像相关信息集合包括多组配对图像的特征;将查找到的特征对应的图像的配对图像作为该目标图像的配对图像并输出。本申请实施例能够通过目标图像的风格,查找与目标图像风格一致的配对图像,从而提高了查找配对图像的准确度。并且,本实施例通过多组配对图像的特征,可以对于彼此配对的图像中的任一图像,能够查找到其配对图像,也能够更准确地确定出目标图像的配对图像。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及图像处理方法和装置。
背景技术
在日常生活中,为了表示亲密的关系,用户可以在网络平台上使用配对的图像,比如一部动画片里的男女主人公。
在相关技术中,用户获得这类配对的头像往往比较麻烦,需要用户动手查找或拍摄等等,很难快捷地得到。
发明内容
本申请实施例提出了图像处理方法和装置。
第一方面,本申请实施例提供了一种图像处理方法,包括:获取目标图像的特征;获取目标图像的风格,以及在风格的图像相关信息集合中,查找与目标图像的特征最相似的特征,其中,图像相关信息集合包括多组配对图像的特征;将查找到的特征对应的图像的配对图像作为目标图像的配对图像并输出。
在一些实施例中,获取目标图像的风格,包括:将目标图像输入预先训练的图像风格确定模型,得到从图像风格确定模型输出的目标图像的风格,其中,图像风格确定模型用于表征图像与该图像的风格的对应关系。
在一些实施例中,图像信息集合为索引下的图像相关信息;以及索引通过如下方式建立:获取多组配对图像,将所获取的多组配对图像输入图像风格确定模型,得到多个风格的配对图像;对于每个风格,建立该风格配对图像的图像相关信息的索引,其中,在该风格对应的索引下,包括所获取的多组配对图像中每组配对图像的关联存储的图像相关信息。
在一些实施例中,获取多组配对图像包括:通过预先训练的配对特征提取模型,提取图像集中各个图像的配对特征,其中,配对特征提取模型用于提取图像的配对特征;将图像集中,配对特征的相似度高的每组图像作为配对图像。
在一些实施例中,配对特征提取模型的训练步骤,包括:获取图像对样本以及标注信息,其中,标注信息用于指示图像对样本为配对图像或非配对图像;将图像对样本作为输入,将图像对样本对应的标注信息作为目标输出,训练孪生神经网络,得到配对特征提取模型。
在一些实施例中,图像相关信息还包括图像的配对图像的存储地址,以及在将查找到的特征对应的图像的配对图像作为目标图像的配对图像并输出之前,方法还包括:确定查找到的特征对应的图像的配对图像的存储地址;获取存储地址指示的图像。
在一些实施例中,图像风格确定模型的训练步骤,包括:获取包括多个风格的图像的样本集;将图像作为输入,将该图像的风格作为目标输出,训练初始图像风格确定模型,得到图像风格确定模型。
第二方面,本申请实施例提供了一种图像处理装置,包括:获取单元,被配置成获取目标图像的特征;查找单元,被配置成获取目标图像的风格,以及在风格的图像相关信息集合中,查找与目标图像的特征最相似的特征,其中,图像相关信息集合包括多组配对图像的特征;输出单元,被配置成将查找到的特征对应的图像的配对图像作为目标图像的配对图像并输出。
在一些实施例中,获取单元被配置成:将目标图像输入预先训练的图像风格确定模型,得到从图像风格确定模型输出的目标图像的风格,其中,图像风格确定模型用于表征图像与该图像的风格的对应关系。
在一些实施例中,图像信息集合为索引下的图像相关信息;以及索引通过如下方式建立:获取多组配对图像,将所获取的多组配对图像输入图像风格确定模型,得到多个风格的配对图像;对于每个风格,建立该风格配对图像的图像相关信息的索引,其中,在该风格对应的索引下,包括所获取的多组配对图像中每组配对图像的关联存储的图像相关信息。
在一些实施例中,获取多组配对图像包括:通过预先训练的配对特征提取模型,提取图像集中各个图像的配对特征,其中,配对特征提取模型用于提取图像的配对特征;将图像集中,配对特征的相似度高的每组图像作为配对图像。
在一些实施例中,配对特征提取模型的训练步骤,包括:获取图像对样本以及标注信息,其中,标注信息用于指示图像对样本为配对图像或非配对图像;将图像对样本作为输入,将图像对样本对应的标注信息作为目标输出,训练孪生神经网络,得到配对特征提取模型。
在一些实施例中,图像相关信息还包括图像的配对图像的存储地址,以及装置还包括:确定单元,被配置成在将查找到的特征对应的图像的配对图像作为目标图像的配对图像并输出之前,确定查找到的特征对应的图像的配对图像的存储地址;图像获取单元,被配置成获取存储地址指示的图像。
在一些实施例中,图像风格确定模型的训练步骤,包括:获取包括多个风格的图像的样本集;将图像作为输入,将该图像的风格作为目标输出,训练初始图像风格确定模型,得到图像风格确定模型。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如图像处理方法中任一实施例的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如图像处理方法中任一实施例的方法。
本申请实施例提供的图像处理方案,首先,获取目标图像的特征。之后,获取目标图像的风格,以及在风格的图像相关信息集合中,查找与目标图像的特征最相似的特征,其中,图像相关信息集合包括多组配对图像的特征。最后,将查找到的特征对应的图像的配对图像作为目标图像的配对图像并输出。本申请实施例能够通过目标图像的风格,查找与目标图像风格一致的配对图像,从而提高了查找配对图像的准确度。并且,本实施例通过多组配对图像的特征,可以对于彼此配对的图像中的任一图像,能够查找到其配对图像,也能够更准确地确定出目标图像的配对图像。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的图像处理方法的一个实施例的流程图;
图3是根据本申请的图像处理方法的一个应用场景的示意图;
图4是根据本申请的图像处理方法的又一个实施例的流程图;
图5是根据本申请的图像处理装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的图像处理方法或图像处理装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如图像处理应用、视频类应用、直播应用、即时通信工具、邮箱客户端、社交平台软件等。
这里的终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103提供支持的后台服务器。后台服务器可以对接收到的目标图像等数据进行分析等处理,并将处理结果(例如目标图像的配对图像)反馈给终端设备。
需要说明的是,本申请实施例所提供的图像处理方法可以由服务器105或者终端设备101、102、103(比如终端设备的处理器)执行,相应地,图像处理装置可以设置于服务器105或者终端设备101、102、103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的图像处理方法的一个实施例的流程200。该图像处理方法,包括以下步骤:
步骤201,获取目标图像的特征。
在本实施例中,图像处理方法的执行主体(例如图1所示的服务器或终端设备)可以获取目标图像的特征。具体地,上述执行主体可以从其他电子设备获取到上述特征,或者从本地获取预存的特征。此外,上述执行主体也可以获取目标图像,并提取目标图像的特征,从而获取到目标图像的特征。
在实践中,上述执行主体或者其他电子设备可以利用各种模型提取目标图像的特征,比如,可以采用卷积神经网络或者残差神经网络,此外,还可以采用图像网络(ImageNet)模型或网页人脸(WebFace)模型等等。
步骤202,获取目标图像的风格,以及在风格的图像相关信息集合中,查找与目标图像的特征最相似的特征,其中,图像相关信息集合包括多组配对图像的特征。
在本实施例中,上述执行主体可以获取目标图像的风格。之后,上述执行主体可以在该风格的图像相关信息集合中,查找与目标图像的特征最相似的特征。配对图像指相互匹配的两个图像。图像相关信息是与图像相关的各种信息。具体地,图像相关信息可以包括图像的特征,此外,还可以包括该图像等等。在一条图像相关信息中,可以仅仅包括某图像的特征,而不包括该图像的匹配图像的特征。
在实践中,上述执行主体可以采用多种方式获取目标图像的风格。举例来说,上述执行主体可以直接从本地或者其他电子设备获取已有的上述风格,还可以在本地确定出目标图像的风格,从而获取到上述风格。上述最相似的特征可以指与目标图像的特征的相似度最高的特征。查找到的特征可以是特征的相似度最高的至少一个图像的特征,比如,这里的至少一个图像可以是特征的相似度最高的图像和特征相似度次之的图像。
可选地,在确定相似度的过程中,可以将图像的特征表示于坐标系,两个图像的特征之间的距离越小,这两个图像的相似度越大。上述执行主体可以响应于查找到的特征与目标图像的特征的距离小于预设阈值,确定查找到的特征对应的图像的配对图像为目标图像的配对图像。而如果查找到的特征与目标图像的特征的距离不小于预设阈值,则确定未查找到目标图像的配对图像。
配对图像可以表现为多种形式,比如,两个图像中的人穿着情侣装,两张图像的背景一致,两张图像中的动画人物有配对关系(例如米奇老鼠和米妮老鼠)、两张图像中的人的动作相关联(例如图像中人的胳膊各摆出半个桃心的造型),和/或图像中的内容布局一致或对称。图像的风格可以是多种形式的,比如,彩色动漫、黑白动漫、素描、简笔画、自拍照或风景摆拍照等等。
步骤203,将查找到的特征对应的图像的配对图像作为目标图像的配对图像并输出。
在本实施例中,上述执行主体可以确定查找到的特征对应的图像。将该图像的配对图像作为目标图像的配对图像。并且,上述执行可以输出该配对图像。这里的特征对应的图像,指提取该特征的图像。
具体地,在上述执行主体为终端设备的情况下,上述执行主体的处理器可以向其他部件进行输出,比如向显示器输出。在上述执行主体为服务器的情况下,上述执行主体可以向其他电子设备比如终端设备发送配对图像,从而实现配对图像的输出。
在实践中,上述执行主体可以采用多种方式确定查找到的特征对应的图像的配对图像。比如,在图像相关信息包括图像和图像对应的特征的情况下,上述执行主体可以直接确定查找到的特征对应的图像,并通过预存的图像配对关系,确定该图像的配对图像。
在本实施例的一些可选的实现方式中,图像相关信息还包括图像的配对图像的存储地址,在步骤203之前,上述方法还可以包括:确定查找到的特征对应的图像的配对图像的存储地址;获取存储地址指示的图像。
在这些可选的实现方式中,在图像相关信息包括图像的配对图像的存储地址的情况下,上述执行主体可以确定查找到的特征对应的图像的配对图像的存储地址。并通过确定出的存储地址,获取到存储地址指示的图像。
这些实现方式可以通过图像的配对图像的存储地址,快速而准确地查找到目标图像的配对图像。
继续参见图3,图3是根据本实施例的图像处理方法的应用场景的一个示意图。在图3的应用场景中,执行主体301可以获取目标图像比如图像A的特征302。获取图像A的风格303,比如简笔画风格,以及在简笔画风格的图像相关信息集合中,查找与图像A的特征最相似的特征304,其中,图像相关信息集合包括多组配对图像的特征。将查找到的特征对应的图像的配对图像即图像B作为图像A的配对图像305并输出。
本申请的上述实施例提供的方法能够通过目标图像的风格,查找与目标图像风格一致的配对图像,从而提高了查找配对图像的准确度。并且,本实施例通过多组配对图像的特征,可以对于彼此配对的图像中的任一图像,能够查找到其配对图像,也能够更准确地确定出目标图像的配对图像。
进一步参考图4,其示出了图像处理方法的又一个实施例的流程400。该图像处理方法的流程400,包括以下步骤:
步骤401,获取目标图像的特征。
在本实施例中,图像处理方法的执行主体(例如图1所示的服务器或终端设备)可以获取目标图像的特征。具体地,上述执行主体可以从其他电子设备获取到上述特征,或者从本地获取预存的特征。此外,上述执行主体也可以获取目标图像,并提取目标图像的特征,从而获取到目标图像的特征。
步骤402,将目标图像输入预先训练的图像风格确定模型,得到从图像风格确定模型输出的目标图像的风格,以及在风格的图像相关信息集合中,查找与目标图像的特征最相似的特征,其中,图像风格确定模型用于表征图像与该图像的风格的对应关系,图像相关信息集合包括多组配对图像的特征。
在本实施例中,上述执行主体可以通过图像风格确定模型确定出目标图像的风格。上述执行主体向图像风格确定模型输入图像,从图像风格确定模型则可以输出该图像的风格。
在本实施例的一些可选的实现方式中,上述图像风格确定模型的训练步骤,可以包括:
获取包括多个风格的图像的样本集;将图像作为输入,将该图像的风格作为目标输出,训练初始图像风格确定模型,得到图像风格确定模型。
在这些可选的实现方式中,不同风格的图像可以标注有不同的标号或者数值。上述执行主体或者其他电子设备可以利用初始图像风格确定模型预测出图像的风格,利用预设损失函数确定该预测的风格与标注的风格之间的损失值,并利用该损失值进行训练。
这些实现方式可以利用多个风格的样本进行训练,从而训练得到可以确定不同风格的图像风格确定模型。
在本实施例的一些可选的实现方式中,图像信息集合为索引下的图像相关信息;以及索引通过如下方式建立:获取多组配对图像,将所获取的多组配对图像输入图像风格确定模型,得到多个风格的配对图像;对于每个风格,建立该风格配对图像的图像相关信息的索引,其中,在该风格对应的索引下,包括所获取的多组配对图像中每组配对图像的关联存储的图像相关信息。
在这些可选的实现方式中,图像信息集合可以存储于索引下,上述执行主体或者其他电子设备可以建立上述索引。具体地,上述执行主体或者其他电子设备可以通过图像风格确定模型确定出多组配对图像的风格,并获取这些配对图像的图像相关信息,之后建立索引,以实现将这些配对图像的图像相关信息按照风格进行分类。不同的风格对应不同的索引。
这些实现方式可以按照风格建立索引,从而实现对不同风格的图像相关信息进行分类。这样,通过风格对应的索引,可以更快、更准确地查找到配对图像。
在这些实现方式的一些可选的应用场景中,上述获取多组配对图像,可以包括:通过预先训练的配对特征提取模型,提取图像集中各个图像的配对特征,其中,配对特征提取模型用于提取图像的配对特征;将图像集中,配对特征的相似度高的每组图像作为配对图像。
在这些可选的应用场景中,上述执行主体可以通过配对特征提取模型,提取图像集中各个图像的配对特征。并将配对特征的相似度高的每两个图像作为配对图像。配对特征为图像的指示图像与其他图像是否配对的特征。图像的相似度高可以指,配对特征表示于坐标系的这两个图像,其配对特征的距离小于某预设阈值。此外,配对特征的相似度高还可以指,两个图像的配对特征之间的距离按照从小到大排名,排名靠前的配对特征。
这些应用场景可以利用配对特征提取模型,准确地确定出图像之间是否可以配对,
在这些应用场景的一些可选的情况下,配对特征提取模型的训练步骤,可以包括:获取图像对样本以及标注信息,其中,标注信息用于指示图像对样本为配对图像或非配对图像;将图像对样本作为输入,将图像对样本对应的标注信息作为目标输出,训练孪生神经网络,得到配对特征提取模型。
在这些可选的情况下,上述执行主体或其他电子设备可以利用图像对训练配对特征提取模型。具体地,电子设备可以将图像对中的配对图像作为正样本,将图像对中的非配对图像作为负样本,并利用正样本和负样本进行训练。
这里的孪生神经网络(siamese network)的网络结构中,可以包括各种提取特征的网络,比如残差神经网络或卷积神经网络等等。
这些情况下的执行主体可以通过配对图像和非配对图像进行训练,从而训练出能够准确提取配对特征的配对特征提取模型。
步骤403,将查找到的特征对应的图像的配对图像作为目标图像的配对图像并输出。
在本实施例中,上述执行主体可以确定查找到的特征对应的图像。将该图像的配对图像作为目标图像的配对图像。并且,上述执行可以输出该配对图像。这里的特征对应的图像,指能够提取该特征的图像。
本实施例能够利用风格确定模型确定目标图像的风格,使确定的风格更加准确,从而使查找到的配对图像更加准确。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种图像处理装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的图像处理装置500包括:获取单元501、查找单元502和输出单元503。其中,获取单元501置成获取目标图像的特征;查找单元502配置成获取目标图像的风格,以及在风格的图像相关信息集合中,查找与目标图像的特征最相似的特征,其中,图像相关信息集合包括多组配对图像的特征;输出单元503置成征对应的图像的配对图像作为目标图像的配对图像并输出。
在一些实施例中,图像处理装置500的获取单元501可以从其他电子设备获取到上述特征,或者从本地获取预存的特征。此外,上述执行主体也可以获取目标图像,并提取目标图像的特征,从而获取到目标图像的特征。
在一些实施例中,查找单元502可以获取目标图像的风格。之后,上述执行主体可以在该风格的图像相关信息集合中,查找与目标图像的特征最相似的特征。配对图像指相互匹配的两个图像。图像相关信息是与图像相关的各种信息。具体地,图像相关信息可以包括图像的特征,此外,还可以包括该图像等等。在一条图像相关信息中,可以仅仅包括某图像的特征,而不包括该图像的匹配图像的特征。
在一些实施例中,输出单元503可以确定查找到的特征对应的图像。将该图像的配对图像作为目标图像的配对图像。并且,上述执行可以输出该配对图像。这里的特征对应的图像,指提取该特征的图像。
在本实施例的一些可选的实现方式中,获取单元被配置成:将目标图像输入预先训练的图像风格确定模型,得到从图像风格确定模型输出的目标图像的风格,其中,图像风格确定模型用于表征图像与该图像的风格的对应关系。
在本实施例的一些可选的实现方式中,图像信息集合为索引下的图像相关信息;以及索引通过如下方式建立:获取多组配对图像,将所获取的多组配对图像输入图像风格确定模型,得到多个风格的配对图像;对于每个风格,建立该风格配对图像的图像相关信息的索引,其中,在该风格对应的索引下,包括所获取的多组配对图像中每组配对图像的关联存储的图像相关信息。
在本实施例的一些可选的实现方式中,获取多组配对图像包括:通过预先训练的配对特征提取模型,提取图像集中各个图像的配对特征,其中,配对特征提取模型用于提取图像的配对特征;将图像集中,配对特征的相似度高的每组图像作为配对图像。
在本实施例的一些可选的实现方式中,配对特征提取模型的训练步骤,包括:获取图像对样本以及标注信息,其中,标注信息用于指示图像对样本为配对图像或非配对图像;将图像对样本作为输入,将图像对样本对应的标注信息作为目标输出,训练孪生神经网络,得到配对特征提取模型。
在本实施例的一些可选的实现方式中,图像相关信息还包括图像的配对图像的存储地址,以及装置还包括:确定单元,被配置成在将查找到的特征对应的图像的配对图像作为目标图像的配对图像并输出之前,确定查找到的特征对应的图像的配对图像的存储地址;图像获取单元,被配置成获取存储地址指示的图像。
在本实施例的一些可选的实现方式中,图像风格确定模型的训练步骤,包括:获取包括多个风格的图像的样本集;将图像作为输入,将该图像的风格作为目标输出,训练初始图像风格确定模型,得到图像风格确定模型。
如图6所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图6中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开的实施例的方法中限定的上述功能。需要说明的是,本公开的实施例的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、查找单元和输出单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取目标图像的特征的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取目标图像的特征;获取目标图像的风格,以及在风格的图像相关信息集合中,查找与目标图像的特征最相似的特征,其中,图像相关信息集合包括多组配对图像的特征;将查找到的特征对应的图像的配对图像作为目标图像的配对图像并输出。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (16)
1.一种图像处理方法,包括:
获取目标图像的特征;
获取所述目标图像的风格,以及在所述风格的图像相关信息集合中,查找与所述目标图像的特征最相似的特征,其中,所述图像相关信息集合包括多组配对图像的特征;
将查找到的特征对应的图像的配对图像作为所述目标图像的配对图像并输出。
2.根据权利要求1所述的方法,其中,获取所述目标图像的风格,包括:
将所述目标图像输入预先训练的图像风格确定模型,得到从所述图像风格确定模型输出的所述目标图像的风格,其中,所述图像风格确定模型用于表征图像与该图像的风格的对应关系。
3.根据权利要求2所述的方法,其中,所述图像信息集合为索引下的图像相关信息;以及
所述索引通过如下方式建立:
获取多组配对图像,将所获取的多组配对图像输入所述图像风格确定模型,得到多个风格的配对图像;
对于每个风格,建立该风格配对图像的图像相关信息的索引,其中,在该风格对应的索引下,包括所获取的多组配对图像中每组配对图像的关联存储的图像相关信息。
4.根据权利要求3所述的方法,其中,所述获取多组配对图像包括:
通过预先训练的配对特征提取模型,提取图像集中各个图像的配对特征,其中,所述配对特征提取模型用于提取图像的配对特征;
将所述图像集中,配对特征的相似度高的每组图像作为配对图像。
5.根据权利要求4所述的方法,其中,所述配对特征提取模型的训练步骤,包括:
获取图像对样本以及标注信息,其中,所述标注信息用于指示所述图像对样本为配对图像或非配对图像;
将图像对样本作为输入,将图像对样本对应的标注信息作为目标输出,训练孪生神经网络,得到所述配对特征提取模型。
6.根据权利要求1所述的方法,其中,所述图像相关信息还包括图像的配对图像的存储地址,以及
在所述将查找到的特征对应的图像的配对图像作为所述目标图像的配对图像并输出之前,所述方法还包括:
确定所述查找到的特征对应的图像的配对图像的存储地址;
获取所述存储地址指示的图像。
7.根据权利要求2所述的方法,其中,所述图像风格确定模型的训练步骤,包括:
获取包括多个风格的图像的样本集;
将图像作为输入,将该图像的风格作为目标输出,训练初始图像风格确定模型,得到所述图像风格确定模型。
8.一种图像处理装置,包括:
获取单元,被配置成获取目标图像的特征;
查找单元,被配置成获取所述目标图像的风格,以及在所述风格的图像相关信息集合中,查找与所述目标图像的特征最相似的特征,其中,所述图像相关信息集合包括多组配对图像的特征;
输出单元,被配置成将查找到的特征对应的图像的配对图像作为所述目标图像的配对图像并输出。
9.根据权利要求8所述的装置,其中,所述获取单元被配置成:
将所述目标图像输入预先训练的图像风格确定模型,得到从所述图像风格确定模型输出的所述目标图像的风格,其中,所述图像风格确定模型用于表征图像与该图像的风格的对应关系。
10.根据权利要求9所述的装置,其中,所述图像信息集合为索引下的图像相关信息;以及
所述索引通过如下方式建立:
获取多组配对图像,将所获取的多组配对图像输入所述图像风格确定模型,得到多个风格的配对图像;
对于每个风格,建立该风格配对图像的图像相关信息的索引,其中,在该风格对应的索引下,包括所获取的多组配对图像中每组配对图像的关联存储的图像相关信息。
11.根据权利要求10所述的装置,其中,所述获取多组配对图像包括:
通过预先训练的配对特征提取模型,提取图像集中各个图像的配对特征,其中,所述配对特征提取模型用于提取图像的配对特征;
将所述图像集中,配对特征的相似度高的每组图像作为配对图像。
12.根据权利要求11所述的装置,其中,所述配对特征提取模型的训练步骤,包括:
获取图像对样本以及标注信息,其中,所述标注信息用于指示所述图像对样本为配对图像或非配对图像;
将图像对样本作为输入,将图像对样本对应的标注信息作为目标输出,训练孪生神经网络,得到所述配对特征提取模型。
13.根据权利要求8所述的装置,其中,所述图像相关信息还包括图像的配对图像的存储地址,以及
所述装置还包括:
确定单元,被配置成在所述将查找到的特征对应的图像的配对图像作为所述目标图像的配对图像并输出之前,确定所述查找到的特征对应的图像的配对图像的存储地址;
图像获取单元,被配置成获取所述存储地址指示的图像。
14.根据权利要求9所述的装置,其中,所述图像风格确定模型的训练步骤,包括:
获取包括多个风格的图像的样本集;
将图像作为输入,将该图像的风格作为目标输出,训练初始图像风格确定模型,得到所述图像风格确定模型。
15.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910794758.XA CN110516099A (zh) | 2019-08-27 | 2019-08-27 | 图像处理方法和装置 |
US16/813,494 US11210563B2 (en) | 2019-08-27 | 2020-03-09 | Method and apparatus for processing image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910794758.XA CN110516099A (zh) | 2019-08-27 | 2019-08-27 | 图像处理方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110516099A true CN110516099A (zh) | 2019-11-29 |
Family
ID=68628004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910794758.XA Pending CN110516099A (zh) | 2019-08-27 | 2019-08-27 | 图像处理方法和装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11210563B2 (zh) |
CN (1) | CN110516099A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111444370A (zh) * | 2020-03-09 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 图像检索方法、装置、设备及其存储介质 |
CN111639599A (zh) * | 2020-05-29 | 2020-09-08 | 北京百度网讯科技有限公司 | 物体图像挖掘方法、装置、设备以及存储介质 |
CN111832494A (zh) * | 2020-07-17 | 2020-10-27 | 中国联合网络通信集团有限公司 | 信息存储方法及设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110516099A (zh) * | 2019-08-27 | 2019-11-29 | 北京百度网讯科技有限公司 | 图像处理方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130129210A1 (en) * | 2010-11-02 | 2013-05-23 | Sk Planet Co., Ltd. | Recommendation system based on the recognition of a face and style, and method thereof |
CN107391599A (zh) * | 2017-06-30 | 2017-11-24 | 中原智慧城市设计研究院有限公司 | 基于风格特征的图像检索方法 |
CN108287857A (zh) * | 2017-02-13 | 2018-07-17 | 腾讯科技(深圳)有限公司 | 表情图片推荐方法及装置 |
CN108595628A (zh) * | 2018-04-24 | 2018-09-28 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN109783671A (zh) * | 2019-01-30 | 2019-05-21 | 京东方科技集团股份有限公司 | 一种以图搜图的方法、计算机可读介质及服务器 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9836545B2 (en) * | 2012-04-27 | 2017-12-05 | Yahoo Holdings, Inc. | Systems and methods for personalized generalized content recommendations |
CN104346370B (zh) * | 2013-07-31 | 2018-10-23 | 阿里巴巴集团控股有限公司 | 图像搜索、获取图像文本信息的方法及装置 |
US10380410B2 (en) * | 2014-04-07 | 2019-08-13 | Eyeways Systems Ltd. | Apparatus and method for image-based positioning, orientation and situational awareness |
US10956948B2 (en) * | 2015-11-09 | 2021-03-23 | Anupam Madiratta | System and method for hotel discovery and generating generalized reviews |
CA3031548A1 (en) * | 2016-07-22 | 2018-01-25 | 9206868 Canada Inc. | System and method for analyzing and searching for features associated with objects |
CN108121943B (zh) * | 2016-11-30 | 2022-05-06 | 阿里巴巴集团控股有限公司 | 基于图片的判别方法及装置和计算设备 |
WO2018145577A1 (zh) | 2017-02-08 | 2018-08-16 | 腾讯科技(深圳)有限公司 | 表情推荐方法和装置 |
US10403031B2 (en) * | 2017-11-15 | 2019-09-03 | Google Llc | Learning to reconstruct 3D shapes by rendering many 3D views |
CN109191382B (zh) * | 2018-10-18 | 2023-12-05 | 京东方科技集团股份有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN109472270B (zh) * | 2018-10-31 | 2021-09-24 | 京东方科技集团股份有限公司 | 图像风格转换方法、装置及设备 |
KR102246408B1 (ko) * | 2019-02-14 | 2021-05-18 | 엔에이치엔 주식회사 | 딥러닝 기반 유사상품 제공방법 |
CN110516099A (zh) * | 2019-08-27 | 2019-11-29 | 北京百度网讯科技有限公司 | 图像处理方法和装置 |
-
2019
- 2019-08-27 CN CN201910794758.XA patent/CN110516099A/zh active Pending
-
2020
- 2020-03-09 US US16/813,494 patent/US11210563B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130129210A1 (en) * | 2010-11-02 | 2013-05-23 | Sk Planet Co., Ltd. | Recommendation system based on the recognition of a face and style, and method thereof |
CN108287857A (zh) * | 2017-02-13 | 2018-07-17 | 腾讯科技(深圳)有限公司 | 表情图片推荐方法及装置 |
CN107391599A (zh) * | 2017-06-30 | 2017-11-24 | 中原智慧城市设计研究院有限公司 | 基于风格特征的图像检索方法 |
CN108595628A (zh) * | 2018-04-24 | 2018-09-28 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN109783671A (zh) * | 2019-01-30 | 2019-05-21 | 京东方科技集团股份有限公司 | 一种以图搜图的方法、计算机可读介质及服务器 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111444370A (zh) * | 2020-03-09 | 2020-07-24 | 腾讯科技(深圳)有限公司 | 图像检索方法、装置、设备及其存储介质 |
CN111639599A (zh) * | 2020-05-29 | 2020-09-08 | 北京百度网讯科技有限公司 | 物体图像挖掘方法、装置、设备以及存储介质 |
CN111639599B (zh) * | 2020-05-29 | 2024-04-02 | 北京百度网讯科技有限公司 | 物体图像挖掘方法、装置、设备以及存储介质 |
CN111832494A (zh) * | 2020-07-17 | 2020-10-27 | 中国联合网络通信集团有限公司 | 信息存储方法及设备 |
CN111832494B (zh) * | 2020-07-17 | 2024-03-05 | 中国联合网络通信集团有限公司 | 信息存储方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
US11210563B2 (en) | 2021-12-28 |
US20210064930A1 (en) | 2021-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108898185A (zh) | 用于生成图像识别模型的方法和装置 | |
CN110516099A (zh) | 图像处理方法和装置 | |
CN108446387A (zh) | 用于更新人脸注册库的方法和装置 | |
CN108898186A (zh) | 用于提取图像的方法和装置 | |
CN109308681A (zh) | 图像处理方法和装置 | |
CN108830235A (zh) | 用于生成信息的方法和装置 | |
CN108985257A (zh) | 用于生成信息的方法和装置 | |
CN109086719A (zh) | 用于输出数据的方法和装置 | |
CN110162670A (zh) | 用于生成表情包的方法和装置 | |
CN108595628A (zh) | 用于推送信息的方法和装置 | |
CN109063653A (zh) | 图像处理方法和装置 | |
CN108345387A (zh) | 用于输出信息的方法和装置 | |
CN109410253B (zh) | 用于生成信息的方法、装置、电子设备和计算机可读介质 | |
CN110517214A (zh) | 用于生成图像的方法和装置 | |
CN109815365A (zh) | 用于处理视频的方法和装置 | |
CN109919244A (zh) | 用于生成场景识别模型的方法和装置 | |
CN109961032A (zh) | 用于生成分类模型的方法和装置 | |
CN109947989A (zh) | 用于处理视频的方法和装置 | |
CN110516678A (zh) | 图像处理方法和装置 | |
CN109862100A (zh) | 用于推送信息的方法和装置 | |
CN109918530A (zh) | 用于推送图像的方法和装置 | |
CN110009059A (zh) | 用于生成模型的方法和装置 | |
CN110210501A (zh) | 虚拟对象生成方法、电子设备及计算机可读存储介质 | |
CN109241934A (zh) | 用于生成信息的方法和装置 | |
CN109389096A (zh) | 检测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |