CN110879849B - 一种基于图像转文字的相似度比较方法及装置 - Google Patents

一种基于图像转文字的相似度比较方法及装置 Download PDF

Info

Publication number
CN110879849B
CN110879849B CN201911091309.5A CN201911091309A CN110879849B CN 110879849 B CN110879849 B CN 110879849B CN 201911091309 A CN201911091309 A CN 201911091309A CN 110879849 B CN110879849 B CN 110879849B
Authority
CN
China
Prior art keywords
image
retrieved
database
keyword
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911091309.5A
Other languages
English (en)
Other versions
CN110879849A (zh
Inventor
邓立邦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Zhimeiyuntu Tech Corp ltd
Original Assignee
Guangdong Zhimeiyuntu Tech Corp ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Zhimeiyuntu Tech Corp ltd filed Critical Guangdong Zhimeiyuntu Tech Corp ltd
Priority to CN201911091309.5A priority Critical patent/CN110879849B/zh
Publication of CN110879849A publication Critical patent/CN110879849A/zh
Application granted granted Critical
Publication of CN110879849B publication Critical patent/CN110879849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本申请实施例公开了一种基于图像转文字的相似度比较方法及装置。本申请实施例提供的技术方案通过获取待检索图像的待检索关键字,并根据待检索关键字和图像数据库中图像关键字的对应关系生成检索结果,从而精确确定与待检索图像相关的数据库图像,提高了图像检索的精度。并且可根据需要设置检索条件,从而调整检索的范围,提高图像检索的灵活性。

Description

一种基于图像转文字的相似度比较方法及装置
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种基于图像转文字的相似度比较方法及装置。
背景技术
随着移动互联网的快速发展,人们对从海量图像资源中快速找到相似图像显的要求越来越高。图像检索是一种用来寻找图像的数据搜索方法,用户输入关键字、图像等检索信息,系统便从数据库中寻找与之相似的图像并反馈给用户。
人们日常生活的图像检索,其相似度衡量更偏向于图像自身的描述信息,而不是图像自身的内容特征,比如,人们提供一张小狗图像作为检索图像,其想要的检索结果不在乎图像中小狗的数量、种类、形态以及外貌等内容,只是想要看关于狗的图像,但现有技术中,往往只反馈与检索图像几乎一模一样的图像,无法满足用户实际需求。
发明内容
本申请实施例提供一种基于图像转文字的相似度比较方法、装置、设备及存储介质,以提高图像检索的精度。
在第一方面,本申请实施例提供了一种基于图像转文字的相似度比较方法,包括:
获取待检索图像的待检索关键字,所述待检索关键字包括待检索图像元素、待检索图像场景和待检索图像颜色中至少一种;
根据所述待检索关键字和图像关键字的对应关系,在图像数据库中检索数据库图像并生成检索结果,所述图像关键字和所述数据库图像存在绑定关系,所述图像关键字包括数据库图像元素、数据库图像场景和数据库图像颜色中至少一种;
根据所述检索结果显示数据库图像。
进一步的,所述获取待检索图像的待检索关键字,包括:
基于元素识别确定待检索图像的待检索图像元素,所述元素识别包括人脸识别和物件识别,所述待检索图像元素包括人和物件;
基于场景识别确定待检索图像的待检索图像场景;
基于色彩模式转换确定待检索图像的待检索HSV图像,基于所述待检索HSV图像的H值确定待检索图像的待检索图像颜色;
基于待检索图像元素、待检索图像场景和待检索图像颜色确定待检索图像的待检索关键字。
进一步的,所述获取待检索图像的待检索关键字之前,还包括:
获取待检索图像和检索条件,所述检索条件包括元素、场景和颜色中至少一种;
所述基于待检索图像元素、待检索图像场景和待检索图像颜色确定待检索图像的待检索关键字,包括:
基于所述检索条件以及待检索图像元素、待检索图像场景和待检索图像颜色确定待检索图像的待检索关键字。
进一步的,所述根据所述待检索关键字和图像关键字的对应关系,在图像数据库中检索数据库图像并生成检索结果,包括:
根据所述待检索关键字和图像关键字的对应关系,以及检索条件的预设权重,确定所述数据库图像相对于所述待检索图像的相似度分数;
基于所述相似度分数生成检索结果。
进一步的,所述根据所述检索结果显示数据库图像,包括:
基于显示下限以及所述检索结果,按照所述相似度分数从高到低的顺序显示数据库图像,所述显示下限为显示数据库图像的最小相似度分数。
进一步的,所述获取待检索图像的待检索关键字之前,还包括:
通过网络抓取网络图片作为数据库图像;
获取所述数据库图像的图像关键字;
将所述图像关键字与所述数据库图像进行绑定;
基于所述数据库图像和所述图像关键字建立图像数据库。
进一步的,所述获取数据库图像的图像关键字,包括:
基于元素识别确定数据库图像的数据库图像元素,所述元素识别包括人脸识别和物件识别,所述数据库图像元素包括人和物件;
基于场景识别确定数据库图像的数据库图像场景;
基于色彩模式转换确定数据库图像的数据库HSV图像,基于所述数据库HSV图像的H值确定数据库图像的数据库图像颜色;
基于数据库图像元素、数据库图像场景和数据库图像颜色确定数据库图像的图像关键字。
在第二方面,本申请实施例提供了一种基于图像转文字的相似度比较装置,包括关键字获取模块、检索模块和执行模块,其中:
关键字获取模块,用于获取待检索图像的待检索关键字,所述待检索关键字包括待检索图像元素、待检索图像场景和待检索图像颜色中至少一种;
检索模块,用于根据所述待检索关键字和图像关键字的对应关系,在图像数据库中检索数据库图像并生成检索结果,所述图像关键字和所述数据库图像存在绑定关系,所述图像关键字包括数据库图像元素、数据库图像场景和数据库图像颜色中至少一种;
执行模块,用于根据所述检索结果显示数据库图像。
在第三方面,本申请实施例提供了一种计算机设备,包括:存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的基于图像转文字的相似度比较方法。
在第四方面,本申请实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的基于图像转文字的相似度比较方法。
本申请实施例通过获取待检索图像的待检索关键字,并根据待检索关键字和图像数据库中图像关键字的对应关系生成检索结果,从而精确确定与待检索图像相关的数据库图像,提高了图像检索的精度。并且可根据需要设置检索条件,从而调整检索的范围,提高图像检索的灵活性。
附图说明
图1是本申请实施例提供的一种基于图像转文字的相似度比较方法的流程图;
图2是本申请实施例提供的另一种基于图像转文字的相似度比较方法的流程图;
图3是本申请实施例提供的另一种基于图像转文字的相似度比较方法的流程图;
图4是本申请实施例提供的一种基于图像转文字的相似度比较装置的结构示意图;
图5是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
图1给出了本申请实施例提供的一种基于图像转文字的相似度比较方法的流程图,本实施例可适用于图像检索,该基于图像转文字的相似度比较方法可以由基于图像转文字的相似度比较装置来执行,该基于图像转文字的相似度比较装置可通过硬件和/或软件的方式实现,并集成在计算机设备中。
下述以基于图像转文字的相似度比较装置来执行基于图像转文字的相似度比较方法为例进行描述。参考图1,该基于图像转文字的相似度比较方法包括:
S101:获取待检索图像的待检索关键字,所述待检索关键字包括待检索图像元素、待检索图像场景和待检索图像颜色中至少一种。
在获取待检索图像的待检索关键字前,先获取待检索图像。可选的,待检索图像可通过手机、平板、电脑等终端从互联网中下载,还可以通过外部存储介质导入的方式获得。
示例性的,待检索关键字可用于描述对应待检索图像的区别特征,根据该区别特征可判断待检索图像与其他图像的相似程度。可以理解的是,待检索关键字所包含的内容越多,所检索出的图像与待检索图像的相似程度越高。
其中,待检索关键字包括待检索图像元素、待检索图像场景和待检索图像颜色中至少一种,可根据实际情况或使用场景选择单一种类的待检索关键字、两两搭配的待检索关键字或三种待检索关键字的组合,本实施例以待检索关键字为待检索图像元素、待检索图像场景和待检索图像颜色三种的结合为例进行描述。
具体的,获取待检索图像的待检索关键字包括步骤S1011-S104:
S1011:基于元素识别确定待检索图像的待检索图像元素,所述元素识别包括人脸识别和物件识别,所述待检索图像元素包括人和物件。
其中,待检索图像元素包括人和物件,物件包括宠物和物体,如猫、狗、杯子、凳子等。人脸识别是指通过边缘检测算法,找出由特征关键点聚类形成的多条抛物线,先确定是否存在人脸轮廓,若存在则确定是否存在人脸眉毛、鼻子、眼睛、嘴巴等其他面部特征,从而得到人脸特征图,若人脸轮廓以及其他面部特征均检测确定完毕,则代表是人脸,否则视为非人脸。物件识别是指大量收集宠物、物件的静态图像,通过深度学习方法对识别模型进行训练,结合相关的物件特征关键点计算,从而达到图像物件及其类别的识别效果。
S1012:基于场景识别确定待检索图像的待检索图像场景。
其中,场景识别是指大量收集室内和室外各场景类型的静态图像,通过深度学习方法对识别模型进行训练,结合相关的场景特征关键点计算,从而达到图像场景及其类别的识别效果。本实施例所说的图像场景包括室内场景和室外场景,室内场景是指办公室、家里、摄影棚、电影院等非露天场所;室外场景是指公园、沙滩、街道、户外体育场等露天场所。
S1013:基于色彩模式转换确定待检索图像的待检索HSV图像,基于所述待检索HSV图像的H值确定待检索图像的待检索图像颜色。
其中,色彩模式转换是指把图像的RGB颜色模式转换成HSV颜色模式得到HSV图像,其转换公式如下:
设(r,g,b)分别是一个颜色的红、绿和蓝坐标,它们的值是在0到1之间的实数;设max等价于r,g和b中的最大者,设min等于这些值中的最小者。
Figure BDA0002266934680000061
Figure BDA0002266934680000062
v=max
根据以上公式可得到待检索图像各个像素点对应的HSV值,从而得到HSV图像。其中HSV图像的H值是指HSV图像色相,其用角度度量,取值范围为0°~360°,基本颜色有黑、灰、白、红、橙、黄、绿、青、蓝、紫这10种,对应颜色分量区间如下:
Figure BDA0002266934680000063
例如,对HSV图像的H值的分布情况进行统计,并根据统计结果确定h值在上表中的分布情况,根据各区间对应h值的占比确定对应颜色分量在图像中的占比,并颜色分量在图像中的占比判断在HSV图像中起关键作用的颜色分量(如占比的前n位或占比达到预设值)作为待检索图像颜色。
可以理解的是,步骤S1011-S1013的顺序可随意指定,或者是同步进行。
S1014:基于待检索图像元素、待检索图像场景和待检索图像颜色确定待检索图像的待检索关键字。
待检索关键字是指由待检索图像元素、待检索图像场景和待检索图像颜色组成的文本信息。如:一张待检索图像已提取的待检索图像元素是“狗”,待检索图像场景是“公园”,待检索图像颜色是“黄、绿、蓝”,则该待检索图像的待检索关键字是“狗/公园/黄绿蓝”。
S102:根据所述待检索关键字和图像关键字的对应关系,在图像数据库中检索数据库图像并生成检索结果。
其中,图像关键字和数据库图像存在绑定关系,图像关键字包括数据库图像元素、数据库图像场景和数据库图像颜色中至少一种,本实施例以图像关键字为数据库图像元素、数据库图像场景和数据库图像颜色三种的组合为例进行描述。
进一步的,在图像数据库中保存有数据库图像,并且每张数据库图像均绑定有图像关键字,根据图像关键字可对应检索出与该图像关键字绑定的数据库图像。图像关键字和数据库图像的绑定方式可以是通过映射表、指针、标签的方式进行,本实施例不作限制。
示例性的,在获取待检索图像对应的待检索关键字后,在图像数据库检索与待检索关键字一致的图像关键字,并生成指向与这些图像关键字相互绑定的数据库图像的检索结果。
S103:根据所述检索结果显示数据库图像。
示例性的,在生成检索结果后,根据检索结果所指向数据库图像,获取这些数据库图像的存储地址,并根据存储地址调取这些数据库图像并进行显示,完成待检索图像的检索。
例如,在确定待检索关键字为“狗/公园/黄绿蓝”,在图像数据库中检索同样为“狗/公园/黄绿蓝”的图像关键字,并生成指向与内容为“狗/公园/黄绿蓝”的图像关键字相互绑定的数据库图像的检索结果,此时获取这些数据库图像的存储地址,并根据存储地址调取这些数据库图像进行显示,此时显示的图像都具有“狗/公园/黄绿蓝”的特征。
上述,通过获取待检索图像的待检索关键字,并根据待检索关键字和图像数据库中图像关键字的对应关系生成检索结果,从而精确确定与待检索图像相关的数据库图像,提高了图像检索的精度。
图2为本申请实施例提供的另一种基于图像转文字的相似度比较方法的流程图。该基于图像转文字的相似度比较方法是对上述基于图像转文字的相似度比较方法的具体化。参考图2,该基于图像转文字的相似度比较方法包括:
S201:获取待检索图像和检索条件,所述检索条件包括元素、场景和颜色中至少一种。
其中,待检索图像可通过手机、平板、电脑等终端从互联网中下载,还可以通过外部存储介质导入的方式获得。可以理解的是,确定检索条件的操作可以在获取待检索图像前、获取待检索图像时或者是获取待检索图像后进行。
检索条件默认为元素、场景和颜色三种的组合或者是延续上一次的设置,并且检索条件可通过主动选择的方式进行选择,例如,通过选择列表的方式显示元素、场景和颜色三个选项,并可通过单选或多选的方式进行选择,并响应于确定操作确定与待检索图像对应的检索条件。例如,在选择并确定的选项仅为元素时,检索条件为元素,在选择并确定的选项为元素和颜色的结合时,检索条件为元素/颜色,在选择并确定的选项为元素、场景和颜色时,检索条件为元素/场景/颜色。
S202:基于元素识别确定待检索图像的待检索图像元素,所述元素识别包括人脸识别和物件识别,所述待检索图像元素包括人和物件。
S203:基于场景识别确定待检索图像的待检索图像场景。
S204:基于色彩模式转换确定待检索图像的待检索HSV图像,基于所述待检索HSV图像的H值确定待检索图像的待检索图像颜色。
S205:基于所述检索条件以及待检索图像元素、待检索图像场景和待检索图像颜色确定待检索图像的待检索关键字。
具体的,在获得待检索图像元素、待检索图像场景和待检索图像颜色后,根据检索条件的内容确定待检索关键字所包含的内容,使得待检索关键字与检索条件相对应。
假设待检索图像中提取的待检索图像元素是“狗”,待检索图像场景是“公园”,待检索图像颜色是“黄、绿、蓝”,在检索条件为元素时,将待检索关键字确定为“狗”,在检索条件为元素/颜色时,将待检索关键字确定为“狗/黄绿蓝”,在检索条件为元素/场景/颜色时,将待检索关键字确定为“狗/公园/黄绿蓝”。
S206:根据所述待检索关键字和图像关键字的对应关系,以及检索条件的预设权重,确定数据库图像相对于所述待检索图像的相似度分数。
其中,检索条件的预设权重可根据元素、场景和颜色对图片检索的影响程度进行默认设置,并且不同的检索条件下对应的预设权重也不同,例如在检索条件为元素/场景/颜色时,元素、场景、颜色对应的预设权重分别为0.6、0.2、0.2;在检索条件为元素/场景或者是元素/颜色时,元素和场景或颜色对应的预设权重分别为0.6、0.4;在检索条件为场景/颜色时,场景和颜色对应的预设权重为0.5、0.5。另外,检索条件的预设权重可根据需要进行调整。
进一步的,在图像数据库中保存有数据库图像,并且每张数据库图像均绑定有图像关键字,根据图像关键字可对应检索出与该图像关键字绑定的数据库图像。图像关键字和数据库图像的绑定方式可以是通过映射表、指针、标签的方式进行,本实施例不作限制。其中,图像关键字包括数据库图像元素、数据库图像场景和数据库图像颜色。
具体的,遍历图像数据库中的图像关键字,将图像关键字和待检索关键字进行比对,并结合检索条件的预设权重,计算每个图像关键字对应的数据库图像相对于待检索图像的相似度分数,其中相似度分数是指数据库图像对应的待检索关键字各组成内容的比对结果值与对应检索条件的预设权重的乘积之和,其中比对结果值为判断值与预设基数的乘积,在图像关键字的组成内容与待检索关键字中对应的组成内容一致时,判断值为1,否则为0,本实施例中预设基数设置为1,其中相似度分数可通过相似分数记录表的方式进行记录。如下表所示,假设检索条件为元素/场景,元素和场景对应的预设权重分别为0.6、0.4,待检索关键字为“狗/公园”,则相似分数记录表如下:
数据库图像的图像关键字 相似度分数
狗/沙滩 1×0.6+0×0.4=0.6
猫/公园 0×0.6+1×0.4=0.4
狗/公园 1×0.6+1×0.4=1.0
猫/家里 0×0.6+0×0.4=0
S207:基于所述相似度分数生成检索结果。
具体的,在获得图像数据库中每个图像关键字对应的数据库图像相对于待检索图像的相似度分数后,建立相似度分数与对应的数据库图像进行绑定,并根据相似度分数与数据库图像的绑定方式生成检索结果。根据检索结果可得出不同的数据库图像对应于待检索图像的相似度分数。相似度分数与数据库图像的绑定方式可以是通过映射表、指针、标签的方式进行,本实施例不作限制。
S208:基于显示下限以及所述检索结果,按照所述相似度分数从高到低的顺序显示数据库图像,所述显示下限为显示数据库图像的最小相似度分数。
具体的,在获得检索结果后,按照相似度分数从大到小的顺序获取数据库图像的存储地址,根据存储地址依次调用对应的数据库图像。
进一步的,在调用数据库图像时,判断数据库图像对应的相似度分数是否大于或大于等于显示数据库图像的最小相似度分数(最小相似度分数可根据实际情况进行确定),若是,继续调用数据库图像,否则,停止调用数据库图像的操作,再按相似度分数从高到低的顺序显示调用的数据库图像。
上述,通过获取待检索图像的待检索关键字,并根据待检索关键字和图像数据库中图像关键字的对应关系生成检索结果,从而精确确定与待检索图像相关的数据库图像,提高了图像检索的精度。并且可根据需要设置检索条件,从而调整检索的范围,提高图像检索的灵活性。同时,通过设置显示下限控制检索出的数据库图像的数量,提高图片检索质量。
图3为本申请实施例提供的另一种基于图像转文字的相似度比较方法的流程图。该基于图像转文字的相似度比较方法是对上述基于图像转文字的相似度比较方法的具体化。参考图3,该基于图像转文字的相似度比较方法包括:
S301:通过网络抓取网络图片作为数据库图像。
其中网络图片(静态图片)可利用爬虫技术在指定网页中获得,在从网络抓取大量(达到搭建图像数据库要求的数量)后,将抓取的网络图片作为数据库图像,用于建立图像数据库。例如,基于python抓取网络图片的步骤为:根据给定的网址获取网页源代码、利用正则表达式把源代码中的图片地址过滤出来、根据过滤出来的图片地址下载网络图片。网络图片的抓取可通过现有技术中的图片抓取工具实现,本实施例不对抓取网络图片的方式进行限定。
S302:获取所述数据库图像的图像关键字。
具体的,图像关键字包括数据库图像元素、数据库图像场景和数据库图像颜色。图像关键字的获取包括步骤S3021-S3024:
S3021:基于元素识别确定数据库图像的数据库图像元素,所述元素识别包括人脸识别和物件识别,所述数据库图像元素包括人和物件。
其中,数据库图像元素包括人和物件,物件包括宠物和物体,如猫、狗、杯子、凳子等。人脸识别是指通过边缘检测算法,找出由特征关键点聚类形成的多条抛物线,先确定是否存在人脸轮廓,若存在则确定是否存在人脸眉毛、鼻子、眼睛、嘴巴等其他面部特征,从而得到人脸特征图,若人脸轮廓以及其他面部特征均检测确定完毕,则代表是人脸,否则视为非人脸。
物件识别是指大量收集宠物、物件的静态图像,通过深度学习方法对识别模型进行训练,结合相关的物件特征关键点计算,从而达到图像物件及其类别的识别效果。
S3022:基于场景识别确定数据库图像的数据库图像场景。
其中,场景识别是指大量收集室内和室外各场景类型的静态图像,通过深度学习方法对识别模型进行训练,结合相关的场景特征关键点计算,从而达到图像场景及其类别的识别效果。
本实施例所说的图像场景包括室内场景和室外场景,室内场景是指办公室、家里、摄影棚、电影院等非露天场所;室外场景是指公园、沙滩、街道、户外体育场等露天场所。
S3023:基于色彩模式转换确定数据库图像的数据库HSV图像,基于所述数据库HSV图像的H值确定数据库图像的数据库图像颜色。
其中,色彩模式转换是指把图像的RGB颜色模式转换成HSV颜色模式得到HSV图像,其转换公式如下:
设(r,g,b)分别是一个颜色的红、绿和蓝坐标,它们的值是在0到1之间的实数;设max等价于r,g和b中的最大者,设min等于这些值中的最小者。
Figure BDA0002266934680000111
Figure BDA0002266934680000112
v=max
根据以上公式可得到待检索图像各个像素点对应的HSV值,从而得到HSV图像。
其中HSV图像的H值是指HSV图像色相,其用角度度量,取值范围为0°~360°,基本颜色有黑、灰、白、红、橙、黄、绿、青、蓝、紫这10种,对应颜色分量区间如下:
Figure BDA0002266934680000121
例如,对HSV图像的H值的分布情况进行统计,并根据统计结果确定h值在上表中的分布情况,根据各区间对应h值的占比确定对应颜色分量在图像中的占比,并颜色分量在图像中的占比判断在HSV图像中起关键作用的颜色分量(如占比的前n位或占比达到预设值)作为数据库图像颜色。
可以理解的是,步骤S3021-S3023的顺序可随意指定,或者是同步进行。
S3024:基于数据库图像元素、数据库图像场景和数据库图像颜色确定数据库图像的图像关键字。
图像关键字是指由数据库图像元素、数据库图像场景和数据库图像颜色组成的文本信息。如:一张数据库图像已提取的数据库图像元素是“狗”,数据库图像场景是“公园”,数据库图像颜色是“黄、绿、蓝”,则该数据库图像的图像关键字是“狗/公园/黄绿蓝”。
S303:将所述图像关键字与所述数据库图像进行绑定。
示例性的,图像关键字和数据库图像的绑定方式可以是通过映射表、指针、标签的方式进行,本实施例不作限制。其中,图像关键字包括数据库图像元素、数据库图像场景和数据库图像颜色。
S304:基于所述数据库图像和所述图像关键字建立图像数据库。
具体的,在完成图像关键字和数据库图像的绑定后,将图像关键字和数据库图像保存在预设存储位置(如数据库服务器或预设存储位置),基于述数据库图像和图像关键字建立图像数据库。基于图像关键字可对应检索出与该图像关键字绑定的数据库图像。
S305:获取待检索图像的待检索关键字。
S306:根据所述待检索关键字和图像关键字的对应关系,在图像数据库中检索数据库图像并生成检索结果。
S307:根据所述检索结果显示数据库图像。
上述,通过获取待检索图像的待检索关键字,并根据待检索关键字和图像数据库中图像关键字的对应关系生成检索结果,从而精确确定与待检索图像相关的数据库图像,提高了图像检索的精度。并通过抓取网络中大量的网络图片,并基于网络图片中提取的图像关键字建立图像数据库,提高了图片检索的丰富程度。
图4为本申请实施例提供的一种基于图像转文字的相似度比较装置的结构示意图。参考图4,本实施例提供的基于图像转文字的相似度比较装置包括关键字获取模块41、检索模块42和执行模块43。
其中,关键字获取模块41,用于获取待检索图像的待检索关键字,所述待检索关键字包括待检索图像元素、待检索图像场景和待检索图像颜色中至少一种;检索模块42,用于根据所述待检索关键字和图像关键字的对应关系,在图像数据库中检索数据库图像并生成检索结果,所述图像关键字和所述数据库图像存在绑定关系,所述图像关键字包括数据库图像元素、数据库图像场景和数据库图像颜色中至少一种;执行模块43,用于根据所述检索结果显示数据库图像。
上述,通过获取待检索图像的待检索关键字,并根据待检索关键字和图像数据库中图像关键字的对应关系生成检索结果,从而精确确定与待检索图像相关的数据库图像,提高了图像检索的精度。
在一个可能的实施例中,所述关键字获取模块41具体用于:获取待检索图像;基于元素识别确定待检索图像的待检索图像元素,所述元素识别包括人脸识别和物件识别,所述待检索图像元素包括人和物件;基于场景识别确定待检索图像的待检索图像场景;基于色彩模式转换确定待检索图像的待检索HSV图像,基于所述待检索HSV图像的H值确定待检索图像的待检索图像颜色;基于待检索图像元素、待检索图像场景和待检索图像颜色确定待检索图像的待检索关键字。
在一个可能的实施例中,所述装置还包括图像获取模块,所述图像获取模块具体用于:获取待检索图像和检索条件,所述检索条件包括元素、场景和颜色中至少一种;所述关键字获取模块41基于所述检索条件以及待检索图像元素、待检索图像场景和待检索图像颜色确定待检索图像的待检索关键字。
在一个可能的实施例中,所述检索模块42具体用于:根据所述待检索关键字和图像关键字的对应关系,以及检索条件的预设权重,确定所述数据库图像相对于所述待检索图像的相似度分数;基于所述相似度分数生成检索结果。
在一个可能的实施例中,所述执行模块43具体用于:基于显示下限以及所述检索结果,按照所述相似度分数从高到低的顺序显示数据库图像,所述显示下限为显示数据库图像的最小相似度分数。
在一个可能的实施例中,所述装置还包括数据库搭建模块,所述数据库搭建模块具体用于:通过网络抓取静态图片作为数据库图像;获取所述数据库图像的图像关键字;将所述图像关键字与所述数据库图像进行绑定;基于所述数据库图像和所述图像关键字建立图像数据库。所述获取所述数据库图像的图像关键字具体包括:基于元素识别确定数据库图像的数据库图像元素,所述元素识别包括人脸识别和物件识别,所述数据库图像元素包括人和物件;基于场景识别确定数据库图像的数据库图像场景;基于色彩模式转换确定数据库图像的数据库HSV图像,基于所述数据库HSV图像的H值确定数据库图像的数据库图像颜色;基于数据库图像元素、数据库图像场景和数据库图像颜色确定数据库图像的图像关键字。
本申请实施例还提供了一种计算机设备,该计算机设备可集成本申请实施例提供的基于图像转文字的相似度比较装置。图5是本申请实施例提供的一种计算机设备的结构示意图。参考图5,该计算机设备包括:输入装置53、输出装置54、存储器52以及一个或多个处理器51;所述存储器52,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器51执行,使得所述一个或多个处理器51实现如上述实施例提供的基于图像转文字的相似度比较方法。其中输入装置53、输出装置54、存储器52和处理器51可以通过总线或者其他方式连接,图5中以通过总线连接为例。
存储器52作为一种计算设备可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请任意实施例所述的基于图像转文字的相似度比较方法对应的程序指令/模块(例如,基于图像转文字的相似度比较装置中的关键字获取模块41、检索模块42和执行模块43)。存储器52可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器52可进一步包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置53可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置54可包括显示屏等显示设备。
处理器51通过运行存储在存储器52中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的基于图像转文字的相似度比较方法。
上述提供的基于图像转文字的相似度比较装置和计算机可用于执行上述实施例提供的基于图像转文字的相似度比较方法,具备相应的功能和有益效果。
本申请实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如上述实施例提供的基于图像转文字的相似度比较方法,该基于图像转文字的相似度比较方法包括:获取待检索图像的待检索关键字,所述待检索关键字包括待检索图像元素、待检索图像场景和待检索图像颜色中至少一种;根据所述待检索关键字和图像关键字的对应关系,在图像数据库中检索数据库图像并生成检索结果,所述图像关键字和所述数据库图像存在绑定关系,所述图像关键字包括数据库图像元素、数据库图像场景和数据库图像颜色中至少一种;根据所述检索结果显示数据库图像。
存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM,兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的第一计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的基于图像转文字的相似度比较方法,还可以执行本申请任意实施例所提供的基于图像转文字的相似度比较方法中的相关操作。
上述实施例中提供的基于图像转文字的相似度比较装置、设备及存储介质可执行本申请任意实施例所提供的基于图像转文字的相似度比较方法,未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的基于图像转文字的相似度比较方法。
上述仅为本申请的较佳实施例及所运用的技术原理。本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行的各种明显变化、重新调整及替代均不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由权利要求的范围决定。

Claims (8)

1.一种基于图像转文字的相似度比较方法,其特征在于,包括:
获取待检索图像的待检索关键字,所述待检索关键字包括待检索图像元素、待检索图像场景和待检索图像颜色中至少一种;
根据所述待检索关键字和图像关键字的对应关系,在图像数据库中检索数据库图像并生成检索结果,所述图像关键字和所述数据库图像存在绑定关系,所述图像关键字包括数据库图像元素、数据库图像场景和数据库图像颜色中至少一种;
根据所述检索结果显示数据库图像;
其中,所述获取待检索图像的待检索关键字,包括:
基于元素识别确定待检索图像的待检索图像元素,所述元素识别包括人脸识别和物件识别,所述待检索图像元素包括人和物件;
基于场景识别确定待检索图像的待检索图像场景;
基于色彩模式转换确定待检索图像的待检索HSV图像,基于所述待检索HSV图像的H值确定待检索图像的待检索图像颜色;
基于待检索图像元素、待检索图像场景和待检索图像颜色确定待检索图像的待检索关键字;
其中,所述根据所述待检索关键字和图像关键字的对应关系,在图像数据库中检索数据库图像并生成检索结果,包括:
根据所述待检索关键字和图像关键字的对应关系,以及检索条件的预设权重,确定所述数据库图像相对于所述待检索图像的相似度分数;
基于所述相似度分数生成检索结果。
2.根据权利要求1所述的基于图像转文字的相似度比较方法,其特征在于,所述获取待检索图像的待检索关键字之前,还包括:
获取待检索图像和检索条件,所述检索条件包括元素、场景和颜色中至少一种;
所述基于待检索图像元素、待检索图像场景和待检索图像颜色确定待检索图像的待检索关键字,包括:
基于所述检索条件以及待检索图像元素、待检索图像场景和待检索图像颜色确定待检索图像的待检索关键字。
3.根据权利要求1所述的基于图像转文字的相似度比较方法,其特征在于,所述根据所述检索结果显示数据库图像,包括:
基于显示下限以及所述检索结果,按照所述相似度分数从高到低的顺序显示数据库图像,所述显示下限为显示数据库图像的最小相似度分数。
4.根据权利要求1-3任一项所述的基于图像转文字的相似度比较方法,其特征在于,所述获取待检索图像的待检索关键字之前,还包括:
通过网络抓取网络图片作为数据库图像;
获取所述数据库图像的图像关键字;
将所述图像关键字与所述数据库图像进行绑定;
基于所述数据库图像和所述图像关键字建立图像数据库。
5.根据权利要求4所述的基于图像转文字的相似度比较方法,其特征在于,所述获取数据库图像的图像关键字,包括:
基于元素识别确定数据库图像的数据库图像元素,所述元素识别包括人脸识别和物件识别,所述数据库图像元素包括人和物件;
基于场景识别确定数据库图像的数据库图像场景;
基于色彩模式转换确定数据库图像的数据库HSV图像,基于所述数据库HSV图像的H值确定数据库图像的数据库图像颜色;
基于数据库图像元素、数据库图像场景和数据库图像颜色确定数据库图像的图像关键字。
6.一种基于图像转文字的相似度比较装置,其特征在于,包括关键字获取模块、检索模块和执行模块,其中:
关键字获取模块,用于获取待检索图像的待检索关键字,所述待检索关键字包括待检索图像元素、待检索图像场景和待检索图像颜色中至少一种;
检索模块,用于根据所述待检索关键字和图像关键字的对应关系,在图像数据库中检索数据库图像并生成检索结果,所述图像关键字和所述数据库图像存在绑定关系,所述图像关键字包括数据库图像元素、数据库图像场景和数据库图像颜色中至少一种;
执行模块,用于根据所述检索结果显示数据库图像;
其中,所述关键字获取模块具体用于:获取待检索图像;基于元素识别确定待检索图像的待检索图像元素,所述元素识别包括人脸识别和物件识别,所述待检索图像元素包括人和物件;基于场景识别确定待检索图像的待检索图像场景;基于色彩模式转换确定待检索图像的待检索HSV图像,基于所述待检索HSV图像的H值确定待检索图像的待检索图像颜色;基于待检索图像元素、待检索图像场景和待检索图像颜色确定待检索图像的待检索关键字;
其中,所述检索模块具体用于根据所述待检索关键字和图像关键字的对应关系,以及检索条件的预设权重,确定所述数据库图像相对于所述待检索图像的相似度分数;
基于所述相似度分数生成检索结果。
7.一种计算机设备,其特征在于,包括:存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5任一所述的基于图像转文字的相似度比较方法。
8.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-5任一所述的基于图像转文字的相似度比较方法。
CN201911091309.5A 2019-11-09 2019-11-09 一种基于图像转文字的相似度比较方法及装置 Active CN110879849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911091309.5A CN110879849B (zh) 2019-11-09 2019-11-09 一种基于图像转文字的相似度比较方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911091309.5A CN110879849B (zh) 2019-11-09 2019-11-09 一种基于图像转文字的相似度比较方法及装置

Publications (2)

Publication Number Publication Date
CN110879849A CN110879849A (zh) 2020-03-13
CN110879849B true CN110879849B (zh) 2022-09-20

Family

ID=69729141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911091309.5A Active CN110879849B (zh) 2019-11-09 2019-11-09 一种基于图像转文字的相似度比较方法及装置

Country Status (1)

Country Link
CN (1) CN110879849B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101542531A (zh) * 2007-06-14 2009-09-23 松下电器产业株式会社 图像识别装置及图像识别方法
CN102147815A (zh) * 2011-04-21 2011-08-10 北京大学 图片搜索方法和图片搜索系统
CN109063068A (zh) * 2018-07-23 2018-12-21 广州云测信息技术有限公司 一种图片检索方法和装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165303A (ja) * 2006-12-27 2008-07-17 Fujifilm Corp コンテンツ登録装置、及びコンテンツ登録方法、及びコンテンツ登録プログラム
CN103631875B (zh) * 2013-11-08 2017-04-12 北京奇虎科技有限公司 在浏览器侧进行网络搜索的方法与浏览器
CN105022752B (zh) * 2014-04-29 2019-04-05 中国电信股份有限公司 图像检索方法与装置
CN104765796A (zh) * 2015-03-25 2015-07-08 无锡天脉聚源传媒科技有限公司 一种图像识别搜索方法及装置
CN104951522B (zh) * 2015-06-10 2020-02-28 小米科技有限责任公司 一种进行搜索的方法和装置
CN106354885A (zh) * 2016-10-14 2017-01-25 百度在线网络技术(北京)有限公司 搜索方法和装置
CN109033308A (zh) * 2018-07-16 2018-12-18 安徽江淮汽车集团股份有限公司 一种图像检索方法及装置
CN109800319A (zh) * 2018-12-26 2019-05-24 中国科学院自动化研究所南京人工智能芯片创新研究院 图像处理方法、装置、计算机设备和存储介质
CN110175256A (zh) * 2019-05-30 2019-08-27 上海联影医疗科技有限公司 一种图像数据检索方法、装置、设备和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101542531A (zh) * 2007-06-14 2009-09-23 松下电器产业株式会社 图像识别装置及图像识别方法
CN102147815A (zh) * 2011-04-21 2011-08-10 北京大学 图片搜索方法和图片搜索系统
CN109063068A (zh) * 2018-07-23 2018-12-21 广州云测信息技术有限公司 一种图片检索方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于非精确图匹配的一种工程图检索方法;赵晔,王昌;《郑州轻工业学院学报(自然科学版)》;20110615;第26卷(第03期);26-28 *

Also Published As

Publication number Publication date
CN110879849A (zh) 2020-03-13

Similar Documents

Publication Publication Date Title
US11532057B1 (en) Automatic updating of real estate database
US11232142B2 (en) Flexible real estate search
JP6349031B2 (ja) 画像に表されたオブジェクトの認識及び照合のための方法及び装置
US8874596B2 (en) Image processing system and method
US9841877B2 (en) Utilizing color descriptors to determine color content of images
US20080162469A1 (en) Content register device, content register method and content register program
US9652534B1 (en) Video-based search engine
US9600738B2 (en) Discriminative embedding of local color names for object retrieval and classification
US20070070217A1 (en) Image analysis apparatus and image analysis program storage medium
CN112040273B (zh) 视频合成方法及装置
US11100159B2 (en) Image metadata enrichment generator
WO2022100133A1 (zh) 场景识别方法、装置、智能设备、存储介质和计算机程序
CN112200844A (zh) 生成图像的方法、装置、电子设备及介质
CN110019913A (zh) 图片匹配方法、用户设备、存储介质及装置
US10885095B2 (en) Personalized criteria-based media organization
CN110879849B (zh) 一种基于图像转文字的相似度比较方法及装置
US11442982B2 (en) Method and system for acquiring data files of blocks of land and of building plans and for making matches thereof
US20180189602A1 (en) Method of and system for determining and selecting media representing event diversity
CN111783786A (zh) 图片的识别方法、系统、电子设备及存储介质
US20230148007A1 (en) System and method for playing audio corresponding to an image
Vaiapury et al. Finding Interesting Images in Albums using Attention.
OH et al. Guidelines for Evaluation of Visual Narrative Technology Based on Image Objects
AU2013273790A1 (en) Heterogeneous feature filtering
WO2014042646A1 (en) Associating an identity to a creator of a set of visual files
CN112199546A (zh) 照片存储管理系统及方法

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant