CN110413816B - 彩色草图图像搜索 - Google Patents
彩色草图图像搜索 Download PDFInfo
- Publication number
- CN110413816B CN110413816B CN201910660658.8A CN201910660658A CN110413816B CN 110413816 B CN110413816 B CN 110413816B CN 201910660658 A CN201910660658 A CN 201910660658A CN 110413816 B CN110413816 B CN 110413816B
- Authority
- CN
- China
- Prior art keywords
- color
- sketch
- image
- words
- segment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
对于将要搜索的图像集合中的每个图像,该图像被表示为色边字集合,其中每个色边字包括位置信息、形状信息和颜色信息。该图像可基于色边字被索引。接收用户生成的草图作为查询并将其表示为色边字集合。相似性将表示草图的色边字集合与该图像索引进行比较以基于位置相似性、形状相似性和颜色相似性的组合来标识搜索结果。
Description
本申请是申请日为2013年6月14日、申请号为201380077462.7、名为“彩色草图图像搜索”的申请的分案申请。
背景
搜索图像是许多计算机用户执行的常见任务。例如,用户可经由互联网搜索大量可用信息来寻找特定地点或事物的图像。尽管搜索查询通常仅是基于关键字的,最近的技术进步已经使得其它选项成为可能。
绘制草图是人类彼此通信、记录其思想、以及自我表达的最自然的方式之一。触摸屏设备正变得越来越可用和流行,它们使得用户能够容易地输入手绘草图。技术进步还使得用户提交操作以被用作搜索与该草图类似的图像的基础成为可能。
一些“草图到图像”匹配技术主要考虑形状相似性或颜色相似性之一。然而,形状和颜色两者均传达图像中的重要信息。因此,主要基于形状信息来执行草图到图像匹配可能由于缺少对颜色信息的考虑而返回较差结果。类似地,主要基于颜色信息来执行草图到图像匹配可能由于缺少形状信息而返回较差结果。
概述
本文描述了彩色草图图像搜索。提供用户界面以使用户能够生成彩色草图并提交该草图作为搜索查询。要搜索的图像和用户提交的草图被表示为色边字集合。每个色边字包括位置信息、形状信息、以及颜色信息。要搜索的图像的集合可被索引,且匹配算法基于位置相似性、形状相似性和颜色相似性的组合来确定草图和图像之间的相似性得分。
提供本概述以便以简化形式介绍将在以下详细描述中进一步描述的一些概念。本概述不旨在标识所要求保护的主题的关键特征或基本特征,也不旨在被用来帮助确定所要求保护的主题的范围。例如,术语“工具”可以指上述上下文和通篇文档所准许的设备、系统、方法、和/或计算机可读介质。
附图简述
参考附图来描述具体实施方式。在附图中,附图标记最左边的数字标识该附图标记首次出现的附图。在各附图中,使用相同的标号来指示相同的特征和组件。
图1是可在其中实现彩色草图图像搜索的示例网络环境的框图。
图2是如图1中所示的示例色边字表示模块的精选组件的框图。
图3是示出局部片检测的插图。
图4是示出图像的示例色边字表示的插图。
图5是用于彩色插图图像搜索的强匹配实现的示例倒置索引的框图。
图6是用于彩色插图图像搜索的灵活匹配实现的示例倒置索引的框图。
图7是示例颜色传播和查询扩大的插图。
图8是用于生成查询草图的示例用户界面的插图。
图9是示出示例查询草图生成的插图。
图10是用于彩色草图图像搜索的示例过程的流程图。
图11是用于预处理数据库图像的示例过程的流程图。
图12是用于生成图像或草图的色边字表示的示例过程的流程图。
详细描述
绘制彩色草图作为图像查询的输入是用户传达其搜索兴趣的自然技术。当基于用户提交的草图执行搜索时,重要的是要考虑草图中包括的形状和颜色两者。
各种绘制技术可被采用来使用户能够创建用于基于图像的查询的草图。例如,用户界面可为用户提供使用各种绘制工具来创建彩色草图的选项,所述绘制工具包括例如:钢笔和色桶(color bucket)、钢笔和色刷、彩色铅笔、或色刷。各种用户输入设备可被用来与该用户界面交互来控制绘制工具,包括例如鼠标、指示笔、触摸屏等等。草图/图像表示被实现以捕捉用户提交的草图和要搜索的图像的形状和颜色信息两者,使用草图到图像匹配技术来标识与用户提交的搜索类似的图像,且使用索引结构来允许图像到用户提交的草图的高效匹配。
在示例实现中,使用图像或草图来基于色边字(color-edge word)生成类似文档的字袋(bag-of-words)表示,其中每个色边字(CEW)由图像或草图内的位置、两种颜色、以及表示分割这两种颜色的轮廓段的形状构成。基于色边字表示,使用修改过的Chamfer匹配算法来匹配彩色草图和图像。利用倒置索引结构来加速大范围数据库中的匹配过程。而且,在一示例实现中,为了提供适恰图像将被匹配到用户提交的草图的可能性,每个草图以及每个图像中的主要对象在尝试将图像匹配到用户提交的草图之前被调整尺度(rescale)。
示例环境
图1示出可在其中实现彩色草图图像搜索的示例网络环境100。该示例环境包括客户端计算设备102、服务器计算设备104、以及图像储存库106,其中每个设备均经由网络108通信地耦合至其它设备。网络108是例如因特网的代表。
客户端计算设备102是任何能够联网的计算设备的代表,包括但不限于台式计算机系统、膝上型计算机系统、电视系统、游戏系统、移动智能电话、平板计算机系统等等。示例客户端计算设备102包括一个或多个处理器110、网络接口112和存储器114。网络接口112使得客户端计算设备102能够通过网络与其他设备通信。
操作系统116、浏览器应用118、以及任何数目的其他应用120作为计算机可读指令被存储在存储器114中,并至少部分地由处理器110执行。浏览器应用118包括彩色草图输入模块122,该彩色草图输入模块使得用户能够生成被用作搜索查询的基础的彩色草图。
服务器计算设备104代表实现搜索引擎并能经由网络108访问的任何类型的计算设备。示例服务器计算设备104包括一个或多个处理器124、网络接口126和存储器128。网络接口126使得服务器计算设备104能够通过网络与其他设备通信。
操作系统130、搜索引擎132、以及任何数目的其他应用134作为计算机可读指令被存储在存储器128中,并至少部分地由处理器124执行。
示例搜索引擎132包括色边字(CEW)表示模块136、匹配模块138、索引模块140、以及图像预处理模块142。色边字表示模块136分析图像或用户生成的草图,从而生成图像或草图的色边字表示。匹配模块138针对用户提交的彩色草图,确定来自图像储存库106的与该草图最相似的图像。索引模块140基于图像储存库106中的图像的色边字表示生成倒置索引来改善匹配模块138能够标识与用户提交的草图最相似的图像的速度。图像预处理模块142将图像储存库106中的每个图像转换为边图(edge map)。通过色边字表示模块136处理边图来生成图像的色边字表示。
尽管这里参考浏览器应用和因特网搜索引擎进行了描述,但是彩色草图图像匹配可在其他搜索环境中被实现。例如,浏览器应用418和搜索引擎132的组件可表示用于搜索图像储存库的接口,图像储存库可以或可以不通过因特网来被访问。例如,彩色图像匹配可被实现以使得用户能够从文档编辑应用内搜索剪贴画。替换地,彩色草图图像匹配可被实现以使用户能够搜索个人相片储存库。如本文所述的彩色草图图像匹配可在其中用户想要定位图像的基本上任何环境或场景中实现,其中图像的性质可用用户生成的彩色草图表示。在各实现中,彩色草图输入模块122、CEW表示模块136、匹配模块138、索引模块140、以及图像储存库106的任何组合可在单个设备(例如,客户端计算设备102)上实现或可跨能够经由网络彼此访问的多个计算设备分布。
虽然在图1中被示为存储在客户端计算设备102的存储器114中,但浏览器应用118或其各部分可以使用可由客户端计算设备102访问的任何形式的计算机可读介质来实现。另外,在替代实现中,操作系统116、浏览器应用118、以及其他应用120的一个或多个组件可被实现为作为客户但计算设备102的一部分或可被客户端计算设备访问的集成电路的一部分。
类似地,搜索引擎132或其部分可使用可由服务器计算设备104访问的任何形式的计算机可读介质实现。另外,在替代实现中,操作系统130、搜索引擎132、以及其他应用134的一个或多个组件可被实现为作为服务器计算设备104的一部分或可被计算设备408访问的集成电路的一部分。
计算机可读介质包括至少两种类型的计算机可读介质,即计算机存储介质和通信介质。
计算机存储介质包括以用于存储如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光存储、磁带盒、磁带、磁盘存储或其它磁存储设备,或者可用于存储供计算设备访问的信息的任何其它介质。
相反,通信介质可在诸如载波的已调制数据信号或其他机制中体现计算机可读指令、数据结构、程序模块或其他数据。如本文所定义的,计算机存储介质不包括通信介质。
色边字表示
尽管有用于自然图像分析的现有公知局部特征技术,诸如SIFT(尺度不变特征变换),可被有效地用于专业绘图或图像,然而手绘草图通常更简单且抽象,通常缺少详细的纹理,纹理是大多数局部特征中的基础元素。而且,大多数全局特征技术,诸如GIST和ColorHistogram(彩色全息)仅捕捉来自图像的全局统计数据而不对详细的形状结构进行编码。
手绘彩色草图到可用图像数据库的精确匹配最可能使用尽可能多地与人脑比较图像相同的方式比较图像的算法来实现。认知科学的研究已经带来关于人类如何感知图像内的形状和颜色的一些结论。具体而言,关于形状和颜色的视觉感知的两个观察在开发本文描述的色边字表示时已被考虑在内。第一,形状和颜色的人类感知在对象识别过程中精妙地互相关。第二,颜色信息主要在图像的轮廓和角落区域中,而不是在跨整个图像等同地采样的位置处,获得和测量。相应地,本文描述的色边字表示将轮廓和角落区域中的颜色信息和局部形状信息相组合地考虑。
除了编码形状和颜色信息两者之外,色边字表示允许被表示的草图/图像的重现和索引。每个草图/图像由具有坐标的特征袋来表示,以使得对于每个小轮廓段,该轮廓段和该轮廓段的每一侧上的颜色被编码为单一视觉字,在本文中将其称为色边字。
图2示出了示例CEW表示模块136的精选组件。在示例实现中,CEW表示组件136包括局部片检测器202、片定位器204、形状检测器206、形状词汇表208、区域指定器210、颜色检测器212、颜色词汇表214、以及色边字生成器216。
局部片检测器202沿草图或图像的轮廓提取局部片(patch)。
片定位器204确定图像或草图内的该片的位置。在一示例实现中,位置由(x,y)坐标表示。
形状检测器206分析片的轮廓段,将该轮廓段与在形状词汇表208中找到的形状相比较。形状检测器206从形状词汇表208中选择与该片的该轮廓段最接近地相似的形状。
形状词汇表208包括至少类似于图像轮廓段的多个形状。在一示例实现中,形状词汇表208基于在样本图像集中标识的片来构建。例如,来自图像储存库106的图像可被用来构建形状词汇表208。在一示例实现中,100000个片被从所述图像随机采样。随后利用k-medoids(k-中心点)群集算法来对来自所述片的轮廓段分组。两个轮廓段之间的距离可使用例如基础Chamfer距离来测量。随后使用示例群集来定义形状词汇表208中的形状。
如图2中所示,形状词汇表208可基于任何数量的轮廓段群集来构建。例如,形状词汇表208(A)仅基于两个群集。在此示例中,100000个被采样的片被分为仅两个群集。结果是仅包含水平形状和竖直形状的词汇表。这是非常简化的并且很可能不是很有用的形状词汇表。
形状词汇表208(B),208(C),208(D)和208(E)是使用渐增数量的群集构建的越来越复杂的形状词汇表的示例。在所示示例中,形状词汇表208(A),208(B),208(C)和208(D)中的每个形状是直线段。与之相对照,在更复杂的形状词汇表208(E)中,随着大量群集被用于构建形状词汇表,更复杂的形状(包括曲线和/或尖锐的转角)被包括在形状词汇表中。
形状词汇表的大小直接影响在执行彩色草图图像搜索时形状被考虑的程度。即,如果形状词汇表208相对较小(例如,形状词汇表208(A)),则与图像内每个被标识片相关联的形状可能仅是片的实际轮廓段的非常粗略的估计。与之相对,如果形状词汇表208相对较大(例如,形状词汇表208(E)),则与图像内每个被标识片相关联的形状可能是实际轮廓段的更精确的估计。每个片中的轮廓段的表示越准确,作为搜索结果返回的图像内的形状将与被用作搜索基础的用户生成的草图内的形状越紧密地匹配。
区域指定器210将片的一个区域指定为“右侧区域”,且将片的另一区域指定为“左侧区域”。在一示例实现中,区域指定器210基于片与种子片的比较来指定区域,所述种子片基于从形状词汇表208中选择的形状。
颜色检测器212确定片的每个区域的主色。例如,每个区域的主色可被提取并在特定色彩空间中量化。在一示例实现中,根据人类色彩感知将HSV(色调饱和度值)色彩空间218量化到预定数量的桶(bin)。在一个示例中,颜色词汇表214定义36个桶220。HSV色彩空间218被量化为36个桶,其中在低值/饱和区域具有更粗糙的量化,而在高值/饱和区域具有更精细的量化。在替换实现中,颜色词汇表可包括不同数量的颜色桶和/或可基于不同色彩空间。
为了确保用户生成的草图(该草图可包括没有颜色的区域)能够被匹配值各图像,“自由色”(或“百搭色”)222被定义为描述没有用任何颜色绘画的区域的颜色。任何颜色和自由色222之间的距离被定义为0。如此,任何颜色可匹配自由色。
色边字生成器216生成表示片的色边字。在一示例实现中,色边字被表示为基于片位置、所确定的形状、以及所确定的主色的五元组。
图3示出如由局部片检测器202和片定位器204执行的局部片检测和定位的示例。示例图像302包括各种颜色,如由该图像右侧的键所指示的。局部片随后在该图像内被标识,如在图像302(A)中所解说的。
在一示例实现中,局部片检测器202使用Canny边检测器提取显著轮廓,并移除短的琐碎线条。对于单一连续轮廓,局部片检测器202沿该轮廓滑动大小为R X R的片检测窗以标识片,每个片包含一轮廓段和两个相邻局部区域。在一示例实现中,所标识的片可交叠以确保每个片中的轮廓段足够长以毫无模糊地将该片分为两个区域。
在图像或草图的复杂区域中,特定片可包括多个轮廓段。为了确保每个片仅具有一个形状和两个区域,片被定义为具有与片的中心相交的轮廓段,且该轮廓段的末端满足片的边界。
在包括彼此足够靠近或相交的多个轮廓的复杂区域中,多个交叠片可被标识,以使得每个片具有一个相关联的轮廓段(即,与该片的中心相交的段)和两个不同的区域。
每个片的各组分随后在为每个片生成色边字时被考虑。例如,片定位器204确定图像302(A)中与片304相对应的特定位置。该位置可被(x,y)坐标306指定。而且,片304包括三个不同的组分,即:轮廓段308、第一区域310和第二区域312。
图4示出了如由片定位器执行的标识与片相关联形状、如由区域指定器210所执行的指定片的左侧和右侧区域、如由颜色检测器212所执行的标识片中的区域的主色、如由色边字生成器216所执行的生成片的色边字、以及将图像或草图表示为色边字袋。
如上面参考图3所描述的,片304包括轮廓段308。在示例实现中,形状检测器206将沦落段308与形状词汇表208中的各形状相比较。形状词汇表中最接近地类似轮廓段308的形状被选择来表示轮廓段308。在所示示例中,被指定为(v)的形状402被选择来表示轮廓段308。
区域指定器210指定每个片的左侧区域和右侧区域。在一示例实现中,形状词汇表208中的每个形状具有对象的种子片。种子片与该图像中所标识的片大小相同,且包括穿过种子片的中间放置的形状。种子片的两个区域被预定义为左侧区域和右侧区域。
在所示示例中,种子片404对应于形状402并具有预定义的左侧区域和预定义的右侧区域。为了针对区域310和312确定哪个区域是左侧区域而哪个区域是右侧区域,执行片304和种子片404之间的比较,如在406处所示。因为区域310的与种子片404的右侧区域交叠的部分大于区域312的与种子片404的右侧区域交叠的部分,所以区域310被指定为片304的右侧区域。类似地,因为区域312的与种子片404的左侧区域交叠的部分大于区域312的与种子片404的左侧区域交叠的部分,所以区域312被指定为片304的左侧区域。
颜色检测器212标识每个片中每个区域的主色。在所示示例中,区域310是绿色的,而区域312为棕色的。在示例场景中,区域310可实际上包括各种绿色的形状。类似地,区域312可包括各种棕色的形状。而且,区域310可包括绿色之外的少量一种或多种颜色,且类似地,区域312可包括棕色之外的少量一种或多种颜色。
如上所述,每个区域的主色可基于HSV色彩空间中的桶来确定,其中桶对应于人类可感知的颜色。这些桶构成颜色词汇表214。在所示示例中,左侧区域312被确定为具有主色408,其被指定为cL。类似地,右侧区域310被确定为具有主色410,其被指定为cR。
色边字生成器216随后生成每个片的色边字。在所示示例中,五元组412是从(x,y)坐标306、形状(v)402、左侧区域的主色(cL)408、以及右侧区域的主色(cR)410生成的色边字。该色边字由(x,y,v,cL,cR)表示。
该色边字还可由片414视觉地表示,该片包括形状(v)402,其中右侧区域具有颜色(cR)410而左侧区域具有颜色(cL)408。色边字(x,y)的位置组分表示在由该色边字表示的片的图像内的位置。
草图或图像随后被表示为色边字袋。例如,如图4中所示,代表性图像416是从图像或草图302生成的色边字的编译。
彩色草图到图像匹配
如本文所述的,彩色草图图像搜索的目标是接收用户生成的彩色草图并标识数据库(或其它数据储存库,例如因特网)中的类似图像。令Q表示代表彩色草图的色边字集合,其中色边字q∈Q为五元组(xq,yq,vq,cLq,cRq),该五元组具有位置xq=(xq,yq),边字vq,以及色字cq=(cLq,cRq)。类似地,令D表示数据库图像。为了确定D是否是的良好匹配Q,使用一种算法来计算Q和D之间的距离(或相似性),该距离由DistQ,D(或SimQ,D)表示。
Chamfer匹配是基于形状将草图匹配到图像的有效工具。根据定义,从图像D到草图Q的基础Chamfer距离被定义为:
其中|D|是图像D的边像素(边素)的数量,而xp和xq是两个边素的位置。Chamfer匹配尝试针对数据库图像D的每个边素寻找查询草图Q上的最接近边素。在实践中,为了降低从O(|D|×|Q|)到O(|D|)的复杂度,可提前构建查询草图Q的距离转换图。此技术可通过增大存储成本来降低时间成本。对称Chamfer距离由下式给出:
尽管Chamfer匹配及其变型已经在形状匹配中取得了成功,然而Chamfer匹配是为原始曲线匹配设计的,而不能被直接用来匹配色边字。然而,通过一定的修改,开发了一种用于应用到由色边字集合表示的草图和图像的基于Chamfer匹配的新算法。
上面描述的Chamfer匹配算法被修改以使得基础元素是与坐标相关联的任何视觉字,而不是单一像素。而且,经修改的Chamfer算法不是计算如等式1表示的两个像素之间的几何距离,而是根据下式来计算两个视觉字之间的距离:
其中Q和D是任何视觉字集合,而dist(·,·)是特征距离测量。对称的经修改Chamfer距离与等式2相同。
为了将上述经修改的Chamfer算法应用到本文描述的色边字草图/图像表示,将距离函数更改为相似性函数以便据实现索引。一般化的单向相似性被定义为:
且一般化的对称Chamfer相似性被定义为:
如本文定义的,sim(p,q)由三个因子来确定:第一,p和q之间的几何距离,即simxy(p,q);第二,形状相似性simv(p,q);以及第三,颜色相似性simc(p,q)。总相似性由此被定义为:
sim(p,q)=simxy(p,q)·simv(p,q)·simc(p,q) (6)
其中:
simxy(p,q)=δ(||xp-xq||2≤r) (7)
simv(p,q)=δ(vp==vq) (8)
为了支持索引,如将在下面更详细地讨论的,simxy(xp,xq)和simv(vp,vq)两者均采用二元形式,其中如果自变量表达式为真则δ(·)为1,否则为0,且r是用于二元化两个色边字之间的距离(相似性)的参数。如果该距离小于r,则这两个局部轮廓段(即,形状)满足形状相似性阈值。如果该距离不小于r,则这两个局部轮廓段不满足形状相似性阈值。在示例实现中,δ(·)是Dirac Delta(狄拉克增量)函数,其被用来提供快速索引回忆。在示例实现中,可使用连续距离函数来提供进一步的重新排名。
在上式中,s(c1,c2)是基于来自同一侧的两个量化色字的颜色相似性函数。即,c1和c2是两个图像片的左侧区域的主色,或c1和c2是两个图像片的右侧区域的主色。
在本文中被称为“强匹配”的示例实现中,s(c1,c2)=δ(c1==c2)。在本文中被称为“灵活匹配”的示例实现中,s(c1,c2)=max{δ(c1==c2),α},其中0<α<1。强匹配实现刚性地实施草图和图像之间的颜色匹配。与之相对,灵活匹配实现经由参数α提供灵活性,该参数被用来调整颜色和形状之间的偏好。α的值越大,搜索结果越强调形状相似性。换言之,如果α是小值,则前面的搜索结果将包括具有良好形状匹配和良好颜色匹配的图像;随着α的值增大,搜索结果图像具有良好的形状匹配,但是更差的颜色匹配将排名得更高。强匹配实现等同于α=0时的灵活匹配实现。
色边字索引
尽管Chamfer匹配是相对简单的过程,然而仍然难以开发出基于数百万图像的线性扫描的实时系统。然而,通过使用倒置索引,本文描述的匹配算法能被调整尺度到大尺度数据库。
首先参考上述强匹配实现,等式4定义一般化单向相似性。如上所述,等式6中的每个相似性是二元的。从而,等式4中的“max”运算也是二元的。相应地,等式4可被重写为:
其中如果存在满足等式7-9的q∈Q,则为HitQ(P)1,否则HitQ(P)为0。换言之,对于数据库图像中的色边字p,关于在查询草图中的位置xp附近是否存在相似色边字(即,具有相同形状和相同颜色的色边字)做出判断。在示例实现中,此判断使用查询扩大和五元组倒置索引查找来实现。
为了构建倒置索引以支持本文描述的Chamfer匹配,构造字典,以将每个色边字p=(x,y,v,cL,cR)作为字包括在该字典中。色边字字典大小为图像_宽度x图像_高度x|V|x|C|2,其中|V|和|C|是形状词汇表208和颜色词汇表214的大小。
图5示出了强匹配实现的示例倒置索引502。如上所述,针对字典504中的每个色边字构造倒置列表。对于特定色边字,如果数据库中的图像包括该色边字,则与该图像相关联的图像ID被添加到针对该色边字的倒置列表。例如,色边字506具有包括图像ID 1、图像ID3、图像ID 5、图像ID 8……以及图像ID J的倒置列表,指示图像1、3、5、8……和J各包括与色边字506相匹配的片。类似地,色边字508具有包括图像ID 2、图像ID 3、图像ID 7……以及图像ID K的倒置列表。
图6示出了灵活匹配实现的示例倒置索引602。如上所述,在灵活匹配实现中,色字之间的相似性不是二元的。为了捕捉灵活匹配实现为匹配颜色所提供的灵活性,边字字典604包括三元组(x,y,v)作为字,其中每个三元组对应于一个或多个色边字并仅包括位置(x,y)和形状(v)信息。
与上面描述的倒置索引502相似,倒置索引602包括为字典604中的每个边字构建的倒置列表。对于字典604中的特定边字,如果数据库中的图像包括具有相同位置和形状信息的色边字,则与该图像相关联的图像ID被添加到该边字的倒置列表。与倒置索引502相对,因为字典604仅包括位置和形状信息,所以倒置列表中的每个条目除了图像ID之外还包括颜色信息。即,对于数据库图像中具有与字典604中的边字相匹配的位置和形状信息的色边字,该图像的图像ID和来自该色边字的颜色信息被一起存储在倒置索引中。
任选的图像预处理
要使用查询草图搜索的图像可能在大小和分辨率方面极大的不同。在一示例实现中,为了平衡结构信息保留和存储成本,在构建索引之前,每个数据库图像被下采样至最大维度(例如,200个像素)。Canny边检测器随后被用于提取图像的主要对象轮廓。显著性检测器随后可被用来提取主要前景对象,其提供了在匹配期间的特定尺度和平移不变性。所提取的显著性图被扩大(例如,经验性地5个像素)并被用作掩模来移除背景边。剩余的边被各向同性地调整尺度并被定位在中心以提供用于遍历数据库的对象检索的尺度和平移不变性。使用这些预处理技术,自然图像被转换为边图,基于边图色边字特征被提取以构建倒置索引。
颜色传播和查询扩大
图7示出示例颜色传播和查询扩大。当用户提交的查询草图被接收,颜色传播和查询扩大被执行。在示例实现中,草图中的仅被部分着色的区域可用颜色填充以确保精确的色边字表示。而且,为了确保形状定位的某种灵活性,查询草图中的每个色边字被传播至其在距离r内的邻居,如上面参考等式7所定义的。
在所示示例中,用户提交的草图702被接收。颜色传播被执行以将着色区域向上扩展至草图内的轮廓。例如,在所示草图702中,在三角形“之后”的区域大部分被着色。通过颜色传播,三角形“之后”的整个区域被着色。类似地,在所示草图702中,与三角形在一起的区域大部分被着色。通过颜色传播,三角形内的整个区域被着色。颜色传播的结果在草图704中示出。
草图706示出了已在颜色传播草图704内被标识的精选片。草图708示出了查询扩大。查询扩大被执行以在将草图内的位置匹配到图像内的位置时提供一定程度的灵活性。这与上面示出的等式7一致。在所示示例中,片710具有位置坐标(x,y)。虚线圈712具有半径,并定义了表示块710的色边字要针对其相关联的区域。换言之,与片710相关联的色边字v,cL和cR的值也将与虚线圈712内的每个其它位置相关联。相应地,具有相同v,cL和cR值的色边字将针对具有范围为从(x-r,y-r)到(x+r,y+r)的坐标的每个位置生成。r的值越大,在匹配草图和图像之间的位置时存在的灵活性越大。
匹配得分
根据所述强匹配实现,当用户提交的查询草图被接收时,如上所述,表示查询草图的一组色边字被生成。为了标识与该查询草图相匹配的图像搜索结果,倒置索引502被访问以标识具有至少一个与查询草图的色边字相匹配的色边字的每个图像。针对被标识为匹配的每个图像保留记分,以使得具有更高记分计数的图像与具有较低记分计数的图像相比具有更多与查询草图的色边字相匹配的色边字。随后根据等式10针对每个数据库图像计算单向匹配得分。例如,如果特定数据库图像D具有100个色边字,且那些色边字中的25个色边字与查询草图Q的色边字相匹配,则相似性SimD→O=0.25。
类似地,根据所述灵活匹配实现,当用户提交的查询草图被接收时,如上所述,表示查询草图的一组色边字被生成。为了标识与该查询草图相匹配的图像搜索结果,倒置索引602被访问以标识具有至少一个与查询草图的色边字的位置和形状信息相匹配的色边字(x,y,v)的每个图像。不是为被标识为匹配的每个图像保留记分,每当一匹配被标识,就根据等式9来评估颜色相似性,并且对于被标识为匹配的每个图像,维持所评估的颜色相似性值的和。随后根据等式4针对每个数据库图像计算单向匹配得分。
如上所述,倒置索引502和602是单向索引。在一示例实现中,另一索引结构可被构建以计算SimQ→D,且等式5随后可被用来计算每个图像的最终匹配得分。然而,为了构建这样的索引,应当针对每个数据库图像中的每个色边字执行图像扩大,这将显著增加存储成本。
相应地,在替换实现中,使用,回忆阈值数量的候选图像(例如前5000个)。这些候选图像被线性扫描以使用等式5计算这些图像中的每个图像的最终匹配得分。在一示例实现中,根据最终匹配得分对查询结果排名以便显示。在一些实现中,可使用连续距离函数执行进一步的重新排名。
示例用户界面
图8示出了用于提交彩色草图作为查询的示例用户界面800。在所示示例中,彩色草图图像搜索是作为搜索引擎的一部分实现的。相应地,用户界面800被描绘为浏览器界面。然而,如同上面讨论的,彩色草图搜索还可在各种其它环境中实现。如此,如本文所述的用户界面800的各组件可作为其它应用用户界面的组件来实现,诸如相片库应用、文档生成应用的剪贴画组件等等。
示例用户界面800包括绘制画布802、绘画工具804、拾色器806、以及查询提交按钮808。绘画工具804可包括例如二元钢笔810、彩色铅笔812、色桶814、以及色刷816。
通过选择颜色和工具,用户在绘制画布802内创建草图。当满意草图时,用户选择查询提交按钮808来将该草图作为查询发送给搜索引擎。
图9示出了示例查询草图生成。作为第一示例,可使用二元钢笔810和色桶814来生成美国国旗的草图。在第一步骤902中,使用二元钢笔810,用户绘制国旗的黑色轮廓。在第二步骤904中,使用色桶814,用户用蓝色填充国旗的方形部分。在第三步骤906中,使用色桶814,用户用红色和白色填充条纹。
作为第二示例,使用二元钢笔810和色刷816生成建筑物的草图。在第一步骤908中,使用二元钢笔810,用户绘制建筑物的黑色轮廓。在第二步骤910中,使用色刷816,用户添加蓝色以指定建筑物上方的背景。在第三步骤912中,使用色刷816,用户添加绿色以指定建筑物下方的前景。
作为第三示例,使用彩色铅笔812生成草莓的草图。在第一步骤914中,用户选择红色,并绘制草莓的轮廓。在第二步骤916中,用户选择绿色,并绘制草莓顶部的叶子的轮廓。在第三步骤918中,用户选择黄色,并在草莓的轮廓内添加代表种子的点。
作为第四示例,使用色刷816生成夜晚的埃菲尔铁塔的草图。在第一步骤920中,用户选择蓝色,并绘制表示埃菲尔铁塔的三角形。在第二步骤922中,用户选择黄色,并绘制铁塔紧下方的被照亮区域。在第三步骤924中,用户选择黑色,填充背景来表示夜空。
示例操作
图10-12示出了用于实现如本文所述的彩色草图图像的示例过程。这些过程被示为逻辑流程图中的各框的集合,这表示可用硬件、软件或其组合实现的一系列操作。在软件的上下文中,这些框表示存储在一个或多个计算机存储介质上的计算机可执行指令,这些指令在由一个或多个处理器执行时使得这些处理器执行既定操作。注意,描述过程的次序并不旨在解释为限制,并且任何数目的所述过程框可以按任何次序组合以实现所述过程或替换过程。另外,可从过程中删除各个框,而不背离此处所述的主题的精神和范围。而且,尽管这些过程是参考上面参考图1和2描述的计算环境100的组件描述的,然而其它计算机架构可整体或部分地实现这些过程的一个或多个部分。
图10示出了用于实现如本文所述的彩色草图图像的示例过程。
在框1002,预处理数据库图像。如上所述,可对照图像储存库的任何变型来执行彩色草图图像搜索,包括但不限于:剪贴画库、相片库、或通过因特网可用的图像。由于在这些图像之间可能存在很广的变化,所以图像预处理模块142对图像进行预处理来将每个图像转换为边图。
在框1004,从数据库图像提取色边字。例如,色边字表示模块136从如在框1002描述地生成的边图来提取色边字。用于从图像或草图提取色边字的过程在下面参考图12更详细地描述。
在框1006,构建倒置索引。例如,如上面参考图5和图6所描述的,索引模块140基于从数据库图像提取的色边字来构建倒置索引。
在框1008,接收查询草图。例如,用户生成的查询草图经由网络108被从浏览器应用118传送到搜索引擎132。
在框1010,预处理查询草图。例如,如上面参考图7描述的,局部片检测器202可执行颜色传播、查询扩大、以及片检测。作为结果,在该搜索查询内标识多个片,其中每个片包括将片分为两个区域的轮廓段。
在框1012,从查询草图提取色边字。例如,对于每个片,片定位器204确定与该片相关联的位置坐标,形状检测器206从形状词汇表208确定表示片的轮廓段的形状,区域指定器210指定片的“右侧区域”和“左侧区域”,且颜色检测器212使用颜色词汇表214分析每个区域的颜色来确定每个区域的主色。基于此信息,色边字生成器206生成每个片的色边字。用于从图像或草图提取色边字的过程在下面参考图12更详细地描述。
在框1014,将从查询草图提取的色边字与倒置索引进行比较以标识查询结果。例如,如上面参考图5和图6所述,匹配模块138与查询草图相关地计算每个数据库图像的相似性得分。
在框1016,对查询结果排名。例如,如上面参考图5和图6描述的,匹配模块138根据类似度得分对查询结果排名。
在框1018,返回查询结果。例如,搜索引擎132通过网络108将图像的经排名列表返回至浏览器应用118。
图11示出了用于预处理数据库图像以将每个图像转换为边图的示例过程。
在框1102,对图像进行下采样。例如,图像预处理模块142对图像进行下采样来实施最大维度。
在框1104,提取对象轮廓。例如,图像预处理模块142利用canny边检测器来提取主要对象轮廓。
在框1106,提取前景对象。例如,图像预处理模块142使用显著性检测器来提取主要前景对象,从而带来二元显著性图。
在框1108,移除背景边。例如,图像预处理模块142使用二进制显著性图作为用于移除背景边的图(map)。
在框1110,边被各向异性地调整尺度并定位在中心。例如,图像预处理模块142调整尺度以及重新定位剩余边以提供用于对象检索的尺度和平移不变性。
图12示出了用于生成图像或草图的色边字表示的示例过程。
在框1202,接收草图或图像。例如,来自图像储存库106的图像被访问或用户生成的草图被接收。
在框1204,执行局部片检测。例如,沿图像中的每个连续轮廓来标识局部片。每个局部片被标识,以使得该轮廓的一段穿过片的中心且该轮廓段的两端与片的边界连接。该轮廓段将该片分为两个区域,在该轮廓段的任一侧有一个区域。
在框1206,检测每个片的位置。例如,片定位器204确定与该片的中心相对应的(x,y)坐标。
在框1208,标识与每个片相关联的形状。例如,形状检测器206将穿过该片的中心的轮廓段与形状词汇表208中的形状进行比较。形状词汇表208中的最接近地类似于该轮廓段的形状被选为与该片相关联的形状。
在框1210,针对每个片指定左侧区域和右侧区域。例如,区域指定器210将在该轮廓段的一侧上的区域指定为“左侧区域”其恶将在该轮廓段的另一侧上的区域指定为“右侧区域”。关于用于确定哪个区域被指定为“左侧区域”而哪个区域被指定为“右侧区域”的示例过程的更多细节在下面参考图5来描述。
在框1212,标识每个片中的每个区域的主色。例如,颜色检测器212针对每个区域确定要与该区域相关联的主色。
颜色检测器212分析该片的每个区域,并且针对每个区域确定该区域的主色。例如,颜色检测器212可确定36个HSV桶中的哪个HSV桶与该区域最相似。基于该区域的平均颜色值或者基于该区域内与该HSV桶中的每个HSV桶相对应的像素数可确定该区域的主色,其中对应于最多像素的桶被选为该区域的主色。
在框1214,针对每个片生成色边字。例如,色边字生成器214将位置、形状、左侧区域颜色和右侧区域颜色进行组合来形成色边字。在一示例实现中,色边字由五元组(x,y,v,cL,cR)表示,其中x和y是该片的中心在该图像或草图内的坐标,v对应于表示穿过该片的中心的轮廓段的形状,cL是该片的左侧区域的主色,而cR是该片的右侧区域的主色。
在框1216,草图或图像随后被表示为色边字袋。例如,草图或图像由针对为该草图或图像标识的所有片生成的色边字集合来表示。
结语
尽管已经用结构特征和/或方法运算专用的语言描述了本主题,但要理解,所附权利要求书中定义的主题不必限于所描述的具体特征或操作。相反,这些具体特征和动作是作为实现权利要求的示例形式来公开的。
Claims (20)
1.一种系统,包括:
至少一个处理器;以及
存储器,所述存储器包括指令,在所述指令被所述至少一个处理器执行时,致使所述至少一个处理器执行操作以:
向计算设备提供搜索草图用户界面,其中所述搜索草图用户界面包括用于创建包括轮廓的草图的绘制工具;
标识所述轮廓的段;
确定所述草图的色边字,所述色边字包括所述段的形状、所述草图中在所述段的第一侧上的部分的颜色、和所述草图中在所述段的第二侧上的部分的颜色;以及
向所述计算设备呈现搜索结果用户界面,所述搜索结果用户界面包括基于所述草图的所述色边字与图像结果的色边字之间的相似性的所述图像结果。
2.如权利要求1所述的系统,其特征在于,所述草图包括以下一者或多者的任何组合:
由所述绘制工具的二元钢笔工具生成的线条;
由所述绘制工具的彩色铅笔工具生成的线条;
由所述绘制工具的色桶工具生成的颜色区域;或者
由所述绘制工具的色刷工具生成的颜色区域。
3.如权利要求1所述的系统,其特征在于,进一步包括进行以下操作的指令:
定义所述图像结果的所述色边字以表示在所述图像结果内的位置、位于所述位置处的轮廓段的形状、所述图像结果中位于所述段的第一侧的部分的颜色、和所述图像结果中位于所述段的第二侧的部分的颜色;以及
将所述色边字添加到第二色边字集合。
4.如权利要求3所述的系统,其特征在于,进一步包括进行以下操作的指令:
将所述草图的所述色边字添加到第一色边字集合;
计算所述第二色边字集合中与所述第一色边字集合中的色边字相匹配的色边字的数量作为匹配值;以及
通过用所述匹配值除以所述第二色边字集合中的色边字的总数来计算所述图像结果与所述草图的相似性。
5.如权利要求4所述的系统,其特征在于,进一步包括进行以下操作的指令:
计算多个图像中的每一个图像与所述草图的相似性;
基于计算出的所述相似性对所述多个图像进行排名;以及
基于所述搜索结果用户界面中的所述排名显示所述多个图像中的一个或多个图像。
6.如权利要求5所述的系统,其特征在于,所述多个图像中的一个或多个图像以基于所述排名的顺序被显示在所述搜索结果用户界面中。
7.如权利要求1所述的系统,其特征在于,所述段被标识成沿着所述草图内的所述轮廓的特定片。
8.如权利要求7所述的系统,其特征在于,使用所述特定片的坐标确定所述特定片的位置。
9.如权利要求1所述的系统,其特征在于,通过将所述段与被包括在形状词汇表中的形状进行比较来确定所述段的形状,其中,基于所述轮廓最接近所述形状来选择所述形状。
10.如权利要求1所述的系统,其特征在于,所述草图中在所述段的第一侧上的部分的所述颜色被确定为在所述段的第一侧上的区域的主色。
11.如权利要求1所述的系统,其特征在于,所述草图中在所述段的第二侧上的部分的所述颜色被确定为在所述段的第二侧上的区域的主色。
12.至少一个计算机可读介质,所述至少一个计算机可读介质包括指令,在所述指令被至少一个处理器执行时,使得所述至少一个处理器执行操作以:
向计算设备提供搜索草图用户界面,其中所述搜索草图用户界面包括用于创建包括轮廓的草图的绘制工具;
标识所述轮廓的段;
确定所述草图的色边字,所述色边字包括所述段的形状、所述草图中在所述段的第一侧上的部分的颜色、和所述草图中在所述段的第二侧上的部分的颜色;以及
向所述计算设备呈现搜索结果用户界面,所述搜索结果用户界面包括基于所述草图的所述色边字与图像结果的色边字之间的相似性的所述图像结果。
13.如权利要求12所述的至少一个计算机可读介质,其特征在于,所述草图包括以下一者或多者的任何组合:
由所述绘制工具的二元钢笔工具生成的线条;
由所述绘制工具的彩色铅笔工具生成的线条;
由所述绘制工具的色桶工具生成的颜色区域;或者
由所述绘制工具的色刷工具生成的颜色区域。
14.如权利要求12所述的至少一个计算机可读介质,其特征在于,进一步包括进行以下操作的指令:
定义所述图像结果的所述色边字以表示在所述图像结果内的位置、位于所述位置处的轮廓段的形状、所述图像结果中位于所述段的第一侧的部分的颜色、和所述图像结果中位于所述段的第二侧的部分的颜色;以及
将所述色边字添加到第二色边字集合。
15.如权利要求14所述的至少一个计算机可读介质,其特征在于,进一步包括进行以下操作的指令:
将所述草图的所述色边字添加到第一色边字集合;
计算所述第二色边字集合中与所述第一色边字集合中的色边字相匹配的色边字的数量作为匹配值;以及
通过用所述匹配值除以所述第二色边字集合中的色边字的总数来计算所述图像结果与所述草图的相似性。
16.如权利要求15所述的至少一个计算机可读介质,其特征在于,进一步包括进行以下操作的指令:
计算多个图像中的每一个图像与所述草图的相似性;
基于计算出的所述相似性对所述多个图像进行排名;以及
基于所述搜索结果用户界面中的所述排名显示所述多个图像中的一个或多个图像。
17.一种方法,包括:
向计算设备提供搜索草图用户界面,所述搜索草图用户界面包括用于创建包括轮廓的草图的绘制工具;
标识所述轮廓的段;
确定所述草图的色边字,所述色边字包括所述段的形状、所述草图中在所述段的第一侧上的部分的颜色、和所述草图中在所述段的第二侧上的部分的颜色;以及
向所述计算设备呈现搜索结果用户界面,所述搜索结果用户界面包括基于所述草图的所述色边字与图像结果的色边字之间的相似性的所述图像结果。
18.如权利要求17所述的方法,其特征在于,所述草图包括以下一者或多者的任何组合:
由所述绘制工具的二元钢笔工具生成的线条;
由所述绘制工具的彩色铅笔工具生成的线条;
由所述绘制工具的色桶工具生成的颜色区域;或者
由所述绘制工具的色刷工具生成的颜色区域。
19.如权利要求17所述的方法,其特征在于,进一步包括:
定义所述图像结果的所述色边字以表示在所述图像结果内的位置、位于所述位置处的轮廓段的形状、所述图像结果中位于所述段的第一侧的部分的颜色、和所述图像结果中位于所述段的第二侧的部分的颜色;以及
将所述色边字添加到第二色边字集合。
20.如权利要求19所述的方法,其特征在于,进一步包括:
将所述草图的所述色边字添加到第一色边字集合;
计算所述第二色边字集合中与所述第一色边字集合中的色边字相匹配的色边字的数量作为匹配值;以及
通过用所述匹配值除以所述第二色边字集合中的色边字的总数来计算所述图像结果与所述草图的相似性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910660658.8A CN110413816B (zh) | 2013-06-14 | 2013-06-14 | 彩色草图图像搜索 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910660658.8A CN110413816B (zh) | 2013-06-14 | 2013-06-14 | 彩色草图图像搜索 |
CN201380077462.7A CN105493078B (zh) | 2013-06-14 | 2013-06-14 | 彩色草图图像搜索 |
PCT/CN2013/077211 WO2014198051A1 (en) | 2013-06-14 | 2013-06-14 | Color sketch image searching |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380077462.7A Division CN105493078B (zh) | 2013-06-14 | 2013-06-14 | 彩色草图图像搜索 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110413816A CN110413816A (zh) | 2019-11-05 |
CN110413816B true CN110413816B (zh) | 2023-09-01 |
Family
ID=52021577
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910660658.8A Active CN110413816B (zh) | 2013-06-14 | 2013-06-14 | 彩色草图图像搜索 |
CN201380077462.7A Active CN105493078B (zh) | 2013-06-14 | 2013-06-14 | 彩色草图图像搜索 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380077462.7A Active CN105493078B (zh) | 2013-06-14 | 2013-06-14 | 彩色草图图像搜索 |
Country Status (4)
Country | Link |
---|---|
US (2) | US9875253B2 (zh) |
EP (1) | EP3008632A4 (zh) |
CN (2) | CN110413816B (zh) |
WO (1) | WO2014198051A1 (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413816B (zh) | 2013-06-14 | 2023-09-01 | 微软技术许可有限责任公司 | 彩色草图图像搜索 |
KR101912794B1 (ko) * | 2013-11-27 | 2018-10-29 | 한화테크윈 주식회사 | 영상 검색 시스템 및 영상 검색 방법 |
WO2017020140A1 (es) * | 2015-08-03 | 2017-02-09 | Orand S.A. | Sistema de búsqueda de imágenes por sketches usando histogramas de orientaciones de celdas y extracción de contornos basado en características de nivel medio |
CN106202189A (zh) * | 2016-06-27 | 2016-12-07 | 乐视控股(北京)有限公司 | 一种图像搜索方法及装置 |
KR102444148B1 (ko) * | 2017-04-17 | 2022-09-19 | 삼성전자주식회사 | 전자 장치 및 그 동작 방법 |
US10380175B2 (en) | 2017-06-06 | 2019-08-13 | International Business Machines Corporation | Sketch-based image retrieval using feedback and hierarchies |
US10902053B2 (en) * | 2017-12-21 | 2021-01-26 | Adobe Inc. | Shape-based graphics search |
US11232596B2 (en) * | 2018-05-09 | 2022-01-25 | Reflektion, Inc. | Search quality improvement using color synonyms |
JP7095738B2 (ja) * | 2018-06-13 | 2022-07-05 | 富士通株式会社 | 取得方法、生成方法、取得プログラム、生成プログラムおよび情報処理装置 |
CN109389660A (zh) * | 2018-09-28 | 2019-02-26 | 百度在线网络技术(北京)有限公司 | 图像生成方法和装置 |
CN110659680B (zh) * | 2019-09-16 | 2022-02-11 | 西安电子科技大学 | 一种基于多尺度卷积的图像patch匹配方法 |
CN112069336B (zh) * | 2020-08-04 | 2022-10-14 | 中国科学院软件研究所 | 一种基于场景草图的细粒度图像检索方法及系统 |
CN113010741B (zh) * | 2021-03-30 | 2023-09-05 | 南京大学 | 基于草图的移动应用模型查询方法 |
US12039634B2 (en) * | 2022-05-09 | 2024-07-16 | Adobe Inc. | Three-dimensional vector-based brushes |
CN116737982B (zh) * | 2023-08-11 | 2023-10-31 | 拓锐科技有限公司 | 一种基于数据分析的图片搜索结果智能筛选管理系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101211341A (zh) * | 2006-12-29 | 2008-07-02 | 上海芯盛电子科技有限公司 | 图像智能模式识别搜索方法 |
CN101329677A (zh) * | 2008-05-07 | 2008-12-24 | 裴亚军 | 基于图像内容的图像搜索引擎 |
CN101739397A (zh) * | 2008-11-17 | 2010-06-16 | 新疆亚奥数码科技有限公司 | 基于mpeg-7的图像检索系统 |
CN102902807A (zh) * | 2011-10-18 | 2013-01-30 | 微软公司 | 使用多个视觉输入模态的视觉搜索 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100422805B1 (ko) * | 2000-12-26 | 2004-03-12 | 한국전자통신연구원 | 자연어를 이용한 이미지 데이터 색상 및 형태 검색 장치및 그 방법 |
JP2007206919A (ja) * | 2006-02-01 | 2007-08-16 | Sony Corp | 表示制御装置および方法、プログラム、並びに記録媒体 |
CN101159064B (zh) | 2007-11-29 | 2010-09-01 | 腾讯科技(深圳)有限公司 | 画像生成系统以及按照图像生成画像的方法 |
CN102265598A (zh) * | 2008-10-26 | 2011-11-30 | 惠普开发有限公司 | 使用基于内容的过滤和基于主题的聚类将图像布置到页面中 |
US8223402B2 (en) * | 2009-05-04 | 2012-07-17 | Xerox Corporation | Color trapping on a halftoned bi-level bitmap |
US8861844B2 (en) * | 2010-03-29 | 2014-10-14 | Ebay Inc. | Pre-computing digests for image similarity searching of image-based listings in a network-based publication system |
US9449026B2 (en) * | 2010-08-31 | 2016-09-20 | Microsoft Technology Licensing, Llc | Sketch-based image search |
US8447752B2 (en) * | 2010-09-16 | 2013-05-21 | Microsoft Corporation | Image search by interactive sketching and tagging |
US20120162244A1 (en) | 2010-12-28 | 2012-06-28 | Microsoft Corporation | Image search color sketch filtering |
US8589410B2 (en) * | 2011-10-18 | 2013-11-19 | Microsoft Corporation | Visual search using multiple visual input modalities |
CN110413816B (zh) | 2013-06-14 | 2023-09-01 | 微软技术许可有限责任公司 | 彩色草图图像搜索 |
-
2013
- 2013-06-14 CN CN201910660658.8A patent/CN110413816B/zh active Active
- 2013-06-14 CN CN201380077462.7A patent/CN105493078B/zh active Active
- 2013-06-14 EP EP13886716.3A patent/EP3008632A4/en not_active Withdrawn
- 2013-06-14 US US14/898,117 patent/US9875253B2/en active Active
- 2013-06-14 WO PCT/CN2013/077211 patent/WO2014198051A1/en active Application Filing
-
2017
- 2017-12-15 US US15/844,376 patent/US10528620B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101211341A (zh) * | 2006-12-29 | 2008-07-02 | 上海芯盛电子科技有限公司 | 图像智能模式识别搜索方法 |
CN101329677A (zh) * | 2008-05-07 | 2008-12-24 | 裴亚军 | 基于图像内容的图像搜索引擎 |
CN101739397A (zh) * | 2008-11-17 | 2010-06-16 | 新疆亚奥数码科技有限公司 | 基于mpeg-7的图像检索系统 |
CN102902807A (zh) * | 2011-10-18 | 2013-01-30 | 微软公司 | 使用多个视觉输入模态的视觉搜索 |
Also Published As
Publication number | Publication date |
---|---|
EP3008632A1 (en) | 2016-04-20 |
US9875253B2 (en) | 2018-01-23 |
US10528620B2 (en) | 2020-01-07 |
WO2014198051A1 (en) | 2014-12-18 |
CN105493078A (zh) | 2016-04-13 |
EP3008632A4 (en) | 2016-06-01 |
US20160132498A1 (en) | 2016-05-12 |
US20180129658A1 (en) | 2018-05-10 |
CN105493078B (zh) | 2019-07-23 |
CN110413816A (zh) | 2019-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110413816B (zh) | 彩色草图图像搜索 | |
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
US9449026B2 (en) | Sketch-based image search | |
CN104200240B (zh) | 一种基于内容自适应哈希编码的草图检索方法 | |
US9507803B2 (en) | Visual search using multiple visual input modalities | |
CN102073748B (zh) | 一种基于视觉关键词的遥感影像语义检索方法 | |
JP4545641B2 (ja) | 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体 | |
US11704357B2 (en) | Shape-based graphics search | |
CN106484692B (zh) | 一种三维模型检索方法 | |
AU2014321165A1 (en) | Image searching method and apparatus | |
CN110956213A (zh) | 遥感影像特征库生成、遥感影像检索方法及装置 | |
Zhao et al. | Learning best views of 3D shapes from sketch contour | |
Martinet et al. | A relational vector space model using an advanced weighting scheme for image retrieval | |
CN111354076A (zh) | 一种基于嵌入空间的单幅图像三维零件组合式建模方法 | |
JP4570995B2 (ja) | マッチング方法およびマッチング装置ならびにプログラム | |
Meng et al. | Merged region based image retrieval | |
KR100609022B1 (ko) | 공간관계와 주석을 이용한 이미지 검색 방법 | |
JP2013008142A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
Mumar | Image retrieval using SURF features | |
Yang et al. | Zero-Shot Sketch-Based Remote-Sensing Image Retrieval Based on Multi-Level and Attention-Guided Tokenization | |
Memon et al. | Localization in images matching through region-based similarity technique for content-based image retrieval | |
Greve et al. | Classification of image regions using the wavelet standard deviation descriptor | |
Islam et al. | Feature-based Intelligent Image Retrieval Algorithms: A Comparison | |
Li et al. | Artistic mosaic series generation | |
Cyriac | Winding Number Algorithm for Reverse Image Search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |