CN101517616A - 使用分类技术来从图像中提取主色 - Google Patents
使用分类技术来从图像中提取主色 Download PDFInfo
- Publication number
- CN101517616A CN101517616A CNA2007800352494A CN200780035249A CN101517616A CN 101517616 A CN101517616 A CN 101517616A CN A2007800352494 A CNA2007800352494 A CN A2007800352494A CN 200780035249 A CN200780035249 A CN 200780035249A CN 101517616 A CN101517616 A CN 101517616A
- Authority
- CN
- China
- Prior art keywords
- color
- dominant colors
- image
- candidate dominant
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
提供了一种用于生成检测图像的主色的检测器的方法和系统。主色系统训练检测器将颜色分类为图像的主色。主色系统使用训练图像的集合来训练该检测器。为了训练检测器,主色系统首先标识训练图像的候选主色。主色系统然后提取候选主色的特征。主色系统还输入每一个候选主色的优势度的指示。主色系统然后将候选主色的所提取的特征和优势度的指示用作训练数据来训练检测器检测图像的主色。
Description
背景
如Google和Overture等许多搜索引擎服务允许对能经由因特网访问的信息进行搜索。这些搜索引擎服务允许用户搜索用户可能感兴趣的显示页面,如网页。在用户提交包含搜索项的搜索请求(即,查询)之后,搜索引擎服务标识可能与这些搜索项相关的网页。为快速标识相关的网页,搜索引擎服务可维护关键词到网页的映射。该映射可以通过“爬寻(crawl)”web(即,万维网)来标识每一网页的关键词来生成。为爬寻web,搜索引擎服务可使用根网页列表来标识能通过这些根网页访问的所有网页。任何特定网页的关键词可使用各种公知信息检索技术来标识,如标识标题行的文字、在网页的元数据中提供的文字、突出显示的文字等等。搜索引擎服务基于网页的关键词与查询的文字匹配得如何来标识可能与搜索请求相关的网页。搜索引擎服务随后将到所标识的网页的链接以基于可以按照其与查询的相关度、流行度、重要性和/或其它度量来确定的排名的顺序显示给用户。
因特网正越来越多地用于搜索和查看图像(例如,照片)。为了支持该用途,商用搜索引擎服务自2005年以来已定位并索引了超过10亿个图像。用于网页图像的索引技术通常以类似网页索引的方式来工作。一旦搜索引擎服务标识了一图像,它就试图从包含该图像的网页上的、该图像周围的文本或从其他网页上引用包含该图像的网页的链接周围的文本中标识与该图像有关的关键词。搜索引擎服务然后创建从这些关键词到该图像的映射。用户然后可以在搜索一图像时提交文本查询。例如,对定位关于老虎的图像感兴趣的用户可提交查询“老虎动物”。搜索引擎服务然后可以在关键词索引中搜索关键词“老虎”和“动物”以便定位相关图像。搜索引擎服务显示每一张相关图像的缩略图作为搜索结果。
为了帮助改进搜索图像,已使用基于内容的图像检索技术。某些基于内容的图像检索技术使用诸如颜色、纹理和锐度等低级特征来表示图像。然而,这些低级特征没有有效地表示图像的语义。某些基于内容的图像检索技术使用诸如主色和图像类型(例如,照片或图形)等中级特征来表示图像。这些中级特征往往提供比低级特征更具语义的信息并由此在搜索图像时更有用。
图像的主色能够由搜索引擎服务以不同的方式用来改善搜索体验。例如,搜索引擎服务可允许用户连同表达所需图像的语义的关键词一起输入主色作为所需图像的视觉特征。由此,查询可由关键词“老虎森林”和主色“绿”组成。作为另一示例,搜索引擎服务可标识匹配查询的关键词的图像并且然后基于其主色来群集所标识的图像。为了便于主色的使用,搜索引擎服务可基于图像的主色来索引其图像。
图像的主色还可在搜索之外的应用中使用。在计算机显示器或电视上显示图像的系统可自动生成围绕每一个图像的遮片(matte)。这些系统可基于主色来为该遮片选择颜色。例如,为该遮片选择的颜色可以是与图像的主色互补的颜色。其他系统在显示图像或视频时生成环境光。这些系统可为该环境光选择基于当前正在显示的图像或视频帧的主色的颜色。
用于标识图像的主色的现有技术通常选择在图像中出现最频繁的颜色或应用某一统计算法。然而,这些当前技术并不能总是将适当的颜色标识为主色。例如,如果一图像中25%的像素是一种颜色而75%的像素是非常相似的颜色(与第一种颜色有很大的不同),但是不超过5%的像素是任一种相似的颜色,则当前技术可能错误地将25%的像素的颜色选为主色。
概述
提供了一种用于生成检测图像的主色的检测器的方法和系统。主色系统训练检测器将颜色分类为图像的主色。主色系统使用训练图像的集合来训练该检测器。为了训练检测器,主色系统首先标识训练图像的候选主色。主色系统然后提取候选主色的特征。所提取的候选主色的特征中的某一些可基于该候选主色与该图像的特定区域内的颜色之间的差异。主色系统还输入每一个候选主色的优势度的指示。主色系统然后将候选主色的所提取的特征和优势度的指示用作训练数据来训练检测器检测图像的主色。主色系统可基于各种分类技术来训练检测器。一旦训练了检测器,检测器就可由各种应用程序用来标识目标图像的主色。为了标识主色,应用程序使用用于标识训练图像的候选主色的相同的技术来标识目标图像的候选主色。应用程序然后同样使用用于提取训练图像的候选主色的特征的相同的技术来提取候选主色的特征。应用程序然后将检测器应用于每一个所提取的候选主色的特征来生成指示该候选主色对于目标图像的优势度的分数。应用程序然后可将具有最高分数的候选主色选为目标图像的主色。
提供本概述以便以简化的形式介绍将在以下详细描述中进一步描述的一些概念。该概述不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
附图简述
图1是示出一个实施例中的主色系统的各组件的框图。
图2是示出一个实施例中的主色系统的生成检测器组件的处理的流程图。
图3是示出一个实施例中的主色系统的标识候选主色组件的处理的流程图。
图4是示出一个实施例中的主色系统的变换色彩空间组件的处理的流程图。
图5是示出一个实施例中的主色系统的将颜色量化为柱组件的处理的流程图。
图6是示出一个实施例中的主色系统的计算平均色组件的处理的流程图。
图7是示出一个实施例中的主色系统的计算权重组件的处理的流程图。
图8是示出一个实施例中的主色系统的群集颜色组件的处理的流程图。
图9是示出一个实施例中的主色系统的过滤颜色组件的处理的流程图。
图10是示出一个实施例中的主色系统的提取候选主色的特征组件的处理的流程图。
图11是示出一个实施例中的主色系统的计算图像中的差异分布组件的处理的流程图。
图12是示出一个实施例中的主色系统的计算与周围颜色的差异组件的处理的流程图。
图13是示出一个实施例中的主色系统的标识主色组件的处理的流程图。
详细描述
提供了一种用于生成检测图像的主色的检测器的方法和系统。在一个实施例中,主色系统训练检测器将颜色分类为图像的主色。主色系统使用训练图像的集合来训练该检测器。例如,训练图像可以是由搜索引擎服务索引的图像的子集。为了训练检测器,主色系统首先标识训练图像的候选主色。主色系统可使用诸如选择具有最高频率的颜色等用于标识候选主色的常规技术,或者可使用如以下所描述的群集技术。主色系统然后提取候选主色的特征。所提取的候选主色的特征中的某一些可基于该候选主色与该图像的特定区域内的颜色之间的差异。例如,一个提取的特征可基于候选主色与同图像中的关注区域(attention area)相关联的颜色之间的差异。主色系统还输入每一个候选主色的优势度的指示。指示可以是二进制值(即,主导或非主导)、其他离散值(例如,极度、高、正常和低)或连续值(例如,0和1之间的实数值)。优势度的指示可以是来自审阅训练图像并提供其对候选主色的优势度的意见的人的输入。主色系统然后将候选主色的所提取的特征和优势度的指示用作训练数据来训练检测器检测图像的主色。主色系统可基于诸如支持向量机(“SVM”)、自适应增强和神经网络等各种分类技术来训练检测器。一旦训练了检测器,检测器就可由各种应用程序用来标识目标图像的主色。为了标识主色,应用程序使用用于标识训练图像的候选主色的相同的技术来标识目标图像的候选主色。应用程序然后再次使用用于提取训练图像的候选主色的特征的相同的技术来提取候选主色的特征。应用程序然后将检测器应用于每一个所提取的候选主色的特征来生成指示该候选主色对于目标图像的优势度的分数。应用程序然后可将具有最高分数的候选主色选为目标图像的主色。以此方式,可基于从训练数据学习哪些候选主色的特征最能指示颜色的优势度来标识图像的主色。
在一个实施例中,主色系统通过将图像的颜色量化为柱(bin)、计算各柱的代表色、计算各柱的权重、以各权重为因子群集各代表色、并且然后过滤掉权重过低的代表色来标识图像的候选主色。主色系统认为在过滤之后剩余的代表色是图像的候选主色。主色系统首先将图像的颜色转换为大致在知觉上统一的色彩空间,以使得颜色之间的相似性可基于色彩空间中的欧几里得距离。例如,主色系统可以在CIE L*a*b色彩空间中表示颜色。在这种情况下,如果图像的颜色在诸如RGB等另一色彩空间中,则主色系统使用本领域内公知的技术来将该图像的颜色变换到CIE L*a*b色彩空间。如由以下公式所表示地,主色系统可使用欧几里得距离度量来表示颜色之间的差异:
其中,L、a和b表示CIE L*a*b空间中的色彩分量。
在一个实施例中,主色系统将图像的颜色量化为柱以降低标识候选主色的计算复杂度。主色系统基于对色彩分量的量化来标识柱。主色系统可根据以下表来定义各柱:
色彩分量 | 范围 | 柱数 | 柱阈值 |
L | 0→100 | 10 | 10,20,...,90 |
a | -86.183→98.235 | 19 | -80,-70,...,90 |
b | -107.865→94.477 | 21 | -100,-90,...,90 |
由此,主色系统定义了3990个柱(即,10×19×21)。本领域的技术人员可以理解可以使用不同数量的柱和不同的阈值。例如,柱阈值可以以5为间隔(例如,5、10和15),从而得到大约八倍之多的柱,或者以20为间隔(例如,20、40和60),从而得到约八分之一多的柱。主色系统将图像的每一个像素的每一种颜色添加到适当的柱。例如,主色系统将颜色(21,101,39)添加到由阈值20、100和-30表示的柱。主色系统然后基于柱中的颜色来计算每一个柱的代表色。主色系统可将柱中的平均色选为该柱的代表色。主色系统还为每一代表色生成一权重,其最初被设置为柱中的颜色总数的百分比。例如,如果图像具有160×160个像素而一个柱具有256个像素,则该柱的代表色的权重可以是.01(即,256/(160×160))。
在一个实施例中,主色系统群集各代表色并将所群集的代表色选为候选主色。主色系统最初认为每一个代表色都是一个代表色的聚类。主色系统连续标识如由公式1的差异度量指示的最相似的代表色对。主色系统然后以各代表色的权重为因子将各代表色组合成单个组合代表色,并且然后将其权重组合成单个组合权重。主色系统可使用线性或非线性加权技术来组合代表色和权重。例如,主色系统可基于以下公式来线性地组合代表色:
其中Ci表示第i个代表色的色彩分量而Wi表示第i个代表色的权重。主色系统可基于以下公式来线性地组合权重:
Wn=Wi+Wj (3)
主色系统只要代表色之间的相似性低于阈值就继续群集最相似的代表色的过程。主色系统然后可过滤掉权重低于阈值的代表色以帮助确保仅从少量像素中生成的代表色不被选为候选主色。主色系统可使用固定阈值(例如,小于.05的权重)或动态阈值(例如,过滤掉具有低权重的代表色中的80%或过滤掉具有权重小于最高权重的某一百分比的代表色)。
主色系统提取候选主色的各种特征以表示该颜色的特性。在一个实施例中,主色系统使用27个元素的特征向量来表示候选主色。主色系统生成4个六维特征元素和一个三维特征元素(即,颜色的色彩分量)。主色系统基于候选主色与图像的特定区域内的颜色之间的差异来标识特征元素。图像的区域可包括整个图像、图像的中央区域和图像中的关注区域。对应于这些区域的六维特征元素是根据差异生成的直方图。在生成整个图像的直方图时,主色系统计算候选主色和该图像的每一种颜色之间的差异。主色系统基于该差异来递增适当的直方图柱。直方图柱可以均匀地分布在0和色彩空间中的最大差异之间或者非线性地分布。在递增了对应于图像的每一种颜色的柱之后,主色系统为每一柱计算该柱中的图像的像素总数的百分比并将这些百分比用作六维直方图的值。主色系统以类似的方式生成对应于关注区域和中央区域的直方图。中央区域可包括图像像素中图像中央附近的25%。关注区域可以是使用公知的关注区域(例如,感兴趣的区域)标识技术来标识的区域。详见例如,Ma,Y.F.、Zhang,H.J.的“Contrast-Based Image Attention Analysis by Using Fuzzy Growing(通过使用模糊成长的基于对比度的图像关注分析”,美国加利福尼亚州伯克利市2003年ACM多媒体大会会刊第374-381页。主色系统可选择这些技术给出最高分数的关注区域。
主色系统还提取基于类似于候选主色的颜色和这些相似颜色的相邻颜色之间的差异的六维特征元素。主色系统标识图像中类似于候选主色的颜色。主色系统然后计算该相似的颜色和该图像中的相邻的相似颜色之间的差异。在一个实施例中,主色系统将相邻颜色定义为相似颜色的像素的5×5区域内的像素颜色。主色系统基于相似颜色与其相邻颜色之间的差异来为每一种相似的颜色创建六维直方图。主色系统将直方图转换为百分比。在主色系统为每一种相似的颜色生成百分比直方图之后,它生成所有相似颜色的平均百分比直方图并将该平均直方图用作候选主色的特征元素。
在一个实施例中,主色系统通过如上所述地标识一集合的图像的候选主色并提取候选主色的特征来生成用于训练检测器的训练数据。主色系统然后为每一主色输入该颜色对于其图像的优势度的指示。所提取的特征及其优势度的指示表示训练数据。主色系统然后使用训练数据来训练检测器检测图像的主色。主色系统可使用用于训练分类器的各种技术来训练检测器。检测器可使用自适应增强技术、支持向量机技术、神经网络技术等来训练。在主色系统生成了分类器之后,它可由应用程序用来标识图像的主色,如以上所描述的。
自适应增强是在具有示例的训练数据的集合上运行多次测试的迭代过程。自适应增强将弱学习算法(仅以比偶然性稍好的水平执行的算法)变换成强学习算法(显示低出错率的算法)。弱学习算法可以在训练数据的不同子集上运行。该算法越来越专注于其前任倾向于显示错误的那些示例。该算法校正由早先的弱学习算法所造成的错误。因为其调整其前任的出错率,因此该算法是自适应的。自适应增强组合粗略和适度地不准确的经验法则以创建高性能算法。自适应增强将各独立运行测试的结果组合成单个、非常准确的分类器或排序功能。
支持向量机通过在可能的输入的空间中寻找超曲面来操作。超曲面尝试通过最大化正和负示例中最接近的一个与超曲面之间的距离而将正示例(例如,数据表的特征向量)与负示例(例如,布局表的特征向量)分开。这允许相似于但不同于训练数据的数据的正确的分类。可使用多种技术训练支持向量机。一种技术使用将较大的二次编程问题分解成一系列可被分析求解的较小的二次编程问题的顺序最小优化算法。(请参考http://research.microsoft.com/~jplatt/smo.html上的顺序最小优化。)
神经网络具有三个主要的组件:体系结构、成本函数和搜索算法。体系结构定义将输入和输出相关的功能形式(按照网络拓扑、单元连通度和激活功能)。训练过程是在权重空间中搜索最小化目标函数的一组权重。神经网络可以使用径向基函数(“RBF”)网络并用标准梯度下降作为搜索技术。
图1是示出在一个实施例中的主色系统的各组件的框图。主色系统100包括图像存储110、检测器120、训练检测器组件130、标识主色组件140和生成检测器组件150。图像存储包含主色系统据其生成训练数据的训练图像。检测器由训练检测器组件通过使用由生成检测器组件生成的训练数据来生成。标识主色组件由应用程序用来标识图像的主色。生成检测器组件通过使用标识候选主色组件160、提取候选主色的特征组件170和输入优势度的指示组件180来生成训练数据。标识候选主色组件通过使用将在以下详细描述的变换色彩空间组件161、将颜色量化为柱组件162、计算平均色组件163、计算权重组件164、群集颜色组件165和过滤颜色组件166来标识候选主色。提取候选主色的特征组件通过使用将在以下详细描述的计算图像中的差异分布组件171、计算关注区域中的差异分布组件172、计算中央区域中的差异分布组件173、计算与周围颜色的差异组件174和选择颜色组件175来提取特征。
其上可以实现主色系统的设备可以包括中央处理单元、存储器、输入设备(例如,键盘和定点设备)、输出设备(例如,显示设备)和存储设备(例如,盘驱动器)。物理存储器和存储设备是可以包含实现主色系统的指令和数据结构的计算机可读介质。此外,主色系统的指令、数据结构和模块可被存储或经由诸如通信链路上的信号之类的数据传送介质发送。可以使用各种通信链路来连接该系统的各组件,如因特网、局域网、广域网、点对点拨号连接、蜂窝电话网络等。
主色系统的各实施例可在各种操作环境中实现,这些操作环境包括个人计算机、服务器计算机、多处理器系统、基于微处理器的系统、网络PC、小型机、大型计算机、包括任何上述系统或设备的分布式计算环境等等。
主色系统可以在诸如程序模块等由一个或多个计算机或其他设备执行的计算机可执行指令的通用上下文中描述。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。通常,程序模块的功能可以在各个实施例中按需进行组合或分布。例如,标识主色组件可以在与实现生成检测器组件的计算系统分开的计算系统上实现。
图2是示出一个实施例中的主色系统的生成检测器组件的处理的流程图。该组件通过传递得到训练图像、从图像中生成训练数据、并训练检测器检测图像的主色。在框201-205中,该组件循环生成每一个训练图像的训练数据。在框201,该组件选择下一个训练图像。在判定框202,如果已选择了所有训练图像,则该组件在框206处继续,否则该组件在框203处继续。在框203,该组件调用标识候选主色组件来标识所选图像的候选主色。在框204,该组件调用提取候选主色的特征组件来提取所选图像的候选主色的特征。在框205,该组件输入所选图像的候选主色的优势度的指示并且然后循环至框201以选择下一个训练图像。在框206,该组件使用所提取的特征和优势度的指示来训练检测器并且然后完成。
图3是示出一个实施例中的主色系统的标识候选主色组件的处理的流程图。该组件通过传递得到一图像并且标识该图像的候选主色。在框301,该组件调用变换色彩空间组件来将所传递的图像的颜色变换到适当的色彩空间。本领域的技术人员可以理解这是可任选的步骤。主色系统可以使用任何色彩空间和用于该色彩空间的适当的差异度量以使得差异表示知觉上的差异。在框302,该组件调用将颜色量化为柱组件来将所传递的图像的颜色量化为柱。在框303,该组件调用计算平均色组件来计算每一柱的代表色。在框304,该组件调用计算权重组件来计算每一柱或代表色的权重。在框305,该组件调用群集颜色组件来群集各代表色。在框306,该组件调用过滤颜色组件来过滤掉权重过低的代表色。该组件然后返回还未被过滤掉的代表色作为候选主色。
图4是示出一个实施例中的主色系统的变换色彩空间组件的处理的流程图。该组件通过传递得到具有RGB色彩空间中的颜色的图像并将这些颜色变换到CIE L*a*b色彩空间。在框401,该组件选择所传递的图像的下一个像素。在判定框402,如果已经选择了所有像素,则该组件返回,否则该组件在框403处继续。在框403,该组件将RGB色彩分量转换为对应的CIE L*a*b色彩分量。该组件然后循环至框401以选择所传递的图像的下一个像素。
图5是示出一个实施例中的主色系统的将颜色量化为柱组件的处理的流程图。该组件通过传递得到一图像并且返回包含该图像的颜色的柱。在框501,该组件选择所传递的图像的下一个像素。在判定框502,如果已经选择了所传递的图像的所有像素,则该组件返回柱,否则该组件在框503处继续。在框503-505,该组件基于柱的阈值来量化所选像素的色彩分量。在框506,该组件将所选像素的颜色添加到经量化的分量所标识的柱。该组件然后循环至框501以选择所传递的图像的下一个像素。
图6是示出一个实施例中的主色系统的计算平均色组件的处理的流程图。该组件通过传递得到包含图像的颜色的柱。该组件循环计算每一柱的平均色以及每一柱中的颜色数量的计数。在框601,该组件选择下一个柱。在判定框602,如果已经选择了所有柱,则该组件返回平均色作为代表色,否则该组件在框603处继续。在框603,该组件初始化所选柱中的颜色的每一个分量的累加总计。在框607,该组件初始化所选柱中的颜色数量的计数。在框608-613,该组件累积所选柱中的每一个分量值的总数。在框608,该组件选择所选柱的下一颜色。在判定框609,如果已经选择了所选柱的所有颜色,则该组件在框614处继续,否则该组件在框610处继续。在框610-612,该组件将分量值的总数递增所选颜色的分量值。在框613,该组件递增所选柱中的颜色数量的计数并且然后循环至框608以选择所选柱中的下一种颜色。在框614-616,该组件计算所选柱的平均色的每一个分量的平均值。该组件随后循环至框601以选择下一个柱。
图7是示出一个实施例中的主色系统的计算权重组件的处理的流程图。该组件通过传递得到各柱并将柱的权重计算为该柱中的颜色对于像素总数的百分比。在框701,该组件选择下一个柱。在判定框702,如果已经选择了所有柱,则该组件返回,否则该组件在框703处继续。在框703,该组件计算所选柱的权重并且然后循环至框701以选择下一个柱。
图8是示出一个实施例中的主色系统的群集颜色组件的处理的流程图。该组件通过传递得到各代表色及其权重并且生成由组合色和组合权重表示的相似颜色的聚类。在框801,该组件为每一个代表色创建初始聚类并将聚类的权重设置成该颜色的权重。在框802,该组件选择具有最小差异的聚类的代表色。在判定框803,如果最小差异大于阈值,则该组件返回已被标识为候选主色的聚类的代表色,否则该组件在框804处继续。在框804,该组件组合所选颜色。在框805,该组件组合所选颜色的权重。在框806,该组件丢弃作为聚类的所选颜色并用组合色和权重生成新聚类。该组件随后循环至框802以选择下一种颜色。
图9是示出一个实施例中的主色系统的过滤颜色组件的处理的流程图。该组件通过传递得到候选主色并过滤掉权重过低的候选主色。在框901,该组件选择下一个候选主色。在判定框902,如果已选择所有候选主色,则该组件返回,否则该组件在框903处继续。在判定框903处,如果所选候选主色的权重低于阈值,则该组件在框904处继续,否则该组件在框901处继续以选择下一个候选主色。在框904,该组件丢弃所选候选主色并且然后循环至框901以选择下一个候选主色。
图10是示出一个实施例中的主色系统的提取候选主色的特征组件的处理的流程图。该组件通过传递得到一图像和候选主色并且生成该候选主色的27个元素的特征向量。该27个元素的特征向量包括4个六维直方图和三个色彩分量。在框1001,该组件调用计算图像中的差异分布组件来生成基于该候选主色和整个所传递的图像的颜色之间的差异的直方图。在框1002,该组件调用计算关注区域中的差异分布组件来生成基于该候选主色和所传递的图像的关注区域的颜色之间的差异的直方图。在框1003,该组件调用计算中央区域中的差异分布组件来生成基于该候选主色和所传递的图像的中央区域的颜色之间的差异的直方图。在框1004,该组件调用计算与周围颜色的差异组件来生成表示类似于候选主色的颜色和相邻颜色之间的差异的直方图。在框1005,该组件选择每一个色彩分量作为特征元素。该组件然后返回特征向量。
图11是示出一个实施例中的主色系统的计算图像中的差异分布组件的处理的流程图。该组件通过传递得到一图像和候选主色并生成基于整个所传递的图像的颜色和所传递的候选主色之间差异分布的直方图。在框1101,该组件选择所传递的图像的下一个像素。在判定框1102,如果已经选择了所有像素,则该组件在框1105处继续,否则该组件在框1103处继续。在框1103,该组件计算所选像素的颜色和所传递的候选主色之间的差异。在框1104,该组件递增与所计算的差异相关联直方图柱并且然后循环至框1101以选择所传递的图像的下一个像素。在框1105,该组件计算直方图的每一个柱的百分比。该组件然后返回这些百分比作为所生成的直方图。虽然计算关注区域中的差异分布组件和计算中央区域中的差异分布组件并未单独示出,但它们以类似的方式操作,不同之处在于它们标识关注区域和中央区域并生成基于这些区域而非整个图像的直方图。
图12是示出一个实施例中的主色系统的计算与周围颜色的差异组件的处理的流程图。该组件通过传递得到一图像和候选主色并生成该颜色的直方图。在框1201,该组件选择所传递的图像的下一个像素。在判定框1202,如果已经选择了所有像素,则该组件在框1210处继续,否则该组件在框1203处继续。在框1203,该组件计算所选像素的颜色和所传递的候选主色之间的色差。在判定框1204,如果该差异小于阈值,则该颜色与所传递的候选主色不相似并且该组件循环至框1201以选择下一个像素,否则该组件在框1205处继续。在框1205-1208,该组件循环生成各直方图柱中对于所选像素的颜色与相邻像素的颜色之间的差异的计数。在框1205,该组件选择下一个相邻像素。在判定框1206,如果已经选择了所有相邻像素,则该组件在框1209处继续,否则该组件在框1207处继续。在框1207,该组件计算所选像素的颜色和所选相邻像素的颜色之间的差异。在框1208,该组件基于所计算的差异来递增适当的直方图柱。该组件然后循环至框1205以选择所选像素的下一个相邻像素。在框1209,该组件计算各直方图柱的百分比并且然后循环至框1201以选择所传递的图像的下一个像素。在框1210,该组件计算为每一个相似的像素生成的直方图的百分比的平均值。该组件然后返回平均直方图柱。
图13是示出一个实施例中的主色系统的标识主色组件的处理的流程图。该组件由应用程序调用来确定图像的主色。该组件通过传递得到目标图像并返回主色。在框1301,该组件调用标识候选主色组件来标识目标图像的候选主色。在框1302,该组件调用提取候选主色的特征组件来提取每一个候选主色的特征。在框1303,该组件为每一个候选主色调用由主色系统生成的检测器。该组件传递每一个候选主色的特征并且作为回报接收指示候选主色的优势度的分数。在框1304,该组件选择具有最高分数的候选主色并返回该颜色作为所传递的目标图像的主色。
尽管用对结构特征和/或方法动作专用的语言描述了本主题,但可以理解,所附权利要求书中定义的主题不必限于上述具体特征或动作。相反,上述具体特征和动作是作为实现权利要求的示例形式公开的。主色系统可用于标识从视频帧或视频帧序列、照片、计算机生成的图形等得到的图像的主色。因此,本发明只由所附权利要求来限制。
Claims (20)
1.一种在计算系统中用于生成检测图像的主色的检测器的方法,所述方法包括:
提供训练图像的集合(110);
对于每一个训练图像,
标识所述训练图像的候选主色(160);
提取所述训练图像的候选主色的特征(170);以及
输入所述候选主色对所述训练图像的优势度的指示(180);以及
使用所述候选主色的所提取的特征和优势度的指示来训练检测器检测所述图像的主色(130)。
2.如权利要求1所述的方法,其特征在于,包括:
标识目标图像的候选主色;
提取所述目标图像的候选主色的特征;以及
通过将所述检测器应用于所提取的所述目标图像的特征来检测所述目标图像的主色。
3.如权利要求1所述的方法,其特征在于,所述标识所述训练图像的候选主色包括:
将所述训练图像的颜色量化为柱;
计算所述柱的平均色;
计算所述柱的权重;以及
以所述柱的权重为因子群集所述柱的平均色,所群集的平均色表示所述候选主色。
4.如权利要求3所述的方法,其特征在于,包括基于所群集的平均色的权重来过滤所群集的平均色。
5.如权利要求3所述的方法,其特征在于,所述群集包括为差异最小的颜色对连续创建组合色。
6.如权利要求5所述的方法,其特征在于,所述组合色是所述颜色对的加权组合并且具有从所述颜色对的权重得到的组合权重。
7.如权利要求1所述的方法,其特征在于,所述提取所述训练图像的候选主色的特征包括提取基于候选主色和所述训练图像的颜色之间的差异的特征。
8.如权利要求7所述的方法,其特征在于,所述差异基于选自整个区域、中央区域和关注区域的训练图像的区域。
9.如权利要求1所述的方法,其特征在于,提取所述训练图像的候选主色的特征包括提取基于所述训练图像中类似于候选主色的相似的颜色和具有所述相似的颜色的所述像素的相邻像素的颜色之间的差异的特征。
10.如权利要求1所述的方法
其特征在于,所述标识所述训练图像的候选主色包括:
将所述训练图像的颜色量化为柱;
计算所述柱的平均色;
计算所述柱的权重;以及
以所述柱的权重为因子群集所述柱的平均色,所群集的平均色表示所述候选主色;并且
所述提取所述训练图像的候选主色的特征包括提取基于候选主色和所述训练图像的颜色之间的差异的特征;并且包括:
标识目标图像的候选主色;
提取所述目标图像的特征;以及
通过将所述检测器应用于所提取的所述目标图像的特征来检测所述目标图像的主色。
11.一种生成检测图像的主色的检测器的计算系统,包括:
标识图像的候选主色的标识候选主色组件(160);
提取图像的候选主色的特征的提取候选主色的特征组件(170);
输入所标识的候选颜色的优势度的指示的输入优势度的指示组件(180);以及
训练组件(130),所述训练组件(130)使用所提取的训练图像的候选主色的特征和所述训练图像的候选主色的优势度的指示来训练检测器检测图像的主色。
12.如权利要求11所述的计算系统,其特征在于,所述训练组件使用所述标识候选主色组件来标识所述训练图像的候选主色、使用所述提取候选主色的特征组件来提取所述训练图像的候选主色的特征、以及使用所述输入优势度的指示组件来输入所述训练图像的候选主色的优势度的指示。
13.如权利要求11所述的计算系统,其特征在于,包括:
通过将所述检测器应用于所提取的目标图像的特征来标识所述目标图像的主色的标识主色组件。
14.如权利要求11所述的计算系统,其特征在于,包括:
标识主色组件,所述标识主色组件通过以下动作来标识目标图像的主色:
使用所述标识候选主色组件来标识所述目标图像的候选主色;
使用所述提取候选主色的特征组件来提取所述目标图像的候选主色的特征;以及
通过使用所提取的所述目标图像的候选主色的特征来使用所述检测器来检测所述目标图像的主色。
15.如权利要求11所述的计算系统,其特征在于,所述标识候选主色组件
将所述训练图像的颜色量化为柱;
计算所述柱的平均色;以及
群集所述柱的平均色,所群集的平均色表示所述候选主色。
16.如权利要求11所述的计算系统,其特征在于,所述提取候选主色的特征组件提取基于候选主色和所述训练图像的颜色之间的差异的特征。
17.如权利要求11所述的方法,其特征在于,所述差异基于选自整个区域、中央区域和关注区域的训练图像的区域。
18.一种包含用于控制计算系统通过一种方法来标识目标图像的主色的指令的计算机可读介质,所述方法包括:
标识所述目标图像的候选主色(160);
提取所述目标图像的候选主色的特征(170);以及
通过将检测器应用于所提取的所述候选主色的特征来检测所述目标图像的主色(120),所述检测器通过以下动作来生成:
标识训练图像的候选主色;
提取所述训练图像的候选主色的特征;
接收所述训练图像的候选主色的优势度的指示;以及
使用所述训练图像的候选主色的所提取的特征和优势度的指示来训练所述检测器检测图像的主色。
19.如权利要求18所述的计算机可读介质,其特征在于,所述标识候选主色包括群集图像的相似的颜色。
20.如权利要求19所述的计算机可读介质,其特征在于,所述提取所述候选主色的特征包括提取基于候选主色和图像的颜色之间的差异的特征。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/533,953 | 2006-09-21 | ||
US11/533,953 US7809185B2 (en) | 2006-09-21 | 2006-09-21 | Extracting dominant colors from images using classification techniques |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101517616A true CN101517616A (zh) | 2009-08-26 |
Family
ID=39200853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007800352494A Pending CN101517616A (zh) | 2006-09-21 | 2007-09-21 | 使用分类技术来从图像中提取主色 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7809185B2 (zh) |
EP (1) | EP2064677B1 (zh) |
JP (1) | JP2010504593A (zh) |
CN (1) | CN101517616A (zh) |
CA (1) | CA2660798A1 (zh) |
WO (1) | WO2008036941A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104508684A (zh) * | 2012-08-01 | 2015-04-08 | 微软公司 | 使用照片来设置操作系统颜色 |
CN111209922A (zh) * | 2020-01-14 | 2020-05-29 | 深圳市彬讯科技有限公司 | 基于svm和opencv的图像色系风格标记方法、装置、设备及介质 |
CN115408552A (zh) * | 2022-07-28 | 2022-11-29 | 深圳市磐鼎科技有限公司 | 显示调整方法、装置、设备及存储介质 |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008014408A1 (en) * | 2006-07-28 | 2008-01-31 | Blue Lava Technologies | Method and system for displaying multimedia content |
US8212859B2 (en) * | 2006-10-13 | 2012-07-03 | Apple Inc. | Peripheral treatment for head-mounted displays |
KR100834095B1 (ko) * | 2006-12-02 | 2008-06-10 | 한국전자통신연구원 | 디지털 미디어의 데이터 고유특성을 이용한 논블라인드워터마크 삽입/추출 장치 및 워터마크 삽입/추출 방법 |
KR100843095B1 (ko) * | 2006-12-13 | 2008-07-03 | 삼성전자주식회사 | 선호색 재현 장치 및 방법 |
JP5041229B2 (ja) * | 2007-12-07 | 2012-10-03 | ソニー株式会社 | 学習装置および方法、認識装置および方法、並びにプログラム |
US8290252B2 (en) * | 2008-08-28 | 2012-10-16 | Microsoft Corporation | Image-based backgrounds for images |
US8537409B2 (en) * | 2008-10-13 | 2013-09-17 | Xerox Corporation | Image summarization by a learning approach |
US8490026B2 (en) * | 2008-10-27 | 2013-07-16 | Microsoft Corporation | Painting user controls |
US8320662B2 (en) * | 2009-01-07 | 2012-11-27 | National Instruments Corporation | Distinguishing colors of illuminated objects using machine vision |
CN102473184A (zh) * | 2009-07-06 | 2012-05-23 | 皇家飞利浦电子股份有限公司 | 用于生成多个图像的序列的方法和装置 |
US8077959B2 (en) * | 2009-09-30 | 2011-12-13 | General Electric Company | Stain-based optimized compression of digital pathology slides |
US8340416B2 (en) | 2010-06-25 | 2012-12-25 | Microsoft Corporation | Techniques for robust color transfer |
US8879835B2 (en) * | 2011-08-26 | 2014-11-04 | Adobe Systems Incorporated | Fast adaptive edge-aware matting |
US9047633B2 (en) | 2012-02-07 | 2015-06-02 | Zencolor Corporation | System and method for identifying, searching and matching products based on color |
US9436704B2 (en) | 2012-02-07 | 2016-09-06 | Zencolor Corporation | System for normalizing, codifying and categorizing color-based product and data based on a universal digital color language |
US9607404B2 (en) | 2012-02-07 | 2017-03-28 | Zencolor Corporation | System for normalizing, codifying and categorizing color-based product and data based on a universal digital color system |
US10460475B2 (en) | 2012-02-07 | 2019-10-29 | Zencolor Global, Llc | Normalization of color from a captured image into a universal digital color system for specification and matching |
WO2013184804A1 (en) * | 2012-06-06 | 2013-12-12 | Zencolor Corporation | System and method for normalization and codificaton of colors for dyanamic analysis |
US8600153B2 (en) | 2012-02-07 | 2013-12-03 | Zencolor Corporation | System and method for normalization and codification of colors for dynamic analysis |
US9245324B2 (en) * | 2013-05-23 | 2016-01-26 | Intel Corporation | Lossy color merge for multi-sampling anti-aliasing compression |
US10282075B2 (en) | 2013-06-24 | 2019-05-07 | Microsoft Technology Licensing, Llc | Automatic presentation of slide design suggestions |
US9087357B2 (en) | 2013-10-16 | 2015-07-21 | Zencolor Corporation | System for normalizing, codifying and categorizing color-based product and data based on a universal digital color language |
US9477748B2 (en) * | 2013-12-20 | 2016-10-25 | Adobe Systems Incorporated | Filter selection in search environments |
WO2015119711A1 (en) * | 2014-02-07 | 2015-08-13 | Zencolor Corporation | System for normalizing, codifying and categorizing color-based product and data based on a universal digital color language |
US20150356944A1 (en) * | 2014-06-09 | 2015-12-10 | Optoma Corporation | Method for controlling scene and electronic apparatus using the same |
US9466259B2 (en) | 2014-10-01 | 2016-10-11 | Honda Motor Co., Ltd. | Color management |
US9542766B1 (en) | 2015-06-26 | 2017-01-10 | Microsoft Technology Licensing, Llc | Intelligent configuration of data visualizations |
US10534748B2 (en) | 2015-11-13 | 2020-01-14 | Microsoft Technology Licensing, Llc | Content file suggestions |
US9824291B2 (en) | 2015-11-13 | 2017-11-21 | Microsoft Technology Licensing, Llc | Image analysis based color suggestions |
US10528547B2 (en) | 2015-11-13 | 2020-01-07 | Microsoft Technology Licensing, Llc | Transferring files |
US20180130444A1 (en) * | 2016-11-07 | 2018-05-10 | Electronics And Telecommunications Research Institute | Information image display apparatus and method |
JP7119910B2 (ja) * | 2018-10-30 | 2022-08-17 | 富士通株式会社 | 検出方法、検出プログラムおよび検出装置 |
WO2021126239A1 (en) * | 2019-12-20 | 2021-06-24 | Hewlett-Packard Development Company, L.P. | Color correction |
CN112132212B (zh) * | 2020-09-22 | 2022-08-09 | 福州大学 | 一种容忍异常原料的木材原料选色方法 |
CN112132091A (zh) * | 2020-09-29 | 2020-12-25 | 陕西省交通规划设计研究院 | 遥感图像的解译方法、装置、计算机设备及其存储介质 |
CN112509068B (zh) * | 2020-10-29 | 2024-08-16 | 北京达佳互联信息技术有限公司 | 图像主色识别方法、装置、电子设备及存储介质 |
CN113284198A (zh) * | 2021-05-13 | 2021-08-20 | 稿定(厦门)科技有限公司 | 图像自动配色方法及装置 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5222154A (en) * | 1991-06-12 | 1993-06-22 | Hewlett-Packard Company | System and method for spot color extraction |
KR100245338B1 (ko) * | 1996-09-25 | 2000-02-15 | 전주범 | 칼라 영상 파일 분류 및 검색 방법 및 장치 |
US6185314B1 (en) * | 1997-06-19 | 2001-02-06 | Ncr Corporation | System and method for matching image information to object model information |
JP2000163594A (ja) * | 1998-11-30 | 2000-06-16 | Canon Inc | 画像パタ―ン検出方法及び装置 |
US6411953B1 (en) * | 1999-01-25 | 2002-06-25 | Lucent Technologies Inc. | Retrieval and matching of color patterns based on a predetermined vocabulary and grammar |
KR100512139B1 (ko) * | 1999-07-03 | 2005-09-02 | 엘지전자 주식회사 | 비디오 영역 대표칼라 설정방법과 데이타 구조 및 신뢰도 추출방법 |
US7417640B1 (en) * | 1999-01-29 | 2008-08-26 | Lg Electronics Inc. | Method for dominant color setting of video region and data structure and method of confidence measure extraction |
KR100390866B1 (ko) * | 1999-02-05 | 2003-07-12 | 삼성전자주식회사 | 컬러 영상 처리 방법 및 그 장치 |
KR100359918B1 (ko) * | 1999-11-29 | 2002-11-04 | 엘지전자 주식회사 | 멀티미디어 객체 검색방법과 멀티미디어 객체의 특징정보 생성방법 및 그 특징정보가 기록된 기록매체 |
KR100494080B1 (ko) * | 2001-01-18 | 2005-06-13 | 엘지전자 주식회사 | 공간 밀착 성분을 이용한 대표 칼라 설정방법 |
ITTO20011080A1 (it) * | 2001-11-19 | 2003-05-19 | Olivetti Tecnost Spa | ,,metodo e dispositivo per la determinazione di una dominante cromatica in un'immagine,, |
US20040130546A1 (en) * | 2003-01-06 | 2004-07-08 | Porikli Fatih M. | Region growing with adaptive thresholds and distance function parameters |
US7085413B2 (en) * | 2003-04-04 | 2006-08-01 | Good News Enterprises Limited | Image background detection and removal |
EP1881455B1 (en) * | 2003-07-04 | 2009-12-23 | Mitsubishi Electric Information Technology Centre Europe B.V. | Method and apparatus for representing a group of images |
US20050270383A1 (en) * | 2004-06-02 | 2005-12-08 | Aiptek International Inc. | Method for detecting and processing dominant color with automatic white balance |
US8063992B2 (en) | 2004-06-30 | 2011-11-22 | Koninklijke Philips Electronics N.V. | Dominant color extraction for ambient light derived from video content mapped through unrendered color space |
US20060077468A1 (en) * | 2004-10-12 | 2006-04-13 | Xerox Corporation | System and method for smart color halftoning |
KR100761417B1 (ko) * | 2006-03-16 | 2007-09-27 | 주식회사 씬멀티미디어 | 벡터 표현으로 변형된 도미넌트 컬러 기술자를 사용한멀티미디어 데이터베이스의 인덱싱 및 검색 방법 |
-
2006
- 2006-09-21 US US11/533,953 patent/US7809185B2/en active Active
-
2007
- 2007-09-21 WO PCT/US2007/079230 patent/WO2008036941A1/en active Application Filing
- 2007-09-21 JP JP2009529418A patent/JP2010504593A/ja not_active Withdrawn
- 2007-09-21 CN CNA2007800352494A patent/CN101517616A/zh active Pending
- 2007-09-21 CA CA002660798A patent/CA2660798A1/en not_active Abandoned
- 2007-09-21 EP EP07853601.8A patent/EP2064677B1/en not_active Not-in-force
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104508684A (zh) * | 2012-08-01 | 2015-04-08 | 微软公司 | 使用照片来设置操作系统颜色 |
CN104508684B (zh) * | 2012-08-01 | 2020-04-03 | 微软技术许可有限责任公司 | 使用照片来设置操作系统颜色 |
CN111209922A (zh) * | 2020-01-14 | 2020-05-29 | 深圳市彬讯科技有限公司 | 基于svm和opencv的图像色系风格标记方法、装置、设备及介质 |
CN111209922B (zh) * | 2020-01-14 | 2023-09-01 | 深圳市彬讯科技有限公司 | 基于svm和opencv的图像色系风格标记方法、装置、设备及介质 |
CN115408552A (zh) * | 2022-07-28 | 2022-11-29 | 深圳市磐鼎科技有限公司 | 显示调整方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP2064677A1 (en) | 2009-06-03 |
WO2008036941A1 (en) | 2008-03-27 |
CA2660798A1 (en) | 2008-03-27 |
EP2064677A4 (en) | 2013-01-23 |
US7809185B2 (en) | 2010-10-05 |
JP2010504593A (ja) | 2010-02-12 |
EP2064677B1 (en) | 2014-07-30 |
US20080075360A1 (en) | 2008-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101517616A (zh) | 使用分类技术来从图像中提取主色 | |
US7657089B2 (en) | Automatic classification of photographs and graphics | |
US8594385B2 (en) | Predicting the aesthetic value of an image | |
US8422832B2 (en) | Annotating images | |
CN110267119B (zh) | 视频精彩度的评价方法及相关设备 | |
CN104834686B (zh) | 一种基于混合语义矩阵的视频推荐方法 | |
CN108229674B (zh) | 聚类用神经网络的训练方法和装置、聚类方法和装置 | |
US8463050B2 (en) | Method for measuring the dissimilarity between a first and a second images and a first and second video sequences | |
CN112308115B (zh) | 一种多标签图像深度学习分类方法及设备 | |
Romero et al. | Using complexity estimates in aesthetic image classification | |
CN111783712A (zh) | 一种视频处理方法、装置、设备及介质 | |
Zhu et al. | A modified deep neural network enables identification of foliage under complex background | |
CN112016618A (zh) | 一种用于对图像语义分割模型泛化能力的度量方法 | |
Debnath et al. | Photo classification based on the presence of diagonal line using pre-trained DCNN VGG16 | |
Dong et al. | Scene-oriented hierarchical classification of blurry and noisy images | |
CN116935057A (zh) | 目标评价方法、电子设备和计算机可读存储介质 | |
Chen et al. | Probabilistic urban structural damage classification using bitemporal satellite images | |
CN108960954B (zh) | 一种基于用户群行为反馈的内容推荐方法及推荐系统 | |
Uehara et al. | Multi-channel higher-order local autocorrelation for object detection on satellite images | |
Maszuhn et al. | A User-Centered Approach for Recognizing Convenience Images in Personal Photo Collections | |
CN117542084B (zh) | 一种语义感知的跨模态行人重识别方法 | |
Huiskes | Aspect-based relevance learning for image retrieval | |
Liu et al. | Scene-oriented aesthetic image assessment | |
Carballal et al. | Detecting bias on aesthetic image datasets | |
Singh | Understanding convolutional networks and semantic similarity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20090826 |