CN101529422B - 通过词汇表示的图像管理 - Google Patents
通过词汇表示的图像管理 Download PDFInfo
- Publication number
- CN101529422B CN101529422B CN2007800388458A CN200780038845A CN101529422B CN 101529422 B CN101529422 B CN 101529422B CN 2007800388458 A CN2007800388458 A CN 2007800388458A CN 200780038845 A CN200780038845 A CN 200780038845A CN 101529422 B CN101529422 B CN 101529422B
- Authority
- CN
- China
- Prior art keywords
- image
- lexical
- graphical representation
- graphical
- representations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 claims abstract description 34
- 239000003086 colorant Substances 0.000 claims abstract description 6
- 238000007726 management method Methods 0.000 claims description 23
- 230000004044 response Effects 0.000 claims description 3
- 230000000877 morphologic effect Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000013139 quantization Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000008520 organization Effects 0.000 description 5
- 241000282412 Homo Species 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
在一种图像管理的方法(300)中,获得(304)包含对象的图像的图像数据。产生(320)对象的图形表示(204′-210c′),确定(322)图形表示(204′-210c′)的形心和大小。确定(324)形心的位置,以及确定(328)基于形心位置的图形表示(204′-210c′)的形态。分配(332)图形表示(204′-210c′)的形心位置、大小、颜色和形态的人可读的词汇表示,并存储(308)在数据库(120)中,所述数据库可通过人可读的词汇进行搜索。
Description
背景技术
由于在互联网上可得到的日益增加的数字图像和视频内容,使用个人计算机和其它数字硬件来处理和显示数字图像已经得以普及。普及增加的一个结果是,由于大量存在的图像而使得检索所需图像变得越来越复杂。传统上,所需图像常常是通过图像的文件名来检索的。
但是,文件名往往不能提供图像或视频内容的充分说明,使用户能够确定图像或视频内容包含什么。因此,在传统的数据库中存储的图像和视频的内容经常是带标签储存的,所述标签提供了内容的简要说明。例如,包含黑色道路上的蓝色汽车的图像可包括例如“汽车”、“蓝色”和“道路”的标签。这些标签通常是人工输入到数据库中的,费力费时。
例如,关于说明颜色,说明图像和视频的自动化方法已包括基于颜色编码的系统,所述颜色编码用多维颜色空间中的位置或坐标来表示颜色分量。换言之,已经用表示颜色空间中的位置或坐标的数字数据数学地表示了颜色。虽然有关颜色的数据可相应于颜色空间明确定义颜色,但这些表示通常不能给人们直观地传达有关颜色的信息。
附图说明
对本领域的技术人员而言,通过如下参照附图的说明,本发明的特征将是明显的,在附图中:
图1示出了根据本发明的实施例的图像管理系统的框图,该图像管理系统可采用在此公开的基于文本的图像数据库创建和图像检索过程的各种实施例。
图2示出了一原始图像的结构图以及根据本发明的实施例由该原始图像所得的语素词汇组织图。
图3A示出了根据本发明的实施例的用于创建图像数据库的方法的流程图。
图3B示出了根据本发明的实施例的在图3A中讨论的语素词汇处理步骤中执行的各个步骤的更详细的流程图。
图4示出了根据本发明的实施例的在通过实施图3A中所述的方法所创建的数据库中检索图像的方法的流程图。
具体实施方式
出于简约和说明的目的,本发明通过主要参照其一优选实施例来说明。在下面的说明中,为提供对本发明的透彻的了解,规定了许多具体的细节。但很显然,对本领域的技术人员,实施本发明并不限于这些具体的细节。在其它情况下,并没有详细说明众所周知的方法和结构,以免不必要地与本发明混淆。
在此公开了管理图像的方法和系统。特别是,在此公开的管理图像的方法和系统中,多个图像的各种特征可以用人可读的词汇来表示。这些表示包括图像中各对象之间的关系,所述关系也可以用人可读的词汇来表示。通过使用这里公开的方法和系统,可以创建可通过定义了各种图像特征的文本术语来检索的图像的数据库。此外,可通过使用文本搜索项搜索数据库或通过与输入图像进行比较来检索期望的图像。
一般而言,在一个例子中,用户可以像文本式文件所用的搜索那样访问和搜索数据库以得到一个或多个图像。因此,这里公开的方法和系统可以使用户以相对更直观的方式搜索图像。
参照图1,图1示出了基于一实施例的图像管理系统100的框图,所述图像管理系统100可采用这里公开的基于文本的图像数据库创建和图像检索过程的多种实施例。所示图像管理系统100包括通信接口102、处理电路104、存储电路106、用户接口108、图像输入设备110和数据库120。图像管理系统100可包括另外的组件,这里说明的一些组件可被去除和/或修改,而不偏离图像管理系统100的范围。
通信接口102用于实现可包括在计算机设备中的图像管理系统100和未图示的外部设备间的通信。例如,可使通信接口102与另一计算机设备双向交流信息。通信接口102可以为网络接口卡(NIC)、串行或并行连接、通用串行总线(USB)口、火线接口、闪存接口、软盘驱动器或任何其它适宜于与图像管理系统100通信的设置。
在一个实施例中,处理电路104用于处理数据、控制数据访问和存储、发出指令以及控制其它期望的操作。在例如下文公开的方法的至少一个实施例中,处理电路104可包括设置为执行由合适的介质提供的期望程序设计的电路。举例来说,处理电路104可以是处理器和其它设置为执行可执行指令的结构的一个或多个,可执行指令例如包括软件、固件和/或硬件电路指令。处理电路104因此可包括例如硬件逻辑、引脚网格阵列(PGA)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、状态机或其它结构自身或其与处理器的组合。
存储电路106用于存储诸如可执行代码或指令的程序设计(如软件和/或固件)、电子数据、图像数据、与图像数据关联的元数据、数据库或其它数字信息,并且可以包括处理器可用的介质。处理器可用的介质可在任何计算机程序产品或制造品中包含,它们可包含、储存或保持程序设计、数据和/或数字信息,为包括处理电路104的指令执行系统所用或与之结合使用。举例来说,处理器可用的介质可包括诸如电、磁、光、电磁、红外或半导体介质等物理介质中的任一种。处理器可用的介质的别的例子例如包括可携式磁性计算机盘,如软盘、压缩盘、硬驱、随机存取存储器、只读存储器、闪存、高速缓冲存储器和/或其它能存储程序设计、数据或其它数字信息的配置。
这里说明的至少一些实施例或方面可用存储在上文所述的适宜的存储电路106中和/或通过网络或其它传播媒介传递、并且配置为控制适当的处理电路的程序设计来实现。举例来说,程序设计可通过适当的介质来提供,包括,例如包括在制造品112中,包括在例如通过通信接口,通过诸如通信网(如互联网和/或个人网)、有线电连接、光连接和电磁能等合适的传输媒介传递的数据信号(如调制载波、数据包、数字表示等)中,或用其它适当的通信结构或介质来提供。例如,包括处理器可用的代码的程序设计可作为在包含在载波中的数据信号来进行传递。
存储电路106还可与数据库120通信,可由处理电路104创建数据库120来存储图像和/或图像的语素词汇表示。如下文更具体地讨论的那样,可创建数据库120来广泛地支持通过基于文本的搜索查询的图像搜索和检索,就像文本文件搜索和检索中使用的那样。
用户接口108配置为与用户进行交互,包括给用户传送数据(如显示数据供用户观察、用声音向用户传递数据等)和从用户处接收输入(如触觉输入、声音指令等)。相应地,用户接口108可包括配置为描绘视觉信息的显示器114(例如阴极射线管,液晶显示器等)和键盘、鼠标和/或其它合适的输入设备116,以支持与图像管理系统100的用户交互。
在一个实施例中,用户可采用用户接口108将搜索项输入到图像管理系统100,所述搜索项与基于文本的搜索所用的搜索项相似。
图像输入设备110可以是提供与供给图像管理系统100的例如照片、视频拍摄帧等图像相对应的电子图像数据的任何适当的设备。例如,图像输入设备110可包括例如平板彩色照片扫描仪的扫描设备、数码相机、数码摄像机、另一图像管理系统等。
图像输入设备110可进而实施为向图像管理系统100输入搜索标准。举例来说,可通过图像输入设备110将图像扫描到图像管理系统100,图像可如下所述进行语素词汇处理。然后,将语素词汇处理后的图像的特征与存储在数据库120中的语素词汇处理后的图像的特征进行比较,以便例如找到图像数据库120中与扫描图像相似的图像。
根据一例,处理电路104可量化多个图像形成基本单位(例如像素)的可包括例如RGB、Lab等的图像数据,以确定具有一致的或共同的特征的图像区。一致或共同的特征可包括,例如,图像中具有相同颜色的毗连区。如下文详细说明的那样,量化图像数据可进一步进行语素词汇处理,从而把图像数据转化为人可读的词汇。
术语“语素词汇处理”可定义为包括辨别图像中各个区的一个或多个特征和使用人可读的词汇来标识的处理。一个或多个特征可包括例如各个区相对于彼此的位置、各个区的颜色、各个区的大小等。此外,所述一个或多个特征可包括各个区相互之间的关系和图像的边界。换句话说,如下文详细说明的那样,可对已词汇化量化的图像进行形态处理。
术语“词汇化量化”可定义为包括使用例如英语或其它语言的词语等人可读的词汇中人可理解的词语说明图像中内容或对象的视觉特征。人可理解的词语可与图像数据相关联,可用来辅助或利于例如在创建图像的可搜索的数据库120中的图像管理。如在此所公开的,人可理解的词语也可辅助或利于从图像的可搜索数据库120中检索图像。
人可理解的词语可使用普通人易懂的自然语言说明图像内容的特征,如颜色、灰度或颜色及灰度。人可理解的词语可包括例如人可读和可理解的词汇中的词汇颜色名称,人可读和可理解的词汇例如,作为人类语言的一部分、易于为人所阅读和理解的内容,这与机器语言或代码不同,虽然程序员也可以理解机器语言或代码,但机器语言或代码通常需要某种类型的数学关系到颜色的映射或理解。人容易辨认的词汇颜色名称的例子包括黑、红、蓝、绿、黄、橙等。
人可理解的词语还可包括在人可读和可理解的词汇中的量化词汇大小标示。人容易辨认的量化词汇大小标示例如包括非常小、小、中、大、非常大等。应清楚理解,根据说明图像中包含的对象相对于彼此或否则的话相对于某个其它特征的大小中期望的粒度等级,词汇大小标示可包括另外或其它的大小标示。
人可理解的词语还可包括在人可读和可理解的词汇中的词汇相对位置标签。词汇相对位置标签例如可说明第一对象相对于第二对象位置的位置、第一对象或第二对象相对于图像的位置、第一对象或第二对象相对于图像的一个或多个边界的位置等。词汇相对位置标签可另外或替代地说明第一对象是否接触第二对象或其它对象。在任何方面,人容易辨认的词汇相对位置标签的例子包括:北、南、东、西、左、右、中心、上、下等。这样,词汇相对位置标签可以是根据例如说明图像中对象的相对位置中期望的粒度等级而随意详尽或广泛。
根据一个例子,对颜色来说,与各量化支(bin)对应的词汇颜色名称可通过相对多人口的定义的集合来产生。因此,在一些例子中,在至少一种实施方式中采用了描述可见电磁光谱中的频率范围的词语,所述词语是容易理解的人类词汇词语,而不同于标识电磁能的、或许只有受过这些技术术语教育的技术人员才懂的技术术语。词语可以指任何有意义的词汇符号序列,举例来说可包括缩写和词条。
在一个针对颜色的实施例中,词汇化量化的类别或支的数量根据用来表征图像的颜色名称的数量来确定。一旦图像词汇化量化,说明图像内容的词语(例如词汇颜色名称)就与图像的图像形成基本单位关联起来。下面详细讨论词汇化量化的更多细节。
此处所述的形态处理可对已经如上所述进行了词汇化量化的图像进行。也就是说,词汇颜色名称中与图像形成基本单位的颜色内容相对应的合适的一个,与图像的图像形成基本单位中的每一个相关联。一般来说,形态处理辨别图像有一致或共同特征的多个区。在一个更具体的例中,图像的多个区在词汇颜色名称中的一个与这些区中的每一个相关联并与相应区的颜色对应时,被找出。形态处理可包括滤除掉给定区中不具有共同特征的图像形成基本单位,并将这些图像形成基本单位的内容改为共同特征。可以用下文讨论的不同的方案来提供滤除。
与所产生的区相关的信息可与初始的图像数据关联,并使用存储电路106例如作为图像的元数据存储,所述初始的图像数据例如是词汇化量化和语素词汇处理之前的图像的图像数据,可用于再现图像的真实复制。在一个实施例中,可用元数据辨别和检索相应图像的期望的初始图像数据。
与得到的区有关的信息,可称为区信息,可包括表示该区的图像形成基本单位的颜色的词汇颜色名称。例如,区信息还可包括区的量信息和位置信息,所述量信息例如是该区的图像形成基本单位以像素数或占总体百分比计的数量。在一个实施例中,位置信息可标识与该区的所有图像形成基本单位的平均x和y位置对应的相应区域的形心。在另一例中,量信息可由词汇量标示表示,位置信息可由词汇相对位置标签来表示。
参照图2提供如何获取词汇表示及怎样用其来说明图像的更详细的例子,图2描绘了原始图像200和从原始图像200所得的语素词汇组织图220。
如图2所示,原始图像200可包括使用将在下面详细讨论的量化方法生成的分割的图像。在其它例中,可使用其它分割图像的方法,例如,产生图像的多个片段并给每一个片段分配一种单一的颜色。在任何情况下,原始图像200包括多个对象,包括具有外部颜色204和内部颜色206的水壶202。在水壶202的把手部内是第三颜色208,由于阴影,所述第三颜色208可能比水壶202的周围区域暗。此外,将水壶202周围的各对象标记为210a-210c。
对原始图像200的图像数据处理后,可创建语素词汇组织图220。图2的语素词汇组织图220包括原始图像200中各区的图形表示。更具体地说,语素词汇组织图220一般根据其大小、颜色、相应位置和形态来描绘各对象的图形表示。因此,语素词汇组织图220根据其形心、大小和颜色图形式地描绘了水壶202的各部分204-208和水壶202周围的各个区210a-210c。因此,例如,水壶202的外部颜色204用具有外部颜色204的相对大的圆圈204′来图形地表示,其形心位于语素词汇组织图220的中心附近。此外,具有外部颜色204的区的图形表示204′描绘成通过各线222分别与具有内部颜色206和第三颜色208的各区的图形表示206′和208′接触。图形表示204′-208′也描绘成与水壶202周围的区210a-210c的图形表示210a′-210c′接触。
根据一个例子,处理电路104可用语素词汇组织图220来获得原始图像200中的对象的词汇表示。举例来说,处理电路104可确定图形表示204′-210c′的颜色,可为图形表示204′-210c′分配词汇颜色名称,如上所述。此外,处理电路104可确定图形表示204′非常大、图形表示210b′和210c′中等、图形表示206′和208′小、图形表示210a′非常小。此外,处理电路104可根据确定的大小来分配词汇大小标示。
处理电路104还可确定图形表示204′-210c′相对于彼此的相对位置和/或相对于图像200的边界的相对位置。处理电路104也可为图形表示204′-210c′分配词汇相对位置标签。例如,处理电路104可存储表明图形表示206′位于图形表示204′的上方和图形表示210c′位于图形表示204′的右边的指示。
作为另一个例子,处理电路104可将语素词汇组织图220分成多个虚拟条带。例如,语素词汇组织图220可分为3个等分的虚拟条带,横向延伸过语素词汇组织图220。此外,每个条带可分成若干区域。语素词汇组织图220分成的条带和区域的数量例如可取决于各区域的密度。也就是说,例如,如果有更大的区域密度,处理电路104可将语素词汇组织图220分成更多个区域。如下面更详细地讨论的那样,当条带被穿过时,区域就可被确定,从而使得能够生成区域,以及区域中包含的图形表示的词汇表示。
现在参照图3A,其示出了根据一个实施例的创建图像数据库的方法300的流程图,其中该数据库可通过人可读的词汇检索。该方法300可使用处理电路104进行。然而,在其它实施例中,其它方法可包括更多、更少和/或替代的步骤。
在步骤302,处理电路104可以通过收到用户的命令、在预定的时间段、自动等启动方法300。一旦开始,处理电路104可在步骤304获取要处理图像的图像数据。图像数据可包括多个图像形成基本单位(例如,像素)的RGB数据。因此,例如,处理电路104可操作,来将图像数据转换到期望的颜色空间,如Lab。
在任何情况下,如步骤306所示,处理电路104可对图像数据进行语素词汇处理。可如上结合图2所述,对图像数据进行语素词汇处理,来生成图像中所含的各区域的人可读的词汇表示。下面将结合图3B更为详细地讨论一种对图像数据进行语素词汇处理的方式。
在步骤306,图像数据可通过一系列允许从图像中的颜色均匀区去除杂散颜色的多个分辨率下的形态操作进行形态处理。在步骤306,图像可形态地过滤以将图像表示为各自包括一种单一一致颜色的多个图形表示。一般情况下,图形表示定义为其中多数图像形成基本单位具有一致或共同的特征(词汇化量化产生的共同词汇颜色名称)而图形表示的其它不一致的图像形成基本单位可被改变或滤除到该一致的特征。对图像数据进行形态处理的各种方式的更详细的说明在题为“图像处理方法、图像管理系统以及制造品”的美国专利申请号待定、提交日:2006年7月27号、委托案件号200408243-1和题为“图像管理方法、图像管理系统以及制造品”的美国专利申请号待定、提交日:2006年7月27号、委托案件号200408244-1中有所说明。上述两个指出的申请的公开在这里一并引用并入。
如在步骤308所示,处理电路104可控制存储电路106,将词汇表示作为人可读的词汇储存在数据库120中。如下文详述的那样,该数据库120可通过文本查询进行搜索。此外,图像可存储在数据库中,图中区域的人可读的词汇表示可存储在图像的元数据中。
在步骤310,处理电路104可确定方法300是否将继续进行。例如,处理电路104可确定方法300要继续,以便建立和储存另外的图像的词汇表示。但是,如果没有更多的图像,处理电路104将在步骤312结束方法300。
现在特别参照图3B,其中详细地示出了根据一个实施例的与图3A中的步骤306相应执行的各个步骤。因此,图3B说明了根据一个实施例的语素词汇处理图像的步骤。
在步骤320,处理电路104可产生在例如图像200的图像中的各对象或区的图形表示。特别是,例如,处理电路104可将量化图像的各单独的图像形成基本单位与多个相应图形表示中的一个相关联。图像的量化考虑了允许滤除图形表示中的不一致的颜色的离散结果。
对象可以通过确定图像中哪些区包含一致或共同的特征来定义成相应的图形表示。一致或共同的特征例如可包括图像中具有相同颜色的毗连区。此外,如果多个区被确定为对应于原始图像中一个单个的部分或对象,例如由于在该部分或对象中出现的颜色梯度导致该部分或对象的词汇化量化被分为多个区,那么,这些区可合并。在任何情况下,参照图2,相应的图形表示可能包括外部颜色204、内部颜色206、第三颜色208和围绕水壶202的区210a-210c。
在一个实施例中,对单个的图形表示,处理电路104可关于接触或毗接相应的主题图形表示的其它图形表示来分析相应的主题图形表示,如果某些条件得到满足,处理电路104可合并多个合适的图形表示。一旦找出毗接主题图形表示的各区域,处理电路104获取图像的初始图像数据,例如在词汇或形态处理前的,与主题图形表示和毗接图形表示对应的图像数据的内容,并可使用该初始图像数据计算这些图形表示的各自的平均值,例如,示例性Lab颜色空间的平均亮度及色度L、a和b值。主题图形表示的平均值可例如使用欧几里德度量与各毗接的图形表示的平均值的每一个进行比较:
其中各x值对应于主题区的平均L、a、b值,各y值对应于所分析的毗接区的平均L、a、b值。
如果将主题图形表示与相应毗接图形表示进行比较的公式1的结果低于某一阈值,那么,这两个图形表示可相互合并。在一个实施例中,可选择阈值来区分在原始图像中是如此相似以致它们应当合并的多个图形表示的合并,例如,选择阈值以辨别多个相似的接近量化支之间的边界的图形表示,与不合并显然包括不同颜色内容的图形表示,例如,量化到不同的支没有因颜色穿入多个相似的量化支中而发生。在一个实施例中,可对毗接主题图形表示的各其它图形表示重复该分析。在一个实施例中,合并后的图形表示可以表示图像中使用单个图像图形表示的单个对象。
一旦区域被确定并在适当时合并,包括每个图形表示的词汇颜色名称、量和位置的图形表示信息例如可作为元数据与相应的图像关联起来。下面更详细地讨论确定和分配图形表示信息的词汇表示的不同方式。
在步骤322,处理电路104可确定各图形表示的形心和大小。处理电路104可根据图像中图像形成基本单位或对象的布置,确定图形表示的这些特征。在任何情况下,在步骤324,处理电路104可以例如以与图2描绘的语素词汇组织图220类似的方式,将各图形表示绘制在语素词汇组织图上。
在步骤326,处理电路104可确定各图形表示的词汇颜色名称。如上所述,处理电路104可确定人可理解的词语来说明图像中各个区的词汇颜色名称,如黑、红、蓝、绿、黄、橙等。
在步骤328,处理电路104可为各图形表示确定词汇大小标示。词汇大小标示可包括例如非常小、小、中,大、非常大等。在一个实施例中,处理电路104可将图形表示的大小相互比较,以确定词汇大小标示。在另一个实施例中,处理电路104可将图形表示的大小与预设的标准比较,以确定词汇大小标示。在这个例子中,例如,处理电路可以决定,如果图形表示低于整个图像的预定百分比,图像表示就是小。
在步骤330,处理电路104可形态处理量化图像以确定各图形表示之间的关系。特别是,例如,处理电路104可确定各图形表示相对于彼此的位置以及在图像自身上的相应位置。步骤330的形态处理可包括一个或多个等级的不同分辨率下的形态处理(滤除)。在一个实施例中的多级处理的更多细节在欧布拉多和佩尔发表在《SPIE可视通信和图像处理》(2006年1月15-19号,加利福尼亚州圣何塞)上的“多分辨率颜色补块提取”中有详述,其教义在这里全部引用并入。
此外,处理电路104可使用多个形态滤除器生成多分辨率级下的图像的抽象表示。这些形态滤波器可用于改变保存在图像的抽象表示中的细节的多少。例如,在较低的分辨率水平,较小的图形表示被消除,从而留下了图像的非常粗的抽象表示和词汇表示。形成对比的是,在较高的分辨率水平,更大程度的细节被保留,相对较小的图形表示在抽象表示中表现,提供了图像更具体的词汇表示。
在任何情况下,处理电路104可确定哪个图形表示与其它图形表示中的哪一个接触,哪一个图形表示与图像的边界接触等。进而/或者,处理电路104可将图像或图像的语素词汇组织图表示分为多个虚拟条带,每个条带包含零个或多个虚拟区域。在这种情况下,处理电路104可例如扫描过所述虚拟条带以确定虚拟区域相互间的相对位置。例如,处理电路104可确定区域A位于图像的中心,与位于其北部的区域B及位于其东部的区域C相邻。
在步骤332,处理电路104可为虚拟区域分配人可读的词汇表示。因此,例如,参考图2,处理电路104可确定用虚线224表示、从组织图220的左上角取出的第一区包括图形表示210a′和208′。例如,假设图形表示210a′是淡灰色的且图像表示208′是深灰色的,处理电路104可为第一区域224分配人可读的词汇表示,表明一个非常小的、浅灰色的图形表示位于一个小的深灰色图形表示的左边。此外,假定图像表示204′是橙色,处理电路104可为位于中间的区域226分配指示非常大的橙色图形表示的人可读的词汇表示。换句话说,处理电路104可确定第一区域224是在中央区域226的西北方。此外,处理电路104可确定一个非常大的橙色图形表示位于一个小的深灰色补块的右下方,所述小深灰色补块位于一个非常小的浅灰色补块的右方,等等。
处理电路104可以对其余区域重复这一处理,从而确定和分配其余图形表示的人可读的词汇表示。此外,如步骤308所示,人可读的词汇表示可存储在基于文本的可检索数据库中。
现在谈到图4,其示出了用于在通过实施方法300所创建的数据库120上检索图像的方法400的流程图。该方法400一般性地说明了查询数据库120以检索到一个或多个所需图像的方式。特别是,方法400使类似于检索文本文件所用的、基于文本的查询能够应用在寻找和检索图像文件中。
在步骤402,处理电路104访问数据库120。此外,在步骤404,处理电路104可接收搜索查询。在一个例子中,可通过用户接口108接收搜索查询作为一个或多个搜索项。在本例中,处理电路104可解析一个或多个搜索项以确定该一个或多个搜索项的各种特征。例如,如果搜索查询包括项“海滩”,处理电路104可以确定与期望的项匹配的图像在高层次上包括在非常大的米色区之上的非常大的蓝色区域。在更详细的层次上,处理电路104可确定含有蓝天和米色沙地的图像匹配项“海滩”的特征。在任一情况下,处理电路104可确定与搜索查询项相关的不同区域的相对位置。
除词汇颜色名称外或者作为其替代,处理电路104可通过输入108接收搜索所需图像的请求,其所用搜索标准包括的特征例如在要检索的期望图像中的一个或多个区域的诸如词汇颜色名称、量和/或位置信息。请求可指定要检索的图像的一个或多个区域,例如,“找中间顶部有大蓝色区域、正中间有中等红色区域、中间底部有黄色区域的图像”,如步骤406所示,处理电路104可使用搜索标准和与存储的图像相关联的区域信息,搜索存储在存储电路106中的图像,并根据其与搜索标准匹配的密切程度对存储图像进行分级。
在执行搜索中,处理电路104可使用输入的文本搜索请求创建搜索表示,其代表了可用来搜索存储图像的指定的词汇颜色名称、量和/或位置信息。搜索表示可以是例如以与颜色、量和位置相对应的三个矢量的形式。
在另一个例子中,搜索查询可通过图像输入设备110例如作为扫描的图像而收到。在这个例子中,处理电路104可如上参照图3A和图3B所述那样对扫描的图像进行语素词汇处理,以获得扫描图像的词汇表示。因此,举例来说,如果扫描的图像包括海滩图片,处理电路104可确定扫描图像包含一个在非常大的米色区之上的非常大的蓝色区。
在这个例子中,处理电路104可以根据与扫描图像的相应相似度对存储在数据库120中的图像进行分级。处理电路104可以建立搜索图像的至少一个区域的区域信息以创建搜索表示,利用与各存储图像相关联的区域信息,使用搜索表示搜索存储的图像。特别是,例如,在步骤406,处理电路104可访问数据库120以取回响应搜索查询的一个或多个图像。因此,就上述海滩例来说,处理电路104可检索在非常大的米色区之上有非常大的蓝色区的所有图像。
在上面所述的任一例中,处理电路104可访问存储图像的区域信息,将搜索标准与存储图像的区域的区域信息进行比较,来试图找出期望的图像。处理电路104可以使用词汇颜色名称、量和位置信息来进行比较操作。例如,可使用词汇颜色名称、量和位置信息来计算搜索标准的至少一个区域相对于每一个储存图像的区域的距离。处理电路104可配置为将搜索标准与每一个存储图像的相似性分级为,与图形表示的大小成正比、与图形表示的形心成反比、与图形表示的颜色差异成反比的关系。例如,可用下式计算两幅图像1和2之间的距离:
其中,
公式2
处理电路104可响应由与相应区域对应的计算出的距离指示的图像的区域的相似性,提供指示所比较的图像的相似性的信息。例如,存储的图像可从最近或最相似到最远或最不相似进行分级。如步骤408所示,处理电路104可以使用显示器116描绘搜索结果,用户可以选择想要的图像来阅览。可从存储电路106获得选定图像的初始图像数据,使用显示器116进行显示。
为方便搜索表示相对于与存储图像有关的信息进行的处理,处理电路104可最开始将搜索表示的最大图形表示与存储图像的最大图形表示进行比较,如果发现较大图形表示足够相似,就随后继续分析较小尺寸的图形表示。
这里说明和解释了本发明的优选实施例及其变形。这里所用的术语、说明和附图仅仅是说明性的而不是限制性的。本领域的技术人员将认识到,在本发明的精神和范围内可能有多种变化。本发明的精神和范围将由下面的权利要求及其等同物来界定,其中除非另有说明外,所有术语都是指最广的合理化的范畴。
Claims (9)
1.一种图像管理方法(300),包括:
获得(304)包含对象的图像的图像数据;
产生(320)对象的图形表示(204′-210c′);
确定(322)图形表示(204′-210c′)的形心和大小;
确定(324)形心的位置;
根据所确定的形心位置,确定(328)图形表示(204′-210c′)的形态,其中所述图形表示(204′-210c′)的形态包括图形表示(204′-210c′)相互之间的物理关系;
对图形表示(204′-210c′)的形心位置、大小、颜色和形态,分配(332)人可读的词汇表示;和
将所分配的人可读的词汇表示存储(308)在数据库(120)中,所述数据库(120)可通过人可读的词汇进行搜索。
2.如权利要求1所述的方法(300),还包括:
对包含多个图形表示(204′-210c′)的图像,确定(330)该多个图形表示(204′-210c′)相互之间的形态;和
分配(332)该多个图形表示(204′-210c′)的相对位置的词汇表示。
3.如权利要求2所述的方法(300),其中分配该多个图形表示(204′-210c′)的词汇表示还包括分配与哪个图形表示(204′-210c′)和哪个图形表示(204′-210c′)接触、以及哪个图形表示(204′-210c′)和相应图像的至少一个边界接触有关的词汇表示。
4.如权利要求2或3所述的方法(300),其中产生对象的图形表示(204′-210c′)还包括量化图像以确定具有至少一个一致和共同的特征的图形表示(204′-210c′),来确定该多个图形表示(204′-210c′)。
5.如权利要求1、2、或3所述的方法(300,400),还包括:
响应收到搜索查询,从数据库中检索出(406)至少一个图像,其中搜索查询包括基于文本的查询。
6.一种图像管理系统(100),包括:
用于获得(304)包含对象的图像的图像数据的装置;
用于产生(320)对象的图形表示(204′-210c′)的装置;
用于确定(322)图形表示(204′-210c′)的形心和大小的装置;
用于确定(324)形心的位置的装置;
用于根据所确定的形心位置,确定(328)图形表示(204′-210c′)的形态的装置,其中所述图形表示(204′-210c′)的形态包括图形表示(204′-210c′)相互之间的物理关系;
用于对图形表示(204′-210c′)的形心位置、大小、颜色和形态,分配(332)人可读的词汇表示的装置;和
用于将所分配的人可读的词汇表示存储(308)在数据库(120)中的装置,其中所述数据库(120)可通过人可读的词汇进行搜索。
7.如权利要求6所述的图像管理系统(100),其中用于产生图形表示的装置还配置为量化图像以确定相应的图像中具有至少一个一致和共同的特征的图形表示,来由此确定图形表示(204′-210c′)。
8.如权利要求6或7所述的图像管理系统(100),其中,用于分配的装置还配置为将形心的位置绘制在语素词汇组织图(220)上,将语素词汇组织图(220)分成多个虚拟区域(224,226),以及根据虚拟区域(224,226)和包含在虚拟区域(224,226)中的图形表示(204′-210c′)之间的关系,分配图形表示(204′-210c′)的形态的人可读的表示。
9.如权利要求6或7所述的图像管理系统(100),还包括用于响应收到搜索查询从所述数据库中检索出至少一个图像的装置,以及用于确定搜索查询的一个或多个特征的装置,其中该一个或多个特征至少定义了期望图像中的各图形表示(204′-210c′)的相对位置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/582,118 US7755646B2 (en) | 2006-10-17 | 2006-10-17 | Image management through lexical representations |
US11/582,118 | 2006-10-17 | ||
PCT/US2007/022226 WO2008048664A2 (en) | 2006-10-17 | 2007-10-17 | Image management through lexical representations |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101529422A CN101529422A (zh) | 2009-09-09 |
CN101529422B true CN101529422B (zh) | 2011-10-05 |
Family
ID=39302670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800388458A Expired - Fee Related CN101529422B (zh) | 2006-10-17 | 2007-10-17 | 通过词汇表示的图像管理 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7755646B2 (zh) |
JP (1) | JP4824820B2 (zh) |
CN (1) | CN101529422B (zh) |
GB (1) | GB2455943A (zh) |
WO (1) | WO2008048664A2 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7755646B2 (en) * | 2006-10-17 | 2010-07-13 | Hewlett-Packard Development Company, L.P. | Image management through lexical representations |
DE112008003972T5 (de) * | 2008-08-21 | 2011-07-14 | Hewlett-Packard Development Co., L.P., Tex. | Automatische Erzeugung einer skalierbaren, nach Relevanz geordneten Darstellung einer Bildsammlung |
JP5385624B2 (ja) * | 2009-01-30 | 2014-01-08 | 富士フイルム株式会社 | 画像キーワード付与装置および画像検索装置ならびにそれらの制御方法 |
JP5682569B2 (ja) | 2009-10-16 | 2015-03-11 | 日本電気株式会社 | 色彩解析装置、色彩解析方法、及び色彩解析プログラム |
US8837867B2 (en) * | 2012-12-07 | 2014-09-16 | Realnetworks, Inc. | Method and system to detect and select best photographs |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1467659A (zh) * | 2002-06-25 | 2004-01-14 | ��ʿͨ��ʽ���� | 图面搜索支持设备和图面搜索方法 |
US7043094B2 (en) * | 2001-06-07 | 2006-05-09 | Commissariat A L'energie Atomique | Process for the automatic creation of a database of images accessible by semantic features |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4307376A (en) * | 1976-12-09 | 1981-12-22 | Geometric Data Corporation | Pattern recognition system for generating hematology profile |
JPH05108728A (ja) * | 1991-10-21 | 1993-04-30 | Hitachi Ltd | 画像のフアイリングならびに検索方法 |
EP0550838A1 (en) * | 1992-01-10 | 1993-07-14 | Hewlett-Packard GmbH | Method and computer-aided design system for defining geometric relations |
JP3464338B2 (ja) * | 1995-03-31 | 2003-11-10 | 株式会社東芝 | 図面検索方法および装置 |
JP2950258B2 (ja) * | 1996-11-11 | 1999-09-20 | 日本電気株式会社 | 荷電粒子線描画方法及び装置 |
US5930783A (en) * | 1997-02-21 | 1999-07-27 | Nec Usa, Inc. | Semantic and cognition based image retrieval |
JP4058127B2 (ja) * | 1997-02-24 | 2008-03-05 | 富士通株式会社 | 半導体装置のレイアウト変更方法 |
JPH11232288A (ja) * | 1998-02-13 | 1999-08-27 | Fuji Xerox Co Ltd | 検索装置及び文書画像登録装置 |
US6240423B1 (en) * | 1998-04-22 | 2001-05-29 | Nec Usa Inc. | Method and system for image querying using region based and boundary based image matching |
JP4086377B2 (ja) * | 1998-09-30 | 2008-05-14 | キヤノン株式会社 | 情報検索装置及び方法 |
US6493705B1 (en) * | 1998-09-30 | 2002-12-10 | Canon Kabushiki Kaisha | Information search apparatus and method, and computer readable memory |
US6502105B1 (en) * | 1999-01-15 | 2002-12-31 | Koninklijke Philips Electronics N.V. | Region-based image archiving and retrieving system |
US6778697B1 (en) * | 1999-02-05 | 2004-08-17 | Samsung Electronics Co., Ltd. | Color image processing method and apparatus thereof |
JP2001160057A (ja) * | 1999-12-03 | 2001-06-12 | Nippon Telegr & Teleph Corp <Ntt> | 画像の階層的分類方法、および画像の分類・検索装置、およびこの方法を実行するプログラムを記録した記録媒体 |
KR100378351B1 (ko) | 2000-11-13 | 2003-03-29 | 삼성전자주식회사 | 색-텍스추어 거리 측정 방법 및 장치와 이를 이용한영상의 영역 구분 방법 및 장치 |
KR100374791B1 (ko) * | 2000-11-22 | 2003-03-04 | 삼성전자주식회사 | 영상의 영역 구분 방법 및 장치 |
KR100422805B1 (ko) * | 2000-12-26 | 2004-03-12 | 한국전자통신연구원 | 자연어를 이용한 이미지 데이터 색상 및 형태 검색 장치및 그 방법 |
US7030855B2 (en) * | 2001-05-10 | 2006-04-18 | Metcalf Darrell J | Video-imaging apparel with user-control system |
FR2825817B1 (fr) * | 2001-06-07 | 2003-09-19 | Commissariat Energie Atomique | Procede de traitement d'images pour l'extraction automatique d'elements semantiques |
US20020196965A1 (en) * | 2001-06-22 | 2002-12-26 | Wallace Edward S. | Image transformation and analysis system and method |
GB0118491D0 (en) * | 2001-07-28 | 2001-09-19 | Mood Internat Ltd | A method and apparatus for visual synchronisation between graphical hierarchical representations of an organisation |
CH701481B1 (de) * | 2001-09-25 | 2011-01-31 | Roland Pulfer | Prozessmanagement. |
DE10206903A1 (de) * | 2002-02-19 | 2003-09-04 | Siemens Ag | Softwareapplikation, Softwarearchitektur und Verfahren zur Erstellung von Softwareapplikationen, insbesondere für MES-Systeme |
US20040021666A1 (en) * | 2002-08-01 | 2004-02-05 | University Of Iowa Research Foundation | System and method for dynamically analyzing a mobile object |
JP4585742B2 (ja) * | 2003-02-06 | 2010-11-24 | キヤノン株式会社 | 画像表示装置、画像表示方法、プログラム及び記録媒体 |
CA2420479A1 (en) * | 2003-02-13 | 2004-08-13 | Ibm Canada Limited - Ibm Canada Limitee | Flow debugging software and method |
AU2003902954A0 (en) * | 2003-06-12 | 2003-06-26 | Canon Information Systems Research Australia Pty Ltd | Geometric space decoration in a graphical design system |
US7289666B2 (en) * | 2003-09-09 | 2007-10-30 | Hewlett-Packard Development Company, L.P. | Image processing utilizing local color correction and cumulative histograms |
US7548334B2 (en) * | 2003-10-15 | 2009-06-16 | Canon Kabushiki Kaisha | User interface for creation and editing of variable data documents |
US20050283070A1 (en) * | 2004-06-21 | 2005-12-22 | Celina Imielinska | Systems and methods for qualifying symmetry to evaluate medical images |
US20080021502A1 (en) * | 2004-06-21 | 2008-01-24 | The Trustees Of Columbia University In The City Of New York | Systems and methods for automatic symmetry identification and for quantification of asymmetry for analytic, diagnostic and therapeutic purposes |
CA2486482A1 (en) * | 2004-11-01 | 2006-05-01 | Canadian Medical Protective Association | Event analysis system and method |
RU2004138685A (ru) * | 2004-12-29 | 2006-06-10 | Общество с ограниченной ответственностью "Активное Видео" (RU) | Способ (варианты) и система обработки мультимедийной информации и способ формирования назначаемой области (варианты) |
US20080030497A1 (en) * | 2005-12-08 | 2008-02-07 | Yangqiu Hu | Three dimensional modeling of objects |
US7755646B2 (en) * | 2006-10-17 | 2010-07-13 | Hewlett-Packard Development Company, L.P. | Image management through lexical representations |
-
2006
- 2006-10-17 US US11/582,118 patent/US7755646B2/en not_active Expired - Fee Related
-
2007
- 2007-10-17 CN CN2007800388458A patent/CN101529422B/zh not_active Expired - Fee Related
- 2007-10-17 JP JP2009533369A patent/JP4824820B2/ja not_active Expired - Fee Related
- 2007-10-17 WO PCT/US2007/022226 patent/WO2008048664A2/en active Application Filing
- 2007-10-17 GB GB0906015A patent/GB2455943A/en not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7043094B2 (en) * | 2001-06-07 | 2006-05-09 | Commissariat A L'energie Atomique | Process for the automatic creation of a database of images accessible by semantic features |
CN1467659A (zh) * | 2002-06-25 | 2004-01-14 | ��ʿͨ��ʽ���� | 图面搜索支持设备和图面搜索方法 |
Also Published As
Publication number | Publication date |
---|---|
US7755646B2 (en) | 2010-07-13 |
JP4824820B2 (ja) | 2011-11-30 |
WO2008048664A2 (en) | 2008-04-24 |
US20080088642A1 (en) | 2008-04-17 |
GB0906015D0 (en) | 2009-05-20 |
GB2455943A (en) | 2009-07-01 |
JP2010507171A (ja) | 2010-03-04 |
CN101529422A (zh) | 2009-09-09 |
WO2008048664A3 (en) | 2008-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7848577B2 (en) | Image processing methods, image management systems, and articles of manufacture | |
EP1516264B1 (en) | Image retrieval by generating a descriptor for each spot of an image the cells of which having visual characteristics within a selected tolerance | |
US7925650B2 (en) | Image management methods, image management systems, and articles of manufacture | |
AU2014321165B2 (en) | Image searching method and apparatus | |
US6563959B1 (en) | Perceptual similarity image retrieval method | |
US8391618B1 (en) | Semantic image classification and search | |
US6915011B2 (en) | Event clustering of images using foreground/background segmentation | |
US7233945B2 (en) | Document processing apparatus | |
US6115717A (en) | System and method for open space metadata-based storage and retrieval of images in an image database | |
US20070109616A1 (en) | System and method for searching digital images | |
JP2014029732A (ja) | 画像の検索および読み出しに関する基準を用いて画像内容の描写を生成する方法 | |
CN101551823A (zh) | 一种综合多特征图像检索方法 | |
Khokher et al. | A fast and effective image retrieval scheme using color-, texture-, and shape-based histograms | |
Fuertes et al. | A scheme of colour image retrieval from databases | |
CN101529422B (zh) | 通过词汇表示的图像管理 | |
EP1530159B1 (en) | Systems and methods for indexing and retrieving images | |
Kannan et al. | Efficient use of MPEG-7 color layout and edge histogram descriptors in CBIR systems | |
CN110188230A (zh) | 基于语义的图像检索方法及装置 | |
Worring et al. | Interactive retrieval of color images | |
Suryawanshi | Image Recognition: Detection of nearly duplicate images | |
Khokher et al. | Image retrieval: A state of the art approach for CBIR | |
Dimai | Unsupervised extraction of salient region-descriptors for content based image retrieval | |
Chua et al. | Color-based pseudo object model for image retrieval with relevance feedback | |
Ali | Content-based image classification and retrieval: A rule-based system using rough sets framework | |
Al-Oraiqat et al. | A modified image comparison algorithm using histogram features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111005 Termination date: 20131017 |