CN102663053A - 一种基于图像内容搜索的分布式服务器系统 - Google Patents

一种基于图像内容搜索的分布式服务器系统 Download PDF

Info

Publication number
CN102663053A
CN102663053A CN2012100894490A CN201210089449A CN102663053A CN 102663053 A CN102663053 A CN 102663053A CN 2012100894490 A CN2012100894490 A CN 2012100894490A CN 201210089449 A CN201210089449 A CN 201210089449A CN 102663053 A CN102663053 A CN 102663053A
Authority
CN
China
Prior art keywords
server
storage
comparison
image
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100894490A
Other languages
English (en)
Inventor
李俊飞
於锋
虞正华
熊均华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI BOKANG INTELLIGENT INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI BOKANG INTELLIGENT INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI BOKANG INTELLIGENT INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI BOKANG INTELLIGENT INFORMATION TECHNOLOGY Co Ltd
Priority to CN2012100894490A priority Critical patent/CN102663053A/zh
Publication of CN102663053A publication Critical patent/CN102663053A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种基于图像内容搜索的分布式服务器系统,用于信息技术领域,所述系统包括:图像特征采集服务器,用来采集图像和提取图像中的特征数据,并将图像数据和特征数据传送至存储和比较服务器;所述存储和比较服务器,用来对图像数据和图像特征数据进行分别存储,以及图像特征数据的检索比对,并将比对的结果传送至调度服务器;所述调度服务器,用来对存储和比较服务器进行资源调度,并与终端用户界面进行通信。通过所述系统能够实现基于图像内容搜索,从而处理大批量的图像数据以及能有效提高检索效率,并通过提取图像特征,进行特征比较搜索,使搜索到的图片的相似性和准确性比传统方法有所提高。

Description

一种基于图像内容搜索的分布式服务器系统
技术领域
本发明涉及信息技术领域,尤其涉及一种基于图像内容搜索的分布式服务器系统。
背景技术
图像搜索是指通过搜索图像文本或者视觉特征,为用户提供互联网上相关图形图像资料搜索服务的专业搜索引擎系统,是搜索引擎的一种细分。图像搜索分为基于图像文本的搜索和基于图像内容的搜索。基于图像文本的搜索是指按照图像类别为不同类别的图像增加文本描述,通过搜索文本达到搜索到所需图像的目的;基于图像内容搜索指的是搜索条件本身就是一幅图像,它建立索引的方式是通过提取底层特征,然后通过计算比较这些特征和查询条件之间的距离,来决定两个图片的相似程度。
21世纪的今天,随着网络技术和信息数字处理化技术飞速发展,图像处理技术已日臻成熟,而图像搜索领域却仍集中在基于图像文本的搜索。另外,由于图像内容的丰富内涵以及人们对图像内容进行抽象的主观性,图像的视觉特征很难用关键字来描述。因此,基于图像文本的搜索不能客观反映图像内容的多样性,而且其数学模型、系统结构、查询方式及用户接口等也不具备有效管理和搜索图像数据的能力,使得传统的基于图像文本的搜索方法往往不能满足人们的需要。同时由于图像本身所携带的信息量大以及图像特征的多样性,图像的许多特征并不能用简单的数值和字符来精确表达,因此现有技术并不能在系统级别上提高图像内容搜索的准确性和搜索效率。
发明内容
本发明实施例的目的是针对现有图像搜索技术的不足,提出一种基于图像内容搜索的分布式服务器系统,以能够基于图像内容搜索,处理大批量的图像数据以及能有效提高检索效率,并通过提取图像特征,进行特征比较搜索,使搜索到的图片的相似性和准确性比传统方法有所提高。
为了达到上述发明目的,本发明实施例提出的一种基于图像内容搜索的分布式服务器系统是通过以下技术方案实现的:
一种基于图像内容搜索的分布式服务器系统,所述系统包括:
图像特征采集服务器,用来采集图像和提取图像中的特征数据,并将图像数据和特征数据传送至存储和比较服务器;
所述存储和比较服务器,用来对图像数据和图像特征数据进行分别存储,以及图像特征数据的检索比对,并将比对的结果传送至调度服务器,其中,所述图像数据和与之对应的图像特征数据存储时相互关联,且所述存储和比较服务器采用分布式存储方式,每个存储和比较服务器只负责存储与之相连的图像特征采集服务器所传送的特征数据和图像数据;
所述调度服务器,用来对存储和比较服务器进行资源调度,并与终端用户界面进行通信。
进一步优选地,所述存储和比较服务器具体包括:
比较模块,用来进行图像特征的比对;
存储模块,用来存储图像特征数据和图像数据;
特征传输模块,用来将处于繁忙状态的存储和比较服务器的图像特征数据传送到处于空闲状态的存储和比较服务器。
进一步优选地,所述调度服务器具体包括:
通信模块,用来接收终端用户发送的待搜索图像转发至图像特征采集服务器和发送比对结果至终端用户;
调度模块,用来进行存储和比较服务器资源的调度。
调度服务器对待搜索的图像提取特征,然后把提取的特征发送到各个特征存储和比较服务器上,由特征存储和比较服务器进行比较。调度服务器的调度模块主要用于资源的调度,起到中转转发的作用。调度模块在进行资源调度时,如果发现某一个特征存储比较服务器在比较时处于空闲状态则进行合理调度,以让此特征存储和比较服务器参与到比较中。
进一步优选地,所述图像特征数据包括图像的颜色、纹理、形状和边缘特征。
与现有技术相比,本发明实施例基于图像内容搜索的分布式服务器系统使用分布式分层次的服务器架构,有利于多个服务器之间的相互配合,能够处理大批量的图像数据以及能有效提高检索效率;通过提取图像特征比较距离方式进行图像搜索,搜索到的图片的相似性和准确性比传统方法都大有提高,图像结果的准确性可高达90%以上;该系统适用性强,不仅适用于C/S系统,在通行的B/S系统上同样适用,同时能够满足不同场景图像的不同类别的特征进行检索比对。
附图说明
通过下面结合附图对其示例性实施例进行的描述,本发明上述特征和优点将会变得更加清楚和容易理解。
图1为本发明实施例1一种基于图像内容搜索的分布式服务器系统结构框图;
图2为本发明实施例2一种基于图像内容搜索的分布式服务器系统消息流程图;
图3为本发明实施例3分布式服务器特征比较时空闲服务器资源调度图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
如图1所示,为本发明实施例1一种基于图像内容搜索的分布式服务器系统实施框图,该系统在实施时可以有一个或多个图像特征采集服务器,一个或多个存储和比较服务器,一个调度服务器,其中,分布式服务器系统中的图像特征采集服务器、存储和比较服务器和调度服务器的功能如下:
图像特征采集服务器,用来采集图像和提取图像中的特征数据,并将图像数据和特征数据传送至存储和比较服务器;
所述存储和比较服务器,用来对图像数据和图像特征数据进行分别存储,以及图像特征数据的检索比对,并将比对的结果传送至调度服务器,其中,所述图像数据和与之对应的图像特征数据存储时相互关联,且所述存储和比较服务器采用分布式存储方式,每个存储和比较服务器只负责存储与之相连的图像特征采集服务器所传送的特征数据和图像数据;
所述调度服务器,用来对存储和比较服务器进行资源调度,并与终端用户界面进行通信。
进一步优选地,所述图像特征数据包括图像的颜色、纹理、形状和边缘特征。
如图2所示,为基于图像内容搜索的分布式服务器系统消息流程图。当终端用户提出图像搜索请求时,调度服务器接收该请求并接收图像数据发送至图像特征采集服务器,调度该图像特征提取服务器进行特征数据的提取,当特征数据提取出来后发送至存储和比较服务器进行特征的比对。
其中,图像特征可分为四类:图像的颜色、纹理、形状和边缘特征;前端图像采集服务器使用合适的方法,比如颜色直方图法,Tamura纹理特征,傅立叶形状描述符等方法提取图像特征数据。前端图像采集服务器根据不同场景提取图像不同的特征,提取到图像特征之后把特征数据传送到存储和比较服务器,由存储和比较服务器进行存储。
存储和比较服务器接收到前端特征搜索服务器传送的图像数据和图像特征时,立即对图像数据和图像特征进行存储。存储时,特征数据要和图像数据分开存储,这样能有效利用存储空间,同时不需要考虑图像本身的内容信息,有利于提高检索效率。
存储特征数据时采用二进制文件流方式存储,这样无须对特征数据进行编解码,这在一定程序上提高了检索效率。需要注意的是,存储特征数据时图像特征需要和与之对应的图像做关联,这样能够轻易的根据图像特征定位到图像位置。
在进行特征检索比对时,由于图片数据量大,需要按照一定的方式把一次比较分为多个片段,让多个片段并发执行检索比对,然后把比对结果传给调度服务器。
而调度服务器主要起到中转调度作用,并不参与特征比较,当存储和比较服务器进行特征比对完成后,将图像搜索结果发送至调度服务器,同时调度服务器将结果返回给用户,至此,一次图像搜索过程完成。
进一步优选地,所述存储和比较服务器具体包括:
比较模块,用来进行图像特征的比对;
存储模块,用来存储图像特征数据和图像数据;
特征传输模块,用来将处于繁忙状态的存储和比较服务器的图像特征数据传送到处于空闲状态的存储和比较服务器。
由于特征比较服务器只负责存储和特征比较,存储时只消耗少量的CPU时间,只有在进行特征比较时CPU时间才能充分利用。这样一来,存储和比较服务器大部分时间CPU处于空闲状态。终端用户在搜索图像时可以按照一定的条件搜索图片,这样就有可能造成有的存储和比较服务器无法参与到比较过程,进而造成CPU资源的浪费。
进一步优选地,所述调度服务器具体包括:
通信模块,用来接收终端用户发送的待搜索图像转发至图像特征采集服务器和发送比对结果至终端用户;
调度模块,用来进行存储和比较服务器资源的调度。
调度服务器对待搜索的图像提取特征,然后把提取的特征发送到各个特征存储和比较服务器上,由特征存储和比较服务器进行比较。
如图3所示,为了充分利用各个特征存储和比较服务器的CPU资源,调度服务器对存储和比较服务器进行资源调度,调度服务器的调度模块主要用于资源的调度,起到中转转发的作用。调度模块在进行资源调度时,如果发现某一个特征存储比较服务器在比较时处于空闲状态则进行合理调度,以让此特征存储和比较服务器参与到比较中。
特征传输模块把特征比较时处于繁忙状态的特征存储和比较服务器上的特征数据传送到处于空闲状态的特征存储和比较服务器上进行比较,以达到资源的充分利用。
其中,存储和比较服务器的存储方式使用分布式存储,每个存储和比较服务器只负责存储与之相连的图像特征采集服务器所传送的特征和图像数据。
具体的实施情况下,图像特征采集服务器位于前端,外接摄像头等其它图像采集设备。每采集一幅图像,特征采集服务器对采集的对象进行特征提取并把提取的特征结果以及图像信息传送给存储和比较服务器。由于特征采集服务器功能单一,不需要过高的硬件配置,但硬件要求耐高温、高压、连续长时间工作不出异常等特点。
存储和比较服务器需要高性能的配置,与特征采集服务器通过光纤相连。在图像传送过程中为防止丢帧,两个服务器之间使用TCP协议进行数据传输。同时存储和比较服务器与调度服务器进行通信,由于通信数据量较大,同样需要光纤作为通信媒介。调度服务器与多个存储和比较服务器相连,并且处理多个终端用户的搜索请求,所以调度服务器同样需要高性能的配置;
终端用户发送待搜索的图像到调度服务器,调度服务器提取待搜索图像的特征,并把提取后的特征发送到与之相连的各个存储和比较服务器上;
存储和比较服务器接收到调度服务器传送的待搜索图像的特征,并与之所存储的所有特征进行比较,检索到结果后,返回搜索结果到调度服务器。调度服务器再把由存储和比较服务器传送的结果发送到终端用户。
与现有技术相比,本发明实施例基于图像内容搜索的分布式服务器系统的有益效果在于:使用分布式分层次的服务器架构,有利于多个服务器之间的相互配合,能够处理大批量的图像数据以及能有效提高检索效率;通过提取图像特征比较距离方式进行图像搜索,搜索到的图片的相似性和准确性比传统方法都大有提高,图像结果的准确性可高达90%以上;该系统适用性强,不仅适用于C/S系统,在通行的B/S系统上同样适用,同时能够满足不同场景图像的不同类别的特征进行检索比对。
本发明所属领域的一般技术人员可以理解,本发明以上实施例仅为本发明的优选实施例之一,为篇幅限制,这里不能逐一列举所有实施方式,任何可以体现本发明权利要求技术方案的实施,都在本发明的保护范围内。
需要注意的是,以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,在本发明的上述指导下,本领域技术人员可以在上述实施例的基础上进行各种改进和变形,而这些改进或者变形落在本发明的保护范围内。

Claims (6)

1.一种基于图像内容搜索的分布式服务器系统,其特征在于,所述系统包括:
图像特征采集服务器,用来采集图像和提取图像中的特征数据,并将图像数据和特征数据传送至存储和比较服务器;
所述存储和比较服务器,用来对图像数据和图像特征数据进行分别存储,以及图像特征数据的检索比对,并将比对的结果传送至调度服务器,其中,所述图像数据和与之对应的图像特征数据存储时相互关联,且所述存储和比较服务器采用分布式存储方式,每个存储和比较服务器只负责存储与之相连的图像特征采集服务器所传送的特征数据和图像数据;
所述调度服务器,用来对存储和比较服务器进行资源调度,并与终端用户界面进行通信。
2.如权利要求1所述的分布式服务器系统,其特征在于,所述存储和比较服务器具体包括:
比较模块,用来进行图像特征的比对;
存储模块,用来存储图像特征数据和图像数据;
特征传输模块,用来将处于繁忙状态的存储和比较服务器的图像特征数据传送到处于空闲状态的存储和比较服务器。
3.如权利要求1或2所述的分布式服务器系统,其特征在于,所述调度服务器具体包括:
通信模块,用来接收终端用户发送的待搜索图像转发至图像特征采集服务器和发送比对结果至终端用户;
调度模块,用来进行存储和比较服务器资源的调度。
4.如权利要3所述的分布式服务器系统,其特征在于,所述图像特征数据包括图像的颜色、纹理、形状和边缘特征。
5.如权利要求4所述的分布式服务器系统,其特征在于,所述存储和比较服务器采用二进制文件流方式存储所述特征数据。
6.如权利要求6所述的分布式服务器系统,其特征在于,所述存储和比较服务器的比较模块进行特征比对搜索时,将一次比较分为多个片段,所述多个片段并发执行。
CN2012100894490A 2012-03-30 2012-03-30 一种基于图像内容搜索的分布式服务器系统 Pending CN102663053A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100894490A CN102663053A (zh) 2012-03-30 2012-03-30 一种基于图像内容搜索的分布式服务器系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100894490A CN102663053A (zh) 2012-03-30 2012-03-30 一种基于图像内容搜索的分布式服务器系统

Publications (1)

Publication Number Publication Date
CN102663053A true CN102663053A (zh) 2012-09-12

Family

ID=46772544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100894490A Pending CN102663053A (zh) 2012-03-30 2012-03-30 一种基于图像内容搜索的分布式服务器系统

Country Status (1)

Country Link
CN (1) CN102663053A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324682A (zh) * 2013-05-31 2013-09-25 百度在线网络技术(北京)有限公司 一种基于图片来搜索视频的方法及装置
CN106453449A (zh) * 2015-08-06 2017-02-22 泰兴市智瀚科技有限公司 信息即时推送的方法和分布式系统服务器
CN106777351A (zh) * 2017-01-17 2017-05-31 中国人民解放军国防科学技术大学 基于art树分布式系统图存储计算系统及其方法
CN106846244A (zh) * 2017-01-04 2017-06-13 宇龙计算机通信科技(深圳)有限公司 一种图像数据处理方法、设备及终端
CN106844727A (zh) * 2017-02-10 2017-06-13 珠海经济特区远宏科技有限公司大连分公司 海量图像特征数据分布式采集处理和分级应用系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080021928A1 (en) * 2006-07-24 2008-01-24 Yagnik Jay N Method and apparatus for automatically annotating images
CN102317929A (zh) * 2009-02-18 2012-01-11 A9.Com有限公司 图像匹配方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080021928A1 (en) * 2006-07-24 2008-01-24 Yagnik Jay N Method and apparatus for automatically annotating images
CN102317929A (zh) * 2009-02-18 2012-01-11 A9.Com有限公司 图像匹配方法和系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324682A (zh) * 2013-05-31 2013-09-25 百度在线网络技术(北京)有限公司 一种基于图片来搜索视频的方法及装置
CN103324682B (zh) * 2013-05-31 2017-06-06 百度在线网络技术(北京)有限公司 一种基于图片来搜索视频的方法及装置
CN106453449A (zh) * 2015-08-06 2017-02-22 泰兴市智瀚科技有限公司 信息即时推送的方法和分布式系统服务器
CN106846244A (zh) * 2017-01-04 2017-06-13 宇龙计算机通信科技(深圳)有限公司 一种图像数据处理方法、设备及终端
CN106777351A (zh) * 2017-01-17 2017-05-31 中国人民解放军国防科学技术大学 基于art树分布式系统图存储计算系统及其方法
CN106844727A (zh) * 2017-02-10 2017-06-13 珠海经济特区远宏科技有限公司大连分公司 海量图像特征数据分布式采集处理和分级应用系统及方法

Similar Documents

Publication Publication Date Title
US8886797B2 (en) System and method for deriving user expertise based on data propagating in a network environment
US8600969B2 (en) User interest pattern modeling server and method for modeling user interest pattern
CN102663053A (zh) 一种基于图像内容搜索的分布式服务器系统
CN109710792A (zh) 一种基于索引的快速人脸检索系统应用
CN106528894B (zh) 设置标签信息的方法及装置
CN102436513A (zh) 分布式检索方法和系统
CN109033462B (zh) 在大数据存储的存储设备中确定低频数据项的方法及系统
CN104462096B (zh) 舆情监测分析方法和装置
CN110597630B (zh) 一种分布式系统中内容资源的处理方法及系统
CN111061837A (zh) 话题识别方法、装置、设备及介质
CN101339560B (zh) 一种搜索系列性数据的方法、装置及一种搜索引擎系统
CN110851473A (zh) 一种数据处理方法、装置和系统
CN101673263B (zh) 视频内容的搜索方法
CN106604068A (zh) 一种更新媒体节目的方法及其系统
CN101261645B (zh) 一种获取多层信息的方法和装置
CN113259151A (zh) 融合内容分发网络cdn中域名带宽明细监控方法及系统
CN110765305A (zh) 媒介信息推送系统及其基于视觉特征的图文检索方法
CN107291875B (zh) 一种基于元数据图的元数据组织管理方法和系统
CN108520047B (zh) 一种视频特征信息检索方法
CN107070987B (zh) 用于分布式对象存储系统的数据获取方法及系统
CN103428231B (zh) 离线下载方法和系统
CN112613396B (zh) 一种任务紧急程度处理方法及系统
CN112069331B (zh) 一种数据处理、检索方法、装置、设备及存储介质
CN101673267A (zh) 音频、视频内容的搜索方法
CN107992474B (zh) 一种流式数据主题挖掘方法及其系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120912