CN1851713A - 基于多图像文本的图像检索及显示方法 - Google Patents

基于多图像文本的图像检索及显示方法 Download PDF

Info

Publication number
CN1851713A
CN1851713A CN 200610083044 CN200610083044A CN1851713A CN 1851713 A CN1851713 A CN 1851713A CN 200610083044 CN200610083044 CN 200610083044 CN 200610083044 A CN200610083044 A CN 200610083044A CN 1851713 A CN1851713 A CN 1851713A
Authority
CN
China
Prior art keywords
image
information
text
picture
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610083044
Other languages
English (en)
Other versions
CN100511230C (zh
Inventor
阮戈
范春莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Cloud Computing Beijing Co Ltd
Original Assignee
WANWANG ZHICHENG SCIENCE-TECHNOLOGY Co Ltd BEIJING
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WANWANG ZHICHENG SCIENCE-TECHNOLOGY Co Ltd BEIJING filed Critical WANWANG ZHICHENG SCIENCE-TECHNOLOGY Co Ltd BEIJING
Priority to CNB2006100830440A priority Critical patent/CN100511230C/zh
Publication of CN1851713A publication Critical patent/CN1851713A/zh
Application granted granted Critical
Publication of CN100511230C publication Critical patent/CN100511230C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种基于多图像文本的图像检索及显示方法,为解决现有图像检索显示效率低而提出,本发明包括步骤:根据图像文本中存储的图像信息建立图像及其匹配信息的对应关系库;根据图像文本显示的图像信息,输入查询条件,并利用该查询条件在关系库中进行匹配操作,若匹配成功,则返回匹配信息对应的图像的边界信息、图像文本的显示区域信息;根据检索图像的边界信息确定仅包括检索图像的显示区域,生成可覆盖除检索图像显示区域外的图像文本的显示区域的覆盖层;将覆盖层输出至显示端,仅显示检索图像。本发明可高效显示一张图片上的指定区域,节约了新图片生成过程和新图片数据传输过程,节约了处理资源。

Description

基于多图像文本的图像检索及显示方法
技术领域
本发明涉及一种图像检索及显示方法,尤其涉及一种基于多图像文本的图像检索及显示方法。
背景技术
图像能够表达丰富的蕴意,又容易被人识别和接受,因此,图像在现代生活中的应用非常广泛。例如一些公司、网站的标识等多采用图像形式来表现。由于图像不同于文本,需要靠人们各自的理解来说明其蕴意,因此图像检索比起文本的查询和匹配要困难得多。特别是在各种图像较多的文本文件中,在文本的海量图像中查找出用户感兴趣的图像,是非常困难的。即使文件支持自动搜索功能,查找到匹配的图像并将其显示到用户输出端,也是需要耗费大量的资源的。特别是当检索对象是网页文本时,被搜索文本需要面对的可能是海量用户,服务器要针对不同的用户检索需求而传送不同的查询结果,而图像数据一般又都比较大,这必然导致网络的阻塞。
而目前,为在有限的空间内增加信息容量及吸引网友眼球,各式网站的网页中存在很多图像信息。互联网上存在各式各样的图像,有时用户需要收集一些自己最感兴趣的、具有代表性的图像以供自己使用。但随着网上图像信息的急剧膨胀,检索相应的图像并显示到各用户端,对于处理能力有限的服务器来讲,耗费了大量的处理资源。用户较多时,很可能导致数据阻塞。
用户通过浏览器访问web页面时,要求在其中存在的大量图像中查找自己感兴趣的,并在web页面里仅凸显自己感兴趣的一个或者多个图像,同时隐藏其他与检索图像无关的显示数据。目前广泛使用的方法是首先进行图像检索,根据用户检索结果显示的需要,重新生成一张仅包括用户检索结果的web页面,传输到用户浏览器端。目前采用方法的缺点是非常明显的:需要重新生成新的web页面及图像,并进行相应传输,这必然导致处理器负担的增加,总体上延迟了在浏览器端的显示,造成用户体验低下。检索用户较多时,将导致网络的阻塞。
发明内容
针对上述现有的图像检索及显示方法中所存在的问题和不足,本发明的目的是提供一种明显改善图像检索后传输显示效果的基于多图像文本的检索图像显示方法。
本发明是这样实现的:一种基于多图像文本的图像检索及显示方法,包括以下步骤:
(1)根据所述图像文本中存储的图像信息建立图像、图像显示区域、所述图像文本显示区域及其匹配信息的对应关系库;
(2)根据所述图像文本显示的图像信息,利用输入的查询条件在所述关系库中进行匹配操作,若匹配成功,则返回匹配信息对应的图像显示区域、所述图像文本的显示区域信息;
(3)根据所述图像文本的显示区域信息生成至少遮盖掉该图像文本显示区域的覆盖层;
(4)根据所述图像的显示区域,将该图像的边界信息对应于所述覆盖层的区域设置为透明。
其中,所述步骤(1)中建立图像及其匹配信息关系库的具体步骤为:
A、为所述图像文本中存储的所有图像建立标识信息;
B、建立所述标识信息与其对应的图像位置及区域的信息的对应关系库。
所述图像文本为网页页面。
利用本发明在对图像进行检索时,当检索到匹配图像并输出该检索图像时,不需要重新生成图像文本对象,也无需再对原图片进行处理,而是通过将不需要显示的原图层遮盖起来,仅显示检索图像所在区域。特别是检索对象是web页面时,利用本发明显示检索结果,不但节约了对图片本身的处理过程,还节约了web应用中重新传输图片数据的过程,加快了图片局部定位显示的过程。本发明可高效显示一张图片上的指定区域,节约了新图片生成过程和新图片数据传输过程,当原图较大时,能明显节约服务器的处理资源、减少用户整体的等待时间,从而能显著提高web用户体验,具有较强的实用意义。
附图说明
图1是本发明的图像检索及显示流程示意图;
图2是网站页面图片显示示意图。
具体实施方式
以下结合附图,对本发明进行详细描述。
本发明是针对在包含有海量图像的文本对象中进行图像搜索并显示而提出的。以下以比较有代表性的web页面为对象详细介绍本发明,本领域技术人员应当理解,本发明并不限于web页面文本的应用。
本发明实施时,首先需要对web页面文本中包括的各单独图像建立检索匹配信息。本发明可采用关键字检索方式。首先为web页面文本中包括的所有图像建立标识信息,这些标识信息均为文字信息,以方便用户的输入。这些关键字的标识信息包括图像所有可能的名称、蕴意、属性、大小、网站地址、网站域名、网站关键词、网站简介等所有可以标识图像特征的文字信息。为图像建立匹配信息数据库,建立图像显示信息与图像的关键字标识信息的对应关系。在web页面文本中设置坐标系统,例如网格、坐标等可用于确定图像位置及显示区域的系统,利用坐标系统完成对web页面文本中包括的各单独图像的定位,并确定各图像的显示区域、web页面文本的整个显示区域,并将该确定的显示区域、web页面文本的整个显示区域与图像的关键字标识信息进行绑定。
如图1所示,本发明的具体流程如下:
步骤1为流程开始步骤;
在步骤2,当web用户需要在包括有海量的web页面上检索自己感兴趣的图像时,输入相应的搜索匹配信息;
在步骤3,用户的浏览器把此次检索请求发送到web服务器,web服务器将检索请求再转交到存储图片信息的数据库,进行匹配信息匹配,若有匹配信息,则进入步骤4;否则返回检索不成功信息,进入步骤6;
在步骤4,输出匹配信息对应的检索图像的位置信息、web页面的显示区域信息和检索图像显示区域(一块或者多块)信息;
在步骤5,web用户端的浏览器接收到web服务器返回的位置及显示区域信息后,根据本发明的坐标系统动态创建一个和原web页面显示区域大小一致(或者大于web页面显示区域),且具有非透明背景色的层(以下称覆盖层)遮盖原图层,从而隐藏掉整个原web页面。根据web服务器返回的检索图像显示区域,设置那些检索图像显示区域的背景色为透明色,从而显示出下方的原图片相对应的区域——这些区域正是web用户检索的结果相关的区域。当web用户继续下一次检索时,将先清除掉覆盖层,然后重复上述的检索和显示过程。
步骤6,流程结束。
本发明图像区域信息生成步骤为:
1、根据所述图像的边界坐标信息,确定所述图像的最大横坐标值、最小横坐标值、最大纵坐标值和最小纵坐标值;
2、根据上述坐标值确定矩形区域,并根据该矩形区域确定一个大于或等于该区域的图像显示区域;
3、将上述步骤2确定的图像显示区域信息与所述标识信息绑定。
本发明图像区域信息生成步骤还可以为:
1、在所述图像中确定一个坐标点,并计算出该坐标点距所述图像的边界的最大距离,以该坐标点为圆心、最大距离为半径确定圆形区域;
2、根据圆形区域确定一个大于或等于该区域的图像显示区域;
3、将上述步骤2确定的图像显示区域信息与所述标识信息绑定。
下面以万网网格页面( http://g.www.com.cn)为例,阐明本发明的具体应用过程。
万网网格是一个集中展示万网联盟会员网站logo、图标的页面,将众多会员网站的logo(一种图片标识)统一展示在一张完整页面上。具体可参见上述网址显示内容,如图2所示,具体可参见页面 http://g.www.com.cn。因为整张web页面面积庞大,里面的网站log(web页面包括的图像)非常多,用户用肉眼找到自己感兴趣的相关网站的logo,显得非常困难。这时,可通过输入检索自己比较感兴趣的匹配信息,如用户仅仅对是域名标识的图像感兴趣,即可输入“域名”来搜索图像,启用本发明的方法后,显示检索结果的页面的过程耗时不到0.05s,避免了服务器的资源损耗、几乎不需要用户等待。
为使本领域技术人员更好地理解本发明。仍以上面的网格为例具体说明如何实施在指定的一张包括了海量图像信息的Web页面上快速显示搜索结果的。
首先需要建立图片区域和标识信息(关键字)的映射关系数据,具体步骤如前述。
上述指定的web页面从逻辑上可分解为很多独立的图像区域——这里的独立指把该区域分离出来,视觉上看是一个小图片或者图标,能独立表达出某种信息,并不依赖于其他区域,这就是本发明所称的图像,每个图像在web页面上占据一个确定的区域,同时每个图像在相应的数据库中都有对应的关键字标识信息。这些关键字标识信息和图像的对应关系,储存在Web服务器端的数据库中的一张映射表里。
在数据库中储存的图像到相关信息的映射关系大致可表示为“坐标x,坐标y,宽,高,网址,介绍,其他信息”,其中坐标x,坐标y,宽,高这四个数据定义了每个图像在整张web页面图上的所在区域。
当用户输入搜索词时,Web页面利用Javascript的AJAX技术实现异步后台提交(这里异步提交意义为,客户端的web页面不刷新或者页面网址不变,搜索词由javascript的xhttp组件提交到服务器端)。
Web服务器端的数据库会根据输入的关键字标识信息,找出该关键字标识信息对应的图像位置信息、Web页面显示区域信息和图像显示区域信息。
服务器将找到的上述位置及显示区域信息加上javascript指令,用字符串形式传回到客户端,由客户端的javascript的fnWhenDone函数负责接收,而此函数调用javascript自身的eval函数,让客户端的浏览器执行服务端返回的javascript指令。
这些javascript指令完成的操作分为两步。首先调用javascript自身的createElement方法,动态创建一个与web页面图片显示区域一样大小的div浮动覆盖层,并设置其在web页面上的坐标,使其位置浮在到web页面图片正上方达到遮盖掉原显示区域的效果。遮盖区域等于或大于原web页面图片显示区域。
然后设置该div浮动层的css属性FILTER为mask(color=#efefff),设置这个属性后,该div浮动层会有一个特性,div里面的子元素(childElement)所在的区域(检索图像显示区域)都会透明,失去遮盖效果。本发明将利用这个特性,继续动态创建createElement该div浮动层的子元素,并把这些子元素根据前面服务端返回的坐标数据,设置其css属性的位置属性,包括left、top、width、height等信息,定位到不需要遮盖的位置上方。检索图像的显示区域数目与检索图像数目一一对应。最后完成显示。本发明原页面本身并没有发生变化,也没有任何新页面图片的传输,节约了图片数据重新传输过程,防止网络拥塞,并且高效地完成了图片搜索显示过程,对于提高网站的用户体验非常有意义。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (6)

1、一种基于多图像文本的图像检索及显示方法,其特征在于,该方法包括以下步骤:
(1)根据所述图像文本中存储的图像信息建立图像、图像显示区域、所述图像文本显示区域及其匹配信息的对应关系库;
(2)根据所述图像文本显示的图像信息,利用输入的查询条件在所述关系库中进行匹配操作,若匹配成功,则返回匹配信息对应的图像显示区域、所述图像文本的显示区域信息;
(3)根据所述图像文本的显示区域信息生成至少遮盖掉该图像文本显示区域的覆盖层;
(4)根据所述图像的显示区域,将该图像的边界信息对应于所述覆盖层的区域设置为透明。
2、根据权利要求1所述的基于多图像文本的检索图像显示方法,其特征在于,所述步骤(1)中建立图像及其匹配信息关系库的具体步骤为:
A、为所述图像文本中存储的所有图像建立标识信息;
B、建立所述标识信息与其对应的图像位置及区域的信息的对应关系库。
3、根据权利要求2所述的基于多图像文本的检索图像显示方法,其特征在于,所述步骤B中的图像区域信息生成步骤为:
a、根据所述图像的边界坐标信息,确定所述图像的最大横坐标值、最小横坐标值、最大纵坐标值和最小纵坐标值;
b、根据上述坐标值确定矩形区域,并根据该矩形区域确定一个大于或等于该区域的图像显示区域;
c、将步骤b确定的图像显示区域信息与所述标识信息绑定。
4、根据权利要求2所述的基于多图像文本的检索图像显示方法,其特征在于,所述步骤B中的图像区域信息生成步骤为:
a、在所述图像中确定一个坐标点,并计算出该坐标点距所述图像的边界的最大距离,以该坐标点为圆心、最大距离为半径确定圆形区域;
b、根据所述圆形区域确定一个大于或等于该区域的图像显示区域;
c、将步骤b确定的图像显示区域信息与所述标识信息绑定。
5、根据权利要求1所述的基于多图像文本的检索图像显示方法,其特征在于,所述图像标识信息包括图像名称、图像属性、标识名称或标识地址。
6、根据权利要求1所述的基于多图像文本的检索图像显示方法,其特征在于,所述图像文本为网页页面。
CNB2006100830440A 2006-05-29 2006-05-29 基于网页页面文本的图像检索及显示方法 Active CN100511230C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100830440A CN100511230C (zh) 2006-05-29 2006-05-29 基于网页页面文本的图像检索及显示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100830440A CN100511230C (zh) 2006-05-29 2006-05-29 基于网页页面文本的图像检索及显示方法

Publications (2)

Publication Number Publication Date
CN1851713A true CN1851713A (zh) 2006-10-25
CN100511230C CN100511230C (zh) 2009-07-08

Family

ID=37133192

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100830440A Active CN100511230C (zh) 2006-05-29 2006-05-29 基于网页页面文本的图像检索及显示方法

Country Status (1)

Country Link
CN (1) CN100511230C (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101820489A (zh) * 2009-02-27 2010-09-01 佳能株式会社 图像处理设备及图像处理方法
CN101990667A (zh) * 2008-04-02 2011-03-23 谷歌公司 将自动人脸识别合并入数字图像集中的方法和装置
CN101382861B (zh) * 2007-09-07 2011-04-13 英业达股份有限公司 移动式讯息区块显示系统及其方法
US8027550B2 (en) 2007-03-30 2011-09-27 Sharp Kabushiki Kaisha Image-document retrieving apparatus, method of retrieving image document, program, and recording medium
CN101308508B (zh) * 2008-07-10 2011-11-02 北京搜狗科技发展有限公司 处理图片的方法、装置以及搜索图片的方法
US8160402B2 (en) 2007-07-23 2012-04-17 Sharp Kabushiki Kaisha Document image processing apparatus
US8208765B2 (en) 2007-07-23 2012-06-26 Sharp Kabushiki Kaisha Search and retrieval of documents indexed by optical character recognition
CN101706793B (zh) * 2009-11-16 2012-09-26 中兴通讯股份有限公司 搜索图片的方法和装置
CN102945277A (zh) * 2012-11-09 2013-02-27 华为技术有限公司 图像文件检索的方法和装置
WO2014036927A1 (zh) * 2012-09-07 2014-03-13 腾讯科技(深圳)有限公司 一种页面遮罩的实现方法及装置
US9075825B2 (en) 2011-09-26 2015-07-07 The University Of Kansas System and methods of integrating visual features with textual features for image searching
WO2018210113A1 (zh) * 2017-05-19 2018-11-22 腾讯科技(深圳)有限公司 动态信息展示的方法、计算机设备和存储介质

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8027550B2 (en) 2007-03-30 2011-09-27 Sharp Kabushiki Kaisha Image-document retrieving apparatus, method of retrieving image document, program, and recording medium
US8160402B2 (en) 2007-07-23 2012-04-17 Sharp Kabushiki Kaisha Document image processing apparatus
US8208765B2 (en) 2007-07-23 2012-06-26 Sharp Kabushiki Kaisha Search and retrieval of documents indexed by optical character recognition
CN101382861B (zh) * 2007-09-07 2011-04-13 英业达股份有限公司 移动式讯息区块显示系统及其方法
CN101990667A (zh) * 2008-04-02 2011-03-23 谷歌公司 将自动人脸识别合并入数字图像集中的方法和装置
CN101990667B (zh) * 2008-04-02 2013-08-28 谷歌公司 将自动人脸识别合并入数字图像集中的方法和装置
CN101308508B (zh) * 2008-07-10 2011-11-02 北京搜狗科技发展有限公司 处理图片的方法、装置以及搜索图片的方法
CN101820489A (zh) * 2009-02-27 2010-09-01 佳能株式会社 图像处理设备及图像处理方法
US8411960B2 (en) 2009-02-27 2013-04-02 Canon Kabushiki Kaisha Image processing for generating electronic document data in which an object can be searched from an input image
CN101820489B (zh) * 2009-02-27 2013-05-29 佳能株式会社 图像处理设备及图像处理方法
CN101706793B (zh) * 2009-11-16 2012-09-26 中兴通讯股份有限公司 搜索图片的方法和装置
US9075825B2 (en) 2011-09-26 2015-07-07 The University Of Kansas System and methods of integrating visual features with textual features for image searching
WO2014036927A1 (zh) * 2012-09-07 2014-03-13 腾讯科技(深圳)有限公司 一种页面遮罩的实现方法及装置
CN103679777A (zh) * 2012-09-07 2014-03-26 腾讯科技(深圳)有限公司 一种页面遮罩的实现方法及装置
CN102945277A (zh) * 2012-11-09 2013-02-27 华为技术有限公司 图像文件检索的方法和装置
WO2018210113A1 (zh) * 2017-05-19 2018-11-22 腾讯科技(深圳)有限公司 动态信息展示的方法、计算机设备和存储介质

Also Published As

Publication number Publication date
CN100511230C (zh) 2009-07-08

Similar Documents

Publication Publication Date Title
CN1851713A (zh) 基于多图像文本的图像检索及显示方法
US8201081B2 (en) Systems and methods for processing inoperative document links
KR101708448B1 (ko) 예측 쿼리 제안 캐싱
KR101175858B1 (ko) 검색 결과 페이지에 인터랙티브 요소를 포함하는 시스템 및 그 방법
US8064727B2 (en) Adaptive image maps
CN100476830C (zh) 一种网络资源检索方法及系统
CA2610208C (en) Learning facts from semi-structured text
KR102281186B1 (ko) 검색 결과에 대한 애니메이션 스니핏
CN102246172A (zh) 用于电子内容的分布式索引搜索的系统及方法
US20090299978A1 (en) Systems and methods for keyword and dynamic url search engine optimization
US7310633B1 (en) Methods and systems for generating textual information
CN102687138A (zh) 搜索建议聚类和呈现
US20110252065A1 (en) Apparatus and method for semantic-based search and semantic metadata providing server and method of operating the same
US20090204579A1 (en) Indexing explicitly-specified quick-link data for web pages
CN106294695A (zh) 一种面向实时大数据搜索引擎的实现方法
US20110055238A1 (en) Methods and systems for generating non-overlapping facets for a query
JP2007122732A (ja) ウェブドキュメントの集合において効率的に日付を検索する方法、コンピュータプログラム、およびサービス方法(ウェブドキュメントの集合において効率的に日付を検索するシステムおよび方法)
CN101655862A (zh) 信息对象搜索的方法和装置
CN104715064A (zh) 一种实现在网页上标注关键词的方法和服务器
CN103699674A (zh) 网页保存、网页打开方法及装置和网页浏览系统
US10810181B2 (en) Refining structured data indexes
US7174513B1 (en) System and method for advanced network viewing
CN102156749B (zh) 一种地图网站的自动搜索判别方法、系统及其分布式服务器系统
CN110955855B (zh) 一种信息拦截的方法、装置及终端
CN111090762A (zh) 图像获取方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: ALIBABA COMMUNICATIONS TECHNOLOGY (BEIJING) CO., L

Free format text: FORMER NAME: WANWANG ZHICHENG SCIENCE-TECHNOLOGY CO., LTD., BEIJING

CP01 Change in the name or title of a patent holder

Address after: 100088, No. 5, No. 501, building A, Tsinghua Science and Technology Park, No. 1, Zhongguancun East Road, Haidian District, Beijing

Patentee after: Alibaba communication technology (Beijing) Co.,Ltd.

Address before: 100088, No. 5, No. 501, building A, Tsinghua Science and Technology Park, No. 1, Zhongguancun East Road, Haidian District, Beijing

Patentee before: BEIJING WANWANG ZHICHENG SCI. & TECH. Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100088, No. 5, No. 501, building A, Tsinghua Science and Technology Park, No. 1, Zhongguancun East Road, Haidian District, Beijing

Patentee after: Alibaba cloud computing (Beijing) Co.,Ltd.

Address before: 100088, No. 5, No. 501, building A, Tsinghua Science and Technology Park, No. 1, Zhongguancun East Road, Haidian District, Beijing

Patentee before: Alibaba communication technology (Beijing) Co.,Ltd.