CN102855298B - 图像检索方法及系统 - Google Patents

图像检索方法及系统 Download PDF

Info

Publication number
CN102855298B
CN102855298B CN201210291216.9A CN201210291216A CN102855298B CN 102855298 B CN102855298 B CN 102855298B CN 201210291216 A CN201210291216 A CN 201210291216A CN 102855298 B CN102855298 B CN 102855298B
Authority
CN
China
Prior art keywords
image
related information
user
coupling
view data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210291216.9A
Other languages
English (en)
Other versions
CN102855298A (zh
Inventor
熊兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mobo (Beijing) Technology Co.,Ltd.
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201210291216.9A priority Critical patent/CN102855298B/zh
Publication of CN102855298A publication Critical patent/CN102855298A/zh
Application granted granted Critical
Publication of CN102855298B publication Critical patent/CN102855298B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及图像处理技术领域,提供了一种图像检索方法及系统。该方法包括步骤:根据图像提供者发送的注册请求接收图像及其对应的关联信息,分别保存图像数据和关联信息,并建立图像数据和关联信息之间的对应关系;将保存的图像返回给提供者供其发布;用户浏览图像并忠实获取浏览到的图像进行反馈;根据用户反馈的图像进行检索,获得接近的匹配图像,根据图像数据与关联信息之间的对应关系向用户返回匹配图像和/或匹配图像对应的关联信息。在本发明的技术方案中,通过将图像与关联信息同时注册、再利用用户反馈进行检索的方式,实现了结果图像和原始关联信息之间的确定性,使得检索得到的信息与用户期望和提供者本意相符。

Description

图像检索方法及系统
技术领域
本发明涉及图像处理技术领域,特别涉及一种图像检索方法及系统。
背景技术
图像检索是通过搜索图像特征信息为用户提供相关图形图像资料的检索服务,其通常是搜索引擎的一种细分。目前,在公知的基于图像的检索系统中,检索入口通常为用户输入图像;检索库一般为预定义的图像集合、或为来自互联网的图像;检索结果为与用户输入图像相近似的图像或近似图像所属的网页链接。
但现有技术的图像检索系统在实际应用中通常存在很多缺陷,比如为了保证检索充分,检索库中要预先记录尽可能多的图像数据和相关特征信息,这会导致其中的图像集合具有不确定性,图像数据量庞大且没有针对性,如果要在海量数据中正确检索近似的图像,对检索算法和计算量要求都很高。同时,现有技术在检索到近似图像后,返回结果的关联信息也具有不确定性(比如包含近似图像的网页并不一定包含用户所需的文本信息),无法保证检索得到的结果能为用户所用,也无法保证返回信息是图像供应者所欲提供的。
此外,目前大部分的图像检索(或搜索)系统均是针对通用计算机设备在本地或计算机网络进行的,很少有针对移动终端能在移动网络中有效使用的图像检索系统。虽然美国专利文献US2005185060A1中公开了一种基于带摄像头的移动设备的图像搜索系统,其服务器将来自移动终端的图像通过模式识别转化为诸如文字类的符号信息,然后再将此符号信息输入传统的互联网搜索引擎技术进行搜索,返回给用户一系列网页链接信息;但是该系统除了同样具备传统的图像搜索引擎所面临的关联信息(如网页链接等)不确定的问题外,还引入了模式识别算法难以实现的问题,无法保证检索的准确性,很难满足用户和图像提供者的真实检索意愿。
另一方面,在上述现有技术中,待拍摄或待输入检索系统的图像对象由于不具有标志,不具有良好的用户提示性。虽然公知的二维码识别系统具有很好的标志性和信息针对性,但是二维码无法提供人眼可辨识的视觉信息,不利于唤起用户的检索意愿;同时二维码提供的信息具有局限性和不可定制性,不便于信息供应者使用、制作或更改关联信息内容,无法有效应用于图像检索系统中。
发明内容
(一)要解决的技术问题
为了解决现有技术中图像检索时信息针对性差的问题,本发明提供了一种图像检索方法及系统,保证了结果图像与关联信息的确定性。
(二)技术方案
为解决上述技术问题,本发明采用如下的技术方案实施:
首先,本发明提供一种图像检索方法,所述方法包括步骤:
S1,图像提供者发送注册请求,根据该请求接收图像及其对应的关联信息,分别保存图像数据和所述关联信息,并建立所述图像数据和所述关联信息之间的对应关系;
S2,将保存的图像返回给提供者供其发布;
S3,用户浏览图像并忠实获取浏览到的图像进行反馈;
S4,根据用户反馈的图像进行检索,获得接近的匹配图像,根据图像数据与关联信息之间的对应关系向用户返回所述匹配图像和/或所述匹配图像对应的关联信息。
优选地,步骤S1中,在接收到图像后在图像对应的位置添加多个易于识别的辅助定位符号后再进行保存;
步骤S4中,识别所述反馈的图像中的辅助定位符号并变换后再进行检索。
优选地,步骤S1中,保存的图像数据包括图像本身和从图像中提取的特征信息/文字;
步骤S4中,检索时利用图像本身和从图像中提取的特征信息/文字进行联合检索。
优选地,步骤S3中,用户通过摄像设备拍摄或通过屏幕截取手段采集来忠实获取浏览到的图像。
优选地,所述关联信息包括文字、超链接、指令、图像、数字文件、声音、视频、位置和地图中的一种信息或多种信息的组合。
优选地,步骤S4中,所述匹配图像有多个时,依照匹配的近似度排序后再返回给用户。
另一方面,本发明还同时提供一种图像检索系统,所述系统包括:
注册模块,用于根据图像提供者发送注册请求来接收图像及其对应的关联信息,分别保存图像数据和所述关联信息,并建立所述图像数据和所述关联信息之间的对应关系;
图像发布模块,用于将保存的图像返回给提供者供其发布;
反馈模块,用于使用户浏览图像并忠实获取浏览到的图像进行反馈;
检索模块,用于根据用户反馈的图像进行检索,获得接近的匹配图像,根据图像数据与关联信息之间的对应关系向用户返回所述匹配图像和/或所述匹配图像对应的关联信息。
优选地,所述注册模块中还包括标记模块,用于在接收到图像后在图像对应的位置添加多个易于识别的辅助定位符号后再进行保存;
所述检索模块中还包括识别模块,用于识别所述反馈的图像中的辅助定位符号并变换后再进行检索。
优选地,所述注册模块中还包括提取模块,用于从图像中提取特征信息/文字后与图像本身一起保存为图像数据;
所述检索模块中还包括联合检索模块,用于从图像中提取特征信息/文字后与图像本身一起进行联合检索。
优选地,所述检索模块中还包括排序模块,用于在所述匹配图像有多个时,依照匹配的近似度排序后再返回给用户。
(三)有益效果
在本发明的技术方案中,通过将图像与关联信息同时注册、再利用用户反馈进行检索的方式,实现了结果图像和原始关联信息之间的确定性,使得检索得到的信息与用户期望和提供者本意相符。
附图说明
图1为本发明的一个实施例中图像检索方法的流程示意图;
图2为本发明的另一个优选实施例中图像检索方法的流程示意图。
具体实施方式
下面将结合各附图对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有技术中图像检索系统的主要缺陷是检索结果具有不确定性,返回结果的关联信息可能并非是用户期望的结果,甚至有可能并非是图像原始提供者的本意,这种不确定性给用户和图像提供者均造成了不小的困扰。而造成上述问题的原因有多种,除了互联网上信息量过大的因素外,还有可能是因为互联网上信息大多经过多次中转和加工,比如对图像的修改、评论或是对说明信息的篡改、歪曲或断章取义均有可能造成图像和关联信息的失真,又或者仅仅是链接的失效也会使得用户无法访问期望的信息。由于海量信息和开放性是互联网所固有的属性,因而上述问题很难被现有图像检索系统所克服。
为此,本发明提出了一种新的图像检索方案,通过将图像与关联信息同时注册、再利用用户反馈进行检索的方式,实现了结果图像和原始关联信息之间的确定性,使得检索得到的信息与用户期望和提供者本意相符。
在本发明的实施例中,图像检索方法的基本流程如图1所示,该方法包括以下步骤:
S1,图像提供者发送注册请求,根据该请求接收图像及其对应的关联信息,分别保存图像数据和所述关联信息,并建立所述图像数据和所述关联信息之间的对应关系;其中,所述关联信息包括文字、超链接、指令、图像、数字文件、声音、视频、位置和地图中的一种信息或多种信息的组合;
S2,将保存的图像返回给提供者供其发布;其中,图像发布的载体不限,如发布在网络、报刊平面杂志、电视、平时布告栏、广告牌等载体上均可;相对于传统的仅能在网络进行图像发布和检索的系统,本发明的方案明显提高了图像发布和检索的应用范围;
S3,用户浏览图像并忠实获取浏览到的图像进行反馈;
S4,根据用户反馈的图像进行检索,获得接近的匹配图像,根据图像数据与关联信息之间的对应关系向用户返回所述匹配图像和/或所述匹配图像对应的关联信息。其中,当发现有多个接近的匹配图像时,首先依照匹配的近似度排序后再将相关内容返回给用户。
图1中,以一幅香山的风景图片为例,注册的关联信息包括图片对应的地址(香山)、电话(12345)和网站超链接(www)等;经检索后,同时向用户返回这些与图片对应的关联信息。由于本发明的方法在图像检索过程中不要求识别图像的内容,而只需做图像相似性匹配,因而大大的降低了算法的复杂度,提高了计算速度和检索的准确度。
下面结合更优选的实施方式对本发明做进一步的说明。为提高匹配的精确度,在步骤S1中,保存的图像数据包括图像本身和从图像中提取的特征信息/文字。相应地,在步骤S4中,检索时可以利用图像本身和从图像中提取的特征信息/文字进行联合检索。检索可以采用现有的图像处理算法进行匹配,包括但不局限于灰度图的模板匹配、二值图的模板匹配、基于特征值的图像匹配和基于模式识别的方法等。此外,步骤S3中,为了保证用户的反馈能忠实反映浏览到的图像,用户可以通过摄像设备拍摄浏览到的图像或通过屏幕截取手段采集浏览到的图像。本发明的方法可应用于通用计算机设备或移动终端中。
更进一步地,考虑到信息供应者发布的图像通常不具有明显提示性的标识,这会使得图像不利于吸引用户的注意;同时,由于用户反馈的待检索图像可能具有方向、大小和视角等多种不确定性(比如拍摄角度不同造成的区别等),这些也会影响匹配的准确度。为进一步提高系统的性能,本发明进一步提出了基于图像辅助定位符号进行图像检索的方法,使发布的图像具有明显提示性的标识,从而可引起用户注意而进行有效的检索查询;另一方面,定位标记可同时降低检索算法的难度并提高匹配的准确度。该改进的方法流程示意图如图2所示,具体地,相对于图1改进的步骤包括:
步骤S1中,在接收到图像后首先对收到的图像进行处理再保存处理后的图像数据。具体地,所述处理为在图像对应的位置添加多个易于识别的辅助定位符号(比如正方形方块等),多个所述定位符号间的位置关系为系统预定义的几何关系P。
步骤S2中,返回给提供者并发布的图像为处理后的图像,即带有所述定位符号的图像。
步骤S4中,根据用户反馈的图像,首先识别所述反馈的图像中的辅助定位符号并计算其几何关系P′,再根据P和P′的投影关系,将用户反馈的图像进行投影变换,然后利用投影变换之后的图像进行检索匹配。
图2中仍然以一幅香山的风景图片为例,注册的关联信息同样包括图片对应的地址(香山)、电话(12345)和网站超链接(www)等;经检索后,也同样向用户返回这些与图片对应的关联信息。但是在检索过程中,利用添加在图片中的特定位置处黑色方块作为辅助定位符号来辅助标识图片,增强图片被识别的显著度,提高了检索的准确度。
采用本发明的方法,除了可以准确地获取图像的关联信息之外,还使图像提供者在图像发布完成之后可灵活修改提供给用户的信息。具体地,当提供者在已经发布了大量的图像之后,如需更改欲提供给用户的信息,不用更改其已发布的图像,而只需修改与图像对应的关联信息就能使用户实际得到的信息与提供者想发布的信息一致,这样大大提高了发布信息的灵活性和可重用性。
此外,本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,包括上述实施例方法的各步骤,而所述的存储介质可以是:ROM/RAM、磁碟、光盘、存储卡等。因此,与本发明的方法相对应的,本发明还同时包括一种图像检索系统,该系统包括:
注册模块,用于根据图像提供者发送注册请求来接收图像数据及其对应的关联信息,分别保存图像数据和所述关联信息,并建立所述图像数据和所述关联信息之间的对应关系;
图像发布模块,用于将保存的图像返回给提供者供其发布;
反馈模块,用于使用户浏览图像并忠实获取浏览到的图像进行反馈;
检索模块,用于根据用户反馈的图像进行检索,获得最接近的匹配图像,根据图像数据与关联信息之间的对应关系向用户返回所述匹配图像和/或所述匹配图像对应的关联信息。
更进一步地,该系统还包括与上述方法的优选实施例中各优选步骤相对应的功能模块。
综上所述,在本发明的技术方案中,通过将图像与关联信息同时注册、再利用用户反馈进行检索的方式,实现了结果图像和原始关联信息之间的确定性,使得检索得到的信息与用户期望和提供者本意相符。由于本发明的方法在图像检索过程中不要求识别图像的内容,而只需做图像相似性匹配,因而大大的降低了算法的复杂度,提高了计算速度和检索的准确度。本发明还是的图像提供者可灵活地修改提供给用户的信息。此外,本发明中还利用定位符号更进一步增强了对用户的提示性和吸引力;该定位符号还克服了用户反馈图像时可能出现的方向、大小和视角的不确定性,进一步提高了检索的准确度。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (8)

1.一种图像检索方法,其特征在于,所述方法包括步骤:
S1,图像提供者发送注册请求,根据该请求接收图像及其对应的关联信息,在接收到图像后在图像对应的位置添加若干个易于识别的辅助定位符号后,分别保存图像数据和所述关联信息,并建立所述图像数据和所述关联信息之间的对应关系;
S2,将保存的图像返回给提供者供其发布;
S3,用户浏览图像并忠实获取浏览到的图像进行反馈;
S4,根据用户反馈的图像,识别所述反馈的图像中的辅助定位符号并变换后再进行检索,获得接近的匹配图像,根据图像数据与关联信息之间的对应关系向用户返回所述匹配图像和/或所述匹配图像对应的关联信息;所述定位符号间的位置关系为系统预定义的几何关系P,步骤S4中,根据用户反馈的图像,首先识别所述反馈的图像中的辅助定位符号并计算其几何关系P′,再根据P和P′的投影关系,将用户反馈的图像进行投影变换,然后利用投影变换之后的图像进行检索匹配。
2.根据权利要求1所述的方法,其特征在于,步骤S1中,保存的图像数据包括图像本身和从图像中提取的特征信息/文字;
步骤S4中,检索时利用图像本身和从图像中提取的特征信息/文字进行联合检索。
3.根据权利要求1或2所述的方法,其特征在于,步骤S3中,用户通过摄像设备拍摄或通过屏幕截取手段采集来忠实获取浏览到的图像。
4.根据权利要求1或2所述的方法,其特征在于,所述关联信息包括文字、超链接、指令、图像、声音、视频、位置和地图中的一种信息或多种信息的组合。
5.根据权利要求1或2所述的方法,其特征在于,步骤S4中,所述匹配图像有多个时,依照匹配的近似度排序后再返回给用户。
6.一种图像检索系统,其特征在于,所述系统包括:
注册模块,根据图像提供者发送注册请求接收图像及其对应的关联信息,在接收到图像后在图像对应的位置添加若干个易于识别的辅助定位符号后,分别保存图像数据和所述关联信息,并建立所述图像数据和所述关联信息之间的对应关系;
图像发布模块,将保存的图像返回给提供者供其发布;
反馈模块,对用户浏览图像并忠实获取浏览到的图像进行反馈;
检索模块,根据用户反馈的图像,识别所述反馈的图像中的辅助定位符号并变换后再进行检索,获得接近的匹配图像,根据图像数据与关联信息之间的对应关系向用户返回所述匹配图像和/或所述匹配图像对应的关联信息;所述定位符号间的位置关系为系统预定义的几何关系P,步骤S4中,根据用户反馈的图像,首先识别所述反馈的图像中的辅助定位符号并计算其几何关系P′,再根据P和P′的投影关系,将用户反馈的图像进行投影变换,然后利用投影变换之后的图像进行检索匹配。
7.根据权利要求6所述的系统,其特征在于,所述注册模块中还包括提取模块,用于从图像中提取特征信息/文字后与图像本身一起保存为图像数据;
所述检索模块中还包括联合检索模块,用于从图像中提取特征信息/文字后与图像本身一起进行联合检索。
8.根据权利要求6所述的系统,其特征在于,所述检索模块中还包括排序模块,用于在所述匹配图像有多个时,依照匹配的近似度排序后再返回给用户。
CN201210291216.9A 2012-08-16 2012-08-16 图像检索方法及系统 Active CN102855298B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210291216.9A CN102855298B (zh) 2012-08-16 2012-08-16 图像检索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210291216.9A CN102855298B (zh) 2012-08-16 2012-08-16 图像检索方法及系统

Publications (2)

Publication Number Publication Date
CN102855298A CN102855298A (zh) 2013-01-02
CN102855298B true CN102855298B (zh) 2016-08-03

Family

ID=47401886

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210291216.9A Active CN102855298B (zh) 2012-08-16 2012-08-16 图像检索方法及系统

Country Status (1)

Country Link
CN (1) CN102855298B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951444B (zh) * 2014-03-25 2019-04-09 中国移动通信集团公司 一种搜索方法及装置
CN104881432A (zh) * 2015-04-23 2015-09-02 百度在线网络技术(北京)有限公司 一种用于获取提示信息的方法和装置
CN104965887A (zh) * 2015-06-16 2015-10-07 安一恒通(北京)科技有限公司 信息获取方法和装置
CN105898379A (zh) * 2015-12-14 2016-08-24 乐视网信息技术(北京)股份有限公司 建立视频图像超链接的方法以及服务器
CN106327207A (zh) * 2015-12-24 2017-01-11 邹波 用于产品上的图形图像识别、赋值内容呈现的方法
CN106254925A (zh) * 2016-08-01 2016-12-21 乐视控股(北京)有限公司 基于视频识别的目标对象提取方法、设备以及系统
CN108268486B (zh) * 2016-12-30 2022-04-19 中兴通讯股份有限公司 多媒体内容的关联、播放方法及装置、终端
CN109635137B (zh) * 2018-10-30 2022-05-17 耀灵人工智能(浙江)有限公司 一种图像关联信息检索方法与系统
CN109688387A (zh) * 2019-01-31 2019-04-26 深圳市多度科技有限公司 视频门禁监控方法及装置、电子设备、可读存储介质
WO2021208633A1 (zh) * 2020-04-16 2021-10-21 腾讯科技(深圳)有限公司 物品名称确定方法、装置、计算机设备及存储介质
CN111461905A (zh) * 2020-05-28 2020-07-28 深圳麦亚信科技股份有限公司 车险骗赔规避方法、装置、计算机设备及存储介质
CN112182263A (zh) * 2020-12-02 2021-01-05 西安热工研究院有限公司 发电设备工程图纸的图像处理方法、系统以及处理设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136042A (zh) * 2006-08-29 2008-03-05 株式会社东芝 图像显示装置、以及图像显示系统
CN101542531A (zh) * 2007-06-14 2009-09-23 松下电器产业株式会社 图像识别装置及图像识别方法
CN102262670A (zh) * 2011-07-29 2011-11-30 中山大学 一种基于移动可视设备的跨媒体信息检索系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136042A (zh) * 2006-08-29 2008-03-05 株式会社东芝 图像显示装置、以及图像显示系统
CN101542531A (zh) * 2007-06-14 2009-09-23 松下电器产业株式会社 图像识别装置及图像识别方法
CN102262670A (zh) * 2011-07-29 2011-11-30 中山大学 一种基于移动可视设备的跨媒体信息检索系统及方法

Also Published As

Publication number Publication date
CN102855298A (zh) 2013-01-02

Similar Documents

Publication Publication Date Title
CN102855298B (zh) 图像检索方法及系统
US10929671B2 (en) Systems and methods for image-feature-based recognition
Chandrasekhar et al. The stanford mobile visual search data set
US7920759B2 (en) Triggering applications for distributed action execution and use of mixed media recognition as a control input
US7812986B2 (en) System and methods for use of voice mail and email in a mixed media environment
US7991778B2 (en) Triggering actions with captured input in a mixed media environment
US7672543B2 (en) Triggering applications based on a captured text in a mixed media environment
US8892990B2 (en) Automatic creation of a table and query tools
Erol et al. HOTPAPER: multimedia interaction with paper using mobile phones
US8244037B2 (en) Image-based data management method and system
US20090313245A1 (en) Mixed Media Reality Brokerage Network With Layout-Independent Recognition
US20090112830A1 (en) System and methods for searching images in presentations
CN102769775A (zh) 覆盖图像提供系统、服务器和方法
CN105631051A (zh) 基于文字识别的移动增强现实阅读方法及其阅读系统
CN111310750B (zh) 一种信息处理方法、装置、计算设备及介质
CN105183950A (zh) 一种基于移动终端查阅工程图纸的方法及系统
WO2007023991A1 (en) Embedding hot spots in electronic documents
Liu et al. Mobile retriever-finding document with a snapshot
Takeda et al. Memory reduction for real-time document image retrieval with a 20 million pages database
Reznik On mpeg work towards a standard for visual search
CN103198162B (zh) 一种图像浏览交互方法
US11080319B2 (en) System and method for providing image search result online using device information
Liu et al. Book page identification using convolutional neural networks trained by task-unrelated dataset
WO2010089736A2 (en) A method and means for identifying items in a printed document associated with media objects
CN115759032A (zh) 文档比对结果的优化方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230427

Address after: Room 418, Building 23, Weigongcun Community, Haidian District, Beijing, 100000

Patentee after: Mobo (Beijing) Technology Co.,Ltd.

Address before: No. 20601 Talent Service Center, No.29 Suzhou Street, Haidian District, Beijing, 100000

Patentee before: Xiong Bing

TR01 Transfer of patent right
DD01 Delivery of document by public notice

Addressee: Xiong Bing

Document name: Notification of Qualified Procedures

DD01 Delivery of document by public notice