CN1952935A - 综合利用图像及文字信息的搜索系统及搜索方法 - Google Patents

综合利用图像及文字信息的搜索系统及搜索方法 Download PDF

Info

Publication number
CN1952935A
CN1952935A CN 200610096392 CN200610096392A CN1952935A CN 1952935 A CN1952935 A CN 1952935A CN 200610096392 CN200610096392 CN 200610096392 CN 200610096392 A CN200610096392 A CN 200610096392A CN 1952935 A CN1952935 A CN 1952935A
Authority
CN
China
Prior art keywords
image
search
keyword
literal
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610096392
Other languages
English (en)
Other versions
CN100414548C (zh
Inventor
振华于
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Bokang Intelligent Information Technology Co., Ltd.
Original Assignee
NANJING SEEKPAI INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NANJING SEEKPAI INFORMATION TECHNOLOGY Co Ltd filed Critical NANJING SEEKPAI INFORMATION TECHNOLOGY Co Ltd
Priority to CNB2006100963921A priority Critical patent/CN100414548C/zh
Publication of CN1952935A publication Critical patent/CN1952935A/zh
Application granted granted Critical
Publication of CN100414548C publication Critical patent/CN100414548C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及一种搜索系统及搜索方法,是一种综合利用图像及文字信息的搜索系统及搜索方法。包括:终端、服务器、文字输入模块、图像分析引擎、文字指令解析模块、搜索引擎、无线通信链路。将终端拍摄的图片及文字输入模块输入的文字通过无线通信链路送到服务器,对用户输入的文字指令进行解析,用限定性关键词在一个基于文字的图像搜索引擎中搜索图像,分析输入图像内容获得特征向量,结合特征向量以及描述性关键词及其权重在一个基于图像内容的搜索引擎中进行搜索,产生输出给用户的搜索结果。本发明可使搜索结果与用户输入信息匹配得更好,不会导致信息浪费,从而使搜索结果更准确。

Description

综合利用图像及文字信息的搜索系统及搜索方法
技术领域
本发明涉及一种搜索系统及搜索方法,具体的说,是一种综合利用图像及文字信息的搜索系统及搜索方法。
背景技术
通过一个移动终端,例如移动电话,掌上电脑,对远端的服务器的内容进行搜索,是一种新型的搜索方式。根据输入查询方式的不同,现有的移动图像的搜索有三种方式。最常见的移动搜索是采用文字搜索的方式。在这种方式中,数据库中的图像采用人工或自动的方法用文字进行标注,而搜索通过文字的匹配进行。但是很多时候,只用文字难以描述搜索的对象。在移动电话的应用中,输入大量文字也不方便。
另一种移动搜索的方式是采用图像搜索的界面。采用自动图像识别的方法,可以方便用户输入检索的目标。MOBOT公司及NEVEN VISION公司都推出过这方面的服务。但是他们都还是针对一些特殊的应用,例如广告推广,这种情况下的图片数据库是比较小的,待识别的对象也是有限的。另一方面来说,在很长的一段时间内,对于很广泛的图像,例如互联网图片库,完全自动图像识别的方法的准确率尚有不足之处。另外,如果待搜索的数据库很大,那么搜索需花费的时间也可能很长。
最近的研究提出了第三种方式,即文字与图像相结合的搜索方式。Tom Yeh等人提出跟据用户上传的图片,首先在一个精简的图片集中进行基于图像内容的图像搜索,然后根据搜索到的图片,导出关键词,再根据这些关键词在一个文字搜索引擎(例如GOOGLE)中进行基于文字的图像搜索,然后从文字搜索得到的图片中,再进行基于图像内容的图像搜索,最终得到结果。Xin Fan等人提出了另一种文字与图像相结合的搜索方式。在他们的方案中,首先利用用户上传的文字在一个文字搜索引擎(例如GOOGLE)中进行基于文字的图像搜索,然后在文字搜索的结果中,进行基于图像内容的图像搜索,从而得到搜索结果。
在以上的两个文字与图像相结合的搜索方式,一个共同的缺点是虽然他们利用了文字及图像信息,但是他们在具体每一步搜索的过程中,图像与文字的信息是分开单独使用的。例如,在进行基于图像内容的图像搜索的时候,前述方法完全没有利用文字信息。这并不是最有效的方式。举一个简单的例子,用户上传一张汽车的照片,并附两个搜索关键词:“汽车”,“红色”,如果采用Xin Fan等人的方法,用“汽车”,“红色”作为关键词在文字搜索引擎搜索,就会导致两个问题。第一个问题是因为文字搜索引擎依靠的是相关页面的文字描述,如果页面只有“汽车”而没有“红色”这两个文字,汽车的图像就会漏掉,虽然它们也是红色的。第二个问题是虽然用户指定了搜索的特征“红色”,但是这信息没有用到基于图像内容的图像搜索过程中,所以该信息被浪费了。
发明内容
本发明的目的在于提出一种可使搜索结果与用户输入信息匹配得更好,不会导致信息浪费的综合利用图像及文字信息的搜索系统及搜索方法。
本发明的目的可以通过以下技术方案来实现:
综合利用图像及文字信息的搜索系统,包括:
终端,终端内设置有图像采集模块,用以采集或获得图像;
服务器,获得搜索的结果;
文字输入模块,提供文字搜索指令;
图像分析引擎,分析用户输入的图像内容;
文字指令解析模块,解析用户输入的文字;
搜索引擎,同时利用图像内容及文字指令进行搜索;
无线通信链路,在终端和服务器之间传送搜索指令及图象的内容,并传送从服务器获得搜索的结果。
本发明的综合利用图像及文字信息的搜索方法,包括以下步骤:
(1)将终端拍摄的图片及文字输入模块输入的文字通过无线通信链路送到服务器;
(2)对用户输入的文字指令进行解析,解析的结果包括至少两部分关键词,一部分为限定性的关键词,用以限定搜索对象的范围,而另一部分为描述性的关键词,用以描述搜索对象的外部特征;
(3)用限定性关键词在一个基于文字的图像搜索引擎中搜索图像;
(4)在步骤(3)搜索得到的图像集中,结合用户上传的图像内容以及描述性关键词及其权重在一个基于图像内容的搜索引擎中进行搜索;
(5)根据步骤(4)的搜索结果,产生输出给用的搜索结果。
本发明的综合利用图像及文字信息的搜索方法,还可以按以下步骤进行:
(1)对终端拍摄的图片提取特征向量,对用户输入的文字指令进行解析及提取特征向量,解析的结果包括至少两部分关键词,一部分为限定性的关键词,用以限定搜索对象的范围,而另一部分为描述性的关键词,用以描述搜索对象的外部特征;
(2)将对步骤(1)提取的图片和文字特征向量以及对用户输入的文字指令进行解析所得的限定性关键词、描述性关键词及其权重通过无线通信链路发送到服务器;
(3)用限定性关键词在一个基于文字的图像搜索引擎中搜索图像;
(4)在步骤(3)搜索得到的图像集中,结合传送到服务器的特征向量以及描述性关键词及其权重在一个基于图像内容的搜索引擎中进行搜索;
(5)根据步骤(4)的搜索结果,产生输出给用的搜索结果。
本发明的目的还以可以通过以下技术措施来进一步实现:
前述的综合利用图像及文字信息的搜索系统,其中所述终端为移动终端(例如移动电话,掌上电脑)或互联网终端(例如个人计算机),终端内设置有摄像头或图片存储空间。
前述的综合利用图像及文字信息的搜索系统,其中所述文字输入模块的文字输入方式为键盘输入方式,或者通过麦克风录入用户话音的语音识别方式。
前述的综合利用图像及文字信息的搜索系统,其中述图像分析引擎驻留于服务器中,或驻留于终端中,或部分驻留于终端中,部分驻留于服务器中。
前述的综合利用图像及文字信息的搜索系统,其中所述无线通信链路包括彩信(MMS)、电子邮件(EMAIL)以及无线应用通讯协议(WAP)。
前述的综合利用图像及文字信息的搜索方法,还可以包括重复图像判别步骤,所述重复图像判别步骤对输入的图像与已经处理过的其它图像进行重复图像对比,如果确认是重复图像,则根据以前识别的结果获得本次识别的结果,如果不是重复图像,则用限定性关键词在一个基于文字的图像搜索引擎中搜索图像。
前述的综合利用图像及文字信息的搜索方法,其中对用户输入的文字指令进行解析的方法为以下两种方法之一:①把名词作为限定性关键词,把形容词作为描述性关键词;②对所有词汇事先做一个查找表,把输入词汇映射到相应的限定性关键词和描述性关键词。
前述的综合利用图像及文字信息的搜索方法,其中基于文字的图像搜索引擎的实现方法为以下两种方法之一:①利用现有的公共图像搜索引擎,把限定性关键词输入给这些公共图像搜索引擎,得到满足搜索条件的图像;②通过构筑自有的检索系统,在这个检索系统中,把图像的关键词以及相关图像的地址放到数据库中,根据关键词查找图像。
前述的综合利用图像及文字信息的搜索方法,其中基于图像内容的搜索包括:
①对用户上传的图像内容提取特征向量,即提取输入查询图像中的颜色,纹理,及形状特征向量;
②对基于文字的图像检索引擎得到一组候选图像在特征向量数据库中查找,得到这些候选图像的特征向量;
③结合①和②中得到的特征向量以及描述性关键词及权重,进行排序并选择最优的若干结果。
本发明的优点为:本发明有机地综合利用了文字及图像内容信息进行搜索。通过分析输入文字提取限定性关键词进行基于文字的图像搜索的方法,可以有效缩小待搜索图像的范围,提高搜索的准确性。通过分析输入文字提取描述性关键词的方式,把描述性的关键词和输入图像同时运用于基于图像内容的图像搜索引擎,根据描述性的关键词来调整基于图像内容的图像搜索引擎内部的参数,从而使结果与用户的输入匹配得更好,不会使用户输入的信息浪费,搜索效果更全面、更准确。
附图说明
图1为本发明的系统框图。
图2为本发明实施例一的流程图。
图3为本发明实施例二的流程图。
图4为本发明基于图像内容的检索的流程图。
具体实施方式
本发明提出了一个综合利用图像及文字信息的搜索系统,其系统框图如图1所示,包括一个终端和一个服务器,终端有内置的摄像头或图片存储空间以采集或获得图像,一个文字输入界面以提供搜索的指令,一个图像分析引擎以分析图像的内容,一个文字指令解析模块,一个搜索引擎同时利用图像内容及文字指令进行搜索,一个通信链路在终端和服务器之间传送搜索指令及图像的内容,另一个通信链路从服务器获得搜索的结果。本发明的终端包括移动终端(例如移动电话,掌上电脑)以及普通互联网终端(例如个人计算机)等。用于查询的图片可以通过终端内置的摄像头采集,终端也可内置图片存储空间,用于查询的图片从该空间中选取。文字输入界面可以采用键盘的输入方式,或者可以通过麦克风录入用户的话音,然后通过语音识别的方式获得用户输入的指令。图像分析引擎可以包括以下功能:检测识别图像中的人脸,文字,提取图像整体的或各个区域的颜色,纹理,形状特征,检测图像中的局部特征点并提取特征点的特征信息(例如使用SIFT-Scale Invariant Feature Transform尺度不变特征变换算法),或者对图像进行频域变换(例如小波变换,傅立叶变换)等。图像分析引擎可以驻留于服务器中,或驻留于终端中,或部分驻留于终端中,部分驻留于服务器中。无线通信链路包括彩信(MMS),电子邮件(EMAIL)以及无线应用通讯协议(WAP)。
实施例一
本发明实施例一发流程图如图2所示,综合利用图像及文字信息的搜索方法,按以下步骤进行:
1.将终端拍摄的图片及文字输入模块输入的文字通过无线通信链路送到服务器。
2.输入的图像与已经处理过的其它图像进行重复图像对比,如果确认是重复图像,则可以根据以前识别的结果获得本次识别的结果;如果不是,则进行下面的步骤。
3.对用户输入的文字指令进行解析,解析的结果包括至少两部分关键词,一部分为限定性的关键词,用以限定搜索对象的范围,而另一部分为描述性的关键词,用以描述搜索对象的外部特征。解析可以有多种实现方法,最简单的一个例子是把名词作为限定性关键词,把形容词作为描述性关键词。另外一个方法是对所有词汇事先做一个查找表,把输入词汇映射到相应的限定性关键词和描述性关键词。例如用户如果输入“花纹”这个查找词汇,那么可以把限定性关键词设为“花纹”以及“图案”(其中也包括把输入关键词扩展到内容相关的限定性关键词),而把描述性关键词设为“纹理”。每个描述性关键词也可以附带一个权重系数用于基于内容的图像搜索。
3.用限定性关键词在一个基于文字的图像搜索引擎中搜索图像。
4.在文字搜索得到的图像集中,结合用户上传的图像内容以及描述性关键词及其权重进行搜索。由于本系统是个广泛的图像搜索系统,包括多种图像特征,因此如果得到描述性关键词及其权重,那么可以据此选择合适的图像特征作为搜索识别的依据。比如说,如果用户搜索的是人脸,那么可以100%的基于人脸特征。如果用户搜索的是可口可乐的商标,那么可以加权混合形状以及颜色(红色)的特征。
5.根据步骤4的搜索结果,产生输出给用的搜索结果。这包括直接输出图像给用户,或者把与输出图像相关的链接发给用户等。
重复图像识别是一个可选模块,用以判断上传的图片是否已经上传过了。如果上传的照片非重复照片,则需要解析输入的查询文字。
本实施例用三种图像特征:颜色,纹理以及形状。在解析查询文字的时候,对于每个搜索词,利用以下形式的查找表:
  搜索词   限定性关键词   描述性关键词及权重
  颜色权重   颜色特征   形状权重   形状特征   纹理权重   纹理特征
  汽车   汽车   0.5   1   0.5
  手机   手机,移动电话   1   1   0.5
  ...   .......   ..   ..   ..   ..   ..   ..
上表中限定性关键词根据同义或包容性语义的物体名扩展。各个描述性关键词的权重根据各个特征对识别该物体的重要性确定,例如对于查询词“汽车”来说,形状是很重要的,但是汽车有各种各样的颜色,所以颜色通常是不重要的,除非用户特别指定颜色。当用户的输入指定了特征的属性时,则填入″某某特征″栏。例如,如果用户输入“红色”查询词,则得到如下的限定性关键词和描述性关键词:
  搜索词   限定性关键词   描述性关键词及权重
  色权重   色特征   状权重   状特征   理权重   理特征
  红色   1   红色
如果用户输入多组查询词,则将他们各自得到的限定性关键词和描述性关键词结合在一起。缺省的组合方式为“与”,而如果用户输入了组合的方式,如“或”,则根据用户的指令进行组合。
例如,如果用户输入“汽车红色”查询词,则得到如下的限定性关键词和描述性关键词:
  搜索词   限定性关键词   描述性关键词及权重
  颜色权重   颜色特征   形状权重   形状特征   纹理权重   纹理特征
  汽车红色   汽车   1   红色   1   0.5
基于文字的图像检索引擎的一种实现方式是利用现有的公共图象搜索引擎如谷歌(GOOGLE),雅虎(YAHOO),百度等。把限定性关键词输入给这些公共图象搜索引擎,则可以得到满足搜索条件的图像。另外,我们也可以通过构筑自有的检索系统来实现。在这个系统中,把图像的关键词以及相关图像的地址放到数据库中,从而根据关键词可以查到图像。也可以对数据库建立索引以实现快速查找。
基于图像内容的检索的流程图如图4所示,可按如下步骤进行:①对用户上传的图像内容提取特征向量,即提取输入查询图像中的颜色,纹理,及形状特征向量;②对基于文字的图像检索引擎得到一组候选图像在特征向量数据库中查找,得到这些候选图像的特征向量;③结合①和②中得到的特征向量以及描述性关键词及权重,进行排序并选择最优的若干结果。提取特征向量模块负责提取输入查询图像中的颜色,纹理,及形状特征向量。颜色特征向量采用直方图的方式。对于输入的彩色图像(通常包括红,绿,蓝三种颜色),首先转化为HSV(色相、饱和度和亮度)色度空间,然后建立166个分组的直方图。纹理特征可以采用MPEG-7标准中的边缘直方图描述符(EdgeHistogram Descriptor)实现。纹理特征可以采用MPEG-7标准中的曲率刻度空间(Curvature scale space)实现。
存储在数据库中的图像也采用上述的方法提取特征向量。提取特征向量可以事先进行,例如在存储新图像于数据库的时候进行。基于文字的图像检索引擎得到一组候选图像。通过在特征向量数据库查询的方式,可以得到这些候选图像的特征向量。
特征向量比对模块对输入查询图像的特征向量和数据库中的特征向量进行比对。比对即对图像一一计算相互的距离,而这距离受描述性关键词权重的影响。用数学公式表示,假定Ci,Ti,Si分别表示图像i的颜色,纹理,及形状特征向量。输入图像i,待查询图像集为A,则需要计算Dij=DCij×Wc+DTij×Wt+DSij×Ws,j∈A,其中Wc,Wt,Ws分别表示颜色,纹理及形状(描述性关键词)特征向量的加权权重(由解析输入的查询文字模块产生),DCij,DTij,DSij表示图像i与图像j的颜色,纹理及形状特征向量的距离,Dij为图像i与图像j总体上的距离。颜色的距离可以用计算所有分组的相应的欧几里德距离的总和的方式实现,纹理及形状特征向量的距离采用相应的MPEG-7标准中的计算方法。
在用户输入指定颜色特性(例如,“红色”)的情况下,DCij(即颜色特征向量之间的距离)的计算方法需要做相应的调整。具体实现例如下:(1)事先构筑一个表示颜色的文字与直方图中的分组的对应关系表;(2)根据该表找到与输入的指定颜色相对应的直方图中的分组;(3)在计算直方图之间的距离的时候,增加步骤(2)找到的直方图分组的权重。增加的一种简单实现方法是增加权重为原来的N倍。N可以事先确定,例如设为2。另一种实现方法是对加权权重用一个高斯函数核进行调制,调制的中心分组对应输入的指定颜色。
排序模块对上一模块得到的所有的距离按其大小进行排序,然后可以选择最小的N个距离值。与这些值相对应的图像即为搜索的结果图像。
根据这些结果图像,“结果产生”模块可以根据数据库中的记录得到与这样图像对应的原始页面,并把这些页面的地址作为结果发给用户。另外一种方式是直接把搜索得到的“图像”作为结果发给用户。
一个应用的例子为:用户可以拍一张地毯的照片,同时输入文字“地毯”在彩信(MMS)的关键词,通过彩信发送该照片至服务器。服务器自动提取收到图片中的特征向量,并且在数据库中地毯类图片的特征向量中,与该特征向量进行匹配。最相近的一个或多个结果可以通过MMS返回给用户。结果中也可包括相关的链接或商品的供应信息等。
实施例二
本发明实施例一发流程图如图3所示,综合利用图像及文字信息的搜索方法,按以下步骤进行:
1.对终端拍摄的图片提取特征向量,对用户输入的文字指令进行解析及提取特征向量,解 析的结果包括至少两部分关键词,一部分为限定性的关键词,用以限定搜索对象的范围,而另一部分为描述性的关键词,用以描述搜索对象的外部特征;
2.将对步骤1提取的图片和文字特征向量以及对用户输入的文字指令进行解析所得的限定性关键词、描述性关键词及其权重通过无线通信链路发送到服务器;
3.用限定性关键词在一个基于文字的图像搜索引擎中搜索图像;
4.在步骤3搜索得到的图像集中,结合传送到服务器的特征向量以及描述性关键词及其权重在一个基于图像内容的搜索引擎中进行搜索;
5.根据步骤4的搜索结果,产生输出给用的搜索结果。
本实施例中,解析输入查询文字的单元位于移动终端中,解析得到的限定性关键词和描述性关键词及权重通过无线通道发送到服务器。同时,图像中的特征向量也在移动终端中提取,并且根据描述性关键词及权重,决定提取不同的图像特征向量。提取的图像特征向量通过无线通道发送到服务器。
本实施例的解析输入查询文字、基于文字的图像检索、基于图像内容的检索的方法与实施例一相同。
根据以上步骤的结果图像,“结果产生”模块可以根据数据库中的记录得到与这样图像对应的原始页面,并把这些页面的地址作为结果发给用户。另外一种方式是直接把搜索得到的“图像”作为结果发给用户。
本发明还可以有其它实施方法,凡采用同等替换或等效变换形成的技术方案,均落在本发明要求保护的范围之内。

Claims (10)

1.综合利用图像及文字信息的搜索系统,其特征在于:包括:
终端,终端内设置有图像采集模块,用以采集或获得图像;
服务器,获得搜索的结果;
文字输入模块,提供文字搜索指令;
图像分析引擎,分析用户输入的图像内容;
文字指令解析模块,解析用户输入的文字;
搜索引擎,同时利用图像内容及文字指令进行搜索;
无线通信链路,在终端和服务器之间传送搜索指令及图像的内容,并传送从服务器获得搜索的结果。
2.如权利要求1所述的综合利用图像及文字信息的搜索系统,其特征在于:所述终端为移动终端或互联网终端,终端内设置有摄像头或图片存储空间。
3.如权利要求1所述的综合利用图像及文字信息的搜索系统,其特征在于:所述图像分析引擎驻留于服务器中,或驻留于终端中,或部分驻留于终端中,部分驻留于服务器中。
4.如权利要求1所述的综合利用图像及文字信息的搜索系统,其特征在于:所述无线通信链路包括彩信、电子邮件以及无线应用通讯协议。
5.综合利用图像及文字信息的搜索方法,其特征在于:包括以下步骤:
(1)将终端拍摄的图片及文字输入模块输入的文字通过无线通信链路送到服务器;
(2)对用户输入的文字指令进行解析,解析的结果包括至少两部分关键词,一部分为限定性的关键词,用以限定搜索对象的范围,而另一部分为描述性的关键词,用以描述搜索对象的外部特征;
(3)用限定性关键词在一个基于文字的图像搜索引擎中搜索图像;
(4)在步骤(3)搜索得到的图像集中,结合用户上传的图像内容以及描述性关键词及其权重在一个基于图像内容的搜索引擎中进行搜索;
(5)根据步骤(4)的搜索结果,产生输出给用户的搜索结果。
6.如权利要求5所述的综合利用图像及文字信息的搜索方法,其特征在于:还可以按照以下步骤进行:
(1)对终端拍摄的图片提取特征向量,对用户输入的文字指令进行解析及提取特征向量,解析的结果包括至少两部分关键词,一部分为限定性的关键词,用以限定搜索对象的范围,而另一部分为描述性的关键词,用以描述搜索对象的外部特征;
(2)将对步骤(1)提取的图片和文字特征向量以及对用户输入的文字指令进行解析所得的限定性关键词、描述性关键词及其权重通过无线通信链路发送到服务器;
(3)用限定性关键词在一个基于文字的图像搜索引擎中搜索图像;
(4)在步骤(3)搜索得到的图像集中,结合传送到服务器的特征向量以及描述性关键词及其权重在一个基于图像内容的搜索引擎中进行搜索;
(5)根据步骤(4)的搜索结果,产生输出给用的搜索结果。
7.如权利要求5或6所述的综合利用图像及文字信息的搜索方法,其特征在于:还可以包括重复图像判别步骤,所述重复图像判别步骤对输入的图像与已经处理过的其它图像进行重复图像对比,如果确认是重复图像,则根据以前识别的结果获得本次识别的结果,如果不是重复图像,则用限定性关键词在一个基于文字的图像搜索引擎中搜索图像。
8.如权利要求5或6所述的综合利用图像及文字信息的搜索方法,其特征在于:所述对用户输入的文字指令进行解析的方法为以下两种方法之一:①把名词作为限定性关键词,把形容词作为描述性关键词;②对所有词汇事先做一个查找表,把输入词汇映射到相应的限定性关键词和描述性关键词。
9.如权利要求5或6所述的综合利用图像及文字信息的搜索方法,其特征在于:所述基于文字的图像搜索引擎的实现方法为以下两种方法之一:①利用现有的公共图象搜索引擎,把限定性关键词输入给这些公共图象搜索引擎,得到满足搜索条件的图像;②通过构筑自有的检索系统,在这个检索系统中,把图像的关键词以及相关图像的地址放到数据库中,根据关键词查找图像。
10.如权利要求5或6所述的综合利用图像及文字信息的搜索方法,其特征在于:所述基于图像内容的搜索包括:
①对用户上传的图像内容提取特征向量,即提取输入查询图像中的颜色,纹理,及形状特征向量;
②对基于文字的图像检索引擎得到一组候选图像在特征向量数据库中查找,得到这些候选图像的特征向量;
③结合①和②中得到的特征向量以及描述性关键词及权重,进行排序并选择最优的若干结果。
CNB2006100963921A 2006-09-22 2006-09-22 综合利用图像及文字信息的搜索系统及搜索方法 Active CN100414548C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100963921A CN100414548C (zh) 2006-09-22 2006-09-22 综合利用图像及文字信息的搜索系统及搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100963921A CN100414548C (zh) 2006-09-22 2006-09-22 综合利用图像及文字信息的搜索系统及搜索方法

Publications (2)

Publication Number Publication Date
CN1952935A true CN1952935A (zh) 2007-04-25
CN100414548C CN100414548C (zh) 2008-08-27

Family

ID=38059278

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100963921A Active CN100414548C (zh) 2006-09-22 2006-09-22 综合利用图像及文字信息的搜索系统及搜索方法

Country Status (1)

Country Link
CN (1) CN100414548C (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388022B (zh) * 2008-08-12 2010-06-09 北京交通大学 一种融合文本语义和视觉内容的Web人像检索方法
CN101520783B (zh) * 2008-02-29 2011-12-21 富士通株式会社 基于图像内容的关键词搜索方法和装置
CN102385578A (zh) * 2010-08-27 2012-03-21 腾讯科技(深圳)有限公司 图片搜索的方法和装置
CN101493813B (zh) * 2008-01-25 2012-05-30 北京新岸线网络技术有限公司 一种基于内容的视频检索系统
CN103020184A (zh) * 2012-11-29 2013-04-03 北京百度网讯科技有限公司 使用拍摄图像获取搜索结果的方法和系统
CN103064936A (zh) * 2012-12-24 2013-04-24 北京百度网讯科技有限公司 一种基于语音输入的图像信息提取分析方法及装置
CN103412937A (zh) * 2013-08-22 2013-11-27 成都数之联科技有限公司 一种基于手持终端的搜索购物方法
CN103440261A (zh) * 2013-07-31 2013-12-11 东莞中山大学研究院 基于内容和结构的生物医疗流程图检索的系统及方法
CN103678458A (zh) * 2012-09-13 2014-03-26 国际商业机器公司 用于图像分析的方法和系统
CN103716685A (zh) * 2014-01-09 2014-04-09 福建网龙计算机网络信息技术有限公司 图标识别系统、服务器和方法
CN104199950A (zh) * 2014-09-12 2014-12-10 中科嘉速(北京)并行软件有限公司 一种基于图像相似度快速匹配的学术论文搜索方法
CN104239445A (zh) * 2014-09-01 2014-12-24 百度在线网络技术(北京)有限公司 搜索结果的展现方法和装置
CN104239568A (zh) * 2014-09-29 2014-12-24 上海斐讯数据通信技术有限公司 一种基于图片说明的快速照片搜索系统和方法
CN104424257A (zh) * 2013-08-28 2015-03-18 北大方正集团有限公司 信息检索装置和信息检索方法
CN104504109A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 图片搜索方法和装置
CN104754261A (zh) * 2013-12-26 2015-07-01 深圳市快播科技有限公司 一种投影设备及投影方法
CN104765796A (zh) * 2015-03-25 2015-07-08 无锡天脉聚源传媒科技有限公司 一种图像识别搜索方法及装置
CN104854539A (zh) * 2014-05-15 2015-08-19 华为技术有限公司 一种对象搜索方法及装置
CN104951444A (zh) * 2014-03-25 2015-09-30 中国移动通信集团公司 一种搜索方法及装置
CN105183812A (zh) * 2015-08-27 2015-12-23 江苏惠居乐信息科技有限公司 多功能信息咨询系统
CN105637505A (zh) * 2013-05-31 2016-06-01 西洛皮斯公司 用于搜索数据库的方法
CN105740432A (zh) * 2016-01-29 2016-07-06 上海摩软通讯技术有限公司 图片生成方法及模块、图片搜索方法及系统
CN106776990A (zh) * 2016-12-06 2017-05-31 北京搜狗科技发展有限公司 一种信息处理方法、装置及电子设备
CN106777316A (zh) * 2017-01-03 2017-05-31 深圳皮皮哥网络科技有限公司 一种基于网络的皮革纹路图像搜索方法及系统
CN107451194A (zh) * 2017-06-30 2017-12-08 百度在线网络技术(北京)有限公司 一种图片搜索方法及装置
WO2019056821A1 (zh) * 2017-09-19 2019-03-28 百度在线网络技术(北京)有限公司 用于信息交互的方法及装置
CN110908525A (zh) * 2019-09-29 2020-03-24 上海萌家网络科技有限公司 一种输入法及其客户端和提供候选图片/视频的方法
CN111209425A (zh) * 2020-01-06 2020-05-29 闻泰通讯股份有限公司 图像搜索方法、装置、电子设备及计算机可读存储介质
WO2020155921A1 (zh) * 2019-01-30 2020-08-06 京东方科技集团股份有限公司 以图搜图的方法、计算机可读存储介质及服务器
CN111524518A (zh) * 2020-04-01 2020-08-11 Oppo广东移动通信有限公司 增强现实处理方法及装置、存储介质和电子设备
CN112148831A (zh) * 2020-11-26 2020-12-29 广州华多网络科技有限公司 图文混合检索方法、装置、存储介质、计算机设备
CN113591882A (zh) * 2021-08-11 2021-11-02 卓尔智联(武汉)研究院有限公司 汽车配件识别方法、计算机装置及可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5995978A (en) * 1997-09-24 1999-11-30 Ricoh Company, Ltd. Navigation system for document image database
JP2004361987A (ja) * 2003-05-30 2004-12-24 Seiko Epson Corp 画像検索システム、画像分類システム、画像検索プログラム及び画像分類プログラム、並びに画像検索方法及び画像分類方法
US7912827B2 (en) * 2004-12-02 2011-03-22 At&T Intellectual Property Ii, L.P. System and method for searching text-based media content

Cited By (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101493813B (zh) * 2008-01-25 2012-05-30 北京新岸线网络技术有限公司 一种基于内容的视频检索系统
CN101520783B (zh) * 2008-02-29 2011-12-21 富士通株式会社 基于图像内容的关键词搜索方法和装置
CN101388022B (zh) * 2008-08-12 2010-06-09 北京交通大学 一种融合文本语义和视觉内容的Web人像检索方法
CN102385578A (zh) * 2010-08-27 2012-03-21 腾讯科技(深圳)有限公司 图片搜索的方法和装置
CN103678458A (zh) * 2012-09-13 2014-03-26 国际商业机器公司 用于图像分析的方法和系统
CN103020184A (zh) * 2012-11-29 2013-04-03 北京百度网讯科技有限公司 使用拍摄图像获取搜索结果的方法和系统
CN103020184B (zh) * 2012-11-29 2016-05-25 北京百度网讯科技有限公司 使用拍摄图像获取搜索结果的方法和系统
CN103064936A (zh) * 2012-12-24 2013-04-24 北京百度网讯科技有限公司 一种基于语音输入的图像信息提取分析方法及装置
CN103064936B (zh) * 2012-12-24 2018-03-30 北京百度网讯科技有限公司 一种基于语音输入的图像信息提取分析方法及装置
CN105637505A (zh) * 2013-05-31 2016-06-01 西洛皮斯公司 用于搜索数据库的方法
CN103440261A (zh) * 2013-07-31 2013-12-11 东莞中山大学研究院 基于内容和结构的生物医疗流程图检索的系统及方法
CN103412937A (zh) * 2013-08-22 2013-11-27 成都数之联科技有限公司 一种基于手持终端的搜索购物方法
CN103412937B (zh) * 2013-08-22 2016-12-28 成都数之联科技有限公司 一种基于手持终端的搜索购物方法
CN104424257A (zh) * 2013-08-28 2015-03-18 北大方正集团有限公司 信息检索装置和信息检索方法
CN104754261A (zh) * 2013-12-26 2015-07-01 深圳市快播科技有限公司 一种投影设备及投影方法
CN103716685A (zh) * 2014-01-09 2014-04-09 福建网龙计算机网络信息技术有限公司 图标识别系统、服务器和方法
CN103716685B (zh) * 2014-01-09 2016-08-24 福建网龙计算机网络信息技术有限公司 图标识别系统、服务器和方法
CN104951444B (zh) * 2014-03-25 2019-04-09 中国移动通信集团公司 一种搜索方法及装置
CN104951444A (zh) * 2014-03-25 2015-09-30 中国移动通信集团公司 一种搜索方法及装置
WO2015172359A1 (zh) * 2014-05-15 2015-11-19 华为技术有限公司 一种对象搜索方法及装置
CN104854539A (zh) * 2014-05-15 2015-08-19 华为技术有限公司 一种对象搜索方法及装置
CN104854539B (zh) * 2014-05-15 2018-08-14 华为技术有限公司 一种对象搜索方法及装置
US10311115B2 (en) 2014-05-15 2019-06-04 Huawei Technologies Co., Ltd. Object search method and apparatus
EP3001333A4 (en) * 2014-05-15 2016-08-24 Huawei Tech Co Ltd METHOD AND APPARATUS FOR SEARCHING OBJECTS
CN104239445A (zh) * 2014-09-01 2014-12-24 百度在线网络技术(北京)有限公司 搜索结果的展现方法和装置
CN104199950A (zh) * 2014-09-12 2014-12-10 中科嘉速(北京)并行软件有限公司 一种基于图像相似度快速匹配的学术论文搜索方法
CN104199950B (zh) * 2014-09-12 2018-02-13 中科嘉速(北京)并行软件有限公司 一种基于图像相似度快速匹配的学术论文搜索方法
CN104239568A (zh) * 2014-09-29 2014-12-24 上海斐讯数据通信技术有限公司 一种基于图片说明的快速照片搜索系统和方法
CN104504109A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 图片搜索方法和装置
CN104765796A (zh) * 2015-03-25 2015-07-08 无锡天脉聚源传媒科技有限公司 一种图像识别搜索方法及装置
CN105183812A (zh) * 2015-08-27 2015-12-23 江苏惠居乐信息科技有限公司 多功能信息咨询系统
CN105740432A (zh) * 2016-01-29 2016-07-06 上海摩软通讯技术有限公司 图片生成方法及模块、图片搜索方法及系统
CN106776990B (zh) * 2016-12-06 2020-04-14 北京搜狗科技发展有限公司 一种信息处理方法、装置及电子设备
CN106776990A (zh) * 2016-12-06 2017-05-31 北京搜狗科技发展有限公司 一种信息处理方法、装置及电子设备
CN106777316A (zh) * 2017-01-03 2017-05-31 深圳皮皮哥网络科技有限公司 一种基于网络的皮革纹路图像搜索方法及系统
CN107451194A (zh) * 2017-06-30 2017-12-08 百度在线网络技术(北京)有限公司 一种图片搜索方法及装置
WO2019056821A1 (zh) * 2017-09-19 2019-03-28 百度在线网络技术(北京)有限公司 用于信息交互的方法及装置
US11763164B2 (en) 2019-01-30 2023-09-19 Boe Technology Group Co., Ltd. Image-to-image search method, computer-readable storage medium and server
WO2020155921A1 (zh) * 2019-01-30 2020-08-06 京东方科技集团股份有限公司 以图搜图的方法、计算机可读存储介质及服务器
CN110908525A (zh) * 2019-09-29 2020-03-24 上海萌家网络科技有限公司 一种输入法及其客户端和提供候选图片/视频的方法
CN111209425A (zh) * 2020-01-06 2020-05-29 闻泰通讯股份有限公司 图像搜索方法、装置、电子设备及计算机可读存储介质
CN111524518A (zh) * 2020-04-01 2020-08-11 Oppo广东移动通信有限公司 增强现实处理方法及装置、存储介质和电子设备
CN112148831A (zh) * 2020-11-26 2020-12-29 广州华多网络科技有限公司 图文混合检索方法、装置、存储介质、计算机设备
CN112148831B (zh) * 2020-11-26 2021-03-19 广州华多网络科技有限公司 图文混合检索方法、装置、存储介质、计算机设备
CN113591882A (zh) * 2021-08-11 2021-11-02 卓尔智联(武汉)研究院有限公司 汽车配件识别方法、计算机装置及可读存储介质

Also Published As

Publication number Publication date
CN100414548C (zh) 2008-08-27

Similar Documents

Publication Publication Date Title
CN100414548C (zh) 综合利用图像及文字信息的搜索系统及搜索方法
CN106560809B (zh) 用从另一图像提取的至少一个属性修改图像的至少一个属性
CN106560810B (zh) 使用图像中找到的特定属性进行搜索
CN103069415B (zh) 用于图像处理的计算机实施的方法、计算机程序产品和计算机系统
US8156116B2 (en) Dynamic presentation of targeted information in a mixed media reality recognition system
CN102549603B (zh) 基于相关性的图像选择
US7853582B2 (en) Method and system for providing information services related to multimodal inputs
CN104991954B (zh) 基于图像搜索的购物搜索系统及其实现方法
US9633015B2 (en) Apparatus and methods for user generated content indexing
CN101571875A (zh) 一种基于图像识别的图像搜索系统的实现方法
US9639633B2 (en) Providing information services related to multimodal inputs
US20130339386A1 (en) Privacy preserving method for querying a remote public service
CN109711443A (zh) 基于神经网络的户型图识别方法、装置、设备及存储介质
CN104268279A (zh) 语料数据的查询方法和装置
CN102722528A (zh) 基于移动设备的实时海量图像检索方法
WO2010071617A1 (en) Method and apparatus for performing image processing
US20220277039A1 (en) Text to color palette generator
Tian et al. Image search reranking with hierarchical topic awareness
CN110765305A (zh) 媒介信息推送系统及其基于视觉特征的图文检索方法
CN109670071A (zh) 一种序列化多特征指导的跨媒体哈希检索方法和系统
CN105512155A (zh) 一种多层语义图像检索装置及方法
KR101592670B1 (ko) 인덱스를 이용하는 데이터 검색 장치 및 이를 이용하는 방법
KR101896177B1 (ko) 다중 결과 제공 기능을 구비한 이미지 검색 시스템
Shinde et al. Efficient classification of images using histogram based average distance computation algorithm extended with duplicate image detection elsevier, proc. of int. conf
KR101910825B1 (ko) 이미지 검색 모델을 제공하는 방법, 장치, 시스템 및 컴퓨터 프로그램

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: SHANGHAI BOKANG INTELLIGENT INFORMATION TECHNOLOGY

Free format text: FORMER OWNER: NANJING SOUPAI INFORMATION TECHNOLOGY CO., LTD.

Effective date: 20090828

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090828

Address after: Shanghai City, Guangxi 27 building 3 floor No. 69 Jinglu

Patentee after: Shanghai Bokang Intelligent Information Technology Co., Ltd.

Address before: Floor 20, civil defense building, No. 189, Guangzhou Road, Gulou District, Jiangsu, Nanjing

Patentee before: Nanjing Seekpai Information Technology Co., Ltd.