CN107665229B - 信息搜索方法、装置及设备 - Google Patents

信息搜索方法、装置及设备 Download PDF

Info

Publication number
CN107665229B
CN107665229B CN201710383841.9A CN201710383841A CN107665229B CN 107665229 B CN107665229 B CN 107665229B CN 201710383841 A CN201710383841 A CN 201710383841A CN 107665229 B CN107665229 B CN 107665229B
Authority
CN
China
Prior art keywords
information
search
image
webpage
intelligent terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710383841.9A
Other languages
English (en)
Other versions
CN107665229A (zh
Inventor
陶德龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Valley Bear Network Technology Co Ltd
Original Assignee
Shenzhen Valley Bear Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Valley Bear Network Technology Co Ltd filed Critical Shenzhen Valley Bear Network Technology Co Ltd
Priority to CN201710383841.9A priority Critical patent/CN107665229B/zh
Publication of CN107665229A publication Critical patent/CN107665229A/zh
Application granted granted Critical
Publication of CN107665229B publication Critical patent/CN107665229B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明适用于互联网技术领域,提供了一种信息搜索方法、装置及设备,该方法包括:获取智能终端上传的图像;将所述图像发送至两个以上的搜索引擎,以使所述搜索引擎搜索关于所述图像的网页信息;接收每一所述搜索引擎返回的所述网页信息;对接收到的所述网页信息进行聚合处理,并将得到的网页信息聚合结果返回至所述智能终端,以使所述智能终端展示所述网页信息聚合结果。本发明保证了用户仅需执行一次图像搜索,便能获取到多种类别的网页信息搜索结果,提高了信息搜索的效率;与此同时,本发明满足了用户多元化的搜索需求,使得每一用户均能在一次信息搜索过程中,准确地获得满足自身需求的搜索结果。

Description

信息搜索方法、装置及设备
技术领域
本发明属于互联网技术领域,尤其涉及一种信息搜索方法、信息搜索装置及信息搜索设备。
背景技术
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
目前,随着图像搜索技术的日益发展,用户可将图片上传至搜索引擎,以搜索出与图片相似的搜索结果,从而实现基于图片的智能检索。但是,由于各大搜索引擎的搜索策略存在不同,因此,对于用户所上传的同一图片,不同的搜索引擎将得到不同的搜索结果。例如,百度搜索引擎会搜索出与图片中所展示的物品的名称相同的其他图片,而淘宝搜索引擎则会搜索出与图片中所展示的物品的类别相似的其他图片。由于每一类搜索引擎的搜索策略对于用户而言是不可见的,故在一次搜索过程中,用户难以准确地获得满足自身需求的搜索结果,因此,在现有的图像搜索技术中,信息搜索的效率较为低下。
发明内容
有鉴于此,本发明实施例提供了一种信息搜索方法、信息搜索装置及信息搜索设备,以解决现有图像搜索技术中信息搜索效率较为低下以及用户在一次搜索过程中,难以准确地获得满足自身需求的搜索结果的问题。
本发明实施例的第一方面提供了一种信息搜索方法,包括:
获取智能终端上传的图像;
将所述图像发送至两个以上的搜索引擎,以使所述搜索引擎搜索关于所述图像的网页信息;
接收每一所述搜索引擎返回的所述网页信息;
对接收到的所述网页信息进行聚合处理,并将得到的网页信息聚合结果返回至所述智能终端,以使所述智能终端展示所述网页信息聚合结果。
本发明实施例的第二方面提供了一种信息搜索装置,包括:
获取单元,用于获取智能终端上传的图像;
发送单元,用于将所述图像发送至两个以上的搜索引擎,以使所述搜索引擎搜索关于所述图像的网页信息;
接收单元,用于接收每一所述搜索引擎返回的所述网页信息;
聚合单元,用于对接收到的所述网页信息进行聚合处理,并将得到的网页信息聚合结果返回至所述智能终端,以使所述智能终端展示所述网页信息聚合结果。
本发明实施例的第三方面提供了一种信息搜索设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面的信息搜索方法的步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面的信息搜索方法的步骤。
本发明实施例中,通过获取智能终端上传的图片,并将图片分发至不同的搜索引擎进行搜索处理,能够接收到基于不同搜索策略的搜索结果;通过对来自不同搜索引擎的搜索结果进行聚合优化,并将聚合后的网页信息搜索结果返回至智能终端,保证了用户仅需执行一次图像搜索,便能获取到多种类别的网页信息搜索结果,提高了信息搜索的效率。与此同时,本发明实施例中,通过一个搜索入口,用户即可方便快捷地实现了多个搜索引擎的图像搜索功能,因而满足了用户多元化的搜索需求。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的信息搜索方法的实现流程图;
图2是本发明实施例一提供的信息搜索方法S101至S104的流程示意图;
图3是本发明实施例二提供的信息搜索方法的实现流程图;
图4是本发明实施例二提供的信息搜索方法的流程示意图;
图5是本发明实施例三提供的信息搜索方法的实现流程图;
图6是本发明实施例三提供的信息搜索方法的流程示意图;
图7是本发明实施例四提供的信息搜索方法的实现流程图;
图8是本发明实施例四提供的信息搜索方法的流程示意图;
图9是本发明实施例五提供的信息搜索方法S104的具体实现流程图;
图10是本发明实施例五提供的信息搜索方法的流程示意图;
图11是本发明实施例六提供的信息搜索方法S104的具体实现流程图;
图12是本发明实施例六提供的网页信息聚合结果的展示图;
图13是本发明实施例六提供的信息搜索方法的流程示意图;
图14是本发明实施例七提供的信息搜索装置的结构框图;
图15是本发明实施例八提供的信息搜索设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一
图1示出了本发明实施例提供的信息搜索方法的实现流程,详述如下:
S101:获取智能终端上传的图像。
本发明实施例中,智能终端包括但不限于智能手机、平板、掌上电脑(PersonalDigital Assistant,PDA)、智能电视以及计算机等具备嵌入式计算机系统的终端设备。其中,上述智能终端还包括有显示屏,用于实现对图像的拍摄管理以及对搜索结果的展示。并且,智能终端内部运行有特定的应用程序客户端或网页客户端,该应用程序客户端或网页客户端通过无线传输的方式,与后台的信息搜索设备交换数据。
本发明实施例中,图像包括静态图像,也包括视频文件中的一帧图像。智能终端可通过以下两种方式将图像数据上传至信息搜索设备。第一种方式,智能终端通过预设的摄像头或者扫描器,对物品进行拍摄或者扫描处理,以得到存储于智能终端中的图像数据,该图像数据即上述图像或者视频文件。智能终端在其运行的应用程序客户端或网页客户端中,根据用户发出的图像数据上传指令,调用预先拍摄或扫描得到的图像数据,以将该图像数据上传至信息搜索设备。第二种方式,智能终端在其运行的应用程序客户端或网页客户端中,根据用户发出的图像数据上传指令,将当前时刻摄像头或者扫描器所实时获取得到的图像数据,上传至信息搜索设备。
基于上述智能终端上传图像数据的方式,信息搜索设备可接收到来自智能终端上传的图像或者接收到智能终端上传的视频文件中的图像。
S102:将所述图像发送至两个以上的搜索引擎,以使所述搜索引擎搜索关于所述图像的网页信息。
在接收到智能终端上传的图像时,根据预先设定的多个搜索引擎的访问地址以及对接接口,将该图像分别传输至多个搜索引擎,使得提供了对接接口的每一个搜索引擎均能接收到智能终端所上传的图像,并使得每一个搜索引擎能够将该图像确定为用户输入的搜索图像。
值得注意的是,本发明实施例中,搜索引擎表示第三方搜索引擎,即,由信息搜索设备以及智能终端所属厂商之外的其他厂商所提供的搜索引擎。其中,上述多个搜索引擎之中的任意两个搜索引擎均属于不同的厂商。
例如,若信息搜索设备将图像分别传输至四个搜索引擎,分别为搜索引擎1至搜索引擎4,则搜索引擎1可以是百度搜索引擎,搜索引擎2可以是淘宝搜索引擎,搜索引擎3可以是搜狗搜索引擎,搜索引擎4可以是搜狐搜索引擎。对于每一厂商所提供的搜索引擎来说,在内部对应有多台搜索引擎服务器,用以实现负载均衡的效果。本发明实施例中,后续提到的每一搜索引擎所执行的各项操作,可由其内部对应的任意一台或者多台搜索引擎服务器来完成。
搜索引擎可通过网络爬虫系统来获取存在于互联网中的网页信息。例如,搜索引擎可定期主动派出“蜘蛛”程序,对一定IP地址范围内的互联网网站进行检索,一旦发现新的网站,则“蜘蛛”程序会自动提取网站的信息和网址,并将其存入预设的搜索引擎数据库;或者,搜索引擎可接受网站拥有者主动提交的网站信息和网址,并在一定期限内定向向该网站派出“蜘蛛”程序,从而将扫描得到的网站信息存入搜索引擎数据库。
当信息搜索设备将图像传输至不同的搜索引擎后,每一搜索引擎通过一种预设算法来识别图像的特征,并基于图像的特征识别结果,在搜索引擎数据库中查找与该图像特征识别结果相似或者相同的网页信息。其中,网页信息包括但不限于文字信息、图像信息、视频信息以及网页的统一资源定位符URL(Uniform Resource Locator)等。
例如,对于其中的一个搜索引擎而言,若其预设算法为字符识别算法,则该搜索引擎将提取图像中的字符作为图像特征识别结果,并搜索与该字符相关的网页信息;对于其中的另一个搜索引擎而言,若其预设算法为形状识别算法,则该搜索引擎将提取图像中物品的轮廓形状作为图像特征识别结果,并搜索与该轮廓形状相同或相似的物品的网页信息。
S103:接收每一所述搜索引擎返回的所述网页信息。
每一个搜索引擎在进行信息检索后,将获得关于智能终端上传的图片的网页信息,此时,每个搜索引擎将其检索得到的网页信息返回至信息搜索设备。
S104:对接收到的所述网页信息进行聚合处理,并将得到的网页信息聚合结果返回至所述智能终端,以使所述智能终端展示所述网页信息聚合结果。
接收到来自于不同搜索引擎的网页信息时,信息搜索设备依照预设的聚合算法,对这些网页信息进行优化整合处理,以将凌乱无序的大量网页信息优化整合为易于用户索引的网页信息。上述聚合算法包括但不限于用于对网页信息进行去重处理的算法、对网页信息进行特征分类处理的算法以及对网页信息进行二次筛选的算法等。
示例性地,当聚合算法为对网页信息进行去重处理的算法时,若信息搜索设备接收到多个相同的网页信息,则会删除其中的部分网页信息,并将仅保留的一个网页信息返回至智能终端,由此能够避免智能终端接收到过多相同的网页信息;当聚合算法为对网页信息进行二次筛选的算法时,若信息搜索设备接收到多个相同的网页信息,且这些网页信息均来源于不同的搜索引擎,则会将这些网页信息确定为相关度较高的网页信息,从而在接收到的所有网页信息中,筛选出相关度较高的所有网页信息后,将这些筛选出的网页信息返回至智能终端,由此能够提高网络带宽资源的使用效率以及提高用户的网页信息索引效率。
对应于上述S101至S104的实现流程,图2示出了本发明实施例提供的信息搜索方法的流程示意图。如图2所示,智能终端根据用户发出的图像上传指令,将获取到的图像上传至信息搜索设备;信息搜索设备将该图像分发至多个不同的搜索引擎,以使每一个搜索引擎获得关于该图像的网页信息搜索结果后,将搜索结果返回至信息搜索设备。此后,信息搜索设备对来源于不同搜索引擎的网页信息搜索结果进行聚合优化,并将聚合优化后的网页信息作为最终得到的搜索结果,返回至智能终端,以使智能终端在显示屏中展示聚合结果。
本发明实施例中,通过获取智能终端上传的图片,并将图片分发至不同的搜索引擎进行搜索处理,能够接收到基于不同搜索策略的搜索结果;通过对来自不同搜索引擎的搜索结果进行聚合优化,并将聚合后的网页信息搜索结果返回至智能终端,保证了用户仅需执行一次图像搜索,便能获取到多种类别的网页信息搜索结果,提高了信息搜索的效率;与此同时,本发明实施例提供的信息搜索方法满足了用户多元化的搜索需求,使得每一用户均能在一次信息搜索过程中,准确地获得满足自身需求的搜索结果,
实施例二
作为本发明的一个实施例,在上述实施例一的基础上,对S102的实现流程作进一步的限定。如图3所示,上述S102具体包括:
S301:根据预设的图像识别算法,分别识别出所述图像对应的多种特征信息。
当接收到终端设备上传的图像时,由信息搜索设备对该图像进行识别处理,以识别出图像对应的特征信息。其中,上述图像对应的特征信息包括但不限于图像中物体的轮廓形状、物体的商品属性类型、图像中的文字信息、图像对应的商标以及图像中的人物身份等。
每一种特征信息由预设的一种图像识别算法来获取,且每一种图像识别算法与一个或多个搜索引擎相对应,即,存在一个或多个搜索引擎,其在接收到用户上传的图像时,同样使用对应的一种图像识别算法来获取图像的特征信息。例如,当搜索引擎中的图像识别算法为人脸识别算法,则信息搜索设备中也预设有该人脸识别算法,且该人脸识别算法与该搜索引擎相对应。
本发明实施例中,信息搜索设备中存储有N种不同的图像识别算法。通过利用N种不同的图像识别算法,分别对智能终端上传的同一图像进行识别处理,可得到该图像对应的M种特征信息,包括图像中物体的轮廓形状、物体的商品属性类型、图像中的文字信息、图像对应的商标以及图像中的人物身份等。其中,上述M和N为大于1的整数,且M大于或等于N。
若经过某一图像识别算法所得到的某一特征信息不存在,则将该特征信息确定为空值。例如,若利用人脸识别算法对图像进行处理后,确定出图像中不存在人脸信息,则确定出图像所对应的人脸特征信息为空值。
S302:将每一种特征信息发送至与该特征信息对应的所述搜索引擎,以使所述搜索引擎搜索关于该特征信息的网页信息。
由S301可知,每一特征信息与一个或多个搜索引擎对应,因此,可将识别出的每一种特征信息分别发送至与该特征信息对应的每一个搜索引擎,以使搜索引擎将其接收到的特征信息作为信息检索的关键词后,在搜索引擎数据库中搜索与该关键词相关的网页信息。
对应于图3中各步骤的实现流程,图4示出了本发明实施例提供的信息搜索方法的流程示意图。如图4所示,智能终端根据用户发出的图像上传指令,将获取到的图像上传至信息搜索设备。信息搜索设备根据预设的多种图像识别方法,获取出图像对应的多种特征信息。例如,文字识别算法、商标识别方法、人物识别方法以及视频识别方法等。将识别出的每一种特征信息分发至该特征信息对应的搜索引擎,以使每一个搜索引擎获得关于该特征信息的网页信息搜索结果后,将搜索结果返回至信息搜索设备。信息搜索设备对来源于不同搜索引擎的网页信息搜索结果进行聚合优化,将聚合优化后的网页信息作为最终得到的搜索结果,返回至智能终端,以使智能终端在显示屏中展示聚合结果。
本发明实施例中,通过在信息搜索设备中预设多种图像识别算法,能够在接收到智能终端上传的图像时,有针对性地提取出图像所对应的不同特征信息;通过把有效的特征信息传输至搜索引擎,提高了信息传输的效率,提高了搜索引擎所接收到的信息的有效性,并且,降低了搜索引擎的运算压力,由此也进一步地提高了网页信息搜索的速度。
实施例三
作为本发明的另一个实施例,在上述实施例一的基础上,对S102的实现流程作进一步的说明。如图5所示,上述S102具体包括:
S501:根据所述图像的存储路径,生成所述图像对应的统一资源定位符URL。
作为本发明实施例的一种具体实现方式,信息搜索设备对智能终端上传的图像进行存储,以将该图像存储于信息搜索设备的本地存储路径之下,或者将该图像存储于远程的云端服务器中。
作为本发明实施例的另一种具体实现方式,信息搜索设备以S301中的实现原理对智能终端上传的图像进行识别处理后,将得到的特征信息进行存储,以将该特征信息存储于信息搜索设备的本地存储路径之下,或者将该图像存储于远程的云端服务器中。
当图像或特征信息存储于本地存储路径时,信息搜索设备自动生成对应该存储路径的URL,并对外开放基于该URL的访问权限,使得其他用户或者其他设备在获取到此URL时,能够根据该URL表示的网络资源位置,通过互联网来实现对该图像或特征信息的访问。当图像存储于远程的云端服务器时,信息搜索设备读取云端服务器中图像存储路径的URL。
S502:将所述URL发送至两个以上的搜索引擎,以使所述搜索引擎获取基于所述URL的所述图像,并使所述搜索引擎搜索关于所述图像的网页信息。
信息搜索设备将每一图像对应的URL分别发送至预先对接的多个搜索引擎。当每一搜索引擎接收到URL时,搜索引擎将从该URL对应的网络资源位置中,获取基于该URL的图像或者图像的特征信息。
若URL对应的网页信息为图像,则搜索引擎通过预设算法来识别出图像的特征,并基于图像特征识别结果,在搜索引擎数据库中查找与该图像特征识别结果相似或者相同的网页信息。
若URL对应的网页信息为图像的特征信息,则搜索引擎将该特征信息确定为信息检索的关键词后,在搜索引擎数据库中搜索与该关键词相关的网页信息。
对应于图5中各步骤的实现流程,图6示出了本发明实施例提供的信息搜索方法的流程示意图。如图6所示,智能终端根据用户发出的图像上传指令,将获取到的图像上传至信息搜索设备。信息搜索设备根据图像的存储路径,将每一图像的URL分发至多个搜索引擎,以使每一个搜索引擎根据该URL,访问智能终端上传的图像,从而获得关于该图像的网页信息搜索结果后,将搜索结果进行返回。信息搜索设备对来源于不同搜索引擎的网页信息搜索结果进行聚合优化,将聚合优化后的网页信息作为最终得到的搜索结果,返回至智能终端,以使智能终端在显示屏中展示聚合结果。
本发明实施例适用于信息搜索设备接收到智能终端上传的视频文件的场景之下,此时,信息搜索设备只需对视频文件进行存储并生成对应的URL,能够将数据量较小的URL传输至搜索引擎,避免了对数据量较大的视频文件进行传输,因此,在保证了搜索引擎能够基于URL来访问视频文件的同时,进一步地降低了网络带宽的占用率。
实施例四
作为本发明的一个实施例,在上述实施例一的基础上,对S102的实现流程作进一步的限定。如图7所示,上述S102具体包括:
S701:将所述图像存储至两个以上的搜索引擎,并根据所述图像在每一所述搜索引擎中的存储路径,获取所述图像对应的各个URL。
信息搜索设备将智能终端上传的图像分别存储至多个搜索引擎中,每个图像在搜索引擎中均有相应的一个存储路径,根据该存储路径,读取图像在每一搜索引擎中对应的URL。由于图像在不同的搜索引擎中所存储的网络资源位置不同,因而对于智能终端所上传的一个图像,其对应存在有多个URL。
S702:将每一所述URL发送至与该URL对应的搜索引擎,以使所述搜索引擎获取基于所述URL的所述图像,并使所述搜索引擎搜索关于所述图像的网页信息。
图像对应的每一个URL,实质上为该图像在一个搜索引擎中的存储路径。由于每个URL与一个搜索引擎关联,因而通过将该URL发送至其关联的搜索引擎,能够保证每一个搜索引擎能够基于其接收到URL,在本地的存储路径中直接确定出该URL对应的图像,并基于图像的特征识别结果,在搜索引擎数据库中查找与该图像特征识别结果相似或者相同的网页信息。
例如,如图8所示,若在搜索引擎1中,图像的存储路径所对应的URL为URL1,则信息搜索设备将URL1发送至搜索引擎1,以使搜索引擎1从本地所存储的资源信息中,读取出URL1对应的图像,从而基于图像的特征识别结果,在搜索引擎数据库中查找与该图像特征识别结果相似或者相同的网页信息。若在搜索引擎2中,图像的存储路径所对应的URL为URL2,则信息搜索设备将URL2发送至搜索引擎2,以使搜索引擎2从本地所存储的资源信息中,读取URL2对应的图像,从而基于图像的特征识别结果,在搜索引擎数据库中查找与该图像特征识别结果相似或者相同的网页信息。
本发明实施例中,通过将图像存储至多个不同的搜索引擎,并将图像的URL告知URL所对应的搜索引擎,保证了接收到URL的搜索引擎能够直接从本地,快速地读取到需要用于进行信息搜索的图像,避免了信息搜索设备仅能在实时接收视频文件或者图像的时刻,才能触发对图像的识别处理以及触发信息搜索事件。若需要重复搜索关于某一视频文件或图像的网页信息,则信息搜索设备只需将数据量较少的URL再次发送至搜索引擎,而无须每次都将该视频文件或图像传输至搜索引擎,因而节约了网络带宽,并在一定程度上减少了搜索引擎所缓存的数据量。
实施例五
作为本发明的一个实施例,在上述各个实施例的基础上,对S104的实现流程作进一步的限定。如图9所示,上述S104具体包括:
S901:对于各个所述搜索引擎返回的所述网页信息,分别将来源于同一所述搜索引擎的所述网页信息进行聚合处理,以得到多种来源的网页信息聚合结果。
本发明实施例中,信息搜索设备接收到的每一网页信息均携带有搜索引擎来源标识,该搜索引擎来源标识例如可以是搜索引擎的IP地址。根据预设的IP地址与搜索引擎的对应关系,信息搜索设备确定出每一网页信息对应的搜索引擎。
若多个网页信息所对应的搜索引擎相同,则确定该多个网页信息来源于同一搜索引擎,此时,信息搜索设备将该多个网页信息进行聚合,以得到聚合后的一种网页信息聚合结果。对于信息搜索设备所接收到的所有网页信息的整体来说,本发明实施例达到了对所有网页信息的聚合效果。
例如,对于各个搜索引擎所返回的网页信息,若其中的a个网页信息来源于搜索引擎1,b个网页信息来源于搜索引擎2,c个网页信息来源于搜索引擎3,则本示例中可得到三种网页信息聚合结果。
S902:将每一种所述网页信息聚合结果返回至所述智能终端,以使所述智能终端在不同的显示区域中展示不同来源的所述网页信息聚合结果。
信息搜索设备将其接收到的网页信息返回至智能终端的同时,利用每一网页信息对应的搜索引擎,对每一条网页信息进行标记,使得智能终端能够基于该标记,确定出网页信息所属的一种网页信息聚合结果。智能终端将每一种网页信息聚合结果展示于应用程序客户端或者网页客户端的一个页面中,或者,将每一种网页信息聚合结果展示于页面的一个区域中。
当智能终端将每一种网页信息聚合结果展示于应用程序客户端或者网页客户端的一个页面时,该页面的页面名称为该网页信息聚合结果所对应的搜索引擎。如图10所示,当智能终端将每一种网页信息聚合结果展示于页面的一个区域时,该区域内部标识有该网页信息聚合结果所对应的搜索引擎。
本发明实施例中,通过识别出网页信息的来源,使得智能终端能够清楚地展示出每一种网页信息搜索结果的搜索引擎来源,使得用户能够直观地了解到哪一个搜索引擎的搜索结果比较适合自己的搜索需求。
实施例六
作为本发明的一个实施例,在上述各个实施例的基础上,对S104的实现流程作进一步的限定。如图11所示,上述S104具体包括:
S1101:对接收到的所述网页信息进行解析处理,以确定每一所述网页信息对应的属性类别。
本发明实施例中,当接收到不同搜索引擎所返回的网页信息时,信息搜索设备根据网页信息的URL,访问URL对应的网页快照、图片以及文字等信息。通过预设算法对该网页快照、图片以及文字等信息进行识别,信息搜索设备可确定出每一网页信息的属性类别。属性类别包括但不限于商品、商标、人物等。
示例性地,上述预设算法例如可以是,对网页信息中的图片进行识别,若图片的识别结果为某一集团的商标,且网页信息中该商标出现的次数大于预设阈值,则确定该网页信息对应的属性类别为商标。
示例性地,上述预设算法还可以是,对网页信息中的文字进行分词处理,若某一分词的在该网页信息中的出现频率大于预设阈值,且该分词为人物名称,则确定该网页信息对应的属性类别为人物。
S1102:聚合所述属性类别相同的所述网页信息,得到多种属性类别的网页信息聚合结果。
将属性类别相同的多个网页信息存储至一个集合中,并将该集合确定为一种网页信息聚合结果。在获取得到多个属性类别的网页信息时,将得到多种网页信息聚合结果。
S1103:将所述网页信息聚合结果返回至所述智能终端,以使所述智能终端在不同的显示区域中展示不同属性类别的所述网页信息聚合结果。
信息搜索设备将其接收到的网页信息返回至智能终端的同时,利用每一网页信息对应的属性类别,对每一条网页信息进行标记,使得智能终端能够基于该标记,确定出网页信息所属的一种网页信息聚合结果。智能终端将每一种网页信息聚合结果展示于应用程序客户端或者网页客户端的一个页面中,或者,将每一种网页信息聚合结果展示于页面的一个区域中。
当智能终端将每一种网页信息聚合结果展示于应用程序客户端或者网页客户端的一个页面时,该页面的页面名称为该网页信息聚合结果所对应的属性类别。如图12所示,当智能终端将每一种网页信息聚合结果展示于页面的一个区域时,该区域内部标识有该网页信息聚合结果所对应的属性类别。
对应于本发明实施例中各步骤的实现流程,图13示出了本发明实施例提供的信息搜索方法的流程示意图。如图13所示,智能终端根据用户发出的图像上传指令,将获取到的图像上传至信息搜索设备。信息搜索设备将每一图像分发至多个搜索引擎,以使每一个搜索引擎通过内部的网络爬虫系统获得关于该图像的网页信息搜索结果后,将搜索结果返回至信息搜索设备。信息搜索设备对其接收到的所有网页信息进行解析及分类,以识别出每一网页信息所对应的属性类别后,将属性类别相同的网页信息进行聚合,并将每一种网页信息聚合结果返回至智能终端,以使智能终端在显示屏中进行展示。
本发明实施例中,通过识别出网页信息的属性类别,使得用户能够根据网页信息聚合结果所对应的属性类别,快速地查找到自己所需的一类搜索结果,提高了信息搜索的效率,保证了用户在一次搜索过程中,能够快速且准确地获得满足自身需求的搜索结果。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例七
对应于上文实施例所述的信息搜索方法,图14示出了本发明实施例提供的信息搜索装置的结构框图。为了便于说明,仅示出了与本实施例相关的部分。
参照图14,该装置包括:
获取单元1401,用于获取智能终端上传的图像。
发送单元1402,用于将所述图像发送至两个以上的搜索引擎,以使所述搜索引擎搜索关于所述图像的网页信息。
接收单元1403,用于接收每一所述搜索引擎返回的所述网页信息。
聚合单元1404,用于对接收到的所述网页信息进行聚合处理,并将得到的网页信息聚合结果返回至所述智能终端,以使所述智能终端展示所述网页信息聚合结果。
可选地,所述发送单元1402包括:
识别子单元,用于根据预设的图像识别算法,分别识别出所述图像对应的多种特征信息。
发送子单元,用于将每一种特征信息发送至与该特征信息对应的所述搜索引擎,以使所述搜索引擎搜索关于该特征信息的网页信息。
可选地,所述发送单元1402包括:
生成子单元,用于根据所述图像的存储路径,生成所述图像对应的统一资源定位符URL。
第二发送子单元,用于将所述URL发送至两个以上的搜索引擎,以使所述搜索引擎获取基于所述URL的所述图像,并使所述搜索引擎搜索关于所述图像的网页信息。
可选地,所述聚合单元1404包括:
解析子单元,用于对接收到的所述网页信息进行解析处理,以确定每一所述网页信息对应的属性类别。
聚合子单元,用于聚合所述属性类别相同的所述网页信息,得到多种属性类别的网页信息聚合结果。
返回子单元,用于将所述网页信息聚合结果返回至所述智能终端,以使所述智能终端在不同的显示区域中展示不同属性类别的所述网页信息聚合结果。
可选地,所述聚合单元1404包括:
第二聚合子单元,用于将来源于同一所述搜索引擎的所述网页信息进行聚合处理,以得到多种来源的网页信息聚合结果;
第二返回子单元,用于将每一种所述网页信息聚合结果返回至所述智能终端,以使所述智能终端在不同的显示区域中展示不同来源的所述网页信息聚合结果。
实施例八
图15是本发明实施例提供的信息搜索设备的示意图。如图15所示,该实施例的信息搜索设备15包括:处理器150、存储器151以及存储在所述存储器151中并可在所述处理器150上运行的计算机程序152,例如信息搜索程序。所述处理器150执行所述计算机程序152时实现上述各个信息搜索方法实施例中的步骤,例如图1所示的步骤101至104。或者,所述处理器150执行所述计算机程序152时实现上述装置实施例中各单元的功能,例如图14所示单元1401至1404的功能。
所述信息搜索设备15可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述信息搜索设备可包括,但不仅限于,处理器150、存储器151。本领域技术人员可以理解,图15仅仅是信息搜索设备15的示例,并不构成对信息搜索设备15的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述信息搜索设备还可以包括输入输出设备、网络接入设备、总线以及显示器等。
所称处理器150可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器151可以是所述信息搜索设备15的内部存储单元,例如信息搜索设备15的硬盘或内存。所述存储器151也可以是所述信息搜索设备15的外部存储设备,例如所述信息搜索设备15上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器151还可以既包括所述信息搜索设备15的内部存储单元也包括外部存储设备。所述存储器151用于存储所述计算机程序以及所述信息搜索设备所需的其他程序和数据。所述存储器151还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (8)

1.一种信息搜索方法,其特征在于,包括:
获取智能终端上传的图像;
将所述图像发送至两个以上的搜索引擎,以使所述搜索引擎搜索关于所述图像的网页信息;具体地,根据预设的图像识别算法,分别识别出所述图像对应的多种特征信息,每一种特征信息由一种预设的图像识别算法来获取,且每一种预设的图像识别算法与一个或多个所述搜索引擎相对应,将每一种特征信息发送至与该特征信息对应的所述搜索引擎,以使所述搜索引擎搜索关于该特征信息的网页信息;
接收每一所述搜索引擎返回的所述网页信息;
对接收到的所述网页信息进行聚合处理,并将得到的网页信息聚合结果返回至所述智能终端,以使所述智能终端展示所述网页信息聚合结果。
2.如权利要求1所述的信息搜索方法,其特征在于,所述将所述图像发送至两个以上的搜索引擎,以使所述搜索引擎搜索关于所述图像的网页信息,包括:
根据所述图像的存储路径,生成所述图像对应的统一资源定位符URL;
将所述URL发送至两个以上的搜索引擎,以使所述搜索引擎获取基于所述URL的所述图像,并使所述搜索引擎搜索关于所述图像的网页信息。
3.如权利要求1至2任一项所述的信息搜索方法,其特征在于,所述对接收到的所述网页信息进行聚合处理,并将得到的网页信息聚合结果返回至所述智能终端,以使所述智能终端展示所述网页信息聚合结果,包括:
对于各个所述搜索引擎返回的所述网页信息,分别将来源于同一所述搜索引擎的所述网页信息进行聚合处理,以得到多种来源的网页信息聚合结果;
将每一种所述网页信息聚合结果返回至所述智能终端,以使所述智能终端在不同的显示区域中展示不同来源的所述网页信息聚合结果。
4.如权利要求1至2任一项所述的信息搜索方法,其特征在于,所述对接收到的所述网页信息进行聚合处理,并将得到的网页信息聚合结果返回至所述智能终端,以使所述智能终端展示所述网页信息聚合结果,包括:
对接收到的所述网页信息进行解析处理,以确定每一所述网页信息对应的属性类别;
聚合所述属性类别相同的所述网页信息,得到多种属性类别的网页信息聚合结果;
将所述网页信息聚合结果返回至所述智能终端,以使所述智能终端在不同的显示区域中展示不同属性类别的所述网页信息聚合结果。
5.一种信息搜索装置,其特征在于,包括:
获取单元,用于获取智能终端上传的图像;
发送单元,用于将所述图像发送至两个以上的搜索引擎,以使所述搜索引擎搜索关于所述图像的网页信息;具体地,所述发送单元包括:
识别子单元,用于根据预设的图像识别算法,分别识别出所述图像对应的多种特征信息,每一种特征信息由一种预设的图像识别算法来获取,且每一种预设的图像识别算法与一个或多个所述搜索引擎相对应;
发送子单元,用于将每一种特征信息发送至与该特征信息对应的所述搜索引擎,以使所述搜索引擎搜索关于该特征信息的网页信息;
接收单元,用于接收每一所述搜索引擎返回的所述网页信息;
聚合单元,用于对接收到的所述网页信息进行聚合处理,并将得到的网页信息聚合结果返回至所述智能终端,以使所述智能终端展示所述网页信息聚合结果。
6.如权利要求5所述的信息搜索装置,其特征在于,所述聚合单元包括:
解析子单元,用于对接收到的所述网页信息进行解析处理,以确定每一所述网页信息对应的属性类别;
聚合子单元,用于聚合所述属性类别相同的所述网页信息,得到多种属性类别的网页信息聚合结果;
返回子单元,用于将所述网页信息聚合结果返回至所述智能终端,以使所述智能终端在不同的显示区域中展示不同属性类别的所述网页信息聚合结果。
7.一种信息搜索设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述信息搜索方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述信息搜索方法的步骤。
CN201710383841.9A 2017-05-26 2017-05-26 信息搜索方法、装置及设备 Active CN107665229B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710383841.9A CN107665229B (zh) 2017-05-26 2017-05-26 信息搜索方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710383841.9A CN107665229B (zh) 2017-05-26 2017-05-26 信息搜索方法、装置及设备

Publications (2)

Publication Number Publication Date
CN107665229A CN107665229A (zh) 2018-02-06
CN107665229B true CN107665229B (zh) 2020-02-21

Family

ID=61121780

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710383841.9A Active CN107665229B (zh) 2017-05-26 2017-05-26 信息搜索方法、装置及设备

Country Status (1)

Country Link
CN (1) CN107665229B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108717639A (zh) * 2018-07-17 2018-10-30 北京引领海逛科技有限公司 扫码快速获得产品详情的方法和系统
CN113614714A (zh) * 2021-06-24 2021-11-05 曹庆恒 一种智能搜索方法及系统
CN113704606A (zh) * 2021-08-26 2021-11-26 山东库睿科技有限公司 搜索方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530299A (zh) * 2012-07-05 2014-01-22 阿里巴巴集团控股有限公司 一种搜索结果的生成方法及装置
CN104111989A (zh) * 2014-07-02 2014-10-22 百度在线网络技术(北京)有限公司 搜索结果的提供方法和装置
CN105373626A (zh) * 2015-12-09 2016-03-02 深圳融合永道科技有限公司 分布式人脸识别轨迹搜索系统和方法
CN106708823A (zh) * 2015-07-20 2017-05-24 阿里巴巴集团控股有限公司 一种搜索处理方法、装置及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4553053B2 (ja) * 2008-03-24 2010-09-29 ブラザー工業株式会社 印刷制御装置およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530299A (zh) * 2012-07-05 2014-01-22 阿里巴巴集团控股有限公司 一种搜索结果的生成方法及装置
CN104111989A (zh) * 2014-07-02 2014-10-22 百度在线网络技术(北京)有限公司 搜索结果的提供方法和装置
CN106708823A (zh) * 2015-07-20 2017-05-24 阿里巴巴集团控股有限公司 一种搜索处理方法、装置及系统
CN105373626A (zh) * 2015-12-09 2016-03-02 深圳融合永道科技有限公司 分布式人脸识别轨迹搜索系统和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于RSS的搜索引擎的研究与实现;戚晶;《中国优秀硕士学位论文全文数据库 信息科技辑》;20061015(第10期);I138-630 *

Also Published As

Publication number Publication date
CN107665229A (zh) 2018-02-06

Similar Documents

Publication Publication Date Title
CN107862553B (zh) 广告实时推荐方法、装置、终端设备及存储介质
CN110020122B (zh) 一种视频推荐方法、系统及计算机可读存储介质
US8489987B2 (en) Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
CN108228792B (zh) 图片检索方法、电子设备及存储介质
US20150019586A1 (en) System and method for sharing tagged multimedia content elements
KR20160044470A (ko) 배경 이미지를 설정하기 위한 방법, 서버 및 시스템
US20170364537A1 (en) Image-aided data collection and retrieval
US20140095308A1 (en) Advertisement distribution apparatus and advertisement distribution method
CN107341160A (zh) 一种拦截爬虫的方法及装置
CN107679560B (zh) 数据传输方法、装置、移动终端及计算机可读存储介质
CN107665229B (zh) 信息搜索方法、装置及设备
CN104933056A (zh) 统一资源定位符去重方法及装置
CN109167840B (zh) 一种任务推送方法、节点自治服务器及边缘缓存服务器
CN103617266A (zh) 个性化扩展搜索方法及装置、系统
CN108804445B (zh) 热力图生成方法和装置
CN106534268B (zh) 一种数据共享方法及装置
WO2023040530A1 (zh) 网页内容溯源方法、知识图谱构建方法以及相关设备
CN105808642B (zh) 推荐方法及装置
CN107748772B (zh) 一种商标识别方法及装置
CN108415748B (zh) 信息显示方法和系统、计算机存储介质及设备
CN111367870A (zh) 一种绘本共享方法、装置和系统
CN111859127A (zh) 消费数据的订阅方法、装置及存储介质
TW201629802A (zh) 資訊搜索系統及方法
CN102306167A (zh) 基于移动手持设备的记事方法及系统
Zuo et al. Bandwidth and energy efficient image sharing for situation awareness in disasters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant