CN102184185A - 一种用于多媒体资源搜索的方法与设备 - Google Patents

一种用于多媒体资源搜索的方法与设备 Download PDF

Info

Publication number
CN102184185A
CN102184185A CN 201110090824 CN201110090824A CN102184185A CN 102184185 A CN102184185 A CN 102184185A CN 201110090824 CN201110090824 CN 201110090824 CN 201110090824 A CN201110090824 A CN 201110090824A CN 102184185 A CN102184185 A CN 102184185A
Authority
CN
China
Prior art keywords
multimedia
search
search result
resource
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110090824
Other languages
English (en)
Inventor
兰强
殷庆轩
李彦宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN 201110090824 priority Critical patent/CN102184185A/zh
Publication of CN102184185A publication Critical patent/CN102184185A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的目的是提供一种用于多媒体资源搜索的方法与设备。其中,多媒体搜索设备获取用户的查询序列;根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;将所述搜索结果提供至所述用户。本发明实现了用户在无需点击搜索结果的情况下,直接浏览搜索结果即可获得与查询序列相对应的多媒体资源信息,并减少了用户为查找所需的多媒体资源所进行的搜索结果点击成本,且在该基础上实现了多媒体资源搜索的搜索结果的快速定位,极大地提高用户的搜索效率和搜索的准确性,同时提升了用户的搜索体验。

Description

一种用于多媒体资源搜索的方法与设备
技术领域
本发明涉及网络资源搜索技术领域,尤其涉及一种用于多媒体资源搜索的技术。
背景技术
现有的多媒体资源搜索技术中,当用户基于查询序列进行多媒体资源搜索时,搜索引擎一般仅提供指向相应多媒体资源页面的页面搜索结果。然而,这些页面搜索结果不能直观地向用户展现其指向页面中的多媒体资源,如指向视频资源页面的页面搜索结果在呈现给用户时,仅提供锚文本和文字描述信息等,而未提供该视频资源的相关截图等用户可以直观地感受该视频资源页面内容的相关信息。在这种情况下,用户需要点击页面搜索结果以进入相应的多媒体资源页面,进行浏览甚至多级查找,才能获得其所需的多媒体资源。此外,由于搜索引擎会返回大量的页面搜索结果,指向用户目标多媒体资源页面的页面搜索结果常常会被这些大量页面搜索结果所淹没,使得用户很难在短时间内获取其希望的多媒体资源,导致搜索效率不高,同时降低了用户的搜索体验。
因此,如何提供一种用于多媒体资源搜索的方法或设备,使得用户在进行多媒体资源搜索时,无需点击页面搜索结果即可直接浏览相应页面的多媒体信息,成为目前亟待解决的问题之一。
发明内容
本发明的目的是提供一种用于多媒体资源搜索的方法与设备。
根据本发明的一个方面,提供了一种计算机实现的用于多媒体资源搜索的方法,其中,该方法包括以下步骤:
a获取用户的查询序列;
b根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;
c根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;
d将所述搜索结果提供至所述用户。
根据本发明的另一方面,还提供了一种用于多媒体资源搜索的设备,其中,该设备包括:
查询获取装置,用于获取用户的查询序列;
多媒体获取装置,用于根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;
结果生成装置,用于根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;
提供装置,用于将所述搜索结果提供至所述用户。
与现有技术相比,本发明根据用户输入的查询序列,在相应的搜索结果中直接展现其对应页面中包括的多媒体资源信息,如视频资源链接、音频下载链接、音频试听链接、图片缩略图等,从而实现了用户在无需点击搜索结果的情况下,直接浏览搜索结果即可获得与查询序列相对应的多媒体资源信息;本发明减少了用户为查找所需的多媒体资源所进行的搜索结果点击成本,并在该基础上实现了多媒体资源搜索的搜索结果的快速定位,极大地提高用户的搜索效率和搜索的准确性,同时提升了用户的搜索体验。进一步地,本发明还可以将直接展现多媒体资源信息的页面搜索结果和普通页面搜索结果集成整合为一个搜索结果页面提供给用户,保证了搜索结果的全面完整性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的计算机实现的用于多媒体资源搜索的设备示意图;
图2示出根据本发明另一个方面的用于多媒体资源搜索的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1为根据本发明一个方面的设备示意图,示出用于多媒体资源搜索的设备。其中,多媒体搜索设备1包括查询获取装置11、多媒体获取装置12、结果生成装置13、提供装置14。具体地,查询获取装置11获取用户的查询序列;随后,多媒体获取装置12根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;接着,结果生成装置13根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;随后,提供装置14将所述搜索结果提供至所述用户。在此,多媒体搜索设备1包括但不限于搜索引擎、与搜索引擎相连的网络设备;其中,网络设备包括但不限于网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合,在此,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解上述多媒体搜索设备以及网络设备仅为举例,其他现有的或今后可能出现的多媒体搜索设备或者网络设备如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
更具体地,查询获取装置11获取用户的查询序列。具体地,查询获取装置11通过诸如按照预先约定的通信协议接收用户经由用户设备发送的查询序列、或者从第三方设备提供的应用程序接口(API),获取用户向该第三方设备输入的查询序列。例如,假设多媒体搜索设备1为搜索引擎,查询获取装置11按照预先约定的通信协议,如http、https等通信协议,接收用户经由用户设备发送的查询序列,从而获取用户经由该用户设备输入的查询序列。又如,查询获取装置11根据第三方设备提供的应用程序接口(API),向该第三方设备发送获取用户输入该第三方设备的查询序列的请求,并接收该第三方设备基于该请求返回的查询序列。本领域技术人员应能理解上述获取查询序列的方式仅为举例,其他现有的或今后可能出现的获取查询序列的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
随后,多媒体获取装置12根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果。具体地,多媒体获取装置12根据查询获取装置11获取的查询序列,在索引信息库中进行匹配查询,如该索引信息库包括媒体索引库,多媒体获取装置12直接在该媒体索引库中进行查询,即可获得与该查询序列相对应的多媒体搜索结果;如该索引信息库包括搜索索引库,多媒体获取装置12在该搜索索引库中查询获得指向多媒体资源页面的页面搜索结果,解析这些多媒体资源页面,提取相应的多媒体相关信息,如视频资源链接、音频下载链接、音频试听链接、图片缩略图等,以生成与该查询序列相对应的多媒体搜索结果;在此,媒体索引库包括查询关键词及其对应的多媒体资源信息,如视频资源链接、音频资源链接、图片缩略图等,搜索索引库包括查询关键词及其对应的页面链接。例如,查询获取装置11获取用户输入的查询序列为“喜羊羊与灰太狼”,索引信息库包括媒体索引库,多媒体获取装置12根据该查询序列,在该媒体索引库中进行匹配查询,获取与该查询序列相对应的多媒体搜索结果,如《喜羊羊与灰太狼》的视频资源链接、《喜羊羊与灰太狼》的主题曲试听链接、《喜羊羊与灰太狼》的图片缩略图等。又如,查询获取装置11获取用户输入的查询序列仍为“喜羊羊与灰太狼”,索引信息库包括搜索索引库,多媒体获取装置12根据该查询序列,在该搜索索引库中进行匹配查询,获取与该查询序列相对应的页面搜索结果,这些页面搜索结果所指向的页面中均包括与“喜羊羊与灰太狼”相关的多媒体资源,多媒体获取装置12解析这些多媒体资源页面,从这些多媒体资源页面中提取相应的多媒体相关信息,如《喜羊羊与灰太狼》的视频资源链接、《喜羊羊与灰太狼》的主题曲试听链接、《喜羊羊与灰太狼》的图片缩略图等,以生成与该查询序列相对应的多媒体搜索结果。本领域技术人员应能理解上述获取多媒体搜索结果的方式仅为举例,其他现有的或今后可能出现的获取多媒体搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
接着,结果生成装置13根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果。具体地,结果生成装置13根据多媒体获取装置12获取的多媒体搜索结果,以及该(等)多媒体搜索结果所对应的页面,通过如提取该(等)页面中的相关信息生成相应多媒体搜索结果的摘要、锚文本等方式,生成与用户输入查询序列相对应的搜索结果。例如,接上例,多媒体获取装置12获取与用户输入的查询序列相对应的多媒体搜索结果,如《喜羊羊与灰太狼》的视频资源链接、《喜羊羊与灰太狼》的主题曲试听链接、《喜羊羊与灰太狼》的图片缩略图等;结果生成装置13根据这些多媒体搜索结果,以及从这些多媒体搜索结果所对应的页面中提取相关信息生成相应的摘要、锚文本等,将这些多媒体搜索结果及其对应的摘要、锚文本相结合,以生成与查询序列“喜羊羊与灰太狼”相对应的搜索结果。优选地,当第三方设备存储有多媒体资源相关信息时,结果生成装置13还基于多媒体搜索结果,向该第三方设备发送获取与这些多媒体搜索结果所对应的多媒体资源相关的信息的请求,并接收该第三方设备根据该请求返回的相应多媒体资源相关信息,将这些多媒体资源相关信息集成进最终生成的搜索结果的摘要;在此,多媒体资源相关信息包括与多媒体资源相关的信息,如多媒体资源的评论、内容信息等。本领域技术人员应能理解上述生成搜索结果的方式仅为举例,其他现有的或今后可能出现的生成搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
随后,提供装置14将所述搜索结果提供至所述用户。具体地,提供装置14将结果生成装置13生成的与查询序列相对应的搜索结果,通过诸如页面技术,如ASP、JSP、PHP等,生成搜索结果页面,并推送至该用户的用户设备,该用户通过该用户设备浏览该搜索结果页面;或者将该搜索结果页面的URL发送至该用户的用户设备,由该用户经该用户设备点击该URL,从而进入相应页面以获得搜索结果;或者向该用户的用户设备逐条推送搜索结果。例如,结果生成装置13生成的与查询序列相对应的搜索结果,提供装置14根据ASP页面技术,由这些搜索结果生成相应的搜索结果页面,并将该页面推送至该用户的用户设备,该用户通过该用户设备浏览该搜索结果页面。本领域技术人员应能理解上述提供搜索结果的方式仅为举例,其他现有的或今后可能出现的提供搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,查询获取装置11、多媒体获取装置12、结果生成装置13和提供装置14之间是持续不断地工作。具体地,查询获取装置11获取用户的查询序列;随后,多媒体获取装置12根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;接着,结果生成装置13根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;随后,提供装置14将所述搜索结果提供至所述用户。在此,本领域技术人员应理解“持续”是指查询获取装置11、多媒体获取装置12、结果生成装置13和提供装置14分别按照设定的或实时调整的工作模式要求进行查询序列的获取、多媒体搜索结果的获取,搜索结果的生成以及搜索结果的提供,直至多媒体搜索设备1在较长时间内停止获取用户输入的查询序列。
在一个优选实施例中(参照图1),索引信息库包括媒体索引库;多媒体获取装置12还根据所述查询序列,在所述媒体索引库中进行匹配查询,以获取所述多媒体搜索结果。以下参照图1对该优选实施例进行详细描述,其中,查询获取装置11获取用户的查询序列;结果生成装置13根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;随后,提供装置14将所述搜索结果提供至所述用户;其具体过程与前述参照图1所描述的实施例中查询获取装置11、结果生成装置13和提供装置14所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,索引信息库包括媒体索引库;多媒体获取装置12根据查询获取装置11获取的用户查询序列,通过诸如对该查询序列或者对该查询序列切分获得的查询关键词在该媒体索引库中进行匹配查询,获取相应的多媒体搜索结果。在此,媒体索引库包括查询关键词及其对应的多媒体资源信息,如视频资源链接、音频资源链接、图片缩略图等。例如,索引信息库包括媒体索引库;查询获取装置11获取用户输入的查询序列为“喜羊羊与灰太狼”,多媒体获取装置12根据该查询序列,在该媒体索引库中进行匹配查询,获取与该查询序列相对应的多媒体搜索结果,如《喜羊羊与灰太狼》的视频资源链接、《喜羊羊与灰太狼》的主题曲试听链接、《喜羊羊与灰太狼》的图片缩略图等。本领域技术人员应能理解上述获取多媒体搜索结果的方式仅为举例,其他现有的或今后可能出现的获取多媒体搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,多媒体搜索设备1还包括更新装置(未示出),更新装置从网络中抓取并解析网页,根据所述网页中包括多媒体资源的类型,从所述网页中提取与所述类型相对应的资源相关信息;根据所述资源相关信息,建立或者更新所述媒体索引库。具体地,更新装置通过网页抓取工具诸如网络蜘蛛(spider)、网络爬虫(crawler)等,从网络中抓取并解析网页,根据这些网页中包括多媒体资源的类型,如视频资源、音频资源、图片资源等,从这些网页中提取与该(等)类型相对应的资源相关信息,如与连续性视频资源相对应的剧集信息、与音频资源相对应的链接类型信息等,并根据该(等)资源相关信息,建立或者更新所述媒体索引库。例如,更新装置通过网页抓取工具如网络蜘蛛(spider)、网络爬虫(crawler)等,从网络中抓取网页,并解析该抓取到的网页中是否包含多媒体资源,如视频、音频、图片等多媒体资源,若该抓取到的网页中包含多媒体资源,则根据该多媒体资源的类型,从该网页中提取相应的资源相关信息,如该网页中包括视频资源,则提取该网页的URL、该视频资源的名称、时长、演员信息、描述信息等资源相关信息,若该网页中包括音频资源,则提取该网页的URL、该音频资源的链接类型信息,诸如试听链接、下载链接等;该更新装置在媒体索引库尚未建立时,根据其提取的这些资源相关信息,建立媒体索引库,在媒体索引库建立后,根据其提取的这些资源相关信息,更新该媒体索引库。优选地,该更新装置根据该媒体索引库向第三方设备提供的应用程序接口(API),接收含多媒体资源的第三方设备提供的多媒体资源链接及相关的描述信息,如标题、评论信息、人物信息、时间信息等,并根据这些多媒体资源链接及相关的描述信息更新该媒体索引库。本领域技术人员应能理解上述建立以及更新媒体索引库的方式仅为举例,其他现有的或今后可能出现的建立或者更新媒体索引库的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在另一个优选实施例中(参照图1),索引信息库包括搜索索引库;多媒体获取装置12还根据所述查询序列,在所述搜索索引库中进行匹配查询,以获取与所述查询序列相对应的多媒体页面搜索结果,其中,所述多媒体页面搜索结果所对应的页面中包括与所述查询序列相对应的多媒体资源;提取所述多媒体资源的多媒体相关信息;根据所述多媒体相关信息,生成所述多媒体搜索结果。以下参照图1对该另一优选实施例进行详细描述,其中,查询获取装置11获取用户的查询序列;结果生成装置13根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;随后,提供装置14将所述搜索结果提供至所述用户;其具体过程与前述参照图1所描述的实施例中查询获取装置11、结果生成装置13和提供装置14所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,索引信息库包括搜索索引库;多媒体获取装置12获取多媒体搜索结果的方式为根据用户的查询序列,在该搜索索引库中进行匹配查询,以获得指向多媒体资源页面的页面搜索结果,解析这些多媒体资源页面,提取相应的多媒体相关信息,如视频资源链接、音频下载链接、音频试听链接、图片缩略图等,以生成与该查询序列相对应的多媒体搜索结果。在此,搜索索引库中包括查询关键词及其对应的页面链接等。例如,查询获取装置11获取用户输入的查询序列仍为“喜羊羊与灰太狼”,索引信息库包括搜索索引库;多媒体获取装置12根据该查询序列,在该搜索索引库中进行匹配查询,获取与该查询序列相对应的页面搜索结果,这些页面搜索结果所指向的页面中均包括与“喜羊羊与灰太狼”相关的多媒体资源,多媒体获取装置12解析这些多媒体资源页面,从这些多媒体资源页面中提取相应的多媒体相关信息,如《喜羊羊与灰太狼》的视频资源链接、《喜羊羊与灰太狼》的主题曲试听链接、《喜羊羊与灰太狼》的图片缩略图等,以生成与该查询序列相对应的多媒体搜索结果。本领域技术人员应能理解上述获取多媒体搜索结果的方式仅为举例,其他现有的或今后可能出现的获取多媒体搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在再一个优选实施例中(参照图1),多媒体搜索设备1还包括需求获取装置(未示出),该需求获取装置根据所述查询序列,获取与所述查询序列相对应的需求类型信息;多媒体获取装置12还根据所述查询序列,结合所述需求类型信息,在所述索引信息库中进行匹配查询,以获取所述多媒体搜索结果。以下参照图1对该再一优选实施例进行详细描述,其中,查询获取装置11获取用户的查询序列;结果生成装置13根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;随后,提供装置14将所述搜索结果提供至所述用户;其具体过程与前述参照图1所描述的实施例中查询获取装置11、结果生成装置13和提供装置14所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,需求获取装置根据查询获取装置11获取的查询序列,获取与该查询序列相对应的需求类型信息;多媒体获取装置12还根据该查询序列,结合需求获取装置获取的需求类型信息,在索引信息库中进行匹配查询,以获取与该查询序列相对应的多媒体搜索结果。在此,需求获取装置获取与查询序列相对应的需求类型信息的方式包括但不限于:1)根据对查询序列的语义分析,获取与该查询序列相对应的需求类型信息;2)根据用户查询历史记录,获取与该查询序列相对应的需求类型信息,在此,用户查询历史记录包括但不限于用户历史输入的查询序列、用户对搜索结果的浏览记录、及用户历史输入的查询序列与用户浏览的搜索结果的映射关系等,其中,用户包括当前用户和统计用户;3)对查询序列进行分词处理,得到相应的查询关键词,在预设特征词库中对这(些)查询关键词进行匹配查询,以获得相应的需求类型信息,在此,预设特征词库包括与用户查询需求类型相关的特征词,如“在线观看”、“下载”、“mp3”等。
例如,查询获取装置11获取的用户输入的查询序列为“想看喜羊羊与灰太狼”,需求获取装置对该查询序列进行语义分析后,获得相应的查询关键词“喜羊羊与灰太狼”和“视频”,由此得到其相应的需求类型信息为视频需求;多媒体获取装置12根据该查询序列,结合该视频需求,在索引信息库中进行匹配查询,获取相应的视频搜索结果。
又如,假设查询序列为“喜羊羊与灰太狼”,需求获取装置根据用户查询历史记录,如用户历史输入的查询序列“喜羊羊与灰太狼”,及其对应的浏览记录,如《喜羊羊与灰太狼》视频,获得该查询序列所对应的需求类型信息为视频需求;多媒体获取装置12根据该查询序列,结合该视频需求,在索引信息库中进行匹配查询,获取相应的视频搜索结果。
再如,假设查询序列为“喜羊羊与灰太狼在线观看”,需求获取装置对该查询序列进行分词处理后,得到查询关键词“喜羊羊与灰太狼”和“在线观看”,在预设特征词库对这些查询关键词进行匹配查询,获得相应的特征词“在线观看”及其对应的需求类型信息,如视频需求;多媒体获取装置12根据该查询序列,结合该需求类型信息,在索引信息库中进行匹配查询,获取相应的视频搜索结果。
本领域技术人员应能理解上述获取需求类型信息的方式以及获取多媒体搜索结果的方式仅为举例,其他现有的或今后可能出现的获取需求类型信息的方式或者获取多媒体搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,需求获取装置还根据所述查询序列,在预设特征词库中进行匹配查询,以获得所述需求类型信息。具体地,需求获取装置通过对查询获取装置11获得的查询序列进行分词,得到相应的查询关键词,在预设特征词库中对该(等)查询关键词进行匹配查询,以获得该查询序列所对应的需求类型信息。在此,预设特征词库包括与用户查询需求类型相关的特征词,如“在线观看、下载、mp3”等。例如,假设查询序列为“喜羊羊与灰太狼在线观看”,需求获取装置对该查询序列进行分词处理后,得到查询关键词“喜羊羊与灰太狼”和“在线观看”,在预设特征词库对这些查询关键词进行匹配查询,得到相应的特征词“在线观看”及其对应的需求类型信息,如视频需求。优选地,预设特征词库还包括与多媒体资源相对应的专有名词,以及这些专有名词所对应的资源类型,如“里约大冒险”,其对应的资源类型为视频,还可以进一步细分为动画、电影;在此,专有名词及其对应的资源类型的来源包括对特定视频网站、特定音乐网站等知名多媒体网站的资源挖掘,对从这些多媒体网站获取的专有名词按照来源网站的属性进行分类,以获得这些专有名词所对应的资源类型;例如,对“百度奇艺网”进行资源挖掘,获得专有名词“里约大冒险”,其对应的资源类型为视频,据此当用户输入查询序列“里约大冒险”时,需求获取装置在该预设特征词库中对该查询序列进行匹配查询,获得专有名词“里约大冒险”及其对应的资源类型“视频”,该资源类型即为该查询序列所对应的需求类型信息。本领域技术人员应能理解上述获取需求类型信息的方式仅为举例,其他现有的或今后可能出现的获取需求类型信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在又一个优选实施例中(参照图1),多媒体搜索设备1还包括筛选装置(未示出),该筛选装置根据所述多媒体搜索结果的查询相关属性,筛选所述多媒体搜索结果,以获得筛选后的多媒体搜索结果;结果生成装置13根据所述筛选后的多媒体搜索结果,以及所述筛选后的多媒体搜索结果所对应的页面,生成所述搜索结果。以下参照图1对该又一优选实施例进行详细描述,其中,查询获取装置11获取用户的查询序列;随后,多媒体获取装置12根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;提供装置14将所述搜索结果提供至所述用户;其具体过程与前述参照图1所描述的实施例中查询获取装置11、多媒体获取装置12和提供装置14所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,筛选装置根据多媒体获取装置12获取的多媒体搜索结果的查询相关属性,诸如多媒体搜索结果的权威度、多媒体搜索结果的相关度、多媒体搜索结果的新鲜度等,筛选该(等)多媒体搜索结果,以获得筛选后的多媒体搜索结果;结果生成装置13根据该(等)筛选后的多媒体搜索结果,以及该(等)筛选后的多媒体搜索结果所对应的页面,生成与该查询序列相对应的搜索结果。在此,多媒体搜索结果的查询相关属性包括与多媒体搜索结果的查询选取相关的属性,如多媒体搜索结果的权威度、多媒体搜索结果的相关度、多媒体搜索结果的新鲜度等;这些查询相关属性可以由索引信息库获取,如在将多媒体资源相关信息加入索引信息库库时,即为其预设相应的查询相关属性,也可以在基于查询序列获取相应的多媒体搜索结果时,对这些多媒体搜索结果实时计算对应的查询相关属性。例如,查询获取装置11获取用户的查询序列;多媒体获取装置12根据该查询序列,从索引信息库中获取相应的多媒体搜索结果,筛选装置根据这些多媒体搜索结果的新鲜度,如每一个多媒体搜索结果的最近更新时间,对这些多媒体搜索结果进行筛选,以获得筛选后最新的多媒体搜索结果;结果生成装置13根据这些筛选后最新的多媒体搜索结果,以及这些最新的多媒体搜索结果所对应的页面,生成与该查询序列相对应的搜索结果。本领域技术人员应能理解上述筛选多媒体资源搜索结果的方式仅为举例,其他现有的或今后可能出现的筛选多媒体资源搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述多媒体搜索结果的查询相关属性包括但不限于,以下至少任一项:
1)所述多媒体搜索结果的权威度;
2)所述多媒体搜索结果的相关度;
3)所述多媒体搜索结果的新鲜度。
具体地,1)多媒体搜索结果的权威度,该权威度根据多媒体搜索结果所对应页面的权威度、多媒体搜索结果所对应站点的权威度等确定;2)多媒体搜索结果的相关度,该相关度根据多媒体搜索结果与查询序列的相关度、多媒体搜索结果与用户属性的相关度等确定,其中,用户属性包括用户的母语、用户所在的位置、用户偏好等与用户自身特性相关的信息。3)多媒体搜索结果的新鲜度,该新鲜度根据多媒体搜索结果所指向页面中多媒体资源的更新时间、多媒体搜索结果所指向页面的更新时间等确定。本领域技术人员应能理解上述各项查询相关属性不仅可以单独用于筛选装置筛选多媒体搜索结果,还可以将其中多项相结合用于筛选装置筛选多媒体搜索结果。例如,假设多媒体搜索结果的权威度的筛选权重为0.3,多媒体搜索结果的相关度的筛选权重为0.5,多媒体搜索结果的新鲜度的筛选权重为0.2,筛选装置对这些多媒体搜索结果的查询相关属性进行加权,以筛选多媒体获取装置12获取的多媒体搜索结果,并将筛选后的多媒体搜索结果提供至结果生成装置13,以供结果生成装置13生成与用户查询序列相对应的搜索结果。本领域技术人员还应能理解上述查询相关属性仅为举例,其他现有的或今后可能出现的查询相关属性如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在还一个优选实施例中(参照图1),多媒体搜索设备1还包括预处理装置(未示出),该预处理装置根据所述多媒体搜索结果所对应的多媒体资源的资源属性,对所述多媒体搜索结果进行预处理,以获得预处理后的多媒体搜索结果;结果生成装置13还根据所述预处理后的多媒体搜索结果,以及所述预处理后的多媒体搜索结果所对应的页面,生成所述搜索结果。以下参照图1对该还一优选实施例进行详细描述,其中,查询获取装置11获取用户的查询序列;随后,多媒体获取装置12根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;提供装置14将所述搜索结果提供至所述用户;其具体过程与前述参照图1所描述的实施例中查询获取装置11、多媒体获取装置12和提供装置14所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,预处理装置根据多媒体获取装置12获取的多媒体搜索结果所对应多媒体资源的资源属性,诸如视频资源的连续性、音频资源的应用类型和图片资源的分类信息等,对多媒体搜索结果进行预处理,诸如对连续性的视频搜索结果做序列化处理、对音频搜索结果按相应音频资源的应用类型做链接归一化处理、对图片搜索结果按相应图片资源的分类信息做分类处理等,以获得预处理后的多媒体搜索结果;结果生成装置13还根据该(等)预处理后的多媒体搜索结果,以及该(等)预处理后的多媒体搜索结果所对应的页面,生成相应的搜索结果。例如,根据用户的查询序列“Harry’s law”,多媒体获取装置12获取多媒体搜索结果为“Harry’s law”的视频资源链接,预处理装置根据这些视频资源链接所对应视频资源的资源属性,如视频资源的连续性,对这些视频资源链接进行序列化处理,如将这些视频资源链接按其所对应的集次顺序,进行排列整合,如将第一集的链接、第二集的链接等依次排列,并整合为一个视频搜索结果;结果生成装置13提取该序列化处理后的视频搜索结果所对应页面中的共同信息以生成摘要、锚文本等,如“Harry’s law”的剧情简介、演员信息等,再根据该序列化处理后的视频搜索结果、摘要和锚文本生成与查询序列“Harry’s law”相对应的搜索结果。本领域技术人员应能理解上述对多媒体搜索结果的预处理操作以及生成搜索结果的方式仅为举例,其他现有的或今后可能出现的对多媒体搜索结果的预处理操作或者生成搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述多媒体资源的资源属性以及与其相对应的预处理操作包括以下至少任一项:
1)根据视频资源的连续性,对视频搜索结果做序列化处理;
2)根据音频资源的应用类型,对音频搜索结果做链接归一化处理;
3)根据图片资源的分类信息,对图片搜索结果做分类处理。
具体地,1)根据视频资源的连续性,对视频搜索结果做序列化处理,包括预处理装置根据多媒体获取装置12获取的视频搜索结果所对应的视频资源的连续性,对该(等)视频搜索结果按照其对应的顺序进行序列化处理。例如,假设视频搜索结果所对应的视频资源为连续剧,则预处理装置按照该连续剧的集次顺序进行序列化处理。又如,假设视频搜索结果所对应的视频资源为包括多个分段的电影,则预处理装置按照该电影的每个分段所对应的时间顺序,对这些分段进行序列化处理。2)根据音频资源的应用类型,对音频搜索结果做链接归一化处理,包括预处理装置根据多媒体获取装置12获取的音频搜索结果所对应的音频资源的应用类型,对该(等)音频搜索结果按照该应用类型进行链接归一化处理。例如,假设用户的查询序列为“那些花儿”,多媒体搜索结果12获取相应的音频搜索结果,其对应音频资源的应用类型包括下载、试听、歌词、铃声等,预处理装置根据这些应用类型,对这些音频搜索结果按照相应的下载链接、试听链接、歌词链接、铃声链接等进行归类,并对这些链接进行链接归一化处理,如将各种链接类型整合入一个音频搜索结果;在此,该链接归一化处理后的音频搜索结果,其中的每个链接类型所对应的链接可以指向一个具体的音频资源页面,也可以指向一个该链接类型所对应的多个音频资源链接的列表页,如在一个链接归一化处理后的音频搜索结果中,当其中的试听链接指向一个具体的音频资源试听页面时,用户点击该试听链接,即可直接试听相应的音频资源,当该试听链接指向其对应的包括多个音频资源试听链接的列表页时,当用户点击该试听链接时,即可获得一个音频资源试听链接列表,用户通过点击该列表中的具体试听链接,试听相应的音频资源。3)根据图片资源的分类信息,对图片搜索结果做分类处理,包括预处理装置根据多媒体获取装置12获取的图片搜索结果所对应的图片资源的分类信息,对该(等)图片搜索结果按照其相应的分类信息进行分类处理。例如,假设用户的查询序列为“刘德华”,多媒体获取装置12获取相应的图片搜索结果为多个刘德华的图片缩略图,预处理装置按照这些图片缩略图的分类信息,如电影图片、音乐专辑图片等,对这些图片缩略图进行分类处理。本领域技术人员应能理解上述多媒体资源的资源属性以及与其相对应的预处理操作仅为举例,其他现有的或今后可能出现的多媒体资源的资源属性以及与其相对应的预处理操作的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在另一个优选实施例中(参照图1),多媒体搜索设备1还包括页面获取装置(未示出),该页面获取装置获取与所述查询序列相对应的通用页面搜索结果;提供装置14还将所述搜索结果与所述通用页面搜索结果集成,以获得集成后的搜索结果;将所述集成后的搜索结果提供至所述用户。以下参照图1对该另一优选实施例进行详细描述,其中,查询获取装置11获取用户的查询序列;随后,多媒体获取装置12根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;接着,结果生成装置13根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;其具体过程与前述参照图1所描述的实施例中查询获取装置11、多媒体获取装置12和结果生成装置13所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,页面获取装置通过诸如根据用户的查询序列在搜索索引库中进行匹配查询,以获得与该查询序列相对应的通用页面搜索结果,或者从搜索引擎或具有页面搜索能力的第三方设备处获取与用户的查询序列相对应的通用页面搜索结果;提供装置14还将结果生成装置13生成的搜索结果与该(等)通用页面搜索结果集成,以获得集成后的搜索结果,并将集成后的搜索结果提供给该用户。在此,通用页面搜索结果包括基于用户的查询序列从搜索索引库中获得的所有页面搜索结果,包括多媒体页面搜索结果和普通页面搜索结果;其中,提供装置14集成结果生成装置13生成的搜索结果与通用页面搜索结果的方式包括但不限于:1)根据结果生成装置13生成的搜索结果所对应的URL和通用页面搜索结果所对应的URL,当两者的URL相同时,则用结果生成装置13生成的搜索结果替代相应的通用页面搜索结果,以实现结果生成装置13生成的搜索结果与通用页面搜索结果的集成;2)获取通用页面搜索结果中的多媒体页面搜索结果,根据这些多媒体页面搜索结果所对应的URL,查找相应的结果生成装置13生成的搜索结果,并用该查找到的搜索结果替代通用页面搜索结果中的相应多媒体页面搜索结果,以实现结果生成装置13生成的搜索结果与通用页面搜索结果的集成;3)将结果生成装置13生成的搜索结果与通用页面搜索结果合并,如将多媒体搜索结果置于搜索结果页面的上半部分,将通用页面搜索结果置于搜索结果页面的下半部分,或者其他的合并方式。例如,查询获取装置11获取的查询序列为“喜羊羊与灰太狼”,页面获取装置根据该查询序列在搜索索引库中进行匹配查询,获取与“喜羊羊与灰太狼”相对应的通用页面搜索结果;多媒体获取装置12获取相应的多媒体搜索结果,结果生成装置13根据这些多媒体搜索结果生成相应的搜索结果;提供装置14通过将这些搜索结果替代对应相同URL的通用页面搜索结果,集成这些搜索结果与通用页面搜索结果,以获得集成后的搜索结果,并生成搜索结果页面,将该搜索结果页面推送至用户设备,用户经由该用户设备浏览该搜索结果页面。
在此,本领域技术人员应能理解,结果生成装置13生成与查询序列相对应的搜索结果的操作与页面获取装置获取与查询序列相对应的通用页面搜索结果的操作,在执行顺序上不分先后,可以是结果生成装置13先生成与查询序列相对应的搜索结果,页面获取装置再获取与该查询序列相对应的通用页面搜索结果;也可以是页面获取装置先获取与该查询序列相对应的通用页面搜索结果,结果生成装置13再生成与查询序列相对应的搜索结果;还可以是结果生成装置13生成与查询序列相对应的搜索结果的同时,页面获取装置获取与该查询序列相对应的通用页面搜索结果。本领域技术人员应能理解上述获取页面搜索结果以及集成搜索结果的方式仅为举例,其他现有的或今后可能出现的获取页面搜索结果或者集成搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
图2为根据本发明另一个方面的方法流程图,示出用于多媒体资源搜索的过程。具体地,在步骤S1中,多媒体获取设备1获取用户的查询序列;随后,在步骤S2中,多媒体获取设备1根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;接着,在步骤S3中,多媒体获取设备1根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;随后,在步骤S4中,多媒体获取设备1将所述搜索结果提供至所述用户。在此,多媒体搜索设备1包括但不限于搜索引擎、与搜索引擎相连的网络设备;其中,网络设备包括但不限于网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合,在此,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解上述多媒体搜索设备以及网络设备仅为举例,其他现有的或今后可能出现的多媒体搜索设备或者网络设备如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
更具体地,在步骤S1中,多媒体获取设备1获取用户的查询序列。具体地,在步骤S1中,多媒体获取设备1通过诸如按照预先约定的通信协议接收用户经由用户设备发送的查询序列、或者从第三方设备提供的应用程序接口(API),获取用户向该第三方设备输入的查询序列。例如,假设多媒体搜索设备1为搜索引擎,在步骤S1中,多媒体获取设备1按照预先约定的通信协议,如http、https等通信协议,接收用户经由用户设备发送的查询序列,从而获取用户经由该用户设备输入的查询序列。又如,在步骤S1中,多媒体获取设备1根据第三方设备提供的应用程序接口(API),向该第三方设备发送获取用户输入该第三方设备的查询序列的请求,并接收该第三方设备基于该请求返回的查询序列。本领域技术人员应能理解上述获取查询序列的方式仅为举例,其他现有的或今后可能出现的获取查询序列的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
随后,在步骤S2中,多媒体获取设备1根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果。具体地,在步骤S2中,多媒体获取设备1根据其在步骤S1中获取的查询序列,在索引信息库中进行匹配查询,如该索引信息库包括媒体索引库,多媒体获取设备1直接在该媒体索引库中进行查询,即可获得与该查询序列相对应的多媒体搜索结果;如该索引信息库包括搜索索引库,在步骤S2中,多媒体获取设备1在该搜索索引库中查询获得指向多媒体资源页面的页面搜索结果,解析这些多媒体资源页面,提取相应的多媒体相关信息,如视频资源链接、音频下载链接、音频试听链接、图片缩略图等,以生成与该查询序列相对应的多媒体搜索结果;在此,媒体索引库包括查询关键词及其对应的多媒体资源信息,如视频资源链接、音频资源链接、图片缩略图等,搜索索引库包括查询关键词及其对应的页面链接。例如,在步骤S1中,多媒体获取设备1获取用户输入的查询序列为“喜羊羊与灰太狼”,索引信息库包括媒体索引库;在步骤S2中,该多媒体获取设备1根据该查询序列,在该媒体索引库中进行匹配查询,获取与该查询序列相对应的多媒体搜索结果,如《喜羊羊与灰太狼》的视频资源链接、《喜羊羊与灰太狼》的主题曲试听链接、《喜羊羊与灰太狼》的图片缩略图等。又如,在步骤S1中,多媒体获取设备1获取用户输入的查询序列仍为“喜羊羊与灰太狼”,索引信息库包括搜索索引库;在步骤S2中,该多媒体获取设备1根据该查询序列,在该搜索索引库中进行匹配查询,获取与该查询序列相对应的页面搜索结果,这些页面搜索结果所指向的页面中均包括与“喜羊羊与灰太狼”相关的多媒体资源,该多媒体获取设备1解析这些多媒体资源页面,从这些多媒体资源页面中提取相应的多媒体相关信息,如《喜羊羊与灰太狼》的视频资源链接、《喜羊羊与灰太狼》的主题曲试听链接、《喜羊羊与灰太狼》的图片缩略图等,以生成与该查询序列相对应的多媒体搜索结果。本领域技术人员应能理解上述获取多媒体搜索结果的方式仅为举例,其他现有的或今后可能出现的获取多媒体搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
接着,在步骤S3中,多媒体获取设备1根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果。具体地,在步骤S3中,多媒体获取设备1根据其在步骤S2中获取的多媒体搜索结果,以及该(等)多媒体搜索结果所对应的页面,通过如提取该(等)页面中的相关信息生成相应多媒体搜索结果的摘要、锚文本等方式,生成与用户输入查询序列相对应的搜索结果。例如,接上例,在步骤S2中,多媒体获取设备1获取与用户输入的查询序列相对应的多媒体搜索结果,如《喜羊羊与灰太狼》的视频资源链接、《喜羊羊与灰太狼》的主题曲试听链接、《喜羊羊与灰太狼》的图片缩略图等;在步骤S3中,该多媒体获取设备1根据这些多媒体搜索结果,以及从这些多媒体搜索结果所对应的页面中提取相关信息生成相应的摘要、锚文本等,将这些多媒体搜索结果及其对应的摘要、锚文本相结合,以生成与查询序列“喜羊羊与灰太狼”相对应的搜索结果。优选地,当第三方设备存储有多媒体资源相关信息时,在步骤S3中,多媒体获取设备1还基于多媒体搜索结果,向该第三方设备发送获取与这些多媒体搜索结果所对应的多媒体资源相关的信息的请求,并接收该第三方设备根据该请求返回的相应多媒体资源相关信息,将这些多媒体资源相关信息集成进最终生成的搜索结果的摘要;在此,多媒体资源相关信息包括与多媒体资源相关的信息,如多媒体资源的评论、内容信息等。本领域技术人员应能理解上述生成搜索结果的方式仅为举例,其他现有的或今后可能出现的生成搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
随后,在步骤S4中,多媒体获取设备1将所述搜索结果提供至所述用户。具体地,在步骤S4中,多媒体获取设备1将其在步骤S3中生成的与查询序列相对应的搜索结果,通过诸如页面技术,如ASP、JSP、PHP等,生成搜索结果页面,并推送至该用户的用户设备,该用户通过该用户设备浏览该搜索结果页面;或者将该搜索结果页面的URL发送至该用户的用户设备,由该用户经该用户设备点击该URL,从而进入相应页面以获得搜索结果;或者向该用户的用户设备逐条推送搜索结果。例如,在步骤S3中,多媒体获取设备1生成与查询序列相对应的搜索结果;在步骤S4中,该多媒体获取设备1根据ASP页面技术,由这些搜索结果生成相应的搜索结果页面,并将该页面推送至该用户的用户设备,该用户通过该用户设备浏览该搜索结果页面。本领域技术人员应能理解上述提供搜索结果的方式仅为举例,其他现有的或今后可能出现的提供搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,多媒体获取设备1在步骤S1、步骤S2、步骤S3和步骤S4中是持续不断地工作。具体地,在步骤S1中,多媒体获取设备1获取用户的查询序列;随后,在步骤S2中,多媒体获取设备1根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;接着,在步骤S3中,多媒体获取设备1根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;随后,在步骤S4中,多媒体获取设备1将所述搜索结果提供至所述用户。在此,本领域技术人员应理解“持续”是指多媒体获取设备1在步骤S1、步骤S2、步骤S3和步骤S4中分别按照设定的或实时调整的工作模式要求进行查询序列的获取、多媒体搜索结果的获取,搜索结果的生成以及搜索结果的提供,直至多媒体搜索设备1在较长时间内停止获取用户输入的查询序列。
在一个优选实施例中(参照图2),索引信息库包括媒体索引库;在步骤S2中,多媒体获取设备1还根据所述查询序列,在所述媒体索引库中进行匹配查询,以获取所述多媒体搜索结果。以下参照图2对该优选实施例进行详细描述,其中,在步骤S1中,多媒体获取设备1获取用户的查询序列;在步骤S3中,该多媒体获取设备1根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;随后,在步骤S4中,该多媒体获取设备1将所述搜索结果提供至所述用户;其具体过程与前述参照图2所描述的实施例中多媒体获取设备1在步骤S1、步骤S3和步骤S4中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,索引信息库包括媒体索引库;在步骤S2中,多媒体获取设备1根据其在步骤S1中获取的用户查询序列,通过诸如对该查询序列或者对该查询序列切分获得的查询关键词在该媒体索引库中进行匹配查询,获取相应的多媒体搜索结果。在此,媒体索引库包括查询关键词及其对应的多媒体资源信息,如视频资源链接、音频资源链接、图片缩略图等。例如,索引信息库包括媒体索引库,在步骤S1中,多媒体获取设备1获取用户输入的查询序列为“喜羊羊与灰太狼”;在步骤S2中,该多媒体获取设备1根据该查询序列,在该媒体索引库中进行匹配查询,获取与该查询序列相对应的多媒体搜索结果,如《喜羊羊与灰太狼》的视频资源链接、《喜羊羊与灰太狼》的主题曲试听链接、《喜羊羊与灰太狼》的图片缩略图等。本领域技术人员应能理解上述获取多媒体搜索结果的方式仅为举例,其他现有的或今后可能出现的获取多媒体搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,该过程还包括步骤S5(未示出),在步骤S5中,多媒体搜索设备1从网络中抓取并解析网页,根据所述网页中包括多媒体资源的类型,从所述网页中提取与所述类型相对应的资源相关信息;根据所述资源相关信息,建立或者更新所述媒体索引库。具体地,在步骤S5中,多媒体搜索设备1通过网页抓取工具诸如网络蜘蛛(spider)、网络爬虫(crawler)等,从网络中抓取并解析网页,根据这些网页中包括多媒体资源的类型,如视频资源、音频资源、图片资源等,从这些网页中提取与该(等)类型相对应的资源相关信息,如与连续性视频资源相对应的剧集信息、与音频资源相对应的链接类型信息等,并根据该(等)资源相关信息,建立或者更新所述媒体索引库。例如,在步骤S5中,多媒体搜索设备1通过网页抓取工具如网络蜘蛛(spider)、网络爬虫(crawler)等,从网络中抓取网页,并解析该抓取到的网页中是否包含多媒体资源,如视频、音频、图片等多媒体资源,若该抓取到的网页中包含多媒体资源,则根据该多媒体资源的类型,从该网页中提取相应的资源相关信息,如该网页中包括视频资源,则提取该网页的URL、该视频资源的名称、时长、演员信息、描述信息等资源相关信息,若该网页中包括音频资源,则提取该网页的URL、该音频资源的链接类型信息,诸如试听链接、下载链接等;在步骤S5中,在媒体索引库尚未建立时,根据其提取的这些资源相关信息,建立媒体索引库,在媒体索引库建立后,根据其提取的这些资源相关信息,更新该媒体索引库。优选地,在步骤S5中,多媒体搜索设备1根据该媒体索引库向第三方设备提供的应用程序接口(API),接收含多媒体资源的第三方设备提供的多媒体资源链接及相关的描述信息,如标题、评论信息、人物信息、时间信息等,并根据这些多媒体资源链接及相关的描述信息更新该媒体索引库。本领域技术人员应能理解上述建立以及更新媒体索引库的方式仅为举例,其他现有的或今后可能出现的建立或者更新媒体索引库的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在另一个优选实施例中(参照图2),索引信息库包括搜索索引库;在步骤S2中,多媒体搜索设备1还根据所述查询序列,在所述搜索索引库中进行匹配查询,以获取与所述查询序列相对应的多媒体页面搜索结果,其中,所述多媒体页面搜索结果所对应的页面中包括与所述查询序列相对应的多媒体资源;提取所述多媒体资源的多媒体相关信息;根据所述多媒体相关信息,生成所述多媒体搜索结果。以下参照图2对该另一优选实施例进行详细描述,其中,在步骤S1中,多媒体搜索设备1获取用户的查询序列;在步骤S3中,该多媒体搜索设备1根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;随后,在步骤S4中,该多媒体搜索设备1将所述搜索结果提供至所述用户;其具体过程与前述参照图2所描述的实施例中多媒体获取设备1在步骤S1、步骤S3和步骤S4中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,索引信息库包括搜索索引库;在步骤S2中,多媒体搜索设备1获取多媒体搜索结果的方式为根据用户的查询序列,在该搜索索引库中进行匹配查询,以获得指向多媒体资源页面的页面搜索结果,解析这些多媒体资源页面,提取相应的多媒体相关信息,如视频资源链接、音频下载链接、音频试听链接、图片缩略图等,以生成与该查询序列相对应的多媒体搜索结果。在此,搜索索引库中包括查询关键词及其对应的页面链接等。例如,在步骤S1中,多媒体搜索设备1获取用户输入的查询序列仍为“喜羊羊与灰太狼”;索引信息库包括搜索索引库;在步骤S2中,多媒体搜索设备1根据该查询序列,在该搜索索引库中进行匹配查询,获取与该查询序列相对应的页面搜索结果,这些页面搜索结果所指向的页面中均包括与“喜羊羊与灰太狼”相关的多媒体资源,该多媒体搜索设备1解析这些多媒体资源页面,从这些多媒体资源页面中提取相应的多媒体相关信息,如《喜羊羊与灰太狼》的视频资源链接、《喜羊羊与灰太狼》的主题曲试听链接、《喜羊羊与灰太狼》的图片缩略图等,以生成与该查询序列相对应的多媒体搜索结果。本领域技术人员应能理解上述获取多媒体搜索结果的方式仅为举例,其他现有的或今后可能出现的获取多媒体搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在再一个优选实施例中(参照图2),该过程还包括步骤S6(未示出),在步骤S6中,多媒体搜索设备1根据所述查询序列,获取与所述查询序列相对应的需求类型信息;在步骤S2中,多媒体搜索设备1还根据所述查询序列,结合所述需求类型信息,在所述索引信息库中进行匹配查询,以获取所述多媒体搜索结果。以下参照图2对该再一优选实施例进行详细描述,其中,在步骤S1中,多媒体搜索设备1获取用户的查询序列;在步骤S3中,该多媒体搜索设备1根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;随后,在步骤S4中,该多媒体搜索设备1将所述搜索结果提供至所述用户;其具体过程与前述参照图2所描述的实施例中多媒体获取设备1在步骤S1、步骤S3和步骤S4中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,在步骤S6中,多媒体搜索设备1根据其在步骤S1中获取的查询序列,获取与该查询序列相对应的需求类型信息;在步骤S2中,多媒体搜索设备1还根据该查询序列,结合需求获取装置获取的需求类型信息,在索引信息库中进行匹配查询,以获取与该查询序列相对应的多媒体搜索结果。在此,多媒体搜索设备1获取与查询序列相对应的需求类型信息的方式包括但不限于:1)根据对查询序列的语义分析,获取与该查询序列相对应的需求类型信息;2)根据用户查询历史记录,获取与该查询序列相对应的需求类型信息,在此,用户查询历史记录包括但不限于用户历史输入的查询序列、用户对搜索结果的浏览记录、及用户历史输入的查询序列与用户浏览的搜索结果的映射关系等,其中,用户包括当前用户和统计用户;3)对查询序列进行分词处理,得到相应的查询关键词,在预设特征词库中对这(些)查询关键词进行匹配查询,以获得相应的需求类型信息,在此,预设特征词库包括与用户查询需求类型相关的特征词,如“在线观看”、“下载”、“mp3”等。
例如,在步骤S1中,多媒体搜索设备1获取的用户输入的查询序列为“想看喜羊羊与灰太狼”;在步骤S6中,该多媒体搜索设备1对该查询序列进行语义分析后,获得相应的查询关键词“喜羊羊与灰太狼”和“视频”,由此得到其相应的需求类型信息为视频需求;在步骤S2中,该多媒体搜索设备1根据该查询序列,结合该视频需求,在索引信息库中进行匹配查询,获取相应的视频搜索结果。
又如,假设查询序列为“喜羊羊与灰太狼”,在步骤S6中,多媒体搜索设备1根据用户查询历史记录,如用户历史输入的查询序列“喜羊羊与灰太狼”,及其对应的浏览记录,如《喜羊羊与灰太狼》视频,获得该查询序列所对应的需求类型信息为视频需求;在步骤S2中,该多媒体搜索设备1根据该查询序列,结合该视频需求,在索引信息库中进行匹配查询,获取相应的视频搜索结果。
再如,假设查询序列为“喜羊羊与灰太狼在线观看”,在步骤S6中,多媒体搜索设备1对该查询序列进行分词处理后,得到查询关键词“喜羊羊与灰太狼”和“在线观看”,在预设特征词库对这些查询关键词进行匹配查询,获得相应的特征词“在线观看”及其对应的需求类型信息,如视频需求;在步骤S2中,该多媒体搜索设备1根据该查询序列,结合该需求类型信息,在索引信息库中进行匹配查询,获取相应的视频搜索结果。
本领域技术人员应能理解上述获取需求类型信息的方式以及获取多媒体搜索结果的方式仅为举例,其他现有的或今后可能出现的获取需求类型信息的方式或者获取多媒体搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,在步骤S6中,多媒体搜索设备1还根据所述查询序列,在预设特征词库中进行匹配查询,以获得所述需求类型信息。具体地,在步骤S6中,多媒体搜索设备1通过对其在步骤S1中获得的查询序列进行分词,得到相应的查询关键词,在预设特征词库中对该(等)查询关键词进行匹配查询,以获得该查询序列所对应的需求类型信息。在此,预设特征词库包括与用户查询需求类型相关的特征词,如“在线观看、下载、mp3”等。例如,假设查询序列为“喜羊羊与灰太狼在线观看”,在步骤S6中,多媒体搜索设备1对该查询序列进行分词处理后,得到查询关键词“喜羊羊与灰太狼”和“在线观看”,在预设特征词库对这些查询关键词进行匹配查询,得到相应的特征词“在线观看”及其对应的需求类型信息,如视频需求。优选地,预设特征词库还包括与多媒体资源相对应的专有名词,以及这些专有名词所对应的资源类型,如“里约大冒险”,其对应的资源类型为视频,还可以进一步细分为动画、电影;在此,专有名词及其对应的资源类型的来源包括对特定视频网站、特定音乐网站等知名多媒体网站的资源挖掘,对从这些多媒体网站获取的专有名词按照来源网站的属性进行分类,以获得这些专有名词所对应的资源类型;例如,对“百度奇艺网”进行资源挖掘,获得专有名词“里约大冒险”,其对应的资源类型为视频,据此当用户输入查询序列“里约大冒险”时,在步骤S6中,多媒体搜索设备1在该预设特征词库中对该查询序列进行匹配查询,获得专有名词“里约大冒险”及其对应的资源类型“视频”,该资源类型即为该查询序列所对应的需求类型信息。本领域技术人员应能理解上述获取需求类型信息的方式仅为举例,其他现有的或今后可能出现的获取需求类型信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在又一个优选实施例中(参照图2),该过程还包括步骤S7(未示出),在步骤S7中,多媒体搜索设备1根据所述多媒体搜索结果的查询相关属性,筛选所述多媒体搜索结果,以获得筛选后的多媒体搜索结果;在步骤S3中,多媒体搜索设备1根据所述筛选后的多媒体搜索结果,以及所述筛选后的多媒体搜索结果所对应的页面,生成所述搜索结果。以下参照图2对该又一优选实施例进行详细描述,其中,在步骤S1中,多媒体搜索设备1获取用户的查询序列;随后,在步骤S2中,该多媒体搜索设备1根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;在步骤S4中,该多媒体搜索设备1将所述搜索结果提供至所述用户;其具体过程与前述参照图2所描述的实施例中多媒体获取设备1在步骤S1、步骤S2和步骤S4中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,在步骤S7中,多媒体搜索设备1根据其在步骤S2中获取的多媒体搜索结果的查询相关属性,诸如多媒体搜索结果的权威度、多媒体搜索结果的相关度、多媒体搜索结果的新鲜度等,筛选该(等)多媒体搜索结果,以获得筛选后的多媒体搜索结果;在步骤S3中,该多媒体搜索设备1根据该(等)筛选后的多媒体搜索结果,以及该(等)筛选后的多媒体搜索结果所对应的页面,生成与该查询序列相对应的搜索结果。在此,多媒体搜索结果的查询相关属性包括与多媒体搜索结果的查询选取相关的属性,如多媒体搜索结果的权威度、多媒体搜索结果的相关度、多媒体搜索结果的新鲜度等;这些查询相关属性可以由索引信息库获取,如在将多媒体资源相关信息加入索引信息库库时,即为其预设相应的查询相关属性,也可以在基于查询序列获取相应的多媒体搜索结果时,对这些多媒体搜索结果实时计算对应的查询相关属性。例如,在步骤S1中,多媒体搜索设备1获取用户的查询序列;在步骤S2中,该多媒体搜索设备1根据该查询序列,从索引信息库中获取相应的多媒体搜索结果;在步骤S7中,该多媒体搜索设备1根据这些多媒体搜索结果的新鲜度,如每一个多媒体搜索结果的最近更新时间,对这些多媒体搜索结果进行筛选,以获得筛选后最新的多媒体搜索结果;在步骤S3中,该多媒体搜索设备1根据这些筛选后最新的多媒体搜索结果,以及这些最新的多媒体搜索结果所对应的页面,生成与该查询序列相对应的搜索结果。本领域技术人员应能理解上述筛选多媒体资源搜索结果的方式仅为举例,其他现有的或今后可能出现的筛选多媒体资源搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述多媒体搜索结果的查询相关属性包括但不限于,以下至少任一项:
1)所述多媒体搜索结果的权威度;
2)所述多媒体搜索结果的相关度;
3)所述多媒体搜索结果的新鲜度。
具体地,1)多媒体搜索结果的权威度,该权威度根据多媒体搜索结果所对应页面的权威度、多媒体搜索结果所对应站点的权威度等确定;2)多媒体搜索结果的相关度,该相关度根据多媒体搜索结果与查询序列的相关度、多媒体搜索结果与用户属性的相关度等确定,其中,用户属性包括用户的母语、用户所在的位置、用户偏好等与用户自身特性相关的信息。3)多媒体搜索结果的新鲜度,该新鲜度根据多媒体搜索结果所指向页面中多媒体资源的更新时间、多媒体搜索结果所指向页面的更新时间等确定。本领域技术人员应能理解上述各项查询相关属性不仅可以单独用于多媒体搜索设备1筛选多媒体搜索结果,还可以将其中多项相结合用于多媒体搜索设备1筛选多媒体搜索结果。例如,假设多媒体搜索结果的权威度的筛选权重为0.3,多媒体搜索结果的相关度的筛选权重为0.5,多媒体搜索结果的新鲜度的筛选权重为0.2,在步骤S7中,多媒体搜索设备1对这些多媒体搜索结果的查询相关属性进行加权,以筛选该多媒体搜索设备1在步骤S2中获取的多媒体搜索结果,并将筛选后的多媒体搜索结果提供至该多媒体搜索设备1,以供该多媒体搜索设备1在步骤S3中生成与用户查询序列相对应的搜索结果。本领域技术人员还应能理解上述查询相关属性仅为举例,其他现有的或今后可能出现的查询相关属性如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在还一个优选实施例中(参照图2),该过程还包括步骤S8(未示出),在步骤S8中,多媒体搜索设备1根据所述多媒体搜索结果所对应的多媒体资源的资源属性,对所述多媒体搜索结果进行预处理,以获得预处理后的多媒体搜索结果;在步骤S3中,多媒体搜索设备1还根据所述预处理后的多媒体搜索结果,以及所述预处理后的多媒体搜索结果所对应的页面,生成所述搜索结果。以下参照图2对该还一优选实施例进行详细描述,其中,在步骤S1中,多媒体搜索设备1获取用户的查询序列;随后,在步骤S2中,该多媒体搜索设备1根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;在步骤S4中,该多媒体搜索设备1将所述搜索结果提供至所述用户;其具体过程与前述参照图2所描述的实施例中多媒体获取设备1在步骤S1、步骤S2和步骤S4中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,在步骤S8中,多媒体搜索设备1根据其在步骤S2中获取的多媒体搜索结果所对应多媒体资源的资源属性,诸如视频资源的连续性、音频资源的应用类型和图片资源的分类信息等,对多媒体搜索结果进行预处理,诸如对连续性的视频搜索结果做序列化处理、对音频搜索结果按相应音频资源的应用类型做链接归一化处理、对图片搜索结果按相应图片资源的分类信息做分类处理等,以获得预处理后的多媒体搜索结果;在步骤S3中,该多媒体搜索设备1还根据该(等)预处理后的多媒体搜索结果,以及该(等)预处理后的多媒体搜索结果所对应的页面,生成相应的搜索结果。例如,根据用户的查询序列“Harry’s law”,在步骤S2中,多媒体搜索设备1获取多媒体搜索结果为“Harry’s law”的视频资源链接;在步骤S8中,该多媒体搜索设备1根据这些视频资源链接所对应视频资源的资源属性,如视频资源的连续性,对这些视频资源链接进行序列化处理,如将这些视频资源链接按其所对应的集次顺序,进行排列整合,如将第一集的链接、第二集的链接等依次排列,并整合为一个视频搜索结果;在步骤S3中,该多媒体搜索设备1提取该序列化处理后的视频搜索结果所对应页面中的共同信息以生成摘要、锚文本等,如“Harry’s law”的剧情简介、演员信息等,再根据该序列化处理后的视频搜索结果、摘要和锚文本生成与查询序列“Harry’s law”相对应的搜索结果。本领域技术人员应能理解上述对多媒体搜索结果的预处理操作以及生成搜索结果的方式仅为举例,其他现有的或今后可能出现的对多媒体搜索结果的预处理操作或者生成搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,所述多媒体资源的资源属性以及与其相对应的预处理操作包括以下至少任一项:
1)根据视频资源的连续性,对视频搜索结果做序列化处理;
2)根据音频资源的应用类型,对音频搜索结果做链接归一化处理;
3)根据图片资源的分类信息,对图片搜索结果做分类处理。
具体地,1)根据视频资源的连续性,对视频搜索结果做序列化处理,包括多媒体搜索设备1根据其在步骤S2中获取的视频搜索结果所对应的视频资源的连续性,对该(等)视频搜索结果按照其对应的顺序进行序列化处理。例如,假设视频搜索结果所对应的视频资源为连续剧,则在步骤S8中,多媒体搜索设备1按照该连续剧的集次顺序进行序列化处理。又如,假设视频搜索结果所对应的视频资源为包括多个分段的电影,则在步骤S8中,多媒体搜索设备1按照该电影的每个分段所对应的时间顺序,对这些分段进行序列化处理。2)根据音频资源的应用类型,对音频搜索结果做链接归一化处理,包括多媒体搜索设备1根据其在步骤S2中获取的音频搜索结果所对应的音频资源的应用类型,对该(等)音频搜索结果按照该应用类型进行链接归一化处理。例如,假设用户的查询序列为“那些花儿”,在步骤S2中,多媒体搜索设备1获取相应的音频搜索结果,其对应音频资源的应用类型包括下载、试听、歌词、铃声等;在步骤S8中,该多媒体搜索设备1根据这些应用类型,对这些音频搜索结果按照相应的下载链接、试听链接、歌词链接、铃声链接等进行归类,并对这些链接进行链接归一化处理,如将各种链接类型整合入一个音频搜索结果;在此,该链接归一化处理后的音频搜索结果,其中的每个链接类型所对应的链接可以指向一个具体的音频资源页面,也可以指向一个该链接类型所对应的多个音频资源链接的列表页,如在一个链接归一化处理后的音频搜索结果中,当其中的试听链接指向一个具体的音频资源试听页面时,用户点击该试听链接,即可直接试听相应的音频资源,当该试听链接指向其对应的包括多个音频资源试听链接的列表页时,当用户点击该试听链接时,即可获得一个音频资源试听链接列表,用户通过点击该列表中的具体试听链接,试听相应的音频资源。3)根据图片资源的分类信息,对图片搜索结果做分类处理,包括多媒体搜索设备1根据其在步骤S2中获取的图片搜索结果所对应的图片资源的分类信息,对该(等)图片搜索结果按照其相应的分类信息进行分类处理。例如,假设用户的查询序列为“刘德华”,在步骤S2中,多媒体搜索设备1获取相应的图片搜索结果为多个刘德华的图片缩略图;在步骤S8中,该多媒体搜索设备1按照这些图片缩略图的分类信息,如电影图片、音乐专辑图片等,对这些图片缩略图进行分类处理。本领域技术人员应能理解上述多媒体资源的资源属性以及与其相对应的预处理操作仅为举例,其他现有的或今后可能出现的多媒体资源的资源属性以及与其相对应的预处理操作的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在另一个优选实施例中(参照图2),该过程还包括步骤S9(未示出),在步骤S9中,多媒体搜索设备1获取与所述查询序列相对应的通用页面搜索结果;在步骤S4中,多媒体搜索设备1还将所述搜索结果与所述通用页面搜索结果集成,以获得集成后的搜索结果;将所述集成后的搜索结果提供至所述用户。以下参照图2对该另一优选实施例进行详细描述,其中,在步骤S1中,多媒体搜索设备1获取用户的查询序列;随后,在步骤S2中,该多媒体搜索设备1根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;接着,在步骤S3中,该多媒体搜索设备1根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;其具体过程与前述参照图2所描述的实施例中多媒体获取设备1在步骤S1、步骤S2和步骤S3中所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。
具体地,在步骤S9中,多媒体搜索设备1通过诸如根据用户的查询序列在搜索索引库中进行匹配查询,以获得与该查询序列相对应的通用页面搜索结果,或者从搜索引擎或具有页面搜索能力的第三方设备处获取与用户的查询序列相对应的通用页面搜索结果;在步骤S4中,多媒体搜索设备1还将其在步骤S3中生成的搜索结果与该(等)通用页面搜索结果集成,以获得集成后的搜索结果,并将集成后的搜索结果提供给该用户。在此,通用页面搜索结果包括基于用户的查询序列从搜索索引库中获得的所有页面搜索结果,包括多媒体页面搜索结果和普通页面搜索结果;其中,多媒体搜索设备1集成其在步骤S3中生成的搜索结果与通用页面搜索结果的方式包括但不限于:1)根据多媒体搜索设备1在步骤S3中生成的搜索结果所对应的URL和通用页面搜索结果所对应的URL,当两者的URL相同时,则用该多媒体搜索设备1在步骤S3中生成的搜索结果替代相应的通用页面搜索结果,以实现该多媒体搜索设备1在步骤S3中生成的搜索结果与通用页面搜索结果的集成;2)获取通用页面搜索结果中的多媒体页面搜索结果,根据这些多媒体页面搜索结果所对应的URL,查找相应的多媒体搜索设备1在步骤S3中生成的搜索结果,并用该查找到的搜索结果替代通用页面搜索结果中的相应多媒体页面搜索结果,以实现该多媒体搜索设备1在步骤S3中生成的搜索结果与通用页面搜索结果的集成;3)将多媒体搜索设备1在步骤S3中生成的搜索结果与通用页面搜索结果合并,如将多媒体搜索结果置于搜索结果页面的上半部分,将通用页面搜索结果置于搜索结果页面的下半部分,或者其他的合并方式。例如,在步骤S1中,多媒体搜索设备1获取的查询序列为“喜羊羊与灰太狼”;在步骤S9中,该多媒体搜索设备1根据该查询序列在搜索索引库中进行匹配查询,获取与“喜羊羊与灰太狼”相对应的通用页面搜索结果;在步骤S2中,该多媒体搜索设备1获取相应的多媒体搜索结果;在步骤S3中,该多媒体搜索设备1根据这些多媒体搜索结果生成相应的搜索结果;在步骤S4中,该多媒体搜索设备1通过将这些搜索结果替代对应相同URL的通用页面搜索结果,集成这些搜索结果与通用页面搜索结果,以获得集成后的搜索结果,并生成搜索结果页面,将该搜索结果页面推送至用户设备,用户经由该用户设备浏览该搜索结果页面。
在此,本领域技术人员应能理解,多媒体搜索设备1在步骤S3中生成与查询序列相对应的搜索结果的操作与多媒体搜索设备1在步骤S9中获取与查询序列相对应的通用页面搜索结果的操作,在执行顺序上不分先后,多媒体搜索设备1可以先执行步骤S3,再执行步骤S9;多媒体搜索设备1也可以先执行步骤S9,再执行步骤S3;多媒体搜索设备1还可以同时执行步骤S3和步骤S9。本领域技术人员还应能理解上述获取页面搜索结果以及集成搜索结果的方式仅为举例,其他现有的或今后可能出现的获取页面搜索结果或者集成搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (22)

1.一种计算机实现的用于多媒体资源搜索的方法,其中,该方法包括以下步骤:
a获取用户的查询序列;
b根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;
c根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;
d将所述搜索结果提供至所述用户。
2.根据权利要求1所述的方法,其中,所述索引信息库包括媒体索引库;
其中,所述步骤b还包括:
-根据所述查询序列,在所述媒体索引库中进行匹配查询,以获取所述多媒体搜索结果。
3.根据权利要求2所述的方法,其中,该方法还包括:
-从网络中抓取并解析网页,根据所述网页中包括多媒体资源的类型,从所述网页中提取与所述类型相对应的资源相关信息;
-根据所述资源相关信息,建立或者更新所述媒体索引库。
4.根据权利要求1所述的方法,其中,所述索引信息库包括搜索索引库;
其中,所述步骤b还包括:
-根据所述查询序列,在所述搜索索引库中进行匹配查询,以获取与所述查询序列相对应的多媒体页面搜索结果,其中,所述多媒体页面搜索结果所对应的页面中包括与所述查询序列相对应的多媒体资源;
-提取所述多媒体资源的多媒体相关信息;
-根据所述多媒体相关信息,生成所述多媒体搜索结果。
5.根据权利要求1至4中任一项所述的方法,其中,该方法还包括:
x根据所述查询序列,获取与所述查询序列相对应的需求类型信息;
其中,所述步骤b还包括:
-根据所述查询序列,结合所述需求类型信息,在所述索引信息库中进行匹配查询,以获取所述多媒体搜索结果。
6.根据权利要求5所述的方法,其中,所述步骤x还包括:
-根据所述查询序列,在预设特征词库中进行匹配查询,以获得所述需求类型信息。
7.根据权利要求1至6中任一项所述的方法,其中,该方法还包括:
-根据所述多媒体搜索结果的查询相关属性,筛选所述多媒体搜索结果,以获得筛选后的多媒体搜索结果;
其中,所述步骤c还包括:
-根据所述筛选后的多媒体搜索结果,以及所述筛选后的多媒体搜索结果所对应的页面,生成所述搜索结果。
8.根据权利要求7所述的方法,其中,所述多媒体搜索结果的查询相关属性包括以下至少任一项:
-所述多媒体搜索结果的权威度;
-所述多媒体搜索结果的相关度;
-所述多媒体搜索结果的新鲜度。
9.根据权利要求1至8中任一项所述的方法,其中,该方法还包括:
-根据所述多媒体搜索结果所对应的多媒体资源的资源属性,对所述多媒体搜索结果进行预处理,以获得预处理后的多媒体搜索结果;
其中,所述步骤c还包括:
-根据所述预处理后的多媒体搜索结果,以及所述预处理后的多媒体搜索结果所对应的页面,生成所述搜索结果。
10.根据权利要求9所述的方法,其中,所述多媒体资源的资源属性以及与其相对应的预处理操作包括以下至少任一项:
-根据视频资源的连续性,对视频搜索结果做序列化处理;
-根据音频资源的应用类型,对音频搜索结果做链接归一化处理;
-根据图片资源的分类信息,对图片搜索结果做分类处理。
11.根据权利要求1至10中任一项所述的方法,其中,该方法还包括:
-获取与所述查询序列相对应的通用页面搜索结果;
其中,所述步骤d还包括:
-将所述搜索结果与所述通用页面搜索结果集成,以获得集成后的搜索结果;
-将所述集成后的搜索结果提供至所述用户。
12.一种用于获取多媒体资源搜索的设备,其中,该设备包括:
查询获取装置,用于获取用户的查询序列;
多媒体获取装置,用于根据所述查询序列,在索引信息库中进行匹配查询,以获取与所述查询序列相对应的多媒体搜索结果;
结果生成装置,用于根据所述多媒体搜索结果,以及所述多媒体搜索结果所对应的页面,生成与所述查询序列相对应的搜索结果;
提供装置,用于将所述搜索结果提供至所述用户。
13.根据权利要求12所述的设备,其中,所述索引信息库包括媒体索引库;
其中,所述多媒体获取装置还用于:
-根据所述查询序列,在所述媒体索引库中进行匹配查询,以获取所述多媒体搜索结果。
14.根据权利要求13所述的设备,其中,该设备还包括更新装置,所述更新装置用于:
-从网络中抓取并解析网页,根据所述网页中包括多媒体资源的类型,从所述网页中提取与所述类型相对应的资源相关信息;
-根据所述资源相关信息,建立或者更新所述媒体索引库。
15.根据权利要求14所述的设备,其中,所述索引信息库包括搜索索引库;
其中,所述多媒体获取装置还用于:
-根据所述查询序列,在所述搜索索引库中进行匹配查询,以获取与所述查询序列相对应的多媒体页面搜索结果,其中,所述多媒体页面搜索结果所对应的页面中包括与所述查询序列相对应的多媒体资源;
-提取所述多媒体资源的多媒体相关信息;
-根据所述多媒体相关信息,生成所述多媒体搜索结果。
16.根据权利要求12至15中任一项所述的设备,其中,该设备还包括:
需求获取装置,用于根据所述查询序列,获取与所述查询序列相对应的需求类型信息;
其中,所述多媒体获取装置还用于:
-根据所述查询序列,结合所述需求类型信息,在所述索引信息库中进行匹配查询,以获取所述多媒体搜索结果。
17.根据权利要求16所述的设备,其中,所述需求获取装置还用于:
-根据所述查询序列,在预设特征词库中进行匹配查询,以获得所述需求类型信息。
18.根据权利要求12至17中任一项所述的设备,其中,该设备还包括:
筛选装置,用于根据所述多媒体搜索结果的查询相关属性,筛选所述多媒体搜索结果,以获得筛选后的多媒体搜索结果;
其中,所述结果生成装置还用于:
-根据所述筛选后的多媒体搜索结果,以及所述筛选后的多媒体搜索结果所对应的页面,生成所述搜索结果。
19.根据权利要求18所述的设备,其中,所述多媒体搜索结果的查询相关属性包括以下至少任一项:
-所述多媒体搜索结果的权威度;
-所述多媒体搜索结果的相关度;
-所述多媒体搜索结果的新鲜度。
20.根据权利要求12至19中任一项所述的设备,其中,该设备还包括:
预处理装置,用于根据所述多媒体搜索结果所对应的多媒体资源的资源属性,对所述多媒体搜索结果进行预处理,以获得预处理后的多媒体搜索结果;
其中,所述结果生成装置还用于:
-根据所述预处理后的多媒体搜索结果,以及所述预处理后的多媒体搜索结果所对应的页面,生成所述搜索结果。
21.根据权利要求20所述的设备,其中,所述多媒体资源的资源属性以及与其相对应的预处理操作包括以下至少任一项:
-根据视频资源的连续性,对视频搜索结果做序列化处理;
-根据音频资源的应用类型,对音频搜索结果做链接归一化处理;
-根据图片资源的分类信息,对图片搜索结果做分类处理。
22.根据权利要求12至21中任一项所述的设备,其中,该设备还包括:
页面获取装置,用于获取与所述查询序列相对应的通用页面搜索结果;
其中,所述提供装置还用于:
-将所述搜索结果与所述通用页面搜索结果集成,以获得集成后的搜索结果;
-将所述集成后的搜索结果提供至所述用户。
CN 201110090824 2011-04-12 2011-04-12 一种用于多媒体资源搜索的方法与设备 Pending CN102184185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110090824 CN102184185A (zh) 2011-04-12 2011-04-12 一种用于多媒体资源搜索的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110090824 CN102184185A (zh) 2011-04-12 2011-04-12 一种用于多媒体资源搜索的方法与设备

Publications (1)

Publication Number Publication Date
CN102184185A true CN102184185A (zh) 2011-09-14

Family

ID=44570362

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110090824 Pending CN102184185A (zh) 2011-04-12 2011-04-12 一种用于多媒体资源搜索的方法与设备

Country Status (1)

Country Link
CN (1) CN102184185A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402603A (zh) * 2011-11-18 2012-04-04 百度在线网络技术(北京)有限公司 一种用于提供缩略图所对应的图片摘要信息的方法与设备
CN102521258A (zh) * 2011-11-18 2012-06-27 百度在线网络技术(北京)有限公司 一种用于提供壁纸图片的方法与设备
CN102521344A (zh) * 2011-12-09 2012-06-27 上海聚力传媒技术有限公司 一种提供与访问页面对应的多媒体访问信息的方法与设备
CN102521257A (zh) * 2011-11-18 2012-06-27 百度在线网络技术(北京)有限公司 一种用于根据缩略图提供对应的在线图片的方法与设备
CN103136261A (zh) * 2011-11-30 2013-06-05 阿里巴巴集团控股有限公司 页面元素搜索显示方法及装置
CN103745017A (zh) * 2014-02-10 2014-04-23 北界创想(北京)软件有限公司 信息抓取装置和方法
CN103761230A (zh) * 2013-10-17 2014-04-30 北京奇虎科技有限公司 一种搜索引擎抓取网页媒体内容信息的方法和装置
CN103914545A (zh) * 2014-04-08 2014-07-09 百度在线网络技术(北京)有限公司 搜索展现方法及装置
CN104462259A (zh) * 2014-11-21 2015-03-25 百度在线网络技术(北京)有限公司 一种用于提供时效性图片搜索结果的方法与设备
CN104809115A (zh) * 2014-01-24 2015-07-29 贝壳网际(北京)安全技术有限公司 一种搜索方法及终端设备
CN105260459A (zh) * 2015-10-13 2016-01-20 百度在线网络技术(北京)有限公司 搜索方法和装置
CN105550286A (zh) * 2015-12-10 2016-05-04 无锡天脉聚源传媒科技有限公司 一种基于搜索结果的分页处理方法和装置
WO2016065987A1 (zh) * 2014-10-27 2016-05-06 北京百度网讯科技有限公司 多媒体内容的提供方法和装置
CN105812846A (zh) * 2014-12-30 2016-07-27 Tcl集团股份有限公司 网络视频的获取方法及装置
CN105955991A (zh) * 2016-04-19 2016-09-21 乐视控股(北京)有限公司 一种搜索结果聚合及定位的方法和装置
CN106156057A (zh) * 2015-03-27 2016-11-23 北京风行在线技术有限公司 一种查询视频数据结果的方法和设备
WO2017028624A1 (zh) * 2015-08-20 2017-02-23 乐视控股(北京)有限公司 一种资源的处理方法及装置
CN106777287A (zh) * 2016-12-29 2017-05-31 上海聚力传媒技术有限公司 一种用于提供视频搜索结果的方法与设备
CN109460481A (zh) * 2018-11-13 2019-03-12 北京中网易企秀科技有限公司 一种多媒体文件生成方法及装置
CN114003739A (zh) * 2021-10-29 2022-02-01 北京达佳互联信息技术有限公司 一种多媒体资源的处理方法及装置
CN114691906A (zh) * 2020-12-29 2022-07-01 北京达佳互联信息技术有限公司 媒体内容的处理方法、装置、电子设备及存储介质
WO2024171284A1 (ja) * 2023-02-14 2024-08-22 三菱電機株式会社 情報提供装置、情報提供方法、および情報受信装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004095318A1 (en) * 2003-04-16 2004-11-04 David Ackerman An internet system for authenticating membership profile information
CN101382960A (zh) * 2008-10-30 2009-03-11 北京搜狗科技发展有限公司 多媒体文件搜索方法和装置
CN101847161A (zh) * 2010-06-02 2010-09-29 苏州搜图网络技术有限公司 搜索网页的方法和建立数据库的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004095318A1 (en) * 2003-04-16 2004-11-04 David Ackerman An internet system for authenticating membership profile information
CN101382960A (zh) * 2008-10-30 2009-03-11 北京搜狗科技发展有限公司 多媒体文件搜索方法和装置
CN101847161A (zh) * 2010-06-02 2010-09-29 苏州搜图网络技术有限公司 搜索网页的方法和建立数据库的方法

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521257B (zh) * 2011-11-18 2015-05-13 百度在线网络技术(北京)有限公司 一种用于根据缩略图提供对应的在线图片的方法与设备
CN102521258A (zh) * 2011-11-18 2012-06-27 百度在线网络技术(北京)有限公司 一种用于提供壁纸图片的方法与设备
CN102521257A (zh) * 2011-11-18 2012-06-27 百度在线网络技术(北京)有限公司 一种用于根据缩略图提供对应的在线图片的方法与设备
CN102402603A (zh) * 2011-11-18 2012-04-04 百度在线网络技术(北京)有限公司 一种用于提供缩略图所对应的图片摘要信息的方法与设备
CN103136261A (zh) * 2011-11-30 2013-06-05 阿里巴巴集团控股有限公司 页面元素搜索显示方法及装置
CN102521344A (zh) * 2011-12-09 2012-06-27 上海聚力传媒技术有限公司 一种提供与访问页面对应的多媒体访问信息的方法与设备
CN103761230A (zh) * 2013-10-17 2014-04-30 北京奇虎科技有限公司 一种搜索引擎抓取网页媒体内容信息的方法和装置
CN104809115A (zh) * 2014-01-24 2015-07-29 贝壳网际(北京)安全技术有限公司 一种搜索方法及终端设备
CN103745017A (zh) * 2014-02-10 2014-04-23 北界创想(北京)软件有限公司 信息抓取装置和方法
CN103745017B (zh) * 2014-02-10 2017-06-16 北界创想(北京)软件有限公司 信息抓取装置和方法
CN103914545A (zh) * 2014-04-08 2014-07-09 百度在线网络技术(北京)有限公司 搜索展现方法及装置
CN103914545B (zh) * 2014-04-08 2018-09-07 百度在线网络技术(北京)有限公司 搜索展现方法及装置
WO2016065987A1 (zh) * 2014-10-27 2016-05-06 北京百度网讯科技有限公司 多媒体内容的提供方法和装置
CN104462259A (zh) * 2014-11-21 2015-03-25 百度在线网络技术(北京)有限公司 一种用于提供时效性图片搜索结果的方法与设备
CN105812846A (zh) * 2014-12-30 2016-07-27 Tcl集团股份有限公司 网络视频的获取方法及装置
CN105812846B (zh) * 2014-12-30 2019-02-01 Tcl集团股份有限公司 网络视频的获取方法及装置
CN106156057A (zh) * 2015-03-27 2016-11-23 北京风行在线技术有限公司 一种查询视频数据结果的方法和设备
WO2017028624A1 (zh) * 2015-08-20 2017-02-23 乐视控股(北京)有限公司 一种资源的处理方法及装置
CN105260459B (zh) * 2015-10-13 2019-10-15 百度在线网络技术(北京)有限公司 搜索方法和装置
CN105260459A (zh) * 2015-10-13 2016-01-20 百度在线网络技术(北京)有限公司 搜索方法和装置
CN105550286A (zh) * 2015-12-10 2016-05-04 无锡天脉聚源传媒科技有限公司 一种基于搜索结果的分页处理方法和装置
CN105955991A (zh) * 2016-04-19 2016-09-21 乐视控股(北京)有限公司 一种搜索结果聚合及定位的方法和装置
CN106777287A (zh) * 2016-12-29 2017-05-31 上海聚力传媒技术有限公司 一种用于提供视频搜索结果的方法与设备
CN106777287B (zh) * 2016-12-29 2020-07-31 上海聚力传媒技术有限公司 一种用于提供视频搜索结果的方法与设备
CN109460481A (zh) * 2018-11-13 2019-03-12 北京中网易企秀科技有限公司 一种多媒体文件生成方法及装置
CN114691906A (zh) * 2020-12-29 2022-07-01 北京达佳互联信息技术有限公司 媒体内容的处理方法、装置、电子设备及存储介质
CN114003739A (zh) * 2021-10-29 2022-02-01 北京达佳互联信息技术有限公司 一种多媒体资源的处理方法及装置
WO2024171284A1 (ja) * 2023-02-14 2024-08-22 三菱電機株式会社 情報提供装置、情報提供方法、および情報受信装置

Similar Documents

Publication Publication Date Title
CN102184185A (zh) 一种用于多媒体资源搜索的方法与设备
CN107145496B (zh) 基于关键词将图像与内容项目匹配的方法
CN102043833B (zh) 一种基于查询词进行搜索的方法和搜索装置
US11797626B2 (en) Search result filters from resource content
CN102368262B (zh) 一种提供与查询序列相对应的搜索建议的方法与设备
CN102346778B (zh) 一种用于提供搜索结果的方法与设备
US8745039B2 (en) Method and system for user guided search navigation
KR101242917B1 (ko) 다수의 검색 엔진들에 걸쳐서 구현되는 연합 검색
CN102420813B (zh) 一种根据用户设备的终端属性提供目标信息的方法与设备
JP2010067175A (ja) ハイブリッド型コンテンツ推薦サーバ、推薦システムおよび推薦方法
US20090094210A1 (en) Intelligently sorted search results
KR20100075545A (ko) 검색 결과 페이지에 인터랙티브 요소를 포함하는 시스템 및 그 방법
CN103221951A (zh) 预测查询建议高速缓存
CN107463592B (zh) 用于将内容项目与图像匹配的方法、设备和数据处理系统
CN102169501A (zh) 基于搜索结果对应文档的类型信息生成摘要的方法与设备
CN104503988B (zh) 搜索方法及装置
CN102402589A (zh) 一种提供与搜索请求相关的参考搜索信息的方法与设备
CN102880609A (zh) 一种用于提供与查询序列相对应的搜索结果的设备和方法
CN107145497B (zh) 基于图像和内容的元数据选择与内容匹配的图像的方法
CN103279513A (zh) 产生内容标签的方法、提供多媒体内容信息的方法及装置
US20100057695A1 (en) Post-processing search results on a client computer
US11106732B2 (en) Systems and methods for sharing audio feeds
KR20110114055A (ko) 의미기반 검색 장치 및 그 방법과, 의미기반 메타데이터 제공 서버 및 그 동작 방법
CN102236710A (zh) 一种用于在查询结果中展现新闻信息的方法与设备
CN102214207A (zh) 一种用于对信息实体中的属性集合进行排序的方法与设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110914