CN103399862A - 确定目标查询序列所对应的搜索引导信息的方法与设备 - Google Patents

确定目标查询序列所对应的搜索引导信息的方法与设备 Download PDF

Info

Publication number
CN103399862A
CN103399862A CN2013102794345A CN201310279434A CN103399862A CN 103399862 A CN103399862 A CN 103399862A CN 2013102794345 A CN2013102794345 A CN 2013102794345A CN 201310279434 A CN201310279434 A CN 201310279434A CN 103399862 A CN103399862 A CN 103399862A
Authority
CN
China
Prior art keywords
candidate
query
information
search
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013102794345A
Other languages
English (en)
Other versions
CN103399862B (zh
Inventor
喻宏勇
徐兴军
潘昕婷
刘文昱
殷瑞娜
伏晓丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310279434.5A priority Critical patent/CN103399862B/zh
Publication of CN103399862A publication Critical patent/CN103399862A/zh
Application granted granted Critical
Publication of CN103399862B publication Critical patent/CN103399862B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明的目的是提供一种用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的方法与设备,具体地,在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息;根据多个候选引导信息,生成与目标资源集合相对应的引导映射关系;获取关于目标资源集合的目标查询序列;以在引导映射关系中进行匹配查询,获得搜索引导信息并提供。其中,与现有技术相比,本发明通过根据关于目标资源集合的目标查询序列,在包括查询序列及其对应的搜索引导信息的引导映射关系中进行匹配查询,获得与目标查询序列相对应的搜索引导信息,实现了为用户提供垂直化的搜索引导,不仅提升了用户需求满意度,也提高了用户获取信息的效率。

Description

确定目标查询序列所对应的搜索引导信息的方法与设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的技术。
背景技术
当前,随着互联网技术的发展及互联网应用对用户学习、工作与生活的渗透,人们越来越多地通过网络获取信息,如通过在搜索引擎搜索栏中输入关键词来表达其需求,进而获得相应的搜索结果,但用户输入的查询序列通常不能表达其精确需求,随之出现的通用搜索引擎的相关搜索为用户提供了引导用户进行搜索的相关检索,如向用户提供与其输入的关键词相关的关键词,如当用户输入“刘德华”时,为用户提供“刘德华ed2k”、“刘德华百度影音”等搜索引导信息,但对于有垂直需求的用户,如用户搜索关于某一特定领域、某一特定人群等方面的信息时,因通用搜索引擎的信息量大、查询不准确、深度不够,显然,现有技术的通用搜索引擎的相关搜索无法满足用户的垂直搜索需求,从而,不仅影响了用户获取信息的效率,也影响了用户的搜索体验。
发明内容
本发明的目的是提供一种用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的方法与设备。
根据本发明的一个方面,提供了一种用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的方法,其中,该方法包括以下步骤:
在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息,其中,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;
根据所述多个候选引导信息,生成与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括查询序列及其对应的搜索引导信息;
其中,该方法还包括:
获取关于所述目标资源集合的目标查询序列;
根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息;
将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。
根据本发明的另一个方面,还提供了一种用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导确定设备,其中,该搜索引导确定设备包括:
候选引导确定装置,用于在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息,其中,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;
引导映射生成装置,用于根据所述多个候选引导信息,生成与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括查询序列及其对应的搜索引导信息;
其中,该搜索引导确定设备还包括:
目标获取装置,用于获取关于所述目标资源集合的目标查询序列;
第一查询装置,用于根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息;
第一提供装置,用于将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。
根据本发明的又一个方面,还提供了一种计算机设备,包括如前述根据本发明另一个方面的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导确定设备。
根据本发明的再一个方面,还提供了一种浏览器,包括如前述根据本发明另一个方面的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导确定设备。
根据本发明的还一个方面,还提供了一种浏览器插件,包括如前述根据本发明另一个方面的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导确定设备。
根据本发明的还一个方面,还提供了一种搜索引擎,包括如前述根据本发明另一个方面的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导确定设备。
根据本发明的还一个方面,还提供了一种搜索引擎插件,包括如前述根据本发明另一个方面的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导确定设备。
与现有技术相比,本发明通过根据获取的关于目标资源集合的目标查询序列,在生成的包括查询序列及其对应的搜索引导信息的引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息,实现了为用户提供垂直化的搜索引导,不仅提升了用户需求满意度,也提高了用户获取信息的效率,相应地,也提升了用户的搜索体验。而且,本发明还可根据所述一个或多个搜索引导信息中至少一个,在所述目标资源集合中进行匹配查询,以获得一个或多个资源搜索结果,从而根据所述一个或多个资源搜索结果中至少一个,生成资源访问页面,进一步地提升了用户需求满意度,提高了用户获取信息的效率。此外,本发明还可获取用户对所述一个或多个搜索引导信息中至少一个的访问操作,以根据所述访问操作,在所述目标资源集合中进行匹配查询,以获得与至少一个所述搜索引导信息相对应的至少一个资源搜索结果,并提供给用户,更进一步地提升了用户需求满意度,提高了用户获取信息的效率,提升了用户的搜索体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的设备示意图;
图2示出根据本发明一个方面的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导信息示意图;
图3示出根据本发明一个方面的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的资源访问页面示意图;
图4示出根据本发明一个优选实施例的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的设备示意图;
图5示出根据本发明另一个方面的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的方法流程图;
图6示出根据本发明一个优选实施例的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导确定设备1,其中,搜索引导确定设备1包括候选引导确定装置11、引导映射生成装置12、目标获取装置13、第一查询装置14和第一提供装置15。具体地,候选引导确定装置11在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息,其中,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;引导映射生成装置12根据所述多个候选引导信息,生成与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括查询序列及其对应的搜索引导信息;目标获取装置13获取关于所述目标资源集合的目标查询序列;第一查询装置14根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息;第一提供装置15将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。在此,搜索引导确定设备1包括但不限于以下至少任一项:1)通过对网页库中的某类专门的信息如某行业诸如购物、旅游、汽车、工作、房产、交友、物流等的行业信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户,从而实现提供某一行业的专业搜索的垂直搜索引擎;2)专注于某一特定领域、某一特定人群或某一特定需求如文档、问题、视频等而提供有一定价值的信息和相关服务的专业性网站、行业网站、垂直门户网站,例如专注于IT领域的“中关村在线”,专注汽车的“汽车之家”,专注体育的“虎扑nba”,专注财经的“东方财富”,专注房产的“搜房网”,专注教育资源的“中国教育出版网”,专注工程机械的“中国工程机械商贸网”,专注古典诗词的“中华诗词网校”等。在此,搜索引导确定设备1包括但不限于用户网络设备、用户设备或网络设备与用户设备通过网络相集成所构成的设备。在此,所述网络确定设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现;或者由用户设备实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,所述用户设备可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑PPC或平板电脑等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解上述搜索引导确定设备1仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
具体地,候选引导确定装置11在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息,其中,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合。具体地,候选引导确定装置11首先通过诸如垂直搜索引擎、垂直网站、浏览器等第三方设备提供的应用程序接口(API),获取用户的搜索日志,以获取关于目标资源结合的历史搜索记录,如在一段时间内,用户曾输入了哪些关键词query,并点击了哪些关键词query所对应的搜索结果,及用户对该关键词query所对应的搜索结果的点击频次信息等,从而获取关于目标资源集合的多个历史查询序列;然后,对该多个历史查询序列进行筛选处理,如将历史查询序列所对应的搜索结果的被点击的次数信息作为所述历史查询序列的频次信息,进而根据历史查询序列的频次信息,对该多个历史查询序列进行筛选处理;接着,根据筛选处理后的多个历史查询序列,在所述目标资源集合中进行匹配查询,以获得对应的资源搜索结果,以根据筛选处理后历史查询序列及其对应的资源搜索结果的数量信息,筛选出多个候选引导信息,如将筛选处理后得到的历史查询序列所对应的资源搜索结果数量信息满足预定阈值的历史查询序列作为所述候选引导信息。在此,所述目标资源集合包括但不限于以下至少任一项:1)垂直索引数据库;2)关于某一个行业、专业性信息等的专业性网站、行业网站、垂直门户网站等网站数据库。本领域技术人员应能理解上述目标资源集合仅为举例,其他现有的或今后可能出现的目标资源集合如可适用于本发明,也应包含在本发明保护范围以内。
例如,在此,以百度文库数据库作为所述目标资源集合为例进行说明:假设候选引导确定装置11通过垂直搜索引擎如百度文库提供的应用程序接口(API),获取到最近一个月如2013-06-01至2013-06-30的时间内用户点击了文库搜索结果的关键词如query1、query2、query3等等,以及在该段时间内关键词query1、query2、query3等所对应的文库搜索结果被点击的频次信息,即获得关于目标资源集合百度文库的多个历史查询序列;然后,候选引导确定装置11将关键词query1、query2、query3等各自所对应的文库搜索结果被点击的频次信息,如将关键词query1、query2、query3等各自所对应的文库搜索结果在2013-06-01至2013-06-30时间内被点击的次数总和、被点击的次数的平均值等,作为关键词query1、query2、query3等的频次信息,可得到关键词query1、query2、query3等及其对应的频次信息形成的集合A={(queryi,weighti)}={(query1,weight1),(query2,weight2),(query3,weight3),...},其中,weighti表示queryi对应的频次信息,i为自然数,如候选引导确定装置11得到如下表1所示的集合A:
Figure BDA00003465553200071
表1
接着,候选引导确定装置11根据历史查询序列queryi所对应的频次信息weighti,对集合A进行筛选处理,如将频次weight<=5的query去除,得到集合B={(queryi,weighti)}={(query2,weight2),(query3,weight3),(query5,weight5),(query6,weight6),(query8,weight8)...},其中,weighti>5;然后,候选引导确定装置11根据集合B中的历史查询序列,在百度文库数据库中进行匹配查询,以获得集合B中的各个历史查询序列所对应的文库搜索结果,以根据筛选处理后历史查询序列及其对应的资源搜索结果的数量信息,筛选出多个候选引导信息,如将筛选处理后得到的历史查询序列所对应的资源搜索结果数量信息满足预定阈值的历史查询序列作为所述候选引导信息,假设候选引导确定装置11根据集合B及集合B中各个历史查询序列所对应的文库搜索结果的数量信息,得到集合C={(queryi,weighti,ndocsi},如下表2所示,其中,ndocsi表示关键词queryi在百度文库数据库中所能匹配查询得到的文库搜索结果数量信息:
Figure BDA00003465553200081
表2
则候选引导确定装置11可将集合C中ndocsi满足>=5的query作为所述候选引导信息,即将集合C中query3、query5、query6等作为所述候选引导信息,如可用集合D={(tagi)}={(queryi,weighti,ndocsi)}={(query3,weight3,ndocsi),(query5,weight5,ndocs5),(query6,weight6,ndocs6)}表示,其中,weighti>5,ndocsi>5。
本领域技术人员应能理解上述优选确定多个候选引导信息的方式仅为举例,其他现有的或今后可能出现的优选确定多个候选引导信息的方式如可适用于本发明,也应包含在本发明保护范围以内。
引导映射生成装置12根据所述多个候选引导信息,生成与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括查询序列及其对应的搜索引导信息。在此,所述搜索引导信息用于当用户通过查询序列进行搜索时,给用户的搜索提示信息,如查询序列推荐等。具体地,引导映射生成装置12可通过预定查询序列,在所述多个候选引导信息中确定包含该预定查询序列的一组候选引导信息,建立该预定查询序列及所述多个候选引导信息中确定包含该预定查询序列的一组候选引导信息之间的引导映射关系,从而获得与所述目标资源集合相对应的一个或多个引导映射关系。在此,所述包含的含义是指:在此,以query-d包含query-a即
Figure BDA00003465553200091
为例进行说明,
Figure BDA00003465553200092
是指query-d与query-a的最长公共子序列为query-a,也即:query-a中具有的字词query-d均有,query-a中字词出现的顺序与query-d一致。在此,所述预定查询序列包括但不限于以下至少任一项:1)来源于所述多个候选引导信息中的query,即来源于D集合中的query;2)输入的查询序列;3)指定的查询序列。本领域技术人员应能理解上述预定查询序列仅为举例,其他现有的或今后可能出现的预定查询序列如可适用于本发明,也应包含在本发明保护范围以内。
例如,假设对于输入的查询序列query-A、query-B等,引导映射生成装置12可首先分别根据查询序列query-A、query-B等,从候选引导确定装置11确定的多个候选引导信息如集合D中分别包含查询序列query-A、query-B等的所有候选引导信息,如假设集合D中与query-A的最长公共子序列为query-A的一组候选引导信息包括query3、query6,集合D中包含query-A的一组候选引导信息candidate-guide-info-A={tag3,tag6}={(query3,weight3,ndocs3),(query6,weight6,ndocs6)},假设集合D中与query-B的最长公共子序列为query-B的一组候选引导信息包括query5、query6,则引导生成装置12可分别根据每组候选引导信息candidate-guide-info-A={tag3,tag6}和candidate-guide-info-B={tag5,tag6},生成与所述目标资源集合相对应的引导映射关系,如建立query-A与candidate-guide-info-A之间的映射关系,如得到映射关系{query-A,(tag3,tag6)},建立query-B与candidate-guide-info-B之间的映射关系,如得到映射关系{query-B,(tag5,tag6)},则引导生成装置12将{query-A,(tag3,tag6)}及映射关系{query-B,(tag5,tag6)}合并,得到{(query-A,(tag3,tag6)),({query-B,(tag5,tag6)}),...},其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息。
本领域技术人员应能理解上述生成与所述目标资源集合相对应的一个或多个引导映射关系的方式仅为举例,其他现有的或今后可能出现的生成与所述目标资源集合相对应的一个或多个引导映射关系的方式如可适用于本发明,也应包含在本发明保护范围以内。
目标获取装置13通过诸如垂直搜索引擎、垂直网站、浏览器等第三方设备提供的应用程序接口(API),获取关于所述目标资源集合的目标查询序列;或者,通过ASP、JSP等动态网页技术,获取关于所述目标资源集合的目标查询序列。例如,假设用户user通过其用户设备PC在http://wenku.baidu.com/搜索栏中输入关键词“个人简历”,则目标获取装置13通过百度文库提供的应用程序接口(API),或者,通过ASP、JSP等动态网页技术,便获取到用户user输入的目标关键词“个人简历”。
本领域技术人员应能理解上述获取关于所述目标资源集合的目标查询序列的方式仅为举例,其他现有的或今后可能出现的获取关于所述目标资源集合的目标查询序列的方式如可适用于本发明,也应包含在本发明保护范围以内。
第一查询装置14根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息。例如,接上例,假设引导映射生成装置12生成的与目标资源如百度文库相对应的引导映射关系guide-maping包括{个人简历,(个人简历模板,个人简历表格,个人简历范文,个人简历自我评价,大学生个人简历、个人工作简历)},则第一查询装置14可根据目标获取装置13获取的目标查询序列“个人简历”,在guide-maping中进行匹配查询,获得与目标查询序列“个人简历”相对应的一个或多个搜索引导信息如“人简历模板,个人简历表格,个人简历范文,个人简历自我评价,大学生个人简历、个人工作简历”。
第一提供装置15通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。在此,与所述一个或多个搜索引导信息相对应的信息包括但不限于以下至少任一项:1)所述一个或多个搜索引导信息本身;2)根据所述一个或多个搜索引导信息生成的资源访问页面。在此,所述目标应用包括但不限于如:1)浏览器;2)搜索引擎。例如,第一提供装置15将第一查询装置14查询到的与目标查询序列“个人简历”相对应的一个或多个搜索引导信息如“人简历模板,个人简历表格,个人简历范文,个人简历自我评价,大学生个人简历、个人工作简历”提供给百度文库搜索引擎,以通过百度文库将该搜索引导信息提供给用户的用户设备,供用户浏览,如图2所示。在此,本发明实现了用户对目标资源集合中的资源搜索结果的点击率由14.92%提升至17.51%、用户的满意度提升了9%的有益效果。
搜索引导确定设备1的各个装置之间是持续不断工作的。具体地,候选引导确定装置11持续在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息,其中,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;引导映射生成装置12持续根据所述多个候选引导信息,生成与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括查询序列及其对应的搜索引导信息;目标获取装置13持续获取关于所述目标资源集合的目标查询序列;第一查询装置14持续根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息;第一提供装置15持续将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。在此,本领域技术人员应当理解“持续”是指搜索引导确定设备1的各装置之间分别不断地进行多个候选引导信息的优选确定、引导映射关系的生成、目标查询序列的获取、搜索引导信息的获得及与该搜索引导信息相对应的信息的提供,直至搜索引导确定设备1在较长一段时间内停止目标查询序列的获取。
在一个优选实施例中(参考图1),搜索引导确定设备1包括候选引导确定装置11、引导映射生成装置12、目标获取装置13、第一查询装置14和第一提供装置15,其中,候选引导确定装置11包括历史序列获取单元(未示出)、筛选单元(未示出)、查询单元(未示出)和优选确定单元(未示出)。以下参考图1对该优选实施例进行描述:具体地,历史序列获取单元从关于目标资源集合的多个历史搜索记录中获取对应的历史查询序列集合,其中,所述历史查询序列集合包括关于目标资源集合的多个历史查询序列及其对应的频次信息,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;筛选单元根据所述频次信息,对所述历史查询序列集合进行筛选处理,以获得筛选处理后的所述历史查询序列集合;查询单元根据筛选处理后的所述历史查询序列集合中的筛选历史查询序列,在所述目标资源集合中进行匹配查询,以获得与所述筛选历史查询序列相匹配的候选资源搜索结果;优选确定单元根据筛选处理后的所述历史查询序列集合及与所述候选资源搜索结果的数量信息,优选确定多个候选引导信息;引导映射生成装置12根据所述多个候选引导信息,生成与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括查询序列及其对应的搜索引导信息;目标获取装置13获取关于所述目标资源集合的目标查询序列;第一查询装置14根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息;第一提供装置15将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。在此,引导映射生成装置12、目标获取装置13、第一查询装置14和第一提供装置15与图1实施例中对应装置的内容相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
具体地,历史序列获取单元首先通过诸如垂直搜索引擎、垂直网站、浏览器等第三方设备提供的应用程序接口(API),获取用户关于目标资源集合的搜索日志,以获取关于目标资源集合的多个历史搜索记录;然后,再从该多个历史搜索记录中获取对应的历史查询序列集合,其中,所述历史查询序列集合包括关于目标资源集合的多个历史查询序列及其对应的频次信息,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合。例如,在此,以百度文库数据库作为所述目标资源集合为例进行说明:假设历史序列获取单元通过垂直搜索引擎如百度文库提供的应用程序接口(API),获取到最近一个月如2013-06-01至2013-06-30的时间内用户点击了文库搜索结果的关键词如query1、query2、query3等等,以及在该段时间内关键词query1、query2、query3等所对应的文库搜索结果被点击的频次信息,即获得关于目标资源集合百度文库的多个历史查询序列,则历史序列获取单元将关键词query1、query2、query3等各自所对应的文库搜索结果被点击的频次信息,如将关键词query1、query2、query3等各自所对应的文库搜索结果在2013-06-01至2013-06-30时间内被点击的次数总和、被点击的次数的平均值等,作为关键词query1、query2、query3等的频次信息,进而可得到关键词query1、query2、query3等及其对应的频次信息形成的历史查询序列集合,如集合A={(queryi,weighti)},其中,weighti表示queryi对应的频次信息。
接着,筛选单元根据所述频次信息,对所述历史查询序列集合进行筛选处理,以获得筛选处理后的所述历史查询序列集合。例如,接上例,假设历史序列获取单元获取的所述历史查询序列结合A如上述表1所示,则筛选单元可根据历史查询序列集合A中的历史查询序列queryi所对应的频次信息weighti,对集合A进行筛选处理,如将频次weight<=5的query去除,得到集合B={(queryi,weighti)}={(query2,weight2),(query3,weight3),(query5,weight5),(query6,weight6),(query8,weight8)...},其中,weighti>5。
查询单元根据筛选处理后的所述历史查询序列集合中的筛选历史查询序列,在所述目标资源集合中进行匹配查询,以获得与所述筛选历史查询序列相匹配的候选资源搜索结果。例如,接上例,查询单元可根据筛选单元得到集合B中的历史查询序列,在百度文库数据库中进行匹配查询,以获得集合B中的各个历史查询序列所对应的候选资源候选结果,即获得集合B中的各个历史查询序列在百度文库中所能检索到的文库搜索结果。
优选确定单元根据筛选处理后的所述历史查询序列集合及与所述候选资源搜索结果的数量信息,优选确定多个候选引导信息,如根据所述候选资源搜索结果的数量信息,将所述数量信息满足预定阈值的筛选历史查询序列,作为所述候选引导信息。例如,接上例,假设优选确定单元根据集合B及集合B中各个历史查询序列所对应的文库搜索结果的数量信息,得到集合C={(queryi,weighti,ndocsi},如上述表2所示,其中,ndocsi表示关键词queryi在百度文库数据库中所能匹配查询得到的文库搜索结果数量信息:则优选确定单元可将集合C中ndocsi满足>=5的query作为所述候选引导信息,即将集合C中query3、query5、query6等作为所述候选引导信息,如可用集合D={(tagi)}={(queryi,weighti,ndocsi)}={(query3,weight3,ndocsi),(query5,weight5,ndocs5),(query6,weight6,ndocs6)}表示,其中,weighti>5,ndocsi>5。
优选地,优选确定单元还可首先将所述候选资源搜索结果的数量信息包含于筛选处理后的所述历史查询序列集合,以获得与筛选处理后的所述历史查询序列集合相对应的初始候选引导信息集合;然后,再根据所述候选资源搜索结果的数量信息,对所述初始候选引导信息集合进行筛选处理,以获得所述多个候选引导信息。例如,还接上例,假设查询单元根据集合B中的历史查询序列queryi,在百度文库数据库中进行匹配查询,获得集合B中的历史查询序列queryi在百度文库中所能检索到的文库搜索结果的数量信息为ndocsi,则优选确定单元可首先将数量信息为ndocsi包含于集合B中,得到对应的初始候选引导信息集合CC={(queryi,weighti,ndocsi},如上述表2所示,其中,ndocsi表示关键词queryi在百度文库数据库中所能匹配查询得到的文库搜索结果数量信息:则优选确定单元可将集合C中ndocsi满足>=5的query作为所述候选引导信息,即将集合C中query3、query5、query6等作为所述候选引导信息,如可用集合D={(tagi)}={(queryi,weighti,ndocsi)}={(query3,weight3,ndocsi),(query5,weight5,ndocs5),(query6,weight6,ndocs6)}表示,其中,weighti>5,ndocsi>5。
优选地,搜索引导确定设备1还包括第二查询装置(未示出)和访问页面生成装置(未示出)。具体地,第二查询装置根据所述一个或多个搜索引导信息中至少一个,在所述目标资源集合中进行匹配查询,以获得一个或多个资源搜索结果;访问页面生成装置根据所述一个或多个资源搜索结果中至少一个,生成资源访问页面;其中,第一提供装置15将所述资源访问页面提供给所述目标查询序列所对应的目标应用。
具体地,第二查询装置根据所述一个或多个搜索引导信息中至少一个,在所述目标资源集合中进行匹配查询,以获得一个或多个资源搜索结果。例如,假设目标获取装置13获取到的关于目标资源集合如百度文库的所述目标查询序列为“个人简历”,而第一查询装置14获得的与该目标查询序列“个人简历”相对应的一个或多个搜索引导信息包括如“人简历模板,个人简历表格,个人简历范文,个人简历自我评价,大学生个人简历、个人工作简历”,则第二查询装置可根据该搜索引导信息“人简历模板,个人简历表格,个人简历范文,个人简历自我评价,大学生个人简历、个人工作简历”中的至少一个,在百度文库中进行匹配查询,以获得与该搜索引导信息“人简历模板,个人简历表格,个人简历范文,个人简历自我评价,大学生个人简历、个人工作简历”中至少一个相对应的一个或多个资源搜索结果,如获得与搜索引导信息“个人简历模板”相对应的资源搜索结果如“求职圣经/简历亮出你的精彩”、“个人简历模板大全(30套)”、“个人简历模板大集合(中英文全)”等。
访问页面生成装置根据所述一个或多个资源搜索结果中至少一个,生成资源访问页面。在此,所述资源访问页面包括至少一个所述资源搜索结果及其所对应的搜索引导信息组成的页面。例如,用户user在百度文库频道输入关键词“个人简历”,访问页面生成装置可根据第二查询装置在百度文库中根据与关键词“个人简历”相对应的搜索引导信息“人简历模板”匹配查询得到的资源搜索结果“求职圣经/简历亮出你的精彩”、“个人简历模板大全(30套)”、“个人简历模板大集合(中英文全)”中至少一个,以及在百度知道中根据与关键词“个人简历”相对应的搜索引导信息“人简历模板”匹配查询得到的资源搜索结果如“那种个人简历模板好用”、“哪有个人简历、个人简历模板下载”等,生成资源访问页面,即该资源访问页面即可包括如来自百度文库中检索得到的关键词“个人简历”对应的搜索引导信息及该搜索引导信息对应的搜索结果链接,还包括在百度知道中检索得到的关键词“个人简历”对应的搜索引导信息及该搜索引导信息对应的搜索结果链接。
本领域技术人员应能理解上述获取生成资源访问页面的方式仅为举例,其他现有的或今后可能出现的生成资源访问页面的方式如可适用于本发明,也应包含在本发明保护范围以内。
接着,第一提供装置15通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将访问页面生成的资源访问页面提供给所述目标查询序列所对应的目标应用,如图3所示。
优选地,搜索引导确定设备1还包括访问操作获取装置(未示出)、第三查询装置(未示出)和第二提供装置。具体地,访问操作获取装置获取用户通过所述目标应用对与所述一个或多个搜索引导信息相对应的信息中的至少一个所述搜索引导信息的访问操作;第三查询装置根据所述访问操作,在所述目标资源集合中进行匹配查询,以获得与至少一个所述搜索引导信息相对应的至少一个资源搜索结果;第二提供装置将所述至少一个资源搜索结果提供给所述用户。
具体地,访问操作获取装置通过诸如所述目标应用提供的应用程序接口(API),或者,通过ASP、JSP等动态网页技术,获取用户通过所述目标应用对与所述一个或多个搜索引导信息相对应的信息中的至少一个所述搜索引导信息的访问操作。例如,假设用户user在百度文库频道输入关键词“个人简历”,第一提供装置15将如图2所示的与所述一个或多个搜索引导信息相对应的信息通过百度文库提供给用户user,用户user对图2中的搜索引导信息“大学生个人简历”感兴趣,其点击了“大学生个人简历”,则访问操作获取装置通过ASP、JSP等动态网页技术,便可获取到用户user对搜索引导信息“大学生个人简历”的访问操作。
本领域技术人员应能理解上述获取所述访问操作的方式仅为举例,其他现有的或今后可能出现的获取所述访问操作的方式如可适用于本发明,也应包含在本发明保护范围以内。
第三查询装置根据所述访问操作,在所述目标资源集合中进行匹配查询,以获得与至少一个所述搜索引导信息相对应的至少一个资源搜索结果。例如,接上例,第三查询装置根据访问操作获取装置获取到的用户user对搜索引导信息“大学生个人简历”的访问操作,在百度文库中进行匹配查询,以获得与搜索引导信息“大学生个人简历”相对应的至少一个资源搜索结果如“大学生个人简历精选”、“在校大学生个人简历”、“大学生个人简历样本”等。
接着,第二提供装置通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将所述至少一个资源搜索结果提供给所述用户。
在此,本领域技术人员应能理解的是,第一提供装置15和第二提供装置可以是相独立的模块,也可以集成在一起;第一查询装置14、第二查询装置和第三查询装置可以是相独立的模块,也可以集成在一起。
在另一优选实施例中,可将上述用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导确定设备1,与现有的浏览器相结合,构成一种新的浏览器,现有的浏览器包括例如Microsoft公司的IE浏览器、Netscape公司的Netscape浏览器、Mozilla公司的Firefox浏览器、Google公司的Chrome浏览器、遨游公司的Maxthon浏览器、Opera公司的opera浏览器、360公司的360浏览器、搜狐公司的搜狗浏览器、腾讯公司的腾讯TT浏览器等。
在另一优选实施例中,可将上述用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导确定设备1,与现有的浏览器插件相结合,构成一种新的浏览器插件,现有的浏览器插件包括如Flash插件、RealPlayer插件、MMS插件、MIDI五线谱插件、ActiveX插件等。
在另一优选实施例中,可将上述用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导确定设备1,与现有垂直搜索引擎相结合,构成一种新的搜索引擎,现有的搜索引擎包括但不限于如Google公司的Google学术搜索引擎、百度公司的百度知道、百度文库等。
在另一优选实施例中,可将上述用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导确定设备1,与现有搜索引擎插件相结合,构成一种新的搜索引擎插件,现有的搜索引擎插件包括但不限于如Google公司的Google ToolBar、百度公司的百度搜霸、微软公司的MSN ToolBar等搜索引擎插件。
图4示出根据本发明一个优选实施例的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的设备示意图,其中,搜索引导确定设备1包括候选引导确定装置11’、引导映射生成装置12’、目标获取装置13’、第一查询装置14’和第一提供装置15’,其中,引导映射生成装置12’包括候选引导确定单元121’和第一映射生成单元122’。具体地,候选引导确定装置11’在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息,其中,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;候选引导确定单元121’在所述多个候选引导信息中确定一组或多组候选引导信息,其中,每组候选引导信息中的候选引导信息包含该组候选引导信息所对应的查询序列;第一映射生成单元122’根据每组候选引导信息,生成与该组候选引导信息相对应的引导映射关系,以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息;目标获取装置13’获取关于所述目标资源集合的目标查询序列;第一查询装置14’根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息;第一提供装置15’将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。在此,候选引导确定装置11’、目标获取装置13’、第一查询装置14’和第一提供装置15’与图1实施例中对应装置的内容相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
具体地,候选引导确定单元121’在所述多个候选引导信息中确定一组或多组候选引导信息,其中,每组候选引导信息中的候选引导信息包含该组候选引导信息所对应的查询序列,如通过预定查询序列,从所述多个候选引导信息中确定包含该预定查询序列的一组候选引导信息,在此,所述包含的含义是指:在此,以query-d包含query-a即为例进行说明,是指query-d与query-a的最长公共子序列为query-a,也即:query-a中具有的字词query-d均有,query-a中字词出现的顺序与query-d一致。在此,所述预定查询序列包括但不限于以下至少任一项:1)来源于所述多个候选引导信息中的query,即来源于D集合中的query;2)输入的查询序列;3)指定的查询序列。本领域技术人员应能理解上述预定查询序列仅为举例,其他现有的或今后可能出现的预定查询序列如可适用于本发明,也应包含在本发明保护范围以内。
例如,假设对于输入的查询序列query-A,则候选引导确定单元121’可根据查询序列query-A,从候选引导确定装置11’确定的多个候选引导信息如集合D中包含查询序列query-A的所有候选引导信息,如假设集合D中与query-A的最长公共子序列为query-A的一组候选引导信息包括query3、与query6,集合D中包含query-A的一组候选引导信息candidate-guide-info-A={tag3,tag6}={(query3,weight3,ndocs3),(query6,weight6,ndocs6)}。
接着,第一映射生成单元122’根据每组候选引导信息,生成与该组候选引导信息相对应的引导映射关系,以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息。例如,接上例,第一映射生成单元122’可根据候选引导确定单元121’确定的一组候选引导信息candidate-guide-info-A={tag3,tag6},生成与该组候选引导信息相对应的引导映射关系,如建立query-A与candidate-guide-info-A之间的映射关系,如得到映射关系{query-A,(tag3,tag6)},以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息。
优选地,第一映射生成单元122’包括过滤单元(未示出)和第二映射生成单元(未示出)。具体地,过滤单元通过对每组候选引导信息按其对应的查询序列进行过滤处理,以获得优选的候选引导信息;第二映射生成单元根据所述查询序列及所述优选的候选引导信息,生成与该组候选引导信息相对应的引导映射关系,以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息。
具体地,过滤单元通过对每组候选引导信息按其对应的查询序列进行过滤处理,以获得优选的候选引导信息;其中,过滤处理操作至少包括以下任一项:
-对每组候选引导信息按其对应的查询序列进行转义过滤处理,以获得优选的候选引导信息;
-对每组候选引导信息按其对应的查询序列进行变形过滤处理,以获得优选的候选引导信息;
-对每组候选引导信息按其对应的查询序列进行去重过滤处理,以获得优选的候选引导信息。
例如,当所述过滤处理操作包括对每组候选引导信息按其对应的查询序列进行转义过滤处理,以获得优选的候选引导信息时。具体地,过滤单元可首先基于每组候选引导信息中的候选引导信息相对于其对应的查询序列的转义模式,以及该候选引导信息所对应的扩展相关信息,对每组候选引导信息进行转义过滤处理,如将符合所述转义模式的候选引导信息作为所述优选的候选引导信息。在此,所述转义模式包括如:1)前缀转义模式,如“个人简历”(查询序列)-->“教师个人简历”(候选引导信息);2)后缀转义模式,如“个人简历”-->“个人简历表格”;3)插入转义模式,如“个人简历”-->“个人实习简历”。在此,所述扩展相关信息包括如:1)所述候选引导信息所对应的有效字符串长度信息小于所述查询序列的有效字符串长度的两倍,如“打算”扩展为“期中考试后的打算”,是不被允许的;2)所述候选引导信息比所述查询序列多包含由2个字符组成的词,如“运动会”扩展为“赞运动会”与“记一次运动会”,是不被允许的;但扩展为“运动会加油稿”是被允许的;3)对于插入转义模式的候选引导信息,所述查询序列每次可最多插入2个连续的词,以得到所述候选引导信息。例如。假设候选引导确定单元121’确定的一组候选引导信息candidate-guide-info-“个人简历”={tagI,tagII,tagIII,tagIV,tagV,tagVI}={(queryI,weightI,ndocsI),(queryII,weightII,ndocsII),(queryIII,weightIII,ndocsIII),(queryIV,weightIV,ndocsIV),(queryV,weightV,ndocsV),(queryVI,weightVI,ndocsVI)},其中,该组候选引导信息candidate-guide-info-“个人简历”所对应的查询序列query=“个人简历”,其中,queryI=“个人简历模板”,queryII=“个人简历表格下载”,queryIII=“教师个人简历”,queryIV=“大学生个人简历”,queryV=“个人实习找工作简历”,queryVI=“个人工作简历”,则过滤单元将该组候选引导信息candidate-guide-info-“个人简历”中的候选引导信息queryI至queryVI分别与该组候选引导信息candidate-guide-info-“个人简历”所对应的查询序列query=“个人简历”进行比较,得到候选引导信息queryI至queryVI相对于查询序列query=“个人简历”的转义模式,以及该候选引导信息所对应的扩展相关信息,如下表3所示:
Figure BDA00003465553200211
表3
则过滤单元根据得到的如上述表3所示的候选引导信息queryI至queryVI相对于查询序列query=“个人简历”的转义模式,以及该候选引导信息所对应的扩展相关信息,判定过滤掉queryII、queryIII、queryV,获得的优选的候选引导信息包括queryI、queryIV、queryVI
本领域技术人员应能理解上述转义模式和扩展相关信息仅为举例,其他现有的或今后可能出现的转义模式或扩展相关信息如可适用于本发明,也应包含在本发明保护范围以内。
又如,当所述过滤处理操作包括对每组候选引导信息按其对应的查询序列进行变形过滤处理,以获得优选的候选引导信息时。具体地,过滤单元首先确定每组候选引导信息中各候选引导信息的优先级,如根据各候选引导信息的热度描述信息,如热门程度等,确定所述优先级;然后,若每组候选引导信息中的一候选引导信息包括除所述查询序列外的关键词,且该关键词未包含于比该候选引导信息的优先级更高的其他候选引导信息,则将该候选引导信息作为优选的候选引导信息。例如,接上例,假设queryI至queryVI中,queryIV=“大学生个人简历”的优先级最高,在此,以queryI=“个人简历模板”为例进行说明,queryI=“个人简历模板”包括除查询序列query=“个人简历”外的关键词“模板”,且该关键词“模板”未包含于比queryI的优先级更高的候选引导信息queryIV,则过滤单元可将queryI作为优选的候选引导信息,以此类推,过滤单元还可确定如将queryII、queryIII、queryV、queryVI作为优选的候选引导信息。
还如,当所述过滤处理操作包括对每组候选引导信息按其对应的查询序列进行去重过滤处理,以获得优选的候选引导信息时。具体地,过滤单元首先通过诸如各候选引导信息与所述查询序列的文本匹配度,确定每组获选引导信息中各候选引导信息与所述查询序列的相似度;然后,根据所述相似度,对每组候选引导信息进行预处理,如将与所述查询序列的相似度大于0.95的候选引导信息删除;若预处理后的每组候选引导信息中的候选引导信息之间的相似度满足预定阈值,则将预处理后的该组候选引导信息中的候选引导信息作为优选的候选引导信息,如当该组候选引导信息的候选引导信息之间的相似度的最大值小于0.95时,将该组候选引导信息中的所有候选引导信息作为所述优选的候选引导信息。例如,接上例,假设过滤单元通过分别比较queryI至queryVI与query=“个人简历”的文本匹配度,得到queryI至queryVI与query=“个人简历”的文本匹配度分别为0.67、0.5、0.67、0.56、0.44、0.67,则过滤单元可将queryI至queryVI与query=“个人简历”的文本匹配度作为queryI至queryVI与query=“个人简历”的相似度,因各相似度均小于预定阈值0.95,则过滤单元可判断全部保留queryI至queryVI;然后,过滤单元确定queryI至queryVI中每两个候选引导信息之间的相似度,如通过queryI至queryVI中每两个候选引导信息之间的文本匹配度,确定该相似度,假设得到queryI至queryVI中每两个候选引导信息之间的相似度的最大值为0.67,小于预定阈值0.95,则过滤单元确定将queryI至queryVI全部作为优选的候选引导信息。
本领域技术人员应能理解上述确定相似度的方式仅为举例,其他现有的或今后可能出现的确定相似度的方式如可适用于本发明,也应包含在本发明保护范围以内。
本领域技术人员应能理解上述对每组候选引导信息按其对应的查询序列进行过滤处理的方式仅为举例,其他现有的或今后可能出现的对每组候选引导信息按其对应的查询序列进行过滤处理的方式如可适用于本发明,也应包含在本发明保护范围以内。
接着,第二映射生成单元根据所述查询序列及所述优选的候选引导信息,生成与该组候选引导信息相对应的引导映射关系,以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息,即所述引导映射关系包括所述查询序列及其对应的优选的候选引导信息。在此,第二映射生成单元获得所述引导映射关系信息的方式与第一映射生成单元122’获得所述引导映射关系的方式相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
图5示出根据本发明另一个方面的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的方法流程图。
具体地,在步骤S1中,搜索引导确定设备1在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息,其中,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;在步骤S2中,搜索引导确定设备1根据所述多个候选引导信息,生成与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括查询序列及其对应的搜索引导信息;在步骤S3中,搜索引导确定设备1获取关于所述目标资源集合的目标查询序列;在步骤S4中,搜索引导确定设备1根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息;在步骤S5中,搜索引导确定设备1将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。在此,搜索引导确定设备1包括但不限于以下至少任一项:1)通过对网页库中的某类专门的信息如某行业诸如购物、旅游、汽车、工作、房产、交友、物流等的行业信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户,从而实现提供某一行业的专业搜索的垂直搜索引擎;2)专注于某一特定领域、某一特定人群或某一特定需求如文档、问题、视频等而提供有一定价值的信息和相关服务的专业性网站、行业网站、垂直门户网站,例如专注于IT领域的“中关村在线”,专注汽车的“汽车之家”,专注体育的“虎扑nba”,专注财经的“东方财富”,专注房产的“搜房网”,专注教育资源的“中国教育出版网”,专注工程机械的“中国工程机械商贸网”,专注古典诗词的“中华诗词网校”等。在此,搜索引导确定设备1包括但不限于用户网络设备、用户设备或网络设备与用户设备通过网络相集成所构成的设备。在此,所述网络确定设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现;或者由用户设备实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,所述用户设备可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑PPC或平板电脑等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解上述搜索引导确定设备1仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
具体地,在步骤S1中,搜索引导确定设备1在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息,其中,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合。具体地,在步骤S1中,搜索引导确定设备1首先通过诸如垂直搜索引擎、垂直网站、浏览器等第三方设备提供的应用程序接口(API),获取用户的搜索日志,以获取关于目标资源结合的历史搜索记录,如在一段时间内,用户曾输入了哪些关键词query,并点击了哪些关键词query所对应的搜索结果,及用户对该关键词query所对应的搜索结果的点击频次信息等,从而获取关于目标资源集合的多个历史查询序列;然后,对该多个历史查询序列进行筛选处理,如将历史查询序列所对应的搜索结果的被点击的次数信息作为所述历史查询序列的频次信息,进而根据历史查询序列的频次信息,对该多个历史查询序列进行筛选处理;接着,根据筛选处理后的多个历史查询序列,在所述目标资源集合中进行匹配查询,以获得对应的资源搜索结果,以根据筛选处理后历史查询序列及其对应的资源搜索结果的数量信息,筛选出多个候选引导信息,如将筛选处理后得到的历史查询序列所对应的资源搜索结果数量信息满足预定阈值的历史查询序列作为所述候选引导信息。在此,所述目标资源集合包括但不限于以下至少任一项:1)垂直索引数据库;2)关于某一个行业、专业性信息等的专业性网站、行业网站、垂直门户网站等网站数据库。本领域技术人员应能理解上述目标资源集合仅为举例,其他现有的或今后可能出现的目标资源集合如可适用于本发明,也应包含在本发明保护范围以内。
例如,在此,以百度文库数据库作为所述目标资源集合为例进行说明:假设在步骤S1中,搜索引导确定设备1通过垂直搜索引擎如百度文库提供的应用程序接口(API),获取到最近一个月如2013-06-01至2013-06-30的时间内用户点击了文库搜索结果的关键词如query1、query2、query3等等,以及在该段时间内关键词query1、query2、query3等所对应的文库搜索结果被点击的频次信息,即获得关于目标资源集合百度文库的多个历史查询序列;然后,在步骤S1中,搜索引导确定设备1将关键词query1、query2、query3等各自所对应的文库搜索结果被点击的频次信息,如将关键词query1、query2、query3等各自所对应的文库搜索结果在2013-06-01至2013-06-30时间内被点击的次数总和、被点击的次数的平均值等,作为关键词query1、query2、query3等的频次信息,可得到关键词query1、query2、query3等及其对应的频次信息形成的集合A={(queryi,weighti)}={(query1,weight1),(query2,weight2),(query3,weight3),...},其中,weighti表示queryi对应的频次信息,i为自然数,如在步骤S1中,搜索引导确定设备1得到如下表4所示的集合A:
Figure BDA00003465553200261
Figure BDA00003465553200271
表4
接着,在步骤S1中,搜索引导确定设备1根据历史查询序列queryi所对应的频次信息weighti,对集合A进行筛选处理,如将频次weight<=5的query去除,得到集合B={(queryi,weighti)}={(query2,weight2),(query3,weight3),(query5,weight5),(query6,weight6),(query8,weight8)...},其中,weighti>5;然后,在步骤S1中,搜索引导确定设备1根据集合B中的历史查询序列,在百度文库数据库中进行匹配查询,以获得集合B中的各个历史查询序列所对应的文库搜索结果,以根据筛选处理后历史查询序列及其对应的资源搜索结果的数量信息,筛选出多个候选引导信息,如将筛选处理后得到的历史查询序列所对应的资源搜索结果数量信息满足预定阈值的历史查询序列作为所述候选引导信息,假设在步骤S1中,搜索引导确定设备1根据集合B及集合B中各个历史查询序列所对应的文库搜索结果的数量信息,得到集合C={(queryi,weighti,ndocsi},如下表5所示,其中,ndocsi表示关键词queryi在百度文库数据库中所能匹配查询得到的文库搜索结果数量信息:
表5
则在步骤S1中,搜索引导确定设备1可将集合C中ndocsi满足>=5的query作为所述候选引导信息,即将集合C中query3、query5、query6等作为所述候选引导信息,如可用集合D={(tagi)}={(queryi,weighti,ndocsi)}={(query3,weight3,ndocsi),(query5,weight5,ndocs5),(query6,weight6,ndocs6)}表示,其中,weighti>5,ndocsi>5。
本领域技术人员应能理解上述优选确定多个候选引导信息的方式仅为举例,其他现有的或今后可能出现的优选确定多个候选引导信息的方式如可适用于本发明,也应包含在本发明保护范围以内。
在步骤S2中,搜索引导确定设备1根据所述多个候选引导信息,生成与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括查询序列及其对应的搜索引导信息。在此,所述搜索引导信息用于当用户通过查询序列进行搜索时,给用户的搜索提示信息,如查询序列推荐等。具体地,在步骤S2中,搜索引导确定设备1可通过预定查询序列,在所述多个候选引导信息中确定包含该预定查询序列的一组候选引导信息,建立该预定查询序列及所述多个候选引导信息中确定包含该预定查询序列的一组候选引导信息之间的引导映射关系,从而获得与所述目标资源集合相对应的一个或多个引导映射关系。在此,所述包含的含义是指:在此,以query-d包含query-a即为例进行说明,
Figure BDA00003465553200282
是指query-d与query-a的最长公共子序列为query-a,也即:query-a中具有的字词query-d均有,query-a中字词出现的顺序与query-d一致。在此,所述预定查询序列包括但不限于以下至少任一项:1)来源于所述多个候选引导信息中的query,即来源于D集合中的query;2)输入的查询序列;3)指定的查询序列。本领域技术人员应能理解上述预定查询序列仅为举例,其他现有的或今后可能出现的预定查询序列如可适用于本发明,也应包含在本发明保护范围以内。
例如,假设对于输入的查询序列query-A、query-B等,在步骤S2中,搜索引导确定设备1可首先分别根据查询序列query-A、query-B等,从其在步骤S1中1确定的多个候选引导信息如集合D中分别包含查询序列query-A、query-B等的所有候选引导信息,如假设集合D中与query-A的最长公共子序列为query-A的一组候选引导信息包括query3、query6,集合D中包含query-A的一组候选引导信息candidate-guide-info-A={tag3,tag6}={(query3,weight3,ndocs3),(query6,weight6,ndocs6)},假设集合D中与query-B的最长公共子序列为query-B的一组候选引导信息包括query5、query6,则在步骤S2中,搜索引导确定设备1可分别根据每组候选引导信息candidate-guide-info-A={tag3,tag6}和candidate-guide-info-B={tag5,tag6},生成与所述目标资源集合相对应的引导映射关系,如建立query-A与candidate-guide-info-A之间的映射关系,如得到映射关系{query-A,(tag3,tag6)},建立query-B与candidate-guide-info-B之间的映射关系,如得到映射关系{query-B,(tag5,tag6)},则在步骤S2中,搜索引导确定设备1将{query-A,(tag3,tag6)}及映射关系{query-B,(tag5,tag6)}合并,得到{(query-A,(tag3,tag6)),({query-B,(tag5,tag6)}),...},其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息。
本领域技术人员应能理解上述生成与所述目标资源集合相对应的一个或多个引导映射关系的方式仅为举例,其他现有的或今后可能出现的生成与所述目标资源集合相对应的一个或多个引导映射关系的方式如可适用于本发明,也应包含在本发明保护范围以内。
在步骤S3中,搜索引导确定设备1通过诸如垂直搜索引擎、垂直网站、浏览器等第三方设备提供的应用程序接口(API),获取关于所述目标资源集合的目标查询序列;或者,通过ASP、JSP等动态网页技术,获取关于所述目标资源集合的目标查询序列。例如,假设用户user通过其用户设备PC在http://wenku.baidu.com/搜索栏中输入关键词“个人简历”,则在步骤S3中,搜索引导确定设备1通过百度文库提供的应用程序接口(API),或者,通过ASP、JSP等动态网页技术,便获取到用户user输入的目标关键词“个人简历”。
本领域技术人员应能理解上述获取关于所述目标资源集合的目标查询序列的方式仅为举例,其他现有的或今后可能出现的获取关于所述目标资源集合的目标查询序列的方式如可适用于本发明,也应包含在本发明保护范围以内。
在步骤S4中,搜索引导确定设备1根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息。例如,接上例,假设在步骤S2中,搜索引导确定设备1生成的与目标资源如百度文库相对应的引导映射关系guide-maping包括{个人简历,(个人简历模板,个人简历表格,个人简历范文,个人简历自我评价,大学生个人简历、个人工作简历)},则在步骤S4中,搜索引导确定设备1可根据其在步骤S3中获取的目标查询序列“个人简历”,在guide-maping中进行匹配查询,获得与目标查询序列“个人简历”相对应的一个或多个搜索引导信息如“人简历模板,个人简历表格,个人简历范文,个人简历自我评价,大学生个人简历、个人工作简历”。
在步骤S5中,搜索引导确定设备1通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。在此,与所述一个或多个搜索引导信息相对应的信息包括但不限于以下至少任一项:1)所述一个或多个搜索引导信息本身;2)根据所述一个或多个搜索引导信息生成的资源访问页面。在此,所述目标应用包括但不限于如:1)浏览器;2)搜索引擎。例如,在步骤S5中,搜索引导确定设备1将其在步骤S4中查询到的与目标查询序列“个人简历”相对应的一个或多个搜索引导信息如“人简历模板,个人简历表格,个人简历范文,个人简历自我评价,大学生个人简历、个人工作简历”提供给百度文库搜索引擎,以通过百度文库将该搜索引导信息提供给用户的用户设备,供用户浏览,如图2所示。在此,本发明实现了用户对目标资源集合中的资源搜索结果的点击率由14.92%提升至17.51%、用户的满意度提升了9%的有益效果。
搜索引导确定设备1的各个步骤之间是持续不断工作的。具体地,在步骤S1中,搜索引导确定设备1持续在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息,其中,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;在步骤S2中,搜索引导确定设备1持续根据所述多个候选引导信息,生成与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括查询序列及其对应的搜索引导信息;在步骤S3中,搜索引导确定设备1持续获取关于所述目标资源集合的目标查询序列;在步骤S4中,搜索引导确定设备1持续根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息;在步骤S5中,搜索引导确定设备1持续将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。在此,本领域技术人员应当理解“持续”是指搜索引导确定设备1的各步骤之间分别不断地进行多个候选引导信息的优选确定、引导映射关系的生成、目标查询序列的获取、搜索引导信息的获得及与该搜索引导信息相对应的信息的提供,直至搜索引导确定设备1在较长一段时间内停止目标查询序列的获取。
在一个优选实施例中(参考图5),该方法包括步骤S1、步骤S2、步骤S3、步骤S4和步骤S5,其中,步骤S1包括步骤S11(未示出)、步骤S12(未示出)、步骤S13(未示出)和步骤S14(未示出)。以下参考图5对该优选实施例进行描述:具体地,在步骤S11中,搜索引导确定设备1从关于目标资源集合的多个历史搜索记录中获取对应的历史查询序列集合,其中,所述历史查询序列集合包括关于目标资源集合的多个历史查询序列及其对应的频次信息,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;在步骤S12中,搜索引导确定设备1根据所述频次信息,对所述历史查询序列集合进行筛选处理,以获得筛选处理后的所述历史查询序列集合;在步骤S13中,搜索引导确定设备1根据筛选处理后的所述历史查询序列集合中的筛选历史查询序列,在所述目标资源集合中进行匹配查询,以获得与所述筛选历史查询序列相匹配的候选资源搜索结果;在步骤S14中,搜索引导确定设备1根据筛选处理后的所述历史查询序列集合及与所述候选资源搜索结果的数量信息,优选确定多个候选引导信息;在步骤S2中,搜索引导确定设备1根据所述多个候选引导信息,生成与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括查询序列及其对应的搜索引导信息;在步骤S3中,搜索引导确定设备1获取关于所述目标资源集合的目标查询序列;在步骤S4中,搜索引导确定设备1根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息;在步骤S5中,搜索引导确定设备1将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。在此,步骤S2、步骤S3、步骤S4和步骤S5与图5实施例中对应步骤的内容相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
具体地,在步骤S11中,搜索引导确定设备1首先通过诸如垂直搜索引擎、垂直网站、浏览器等第三方设备提供的应用程序接口(API),获取用户关于目标资源集合的搜索日志,以获取关于目标资源集合的多个历史搜索记录;然后,再从该多个历史搜索记录中获取对应的历史查询序列集合,其中,所述历史查询序列集合包括关于目标资源集合的多个历史查询序列及其对应的频次信息,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合。例如,在此,以百度文库数据库作为所述目标资源集合为例进行说明:假设在步骤S11中,搜索引导确定设备1通过垂直搜索引擎如百度文库提供的应用程序接口(API),获取到最近一个月如2013-06-01至2013-06-30的时间内用户点击了文库搜索结果的关键词如query1、query2、query3等等,以及在该段时间内关键词query1、query2、query3等所对应的文库搜索结果被点击的频次信息,即获得关于目标资源集合百度文库的多个历史查询序列,则在步骤S11中,搜索引导确定设备1将关键词query1、query2、query3等各自所对应的文库搜索结果被点击的频次信息,如将关键词query1、query2、query3等各自所对应的文库搜索结果在2013-06-01至2013-06-30时间内被点击的次数总和、被点击的次数的平均值等,作为关键词query1、query2、query3等的频次信息,进而可得到关键词query1、query2、query3等及其对应的频次信息形成的历史查询序列集合,如集合A={(queryi,weighti)},其中,weighti表示queryi对应的频次信息。
接着,在步骤S12中,搜索引导确定设备1根据所述频次信息,对所述历史查询序列集合进行筛选处理,以获得筛选处理后的所述历史查询序列集合。例如,接上例,假设在步骤S11中,搜索引导确定设备1获取的所述历史查询序列结合A如上述表1所示,则在步骤S12中,搜索引导确定设备1可根据历史查询序列集合A中的历史查询序列queryi所对应的频次信息weighti,对集合A进行筛选处理,如将频次weight<=5的query去除,得到集合B={(queryi,weighti)}={(query2,weight2),(query3,weight3),(query5,weight5),(query6,weight6),(query8,weight8)...},其中,weighti>5。
在步骤S13中,搜索引导确定设备1根据筛选处理后的所述历史查询序列集合中的筛选历史查询序列,在所述目标资源集合中进行匹配查询,以获得与所述筛选历史查询序列相匹配的候选资源搜索结果。例如,接上例,在步骤S13中,搜索引导确定设备1可根据其在步骤S12中得到集合B中的历史查询序列,在百度文库数据库中进行匹配查询,以获得集合B中的各个历史查询序列所对应的候选资源候选结果,即获得集合B中的各个历史查询序列在百度文库中所能检索到的文库搜索结果。
在步骤S14中,搜索引导确定设备1根据筛选处理后的所述历史查询序列集合及与所述候选资源搜索结果的数量信息,优选确定多个候选引导信息,如根据所述候选资源搜索结果的数量信息,将所述数量信息满足预定阈值的筛选历史查询序列,作为所述候选引导信息。例如,接上例,假设在步骤S14中,搜索引导确定设备1根据集合B及集合B中各个历史查询序列所对应的文库搜索结果的数量信息,得到集合C={(queryi,weighti,ndocsi},如上述表5所示,其中,ndocsi表示关键词queryi在百度文库数据库中所能匹配查询得到的文库搜索结果数量信息:则优选确定单元可将集合C中ndocsi满足>=5的query作为所述候选引导信息,即将集合C中query3、query5、query6等作为所述候选引导信息,如可用集合D={(tagi)}={(queryi,weighti,ndocsi)}={(query3,weight3,ndocsi),(query5,weight5,ndocs5),(query6,weight6,ndocs6)}表示,其中,weighti>5,ndocsi>5。
优选地,在步骤S14中,搜索引导确定设备1还可首先将所述候选资源搜索结果的数量信息包含于筛选处理后的所述历史查询序列集合,以获得与筛选处理后的所述历史查询序列集合相对应的初始候选引导信息集合;然后,再根据所述候选资源搜索结果的数量信息,对所述初始候选引导信息集合进行筛选处理,以获得所述多个候选引导信息。例如,还接上例,假设在步骤S13中,搜索引导确定设备1根据集合B中的历史查询序列queryi,在百度文库数据库中进行匹配查询,获得集合B中的历史查询序列queryi在百度文库中所能检索到的文库搜索结果的数量信息为ndocsi,则在步骤S14中,搜索引导确定设备1可首先将数量信息为ndocsi包含于集合B中,得到对应的初始候选引导信息集合C C={(queryi,weighti,ndocsi},如上述表5所示,其中,ndocsi表示关键词queryi在百度文库数据库中所能匹配查询得到的文库搜索结果数量信息:则优选确定单元可将集合C中ndocsi满足>=5的query作为所述候选引导信息,即将集合C中query3、query5、query6等作为所述候选引导信息,如可用集合D={(tagi)}={(queryi,weighti,ndocsi)}={(query3,weight3,ndocsi),(query5,weight5,ndocs5),(query6,weight6,ndocs6)}表示,其中,weighti>5,ndocsi>5。
优选地,搜索引导确定设备1还包括步骤S6(未示出)和步骤S7(未示出)。具体地,在步骤S6中,搜索引导确定设备1根据所述一个或多个搜索引导信息中至少一个,在所述目标资源集合中进行匹配查询,以获得一个或多个资源搜索结果;在步骤S7中,搜索引导确定设备1根据所述一个或多个资源搜索结果中至少一个,生成资源访问页面;其中,在步骤S5中,搜索引导确定设备1将所述资源访问页面提供给所述目标查询序列所对应的目标应用。
具体地,在步骤S6中,搜索引导确定设备1根据所述一个或多个搜索引导信息中至少一个,在所述目标资源集合中进行匹配查询,以获得一个或多个资源搜索结果。例如,假设在步骤S3中,搜索引导确定设备1获取到的关于目标资源集合如百度文库的所述目标查询序列为“个人简历”,而在步骤S4中,搜索引导确定设备1获得的与该目标查询序列“个人简历”相对应的一个或多个搜索引导信息包括如“人简历模板,个人简历表格,个人简历范文,个人简历自我评价,大学生个人简历、个人工作简历”,则在步骤S6中,搜索引导确定设备1可根据该搜索引导信息“人简历模板,个人简历表格,个人简历范文,个人简历自我评价,大学生个人简历、个人工作简历”中的至少一个,在百度文库中进行匹配查询,以获得与该搜索引导信息“人简历模板,个人简历表格,个人简历范文,个人简历自我评价,大学生个人简历”中至少一个相对应的一个或多个资源搜索结果,如获得与搜索引导信息“人简历模板”相对应的资源搜索结果如“求职圣经/简历亮出你的精彩”、“个人简历模板大全(30套)”、“个人简历模板大集合(中英文全)”等。
在步骤S7中,搜索引导确定设备1根据所述一个或多个资源搜索结果中至少一个,生成资源访问页面。在此,所述资源访问页面包括至少一个所述资源搜索结果及其所对应的搜索引导信息组成的页面。例如,用户user在百度文库频道输入关键词“个人简历”,在步骤S7中,搜索引导确定设备1可根据其在步骤S6中在百度文库中根据与关键词“个人简历”相对应的搜索引导信息“人简历模板”匹配查询得到的资源搜索结果“求职圣经/简历亮出你的精彩”、“个人简历模板大全(30套)”、“个人简历模板大集合(中英文全)”中至少一个,以及在百度知道中根据与关键词“个人简历”相对应的搜索引导信息“人简历模板”匹配查询得到的资源搜索结果如“那种个人简历模板好用”、“哪有个人简历、个人简历模板下载”等,生成资源访问页面,即该资源访问页面即可包括如来自百度文库中检索得到的关键词“个人简历”对应的搜索引导信息及该搜索引导信息对应的搜索结果链接,还包括在百度知道中检索得到的关键词“个人简历”对应的搜索引导信息及该搜索引导信息对应的搜索结果链接。
本领域技术人员应能理解上述获取生成资源访问页面的方式仅为举例,其他现有的或今后可能出现的生成资源访问页面的方式如可适用于本发明,也应包含在本发明保护范围以内。
接着,在步骤S5中,搜索引导确定设备1通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将访问页面生成的资源访问页面提供给所述目标查询序列所对应的目标应用,如图3所示。
优选地,搜索引导确定设备1还包括步骤S8(未示出)、步骤S9(未示出)和步骤S10。具体地,在步骤S8中,搜索引导确定设备1获取用户通过所述目标应用对与所述一个或多个搜索引导信息相对应的信息中的至少一个所述搜索引导信息的访问操作;在步骤S9中,搜索引导确定设备1根据所述访问操作,在所述目标资源集合中进行匹配查询,以获得与至少一个所述搜索引导信息相对应的至少一个资源搜索结果;在步骤S10中,搜索引导确定设备1将所述至少一个资源搜索结果提供给所述用户。
具体地,在步骤S8中,搜索引导确定设备1通过诸如所述目标应用提供的应用程序接口(API),或者,通过ASP、JSP等动态网页技术,获取用户通过所述目标应用对与所述一个或多个搜索引导信息相对应的信息中的至少一个所述搜索引导信息的访问操作。例如,假设用户user在百度文库频道输入关键词“个人简历”,在步骤S5中,搜索引导确定设备1将如图2所示的与所述一个或多个搜索引导信息相对应的信息通过百度文库提供给用户user,用户user对图2中的搜索引导信息“大学生个人简历”感兴趣,其点击了“大学生个人简历”,则在步骤S8中,搜索引导确定设备1通过ASP、JSP等动态网页技术,便可获取到用户user对搜索引导信息“大学生个人简历”的访问操作。
本领域技术人员应能理解上述获取所述访问操作的方式仅为举例,其他现有的或今后可能出现的获取所述访问操作的方式如可适用于本发明,也应包含在本发明保护范围以内。
在步骤S9中,搜索引导确定设备1根据所述访问操作,在所述目标资源集合中进行匹配查询,以获得与至少一个所述搜索引导信息相对应的至少一个资源搜索结果。例如,接上例,在步骤S9中,搜索引导确定设备1根据访问操作获取装置获取到的用户user对搜索引导信息“大学生个人简历”的访问操作,在百度文库中进行匹配查询,以获得与搜索引导信息“大学生个人简历”相对应的至少一个资源搜索结果如“大学生个人简历精选”、“在校大学生个人简历”、“大学生个人简历样本”等。
接着,在步骤S10中,搜索引导确定设备1通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将所述至少一个资源搜索结果提供给所述用户。
图6示出根据本发明一个优选实施例的用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的方法流程图。
其中,该方法包括步骤S1’、步骤S2’、步骤S3’、步骤S4’和步骤S5’,其中,步骤S2’包括步骤S21’和步骤S22’。具体地,在步骤S1’中,搜索引导确定设备1在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息,其中,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;在步骤S21’中,搜索引导确定设备1121’在所述多个候选引导信息中确定一组或多组候选引导信息,其中,每组候选引导信息中的候选引导信息包含该组候选引导信息所对应的查询序列;在步骤S22’中,搜索引导确定设备1根据每组候选引导信息,生成与该组候选引导信息相对应的引导映射关系,以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息;在步骤S3’中,搜索引导确定设备1获取关于所述目标资源集合的目标查询序列;在步骤S4’中,搜索引导确定设备1根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息;在步骤S5’中,搜索引导确定设备1将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。在此,步骤S1’、步骤S3’、步骤S4’和步骤S5’与图5实施例中对应步骤的内容相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
具体地,在步骤S21’中,搜索引导确定设备1在所述多个候选引导信息中确定一组或多组候选引导信息,其中,每组候选引导信息中的候选引导信息包含该组候选引导信息所对应的查询序列,如通过预定查询序列,从所述多个候选引导信息中确定包含该预定查询序列的一组候选引导信息,在此,所述包含的含义是指:在此,以query-d包含query-a即
Figure BDA00003465553200381
为例进行说明,
Figure BDA00003465553200382
是指query-d与query-a的最长公共子序列为query-a,也即:query-a中具有的字词query-d均有,query-a中字词出现的顺序与query-d一致。在此,所述预定查询序列包括但不限于以下至少任一项:1)来源于所述多个候选引导信息中的query,即来源于D集合中的query;2)输入的查询序列;3)指定的查询序列。本领域技术人员应能理解上述预定查询序列仅为举例,其他现有的或今后可能出现的预定查询序列如可适用于本发明,也应包含在本发明保护范围以内。
例如,假设对于输入的查询序列query-A,则在步骤S21’中,搜索引导确定设备1可根据查询序列query-A,从其在步骤S1’中确定的多个候选引导信息如集合D中包含查询序列query-A的所有候选引导信息,如假设集合D中与query-A的最长公共子序列为query-A的一组候选引导信息包括query3、与query6,集合D中包含query-A的一组候选引导信息candidate-guide-info-A={tag3,tag6}={(query3,weight3,ndocs3),(query6,weight6,ndocs6)}。
接着,在步骤S22’中,搜索引导确定设备1根据每组候选引导信息,生成与该组候选引导信息相对应的引导映射关系,以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息。例如,接上例在步骤S22’中,搜索引导确定设备1可根据其在步骤S21’中确定的一组候选引导信息candidate-guide-info-A={tag3,tag6},生成与该组候选引导信息相对应的引导映射关系,如建立query-A与candidate-guide-info-A之间的映射关系,如得到映射关系{query-A,(tag3,tag6)},以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息。
优选地,步骤S22’包括步骤S221’(未示出)和步骤S222’(未示出)。具体地,在步骤S221’中,搜索引导确定设备1通过对每组候选引导信息按其对应的查询序列进行过滤处理,以获得优选的候选引导信息;在步骤S222’中,搜索引导确定设备1根据所述查询序列及所述优选的候选引导信息,生成与该组候选引导信息相对应的引导映射关系,以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息。
具体地,在步骤S221’中,搜索引导确定设备1通过对每组候选引导信息按其对应的查询序列进行过滤处理,以获得优选的候选引导信息;其中,过滤处理操作至少包括以下任一项:
-对每组候选引导信息按其对应的查询序列进行转义过滤处理,以获得优选的候选引导信息;
-对每组候选引导信息按其对应的查询序列进行变形过滤处理,以获得优选的候选引导信息;
-对每组候选引导信息按其对应的查询序列进行去重过滤处理,以获得优选的候选引导信息。
例如,当所述过滤处理操作包括对每组候选引导信息按其对应的查询序列进行转义过滤处理,以获得优选的候选引导信息时。具体地,在步骤S221’中,搜索引导确定设备1可首先基于每组候选引导信息中的候选引导信息相对于其对应的查询序列的转义模式,以及该候选引导信息所对应的扩展相关信息,对每组候选引导信息进行转义过滤处理,如将符合所述转义模式的候选引导信息作为所述优选的候选引导信息。在此,所述转义模式包括如:1)前缀转义模式,如“个人简历”(查询序列)-->“教师个人简历”(候选引导信息);2)后缀转义模式,如“个人简历”-->“个人简历表格”;3)插入转义模式,如“个人简历”-->“个人实习简历”。在此,所述扩展相关信息包括如:1)所述候选引导信息所对应的有效字符串长度信息小于所述查询序列的有效字符串长度的两倍,如“打算”扩展为“期中考试后的打算”,是不被允许的;2)所述候选引导信息比所述查询序列多包含由2个字符组成的词,如“运动会”扩展为“赞运动会”与“记一次运动会”,是不被允许的;但扩展为“运动会加油稿”是被允许的;3)对于插入转义模式的候选引导信息,所述查询序列每次可最多插入2个连续的词,以得到所述候选引导信息。例如。假设在步骤S21’中,搜索引导确定设备1确定的一组候选引导信息candidate-guide-info-“个人简历”={tagI,tagII,tagIII,tagIV,tagV,tagVI}={(queryI,weightI,ndocsI),(queryII,weightII,ndocsII),(queryIII,weightIII,ndocsIII),(queryIV,weightIV,ndocsIV),(queryV,weightV,ndocsV),(queryVI,weightVI,ndocsVI)},其中,该组候选引导信息candidate-guide-info-“个人简历”所对应的查询序列query=“个人简历”,其中,queryI=“个人简历模板”,queryII=“个人简历表格下载”,queryIII=“教师个人简历”,queryIV=“大学生个人简历”,queryV=“个人实习找工作简历”,queryVI=“个人工作简历”,则在步骤S221’中,搜索引导确定设备1将该组候选引导信息candidate-guide-info-“个人简历”中的候选引导信息queryI至queryVI分别与该组候选引导信息candidate-guide-info-“个人简历”所对应的查询序列query=“个人简历”进行比较,得到候选引导信息queryI至queryVI相对于查询序列query=“个人简历”的转义模式,以及该候选引导信息所对应的扩展相关信息,如下表6所示:
Figure BDA00003465553200401
表6
则过滤单元根据得到的如上述表6所示的候选引导信息queryI至queryVI相对于查询序列query=“个人简历”的转义模式,以及该候选引导信息所对应的扩展相关信息,判定过滤掉queryII、queryIII、queryV,获得的优选的候选引导信息包括queryI、queryIV、queryVI
本领域技术人员应能理解上述转义模式和扩展相关信息仅为举例,其他现有的或今后可能出现的转义模式或扩展相关信息如可适用于本发明,也应包含在本发明保护范围以内。
又如,当所述过滤处理操作包括对每组候选引导信息按其对应的查询序列进行变形过滤处理,以获得优选的候选引导信息时。具体地,在步骤S221’中,搜索引导确定设备1首先确定每组候选引导信息中各候选引导信息的优先级,如根据各候选引导信息的热度描述信息,如热门程度等,确定所述优先级;然后,若每组候选引导信息中的一候选引导信息包括除所述查询序列外的关键词,且该关键词未包含于比该候选引导信息的优先级更高的其他候选引导信息,则将该候选引导信息作为优选的候选引导信息。例如,接上例,假设queryI至queryVI中,queryIV=“大学生个人简历”的优先级最高,在此,以queryI=“个人简历模板”为例进行说明,queryI=“个人简历模板”包括除查询序列query=“个人简历”外的关键词“模板”,且该关键词“模板”未包含于比queryI的优先级更高的候选引导信息queryIV,则在步骤S221’中,搜索引导确定设备1可将queryI作为优选的候选引导信息,以此类推,过滤单元还可确定如将queryII、queryIII、queryV、queryVI作为优选的候选引导信息。
还如,当所述过滤处理操作包括对每组候选引导信息按其对应的查询序列进行去重过滤处理,以获得优选的候选引导信息时。具体地,在步骤S221’中,搜索引导确定设备1首先通过诸如各候选引导信息与所述查询序列的文本匹配度,确定每组获选引导信息中各候选引导信息与所述查询序列的相似度;然后,根据所述相似度,对每组候选引导信息进行预处理,如将与所述查询序列的相似度大于0.95的候选引导信息删除;若预处理后的每组候选引导信息中的候选引导信息之间的相似度满足预定阈值,则将预处理后的该组候选引导信息中的候选引导信息作为优选的候选引导信息,如当该组候选引导信息的候选引导信息之间的相似度的最大值小于0.95时,将该组候选引导信息中的所有候选引导信息作为所述优选的候选引导信息。例如,接上例,假设在步骤S221’中,搜索引导确定设备1通过分别比较queryI至queryVI与query=“个人简历”的文本匹配度,得到queryI至queryVI与query=“个人简历”的文本匹配度分别为0.67、0.5、0.67、0.56、0.44、0.67,则在步骤S221’中,搜索引导确定设备1可将queryI至queryVI与query=“个人简历”的文本匹配度作为queryI至queryVI与query=“个人简历”的相似度,因各相似度均小于预定阈值0.95,则过滤单元可判断全部保留queryI至queryVI;然后,在步骤S221’中,搜索引导确定设备1确定queryI至queryVI中每两个候选引导信息之间的相似度,如通过queryI至queryVI中每两个候选引导信息之间的文本匹配度,确定该相似度,假设得到queryI至queryVI中每两个候选引导信息之间的相似度的最大值为0.67,小于预定阈值0.95,则在步骤S221’中,搜索引导确定设备1确定将queryI至queryVI全部作为优选的候选引导信息。
本领域技术人员应能理解上述确定相似度的方式仅为举例,其他现有的或今后可能出现的确定相似度的方式如可适用于本发明,也应包含在本发明保护范围以内。
本领域技术人员应能理解上述对每组候选引导信息按其对应的查询序列进行过滤处理的方式仅为举例,其他现有的或今后可能出现的对每组候选引导信息按其对应的查询序列进行过滤处理的方式如可适用于本发明,也应包含在本发明保护范围以内。
接着,在步骤S222’中,搜索引导确定设备1根据所述查询序列及所述优选的候选引导信息,生成与该组候选引导信息相对应的引导映射关系,以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息,即所述引导映射关系包括所述查询序列及其对应的优选的候选引导信息。在此,在步骤S222’中,搜索引导确定设备1获得所述引导映射关系信息的方式与在步骤S22’中获得所述引导映射关系的方式相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (19)

1.一种用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的方法,其中,该方法包括以下步骤:
x在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息,其中,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;
y根据所述多个候选引导信息,生成与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括查询序列及其对应的搜索引导信息;
其中,该方法还包括:
a获取关于所述目标资源集合的目标查询序列;
b根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息;
c将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。
2.根据权利要求1所述的方法,其中,所述步骤x包括:
-从关于目标资源集合的多个历史搜索记录中获取对应的历史查询序列集合,其中,所述历史查询序列集合包括关于目标资源集合的多个历史查询序列及其对应的频次信息,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;
-根据所述频次信息,对所述历史查询序列集合进行筛选处理,以获得筛选处理后的所述历史查询序列集合;
-根据筛选处理后的所述历史查询序列集合中的筛选历史查询序列,在所述目标资源集合中进行匹配查询,以获得与所述筛选历史查询序列相匹配的候选资源搜索结果;
x1根据筛选处理后所述历史查询序列集合及与所述候选资源搜索结果的数量信息,优选确定多个候选引导信息。
3.根据权利要求2所述的方法,其中,所述步骤x1包括:
-将所述候选资源搜索结果的数量信息包含于筛选处理后的所述历史查询序列集合,以获得与所述历史查询序列集合相对应的初始候选引导信息集合;
-根据所述候选资源搜索结果的数量信息,对所述初始候选引导信息集合进行筛选处理,以获得所述多个候选引导信息。
4.根据权利要求1至3中任一项所述的方法,其中,所述步骤y包括:
-在所述多个候选引导信息中确定一组或多组候选引导信息,其中,每组候选引导信息中的候选引导信息包含该组候选引导信息所对应的查询序列;
y1根据每组候选引导信息,生成与该组候选引导信息相对应的引导映射关系,以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息。
5.根据权利要求4所述的方法,其中,所述步骤y1包括:
y11通过对每组候选引导信息按其对应的查询序列进行过滤处理,以获得优选的候选引导信息;
-根据所述查询序列及所述优选的候选引导信息,生成与该组候选引导信息相对应的引导映射关系,以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息。
6.根据权利要求5所述的方法,其中,所述步骤y11中的过滤处理操作至少包括以下任一项:
-对每组候选引导信息按其对应的查询序列进行转义过滤处理,以获得优选的候选引导信息;
-对每组候选引导信息按其对应的查询序列进行变形过滤处理,以获得优选的候选引导信息;
-对每组候选引导信息按其对应的查询序列进行去重过滤处理,以获得优选的候选引导信息。
7.根据权利要求1至6中任一项所述的方法,其中,该方法还包括:
-根据所述一个或多个搜索引导信息中至少一个,在所述目标资源集合中进行匹配查询,以获得一个或多个资源搜索结果;
-根据所述一个或多个资源搜索结果中至少一个,生成资源访问页面;
其中,所述步骤c包括:
-将所述资源访问页面提供给所述目标查询序列所对应的目标应用。
8.一种用于确定目标查询序列在目标资源集合下所对应的搜索引导信息的搜索引导确定设备,其中,该搜索引导确定设备包括:
候选引导确定装置,用于在关于目标资源集合的多个历史查询序列中,优选确定多个候选引导信息,其中,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;
引导映射生成装置,用于根据所述多个候选引导信息,生成与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括查询序列及其对应的搜索引导信息;
其中,该搜索引导确定设备还包括:
目标获取装置,用于获取关于所述目标资源集合的目标查询序列;
第一查询装置,用于根据所述目标查询序列,在所述一个或多个引导映射关系中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个搜索引导信息;
第一提供装置,用于将与所述一个或多个搜索引导信息相对应的信息提供给所述目标查询序列所对应的目标应用。
9.根据权利要求8所述的搜索引导确定设备,其中,所述候选引导确定装置包括:
历史序列获取单元,用于从关于目标资源集合的多个历史搜索记录中获取对应的历史查询序列集合,其中,所述历史查询序列集合包括关于目标资源集合的多个历史查询序列及其对应的频次信息,所述历史查询序列所对应的被访问搜索结果中的至少一个包含于所述目标资源集合;
筛选单元,用于根据所述频次信息,对所述历史查询序列集合进行筛选处理,以获得筛选处理后的所述历史查询序列集合;
查询单元,用于根据筛选处理后的所述历史查询序列集合中的筛选历史查询序列,在所述目标资源集合中进行匹配查询,以获得与所述筛选历史查询序列相匹配的候选资源搜索结果;
优选确定单元,用于根据筛选处理后的所述历史查询序列集合及与所述候选资源搜索结果的数量信息,优选确定多个候选引导信息。
10.根据权利要求9所述的搜索引导确定设备,其中,所述优选确定单元用于:
-将所述候选资源搜索结果的数量信息包含于筛选处理后的所述历史查询序列集合,以获得与所述历史查询序列集合相对应的初始候选引导信息集合;
-根据所述候选资源搜索结果的数量信息,对所述初始候选引导信息集合进行筛选处理,以获得所述多个候选引导信息。
11.根据权利要求8至10中任一项所述的搜索引导确定设备,其中,所述引导映射生成装置包括:
候选引导确定单元,用于在所述多个候选引导信息中确定一组或多组候选引导信息,其中,每组候选引导信息中的候选引导信息包含该组候选引导信息所对应的查询序列;
第一映射生成单元,用于根据每组候选引导信息,生成与该组候选引导信息相对应的引导映射关系,以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息。
12.根据权利要求11所述的搜索引导确定设备,其中,所述第一映射生成单元包括:
过滤单元,用于通过对每组候选引导信息按其对应的查询序列进行过滤处理,以获得优选的候选引导信息;
第二映射生成单元,用于根据所述查询序列及所述优选的候选引导信息,生成与该组候选引导信息相对应的引导映射关系,以获得与所述目标资源集合相对应的一个或多个引导映射关系,其中,所述引导映射关系包括所述查询序列及其对应的搜索引导信息。
13.根据权利要求12所述的搜索引导确定设备,其中,所述过滤单元中的过滤处理操作至少包括以下任一项:
-对每组候选引导信息按其对应的查询序列进行转义过滤处理,以获得优选的候选引导信息;
-对每组候选引导信息按其对应的查询序列进行变形过滤处理,以获得优选的候选引导信息;
-对每组候选引导信息按其对应的查询序列进行去重过滤处理,以获得优选的候选引导信息。
14.根据权利要求8至13中任一项所述的搜索引导确定设备,其中,该搜索引导确定设备还包括:
第二查询装置,用于根据所述一个或多个搜索引导信息中至少一个,在所述目标资源集合中进行匹配查询,以获得一个或多个资源搜索结果;
访问页面生成装置,用于根据所述一个或多个资源搜索结果中至少一个,生成资源访问页面;
其中,所述第一提供装置用于:
-将所述资源访问页面提供给所述目标查询序列所对应的目标应用。
15.一种计算机设备,包括如权利要求8至14中任一项所述的搜索引导确定设备。
16.一种浏览器,包括如权利要求8至14中任一项所述的搜索引导确定设备。
17.一种浏览器插件,包括如权利要求8至14中任一项所述的搜索引导确定设备。
18.一种搜索引擎,包括如权利要求8至14中任一项所述的搜索引导确定设备。
19.一种搜索引擎插件,包括如权利要求8至14中任一项所述的搜索引导确定设备。
CN201310279434.5A 2013-07-04 2013-07-04 确定目标查询序列所对应的搜索引导信息的方法与设备 Active CN103399862B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310279434.5A CN103399862B (zh) 2013-07-04 2013-07-04 确定目标查询序列所对应的搜索引导信息的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310279434.5A CN103399862B (zh) 2013-07-04 2013-07-04 确定目标查询序列所对应的搜索引导信息的方法与设备

Publications (2)

Publication Number Publication Date
CN103399862A true CN103399862A (zh) 2013-11-20
CN103399862B CN103399862B (zh) 2016-12-28

Family

ID=49563492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310279434.5A Active CN103399862B (zh) 2013-07-04 2013-07-04 确定目标查询序列所对应的搜索引导信息的方法与设备

Country Status (1)

Country Link
CN (1) CN103399862B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699602A (zh) * 2013-12-13 2014-04-02 北京奇虎科技有限公司 一种建立范文网页数据库的方法和装置
CN104794242A (zh) * 2015-05-11 2015-07-22 何杨洲 一种搜索方法
CN107169133A (zh) * 2017-06-09 2017-09-15 腾讯科技(深圳)有限公司 一种快照抓取方法、装置、服务器及系统
CN108319585A (zh) * 2018-01-29 2018-07-24 北京三快在线科技有限公司 数据处理方法及装置、电子设备、计算机可读介质
CN108664586A (zh) * 2018-05-07 2018-10-16 北京中电普华信息技术有限公司 一种信息的获取方法及系统
CN109582757A (zh) * 2018-12-06 2019-04-05 深圳高企在线科技有限公司 一种知识产权综合信息快速查询方法及系统
CN109657236A (zh) * 2018-12-07 2019-04-19 腾讯科技(深圳)有限公司 引导信息获取方法、装置、电子装置及存储介质
CN116340467A (zh) * 2023-05-11 2023-06-27 腾讯科技(深圳)有限公司 文本处理方法、装置、电子设备及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050160083A1 (en) * 2004-01-16 2005-07-21 Yahoo! Inc. User-specific vertical search
CN101179472A (zh) * 2007-05-31 2008-05-14 腾讯科技(深圳)有限公司 一种网络资源搜索方法及搜索系统
CN103077218A (zh) * 2012-12-28 2013-05-01 百度在线网络技术(北京)有限公司 一种用于确定查询请求中查询序列的需求信息的方法与设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050160083A1 (en) * 2004-01-16 2005-07-21 Yahoo! Inc. User-specific vertical search
CN101179472A (zh) * 2007-05-31 2008-05-14 腾讯科技(深圳)有限公司 一种网络资源搜索方法及搜索系统
CN103077218A (zh) * 2012-12-28 2013-05-01 百度在线网络技术(北京)有限公司 一种用于确定查询请求中查询序列的需求信息的方法与设备

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699602A (zh) * 2013-12-13 2014-04-02 北京奇虎科技有限公司 一种建立范文网页数据库的方法和装置
CN103699602B (zh) * 2013-12-13 2017-08-29 北京奇虎科技有限公司 一种建立范文网页数据库的方法和装置
CN104794242A (zh) * 2015-05-11 2015-07-22 何杨洲 一种搜索方法
CN107169133A (zh) * 2017-06-09 2017-09-15 腾讯科技(深圳)有限公司 一种快照抓取方法、装置、服务器及系统
CN107169133B (zh) * 2017-06-09 2022-12-23 腾讯科技(深圳)有限公司 一种快照抓取方法、装置、服务器及系统
CN108319585A (zh) * 2018-01-29 2018-07-24 北京三快在线科技有限公司 数据处理方法及装置、电子设备、计算机可读介质
CN108664586A (zh) * 2018-05-07 2018-10-16 北京中电普华信息技术有限公司 一种信息的获取方法及系统
CN109582757A (zh) * 2018-12-06 2019-04-05 深圳高企在线科技有限公司 一种知识产权综合信息快速查询方法及系统
CN109657236A (zh) * 2018-12-07 2019-04-19 腾讯科技(深圳)有限公司 引导信息获取方法、装置、电子装置及存储介质
CN109657236B (zh) * 2018-12-07 2022-02-18 腾讯科技(深圳)有限公司 引导信息获取方法、装置、电子装置及存储介质
CN116340467A (zh) * 2023-05-11 2023-06-27 腾讯科技(深圳)有限公司 文本处理方法、装置、电子设备及计算机可读存储介质
CN116340467B (zh) * 2023-05-11 2023-11-17 腾讯科技(深圳)有限公司 文本处理方法、装置、电子设备、及计算机可读存储介质

Also Published As

Publication number Publication date
CN103399862B (zh) 2016-12-28

Similar Documents

Publication Publication Date Title
CN103399862A (zh) 确定目标查询序列所对应的搜索引导信息的方法与设备
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
CN103339623B (zh) 涉及因特网搜索的方法和设备
CN104361102B (zh) 一种基于群组匹配的专家推荐方法及系统
CN101452463A (zh) 定向抓取页面资源的方法和装置
Thung et al. WebAPIRec: Recommending web APIs to software projects via personalized ranking
Du et al. An approach for selecting seed URLs of focused crawler based on user-interest ontology
KR20090006464A (ko) 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체
CN103823906A (zh) 一种基于微博数据的多维度检索排序优化算法和工具
CN104361092A (zh) 搜索方法及装置
CN110543595A (zh) 一种站内搜索系统及方法
US10409866B1 (en) Systems and methods for occupation normalization at a job aggregator
CN111611452A (zh) 搜索文本的歧义识别方法、系统、设备及存储介质
CN102609539B (zh) 一种搜索方法和系统
Murugudu et al. Efficiently harvesting deep web interfaces based on adaptive learning using two-phase data crawler framework
KR100671077B1 (ko) 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템
CN104933099B (zh) 一种为用户提供目标搜索结果的方法与装置
WO2019108740A1 (en) Systems and methods for crawling web pages and parsing relevant information stored in web pages
US10339148B2 (en) Cross-platform computer application query categories
CN104462556A (zh) 问答页面相关问题推荐方法和装置
CN112035723A (zh) 资源库的确定方法和装置、存储介质及电子装置
CN103235784A (zh) 一种用于获取搜索结果的方法与设备
Irfan et al. A review on different ranking algorithms
CN104123337A (zh) 一种预测报考信息的方法和装置
CN103235783A (zh) 一种用于确定优选搜索结果的方法与设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant