CN103235786A - 一种用于提供长尾搜索结果的方法与设备 - Google Patents
一种用于提供长尾搜索结果的方法与设备 Download PDFInfo
- Publication number
- CN103235786A CN103235786A CN201310105431XA CN201310105431A CN103235786A CN 103235786 A CN103235786 A CN 103235786A CN 201310105431X A CN201310105431X A CN 201310105431XA CN 201310105431 A CN201310105431 A CN 201310105431A CN 103235786 A CN103235786 A CN 103235786A
- Authority
- CN
- China
- Prior art keywords
- long
- tail
- sequence
- search results
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明的目的是提供一种用于提供长尾搜索结果的方法与设备。具体地,根据候选长尾序列,获取与候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;根据候选长尾信息记录,建立或更新长尾信息库;根据目标查询序列,在长尾信息库中进行匹配查询,以获得与目标查询序列相对应的一个或多个长尾搜索结果;将一个或多个长尾搜索结果中至少一个提供给目标查询序列所对应的用户。其中,与现有技术相比,本发明通过建立或更新长尾信息库,以根据目标查询序列,在长尾信息库中进行匹配查询,获得与目标查询序列相对应的一个或多个长尾搜索结果,不仅提升了用户需求满意度,也提高了用户获取信息的效率。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种用于提供长尾搜索结果的技术。
背景技术
当前,随着互联网技术的发展及互联网应用对用户学习、工作与生活的渗透,人们越来越多地通过网络获取信息,如通过在搜索引擎搜索栏中输入由多个关键词组成的长尾关键词以准确地表达其需求,进而获得相应的搜索结果,但对于长尾检索,如根据长尾关键词进行匹配查询时,由于长尾关键词通常包含多个词语,搜索引擎通过关键词匹配可从搜索索引库中检索出与用户输入的长尾关键词相匹配的普通搜索结果,并不能识别表述不同但语义相同的长尾序列,如“怎么买车险”和“如何买车险”。而且,由于长尾关键词的搜索量极少,搜索结果不稳定。显然,这样的普通搜索结果往往并不能很好地满足用户的长尾检索需求,从而,降低了用户获取信息的效率,影响了用户的搜索体验。
发明内容
本发明的目的是提供一种用于提供长尾搜索结果的方法与设备。
根据本发明的一个方面,提供了一种用于提供长尾搜索结果的方法,其中,该方法包括以下步骤:
x根据候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;
y根据所述候选长尾信息记录,建立或更新长尾信息库;
其中,该方法还包括:
a根据目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果;
b将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的用户。
根据本发明的另一个方面,还提供了一种用于提供长尾搜索结果的结果提供设备,其中,该结果提供设备包括:
描述获取装置,用于根据候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;
信息库建立装置,用于根据所述候选长尾信息记录,建立或更新长尾信息库;
其中,该结果提供设备还包括:
匹配查询装置,用于根据目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果;
第一提供装置,用于将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的用户。
根据本发明的再一个方面,还提供了一种用于提供长尾搜索结果的计算机设备,其中,该计算机设备包括前述根据本发明另一个方面的用于提供长尾搜索结果的结果提供设备。
根据本发明的又一个方面,还提供了一种用于提供长尾搜索结果的搜索引擎,其中,该搜索引擎包括前述根据本发明另一个方面的用于提供长尾搜索结果的结果提供设备。
根据本发明的还一个方面,还提供了一种用于提供长尾搜索结果的搜索引擎插件,其中,该搜索引擎插件包括前述根据本发明另一个方面的用于提供长尾搜索结果的结果提供设备。
与现有技术相比,本发明通过建立或更新长尾信息库,以根据目标查询序列,在所述长尾信息库中进行匹配查询,获得与所述目标查询序列相对应的一个或多个长尾搜索结果,不仅提升了用户需求满意度,也提高了用户获取信息的效率,相应地,也提升了用户的搜索体验。进一步地,本发明还可获取用户基于所述一个或多个长尾搜索结果中至少一个提交的第一页面访问请求,将所述第一页面访问请求所对应的访问页面提供给所述用户,从而更进一步地提高了用户获取信息的效率,提升了用户的搜索体验及用户需求满意度。而且,本发明获取所述用户基于所述访问页面提交的第二页面访问请求,将所述第二页面访问请求所对应的目标页面提供给所述用户,从而更进一步地提高了用户获取信息的效率,提升了用户需求满意度。此外,本发明还可根据所述目标查询序列,在搜索索引库中进行匹配查询,以获得与所述目标查询序列相对应的通用搜索结果,从而更进一步地提高了用户获取信息的效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的用于提供长尾搜索结果的设备示意图;
图2示出根据本发明一个方面的用于提供长尾搜索结果的长尾搜索结果示意图;
图3示出根据本发明一个方面的用于提供长尾搜索结果的访问页面示意图;
图4示出根据本发明一个优选实施例的用于提供长尾搜索结果的设备示意图;
图5示出根据本发明另一个方面的用于提供长尾搜索结果的方法流程图;
图6示出根据本发明一个优选实施例的用于提供长尾搜索结果的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的用于提供长尾搜索结果的结果提供设备1,其中,结果提供设备1包括描述获取装置11、信息库建立装置12、匹配查询装置13和第一提供装置14。具体地,描述获取装置11根据候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;信息库建立装置12根据所述候选长尾信息记录,建立或更新长尾信息库;匹配查询装置13根据目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果;第一提供装置14将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的用户。在此,结果提供设备1包括但不限于网络设备、用户设备或网络设备与用户设备通过网络相集成所构成的设备。在此,所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现;或者由用户设备实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,所述用户设备可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑PPC或平板电脑等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解上述结果提供设备1仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
具体地,描述获取装置11首先通过搜索引擎、浏览器等第三方设备提供的获取搜索日志的应用程序接口(API),获取多个搜索日志;然后,对该多个搜索日志进行语义分析处理,来获取一个或多个候选长尾序列。例如,描述获取装置11首先通过搜索引擎提供的获取搜索日志的应用程序接口(API),获取到多个搜索日志,如在某段时间内,用户提交的搜索包括了哪些长尾关键词、用户访问了哪些返回的搜索结果等;然后,描述获取装置11对这些搜索日志进行语义分析处理,得到一个或多个候选长尾序列,如由多个近义长尾序列组成的近义长尾序列簇,如由与长尾关键词“苏州游玩有哪些景点是必须去的”属于同义近义词的长尾关键词如“苏州有哪些好玩的?”、“苏州旅游胜地有哪些”、“苏州景点大全”等组成的近义长尾序列簇,再如,由与长尾关联词“怎么买车险”属于同义近义词的长尾关键词如“如何给汽车买保险才好”、“车辆保险在哪里买”、“新手如何买车险?”、“买车险什么保险公司好?怎样投保更有保障?”、“如何给车辆上保险?”、“怎么买车险最便宜”、“怎么买车险划算”、“如何买车险最优惠”等组成的近义长尾序列簇。
本领域技术人员应能理解上述获取候选长尾序列的方式仅为举例,其他现有的或今后可能出现的获取候选长尾序列的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。接着,描述获取装置11根据所述候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录。在此,所述长尾描述信息包括来自互联网用户、第三方应用如提供所述长尾描述信息的官方提供用户等、第三方网络平台如第三方客服平台等用于对所述候选长尾序列所对应的问题信息进行解答的答案信息,如来自平安车险对“车险怎么买最划算?”的回答“车险怎么买最划算?最重要的还是能买到最理赔快、服务好的车险才最划算。理赔难一直是车险顽疾,今年保监会下大力气对此进行治理。平安网销车险积极主动地执行着保监会的各项要求,在提高查勘定损时效、简化流程的同时,在承保、理赔环节推出人性化关怀服务。在“万元以下,资料齐全,一天赔付”的基础上,又推出了“一袋式”理赔服务。当客户需要理赔时,只需在家等候,一切由平安代办。”。在此,所述候选长尾信息记录由所述候选长尾序列及其对应的所述长尾描述信息组成。本领域技术人员应能理解上述长尾描述信息的来源仅为举例,其他现有的或今后可能出现的长尾描述信息的来源如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员应能理解上述长尾描述信息和候选长尾信息记录仅为举例,其他现有的或今后可能出现的长尾描述信息或候选长尾信息记录如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,描述获取装置11获取所述长尾描述信息的方式包括但不限于以下至少任一项:
1)根据所述候选长尾序列,从第三方应用中获取与所述候选长尾序列相对应的长尾描述信息。具体地,描述获取装置11根据所述候选长尾序列,通过约定的通信方式,如http或https等通信协议,如电子邮件、短信平台等,将所述候选行尾序列发送至提供所述长尾描述信息的所述第三方应用对应的第三方应用平台,并通过约定的通信方式,如http或https等通信协议,如电子邮件、短信平台等,接收该第三方应用平台返回的与所述候选长尾序列相对应的长尾描述信息,如第三方应用平台在其数据库中存储的长尾序列及其对应的长尾描述信息,以及该第三方应用的应用相关信息,如联系方式、应用标识信息如logo等。例如,假设用户A通过其移动设备iphone在搜索引擎搜索栏中输入长尾序列,如输入关键词query1“车辆保险在哪里买”,按Enter键,则描述获取装置11通过ASP、JSP等动态网页技术,便获取到用户A提交的该长尾序列query1“车辆保险在哪里买”,并通过约定的通信方式,如http或https等通信协议,如电子邮件、短信平台等,将该长尾序列query1“车辆保险在哪里买”发送至提供所述长尾描述信息的所述第三方应用对应的第三方应用平台,如与该搜索引擎建立了关联信息的平安车险官方客服平台,当平安车险官方客服平台的企业官方专业人员对该问题给予专业解答answer1如“要从投保和理赔两方面来考虑。投保需要考虑的是方便和优惠。目前电话销售和网络销售车险有更多的优惠,网上投保仅需几分钟就能轻松搞定,不受时间和地点的限制。而且网上投保只是投保渠道有所改变,理赔服务还是和线下投保一样。所以,最好的解决方法就是找一家口碑良好的公司,在网站上投保。平安网销车险平台现在可以说是家喻户晓,完全满足了车辆保险在哪里买的各种条件。在平安车险网销平台上有详细的车险条款讲解、有在线专家免费咨询,网上报价清晰列出每项险种及对应的保费,优惠价、对比市场价、多省保费均一目了然,报价精准,可直接在线支付。在理赔环节,平安产险依托平安集团强大的IT支持系统及后援集中平台,通过系统控制及集中作业管理为客户提供高质量、标准统一的救援、送修、定损、赔款支付等理赔服务。”,并通过约定的通信方式,如http或https等通信协议将该专业解答发送至结果提供设备1,则描述获取装置11通过约定的通信方式,如http或https等通信协议,便接收到该专业解答,即获取到与用户A提交的所述候选长尾序列相对应的所述长尾描述信息。
2)根据所述候选长尾序列,在预定长尾信息库中进行匹配查询,以获得与所述候选长尾序列相对应的长尾描述信息。在此,所述预定长尾信息库用于存储所述候选长尾序列及其对应的长尾描述信息,其可以是一个或多个,既可位于结果提供设备1的本地服务器中,也可位于与结果提供设备1通过网络相连的其他服务器中,如向结果提供设备1开放接口的第三方应用平台所对应的服务器中。本领域技术人员应能理解上述预定长尾信息库仅为举例,其他现有的或今后可能出现的预定长尾信息库如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。例如,接上例,平安车险官方客服平台的企业官方专业人员将query1及其对应的answer1以问答形式上传至其预定长尾信息库中,则描述获取装置11根据用户A所提交的所述候选长尾序列,在平安车险官方客服平台所对应的预定长尾信息库中进行匹配查询,便可获得与所述候选长尾序列相对应的长尾描述信息,即得到answer1。
本领域技术人员应能理解上述获取长尾描述信息的方式仅为举例,其他现有的或今后可能出现的获取长尾描述信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,描述获取装置11根据所述候选长尾序列,及与所述候选长尾序列相对应的长尾描述信息,得到对应的候选长尾信息记录,如将所述候选长尾序列及其对应的所述长尾描述信息组成序列-信息对,并将该序列-信息对作为所述候选长尾信息记录。例如,接上例,描述获取装置11将query1与answer1以问答形式组成一对,来得到所述候选长尾信息记录。
信息库建立装置12根据所述候选长尾信息记录,建立或更新长尾信息库。例如,接上例,信息库建立装置12可将所述候选长尾序列及其对应的长尾描述信息存储于长尾信息库中,并按一定方式更新该长尾信息库,如按照预定周期、定时更新、立即更新所述长尾信息库。在此,所述长尾信息库用于存储所述候选长尾序列及其对应的长尾描述信息,其可以是一个或多个,既可位于结果提供设备1的本地服务器中,也可位于与结果提供设备1通过网络相连的其他服务器中,如向结果提供设备1开放接口的第三方应用平台所对应的服务器中。
本领域技术人员应能理解上述更新所述长尾信息库的方式仅为举例,其他现有的或今后可能出现的更新所述长尾信息库的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
匹配查询装置13首先通过ASP、JSP等动态网页技术,或者通过搜索引擎提供的应用程序接口(API),获取用户通过用户设备提交的目标查询序列;然后,再根据目标查询序列,在所述长尾信息库中进行匹配查询,如将所述目标查询序列与所述长尾信息库中的候选长尾序列和/或所述长尾信息库中的候选长尾序列对应的长尾描述信息进行文本匹配、语义匹配等,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果。例如,若搜索用户A通过其移动设备iphone在搜索引擎搜索栏中输入关键词“怎么买车险”,按Enter键,则匹配查询装置13通过ASP、JSP等动态网页技术,便获取用户A通过其移动设备iphone提交的目标查询序列“怎么买车险”;然后,匹配查询装置13根据该目标查询序列“怎么买车险”,在信息库建立装置12建立的所述长尾信息库中进行匹配查询,获得与所述目标查询序列相对应的一个或多个长尾搜索结果,如所述长尾信息库中与目标序列“如何买车险”相匹配的候选长尾信息记录I至V:
I query:车辆保险在哪里买?是一个重要问题
answer:要从投保和理赔两方面来考虑。投保需要考虑的是方便和优惠。目前电话销售和网络销售车险有更多的优惠,网上投保仅需几分钟就能轻松搞定,不受时间和地点的限制。而且网上投保只是投保渠道有所改变,理赔服务还是和线下投保一样。所以,最好的解决方法就是找一家口碑良好的公司,在网站上投保。平安网销车险平台现在可以说是家喻户晓,完全满足了车辆保险在哪里买的各种条件。在平安车险网销平台上有详细的车险条款讲解、有在线专家免费咨询,网上报价清晰列出每项险种及对应的保费,优惠价、对比市场价、多省保费均一目了然,报价精准,可直接在线支付。在理赔环节,平安产险依托平安集团强大的IT支持系统及后援集中平台,通过系统控制及集中作业管理为客户提供高质量、标准统一的救援、送修、定损、赔款支付等理赔服务。
II query:新手如何买车险?怎样全面投保才最为保障?
answer:平安车险专家推荐全面保障型车险组合:第三者责任险(50万元)+车损险+车上人员责任险+盗抢险+玻璃单独破碎险+不计免赔险+划痕险。如果车主驾驶的是价值较高的新车,那最好选择投保盗抢险、划痕险和玻璃单独破碎险,可以更好地保障车辆。投保车险的渠道也日趋多元化,车主可以通过4S店、保险代理渠道投保,也可以直接到保险公司网点投保,如果车主不想奔波的话可以通过电话车险和网上车险渠道来投保。如在平安车险率先推出的车险与网上车险直销渠道上投保,私家车主可以享受更多的优惠折扣。车主通过直销平台,10分钟即可完成投保流程,确认投保后还可通过线上线下多种支付渠道支付保费,大大节约了经济成本与时间成本。新手投保一般要避免两个误区:一是避免超额投保或不足额投保,二是避免重复保险。
III query:如何给汽车买保险才好?如何在家中轻松为车辆投保?
answer:汽车买回家以后,紧接着就是为爱车投一份保险。关于如何给汽车买保险,车主们可能都有各自不同的方法。有人去保险公司的营销部投保,有人通过电话为汽车投保,还有不少人不出门也不打电话,悄悄地在家里就可以完成车辆的投保流程。至目前,平安官网的网上直销车险因其良好的信誉和安全性受到广大车主的信赖。车主们登录平安官网的网上车险平台投保车险,从填写相关资料起到获得各险种的报价,直到最后完成付款,一系列的流程没有丝毫繁琐,全部流程完成后,只需用大约十分钟时间。由于平安网上车险是直销车险,所以省去了中间环节,而使车主能够得到私家车商业险多省15%的大优惠。另外,车主们通过平安网上直销车险平台来投保车险,不仅可以得到“万元以下,资料齐全,一天支付”的快速理赔服务,而且还可尊享免费上门代收索赔资料的增值服务。
IV query:如何给车辆上保险?
answer:如何给车辆上保险,首先我们得先知道分类。简单而言,车险按性质可分为强制保险与商业险。交强险是国家规定强制购买的保险;商业险是非强制购买的保险,车主可以根据实际情况进行选择性购买。商业险根据保障的责任范围分为基本险和附加险。基本险如:商业第三者责任险、车辆损失险、全车盗抢险、车上人员责任险,其特点是投保人可以选择其中的部分险种,也可是全部投保。附加险有:玻璃单独破碎险、自燃损失险、车身划痕险、不计免赔率特约条款。这些都必须先投保基本险后才能投保。如何给车辆上保险,了解险种是基础,最重要的还是最终选择一个好的保险公司。平安产险几个分公司理赔服务的抽查合格率为100%,完全履行了7×24小时接报案、7×24小时查勘救援的服务标准,并在响应速度、理赔效率和诚信服务品质上处于行业领先水平。
V query:汽车保险如何购买更好
answer:我国法律明确规定,车辆必须投保交强险之后才能上路行驶,否则将面临罚款扣车的处罚。从去年开始,不少的车主已率先开始通过互联网来办理车险的投保事宜,平安保险公司官方网站推出的网上车险直销渠道,因其良好的信誉及优质的售后服务等,受到了车主们的一致好评。在平安网上车险投保,只要车主填写了自己及车辆的相关资料后,即可进行商业险和交强险的选择及投保。车主可以得到非常透明的网上报价,平安网上车险计算器能为您列出非常精确的车险报价和市场价。实际上,平安网上车险属于直销平台,省去了中间环节,所以车主们能够享受“私家车商业险多省15%”的优惠。经过了报价环节,您确定要投保的险种以后,就可以完善投保资料并选择付款方式,继而完成车险的投保之旅了。
接着,第一提供装置14通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将所述一个或多个长尾搜索结果中至少一个如候选长尾信息记录I提供给所述目标查询序列所对应的用户,如首先将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的目标应用,如搜索引擎、浏览器等,再由该目标应用向所述用户展示所述一个或多个长尾搜索结果中至少一个,如将所述长尾搜索结果展示在搜索引擎搜索栏中的下方、作为第一条搜索结果展示等,供用户浏览,如图2所示。
优选地,匹配查询装置13还可首先获取所述目标查询序列;然后,检测所述目标查询序列是否满足长尾触发条件;当满足所述长尾触发条件时,根据所述目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果。
具体地,匹配查询装置13可首先通过ASP、JSP等动态网页技术,或者通过搜索引擎提供的应用程序接口(API),获取用户通过用户设备提交的所述目标查询序列。例如,若用户A通过其移动设备iphone在搜索引擎搜索栏中输入长尾关键词如“怎么买车险”或“怎么买车险最便宜”,按Enter键,则匹配查询装置13通过ASP、JSP等动态网页技术,便获取用户A通过其移动设备iphone提交的目标查询序列如“怎么买车险”。
本领域技术人员应能理解上述获取目标查询序列的方式仅为举例,其他现有的或今后可能出现的获取目标查询序列的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
然后,匹配查询装置13检测所述目标查询序列是否满足长尾触发条件。在此,所述长尾触发条件包括但不限于以下至少任一项:1)所述目标查询序列中的词语数量满足预定的词数阈值;2)所述目标查询序列中的文字数量满足预定的字数阈值;3)所述目标查询序列所对应的分类信息满足属于预定的类别信息。
例如,当所述长尾触发条件包括所述目标查询序列中的词语数量满足预定的词数阈值时,接上例,匹配查询装置13首先获取到用户A通过其移动设备iphone提交的目标查询序列“怎么买车险”,然后匹配查询装置13对该目标查询序列“怎么买车险”进行切词处理,得到该目标查询序列“怎么买车险”所包含的词语信息{怎么,买,车险},匹配查询装置13检测发现该词语信息{怎么,买,车险}对应的词语数量满足预定的词数阈值如2个词语,则匹配查询装置13判断该目标查询序列“怎么买车险”满足长尾触发条件;再如,当所述长尾触发条件包括所述目标查询序列中的文字数量满足预定的字数阈值时,接上例,匹配查询装置13检测发现目标查询序列“怎么买车险”对应的文字数量为5个,满足预定的字数阈值如4个,则匹配查询装置13判断该目标查询序列“怎么买车险”满足长尾触发条件;还如,当所述长尾触发条件包括所述目标查询序列所对应的分类信息满足属于预定的类别信息时,在此,所述预定的类别信息包括行业类别,如根据行业特征,某一些行业的部分长尾关键词比较专业和精准,如专业术语“庞加莱猜想”、“蒙特卡洛分析方法”、“薛定谔方程”、“脱氧核糖核酸”等,假设匹配查询装置13首先获取到用户A提交的所述目标查询序列为“蒙特卡洛分析方法”,则匹配查询装置13检测发现该目标查询序列为“蒙特卡洛分析方法”满足属于预定的类别信息如数学类别,则匹配查询装置13判断该目标查询序列“蒙特卡洛分析方法”满足长尾触发条件。
本领域技术人员应能理解上述检测所述目标查询序列是否满足长尾触发条件的方式仅为举例,其他现有的或今后可能出现的检测所述目标查询序列是否满足长尾触发条件的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
当满足所述长尾触发条件时,匹配查询装置13根据所述目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果。本领域技术人员应能理解上述长尾信息库仅为举例,其他现有的或今后可能出现的长尾信息库如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。例如,假设匹配查询装置13获取到用户A通过其移动设备iphone提交的目标查询序列如“怎么买车险”,匹配查询装置13检测到该目标查询序列满足长尾触发条件,则匹配查询装置13根据该目标查询序列,在所述长尾信息库中进行匹配查询,以获得与该目标查询序列相对应的一个或多个长尾搜索结果如上述候选长尾信息记录I至V。
结果提供设备1的各个装置之间是持续不断工作的。具体地,描述获取装置11持续根据候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;信息库建立装置12持续根据所述候选长尾信息记录,建立或更新长尾信息库;匹配查询装置13持续根据目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果;第一提供装置14持续将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的用户。在此,本领域技术人员应能理解,所述“持续”是指结果提供设备1的各个装置之间持续不断地进行候选长尾信息记录的获取、长尾信息库的建立、长尾搜索结果的获得与提供,直至结果提供设备1在较长时间内停止长尾搜索结果的获得。
优选地,结果提供设备1还包括通用搜索结果获取装置(未示出)。具体地,通用结果获取装置根据所述目标查询序列,在搜索索引库中进行匹配查询,以获得与所述目标查询序列相对应的通用搜索结果;其中,第一提供装置14将所述一个或多个长尾搜索结果中至少一个,以及所述通用搜索结果中至少一个,提供至所述用户。
具体地,通用结果获取装置根据所述目标查询序列,在搜索索引库中进行匹配查询,以获得与所述目标查询序列相对应的通用搜索结果。例如,假设匹配查询装置13获取到用户A通过其移动设备iphone提交的目标查询序列如“怎么买车险”,则通用结果获取装置根据该目标查询序列,在搜索引擎通过在爬虫抓取到的网页建立起来的搜索索引库如网页数据库中进行匹配查询,以获得与所述目标查询序列相对应的通用搜索结果,如包含“怎么买车险”的网页链接,如“怎么买车险人保多省15%2013最新报价赢油卡”、“如何买车险百度知道”。
本领域技术人员应能理解上述获得与所述目标查询序列相对应的通用搜索结果的方式仅为举例,其他现有的或今后可能出现的获得与所述目标查询序列相对应的通用搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第一提供装置14通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议将所述一个或多个长尾搜索结果中至少一个,以及所述通用搜索结果中至少一个,提供给所述用户,如提供给所述用户的用户设备,供所述用户浏览。
在一个优选实施例中(如图1所示),结果提供设备1还包括第一请求获取装置(未示出)和第二提供装置(未示出)。在此,参考图1对该优选实施例进行说明:具体地,描述获取装置11根据候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;信息库建立装置12根据所述候选长尾信息记录,建立或更新长尾信息库;匹配查询装置13根据目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果;第一提供装置14将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的用户;第一请求获取装置获取所述用户基于所述一个或多个长尾搜索结果中至少一个提交的第一页面访问请求;第二提供装置将所述第一页面访问请求所对应的访问页面提供给所述用户。在此,描述获取装置11、信息库建立装置12、匹配查询装置13和第一提供装置14与图1中所示实施例中对应装置的内容相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
具体地,第一请求获取装置通过诸如ASP、JSP或PHP等动态网页技术,或者搜索引擎等第三方设备所提供的应用程序接口(API);或者,通过HTTP、HTTPS等约定的通信方式,获取所述用户基于所述一个或多个长尾搜索结果中至少一个提交的第一页面访问请求。在此,所述第一页面访问请求包括所述用户点击所述一个或多个长尾搜索结果中至少一个对应的链接。例如,假设用户A通过其移动设备iphone提交了目标查询序列如“怎么买车险”,第一提供装置14将如图2所示的长尾搜索结果提供给用户A,而用户A在阅读了图2所示的长尾搜索结果之后,点击了长尾搜索结果如候选长尾信息记录I对应的链接,则第一请求获取装置通过诸如ASP、JSP或PHP等动态网页技术,便获取到用户A所述一个或多个长尾搜索结果中至少一个提交的第一页面访问请求。
本领域技术人员应能理解上述获取所述第一页面访问请求的方式仅为举例,其他现有的或今后可能出现的获取所述第一页面访问请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第二提供装置通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议将所述第一页面访问请求所对应的访问页面提供给所述用户。在此,所述访问页面包括当网络用户意欲访问所述第一页面访问请求所对应的链接所指向的原始页面时,为网络用户提供的与所述第一页面访问请求所对应的第一访问页面的页面信息,及以所述第一页面访问请求所对应的长尾搜索结果包括的长尾信息记录相对应的中间页面。在此,所述第一页面访问请求所对应的第一访问页面的页面信息包括但不限于以下至少任一项:1)所述第一页面访问请求对应的链接所指向的原始页面,即提供所述第一页面访问请求所对应的长尾搜索结果包括的长尾信息记录的提供用户的主页面,如提供用户的着陆页landingpage;2)所述第一页面访问请求所对应的链接所指向的原始页面中,与所述第一页面访问请求所对应的长尾搜索结果包括的长尾信息记录相匹配的页面内容信息位置处的页面信息,如文本描述、图片、动画等内容信息。本领域技术人员应能理解上述访问页面和第一访问页面仅为举例,其他现有的或今后可能出现的访问页面或第一访问页面如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
例如,接上例,第一请求获取装置获取到用户A点击了图2中所示的长尾搜索结果如候选长尾信息记录I对应的链接的第一页面访问请求,则第二提供装置根据所述第一页面访问请求,在页面信息数据库中进行匹配查询,以获得与所述第一页面访问请求相对应的第一访问页面如所述第一页面访问请求对应的链接所指向的原始页面中与所述第一页面访问请求所对应的长尾搜索结果包括的长尾信息记录相匹配的页面内容信息位置处的链接页面如http://chexian.pingan.com/campaign/pa/index.jsp?WT.mc_id=c03-BDZS-201&WT.srch=1;然后,第二提供装置根据该链接页面,结合长尾信息记录I,生成所述访问页面,如以该主页面为背景、长尾信息记录I为浮层,得到访问页面,然后,通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将该访问页面提供给用户A,如图3所示。
优选地,第二提供装置还可首先根据所述第一页面访问请求,在页面信息数据库中进行匹配查询,以获得与所述第一页面访问请求相对应的第一访问页面;然后,根据所述第一访问页面,结合所述一个或多个长尾搜索结果中至少一个包括的长尾信息记录,生成所述访问页面;接着,将所述访问页面提供给所述用户。例如,假设第一请求获取装置获取到用户A点击了图2中所示的长尾搜索结果如候选长尾信息记录I对应的链接的第一页面访问请求,则第二提供装置首先根据所述第一页面访问请求,在页面信息数据库中进行匹配查询,以获得与所述第一页面访问请求相对应的第一访问页面,如所述第一页面访问请求对应的链接所指向的原始页面中与所述第一页面访问请求所对应的长尾搜索结果包括的长尾信息记录相匹配的页面内容信息位置处的链接页面如http://chexian.pingan.com/campaign/pa/index.jsp?WT.mc_id=c03-BDZS-201&WT.srch=1;然后,第二提供装置根据该主页面,结合长尾信息记录I,生成所述访问页面,如以该主页面为背景、长尾信息记录I为浮层,得到访问页面,然后,通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将该访问页面提供给用户A,如图3所示。
本领域技术人员应能理解上述生成所述访问页面的方式仅为举例,其他现有的或今后可能出现的生成所述访问页面的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,结果提供设备1还包括第二请求获取装置(未示出)和第三提供装置(未示出)。具体地,第二请求获取装置获取所述用户基于所述访问页面提交的第二页面访问请求;第三提供装置将所述第二页面访问请求所对应的目标页面提供给所述用户。
具体地,第二请求获取装置通过诸如ASP、JSP或PHP等动态网页技术,或者搜索引擎等第三方设备所提供的应用程序接口(API);或者,通过HTTP、HTTPS等约定的通信方式,获取所述用户基于所述访问页面提交的第二页面访问请求。在此,所述第二页面访问请求包括用户点击所述访问页面中的相关按钮,如点击访问页面中的关闭按钮、了解更多按钮等。例如,接上例,第二提供装置将如图3所示的访问页面提供给用户A,当用户A阅读完如图3所示的访问页面中的长尾信息记录后,认为该长尾信息记录对其有帮助,然后点击了页面中的关闭按钮,则第二请求获取装置通过诸如ASP、JSP或PHP等动态网页技术便获取到用户A基于所述访问页面提交的第二页面访问请求。
本领域技术人员应能理解上述触发所述第二页面访问请求的方式仅为举例,其他现有的或今后可能出现的获触发所述第二页面访问请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员应能理解上述获取所述第二页面访问请求的方式仅为举例,其他现有的或今后可能出现的获取所述第二页面访问请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第三提供装置通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议将所述第二页面访问请求所对应的目标页面提供给所述用户。例如,接上例,第二请求获取装置获取到用户A点击图3所示的访问页面中的关闭按钮的第二页面访问请求,则第三提供装置可直接将提供该访问页面中的长尾信息记录的提供用户的主页面中与所述长尾信息记录相匹配的页面内容信息位置处的链接页面如用户A希望继续进行相关操作如计算车险的页面http://chexian.pingan.com/campaign/pa/index.jsp?WT.mc_id=c03-BDZS-201&WT.srch=1作为所述第二页面访问请求所对应的目标页面提供给用户A。在此,本发明不仅实现了提高用户获取信息的效率的有益效果,还实现了进一步满足用户需求、方便用户操作的有益效果。
本领域技术人员应能理解,在具体实施例中,第一提供装置14、第二提供装置和第三提供装置可集成在一起,也可相互分离。
优选地,可将上述用于提供长尾搜索结果的结果提供设备1,与现有搜索引擎相结合,构成一种新的搜索引擎,现有的搜索引擎包括但不限于如Google公司的Google搜索引擎、百度公司的baidu搜索引擎、百度知道等。
优选地,可将上述用于用于提供长尾搜索结果的结果提供设备1,与现有搜索引擎插件相结合,构成一种新的搜索引擎插件,现有的包括但不限于如Google公司的Google ToolBar、百度公司的百度搜霸、微软公司的MSN ToolBar等搜索引擎插件。
图4示出根据本发明一个优选实施例的用于提供长尾搜索结果的设备示意图,其中,结果提供设备1包括描述获取装置11’、信息库建立装置12’、匹配查询装置13’和第一提供装置14’,其中,描述获取装置11’包括序列簇获取单元111’和描述获取单元112’。具体地,序列簇获取单元111’获取一个或多个近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列;描述获取单元112’根据所述候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;信息库建立装置12’根据所述候选长尾信息记录,建立或更新长尾信息库;匹配查询装置13’根据目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果;第一提供装置14’将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的用户。在此,信息库建立装置12’、匹配查询装置13’和第一提供装置14’与图1中所示实施例中对应装置的内容相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
具体地,序列簇获取单元111’通过搜索引擎、浏览器等第三方设备提供的获取搜索日志的应用程序接口(API),获取多个搜索日志;然后,对该多个搜索日志进行语义分析处理,获取一个或多个近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。例如,序列簇获取单元111’首先通过搜索引擎提供的获取搜索日志的应用程序接口(API),获取到多个搜索日志,如在某段时间内,用户提交的搜索包括了哪些长尾关键词、用户访问了哪些返回的搜索结果等;然后,序列簇获取单元111’对这些搜索日志进行语义分析处理,得到一个或多个近义长尾序列簇,如由多个近义长尾序列组成的近义长尾序列簇,如由与长尾关键词“苏州游玩有哪些景点是必须去的”属于同义近义词的长尾关键词如“苏州有哪些好玩的?”、“苏州旅游胜地有哪些”、“苏州景点大全”等组成的近义长尾序列簇,再如,由与长尾关联词“怎么买车险”属于同义近义词的长尾关键词如“如何给汽车买保险才好”、“车辆保险在哪里买”、“新手如何买车险?”、“买车险什么保险公司好?怎样投保更有保障?”、“如何给车辆上保险?”、“怎么买车险最便宜”、“怎么买车险划算”、“如何买车险最优惠”等组成的近义长尾序列簇,则序列簇获取单元111’可将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。
优选地,序列簇获取单元111’可根据已标注近义关系的多个长尾序列训练样本,对所述多个长尾序列训练样本进行聚类处理,以获得所述一个或多个近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。例如,假设存在已标注近义关系的多个长尾序列训练样本如下所示:
①对于旅游查询,“必须去”、“旅游胜地”、“重要景点”、“景点大全”属于近义关系词语;
②对于车险查询,“如何买车险”、“如何给车辆上保险”、“怎么给车辆上保险”、“怎样投保车险”属于近义关系词语;
……
则序列簇获取单元111’可根据该已标注近义关系的多个长尾序列训练样本,对该多个长尾序列训练样本进行聚类处理,如将标注属于近义关系的长尾序列训练样本归为一类,从而得到所述一个或多个近义长尾序列簇,如将含有上述已标注近义关系的长尾序列训练样本①的长尾序列归为一类得到cluster1,将上述已标注近义关系的长尾序列训练样本②的长尾序列归为一类得到cluster2,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列.
优选地,序列簇获取单元111’包括会话获取单元(未示出)、初始序列簇获取单元(未示出)和筛选处理单元(未示出)。具体地,会话获取单元从多个搜索日志中获取一个或多个搜索会话,其中,所述搜索会话包括对应的长尾序列及其对应的搜索结果;初始序列簇获取单元根据所述一个或多个搜索会话,获取一个或多个初始近义长尾序列簇;筛选处理单元根据所述初始近义长尾序列簇中长尾序列对应的用户应用频度信息,对所述初始近义长尾系列簇中的长尾序列进行筛选处理,以获得所述近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。
具体地,会话获取单元首先通过搜索引擎、浏览器等第三方设备提供的获取搜索日志的应用程序接口(API),获取多个搜索日志;然后,再从所述多个搜索日志中获取一个或多个搜索会话,其中,所述搜索会话包括对应的长尾序列及其对应的搜索结果。例如,假设搜索用户A通过其移动设备iphone在搜索引擎搜索栏中输入关键词“怎么买车险”,按Enter键,然后在搜索引擎返回的多个搜索结果中点击搜索结果“车辆保险在哪里买”对应的链接进入该页面进行浏览,则会话获取单元可通过该搜索引擎提供的获取搜索日志的应用程序接口(API),获取到该搜索会话,其包括用户A输入的查询序列“怎么买车险”及访问的搜索结果“车辆保险在哪里买”。
初始序列簇获取单元根据所述一个或多个搜索会话,获取一个或多个初始近义长尾序列簇;在此,初始序列簇获取单元获取所述初始近义长尾序列簇的方式包括但不限于以下至少任一项;
1)根据所述搜索会话对应的搜索结果,通过对所述搜索会话对应的搜索结果如搜索结果对应的摘要文本、标题链接文本、页面主体内容等进行语义分析,对所述一个或多个搜索会话进行分类处理,以获得所述一个或多个初始近义长尾序列簇,其中,所述初始近义长尾序列簇包括属于同一类搜索会话的长尾序列。例如,假设会话获取单元获取如下多个搜索会话I至V:
I“怎么买车险”:“车辆保险在哪里买”
“新手如何买车险?”
“买车险什么保险公司好?怎样投保更有保障?”
“如何给车辆上保险?”
“怎么买车险最便宜”
II“如何买车险”:“如何给汽车买保险才好”
“新手如何买车险?”
“车险怎么买最划算?”
“汽车保险如何购买更好?”
III“怎么买车险”:“车辆保险在哪里买”
“新手如何买车险?”
IV“苏州有哪些好玩的”:“推荐下苏州好玩的地方”
“苏州有哪些好玩的地方,急急急!”
“要去苏州旅游了最应该去哪些地方?”
V“苏州游玩必须去的地方”:
“要去苏州旅游了最应该去哪些地方?”
“苏州旅游哪些地方必去?”
则初始序列簇获取单元通过诸如对搜索会话I至V对应的搜索结果如搜索结果对应标题链接文本进行语义分析,对搜索会话I至V对应的搜索结果进行分类处理,得到搜索会话I至V的分类,如搜索会话I至III归为同一类,搜索会话IV和V归为同一类;然后,初始序列簇获取单元根据获得的搜索会话分类,将属于同一类的搜索会话的长尾序列作为初始近义长尾序列簇,如获得与搜索会话I至III对应的初始近义长尾序列簇cluster1,其包括“怎么买车险”、“如何买车险”、“怎么买车险”,与搜索会话IV和V对应的初始近义长尾序列簇cluster2,其包括“苏州有哪些好玩的、“苏州游玩必须去的地方”。
2)对所述一个或多个搜索会话对应的长尾序列进行分类处理,以获得所述一个或多个初始近义长尾序列簇,其中,所述初始近义长尾序列簇包括属于同一类的长尾序列。例如,接上例,初始序列簇获取单元通过语义分析,对会话获取单元获取的搜索会话I至V对应的查询序列进行分类处理,获得一个或多个初始近义长尾序列簇,其中,所述初始近义长尾序列簇包括属于同一类的长尾序列,如初始序列簇获取单元可获得与搜索会话I至III对应的初始近义长尾序列簇cluster1,其包括“怎么买车险”、“如何买车险”、“怎么买车险”,与搜索会话IV和V对应的初始近义长尾序列簇cluster2,其包括“苏州有哪些好玩的”、“苏州游玩必须去的地方”。
3)将所述搜索会话中长尾序列及其对应的搜索结果作为所述初始近义长尾序列簇。例如,假设会话获取单元获取到搜索日志中用户A点击了与查询序列“怎么买车险”相匹配的多个搜索结果如title1“车辆保险在哪里买”和title2“新手如何买车险?”,则初始序列簇获取单元将搜索结果title1“车辆保险在哪里买”对应的标题及搜索结果title2“新手如何买车险?”对应的标题作为长尾序列,与长尾序列“怎么买车险”构成所述初始近义长尾序列簇。
4)将所述搜索记录中相同搜索结果对应的不同长尾序列作为所述初始近义长尾序列簇。例如,假设会话获取单元获取到搜索日志中用户A点击了与长尾序列“如何买车险”相匹配的多个搜索结果中的搜索结果如“新手如何买车险?”,而用户B根据长尾序列“怎么买车险”进行搜索时,也点击了长尾序列“怎么买车险相匹配的多个搜索结果中的搜索结果如“新手如何买车险?”,则初始序列簇获取单元将长尾序列“如何买车险”与怎么买车险”构成所述初始近义长尾序列簇。
本领域技术人员应能理解上述获取初始近义长尾序列簇的方式仅为举例,其他现有的或今后可能出现的获取初始近义长尾序列簇的方式仅如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
筛选处理单元根据所述初始近义长尾序列簇中长尾序列对应的用户应用频度信息,对所述初始近义长尾系列簇中的长尾序列进行筛选处理,以获得所述近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。在此,所述用户应用频度信息包括但不限于如用户对所述长尾序列的检索次数、用户查看所述长尾序列对应搜索结果的次数等。例如,假设初始序列簇获取单元获得的初始近义长尾序列簇包括初始近义长尾序列簇cluster1,其包括“怎么买车险”、“如何买车险”、“怎么买车险”,初始近义长尾序列簇cluster2,其包括“苏州有哪些好玩的”、“苏州游玩必须去的地方”,假设,对于初始近义长尾序列簇cluster1的长尾序列,用户对长尾序列“怎么买车险”及“如何买车险”的检索次数高于对长尾序列“怎么买车险”的检索次数,则筛选处理单元可将长尾序列“怎么买车险”从初始近义长尾序列簇cluster1中删除,得到删除后的初始近义长尾序列簇cluster1,其包括“怎么买车险”、“如何买车险”。
本领域技术人员应能理解上述对所述初始近义长尾系列簇中的长尾序列进行筛选处理的方式仅为举例,其他现有的或今后可能出现的对所述初始近义长尾系列簇中的长尾序列进行筛选处理的方式仅如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,描述获取单元112’根据所述候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录。在此,描述获取单元112’获取所述长尾描述信息及对应的候选长尾信息记录的方式与图1中描述获取装置11获取所述长尾描述信息及对应的候选长尾信息记录的方式的内容相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
图5示出根据本发明另一个方面的用于提供长尾搜索结果的方法流程图。
具体地,在步骤S1中,结果提供设备1根据候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;在步骤S2中,结果提供设备1根据所述候选长尾信息记录,建立或更新长尾信息库;在步骤S3中,结果提供设备1根据目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果;在步骤S4中,结果提供设备1将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的用户。在此,结果提供设备1包括但不限于网络设备、用户设备或网络设备与用户设备通过网络相集成所构成的设备。在此,所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现;或者由用户设备实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,所述用户设备可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、PDA、掌上电脑PPC或平板电脑等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解上述结果提供设备1仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
具体地,在步骤S1中,结果提供设备1首先通过搜索引擎、浏览器等第三方设备提供的获取搜索日志的应用程序接口(API),获取多个搜索日志;然后,对该多个搜索日志进行语义分析处理,来获取一个或多个候选长尾序列。例如,在步骤S1中,结果提供设备1首先通过搜索引擎提供的获取搜索日志的应用程序接口(API),获取到多个搜索日志,如在某段时间内,用户提交的搜索包括了哪些长尾关键词、用户访问了哪些返回的搜索结果等;然后,在步骤S1中,结果提供设备1对这些搜索日志进行语义分析处理,得到一个或多个候选长尾序列,如由多个近义长尾序列组成的近义长尾序列簇,如由与长尾关键词“苏州游玩有哪些景点是必须去的”属于同义近义词的长尾关键词如“苏州有哪些好玩的?”、“苏州旅游胜地有哪些”、“苏州景点大全”等组成的近义长尾序列簇,再如,由与长尾关联词“怎么买车险”属于同义近义词的长尾关键词如“如何给汽车买保险才好”、“车辆保险在哪里买”、“新手如何买车险?”、“买车险什么保险公司好?怎样投保更有保障?”、“如何给车辆上保险?”、“怎么买车险最便宜”、“怎么买车险划算”、“如何买车险最优惠”等组成的近义长尾序列簇。
本领域技术人员应能理解上述获取候选长尾序列的方式仅为举例,其他现有的或今后可能出现的获取候选长尾序列的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S1中,结果提供设备1根据所述候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录。在此,所述长尾描述信息包括来自互联网用户、第三方应用如提供所述长尾描述信息的官方提供用户等、第三方网络平台如第三方客服平台等用于对所述候选长尾序列所对应的问题信息进行解答的答案信息,如来自平安车险对“车险怎么买最划算?”的回答“车险怎么买最划算?最重要的还是能买到最理赔快、服务好的车险才最划算。理赔难一直是车险顽疾,今年保监会下大力气对此进行治理。平安网销车险积极主动地执行着保监会的各项要求,在提高查勘定损时效、简化流程的同时,在承保、理赔环节推出人性化关怀服务。在“万元以下,资料齐全,一天赔付”的基础上,又推出了“一袋式”理赔服务。当客户需要理赔时,只需在家等候,一切由平安代办。”。在此,所述候选长尾信息记录由所述候选长尾序列及其对应的所述长尾描述信息组成。本领域技术人员应能理解上述长尾描述信息的来源仅为举例,其他现有的或今后可能出现的长尾描述信息的来源如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。本领域技术人员应能理解上述长尾描述信息和候选长尾信息记录仅为举例,其他现有的或今后可能出现的长尾描述信息或候选长尾信息记录如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,在步骤S1中,结果提供设备1获取所述长尾描述信息的方式包括但不限于以下至少任一项:
1)根据所述候选长尾序列,从第三方应用中获取与所述候选长尾序列相对应的长尾描述信息。具体地,在步骤S1中,结果提供设备1根据所述候选长尾序列,通过约定的通信方式,如http或https等通信协议,如电子邮件、短信平台等,将所述候选行尾序列发送至提供所述长尾描述信息的所述第三方应用对应的第三方应用平台,并通过约定的通信方式,如http或https等通信协议,如电子邮件、短信平台等,接收该第三方应用平台返回的与所述候选长尾序列相对应的长尾描述信息,如第三方应用平台在其数据库中存储的长尾序列及其对应的长尾描述信息,以及该第三方应用的应用相关信息,如联系方式、应用标识信息如logo等。例如,假设用户A通过其移动设备iphone在搜索引擎搜索栏中输入长尾序列,如输入关键词query1“车辆保险在哪里买”,按Enter键,则描述获取装置11通过ASP、JSP等动态网页技术,便获取到用户A提交的该长尾序列query1“车辆保险在哪里买”,并通过约定的通信方式,如http或https等通信协议,如电子邮件、短信平台等,将该长尾序列query1“车辆保险在哪里买”发送至提供所述长尾描述信息的所述第三方应用对应的第三方应用平台,如与该搜索引擎建立了关联信息的平安车险官方客服平台,当平安车险官方客服平台的企业官方专业人员对该问题给予专业解答answer1如“要从投保和理赔两方面来考虑。投保需要考虑的是方便和优惠。目前电话销售和网络销售车险有更多的优惠,网上投保仅需几分钟就能轻松搞定,不受时间和地点的限制。而且网上投保只是投保渠道有所改变,理赔服务还是和线下投保一样。所以,最好的解决方法就是找一家口碑良好的公司,在网站上投保。平安网销车险平台现在可以说是家喻户晓,完全满足了车辆保险在哪里买的各种条件。在平安车险网销平台上有详细的车险条款讲解、有在线专家免费咨询,网上报价清晰列出每项险种及对应的保费,优惠价、对比市场价、多省保费均一目了然,报价精准,可直接在线支付。在理赔环节,平安产险依托平安集团强大的IT支持系统及后援集中平台,通过系统控制及集中作业管理为客户提供高质量、标准统一的救援、送修、定损、赔款支付等理赔服务。”,并通过约定的通信方式,如http或https等通信协议将该专业解答发送至结果提供设备1,则在步骤S1中,结果提供设备1通过约定的通信方式,如http或https等通信协议,便接收到该专业解答,即获取到与用户A提交的所述候选长尾序列相对应的所述长尾描述信息。
2)根据所述候选长尾序列,在预定长尾信息库中进行匹配查询,以获得与所述候选长尾序列相对应的长尾描述信息。在此,所述预定长尾信息库用于存储所述候选长尾序列及其对应的长尾描述信息,其可以是一个或多个,既可位于结果提供设备1的本地服务器中,也可位于与结果提供设备1通过网络相连的其他服务器中,如向结果提供设备1开放接口的第三方应用平台所对应的服务器中。本领域技术人员应能理解上述预定长尾信息库仅为举例,其他现有的或今后可能出现的预定长尾信息库如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。例如,接上例,平安车险官方客服平台的企业官方专业人员将query1及其对应的answer1以问答形式上传至其预定长尾信息库中,则在步骤S1中,结果提供设备1根据用户A所提交的所述候选长尾序列,在平安车险官方客服平台所对应的预定长尾信息库中进行匹配查询,便可获得与所述候选长尾序列相对应的长尾描述信息,即得到answer1。
本领域技术人员应能理解上述获取长尾描述信息的方式仅为举例,其他现有的或今后可能出现的获取长尾描述信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S1中,结果提供设备1根据所述候选长尾序列,及与所述候选长尾序列相对应的长尾描述信息,得到对应的候选长尾信息记录,如将所述候选长尾序列及其对应的所述长尾描述信息组成序列-信息对,并将该序列-信息对作为所述候选长尾信息记录。例如,接上例,在步骤S1中,结果提供设备1将query1与answer1以问答形式组成一对,来得到所述候选长尾信息记录。
在步骤S2中,结果提供设备1根据所述候选长尾信息记录,建立或更新长尾信息库。例如,接上例,在步骤S2中,结果提供设备1可将所述候选长尾序列及其对应的长尾描述信息存储于长尾信息库中,并按一定方式更新该长尾信息库,如按照预定周期、定时更新、立即更新所述长尾信息库。在此,所述长尾信息库用于存储所述候选长尾序列及其对应的长尾描述信息,其可以是一个或多个,既可位于结果提供设备1的本地服务器中,也可位于与结果提供设备1通过网络相连的其他服务器中,如向结果提供设备1开放接口的第三方应用平台所对应的服务器中。
本领域技术人员应能理解上述更新所述长尾信息库的方式仅为举例,其他现有的或今后可能出现的更新所述长尾信息库的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S3中,结果提供设备1首先通过ASP、JSP等动态网页技术,或者通过搜索引擎提供的应用程序接口(API),获取用户通过用户设备提交的目标查询序列;然后,再根据目标查询序列,在所述长尾信息库中进行匹配查询,如将所述目标查询序列与所述长尾信息库中的候选长尾序列和/或所述长尾信息库中的候选长尾序列的长尾描述信息进行文本匹配、语义匹配等,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果。例如,若搜索用户A通过其移动设备iphone在搜索引擎搜索栏中输入关键词“怎么买车险”,按Enter键,则在步骤S3中,结果提供设备1通过ASP、JSP等动态网页技术,便获取用户A通过其移动设备iphone提交的目标查询序列“怎么买车险”;然后,在步骤S2中,结果提供设备1根据该目标查询序列“怎么买车险”,在其在步骤S2中建立的所述长尾信息库中进行匹配查询,获得与所述目标查询序列相对应的一个或多个长尾搜索结果,如所述长尾信息库中与目标序列“如何买车险”相匹配的候选长尾信息记录I至V:
I query:车辆保险在哪里买?是一个重要问题
answer:要从投保和理赔两方面来考虑。投保需要考虑的是方便和优惠。目前电话销售和网络销售车险有更多的优惠,网上投保仅需几分钟就能轻松搞定,不受时间和地点的限制。而且网上投保只是投保渠道有所改变,理赔服务还是和线下投保一样。所以,最好的解决方法就是找一家口碑良好的公司,在网站上投保。平安网销车险平台现在可以说是家喻户晓,完全满足了车辆保险在哪里买的各种条件。在平安车险网销平台上有详细的车险条款讲解、有在线专家免费咨询,网上报价清晰列出每项险种及对应的保费,优惠价、对比市场价、多省保费均一目了然,报价精准,可直接在线支付。在理赔环节,平安产险依托平安集团强大的IT支持系统及后援集中平台,通过系统控制及集中作业管理为客户提供高质量、标准统一的救援、送修、定损、赔款支付等理赔服务。
II query:新手如何买车险?怎样全面投保才最为保障?
answer:平安车险专家推荐全面保障型车险组合:第三者责任险(50万元)+车损险+车上人员责任险+盗抢险+玻璃单独破碎险+不计免赔险+划痕险。如果车主驾驶的是价值较高的新车,那最好选择投保盗抢险、划痕险和玻璃单独破碎险,可以更好地保障车辆。投保车险的渠道也日趋多元化,车主可以通过4S店、保险代理渠道投保,也可以直接到保险公司网点投保,如果车主不想奔波的话可以通过电话车险和网上车险渠道来投保。如在平安车险率先推出的车险与网上车险直销渠道上投保,私家车主可以享受更多的优惠折扣。车主通过直销平台,10分钟即可完成投保流程,确认投保后还可通过线上线下多种支付渠道支付保费,大大节约了经济成本与时间成本。新手投保一般要避免两个误区:一是避免超额投保或不足额投保,二是避免重复保险。
III query:如何给汽车买保险才好?如何在家中轻松为车辆投保?
answer:汽车买回家以后,紧接着就是为爱车投一份保险。关于如何给汽车买保险,车主们可能都有各自不同的方法。有人去保险公司的营销部投保,有人通过电话为汽车投保,还有不少人不出门也不打电话,悄悄地在家里就可以完成车辆的投保流程。至目前,平安官网的网上直销车险因其良好的信誉和安全性受到广大车主的信赖。车主们登录平安官网的网上车险平台投保车险,从填写相关资料起到获得各险种的报价,直到最后完成付款,一系列的流程没有丝毫繁琐,全部流程完成后,只需用大约十分钟时间。由于平安网上车险是直销车险,所以省去了中间环节,而使车主能够得到私家车商业险多省15%的大优惠。另外,车主们通过平安网上直销车险平台来投保车险,不仅可以得到“万元以下,资料齐全,一天支付”的快速理赔服务,而且还可尊享免费上门代收索赔资料的增值服务。
IV query:如何给车辆上保险?
answer:如何给车辆上保险,首先我们得先知道分类。简单而言,车险按性质可分为强制保险与商业险。交强险是国家规定强制购买的保险;商业险是非强制购买的保险,车主可以根据实际情况进行选择性购买。商业险根据保障的责任范围分为基本险和附加险。基本险如:商业第三者责任险、车辆损失险、全车盗抢险、车上人员责任险,其特点是投保人可以选择其中的部分险种,也可是全部投保。附加险有:玻璃单独破碎险、自燃损失险、车身划痕险、不计免赔率特约条款。这些都必须先投保基本险后才能投保。如何给车辆上保险,了解险种是基础,最重要的还是最终选择一个好的保险公司。平安产险几个分公司理赔服务的抽查合格率为100%,完全履行了7×24小时接报案、7×24小时查勘救援的服务标准,并在响应速度、理赔效率和诚信服务品质上处于行业领先水平。
V query:汽车保险如何购买更好
answer:我国法律明确规定,车辆必须投保交强险之后才能上路行驶,否则将面临罚款扣车的处罚。从去年开始,不少的车主已率先开始通过互联网来办理车险的投保事宜,平安保险公司官方网站推出的网上车险直销渠道,因其良好的信誉及优质的售后服务等,受到了车主们的一致好评。在平安网上车险投保,只要车主填写了自己及车辆的相关资料后,即可进行商业险和交强险的选择及投保。车主可以得到非常透明的网上报价,平安网上车险计算器能为您列出非常精确的车险报价和市场价。实际上,平安网上车险属于直销平台,省去了中间环节,所以车主们能够享受“私家车商业险多省15%”的优惠。经过了报价环节,您确定要投保的险种以后,就可以完善投保资料并选择付款方式,继而完成车险的投保之旅了。
接着,在步骤S4中,结果提供设备1通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将所述一个或多个长尾搜索结果中至少一个如候选长尾信息记录I提供给所述目标查询序列所对应的用户,如首先将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的目标应用,如搜索引擎、浏览器等,再由该目标应用向所述用户展示所述一个或多个长尾搜索结果中至少一个,如将所述长尾搜索结果展示在搜索引擎搜索栏中的下方、作为第一条搜索结果展示等,供用户浏览,如图2所示。
优选地,在步骤S3中,结果提供设备1还可首先获取所述目标查询序列;然后,检测所述目标查询序列是否满足长尾触发条件;当满足所述长尾触发条件时,根据所述目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果。
具体地,在步骤S3中,结果提供设备1可首先通过ASP、JSP等动态网页技术,或者通过搜索引擎提供的应用程序接口(API),获取用户通过用户设备提交的所述目标查询序列。例如,若用户A通过其移动设备iphone在搜索引擎搜索栏中输入长尾关键词如“怎么买车险”或“怎么买车险最便宜”,按Enter键,则在步骤S3中,结果提供设备1通过ASP、JSP等动态网页技术,便获取用户A通过其移动设备iphone提交的目标查询序列如“怎么买车险”。
本领域技术人员应能理解上述获取目标查询序列的方式仅为举例,其他现有的或今后可能出现的获取目标查询序列的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
然后,在步骤S3中,结果提供设备1检测所述目标查询序列是否满足长尾触发条件。在此,所述长尾触发条件包括但不限于以下至少任一项:1)所述目标查询序列中的词语数量满足预定的词数阈值;2)所述目标查询序列中的文字数量满足预定的字数阈值;3)所述目标查询序列所对应的分类信息满足属于预定的类别信息。
例如,当所述长尾触发条件包括所述目标查询序列中的词语数量满足预定的词数阈值时,接上例,在步骤S3中,结果提供设备1首先获取到用户A通过其移动设备iphone提交的目标查询序列“怎么买车险”,然后在步骤S3中,结果提供设备1对该目标查询序列“怎么买车险”进行切词处理,得到该目标查询序列“怎么买车险”所包含的词语信息{怎么,买,车险},在步骤S3中,结果提供设备1检测发现该词语信息{怎么,买,车险}对应的词语数量满足预定的词数阈值如2个词语,则在步骤S3中,结果提供设备1判断该目标查询序列“怎么买车险”满足长尾触发条件;再如,当所述长尾触发条件包括所述目标查询序列中的文字数量满足预定的字数阈值时,接上例,在步骤S3中,结果提供设备1检测发现目标查询序列“怎么买车险”对应的文字数量为5个,满足预定的字数阈值如4个,则在步骤S3中,结果提供设备1判断该目标查询序列“怎么买车险”满足长尾触发条件;还如,当所述长尾触发条件包括所述目标查询序列所对应的分类信息满足属于预定的类别信息时,在此,所述预定的类别信息包括行业类别,如根据行业特征,某一些行业的部分长尾关键词比较专业和精准,如专业术语“庞加莱猜想”、“蒙特卡洛分析方法”、“薛定谔方程”、“脱氧核糖核酸”等,假设在步骤S3中,结果提供设备1首先获取到用户A提交的所述目标查询序列为“蒙特卡洛分析方法”,则在步骤S3中,结果提供设备1检测发现该目标查询序列为“蒙特卡洛分析方法”满足属于预定的类别信息如数学类别,则在步骤S3中,结果提供设备1判断该目标查询序列“蒙特卡洛分析方法”满足长尾触发条件。
本领域技术人员应能理解上述检测所述目标查询序列是否满足长尾触发条件的方式仅为举例,其他现有的或今后可能出现的检测所述目标查询序列是否满足长尾触发条件的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
当满足所述长尾触发条件时,在步骤S3中,结果提供设备1根据所述目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果。本领域技术人员应能理解上述长尾信息库仅为举例,其他现有的或今后可能出现的长尾信息库如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。例如,假设在步骤S3中,结果提供设备1获取到用户A通过其移动设备iphone提交的目标查询序列如“怎么买车险”,在步骤S3中,结果提供设备1检测到该目标查询序列满足长尾触发条件,则在步骤S3中,结果提供设备1根据该目标查询序列,在所述长尾信息库中进行匹配查询,以获得与该目标查询序列相对应的一个或多个长尾搜索结果如上述候选长尾信息记录I至V。
结果提供设备1的各个步骤之间是持续不断工作的。具体地,在步骤S1中,结果提供设备1持续根据候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;在步骤S2中,结果提供设备1持续根据所述候选长尾信息记录,建立或更新长尾信息库;在步骤S3中,结果提供设备1持续根据目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果;在步骤S4中,结果提供设备1持续将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的用户。在此,本领域技术人员应能理解,所述“持续”是指结果提供设备1的各个步骤之间持续不断地进行候选长尾信息记录的获取、长尾信息库的建立、长尾搜索结果的获得与提供,直至结果提供设备1在较长时间内停止长尾搜索结果的获得。
优选地,结果提供设备1还包括步骤S5(未示出)。具体地,在步骤S5中,结果提供设备1根据所述目标查询序列,在搜索索引库中进行匹配查询,以获得与所述目标查询序列相对应的通用搜索结果;其中,在步骤S4中,结果提供设备1将所述一个或多个长尾搜索结果中至少一个,以及所述通用搜索结果中至少一个,提供至所述用户。
具体地,在步骤S5中,结果提供设备1根据所述目标查询序列,在搜索索引库中进行匹配查询,以获得与所述目标查询序列相对应的通用搜索结果。例如,假设在步骤S3中,结果提供设备1获取到用户A通过其移动设备iphone提交的目标查询序列如“怎么买车险”,则在步骤S5中,结果提供设备1根据该目标查询序列,在搜索引擎通过在爬虫抓取到的网页建立起来的搜索索引库如网页数据库中进行匹配查询,以获得与所述目标查询序列相对应的通用搜索结果,如包含“怎么买车险”的网页链接,如“怎么买车险人保多省15%2013最新报价赢油卡”、“如何买车险百度知道”。
本领域技术人员应能理解上述获得与所述目标查询序列相对应的通用搜索结果的方式仅为举例,其他现有的或今后可能出现的获得与所述目标查询序列相对应的通用搜索结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S4中,结果提供设备1通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议将所述一个或多个长尾搜索结果中至少一个,以及所述通用搜索结果中至少一个,提供给所述用户,如提供给所述用户的用户设备,供所述用户浏览。
在一个优选实施例中(如图5所示),结果提供设备1还包括步骤S6(未示出)和步骤S7(未示出)。在此,参考图5对该优选实施例进行说明:具体地,在步骤S1中,结果提供设备1根据候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;在步骤S2中,结果提供设备1根据所述候选长尾信息记录,建立或更新长尾信息库;在步骤S3中,结果提供设备1根据目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果;在步骤S4中,结果提供设备1将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的用户;第一请求获取装置获取所述用户基于所述一个或多个长尾搜索结果中至少一个提交的第一页面访问请求;第二提供装置将所述第一页面访问请求所对应的访问页面提供给所述用户。在此,步骤S1、步骤S2、步骤S3和步骤S4与图5中所示实施例中对应步骤的内容相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
具体地,在步骤S6中,结果提供设备1通过诸如ASP、JSP或PHP等动态网页技术,或者搜索引擎等第三方设备所提供的应用程序接口(API);或者,通过HTTP、HTTPS等约定的通信方式,获取所述用户基于所述一个或多个长尾搜索结果中至少一个提交的第一页面访问请求。在此,所述第一页面访问请求包括所述用户点击所述一个或多个长尾搜索结果中至少一个对应的链接。例如,假设用户A通过其移动设备iphone提交了目标查询序列如“怎么买车险”,在步骤S4中,结果提供设备1将如图2所示的长尾搜索结果提供给用户A,而用户A在阅读了图2所示的长尾搜索结果之后,点击了长尾搜索结果如候选长尾信息记录I对应的链接,则在步骤S6中,结果提供设备1通过诸如ASP、JSP或PHP等动态网页技术,便获取到用户A所述一个或多个长尾搜索结果中至少一个提交的第一页面访问请求。
本领域技术人员应能理解上述获取所述第一页面访问请求的方式仅为举例,其他现有的或今后可能出现的获取所述第一页面访问请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S7中,结果提供设备1通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议将所述第一页面访问请求所对应的访问页面提供给所述用户。在此,所述访问页面包括所述包括当网络用户意欲访问所述第一页面访问请求所对应的链接所指向的原始页面时,为网络用户提供的与所述第一页面访问请求所对应的第一访问页面的页面信息,及以所述第一页面访问请求所对应的长尾搜索结果包括的长尾信息记录相对应的中间页面。在此,所述第一页面访问请求所对应的第一访问页面的页面信息包括但不限于以下至少任一项:1)所述第一页面访问请求对应的链接所指向的原始页面,即提供所述第一页面访问请求所对应的长尾搜索结果包括的长尾信息记录的提供用户的主页面,如提供用户的着陆页landingpage;2)所述第一页面访问请求所对应的链接所指向的原始页面中,与所述第一页面访问请求所对应的长尾搜索结果包括的长尾信息记录相匹配的页面内容信息位置处的页面信息,如文本描述、图片、动画等内容信息。本领域技术人员应能理解上述访问页面和第一访问页面仅为举例,其他现有的或今后可能出现的访问页面或第一访问页面如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
例如,接上例,在步骤S6中,结果提供设备1获取到用户A点击了图2中所示的长尾搜索结果如候选长尾信息记录I对应的链接的第一页面访问请求,则在步骤S7中,结果提供设备1根据所述第一页面访问请求,在页面信息数据库中进行匹配查询,以获得与所述第一页面访问请求相对应的第一访问页面如所述第一页面访问请求对应的链接所指向的原始页面中与所述第一页面访问请求所对应的长尾搜索结果包括的长尾信息记录相匹配的页面内容信息位置处的链接页面如http://chexian.pingan.com/campaign/pa/index.jsp?WT.mc_id=c03-BDZS-201&WT.srch=1;然后,在步骤S7中,结果提供设备1根据该链接页面,结合长尾信息记录I,生成所述访问页面,如以该主页面为背景、长尾信息记录I为浮层,得到访问页面,然后,通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将该访问页面提供给用户A,如图3所示。
优选地,在步骤S7中,结果提供设备1还可首先根据所述第一页面访问请求,在页面信息数据库中进行匹配查询,以获得与所述第一页面访问请求相对应的第一访问页面;然后,根据所述第一访问页面,结合所述一个或多个长尾搜索结果中至少一个包括的长尾信息记录,生成所述访问页面;接着,将所述访问页面提供给所述用户。例如,假设在步骤S6中,结果提供设备1获取到用户A点击了图2中所示的长尾搜索结果如候选长尾信息记录I对应的链接的第一页面访问请求,则在步骤S7中,结果提供设备1首先根据所述第一页面访问请求,在页面信息数据库中进行匹配查询,以获得与所述第一页面访问请求相对应的第一访问页面,如所述第一页面访问请求对应的链接所指向的原始页面中与所述第一页面访问请求所对应的长尾搜索结果包括的长尾信息记录相匹配的页面内容信息位置处的链接页面如http://chexian.pingan.com/campaign/pa/index.jsp?WT.mc_id=c03-BDZS-201&WT.srch=1;然后,在步骤S7中,结果提供设备1根据该主页面,结合长尾信息记录I,生成所述访问页面,如以该主页面为背景、长尾信息记录I为浮层,得到访问页面,然后,通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议,将该访问页面提供给用户A,如图3所示。
本领域技术人员应能理解上述生成所述访问页面的方式仅为举例,其他现有的或今后可能出现的生成所述访问页面的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,结果提供设备1还包括步骤S8(未示出)和步骤S9(未示出)。具体地,在步骤S8中,结果提供设备1获取所述用户基于所述访问页面提交的第二页面访问请求;在步骤S9中,结果提供设备1将所述第二页面访问请求所对应的目标页面提供给所述用户。
具体地,在步骤S8中,结果提供设备1通过诸如ASP、JSP或PHP等动态网页技术,或者搜索引擎等第三方设备所提供的应用程序接口(API);或者,通过HTTP、HTTPS等约定的通信方式,获取所述用户基于所述访问页面提交的第二页面访问请求。在此,所述第二页面访问请求包括用户点击所述访问页面中的相关按钮,如点击访问页面中的关闭按钮、了解更多按钮等。例如,接上例,在步骤S7中,结果提供设备1将如图3所示的访问页面提供给用户A,当用户A阅读完如图3所示的访问页面中的长尾信息记录后,认为该长尾信息记录对其有帮助,然后点击了页面中的关闭按钮,则在步骤S8中,结果提供设备1通过诸如ASP、JSP或PHP等动态网页技术便获取到用户A基于所述访问页面提交的第二页面访问请求。
本领域技术人员应能理解上述触发所述第二页面访问请求的方式仅为举例,其他现有的或今后可能出现的获触发所述第二页面访问请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
本领域技术人员应能理解上述获取所述第二页面访问请求的方式仅为举例,其他现有的或今后可能出现的获取所述第二页面访问请求的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S9中,结果提供设备1通过诸如ASP、JSP或PHP等动态网页技术,或者其他约定的通信方式,如http或https等通信协议将所述第二页面访问请求所对应的目标页面提供给所述用户。例如,接上例,在步骤S8中,结果提供设备1获取到用户A点击图3所示的访问页面中的关闭按钮的第二页面访问请求,则在步骤S9中,结果提供设备1可直接将提供该访问页面中的长尾信息记录的提供用户的主页面中与所述长尾信息记录相匹配的页面内容信息位置处的链接页面如用户A希望继续进行相关操作如计算车险的页面http://chexian.pingan.com/campaign/pa/index.jsp?WT.mc_id=c03-BDZS-201&WT.srch=1作为所述第二页面访问请求所对应的目标页面提供给用户A。在此,本发明不仅实现了提高用户获取信息的效率的有益效果,还实现了进一步满足用户需求、方便用户操作的有益效果。
图6示出根据本发明一个优选实施例的用于提供长尾搜索结果的方法流程图。
其中,结果提供设备1包括步骤S1’、步骤S2’、步骤S3’和步骤S4’,其中,步骤S1’包括步骤S11’和步骤S12’。具体地,在步骤S11’中,结果提供设备1获取一个或多个近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列;在步骤S12’中,结果提供设备1根据所述候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;在步骤S2’中,结果提供设备1根据所述候选长尾信息记录,建立或更新长尾信息库;在步骤S3’中,结果提供设备1根据目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果;在步骤S4’中,结果提供设备1将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的用户。在此,步骤S2’、步骤S3’和步骤S4’与图5中所示实施例中对应步骤的内容相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
具体地,在步骤S11’中,结果提供设备1通过搜索引擎、浏览器等第三方设备提供的获取搜索日志的应用程序接口(API),获取多个搜索日志;然后,对该多个搜索日志进行语义分析处理,获取一个或多个近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。例如,在步骤S11’中,结果提供设备1首先通过搜索引擎提供的获取搜索日志的应用程序接口(API),获取到多个搜索日志,如在某段时间内,用户提交的搜索包括了哪些长尾关键词、用户访问了哪些返回的搜索结果等;然后,在步骤S11’中,结果提供设备1对这些搜索日志进行语义分析处理,得到一个或多个近义长尾序列簇,如由多个近义长尾序列组成的近义长尾序列簇,如由与长尾关键词“苏州游玩有哪些景点是必须去的”属于同义近义词的长尾关键词如“苏州有哪些好玩的?”、“苏州旅游胜地有哪些”、“苏州景点大全”等组成的近义长尾序列簇,再如,由与长尾关联词“怎么买车险”属于同义近义词的长尾关键词如“如何给汽车买保险才好”、“车辆保险在哪里买”、“新手如何买车险?”、“买车险什么保险公司好?怎样投保更有保障?”、“如何给车辆上保险?”、“怎么买车险最便宜”、“怎么买车险划算”、“如何买车险最优惠”等组成的近义长尾序列簇,则在步骤S1’1中,结果提供设备1可将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。
优选地,在步骤S11’中,结果提供设备1可根据已标注近义关系的多个长尾序列训练样本,对所述多个长尾序列训练样本进行聚类处理,以获得所述一个或多个近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。例如,假设存在已标注近义关系的多个长尾序列训练样本如下所示:
①对于旅游查询,“必须去”、“旅游胜地”、“重要景点”、“景点大全”属于近义关系词语;
②对于车险查询,“如何买车险”、“如何给车辆上保险”、“怎么给车辆上保险”、“怎样投保车险”属于近义关系词语;
……
则在步骤S11’中,结果提供设备1可根据该已标注近义关系的多个长尾序列训练样本,对该多个长尾序列训练样本进行聚类处理,如将标注属于近义关系的长尾序列训练样本归为一类,从而得到所述一个或多个近义长尾序列簇,如将含有上述已标注近义关系的长尾序列训练样本①的长尾序列归为一类得到cluster1,将上述已标注近义关系的长尾序列训练样本②的长尾序列归为一类得到cluster2,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列.
优选地,在步骤S11’中,结果提供设备1包括步骤S111’(未示出)、步骤S112’(未示出)和步骤S113’(未示出)。具体地,在步骤S111’中,结果提供设备1从多个搜索日志中获取一个或多个搜索会话,其中,所述搜索会话包括对应的长尾序列及其对应的搜索结果;在步骤S112’中,结果提供设备1根据所述一个或多个搜索会话,获取一个或多个初始近义长尾序列簇;在步骤S113’中,结果提供设备1根据所述初始近义长尾序列簇中长尾序列对应的用户应用频度信息,对所述初始近义长尾系列簇中的长尾序列进行筛选处理,以获得所述近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。
具体地,在步骤S111’中,结果提供设备1首先通过搜索引擎、浏览器等第三方设备提供的获取搜索日志的应用程序接口(API),获取多个搜索日志;然后,再从所述多个搜索日志中获取一个或多个搜索会话,其中,所述搜索会话包括对应的长尾序列及其对应的搜索结果。例如,假设搜索用户A通过其移动设备iphone在搜索引擎搜索栏中输入关键词“怎么买车险”,按Enter键,然后在搜索引擎返回的多个搜索结果中点击搜索结果“车辆保险在哪里买”对应的链接进入该页面进行浏览,则在步骤S111’中,结果提供设备1可通过该搜索引擎提供的获取搜索日志的应用程序接口(API),获取到该搜索会话,其包括用户A输入的查询序列“怎么买车险”及访问的搜索结果“车辆保险在哪里买”。
在步骤S112’中,结果提供设备1根据所述一个或多个搜索会话,获取一个或多个初始近义长尾序列簇;在此,在步骤S112’中,结果提供设备1获取所述初始近义长尾序列簇的方式包括但不限于以下至少任一项;
1)根据所述搜索会话对应的搜索结果,通过对所述搜索会话对应的搜索结果如搜索结果对应的摘要文本、标题链接文本、页面主体内容等进行语义分析,对所述一个或多个搜索会话进行分类处理,以获得所述一个或多个初始近义长尾序列簇,其中,所述初始近义长尾序列簇包括属于同一类搜索会话的长尾序列。例如,假设在步骤S111’中,结果提供设备1获取如下多个搜索会话I至V:
I“怎么买车险”:“车辆保险在哪里买”
“新手如何买车险?”
“买车险什么保险公司好?怎样投保更有保障?”
“如何给车辆上保险?”
“怎么买车险最便宜”
II“如何买车险”:“如何给汽车买保险才好”
“新手如何买车险?”
“车险怎么买最划算?”
“汽车保险如何购买更好?”
III“怎么买车险”:“车辆保险在哪里买”
“新手如何买车险?”
IV“苏州有哪些好玩的”:“推荐下苏州好玩的地方”
“苏州有哪些好玩的地方,急急急!”
“要去苏州旅游了最应该去哪些地方?”
V“苏州游玩必须去的地方”:
“要去苏州旅游了最应该去哪些地方?”
“苏州旅游哪些地方必去?”
则在步骤S112’中,结果提供设备1通过诸如对搜索会话I至V对应的搜索结果如搜索结果对应标题链接文本进行语义分析,对搜索会话I至V对应的搜索结果进行分类处理,得到搜索会话I至V的分类,如搜索会话I至III归为同一类,搜索会话IV和V归为同一类;然后,在步骤S112’中,结果提供设备1根据获得的搜索会话分类,将属于同一类的搜索会话的长尾序列作为初始近义长尾序列簇,如获得与搜索会话I至III对应的初始近义长尾序列簇cluster1,其包括“怎么买车险”、“如何买车险”、“怎么买车险”,与搜索会话IV和V对应的初始近义长尾序列簇cluster2,其包括“苏州有哪些好玩的、“苏州游玩必须去的地方”。
2)对所述一个或多个搜索会话对应的长尾序列进行分类处理,以获得所述一个或多个初始近义长尾序列簇,其中,所述初始近义长尾序列簇包括属于同一类的长尾序列。例如,接上例,在步骤S112’中,结果提供设备1通过语义分析,对会话获取单元获取的搜索会话I至V对应的查询序列进行分类处理,获得一个或多个初始近义长尾序列簇,其中,所述初始近义长尾序列簇包括属于同一类的长尾序列,如在步骤S112’中,结果提供设备1可获得与搜索会话I至III对应的初始近义长尾序列簇cluster1,其包括“怎么买车险”、“如何买车险”、“怎么买车险”,与搜索会话IV和V对应的初始近义长尾序列簇cluster2,其包括“苏州有哪些好玩的”、“苏州游玩必须去的地方”。
3)将所述搜索会话中长尾序列及其对应的搜索结果作为所述初始近义长尾序列簇。例如,假设在步骤S111’中,结果提供设备1获取到搜索日志中用户A点击了与查询序列“怎么买车险”相匹配的多个搜索结果如title1“车辆保险在哪里买”和title2“新手如何买车险?”,则在步骤S112’中,结果提供设备1将搜索结果title1“车辆保险在哪里买”对应的标题及搜索结果title2“新手如何买车险?”对应的标题作为长尾序列,与长尾序列“怎么买车险”构成所述初始近义长尾序列簇。
4)将所述搜索记录中相同搜索结果对应的不同长尾序列作为所述初始近义长尾序列簇。例如,假设在步骤S111’中,结果提供设备1获取到搜索日志中用户A点击了与长尾序列“如何买车险”相匹配的多个搜索结果中的搜索结果如“新手如何买车险?”,而用户B根据长尾序列“怎么买车险”进行搜索时,也点击了长尾序列“怎么买车险相匹配的多个搜索结果中的搜索结果如“新手如何买车险?”,则在步骤S112’中,结果提供设备1将长尾序列“如何买车险”与怎么买车险”构成所述初始近义长尾序列簇。
本领域技术人员应能理解上述获取初始近义长尾序列簇的方式仅为举例,其他现有的或今后可能出现的获取初始近义长尾序列簇的方式仅如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S113’中,结果提供设备1根据所述初始近义长尾序列簇中长尾序列对应的用户应用频度信息,对所述初始近义长尾系列簇中的长尾序列进行筛选处理,以获得所述近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。在此,所述用户应用频度信息包括但不限于如用户对所述长尾序列的检索次数、用户查看所述长尾序列对应搜索结果的次数等。例如,假设在步骤S112’中,结果提供设备1获得的初始近义长尾序列簇包括初始近义长尾序列簇cluster1,其包括“怎么买车险”、“如何买车险”、“怎么买车险”,初始近义长尾序列簇cluster2,其包括“苏州有哪些好玩的”、“苏州游玩必须去的地方”,假设,对于初始近义长尾序列簇cluster1的长尾序列,用户对长尾序列“怎么买车险”及“如何买车险”的检索次数高于对长尾序列“怎么买车险”的检索次数,则在步骤S113’中,结果提供设备1可将长尾序列“怎么买车险”从初始近义长尾序列簇cluster1中删除,得到删除后的初始近义长尾序列簇cluster1,其包括“怎么买车险”、“如何买车险”。
本领域技术人员应能理解上述对所述初始近义长尾系列簇中的长尾序列进行筛选处理的方式仅为举例,其他现有的或今后可能出现的对所述初始近义长尾系列簇中的长尾序列进行筛选处理的方式仅如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S12’中,结果提供设备1根据所述候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录。在此,在步骤S12’中,结果提供设备1获取所述长尾描述信息及对应的候选长尾信息记录的方式与图5中在步骤S1中,结果提供设备1获取所述长尾描述信息及对应的候选长尾信息记录的方式的内容相同或相似,为简明起见,故在此不再赘述,并以引用的方式包含与此。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
Claims (25)
1.一种用于提供长尾搜索结果的方法,其中,该方法包括以下步骤:
x根据候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;
y根据所述候选长尾信息记录,建立或更新长尾信息库;
其中,该方法还包括:
a根据目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果;
b将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的用户。
2.根据权利要求1所述的方法,其中,所述步骤x包括:
x1获取一个或多个近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列;
x2根据所述候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录。
3.根据权利要求2所述的方法,其中,所述步骤x1包括:
-从多个搜索日志中获取一个或多个搜索会话,其中,所述搜索会话包括对应的长尾序列及其对应的搜索结果;
x11根据所述一个或多个搜索会话,获取一个或多个初始近义长尾序列簇;
-根据所述初始近义长尾序列簇中长尾序列对应的用户应用频度信息,对所述初始近义长尾系列簇中的长尾序列进行筛选处理,以获得所述近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。
4.根据权利要求3所述的方法,其中,所述步骤x11包括:
-根据所述搜索会话对应的搜索结果,对所述一个或多个搜索会话进行分类处理,以获得所述一个或多个初始近义长尾序列簇,其中,所述初始近义长尾序列簇包括属于同一类搜索会话的长尾序列。
5.根据权利要求3所述的方法,其中,所述步骤x11包括:
-对所述一个或多个搜索会话对应的长尾序列进行分类处理,以获得所述一个或多个初始近义长尾序列簇,其中,所述初始近义长尾序列簇包括属于同一类的长尾序列。
6.根据权利要求2所述的方法,其中,所述步骤x1包括:
-根据已标注近义关系的多个长尾序列训练样本,对所述多个长尾序列训练样本进行聚类处理,以获得所述一个或多个近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。
7.根据权利要求1至6中任一项所述的方法,其中,所述步骤a包括:
-获取所述目标查询序列;
-检测所述目标查询序列是否满足长尾触发条件;
-当满足所述长尾触发条件时,根据所述目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果。
8.根据权利要求1至7中任一项所述的方法,其中,该方法还包括:
-获取所述用户基于所述一个或多个长尾搜索结果中至少一个提交的第一页面访问请求;
e将所述第一页面访问请求所对应的访问页面提供给所述用户。
9.根据权利要求8所述的方法,其中,所述步骤e包括:
-根据所述第一页面访问请求,在页面信息数据库中进行匹配查询,以获得与所述第一页面访问请求相对应的第一访问页面;
-根据所述第一访问页面,结合所述一个或多个长尾搜索结果中至少一个包括的长尾信息记录,生成所述访问页面;
-将所述访问页面提供给所述用户。
10.根据权利要求8或9所述的方法,其中,该方法还包括:
-获取所述用户基于所述访问页面提交的第二页面访问请求;
-将所述第二页面访问请求所对应的目标页面提供给所述用户。
11.根据权利要求1至10中任一项所述的方法,其中,该方法还包括:
-根据所述目标查询序列,在搜索索引库中进行匹配查询,以获得与所述目标查询序列相对应的通用搜索结果;
其中,所述步骤b包括:
-将所述一个或多个长尾搜索结果中至少一个,以及所述通用搜索结果中至少一个,提供给所述用户。
12.一种用于提供长尾搜索结果的结果提供设备,其中,该结果提供设备包括:
描述获取装置,用于根据候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录;
信息库建立装置,用于根据所述候选长尾信息记录,建立或更新长尾信息库;
其中,该结果提供设备还包括:
匹配查询装置,用于根据目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果;
第一提供装置,用于将所述一个或多个长尾搜索结果中至少一个提供给所述目标查询序列所对应的用户。
13.根据权利要求12所述的结果提供设备,其中,所述描述获取装置包括:
序列簇获取单元,用于获取一个或多个近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列;
描述获取单元,用于根据所述候选长尾序列,获取与所述候选长尾序列相对应的长尾描述信息,以获得对应的候选长尾信息记录。
14.根据权利要求13所述的结果提供设备,其中,所述序列簇获取单元包括:
会话获取单元,用于从多个搜索日志中获取一个或多个搜索会话,其中,所述搜索会话包括对应的长尾序列及其对应的搜索结果;
初始序列簇获取单元,用于根据所述一个或多个搜索会话,获取一个或多个初始近义长尾序列簇;
筛选处理单元,用于根据所述初始近义长尾序列簇中长尾序列对应的用户应用频度信息,对所述初始近义长尾系列簇中的长尾序列进行筛选处理,以获得所述近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。
15.根据权利要求14所述的结果提供设备,其中,所述初始序列簇获取单元用于:
-根据所述搜索会话对应的搜索结果,对所述一个或多个搜索会话进行分类处理,以获得所述一个或多个初始近义长尾序列簇,其中,所述初始近义长尾序列簇包括属于同一类搜索会话的长尾序列。
16.根据权利要求14所述的结果提供设备,其中,所述序列簇获取单元用于:
-对所述一个或多个搜索会话对应的长尾序列进行分类处理,以获得所述一个或多个初始近义长尾序列簇,其中,所述初始近义长尾序列簇包括属于同一类的长尾序列。
17.根据权利要求13所述的结果提供设备,其中,所述初始序列簇获取单元用于:
-根据已标注近义关系的多个长尾序列训练样本,对所述多个长尾序列训练样本进行聚类处理,以获得所述一个或多个近义长尾序列簇,以将所述近义长尾序列簇中的长尾序列作为所述候选长尾序列。
18.根据权利要求12至17中任一项所述的结果提供设备,其中,所述匹配查询装置用于:
-获取所述目标查询序列;
-检测所述目标查询序列是否满足长尾触发条件;
-当满足所述长尾触发条件时,根据所述目标查询序列,在所述长尾信息库中进行匹配查询,以获得与所述目标查询序列相对应的一个或多个长尾搜索结果。
19.根据权利要求12至18中任一项所述的结果提供设备,其中,该结果提供设备还包括:
第一请求获取装置,用于获取所述用户基于所述一个或多个长尾搜索结果中至少一个提交的第一页面访问请求;
第二提供装置,用于将所述第一页面访问请求所对应的访问页面提供给所述用户。
20.根据权利要求19所述的结果提供设备,其中,所述第二提供装置用于:
-根据所述第一页面访问请求,在页面信息数据库中进行匹配查询,以获得与所述第一页面访问请求相对应的第一访问页面;
-根据所述第一访问页面,结合所述一个或多个长尾搜索结果中至少一个包括的长尾信息记录,生成所述访问页面;
-将所述访问页面提供给所述用户。
21.根据权利要求19或20所述的结果提供设备,其中,该结果提供设备还包括:
第二请求获取装置,用于获取所述用户基于所述访问页面提交的第二页面访问请求;
第三提供装置,用于将所述第二页面访问请求所对应的目标页面提供给所述用户。
22.根据权利要求12至21中任一项所述的结果提供设备,其中,该结果提供设备还包括:
通用结果获取装置,用于根据所述目标查询序列,在搜索索引库中进行匹配查询,以获得与所述目标查询序列相对应的通用搜索结果;
其中,所述第一提供装置用于:
-将所述一个或多个长尾搜索结果中至少一个,以及所述通用搜索结果中至少一个,提供给所述用户。
23.一种计算机设备,包括如权利要求12至22中任一项所述的结果提供设备。
24.一种用于提供长尾搜索结果的搜索引擎,其中,该搜索引擎包括如权利要求12至22中任一项所述的结果提供设备。
25.一种用于提供长尾搜索结果的搜索引擎插件,其中,该搜索引擎插件包括如权利要求12至22中任一项所述的结果提供设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310105431.XA CN103235786B (zh) | 2013-03-28 | 2013-03-28 | 一种用于提供长尾搜索结果的方法与设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310105431.XA CN103235786B (zh) | 2013-03-28 | 2013-03-28 | 一种用于提供长尾搜索结果的方法与设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103235786A true CN103235786A (zh) | 2013-08-07 |
CN103235786B CN103235786B (zh) | 2018-12-18 |
Family
ID=48883828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310105431.XA Active CN103235786B (zh) | 2013-03-28 | 2013-03-28 | 一种用于提供长尾搜索结果的方法与设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103235786B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021214A (zh) * | 2014-06-20 | 2014-09-03 | 北京奇虎科技有限公司 | 一种基于长尾关键词的搜索推荐方法及装置 |
CN106326353A (zh) * | 2016-08-09 | 2017-01-11 | 百度在线网络技术(北京)有限公司 | 一种用于提供呈现信息的方法与设备 |
CN108701014A (zh) * | 2016-03-09 | 2018-10-23 | 电子湾有限公司 | 用于尾部查询的查询数据库 |
US10212106B2 (en) * | 2013-07-18 | 2019-02-19 | Tencent Technology (Shenzhen) Company Limited | Method and system for subscribing long tail information |
US11593855B2 (en) | 2015-12-30 | 2023-02-28 | Ebay Inc. | System and method for computing features that apply to infrequent queries |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101097573A (zh) * | 2006-06-28 | 2008-01-02 | 腾讯科技(深圳)有限公司 | 一种自动问答系统及方法 |
CN101111837A (zh) * | 2004-12-06 | 2008-01-23 | 雅虎公司 | 查询自动分类的搜索处理 |
US20130013429A1 (en) * | 2011-07-07 | 2013-01-10 | Daniel Allan Mooney | Systems, methods, and media for providing advertisements based upon relational data |
-
2013
- 2013-03-28 CN CN201310105431.XA patent/CN103235786B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101111837A (zh) * | 2004-12-06 | 2008-01-23 | 雅虎公司 | 查询自动分类的搜索处理 |
CN101097573A (zh) * | 2006-06-28 | 2008-01-02 | 腾讯科技(深圳)有限公司 | 一种自动问答系统及方法 |
US20130013429A1 (en) * | 2011-07-07 | 2013-01-10 | Daniel Allan Mooney | Systems, methods, and media for providing advertisements based upon relational data |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10212106B2 (en) * | 2013-07-18 | 2019-02-19 | Tencent Technology (Shenzhen) Company Limited | Method and system for subscribing long tail information |
CN104021214A (zh) * | 2014-06-20 | 2014-09-03 | 北京奇虎科技有限公司 | 一种基于长尾关键词的搜索推荐方法及装置 |
US11593855B2 (en) | 2015-12-30 | 2023-02-28 | Ebay Inc. | System and method for computing features that apply to infrequent queries |
CN108701014A (zh) * | 2016-03-09 | 2018-10-23 | 电子湾有限公司 | 用于尾部查询的查询数据库 |
CN106326353A (zh) * | 2016-08-09 | 2017-01-11 | 百度在线网络技术(北京)有限公司 | 一种用于提供呈现信息的方法与设备 |
Also Published As
Publication number | Publication date |
---|---|
CN103235786B (zh) | 2018-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111949834B (zh) | 选址方法和选址平台系统 | |
KR101940623B1 (ko) | 비즈니스용 추천 프로그램 | |
Edlin et al. | The role of switching costs in antitrust analysis: a comparison of Microsoft and Google | |
US10235470B2 (en) | User retrieval enhancement | |
CN102682389B (zh) | 用于将信息从外部源提供到基于web的文档的方法和系统 | |
CN102446180B (zh) | 一种商品搜索方法及其装置 | |
US9659067B2 (en) | Providing a search results document that includes a user interface for performing an action in connection with a web page identified in the search results document | |
US20160155181A1 (en) | System and method of displaying relevant real estate service providers on an interactive map | |
CN105556512A (zh) | 用于分析关注实体特性的设备、系统以及方法 | |
CN105164710A (zh) | 实体投标 | |
CN105808685A (zh) | 推广信息的推送方法及装置 | |
Cioppi et al. | Online presence, visibility and reputation: a systematic literature review in management studies | |
CN105247507A (zh) | 品牌的影响力得分 | |
CN103620583A (zh) | 根据浏览活动显现应用 | |
KR20190007875A (ko) | 유통과 물류의 최적화를 위한 마케팅 관리 데이터 제공 방법 및 이를 위한 장치 | |
CN102663626A (zh) | 基于区域特征的协同过滤推荐方法 | |
CN104572863A (zh) | 一种产品推荐方法及系统 | |
CN105210061A (zh) | 加标签的搜索结果维护 | |
CN103235786A (zh) | 一种用于提供长尾搜索结果的方法与设备 | |
US20180139296A1 (en) | Method of producing browsing attributes of users, and non-transitory computer-readable storage medium | |
CN106294337A (zh) | 一种信息服务系统 | |
CN103854206A (zh) | 一种分析人群特征的方法和设备 | |
CN108351787A (zh) | 与移动应用相关联的内容项目的基于装置的过滤 | |
Dias et al. | Automating the extraction of static content and dynamic behaviour from e-commerce websites | |
US20150302088A1 (en) | Method and System for Providing Personalized Content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |