CN103631793A - 一种用于对搜索结果进行排序的方法、装置与设备 - Google Patents

一种用于对搜索结果进行排序的方法、装置与设备 Download PDF

Info

Publication number
CN103631793A
CN103631793A CN201210300943.7A CN201210300943A CN103631793A CN 103631793 A CN103631793 A CN 103631793A CN 201210300943 A CN201210300943 A CN 201210300943A CN 103631793 A CN103631793 A CN 103631793A
Authority
CN
China
Prior art keywords
search
search results
sequence
information
web page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210300943.7A
Other languages
English (en)
Other versions
CN103631793B (zh
Inventor
林冠辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210300943.7A priority Critical patent/CN103631793B/zh
Publication of CN103631793A publication Critical patent/CN103631793A/zh
Application granted granted Critical
Publication of CN103631793B publication Critical patent/CN103631793B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明的目的是提供一种用于对搜索结果进行排序的方法、装置与设备。其中,首先根据来自移动终端的查询序列进行匹配查询,来获取与所述查询序列相匹配的多个搜索结果及每个搜索结果与所述查询序列的相关度信息;对所述查询序列进行识别处理,来判断所述查询序列是否用于请求预定类型网页;当判断所述查询序列用于请求预定类型网页时,获取每个搜索结果的排序调整信息,其中,所述排序调整信息与该搜索结果网页适于在移动终端上以预定类型网页方式呈现的适合程度有关;根据所述每个搜索结果与所述查询序列的相关度信息及所述每个搜索结果的排序调整信息,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果。

Description

一种用于对搜索结果进行排序的方法、装置与设备
技术领域
本发明涉及搜索结果排序技术领域,尤其涉及一种用于对搜索结果进行排序的方法、装置与设备。
背景技术
当今,移动互联网在人们的生活中扮演越来越重要的角色,人们可随时随地通过移动终端在互联网中进行信息搜索。现有技术中,移动终端一般根据用户输入的查询序列,向用户呈现搜索引擎基于查询序列获得并排序后提供给移动终端的多个搜索结果项。
然而,用户无法知晓大量的搜索结果项中哪些搜索结果项对应的搜索结果网页适于在移动终端上以预定类型网页方式呈现、用户通过浏览该搜索结果页面是否能够得到较好浏览效果,故其需要通过点击每一搜索结果中的页面链接进入搜索结果网页,分别浏览每一搜索结果网页以进行判断,因此,用户在此过程中操作繁琐,影响用户浏览体验;同时,由于访问了相当数量的不适于在移动终端屏幕中展示的搜索结果网页,不仅降低了用户信息获取效率,也带来了很多不必要的通信流量。
发明内容
本发明的目的是提供一种用于对搜索结果进行排序的方法、装置与设备。
根据本发明的一个方面,提供了一种用于对搜索结果进行排序的方法,该方法包括以下步骤:
a根据来自移动终端的查询序列进行匹配查询,来获取与所述查询序列相匹配的多个搜索结果及每个搜索结果与所述查询序列的相关度信息;
其中,该方法还包括:
w对所述查询序列进行识别处理,来判断所述查询序列是否用于请求预定类型网页;
x当判断所述查询序列用于请求预定类型网页时,获取每个搜索结果的排序调整信息,其中,所述排序调整信息与该搜索结果网页适于在移动终端上以预定类型网页方式呈现的适合程度有关;
y根据所述每个搜索结果与所述查询序列的相关度信息及所述每个搜索结果的排序调整信息,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果。
根据本发明的另一方面,还提供了一种用于对搜索结果进行排序的排序装置,该排序装置包括:
搜索结果获取装置,用于根据来自移动终端的查询序列进行匹配查询,来获取与所述查询序列相匹配的多个搜索结果及每个搜索结果与所述查询序列的相关度信息;
其中,该排序装置还包括:
判断装置,用于对所述查询序列进行识别处理,来判断所述查询序列是否用于请求预定类型网页;
调整信息获取装置,用于当判断所述查询序列用于请求预定类型网页时,获取每个搜索结果的排序调整信息,其中,所述排序调整信息与该搜索结果网页适于在移动终端上以预定类型网页方式呈现的适合程度有关;
第一排序装置,用于根据所述每个搜索结果与所述查询序列的相关度信息及所述每个搜索结果的排序调整信息,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果。
与现有技术相比,本发明具有以下优点:通过根据每个搜索结果与查询序列的相关度信息及每个搜索结果的排序调整信息,对该多个搜索结果进行排序处理,以使得多个搜索结果的排序方式不仅与用户输入的查询序列的匹配程度相关,而且该排序方式也与每个搜索结果网页是否适于在移动终端上以预定类型网页方式呈现相关联,实现了将适于在移动终端上以预定类型网页方式呈现的较高转码质量的搜索结果网页对应的搜索结果及适于在移动终端上以预定类型网页方式呈现的较高适合度信息的搜索结果网页对应的搜索结果能够排于搜索结果页的较高位置,用户可在其最易获取信息的视觉区域内点击排序较高的几个搜索结果,就可获取适于其在移动终端浏览的搜索结果网页,从而提高用户浏览体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的用于对搜索结果进行排序的排序装置的结构示意图;
图2示出根据本发明一个优选实施例的确定每个搜索结果对应的搜索结果网页的转码质量的排序装置的结构示意图;
图3示出根据本发明另一个优选实施例的确定页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息量的排序装置的结构示意图;
图4示出根据本发明另一个方面的用于对搜索结果进行排序的方法流程图;
图5示出根据本发明一个优选实施例的确定每个搜索结果对应的搜索结果网页的转码质量的方法流程图;
图6示出根据本发明另一个优选实施例的确定页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息量的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的用于对搜索结果进行排序的排序装置的结构示意图。本实施例的排序装置包含于网络设备中;该排序装置包括搜索结果获取装置1、判断装置2、调整信息获取装置3和第一排序装置4。
所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
首先,搜索结果获取装置1根据来自移动终端的查询序列进行匹配查询,来获取与所述查询序列相匹配的多个搜索结果及每个搜索结果与所述查询序列的相关度信息。
其中,本发明所述的“多个”指两个或两个以上。
其中,所述移动终端包括但不限于任何可适用于本发明的能够通过键盘、触摸屏等与用户进行交互的移动式电子产品,诸如手机、PDA、掌上电脑(PPC)、游戏机(PSP)等。在此,所述网络设备和移动终端均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件可包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
本领域技术人员应能理解上述移动终端以及网络设备仅为举例,其他现有的或今后可能出现的移动终端以及网络设备如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在此,所述移动终端与所述网络设备之间可通过任何通信方式实现通信,包括但不限于,基于3GPP、LTE、WIMAX的移动通信、基于TCP/IP、UDP协议的计算机网络通信以及基于蓝牙、红外传输标准的近距无线传输方式。所述移动终端与所述网络设备之间连接的网络包括但不限于:互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。
具体地,搜索结果获取装置1根据来自移动终端的用户输入的查询序列进行匹配查询,并基于接收到的查询序列进行搜索。一般地,搜索过程如下:查询序列中包含一个或多个关键词,优选地,还包括关键词之间的关联词,搜索结果获取装置1将提取这些关键词,优选地,还提取关联词,并在网络索引库中根据所述关键词、或关键词与关联词进行匹配查询从而获得多个搜索结果,其中每个搜索结果与该查询序列的相关度信息可根据各种搜索算法确定,例如根据传统的点击率算法确定该相关度信息、根据Google的“PageRank”搜索算法(参见美国专利US6285699,“Method for node ranking in a linked database”)确定该相关度信息、根据百度的“超链”搜索算法确定该相关度信息,搜索结果获取装置1基于上述搜索算法来获得每个搜索结果与该查询序列的相关度信息。其中,所述相关度信息指通过“PageRank”、“超链”等基本搜索算法确定的搜索结果与查询序列的匹配程度分值。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据来自移动终端的查询序列进行匹配查询,来获取与所述查询序列相匹配的多个搜索结果及每个搜索结果与所述查询序列的相关度信息的实现方式,均应包含在本发明的范围内。
判断装置2对所述查询序列进行识别处理,来判断所述查询序列是否用于请求预定类型网页。
其中,预定类型网页包括但不限于:
1)文学类网页,如小说类网页
2)图片类网页,如图片集网页。
在一示例中,判断装置2将查询序列在预定的类型映射表中进行匹配查询,来判断所述查询序列是否用于请求预定类型网页;其中,所述类型映射表中包括多种预定类型及其分别对应的一个或多个查询序列;优选地,所述查询序列与所述预定类型的对应关系可通过网络设备预先对多个用户的大量搜索行为进行挖掘来确定。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对所述查询序列进行识别处理,来判断所述查询序列是否用于请求预定类型网页的实现方式,均应包含在本发明的范围内。
当判断装置2判断所述查询序列用于请求预定类型网页时,调整信息获取装置3获取每个搜索结果的排序调整信息,其中,所述排序调整信息与该搜索结果网页适于在移动终端上以预定类型网页方式呈现的适合程度有关。
其中,所述排序调整信息包括以下至少任一项:
1)搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量;
2)搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
具体地,调整信息获取装置3获取每个搜索结果的排序调整信息的方式包括但不限于:
1)从调整信息库中获取预存的每个搜索结果的搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量及该搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息;其中,所述调整信息库包括但不限于关系数据库、Key-Value存储系统或文件系统等;
2)获取每个搜索结果网页对应的网页类型模板;根据所述网页类型模版,提取所述搜索结果网页中的一个或多个页面内容块特征信息;根据所述一个或多个页面内容块特征信息,基于第一预定判断规则,确定所述每个搜索结果对应的搜索结果网页的转码质量;该方式将在图2所示的实施例中给予详述。
3)确定每个搜索结果网页的页面编程语言信息;根据所述页面编程语言信息,基于第二预定判断规则,确定所述页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息;该方式将在图3所示的实施例中给予详述。
在一示例中,搜索结果获取装置1根据来自移动终端的查询序列“武极”进行匹配查询,获取与该查询序列相匹配的多个搜索结果为A1、A2、A3和A4,当判断装置2判断查询序列“武极”为用于请求小说类网页时,调整信息获取装置3根据搜索结果A1、A2、A3和A4分别对应的链接信息,从网络设备的调整信息库中获取预存的A1、A2、A3和A4的搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量及该搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何当判断所述查询序列用于请求预定类型网页时,获取每个搜索结果的排序调整信息的实现方式,均应包含在本发明的范围内,其中,所述排序调整信息与该搜索结果网页适于在移动终端上以预定类型网页方式呈现的适合程度有关。
随后,第一排序装置4根据所述每个搜索结果与所述查询序列的相关度信息及所述每个搜索结果的排序调整信息,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果。
其中,第一排序装置4对多个搜索结果进行排序处理以获取排序后的多个搜索结果的方式包括但不限于:
-根据每个搜索结果与查询序列的相关度信息的分值、每个搜索结果的搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量的分值及每个搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息的分值,简单进行加和计算,并根据加和结果进行排序操作;
在一示例中,多个搜索结果为A1、A2、A3和A4,搜索结果获取装置1获取的四个搜索结果与查询序列的相关度信息的分值分别为RA1:10、RA2:8、RA3:7、RA4:3,且调整信息获取装置3获取的该四个搜索结果的搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量的分值分别为QA1:1、QA2:1、QA3:4、QA4:2,调整信息获取装置3获取的该四个搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息的分值分别为FA1:0、FA2:0、FA3:1、FA4:1;第一排序装置4将每个搜索结果的相关度信息、转码质量的分值和适合度信息的分值进行加和计算,即通过公式1):
sn=RAn+QAn+FAn    1)
获取的加和结果为:
s1:=10+1+0=11;
s2:=8+1+0=9;
s3:=7+4+1=12;
s4:=3+2+1=6;
则第一排序装置4根据该等加和结果,对该四个所述搜索结果进行排序获得排序后的该四个搜索结果为A3、A1、A2和A4。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述每个搜索结果与所述查询序列的相关度信息及所述每个搜索结果的排序调整信息,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果的实现方式,均应包含在本发明的范围内。
通过根据每个搜索结果与查询序列的相关度信息及每个搜索结果的排序调整信息,对该多个搜索结果进行排序处理,以使得多个搜索结果的排序方式不仅与用户输入的查询序列的匹配程度相关,而且该排序方式也与每个搜索结果网页是否适于在移动终端上以预定类型网页方式呈现相关联,实现了将适于在移动终端上以预定类型网页方式呈现的较高转码质量的搜索结果网页对应的搜索结果及适于在移动终端上以预定类型网页方式呈现的较高适合度信息的搜索结果网页对应的搜索结果能够排于搜索结果页的较高位置,用户可在其最易获取信息的视觉区域内点击排序较高的几个搜索结果,就可获取适于其在移动终端浏览的搜索结果网页,从而提高用户浏览体验。
优选地,该排序装置还包括加权确定装置(图未示)和第二排序装置(图未示)。其中,加权确定装置根据所述每个搜索结果与所述查询序列的相关度信息及所述搜索结果的排序调整信息,并结合所述相关度信息和所述排序调整信息的预定权重,进行加权计算,以确定所述每个搜索结果的加权排序结果;第二排序装置根据加权确定装置确定的所述每个搜索结果的加权排序结果,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果。
在一示例中,多个搜索结果为A1、A2、A3和A4,搜索结果获取装置1获取的四个搜索结果与查询序列的相关度信息的分值分别为RA1:10、RA2:8、RA3:7、RA4:3,且调整信息获取装置3获取的该四个搜索结果的搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量的分值分别为QA1:1、QA2:1、QA3:4、QA4:2,调整信息获取装置3获取的该四个搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息的分值分别为FA1:0、FA2:0、FA3:1、FA4:1;同时,相关度信息的预定权重为W1:1;搜索结果的搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量的预定权重为W2:0.4,搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息的预定权重为W3:0.5;则加权确定装置将每个搜索结果的相关度信息、转码质量的分值和适合度信息的分值进行加权计算,即通过公式2):
Sn=RAn×W1+QAn×W2+FAn×W3          2)
以获取的加权结果为:
S1:=10×1+1×0.4+0×0.5=10.4;
S2:=8×1+1×0.4+0×0.5=8.4;
S3:=7×1+4×0.4+1×0.5=9.1;
S4:=3×1+2×0.4+1×0.5=4.3;
则第二排序装置根据该等加权结果,对该四个所述搜索结果进行排序获得排序后的该四个搜索结果为A1、A3、A2和A4。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述每个搜索结果与所述查询序列的相关度信息及所述搜索结果的排序调整信息,并结合所述相关度信息和所述排序调整信息的预定权重,进行加权计算,以确定所述每个搜索结果的加权排序结果,接着根据加权确定装置确定的所述每个搜索结果的加权排序结果,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果的实现方式,均应包含在本发明的范围内。
由于对多个搜索结果进行排序的不同排序维度对搜索结果在适于在移动终端上以预定类型网页方式呈现的影响程度不同,因此根据各个排序维度的重要程度对其分别赋予不同权重,从而使得最终获取的排序后的多个搜索结果对应的搜索结果网页既与查询序列具有较高匹配度又适于在移动终端上以预定类型网页方式呈现,使得用户能够获得同时符合其查询需求及其浏览体验的排序后的多个搜索结果。
作为本实施例的优选方案之一,图2示出根据本发明一个优选实施例的确定每个搜索结果对应的搜索结果网页的转码质量的排序装置的结构示意图。其中,该排序装置包括搜索结果获取装置1、判断装置2、调整信息获取装置3、第一排序装置4、模板获取装置5、特征提取装置6和转码质量确定装置7。
其中,搜索结果获取装置1、判断装置2、调整信息获取装置3和第一排序装置4已在参照图1所示实施例中予以详述,在此不再赘述。
模板获取装置5获取每个搜索结果网页对应的网页类型模板。
具体地,模板获取装置5根据每个搜索结果网页的预定类型,确定与该预定类型网页对应的网页类型模板;例如,搜索结果网页为小说类网页,则模板获取装置5根据该小说类网页,在网页类型模板库进行查询,以获得与该小说类网页对应的网页类型模板。
接着,特征提取装置6根据模板获取装置5获取的网页类型模版,提取所述搜索结果网页中的一个或多个页面内容块特征信息。
具体地,特征提取装置6根据已获取的网页类型模板中包括的页面内容块,逐一在每个搜索结果网页的页面编程语言信息中进行提取,提取获取该搜索结果网页中的、同时包括于该网页类型模板中的一个或多个页面内容块特征信息。
其中,所述页面编程语言信息中的内容块包括该页面编程语言信息中的由一个或多个标签标识的内容区域,其与页面中显示的特定内容相对应,例如,与标题、目录、作者名称、正文内容等相对应。
其中,所述页面编程语言信息包括但不限于:1)HTML(超文本标记语言)文件;2)XML(可扩展标记语言)文件;3)XHTML(可扩展超文本标记语言)文件;4)XAML(可扩展应用程序标记语言)文件等。
其中,所述页面内容块标注信息在所述页面编程语言信息中的存储方式包括但不限于以下至少任一项方式:
1)存储于所述页面编程语言信息中的注释中;
例如,利用JSON格式,页面内容块标识信息存储于XHTML文件注释中,如<!--tc block_begin:{type:″TITLE″}--><!--tc block_end-->;特征提取装置6通过对该XHTML文件进行解析,在该XHTML文件中确定用于标注标题内容块的注释,从而将该注释<!--tcblock_begin:{type:″TITLE″}-->及<!--tc block_end-->之间的HTML文件部分进行提取,以提取该页面的标题内容块;其中,JSON格式是一种轻量级的数据交换格式,其一般采用“名称/值”对的方式表示数据,名称和值之间使用“:”隔开。
2)存储于所述页面编程语言信息中的定制标签中;
例如,页面内容块标识信息存储于XHTML文件的定制标签<tc></tc>中,特征提取装置6通过对该XHTML文件进行解析,在该XHTML文件中确定用于标注作者名称内容块的定制标签<tctype=“author”>,从而将<tc type=“author”>与</tc>之间的HTML文件部分进行提取,以获取该页面的作者名称内容块。
3)存储于所述页面编程语言信息中的标签属性中;
例如,页面内容块标识信息存储于XHTML文件的标签属性中,如段落标签<p>的标签属性中,特征提取装置6通过对该XHTML文件进行解析,在该XHTML文件中确定用于标注正文内容块的段落标签属性<p tc_type=“TEXT”>,则对该段落标签<p tc_type=“TEXT”>与</p>之间的XHTML文件部分进行提取,以获取该页面的正文内容块。
在一示例中,用于搜索小说类网页的多个搜索结果为A5和A6,模板获取装置5获取小说类网页的网页类型模板;特征提取装置6根据已获取的小说类型的网页类型模板中包括的封面页包括标题内容块及作者名称内容块、目录页包括章节标题内容块和正文页包括正文内容块,逐一在每个搜索结果网页的页面编程语言信息中进行提取,以获得A5的搜索结果网页的封面页包括标题内容块及作者名称内容块、目录页包括章节标题内容块和正文页包括正文内容块,且A6的搜索结果网页的封面页包括标题内容块及正文页包括正文内容块。
随后,转码质量确定装置7根据特征提取装置6已提取的一个或多个页面内容块特征信息,基于第一预定判断规则,确定所述每个搜索结果对应的搜索结果网页的转码质量。
其中,所述第一预定判断规则包括但不限于:
1)当预定网页类型为小说类网页时,则:
a判断搜索结果网页的封面页中是否包括标题内容块、作者名称内容块,并根据第一赋值规则,来确定该搜索结果对应的搜索结果网页的转码质量;
b判断搜索结果网页中的目录页中是否包括章节标题内容块时,并根据第二赋值规则,来确定该搜索结果对应的搜索结果网页的转码质量;
c判断搜索结果网页中的正文页中包括正文内容块时,并根据第三赋值规则,来确定该搜索结果对应的搜索结果网页的转码质量;
2)当预定网页类型为图片集网页类型时,则判断搜索结果网页中是否包括图片内容块时,并根据第四赋值规则,来确定该搜索结果对应的搜索结果网页的转码质量。
在一示例中,接上例,A5的搜索结果网页的封面页包括标题内容块及作者名称内容块、目录页包括章节标题内容块和正文页包括正文内容块,且A6的搜索结果网页的封面页包括标题内容块及正文页包括正文内容块;第一、第二、第三及第四赋值规则示出的包括相应的一个内容块则对转码质量的评分加1;则转码质量确定装置7确定A5对应的搜索结果网页的转码质量为QA5:4,且A6对应的搜索结果网页的转码质量为QA6:2。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取每个搜索结果网页对应的网页类型模板,根据所述网页类型模版,提取所述搜索结果网页中的一个或多个页面内容块特征信息;根据所述一个或多个页面内容块特征信息,基于第一预定判断规则,确定所述每个搜索结果对应的搜索结果网页的转码质量的实现方式,均应包含在本发明的范围内。
转码质量较高的搜索结果网页更加适于在移动终端上以预定类型网页方式来呈现,因此将转码质量作为对多个搜索结果进行排序的一个排序维度,可使得具有较高转码质量的搜索结果网页对应的搜索结果能在一定程度上提升其排序,最终使得用户更易于获取能够带给其更高浏览体验的搜索结果。
作为本实施例的优选方案之一,图3示出根据本发明另一个优选实施例的确定页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息量的排序装置的结构示意图。其中,其中,该排序装置包括搜索结果获取装置1、判断装置2、调整信息获取装置3、第一排序装置4、编程语言确定装置8和第一适合度确定装置9。
其中,搜索结果获取装置1、判断装置2、调整信息获取装置3和第一排序装置4已在参照图1所示实施例中予以详述,在此不再赘述。
编程语言确定装置8确定每个搜索结果网页的页面编程语言信息。
具体地,编程语言确定装置8根据每个搜索结果页面的页面编程语言文件中包括的特定标签信息,如<HTML>,来判断搜索结果网页的页面编程语言信息;也可在网页编程语言库中进行查询,以获取预存的每个搜索结果页面的页面编程语言信息。
随后,第一适合度确定装置9根据已确定的页面编程语言信息,基于第二预定判断规则,确定所述页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
其中,所述第二预定判断规则包括但不限于:
-当页面编程语言信息为XHTML、HTML5、WML等时,对页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息加1。
在一示例中,已确定搜索结果A1、A2、A3和A4分别对应的页面编程语言信息为HTML、WML、HTML5和XHTML时,第一适合度确定装置9基于第二预定判断规则,确定A1、A2、A3和A4分别对应的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息为FA1:0、FA2:1、FA3:1、FA4:1。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何确定每个搜索结果网页的页面编程语言信息,根据所述页面编程语言信息,基于第二预定判断规则,确定所述页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息的实现方式,均应包含在本发明的范围内。
适合度信息较高的搜索结果网页其页面编程语言更加适于在移动终端上以预定类型网页方式来呈现,因此将适合度信息作为对多个搜索结果进行排序的另一个排序维度,可使得具有较高适合度信息的搜索结果网页对应的搜索结果能在一定程度上提升其排序,最终使得用户更易于获取能够带给其更高浏览体验的搜索结果。
作为本实施例的优选方案之一(参照图1),该排序装置还包括相关信息获取装置(未示出)和第二适合度确定装置(未示出)。
相关信息获取装置获取所述移动终端的设备相关信息。
其中,所述设备相关信息包括但不限于:
1)移动终端的浏览器支持展示的页面编程语言信息;
2)移动终端的品牌型号。
在一示例中,相关信息获取装置向移动终端发送获取该移动终端的设备相关信息的请求,该移动终端接收该请求,并在其属性信息库中进行查询,以获得其浏览器支持的页面编程语言信息等设备相关信息,并将该等设备相关信息发送至网络设备,接着相关信息获取装置通过实时监控的方式接收该等设备相关信息。
随后,第二适合度确定装置根据已获取的设备相关信息,确定所述搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
在一示例中,已确定搜索结果A5、A6、A7和A8分别对应的页面编程语言信息为HTML、WML、HTML5和XHTML时,已获取的设备相关信息中示出移动终端的浏览器支持展示的页面编程语言信息为WML,则第二适合度确定装置根据已获取的设备相关信息,确定搜索结果A6对应的页面编程语言信息与该移动终端的浏览器支持展示的页面编程语言信息一致,则将A6的搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息确定为FA6:1,其他的搜索结果网页的该适合度信息均为0。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取所述移动终端的设备相关信息,根据所述设备相关信息,确定所述搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息的实现方式,均应包含在本发明的范围内。
图4示出根据本发明另一个方面的用于对搜索结果进行排序的方法流程图。本发明的方法主要通过网络设备来实现;其中,根据本优选实施例的方法包括步骤S1、步骤S2、步骤S3和步骤S4。
所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
首先,在步骤S1中,网络设备根据来自移动终端的查询序列进行匹配查询,来获取与所述查询序列相匹配的多个搜索结果及每个搜索结果与所述查询序列的相关度信息;
其中,所述移动终端包括但不限于任何可适用于本发明的能够通过键盘、触摸屏等与用户进行交互的移动式电子产品,诸如手机、PDA、掌上电脑(PPC)、游戏机(PSP)等。在此,所述网络设备和移动终端均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件可包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
本领域技术人员应能理解上述移动终端以及网络设备仅为举例,其他现有的或今后可能出现的移动终端以及网络设备如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在此,所述移动终端与所述网络设备之间可通过任何通信方式实现通信,包括但不限于,基于3GPP、LTE、WIMAX的移动通信、基于TCP/IP、UDP协议的计算机网络通信以及基于蓝牙、红外传输标准的近距无线传输方式。所述移动终端与所述网络设备之间连接的网络包括但不限于:互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。
具体地,在步骤S1中,网络设备根据来自移动终端的用户输入的查询序列进行匹配查询,并基于接收到的查询序列进行搜索。一般地,搜索过程如下:查询序列中包含一个或多个关键词,优选地,还包括关键词之间的关联词,搜索结果获取装置1将提取这些关键词,优选地,还提取关联词,并在网络索引库中根据所述关键词、或关键词与关联词进行匹配查询从而获得多个搜索结果,其中每个搜索结果与该查询序列的相关度信息可根据各种搜索算法确定,例如根据传统的点击率算法确定该相关度信息、根据Google的“PageRank”搜索算法(参见美国专利US6285699,“Method for node ranking in a linkeddatabase”)确定该相关度信息、根据百度的“超链”搜索算法确定该相关度信息,在步骤S1中,网络设备基于上述搜索算法来获得每个搜索结果与该查询序列的相关度信息。其中,所述相关度信息指通过“PageRank”、“超链”等基本搜索算法确定的搜索结果与查询序列的匹配程度分值。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据来自移动终端的查询序列进行匹配查询,来获取与所述查询序列相匹配的多个搜索结果及每个搜索结果与所述查询序列的相关度信息的实现方式,均应包含在本发明的范围内。
在步骤S2中,网络设备对所述查询序列进行识别处理,来判断所述查询序列是否用于请求预定类型网页。
其中,预定类型网页包括但不限于:
1)文学类网页,如小说类网页
2)图片类网页,如图片集网页。
在一示例中,在步骤S2中,网络设备将查询序列在预定的类型映射表中进行匹配查询,来判断所述查询序列是否用于请求预定类型网页;其中,所述类型映射表中包括多种预定类型及其分别对应的一个或多个查询序列;优选地,所述查询序列与所述预定类型的对应关系可通过网络设备预先对多个用户的大量搜索行为进行挖掘来确定。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对所述查询序列进行识别处理,来判断所述查询序列是否用于请求预定类型网页的实现方式,均应包含在本发明的范围内。
当在步骤S2中网络设备判断所述查询序列用于请求预定类型网页时,在步骤S3中,网络设备获取每个搜索结果的排序调整信息,其中,所述排序调整信息与该搜索结果网页适于在移动终端上以预定类型网页方式呈现的适合程度有关。
其中,所述排序调整信息包括以下至少任一项:
1)搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量;
2)搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
具体地,在步骤S3中,网络设备获取每个搜索结果的排序调整信息的方式包括但不限于:
1)从调整信息库中获取预存的每个搜索结果的搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量及该搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息;其中,所述调整信息库包括但不限于关系数据库、Key-Value存储系统或文件系统等;
2)获取每个搜索结果网页对应的网页类型模板;根据所述网页类型模版,提取所述搜索结果网页中的一个或多个页面内容块特征信息;根据所述一个或多个页面内容块特征信息,基于第一预定判断规则,确定所述每个搜索结果对应的搜索结果网页的转码质量;该方式将在图5所示的实施例中给予详述。
3)确定每个搜索结果网页的页面编程语言信息;根据所述页面编程语言信息,基于第二预定判断规则,确定所述页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息;该方式将在图6所示的实施例中给予详述。
在一示例中,网络设备根据来自移动终端的查询序列“武极”进行匹配查询,获取与该查询序列相匹配的多个搜索结果为A1、A2、A3和A4,当网络设备判断查询序列“武极”为用于请求小说类网页时,在步骤S3中,网络设备根据搜索结果A1、A2、A3和A4分别对应的链接信息,从网络设备的调整信息库中获取预存的A1、A2、A3和A4的搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量及该搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何当判断所述查询序列用于请求预定类型网页时,获取每个搜索结果的排序调整信息的实现方式,均应包含在本发明的范围内,其中,所述排序调整信息与该搜索结果网页适于在移动终端上以预定类型网页方式呈现的适合程度有关。
随后,在步骤S4中,网络设备根据所述每个搜索结果与所述查询序列的相关度信息及所述每个搜索结果的排序调整信息,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果。
其中,在步骤S4中,网络设备对多个搜索结果进行排序处理以获取排序后的多个搜索结果的方式包括但不限于:
-根据每个搜索结果与查询序列的相关度信息的分值、每个搜索结果的搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量的分值及每个搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息的分值,简单进行加和计算,并根据加和结果进行排序操作;
在一示例中,多个搜索结果为A1、A2、A3和A4,网络设备获取的四个搜索结果与查询序列的相关度信息的分值分别为RA1:10、RA2:8、RA3:7、RA4:3,且网络设备获取的该四个搜索结果的搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量的分值分别为QA1:1、QA2:1、QA3:4、QA4:2,在步骤S3中,网络设备获取的该四个搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息的分值分别为FA1:0、FA2:0、FA3:1、FA4:1;在步骤S4中,网络设备将每个搜索结果的相关度信息、转码质量的分值和适合度信息的分值进行加和计算,即通过公式1):
sn=RAn+QAn+FAn    1)
获取的加和结果为:
s1:=10+1+0=11;
s2:=8+1+0=9;
s3:=7+4+1=12;
s4:=3+2+1=6;
则网络设备根据该等加和结果,对该四个所述搜索结果进行排序获得排序后的该四个搜索结果为A3、A1、A2和A4。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述每个搜索结果与所述查询序列的相关度信息及所述每个搜索结果的排序调整信息,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果的实现方式,均应包含在本发明的范围内。
通过根据每个搜索结果与查询序列的相关度信息及每个搜索结果的排序调整信息,对该多个搜索结果进行排序处理,以使得多个搜索结果的排序方式不仅与用户输入的查询序列的匹配程度相关,而且该排序方式也与每个搜索结果网页是否适于在移动终端上以预定类型网页方式呈现相关联,实现了将适于在移动终端上以预定类型网页方式呈现的较高转码质量的搜索结果网页对应的搜索结果及适于在移动终端上以预定类型网页方式呈现的较高适合度信息的搜索结果网页对应的搜索结果能够排于搜索结果页的较高位置,用户可在其最易获取信息的视觉区域内点击排序较高的几个搜索结果,就可获取适于其在移动终端浏览的搜索结果网页,从而提高用户浏览体验。
优选地,该方法还包括步骤S10(图未示)和步骤S11(图未示)。其中,在步骤S10中,网络设备根据所述每个搜索结果与所述查询序列的相关度信息及所述搜索结果的排序调整信息,并结合所述相关度信息和所述排序调整信息的预定权重,进行加权计算,以确定所述每个搜索结果的加权排序结果;在步骤S11中,网络设备根据加权确定装置确定的所述每个搜索结果的加权排序结果,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果。
在一示例中,多个搜索结果为A1、A2、A3和A4,网络设备获取的四个搜索结果与查询序列的相关度信息的分值分别为RA1:10、RA2:8、RA3:7、RA4:3,且已获取的该四个搜索结果的搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量的分值分别为QA1:1、QA2:1、QA3:4、QA4:2,该四个搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息的分值分别为FA1:0、FA2:0、FA3:1、FA4:1;同时,相关度信息的预定权重为W1:1;搜索结果的搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量的预定权重为W2:0.4,搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息的预定权重为W3:0.5;则在步骤S10中,网络设备将每个搜索结果的相关度信息、转码质量的分值和适合度信息的分值进行加权计算,即通过公式2):
Sn=RAn×W1+QAn×W2+FAn×W3        2)
以获取的加权结果为:
S1:=10×1+1×0.4+0×0.5=10.4;
S2:=8×1+1×0.4+0×0.5=8.4;
S3:=7×1+4×0.4+1×0.5=9.1;
S4:=3×1+2×0.4+1×0.5=4.3;
则在步骤S11中,网络设备根据该等加权结果,对该四个所述搜索结果进行排序获得排序后的该四个搜索结果为A1、A3、A2和A4。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述每个搜索结果与所述查询序列的相关度信息及所述搜索结果的排序调整信息,并结合所述相关度信息和所述排序调整信息的预定权重,进行加权计算,以确定所述每个搜索结果的加权排序结果,接着根据加权确定装置确定的所述每个搜索结果的加权排序结果,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果的实现方式,均应包含在本发明的范围内。
由于对多个搜索结果进行排序的不同排序维度对搜索结果在适于在移动终端上以预定类型网页方式呈现的影响程度不同,因此根据各个排序维度的重要程度对其分别赋予不同权重,从而使得最终获取的排序后的多个搜索结果对应的搜索结果网页既与查询序列具有较高匹配度又适于在移动终端上以预定类型网页方式呈现,使得用户能够获得同时符合其查询需求及其浏览体验的排序后的多个搜索结果。
作为本实施例的优选方案之一,图5示出根据本发明一个优选实施例的确定每个搜索结果对应的搜索结果网页的转码质量的方法流程图。其中,根据本优选实施例的方法包括步骤S101、步骤S102、步骤S103、步骤S104、步骤S105、步骤S106和步骤S107。
其中,步骤S101、步骤S102、步骤S103和步骤S104已在参照图4所示实施例中予以详述,在此不再赘述。
在步骤S105中,网络设备获取每个搜索结果网页对应的网页类型模板。
具体地,在步骤S105中,网络设备根据每个搜索结果网页的预定类型,确定与该预定类型网页对应的网页类型模板;例如,搜索结果网页为小说类网页,则在步骤S105中,网络设备根据该小说类网页,在网页类型模板库进行查询,以获得与该小说类网页对应的网页类型模板。
接着,在步骤S106中,网络设备根据已获取的网页类型模版,提取所述搜索结果网页中的一个或多个页面内容块特征信息。
具体地,在步骤S106中,网络设备根据已获取的网页类型模板中包括的页面内容块,逐一在每个搜索结果网页的页面编程语言信息中进行提取,提取获取该搜索结果网页中的、同时包括于该网页类型模板中的一个或多个页面内容块特征信息。
其中,所述页面编程语言信息中的内容块包括该页面编程语言信息中的由一个或多个标签标识的内容区域,其与页面中显示的特定内容相对应,例如,与标题、目录、作者名称、正文内容等相对应。
其中,所述页面编程语言信息包括但不限于:1)HTML(超文本标记语言)文件;2)XML(可扩展标记语言)文件;3)XHTML(可扩展超文本标记语言)文件;4)XAML(可扩展应用程序标记语言)文件等。
其中,所述页面内容块标注信息在所述页面编程语言信息中的存储方式包括但不限于以下至少任一项方式:
1)存储于所述页面编程语言信息中的注释中;
例如,利用JSON格式,页面内容块标识信息存储于XHTML文件注释中,如<!--tc block_begin:{type:″TITLE″}--><!--tc block_end-->;在步骤S106中,网络设备通过对该XHTML文件进行解析,在该XHTML文件中确定用于标注标题内容块的注释,从而将该注释<!--tc block_begin:{type:″TITLE″}-->及<!--tc block_end-->之间的HTML文件部分进行提取,以提取该页面的标题内容块;其中,JSON格式是一种轻量级的数据交换格式,其一般采用“名称/值”对的方式表示数据,名称和值之间使用“:”隔开。
2)存储于所述页面编程语言信息中的定制标签中;
例如,页面内容块标识信息存储于XHTML文件的定制标签<tc></tc>中,在步骤S106中,网络设备通过对该XHTML文件进行解析,在该XHTML文件中确定用于标注作者名称内容块的定制标签<tc type=“author”>,从而将<tc type=“author”>与</tc>之间的HTML文件部分进行提取,以获取该页面的作者名称内容块。
3)存储于所述页面编程语言信息中的标签属性中;
例如,页面内容块标识信息存储于XHTML文件的标签属性中,如段落标签<p>的标签属性中,在步骤S106中,网络设备通过对该XHTML文件进行解析,在该XHTML文件中确定用于标注正文内容块的段落标签属性<p tc_type=“TEXT”>,则对该段落标签<ptc_type=“TEXT”>与</p>之间的XHTML文件部分进行提取,以获取该页面的正文内容块。
在一示例中,用于搜索小说类网页的多个搜索结果为A5和A6,在步骤S105中,网络设备获取小说类网页的网页类型模板;在步骤S106中,网络设备根据已获取的小说类型的网页类型模板中包括的封面页包括标题内容块及作者名称内容块、目录页包括章节标题内容块和正文页包括正文内容块,逐一在每个搜索结果网页的页面编程语言信息中进行提取,以获得A5的搜索结果网页的封面页包括标题内容块及作者名称内容块、目录页包括章节标题内容块和正文页包括正文内容块,且A6的搜索结果网页的封面页包括标题内容块及正文页包括正文内容块。
随后,在步骤S107中,网络设备根据其在步骤S106中已提取的一个或多个页面内容块特征信息,基于第一预定判断规则,确定所述每个搜索结果对应的搜索结果网页的转码质量。
其中,所述第一预定判断规则包括但不限于:
1)当预定网页类型为小说类网页时,则:
a判断搜索结果网页的封面页中是否包括标题内容块、作者名称内容块,并根据第一赋值规则,来确定该搜索结果对应的搜索结果网页的转码质量;
b判断搜索结果网页中的目录页中是否包括章节标题内容块时,并根据第二赋值规则,来确定该搜索结果对应的搜索结果网页的转码质量;
c判断搜索结果网页中的正文页中包括正文内容块时,并根据第三赋值规则,来确定该搜索结果对应的搜索结果网页的转码质量;
2)当预定网页类型为图片集网页类型时,则判断搜索结果网页中是否包括图片内容块时,并根据第四赋值规则,来确定该搜索结果对应的搜索结果网页的转码质量。
在一示例中,接上例,A5的搜索结果网页的封面页包括标题内容块及作者名称内容块、目录页包括章节标题内容块和正文页包括正文内容块,且A6的搜索结果网页的封面页包括标题内容块及正文页包括正文内容块;第一、第二、第三及第四赋值规则示出的包括相应的一个内容块则对转码质量的评分加1;则在步骤S107中,网络设备确定A5对应的搜索结果网页的转码质量为QA5:4,且A6对应的搜索结果网页的转码质量为QA6:2。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取每个搜索结果网页对应的网页类型模板,根据所述网页类型模版,提取所述搜索结果网页中的一个或多个页面内容块特征信息;根据所述一个或多个页面内容块特征信息,基于第一预定判断规则,确定所述每个搜索结果对应的搜索结果网页的转码质量的实现方式,均应包含在本发明的范围内。
转码质量较高的搜索结果网页更加适于在移动终端上以预定类型网页方式来呈现,因此将转码质量作为对多个搜索结果进行排序的一个排序维度,可使得具有较高转码质量的搜索结果网页对应的搜索结果能在一定程度上提升其排序,最终使得用户更易于获取能够带给其更高浏览体验的搜索结果。
作为本实施例的优选方案之一,图6示出根据本发明另一个优选实施例的确定页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息量的方法流程图。其中,本优选实施例的方法包括步骤S101、步骤S102、步骤S103、步骤S104、步骤S108和步骤S109。
其中,步骤S101、步骤S102、步骤S103和步骤S104已在参照图4所示实施例中予以详述,在此不再赘述。
在步骤S108中,网络设备确定每个搜索结果网页的页面编程语言信息。
具体地,在步骤S108中,网络设备根据每个搜索结果页面的页面编程语言文件中包括的特定标签信息,如<HTML>,来判断搜索结果网页的页面编程语言信息;也可在网页编程语言库中进行查询,以获取预存的每个搜索结果页面的页面编程语言信息。
随后,在步骤S109中,网络设备根据已确定的页面编程语言信息,基于第二预定判断规则,确定所述页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
其中,所述第二预定判断规则包括但不限于:
-当页面编程语言信息为XHTML、HTML5、WML等时,对页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息加1。
在一示例中,已确定搜索结果A1、A2、A3和A4分别对应的页面编程语言信息为HTML、WML、HTML5和XHTML时,在步骤S109中,网络设备基于第二预定判断规则,确定A1、A2、A3和A4分别对应的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息为FA1:0、FA2:1、FA3:1、FA4:1。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何确定每个搜索结果网页的页面编程语言信息,根据所述页面编程语言信息,基于第二预定判断规则,确定所述页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息的实现方式,均应包含在本发明的范围内。
适合度信息较高的搜索结果网页其页面编程语言更加适于在移动终端上以预定类型网页方式来呈现,因此将适合度信息作为对多个搜索结果进行排序的另一个排序维度,可使得具有较高适合度信息的搜索结果网页对应的搜索结果能在一定程度上提升其排序,最终使得用户更易于获取能够带给其更高浏览体验的搜索结果。
作为本实施例的优选方案之一(参照图4),该方法还包括步骤S12(未示出)和步骤S13(未示出)。
在步骤S12中,网络设备获取所述移动终端的设备相关信息。
其中,所述设备相关信息包括但不限于:
1)移动终端的浏览器支持展示的页面编程语言信息;
2)移动终端的品牌型号。
在一示例中,在步骤S12中,网络设备向移动终端发送获取该移动终端的设备相关信息的请求,该移动终端接收该请求,并在其属性信息库中进行查询,以获得其浏览器支持的页面编程语言信息等设备相关信息,并将该等设备相关信息发送至网络设备,接着相关信息获取装置通过实时监控的方式接收该等设备相关信息。
随后,在步骤S13中,网络设备根据已获取的设备相关信息,确定所述搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
在一示例中,已确定搜索结果A5、A6、A7和A8分别对应的页面编程语言信息为HTML、WML、HTML5和XHTML时,已获取的设备相关信息中示出移动终端的浏览器支持展示的页面编程语言信息为WML,则在步骤S13中,网络设备根据已获取的设备相关信息,确定搜索结果A6对应的页面编程语言信息与该移动终端的浏览器支持展示的页面编程语言信息一致,则将A6的搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息确定为FA6:1,其他的搜索结果网页的该适合度信息均为0。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取所述移动终端的设备相关信息,根据所述设备相关信息,确定所述搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息的实现方式,均应包含在本发明的范围内。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现本发明中的装置。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他装置或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (13)

1.一种用于对搜索结果进行排序的方法,该方法包括以下步骤:
a根据来自移动终端的查询序列进行匹配查询,来获取与所述查询序列相匹配的多个搜索结果及每个搜索结果与所述查询序列的相关度信息;
其中,该方法还包括:
w对所述查询序列进行识别处理,来判断所述查询序列是否用于请求预定类型网页;
x当判断所述查询序列用于请求预定类型网页时,获取每个搜索结果的排序调整信息,其中,所述排序调整信息与该搜索结果网页适于在移动终端上以预定类型网页方式呈现的适合程度有关;
y根据所述每个搜索结果与所述查询序列的相关度信息及所述每个搜索结果的排序调整信息,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果。
2.根据权利要求1所述的方法,其中,所述步骤y包括:
-根据所述每个搜索结果与所述查询序列的相关度信息及所述搜索结果的排序调整信息,并结合所述相关度信息和所述排序调整信息的预定权重,进行加权计算,以确定所述每个搜索结果的加权排序结果;
-根据所述每个搜索结果的加权排序结果,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果。
3.根据权利要求1或2所述的方法,其中,所述排序调整信息包括以下至少任一项:
-搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量;
-搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
4.根据权利要求3所述的方法,其中,该方法还包括以下步骤:
-获取每个搜索结果网页对应的网页类型模板;
-根据所述网页类型模版,提取所述搜索结果网页中的一个或多个页面内容块特征信息;
-根据所述一个或多个页面内容块特征信息,基于第一预定判断规则,确定所述每个搜索结果对应的搜索结果网页的转码质量。
5.根据权利要求3所述的方法,其中,该方法还包括以下步骤:
-确定每个搜索结果网页的页面编程语言信息;
-根据所述页面编程语言信息,基于第二预定判断规则,确定所述页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
6.根据权利要求3所述的方法,其中,该方法还包括:
-获取所述移动终端的设备相关信息;
-根据所述设备相关信息,确定所述搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
7.一种用于对搜索结果进行排序的排序装置,该排序装置包括:
搜索结果获取装置,用于根据来自移动终端的查询序列进行匹配查询,来获取与所述查询序列相匹配的多个搜索结果及每个搜索结果与所述查询序列的相关度信息;
其中,该排序装置还包括:
判断装置,用于对所述查询序列进行识别处理,来判断所述查询序列是否用于请求预定类型网页;
调整信息获取装置,用于当判断所述查询序列用于请求预定类型网页时,获取每个搜索结果的排序调整信息,其中,所述排序调整信息与该搜索结果网页适于在移动终端上以预定类型网页方式呈现的适合程度有关;
第一排序装置,用于根据所述每个搜索结果与所述查询序列的相关度信息及所述每个搜索结果的排序调整信息,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果。
8.根据权利要求7所述的排序装置,其中,所述第一排序装置包括:
加权确定装置,用于根据所述每个搜索结果与所述查询序列的相关度信息及所述搜索结果的排序调整信息,并结合所述相关度信息和所述排序调整信息的预定权重,进行加权计算,以确定所述每个搜索结果的加权排序结果;
第二排序装置,用于根据所述每个搜索结果的加权排序结果,对所述多个搜索结果进行排序处理,以获取排序后的多个搜索结果。
9.根据权利要求7或8所述的排序装置,其中,所述排序调整信息包括以下至少任一项:
-搜索结果网页被转码为适于在移动终端上以预定类型网页方式呈现的转码质量;
-搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
10.根据权利要求9所述的排序装置,其中,该排序装置还包括:
模板获取装置,用于获取每个搜索结果网页对应的网页类型模板;
特征提取装置,用于根据所述网页类型模版,提取所述搜索结果网页中的一个或多个页面内容块特征信息;
转码质量确定装置,用于根据所述一个或多个页面内容块特征信息,基于第一预定判断规则,确定所述每个搜索结果对应的搜索结果网页的转码质量。
11.根据权利要求9所述的排序装置,其中,该排序装置还包括:
编程语言确定装置,用于确定每个搜索结果网页的页面编程语言信息;
第一适合度确定装置,用于根据所述页面编程语言信息,基于第二预定判断规则,确定所述页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
12.根据权利要求9所述的方法,其中,该排序装置还包括:
相关信息获取装置,用于获取所述移动终端的设备相关信息;
第二适合度确定装置,用于根据所述设备相关信息,确定所述搜索结果网页的页面编程语言适于在移动终端上以预定类型网页方式呈现的适合度信息。
13.一种网络设备,包括如权利要求7至12中至少一项所述的排序装置。
CN201210300943.7A 2012-08-22 2012-08-22 一种用于对搜索结果进行排序的方法、装置与设备 Active CN103631793B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210300943.7A CN103631793B (zh) 2012-08-22 2012-08-22 一种用于对搜索结果进行排序的方法、装置与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210300943.7A CN103631793B (zh) 2012-08-22 2012-08-22 一种用于对搜索结果进行排序的方法、装置与设备

Publications (2)

Publication Number Publication Date
CN103631793A true CN103631793A (zh) 2014-03-12
CN103631793B CN103631793B (zh) 2018-11-23

Family

ID=50212866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210300943.7A Active CN103631793B (zh) 2012-08-22 2012-08-22 一种用于对搜索结果进行排序的方法、装置与设备

Country Status (1)

Country Link
CN (1) CN103631793B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955471A (zh) * 2014-03-31 2014-07-30 北京奇虎科技有限公司 一种进行搜索的方法和装置
CN104881453A (zh) * 2015-05-18 2015-09-02 百度在线网络技术(北京)有限公司 一种识别网页类型的方法和装置
CN105095336A (zh) * 2014-05-23 2015-11-25 岳造宇 资讯查询方法、资讯提供方法、资讯查询系统及其服务器
CN105335373A (zh) * 2014-06-17 2016-02-17 阿里巴巴集团控股有限公司 信息搜索方法及装置
CN105740255A (zh) * 2014-12-09 2016-07-06 深圳市腾讯计算机系统有限公司 网络搜索方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080172357A1 (en) * 2007-01-17 2008-07-17 Google Inc. Location in search queries
CN101636737A (zh) * 2007-01-24 2010-01-27 谷歌公司 混合移动搜索结果
CN102023991A (zh) * 2009-09-21 2011-04-20 中兴通讯股份有限公司 在终端上更新索引并基于其对搜索结果排序的方法及装置
CN102298615A (zh) * 2011-07-29 2011-12-28 百度在线网络技术(北京)有限公司 一种计算机实现的用于展示搜索结果的方法与设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080172357A1 (en) * 2007-01-17 2008-07-17 Google Inc. Location in search queries
CN101636737A (zh) * 2007-01-24 2010-01-27 谷歌公司 混合移动搜索结果
CN102023991A (zh) * 2009-09-21 2011-04-20 中兴通讯股份有限公司 在终端上更新索引并基于其对搜索结果排序的方法及装置
CN102298615A (zh) * 2011-07-29 2011-12-28 百度在线网络技术(北京)有限公司 一种计算机实现的用于展示搜索结果的方法与设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955471A (zh) * 2014-03-31 2014-07-30 北京奇虎科技有限公司 一种进行搜索的方法和装置
CN105095336A (zh) * 2014-05-23 2015-11-25 岳造宇 资讯查询方法、资讯提供方法、资讯查询系统及其服务器
CN105335373A (zh) * 2014-06-17 2016-02-17 阿里巴巴集团控股有限公司 信息搜索方法及装置
CN105740255A (zh) * 2014-12-09 2016-07-06 深圳市腾讯计算机系统有限公司 网络搜索方法及装置
CN105740255B (zh) * 2014-12-09 2019-07-05 深圳市腾讯计算机系统有限公司 网络搜索方法及装置
CN104881453A (zh) * 2015-05-18 2015-09-02 百度在线网络技术(北京)有限公司 一种识别网页类型的方法和装置

Also Published As

Publication number Publication date
CN103631793B (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
CN103631794A (zh) 一种用于对搜索结果进行排序的方法、装置与设备
CN100476830C (zh) 一种网络资源检索方法及系统
JP5501373B2 (ja) 複数のウェブサイトからデータを収集及びランク付けするためのシステム及び方法
CN102171689B (zh) 用于提供搜索结果的方法、系统
CN104217031B (zh) 一种根据服务器搜索日志数据进行用户分类的方法和装置
CN107145496A (zh) 基于关键词将图像与内容项目匹配的方法
CN102968413B (zh) 一种用于提供搜索结果的方法与设备
US10402479B2 (en) Method, server, browser, and system for recommending text information
CN102687138A (zh) 搜索建议聚类和呈现
CN102073699A (zh) 用于基于用户行为来改善搜索结果的方法、装置和设备
JP2017220205A (ja) 検索クエリに応答してコンテンツとマッチングしようとする画像を動的にランキングする方法及びシステム
CN107145497B (zh) 基于图像和内容的元数据选择与内容匹配的图像的方法
CN102663088A (zh) 一种用于提供搜索结果的方法与设备
CN108230113A (zh) 用户画像生成方法、装置、设备及可读存储介质
CN103631793A (zh) 一种用于对搜索结果进行排序的方法、装置与设备
US20090259649A1 (en) System and method for detecting templates of a website using hyperlink analysis
CN107766399A (zh) 用于使图像与内容项目匹配的方法和系统及机器可读介质
CN106033445A (zh) 获取文章关联度数据的方法和装置
CN104699837B (zh) 网页配图选取方法、装置及服务器
CN102364467A (zh) 一种网络搜索方法和系统
TW201220097A (en) capable of performing relevancy processing for at least one product corresponding to product identifiers referenced in relevant web pages
CN107491465A (zh) 用于搜索内容的方法和装置以及数据处理系统
JP2009301221A (ja) 文書検索システム、文書検索方法、及びプログラム
KR101346927B1 (ko) 검색 장치, 검색 방법, 및 검색 프로그램을 기억하는 컴퓨터 판독 가능한 기록 매체
CN106933864A (zh) 一种搜索引擎系统及其搜索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant