CN103593373A - 一种用于搜索结果排序的方法与设备 - Google Patents

一种用于搜索结果排序的方法与设备 Download PDF

Info

Publication number
CN103593373A
CN103593373A CN201210293220.9A CN201210293220A CN103593373A CN 103593373 A CN103593373 A CN 103593373A CN 201210293220 A CN201210293220 A CN 201210293220A CN 103593373 A CN103593373 A CN 103593373A
Authority
CN
China
Prior art keywords
information
search results
sequencing
sequence
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210293220.9A
Other languages
English (en)
Other versions
CN103593373B (zh
Inventor
于佃海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210293220.9A priority Critical patent/CN103593373B/zh
Publication of CN103593373A publication Critical patent/CN103593373A/zh
Application granted granted Critical
Publication of CN103593373B publication Critical patent/CN103593373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的目的是提供一种用于搜索结果排序的方法与设备。排序设备获取与用户输入的查询序列相对应的搜索结果;根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型;根据所述结果排序模型,确定所述搜索结果的优先级;根据所述优先级,将所述搜索结果提供给所述用户。与现有技术相比,本发明通过根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型,进而确定搜索结果的优先级,从而解决了单一利用查询请求与搜索结果的匹配度信息来进行排序的方式,会可能导致排序结果与用户期待的结果相背离的问题,提高了搜索结果优先级的准确率与用户获取信息的效率,从而提升了用户的搜索使用体验。

Description

一种用于搜索结果排序的方法与设备
技术领域
本发明涉及计算机领域,尤其涉及一种用于搜索结果排序的技术。
背景技术
当前,对于搜索结果的排序大多采用内容匹配的方法,即将用户的查询请求与搜索结果通过例如关键字匹配等方式,来判断用户的查询请求与搜索结果的匹配度信息,从而获取用户的查询请求与搜索结果的内容匹配得分,并按照得分的高低进行排序。这种方式在一定程度上满足了用户对于搜索结果匹配的需求,但同时也存在着一定的问题,即忽略了查询请求或搜索结果对于所述用户的查询请求与搜索结果的匹配度信息的影响,如查询请求的类型、搜索结果的特征等,都会在一定程度上对搜索结果的排序产生作用。因此对查询请求或搜索结果等信息的忽略可能导致排序结果与用户期望的结果差距较大,进而降低了用户获取信息的效率以及用户使用体验等。
发明内容
本发明的目的是提供一种用于搜索结果排序的方法与设备。
根据本发明的一个方面,提供了一种用于搜索结果排序的方法,该方法包括以下步骤:
a获取与用户输入的查询序列相对应的搜索结果;
b根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型;
c根据所述结果排序模型,确定所述搜索结果的优先级;
d根据所述优先级,将所述搜索结果提供给所述用户。
根据本发明的另一方面,还提供了一种用于搜索结果排序的排序设备,该设备包括:
结果获取装置,用于获取与用户输入的查询序列相对应的搜索结果;
模型确定装置,用于根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型;
优先级确定装置,用于根据所述结果排序模型,确定所述搜索结果的优先级;
结果提供装置,用于根据所述优先级,将所述搜索结果提供给所述用户。
根据本发明的再一方面,还提供了一种搜索引擎,包括如上述的用于搜索结果排序的排序设备。
根据本发明的再一方面,还提供了一种搜索引擎插件,包括如上述的用于搜索结果排序的排序设备。
根据本发明的再一方面,还提供了一种浏览器,包括如上述的用于搜索结果排序的排序设备。
根据本发明的再一方面,还提供了一种浏览器插件,包括如上述的用于搜索结果排序的排序设备。
与现有技术相比,本发明通过根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型,进而确定搜索结果的优先级,从而解决了单一利用查询请求与搜索结果的匹配度信息来进行排序的方式,会可能导致排序结果与用户期待的结果相背离的问题,提高了搜索结果优先级的准确率与用户获取信息的效率,从而提升了用户的搜索使用体验。进一步地,本发明还利用搜索结果与查询序列的匹配度信息来调整该搜索结果的特征信息在该查询序列对应的结果排序模型中的权重信息,再利用调整后的结果排序模型确定该等搜索结果的优先级,进一步地,提高了搜索结果优先级的准确率与用户获取信息的效率,从而提升了用户的搜索使用体验。此外,本发明还可以利用已标注排序信息的多个训练结果进行机器学习,获取与各类型查询序列相对应的结果排序模型,有效地支持搜索结果优先级的确定,从另一个方面保证了用户获取消息的效率与用户的搜索使用体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的一种用于搜索结果排序的排序设备示意图;
图2示出根据本发明一个优选实施例的一种用于搜索结果排序的排序设备示意图;
图3示出根据本发明另一个方面的一种由排序设备实现的用于搜索结果排序的方法流程图;
图4示出根据本发明一个优选实施例的一种由排序设备实现的用于搜索结果排序的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的一种用于搜索结果排序的排序设备示意图;其中,该排序设备包括结果获取装置11、模型确定装置12、优先级确定装置13、结果提供装置14。结果获取装置11获取与用户输入的查询序列相对应的搜索结果;模型确定装置12根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型;优先级确定装置13根据所述结果排序模型,确定所述搜索结果的优先级;结果提供装置14根据所述优先级,将所述搜索结果提供给所述用户。其中,排序设备,其包括但不限于网络设备、用户设备、或网络设备与用户设备通过网络相集成所构成的设备。其中,所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(CloudComputing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述用户设备其包括但不限于任何一种可与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解,其他的排序设备同样适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
其中,结果获取装置11获取与用户输入的查询序列相对应的搜索结果。具体地,结果获取装置11例如通过页面技术,如JSP、ASP、PHP等页面技术,或者,通过调用用户设备或其他能够提供所述查询序列的设备所提供的应用程序接口(API)或其他约定的通信方式,与用户进行交互,获取用户输入的查询序列,并通过例如对用户输入的查询序列进行分词,并在查询数据库中针对所述分词进行搜索的方式,获得与用户输入的查询序列相对应的搜索结果,其中,用户可通过诸如键盘、触摸屏、语音输入装置与结果获取装置11进行交互,输入其希望查询的查询序列,从而发起搜索;或者,结果获取装置11通过基于各种通信协议(Communications Protocol),在此“通信协议”指计算机通信的传送协议,如:TCP/IP、UDP、FTP、ICMP、NetBEUI等,同时还包括存在于计算机中的其他形式通信,例如:面向对象编程里面对象之间的通信;操作系统内不同程序或计算机不同模块之间的消息传送协议,与其他能够提供所述搜索结果的设备进行交互,获取与用户输入的查询序列相对应的搜索结果。
模型确定装置12根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型。具体地,模型确定装置12获取所述用户输入的查询序列的类型信息,其中,所述获取查询序列的类型信息的方式包括但不限于通过诸如关键字查询或与预定的查询序列长度阈值相比较,例如包括“视频”的查询序列可归为资源类、包括“地址”的查询序列可归为寻址类;或通过将所述查询序列利用根据如用户历史记录或/和用户所输入的查询序列之间的关系等来进行识别的需求类识别模块进行分析,其中,所述根据用户历史记录来进行识别的方式指通过对例如所述用户历史记录中的查询序列和/或查询序列所对应的结果类型进行分析,获取历史记录中的类型信息,从而判断用户新的查询序列的类型信息,所述根据用户输入的查询序列之间的关系来进行识别的方式,指例如用户输入的查询序列为“鲜花”,若用户的下一个查询序列为“生日”,则可以认为用户所输入的“鲜花”意指用来进行生日礼品馈赠的实际鲜花,因此可以为所述用户推荐花店信息,若用户的下一个查询序列为“设计”,则可以认为用户所输入的“鲜花”意指用来设计的鲜花元素,因此可以为所述用户推荐设计中的鲜花信息,如带有鲜花的设计图或素材等。其中,所述类型信息包括但不限于按照查询序列的长度分为短序列、长序列、特长序列,或者按照查询序列的需求分为资源类、寻址类等。模型确定装置12获取到所述用户输入的查询序列的类型信息后,按照所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型,其中,所述结果排序模型中包含与查询序列的类型信息相关的参量,所述结果排序模型包括但不限于利用排序特征向量进行排序的方式。所述确定与所述查询序列相对应的结果排序模型的方法包括但不限于,确定与所述查询序列的类型信息相对应的结果排序模型,即所述结果排序模型中仅含有与所述查询序列的类型信息相对应的所述类型信息相关的参量;或者将所述查询序列的类型信息在预先设置的包含全部所述查询序列的类型信息的总体线性结果排序模型中进行匹配或排除,例如,激活总体线性结果排序模型中与所述查询序列的类型信息所对应的参量或是排除总体线性结果排序模型中与所述查询序列的类型信息不对应的参量。若无法确定所述查询序列的类型信息,则将所述查询序列划分为默认的缺省类型,从而确定与所述查询序列相对应的结果排序模型。例如,确定总体线性结果排序模型如下所示:
f ( q , url ) = Σ i = 0 k w i z i + Σ j = 0 m Σ i = 0 k δ ( j ) w i j z i + Σ j ′ = 0 m Σ i = 0 k σ ( j ) w i j ′ z i (公式1)
其中,利用q表示查询序列,url代表搜索结果,f(q,url)表示该利用结果排序模型函数后,该函数的值。zi(i∈[0,k])表示除所述查询序列的类型信息之外的其他特征的特征值,wi表示对应各项特征分量的权重,所述查询序列的类型信息分为m类,利用δ(j)与σ(j)分别表示查询序列属于/不属于某一类别,
Figure BDA00002022611200061
对应当查询序列属于某一类别时,该项的参数,
Figure BDA00002022611200062
对应当查询序列不属于某一类别时,该项的参数。当某一查询序列属于某一类型信息时,δ(j)取值为1,当某一查询序列不属于某一类型信息时,σ(j)取值为1,从而确定f(q,url)的值;从而公式1可对应单个查询序列对应一个或多个类型信息时的排序模型。若无法判断所述查询序列的类型,则利所述查询序列划分为默认的缺省类型,利用公式1的缺省模式,如公式2所示,来确定f(q,url)的值。
f ( q , url ) = Σ i = 0 k w i z i (公式2)
本领域技术人员应理解上述查询序列的类型信息及结果排序模型仅为举例,其他现有的或今后可能出现的查询序列的类型信息或结果排序模型如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优先级确定装置13根据所述结果排序模型,确定所述搜索结果的优先级。具体地,优先级确定装置13根据模型确定装置12所确定的所述结果排序模型,将所述用户输入的查询序列的相关参数,如查询序列的类型等、所述搜索结果的相关参数,如搜索结果的特征信息等、以及所述用户输入的查询序列与所述搜索结果的相关关联参数,如所述查询序列与所述搜索结果的匹配度信息等,与所述结果排序模型进行结合,通过计算等方式,确定所述搜索结果的优先级。
结果提供装置14根据所述优先级,将所述搜索结果提供给所述用户。具体地,结果提供装置14获取优先级确定装置13所确定的带有不同优先级信息的搜索结果,按照用户的需求,如需求提供优先级排序前10的搜索结果等,利用与用户进行交互,或者按照用户设备所提供的应用程序接口(API)或http、https等其他约定的通信方式的格式要求,将所述带有不同优先级信息的搜索结果提供给所述用户。
在一个优选的实施例(参照图1)中,在此,所述结果排序模型包括一个或多个排序特征向量,如在公式1或公式2中,zi(i∈[0,k])表示除所述查询序列的类型信息之外的其他特征的特征值,则可以利用zi(i∈[0,k])表征所述一个或多个排序特征向量的特征值,其中,所述排序特征向量包括以下至少任一项:
-所述搜索结果与所述查询序列的相关性信息及其权重信息;
-所述搜索结果的特征信息及其权重信息。
其中,所述搜索结果与所述查询序列的相关性信息包括以下至少任一项:
-所述搜索结果与所述查询序列的匹配度信息,其中所述匹配度信息包括但不限于文本匹配度信息或语义匹配度信息,如利用所述查询序列中的关键字与所述搜索结果中的关键字进行匹配,若所述搜索结果与所述查询序列的匹配度高的,则其相关性信息更匹配等;
-所述搜索结果在所述查询序列下的点击率信息,如某条所述搜索结果在所述查询序列下的点击率较高,则认为该条搜索结果在所述查询序列下更符合大多数用户的需求,则所述搜索结果与所述查询序列的相关性信息更匹配。
其中,所述搜索结果的特征信息包括以下至少任一项:
-所述搜索结果的权威度信息,如根据所述搜索结果的信息源,如根据页面来自官方网站、非官方网站、资源类网站、个人博客等信息判断所述搜索结果的权威度信息;
-所述搜索结果的质量度信息,如根据所述搜索结果的呈现速度、网页质量、连接成功率等信息判断所述搜索结果的质量度信息;
-所述搜索结果的丰富度信息,如根据页面多媒体的数量、页面外链的数量等信息判断所述搜索结果的丰富度信息;
-所述搜索结果的热门度信息,如根据所述搜索结果的点击量多少等信息判断所述搜索结果的热门度信息。
优选地,当所述排序特征向量包括所述搜索结果的特征信息及其权重信息时,优先级确定装置13根据所述排序特征向量,确定所述搜索结果的特征信息的赋值;根据所述特征信息的赋值以及所述特征信息的权重信息,并结合所述搜索结果与所述查询序列的匹配度信息,确定所述搜索结果的优先级。具体地,当所述排序特征向量包括所述搜索结果的特征信息及其权重信息时,优先级确定装置13根据所述排序特征向量,确定所述搜索结果的特征信息的赋值,以获得调整后的所述结果排序模型;例如当结果排序模型形如公式2所示:
f ( q , url ) = Σ i = 0 k w i z i (公式2)
其中,利用zi(i∈[0,k])表征所述一个或多个排序特征向量的特征值,并利用如下公式表示当所述排序特征向量包括所述搜索结果的特征信息时,f(q,url)的表达式:
f ( q , url ) = Σ i = 0 k w i z i = Σ i = 0 c w i x i + Σ j = c + 1 k w j x j x c (公式3)
其中,[0,c]维特征是所述搜索结果与所述查询序列的匹配度信息,[c+1,k]维代表的是搜索结果的特征信息,wi表示对应的权重。
Figure BDA00002022611200083
代表c维的所述搜索结果与所述查询序列的匹配度信息对f(q,url)的影响,
Figure BDA00002022611200084
代表基于所述搜索结果与所述查询序列的匹配度信息,利用乘法操作,非线性的调整所述搜索结果的特征信息在所述结果排序模型的权重信息,在此,优先级确定装置13首先确定了所述搜索结果的特征信息的赋值xj,并根据所述特征信息的赋值xj以及所述特征信息的权重信息wj,结合所述搜索结果与所述查询序列的匹配度信息
Figure BDA00002022611200085
两者通过线性相加,获得f(q,url)的值,从而确定所述搜索结果的优先级。本领域技术人员应理解上述结果排序模型仅为举例,其他现有的或今后可能出现的结果排序模型如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图2示出根据本发明一个优选实施例的一种用于搜索结果排序的排序设备示意图;其中,该排序设备包括结果获取装置11’、模型确定装置12’、优先级确定装置13’、结果提供装置14’、模型学习装置15’。具体地,结果获取装置11’获取与用户输入的查询序列相对应的搜索结果;模型学习装置15’根据已标注排序信息的多个训练结果,并结合所述训练结果所对应的查询序列的类型信息,进行机器学习,以获得所述结果排序模型;模型确定装置12’根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型;优先级确定装置13’根据所述结果排序模型,确定所述搜索结果的优先级;结果提供装置14’根据所述优先级,将所述搜索结果提供给所述用户。其中,排序设备中的结果获取装置11’、模型确定装置12’、优先级确定装置13’、结果提供装置14’分别与图1所示对应装置相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别实时地,或者按照设定的或实时调整的工作模式要求,进行搜索结果的获取、结果排序模型的学习、结果排序模型的确定、搜索结果优先级的确定以及搜索结果的提供等,直至排序设备停止获取与用户输入的查询序列相对应的搜索结果。
模型学习装置15’根据已标注排序信息的多个训练结果,并结合所述训练结果所对应的查询序列的类型信息,进行机器学习,以获得所述结果排序模型。具体地,所述已标注排序信息的训练结果中包括作为训练用例的多个查询序列、搜索结果、查询序列与搜索结果之间的相关性信息,以及将不同查询序列与搜索结果之间按照一定的需求经过排序后的排序信息;模型学习装置15’根据已标注排序的多个训练结果,并结合所述训练结果所对应的查询序列的类型信息,通过诸如利用线性模型(如线性SVM模型)等不断调整已对应的查询序列的类型信息的结果排序模型中的参数或参量等信息的方式,或是在总体线性结果排序模型中不断添加新的查询序列的类型信息,并利用线性SVM模型对所述总体线性结果排序模型中的参数或参量进行调整等方式,进行机器学习,以获得所述结果排序模型。在此,所述机器学习方法例如,在所述训练结果中,每一个查询序列与其所对应的搜索结果都存在一个人工给定的满足度评分值,利用如线性SVM模型等所述机器学习方式对每一个查询序列与其所对应的搜索结果进行评分,不断调整排序模型中的参数或参量的值,使利用机器学习方式获得的满足度评分值无限接近人工给定的满足度评分值;或者,利用如数值优化算法(如随机梯度下降算法)不断调整排序模型中的参数或参量的值,使在已标注排序的具有不同满足度评分的训练结果在排序模型中保持同样的满足度评分的比例关系。其中,该结果排序模型中包含与查询序列的类型信息相关的信息。在此,根据本发明,利用线性模型作为结果排序模型,或者利用线性模型进行机器学习能够充分利用线性模型简单、易解释、效率高等特点,并克服了一般线性模型在鲁棒性上的缺陷。在此,所述结果排序模型包括一个或多个排序特征向量,如在公式1或公式2中,zi(i∈[0,k])表示除所述查询序列的类型信息之外的其他特征的特征值,则可以利用zi(i∈[0,k])表征所述一个或多个排序特征向量的特征值,其中,所述排序特征向量包括以下至少任一项:
-所述搜索结果与所述查询序列的相关性信息及其权重信息;
-所述搜索结果的特征信息及其权重信息。
其中,所述搜索结果与所述查询序列的相关性信息包括以下至少任一项:
-所述搜索结果与所述查询序列的匹配度信息,其中所述匹配度信息包括但不限于文本匹配度信息或语义匹配度信息,如利用所述查询序列中的关键字与所述搜索结果中的关键字进行匹配,若所述搜索结果与所述查询序列的匹配度高的,则其相关性信息更匹配等;
-所述搜索结果在所述查询序列下的点击率信息,如某条所述搜索结果在所述查询序列下的点击率较高,则认为该条搜索结果在所述查询序列下更符合大多数用户的需求,则所述搜索结果与所述查询序列的相关性信息更匹配。
其中,所述搜索结果的特征信息包括以下至少任一项:
-所述搜索结果的权威度信息,如根据所述搜索结果的信息源,如根据页面来自官方网站、非官方网站、资源类网站、个人博客等信息判断所述搜索结果的权威度信息;
-所述搜索结果的质量度信息,如根据所述搜索结果的呈现速度、网页质量、连接成功率等信息判断所述搜索结果的质量度信息;
-所述搜索结果的丰富度信息,如根据页面多媒体的数量、页面外链的数量等信息判断所述搜索结果的丰富度信息;
-所述搜索结果的热门度信息,如根据所述搜索结果的点击量多少等信息判断所述搜索结果的热门度信息。
优选地,模型学习装置15’还可以根据已标注排序信息的多个训练结果,进行机器学习,以获得候选结果排序模型;根据所述候选结果排序模型,并结合所述训练结果所对应的查询序列的类型信息,确定所述结果排序模型。具体地,首先,所述已标注排序信息的训练结果中包括作为训练用例的多个查询序列、搜索结果、查询序列与搜索结果之间的相关性信息,以及将不同查询序列与搜索结果之间按照一定的需求经过排序后的排序信息,模型学习装置15’根据已标注排序信息的多个训练结果,通过诸如利用线性模型(如线性SVM模型)等不断调整结果排序模型中的参数或参量等信息,进行机器学习,以获得候选结果排序模型,其中,所述候选结果排序模型与所述训练结果所对应的查询序列的类型信息无关;接着,模型学习装置15’根据所述候选结果排序模型,并结合所述训练结果所对应的查询序列的类型信息,确定所述结果排序模型,其中,该结果排序模型中包含与查询序列的类型信息相关的信息。
优选地,模型学习装置15’还可以对于已标注排序信息的多个训练结果,基于所述训练结果所对应的查询序列的类型信息,进行分组处理,以获得一个或多个训练结果子集,其中,每个训练结果子集包括一个或多个所述训练结果,且所述一个或多个训练结果所对应的查询序列具有相同的类型信息;根据所述训练结果子集,进行机器学习,以获得所述结果排序模型。具体地,所述已标注排序信息的训练结果中包括作为训练用例的多个查询序列、搜索结果、查询序列与搜索结果之间的相关性信息,以及将不同查询序列与搜索结果之间按照一定的需求经过排序后的排序信息;模型学习装置15’可以对于已标注排序信息的多个训练结果,基于所述训练结果所对应的查询序列的类型信息,进行分组处理,以获得一个或多个训练结果子集,如将所述查询序列的类型信息为资源类的对应查询序列、搜索结果、查询序列与搜索结果之间的相关性信息,对应的排序信息等相关所述一个或多个训练结果进行分组处理,以获得类型信息为“资源类”的训练结果子集;模型学习装置15’根据所述训练结果子集,通过诸如利用线性模型(如线性SVM模型)等不断调整结果排序模型中的参数或参量等信息,进行机器学习,以获得所述结果排序模型。
在另一优选实施例中,可将上述用于搜索结果排序的排序设备,与现有的搜索引擎相结合,构成一种新的搜索引擎,现有的搜索引擎可以是例如Google公司的Google搜索引擎、百度公司的baidu搜索引擎等。
在另一优选实施例中,可将上述用于搜索结果排序的排序设备,与现有的搜索引擎插件相结合,构成一种新的搜索引擎插件,现有的搜索引擎插件可以是例如Google公司的Google ToolBar、百度公司的百度搜霸、微软公司的MSN ToolBar等。
在另一优选实施例中,可将上述用于搜索结果排序的排序设备,与现有的浏览器相结合,构成一种新的浏览器,现有的浏览器可以是是例如Microsoft公司的IE浏览器、Netscape公司的Netscape浏览器、Mozilla公司的Firefox浏览器、Google公司的Chrome浏览器、遨游公司的Maxthon浏览器、0pera公司的opera浏览器、360公司的360浏览器、搜狐公司的搜狗浏览器、腾讯公司的腾讯TT浏览器等。
在另一优选实施例中,可将上述用于搜索结果排序的排序设备,与现有的浏览器插件相结合,构成一种新的浏览器插件,现有的浏览器插件可以是例如Flash插件、RealPlayer插件、MMS插件、MIDI五线谱插件、ActiveX插件等。
图3示出根据本发明另一个方面的一种由排序设备实现的用于搜索结果排序的方法流程图;具体地,排序设备在步骤s1中,获取与用户输入的查询序列相对应的搜索结果;在步骤s2中,根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型;在步骤s3中,根据所述结果排序模型,确定所述搜索结果的优先级;在步骤s4中,根据所述优先级,将所述搜索结果提供给所述用户。其中,排序设备,其包括但不限于网络设备、用户设备、或网络设备与用户设备通过网络相集成所构成的设备。其中,所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述用户设备其包括但不限于任何一种可与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解,其他的排序设备同样适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
其中,在步骤s1中,排序设备获取与用户输入的查询序列相对应的搜索结果。具体地,在步骤s1中,排序设备例如通过页面技术,如JSP、ASP、PHP等页面技术,或者,通过调用用户设备或其他能够提供所述查询序列的设备所提供的应用程序接口(API)或其他约定的通信方式,与用户进行交互,获取用户输入的查询序列,并通过例如对用户输入的查询序列进行分词,并在查询数据库中针对所述分词进行搜索的方式,获得与用户输入的查询序列相对应的搜索结果,其中,用户可通过诸如键盘、触摸屏、语音输入装置与排序设备进行交互,输入其希望查询的查询序列,从而发起搜索;或者,排序设备通过基于各种通信协议(Communications Protocol),在此“通信协议”指计算机通信的传送协议,如:TCP/IP、UDP、FTP、ICMP、NetBEUI等,同时还包括存在于计算机中的其他形式通信,例如:面向对象编程里面对象之间的通信;操作系统内不同程序或计算机不同模块之间的消息传送协议,与其他能够提供所述搜索结果的设备进行交互,获取与用户输入的查询序列相对应的搜索结果。
在步骤s2中,排序设备根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型。具体地,在步骤s2中,排序设备获取所述用户输入的查询序列的类型信息,其中,所述获取查询序列的类型信息的方式包括但不限于通过诸如关键字查询或与预定的查询序列长度阈值相比较,例如包括“视频”的查询序列可归为资源类、包括“地址”的查询序列可归为寻址类;或通过将所述查询序列利用根据如用户历史记录或/和用户所输入的查询序列之间的关系等来进行识别的需求类识别模块进行分析,其中,所述根据用户历史记录来进行识别的方式指通过对例如所述用户历史记录中的查询序列和/或查询序列所对应的结果类型进行分析,获取历史记录中的类型信息,从而判断用户新的查询序列的类型信息,所述根据用户输入的查询序列之间的关系来进行识别的方式,指例如用户输入的查询序列为“鲜花”,若用户的下一个查询序列为“生日”,则可以认为用户所输入的“鲜花”意指用来进行生日礼品馈赠的实际鲜花,因此可以为所述用户推荐花店信息,若用户的下一个查询序列为“设计”,则可以认为用户所输入的“鲜花”意指用来设计的鲜花元素,因此可以为所述用户推荐设计中的鲜花信息,如带有鲜花的设计图或素材等。其中,所述类型信息包括但不限于按照查询序列的长度分为短序列、长序列、特长序列,或者按照查询序列的需求分为资源类、寻址类等。在步骤s2中,排序设备获取到所述用户输入的查询序列的类型信息后,按照所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型,其中,所述结果排序模型中包含与查询序列的类型信息相关的参量,所述结果排序模型包括但不限于利用排序特征向量进行排序的方式。所述确定与所述查询序列相对应的结果排序模型的方法包括但不限于,确定与所述查询序列的类型信息相对应的结果排序模型,即所述结果排序模型中仅含有与所述查询序列的类型信息相对应的所述类型信息相关的参量;或者将所述查询序列的类型信息在预先设置的包含全部所述查询序列的类型信息的总体线性结果排序模型中进行匹配或排除,例如,激活总体线性结果排序模型中与所述查询序列的类型信息所对应的参量或是排除总体线性结果排序模型中与所述查询序列的类型信息不对应的参量。若无法确定所述查询序列的类型信息,则将所述查询序列划分为默认的缺省类型,从而确定与所述查询序列相对应的结果排序模型。例如,确定总体线性结果排序模型如下所示:
f ( q , url ) = Σ i = 0 k w i z i + Σ j = 0 m Σ i = 0 k δ ( j ) w i j z i + Σ j ′ = 0 m Σ i = 0 k σ ( j ) w i j ′ z i (公式4)
其中,利用q表示查询序列,url代表搜索结果,f(q,url)表示该利用结果排序模型函数后,该函数的值。zi(i∈[0,k])表示除所述查询序列的类型信息之外的其他特征的特征值,wi表示对应各项特征分量的权重,所述查询序列的类型信息分为m类,利用δ(j)与σ(j)分别表示查询序列属于/不属于某一类别,
Figure BDA00002022611200152
对应当查询序列属于某一类别时,该项的参数,
Figure BDA00002022611200153
对应当查询序列不属于某一类别时,该项的参数。当某一查询序列属于某一类型信息时,δ(j)取值为1,当某一查询序列不属于某一类型信息时,σ(j)取值为1,从而确定f(q,url)的值;从而公式4可对应单个查询序列对应一个或多个类型信息时的排序模型。若无法判断所述查询序列的类型,则利所述查询序列划分为默认的缺省类型,利用公式4的缺省模式,如公式5所示,来确定f(q,url)的值。
f ( q , url ) = Σ i = 0 k w i z i (公式5)
本领域技术人员应理解上述查询序列的类型信息及结果排序模型仅为举例,其他现有的或今后可能出现的查询序列的类型信息或结果排序模型如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤s3中,排序设备根据所述结果排序模型,确定所述搜索结果的优先级。具体地,在步骤s3中,排序设备根据步骤s2中所确定的所述结果排序模型,将所述用户输入的查询序列的相关参数,如查询序列的类型等、所述搜索结果的相关参数,如搜索结果的特征信息等、以及所述用户输入的查询序列与所述搜索结果的相关关联参数,如所述查询序列与所述搜索结果的匹配度信息等,与所述结果排序模型进行结合,通过计算等方式,确定所述搜索结果的优先级。
在步骤s4中,排序设备根据所述优先级,将所述搜索结果提供给所述用户。具体地,在步骤s4中,排序设备获取步骤s3中所确定的带有不同优先级信息的搜索结果,按照用户的需求,如需求提供优先级排序前10的搜索结果等,利用与用户进行交互,或者按照用户设备所提供的应用程序接口(API)或http、https等其他约定的通信方式的格式要求,将所述带有不同优先级信息的搜索结果提供给所述用户。
在一个优选的实施例(参照图3)中,在此,所述结果排序模型包括一个或多个排序特征向量,如在公式4或公式5中,zi(i∈[0,k])表示除所述查询序列的类型信息之外的其他特征的特征值,则可以利用zi(i∈[0,k])表征所述一个或多个排序特征向量的特征值,其中,所述排序特征向量包括以下至少任一项:
-所述搜索结果与所述查询序列的相关性信息及其权重信息;
-所述搜索结果的特征信息及其权重信息。
其中,所述搜索结果与所述查询序列的相关性信息包括以下至少任一项:
-所述搜索结果与所述查询序列的匹配度信息,其中所述匹配度信息包括但不限于文本匹配度信息或语义匹配度信息,如利用所述查询序列中的关键字与所述搜索结果中的关键字进行匹配,若所述搜索结果与所述查询序列的匹配度高的,则其相关性信息更匹配等;
-所述搜索结果在所述查询序列下的点击率信息,如某条所述搜索结果在所述查询序列下的点击率较高,则认为该条搜索结果在所述查询序列下更符合大多数用户的需求,则所述搜索结果与所述查询序列的相关性信息更匹配。
其中,所述搜索结果的特征信息包括以下至少任一项:
-所述搜索结果的权威度信息,如根据所述搜索结果的信息源,如根据页面来自官方网站、非官方网站、资源类网站、个人博客等信息判断所述搜索结果的权威度信息;
-所述搜索结果的质量度信息,如根据所述搜索结果的呈现速度、网页质量、连接成功率等信息判断所述搜索结果的质量度信息;
-所述搜索结果的丰富度信息,如根据页面多媒体的数量、页面外链的数量等信息判断所述搜索结果的丰富度信息;
-所述搜索结果的热门度信息,如根据所述搜索结果的点击量多少等信息判断所述搜索结果的热门度信息。
优选地,当所述排序特征向量包括所述搜索结果的特征信息及其权重信息时,在步骤s3中,排序设备根据所述排序特征向量,确定所述搜索结果的特征信息的赋值;根据所述特征信息的赋值以及所述特征信息的权重信息,并结合所述搜索结果与所述查询序列的匹配度信息,确定所述搜索结果的优先级。具体地,当所述排序特征向量包括所述搜索结果的特征信息及其权重信息时,在步骤s3中,排序设备根据所述排序特征向量,确定所述搜索结果的特征信息的赋值,以获得调整后的所述结果排序模型;例如当结果排序模型形如公式5所示:
f ( q , url ) = Σ i = 0 k w i z i (公式5)
其中,利用zi(i∈[0,k])表征所述一个或多个排序特征向量的特征值,并利用如下公式表示当所述排序特征向量包括所述搜索结果的特征信息时,f(q,url)的表达式:
f ( q , url ) = Σ i = 0 k w i z i = Σ i = 0 c w i x i + Σ j = c + 1 k w j x j x c (公式6)
其中,[0,c]维特征是所述搜索结果与所述查询序列的匹配度信息,[c+1,k]维代表的是搜索结果的特征信息,wi表示对应的权重。
Figure BDA00002022611200181
代表c维的所述搜索结果与所述查询序列的匹配度信息对f(q,url)的影响,
Figure BDA00002022611200182
代表基于所述搜索结果与所述查询序列的匹配度信息,利用乘法操作,非线性的调整所述搜索结果的特征信息在所述结果排序模型的权重信息,最终,两者通过线性相加,获得f(q,url)的值。随后,在步骤s3中,排序设备根据所调整后的结果排序模型,确定所述搜索结果的优先级。在此,优先级确定装置13首先确定了所述搜索结果的特征信息的赋值xj,并根据所述特征信息的赋值xj以及所述特征信息的权重信息wj,结合所述搜索结果与所述查询序列的匹配度信息两者通过线性相加,获得f(q,url)的值,从而确定所述搜索结果的优先级。本领域技术人员应理解上述结果排序模型仅为举例,其他现有的或今后可能出现的结果排序模型如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图4示出根据本发明一个优选实施例的一种由排序设备实现的用于搜索结果排序的方法流程图。具体地,排序设备在步骤s1’中,获取与用户输入的查询序列相对应的搜索结果;在步骤s5’中,根据已标注排序信息的多个训练结果,并结合所述训练结果所对应的查询序列的类型信息,进行机器学习,以获得所述结果排序模型;在步骤s2’中,根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型;在步骤s3’中,根据所述结果排序模型,确定所述搜索结果的优先级;在步骤s4’中,根据所述优先级,将所述搜索结果提供给所述用户。其中,排序设备中的步骤s1’、步骤s2’、步骤s3’和步骤s4’分别与图3所示对应步骤相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别实时地,或者按照设定的或实时调整的工作模式要求,进行搜索结果的获取、结果排序模型的学习、结果排序模型的确定、搜索结果优先级的确定以及搜索结果的提供等,直至排序设备停止获取与用户输入的查询序列相对应的搜索结果。
在步骤s5’中,排序设备根据已标注排序信息的多个训练结果,并结合所述训练结果所对应的查询序列的类型信息,进行机器学习,以获得所述结果排序模型。具体地,所述已标注排序信息的训练结果中包括作为训练用例的多个查询序列、搜索结果、查询序列与搜索结果之间的相关性信息,以及将不同查询序列与搜索结果之间按照一定的需求经过排序后的排序信息;排序设备根据已标注排序的多个训练结果,并结合所述训练结果所对应的查询序列的类型信息,通过诸如利用线性模型(如线性SVM模型)等不断调整已对应的查询序列的类型信息的结果排序模型中的参数或参量等信息的方式,或是在总体线性结果排序模型中不断添加新的查询序列的类型信息,并利用线性SVM模型对所述总体线性结果排序模型中的参数或参量进行调整等方式,进行机器学习,以获得所述结果排序模型。在此,所述机器学习方法例如,在所述训练结果中,每一个查询序列与其所对应的搜索结果都存在一个人工给定的满足度评分值,利用如线性SVM模型等所述机器学习方式对每一个查询序列与其所对应的搜索结果进行评分,不断调整排序模型中的参数或参量的值,使利用机器学习方式获得的满足度评分值无限接近人工给定的满足度评分值;或者,利用如数值优化算法(如随机梯度下降算法)不断调整排序模型中的参数或参量的值,使在已标注排序的具有不同满足度评分的训练结果在排序模型中保持同样的满足度评分的比例关系。其中,该结果排序模型中包含与查询序列的类型信息相关的信息。在此,根据本发明,利用线性模型作为结果排序模型,或者利用线性模型进行机器学习能够充分利用线性模型简单、易解释、效率高等特点,并克服了一般线性模型在鲁棒性上的缺陷。在此,所述结果排序模型包括一个或多个排序特征向量,如在公式1或公式2中,zi(i∈[0,k])表示除所述查询序列的类型信息之外的其他特征的特征值,则可以利用zi(i∈[0,k])表征所述一个或多个排序特征向量的特征值,其中,所述排序特征向量包括以下至少任一项:
-所述搜索结果与所述查询序列的相关性信息及其权重信息;
-所述搜索结果的特征信息及其权重信息。
其中,所述搜索结果与所述查询序列的相关性信息包括以下至少任一项:
-所述搜索结果与所述查询序列的匹配度信息,其中所述匹配度信息包括但不限于文本匹配度信息或语义匹配度信息,如利用所述查询序列中的关键字与所述搜索结果中的关键字进行匹配,若所述搜索结果与所述查询序列的匹配度高的,则其相关性信息更匹配等;
-所述搜索结果在所述查询序列下的点击率信息,如某条所述搜索结果在所述查询序列下的点击率较高,则认为该条搜索结果在所述查询序列下更符合大多数用户的需求,则所述搜索结果与所述查询序列的相关性信息更匹配。
其中,所述搜索结果的特征信息包括以下至少任一项:
-所述搜索结果的权威度信息,如根据所述搜索结果的信息源,如根据页面来自官方网站、非官方网站、资源类网站、个人博客等信息判断所述搜索结果的权威度信息;
-所述搜索结果的质量度信息,如根据所述搜索结果的呈现速度、网页质量、连接成功率等信息判断所述搜索结果的质量度信息;
-所述搜索结果的丰富度信息,如根据页面多媒体的数量、页面外链的数量等信息判断所述搜索结果的丰富度信息;
-所述搜索结果的热门度信息,如根据所述搜索结果的点击量多少等信息判断所述搜索结果的热门度信息。
优选地,在步骤s5’中,排序设备还可以根据已标注排序信息的多个训练结果,进行机器学习,以获得候选结果排序模型;根据所述候选结果排序模型,并结合所述训练结果所对应的查询序列的类型信息,确定所述结果排序模型。具体地,首先,所述已标注排序信息的训练结果中包括作为训练用例的多个查询序列、搜索结果、查询序列与搜索结果之间的相关性信息,以及将不同查询序列与搜索结果之间按照一定的需求经过排序后的排序信息,排序设备根据已标注排序信息的多个训练结果,通过诸如利用线性模型(如线性SVM模型)等不断调整结果排序模型中的参数或参量等信息,进行机器学习,以获得候选结果排序模型,其中,所述候选结果排序模型与所述训练结果所对应的查询序列的类型信息无关;接着,排序设备根据所述候选结果排序模型,并结合所述训练结果所对应的查询序列的类型信息,确定所述结果排序模型,其中,该结果排序模型中包含与查询序列的类型信息相关的信息。
优选地,在步骤s5’中,排序设备还可以对于已标注排序信息的多个训练结果,基于所述训练结果所对应的查询序列的类型信息,进行分组处理,以获得一个或多个训练结果子集,其中,每个训练结果子集包括一个或多个所述训练结果,且所述一个或多个训练结果所对应的查询序列具有相同的类型信息;根据所述训练结果子集,进行机器学习,以获得所述结果排序模型。具体地,所述已标注排序信息的训练结果中包括作为训练用例的多个查询序列、搜索结果、查询序列与搜索结果之间的相关性信息,以及将不同查询序列与搜索结果之间按照一定的需求经过排序后的排序信息;排序设备可以对于已标注排序信息的多个训练结果,基于所述训练结果所对应的查询序列的类型信息,进行分组处理,以获得一个或多个训练结果子集,如将所述查询序列的类型信息为资源类的对应查询序列、搜索结果、查询序列与搜索结果之间的相关性信息,对应的排序信息等相关所述一个或多个训练结果进行分组处理,以获得类型信息为“资源类”的训练结果子集;排序设备根据所述训练结果子集,通过诸如利用线性模型(如线性SVM模型)等不断调整结果排序模型中的参数或参量等信息,进行机器学习,以获得所述结果排序模型。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (20)

1.一种用于搜索结果排序的方法,其中,该方法包括以下步骤:
a获取与用户输入的查询序列相对应的搜索结果;
b根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型;
c根据所述结果排序模型,确定所述搜索结果的优先级;
d根据所述优先级,将所述搜索结果提供给所述用户。
2.根据权利要求1所述的方法,其中,该方法还包括:
x根据已标注排序信息的多个训练结果,并结合所述训练结果所对应的查询序列的类型信息,进行机器学习,以获得所述结果排序模型。
3.根据权利要求2所述的方法,其中,所述步骤x包括:
-根据已标注排序信息的多个训练结果,进行机器学习,以获得候选结果排序模型;
-根据所述候选结果排序模型,并结合所述训练结果所对应的查询序列的类型信息,确定所述结果排序模型。
4.根据权利要求2所述的方法,其中,所述步骤x包括:
-对于已标注排序信息的多个训练结果,基于所述训练结果所对应的查询序列的类型信息,进行分组处理,以获得一个或多个训练结果子集,其中,每个训练结果子集包括一个或多个所述训练结果,且所述一个或多个训练结果所对应的查询序列具有相同的类型信息;
-根据所述训练结果子集,进行机器学习,以获得所述结果排序模型。
5.根据权利要求1至4中任一项所述的方法,其中,所述结果排序模型包括一个或多个排序特征向量;
其中,所述排序特征向量包括以下至少任一项:
-所述搜索结果与所述查询序列的相关性信息及其权重信息;
-所述搜索结果的特征信息及其权重信息。
-所述搜索结果的特征信息及其权重信息。
6.根据权利要求5所述的方法,其中,所述排序特征向量包括所述搜索结果的特征信息及其权重信息;
其中,所述步骤c包括:
-根据所述排序特征向量,确定所述搜索结果的特征信息的赋值;
-根据所述特征信息的赋值以及所述特征信息的权重信息,并结合所述搜索结果与所述查询序列的匹配度信息,确定所述搜索结果的优先级。
7.根据权利要求5或6所述的方法,其中,所述搜索结果的特征信息包括以下至少任一项:
-所述搜索结果的权威度信息;
-所述搜索结果的质量度信息;
-所述搜索结果的丰富度信息;
-所述搜索结果的热门度信息。
8.根据权利要求5、6或7所述的方法,其中,所述搜索结果与所述查询序列的相关性信息包括以下至少任一项:
-所述搜索结果与所述查询序列的匹配度信息;
-所述搜索结果在所述查询序列下的点击率信息。
9.一种用于搜索结果排序的排序设备,其中,该设备包括:
结果获取装置,用于获取与用户输入的查询序列相对应的搜索结果;
模型确定装置,用于根据所述查询序列的类型信息,确定与所述查询序列相对应的结果排序模型;
优先级确定装置,用于根据所述结果排序模型,确定所述搜索结果的优先级;
结果提供装置,用于根据所述优先级,将所述搜索结果提供给所述用户。
10.根据权利要求9所述的排序设备,其中,该设备还包括:
模型学习装置,用于根据已标注排序信息的多个训练结果,并结合所述训练结果所对应的查询序列的类型信息,进行机器学习,以获得所述结果排序模型。
11.根据权利要求10所述的排序设备,其中,所述模型学习装置用于:
-根据已标注排序信息的多个训练结果,进行机器学习,以获得候选结果排序模型;
-根据所述候选结果排序模型,并结合所述训练结果所对应的查询序列的类型信息,确定所述结果排序模型。
12.根据权利要求10所述的排序设备,其中,所述模型学习装置用于:
-对于已标注排序信息的多个训练结果,基于所述训练结果所对应的查询序列的类型信息,进行分组处理,以获得一个或多个训练结果子集,其中,每个训练结果子集包括一个或多个所述训练结果,且所述一个或多个训练结果所对应的查询序列具有相同的类型信息;
-根据所述训练结果子集,进行机器学习,以获得所述结果排序模型。
13.根据权利要求9至12中任一项所述的排序设备,其中,所述结果排序模型包括一个或多个排序特征向量;
其中,所述排序特征向量包括以下至少任一项:
-所述搜索结果与所述查询序列的相关性信息及其权重信息;
-所述搜索结果的特征信息及其权重信息。
14.根据权利要求13所述的排序设备,其中,所述排序特征向量包括所述搜索结果的特征信息及其权重信息;
其中,所述优先级确定装置用于:
-根据所述排序特征向量,确定所述搜索结果的特征信息的赋值;
-根据所述特征信息的赋值以及所述特征信息的权重信息,并结合所述搜索结果与所述查询序列的匹配度信息,确定所述搜索结果的优先级。
15.根据权利要求13或14所述的排序设备,其中,所述搜索结果的特征信息包括以下至少任一项:
-所述搜索结果的权威度信息;
-所述搜索结果的质量度信息;
-所述搜索结果的丰富度信息;
-所述搜索结果的热门度信息。
16.根据权利要求13、14或15所述的排序设备,其中,所述搜索结果与所述查询序列的相关性信息包括以下至少任一项:
-所述搜索结果与所述查询序列的匹配度信息;
-所述搜索结果在所述查询序列下的点击率信息。
17.一种搜索引擎,包括如权利要求9至16中任一项所述的用于搜索结果排序的排序设备。
18.一种搜索引擎插件,包括如权利要求9至16中任一项所述的用于搜索结果排序的排序设备。
19.一种浏览器,包括如权利要求9至16中任一项所述的用于搜索结果排序的排序设备。
20.一种浏览器插件,包括如权利要求9至16中任一项所述的用于搜索结果排序的排序设备。
CN201210293220.9A 2012-08-16 2012-08-16 一种用于搜索结果排序的方法与设备 Active CN103593373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210293220.9A CN103593373B (zh) 2012-08-16 2012-08-16 一种用于搜索结果排序的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210293220.9A CN103593373B (zh) 2012-08-16 2012-08-16 一种用于搜索结果排序的方法与设备

Publications (2)

Publication Number Publication Date
CN103593373A true CN103593373A (zh) 2014-02-19
CN103593373B CN103593373B (zh) 2018-09-07

Family

ID=50083522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210293220.9A Active CN103593373B (zh) 2012-08-16 2012-08-16 一种用于搜索结果排序的方法与设备

Country Status (1)

Country Link
CN (1) CN103593373B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104111989A (zh) * 2014-07-02 2014-10-22 百度在线网络技术(北京)有限公司 搜索结果的提供方法和装置
CN104462259A (zh) * 2014-11-21 2015-03-25 百度在线网络技术(北京)有限公司 一种用于提供时效性图片搜索结果的方法与设备
CN104462510A (zh) * 2014-12-22 2015-03-25 北京奇虎科技有限公司 基于用户搜索意图的搜索方法及装置
CN104572960A (zh) * 2014-12-29 2015-04-29 北京奇虎科技有限公司 一种搜索的方法及装置
CN104598611A (zh) * 2015-01-29 2015-05-06 百度在线网络技术(北京)有限公司 对搜索条目进行排序的方法及系统
CN105069069A (zh) * 2015-07-30 2015-11-18 成都亿盟恒信科技有限公司 一种多个统计报表快捷关联方法
CN105574185A (zh) * 2015-12-22 2016-05-11 北京奇虎科技有限公司 一种提供聚合类型的智能摘要的方法和装置
CN105740255A (zh) * 2014-12-09 2016-07-06 深圳市腾讯计算机系统有限公司 网络搜索方法及装置
CN106446005A (zh) * 2015-08-07 2017-02-22 谷歌公司 因子分解模型
CN106446213A (zh) * 2016-09-30 2017-02-22 北京百度网讯科技有限公司 基于人工智能的服务排序方法和装置
CN107066493A (zh) * 2016-12-29 2017-08-18 广州联客信息科技有限公司 一种利用ip地址的搜索引擎的结果排序优化方法及系统
CN108038148A (zh) * 2017-11-29 2018-05-15 广东欧珀移动通信有限公司 搜索响应方法、装置、服务器及存储介质
CN108121814A (zh) * 2017-12-28 2018-06-05 北京百度网讯科技有限公司 搜索结果排序模型生成方法和装置
CN108255874A (zh) * 2016-12-29 2018-07-06 百度在线网络技术(北京)有限公司 一种用于提供开放api搜索结果的方法与设备
CN109543153A (zh) * 2018-11-13 2019-03-29 成都数联铭品科技有限公司 一种序列标注系统及方法
CN113344201A (zh) * 2021-06-22 2021-09-03 北京三快在线科技有限公司 一种模型训练的方法及装置
CN113343131A (zh) * 2021-06-30 2021-09-03 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930438B (zh) * 2009-06-19 2016-08-31 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN102402416B (zh) * 2010-09-10 2013-08-14 深圳市金蝶中间件有限公司 一种元素出队序列设置方法及装置
CN102495804A (zh) * 2011-12-27 2012-06-13 创新科存储技术(深圳)有限公司 软件自动化测试方法

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104111989B (zh) * 2014-07-02 2017-12-22 百度在线网络技术(北京)有限公司 搜索结果的提供方法和装置
CN104111989A (zh) * 2014-07-02 2014-10-22 百度在线网络技术(北京)有限公司 搜索结果的提供方法和装置
CN104462259A (zh) * 2014-11-21 2015-03-25 百度在线网络技术(北京)有限公司 一种用于提供时效性图片搜索结果的方法与设备
CN104462259B (zh) * 2014-11-21 2018-11-23 百度在线网络技术(北京)有限公司 一种用于提供时效性图片搜索结果的方法与设备
CN105740255B (zh) * 2014-12-09 2019-07-05 深圳市腾讯计算机系统有限公司 网络搜索方法及装置
CN105740255A (zh) * 2014-12-09 2016-07-06 深圳市腾讯计算机系统有限公司 网络搜索方法及装置
CN104462510A (zh) * 2014-12-22 2015-03-25 北京奇虎科技有限公司 基于用户搜索意图的搜索方法及装置
CN104462510B (zh) * 2014-12-22 2018-09-11 北京奇虎科技有限公司 基于用户搜索意图的搜索方法及装置
CN104572960A (zh) * 2014-12-29 2015-04-29 北京奇虎科技有限公司 一种搜索的方法及装置
WO2016107276A1 (zh) * 2014-12-29 2016-07-07 北京奇虎科技有限公司 一种搜索的方法及装置
CN104572960B (zh) * 2014-12-29 2018-07-06 北京奇虎科技有限公司 一种搜索的方法及装置
CN104598611B (zh) * 2015-01-29 2018-03-23 百度在线网络技术(北京)有限公司 对搜索条目进行排序的方法及系统
CN104598611A (zh) * 2015-01-29 2015-05-06 百度在线网络技术(北京)有限公司 对搜索条目进行排序的方法及系统
CN105069069A (zh) * 2015-07-30 2015-11-18 成都亿盟恒信科技有限公司 一种多个统计报表快捷关联方法
CN106446005A (zh) * 2015-08-07 2017-02-22 谷歌公司 因子分解模型
CN106446005B (zh) * 2015-08-07 2020-08-18 谷歌有限责任公司 因子分解模型
CN105574185A (zh) * 2015-12-22 2016-05-11 北京奇虎科技有限公司 一种提供聚合类型的智能摘要的方法和装置
CN106446213A (zh) * 2016-09-30 2017-02-22 北京百度网讯科技有限公司 基于人工智能的服务排序方法和装置
CN107066493A (zh) * 2016-12-29 2017-08-18 广州联客信息科技有限公司 一种利用ip地址的搜索引擎的结果排序优化方法及系统
CN108255874A (zh) * 2016-12-29 2018-07-06 百度在线网络技术(北京)有限公司 一种用于提供开放api搜索结果的方法与设备
CN108038148A (zh) * 2017-11-29 2018-05-15 广东欧珀移动通信有限公司 搜索响应方法、装置、服务器及存储介质
CN108121814A (zh) * 2017-12-28 2018-06-05 北京百度网讯科技有限公司 搜索结果排序模型生成方法和装置
CN108121814B (zh) * 2017-12-28 2022-04-22 北京百度网讯科技有限公司 搜索结果排序模型生成方法和装置
CN109543153A (zh) * 2018-11-13 2019-03-29 成都数联铭品科技有限公司 一种序列标注系统及方法
CN109543153B (zh) * 2018-11-13 2023-08-18 成都数联铭品科技有限公司 一种序列标注系统及方法
CN113344201A (zh) * 2021-06-22 2021-09-03 北京三快在线科技有限公司 一种模型训练的方法及装置
CN113343131A (zh) * 2021-06-30 2021-09-03 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置
CN113343131B (zh) * 2021-06-30 2022-08-26 北京三快在线科技有限公司 一种模型训练的方法、信息展示的方法及装置

Also Published As

Publication number Publication date
CN103593373B (zh) 2018-09-07

Similar Documents

Publication Publication Date Title
CN103593373A (zh) 一种用于搜索结果排序的方法与设备
CN102810117B (zh) 一种用于提供搜索结果的方法与设备
CN105247507B (zh) 用于确定品牌的影响力得分的方法、系统和存储介质
CN104008109B (zh) 基于用户兴趣的Web信息推送服务系统
CN102346778B (zh) 一种用于提供搜索结果的方法与设备
CN107704503A (zh) 用户关键词提取装置、方法及计算机可读存储介质
CN101984420B (zh) 一种基于拆词处理进行图片搜索的方法与设备
CN102682099B (zh) 一种用于在目标区域提供目标图片的方法与设备
CN107145496A (zh) 基于关键词将图像与内容项目匹配的方法
CN103226393A (zh) 一种输入方法和设备
CN102073699A (zh) 用于基于用户行为来改善搜索结果的方法、装置和设备
CN102968413A (zh) 一种用于提供搜索结果的方法与设备
CN101930438A (zh) 一种搜索结果生成方法及信息搜索系统
CN106445963B (zh) App平台的广告索引关键词自动生成方法和装置
CN103514191A (zh) 用于确定目标推广信息的关键词匹配模式的方法和设备
CN105224959A (zh) 排序模型的训练方法和装置
CN103049452A (zh) 一种基于预估下载率进行应用排序的方法与设备
CN104166732B (zh) 一种基于全局评分信息的项目协同过滤推荐方法
CN102236710A (zh) 一种用于在查询结果中展现新闻信息的方法与设备
CN103713894A (zh) 一种用于确定用户的访问需求信息的方法与设备
CN107145497A (zh) 基于图像和内容的元数据选择与内容匹配的图像的方法
CN104281619A (zh) 搜索结果排序系统及方法
CN103365876A (zh) 基于关系图谱生成网络操作辅助信息的方法与设备
US11269896B2 (en) System and method for automatic difficulty level estimation
CN102541946B (zh) 基于超链接的推荐属性确定超链推荐度的方法与设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant