CN102073699A - 用于基于用户行为来改善搜索结果的方法、装置和设备 - Google Patents

用于基于用户行为来改善搜索结果的方法、装置和设备 Download PDF

Info

Publication number
CN102073699A
CN102073699A CN 201010612415 CN201010612415A CN102073699A CN 102073699 A CN102073699 A CN 102073699A CN 201010612415 CN201010612415 CN 201010612415 CN 201010612415 A CN201010612415 A CN 201010612415A CN 102073699 A CN102073699 A CN 102073699A
Authority
CN
China
Prior art keywords
search result
result items
candidate search
list entries
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010612415
Other languages
English (en)
Other versions
CN102073699B (zh
Inventor
王清翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201010612415.6A priority Critical patent/CN102073699B/zh
Publication of CN102073699A publication Critical patent/CN102073699A/zh
Application granted granted Critical
Publication of CN102073699B publication Critical patent/CN102073699B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种用于基于用户行为来改善搜索结果的方法、装置及设备,其中,本发明通过获取来自用户的输入序列;根据所述输入序列来获取候选搜索结果项及其在所述输入序列下对应的真实热门度;并基于第一预定规则,根据所述真实热门度,来对所述候选搜索结果项进行排序,来获得排序结果。与现有技术相比,本发明具有以下优点:1)根据本发明的方法,参考了真实热门度、其他用户行为信息及用户相关信息来确定排序结果,因此,相对现有技术更能反映用户的真实关注点,使得排序结果更符合用户的需求;2)根据本发明的方法能够用于线上或线下处理,适用范围广。

Description

用于基于用户行为来改善搜索结果的方法、装置和设备
技术领域
本发明涉及计算机网络技术,尤其涉及一种用于基于用户行为来改善搜索结果的方法、装置和设备。
背景技术
现有技术中,提供搜索服务的设备,除了根据用户输入的输入序列进行文本匹配外,往往仅参考各个搜索结果项的历史点击率,来对搜索结果项进行排名。
然而,由于种种因素,例如,未能在搜索结果项中查找到其真实需要的内容,或者,因为误判而点击并非其所需的搜索结果项等,因此,单纯的点击率往往无法完全反映用户的真实需求。
发明内容
本发明的目的是提供一种用于基于用户行为来改善搜索结果的方法、装置和设备。
根据本发明的一个方面,提供一种计算机实现的用于基于用户行为来改善搜索结果的方法,其中,该方法包括以下步骤:
a获取来自用户的输入序列;
b根据所述输入序列来获取候选搜索结果项及其与所述输入序列相对应的真实热门度;
c基于第一预定规则,根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得排序结果。
根据本发明的另一个方面,还提供了一种用于基于用户行为来改善搜索结果的搜索装置,其中,该搜索装置包括:
第一获取装置、用于获取来自用户的输入序列;
第二获取装置、用于根据所述输入序列来获取候选搜索结果项及其在所述输入序列下对应的真实热门度;
排序装置、用于基于第一预定规则,根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得排序结果。
根据本发明的再一个方面,还提供了一种计算机设备,其中,该计算机设备包括根据前述搜索装置。
与现有技术相比,本发明具有以下优点:1)根据本发明的方法,参考了真实热门度、其他用户行为信息及用户相关信息来确定排序结果,因此,相对现有技术更能反映用户的真实关注点,使得排序结果更符合用户的需求;2)根据本发明的方法能够用于线上或线下处理,适用范围广。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一个方面的用于基于用户行为来改善搜索结果的方法流程图;
图2为本发明一个优选实施例的用于基于用户行为来改善搜索结果的方法流程图;
图3为本发明另一个优选实施例的用于基于用户行为来改善搜索结果的方法流程图;
图4为本发明一个方面的用于基于用户行为来改善搜索结果的搜索装置结构示意图;
图5为本发明一个优选实施例的用于基于用户行为来改善搜索结果的搜索装置结构示意图;
图6为本发明另一个优选实施例的用于基于用户行为来改善搜索结果的搜索装置结构示意图;
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1为本发明一个方面的用于基于用户行为来改善搜索结果的方法流程图。其中,根据本发明的方法可通过计算机中的操作系统或处理控制器来完成,为简明起见,以下将所述操作系统或处理控制器统称为搜索装置。其中,该计算机包括但不限于:1)用户设备;2)网络设备。其中,所述用户设备包括但不限于:个人电脑、智能手机、PDA等;所述网络设备包括但不限于:单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在步骤S1中,搜索装置获取来自用户的输入序列。
其中,搜索装置获取所述输入序列的方式包括但不限于:
1)实时获取来自用户的输入序列;
具体地,当所述搜索装置包含在用户设备中时,搜索装置直接获取用户输入的输入序列;当所述搜索装置包含在网络设备中时,搜索装置经由用户设备获取用户实时输入的输入序列。
2)获取预存储的来自用户的输入序列;
具体地,搜索装置获取预存储的输入序列,该输入序列由计算机或其他设备将所获取的来自用户的输入序列进行存储而得到。
接着,在步骤S2中,搜索装置根据所述输入序列来获取候选搜索结果项及其与所述输入序列相对应的真实热门度。
具体地,搜索装置根据所述输入序列,来获取候选搜索结果项,接着,搜索装置根据所述候选搜索结果项及所述输入序列来获取相应的真实热门度。其中,每一候选搜索结果项均包含一个网络资源或本地资源的描述信息及/或获取信息,例如,包含网络资源或本地资源的链接信息及文本描述信息等,或直接包含该资源本身。所述网络资源或本地资源包括但不限于:1)文本信息;2)网页信息;3)多媒体信息,例如,图片信息、音频信息、视频信息等。
其中,搜索装置获取所述候选搜索结果项的方式包括但不限于:
1)根据所述输入序列,在预设的倒排索引库中进行搜索,以获取候选搜索结果项;
具体地,所述倒排索引库中预设索引词及与索引词对应的候选搜索结果项,搜索装置将所述输入序列与所述索引词相匹配,并获取成功匹配的索引词对应的候选搜索结果项作为该输入序列的候选搜索结果项。
2)根据所述输入序列,在所有候选搜索结果项对应的描述信息及/或获取信息中进行匹配查询,以获取候选搜索结果项;
具体地,搜索装置查询各候选搜索结果项对应的描述信息及/或获取信息中是否包含所述输入序列的全部或部分信息,当查询得到包含所述输入序列的全部或部分信息时,将该候选搜索结果项作为该输入序列的候选搜索结果项。
其中,搜索装置获取所述真实热门度的方式包括但不限于:
1)搜索装置直接获取预设的与各候选搜索结果项及该输入序列相对应的真实热门度。
具体地,各候选搜索结果项均对应一个或多个真实热门度,每个真实热门度均对应一个输入序列。该真实热门度及其对应的输入序列存储在计算机设备或其他与该计算机设备物理分离但通信相连的设备中。当获取所述输入序列的候选搜索结果项后,搜索装置在计算机设备或其他设备中查询并获取所述候选搜索结果项与当前所处理的输入序列相对应的真实热门度。
例如,若输入序列为“游戏下载”,搜索装置根据该输入序列获得的候选搜索结果项中包括下述候选搜索结果项:
单机游戏_单机游戏下载_多特好玩的单机游戏下载基地
多特单机游戏下载基地为单机游戏玩家提供最新经典单机游戏下载,热门好玩的单机游戏免费下载。单机游戏下载,从多特单机游戏下载基地开始,百万人共同分享!”
该候选搜索结果项预设有多个分别与不同的输入序列对应多个真实热门度,输入序列与真实热门度的对应关系如下所示:
输入序列    真实热门度
经典游戏    1.234
游戏下载    1.456
单机游戏    2.487
多特        1.112
则搜索装置查询得带该候选搜索结果项与输入序列“游戏下载”相对应的真实热门度为1.456。
2)搜索装置获取预存储的与所述真实热门度相关的多个因素,并根据该多个因素获得所述真实热门度:
其中,与所述真实热门度相关的多个因素包括以下至少一项:
1)所述候选搜索结果项与所述输入序列相对应的相对点击率;
其中,该相对点击率根据所述候选结果项与所述输入序列相对应的点击次数及展现次数来获得;
2)所述候选搜索结果项与所述输入序列相对应的用户推荐数;
3)所述候选搜索结果项与所述输入序列相对应的用户收藏数。
根据上述因素来获得所述真实热门度的方式将在后续内容中进行详细陈述。
需要说明的是,上述举例仅为更好地说明本发明的方案,而非对本发明的限制,真实热门度还可采用其他表征方式,例如,采用等级来进行表征等,任何根据所述输入序列来获取候选搜索结果项及其与所述输入序列相对应的真实热门度的实现方式,均应包含在本发明的范围内。
接着,在步骤S3中,搜索装置根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得排序结果。
具体地,搜索装置按照真实热门度由高至低的方式,来对所述真实热门度对应的候选搜索结果项进行排序。其中,该由高至低的方式包括但不限于:
1)当所述真实热门度通过值来表示时,按照该真实热门度的值由高至低的方式来对候选搜索结果项进行排序;
2)当所述真实热门度通过等级来表示时,按照该真实热门度的等级由高至低的方式来对候选搜索结果项进行排序。
需要说明的是,上述举例仅为更好地说明本发明的方案,而非对本发明的限制,任何根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得排序结果的实现方式,均应包含在本发明的范围内。
根据本发明的方法,能够用于线上实时根据用户的输入序列反馈排序结果,也可用于线下处理以获得与输入序列相对应的排序结果。进一步的,根据本发明的方法,可用于根据用户在搜索框内输入的查询输入序列,来反馈排序结果,例如,通过在搜索引擎、网站提供的搜索框内输入查询输入序列,以通过互联网获得排序结果,或在局域网内通过网页或客户端进行资源查询等;或者,用于在输入法中,根据用户输入的输入序列,向用户提供排序后的短文本等。
由于根据本发明的方法,参考了真实热门度来确定排序结果,因此,相对现有技术更能反映用户的真实关注点,使得排序结果更符合用户的需求。
作为本发明的优选方案之一,本发明还包括步骤S4(图未示)。在步骤S4中,搜索装置根据以下至少一项来确定候选搜索结果项在所述输入序列下相对应的所述真实热门度:
1)所述候选搜索结果项与所述输入序列相对应的相对点击率;
具体地,搜索装置根据所记录的所述候选搜索结果项与所述输入序列相对应的点击次数与展现次数,来获得所述相对点击率。
例如,搜索装置根据公式:
相对点击率=k*(点击次数/展现次数),来获得相对点击率;
其中,k为本领域技术人员可根据实际情况和需求来确定的参数。
又例如,搜索装置根据公式:
相对点击率=点击次数/(展现次数-点击次数),来获得相对点击率。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述候选搜索结果项与所述输入序列相对应的相对点击率,来获得所述真实热门度的实现方式,均应包含在本发明的范围内。
其中,点击次数表示在该输入序列下用户点击该候选搜索结果项的次数,展现次数表示在该输入序列下该候选搜索结果项呈现在用户面前的次数。
具体地,搜索装置或其他装置通过记录各输入序列下候选搜索结果项展现在用户面前的次数,来获得该展现次数。当需要对该展现次数进行处理时,搜索装置根据输入序列及候选搜索结果项来查询所记录的相应展现次数。
其中,判断候选搜索结果项在用户面前展现的方式包括但不限于:
i)判断通过浏览器呈现的候选搜索结果项为在用户面前展现的候选搜索结果项;
搜索装置或其他装置根据用户确认进行搜索的行为及用户输入的输入序列,直接或经由用户设备向浏览器提供用于展现给用户的数据。则搜索装置或其他装置将向浏览器提供的数据中所包含的候选搜索结果项判断为在该输入序列下展现在用户面前的候选搜索结果项。
例如,用户通过用户设备访问百度搜索引擎,输入输入序列“游戏下载”并点击按键“百度一下”以确认进行搜索。则百度搜索引擎判断根据输入序列“游戏下载”来向用户设备反馈的数据中包含的候选搜索结果项为在输入序列“游戏下载”下展现在用户面前的候选搜索结果项。
ii)判断通过客户端呈现的候选搜索结果项为在用户面前展现的候选搜索结果项;
搜索装置或其他装置根据用户行为,直接或经由用户设备向客户端提供用于展现给用户的数据。则搜索装置或其他装置将向客户端提供的数据中所包含的候选搜索结果项判断为展现在用户面前的候选搜索结果项。
例如,用户通过一个论文搜索客户端访问一个论文库的本地搜索引擎,输入输入序列“游戏下载”并点击按键“确认”以确认进行搜索。则该本地搜索引擎判断根据输入序列“游戏下载”来向客户端反馈的数据中包含的候选搜索结果项为在输入序列“游戏下载”下展现在用户面前的候选搜索结果项。
iii)判断所展现的输入法候选项为在用户面前展现的候选搜索结果项;
当候选搜索结果项为输入法候选项时,搜索装置或其他装置将用于生成输入法候选栏的数据中所包含的输入法候选项判断为在该输入序列下展现在用户面前的候选搜索结果项。
例如,用户输入的输入序列为“youxi”,用户设备基于该输入序列所获取得到用于生成输入法候选栏的数据中所包含的输入法候选项为“游戏”、“有戏”、“有喜”、“又细”和“又洗”,则搜索装置或其他装置判断上述五项输入法选项判断为在输入序列“youxi”下展现在用户面前的候选搜索结果项。需要说明的是,当用户执行呈现下一页的操作,例如,选择“pagedown”按键等,则在更新输入法候选栏的数据中所包含的输入法候选项同样被判断为为在输入序列“youxi”下展现在用户面前的候选搜索结果项。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何通过记录各输入序列下候选搜索结果项展现在用户面前的次数,来获得该展现次数的实现方式,均应包含在本发明的范围内。
搜索装置或其他装置还通过记录各输入序列下各候选搜索结果项被用户点击的次数,来获得该点击次数。当需要对该点击次数进行处理时,搜索装置根据输入序列及候选搜索结果项来查询所记录的相应点击次数。搜索装置或其他装置将候选搜索结果项在展现的过程中,例如在通过浏览器、客户端或输入法候选栏进行展现的过程中,被用户选择的次数作为点击次数。本领域技术人员应能够确定获得该点击次数的实现方式,在此不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述候选搜索结果项与所述输入序列相对应的点击次数与展现次数,来获得所述相对点击率的实现方式,均应包含在本发明的范围内。
2)所述候选搜索结果项与所述输入序列相对应的用户推荐数;
具体地,当提供候选搜索结果项的设备向游客或注册用户提供推荐各候选搜索结果项的功能时,该设备记录基于输入序列而获得的各候选搜索结果项被用户推荐的推荐数。当需要对该推荐数进行处理时,搜索装置根据输入序列及候选搜索结果项来查询所记录的推荐数,并根据该推荐数来获得所述真实热门度,例如,直接将该推荐数作为真实热门度,或者,将该推荐数进行处理后,例如,进行归一化处理或除以一个预定系数后,在将处理所得的值作为真实热门度。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述候选搜索结果项与所述输入序列相对应的用户推荐数,来获得所述真实热门度的实现方式,均应包含在本发明的范围内。
3)所述候选搜索结果项与所述输入序列相对应的用户收藏数;
具体地,当提供候选搜索结果项的设备提供注册用户收藏各候选搜索结果项的功能时,该设备记录基于输入序列而获得的各候选搜索结果项被用户收藏的收藏数。当需要对该收藏数进行处理时,搜索装置根据输入序列及候选搜索结果项来查询所记录的收藏数,并根据该收藏数来获得所述真实热门度,例如,直接将该收藏数作为真实热门度,或者,将该收藏数进行处理后,例如,进行归一化处理或除以一个预定系数后,在将处理所得的值作为真实热门度。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述候选搜索结果项与所述输入序列相对应的用户收藏数,来获得所述真实热门度的实现方式,均应包含在本发明的范围内。
需要说明的是,搜索装置还可结合所述相对点击率、所述用户推荐数及所述用户收藏数中的任意若干者来获得所述真实热门度。例如,搜索装置将相对点击率、用户推荐数及用户收藏数分别归一化后,再获取上述三者的平均值或者和或者根据预设公式进行相应处理后,获得真实热门度等。本领域技术人员应该理解,本发明的范围不以上述举例为限。
需要进一步说明的是,本实施例所述的确定真实热门度的方式,还可用于在步骤S3中,搜索装置获取预存储的与所述真实热门度相关的多个因素,并根据该多个因素获得所述真实热门度的情况。
作为本发明的优选方案之一,在步骤S3中,搜索装置还基于第一预定规则,根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得所述排序结果。
具体地,第一预定规则中包括根据一项或多项现有因素,并结合所述真实热门度,来确定所述候选搜索结果项的排序结果的排序规则。则搜索装置根据第一预定规则所规定的排序规则,获取该一项或多项现有因素,并根据所获取的现有因素,结合所述真实热门度,来确定所述候选搜索结果项的排序结果。
其中,所述现有因素包括但不限于:
1)所述输入序列与所述候选搜索结果项的相关度;
该相关度可根据所述输入序列与所述候选搜索结果项的匹配度、所述输入序列的类别及/或所述候选搜索结果项的类别等因素得到;
2)所述候选搜索结果项的重要度;
该重要度可根据候选搜索结果项的点击率、权威性等因素得到。
由于上述两项均为现有因素,本领域技术人员应能根据实际情况及需求来根据所述输入序列及所述候选搜索结果项获得上述两项因素,因此,在此不再对该两项因素的获取方式予以赘述。
需要说明的是,上述所举现有因素举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何其他现有的影响候选搜索结果项排序的因素,均应包含在本发明所述现有因素的范围内。
所述排序规则进一步包括以下任一规则:
1)先根据现有因素确定所述候选搜索结果项的初始排序结果,再根据所述真实热门度来调整该初始排序结果,以获得所述排序结果的规则;
例如,对于输入序列“游戏下载”,搜索装置根据现有因素所获得的候选搜索结果项初始排序结果为:
候选搜索结果项一;
候选搜索结果项三;
候选搜索结果项四;
候选搜索结果项二;
候选搜索结果项五。
搜索装置所获得的各候选搜索结果项与输入序列“游戏下载”相对应的真实热门度如下所示:
候选搜索结果项       真实热门度
候选搜索结果项一     第一等级
候选搜索结果项二     第一等级
候选搜索结果项三     第三等级
候选搜索结果项四     第二等级
候选搜索结果项五     第三等级
若排序规则中包括由前至后分析相邻两候选搜索结果项的真实热门度,当在后的候选搜索结果项真实热门度等级高于在前的候选搜索结果项,则将两者位置互换;当在后的候选搜索结果项真实热门度等级低于或等于在前的候选搜索结果项,则不改变两者排序位置的规则。
搜索装置根据上述规则,分析得到候选搜索结果项一的真实热门度等级高于候选搜索结果项三的真实热门度等级,则不改变两者排序位置;接着,搜索装置分析得到候选搜索结果项三的真实热门度等级低于候选搜索结果项四的真实热门度等级,则将候选搜索结果项三与候选搜索结果项四的位置互换;接着,由于候选搜索结果项三的位置已由原来的第二位换至第三位,因此,搜索装置将候选搜索结果项三的真实热门度等级与候选搜索结果二的真实热门度等级进行比对,判断得到候选搜索结果项三的真实热门度等级低于候选搜索结果项二的真实热门度等级,则将候选搜索结果项三与候选搜索结果项二的位置互换;接着,由于候选搜索结果项三的位置已由第三位换至第四位,因此,搜索装置将候选搜索结果项三的真实热门度等级与候选搜索结果五的真实热门度等级进行比对,判断得到候选搜索结果项三的真实热门度等级等于候选搜索结果项五的真实热门度等级,则不改变两者排序位置。搜索装置执行上述操作后,所得的候选搜索项排序结果为:
候选搜索结果项一;
候选搜索结果项四;
候选搜索结果项二;
候选搜索结果项三;
候选搜索结果项五。
2)综合所述现有因素及所述真实热门度,直接获得所述排序结果的规则。
又例如,对于输入序列“游戏下载”,所述排序规则所参考的现有因素包括所述输入序列与所述候选搜索结果项的相关度及所述候选搜索结果项的重要度,且该排序规则规定将所述相关度、重要度及真实热门度相加,并根据相加所得的和来对候选搜索结果项进行排序。若搜索装置在步骤S3中所获得的相关度及重要度和搜索装置在步骤S2中所获得的真实热门度如下所示:
候选搜索结果         项相关度    重要度      真实热门度
候选搜索结果项一     2.135       2.167       1.234
候选搜索结果项二     3.214       3.246       1.456
候选搜索结果项三     2.489       2.498       2.487
候选搜索结果项四     1.358       1.397       1.112
候选搜索结果项五    1.698    2.054    1.587
则搜索装置根据排序规则的规定,计算各候选搜索结果项相关度、重要度及真实热门度之和,并根据该相加之和对个候选搜索结果项进行排序所得的排序结果为:
候选搜索结果项二;
候选搜索结果项三;
候选搜索结果项一;
候选搜索结果项五;
候选搜索结果项四。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于第一预定规则,根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得排序结果的实现方式,例如,改变根据真实热门度来调整所述初始排序结果的规则,或者,当真实热门度以值的形式表征时,根据真实热门度的值来调整所述初始排序结果,或者,对各现有因素及真实热门度进行加权,然后将加权后的各现有因素及真实热门度进行相乘或取均值等其他处理方式来获得用于排序的值等,均应包含在本发明的范围内。
作为本发明的优选方案之一,步骤S2还进一步包括步骤S21(图未示)及步骤S22(图未示)。
在步骤S21中,搜索装置获取所述输入序列所包含的信息单元。
具体地,获得该信息单元的方式包括但不限于:
1)搜索装置对所述输入序列进行切分,以获得切词单元作为信息单元;
2)搜索装置提取所述输入序列的n-gram片段,以将该n-gram片段作为信息单元。
进一步地,还可去除通过上述两种方法所得的切词单元或n-gram片段中的无效信息,以将剩余的切词单元或n-gram片段作为信息单元。
接着,在步骤S22中,搜索装置根据所述信息单元来获取所述候选搜索结果项。
具体地,搜索装置先根据信息单元来获取候选搜索结果项,再将基于信息单元所得的候选搜索结果项作为该信息单元所属的输入序列的候选搜索结果项。其中,搜索装置根据信息单元来获取候选搜索结果项的方式与步骤S2中搜索装置根据输入序列来获取候选搜索结果项的方式相同或相似,在此不再赘述。
作为本发明的优选方案之一,根据本发明的方法还包括步骤S5(图未示)、步骤S6(图未示)及步骤S7(图未示)。
在步骤S5中,搜索装置根据所述输入序列及其对应的候选搜索结果项排序结果,来建立或更新排序索引信息。
其中,所述排序索引信息包括以下任一种索引信息:
1)输入序列、与该输入序列对应的候选搜索结果项及该候选搜索结果项在该输入序列下的排序位置;
具体地,搜索装置根据步骤S3中获得的排序结果,直接建立或更新输入序列、与该输入序列对应的候选搜索结果项及该候选搜索结果项在该输入序列下排序位置的索引信息。
2)输入序列、与该输入序列对应的候选搜索结果项及该候选搜索结果项在该输入序列下的排序位置调整信息;
具体地,搜索装置根据步骤S3中获得的排序结果中包含的真实热门度或其他现有因素的等级或权重值,来获取该输入序列下该候选搜索结果项的排序位置调整信息,例如,加权信息或降权信息等,以建立或更新输入序列、与该输入序列对应的候选搜索结果项及该候选搜索结果项在该输入序列下排序位置调整信息的索引信息。
在步骤S6中,搜索装置实时获取来自用户的输入序列。
接着,在步骤S7中,搜索装置根据所述实时获取的输入序列,在所述排序索引信息中进行匹配查询,以获得该实时获取的输入序列对应的排序结果。
具体地,搜索装置直接根据排序索引信息中包含的输入序列、与该输入序列对应的候选搜索结果项及该候选搜索结果项在该输入序列下的排序位置,直接查询得到该输入序列的排序结果。
或者,搜索装置根据排序索引信息中包含的输入序列、与该输入序列对应的候选搜索结果项及该候选搜索结果项在该输入序列下的排序位置调整信息,对候选搜索结果项进行处理,以得到该输入序列的排序结果。
优选地,本发明还包括根据所述排序结果,由所述候选搜索结果项中选择用于呈现给用户的搜索结果项的步骤。
具体地,搜索装置根据用户行为及需要呈现的候选搜索结果项的数量,来由候选搜索结果项中选择用于呈现给用户的搜索结果项。
图2为本发明一个优选实施例的用于基于用户行为来改善搜索结果的方法流程图。根据本发明的方法包括步骤S1、步骤S2及步骤S31。
步骤S1及步骤S2已在参照图1所示的实施例中予以详述,并以引用的方式包含于此,不再赘述。
在步骤S31中,搜索装置基于第一预定规则,根据所述真实热门度及其他排序相关信息,来对所述候选搜索结果项进行排序,以获得所述排序结果。
所述其他排序相关信息包括以下至少一项:
1)与所述候选搜索结果项有关的其他用户行为信息;
其中,该其他用户行为信息可由搜索装置或其他装置获取,并且搜索装置能够以通信连接或其他连接方式来获得其他装置所获取的该其他用户行为信息,该其他用户行为信息包括以下至少一项:
i)所述候选搜索结果项与所述输入序列相对应的展现时间;
该展现时间表示候选搜索结果项在用户面前所展现的时间。具体地,当该候选搜索结果项通过浏览器展现时,该展现时间表示从浏览器生成页面至用户更新该页面中的候选搜索结果项或关闭该页面的时间;当该候选搜索结果项通过客户端展现时,该展现时间表示从客户端生成展现页面至用户更新该展现页面中的候选搜索结果项或关闭该页面的时间;当该候选搜索结果项通过输入法候选栏展现时,该展现时间表示该候选搜索结果项在该输入法候选栏中展现的时间。
ii)所述候选搜索结果项在页面中的展现位置;
该展现位置包括候选搜索结果项在展现给用户时,在网页页面、客户端页面、或输入法候选栏中所处的位置。例如,对于网页和客户端页面,该展现位置包括上部、左部、右部、下部、中部、标题处、正文处、侧边栏处等等,对于输入法候选栏,该展现位置包括位于输入法候选栏中的第几个选项等等。
iii)所述候选搜索结果项对应的资源与所述输入序列相对应的浏览时间;
该浏览时间表示用户选择该候选搜索结果项后,对其进行浏览的时间长度。例如,对于以浏览器或客户端呈现候选搜索结果项的方式,该浏览时间可根据用户通过点击或键盘选择行为打开该候选搜索结果项对应的资源后,浏览该资源的时间;其中,可通过该资源展现的时间来获得所述浏览时间,例如,若该资源为网页,则将所获取的该网页的存在时间作为用户浏览时间等。
具体地,搜索装置根据其他用户行为信息中的至少一项来调节基于第一预定规则,并根据所述真实热门度所得的排序结果;或者,搜索装置直接基于第一预定规则所参考的现有因素、真实热门度及其他用户行为信息来获得排序结果。
其中,候选搜索结果项展现时间越长,其排序越靠前;候选搜索结果项展现位置越远离用户关注区,且其被用户选择,则其排序越靠前,其中,该用户关注区由预设得到,例如,预设页面中部和标题、输入法候选栏第一项为用户关注区等;候选搜索结果项浏览时间越长,其排序越靠前。搜索装置可根据所获得的展现时间、展现位置及浏览时间的信息中的任一项或任若干项,来分别判断该展现时间、展现位置及浏览时间所属的调节等级,并根据该调节等级来调整前述排序结果,该根据调节等级来调节排序结果的方式,与参照图1所示实施例中根据真实热门度来调节初始排序结果的方式相同或相似,并以引用的方式包含于此,不再赘述;或者,搜索装置根据所获得的展现时间、展现位置及浏览时间的信息中的任一项或任若干项,来分别确定该展现时间、展现位置及浏览时间对应的单项权重值,并根据该单项权重值来获得排序结果,该方式将在后续实施例中予以详述,在此不再赘述。
2)用户相关信息;
其中,用户身份可根据用户的注册信息;用户设备的识别码,例如,手机号或硬件哈希值等;用户的临时记录信息,例如,用户cookie等来识别。所述用户相关信息包括以下至少一项:
i)用户的个人属性;
该个人属性包括但不限于由注册用户主动提供或根据所记录的用户行为推测得到的用户年龄、性别、职业、收入、教育程度等信息。搜索装置根据用户的个人属性,来调整排序结果。例如,若用户为女性,则将类别为“购物”的候选搜索结果项排序位置提前等。其中,候选搜索结果项的类别通过预设信息得到。
ii)用户的偏好设置;
搜索装置根据用户的偏好设置,来调整排序结果。例如,若偏好设置中包括将“军事”类别的候选搜索结果项提前的设置。则搜索装置根据该偏好设置,将排序结果中“军事”类别的候选搜索结果项排序位置提前等。
iii)用户的环境信息;
该环境信息包括时间信息及位置信息。其中,该时间信息可通过用户设备的当前时间获得,该位置信息可根据用户设备当前的位置信息,例如,IP地址或手机漫游区域等信息获得。搜索装置根据该环境信息,来调整排序结果。例如,若搜索装置分析得到用户当前的IP地址为上海,且用户输入序列为“天气预报”,则将上海地区的天气预报排序位置提前等。
iv)用户的历史行为记录;
该用户的历史行为记录包括但不限于:用户的点击行为、用户的浏览行为等。搜索装置根据用户的历史行为记录,来调整排序结果。例如,若历史行为记录中包括用户在输入序列“天气预报”时选择上海地区的天气预报的记录,则当获取到该用户的输入序列为“天气预报”时,将上海地区的天气预报排序位置提前等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于第一预定规则,根据所述真实热门度及其他排序相关信息,来对所述候选搜索结果项进行排序,以获得所述排序结果的实现方式,均应包含在本发明的范围内。
图3为本发明另一个优选实施例的用于基于用户行为来改善搜索结果的方法流程图。根据本实施例的方法包括步骤S1、步骤S2及步骤S3。其中,步骤S3进一步包括步骤S32及步骤S33。
步骤S1及步骤S2已在参照图1所示实施例中予以详述,并以引用的方式包含于此,不再赘述。
本实施例中,第一预定规则进一步包括权重排序规则。
在步骤S32中,搜索装置基于所述权重排序规则,根据所述真实热门度及所述其他排序相关信息,来获得所述候选搜索结果项在该输入序列下的权重值。
具体地,所述权重排序规则参考现有因素、真实热门度及其他相关排序信息来确定所述权重值。其中,该现有因素、真实热门度及其他排序相关信息已在参照图1或图2所示实施例中予以详述,并以引用的方式包含于此,不再赘述。该权重排序规则进一步包括以下任一种规则:
1)将现有因素、真实热门度或其他排序相关信息中任一者对应的单项权重值作为初始权重值,接着,根据其他两者对应的单项权重值来调整该初始权重值,以获得前述权重值。
例如,根据权重排序规则,搜索装置将现有因素对应的单项权重值作为初始权重值,接着,根据真实热门度及其他排序相关信息对应的单项权重值与现有因素对应的单项权重值的差值大小所属的预定范围,来确定该初始权重值的上调或下调幅度等。其中,本领域技术人员应可根据实际情况和需求来确定该预定范围。例如,若真实热门度及其他排序相关信息对应的单项权重值均大于现有因素对应的单项权重值,且差值属于一预定范围0.2至0.4之间,则将初始权重值上调0.1等。
其中,本领域技术人员应可根据实际情况确定现有因素的单项权重值,在此不再赘述。
真实热门度对应的单项权重值根据所述候选搜索结果项与所述输入序列相对应的相对点击率、所述候选搜索结果项与所述输入序列相对应的用户推荐数及所述候选搜索结果项与所述输入序列相对应的用户收藏数中至少一项来获得。例如,搜索装置直接将相对点击率、推荐数或收藏数对应的值作为真实热门度的权重值;又例如,将相对点击率、推荐数及收藏数分别进行归一化后相加,并将所得的和作为真实热门度对应的权重值等。本领域技术人员应理解,真实热门度对应的单项权重值的获取方式不以上述举例为限。
其他排序相关信息对应的单项权重值根据该其他排序相关信息所包含一种或多种信息来获得。例如,搜索装置直接将其他用户行为信息中各项对应的值中的任一种作为其他排序相关信息的权重值;又例如,搜索装置将其他用户行为信息各项对应的值分别进行归一化,并获取各归一化后的值的平均值来作为其他排序相关信息对应的单项权重值等。本领域技术人员应理解,其他排序相关信息对应的单项权重值的获取方式不以上述举例为限。
2)直接根据现有因素、真实热门度或其他排序相关信息中至少一者对应的单项权重值来获得前述权重值。
例如,权重排序规则规定现有因素、真实热门度或其他排序相关信息的加权系数分别为0.8、1.2及1.1,并规定将各单项权重值乘以相应的加权系数后相加以获得权重值。则搜索装置将各单项权重值分别乘以相应的加权系数后相加,并将相加所得的和作为权重值等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于所述权重排序规则,根据所述真实热门度及所述其他排序相关信息,来获得所述候选搜索结果项在该输入序列下的权重值的实现方式,例如采用其他的权重调整方式或者采用其他的权重计算方式等,均应包含在本发明的范围内。
在步骤S33中,搜索装置根据所述权重值来对所述候选搜索结果项进行排序,以获得所述排序结果。
具体地,搜索装置按照权重值由高至低的顺序对候选搜索结果项进行排序,以获得排序结果。
图4为本发明一个方面的用于基于用户行为来改善搜索结果的搜索装置结构示意图。根据本发明的搜索装置包括第一获取装置1、第二获取装置2及排序装置3。
第一获取装置1获取来自用户的输入序列。
其中,第一获取装置1获取所述输入序列的方式包括但不限于:
1)实时获取来自用户的输入序列;
具体地,当所述第一获取装置1包含在用户设备中时,第一获取装置1直接获取用户输入的输入序列;当所述第一获取装置1包含在网络设备中时,第一获取装置1经由用户设备获取用户实时输入的输入序列。
2)获取预存储的来自用户的输入序列;
具体地,第一获取装置1获取预存储的输入序列,该输入序列由计算机或其他设备将所获取的来自用户的输入序列进行存储而得到。
第二获取装置2根据所述输入序列来获取候选搜索结果项及其与所述输入序列相对应的真实热门度。
具体地,第二获取装置2根据所述输入序列,来获取候选搜索结果项,接着,第二获取装置2根据所述候选搜索结果项及所述输入序列来获取相应的真实热门度。其中,每一候选搜索结果项均包含一个网络资源或本地资源的描述信息及/或获取信息,例如,包含网络资源或本地资源的链接信息及文本描述信息等,或直接包含该资源本身。所述网络资源或本地资源包括但不限于:1)文本信息;2)网页信息;3)多媒体信息,例如,图片信息、音频信息、视频信息等。
其中,第二获取装置2获取所述候选搜索结果项的方式包括但不限于:
1)根据所述输入序列,在预设的倒排索引库中进行搜索,以获取候选搜索结果项;
具体地,所述倒排索引库中预设索引词及与索引词对应的候选搜索结果项,第二获取装置2将所述输入序列与所述索引词相匹配,并获取成功匹配的索引词对应的候选搜索结果项作为该输入序列的候选搜索结果项。
2)根据所述输入序列,在所有候选搜索结果项对应的描述信息及/或获取信息中进行匹配查询,以获取候选搜索结果项;
具体地,第二获取装置2查询各候选搜索结果项对应的描述信息及/或获取信息中是否包含所述输入序列的全部或部分信息,当查询得到包含所述输入序列的全部或部分信息时,将该候选搜索结果项作为该输入序列的候选搜索结果项。
其中,第二获取装置2获取所述真实热门度的方式包括但不限于:
1)第二获取装置2直接获取预设的与各候选搜索结果项及该输入序列相对应的真实热门度。
具体地,各候选搜索结果项均对应一个或多个真实热门度,每个真实热门度均对应一个输入序列。该真实热门度及其对应的输入序列存储在计算机设备或其他与该计算机设备物理分离但通信相连的设备中。当获取所述输入序列的候选搜索结果项后,第二获取装置2在计算机设备或其他设备中查询并获取所述候选搜索结果项与当前所处理的输入序列相对应的真实热门度。
例如,若输入序列为“游戏下载”,第二获取装置2根据该输入序列获得的候选搜索结果项中包括下述候选搜索结果项:
单机游戏_单机游戏下载_多特好玩的单机游戏下载基地
多特单机游戏下载基地为单机游戏玩家提供最新经典单机游戏下载,热门好玩的单机游戏免费下载。单机游戏下载,从多特单机游戏下载基地开始,百万人共同分享!”
该候选搜索结果项预设有多个分别与不同的输入序列对应多个真实热门度,输入序列与真实热门度的对应关系如下所示:
输入序列        真实热门度
经典游戏        1.234
游戏下载        1.456
单机游戏        2.487
多特            1.112
则第二获取装置2查询得带该候选搜索结果项与输入序列“游戏下载”相对应的真实热门度为1.456。
2)第二获取装置2获取预存储的与所述真实热门度相关的多个因素,并根据该多个因素获得所述真实热门度:
其中,与所述真实热门度相关的多个因素包括以下至少一项:
1)所述候选搜索结果项与所述输入序列相对应的相对点击率;
其中,该相对点击率根据所述候选结果项与所述输入序列相对应的点击次数及展现次数来获得;
2)所述候选搜索结果项与所述输入序列相对应的用户推荐数;
3)所述候选搜索结果项与所述输入序列相对应的用户收藏数。
根据上述因素来获得所述真实热门度的方式将在后续内容中进行详细陈述。
需要说明的是,上述举例仅为更好地说明本发明的方案,而非对本发明的限制,真实热门度还可采用其他表征方式,例如,采用等级来进行表征等,任何根据所述输入序列来获取候选搜索结果项及其与所述输入序列相对应的真实热门度的实现方式,均应包含在本发明的范围内。
排序装置3根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得排序结果。
具体地,排序装置3按照真实热门度由高至低的方式,来对所述真实热门度对应的候选搜索结果项进行排序。其中,该由高至低的方式包括但不限于:
1)当所述真实热门度通过值来表示时,按照该真实热门度的值由高至低的方式来对候选搜索结果项进行排序;
2)当所述真实热门度通过等级来表示时,按照该真实热门度的等级由高至低的方式来对候选搜索结果项进行排序。
需要说明的是,上述举例仅为更好地说明本发明的方案,而非对本发明的限制,任何根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得排序结果的实现方式,均应包含在本发明的范围内。
根据本发明的方法,能够用于线上实时根据用户的输入序列反馈排序结果,也可用于线下处理以获得与输入序列相对应的排序结果。进一步的,根据本发明的方法,可用于根据用户在搜索框内输入的查询输入序列,来反馈排序结果,例如,通过在搜索引擎、网站提供的搜索框内输入查询输入序列,以通过互联网获得排序结果,或在局域网内通过网页或客户端进行资源查询等;或者,用于在输入法中,根据用户输入的输入序列,向用户提供排序后的短文本等。
由于根据本发明的方法,参考了真实热门度来确定排序结果,因此,相对现有技术更能反映用户的真实关注点,使得排序结果更符合用户的需求。
作为本发明的优选方案之一,本发明还包括确定装置(图未示)。该确定装置根据以下至少一项来确定候选搜索结果项在所述输入序列下相对应的所述真实热门度:
1)所述候选搜索结果项与所述输入序列相对应的相对点击率;
具体地,确定装置根据所记录的所述候选搜索结果项与所述输入序列相对应的点击次数与展现次数,来获得所述相对点击率。
例如,确定装置根据公式:
相对点击率=k*(点击次数/展现次数),来获得相对点击率;
其中,k为本领域技术人员可根据实际情况和需求来确定的参数。
又例如,确定装置根据公式:
相对点击率=点击次数/(展现次数-点击次数),来获得相对点击率。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述候选搜索结果项与所述输入序列相对应的相对点击率,来获得所述真实热门度的实现方式,均应包含在本发明的范围内。
其中,点击次数表示在该输入序列下用户点击该候选搜索结果项的次数,展现次数表示在该输入序列下该候选搜索结果项呈现在用户面前的次数。
具体地,搜索装置或其他装置通过记录各输入序列下候选搜索结果项展现在用户面前的次数,来获得该展现次数。当需要对该展现次数进行处理时,确定装置根据输入序列及候选搜索结果项来查询所记录的相应展现次数。
其中,判断候选搜索结果项在用户面前展现的方式包括但不限于:
i)判断通过浏览器呈现的候选搜索结果项为在用户面前展现的候选搜索结果项;
搜索装置或其他装置根据用户确认进行搜索的行为及用户输入的输入序列,直接或经由用户设备向浏览器提供用于展现给用户的数据。则搜索装置或其他装置将向浏览器提供的数据中所包含的候选搜索结果项判断为在该输入序列下展现在用户面前的候选搜索结果项。
例如,用户通过用户设备访问百度搜索引擎,输入输入序列“游戏下载”并点击按键“百度一下”以确认进行搜索。则百度搜索引擎判断根据输入序列“游戏下载”来向用户设备反馈的数据中包含的候选搜索结果项为在输入序列“游戏下载”下展现在用户面前的候选搜索结果项。
ii)判断通过客户端呈现的候选搜索结果项为在用户面前展现的候选搜索结果项;
搜索装置或其他装置根据用户行为,直接或经由用户设备向客户端提供用于展现给用户的数据。则搜索装置或其他装置将向客户端提供的数据中所包含的候选搜索结果项判断为展现在用户面前的候选搜索结果项。
例如,用户通过一个论文搜索客户端访问一个论文库的本地搜索引擎,输入输入序列“游戏下载”并点击按键“确认”以确认进行搜索。则该本地搜索引擎判断根据输入序列“游戏下载”来向客户端反馈的数据中包含的候选搜索结果项为在输入序列“游戏下载”下展现在用户面前的候选搜索结果项。
iii)判断所展现的输入法候选项为在用户面前展现的候选搜索结果项;
当候选搜索结果项为输入法候选项时,搜索装置或其他装置将用于生成输入法候选栏的数据中所包含的输入法候选项判断为在该输入序列下展现在用户面前的候选搜索结果项。
例如,用户输入的输入序列为“youxi”,用户设备基于该输入序列所获取得到用于生成输入法候选栏的数据中所包含的输入法候选项为“游戏”、“有戏”、“有喜”、“又细”和“又洗”,则搜索装置或其他装置判断上述五项输入法选项判断为在输入序列“youxi”下展现在用户面前的候选搜索结果项。需要说明的是,当用户执行呈现下一页的操作,例如,选择“pagedown”按键等,则在更新输入法候选栏的数据中所包含的输入法候选项同样被判断为为在输入序列“youxi”下展现在用户面前的候选搜索结果项。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何通过记录各输入序列下候选搜索结果项展现在用户面前的次数,来获得该展现次数的实现方式,均应包含在本发明的范围内。
搜索装置或其他装置还通过记录各输入序列下各候选搜索结果项被用户点击的次数,来获得该点击次数。当需要对该点击次数进行处理时,确定装置根据输入序列及候选搜索结果项来查询所记录的相应点击次数。搜索装置或其他装置将候选搜索结果项在展现的过程中,例如在通过浏览器、客户端或输入法候选栏进行展现的过程中,被用户选择的次数作为点击次数。本领域技术人员应能够确定获得该点击次数的实现方式,在此不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述候选搜索结果项与所述输入序列相对应的点击次数与展现次数,来获得所述相对点击率的实现方式,均应包含在本发明的范围内。
2)所述候选搜索结果项与所述输入序列相对应的用户推荐数;
具体地,当提供候选搜索结果项的设备向游客或注册用户提供推荐各候选搜索结果项的功能时,该设备记录基于输入序列而获得的各候选搜索结果项被用户推荐的推荐数。当需要对该推荐数进行处理时,确定装置根据输入序列及候选搜索结果项来查询所记录的推荐数,并根据该推荐数来获得所述真实热门度,例如,直接将该推荐数作为真实热门度,或者,将该推荐数进行处理后,例如,进行归一化处理或除以一个预定系数后,在将处理所得的值作为真实热门度。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述候选搜索结果项与所述输入序列相对应的用户推荐数,来获得所述真实热门度的实现方式,均应包含在本发明的范围内。
3)所述候选搜索结果项与所述输入序列相对应的用户收藏数;
具体地,当提供候选搜索结果项的设备提供注册用户收藏各候选搜索结果项的功能时,该设备记录基于输入序列而获得的各候选搜索结果项被用户收藏的收藏数。当需要对该收藏数进行处理时,确定装置根据输入序列及候选搜索结果项来查询所记录的收藏数,并根据该收藏数来获得所述真实热门度,例如,直接将该收藏数作为真实热门度,或者,将该收藏数进行处理后,例如,进行归一化处理或除以一个预定系数后,在将处理所得的值作为真实热门度。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述候选搜索结果项与所述输入序列相对应的用户收藏数,来获得所述真实热门度的实现方式,均应包含在本发明的范围内。
需要说明的是,确定装置还可结合所述相对点击率、所述用户推荐数及所述用户收藏数中的任意若干者来获得所述真实热门度。例如,搜索装置将相对点击率、用户推荐数及用户收藏数分别归一化后,再获取上述三者的平均值或者和或者根据预设公式进行相应处理后,获得真实热门度等。本领域技术人员应该理解,本发明的范围不以上述举例为限。
需要进一步说明的是,确定装置确定真实热门度的方式,还可用于排序装置获取预存储的与所述真实热门度相关的多个因素后,根据该多个因素获得所述真实热门度。
作为本发明的优选方案之一,排序装置3还基于第一预定规则,根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得所述排序结果。
具体地,第一预定规则中包括根据一项或多项现有因素,并结合所述真实热门度,来确定所述候选搜索结果项的排序结果的排序规则。则排序装置3根据第一预定规则所规定的排序规则,获取该一项或多项现有因素,并根据所获取的现有因素,结合所述真实热门度,来确定所述候选搜索结果项的排序结果。
其中,所述现有因素包括但不限于:
1)所述输入序列与所述候选搜索结果项的相关度;
该相关度可根据所述输入序列与所述候选搜索结果项的匹配度、所述输入序列的类别及/或所述候选搜索结果项的类别等因素得到;
2)所述候选搜索结果项的重要度;
该重要度可根据候选搜索结果项的点击率、权威性等因素得到。
由于上述两项均为现有因素,本领域技术人员应能根据实际情况及需求来根据所述输入序列及所述候选搜索结果项获得上述两项因素,因此,在此不再对该两项因素的获取方式予以赘述。
需要说明的是,上述所举现有因素举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何其他现有的影响候选搜索结果项排序的因素,均应包含在本发明所述现有因素的范围内。
所述排序规则进一步包括以下任一规则:
1)先根据现有因素确定所述候选搜索结果项的初始排序结果,再根据所述真实热门度来调整该初始排序结果,以获得所述排序结果的规则;
例如,对于输入序列“游戏下载”,排序装置3根据现有因素所获得的候选搜索结果项初始排序结果为:
候选搜索结果项一;
候选搜索结果项三;
候选搜索结果项四;
候选搜索结果项二;
候选搜索结果项五。
第二获取装置2所获得的各候选搜索结果项与输入序列“游戏下载”相对应的真实热门度如下所示:
候选搜索结果项          真实热门度
候选搜索结果项一        第一等级
候选搜索结果项二        第一等级
候选搜索结果项三        第三等级
候选搜索结果项四        第二等级
候选搜索结果项五        第三等级
若排序规则中包括由前至后分析相邻两候选搜索结果项的真实热门度,当在后的候选搜索结果项真实热门度等级高于在前的候选搜索结果项,则将两者位置互换;当在后的候选搜索结果项真实热门度等级低于或等于在前的候选搜索结果项,则不改变两者排序位置的规则。
排序装置3根据上述规则,分析得到候选搜索结果项一的真实热门度等级高于候选搜索结果项三的真实热门度等级,则不改变两者排序位置;接着,排序装置3分析得到候选搜索结果项三的真实热门度等级低于候选搜索结果项四的真实热门度等级,则将候选搜索结果项三与候选搜索结果项四的位置互换;接着,由于候选搜索结果项三的位置已由原来的第二位换至第三位,因此,排序装置3将候选搜索结果项三的真实热门度等级与候选搜索结果二的真实热门度等级进行比对,判断得到候选搜索结果项三的真实热门度等级低于候选搜索结果项二的真实热门度等级,则将候选搜索结果项三与候选搜索结果项二的位置互换;接着,由于候选搜索结果项三的位置已由第三位换至第四位,因此,排序装置3将候选搜索结果项三的真实热门度等级与候选搜索结果五的真实热门度等级进行比对,判断得到候选搜索结果项三的真实热门度等级等于候选搜索结果项五的真实热门度等级,则不改变两者排序位置。排序装置3执行上述操作后,所得的候选搜索项排序结果为:
候选搜索结果项一;
候选搜索结果项四;
候选搜索结果项二;
候选搜索结果项三;
候选搜索结果项五。
2)综合所述现有因素及所述真实热门度,直接获得所述排序结果的规则。
又例如,对于输入序列“游戏下载”,所述排序规则所参考的现有因素包括所述输入序列与所述候选搜索结果项的相关度及所述候选搜索结果项的重要度,且该排序规则规定将所述相关度、重要度及真实热门度相加,并根据相加所得的和来对候选搜索结果项进行排序。若排序装置3所获得的相关度及重要度和第二获取装置2所获得的真实热门度如下所示:
候选搜索结果        项相关度        重要度          真实热门度
候选搜索结果项一    2.135           2.167           1.234
候选搜索结果项二    3.214           3.246           1.456
候选搜索结果项三      2.489      2.498      2.487
候选搜索结果项四      1.358      1.397      1.112
候选搜索结果项五      1.698      2.054      1.587
则排序装置3根据排序规则的规定,计算各候选搜索结果项相关度、重要度及真实热门度之和,并根据该相加之和对个候选搜索结果项进行排序所得的排序结果为:
候选搜索结果项二;
候选搜索结果项三;
候选搜索结果项一;
候选搜索结果项五;
候选搜索结果项四。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于第一预定规则,根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得排序结果的实现方式,例如,改变根据真实热门度来调整所述初始排序结果的规则,或者,当真实热门度以值的形式表征时,根据真实热门度的值来调整所述初始排序结果,或者,对各现有因素及真实热门度进行加权,然后将加权后的各现有因素及真实热门度进行相乘或取均值等其他处理方式来获得用于排序的值等,均应包含在本发明的范围内。
作为本发明的优选方案之一,第二获取装置还进一步包括信息单元获取装置(图未示)及搜索结果获取装置(图未示)。
信息单元获取装置获取所述输入序列所包含的信息单元。
具体地,信息单元获取装置获得该信息单元的方式包括但不限于:
1)信息单元获取装置对所述输入序列进行切分,以获得切词单元作为信息单元;
2)信息单元获取装置提取所述输入序列的n-gram片段,以将该n-gram片段作为信息单元。
进一步地,信息单元获取装置还可去除通过上述两种方法所得的切词单元或n-gram片段中的无效信息,以将剩余的切词单元或n-gram片段作为信息单元。
搜索结果获取装置根据所述信息单元来获取所述候选搜索结果项。
具体地,搜索结果获取装置先根据信息单元来获取候选搜索结果项,再将基于信息单元所得的候选搜索结果项作为该信息单元所属的输入序列的候选搜索结果项。其中,搜索结果获取装置根据信息单元来获取候选搜索结果项的方式与第二获取装置2根据输入序列来获取候选搜索结果项的方式相同或相似,在此不再赘述。
作为本发明的优选方案之一,搜索装置还包括更新装置(图未示)、实时获取装置(图未示)及查询装置(图未示)。
更新装置根据所述输入序列及其对应的候选搜索结果项排序结果,来建立或更新排序索引信息。
其中,所述排序索引信息包括以下任一种索引信息:
1)输入序列、与该输入序列对应的候选搜索结果项及该候选搜索结果项在该输入序列下的排序位置;
具体地,更新装置根据排序装置3获得的排序结果,直接建立或更新输入序列、与该输入序列对应的候选搜索结果项及该候选搜索结果项在该输入序列下排序位置的索引信息。
2)输入序列、与该输入序列对应的候选搜索结果项及该候选搜索结果项在该输入序列下的排序位置调整信息;
具体地,更新装置根据排序装置3获得的排序结果中包含的真实热门度或其他现有因素的等级或权重值,来获取该输入序列下该候选搜索结果项的排序位置调整信息,例如,加权信息或降权信息等,以建立或更新输入序列、与该输入序列对应的候选搜索结果项及该候选搜索结果项在该输入序列下排序位置调整信息的索引信息。
实时获取装置实时获取来自用户的输入序列。
查询装置根据所述实时获取的输入序列,在所述排序索引信息中进行匹配查询,以获得该实时获取的输入序列对应的排序结果。
具体地,查询装置直接根据排序索引信息中包含的输入序列、与该输入序列对应的候选搜索结果项及该候选搜索结果项在该输入序列下的排序位置,直接查询得到该输入序列的排序结果。
或者,查询装置根据排序索引信息中包含的输入序列、与该输入序列对应的候选搜索结果项及该候选搜索结果项在该输入序列下的排序位置调整信息,对候选搜索结果项进行处理,以得到该输入序列的排序结果。
优选地,本发明还包括选择装置,该选择装置根据所述排序结果,由所述候选搜索结果项中选择用于呈现给用户的搜索结果项。
具体地,选择装置根据用户行为及需要呈现的候选搜索结果项的数量,来由候选搜索结果项中选择用于呈现给用户的搜索结果项。
图5为本发明一个优选实施例的用于基于用户行为来改善搜索结果的搜索装置结构示意图。根据本实施例的搜索装置包括第一获取装置1、第二获取装置2及包含在排序装置3中的第一子排序装置31。
第一获取装置1及第二获取装置2已在参照图4所示的实施例中予以详述,并以引用的方式包含于此,不再赘述。
第一子排序装置31基于第一预定规则,根据所述真实热门度及其他排序相关信息,来对所述候选搜索结果项进行排序,以获得所述排序结果。
所述其他排序相关信息包括以下至少一项:
1)与所述候选搜索结果项有关的其他用户行为信息;
其中,该其他用户行为信息可由搜索装置或其他装置获取,并且第一子排序装置31能够以通信连接或其他连接方式来获得其他装置所获取的该其他用户行为信息,该其他用户行为信息包括以下至少一项:
i)所述候选搜索结果项与所述输入序列相对应的展现时间;
该展现时间表示候选搜索结果项在用户面前所展现的时间。具体地,当该候选搜索结果项通过浏览器展现时,该展现时间表示从浏览器生成页面至用户更新该页面中的候选搜索结果项或关闭该页面的时间;当该候选搜索结果项通过客户端展现时,该展现时间表示从客户端生成展现页面至用户更新该展现页面中的候选搜索结果项或关闭该页面的时间;当该候选搜索结果项通过输入法候选栏展现时,该展现时间表示该候选搜索结果项在该输入法候选栏中展现的时间。
ii)所述候选搜索结果项在页面中的展现位置;
该展现位置包括候选搜索结果项在展现给用户时,在网页页面、客户端页面、或输入法候选栏中所处的位置。例如,对于网页和客户端页面,该展现位置包括上部、左部、右部、下部、中部、标题处、正文处、侧边栏处等等,对于输入法候选栏,该展现位置包括位于输入法候选栏中的第几个选项等等。
iii)所述候选搜索结果项对应的资源与所述输入序列相对应的浏览时间;
该浏览时间表示用户选择该候选搜索结果项后,对其进行浏览的时间长度。例如,对于以浏览器或客户端呈现候选搜索结果项的方式,该浏览时间可根据用户通过点击或键盘选择行为打开该候选搜索结果项对应的资源后,浏览该资源的时间;其中,可通过该资源展现的时间来获得所述浏览时间,例如,若该资源为网页,则将所获取的该网页的存在时间作为用户浏览时间等。
具体地,第一子排序装置31根据其他用户行为信息中的至少一项来调节基于第一预定规则,并根据所述真实热门度所得的排序结果;或者,第一子排序装置31直接基于第一预定规则所参考的现有因素、真实热门度及其他用户行为信息来获得排序结果。
其中,候选搜索结果项展现时间越长,其排序越靠前;候选搜索结果项展现位置越远离用户关注区,且其被用户选择,则其排序越靠前,其中,该用户关注区由预设得到,例如,预设页面中部和标题、输入法候选栏第一项为用户关注区等;候选搜索结果项浏览时间越长,其排序越靠前。第一子排序装置31可根据所获得的展现时间、展现位置及浏览时间的信息中的任一项或任若干项,来分别判断该展现时间、展现位置及浏览时间所属的调节等级,并根据该调节等级来调整前述排序结果,该根据调节等级来调节排序结果的方式,与参照图1所示实施例中根据真实热门度来调节初始排序结果的方式相同或相似,并以引用的方式包含于此,不再赘述;或者,搜索装置根据所获得的展现时间、展现位置及浏览时间的信息中的任一项或任若干项,来分别确定该展现时间、展现位置及浏览时间对应的单项权重值,并根据该单项权重值来获得排序结果,该方式将在后续实施例中予以详述,在此不再赘述。
2)用户相关信息;
其中,用户身份可根据用户的注册信息;用户设备的识别码,例如,手机号或硬件哈希值等;用户的临时记录信息,例如,用户cookie等来识别。所述用户相关信息包括以下至少一项:
i)用户的个人属性;
该个人属性包括但不限于由注册用户主动提供或根据所记录的用户行为推测得到的用户年龄、性别、职业、收入、教育程度等信息。第一子排序装置31根据用户的个人属性,来调整排序结果。例如,若用户为女性,则将类别为“购物”的候选搜索结果项排序位置提前等。其中,候选搜索结果项的类别通过预设信息得到。
ii)用户的偏好设置;
第一子排序装置31根据用户的偏好设置,来调整排序结果。例如,若偏好设置中包括将“军事”类别的候选搜索结果项提前的设置。则第一子排序装置31根据该偏好设置,将排序结果中“军事”类别的候选搜索结果项排序位置提前等。
iii)用户的环境信息;
该环境信息包括时间信息及位置信息。其中,该时间信息可通过用户设备的当前时间获得,该位置信息可根据用户设备当前的位置信息,例如,IP地址或手机漫游区域等信息获得。第一子排序装置31根据该环境信息,来调整排序结果。例如,若第一子排序装置31分析得到用户当前的IP地址为上海,且用户输入序列为“天气预报”,则将上海地区的天气预报排序位置提前等。
iv)用户的历史行为记录;
该用户的历史行为记录包括但不限于:用户的点击行为、用户的浏览行为等。第一子排序装置31根据用户的历史行为记录,来调整排序结果。例如,若历史行为记录中包括用户在输入序列“天气预报”时选择上海地区的天气预报的记录,则当获取到该用户的输入序列为“天气预报”时,将上海地区的天气预报排序位置提前等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于第一预定规则,根据所述真实热门度及其他排序相关信息,来对所述候选搜索结果项进行排序,以获得所述排序结果的实现方式,均应包含在本发明的范围内。
图6为本发明另一个优选实施例的用于基于用户行为来改善搜索结果的搜索装置结构示意图。根据本实施例的搜索装置,包括第一获取装置1、第二获取装置2及排序装置3。其中,排序装置3进一步包括权重获取装置32及第二子排序装置33。
第一获取装置1及第二获取装置2已在参照图4所示实施例中予以详述,并以引用的方式包含于此,不再赘述。
本实施例中,第一预定规则进一步包括权重排序规则。
权重获取装置32基于所述权重排序规则,根据所述真实热门度及所述其他排序相关信息,来获得所述候选搜索结果项在该输入序列下的权重值。
具体地,所述权重排序规则参考现有因素、真实热门度及其他相关排序信息来确定所述权重值。其中,该现有因素、真实热门度及其他排序相关信息已在参照图4或图5所示实施例中予以详述,并以引用的方式包含于此,不再赘述。该权重排序规则进一步包括以下任一种规则:
1)将现有因素、真实热门度或其他排序相关信息中任一者对应的单项权重值作为初始权重值,接着,根据其他两者对应的单项权重值来调整该初始权重值,以获得前述权重值。
例如,根据权重排序规则,权重获取装置32将现有因素对应的单项权重值作为初始权重值,接着,根据真实热门度及其他排序相关信息对应的单项权重值与现有因素对应的单项权重值的差值大小所属的预定范围,来确定该初始权重值的上调或下调幅度等。其中,本领域技术人员应可根据实际情况和需求来确定该预定范围。例如,若真实热门度及其他排序相关信息对应的单项权重值均大于现有因素对应的单项权重值,且差值属于一预定范围0.2至0.4之间,则将初始权重值上调0.1等。
其中,本领域技术人员应可根据实际情况确定现有因素的单项权重值,在此不再赘述。
真实热门度对应的单项权重值根据所述候选搜索结果项与所述输入序列相对应的相对点击率、所述候选搜索结果项与所述输入序列相对应的用户推荐数及所述候选搜索结果项与所述输入序列相对应的用户收藏数中至少一项来获得。例如,权重获取装置32直接将相对点击率、推荐数或收藏数对应的值作为真实热门度的权重值;又例如,权重获取装置32将相对点击率、推荐数及收藏数分别进行归一化后相加,并将所得的和作为真实热门度对应的权重值等。本领域技术人员应理解,真实热门度对应的单项权重值的获取方式不以上述举例为限。
其他排序相关信息对应的单项权重值根据该其他排序相关信息所包含一种或多种信息来获得。例如,权重获取装置32直接将其他用户行为信息中各项对应的值中的任一种作为其他排序相关信息的权重值;又例如,权重获取装置32将其他用户行为信息各项对应的值分别进行归一化,并获取各归一化后的值的平均值来作为其他排序相关信息对应的单项权重值等。本领域技术人员应理解,其他排序相关信息对应的单项权重值的获取方式不以上述举例为限。
2)直接根据现有因素、真实热门度或其他排序相关信息中至少一者对应的单项权重值来获得前述权重值。
例如,权重排序规则规定现有因素、真实热门度或其他排序相关信息的加权系数分别为0.8、1.2及1.1,并规定将各单项权重值乘以相应的加权系数后相加以获得权重值。则搜索装置将各单项权重值分别乘以相应的加权系数后相加,并将相加所得的和作为权重值等。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于所述权重排序规则,根据所述真实热门度及所述其他排序相关信息,来获得所述候选搜索结果项在该输入序列下的权重值的实现方式,例如采用其他的权重调整方式或者采用其他的权重计算方式等,均应包含在本发明的范围内。
第二子排序装置33根据所述权重值来对所述候选搜索结果项进行排序,以获得所述排序结果。
具体地,第二子排序装置33按照权重值由高至低的顺序对候选搜索结果项进行排序,以获得排序结果。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (23)

1.一种计算机实现的用于基于用户行为来改善搜索结果的方法,其中,该方法包括以下步骤:
a获取来自用户的输入序列;
b根据所述输入序列来获取候选搜索结果项及其与所述输入序列相对应的真实热门度;
c根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得排序结果。
2.根据权利要求1所述的方法,其中,该方法还包括以下步骤:
-根据以下至少一项来确定候选搜索结果项在所述输入序列下相对应的所述真实热门度:
-所述候选搜索结果项与所述输入序列相对应的相对点击率;
-所述候选搜索结果项与所述输入序列相对应的用户推荐数;
-所述候选搜索结果项与所述输入序列相对应的用户收藏数。
3.根据权利要求1或2所述的方法,其中,所述步骤c包括以下步骤:
-基于第一预定规则,根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得所述排序结果;
其中,所述第一预定规则参考以下至少一项因素,来结合所述真实热门度以获得所述排序结果:
-所述输入序列与所述候选搜索结果项之间的相关度;
-所述候选搜索结果项的重要度。
4.根据权利要求3所述的方法,其中,所述步骤c还包括以下步骤:
-基于所述第一预定规则,根据所述真实热门度及其他排序相关信息,来对所述候选搜索结果项进行排序,以获得所述排序结果。
5.根据权利要求4所述的方法,其中,所述其他排序相关信息包括以下至少一项:
-与所述候选搜索结果项有关的其他用户行为信息;
-用户相关信息;
其中,该其他用户行为信息包括以下至少一项:
-所述候选搜索结果项与所述输入序列相对应的展现时间;
-所述候选搜索结果项在页面中的展现位置;
-所述候选搜索结果项对应的资源与所述输入序列相对应的浏览时间。
6.根据权利要求4或5所述的方法,其中,所述第一预定规则包括权重排序规则,所述步骤c包括以下步骤:
-基于所述权重排序规则,根据所述真实热门度及所述其他排序相关信息,来获得所述候选搜索结果项在该输入序列下的权重值;
-根据所述权重值来对所述候选搜索结果项进行排序,以获得所述排序结果。
7.根据权利要求5或6所述的方法,其中,所述用户相关信息包括以下至少一项:
-用户的个人属性;
-用户的偏好设置;
-用户的环境信息;
-用户的历史行为记录。
8.根据权利要求1至7中任一项所述的方法,其中,所述步骤b包括以下步骤:
-获取所述输入序列所包含的信息单元;
-根据所述信息单元来获取所述候选搜索结果项。
9.根据权利要求1至8中任一项所述的方法,其中,该方法还包括以下步骤:
-根据所述输入序列及其对应的候选搜索结果项排序结果,来建立或更新排序索引信息。
10.根据权利要求9所述的方法,其中,该方法还包括以下步骤:
-实时获取来自用户的输入序列;
-根据所述实时获取的输入序列,在所述排序索引信息中进行匹配查询,以获得该实时获取的输入序列对应的排序结果。
11.根据权利要求1至10中任一项所述的方法,其中,该方法还包括以下步骤:
-根据所述排序结果,由所述候选搜索结果项中选择用于呈现给用户的搜索结果项。
12.一种用于基于用户行为来改善搜索结果的搜索装置,其中,该搜索装置包括:
第一获取装置、用于获取来自用户的输入序列;
第二获取装置、用于根据所述输入序列来获取候选搜索结果项及其在所述输入序列下对应的真实热门度;
排序装置、用于根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得排序结果。
13.根据权利要求12所述的搜索装置,其中,该搜索装置还包括:
确定装置、用于根据以下至少一项来确定候选搜索结果项在所述输入序列下相对应的所述真实热门度:
-所述候选搜索结果项与所述输入序列相对应的相对点击率;
-所述候选搜索结果项与所述输入序列相对应的用户推荐数;
-所述候选搜索结果项与所述输入序列相对应的用户收藏数。
14.根据权利要求12或13所述的搜索装置,其中,所述排序装置还用于:
基于第一预定规则,根据所述真实热门度,来对所述候选搜索结果项进行排序,以获得所述排序结果;
其中,所述第一预定规则参考以下至少一项因素,来结合所述真实热门度以获得所述排序结果:
-所述输入序列与所述候选搜索结果项之间的相关度;
-所述候选搜索结果项的重要度。
15.根据权利要求14所述的搜索装置,其中,所述排序装置还包括:
第一子排序装置、用于基于所述第一预定规则,根据所述真实热门度及其他排序相关信息,来对所述候选搜索结果项进行排序,以获得所述排序结果。
16.根据权利要求15所述的搜索装置,其中,所述其他排序相关信息包括以下至少一项:
-与所述候选搜索结果项有关的其他用户行为信息;
-用户相关信息;
其中,该其他用户行为信息包括以下至少一项:
-所述候选搜索结果项与所述输入序列相对应的展现时间;
-所述候选搜索结果项在页面中的展现位置;
-所述候选搜索结果项对应的网络资源与所述输入序列相对应的浏览时间。
17.根据权利要求15或16所述的搜索装置,其中,所述第一预定规则包括权重排序规则,所述排序装置包括:
权重获取装置、用于基于所述权重排序规则,根据所述真实热门度及所述其他排序相关信息,来获得所述候选搜索结果项在该输入序列下的权重值;
第二子排序装置、用于根据所述权重值来对所述候选搜索结果项进行排序,以获得所述排序结果。
18.根据权利要求16或17所述的搜索装置,其中,所述用户相关信息包括以下至少一项:
-用户的个人属性;
-用户的偏好设置;
-用户的环境信息;
-用户的历史行为记录。
19.根据权利要求12至18中任一项所述的搜索装置,其中,所述第二获取装置包括:
信息单元获取装置、用于获取所述输入序列所包含的信息单元;
搜索结果获取装置、用于根据所述信息单元来获取所述候选搜索结果项。
20.根据权利要求12至19中任一项所述的搜索装置,其中,该搜索装置还包括:
更新装置、用于根据所述输入序列及其对应的候选搜索结果项排序结果,来建立或更新排序索引信息。
21.根据权利要求20所述的搜索装置,其中,该搜索装置还包括:
实时获取装置、用于实时获取来自用户的输入序列;
查询装置、用于根据实时获取的输入序列,在所述排序索引信息中进行匹配查询,以获得该实时获取的输入序列对应的排序结果。
22.根据权利要求12至21中任一项所述的搜索装置,其中,该搜索装置还包括:
选择装置、用于根据所述排序结果,由所述候选搜索结果项中选择用于呈现给用户的搜索结果项。
23.一种计算机设备,其中,该计算机设备包括根据权利要求12至22中至少一项所述的搜索装置。
CN201010612415.6A 2010-12-20 2010-12-20 用于基于用户行为来改善搜索结果的方法、装置和设备 Active CN102073699B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010612415.6A CN102073699B (zh) 2010-12-20 2010-12-20 用于基于用户行为来改善搜索结果的方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010612415.6A CN102073699B (zh) 2010-12-20 2010-12-20 用于基于用户行为来改善搜索结果的方法、装置和设备

Publications (2)

Publication Number Publication Date
CN102073699A true CN102073699A (zh) 2011-05-25
CN102073699B CN102073699B (zh) 2016-03-02

Family

ID=44032238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010612415.6A Active CN102073699B (zh) 2010-12-20 2010-12-20 用于基于用户行为来改善搜索结果的方法、装置和设备

Country Status (1)

Country Link
CN (1) CN102073699B (zh)

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102419773A (zh) * 2011-12-13 2012-04-18 百度在线网络技术(北京)有限公司 一种用于对资源项进行排序的方法、装置和设备
CN102841904A (zh) * 2011-06-24 2012-12-26 阿里巴巴集团控股有限公司 一种搜索方法及设备
CN102902755A (zh) * 2012-09-21 2013-01-30 北京百度网讯科技有限公司 一种对检索结果项的排序进行调整的方法及装置
CN102955829A (zh) * 2011-08-30 2013-03-06 北京百度网讯科技有限公司 用于对资源项进行排序的方法、装置和设备
CN102982164A (zh) * 2012-12-07 2013-03-20 北京奇虎科技有限公司 一种浏览器页面呈现方法和浏览器
CN103136351A (zh) * 2013-02-25 2013-06-05 Tcl集团股份有限公司 一种媒体系统的媒体文件推送方法及媒体系统
CN103235799A (zh) * 2013-04-15 2013-08-07 百度在线网络技术(北京)有限公司 调整移动终端的互联网内容项的展现顺序的方法和系统
CN103365870A (zh) * 2012-03-29 2013-10-23 腾讯科技(深圳)有限公司 搜索结果排序的方法和系统
CN103440286A (zh) * 2013-08-14 2013-12-11 北京百度网讯科技有限公司 一种基于搜索结果来提供推荐信息的方法及装置
CN103514178A (zh) * 2012-06-18 2014-01-15 阿里巴巴集团控股有限公司 一种基于点击率的搜索排序方法及装置
CN103649914A (zh) * 2011-06-06 2014-03-19 国际商业机器公司 对于云计算选项的自动推荐
CN103810214A (zh) * 2012-11-14 2014-05-21 腾讯科技(深圳)有限公司 搜索页面的频率信息显示方法及装置
CN103942337A (zh) * 2014-05-08 2014-07-23 北京航空航天大学 一种基于图像识别与匹配的视频搜索系统
CN103984757A (zh) * 2014-05-29 2014-08-13 北京奇虎科技有限公司 在搜索结果页上插入新闻信息条目的方法和系统
CN104008170A (zh) * 2014-05-30 2014-08-27 广州金山网络科技有限公司 搜索结果的提供方法和装置
CN104050243A (zh) * 2014-05-28 2014-09-17 黄斌 一种将搜索与社交相结合的网络搜索方法及其系统
CN104199982A (zh) * 2014-09-25 2014-12-10 北京金山安全软件有限公司 一种对搜索关键词进行显示的方法及装置
CN104391847A (zh) * 2014-05-22 2015-03-04 艺龙网信息技术(北京)有限公司 一种基于用户行为的酒店排序方法、云端服务器及系统
CN104424291A (zh) * 2013-09-02 2015-03-18 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
CN104572717A (zh) * 2013-10-18 2015-04-29 腾讯科技(深圳)有限公司 信息搜索方法和装置
CN104750713A (zh) * 2013-12-27 2015-07-01 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
CN105045835A (zh) * 2015-06-30 2015-11-11 百度在线网络技术(北京)有限公司 信息搜索方法和装置
US9262513B2 (en) 2011-06-24 2016-02-16 Alibaba Group Holding Limited Search method and apparatus
CN105335415A (zh) * 2014-08-04 2016-02-17 北京搜狗科技发展有限公司 基于输入预测的搜索方法和输入法系统
CN105512156A (zh) * 2014-10-20 2016-04-20 腾讯科技(深圳)有限公司 点击模型生成方法和装置
WO2017054330A1 (zh) * 2015-09-29 2017-04-06 百度在线网络技术(北京)有限公司 资源组合处理方法、装置、设备及计算机存储介质
CN106682216A (zh) * 2016-12-30 2017-05-17 深圳市空谷幽兰人工智能科技有限公司 一种基于多源信息进行候选集排序的方法和设备
CN108108380A (zh) * 2016-11-25 2018-06-01 阿里巴巴集团控股有限公司 搜索排序方法、搜索排序装置、搜索方法和搜索装置
CN109597941A (zh) * 2018-12-12 2019-04-09 拉扎斯网络科技(上海)有限公司 排序方法及装置、电子设备和存储介质
CN110083253A (zh) * 2018-01-25 2019-08-02 北京搜狗科技发展有限公司 一种输入方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101055587A (zh) * 2007-05-25 2007-10-17 清华大学 一种基于用户行为信息的搜索引擎检索结果重排序方法
CN101206647A (zh) * 2006-12-20 2008-06-25 叶克 一种关于商品热门度量及利用颜色表现和搜索的方法
JP2010224705A (ja) * 2009-03-23 2010-10-07 Hitachi Software Eng Co Ltd ログ検索システム
CN101887437A (zh) * 2009-05-12 2010-11-17 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101206647A (zh) * 2006-12-20 2008-06-25 叶克 一种关于商品热门度量及利用颜色表现和搜索的方法
CN101055587A (zh) * 2007-05-25 2007-10-17 清华大学 一种基于用户行为信息的搜索引擎检索结果重排序方法
JP2010224705A (ja) * 2009-03-23 2010-10-07 Hitachi Software Eng Co Ltd ログ検索システム
CN101887437A (zh) * 2009-05-12 2010-11-17 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103649914A (zh) * 2011-06-06 2014-03-19 国际商业机器公司 对于云计算选项的自动推荐
CN103649914B (zh) * 2011-06-06 2016-12-07 国际商业机器公司 对于云计算选项的自动推荐
CN102841904A (zh) * 2011-06-24 2012-12-26 阿里巴巴集团控股有限公司 一种搜索方法及设备
US9262513B2 (en) 2011-06-24 2016-02-16 Alibaba Group Holding Limited Search method and apparatus
CN102841904B (zh) * 2011-06-24 2016-05-04 阿里巴巴集团控股有限公司 一种搜索方法及设备
CN102955829A (zh) * 2011-08-30 2013-03-06 北京百度网讯科技有限公司 用于对资源项进行排序的方法、装置和设备
CN102955829B (zh) * 2011-08-30 2017-11-03 北京百度网讯科技有限公司 用于对资源项进行排序的方法、装置和设备
CN102419773B (zh) * 2011-12-13 2014-09-03 百度在线网络技术(北京)有限公司 一种用于对资源项进行排序的方法、装置和设备
CN102419773A (zh) * 2011-12-13 2012-04-18 百度在线网络技术(北京)有限公司 一种用于对资源项进行排序的方法、装置和设备
CN103365870B (zh) * 2012-03-29 2017-12-01 腾讯科技(深圳)有限公司 搜索结果排序的方法和系统
CN103365870A (zh) * 2012-03-29 2013-10-23 腾讯科技(深圳)有限公司 搜索结果排序的方法和系统
CN103514178A (zh) * 2012-06-18 2014-01-15 阿里巴巴集团控股有限公司 一种基于点击率的搜索排序方法及装置
CN102902755A (zh) * 2012-09-21 2013-01-30 北京百度网讯科技有限公司 一种对检索结果项的排序进行调整的方法及装置
CN103810214A (zh) * 2012-11-14 2014-05-21 腾讯科技(深圳)有限公司 搜索页面的频率信息显示方法及装置
CN103810214B (zh) * 2012-11-14 2018-03-13 腾讯科技(深圳)有限公司 搜索页面的频率信息显示方法及装置
CN102982164B (zh) * 2012-12-07 2016-08-03 北京奇虎科技有限公司 一种浏览器页面呈现方法和浏览器
CN102982164A (zh) * 2012-12-07 2013-03-20 北京奇虎科技有限公司 一种浏览器页面呈现方法和浏览器
CN103136351B (zh) * 2013-02-25 2017-04-19 Tcl集团股份有限公司 一种媒体系统的媒体文件推送方法及媒体系统
CN103136351A (zh) * 2013-02-25 2013-06-05 Tcl集团股份有限公司 一种媒体系统的媒体文件推送方法及媒体系统
CN103235799B (zh) * 2013-04-15 2015-12-02 百度在线网络技术(北京)有限公司 调整移动终端的互联网内容项的展现顺序的方法和系统
CN103235799A (zh) * 2013-04-15 2013-08-07 百度在线网络技术(北京)有限公司 调整移动终端的互联网内容项的展现顺序的方法和系统
CN103440286B (zh) * 2013-08-14 2017-12-26 北京百度网讯科技有限公司 一种基于搜索结果来提供推荐信息的方法及装置
CN103440286A (zh) * 2013-08-14 2013-12-11 北京百度网讯科技有限公司 一种基于搜索结果来提供推荐信息的方法及装置
CN104424291A (zh) * 2013-09-02 2015-03-18 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
CN104424291B (zh) * 2013-09-02 2018-12-21 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
CN104572717A (zh) * 2013-10-18 2015-04-29 腾讯科技(深圳)有限公司 信息搜索方法和装置
CN104572717B (zh) * 2013-10-18 2020-01-31 腾讯科技(深圳)有限公司 信息搜索方法和装置
CN104750713A (zh) * 2013-12-27 2015-07-01 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
CN103942337B (zh) * 2014-05-08 2017-08-18 北京航空航天大学 一种基于图像识别与匹配的视频搜索系统
CN103942337A (zh) * 2014-05-08 2014-07-23 北京航空航天大学 一种基于图像识别与匹配的视频搜索系统
CN104391847A (zh) * 2014-05-22 2015-03-04 艺龙网信息技术(北京)有限公司 一种基于用户行为的酒店排序方法、云端服务器及系统
CN104050243B (zh) * 2014-05-28 2019-05-28 北京立新盈企大数据技术股份有限公司 一种将搜索与社交相结合的网络搜索方法及其系统
CN104050243A (zh) * 2014-05-28 2014-09-17 黄斌 一种将搜索与社交相结合的网络搜索方法及其系统
CN103984757A (zh) * 2014-05-29 2014-08-13 北京奇虎科技有限公司 在搜索结果页上插入新闻信息条目的方法和系统
CN104008170B (zh) * 2014-05-30 2017-03-29 广州金山网络科技有限公司 搜索结果的提供方法和装置
CN104008170A (zh) * 2014-05-30 2014-08-27 广州金山网络科技有限公司 搜索结果的提供方法和装置
CN105335415A (zh) * 2014-08-04 2016-02-17 北京搜狗科技发展有限公司 基于输入预测的搜索方法和输入法系统
CN104199982B (zh) * 2014-09-25 2017-09-26 北京金山安全软件有限公司 一种对搜索关键词进行显示的方法及装置
CN104199982A (zh) * 2014-09-25 2014-12-10 北京金山安全软件有限公司 一种对搜索关键词进行显示的方法及装置
CN105512156A (zh) * 2014-10-20 2016-04-20 腾讯科技(深圳)有限公司 点击模型生成方法和装置
CN105512156B (zh) * 2014-10-20 2020-02-07 腾讯科技(深圳)有限公司 点击模型生成方法和装置
CN105045835B (zh) * 2015-06-30 2019-06-04 百度在线网络技术(北京)有限公司 信息搜索方法和装置
CN105045835A (zh) * 2015-06-30 2015-11-11 百度在线网络技术(北京)有限公司 信息搜索方法和装置
US10521437B2 (en) 2015-09-29 2019-12-31 Baidu Online Network Technology (Beijing) Co., Ltd. Resource portfolio processing method, device, apparatus and computer storage medium
WO2017054330A1 (zh) * 2015-09-29 2017-04-06 百度在线网络技术(北京)有限公司 资源组合处理方法、装置、设备及计算机存储介质
CN108108380A (zh) * 2016-11-25 2018-06-01 阿里巴巴集团控股有限公司 搜索排序方法、搜索排序装置、搜索方法和搜索装置
CN106682216A (zh) * 2016-12-30 2017-05-17 深圳市空谷幽兰人工智能科技有限公司 一种基于多源信息进行候选集排序的方法和设备
CN106682216B (zh) * 2016-12-30 2020-06-19 广东惠禾科技发展有限公司 一种基于多源信息进行候选集排序的方法和设备
CN110083253A (zh) * 2018-01-25 2019-08-02 北京搜狗科技发展有限公司 一种输入方法和装置
CN109597941A (zh) * 2018-12-12 2019-04-09 拉扎斯网络科技(上海)有限公司 排序方法及装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN102073699B (zh) 2016-03-02

Similar Documents

Publication Publication Date Title
CN102073699B (zh) 用于基于用户行为来改善搜索结果的方法、装置和设备
CN102982042B (zh) 一种个性化内容推荐方法、平台以及系统
CN103886090B (zh) 基于用户喜好的内容推荐方法及装置
CN105893609B (zh) 一种基于加权混合的移动app推荐方法
CN101551806B (zh) 一种个性化网址导航的方法和系统
JP5328212B2 (ja) レコメンド情報評価装置およびレコメンド情報評価方法
CN102999586B (zh) 一种网站推荐的方法和装置
CN102609473B (zh) 一种网站访问方法及系统
CN106686063A (zh) 一种信息推荐方法、装置及电子设备
CN105488233A (zh) 阅读信息推荐方法和系统
CN105701216A (zh) 一种信息推送方法及装置
CN101111837A (zh) 查询自动分类的搜索处理
CN103890761A (zh) 自动生成推荐的方法和装置
CN102968413A (zh) 一种用于提供搜索结果的方法与设备
CN104423621A (zh) 拼音字符串处理方法和装置
CN101382954A (zh) 提供网址收藏名称的方法及系统
CN102364467A (zh) 一种网络搜索方法和系统
KR101694727B1 (ko) 인공 지능 기반 연관도 계산을 이용한 노트 제공 방법 및 장치
CN103106234A (zh) 一种网页内容搜索方法和装置
JP5048852B2 (ja) 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
CN103425767B (zh) 一种提示数据的确定方法和系统
JP2010181966A (ja) レコメンド情報評価装置およびレコメンド情報評価方法
KR101866411B1 (ko) 문서 추천 정보를 제공하는 방법 및 이를 이용하는 문서 추천 정보 제공 장치
KR20180088153A (ko) 관심도 높은 단어를 검색어로 추천하는 문장완성형 검색시스템 및 방법
Wang et al. A personalization-oriented academic literature recommendation method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20110525

Assignee: Beijing small mutual Entertainment Technology Co., Ltd.

Assignor: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Contract record no.: 2017990000087

Denomination of invention: Method, device and equipment for improving search result based on user behaviors

Granted publication date: 20160302

License type: Exclusive License

Record date: 20170315

EE01 Entry into force of recordation of patent licensing contract