CN102056335B - 移动搜索方法、装置和系统 - Google Patents

移动搜索方法、装置和系统 Download PDF

Info

Publication number
CN102056335B
CN102056335B CN200910220810.7A CN200910220810A CN102056335B CN 102056335 B CN102056335 B CN 102056335B CN 200910220810 A CN200910220810 A CN 200910220810A CN 102056335 B CN102056335 B CN 102056335B
Authority
CN
China
Prior art keywords
search
interest model
information
long
score value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200910220810.7A
Other languages
English (en)
Other versions
CN102056335A (zh
Inventor
胡汉强
杜家春
顾翀
贾江涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN200910220810.7A priority Critical patent/CN102056335B/zh
Priority to PCT/CN2010/077773 priority patent/WO2011054245A1/zh
Publication of CN102056335A publication Critical patent/CN102056335A/zh
Priority to US13/464,391 priority patent/US8983971B2/en
Application granted granted Critical
Publication of CN102056335B publication Critical patent/CN102056335B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明实施例提供一种移动搜索方法、装置和系统。一个移动搜索方法包括:接收搜索请求,所述搜索请求中携带所需搜索的关键词信息以及所述搜索应用服务器获取的即时兴趣模型和长期兴趣模型;根据所述搜索请求、各成员引擎的元索引信息以及所述即时兴趣模型和长期兴趣模型,计算所述成员引擎的相关度评分值;根据所述相关度评分值选择一个或多个成员引擎对所述关键词信息进行搜索。本发明实施例,在对关键词信息进行搜索时,可以结合用户的即时兴趣模型和长期兴趣模型,从而为用户提供满足需求的、个性化的以及精确度高的搜索结果信息。

Description

移动搜索方法、装置和系统
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种移动搜索方法、装置和系统。
背景技术
随着增值业务的不断发展,移动搜索业务也随之快速发展。移动搜索中一个很重要的技术亮点是精确搜索,即需要提供给用户个性化且精度较高的搜索服务。移动搜索框架是一个基于元搜索的平台,该平台整合了许多专业/垂直搜索引擎的能力,为用户提供一个全新的、综合的搜索能力。
在现有技术中,开放移动联盟(Open Mobile Alliance,以下简称:OMA)移动搜索框架包括:搜索应用服务器、搜索服务器、搜索客户端和数据源。在进行移动搜索时,搜索客户端将搜索请求发给搜索应用服务器,搜索应用服务器提取上下文信息并做查询分类,然后将搜索请求发给搜索服务器,搜索服务器将搜索请求分发给成员引擎,成员引擎在完成搜索后将搜索结果反馈给搜索服务器,搜索服务器再将搜索结果反馈给搜索应用服务器,最后搜索应用服务器将最终的搜索结果返回给搜索客户端。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有基于OMA移动搜索框架的移动搜索,其个性化程度不高,无法满足用户对搜索精度的需求。
发明内容
本发明实施例提供一种移动搜索方法、装置和系统。
本发明实施例提供一种移动搜索方法,包括:
接收搜索请求,所述搜索请求中携带所需搜索的关键词信息以及所述搜索应用服务器获取的即时兴趣模型和长期兴趣模型;
根据所述搜索请求、各成员引擎的元索引信息以及所述即时兴趣模型和长期兴趣模型,计算所述成员引擎的相关度评分值;
根据所述相关度评分值选择一个或多个成员引擎对所述关键词信息进行搜索。
本发明实施例另提供一种移动搜索方法,包括:
向一个或多个成员引擎发送搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型;
接收所述一个或多个成员引擎根据所述关键词信息、所述即时兴趣模型和长期兴趣模型获取的搜索结果信息以及与所述搜索结果信息对应的评分信息;
根据所述评分信息和相关因素信息对所述搜索结果信息进行重新评分排序,获取重新评分排序后的搜索结果信息,并将所述重新评分排序后的搜索结果信息发送给所述搜索应用服务器。
本发明实施例再提供一种移动搜索方法,包括:
接收搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型;
接收成员引擎根据所述关键词信息搜索获取的搜索结果信息,并根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理;
将评分排序处理后的搜索结果信息以及相应的评分信息发送给所述搜索应用服务器。
本发明实施例又提供一种移动搜索方法,包括:
接收搜索请求,所述搜索请求中携带即时兴趣模型和长期兴趣模型;
根据所述搜索请求进行搜索获取搜索结果信息,并根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理;
返回评分排序处理后的搜索结果信息。
本发明实施例还提供一种移动搜索方法,包括:
接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息;
从用户数据库中提取即时兴趣模型和长期兴趣模型;
向搜索服务器发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型,以使所述搜索服务器根据所述即时兴趣模型和长期兴趣模型对所述关键词信息进行搜索。
本发明实施例提供一种搜索服务器,包括:
第一接收模块,用于接收搜索请求,所述搜索请求中携带所需搜索的关键词信息以及所述搜索应用服务器获取的即时兴趣模型和长期兴趣模型;
第一处理模块,用于根据所述搜索请求、各成员引擎的元索引信息以及所述即时兴趣模型和长期兴趣模型,计算所述成员引擎的相关度评分值;
第一搜索模块,用于根据所述相关度评分值选择一个或多个成员引擎对所述关键词信息进行搜索。
本发明实施例另提供一种搜索服务器,包括:
第二发送模块,用于向一个或多个成员引擎发送搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型;
第二接收模块,用于接收所述一个或多个成员引擎根据所述关键词信息、所述即时兴趣模型和长期兴趣模型获取的搜索结果信息以及与所述搜索结果信息对应的评分信息;
第二处理模块,用于根据所述评分信息和相关因素信息对所述搜索结果信息进行重新评分排序,获取重新评分排序后的搜索结果信息,并将所述重新评分排序后的搜索结果信息通过所述第二发送模块发送给所述搜索应用服务器。
本发明实施例再提供一种搜索服务器,包括:
第三接收模块,用于接收搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型;并接收成员引擎根据所述关键词信息搜索获取的搜索结果信息;
第三处理模块,用于根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理;
第三发送模块,用于将评分排序处理后的搜索结果信息以及相应的评分信息发送给所述搜索应用服务器。
本发明实施例提供一种成员引擎设备,包括:
第四接收模块,用于接收搜索请求,所述搜索请求中携带所需搜索的关键词信息以及即时兴趣模型和长期兴趣模型;
第四处理模块,用于根据所述搜索请求对所述关键词信息进行搜索获取搜索结果信息,并根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理;
第四发送模块,用于返回评分排序处理后的搜索结果信息。
本发明实施例提供一种搜索应用服务器,包括:
第五接收模块,用于接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息;
第五处理模块,用于从用户数据库中提取即时兴趣模型和长期兴趣模型;
第五发送模块,用于向搜索服务器发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型,以使所述搜索服务器根据所述即时兴趣模型和长期兴趣模型对所述关键词信息进行搜索。
本发明实施例提供一种移动搜索系统,包括:
第一搜索应用服务器,用于接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息;从用户数据库中提取即时兴趣模型和长期兴趣模型;向第一搜索服务器发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型;
第一搜索服务器,用于接收所述第一搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及所述第一搜索应用服务器获取的即时兴趣模型和长期兴趣模型;根据所述搜索请求、各成员引擎的元索引信息以及所述即时兴趣模型和长期兴趣模型,计算所述成员引擎的相关度评分值,根据所述相关度评分值从第一成员引擎设备中选择一个或多个成员引擎对所述关键词信息进行搜索;
第一成员引擎设备,用于接收所述第一搜索服务器发送的搜索请求,对所述关键词信息进行搜索,并将搜索结果信息发送给所述第一搜索服务器,以使所述第一搜索服务器通过所述第一搜索应用服务器将所述搜索结果信息反馈给所述搜索客户端。
本发明实施例另提供一种移动搜索系统,包括:
第二搜索应用服务器,用于接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息;从用户数据库中提取即时兴趣模型和长期兴趣模型;向第二搜索服务器发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型;
第二搜索服务器,用于向第二成员引擎设备发送搜索请求,所述搜索请求中携带所需搜索的关键词信息以及第二搜索应用服务器获取的即时兴趣模型和长期兴趣模型;接收所述第二成员引擎设备反馈的搜索结果信息以及与所述搜索结果信息对应的评分信息;根据所述评分信息和相关因素信息对所述搜索结果信息进行重新评分排序,获取重新评分排序后的搜索结果信息,并将所述重新评分排序后的搜索结果信息发送给所述第二搜索应用服务器;
第二成员引擎设备,用于接收所述第二搜索服务器发送的搜索请求,对所述关键词信息进行搜索,根据所述即时兴趣模型和长期兴趣模型获取搜索结果信息以及与所述搜索结果信息对应的评分信息,并将所述搜索结果信息以及评分信息发送给所述第二搜索服务器。
本发明实施例再提供一种移动搜索系统,包括:
第三搜索应用服务器,用于接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息;从用户数据库中提取即时兴趣模型和长期兴趣模型;向第三搜索服务器发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型;
第三搜索服务器,用于接收第三搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型;接收第三成员引擎设备根据所述关键词信息搜索获取的搜索结果信息,并根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理;并将评分排序处理后的搜索结果信息以及相应的评分信息发送给所述第三搜索应用服务器;
第三成员引擎设备,用于接收所述第三搜索服务器发送的搜索请求,对所述关键词信息进行搜索,获取所述搜索结果信息。
本发明实施例,在对关键词信息进行搜索时,可以结合用户的即时兴趣模型和长期兴趣模型,从而为用户提供满足需求的、个性化的以及精确度高的搜索结果信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明移动搜索方法实施例一的流程图;
图2为本发明移动搜索方法实施例二的信令流程图;
图3为本发明移动搜索方法实施例三的流程图;
图4为本发明移动搜索方法实施例四的流程图;
图5为本发明移动搜索方法实施例五的信令流程图;
图6为本发明移动搜索方法实施例六的流程图;
图7为本发明移动搜索方法实施例七的信令流程图;
图8为本发明移动搜索方法实施例八的流程图;
图9为本发明搜索服务器实施例一的结构示意图;
图10为本发明搜索服务器实施例二的结构示意图;
图11为本发明搜索服务器实施例三的结构示意图;
图12为本发明搜索服务器实施例四的结构示意图;
图13为本发明搜索服务器实施例五的结构示意图;
图14为本发明成员引擎设备实施例一的结构示意图;
图15为本发明成员引擎设备实施例二的结构示意图;
图16为本发明搜索应用服务器实施例的结构示意图;
图17为本发明移动搜索系统实施例一的结构示意图;
图18为本发明移动搜索系统实施例二的结构示意图;
图19为本发明移动搜索系统实施例三的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明移动搜索方法实施例一的流程图,如图1所示,本实施例的方法可以包括:
步骤101、接收搜索请求,所述搜索请求中携带所需搜索的关键词信息以及所述搜索应用服务器获取的即时兴趣模型和长期兴趣模型。
举例来说,搜索应用服务器可以根据搜索客户端发送的搜索请求消息,从用户数据库中获取用户的即时兴趣模型和长期兴趣模型。例如,从用户数据库,如用户的静态profile、搜索历史等信息中提取用户的长期兴趣模型,或者直接提取预先存储在用户数据库中的长期兴趣模型,并且搜索应用服务器还可以从与当前查询q(t)处于同一搜索上下文会话(Search Context Session)的查询序列q(1),...,q(t-1),q(t)的相关数据中提取用户的即时兴趣模型,所述搜索上下文会话为当前查询q(t)发生的前一段预设的时间,如半个小时,包括q(t)当前发生的时间。在提取即时兴趣模型和长期兴趣模型后,搜索应用服务器即可向搜索服务器发送搜索请求,从而使得搜索服务器可以根据该搜索请求中携带的用户的即时兴趣模型和长期兴趣模型对所需搜索的关键字信息进行搜索。
用户的兴趣模型可以用n个维度来表示如:新闻、体育、娱乐、财经、科技、房产、游戏、女性、论坛、天气、商品、家电、音乐、读书、博客、手机、军事、教育、旅游、彩信、彩铃、餐饮、民航、工业、农业、电脑、地理等。用户对每个维度的兴趣的评分值所组成的一个向量W(r1,r2,r3,......,rn)则为用户的兴趣模型。
如果兴趣模型W(r1,r2,r3,...,rn)中的各个维度的评分值ri是由用户的所有搜索历史数据和用户的静态档案profile计算得到,则兴趣模型W(r1,r2,r3,...rn)为用户的长期兴趣模型。如果兴趣模型W(r1,r2,r3,...,rn)中的各个维度的评分值ri是由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),...,q(t-1),q(t)的相关数据计算得到的,那么W(r1,r2,r3,...rn)为用户的即时兴趣模型,在此需要说明的是本发明实施例中的查询q(t)与搜索请求相对应,即每个搜索请求都会有一个查询q(t)。
步骤102、根据所述搜索请求、各成员引擎的元索引信息以及所述即时兴趣模型和长期兴趣模型,计算所述成员引擎的相关度评分值。
成员引擎是具体用于搜索关键词信息的服务器,成员引擎可以向搜索服务器上报其元索引信息。具体的,成员引擎的元索引信息为关于该成员引擎对应的数据库,子数据库,数据库或者子数据库中包含的文档或者记录,以及,该文档或者记录中包含的术语的统计数据。
元索引信息可以包括下述信息之一或者其任意组合:
术语最大归一化权重向量mnw=(mnw1,mnw2,...,mnwi,...mnwp),其中mnwi为术语ti相对于所述成员引擎对应的数据库或者子数据库中的所有文档的最大归一化权重;
术语平均归一化权重向量anw=(anw1,anw2,...,anwi......,anwp),其中anwi为术语ti相对于所述成员引擎对应的数据库或者子数据库中的所有文档的平均归一化权重;
数据库或者子数据库中的文档的兴趣模型最大归一化权重向量mnv=(mnv1,mnv2,......,mnvi,......,mnvn),其中mnvi为所述文档的兴趣模型的第i个维度相对于所述成员引擎对应的数据库或者子数据库中的所有文档的最大归一化权重;
数据库或者子数据库中的文档的兴趣模型平均归一化权重向量anv=(anv1,anv2,......,anvi,......,anvn),其中anvi为文档的兴趣模型的第i个维度相对于所述成员引擎对应的数据库或者子数据库中的所有文档的平均归一化权重;
术语ti相对于该数据库的全局反向文档频率gidfi,其中gidfi=1/dfi,dfi为该元索引对应的数据库中包含术语ti的文档的数量;
文档的兴趣模型第i个维度对应的全局反向文档频率IM_gidfi,其中IM_gidfi=1/IM_IDFi,IM_IDFi为数据库或者子数据库中包含的属于文档的兴趣模型的第i个维度的术语的文档的个数;
术语ti相对于该数据库的全局反向文档频率gidfi=log(n/(gdfi+1)),其中gdfi为所有成员引擎对应数据库或者子数据库中包含术语ti的文档的数量的总和,n为所有成员引擎所包含的所有文档数量的总和;或者,
文档的兴趣模型第i个维度对应的全局反向文档频率IM_gidfi=log(n/(IM_gdfi+1)),IM_gdfi为所有成员引擎对应的数据库或子数据库中包含属于文档的兴趣模型的第i个维度的术语的文档个数的总和,n为所有成员引擎所包含的所有文档数量的总和。
搜索服务器可以根据各成员引擎上报的元索引信息以及所述即时兴趣模型和长期兴趣模型,获取各成员引擎的选择结果信息。举例来说,搜索服务器可以将元索引信息与即时兴趣模型、长期兴趣模型以及查询请求分别进行匹配处理,并将选择匹配较好的成员引擎作为后续搜索关键词信息所使用的成员引擎,该选择结果信息可以为选择出的成员引擎的ID信息。选择出的成员引擎可以与用户的长期兴趣、即时兴趣以及所需搜索的关键词信息进行较好的匹配,从而使得搜索服务器可以将所需搜索的关键词交付给选择出的成员引擎进行搜索,从而获取较为精确的搜索结果信息。
步骤103、根据所述相关度评分值选择一个或多个成员引擎对所述关键词信息进行搜索。
搜索服务器在从各成员引擎中选择出所需使用的成员引擎后,即可向选择出的成员引擎发送搜索请求。
本实施例中,搜索服务器在请求成员引擎搜索关键词信息之前,可以根据用户的即时兴趣模型和长期兴趣模型对成员引擎进行选择,从而能够选择获取与关键词信息、即时兴趣模型和长期兴趣模型匹配较好的成员引擎对该关键词信息进行搜索,从而能够获取精度较高的搜索结果信息,进一步满足用户的搜索需求。
在本发明移动搜索方法另一个实施例中,所述即时兴趣模型可以为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),...,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间。
具体来说,本实施例可以应用条件随机场(Conditional Random Field,以下简称:CRF)模型计算在给定与当前查询q(t)处于同一搜索上下文会话(Search Context Session)的查询序列q(1),....q(t-1),q(t)的条件下,当前查询q(t)的输出类型的条件概率,把该条件概率值作为即时兴趣模型与该输出类型对应的兴趣维度的评分值。
举例来说,本实施例可以定义G=(V,E)为一个无向图,Y={Yv|v∈V}.即V中的每个节点对应一个随机变量所表示的标记序列的成分Yv,如果每个随机量Yv对于G遵守马尔可夫属性,那么(X,Y)就是一个条件随机场,而且在给定X和所有其他随机变量Y{u|u≠v,{u,v}∈V}的条件下,随机变量Yv的概率P(Yv|X,Yu,u≠v,{u.v}∈V)即等于P(Yv|X,Yu,(u,v)∈E)。
根据马尔可夫属性和最大熵的原理,可以推导出条件随机场的经典条件概率公式:
给定观察序列x的前提下,观察序列的状态标记序列y的条件概率等于:
P θ ( y | x ) = 1 Z ( x ) exp ( Σ e ∈ E , k λ k f k ( e , y | e , x ) + Σ v ∈ V , k u k g k ( v , y | v , x ) )
其中,x为观察序列,y为标记状态序列,y|S为与子图S的顶点相关联的序列y的成分的集合,f,g为特征函数,λ,μ为特征函数的权重值,Z(x)为归一化因子。
给定处于同一session的查询序列q=q1,...,q(T-1),q(T),输出查询序列对应的类型序列C=c1,...cT-1,cT的条件概率:
令ci的取值空间为|C|,令c0=start,cT+1=end,将状态start、end加入|C|
p ( c | q ) = 1 Z ( q ) Π t = 1 T + 1 M t ( c t - 1 , c t | q ) ,
其中: Z ( q ) = Σ c Π t = 1 T + 1 M t ( c t - 1 , c t | q ) , 为归一化因子。
M t ( c t - 1 , c t | q ) = exp ( Σ k λ k f k ( c t - 1 , c t , q ) + Σ k u k g k ( c t , q ) )
定义一个|C|×|C|的矩阵:
Mt(q)=[Mt(ct-1,ct|q)]
那么Z(q)等于M1(q)*...MT(q)*MT+1(q)矩阵的(start,end)项。
Z ( q ) = Σ c Π t = 1 T + 1 M t ( c t - 1 , c t | q ) = Σ startc 1 . . . c T - 1 c T end Π t = 1 T + 1 M t ( c t - 1 , c t | q )
= ( Π t = 1 T + 1 M t ( q ) ) start , end
令θ=(λ1,.λ2,......;u1,.u2,......)
参数θ的确定:
给定训练数据 D = { ( q ( i ) , c ( i ) ) } i = 1 N 和经验分布
Figure G2009102208107D00125
训练数据的对数似然函数为:
L ( θ ) = Σ i = 1 N log P θ ( c ( i ) | q ( i ) )
∝ Σ q , c p ~ ( q , c ) log ( p θ ( c | q ) )
求θ使得L(θ)取得最大值。
本实施例可以用通用迭代算法(General Iterative Scaling,以下简称:GIS)算法求θ:
(a)求Efk、Egk
Ef k = Σ q , c p θ ( q , c ) f k ( q , c )
= Σ q , c p θ ( q ) p θ ( c | q ) f k ( q , c )
≈ Σ q , c p ~ ( q ) p θ ( c | q ) f k ( q , c )
= Σ q p ~ ( q ) Σ i = 1 T Σ c i - 1 c i ( p θ ( c i - 1 , c i | q ) f k ( c i - 1 , c i , q ) )
p θ ( c i - 1 , c i | q ) = Σ startc 1 . . . c i - 2 c i + 1 . . . c Tend p θ ( startc 1 , . . . , c T end | q )
= 1 Z ( q ) Σ startc 1 . . . c i - 2 c i + 1 . . . c Tend Π t = 1 T + 1 M t ( c t - 1 , c t | q )
= 1 Z ( q ) ( Σ startc 1 . . . c i - 2 Σ t = 1 i - 1 M t ( c t - 1 , c t | q ) ) M i ( c i - 1 , c i | q ) ( Σ C i + 1 . . . C T end Π t = i + 1 T + 1 M t ( c t - 1 , c t | q ) )
= 1 Z ( q ) ( ( Π t = 1 i - 1 M t ( q ) ) start , c i - 1 M i ( c i - 1 , c i | q ) ( Π t = i + 1 T + 1 M t ( q ) ) c i , end )
= 1 Z ( q ) α i - 1 ( c i - 1 | q ) M i ( c i - 1 , c i | q ) β i ( c i | q ) )
其中:
αi(q)为1×|C|向量,
αi(q)=αi-1Mi(q)
如果ct=start,α0(ct|q)=1
否则α0(ct|q)=0
β(i)为1x|C|向量,
β(i)T=Mi+1(q)β(i+1)T
如果ct=end βT+1(ct|q)=1
否则,βT+1(ct|q)=0
Eg k = Σ q , c p θ ( q , c ) g k ( q , c )
= Σ q , c p θ ( q ) p θ ( c | q ) g k ( q , c )
≈ Σ q , c p ~ ( q ) p θ ( c | q ) g k ( q , c )
= Σ q p ~ ( q ) Σ i = 1 T Σ c i p θ ( c i | q ) g k ( c i , q )
p θ ( c i | q ) = Σ c 1 . . . c i - 1 c i + 1 . . . c T p θ ( c 1 , . . . , c T | q )
= 1 Z ( q ) Σ c 1 . . . c i - 1 c i + 1 . . . c T Π t = 1 T M t ( c t - 1 , c t , q )
= 1 Z ( q ) ( Σ c 1 . . . c i - 1 Π t = 1 i M t ( c t - 1 , c t , q ) ) ( Σ c i + 1 . . . c T Π t = i + 1 T M t ( c t - 1 , c t , q ) )
= 1 Z ( q ) ( ( Π t = 1 i M t ( q ) ) start , c i ( Π t = i + 1 T + 1 M t ( q ) ) c i , end )
= 1 Z ( q ) α ( i ) β ( i )
(b)求
Figure G2009102208107D00144
E ~ f k = Σ q , c p ~ ( q , c ) f k ( q , c )
= Σ q , c p ~ ( q ) p ~ ( c | q ) f k ( q , c )
= Σ q p ~ ( q ) Σ i = 1 T Σ c i - 1 c i p ~ ( c i - 1 , c i | q ) f k ( c i - 1 , c i , q )
E ~ g k = Σ q , c p ~ ( q , c ) g k ( q , c )
= Σ q , c p ~ ( q ) p ~ ( c | q ) g k ( q , c )
= Σ q p ~ ( q ) Σ i = 1 T Σ c i p ~ ( c i | q ) g k ( c i , q )
(c)求迭代求λk、uk,直到λk、uk收敛:
δ λ k = 1 S 1 log E ~ f k E f k , 其中S1为大于1的常数,使得对任何q、c, Σ k = 0 n f k ( q , c ) = S 1
λk+1=λk+δλk
δ u k = 1 S 2 log E ~ g k E g k , 其中S2为大于1的常数,使得对任何q、c, Σ k = 0 n g k ( q , c ) = S 2
uk+1=uk+δuk
重复(a)、(b)、(c)步骤直到λk、uk收敛。
给定处于同一session查询序列q=q1,...,q(T-1),q(T),当前查询q(T)属于类型cT的条件概率:
p ( c T | q ) = Σ c 1 . . . c T - 1 p ( c | q )
= 1 Z ( q ) ( Σ startc 1 . . . c T - 1 Π t = 1 T + 1 M t ( c t - 1 , c t | q ) )
= 1 Z ( q ) ( Σ startc 1 . . . c T - 1 Π t = 1 T M t ( c t - 1 , c t | q ) ) M T + 1 ( c T , c end | q ) )
= 1 Z ( q ) ( ( Π t = 1 T M t ( q ) ) ) start , c T M T + 1 ( c T , c end | q )
= 1 Z ( q ) α T ( c T | q ) M T + 1 ( c T , c end | q )
把p(cT|q)作为即时兴趣模型类型为cT的对应维度的评分值。
本地特征函数gk的选取:
(1)给每个领域类型cT的所有主题词和相关词赋予一定的权重,由这些主题词和相关词的权重组成一个领域cT的向量,cT(t1,...,tn-1,tn)
cT中的词的权重的分配方法有两种,
一种是人工分配权重的方法:
cT的词的权重可以这样赋予:对于主题词赋予最大的权重,对于强相关词赋予中间大小的权重,对于弱相关词赋予最小权重。
比如:主题词(如餐饮领域cT的”川菜”)赋予权重1,强相关词(如餐饮领域cT的”辣”)赋予权重0.8,弱相关词(如餐饮领域cT的”香”)赋予权重0.5
另一种是通过学习自动分配权重的方法:
对每个领域cT收集一些有代表性的训练文本语料资料;
对语料样本进行切词,生存领域cT的词库;
计算领域cT中的词的权重,权重=TF×GIDF,其中TF为词在该领域cT所有语料中的词的总词频,GIDF为全局反向文档频率,GIDF=log(1+N/GDF),其中N为所有领域的所有文档的总数量,GDF为全局文档频率即为所有领域中包含该词的的所有文档的数量。
设置各个水平的阈值,如T1,T2,...,Tn,T1>T2>...>Tn
对领域cT词库中词根据其权重按上面阈值划分为多个档次的集合,Ti>总词频>Ti+1的为第个档次。
对各个档次的词分别赋予一定的最终评分值,第一档赋予最高评分值,中间档赋予中间大小的评分值,第n档赋予最小评分值。
由词库中的词及其最终评分值组成领域cT向量。
给搜索请求的关键字赋予一定的权重,组成一个Query的向量,Query(q1,q2,...qn’)。
(2)Query的关键字的权重可以这样赋予:
方法1:全部关键字赋予权重1;
方法2:排在最前面的关键字赋予最大权重(比如赋予权重1),排在中间的关键字赋予中间大小的权重(比如赋予0.5<权重<1),排在最后的关键字赋予最小权重(比如赋予权重0.5)。
(3)计算领域向量cT(t1,t2,...,tn)与查询向量qT(q1,q2,...,qn’)之间的Cousine相似度:
Sim ( q T ( q 1 , q 2 , . . . , qn , ) , c T ( t 1 , t 2 , . . . , tn ) )
= ( q 1 × t 1 + q 2 × t 2 + . . . . . . + qn × tn ) / ( q 1 2 + q 2 2 + . . . + qn 2 ×
t 1 2 + t 2 2 + . . . + tn 2 )
(4)g1(cT,qT)=sim(qT,cT);
(5)从搜索历史相关数据中收集查询q(t)的所有用户点击历史文档UT={uT},其中uT为查询qT对应的某个用户点击搜索结果文档的向量,计算uT与cT的cousine相似度:
sim ( c T ( t 1 , t 2 , . . . , tn ) , u T ( u 1 , u 2 , . . . , un ) )
= ( u 1 × t 1 + u 2 × t 2 + . . . . . . + un × tn ) / ( u 1 2 + u 2 2 + . . . + un 2 ×
t 1 2 + t 2 2 + . . . + tn 2
( 6 ) , g 2 ( c T , q T ) = Σ u T sim ( c T , u T ) | U T |
上下文相关的特征函数fk的选取:
(1)直接关联
设置查询序列对(qt-1,qt)的标记序列对为(ct-1,ct),本实施例用在给定查询序列对(qt-1,qt)前提下,标记序列对(ct-1,ct)出现的次数来计算f1(ct-1,ct,q)
f 1 ( c t - 1 , c t , q ) = O ( c t - 1 , c t ) O ( q t - 1 , q t )
其中
Figure G2009102208107D00175
为用在给定查询序列对(qt-1,qt)前提下,标记序列对(ct-1,ct)出现的次数。
O(qt-1,qt)为查询序列对(qt-1,qt)出现的总次数。
(2)利用分类目录树间接关联
假设标记序列对(ct-1,ct)处于分类目录树的第n层,(ct-1,ct)的祖先节点对的集合为
Figure G2009102208107D00176
1≤i≤n-1,本实施例用在给定查询序列对(qt-1,qt)前提下(ct-1,ct)的祖先节点对
Figure G2009102208107D00177
出现的次数来计算f2(ct-1,ct,q):
f 2 ( c t - 1 , c t , q ) = Σ i = 1 n - 1 O ( a c t - 1 ( i ) , a c t ( i ) ) O ( q t - 1 , q t )
其中,
Figure G2009102208107D00179
为在给定查询序列对(qt-1,qt)前提下(ct-1,ct)的祖先节点对
Figure G2009102208107D001710
出现的次数,O(qt-1,qt)为查询序列对(qt-1,qt)出现的总次数。
进一步地,图1中所述步骤102可以包括:计算所述关键词信息与成员引擎的元索引信息之间的第一最大相似度;计算在成员引擎的元索引信息与关键词信息的相似度大于第一阈值且成员引擎的元索引信息与长期兴趣模型的相似度大于第二阈值的基础上,成员引擎的元索引信息与即时兴趣模型的第二最大相似度;计算在成员引擎的元索引信息与关键词信息的相似度大于第三阈值且成员引擎的元索引信息与即时兴趣模型的相似度大于第四阈值的基础上,成员引擎的元索引信息与长期兴趣模型的第三最大相似度;计算在成员引擎的元索引信息与关键词信息的相似度大于第五阈值的基础上,成员引擎的元索引信息与长期兴趣模型和即时兴趣模型的加权相加的结果向量的第四最大相似度;根据第一最大相似度、第二最大相似度、第三最大相似度和第四最大相似度计算成员引擎的相似度评分值。
需要说明的是,上述第一阈值、第二阈值、第三阈值、第四阈值以及第五阈值的取值范围为0~1,本领域技术人员可以根据需要设定这些阈值的取值,或者采用经验值。
具体来说,获取所述选择结果信息的步骤可以如下:
假设成员引擎对应的数据库为D,用户的当前查询向量为Q(q1,...,qk-1,qk),用户的即时兴趣模型向量为IIM(u1,....un-1,un)(Instant interest model)、用户的长期兴趣模型向量为LIM(r1,....rn-1,rn)(Long-term interest model).
(a)计算Q与D的最大相似度,即第一最大相似度sim1
sim 1 = Max 1 ≤ i ≤ k ( ( q i * gidf i * mnw i + Σ j = 1 , j ≠ i k q j * gidf j * anw j ) / | Q | + Σ j = 1 n ( r j + u j ) * anvj / | R | ) 的值,其中|Q|为搜索请求向量Q的模,|R|为用户的兴趣模型R的模;该值作为该第一最大相似度。
(b)计算在D与Q以及D与LIM分别取得较好匹配的基础上,D与IIM的第二最大相似度sim2
sim 2 = Max 1 ≤ i ≤ n (if(sim(V(mnvi,anvj,(j≠i,1≤j≤n)),Q’)>T1andsim(V(mnvi,anvj(j≠i,1≤j≤n)),LIM(r1,....rn-1,rn))>T2)then ( ( u i * mnv i + Σ j = 1 , j ≠ i n u j * anv j ) / | R | + Σ i = 1 k q i * gidf i * anw i / | Q | )
其中,Q’的计算方法为:如果术语ti属于用户的兴趣模型的某个维度的范围,将qi的值映射成用户的兴趣模型的该维度的权重,然后将相同维度的权重相加得到qi’,再作归一化处理;V为由mnvi和anvj(j≠i,1≤j≤n)组成的向量;sim(V(mnvi,anvj(j≠i,1≤j≤n)),Q’)为向量V和向量Q’的cousine相似度;sim(V(mnvi,anvj(j≠i,1≤j≤n)),LIM(r1,....rn-1,rn))为向量V和向量LIM的cousine相似度;T1,T2为阈值,且0<T1,T2≤1;i,k,j,n为自然数。
(c)计算在D与Q以及D与IIM分别取得较好匹配的基础上,D与LIM的第三最大相似度sim3
sim 3 = Max 1 ≤ i ≤ n (if(sim(V(mnvi,anvj,(j≠i,1≤j≤n)),Q’)>T1andsim(V(mnvi,anvj(j≠i,1≤j≤n)),IIM(u1,....un-1,un))>T2)then ( ( r i * mnv i + Σ j = 1 , j ≠ i n r j * anv j ) / | R | + Σ i = 1 k q i * gidf i * anw i / | Q | )
其中,Q’的计算方法为:如果术语ti属于用户的兴趣模型的某个维度的范围,将qi的值映射成用户的兴趣模型的该维度的权重,然后将相同维度的权重相加得到qi’,再作归一化处理;V为由mnvi和anvj(j≠i,1≤j≤n)组成的向量;sim(V(mnvi,anvj(j≠i,1≤j≤n)),Q’)为向量V和向量Q’的cousine相似度;sim(V(mnvi,anvj(j≠i,1≤j≤n)),IIM(u1,....un-1,un)为向量V和向量IIM的cousine相似度;T1,T2为阈值,且0<T1,T2≤1;i,k,j,n为自然数。
(d)计算在D与Q取得较好匹配的基础上,D与IIM和LIM加权相加所的结果向量之间的第四最大相似度sim4
设IM(p1,...,pn-1,pn)=r′1LIM(r1,...,rn)+r′2IIM(u1,...,un-1,un),r′1+r′2=1,
sim 4 = Max 1 ≤ i ≤ n ( if ( sim ( V ( mnv i , anv j ( j ≠ i , 1 ≤ j ≤ n ) ) , Q , ) > T 1 ) then ( ( p i * mnv i + Σ j = 1 , j ≠ i n p j * anv j ) / | R | + Σ i = 1 k q i * gidf i * anw i / | Q | )
(e)根据sim1~sim4计算成员引擎的相似度评分值Msim:
方法1:取sim1~sim4的最大值.
Msim=Max{sim 1,sim2,sim3,sim4}
方法2:sim1~sim4加权相加
Msim=r1×sim1+r2×sim2+r3×sim3+r4×sim4,其中ri+r2+r3+r4=1.
方法3:sim1~sim4相乘
Msim=sim1×sim2×sim3×sim4
除了上面方法计算成员引擎相关度评分值外,还可以进一步考虑其他相关因素,如成员引擎的性能因素和成员引擎的价格因素等,最终的成员引擎综合相关度评分值为上述基于元索引的相似度评分值(Msim)与性能因素评分值和价格因素评分值的加权相加:
Integrated_Sim=r1×Msim+r2×性能因素评分值+r3×价格因素评分值,其中r1+r2+r3=1
对于每个成员引擎,均可以采用上述步骤(a)~(e)进行操作,从而可以获取每个成员引擎的评分最大值。
在选择使用哪个成员引擎搜索关键词信息时,可以根据需要从这些评分最大值的集合中选择前一个或者前几个评分最大值,即选择一个或多个成员引擎,从而使得搜索服务器可以将搜索请求分发给选择出的成员引擎进行搜索操作。在具体实现过程中,可以获取选择出的成员引擎的ID信息作为选择结果信息,从而向与ID信息对应的成员引擎发送搜索请求。
下面以一个具体实施例对本发明移动搜索方法上述实施例的技术方案进行详细说明。
图2为本发明移动搜索方法实施例二的信令流程图,如图2所示,本实施例的方法可以包括:
步骤201、搜索服务器接收各个成员引擎上报的元索引信息。
需要说明的是,该步骤为可选的,且其执行顺序不限于此。
该元索引信息可以包括下述信息之一或者其任意组合:
(1)术语最大归一化权重向量mnw=(mnw1,mnw2,...,mnwi,....,mnwp),其中mnwi为术语ti相对于该成员引擎对应的数据库或者子数据库中的所有文档的最大归一化权重。则其中,mnwi可以以下面的方式计算得到:首先计算数据库/子数据库中的每个文档相对于术语ti的归一化权重,归一化权重的取值可以为文档中术语ti出现的次数(词频)除以文档的长度,文档中术语ti的归一化权重=TFi/|d|,其中文档长度 | d | = tf 1 2 + tf 2 2 + . . . . + tfn 2 (tf1~tfn为文档的所有术语的词频),TFi为术语ti的词频。再从数据库/子数据库中所有文档相对术语ti的归一化权重中取最大值,得到数据库/子数据库术语t1的最大归一化权重。
(2)术语平均归一化权重向量anw=(anw1,anw2,.....,anwi......,anwp),其中anwi为术语ti相对于该成员引擎对应的数据库或者子数据库中的所有文档的平均归一化权重。则其中,anwi可以以下面的方式计算得到:首先计算数据库/子数据库中的每个文档相对于术语ti的归一化权重,归一化权重的取值可以为文档中术语ti出现的次数(词频)除以文档的长度,文档中术语ti的归一化权重=TFi/|d|,其中文档长度 | d | = tf 1 2 + tf 2 2 + . . . . + tfn 2 (tf1~tfn为文档的所有术语的词频),TFi为术语ti的词频。再从数据库/子数据库中所有文档相对术语ti的归一化权重中取平均值,得到数据库/子数据库术语t1的平均归一化权重。
(3)数据库或者子数据库中的文档的兴趣模型最大归一化权重向量mnv=(mnv1,mnv2,......,mnvi,......,mnvn),其中mnvi为该文档的兴趣模型的第i个维度相对于该成员引擎对应的数据库或者子数据库中的所有文档的最大归一化权重。其中,mnvi可以通过下面的方式计算得到:
方法1:首先计算数据库的每个文档相对于兴趣模型第i个维度的归一化权重,归一化权重的取值为文档中属于兴趣模型第i个维度范围(如:体育)的所有词的词频之和再除以文档的长度;再从所有文档相对于兴趣模型第i个维度的归一化权重中取最大值,就得到兴趣模型的第i个维度相对于数据库D中的所有文档的最大归一化权重mnvi。
方法2:首先计算数据库的每个文档相对于兴趣模型第i个维度的归一化权重,将文档进行自动分类(分类的方法可以采用常用的朴素贝叶斯、K最近邻分类算法、支持向量机、向量空间模型等算法),将文档属于第i个维度对应类型的归一化评分值作为每个文档相对于兴趣模型第i个维度的归一化权重的取值,再从所有文档相对于兴趣模型第i个维度的归一化权重中取最大值,就得到兴趣模型的第i个维度相对于数据库D中的所有文档的最大归一化权重mnvi。
(4)数据库或者子数据库中的文档的兴趣模型平均归一化权重向量anv=(anv1,anv2,......,anvi,......,anvn),其中anvi为该文档的兴趣模型的第i个维度相对于该成员引擎对应的数据库中的所有文档的平均归一化权重。其中,anvi可以通过下面的方式计算得到:
方法1:首先计算数据库的每个文档相对于兴趣模型第i个维度的归一化权重,归一化权重的取值为文档中属于兴趣模型第i个维度范围(如:体育)的所有词的词频之和再除以文档的长度;再从所有文档相对于兴趣模型第i个维度的归一化权重中取平均值,就得到兴趣模型的第i个维度相对于数据库D中的所有文档的平均归一化权重anvi。
方法2:首先计算数据库的每个文档相对于兴趣模型第i个维度的归一化权重,将文档进行自动分类(分类的方法可以采用常用的朴素贝叶斯、K最近邻分类算法、支持向量机、向量空间模型等算法),将文档属于第i个维度对应类型的归一化评分值作为每个文档相对于兴趣模型第i个维度的归一化权重的取值,;再从所有文档相对于兴趣模型第i个维度的归一化权重中取平均值,就得到兴趣模型的第i个维度相对于数据库D中的所有文档的平均归一化权重anvi
(5)术语ti相对于该数据库的全局反向文档频率gidfi,其中gidfi=log(n/(gdfi+1)),其中gdfi为所有成员引擎对应数据库或者子数据库中包含术语ti的文档的数量的总和,n为所有成员引擎所包含的所有文档数量的总和;
(6)文档的兴趣模型第i个维度对应的全局反向文档频率IM_gidfi,其中IM_gidfi=log(n/(IM_gdfi+1)),IM_gdfi为所有成员引擎对应的数据库或子数据库中包含属于文档的兴趣模型的第i个维度的术语的文档个数的总和,n为所有成员引擎所包含的所有文档数量的总和。
步骤202、搜索客户端将搜索请求发给搜索应用服务器。
步骤203、搜索应用服务器从用户数据库中提取用户的长期兴趣模型和即时兴趣模型。
例如,搜索应用服务器可以从用户的静态profile、搜索历史等信息中提取用户的长期兴趣模型,或者直接提取预先存储在用户数据库中的长期兴趣模型,并且搜索应用服务器还可以从与当前查询q(t)处于同一搜索上下文会话(Search Context Session)的查询序列q(1),...,q(t-1),q(t)的相关数据中提取用户的即时兴趣模型,所述搜索上下文会话为当前查询q(t)发生的前一段预设的时间,如半个小时,包括q(t)当前发生的时间。
对于用户的静态profile所对应的长期兴趣模型W1来说,W1=(p1,p2,p3,......,pn),其中pi为静态profile中类型属于第i个兴趣维度的所有词的词频之和;或者对该静态profile对应的文档进行分类(分类的算法可以用朴素贝叶斯、K最近邻分类算法、支持向量机、向量空间模型等算法),tj等于该静态profile对应的文档属于第j个兴趣维度所对应的类型的评分值。。
对于用户的搜索点击历史所对应的长期兴趣模型W2来说,W2=d1+d2+d3+......dm,其中di为用户某个点击文档所对应的兴趣模型向量,di=(t1,t2,t3,.......,tn),当用户最新点击了这个文档,tj等于文档中类型属于第j个兴趣维度的所有词的词频之和;或者对该文档进行分类(分类的算法可以用朴素贝叶斯、K最近邻分类算法、支持向量机、向量空间模型等算法),tj等于该文档属于第j个兴趣维度所对应的类型的评分值。如果用户对某个点击过的文档进行评价,如果评价好,di向量乘以一个正的常数c表示文档的重要性增加di=c×di=(c×ti,c×t2,c ×t3,......,c×tn),如果评价不好,di向量乘以一个正的常数c的倒数表示文档的重要性减小di=1/c×di=(1/c×ti,1/c×t2,1/c×t3,......,1/c×tn);过了一段时间,tj的值又自动减少一定的百分比,表示随着时间的推移其重要性减弱,直到过了较长的时间tj的值减为零为止,这时将di从历史记录中删除。
对于综合的长期兴趣模型来说,可以将W1和W2分别归一化后相加,即:兴趣模型向量W=W1+W2,或者加权相加,如兴趣模型向量W=W1×30%+W2×70%,然后再对W进行归一化处理。
步骤204、搜索应用服务器将搜索请求发送给搜索服务器。
该搜索请求中携带即时兴趣模型和长期兴趣模型。
步骤205、搜索服务器根据搜索请求选择成员引擎。
搜索服务器可以根据即时兴趣模型和长期兴趣模型以及步骤201获取的元索引信息计算成员引擎对应的数据库的相似度评分值,选择相似度评分值高的成员引擎。选择成员引擎,获取选择结果信息的方法可以采用上述描述的过程,不再赘述。
步骤206、搜索服务器将搜索请求分发给选中的成员引擎。
举例来说,搜索服务器获取的选择结果信息可以为选中的成员引擎的ID信息,因此该搜索服务器可以向与ID信息对应的成员引擎分发搜索请求,从而使得一个或多个成员引擎可以对该关键词信息进行搜索,从而获取搜索结果信息。
本实施例中,搜索服务器在请求成员引擎搜索关键词信息之前,可以根据用户的即时兴趣模型和长期兴趣模型对成员引擎进行选择,从而能够选择获取与所需搜索的关键词信息以及用户的即时兴趣模型和长期兴趣模型匹配较好的成员引擎对该关键词信息进行搜索,从而能够获取精度较高的搜索结果信息,进一步满足用户的搜索需求。
图3为本发明移动搜索方法实施例三的流程图,如图3所示,本实施例的方法可以包括:
步骤301、向一个或多个成员引擎发送搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型。
搜索服务器可以向一个或多个成员引擎发送搜索请求,以指示接收到该搜索请求的成员引擎可以根据搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型进行搜索,获取具有个性化评分信息的搜索结果信息。
举例来说,用户的兴趣模型可以用n个维度来表示如:新闻、体育、娱乐、财经、科技、房产、游戏、女性、论坛、天气、商品、家电、音乐、读书、博客、手机、军事、教育、旅游、彩信、彩铃、餐饮、民航、工业、农业、电脑、地理等。用户对每个维度的兴趣的评分值所组成的一个向量W(r1,r2,r3,......,rn)则为用户的兴趣模型。
如果兴趣模型W(r1,r2,r3,...,rn)中的各个维度的评分值ri是由用户的所有搜索历史数据和用户的静态档案profile计算得到,则兴趣模型W(r1,r2,r3,...rn)为用户的长期兴趣模型。如果兴趣模型W(r1,r2,r3,...,rn)中的各个维度的评分值ri是由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),...,q(t-1),q(t)的相关数据计算得到的,那么W(r1,r2,r3,...rn)为用户的即时兴趣模型。
步骤302、接收所述一个或多个成员引擎根据所述关键词信息、所述即时兴趣模型和长期兴趣模型获取的搜索结果信息以及与所述搜索结果信息对应的评分信息。
成员引擎在接收该搜索请求后,可以对所需搜索的关键词信息进行搜索,获取搜索结果信息。然后,成员引擎可以根据即时兴趣模型和长期兴趣模型对搜索结果信息进行个性化的评分处理,从而获取与各搜索结果信息对应的具有个性化的评分信息,该评分信息可以表示各搜索结果信息与即时兴趣模型和长期兴趣模型之间的匹配程度。成员引擎可以将该搜索结果信息以及相应的评分信息发送给搜索服务器。
步骤303、根据所述评分信息和相关因素信息对所述搜索结果信息进行重新评分排序,获取重新评分排序后的搜索结果信息,并将所述重新评分排序后的搜索结果信息发送给所述搜索应用服务器。
搜索服务器在接收到各成员引擎反馈的搜索结果信息以及相应的评分信息后,可以对搜索结果信息进行重新评分处理,即对该搜索结果信息进行进一步的筛选处理,从而可以获取更为个性化地,符合需求的搜索结果信息。在重新评分处理过程中,搜索服务器可以将成员引擎反馈的与各搜索结果信息对应的评分信息以及其他相关因素信息结合起来对搜索结果信息进行综合评分。该相关因素信息可以包括该成员引擎的价格、级别、搜索速度、好评率等等信息,本领域技术人员可以根据需要将各种可能影响排序的信息结合到重新评分处理的过程中。
搜索服务器在完成重新评分处理后,即可将该重新评分处理后的搜索结果信息反馈给搜索应用服务器,以便搜索应用服务器可以将个性化的,满足用户需求的以及匹配精度高的搜索结果信息提供给搜索客户端。
本实施例中,搜索服务器可以将搜索应用服务器提取的即时兴趣模型和长期兴趣模型发送给成员引擎,从而使得成员引擎在获取搜索结果信息后,可以根据用户的即时兴趣模型和长期兴趣模型对该搜索结果信息进行个性化评分处理,从而获取各搜索结果信息相应的评分信息。当搜索服务器接收到成员引擎反馈的搜索结果信息以及相应的评分信息以后,还可以结合其它相关因素对搜索结果信息进行重新评分排序,从而可以获取个性化的,满足用户需求的以及匹配精度高的搜索结果信息。
进一步地,本发明移动搜索方法另一个实施例还可以包括:接收所述搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型。所述即时兴趣模型可以为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),...,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间。所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。
具体来说,搜索应用服务器可以根据搜索客户端发送的搜索请求消息,从用户数据库中获取用户的即时兴趣模型和长期兴趣模型。例如,从用户数据库,如用户的静态profile、搜索历史等信息中提取用户的长期兴趣模型,或者直接提取预先存储在用户数据库中的长期兴趣模型,并且搜索应用服务器还可以从与当前所需搜索的关键字信息处于同一查询序列q(1),...,q(t-1),q(t)的相关数据中提取用户的即时兴趣模型。在提取即时兴趣模型和长期兴趣模型后,搜索应用服务器即可向搜索服务器发送搜索请求,从而使得搜索服务器可以根据该搜索请求中携带的用户的即时兴趣模型和长期兴趣模型对所需搜索的关键字信息进行搜索。
再进一步地,步骤303所述的相关因素信息可以包括:成员引擎级别信息和/或价格信息,相应地,步骤303中所述根据所述评分信息和相关因素信息对所述搜索结果信息进行重新评分排序可以包括根据所述评分信息、成员引擎级别信息和/或价格信息,计算所述搜索结果的综合评分值,并根据所述综合评分值对所述搜索结果信息进行排序处理。举例来说,搜索结果信息的综合评分值=r1×成员引擎返回评分值+r2×成员引擎级别相关的评分值+r3×价格因素相关的评分值,其中r1+r2+r3=1。
需要说明的是,上述实施例也可以采用实施例一和实施例二所述的方法先行对所需使用的成员引擎进行选择处理,从而使得搜索服务器只向选中的成员引擎分发搜索请求,进一步提高搜索精度。
本实施例中,搜索服务器可以将搜索应用服务器提取的即时兴趣模型和长期兴趣模型发送给成员引擎,从而使得成员引擎在获取搜索结果信息后,可以根据用户的即时兴趣模型和长期兴趣模型对该搜索结果信息进行个性化评分处理,从而获取各搜索结果信息相应的评分信息。当搜索服务器接收到成员引擎反馈的搜索结果信息以及相应的评分信息以后,还可以结合其它相关因素对搜索结果信息进行重新评分排序,从而可以获取个性化的,满足用户需求的以及匹配精度高的搜索结果信息。
图4为本发明移动搜索方法实施例四的流程图,如图4所示,本实施例的方法可以包括:
步骤401、接收搜索服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型。
成员引擎可以接受搜索服务器发送的搜索请求。该成员引擎可以为采用实施例一和实施例二所述的方法选中的成员引擎。
步骤402、对所述关键词信息进行搜索,获取搜索结果信息,并根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理。
成员引擎在接收该搜索请求后,可以对所需搜索的关键词信息进行搜索,获取搜索结果信息。然后,成员引擎可以根据即时兴趣模型和长期兴趣模型对搜索结果信息进行个性化评分处理,从而获取与各搜索结果信息对应的评分信息,该评分信息可以表示各搜索结果信息与即时兴趣模型和长期兴趣模型之间的匹配程度。
步骤403、将评分排序处理后的搜索结果信息反馈给所述搜索服务器。
成员引擎可以将该搜索结果信息以及相应的评分信息发送给搜索服务器。
搜索服务器在接收到各成员引擎反馈的搜索结果信息以及相应的评分信息后,可以对搜索结果信息进行重新评分处理,即对该搜索结果信息进行进一步的筛选处理,从而可以获取更为个性化地,符合需求的搜索结果信息。在重新评分处理过程中,搜索服务器可以将成员引擎反馈的与各搜索结果信息对应的评分信息以及其他相关因素信息结合起来对搜索结果信息进行综合评分。该相关因素信息可以包括该成员引擎的价格、级别、搜索速度、好评率等等信息,本领域技术人员可以根据需要将各种可能影响排序的信息结合到重评分处理的过程中。
搜索服务器在完成重新评分处理后,即可将该重新评分处理后的搜索结果信息反馈给搜索应用服务器,以便搜索应用服务器可以将个性化的,满足用户需求的以及匹配精度高的搜索结果信息提供给搜索客户端。
进一步地,步骤402中所述的根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理,可以包括:计算所述即时兴趣模型与所述搜索结果信息的第一相似度;计算所述长期兴趣模型与所述搜索结果信息的第二相似度;根据所述第一相似度和第二相似度获取评分值,并根据所述评分值对所述搜索结果信息进行排序处理。
具体来说,搜索结果信息的评分值=r′1×搜索结果信息与LIM的第二相似度+r′2×搜索结果信息与IIM的第一相似度,r′1+r′2=1。
计算搜索结果信息与长期兴趣模型向量LIM(r1,...,rn)的第二相似度:
(1)成员引擎根据倒排索引检索出候选的搜索结果信息。
(2)成员引擎根据长期兴趣模型数据对候选的搜索结果信息进行个性化相关性评分。
W=(r1,r2,r3,......,rn)为搜索服务器传过来的长期兴趣模型,D=(t1,t2,t3,.......,tn)为搜索结果信息所对应的兴趣模型向量。
评分值score1=W×D=r1×t1+r2×t2+r3×t3+......,+rn×tn。
计算搜索结果信息与即时兴趣模型IIM(u1,...,un)的第一相似度:
(1)成员引擎根据倒排索引检索出候选的搜索结果信息。
(2)成员引擎根据即时兴趣模型数据对候选的搜索结果信息进行个性化相关性评分。
U=(u1,u2,u3,......,un)为搜索服务器传过来的即时兴趣模型,D=(t1,t2,t3,.......,tn)为搜索结果信息所对应的兴趣模型向量。
评分值score2=W×D=u1×t1+u2×t2+u3×t3+......,+un×tn
计算评分值=r′1×score1+r′2×score2。
本实施例中,成员引擎可以接收搜索服务器发送的即时兴趣模型和长期兴趣模型,从而在获取与关键词信息对应的搜索结果信息后,可以根据用户的即时兴趣模型和长期兴趣模型对该搜索结果信息进行个性化的评分处理,从而获取各搜索结果信息相应的个性化的评分信息,满足用户需求的以及匹配精度高的搜索结果信息。
下面以一个具体实施例对本发明移动搜索方法上述实施例的技术方案进行详细说明。
图5为本发明移动搜索方法实施例五的信令流程图,如图5所示,本实施例的方法可以包括:
步骤501、搜索客户端将搜索请求发给搜索应用服务器。
该搜索请求中可以携带所需搜索的关键词信息。
步骤502、搜索应用服务器从用户数据库中提取用户的长期兴趣模型和即时兴趣模型。
例如,搜索应用服务器可以从用户的静态profile、搜索历史等信息中提取用户的长期兴趣模型,或者直接提取预先存储在用户数据库中的长期兴趣模型,并且搜索应用服务器还可以从与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),...,q(t-1),q(t)的相关数据中提取用户的即时兴趣模型。
步骤503、搜索应用服务器向搜索服务器发送搜索请求。
该搜索请求中可以携带关键词信息以及用户的长期兴趣模型和即时兴趣模型。
步骤504、搜索服务器向成员引擎分发搜索请求。
该搜索请求中可以携带关键词信息以及用户的长期兴趣模型和即时兴趣模型。成员引擎可以接受搜索服务器发送的搜索请求。该成员引擎可以为采用实施例一和实施例二所述的方法选中的成员引擎。
步骤505、成员引擎搜索关键词信息,获取搜索结果信息,根据用户的即时兴趣模型和长期兴趣模型对搜索结果信息进行个性化相关性评分与排序处理。
获取评分值的过程可以采用上述方法,不再赘述。
步骤506、成员引擎将排序处理后的搜索结果信息以及相应的评分值返回给搜索服务器。
步骤507、搜索服务器根据搜索结果信息的评分值和其它相关因素对搜索结果信息进行重新评分。
例如,搜索结果信息的综合评分值=r1×成员引擎返回评分值+r2×成员引擎级别相关的评分值+r3×价格因素相关的评分值,其中r1+r2+r3=1。
步骤508、搜索服务器根据综合评分值,对搜索结果信息进行重新排序处理。
步骤509、搜索服务器将最终的搜索结果信息发送给搜索应用服务器。
步骤510、搜索应用服务器将最终的搜索结果信息发送给搜索客户端。
本实施例中,搜索服务器可以将搜索应用服务器提取的即时兴趣模型和长期兴趣模型发送给成员引擎,从而使得成员引擎在获取搜索结果信息后,可以根据用户的即时兴趣模型和长期兴趣模型对该搜索结果信息进行个性化的评分处理,从而获取各搜索结果信息相应的评分信息。当搜索服务器接收到成员引擎反馈的搜索结果信息以及相应的评分信息以后,还可以结合其它相关因素对搜索结果信息进行重新评分排序,从而可以获取个性化的、满足用户需求的以及匹配精度高的搜索结果信息。
图6为本发明移动搜索方法实施例六的流程图,如图6所示,本实施例的方法可以包括:
步骤601、接收搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型。
举例来说,搜索服务器可以接收搜索应用服务器发送的搜索请求。该搜索请求中携带所需搜索的关键词信息以及所述搜索应用服务器获取的即时兴趣模型和长期兴趣模型。搜索应用服务器可以根据搜索客户端发送的搜索请求消息,从用户数据库中获取用户的即时兴趣模型和长期兴趣模型。例如,从用户数据库,如用户的静态profile、搜索历史等信息中提取用户的长期兴趣模型,或者直接提取预先存储在用户数据库中的长期兴趣模型,并且搜索应用服务器还可以从与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),...,q(t-1),q(t)的相关数据中提取用户的即时兴趣模型。在提取即时兴趣模型和长期兴趣模型后,搜索应用服务器即可向搜索服务器发送搜索请求,从而使得搜索服务器可以根据该搜索请求中携带的用户的即时兴趣模型和长期兴趣模型对所需搜索的关键字信息进行搜索。
用户的兴趣模型可以用n个维度来表示如:新闻、体育、娱乐、财经、科技、房产、游戏、女性、论坛、天气、商品、家电、音乐、读书、博客、手机、军事、教育、旅游、彩信、彩铃、餐饮、民航、工业、农业、电脑、地理等。用户对每个维度的兴趣的评分值所组成的一个向量W(r1,r2,r3,......,rn)则为用户的兴趣模型。
如果兴趣模型W(r1,r2,r3,...,rn)中的各个维度的评分值ri是由用户的所有搜索历史数据和用户的静态档案profile计算得到,则兴趣模型W(r1,r2,r3,...rn)为用户的长期兴趣模型。如果兴趣模型W(r1,r2,r3,...,rn)中的各个维度的评分值ri是由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),...,q(t-1),q(t)的相关数据计算得到的,那么W(r1,r2,r3,...rn)为用户的即时兴趣模型。
步骤602、接收成员引擎根据所述关键词信息搜索获取的搜索结果信息,并根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理。
成员引擎可以根据搜索服务器发送的搜索请求中携带的关键词信息进行搜索,获取搜索结果信息,并将该搜索结果信息反馈给搜索服务器。搜索服务器可以根据即时兴趣模型和长期兴趣模型对该搜索结果信息进行个性化的评分排序处理。
步骤603、将评分排序处理后的搜索结果信息以及相应的评分信息发送给所述搜索应用服务器。
搜索服务器可以将评分排序处理后的搜索结果信息以及相应的评分信息发送给搜索应用服务器,以便搜索应用服务器将搜索结果信息以及相应的评分信息反馈给搜索客户端,从而为用户提供个性化的,精度较高的搜索结果。
进一步地,步骤602所述的根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理,可以包括:计算所述即时兴趣模型与所述搜索结果信息的第一相似度;计算所述长期兴趣模型与所述搜索结果信息的第二相似度;根据所述第一相似度和第二相似度获取评分值,并根据所述评分值对所述搜索结果信息进行排序处理。
具体来说,搜索结果信息的评分值=r′1×搜索结果信息与LIM的第二相似度+r′2×搜索结果信息与IIM的第一相似度,r′1+r′2=1。
计算搜索结果信息与长期兴趣模型向量LIM(r1,...,rn)的第二相似度:
(1)成员引擎根据倒排索引检索出候选的搜索结果信息。
(2)成员引擎根据长期兴趣模型数据对候选的搜索结果信息进行个性化相关性评分。
W=(r1,r2,r3,......,rn)为搜索服务器传过来的长期兴趣模型,D=(t1,t2,t3,.......,tn)为搜索结果信息所对应的兴趣模型向量。
评分值score1=W×D=r1×t1+r2×t2+r3×t3+......,+rn×tn。
计算搜索结果信息与即时兴趣模型IIM(u1,...,un)的第一相似度:
(1)成员引擎根据倒排索引检索出候选的搜索结果信息。
(2)成员引擎根据即时兴趣模型数据对候选的搜索结果信息进行个性化相关性评分。
U=(u1,u2,u3,......,un)为搜索服务器传过来的即时兴趣模型,D=(t1,t2,t3,.......,tn)为搜索结果信息所对应的兴趣模型向量。
评分值score2=W×D=u1×t1+u2×t2+u3×t3+......,+un×tn
计算评分值=r′1×score1+r′2×score2。
搜索服务器即可根据评分值对搜索结果信息进行排序处理,获取排序处理后的搜索结果信息。
本实施例中,搜索服务器可以根据用户的即时兴趣模型和长期兴趣模型对成员引擎反馈的搜索结果信息进行评分排序,从而用户提供个性化的,满足用户需求的以及匹配精度高的搜索结果信息。
下面以一个具体实施例对本发明移动搜索方法上述实施例的技术方案进行详细说明。
图7为本发明移动搜索方法实施例七的信令流程图,如图7所示,本实施例的方法可以包括:
步骤701、搜索客户端将搜索请求发给搜索应用服务器。
该搜索请求中可以携带所需搜索的关键词信息。
步骤702、搜索应用服务器从用户数据库中提取用户的长期兴趣模型和即时兴趣模型。
例如,搜索应用服务器可以从用户的静态profile、搜索历史等信息中提取用户的长期兴趣模型,或者直接提取预先存储在用户数据库中的长期兴趣模型,并且搜索应用服务器还可以从与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),...,q(t-1),q(t)的相关数据中提取用户的即时兴趣模型。
步骤703、搜索应用服务器向搜索服务器发送搜索请求。
该搜索请求中可以携带关键词信息以及用户的长期兴趣模型和即时兴趣模型。
步骤704、搜索服务器向成员引擎分发搜索请求。
该搜索请求中可以携带关键词信息。成员引擎可以接受搜索服务器发送的搜索请求。该成员引擎可以为采用实施例一和实施例二所述的方法选中的成员引擎。
步骤705、各个成员引擎完成搜索,获取搜索结果信息。
步骤706、各个成员引擎将搜索结果信息返回给搜索服务器。
步骤707、搜索服务器根据即时兴趣模型和长期兴趣模型对搜索结果信息进行评分排序处理。
评分排序处理的过程如上所述,不再赘述。
步骤708、搜索服务器将评分排序处理后的搜索结果信息返回给搜索应用服务器。
步骤709、搜索应用服务器将最终的搜索结果信息返回给搜索客户端。
本实施例中,搜索服务器可以根据用户的即时兴趣模型和长期兴趣模型对成员引擎反馈的搜索结果信息进行评分排序,从而用户提供个性化的,满足用户需求的以及匹配精度高的搜索结果信息。
图8为本发明移动搜索方法实施例八的流程图,如图8所示,本实施例的方法可以包括:
步骤801、接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息。
具体来说,搜索应用服务器可以接收搜索客户端发送的搜索请求消息,该搜索请求消息中可以携带所需搜索的关键词信息。
步骤802、从用户数据库中提取即时兴趣模型和长期兴趣模型。
搜索应用服务器可以从用户数据库中提取即时兴趣模型和长期兴趣模型。例如,搜索应用服务器可以从用户的静态profile、搜索历史等信息中提取用户的长期兴趣模型,或者直接提取预先存储在用户数据库中的长期兴趣模型,并且搜索应用服务器还可以从与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),...,q(t-1),q(t)的相关数据中提取用户的即时兴趣模型。
举例来说,用户的兴趣模型可以用n个维度来表示如:新闻、体育、娱乐、财经、科技、房产、游戏、女性、论坛、天气、商品、家电、音乐、读书、博客、手机、军事、教育、旅游、彩信、彩铃、餐饮、民航、工业、农业、电脑、地理等。用户对每个维度的兴趣的评分值所组成的一个向量W(r1,r2,r3,......,rn)则为用户的兴趣模型。
如果兴趣模型W(r1,r2,r3,...,rn)中的各个维度的评分值ri是由用户的所有搜索历史数据和用户的静态档案profile计算得到,则兴趣模型W(r1,r2,r3,...rn)为用户的长期兴趣模型。如果兴趣模型W(r1,r2,r3,...,rn)中的各个维度的评分值ri是由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),...,q(t-1),q(t)的相关数据计算得到的,那么W(r1,r2,r3,...rn)为用户的即时兴趣模型。
对于用户的静态profile所对应的长期兴趣模型W1来说,W1=(p1,p2,p3,......,pn),其中pi为静态profile中类型属于第i个兴趣维度的所有词的词频之和;或者对该静态profile对应的文档进行分类(分类的算法可以用朴素贝叶斯、K最近邻分类算法、支持向量机、向量空间模型等算法),tj等于该静态profile对应的文档属于第j个兴趣维度所对应的类型的评分值。
对于用户的搜索点击历史所对应的长期兴趣模型W2来说,W2=d1+d2+d3+......dm,其中di为用户某个点击文档所对应的兴趣模型向量,di=(t1,t2,t3,.......,tn),当用户最新点击了这个文档,tj等于文档中类型属于第j个兴趣维度的所有词的词频之和;或者对该文档进行分类(分类的算法可以用朴素贝叶斯、K最近邻分类算法、支持向量机、向量空间模型等算法),tj等于该文档属于第j个兴趣维度所对应的类型的评分值。如果用户对某个点击过的文档进行评价,如果评价好,di向量乘以一个正的常数c表示文档的重要性增加di=c ×di=(c×ti,c×t2,c×t3,......,c×tn),如果评价不好,di向量乘以一个正的常数c的倒数表示文档的重要性减小di=1/c×di=(1/c×ti,1/c×t2,1/c×t3,......,1/c×tn);过了一段时间,tj的值又自动减少一定的百分比,表示随着时间的推移其重要性减弱,直到过了较长的时间tj的值减为零为止,这时将di从历史记录中删除。
对于综合的长期兴趣模型来说,可以将W1和W2分别归一化后相加,即:兴趣模型向量W=W1+W2,或者加权相加,如兴趣模型向量W=W1×30%+W2×70%,然后再对W进行归一化处理。
步骤803、向搜索服务器发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型,以使所述搜索服务器根据所述即时兴趣模型和长期兴趣模型对所述关键词信息进行搜索。
搜索应用服务器可以将关键词信息发送给搜索服务器,也将提取获得的即时兴趣模型和长期兴趣模型也发送给搜索服务器,从而使得搜索服务器根据所述即时兴趣模型和长期兴趣模型对所述关键词信息进行搜索。搜索服务器具体进行搜索的过程可以采用上述实施例三~七中的方法实现。
进一步地,步骤802中所述的从用户数据库中提取即时兴趣模型,可以包括:应用条件随机场模型计算在给定与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),....q(t-1),q(t)的条件下,当前查询q(t)的输出类型的条件概率,将该条件概率值作为即时兴趣模型与该输出类型对应的兴趣维度的评分值。
举例来说,本实施例可以定义G=(V,E)为一个无向图,Y={Yv|v∈V}.即V中的每个节点对应一个随机变量所表示的标记序列的成分Yv,如果每个随机量Yv对于G遵守马尔可夫属性,那么(X,Y)就是一个条件随机场,而且在给定X和所有其他随机变量Y{u|u≠v,{u,v}∈V}的条件下,随机变量Yv的概率P(Yv|X,Yu,u≠v,{u.v}∈V)即等于P(Yv|X,Yu,(u,v)∈E)。
根据马尔可夫属性和最大熵的原理,可以推导出条件随机场的经典条件概率公式:
给定观察序列x的前提下,观察序列的状态标记序列y的条件概率等于:
P θ ( y | x ) = 1 Z ( x ) exp ( Σ e ∈ E , k λ k f k ( e , y | e , x ) + Σ v ∈ V , k u k g k ( v , y | v , x ) )
其中,x为观察序列,y为标记状态序列,y|S为与子图S的顶点相关联的序列y的成分的集合,f,g为特征函数,λ,μ为特征函数的权重值,Z(x)为归一化因子。
给定处于同一session的查询序列q=q1,...,q(T-1),q(T),输出查询序列对应的类型序列C=c1,...cT-1,cT的条件概率:
令ci的取值空间为|C|,令c0=start,cT+1=end,将状态start、end加入|C|
p ( c | q ) = 1 Z ( q ) Π t = 1 T + 1 M t ( c t - 1 , c t | q ) ,
其中: Z ( q ) = Σ c Π t = 1 T + 1 M t ( c t - 1 , c t | q ) , 为归一化因子。
M t ( c t - 1 , c t | q ) = exp ( Σ k λ k f k ( c t - 1 , c t , q ) + Σ k u k g k ( c t , q ) )
定义一个|C|×|C|的矩阵:
Mt(q)=[Mt(ct-1,ct|q)]
那么Z(q)等于M1(q)*...MT(q)*MT+1(q)矩阵的(start,end)项。
Z ( q ) = Σ c Π t = 1 T + 1 M t ( c t - 1 , c t | q ) = Σ startc 1 . . . c T - 1 c T end Π t = 1 T + 1 M t ( c t - 1 , c t | q )
= ( Π t = 1 T + 1 M t ( q ) ) start , end
令θ=(λ1,.λ2,......;u1,.u2,......)
参数θ的确定:
给定训练数据 D = { ( q ( i ) , c ( i ) ) } i = 1 N 和经验分布p(q,c),
训练数据的对数似然函数为:
L ( θ ) = Σ i = 1 N log P θ ( c ( i ) | q ( i ) )
∝ Σ q , c p ~ ( q , c ) log ( p θ ( c | q ) )
求θ使得L(θ)取得最大值。
本实施例可以用GIS算法求θ:
(a)求Efk、Egk
Ef k = Σ q , c p θ ( q , c ) f k ( q , c )
= Σ q , c p θ ( q ) p θ ( c | q ) f k ( q , c )
≈ Σ q , c p ~ ( q ) p θ ( c | q ) f k ( q , c )
= Σ q p ~ ( q ) Σ i = 1 T Σ c i - 1 c i ( p θ ( c i - 1 , c i | q ) f k ( c i - 1 , c i , q ) )
p θ ( c i - 1 , c i | q ) = Σ startc 1 . . . c i - 2 c i + 1 . . . c Tend p θ ( startc 1 , . . . , c T end | q )
= 1 Z ( q ) Σ startc 1 . . . c i - 2 c i + 1 . . . c Tend Π t = 1 T + 1 M t ( c t - 1 , c t | q )
= 1 Z ( q ) ( Σ startc 1 . . . c i - 2 Σ t = 1 i - 1 M t ( c t - 1 , c t | q ) ) M i ( c i - 1 , c i | q ) ( Σ C i + 1 . . . C T end Π t = i + 1 T + 1 M t ( c t - 1 , c t | q ) )
= 1 Z ( q ) ( ( Π t = 1 i - 1 M t ( q ) ) start , c i - 1 M i ( c i - 1 , c i | q ) ( Π t = i + 1 T + 1 M t ( q ) ) c i , end )
= 1 Z ( q ) α i - 1 ( c i - 1 | q ) M i ( c i - 1 , c i | q ) β i ( c i | q ) )
其中:
αi(q)为1×|C|向量,
αi(q)=αi-1Mi(q)
如果ct=start,α0(ct|q)=1
否则α0(ct|q)=0
β(i)为1x|C|向量,
β(i)T=Mi+1(q)β(i+1)T
如果ct=end βT+1(ct|q)=1
否则,βT+1(ct|q)=0
Eg k = Σ q , c p θ ( q , c ) g k ( q , c )
= Σ q , c p θ ( q ) p θ ( c | q ) g k ( q , c )
≈ Σ q , c p ~ ( q ) p θ ( c | q ) g k ( q , c )
= Σ q p ~ ( q ) Σ i = 1 T Σ c i p θ ( c i | q ) g k ( c i , q )
p θ ( c i | q ) = Σ c 1 . . . c i - 1 c i + 1 . . . c T p θ ( c 1 , . . . , c T | q )
= 1 Z ( q ) Σ c 1 . . . c i - 1 c i + 1 . . . c T Π t = 1 T M t ( c t - 1 , c t , q )
= 1 Z ( q ) ( Σ c 1 . . . c i - 1 Π t = 1 i M t ( c t - 1 , c t , q ) ) ( Σ c i + 1 . . . c T Π t = i + 1 T M t ( c t - 1 , c t , q ) )
= 1 Z ( q ) ( ( Π t = 1 i M t ( q ) ) start , c i ( Π t = i + 1 T + 1 M t ( q ) ) c i , end )
= 1 Z ( q ) α ( i ) β ( i )
(b)求
Figure G2009102208107D004010
E ~ f k = Σ q , c p ~ ( q , c ) f k ( q , c )
= Σ q , c p ~ ( q ) p ~ ( c | q ) f k ( q , c )
= Σ q p ~ ( q ) Σ i = 1 T Σ c i - 1 c i p ~ ( c i - 1 , c i | q ) f k ( c i - 1 , c i , q )
E ~ g k = Σ q , c p ~ ( q , c ) g k ( q , c )
= Σ q , c p ~ ( q ) p ~ ( c | q ) g k ( q , c )
= Σ q p ~ ( q ) Σ i = 1 T Σ c i p ~ ( c i | q ) g k ( c i , q )
(c)求迭代求λk、uk,直到λk、uk收敛:
δ λ k = 1 S 1 log E ~ f k E f k , 其中S1为大于1的常数,使得对任何q、c, Σ k = 0 n f k ( q , c ) = S 1
λk+1=λk+δλk
δ u k = 1 S 2 log E ~ g k E g k , 其中S2为大于1的常数,使得对任何q、c, Σ k = 0 n g k ( q , c ) = S 2
uk+1=uk+δuk
重复(a)、(b)、(c)步骤直到λk、uk收敛。
给定处于同一session查询序列q=q1,...,q(T-1),q(T),当前查询q(T)属于类型cT的条件概率:
p ( c T | q ) = Σ c 1 . . . c T - 1 p ( c | q )
= 1 Z ( q ) ( Σ startc 1 . . . c T - 1 Π t = 1 T + 1 M t ( c t - 1 , c t | q ) )
= 1 Z ( q ) ( Σ startc 1 . . . c T - 1 Π t = 1 T M t ( c t - 1 , c t | q ) ) M T + 1 ( c T , c end | q ) )
= 1 Z ( q ) ( ( Π t = 1 T M t ( q ) ) ) start , c T M T + 1 ( c T , c end | q )
= 1 Z ( q ) α T ( c T | q ) M T + 1 ( c T , c end | q )
把p(cT|q)作为即时兴趣模型类型为cT的对应维度的评分值。
本地特征函数gk的选取:
(1)给每个领域类型cT的所有主题词和相关词赋予一定的权重,由这些主题词和相关词的权重组成一个领域cT的向量,cT(t1,...,tn-1,tn)
cT中的词的权重的分配方法有两种,
一种是人工分配权重的方法:
cT的词的权重可以这样赋予:对于主题词赋予最大的权重,对于强相关词赋予中间大小的权重,对于弱相关词赋予最小权重。
比如:主题词(如餐饮领域cT的”川菜”)赋予权重1,强相关词(如餐饮领域cT的”辣”)赋予权重0.8,弱相关词(如餐饮领域cT的”香”)赋予权重0.5
另一种是通过学习自动分配权重的方法:
对每个领域cT收集一些有代表性的训练文本语料资料;
对语料样本进行切词,生存领域cT的词库;
计算领域cT中的词的权重,权重=TF×GIDF,其中TF为词在该领域cT所有语料中的词的总词频,GIDF为全局反向文档频率,GIDF=log(1+N/GDF),其中N为所有领域的所有文档的总数量,GDF为全局文档频率即为所有领域中包含该词的的所有文档的数量。
设置各个水平的阈值,如T1,T2,...,Tn,T1>T2>...>Tn
对领域cT词库中词根据其权重按上面阈值划分为多个档次的集合,Ti>总词频>Ti+1的为第个档次。
对各个档次的词分别赋予一定的最终评分值,第一档赋予最高评分值,中间档赋予中间大小的评分值,第n档赋予最小评分值。
由词库中的词及其最终评分值组成领域cT向量。
(2)给搜索请求的关键字赋予一定的权重,组成一个Query的向量,Query(q1,q2,...qn’)。
Query的关键字的权重可以这样赋予:
方法1:全部关键字赋予权重1;
方法2:排在最前面的关键字赋予最大权重(比如赋予权重1),排在中间的关键字赋予中间大小的权重(比如赋予0.5<权重<1),排在最后的关键字赋予最小权重(比如赋予权重0.5)。
(3)计算领域向量cT(t1,t2,...,tn)与查询向量qT(q1,q2,...,qn’)之间的Cousine相似度:
Sim ( q T ( q 1 , q 2 , . . . , qn , ) , c T ( t 1 , t 2 , . . . , tn ) )
= ( q 1 × t 1 + q 2 × t 2 + . . . . . . + qn × tn ) / ( q 1 2 + q 2 2 + . . . + qn 2 ×
t 1 2 + t 2 2 + . . . + tn 2 )
(4)g1(cT,qT)=sim(qT,cT);
(5)从搜索历史数据中收集查询q(t)的所有用户点击历史文档UT={uT},其中uT为查询qT对应的某个用户点击搜索结果文档的向量,计算uT与cT的cousine相似度:
sim ( c T ( t 1 , t 2 , . . . , tn ) , u T ( u 1 , u 2 , . . . , un ) )
= ( u 1 × t 1 + u 2 × t 2 + . . . . . . + un × tn ) / ( u 1 2 + u 2 2 + . . . + un 2 ×
t 1 2 + t 2 2 + . . . + tn 2
( 6 ) , g 2 ( c T , q T ) = Σ u T sim ( c T , u T ) | U T |
上下文相关的特征函数fk的选取:
(1)直接关联
设置查询序列对(qt-1,qt)的标记序列对为(ct-1,ct),本实施例用在给定查询序列对(qt-1,qt)前提下,标记序列对(ct-1,ct)出现的次数来计算f1(ct-1,ct,q)
f 1 ( c t - 1 , c t , q ) = O ( c t - 1 , c t ) O ( q t - 1 , q t )
其中O(ct-1,ct)为用在给定查询序列对(qt-1,qt)前提下,标记序列对(ct-1,ct)出现的次数。
O(qt-1,qt)为查询序列对(qt-1,qt)出现的总次数。
(2)利用分类目录树间接关联
假设标记序列对(ct-1,ct)处于分类目录树的第n层,(ct-1,ct)的祖先节点对的集合为1≤i≤n-1,本实施例用在给定查询序列对(qt-1,qt)前提下(ct-1,ct)的祖先节点对
Figure G2009102208107D00442
出现的次数来计算f2(ct-1,ct,q):
f 2 ( c t - 1 , c t , q ) = Σ i = 1 n - 1 O ( a c t - 1 ( i ) , a c t ( i ) ) O ( q t - 1 , q t )
其中,
Figure G2009102208107D00444
为在给定查询序列对(qt-1,qt)前提下(ct-1,ct)的祖先节点对
Figure G2009102208107D00445
出现的次数,O(qt-1,qt)为查询序列对(qt-1,qt)出现的总次数。
本实施例中,搜索应用服务器通过提取用户的即时兴趣模型和长期兴趣模型,使得搜索服务器可以根据用户的即时兴趣模型和长期兴趣模型进行相应的搜索,从而用户提供个性化的,满足用户需求的以及匹配精度高的搜索结果信息。
图9为本发明搜索服务器实施例一的结构示意图,如图9所示,本实施例的搜索服务器可以包括:第一接收模块11、第一处理模块12以及第一搜索模块13。其中,第一接收模块11用于接收搜索请求,所述搜索请求中携带所需搜索的关键词信息以及即时兴趣模型和长期兴趣模型;第一处理模块12用于根据各成员引擎元索引信息以及所述即时兴趣模型和长期兴趣模型,计算所述成员引擎的相关度评分值;第一搜索模块13用于根据所述相关度评分值选择一个或多个成员引擎对所述关键词信息进行搜索。
本实施例的搜索服务器,其实现原理与方法实施例一的实现原理相同,不再赘述。
本实施例中,搜索服务器在请求成员引擎搜索关键词信息之前,可以根据用户的即时兴趣模型和长期兴趣模型对成员引擎进行选择,从而能够选择获取与所需搜索的关键词信息以及即时兴趣模型和长期兴趣模型匹配较好的成员引擎对该关键词信息进行搜索,从而能够获取精度较高的搜索结果信息,进一步满足用户的搜索需求。
图10为本发明搜索服务器实施例二的结构示意图,如图10所示,本实施例的搜索服务器在图9所示的搜索服务器的基础上,进一步地,所述第一接收模块11接收的即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),...,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间。
所述第一处理模块12可以包括:第一计算单元121和第一处理单元122,其中,第一计算单元121用于计算所述关键词信息与成员引擎的元索引信息之间的第一最大相似度;计算在成员引擎的元索引信息与关键词信息的相似度大于第一阈值且成员引擎的元索引信息与长期兴趣模型的相似度大于第二阈值的基础上,成员引擎的元索引信息与即时兴趣模型的第二最大相似度;计算在成员引擎的元索引信息与关键词信息的相似度大于第三阈值且成员引擎的元索引信息与即时兴趣模型的相似度大于第四阈值的基础上,成员引擎的元索引信息与长期兴趣模型的第三最大相似度;计算在成员引擎的元索引信息与关键词信息的相似度大于第五阈值的基础上,成员引擎的元索引信息与长期兴趣模型和即时兴趣模型的加权相加的结果向量的第四最大相似度;第一处理单元122用于根据第一最大相似度、第二最大相似度、第三最大相似度和第四最大相似度计算成员引擎的相似度评分值。
本实施例的搜索服务器,其实现原理与方法实施例二的实现原理相同,不再赘述。
本实施例中,搜索服务器在请求成员引擎搜索关键词信息之前,可以根据用户的即时兴趣模型和长期兴趣模型对成员引擎进行选择,从而能够选择获取与所需搜索的关键词信息以及即时兴趣模型和长期兴趣模型匹配较好的成员引擎对该关键词信息进行搜索,从而能够获取精度较高的搜索结果信息,进一步满足用户的搜索需求。
图11为本发明搜索服务器实施例三的结构示意图,如图11所示,本实施例的搜索服务器可以包括:第二发送模块21、第二接收模块22以及第二处理模块23,其中,第二发送模块21用于向一个或多个成员引擎发送搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型;第二接收模块22用于接收所述一个或多个成员引擎搜索所述关键词信息后,根据所述即时兴趣模型和长期兴趣模型获取并反馈的搜索结果信息以及与所述搜索结果信息对应的评分信息;第二处理模块23用于根据所述评分信息和相关因素信息对所述搜索结果信息进行重新评分排序,获取重新评分排序后的搜索结果信息,并将所述重新评分排序后的搜索结果信息通过所述第二发送模块发送给所述搜索应用服务器。
进一步地,第二接收模块22还用于接收所述搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型。第二接收模块22接收的即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),...,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间。
本实施例的搜索服务器,其实现原理与方法实施例三和五的实现原理相同,不再赘述。
本实施例中,搜索服务器可以将搜索应用服务器提取的即时兴趣模型和长期兴趣模型发送给成员引擎,从而使得成员引擎在获取搜索结果信息后,可以根据用户的即时兴趣模型和长期兴趣模型对该搜索结果信息进行个性化的评分处理,从而获取各搜索结果信息相应的评分信息。当搜索服务器接收到成员引擎反馈的搜索结果信息以及相应的评分信息以后,还可以结合其它相关因素对搜索结果信息进行重新评分排序,从而可以获取个性化的、满足用户需求的以及匹配精度高的搜索结果信息。
图12为本发明搜索服务器实施例四的结构示意图,如图12所示,本实施例的搜索服务器可以包括:第三接收模块31、第三处理模块32以及第三发送模块33,其中,第三接收模块31用于接收搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型;并接收成员引擎根据所述关键词信息搜索获取的搜索结果信息;第三处理模块32用于根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理;第三发送模块33用于将评分排序处理后的搜索结果信息以及相应的评分信息发送给所述搜索应用服务器。
本实施例的搜索服务器,其实现原理与方法实施例六的实现原理相同,不再赘述。
本实施例中,搜索服务器可以根据用户的即时兴趣模型和长期兴趣模型对成员引擎反馈的搜索结果信息进行评分排序,从而用户提供个性化的,满足用户需求的以及匹配精度高的搜索结果信息。
图13为本发明搜索服务器实施例五的结构示意图,如图13所示,本实施例的搜索服务器在图12所示的搜索服务器的基础上,进一步地,第三处理模块32可以包括:第三计算单元321和第三处理单元322,其中,第三计算单元321用于计算所述即时兴趣模型与所述搜索结果信息的第一相似度;计算所述长期兴趣模型与所述搜索结果信息的第二相似度;第三处理单元322用于根据所述第一相似度和第二相似度获取评分值,并根据所述评分值对所述搜索结果信息进行排序处理。
本实施例的搜索服务器,其实现原理与方法实施例七的实现原理相同,不再赘述。
本实施例中,搜索服务器可以根据用户的即时兴趣模型和长期兴趣模型对成员引擎反馈的搜索结果信息进行评分排序,从而用户提供个性化的,满足用户需求的以及匹配精度高的搜索结果信息。
图14为本发明成员引擎设备实施例一的结构示意图,如图14所示,本实施例的成员引擎设备可以包括:第四接收模块41、第四处理模块42以及第四发送模块43,其中,第四接收模块41用于接收搜索请求,所述搜索请求中携带所需搜索的关键词信息以及即时兴趣模型和长期兴趣模型;第四处理模块42用于根据所述搜索请求对所述关键词信息进行搜索获取搜索结果信息,并根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理;第四发送模块43用于返回评分排序处理后的搜索结果信息。
本实施例的成员引擎设备,其实现原理与方法实施例四的实现原理相同,不再赘述。
本实施例中,成员引擎设备可以接收搜索服务器发送的即时兴趣模型和长期兴趣模型,从而在获取与关键词信息对应的搜索结果信息后,可以根据用户的即时兴趣模型和长期兴趣模型对该搜索结果信息进行个性化的评分处理,获取各搜索结果信息相应的评分信息。从而可以获取个性化的、满足用户需求的以及匹配精度高的搜索结果信息。
图15为本发明成员引擎设备实施例二的结构示意图,如图15所示,本实施例的成员引擎设备在图14所示的成员引擎设备的基础上,进一步地,第四处理模块42可以包括:第四计算单元421和第四处理单元422,其中,第四计算单元421用于计算所述即时兴趣模型与所述搜索结果信息的第一相似度;计算所述长期兴趣模型与所述搜索结果信息的第二相似度;第四处理单元422用于根据所述第一相似度和第二相似度获取评分值,并根据所述评分值对所述搜索结果信息进行排序处理。
本实施例的成员引擎设备,其实现原理与方法实施例四和五的实现原理相同,不再赘述。
本实施例中,成员引擎设备可以接收搜索服务器发送的即时兴趣模型和长期兴趣模型,从而在获取与关键词信息对应的搜索结果信息后,可以根据用户的即时兴趣模型和长期兴趣模型对该搜索结果信息进行个性化的评分处理,获取各搜索结果信息相应的评分信息。从而可以获取个性化的、满足用户需求的以及匹配精度高的搜索结果信息。
图16为本发明搜索应用服务器实施例的结构示意图,如图16所示,本实施例的搜索应用服务器可以包括:第五接收模块51、第五处理模块52以及第五发送模块53,其中,第五接收模块51用于接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息;第五处理模块52用于从用户数据库中提取即时兴趣模型和长期兴趣模型;第五发送模块53用于向搜索服务器发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型,以使所述搜索服务器根据所述即时兴趣模型和长期兴趣模型对所述关键词信息进行搜索。
进一步地,第五处理模块52具体用于应用条件随机场模型计算在给定与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),....q(t-1),q(t)的条件下,当前查询q(t)的输出类型的条件概率,将该条件概率值作为即时兴趣模型与该输出类型对应的兴趣维度的评分值。
本实施例的搜索应用服务器,其实现原理与方法实施例八的实现原理相同,不再赘述。
本实施例中,搜索应用服务器通过提取用户的即时兴趣模型和长期兴趣模型,使得搜索服务器可以根据用户的即时兴趣模型和长期兴趣模型进行相应的搜索,从而用户提供个性化的,满足用户需求的以及匹配精度高的搜索结果信息。
图17为本发明移动搜索系统实施例一的结构示意图,如图17所示,本实施例的系统可以包括:第一搜索应用服务器1、第一搜索服务器2以及第一成员引擎设备3,其中,第一搜索应用服务器1用于接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息;从用户数据库中提取即时兴趣模型和长期兴趣模型;向第一搜索服务器2发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型;第一搜索服务器2用于接收所述第一搜索应用服务器1发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及第一搜索应用服务器1获取的即时兴趣模型和长期兴趣模型;根据关键词信息、各成员引擎的元索引信息以及所述即时兴趣模型和长期兴趣模型,计算所述成员引擎的相关度评分值,根据所述相关度评分值从第一成员引擎设备3中选择一个或多个成员引擎对所述关键词信息进行搜索;第一成员引擎设备3用于接收所述第一搜索服务器2发送的搜索请求,对所述关键词信息进行搜索,并将搜索结果信息发送给所述第一搜索服务器2,以使所述第一搜索服务器2通过所述第一搜索应用服务器1将所述搜索结果信息反馈给所述搜索客户端。
本实施例的移动搜索系统中,第一搜索服务器在请求第一成员引擎设备搜索关键词信息之前,可以根据第一搜索应用服务器发送的用户的即时兴趣模型和长期兴趣模型对第一成员引擎设备进行选择,从而能够选择获取与所需搜索的关键词信息匹配以及即时兴趣模型和长期兴趣模型较好的第一成员引擎设备中的成员引擎对该关键词信息进行搜索,从而能够获取精度较高的搜索结果信息,进一步满足用户的搜索需求。
图18为本发明移动搜索系统实施例二的结构示意图,如图18所示,本实施例的系统可以包括:第二搜索应用服务器4、第二搜索服务器5以及第二成员引擎设备6,其中,第二搜索应用服务器4用于接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息;从用户数据库中提取即时兴趣模型和长期兴趣模型;向第二搜索服务器5发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型;第二搜索服务器5用于向第二成员引擎设备6发送搜索请求,所述搜索请求中携带所需搜索的关键词信息以及第二搜索应用服务器4获取的即时兴趣模型和长期兴趣模型;接收所述第二成员引擎设备6反馈的搜索结果信息以及与所述搜索结果信息对应的评分信息;根据所述评分信息和相关因素信息对所述搜索结果信息进行重新评分排序,获取重新评分排序后的搜索结果信息,并将所述重新评分排序后的搜索结果信息发送给所述第二搜索应用服务器4;第二成员引擎设备6用于接收所述第二搜索服务器5发送的搜索请求,对所述关键词信息进行搜索,根据所述即时兴趣模型和长期兴趣模型获取搜索结果信息以及与所述搜索结果信息对应的评分信息,并将所述搜索结果信息以及评分信息发送给所述第二搜索服务器5。
本实施例的移动搜索系统中,第二搜索服务器可以将第二搜索应用服务器提取的即时兴趣模型和长期兴趣模型发送给第二成员引擎设备,从而使得第二成员引擎设备在获取搜索结果信息后,可以根据用户的即时兴趣模型和长期兴趣模型对该搜索结果信息进行个性化评分处理,从而获取各搜索结果信息相应的评分信息。当第二搜索服务器接收到第二成员引擎设备反馈的搜索结果信息以及相应的评分信息以后,还可以结合其它相关因素对搜索结果信息进行重新评分排序,从而可以获取个性化的、满足用户需求的以及匹配精度高的搜索结果信息。
图19为本发明移动搜索系统实施例三的结构示意图,如图19所示,本实施例的系统可以包括:第三搜索应用服务器7、第三搜索服务器8以及第三成员引擎设备9,其中,第三搜索应用服务器7用于接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息;从用户数据库中提取即时兴趣模型和长期兴趣模型;向第三搜索服务器8发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型;第三搜索服务器8用于接收第三搜索应用服务器7发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型;接收第三成员引擎设备9根据所述关键词信息搜索获取的搜索结果信息,并根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理;并将评分排序处理后的搜索结果信息以及相应的评分信息发送给所述第三搜索应用服务器7;第三成员引擎设备9用于接收所述第三搜索服务器8发送的搜索请求,对所述关键词信息进行搜索,获取所述搜索结果信息。
本实施例的移动搜索系统,第三搜索服务器可以根据第三搜索应用服务器提取的用户的即时兴趣模型和长期兴趣模型对第三成员引擎设备反馈的搜索结果信息进行评分排序,从而用户提供个性化的、满足用户需求的以及匹配精度高的搜索结果信息。
本发明的各个装置、服务器和系统实施例中所提供各个单元之间的交互及相关信息均可以参考前述各个方法实施例提供的相关流程,具体功能和处理流程请参见前述各个实施例,此处不再赘述。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (25)

1.一种移动搜索方法,其特征在于,包括: 
搜索服务器接收搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及所述搜索应用服务器获取的即时兴趣模型和长期兴趣模型; 
所述搜索服务器根据所述搜索请求、各成员引擎的元索引信息以及所述即时兴趣模型和长期兴趣模型,计算所述成员引擎的相关度评分值; 
所述搜索服务器根据所述相关度评分值选择一个或多个成员引擎对所述关键词信息进行搜索; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与所述搜索请求对应的当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间,所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
2.根据权利要求1所述的移动搜索方法,其特征在于,所述搜索服务器根据各成员引擎的元索引信息以及所述即时兴趣模型和长期兴趣模型,计算所述成员引擎的相关度评分值,包括: 
所述搜索服务器计算所述关键词信息与成员引擎的元索引信息之间的第一最大相似度;计算在成员引擎的元索引信息与关键词信息的相似度大于第一阈值且成员引擎的元索引信息与长期兴趣模型的相似度大于第二阈值的基础上,成员引擎的元索引信息与即时兴趣模型的第二最大相似度;计算在成员引擎的元索引信息与关键词信息的相似度大于第三阈值且成员引擎的元索引信息与即时兴趣模型的相似度大于第四阈值的基础上,成员引擎的元索引信息与长期兴趣模型的第三最大相似度;计算在成员引擎的元索引信息与关键词信息的相似度大于第五阈值的基础上,成员引擎的元索引信息与长期兴 趣模型和即时兴趣模型的加权相加的结果向量的第四最大相似度; 
所述搜索服务器根据第一最大相似度、第二最大相似度、第三最大相似度和第四最大相似度计算成员引擎的相似度评分值。 
3.根据权利要求2所述的移动搜索方法,其特征在于,所述搜索服务器根据第一最大相似度、第二最大相似度、第三最大相似度和第四最大相似度计算成员引擎的相似度评分值,包括: 
所述搜索服务器对第一最大相似度、第二最大相似度、第三最大相似度和第四最大相似度加权相加、或相乘、或取最大值,获取相似度评分值。 
4.一种移动搜索方法,其特征在于,包括: 
搜索服务器向一个或多个成员引擎发送搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型; 
所述搜索服务器接收所述一个或多个成员引擎根据所述关键词信息、所述即时兴趣模型和长期兴趣模型获取的搜索结果信息以及与所述搜索结果信息对应的评分信息; 
所述搜索服务器根据所述评分信息和相关因素信息对所述搜索结果信息进行重新评分排序,获取重新评分排序后的搜索结果信息,并将所述重新评分排序后的搜索结果信息发送给所述搜索应用服务器; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间;所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
5.根据权利要求4所述的移动搜索方法,其特征在于,还包括: 
所述搜索服务器接收所述搜索应用服务器发送的搜索请求,所述搜索请 求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型。 
6.根据权利要求4或5所述的移动搜索方法,其特征在于,所述相关因素信息包括:成员引擎级别信息和/或价格信息,所述搜索服务器根据所述评分信息和相关因素信息对所述搜索结果信息进行重新评分排序,包括: 
所述搜索服务器根据所述评分信息、成员引擎级别信息和/或价格信息,计算所述搜索结果的综合评分值,并根据所述综合评分值对所述搜索结果信息进行排序处理。 
7.一种移动搜索方法,其特征在于,包括: 
搜索服务器接收搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型; 
所述搜索服务器接收成员引擎根据所述关键词信息搜索获取的搜索结果信息,并根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理; 
所述搜索服务器将评分排序处理后的搜索结果信息以及相应的评分信息发送给所述搜索应用服务器; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与所述搜索请求对应的当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间;所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
8.根据权利要求7所述的移动搜索方法,其特征在于,所述搜索服务器根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理,包括: 
所述搜索服务器计算所述即时兴趣模型与所述搜索结果信息的第一相似度; 
所述搜索服务器计算所述长期兴趣模型与所述搜索结果信息的第二相似度; 
所述搜索服务器根据所述第一相似度和第二相似度获取评分值,并根据所述评分值对所述搜索结果信息进行排序处理。 
9.一种移动搜索方法,其特征在于,包括: 
成员引擎接收搜索服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及即时兴趣模型和长期兴趣模型; 
所述成员引擎对所述关键词信息进行搜索,获取搜索结果信息,并根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理; 
所述成员引擎返回评分排序处理后的搜索结果信息; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间;所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
10.根据权利要求9所述的移动搜索方法,其特征在于,所述根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理,包括: 
计算所述即时兴趣模型与所述搜索结果信息的第一相似度; 
计算所述长期兴趣模型与所述搜索结果信息的第二相似度; 
根据所述第一相似度和第二相似度获取评分值,并根据所述评分值对所述搜索结果信息进行排序处理。 
11.一种移动搜索方法,其特征在于,包括: 
搜索应用服务器接收搜索客户端发送的搜索请求消息,所述搜索请求消 息中携带关键词信息; 
所述搜索应用服务器从用户数据库中提取即时兴趣模型和长期兴趣模型; 
所述搜索应用服务器向搜索服务器发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型,以使所述搜索服务器根据所述即时兴趣模型和长期兴趣模型对所述关键词信息进行搜索; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间;所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
12.根据权利要求11所述的移动搜索方法,其特征在于,所述搜索应用服务器从用户数据库中提取即时兴趣模型,包括: 
所述搜索应用服务器应用条件随机场模型计算在给定与所述搜索请求对应的当前查询q(t)处于同一搜索上下文会话的查询序列q(1),....q(t-1),q(t)的条件下,当前查询q(t)的输出类型的条件概率,将该条件概率值作为即时兴趣模型与该输出类型对应的兴趣维度的评分值。 
13.一种搜索服务器,其特征在于,包括: 
第一接收模块,用于接收搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及所述搜索应用服务器获取的即时兴趣模型和长期兴趣模型; 
第一处理模块,用于根据所述搜索请求、各成员引擎的元索引信息以及所述即时兴趣模型和长期兴趣模型,计算所述成员引擎的相关度评分值; 
第一搜索模块,用于根据所述相关度评分值选择一个或多个成员引擎对所述关键词信息进行搜索; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间;所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
14.根据权利要求13所述的搜索服务器,其特征在于,所述第一处理模块包括: 
第一计算单元,用于计算所述关键词信息与成员引擎的元索引信息之间的第一最大相似度;计算在成员引擎的元索引信息与关键词信息的相似度大于第一阈值且成员引擎的元索引信息与长期兴趣模型的相似度大于第二阈值的基础上,成员引擎的元索引信息与即时兴趣模型的第二最大相似度;计算在成员引擎的元索引信息与关键词信息的相似度大于第三阈值且成员引擎的元索引信息与即时兴趣模型的相似度大于第四阈值的基础上,成员引擎的元索引信息与长期兴趣模型的第三最大相似度;计算在成员引擎的元索引信息与关键词信息的相似度大于第五阈值的基础上,成员引擎的元索引信息与长期兴趣模型和即时兴趣模型的加权相加的结果向量的第四最大相似度; 
第一处理单元,用于根据第一最大相似度、第二最大相似度、第三最大相似度和第四最大相似度计算成员引擎的相似度评分值。 
15.一种搜索服务器,其特征在于,包括: 
第二发送模块,用于向一个或多个成员引擎发送搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型; 
第二接收模块,用于接收所述一个或多个成员引擎根据所述关键词信息、所述即时兴趣模型和长期兴趣模型获取的搜索结果信息以及与所述搜索结果信息对应的评分信息; 
第二处理模块,用于根据所述评分信息和相关因素信息对所述搜索结果信息进行重新评分排序,获取重新评分排序后的搜索结果信息,并将所述重新评分排序后的搜索结果信息通过所述第二发送模块发送给所述搜索应用服务器; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间;所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
16.根据权利要求15所述的搜索服务器,其特征在于,所述第二接收模块还用于接收所述搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型。 
17.一种搜索服务器,其特征在于,包括: 
第三接收模块,用于接收搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型;并接收成员引擎根据所述关键词信息搜索获取的搜索结果信息; 
第三处理模块,用于根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理; 
第三发送模块,用于将评分排序处理后的搜索结果信息以及相应的评分信息发送给所述搜索应用服务器; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间;所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
18.根据权利要求17所述的搜索服务器,其特征在于,所述第三处理模块包括: 
第三计算单元,用于计算所述即时兴趣模型与所述搜索结果信息的第一相似度;计算所述长期兴趣模型与所述搜索结果信息的第二相似度; 
第三处理单元,用于根据所述第一相似度和第二相似度获取评分值,并根据所述评分值对所述搜索结果信息进行排序处理。 
19.一种成员引擎设备,其特征在于,包括: 
第四接收模块,用于接收搜索服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及即时兴趣模型和长期兴趣模型; 
第四处理模块,用于根据所述搜索请求对所述关键词信息进行搜索获取搜索结果信息,并根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理; 
第四发送模块,用于返回评分排序处理后的搜索结果信息; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间;所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
20.根据权利要求19所述的成员引擎设备,其特征在于,所述第四处理模块包括: 
第四计算单元,用于计算所述即时兴趣模型与所述搜索结果信息的第一相似度;计算所述长期兴趣模型与所述搜索结果信息的第二相似度; 
第四处理单元,用于根据所述第一相似度和第二相似度获取评分值,并根据所述评分值对所述搜索结果信息进行排序处理。 
21.一种搜索应用服务器,其特征在于,包括: 
第五接收模块,用于接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息; 
第五处理模块,用于从用户数据库中提取即时兴趣模型和长期兴趣模型; 
第五发送模块,用于向搜索服务器发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型,以使所述搜索服务器根据所述即时兴趣模型和长期兴趣模型对所述关键词信息进行搜索; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间;所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
22.根据权利要求21所述的搜索应用服务器,其特征在于,所述第五处理模块具体用于应用条件随机场模型计算在给定与所述搜索请求对应的当前查询q(t)处于同一搜索上下文会话的查询序列q(1),....q(t-1),q(t)的条件下,当前查询q(t)的输出类型的条件概率,将该条件概率值作为即时兴趣模型与该输出类型对应的兴趣维度的评分值。 
23.一种移动搜索系统,其特征在于,包括: 
第一搜索应用服务器,用于接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息;从用户数据库中提取即时兴趣模型和长期兴趣模型;向第一搜索服务器发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型; 
第一搜索服务器,用于接收所述第一搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及所述第一搜索应用服务器获取的即时兴趣模型和长期兴趣模型;根据所述搜索请求、各成员引擎的元索引信息以及所述即时兴趣模型和长期兴趣模型,计算所述成员引擎的相关度 评分值,根据所述相关度评分值从第一成员引擎设备中选择一个或多个成员引擎对所述关键词信息进行搜索; 
第一成员引擎设备,用于接收所述第一搜索服务器发送的搜索请求,对所述关键词信息进行搜索,并将搜索结果信息发送给所述第一搜索服务器,以使所述第一搜索服务器通过所述第一搜索应用服务器将所述搜索结果信息反馈给所述搜索客户端; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间;所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
24.一种移动搜索系统,其特征在于,包括: 
第二搜索应用服务器,用于接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息;从用户数据库中提取即时兴趣模型和长期兴趣模型;向第二搜索服务器发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型; 
第二搜索服务器,用于向第二成员引擎设备发送搜索请求,所述搜索请求中携带所需搜索的关键词信息以及第二搜索应用服务器获取的即时兴趣模型和长期兴趣模型;接收所述第二成员引擎设备反馈的搜索结果信息以及与所述搜索结果信息对应的评分信息;根据所述评分信息和相关因素信息对所述搜索结果信息进行重新评分排序,获取重新评分排序后的搜索结果信息,并将所述重新评分排序后的搜索结果信息发送给所述第二搜索应用服务器; 
第二成员引擎设备,用于接收所述第二搜索服务器发送的搜索请求,对所述关键词信息进行搜索,根据所述即时兴趣模型和长期兴趣模型获取搜索结果信息以及与所述搜索结果信息对应的评分信息,并将所述搜索结果信息 以及评分信息发送给所述第二搜索服务器; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间;所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
25.一种移动搜索系统,其特征在于,包括: 
第三搜索应用服务器,用于接收搜索客户端发送的搜索请求消息,所述搜索请求消息中携带关键词信息;从用户数据库中提取即时兴趣模型和长期兴趣模型;向第三搜索服务器发送搜索请求,所述搜索请求中携带关键词信息以及所述即时兴趣模型和长期兴趣模型; 
第三搜索服务器,用于接收第三搜索应用服务器发送的搜索请求,所述搜索请求中携带所需搜索的关键词信息以及搜索应用服务器获取的即时兴趣模型和长期兴趣模型;接收第三成员引擎设备根据所述关键词信息搜索获取的搜索结果信息,并根据所述即时兴趣模型和长期兴趣模型对所述搜索结果信息进行评分排序处理;并将评分排序处理后的搜索结果信息以及相应的评分信息发送给所述第三搜索应用服务器; 
第三成员引擎设备,用于接收所述第三搜索服务器发送的搜索请求,对所述关键词信息进行搜索,获取所述搜索结果信息; 
其中,所述即时兴趣模型为N个维度的评分值组成的即时兴趣模型向量,各个维度的评分值由与当前查询q(t)处于同一搜索上下文会话的查询序列q(1),…,q(t-1),q(t)的相关数据计算得到,所述搜索上下文会话为当前查询q(t)发生之前包括当前查询q(t)发生时间在内的一段预设时间;所述长期兴趣模型为N个维度的评分值所组成的长期兴趣模型向量,各个维度的评分值由用户搜索历史数据和静态档案profile计算得到。 
CN200910220810.7A 2009-11-06 2009-11-06 移动搜索方法、装置和系统 Active CN102056335B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN200910220810.7A CN102056335B (zh) 2009-11-06 2009-11-06 移动搜索方法、装置和系统
PCT/CN2010/077773 WO2011054245A1 (zh) 2009-11-06 2010-10-15 移动搜索方法、装置和系统
US13/464,391 US8983971B2 (en) 2009-11-06 2012-05-04 Method, apparatus, and system for mobile search

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910220810.7A CN102056335B (zh) 2009-11-06 2009-11-06 移动搜索方法、装置和系统

Publications (2)

Publication Number Publication Date
CN102056335A CN102056335A (zh) 2011-05-11
CN102056335B true CN102056335B (zh) 2014-02-19

Family

ID=43960105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910220810.7A Active CN102056335B (zh) 2009-11-06 2009-11-06 移动搜索方法、装置和系统

Country Status (3)

Country Link
US (1) US8983971B2 (zh)
CN (1) CN102056335B (zh)
WO (1) WO2011054245A1 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030217106A1 (en) * 2002-03-25 2003-11-20 Eytan Adar System and method for profiling clients within a system for harvesting community knowledge
CN102890689B (zh) * 2011-07-22 2017-06-06 北京百度网讯科技有限公司 一种用户兴趣模型的建立方法及系统
US20130041750A1 (en) * 2011-08-12 2013-02-14 Founton Technologies, Ltd. Method of attention-targeting for online advertisement
CN103377200B (zh) * 2012-04-17 2018-09-04 腾讯科技(深圳)有限公司 用户偏好信息采集方法和装置
CN104428734A (zh) 2012-06-25 2015-03-18 微软公司 输入法编辑器应用平台
CN104823183B (zh) * 2012-08-30 2018-04-24 微软技术许可有限责任公司 基于特征的候选选择
CN102970352A (zh) * 2012-11-08 2013-03-13 北京小米科技有限责任公司 提供信息的方法及装置
CN103870458B (zh) * 2012-12-07 2017-07-18 富士通株式会社 数据处理装置、数据处理方法和程序
US10210547B1 (en) 2013-11-25 2019-02-19 Groupon, Inc. Predictive recommendation system using contextual relevance
CN104679743B (zh) * 2013-11-26 2019-10-29 阿里巴巴集团控股有限公司 一种确定用户的偏好模式的方法及装置
CN103744830A (zh) * 2013-12-31 2014-04-23 北京锐安科技有限公司 基于语义分析的excel文档中身份信息的识别方法
US8837835B1 (en) * 2014-01-20 2014-09-16 Array Technology, LLC Document grouping system
CN104850537B (zh) * 2014-02-17 2017-12-15 腾讯科技(深圳)有限公司 对文本内容进行筛选的方法及装置
US9535960B2 (en) * 2014-04-14 2017-01-03 Microsoft Corporation Context-sensitive search using a deep learning model
CN104915429B (zh) * 2015-06-15 2018-09-04 小米科技有限责任公司 关键词搜索方法及装置
US10409823B2 (en) * 2015-12-29 2019-09-10 Facebook, Inc. Identifying content for users on online social networks
US10037365B2 (en) * 2016-01-29 2018-07-31 Integral Search International Ltd. Computer-implemented patent searching method in connection to matching degree
CN107291442B (zh) * 2017-04-28 2020-01-10 中国农业大学 一种旅游游戏设计模型的选取方法及旅游游戏设计方法
CN109033140B (zh) * 2018-06-08 2020-05-29 北京百度网讯科技有限公司 一种确定搜索结果的方法、装置、设备和计算机存储介质
JP7183600B2 (ja) 2018-07-20 2022-12-06 株式会社リコー 情報処理装置、システム、方法およびプログラム
CN110245299B (zh) * 2019-06-19 2022-02-08 中国人民解放军国防科技大学 一种基于动态交互注意力机制的序列推荐方法及其系统
CN111078849B (zh) * 2019-12-02 2023-07-25 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN112182387B (zh) * 2020-09-29 2023-08-25 中国人民大学 一种时间信息增强的个性化搜索方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140582A (zh) * 2007-09-27 2008-03-12 中兴通讯股份有限公司 用户偏好生成系统和方法
US7395259B2 (en) * 1999-12-08 2008-07-01 A9.Com, Inc. Search engine system and associated content analysis methods for locating web pages with product offerings
CN101317176A (zh) * 2005-11-29 2008-12-03 泰普有限公司 利用后台处理在移动设备浏览器上显示搜索结果

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6963867B2 (en) * 1999-12-08 2005-11-08 A9.Com, Inc. Search query processing to provide category-ranked presentation of search results
US7428529B2 (en) * 2004-04-15 2008-09-23 Microsoft Corporation Term suggestion for multi-sense query

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7395259B2 (en) * 1999-12-08 2008-07-01 A9.Com, Inc. Search engine system and associated content analysis methods for locating web pages with product offerings
CN101317176A (zh) * 2005-11-29 2008-12-03 泰普有限公司 利用后台处理在移动设备浏览器上显示搜索结果
CN101140582A (zh) * 2007-09-27 2008-03-12 中兴通讯股份有限公司 用户偏好生成系统和方法

Also Published As

Publication number Publication date
US20120221544A1 (en) 2012-08-30
CN102056335A (zh) 2011-05-11
US8983971B2 (en) 2015-03-17
WO2011054245A1 (zh) 2011-05-12

Similar Documents

Publication Publication Date Title
CN102056335B (zh) 移动搜索方法、装置和系统
CN101661474B (zh) 一种搜索方法和系统
Ozsoy From word embeddings to item recommendation
CN101321190B (zh) 一种异构网络中的推荐方法及推荐系统
CN102063469B (zh) 一种用于获取相关关键词信息的方法、装置和计算机设备
CN103309886A (zh) 一种基于交易平台的结构化信息搜索方法和装置
CN102411754A (zh) 一种基于商品属性熵值的个性化推荐方法
CN102063432A (zh) 一种检索方法和系统
US20100318427A1 (en) Enhancing database management by search, personal search, advertising, and databases analysis efficiently using core-set implementations
EP2524344A1 (en) Matching of advertising sources and keyword sets in online commerce platforms
CN101685456B (zh) 一种搜索的方法、系统和装置
CN109410001A (zh) 一种商品推荐方法、系统、电子设备和存储介质
CN104572733A (zh) 用户兴趣标签分类的方法及装置
Calumby et al. Diversity-based interactive learning meets multimodality
CN114254615A (zh) 组卷方法、装置、电子设备和存储介质
Rao et al. Product recommendation system from users reviews using sentiment analysis
CN108572981B (zh) 一种信息推荐方法及装置
CN104615685A (zh) 一种面向网络话题的热度评价方法
CN115618127A (zh) 一种神经网络推荐系统协同过滤算法
CN108595595B (zh) 一种基于交互式差分进化计算的用户知识需求获取方法
Huang et al. Rough-set-based approach to manufacturing process document retrieval
CN104915395A (zh) 一种用于查询主体的关联信息的方法和装置
CN111694929B (zh) 基于数据图谱的搜索方法、智能终端和可读存储介质
Huang et al. Personality mining method in web based education system using data mining
Han et al. Cigarette Brand Recommendation Based on Consumer Modeling

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant