CN104239440B - 搜索结果的展现方法和装置 - Google Patents
搜索结果的展现方法和装置 Download PDFInfo
- Publication number
- CN104239440B CN104239440B CN201410439768.9A CN201410439768A CN104239440B CN 104239440 B CN104239440 B CN 104239440B CN 201410439768 A CN201410439768 A CN 201410439768A CN 104239440 B CN104239440 B CN 104239440B
- Authority
- CN
- China
- Prior art keywords
- search
- search results
- user
- click
- attribute information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000012163 sequencing technique Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000003542 behavioural effect Effects 0.000 claims description 5
- 230000006399 behavior Effects 0.000 description 22
- 238000005070 sampling Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种搜索结果的展现方法和装置。其中,该方法包括:接收用户输入的搜索词,并根据搜索词获取多个搜索结果;获取用户的情景属性信息;根据情景属性信息对多个搜索结果进行排序;以及根据排序后的多个搜索结果生成搜索结果展现界面。本发明实施例的搜索结果的展现方法,使搜索引擎提供的搜索结果排序场景化,搜索结果更加符合用户的需求,明显降低了用户点击搜索结果的次数,提高了用户体验。
Description
技术领域
本发明涉及搜索引擎技术领域,尤其涉及一种搜索结果的展现方法和装置。
背景技术
随着信息化的飞速发展,用户通过搜索引擎进行信息查询的频率也越来越高。通常来说,用户在搜索引擎提供的搜索栏中输入需要查询的搜索词,搜索引擎对搜索词进行匹配,然后将搜索结果显示给用户。
目前,搜索引擎在显示搜索结果页面时,对搜索结果排序的主要目的是将大部分用户需要的结果排在最前面,使得用户最方便的获取信息。然而,随着用户使用移动终端进行搜索的频率越来越高,用户在不同的情景下需求可能是不一样的。同时,由于移动终端屏幕的尺寸较小,对搜索结果的精准度也提出了更高的需求。因此,传统的对搜索结果排序的方式,不能给用户提供更加准确的搜索结果,用户查看到自己满意的搜索结果需要点击的次数普遍很多,不能更好的满足用户的需求。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种搜索结果的展现方法,该方法使搜索引擎提供的搜索结果排序场景化,搜索结果更加符合用户的需求,明显降低了用户点击搜索结果的次数,提高了用户体验。
本发明的第二个目的在于提出一种搜索结果的展现装置。
为达上述目的,本发明第一方面实施例提出了一种搜索结果的展现方法,包括:接收用户输入的搜索词,并根据所述搜索词获取多个搜索结果;获取所述用户的情景属性信息;根据所述情景属性信息对所述多个搜索结果进行排序;以及根据排序后的多个搜索结果生成搜索结果展现界面。
本发明实施例的搜索结果的展现方法,搜索引擎在接收用户输入搜索词时,获取用户所处情景的情景属性信息,根据情景属性信息对多个搜索结果进行排序,使搜索引擎提供的搜索结果排序场景化,搜索结果更加符合用户的需求,明显降低了用户点击搜索结果的次数,提高了用户体验。
为达上述目的,本发明第二方面实施例提出了一种搜索结果的展现装置,包括:第一获取模块,用于接收用户输入的搜索词,并根据所述搜索词获取多个搜索结果;第二获取模块,用于获取所述用户的情景属性信息;排序模块,用于根据所述情景属性信息对所述多个搜索结果进行排序;以及展现模块,用于根据排序后的多个搜索结果生成搜索结果展现界面。
本发明实施例的搜索结果的展现装置,搜索引擎在接收用户输入搜索词时,获取用户所处情景的情景属性信息,根据情景属性信息对多个搜索结果进行排序,使搜索引擎提供的搜索结果排序场景化,搜索结果更加符合用户的需求,明显降低了用户点击搜索结果的次数,提高了用户体验。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一个实施例的搜索结果的展现方法的流程图;
图2(a)-(b)是本发明一个实施例的基于场景的搜索结果排序的示意图;
图3是本发明一个具体实施例的搜索结果的展现方法的流程图;
图4是本发明一个实施例的采样次数和错排率之间关系的示意图;
图5是本发明一个实施例的搜索结果的展现装置的结构示意图;以及
图6是本发明一个具体实施例的搜索结果的展现装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
为了更好的满足用户使用移动终端进行搜索的需求,本发明提出了一种基于用户使用情景对搜索结果进行排序的方法,针对用户不同的使用情景给出不同的搜索结果排序,由此,用户点击查看搜索结果的次数明显的降低,提高了搜索引擎服务的准确性,同时提升了用户的使用体验。图1是本发明一个实施例的搜索结果的展现方法的流程图。
如图1所示,搜索结果的展现方法包括:
S101,接收用户输入的搜索词,并根据搜索词获取多个搜索结果。
具体而言,搜索引擎在搜索界面中提供搜索输入框,用户可在搜索输入框中输入搜索词。在搜索引擎接收到用户输入的搜索词之后,搜索引擎根据搜索词发起查询,获取到该搜索词对应的多个搜索结果。
S102,获取用户的情景属性信息。
在本发明的一个实施例中,情景属性信息包括但不限于搜索时间、终端类型、网络类型、地理位置、用户属性中的一个或者多个。具体地,用户在搜索引擎中发起搜索请求之后,搜索引擎获取用户当前所处情景的情景属性信息。例如,用户的搜索时间包含工作时间、午休时间、下班时间或者节假日时间等;用户使用的移动终端的网络类型包含蜂窝移动网络(2g/3g/4g),无线局域网(Wifi)等;用户的地理位置包含具体位置或者抽象的地理位置,例如家中、工作地点等;用户的属性包含用户的各种偏好。
S103,根据情景属性信息对多个搜索结果进行排序。
具体地,搜索引擎根据用户当前所处情景的情景属性信息对多个搜索结果进行排序,例如,如果用户使用移动终端的网络类型为3g网络,在搜索电影时,由于用户使用3g网络受到流量的限制,用户的主要需求是查看该电影的介绍,此时应当将包含电影介绍的搜索结果排在多个搜索结果的最前面。举例而言,如图2(a)所示,用户搜索“前任攻略”时,如果用户所处的情景是下班路途中,移动终端使用的网络类型是3g网络,则搜索引擎将搜索结果“前任攻略的_百度百科”排在多个搜索结果的最前面。
如果用户使用移动终端的网络类型为Wifi网络,用户的主要需求是观看电影,此时应当将包含播放电影的搜索结果排在多个搜索结果的最前面。换言之,搜索引擎考虑了用户的情境化需求,结合用户的情景属性信息来预测用户的需求,根据情景属性信息对多个搜索结果进行重排序。举例而言,如图2(b)所示,用户搜索“前任攻略”时,如果用户所处的情景是家中,移动终端使用的网络类型是Wifi网络,则搜索引擎将搜索结果“电影前任攻略”排在多个搜索结果的最前面。
S104,根据排序后的多个搜索结果生成搜索结果展现界面。
具体地,搜索引擎将排序后的多个搜索结果在展现界面中展现给用户,用户选择自己需要的搜索结果,点击该搜索结果进行浏览。
本发明实施例的搜索结果的展现方法,搜索引擎在接收用户输入搜索词时,获取用户所处情景的情景属性信息,根据情景属性信息对多个搜索结果进行排序,使搜索引擎提供的搜索结果排序场景化,搜索结果更加符合用户的需求,明显降低了用户点击搜索结果的次数,提高了用户体验。
图3是本发明一个具体实施例的搜索结果的展现方法的流程图。
如图3所示,搜索结果的展现方法包括:
S301,接收用户输入的搜索词,并根据搜索词获取多个搜索结果。
具体而言,搜索引擎在搜索界面中提供搜索输入框,用户可在搜索输入框中输入搜索词。在搜索引擎接收到用户输入的搜索词之后,搜索引擎根据搜索词发起查询,获取到该搜索词对应的多个搜索结果。
S302,获取用户的情景属性信息。
在本发明的一个实施例中,情景属性信息包括但不限于搜索时间、终端类型、网络类型、地理位置、用户属性中的一个或者多个。具体地,用户在搜索引擎中发起搜索请求之后,搜索引擎获取用户当前所处情景的情景属性信息。例如,用户的搜索时间包含工作时间、午休时间、下班时间或者节假日时间等;用户使用的移动终端的网络类型包含蜂窝移动网络(2g/3g/4g),无线局域网(Wifi)等;用户的地理位置包含具体位置或者抽象的地理位置,例如家中、工作地点等;用户的属性包含用户的各种偏好。
S303,根据情景属性信息建立情景模型。
具体地,搜索引擎根据情景属性信息构建情景模型其中,用M表示情景模型,情景属性信息用向量来表示(F1,F2,F3,F4…Fn)。表示搜索结果情景化后的权值,其中,w表示搜索结果的基础权值。
S304,获取搜索词和多个搜索结果的相关性分值。
在本发明的一个实施例中,获取用户的行为数据,并根据行为数据计算多个搜索结果的相关性分值。
在本发明的一个实施例中,根据多个搜索结果的点击率和满意点击率计算多个搜索结果的当天点击分值,并获取多个搜索结果的历史点击分值,以及根据多个搜索结果的历史点击分值和当天点击分值计算多个搜索结果的相关性分值。
具体地,的计算目标可以采用人工标注的方法,但是这样的代价是很昂贵的。用户在移动情景下的用户行为数据,在采样足够多的情况下,在很大程度能够拟合
其中,表示在特定的情景下,用户行为模型的相关性分值,搜索引擎可以用该相关性分值作为的学习目标。采样的次数越多,Score的分值和越接近。采样次数的降低,会增加情景模型的权值发生错排的概率。
进一步而言,采样次数和错排的概率之间存在如下的关系。如果一个搜索词搜索了n次,产生m次先点的搜索结果1和后点的搜索结果2的概率为其中,p=0.55。先点搜索结果1和后点搜索结果2的用户对搜索结果贡献的点击分值分别为0.75和0.25。也就是说,错排的概率计算公式为:
在某个采样的集合中(即当天在该搜索词下用户点击数据),计算当天的用户点击分值,然后按照如下公式计算点击分值,
点积分值=历史点击分值*衰减系数+当天点击分值,
其中,历史的点击分值的最乐观的预期为,搜索结果1的点击分值为搜索结果2的点击分值为此时,观察不同样本集合大小(即搜索词当天搜索次数)可能产生的错排的概率(即搜索结果2点击分值大于搜索结果1)。错排的概率的计算公式为,其中,i满足即导致错排的抽样结果。
具体而言,如图4所示,当搜索词的搜索次数大于50的时候错排的概率小于0.1%,因此,计算得出的权值可以很好的替代人工标注。
进一步而言,搜索结果的相关性分值可根据如下公式计算得出:
Score(query,result)=∑wWi*Click_Feature(i),
搜索引擎可利用用户行为数据,对搜索词和搜索结果的相关性Score(query,result)进行建模,其中,Click_Feature(i)表示用户行为模型中的各个行为特征。例如,点击率,满意点击率等;Wi表示各个行为特征的权重。
其中,点击率可通过如下公式计算得出:
click_rate=click/exam
其中,click表示用户点击的次数,exam表示用户看到这条结果的次数。换言之,click是观测变量,exam是隐变量。exam需要其他的观测变量进行近似。
进一步而言,从用户使用搜索引擎的行为习惯上看,我们可以有以下假设:
1.用户点击过的搜索结果,基本都是用户检查过的;
2.正常用户在大多数情况下是从前往后浏览展现的搜索结果,因此,用户如果点击过位置i的搜索结果,则位于位置i的搜索结果前面的搜索结果有很大概率也被用户检查过;
3.点击搜索结果后面的未被点击过搜索结果,有一定的概率被用户检查过,但未被点击过,被检查过的概率明显小于前面的搜索结果的检查概率,且依次递减;
4.如果用户最后一次点击为满意点击,则该搜索结果后面的搜索结果有较低概率被检查,否则有较高的概率被检查过。
基于以上假设,可继续推算检查概率的计算策略。
1.由假设1,可以认为有点击的搜索结果,检查概率为1;
2.由假设2,可以认为有点击的搜索结果之前的未被点击的搜索结果,有接近1的检查概率
3.对假设3,虽然后向搜索结果的检查概率没有真实的物理量计算,但点击序列的条件点击概率反应了用户在点击位置i之后有点击后向的j(j>i)的概率,从行为含义上非常接近用户点击过位置i之后检查j的概率。因此我们采用条件点击概率模拟后向搜索结果的检查概率。
4.对假设4,理想情况下,用户得到满意点击之后,不会检查后向其他的搜索结果。但从现实用户行为角度的焦点分散等行为,以及模型本身的平滑,满意点击之后也会分配一定的检查概率(小于标准的条件点击概率)。对非满意点击分配较大的检查概率(大于标准的条件点击概率)。
S305,根据相关性分值计算情景模型的权值。
具体地,在计算得到搜索词和搜索结果的想关性分值之后,即确定了学习目标集之后,搜索引擎可对中的进行求解。目标集合是一些连续的分值,表示搜索引擎系统的情景特征,这是一个有监督的回归问题。不同的回归模型有不同的学习算法,此处不再一一赘述。
S306,根据情景模型的权值对多个搜索结果进行排序。
具体地,模型表明了情景特征在搜索引擎的在对多个搜索结果进行搜索排序中发挥的作用,通过学习目标集,找到情景特征与搜索结果特征之间的内在联系。这种内在联系通过模型得到了量化,影响到最终的搜索结果排序,排序排在最前面的结果,就是在此时此景下用户最想要的搜索结果。例如,如果用户使用移动终端的网络类型为3g网络,在搜索电影时,由于用户使用3g网络受到流量的限制,用户的主要需求是查看该电影的介绍,此时应当将包含电影介绍的搜索结果排在多个搜索结果的最前面。举例而言,如图2(a)所示,用户搜索“前任攻略”时,如果用户所处的情景是下班路途中,移动终端使用的网络类型是3g网络,则搜索引擎将搜索结果“前任攻略的_百度百科”排在多个搜索结果的最前面。
如果用户使用移动终端的网络类型为Wifi网络,用户的主要需求是观看电影,此时应当将包含播放电影的搜索结果排在多个搜索结果的最前面。换言之,搜索引擎考虑了用户的情境化需求,结合用户的情景属性信息来预测用户的需求,根据情景属性信息对多个搜索结果进行重排序。举例而言,如图2(b)所示,用户搜索“前任攻略”时,如果用户所处的情景是家中,移动终端使用的网络类型是Wifi网络,则搜索引擎将搜索结果“电影前任攻略”排在多个搜索结果的最前面。
S307,根据排序后的多个搜索结果生成搜索结果展现界面。
具体地,搜索引擎将排序后的多个搜索结果在展现界面中展现给用户,用户选择自己需要的搜索结果,点击该搜索结果进行浏览。
本发明实施例的搜索结果的展现方法,搜索引擎通过用户的行为数据,挖掘出学习目标集,以目标集作为目标,构建用户的情景模型,根据情景模型来预测用户当前的需求类型,进而将更加匹配的搜索结果放在更靠前的位置,使搜索结果更加符合用户的需求,明显降低了用户点击搜索结果的次数,提高了用户体验。
为了实现上述实施例,本发明还提出一种搜索结果的展现装置。
图5是本发明一个实施例的搜索结果的展现装置的结构示意图。
如图5所示,搜索结果的展现装置包括:第一获取模块100、第二获取模块200、排序模块300和展现模块400。
具体地,第一获取模块100用于接收用户输入的搜索词,并根据搜索词获取多个搜索结果。具体而言,第一获取模块100在搜索界面中提供搜索输入框,用户可在搜索输入框中输入搜索词。在第一获取模块100接收到用户输入的搜索词之后,第一获取模块100根据搜索词发起查询,获取到该搜索词对应的多个搜索结果。
第二获取模块200用于获取用户的情景属性信息。其中,情景属性信息包括但不限于搜索时间、终端类型、网络类型、地理位置、用户属性中的一个或者多个。具体而言,用户在搜索引擎中发起搜索请求之后,第二获取模块200获取用户当前所处情景的情景属性信息。例如,用户的搜索时间包含工作时间、午休时间、下班时间或者节假日时间等;用户使用的移动终端的网络类型包含蜂窝移动网络(2g/3g/4g),无线局域网(Wifi)等;用户的地理位置包含具体位置或者抽象的地理位置,例如家中、工作地点等;用户的属性包含用户的各种偏好。
排序模块300用于根据情景属性信息对多个搜索结果进行排序。具体而言,排序模块300根据用户当前所处情景的情景属性信息对多个搜索结果进行排序,例如,如果用户使用移动终端的网络类型为3g网络,在搜索电影时,由于用户使用3g网络受到流量的限制,用户的主要需求是查看该电影的介绍,此时排序模块300应当将包含电影介绍的搜索结果排在多个搜索结果的最前面。举例而言,如图2(a)所示,用户搜索“前任攻略”时,如果用户所处的情景是下班路途中,移动终端使用的网络类型是3g网络,则排序模块300将搜索结果“前任攻略的_百度百科”排在多个搜索结果的最前面。
如果用户使用移动终端的网络类型为Wifi网络,用户的主要需求是观看电影,此时排序模块300应当将包含播放电影的搜索结果排在多个搜索结果的最前面。换言之,排序模块300考虑了用户的情境化需求,结合用户的情景属性信息来预测用户的需求,根据情景属性信息对多个搜索结果进行重排序。举例而言,如图2(b)所示,用户搜索“前任攻略”时,如果用户所处的情景是家中,移动终端使用的网络类型是Wifi网络,则排序模块300将搜索结果“电影前任攻略”排在多个搜索结果的最前面。
展现模块400用于根据排序后的多个搜索结果生成搜索结果展现界面。具体而言,展现模块400将排序模块300排序后的多个搜索结果在展现界面中展现给用户,用户选择自己需要的搜索结果,点击该搜索结果进行浏览。
本发明实施例的搜索结果的展现装置,在接收用户输入搜索词时,获取用户所处情景的情景属性信息,根据情景属性信息对多个搜索结果进行排序,使提供的搜索结果排序场景化,搜索结果更加符合用户的需求,明显降低了用户点击搜索结果的次数,提高了用户体验。。
图6是本发明一个具体实施例的搜索结果的展现装置的结构示意图。
如图6所示,搜索结果的展现装置包括:第一获取模块100、第二获取模块200、排序模块300和展现模块400,其中,排序模块300包括:建立单元310、获取单元320、计算单元330和排序单元340。
具体地,建立单元310用于根据情景属性信息建立情景模型。具体而言,建立单元310根据情景属性信息构建情景模型其中,用M表示情景模型,情景属性信息用向量来表示(F1,F2,F3,F4…Fn)。表示搜索结果情景化后的权值,其中,w表示搜索结果的基础权值。
获取单元320用于获取搜索词和多个搜索结果的相关性分值。
在本发明的一个实施例中,获取单元320具体用于获取用户的行为数据,并根据行为数据计算多个搜索结果的相关性分值。
在本发明的一个实施例中,获取单元320还用于根据多个搜索结果的点击率和满意点击率计算多个搜索结果的当天点击分值,并获取多个搜索结果的历史点击分值,以及根据多个搜索结果的历史点击分值和当天点击分值计算多个搜索结果的相关性分值。
具体而言,的计算目标可以采用人工标注的方法,但是这样的代价是很昂贵的。用户在移动情景下的用户行为数据,在采样足够多的情况下,在很大程度能够拟合
其中,表示在特定的情景下,用户行为模型的相关性分值,获取单元320可以用该相关性分值作为的学习目标。采样的次数越多,Score的分值和越接近。采样次数的降低,会增加情景模型的权值发生错排的概率。
进一步而言,采样次数和错排的概率之间存在如下的关系。如果一个搜索词搜索了n次,产生m次先点的搜索结果1和后点的搜索结果2的概率为其中,p=0.55。先点搜索结果1和后点搜索结果2的用户对搜索结果贡献的点击分值分别为0.75和0.25。也就是说,错排的概率计算公式为:
在某个采样的集合中(即当天在该搜索词下用户点击数据),计算当天的用户点击分值,然后按照如下公式计算点击分值,
点积分值=历史点击分值*衰减系数+当天点击分值,
其中,历史的点击分值的最乐观的预期为,搜索结果1的点击分值为搜索结果2的点击分值为此时,观察不同样本集合大小(即搜索词当天搜索次数)可能产生的错排的概率(即搜索结果2点击分值大于搜索结果1)。错排的概率的计算公式为,其中,i满足即导致错排的抽样结果。
具体而言,如图4所示,当搜索词的搜索次数大于50的时候错排的概率小于0.1%,因此,计算得出的权值可以很好的替代人工标注。
进一步而言,搜索结果的相关性分值可根据如下公式计算得出:
Score(query,result)=∑wWi*Click_Feature(i),
获取单元320可利用用户行为数据,对搜索词和搜索结果的相关性Score(query,result)进行建模,其中,Click_Feature(i)表示用户行为模型中的各个行为特征。例如,点击率,满意点击率等;Wi表示各个行为特征的权重。
其中,点击率可通过如下公式计算得出:
click_rate=click/exam
其中,click表示用户点击的次数,exam表示用户看到这条结果的次数。换言之,click是观测变量,exam是隐变量。exam需要其他的观测变量进行近似。
进一步而言,从用户使用搜索引擎的行为习惯上看,我们可以有以下假设:
1.用户点击过的搜索结果,基本都是用户检查过的;
2.正常用户在大多数情况下是从前往后浏览展现的搜索结果,因此,用户如果点击过位置i的搜索结果,则位于位置i的搜索结果前面的搜索结果有很大概率也被用户检查过;
3.点击搜索结果后面的未被点击过搜索结果,有一定的概率被用户检查过,但未被点击过,被检查过的概率明显小于前面的搜索结果的检查概率,且依次递减;
4.如果用户最后一次点击为满意点击,则该搜索结果后面的搜索结果有较低概率被检查,否则有较高的概率被检查过。
基于以上假设,可继续推算检查概率的计算策略。
1.由假设1,可以认为有点击的搜索结果,检查概率为1;
2.由假设2,可以认为有点击的搜索结果之前的未被点击的搜索结果,有接近1的检查概率
3.对假设3,虽然后向搜索结果的检查概率没有真实的物理量计算,但点击序列的条件点击概率反应了用户在点击位置i之后有点击后向的j(j>i)的概率,从行为含义上非常接近用户点击过位置i之后检查j的概率。因此我们采用条件点击概率模拟后向搜索结果的检查概率。
4.对假设4,理想情况下,用户得到满意点击之后,不会检查后向其他的搜索结果。但从现实用户行为角度的焦点分散等行为,以及模型本身的平滑,满意点击之后也会分配一定的检查概率(小于标准的条件点击概率)。对非满意点击分配较大的检查概率(大于标准的条件点击概率)。
计算单元330用于根据相关性分值计算情景模型的权值。具体而言,在获取单元320计算得到搜索词和搜索结果的想关性分值之后,即确定了学习目标集之后,计算单元330可对中的进行求解。目标集合是一些连续的分值,表示搜索引擎系统的情景特征,这是一个有监督的回归问题。不同的回归模型有不同的学习算法,此处不再一一赘述。
排序单元340用于根据情景模型的权值对多个搜索结果进行排序。具体而言,模型表明了情景特征在搜索引擎的在对多个搜索结果进行搜索排序中发挥的作用,通过学习目标集,找到情景特征与搜索结果特征之间的内在联系。这种内在联系通过模型得到了量化,影响到最终的搜索结果排序,排序排在最前面的结果,就是在此时此景下用户最想要的搜索结果。例如,如果用户使用移动终端的网络类型为3g网络,在搜索电影时,由于用户使用3g网络受到流量的限制,用户的主要需求是查看该电影的介绍,此时排序单元340应当将包含电影介绍的搜索结果排在多个搜索结果的最前面。举例而言,如图2(a)所示,用户搜索“前任攻略”时,如果用户所处的情景是下班路途中,移动终端使用的网络类型是3g网络,则排序单元340将搜索结果“前任攻略的_百度百科”排在多个搜索结果的最前面。
如果用户使用移动终端的网络类型为Wifi网络,用户的主要需求是观看电影,此时排序单元340应当将包含播放电影的搜索结果排在多个搜索结果的最前面。换言之,排序单元340考虑了用户的情境化需求,结合用户的情景属性信息来预测用户的需求,根据情景属性信息对多个搜索结果进行重排序。举例而言,如图2(b)所示,用户搜索“前任攻略”时,如果用户所处的情景是家中,移动终端使用的网络类型是Wifi网络,则排序单元340将搜索结果“电影前任攻略”排在多个搜索结果的最前面。
本发明实施例的搜索结果的展现装置,通过用户的行为数据,挖掘出学习目标集,以目标集作为目标,构建用户的情景模型,根据情景模型来预测用户当前的需求类型,进而将更加匹配的搜索结果放在更靠前的位置,使搜索结果更加符合用户的需求,明显降低了用户点击搜索结果的次数,提高了用户体验。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (8)
1.一种搜索结果的展现方法,其特征在于,包括以下步骤:
接收用户输入的搜索词,并根据所述搜索词获取多个搜索结果;
获取所述用户的情景属性信息;
根据所述情景属性信息建立情景模型;
获取所述搜索词和所述多个搜索结果的相关性分值;
根据所述相关性分值计算所述情景模型的权值;
根据所述情景模型的权值对所述多个搜索结果进行排序;以及
根据排序后的多个搜索结果生成搜索结果展现界面。
2.如权利要求1所述的方法,其特征在于,所述情景属性信息包括搜索时间、终端类型、网络类型、地理位置、用户属性中的一个或者多个。
3.如权利要求1所述的方法,其特征在于,所述获取所述搜索词和所述多个搜索结果的相关性分值具体包括:
获取所述用户的行为数据;以及
根据所述行为数据计算所述多个搜索结果的相关性分值。
4.如权利要求3所述的方法,其特征在于,所述行为数据包括用户点击所述多个搜索结果的点击率和满意点击率,所述根据所述行为数据计算所述多个搜索结果的相关性分值具体包括:
根据所述多个搜索结果的点击率和满意点击率计算所述多个搜索结果的当天点击分值;以及
获取所述多个搜索结果的历史点击分值,并根据所述多个搜索结果的历史点击分值和当天点击分值计算所述多个搜索结果的相关性分值。
5.一种搜索结果的展现装置,其特征在于,包括:
第一获取模块,用于接收用户输入的搜索词,并根据所述搜索词获取多个搜索结果;
第二获取模块,用于获取所述用户的情景属性信息;
排序模块,用于根据所述情景属性信息对所述多个搜索结果进行排序,其中,所述排序模块包括:
建立单元,用于根据所述情景属性信息建立情景模型;
获取单元,用于获取所述搜索词和所述多个搜索结果的相关性分值;
计算单元,用于根据所述相关性分值计算所述情景模型的权值;
排序单元,用于根据所述情景模型的权值对所述多个搜索结果进行排序;以及
展现模块,用于根据排序后的多个搜索结果生成搜索结果展现界面。
6.如权利要求5所述的装置,其特征在于,所述情景属性信息包括搜索时间、终端类型、网络类型、地理位置、用户属性中的一个或者多个。
7.如权利要求5所述的装置,其特征在于,所述获取单元具体用于:
获取所述用户的行为数据,并根据所述行为数据计算所述多个搜索结果的相关性分值。
8.如权利要求7所述的装置,其特征在于,所述行为数据包括用户点击所述多个搜索结果的点击率和满意点击率,所述计算单元还用于:
根据所述多个搜索结果的点击率和满意点击率计算所述多个搜索结果的当天点击分值,并获取所述多个搜索结果的历史点击分值,以及根据所述多个搜索结果的历史点击分值和当天点击分值计算所述多个搜索结果的相关性分值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410439768.9A CN104239440B (zh) | 2014-09-01 | 2014-09-01 | 搜索结果的展现方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410439768.9A CN104239440B (zh) | 2014-09-01 | 2014-09-01 | 搜索结果的展现方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104239440A CN104239440A (zh) | 2014-12-24 |
CN104239440B true CN104239440B (zh) | 2017-08-25 |
Family
ID=52227499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410439768.9A Active CN104239440B (zh) | 2014-09-01 | 2014-09-01 | 搜索结果的展现方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104239440B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105808596B (zh) * | 2014-12-31 | 2019-06-14 | 北京奇虎科技有限公司 | 基于用户行为特征的搜索资源收录方法及装置 |
CN104778233A (zh) * | 2015-03-31 | 2015-07-15 | 北京奇虎科技有限公司 | 一种基于点击量的搜索方法和装置 |
CN106708282B (zh) | 2015-12-02 | 2019-03-19 | 北京搜狗科技发展有限公司 | 一种推荐方法和装置、一种用于推荐的装置 |
CN105740453B (zh) * | 2016-02-03 | 2018-06-19 | 百度在线网络技术(北京)有限公司 | 信息推送方法和装置 |
CN107045505B (zh) * | 2016-02-05 | 2021-07-27 | 百度在线网络技术(北京)有限公司 | 一种用于查询的方法和装置 |
CN106354856B (zh) * | 2016-09-05 | 2020-02-21 | 北京百度网讯科技有限公司 | 基于人工智能的深度神经网络强化搜索方法和装置 |
US10650071B2 (en) * | 2016-11-28 | 2020-05-12 | Google Llc | Search and retrieval of keyed data maintained using a keyed database |
CN106649775A (zh) * | 2016-12-27 | 2017-05-10 | 北京奇虎科技有限公司 | 评估搜索行为满意度的方法、装置及服务器 |
CN106874413A (zh) * | 2017-01-22 | 2017-06-20 | 斑马信息科技有限公司 | 搜索系统及其搜索结果处理方法 |
CN109657154B (zh) * | 2018-12-28 | 2021-08-31 | 浙江省公众信息产业有限公司 | 基于情景的资源排序装置和资源排序方法 |
CN110399568B (zh) * | 2019-07-04 | 2022-09-30 | Oppo广东移动通信有限公司 | 信息搜索方法、装置、终端及存储介质 |
CN111191133B (zh) * | 2019-12-31 | 2023-12-01 | 口口相传(北京)网络技术有限公司 | 业务搜索处理方法、装置及设备 |
CN111428100A (zh) * | 2020-03-27 | 2020-07-17 | 京东方科技集团股份有限公司 | 一种数据检索方法、装置、电子设备及计算机可读存储介质 |
CN113536156B (zh) * | 2020-04-13 | 2024-05-28 | 百度在线网络技术(北京)有限公司 | 搜索结果排序方法、模型构建方法、装置、设备和介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101661474A (zh) * | 2008-08-26 | 2010-03-03 | 华为技术有限公司 | 一种搜索方法和系统 |
CN101996215A (zh) * | 2009-08-27 | 2011-03-30 | 阿里巴巴集团控股有限公司 | 一种应用于电子商务网站的信息匹配方法和系统 |
CN102722483A (zh) * | 2011-03-29 | 2012-10-10 | 百度在线网络技术(北京)有限公司 | 用于确定输入法的候选项排序的方法、装置和设备 |
CN103207904A (zh) * | 2013-03-28 | 2013-07-17 | 百度在线网络技术(北京)有限公司 | 搜索结果的提供方法及搜索引擎 |
CN103778187A (zh) * | 2013-12-31 | 2014-05-07 | 百度(中国)有限公司 | 一种定向返回搜索结果的方法和设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9367634B2 (en) * | 2012-01-19 | 2016-06-14 | Brightedge Technologies, Inc. | Optimizing location and mobile search |
-
2014
- 2014-09-01 CN CN201410439768.9A patent/CN104239440B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101661474A (zh) * | 2008-08-26 | 2010-03-03 | 华为技术有限公司 | 一种搜索方法和系统 |
CN101996215A (zh) * | 2009-08-27 | 2011-03-30 | 阿里巴巴集团控股有限公司 | 一种应用于电子商务网站的信息匹配方法和系统 |
CN102722483A (zh) * | 2011-03-29 | 2012-10-10 | 百度在线网络技术(北京)有限公司 | 用于确定输入法的候选项排序的方法、装置和设备 |
CN103207904A (zh) * | 2013-03-28 | 2013-07-17 | 百度在线网络技术(北京)有限公司 | 搜索结果的提供方法及搜索引擎 |
CN103778187A (zh) * | 2013-12-31 | 2014-05-07 | 百度(中国)有限公司 | 一种定向返回搜索结果的方法和设备 |
Also Published As
Publication number | Publication date |
---|---|
CN104239440A (zh) | 2014-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104239440B (zh) | 搜索结果的展现方法和装置 | |
CN110297848B (zh) | 基于联邦学习的推荐模型训练方法、终端及存储介质 | |
CN108322829B (zh) | 个性化主播推荐方法、装置及电子设备 | |
US11210598B2 (en) | Extrapolating probabilistic predictions for skills using unanswered questions and determining corresponding instructional content | |
CN103077050B (zh) | 一种显示应用程序信息的方法、装置及设备 | |
US20170083965A1 (en) | Item Recommendation Method and Apparatus | |
CN109447958B (zh) | 图像处理方法、装置、存储介质及计算机设备 | |
CN110019896A (zh) | 一种图像检索方法、装置及电子设备 | |
CN103744917B (zh) | 混合推荐方法及系统 | |
CN109753601B (zh) | 推荐信息点击率确定方法、装置及电子设备 | |
CN110413867B (zh) | 用于内容推荐的方法及系统 | |
EP4092545A1 (en) | Content recommendation method and device | |
CN113034241B (zh) | 一种产品信息推荐方法及计算机设备 | |
CN109245996A (zh) | 邮件推送方法、装置、计算机设备和存储介质 | |
JPWO2011052315A1 (ja) | コンテンツ推薦システム、推薦方法及び推薦プログラム | |
CN109660980A (zh) | 基于历史连接WiFi构建用户画像的方法、装置、设备及介质 | |
KR101873339B1 (ko) | 관심사 및 콘텐츠를 제공하는 방법 및 시스템 | |
EP4091075A1 (en) | Generation of personalized recommendations | |
CN109255070A (zh) | 推荐信息处理方法、装置、计算机设备及存储介质 | |
US20150052126A1 (en) | Method and system for recommending relevant web content to second screen application users | |
US9940372B2 (en) | Triggering method for instant search | |
CN109377284B (zh) | 用于推送信息的方法和电子设备 | |
CN113412481A (zh) | 资源推送方法、装置、服务器以及存储介质 | |
US20160094887A1 (en) | Tv program-based shopping guide system and tv program-based shopping guide method | |
US20150222959A1 (en) | Information processing method, and information processing system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |