CN104462278B - 页面内容展现的控制方法和系统 - Google Patents

页面内容展现的控制方法和系统 Download PDF

Info

Publication number
CN104462278B
CN104462278B CN201410693959.8A CN201410693959A CN104462278B CN 104462278 B CN104462278 B CN 104462278B CN 201410693959 A CN201410693959 A CN 201410693959A CN 104462278 B CN104462278 B CN 104462278B
Authority
CN
China
Prior art keywords
entry
search result
showed
msub
result entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410693959.8A
Other languages
English (en)
Other versions
CN104462278A (zh
Inventor
赵继承
徐云峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410693959.8A priority Critical patent/CN104462278B/zh
Publication of CN104462278A publication Critical patent/CN104462278A/zh
Application granted granted Critical
Publication of CN104462278B publication Critical patent/CN104462278B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种页面内容展现的控制方法和系统,方法包括:接收搜索词;根据所述搜索词获取多个搜索结果条目;计算各搜索结果条目相对于反例集合中的条目的第一相似性评定值;所述反例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且未被用户查看的条目;将所述第一相似性评定值中小于第一评定阈值的所述搜索结果条目选取为待展现的搜索结果条目;发送所述待展现的搜索结果条目至客户端以进行展现。本发明的技术方案实现了将相对丰富多样的搜索结果条目信息展现给用户,同时改善了用户的体验。

Description

页面内容展现的控制方法和系统
技术领域
本发明涉及通信技术领域,尤其涉及一种页面内容展现的控制方法和系统。
背景技术
通过互联网搜索获得所需信息目前已经成为用户获得信息的主要途径之一。在用户输入搜索需求后,如何从候选列表中选取合适的内容条目(Item)在一个页面中最终呈现给用户,除了考虑用户当前需求和Item之间的相关性、Item本身的质量等因素外,也需要考虑Item所带给用户的信息量。
现有方法中,在用户输入搜索需求后,系统通常只是将与用户需求相关的候选列表中的Item按原始的先后顺序呈现给用户,并不考虑当前页面中呈现的各Item与用户已浏览的历史Item之间的差异性,导致同一条或类似Item很可能在连续多个页面中反复出现,降低了各页面的信息量。由此使得用户体验下降。
发明内容
本发明的实施例提供一种页面内容展现的控制方法和系统,以实现将更为丰富多样的信息呈现给用户,提高用户体验。
为达到上述目的,本发明的实施例提供了一种页面内容展现的控制方法,包括:
接收搜索词;
根据所述搜索词获取多个搜索结果条目;
计算各搜索结果条目相对于反例集合中的条目的第一相似性评定值;所述反例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且未被用户查看的条目;
将所述第一相似性评定值中小于第一评定阈值的所述搜索结果条目选取为待展现的搜索结果条目;
发送所述待展现的搜索结果条目至客户端以进行展现。
本发明的实施例还提供了一种页面内容展现的控制系统,包括:
接收模块,用于接收搜索词;
获取模块,用于根据所述搜索词获取多个搜索结果条目;
第一处理模块,用于计算各搜索结果条目相对于反例集合中的条目的第一相似性评定值;所述反例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且未被用户查看的条目;
第一选取模块,用于将所述第一相似性评定值中小于第一评定阈值的所述搜索结果条目选取为待展现的搜索结果条目;
发送模块,用于发送所述待展现的搜索结果条目至客户端以进行展现。
本发明实施例提供的页面内容展现的控制方法和系统,根据接收的搜索词获取多个搜索结果条目;计算各搜索结果条目相对于反例集合中的条目的第一相似性评定值,并将第一相似性评定值中小于第一评定阈值的所述搜索结果条目选取为待展现的搜索结果条目发送至客户端以进行展现,由此将相对丰富多样的搜索结果条目信息展现给用户,同时改善了用户的体验。
附图说明
图1为本发明提供的页面内容展现的控制方法一个实施例的方法流程图;
图2为本发明提供的页面内容展现的控制方法另一个实施例的方法流程图;
图3为本发明提供的页面内容展现的控制系统一个实施例的结构示意图;
图4为本发明提供的页面内容展现的控制系统另一个实施例的结构示意图。
具体实施方式
本发明的实施例利用预先设定的反例集合,在根据搜索词获取多个搜索结果条目后,根据各搜索结果条目相对于反例集合中包含的条目的第一相似性评价值来确定待展现的搜索结果条目,以发送至客户端进行展现。本发明实施例的技术方案可以适用于网页内容条目的控制展现。
实施例一
图1为本发明提供的页面内容展现的控制方法一个实施例的方法流程图,该方法的执行主体可以为具有页面内容展现控制功能的装置或系统。如图1所示,该页面内容展现的控制方法具体包括:
S101,接收搜索词;
该搜索词可以为用户在搜索页面键入的欲搜索内容的关键词。
S102,根据搜索词获取多个搜索结果条目;
用户在搜索页面键入搜索词后,系统会在已有条目库中检索与该搜索词相关的条目,并将这些相关的条目确定为搜索结果条目。其中,上述条目库中包含的各条目的具体内容可以为系统预先存储的一件商品、一条新闻等等所包含的信息的集合;例如,对于商品条目,其包含的信息可以是商品的价格、品牌、型号、颜色以及供应商等信息;对于新闻条目,其包含的信息可以是新闻的发生时间、发生地点、涉及的关键词、报道者等信息。
S103,计算各搜索结果条目相对于反例集合中的条目的第一相似性评定值;所述反例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且未被用户查看的条目;
通常,现有的页面内容展现过程是将搜索到的条目按搜索获得时的原有顺序,或与键入的搜索词相关程度形成的顺序进行逐一展现,而这些展现搜索结果条目的顺序并没有考虑到用户本身已搜索或查看条目的历史行为。可以理解的,当同一个条目多次展现给用户,且该条目未被用户查看时,表征用户很可能对该条目不敢兴趣,进而在接下来的页面中用户很可能不再点击查看与之相同或类似的条目。如果在接下来的页面中仍展现相同条目或类似的条目,那么针对当前该用户势必造成所展现的条目的冗余,同时带给用户不好的体验。
为了保证后续页面中展现的条目与之前展现给该用户的条目之间更具有多样性,本实施例引入了反例集合的概念。该反例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且未被用户查看的条目。对于上述各搜索结果条目,本实施例采用第一相似性评定值来衡量各搜索结果条目与反例集合中的条目的相似性,若某搜索结果条目相对于反例集合中的条目的第一相似性评定值越大,则表征该搜索结果条目与反例集合中的条目越相似,反之越不相似。当某搜索结果条目与该反例集合中的条目越不相似,则表征该搜索结果条目给用户带来的信息量更多样化,反之则更单一化。本实施例中对于各搜索结果条目相对于反例集合中的条目的第一相似性评定值的具体算法可采用但不局限于通过求解条目包含的信息间的编辑距离获得。
S104,将第一相似性评定值中小于第一评定阈值的搜索结果条目选取为待展现的搜索结果条目;
通过求解得到的各搜索结果条目相对于反例集合中的条目的第一相似性评定值,可以获悉各搜索结果条目与当前用户在过去时段查看的页面中已展现且未被用户查看的条目之间的相似性,第一相似性评定值越大表征相似性越大。本实施例引用第一评定阈值作为选取待展现的搜索结果条目的依据,将第一相似性评定值中小于第一评定阈值的搜索结果条目认为是可以为当前用户带来更丰富的信息量的条目,并选取为待展现的搜索结果条目。其中,所述第一评定阈值可依据已有的条目库中的条目通过训练学习后获得。
S105,发送待展现的搜索结果条目至客户端以进行展现;
选取完待展现的搜索结果条目后,系统可根据自身设置将其发送至用户的客户端上以进行展现,当待展现的搜索结果条目较多时,可以分多页面进行展示,并对每页进行编号。
本发明实施例提供的页面内容展现的控制方法,根据接收的搜索词获取多个搜索结果条目;计算各搜索结果条目相对于反例集合中的条目的第一相似性评定值,并将第一相似性评定值中小于第一评定阈值的所述搜索结果条目选取为待展现的搜索结果条目发送至客户端以进行展现,由此将相对丰富多样的搜索结果条目信息展现给用户,同时改善了用户的体验。
实施例二
图2为本发明提供的页面内容展现的控制方法另一个实施例的方法流程图,是如图1所示方法实施例的一种具体实现方式,如图2所示,该页面内容展现的控制方法具体包括:
S201,接收搜索词;
S202,根据搜索词获取多个搜索结果条目;
S203,计算各搜索结果条目相对于反例集合中的条目的第一相似性评定值;所述反例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且未被用户查看的条目;
上述步骤S201~203的具体执行过程可参见步骤101~103的相应内容,在此不作赘述。
上述步骤203的具体实现方式可以为:计算各搜索结果条目与反例集合中的各条目之间的相似值,并将各搜索结果条目对应的所有相似值的平均值作为相应的搜索结果条目相对于反例集合中的条目的第一相似性评定值。具体地,如通过:
获得搜索结果条目Itemj与反例集合S1中的条目Itemm的第一相似性评定值T1,其中,所述sim(Itemm,Itemj)为Itemj与Itemm之间的相似值,可通过其各自包含的信息之间的编辑距离求解获得;所述|S1|为反例集合S1中包含的条目的数量。
S204,将第一相似性评定值中小于第一评定阈值的所述搜索结果条目选取为待展现的搜索结果条目;该步骤具体执行过程可参见步骤104的相应内容。
本实施例,在上述利用反例集合选取待展现的搜索结果条目时,充分考虑了当前用户在过去时段查看条目的历史行为,尽量避免将用户不感兴趣的相同或相近的条目再次展现给用户,保证给用户提供更为丰富和多样的条目内容。而在实际应用场景中,这种多样性的程度又必须以用户的历史行为为准绳,即在满足信息量多样化的同时,也应该保证用户体验中对于相关性的考虑,即最终展现给用户的搜索结果条目是与用户查看的历史条目之间是相关联的。
因此,在步骤204之后,本实施例采取继续执行步骤205~206来选取最终的待展现的搜索结果条目。
S205,计算各待展现的搜索结果条目相对于正例集合中的条目的第二相似性评定值;所述正例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且被用户查看的条目;
为保证最终展现给用户的搜索结果条目是与用户查看的历史条目之间是相关联的,本实施例引入了正例集合的概念。该正例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且被用户查看的条目。对于上述通过步骤204选取的各待展现的搜索结果条目,本实施例采用第二相似性评定值来衡量各搜索结果条目与正例集合中的条目的相似性,若某搜索结果条目相对于正例集合中的条目的第二相似性评定值越大,则表征该搜索结果条目与正例集合中的条目越相似,反之越不相似。当某搜索结果条目与该正例集合中的条目越相似,则表征该搜索结果条目与用户查看的历史条目之间的关联性越大,反之则关联性越小。本实施例中对于各待展现的搜索结果条目相对于正例集合中的条目的第二相似性评定值的具体算法可采用但不局限于通过求解条目包含的信息间的编辑距离获得。
S206,将待展现的搜索结果条目中,第二相似性评定值减去第一相似性评定值与系数a的乘积得到的差值中大于第二评定阈值的搜索结果条目选取为最终待展现的搜索结果条目;所述a大于0;
通过求解得到的各待展现的搜索结果条目相对于正例集合中的条目的第二相似性评定值,可以获悉各搜索结果条目与当前用户在过去时段查看的页面中已展现且被用户查看的条目之间的相关性,第二相似性评定值越大表征相关性越大。
本实施例引用第二相似性评定值减去第一相似性评定值与系数α的乘积得到的差值作为选取待展现的搜索结果条目的依据,将初步选取的待展现的搜索结果条目中,上述差值中大于第二评定阈值的搜索结果条目认为是可以为当前用户带来与其历史查看行为更相关的条目,并选取为最终待展现的搜索结果条目。其中,所述第二评定阈值可依据已有的条目库中的条目通过训练学习后获得。具体地,如通过:
获得待展现的搜索结果条目Itemj对应的第二相似性评定值减去第一相似性评定值与系数α的乘积得到的差值T2。其中,所述为待展现的搜索结果条目Itemj对应的第一相似评定值,所述为待展现的搜索结果条目Itemj对应的第二相似评定值,所述sim(Itemi,Itemj)为Itemj与正例集合S2中包含的条目Itemi之间的相似值,可通过其各自包含的信息之间的编辑距离求解获得;所述|S2|为正例集合S2中包含的条目的数量;a大于0。通过调节a的大小可以修正正例集合和反例集合在选取待展现的搜索结果条目时其占得比重作用。
本实施例利用公式(2),在综合考虑各初步选取的搜索结果条目与用户历史查看的条目之间的多样性以及相关性的基础上,选取最终待展现的搜索结果条目,更加满足了用户对信息量的多样化以及查看信息的相关性的需求,提高了用户体验。
S207,从待展现的搜索结果条目中选取固定数目的搜索结果条目;
在选取完最终展现给用户的搜索结果条目后即可通过步骤105将其发送至客户端以进行展现。
具体地,在最终选取的待展现的搜索结果条目中,很可能存在相同或相似的搜索结果条目,当将它们连续展现给用户时势必会造成不好的用户体验,因此,本实施例在确定的待展现给用户的条目中会进一步选取信息内容更为多样化的一定数目的搜索结果条目发送至用户的客户端以进行展现。具体的,选取固定数目的搜索结果条目的方法包括:
1.在各待展现的搜索结果条目中,针对已从中提取的确定展现的搜索结果条目,将当前剩余的各待展现的搜索结果条目分别与其组成一个临时条目集合;
其中,第一个被确定展现的搜索结果条目可以为待展现的搜索结果条目中的任一个搜索结果条目。
2.计算各临时集合中的条目在各属性维度对应的信息熵;其中,各临时集合中的条目包含的属性维度可以理解为这些条目所包含的信息的内容属性。如针对商品条目,其对应的属性维度可以具体包括:价格、品牌、型号、颜色以及供应商等属性;对于新闻条目,其对应的属性维度可以具体包括:新闻的发生时间、发生地点、涉及的关键词、报道者等属性;而各个属性维度对应的属性值即为该属性维度上的一个具体个例,如apple、xiaomi即为关于手机的搜索结果条目中品牌属性维度上的两个属性值,黑色、白色即为其相应在颜色属性维度上的两个属性值。
具体地,各临时集合中的条目在各属性维度对应的信息熵可根据:
H(x)=-∑p(xi)log(2,p(xi))(i=1,2,..n)..........................(3)
计算各临时集合在各属性维度x对应的信息熵H(x);其中,所述p(xi)为属性维度x中的属性值xi在临时集合中出现的概率,并通过公式
计算获得;所述n为正整数;所述ci为属性值xi在临时集合中出现的次数,所述bi为属性值xi在所有待展现的搜索结果条目中出现的概率,所述k为正整数。
3.根据各临时集合中的条目在各属性维度对应的信息熵,计算各临时集合在各属性维度上的加权熵值;具体地,如根据:
H=∑Hi*wi...........................................(5)
其中,所述Hi为临时集合中的条目在第i个属性维度上的信息熵,所述wi为临时集合中的条目在第i个属性维度上对应的权重。
4.提取加权熵值中的最大值所对应的临时集合,并将该临时集合中包含的条目作为确定展现的搜索结果条目,依此类推,直到选取的确定展现的搜索结果条目满足所述固定数目。
举例说明,在各待展现的手机搜索结果条目中,选取固定数目的搜索结果条目的方法如下:
假设已经选取的关于手机的待展现的搜索结果条目(其属性维度包括颜色和品牌)为:
H_1:black,apple
H_2:black,xiaomi
当前剩余的各所述待展现的搜索结果条目分别如下:
Item 1:white,samsung
Item 2:black,Samsung
Item 3:black,samsung
Item 5:white,xiaomi
首先,对于每个属性维度的每个属性值,我们计算其在所有待展现的搜索结果条目中出现的概率:
b(color_black)=4/6
b(color_white)=2/6
b(brand_apple)=1/6
b(brand_samsung)=3/6
b(brand_xiaomi)=2/6
对于临时集合(H_1、H_2、Item1),先考虑该临时集合中每个属性维度的属性值在该临时结合中出现的概率,此时,color属性维度上共有black,white两个属性值,它们在临时集合中出现次数分别为2,1。它们在所有待展现的搜索结果条目中出现频率为4/6和2/6,因此其各自对应的ci/bi分别为2/(4/6)和1/(2/6),即3和3。
根据公式(4)可得到对应的p(xi)分别为:
p(color_black)=3/(3+3)=1/2
p(color_white)=3/(3+3)=1/2
brand属性维度的属性值的概率可以类似计算。
然后,根据公式(3)可得到该临时集合在各属性维度x对应的信息熵H(x),包括H(color),和H(brand)。
从而,根据公式(5)计算得到的临时集合{H_1,H_2,Item1}的加权熵值为:
H(color)*w_color+H(brand)*w_brand
其中,w_color为颜色属性维度的权重值,w_brand为品牌属性维度上的权重值,这些权重值可根据实际应用场景中对于颜色和品牌的看重程度进行设置。假如更希望品牌上的多样性,则可设置w_color=1,w_brand=2。
根据上述方法计算各个临时集合对应的加权熵值,最后,提取加权熵值中的最大值所对应的临时集合,并将该临时集合中包含的条目作为确定展现的搜索结果条目,依此类推,直到选取的确定展现的搜索结果条目满足上述固定数目。
通过设置各临时集合的条目在各个属性维度上的权重值,还可以避免过于强调搜索结果条目在各属性维度上的差异而忽略各属性维度在各搜索结果条目中本身出现的频率的缺陷,使得选取过程更加合理。
S208,将从待展现的搜索结果条目中选取的固定数目的搜索结果条目发送至客户端以进行展现;该步骤具体执行过程可参见步骤105的相应内容。
进一步的,上述实施例所述的页面内容展现的控制方法还可以应用于网页中的广告和推荐的页面内容展现。具体地,当需要展现的为系统主动推送的广告或推荐信息时,触发上述控制方法的可以为用户的某个具体操作行为,或是特定页面被打开。而针对用户已经查看的页面的内容,同样可以设置正例集合和反例集合的条目,以便从待推送的广告或推荐信息中选取适合的条目发送至用户的客户端进行展现,具体过程原理可参考上述实施例的方法步骤,在此不做赘述。
本发明实施例提供的页面内容展现的控制方法,在图1所示实施例的基础上,进一步的通过计算各待展现的搜索结果条目相对于正例集合的条目的第二相似评定值来选取与用户查看的历史条目之间相关联的搜索结果条目,避免偏离用户的关注兴趣。同时,在对待展现的搜索结果条目进行展现的过程中,引用加权熵值的方法来选取固定数目的搜索结果条目,而这些搜索结果条目之间保证了其带给用户的信息内容更为多样化,提高了用户体验。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
实施例三
图3为本发明提供的页面内容展现的控制系统一个实施例的结构示意图,可执行如图1所示方法步骤。如图3所示,该页面内容展现的控制系统具体包括接收模块31,获取模块32、第一处理模块33、第一选取模块34和发送模块35;其中:
接收模块31,用于接收搜索词;
获取模块32,用于根据搜索词获取多个搜索结果条目;
第一处理模块33,用于计算各搜索结果条目相对于反例集合中的条目的第一相似性评定值;所述反例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且未被用户查看的条目;
第一选取模块34,用于将第一相似性评定值中小于第一评定阈值的所述搜索结果条目选取为待展现的搜索结果条目;
发送模块35,用于发送待展现的搜索结果条目至客户端以进行展现。
进一步的,上述第一处理模块33具体用于:
计算各搜索结果条目与反例集合中的各条目之间的相似值,并将各搜索结果条目对应的所有相似值的平均值作为相应的搜索结果条目相对于反例集合中的条目的第一相似性评定值。
进一步的,如图4所示,上述页面内容展现的控制系统还可以包括:
第二处理模块36,用于计算各待展现的搜索结果条目相对于正例集合中的条目的第二相似性评定值;所述正例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且被用户查看的条目;
第二选取模块37,用于将待展现的搜索结果条目中,第二相似性评定值减去第一相似性评定值与系数a的乘积得到的差值中大于第二评定阈值的搜索结果条目选取为最终待展现的搜索结果条目,所述a大于0。
进一步的,如图4所示的页面内容展现的控制系统中,还可以包括:
第三选取模块38,用于从待展现的搜索结果条目中选取固定数目的搜索结果条目;
发送模块35具体用于:将从待展现的搜索结果条目中选取的固定数目的搜索结果条目发送至客户端以进行展现。
进一步的,上述第三选取模块38可以具体包括:
组成单元381,用于在各待展现的搜索结果条目中,针对已从中提取的确定展现的搜索结果条目,将当前剩余的各待展现的搜索结果条目分别与其组成一个临时条目集合;
第一计算单元382,用于计算各临时集合中的条目在各属性维度对应的信息熵;
第二计算单元383,用于根据各临时集合中的条目在各属性维度对应的信息熵,计算各临时集合在各属性维度上的加权熵值;
选取单元384,用于提取加权熵值中的最大值所对应的临时集合,并将该临时集合中包含的条目作为确定展现的搜索结果条目,依此类推,直到选取的确定展现的搜索结果条目满足固定数目。
进一步的,上述第一计算单元382具体用于:
根据H(x)=-∑p(xi)log(2,p(xi))(i=1,2,..n)
计算各临时集合在各属性维度x对应的信息熵H(x);其中,所述p(xi)为属性维度x中的属性值xi在临时集合中出现的概率,并通过
计算获得;所述n为正整数;所述ci为属性值xi在临时集合中出现的次数,所述bi为属性值xi在所有待展现的搜索结果条目中出现的概率,所述k为正整数。
本发明实施例提供的页面内容展现的控制系统,根据接收的搜索词获取多个搜索结果条目;计算各搜索结果条目相对于反例集合中的条目的第一相似性评定值,并将第一相似性评定值中小于第一评定阈值的所述搜索结果条目选取为待展现的搜索结果条目发送至客户端以进行展现,由此将相对丰富多样的搜索结果条目信息展现给用户。
进一步的,本方案采用的页面内容展现的控制方法,还通过计算各待展现的搜索结果条目相对于正例集合的条目的第二相似评定值来选取与用户查看的历史条目之间相关联的搜索结果条目,避免偏离用户的关注兴趣。同时,在对待展现的搜索结果条目进行展现的过程中,引用加权熵值的方法来选取固定数目的搜索结果条目,而这些搜索结果条目之间保证了其带给用户的信息内容更为多样化,进一步提高了用户体验。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种页面内容展现的控制方法,其特征在于,包括:
接收搜索词;
根据所述搜索词获取多个搜索结果条目;
计算各搜索结果条目相对于反例集合中的条目的第一相似性评定值;所述反例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且未被用户查看的条目;
将所述第一相似性评定值中小于第一评定阈值的所述搜索结果条目选取为待展现的搜索结果条目;计算各所述待展现的搜索结果条目相对于正例集合中的条目的第二相似性评定值;所述正例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且被用户查看的条目;
将所述待展现的搜索结果条目中,所述第二相似性评定值减去所述第一相似性评定值与系数a的乘积得到的差值中大于第二评定阈值的搜索结果条目选取为最终所述待展现的搜索结果条目,所述a大于0;
发送所述待展现的搜索结果条目至客户端以进行展现。
2.根据权利要求1所述的方法,其特征在于,所述计算各搜索结果条目相对于反例集合中的条目的第一相似性评定值,包括:
计算各所述搜索结果条目与所述反例集合中的各条目之间的相似值,并将各所述搜索结果条目对应的所有所述相似值的平均值作为相应的所述搜索结果条目相对于反例集合中的条目的第一相似性评定值。
3.根据权利要求1-2任一项所述的方法,其特征在于,所述方法还包括:
从所述待展现的搜索结果条目中选取固定数目的搜索结果条目;
所述发送所述待展现的搜索结果条目至客户端以进行展现,包括:
将从所述待展现的搜索结果条目中选取的所述固定数目的搜索结果条目发送至客户端以进行展现。
4.根据权利要求3所述的方法,其特征在于,所述从所述待展现的搜索结果条目中选取固定数目的搜索结果条目,包括:
在各所述待展现的搜索结果条目中,针对已从中提取的确定展现的搜索结果条目,将当前剩余的各所述待展现的搜索结果条目分别与其组成一个临时条目集合;
计算各所述临时集合中的条目在各属性维度对应的信息熵;
根据各所述临时集合中的条目在各属性维度对应的信息熵,计算各所述临时集合在各属性维度上的加权熵值;
提取所述加权熵值中的最大值所对应的所述临时集合,并将该临时集合中包含的条目作为所述确定展现的搜索结果条目,依此类推,直到选取的所述确定展现的搜索结果条目满足所述固定数目。
5.根据权利要求4所述的方法,其特征在于,所述计算各所述临时集合中的条目在各属性维度对应的信息熵,包括:
根据H(x)=-∑p(xi)log(2,p(xi))(i=1,2,..n)
计算各所述临时集合在各属性维度x对应的信息熵H(x);其中,所述p(xi)为属性维度x中的属性值xi在所述临时集合中出现的概率,并通过
<mrow> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>/</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> </mrow> <mrow> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1...</mn> <mi>k</mi> </mrow> </msub> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>/</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> </mrow> </mfrac> </mrow>
计算获得;所述n为正整数;所述ci为属性值xi在所述临时集合中出现的次数,所述bi为属性值xi在所有所述待展现的搜索结果条目中出现的概率,所述k为正整数。
6.一种页面内容展现的控制系统,其特征在于,包括:
接收模块,用于接收搜索词;
获取模块,用于根据所述搜索词获取多个搜索结果条目;
第一处理模块,用于计算各搜索结果条目相对于反例集合中的条目的第一相似性评定值;所述反例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且未被用户查看的条目;
第一选取模块,用于将所述第一相似性评定值中小于第一评定阈值的所述搜索结果条目选取为待展现的搜索结果条目;
第二处理模块,用于计算各所述待展现的搜索结果条目相对于正例集合中的条目的第二相似性评定值;所述正例集合中包含的各条目为针对当前用户在过去时段查看的页面中已展现且被用户查看的条目;
第二选取模块,用于将所述待展现的搜索结果条目中,所述第二相似性评定值减去所述第一相似性评定值与系数a的乘积得到的差值中大于第二评定阈值的搜索结果条目选取为最终所述待展现的搜索结果条目,所述a大于0;
发送模块,用于发送所述待展现的搜索结果条目至客户端以进行展现。
7.根据权利要求6所述的系统,其特征在于,所述第一处理模块具体用于:
计算各所述搜索结果条目与所述反例集合中的各条目之间的相似值,并将各所述搜索结果条目对应的所有所述相似值的平均值作为相应的所述搜索结果条目相对于反例集合中的条目的第一相似性评定值。
8.根据权利要求6-7任一项所述的系统,其特征在于,还包括:
第三选取模块,用于从所述待展现的搜索结果条目中选取固定数目的搜索结果条目;
所述发送模块具体用于:将从所述待展现的搜索结果条目中选取的所述固定数目的搜索结果条目发送至客户端以进行展现。
9.根据权利要求8所述的系统,其特征在于,所述第三选取模块包括:
组成单元,用于在各所述待展现的搜索结果条目中,针对已从中提取的确定展现的搜索结果条目,将当前剩余的各所述待展现的搜索结果条目分别与其组成一个临时条目集合;
第一计算单元,用于计算各所述临时集合中的条目在各属性维度对应的信息熵;
第二计算单元,用于根据各所述临时集合中的条目在各属性维度对应的信息熵,计算各所述临时集合在各属性维度上的加权熵值;
选取单元,用于提取所述加权熵值中的最大值所对应的所述临时集合,并将该临时集合中包含的条目作为所述确定展现的搜索结果条目,依此类推,直到选取的所述确定展现的搜索结果条目满足所述固定数目。
10.根据权利要求9所述的系统,其特征在于,所述第一计算单元具体用于:
根据H(x)=-∑p(xi)log(2,p(xi))(i=1,2,..n)
计算各所述临时集合在各属性维度x对应的信息熵H(x);其中,所述p(xi)为属性维度x中的属性值xi在所述临时集合中出现的概率,并通过
<mrow> <mi>p</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>/</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> </mrow> <mrow> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1...</mn> <mi>k</mi> </mrow> </msub> <msub> <mi>c</mi> <mi>i</mi> </msub> <mo>/</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> </mrow> </mfrac> </mrow>
计算获得;所述n为正整数;所述ci为属性值xi在所述临时集合中出现的次数,所述bi为属性值xi在所有所述待展现的搜索结果条目中出现的概率,所述k为正整数。
CN201410693959.8A 2014-11-26 2014-11-26 页面内容展现的控制方法和系统 Active CN104462278B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410693959.8A CN104462278B (zh) 2014-11-26 2014-11-26 页面内容展现的控制方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410693959.8A CN104462278B (zh) 2014-11-26 2014-11-26 页面内容展现的控制方法和系统

Publications (2)

Publication Number Publication Date
CN104462278A CN104462278A (zh) 2015-03-25
CN104462278B true CN104462278B (zh) 2017-12-08

Family

ID=52908314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410693959.8A Active CN104462278B (zh) 2014-11-26 2014-11-26 页面内容展现的控制方法和系统

Country Status (1)

Country Link
CN (1) CN104462278B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637171A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 一种优化搜索结果的方法和装置
CN103729362A (zh) * 2012-10-12 2014-04-16 阿里巴巴集团控股有限公司 导航内容的确定方法和装置
CN103995852A (zh) * 2014-05-12 2014-08-20 百度在线网络技术(北京)有限公司 数据处理方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090271374A1 (en) * 2008-04-29 2009-10-29 Microsoft Corporation Social network powered query refinement and recommendations

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637171A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 一种优化搜索结果的方法和装置
CN103729362A (zh) * 2012-10-12 2014-04-16 阿里巴巴集团控股有限公司 导航内容的确定方法和装置
CN103995852A (zh) * 2014-05-12 2014-08-20 百度在线网络技术(北京)有限公司 数据处理方法和装置

Also Published As

Publication number Publication date
CN104462278A (zh) 2015-03-25

Similar Documents

Publication Publication Date Title
US10726446B2 (en) Method and apparatus for pushing information
Ceron et al. iSA: A fast, scalable and accurate algorithm for sentiment analysis of social media content
CN102063469B (zh) 一种用于获取相关关键词信息的方法、装置和计算机设备
CN104899273B (zh) 一种基于话题和相对熵的网页个性化推荐方法
JP2020509449A (ja) 警告するための方法と装置
CN106407420B (zh) 一种多媒体资源的推荐方法及系统
CN104599160A (zh) 商品推荐方法和装置
CN106682170B (zh) 一种应用搜索方法和装置
CN106250550A (zh) 一种实时关联新闻推荐内容的方法和装置
CN105677780A (zh) 可拓展的用户意图挖掘方法及其系统
CN102043843A (zh) 一种用于基于目标应用获取目标词条的方法与获取设备
CN103400286A (zh) 一种基于用户行为进行物品特征标注的推荐系统及方法
CN104536956A (zh) 一种基于微博平台的事件可视化方法及系统
CN104008203A (zh) 一种融入本体情境的用户兴趣挖掘方法
CN104462327A (zh) 语句相似度的计算、搜索处理方法及装置
CN103034680A (zh) 针对终端设备的数据交互方法及装置
CN107526718A (zh) 用于生成文本的方法和装置
CN105468668A (zh) 一种官方媒体新闻中话题的推送方法及装置
CN107943895A (zh) 信息推送方法和装置
CN105989125B (zh) 对无结果词进行标签识别的搜索方法和系统
CN109410001A (zh) 一种商品推荐方法、系统、电子设备和存储介质
CN102959539B (zh) 一种业务交叉时的项目推荐方法及系统
JP2011227721A (ja) 関心抽出装置、関心抽出方法、及び関心抽出プログラム
CN104156359A (zh) 内链信息推荐方法及装置
CN106257449A (zh) 一种信息确定方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant