CN107491462B - 提供搜索结果的方法和系统 - Google Patents

提供搜索结果的方法和系统 Download PDF

Info

Publication number
CN107491462B
CN107491462B CN201610420365.9A CN201610420365A CN107491462B CN 107491462 B CN107491462 B CN 107491462B CN 201610420365 A CN201610420365 A CN 201610420365A CN 107491462 B CN107491462 B CN 107491462B
Authority
CN
China
Prior art keywords
item
recommended
search
matching
items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610420365.9A
Other languages
English (en)
Other versions
CN107491462A (zh
Inventor
曹训
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610420365.9A priority Critical patent/CN107491462B/zh
Publication of CN107491462A publication Critical patent/CN107491462A/zh
Application granted granted Critical
Publication of CN107491462B publication Critical patent/CN107491462B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了一种提供搜索结果的方法和系统。该方法可以包括:根据用户输入的搜索文本在搜索目标库中搜索,得到各匹配项目及其参数值;根据所述匹配项目的参数值确定所述匹配项目所属的级别;根据所述搜索文本在推荐项目库中搜索,得到各推荐项目及其参数值;根据所述推荐项目的参数值确定所述推荐项目所属的级别;生成包括所述匹配项目和所述推荐项目的搜索结果列表,其中,所述匹配项目和所述推荐项目根据其级别按预定方式排列;使所述用户的客户端呈现所述搜索结果列表。

Description

提供搜索结果的方法和系统
技术领域
本申请涉及互联网领域,特别涉及一种提供搜索结果的方法和系统。
背景技术
目前,提供搜索服务的平台中,当采用搜索结果和推荐项目混合排列的呈现形式时,搜索结果和推荐项目的位次和个数往往是事先固定的,例如,固定采用第N位、第P位、第W位来提供向用户推荐的项目,采用其它位次来呈现搜索结果。这种方式不仅不够灵活,对用户有帮助的推荐项目可能因为受到限制不会出现在搜索结果中或者出现在比较靠后的位置,用户可能需要多次搜索或者多次翻页才能得到想要的结果,因此搜索的效率较低。
发明内容
本申请各实施例提供了一种提供搜索结果的方法和系统,可以根据搜索到的匹配项目和推荐项目的参数来确定其提供给用户时的排列顺序。
本发明实施例的一种提供搜索结果的方法可以包括:
根据用户输入的搜索文本在搜索目标库中搜索,得到各匹配项目及其参数值;
根据所述匹配项目的参数值确定所述匹配项目所属的级别;
根据所述搜索文本在推荐项目库中搜索,得到各推荐项目及其参数值;
根据所述推荐项目的参数值计算所述匹配项目的得分值;
利用以下之一对所述得分值进行调整:
如果所述推荐项目的类别符合根据所述搜索文本确定的搜索目标的类别特征,则增大所述得分值;
当本次搜索为精确搜索时,确定所述各匹配项目中与所述搜索文本相关度最高的第一匹配项目,如果所述推荐项目与所述第一匹配项目的相关度大于预设相关度阈值,增大所述推荐项目的得分值;
根据预设的第二阈值和所述得分值确定所述推荐项目所属的级别;
生成包括所述匹配项目和所述推荐项目的搜索结果列表,其中,所述匹配项目和所述推荐项目根据其级别按预定方式排列;
使所述用户的客户端呈现所述搜索结果列表。
本发明实施例的一种提供搜索结果的系统可以包括:
匹配项目搜索模块,用于根据用户输入的搜索文本在搜索目标库中搜索,得到各匹配项目及其参数值;
推荐项目搜索模块,用于根据所述搜索文本在推荐项目库中搜索,得到各推荐项目及其参数值;
分级模块,用于
根据所述匹配项目的参数值确定所述匹配项目所属的级别;
根据所述推荐项目的参数值计算所述匹配项目的得分值;
利用以下之一对所述得分值进行调整:
如果所述推荐项目的类别符合根据所述搜索文本确定的搜索目标的类别特征,则增大所述得分值;
当本次搜索为精确搜索时,确定所述各匹配项目中与所述搜索文本相关度最高的第一匹配项目,如果所述推荐项目与所述第一匹配项目的相关度大于预设相关度阈值,增大所述推荐项目的得分值;
根据预设的第二阈值和所述得分值确定所述推荐项目所属的级别;
搜索结果生成模块,用于生成包括所述匹配项目和所述推荐项目的搜索结果列表,其中,所述匹配项目和所述推荐项目根据其级别按预定方式排列;
搜索结果提供模块,用于使所述用户的客户端呈现所述搜索结果列表。
本发明实施例的一种计算机可读存储介质,存储有计算机可读指令,所述指令可以由一个或多个处理器执行以实现各实施例的提供搜索结果的方法。
通过各实施例的技术方案,通过对搜索得到的匹配项目和推荐项目根据其各自的参数进行级别划分,使得根据级别排列得到的搜索结果更符合用户的需要,从而减少用户进行搜索的次数,提高单次搜索的效率。
附图说明
图1为本发明实施例提供的一种提供搜索结果的方法;
图2为本发明实施例的一种确定推荐项目的级别的方法的流程图;
图3为本发明实施例的一种确定推荐项目的级别的方法的流程图;
图4为本发明实施例的一种确定推荐项目的级别的方法的流程图;
图5为本发明实施例的一种提供搜索结果的方法流程图;
图6a和图6b分别为本发明实施例中在不同搜索文本下的搜索结果列表呈现效果图;
图7为本发明实施例的一种提供搜索结果的系统的示意图。
具体实施方式
为了描述上的简洁和直观,下文通过描述若干代表性的实施例来对本发明的方案进行阐述。但本文并未示出所有实施方式。下文中,“包括”是指“包括但不限于”,“根据……”是指“至少根据……,但不限于仅根据……”。说明书和权利要求书中的“包括”及其变形是指某种程度上至少包括,应当解释为除了包括之后提到的特征外,其它特征也可以存在。下文中没有特别指出一个成分的数量时,意味着该成分可以是一个也可以是多个,或可理解为至少一个。
图1为本发明实施例提供的一种提供搜索结果的方法。如图1所示,该方法10可以包括以下步骤。
步骤S11,根据用户输入的搜索文本在搜索目标库中搜索,得到各匹配项目及其参数值。
步骤S12,根据所述匹配项目的参数值确定所述匹配项目所属的级别。
步骤S13,根据所述搜索文本在推荐项目库中搜索,得到各推荐项目及其参数值。
步骤S14,根据所述推荐项目的参数值确定所述推荐项目所属的级别;
步骤S15,生成包括所述匹配项目和所述推荐项目的搜索结果列表,其中,所述匹配项目和所述推荐项目根据其级别按预定方式排列。
步骤S16,使所述用户的客户端呈现所述搜索结果列表。
这里,级别也可以称为推荐级别,是指一个项目值得被推荐的程度。例如,一个项目的级别越高,则表示该匹配项目值得被推荐的程度越高。级别的具体表示方法这里不做限定。例如,当级别分为级别一至五,可以用级别一表示最高级别,也可以用级别五表示最高级别,即值得被推荐的程度最高。
通过对搜索得到的匹配项目和推荐项目根据其各自的参数进行级别划分,使得由不同的检索策略和评判标准得出的匹配项目和推荐项目通过级别划分在值得推荐的程度这一维度上具有了可比性。因此,根据级别排列得到的搜索结果中,匹配项目和推荐项目的顺序和个数可以根据具体情况而定,搜索结果更符合用户的需要,从而减少用户的搜索或者翻页次数,提高了搜索的效率。
一些例子中,步骤S12中可以根据所述匹配项目的参数值计算所述匹配项目的得分值,根据预设的第一阈值和所述得分值确定所述推荐项目所属的级别。第一阈值可以有一个或者多个,也可以是多个值的范围。相应地,各匹配项目可以被划分入两个或者两个以上的级别。
匹配项目的参数值可以包括以下中的至少一个,但不限于:所述匹配项目与所述搜索文本的相关度、根据所述匹配项目所属的类别、所述匹配项目的点击率、所述匹配项目的来源的权威性数据、所述匹配项目的用户认可度数据,或者其它能够体现匹配项目值得被推荐的程度的参数值。
匹配项目与搜索文本的相关度是指该匹配项目的名称或者描述信息与搜索文本的相似性程度,可以根据文本相似度算法计算得到,具体的算法可以采用现有的算法,也可以采用专门设计的算法。
匹配项目所属的类别是指该匹配项目所属的分类,例如,新闻、娱乐、社交,等。该类别可以从该匹配项目的描述数据中得到,或者是从预设的项目与类别的对应关系中得到,或采用其它的方式获得。
匹配项目的点击率是指在利用该搜索文本进行搜索时,该匹配项目被用户点击的比率,可以根据历史数据统计得到。点击率可以根据记录的先前的用户对搜索结果的点击行为,利用一个点击模型计算出来的分值,能衡量出一个搜索文本下,搜索结果中各项目被用户点击的情况。例如,在应用搜索平台搜“视频”,“M视频”这个APP在这个搜索文本下的点击率是0.6,“Q视频”这个APP在此搜索文本下点击率是0.3,大致可认为这个搜索文本下,约60%的人点击了“M视频”这个项目。
匹配项目的来源的权威性数据是指用于表示提供该匹配项目的提供者的权威性程度。一个匹配项目的权威性数据可以根据预设的项目提供者与其权威性数据的对应关系获得。一个项目提供者的权威性数据可以根据该提供者的市场占有率、品牌知名度、其它机构对其的认证结果,或其它数据来确定。
匹配项目的用户认可度数据用于表示该匹配项目在用户当中被认可的程度,可以根据针对该匹配项目的历史用户行为数据统计得到。例如可以根据用户对该匹配项目的点击数量、收藏数量、点赞数量、被下载的次数、用户的评分数据等来确定匹配项目的用户认可度。
计算得分值的方法可以按照参数值与得分值的预设关系来确定。这里,预设的关系可以包括,例如,匹配项目与搜索文本的相关度越高,则其得分值越高;匹配项目的所属的类别与根据搜索文本确定的搜索目标的类别越相近,则其得分值越高;匹配项目在该搜索文本条件下的点击率越高,则其得分值越高;匹配项目的来源的权威性越高,则其得分值越高;匹配项目的用户认可度越高,则其得分值越高。以上仅以部分参数的情况举例,实际还可以根据其它参数值来确定得分值。只要计算方法能够体现出预设的参数值与得分值的关系即可,这里不进行限定。
上述步骤S14中,推荐项目所属的级别可以根据推荐项目的一种或者多种参数值来确定。推荐项目的参数值可以包括以下中的至少一个,但不限于:所述推荐项目与所述搜索文本的相关度、所述推荐项目所属的类别、所述推荐项目的点击率、所述推荐项目的来源的权威性数据、所述推荐项目的用户认可度数据,或者其它能够体现推荐项目值得被推荐的程度的参数值。以上参数值的获得方式与匹配项目的相应参数值的获取方式类似,这里不再赘述。
可以采用各种可能的方式确定推荐项目的级别。例如,可以根据推荐项目的参数值计算匹配项目的得分值,根据预设的第二阈值和所述得分值确定所述推荐项目所属的级别。第二阈值可以有一个或者多个,也可以是多个值的范围。相应地,各推荐项目可以被划分入两个或者两个以上的级别。
一些例子中,由于推荐项目的打分规则与匹配项目的打分规则不同,因此,分级采用的阈值一般也不相同。通过设置合适的第一阈值和第二阈值,可以使得相同级别的匹配项目和推荐项目具有相似的值得被推荐的程度,即,使得通过不同标准和规则选择出的匹配项目和推荐项目通过分级具有了在值得推荐程度这一维度上的可比性。
一些例子中,在计算得到推荐项目的得分值后,还可以根据第二参数值调整其得分值。图2为本发明实施例的一种确定推荐项目的级别的方法的流程图。如图2所示,该方法20可以包括以下步骤。
步骤S21,根据推荐项目的第一参数值计算该推荐项目的得分值。
步骤S22,根据第二参数值调整所述推荐项目的得分值。
步骤S23,根据调整后的得分值确定所述推荐项目所属的级别。
这样,可以实现根据多种参数来确定推荐项目所属的级别,使得最终呈现给用户的搜索结果更能满足用户的需要,减少用户操作,提高搜索效率。
上述第一参数值可以是上面列举的推荐项目的参数值中的一种或者多种。例如,第一参数值为推荐项目与搜索文本的相关度时,可以根据该相关度计算该推荐项目的得分值。
第二参数值可以是上面列举的推荐项目的参数值中除第一参数值之外的一种或多种,也可以是一个或者多个匹配项目的一种或多种参数值,还可以是其它影响推荐项目的值得推荐程度的参数值。一些例子中,当所述第二参数值为多个时,则步骤S22可以被执行多次,每次根据一个第二参数值调整该得分值。另一些例子中,当所述第二参数值为多个时,则可以根据预设的算法,将得分值和各第二参数值代入一个预设的公式,计算得到调整后的得分值。
例如,第二参数值可以是根据搜索文本确定的搜索目标的类别特征,则步骤S22可以包括:如果所述推荐项目的类别符合所述搜索目标的类别特征,则增大所述得分值。
又例如,第二参数值可以是根据所述搜索文本确定的搜索模糊性特征,用于指示本次搜索为精确搜索还是模糊搜索。图3为本发明实施例的一种确定推荐项目的级别的方法的流程图。如图3所示,该方法30可以包括以下步骤。
步骤S31,根据推荐项目的第一参数值计算该推荐项目的得分值。
步骤S32,根据所述搜索文本确定搜索的模糊性特征。
步骤S33,根据模糊性特征判断本次搜索是否是精确搜索。
步骤S34,当所述搜索模糊性特征指示本次搜索为精确搜索时,确定所述各匹配项目中与所述搜索文本相关度最高的第一匹配项目,如果所述推荐项目与所述第一匹配项目的相关度大于预设相关度阈值,增大所述推荐项目的得分值。
当确定本次搜索为精确搜索时,说明用户有明确的搜索目标,因此,与可能的搜索目标(即上述第一匹配项目,也即与搜索文本相关度最高的一个或者多个匹配项目)相关度较高的推荐项目也很有可能是用户感兴趣的。通过增大这些推荐项目的得分值,可以将这些用户可能感兴趣的推荐项目的排序提前,从而使提供给用户的搜索结果更符合用户的需要,提高搜索效率。
步骤S35,当所述搜索模糊性特征指示本次搜索为模糊搜索时,如果所述推荐项目的第三参数值符合预设条件,增大所述推荐项目的得分值。
当确定本次搜索为模糊搜索时,说明用户并没有明确的搜索目标,只是对某一类信息感兴趣,例如搜索文本是“新闻资讯”或者“输入法”。此时,可以将一些质量较高的推荐项目的得分值增大,提前其排位,从而使提供给用户的搜索结果更符合用户的需要,提高搜索效率。这里,质量高,是指高度符合当前用户搜索的需要。
一些例子中,推荐项目的第三参数值可以包括以下中的至少一个,但不限于:所述推荐项目的点击率、所述推荐项目的来源的权威性数据、所述推荐项目的用户认可度数据,等。预设的条件可以是针对某一种第三参数值而设定的阈值。当采用的第三参数值为两种或以上时,可以分别针对每种第三参数值分别采用各自的阈值进行判断。这里,第三参数值可以是以下中的至少一个:所述推荐项目的点击率、所述推荐项目的来源的权威性数据、所述推荐项目的用户认可度数据。
步骤S36,根据调整后的得分值确定所述推荐项目所属的级别。
一些例子中,步骤S32中可以根据搜索文本获得各匹配项目,然后根据各匹配项目的参数值确定所述搜索模糊性特征。例如,根据搜索文本在搜索目标库中进行搜索后,可以得到包括多个匹配项目的匹配项目列表。该列表中的各匹配项目的顺序可以根据与搜索文本的相关度按预定规则确定。一些例子中,可以从各匹配项目中选取一个或者多个与搜索文本的相关度最高的匹配项目,例如,按照与搜索文本的相关度从高到低的顺序依次选取匹配项目列表中的前预定数目个匹配项目。然后根据选取的匹配项目的参数值,例如与所述搜索文本的相关度、点击率等来确定本次搜索的模糊性特征。例如,当所选取的匹配项目的参数值符合预设的条件(例如,大于预设阈值,或者根据某一公式计算得到的结果符合预设条件)时,则判断本次搜索为精确搜索;若不符合预设条件,则判断本次搜索为模糊搜索。
另一些例子中,步骤S32中可以根据预设的搜索文本与模糊性特征值之间的对应关系确定所述搜索文本的模糊性特征值,根据所述模糊性特征值确定所述搜索模糊性特征。
例如,一种计算搜索文本的模糊性特征值(也称为搜索熵值)的公式可以如下:
Figure GDA0002503252210000101
其中,QEq表示搜索文本的熵值,p(d,q)表示在先前的搜索过程中,当搜索文本为q时,匹配项目d被点击到的比率。其中,匹配项目被点击到的比率等于匹配项目被点击到的次数与所有匹配项目的总点击次数的比值。例如,搜索文本为q时,过去产生的总点击数为n,其中,m次点击了匹配项目d,则p(d,q)=m/n。搜索文本的熵值为对各匹配项目计算匹配项目被点击到的比率的以2为底的对数值和匹配项目被点击到的比率的乘积,然后对各匹配项目计算得到的乘积求和的结果。p(d,q)=m/n的值的范围为(0,1),log2p(d,q)的值为负值。利用计算出的熵值和预定的阈值,就可确定本次搜索为模糊搜索还是精准搜索,即确定了本次搜索的模糊性特征。
一些例子中,还可以根据匹配项目中与搜索文本的相关度排在前预定数目个的匹配项目的相关度、点击率等特征来调整熵值。例如,如果相关度最高的匹配项目的相关度和/或点击率超过预设阈值,可以增大计算出的熵值,例如,可以乘以一个大于1的倍数,等。
一些例子中,可以将一些搜索文本的熵值记录起来,供后续查询。记录的搜索文本的熵值可以按照预定的时间间隔重新计算并更新。
一些例子中,在对推荐项目进行分级后,还可以在各级别内,调整同一级别的多个推荐项目的排列顺序。图4为本发明实施例的一种确定推荐项目的级别的方法的流程图。如图4所示,该方法40可以包括以下步骤。
步骤S41,根据匹配项目的参数值确定所述匹配项目所属的级别。
步骤S42,根据推荐项目的参数值确定所述推荐项目所属的级别。
步骤S43,根据推荐项目的第四参数值确定属于同一级别的多个推荐项目的顺序。
步骤S44,生成包括匹配项目和推荐项目的搜索结果列表,其中,匹配项目和推荐项目根据其级别按预定方式排列,所述多个推荐项目根据步骤S43中确定的顺序排列。
这里,通过划分级别,将质量较好的推荐项目划分在较高的推荐级别后,保证了推荐项目大体的排序是按照推荐级别从高到低的顺序。本实施例中,可以在各级别内部,根据其它的参数来对级别内推荐项目的顺序进行调整,在不破坏按质量排序的大前提下,达到一些其它的效果,例如提高收益等。
这里,推荐项目的第四参数值包括以下中的至少一个,但不限于:所述推荐项目的推荐需求、推荐所述推荐项目可获得的收益,等。当推荐项目是由其提供者委托推广时,委托方可能提出了推荐需求,例如预定时间内的推荐次数、曝光量、点击量等时,这些推荐需求也称为库存量。库存量大的推荐项目的推荐需求更大,因此,可以根据推荐需求的大小来调整推荐项目在级别内的排序,例如,可以将级别内的推荐项目按照库存量进行排序。又例如,当推荐项目的提供者会为每次推荐付费时,可以根据推荐项目的价格,即推荐所述推荐项目可获得的收益,来调整推荐项目在级别内的排序,例如,可以将级别内的推荐项目按照价格进行排序,等。当采用的第四参数值为多个时,可以根据每个参数设定阈值,根据每个参数对推荐项目在级别内的顺序提前预定的位次;或者,可以根据预设的算法,将各第四参数值代入,根据计算得到的数值来确定各推荐项目在级别内的排序。
一些例子中,生成搜索结果列表时,可以按预定方式并根据级别,对所得到的各匹配项目和各推荐项目进行排序;创建一空的搜索结果列表;根据所述搜索结果列表中可包括的推荐项目的总数最大值和/或可相邻排列的推荐项目的最大个数,以及各匹配项目和各推荐项目的排序结果,确定包括在所述搜索结果列表中的各匹配项目和各推荐项目并将其加入所述搜索结果列表。
本发明实施例的方法可以应用在应用程序APP的搜索场景中。图5为本发明实施例的一种提供搜索结果的方法流程图。如图5所示,该方法50可以包括以下步骤。
步骤S51,根据用户输入的搜索文本在APP库中搜索,得到多个匹配项目及其与搜索文本的相关度。
步骤S52,根据所述匹配项目的相关度计算所述匹配项目的得分值,根据所述得分值和预设的第一阈值确定所述匹配项目所属的级别。
一些例子中,可以将相关度作为得分值。另一些例子中,可以根据预定算法对相关度进行处理得到得分值。
预设的第一阈值可以是一个或者多个值,或者一个或多个值的范围。例如,预设第一阈值可以是0~0.35,0.35~0.7,0.7~0.85,0.85~1,分别对应级别四、三、二、一。这里,最高的推荐级别用级别一来表示,相应地,级别四表示最低的推荐级别。假设匹配项目A1、A2、A3、A4的得分值分别为0.3、0.4、0.9和0.95,则确定其级别分别为四、三、一、一。
第一阈值可以由一个或者多个,也可以是多个值的范围。相应地,各匹配项目可以被划分入两个或者两个以上的级别。
步骤S53,根据用户输入的搜索文本在推荐项目库中搜索,得到多个推荐项目及其与搜索文本的相关度。
本实施例中,匹配项目和推荐项目均为应用程序APP的信息,例如,可以包括以下中的至少一个:APP的名称、图标、版本号、大小、开发者、介绍、下载地址、用户评价信息、在搜索平台中的唯一标识,等。一个APP的信息可以以一个文档的形式存储在搜索目标库或推荐项目库中。
步骤S54,根据所述推荐项目的相关度计算所述推荐项目的得分值,并根据第二参数值调整所述得分值。
一些例子中,可以将相关度作为得分值。另一些例子中,可以根据预定算法对相关度进行处理得到得分值。
一些例子中,可以根据推荐项目的提供者的权威性数据和用户下载量作为第二参数来调整各推荐项目的得分值。假设推荐项目B1、B2、B3、B4的得分值分别为0.3、0.75、0.8和0.925,B2的提供者权威度超过预定阈值,则B2的得分值可被调整为0.75*1.2=0.9。B3的下载量超过预定阈值,则B3的得分则可以被调整为0.8*1.1=0.88。
一些例子中,可以根据具有最高搜索文本相关度的匹配项目的参数来调整各推荐项目的得分值。假设推荐项目B1、B2、B3、B4的得分值分别为0.3、0.75、0.8和0.925,B2与搜索文本相关度最高的匹配项目的相关度超过预定阈值,则B2的得分值可被调整为0.75*1.2=0.9;B3与搜索文本相关度第二高的匹配项目的相关度超过预定阈值,则B3的得分则可以被调整为0.8*1.1=0.88。
步骤S55,根据预设的第二阈值和所述得分值确定所述推荐项目所属的级别。
预设的第二阈值可以是一个或者多个值,或者一个或多个值的范围。例如,预设第一阈值可以是0~0.4,0.4~0.6,0.6~0.85,0.85~1,分别对应级别四、三、二、一。与匹配项目的级别相同地,推荐项目的最高推荐级别也用级别一来表示,相应地,级别四表示最低的推荐级别。在上面的例子中,推荐项目B1、B2、B3、B4调整后的得分值分别为0.3、0.9、0.88和0.92,则确定其级别分别为四、一、一、一。
步骤S56,根据所述推荐项目的第三参数值确定属于同一级别的多个推荐项目的顺序。
一些例子中,可能有多个推荐项目被划分入同一级别,这些推荐项目的顺序可以根据一些参数进行调整。例如,可以根据推荐项目的推荐需求(例如,库存量、优先级等)、所述推荐项目的收益(例如,每次被推荐的价格,等)对同一级别的多个推荐项目进行排序。这样,在同一级别中,推荐需求较高或者收益较高的推荐项目的顺序可以被排在更靠前的位置。由于这种顺序调整不会改变推荐项目所属的级别,因此,推荐需求、收益等因素不会影响推荐项目根据相关性、权威性等参数的排列的大体顺序。
在上面的例子中,推荐项目B2、B3、B4同属于级别一,其按照得分值的排序为B4>B2>B1。假设B2、B3、B4的广告价格从高到低排序依次为B3>B2>B4,则可以将其排序改为B3、B2、B4。调整后,推荐项目B1、B2、B3、B4的推荐顺序从高到低依次为B3、B2、B4、B1。由于B3、B2、B4同属于级别一,均为值得推荐程度很高的项目,因此,它们之间的顺序调整不会影响推荐项目的质量。而由于B1被分入级别四,即使它的广告费用非常高,它只能在级别四内部进行顺序调整,不会进入级别三,更不会进入级别一。这样,质量不高的推荐项目也不会因为价格等因素被排到质量较高的推荐项目之前,从而保证了搜索结果能够符合用户的需要,提高搜索效率。
步骤S57,按预定方式并根据级别,生成各匹配项目和各推荐项目的搜索结果列表。
一个例子中,生成搜索结果列表的方法可以包括:
a1,对所得到的各匹配项目和各推荐项目根据级别进行排序。
上面的例子中,按照级别排序的结果是:(级别一)A3、A4、B3、B2、B4、(级别二)A1、(级别三)A2、(级别四)B1。
a2,根据预设的搜索结果列表中可包括的推荐项目的总数最大值和/或可相邻排列的推荐项目的最大个数,以及各匹配项目和各推荐项目的排序结果,确定包括在所述搜索结果列表中的各匹配项目和各推荐项目。
a3,创建一空的搜索结果列表,将确定的各匹配项目和推荐项目加入所述搜索结果列表。
上例中,假设预设的推荐项目总数最大值为5、可相邻排列的推荐项目的最大个数为2,则上面的推荐项目均可包括在搜索结果列表中。
一些例子中,如果预设的规则是级别高的推荐项目排在级别低的匹配项目之前,生成的搜索结果列表可以依次包括:(级别一)B3、B2、A3、A4、B4、(级别二)A1、(级别三)A2、(级别四)B1,或者(级别一)A3、B3、B2、A4、B4、(级别二)A1、(级别三)A2、(级别四)B1,或者其它符合规则的排列方式。
另一些例子中,如果预设的规则是级别高的推荐项目可以排在级别低的匹配项目之后,生成的搜索结果列表可以依次包括:(级别一)A3、A4、B3、B2、(级别二)A1、(级别一)B4、(级别三)A2、(级别四)B1,或者其它符合规则的排列方式。
步骤S58,使用户的客户端呈现所述搜索结果列表。
图6a和图6b分别为本发明实施例中在不同搜索文本下的搜索结果列表呈现效果图。
图6a示出,搜索文本为“输入法”,根据得到的相关度最高的两个匹配项目“ABC输入法”和“XYZ输入法”的相关度和点击率均超过各自预定的阈值,可以确定本次搜索为精确搜索。此时,可以将与匹配项目“XYZ输入法”相关度超过预设阈值的推荐项目“XYZ浏览器”的得分值增大,从而使得“XYZ浏览器”的级别提高,被安排在搜索结果列表中比较靠前的位置。
图6b示出,搜索文本为“新闻资讯”,查熵值表确定本次搜索为模糊搜索。搜索得到的推荐项目“XX快报”和“CC新闻”,由于其与搜索文本的相关度、提供者权威性、和下载量的值均比较高,根据预设算法,其得分值被增大,因此被安排在搜索结果列表中最靠前的位置。
本发明实施例还提供一种提供搜索结果的系统。图7为本发明实施例的一种提供搜索结果的系统的示意图。如图7所示,该系统70可以包括处理器701、通信接口704、存储装置706和总线709。存储装置706中包括操作系统707、通信模块708、数据库702和搜索模块703。
该系统70可以应用在提供搜索服务的平台中,可以由一个或者多个计算设备实现。
处理器701可以有一个或者多个,可以在同一个物理设备中,或者分布在多个物理设备中。
系统70可以利用通信接口704通过某种网络接收用户通过客户端提交的搜索文本,并通过通信接口704将搜索结果列表提供给用户的客户端用于显示。
数据库702中存储有搜索目标库721和推荐项目库722。
搜索模块703用于根据用户输入的搜索文本在数据库702中搜索得到各匹配项目和各推荐项目,并生成搜索结果列表供用户的客户端显示。
搜索模块703可以包括:
匹配项目搜索模块731,用于根据用户输入的搜索文本在搜索目标库中搜索,得到各匹配项目及其参数值;
推荐项目搜索模块732,用于根据所述搜索文本在推荐项目库中搜索,得到各推荐项目及其参数值;
分级模块733,用于根据所述匹配项目的参数值确定所述匹配项目所属的级别;根据所述推荐项目的参数值确定所述推荐项目所属的级别;
搜索结果生成模块734,用于生成包括所述匹配项目和所述推荐项目的搜索结果列表,其中,所述匹配项目和所述推荐项目根据其级别按预定方式排列;
搜索结果提供模块735,用于使所述用户的客户端呈现所述搜索结果列表。
一些例子中,分级模块733可以根据所述匹配项目的参数值计算所述匹配项目的得分值,根据预设的第一阈值和所述得分值确定所述推荐项目所属的级别;根据所述推荐项目的参数值计算所述匹配项目的得分值,根据预设的第二阈值和所述得分值确定所述推荐项目所属的级别。
一些例子中,分级模块733可以根据所述推荐项目的参数值计算所述匹配项目的得分值;根据第二参数值调整所述得分值;根据预设的第二阈值和所述得分值确定所述推荐项目所属的级别。
一些例子中,分级模块733可以根据所述搜索文本确定搜索目标的类别特征;如果所述推荐项目的类别符合所述搜索目标的类别特征,则增大所述得分值。
一些例子中,分级模块733可以根据所述搜索文本确定本次搜索为精确搜索还是模糊搜索;当确定本次搜索为精确搜索时,确定所述各匹配项目中与所述搜索文本相关度最高的第一匹配项目;如果所述推荐项目与所述第一匹配项目的相关度大于预设相关度阈值,增大所述推荐项目的得分值;当确定本次搜索为模糊搜索时,如果所述推荐项目的第三参数值符合预设条件,增大所述推荐项目的得分值。
一些例子中,分级模块733还可以根据所述推荐项目的第四参数值确定属于同一级别的多个推荐项目的在该级别内的顺序;搜索结果生成模块用于根据所述多个推荐项目的在该级别内的顺序在所述搜索结果列表中排列所述多个推荐项目。
一些例子中,搜索结果生成模块734可以按预定方式并根据级别,对所得到的各匹配项目和各推荐项目进行排序;创建一空的搜索结果列表;根据所述搜索结果列表中可包括的推荐项目的总数最大值和/或可相邻排列的推荐项目的最大个数,以及各匹配项目和各推荐项目的排序结果,确定包括在所述搜索结果列表中的各匹配项目和各推荐项目并将其加入所述搜索结果列表。
根据本发明实施例,还可以利用机器学习的方法对各匹配项目和各推荐项目进行排序。根据这种方法,可以建立一种机器学习模型,利用标注有顺序的搜索结果数据和其中各项目的参数值来训练该机器学习模型,让机器模型自动学习出排序的规则。这样,就可以使用训练出的排序模型来对搜索得到的各匹配项目和各推荐项目进行混合排序。其中,机器模型会利用各个项目的参数来对各项目打分排序,并输入排序的结果。可以使用各种排序算法和模型,例如,AdaRank、SoftRank、LambdaMART、GDBT等。
需要说明的是,上述各流程和各结构图中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。各模块的划分仅仅是为了便于描述采用的功能上的划分,实际实现时,一个模块可以分由多个模块实现,多个模块的功能也可以由同一个模块实现,这些模块可以位于同一个设备中,也可以位于不同的设备中。另外,上面描述中采用“第一”、“第二”仅仅为了方便区分具有同一含义的两个对象,并不表示其有实质的区别。
各实施例中的硬件模块可以以硬件方式或硬件平台加软件的方式实现。上述软件包括机器可读指令,存储在非易失性存储介质中。因此,各实施例也可以体现为软件产品。
各例中,硬件可以由专门的硬件或执行机器可读指令的硬件实现。例如,硬件可以为专门设计的永久性电路或逻辑器件(如专用处理器,如FPGA或ASIC)用于完成特定的操作。硬件也可以包括由软件临时配置的可编程逻辑器件或电路(如包括通用处理器或其它可编程处理器)用于执行特定操作。
图中的模块对应的机器可读指令可以使计算机上操作的操作系统等来完成这里描述的部分或者全部操作。非易失性计算机可读存储介质可以是插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器。安装在扩展板或者扩展单元上的CPU等可以根据指令执行部分和全部实际操作。
非易失性计算机可读存储介质包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
综上所述,权利要求的范围不应局限于以上描述的例子中的实施方式,而应当将说明书作为一个整体并给予最宽泛的解释。

Claims (23)

1.一种提供搜索结果的方法,其特征在于,包括:
根据用户输入的搜索文本在搜索目标库中搜索,得到各匹配项目及其参数值;
根据所述匹配项目的参数值确定所述匹配项目所属的级别;
根据所述搜索文本在推荐项目库中搜索,得到各推荐项目及其参数值;
根据所述推荐项目的参数值计算所述匹配项目的得分值;
利用以下之一对所述得分值进行调整:
如果所述推荐项目的类别符合根据所述搜索文本确定的搜索目标的类别特征,则增大所述得分值;
当本次搜索为精确搜索时,确定所述各匹配项目中与所述搜索文本相关度最高的第一匹配项目,如果所述推荐项目与所述第一匹配项目的相关度大于预设相关度阈值,增大所述推荐项目的得分值;
根据预设的第二阈值和所述得分值确定所述推荐项目所属的级别;
生成包括所述匹配项目和所述推荐项目的搜索结果列表,其中,所述匹配项目和所述推荐项目根据其级别按预定方式排列;
使所述用户的客户端呈现所述搜索结果列表。
2.根据权利要求1所述的方法,其特征在于,所述根据匹配项目的参数值确定所述匹配项目所属的级别包括:
根据所述匹配项目的参数值计算所述匹配项目的得分值,根据预设的第一阈值和所述得分值确定所述推荐项目所属的级别。
3.根据权利要求1所述的方法,其特征在于,进一步包括:
当根据所述搜索文本确定的搜索模糊性特征指示本次搜索为模糊搜索时,如果所述推荐项目的第三参数值符合预设条件,增大所述推荐项目的得分值。
4.根据权利要求1所述的方法,其特征在于,所述根据预设的第二阈值和所述得分值确定所述推荐项目所属的级别包括:
根据所述推荐项目的参数值计算所述匹配项目的得分值;
根据第二参数值调整所述得分值;
根据预设的第二阈值和所述得分值确定所述推荐项目所属的级别。
5.根据权利要求1所述的方法,其特征在于,所述推荐项目的参数值包括以下中的至少一个:所述推荐项目与所述搜索文本的相关度、所述推荐项目所属的类别、所述推荐项目的点击率、所述推荐项目的来源的权威性数据、所述推荐项目的用户认可度数据。
6.根据权利要求1所述的方法,其特征在于,进一步包括:
根据所述搜索文本确定搜索模糊性特征,用于指示本次搜索为精确搜索还是模糊搜索。
7.根据权利要求6所述的方法,其特征在于,根据所述搜索文本确定搜索模糊性特征包括:
根据所述各匹配项目的参数值确定所述搜索模糊性特征;或
根据预设的搜索文本与模糊性特征值之间的对应关系确定所述搜索文本的模糊性特征值,根据所述模糊性特征值确定所述搜索模糊性特征。
8.根据权利要求2或7所述的方法,其特征在于,所述匹配项目的参数值包括以下中的至少一个:所述匹配项目与所述搜索文本的相关度、根据所述匹配项目的所属的类别、所述匹配项目的点击率、所述匹配项目的来源的权威性数据、所述匹配项目的用户认可度数据。
9.根据权利要求3所述的方法,其特征在于,所述推荐项目的第三参数值包括以下中的至少一个:所述推荐项目的点击率、所述推荐项目的来源的权威性数据、所述推荐项目的用户认可度数据。
10.根据权利要求1所述的方法,其特征在于,进一步包括:
根据所述推荐项目的第四参数值确定属于同一级别的多个推荐项目的顺序;
所述搜索结果列表中所述多个推荐项目根据所述顺序排列。
11.根据权利要求10所述的方法,其特征在于,所述推荐项目的第四参数值包括以下中的至少一个:所述推荐项目的推荐需求、推荐所述推荐项目可获得的收益。
12.根据权利要求1所述的方法,其特征在于,所述生成包括所述匹配项目和所述推荐项目的搜索结果列表包括:
按预定方式并根据级别,对所得到的各匹配项目和各推荐项目进行排序;
创建一空的搜索结果列表;
根据所述搜索结果列表中可包括的推荐项目的总数最大值和/或可相邻排列的推荐项目的最大个数,以及各匹配项目和各推荐项目的排序结果,确定包括在所述搜索结果列表中的各匹配项目和各推荐项目并将其加入所述搜索结果列表。
13.根据权利要求1所述的方法,其特征在于,所述匹配项目和所述推荐项目为应用程序APP的信息。
14.一种提供搜索结果的系统,其特征在于,包括:
匹配项目搜索模块,用于根据用户输入的搜索文本在搜索目标库中搜索,得到各匹配项目及其参数值;
推荐项目搜索模块,用于根据所述搜索文本在推荐项目库中搜索,得到各推荐项目及其参数值;
分级模块,用于
根据所述匹配项目的参数值确定所述匹配项目所属的级别;
根据所述推荐项目的参数值计算所述匹配项目的得分值;
利用以下之一对所述得分值进行调整:
如果所述推荐项目的类别符合根据所述搜索文本确定的搜索目标的类别特征,则增大所述得分值;
当本次搜索为精确搜索时,确定所述各匹配项目中与所述搜索文本相关度最高的第一匹配项目,如果所述推荐项目与所述第一匹配项目的相关度大于预设相关度阈值,增大所述推荐项目的得分值;
根据预设的第二阈值和所述得分值确定所述推荐项目所属的级别;
搜索结果生成模块,用于生成包括所述匹配项目和所述推荐项目的搜索结果列表,其中,所述匹配项目和所述推荐项目根据其级别按预定方式排列;
搜索结果提供模块,用于使所述用户的客户端呈现所述搜索结果列表。
15.根据权利要求14所述的系统,其特征在于,所述分级模块用于:
根据所述匹配项目的参数值计算所述匹配项目的得分值,根据预设的第一阈值和所述得分值确定所述推荐项目所属的级别;
根据所述推荐项目的参数值计算所述匹配项目的得分值,根据预设的第二阈值和所述得分值确定所述推荐项目所属的级别。
16.根据权利要求14所述的系统,其特征在于,所述分级模块进一步用于:
当根据所述搜索文本确定的搜索模糊性特征指示本次搜索为模糊搜索时,如果所述推荐项目的第三参数值符合预设条件,增大所述推荐项目的得分值。
17.根据权利要求14中任一权利要求所述的系统,其特征在于,所述推荐项目的参数值包括以下中的至少一个:所述推荐项目与所述搜索文本的相关度、所述推荐项目所属的类别、所述推荐项目的点击率、所述推荐项目的来源的权威性数据、所述推荐项目的用户认可度数据。
18.根据权利要求14所述的系统,其特征在于,所述分级模块用于:
根据所述搜索文本确定本次搜索为精确搜索还是模糊搜索。
19.根据权利要求16所述的系统,其特征在于,所述推荐项目的第三参数值包括以下中的至少一个:所述推荐项目的点击率、所述推荐项目的来源的权威性数据、所述推荐项目的用户认可度数据。
20.根据权利要求14所述的系统,其特征在于,
所述分级模块进一步用于:根据所述推荐项目的第四参数值确定属于同一级别的多个推荐项目的在该级别内的顺序;
搜索结果生成模块用于根据所述多个推荐项目的在该级别内的顺序在所述搜索结果列表中排列所述多个推荐项目。
21.根据权利要求20所述的系统,其特征在于,所述推荐项目的第四参数值包括以下中的至少一个:所述推荐项目的推荐需求、推荐所述推荐项目可获得的收益。
22.根据权利要求14所述的系统,其特征在于,搜索结果生成模块用于:
按预定方式并根据级别,对所得到的各匹配项目和各推荐项目进行排序;
创建一空的搜索结果列表;
根据所述搜索结果列表中可包括的推荐项目的总数最大值和/或可相邻排列的推荐项目的最大个数,以及各匹配项目和各推荐项目的排序结果,确定包括在所述搜索结果列表中的各匹配项目和各推荐项目并将其加入所述搜索结果列表。
23.一种计算机可读存储介质,存储有计算机可读指令,其特征在于,所述指令可以由一个或多个处理器执行以实现根据权利要求1-12所述的提供搜索结果的方法。
CN201610420365.9A 2016-06-13 2016-06-13 提供搜索结果的方法和系统 Active CN107491462B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610420365.9A CN107491462B (zh) 2016-06-13 2016-06-13 提供搜索结果的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610420365.9A CN107491462B (zh) 2016-06-13 2016-06-13 提供搜索结果的方法和系统

Publications (2)

Publication Number Publication Date
CN107491462A CN107491462A (zh) 2017-12-19
CN107491462B true CN107491462B (zh) 2020-09-11

Family

ID=60642010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610420365.9A Active CN107491462B (zh) 2016-06-13 2016-06-13 提供搜索结果的方法和系统

Country Status (1)

Country Link
CN (1) CN107491462B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319646B (zh) * 2017-12-26 2020-10-09 金瓜子科技发展(北京)有限公司 基于用户历史行为的车源搜索方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258020A (zh) * 2013-05-02 2013-08-21 华南师范大学 一种结合sns和搜索引擎技术的推荐系统与方法
CN104516887A (zh) * 2013-09-27 2015-04-15 腾讯科技(深圳)有限公司 一种网页数据搜索方法、装置和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070067274A1 (en) * 2005-09-16 2007-03-22 International Business Machines Corporation Hybrid push-down/pull-up of unions with expensive operations in a federated query processor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258020A (zh) * 2013-05-02 2013-08-21 华南师范大学 一种结合sns和搜索引擎技术的推荐系统与方法
CN104516887A (zh) * 2013-09-27 2015-04-15 腾讯科技(深圳)有限公司 一种网页数据搜索方法、装置和系统

Also Published As

Publication number Publication date
CN107491462A (zh) 2017-12-19

Similar Documents

Publication Publication Date Title
US9342627B2 (en) Determining word information entropies
CN105678587B (zh) 一种推荐特征确定方法、信息推荐方法及装置
US8290927B2 (en) Method and apparatus for rating user generated content in search results
CN105765573B (zh) 网站通信量优化方面的改进
CN102483745B (zh) 共同选择图像分类
CN102542012B (zh) 分类搜索查询的结果
US8355997B2 (en) Method and system for developing a classification tool
US8311957B2 (en) Method and system for developing a classification tool
US20170161259A1 (en) Method and Electronic Device for Generating a Summary
EP3617952A1 (en) Information search method, apparatus and system
US8893012B1 (en) Visual indicator based on relative rating of content item
CN110428298A (zh) 一种店铺推荐方法、装置及设备
US20120173562A1 (en) Recommendation of search keywords based on indication of user intention
US20080306819A1 (en) System and method for shaping relevance scores for position auctions
WO2015120798A1 (en) Method for processing network media information and related system
US20130110829A1 (en) Method and Apparatus of Ranking Search Results, and Search Method and Apparatus
US8660901B2 (en) Matching of advertising sources and keyword sets in online commerce platforms
CN103310003A (zh) 一种基于点击日志的新广告点击率预测方法及系统
CN107153656B (zh) 一种信息搜索方法和装置
CN104951468A (zh) 数据搜索处理方法和系统
US11109085B2 (en) Utilizing one hash permutation and populated-value-slot-based densification for generating audience segment trait recommendations
US20120124070A1 (en) Recommending queries according to mapping of query communities
CN104239552A (zh) 生成关联关键词、提供关联关键词的方法及系统
US10394804B1 (en) Method and system for increasing internet traffic to a question and answer customer support system
KR102486241B1 (ko) 검열된 미디어 코퍼스에의 통합을 위한 미디어 소스 측정

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant