CN103885961B - 一种关联搜索词的推荐方法及系统 - Google Patents

一种关联搜索词的推荐方法及系统 Download PDF

Info

Publication number
CN103885961B
CN103885961B CN201210558798.2A CN201210558798A CN103885961B CN 103885961 B CN103885961 B CN 103885961B CN 201210558798 A CN201210558798 A CN 201210558798A CN 103885961 B CN103885961 B CN 103885961B
Authority
CN
China
Prior art keywords
search word
association search
association
root node
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210558798.2A
Other languages
English (en)
Other versions
CN103885961A (zh
Inventor
胡德凤
李兮芝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210558798.2A priority Critical patent/CN103885961B/zh
Publication of CN103885961A publication Critical patent/CN103885961A/zh
Application granted granted Critical
Publication of CN103885961B publication Critical patent/CN103885961B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及互联网技术领域,公开了一种关联搜索词的推荐方法及系统,该方法包括:获取搜索词;确定包含该搜索词的关联搜索词树,其中,该关联搜索词树以该搜索词形成根节点,以收集到该搜索词的每个日期形成一个中间分支节点,以及以每个日期内收集到的该搜索词的每个关联搜索词分别形成由该日期形成的中间分支节点的一个叶节点;利用每个叶节点中的关联搜索词的每个用户贡献值确定该关联搜索词的权重值;以及根据该根节点下的每个关联搜索词的权重值,确定该根节点下的每一类关联搜索词与该搜索词之间的关联值;根据每一类关联搜索词与该搜索词之间的关联值,选取若干类关联搜索词进行推荐。本发明能够准确地推荐出热门的关联搜索词。

Description

一种关联搜索词的推荐方法及系统
技术领域
本发明涉及互联网技术领域,具体涉及一种关联搜索词的推荐方法及系统。
背景技术
在购物平台中,当用户输入搜索词进行商品搜索后,购物平台通常会推荐一些与用户输入的搜索词相关联的其他搜索词(称为关联搜索词),以引导用户进行更多的商品交易。其中,购物平台推荐关联搜索词的方法简述如下:购物平台接收到用户输入的搜索词后,对用户输入的搜索词进行分解,以获得分解词;购物平台查询各个分解词的关联词作为关联搜索词推荐给用户。举例来说,当用户输入的搜索词是“adidas休闲鞋”时,购物平台对用户输入的搜索词“adidas休闲鞋”进行分解,可以获得分解词“adidas”和“休闲鞋”;进一步地,购物平台可以查询分解词“adidas”的关联词“adidas t恤”、“adidas运动鞋”等作为关联搜索词推荐给用户,以及查询分解词“休闲鞋”的关联词“nike休闲鞋”、“peak休闲鞋”等作为关联搜索词推荐给用户。
然而实践中发现,上述关联搜索词的推荐方法所推荐的关联搜索词的范围通常很大,无法准确地推荐出热门的关联搜索词。
发明内容
本发明实施例所要解决的技术问题是提供一种关联搜索词的推荐方法及系统,能够准确地推荐出热门的关联搜索词。
本发明实施例第一方面提供一种关联搜索词的推荐方法,包括:
获取搜索词;
确定包含该搜索词的关联搜索词树;该关联搜索词树以该搜索词形成根节点,以收集到该搜索词的每个日期形成一个中间分支节点,以及以每个日期内收集到的该搜索词的每个关联搜索词分别形成由该日期形成的中间分支节点的一个叶节点;
利用每个叶节点中的关联搜索词的每个用户贡献值确定该关联搜索词的权重值;其中,每个叶节点中的关联搜索词的每个用户贡献值取决于在该叶节点所属的中间分支节点下针对每个用户收集到的该关联搜索词与该搜索词的间隔距离;
根据该根节点下的每个关联搜索词的权重值,确定该根节点下的每一类关联搜索词与该搜索词之间的关联值;
根据所述每一类关联搜索词与该搜索词之间的关联值,选取若干类关联搜索词进行推荐。
本发明实施例第二方面提供一种关联搜索词的推荐系统,包括:
获取单元,用于获取搜索词;
第一确定单元,用于确定包含该搜索词的关联搜索词树;该关联搜索词树以该搜索词形成根节点,以收集到该搜索词的每个日期形成一个中间分支节点,以及以每个日期内收集到的该搜索词的每个关联搜索词分别形成由该日期形成的中间分支节点的一个叶节点;
第二确定单元,用于利用每个叶节点中的关联搜索词的每个用户贡献值确定该关联搜索词的权重值;其中,每个叶节点中的关联搜索词的每个用户贡献值取决于在该叶节点所属的中间分支节点下针对每个用户收集到的所述关联搜索词与所述搜索词的间隔距离;
第三确定单元,用于根据该根节点下的每个关联搜索词的权重值,确定该根节点下的每一类关联搜索词与所述搜索词之间的关联值;
推荐单元,用于根据所述每一类关联搜索词与该搜索词之间的关联值,选取若干类关联搜索词进行推荐。
本发明实施例中,在获取搜索词后,先确定以该搜索词为根节点的关联搜索词树,然后利用该关联搜索词树的每个叶节点中的关联搜索词的每个用户贡献值来确定该关联搜索词的权重值,再根据该根节点下的每个关联搜索词的权重值,确定该根节点下的每一类关联搜索词与该搜索词之间的关联值;最后根据每一类关联搜索词与该搜索词之间的关联值,选取若干类关联搜索词进行推荐。可见,基于上述技术方案,本发明实施例可以选取出关联值高的若干类关联搜索词进行推荐,从而可以实现准确地推荐出热门的关联搜索词。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种关联搜索词的推荐方法的流程图;
图2是本发明实施例提供的两种关联搜索词树的示意图;
图3是本发明实施例提供的一种关联搜索词的推荐系统的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种关联搜索词的推荐方法及系统,能够准确地推荐出热门的关联搜索词。以下分别进行详细说明。
请参阅图1,图1是本发明实施例提供的一种关联搜索词的推荐方法的流程图。如图1所示,该关联搜索词的推荐方法可以包括以下步骤。
101、获取搜索词。
本发明实施例中,系统可以接受用户输入的搜索词,或者,系统也可以主动向外部设备发送获取搜索词请求,并接受外部设备返回的搜索词,本发明实施例不作限定。
102、确定包含该搜索词的关联搜索词树;该关联搜索词树以该搜索词形成根节点,以收集到该搜索词的每个日期形成一个中间分支节点,以及以每个日期内收集到的该搜索词的每个关联搜索词分别形成由该日期形成的中间分支节点的一个叶节点。
本发明实施例中,系统收集到该搜索词的日期可以有多个,每个日期可以形成一个中间分支节点。特别地,当收集到该搜索词的多个日期中存在至少二个相同日期时,系统可以将该至少二个相同日期形成一个中间分支节点。
103、利用每个叶节点中的关联搜索词的每个用户贡献值确定该关联搜索词的权重值;其中,每个叶节点中的关联搜索词的每个用户贡献值取决于在该叶节点所属的中间分支节点下针对每个用户收集到的该关联搜索词与该搜索词的间隔距离。
本发明实施例中,系统可以将每个叶节点中的关联搜索词的每个用户贡献值进行累计,获得累计值作为该关联搜索词的权重值。
本发明实施例中,每个叶节点中的关联搜索词的每个用户贡献值与在该叶节点所属的中间分支节点下针对每个用户收集到的该关联搜索词与该搜索词的间隔距离成反比。其中,关联搜索词的每个用户贡献值用于表征了每个用户的搜索思路或意图。
104、根据该根节点下的每个关联搜索词的权重值,确定该根节点下的每一类关联搜索词与该搜索词之间的关联值。
一个实施例中,系统可以根据该根节点下的每个关联搜索词的权重值,将该根节点下的每一类关联搜索词的权重值进行累计,获得累计值作为该根节点下的该类关联搜索词与该搜索词之间的关联值。
另一个实施例中,系统也可以计算预设的基础系数与该根节点下的每一类关联搜索词中的每个关联搜索词对应的衰减系数的差值,以及计算该差值与该根节点下的该类关联搜索词中的该关联搜索词的权重值的乘积,将该乘积作为该根节点下的该类关联搜索词中的该关联搜索词的关联因子;以及,将该根节点下的每一类关联搜索词中的每个关联搜索词的关联因子进行累计,获得累计值作为该根节点下的该类关联搜索词与该搜索词之间的关联值;其中,该根节点下的每一类关联搜索词中的每个关联搜索词对应的衰减系数的大小,取决于该根节点下的该类关联搜索词中的该关联搜索词的收集日期与该根节点下的关联搜索词的最早收集日期之间的间隔距离。其中,该根节点下的每一类关联搜索词中的每个关联搜索词对应的衰减系数用于体现时间上的用户群体行为。
105、根据每一类关联搜索词与该搜索词之间的关联值,选取若干类关联搜索词进行推荐。
本发明实施例中,系统可以将每一类关联搜索词与该搜索词之间的关联值从高到低(或从低到高)依次排序,并从最高关联值一端开始顺序选取若干类关联搜索词进行推荐。
一个实施例中,图1所示的关联搜索词的推荐方法还可以包括以下步骤:
1)、收集搜索词以及该搜索词的关联搜索词;
2)、将收集到的该搜索词形成关联搜索词树的根节点;
3)、将收集到该搜索词的每个日期形成关联搜索词树的一个中间分支节点;
4)、将每个日期内收集到的该搜索词的每个关联搜索词分别形成由该日期形成的中间分支节点的一个叶节点。
其中,通过上述步骤1)~步骤4)可以生成包含该搜索词的关联搜索词树。
举例来说,系统可以在一定时间段(比如说30天)收集用户输入的搜索词以及该搜索词的关联搜索词,并按照收集日期,用户ID,收集时间依次进行排序。以下是系统收集到的一段数据示例。
在上述的数据示例中,当“adidas”作为搜索词时,“adidas休闲鞋”、“adidas休闲鞋2012新款”可以作为搜索词“adidas”的关联搜索词;而当“adidas休闲鞋”作为搜索词时,“adidas休闲鞋2012新款”可以作为搜索词“adidas休闲鞋”的关联搜索词。
在上述的数据示例的基础上,可以生成图2所示的关联搜索词树a和关联搜索词树b。其中,关联搜索词树a以搜索词“adidas”形成根节点,以收集到搜索词“adidas”的日期(即20120801)形成一个中间分支节点,以及以该日期(即20120801)内收集到的搜索词“adidas”的关联搜索词“adidas休闲鞋”、“adidas休闲鞋2012新款”分别形成由该日期(即20120801)形成的中间分支节点的一个叶节点。其中,关联搜索词树b以搜索词“adidas休闲鞋”形成根节点,以收集到搜索词“adidas休闲鞋”的两个日期(即20120801和20120802)分别形成两个中间分支节点,以及以这两个日期(即20120801和20120802)内分别收集到的搜索词“adidas休闲鞋”的关联搜索词“adidas休闲鞋2012新款”分别形成由这两个日期(即20120801和20120802)形成的两个中间分支节点的一个叶节点。
在图2所示的关联搜索词树a中,在中间分支节点(即20120801)下,针对A用户收集到的关联搜索词“adidas休闲鞋”与搜索词“adidas”的间隔距离为1,系统可以设置A用户贡献值为5;同理,在中间分支节点(即20120801)下,针对B用户收集到的关联搜索词“adidas休闲鞋”与搜索词“adidas”的间隔距离也为1,系统也可以设置B用户贡献值为5。而在中间分支节点(即20120801)下,针对A用户收集到的关联搜索词“adidas休闲鞋2012新款”与搜索词“adidas”的间隔距离为2,系统可以设置A用户贡献值为4。
举例来说,当用户输入搜索词“adidas”时,系统可以确定包含搜索词“adidas”的关联搜索词树即是关联搜索词树a,系统可以将关联搜索词树a中的关联搜索词“adidas休闲鞋”形成的叶节点中的A用户贡献值(即5)和B用户贡献值(即5)进行累计,获得累计值(即10)作为关联搜索词“adidas休闲鞋”的权重值(即10);以及,系统可以将关联搜索词“adidas休闲鞋2012新款”形成的叶节点中的A用户贡献值(即4)作为关联搜索词“adidas休闲鞋2012新款”的权重值(即4)。
进一步地,在关联搜索词树a中,关联搜索词“adidas休闲鞋”和关联搜索词“adidas休闲鞋2012新款”分别为两类关联搜索词,假定预设的基础系数为1,关联搜索词“adidas休闲鞋”的收集日期为20120801,关联搜索词树a的关联搜索词的最早收集日期也同样为20120801,因此,关联搜索词“adidas休闲鞋”的衰减系数可以设置为0;联搜索词“adidas休闲鞋2012新款”的收集日期也为20120801,因此,关联搜索词“adidas休闲鞋2012新款”的衰减系数也可以设置为0。相应地,系统可以计算预设的基础系数(即1)与关联搜索词“adidas休闲鞋”对应的衰减系数(即0)的差值(即1),以及计算该差值(即1)与关联搜索词“adidas休闲鞋”的权重值(即10)的乘积(即10),将该乘积(即10)作为关联搜索词“adidas休闲鞋”的关联因子;以及,将关联搜索词“adidas休闲鞋”的关联因子进行累计,获得累计值作为关联搜索词“adidas休闲鞋”与搜索词“adidas”之间的关联值(即10)。相应地,系统可以计算预设的基础系数(即1)与关联搜索词“adidas休闲鞋2012新款”对应的衰减系数(即0)的差值(即1),以及计算该差值(即1)与关联搜索词“adidas休闲鞋2012新款”的权重值(即4)的乘积(即4),将该乘积(即4)作为关联搜索词“adidas休闲鞋2012新款”的关联因子;以及,将关联搜索词“adidas休闲鞋2012新款”的关联因子进行累计,获得累计值作为关联搜索词“adidas休闲鞋2012新款”与搜索词“adidas”之间的关联值(即4)。
进一步地,由于关联搜索词“adidas休闲鞋”与搜索词“adidas”之间的关联值(即10)高于关联搜索词“adidas休闲鞋2012新款”与搜索词“adidas”之间的关联值(即4),说明了关联搜索词“adidas休闲鞋”是热门的关联搜索词,因此,系统可以选取关联搜索词“adidas休闲鞋”进行推荐。
再举例来说,当用户输入搜索词“adidas休闲鞋”时,系统可以确定包含搜索词“adidas休闲鞋”的关联搜索词树即是关联搜索词树b,系统可以将关联搜索词树b中由收集日期20120801形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”形成的叶节点中的A用户贡献值(即5)进行累计,获得累计值(即5)作为收集日期20120801形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”的权重值(即5);以及,系统可以将由收集日期20120802形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”形成的叶节点中的C用户贡献值(即5,其中,针对C用户收集到的“adidas休闲鞋2012新款”与“adidas休闲鞋”的间隔距离为1,所以,C用户贡献值为5)进行累计,获得累计值(即5)作为收集日期20120802形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”的权重值(即5)。
进一步地,在关联搜索词树b中,关联搜索词“adidas休闲鞋2012新款”为一类关联搜索词,假定预设的基础系数为1,关联搜索词树b的关联搜索词的最早收集日期为20120801,因此,由20120801形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”的衰减系数可以设置为0;而由20120802形成的中间分支节点下的联搜索词“adidas休闲鞋2012新款”的收集日期为20120802,因此,由20120802形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”的衰减系数也可以设置为0.1。相应地,系统可以计算预设的基础系数(即1)与20120801形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”对应的衰减系数(即0)的差值(即1),以及计算该差值(即1)与20120801形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”的权重值(即5)的乘积(即5*1),将该乘积(即5*1)作为20120801形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”的关联因子;以及,系统可以计算预设的基础系数(即1)与20120802形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”对应的衰减系数(即0.1)的差值(即1-0.1),以及计算该差值(即1-0.1)与20120802形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”的权重值(即5)的乘积(即5*(1-0.1)),将该乘积(即5*(1-0.1))作为20120802形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”的关联因子;以及,将20120801形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”的关联因子与20120802形成的中间分支节点下的关联搜索词“adidas休闲鞋2012新款”的关联因子进行累计,获得累计值(即5*1+5*(1-0.1))作为关联搜索词“adidas休闲鞋2012新款”与搜索词“adidas休闲鞋”之间的关联值(即5*1+5*(1-0.1)=5+5*0.9=9.5)。
进一步地,当关联搜索词“adidas休闲鞋2012新款”与搜索词“adidas休闲鞋”之间的关联值(即9.5)高于关联搜索词树b中的其他类的关联搜索词(如果有的话)”与搜索词“adidas休闲鞋”之间的关联值时,说明了关联搜索词“adidas休闲鞋2012新款”是热门的关联搜索词,因此,系统可以选取关联搜索词“adidas休闲鞋2012新款”进行推荐。
本发明实施例中,用户在搜索时,输入一个已存在关联搜索词树中的搜索词(即根节点)时,系统可以利用群体用户行为来推荐出热门的关联搜索词,帮助用户达到理想的搜索结果。
本发明实施例中,系统推荐出来的关联搜索自然吻合群体用户的搜索思路,可以比较快速、准确地反应出来与某搜索词最相关的一类关联搜索词。
本发明实施例用户输入的搜索词为中心,与该用户相似用户群的群里行为为导向,结合时间和潮流的变化,逐步帮助用户横向关联或者缩小搜索范围,不断迭代,直到最终搜索到最热门的关联搜索词,从而可以引导用户进行更多交易。
在图1所示的关联搜索词的推荐方法中,在获取搜索词后,先确定以该搜索词为根节点的关联搜索词树,然后利用该关联搜索词树的每个叶节点中的关联搜索词的每个用户贡献值来确定该关联搜索词的权重值,再根据该根节点下的每个关联搜索词的权重值,确定该根节点下的每一类关联搜索词与该搜索词之间的关联值;最后根据每一类关联搜索词与该搜索词之间的关联值,选取若干类关联搜索词进行推荐。可见,图1所示的关联搜索词的推荐方法可以选取出关联值高的若干类关联搜索词进行推荐,从而可以实现准确地推荐出热门的关联搜索词。
请参阅图3,图3是本发明实施例提供的一种关联搜索词的推荐系统的结构图。如图3所示,该关联搜索词的推荐系统可以包括:
获取单元301,用于获取搜索词;
第一确定单元302,用于确定包含该搜索词的关联搜索词树;该关联搜索词树以该搜索词形成根节点,以收集到该搜索词的每个日期形成一个中间分支节点,以及以每个日期内收集到的该搜索词的每个关联搜索词分别形成由该日期形成的中间分支节点的一个叶节点;
第二确定单元303,用于利用每个叶节点中的关联搜索词的每个用户贡献值确定该关联搜索词的权重值;其中,每个叶节点中的关联搜索词的每个用户贡献值取决于在该叶节点所属的中间分支节点下针对每个用户收集到的该关联搜索词与该搜索词的间隔距离;
第三确定单元304,用于根据该根节点下的每个关联搜索词的权重值,确定该根节点下的每一类关联搜索词与该搜索词之间的关联值;
推荐单元305,用于根据每一类关联搜索词与该搜索词之间的关联值,选取若干类关联搜索词进行推荐。
本发明实施例中,第二确定单元303具体用于将每个叶节点中的关联搜索词的每个用户贡献值进行累计,获得累计值作为该关联搜索词的权重值。
本发明实施例中,第三确定单元304具体用于根据该根节点下的每个关联搜索词的权重值,将该根节点下的每一类关联搜索词的权重值进行累计,获得累计值作为该根节点下的该类关联搜索词与该搜索词之间的关联值。
本发明实施例中,第三确定单元304也可以具体用于计算预设的基础系数与该根节点下的每一类关联搜索词中的每个关联搜索词对应的衰减系数的差值,以及计算该差值与该根节点下的该类关联搜索词中的该关联搜索词的权重值的乘积,将该乘积作为该根节点下的该类关联搜索词中的该关联搜索词的关联因子;以及将该根节点下的每一类关联搜索词中的每个关联搜索词的关联因子进行累计,获得累计值作为该根节点下的该类关联搜索词与所述搜索词之间的关联值;其中,该根节点下的每一类关联搜索词中的每个关联搜索词对应的衰减系数的大小,取决于该根节点下的该类关联搜索词中的该关联搜索词的收集日期与该根节点下的关联搜索词的最早收集日期之间的间隔距离。
本发明实施例中,推荐单元305具体用于将每一类关联搜索词与该搜索词之间的关联值从高到低依次排序,并从最高关联值一端开始顺序选取若干类关联搜索词进行推荐。
一个实施例中,图3所示的系统还可以包括:
树生成单元306,用于收集搜索词以及该搜索词的关联搜索词,将收集到的该搜索词形成关联搜索词树的根节点,以及将收集到该搜索词的每个日期形成关联搜索词树的一个中间分支节点,以及将每个日期内收集到的该搜索词的每个关联搜索词分别形成由该日期形成的中间分支节点的一个叶节点。
在图3所示的关联搜索词的推荐系统中,在获取搜索词后,先确定以该搜索词为根节点的关联搜索词树,然后利用该关联搜索词树的每个叶节点中的关联搜索词的每个用户贡献值来确定该关联搜索词的权重值,再根据该根节点下的每个关联搜索词的权重值,确定该根节点下的每一类关联搜索词与该搜索词之间的关联值;最后根据每一类关联搜索词与该搜索词之间的关联值,选取若干类关联搜索词进行推荐。可见,图3所示的关联搜索词的推荐系统可以选取出关联值高的若干类关联搜索词进行推荐,从而可以实现准确地推荐出热门的关联搜索词。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-OnlyMemory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
以上对本发明实施例所提供的关联搜索词的推荐方法、系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种关联搜索词的推荐方法,其特征在于,包括:
获取搜索词;
确定包含该搜索词的关联搜索词树;该关联搜索词树以该搜索词形成根节点,以收集到该搜索词的每个日期形成一个中间分支节点,以及以每个日期内收集到的该搜索词的每个关联搜索词分别形成由该日期形成的中间分支节点的一个叶节点;
利用每个叶节点中的关联搜索词的每个用户贡献值确定该关联搜索词的权重值;其中,每个叶节点中的关联搜索词的每个用户贡献值取决于在该叶节点所属的中间分支节点下针对每个用户收集到的所述关联搜索词与所述搜索词的间隔距离;
根据该根节点下的每个关联搜索词的权重值,确定该根节点下的每一类关联搜索词与该搜索词之间的关联值;
根据所述每一类关联搜索词与该搜索词之间的关联值,选取若干类关联搜索词进行推荐。
2.根据权利要求1所述的方法,其特征在于,所述利用每个叶节点中的关联搜索词的每个用户贡献值确定该关联搜索词的权重值包括:
将每个叶节点中的关联搜索词的每个用户贡献值进行累计,获得累计值作为该关联搜索词的权重值。
3.根据权利要求1所述的方法,其特征在于,所述根据该根节点下的每个关联搜索词的权重值,确定该根节点下的每一类关联搜索词与该搜索词之间的关联值包括:
根据该根节点下的每个关联搜索词的权重值,将该根节点下的每一类关联搜索词的权重值进行累计,获得累计值作为该根节点下的该类关联搜索词与该搜索词之间的关联值。
4.根据权利要求1所述的方法,其特征在于,所述根据该根节点下的每个关联搜索词的权重值,确定该根节点下的每一类关联搜索词与该搜索词之间的关联值包括:
计算预设的基础系数与该根节点下的每一类关联搜索词中的每个关联搜索词对应的衰减系数的差值,以及计算该差值与该根节点下的该类关联搜索词中的该关联搜索词的权重值的乘积,将该乘积作为该根节点下的该类关联搜索词中的该关联搜索词的关联因子;
将该根节点下的每一类关联搜索词中的每个关联搜索词的关联因子进行累计,获得累计值作为该根节点下的该类关联搜索词与该搜索词之间的关联值;
其中,所述该根节点下的每一类关联搜索词中的每个关联搜索词对应的衰减系数的大小,取决于该根节点下的该类关联搜索词中的该关联搜索词的收集日期与该根节点下的关联搜索词的最早收集日期之间的间隔距离。
5.根据权利要求1所述的方法,其特征在于,所述根据所述每一类关联搜索词与该搜索词之间的关联值,选取若干类关联搜索词进行推荐包括:
将所述每一类关联搜索词与该搜索词之间的关联值从高到低依次排序,并从最高关联值一端开始顺序选取若干类关联搜索词进行推荐。
6.一种关联搜索词的推荐系统,其特征在于,包括:
获取单元,用于获取搜索词;
第一确定单元,用于确定包含该搜索词的关联搜索词树;该关联搜索词树以该搜索词形成根节点,以收集到该搜索词的每个日期形成一个中间分支节点,以及以每个日期内收集到的该搜索词的每个关联搜索词分别形成由该日期形成的中间分支节点的一个叶节点;
第二确定单元,用于利用每个叶节点中的关联搜索词的每个用户贡献值确定该关联搜索词的权重值;其中,每个叶节点中的关联搜索词的每个用户贡献值取决于在该叶节点所属的中间分支节点下针对每个用户收集到的所述关联搜索词与所述搜索词的间隔距离;
第三确定单元,用于根据该根节点下的每个关联搜索词的权重值,确定该根节点下的每一类关联搜索词与该搜索词之间的关联值;
推荐单元,用于根据所述每一类关联搜索词与该搜索词之间的关联值,选取若干类关联搜索词进行推荐。
7.根据权利要求6所述的系统,其特征在于,所述第二确定单元具体用于将每个叶节点中的关联搜索词的每个用户贡献值进行累计,获得累计值作为该关联搜索词的权重值。
8.根据权利要求6所述的系统,其特征在于,所述第三确定单元具体用于根据该根节点下的每个关联搜索词的权重值,将该根节点下的每一类关联搜索词的权重值进行累计,获得累计值作为该根节点下的该类关联搜索词与该搜索词之间的关联值。
9.根据权利要求6所述的系统,其特征在于,所述第三确定单元具体用于计算预设的基础系数与该根节点下的每一类关联搜索词中的每个关联搜索词对应的衰减系数的差值,以及计算该差值与该根节点下的该类关联搜索词中的该关联搜索词的权重值的乘积,将该乘积作为该根节点下的该类关联搜索词中的该关联搜索词的关联因子;以及将该根节点下的每一类关联搜索词中的每个关联搜索词的关联因子进行累计,获得累计值作为该根节点下的该类关联搜索词与该搜索词之间的关联值;其中,所述该根节点下的每一类关联搜索词中的每个关联搜索词对应的衰减系数的大小,取决于该根节点下的该类关联搜索词中的该关联搜索词的收集日期与该根节点下的关联搜索词的最早收集日期之间的间隔距离。
10.根据权利要求6所述的系统,其特征在于,所述推荐单元具体用于将所述每一类关联搜索词与该搜索词之间的关联值从高到低依次排序,并从最高关联值一端开始顺序选取若干类关联搜索词进行推荐。
CN201210558798.2A 2012-12-20 2012-12-20 一种关联搜索词的推荐方法及系统 Active CN103885961B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210558798.2A CN103885961B (zh) 2012-12-20 2012-12-20 一种关联搜索词的推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210558798.2A CN103885961B (zh) 2012-12-20 2012-12-20 一种关联搜索词的推荐方法及系统

Publications (2)

Publication Number Publication Date
CN103885961A CN103885961A (zh) 2014-06-25
CN103885961B true CN103885961B (zh) 2015-10-28

Family

ID=50954856

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210558798.2A Active CN103885961B (zh) 2012-12-20 2012-12-20 一种关联搜索词的推荐方法及系统

Country Status (1)

Country Link
CN (1) CN103885961B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107256244B (zh) * 2017-06-01 2021-09-03 北京京东尚科信息技术有限公司 数据处理方法和系统
CN111324804B (zh) * 2020-02-21 2023-09-22 抖音视界有限公司 搜索关键词推荐模型生成方法、关键词推荐方法与装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101479760A (zh) * 2006-06-28 2009-07-08 微软公司 在线关键词购买、广告和推销
CN101692223A (zh) * 2007-10-05 2010-04-07 富士通株式会社 响应于用户输入精炼搜索空间
CN102004979A (zh) * 2009-09-03 2011-04-06 叶克 一种提供商品匹配推广服务的系统和方法
CN102768681A (zh) * 2012-06-26 2012-11-07 北京奇虎科技有限公司 一种用于搜索输入的推荐系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101479760A (zh) * 2006-06-28 2009-07-08 微软公司 在线关键词购买、广告和推销
CN101692223A (zh) * 2007-10-05 2010-04-07 富士通株式会社 响应于用户输入精炼搜索空间
CN102004979A (zh) * 2009-09-03 2011-04-06 叶克 一种提供商品匹配推广服务的系统和方法
CN102768681A (zh) * 2012-06-26 2012-11-07 北京奇虎科技有限公司 一种用于搜索输入的推荐系统及方法

Also Published As

Publication number Publication date
CN103885961A (zh) 2014-06-25

Similar Documents

Publication Publication Date Title
US9418147B2 (en) Method and apparatus of determining product category information
US20170329856A1 (en) Method and device for selecting data content to be pushed to terminal, and non-transitory computer storage medium
JP5802745B2 (ja) インテリジェントナビゲーションの方法、装置、およびシステム
CN108090208A (zh) 融合数据处理方法及装置
US20140025533A1 (en) Method and Apparatus of Recommending Clothing Products
CN109559208A (zh) 一种信息推荐方法、服务器及计算机可读介质
CN108121737A (zh) 一种业务对象属性标识的生成方法、装置和系统
CN103729359A (zh) 一种推荐搜索词的方法及系统
US20130191409A1 (en) Intelligent navigation of a category system
CN106446189A (zh) 一种资讯推荐方法及系统
CN103810198A (zh) 一种商品信息的搜索方法及装置
CN103902545B (zh) 一种类目路径识别方法及系统
CN104102648A (zh) 基于用户行为数据的兴趣推荐方法及装置
CN105005582A (zh) 多媒体信息的推荐方法及装置
CN104866474A (zh) 个性化数据搜索方法及装置
CN103309894B (zh) 基于用户属性的搜索实现方法及系统
CN111159341B (zh) 基于用户投资理财偏好的资讯推荐方法及装置
CN105023178B (zh) 一种基于本体的电子商务推荐方法
CN103136683A (zh) 计算产品参考价格的方法、装置及产品搜索方法、系统
CN106951527B (zh) 一种歌曲推荐方法及装置
CN111639255B (zh) 搜索关键词的推荐方法、装置、存储介质及电子设备
CN104391999A (zh) 信息推荐方法和装置
CN104216884A (zh) 一种基于时间衰减的协同过滤系统及方法
CN103927673A (zh) 一种推荐业务信息的方法及装置
CN104992352A (zh) 一种个性化资源检索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant