CN104252470A - 一种热词推荐方法及系统 - Google Patents

一种热词推荐方法及系统 Download PDF

Info

Publication number
CN104252470A
CN104252470A CN201310261220.5A CN201310261220A CN104252470A CN 104252470 A CN104252470 A CN 104252470A CN 201310261220 A CN201310261220 A CN 201310261220A CN 104252470 A CN104252470 A CN 104252470A
Authority
CN
China
Prior art keywords
vocabulary
temperature
date
initial
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310261220.5A
Other languages
English (en)
Other versions
CN104252470B (zh
Inventor
王忻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Tai Yue Xiang Sheng Software Co., Ltd.
Original Assignee
CHONGQING XINMEI AGRICULTURAL INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHONGQING XINMEI AGRICULTURAL INFORMATION TECHNOLOGY CO LTD filed Critical CHONGQING XINMEI AGRICULTURAL INFORMATION TECHNOLOGY CO LTD
Priority to CN201310261220.5A priority Critical patent/CN104252470B/zh
Publication of CN104252470A publication Critical patent/CN104252470A/zh
Application granted granted Critical
Publication of CN104252470B publication Critical patent/CN104252470B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种热词推荐方法及系统,该推荐方法包括如下步骤:在存储器中存储词汇、始词汇热度和词汇的最近被访问日期;查找初始词汇热度,每天对当天未被访问的词汇计算当前词汇热度,将初始词汇热度的数值更新为当前词汇热度数值;在接收到词汇访问请求时,查找初始词汇热度和最近被访问日期,将初始词汇热度的数值加m,将最近被访问日期更新为当前日期。本发明仅利用初始词汇热度计算当前词汇热度,无需遍历该词所有天的访问记录,能够减少数据库访问量,减少访问记录的存储空间,提高统计速度和系统性能。同时每天对未被访问的词汇的热度采用消融算法进行计算,随着未被访问时间的增长逐渐降低其初始词汇热度,结果更准确。

Description

一种热词推荐方法及系统
技术领域
本发明涉及搜索引擎、网络服务开发技术领域,具体涉及一种高效率的热词推荐方法及系统。
背景技术
在许多网络服务器程序,例如新闻网站、购物网站、搜索网站中,都会统计用户输入的关键字,用于后期的数据挖掘处理,这样在网站页面上,可以提示用户最热门的检索关键字排序,用户以更准确,更便利的方式获取最想得到的网站内容。
在统计并推荐热门词汇(热词)的过程中,由于网站的访问量大,因此具有海量的关键字,热词的统计方式和统计效率成为整个热词统计技术的瓶颈点。传统的热词统计方式,是在数据库当中记录每一个词汇,并记录该词汇每天被访问的次数,当在一天内访问多次时,每次访问都在当天的计数上加1。
表1.传统的热词存储方式
ID 词汇 访问次数 日期
1 A 100 2012-01-01
2 B 90 2012-01-01
3 C 200 2012-01-01
5 A 120 2012-01-02
6 B 50 2012-01-02
7 C 30 2012-01-02
10000 A 50 2012-02-01
10001 B 40 2012-02-01
10002 C 80 2012-02-01
根据表1中热词的存储方式,现有技术中采用如下公式计算词汇的热度,词汇A的热度计算公式为:
HOT_VALUE(A)=一周内访问次数*周系数+一个月内访问次数*月系数+半年内访问次数*半年系数+一年内访问次数*一年系数+一年前访问次数*一年前访问系数,用字母表示即为:
HOT_VALUE(A)=n1*week+n2*month+n3*halfyear+n4*year+n5*yearago,其中,周系数week、月系数month、半年系数halfyear、一年系数year、一年前访问系数yearago可根据应用自定义,例如week=0.8,month=0.4,halfyear=0.2,year=0.1,Yearago=0.05。通过以上计算公式能够计算出的词汇A的当天热度值,但这种计算方式存在以下问题:
一、计算时每次都要遍历该词所有天内被访问的次数,如果时间久了会有大量的时间方向的数据,同时也浪费了数据库的存储空间;
二、当词汇达到海量后,无论该词最近有无被访问都要重新计算一遍,海量词汇重新计算十分耗时,并且耗时长短不可预计,降低了系统性能。
发明内容
为了克服上述现有技术中存在的缺陷,本发明的目的是提供一种热词推荐方法及系统,本发明在热词热度统计中参与的计算词汇量少,无需访问所有天的访问记录,能够减少数据库访问量,减少访问记录的存储空间,提高系统性能。
为了实现本发明的上述目的,根据本发明的一个方面,本发明提供了一种热词推荐方法,包括如下步骤:
S1,数据存储:在存储器的词汇存储阵列中存储词汇;在存储器的热度存储阵列中存储初始词汇热度,每一个词汇的存储地址与其初始词汇热度的存储地址一一对应;在存储器的日期存储阵列中存储词汇的最近被访问日期,每一个词汇的存储地址与其最近被访问日期的存储地址一一对应;
S2,数据更新:控制器通过词汇存储地址与初始词汇热度存储地址的对应关系查找所述词汇对应的初始词汇热度,每天对当天未被访问的词汇根据热度消融法计算当前词汇热度,每个当天未被访问的词汇的词汇热度随该词汇的访问日期间隔天数的增加而减小,将所述词汇对应的初始词汇热度的数值更新为当前词汇热度数值;
当控制器在接收到通过人机交互界面输入的词汇访问请求时,通过词汇存储地址与词汇热度存储地址的对应关系,以及词汇存储地址与最近被访问日期存储地址的对应关系查找所述词汇对应的初始词汇热度和最近被访问日期,将所述词汇对应的初始词汇热度的数值加m,如果最近被访问日期不是当前日期,将所述词汇对应的最近被访问日期更新为当前日期,如果最近被访问日期是当前日期,则不对日期做处理;
S3,数据显示:所述控制器指令人机交互界面对词汇热度高的前设定个数个词汇进行显示。
本发明的热词推荐方法将词汇的初始词汇热度和最近被访问日期存储在存储器中,每天对未被访问的词汇的热度采用消融算法进行计算,随着未被访问时间的增长逐渐降低其初始词汇热度,本发明在计算当前词汇热度时仅利用初始词汇热度进行运算,无需遍历该词所有天的访问记录,能够减少数据库访问量,减少访问记录的存储空间,提高统计速度和系统性能。
为了实现本发明的上述目的,根据本发明的二个方面,本发明提供了一种热词推荐系统,其包括:人机交互界面、控制器和存储器,所述人机交互界面与所述控制器连接,所述控制器与所述存储器连接;所述存储器包括存储词汇存储阵列、热度存储阵列和日期存储阵列,在词汇存储阵列中存储词汇,在热度存储阵列中存储初始词汇热度,每一个词汇的存储地址与其初始词汇热度的存储地址一一对应;在日期存储阵列中存储词汇的最近被访问日期,每一个词汇的存储地址与其最近被访问日期的存储地址一一对应;所述控制器用于:通过词汇存储地址与初始词汇热度存储地址的对应关系查找所述词汇对应的初始词汇热度,每天对当天未被访问的词汇根据热度消融法计算当前词汇热度,每个当天未被访问的词汇的词汇热度随该词汇的访问日期间隔天数的增加而减小,将所述词汇对应的初始词汇热度的数值更新为当前词汇热度数值;当控制器在接收到通过人机交互界面输入的词汇访问请求时,通过词汇存储地址与词汇热度存储地址的对应关系,以及词汇存储地址与最近被访问日期存储地址的对应关系查找所述词汇对应的初始词汇热度和最近被访问日期,将所述词汇对应的初始词汇热度的数值加m,如果最近被访问日期不是当前日期,将所述词汇对应的最近被访问日期更新为当前日期,如果最近被访问日期是当前日期,则不对日期做处理;控制器指令人机交互界面对词汇热度高的前设定个数个词汇进行显示。
本发明的热词推荐系统将词汇的初始词汇热度和最近被访问日期存储在存储器中,控制器每天对未被访问的词汇的热度采用消融算法进行计算并更新,随着未被访问时间的增长逐渐降低其初始词汇热度,本发明的控制器在计算当前词汇热度时仅利用初始词汇热度进行运算,无需遍历该词所有天的访问记录,能够减少数据库访问量,减少访问记录的存储空间,提高统计速度和系统性能。
在本发明的一种优选实施方式中,所述根据热度消融法计算当前词汇热度的方法为:
S21:计算词汇的间隔日期天数d;
S22:根据词汇被访问的间隔日期天数d确定消融系数,其中,所述消融系数p随访问日期间隔天数d的增长而梯度递减;
S23:根据公式H=(1-p)*h计算当前词汇热度H,其中,H为当前词汇热度,p为消融系数,h为初始词汇热度,d为访问日期间隔天数;
S24:将初始词汇热度h的数值更新为当前词汇热度H的数值。
本发明采用热词消融算法计算当前词汇热度,根据访问日期间隔天数确定消融系数并计算当前词汇热度,采用这种方法参与计算的词汇量少,仅计算哪些未被访问过的词汇,无需遍历该词所有天的访问记录,能够提高统计速度和系统性能。
在本发明的一种优选实施方式中,当d≤1时,p为0;当7≥d>1时,p为1/7,当30≥d>7时,p为1/30,当183≥d>30时,p为1/183,当365≥d>183时,p为1/365,当d>365,p为0。
随着时间的延长逐渐降低词汇热度的减小速率,使词汇热度不会降低为零。
在本发明的一种优选实施方式中,所述m为1。
在本发明的另一种优选实施方式中,所述设定个数为5。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一种优选实施方式中根据热度消融法计算当前词汇热度的流程图;
图2是本发明一种优选实方式中消融系数p随访问日期间隔天数d的变化曲线;
图3是本发明热词推荐系统的方框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
本发明提供了一种热词推荐方法,包括如下步骤:
S1,数据存储:如表2所示,在存储器的词汇存储阵列中存储词汇;在存储器的热度存储阵列中存储初始词汇热度,每一个词汇的存储地址与其初始词汇热度的存储地址一一对应;在存储器的日期存储阵列中存储词汇的最近被访问日期,每一个词汇的存储地址与其最近被访问日期的存储地址一一对应;词汇存储阵列中的词汇与热度存储阵列中的初始词汇热度可以通过ID确定对应关系,词汇存储阵列中的词汇与日期存储阵列中的最近被访问日期也可以通过ID确定对应关系。
表2.本发明的热词存储方式
ID 词汇 初始词汇热度 最近被访问的日期
1 A 1000 2012-01-01
2 B 900 2012-01-01
3 C 2000 2012-01-01
S2,数据更新:控制器通过词汇存储地址与初始词汇热度存储地址的对应关系查找所述词汇对应的初始词汇热度,每天对当天未被访问的词汇根据热度消融法计算当前词汇热度,每个当天未被访问的词汇的词汇热度随该词汇的访问日期间隔天数的增加而减小,将所述词汇对应的初始词汇热度的数值更新为当前词汇热度数值。
当控制器在接收到通过人机交互界面输入的词汇访问请求时,通过词汇存储地址与词汇热度存储地址的对应关系,以及词汇存储地址与最近被访问日期存储地址的对应关系查找所述词汇对应的初始词汇热度和最近被访问日期,将所述词汇对应的初始词汇热度的数值加m,在本实施方式中,m优选为1,如果最近被访问日期不是当前日期,将所述词汇对应的最近被访问日期更新为当前日期,如果最近被访问日期是当前日期,则不对日期做处理。
在本实施方式中,根据热度消融法计算当前词汇热度,降低那些过时未被访问词汇的热度的方法为:
H=(1-p)*h;
其中,H为当前词汇热度,p为消融系数,h为初始词汇热度,d为访问日期间隔天数,访问日期间隔天数为当前词汇的最近被访问的日期与当前日期之间的间隔天数。
具体的计算过程如图1所示,首先,计算词汇的间隔日期天数d,然后,根据词汇被访问的间隔日期天数d确定消融系数,其中,消融系数p随访问日期间隔天数d的增长而梯度递减。在本发明的一个优选实施方式中,如图2所示,当d≤1时,p为0;当7≥d>1时,p为1/7,当30≥d>7时,p为1/30,当183≥d>30时,p为1/183,当365≥d>183时,p为1/365,当d>365,p为0。再后,根据公式H=(1-p)*h计算当前词汇热度H,并将初始词汇热度的数值更新为当前词汇热度数值。
在本发明的一种优选实施方式中,例如表2中所示为2012年1月1号的存储信息,如果2012年1月2号没有对A、B、C进行访问,并且访问日期间隔天数d为1,消融系数p为0,当前词汇热度H=初始词汇热度h,2012年1月2号存储的表格为表3所示。
表3.表2所示数据在2012年1月2号的存储情况
ID 词汇 初始词汇热度 最近被访问的日期
1 A 1000 2012-01-01
2 B 900 2012-01-01
3 C 2000 2012-01-01
在2012年1月3号,如果这一天用户对词汇A进行访问了两次,对词汇B和C没有进行访问,根据表3中的记载,词汇A、B、C的最近被访问日期均为2012年1月1号,访问日期间隔天数d为2,则控制器通过词汇与词汇热度的对应关系查找与词汇A对应的初始词汇热度,为1000,在第一次访问时,将词汇对应的初始词汇热度的数值加1,为1001,同时将词汇A对应的最近被访问日期更新为当前日期2012年1月3号,在第二次访问时,将词汇对应的初始词汇热度的数值加1,为1002,由于词汇A对应的最近被访问日期更新为当前日期2012年1月3号,不再更新。控制器通过词汇与词汇热度的对应关系查找与词汇B对应的初始词汇热度,为900,由于访问日期间隔天数d为2,消融系数p为1/7,当前词汇热度H=(1-1/7)*900=771.14,在本实施方式中,对当前词汇热度H采用四舍五入取整,即为771。同理,控制器通过词汇与词汇热度的对应关系查找与词汇C对应的初始词汇热度,为2000,由于访问日期间隔天数d为2,消融系数p为1/7,当前词汇热度H=(1-1/7)*2000=1714。这样,在2012年1月3号存储的的表格为表4所示。
表4.表2所示数据在2012年1月3号的存储情况
ID 词汇 初始词汇热度 最近被访问的日期
1 A 1002 2012-01-03
2 B 771 2012-01-01
3 C 1714 2012-01-01
本发明中,对当天访问过的词汇每访问一次将其对应的初始词汇热度的数值加m,m为正数;每天对当天未被访问的词汇根据热度消融法计算当前词汇热度,根据访问日期间隔天数确定消融系数并计算当前词汇热度,热度消融算法参与计算的词汇量少,仅计算那些未被访问过的词汇,无需遍历该词所有天的访问记录,能够提高统计速度和系统性能。
S3,数据显示:控制器指令人机交互界面根据词汇热度高低对所述词汇进行显示。在本实施方式中,将热度高的词汇显示在前,将热度低的词汇显示在后。
本发明的热词推荐方法将词汇的初始词汇热度和最近被访问日期存储在存储器中,每天对未被访问的词汇的热度采用消融算法进行计算,随着未被访问时间的增长逐渐降低其初始词汇热度,本发明在计算当前词汇热度时仅利用初始词汇热度进行运算,无需遍历该词所有天的访问记录,能够减少数据库访问量,减少访问记录的存储空间,提高统计速度和系统性能。
本发明还提供了一种热词推荐系统,如图3所示,其包括:人机交互界面1、控制器2和存储器3,其中,人机交互界面1与控制器2连接,控制器2与存储器3连接。
存储器3用于存储词汇存储阵列、热度存储阵列和日期存储阵列,词汇存储阵列中存储的词汇与热度存储阵列中存储的初始词汇热度一一对应,词汇存储阵列中存储的词汇与日期存储阵列中存储的最近被访问日期一一对应。
控制器2用于:通过词汇与词汇热度的对应关系查找与词汇对应的初始词汇热度,每天对当天未被访问的词汇根据热度消融法计算当前词汇热度,当前词汇热度随访问日期间隔天数的增加而减小,将词汇对应的初始词汇热度的数值更新为当前词汇热度数值;当控制器2在接收到通过人机交互界面1输入的词汇访问请求时,通过词汇与词汇热度的对应关系,以及词汇与最近被访问日期的对应关系查找与所述词汇对应的初始词汇热度和最近被访问日期,将词汇对应的初始词汇热度的数值加m(m为正数),将词汇对应的最近被访问日期更新为当前日期,并指令人机交互界面1根据词汇热度高低对词汇进行显示。
具体的过程为:控制器2计算当天未被访问的词汇的间隔日期天数d,根据词汇被访问的间隔日期天数d确定消融系数,其中,消融系数p随访问日期间隔天数d的增长而梯度递减,根据公式H=(1-p)*h计算当前词汇热度H,其中,H为当前词汇热度,p为消融系数,h为初始词汇热度,d为访问日期间隔天数;控制器2将初始词汇热度h的数值更新为当前词汇热度H的数值。
本发明的热词推荐系统将词汇的初始词汇热度和最近被访问日期存储在存储器中,控制器每天对未被访问的词汇的热度采用消融算法进行计算并更新,随着未被访问时间的增长逐渐降低其初始词汇热度,本发明的控制器在计算当前词汇热度时仅利用初始词汇热度进行运算,无需遍历该词所有天的访问记录,能够减少数据库访问量,减少访问记录的存储空间,提高统计速度和系统性能。由于系统实施例与方法实施例的相似内容较多,因此介绍的比较简略,相关内容请参见方法实施例部分。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (10)

1.一种热词推荐方法,其特征在于,包括如下步骤: 
S1,数据存储:在存储器的词汇存储阵列中存储词汇;在存储器的热度存储阵列中存储初始词汇热度,每一个词汇的存储地址与其初始词汇热度的存储地址一一对应;在存储器的日期存储阵列中存储词汇的最近被访问日期,每一个词汇的存储地址与其最近被访问日期的存储地址一一对应; 
S2,数据更新:控制器通过词汇存储地址与初始词汇热度存储地址的对应关系查找所述词汇对应的初始词汇热度,每天对当天未被访问的词汇根据热度消融法计算当前词汇热度,每个当天未被访问的词汇的词汇热度随该词汇的访问日期间隔天数的增加而减小,将所述词汇对应的初始词汇热度的数值更新为当前词汇热度数值; 
当控制器在接收到通过人机交互界面输入的词汇访问请求时,通过词汇存储地址与词汇热度存储地址的对应关系,以及词汇存储地址与最近被访问日期存储地址的对应关系查找所述词汇对应的初始词汇热度和最近被访问日期,将所述词汇对应的初始词汇热度的数值加m,如果最近被访问日期不是当前日期,将所述词汇对应的最近被访问日期更新为当前日期,如果最近被访问日期是当前日期,则不对日期做处理; 
S3,数据显示:所述控制器指令人机交互界面对词汇热度高的前设定个数个词汇进行显示。 
2.如权利要求1所述的热词推荐方法,其特征在于,所述根据热度消融法计算当前词汇热度的方法为: 
S21:计算词汇的间隔日期天数d; 
S22:根据词汇被访问的间隔日期天数d确定消融系数,其中,所述消融系数p随访问日期间隔天数d的增长而梯度递减; 
S23:根据公式H=(1-p)*h计算当前词汇热度H,其中,H为当前词汇热度,p为消融系数,h为初始词汇热度,d为访问日期间隔天数; 
S24:将初始词汇热度h的数值更新为当前词汇热度H的数值。 
3.如权利要求2所述的热词推荐方法,其特征在于,当d≤1时,p为0;当7≥d>1时,p为1/7,当30≥d>7时,p为1/30,当183≥d>30时,p为1/183,当365≥d>183时,p为1/365,当d>365,p为0。 
4.如权利要求1所述的热词推荐方法,其特征在于,所述m为1。 
5.如权利要求1所述的热词推荐方法,其特征在于,所述设定个数为5。 
6.一种热词推荐系统,其特征在于,包括:人机交互界面、控制器和存储器,所述人机交互界面与所述控制器连接,所述控制器与所述存储器连接; 
所述存储器包括存储词汇存储阵列、热度存储阵列和日期存储阵列,在词汇存储阵列中存储词汇,在热度存储阵列中存储初始词汇热度,每一个词汇的存储地址与其初始词汇热度的存储地址一一对应;在日期存储阵列中存储词汇的最近被访问日期,每一个词汇的存储地址与其最近被访问日期的存储地址一一对应; 
所述控制器用于:通过词汇存储地址与初始词汇热度存储地址的对应关系查找所述词汇对应的初始词汇热度,每天对当天未被访问的词汇根据热度消融法计算当前词汇热度,每个当天未被访问的词汇的词汇热度随该词汇的访问日期间隔天数的增加而减小,将所述词汇对应的初始词汇热度的数值更新为当前词汇热度数值;当控制器在接收到通过人机交互界面输入的词汇访问请求时,通过词汇存储地址与词汇热度存储地址的对应关系,以及词汇存储地址与最近 被访问日期存储地址的对应关系查找所述词汇对应的初始词汇热度和最近被访问日期,将所述词汇对应的初始词汇热度的数值加m,如果最近被访问日期不是当前日期,将所述词汇对应的最近被访问日期更新为当前日期,如果最近被访问日期是当前日期,则不对日期做处理;控制器指令人机交互界面对词汇热度高的前设定个数个词汇进行显示。 
7.如权利要求6所述的热词推荐系统,其特征在于,所述控制器计算当天未被访问的词汇的间隔日期天数d,根据词汇被访问的间隔日期天数d确定消融系数,其中,消融系数p随访问日期间隔天数d的增长而梯度递减,根据公式H=(1-p)*h计算当前词汇热度H,其中,H为当前词汇热度,p为消融系数,h为初始词汇热度,d为访问日期间隔天数;控制器将初始词汇热度h的数值更新为当前词汇热度H的数值。 
8.如权利要求7所述的热词推荐系统,其特征在于,当d≤1时,p为0;当7≥d>1时,p为1/7,当30≥d>7时,p为1/30,当183≥d>30时,p为1/183,当365≥d>183时,p为1/365,当d>365,p为0。 
9.如权利要求6所述的热词推荐系统,其特征在于,所述m为1。 
10.如权利要求6所述的热词推荐系统,其特征在于,所述设定个数为5。 
CN201310261220.5A 2013-06-26 2013-06-26 一种热词推荐方法及系统 Active CN104252470B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310261220.5A CN104252470B (zh) 2013-06-26 2013-06-26 一种热词推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310261220.5A CN104252470B (zh) 2013-06-26 2013-06-26 一种热词推荐方法及系统

Publications (2)

Publication Number Publication Date
CN104252470A true CN104252470A (zh) 2014-12-31
CN104252470B CN104252470B (zh) 2018-02-09

Family

ID=52187374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310261220.5A Active CN104252470B (zh) 2013-06-26 2013-06-26 一种热词推荐方法及系统

Country Status (1)

Country Link
CN (1) CN104252470B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572846A (zh) * 2014-12-12 2015-04-29 百度在线网络技术(北京)有限公司 一种热词推荐方法、装置和系统
CN106919693A (zh) * 2017-03-07 2017-07-04 广州优视网络科技有限公司 一种提高热词曝光覆盖率的方法和装置
CN110569441A (zh) * 2019-09-16 2019-12-13 腾讯科技(深圳)有限公司 一种搜索字符串纠错方法及装置
CN110750682A (zh) * 2018-07-06 2020-02-04 武汉斗鱼网络科技有限公司 一种标题热词自动计量方法、存储介质、电子设备及系统
CN117371436A (zh) * 2023-10-09 2024-01-09 北京睿企信息科技有限公司 一种热度递增的热词获取系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101694659A (zh) * 2009-10-20 2010-04-14 浙江大学 基于多主题追踪的个性化网络新闻推送方法
US7734641B2 (en) * 2007-05-25 2010-06-08 Peerset, Inc. Recommendation systems and methods using interest correlation
US20100191742A1 (en) * 2009-01-27 2010-07-29 Palo Alto Research Center Incorporated System And Method For Managing User Attention By Detecting Hot And Cold Topics In Social Indexes
CN102194015A (zh) * 2011-06-30 2011-09-21 重庆新媒农信科技有限公司 检索信息热度统计方法
CN103164804A (zh) * 2011-12-16 2013-06-19 阿里巴巴集团控股有限公司 一种个性化的信息推送方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7734641B2 (en) * 2007-05-25 2010-06-08 Peerset, Inc. Recommendation systems and methods using interest correlation
US20100191742A1 (en) * 2009-01-27 2010-07-29 Palo Alto Research Center Incorporated System And Method For Managing User Attention By Detecting Hot And Cold Topics In Social Indexes
CN101694659A (zh) * 2009-10-20 2010-04-14 浙江大学 基于多主题追踪的个性化网络新闻推送方法
CN102194015A (zh) * 2011-06-30 2011-09-21 重庆新媒农信科技有限公司 检索信息热度统计方法
CN103164804A (zh) * 2011-12-16 2013-06-19 阿里巴巴集团控股有限公司 一种个性化的信息推送方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
席耀一: "论坛话题检测与追踪技术研究", 《中国优秀硕士学位论文全文数据库-信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572846A (zh) * 2014-12-12 2015-04-29 百度在线网络技术(北京)有限公司 一种热词推荐方法、装置和系统
CN104572846B (zh) * 2014-12-12 2018-10-16 百度在线网络技术(北京)有限公司 一种热词推荐方法、装置和系统
CN106919693A (zh) * 2017-03-07 2017-07-04 广州优视网络科技有限公司 一种提高热词曝光覆盖率的方法和装置
CN106919693B (zh) * 2017-03-07 2020-12-01 阿里巴巴(中国)有限公司 一种提高热词曝光覆盖率的方法和装置
CN110750682A (zh) * 2018-07-06 2020-02-04 武汉斗鱼网络科技有限公司 一种标题热词自动计量方法、存储介质、电子设备及系统
CN110569441A (zh) * 2019-09-16 2019-12-13 腾讯科技(深圳)有限公司 一种搜索字符串纠错方法及装置
CN110569441B (zh) * 2019-09-16 2022-05-17 腾讯科技(深圳)有限公司 一种搜索字符串纠错方法及装置
CN117371436A (zh) * 2023-10-09 2024-01-09 北京睿企信息科技有限公司 一种热度递增的热词获取系统
CN117371436B (zh) * 2023-10-09 2024-04-12 北京睿企信息科技有限公司 一种热度递增的热词获取系统

Also Published As

Publication number Publication date
CN104252470B (zh) 2018-02-09

Similar Documents

Publication Publication Date Title
CN104252470A (zh) 一种热词推荐方法及系统
CN102646130B (zh) 一种海量历史数据的存储及索引方法
CN104850572B (zh) HBase非主键索引构建与查询方法及其系统
CN100458779C (zh) 扩展索引的方法
CN103488704B (zh) 一种数据存储方法及装置
US9460308B2 (en) Multi-level privacy evaluation
CN102117338B (zh) 一种数据库缓存的方法
CN104794177B (zh) 一种数据存储方法及装置
CN108255958A (zh) 数据查询方法、装置和存储介质
CN104252461B (zh) 监测感兴趣主题的方法和系统
CN103885887B (zh) 用户数据存储方法、读取方法及系统
CN105740472A (zh) 一种分布式实时全文检索方法及系统
CN102682046A (zh) 社交网络的节点搜索和分析方法及搜索系统
CN102841860A (zh) 一种大数据量信息存储与访问方法
CN104079960A (zh) 文件推荐方法和装置
CN103098056A (zh) 一种排序的方法、装置与终端
CN103559258A (zh) 基于云计算的网页排序方法
CN104112011A (zh) 一种海量数据提取的方法及装置
CN104765754A (zh) 数据存储方法及装置
CN104794237A (zh) 网页信息处理方法及装置
CN106547916A (zh) 一种用户画像标签查询方法及装置
WO2021082936A1 (zh) 一种网页访客数量统计方法及装置
CN105354264A (zh) 一种基于局部敏感哈希的主题标签快速赋予方法
Shuttleworth et al. The fungus, the Code and the mysterious publication date: Why Gnomoniopsis smithogilvyi is still the correct name for the chestnut rot fungus
CN103577493B (zh) 一种社交网络中好友分组的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180731

Address after: 230088 room 405-5, R & D center of China (Hefei) International Intelligent Speech Industrial Park, 3333, hi tech Road, Hefei, Anhui.

Patentee after: Anhui Tai Yue Xiang Sheng Software Co., Ltd.

Address before: 401121 3, 1 floor, office building, south wing of mercury science and technology building, 5 new Mount Huangshan Road, North New District, Chongqing.

Patentee before: Chongqing Xinmei Agricultural Information Technology Co.,Ltd.