CN103995865A - 突发时效性查询词识别方法和系统 - Google Patents

突发时效性查询词识别方法和系统 Download PDF

Info

Publication number
CN103995865A
CN103995865A CN201410211458.1A CN201410211458A CN103995865A CN 103995865 A CN103995865 A CN 103995865A CN 201410211458 A CN201410211458 A CN 201410211458A CN 103995865 A CN103995865 A CN 103995865A
Authority
CN
China
Prior art keywords
query word
time
variation tendency
inquiry amount
ageing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410211458.1A
Other languages
English (en)
Inventor
苏文杰
常富洋
秦吉胜
周鸿祎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201410211458.1A priority Critical patent/CN103995865A/zh
Publication of CN103995865A publication Critical patent/CN103995865A/zh
Priority to PCT/CN2015/079044 priority patent/WO2015176624A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种突发时效性查询词识别方法和系统,方法包括:分别计算查询词在第一段时间内和第二段时间内的查询量变化趋势,第二段时间为第一段时间的一部分;比较查询词在第一段时间和第二段时间内的查询量变化趋势之间的差距,并根据差距的大小判断查询词是否为突发时效性查询词。本发明的技术方案中比较的是查询词在一段时间内查询量的长期变化趋势与短期变化趋势,即使查询词的查询量维持在较小的数量级,查询量的突增情况也可以明显地体现在查询量变化趋势的差距中,有利于识别出突发时效性查询词。

Description

突发时效性查询词识别方法和系统
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种突发时效性查询词识别方法和系统。
背景技术
突发时效性查询词是短时间内用户对其的查询量较之前明显变大的查询词,所以突发时效性查询词往往反映的是一个新的事件的爆发,引发用户对事件的关注,其具有很强的时效性。因此,及时识别出突发时效性查询词,并根据突发时效性查询词来调整搜索引擎中新闻的排名,可以有效提升用户对新闻的搜索体验,改善搜索引擎的质量。
现有的识别突发时效性查询词的方法,是根据查询词在当前时间段的查询量和在前一段时间的查询量比较,差值越大越说明该查询词可能是当前时间段的突发时效性查询词。
上述技术方案的缺点在于,如两段时间内查询词的查询量维持较小的量级,则可能造成查询词的查询量出现了突增但差值却较小的情况,而差值过小则造成无法识别出该突发时效性查询词,例如:
1、一些查询量大的查询词的查询量改变会掩盖突发时效性查询词,比如,查询词A的查询量由10000变为11000,那么差值就为1000,而突发时效性查询词的查询量由100变为200,查询量虽然翻倍但差值仅为100,与查询词A差值相比较小,无法体现出查询量的突增变化,造成难以识别出该突发时效性查询词。
2、一般地,统计查询量的时间段设置的比较小(如按小时设置),由于查询词的查询量受时间影响较大,在凌晨时段的整体查询量较小,在凌晨比较查询量得到的差值也较小,所以难以识别出突发时效性查询词;如为了克服该问题,将时间段设置的比较大(如按天设置),进行不同时间段的查询量比较的时间间隔就比较久,那么突发时效性查询词会更新比较慢。
所以,本发明需要解决的技术问题在于,提供一种新的识别突发时效性查询词的技术方案,保证即使在查询词的查询量始终维持在较小量级的情况下,也能有效地识别出突发时效性查询词。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的突发时效性查询词识别方法和系统。
依据本发明的一个方面,提供了一种突发时效性查询词识别方法,其包括:分别计算查询词在第一段时间内和第二段时间内的查询量变化趋势,所述第二段时间为所述第一段时间的一部分;比较所述查询词在所述第一段时间和所述第二段时间内的查询量变化趋势之间的差距,并根据所述差距的大小判断所述查询词是否为突发时效性查询词。
可选地,前述的突发时效性查询词识别方法,所述分别计算查询词在第一段时间内和第二段时间内的查询量变化趋势的步骤包括:按预设长度的时间段,连续多次统计所述查询词的查询量;取最近的连续m个时间段为所述第一段时间,并根据所述查询词在所述m个时间段内的查询量,确定所述查询词在所述第一段时间内的查询量变化趋势,m为整数;取最近的连续n个时间段为所述第二段时间,并根据所述查询词在所述n个时间段内的查询量,确定所述查询词在所述第二段时间内的查询量变化趋势,n为小于m的整数。
可选地,前述的突发时效性查询词识别方法,所述比较所述查询词在所述第一段时间和所述第二段时间内的查询量变化趋势之间的差距的步骤包括:取反映所述查询词在所述第一段时间内的查询量变化趋势的第一轨迹线,以及反映所述查询词在所述第二段时间内的查询量变化趋势的第二轨迹线,并将所述第一轨迹线以及所述第二轨迹线的夹角作为所述差距。
可选地,前述的突发时效性查询词识别方法,还包括:获取所述查询词对应的多个搜索结果条目,所述多个搜索结果条目中包含新闻信息条目;为所述多个搜索结果条目分别设置权值;在所述查询词为突发时效性查询词时,增大所述新闻信息条目的权值;根据所述多个搜索结果条目的权值大小,在所述查询词对应的搜索结果页上,确定所述多个搜索结果条目的排名位置。
依据本发明的另一方面,提供了一种突发时效性查询词识别系统,其包括:变化趋势计算模块,用于分别计算查询词在第一段时间内和第二段时间内的查询量变化趋势,所述第二段时间为所述第一段时间的一部分;识别模块,用于比较所述查询词在所述第一段时间和所述第二段时间内的查询量变化趋势之间的差距,并根据所述差距的大小判断所述查询词是否为突发时效性查询词。
可选地,前述的突发时效性查询词识别系统,还包括:查询量统计模块,用于按预设长度的时间段,连续多次统计所述查询词的查询量;所述变化趋势计算模块取最近的连续m个时间段为所述第一段时间,并根据所述查询词在所述m个时间段内的查询量,确定所述查询词在所述第一段时间内的查询量变化趋势,m为整数;所述变化趋势计算模块取最近的连续n个时间段为所述第二段时间,并根据所述查询词在所述n个时间段内的查询量,确定所述查询词在所述第二段时间内的查询量变化趋势,n为小于m的整数。
可选地,前述的突发时效性查询词识别系统,所述识别模块取反映所述查询词在所述第一段时间内的查询量变化趋势的第一轨迹线,以及反映所述查询词在所述第二段时间内的查询量变化趋势的第二轨迹线,并将所述第一轨迹线以及所述第二轨迹线的夹角作为所述差距。
可选地,前述的突发时效性查询词识别系统,还包括:搜索结果条目获取模块,用于获取所述查询词对应的多个搜索结果条目,所述多个搜索结果条目中包含新闻信息条目;权值设置模块,用于为所述多个搜索结果条目分别设置权值;权值调整模块,用于在所述查询词为突发时效性查询词时,增大所述新闻信息条目的权值;排名位置确定模块,用于根据所述多个搜索结果条目的权值大小,在所述查询词对应的搜索结果页上,确定所述多个搜索结果条目的排名位置。
根据以上技术方案,本发明的突发时效性查询词识别方法和系统至少有以下优点:
由于第二段时间为第一段时间的一部分,所以本发明的技术方案中比较的是查询词在一段时间内查询量的长期变化趋势与短期变化趋势,如果第一段时间内查询词的查询量变化趋势表现为缓慢增加,而在第二段时间内查询词的查询量变化趋势表现为急速增加,则变化趋势的差距就说明突发地出现大量用户关注该查询词的相关新闻,并在搜索引擎中进行查询,则该查询词必然是突发时效性查询词;查询词的查询量变化趋势与其查询量无关,即使查询词的查询量维持在较小的数量级,查询量的突增情况也可以明显地体现在查询量变化趋势的差距中,有利于识别出突发时效性查询词,而不受到较大查询量的查询词干扰,不受到整体查询量较小的时间段影响。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明的一个实施例的突发时效性查询词识别方法的流程图;
图2示出了根据本发明的一个实施例的突发时效性查询词识别方法的流程图;
图3示出了根据本发明的一个实施例的突发时效性查询词识别方法的流程图;
图4示出了根据本发明的一个实施例的突发时效性查询词识别系统的框图;
图5示出了根据本发明的一个实施例的突发时效性查询词识别系统的框图;
图6示出了根据本发明的一个实施例的突发时效性查询词识别方法的框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本发明的一个实施例中提供了一种突发时效性查询词识别方法,其包括:
步骤110,分别计算查询词在第一段时间内和第二段时间内的查询量变化趋势,第二段时间为第一段时间的一部分。在本实施例的技术方案中,对查询量变化趋势的表现形式不做限制,例如,可以取多个时间点,记录截止到每个时间点的总查询量,则多个时间点对应的总查询量可提现查询量变化趋势。
步骤120,比较查询词在第一段时间和第二段时间内的查询量变化趋势之间的差距,并根据差距的大小判断查询词是否为突发时效性查询词。在本实施例的技术方案中,对查询量变化趋势的差距大小的比较形式不做限制,例如,可以分别计算第一段时间内查询词的查询量在单位时间的内变化量,以及第二段时间内查询词的查询量在单位时间的内变化量,并进行比较。
在本实施例的技术方案中,由于第二段时间为第一段时间的一部分,所以本发明的技术方案中比较的是查询词在一段时间内查询量的长期变化趋势与短期变化趋势,如果第一段时间内查询词的查询量变化趋势表现为缓慢增加,而在第二段时间内查询词的查询量变化趋势表现为急速增加,则变化趋势的差距就说明突发地出现大量用户关注该查询词的相关新闻,并在搜索引擎中进行查询,则该查询词必然是突发时效性查询词。查询词的查询量变化趋势与其查询量无关,即使查询词的查询量维持在较小的数量级,查询量的突增情况也可以明显地体现在查询量变化趋势的差距中,有利于识别出突发时效性查询词,而不受到较大查询量的查询词干扰,不受到整体查询量较小的时间段影响。
如图2所示,本发明的另一实施例中还提供了一种突发时效性查询词识别方法,相比于上述实施例,本实施例的突发时效性查询词识别方法,步骤110包括:
步骤111,按预设长度的时间段,连续多次统计查询词的查询量。本实施例中对时间段的大小不做限制,为了及时识别出突发时效性查询词,可以将时间段设置的较小,如按小时。
步骤112,取最近的连续m个时间段为第一段时间,并根据查询词在m个时间段内的查询量,确定查询词在第一段时间内的查询量变化趋势,m为整数。
步骤113,取最近的连续n个时间段为第二段时间,并根据查询词在n个时间段内的查询量,确定查询词在第二段时间内的查询量变化趋势,n为小于m的整数。
本实施例中对n和m的具体大小不做限制,为了突出第一段时间为长期,第二段时间为短期,m的值可以远大于n,例如时间段为1小时的话,则m可以取48,n可以取5,即第一段时间为48小时,第二段时间为5小时。
在本实施例的技术方案中,不需针对两段时间内分别统计查询量再计算查询量变化趋势,而只需按时间段连续地统计一次查询量即可,只要分别对应两端时间的多个时间段分别计算查询量变化趋势即可。
本发明的另一实施例中还提供了一种突发时效性查询词识别方法,相比于上述实施例,本实施例的突发时效性查询词识别方法,步骤120包括:
取反映查询词在第一段时间内的查询量变化趋势的第一轨迹线,以及反映查询词在第二段时间内的查询量变化趋势的第二轨迹线,并将第一轨迹线以及第二轨迹线的夹角作为差距。在本实施例中,对于轨迹线的类型不做限制,以横坐标为时间段、纵坐标为查询量,多个时间段的查询量反映为多个点,则例如轨迹线可以是连接多个时间上的查询量的折线,也可以是通过最小二乘法拟合的平滑曲线。
在本实施例的技术方案中,轨迹线可以直观准确地体现查询量变化趋势,而轨迹线夹角大小可以直观准确地体现查询量变化趋势的差距,则本实施例的技术方案查询量变化趋势的差距进行量化,量化的结果有利于准确识别查询词是否为突发时效性查询词。
如图3所示,本发明的另一实施例中还提供了一种突发时效性查询词识别方法,相比于上述实施例,本实施例的突发时效性查询词识别方法,还包括:
步骤130,获取查询词对应的多个搜索结果条目,多个搜索结果条目中包含新闻信息条目。
步骤140,为多个搜索结果条目分别设置权值。
步骤150,在查询词为突发时效性查询词时,增大新闻信息条目的权值。
步骤160,根据多个搜索结果条目的权值大小,在查询词对应的搜索结果页上,确定多个搜索结果条目的排名位置。一般地,权值越大的搜索结果条目,排名位置越高。
在本实施例的技术方案中,对于突发时效性查询词来说,提高了其相关新闻条目的排名位置,有利于用户及时发现其关注的突发性事件,提升了用户体验。
如图4所示,本发明的一个实施例提供了一种突发时效性查询词识别系统,其包括:
变化趋势计算模块410,用于分别计算查询词在第一段时间内和第二段时间内的查询量变化趋势,第二段时间为第一段时间的一部分。在本实施例的技术方案中,对查询量变化趋势的表现形式不做限制,例如,可以取多个时间点,记录截止到每个时间点的总查询量,则多个时间点对应的总查询量可提现查询量变化趋势。
识别模块420,用于比较查询词在第一段时间和第二段时间内的查询量变化趋势之间的差距,并根据差距的大小判断查询词是否为突发时效性查询词。在本实施例的技术方案中,对查询量变化趋势的差距大小的比较形式不做限制,例如,可以分别计算第一段时间内查询词的查询量在单位时间的内变化量,以及第二段时间内查询词的查询量在单位时间的内变化量,并进行比较。
在本实施例的技术方案中,由于第二段时间为第一段时间的一部分,所以本发明的技术方案中比较的是查询词在一段时间内查询量的长期变化趋势与短期变化趋势,如果第一段时间内查询词的查询量变化趋势表现为缓慢增加,而在第二段时间内查询词的查询量变化趋势表现为急速增加,则变化趋势的差距就说明突发地出现大量用户关注该查询词的相关新闻,并在搜索引擎中进行查询,则该查询词必然是突发时效性查询词。查询词的查询量变化趋势与其查询量无关,即使查询词的查询量维持在较小的数量级,查询量的突增情况也可以明显地体现在查询量变化趋势的差距中,有利于识别出突发时效性查询词,而不受到较大查询量的查询词干扰,不受到整体查询量较小的时间段影响。
如图5所示,本发明的另一实施例中还提供了一种突发时效性查询词识别系统,相比于上述实施例,本实施例的突发时效性查询词识别系统,还包括:
查询量统计模块430,用于按预设长度的时间段,连续多次统计查询词的查询量。本实施例中对时间段的大小不做限制,为了及时识别出突发时效性查询词,可以将时间段设置的较小,如按小时。
变化趋势计算模块410取最近的连续m个时间段为第一段时间,并根据查询词在m个时间段内的查询量,确定查询词在第一段时间内的查询量变化趋势,m为整数。
变化趋势计算模块410取最近的连续n个时间段为第二段时间,并根据查询词在n个时间段内的查询量,确定查询词在第二段时间内的查询量变化趋势,n为小于m的整数。
本实施例中对n和m的具体大小不做限制,为了突出第一段时间为长期,第二段时间为短期,m的值可以远大于n,例如时间段为1小时的话,则m可以取48,n可以取5,即第一段时间为48小时,第二段时间为5小时。
在本实施例的技术方案中,不需针对两段时间内分别统计查询量再计算查询量变化趋势,而只需按时间段连续地统计一次查询量即可,只要分别对应两端时间的多个时间段分别计算查询量变化趋势即可。
本发明的另一实施例中还提供了一种突发时效性查询词识别系统,相比于上述实施例,本实施例的突发时效性查询词识别系统,识别模块420取反映查询词在第一段时间内的查询量变化趋势的第一轨迹线,以及反映查询词在第二段时间内的查询量变化趋势的第二轨迹线,并将第一轨迹线以及第二轨迹线的夹角作为差距。在本实施例中,对于轨迹线的类型不做限制,以横坐标为时间段、纵坐标为查询量,多个时间段的查询量反映为多个点,则例如轨迹线可以是连接多个时间上的查询量的折线,也可以是通过最小二乘法拟合的平滑曲线。
在本实施例的技术方案中,轨迹线可以直观准确地体现查询量变化趋势,而轨迹线夹角大小可以直观准确地体现查询量变化趋势的差距,则本实施例的技术方案查询量变化趋势的差距进行量化,量化的结果有利于准确识别查询词是否为突发时效性查询词。
如图6所示,本发明的另一实施例中还提供了一种突发时效性查询词识别系统,相比于上述实施例,本实施例的突发时效性查询词识别系统,还包括:
搜索结果条目获取模块440,用于获取查询词对应的多个搜索结果条目,多个搜索结果条目中包含新闻信息条目。
权值设置模块450,用于为多个搜索结果条目分别设置权值。
权值调整模块460,用于在查询词为突发时效性查询词时,增大新闻信息条目的权值。
排名位置确定模块470,用于根据多个搜索结果条目的权值大小,在查询词对应的搜索结果页上,确定多个搜索结果条目的排名位置。一般地,权值越大的搜索结果条目,排名位置越高。
在本实施例的技术方案中,对于突发时效性查询词来说,提高了其相关新闻条目的排名位置,有利于用户及时发现其关注的突发性事件,提升了用户体验。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的突发时效性查询词识别系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (8)

1.一种突发时效性查询词识别方法,其包括:
分别计算查询词在第一段时间内和第二段时间内的查询量变化趋势,所述第二段时间为所述第一段时间的一部分;
比较所述查询词在所述第一段时间和所述第二段时间内的查询量变化趋势之间的差距,并根据所述差距的大小判断所述查询词是否为突发时效性查询词。
2.根据权利要求1所述的突发时效性查询词识别方法,其中,所述分别计算查询词在第一段时间内和第二段时间内的查询量变化趋势的步骤包括:
按预设长度的时间段,连续多次统计所述查询词的查询量;
取最近的连续m个时间段为所述第一段时间,并根据所述查询词在所述m个时间段内的查询量,确定所述查询词在所述第一段时间内的查询量变化趋势,m为整数;
取最近的连续n个时间段为所述第二段时间,并根据所述查询词在所述n个时间段内的查询量,确定所述查询词在所述第二段时间内的查询量变化趋势,n为小于m的整数。
3.根据权利要求1所述的突发时效性查询词识别方法,其中,所述比较所述查询词在所述第一段时间和所述第二段时间内的查询量变化趋势之间的差距的步骤包括:
取反映所述查询词在所述第一段时间内的查询量变化趋势的第一轨迹线,以及反映所述查询词在所述第二段时间内的查询量变化趋势的第二轨迹线,并将所述第一轨迹线以及所述第二轨迹线的夹角作为所述差距。
4.根据权利要求1至3中任一项所述的突发时效性查询词识别方法,其中,还包括:
获取所述查询词对应的多个搜索结果条目,所述多个搜索结果条目中包含新闻信息条目;
为所述多个搜索结果条目分别设置权值;
在所述查询词为突发时效性查询词时,增大所述新闻信息条目的权值;
根据所述多个搜索结果条目的权值大小,在所述查询词对应的搜索结果页上,确定所述多个搜索结果条目的排名位置。
5.一种突发时效性查询词识别系统,其包括:
变化趋势计算模块,用于分别计算查询词在第一段时间内和第二段时间内的查询量变化趋势,所述第二段时间为所述第一段时间的一部分;
识别模块,用于比较所述查询词在所述第一段时间和所述第二段时间内的查询量变化趋势之间的差距,并根据所述差距的大小判断所述查询词是否为突发时效性查询词。
6.根据权利要求5所述的突发时效性查询词识别系统,其中,还包括:
查询量统计模块,用于按预设长度的时间段,连续多次统计所述查询词的查询量;
所述变化趋势计算模块取最近的连续m个时间段为所述第一段时间,并根据所述查询词在所述m个时间段内的查询量,确定所述查询词在所述第一段时间内的查询量变化趋势,m为整数;
所述变化趋势计算模块取最近的连续n个时间段为所述第二段时间,并根据所述查询词在所述n个时间段内的查询量,确定所述查询词在所述第二段时间内的查询量变化趋势,n为小于m的整数。
7.根据权利要求5所述的突发时效性查询词识别系统,其中,所述识别模块取反映所述查询词在所述第一段时间内的查询量变化趋势的第一轨迹线,以及反映所述查询词在所述第二段时间内的查询量变化趋势的第二轨迹线,并将所述第一轨迹线以及所述第二轨迹线的夹角作为所述差距。
8.根据权利要求1至3中任一项所述的突发时效性查询词识别系统,其中,还包括:
搜索结果条目获取模块,用于获取所述查询词对应的多个搜索结果条目,所述多个搜索结果条目中包含新闻信息条目;
权值设置模块,用于为所述多个搜索结果条目分别设置权值;
权值调整模块,用于在所述查询词为突发时效性查询词时,增大所述新闻信息条目的权值;
排名位置确定模块,用于根据所述多个搜索结果条目的权值大小,在所述查询词对应的搜索结果页上,确定所述多个搜索结果条目的排名位置。
CN201410211458.1A 2014-05-19 2014-05-19 突发时效性查询词识别方法和系统 Pending CN103995865A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410211458.1A CN103995865A (zh) 2014-05-19 2014-05-19 突发时效性查询词识别方法和系统
PCT/CN2015/079044 WO2015176624A1 (zh) 2014-05-19 2015-05-15 突发时效性查询词识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410211458.1A CN103995865A (zh) 2014-05-19 2014-05-19 突发时效性查询词识别方法和系统

Publications (1)

Publication Number Publication Date
CN103995865A true CN103995865A (zh) 2014-08-20

Family

ID=51310030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410211458.1A Pending CN103995865A (zh) 2014-05-19 2014-05-19 突发时效性查询词识别方法和系统

Country Status (1)

Country Link
CN (1) CN103995865A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015176624A1 (zh) * 2014-05-19 2015-11-26 北京奇虎科技有限公司 突发时效性查询词识别方法和系统
CN105512199A (zh) * 2015-11-27 2016-04-20 广州神马移动信息科技有限公司 搜索方法、搜索装置以及搜索服务器
CN116894118A (zh) * 2023-09-08 2023-10-17 腾讯科技(深圳)有限公司 数据搜索方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060136451A1 (en) * 2004-12-22 2006-06-22 Mikhail Denissov Methods and systems for applying attention strength, activation scores and co-occurrence statistics in information management
CN101604340A (zh) * 2009-07-20 2009-12-16 腾讯科技(深圳)有限公司 一种获得查询的时新性的方法
CN103198072A (zh) * 2012-01-06 2013-07-10 腾讯科技(深圳)有限公司 一种流行检索词的挖掘、推荐方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060136451A1 (en) * 2004-12-22 2006-06-22 Mikhail Denissov Methods and systems for applying attention strength, activation scores and co-occurrence statistics in information management
CN101604340A (zh) * 2009-07-20 2009-12-16 腾讯科技(深圳)有限公司 一种获得查询的时新性的方法
CN103198072A (zh) * 2012-01-06 2013-07-10 腾讯科技(深圳)有限公司 一种流行检索词的挖掘、推荐方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015176624A1 (zh) * 2014-05-19 2015-11-26 北京奇虎科技有限公司 突发时效性查询词识别方法和系统
CN105512199A (zh) * 2015-11-27 2016-04-20 广州神马移动信息科技有限公司 搜索方法、搜索装置以及搜索服务器
CN116894118A (zh) * 2023-09-08 2023-10-17 腾讯科技(深圳)有限公司 数据搜索方法、装置、设备及存储介质
CN116894118B (zh) * 2023-09-08 2023-12-22 腾讯科技(深圳)有限公司 数据搜索方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US10067920B2 (en) Identifying changes for online documents
CN104065565B (zh) 推送消息的方法、服务器、客户端装置和系统
US9135303B2 (en) Using pre-search triggers
US11151212B2 (en) Information analysis method, electronic device, and storage medium
US20160055242A1 (en) Systems and methods for analyzing content from digital content sources
WO2013121181A1 (en) Method of machine learning classes of search queries
CN104238897A (zh) 一种菜单项显示方法及装置
WO2015017276A2 (en) Method and system for providing recommended terms
CN104021163A (zh) 产品推荐系统及方法
CN101140587A (zh) 一种搜索方法及装置
CN102890689A (zh) 一种用户兴趣模型的建立方法及系统
US20140129545A1 (en) Sorting search results
CN103995865A (zh) 突发时效性查询词识别方法和系统
CN102955829A (zh) 用于对资源项进行排序的方法、装置和设备
CN102982136A (zh) 浏览器地址栏中显示推荐网址信息的方法和浏览器
US20160253503A1 (en) Visualization of security risks
CN102982177A (zh) 一种浏览器中进行搜索的方法和装置
CN106503010B (zh) 一种数据库更改写入分区的方法及装置
CN104199989A (zh) 在搜索结果页中显示各搜索结果项置顶数的方法及客户端
CN103595758A (zh) 推荐软件的方法及装置
US10521461B2 (en) System and method for augmenting a search query
CN103530392A (zh) 确定抓取流量的方法及设备
CN107807993B (zh) 一种网页历史记录功能的实现方法及装置
CN106776601B (zh) 搜索条件的配置方法及装置
CN103838877A (zh) 基于搜索的时效性信息网页结果的推送方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140820

RJ01 Rejection of invention patent application after publication