CN103226550B - 一种基于查询输入的热点事件确定方法和系统 - Google Patents

一种基于查询输入的热点事件确定方法和系统 Download PDF

Info

Publication number
CN103226550B
CN103226550B CN201210021488.7A CN201210021488A CN103226550B CN 103226550 B CN103226550 B CN 103226550B CN 201210021488 A CN201210021488 A CN 201210021488A CN 103226550 B CN103226550 B CN 103226550B
Authority
CN
China
Prior art keywords
inquiry
input
focus incident
inquiry input
time window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210021488.7A
Other languages
English (en)
Other versions
CN103226550A (zh
Inventor
高小平
宋国龙
练振杰
李超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shiji Guangsu Information Technology Co Ltd
Original Assignee
Shenzhen Shiji Guangsu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shiji Guangsu Information Technology Co Ltd filed Critical Shenzhen Shiji Guangsu Information Technology Co Ltd
Priority to CN201210021488.7A priority Critical patent/CN103226550B/zh
Publication of CN103226550A publication Critical patent/CN103226550A/zh
Application granted granted Critical
Publication of CN103226550B publication Critical patent/CN103226550B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施方式提出了一种基于查询输入的热点事件确定方法和系统。该方法包括:确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数;基于每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数,确定每个查询输入在该预定时间窗口内的时新度;选择时新度符合预定条件的查询输入作为热点事件。应用本发明实施方式之后,能够自动从各种查询日志中基于时新度确定出热点事件。而且,本发明实施方式还能够给出热点事件对应的时新度值,方便人工参考和过滤,而且能够有效去除热点事件中的周期性事件或话题,保证了热点事件的时新性和准确性。

Description

一种基于查询输入的热点事件确定方法和系统
技术领域
本发明实施方式涉及互联网应用技术领域,更具体地,涉及一种基于查询输入的热点事件确定方法和系统。
背景技术
随着计算机技术和网络技术的飞速发展,互联网(Internet)在人们的日常生活、学习和工作中发挥的作用也越来越大。人们越来越习惯通过互联网来获取包括热点事件在内的许多资讯信息。目前人们一般通过新闻网站、搜索引擎、微博等多种方式来获取各种最新的热点事件。
搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎是用户在互联网上寻找感兴趣内容的主要渠道之一。对于新闻事件或者最新的热门话题,用户会在很短时间以内通过查询输入(QUERY)向搜索引擎发出查询输入,从而检索到最新的新闻信息。因此在新闻事件发生后的很短时间内,搜索引擎会接收到大量用户关于某一事件或话题的大量查询输入。比如:苹果公司最新产品发布会开始以后,搜索引擎的日志中会大量出现关于某款产品的查询输入(如:“iphone”、“ipad”等)。
然而,目前新闻网站、搜索引擎和微博等诸多资讯提供平台都是在获取到相应事件后,预先由编辑人员确定出热点事件,再向用户派发热点事件消息。首先,这种派发方式所派发出的热点事件并不一定是用户真正关注的内容,而且这种主动派发方式并不能保证热点事件信息的即时性。再有,这种主动派发方式需要由编辑人员进行处理后才能派发,而无法自动生成热点事件,这样无论是成本还是用户体验上都会产生不利影响。
发明内容
本发明实施方式提出一种基于查询输入的热点事件确定方法,以提高热点事件的即时性。
本发明实施方式提出一种基于查询输入的热点事件确定系统,以以提高热点事件的即时性。
本发明实施方式的具体方案如下:
一种基于查询输入的热点事件确定方法,该方法包括:
确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数;
基于所述每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数,确定每个查询输入在该预定时间窗口内的时新度;
选择时新度符合预定条件的查询输入作为热点事件。
一种基于查询输入的热点事件确定系统,该系统包括:
查询次数确定单元,用于确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数;
时新度确定单元,用于基于所述每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数,确定每个查询输入在该预定时间窗口内的时新度;
热点事件选择单元,用于选择时新度符合预定条件的查询输入作为热点事件。
从上述技术方案可以看出,在本发明实施方式中,首先确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数;然后基于每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数,确定每个查询输入在该预定时间窗口内的时新度;再选择时新度符合预定条件的查询输入作为热点事件。由此可见,应用本发明实施方式之后,通过结合一定时间窗口中的查询次数统计趋势,能够自动从各种查询日志中基于时新度确定出热点事件,从而保证了热点事件的即时性。
附图说明
图1为根据本发明实施方式的基于查询输入的热点事件确定方法流程图;
图2为根据本发明实施方式的历史日志划分示意图;
图3为根据本发明实施方式的基于查询输入的热点事件确定系统结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
在本发明实施方式中,从搜索引擎、微博系统等多种网络平台的用户查询中自动发现热点事件。
同时,优选能够给出其对应的时新度值,并能够有效去除其中的周期性话题。
图1为根据本发明实施方式的基于查询输入的热点事件确定方法流程图。
如图1所示,该方法包括:
步骤101:确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数。
在这里,预定的时间窗口一般是若干天,而单位时间粒度的优选单位为1天。针对每个查询输入,都统计出该查询输入在预定时间窗口中的每个单位时间粒度内的查询次数。比如,假设预定的时间窗口为3天,而单位时间粒度为1天,则统计出每个查询输入在最近3天之内的每一天中的查询次数。
在具体实施中,可以从搜索引擎、微博、新闻网站等诸多类型平台的查询日志中来获取查询次数。
以上虽然罗列出单位时间粒度、时间窗口的具体数值和/或数值单位,本领域技术人员可以意识到,这仅起到阐述作用,而并不用于限定本发明实施方式的保护范围。
步骤102:基于每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数,确定每个查询输入在该预定时间窗口内的时新度。
首先,新闻是事实的报道,而事实作为某些事物的稳定态出现,总是相对的、暂时的、瞬息的,而且即便是这种“稳定态”,实际上也在不停地运动和变化.新闻所报道的,实际上是事物的某种变动,是变动的事实。事实作为事物稳定态出现及其所具有的变动不居、瞬息万变的特性,便是事实的瞬息性,因此时新度是一项非常关键的指标。
基于每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数,可以了解到在每一个单位时间粒度内的查询次数,从而根据该查询次数在该预定时间窗口中的相对升降情况,可以确定每个查询输入在该预定时间窗口内的时新度。
步骤103:选择时新度符合预定条件的查询输入作为热点事件。
在这里,计算出各个查询输入的时新度后,可以选择符合预定条件的查询输入作为热点事件。比如:选择时新度高于预先设置的时新度阈值的查询输入作为热点事件;或按照时新度从大到小的顺序选择预定数目的查询输入作为热点事件。
选择出热点事件之后,可以主动向用户推出热点事件榜单,或者基于用户的请求向用户推出热点事件榜单。此时,该热点事件榜单完全基于用户的查询输入(比如:对应于用户的查询输入的特定事件),而且该热点事件榜单综合考虑了时新度,因此符合用户的需求,并且保证了即时性。
优选地,在该方法中进一步包括设置查询输入次数阈值的步骤。在确定每个查询输入在该预定时间窗口内的时新度之前,该方法进一步包括:过滤去查询输入次数低于查询输入次数阈值的查询输入,从而去除一些可能具有一定时新度但是关注热点却不够的查询输入。
在一个实施方式中,在确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数之前,进一步对每个查询输入执行归一化处理。
更具体地,由于用户对同一事件的描述可能各不相同,因此输入的查询可能不同。例如用户输入的“ipad发布”与“ipad發布”实际内容并无区别,仅是简繁体的差别;“ipad发布”与“ipad发布”实际内容并无区别,仅仅是前者多了空格,而这些描述的事件均为“ipad发布”。
因此,可以通过归一化处理来将所有的用户查询归一化,将同一事件的查询用统一的方式描述。归一化处理具体可以包括:
(1)将所有查询输入统一转换为相同的字符集。比如:利用简繁转换对应词表,将所有用户查询统一转换为简体或繁体。
(2)将所有查询输入中具有数字意义的符号之外的所有其它标点符号替换成空格。比如:将用户查询中的所有中英文标点符号替换成空格,而小数点或时间间隔符等有数字意义的符号除外。
(3)将所有查询输入之间的空格去除。比如:不改变语义的情况下,将中英文之间,中文与数字之间的空格去除;将多个连续的空格去除。
根据归一化后的用户查询,可以统计一段时间粒度以内不同查询的各自查询次数,并可以得出该段时间内查询与次数列表。
优选地,查询的统计有两种方式:
1.将同一用户在同一时间窗口(即时间段内)的多次查询记为一次,此时统计的是该时间段内某查询对应用户数,这种方式可以避免某一用户恶意大量查询造成的失真,此处记为查询的PV。
2.将同一用户在同一时间窗口(即时间段内)的多次查询记多次,也即每次查询都记录,这种情况更接近实际,此处记为查询的QV。
比如:时间粒度以天为例,可以统计出列表如下:
表1
查询 次数(PV或QV)
ipad发布 1500
美国总统竞选 1000
...... ......
统计时间粒度以天为例,统计一定时间窗口(若干天,设为T)内所有查询的QV或PV信息,可以得到如下列表:
表2
图2为根据本发明实施方式的历史日志划分示意图。
如图2所示,该预定时间窗口分为T-n部分和n部分,其中T为该预定时间窗口的长度,n为从当前时间算起的时间粒度数。
假设某个查询输入(query)在前T-n天的总共查询次数是pT-n,在近n天的总共查询次数是pn,其中i为序号。即:
当pT-n>=pn时,定义时新度为0;
当pT-n<pn时,定义该查询输入在用户日志中的时新度fn是:
(式1)
由式1可见,当pn与pT-n的差异越大,fn值就越大。这也符合时新性定义的要求,最新的查询次数量与历史的差异越大,时新度越高。
优选地,为fn定义一个时间衰减系数rn,它随着n的增大而指数衰减:rn=αn,其中0<α<1。
因此对于每个查询输入,其时新度可以表示为
(式2)
在实际使用中,为了简化计算,通常将n少数几个离散的值,例如:当时间窗口T=90时,只取f5和f20,对应的系数选取 其他的项忽略。
因此简化的时新度f为:
此时,根据上述简化公式,计算表2中查询输入(“ipad发布”和“美国总统竞选”)的时新度。
对于“ipad发布”,其时新度为:
对于“美国总统竞选”,因为查询的近3天没有PV,则p8←3<p3,同理p8←1<p1,因此其时新性为零,也即没有时新性。
由此可以计算每一个候选查询的时新性f,而f越大表明此查询的时新度更高,因此可以参考总体查询结合的时新性f取值的范围,选取时新性f最高的一部分查询生成查询热榜的榜单。
比如,“ipad发布”相对“美国总统竞选”而言,更具有时新性。因此可以将“ipad发布”作为热点事件,并通过搜索引擎、微博、新闻网站等多种方式主动推送给用户。
另外,对于有一些查询输入,可能具有周期性大量爆发的特征。例如“周末去哪里”会在周末之前大量被查询;“换季穿什么”会在每次换季时大量出现。由于统计的总天数的限制,一些周期性出现的查询在统计的时间范围内不会出现周期性的特征。例如以60天的统计范围,可能不会发现“换季穿什么”有周期性,因此可能将此类查询作为热点事件的候选输出。
当不需要周期性查询作为热点事件或者热门话题时,可以利用此类查询的周期性,将其从候选中去除。在一个实施方式中,首先保存之前已经计算过时新度的查询输入;然后在选择时新度符合预定条件的查询输入作为热点事件之前,进一步过滤去已被保存的查询输入,从而从候选中去除周期性查询输入。
更具体地,对于周期性查询,首先保存过去每天查询量超过一定阈值的查询及其对应的查询次数,保存的事件跨度应当超过周期性查询的最小周期,例如对于“周”或“月”为周期的事件保存一年。将这些查询放在历史数据库中。然后将本次计算出的时新性查询与历史数据库中的查询进行比较,如果时新性查询在历史数据库中出现过,将其从候选列表中过滤。
过滤历史数据库中的查询的依据是该查询不具有时新性,因为在历史上大量出现过。而周期性事件的查询在较大的时间范围内(超过其周期数倍),曾经大量出现过,因此周期性查询可以通过此方法过滤。
基于上述详细分析,本发明实施方式还提出一种基于查询输入的热点事件确定系统。
图3为根据本发明实施方式的基于查询输入的热点事件确定系统结构图。
如图3所示,该系统包括查询次数确定单元301、时新度确定单元302和热点事件选择单元303。
其中:查询次数确定单元301,用于确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数;
时新度确定单元302,用于基于所述每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数,确定每个查询输入在该预定时间窗口内的时新度;
热点事件选择单元303,用于选择时新度符合预定条件的查询输入作为热点事件。
优选地,该系统进一步包括归一化处理单元304。归一化处理单元304,用于在确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数之前,对每个查询输入执行归一化处理。而且,对每个查询输入执行归一化处理可以包括执行下列处理中的任一项或者多与两项的任意组合:将所有查询输入统一转换为相同的字符集;将所有查询输入中具有数字意义的符号之外的所有其它标点符号替换成空格;将所有查询输入之间的空格去除,等等。
优选地,该系统进一步包括查询输入过滤单元305。查询输入过滤单元305,用于设置查询输入次数阈值,并且在所述确定每个查询输入在该预定时间窗口内的时新度之前,过滤去查询输入次数低于所述查询输入次数阈值的查询输入。
在一个实施方式中,时新度确定单元302,用于确定每个查询输入在该预定时间窗口内的时新度包括:将该预定时间窗口分为T-n部分和n部分,其中T为该预定时间窗口的长度,n为从当前时间算起的时间粒度数;计算所述T-n部分内的所有查询输入次数pT-n以及所述n部分内的所有查询输入次数pn;其中:
i为序号,PVi为第i个时间粒度内的查询输入次数;
针对每个查询输入,计算在该预定时间窗口内的时新度f,其中:
pT-n>=pn时,f为0;
而当pT-n小于pn时,
其中rn=αn
rn为衰减系数;0<α<1。
综上所述,在本发明实施方式中,首先确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数;然后基于每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数,确定每个查询输入在该预定时间窗口内的时新度;再选择时新度符合预定条件的查询输入作为热点事件。由此可见,应用本发明实施方式之后,通过结合时间窗口中的查询次数统计趋势,能够自动从各种查询日志中基于时新度确定出热点事件,从而保证了热点事件的即时性。
而且,本发明实施方式还能够给出热点事件对应的时新度值,方便人工参考和过滤。
还有,本发明实施方式通过过滤机制,能够有效去除热点事件中的周期性事件或话题,从而保证了热点事件的时新性和准确性。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种基于查询输入的热点事件确定方法,其特征在于,该方法包括:
确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数,所述预定时间窗口包括T-n部分和n部分,T为该预定时间窗口的长度,n为从当前时间算起的时间粒度数;
基于所述每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数,确定每个查询输入在该预定时间窗口内的时新度,其中,所述每个查询输入在所述n部分的查询次数与在所述T-n部分的查询次数之间的差异越大,所述时新度越高;
选择时新度符合预定条件的查询输入作为热点事件。
2.根据权利要求1所述的基于查询输入的热点事件确定方法,其特征在于,在所述确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数之前,该方法进一步包括:对每个查询输入执行归一化处理。
3.根据权利要求2所述的基于查询输入的热点事件确定方法,其特征在于,所述对每个查询输入执行归一化处理包括执行下列处理中的至少一项:
将所有查询输入统一转换为相同的字符集;
将所有查询输入中具有数字意义的符号之外的所有其它标点符号替换成空格;
将所有查询输入之间的空格去除。
4.根据权利要求1所述的基于查询输入的热点事件确定方法,其特征在于,该方法进一步包括设置查询输入次数阈值的步骤;在确定每个查询输入在该预定时间窗口内的时新度之前,该方法进一步包括:
过滤掉查询输入次数低于所述查询输入次数阈值的查询输入。
5.根据权利要求1所述的基于查询输入的热点事件确定方法,其特征在于,所述确定每个查询输入在该预定时间窗口内的时新度包括:
计算所述T-n部分内的所有查询输入次数pT-n以及所述n部分内的所有查询输入次数pn;其中:
i为序号,PVi为第i个时间粒度内的查询输入次数;
针对每个查询输入,计算在该预定时间窗口内的时新度f,其中:
当pT-n>=pn时,f为0;
而当pT-n小于pn时,其中rn=αn
rn为衰减系数;0<α<1。
6.根据权利要求1所述的基于查询输入的热点事件确定方法,其特征在于,所述选择时新度符合预定条件的查询输入作为热点事件包括:
选择时新度高于预先设置的时新度阈值的查询输入作为热点事件,或按照时新度从大到小的顺序选择预定数目的查询输入作为热点事件。
7.根据权利要求1所述的基于查询输入的热点事件确定方法,其特征在于,该方法进一步包括:保存已经计算过时新度的查询输入;
在所述选择时新度符合预定条件的查询输入作为热点事件之前,该方法进一步包括:
过滤掉所述已被保存的查询输入。
8.一种基于查询输入的热点事件确定系统,其特征在于,该系统包括:
查询次数确定单元,用于确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数,所述预定时间窗口包括T-n部分和n部分,T为该预定时间窗口的长度,n为从当前时间算起的时间粒度数;
时新度确定单元,用于基于所述每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数,确定每个查询输入在该预定时间窗口内的时新度,其中,所述每个查询输入在所述n部分的查询次数与在所述T-n部分的查询次数之间的差异越大,所述时新度越高;
热点事件选择单元,用于选择时新度符合预定条件的查询输入作为热点事件。
9.根据权利要求8所述的基于查询输入的热点事件确定系统,其特征在于,该系统进一步包括归一化处理单元;
所述归一化处理单元,用于在确定每个查询输入在预定时间窗口中的每个单位时间粒度内的查询次数之前,对每个查询输入执行归一化处理。
10.根据权利要求8所述的基于查询输入的热点事件确定系统,其特征在于,该系统进一步包括查询输入过滤单元;
所述查询输入过滤单元,用于设置查询输入次数阈值,并且在所述确定每个查询输入在该预定时间窗口内的时新度之前,过滤去查询输入次数低于所述查询输入次数阈值的查询输入。
11.根据权利要求8所述的基于查询输入的热点事件确定系统,其特征在于,
所述时新度确定单元,具体用于:
计算所述T-n部分内的所有查询输入次数pT-n以及所述n部分内的所有查询输入次数pn;其中:
i为序号,PVi为第i个时间粒度内的查询输入次数;
针对每个查询输入,计算在该预定时间窗口内的时新度f,其中:
pT-n>=pn时,f为0;
而当pT-n小于pn时,其中rn=αn
rn为衰减系数;0<α<1。
CN201210021488.7A 2012-01-31 2012-01-31 一种基于查询输入的热点事件确定方法和系统 Active CN103226550B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210021488.7A CN103226550B (zh) 2012-01-31 2012-01-31 一种基于查询输入的热点事件确定方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210021488.7A CN103226550B (zh) 2012-01-31 2012-01-31 一种基于查询输入的热点事件确定方法和系统

Publications (2)

Publication Number Publication Date
CN103226550A CN103226550A (zh) 2013-07-31
CN103226550B true CN103226550B (zh) 2018-05-29

Family

ID=48837004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210021488.7A Active CN103226550B (zh) 2012-01-31 2012-01-31 一种基于查询输入的热点事件确定方法和系统

Country Status (1)

Country Link
CN (1) CN103226550B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593444B (zh) * 2013-11-15 2017-06-06 北京国双科技有限公司 网络关键词识别处理方法和装置
WO2015176624A1 (zh) * 2014-05-19 2015-11-26 北京奇虎科技有限公司 突发时效性查询词识别方法和系统
CN105589895B (zh) * 2014-11-13 2020-04-24 深圳市腾讯计算机系统有限公司 资源排行数据生成方法和装置
CN107918617B (zh) * 2016-10-10 2021-11-30 北京京东尚科信息技术有限公司 数据查询方法和装置
CN108156193B (zh) * 2016-12-02 2022-08-19 阿里巴巴集团控股有限公司 一种热点确定方法及系统
CN108427684B (zh) * 2017-02-14 2020-12-25 华为技术有限公司 数据查询方法、装置及计算设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101604340A (zh) * 2009-07-20 2009-12-16 腾讯科技(深圳)有限公司 一种获得查询的时新性的方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101604340A (zh) * 2009-07-20 2009-12-16 腾讯科技(深圳)有限公司 一种获得查询的时新性的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《一种基于相关度统计的告警事件关联算法》;刘强等;《计算机应用与软件》;20100630;第27卷(第6期);正文第105-107、114页 *
《网络热点发现与跟踪算法研究》;邓爱萍;《计算机与现代化》;20091231(第12期);正文第122-124页 *

Also Published As

Publication number Publication date
CN103226550A (zh) 2013-07-31

Similar Documents

Publication Publication Date Title
CN103226550B (zh) 一种基于查询输入的热点事件确定方法和系统
US12001439B2 (en) Information service for facts extracted from differing sources on a wide area network
US8402031B2 (en) Determining entity popularity using search queries
CN107526807B (zh) 信息推荐方法及装置
KR102080362B1 (ko) 쿼리 확장
CN111506569B (zh) 数据存储方法、装置、电子装置
CN108304444A (zh) 信息查询方法及装置
CN103049440A (zh) 一种相关文章的推荐处理方法和处理系统
CN105989076A (zh) 一种数据统计方法以及装置
US10437820B2 (en) Asymmetric distributed cache with data chains
Mahmood et al. FAST: frequency-aware indexing for spatio-textual data streams
CN108897808A (zh) 一种在云存储系统中进行数据存储的方法及系统
US20140330837A1 (en) Method, apparatus and system for pushing micro-blogs
US20140201203A1 (en) System, method and device for providing an automated electronic researcher
EP3385864A1 (en) Method and device for establishing index
US10922734B2 (en) Automatic identification of issues in text-based transcripts
CN103200269A (zh) 互联网信息统计方法及系统
KR101682659B1 (ko) 키워드 기반 맞춤 뉴스 알림 방법 및 그를 위한 뉴스 검색 관리 서버
US20160248724A1 (en) Social Message Monitoring Method and Apparatus
CN107203623B (zh) 网络爬虫系统的负载均衡调节方法
KR101621735B1 (ko) 추천 검색어 제공 방법 및 시스템
CN106708880B (zh) 话题关联词的获取方法和装置
CN113849499A (zh) 数据的查询方法、装置、存储介质及电子装置
KR101568800B1 (ko) 실시간 이슈 검색어 선별 방법 및 시스템
CN109542909B (zh) 识别大数据存储系统中的关联性存储设备的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: SHENZHEN SHIJI LIGHT SPEED INFORMATION TECHNOLOGY

Free format text: FORMER OWNER: TENGXUN SCI-TECH (SHENZHEN) CO., LTD.

Effective date: 20131021

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518044 SHENZHEN, GUANGDONG PROVINCE TO: 518057 SHENZHEN, GUANGDONG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20131021

Address after: 518057 Tencent Building, 16, Nanshan District hi tech park, Guangdong, Shenzhen

Applicant after: Shenzhen Shiji Guangsu Information Technology Co., Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403

Applicant before: Tencent Technology (Shenzhen) Co., Ltd.

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant