CN103559282B - 实时系统数据的去重方法和装置 - Google Patents

实时系统数据的去重方法和装置 Download PDF

Info

Publication number
CN103559282B
CN103559282B CN201310551776.8A CN201310551776A CN103559282B CN 103559282 B CN103559282 B CN 103559282B CN 201310551776 A CN201310551776 A CN 201310551776A CN 103559282 B CN103559282 B CN 103559282B
Authority
CN
China
Prior art keywords
data
real
time system
time
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310551776.8A
Other languages
English (en)
Other versions
CN103559282A (zh
Inventor
杨基彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201310551776.8A priority Critical patent/CN103559282B/zh
Publication of CN103559282A publication Critical patent/CN103559282A/zh
Priority to PCT/CN2014/088312 priority patent/WO2015067115A1/zh
Application granted granted Critical
Publication of CN103559282B publication Critical patent/CN103559282B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种实时系统数据的去重方法和装置。其中,实时系统数据的去重方法包括接收实时系统数据;判断第一数据的数据源与实时系统数据的数据源是否相同,其中,第一数据为存储在数据缓冲区中的数据;在判断出第一数据的数据源与实时系统数据的数据源相同的情况下,删除第一数据中的数据源与实时系统数据数据源相同的数据;以及暂存实时系统数据至数据缓冲区。通过本发明,解决了实时系统去重效率低的问题,进而达到了提高实时系统效果。

Description

实时系统数据的去重方法和装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种实时系统数据的去重方法和装置。
背景技术
StreamInsight是美国微软公司提供的实时数据流处理框架,可以用于高效实时计算。但是StreamInsight没有自带去重统计数据功能,而实际应用中有时候需要用到去重统计数据。
实时处理系统通常是每隔一段时间获取一次最新的数据,这样方便了系统的实时管理,但是同时数据量会很大。同时,实时系统的数据一般而言都有数据周期,对数据进行统计时常常会发生重复统计的情况。以视频实时处理系统需要实时接收播放数据为例,每个播放Id每间隔一段时间会发送一个快照数据,表示最新的播放信息。
现有技术解决方案是使用流剪辑的方法来统计播放次数,采用流剪辑的方法计播放次数时,先给播放数据赋予一定的生命周期,假如1分钟计算一次播放次数,则生播放数据的命周期设置为1分钟,当遇到播放Id相同的新快照时,将旧快照的生命周期截断至新快照的起始时间,当想要计算00:00:00到00:00:59这个时间区间内的播放次数时,只需要在59秒的瞬间统计一下快照总数即可。虽然流剪辑方案看起来可以很方便的统计播放次数,但实施起来却不容易,因为需要使用同一个流的自连接来实现,假如1分钟内有10w次播放快照,那么相当于10w个播放快照条目和10w个播放快照条目进行集合的笛卡儿积运算,然后过滤出符合筛选条件的记录。这个计算是非常消耗CPU以及内存的。
针对相关技术中对实时系统数据进行去重的效率较低的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种实时系统数据的去重方法和装置,以解决实时系统数据去重效率较低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种实时系统数据的去重方法,包括:接收实时系统数据;判断第一数据的数据源与实时系统数据的数据源是否相同,其中,第一数据为存储在数据缓冲区中的数据;在判断出第一数据的数据源与实时系统数据的数据源相同的情况下,删除第一数据中数据源与实时系统数据数据源相同的数据;以及暂存实时系统数据至数据缓冲区。
进一步地,实时系统数据的数量为多个,判断第一数据的数据源与实时系统数据的数据源是否相同包括:每接收一个实时系统数据,判断一次第一数据的数据源与实时系统数据的数据源是否相同。
进一步地,通过判断每一个第一数据的标识ID与实时系统数据的标识ID是否相同,来判断第一数据的数据源与实时系统数据的数据源是否相同。
进一步地,在暂存实时系统数据至数据缓冲区之后,去重方法还包括:将数据缓冲区中的数据存储至目标存储区域;以及清空数据缓冲区中的数据。
进一步地,每间隔预定时间将数据缓冲区中的数据存储至目标存储区域。
进一步地,实时系统数据为来自视频实时处理系统或者网页实时处理系统的数据。
为了实现上述目的,根据本发明的另一方面,提供了一种实时系统数据的去重装置,该去重装置主要用于执行本发明上述内容所提供的任一种实时系统数据的去重方法。
为了实现上述目的,根据本发明的另一方面,提供了一种实时系统数据的去重装置,包括:接收单元,用于接收实时系统数据;判断单元,用于判断第一数据的数据源与实时系统数据的数据源是否相同,其中,第一数据为存储在数据缓冲区中的数据;删除单元,用于在判断出第一数据的数据源与实时系统数据的数据源相同的情况下,删除第一数据中数据源与实时系统数据数据源相同的数据;以及暂存单元,用于暂存实时系统数据至数据缓冲区。
进一步地,实时系统数据的数量为多个,判断单元包括:判断子单元,用于每接收一个实时系统数据,判断一次第一数据的数据源与实时系统数据的数据源是否相同。
进一步地,判断子单元包括:判断模块,用于判断每一个第一数据的标识ID与实时系统数据的标识ID是否相同,来判断第一数据的数据源与实时系统数据的数据源是否相同。
进一步地,去重装置还包括:存储单元,用于将数据缓冲区中的数据存储至目标存储区域;以及清空单元,用于清空数据缓冲区中的数据。
进一步地,存储单元用于每间隔预定时间将数据缓冲区中的数据存储至目标存储区域。
进一步地,实时系统数据为来自视频实时处理系统或者网页实时处理系统的数据。
本发明采用接收实时系统数据;判断第一数据的数据源与实时系统数据的数据源是否相同,其中,第一数据为存储在数据缓冲区中的数据;在判断出第一数据的数据源与实时系统数据的数据源相同的情况下,删除第一数据中的数据源与实时系统数据数据源相同的数据;以及暂存实时系统数据至数据缓冲区。在接收实时系统数据之前先建立一个数据缓冲区,通过将实时系统数据暂存至缓冲区,且在数据暂存至缓冲区之前,先对数据进行判断,如果缓冲区中有来自同一个数据源的数据则先删除数据缓冲区中的这个数据源的数据,在进行下一步的处理之前就将数据源的重复数据去重,避免了同一个数据源的大量数据直接进入实时处理系统进行去重,解决了实时系统去重效率低的问题,进而达到了提高实时系统效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的实时系统数据去重方法的流程图;
图2是根据现有技术的流剪辑之前的数据生命周期示意图;
图3是根据现有技术的流剪辑之后的数据生命周期示意图;以及
图4是根据本发明实施例的实时系统数据去重装置的结构示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
本发明提供一种实时系统数据的去重方法,下面对本发明的实时系统数据的去重方法进行具体介绍:
图1是本发明实施例的实时系统数据去重方法的流程图。如图1所示,该方法包括如下的步骤S102至步骤S108:
步骤S102,接收实时系统数据。具体地,在接收数据之前,先在内存里开辟一个数据缓冲区。
步骤S104,判断第一数据的数据源与实时系统数据的数据源是否相同,其中,第一数据为存储在数据缓冲区中的数据。
步骤S106,在判断出第一数据的数据源与实时系统数据的数据源相同的情况下,删除第一数据中的数据源与实时系统数据数据源相同的数据,
步骤S108,暂存实时系统数据至数据缓冲区。
本发明实施例的实时系统数据的去重方法,在接收实时系统数据之前先建立一个数据缓冲区,通过将实时系统数据暂存至缓冲区,且在数据暂存至缓冲区之前,先对数据进行判断,如果缓冲区中有来自同一个数据源的数据则先删除数据缓冲区中的这个数据源的数据,在进行下一步的处理之前就将数据源的重复数据去重,避免了同一个数据源的大量数据直接进入实时处理系统进行去重,解决了实时系统去重效率低的问题,进而达到了提高实时系统处理数据效率的效果。
进一步地,实时系统数据为多个,判断第一数据的数据源与实时系统数据的数据源是否相同包括:每接收一个实时系统数据,判断一次第一数据的数据源与接收到的实时系统数据的数据源是否相同。实时系统的各个数据源会每间隔一段时间发送一个最新的数据,以便于监控系统的运行状态,每接收一个新的数据时,进行一次判断,即将数据缓冲区中的数据的数据源与接收到的这个实时系统数据的数据源进行比较,如果数据缓冲区中某个数据的数据源与接收到的这个实时系统数据的数据源相同,则删除数据缓冲区中的旧数据,暂存这个数据源发来的最新数据。
进一步地,在本发明实施例中,可以通过判断每一个第一数据的标识ID与实时系统数据的标识ID是否相同,来判断第一数据的数据源与实时系统数据的数据源是否相同,其中,当判断出某个第一数据的标识ID与实时系统数据的标识ID相同的情况下,确定这个第一数据的数据源与实时系统数据的数据源相同,反之,则不相同。此种通过标识ID进行判断的方式也称作自连接判断方式,以实时系统数据为来自视频实时处理系统的数据为例进一步说明,假设目前在处理很多条“播放记录”的集合,每条播放记录都有一个唯一的播放Id,对于判断新接收到的视频播放数据的数据源与已经记录的视频播放数据的数据源是否相同,则将新接收到的视频播放数据集合与已经记录的视频播放数据集合进行连接,这两个集合在连接的时候,根据播放Id作为连接的条件判定,即从新接收到的视频数据集合中选择任意一个播放Id的播放记录,到已经记录的视频播放数据的集合中去查找是否具有同样播放Id的播放记录。
通过一对一的自连接,来判断数据缓冲区中的数据与实时系统数据是否来自同一个源的效率要远远高于多对多的数据自连接,判断的效率较高。
进一步地,在暂存实时系统数据至数据缓冲区之后,本发明实施例的实时系统数据的去重方法还包括,每间隔预定时间将数据缓冲区中的数据存储至目标存储区域,并清空数据缓冲区中的数据。
为了让实时系统的最新数据及时输出,以便实时获取实时系统的运行状态,所以需要每隔一段时间将去重的数据存储起来,以便于下一步的处理。在数据存储之后,清空缓冲区,以便与缓冲区缓冲后面接收到的数据。预定时间的长短可以根据后续处理系统对数据实时性的要求来确定。
进一步地,本发明实施例的实时数据的去重方法可以用于统计一段时间以内地视屏播放次数,或者用于统计一段时间内网页浏览的次数,即,在本发明实施例所提供的实时系统数据的去重方法中,实时系统数据可以是来自视频实时处理系统的数据,也可以是来自网页实时处理系统的数据。为了更好的理解本发明实施例,下面以统计一段时间内的视频播放次数为例来说明本发明实施例的实时数据的去重方法。
在00:00:00到00:00:59这段时间内收到的快照如下表所示:
时间 00:00:00 00:00:05 00:00:10 00:00:15 00:00:20
播放Id 播放1快照1 播放1快照2 播放1快照3 播放2快照1 播放2快照2
表中虽然有5个快照数据,但是只有播放1和播放2两次播放。假定每个数据的生命周期为1分钟,则在00:00:00到00:00:59这个时间段统计播放次数时会得到播放次数为5次(如图2所示),而实际上只有2次播放。为了得到准确的播放次数,在统计播放次数之前采用流剪辑的方法,当遇到相同ID的新快照时,将旧快照的生命周期截断至新快照开始的时间。流剪辑之后的快照生命周期如图3所示,流剪辑之后统计00:00:00到00:00:59这个时间段的播放次数为2。
如果快照的数量很大,比如00:00:00到00:00:59这个时间段内,有100000个播放快照,那么,在StreamInsight中对其进行流剪辑时,将进行10000*10000次自连接,才能将所有快照进行去重,去重效率较低,本发明的实时数据的去重方法在数据输入StreamInsight之前,先建立一个数据缓冲区,00:00:00接收“播放1快照1”,由于此时数据缓冲区中没有数据,直接放入数据缓冲区中,00:00:05接收“播放1快照2”,此时先进行一次判断,由于“播放1快照1”和“播放1快照2”均为来自“播放1”这个数据源,所以删除“播放1快照1”,将“播放1快照2”保存到数据缓冲区中。按照此方法依次接收数据,到00:00:59的时候,数据缓冲区中的只有“播放1快照3”和“播放2快照2”这两个数据,即,00:00:00到00:00:59这个时间段内有两次播放。
本发明还提供一种实时系统数据去重装置,该装置主要用于实现本法明实施例上述内容所提供的实时系统数据的去重方法,下面对本发明的实时系统数据的去重方法进行具体介绍:
图4是根据本发明实施例的实时系统数据去重方法的结构示意图。如图4所示,该装置主要包括接收单元10、判断单元20、删除单元30和暂存单元40,其中:
接收单元10用于接收实时系统数据。具体地,在接收数据之前,先在内存里开辟一个数据缓冲区。
判断单元20用于判断第一数据的数据源与实时系统数据的数据源是否相同,其中,第一数据为存储在数据缓冲区中的数据。
删除单元30用于在判断出第一数据的数据源与实时系统数据的数据源相同的情况下,删除第一数据中的数据源与实时系统数据数据源相同的数据,
暂存单元40用于暂存实时系统数据至数据缓冲区。
本发明实施例的实时系统数据的去重装置,在接收实时系统数据之前先建立一个数据缓冲区,通过将实时系统数据暂存至数据缓冲区,且在数据暂存至数据缓冲区之前,先对数据进行判断,如果缓冲区中有来自同一个数据源的数据则先删除数据缓冲区中的这个数据源的数据,在进行下一步的处理之前就将数据源的重复数据去重,避免了同一个数据源的大量数据直接进入实时处理系统进行去重,解决了实时系统去重效率低的问题,进而达到了提高实时系统处理数据效率的效果。
进一步地,实时系统数据为多个,判断单元20包括判断子单元,用于每接收一个实时系统数据,判断一次第一数据的数据源与实时系统数据的数据源是否相同。实时系统的各个数据源会每间隔一段时间发送一个最新的数据,以便于监控系统的运行状态,每接收一个新的数据时,进行一次判断,即将数据缓冲区中的数据的数据源与接收到的这个实时系统数据的数据源进行比较,如果数据缓冲区中有数据的数据源与接收到的这个实时系统的数据的数据源相同,则删除数据缓冲区中的旧数据,而这个数据源发来的最新数据。
进一步地,判断子单元包括判断模块,用于判断每一个第一数据的标识ID与实时系统数据的标识ID是否相同,来判断第一数据的数据源与实时系统数据的数据源是否相同,其中,当判断出某个第一数据的标识ID与实时系统数据的标识ID相同的情况下,确定这个第一数据的数据源与实时系统数据的数据源相同,反之,则不相同。此种通过标识ID进行判断的方式也称作自连接判断方式,以实时系统数据为来自视频实时处理系统的数据为例进一步说明,假设目前在处理很多条“播放记录”的集合,每条播放记录都有一个唯一的播放Id,对于判断新接收到的视频播放数据的数据源与已经记录的视频播放数据的数据源是否相同,则将新接收到的视频播放数据集合与已经记录的视频播放数据集合进行连接,这两个集合在连接的时候,根据播放Id作为连接的条件判定,即从新接收到的视频数据集合中选择任意一个播放Id的播放记录,到已经记录的视频播放数据的集合中去查找是否具有同样播放Id的播放记录。。
通过一对一的自连接,来判断数据缓冲区中的数据与实时系统数据是否来自同一个源的效率要远远高于多对多的数据自连接,判断的效率较高。
进一步地,去重装置还包括存储单元,用于将数据缓冲区中的数据存储至目标存储区域;以及清空单元,用于清空数据缓冲区中的数据。其中,存储单元主要是每间隔预定时间将数据缓冲区中的数据存储至目标存储区域,为了让实时系统的最新数据及时输出,以便实时获取实时系统的运行状态,所以需要每隔一段时间将去重的数据存储起来,以便于下一步的处理。在数据存储之后,清空缓冲区,以便与缓冲区缓冲后面接收到的数据。预定时间的长短可以根据后续处理系统对数据实时性的要求来确定。
进一步地,本发明实施例的实时数据的去重装置可以用于统计一段时间以内地视屏播放次数,或者用于统计一段时间内网页浏览的次数,即,在本发明实施例所提供的实时系统数据的去重方法中,实时系统数据可以是来自视频实时处理系统的数据,也可以是来自网页实时处理系统的数据。其中,去重装置用于统计一段时间以内的视屏播放次数的具体统计方式,与本发明实施例上述内容所提供的实时系统数据的去重方法中统计一段时间内的视频播放次数相同,此处不再赘述。
从以上的描述中,可以看出,本发明解决了实时系统去重效率低的问题,进而达到了提高实时系统数据处理效率的效果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种实时系统数据的去重方法,其特征在于,包括:
接收所述实时系统数据;
判断第一数据的数据源与所述实时系统数据的数据源是否相同,其中,所述第一数据为存储在数据缓冲区中的数据;
在判断出所述第一数据的数据源与所述实时系统数据的数据源相同的情况下,删除所述第一数据中数据源与所述实时系统数据数据源相同的数据;以及
暂存所述实时系统数据至所述数据缓冲区;
每间隔预定时间将所述数据缓冲区中的数据存储至目标存储区域;以及
清空所述数据缓冲区中的数据;
所述实时系统数据的数量为多个,判断第一数据的数据源与所述实时系统数据的数据源是否相同包括:每接收一个所述实时系统数据,判断一次所述第一数据的数据源与所述实时系统数据的数据源是否相同;
其中,所述实时系统数据为来自视频实时处理系统或者网页实时处理系统的数据。
2.根据权利要求1所述的去重方法,其特征在于,通过判断每一个所述第一数据的标识ID与所述实时系统数据的标识ID是否相同,来判断所述第一数据的数据源与所述实时系统数据的数据源是否相同。
3.一种实时系统数据的去重装置,其特征在于,包括:
接收单元,用于接收所述实时系统数据;
判断单元,用于判断第一数据的数据源与所述实时系统数据的数据源是否相同,其中,所述第一数据为存储在数据缓冲区中的数据;
删除单元,用于在判断出所述第一数据的数据源与所述实时系统数据的数据源相同的情况下,删除所述第一数据中数据源与所述实时系统数据数据源相同的数据;以及
暂存单元,用于暂存所述实时系统数据至所述数据缓冲区;
存储单元,用于每间隔预定时间将所述数据缓冲区中的数据存储至目标存储区域;以及
清空单元,用于清空所述数据缓冲区中的数据;
所述实时系统数据的数量为多个,所述判断单元包括:
判断子单元,用于每接收一个所述实时系统数据,判断一次所述第一数据的数据源与所述实时系统数据的数据源是否相同;
其中,所述实时系统数据为来自视频实时处理系统或者网页实时处理系统的数据。
4.根据权利要求3所述的去重装置,其特征在于,所述判断子单元包括:
判断模块,用于判断每一个所述第一数据的标识ID与所述实时系统数据的标识ID是否相同,来判断所述第一数据的数据源与所述实时系统数据的数据源是否相同。
CN201310551776.8A 2013-11-07 2013-11-07 实时系统数据的去重方法和装置 Active CN103559282B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310551776.8A CN103559282B (zh) 2013-11-07 2013-11-07 实时系统数据的去重方法和装置
PCT/CN2014/088312 WO2015067115A1 (zh) 2013-11-07 2014-10-10 实时系统数据的去重方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310551776.8A CN103559282B (zh) 2013-11-07 2013-11-07 实时系统数据的去重方法和装置

Publications (2)

Publication Number Publication Date
CN103559282A CN103559282A (zh) 2014-02-05
CN103559282B true CN103559282B (zh) 2018-02-23

Family

ID=50013528

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310551776.8A Active CN103559282B (zh) 2013-11-07 2013-11-07 实时系统数据的去重方法和装置

Country Status (2)

Country Link
CN (1) CN103559282B (zh)
WO (1) WO2015067115A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559282B (zh) * 2013-11-07 2018-02-23 北京国双科技有限公司 实时系统数据的去重方法和装置
CN104298750B (zh) * 2014-10-14 2018-02-23 北京国双科技有限公司 用于实时系统通信的更新处理方法及装置
CN108959397A (zh) * 2018-06-04 2018-12-07 成都盯盯科技有限公司 重复数据删除方法及终端
CN108923972B (zh) * 2018-06-30 2021-06-04 平安科技(深圳)有限公司 一种去重流量提示方法、装置、服务器及存储介质
CN111400370A (zh) * 2020-03-06 2020-07-10 上海数据交易中心有限公司 数据流通中的数据监控方法及装置、存储介质、服务器

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1988669A (zh) * 2006-11-21 2007-06-27 北京大学 流媒体监播中的数字标记构造、验证方法及监播系统
CN101102432A (zh) * 2007-08-07 2008-01-09 四川长虹电器股份有限公司 记录数字电视运行过程的方法
CN101510835A (zh) * 2009-03-23 2009-08-19 北京学之途网络科技有限公司 一种监测网络电视系统组播业务的方法及其系统
CN102591946A (zh) * 2010-12-28 2012-07-18 微软公司 使用索引划分和协调来进行数据去重复
CN103067696A (zh) * 2013-01-31 2013-04-24 东方网力科技股份有限公司 面向视频监控的流媒体缓存方法、装置、控制器和系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009033074A2 (en) * 2007-09-05 2009-03-12 Emc Corporation De-duplication in virtualized server and virtualized storage environments
US20100250502A1 (en) * 2009-03-27 2010-09-30 Kiyokazu Saigo Method and apparatus for contents de-duplication
CN101834801B (zh) * 2010-05-20 2012-11-21 哈尔滨工业大学 基于缓冲池的数据缓存排序在线处理方法
CN103559282B (zh) * 2013-11-07 2018-02-23 北京国双科技有限公司 实时系统数据的去重方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1988669A (zh) * 2006-11-21 2007-06-27 北京大学 流媒体监播中的数字标记构造、验证方法及监播系统
CN101102432A (zh) * 2007-08-07 2008-01-09 四川长虹电器股份有限公司 记录数字电视运行过程的方法
CN101510835A (zh) * 2009-03-23 2009-08-19 北京学之途网络科技有限公司 一种监测网络电视系统组播业务的方法及其系统
CN102591946A (zh) * 2010-12-28 2012-07-18 微软公司 使用索引划分和协调来进行数据去重复
CN103067696A (zh) * 2013-01-31 2013-04-24 东方网力科技股份有限公司 面向视频监控的流媒体缓存方法、装置、控制器和系统

Also Published As

Publication number Publication date
CN103559282A (zh) 2014-02-05
WO2015067115A1 (zh) 2015-05-14

Similar Documents

Publication Publication Date Title
CN103559282B (zh) 实时系统数据的去重方法和装置
CN106126407B (zh) 一种针对分布式存储系统的性能监控调优系统及方法
JP5838229B2 (ja) 決定されたプリファレンス値に基づく製品情報の送信
CN103561354B (zh) 视频流畅度计算处理方法和装置
US20150095381A1 (en) Method and apparatus for managing time series database
CN107122126B (zh) 数据的迁移方法、装置和系统
CN109391647B (zh) 存储资源回收方法、装置及系统
CN106488256B (zh) 一种数据处理方法及装置
CN103246549B (zh) 一种数据转存的方法及系统
CN107704507B (zh) 数据库处理方法和设备
CN105701135A (zh) 一种应用推荐的方法和装置
CN110113626A (zh) 一种回放直播视频的方法及装置
CN103064908A (zh) 一种通过内存快速去重名单的方法
CN109033188A (zh) 一种元数据采集方法、装置、服务器和计算机可读介质
US20170097787A1 (en) Dynamic two-tier data storage utilization
CN110427259A (zh) 一种任务处理方法及装置
CN108920098A (zh) 一种存储管理系统收集信息的方法、系统及设备
CN106686619A (zh) 一种性能评估方法和设备
CN106599005B (zh) 一种数据归档方法及装置
CN110502486B (zh) 日志处理方法、装置、电子设备和计算机可读存储介质
WO2023169188A1 (zh) 一种文件系统中的热度识别方法、装置及计算机设备
CN107295059A (zh) 业务推送量的统计系统及方法
CN108829735B (zh) 并行执行计划的同步方法、装置、服务器及存储介质
CN108228598A (zh) 媒体信息排序方法、服务器和系统
CN105939218A (zh) 网络流量的统计方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Real-time system data reduplication removing method and device

Effective date of registration: 20190531

Granted publication date: 20180223

Pledgee: Shenzhen Black Horse World Investment Consulting Co.,Ltd.

Pledgor: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Registration number: 2019990000503

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

PP01 Preservation of patent right

Effective date of registration: 20240604

Granted publication date: 20180223