CN113515527A - 一种聚合型ip索引的建立和应用方法 - Google Patents

一种聚合型ip索引的建立和应用方法 Download PDF

Info

Publication number
CN113515527A
CN113515527A CN202111067029.8A CN202111067029A CN113515527A CN 113515527 A CN113515527 A CN 113515527A CN 202111067029 A CN202111067029 A CN 202111067029A CN 113515527 A CN113515527 A CN 113515527A
Authority
CN
China
Prior art keywords
index
data
fragment
address data
checked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111067029.8A
Other languages
English (en)
Other versions
CN113515527B (zh
Inventor
田红伟
徐文勇
王伟旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Shumo Technology Co ltd
Original Assignee
Chengdu Shumo Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Shumo Technology Co ltd filed Critical Chengdu Shumo Technology Co ltd
Priority to CN202111067029.8A priority Critical patent/CN113515527B/zh
Publication of CN113515527A publication Critical patent/CN113515527A/zh
Application granted granted Critical
Publication of CN113515527B publication Critical patent/CN113515527B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2237Vectors, bitmaps or matrices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2272Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2101/00Indexing scheme associated with group H04L61/00
    • H04L2101/60Types of network addresses

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种聚合型IP索引的建立和应用方法,属于数据处理技术领域。包括将所有IP域范围内的4个字节,转换对应为主机字节序的整数,建立空白位图索引;抽取一个时空内接收的所有数据块中的IP数据转化为整数,放入空白位图索引中对应的位置打上标记,形成处理索引;将处理索引进行逻辑“或”操作聚合到更大时空索引中;接收待查IP数据,确定待查IP数据转换为对应主机字节序的整数是否在更大时空索引中,若是则依次读取更小时空索引,直至定位到该IP数据。通过本发明所述的方法能够简单快速判断在数据有效时间范围内,原始数据中是否存在某IP数据。

Description

一种聚合型IP索引的建立和应用方法
技术领域
本发明涉及数据处理领域,具体涉及一种聚合型IP索引的建立和应用方法。
背景技术
系统按照时间或空间对网络流量进行采集,这些网络流量中包含了大量的原始数据。如果需要确定每段时间采集的流量中是否存在某IP数据,则需要进行IP索引建立和检索,但由于系统存储空间限制,需要进行IP数据和索引的删除。现有技术中,专利CN110825940A公开了一种网络数据包存储和查询方法,其技术方案为:在收到网络数据包时,将数据包放入数据包写入队列中;解析数据包的特征,并提取特征数据;根据特征数据生成布隆过滤器、位图索引和偏移数组文件;以大数据包文件方式写入数据包。
但是上述现有技术存在以下问题:首先,使用布隆过滤器无法实现索引的删除,容易造成系统存储空间的占用;其次,在构建索引时需要分别使用三种技术:布隆过滤器、位图 和数组索引,才能定位到数据所在偏移,过程比较复杂。因此,亟待设计一种方法能够简单快速判断在有效时间范围内,原始数据中是否存在某IP数据的方法。
发明内容
本发明旨在解决现有技术中的数据存储和查询存在的过程复杂、容易造成系统空间占用的问题,提出一种性能好、效率高的聚合型IP索引的建立和应用方法。
为了实现上述发明目的,本发明的技术方案如下:
一种聚合型IP索引的建立和应用方法,包括如下步骤:
步骤S1、索引设计:将所有IP域范围内的4个字节,转换对应为主机字节序的整数,建立空白的位图索引;
步骤S2、索引标记:接收数据块,抽取一个时空内到来的所有数据块的IP地址数据转化为整数,放入空白的位图索引中对应的位置打上标记,形成局部时空的处理索引;
步骤S3、索引聚合:将多个打上标记的处理索引进行逻辑“或”操作聚合到较大时空索引中;将聚合成的较大时空索引通过逻辑“或”操作聚合到更大时空索引中;
步骤S4、数据查询:接收待查IP地址数据,确定待查IP地址数据转换为对应主机字节序的整数是否在步骤S3形成的更大时空索引中,若是则依次读取更小时空索引,直至定位到该IP地址数据;否则继续接收待查IP地址数据。
进一步的,步骤S1还包括:将转换对应为主机字节序的整数按段均匀划分,形成分片数组,并为每个分片数组编制一个分片序号。
进一步的,步骤S1还包括:将每个分片数组以指定的映射倍数进行模糊处理,即将一个分片数组中的N个连续整数用一个位来表示,只要该位中任意一个IP地址出现,则将该位置为“1”。
进一步的,步骤S1还包括:使用LZ4压缩算法,对形成的空白的位图索引中的每个分片数组进行压缩处理,按照每个分片数组进行整体的存储和读取。
进一步的,步骤S2中,处理索引的形成过程为:根据数据块中的IP地址数据转化为整数后的大小,确定该整数所在的空白位图索引上的分片序号,根据分片序号内分片数组的映射倍数,获取该IP地址数据所在空白位图索引的偏移和位置,并将该位置为“1”。
进一步的,步骤S3中,索引聚合包括如下步骤:
步骤S31、合并第一个处理索引时:将打上标记的处理索引的每个分片内存依次拷贝到相同分片序号的内存进行覆盖;
步骤S32、合并后来的处理索引时:依次按照索引分片,对相同分片序号相同偏移位的IP地址数据进行位“或”运算,并将运算结果保存到新的索引分片中。
进一步的,步骤S4具体包括:
步骤S41、输入待查IP地址数据,查找该待查IP地址数据所在的时间段,并将该待查IP地址数据转换为对应主机字节序的整数;
步骤S42、根据该待查IP地址数据转换为对应主机字节序的整数的大小,定位到具体的分片数组,并读取该分片数组的分片序号;
步骤S43、根据该分片序号内分片数组的映射倍数,确定该待查IP地址数据所在的位图偏移是否为“1”;
步骤S44、若为1,则进入所在时段的更小的局部时空索引,最终定该待查IP地址数据出现在哪些时段;若为0,则该待查IP地址数据在该时段中不存在。
进一步的,使用LZ4压缩算法,对聚合后的索引中的每个分片数组进行压缩处理,按照每个分片数组进行整体的存储和读取。
综上所述,本发明具有以下优点:
1、本发明采用位图索引模式,可以在数据完全不失真的情况下记录所有IP情况,并且位图匹配性能高效;
2、本发明以主机字节序进行IP位图设计,相同网络的IP位标记会相近,在读取和匹配相近IP时,达到优化效果,由于大部分网络中是将IP以网段方式进行规划,网络中就会出现相近IP;
3、本发明中,采用索引分片技术,将索引分片进行存储和聚合,在聚合时,若IP数量较小,某个分片不存在,则该分片的聚合则可以不进行内存的申请,减小内存消耗;在索引读取时,能根据查询IP定位具体索引分片,仅需要读取指定分片,减少读取IO消耗;
4、本发明支持对分片进行模糊处理,支持在资源受限的情况下,将全位图索引以指定的映射倍数进行模糊处理,减少索引所耗内存和存储空间;
5、本发明中,采用了分片压缩策略,作为512MB的全位图索引,存储空间进行lz4压缩,可在压缩效率和压缩比上获取可观的增益;
6、本发明中,当索引所对应的数据由于时间失效时,需要将数据删除同时清除索引,本发明能直接将对应的索引清除,并且不会对数据检索和数据准确性造成影响;
7、本发明中,所述的索引聚合策略,可灵活的由小片时空IP索引数据,聚合为更大时空IP索引数据;在检索时,由大时间窗口或者大数据范围快速减少数据筛选时间空间范围,提高检索效率。
附图说明
图1为本发明的数据入库步骤流程图;
图2为本发明的数据查询步骤流程图;
图3为本发明的索引标记步骤示意图;
图4为本发明的索引聚合步骤示意图;
图5为本发明的数据存储结构图;
图6为本发明的数据查询步骤一个具体实施例的示意图。
具体实施方式
下面结合实施例对本发明作进一步地详细说明,但本发明的实施方式不限于此。
实施例1
本实施例提供了一种聚合型IP索引的建立和应用方法,包括如下步骤:
步骤S1、索引设计:将所有IP域范围内的4个字节,转换对应为主机字节序的整数,建立空白的位图索引;以主机字节序进行IP位图设计,检索的时候能提高命中率,相同网络的IP位标记会相近,在读取和匹配相近IP时,达到优化效果,由于大部分网络中是将IP以网段方式进行规划,网络中就会出现相近IP。
步骤S2、索引标记:接收数据块,抽取一个时空内到来的所有数据块的IP数据转化为整数,放入空白的位图索引中对应的位置打上标记,形成局部时空的处理索引;采用位图索引模式,可以在数据完全不失真的情况下记录所有IP情况,并且位图匹配性能高效。
步骤S3、索引聚合:将多个打上标记的处理索引进行逻辑“或”操作聚合到较大时空索引中;将聚合成的较大时空索引通过逻辑“或”操作聚合到更大时空索引中;
步骤S4、数据查询:接收待查IP数据,确定待查IP数据转换为对应主机字节序的整数是否在步骤S3形成的更大时空索引中,若是则依次读取更小时空索引,直至定位到该IP数据;否则继续接收待查IP数据。
实施例2
本发明提供了一种聚合型IP索引的建立和应用方法,该方法基于如下的索引设计策略:
步骤一、将所有IP域范围(0-255.255.255.255)内的4个字节,转换对应为主机字节序的整数,转换后的整数范围为0到 4294967295。
步骤二、分别为每个整数建立一个掩码bit位,则总计需要4294967295位,这4294967295位形成一个空白的位图索引,则总计消耗512MB内存来记录该位图索引。
步骤三、将整数按段均匀划分,形成分片数组,并为每个分片数组编制一个分片序号(0-15);在本实施例中,将0到 4294967295的整数按段分片为16片,每片32MB。每片的数据大小为268435456,0分片数据范围为[0,268435456)或[0,268435455],1分片数据范围为[268435456, 536870911],以此类推,15分片数据范围为[4026531839,4294967295],如图3所示。
步骤四、对每个分片数组进行模糊分片处理,形成N倍映射,达到压缩每个分片数组空间的目的。具体处理方法是:将一个分片数组中的N个连续IP(也可以说是N个连续整数)用一个位来表示,那么只要该位中存在其中一个IP,则将该位置为“1”;如当映射倍数为2倍时,0.0.0.0和0.0.0.1公用0分片的0偏移位,其中属于其中的任意一个IP出现,则将该位置为1(按位“或”运算)。
步骤五、使用lz4压缩算法,对位图索引里的每个分片数组进行压缩,然后按照每个分片数组进行整体的存储和读取。
步骤六、索引聚合。为了取得更大时间或者空间范围的快速检索,快速筛选更大时间跨度的数据,减少数据无效读取造成的资源消耗,创造一个更大时空的新索引,设计将多个经过步骤一到步骤四产生的位图索引进行合并,索引聚合方式如下:
合并第一个处理索引时:将打上标记的处理索引的每个分片内存依次拷贝到相同分片序号的内存进行覆盖;
合并后来的处理索引时:依次按照索引分片,对相同分片序号相同偏移位的IP数据进行位“或”运算,并将运算结果保存到新的索引分片中。如图4所示。
经过步骤六,可以生成多个位图索引的聚合索引,在查询时,如果聚合索引已经进行排除,那么就可以避免进行其参与聚合的位图索引的读取和判断,极大地提高查询效率。
基于上述索引设计策略,本发明所述的一种聚合型IP索引的建立和应用方法,主要包括数据入库和数据查询两个步骤,其中,
如图1所示,数据入库步骤主要包括:
步骤S1、接收数据块:获取数据块中的IP数据,并将该IP数据转化对应为主机字节序的整数,接收的数据块作为原始数据进行存储。
步骤S2、索引标记:根据转换后整数的大小,确定该整数所在的位图索引的分片序号;根据分片序号内的分片数组的映射倍数,获取该IP数据所在位图索引的偏移和位置,并将该位置为“1”;循环上述步骤S1至步骤S2,将一个时空内到来的所有IP数据都打上位图标记,形成对应的处理索引。
下面通过具体的例子来说明索引标记过程,如图3所示,假设需要建立索引的IP数据为127.0.0.1;192.168.0.1。每个分片大小为32MB,映射为32位,映射倍数为1024*1024*8,图中的每个空白单元格为一位。
将上述两个IP转为主机字节数的整数分别为:213006433;3232235521。
根据转换的整数大小定位其所在位图索引的分片序号和位移:
213006433/268435456=0——分片0;
余213006433;
213006433/(1024*1024*8)=25——偏移25,则将该位置为“1”;
3232235521/268435456=12——分片12;
余11010049;
11010049/(1024*1024*8)=1——偏移1,则将该位置为“1”。
步骤S3、索引存储、压缩:将打上标记的位图索引(即处理索引)按照分片分别进行lz4压缩,并且分别存储。
步骤S4、索引聚合:将步骤S1至步骤S3产生的处理索引进行按位“或”操作到更大时空索引中。如图4所示是将两个1小时索引聚合成1个2小时的聚合索引。
步骤S5、循环步骤S1至步骤S4,形成更大时空索引。这里的更大时空索引,包括按照时间维度来聚合索引,如时间(1分钟,10分钟,1小时,1天,1周,1月,1年),还包括按照空间维度来聚合索引,如空间(1GB,10GB,100GB,1TB,10TB,100TB,1PB)。需要明确的是,这里的局部时空索引和更大时空索引是相对而言的。
以按照时间维度来聚合索引为例,最终形成的数据存储结构如图5所示,从局部时间的10分索引聚合成更大时间的小时索引,小时索引又聚合成更大时间的天索引,天索引还可以聚合成更大时间的周索引、月索引……。
步骤S6、将聚合后的索引,按照上述步骤S3进行索引的压缩和存储。
如图2所示,数据查询步骤包括:
步骤S1、接收查询IP:输入待查IP,查找一天数据中该待查IP所在的时间段,并将该待查IP转换为对应主机字节序的整数;
步骤S2、定位索引分片并读取分片:根据转换后整数的大小定位到具体的分片数组,并读取该分片数组对应的分片序号;
步骤S3、匹配偏移:根据该分片数组的映射倍数,确定所在的位图偏移是否为“1”,若为1,则需要按照查看更小时空中的索引,最终定位该待查IP出现在哪些小时段;若为0,则该IP在当天中并不存在。
下面通过具体的例子来说明数据查询过程,如图6所示,需要查询的IP数据为127.0.0.2;220.222.18.1。设每个分片32MB,映射为32位,映射倍数为1024*1024*8;图中每个空白单元格为一位。
上述两个IP数据转为主机字节序对应的整数分别为213006434;3705541121。
根据上述两个整数的大小定位分片序号和偏移:
213006434/268435456——则分片序号为0;
余213006434;
213006434/(1024*1024*8)=25——偏移25;
3705541121/268435456——则分片序号为13;
余215880193;
215880193/(1024*1024*8)=25——偏移25。
分别读取0分片和13分片,分别解压分片数组到内存中。
匹配0分片的25偏移,结果为已标记,则说明该IP数据疑似存在,继续进行小一刻度0分片的索引读取或者直接遍历查询数据;
匹配13分片的25偏移,结果为未标记,说明该IP不存在,则跳过该时间段。
本发明中提到的“IP”均指“IP地址”,IP地址是一种在Internet上的给主机编址的方式,也称为网际协议地址。
虽然结合附图对本发明的具体实施方式进行了详细地描述,但不应理解为对本专利的保护范围的限定。在权利要求书所描述的范围内,本领域技术人员不经创造性劳动即可做出的各种修改和变形仍属本专利的保护范围。
以上所述,仅是本发明的较佳实施例,并非对本发明做任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化,均落入本发明的保护范围之内。

Claims (8)

1.一种聚合型IP索引的建立和应用方法,其特征在于,包括如下步骤:
步骤S1、索引设计:将所有IP域范围内的4个字节,转换对应为主机字节序的整数,建立空白的位图索引;
步骤S2、索引标记:接收数据块,抽取一个时空内到来的所有数据块的IP地址数据转化为整数,放入空白的位图索引中对应的位置打上标记,形成局部时空的处理索引;
步骤S3、索引聚合:将多个打上标记的处理索引进行逻辑“或”操作聚合到较大时空索引中;将聚合成的较大时空索引通过逻辑“或”操作聚合到更大时空索引中;
步骤S4、数据查询:接收待查IP地址数据,确定待查IP地址数据转换为对应主机字节序的整数是否在步骤S3形成的更大时空索引中,若是则依次读取更小时空索引,直至定位到该IP地址数据;否则继续接收待查IP地址数据。
2.根据权利要求1所述的一种聚合型IP索引的建立和应用方法,其特征在于,步骤S1还包括:将转换对应为主机字节序的整数按段均匀划分,形成分片数组,并为每个分片数组编制一个分片序号。
3.根据权利要求2所述的一种聚合型IP索引的建立和应用方法,其特征在于,步骤S1还包括:将每个分片数组以指定的映射倍数进行模糊处理,即将一个分片数组中的N个连续整数用一个位来表示,只要该位中任意一个IP地址出现,则将该位置为“1”。
4.根据权利要求3所述的一种聚合型IP索引的建立和应用方法,其特征在于,使用LZ4压缩算法,对形成的空白的位图索引中的每个分片数组进行压缩处理,按照每个分片数组进行整体的存储和读取。
5.根据权利要求3所述的一种聚合型IP索引的建立和应用方法,其特征在于,步骤S2中,处理索引的形成过程为:根据数据块中的IP地址数据转化为整数后的大小,确定该整数所在的空白位图索引上的分片序号,根据分片序号内分片数组的映射倍数,获取该IP地址数据所在空白位图索引的偏移和位置,并将该位置为“1”。
6.根据权利要求2所述的一种聚合型IP索引的建立和应用方法,其特征在于,步骤S3中,索引聚合过程包括如下步骤:
步骤S31、合并第一个处理索引时:将打上标记的处理索引的每个分片内存依次拷贝到相同分片序号的内存进行覆盖;
步骤S32、合并后来的处理索引时:依次按照索引分片,对相同分片序号相同偏移位的IP地址数据进行位“或”运算,并将运算结果保存到新的索引分片中。
7.根据权利要求1所述的一种聚合型IP索引的建立和应用方法,其特征在于,步骤S4具体包括:
步骤S41、输入待查IP地址数据,查找该待查IP地址数据所在的时间段,并将该待查IP地址数据转换为对应主机字节序的整数;
步骤S42、根据该待查IP地址数据转换为对应主机字节序的整数的大小,定位到具体的分片数组,并读取该分片数组的分片序号;
步骤S43、根据该分片序号内分片数组的映射倍数,确定该待查IP地址数据所在的位图偏移是否为“1”;
步骤S44、若为1,则进入所在时段的更小时空索引中,最终定该待查IP地址数据出现在哪些时段;若为0,则该待查IP地址数据在该时段中不存在。
8.根据权利要求1或6所述的一种聚合型IP索引的建立和应用方法,其特征在于,使用LZ4压缩算法,对聚合后的索引中的每个分片数组进行压缩处理,按照每个分片数组进行整体的存储和读取。
CN202111067029.8A 2021-09-13 2021-09-13 一种聚合型ip索引的建立和应用方法 Active CN113515527B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111067029.8A CN113515527B (zh) 2021-09-13 2021-09-13 一种聚合型ip索引的建立和应用方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111067029.8A CN113515527B (zh) 2021-09-13 2021-09-13 一种聚合型ip索引的建立和应用方法

Publications (2)

Publication Number Publication Date
CN113515527A true CN113515527A (zh) 2021-10-19
CN113515527B CN113515527B (zh) 2021-12-07

Family

ID=78063292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111067029.8A Active CN113515527B (zh) 2021-09-13 2021-09-13 一种聚合型ip索引的建立和应用方法

Country Status (1)

Country Link
CN (1) CN113515527B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020172203A1 (en) * 2000-11-16 2002-11-21 Hongbin Ji Fast IP route lookup with 16/K and 16/Kc compressed data structures
US20080104276A1 (en) * 2006-10-25 2008-05-01 Arcsight, Inc. Real-Time Identification of an Asset Model and Categorization of an Asset to Assist in Computer Network Security
CN102571531A (zh) * 2010-12-16 2012-07-11 上海博达数据通信有限公司 一种访问控制列表的分类匹配方法
CN103678553A (zh) * 2013-12-06 2014-03-26 上海寰创通信科技股份有限公司 基于共享内存设计的无线终端数据库构建方法
CN104009984A (zh) * 2014-05-15 2014-08-27 清华大学 基于倒排列表的网流索引检索与压缩的方法
CN106599019A (zh) * 2016-10-21 2017-04-26 东莞市大易产业链服务有限公司 一种精确高效的ip地址定位方法
CN110442570A (zh) * 2019-06-06 2019-11-12 北京左江科技股份有限公司 一种BitMap高速模糊查找方法
CN112052010A (zh) * 2020-09-25 2020-12-08 中国直升机设计研究所 一种icd字节序自动转换方法
CN112764997A (zh) * 2021-01-28 2021-05-07 北京字节跳动网络技术有限公司 一种日志存储的方法、装置、计算机设备和存储介质
CN113220679A (zh) * 2021-04-29 2021-08-06 天津大学 面向多模态网络的混合型fib存储结构及其数据处理方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020172203A1 (en) * 2000-11-16 2002-11-21 Hongbin Ji Fast IP route lookup with 16/K and 16/Kc compressed data structures
US20080104276A1 (en) * 2006-10-25 2008-05-01 Arcsight, Inc. Real-Time Identification of an Asset Model and Categorization of an Asset to Assist in Computer Network Security
CN102571531A (zh) * 2010-12-16 2012-07-11 上海博达数据通信有限公司 一种访问控制列表的分类匹配方法
CN103678553A (zh) * 2013-12-06 2014-03-26 上海寰创通信科技股份有限公司 基于共享内存设计的无线终端数据库构建方法
CN104009984A (zh) * 2014-05-15 2014-08-27 清华大学 基于倒排列表的网流索引检索与压缩的方法
CN106599019A (zh) * 2016-10-21 2017-04-26 东莞市大易产业链服务有限公司 一种精确高效的ip地址定位方法
CN110442570A (zh) * 2019-06-06 2019-11-12 北京左江科技股份有限公司 一种BitMap高速模糊查找方法
CN112052010A (zh) * 2020-09-25 2020-12-08 中国直升机设计研究所 一种icd字节序自动转换方法
CN112764997A (zh) * 2021-01-28 2021-05-07 北京字节跳动网络技术有限公司 一种日志存储的方法、装置、计算机设备和存储介质
CN113220679A (zh) * 2021-04-29 2021-08-06 天津大学 面向多模态网络的混合型fib存储结构及其数据处理方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
PRADEEP KUMAR GAUTAM 等: "Extensible processor speeds up IP lookup", 《2012 18TH IEEE INTERNATIONAL CONFERENCE ON NETWORKS (ICON)》 *
熊帅: "IP地址查找和数据包分类算法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *
闫锟: "基于Trie的高性能IP查找算法研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *
黄昆 等: "一种基于偏移寻址的存储高效IP地址查找算法", 《信息技术快报》 *

Also Published As

Publication number Publication date
CN113515527B (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
CN111125089B (zh) 时序数据存储方法、装置、服务器及存储介质
US11036799B2 (en) Low RAM space, high-throughput persistent key value store using secondary memory
TWI600305B (zh) 用於壓縮經由網路所接收之資料的方法及設備
CN103488709B (zh) 一种索引建立方法及系统、检索方法及系统
CN104346357B (zh) 一种嵌入式终端的文件存取方法及系统
US6751627B2 (en) Method and apparatus to facilitate accessing data in network management protocol tables
US7636731B2 (en) Approximating a database statistic
CN112953550B (zh) 数据压缩的方法、电子设备及存储介质
CN103714134A (zh) 一种网络流量数据索引方法及系统
US11625412B2 (en) Storing data items and identifying stored data items
CN106777387A (zh) 一种基于HBase的物联网大数据存取方法
CN110413571A (zh) 基于MongoDB大规模遥感影像数据分布式存储方法
CN101692231B (zh) 一种适合空间查询的遥感影像分块排序存储方法
CN106095850A (zh) 一种数据处理方法及设备
CN113515527B (zh) 一种聚合型ip索引的建立和应用方法
CN104424189A (zh) 基于云平台的定位解算方法和系统
CN106909623B (zh) 一种支持高效海量数据分析和检索的数据装置及数据存储方法
CN102693315A (zh) 一种基于共享内存映射的url去重方法及装置
CN115454353B (zh) 一种面向空间应用数据的高速写入及查询方法
CN110851758A (zh) 一种网页访客数量统计方法及装置
US8988258B2 (en) Hardware compression using common portions of data
CN116028572A (zh) 通信业务数据的处理方法、装置和计算机存储介质
CN112650756A (zh) 一种基于时序数据的时间投影的索引方法及系统
CN110825940A (zh) 网络数据包存储和查询方法
CN110990394A (zh) 分布式面向列数据库表的行数统计方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant