KR20220060842A - 네트워크 패킷 분석 기반의 대상파일 검출 장치 및 방법 - Google Patents
네트워크 패킷 분석 기반의 대상파일 검출 장치 및 방법 Download PDFInfo
- Publication number
- KR20220060842A KR20220060842A KR1020200146907A KR20200146907A KR20220060842A KR 20220060842 A KR20220060842 A KR 20220060842A KR 1020200146907 A KR1020200146907 A KR 1020200146907A KR 20200146907 A KR20200146907 A KR 20200146907A KR 20220060842 A KR20220060842 A KR 20220060842A
- Authority
- KR
- South Korea
- Prior art keywords
- chunk
- target file
- packet
- detection target
- file
- Prior art date
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 139
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000008569 process Effects 0.000 description 14
- 230000006854 communication Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/36—Flow control; Congestion control by determining packet size, e.g. maximum transfer unit [MTU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/144—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1748—De-duplication implemented within the file system, e.g. based on file segments
- G06F16/1752—De-duplication implemented within the file system, e.g. based on file segments based on file chunks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/43—Assembling or disassembling of packets, e.g. segmentation and reassembly [SAR]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/27—Evaluation or update of window size, e.g. using information derived from acknowledged [ACK] packets
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
도 2는 도 1의 대상파일 검출 장치의 시스템 구성을 설명하는 도면이다.
도 3은 도 1의 대상파일 검출 장치의 기능적 구성을 설명하는 도면이다.
도 4는 본 발명에 따른 네트워크 패킷 분석 기반의 대상파일 검출 과정을 설명하는 순서도이다.
도 5는 본 발명에 따른 대상파일 검출을 위한 동적 청킹 동작을 설명하는 도면이다.
도 6은 본 발명에 따른 네트워크 패킷 분석 기반의 대상파일 검출 과정을 설명하는 도면이다.
110: 사용자 단말 130: 대상파일 검출 장치
150: 데이터베이스
210: 프로세서 230: 메모리
250: 사용자 입출력부 270: 네트워크 입출력부
310: 역인덱싱 데이터베이스부 320: 네트워크 패킷 수신부
330: 패킷 청크 처리부 340: 청크 질의부
350: 파일코드 결정부 360: 제어부
510: 검출대상파일 520: 파일 청크
530: 네트워크 패킷 540: 패킷 청크
610: 역 인덱스 청크 DB
Claims (15)
- 검출대상파일에 관해 청킹 연산을 수행하여 적어도 하나의 파일 청크를 생성하고, 상기 적어도 하나의 파일 청크 각각을 검출대상 파일코드로서 역인덱싱하는 역인덱싱 데이터베이스부;
네트워크 패킷을 수신하는 네트워크 패킷 수신부;
상기 네트워크 패킷에 관해 청킹 연산을 수행하여 적어도 하나의 패킷 청크를 생성하는 패킷 청크 처리부;
상기 적어도 하나의 패킷 청크 각각에 관한 패킷 청크 질의어를 생성하고 상기 패킷 청크 질의어를 상기 역인덱싱 데이터베이스부에 제공하여 상기 검출대상 파일코드를 수신하는 청크 질의부; 및
상기 수신된 검출대상 파일코드를 기초로 상기 네트워크 패킷에 있는 가장 가능성 높은 검출대상 파일코드를 결정하는 파일코드 결정부를 포함하는 네트워크 패킷 분석 기반의 대상파일 검출 장치.
- 제1항에 있어서, 상기 역인덱싱 데이터베이스부는
상기 검출대상파일에 관해 AE 청킹(Asymmetric Extremum Chunking)을 수행하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 장치.
- 제2항에 있어서, 상기 역인덱싱 데이터베이스부는
상기 검출대상파일의 로컬 범위에서 검출된 극값과 지정 윈도우 사이즈를 기준으로 문자열을 청킹하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 장치.
- 제3항에 있어서, 상기 역인덱싱 데이터베이스부는
상기 윈도우 사이즈 내에 신규 극값이 검출되지 않는 경우에는 해당 파일 청크를 생성하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 장치.
- 제4항에 있어서, 상기 역인덱싱 데이터베이스부는
상기 윈도우 사이즈 내에 신규 극값이 검출되는 경우에는 상기 해당 파일 청크의 생성을 보류하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 장치.
- 제1항에 있어서, 상기 역인덱싱 데이터베이스부는
상기 적어도 하나의 파일 청크 각각에 관한 청크 비트맵을 생성하고 상기 청크 비트맵을 상기 검출대상 파일코드와 연관 저장하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 장치.
- 제1항에 있어서, 상기 패킷 청크 처리부는
상기 네트워크 패킷의 오류 유무에 관계없이 지속적으로 수신되는 일련의 네트워크 패킷을 독립적으로 처리하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 장치.
- 제7항에 있어서, 상기 패킷 청크 처리부는
상기 일련의 네트워크 패킷 중 특정 네트워크 패킷에 오류가 특정 기준 이상이면 상기 특정 네트워크 패킷의 검출대상 파일코드를 인접 네트워크 패킷의 인접 검출대상 파일코드를 기초로 추정하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 장치.
- 제1항에 있어서, 상기 청크 질의부는
상기 적어도 하나의 패킷 청크 각각에 관한 패킷 청크 비트맵을 생성하고 상기 패킷 청크 비트맵을 기초로 상기 검출대상 파일코드를 수신하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 장치.
- 제1항에 있어서, 상기 파일코드 결정부는
상기 적어도 하나의 패킷 청크 각각의 검출대상 파일코드에서 가장 빈도수가 높은 검출대상 파일코드를 상기 가장 가능성 높은 검출대상 파일코드로서 결정하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 장치.
- 제10항에 있어서, 상기 파일코드 결정부는
상기 가장 빈도수가 높은 검출대상 파일코드가 과반 이상인 경우에는 상기 가장 가능성 높은 검출대상 파일코드를 결정하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 장치.
- 제10항에 있어서, 상기 파일코드 결정부는
상기 가장 빈도수가 높은 검출대상 파일코드가 과반 미만인 경우에는 인접 네트워크 패킷을 함께 고려하여 상기 가장 가능성 높은 검출대상 파일코드를 결정하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 장치.
- 검출대상파일에 관해 청킹 연산을 수행하여 적어도 하나의 파일 청크를 생성하고, 상기 적어도 하나의 파일 청크 각각을 검출대상 파일코드로서 역인덱싱하는 단계;
네트워크 패킷을 수신하는 단계;
상기 네트워크 패킷에 관해 청킹 연산을 수행하여 적어도 하나의 패킷 청크를 생성하는 단계;
상기 적어도 하나의 패킷 청크 각각에 관한 패킷 청크 질의어를 생성하고 상기 패킷 청크 질의어를 상기 역인덱싱 데이터베이스부에 제공하여 상기 검출대상 파일코드를 수신하는 단계; 및
상기 수신된 검출대상 파일코드를 기초로 상기 네트워크 패킷에 있는 가장 가능성 높은 검출대상 파일코드를 결정하는 단계를 포함하는 네트워크 패킷 분석 기반의 대상파일 검출 방법.
- 제13항에 있어서, 상기 역인덱싱하는 단계는
상기 적어도 하나의 파일 청크 각각에 관한 청크 비트맵을 생성하고 상기 청크 비트맵을 상기 검출대상 파일코드와 연관 저장하는 단계를 포함하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 방법.
- 제14항에 있어서, 상기 검출대상 파일코드를 수신하는 단계는
상기 적어도 하나의 패킷 청크 각각에 관한 패킷 청크 비트맵을 생성하고 상기 패킷 청크 비트맵을 기초로 상기 검출대상 파일코드를 수신하는 단계를 포함하는 것을 특징으로 하는 네트워크 패킷 분석 기반의 대상파일 검출 방법.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200146907A KR102447130B1 (ko) | 2020-11-05 | 2020-11-05 | 네트워크 패킷 분석 기반의 대상파일 검출 장치 및 방법 |
PCT/KR2021/009516 WO2022097881A1 (ko) | 2020-11-05 | 2021-07-22 | 네트워크 패킷 분석 기반의 대상파일 검출 장치 및 방법 |
US17/623,081 US12007949B2 (en) | 2020-11-05 | 2021-07-22 | Apparatus and method for detecting target file based on network packet analysis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200146907A KR102447130B1 (ko) | 2020-11-05 | 2020-11-05 | 네트워크 패킷 분석 기반의 대상파일 검출 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220060842A true KR20220060842A (ko) | 2022-05-12 |
KR102447130B1 KR102447130B1 (ko) | 2022-09-26 |
Family
ID=81458052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200146907A KR102447130B1 (ko) | 2020-11-05 | 2020-11-05 | 네트워크 패킷 분석 기반의 대상파일 검출 장치 및 방법 |
Country Status (3)
Country | Link |
---|---|
US (1) | US12007949B2 (ko) |
KR (1) | KR102447130B1 (ko) |
WO (1) | WO2022097881A1 (ko) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101465891B1 (ko) | 2013-07-30 | 2014-11-26 | 고려대학교 산학협력단 | 무선 네트워크에서 트래픽 중복 제거 방법 및 장치 |
KR20190049244A (ko) * | 2017-11-01 | 2019-05-09 | 국민대학교산학협력단 | 경량 복잡도 기반의 패킷레벨 중복 제거 장치 및 방법, 이를 저장하는 기록매체 |
KR20190112918A (ko) * | 2018-03-27 | 2019-10-08 | 계명대학교 산학협력단 | 고성능 보안 라우터를 지원하기 위한 통합 패킷 분류 방법 및 시스템 |
KR20200014979A (ko) * | 2018-08-02 | 2020-02-12 | 주식회사 누리랩 | 역 색인 구성 방법, 역 색인을 이용한 유사 데이터 검색 방법 및 장치 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6363429B1 (en) * | 1999-04-20 | 2002-03-26 | 3Com Corporation | Method and system for automatic determination of priority data streams on computer networks |
US7061874B2 (en) * | 2001-01-26 | 2006-06-13 | Broadcom Corporation | Method, system and computer program product for classifying packet flows with a bit mask |
US7784094B2 (en) * | 2005-06-30 | 2010-08-24 | Intel Corporation | Stateful packet content matching mechanisms |
US7747921B2 (en) * | 2005-08-05 | 2010-06-29 | Sony Corporation | Systems and methods for transmitting data over lossy networks |
US7669023B2 (en) * | 2007-07-10 | 2010-02-23 | Hitachi, Ltd. | Power efficient storage with data de-duplication |
US8472449B2 (en) * | 2010-03-02 | 2013-06-25 | Intrusion, Inc. | Packet file system |
US8909657B2 (en) * | 2011-01-14 | 2014-12-09 | Apple Inc. | Content based file chunking |
CN103281213B (zh) * | 2013-04-18 | 2016-04-06 | 西安交通大学 | 一种网络流量内容提取和分析检索方法 |
US10073971B2 (en) | 2013-06-28 | 2018-09-11 | Microsoft Technology Licensing, Llc | Traffic processing for network performance and security |
KR101588976B1 (ko) * | 2014-10-22 | 2016-01-27 | 삼성에스디에스 주식회사 | 파일 송신 장치 및 방법 |
US11063694B2 (en) * | 2016-09-09 | 2021-07-13 | École De Technologie Superieure | Checksum-filtered decoding, checksum-aided forward error correction of data packets, forward error correction of data using bit erasure channels and sub-symbol level decoding for erroneous fountain codes |
KR20180099136A (ko) * | 2017-02-28 | 2018-09-05 | 한국전자통신연구원 | 네트워크 패킷의 중복 데이터 제거 장치 및 그 방법, 중복제거파일 복원 장치 |
US11841768B2 (en) * | 2020-04-01 | 2023-12-12 | Datto, Inc. | Multi-client backup deduplication apparatuses, methods and systems |
GB202007055D0 (en) * | 2020-05-13 | 2020-06-24 | 1E Ltd | File comparison method |
-
2020
- 2020-11-05 KR KR1020200146907A patent/KR102447130B1/ko active IP Right Grant
-
2021
- 2021-07-22 US US17/623,081 patent/US12007949B2/en active Active
- 2021-07-22 WO PCT/KR2021/009516 patent/WO2022097881A1/ko active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101465891B1 (ko) | 2013-07-30 | 2014-11-26 | 고려대학교 산학협력단 | 무선 네트워크에서 트래픽 중복 제거 방법 및 장치 |
KR20190049244A (ko) * | 2017-11-01 | 2019-05-09 | 국민대학교산학협력단 | 경량 복잡도 기반의 패킷레벨 중복 제거 장치 및 방법, 이를 저장하는 기록매체 |
KR20190112918A (ko) * | 2018-03-27 | 2019-10-08 | 계명대학교 산학협력단 | 고성능 보안 라우터를 지원하기 위한 통합 패킷 분류 방법 및 시스템 |
KR20200014979A (ko) * | 2018-08-02 | 2020-02-12 | 주식회사 누리랩 | 역 색인 구성 방법, 역 색인을 이용한 유사 데이터 검색 방법 및 장치 |
Non-Patent Citations (1)
Title |
---|
YUCHENG ZHANG 등, 'AE: An Asymmetric Extremum Content Defined Chunking Algorithm for Fast and Bandwidth-Efficient Data Deduplication', Hong Kong: IEEE, 2015, pp. 1337-1345 1부.* * |
Also Published As
Publication number | Publication date |
---|---|
US12007949B2 (en) | 2024-06-11 |
WO2022097881A1 (ko) | 2022-05-12 |
US20220365909A1 (en) | 2022-11-17 |
KR102447130B1 (ko) | 2022-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pal et al. | Detecting file fragmentation point using sequential hypothesis testing | |
TWI729472B (zh) | 特徵詞的確定方法、裝置和伺服器 | |
EP2304649B1 (en) | Frame based video matching | |
WO2021088385A1 (zh) | 一种在线日志解析方法、系统及其电子终端设备 | |
US9053121B2 (en) | Real-time identification of data candidates for classification based compression | |
Lu et al. | Frequency based chunking for data de-duplication | |
US8407192B2 (en) | Detecting a file fragmentation point for reconstructing fragmented files using sequential hypothesis testing | |
US20130117246A1 (en) | Methods of processing text data | |
US11526608B2 (en) | Method and system for determining affiliation of software to software families | |
CN113612749A (zh) | 一种面向入侵行为的溯源数据聚类方法及装置 | |
US20220279045A1 (en) | Global iterative clustering algorithm to model entities' behaviors and detect anomalies | |
US20210336973A1 (en) | Method and system for detecting malicious or suspicious activity by baselining host behavior | |
Ding et al. | {ELISE}: A storage efficient logging system powered by redundancy reduction and representation learning | |
WO2015067145A1 (zh) | 应用识别方法与装置 | |
US9213759B2 (en) | System, apparatus, and method for executing a query including boolean and conditional expressions | |
CN111737398A (zh) | 文本中的敏感词的检索方法、装置、电子设备及存储介质 | |
KR102559398B1 (ko) | 인공지능을 이용한 보안관제 침입탐지 알람 처리 장치 및 방법 | |
KR102289408B1 (ko) | 해시 코드 기반의 검색 장치 및 검색 방법 | |
CN115062144A (zh) | 一种基于知识库和集成学习的日志异常检测方法与系统 | |
KR102447130B1 (ko) | 네트워크 패킷 분석 기반의 대상파일 검출 장치 및 방법 | |
KR102289395B1 (ko) | 자카드 모델 기반의 문서 검색 장치 및 방법 | |
CN112612832A (zh) | 节点分析方法、装置、设备及存储介质 | |
US10223529B2 (en) | Indexing apparatus and method for search of security monitoring data | |
KR102269652B1 (ko) | 보안관제 데이터 분석을 위한 머신러닝 기반의 학습 벡터 생성 장치 및 방법 | |
US20250068729A1 (en) | Ultra-light clustering-based generative intrusion detection device and method, and computer-readable recording medium including instructions to perform method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20201105 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220421 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20220818 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220921 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20220922 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |