KR102395097B1 - 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템 - Google Patents

악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템 Download PDF

Info

Publication number
KR102395097B1
KR102395097B1 KR1020220020070A KR20220020070A KR102395097B1 KR 102395097 B1 KR102395097 B1 KR 102395097B1 KR 1020220020070 A KR1020220020070 A KR 1020220020070A KR 20220020070 A KR20220020070 A KR 20220020070A KR 102395097 B1 KR102395097 B1 KR 102395097B1
Authority
KR
South Korea
Prior art keywords
data
backup
feature vector
unit
module
Prior art date
Application number
KR1020220020070A
Other languages
English (en)
Inventor
김승용
Original Assignee
케이디시스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 케이디시스 주식회사 filed Critical 케이디시스 주식회사
Priority to KR1020220020070A priority Critical patent/KR102395097B1/ko
Application granted granted Critical
Publication of KR102395097B1 publication Critical patent/KR102395097B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Mathematical Optimization (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Virology (AREA)
  • Algebra (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 물리, 가상, 워크스테이션 및 클라우드가 혼재된 IT환경에서 운영체제, 데이터, 애플리케이션의 백업, 데이터 복구 및 재해 복구 등과 같은 통합 데이터 보호 솔루션 서비스를 제공하는 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템에 관한 것이다.

Description

악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템 {Data backup system}
본 발명은 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템에 관한 것으로, 더욱 상세하게는 물리, 가상, 워크스테이션 및 클라우드가 혼재된 IT환경에서 운영체제, 데이터, 애플리케이션의 백업, 데이터 복구 및 재해 복구 등과 같은 통합 데이터 보호 솔루션 서비스를 제공하고, 데이터의 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템에 관한 것이다.
기관, 기업, 개인 등을 위한 단말에서는 데이터 유실 또는 손상에 의해 발생하는 공백이나 마비를 최소화하기 위해 기본적으로 시스템 또는 데이터 백업 시스템을 도입하여 운영하고 있다.
데이터 백업 시스템이라 함은, 사용자의 단말기 상에서 생성 및 처리된 데이터 정보를 별도의 백업 공간에 사본화함을 지칭한다. 이러한 데이터 백업 시스템은, 사용자에 의해 생성된 원본 데이터를 입력 받아, 원본 데이터가 저장된 단말기의 저장 공간 내의 백업 영역에 이를 저장하거나, 단말기 외부에 별도의 백업 공간을 갖는 시스템을 설치하여 데이터 파일을 백업하여 기능을 수행하였다. 기존의 데이터 파일 백업 시스템은, 일정 주기 마다 백업을 하거나, 사용자의 요청에 의하여 백업을 수행하였다. 또한, 다수의 단말기에 접속된 데이터 파일 백업 시스템의 경우에는, 각 단말기로부터의 요청에 의하여 수시로 또는 일정 주기로 원본 데이터를 백업 저장 공간에 저장하였다.
즉, 각 단말 상의 상주하는 프로그램은 사용자의 지정일, 일정 주기마다 또는 데이터 용량이 초과하면 시스템 백업 및/또는 데이터 백업 알고리즘을 이용하여 현재의 시스템 상태 및 데이터를 백업함으로써, 단말 상에서 발생하는 각종 이벤트인 단말 상의 각 프로그램 상의 비호환성 등과 같은 고장 이벤트, 외부로부터 바이러스 등의 불법적인 침입에 따른 사고 이벤트, 원하지 않은 데이터의 삭제 등에 의한 데이터 복구 이벤트 등으로부터 시스템 및 데이터를 보호하고 있다.
하지만, 종래의 데이터 백업 시스템은, 단일의 백업 데이터만을 생성하여 저장하는 바, 해당 백업 데이터가 손상된 경우에 이로부터 본래의 데이터를 복구할 수 없다는 문제점이 있다.
한편, 전술한 배경 기술은 발명자가 본 발명의 도출을 위해 보유하고 있었거나, 본 발명의 도출 과정에서 습득한 기술 정보로서, 반드시 본 발명의 출원 전에 일반 공중에게 공개된 공지기술이라 할 수는 없다.
한국등록특허 제10-2101591호
본 발명의 일측면은 물리, 가상, 워크스테이션 및 클라우드가 혼재된 IT환경에서 운영체제, 데이터, 애플리케이션의 백업, 데이터 복구 및 재해 복구 등과 같은 통합 데이터 보호 솔루션 서비스를 제공하고, 데이터의 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템을 제공한다.
본 발명의 기술적 과제는 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일 실시예에 따른 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템은, 사용자 단말과 통신하며, 상기 사용자 단말에 저장된 데이터 중 백업이 요구되는 백업 대상 데이터를 추출하는 백업 어플라이언스를 포함한다.
상기 백업 어플라이언스는,
미리 설정된 이미지 백업 시간 주기마다 스냅샷 정보를 생성하는 전체 백업부;
이미지 백업 시간 주기 사이에 설정된 증분 백업 주기에서 상기 사용자 단말에 저장된 데이터의 변경이 감지된 경우 변경된 데이터의 백업 여부를 결정하는 데이터 관리부;
상기 데이터 관리부에 의해 선택된 백업이 요구되는 데이터만 선택적으로 백업하는 선택적 백업부; 및
이미지 백업 시간 주기마다 생성되는 스냅샷 정보를 비교하여 중복되는 데이터를 제거하는 중복 데이터 제거부;를 포함하고,
상기 데이터 관리부는,
변경된 데이터의 주소를 나타내는 제1 특징벡터, 변경된 데이터와 상기 사용자 단말에 저장된 데이터와의 유사도를 나타내는 제2 특징벡터 및 변경된 데이터의 데이터 특징을 나타내는 제3 특징벡터를 생성하는 특징벡터 생성부;
생성된 상기 제1 특징 벡터, 상기 제2 특징 벡터 및 상기 제3 특징 벡터에 가중치를 부여하는 가중치 설정부; 및
가중치가 반영된 상기 제1 특징 벡터, 상기 제2 특징 벡터 및 상기 제3 특징 벡터에 기초하여 증분 백업 주기에서 변경된 데이터의 백업여부를 결정하는 백업 판단부를 포함하고,
상기 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템은,
블록체인 네트워크를 이용하여 상기 백업 어플라이언스로부터 수신된 백업 대상 데이터를 관리하는 데이터 관리 서버를 더 포함하고,
상기 데이터 관리 서버는,
수신된 상기 백업 대상 데이터를 블록체인 네트워크를 구성하는 복수의 노드에 분산 저장하고, 분산 저장된 백업 대상 데이터의 트랜잭션을 암호화하여 관리한다.
일 실시예에서, 상기 데이터 관리 서버는, 빅데이터 분석 기반의 비정상 데이터 도출 시스템을 이용하여 수신된 데이터에 악성코드가 포함되어 있는지를 자동으로 판단할 수 있는 악성코드 판단부;를 포함하고, 상기 악성코드 판단부는, 수집 대상 데이터 소스 모듈; 수집 대상 키워드 및 수집 대상 기간 중 적어도 어느 하나의 수집 기준을 설정하는 수집 관리 모듈; 상기 수집 관리 모듈로부터 설정 받은 데이터 수집 기준에 따라 해당 데이터 소스 모듈로부터 빅데이터를 수집하여 데이터베이스 모듈에 저장하는 데이터 수집 모듈; 데이터베이스 모듈에 저장된 빅데이터의 형태소를 분석하여 형태소 별로구분하고 형태소 분석 데이터를 생성하는 형태소 분석 모듈; 및 형태소 분석 데이터를 분산 병렬 처리 기반의 통계분석 알고리즘으로 처리하여 통계값을 산출하고 통계값에 따라 악성코드를 출력하는 데이터 분석 모듈;을 포함하고, 상기 데이터 수집 모듈은, 이미지, 동영상, 음성, 센서, GPS, GIS, M2M 데이터 중 적어도 어느 하나의 비정형 데이터를 포함하는 빅데이터를 수집하는 것을 특징으로 하는, 악성코드 포함 여부를 자동으로 판단할 수 있다.
상술한 본 발명의 일측면에 따르면, 물리, 가상, 워크스테이션 및 클라우드가 혼재된 IT환경에서 운영체제, 데이터, 애플리케이션의 백업, 데이터 복구 및 재해 복구 등과 같은 통합 데이터 보호 솔루션 서비스를 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템의 개략적인 구성이 도시된 도면이다.
도 2 및 도 3은 도 1의 백업 어플라이언스의 구체적인 구성이 도시된 도면이다.
도 4 및 도 5는 본 발명에 따른 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템을 이용한 데이터 백업의 구체적인 일 예가 도시된 도면이다.
도 6은 본 발명에 따른 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템의 악성코드 판단부를 나타낸 도면이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예와 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
이하, 도면들을 참조하여 본 발명의 바람직한 실시예들을 보다 상세하게 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템의 개략적인 구성이 도시된 도면이다.
본 발명에 따른 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템은 물리, 가상, 워크스테이션 및 클라우드가 혼재된 IT환경에서 운영체제, 데이터, 애플리케이션의 백업, 데이터 복구 및 재해 복구 등과 같은 통합 데이터 보호 솔루션 서비스를 제공할 수 있다.
이를 위해, 본 발명에 따른 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템(1000)은 백업 어플라이언스(200) 및 데이터 관리 서버(300)를 포함한다.
백업 어플라이언스(200)는 사용자 단말(100)이 배치된 위치에 설치되어 사용자 단말(100)과 유선 또는 무선 통신으로 연결되어 사용자 단말(100)에 저장된 데이터를 주기적으로 백업할 수 있다.
특히, 본 발명에 따른 백업 어플라이언스(200)는 사용자 단말(100)과 통신하며, 상기 사용자 단말에 저장된 데이터 중 백업이 요구되는 백업 대상 데이터를 추출한다.
도 2 및 도 3은 이러한 백업 어플라이언스의 구체적인 구성이 도시된 도면이다.
도시된 바와 같이, 백업 어플라이언스(200)는, 전체 백업부(210), 데이터 관리부(220), 선택적 백업부(230) 및 중복 데이터 제거부(240)를 포함한다.
전체 백업부(210)는 미리 설정된 이미지 백업 시간 주기마다 스냅샷 정보를 생성한다. 스냅샷 정보는 주어진 시간에 데이터베이스 상태를 기록하기 위한 데이터베이스의 질의, 임시 자료를 다루는 수단으로서 또는 특정 시간에 자료의 백업을 수행하기 위해서 사용된다.
예컨대, 전체 백업부(210)는 일주일 단위로 스냅샷 정보를 생성함으로써, 사용자 단말(100)에 저장된 전체 데이터를 일주일마다 전체 백업할 수 있다.
데이터 관리부(220)는 이미지 백업 시간 주기 사이에 설정된 증분 백업 주기에서 상기 사용자 단말에 저장된 데이터의 변경이 감지된 경우 변경된 데이터의 백업 여부를 결정한다.
후술하겠지만, 본 발명에 따른 백업 어플라이언스(200)는 미리 정해진 주기마다 전체 백업을 수행하면서, 전체 백업 주기 사이에 발생되는 데이터 변경 사항을 추가적으로 백업해 둔 후, 다음 번 전체 백업 시간에 이를 반영하는 증분 백업 방식을 이용하여 사용자 단말(100)에 저장된 데이터를 백업한다.
이때, 본 발명에 따른 데이터 관리부(220)는 전체 백업 주기 사이에 발생되는 데이터 변경 사항 중 백업이 필요할 것으로 판단되는 데이터와, 백업이 필요 없을 것으로 판단되는 데이터를 구분하고, 구분된 결과에 따라 다음번 전체 백업 시 특정 데이터는 백업에 포함되도록 하면서, 특정 데이터는 백업에 포함되지 않도록 하는 것을 특징으로 한다.
이를 위해, 데이터 관리부는, 특징벡터 생성부(231), 가중치 설정부(232) 및 백업 판단부(233)를 포함한다.
특징벡터 생성부(231)는 변경된 데이터의 주소(위치)를 나타내는 제1 특징벡터, 변경된 데이터와 상기 사용자 단말에 저장된 데이터와의 유사도를 나타내는 제2 특징벡터 및 변경된 데이터가 발생된 사용자 단말의 특징을 나타내는 제3 특징벡터를 생성한다.
여기서, 제2 특징 벡터는 변경된 데이터와 상기 사용자 단말에 저장된 데이터와의 유사도를 나타내는 것으로, 예컨대, 사용자가 어느 하나의 파일을 수정하고자 해당 파일의 복사본을 생성한 경우, 두 문서는 실질적으로 동일하나 복사된 문서는 참조용으로만 생성된 것이므로 굳이 백업에 포함되지 않더라도 상관없는 데이터이다. 따라서, 특징벡터 생성부(231)는 변경된 데이터와 유사한 데이터가 사용자 단말에 이미 저장되어있는지 여부를 나타내는 제2 특징벡터를 생성함으로써 변경된 문서의 중요도를 판단할 수 있는 척도로 활용할 수 있도록 한다.
가중치 설정부(232)는 생성된 상기 제1 특징 벡터, 상기 제2 특징 벡터 및 상기 제3 특징 벡터에 가중치를 부여한다.
예컨대, 가중치 설정부(232)는 제1 특징 벡터를 분석하여 기존의 데이터가 휴지통으로 이동된 것으로 판단되면 제1 특징 벡터에 낮은 가중치를 부여할 수 있다. 반면, 가중치 설정부(232)는 제1 특징 벡터를 분석하여 기존의 데이터가 중요 폴더로 설정된 폴더로 이동된 것으로 판단되면 제1 특징 벡터에 높은 가중치를 부여할 수 있다. 이와 같은 방법으로, 가중치 설정부(232)는 특징벡터별로 가중치를 부여할 수 있다.
백업 판단부(233)는 가중치가 반영된 상기 제1 특징 벡터, 상기 제2 특징 벡터 및 상기 제3 특징 벡터에 기초하여 증분 백업 주기에서 변경된 데이터의 백업여부를 결정한다.
백업 판단부(233)는 제1 변경 데이터의 특징벡터들에 기초하여 백업에 불필요한 데이터인 것으로 판단되면, 제1 변경 데이터를 삭제할 수 있다. 반면, 백업 판단부(233)는 제2 변경 데이터의 특징벡터들에 기초하여 백업에 필요한 데이터인 것으로 판단되면, 제2 변경 데이터에 대한 정보를 선택적 백업부(230)로 제공할 수 있다.
선택적 백업부(230)는 상기 데이터 관리부에 의해 선택된 백업이 요구되는 데이터만 선택적으로 백업한다.
이에 따라, 선택적 백업부(230)는 도 4에 도시된 바와 같이 증분 백업 주기에 발생된 모든 변경 데이터가 백업이 요구되는 것으로 판단되면 다음 번 전체 백업 시 모든 변경 데이터를 백업에 반영할 수 있다.
반면, 선택적 백업부(230)는 도 5에 도시된 바와 같이 특정 증분 백업 주기에 발생된 어느 하나의 변경 데이터가 백업이 불필요한 데이터인 것으로 판단되면(도면의 빗금 영역에 해당) 해당 변경 데이터는 다음 번 전체 백업에 미포함시킨 스냅샷 정보가 생성되도록 할 수 있다.
중복 데이터 제거부(240)는 이미지 백업 시간 주기마다 생성되는 스냅샷 정보를 비교하여 중복되는 데이터를 제거한다.
이와 같이, 본 발명에 따른 백업 어플라이언스(200)는 이미지 백업, 영구 증분 백업, 선택적 백업 기법을 이용하여 사용자 단말(100)에 저장된 데이터의 효율적인 백업 서비스를 제공할 수 있다.
이 외에도, 백업 어플라이언스(200)는 이기종 서버 복원, 서버 이중화, 실시간 복제, 아카이빙, 테이프, 클라우드, 가상화를 위한 통합된 아키텍쳐를 제공하며, 후술하는 데이터 관리 서버(300)와 연동하여 백업 데이터의 이중화 서비스를 제공할 수 있다.
한편, 본 발명에 따른 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템(1000)은, 블록체인 네트워크를 이용하여 상기 백업 어플라이언스로부터 수신된 백업 대상 데이터를 관리하는 데이터 관리 서버(300)를 더 포함한다.
상기 데이터 관리 서버(300)는, 수신된 상기 백업 대상 데이터를 블록체인 네트워크를 구성하는 복수의 노드에 분산 저장하고, 분산 저장된 백업 대상 데이터를 해시 함수를 이용하여 암호화하여 관리한다.
데이터 관리 서버(300)는 암호화된 해시값을 블록체인 네트워크를 구성하는 모든 노드들에 분산 저장하고, 분산 저장된 복수의 해시값을 상호 비교하여 상기 트랜잭션 정보의 유효성을 검증하고, 유효성이 검증된 트랜잭션 정보가 포함된 블록을 생성하고, 생성된 새로운 블록을 기 생성된 블록체인에 결합한다.
일 실시예에서, 데이터 관리 서버(300)는, 데이터 수신 시점에 기초하여 데이터를 암호화하기 위한 개인 키 및 공개 키를 생성할 수 있다.
즉, 데이터 관리 서버(300)는 비대칭 암호화 방법을 통해 데이터를 암호화하기 위해 수학적으로 연결된 공개 키와 개인 키를 생성할 수 있다.
예컨대, 데이터 관리 서버(300)는 백업 어플라이언스(200)로부터 수신된 데이터의 수신 시점이 15시 37분 23초인 경우 시간 정보를 세 자리 단위의 수로 분할할 수 있다. 예컨대, 상술한 실시예의 경우에서는 수신된 시간이 15:37:27이므로, 데이터 관리 서버(300)는 시간 정보를 153/727로 분할할 수 있다.
이때, 데이터 관리 서버(300)는 153과 가장 가까운 소수인 151을 제1 소수로, 727과 가장 가까운 소수인 727을 제2 소수로 설정하고, 이를 개인 키로 설정할 수 있다.
데이터 관리 서버(300)는 생성된 두 개의 개인 키를 이용하여 공개 키를 생성할 수 있다. 이러한 개인 키-공개 키 생성 방법은 RSA 암호화 알고리즘을 이용한 것으로, RSA 암호화 알고리즘은 널리 공개된 기술이므로 구체적인 공개 키 생성 과정은 생략하기로 한다.
이러한 경우, 데이터 관리 서버(300)는 생성된 공개 키를 블록체인 네트워크를 통해 공표하여, 사용자 단말(100)들은 암호화된 데이터를 수신하게 되면 데이터 관리 서버(300)로부터 수신된 공개 키를 이용하여 복호화할 수 있다.
다른 실시예에서, 데이터 관리 서버(300)는 데이터의 형태가 이미지인 경우, 히스토그램을 이용하여 이미지 데이터를 암호화할 수 있다.
데이터 관리 서버(300)는 원본 이미지 데이터로부터 관심영역을 설정하고, 원본 이미지 데이터 및 관심영역의 히스토그램을 생성할 수 있다. 여기서, 데이터 관리 서버(300)는 미리 설정된 객체 추출 알고리즘을 이용하여 관심영역을 설정할 수 있으며, 원본 이미지로부터 사람, 특정 사물 등이 포함된 관심 영역을 설정할 수 있다.
이후, 데이터 관리 서버(300)는 원본 이미지 데이터에 대한 제1 히스토그램과, 관심영역에 대한 제2 히스토그램을 생성하고, 상기 제1 히스토그램을 분석하여 가장 빈도수가 높은 밝기값을 제1 변수로 설정하고, 상기 제2 히스토그램을 분석하여 가장 빈도수가 높은 밝기값을 제2 변수로 설정하며, 설정된 상기 제1 소수 및 상기 제2 소수를 이용하여 상기 개인 키 및 상기 공개 키를 생성한다.
이때, 암호화부(300)는 상기 제1 변수와 상기 제2 변수가 동일한 밝기값인 경우, 상기 제2 히스토그램에서 차순위 빈도수가 높은 밝기값을 제2 변수로 재설정하는 것을 특징으로 한다.
특히, 본 발명에 따른 데이터 관리 서버(300)는 암호화되는 이미지 데이터의 개수가 미리 정해진 개수만큼 누적 저장될 때까지 상기 데이터의 전송 과정을 보류하고 있다가, 암호화된 이미지 데이터의 개수가 미리 정해진 개수만큼 누적 저장된 것으로 확인되면, 누적 저장된 데이터 그룹의 특징을 나타내는 변수 데이터를 설정하고, 설정된 변수 데이터에 기초하여 상기 이미지 데이터를 암호화하는 것을 특징으로 한다.
이를 위해, 데이터 관리 서버(300)는 누적 저장된 수집 데이터를 데이터 그룹으로 묶어 전송할 데이터 그룹을 추출하고, 추출된 데이터 그룹의 특징에 따른 변수 데이터를 설정하며, 설정된 변수 데이터를 각각의 수집 데이터에 연결킨 변형 데이터를 생성하며, 생성된 변형 데이터를 해쉬 함수를 통해 해쉬 값으로 변환시켜 블록체인 네트워크로 등록한다.
즉, 사용자가 아닌 제3자가 이미지 데이터를 중간에서 획득하더라도, 이미지 데이터의 핵심적인 특징을 차지하는 관심영역 부분의 픽셀이 재배열되어 있어 원본 데이터의 확인이 어려우며, 개인 키 및 공개 키는 관심영역의 특징에 의해 매번 새롭게 생성되기 때문에 외부에서 개인 키 및 공개 키를 알아내기 어렵다는 장점이 있다.
몇몇 다른 실시예에서, 데이터 관리 서버(300)는 수집 대상 데이터 소스 모듈(3001), 수집 대상 키워드 및 수집 대상 기간 중 적어도 어느 하나의 수집 기준을 설정하는 수집 관리 모듈(3002); 수집 관리 모듈로부터 설정 받은 데이터 수집 기준에 따라 해당 데이터 소스 모듈로부터 빅데이터를 수집하여 데이터베이스 모듈에 저장하는 데이터 수집 모듈(3003); 데이터베이스 모듈에 저장된 빅데이터의 형태소를 분석하여 형태소 별로 구분하고 형태소 분석 데이터를 생성하는 형태소 분석 모듈(3004); 및 형태소 분석 데이터를 분산 병렬 처리 기반의 통계분석 알고리즘으로 처리하여 통계값을 산출하고 통계값에 따라 악성코드를 출력하는 데이터 분석 모듈(3005);을 포함하는 빅데이터 분석 기반의 비정상 데이터 도출 시스템(설명의 편의상 도면에는 도시하지 않음)을 이용하여 수신된 데이터에 악성코드가 포함되어 있는지를 자동으로 판단할 수 있다.
여기서, 데이터 수집부는 수신된 평가 데이터를 의미를 갖는 형태소별로 구분한 형태소 분석 데이터를 생성하고, 상기 형태소 분석 데이터를 저장하는 분산 파일 시스템; 상기 분산 파일 시스템에 존재하는 형태소 분석 데이터를 SQL(structured query language)을 기반으로 처리할 수 있도록 가상화 데이터베이스 인터페이스를 제공하는 데이터 처리부; 및 상기 데이터 처리부가 제공하는 가상화 데이터베이스 인터페이스를 통해 통계분석 알고리즘을 실행하여, 상기 형태소 분석 데이터로부터 연도별 출현빈도수(instance frequencies), 연도별 단어-단어 간 동시 출연 건수, 연도별 출현빈도수 및 연도별 단어-단어 간 동시 출현 건수로부터 가공된 값들 중 적어도 하나 이상을 산출하는 통계 분석부를 포함할 수 있다.
그리고, 상기 통계 분석부는, 상기 통계 분석부는 상기 연도별 출현건수(instance frequencies) 및 단어-단어간 동시 발생건수에 기초하여 단어 별 발생건수 증가율을 산출할 수 있다.
또한, 상기 통계 분석부는, 상기 연도별 출현건수(instance frequencies)를 연도별 문서수로 나누어 문서당 상기 단어들의 연도별 출현 빈도수를 표준화하여 상기 단어들에 대한 표준화된 단어 별 출현 빈도수 증가율을 산 출할 수 있다.
또한, 상기 통계 분석부는, 상기 단어-단어간 동시발생건수 매트릭스를 이용하여 단어 별 연결 정도 중심성 증가율을 산출하고, 상기 표준화된 단어 별 출현 빈도수 증가율 및 상기 연결 정도 중심성 증가율이 상위 일정 부분 이상인 단어 또는 하위 일정 부분 이하인 단어를 악성코드로 도출할 수 있다.
한편, 상기 데이터 수집 모듈(3003)은, 이미지, 동영상, 음성, 센서, GPS, GIS, M2M 데이터 중 적어도 어느 하나의 비정형 데이터를 포함하는 빅데이터를 수집할 수 있다.
이에 따라, 컴퓨터 장치는 상술한 바와 같은 구성을 포함하는 비정상 데이터 도출 시스템을 통한 빅데이터 분석을 통해 악성코드가 포함된 데이터를 사전에 필터링함으로써 백업 데이터의 보안성을 향상시킬 수 있다.
이와 같은, 본 발명에 따른 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템을 제공하는 기술은 애플리케이션으로 구현되거나 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.
상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거니와 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD 와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.
프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서는 실시예들을 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구범위에 기재된 본 발명의 사상 및 공간으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 사용자 단말
200: 백업 어플라이언스
300: 데이터 관리 서버

Claims (1)

  1. 사용자 단말과 통신하며, 상기 사용자 단말에 저장된 데이터 중 백업이 요구되는 백업 대상 데이터를 추출하는 백업 어플라이언스를 포함하는, 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템에 있어서,
    상기 백업 어플라이언스는,
    미리 설정된 이미지 백업 시간 주기마다 스냅샷 정보를 생성하는 전체 백업부;
    이미지 백업 시간 주기 사이에 설정된 증분 백업 주기에서 상기 사용자 단말에 저장된 데이터의 변경이 감지된 경우, 변경된 데이터의 백업 여부를 결정하는 데이터 관리부;
    상기 데이터 관리부에 의해 선택된 백업이 요구되는 데이터만 선택적으로 백업하는 선택적 백업부; 및
    이미지 백업 시간 주기마다 생성되는 스냅샷 정보를 비교하여 중복되는 데이터를 제거하는 중복 데이터 제거부;를 포함하고,
    상기 스냅샷 정보는,
    스냅샷 정보는 주어진 시간에 데이터베이스 상태를 기록하기 위한 데이터베이스의 질의, 임시 자료를 다루는 수단으로서 또는 특정 시간에 자료의 백업을 수행하기 위해서 사용되고,
    상기 데이터 관리부는,
    변경된 데이터의 주소를 나타내는 제1 특징벡터, 변경된 데이터와 상기 사용자 단말에 저장된 데이터와의 유사도를 나타내는 제2 특징벡터 및 변경된 데이터가 발생된 사용자 단말의 특징을 나타내는 제3 특징벡터를 생성하는 특징벡터 생성부;
    생성된 상기 제1 특징 벡터, 상기 제2 특징 벡터 및 상기 제3 특징 벡터에 가중치를 부여하는 가중치 설정부; 및
    가중치가 반영된 상기 제1 특징 벡터, 상기 제2 특징 벡터 및 상기 제3 특징 벡터에 기초하여 증분 백업 주기에서 변경된 데이터의 백업여부를 결정하는 백업 판단부를 포함하고,
    상기 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템은,
    블록체인 네트워크를 이용하여 상기 백업 어플라이언스로부터 수신된 백업 대상 데이터를 관리하는 데이터 관리 서버를 더 포함하고,
    상기 데이터 관리 서버는,
    수신된 상기 백업 대상 데이터를 블록체인 네트워크를 구성하는 복수의 노드에 분산 저장하고, 분산 저장된 백업 대상 데이터의 트랜잭션을 암호화하여 관리하고,
    상기 데이터 관리 서버는,
    빅데이터 분석 기반의 비정상 데이터 도출 시스템을 이용하여 수신된 데이터에 악성코드가 포함되어 있는지를 자동으로 판단할 수 있는 악성코드 판단부;를 포함하고,
    상기 악성코드 판단부는,
    수집 대상 데이터 소스 모듈;
    수집 대상 키워드 및 수집 대상 기간 중 적어도 어느 하나의 수집 기준을 설정하는 수집 관리 모듈;
    상기 수집 관리 모듈로부터 설정 받은 데이터 수집 기준에 따라 해당 데이터 소스 모듈로부터 빅데이터를 수집하여 데이터베이스 모듈에 저장하는 데이터 수집 모듈;
    데이터베이스 모듈에 저장된 빅데이터의 형태소를 분석하여 형태소 별로구분하고 형태소 분석 데이터를 생성하는 형태소 분석 모듈; 및
    형태소 분석 데이터를 분산 병렬 처리 기반의 통계분석 알고리즘으로 처리하여 통계값을 산출하고 통계값에 따라 악성코드를 출력하는 데이터 분석 모듈;을 포함하고,
    상기 데이터 수집 모듈은,
    이미지, 동영상, 음성, 센서, GPS, GIS, M2M 데이터 중 적어도 어느 하나의 비정형 데이터를 포함하는 빅데이터를 수집하는 것을 특징으로 하는, 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템.

KR1020220020070A 2021-11-24 2022-02-16 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템 KR102395097B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220020070A KR102395097B1 (ko) 2021-11-24 2022-02-16 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020210163815A KR102375955B1 (ko) 2021-11-24 2021-11-24 보안성이 향상된 데이터 백업 시스템
KR1020220020070A KR102395097B1 (ko) 2021-11-24 2022-02-16 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020210163815A Division KR102375955B1 (ko) 2021-11-24 2021-11-24 보안성이 향상된 데이터 백업 시스템

Publications (1)

Publication Number Publication Date
KR102395097B1 true KR102395097B1 (ko) 2022-05-09

Family

ID=80936779

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020210163815A KR102375955B1 (ko) 2021-11-24 2021-11-24 보안성이 향상된 데이터 백업 시스템
KR1020220020070A KR102395097B1 (ko) 2021-11-24 2022-02-16 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020210163815A KR102375955B1 (ko) 2021-11-24 2021-11-24 보안성이 향상된 데이터 백업 시스템

Country Status (2)

Country Link
KR (2) KR102375955B1 (ko)
WO (1) WO2023096027A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102488665B1 (ko) * 2022-03-31 2023-01-13 주식회사 레빗 클라우드 서비스 플랫폼 구축 시스템
KR102466193B1 (ko) * 2022-04-05 2022-11-14 (주)한국비씨피솔루션즈 파일 복제 솔루션
KR102483422B1 (ko) * 2022-04-20 2022-12-30 주식회사 정데이타시스템 클라우드 서비스 융복합 시스템
KR102664022B1 (ko) * 2023-12-07 2024-05-08 주식회사 에이텍 단말의 백업 및 복원 시간 단축을 통한 환경 유지 시스템
CN118018326B (zh) * 2024-04-08 2024-06-07 深圳众投互联信息技术有限公司 基于分布式存储的数据安全加密方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110008854A (ko) * 2009-07-21 2011-01-27 (주) 세인트 시큐리티 악성 코드 탐지 방법, 시스템 및 컴퓨터 판독 가능한 저장매체
KR20130075300A (ko) * 2011-12-27 2013-07-05 한국과학기술원 공개형 악성코드 관리 및 분석 시스템
KR20150057322A (ko) * 2013-11-19 2015-05-28 한국과학기술정보연구원 빅데이터 분석 기반의 위크시그널 도출 시스템 및 그 방법
KR101631032B1 (ko) * 2015-07-21 2016-06-16 한국과학기술원 비정형 데이터 필터링 및 공통형태 변환을 통한 저장 시스템 및 방법
KR101710684B1 (ko) * 2015-09-10 2017-03-02 (주) 세인트 시큐리티 가상 환경에서는 실행되지 않는 악성 코드를 분석할 수 있는 os 이미지의 복구 시스템 및 방법
KR102101591B1 (ko) 2020-03-03 2020-04-16 정일형 Ai 기반 백업 데이터 관리 시스템 및 그 방법
KR102328106B1 (ko) * 2021-05-10 2021-11-17 주식회사 삼마아이씨티 이미지 암호화 저장 시스템 및 방법
KR102375962B1 (ko) * 2021-11-24 2022-03-18 박경진 유저중심의 학습공간 매칭 통합관리 시스템

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050118355A (ko) * 2004-06-14 2005-12-19 주식회사 팬택앤큐리텔 이동통신단말기의 데이터 백업 방법
US8769049B2 (en) * 2009-04-24 2014-07-01 Microsoft Corporation Intelligent tiers of backup data
KR20140110366A (ko) * 2013-03-07 2014-09-17 중소기업은행 데이터 백업 장치 및 방법
WO2018010766A1 (en) * 2016-07-12 2018-01-18 Huawei Technologies Co., Ltd. Apparatus and method for backing up data of computing devices in a computer network
KR102012482B1 (ko) * 2017-08-29 2019-08-20 이호준 실시간 파일 변경 감지 기반 자동백업 장치
KR102412830B1 (ko) * 2020-04-11 2022-06-24 (주)리핏 대용량 데이터 저장을 위한 블록체인 기반 분산 데이터 저장 장치 및 방법

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110008854A (ko) * 2009-07-21 2011-01-27 (주) 세인트 시큐리티 악성 코드 탐지 방법, 시스템 및 컴퓨터 판독 가능한 저장매체
KR20130075300A (ko) * 2011-12-27 2013-07-05 한국과학기술원 공개형 악성코드 관리 및 분석 시스템
KR20150057322A (ko) * 2013-11-19 2015-05-28 한국과학기술정보연구원 빅데이터 분석 기반의 위크시그널 도출 시스템 및 그 방법
KR101631032B1 (ko) * 2015-07-21 2016-06-16 한국과학기술원 비정형 데이터 필터링 및 공통형태 변환을 통한 저장 시스템 및 방법
KR101710684B1 (ko) * 2015-09-10 2017-03-02 (주) 세인트 시큐리티 가상 환경에서는 실행되지 않는 악성 코드를 분석할 수 있는 os 이미지의 복구 시스템 및 방법
KR102101591B1 (ko) 2020-03-03 2020-04-16 정일형 Ai 기반 백업 데이터 관리 시스템 및 그 방법
KR102328106B1 (ko) * 2021-05-10 2021-11-17 주식회사 삼마아이씨티 이미지 암호화 저장 시스템 및 방법
KR102375962B1 (ko) * 2021-11-24 2022-03-18 박경진 유저중심의 학습공간 매칭 통합관리 시스템

Also Published As

Publication number Publication date
KR102375955B1 (ko) 2022-03-18
WO2023096027A1 (ko) 2023-06-01

Similar Documents

Publication Publication Date Title
KR102395097B1 (ko) 악성코드 포함 여부를 자동으로 판단하는 데이터 백업 시스템
US11042663B2 (en) Automatic file encryption
CN110062034B (zh) 一种区块链大文件安全存储方法及系统
US9548866B2 (en) Deletion of content in digital storage systems
US8667273B1 (en) Intelligent file encryption and secure backup system
US8099605B1 (en) Intelligent storage device for backup system
US8892905B2 (en) Method and apparatus for performing selective encryption/decryption in a data storage system
US20170344433A1 (en) Apparatus and method for data migration
CN105120003B (zh) 一种实现云环境下数据备份的方法
WO2001046808A1 (fr) Dispositif et systeme d'archivage reparti
US8977865B2 (en) Data encryption conversion for independent agents
WO2018032375A1 (zh) 一种用于区块链可生存存储系统及其方法
US20220222345A1 (en) Automatic ransomware detection with an on-demand file system lock down and automatic repair function
WO2012063755A1 (ja) 分散アーカイブシステム並びにデータアーカイブ装置及びデータ復元装置
US11693963B2 (en) Automatic ransomware detection with an on-demand file system lock down and automatic repair function
WO2020118304A1 (en) Distributed parallel data protection system and method
Li et al. Managing data retention policies at scale
EP3921754A1 (en) Blockchain technology for data integrity regulation and proof of existence in data protection systems
US11238157B2 (en) Efficient detection of ransomware attacks within a backup storage environment
WO2017026987A1 (en) Encrypted data chunks
KR20220086677A (ko) 블록체인 기반 백업 및 복구를 위한 시스템 및 방법
Andavan et al. Cloud computing based deduplication using high-performance grade byte check and fuzzy search technique
KR102220635B1 (ko) 메모리 db 기반 중복 제거 블록 데이터 전송 방법
JP7300781B1 (ja) データ管理システム、データ管理方法、及びデータ管理プログラム
D’Arco et al. On the file recovery in systems infected by Ransomware

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant