KR20130068633A - 데이터 시각화 장치 및 방법 - Google Patents

데이터 시각화 장치 및 방법 Download PDF

Info

Publication number
KR20130068633A
KR20130068633A KR1020110135928A KR20110135928A KR20130068633A KR 20130068633 A KR20130068633 A KR 20130068633A KR 1020110135928 A KR1020110135928 A KR 1020110135928A KR 20110135928 A KR20110135928 A KR 20110135928A KR 20130068633 A KR20130068633 A KR 20130068633A
Authority
KR
South Korea
Prior art keywords
data
unit
visualization
visualized
single data
Prior art date
Application number
KR1020110135928A
Other languages
English (en)
Inventor
김건우
홍도원
은성경
김영수
최우용
이상수
이주영
조수형
길연희
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020110135928A priority Critical patent/KR20130068633A/ko
Priority to US13/488,826 priority patent/US8856152B2/en
Publication of KR20130068633A publication Critical patent/KR20130068633A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Computer Security & Cryptography (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 다양한 소스로부터 수집한 포렌식 데이터 간의 상관관계를 이용하여 데이터를 의미있는 정보로 시각화하는 데이터 시각화 장치를 제안한다. 제안된 데이터 시각화 장치는 싱글 소스 싱글 데이터(single-source single-data), 싱글 소스 멀티 데이터(single-source multi-data), 멀티 소스 멀티 데이터(multi-source multi-data)를 의미있는 정보로 시각화할 수 있다.

Description

데이터 시각화 장치 및 방법 {Apparatus and method for visualizing data}
본 발명은 데이터를 시각화하는 장치 및 방법에 관한 것이다. 보다 상세하게는, 포렌식 데이터(forensic data)를 시각화하는 장치 및 방법에 관한 것이다.
디지털 포렌식 도구는 데이터 수집과 분석에 중점을 두어서 데이터를 의미있게 표현하는 방법을 제공하지 않는다. 그래서, 사용자에게 좀더 효율적으로 정보를 전달하기 위해서는 데이터 시각화 기법을 활용하여 포렌식 데이터가 정보로서 의미가 생성되도록 형상화할 필요가 있다.
시각화 대상이 될 수 있는 포렌식 데이터는 컴퓨터 포렌식 데이터, USB와 같은 외부 저장 장치를 사용하는 휴대형 포렌식 데이터, 스마트폰을 포함한 모바일 기기 데이터, SNS 포렌식 데이터 등이 있다.
포렌식 데이터 시각화를 위한 로 데이터(raw data) 수집은 서로 다른 종류의 소스(source)로부터 다양한 데이터를 대상으로 하고, 동일 소스에 대해서도 사용자별로 복수의 데이터가 수집된다. 또한, 동일한 소스에서 수집된 데이터라 하더라도 사용한 수집 도구에 따라서 수집된 데이터는 서로 다른 포맷을 가진다.
여러 소스로부터 수집된 다양한 형식을 가지는 데이터 간에는 여러가지 상관관계가 존재하는데, 이를 시각적으로 표현하는 것은 포렌식 수사나 사용자 행위를 분석하기 위해서 매우 중요하다. 하지만, 기존의 포렌식 도구나 포렌식 시각화 도구는 이를 표현하는 방법을 제공하지 않는다. 그래서, 기존의 시각화 방법은 하나의 소스로부터 수집된 데이터만 표현하는 방법을 제공하고, 여러 소스에서 수집된 데이터를 혼합하여 표현하기는 매우 어렵다. 의미있는 포렌식 수사나 사용자의 행위를 분석하기 위해서는 단일 데이터 수집원(single source)에서 수집한 하나의 데이터(single data)를 시각적으로 표현하는 것도 필요하다. 뿐만 아니라 복수 데이터 수집원(multi source)에서 수집한 복수의 데이터(multi data)도 시각적으로 표현 가능해야 하는데 기존의 포렌식 시각화 도구로는 한계가 있다.
본 발명은 상기한 문제점을 해결하기 위해 안출된 것으로서, 다양한 소스와 데이터 포맷에 제한을 받지 않는 데이터 시각화 장치 및 방법을 제안함을 목적으로 한다.
본 발명은 상기한 목적을 달성하기 위해 안출된 것으로서, 서로 다른 포맷을 가지는 싱글 데이터들을 수집하는 싱글 데이터 수집부; 수집된 싱글 데이터들로부터 얻은 동일한 포맷을 가지는 제1 싱글 데이터들로 제1 멀티 데이터를 생성하는 제1 멀티 데이터 생성부; 상기 제1 싱글 데이터들, 상기 제1 싱글 데이터들과 포맷이 다른 제2 싱글 데이터들, 및 생성된 제1 멀티 데이터들 중 적어도 하나의 데이터들로 제2 멀티 데이터를 생성하는 제2 멀티 데이터 생성부; 및 상기 수집된 싱글 데이터들, 상기 생성된 제1 멀티 데이터, 및 생성된 제2 멀티 데이터 중 적어도 하나의 데이터를 시각화하는 데이터 시각화부를 포함하는 것을 특징으로 하는 데이터 시각화 장치를 제안한다.
바람직하게는, 상기 싱글 데이터 수집부는 미리 저장된 데이터들 중에서 시각화하려는 데이터들을 획득하거나 외부 기기로부터 시각화하려는 데이터들을 획득하는 데이터 획득부; 획득된 데이터들을 파싱하는 데이터 파싱부; 파싱된 데이터들을 정규화하여 싱글 데이터들을 생성하는 데이터 생성부; 및 생성된 싱글 데이터들로부터 서로 다른 포맷을 가지는 싱글 데이터들을 수집하는 포맷 기반 데이터 수집부를 포함한다.
바람직하게는, 상기 싱글 데이터 수집부는 하나의 데이터 수집원으로부터 포맷이 다른 싱글 데이터들을 모두 수집하거나 각각의 데이터 수집원마다 포맷을 지정한 뒤 각 데이터 수집원으로부터 지정된 포맷을 가지는 싱글 데이터만을 수집한다.
바람직하게는, 상기 제1 멀티 데이터 생성부는 상기 수집된 싱글 데이터들 중에서 어느 하나의 포맷을 가지는 싱글 데이터들만 추출하는 제1 데이터 추출부; 추출된 싱글 데이터들을 미리 정해진 기준에 따라 정렬시켜 싱글 데이터들 간의 관계를 규정하는 제1 데이터 관계 규정부; 및 관계 규정된 싱글 데이터들을 정규화하여 상기 제1 멀티 데이터를 생성하는 제1 데이터 정규화부를 포함한다. 더욱 바람직하게는, 상기 제1 데이터 추출부는 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 싱글 데이터들로 수집한다. 더욱 바람직하게는, 상기 제1 데이터 관계 규정부는 시각화된 데이터들 간의 관계를 이용하여 상기 싱글 데이터들 간의 관계를 규정한다.
바람직하게는, 상기 제2 멀티 데이터 생성부는 상기 생성된 제1 멀티 데이터들만 추출하거나, 상기 제2 싱글 데이터들만 추출하거나, 또는 적어도 하나의 제1 싱글 데이터와 적어도 하나의 제1 멀티 데이터 및 적어도 하나의 제2 싱글 데이터 중 적어도 두개의 데이터들을 혼합 추출하는 제2 데이터 추출부; 추출된 데이터들을 미리 정해진 기준에 따라 정렬시켜 상기 추출된 데이터들 간의 관계를 규정하는 제2 데이터 관계 규정부; 및 관계 규정된 데이터들을 정규화하여 상기 제2 멀티 데이터를 생성하는 제2 데이터 정규화부를 포함한다. 더욱 바람직하게는, 상기 제2 데이터 추출부는 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 싱글 데이터들로 수집한다. 상기 제2 데이터 추출부는 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 제1 멀티 데이터들 또는 제2 멀티 데이터들로 수집할 수 있다. 더욱 바람직하게는, 상기 제2 데이터 관계 규정부는 시각화된 데이터들 간의 관계를 이용하여 상기 싱글 데이터들 간의 관계를 규정한다. 상기 제2 데이터 관계 규정부는 시각화된 데이터들 간의 관계를 이용하여 상기 제1 멀티 데이터들 또는 상기 제2 멀티 데이터들 또는 이들 상호간의 관계를 규정할 수 있다.
바람직하게는, 상기 데이터 시각화부는 사용자 인터랙션 유무에 따라 데이터를 정적 또는 동적으로 시각화한다. 더욱 바람직하게는, 상기 데이터 시각화부는 데이터를 동적으로 시각화할 때 미리 정해진 시간마다 시각화하려는 데이터를 재생성한 뒤 재생성된 데이터를 시각화한다.
바람직하게는, 상기 데이터 시각화부가 시각화하려는 데이터는 포렌식 데이터(forensic data)이다.
또한, 본 발명은 서로 다른 포맷을 가지는 싱글 데이터들을 수집하는 싱글 데이터 수집 단계; 수집된 싱글 데이터들로부터 얻은 동일한 포맷을 가지는 제1 싱글 데이터들로 제1 멀티 데이터를 생성하는 제1 멀티 데이터 생성 단계; 상기 제1 싱글 데이터들, 상기 제1 싱글 데이터들과 포맷이 다른 제2 싱글 데이터들, 및 생성된 제1 멀티 데이터들 중 적어도 하나의 데이터들로 제2 멀티 데이터를 생성하는 제2 멀티 데이터 생성 단계; 및 상기 수집된 싱글 데이터들, 상기 생성된 제1 멀티 데이터, 및 생성된 제2 멀티 데이터 중 적어도 하나의 데이터를 시각화하는 데이터 시각화 단계를 포함하는 것을 특징으로 하는 데이터 시각화 방법을 제안한다.
바람직하게는, 상기 싱글 데이터 수집 단계는 미리 저장된 데이터들 중에서 시각화하려는 데이터들을 획득하거나 외부 기기로부터 시각화하려는 데이터들을 획득하는 데이터 획득 단계; 획득된 데이터들을 파싱하는 데이터 파싱 단계; 파싱된 데이터들을 정규화하여 싱글 데이터들을 생성하는 데이터 생성 단계; 및 생성된 싱글 데이터들로부터 서로 다른 포맷을 가지는 싱글 데이터들을 수집하는 포맷 기반 데이터 수집 단계를 포함한다.
바람직하게는, 상기 싱글 데이터 수집 단계는 하나의 데이터 수집원으로부터 포맷이 다른 싱글 데이터들을 모두 수집하거나 각각의 데이터 수집원마다 포맷을 지정한 뒤 각 데이터 수집원으로부터 지정된 포맷을 가지는 싱글 데이터만을 수집한다.
바람직하게는, 상기 제1 멀티 데이터 생성 단계는 상기 수집된 싱글 데이터들 중에서 어느 하나의 포맷을 가지는 싱글 데이터들만 추출하는 제1 데이터 추출 단계; 추출된 싱글 데이터들을 미리 정해진 기준에 따라 정렬시켜 싱글 데이터들 간의 관계를 규정하는 제1 데이터 관계 규정 단계; 및 관계 규정된 싱글 데이터들을 정규화하여 상기 제1 멀티 데이터를 생성하는 제1 데이터 정규화 단계를 포함한다. 더욱 바람직하게는, 상기 제1 데이터 추출 단계는 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 싱글 데이터들로 수집한다. 더욱 바람직하게는, 상기 제1 데이터 관계 규정 단계는 시각화된 데이터들 간의 관계를 이용하여 상기 싱글 데이터들 간의 관계를 규정한다.
바람직하게는, 상기 제2 멀티 데이터 생성 단계는 상기 생성된 제1 멀티 데이터들만 추출하거나, 상기 제2 싱글 데이터들만 추출하거나, 또는 적어도 하나의 제1 싱글 데이터와 적어도 하나의 제1 멀티 데이터 및 적어도 하나의 제2 싱글 데이터 중 적어도 두개의 데이터들을 혼합 추출하는 제2 데이터 추출 단계; 추출된 데이터들을 미리 정해진 기준에 따라 정렬시켜 상기 추출된 데이터들 간의 관계를 규정하는 제2 데이터 관계 규정 단계; 및 관계 규정된 데이터들을 정규화하여 상기 제2 멀티 데이터를 생성하는 제2 데이터 정규화 단계를 포함한다. 더욱 바람직하게는, 상기 제2 데이터 추출 단계는 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 싱글 데이터들로 수집한다. 상기 제2 데이터 추출 단계는 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 제1 멀티 데이터들 또는 제2 멀티 데이터들로 수집할 수 있다. 더욱 바람직하게는, 상기 제2 데이터 관계 규정 단계는 시각화된 데이터들 간의 관계를 이용하여 상기 싱글 데이터들 간의 관계를 규정한다. 상기 제2 데이터 관계 규정 단계는 시각화된 데이터들 간의 관계를 이용하여 상기 제1 멀티 데이터들 또는 상기 제2 멀티 데이터들 또는 이들 상호간의 관계를 규정할 수 있다.
바람직하게는, 상기 데이터 시각화 단계는 사용자 인터랙션 유무에 따라 데이터를 정적 또는 동적으로 시각화한다. 더욱 바람직하게는, 상기 데이터 시각화 단계는 데이터를 동적으로 시각화할 때 미리 정해진 시간마다 시각화하려는 데이터를 재생성한 뒤 재생성된 데이터를 시각화한다.
바람직하게는, 상기 데이터 시각화 단계에서 시각화되는 데이터는 포렌식 데이터(forensic data)이다.
본 발명에 따르면, 다양한 소스로부터 수집한 포렌식 데이터 간의 상관관계를 이용하여 데이터를 의미있는 정보로 시각화할 수 있다. 또한, Single-Source Single-Data(단일 데이터 수집원에서 수집한 하나의 데이터), Single-Source Multi-Data(단일 데이터 수집원에서 수집한 복수의 데이터), Multi-Source Multi-Data(복수 데이터 수집원에서 수집한 복수의 데이터) 각각을 의미있는 정보로 시각화하는 것이 가능해진다. 또한, 서로 다른 소스와 서로 다른 유저(user) 간의 데이터가 결합되더라도 결합 데이터에 내포된 상관관계를 이용하여 결합 데이터를 의미있는 정보로 시각화하는 것이 가능해진다.
도 1은 본 발명의 바람직한 실시예에 따른 데이터 시각화 장치를 개략적으로 도시한 블록도이다.
도 2는 도 1에 도시된 데이터 시각화 장치의 내부 구성을 세부적으로 도시한 블록도이다.
도 3은 포렌식 데이터 가시화 장치의 내부 구성을 개략적으로 도시한 블록도이다.
도 4는 포렌식 데이터 변환 과정을 보여주는 도면이다.
도 5는 포렌식 데이터 수집기의 내부 구성을 개략적으로 도시한 블록도이다.
도 6은 싱글 소스 포렌식 데이터 분석기의 내부 구성을 개략적으로 도시한 블록도이다.
도 7은 멀티 소스 포렌식 데이터 분석기의 내부 구성을 개략적으로 도시한 블록도이다.
도 8은 포렌식 데이터 가시화기의 내부 구성을 개략적으로 도시한 블록도이다.
도 9는 본 발명의 바람직한 실시예에 따른 데이터 시각화 방법을 개략적으로 도시한 흐름도이다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다. 또한, 이하에서 본 발명의 바람직한 실시예를 설명할 것이나, 본 발명의 기술적 사상은 이에 한정하거나 제한되지 않고 당업자에 의해 변형되어 다양하게 실시될 수 있음은 물론이다.
도 1은 본 발명의 바람직한 실시예에 따른 데이터 시각화 장치를 개략적으로 도시한 블록도이다. 도 2는 도 1에 도시된 데이터 시각화 장치의 내부 구성을 세부적으로 도시한 블록도이다. 이하 설명은 도 1과 도 2를 참조한다.
도 1에 따르면, 데이터 시각화 장치(100)는 싱글 데이터 수집부(110), 제1 멀티 데이터 생성부(120), 제2 멀티 데이터 생성부(130), 데이터 시각화부(140), 전원부(150) 및 주제어부(160)를 포함한다.
데이터 시각화 장치(100)는 다양한 소스로부터 수집한 포렌식 데이터 간의 상관관계를 이용하여 데이터를 의미있는 정보로 시각화하는 장치이다. 이 데이터 시각화 장치(100)는 싱글 소스 싱글 데이터(single-source single-data), 싱글 소스 멀티 데이터(single-source multi-data), 멀티 소스 멀티 데이터(multi-source multi-data)를 의미있는 정보로 시각화할 수 있다. 싱글 소스 싱글 데이터는 단일 데이터 수집원에서 수집한 하나의 데이터를 의미하고, 싱글 소스 멀티 데이터는 단일 데이터 수집원에서 수집한 복수의 데이터를 의미하며, 멀티 소스 멀티 데이터는 복수 데이터 수집원에서 수집한 복수의 데이터를 의미한다. 데이터 시각화 장치(100)는 일례로 포렌식 데이터(forensic data)를 의미있는 정보로 시각화할 수 있다.
싱글 데이터 수집부(110)는 서로 다른 포맷을 가지는 싱글 데이터들을 수집하는 기능을 수행한다. 제1 멀티 데이터 생성부(120)는 수집된 싱글 데이터들로부터 얻은 동일한 포맷을 가지는 제1 싱글 데이터들로 제1 멀티 데이터를 생성하는 기능을 수행한다. 제2 멀티 데이터 생성부(130)는 제1 싱글 데이터들, 제1 싱글 데이터들과 포맷이 다른 제2 싱글 데이터들, 및 생성된 제1 멀티 데이터들 중 적어도 하나의 데이터들로 제2 멀티 데이터를 생성하는 기능을 수행한다. 데이터 시각화부(140)는 수집된 싱글 데이터들, 생성된 제1 멀티 데이터, 및 생성된 제2 멀티 데이터 중 적어도 하나의 데이터를 시각화하는 기능을 수행한다. 전원부(150)는 데이터 시각화 장치(100)를 구성하는 각 구성부에 전원을 공급하는 기능을 수행한다. 주제어부(160)는 데이터 시각화 장치(100)를 구성하는 각 구성부의 전체 작동을 제어하는 기능을 수행한다.
싱글 데이터는 미리 정해진 포맷을 가지는 데이터로, 본 실시예에서는 싱글 소스 싱글 데이터(single-source single-data)가 이에 해당한다. 싱글 소스 싱글 데이터에 대해서는 후술한다. 제1 멀티 데이터는 포맷이 같은 데이터들을 결합하여 얻은 데이터로, 본 실시예에서는 싱글 소스 멀티 데이터(single-source multi-data)가 이에 해당한다. 싱글 소스 멀티 데이터에 대해서는 후술한다. 제2 멀티 데이터는 포맷이 다른 데이터들을 결합하여 얻은 데이터로, 본 실시예에서는 멀티 소스 멀티 데이터(multi-source multi-data)가 이에 해당한다. 멀티 소스 멀티 데이터에 대해서는 후술한다.
싱글 데이터 수집부(110)는 포렌식 데이터 수집기(forensic data collector)와 동일한 기능을 수행하는 구성이다. 포렌식 데이터 수집기에 대해서는 후술한다. 제1 멀티 데이터 생성부(120)는 싱글 소스 포렌식 데이터 분석기(single-source forensic data analyzer)와 동일한 기능을 수행하는 구성이다. 싱글 소스 포렌식 데이터 분석기에 대해서는 후술한다. 제2 멀티 데이터 생성부(130)는 멀티 소스 포렌식 데이터 분석기(multi-source forensic data analyzer)와 동일한 기능을 수행하는 구성이다. 멀티 소스 포렌식 데이터 분석기에 대해서는 후술한다. 데이터 시각화부(140)는 포렌식 데이터 가시화기(forensic data visualizer)와 동일한 기능을 수행하는 구성이다. 포렌식 데이터 가시화기에 대해서는 후술한다.
싱글 데이터 수집부(110)는 도 2 (a)에 도시된 바와 같이 데이터 획득부(111), 데이터 파싱부(112), 데이터 생성부(113) 및 포맷 기반 데이터 수집부(114)를 포함할 수 있다. 데이터 획득부(111)는 미리 저장된 데이터들 중에서 시각화하려는 데이터들을 획득하거나 외부 기기로부터 시각화하려는 데이터들을 획득하는 기능을 수행한다. 데이터 파싱부(112)는 획득된 데이터들을 파싱하는 기능을 수행한다. 데이터 생성부(113)는 파싱된 데이터들을 정규화하여 싱글 데이터들을 생성하는 기능을 수행한다. 포맷 기반 데이터 수집부(114)는 생성된 싱글 데이터들로부터 서로 다른 포맷을 가지는 싱글 데이터들을 수집하는 기능을 수행한다.
데이터 획득부(111)는 데이터 임포트 유닛(data import unit)과 동일한 기능을 수행하는 구성이다. 데이터 임포트 유닛에 대해서는 후술한다. 데이터 파싱부(112)는 데이터 파싱 유닛(data parsing unit)과 동일한 기능을 수행하는 구성이다. 데이터 파싱 유닛에 대해서는 후술한다. 데이터 생성부(113)는 제1 데이터 테이블 메이킹 유닛(first data table making unit)과 동일한 기능을 수행하는 구성이다. 제1 데이터 테이블 메이킹 유닛에 대해서는 후술한다.
싱글 데이터 수집부(110)는 하나의 데이터 수집원으로부터 포맷이 다른 싱글 데이터들을 모두 수집할 수 있다. 또한, 싱글 데이터 수집부(110)는 각각의 데이터 수집원마다 포맷을 지정한 뒤 각 데이터 수집원으로부터 지정된 포맷을 가지는 싱글 데이터만을 수집할 수 있다.
제1 멀티 데이터 생성부(120)는 도 2 (b)에 도시된 바와 같이 제1 데이터 추출부(121), 제1 데이터 관계 규정부(122) 및 제1 데이터 정규화부(123)를 포함할 수 있다. 제1 데이터 추출부(121)는 수집된 싱글 데이터들 중에서 어느 하나의 포맷을 가지는 싱글 데이터들만 추출하는 기능을 수행한다. 제1 데이터 관계 규정부(122)는 추출된 싱글 데이터들을 미리 정해진 기준에 따라 정렬시켜 싱글 데이터들 간의 관계를 규정하는 기능을 수행한다. 제1 데이터 정규화부(123)는 관계 규정된 싱글 데이터들을 정규화하여 제1 멀티 데이터를 생성하는 기능을 수행한다.
제1 데이터 추출부(121)는 싱글 소스 데이터 게더링 유닛(single-source data gathering unit)과 동일한 기능을 수행하는 구성이다. 싱글 소스 데이터 게더링 유닛에 대해서는 후술한다. 제1 데이터 관계 규정부(122)는 싱글 소스 데이터 프로세싱 유닛(single-source data processing unit)과 동일한 기능을 수행하는 구성이다. 싱글 소스 데이터 프로세싱 유닛에 대해서는 후술한다. 제1 데이터 정규화부(123)는 제2 데이터 테이블 메이킹 유닛(second data table making unit)과 동일한 기능을 수행하는 구성이다. 제2 데이터 테이블 메이킹 유닛에 대해서는 후술한다.
제1 데이터 추출부(121)는 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 싱글 데이터들로 수집할 수 있다. 제1 데이터 관계 규정부(122)는 시각화된 데이터들 간의 관계를 이용하여 싱글 데이터들 간의 관계를 규정할 수 있다.
제2 멀티 데이터 생성부(130)는 도 2 (c)에 도시된 바와 같이 제2 데이터 추출부(131), 제2 데이터 관계 규정부(132) 및 제2 데이터 정규화부(133)를 포함할 수 있다. 제2 데이터 추출부(131)는 생성된 제1 멀티 데이터들만 추출하거나, 제2 싱글 데이터들만 추출하거나, 또는 적어도 하나의 제1 싱글 데이터와 적어도 하나의 제1 멀티 데이터 및 적어도 하나의 제2 싱글 데이터 중 적어도 두개의 데이터들을 혼합 추출하는 기능을 수행한다. 제2 데이터 관계 규정부(132)는 추출된 데이터들을 미리 정해진 기준에 따라 정렬시켜 추출된 데이터들 간의 관계를 규정하는 기능을 수행한다. 제2 데이터 정규화부(133)는 관계 규정된 데이터들을 정규화하여 제2 멀티 데이터를 생성하는 기능을 수행한다.
제2 데이터 추출부(131)는 멀티 소스 데이터 게더링 유닛(multi-source data gathering unit)과 동일한 기능을 수행하는 구성이다. 멀티 소스 데이터 게더링 유닛에 대해서는 후술한다. 제2 데이터 관계 규정부(132)는 멀티 소스 데이터 프로세싱 유닛(multi-source data processing unit)과 동일한 기능을 수행하는 구성이다. 멀티 소스 데이터 프로세싱 유닛에 대해서는 후술한다. 제2 데이터 정규화부(133)는 제3 데이터 테이블 메이킹 유닛(third data table making unit)과 동일한 기능을 수행하는 구성이다. 제3 데이터 테이블 메이킹 유닛에 대해서는 후술한다.
제2 데이터 추출부(131)는 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 싱글 데이터들로 수집할 수 있다. 제2 데이터 추출부(131)는 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 제1 멀티 데이터들 또는 제2 멀티 데이터들로 수집할 수 있다. 제2 데이터 관계 규정부(132)는 시각화된 데이터들 간의 관계를 이용하여 싱글 데이터들 간의 관계를 규정할 수 있다. 제2 데이터 관계 규정부(132)는 시각화된 데이터들 간의 관계를 이용하여 제1 멀티 데이터들 또는 제2 멀티 데이터들 또는 이들 상호간의 관계를 규정할 수 있다.
데이터 시각화부(140)는 사용자 인터랙션 유무에 따라 데이터를 정적 또는 동적으로 시각화할 수 있다. 본 실시예에서 이 기능은 데이터 비주얼라이징 유닛(data visualizing unit)이 담당한다. 데이터 비주얼라이징 유닛에 대해서는 후술한다.
데이터 시각화부(140)는 데이터를 동적으로 시각화할 때 미리 정해진 시간마다 시각화하려는 데이터를 재생성한 뒤 재생성된 데이터를 시각화할 수 있다. 본 실시예에서 이 기능은 데이터 리퀘스트 유닛(data request unit)이 담당한다. 데이터 리퀘스트 유닛에 대해서는 후술한다.
다음으로, 데이터 시각화 장치(100)의 일실시예로 포렌식 데이터 시각화 장치에 대해 설명한다. 이하에서는 다양한 소스(source)로부터 수집한 포렌식 데이터 간의 연관관계를 시각화하기 위한 포렌식 데이터 시각화 장치를 구성하고, 그 장치에서 싱글 소스 싱글 데이터(single-source single-data), 싱글 소스 멀티 데이터(single-source multi-data), 멀티 소스 멀티 데이터(multi-source multi-data)를 시각화 표현하는 방법을 설명한다.
도 3은 포렌식 데이터 가시화 장치의 내부 구성을 개략적으로 도시한 블록도이다. 도 3에 따르면, 포렌식 데이터 시각화 장치(300)는 포렌식 데이터 수집기(forensic data collector; 310), 싱글 소스 포렌식 데이터 분석기(single-source forensic data analyzer; 320), 멀티 소스 포렌식 데이터 분석기(multi-source forensic data analyzer; 330), 및 포렌식 데이터 가시화기(forensic data visualizer; 340)를 포함한다. 상기에서, 포렌식 데이터 수집기(310)와 싱글 소스 포렌식 데이터 분석기(320) 및 멀티 소스 포렌식 데이터 분석기(330)가 데이터 변환(data transform) 기능을 수행하는 것이며, 포렌식 데이터 가시화기(340)가 비주얼 맵핑(visual mapping) 및 뷰 변환(view transform) 기능을 수행하는 것이다.
포렌식 데이터 변환 과정은 도 4에 도시된 바와 같다. 도 4는 포렌식 데이터 변환 과정을 보여주는 도면이다. 이하 설명은 도 3과 도 4를 참조한다.
포렌식 데이터 변환 기능은 Raw data(401)로부터 시각화 툴에서 사용 가능한 시각화 데이터를 구축하는 데이터 수집 기능, 수집된 데이터를 분석하여 새로운 시각화 데이터를 생성하기 위한 데이터 분석 기능, 데이터를 정규화하여 데이터 테이블을 생성하는 기능 등을 포함한다. 이를 위해서 포렌식 데이터 수집기(310)는 싱글 소스single-source)로부터 싱글 데이터single-data)를 수집한다. 즉, 단일 데이터 수집원으로부터 Raw Data(401)를 수집해서(S411) 데이터 테이블 1(data table 1; 402)을 생성한다(S412). 데이터 테이블 1(402)을 이용하여 포렌식 데이터 가시화기(340)에서 시각화로 표현할 수 있다(S413). 싱글 소스 포렌식 데이터 분석기(320)는 싱글 소스로부터 멀티 데이터(multi-data)를 분석한다. 즉, 동일한 소스로부터 생성된 데이터 테이블 1(402)로부터(S414) 테이블 내의 데이터를 가공하여 새로운 복수개의 데이터 테이블 2(data table 2; 403)를 생성한다(S415). 데이터 테이블 2(403)를 이용하여 포렌식 데이터 가시화기(340)에서 시각화로 표현할 수 있다(S416). 멀티 소스 포렌식 데이터 분석기(330)는 멀티 소스(multi-source)로부터 멀티 데이터를 분석한다. 즉, 다양한 소스의 데이터 테이블 1(S417), 데이터 테이블 2(S418), 다른 데이터 테이블(other data table; 404)로부터 테이블들의 데이터를 가공하여 새로운 복수개의 데이터 테이블 3(data table 3; 405)을 생성하는 역할을 한다(S420). 데이터 테이블 3(405)을 이용하여 포렌식 데이터 가시화기(340)에서 시각화로 표현할 수 있다(S421).
시각화 대상이 되는 Raw Data(401)는 포렌식 도구 출력이거나 이미 저장된 포렌식 파일 데이터이다. Raw data(401)는 개인용 PC, 휴대형 기기 등의 싱글 플랫폼(single platform)에 저장될 수도 있고, 클라우드나 분산 컴퓨터와 같은 분산 플랫폼(distributed platform)에 저장될 수도 있다. 뿐만 아니라, 포렌식 도구로부터의 결과가 기존의 레포지토리(repository)에 저장되어서 나중에 시각화를 위해 활용될 수도 있다. 포렌식 데이터 수집기(310), 싱글 소스 포렌식 데이터 분석기(320) 및 멀티 소스 포렌식 데이터 분석기(330)는 각각 독립적으로 존재하는 모듈일 수도 있고 3가지 기능이 통합된 형태일 수도 있다.
도 5는 포렌식 데이터 수집기의 내부 구성을 개략적으로 도시한 블록도이다. 포렌식 데이터 수집기(310)는 데이터 임포트 유닛(Data Import Unit; 510), 데이터 파싱 유닛(Data Parsing Unit; 520), 제1 데이터 테이블 메이킹 유닛(First Data Table Making Unit; 530), 및 제1 데이터 익스포트 유닛(First Data Export Unit; 540)으로 구성된다.
데이터 임포트 유닛(510)은 파일 임포트(File Import)나 TCP/UDP 인터페이스를 사용하여 시각화 대상이 되는 데이터를 임포트(import)한다. 대상 데이터는 시각화 도구 출력 데이터이거나 저장된 파일 데이터이고, XML reader, CSV reader, SQL reader 등을 이용하여 임포트한다.
데이터 파싱 유닛(520)은 다양한 데이터 포맷의 raw data로부터 시각화 대상 데이터를 추출하여 시각화 데이터를 파싱하는 역할을 한다. 파서(Parser) 기능을 위해 CSV/txt parser, XML parser, SQL data parser, MS-excel, grep 등과 같은 방법이 사용될 수 있다. 파싱된 데이터는 제1 데이터 테이블 메이킹 유닛(530)에서 사용되거나 싱글 소스 포렌식 데이터 분석기(320)에서 이용되거나 멀티 소스 포렌식 데이터 분석기(330)에서 활용된다.
제1 데이터 테이블 메이킹 유닛(530)은 포렌식 데이터를 정규화하여 데이터 테이블 1(402)을 생성한다. 예컨대, Portable Forensic Data Table, Mobile Forensic Data Table, Online Forensic Data Table, Computer Forensic Data Table 등과 같은 데이터 테이블 1(402)을 생성한다. Portable Forensic Data Table 1은 System Table , Web Table, USB Table, Process Table, Command Table, FileSearch Table, Messenger Table, Documet Table, DocumetDeleted Table, Time Table, Integrated Table 등을 예로 들 수 있다. Mobile Forensic Data Table 1의 종류로는 Basic Table, Call History Table, Message Table, Phonebook Table, Photo Table, Video Table, Memo Table, Recorder Table, Email Table, SNS Table, Navi Table, Time Table, Integrated Table 등을 예로 들 수 있다. Online Forensic Data Table 1은 WebPage Table, WebMail Table, WebBlog Table, WebCafe Table, Integrated Table 등을 예로 들 수 있다. 데이터 테이블은 시각화에서 사용 가능한 데이터 형태로 변환되는데 Table, Tree, graph 등의 구조를 가진다. 또한, 미리 정의된 XML 스키마, CSV 데이터 테이블, Sql DB 등의 Configuration File이 적용된다.
제1 데이터 익스포트 유닛(540)은 시각화 데이터를 익스포트(export)하는 기능을 한다. 싱글 소스 포렌식 데이터 분석기(320)로 데이터가 전달되거나 멀티 소스 포렌식 데이터 분석기(330)로 데이터가 전달되거나 포렌식 데이터 가시화기(340)로 데이터로 전달된다. 정규화된 데이터 테이블 파일은 CSV, XML 파일 형태의 출력이거나 DB 출력일 수 있다. 출력(Output) 대상은 데이터 테이블 1(402) 혹은 파싱(Parsing)된 데이터이다.
도 6은 싱글 소스 포렌식 데이터 분석기의 내부 구성을 개략적으로 도시한 블록도이다. 도 6에 따르면, 싱글 소스 포렌식 데이터 분석기(320)는 싱글 소스 데이터 게더링 유닛(Single-Source Data Gathering Unit; 610), 싱글 소스 데이터 프로세싱 유닛(Single-Source Data Processing Unit; 620), 제2 데이터 테이블 메이킹 유닛(Second Data Table Making Unit; 630) 및 제2 데이터 익스포트 유닛(Second Data Export Unit; 640)으로 구성된다.
싱글 소스 데이터 게더링 유닛(610)은 세가지 기능을 가진다. 첫째, 싱글 소스 싱글 데이터 테이블을 수집하여 하나의 데이터 테이블 1을 수집한다. 둘째, 싱글 소스 멀티 데이터 테이블을 수집하여 다수의 데이터 테이블 1을 수집한다. 선택적인 데이터를 요구하여 그 응답이 되는 데이터를 저장한다. 세째, 포렌식 데이터 수집기(310)의 파싱된 데이터를 수집한다. 이 데이터는 데이터 테이블 1의 형태는 아니다.
싱글 소스 데이터 프로세싱 유닛(620)은 하나의 테이블에서 데이터를 소팅(sorting)하거나 특정 속성(attribute), 필드(field)만 선택하거나 특정 단어만 들어간 필드만 추출하는 등의 정의된 데이터 관계(data relation)을 처리한다. 구체적인 기능은 다음과 같다. 첫째, 싱글 소스 싱글 데이터를 처리한다. 하나의 데이터 테이블 1로부터 다수의 데이터 테이블 2 생성을 위한 데이터를 재가공하고 하나의 데이터 테이블 1을 대상으로 데이터 관계를 반영한다. 둘째, 싱글 소스 멀티 데이터를 처리한다. 다수의 데이터 테이블 1로부터 다수의 데이터 테이블 2를 위한 데이터를 재가공하고 다수의 데이터 테이블 1을 대상으로 데이터 관계를 반영한다. 세째, 포렌식 데이터 수집기(310)의 파싱된 데이터를 처리한다. 포렌식 데이터 수집기(310)의 파싱된 데이터를 대상으로 데이터 관계를 반영하여 데이터를 재가공한다. 네째, 포렌식 데이터 가시화기(340)로부터 인터랙션(Interaction)을 반영하여 데이터를 재가공한다.
제2 데이터 테이블 메이킹 유닛(630)은 컨피규레이션 파일(Configuration File)과 데이터 구조(Data Structure)를 적용하여 새로운 시각화 데이터 테이블을 정규화한다. 세부 기능은 다음과 같다. 첫째, 싱글 소스 싱글 데이터의 데이터 테이블 2(403)를 생성한다. 즉, 하나의 데이터 테이블 1로부터 다수의 데이터 테이블 2(403)를 구성한다. 둘째, 싱글 소스 멀티 데이터의 데이터 테이블 2(403)를 생성한다. 이는 다수의 데이터 테이블 1로부터 다수의 데이터 테이블 2를 구성하는 것이다. 세째, 포렌식 데이터 수집기(310)의 파싱된 데이터로부터 다수의 데이터 테이블 2를 생성한다.
제2 데이터 익스포트 유닛(640)은 시각화 데이터를 익스포트(export)한다. 멀티 소스 포렌식 데이터 분석기(330)로 데이터를 전달하거나 포렌식 데이터 가시화기(340)로 데이터를 전달한다. 당장 가시화에 사용되지 않고 나중에 사용 가능하도록 파일이나 DB 형태로 출력될 수도 있다.
도 7은 멀티 소스 포렌식 데이터 분석기의 내부 구성을 개략적으로 도시한 블록도이다. 도 7에 따르면, 멀티 소스 포렌식 데이터 분석기(330)은 멀티 소스 데이터 게더링 유닛(Multi-Source Data Gathering Unit; 710), 멀티 소스 데이터 프로세싱 유닛(Multi-Source Data Processing Unit; 720), 제3 데이터 테이블 메이킹 유닛(Third Data Table Making Unit; 730) 및 제3 데이터 익스포트 유닛(Third Data Export Unit; 740)으로 구성된다.
멀티 소스 데이터 게더링 유닛(710)의 기능은 다음과 같다. 첫째, 멀티 소스 멀티 데이터 테이블을 수집한다. 다수의 포렌식 데이터 수집기(310)로부터 다수의 데이터 테이블 1을 수집하거나 다수의 싱글 소스 포렌식 데이터 분석기(320)로부터 다수의 데이터 테이블 2를 수집한다. 데이터를 선택적으로 요구하고 그 응답이 되는 데이터를 저장한다. 둘째, 포렌식 데이터 수집기(310)의 파싱된 데이터를 수집하는데 이것은 데이터 테이블은 아니고 파싱된 멀티 소스 멀티 데이터를 수집하는 것이다. 세째, 파일 또는 DB 형태의 테이터를 수집한다. 포렌식 데이터 수집기(310)와 싱글 소스 포렌식 데이터 분석기(320)의 파일 또는 DB 출력 결과의 형태이다.
멀티 소스 데이터 프로세싱 유닛(720)은 다수의 테이블에서 데이터를 소팅(sorting)하거나 다수의 테이블에서 특정 데이터를 추출하는 등의 정의된 데이터 관계(data relation)를 처리한다. 세부 기능은 다음과 같다. 첫째, 멀티 소스 멀티 데이터를 처리한다. 다수의 데이터 테이블 1과 데이터 테이블 2, 이미 존재하는 다른 데이터 테이블(404)로부터 새로운 다수의 데이터 테이블 3(405)을 위한 데이터를 재가공하거나 서로 다른 소스로부터 다수의 데이터 테이블 1, 데이터 테이블 2를 대상으로 데이터 관계를 반영한다. 둘째, 포렌식 데이터 수집기(310)의 파싱된 데이터를 대상으로 데이터 관계를 반영하여 데이터를 재가공한다. 세째, 포렌식 데이터 가시화기(340)로부터 인터랙션을 반영하여 데이터를 재가공한다.
제3 데이터 테이블 메이킹 유닛(730)은 컨피규레이션 파일(Configuration File)과 데이터 구조(Data Structure)를 적용하여 새로운 시각화 데이터 테이블을 정규화한다. 세부 기능은 다음과 같다. 첫째, 싱글 소스 멀티 데이터의 데이터 테이블 3(405)을 생성한다. 이것은 다수의 데이터 테이블 1, 2, 3으로부터 다수의 데이터 테이블 3(405)을 구성하는 것이다. 둘째, 포렌식 데이터 수집기(310)의 파싱된 데이터의 데이터 테이블 3(405)을 생성한다. 서로 다른 소스로부터 다수의 포렌식 데이터 수집기(310)의 파싱된 데이터로부터 다수의 데이터 테이블 3(405)을 구성하는 것이다. 예컨대, 데이터 테이블 3은 Portable Data Table 1, 2, Mobile Data Table 1, 2, Online Data Table 1, 2, 그리고, Computer Data Table 1, 2로부터 생성된다.
제3 데이터 익스포트 유닛(740)은 포렌식 데이터 가시화기(340)로 데이터를 전달하여 시각화 데이터를 익스포트(export)한다. 당장 가시화에 사용되지 않고 나중에 사용 가능하도록 파일이나 DB 형태로 출력될 수도 있다.
도 8은 포렌식 데이터 가시화기의 내부 구성을 개략적으로 도시한 블록도이다. 포렌식 데이터 가시화기(340)는 데이터 테이블 1~3을 이용하여 다양한 가시화 방법을 제공해야 하고 사용자에게 친숙한 GUI를 제공해야 한다. 또한, 동일한 데이터에 대해 여러 가지 분석이 가능하도록 해야 한다. 이를 위해 포렌식 데이터 가시화기(340)는 데이터 임포트 유닛(Data Import Unit; 810), 메모리 버퍼(Memory Buffer; 820), 데이터 비주얼라이징 유닛(Data Visualizing Unit; 830), 및 데이터 리퀘스트 유닛(Data Request Unit; 840)으로 구성된다.
데이터 임포트 유닛(810)은 표현할 데이터 테이블 1, 2, 3을 입력받는 기능을 한다. 입력 소스는 포렌식 데이터 수집기(310), 싱글 소스 포렌식 데이터 분석기(320), 멀티 소스 포렌식 데이터 분석기(330), 파일/DB/Other Data 입력이다.
메모리 버퍼(820)는 동일한 데이터 테이블이 다양한 방법으로 표현될 수 있도록 동일한 메모리 버퍼를 사용하는 공간을 제공한다.
데이터 비주얼라이징 유닛(830)은 하나의 데이터 테이블에 대해 다양한 모델링을 가진 시각화가 가능하도록 한다. 동일한 데이터 테이블에 대해 다양한 visual structure를 제공하고 동일한 데이터 테이블에 대해 다양한 visual view를 제공한다. 데이터가 시간에 대한 의존성을 가지냐에 따라 정적 데이터 비주얼라이징 유닛(Static Data Visualizing Unit; 831)과 동적 데이터 비주얼라이징 유닛(Dynamic Data Visualizing Unit; 832)로 나눌 수 있다. 정적 데이터 비주얼라이징 유닛(831)은 사용자 인터랙션(User Interaction)이 없다. 반면, 동적 데이터 비주얼라이징 유닛(832)은 사용자 인터랙션이 있고 많은 데이터 테이블을 고속으로 처리할 수 있어야 한다. 디스플레이 타입(Large Screen View, Mobile View, Web View)에 따라 개발 환경과 visual structure도 달라질 수 있다.
데이터 리퀘스트 유닛(840)은 사용자 인터랙션을 반영해서 새로운 데이터 테이블을 요구하는 기능을 한다. 사용자에 의한 새로운 데이터 관계를 반영하는데 실제적인 데이터 테이블 변형은 싱글 소스 포렌식 데이터 분석기(320)와 멀티 소스 포렌식 데이터 분석기(330)에서 담당한다. 동적 데이터(Dynamic Data)를 처리하기 위해서는 포렌식 데이터 가시화기(340)가 데이터 변환 기능을 수행하는 구성에 통합되어야 하고, 만약 분리된다면 포렌식 데이터 가시화기(340)가 데이터 관계를 반영하여 데이터 프로세싱 기능을 수행해야 한다. 정적 데이터(Static Data)를 처리하기 위해서는 포렌식 데이터 가시화기(340)가 데이터 변환(Data Transform) 기능과 통합 또는 분리가 가능하다.
디스플레이 환경은 Large Screen View, Web View, Mobile View 등 다양하게 선택할 수 있다.
다음으로, 데이터 시각화 장치(100)의 데이터 시각화 방법에 대해 설명한다. 도 9는 본 발명의 바람직한 실시예에 따른 데이터 시각화 방법을 개략적으로 도시한 흐름도이다. 이하 설명은 도 9를 참조한다.
먼저, 다양한 포맷을 가지는 싱글 데이터들을 수집한다(싱글 데이터 수집 단계, S10). 이때, 하나의 데이터 수집원으로부터 포맷이 다른 싱글 데이터들을 모두 수집하거나 각각의 데이터 수집원마다 포맷을 지정한 뒤 각 데이터 수집원으로부터 지정된 포맷을 가지는 싱글 데이터만을 수집할 수 있다.
싱글 데이터 수집 단계(S10)는 다음과 같이 구체적으로 수행될 수 있다. 먼저, 미리 저장된 데이터들 중에서 시각화하려는 데이터들을 획득하거나 외부 기기로부터 시각화하려는 데이터들을 획득한다. 이후, 획득된 데이터들을 파싱한다. 이후, 파싱된 데이터들을 정규화하여 싱글 데이터들을 생성한다. 이후, 생성된 싱글 데이터들로부터 서로 다른 포맷을 가지는 싱글 데이터들을 수집한다.
싱글 데이터 수집 단계(S10) 이후, 수집된 싱글 데이터들로부터 얻은 동일한 포맷을 가지는 제1 싱글 데이터들로 제1 멀티 데이터를 생성한다(제1 멀티 데이터 생성 단계, S20).
제1 멀티 데이터 생성 단계(S20)는 다음과 같이 수행될 수 있다. 먼저, 수집된 싱글 데이터들 중에서 어느 하나의 포맷을 가지는 싱글 데이터들만 추출한다. 이때, 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 싱글 데이터들로 수집할 수 있다. 이후, 추출된 싱글 데이터들을 미리 정해진 기준에 따라 정렬시켜 싱글 데이터들 간의 관계를 규정한다. 이때, 시각화된 데이터들 간의 관계를 이용하여 상기 싱글 데이터들 간의 관계를 규정할 수 있다. 이후, 관계 규정된 싱글 데이터들을 정규화하여 제1 멀티 데이터를 생성한다.
제1 멀티 데이터 생성 단계(S20) 이후, 제1 싱글 데이터들, 제1 싱글 데이터들과 포맷이 다른 제2 싱글 데이터들, 및 생성된 제1 멀티 데이터들 중 적어도 하나의 데이터들로 제2 멀티 데이터를 생성한다(제2 멀티 데이터 생성 단계, S30).
제2 멀티 데이터 생성 단계(S30)는 다음과 같이 수행될 수 있다. 먼저, 생성된 제1 멀티 데이터들만 추출하거나, 제2 싱글 데이터들만 추출하거나, 또는 적어도 하나의 제1 싱글 데이터와 적어도 하나의 제1 멀티 데이터 및 적어도 하나의 제2 싱글 데이터 중 적어도 두개의 데이터들을 혼합 추출한다. 이때, 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 싱글 데이터들로 수집할 수 있다. 또한, 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 제1 멀티 데이터들 또는 제2 멀티 데이터들로 수집할 수 있다.
이후, 추출된 데이터들을 미리 정해진 기준에 따라 정렬시켜 추출된 데이터들 간의 관계를 규정한다. 이때, 시각화된 데이터들 간의 관계를 이용하여 싱글 데이터들 간의 관계를 규정할 수 있다. 또한, 시각화된 데이터들 간의 관계를 이용하여 상기 제1 멀티 데이터들 또는 상기 제2 멀티 데이터들 또는 이들 상호간의 관계를 규정할 수 있다.
이후, 관계 규정된 데이터들을 정규화하여 제2 멀티 데이터를 생성한다.
제2 멀티 데이터 생성 단계(S30) 이후, 수집된 싱글 데이터들, 생성된 제1 멀티 데이터, 및 생성된 제2 멀티 데이터 중 적어도 하나의 데이터를 시각화한다(데이터 시각화 단계, S40). 데이터 시각화 단계(S40)에서는 사용자 인터랙션 유무에 따라 데이터를 정적 또는 동적으로 시각화할 수 있다. 또한, 데이터 시각화 단계(S40)에서는 데이터를 동적으로 시각화할 때 미리 정해진 시간마다 시각화하려는 데이터를 재생성한 뒤 재생성된 데이터를 시각화할 수 있다. 데이터 시각화 단계(S40)에서 시각화되는 데이터는 예컨대 포렌식 데이터(forensic data)일 수 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서, 본 발명에 개시된 실시예 및 첨부된 도면들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예 및 첨부된 도면에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구 범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리 범위에 포함되는 것으로 해석되어야 할 것이다.
100 : 데이터 시각화 장치 110 : 싱글 데이터 수집부
111 : 데이터 획득부 112 : 데이터 파싱부
113 : 데이터 생성부 114 : 포맷 기반 데이터 수집부
120 : 제1 멀티 데이터 생성부 121 : 제1 데이터 추출부
122 : 제1 데이터 관계 규정부 123 : 제1 데이터 정규화부
130 : 제2 멀티 데이터 생성부 131 : 제2 데이터 추출부
132 : 제2 데이터 관계 규정부 133 : 제2 데이터 정규화부
140 : 데이터 시각화부 150 : 전원부
160 : 주제어부 300 : 포렌식 데이터 시각화 장치
310 : 포렌식 데이터 수집기 320 : 싱글소스 포렌식 데이터 분석기
330 : 멀티소스 포렌식 데이터 분석기
340 : 포렌식 데이터 가시화기

Claims (19)

  1. 서로 다른 포맷을 가지는 싱글 데이터들을 수집하는 싱글 데이터 수집부;
    수집된 싱글 데이터들로부터 얻은 동일한 포맷을 가지는 제1 싱글 데이터들로 제1 멀티 데이터를 생성하는 제1 멀티 데이터 생성부;
    상기 제1 싱글 데이터들, 상기 제1 싱글 데이터들과 포맷이 다른 제2 싱글 데이터들, 및 생성된 제1 멀티 데이터들 중 적어도 하나의 데이터들로 제2 멀티 데이터를 생성하는 제2 멀티 데이터 생성부; 및
    상기 수집된 싱글 데이터들, 상기 생성된 제1 멀티 데이터, 및 생성된 제2 멀티 데이터 중 적어도 하나의 데이터를 시각화하는 데이터 시각화부
    를 포함하는 것을 특징으로 하는 데이터 시각화 장치.
  2. 제 1 항에 있어서,
    상기 싱글 데이터 수집부는,
    미리 저장된 데이터들 중에서 시각화하려는 데이터들을 획득하거나 외부 기기로부터 시각화하려는 데이터들을 획득하는 데이터 획득부;
    획득된 데이터들을 파싱하는 데이터 파싱부;
    파싱된 데이터들을 정규화하여 싱글 데이터들을 생성하는 데이터 생성부; 및
    생성된 싱글 데이터들로부터 서로 다른 포맷을 가지는 싱글 데이터들을 수집하는 포맷 기반 데이터 수집부
    를 포함하는 것을 특징으로 하는 데이터 시각화 장치.
  3. 제 1 항에 있어서,
    상기 싱글 데이터 수집부는 하나의 데이터 수집원으로부터 포맷이 다른 싱글 데이터들을 모두 수집하거나 각각의 데이터 수집원마다 포맷을 지정한 뒤 각 데이터 수집원으로부터 지정된 포맷을 가지는 싱글 데이터만을 수집하는 것을 특징으로 하는 데이터 시각화 장치.
  4. 제 1 항에 있어서,
    상기 제1 멀티 데이터 생성부는,
    상기 수집된 싱글 데이터들 중에서 어느 하나의 포맷을 가지는 싱글 데이터들만 추출하는 제1 데이터 추출부;
    추출된 싱글 데이터들을 미리 정해진 기준에 따라 정렬시켜 싱글 데이터들 간의 관계를 규정하는 제1 데이터 관계 규정부; 및
    관계 규정된 싱글 데이터들을 정규화하여 상기 제1 멀티 데이터를 생성하는 제1 데이터 정규화부
    를 포함하는 것을 특징으로 하는 데이터 시각화 장치.
  5. 제 4 항에 있어서,
    상기 제1 데이터 추출부는 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 싱글 데이터들로 수집하는 것을 특징으로 하는 데이터 시각화 장치.
  6. 제 4 항에 있어서,
    상기 제1 데이터 관계 규정부는 시각화된 데이터들 간의 관계를 이용하여 상기 싱글 데이터들 간의 관계를 규정하는 것을 특징으로 하는 데이터 시각화 장치.
  7. 제 1 항에 있어서,
    상기 제2 멀티 데이터 생성부는,
    상기 생성된 제1 멀티 데이터들만 추출하거나, 상기 제2 싱글 데이터들만 추출하거나, 또는 적어도 하나의 제1 싱글 데이터와 적어도 하나의 제1 멀티 데이터 및 적어도 하나의 제2 싱글 데이터 중 적어도 두개의 데이터들을 혼합 추출하는 제2 데이터 추출부;
    추출된 데이터들을 미리 정해진 기준에 따라 정렬시켜 상기 추출된 데이터들 간의 관계를 규정하는 제2 데이터 관계 규정부; 및
    관계 규정된 데이터들을 정규화하여 상기 제2 멀티 데이터를 생성하는 제2 데이터 정규화부
    를 포함하는 것을 특징으로 하는 데이터 시각화 장치.
  8. 제 7 항에 있어서,
    상기 제2 데이터 추출부는 시각화하려는 데이터가 파싱되면 파싱된 데이터를 추출 대상 싱글 데이터들로 수집하는 것을 특징으로 하는 데이터 시각화 장치.
  9. 제 7 항에 있어서,
    상기 제2 데이터 관계 규정부는 시각화된 데이터들 간의 관계를 이용하여 상기 싱글 데이터들 간의 관계를 규정하는 것을 특징으로 하는 데이터 시각화 장치.
  10. 제 1 항에 있어서,
    상기 데이터 시각화부는 사용자 인터랙션 유무에 따라 데이터를 정적 또는 동적으로 시각화하는 것을 특징으로 하는 데이터 시각화 장치.
  11. 제 10 항에 있어서,
    상기 데이터 시각화부는 데이터를 동적으로 시각화할 때 미리 정해진 시간마다 시각화하려는 데이터를 재생성한 뒤 재생성된 데이터를 시각화하는 것을 특징으로 하는 데이터 시각화 장치.
  12. 제 1 항에 있어서,
    상기 데이터 시각화부가 시각화하려는 데이터는 포렌식 데이터(forensic data)인 것을 특징으로 하는 데이터 시각화 장치.
  13. 서로 다른 포맷을 가지는 싱글 데이터들을 수집하는 싱글 데이터 수집 단계;
    수집된 싱글 데이터들로부터 얻은 동일한 포맷을 가지는 제1 싱글 데이터들로 제1 멀티 데이터를 생성하는 제1 멀티 데이터 생성 단계;
    상기 제1 싱글 데이터들, 상기 제1 싱글 데이터들과 포맷이 다른 제2 싱글 데이터들, 및 생성된 제1 멀티 데이터들 중 적어도 하나의 데이터들로 제2 멀티 데이터를 생성하는 제2 멀티 데이터 생성 단계; 및
    상기 수집된 싱글 데이터들, 상기 생성된 제1 멀티 데이터, 및 생성된 제2 멀티 데이터 중 적어도 하나의 데이터를 시각화하는 데이터 시각화 단계
    를 포함하는 것을 특징으로 하는 데이터 시각화 방법.
  14. 제 13 항에 있어서,
    상기 싱글 데이터 수집 단계는,
    미리 저장된 데이터들 중에서 시각화하려는 데이터들을 획득하거나 외부 기기로부터 시각화하려는 데이터들을 획득하는 데이터 획득 단계;
    획득된 데이터들을 파싱하는 데이터 파싱 단계;
    파싱된 데이터들을 정규화하여 싱글 데이터들을 생성하는 데이터 생성 단계; 및
    생성된 싱글 데이터들로부터 서로 다른 포맷을 가지는 싱글 데이터들을 수집하는 포맷 기반 데이터 수집 단계
    를 포함하는 것을 특징으로 하는 데이터 시각화 방법.
  15. 제 13 항에 있어서,
    상기 제1 멀티 데이터 생성 단계는,
    상기 수집된 싱글 데이터들 중에서 어느 하나의 포맷을 가지는 싱글 데이터들만 추출하는 제1 데이터 추출 단계;
    추출된 싱글 데이터들을 미리 정해진 기준에 따라 정렬시켜 싱글 데이터들 간의 관계를 규정하는 제1 데이터 관계 규정 단계; 및
    관계 규정된 싱글 데이터들을 정규화하여 상기 제1 멀티 데이터를 생성하는 제1 데이터 정규화 단계
    를 포함하는 것을 특징으로 하는 데이터 시각화 방법.
  16. 제 13 항에 있어서,
    상기 제2 멀티 데이터 생성 단계는,
    상기 생성된 제1 멀티 데이터들만 추출하거나, 상기 제2 싱글 데이터들만 추출하거나, 또는 적어도 하나의 제1 싱글 데이터와 적어도 하나의 제1 멀티 데이터 및 적어도 하나의 제2 싱글 데이터 중 적어도 두개의 데이터들을 혼합 추출하는 제2 데이터 추출 단계;
    추출된 데이터들을 미리 정해진 기준에 따라 정렬시켜 상기 추출된 데이터들 간의 관계를 규정하는 제2 데이터 관계 규정 단계; 및
    관계 규정된 데이터들을 정규화하여 상기 제2 멀티 데이터를 생성하는 제2 데이터 정규화 단계
    를 포함하는 것을 특징으로 하는 데이터 시각화 방법.
  17. 제 13 항에 있어서,
    상기 데이터 시각화 단계는 사용자 인터랙션 유무에 따라 데이터를 정적 또는 동적으로 시각화하는 것을 특징으로 하는 데이터 시각화 방법.
  18. 제 17 항에 있어서,
    상기 데이터 시각화 단계는 데이터를 동적으로 시각화할 때 미리 정해진 시간마다 시각화하려는 데이터를 재생성한 뒤 재생성된 데이터를 시각화하는 것을 특징으로 하는 데이터 시각화 방법.
  19. 제 13 항에 있어서,
    상기 데이터 시각화 단계에서 시각화되는 데이터는 포렌식 데이터(forensic data)인 것을 특징으로 하는 데이터 시각화 방법.
KR1020110135928A 2011-12-15 2011-12-15 데이터 시각화 장치 및 방법 KR20130068633A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020110135928A KR20130068633A (ko) 2011-12-15 2011-12-15 데이터 시각화 장치 및 방법
US13/488,826 US8856152B2 (en) 2011-12-15 2012-06-05 Apparatus and method for visualizing data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110135928A KR20130068633A (ko) 2011-12-15 2011-12-15 데이터 시각화 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20130068633A true KR20130068633A (ko) 2013-06-26

Family

ID=48611261

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110135928A KR20130068633A (ko) 2011-12-15 2011-12-15 데이터 시각화 장치 및 방법

Country Status (2)

Country Link
US (1) US8856152B2 (ko)
KR (1) KR20130068633A (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10318956B2 (en) * 2014-09-22 2019-06-11 Payactiv, Inc. Systems and methods for utilization of earned but unpaid income
US10628393B2 (en) * 2015-06-24 2020-04-21 International Business Machines Corporation Generating data tables
CN108876666A (zh) * 2018-07-06 2018-11-23 苏州昶彭知识产权运营有限公司 知识产权大数据管理系统

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL136233A (en) * 2000-05-18 2009-05-04 Whitmaps Us Foundation Llc Method and system for retrieving map data via a communication network
US7092957B2 (en) * 2002-01-18 2006-08-15 Boundary Solutions Incorporated Computerized national online parcel-level map data portal
US7421660B2 (en) * 2003-02-04 2008-09-02 Cataphora, Inc. Method and apparatus to visually present discussions for data mining purposes
US7107285B2 (en) * 2002-03-16 2006-09-12 Questerra Corporation Method, system, and program for an improved enterprise spatial system
US8458805B2 (en) * 2003-06-23 2013-06-04 Architecture Technology Corporation Digital forensic analysis using empirical privilege profiling (EPP) for filtering collected data
US20050076313A1 (en) * 2003-10-03 2005-04-07 Pegram David A. Display of biological data to maximize human perception and apprehension
US8060112B2 (en) * 2003-11-20 2011-11-15 Intellient Spatial Technologies, Inc. Mobile device and geographic information system background and summary of the related art
US7245923B2 (en) * 2003-11-20 2007-07-17 Intelligent Spatial Technologies Mobile device and geographic information system background and summary of the related art
US7734607B2 (en) * 2005-02-01 2010-06-08 University Of Massachusetts Universal visualization platform
US7535473B2 (en) * 2005-09-20 2009-05-19 Erdas, Inc. Collaborative environments in a graphical information system
US20070180385A1 (en) * 2006-02-01 2007-08-02 Siva Somasundaram Apparatus for visual navigation of large, complex out-of-band and in-band network management and access entities
US8392418B2 (en) * 2009-06-25 2013-03-05 University Of Tennessee Research Foundation Method and apparatus for predicting object properties and events using similarity-based information retrieval and model
US8640056B2 (en) 2007-07-05 2014-01-28 Oracle International Corporation Data visualization techniques
WO2010084139A1 (en) * 2009-01-21 2010-07-29 Universiteit Gent Geodatabase information processing
EP3825833B1 (en) * 2009-06-10 2022-08-03 Hexagon Technology Center GmbH Ontological filtering using spatial boundary of 3d objects
US20100332468A1 (en) * 2009-06-26 2010-12-30 Simon John Cantrell Spatial search engine support of virtual earth visualization system
US8176053B2 (en) * 2010-02-17 2012-05-08 Lockheed Martin Corporation Query system for a hybrid voxel and feature database
US9400958B2 (en) * 2010-06-30 2016-07-26 Oracle International Corporation Techniques for display of information related to policies
US20120174001A1 (en) * 2010-12-31 2012-07-05 Itschak Friedman Graphically based hierarchical method for documenting items of evidence genealogy

Also Published As

Publication number Publication date
US20130159327A1 (en) 2013-06-20
US8856152B2 (en) 2014-10-07

Similar Documents

Publication Publication Date Title
CN110532019B (zh) 一种软件代码片段历史追溯的方法
CN104778241A (zh) 一种报表生成方法及系统
RU2007138848A (ru) Определяющие поля для представляемых файлов и схемы расширяемого языка разметки для библиографий и цитирования
CN105144155A (zh) 可视地表示多源数据的查询
CN110674083A (zh) 工作流迁移方法、装置、设备及计算机可读存储介质
CN114443854A (zh) 多源异构数据的处理方法、装置、计算机设备及存储介质
CN110851234A (zh) 基于docker容器的日志处理方法及装置
Padhy et al. Brown dog: Leveraging everything towards autocuration
CN107704620B (zh) 一种档案管理的方法、装置、设备和存储介质
KR20130068633A (ko) 데이터 시각화 장치 및 방법
Inglot et al. A framework for enhanced timeline analysis in digital forensics
CN112818070A (zh) 基于全域数据字典的数据查询方法、装置及电子设备
CN103473306A (zh) 一种采用sql标记替换法实现数据自取的方法及系统
KR102345410B1 (ko) 빅데이터 지능형 수집 방법 및 장치
CN112131288B (zh) 数据源接入处理方法和装置
CN112036843A (zh) 基于rpa及ai的流程元素定位方法、装置、设备和介质
CN115757174A (zh) 一种数据库的差异检测方法及装置
KR20200103133A (ko) 하둡 기반의 빅데이터 시스템에서 etl 절차를 수행하는 방법 및 장치
CN116225902A (zh) 生成测试用例的方法、装置及设备
CN115510361A (zh) 一种基于可视化配置的数据图表页面生成方法及相关设备
CN113407678B (zh) 知识图谱构建方法、装置和设备
CN115795046A (zh) 数据加工方法、装置、系统、电子设备和存储介质
Jochim Extending the EMU Speech Database Management System: Cloud Hosting, Team Collaboration, Automatic Revision Control.
JP2013145508A (ja) グラフパターンマッチングシステムおよびグラフパターン代表元抽出方法
CN113760734A (zh) 一种数据准备方法及装置、设备、存储介质

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid