KR101895848B1 - 문서 보안 방법 - Google Patents

문서 보안 방법 Download PDF

Info

Publication number
KR101895848B1
KR101895848B1 KR1020160182044A KR20160182044A KR101895848B1 KR 101895848 B1 KR101895848 B1 KR 101895848B1 KR 1020160182044 A KR1020160182044 A KR 1020160182044A KR 20160182044 A KR20160182044 A KR 20160182044A KR 101895848 B1 KR101895848 B1 KR 101895848B1
Authority
KR
South Korea
Prior art keywords
document
image
information
puzzling
shuffling
Prior art date
Application number
KR1020160182044A
Other languages
English (en)
Other versions
KR20180077573A (ko
Inventor
백기영
Original Assignee
주식회사 에이치앤비트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 에이치앤비트 filed Critical 주식회사 에이치앤비트
Priority to KR1020160182044A priority Critical patent/KR101895848B1/ko
Publication of KR20180077573A publication Critical patent/KR20180077573A/ko
Application granted granted Critical
Publication of KR101895848B1 publication Critical patent/KR101895848B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F17/30244
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0061Embedding of the watermark in each block of the image, e.g. segmented watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Abstract

본 발명은 이미지화한 문서를 퍼즐화한 이후 복수의 DB 서버에 분산 저장하고, 문서 이미지를 얻기 위해서는 분산 저장된 이미지를 취합하는 과정 및 퍼즐화된 이미지를 복원하는 과정을 거치게 함으로서, 개별 DB 서버의 해킹에 의한 문서 정보의 유출을 방지할 뿐만 아니라 모든 DB 서버가 해킹되더라도 문서 정보를 얻을 수 없게 하고, 아울러, 퍼즐화 정보를 의사 난수 발생기의 시이드 값의 수열 개수로 간소화하고, 확률적으로 적절하게 퍼즐화함으로써 과도하거나 부족하게 퍼즐화하지 아니하면서 퍼즐화에 의한 보안성을 확보하며, 문서 내용을 검색할 수 있게 하고, 이미지-문서 변환에 의해 원 문서를 제공하여 활용도를 높인 문서 보안 방법에 관한 것이다.
본 발명과 관련된 연구는 미래창조과학부 '범부처 Giga KOREA 사업[GK16P0100,Giga Media 기반 Tele-Experience 서비스 SW플랫폼 기술 개발]'의 지원을 받아 수행하였음(This work was supported by 'The Cross-Ministry Giga KOREA Project' grant from the Ministry of Science, ICT and Future Planning, Korea[GK16P0100, Development of Tele-Experience Service SW Platform based on Giga Media]).

Description

문서 보안 방법{DOCUMENT SECURITY METHOD}
본 발명은 이미지화한 문서를 복수 이미지 조각으로 나누고 퍼즐화한 이후, 복수의 DB 서버에 분산 저장하고, 문서 이미지를 얻기 위해서는 분산 저장된 이미지를 취합하는 과정 및 퍼즐화된 이미지를 복원하는 과정을 거치게 한 문서 보안 방법에 관한 것이다.
본 발명과 관련된 연구는 미래창조과학부 '범부처 Giga KOREA 사업[GK16P0100,Giga Media 기반 Tele-Experience 서비스 SW플랫폼 기술 개발]'의 지원을 받아 수행하였음(This work was supported by 'The Cross-Ministry Giga KOREA Project' grant from the Ministry of Science, ICT and Future Planning, Korea[GK16P0100, Development of Tele-Experience Service SW Platform based on Giga Media]).
결제 정보, 계약 정보, 개인 정보, 유전자 정보, 병원 진료 정보, 경영 정보, 기밀 정보 등에 관련된 전자문서를 분산 저장하는 기존 기술은 정보를 분할하여 복수 DB 서버에 저장하고 어느 DB 서버에 분산 저장하였는지에 대한 정보를 별도의 DB 서버에 저장한다. 이에 따라, 개별 DB 서버를 해킹하더라도 원 정보를 온전히 얻을 수 없게 하였다.
정보를 열람 또는 다운로드하여 활용할 시에는 분산 저장 정보에 따라 각 DB 서버로부터 정보를 취합하여 복원하게 하였다.
또한, 보안성을 강화하기 위해서, 정보를 암호화한 이후 복수 DB 서버에 분산 저장하였다.
그런데, 복호화를 어렵게 하려면 암호화 과정을 복잡하고 난해하게 하여야 하고, 암호화 과정이 분산 저장하는 방식과는 별도로 이루어져서 이원화됨에 따라 복잡도를 줄일 수 없다.
한편, 공개특허 10-2001-0044248호에 기술된 바와 같이 문서를 스캔 또는 그래픽화하여 얻는 이미지를 분할하여 분산 저장하는 기술이 있다.
이 기술은 이미지화한 후 분산 저장할 종이문서를 스캔하여 이미지 포맷으로 변환한 후 보관 관리하는 데 있어 유용하다.
그렇지만, 개별 DB 서버에 분산 저장된 이미지들은 일부 이미지 조각들만 포함된 것이기는 하지만, 온전한 원 이미지를 유추할 수 있는 정보를 담고 있어서, 보안성에 취약하며, 이러한 보안성 취약 문제를 해소하기 위해서는 원 이미지를 형상에 따라 적절하게 분할하여야 하고, 분할 그룹의 수도 상당히 크게 하여야 하는 어려움이 따른다.
KR 10-0749428 B1 2007.08.08. KR 10-2001-0044248 A 2001.06.05.
따라서, 본 발명은 문서를 그래픽 문서화한 이미지를 암호화한 후 분산 저장하여 분산 저장한 개별 이미지로 원 이미지의 유추를 원천 차단하는 한편, 이미지 암호화 과정을 분산 저장 과정에 연계하여 복잡도를 줄이며, 이미지 암호화의 복잡도를 줄여 이미지 복원도 용이한 문서 보안 방법을 제공하는 데 목적이 있다.
상기 목적을 달성하기 위해 본 발명은 문서를 분할하여 복수의 DB 서버(3)에 분산 저장하고 분산 저장된 문서를 취합하기 위한 문서정보를 문서정보 DB 서버(4)에 등록하는 문서 등록부(10) 및 문서를 요청받을 시에 분산 저장된 문서를 문서정보에 따라 취합 복원하여 제공하는 문서 복원부(20)에 의해 이루어지는 문서 보안 방법에 있어서, 문서 등록부(10)에 의해 수행하는 문서 등록 단계(S100); 및 문서 복원부(20)에 의해 수행되는 문서 복원 단계(S200);로 이루어진다.
상기 문서 등록 단계(S100)는 문서를 그래픽 문서화한 이미지 또는 그래픽 문서로 작성된 이미지를 복수의 조각으로 분할한 후 이미지 조각들의 배열을 변경하여 퍼즐화 이미지를 얻는 퍼즐화 단계(S110)와, 문서의 속성 정보를 텍스트 형태로 추출하는 속성 추출 단계(S120)와, 퍼즐화 이미지의 이미지 조각들을 복수 그룹으로 분류하여 복수의 DB 서버(3)에 분산 저장하는 분산 저장 단계(S130)와, 퍼즐화 정보, 분산 저장 정보 및 속성 정보를 문서정보로 하여 문서정보 DB 서버(4)에 등록하는 문서정보 DB화 단계(S140)를 포함한다.
상기 문서 복원 단계(S200)는 문서 제공을 요청받을 시에 해당 문서의 속성 정보에 근거하여 대응되는 퍼즐화 정보 및 분산 저장 정보를 얻는 검색 단계(S210)와, 분산 저장된 이미지를 분산 저장 정보에 따라 취합한 후 결합한 이미지를 얻는 취합 단계(S220)와, 퍼즐화 정보에 근거하여 퍼즐화할 시 배열 변경의 역으로 재배열하여 퍼즐화 이전의 이미지를 얻는 역퍼즐화 단계(S230)를 포함한다.
상기 문서 복원 단계(S200)는 역퍼즐화 단계(S230)에서 얻은 이미지가 문서를 그래픽 형태로 변환한 이미지인 경우에 텍스트 인식하여 그래픽화 이전 문서를 얻는 문서화 단계(S240)를 포함할 수 있다.
상기 속성 추출 단계(S120)는 문서 내의 텍스트를 추출하여 속성 정보에 포함시키고, 상기 검색 단계(S210)는 속성 정보에 포함된 텍스트를 검색하여 속성 정보를 특정한 후 특정한 속성 정보에 대응되는 퍼즐화 정보 및 분산 저장 정보를 얻는다.
상기 분산 저장 단계(S110)는 각 그룹에 대해 퍼즐화 이미지 상에서의 이미지 조각들을 위치 변경 없이 그대로 두고 나머지 영역을 비워둔 희소성 이미지를 생성하여 서로 다른 DB 서버(3)에 저장하고, 상기 취합 단계(S220)는 각 DB 서버(3)에서 취한 희소성 이미지를 겹쳐 결합한다.
상기 분산 저장 단계(S110)는 각 그룹에 대해 퍼즐화 이미지 상에서의 이미지 조각들을 위치 변경 없이 그대로 두고 나머지 영역을 임의의 이미지로 채운 희소성 이미지를 생성하여 서로 다른 DB 서버(3)에 저장하고, 상기 취합 단계(S220)는 각 DB 서버(4)에서 취한 희소성 이미지를 상기 임의의 이미지를 삭제한 한 후 겹쳐 결합한다.
상기 퍼즐화 단계(S110)는 이미지의 분할 위치에 번호를 매기고, 시이드(seed)에 따라 난수 수열이 결정되는 의사 난수 발생기(pseudo random number generator)로 셔플링 회수의 2배수 난수 수열을 생성하되, 난수 수열의 순서로 2개씩 취하여 2개의 난수 번호를 매긴 분할 위치의 이미지 조각을 위치 교환하는 셔플링(shuffling) 과정을 반복함으로써 퍼즐화 이미지를 생성하고, 상기 퍼즐화 정보는 시이드 값 및 셔플링 회수를 포함하며, 상기 역퍼즐화 단계(S230)는 시이드 값에 따라 셔플링 회수의 2배수 난수 수열을 생성한 후, 난수 수열의 역순으로 2개씩 취하여 2개의 난수 번호를 매긴 분할 위치의 이미지 조각을 위치 교환하는 셔플링(shuffling) 과정을 반복함으로써 퍼즐화 이전의 이미지를 얻는다.
상기 셔플링 회수는 셔플링 과정을 반복함에 따라 어느 하나의 특정 이미지 조각이 확률적으로 분할 위치에 관계없이 균일 확률로 존재할 수 있는 정상 분포(stationary distribution)로의 수렴도(convergence rate), 및 분할한 이미지 조각의 개수의 함수로 결정된다.
상기 수렴도는 분할 위치별 확률의 최대 편차를 정상 분포일 때의 분할 위치 확률로 나누어 얻는 값으로 한다.
상기 셔플링 회수(k)는 이미지 조각의 개수(N) 및 수렴도(β)에 따라 수학식
Figure 112016128943761-pat00001
으로 산정한다.
상기와 같이 이루어지는 본 발명은 이미지를 복수 이미지 조각으로 분할하고 배열 변경하여 퍼즐화한 이후, 복수 이미지 조각을 분산 저장하므로, 개별 저장 이미지의 유출뿐만 아니라 모든 저장 이미지의 유출에 의해서도 원 이미지의 온전한 복원을 원천 차단할 수 있다.
또한, 본 발명은 복원한 이미지를 이미지-문서 변환하여 활용도를 높인다.
또한, 본 발명은 분산 저장하는 이미지를 희소성 이미지로 함으로써, 이미지 퍼즐화 과정의 추가에 따른 복원 시 복잡도를 최소화한다.
또한, 본 발명은 이미지 퍼즐화를 추가함에도 시이드 값 및 셔플링 회수만으로 역퍼즐화할 수 있으므로, 문서 관리 및 복원 시 복잡도를 더욱 줄일 수 있다.
또한, 본 발명은 적절한 퍼즐화 이미지를 얻을 수 있는 최적의 셔플링 회수로 퍼즐화하므로, 운용 효율을 극대화할 수 있다.
도 1은 본 발명의 실시 예에 따른 문서 보안 방법을 위한 문서 보안 시스템의 블록 구성도.
도 2는 문서 보안 시스템의 변형 예를 보여주는 블록 구성도.
도 3은 본 발명의 실시 예에 따른 문서 보안 방법의 순서도.
도 4는 퍼즐화 단계(S110) 및 분산 저장 단계(S130)에 의한 이미지의 변동 과정(실선 화살표)과, 취합 단계(S220) 및 역퍼즐화 단계(S230)에 의한 이미지의 변동 과정(파선 화살표)을 보여주는 이미지 도면.
도 5는 퍼줄화 단계(110)에서 셔플링(shuffling) 회수의 증가에 따른 이미지의 변동 과정을 보여주는 이미지 도면.
이하, 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 당해 분야에 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 설명한다. 본 발명의 실시 예를 설명함에 있어서, 관련된 공지의 기능 또는 공지의 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.
도 1을 참조하면, 본 발명의 실시 예에 따른 문서 보안 방법을 위한 문서 보안 시스템은 문서를 분할하여 분산 저장하기 위한 복수의 DB 서버(3), 분산 저장된 문서를 불러들이고 취합하기 위한 문서정보를 저장하기 위한 문서정보 DB 서버(4), 및 DB화 등록 요청받는 문서를 복수 DB 서버(3)에 저장시키고 복원 요청받는 문서를 복수 DB 서버(3)에서 취합 복원하여 제공하는 문서 보안 서버(6)를 포함하여 구성된다.
이에, 상기 문서 보안 서버(6)는 네트워크(5)를 통해 제1 단말(1)에서 요청하는 문서 DB화를 접수할 시에 문서를 분할하여 복수의 DB 서버(3)에 분산 저장하는 한편, 문서정보를 문서정보 DB 서버(4)에 등록 저장하는 문서 등록부(10)와, 네트워크(5)를 통해 제2 단말(2)에서 요청하는 문서 제공을 접수할 시에 복수 DB 서버(3)에 분산 저장된 문서를 문서정보 DB 서버(4)에 저장된 문서정보에 따라 각 DB 서버(3)로부터 불러들여 취합 복원한 문서를 제2 단말(2)에 전송 제공하는 문서 복원부(20)를 구비한다.
여기서, 복수 DB 서버(3)에 분산 저장할 문서는 텍스트 요소를 포함한 문서 또는 그래픽 요소만 포함된 문서를 그래픽 문서화한 이미지일 수 있으며, 물론, 문서가 전자문서로서 그래픽 데이터로 작성된 경우에는 그래픽 문서화하지 아니하고 그대로 사용한다.
문서는 종이문서(책자를 포함) 및 전자문서로 구분할 수 있다.
전자문서는 워드 문서, 데이터베이스 파일, 스프레드 쉬트, 프로그램 소스코드, 이미지 파일(그래픽 데이터) 등을 포함한다.
즉, 본 발명에 따르면 제1 단말(1)에서 전자문서의 일종인 그래픽 데이터로 이루어지는 이미지, 종이문서를 스캔한 이미지, 또는 이미지 파일 형식을 제외한 다른 형식의 전자문서를 그래픽 형태로 포맷 변환한 이미지를 문서 보안 서버(6)에 전송하게 하거나, 또는 제1 단말(1)로부터 이미지 파일이 아닌 전자문서로 전송할 시에 문서 보안 서버(6)의 문서 등록부(10)에서 그 전자문서를 이미지로 변환하게 한다.
이에, 문서 등록부(10)에는 문서-이미지 변환부(미도시)를 구비하는 것이 좋다.
이와 같은 이미지의 등록 요청을 접수하는 상기 문서 등록부(10)는 이미지를 복수의 조각으로 분할한 후 이미지 조각들의 배열을 변경하여 퍼즐화 이미지를 얻는 퍼즐화부(11), 문서의 속성 정보를 텍스트 형태로 얻는 속성 추출부(12) 및 퍼즐화 이미지의 이미지 조각들을 복수 그룹으로 분류하여 복수의 DB 서버(3)에 분산 저장하고, 퍼즐화 정보, 분산 저장 정보 및 속성 정보를 문서정보로 하여 문서정보 DB 서버(4)에 등록 저장하는 DB화부(13)를 포함한다.
문서의 속성 정보는 통상적으로 사용되는 문서 분류 및 조회를 위한 정보, 메타 정보 등을 포함할 수 있으며, 본 발명의 실시 예에서는 문서 내용을 단어 또는 키워드로 검색하기 위해 이미지화 이전 문서의 텍스트 또는 이미지 내에서 문자 인식(OCR : Optical character recognition)에 의해 얻는 텍스트를 속성 정보에 포함시키며, 이때 포함시키는 텍스트는 예를 들면 색인으로 할 수도 있다. 물론, 속성 정보는 제1 단말(1)로부터 전송받을 수도 있다.
본 발명의 실시 예에 따르면, 이미지의 분할 위치에 번호를 매긴 후, 시이드(seed) 값에 따라 난수 수열이 결정되는 의사 난수 발생기(pseudo random number generator)로 2개 번호를 생성하여 생성한 2개 번호를 매긴 분할 위치의 이미지 조각을 위치 교환하는 셔플링(shuffling) 과정을 소정 회수 반복하므로, 상기 퍼즐화 정보는 시이드(seed) 값 및 셔플링 회수를 포함하고, 2개씩 생성한 난수 수열 전체는 포함하지 아니하여도 된다.
한편, 후술하는 바와 같이, 본 발명의 실시 예에 따르면 상기 셔플링 회수는 확률적 정상 분포(stationary distribution)로의 수렴도(convergence rate)와, 분할한 이미지 조각 개수의 함수로 결정한다.
상기 분산 저장 정보는 분류한 각 그룹별로 저장된 DB 서버(3)의 IP 주소 또는 저장 위치를 포함으로써 네트워크를 통해 불러들이기 위한 접근 정보로 사용된다.
각 그룹 내 이미지 조각들에 대한 퍼즐화 이미지 상의 위치(즉 분할 위치) 정보는 상기 분산 저장 정보에 포함시킬 수도 있다.
그렇지만, 본 발명의 실시 예에 따르면, 복수 DB 서버(3)에 분산 저장되는 이미지는 각 그룹에 대해 퍼즐화 이미지 상에서의 이미지 조각들을 위치 변경 없이 그대로 두고, 나머지 영역을 비워두거나 아니면 임의의 이미지로 채운 희소성 이미지로 한다. 이에, 각 그룹 내 이미지 조각들의 위치 정보는 분산 저장 정보에 포함시키지 아니하여도 좋다. 다만, 상기 임의의 이미지를 희소성 이미지에 채워 넣는 경우에는, 임의의 이미지를 구분하기 위한 정보를 분산 저장 정보에 포함시키는 것이 바람직하다.
상기 문서 복원부(20)는 상기한 바와 같이 저장한 복수 희소성 이미지 및 문서정보를 제2 단말(2)에서 검색 또는 조회하여 문서를 제공받을 수 있게 하는 구성요소로서, 제2 단말(2)이 네트워크(5)를 통해 접속하여 문서 제공을 요청할 시에, 속성 정보에 근거하여 요청 문서에 관련된 속성 정보를 특정함으로써 요청 문서에 대응되는 퍼즐화 정보 및 분산 저장 정보를 얻는 검색부(21), 각 DB 서버(3)에 분산 저장된 희소성 이미지를 분산 저장 정보에 따라 취합한 후 결합한 이미지를 얻은 후 퍼즐화 정보에 근거하여 퍼즐화할 시 배열 변경의 역으로 재배열하여 퍼즐화 이전의 이미지를 얻는 이미지 복원부(22), 및 이때 얻은 이미지가 문서를 그래픽 형태로 변환한 이미지인 경우에 문자 인식(OCR : Optical character recognition)하여 그래픽화 이전 전자 문서를 얻는 문서화부(23)를 구비한다.
본 발명의 실시 예에 따르면, 복수 DB 서버(3)에 분산 저장된 이미지는 퍼즐화 이미지 상의 이미지 조각 위치에 대해 변동을 주지 아니한 희소성 이미지이므로, 각 DB 서버(3)에서 취한 각 희소성 이미지를 겹쳐 원 퍼즐화 이미지를 복원할 수 있다.
도 2는 도 1에 도시한 문서 보안 시스템의 변형 예를 보여주는 블록 구성도로서, 문서 등록부(10)를 제1 단말(1)에 구비하고, 문서 복원부(20)를 제2 단말(2)에 구비하며, 문서 보안 서버(6)는 별도로 구비하지 아니한다. 여기서, 문서 복원부(20)는 문서정보 DB 서버(4)에 등록한 문서정보에 따라 복수 DB 서버(3)에 분산 저장된 희소성 이미지로부터 문서를 얻을 수 있다.
도면으로 첨부하지는 아니하였지만, 다른 변형 예로서, 문서 등록부(10)의 퍼즐화부(11) 및 속성 추출부(12)를 제1 단말에 구비하고, 문서 보안 서버(6)는 DB화부(13) 및 문서 복원부(20)를 구비하게 할 수도 있다.
이와 같은 변형 실시 예는 동일 기능의 구성요소를 위치 변경한 것에 불과하다.
이하, 상기한 문서 보안 시스템의 문서 등록부(10) 및 문서 복원부(20)에 이루어지는 문서 보안 방법에 대해서 상세하게 설명한다.
도 3에 도시한 바와 같이, 본 발명의 실시 예에 따른 문서 보안 방법은 문서 등록부(10)에 의해 수행되는 문서 등록 단계(S100)와, 제2 단말(2)로부터 문서 제공을 요청받을 시에(S201) 문서 복원부(20)에 의해 수행되는 문서 복원 단계(S200)로 이루어진다.
상기 문서 등록 단계(S100)는 텍스트 요소를 포함한 문서를 그래픽화한 이미지 또는 그래픽 문서로 작성된 이미지를 복수의 조각으로 분할한 이후 이미지 조각들의 위치를 바꿔 배열 변경함으로써 원 문서의 내용 또는 원 문서에 표출된 형상을 유추하지 못하게 한 퍼즐화 이미지를 얻는 퍼즐화 단계(S110)와, 문서를 검색 또는 조회할 시에 사용할 속성 정보를 문서 또는 문서의 이미지로부터 추출하거나 또는 문서 등록을 하는 제1 단말(1)로부터 전송받는 속성 추출 단계(S120)와, 퍼즐화 이미지의 이미지 조각들을 복수 그룹으로 분류한 후 복수의 DB 서버(3)에 분산 저장하는 분산 저장 단계(S130)와, 퍼즐화 정보, 분산 저장 정보 및 속성 정보를 문서정보로 하여 문서정보 DB 서버(4)에 등록하는 문서정보 DB화 단계(S140)의 순서로 이루어진다.
본 발명의 실시 예에 따른 상기 퍼즐화 단계(S110)에 대해서는 도 4 및 도 5를 참조하며 설명한다. 여기서, 도4를 참조할 시에는 실선 화살표 방향으로 변화를 참조하면 된다.
상기 퍼즐화 단계(S110)는 도 4에 도시한 바와 같이 원 이미지(A)를 격자 형태로 분할한 이후, 원 이미지(A)를 유추하기도 어렵고 어떤 내용 또는 이미지가 있는지도 알아보기 어려울 정도의 퍼즐화 이미지(B)를 얻을 때까지 분할 이미지(a)들의 배열을 변경하는 단계로서, 본 발명의 실시 예에 따르면, 2개 분할 이미지(a)를 무작위로 취하여 위치 교환하는 셔플링(shuffling) 과정을 반복한다.
도 5에 구체적으로 예시한 도면을 참조하며 구체적으로 설명하면, 원 이미지(A)를 가로 7열 및 세로 9열로 나눠 63개의 분할 이미지로 분할하고 순서에 따라 각 분할 위치에 1에 63까지 번호를 매긴 이후, 1부터 63까지의 번호 중에 2개의 난수에 대응되는 위치의 이미지 조각(a)을 위치 교환하는 셔플링 과정을 소정의 셔플링 회수만큼 반복한다. 도 5에 예시한 바와 같이 3회까지의 셔플링 과정에서 난수가 서로 다르면 6개 분할 이미지가 위치 변동하고, 셔플링 과정을 진행할수록 원 이미지(A) 상의 위치와 다른 위치로 변동하는 분할 이미지(a)의 개수도 증가하게 된다.
그런데, 퍼즐화 이미지를 얻기 위해 사용한 난수의 개수만큼 퍼즐화 정보의 데이터량도 증가하며, 셔플링 회수를 많게 하면 퍼즐화 단계(S110)에 소요되는 시간이 길어지고, 셔플링 회수를 너무 적게 하면 적절한 퍼즐화 이미지를 얻을 수 없게 되는 문제가 있다.
본 발명의 실시 예에서는 난수의 개수에 무관하게 시이드(seed) 값과 셔플링 회수를 퍼즐화 정보로 하여 셔플링 회수의 변동에 따른 데이터량의 증가 없이 일정한 데이터량을 갖게 하고, 셔플링 회수도 적절한 퍼즐화 이미지를 얻을 수 있는 적정 셔플링 회수를 사용한다.
먼저, 난수에 대해서는 시이드(seed)에 따라 난수 수열이 결정되는 의사 난수 발생기(pseudo random number generator)로 적정 셔플링 회수의 2배수 난수 수열을 생성하되, 생성 순서에 따라 2개씩 취하여 난수 번호가 매겨진 분할 위치의 이미지 조각을 위치 교환하는 셔플링 과정을 반복한다. 물론 시이드 값은 임의의 값으로 하는 것이 좋다.
그리고, 퍼즐화 정보는 시이드 값과 적정 셔플링 회수를 포함하게 한다. 즉, 하기의 역퍼즐화 단계(S230)에서 동일한 의사 난수 발생기에 시이드 값을 적용하여 적정 셔플링 회수의 2배수 난수 수열을 생성함으로써 퍼즐화 과정에 적용한 난수를 얻게 한다.
다음으로, 적정 셔플링 회수에 대해서는 셔플링 회수의 증가에 따라 각 이미지 조각 또는 어느 하나의 특정 이미지 조각이 확률적으로 분할 위치에 관계없이 균일 확률로 존재할 수 있는 정상 분포(stationary distribution)로의 수렴도(convergence rate) 및 분할한 이미지 조각 개수의 함수로 결정한다.
바람직하게는 상기 수렴도는 분할 위치별 확률의 최대 편차를 정상 분포일 때의 분할 위치 확률로 나누어 얻는 정규화 값으로 하여서, 분할 이미지 조각의 개수에 따라 위치별 확률 분포의 편차가 상이하게 되는 문제도 해소하였다.
여기서, 정상 분포일 때의 분할 위치 확률은 이미지 조각 개수의 역수이다.
수식으로 설명하면, 상기 퍼즐화 단계(S110)는 아래의 수학식 1로 적정 셔플링 회수를 산정 사용한다.
Figure 112016128943761-pat00002
수학식 1에서, k는 적정 셔플링 회수이고, N은 분할 이미지 조각의 개수이고, β는 상기한 바와 같이 정규한화 값으로서 사전에 설정한 수렴도이다.
상기 수학식 1의 도출과정은 하기에서 상세하게 설명한다.
상기 속성 추출 단계(S120)에서 추출하는 속성 정보는 문서 관리를 위한 분류 정보 또는 조회 정보, 메타 정보 등을 포함할 수 있고, 본 발명의 실시 예에서는 문서에서 직접 또는 이미지에서 텍스트 인식하여 문서 내용, 색인 등을 나타내는 텍스트를 추가 추출하여 속성 정보에 포함시킨다.
상기 분산 저장 단계(S130)는 분류된 각 그룹에 대해 퍼즐화 이미지(B) 상에서의 이미지 조각(a)들을 위치 변경 없이 그대로 두어 분할 이전 퍼즐화 이미지(B)의 크기를 갖는 희소성 이미지(C1, C2, C3, C4)를 생성하고, 그룹별로 생성한 희소성 이미지(C1, C2, C3, C4)를 서로 다른 DB 서버(3)에 분산 저장한다.
이때, 각 그룹별 희소성 이미지(C1, C2, C3, C4)는 이미지 조각(a)이 있는 위치를 제외한 나머지 영역(b)을 비워둔 상태로 두거나, 아니면 나머지 영역(b)을 식별 가능한 임의의 이미지로 채운다. 여기서, 식별 가능한 임의의 이미지는 하기서 설명하는 취합 단계(S220)에서 이미지 조각(a)을 제외한 나머지 영역(b)을 삭제하기 위해 식별 가능한 임의의 이미지로 한다.
식별을 위한 예를 들면, 임의의 이미지에 사전 약속된 패턴을 추가하는 방식을 사용할 수 있다.
물론, 각 그룹별 희소성 이미지(C1, C2, C3, C4)에서 이미지 조각(a)의 위치를 분산 저장 정보에 포함시켜서, 나머지 영역(b)과 구분할 수 있게 하는 것도 가능하다.
이에, 퍼즐화 이미지(B) 상의 각 분할 이미지 조작(a)들은 복수의 희소성 이미지(C1, C2, C3, C4) 중에 어느 하나에만 존재하고 중복되지는 아니한다.
그리고, 상기 분산 저장 단계(S130)는 복수 DB 서버(3) 내의 저장된 희소성 이미지로의 접근 정보, 즉, IP주소 또는 DB 서버(3) 내의 저장 위치(주소)를 포함하는 분산 저장 정보를 생성한다.
한편, 각 그룹별로 이미지 조각(a)들을 상호 붙인 이미지로 저장하고, 각 이미지 조각(a)에 대해 퍼즐화 이미지(B) 상에서의 위치 정보를 분산 저장 정보에 포함시키는 방식도 가능하지만, 희소성 이미지로 하는 것이 취합 복원하는 데 복잡도가 낮으므로 이하 설명에서는 희소성 이미지로 분산 저장하는 것으로 설명한다.
상기 문서정보 DB화 단계(S140)는 상기 퍼즐화 단계(S110)에서 원 문서의 이미지(A)로부터 퍼즐화 이미지(B)를 얻을 시에 적용한 퍼즐화 정보(즉, 시이드 값 및 적정 셔플링 회수), 상기 속성 추출 단계(S120)에서 추출한 속성 정보, 및 분산 저장 단계(S130)에서 각 그룹별로 저장된 DB 서버(3)내의 접근 정보인 분산 저장 정보를 문서정보로 하여 문서정보 DB 서버(4)에 등록 저장한다.
이와 같이 문서를 이미지로서 분산 저장하고 문서정보를 등록하여 둠으로써, 문서를 열람 또는 다운로드 받기 위한 준비가 된 이후, 제2 단말(2)에서 열람 또는 다운로드 방식으로 문서 요청을 하면(S201) 상기 문서 복원 단계(S200)를 수행한다.
이때의 문서 요청은 문서의 속성 정보를 전송하여 속성 정보에 대응되는 이미지를 요청하는 것으로서, 문서 내용이 담긴 텍스트를 검색 키워드로 할 수 있게 하였다.
상기 문서 복원 단계(S200)는 문서 제공을 요청받을 시에 해당 문서의 속성 정보에 근거하여 대응되는 퍼즐화 정보 및 분산 저장 정보를 문서정보 DB 서버(4)로부터 얻는 검색 단계(S210)와, 분산 저장된 희소성 이미지를 분산 저장 정보에 따라 각 DB 서버(3)로부터 취합한 후 결합한 이미지를 얻는 취합 단계(S220)와, 퍼즐화 정보에 근거하여 퍼즐화할 시 배열 변경의 역으로 재배열하여 퍼즐화 이전의 이미지를 얻는 역퍼즐화 단계(S230)와, 역퍼즐화 단계(S230)에서 얻은 이미지가 문서를 그래픽 형태로 변환한 이미지인 경우에 텍스트 인식하여 그래픽화 이전 문서를 얻는 문서화 단계(S240)의 순서로 이루어진다.
상기 검색 단계(S210)는 문서 분류 정보, 조회 정보 또는 메타 정보에 따라 요청 문서에 대응되는 속성 정보를 특정하여 퍼즐화 정보 및 분산 저장 정보를 얻을 수 있으나, 문서 내의 텍스트를 속성 정보에 포함시켰으므로, 문서 요청 시에 검색어로 속성 정보에 포함된 텍스트를 검색함으로써, 속성 정보를 특정할 수 있고, 이에, 특정한 속성 정보에 대응되는 퍼즐화 정보 및 분산 저장 정보를 얻을 수 있다.
상기 취합 단계(S220) 및 역퍼즐화 단계(S230)는 도 4에 파선 화살표로 표시되어 있다.
도 4를 참조하면, 취합 단계(S220)는 분산 저장 정보에 따라 각 DB 서버(3)로부터 불러들인 희소성 이미지(C1, C2, C3, C4)를 상호 겹쳐 퍼즐화 이미지(B)를 생성한다.
즉, 이미지 조각(a)들은 서로 다른 희소성 이미지(C1, C2, C3, C4)에 중복으로 존재하지 아니하므로, 상호 겹침으로써 퍼즐화 이미지(B)를 얻을 수 있다. 물론, 각각의 희소성 이미지(C1, C2, C3, C4)에서 이미지 조각(a)을 제외한 나머지 영역(b)에 상기한 임의의 이미지를 채워 넣는 방식을 사용한 경우에는, 그 임의의 이미지를 삭제한 후 겹치면 된다.
상기 역퍼즐화 단계(S230)는 퍼즐화 정보에 포함된 시이드 값 및 적정 셔플링 회수에 따라 퍼즐화 이전 원 이미지(A)를 얻는 단계로서, 시이드 값을 적용한 의사 난수 발생기(pseudo random number generator)로 적정 셔플링 회수의 2배수 난수 수열을 생성하여 상기 퍼즐화 단계(S110)와 동일한 난수 수열을 얻고, 난수 수열의 역순으로 2개씩 취하여 2개의 난수 번호가 매겨진 분할 위치의 이미지 조각을 위치 교환하는 셔플링(shuffling) 과정을 반복한다. 이에, 퍼즐화 이전 원 이미지(A)를 얻을 수 있다.
상기 문서화 단계(S240)는 상기 역퍼즐화 단계(S230)에서 얻은 원 이미지(A)를 예를 들어 문자 인식(OCR : Optical character recognition)하여 텍스트를 추출하고, 원 문서의 포맷으로 전자문서화한다. 원 문서의 포맷은 속성 정보 또는 희소성 이미지의 메타 정보에 넣어두어서, 문서화 단계(S240)에서 알 수 있게 하는 것이 좋다.
이러한, 문서화 단계(S240)는 이미지로 DB화한 워드 문서, 데이터베이스 파일, 스프레드 쉬트, 프로그램 소스코드 등의 전자문서를 제공함으로써, 제2 단말(2)에서의 활용 범위를 넓게 한다.
이와 같이 얻은 전자문서 또는 텍스트가 존재하지 아니하여 문서화 단계를 거치지 아니한 이미지는 제2 단말(2)에 전송한다. 한편, 문서화 단계(S240)에 의한 전자문서화 이전의 이미지를 전송하게 하여도 좋다.
물론, 제1 단말(1)과 제2 단말(2)이 문서 보안 서버(6)에 접속할 시에는 인증과정을 수행하여 접속 보안을 확보한 이후 문서 등록 및 문서 복원 서비스를 제공하여야 할 것이다.
이하, 상기 수학식1의 근거에 대해서 설명한다.
먼저, DTMC(Discrete Time Markov Chain)은 다음과 같이 정의한다.
<정의 1 : DTMC(Discrete Time Markov Chain) >
Countable state space S 에서 값을 갖는 random variable의 수열 X1,X2,...에 대하여 다음과 같이 Markov property 를 만족하는 경우, 이 수열을 DTMC라고 정의한다.
< Markov property >
모든
Figure 112016128943761-pat00003
에 대하여,
Figure 112016128943761-pat00004
상기한 Markov property를 살펴보면, n+1번째 시점의 state는 바로 직전 시점인 n번째 시점의 state에 의해 분포가 결정되고, 이 확률
Figure 112016128943761-pat00005
이 n에 관계 없이 일정하면 time homogeneous DTMC 라고 한다.
그리고, state space S의 크기를 N이라 할 경우,
Figure 112016128943761-pat00006
를 i번째 row 및 j번째 column의 값을 갖는 N x N 크기의 transition matrix P=(pij)를 정의할 수 있다.
다음으로, 아래와 같이 정의 2 및 정의 3에 대한 정리를 소개한다.
< 정의 2 : limiting distribution >
크기가 N인 state space S를 갖는 DTMC의 transition matrix 를 P라고 할 때, 크기가 N row vector로 만들어진 초기 distribution
Figure 112016128943761-pat00007
에 대하여 k번째 distribution 을
Figure 112016128943761-pat00008
=
Figure 112016128943761-pat00009
라고 정리할 수 있고, 이때
Figure 112016128943761-pat00010
가 존재한다면 우리는 이 row vector를 limiting distribution이라고 정의한다.
이 정의에서 초기 distribution 이란, random variable X0 가 각 state에 있을 확률이라고 보면 된다. 따라서, 초기 distribution
Figure 112016128943761-pat00011
의 각 entry는 확률이기 때문에 0 이상 1 이하의 값을 갖고, entry의 합은 1의 값을 갖는다.
<정의 3 : stationary distribution>
크기가 N인 state space S를 갖는 DTMC의 transition matrix 를 P라고 할 때,
Figure 112016128943761-pat00012
의 조건을 만족하는 크기가 N인 row vector
Figure 112016128943761-pat00013
를 stationary distrabution이라고 정의한다.
여기서, 크기가 N<∞인 state space S를 갖는 DTMC가 irreducible 하고 aperiodic하면, N row vector로 만들어지는 distribution π 에 대해 stationary distribution이 유일하게 존재하고, 초기 distribution에 무관하게 limiting distribution이 stationary distribution과 일치하는 정리를 얻을 수 있다.
이에, stationary distribution에 관심을 갖고 다음과 같이 셔플링에 따른 distribution을 해석할 수 있다.
도 4 및 도 5를 참조하며 설명한 바와 같이, 원 이미지(A)를 N개의 조각으로 분할하고, 분할 조각의 위치에 차례대로 1부터 N까지 순번을 매긴 이후에, 1 내지 N의 범위 내에서 실질적으로 uniform random number(균등 난수)를 생성하는 pseudo random number generator(의사 난수 발생기)로 2개 난수를 생성하고 2개 난수의 위치에 있는 이미지 조각을 상호 교환하는 셔플링 과정을 반복하여서 퍼즐화 이미지(B)를 얻는다.
이 경우, 특정 이미지 조각의 위치를 state로 잡으면, 셔플링을 할 때마다 특정 이미지 조각이 N개 위치 중 한 곳으로 이동할 수 있으므로, state space S는 {1,2, ..., N}으로 생각할 수 있고, transition matrix P의 크기는 N x N으로 생각할 수 있다. 즉, 초기 state를 X0=1으로 설정한 경우 초기 distribution은 [1,0,0, ...,0]으로 설정된다.
이와 같이 특정 이미지 조각으로 선택한 어느 하나의 이미지 조각의 위치를 state로 하더라도 셔플링 회수의 증가에 따른 다른 이미지 조각들의 distribution도 특정 이미지 조각과 실질적으로 동일한 distribution을 보일 것이므로, 어느 하나의 특정 이미지 조각에 한정하여 살펴본다.
2개 난수로 셔플링하여서 특정 이미지 조각의 위치가 바뀌는 경우는 2개 난수 모두가 특정 이미지 조각의 현재 위치이거나 아니면 특정 이미지 조각의 현재 위치가 아닌 경우이므로, 확률은
Figure 112016128943761-pat00014
이다.
또한, 셔플링에 의해 특정 이미지 조각의 위치가 다른 위치로 바뀌는 경우는 2개 난수 중에 어느 하나의 난수가 특정 이미지 조각의 현재 위치이고 다른 하나의 난수가 그 다른 위치인 경우이므로, 확률은
Figure 112016128943761-pat00015
가 된다.
이에, 현재의 i 위치에서 j위치로 변경될 확률 P(i,j)를 entry 로 하는 다음의 transition matrix P를 정의할 수 있다.
Figure 112016128943761-pat00016
상기한 transition matrix P에 따르면, 모든 entry는 양수이므로 irreducible하고, diagonal entry도 모두 양수이므로 aperiodic하다. 또한, transition matrix P는 symmetric이고, 각 row의 합이 항상 1이고, 각 column의 합도 항상 1이므로, symmetric doubly stochastic matrix이다.
따라서, transition matrix P는 irreducible하고 aperiodic하므로, 앞서 정리한 바를 적용하면, stationary distribution이 유일하게 존재하고, 초기 distribution에 관계없이 limiting distribution과 stationary distribution이 일치한다.
그리고, transition matrix P의 각 column의 합이 1이므로
Figure 112016128943761-pat00017
이 stationary distribution임을 확인할 수 있다.
이는, 셔플링 회수를 점차 증가시키면, 초기 특정 위치의 특정 이미지 조각이 1 ~ N의 임의의 위치에 있을 수 있는 확률이 위치에 관계없이 항상 같게 되는 uniform 분포로 수렴하게 된다고 생각할 수 있다.
이에, 적정 셔플링 회수를 얻기 위해서 수렴도에 대해 고찰한다.
이 경우의 DTMC에서는 transition matrix P의 eigenvalue와 eigenvector를 아래와 같이 직접 구할 수 있다.
eigenvalue λ = 1 일 때에,
Figure 112016128943761-pat00018
이고, 이때 각 row의 합이 0이 되므로, eigenvector는
Figure 112016128943761-pat00019
이 되고, normalize한 eigenvector
Figure 112016128943761-pat00020
을 얻을 수 있다.
다음으로, eigenvalue
Figure 112016128943761-pat00021
일 때에,
Figure 112016128943761-pat00022
으로 된다. 이 matrix를 살펴보면, row의 모든 entry가 동일하다. 즉, row rank가 1이고 nullity가 N-1이 되므로, linearly independent한 N-1개의 eigenvector를 구할 수 있다.
결과적으로, 2개의 eigenvalue λ=1 및
Figure 112016128943761-pat00023
에서 N개의 eigenvector를 모두 찾았으므로, diagonal decomposition을 이용할 수 있다. 또한, transition matrix P는 symmetric하므로 orthogonally diagonalizable하다. 따라서, Gram-Schmidt process를 통해 eigenvalue
Figure 112016128943761-pat00024
에 대한 orthonormal한 eigenvector set e2,e3, ...eN 를 구할 수 있고, 다음과 같이 matrix D와 Q를 정의하여 transition matrix P를 표현할 수 있다.
Figure 112016128943761-pat00025
Figure 112016128943761-pat00026
그리고, 초기 distribution
Figure 112016128943761-pat00027
에 대해 k번째 transition(셔플링)한 상태의 distribution
Figure 112016128943761-pat00028
을 다음과 같이 전개 가능하다.
Figure 112016128943761-pat00029
여기서, 상기한 바와 같이 초기 distribution에 대해 다른 초기 state를 사용하더라도 계산 과정과 결과는 동일하게 된다고 할 수 있다.
상기한 초기 distribution
Figure 112016128943761-pat00030
는 linearly independent한 eigenvector e1,e2, ...eN 를 이용하여
Figure 112016128943761-pat00031
,
Figure 112016128943761-pat00032
으로 전개할 수 있고, 이러한 전개를 만족하는
Figure 112016128943761-pat00033
도 존재하게 된다.
이런 초기 distribution을 k번째 transition 이후의 distribution에 대입하여 다음과 같이 전개할 수 있다.
Figure 112016128943761-pat00034
여기서, a1을 직접 계산해보면
Figure 112016128943761-pat00035
이 되므로,
Figure 112016128943761-pat00036
이 되며, 이 row vector를 u 라고 정의하면, k번째 transition 한 상태의 distribution에 대한 식을 다음과 같이 된다.
Figure 112016128943761-pat00037
이 수학식을 살펴보면,
Figure 112016128943761-pat00038
로서 1보다 작으므로, k를 무한대로 보냈을 때에, 우변이 zero vector로 수렴하고, 결국,
Figure 112016128943761-pat00039
도 u로 수렴함을 알 수 있다.
이에, 수렴도(convergence rate, α)를 다음과 같이 정의한다.
Figure 112016128943761-pat00040
여기서의 norm은 distribution π와 uniform distribution u 사이의 거리를 의미하는 L1 norm으로 생각할 수 있다.
이에, k번째 셔플링한 상태의 distribution
Figure 112016128943761-pat00041
에 대한 수렴도
Figure 112016128943761-pat00042
Figure 112016128943761-pat00043
으로 정리된다.
최종적으로, 임의의 값 또는 적절한 수렴도의 값으로
Figure 112016128943761-pat00044
를 만족하는 k, 즉, 셔플링 회수 k의 식으로 정리할 수 있다.
Figure 112016128943761-pat00045
Figure 112016128943761-pat00046
따라서, 셔플링 회수 k는 최종 결과식으로 다음의 수학식 2로 정의할 수 있다.
Figure 112016128943761-pat00047
최종적으로 얻는 수학식 2를 살펴보면, 경험적으로 적정 수렴도 α를 결정하면, 이미지 조각의 개수에 따라 적정 셔플링 회수도 결정할 수 있게 됨을 알 수 있다.
그런데, 상기 수학식 2 또는 수렴도 α로 정리한 식을 자세히 살펴보면, 수렴도 α는 이미지 조각의 개수 N의 영향을 받게 된다. 예를 들어, 동일하게 k 회수 셔플링하더라도, N이 크면 클수록 초기 state의 확률이 다른 state의 확률보다 상대적으로 크게 나타남을 확인할 수 있었다.
다시 말해서, 상기한 바와 같이 수렴도 α를 계산할 때에 L1 norm을 사용함에 따라, N의 값이 커질수록 각 state에서 uniform distribution 일 때 갖는 확률 값은 감소하지만, 수렴도 α는 이와 상관없이 같은 값을 유지하므로, N이 상대적으로 큰 값을 갖는 경우에 state 사이의 distribution 값의 차이가 더 도드라지게 나타난다.
이와 같은 문제점을 해소하기 위해서 다음과 같이 정규화한 수렴도 β를 정의한다.
Figure 112016128943761-pat00048
수렴도 β는 uniform distribution 일 때 모든 state가 동일 값으로 갖는 확률 1/N에 비해서 현재 distribution에서 갖는 확률 값의 편차의 비율로 정의한 것이다.
이와 같이 수렴도 β를 정의함으로써, β 값을 작게 설정할수록 확률 값의 편차도 줄어들고 결국, distribution도 uniform distribution 에 근접하게 되는 것이다.
그리고, 셔플링 회수 k에서의 수렴도 β는 k번째 distribution
Figure 112016128943761-pat00049
의 각 state에 대한 다음 관계식
Figure 112016128943761-pat00050
을 대입함으로써 다음의 식을 얻을 수 있다.
Figure 112016128943761-pat00051
이 식을 통해서, 최종적으로 셔플링 회수에 대한 수학식 3을 얻을 수 있다.
Figure 112016128943761-pat00052
여기서, 수렴도 β는 이미지 조각들의 뒤섞임 정도, 즉, 퍼즐화 정도를 나타내므로, 적절한 값을 설정하여 두면, 이미지 조각의 개수에 따라 수렴도 β를 얻기 위한 셔플링 회수 k를 산정할 수 있음을 보여준다.
이상에서 본 발명의 기술적 사상을 예시하기 위해 구체적인 실시 예로 도시하고 설명하였으나, 본 발명은 상기와 같이 구체적인 실시 예와 동일한 구성 및 작용에만 국한되지 않고, 여러가지 변형이 본 발명의 범위를 벗어나지 않는 한도 내에서 실시될 수 있다. 따라서, 그와 같은 변형도 본 발명의 범위에 속하는 것으로 간주해야 하며, 본 발명의 범위는 후술하는 특허청구범위에 의해 결정되어야 한다.
1,2 : 단말 3 : DB 서버 4 : 문서정보 DB 서버
5 : 네트워크 6 : 문서 보안 서버
10 : 문서 등록부
11 : 퍼즐화부 12 : 속성 추출부 13 : DB화부
20 : 문서 복원부
21 : 검색부 22 : 이미지 복원부 23 : 문서화부

Claims (9)

  1. 문서를 분할하여 복수의 DB 서버(3)에 분산 저장하고 분산 저장된 문서를 취합하기 위한 문서정보를 문서정보 DB 서버(4)에 등록하는 문서 등록부(10) 및 문서를 요청받을 시에 분산 저장된 문서를 문서정보에 따라 취합 복원하여 제공하는 문서 복원부(20)에 의해 이루어지는 문서 보안 방법에 있어서,
    문서를 그래픽 문서화한 이미지 또는 그래픽 문서로 작성된 이미지를 복수의 조각으로 분할한 후 이미지 조각들의 배열을 변경하여 퍼즐화 이미지를 얻는 퍼즐화 단계(S110)와,
    문서의 속성 정보를 텍스트 형태로 추출하는 속성 추출 단계(S120)와,
    퍼즐화 이미지의 이미지 조각들을 복수 그룹으로 분류한 후, 각 그룹에 대해 퍼즐화 이미지 상에서의 이미지 조각들을 위치 변경 없이 그대로 두고 나머지 영역을 비워둔 희소성 이미지를 생성하여 서로 다른 복수의 DB 서버(3)에 분산 저장하는 분산 저장 단계(S130)와,
    퍼즐화 정보, 분산 저장 정보 및 속성 정보를 문서정보로 하여 문서정보 DB 서버(4)에 등록하는 문서정보 DB화 단계(S140)
    를 포함하며, 문서 등록부(10)에 의해 수행하는 문서 등록 단계(S100); 및
    문서 제공을 요청받을 시에 해당 문서의 속성 정보에 근거하여 대응되는 퍼즐화 정보 및 분산 저장 정보를 얻는 검색 단계(S210)와,
    분산 저장된 희소성 이미지를 분산 저장 정보에 따라 취합한 후 겹쳐 결합한 이미지를 얻는 취합 단계(S220)와,
    퍼즐화 정보에 근거하여 퍼즐화할 시 배열 변경의 역으로 재배열하여 퍼즐화 이전의 이미지를 얻는 역퍼즐화 단계(S230)
    를 포함하며, 문서 복원부(20)에 의해 수행되는 문서 복원 단계(S200);
    로 이루어지는 문서 보안 방법.
  2. 제 1항에 있어서,
    상기 문서 복원 단계(S200)는 역퍼즐화 단계(S230)에서 얻은 이미지가 문서를 그래픽 형태로 변환한 이미지인 경우에 텍스트 인식하여 그래픽화 이전 문서를 얻는 문서화 단계(S240)를 포함하는 문서 보안 방법.
  3. 제 1항에 있어서,
    상기 속성 추출 단계(S120)는 문서 내의 텍스트를 추출하여 속성 정보에 포함시키고,
    상기 검색 단계(S210)는 속성 정보에 포함된 텍스트를 검색하여 속성 정보를 특정한 후 특정한 속성 정보에 대응되는 퍼즐화 정보 및 분산 저장 정보를 얻는 문서 보안 방법.
  4. 삭제
  5. 제 1항에 있어서,
    상기 분산 저장 단계(S130)는 희소성 이미지의 비워둔 영역을 임의의 이미지로 채우고,
    상기 취합 단계(S220)는 각 DB 서버(4)에서 취한 희소성 이미지를 상기 임의의 이미지를 삭제한 한 후 겹쳐 결합하는 문서 보안 방법.
  6. 제 1항에 있어서,
    상기 퍼즐화 단계(S110)는 이미지의 분할 위치에 번호를 매기고, 시이드(seed)에 따라 난수 수열이 결정되는 의사 난수 발생기(pseudo random number generator)로 셔플링 회수의 2배수 난수 수열을 생성하되, 난수 수열의 순서로 2개씩 취하여 2개의 난수 번호를 매긴 분할 위치의 이미지 조각을 위치 교환하는 셔플링(shuffling) 과정을 반복함으로써 퍼즐화 이미지를 생성하고,
    상기 퍼즐화 정보는 시이드 값 및 셔플링 회수를 포함하며,
    상기 역퍼즐화 단계(S230)는 시이드 값에 따라 셔플링 회수의 2배수 난수 수열을 생성한 후, 난수 수열의 역순으로 2개씩 취하여 2개의 난수 번호를 매긴 분할 위치의 이미지 조각을 위치 교환하는 셔플링(shuffling) 과정을 반복함으로써 퍼즐화 이전의 이미지를 얻는 문서 보안 방법.
  7. 제 6항에 있어서,
    상기 셔플링 회수는 셔플링 과정을 반복함에 따라 어느 하나의 특정 이미지 조각이 확률적으로 분할 위치에 관계없이 균일 확률로 존재할 수 있는 정상 분포(stationary distribution)로의 수렴도(convergence rate), 및 분할한 이미지 조각의 개수의 함수로 결정되는 문서 보안 방법.
  8. 제 7항에 있어서,
    상기 수렴도는 분할 위치별 확률의 최대 편차를 정상 분포일 때의 분할 위치 확률로 나누어 얻는 값으로 하는 문서 보안 방법.
  9. 제 6항에 있어서,
    상기 셔플링 회수(k)는 이미지 조각의 개수(N) 및 수렴도(β)에 따라 수학식
    Figure 112016128943761-pat00053

    으로 산정하는 문서 보안 방법.
KR1020160182044A 2016-12-29 2016-12-29 문서 보안 방법 KR101895848B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160182044A KR101895848B1 (ko) 2016-12-29 2016-12-29 문서 보안 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160182044A KR101895848B1 (ko) 2016-12-29 2016-12-29 문서 보안 방법

Publications (2)

Publication Number Publication Date
KR20180077573A KR20180077573A (ko) 2018-07-09
KR101895848B1 true KR101895848B1 (ko) 2018-09-06

Family

ID=62919535

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160182044A KR101895848B1 (ko) 2016-12-29 2016-12-29 문서 보안 방법

Country Status (1)

Country Link
KR (1) KR101895848B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102528336B1 (ko) * 2022-07-22 2023-05-03 주식회사 라이펙스 이미지셔플링과 3d-lea 블록 암호로 이루어진 라이펙스형 이중암호화 앱 모듈장치 및 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285612A (ja) * 2005-03-31 2006-10-19 Canon Inc 情報処理装置およびその方法
KR100880243B1 (ko) * 2007-07-30 2009-01-23 주식회사 골드엔키 이미지 퍼즐형 암호화이미지를 이용한 원본이미지암호화시스템

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE354128T1 (de) 1999-12-20 2007-03-15 Dainippon Printing Co Ltd Verteilte datenarchivierungsvorrichtung und system
KR20010044248A (ko) 2001-01-26 2001-06-05 김동희 디지털 웹 페이퍼 서비스 시스템
CN104982026B (zh) * 2014-02-03 2018-06-05 株式会社隆创 图像检查装置和图像检查方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285612A (ja) * 2005-03-31 2006-10-19 Canon Inc 情報処理装置およびその方法
KR100880243B1 (ko) * 2007-07-30 2009-01-23 주식회사 골드엔키 이미지 퍼즐형 암호화이미지를 이용한 원본이미지암호화시스템

Also Published As

Publication number Publication date
KR20180077573A (ko) 2018-07-09

Similar Documents

Publication Publication Date Title
Wang et al. Searchable encryption over feature-rich data
Xia et al. Towards privacy-preserving content-based image retrieval in cloud computing
US8533489B2 (en) Searchable symmetric encryption with dynamic updating
Williams et al. Single round access privacy on outsourced storage
US11232216B1 (en) Systems and methods for generation of secure indexes for cryptographically-secure queries
CN101855620B (zh) 数据处理设备和数据处理方法
CN101855636B (zh) 数据处理设备及数据处理方法
US8799291B2 (en) Forensic index method and apparatus by distributed processing
US9202081B2 (en) Apparatus and methods for anonymizing a data set
CN110659379B (zh) 一种基于深度卷积网络特征的可搜索加密图像检索方法
WO2005114478A2 (en) Encrypted table indexes and searching encrypted tables
Oosterhuis et al. The potential of learned index structures for index compression
JP6142704B2 (ja) 秘匿データ照合装置、秘匿データ照合プログラムおよび秘匿データ照合方法
US20220100884A1 (en) Term-Based Encrypted Retrieval Privacy
KR101428649B1 (ko) 맵 리듀스 기반의 대용량 개인정보 암호화 시스템 및 그의 동작 방법
CN109492410A (zh) 数据可搜索加密和关键词搜索方法、系统及终端、设备
CN111651779A (zh) 一种在区块链中进行加密图像检索的隐私保护方法
KR101895848B1 (ko) 문서 보안 방법
CN106133745A (zh) 流数据的匿名化
CN106250453A (zh) 基于云存储的数值型数据的密文检索方法及装置
Magdy et al. Privacy preserving search index for image databases based on SURF and order preserving encryption
CN105763324A (zh) 可控制的可验证多用户端可搜索加密搜索方法
JP2006189925A (ja) 個人情報管理システム、個人情報管理プログラムおよび個人情報保護方法
CN110945506B (zh) 支持混合索引的可搜索加密
US20220277098A1 (en) Method and system for securely storing and programmatically searching data

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right