KR20180077573A - Document security method - Google Patents

Document security method Download PDF

Info

Publication number
KR20180077573A
KR20180077573A KR1020160182044A KR20160182044A KR20180077573A KR 20180077573 A KR20180077573 A KR 20180077573A KR 1020160182044 A KR1020160182044 A KR 1020160182044A KR 20160182044 A KR20160182044 A KR 20160182044A KR 20180077573 A KR20180077573 A KR 20180077573A
Authority
KR
South Korea
Prior art keywords
document
image
information
puzzling
shuffling
Prior art date
Application number
KR1020160182044A
Other languages
Korean (ko)
Other versions
KR101895848B1 (en
Inventor
백기영
Original Assignee
주식회사 에이치앤비트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 에이치앤비트 filed Critical 주식회사 에이치앤비트
Priority to KR1020160182044A priority Critical patent/KR101895848B1/en
Publication of KR20180077573A publication Critical patent/KR20180077573A/en
Application granted granted Critical
Publication of KR101895848B1 publication Critical patent/KR101895848B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F17/30244
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0061Embedding of the watermark in each block of the image, e.g. segmented watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

The present invention relates to a document security method. The me document security method comprises the steps of: distributing and storing an imaged document in a plurality of DB servers after puzzling the document, and collecting the distributed and stored images in order to obtain a document image; and restoring a puzzled image. It is possible to prevent a leakage of document information due to hacking of an individual DB server. Also, even when all DB servers are hacked, document information cannot be obtained. In addition, puzzling information is simplified to the number of progression of seed values of a pseudo random number generator, and puzzling is probabilistically appropriately performed. Accordingly, it is possible to secure security due to puzzling without excessive or insufficient puzzling and search document contents. An original document is provided by an image-document conversion, and thus utilization is enhanced. A study related to the present invention was supported by ″The Cross-Ministry Giga KOREA Project″ grant from the Ministry of Science, ICT and Future Planning, Korea ([GK16P0100, Development of Tele-Experience Service SW Platform based on Giga Media]).

Description

문서 보안 방법{DOCUMENT SECURITY METHOD}Document security method {DOCUMENT SECURITY METHOD}

본 발명은 이미지화한 문서를 복수 이미지 조각으로 나누고 퍼즐화한 이후, 복수의 DB 서버에 분산 저장하고, 문서 이미지를 얻기 위해서는 분산 저장된 이미지를 취합하는 과정 및 퍼즐화된 이미지를 복원하는 과정을 거치게 한 문서 보안 방법에 관한 것이다.The present invention divides an imaged document into a plurality of image pieces and puzzles them, distributes them to a plurality of DB servers, acquires a distributed image and obtains a document image, and restores the puzzle image And a document security method.

본 발명과 관련된 연구는 미래창조과학부 '범부처 Giga KOREA 사업[GK16P0100,Giga Media 기반 Tele-Experience 서비스 SW플랫폼 기술 개발]'의 지원을 받아 수행하였음(This work was supported by 'The Cross-Ministry Giga KOREA Project' grant from the Ministry of Science, ICT and Future Planning, Korea[GK16P0100, Development of Tele-Experience Service SW Platform based on Giga Media]).The research related to the present invention was carried out with support from Giga KOREA business [GK16P0100, Giga Media based tele-experience service SW platform technology development] of the future Creation Science Department. (This work was supported by 'The Cross-Ministry Giga KOREA Project 'grant from the Ministry of Science, ICT and Future Planning, Korea [GK16P0100, Development of Tele-Experience Service SW Platform based on Giga Media]).

결제 정보, 계약 정보, 개인 정보, 유전자 정보, 병원 진료 정보, 경영 정보, 기밀 정보 등에 관련된 전자문서를 분산 저장하는 기존 기술은 정보를 분할하여 복수 DB 서버에 저장하고 어느 DB 서버에 분산 저장하였는지에 대한 정보를 별도의 DB 서버에 저장한다. 이에 따라, 개별 DB 서버를 해킹하더라도 원 정보를 온전히 얻을 수 없게 하였다.Existing technologies that distribute and store electronic documents related to payment information, contract information, personal information, genetic information, hospital treatment information, management information, and confidential information are divided into a plurality of DB servers, The information is stored in a separate DB server. Thus, even if individual DB servers are hacked, the original information can not be obtained completely.

정보를 열람 또는 다운로드하여 활용할 시에는 분산 저장 정보에 따라 각 DB 서버로부터 정보를 취합하여 복원하게 하였다.When information is viewed or downloaded, information is collected from each DB server according to the distributed storage information and restored.

또한, 보안성을 강화하기 위해서, 정보를 암호화한 이후 복수 DB 서버에 분산 저장하였다.Also, in order to enhance the security, the information is encrypted and distributed to a plurality of DB servers.

그런데, 복호화를 어렵게 하려면 암호화 과정을 복잡하고 난해하게 하여야 하고, 암호화 과정이 분산 저장하는 방식과는 별도로 이루어져서 이원화됨에 따라 복잡도를 줄일 수 없다.However, in order to make the decryption difficult, the encryption process must be complicated and difficult, and the encryption process is performed separately from the distributed storage method, so that the complexity can not be reduced as it is dualized.

한편, 공개특허 10-2001-0044248호에 기술된 바와 같이 문서를 스캔 또는 그래픽화하여 얻는 이미지를 분할하여 분산 저장하는 기술이 있다.On the other hand, there is a technique of dividing and distributing an image obtained by scanning or graphicizing a document as described in Patent Document 10-2001-0044248.

이 기술은 이미지화한 후 분산 저장할 종이문서를 스캔하여 이미지 포맷으로 변환한 후 보관 관리하는 데 있어 유용하다.This technique is useful for scanning paper documents to be distributed and stored after image formation, converting them into image format, and then archiving them.

그렇지만, 개별 DB 서버에 분산 저장된 이미지들은 일부 이미지 조각들만 포함된 것이기는 하지만, 온전한 원 이미지를 유추할 수 있는 정보를 담고 있어서, 보안성에 취약하며, 이러한 보안성 취약 문제를 해소하기 위해서는 원 이미지를 형상에 따라 적절하게 분할하여야 하고, 분할 그룹의 수도 상당히 크게 하여야 하는 어려움이 따른다.However, although the images stored in the individual DB servers are included only in some image fragments, they are vulnerable to security because they contain information that can infer a complete original image. In order to solve this vulnerability problem, It is difficult to appropriately divide the number of divided groups according to the shape and the number of divided groups to be considerably large.

KR 10-0749428 B1 2007.08.08.KR 10-0749428 B1 2007.08.08. KR 10-2001-0044248 A 2001.06.05.KR 10-2001-0044248 A 2001.06.05.

따라서, 본 발명은 문서를 그래픽 문서화한 이미지를 암호화한 후 분산 저장하여 분산 저장한 개별 이미지로 원 이미지의 유추를 원천 차단하는 한편, 이미지 암호화 과정을 분산 저장 과정에 연계하여 복잡도를 줄이며, 이미지 암호화의 복잡도를 줄여 이미지 복원도 용이한 문서 보안 방법을 제공하는 데 목적이 있다.Accordingly, the present invention can prevent the analogy of the original image from being encrypted by encrypting an image of a document, distributing the encrypted image, distributing and storing the encrypted image, and reducing the complexity by linking the image encryption process to the distributed storage process, The present invention provides a document security method that can reduce the complexity of image restoration.

상기 목적을 달성하기 위해 본 발명은 문서를 분할하여 복수의 DB 서버(3)에 분산 저장하고 분산 저장된 문서를 취합하기 위한 문서정보를 문서정보 DB 서버(4)에 등록하는 문서 등록부(10) 및 문서를 요청받을 시에 분산 저장된 문서를 문서정보에 따라 취합 복원하여 제공하는 문서 복원부(20)에 의해 이루어지는 문서 보안 방법에 있어서, 문서 등록부(10)에 의해 수행하는 문서 등록 단계(S100); 및 문서 복원부(20)에 의해 수행되는 문서 복원 단계(S200);로 이루어진다.In order to achieve the above object, the present invention provides a document registration system comprising: a document registration unit (10) for dividing a document into a plurality of DB servers (3) and storing document information for collecting distributed stored documents in a document information DB server (4) A document security method performed by a document restoring unit (20) that collects and restores distributed stored documents according to document information when a document is requested, the method comprising: a document registration step (S100) performed by the document registration unit (10); And a document restoring step (S200) performed by the document restoring unit 20.

상기 문서 등록 단계(S100)는 문서를 그래픽 문서화한 이미지 또는 그래픽 문서로 작성된 이미지를 복수의 조각으로 분할한 후 이미지 조각들의 배열을 변경하여 퍼즐화 이미지를 얻는 퍼즐화 단계(S110)와, 문서의 속성 정보를 텍스트 형태로 추출하는 속성 추출 단계(S120)와, 퍼즐화 이미지의 이미지 조각들을 복수 그룹으로 분류하여 복수의 DB 서버(3)에 분산 저장하는 분산 저장 단계(S130)와, 퍼즐화 정보, 분산 저장 정보 및 속성 정보를 문서정보로 하여 문서정보 DB 서버(4)에 등록하는 문서정보 DB화 단계(S140)를 포함한다.The document registration step S100 includes a puzzling step S110 of dividing an image created as a graphical document or a graphic document into a plurality of pieces and changing the arrangement of image pieces to obtain a puzzled image, (S130) for dividing image pieces of the puzzled image into a plurality of groups and distributing the image pieces in a plurality of DB servers (3) , And a document information DB step (S140) of registering the distributed storage information and attribute information in the document information DB server 4 as document information.

상기 문서 복원 단계(S200)는 문서 제공을 요청받을 시에 해당 문서의 속성 정보에 근거하여 대응되는 퍼즐화 정보 및 분산 저장 정보를 얻는 검색 단계(S210)와, 분산 저장된 이미지를 분산 저장 정보에 따라 취합한 후 결합한 이미지를 얻는 취합 단계(S220)와, 퍼즐화 정보에 근거하여 퍼즐화할 시 배열 변경의 역으로 재배열하여 퍼즐화 이전의 이미지를 얻는 역퍼즐화 단계(S230)를 포함한다.The document restoring step S200 includes a retrieving step S210 of obtaining corresponding puzzling information and distributed storing information based on the attribute information of the corresponding document when a document is requested to be provided, (S220) for obtaining combined images after collecting, and an inverse puzzling step (S230) for obtaining an image before puzzling by rearranging in reverse to the arrangement change when puzzling based on the puzzling information.

상기 문서 복원 단계(S200)는 역퍼즐화 단계(S230)에서 얻은 이미지가 문서를 그래픽 형태로 변환한 이미지인 경우에 텍스트 인식하여 그래픽화 이전 문서를 얻는 문서화 단계(S240)를 포함할 수 있다.The document decompressing step S200 may include a step S240 of obtaining a document before graphing by recognizing text if the image obtained in the reverse puzzling step S230 is an image obtained by converting the document into a graphic form.

상기 속성 추출 단계(S120)는 문서 내의 텍스트를 추출하여 속성 정보에 포함시키고, 상기 검색 단계(S210)는 속성 정보에 포함된 텍스트를 검색하여 속성 정보를 특정한 후 특정한 속성 정보에 대응되는 퍼즐화 정보 및 분산 저장 정보를 얻는다.In the attribute extracting step S120, the text in the document is extracted and included in the attribute information. In the searching step S210, the text included in the attribute information is searched to specify the attribute information, and the puzzling information corresponding to the specific attribute information And distributed storage information.

상기 분산 저장 단계(S110)는 각 그룹에 대해 퍼즐화 이미지 상에서의 이미지 조각들을 위치 변경 없이 그대로 두고 나머지 영역을 비워둔 희소성 이미지를 생성하여 서로 다른 DB 서버(3)에 저장하고, 상기 취합 단계(S220)는 각 DB 서버(3)에서 취한 희소성 이미지를 겹쳐 결합한다.In the distributed storage step (S110), image fragments on the puzzled image are left unchanged for each group, and a sparse image in which the remaining area is left empty is generated and stored in different DB servers (3) S220 overlap the scarcity images taken by each DB server 3.

상기 분산 저장 단계(S110)는 각 그룹에 대해 퍼즐화 이미지 상에서의 이미지 조각들을 위치 변경 없이 그대로 두고 나머지 영역을 임의의 이미지로 채운 희소성 이미지를 생성하여 서로 다른 DB 서버(3)에 저장하고, 상기 취합 단계(S220)는 각 DB 서버(4)에서 취한 희소성 이미지를 상기 임의의 이미지를 삭제한 한 후 겹쳐 결합한다.In the distributed storage step (S110), the image fragments on the puzzled image are left unchanged for each group, and a sparse image is created by filling the remaining area with an arbitrary image, and stored in different DB servers (3) In the collecting step S220, the scarcity image taken by each DB server 4 is deleted after the arbitrary image is deleted.

상기 퍼즐화 단계(S110)는 이미지의 분할 위치에 번호를 매기고, 시이드(seed)에 따라 난수 수열이 결정되는 의사 난수 발생기(pseudo random number generator)로 셔플링 회수의 2배수 난수 수열을 생성하되, 난수 수열의 순서로 2개씩 취하여 2개의 난수 번호를 매긴 분할 위치의 이미지 조각을 위치 교환하는 셔플링(shuffling) 과정을 반복함으로써 퍼즐화 이미지를 생성하고, 상기 퍼즐화 정보는 시이드 값 및 셔플링 회수를 포함하며, 상기 역퍼즐화 단계(S230)는 시이드 값에 따라 셔플링 회수의 2배수 난수 수열을 생성한 후, 난수 수열의 역순으로 2개씩 취하여 2개의 난수 번호를 매긴 분할 위치의 이미지 조각을 위치 교환하는 셔플링(shuffling) 과정을 반복함으로써 퍼즐화 이전의 이미지를 얻는다.In the puzzling step S110, a division number of the image is numbered, and a random number sequence of two times the shuffling number is generated by a pseudo random number generator in which a random number sequence is determined according to a seed And generating a puzzled image by repeating a shuffling process of taking two images in the order of the random number sequence and exchanging the image pieces of the two random number-assigned split positions, and the puzzle information includes a seed value and a shuffle And the inverse puzzling step S230 generates a random number sequence of two times the shuffling number according to the seed value, and then takes two pieces of the random number sequence in the reverse order of the random number sequence, The image before puzzling is obtained by repeating the shuffling process of exchanging the image pieces.

상기 셔플링 회수는 셔플링 과정을 반복함에 따라 어느 하나의 특정 이미지 조각이 확률적으로 분할 위치에 관계없이 균일 확률로 존재할 수 있는 정상 분포(stationary distribution)로의 수렴도(convergence rate), 및 분할한 이미지 조각의 개수의 함수로 결정된다.The shuffling count is a convergence rate to a stationary distribution in which one specific image fragment can be stochastically present at a uniform probability regardless of the dividing position as the shuffling process is repeated, It is determined as a function of the number of image fragments.

상기 수렴도는 분할 위치별 확률의 최대 편차를 정상 분포일 때의 분할 위치 확률로 나누어 얻는 값으로 한다.The degree of convergence is a value obtained by dividing the maximum deviation of the probability by the dividing position by the dividing position probability at the time of the normal distribution.

상기 셔플링 회수(k)는 이미지 조각의 개수(N) 및 수렴도(β)에 따라 수학식 The shuffling count k may be calculated according to the number N of image pieces and the degree of convergence?

Figure pat00001
Figure pat00001

으로 산정한다.Respectively.

상기와 같이 이루어지는 본 발명은 이미지를 복수 이미지 조각으로 분할하고 배열 변경하여 퍼즐화한 이후, 복수 이미지 조각을 분산 저장하므로, 개별 저장 이미지의 유출뿐만 아니라 모든 저장 이미지의 유출에 의해서도 원 이미지의 온전한 복원을 원천 차단할 수 있다.The present invention as described above divides an image into a plurality of image pieces, rearranges and puzzles the image, and then distributes a plurality of image pieces. Therefore, not only a leakage of individual storage images but also a complete restoration of original images .

또한, 본 발명은 복원한 이미지를 이미지-문서 변환하여 활용도를 높인다.In addition, the present invention improves the utilization of the restored image by image-document conversion.

또한, 본 발명은 분산 저장하는 이미지를 희소성 이미지로 함으로써, 이미지 퍼즐화 과정의 추가에 따른 복원 시 복잡도를 최소화한다.In addition, the present invention minimizes the complexity in restoration by adding image puzzling process by making distributed images to be scarce images.

또한, 본 발명은 이미지 퍼즐화를 추가함에도 시이드 값 및 셔플링 회수만으로 역퍼즐화할 수 있으므로, 문서 관리 및 복원 시 복잡도를 더욱 줄일 수 있다.In addition, the present invention can reduce the complexity of the document management and restoration even if image puzzling is added, since the puzzle can be reversed only by the number of shades and the number of shuffling.

또한, 본 발명은 적절한 퍼즐화 이미지를 얻을 수 있는 최적의 셔플링 회수로 퍼즐화하므로, 운용 효율을 극대화할 수 있다.In addition, since the present invention is puzzled with an optimal number of shuffling times to obtain an appropriate puzzled image, the efficiency of operation can be maximized.

도 1은 본 발명의 실시 예에 따른 문서 보안 방법을 위한 문서 보안 시스템의 블록 구성도.
도 2는 문서 보안 시스템의 변형 예를 보여주는 블록 구성도.
도 3은 본 발명의 실시 예에 따른 문서 보안 방법의 순서도.
도 4는 퍼즐화 단계(S110) 및 분산 저장 단계(S130)에 의한 이미지의 변동 과정(실선 화살표)과, 취합 단계(S220) 및 역퍼즐화 단계(S230)에 의한 이미지의 변동 과정(파선 화살표)을 보여주는 이미지 도면.
도 5는 퍼줄화 단계(110)에서 셔플링(shuffling) 회수의 증가에 따른 이미지의 변동 과정을 보여주는 이미지 도면.
1 is a block diagram of a document security system for a document security method according to an embodiment of the present invention;
2 is a block diagram showing a modification of the document security system;
3 is a flowchart of a document security method according to an embodiment of the present invention.
4 is a flowchart illustrating a process of changing the image by the puzzling step S110 and the distributed storing step S130 and a process of changing the image by the combining step S220 and the reverse puzzling step S230 ).
FIG. 5 is an image showing the process of image variation as the number of shuffling increases in the padding step 110; FIG.

이하, 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 당해 분야에 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 설명한다. 본 발명의 실시 예를 설명함에 있어서, 관련된 공지의 기능 또는 공지의 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS In the following description of the embodiments of the present invention, detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear.

도 1을 참조하면, 본 발명의 실시 예에 따른 문서 보안 방법을 위한 문서 보안 시스템은 문서를 분할하여 분산 저장하기 위한 복수의 DB 서버(3), 분산 저장된 문서를 불러들이고 취합하기 위한 문서정보를 저장하기 위한 문서정보 DB 서버(4), 및 DB화 등록 요청받는 문서를 복수 DB 서버(3)에 저장시키고 복원 요청받는 문서를 복수 DB 서버(3)에서 취합 복원하여 제공하는 문서 보안 서버(6)를 포함하여 구성된다.Referring to FIG. 1, a document security system for a document security method according to an exemplary embodiment of the present invention includes a plurality of DB servers 3 for dividing and storing documents in a distributed manner, document information for retrieving and collecting distributed stored documents And a document security server (6) for storing a document requested to be registered in the DB server (3) in a plurality of DB servers (3) ).

이에, 상기 문서 보안 서버(6)는 네트워크(5)를 통해 제1 단말(1)에서 요청하는 문서 DB화를 접수할 시에 문서를 분할하여 복수의 DB 서버(3)에 분산 저장하는 한편, 문서정보를 문서정보 DB 서버(4)에 등록 저장하는 문서 등록부(10)와, 네트워크(5)를 통해 제2 단말(2)에서 요청하는 문서 제공을 접수할 시에 복수 DB 서버(3)에 분산 저장된 문서를 문서정보 DB 서버(4)에 저장된 문서정보에 따라 각 DB 서버(3)로부터 불러들여 취합 복원한 문서를 제2 단말(2)에 전송 제공하는 문서 복원부(20)를 구비한다.The document security server 6 divides a document into a plurality of DB servers 3 and stores the documents in a distributed manner when the document security DB 6 requests a document DB from the first terminal 1 through the network 5, A document registration unit 10 for registering and storing document information in the document information DB server 4 and a plurality of DB servers 3 And a document restoring unit (20) for transferring and retrieving the distributed stored document from each DB server (3) according to the document information stored in the document information DB server (4) to the second terminal (2) .

여기서, 복수 DB 서버(3)에 분산 저장할 문서는 텍스트 요소를 포함한 문서 또는 그래픽 요소만 포함된 문서를 그래픽 문서화한 이미지일 수 있으며, 물론, 문서가 전자문서로서 그래픽 데이터로 작성된 경우에는 그래픽 문서화하지 아니하고 그대로 사용한다.Here, the document to be distributed and stored in the plurality of DB servers 3 may be a document including only a text element or an image including only graphic elements, a graphic document, and of course, when the document is created as graphic data, Do not use it.

문서는 종이문서(책자를 포함) 및 전자문서로 구분할 수 있다. Documents can be classified into paper documents (including booklets) and electronic documents.

전자문서는 워드 문서, 데이터베이스 파일, 스프레드 쉬트, 프로그램 소스코드, 이미지 파일(그래픽 데이터) 등을 포함한다.The electronic document includes a word document, a database file, a spreadsheet, a program source code, an image file (graphic data), and the like.

즉, 본 발명에 따르면 제1 단말(1)에서 전자문서의 일종인 그래픽 데이터로 이루어지는 이미지, 종이문서를 스캔한 이미지, 또는 이미지 파일 형식을 제외한 다른 형식의 전자문서를 그래픽 형태로 포맷 변환한 이미지를 문서 보안 서버(6)에 전송하게 하거나, 또는 제1 단말(1)로부터 이미지 파일이 아닌 전자문서로 전송할 시에 문서 보안 서버(6)의 문서 등록부(10)에서 그 전자문서를 이미지로 변환하게 한다. That is, according to the present invention, in the first terminal 1, an image composed of graphic data, which is a type of an electronic document, an image obtained by scanning a paper document, or an image obtained by format- To the document security server 6 or to convert the electronic document to an image in the document registration unit 10 of the document security server 6 when the document is transmitted from the first terminal 1 to an electronic document that is not an image file .

이에, 문서 등록부(10)에는 문서-이미지 변환부(미도시)를 구비하는 것이 좋다.Therefore, the document registration unit 10 is preferably provided with a document-image conversion unit (not shown).

이와 같은 이미지의 등록 요청을 접수하는 상기 문서 등록부(10)는 이미지를 복수의 조각으로 분할한 후 이미지 조각들의 배열을 변경하여 퍼즐화 이미지를 얻는 퍼즐화부(11), 문서의 속성 정보를 텍스트 형태로 얻는 속성 추출부(12) 및 퍼즐화 이미지의 이미지 조각들을 복수 그룹으로 분류하여 복수의 DB 서버(3)에 분산 저장하고, 퍼즐화 정보, 분산 저장 정보 및 속성 정보를 문서정보로 하여 문서정보 DB 서버(4)에 등록 저장하는 DB화부(13)를 포함한다.The document registration unit 10 for receiving such an image registration request includes a puzzling unit 11 for dividing an image into a plurality of pieces and then changing the arrangement of image pieces to obtain a puzzled image, And the image pieces of the puzzle image are distributed and stored in a plurality of DB servers 3, and the puzzle information, distributed storage information, and attribute information are stored as document information, And a DB formatting unit 13 for registering and storing the data in the DB server 4.

문서의 속성 정보는 통상적으로 사용되는 문서 분류 및 조회를 위한 정보, 메타 정보 등을 포함할 수 있으며, 본 발명의 실시 예에서는 문서 내용을 단어 또는 키워드로 검색하기 위해 이미지화 이전 문서의 텍스트 또는 이미지 내에서 문자 인식(OCR : Optical character recognition)에 의해 얻는 텍스트를 속성 정보에 포함시키며, 이때 포함시키는 텍스트는 예를 들면 색인으로 할 수도 있다. 물론, 속성 정보는 제1 단말(1)로부터 전송받을 수도 있다.The attribute information of the document may include information for commonly used document classification and inquiry, meta information, and the like. In the embodiment of the present invention, in order to search the document contents by words or keywords, , Text included in OCR (Optical Character Recognition) is included in the attribute information, and the included text may be indexed, for example. Of course, the attribute information may be transmitted from the first terminal 1.

본 발명의 실시 예에 따르면, 이미지의 분할 위치에 번호를 매긴 후, 시이드(seed) 값에 따라 난수 수열이 결정되는 의사 난수 발생기(pseudo random number generator)로 2개 번호를 생성하여 생성한 2개 번호를 매긴 분할 위치의 이미지 조각을 위치 교환하는 셔플링(shuffling) 과정을 소정 회수 반복하므로, 상기 퍼즐화 정보는 시이드(seed) 값 및 셔플링 회수를 포함하고, 2개씩 생성한 난수 수열 전체는 포함하지 아니하여도 된다.According to the embodiment of the present invention, after dividing positions of images are numbered, two numbers are generated by a pseudo random number generator in which a random number sequence is determined according to a seed value. The shuffling process of exchanging the image fragments of the numbered division positions is repeated a predetermined number of times so that the puzzle information includes the seed value and the shuffling count, But may not include all of them.

한편, 후술하는 바와 같이, 본 발명의 실시 예에 따르면 상기 셔플링 회수는 확률적 정상 분포(stationary distribution)로의 수렴도(convergence rate)와, 분할한 이미지 조각 개수의 함수로 결정한다.Meanwhile, as described later, according to the embodiment of the present invention, the shuffling count is determined by a convergence rate to a stochastic normal distribution and a function of the number of divided image fragments.

상기 분산 저장 정보는 분류한 각 그룹별로 저장된 DB 서버(3)의 IP 주소 또는 저장 위치를 포함으로써 네트워크를 통해 불러들이기 위한 접근 정보로 사용된다.The distributed storage information includes an IP address or a storage location of the DB server 3 stored for each classified group, and is used as access information for loading through the network.

각 그룹 내 이미지 조각들에 대한 퍼즐화 이미지 상의 위치(즉 분할 위치) 정보는 상기 분산 저장 정보에 포함시킬 수도 있다.Information on the position (i.e., division position) on the puzzled image for the image pieces in each group may be included in the distributed storage information.

그렇지만, 본 발명의 실시 예에 따르면, 복수 DB 서버(3)에 분산 저장되는 이미지는 각 그룹에 대해 퍼즐화 이미지 상에서의 이미지 조각들을 위치 변경 없이 그대로 두고, 나머지 영역을 비워두거나 아니면 임의의 이미지로 채운 희소성 이미지로 한다. 이에, 각 그룹 내 이미지 조각들의 위치 정보는 분산 저장 정보에 포함시키지 아니하여도 좋다. 다만, 상기 임의의 이미지를 희소성 이미지에 채워 넣는 경우에는, 임의의 이미지를 구분하기 위한 정보를 분산 저장 정보에 포함시키는 것이 바람직하다.However, according to the embodiment of the present invention, the image distributed and stored in the plurality of DB servers 3 can be obtained by leaving the image fragments on the puzzled image for each group unchanged, leaving the remaining region empty, Filled images of scarcity. Therefore, the position information of the image pieces in each group may not be included in the distributed storage information. However, when the arbitrary image is filled in the sparse image, it is preferable that information for identifying an arbitrary image is included in the distributed storage information.

상기 문서 복원부(20)는 상기한 바와 같이 저장한 복수 희소성 이미지 및 문서정보를 제2 단말(2)에서 검색 또는 조회하여 문서를 제공받을 수 있게 하는 구성요소로서, 제2 단말(2)이 네트워크(5)를 통해 접속하여 문서 제공을 요청할 시에, 속성 정보에 근거하여 요청 문서에 관련된 속성 정보를 특정함으로써 요청 문서에 대응되는 퍼즐화 정보 및 분산 저장 정보를 얻는 검색부(21), 각 DB 서버(3)에 분산 저장된 희소성 이미지를 분산 저장 정보에 따라 취합한 후 결합한 이미지를 얻은 후 퍼즐화 정보에 근거하여 퍼즐화할 시 배열 변경의 역으로 재배열하여 퍼즐화 이전의 이미지를 얻는 이미지 복원부(22), 및 이때 얻은 이미지가 문서를 그래픽 형태로 변환한 이미지인 경우에 문자 인식(OCR : Optical character recognition)하여 그래픽화 이전 전자 문서를 얻는 문서화부(23)를 구비한다.The document restoration unit 20 is a component that allows the second terminal 2 to retrieve or query the plurality of scarce images and document information stored as described above to receive a document, A retrieval unit 21 for obtaining puzzification information and distributed storage information corresponding to the requested document by specifying attribution information related to the requested document based on the attribution information when access is made via the network 5 and requesting document provision, A method for restoring an image to obtain a pre-puzzled image by rearranging a scarcity image distributed in the DB server (3) according to distributed storage information, rearranging the rearranged sequence in a puzzle based on the puzzled information after obtaining a combined image (22), and an electronic document obtained by pre-graphicization by OCR (Optical Character Recognition) when the obtained image is an image obtained by converting the document into a graphic form And a section (23).

본 발명의 실시 예에 따르면, 복수 DB 서버(3)에 분산 저장된 이미지는 퍼즐화 이미지 상의 이미지 조각 위치에 대해 변동을 주지 아니한 희소성 이미지이므로, 각 DB 서버(3)에서 취한 각 희소성 이미지를 겹쳐 원 퍼즐화 이미지를 복원할 수 있다.According to the embodiment of the present invention, since the image distributed to the plurality of DB servers 3 is a scarcity image that does not change with respect to the position of the image fragment on the puzzled image, each scarcity image taken by each DB server 3 is superimposed You can restore the puzzle image.

도 2는 도 1에 도시한 문서 보안 시스템의 변형 예를 보여주는 블록 구성도로서, 문서 등록부(10)를 제1 단말(1)에 구비하고, 문서 복원부(20)를 제2 단말(2)에 구비하며, 문서 보안 서버(6)는 별도로 구비하지 아니한다. 여기서, 문서 복원부(20)는 문서정보 DB 서버(4)에 등록한 문서정보에 따라 복수 DB 서버(3)에 분산 저장된 희소성 이미지로부터 문서를 얻을 수 있다.FIG. 2 is a block diagram showing a modification of the document security system shown in FIG. 1, in which the document registration unit 10 is provided in the first terminal 1, the document restoration unit 20 is provided in the second terminal 2, And the document security server 6 is not provided separately. Here, the document restoring unit 20 can obtain a document from the scarcity image distributed and stored in the plurality of DB servers 3 according to the document information registered in the document information DB server 4. [

도면으로 첨부하지는 아니하였지만, 다른 변형 예로서, 문서 등록부(10)의 퍼즐화부(11) 및 속성 추출부(12)를 제1 단말에 구비하고, 문서 보안 서버(6)는 DB화부(13) 및 문서 복원부(20)를 구비하게 할 수도 있다. The document security server 6 includes the paging unit 11 and the attribute extracting unit 12 of the document registering unit 10 and the DB generating unit 13 in the first terminal, And a document restoration unit 20 may be provided.

이와 같은 변형 실시 예는 동일 기능의 구성요소를 위치 변경한 것에 불과하다.Such a modified embodiment is merely a replacement of the constituent elements of the same function.

이하, 상기한 문서 보안 시스템의 문서 등록부(10) 및 문서 복원부(20)에 이루어지는 문서 보안 방법에 대해서 상세하게 설명한다.Hereinafter, a document security method in the document registration unit 10 and the document restoration unit 20 of the document security system will be described in detail.

도 3에 도시한 바와 같이, 본 발명의 실시 예에 따른 문서 보안 방법은 문서 등록부(10)에 의해 수행되는 문서 등록 단계(S100)와, 제2 단말(2)로부터 문서 제공을 요청받을 시에(S201) 문서 복원부(20)에 의해 수행되는 문서 복원 단계(S200)로 이루어진다.3, a document security method according to an exemplary embodiment of the present invention includes a document registration step S100 performed by the document registration unit 10, a document registration step S100 when a document is requested to be provided from the second terminal 2 (S201) a document restoration step performed by the document restoring unit 20 (S200).

상기 문서 등록 단계(S100)는 텍스트 요소를 포함한 문서를 그래픽화한 이미지 또는 그래픽 문서로 작성된 이미지를 복수의 조각으로 분할한 이후 이미지 조각들의 위치를 바꿔 배열 변경함으로써 원 문서의 내용 또는 원 문서에 표출된 형상을 유추하지 못하게 한 퍼즐화 이미지를 얻는 퍼즐화 단계(S110)와, 문서를 검색 또는 조회할 시에 사용할 속성 정보를 문서 또는 문서의 이미지로부터 추출하거나 또는 문서 등록을 하는 제1 단말(1)로부터 전송받는 속성 추출 단계(S120)와, 퍼즐화 이미지의 이미지 조각들을 복수 그룹으로 분류한 후 복수의 DB 서버(3)에 분산 저장하는 분산 저장 단계(S130)와, 퍼즐화 정보, 분산 저장 정보 및 속성 정보를 문서정보로 하여 문서정보 DB 서버(4)에 등록하는 문서정보 DB화 단계(S140)의 순서로 이루어진다.The document registration step (S100) includes dividing an image formed of an image of a document containing a text element or a graphic document into a plurality of fragments, and then repositioning the image fragments to change the arrangement thereof. (S110) for obtaining a puzzled image which prevents the shape of the document from being inferred from the image of the document or the document, A distributed storage step S130 of dividing the image pieces of the puzzled image into a plurality of groups and distributing the divided image pieces to a plurality of DB servers 3, And a document information DB making step (S140) of registering the information and attribute information in the document information DB server 4 as document information.

본 발명의 실시 예에 따른 상기 퍼즐화 단계(S110)에 대해서는 도 4 및 도 5를 참조하며 설명한다. 여기서, 도4를 참조할 시에는 실선 화살표 방향으로 변화를 참조하면 된다.The puzzling step (S110) according to the embodiment of the present invention will be described with reference to FIG. 4 and FIG. Here, referring to FIG. 4, the change in the arrow direction of the solid line may be referred to.

상기 퍼즐화 단계(S110)는 도 4에 도시한 바와 같이 원 이미지(A)를 격자 형태로 분할한 이후, 원 이미지(A)를 유추하기도 어렵고 어떤 내용 또는 이미지가 있는지도 알아보기 어려울 정도의 퍼즐화 이미지(B)를 얻을 때까지 분할 이미지(a)들의 배열을 변경하는 단계로서, 본 발명의 실시 예에 따르면, 2개 분할 이미지(a)를 무작위로 취하여 위치 교환하는 셔플링(shuffling) 과정을 반복한다.As shown in FIG. 4, the puzzling step S110 is a process of dividing the original image A into a lattice shape, and then it is difficult to infer the original image A, Changing the arrangement of the divided images (a) until the image B is obtained, wherein according to the embodiment of the present invention, a shuffling process of randomly taking the two divided images (a) Repeat.

도 5에 구체적으로 예시한 도면을 참조하며 구체적으로 설명하면, 원 이미지(A)를 가로 7열 및 세로 9열로 나눠 63개의 분할 이미지로 분할하고 순서에 따라 각 분할 위치에 1에 63까지 번호를 매긴 이후, 1부터 63까지의 번호 중에 2개의 난수에 대응되는 위치의 이미지 조각(a)을 위치 교환하는 셔플링 과정을 소정의 셔플링 회수만큼 반복한다. 도 5에 예시한 바와 같이 3회까지의 셔플링 과정에서 난수가 서로 다르면 6개 분할 이미지가 위치 변동하고, 셔플링 과정을 진행할수록 원 이미지(A) 상의 위치와 다른 위치로 변동하는 분할 이미지(a)의 개수도 증가하게 된다.Referring to the drawings specifically illustrated in FIG. 5, the original image (A) is divided into seven divided images of seven columns and nine columns, and divided into 63 divided images. After that, the shuffling process of exchanging the image pieces (a) at positions corresponding to the two random numbers out of the numbers 1 to 63 is repeated by a predetermined number of shuffling times. As shown in FIG. 5, when the random numbers are different from each other in the three shuffling processes, the six divided images are moved and the divided images (A, B, the number of a) also increases.

그런데, 퍼즐화 이미지를 얻기 위해 사용한 난수의 개수만큼 퍼즐화 정보의 데이터량도 증가하며, 셔플링 회수를 많게 하면 퍼즐화 단계(S110)에 소요되는 시간이 길어지고, 셔플링 회수를 너무 적게 하면 적절한 퍼즐화 이미지를 얻을 수 없게 되는 문제가 있다.However, the data amount of the puzzle information increases by the number of random numbers used to obtain the puzzled image. If the number of shuffling times is increased, the time required for the puzzling step (S110) becomes longer. If the number of shuffling times is too small There is a problem that an appropriate puzzled image can not be obtained.

본 발명의 실시 예에서는 난수의 개수에 무관하게 시이드(seed) 값과 셔플링 회수를 퍼즐화 정보로 하여 셔플링 회수의 변동에 따른 데이터량의 증가 없이 일정한 데이터량을 갖게 하고, 셔플링 회수도 적절한 퍼즐화 이미지를 얻을 수 있는 적정 셔플링 회수를 사용한다.In the embodiment of the present invention, the seed value and the shuffling count are used as puzzle information irrespective of the number of random numbers, a certain amount of data is provided without increasing the data amount due to the variation of the shuffling count, Also use the appropriate shuffling number to get an appropriate puzzled image.

먼저, 난수에 대해서는 시이드(seed)에 따라 난수 수열이 결정되는 의사 난수 발생기(pseudo random number generator)로 적정 셔플링 회수의 2배수 난수 수열을 생성하되, 생성 순서에 따라 2개씩 취하여 난수 번호가 매겨진 분할 위치의 이미지 조각을 위치 교환하는 셔플링 과정을 반복한다. 물론 시이드 값은 임의의 값으로 하는 것이 좋다.First, for a random number, a random number sequence is generated by a pseudo random number generator whose random number sequence is determined according to a seed. And repeats the shuffling process of exchanging positions of image fragments of the divided positions. Of course, it is preferable to set the seed value to an arbitrary value.

그리고, 퍼즐화 정보는 시이드 값과 적정 셔플링 회수를 포함하게 한다. 즉, 하기의 역퍼즐화 단계(S230)에서 동일한 의사 난수 발생기에 시이드 값을 적용하여 적정 셔플링 회수의 2배수 난수 수열을 생성함으로써 퍼즐화 과정에 적용한 난수를 얻게 한다.The puzzle information includes the seed value and the appropriate shuffling count. That is, in the following reverse puzzling step S230, a seed value is applied to the same pseudo-random number generator to generate a random number sequence of two times the proper shuffling number, thereby obtaining a random number applied to the puzzle processing.

다음으로, 적정 셔플링 회수에 대해서는 셔플링 회수의 증가에 따라 각 이미지 조각 또는 어느 하나의 특정 이미지 조각이 확률적으로 분할 위치에 관계없이 균일 확률로 존재할 수 있는 정상 분포(stationary distribution)로의 수렴도(convergence rate) 및 분할한 이미지 조각 개수의 함수로 결정한다. Next, with respect to the number of shuffling times, the convergence to a stationary distribution in which each image piece or one specific image piece can exist stochastically with a uniform probability irrespective of the dividing position the convergence rate and the number of divided image fragments.

바람직하게는 상기 수렴도는 분할 위치별 확률의 최대 편차를 정상 분포일 때의 분할 위치 확률로 나누어 얻는 정규화 값으로 하여서, 분할 이미지 조각의 개수에 따라 위치별 확률 분포의 편차가 상이하게 되는 문제도 해소하였다.Preferably, the degree of convergence is a normalized value obtained by dividing the maximum deviation of the probability of each divided position by the divided position probability at the normal distribution, so that the deviation of the probability distribution by position differs according to the number of divided image fragments Respectively.

여기서, 정상 분포일 때의 분할 위치 확률은 이미지 조각 개수의 역수이다.Here, the split position probability at the normal distribution is the reciprocal of the number of image fragments.

수식으로 설명하면, 상기 퍼즐화 단계(S110)는 아래의 수학식 1로 적정 셔플링 회수를 산정 사용한다.The puzzling step (S110) calculates an appropriate shuffling count by the following equation (1).

Figure pat00002
Figure pat00002

수학식 1에서, k는 적정 셔플링 회수이고, N은 분할 이미지 조각의 개수이고, β는 상기한 바와 같이 정규한화 값으로서 사전에 설정한 수렴도이다.In Equation (1), k is an appropriate shuffling number, N is the number of divided image pieces, and? Is a predetermined convergence degree as a normalized value as described above.

상기 수학식 1의 도출과정은 하기에서 상세하게 설명한다.The derivation of Equation (1) will be described in detail below.

상기 속성 추출 단계(S120)에서 추출하는 속성 정보는 문서 관리를 위한 분류 정보 또는 조회 정보, 메타 정보 등을 포함할 수 있고, 본 발명의 실시 예에서는 문서에서 직접 또는 이미지에서 텍스트 인식하여 문서 내용, 색인 등을 나타내는 텍스트를 추가 추출하여 속성 정보에 포함시킨다. The attribute information extracted in the attribute extracting step S120 may include classification information for managing a document, inquiry information, meta information, and the like. In an embodiment of the present invention, An index, and the like are further extracted and included in the attribute information.

상기 분산 저장 단계(S130)는 분류된 각 그룹에 대해 퍼즐화 이미지(B) 상에서의 이미지 조각(a)들을 위치 변경 없이 그대로 두어 분할 이전 퍼즐화 이미지(B)의 크기를 갖는 희소성 이미지(C1, C2, C3, C4)를 생성하고, 그룹별로 생성한 희소성 이미지(C1, C2, C3, C4)를 서로 다른 DB 서버(3)에 분산 저장한다. The distributed storage step S130 may be performed by leaving the image fragments a on the puzzled image B as unchanged for each classified group to generate scarcity images C1, C2, C3, and C4, and distributes the scarcity images C1, C2, C3, and C4 generated for each group to the different DB servers 3 in a distributed manner.

이때, 각 그룹별 희소성 이미지(C1, C2, C3, C4)는 이미지 조각(a)이 있는 위치를 제외한 나머지 영역(b)을 비워둔 상태로 두거나, 아니면 나머지 영역(b)을 식별 가능한 임의의 이미지로 채운다. 여기서, 식별 가능한 임의의 이미지는 하기서 설명하는 취합 단계(S220)에서 이미지 조각(a)을 제외한 나머지 영역(b)을 삭제하기 위해 식별 가능한 임의의 이미지로 한다. At this time, the scarcity images (C1, C2, C3, C4) for each group are left in a state in which the remaining region b is left empty except for the position where the image piece a is present, Fill with images. Here, any identifiable image is any image which can be discerned in order to delete the remaining region (b) except for the image fragment (a) in the collecting step (S220) described below.

식별을 위한 예를 들면, 임의의 이미지에 사전 약속된 패턴을 추가하는 방식을 사용할 수 있다.For identification, for example, a method of adding a previously promised pattern to an arbitrary image can be used.

물론, 각 그룹별 희소성 이미지(C1, C2, C3, C4)에서 이미지 조각(a)의 위치를 분산 저장 정보에 포함시켜서, 나머지 영역(b)과 구분할 수 있게 하는 것도 가능하다.Of course, it is also possible to include the position of the image segment (a) in the scarcity images (C1, C2, C3, C4) for each group in the distributed storage information so as to be distinguishable from the remaining region (b).

이에, 퍼즐화 이미지(B) 상의 각 분할 이미지 조작(a)들은 복수의 희소성 이미지(C1, C2, C3, C4) 중에 어느 하나에만 존재하고 중복되지는 아니한다.Thus, each divisional image operation (a) on the puzzled image B exists and is not duplicated in any one of the plurality of scarity images C1, C2, C3, C4.

그리고, 상기 분산 저장 단계(S130)는 복수 DB 서버(3) 내의 저장된 희소성 이미지로의 접근 정보, 즉, IP주소 또는 DB 서버(3) 내의 저장 위치(주소)를 포함하는 분산 저장 정보를 생성한다.The distributed storage step (S130) generates distributed storage information including access information to the stored sparse images in the plurality of DB servers 3, that is, an IP address or a storage location (address) in the DB server 3 .

한편, 각 그룹별로 이미지 조각(a)들을 상호 붙인 이미지로 저장하고, 각 이미지 조각(a)에 대해 퍼즐화 이미지(B) 상에서의 위치 정보를 분산 저장 정보에 포함시키는 방식도 가능하지만, 희소성 이미지로 하는 것이 취합 복원하는 데 복잡도가 낮으므로 이하 설명에서는 희소성 이미지로 분산 저장하는 것으로 설명한다.Meanwhile, it is possible to store the image pieces (a) as images with each other in each group, and to store the position information on the puzzled image (B) in each image piece (a) The complexity is low in restoring and restoring, so that the following description will be made on the assumption that the images are scattered and stored as a scarcity image.

상기 문서정보 DB화 단계(S140)는 상기 퍼즐화 단계(S110)에서 원 문서의 이미지(A)로부터 퍼즐화 이미지(B)를 얻을 시에 적용한 퍼즐화 정보(즉, 시이드 값 및 적정 셔플링 회수), 상기 속성 추출 단계(S120)에서 추출한 속성 정보, 및 분산 저장 단계(S130)에서 각 그룹별로 저장된 DB 서버(3)내의 접근 정보인 분산 저장 정보를 문서정보로 하여 문서정보 DB 서버(4)에 등록 저장한다.The document information DB making step S140 is a step of converting the puzzle information (i.e., the seed value and the appropriate shuffling information) applied to obtain the puzzled image B from the image A of the original document in the puzzling step S110 The attribute information extracted in the attribute extracting step S120 and the distributed storage information which is the access information in the DB server 3 stored in each group in the distributed storage step S130 as document information, ).

이와 같이 문서를 이미지로서 분산 저장하고 문서정보를 등록하여 둠으로써, 문서를 열람 또는 다운로드 받기 위한 준비가 된 이후, 제2 단말(2)에서 열람 또는 다운로드 방식으로 문서 요청을 하면(S201) 상기 문서 복원 단계(S200)를 수행한다.After the document is distributed and stored as an image and the document information is registered, the document is requested to be viewed or downloaded from the second terminal 2 (S201) A restoration step (S200) is performed.

이때의 문서 요청은 문서의 속성 정보를 전송하여 속성 정보에 대응되는 이미지를 요청하는 것으로서, 문서 내용이 담긴 텍스트를 검색 키워드로 할 수 있게 하였다.The document request at this time requests the image corresponding to the attribute information by transmitting the attribute information of the document, and the text containing the document contents can be used as the search keyword.

상기 문서 복원 단계(S200)는 문서 제공을 요청받을 시에 해당 문서의 속성 정보에 근거하여 대응되는 퍼즐화 정보 및 분산 저장 정보를 문서정보 DB 서버(4)로부터 얻는 검색 단계(S210)와, 분산 저장된 희소성 이미지를 분산 저장 정보에 따라 각 DB 서버(3)로부터 취합한 후 결합한 이미지를 얻는 취합 단계(S220)와, 퍼즐화 정보에 근거하여 퍼즐화할 시 배열 변경의 역으로 재배열하여 퍼즐화 이전의 이미지를 얻는 역퍼즐화 단계(S230)와, 역퍼즐화 단계(S230)에서 얻은 이미지가 문서를 그래픽 형태로 변환한 이미지인 경우에 텍스트 인식하여 그래픽화 이전 문서를 얻는 문서화 단계(S240)의 순서로 이루어진다.The document restoration step S200 includes a retrieving step S210 of obtaining corresponding puzzling information and distributed storage information from the document information DB server 4 on the basis of the attribute information of the document when requested to provide the document, A collection step S220 of collecting the stored scarcity images from the respective DB servers 3 according to the distributed storage information and obtaining a combined image, and rearranging them in the reverse order of the arrangement change when puzzling based on the puzzle information (S230) for obtaining an image of the document in the reverse puzzling step (S230), and a documenting step S240 for acquiring a text before the graphic recognition when the image obtained in the reverse puzzling step S230 is an image obtained by converting the document into a graphic form In order.

상기 검색 단계(S210)는 문서 분류 정보, 조회 정보 또는 메타 정보에 따라 요청 문서에 대응되는 속성 정보를 특정하여 퍼즐화 정보 및 분산 저장 정보를 얻을 수 있으나, 문서 내의 텍스트를 속성 정보에 포함시켰으므로, 문서 요청 시에 검색어로 속성 정보에 포함된 텍스트를 검색함으로써, 속성 정보를 특정할 수 있고, 이에, 특정한 속성 정보에 대응되는 퍼즐화 정보 및 분산 저장 정보를 얻을 수 있다.The searching step S210 can obtain the puzzle information and the distributed storing information by specifying the attribute information corresponding to the requested document according to the document classification information, the inquiry information or the meta information, but the text in the document is included in the attribute information , The attribute information can be specified by searching the text included in the attribute information as a search word at the time of the document request, and puzzification information and distributed storage information corresponding to the specific attribute information can be obtained.

상기 취합 단계(S220) 및 역퍼즐화 단계(S230)는 도 4에 파선 화살표로 표시되어 있다. The combining step (S220) and the reverse puzzling step (S230) are indicated by dashed arrows in Fig.

도 4를 참조하면, 취합 단계(S220)는 분산 저장 정보에 따라 각 DB 서버(3)로부터 불러들인 희소성 이미지(C1, C2, C3, C4)를 상호 겹쳐 퍼즐화 이미지(B)를 생성한다. Referring to FIG. 4, the collecting step S220 creates a puzzled image B by superimposing the scarlet images C1, C2, C3 and C4 loaded from each DB server 3 according to the distributed storage information.

즉, 이미지 조각(a)들은 서로 다른 희소성 이미지(C1, C2, C3, C4)에 중복으로 존재하지 아니하므로, 상호 겹침으로써 퍼즐화 이미지(B)를 얻을 수 있다. 물론, 각각의 희소성 이미지(C1, C2, C3, C4)에서 이미지 조각(a)을 제외한 나머지 영역(b)에 상기한 임의의 이미지를 채워 넣는 방식을 사용한 경우에는, 그 임의의 이미지를 삭제한 후 겹치면 된다.That is, since the image pieces (a) do not overlap in the different scarcity images (C1, C2, C3, C4), they can overlap each other to obtain the puzzled image (B). Of course, in the case of employing a method of filling the above-mentioned arbitrary image into the remaining area b except for the image fragment (a) in each of the scarity images C1, C2, C3 and C4, And then overlap.

상기 역퍼즐화 단계(S230)는 퍼즐화 정보에 포함된 시이드 값 및 적정 셔플링 회수에 따라 퍼즐화 이전 원 이미지(A)를 얻는 단계로서, 시이드 값을 적용한 의사 난수 발생기(pseudo random number generator)로 적정 셔플링 회수의 2배수 난수 수열을 생성하여 상기 퍼즐화 단계(S110)와 동일한 난수 수열을 얻고, 난수 수열의 역순으로 2개씩 취하여 2개의 난수 번호가 매겨진 분할 위치의 이미지 조각을 위치 교환하는 셔플링(shuffling) 과정을 반복한다. 이에, 퍼즐화 이전 원 이미지(A)를 얻을 수 있다.The reverse puzzling step S230 is a step of obtaining the original image A before puzzling according to the seed value and the appropriate shuffling count included in the puzzle information and includes a pseudo random number generator generating two random number sequences of the shuffling number of times to obtain the same random number sequence as the puzzling step S110 and taking two random numbers in the reverse order of the random number sequence to generate image pieces of the two random number- Repeat shuffling process to exchange. Thus, the original image A before puzzling can be obtained.

상기 문서화 단계(S240)는 상기 역퍼즐화 단계(S230)에서 얻은 원 이미지(A)를 예를 들어 문자 인식(OCR : Optical character recognition)하여 텍스트를 추출하고, 원 문서의 포맷으로 전자문서화한다. 원 문서의 포맷은 속성 정보 또는 희소성 이미지의 메타 정보에 넣어두어서, 문서화 단계(S240)에서 알 수 있게 하는 것이 좋다.The documenting step S240 extracts the text by performing optical character recognition (OCR) on the original image A obtained in the reverse puzzling step S230, and electronically documents the original image in the original document format. It is preferable that the format of the original document is put into the meta information of the attribute information or the scarcity image so that it can be known in the documenting step S240.

이러한, 문서화 단계(S240)는 이미지로 DB화한 워드 문서, 데이터베이스 파일, 스프레드 쉬트, 프로그램 소스코드 등의 전자문서를 제공함으로써, 제2 단말(2)에서의 활용 범위를 넓게 한다.The documenting step S240 provides an electronic document such as a word document, a database file, a spreadsheet, a program source code or the like, which is made into an image DB, thereby widening the utilization range of the second terminal 2.

이와 같이 얻은 전자문서 또는 텍스트가 존재하지 아니하여 문서화 단계를 거치지 아니한 이미지는 제2 단말(2)에 전송한다. 한편, 문서화 단계(S240)에 의한 전자문서화 이전의 이미지를 전송하게 하여도 좋다.The electronic document or text thus obtained does not exist and the image that has not undergone the documenting step is transmitted to the second terminal 2. Alternatively, the image before the electronic documenting by the documenting step S240 may be transmitted.

물론, 제1 단말(1)과 제2 단말(2)이 문서 보안 서버(6)에 접속할 시에는 인증과정을 수행하여 접속 보안을 확보한 이후 문서 등록 및 문서 복원 서비스를 제공하여야 할 것이다.Of course, when the first terminal 1 and the second terminal 2 are connected to the document security server 6, an authentication process is performed to secure connection security, and then a document registration and document restoration service should be provided.

이하, 상기 수학식1의 근거에 대해서 설명한다.Hereinafter, the basis of Equation (1) will be described.

먼저, DTMC(Discrete Time Markov Chain)은 다음과 같이 정의한다.First, the DTMC (Discrete Time Markov Chain) is defined as follows.

<정의 1 : DTMC(Discrete Time Markov Chain) >Definition 1: Discrete Time Markov Chain (DTMC)

Countable state space S 에서 값을 갖는 random variable의 수열 X1,X2,...에 대하여 다음과 같이 Markov property 를 만족하는 경우, 이 수열을 DTMC라고 정의한다.If the Markov property is satisfied for the sequence X 1 , X 2 , ... of a random variable having a value in the countable state space S, this sequence is defined as DTMC.

< Markov property ><Markov property>

모든

Figure pat00003
에 대하여, all
Figure pat00003
about,

Figure pat00004
Figure pat00004

상기한 Markov property를 살펴보면, n+1번째 시점의 state는 바로 직전 시점인 n번째 시점의 state에 의해 분포가 결정되고, 이 확률

Figure pat00005
이 n에 관계 없이 일정하면 time homogeneous DTMC 라고 한다. In the Markov property, the state of the (n + 1) -th viewpoint is determined by the state of the n-th viewpoint just before the instant,
Figure pat00005
If it is constant regardless of n, it is called time homogeneous DTMC.

그리고, state space S의 크기를 N이라 할 경우,

Figure pat00006
를 i번째 row 및 j번째 column의 값을 갖는 N x N 크기의 transition matrix P=(pij)를 정의할 수 있다.If the size of state space S is N,
Figure pat00006
Can be defined as a transition matrix P = (p ij ) of size N x N having the values of the i-th row and the j-th column.

다음으로, 아래와 같이 정의 2 및 정의 3에 대한 정리를 소개한다.Next, we introduce the theorem for Definitions 2 and 3 as follows.

< 정의 2 : limiting distribution ><Definition 2: limiting distribution>

크기가 N인 state space S를 갖는 DTMC의 transition matrix 를 P라고 할 때, 크기가 N row vector로 만들어진 초기 distribution

Figure pat00007
에 대하여 k번째 distribution 을
Figure pat00008
=
Figure pat00009
라고 정리할 수 있고, 이때
Figure pat00010
가 존재한다면 우리는 이 row vector를 limiting distribution이라고 정의한다.Let P be the transition matrix of the DTMC with state space S of size N. The initial distribution
Figure pat00007
The kth distribution for
Figure pat00008
=
Figure pat00009
In this case,
Figure pat00010
We define this row vector as the limiting distribution.

이 정의에서 초기 distribution 이란, random variable X0 가 각 state에 있을 확률이라고 보면 된다. 따라서, 초기 distribution

Figure pat00011
의 각 entry는 확률이기 때문에 0 이상 1 이하의 값을 갖고, entry의 합은 1의 값을 갖는다.In this definition, the initial distribution is the probability that a random variable X 0 exists in each state. Therefore,
Figure pat00011
Each entry has a probability of 0 or more and 1 or less, and the sum of the entries has a value of 1.

<정의 3 : stationary distribution><Definition 3: stationary distribution>

크기가 N인 state space S를 갖는 DTMC의 transition matrix 를 P라고 할 때, Let P be the transition matrix of the DTMC with state space S of size N,

Figure pat00012
Figure pat00012

의 조건을 만족하는 크기가 N인 row vector

Figure pat00013
를 stationary distrabution이라고 정의한다.A row vector of size N satisfying the condition
Figure pat00013
Is defined as stationary distrabution.

여기서, 크기가 N<∞인 state space S를 갖는 DTMC가 irreducible 하고 aperiodic하면, N row vector로 만들어지는 distribution π 에 대해 stationary distribution이 유일하게 존재하고, 초기 distribution에 무관하게 limiting distribution이 stationary distribution과 일치하는 정리를 얻을 수 있다. If a DTMC with a state space S of size N <∞ is irreducible and aperiodic, then there is a stationary distribution for the distribution π made up of N row vectors, and the limiting distribution is consistent with the stationary distribution regardless of the initial distribution. Can be obtained.

이에, stationary distribution에 관심을 갖고 다음과 같이 셔플링에 따른 distribution을 해석할 수 있다.Therefore, we are interested in stationary distribution and can interpret distribution according to shuffling as follows.

도 4 및 도 5를 참조하며 설명한 바와 같이, 원 이미지(A)를 N개의 조각으로 분할하고, 분할 조각의 위치에 차례대로 1부터 N까지 순번을 매긴 이후에, 1 내지 N의 범위 내에서 실질적으로 uniform random number(균등 난수)를 생성하는 pseudo random number generator(의사 난수 발생기)로 2개 난수를 생성하고 2개 난수의 위치에 있는 이미지 조각을 상호 교환하는 셔플링 과정을 반복하여서 퍼즐화 이미지(B)를 얻는다.As described with reference to Figs. 4 and 5, after the original image A is divided into N pieces and the sequence of the division pieces is sequentially ranked from 1 to N, A random number generator generating a uniform random number and generating a random number by repeating a shuffling process of mutually exchanging image fragments at two random numbers to generate a puzzle image B).

이 경우, 특정 이미지 조각의 위치를 state로 잡으면, 셔플링을 할 때마다 특정 이미지 조각이 N개 위치 중 한 곳으로 이동할 수 있으므로, state space S는 {1,2, ..., N}으로 생각할 수 있고, transition matrix P의 크기는 N x N으로 생각할 수 있다. 즉, 초기 state를 X0=1으로 설정한 경우 초기 distribution은 [1,0,0, ...,0]으로 설정된다. In this case, if the state of a particular image fragment is set to state, the state space S is {1,2, ..., N} since a particular image fragment can be moved to one of N positions each time shuffling is performed And the size of the transition matrix P can be thought of as N x N. That is, when the initial state is set to X 0 = 1, the initial distribution is set to [1,0,0, ..., 0].

이와 같이 특정 이미지 조각으로 선택한 어느 하나의 이미지 조각의 위치를 state로 하더라도 셔플링 회수의 증가에 따른 다른 이미지 조각들의 distribution도 특정 이미지 조각과 실질적으로 동일한 distribution을 보일 것이므로, 어느 하나의 특정 이미지 조각에 한정하여 살펴본다.Thus, even if the position of one image segment selected by a specific image segment is set to a state, the distribution of other image segments according to an increase in the number of shuffling will also have a distribution substantially identical to that of a specific image segment. We will look at it in a limited way.

2개 난수로 셔플링하여서 특정 이미지 조각의 위치가 바뀌는 경우는 2개 난수 모두가 특정 이미지 조각의 현재 위치이거나 아니면 특정 이미지 조각의 현재 위치가 아닌 경우이므로, 확률은

Figure pat00014
이다.If the position of a particular image fragment changes due to shuffling with two random numbers, since both of the two random numbers are either the current position of a particular image fragment or the current position of a particular image fragment,
Figure pat00014
to be.

또한, 셔플링에 의해 특정 이미지 조각의 위치가 다른 위치로 바뀌는 경우는 2개 난수 중에 어느 하나의 난수가 특정 이미지 조각의 현재 위치이고 다른 하나의 난수가 그 다른 위치인 경우이므로, 확률은

Figure pat00015
가 된다.In addition, when the position of a specific image fragment is changed to another position by shuffling, since any one of the two random numbers is the current position of the specific image fragment and the other random number is the other position,
Figure pat00015
.

이에, 현재의 i 위치에서 j위치로 변경될 확률 P(i,j)를 entry 로 하는 다음의 transition matrix P를 정의할 수 있다.Thus, we can define the next transition matrix P with the entry P (i, j) as the entry to be changed from the current i position to the j position.

Figure pat00016
Figure pat00016

상기한 transition matrix P에 따르면, 모든 entry는 양수이므로 irreducible하고, diagonal entry도 모두 양수이므로 aperiodic하다. 또한, transition matrix P는 symmetric이고, 각 row의 합이 항상 1이고, 각 column의 합도 항상 1이므로, symmetric doubly stochastic matrix이다.According to the transition matrix P described above, all entries are irreducible because they are positive numbers, and diagonal entries are both aperiodic because they are both positive. Also, the transition matrix P is a symmetric doubly stochastic matrix, since the sum of each row is always 1 and the sum of each column is always 1.

따라서, transition matrix P는 irreducible하고 aperiodic하므로, 앞서 정리한 바를 적용하면, stationary distribution이 유일하게 존재하고, 초기 distribution에 관계없이 limiting distribution과 stationary distribution이 일치한다.Thus, the transition matrix P is irreducible and aperiodic, so if we apply the foregoing, there is only one stationary distribution, and the limiting and stationary distributions are consistent regardless of the initial distribution.

그리고, transition matrix P의 각 column의 합이 1이므로

Figure pat00017
이 stationary distribution임을 확인할 수 있다.And, since the sum of the columns of the transition matrix P is 1
Figure pat00017
This is a stationary distribution.

이는, 셔플링 회수를 점차 증가시키면, 초기 특정 위치의 특정 이미지 조각이 1 ~ N의 임의의 위치에 있을 수 있는 확률이 위치에 관계없이 항상 같게 되는 uniform 분포로 수렴하게 된다고 생각할 수 있다.It can be considered that increasing the shuffling number gradually converges to a uniform distribution in which the probability that a specific image fragment at an initial specific position may be in any position of 1 to N is always the same regardless of the position.

이에, 적정 셔플링 회수를 얻기 위해서 수렴도에 대해 고찰한다.Thus, the degree of convergence is considered to obtain the appropriate shuffling number.

이 경우의 DTMC에서는 transition matrix P의 eigenvalue와 eigenvector를 아래와 같이 직접 구할 수 있다.In this case, the eigenvalue and eigenvector of the transition matrix P can be directly obtained as follows.

eigenvalue λ = 1 일 때에, When eigenvalue? = 1,

Figure pat00018
Figure pat00018

이고, 이때 각 row의 합이 0이 되므로, eigenvector는 Since the sum of each row is 0 at this time, the eigenvector is

Figure pat00019
Figure pat00019

이 되고, normalize한 eigenvector And the normalized eigenvector

Figure pat00020
Figure pat00020

을 얻을 수 있다.Can be obtained.

다음으로, eigenvalue

Figure pat00021
일 때에, Next, the eigenvalue
Figure pat00021
In this case,

Figure pat00022
Figure pat00022

으로 된다. 이 matrix를 살펴보면, row의 모든 entry가 동일하다. 즉, row rank가 1이고 nullity가 N-1이 되므로, linearly independent한 N-1개의 eigenvector를 구할 수 있다.. Looking at this matrix, all entries in the row are the same. That is, since row rank is 1 and nullity is N-1, linearly independent N-1 eigenvectors can be obtained.

결과적으로, 2개의 eigenvalue λ=1 및

Figure pat00023
에서 N개의 eigenvector를 모두 찾았으므로, diagonal decomposition을 이용할 수 있다. 또한, transition matrix P는 symmetric하므로 orthogonally diagonalizable하다. 따라서, Gram-Schmidt process를 통해 eigenvalue
Figure pat00024
에 대한 orthonormal한 eigenvector set e2,e3, ...eN 를 구할 수 있고, 다음과 같이 matrix D와 Q를 정의하여 transition matrix P를 표현할 수 있다.As a result, two eigenvalues λ = 1 and
Figure pat00023
Since we have found all the eigenvectors in Eq. (1), we can use diagonal decomposition. Also, the transition matrix P is symmetric and orthogonally diagonalizable. Thus, through the Gram-Schmidt process, eigenvalue
Figure pat00024
We can obtain the orthonormal eigenvectors set e 2 , e 3 , ..., e N for the matrix D and Q to define the transition matrix P as follows.

Figure pat00025
Figure pat00025

Figure pat00026
Figure pat00026

그리고, 초기 distribution

Figure pat00027
에 대해 k번째 transition(셔플링)한 상태의 distribution
Figure pat00028
을 다음과 같이 전개 가능하다.And, the initial distribution
Figure pat00027
The distribution with the k-th transition (shuffling)
Figure pat00028
Can be developed as follows.

Figure pat00029
Figure pat00029

여기서, 상기한 바와 같이 초기 distribution에 대해 다른 초기 state를 사용하더라도 계산 과정과 결과는 동일하게 된다고 할 수 있다.Here, as described above, even if another initial state is used for the initial distribution, the calculation process and the result are the same.

상기한 초기 distribution

Figure pat00030
는 linearly independent한 eigenvector e1,e2, ...eN 를 이용하여 The initial distribution
Figure pat00030
Using a linearly independent eigenvector e 1 , e 2 , ... e N

Figure pat00031
,
Figure pat00032
Figure pat00031
,
Figure pat00032

으로 전개할 수 있고, 이러한 전개를 만족하는

Figure pat00033
도 존재하게 된다.Can be developed,
Figure pat00033
.

이런 초기 distribution을 k번째 transition 이후의 distribution에 대입하여 다음과 같이 전개할 수 있다.This initial distribution can be assigned to the distribution after the k-th transition to develop as follows.

Figure pat00034
Figure pat00034

여기서, a1을 직접 계산해보면

Figure pat00035
이 되므로,
Figure pat00036
이 되며, 이 row vector를 u 라고 정의하면, k번째 transition 한 상태의 distribution에 대한 식을 다음과 같이 된다.Here, if you directly calculate a 1
Figure pat00035
Therefore,
Figure pat00036
If the row vector is defined as u, the equation for the distribution of the kth transition state is as follows.

Figure pat00037
Figure pat00037

이 수학식을 살펴보면,

Figure pat00038
로서 1보다 작으므로, k를 무한대로 보냈을 때에, 우변이 zero vector로 수렴하고, 결국,
Figure pat00039
도 u로 수렴함을 알 수 있다.Looking at this equation,
Figure pat00038
Is less than 1, so that when k is sent to infinity, the right side converges to zero vector,
Figure pat00039
Is converged to u.

이에, 수렴도(convergence rate, α)를 다음과 같이 정의한다.The convergence rate (α) is defined as follows.

Figure pat00040
Figure pat00040

여기서의 norm은 distribution π와 uniform distribution u 사이의 거리를 의미하는 L1 norm으로 생각할 수 있다.The norm in this case can be thought of as the L1 norm, which means the distance between distribution π and uniform distribution u.

이에, k번째 셔플링한 상태의 distribution

Figure pat00041
에 대한 수렴도
Figure pat00042
Figure pat00043
Thus, the k-th shuffled distribution
Figure pat00041
Convergence to
Figure pat00042
The
Figure pat00043

으로 정리된다.Respectively.

최종적으로, 임의의 값 또는 적절한 수렴도의 값으로

Figure pat00044
를 만족하는 k, 즉, 셔플링 회수 k의 식으로 정리할 수 있다.Finally, any value or value of the appropriate degree of convergence
Figure pat00044
K, that is, the shuffling count k.

Figure pat00045
Figure pat00045

Figure pat00046
Figure pat00046

따라서, 셔플링 회수 k는 최종 결과식으로 다음의 수학식 2로 정의할 수 있다.Therefore, the shuffling number k can be defined by the following formula (2) as the final result formula.

Figure pat00047
Figure pat00047

최종적으로 얻는 수학식 2를 살펴보면, 경험적으로 적정 수렴도 α를 결정하면, 이미지 조각의 개수에 따라 적정 셔플링 회수도 결정할 수 있게 됨을 알 수 있다.[0053] From the equation (2), it can be seen that the appropriate shuffling number can be determined according to the number of image fragments by empirically determining the appropriate convergence degree [alpha].

그런데, 상기 수학식 2 또는 수렴도 α로 정리한 식을 자세히 살펴보면, 수렴도 α는 이미지 조각의 개수 N의 영향을 받게 된다. 예를 들어, 동일하게 k 회수 셔플링하더라도, N이 크면 클수록 초기 state의 확률이 다른 state의 확률보다 상대적으로 크게 나타남을 확인할 수 있었다.If we look closely at the equation (2) or the equation summarized by the convergence degree?, The degree of convergence? Is affected by the number N of image pieces. For example, even if k shuffling is performed the same, the larger the N, the greater the probability of the initial state is.

다시 말해서, 상기한 바와 같이 수렴도 α를 계산할 때에 L1 norm을 사용함에 따라, N의 값이 커질수록 각 state에서 uniform distribution 일 때 갖는 확률 값은 감소하지만, 수렴도 α는 이와 상관없이 같은 값을 유지하므로, N이 상대적으로 큰 값을 갖는 경우에 state 사이의 distribution 값의 차이가 더 도드라지게 나타난다.In other words, as described above, the use of L1 norm in calculating the convergence degree α decreases the probability value in the uniform distribution in each state as the value of N increases, but the convergence degree α is the same value regardless of The difference in distribution values between states becomes more pronounced when N has a relatively large value.

이와 같은 문제점을 해소하기 위해서 다음과 같이 정규화한 수렴도 β를 정의한다.In order to solve this problem, the following normalized convergence degree β is defined.

Figure pat00048
Figure pat00048

수렴도 β는 uniform distribution 일 때 모든 state가 동일 값으로 갖는 확률 1/N에 비해서 현재 distribution에서 갖는 확률 값의 편차의 비율로 정의한 것이다.Convergence β is defined as the ratio of the variance of the probability value in the current distribution to the probability 1 / N that all states have the same value when the distribution is uniform.

이와 같이 수렴도 β를 정의함으로써, β 값을 작게 설정할수록 확률 값의 편차도 줄어들고 결국, distribution도 uniform distribution 에 근접하게 되는 것이다.By defining the convergence degree β as described above, the smaller the value of β is set, the less the deviation of the probability value becomes, and the distribution becomes closer to the uniform distribution.

그리고, 셔플링 회수 k에서의 수렴도 β는 k번째 distribution

Figure pat00049
의 각 state에 대한 다음 관계식Then, the convergence degree beta at the shuffling number k is the kth distribution
Figure pat00049
The following relation for each state of

Figure pat00050
Figure pat00050

을 대입함으로써 다음의 식을 얻을 수 있다.The following equation can be obtained.

Figure pat00051
Figure pat00051

이 식을 통해서, 최종적으로 셔플링 회수에 대한 수학식 3을 얻을 수 있다.From this equation, finally, Equation 3 for the shuffling number can be obtained.

Figure pat00052
Figure pat00052

여기서, 수렴도 β는 이미지 조각들의 뒤섞임 정도, 즉, 퍼즐화 정도를 나타내므로, 적절한 값을 설정하여 두면, 이미지 조각의 개수에 따라 수렴도 β를 얻기 위한 셔플링 회수 k를 산정할 수 있음을 보여준다.Since the degree of convergence β indicates the degree of interlacing of the image fragments, that is, the degree of puzzling, if the appropriate value is set, the number of shuffling k for obtaining the convergence degree β according to the number of image fragments can be calculated Show.

이상에서 본 발명의 기술적 사상을 예시하기 위해 구체적인 실시 예로 도시하고 설명하였으나, 본 발명은 상기와 같이 구체적인 실시 예와 동일한 구성 및 작용에만 국한되지 않고, 여러가지 변형이 본 발명의 범위를 벗어나지 않는 한도 내에서 실시될 수 있다. 따라서, 그와 같은 변형도 본 발명의 범위에 속하는 것으로 간주해야 하며, 본 발명의 범위는 후술하는 특허청구범위에 의해 결정되어야 한다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, . &Lt; / RTI &gt; Accordingly, such modifications are deemed to be within the scope of the present invention, and the scope of the present invention should be determined by the following claims.

1,2 : 단말 3 : DB 서버 4 : 문서정보 DB 서버
5 : 네트워크 6 : 문서 보안 서버
10 : 문서 등록부
11 : 퍼즐화부 12 : 속성 추출부 13 : DB화부
20 : 문서 복원부
21 : 검색부 22 : 이미지 복원부 23 : 문서화부
1, 2: terminal 3: DB server 4: document information DB server
5: Network 6: Document security server
10: Document registration part
11: puzzler 12: attribute extractor 13: DB editor
20:
21: searching unit 22: image restoring unit 23:

Claims (9)

문서를 분할하여 복수의 DB 서버(3)에 분산 저장하고 분산 저장된 문서를 취합하기 위한 문서정보를 문서정보 DB 서버(4)에 등록하는 문서 등록부(10) 및 문서를 요청받을 시에 분산 저장된 문서를 문서정보에 따라 취합 복원하여 제공하는 문서 복원부(20)에 의해 이루어지는 문서 보안 방법에 있어서,
문서를 그래픽 문서화한 이미지 또는 그래픽 문서로 작성된 이미지를 복수의 조각으로 분할한 후 이미지 조각들의 배열을 변경하여 퍼즐화 이미지를 얻는 퍼즐화 단계(S110)와,
문서의 속성 정보를 텍스트 형태로 추출하는 속성 추출 단계(S120)와,
퍼즐화 이미지의 이미지 조각들을 복수 그룹으로 분류하여 복수의 DB 서버(3)에 분산 저장하는 분산 저장 단계(S130)와,
퍼즐화 정보, 분산 저장 정보 및 속성 정보를 문서정보로 하여 문서정보 DB 서버(4)에 등록하는 문서정보 DB화 단계(S140)
를 포함하며, 문서 등록부(10)에 의해 수행하는 문서 등록 단계(S100); 및
문서 제공을 요청받을 시에 해당 문서의 속성 정보에 근거하여 대응되는 퍼즐화 정보 및 분산 저장 정보를 얻는 검색 단계(S210)와,
분산 저장된 이미지를 분산 저장 정보에 따라 취합한 후 결합한 이미지를 얻는 취합 단계(S220)와,
퍼즐화 정보에 근거하여 퍼즐화할 시 배열 변경의 역으로 재배열하여 퍼즐화 이전의 이미지를 얻는 역퍼즐화 단계(S230)
를 포함하며, 문서 복원부(20)에 의해 수행되는 문서 복원 단계(S200);
로 이루어지는 문서 보안 방법.
A document registration unit 10 for dividing a document into a plurality of DB servers 3 and storing document information for collecting distributedly stored documents in the document information DB server 4, And a document restoring unit (20) for restoring the restored document information according to the document information,
A puzzling step (S110) of dividing an image created as a graphical document of a document into an image or a graphic document into a plurality of pieces and then changing the arrangement of image pieces to obtain a puzzled image;
An attribute extraction step (S120) of extracting attribute information of a document in a text form,
A distributed storage step (S130) of dividing the image pieces of the puzzled image into a plurality of groups and storing them in a distributed manner in a plurality of DB servers (3)
A document information DB step (S140) of registering puzzle information, distributed storage information and attribute information as document information in the document information DB server 4,
A document registration step S100 performed by the document registration unit 10; And
A retrieval step (S210) of obtaining corresponding puzzle information and distributed storage information based on the attribute information of the document when the document is requested to be provided;
A collecting step (S220) of collecting distributed images in accordance with the distributed storage information and obtaining a combined image,
A reverse puzzling step (S230) of rearranging the rearrangement of the rearrangement sequence to obtain an image before the puzzling,
A document restoring step (S200) performed by the document restoring unit (20);
&Lt; / RTI &gt;
제 1항에 있어서,
상기 문서 복원 단계(S200)는 역퍼즐화 단계(S230)에서 얻은 이미지가 문서를 그래픽 형태로 변환한 이미지인 경우에 텍스트 인식하여 그래픽화 이전 문서를 얻는 문서화 단계(S240)를 포함하는 문서 보안 방법.
The method according to claim 1,
In the document restoring step S200, if the image obtained in the reverse puzzling step S230 is an image obtained by converting the document into a graphical form, the document restoring step S240 includes a document obtaining step S240 for obtaining a pre- .
제 1항에 있어서,
상기 속성 추출 단계(S120)는 문서 내의 텍스트를 추출하여 속성 정보에 포함시키고,
상기 검색 단계(S210)는 속성 정보에 포함된 텍스트를 검색하여 속성 정보를 특정한 후 특정한 속성 정보에 대응되는 퍼즐화 정보 및 분산 저장 정보를 얻는 문서 보안 방법.
The method according to claim 1,
The attribute extracting step (S120) extracts the text in the document and includes it in the attribute information,
The retrieval step (S210) searches the text included in the attribute information to specify the attribute information, and then obtains the puzzle information and the distributed storage information corresponding to the specific attribute information.
제 1항에 있어서,
상기 분산 저장 단계(S110)는 각 그룹에 대해 퍼즐화 이미지 상에서의 이미지 조각들을 위치 변경 없이 그대로 두고 나머지 영역을 비워둔 희소성 이미지를 생성하여 서로 다른 DB 서버(3)에 저장하고,
상기 취합 단계(S220)는 각 DB 서버(3)에서 취한 희소성 이미지를 겹쳐 결합하는 문서 보안 방법.
The method according to claim 1,
In the distributed storage step (S110), image fragments on the puzzled image are left unchanged for each group, a sparse image in which the remaining regions are left empty, and stored in different DB servers 3,
The collecting step (S220) superimposes the sparse images taken by each DB server (3).
제 1항에 있어서,
상기 분산 저장 단계(S110)는 각 그룹에 대해 퍼즐화 이미지 상에서의 이미지 조각들을 위치 변경 없이 그대로 두고 나머지 영역을 임의의 이미지로 채운 희소성 이미지를 생성하여 서로 다른 DB 서버(3)에 저장하고,
상기 취합 단계(S220)는 각 DB 서버(4)에서 취한 희소성 이미지를 상기 임의의 이미지를 삭제한 한 후 겹쳐 결합하는 문서 보안 방법.
The method according to claim 1,
In the distributed storage step (S110), image fragments on the puzzled image are left unchanged for each group, a sparseness image in which the remaining region is filled with an arbitrary image is generated and stored in different DB servers (3)
In the collecting step S220, the scarcity image taken by each DB server 4 is deleted after the arbitrary image is deleted.
제 1항에 있어서,
상기 퍼즐화 단계(S110)는 이미지의 분할 위치에 번호를 매기고, 시이드(seed)에 따라 난수 수열이 결정되는 의사 난수 발생기(pseudo random number generator)로 셔플링 회수의 2배수 난수 수열을 생성하되, 난수 수열의 순서로 2개씩 취하여 2개의 난수 번호를 매긴 분할 위치의 이미지 조각을 위치 교환하는 셔플링(shuffling) 과정을 반복함으로써 퍼즐화 이미지를 생성하고,
상기 퍼즐화 정보는 시이드 값 및 셔플링 회수를 포함하며,
상기 역퍼즐화 단계(S230)는 시이드 값에 따라 셔플링 회수의 2배수 난수 수열을 생성한 후, 난수 수열의 역순으로 2개씩 취하여 2개의 난수 번호를 매긴 분할 위치의 이미지 조각을 위치 교환하는 셔플링(shuffling) 과정을 반복함으로써 퍼즐화 이전의 이미지를 얻는 문서 보안 방법.
The method according to claim 1,
In the puzzling step S110, a division number of the image is numbered, and a random number sequence of two times the shuffling number is generated by a pseudo random number generator in which a random number sequence is determined according to a seed A shuffling process of taking two images in order of a random number sequence and exchanging positions of image pieces of the two random numbered positions is repeated to generate a puzzled image,
Wherein the puzzle information comprises a seed value and a shuffling number,
In the reverse puzzling step S230, a random number sequence of two times the shuffling number is generated according to the seed value, and two pieces of the random number sequence are taken in reverse order of the random number sequence to exchange the image pieces of the two random numbers A document security method for obtaining an image prior to a puzzle by repeating a shuffling process.
제 6항에 있어서,
상기 셔플링 회수는 셔플링 과정을 반복함에 따라 어느 하나의 특정 이미지 조각이 확률적으로 분할 위치에 관계없이 균일 확률로 존재할 수 있는 정상 분포(stationary distribution)로의 수렴도(convergence rate), 및 분할한 이미지 조각의 개수의 함수로 결정되는 문서 보안 방법.
The method according to claim 6,
The shuffling count is a convergence rate to a stationary distribution in which one specific image fragment can be stochastically present at a uniform probability regardless of the dividing position as the shuffling process is repeated, A document security method determined by a function of the number of image fragments.
제 7항에 있어서,
상기 수렴도는 분할 위치별 확률의 최대 편차를 정상 분포일 때의 분할 위치 확률로 나누어 얻는 값으로 하는 문서 보안 방법.
8. The method of claim 7,
Wherein the degree of convergence is a value obtained by dividing a maximum deviation of a probability by a dividing position by a dividing position probability at a normal distribution.
제 6항에 있어서,
상기 셔플링 회수(k)는 이미지 조각의 개수(N) 및 수렴도(β)에 따라 수학식
Figure pat00053

으로 산정하는 문서 보안 방법.
The method according to claim 6,
The shuffling count k may be calculated according to the number N of image pieces and the degree of convergence?
Figure pat00053

Document security method.
KR1020160182044A 2016-12-29 2016-12-29 Document security method KR101895848B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160182044A KR101895848B1 (en) 2016-12-29 2016-12-29 Document security method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160182044A KR101895848B1 (en) 2016-12-29 2016-12-29 Document security method

Publications (2)

Publication Number Publication Date
KR20180077573A true KR20180077573A (en) 2018-07-09
KR101895848B1 KR101895848B1 (en) 2018-09-06

Family

ID=62919535

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160182044A KR101895848B1 (en) 2016-12-29 2016-12-29 Document security method

Country Status (1)

Country Link
KR (1) KR101895848B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102528336B1 (en) * 2022-07-22 2023-05-03 주식회사 라이펙스 A ripex-type double encryption app module device consisting of image shuffling and 3D-LEA block cipher

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010044248A (en) 2001-01-26 2001-06-05 김동희 Digital web paper service system
JP2006285612A (en) * 2005-03-31 2006-10-19 Canon Inc Information processor, and its method
KR100749428B1 (en) 1999-12-20 2007-08-14 다이니폰 인사츠 가부시키가이샤 Distributed data archive device, system and recording medium
KR100880243B1 (en) * 2007-07-30 2009-01-23 주식회사 골드엔키 Security system using encoded image with puzzled image
KR20150104022A (en) * 2014-02-03 2015-09-14 가부시키가이샤 프로스퍼 크리에이티브 Image inspecting apparatus and image inspecting program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100749428B1 (en) 1999-12-20 2007-08-14 다이니폰 인사츠 가부시키가이샤 Distributed data archive device, system and recording medium
KR20010044248A (en) 2001-01-26 2001-06-05 김동희 Digital web paper service system
JP2006285612A (en) * 2005-03-31 2006-10-19 Canon Inc Information processor, and its method
KR100880243B1 (en) * 2007-07-30 2009-01-23 주식회사 골드엔키 Security system using encoded image with puzzled image
KR20150104022A (en) * 2014-02-03 2015-09-14 가부시키가이샤 프로스퍼 크리에이티브 Image inspecting apparatus and image inspecting program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
일본 공개특허공보 특개2006-285612호(2006.10.19.) 1부. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102528336B1 (en) * 2022-07-22 2023-05-03 주식회사 라이펙스 A ripex-type double encryption app module device consisting of image shuffling and 3D-LEA block cipher

Also Published As

Publication number Publication date
KR101895848B1 (en) 2018-09-06

Similar Documents

Publication Publication Date Title
Wang et al. Searchable encryption over feature-rich data
US8533489B2 (en) Searchable symmetric encryption with dynamic updating
CN106127075B (en) Encryption method can search for based on secret protection under a kind of cloud storage environment
US11232216B1 (en) Systems and methods for generation of secure indexes for cryptographically-secure queries
US9202081B2 (en) Apparatus and methods for anonymizing a data set
US8799291B2 (en) Forensic index method and apparatus by distributed processing
CN109783667B (en) Image storage and retrieval method, client and system
US20220100884A1 (en) Term-Based Encrypted Retrieval Privacy
KR20150007960A (en) Secret data matching device, secret data matching method, and recording medium
CN111651779B (en) Privacy protection method for encrypted image retrieval in block chain
KR101428649B1 (en) Encryption system for mass private information based on map reduce and operating method for the same
CN109492410A (en) Data can search for encryption and keyword search methodology, system and terminal, equipment
KR20170122048A (en) System and method for searching encrypted data using bloom filter and binary tree
CN106133745A (en) The anonymization of flow data
KR101895848B1 (en) Document security method
CN106250453A (en) The cipher text retrieval method of numeric type data based on cloud storage and device
CN105763324A (en) Controllable searchable encryption searching method being able to verify multi user-ends
CN110945506B (en) Searchable encryption supporting hybrid indexes
US20220277098A1 (en) Method and system for securely storing and programmatically searching data
Li et al. Secure and verifiable multi-owner ranked-keyword search in cloud computing
Aritomo et al. A privacy-preserving similarity search scheme over encrypted word embeddings
Balamurugan et al. Multi-Keyword Graded Exploration in Encrypted Cloud Data for Industries Based on Rc4+ and Forest
DE112020005626T5 (en) BROWSABLE ENCRYPTION SYSTEM, BROWSABLE ENCRYPTION METHOD AND BROWSABLE ENCRYPTION PROGRAM
Shaon et al. A practical framework for executing complex queries over encrypted multimedia data
KR102625319B1 (en) Method of managing healthcare data based on cloud server and apparatus thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right