KR102211360B1 - Digital document authentication method using location information in digital documents - Google Patents

Digital document authentication method using location information in digital documents Download PDF

Info

Publication number
KR102211360B1
KR102211360B1 KR1020200124082A KR20200124082A KR102211360B1 KR 102211360 B1 KR102211360 B1 KR 102211360B1 KR 1020200124082 A KR1020200124082 A KR 1020200124082A KR 20200124082 A KR20200124082 A KR 20200124082A KR 102211360 B1 KR102211360 B1 KR 102211360B1
Authority
KR
South Korea
Prior art keywords
digital document
information
sensitive information
server
location information
Prior art date
Application number
KR1020200124082A
Other languages
Korean (ko)
Inventor
김주익
Original Assignee
주식회사 화난사람들
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 화난사람들 filed Critical 주식회사 화난사람들
Priority to KR1020200124082A priority Critical patent/KR102211360B1/en
Application granted granted Critical
Publication of KR102211360B1 publication Critical patent/KR102211360B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06K9/3283
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Document Processing Apparatus (AREA)

Abstract

The present invention relates to a method for authenticating a digital document in a digital document management server, which includes: setting a label for a digital document type by recognizing an upper part of the digital document; recognizing text of a digital document, determining sensitive information and non-sensitive information, and calculating location information of a sensitive information area in which sensitive information is written; associating the set label with the location information to store the information in a sensitive information pattern server; parsing sensitive information into preset unit text to create interconnection patterns so that the unit text is not concatenated, and generating an encrypted string based on the interconnection pattern; storing the interconnection pattern and the encrypted string in an encryption information server; overlapping the pseudonymous information in the sensitive information area; overlapping the pseudonym information with the decrypted sensitive information received from the encryption information server on the location information, when the certification request for the digital document is confirmed; and performing authentication with a digital document overlaid with encrypted sensitive information.

Description

디지털 문서 내 위치 정보를 이용한 디지털 문서 인증 방법 {Digital document authentication method using location information in digital documents}Digital document authentication method using location information in digital documents}

본 발명은 디지털 문서 인증 방법에 관한 것으로서, 보다 상세하게는 디지털 문서 내 위치 정보를 이용하여 디지털 문서 인증을 수행하는 방법 에 관한 것이다.The present invention relates to a digital document authentication method, and more particularly, to a method of performing digital document authentication using location information in a digital document.

다수의 일반 이용자가 공동으로 소송을 진행함에 있어서, 업무 처리에 필요한 문서의 양이 방대하며, 이를 취합하고 처리함에 있어서 변호사의 과도한 업무량 증가가 발생한다는 문제점이 있었다. When a number of general users jointly file a lawsuit, there is a problem that the amount of documents required for business processing is enormous, and an excessive increase in the workload of lawyers occurs in collecting and processing them.

또한, 이용자를 모집하여 변호사에게 위임을 하고, 각 서류를 취합하는 과정 모두가 온라인에서 진행되어 여러 잠재적인 문제점이 존재하였다. 예를 들어, 위임장을 비롯한 각종 증거자료가 온라인으로 전송되는데, 그 과정에서 위변조가 발생할 경우 검증이 어려우며, 동일 자료가 이용자와 변호사 사이에서 수정이나 보완을 거쳐 여러 가지 버전이 존재할 수 있는데, 최종적으로 취합되는 자료가 자칫 뒤섞일 수 있다. 다른 예로, 법원에 제출되는 파일들은 법원 제출 전 단계에서의 중복되거나 동일한 명칭의 파일이 여러 가지 버전이 존재할 가능성이 존재한다. 이로 인해 법원에 제출하는 단계에서 의뢰인과 변호사의 의도와 다른 파일이 전송될 위험성이 존재한다.In addition, the process of recruiting users, entrusting them to lawyers, and collecting each document was conducted online, and there were several potential problems. For example, various evidence materials including power of attorney are transmitted online, but if forgery or alteration occurs in the process, verification is difficult, and there may be various versions of the same data after modification or supplementation between the user and the lawyer. The data being collected can be mixed up. As another example, there is a possibility that the files submitted to the court are duplicated at the stage before the court submission, or there are multiple versions of the files with the same name. As a result, there is a risk that files that differ from the client's and attorney's intentions will be transmitted during the filing with the court.

특히, 공동 소송의 특성상 의뢰인의 숫자가 수만 명 이상이 될 수 있는데, 이 경우 이런 복잡성은 기하급수적으로 증가하게 되므로, 변호사가 시스템을 통해 의뢰인의 파일을 취합할 때 가장 최신의 파일을 취합해서 일괄로 제출 할 수 있도록 지원해줄 필요가 있다.In particular, due to the nature of joint lawsuits, the number of clients may be tens of thousands or more.In this case, this complexity increases exponentially.When a lawyer collects the client's files through the system, the latest files are collected and collectively There is a need to support the submission of documents.

이에 따라, 다수의 이용자가 저비용으로 법률 소송을 진행할 수 있도록 IT기술의 지원이 필요한 상황이다.Accordingly, it is necessary to support IT technology so that a large number of users can proceed with legal litigation at low cost.

상술한 바와 같은 논의를 바탕으로 이하에서는 디지털 문서를 인증하는 방법을 제공하고자 한다.Based on the above discussion, the following will provide a method of authenticating a digital document.

본 발명에서 이루고자 하는 기술적 과제들은 상기 기술적 과제로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The technical problems to be achieved in the present invention are not limited to the above technical problems, and other technical problems that are not mentioned will be clearly understood by those of ordinary skill in the technical field to which the present invention belongs from the following description.

상술한 문제점을 해결하기 위한 본 발명의 일 양상인 디지털 문서 관리 서버에서 디지털 문서를 인증하는 방법은, 디지털 문서의 상단부를 인식하여, 디지털 문서 종류에 대한 라벨(label)을 설정하는 단계; 상기 디지털 문서의 텍스트를 인식하여, 민감 정보와 비민감 정보를 판단하고, 상기 민감 정보가 기재된 민감 정보 영역의 위치 정보를 산출하는 단계; 상기 설정된 라벨과 상기 위치 정보를 연관시켜, 민감 정보 패턴 서버에 저장하는 단계; 상기 민감 정보를 미리 설정된 단위 텍스트로 파싱(parsing)하여, 상기 단위 텍스트가 연접하지 않도록 상호 연결 패턴을 생성하고, 상기 상호 연결 패턴에 기반하여, 암호화된 문자열을 생성하는 단계; 상기 상호 연결 패턴과 상기 암호화된 문자열을 암호화 정보 서버에 저장하는 단계; 상기 민감 정보 영역에 가명 정보를 오버랩하는 단계; 상기 디지털 문서에 대한 인증 요청이 확인된 경우, 상기 위치 정보에 상기 암호화 정보 서버로부터 수신한 복호화된 민감 정보로 상기 가명 정보를 오버랩하는 단계; 및 상기 복호화된 민감 정보가 오버랩된 디지털 문서로 인증을 수행하는 단계를 포함하는 것을 특징으로 한다.A method of authenticating a digital document in a digital document management server according to an aspect of the present invention for solving the above-described problem includes the steps of recognizing an upper end of the digital document and setting a label for a digital document type; Recognizing the text of the digital document, determining sensitive information and non-sensitive information, and calculating location information of a sensitive information area in which the sensitive information is written; Associating the set label with the location information and storing it in a sensitive information pattern server; Parsing the sensitive information into a preset unit text, generating an interconnection pattern so that the unit texts do not concatenate, and generating an encrypted character string based on the interconnection pattern; Storing the interconnection pattern and the encrypted character string in an encryption information server; Overlapping pseudonym information in the sensitive information area; When the authentication request for the digital document is confirmed, overlapping the pseudonym information with the decrypted sensitive information received from the encryption information server with the location information; And performing authentication with the digital document in which the decrypted sensitive information overlaps.

나아가, 상기 라벨을 설정하는 단계는, 상기 디지털 문서에 포함된 표(table)의 외부 영역에 표시된 텍스트를 인식하여, 디지털 문서에 적용되는 라벨을 설정하는 것을 특징으로 할 수 있다.Further, the step of setting the label may be characterized in that, by recognizing text displayed in an outer area of a table included in the digital document, a label applied to the digital document is set.

나아가, 상기 복호화된 민감 정보를 오버랩하는 단계는, 상기 디지털 문서 인증을 위한 요청이 확인된 경우, 상기 디지털 문서의 라벨에 대응되는 상기 위치 정보를 상기 민감 정보 패턴 서버로부터 수신하는 단계; 상기 민감 정보 패턴 서버로부터 상기 암호화 정보 서버로 상기 위치 정보가 송신되고, 상기 암호화 정보 서버는 상기 위치 정보를 이용하여 상기 상호 연결 패턴과 상기 암호화된 문자열을 복호화하는 단계; 및 상기 복호화된 민감 정보를 상기 암호화 정보 서버로부터 수신하고, 상기 위치 정보에 기반하여 복호화된 민감 정보를 상기 가명 정보로 오버랩하는 단계를 포함하는 것을 특징으로 할 수 있다.Further, the overlapping of the decrypted sensitive information may include: receiving the location information corresponding to a label of the digital document from the sensitive information pattern server when the request for digital document authentication is confirmed; The location information is transmitted from the sensitive information pattern server to the encryption information server, and the encryption information server decrypts the interconnection pattern and the encrypted character string using the location information; And receiving the decrypted sensitive information from the encryption information server, and overlapping the decrypted sensitive information with the pseudonym information based on the location information.

나아가, 상기 디지털 문서에 대한 인증 요청이 확인되지 않는 경우, 상기 디지털 문서의 라벨에 대응되는 상기 위치 정보를 상기 민감 정보 패턴 서버로부터 수신하여, 상기 디지털 문서 상에 안내하는 단계를 포함하는 것을 특징으로 할 수 있다.Further, when the authentication request for the digital document is not confirmed, receiving the location information corresponding to the label of the digital document from the sensitive information pattern server, comprising the step of guiding on the digital document can do.

나아가, 사용자 인증이 완료된 경우에, 상기 민감 정보 서버와 연결을 설정하는 단계; 및 상기 복호화된 민감 정보를 수신하는 경우, 상기 민감 정보 서버와 연결을 해제(release)하는 단계를 더 포함하는 것을 특징으로 할 수 있다.Further, when user authentication is completed, establishing a connection with the sensitive information server; And when receiving the decrypted sensitive information, releasing a connection with the sensitive information server.

나아가, 상기 민감 정보는, 상기 디지털 문서 관리 서버에 저장된 디지털 문서 데이터가 학습되어, 성명, 주민등록번호, 전화번호로 판단되는 정보인 것을 특징으로 할 수 있다.Further, the sensitive information may be information determined as a name, a social security number, and a phone number by learning digital document data stored in the digital document management server.

본 발명의 실시예에 따르면, 디지털 문서 인증을 효율적으로 수행할 수 있다.According to an embodiment of the present invention, digital document authentication can be efficiently performed.

본 발명에서 얻은 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The effects that can be obtained in the present invention are not limited to the effects mentioned above, and other effects not mentioned can be clearly understood by those of ordinary skill in the art from the following description. will be.

본 발명에 관한 이해를 돕기 위한 상세한 설명의 일부로 포함되는, 첨부 도면은 본 발명에 대한 실시예를 제공하고, 상세한 설명과 함께 본 발명의 기술적 사상을 설명한다.
도 1은 본 발명에 따른 디지털 문서 관리 시스템을 설명하기 위한 도면이다.
도 2는 본 발명에 따른 디지털 문서 관리 방법을 설명하기 위한 순서도이다.
도 3은 본 발명의 실시 예에 따른 라벨 설정 및 위치 정보 산출을 설명하기 위한 참고도이다.
도 4는 본 발명의 실시 예에 따른 상호 연결 패턴과 암호화된 문자열을 설명하기 위한 참고도이다.
The accompanying drawings, which are included as part of the detailed description for aiding understanding of the present invention, provide embodiments of the present invention, and together with the detailed description will be described the technical idea of the present invention.
1 is a diagram for describing a digital document management system according to the present invention.
2 is a flowchart illustrating a digital document management method according to the present invention.
3 is a reference diagram for explaining label setting and location information calculation according to an embodiment of the present invention.
4 is a reference diagram for explaining an interconnection pattern and an encrypted character string according to an embodiment of the present invention.

이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다. 아래 설명하는 실시예들에는 다양한 변경이 가해질 수 있다. 아래 설명하는 실시예들은 실시 형태에 대해 한정하려는 것이 아니며, 이들에 대한 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.Hereinafter, exemplary embodiments will be described in detail with reference to the accompanying drawings. The same reference numerals in each drawing indicate the same members. Various changes may be made to the embodiments described below. The embodiments described below are not intended to be limited to the embodiments, and should be understood to include all changes, equivalents, and substitutes thereto.

실시예에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 실시예를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 입력, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 입력, 구성 요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in the examples are used only to describe specific embodiments, and are not intended to limit the embodiments. Singular expressions include plural expressions unless the context clearly indicates otherwise. In the present specification, terms such as "comprise" or "have" are intended to designate the presence of features, numbers, steps, inputs, components, parts, or a combination of one or more other features described in the specification. It is to be understood that the presence or addition of elements or numbers, steps, inputs, components, parts, or combinations thereof does not preclude in advance.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which the embodiment belongs. Terms as defined in a commonly used dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related technology, and should not be interpreted as an ideal or excessively formal meaning unless explicitly defined in this application. Does not.

또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.In addition, in the description with reference to the accompanying drawings, the same reference numerals are assigned to the same components regardless of the reference numerals, and redundant descriptions thereof will be omitted. In describing the embodiments, when it is determined that a detailed description of related known technologies may unnecessarily obscure the subject matter of the embodiments, the detailed description thereof will be omitted.

도 1은 본 발명의 일 실시예에 따른 디지털 문서 관리 시스템을 나타낸 것이다.1 shows a digital document management system according to an embodiment of the present invention.

본 발명에 따른 디지털 문서 관리 시스템은 디지털 문서 관리 서버(110), 민감 정보 패턴 서버(130) 및 암호화 정보 서버(150)로 구성될 수 있다.The digital document management system according to the present invention may include a digital document management server 110, a sensitive information pattern server 130, and an encryption information server 150.

디지털 문서 관리 서버(110)는 사용자들이 제출한 디지털 문서들을 저장하며 관리하는 서버로서, 다수의 사용자들로부터 저장되는 문서를 이용한 수정이나 보완을 수행하는 역할을 가질 수 있다. 이에, 디지털 문서 관리 서버는 디지털 문서의 이미지, 텍스트, 숫자를 인식하도록 설정될 수 있으며, 이를 수정하거나 변경할 수 있다.The digital document management server 110 is a server that stores and manages digital documents submitted by users, and may have a role of performing correction or supplementation using documents stored by a plurality of users. Accordingly, the digital document management server may be set to recognize images, texts, and numbers of digital documents, and may modify or change them.

또한, 본 발명에 따른 디지털 문서 관리 서버(110)는 문서의 종류를 인식한 이후, 해당 문서에 대한 내용들에 대한 인식을 수행함으로써, 문서 내용에 대한 민감 정보, 비민감 정보 등을 보다 정확하게 파악할 수 있다.In addition, after recognizing the type of document, the digital document management server 110 according to the present invention recognizes the contents of the document, so that sensitive information and non-sensitive information about the document contents can be more accurately identified. I can.

먼저, 디지털 문서의 일부 영역을 인식하여, 특정 데이터로 라벨링(labeling)을 할 수 있다. First, by recognizing a partial area of a digital document, it is possible to label it with specific data.

예를 들어, 디지털 문서의 상단부를 인식하여 디지털 문서의 종류에 대한 라벨링을 수행할 수 있다. 구체적으로, 디지털 문서에 포함된 표(table)의 외부 영역에 표시된 텍스트를 인식하거나, 디지털 문서에 포함된 글자의 크기를 비교하여 문서의 종류를 파악하는 데 활용할 수 있다. 일반적으로, 문서의 종류를 나타내는 신청서, 탄원서, 경고장 등의 문구는 디지털 문서의 상단에 표시되는 경우가 많으며, 디지털 문서의 구체적인 내용의 기재는 표의 내부에 기재되어 있는 경우가 많다. 따라서, 본 발명에서는 문서의 상단부에 표시된 글자, 혹은 문서의 표를 구성하는 선분(line)의 상단에 표시된 글자들을 문서의 종류를 인식하기 위하여 사용할 수 있다. 또한, 디지털 문서에 포함된 글자의 크기를 비교하여 평균 글자의 크기보다 높은 글자가 문서의 종류를 나타낼 수 있다는 사실도 이용될 수 있다. 즉, 문서의 상단부에 표시된 글자 중 평균 글자의 크기보다 높은 글자가 문서의 종류를 나타낼 확률이 높으며, 이를 통하여 문서의 종류를 보다 정확히 추정할 수 있다. 예를 들어, 신청서, 탄원서, 경고장 등의 문서의 종류를 나타내는 글자는 신청서에 기재된 성명, 주민등록번호, 전화번호 등에 기재된 글자보다 큰 사이즈를 가진다는 사실을 고려하여 본 발명에서는 인공지능을 통해 학습된 추정 모델로 문서의 종류를 추정할 수 있다. For example, by recognizing the upper part of the digital document, labeling of the type of the digital document may be performed. Specifically, it can be used to recognize text displayed in an external area of a table included in a digital document, or to determine the type of a document by comparing the sizes of characters included in the digital document. In general, phrases such as an application form, petition, warning letter, etc. indicating the type of document are often displayed at the top of a digital document, and the specific contents of the digital document are often listed inside a table. Accordingly, in the present invention, the letters displayed on the upper part of the document or the letters displayed on the upper part of the line constituting the table of the document can be used to recognize the type of the document. In addition, the fact that a character higher than the average character size may indicate the type of document may be used by comparing the size of characters included in the digital document. In other words, among the characters displayed on the upper part of the document, a character that is higher than the average character size has a high probability of indicating the type of the document, and through this, the type of the document can be more accurately estimated. For example, in the present invention, in consideration of the fact that the letters indicating the type of documents such as an application form, petition, warning letter, etc. have a larger size than the letters written in the name, social security number, telephone number, etc. The model can be used to estimate the type of document.

또한, 디지털 문서 관리 서버(110)는, 디지털 문서의 텍스트를 인식하여, 민감 정보와 비민감 정보를 판단하고, 민감 정보가 기재된 민감 정보 영역의 위치 정보를 산출할 수 있다. 이때, 민감 정보인지 비민감 정보인지여부는 인공지능을 이용한 자연어 처리 시스템에 기반하여 수행될 수 있는데, 디지털 문서 관리 서버에 저장된 디지털 문서들 관련 데이터를 기반으로 학습되어, 성명, 주민등록번호, 전화번호 등에 해당하는지 여부가 판단될 수 있다.Further, the digital document management server 110 may recognize text of a digital document, determine sensitive information and non-sensitive information, and calculate location information of a sensitive information area in which the sensitive information is written. At this time, whether sensitive information or non-sensitive information is recognized may be performed based on a natural language processing system using artificial intelligence, which is learned based on data related to digital documents stored in a digital document management server, and is then learned by name, social security number, phone number, etc. Whether or not it can be determined.

예를 들어, '㈜'와 연결된 명칭은 회사 혹은 법인의 명칭을 나타내는 것으로 판단하거나, '(인)'의 앞에 표시된 명칭은 성명 혹은 법인의 명칭으로 판단될 수 있다. 또한, '숫자 6자리 - 숫자 7자리'로 이루어진 텍스트는 주민등록번호로 판단될 수 있으며, '숫자 3자리-숫자2자리-숫자5자리'로 이루어진 텍스트는 사업자등록번호로 판단될 수 있다. For example, a name linked to'Co.' may be determined to indicate the name of a company or corporation, or a name displayed in front of'(person)' may be determined as the name or name of a corporation. In addition, a text consisting of '6 digits-7 digits' may be determined as a social security number, and a text consisting of '3 digits-2 digits-5 digits' may be determined as a business registration number.

또한, 텍스트의 판단은 디지털 문서 관리 서버에 저장된 디지털 문서들에 기반하여 학습된 인공지능을 통해, 유효한 주민등록번호, 전화번호, 휴대폰 번호의 형태인지 여부가 판단될 수 있다.In addition, the text may be determined in the form of a valid social security number, phone number, or mobile phone number through artificial intelligence learned based on digital documents stored in the digital document management server.

디지털 문서 관리 서버(110)는, 민감 정보에 해당하는 영역들에 대하여, 디지털 문서상에서 위치 정보를 산출한다. 민감 정보에 해당하는 영역들에 대하여 위치 정보를 생성하는 이유는, 디지털 문서의 처리에 있어서 민감 영역에 해당하는 부분은 가명 정보로 처리되었음을 사용자에게 고지시키고, 이에 대한 잘못된 해석을 방지하기 위함일 뿐만이 아니라, 본 특허가 적용되는 디지털 문서 관리 서버는 동일한 내용을 가지는 다수의 문서들에 대한 문서처리를 수행함으로, 판단된 위치 정보를 이용하여 문서가 동일한 종류의 문서인지(예를 들어, 위임장, 탄원서 등)을 판단하거나, 문서의 오류를 확인하기 위하여 사용될 수 있기 때문이다. The digital document management server 110 calculates location information on the digital document for areas corresponding to sensitive information. The reason for generating location information for areas corresponding to sensitive information is to notify users that the areas corresponding to sensitive areas have been processed as pseudonym information in the processing of digital documents, and to prevent misinterpretations. Rather, the digital document management server to which this patent is applied performs document processing on multiple documents having the same content, so whether the document is the same type of document using the determined location information (e.g., power of attorney, petition Etc.) or to check for errors in the document.

이때, 위치 정보는 디지털 문서의 왼쪽 상단 모서리를 기준으로 산출될 수 있으며, 본 발명에서는 문서 사이즈를 인식하여 문서 사이즈에 대한 포인트를 좌표로 삼을 수 있다. 예를 들어, A4 용지로 인식된 경우에는 (210, 297)을 좌표로 산출할 수 있다. 또는, 왼쪽 모서리 상단을 (0,0), 우측 모서리 하단을 (100,100)으로 설정하고, 상대적인 좌표를 산출할 수 있다. 디지털 문서의 사이즈로 좌표를 인식한 경우에는, 위치 정보를 세밀하게 측정할 수 있는 장점이 있으나, 다량의 디지털 문서들의 사이즈가 명확하게 일치하지 않는 문제점이 있을 수 있으며, 상대적인 좌표를 설정하는 경우에는 위치 정보를 세밀하게 측정하기는 어려우나, 다량의 디지털 문서들의 사이즈가 다소 상이하더라도 범위로 측정할 수 있는 장점이 있다. 문서의 위치 정보를 생성하는 구체적인 도 3과 관련하여 후술한다.In this case, the location information may be calculated based on the upper left corner of the digital document, and in the present invention, a point for the document size may be used as a coordinate by recognizing the document size. For example, when recognized as an A4 paper, (210, 297) can be calculated as coordinates. Alternatively, the upper left corner is set to (0,0) and the lower right corner is set to (100,100), and relative coordinates may be calculated. When the coordinates are recognized by the size of a digital document, there is an advantage of being able to measure location information in detail, but there may be a problem that the sizes of a large number of digital documents are not clearly matched, and when a relative coordinate is set, Although it is difficult to measure location information in detail, there is an advantage that it can be measured in a range even if the size of a large amount of digital documents is slightly different. It will be described later with reference to the specific Figure 3 for generating the location information of the document.

디지털 문서 관리 서버(110)는, 라벨과 위치 정보를 연관시켜, 민감 정보 패턴 서버(130)로 송신함으로써, 별도로 존재하는 민감 정보 패턴 서버에 저장시킬 수 있다. 즉, 디지털 문서 관리 서버에 존재하는 민감 정보 패턴을 별도의 서버에 저장함으로써, 단일 사용자뿐 만이 아니라 다수 사용자에게도 동일한 민감 정보 패턴을 적용할 수 있고, 후술할 암호화 정보 서버와 연결됨으로써, 복수의 서버를 이용한 암호화를 통해 민감 정보의 유출을 방지할 수 있다.The digital document management server 110 associates the label and the location information and transmits it to the sensitive information pattern server 130, thereby storing it in a separate sensitive information pattern server. That is, by storing the sensitive information pattern existing in the digital document management server in a separate server, the same sensitive information pattern can be applied not only to a single user but also to multiple users, and by being connected to the encryption information server to be described later, multiple servers The leakage of sensitive information can be prevented through encryption using.

디지털 문서 관리 서버는 민감 정보를 미리 설정된 단위 텍스트로 파싱(parsing)하여, 단위 텍스트가 연접하지 않도록 상호 연결 패턴을 생성하고, 상호 연결 패턴에 기반하여, 암호화된 문자열을 생성할 수 있다. 이에 디지털 문서 관리 서버는 상호 연결 패턴 및 암호화된 문자열을 암호화 정보 서버에 전송함으로써, 암호화 서버에 저장시킨다.The digital document management server parses sensitive information into a preset unit text, generates an interconnection pattern so that the unit texts do not concatenate, and generates an encrypted character string based on the interconnection pattern. Accordingly, the digital document management server transmits the interconnection pattern and the encrypted character string to the encryption information server and stores it in the encryption server.

본 발명에서는 디지털 문서 관리 서버(110)에서 상호 연결 패턴 및 암호화된 문자열을 생성하여 외부의 암호화 정보 서버(150)에 저장할 수 있으나, 이에 대한 복호화는 수행하지 않도록 설정될 수 있다. 이는, 각각의 디지털 문서에 대한 데이터 처리를 할 때 마다 복호화를 수행함으로써 디지털 문서 관리 서버가 부하가 증가하는 것을 방지할 수 있다.In the present invention, an interconnection pattern and an encrypted character string may be generated by the digital document management server 110 and stored in the external encryption information server 150, but the decryption may be set not to be performed. This can prevent an increase in the load on the digital document management server by performing decoding every time data processing for each digital document is performed.

상호 연결 패턴과 암호화된 문자열을 만드는 방법에 대하여는 도 4에서 후술한다.A method of creating an interconnection pattern and an encrypted character string will be described later in FIG. 4.

디지털 문서 관리 서버(110)는 민감 정보를 가명 정보로 오버랩한다. 즉, 디지털 문서의 인증을 제외한 처리를 수행하는 경우에는 가명 정보를 이용함으로써, 디지털 문서가 외부에 노출되는 경우일지라도 민감 정보가 유출되지 않도록 할 수 있다.The digital document management server 110 overlaps sensitive information with pseudonym information. That is, in the case of processing other than authentication of a digital document, by using pseudonym information, sensitive information can be prevented from leaking even when the digital document is exposed to the outside.

디지털 문서 관리 서버는 디지털 문서에 대한 인증 요청이 확인된 경우, 위치 정보에 암호화 정보 서버로부터 수신한 복호화된 민감 정보를 오버랩할 수 있다.When the authentication request for the digital document is confirmed, the digital document management server may overlap the decrypted sensitive information received from the encryption information server with the location information.

구체적으로, 디지털 문서 인증을 위한 요청이 확인된 경우, 디지털 문서의 라벨에 대응되는 위치 정보를 민감 정보 패턴 서버(130)로부터 수신한다. 또한, 디지털 문서 인증을 위한 요청을 수신한 민감 정보 패턴 서버는 암호화 정보 서버로 위치 정보를 송신한다. 즉, 암호화 정보 서버(150)는 인증을 수행하는 민감 정보 패턴 서버로부터 위치 정보를 수신하며, 별도의 인증을 수행하지 않는다. 따라서, 시스템상 데이터 처리에 있어서 중복적인 처리를 할 필요가 없으며, 암호화 정보 서버(150)에는 데이터 업로드를 제외하고는 직접적인 액세스(access)를 할 수 없도록 한다.Specifically, when a request for digital document authentication is confirmed, location information corresponding to a label of the digital document is received from the sensitive information pattern server 130. In addition, the sensitive information pattern server receiving the request for digital document authentication transmits location information to the encryption information server. That is, the encryption information server 150 receives location information from a sensitive information pattern server that performs authentication, and does not perform separate authentication. Therefore, there is no need to perform redundant processing in data processing on the system, and direct access to the encryption information server 150 except for uploading data is not possible.

암호화 정보 서버(150)는 민감 정보 서버로부터 수신된 위치 정보를 이용하여, 저장된 상호 연결 패턴과 암호화된 문자열을 복호화한다. 즉, 위치 정보를 정확히 알고 있는 경우에 한하여, 상호 연결패턴과 암호화된 문자열을 복호화할 수 있으며, 위치 정보가 상호 연결 패턴의 좌표와 상이한 경우에는 문자열이 정상적으로 복호화되지 아니한다.The encryption information server 150 decrypts the stored interconnection pattern and the encrypted character string using the location information received from the sensitive information server. That is, only when the location information is accurately known, the interconnection pattern and the encrypted character string can be decrypted. When the location information is different from the coordinates of the interconnection pattern, the character string is not normally decrypted.

만약, 데이터 디지털 문서에 대한 인증 요청이 확인되지 않는 경우, 디지털 문서 관리 서버(110)는 디지털 문서의 라벨에 대응되는 위치 정보를 민감 정보 패턴 서버(130)로부터 수신하여, 상기 디지털 문서 상에 별도로 안내할 수 있다. 예를 들어, 위치 정보에 대응하는 디지털 문서의 영역 상에는 하이라이트 표시를 함과 동시에, 디지털 문서의 하단부에 '하이라이트된 부분은 가명 처리된 부분입니다'라는 안내를 함으로써, 사용자가 디지털 문서에서 특정 부분이 가명 처리되었다는 사실을 확인할 수 있다.If the authentication request for the data digital document is not confirmed, the digital document management server 110 receives the location information corresponding to the label of the digital document from the sensitive information pattern server 130, and separately on the digital document. I can guide you. For example, by displaying a highlight on the area of the digital document corresponding to the location information, and providing a guide to the lower part of the digital document, ``The highlighted part is a pseudonymized part'', so that the user can select a specific part of the digital document. You can see that it has been changed.

디지털 문서 관리 서버(110)는 복호화된 민감 정보를 암호화 정보 서버로부터 수신하고, 위치 정보에 기반하여 복호화된 민감 정보를 가명 정보 위에 오버랩한다.The digital document management server 110 receives the decrypted sensitive information from the encryption information server, and overlaps the decrypted sensitive information on the pseudonym information based on the location information.

이에, 본 발명에 따른 디지털 문서 관리 서버는, 복호화된 민감 정보가 오버랩된 디지털 문서로 인증을 수행한다.Accordingly, the digital document management server according to the present invention performs authentication with a digital document overlapping the decrypted sensitive information.

본 발명에서, 민감 정보 패턴 서버(130)는, 데이터 문서 관리 서버(110)로부터 수신한 라벨 및 위치 정보를 저장한다. 이에, 데이터 문서 관리 서버에서 특정 라벨에 대하여 위치 정보를 요청하는 경우, 대응되는 위치 정보를 응답한다. 또한, 디지털 문서에 대한 인증 요청, 즉, 디지털 문서의 위변조 여부에 대한 인증 요청이 수신된 경우에는, 특정 라벨에 대한 위치 정보를 응답할 뿐 아니라, 이를 암호화 정보 서버(150)로 전송함으로써, 복호화된 민감 정보를 획득할 수 있도록 할 수 있다.In the present invention, the sensitive information pattern server 130 stores label and location information received from the data document management server 110. Accordingly, when the data document management server requests location information for a specific label, it responds with the corresponding location information. In addition, when an authentication request for a digital document, that is, an authentication request for whether or not the digital document is forged, is received, not only the location information for the specific label is received, but also the encryption information server 150 transmits it to decryption. You can make it possible to obtain sensitive information.

암호화 정보 서버(150)는, 디지털 문서 관리 서버(110)로부터 상호 연결 패턴과 암호화된 문자열을 수신받아 저장하며, 민감 정보 패턴 서버(130)로부터 위치 정보를 수신하는 경우에는 해당 위치 정보에 대응하는 상호 연결 패턴과 암호화된 문자열을 복호화하여 디지털 문서 관리 서버(110)로 전송할 수 있다.The encryption information server 150 receives and stores an interconnection pattern and an encrypted character string from the digital document management server 110, and when receiving location information from the sensitive information pattern server 130, corresponding to the location information The interconnection pattern and the encrypted character string may be decrypted and transmitted to the digital document management server 110.

도 2는 본 발명의 일 실시예에 따라 디지털 문서 인증을 수행하는 방법을 설명하기 위한 순서도이다. 2 is a flowchart illustrating a method of performing digital document authentication according to an embodiment of the present invention.

디지털 문서 관리 서버는, 디지털 문서의 상단부를 인식하여 디지털 문서 종류(예, 이유서, 탄원서, 고발장 등)에 대한 라벨을 설정한다(S210). 이 때, 디지털 문서내의 표, 이미지, 글자 크기를 고려하여 라벨을 설정하며, 디지털 문서에 기재된 글자의 표기를 이용하여 글자가 거꾸로 판독되지 않도록 정배열을 수행할 수 도 있다.The digital document management server recognizes the upper part of the digital document and sets a label for the digital document type (eg, reason, petition, complaint, etc.) (S210). At this time, a label is set in consideration of the size of tables, images, and characters in the digital document, and alignment may be performed so that the characters are not read backwards by using the notation of the characters written in the digital document.

디지털 문서 관리 서버는, 설정된 라벨에 따라, 민감 정보로 판단되어야 하는 텍스트를 설정하고, 라벨 이하 영역의 텍스트를 인식하여 민감 정보와 비민감 정보를 판단하여, 민감 정보가 기재된 민감 정보 영역의 위치 정보를 산출한다(S220). The digital document management server sets the text that should be determined as sensitive information according to the set label, recognizes the text in the area below the label to determine sensitive information and non-sensitive information, and position information of the sensitive information area in which the sensitive information is written. Is calculated (S220).

디지털 문서 관리 서버는, 설정된 라벨과 위치 정보를 연관시켜, 민감 정보 패턴 서버에 전송함으로써, 저장한다(S230). The digital document management server associates the set label with the location information and transmits it to the sensitive information pattern server to store it (S230).

디지털 문서 관리 서버는, 위치 정보가 파악된 민감 정보를 미리 설정된 단위 텍스트로 파싱(parsing)하여, 단위 텍스트가 연접하지 않도록 상호 연결 패턴을 생성하고, 상호 연결 패턴에 기반하여, 암호화된 문자열을 생성한다. 여기서 미리 설정된 단위는 2 혹은 3 글자 단위가 바람직하며, 1 글자 단위로 텍스트를 파싱하는 경우에는 상호 연결 패턴이 지나치게 복잡해지는 문제점이 발생할 수 있다(S240). 디지털 문서 관리 서버는 암호화 정보 서버로 상호 연결 패턴과 암호화된 문자열을 전송함으로써, 물리적으로 분리된 암호화 정보 서버에 저장한다. The digital document management server parses sensitive information whose location information is identified into a preset unit text, generates an interconnection pattern so that the unit texts do not concatenate, and generates an encrypted string based on the interconnection pattern. do. Here, the preset unit is preferably a unit of 2 or 3 characters, and when the text is parsed in units of 1 character, there may be a problem that the interconnection pattern becomes too complex (S240). The digital document management server transmits the interconnection pattern and the encrypted character string to the encrypted information server and stores them in a physically separate encrypted information server.

또한, 디지털 문서 관리 서버는, 민감 정보 영역에 가명 정보를 오버랩하여 저장함으로써, 디지털 문서를 단순 처리하는 경우에 민감 정보가 외부로 유출되지 않도록 할 수 있다. In addition, the digital document management server may overlap and store pseudonym information in the sensitive information area, so that sensitive information is not leaked to the outside when a digital document is simply processed.

디지털 문서 관리 서버는, 디지털 문서에 대한 인증 요청이 확인된 경우, 위치 정보에 암호화 정보 서버로부터 수신한 복호화된 민감 정보를 오버랩함으로써, 가명 정보를 이용하던 디지털 문서를 원복할 수 있다(S250). When the authentication request for the digital document is confirmed, the digital document management server may restore the digital document using the pseudonym information by overlapping the decrypted sensitive information received from the encryption information server with the location information (S250).

디지털 문서 관리 서버는, 복호화된 민감 정보가 오버랩된 디지털 문서로 인증을 수행함으로써, 디지털 문서의 진위 여부를 증명할 수 있다(S260). The digital document management server may verify the authenticity of the digital document by performing authentication on the digital document in which the decrypted sensitive information overlaps (S260).

도 3은 본 발명의 일 실시예에 따라, 디지털 문서의 내용을 파악하고, 라벨 및 민감 정보와 비민감 정보를 구분하여 위치 영역을 판단하는 방법을 설명하기 위한 참고도이다. FIG. 3 is a reference diagram for explaining a method of determining a location area by recognizing contents of a digital document and classifying label and sensitive information and non-sensitive information according to an embodiment of the present invention.

디지털 문서 관리 서버는 문서 전체의 이미지에서 표(table), 선분(line), 글자의 평균 크기 등을 파악하고, 파악된 정보에 기반하여 해당 문서의 종류에 대한 라벨(label)을 설정할 수 있다. The digital document management server can determine a table, a line, an average size of characters, etc. in the image of the entire document, and set a label for the type of the document based on the identified information.

예를 들어, 도 3(a)에서와 같이 표(table)을 구성하는 선분 상단의 '신 고 장'을 문서의 종류로 판단할 수 있으며, 문서의 종류는 디지털 문서에 기재된 나머지 글자들에 비하여 크기가 크다는 사실도 고려하여, 인공지능을 통해 학습된 모델을 통하여 판단될 수 있다. 여기서, 이렇게 판단된 디지털 문서내의 라벨은 성명을 기재한 '홍길동'보다 글자의 크기가 크다는 사실을 확인하여, 디지털 문서의 종류에 대한 라벨 판단의 정확성을 향상시킬 수 있다.For example, as shown in Fig. 3(a), the'report' at the top of the line segment constituting the table can be determined as the type of document, and the type of the document is compared to the rest of the letters written in the digital document. Considering the fact that the size is large, it can be determined through a model learned through artificial intelligence. Here, it is possible to improve the accuracy of label determination for the type of digital document by confirming that the label in the digital document determined in this way has a larger text size than the'Hong Gil-dong' in which the name is written.

도 3(a)에서 디지털 문서의 내용이 '신 고 장'으로 판단된 경우, 해당 라벨에 대응하여 민감 정보로 설정된 성명, 주민등록번호를 일차적으로 민감 정보로 설정하고, 디지털 문서의 전체적인 내용에 대하여 자연어 처리를 수행한다. 디지털 문서의 전체적인 내용에 대하여, 이차적으로 민감 정보가 포함되어 있는지 여부를 판단할 수 있는데, 이는 디지털 문서 관리 서버에 저장된 다른 문서에서 민감 정보에 해당하는 것으로 판단된 내용이 포함되어 있는지 여부를 판단함으로써 수행될 수 있다. In Fig. 3(a), when the content of the digital document is determined to be'report', the name and resident registration number set as sensitive information corresponding to the label are primarily set as sensitive information, and the entire contents of the digital document are in natural language. Carry out processing. With respect to the overall contents of the digital document, it can be determined whether or not sensitive information is secondary, which is determined by determining whether the contents determined to correspond to sensitive information in other documents stored in the digital document management server are included. Can be done.

이에 도 3(b)에서와 같이, 성명(상단), 주민등록번호 및 성명(하단)이 민감 정보로 판단될 수 있으며, 이에 대한 디지털 문서 내에서의 위치 정보가 산출되고, 이는 민감 정보 패턴 서버에 저장될 수 있다. 도 3(b)에서는 문서 내부의 민감 정보들에 대하여 절대 좌표로 산출된 내역을 표기하는 바, 성명(상단)의 경우에는 (20, 80), 주민등록번호의 경우에는 (120, 80), 성명(하단)의 경우에는 (70, 210)이라는 좌표가 산출될 수 있다.Accordingly, as shown in Fig. 3(b), the name (top), social security number, and name (bottom) can be determined as sensitive information, and location information in the digital document is calculated, which is stored in the sensitive information pattern server. Can be. In Fig. 3(b), details calculated in absolute coordinates for sensitive information inside the document are indicated. In the case of the name (top), (20, 80), in the case of the resident registration number (120, 80), and the name ( In the case of the bottom), coordinates of (70, 210) may be calculated.

이에, 디지털 문서 관리 서버는 (20, 80), (120, 80), (70, 210)이라는 위치 정보와 '신고장'이라는 문서의 종류에 관한 라벨을 민감 정보 서버에 저장시키고, 해당 위치에 가명 정보를 기재함으로써, 데이터 보안을 유지할 수 있다. 또한, 디지털 문서에 대한 진위 여부를 인증하는 요청이 아닌 경우에는, 해당 문서에 대한 위치 정보를 확인함으로써, 디지털 문서 관리 서버는 사용자에게 해당 위치 정보에 가명 정보가 사용되었음을 하이라이트 등의 표시를 덧붙여 알릴 수 있다.Accordingly, the digital document management server stores the location information of (20, 80), (120, 80), (70, 210) and the label for the type of document called'report' in the sensitive information server, and Data security can be maintained by writing pseudonym information. In addition, if it is not a request to certify the authenticity of the digital document, by checking the location information for the document, the digital document management server notifies the user with a highlight, etc., that the pseudonym information was used for the location information. I can.

도 4는 본 발명의 일 실시예에 따라, 민감 정보를 암호화된 문자열로 변경하는 방법을 설명하기 위한 참고도이다. 4 is a reference diagram for explaining a method of changing sensitive information into an encrypted character string according to an embodiment of the present invention.

도 3에서와 같이 산출된 위치 정보에 성명(상단), 주민등록번호, 성명(하단)과 같이 민감 정보가 존재하는 경우 미리 설정된 단위로 파싱할 수 있다. 도 4에서는 2글자 단위로 파싱되어 암호화되는 경우를 가정한다. When sensitive information such as name (top), resident registration number, and name (bottom) exists in the calculated location information as shown in FIG. 3, it can be parsed in preset units. In FIG. 4, it is assumed that the data is parsed in units of 2 characters and encrypted.

도 4(a)에서 개시된 바와 같이 2글자 단위가 연접하지 않도록 상호 연결 패턴이 생성되면, 처음은 성명(상단)에서 최초 2글자 단위로 문자를 추출하고, 주민등록번호로 연결될 수 있다. 이때, 성명(하단)으로 연결될 수 도 있으나, 주민등록번호상의 글자로 연접하지 않도록 연결될 수 있다. 이와 같이 단위 텍스트가 연접하지 않도록 상호 연결 패턴을 생성하며, 단위 텍스트가 연접하도록 상호 연결이 되는 경우에는 재생성하도록 설정된다. 이에 따라, 상호 연결 패턴의 순서대로 '홍길''01' '동 ''02'….와 같이 암호화된 문자열이 생성될 수 가 있다. When the interconnection pattern is generated so that the two-letter units are not concatenated as disclosed in FIG. 4(a), the first two-letter units are extracted from the name (top), and then connected to the resident registration number. At this time, although it may be connected by the name (bottom), it may be connected so as not to be connected with the letters on the resident registration number. In this way, an interconnection pattern is generated so that the unit texts do not concatenate, and when the unit texts are interconnected so that the unit texts are concatenated, it is set to regenerate. Accordingly, in the order of interconnection pattern,'Honggil' '01''Dong' '02'... Encrypted strings can be created like.

디지털 문서 관리 서버에서 생성된 암호화된 문자열은 암호화 정보 서버로 전달되며, 암호화 정보 서버는 수신된 문자열을 해시(hash)화하여 저장할 수 있다. The encrypted character string generated by the digital document management server is transmitted to the encryption information server, and the encryption information server can hash the received character string and store it.

암호화 정보 서버는, 디지털 문서 관리 서버가 디지털 문서에 대한 진위 여부의 인증 요청을 수신한 경우 민감 정보 패턴 서버를 통하여 위치 정보를 수신할 수 있고, 위치 정보가 수신된 경우에는 상호 연결 패턴에 맞추어 해당 위치 정보에 암호화된 문자열을 차례대로 파싱하여 넣음으로써, 민감 정보를 복원할 수 있다.The encryption information server can receive location information through the sensitive information pattern server when the digital document management server receives a request for authenticity or not for a digital document, and when the location information is received, it corresponds to the interconnection pattern. Sensitive information can be restored by sequentially parsing and inserting the encrypted character string into the location information.

이때, 상호 연결 패턴에 따른 위치 정보(즉, (20,80)->(120,80)->(120,80)…)가 민감 정보 패턴 서버에서 준 위치 정보와 상이한 경우, 즉, 민감 정보 패턴상에서 넘어온 위치 정보의 좌표와 상호 연결 패턴에 따른 위치 정보가 상이할 경우에는, 해당 민감 정보의 복원은 오류가 발생하지 않게되며, 이에 따라 민감 정보는 복호화되지 않도록 설정될 수 있다.At this time, when the location information according to the interconnection pattern (ie (20,80)->(120,80)->(120,80)…) is different from the location information provided by the sensitive information pattern server, that is, sensitive information When the coordinates of the location information transferred from the pattern and the location information according to the interconnection pattern are different, the restoration of the sensitive information does not cause an error, and accordingly, the sensitive information may be set not to be decoded.

본 명세서와 도면에 게시된 본 발명의 실시 예들은 본 발명의 기술 내용을 쉽게 설명하고 본 발명의 이해를 돕기 위해 특정 예를 제시한 것뿐이며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 여기에 게시된 실시 예들 이외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다. The embodiments of the present invention disclosed in the present specification and drawings are provided only to provide specific examples to easily explain the technical content of the present invention and to aid understanding of the present invention, and are not intended to limit the scope of the present invention. It is apparent to those of ordinary skill in the art that other modifications based on the technical idea of the present invention can be implemented in addition to the embodiments posted here.

상술한 바와 같은 디지털 문서 내의 위치 정보를 이용한 디지털 문서 인증은 다양한 산업 분야에 적용하는 것이 가능하다.Digital document authentication using location information in a digital document as described above can be applied to various industrial fields.

Claims (6)

디지털 문서 관리 서버에서 디지털 문서를 인증하는 방법에 있어서,
디지털 문서의 상단부를 인식하여, 디지털 문서 종류에 대한 라벨(label)을 설정하는 단계;
상기 디지털 문서의 텍스트를 인식하여, 상기 디지털 문서 관리 서버에 저장된 디지털 문서 데이터에 기반하여 민감 정보와 비민감 정보를 판단하고, 상기 민감 정보가 기재된 민감 정보 영역의 위치 정보를 산출하는 단계;
상기 설정된 라벨과 상기 위치 정보를 연관시켜, 민감 정보 패턴 서버에 저장하는 단계;
상기 민감 정보를 미리 설정된 단위 텍스트로 파싱(parsing)하여, 상기 단위 텍스트가 연접하지 않도록 상호 연결 패턴을 생성하고, 상기 상호 연결 패턴에 기반하여, 암호화된 문자열을 생성하는 단계;
상기 상호 연결 패턴과 상기 암호화된 문자열을 암호화 정보 서버에 저장하는 단계;
상기 민감 정보 영역에 가명 정보를 오버랩하는 단계;
상기 디지털 문서에 대한 인증 요청이 확인된 경우, 상기 위치 정보에 기반하여 상기 암호화 정보 서버로부터 수신한 복호화된 민감 정보로 상기 가명 정보를 오버랩하는 단계; 및
상기 복호화된 민감 정보가 오버랩된 디지털 문서로 인증을 수행하는 단계를 포함하며,
상기 복호화된 민감 정보를 오버랩하는 단계는,
상기 디지털 문서 인증을 위한 요청이 확인된 경우, 상기 디지털 문서의 라벨에 대응되는 상기 위치 정보를 상기 민감 정보 패턴 서버로부터 수신하는 단계;
상기 민감 정보 패턴 서버로부터 상기 암호화 정보 서버로 상기 위치 정보가 송신되고, 상기 암호화 정보 서버는 상기 위치 정보를 이용하여 상기 상호 연결 패턴과 상기 암호화된 문자열을 복호화하는 단계; 및
상기 복호화된 민감 정보를 상기 암호화 정보 서버로부터 수신하고, 상기 위치 정보에 기반하여 복호화된 민감 정보를 상기 가명 정보로 오버랩하는 단계를 포함하는,
디지털 문서 인증 방법.
In a method for authenticating a digital document in a digital document management server,
Recognizing the upper part of the digital document and setting a label for the digital document type;
Recognizing the text of the digital document, determining sensitive information and non-sensitive information based on digital document data stored in the digital document management server, and calculating location information of a sensitive information area in which the sensitive information is written;
Associating the set label with the location information and storing it in a sensitive information pattern server;
Parsing the sensitive information into a preset unit text, generating an interconnection pattern so that the unit texts do not concatenate, and generating an encrypted character string based on the interconnection pattern;
Storing the interconnection pattern and the encrypted character string in an encryption information server;
Overlapping pseudonym information in the sensitive information area;
Overlapping the pseudonym information with decrypted sensitive information received from the encryption information server based on the location information when the authentication request for the digital document is confirmed; And
Including the step of performing authentication with the digital document overlapping the decrypted sensitive information,
The step of overlapping the decrypted sensitive information,
Receiving the location information corresponding to the label of the digital document from the sensitive information pattern server when the request for digital document authentication is confirmed;
The location information is transmitted from the sensitive information pattern server to the encryption information server, and the encryption information server decrypts the interconnection pattern and the encrypted character string using the location information; And
Receiving the decrypted sensitive information from the encryption information server, comprising the step of overlapping the decrypted sensitive information based on the location information with the pseudonym information,
Digital document authentication method.
제 1 항에 있어서,
상기 라벨을 설정하는 단계는,
상기 디지털 문서에 포함된 표(table)의 외부 영역에 표시된 텍스트를 인식하여, 디지털 문서에 적용되는 라벨을 설정하는 것을 특징으로 하는,
디지털 문서 인증 방법.
The method of claim 1,
The step of setting the label,
Characterized in that by recognizing text displayed in an outer area of a table included in the digital document, a label applied to the digital document is set,
Digital document authentication method.
삭제delete 제 1 항에 있어서,
상기 디지털 문서에 대한 인증 요청이 확인되지 않는 경우,
상기 디지털 문서의 라벨에 대응되는 상기 위치 정보를 상기 민감 정보 패턴 서버로부터 수신하여, 상기 디지털 문서 상에 안내하는 단계를 포함하는,
디지털 문서 인증 방법.
The method of claim 1,
If the authentication request for the above digital document is not confirmed,
Receiving the location information corresponding to the label of the digital document from the sensitive information pattern server, comprising the step of guiding on the digital document,
Digital document authentication method.
제 1 항에 있어서,
사용자 인증이 완료된 경우에, 상기 민감 정보 서버와 연결을 설정하는 단계; 및
상기 복호화된 민감 정보를 수신하는 경우, 상기 민감 정보 서버와 연결을 해제(release)하는 단계를 더 포함하는,
디지털 문서 인증 방법.
The method of claim 1,
Establishing a connection with the sensitive information server when user authentication is completed; And
When receiving the decrypted sensitive information, further comprising the step of releasing the connection with the sensitive information server,
Digital document authentication method.
제 1 항에 있어서,
상기 민감 정보는,
상기 디지털 문서 관리 서버에 저장된 디지털 문서 데이터가 학습되어, 성명, 주민등록번호, 전화번호로 판단되는 정보인 것을 특징으로 하는,
디지털 문서 인증 방법.
The method of claim 1,
The sensitive information,
The digital document data stored in the digital document management server is learned and is information determined as a name, a resident registration number, and a phone number,
Digital document authentication method.
KR1020200124082A 2020-09-24 2020-09-24 Digital document authentication method using location information in digital documents KR102211360B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200124082A KR102211360B1 (en) 2020-09-24 2020-09-24 Digital document authentication method using location information in digital documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200124082A KR102211360B1 (en) 2020-09-24 2020-09-24 Digital document authentication method using location information in digital documents

Publications (1)

Publication Number Publication Date
KR102211360B1 true KR102211360B1 (en) 2021-02-03

Family

ID=74571835

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200124082A KR102211360B1 (en) 2020-09-24 2020-09-24 Digital document authentication method using location information in digital documents

Country Status (1)

Country Link
KR (1) KR102211360B1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010096803A (en) * 2000-04-14 2001-11-08 한정택 Text information encryption input system and method thereof
JP2004013287A (en) * 2002-06-04 2004-01-15 Fuji Xerox Co Ltd Document issuing system
JP2013534654A (en) * 2010-06-01 2013-09-05 アンスティテュ ミーヌ−テレコム Methods for securing digital data and identification information, particularly in processes using information technology and communication technology
JP2020009365A (en) * 2018-07-12 2020-01-16 京セラドキュメントソリューションズ株式会社 Document management system, image forming apparatus, and document management method
KR102067926B1 (en) * 2019-04-10 2020-01-17 주식회사 데이타솔루션 Apparatus and method for de-identifying personal information contained in electronic documents

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010096803A (en) * 2000-04-14 2001-11-08 한정택 Text information encryption input system and method thereof
JP2004013287A (en) * 2002-06-04 2004-01-15 Fuji Xerox Co Ltd Document issuing system
JP2013534654A (en) * 2010-06-01 2013-09-05 アンスティテュ ミーヌ−テレコム Methods for securing digital data and identification information, particularly in processes using information technology and communication technology
JP2020009365A (en) * 2018-07-12 2020-01-16 京セラドキュメントソリューションズ株式会社 Document management system, image forming apparatus, and document management method
KR102067926B1 (en) * 2019-04-10 2020-01-17 주식회사 데이타솔루션 Apparatus and method for de-identifying personal information contained in electronic documents

Similar Documents

Publication Publication Date Title
US11186111B1 (en) Digitally encoded seal for document verification
US9922278B2 (en) Verifying integrity of physical documents
US9898655B2 (en) System and method for identification and extraction of data
US9331856B1 (en) Systems and methods for validating digital signatures
US20080091954A1 (en) Method and system for facilitating printed page authentication, unique code generation and content integrity verification of documents
JP2008527937A (en) Method and apparatus for adding signature information to an electronic document
US10939013B2 (en) Encoding information within features associated with a document
KR102321608B1 (en) First copyright holder authentication system using blockchain and its method
BR102019005724A2 (en) VITAL CYCLE MONITORING METHOD OF CERTIFIED DOCUMENTS, VITAL CYCLE MONITORING SYSTEM OF CERTIFIED DOCUMENTS, AND NON TRANSITIONAL COMPUTER-READable MEDIA
CN108090364B (en) Method and system for positioning data leakage source
US9682590B1 (en) Printed document security
KR102211360B1 (en) Digital document authentication method using location information in digital documents
US8959344B2 (en) Method and system for handling defined areas within an electronic document
CN117371002A (en) Model encryption method, model decryption method, encryption device, and readable storage medium
CN109783450B (en) Data processing method and device and computer equipment
US20070016789A1 (en) Methods and systems for signing physical documents and for authenticating signatures on physical documents
CN103647650A (en) Rule definition based automatic signature/signature verification device and method
US10944569B2 (en) Comparison and validation of digital content using contextual analysis
US20130194636A1 (en) Document certificates
Milon Islam et al. A novel approach towards tamper detection of digital holy quran generation
KR101523842B1 (en) Method and apparatus for translation management
CN112100666A (en) Text credit granting method, credit granting text verification method and system
KR20080107954A (en) Apparatus for providing document security and method therefor
RU2543928C1 (en) Method for generation of electronic document and its copies
CN112560055B (en) Credible electronic license system based on PKI technology and working method

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant