KR102342802B1 - 기밀 유지를 위한 문서 관리 방법 - Google Patents

기밀 유지를 위한 문서 관리 방법 Download PDF

Info

Publication number
KR102342802B1
KR102342802B1 KR1020210057253A KR20210057253A KR102342802B1 KR 102342802 B1 KR102342802 B1 KR 102342802B1 KR 1020210057253 A KR1020210057253 A KR 1020210057253A KR 20210057253 A KR20210057253 A KR 20210057253A KR 102342802 B1 KR102342802 B1 KR 102342802B1
Authority
KR
South Korea
Prior art keywords
document
representative
user terminal
server
identification
Prior art date
Application number
KR1020210057253A
Other languages
English (en)
Inventor
이강건
Original Assignee
이강건
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이강건 filed Critical 이강건
Priority to KR1020210057253A priority Critical patent/KR102342802B1/ko
Priority to KR1020210182949A priority patent/KR102580865B1/ko
Application granted granted Critical
Publication of KR102342802B1 publication Critical patent/KR102342802B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 사용자의 기밀 유지를 위해 문서를 분류하고 관리하는 방법을 제공할 수 있다.
일 측면에 따른 사용자의 문서를 관리하는 서버에 의해 수행되는 문서 관리 방법에 있어서, 상기 서버가, 복수의 사용자 단말기로부터 문서 정보를 획득하는 단계, 상기 서버가, 복수의 사용자 단말기 중 대표 사용자 단말기를 결정하는 단계, 상기 서버가, 상기 대표 사용자 단말기로부터 획득한 대표 문서를 적어도 하나의 목록으로 분류하는 단계, 상기 서버가, 분류한 상기 대표 사용자 단말기로부터 획득한 대표 문서를 우선순위를 정하여 정렬하는 단계, 상기 서버가, 각각의 상기 목록에 포함된 대표 문서와 상기 대표 사용자 단말기를 제외한 다른 사용자 단말기에 포함된 문서를 상기 우선순위에 따라 비교하여 일치값을 계산하는 단계, 계산한 상기 일치값에 기초하여 상기 다른 사용자 단말기에 포함된 문서를 일치율에 따라 분류하는 단계를 포함할 수 있다.

Description

기밀 유지를 위한 문서 관리 방법{A method of managing document for confidentiality}
본 발명은 사용자의 기밀 유지를 위한 문서의 관리 방법에 관한 발명이다.
사용자의 문서는 개인의 사생활을 담고 있어 이에 대한 관리가 중요하다. 특히나 사내 문서의 경우 그 보안이 굉장히 중요하며 이에 대한 중요성이 부각되고 있는 상황이다. 이와 더불어서 사내 문서의 보안을 위한 연구가 활발하게 진행되고 있다. 기존의 문서 보안은 문서를 수작업으로 검토하는 방식에 그치고 있다. 이에 문서의 보안을 위한 발명을 절실하게 요하고 있는 상황이다. 특히 문서의 보안을 관리하는데 있어서, 세밀하게 보안할 파일과 보안하지 않을 파일을 구분하는 것이 중요하며, 보안할 파일이 있는 경우 보안하는 방법에 대해서 세밀하게 설정해야 보안하는 과정에 있어서의 오류를 줄일 수 있다.
따라서 문서의 보안을 관리하는데 있어서 보안할 포인트를 결정하고, 해당 포인트를 세밀하게 관리하여 사내 보안을 강화하기 위한 연구가 활발하게 진행되고 있다.
한국 공개특허공보 제10-2016-0098084호(2016. 08. 18)
본 발명은 사용자의 기밀 유지를 위해 문서를 분류하고 관리하는 방법을 제공할 수 있다.
일 측면에 따른 사용자의 문서를 관리하는 서버에 의해 수행되는 문서 관리 방법에 있어서, 상기 서버가, 복수의 사용자 단말기로부터 문서 정보를 획득하는 단계, 상기 서버가, 복수의 사용자 단말기 중 대표 사용자 단말기를 결정하는 단계, 상기 서버가, 상기 대표 사용자 단말기로부터 획득한 대표 문서를 적어도 하나의 목록으로 분류하는 단계, 상기 서버가, 분류한 상기 대표 사용자 단말기로부터 획득한 대표 문서를 우선순위를 정하여 정렬하는 단계, 상기 서버가, 각각의 상기 목록에 포함된 대표 문서와 상기 대표 사용자 단말기를 제외한 다른 사용자 단말기에 포함된 문서를 상기 우선순위에 따라 비교하여 일치값을 계산하는 단계, 계산한 상기 일치값에 기초하여 상기 다른 사용자 단말기에 포함된 문서를 일치율에 따라 분류하는 단계를 포함할 수 있다.
상기 서버가, 각각의 상기 목록에 포함된 대표 문서와 상기 다른 사용자 단말기에 포함된 문서를 비교하여 일치값을 계산하는 단계는 상기 대표 문서에 포함된 단어에서 식별 단어를 결정하는 단계, 상기 다른 사용자 단말기에 포함된 문서에 포함되어 있는 상기 식별 단어의 개수 정보에 기초하여 상기 문서를 분류하는 단계를 포함할 수 있다.
상기 서버가, 상기 대표 문서에 포함된 단어에서 식별 단어를 결정하는 단계는 상기 대표 문서에 포함된 단어 중 상기 사용자가 미리 설정한 단어와 미리 정해진 일치율 이상으로 일치하는 단어를 상기 식별 단어로 결정하는 단계를 포함할 수 있다.
상기 서버가, 상기 각각의 상기 목록에 포함된 대표 문서와 상기 다른 사용자 단말기에 포함된 문서를 비교하여 일치값을 계산하는 단계는 상기 서버가, 상기 대표 문서에 포함되어 있는 상기 식별 단어의 개수와 상기 다른 사용자 단말기에 포함된 문서에 포함되어 있는 상기 식별 단어의 개수를 미리 정해진 알고리즘으로 수치화 하는 단계, 상기 서버가, 수치화 한 상기 다른 사용자 단말기에 포함된 문서에 포함되어 있는 상기 식별 단어의 개수와 수치화 한 상기 대표 사용자 단말기에 포함된 문서에 포함되어 있는 상기 식별 단어의 개수를 비교하여 가장 수치가 근사한 상기 대표 사용자 단말기에 포함된 문서를 결정하는 단계, 상기 서버가, 결정한 상기 대표 사용자 단말기에 포함된 문서에 포함되어 있는 상기 식별 단어와 상기 다른 사용자 단말기에 포함된 문서에 포함되어 있는 상기 식별 단어의 개수 비율을 상기 일치값으로 결정하는 단계, 상기 일치값의 크기에 따라 상기 문서를 분류하는 단계를 포함하는 단계를 포함할 수 있다.
사용자의 문서를 관리하는 서버에 의해 수행되는 문서 관리 방법에 있어서, 상기 서버가 상기 일치값이 임계치 이상이면 상기 임계치 이상의 일치값에 대응하는 상기 다른 사용자 단말기에 포함된 문서의 문서명을 상기 대표 사용자 단말기로 전송하는 단계를 더 포함할 수 있다.
본 발명은 사용자의 기밀 유지를 위해 문서를 분류하고 관리하는 방법을 제공함으로서 사용자의 기밀 문서를 효율적으로 보호할 수 있다.
도 1은 일 실시예에 의한 대표 문서와 다른 사용자 단말기에 포함된 문서를 비교하여 문서를 분류하는 동작을 예시한 도면이다.
도 2는 일 실시예에 의한 일치값을 계산하여 다른 사용자 단말기에 포함된 문서를 분류하는 동작을 예시한 도면이다.
도 3은 일 실시예에 의한 식별 단어의 개수 정보에 기초하여 문서를 분류하는 동작을 예시한 도면이다.
도 4는 일 실시예에 의한 일치값에 기초하여 문서를 분류하는 동작을 예시한 도면이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다. 도 1은 일 실시예에 의한 서버가 CPU 데이터를 획득하여 노후화 정도를 파악하고 노후화 정도를 사용자 단말에 표시하는 동작을 예시한 도면이다.
도 1은 일 실시예에 의한 대표 문서와 다른 사용자 단말기에 포함된 문서를 비교하여 문서를 분류하는 동작을 예시한 도면이다.
도 1을 구체적으로 살펴보면, 서버는 복수의 사용자 단말기로부터 문서 정보를 획득할 수 있고, 복수의 사용자 단말기 중 대표 사용자 단말기(1)를 결정할 수 있다.
일 실시예로 서버는 대표 사용자 단말기로부터 획득한 대표 문서를 적어도 극비 문서가 담긴 목록(11) 일반 문서가 담긴 목록(12)으로 분류할 수 있다.
이후 각각의 목록에 포함된 대표 문서와 대표 사용자 단말기를 제외한 다른 사용자 단말기에 포함된 문서들을 우선순위에 따라 비교하여 일치값을 계산할 수 있다.
일 실시예로 다른 사용자 단말기가 복수개로 이를 각각 단말기 1(2), 단말기 2(3)로 지칭하면 단말기 1에 포함된 문서(21)와 단말기 2에 포함된 문서(31) 각각을 극비 문서가 담긴 목록(11)에 포함된 문서들과, 일반 문서가 담긴 목록(12)에 포함된 문서들과 비교하여 일치값을 계산할 수 있다. 이때 우선순위에 따라 극비 문서가 담긴 목록(11)에 담긴 문서들을 일반 문서가 담긴 목록(12)에 담긴 문서들보다 먼저 비교할 수도 있다.
후술하듯 대표 사용자 단말기에 포함된 모든 문서와 다른 사용자 단말기에 포함된 모든 문서를 비교하지 않고 극비 문서가 담긴 목록(11)을 결정하는 기준값과 일반 문서가 담긴 목록(12)을 결정하는 기준값을 포함하는 복수의 기준값과 다른 사용자 단말기에 포함된 문서들을 비교할 수도 있다. 이는 업무의 빠른 처리를 위함이다.
도 2는 일 실시예에 의한 일치값을 계산하여 다른 사용자 단말기에 포함된 문서를 분류하는 동작을 예시한 도면이다. 도 3은 일 실시예에 의한 식별 단어의 개수 정보에 기초하여 문서를 분류하는 동작을 예시한 도면이다.
도 2 및 도3을 구체적으로 살펴보면, 사용자의 문서를 관리하는 서버에 의해 수행되는 문서 관리 방법에 있어서, 서버가, 복수의 사용자 단말기로부터 문서 정보를 획득하는 단계를 포함할 수 있다. 문서 정보는 사용자 단말기에 포함된 문서 파일을 의미할 수 있다. 이때 문서 정보에는 문서가 작성된 날짜, 문서에 포함되어 있는 내용, 문서가 가장 최근에 수정된 날짜 등의 정보를 포함할 수 있다. 문서 관리 방법에 있어서 서버가, 복수의 사용자 단말기 중 대표 사용자 단말기를 결정하는 단계를 포함할 수 있다. 대표 사용자 단말기는 기준이 되는 사용자 단말기를 의미할 수 있다. 대표 사용자 단말기를 결정하는 것은 사용자의 입력에 따라 지정된 단말기가 대표 사용자 단말기가 될 수 있으며, 사용자가 입력하는 순서에 의할 수도 있다.
일 예시로 처음으로 획득한 문서에 대응되는 사용자 단말기가 대표 사용자 단말기로 결정되게끔 설정할 수도 있다. 문서 관리 방법에 있어서 서버가, 대표 사용자 단말기로부터 획득한 대표 문서를 미리 정해진 기준에 따라 적어도 하나의 목록으로 분류하는 단계를 포함할 수 있다. 대표 문서는 대표 사용자 단말기로부터 획득한 문서를 의미할 수 있다. 미리 정해진 기준에 따라 적어도 하나의 목록으로 분류하는 것은 대표 문서에 포함된 특정 단어의 개수를 기준으로 설정할 수 있고, 사용자에 입력에 의해 분류되는 것일수도 있으며, 대표 문서의 획득 시간으로 분류한 것을 포함할 수 있다. 또한 후에 서술할 식별 단어의 개수에 기초하여 식별 단어의 개수를 기준으로 하여 목록을 분류할 수도 있다.
식별 단어는 수학식1의 방식과 같이 각 식별 단어의 개수와 가중치를 곱하여 그에 따른 값을 수치화 한 후, 이를 통해 수치를 기준으로 하여 목록을 분류할 수도 있다. 문서 관리 방법에 있어서 서버가, 분류한 대표 사용자 단말기로부터 획득한 대표 문서를 미리 정해진 방식으로 우선순위를 정하여 정렬하는 단계를 포함할 수 있다. 미리 정해진 방식으로 우선순위를 정하여 정렬하는 것은, 식별 단어의 개수가 많은 순서대로 정렬할 수도 있으며, 식별 단어가 아니더라도 특정 단어의 개수가 많은 순서대로 정렬할 수도 있고, 대표 문서의 획득 시간으로 분류하였다면 대표 문서의 획득 시간이 빠른 순으로 정렬할 수도 있다. 식별 단어가 복수개 라면 앞서 얘기한 방법과 같이 수학식 1의 방식과 같이 각 식별 단어의 개수와 가중치를 곱하여 그에 따른 값을 수치화 한 후, 이를 통해 수치가 높은 순으로 우선순위 기준을 정하여 목록을 분류할 수도 있다.
목록을 정렬하였다면 이를 정렬한 순서대로 저장할 수 있다. 이때 서버 내부에 포함된 저장부를 이용할 수도 있고, 서버 외부의 저장부를 이용할 수도 있다. 문서 관리 방법에 있어서 서버가, 각각의 목록에 포함된 대표 문서와 대표 사용자 단말기를 제외한 다른 사용자 단말기에 포함된 문서를 우선순위에 따라 비교하여 일치값을 계산하는 단계, 문서 관리 방법은 계산한 일치값에 기초하여 다른 사용자 단말기에 포함된 문서를 일치율에 따라 분류하는 단계를 포함할 수 있다.
각각의 목록에 포함된 대표 문서와 다른 사용자 단말기에 포함된 문서를 비교하는 것은 전체 대표 문서와 다른 사용자 단말기에 포함된 문서를 전부 비교하는 것을 포함할 수 있다. 또한, 목록을 특정 단어나 식별 단어의 개수로 정렬하였다면, 특정 그룹으로 묶인 목록에 있는 문서들과 다른 사용자 단말기에 포함된 문서를 비교할 수도 있다. 또한 목록을 특정 단어나 식별 단어의 개수로 정렬하였다면, 목록을 분류하는 기준이 되는 특정 단어 또는 식별 단어의 개수를 기준으로 하여 비교할 수도 있다.
일 실시예로 식별 단어의 개수가 300단어 이상, 200단어 이상에서 300단어 이하, 200단어 이하인 개수들을 기준으로 하여 각각 제1 목록, 제2 목록, 제3 목록으로 대표 문서를 분류할 수도 있다. 이후 제1 목록을 우선순위 1순위로 하면, 제1 목록과 대응될 수 있는 다른 사용자 단말기에 포함된 문서를 찾기 위해 제1 목록에 포함된 대표 문서를 다른 사용자 단말기에 포함된 문서를 비교할 수 있다. 비교를 하는 것은 식별 단어의 개수에 기초하여 식별 단어의 개수의 일치율을 기준으로 비교하는 것을 포함할 수 있다.
다른 실시예로 사용자의 설정에 따라서 식별 단어의 개수 300개 200개를 기준으로 하여 다른 사용자 단말기에 포함된 문서들에 포함된 특정 단어 또는 식별 단어의 개수를 획득하여 각 목록의 기준 값과 다른 사용자 단말기에 포함된 문서의 일치율을 계산할 수 있다.
예를 들어서 다른 사용자 단말기에 포함된 문서의 식별 단어개수가 280개라고 하면 제1 목록의 기준인 식별 단어 300개와 가장 근접하기에 일치율이 가장 높을 수 있다. 이때의 다른 사용자 단말기에 포함된 문서는 일치율이 가장 높은 목록에 속하도록 분류될 수 있다. 식별 단어가 기밀과 관련된 단어여서 제1 목록이 가장 보안이 중요한 문서 목록이라면 이때 다른 사용자 단말기에 포함된 문서는 극비 문서에 해당하는 문서로서 이에 대해 따로 인지할 수 있도록 대표 사용자 단말기에 다른 사용자 단말기에 포함된 문서가 극비 문서에 해당함을 전할 수 있다.
즉 이를 정리하면 서버는 사용자 단말기로부터 문서 정보를 획득(201)할 수 있고, 이후 복수의 사용자 단말기 중 대표 사용자 단말기를 결정(202)할 수 있다. 이후 대표 사용자 단말기로부터 획득한 문서를 미리 정해진 기준에 따라 적어도 하나의 목록으로 분류하고 우선순위를 정하여 정렬(203)할 수 있다. 이후 목록에 포함된 문서와 다른 사용자 단말기에 포함된 문서를 우선순위에 따라 비교하여 일치값 계산하고, 일치값에 기초하여 다른 사용자 단말기에 포함된 문서를 일칭율에 따라 분류(204)할 수 있다. 또한 서버는 대표 문서에 포함된 단어에서 식별 단어를 결정(301)할 수 있다.
이후 다른 사용자 단말기에 포함된 문서에 포함되어 있는 식별 단어의 개수 정보에 기초하여 문서를 분류(302)할 수 있다. 여기서 식별 단어의 개수 정보에 기초하여 문서를 분류하는 것은 상술한 바와 같은 일 실시예로 식별 단어 300개, 200개를 기준으로 해서 다른 사용자 단말기에 포함된 식별 단어의 개수가 300개 이상이면 1목록으로, 200개 이상에서 300개 이하면 2목록으로, 200개 미만이면 3목록으로 분류할 수도 있다. 이때 다른 사용자 단말기에 포함된 문서를 분류한 후 서버 내 또는 서버 외에 있는 저장부나 저장 장치에 분류하여 저장할 수도 있고, 저장한 분류 목록을 사용자 단말기나 사용자가 지정한 장치에 전송할 수도 있다.
또한 서버가 대표 문서에 포함된 단어에서 식별 단어를 결정하는 단계는, 대표 문서에 포함된 단어 중 사용자가 미리 설정한 단어와 미리 정해진 일치율 이상으로 일치하는 단어를 식별 단어로 결정하는 단계를 포함할 수 있다. 사용자가 미리 설정한 단어와 미리 정해진 일치율 이상으로 일치하는 단어는 다음과 같은 방식과 같을 수 있다. 서버는 외부 서버로부터 특정 단어와 관계가 있는 단어 정보를 획득할 수 있다. 일 실시예로 사용자가 '보안'이라는 단어를 미리 설정한 단어라고 했다면, 'security'도 이와 동일한 의미의 단어이기에 이에 대한 정보를 외부 서버에서 획득할 수 있다. 또한 외부 서버로부터 'ㅂㅗ안', '보앙' 등의 오타 작업도 포함해야 할 수 있기에 해당 단어들도 일치율을 높은 것으로 판단하여 획득할 수 있다.
이때 일치율은 음절의 개수를 기준으로 하여 음절의 개수 일치율을 기준으로 정할수도 있고, 비슷한 의미를 기준으로 결정할 수도 있다. 이에 대한 기준은 사용자가 미리 설정하여 외부 서버로부터 미리 설정한 단어와 비슷한 단어를 획득할 수도 있으며, 외부 서버에서 이미 결정된 기준으로 하여 외부 서버로부터 획득할 수도 있다. 해당 과정을 통해 단순히 특정 단어뿐만 아니라 특정 단어와 관련된 비슷한 단어들도 문서를 비교하는데 사용하여 보다 정확하게 비슷한 문서를 검출하는 것이 가능할 수 있다.
도 4는 일 실시예에 의한 일치값에 기초하여 문서를 분류하는 동작을 예시한 도면이다. 도 4를 구체적으로 살펴보면, 서버가, 각각의 목록에 포함된 대표 문서와 다른 사용자 단말기에 포함된 문서를 비교하여 일치값을 계산하는 단계는 서버가, 다른 사용자 단말기에 포함된 문서에 포함되어 있는 식별 단어의 개수를 미리 정해진 알고리즘으로 수치화 하는 단계, 수치화 한 다른 사용자 단말기에 포함된 문서에 포함되어 있는 식별 단어의 개수와 대표 사용자 단말기에 포함된 문서에 포함되어 있는 식별 단어의 개수를 비교하여 가장 수치가 근사한 대표 사용자 단말기에 포함된 문서를 결정하는 단계, 결정한 대표 사용자 단말기에 포함된 문서에 포함되어 있는 식별 단어와 다른 사용자 단말기에 포함된 문서에 포함되어 있는 식별 단어의 개수 비율을 일치값으로 결정하는 단계, 일치값의 크기에 따라 문서를 분류하는 단계를 포함하는 단계를 포함할 수 있다.
대표 문서에 포함되어 있는 식별 단어의 개수와 다른 사용자 단말기에 포함된 문서에 포함되어 있는 식별 단어의 개수를 미리 정해진 알고리즘으로 수치화 할 수 있다. 미리 정해진 알고리즘은 아래와 같은 수학식 1에 의할 수 있다. 이때 대표 문서와 다른 사용자 단말기에 포함된 문서는 각각 알고리즘에 대입하여 각각의 결과를 도출할 수 있다.
Figure 112021051412819-pat00001
여기서 Q는 식별 단어의 개수를 미리 정해진 알고리즘으로 수치화 한 값을 의미할 수 있다. C는 문서에 포함된 식별 단어를 의미할 수 있다. 예를 들어서 식별 단어가 '극비', '보안'이라면 i=2라는 값을 가지게 되고 극비는 c=1일때, 보안은 c=2일 때 대응될 수 있다. G는 해당 식별 단어에 대응하는 다른 사용자 단말기에 포함된 문서에 포함되어 있는 단어 개수를 의미할 수 있다. H는 해당 식별 단어에 대응되는 가중치를 의미할 수 있다. 가중치를 결정하는 기준은 사용자가 지정할 수 있다.
일 실시예로 사용자는 '극비'라는 단어가 '보안'이라는 단어보다 더 중요한 요소로 생각하여 '극비'에 해당하는 가중치를 2로, '보안'에 해당하는 가중치를 1.5로 설정할 수도 있다. 이때 가중치를 결정하는 기준으로 외부 서버로부터 획득한 보안 등급에 따른 기준 자료를 이용할 수 있다. 일 실시예로 정부의 주요 계획과 관련된 문서의 보안 등급이 중요도 순으로 하여 1-5단계가 있다고 하고, 1단계의 보안 등급이 가장 중요하다고 하면, 1단계-5단계의 문서에서 중요 핵심이 되는 단어를 사용자가 도출하거나 외부 서버에서 결정한 단어를 가져올 수 있다. 이때 가중치를 정하는 기준은 사용자가 미리 설정해둔 값에 의할 수 있으며, 외부 서버가 계산한 값에 의할 수도 있다. 가중치를 결정하는 것은 미리 분류해둔 카테고리에 따라 미리 설정된 값에 의할 수도 있다.
일 실시예로 '정부의 A지역 재개발 관련 정책'문서라고 한다면 외부 서버로부터 가져온 분석을 통해 특정 도시의 명칭인 A가 식별 단어가 될 수 있다. 이때 식별 단어를 정하는 기준을 제목에 포함된 단어가 기준이 될 수도 있다. 또한 사용자가 도시의 명칭을 식별 단어로 지정할 수도 있다.
또한 일 실시예로 '암호화 관련된 정책'이라고 한다면 해당 보완에 있어서 암호에 대응되는 숫자와 문자의 조합이 식별 단어가 될 수 있다. 이때 제목에 포함된 '암호화'라는 단어에 대응하여 본문안에 문자와 숫자의 조합으로 이루어진 문자가 8글자 이상이라고 한다면 해당 단어를 식별 단어로 정할 수도 있으며, 이를 후에 사용자가 직접 판단하여 식별 단어의 유무를 결정할 수도 있다. 즉, 본문에 포함된 단어에 대응되는 미리 설정된 기준으로 식별 단어가 결정될 수도 있다.
수치화 한 다른 사용자 단말기에 포함된 문서에 포함되어 있는 식별 단어의 개수와 대표 사용자 단말기에 포함된 문서에 포함되어 있는 식별 단어의 개수를 비교하여 가장 수치가 근사한 대표 사용자 단말기에 포함된 문서를 결정할 수 있다. 이때 가장 수치가 근사한 대표 사용자 단말기에 포함된 문서를 결정하는 것 말고도 가장 수치가 근사한 대표 사용자 단말기에 포함된 문서가 속해있는 목록을 결정할 수도 있다. 이는 업무의 빠른 처리를 위해 문서와 문서간의 비교가 아닌 다른 사용자 단말기에 포함된 문서와 대응되는 대표 사용자 단말기에 포함된 목록을 결정하여 이를 분류하는 것을 포함할 수도 있다.
이후 일치값을 결정할 때 식별 단어의 개수 비율을 일치값으로 하는 것은, 일 실시예로 대표 사용자 단말기에 포함된 문서의 식별 단어의 개수를 수치화 한 값, 다른 사용자 단말기에 포함된 문서의 식별 단어의 개수를 수치화 한 값이 각각 90개 60개라고 하면 이때 일치값은 60/90으로 2/3일 수 있다. 이때 양 값 중 큰 수치의 값이 분모로 작은 수치의 값이 분자로 설정될 수 있다. 이렇게 하여 구한 일치값이 각각 1/2, 2/3으로 나온다면 크기가 큰 2/3에 해당하는 문서가 먼저 그 이후에 작은 수치인 1.2의 문서가 정렬될 수도 있다.
서버는 일치값이 임계치 이상이면, 임계치 이상의 일치값에 대응하는 다른 사용자 단말기에 포함된 문서의 문서명을 대표 사용자 단말기로 전송하는 단계를 더 포함할 수 있다. 또한 서버는 일치값이 임계치 이상인 문서들을 다른 방법으로 사용자 단말기로 전송할 수 있다. 예를 들어서 일치값이 사용자가 설정해 둔 미리 정해진 값인 1/2을 넘으면 사용자에게 경고 알람과 해당 문서를 함께 전송할 수 있으며, 1/2 이하 1/3이하의 일치값이라면 단순히 해당 문서를 전송하도록 제어할 수 있다. 또한 일치값이 미리 정해진 값 이상인 문서는 자동으로 삭제되도록 제어할 수도 있다.
예를 들어서 일치값을 확인한 결과 미리 정해진 값인 1/2이상의 일치값으로 판단되면 이는 극비 문서에 해당하는 것으로 판단되어 사용자 단말기에 삭제 여부를 알리는 메시지를 보내고 삭제 입력이 들어오면 삭제하도록 할 수도 있으며, 삭제했다는 통보 알림을 보내면서 사용자의 입력 없이 바로 삭제되도록 제어할 수도 있다.
사용자 단말기의 예를 들면, 통신 가능한 데스크탑 컴퓨터(desktop computer), 랩탑 컴퓨터(laptop computer), 노트북(notebook), 스마트폰(smart phone), 태블릿 PC(tablet PC), 모바일폰(mobile phone), 스마트 워치(smart watch), 스마트 글래스(smart glass), e-book 리더기, PMP(portable multimedia player), 휴대용 게임기, 네비게이션(navigation) 장치, 디지털 카메라(digital camera), DMB(digital multimedia broadcasting) 재생기, 디지털 음성 녹음기(digital audio recorder), 디지털 음성 재생기(digital audio player), 디지털 동영상 녹화기(digital video recorder), 디지털 동영상 재생기(digital video player), PDA(Personal Digital Assistant) 등일 수 있다.
본 발명에 따른 방법들은 다양한 컴퓨터 수단을 통해 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위해 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능 매체의 예에는 롬(ROM), 램(RAM), 플래시 메모리(flash memory) 등과 같이 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러(compiler)에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터(interpreter) 등을 사용해서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 적어도 하나의 소프트웨어 모듈로 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
또한, 상술한 방법 또는 장치는 그 구성이나 기능의 전부 또는 일부가 결합되어 구현되거나, 분리되어 구현될 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
1: 대표 문서
2: 단말기 1
3: 단말기 2

Claims (5)

  1. 사용자의 문서를 관리하는 서버에 의해 수행되는 문서 관리 방법에 있어서,
    상기 서버가, 복수의 사용자 단말기로부터 문서 정보를 획득하는 단계;
    상기 서버가, 복수의 사용자 단말기 중 대표 사용자 단말기를 결정하는 단계;
    상기 서버가, 상기 대표 사용자 단말기로부터 획득한 대표 문서를 적어도 하나의 목록으로 분류하는 단계;
    상기 서버가, 분류한 상기 대표 사용자 단말기로부터 획득한 대표 문서를 우선순위를 정하여 정렬하는 단계;
    상기 서버가, 각각의 상기 목록에 포함된 대표 문서와 상기 대표 사용자 단말기를 제외한 다른 사용자 단말기에 포함된 문서를 상기 우선순위에 따라 비교하여 일치값을 계산하는 단계;
    계산한 상기 일치값에 기초하여 상기 다른 사용자 단말기에 포함된 문서를 일치율에 따라 분류하는 단계;를 포함하고,
    상기 서버가, 각각의 상기 목록에 포함된 대표 문서와 상기 다른 사용자 단말기에 포함된 문서를 비교하여 일치값을 계산하는 단계;는
    상기 대표 문서에 포함된 단어에서 식별 단어를 결정하는 단계;
    상기 다른 사용자 단말기에 포함된 문서에 포함되어 있는 상기 식별 단어의 개수 정보에 기초하여 상기 문서를 분류하는 단계;를 포함하고,
    상기 서버가, 상기 대표 문서에 포함된 단어에서 식별 단어를 결정하는 단계;는
    상기 대표 문서에 포함된 단어 중 상기 사용자가 미리 설정한 단어와 미리 정해진 일치율 이상으로 일치하는 단어를 상기 식별 단어로 결정하는 단계;를 포함하고,
    상기 서버가, 상기 각각의 상기 목록에 포함된 대표 문서와 상기 다른 사용자 단말기에 포함된 문서를 비교하여 일치값을 계산하는 단계;는
    상기 서버가, 상기 대표 문서에 포함되어 있는 상기 식별 단어의 개수와 상기 다른 사용자 단말기에 포함된 문서에 포함되어 있는 상기 식별 단어의 개수를 미리 정해진 알고리즘으로 수치화 하는 단계;
    상기 서버가, 수치화 한 상기 다른 사용자 단말기에 포함된 문서에 포함되어 있는 상기 식별 단어의 개수와 수치화 한 상기 대표 사용자 단말기에 포함된 문서에 포함되어 있는 상기 식별 단어의 개수를 비교하여 가장 수치가 근사한 상기 대표 사용자 단말기에 포함된 문서를 결정하는 단계;
    상기 서버가, 결정한 상기 대표 사용자 단말기에 포함된 문서에 포함되어 있는상기 식별 단어와 상기 다른 사용자 단말기에 포함된 문서에 포함되어 있는 상기 식별 단어의 개수 비율을 상기 일치값으로 결정하는 단계;
    상기 일치값의 크기에 따라 상기 문서를 분류하는 단계를 포함하는 단계;를 포함하고,
    상기 서버가, 상기 일치값이 임계치 이상이면 상기 임계치 이상의 일치값에 대응하는 상기 다른 사용자 단말기에 포함된 문서의 문서명을 상기 대표 사용자 단말기로 전송하는 단계;를 더 포함하고,
    상기 식별 단어의 개수와 상기 다른 사용자 단말기에 포함된 문서에 포함되어 있는 상기 식별 단어의 개수를 미리 정해진 알고리즘으로 수치화 하는 단계는, 수학식 1에 의해서 상기 식별 단어의 개수를 미리 정해진 알고리즘으로 수치화 하고,
    [수학식 1]
    Figure 112021133329840-pat00007
    ,
    상기 Q는 상기 식별 단어의 개수를 상기 미리 정해진 알고리즘으로 수치화 한 값을 나타내고, 상기 C는 문서에 포함된 상기 식별 단어를 나타내고, 상기 i는 문서에 포함된 상기 식별 단어의 개수를 나타내고, 상기 Gc는 상기 c번째 상기 식별 단어에 대응하는 상기 다른 사용자 단말기에 포함된 문서에 포함되어 있는 단어 개수를 나타내고, 상기 Hc는 상기 c번째 상기 식별 단어에 대응되는 가중치를 나타내고,
    상기 대표 문서에 포함된 단어 중 상기 사용자가 미리 설정한 단어와 미리 정해진 일치율 이상으로 일치하는 단어를 상기 식별 단어로 결정하는 단계는,
    상기 사용자가 미리 설정한 단어에 포함된 음절과 동일한 음절의 개수를 기준으로 상기 일치율을 결정하는 단계;를 더 포함하고,
    상기 서버가, 분류한 상기 대표 사용자 단말기로부터 획득한 대표 문서를 우선순위를 정하여 정렬하는 단계는,
    상기 대표 사용자 단말기로부터 획득한 상기 대표 문서를 상기 식별 단어의 개수와 상기 식별 단어에 대응되는 가중치를 곱한 값에 따라 수치화 한 후, 수치가 높은 순서대로 상기 우선순위의 기준을 정하여 제1 목록, 제2 목록 및 제3 목록으로 분류하는 단계;를 포함하고,
    상기 서버가, 각각의 상기 목록에 포함된 대표 문서와 상기 대표 사용자 단말기를 제외한 다른 사용자 단말기에 포함된 문서를 상기 우선순위에 따라 비교하여 일치값을 계산하는 단계는,
    상기 제1 목록, 상기 제2 목록 및 상기 제3 목록 중 상기 우선순위가 가장 높은 상기 제1 목록에 포함된 상기 대표 문서와 상기 다른 사용자 단말기에 포함된 문서를 비교하여 상기 일치값을 계산하는 단계;를 포함하고,
    상기 서버가, 상기 일치값이 제1 임계치 이상인 문서는 상기 사용자 단말기로 경고 알람을 전송하거나 상기 사용자 단말기에 삭제 여부를 알리는 메시지를 송신하고, 상기 사용자 단말기로부터 삭제 입력이 들어오면 상기 일치값이 상기 제1 임계치 이상인 문서를 삭제하는 단계; 및
    상기 서버가, 상기 일치값이 상기 제 1임계치 미만이고 제2 임계치 이상인 문서는 상기 사용자 단말에 전송하는 단계; 를 더 포함하는 문서 관리 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
KR1020210057253A 2021-05-03 2021-05-03 기밀 유지를 위한 문서 관리 방법 KR102342802B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210057253A KR102342802B1 (ko) 2021-05-03 2021-05-03 기밀 유지를 위한 문서 관리 방법
KR1020210182949A KR102580865B1 (ko) 2021-05-03 2021-12-20 복수의 단말 간의 기밀 문서 관리 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210057253A KR102342802B1 (ko) 2021-05-03 2021-05-03 기밀 유지를 위한 문서 관리 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020210182949A Division KR102580865B1 (ko) 2021-05-03 2021-12-20 복수의 단말 간의 기밀 문서 관리 시스템

Publications (1)

Publication Number Publication Date
KR102342802B1 true KR102342802B1 (ko) 2021-12-22

Family

ID=79164159

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020210057253A KR102342802B1 (ko) 2021-05-03 2021-05-03 기밀 유지를 위한 문서 관리 방법
KR1020210182949A KR102580865B1 (ko) 2021-05-03 2021-12-20 복수의 단말 간의 기밀 문서 관리 시스템

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020210182949A KR102580865B1 (ko) 2021-05-03 2021-12-20 복수의 단말 간의 기밀 문서 관리 시스템

Country Status (1)

Country Link
KR (2) KR102342802B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101473452B1 (ko) * 2013-09-04 2014-12-18 주식회사 마크애니 기업 내부 정보 보안을 강화하기 위한 방법, 시스템 및 장치
KR20160098084A (ko) 2015-02-09 2016-08-18 특허법인 해담 관심대상 문서 필터링 시스템 및 그 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101473452B1 (ko) * 2013-09-04 2014-12-18 주식회사 마크애니 기업 내부 정보 보안을 강화하기 위한 방법, 시스템 및 장치
KR20160098084A (ko) 2015-02-09 2016-08-18 특허법인 해담 관심대상 문서 필터링 시스템 및 그 방법

Also Published As

Publication number Publication date
KR102580865B1 (ko) 2023-09-20
KR20220150191A (ko) 2022-11-10

Similar Documents

Publication Publication Date Title
US11188657B2 (en) Method and system for managing electronic documents based on sensitivity of information
US9215197B2 (en) System, method, and computer program product for preventing image-related data loss
US20240168982A1 (en) System for routing of requests
US9043247B1 (en) Systems and methods for classifying documents for data loss prevention
US11418592B2 (en) Uploading user and system data from a source location to a destination location
US20210141915A1 (en) System for automatic classification and protection unified to both cloud and on-premise environments
US11721116B2 (en) Managing camera actions
TW201513035A (zh) 相關關係顯示系統、相關關係顯示方法及相關關係顯示程式
CN113722438A (zh) 基于句向量模型的句向量生成方法、装置及计算机设备
CN111314063A (zh) 一种基于物联网大数据信息管理方法、系统及装置
CN114969840A (zh) 数据防泄漏方法和装置
US20240022570A1 (en) Classifying types of sensitive events for data loss prevention
US10778627B2 (en) Centralized communications controller
KR102342802B1 (ko) 기밀 유지를 위한 문서 관리 방법
US8918406B2 (en) Intelligent analysis queue construction
CN105354506B (zh) 隐藏文件的方法和装置
US20230315993A1 (en) Systems and processes for natural language processing
CN116055067A (zh) 一种弱口令检测的方法、装置、电子设备及介质
US11947915B1 (en) System for determining document portions that correspond to queries
CN111061731B (zh) 一种加密数据全文检索方法
WO2023177401A1 (en) Systems and processes for natural language processing
Escobar et al. Automatic content backup and allocation to native applications
AU2023201691A1 (en) System and method for predicting significant files from within a dataset of interest
CN115718734A (zh) 文档质量确定方法、装置、电子设备以及存储介质
KR20230036221A (ko) 웹서비스를 위한 개인정보 보호 장치 및 방법

Legal Events

Date Code Title Description
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant