KR101783145B1 - System for managing document - Google Patents

System for managing document Download PDF

Info

Publication number
KR101783145B1
KR101783145B1 KR1020160124942A KR20160124942A KR101783145B1 KR 101783145 B1 KR101783145 B1 KR 101783145B1 KR 1020160124942 A KR1020160124942 A KR 1020160124942A KR 20160124942 A KR20160124942 A KR 20160124942A KR 101783145 B1 KR101783145 B1 KR 101783145B1
Authority
KR
South Korea
Prior art keywords
risk
keywords
document
keyword
documents
Prior art date
Application number
KR1020160124942A
Other languages
Korean (ko)
Inventor
윤정훈
Original Assignee
두산중공업 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 두산중공업 주식회사 filed Critical 두산중공업 주식회사
Priority to KR1020160124942A priority Critical patent/KR101783145B1/en
Application granted granted Critical
Publication of KR101783145B1 publication Critical patent/KR101783145B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F17/30716
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F17/30699

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention provides a document management system. A document management system is a document management system for retrieving a risk term in a document. The document management system includes a step of designating a matching unit including a plurality of keywords set in a risk term list; a step of collating the keywords with at least one document for each matching unit; a step of classifying the risk documents matched with the keywords among the documents; a step of emphasizing and displaying risk words matching the keywords among words described in the risk documents; and a step of displaying an alternative phrase set in the risk term list corresponding to the risk words.

Description

문서 관리 시스템{System for managing document}Document management system {System for managing document}

본 발명은 문서 관리 시스템에 관한 것으로, 구체적으로 문서들의 위험 조항을 검색하기 위한 문서 관리 시스템에 관한 것이다.The present invention relates to a document management system, and more particularly, to a document management system for retrieving risk terms of documents.

사용자와 상대방은 특정한 계약 사항에 관하여 합의하기 위해 계약서를 주고 받게 된다. 계약서 내에는 계약의 대상과 더불어 여러가지 법적 의무 사항이 기재될 수 있다. 일반적으로, 사용자는 상대방으로부터 받은 계약서에 위험 조항이 있는지 여부를 일일이 확인하게 된다. 다만, 사람이 많은 양의 계약서를 검토하기엔 많은 시간이 소모되고, 정확성도 떨어지게 된다.The user and the other party will send and receive contracts to agree on specific contractual matters. In the contract, various legal obligations may be listed along with the subject of the contract. Generally, the user will individually check whether there is a risk provision in the contract received from the other party. However, it takes a lot of time for a person to review a large amount of contracts, and accuracy is also reduced.

본 발명의 기술적 과제는 계약서 내에 존재하는 위험 조항을 검색하지 못하는 리스크를 방지할 수 있는 문서 관리 시스템을 제공하는 것이다.A technical problem of the present invention is to provide a document management system capable of preventing a risk of not detecting a dangerous clause existing in a contract.

본 발명은 문서 관리 시스템을 제공한다. 문서 관리 시스템은 문서 내의 위험 조항을 검색하기 위한 문서 관리 시스템으로서, 위험 조항 리스트에 설정된 복수개의 키워드들이 포함되는 매칭 단위를 지정하는 단계, 상기 키워드들과 적어도 하나의 문서를 상기 매칭 단위별로 대조하는 단계, 상기 문서들 중 상기 키워드들과 매칭되는 위험 문서들을 분류하는 단계, 상기 위험 문서들에 기재된 단어 중 상기 키워드들과 매칭되는 위험 단어들을 강조하여 표시하는 단계 및 상기 위험 단어들과 대응되는 상기 위험 조항 리스트에 설정된 대체 문구를 표시하는 단계를 포함한다.The present invention provides a document management system. A document management system for searching a risk term in a document, the document management system comprising a step of designating a matching unit including a plurality of keywords set in a risk item list, a step of collating the at least one document with the matching unit The method according to claim 1, further comprising the steps of: classifying dangerous documents matched with the keywords among the documents; highlighting and displaying dangerous words matching the keywords among words described in the dangerous documents; And displaying an alternative phrase set in the risk term list.

일 예에 의하여, 상기 매칭 단위는 일 문장 단위이고, 상기 위험 문서들을 분류하는 단계는 상기 키워드들이 상기 문서들 각각의 어느 하나의 문장에 모두 포함되는지 여부를 판단하는 것을 포함한다.According to an example, the matching unit is on a one-sentence basis and the step of classifying the risk documents comprises determining whether the keywords are included in any one of the documents.

일 예에 의하여, 상기 매칭 단위는 일 문장 및 상기 일 문장과 인접하는 문장 단위이고, 상기 위험 문서들을 분류하는 단계는 상기 키워드들이 상기 문서들 각각의 어느 하나의 문장과 이에 인접하는 문장들에 모두 포함되는지 여부를 판단하는 것을 포함하고, 상기 인접하는 문장들은 상기 일 문장의 앞과 뒤에 배치되는 문장들이다.According to one example, the matching unit is a sentence unit adjacent to the one sentence and the one sentence, and the step of classifying the dangerous documents includes a step of classifying the keywords into one sentence of each of the documents and adjacent sentences Wherein the neighboring sentences are sentences placed before and after the one sentence.

일 예에 의하여, 상기 매칭 단위는 일 문단 단위이고, 상기 위험 문서들을 분류하는 단계는 상기 키워드들이 상기 문서들 각각의 일 문단에 모두 포함되는지 여부를 판단하는 것을 포함한다.According to an example, the matching unit is a one-paragraph unit, and the step of classifying the risk documents includes determining whether the keywords are all included in one paragraph of each of the documents.

일 예에 의하여, 상기 키워드들은 상기 위험 문서를 분류하는 위험 키워드들 및 안전 키워드들을 포함하고, 상기 위험 키워드들이 포함된 문서는 상기 위험 문서로 분류하고, 상기 안전 키워드들이 포함된 문서는 안전 문서로 분류한다.According to an example, the keywords include risk keywords and safety keywords for classifying the risk document, a document including the risk keywords is classified as the risk document, a document including the safety keywords is a safety document Classify.

일 예에 의하여, 상기 위험 키워드들은 제1 위험 키워드 및 제2 위험 키워드를 포함할 수 있고, 상기 제1 위험 키워드는 장비의 명칭에 관한 키워드이고, 상기 제2 위험 키워드는 상기 장비의 상태에 관한 키워드이다.According to an example, the risk keywords may include a first risk keyword and a second risk keyword, the first risk keyword is a keyword related to a name of the equipment, and the second risk keyword is related to a state of the equipment It is a keyword.

일 예에 의하여, 상기 위험 키워드는 제3 위험 키워드를 더 포함하고, 상기 제3 위험 키워드는 상기 장비의 상태에 관한 정보를 수치화한 키워드이다.According to an example, the risk keyword further includes a third risk keyword, and the third risk keyword is a keyword obtained by digitizing information on the state of the equipment.

일 예에 의하여, 상기 키워드들과 상기 적어도 하나의 문서를 서로 대조하는 단계는 상기 키워드들과 유사한 유사 키워드들까지 상기 적어도 하나의 문서와 대조하는 것을 포함한다.In one example, the step of matching the keywords with the at least one document includes matching to at least one document up to similar keywords similar to the keywords.

일 예에 의하여, 상기 키워드들과 상기 적어도 하나의 문서를 서로 대조하는 단계는 상기 문서의 종류에 따라 상기 키워드들을 조합하는 것을 포함한다.According to an example, the step of collating the keywords with the at least one document includes combining the keywords according to the type of the document.

일 예에 의하여, 상기 위험 단어들을 상기 대체 문구로 변환하는 단계를 더 포함한다.By way of example, the method further comprises converting the risk words into the replacement phrase.

일 예에 의하여, 상기 위험 문서의 내용, 상기 위험 문서에 포함된 상기 위험 단어들 및 상기 대체 문구에 관한 내용을 바탕으로 상기 위험 조항 리스트를 업데이트하는 단계를 더 포함한다.According to an example, the method further includes updating the risk list on the basis of the content of the risk document, the risk words included in the risk document, and the substitute phrase.

일 예에 의하여, 상기 키워드들과 상기 적어도 하나의 문서를 서로 대조하는 단계 전에 상기 문서의 파일 형식을 편집 가능한 파일 형식으로 변환하는 단계를 더 포함한다.In one embodiment, the method further comprises converting the file format of the document into an editable file format prior to collating the keywords with the at least one document.

일 예에 의하여, 상기 위험 단어들을 강조하여 표시하는 단계는 화면을 통해 상기 위험 문서들 각각에 포함된 상기 위험 단어들을 강조하여 표시하고, 상기 위험 단어들을 강조하는 방법은 색상의 변경, 글씨체의 변경, 음영, 밑줄, 굵기의 변경, 기울임 및 크기의 변경을 포함한다.For example, the step of highlighting and displaying the risk words may include highlighting and displaying the risk words included in each of the risk documents through a screen, and the method of highlighting the risk words may include changing a color, , Shading, underlining, changing thickness, tilting, and changing size.

일 예에 의하여, 상기 위험 단어들을 강조하여 표시하는 단계는 상기 키워드들, 상기 키워드들을 포함하는 상기 위험 문서들의 일 부분 및 상기 위험 단어들을 대체할 수 있는 대체 문구를 화면을 통해 표시하는 것을 포함한다.According to an example, the step of highlighting and displaying the danger words includes displaying the keywords, a part of the risk documents including the keywords, and an alternative phrase that can replace the danger words, on the screen .

본 발명의 실시예에 따르면, 계약서 내에 존재하는 위험 조항을 검색하고, 위험 조항을 강조하고 이를 표시하여 계약서의 위험 조항에 따른 리스크를 방지할 수 있다.According to an embodiment of the present invention, it is possible to search for dangerous clauses existing in a contract, to emphasize and mark dangerous clauses, and to prevent risks according to the risk terms of the contract.

본 발명의 실시예에 따르면, 계약서 내의 위험 조항을 자동으로 대체 문구로 변환시킬 수 있다. According to an embodiment of the present invention, the risk terms in the contract can be automatically converted into alternative phrases.

본 발명의 실시예에 따르면, 위험 조항을 검색하고 이를 대체 문구로 변환시키는데 드는 시간을 줄일 수 있고, 위험 조항 검색의 정확성을 향상시킬 수 있다. According to an embodiment of the present invention, it is possible to reduce the time required to search for a dangerous clause and convert it into an alternative phrase, and improve the accuracy of the dangerous clause retrieval.

도 1은 본 발명의 실시예에 따른 문서 관리 시스템을 대략적으로 나타내는 도면이다.
도 2는 본 발명의 실시예에 따른 위험 조항 리스트와 처리 시스템 각각의 구성을 나타내는 도면이다.
도 3은 본 발명의 실시예에 따른 문서 관리 시스템의 검색 결과를 나타내는 도면이다.
도 4는 본 발명의 실시예에 따른 문서 관리 시스템을 순서를 나타내는 순서도이다.
1 is a view schematically showing a document management system according to an embodiment of the present invention.
2 is a diagram showing the configuration of each of the risk item list and the processing system according to the embodiment of the present invention.
3 is a diagram showing search results of a document management system according to an embodiment of the present invention.
4 is a flowchart showing the sequence of a document management system according to an embodiment of the present invention.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예를 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예는 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전문에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.BRIEF DESCRIPTION OF THE DRAWINGS The advantages and features of the present invention, and how to accomplish them, will become apparent by reference to the embodiments described in detail below with reference to the accompanying drawings. The present invention may, however, be embodied in many different forms and should not be construed as being limited to the embodiments set forth herein. Rather, these embodiments are provided so that this disclosure will be thorough and complete, and will fully convey the concept of the invention to those skilled in the art. Is provided to fully convey the scope of the invention to those skilled in the art, and the invention is only defined by the scope of the claims. Like reference numerals refer to like elements throughout the specification.

또한, 본 명세서에서 기술하는 실시 예들은 본 발명의 이상적인 예시도인 단면도 및/또는 평면도들을 참고하여 설명될 것이다. 도면들에 있어서, 막 및 영역들의 두께는 기술적 내용의 효과적인 설명을 위해 과장된 것이다. 따라서, 제조 기술 및/또는 허용 오차 등에 의해 예시도의 형태가 변형될 수 있다. 따라서, 본 발명의 실시 예들은 도시된 특정 형태로 제한되는 것이 아니라 제조 공정에 따라 생성되는 형태의 변화도 포함되는 것이다. 예를 들면, 직각으로 도시된 식각 영역은 라운드지거나 소정 곡률을 가지는 형태일 수 있다. 따라서, 도면에서 예시된 영역들은 개략적인 속성을 가지며, 도면에서 예시된 영역들의 모양은 소자의 영역의 특정 형태를 예시하기 위한 것이며 발명의 범주를 제한하기 위한 것이 아니다.In addition, the embodiments described herein will be described with reference to cross-sectional views and / or plan views, which are ideal illustrations of the present invention. In the drawings, the thicknesses of the films and regions are exaggerated for an effective description of the technical content. Thus, the shape of the illustrations may be modified by manufacturing techniques and / or tolerances. Therefore, the embodiments of the present invention are not limited to the specific forms shown, but also include changes in the forms that are generated according to the manufacturing process. For example, the etched area shown at right angles may be rounded or may have a shape with a certain curvature. Thus, the regions illustrated in the figures have schematic attributes, and the shapes of the regions illustrated in the figures are intended to illustrate specific types of regions of the elements and are not intended to limit the scope of the invention.

도 1은 본 발명의 실시예에 따른 문서 관리 시스템을 대략적으로 나타내는 도면이고, 도 2는 본 발명의 실시예에 따른 위험 조항 리스트와 처리 시스템 각각의 구성을 나타내는 도면이다.FIG. 1 schematically shows a document management system according to an embodiment of the present invention, and FIG. 2 is a diagram showing the configuration of each of a risk item list and a processing system according to an embodiment of the present invention.

도 1 및 도 2를 참조하면, 문서 관리 시스템(1)은 처리 시스템(100) 및 위험 조항 리스트(200)를 포함할 수 있다. 처리 시스템(100)은 문서(10)에 포함된 위험 조항을 검색하고, 위험 조항을 안전한 문구로 변환시켜 변환된 문서(20)를 생성할 수 있다. 예를 들어, 문서(10)는 계약서와 같은 법률 문서를 포함할 수 있다. 본 발명의 실시예에 따르면, 문서(10)는 복수개로 제공될 수 있고, 처리 시스템(100)은 복수개의 문서들(10)을 일괄적으로 처리할 수 있다. 처리 시스템(100)은 위험 조항 리스트(200)에 저장된 기존의 계약서들에 관한 내용을 토대로 문서(10) 내의 위험 조항을 검색할 수 있다. Referring to Figures 1 and 2, the document management system 1 may include a processing system 100 and a risk term list 200. The processing system 100 may retrieve the risk terms contained in the document 10 and convert the risk terms into secure phrases to generate the converted document 20. [ For example, the document 10 may include legal documents such as a contract. According to an embodiment of the present invention, the document 10 may be provided in a plurality, and the processing system 100 may process the plurality of documents 10 collectively. The processing system 100 may retrieve the risk terms in the document 10 based on the content of the existing contracts stored in the risk terms list 200. [

위험 조항 리스트(200)는 기존의 복수의 계약서들에 대한 내용을 정리한 것으로, 데이터 베이스화 된 것일 수 있다. 위험 조항 리스트(200)는 문서 내용 데이터 베이스(210), 키워드 데이터 베이스(230) 및 대체 문구 데이터 베이스(250)를 포함할 수 있다. 문서 내용 데이터 베이스(210)는 기존의 계약서들의 제목, 내용, 계약서들에 포함된 위험 조항 및 위험 조항에 따른 조치 등에 대한 내용을 저장할 수 있다. 키워드 데이터 베이스(230)는 위험 조항을 구성하는 키워드들을 정리하여 저장할 수 있다. 대체 문구 데이터 베이스(250)는 키워드들이 포함된 위험 조항을 대체할 수 있는 대체 문구들을 저장할 수 있다. 위험 조항은 키워드들의 조합에 따라 다양하게 형성될 수 있고, 대체 문구들은 복수개의 위험 조항들과 대응될 수 있다. The risk term list 200 is a summary of a plurality of existing contracts, and may be a database. The risk term list 200 may include a document content database 210, a keyword database 230, and an alternate phrase database 250. The document content database 210 may store information on the subject matter of the existing contracts, the contents of the existing contracts, the risk terms included in the contracts, and the actions according to the risk terms. The keyword database 230 may organize and store the keywords constituting the risk terms. The alternate phrase database 250 may store alternative phrases that may replace the risk terms that the keywords contain. The risk terms can be variously formed according to the combination of the keywords, and the alternative phrases can correspond to a plurality of risk terms.

처리 시스템(100)은 파일 형식 변환부(110), 키워드 구성부(130), 표시부(150) 및 변환부(170)를 포함할 수 있다. 파일 형식 변환부(110)는 문서(10)를 디지털화 할 수 있다. 일 예로, 파일 형식 변환부(110)는 문서(10)의 파일 형식을 편집이 가능한 파일 형식으로 변환할 수 있다. 예를 들어, 문서(10)가 PDF 파일인 경우, 파일 형식 변환부(110)는 문서(10)의 파일 형식을 워드 파일로 변환시킬 수 있다. The processing system 100 may include a file format conversion unit 110, a keyword configuration unit 130, a display unit 150, and a conversion unit 170. The file format conversion unit 110 can digitize the document 10. For example, the file format conversion unit 110 may convert the file format of the document 10 into a file format that can be edited. For example, when the document 10 is a PDF file, the file format conversion unit 110 can convert the file format of the document 10 into a word file.

키워드 구성부(130)는 문서(10) 내의 위험 조항을 검색하기 위한 키워드들을 구성할 수 있고, 키워드들과 문서(10)를 서로 대조할 수 있다. 문서(10)의 성격 및 종류에 따라 키워드들은 달리 설정될 수 있고, 키워드 구성부(130)는 문서(10)의 성격과 종류에 따라 키워드들을 달리 조합할 수 있다. 키워드들은 위험 키워드 및 안전 키워드를 포함할 수 있다. 일 예로, 위험 키워드 및 안전 키워드는 적어도 하나 이상일 수 있 수 있다. 이 때, 위험 키워드는 문서(10) 내에 존재하면 위험 조항이 될 염려가 있는 단어일 수 있고, 문서(10) 내의 단어 중 위험 키워드와 매칭되는 단어는 위험 단어로 정의될 수 있다. 안전 키워드는 문서(10) 내에 존재하면 위험 조항이 될 염려가 없는 단어일 수 있다. The keyword constructing unit 130 may construct keywords for searching for a risk term in the document 10 and may collate the keywords and the document 10. [ Keywords may be set differently depending on the nature and type of the document 10, and the keyword constructing unit 130 may combine keywords differently according to the nature and the type of the document 10. The keywords may include risk keywords and safety keywords. As an example, the risk keyword and the safety keyword may be at least one or more. At this time, the dangerous keyword may be a word that may be a dangerous item if it exists in the document 10, and a word matching the dangerous keyword in the document 10 may be defined as a dangerous word. The safety keyword may be a word that does not become a danger clause if it is present in the document (10).

위험 키워드는 제1 키워드, 제2 키워드 및 제3 키워드를 포함할 수 있다. 제1 키워드는 장비의 명칭에 관한 키워드일 수 있다. 예를 들어, 장비는 터빈, 복수 펌프 및 냉각기 등을 포함하는 발전기 자재를 포함하는 개념일 수 있다. 제2 키워드는 장비의 상태에 관한 키워드일 수 있다. 예를 들어, 장비의 상태는 진동, 파손, 누수 및 파단 등을 포함하는 개념일 수 있다. 제3 키워드는 장비의 상태를 수치로 보여주는 개념일 수 있다. 예를 들어, 제3 키워드는 장비의 진동의 수치 및 누수의 정도 등을 수치로 나타낼 수 있다. The risk keyword may include a first keyword, a second keyword, and a third keyword. The first keyword may be a keyword related to the name of the equipment. For example, the equipment may be a concept that includes generator materials including turbines, multiple pumps, coolers, and the like. The second keyword may be a keyword related to the state of the equipment. For example, the state of the equipment may be a concept including vibration, breakage, leakage and breakage. The third keyword may be a concept that shows the state of the equipment numerically. For example, the third keyword can represent the numerical value of vibration of the equipment and the degree of leakage.

다른 예로, 키워드 구성부(130)는 키워드들과 유사한 유사 키워드들까지 문서(10)의 일 부분과 대조할 수 있다. 유사 키워드란 키워드와 의미가 동일하지만 철자가 서로 다른 단어를 의미할 수 있다. 예를 들어, 터빈의 유사 키워드는 발전기, 엔진 및 제너레이터 등을 포함할 수 있다. 키워드 구성부(130)는 키워드들과 유사 키워드들을 모두 이용하여 문서(10) 내의 위험 조항을 검색할 수 있다. 따라서, 위험 조항 검색의 신뢰도가 향상될 수 있다.In another example, the keyword constructor 130 may match up a portion of the document 10 with similar keywords similar to the keywords. A similar keyword can mean a word with the same meaning but different spelling. For example, a similar keyword of a turbine may include a generator, an engine, a generator, and the like. The keyword constructing unit 130 may search for the risk terms in the document 10 using both keywords and similar keywords. Therefore, the reliability of the search for dangerous articles can be improved.

키워드 구성부(130)는 문서(10)의 일 부분에 안전 키워드들이 모두 포함된 경우 문서(10)를 위험 조항이 없는 안전한 문서로 판단할 수 있다. 이 때, 일 부분은 매칭 단위라고 정의한다. 또한, 키워드 구성부(130)는 매칭 단위에 위험 키워드들이 모두 포함된 경우 문서(10)를 위험 문서로 판단할 수 있다. 매칭 단위는 일 문장, 일 문장과 인접하는 문장들 및 일 문단을 포함할 수 있다. 인접하는 문장들은 일 문장의 앞과 뒤에 배치되는 문장을 포괄하는 의미일 수 있다.  The keyword constructing unit 130 may determine that the document 10 is a safe document without any dangerous condition if all the safety keywords are included in a part of the document 10. [ In this case, one part is defined as a matching unit. Also, the keyword constructing unit 130 may determine the document 10 as a dangerous document when all of the risk keywords are included in the matching unit. The matching unit may include one sentence, one sentence, adjacent sentences, and one paragraph. Adjacent sentences may be meant to encompass sentences placed before and after a sentence.

표시부(150)는 문서(10)의 매칭 단위에 위험 키워드들이 모두 포함된 경우 위험 키워드들과 매칭되는 위험 단어들을 강조하여 표시할 수 있다. 또한, 위험 단어들을 포함하는 위험 조항을 표시하고, 위험 조항을 대체할 수 있는 대체 문구를 표시할 수 있다. 위험 단어들을 강조하는 방법은 색상의 변경, 글씨체의 변경, 음영, 밑줄, 굵기의 변경, 기울임 및 크기의 변경을 포함할 수 있다. 다만, 위험 단어들을 강조하는 방법은 상기 방법에 한정되지 않고, 문서(10) 내의 다른 단어들과 구별할 수 있는 방법은 모두 포함할 수 있다. 표시부(150)는 문서(10)를 검토하는 사용자가 위험 단어들, 위험 조항 및 대체 문구를 확인할 수 있도록 화면을 통해 위험 단어들을 표시할 수 있다. The display unit 150 can highlight and display danger words matching with the dangerous keywords when all the dangerous keywords are included in the matching unit of the document 10. [ It may also indicate a hazard statement containing risk words and an alternative statement that may replace the hazard statement. How to emphasize dangerous words can include changing colors, changing fonts, shading, underlining, changing thickness, tilting, and changing size. However, the method of emphasizing the dangerous words is not limited to the above method, and may include any method capable of distinguishing from other words in the document 10. [ The display unit 150 may display the danger words on the screen so that the user who reviews the document 10 can check the danger words, the danger terms and the replacement phrases.

변환부(170)는 위험 단어들이 포함된 위험 조항을 대체 문구로 변환시킬 수 있다. 변환부(170)는 위험 조항 리스트(200)의 대체 문구 데이터 베이스(230)에 저장된 대체 문구를 바탕으로 위험 조항을 대체 문구로 변화시켜 변환된 문서(20)를 생성할 수 있다. 사용자는 변환된 문서(20)를 계약의 상대방에게 송부하여 기존의 문서(10)에 위험 조항이 있음을 알릴 수 있다. 또한, 변환부(170)는 변환된 문서(20)를 바탕으로 위험 조항 리스트(200)를 업데이트할 수 있다. 이 때, 변환된 문서(20)의 제목, 내용, 위험 조항 및 변경된 문구(즉, 대체 문구) 등이 위험 조항 리스트(200)에 업데이트될 수 있다.The conversion unit 170 may convert the risk terms including the danger words into an alternative phrase. The conversion unit 170 may generate the converted document 20 by changing the risk terms into an alternative phrase based on the substitute phrase stored in the substitute phrase database 230 of the risk terms list 200. [ The user can send the converted document 20 to the other party of the contract to notify the existing document 10 that there is a risk provision. In addition, the conversion unit 170 can update the risk item list 200 based on the converted document 20. At this time, the title, contents, risk terms, and altered text (i.e., substitute text) of the converted document 20 may be updated in the risk terms list 200.

본 발명의 실시예에 따르면, 사용자는 위험 조항 리스트(200) 내에 저장된 위험 키워드와 안전 키워드를 통해 문서(10) 내의 위험 조항을 검색할 수 있다. 이를 통해, 사용자가 직접 문서(10) 내에 위험 조항이 있는지 확인하는 작업을 생략할 수 있어 시간이 절약될 수 있고, 위험 조항 검색의 신뢰도를 향상시킬 수 있다. According to an embodiment of the present invention, the user can retrieve the risk terms in the document 10 via the risk keywords stored in the risk terms list 200 and the safety keywords. In this way, the user can omit the task of confirming whether there is a risk item in the document 10 directly, which saves time and improves the reliability of the risk item search.

도 3은 본 발명의 실시예에 따른 문서 관리 시스템의 검색 결과를 나타내는 도면이다. 본 실시예에서는 문서는 위험 조항을 검색하려는 대상일 수 있고, 계약서는 위험 조항 리스트에 저장된 문서를 의미할 수 있다. 3 is a diagram showing search results of a document management system according to an embodiment of the present invention. In this embodiment, the document may be an object for which a risk clause is searched, and the contract may mean a document stored in a risk clause list.

도 2 및 도 3을 참조하면, 표시부(150)는 화면(155)을 통해 위험 조항을 검색한 결과를 표시할 수 있다. 화면(155)에는 위험 조항 검색을 위한 키워드들, 키워드들이 포함된 문서의 일부분(예: 검색 문구), 위험 조항 리스트에 존재하고 키워드들과 매칭되는 계약서의 제목과 내용 및 위험 조항을 대체하는 대체 문구가 표시될 수 있다. 다만, 화면(155)에 표시되는 검색 결과는 특별한 한정이 없을 수 있다. Referring to FIGS. 2 and 3, the display unit 150 may display a result of searching for a dangerous item through the screen 155. The screen 155 includes keywords for searching for a risk term, a portion of the document containing the keywords (e.g., a search phrase), a title and content of a contract that exists in the risk terms list and matches the keywords, The phrase may be displayed. However, the search result displayed on the screen 155 may have no particular limitation.

사용자는 화면(155)을 통해 문서 내에 존재하는 위험 조항을 한눈에 파악할 수 있고, 위험 조항을 대체하는 대체 문구로 함께 파악할 수 있다. 사용자는 위험 키워드들과 대응되는 대체 문구로 문서를 수정할 수 있다.The user can grasp the risk terms existing in the document at a glance through the screen 155 and grasp it together as an alternative phrase to replace the risk terms. The user can modify the document with an alternative phrase corresponding to the dangerous keywords.

도 4는 본 발명의 실시예에 따른 문서 관리 시스템을 순서를 나타내는 순서도이다. 도 4에서는 제1 키워드는 위험 키워드를 의미하고, 제2 키워드는 안전 키워드를 의미한다. 계약서는 앞선 도면에서 설명한 문서를 의미한다.4 is a flowchart showing the sequence of a document management system according to an embodiment of the present invention. In FIG. 4, the first keyword indicates a danger keyword, and the second keyword indicates a safety keyword. The contract means the document described in the preceding figure.

도 4를 참조하면, 데이터 베이스에 저장된 복수개의 제1 키워드들과 제2 키워드들로 계약서에 위험 조항이 있는지 검색할 수 있다. 제1 키워드들은 위험 문서로 판단하기 위한 단어들이고, 제2 키워드들은 안전 문서로 판단하기 위한 단어들일 수 있다. Referring to FIG. 4, a plurality of first keywords and second keywords stored in a database may be used to search for a risk term in a contract. The first keywords are words for judging as a dangerous document, and the second keywords may be words for judging as a safety document.

디지털로 변환된 계약서를 위험 조항 리스트와 대조하기 위하여 매칭 단위를 설정할 수 있다. 매칭 단위는 위험 조항 리스트에 입력된 키워드들 중 분석하려는 계약서에 적용되는 키워드들이 모두 포함되는 단위를 의미할 수 있다. 예를 들어, 매칭 단위는 계약서 내의 일 문장, 일 문장과 인접하는 문장들 및 일 문단을 의미할 수 있다(S10). 매칭 단위를 설정한 후, 제1 키워드들 및 제2 키워드들과 적어도 하나 이상의 계약서를 서로 대조할 수 있다(S20). 계약서들 중 매칭 단위별로 제2 키워드들이 모두 포함되는지 여부를 판단할 수 있다. 설정된 매칭 단위와 제2 키워드들을 대조한 결과 제2 키워드들이 모두 포함되는 경우, 당해 계약서는 안전 문서로 분류될 수 있다. 따라서, 당해 계약서 내에 제1 키워드들이 포함되는지 여부를 판단하지 않을 수 있다(S35). 매칭 단위에 제2 키워드들이 모두 포함되지 않는 경우, 계약서의 매칭 단위별로 제1 키워드들이 모두 포함되는지 여부를 판단할 수 있다. 일 예로, 계약서의 매칭 단위에 제1 키워드들이 모두 포함되지 않는 경우, 당해 계약서는 안전 문서로 분류될 수 있다. 다른 예로, 계약서 내의 어느 일 문장에 제1 키워드들이 모두 포함되는 경우, 당해 계약서는 위험 문서로 분류될 수 있다(S45). 위험 문서로 분류된 계약서에 포함된 제1 키워드들은 위험 단어들로 정의될 수 있다. 위험 단어들은 다른 단어들에 비해 강조될 수 있고, 강조된 위험 단어들은 화면을 통해 표시될 수 있다(S50). 위험 단어들이 포함된 문장은 위험 조항일 수 있고, 위험 조항은 대체 문구로 변환될 수 있다. 이 때, 위험 단어들은 자동적으로 대체 문구로 변환되거나 사용자가 대체 문구 중 적절한 문구로 위험 단어들을 수정할 수 있다. 이를 통해, 위험 조항을 포함하던 계약서는 안전한 문서로 바뀔 수 있다(S60).A matching unit can be set up to compare the contract converted to digital with the list of risk terms. The matching unit may refer to a unit of a keyword included in the risk list including all the keywords applied to the contract to be analyzed. For example, the matching unit may refer to a sentence in a contract, a sentence adjacent to a sentence, and a paragraph (S10). After setting the matching unit, the first and second keywords may be collated with at least one contract (S20). It can be determined whether or not all the second keywords are included in the matching units by matching units. When all of the second keywords are included as a result of collating the set matching unit with the second keywords, the contract may be classified as a safety document. Therefore, it may not be determined whether the first keywords are included in the contract (S35). If all of the second keywords are not included in the matching unit, it may be determined whether all the first keywords are included in the matching unit of the contract. For example, if all the first keywords are not included in the matching unit of the contract, the contract may be classified as a safety document. As another example, if all the first keywords are included in a sentence in the contract, the contract can be classified as a dangerous document (S45). The first keywords included in the contract classified as a dangerous document may be defined as dangerous words. The risk words can be emphasized relative to other words, and the emphasized risk words can be displayed on the screen (S50). A sentence containing danger words can be a danger clause, and a danger clause can be translated into an alternative phrase. At this time, the danger words are automatically converted into an alternative phrase or the user can modify the danger words with the appropriate phrase of the alternative phrase. Through this, the contract containing the risk terms can be converted into a secure document (S60).

이상, 첨부된 도면들을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. While the present invention has been described in connection with what is presently considered to be practical exemplary embodiments, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, It will be understood. It is therefore to be understood that the above-described embodiments are illustrative in all aspects and not restrictive.

Claims (14)

문서 내의 위험 조항을 검색하기 위한 문서 관리 시스템으로서,
위험 조항 리스트에 설정된 복수개의 키워드들이 포함되는 매칭 단위를 지정하는 단계;
상기 키워드들과 적어도 하나의 문서를 상기 매칭 단위별로 대조하는 단계;
상기 문서들 중 상기 키워드들과 매칭되는 위험 문서들을 분류하는 단계;
상기 위험 문서들에 기재된 단어 중 상기 키워드들과 매칭되는 위험 단어들을 강조하여 표시하는 단계; 및
상기 위험 단어들과 대응되는 상기 위험 조항 리스트에 설정된 대체 문구를 표시하는 단계;
를 포함하는 문서 관리 시스템.
A document management system for retrieving a risk term in a document,
Designating a matching unit including a plurality of keywords set in the risk term list;
Collating the keywords and at least one document for each matching unit;
Classifying the risk documents matched with the keywords among the documents;
Highlighting and displaying danger words matching the keywords among the words listed in the risk documents; And
Displaying an alternative phrase set in the risk terms list corresponding to the risk words;
The document management system comprising:
제 1 항에 있어서,
상기 매칭 단위는 일 문장 단위이고,
상기 위험 문서들을 분류하는 단계는:
상기 키워드들이 상기 문서들 각각의 어느 하나의 문장에 모두 포함되는지 여부를 판단하는 것을 포함하는 문서 관리 시스템.
The method according to claim 1,
Wherein the matching unit is one sentence unit,
Classifying the risk documents comprises:
And determining whether the keywords are included in any one of the sentences of each of the documents.
제 1 항에 있어서,
상기 매칭 단위는 일 문장 및 상기 일 문장과 인접하는 문장 단위이고,
상기 위험 문서들을 분류하는 단계는:
상기 키워드들이 상기 문서들 각각의 어느 하나의 문장과 이에 인접하는 문장들에 모두 포함되는지 여부를 판단하는 것을 포함하고,
상기 인접하는 문장들은 상기 일 문장의 앞과 뒤에 배치되는 문장들인 문서 관리 시스템.
The method according to claim 1,
Wherein the matching unit is a sentence unit adjacent to the one sentence and the one sentence,
Classifying the risk documents comprises:
Determining whether the keywords are included in both a sentence and adjacent sentences of each of the documents,
Wherein the adjacent sentences are sentences placed before and after the one sentence.
제 1 항에 있어서,
상기 매칭 단위는 일 문단 단위이고,
상기 위험 문서들을 분류하는 단계는:
상기 키워드들이 상기 문서들 각각의 일 문단에 모두 포함되는지 여부를 판단하는 것을 포함하는 문서 관리 시스템.
The method according to claim 1,
The matching unit is a unit of paragraph,
Classifying the risk documents comprises:
And determining whether the keywords are all contained in one paragraph of each of the documents.
제 1 항에 있어서,
상기 키워드들은 상기 위험 문서를 분류하는 위험 키워드들 및 안전 키워드들을 포함하고,
상기 위험 키워드들이 포함된 문서는 상기 위험 문서로 분류하고,
상기 안전 키워드들이 포함된 문서는 안전 문서로 분류하는 문서 관리 시스템.
The method according to claim 1,
Wherein the keywords include risk keywords and safety keywords for classifying the dangerous document,
The document including the risk keywords is classified as the dangerous document,
And classifying the document including the safety keywords into a safety document.
제 5 항에 있어서,
상기 위험 키워드들은 제1 위험 키워드 및 제2 위험 키워드를 포함할 수 있고,
상기 제1 위험 키워드는 장비의 명칭에 관한 키워드이고,
상기 제2 위험 키워드는 상기 장비의 상태에 관한 키워드인 문서 관리 시스템.
6. The method of claim 5,
The risk keywords may include a first risk keyword and a second risk keyword,
The first risk keyword is a keyword related to the name of the equipment,
And the second risk keyword is a keyword related to the state of the equipment.
제 6 항에 있어서,
상기 위험 키워드는 제3 위험 키워드를 더 포함하고,
상기 제3 위험 키워드는 상기 장비의 상태에 관한 정보를 수치화한 키워드인 문서 관리 시스템.
The method according to claim 6,
The risk keyword further includes a third risk keyword,
And the third risk keyword is a keyword obtained by digitizing information on the state of the equipment.
제 1 항에 있어서,
상기 키워드들과 상기 적어도 하나의 문서를 서로 대조하는 단계는:
상기 키워드들과 유사한 유사 키워드들까지 상기 적어도 하나의 문서와 대조하는 것을 포함하는 문서 관리 시스템.
The method according to claim 1,
Wherein the step of collating the keywords with the at least one document comprises:
And comparing the at least one document to similar keywords similar to the keywords.
제 1 항에 있어서,
상기 키워드들과 상기 적어도 하나의 문서를 서로 대조하는 단계는:
상기 문서의 종류에 따라 상기 키워드들을 조합하는 것을 포함하는 문서 관리 시스템.
The method according to claim 1,
Wherein the step of collating the keywords with the at least one document comprises:
And combining the keywords according to the type of the document.
제 1 항에 있어서,
상기 위험 단어들을 상기 대체 문구로 변환하는 단계를 더 포함하는 문서 관리 시스템.
The method according to claim 1,
And translating the risk words into the replacement phrase.
제 10 항에 있어서,
상기 위험 문서의 내용, 상기 위험 문서에 포함된 상기 위험 단어들 및 상기 대체 문구에 관한 내용을 바탕으로 상기 위험 조항 리스트를 업데이트하는 단계를 더 포함하는 문서 관리 시스템.
11. The method of claim 10,
Further comprising: updating the risk list based on the content of the risk document, the risk words included in the risk document, and the content of the substitute phrase.
제 1 항에 있어서,
상기 키워드들과 상기 적어도 하나의 문서를 서로 대조하는 단계 전에,
상기 문서의 파일 형식을 편집 가능한 파일 형식으로 변환하는 단계를 더 포함하는 문서 관리 시스템.
The method according to claim 1,
Before matching the keywords with the at least one document,
And converting the file format of the document into an editable file format.
제 1 항에 있어서,
상기 위험 단어들을 강조하여 표시하는 단계는:
화면을 통해 상기 위험 문서들 각각에 포함된 상기 위험 단어들을 강조하여 표시하고,
상기 위험 단어들을 강조하는 방법은 색상의 변경, 글씨체의 변경, 음영, 밑줄, 굵기의 변경, 기울임 및 크기의 변경을 포함하는 문서 관리 시스템.
The method according to claim 1,
Highlighting and displaying the risk words comprises:
The risk words included in each of the risk documents are highlighted and displayed on the screen,
The method of highlighting the risk words includes color change, font change, shade, underline, change of thickness, tilt, and size change.
제 1 항에 있어서,
상기 위험 단어들을 강조하여 표시하는 단계는:
상기 키워드들, 상기 키워드들을 포함하는 상기 위험 문서들의 일 부분 및 상기 위험 단어들을 대체할 수 있는 대체 문구를 화면을 통해 표시하는 것을 포함하는 문서 관리 시스템.

The method according to claim 1,
Highlighting and displaying the risk words comprises:
Displaying the keywords, a part of the risk documents including the keywords, and an alternative phrase that can replace the risk words, on the screen.

KR1020160124942A 2016-09-28 2016-09-28 System for managing document KR101783145B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160124942A KR101783145B1 (en) 2016-09-28 2016-09-28 System for managing document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160124942A KR101783145B1 (en) 2016-09-28 2016-09-28 System for managing document

Publications (1)

Publication Number Publication Date
KR101783145B1 true KR101783145B1 (en) 2017-09-28

Family

ID=60035890

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160124942A KR101783145B1 (en) 2016-09-28 2016-09-28 System for managing document

Country Status (1)

Country Link
KR (1) KR101783145B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210024365A (en) * 2019-08-23 2021-03-05 주식회사 인텔리콘 연구소 System and method for analysing legal documents based on artificial intelligence

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210024365A (en) * 2019-08-23 2021-03-05 주식회사 인텔리콘 연구소 System and method for analysing legal documents based on artificial intelligence
KR102289935B1 (en) * 2019-08-23 2021-08-17 주식회사 인텔리콘 연구소 System and method for analysing legal documents based on artificial intelligence

Similar Documents

Publication Publication Date Title
US9626358B2 (en) Creating ontologies by analyzing natural language texts
US20160055196A1 (en) Methods and systems for improved document comparison
US20170161255A1 (en) Extracting entities from natural language texts
US8380650B2 (en) Information extraction rule making support system, information extraction rule making support method, and information extraction rule making support program
US9996528B2 (en) Advanced clause groupings detection
US20140304579A1 (en) Understanding Interconnected Documents
CN103324609A (en) Text proofreading apparatus and text proofreading method
RU2010107150A (en) IDENTIFICATION OF SEMANTIC RELATIONS IN INDIRECT SPEECH
US7853595B2 (en) Method and apparatus for creating a tool for generating an index for a document
CN113486158B (en) Case situation comparison-based case retrieval method, device, equipment and storage medium
CN106502991A (en) Publication treating method and apparatus
EP2544100A2 (en) Method and system for making document modules
KR101783145B1 (en) System for managing document
JP2021089668A (en) Information processing apparatus and program
KR101664454B1 (en) Apparatus and method for bulding law ontology
Jurish et al. Querying the Deutsches Textarchiv.
Huynh et al. GATE framework based metadata extraction from scientific papers
US9530070B2 (en) Text parsing in complex graphical images
Junger Automation first–the subject cataloguing policy of the Deutsche Nationalbibliothek
US20090150140A1 (en) Efficient stemming of semitic languages
CN111401047A (en) Method and device for generating dispute focus of legal document and computer equipment
Povlsen et al. Anonymization of court orders
WO2014170965A1 (en) Document processing method, document processing device, and document processing program
US20090037487A1 (en) Prioritizing documents
Nawab et al. Comparing Medline citations using modified N-grams

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant