KR20220005167A - 인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법 및 이를 위한 장치 - Google Patents
인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법 및 이를 위한 장치 Download PDFInfo
- Publication number
- KR20220005167A KR20220005167A KR1020200082645A KR20200082645A KR20220005167A KR 20220005167 A KR20220005167 A KR 20220005167A KR 1020200082645 A KR1020200082645 A KR 1020200082645A KR 20200082645 A KR20200082645 A KR 20200082645A KR 20220005167 A KR20220005167 A KR 20220005167A
- Authority
- KR
- South Korea
- Prior art keywords
- item
- similarity
- document
- comment
- legal
- Prior art date
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 104
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title claims description 35
- 238000000605 extraction Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 27
- 238000010348 incorporation Methods 0.000 description 27
- 238000012552 review Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241001122767 Theaceae Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Technology Law (AREA)
- Library & Information Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
기재된 실시예는 법률 문서를 표준 문서와의 인공지능을 활용한 항목(Term) 매칭을 통해 상기 표준문서의 항목별로 표시한 텀시트(Term Sheet)를 생성하는 단계; 상기 법률 문서와 상기 표준 문서에 대하여 인공지능을 활용하여 상기 항목별 유사도를 산출하는 단계; 상기 항목별 유사도를 기반으로 코멘트 데이터베이스에서 상기 법률 문서에 대한 항목별 코멘트를 생성하는 단계; 및 상기 텀시트, 항목별 유사도, 항목별 코멘트를 포함하는 상기 법률 문서의 분석 결과를 제공하는 단계를 포함하는, 인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법에 관한 것이다.
Description
본 발명은 인공지능을 이용하여 법률 문서를 분석하는 기술에 관한 것이다.
기존의 계약서와 같은 법률 문서를 온라인상으로 체결하는 방법은 계약서를 작성해서 업로드하면, 업로드된 계약서에 계약 양 당사자가 온라인상으로 접근하여 서명하여 체결하는 방식을 취하고 있다.
그러나 이러한 방식은 계약서와 같은 법률 문서가 오프라인상으로 법률 전문가에 의해 이미 검토가 완료되고, 작성이 마쳐진 상태여야 한다.
따라서 온라인상으로 상기 법률 문서의 작성, 검토 및 체결까지 논스톱으로진행하기 위해서는 온라인상으로 법률적 검토 절차가 가능하여야 한다.
현재 법률 문서의 검토는 변호사가 일일이 법률 문서의 내용을 검토하는 방식을 취하고 있으나, 최근의 인공지능 기술을 이용하면 상기 법률 문서의 검토까지도 온라인상에서 가능하게 할 수 있다.
따라서 본 발명에서는 법률 문서의 검토를 표준 문서를 기반으로 하여 인공지능을 활용하여 구현하는 방법을 제안하고자 한다.
본 발명의 목적은 법률 문서의 검토를 인공지능을 활용하여 온라인상에서 구현할 수 있는 방법 및 이를 위한 장치를 제공함에 있다.
또한, 본 발명의 목적은 표준 문서 데이터베이스와 표준 문서 기반 코멘트데이터베이스를 활용하여 법률 문서를 검토함으로써 정확하고도 효율적으로 분석 결과를 제공할 수 있는 방법을 제공함에 있다.
실시예에 따른 인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법은 법률 문서를 표준 문서와의 인공지능을 활용한 항목(Term) 매칭을 통해 상기 표준문서의 항목별로 표시한 텀시트(Term Sheet)를 생성하는 단계; 상기 법률 문서와 상기 표준 문서에 대하여 인공지능을 활용하여 상기 항목별 유사도를 산출하는 단계; 상기 항목별 유사도를 기반으로 코멘트 데이터베이스에서 상기 법률 문서에 대한 항목별 코멘트를 생성하는 단계; 및 상기 텀시트, 항목별 유사도, 항목별 코멘트를 포함하는 상기 법률 문서의 분석 결과를 제공하는 단계를 포함한다.
이 때, 상기 텀시트를 생성하는 단계는 인공지능을 이용하여 상기 법률 문서로부터 메타 데이터(Meta Data)를 추출하는 단계; 상기 메타 데이터를 기반으로 상기 법률 문서의 항목들을 추출하는 단계; 및 상기 법률 문서의 항목들을 상기 표준 문서의 항목들과 매칭하여 상기 법률 문서를 상기 항목별로 일목요연하게 표시한 상기 텀시트를 저장하는 단계를 포함할 수 있다.
이 때, 상기 항목별 유사도를 산출하는 단계는 상기 법률 문서를 상기 표준 문서의 항목에 맞추어 재구조화하여 재구조화된 법률 문서를 생성하는 단계; 및 인공지능을 이용하여 상기 재구조화된 법률 문서와 표준 문서를 항목별로 내용을 비교하여 각 항목에 대응하는 유사도를 판단하는 단계를 포함할 수 있다.
이 때, 상기 각 항목에 대응하는 유사도를 판단하는 단계는 상기 재구조화된 법률 문서의 각 항목에 대하여 항목별 의미방향을 생성하는 단계; 상기 항목별 의미방향을 기반으로 상기 항목별 1차 유사도를 정하는 단계; 및 상기 항목별 1차 유사도를 기반으로 상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 구문비교를 통해 상기 항목별 2차 유사도를 정하는 단계를 포함하고, 상기 항목별 의미 방향은 상기 항목의 주체, 대상, 행위의 관계를 기반으로 결정되는 것일 수 있다.
이 때, 상기 항목별 1차 유사도를 정하는 단계는 상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치한다면, 상기 항목별 1차 유사도를 제1 범위로 정하는 단계; 및 상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치하지 않는다면, 상기 항목별 1차 유사도를 제2 범위로 정하는 단계를 포함할 수 있다.
이 때, 상기 항목별 2차 유사도를 정하는 단계는 상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 일대일 구문 비교를 하는 단계; 및 상기 구문 비교의 결과를 기반으로 상기 항목별 1차 유사도 내에서 상기 항목별 2차 유사도를 정하는 단계를 포함할 수 있다.
이 때, 상기 항목별 코멘트를 생성하는 단계는 상기 항목별 2차 유사도를 기반으로 각 항목에 대응하는 코멘트를 코멘트 데이터베이스에서 검색하는 단계; 및 검색된 상기 각 항목에 대응하는 코멘트를 상기 항목별 코멘트로 저장하는 단계를 포함할 수 있다.
이 때, 상기 항목별 코멘트를 생성하는 단계는 상기 항목별 2차 유사도가 적정점수 이상이면 상기 코멘트 데이터베이스를 검색하는 단계를 생략하는 것일 수 있다.
실시예에 따른 인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치는 법률 문서를 표준 문서와의 인공지능을 활용한 항목(Term) 매칭을 통해 상기 표준 문서의 항목별로 표시한 텀시트(Term Sheet)를 생성하는 텀시트 생성부; 상기 법률 문서와 상기 표준 문서에 대하여 인공지능을 활용하여 상기 항목별 유사도를 산출하는 유사도 산출부; 상기 항목별 유사도를 기반으로 코멘트 데이터베이스에서 상기 법률 문서에 대한 항목별 코멘트를 생성하는 코멘트 생성부; 및 상기 텀시트, 항목별 유사도, 항목별 코멘트를 포함하는 상기 법률 문서의 분석 결과를 제공하는 분석 결과 제공부를 포함한다.
이 때, 상기 텀시트 생성부는 인공지능을 이용하여 상기 법률 문서로부터 메타 데이터(Meta Data)를 추출하는 메타 데이터 추출부; 상기 메타 데이터를 기반으로 상기 법률 문서의 항목들을 추출하는 항목 추출부; 상기 법률 문서의 항목들을 상기 표준 문서의 항목들과 매칭하여 상기 법률 문서를 상기 항목별로 일목요연하게 표시한 상기 텀시트를 저장하는 텀시트 저장부를 포함할 수 있다.
이 때, 상기 유사도 산출부는 상기 법률 문서를 상기 표준 문서의 항목에 맞추어 재구조화하여 재구조화된 법률 문서를 생성하는 법률 문서 재구조화부; 및 인공지능을 이용하여 상기 재구조화된 법률 문서와 상기 표준 문서를 항목별로 내용을 비교하여 각 항목에 대응하는 유사도를 판단하는 유사도 판단부를 포함할 수 있다.
이 때, 상기 유사도 판단부는 상기 재구조화된 법률 문서의 각 항목에 대하여 항목별 의미방향을 생성하는 의미방향 생성부; 상기 항목별 의미방향을 기반으로 상기 항목별 1차 유사도를 정하는 1차 유사도 결정부; 및 상기 항목별 1차 유사도를 기반으로 상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 구문비교를 통해 상기 항목별 2차 유사도를 정하는 2차 유사도 결정부를 포함하고, 상기 항목별 의미 방향은 상기 항목의 주체, 대상, 행위의 관계를 기반으로 결정되는 것일 수 있다.
이 때, 상기 1차 유사도 결정부는 상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치한다면, 상기 항목별 1차 유사도를 제1 범위로 정하고, 상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치하지 않는다면, 상기 항목별 1차 유사도를 제2 범위로 정하는 것일 수 있다.
이 때, 상기 2차 유사도 결정부는 상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 일대일 구문 비교를 하고, 상기 구문 비교의 결과를 기반으로 상기 항목별 1차 유사도 내에서 상기 항목별 2차 유사도를 정하는 것일 수 있다.
이 때, 상기 코멘트 생성부는 상기 항목별 2차 유사도를 기반으로 각 항목에 대응하는 코멘트를 코멘트 데이터베이스에서 검색하는 코멘트 데이터베이스 검색부; 및 검색된 상기 각 항목에 대응하는 코멘트를 상기 항목별 코멘트로 저장하는 항목별 코멘트 저장부를 포함할 수 있다.
본 발명은 법률 문서의 검토를 인공지능을 활용하여 온라인상에서 구현할 수 있는 방법 및 이를 위한 장치를 제공할 수 있다.
또한, 본 발명은 표준 문서 데이터베이스와 표준 문서 기반 코멘트데이터베이스를 활용하여 법률 문서를 검토함으로써 정확하고도 효율적으로 분석 결과를 제공할 수 있는 방법을 제공할 수 있다.
도 1은 실시예에 따른 인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치(100)의 일 예를 나타낸 블록도이다.
도 2는 도 1에 도시된 텀시트 생성부(150)의 일 예를 나타낸 블록도이다.
도 3은 도 1에 도시된 유사도 산출부(160)의 일 예를 나타낸 블록도이다.
도 4는 도 1에 도시된 코멘트 생성부(170)의 일 예를 나타낸 블록도이다.
도 5는 실시예에 따른 인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치(100)의 동작 흐름도를 나타낸 도면이다.
도 6은 도 1에 도시된 텀시트 생성부(150)에서 텀시트가 생성되는 과정의 일 예를 보여주는 도면이다.
도 7은 도 1에 도시된 유사도 산출부(160)에서 유사도가 산출되는 과정의 일 예를 보여주는 도면이다.
도 8은 실시예에 따른 법률 문서 분석 장치에서 법률 문서의 입력 화면의 예를 보여주는 도면이다.
도 9는 실시예에 따른 법률 문서 분석 장치에서 법률 문서의 원문이 제공되는 예를 보여주는 도면이다.
도 10은 도 1에 도시된 분석 결과 제공부(180)에서 제공하는 텀시트의 일 예를 나타낸 도면이다.
도 11은 도 1에 도시된 분석 결과 제공부(180)에서 제공하는 유사도의 일 예를 나타낸 도면이다.
도 12는 도 1에 도시된 분석 결과 제공부(180)에서 제공하는 코멘트의 일 예를 나타낸 도면이다.
도 13은 도 1에 도시된 분석 결과 제공부(180)에서 제공하는 최종 분석결과의 일 예를 나타낸 도면이다.
도 14는 도 1에 도시된 분석 결과 제공부(180)에서 제공하는 최종 분석결과의 다른 예를 나타낸 도면이다.
도 15는 본 발명의 일실시예에 따른 컴퓨터 시스템을 나타낸 도면이다.
도 2는 도 1에 도시된 텀시트 생성부(150)의 일 예를 나타낸 블록도이다.
도 3은 도 1에 도시된 유사도 산출부(160)의 일 예를 나타낸 블록도이다.
도 4는 도 1에 도시된 코멘트 생성부(170)의 일 예를 나타낸 블록도이다.
도 5는 실시예에 따른 인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치(100)의 동작 흐름도를 나타낸 도면이다.
도 6은 도 1에 도시된 텀시트 생성부(150)에서 텀시트가 생성되는 과정의 일 예를 보여주는 도면이다.
도 7은 도 1에 도시된 유사도 산출부(160)에서 유사도가 산출되는 과정의 일 예를 보여주는 도면이다.
도 8은 실시예에 따른 법률 문서 분석 장치에서 법률 문서의 입력 화면의 예를 보여주는 도면이다.
도 9는 실시예에 따른 법률 문서 분석 장치에서 법률 문서의 원문이 제공되는 예를 보여주는 도면이다.
도 10은 도 1에 도시된 분석 결과 제공부(180)에서 제공하는 텀시트의 일 예를 나타낸 도면이다.
도 11은 도 1에 도시된 분석 결과 제공부(180)에서 제공하는 유사도의 일 예를 나타낸 도면이다.
도 12는 도 1에 도시된 분석 결과 제공부(180)에서 제공하는 코멘트의 일 예를 나타낸 도면이다.
도 13은 도 1에 도시된 분석 결과 제공부(180)에서 제공하는 최종 분석결과의 일 예를 나타낸 도면이다.
도 14는 도 1에 도시된 분석 결과 제공부(180)에서 제공하는 최종 분석결과의 다른 예를 나타낸 도면이다.
도 15는 본 발명의 일실시예에 따른 컴퓨터 시스템을 나타낸 도면이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
비록 "제1" 또는 "제2" 등이 다양한 구성요소를 서술하기 위해서 사용되나, 이러한 구성요소는 상기와 같은 용어에 의해 제한되지 않는다. 상기와 같은 용어는 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용될 수 있다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있다.
본 명세서에서 사용된 용어는 실시예를 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 또는 "포함하는(comprising)"은 언급된 구성요소 또는 단계가 하나 이상의 다른 구성요소 또는 단계의 존재 또는 추가를 배제하지 않는다는 의미를 내포한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 해석될 수 있다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
이하에서는, 도 1 내지 도 15를 참조하여 실시예에 따른 인공지능을 이용한표준 문서 기반 법률 문서 분석 방법 및 이를 위한 장치가 상세히 설명된다.
도 1은 실시예에 따른 인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치(100)의 일 예를 나타낸 블록도이다.
도 1을 참조하면, 상기 법률 문서 분석 장치(100)는 법률 문서(110)를 입력으로 받아 분석 결과(120)를 출력한다. 그리고 상기 법률 문서 분석 장치(100)는 입력부(130), 표준 문서 검색부(140), 텀시트 생성부(150), 유사도 산출부(160), 코멘트 생성부(170), 분석 결과 제공부(180), 그리고 표준 문서 데이터베이스(185)와 코멘트 데이터베이스(190)을 포함할 수 있다.
입력부(130)는 사용자로부터 법률 문서를 입력받을 수 있다. 이때, 상기 법률 문서는 사용자가 상기 법률 문서 장치(100)에 법률적인 분석을 의뢰한 것이다. 상기 법률 문서는 회사의 정관, 근로계약서, 용역계약서, 신주인수 계약서, 투자유치 계약서와 같은 계약서를 포함할 수 있다.
만약 입력 받은 상기 법률 문서의 형태가 이미지라면, 상기 입력부(130)는 OCR(Optical Character Recognition, 광학적 문자 판독장치)을 통해 문서 파일 형태의 법률 문서로 변환할 수 있다.
그리고 표준 문서 검색부(140)는 표준 문서 데이터베이스에서 상기 법률 문서와 같은 유형의 표준 문서를 검색할 수 있다. 예를 들어, 입력받은 법률 문서가 근로 계약서라면 근로 계약서의 표준 문서를 상기 표준 문서 데이터베이스(185)에서 검색하여 찾아내는 것이다.
이때, 표준 문서 데이터베이스(185)는 관련 법률에 근거하고 일반적으로 통용되는 회사의 정관, 각종 법률 계약서 등의 표준 법률 문서들을 모아놓은 것이다. 상기 표준 (법률) 문서들은 법률이나 관행 상 꼭 있어야 하는 주요 항목들로 구성된 것으로, 이미 법률 전문가에 의해 법률 검토가 완료된 것일 수 있다. 표준 문서 데이터베이스(185)에 포함되어 있는 표준 문서들의 종류나 수는 사용자나 사용되는 환경에 의해 달라질 수 있다.
텀시트 생성부(150)는 상기 입력부(130)에서 입력받은 법률 문서와 상기 표준 문서 검색부(140)에서 검색하여 획득한 표준 문서를 인공지능을 활용한 항목(Term) 매칭을 통해 상기 법률 문서에 상응하는 텀시트(Term Sheet)를 생성할 수 있다.
텀시트(Term Sheet)는 보통 계약 체결 과정을 신속하게 진행하기 위해 중요 조항, 핵심 조항만을 추려 간략하게 구성한 문서를 말하는데, 본 발명에서는 상기 중요 조항이 표준 문서의 항목들로 선별이 되어 있기 때문에 상기 법률 문서를 상기 표준 문서상의 항목들로 추려 정리한 문서를 말한다. 따라서 사용자는 상기 텀시트를 통해 상기 법률 문서에 꼭 필요한 항목들이 있는지를 확인할 수 있게 된다.
상기 텀시트 생성부(150)는 인공지능을 이용하여 상기 법률 문서로부터 메타 데이터(Meta Data)를 추출하고, 상기 메타 데이터를 기반으로 상기 법률 문서의 항목들을 추출할 수 있다. 그리고 상기 텀시트 생성부(150)는 상기 법률 문서의 항목들을 상기 표준 문서의 항목들과 매칭하여 상기 법률 문서를 상기 항목별로 일목요연하게 표시한 상기 텀시트를 저장할 수 있다.
유사도 산출부(160)는 상기 법률 문서를 상기 표준 문서의 항목에 맞추어 재구조화하여 재구조화된 법률 문서를 생성하고, 인공지능을 이용하여 상기 재구조화된 법률 문서와 표준 문서를 항목별로 내용을 비교하여 각 항목에 대응하는 유사도를 판단할 수 있다.
즉, 상기 유사도 산출부(160)가 딥러닝으로 사전 학습된 모델을 이용하여 분석을 하는데, 인공지능을 이용한 문장 분류(AI Sentence Classification)를 통해 상기 법률 문서를 재구조화하고, 인공지능을 이용한 문장 내용 유사도(AI Sentence Semantic Similarity) 측정을 수행하는 것이다.
이 때, 상기 유사도 산출부(160)가 상기 각 항목에 대응하는 유사도를 판단하기 위하여, 상기 재구조화된 법률 문서의 각 항목에 대하여 항목별 의미방향을 생성하고, 상기 항목별 의미방향을 기반으로 상기 항목별 1차 유사도를 정할 수 있다. 그리고 상기 항목별 1차 유사도를 기반으로 상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 구문비교를 통해 상기 항목별 2차 유사도를 정할 수 있다.
그리고, 상기 유사도 산출부(160)가 상기 항목별 1차 유사도를 정하기 위하여, 상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치한다면, 상기 항목별 1차 유사도를 제1 범위로 정하고, 만약 상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치하지 않는다면, 상기 항목별 1차 유사도를 제2 범위로 정할 수 있다.
여기서 상기 항목별 의미방향은 상기 항목의 주체, 대상, 행위의 관계를 기반으로 결정되는 것일 수 있다. 그리고 상기 항목은 이미 표준 문서의 항목과 매칭되었으므로, 상기 항목의 주체, 대상, 행위는 표준 문서의 항목의 주체, 대상, 행위와 매칭되어 있다고 가정할 수 있다. 예를 들어, '이사는 주주총회에서 선임한다'는 주체는 '주주총회', 대상은 '이사', 행위는 '선임'으로 결정될 수 있다. 따라서 상기 예의 경우, 상기 주체, 대상, 행위의 관계가 '정방향'으로 정해질 수 있다. 만약 '이사는 주주총회에서 선임하지 아니한다'면, 상기 주체, 대상, 행위의 관계가 '반대방향'으로 정해질 수 있다. 또한, '이사는 주주총회외에서 선임한다'의 경우에는 같은 주체, 대상, 행위의 관계에 있어, '반대방향'으로 정해질 수 있는 것이다.
그리고, 상기 유사도 산출부(160)은 상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치한다면, 상기 항목별 유사도의 범위를 제1 범위로 정하고, 상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치하지 않는다면, 상기 항목별 유사도의 범위를 제2 범위로 정할 수 있다. 예를 들어 상기 제1 범위는 90 이상, 제2 범위는 90 미만으로 설정할 수 있다.
즉, 상기 법률 문서의 항목별 의미방향에 따라 유사도의 범위인 1차 유사도가 결정되는 것이다. 그리고 상기 1차 유사도가 정해진 이후에는 구문을 일일이 비교해 상기 1차 유사도내에서 최종 유사도인 2차 유사도가 결정되는 것이다.
상기 유사도 산출부(160)은 상기 항목별 2차 유사도를 정하기 위하여, 상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 일대일 구문 비교를 하고, 상기 구문 비교의 결과를 기반으로 상기 항목별 1차 유사도 내에서 상기 항목별 2차 유사도를 정할 수 있다.
즉, 항목별 의미방향을 기반으로 1차 유사도가 결정되고 나면, 인공지능으로 사전 학습된 모델을 가지고 법률 문서와 표준 문서를 항목별로 구문 비교하여 유사도의 최종값을 구해내는 것이다. 예를 들어, 만약 법률 문서와 표준 문서의 항목이 정확히 일치한다면, 상기 유사도의 최종값, 2차 유사도는 100이 될 수 있는 것이다.
코멘트 생성부(170)는 상기 유사도 산출부(160)에서 생성한 상기 항목별 2차유사도를 기반으로 각 항목에 대응하는 코멘트를 코멘트 데이터베이스(190)에서 검색하고, 검색된 상기 각 항목에 대응하는 코멘트를 상기 항목별 코멘트로 저장할 수 있다.
그리고 상기 코멘트 생성부(170)는 상기 항목별 2차 유사도가 적정 점수 이상이면 상기 코멘트 데이터베이스(190)를 검색하는 단계를 생략할 수 있다. 법률 문서의 분석을 하는 이유가 상기 법률 문서가 법령등에 위배되어 무효여서 수정이 요구되는 조항이 있는지 확인하려는 것이므로, 표준 문서와 같이 잘 작성되어 있는 항목에 대해서는 굳이 코멘트를 생성할 필요가 없기 때문이다. 따라서 상기 2차 유사도가 100점 만점에 99점 이상이라고 하면, 코멘트의 검색을 생략하고, 상기 유사도만을 출력할 수 있는 것이다.
그리고 상기 코멘트 데이터베이스(190)는 표준 문서의 각 항목에 대응하는 사전 정의된 변호사의 코멘트들을 모아놓은 것일 수 있다. 일반적으로 변호사와 같은 법률전문가는 FIRAC (Facts, Issue, Rule, Analysis, Conclusion)기반으로 코멘트를 작성한다. 여기서, FIRAC란 법률적 문제 해결에 있어, 사실관계(Facts)와 쟁점(Issue)을 파악하고, 법령(Rule)을 찾아 분석(Analysis)하고, 이에 따라 결론(Conclusion)을 내리는 것을 말한다. 따라서 상기 코멘트 데이터베이스(190)는 사전에 변호사에 의해 FIRAC 기반으로 작성된 코멘트들의 집합인 것이다.
상기 코멘트 생성부(170)는 인공지능을 이용하여 표준 문서의 항목별 사전 정의 질의를 기반으로 법률 문서의 항목별 코멘트를 생성할 수 있다. 그리고 상기 항목별 사전 정의 질의는 2개 이상의 계층으로 구성되어 있을 수 있다. 즉, 상기 항목별 사전 정의 질의가 첫번째 질의에 대한 답에 따라 두번째 질의가 결정되고, 두번째 질의에 대한 답에 따라 다시 세번째 질의가 결정되는 식으로 계층을 형성할 수 있는 것이다.
상기 코멘트 생성부(170)는 상기 사전 정의 질의에 대한 답을 기반으로 코멘트 데이터베이스로부터 상기 항목에 대한 1차 코멘트를 검색할 수 있다.
그러나, 상기 코멘트 데이터베이스의 불완전성에 의해 상기 1차 코멘트를 검색하지 못할 수도 있으므로, 다른 방법으로 코멘트를 생성하는 방법이 필요하다. 이때 상기 코멘트 생성부(170)는 인공지능을 이용하여 상기 항목과 답에 상응하는 관련 법률 조항을 검색하고, 상기 관련 법률 조항을 기반으로 2차 코멘트를 생성할 수 있다.
그리고, 상기 코멘트 생성부(170)는 상기 1차 코멘트 및 상기 2차 코멘트를 기반으로 항목별 코멘트를 생성, 저장할 수 있다. 그러나, 상기 1차 코멘트가 검색되면, 상기 관련 법률 조항 검색 및 2차 코멘트 생성의 동작을 생략할 수도 있다.
마지막으로 분석 결과 제공부(180)는 상기 텀시트 생성부(150)에서 생성한 텀시트와 상기 유사도 산출부(160)에서 산출한 항목별 유사도, 상기 코멘트 생성부(170)에서 생성한 코멘트를 포함하는 분석 결과를 사용자에게 제공할 수 있다.
상기 분석 결과 제공부(180)는 상기 텀시트, 유사도, 코멘트를 시각화한 인터페이스로 제공할 수 있다. 즉, 법률 문서를 기설정된 항목 별로 일목요연하게 정리한 텀시트를 포함하는 제1 인터페이스를 제공하고, 상기 텀시트의 항목별 또는 상기 법률 문서의 조항별 표준 문서와의 유사도 및 코멘트를 포함하는 제2 인터페이스를 제공할 수 있다.
상기 텀시트는 상기 기설정된 항목에 상응하는 상기 법률 문서의 항목을 항목명과 함께 표시하고, 상기 기설정된 항목별로 구분하여 표시할 수 있다. 그리고 상기 기설정된 항목은 상기 표준 문서의 항목들 중 적어도 일부를 포함하는 것일 수 있다.
예를 들어, '회사명 XX, 회사 사업 목적 YY, 회사 발행 주식 총수는 100주로 한다, 스톡옵션은 발행 주식 총수의 10%로 한다'는 내용의 회사의 정관이 있다고 하자. 그리고, 표준 정관의 경우, 기설정된 항목은 ① 회사명, ② 회사 사업 목적, ③ 회사 발행 주식 총수, ④ 스톡옵션 도입여부, ⑤ 전환사채 발행여부의 5개 항목이라고 가정하자. 그렇다면, 상기 정관의 텀시트는 '회사명 XX', '회사 사업 목적 YY', '회사 발행 주식 총수 100주', '스톡옵션 도입여부 O','전환사채 발행여부 X'으로 표시되어 각 항목별로 구분되어 표시될 수 있다.
그리고 유사도 및 코멘트를 포함하는 제2 인터페이스는 좌측부터 차례대로 목차, 상기 법률 문서 원문, 상기 법률 문서의 분석 결과로 구분되어 구성될 수 있다. 상기 목차는 상기 법률 문서의 항목 또는 조항을 포함하고, 상기 목차의 항목을 선택하면, 상기 법률 문서 원문에서 상기 목차의 항목에 상응하는 상기 법률 문서의 항목이 스크롤(Scroll)되어 정면에 표시될 수 있다.
예를 들어, 상기 목차는 왼쪽에 위치하여 '제목, 서무, 제 1조, 제 2조, 제 3조' 등으로 위에서부터 차례대로 디스플레이될 수 있다. 그리고 상기 목차의 '제 2조' 부분을 선택하여 누르게 되면 화면 중앙의 법률 문서 원문에서 상기 법률 문서의 제 2조 부분이 자동으로 스크롤되어 화면 가운데로 디스플레이 되고 색이 다르게 표시될 수 있다.
또한, 화면의 우측에는 상기 법률 문서의 분석 결과가 디스플레이될 수 있는데, 상기 분석 결과는 유사도 탭과 코멘트 탭을 포함할 수 있다. 그리고 상기 유사도 탭은 상기 법률 문서의 상기 표준 문서와의 각 항목별 유사도를 표시하고, 상기 코멘트 탭은 상기 각 항목별 유사도를 기반으로 생성된 항목별 코멘트를 표시하는 것일 수 있다. 그리고 상기 유사도 탭과 코멘트 탭의 이름은 다르게 정할 수도 있다.
예를 들어, 상기 목차의 '제 2조'가 선택되고, 유사도 탭을 누르면 상기 목차의 '제 2조'의 유사도가 화면의 우측에 'SCORE 50' 과 같이 표시될 수 있다. 그리고 코멘트 탭을 누르면 상기 목차의 '제 2조'의 코멘트는 화면의 우측에 '상법 제 382조에 의해 무효입니다'와 같이 표시될 수 있다.
또한, 상기 제2 인터페이스는 좀 더 완성된 형태의 최종 분석 결과를 디스플레이할 수 있다. 즉, 제2 인터페이스는 최종 분석 결과를 제공하는 최종 분석 버튼을 더 포함하고, 상기 최종 분석 결과는 상기 법률 문서의 항목과 상기 항목에 상응하는 코멘트를 함께 표시하고, 상기 코멘트는 상기 항목의 유사도에 따라 낮은 점수부터 차례로 경고, 주의, 양호의 세 단계로 표시하고, 상기 세 단계의 코멘트를 색으로 구분하여 표시하는 것일 수 있다.
예를 들어, 상기 최종 분석 버튼은 팝업창의 형태로, '최종 분석이 완료되었습니다. [최종분석 보기]'와 같이 표시될 수 있다. 그리고 상기 버튼을 누르면 상기 최종 분석 결과가 나오는데, 상기 최종 분석 결과는 상기 법률 문서의 항목과 상기 항목에 대한 코멘트가 함께 표시되어 있고, 유사도도 표시되는 데, 이때 유사도의 범위에 따라 경고, 주의, 양호의 단계로 나누어 표시할 수 있는 것이다. 경고, 주의, 양호를 빨강, 노랑, 초록으로 표시하여 법률 문서의 각 항목 또는 조항에 대한 분석 결과를 한눈에 알아볼 수 있게 할 수 있다.
또한, 상기 최종 분석 결과는 계층 구조 버전의 항목들로 표시될 수도 있다. 즉, 사전 정의 질의가 계층 구조로 되어 있다면, 상기 법률 문서를 계층 구조의 상기 사전 정의 질의에 대한 답에 기반하여 계층 구조로 표시하는 것이다.
예를 들어, 첫번째 층(줄)에는'주식', 두번째 층(줄)에는 '상환 주식','전환 주식'이라는 항목 들이 연결되어 표시되고, 세번째 층(줄)에는 상기 '상환 주식'항목과 연결되어 '전환 기간 신주 발행 익일부터 10년내 범위에서 이사회결정'과 '전환가액 전환전 우선주식의 총발행가액과 전환후 보통주식 발행가액 총액 동일'등의 항목들이 계층 구조로 표시되는 것이다.
도 2는 도 1에 도시된 텀시트 생성부(150)의 일 예를 나타낸 블록도이다.
도 2를 참조하면, 상기 텀시트 생성부(150)는 법률 문서(210)를 입력으로 받아, 텀시트(250)을 출력할 수 있다. 그리고 상기 텀시트 생성부(150)는 메타 데이터 추출부(210), 항목 추출부(220), 텀시트 저장부(230)를 포함할 수 있다.
상기 메타 데이터 추출부(210)는 인공지능을 이용하여 상기 법률 문서로부터 메타 데이터(Meta Data)를 추출하고, 상기 항목 추출부(220)는 상기 메타 데이터를 기반으로 상기 법률 문서의 항목들을 추출할 수 있다. 그리고 상기 텀시트 저장부(230)는 상기 법률 문서의 항목들을 상기 표준 문서의 항목들과 매칭하여 상기 법률 문서를 상기 항목별로 일목요연하게 표시한 상기 텀시트를 저장할 수 있다.
여기서, 메타 데이터란 속성 정보라고도 하는데, 데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해주는 데이터이다. 즉, 메타 데이터는 데이터를 위한 데이터로, 구조화된 정보를 분석/분류하고, 부가 정보를 추가하기 위해 데이터에 따라가는 정보를 말하고, 결과적으로 정보를 자산으로 만들어주는 역할을 한다. 따라서 메타 데이터가 추출되고 나면 상기 메타 데이터를 기반으로 효율적으로 데이터를 검색, 해석할 수 있게 된다.
따라서 상기 메타 데이터 추출부(210)는 PyTorch와 같은 딥러닝으로 학습된 모델을 이용하여 사전 처리된 법률 문서로부터 메타 데이터를 추출하는 것이다.
이후, 항목 추출부(230)는 상기 메타 데이터를 기반으로 상기 법률 문서의 항목들을 추출할 수있다. 상기 항목들이 추출되어야 표준 문서의 항목들과의 매칭이 가능하게 된다.
이후, 텀시트 저장부(240)는 상기 항목 추출부(230)에서 추출된 항목과 표준 문서의 항목들을 일대일 매칭하여, 상기 표준 문서의 항목별로 상기 법률문서의 내용을 일목요연하게 정리한 후 텀시트로 저장할 수 있다.
도 3은 도 1에 도시된 유사도 산출부(160)의 일 예를 나타낸 블록도이다.
도 3을 참조하면, 상기 유사도 산출부(160)는 법률 문서 재구조화부(310), 유사도 판단부(300)를 포함하고, 상기 유사도 판단부(300)는 의미방향 생성부(320), 1차 유사도 결정부(330), 2차 유사도 결정부(340)를 포함할 수 있다.
상기 법률 문서 재구조화부(310)는 상기 법률 문서를 상기 표준 문서의 항목에 맞추어 재구조화하여 재구조화된 법률 문서를 생성하고, 상기 유사도 판단부(300)는 인공지능을 이용하여 상기 재구조화된 법률 문서와 표준 문서를 항목별로 내용을 비교하여 각 항목에 대응하는 유사도를 판단할 수 있다.
상기 법률 문서 재구조화부(310)는 상기 법률 문서와 표준 문서의 유사도를항목별로 판단하기 위하여 상기 법률 문서를 표준 문서의 항목의 순서대로 재구성 하여 재구조화된 법률 문서를 생성하는 것이다. 이후 유사도 판단부(300)에서 상기 재구조화된 법률 문서의 순서에 따라 유사도를 판단하게 된다.
의미방향 생성부(320)는 상기 재구조화된 법률 문서의 각 항목에 대하여 항목별 의미방향을 생성하고, 1차 유사도 결정부(330)는 상기 항목별 의미방향을 기반으로 상기 항목별 1차 유사도를 정할 수 있다. 그리고 2차 유사도 결정부(340)는 상기 항목별 1차 유사도를 기반으로 상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 구문비교를 통해 상기 항목별 2차 유사도를 정할 수 있다.
상기 의미방향 생성부(320)에서 생성하는 항목별 의미방향은 상기 항목의 주체, 대상, 행위의 관계를 기반으로 결정되는 것일 수 있다. 예를 들어, '이사는 주주총회에서 선임한다'는 주체는 '주주총회', 대상은 '이사', 행위는 '선임'으로 결정되고, 상기 주체, 대상, 행위의 관계가 '정방향'으로 정해질 수 있다. 만약 '이사는 주주총회에서 선임하지 아니한다'라고 한다면, 상기 주체, 대상, 행위의 관계가 '반대방향'으로 정해질 수 있다. 이때, 주체, 대상, 행위 말고도 다른 요소를 추가할 수도 있고, 상기 주체, 대상, 행위등의 요소의 추출과 상기 요소들을 기반으로 상기 항목별 의미방향을 결정하는 것은 인공지능의 학습을 통해 구현할 수 있다.
상기 1차 유사도 결정부(330)는 상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치한다면, 상기 항목별 유사도의 범위를 제1 범위로 정하고, 상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치하지 않는다면, 상기 항목별 유사도의 범위를 제2 범위로 정할 수 있다.
예를 들어, 회사의 정관과 표준 정관 모두 '이사는 주주총회에서 선임한다'라는 항목이 있다고 가정하자. 상기 '이사의 선임'이라는 항목에 대하여 주체는 '주주총회', 대상은 '이사', 행위는 '선임'이 결정되고, 상기 정관 및 표준 정관 모두 항목별 의미방향이 정방향으로 나타나게 된다. 따라서 상기 1차 유사도 결정부(330)에서 상기 항목에 대응하는 항목별 의미방향이 모두 정방향으로 일치하므로 유사도의 범위를 제1 범위인 70 초과로 정할 수 있는 것이다.
상기 2차 유사도 결정부(340)는 상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 일대일 구문 비교를 하고, 상기 구문 비교의 결과를 기반으로 상기 항목별 1차 유사도 내에서 상기 항목별 2차 유사도를 정할 수 있다.
즉, 1차 유사도 결정부(330)에서 상기 항목별 의미 방향으로 대강의 유사도의 범위를 구하고, 일대일 구문비교로 정밀한 유사도를 구하게 되는 것이다.
상기 예의 경우, 입력받은 정관과 표준 정관의 항목이 '이사는 주주총회에서 선임한다'로 정확히 일치하므로 유사도는 100 만점을 기준으로 100이 될 수 있다.
정관의 '이사는 주주총회외에서 선임한다'라는 항목의 예를 들어, 상기 유사도 산출부(160)의 동작을 다시 설명하자면, 원래 표준 문서는 상법에 따라'이사는 주주총회에서 선임한다'일 수 있다. 그렇다면, 상기 항목의 주체가 '주주총회', 대상이 '이사', 행위가 '선임'이 되고, 상기 주체, 대상, 행위의 관계에서, 상기 법률 문서의 항목은 반대 방향, 표준 문서의 항목은 정방향이 될 수 있다. 그렇게 되면, 두 문서의 항목별 의미방향이 일치하지 아니하므로 항목별 1차 유사도를 제1 범위인 70 이하로 설정할 수 있다. 그리고, 두 문서의 항목을 일대일 구문비교를 하면 주주총회와 주주총회외로 차이가 나므로 항목별 2차 유사도는 50으로 결정될 수 있는 것이다.
도 4는 도 1에 도시된 코멘트 생성부(170)의 일 예를 나타낸 블록도이다.
도 4를 참조하면, 상기 코멘트 생성부(170)는 코멘트 데이터베이스 검색부(410), 항목별 코멘트 저장부(420)를 포함할 수 있다. 상기 코멘트 데이터베이스 검색부(400)는 답 생성부(410), 1차 코멘트 생성부(420), 법률조항 검색부(430), 및 2차 코멘트 생성부(440)를 포함할 수 있다.
상기 코멘트 생성부(170)는 인공지능을 이용하여 표준 문서의 항목별 사전 정의 질의를 기반으로 법률 문서의 항목별 코멘트를 생성할 수 있다.
상기 항목별 사전 정의 질의는 표준 문서에 기반하여 미리 만들어 놓은 질문들을 말한다. 예를 들어, 상법 등에 근거한 정관의 경우, '이사는 어디서 선임하는가?'또는 '이사의 임기는 몇 년인가?'등과 같은 것일 수 있다. 이와 같은 사전 정의 질의들은 표준 문서의 항목들마다 정해져 있을 수 있다. 그리고 상기 표준 문서의 항목들에 매칭된 법률 문서의 항목들에 대하여 상기 항목에 해당하는 사전 정의 질의에 대한 답을 구하고, 상기 답을 기반으로 코멘트를 생성하게 되는 것이다.
그리고 상기 항목별 사전 정의 질의는 2개 이상의 계층으로 구성되어 있을 수 있다. 즉, 상기 항목별 사전 정의 질의가 첫번째 질의에 대한 답에 따라 두번째 질의가 결정되고, 두번째 질의에 대한 답에 따라 다시 세번째 질의가 결정되는 식으로 계층을 형성할 수 있는 것이다.
앞서 말한 회사의 정관의 예를 들면, 첫번째 사전 정의 질의가 '이사는 몇 명인가?'라고 하면, 답이 '3명 미만'일 경우에는 회사의 자본금 총액이 10억 원 미만인 회사만이 3명 미만의 이사를 둘 수 있다. 그렇다면, 두번째 사전 정의 질의는 '자본금 총액이 10억 원 미만인가?'가 될 수 있고 그 답에 따라 코멘트가 결정이 되는 것이다.
따라서 답 생성부(410)는 상기 표준 문서의 항목별 사전 정의 질의에 대하여 상기 법률 문서의 항목에 상응하는 답을 생성할 수 있다. 앞서 말한 바와 같이 상기 항목별 사전 정의 질의는 2개 이상의 계층 구조를 가질 수 있고, 표준 문서를 작성할 당시 역시 법률 전문가에 의해 함께 구축되는 것일 수 있다.
이후 1차 코멘트 생성부(420)는 상기 답 생성부(410)에서 생성한 상기 항목에 상응하는 답을 기반으로 코멘트 데이터베이스로부터 상기 항목에 대한 1차 코멘트를 검색할 수 있다.
상기 코멘트 데이터베이스는 상기 항목별 사전 정의 질의와 그에 대한 답, 그리고 상기 답에 따른 코멘트를 포함하고 있을 수 있다. 그러나 아무리 정교하게 구축된 코멘트 데이터베이스라고 하더라도, 법률 문서의 모든 항목에 대한 코멘트들을 포함하고 있지 않을 수도 있다.
따라서 상기 답 생성부(410)에서 생성한 답을 기반으로 상기 1차 코멘트 생성부(420)에서 1차 코멘트를 검색하지 못할 수도 있으므로, 다른 방법으로 코멘트를 생성하는 방법이 필요하다. 이때 필요한 것이 법률조항 검색부(430)와 2차 코멘트 생성부(440)이다. 상기 법률조항 검색부(430)는 인공지능을 이용하여 상기 항목과 답에 상응하는 관련 법률 조항을 검색하고, 상기 2차 코멘트 생성부(440)는 상기 관련 법률 조항을 기반으로 2차 코멘트를 생성할 수 있다.
상기 법률조항 검색부(430)는 상기 답 생성부(410)에서 상기 항목과 답을 기반으로 관련 법률 조항을 인공지능의 학습을 이용하여 찾아낼 수 있다. 상기 답 또는 답과 관련된 구문을 포함하고 있는 관련 법률 조항을 찾아내고, 상기 항목, 답 그리고 관련 법률 조항을 기반으로 2차 코멘트를 생성하는 것이다. 예를 들어, '이사는 몇 명인가'라는 사전 정의 질의에 대해 '2명'이라는 답이 생성되었다고 가정하자. 그런데 상기 코멘트 데이터베이스에는 이사가 3명 미만일 경우의 코멘트는 없다고 하면, 상기 답과 관련된 관련 법률 조항을 상법 제 383조 제 1항의 '이사는 3명이상이어야 한다. 다만 자본금 총액이 10억 원 미만인 회사는 1명 또는 2명으로 할 수 있다'를 검색할 수 있고, 상기 관련 법률 조항을 기반으로 '상법 제 383조 제 1항 단서에 의해 유효합니다'라는 2차 코멘트를 생성할 수 있는 것이다.
이후, 항목별 코멘트 저장부(450)는 상기 1차 코멘트 생성부(420)에서 생성한 1차 코멘트, 상기 2차 코멘트 생성부(440)에서 생성한 2차 코멘트를 기반으로 항목별 코멘트를 생성, 저장할 수 있다.
그리고 상기 코멘트 생성부(170)는 상기 1차 코멘트가 검색되면, 상기 법률조항 검색부(430)와 상기 2차 코멘트 생성부(440)의 동작을 생략할 수 있다.
도 5는 실시예에 따른 인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치(100)의 동작 흐름도를 나타낸 도면이다.
도 5를 참조하면, 법률 문서의 법률적인 분석을 위해 상기 법률 문서가 상기법률 문서 분석 장치의 입력부에 입력된다(S510). 상기 법률 문서는 사용자가 법률 적인 분석을 의뢰한 것으로, 이미지의 형태나 파일의 형태로 입력될 수 있다. 그리고 만약 상기 법률 문서의 헝태가 이미지라면 광학적 문자 판독장치인 OCR을 이용하여 문서 형태로 변환하여 분석을 진행할 수 있다.
그리고, 상기 법률 문서 분석 장치의 표준 문서 검색부는 표준 문서 데이터베이스에서 상기 법률 문서와 같은 유형의 표준 문서를 검색한다(S520). 즉, 상기 입력부에 입력된 법률 문서의 유형을 기반으로 표준 문서를 표준 문서 데이터베이스에서 검색하는 것이다. 상기 법률 문서의 유형은 사용자에 의해 입력될 수도 있고, 상기 법률 문서 분석 장치가 입력된 법률 문서를 기반으로 유형을 파악할 수도 있다. 예를 들어, 상기 법률 문서의 제목이 '근로계약서'라면 그 제목으로부터 유형을 파악할 수도 있는 것이다.
그리고 상기 표준 문서 데이터베이스는 각종 표준 문서들로 이루어져 있는데, 상기 표준 문서들은 사전에 법률 전문가들에 의해 관련 법률 등에 근거하여 검토되어 구축된 것일 수 있다.
이후, 상기 법률 문서 분석 장치의 텀시트 생성부는 상기 법률 문서와 상기 표준 문서를 기반으로 텀시트를 생성한다(S530). 상기 법률 문서와 상기 표준 문서를 인공지능을 활용하여 항목 매칭을 하고, 상기 항목 매칭을 통해 상기 법률 문서를 상기 항목별로 일목요연하게 표시한 텀시트를 생성하는 것이다. 상기 텀시트는 상기 표준 문서상의 항목들을 추려 정리한 문서들을 말한다. 상기 텀시트의 항목은 기설정된 항목으로 상기 표준 문서상의 항목의 일부를 포함하는 것일 수 있다.
그리고 상기 법률 문서 분석 장치의 유사도 산출부는 상기 법률 문서와 상기 표준 문서에 대하여 인공지능을 활용하여 상기 항목별 유사도를 산출한다(S540).
즉, 상기 유사도 산출부는 상기 법률 문서를 상기 표준 문서의 항목에 맞추어 재구조화하여 재구조화된 법률 문서를 생성하고, 인공지능을 이용하여 상기 재구조화된 법률 문서와 표준 문서를 항목별로 내용을 비교하여 각 항목에 대응하는 유사도를 판단할 수 있다.
그리고 상기 유사도 산출부는 상기 유사도를 판단하기 위하여 상기 재구조화된 법률 문서의 각 항목에 대하여 항목별 의미방향을 생성하고, 상기 항목별 의미방향을 기반으로 상기 항목별 1차 유사도를 정하며, 상기 항목별 1차 유사도를 기반으로 상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 구문비교를 통해 상기 항목별 2차 유사도를 정할 수 있다.
즉, 상기 법률 문서의 항목의 주체, 대상, 행위의 관계를 기반으로 상기 항목의 항목별 의미방향을 결정하고, 상기 법률 문서의 항목별 의미방향에 따라 유사도의 범위인 1차 유사도가 결정되는 것이다. 그리고 상기 1차 유사도가 정해진 이후에는 구문을 일일이 비교해 상기 1차 유사도내에서 최종 유사도인 2차 유사도가 결정되는 것이다.
이후, 상기 법률 문서 분석 장치의 코멘트 생성부는 상기 항목별 유사도를 기반으로 코멘트 데이터베이스에서 상기 법률 문서에 대한 항목별 코멘트를 생성한다(S550).
즉, 상기 코멘트 생성부는 상기 항목별 2차 유사도를 기반으로 각 항목에 대응하는 코멘트를 코멘트 데이터베이스에서 검색하고, 검색된 상기 각 항목에 대응하는 코멘트를 상기 항목별 코멘트로 저장할 수 있다. 또한, 상기 항목별 2차 유사도가 적정 점수 이상이면 상기 코멘트 데이터베이스(190)를 검색하는 단계를 생략할 수 있다. 예를 들어, 상기 2차 유사도가 100점 만점에 99점 이상이라고 하면, 코멘트의 검색을 생략하고, 상기 유사도만을 출력할 수 있는 것이다.
그리고 상기 코멘트 생성부는 상기 사전 정의 질의에 대한 답을 기반으로 코멘트 데이터베이스로부터 상기 항목에 대한 1차 코멘트를 검색하고, 인공지능을 이용하여 상기 항목과 답에 상응하는 관련 법률 조항을 검색하고, 상기 관련 법률 조항을 기반으로 2차 코멘트를 생성할 수 있다. 그리고 상기 상기 코멘트 생성부(170)는 상기 1차 코멘트 및 상기 2차 코멘트를 기반으로 항목별 코멘트를 생성, 저장할 수 있다. 그러나, 상기 1차 코멘트가 검색되면, 상기 관련 법률 조항 검색 및 2차 코멘트 생성의 동작을 생략할 수도 있다.
여기서 상기 텀시트 생성부의 동작과 상기 유사도 산출부 및 코멘트 생성부의 동작은 동시에 또는 이시에 수행될 수도 있다.
상기 법률 문서 분석 장치의 분석 결과 제공부는 상기 텀시트, 항목별 유사도, 항목별 코멘트를 포함하는 상기 법률 문서의 분석 결과를 제공한다(S560).
이 때, 상기 분석 결과 제공부는 상기 텀시트, 유사도, 코멘트를 시각화한 인터페이스로 제공할 수 있다. 즉, 법률 문서를 기설정된 항목 별로 일목요연하게 정리한 텀시트를 포함하는 제1 인터페이스를 제공하고, 상기 텀시트의 항목별 또는 상기 법률 문서의 조항별 표준 문서와의 유사도 및 코멘트를 포함하는 제2 인터페이스를 제공할 수 있다.
도 6은 도 1에 도시된 코멘트 생성부(170)에서 코멘트가 생성되는 과정의 일예를 보여주는 도면이다.
도 6을 참조하면, 코멘트 데이터 베이스(600)는 복수개의 사전 정의 질의, 상기 복수개의 사전 정의 질의에 상응하는 복수개의 답과 코멘트를 포함하고 있고, 상기 복수개의 사전 정의 질의를 기반으로 코멘트가 생성되는 것이다.
도 6에서는 3개의 항목에 대한 사전 정의 질의들을 도시하고 있지만, 사용자나 문서의 유형 그리고 사용되는 환경에 따라 상기 사전 정의 질의의 개수, 구성은 달라질 수 있다.
상기 코멘트 데이터 베이스(600)의 사전 정의 질의는 이사의 선임 주체, 이사의 임기, 이사의 수 의 3개의 항목으로 구성 되어있는데, 첫번째 질의(620)는 ① 이사는 어디서 선임하는가, ② 이사의 임기는 몇 년인가, ③ (상근)이사는 몇 명인가라는 3개로 구성되어 있고, 상기 ③ (상근)이사는 몇 명인가라는 질문에 답이 3명 미만인 경우는 '자본금 총액이 10억원 미만인가(660)'라는 두번째 질의가 존재한다. 그리고 상기 두번째 질의에 대한 답에 따라 두번째 코멘트가 만들어지는 것이다.
이하에서는 도 6의 정관(610)의 예를 들어, 상기 정관(610)으로부터 코멘트가 만들어지는 과정을 설명한다. 상기 정관(610)에는 자본금과 이사에 관한 사항이 포함되어 있다.
우선 코멘트 생성부(170)의 답생성부는 상기 정관(610), 특히 정관 제 3조의 이사에 관한 사항에 대하여 상기 사전 정의 질의들 중 첫번째 질의들(620)에 대한 답들(630)을 생성한다.
그리고 상기 코멘트 생성부(170)의 1차 코멘트 생성부는 상기 답들(630)을 기반으로 상기 코멘트 데이터베이스(600)를 기반으로 코멘트들을 생성하게 되는데, 상기 ③ (상근)이사는 몇 명인가에 대하여는 코멘트를 생성할 수도 있고, 다음의 두번째 질의인 '자본금 총액이 10억원 미만인가(660)'에 대한 답을 구해 코멘트를 생성하게 할수도 있다.
결국 상기 코멘트 생성부(170)는 도 6의 정관(610)의 제 3조에 대하여, 제 3조 제 1항의 '이사는 이사회에서 선임한다'에 대하여는 '무효입니다'라는 코멘트가, 제 3조 제 2항의 '이사의 임기는 3년이다'에 대하여는 '문제없음'이라는 코멘트가, 제 3조 제 3항에 대하여는 '문제없음'이라는 코멘트가 생성되는 것이다. 여기서 상기 제 3조 제 3항에 대하여는 첫번째 질의에 대한 코멘트인 '자본금 총액이 10억원 미만인 회사만이 3명 미만의 이사를 둘 수 있습니다'도 함께 생성될 수도 있다.
그리고, 이렇게 생성된 1차 코멘트를 항목별 코멘트로 저장하게 되는 것이다.
도 7은 도 1에 도시된 코멘트 생성부(170)에서 코멘트가 생성되는 과정의 다른 예를 보여주는 도면이다.
도 7을 참조하면, 코멘트 데이터 베이스(700)는 복수개의 사전 정의 질의, 상기 복수개의 사전 정의 질의에 상응하는 복수개의 답과 코멘트를 포함하고 있고, 상기 복수개의 사전 정의 질의를 기반으로 코멘트가 생성되는 것이다. 도 7에서는 3개의 항목에 대한 사전 정의 질의들을 도시하고 있지만, 사용자나 문서의 유형 그리고 사용되는 환경에 따라 상기 사전 정의 질의의 개수, 구성은 달라질 수 있다.
상기 코멘트 데이터 베이스(700)의 사전 정의 질의는 이사의 선임 주체, 이사의 임기, 이사의 수 의 3개의 항목으로 구성 되어있는데, 첫번째 질의(620)는 ① 이사는 어디서 선임하는가, ② 이사의 임기는 몇 년인가, ③ (상근)이사는 몇 명인가라는 3개로 구성되어 있다. 상기 코멘트 데이터 베이스(700)가 앞서 도 6의 코멘트 데이터베이스(600)와 다른 점은 ③ (상근)이사는 몇 명인가의 답인 '3명 미만'에 대하여 저장된 코멘트가 없다는 것이다. 이와 같은 경우, 코멘트 생성부(170) 에 포함되어 있는 법률 조항 검색부와 2차 코멘트 생성부를 통해 2차 코멘트를 생성할 수 있는 것이다.
이하에서는 도 7의 정관(710)의 예를 들어, 상기 정관(710)으로부터 법률 조항 검색을 통해 2차 코멘트가 만들어지는 과정을 설명한다. 상기 정관(710)에는 자본금과 이사에 관한 사항이 포함되어 있다.
코멘트 생성부(170)의 답 생성부는 상기 정관(710)의 제 3조 제 3항에 대하여 상기 첫번째 질의(720)에 대한 답(730)을 생성한다.
그리고 상기 코멘트 생성부(170)의 1차 코멘트 생성부는 상기 답(730)을 기반으로 상기 코멘트 데이터베이스(700)를 기반으로 코멘트를 생성하려고 하는데, 상기 코멘트 데이터베이스(700)상에 저장된 코멘트가 존재하지 않는다(740).
이때, 상기 코멘트 생성부(170)의 법률조항 검색부는 상기 항목과 답에 상응하는 관련 법률 조항을 검색하게 되고(750), 상기 관련 법률 조항으로 상법 제 383조 제1항 단서(760)를 찾아내게 된다.
그리고 상기 코멘트 생성부(170)의 2차 코멘트 생성부는 상기 관련 법률 조항(760)과 상기 답(730)을 기반으로 2차 코멘트인 '상법 제383조 제 1항 단서에 의해 유효합니다'라는 2차 코멘트를 생성하게 되는 것이다.
그리고 상기 2차 코멘트는 항목별 코멘트로 저장하게 되는 것이다.
도 8은 실시예에 따른 법률 문서 분석 장치에서 법률 문서의 입력 화면의 예를 보여주는 도면이다.
도 8을 참조하면, 법률 문서 중 계약서의 입력 화면의 예를 확인할 수 있다. 상기 계약서의 입력 화면은 상기 계약서의 정보 중 회사 기본 정보를 입력하는 화면이 상단에 존재하고, 상기 회사 기본 정보는 대표이사 이름, 회사 주소, 회사 홈페이지 주소를 포함하고 있다. 그리고 화면의 하단에는 계약서의 원문 내용을 입력하는 부분이 있는데, 이때 파일을 업로드할 수 있도록 할 수 있다.
도 9는 실시예에 따른 법률 문서 분석 장치에서 법률 문서의 원문이 제공되는 예를 보여주는 도면이다.
도 9를 참조하면, 법률 문서 중 계약서가 입력되었을 경우, 화면의 좌측에는상기 계약서의 목차들이 표시되고, 화면의 중앙에는 입력된 계약서의 원문이 상단부터 계약서 제목과 설명, 그리고 계약서의 원문 내용이 조항별로 표시됨을 알 수 있다.
도 10에서 도 14는 도 1에 도시된 분석 결과 제공부(180)에서 제공하는 시각화한 분석 결과들을 보여주는 도면들이다. 도 10에서 도 14의 분석 결과 화면들의 내용은 단지 상기 시각화한 분석 결과인 인터페이스를 설명하기 위한 용도로 사용된 것이다. 따라서 상기 내용은 문서의 유형과 문서의 내용이 연관되어 있지 않을 수도 있고, 상기 문서의 내용이 실제 사실과 법령등과 맞지 않을 수 있다.
도 10은 상기 분석 결과 제공부에서 제공하는 텀시트의 일 예를 나타낸 도면이다. 도 10을 참조하면, '한양은행'이라는 회사의 정관으로부터 생성된 텀시트가 시각적으로 제공되는 일 예를 알 수 있다.
도 10에서 텀시트(Term Sheet)는 회사명, 회사의 사업목적, 회사가 발행할 주식의 총수, 1주의 금액, 회사 설립시에 발행하는 주식의 총수, 회사의 본점 소재지 주소, 감사 및 이사의 수, 스톡옵션 도입 여부, 종류 주식 발행 예정 여부, 향후 전환사채 발행 예정 여부 등의 항목으로 구성되어 있음을 알 수 있다.
그리고 각 항목별로 상기 '한양은행'의 정관의 내용이 정리되어 일목요연하게디스플레이되고 있음을 알 수 있다. 도 10의 텀시트를 통해, 정관에서 필요로하는 항목들이 어떻게 구성되어 있는지를 한눈에 알아볼 수 있는 것이다. 그리고 상기 텀시트의 항목은 표준 문서의 항목을 기준으로 사전에 설정되기 때문에, 만약 텀시트의 항목의 내용에 해당하는 내용이 사용자의 법률 문서에 없다면, 사용자는 그 부분을 보충하여야 한다는 사실을 알 수 있게 되는 것이다.
도 11 내지 도 12는 상기 분석 결과 제공부에서 제공하는 유사도 및 코멘트의 일 예를 나타낸 도면들이다. 도 11 내지 도 12를 참조하면, '기술 제휴 계약'이라는 계약서의 내용을 분석한 유사도 및 코멘트가 시각적으로 제공되는 예를 확인할 수 있다.
도 11 내지 도 12에서 분석 결과가 나타나는 화면은 좌측부터 차례대로 목차, 상기 계약서 원문, 상기 계약서의 분석 결과로 구분되어 구성되어 있다. 상기 목차는 상기 계약서의 항목으로 화면상 왼쪽에 위치하여,'제목, 서무, 제 1조 목적, 제 2조 용역범위, 제 3조 주식, 제 4조 용역대금, ...'으로 위에서부터 차례대로 표시되고 있다. 그리고 화면의 중앙에는 상기 계약서의 원문이 각 조항별로 표시되고 있다.
상기 목차상 제 3조를 선택하면, 상기 계약서의 원문에서도 제 3조 부분이 하이라이트되어 나타나고 오른쪽 위에 유사도인 Score 99가 표시될 수도 있다.
이 때, 계약서 원문에는 제 3조 내용 중 유사도가 높은 부분(녹색)과, 차이가 있는 부분(노란색) 및 차이와 법적 문제가 있는 부분(적색)이 다른 인터페이스들(예를 들어, 서로 다른 색의 밑줄)을 이용하여 표시될 수 있다.
그리고 화면상 오른쪽의 분석결과 탭과 코멘트 탭중 하나를 선택하여 상기 유사도를 포함한 분석결과 또는 코멘트를 확인할 수 있다. 도 11과 같이 분석결과 탭을 선택하면 유사도를 포함하는 분석결과가 표시되고, 분석결과에는 상기 항목에 관한 코멘트가 포함될 수 있고, 도 12와 같이 코멘트 탭을 선택하면 상기 항목에 해당하는 코멘트(분석결과에서 제공되지 않은 추가 코멘트)가 표시될 수 있다.
도 12에서는 유사도를 기반으로 '의뢰하신 문서는 표준 문서와 99.9% 일치하고, 문제되는 항목이 없는 바, 수정할 내용이 없습니다'라는 코멘트가 제공되고 있음을 알 수 있다. 그리고 최종 분석 결과를 제공하는 최종 분석 버튼은 팝업창의 형태로, '최종 분석이 완료되었습니다. [최종분석 보기]'와 같이 표시됨을 알 수 있다. 상기 버튼을 누르면 도 13과 14에 도시된 최종 분석 결과가 디스플레이될 수 있다.
도 13 내지 도14는 상기 분석 결과 제공부에서 제공하는 최종 분석결과의 예들을 나타낸 도면이다.
도 13을 참조하면, 상기 최종 분석 결과가 상기 법률 문서의 항목과 상기 항목에 대한 코멘트, 유사도도 표시되는 데, 이때 유사도의 범위에 따라 조치필요사항(경고), 주의필요사항(주의), 문제없음(양호)의 단계로 나누어 표시하고, 상기 조치필요사항, 주의필요사항, 문제없음을 각각 다른 색으로 표시하여 법률 문서의 각 항목 또는 조항에 대한 분석 결과를 한눈에 알아볼 수 있게 할 수 있다.
도 13에서는 최종 분석 결과의 윗부분에 '27개 조항에서 59가지 항목이 분석되었고, 경고가 4개, 주의가 3개, 양호가 52개의 항목이 나왔음'을 표시하고 있음을 알 수 있다. 그리고 상세하게는 제 30조의 경우 첫번째 항인 '이사는 이사회에서 선임한다'가 상기 경고에 해당하고, 상법에 따라 무효라는 분석 결과가 제공되고 있음을 알 수 있다.
도 14를 참조하면, 상기 최종 분석 결과가 계층 구조 버전의 항목들로 표시되어 있다. 만약, 사전 정의 질의가 계층 구조로 되어 있다면, 상기 법률 문서를 계층 구조의 상기 사전 정의 질의에 대한 답에 기반하여 계층 구조로 표시하는 것이다.
도 14에서는 최종 분석 결과가 왼쪽부터 4개의 층으로 구성되어 있음을 알 수 있다. 첫번째 층은 기본정보, 주식, 사채, 이사, 이사회, 감사를 포함하는데, 이중 주식만이 3개의 하위계층을 더 포함하고 있다. 즉, 첫번째 층의 '주식'이라는 항목에 대하여, 발행주식 총수, 액면가 등의 두번째 층이 존재하고, 이익배당, 의결권 우선주 등의 세번째 층과 우선배당, 액면가액등의 네번째 층이 존재한다.
도 15는 본 발명의 일실시예에 따른 컴퓨터 시스템을 나타낸 도면이다.
도 15를 참조하면, 본 발명의 일실시예에 따른 인공지능을 이용한 표준 문서기반 법률 문서 분석 장치는 컴퓨터로 읽을 수 있는 기록매체와 같은 컴퓨터 시스템(900)에서 구현될 수 있다. 도 15에 도시된 바와 같이, 컴퓨터 시스템(900)은 버스(920)를 통하여 서로 통신하는 하나 이상의 프로세서(910), 메모리(930), 사용자 인터페이스 입력 장치(940), 사용자 인터페이스 출력 장치(950) 및 스토리지(960)를 포함할 수 있다. 또한, 컴퓨터 시스템(900)은 네트워크(980)에 연결되는 네트워크 인터페이스(970)를 더 포함할 수 있다. 프로세서(910)는 중앙 처리 장치 또는 메모리(930)나 스토리지(960)에 저장된 프로세싱 인스트럭션들을 실행하는 반도체 장치일 수 있다. 메모리(930) 및 스토리지(960)는 다양한 형태의 휘발성 또는 비휘발성 저장 매체일 수 있다. 예를 들어, 메모리는 ROM(931)이나 RAM(932)을 포함할 수 있다.
이상에서 설명된 실시예에 따르면, 본 발명은 법률 문서의 검토를 인공지능을 활용하여 온라인상에서 구현할 수 있는 방법 및 이를 위한 장치를 제공할 수 있다.
또한, 본 발명은 표준 문서 데이터베이스와 표준 문서 기반 코멘트데이터베이스를 활용하여 법률 문서를 검토함으로써 정확하고도 효율적으로 분석 결과를 제공할 수 있는 방법을 제공할 수 있다.
이상에서 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다.
100: 인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치
110: 법률 문서
120: 분석 결과
130: 입력부
140: 표준 문서 검색부
150: 텀시트 생성부
160: 유사도 산출부
170: 코멘트 생성부
180: 분석 결과 제공부
185: 표준 문서 데이터베이스
190: 코멘트 데이터베이스
110: 법률 문서
120: 분석 결과
130: 입력부
140: 표준 문서 검색부
150: 텀시트 생성부
160: 유사도 산출부
170: 코멘트 생성부
180: 분석 결과 제공부
185: 표준 문서 데이터베이스
190: 코멘트 데이터베이스
Claims (15)
- 법률 문서를 표준 문서와의 인공지능을 활용한 항목(Term) 매칭을 통해 상기 표준문서의 항목별로 표시한 텀시트(Term Sheet)를 생성하는 단계;
상기 법률 문서와 상기 표준 문서에 대하여 인공지능을 활용하여 상기 항목별 유사도를 산출하는 단계;
상기 항목별 유사도를 기반으로 코멘트 데이터베이스에서 상기 법률 문서에 대한 항목별 코멘트를 생성하는 단계; 및
상기 텀시트, 항목별 유사도, 항목별 코멘트를 포함하는 상기 법률 문서의 분석 결과를 제공하는 단계를 포함하는,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법. - 제1 항에 있어서,
상기 텀시트를 생성하는 단계는
인공지능을 이용하여 상기 법률 문서로부터 메타 데이터(Meta Data)를 추출하는 단계;
상기 메타 데이터를 기반으로 상기 법률 문서의 항목들을 추출하는 단계; 및
상기 법률 문서의 항목들을 상기 표준 문서의 항목들과 매칭하여 상기 법률 문서를 상기 항목별로 일목요연하게 표시한 상기 텀시트를 저장하는 단계를 포함하는,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치. - 제2 항에 있어서,
상기 항목별 유사도를 산출하는 단계는
상기 법률 문서를 상기 표준 문서의 항목에 맞추어 재구조화하여 재구조화된 법률 문서를 생성하는 단계; 및
인공지능을 이용하여 상기 재구조화된 법률 문서와 표준 문서를 항목별로 내용을 비교하여 각 항목에 대응하는 유사도를 판단하는 단계를 포함하는,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법. - 제3 항에 있어서,
상기 각 항목에 대응하는 유사도를 판단하는 단계는
상기 재구조화된 법률 문서의 각 항목에 대하여 항목별 의미방향을 생성하는 단계;
상기 항목별 의미방향을 기반으로 상기 항목별 1차 유사도를 정하는 단계; 및
상기 항목별 1차 유사도를 기반으로 상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 구문비교를 통해 상기 항목별 2차 유사도를 정하는 단계를 포함하고,
상기 항목별 의미 방향은 상기 항목의 주체, 대상, 행위의 관계를 기반으로 결정되는 것인,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법. - 제4 항에 있어서,
상기 항목별 1차 유사도를 정하는 단계는
상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치한다면, 상기 항목별 1차 유사도를 제1 범위로 정하는 단계; 및
상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치하지 않는다면, 상기 항목별 1차 유사도를 제2 범위로 정하는 단계를 포함하는,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법. - 제5 항에 있어서,
상기 항목별 2차 유사도를 정하는 단계는
상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 일대일 구문 비교를 하는 단계; 및
상기 구문 비교의 결과를 기반으로 상기 항목별 1차 유사도 내에서 상기 항목별 2차 유사도를 정하는 단계를 포함하는,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법. - 제6 항에 있어서,
상기 항목별 코멘트를 생성하는 단계는
상기 항목별 2차 유사도를 기반으로 각 항목에 대응하는 코멘트를 코멘트 데이터베이스에서 검색하는 단계; 및
검색된 상기 각 항목에 대응하는 코멘트를 상기 항목별 코멘트로 저장하는 단계를 포함하는,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법. - 제7 항에 있어서,
상기 항목별 코멘트를 생성하는 단계는
상기 항목별 2차 유사도가 적정점수 이상이면 상기 코멘트 데이터베이스를 검색하는 단계를 생략하는 것인,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법. - 법률 문서를 표준 문서와의 인공지능을 활용한 항목(Term) 매칭을 통해 상기 표준 문서의 항목별로 표시한 텀시트(Term Sheet)를 생성하는 텀시트 생성부;
상기 법률 문서와 상기 표준 문서에 대하여 인공지능을 활용하여 상기 항목별 유사도를 산출하는 유사도 산출부;
상기 항목별 유사도를 기반으로 코멘트 데이터베이스에서 상기 법률 문서에 대한 항목별 코멘트를 생성하는 코멘트 생성부; 및
상기 텀시트, 항목별 유사도, 항목별 코멘트를 포함하는 상기 법률 문서의 분석 결과를 제공하는 분석 결과 제공부를 포함하는,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치. - 제9 항에 있어서,
상기 텀시트 생성부는
인공지능을 이용하여 상기 법률 문서로부터 메타 데이터(Meta Data)를 추출하는 메타 데이터 추출부;
상기 메타 데이터를 기반으로 상기 법률 문서의 항목들을 추출하는 항목 추출부; 및
상기 법률 문서의 항목들을 상기 표준 문서의 항목들과 매칭하여 상기 법률 문서를 상기 항목별로 일목요연하게 표시한 상기 텀시트를 저장하는 텀시트 저장부를 포함하는,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치. - 제10 항에 있어서,
상기 유사도 산출부는
상기 법률 문서를 상기 표준 문서의 항목에 맞추어 재구조화하여 재구조화된 법률 문서를 생성하는 법률 문서 재구조화부; 및
인공지능을 이용하여 상기 재구조화된 법률 문서와 상기 표준 문서를 항목별로 내용을 비교하여 각 항목에 대응하는 유사도를 판단하는 유사도 판단부를 포함하는,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치. - 제11 항에 있어서,
상기 유사도 판단부는
상기 재구조화된 법률 문서의 각 항목에 대하여 항목별 의미방향을 생성하는 의미방향 생성부;
상기 항목별 의미방향을 기반으로 상기 항목별 1차 유사도를 정하는 1차 유사도 결정부; 및
상기 항목별 1차 유사도를 기반으로 상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 구문비교를 통해 상기 항목별 2차 유사도를 정하는 2차 유사도 결정부를 포함하고,
상기 항목별 의미 방향은 상기 항목의 주체, 대상, 행위의 관계를 기반으로 결정되는 것인,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치. - 제12 항에 있어서,
상기 1차 유사도 결정부는
상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치한다면, 상기 항목별 1차 유사도를 제1 범위로 정하고,
상기 항목별 의미방향이 상기 항목에 대응하는 상기 표준 문서의 의미방향과 일치하지 않는다면, 상기 항목별 1차 유사도를 제2 범위로 정하는 것인,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치. - 제13 항에 있어서,
상기 2차 유사도 결정부는
상기 재구조화된 법률 문서의 각 항목에 대하여 인공지능을 활용한 일대일 구문 비교를 하고,
상기 구문 비교의 결과를 기반으로 상기 항목별 1차 유사도 내에서 상기 항목별 2차 유사도를 정하는 것인,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치. - 제14 항에 있어서,
상기 코멘트 생성부는
상기 항목별 2차 유사도를 기반으로 각 항목에 대응하는 코멘트를 코멘트 데이터베이스에서 검색하는 코멘트 데이터베이스 검색부; 및
검색된 상기 각 항목에 대응하는 코멘트를 상기 항목별 코멘트로 저장하는 항목별 코멘트 저장부를 포함하는,
인공지능을 이용한 표준 문서 기반 법률 문서 분석 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200082645A KR20220005167A (ko) | 2020-07-06 | 2020-07-06 | 인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법 및 이를 위한 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200082645A KR20220005167A (ko) | 2020-07-06 | 2020-07-06 | 인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법 및 이를 위한 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220005167A true KR20220005167A (ko) | 2022-01-13 |
Family
ID=79341919
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200082645A KR20220005167A (ko) | 2020-07-06 | 2020-07-06 | 인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법 및 이를 위한 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20220005167A (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230120227A (ko) | 2022-02-09 | 2023-08-17 | 빅베이스 주식회사 | 인공지능을 이용한 구조화된 문서 분석 시스템 및 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100919757B1 (ko) | 2008-04-17 | 2009-10-07 | 엘지전자 주식회사 | 문서분석을 위한 사용자 인터페이스 시스템 |
-
2020
- 2020-07-06 KR KR1020200082645A patent/KR20220005167A/ko not_active Application Discontinuation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100919757B1 (ko) | 2008-04-17 | 2009-10-07 | 엘지전자 주식회사 | 문서분석을 위한 사용자 인터페이스 시스템 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230120227A (ko) | 2022-02-09 | 2023-08-17 | 빅베이스 주식회사 | 인공지능을 이용한 구조화된 문서 분석 시스템 및 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210382878A1 (en) | Systems and methods for generating a contextually and conversationally correct response to a query | |
CN115238101B (zh) | 一种面向多类型知识库的多引擎智能问答系统 | |
CN110147436B (zh) | 一种基于教育知识图谱与文本的混合自动问答方法 | |
CN109684448B (zh) | 一种智能问答方法 | |
CN109597994B (zh) | 短文本问题语义匹配方法和系统 | |
CN106649223A (zh) | 基于自然语言处理的金融报告自动生成方法 | |
US20150081277A1 (en) | System and Method for Automatically Classifying Text using Discourse Analysis | |
US20090198488A1 (en) | System and method for analyzing communications using multi-placement hierarchical structures | |
CN111967761A (zh) | 一种基于知识图谱的监控预警方法、装置及电子设备 | |
US11699034B2 (en) | Hybrid artificial intelligence system for semi-automatic patent infringement analysis | |
CN114036281B (zh) | 基于知识图谱的柑橘管控问答模块构建方法及问答系统 | |
TWI743623B (zh) | 基於人工智慧的商務智慧系統及其分析方法 | |
CN112035652A (zh) | 一种基于机器阅读理解的智能问答交互方法及系统 | |
CN113159969A (zh) | 一种金融长文本复核系统 | |
CN116070599A (zh) | 智能化题库生成及辅助管理系统 | |
CN117131070B (zh) | 一种自适应规则引导的大语言模型生成sql系统 | |
KR20220005167A (ko) | 인공지능을 이용한 표준 문서 기반 법률 문서 분석 방법 및 이를 위한 장치 | |
CN117112794A (zh) | 一种基于知识增强的多粒度政务服务事项推荐方法 | |
US11573968B2 (en) | Systems and methods of creating and using a transparent, computable contractual natural language | |
CN113392189B (zh) | 基于自动分词的新闻文本处理方法 | |
KR20220005168A (ko) | 인공지능을 이용한 사전 정의 질의 기반 법률 문서 분석 방법 및 이를 위한 장치 | |
Voghoei et al. | Decoding the alphabet soup of degrees in the united states postsecondary education system through hybrid method: Database and text mining | |
KR20220005169A (ko) | 인공지능을 이용한 법률 문서 분석 방법 및 이를 위한 장치 | |
Kimura et al. | Budget Argument Mining Dataset Using Japanese Minutes from the National Diet and Local Assemblies | |
Makwana | A Textual Data Analysis of the Union Budget of India |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |