KR20220042838A - Systems and Methods to Provide AI Answering Service for Legal Questions - Google Patents
Systems and Methods to Provide AI Answering Service for Legal Questions Download PDFInfo
- Publication number
- KR20220042838A KR20220042838A KR1020200126150A KR20200126150A KR20220042838A KR 20220042838 A KR20220042838 A KR 20220042838A KR 1020200126150 A KR1020200126150 A KR 1020200126150A KR 20200126150 A KR20200126150 A KR 20200126150A KR 20220042838 A KR20220042838 A KR 20220042838A
- Authority
- KR
- South Korea
- Prior art keywords
- legal
- question
- answer
- numerical
- providing
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 90
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 37
- 238000010801 machine learning Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 9
- 239000013598 vector Substances 0.000 claims description 50
- 238000003058 natural language processing Methods 0.000 claims description 49
- 238000004458 analytical method Methods 0.000 claims description 22
- 239000000284 extract Substances 0.000 claims description 6
- 230000004044 response Effects 0.000 claims 1
- 238000000605 extraction Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000009223 counseling Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Technology Law (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법에 관한 것이다.The present invention relates to a system and method for providing a numerical AI answer service to legal questions.
법무관련 영역은 기본적으로 상담을 필수로 하고 있지만, 전문가와 상담을 연결하는 다양한 수단 또는 양식(또 는 Form)을 제공하고 사전 조사형태로 진행되는정도에 그치는 것이 현재로서는 대부분이다. In the legal field, counseling is basically required, but at present, most of them provide various means or forms (or forms) to connect experts and counseling and proceed only in the form of a preliminary investigation.
이는 상담을 정형화하여 ARS 방식으로 각종 단계와 조건을 확인하며 처리하게 되므로 서비스 진행 속도가 매우 지루하고 서비스 경험이 나빠 해당 서비스의 자동화된 처리에 매우 큰 장애요소가 된다. 하지만 자연어 처리를 통해 상담이 가능하게 하면 기계학습에 따라 상담의 정밀도가 높아지고 유관산업의 활성 화를 시간과 공간의 제약없이 할 수 있게 된다.This standardizes the consultation and processes it by checking various steps and conditions in the ARS method, so the speed of the service is very tedious and the service experience is poor, which is a very big obstacle to the automated processing of the service. However, if consultation is made possible through natural language processing, the precision of consultation will increase according to machine learning, and the revitalization of related industries will be possible without time and space limitations.
이에 본 발명은 사용자의 법률질문에 대한 답변을 AI 학습알고리즘을 이용하여 제공할 수 있는 시스템 및 방법을 개시하고자 한다.Accordingly, the present invention intends to disclose a system and method that can provide an answer to a user's legal question using an AI learning algorithm.
본 발명이 해결하고자 하는 과제는 종래의 문제점을 해결할 수 있는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 제공하는 데 그 목적이 있다.An object of the present invention is to provide a system and method for providing a numerical AI answering service to legal questions that can solve conventional problems.
상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템은 질의내용에 대한 법률자문을 요청하는 질의단말: 및 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 긍정 및 부정 각각의 수치값으로 제공하는 AI 법률/질의응답서버를 포함하고, 상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 한다.A system for providing a numerical AI answer service to a legal question according to an embodiment of the present invention for solving the above problem is a query terminal requesting legal advice on the query content: and a case to which an event similar to the query content is applied After collecting case law information and legal consultation information of lawyers from at least one or more external servers, it is processed into a preset form and built into a database. After analyzing legal answers to negation using an artificial intelligence machine learning algorithm, it includes an AI legal/question answer server that provides numerical values of positive and negative values respectively, and the query terminal uses the numerical values in the form of gauges for users It is characterized by running a question-and-answer platform that is displayed to
일 실시예에서, 상기 AI 법률/질의응답서버는 상기 적어도 하나 이상의 외부서버로부터 수집된 사건판례정보 및 법률상담정보를 질문과 답변 형태로 변환한 후, 상기 답변의 성향을 '긍정(적극)' 및 '부정(소극)' 중 어느 하나로 분류하여 상기 데이터베이스로 구축하는 것을 특징으로 한다.In one embodiment, the AI legal/question answering server converts the case precedent information and legal consultation information collected from the at least one or more external servers into a question-and-answer format, and then changes the tendency of the answer to 'positive (actively)' and 'negative (negative)' is characterized in that it is classified into any one of 'negative' and constructed as the database.
일 실시예에서, 상기 AI 법률/질의응답서버는 상기 질문 및 답변을 데이터베이스로 구축 시, 상기 질문 및 답변에 대한 로우(Raw)데이터, 질문에 대한 카테고리, 판례번호, 근거법률 중 적어도 하나 이상이 포함되도록 구축하는 것을 특징으로 한다.In one embodiment, when the AI law/question answer server builds the question and answer into a database, at least one or more of raw data for the question and answer, a category for the question, a case number, and the grounding law It is characterized in that it is built to be included.
일 실시예에서, 상기 AI 법률/질의응답서버는 상기 사용자의 질의내용에 대한 어감을 긍정 및 부정 중 어느 하나로 인식하는 것을 특징으로 한다.In one embodiment, the AI law/question answering server is characterized in that it recognizes the sense of the user's query content as either positive or negative.
일 실시예에서, 상기 AI 법률/질의응답서버는 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정한 후, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 것을 특징으로 한다.In one embodiment, the AI law/question answer server calculates sentence vectors of a plurality of questions and answers constructed in a database using a sentence vector similarity algorithm, and then calculates the sentence vectors of the 10 sentences with the highest similarity between sentences (questions and answers). ), define the perceived similarity that humans feel for the selected sentences as '0' or '1', then learn the defined sentences using the natural language processing learning algorithm (BERT NLP), and use the learned data It is characterized in that learning data is derived by re-learning.
일 실시예에서, 상기 AI 법률/질의응답서버는 자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 것을 특징으로 한다.In one embodiment, the AI law/question answer server is characterized in that it uses a natural language processing algorithm to extract semantic analysis, negative or positive tone, and a preset category for the query content.
일 실시예에서, 상기 AI 법률/질의응답서버는 자연어처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용 내의 문장내용(의미)을 다차원 공간 벡터좌표로 가공처리하는 것을 특징으로 한다.In an embodiment, the AI law/question answer server processes the sentence content (meaning) in the query content into multidimensional space vector coordinates using a natural language processing learning algorithm (BERT NLP).
일 실시예에서, 상기 AI 법률/질의응답서버는 상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 포함하는 사건판례정보 및 법률상담정보를 데이터베이스에서 추출하는 것을 특징으로 한다.In an embodiment, the AI legal/question answering server extracts case precedent information and legal consultation information including a category and multidimensional space vector coordinates similar to the category of the query content and multidimensional space vector coordinates from the database. .
일 실시예에서, 상기 AI 법률/질의응답서버는 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값을 상기 수치값으로 제공하는 것을 특징으로 한다.In one embodiment, the AI legal/question answering server is characterized in that it provides the average value of the positive and negative categories (numeric values) of the extracted at least one or more case precedent information and legal consultation information as the numerical value.
일 실시예에서, 상기 AI 법률/질의응답서버는 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공하는 것을 특징으로 한다.In one embodiment, the AI legal/question answering server has a positive or negative numerical value among the average values of the positive and negative categories (numeric values) of the extracted at least one or more case precedent information and legal consultation information is more than a relatively preset value When calculated as , it is characterized in that the numerical value reflecting the weight is provided.
상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법은 질의단말에서 질의내용에 대한 법률자문을 요청하는 단계; 및 AI 법률/질의응답서버에서 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 수치값으로 제공단계를 포함하고, 상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 하는 한다.A method of providing a numerical AI answering service to a legal question according to an embodiment of the present invention for solving the above problem includes the steps of: requesting legal advice on the content of a query from a query terminal; And the AI law/question answer server collects case precedent information to which cases similar to the above query are applied and legal consultation information of lawyers from at least one or more external servers, then processes them into a preset form to build a database, Based on case precedent information and legal consultation information, after analyzing legal answers to the affirmative and negation of the query contents using an artificial intelligence machine learning algorithm, providing a numerical value, wherein the query terminal uses the numerical value Characterized in executing a question-and-answer platform that displays the value to the user in the form of a gauge.
본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 이용하면, 사용자는 간편하게 자신이 궁금하거나 또는 자신에게 벌어진 사건들에 대한 법률적 지식 또는 법률적 적용여부에 대한 답변을 긍정 및 부정의 수치가 포함된 게이지 형태로 제공받을 수 있고, 이와 유사한 판례 및 사례를 제공받을 수 있다는 이점이 있다.By using the system and method for providing a numerical AI answer service to a legal question according to an embodiment of the present invention, the user can conveniently find out whether the user is curious about himself or whether he has legal knowledge or legal application to the incidents that have occurred to him or her. There is an advantage in that answers to the questions can be provided in the form of gauges containing positive and negative figures, and similar precedents and cases can be provided.
도 1은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템의 네트워크 구성도이다.
도 2는 도 1에 도시된 AI 법률/질의응답서버의 세부 구성도이다.
도 3은 도 1에 도시된 데이터베이스의 데이터 구축형태를 나타낸 일 예시도이다.
도 4 내지 도 6은 자연어처리 학습알고리즘(BERT NLP)을 설명하기 위한 일 예시도이다.
도 7 및 도 8은 도 2에 도시된 질의 및 유사도 분석/추출부의 실행과정을 설명하기 위한 일 예시도이다.
도 9는 질의단말에서 도 2에 도시된 결과 제공부에서 제공한 수치값이 반영된 게이지 바의 일 예시도이다.
도 10은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법의 흐름도이다.
도 11은 도 10에 도시된 S720 과정의 세부 흐름도이다.
도 12는 본 명세서에 개진된 하나 이상의 실시예가 구현될 수 있는 예시적인 컴퓨팅 환경을 도시한 도이다.1 is a network configuration diagram of a system that provides a numerical AI answering service to legal questions according to an embodiment of the present invention.
FIG. 2 is a detailed configuration diagram of the AI law/question answer server shown in FIG. 1. Referring to FIG.
3 is an exemplary diagram illustrating a data construction form of the database shown in FIG. 1 .
4 to 6 are exemplary views for explaining a natural language processing learning algorithm (BERT NLP).
7 and 8 are exemplary diagrams for explaining the execution process of the query and similarity analysis/extraction unit shown in FIG. 2 .
FIG. 9 is an exemplary diagram of a gauge bar in which the numerical value provided by the result providing unit shown in FIG. 2 is reflected in the query terminal.
10 is a flowchart of a method of providing a numerical AI answering service to a legal question according to an embodiment of the present invention.
11 is a detailed flowchart of the process S720 illustrated in FIG. 10 .
12 illustrates an example computing environment in which one or more embodiments disclosed herein may be implemented.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art can easily implement them. However, the present invention may be embodied in several different forms and is not limited to the embodiments described herein. And in order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Throughout the specification, when a part is "connected" with another part, this includes not only the case of being "directly connected" but also the case of being "electrically connected" with another element interposed therebetween. . In addition, when a part "includes" a certain component, it means that other components may be further included, rather than excluding other components, unless otherwise stated, and one or more other features However, it is to be understood that the existence or addition of numbers, steps, operations, components, parts, or combinations thereof is not precluded in advance.
명세서 전체에서 사용되는 정도의 용어 "약", "실질적으로" 등은 언급된 의미에 고유한 제조 및 물질 허용오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본 발명의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다. 본 발명의 명세서 전체에서 사용되는 정도의 용어 "~(하는) 단계" 또는 "~의 단계"는 "~ 를 위한 단계"를 의미하지 않는다. The terms "about", "substantially", etc. to the extent used throughout the specification are used in or close to the numerical value when manufacturing and material tolerances inherent in the stated meaning are presented, and are intended to enhance the understanding of the present invention. To help, precise or absolute figures are used to prevent unfair use by unconscionable infringers of the stated disclosure. As used throughout the specification of the present invention, the term "step of (to)" or "step of" does not mean "step for".
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체 지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.In this specification, a "part" includes a unit realized by hardware, a unit realized by software, and a unit realized using both. In addition, one unit may be implemented using two or more hardware, and two or more units may be implemented by one hardware. Meanwhile, '~ unit' is not limited to software or hardware, and '~ unit' may be configured to be in an addressable storage medium or to reproduce one or more processors. Thus, as an example, '~' denotes components such as software components, object-oriented software components, class components, and task components, and processes, functions, properties, and procedures. , subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays and variables. The functions provided in the components and '~ units' may be combined into a smaller number of components and '~ units' or further separated into additional components and '~ units'. In addition, components and '~ units' may be implemented to play one or more CPUs in a device or secure multimedia card.
본 명세서에 있어서 단말, 장치 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말, 장치 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말, 장치 또는 디바이스에서 수행될 수도 있다. Some of the operations or functions described as being performed by the terminal, apparatus, or device in the present specification may be performed instead of by a server connected to the terminal, apparatus, or device. Similarly, some of the operations or functions described as being performed by the server may also be performed in a terminal, apparatus, or device connected to the server.
본 명세서에 있어서, 단말과 매핑(Mapping) 또는 매칭(Matching)으로 기술된 동작이나 기능 중 일부는, 단말의 식별 정보(Identifying Data)인 단말기의 고유번호나 개인의 식별정보를 매핑 또는 매칭한다는 의미로 해석될 수 있다.In this specification, some of the operations or functions described as mapping or matching with the terminal means mapping or matching the terminal's unique number or personal identification information, which is the identification data of the terminal. can be interpreted as
이하, 첨부된 도면들에 기초하여 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 보다 상세하게 설명하도록 한다.Hereinafter, based on the accompanying drawings, a system and method for providing a numerical AI answering service to a legal question according to an embodiment of the present invention will be described in more detail.
도 1은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템의 네트워크 구성도이고, 도 2는 도 1에 도시된 AI 법률/질의응답서버의 세부 구성도이고, 도 3은 도 1에 도시된 데이터베이스의 데이터 구축형태를 나타낸 일 예시도이고, 도 4 내지 도 6은 자연어처리 학습알고리즘(BERT NLP)을 설명하기 위한 일 예시도이고, 도 7 및 도 8은 도 2에 도시된 질의 및 유사도 분석/추출부의 실행과정을 설명하기 위한 일 예시도이고, 도 9는 질의단말에서 도 2에 도시된 결과 제공부에서 제공한 수치값이 반영된 게이지 바의 일 예시도이다.1 is a network configuration diagram of a system that provides a numerical AI answering service to legal questions according to an embodiment of the present invention, and FIG. 2 is a detailed configuration diagram of the AI legal/question answering server shown in FIG. 3 is an exemplary diagram illustrating a data construction form of the database shown in FIG. 1 , FIGS. 4 to 6 are exemplary views for explaining a natural language processing learning algorithm (BERT NLP), and FIGS. 7 and 8 are FIG. It is an exemplary view for explaining the execution process of the query and similarity analysis/extraction unit shown in 2, and FIG. 9 is an exemplary view of a gauge bar in which the numerical value provided by the result providing unit shown in FIG. 2 is reflected in the query terminal. .
먼저, 도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템(100)은 질의단말(200) 및 AI 법률/질의응답서버(300)를 포함한다.First, as shown in FIG. 1 , the
다만, 도 1의 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템(100)은, 본 발명의 일 실시예에 불과함으로, 도 1을 통하여 본 발명이 한정 해석되는 것은 아니다.However, since the
이때, 도 1의 각 구성요소들은 일반적으로 네트워크를 통해 연결된다. 예를들어, 도 1에 도시된 바와 같이, 적어도 하나 이상의 질의단말(200)은 네트워크를 통해 AI 법률/질의응답서버(300)와 연결될 수 있다.At this time, each component of FIG. 1 is generally connected through a network. For example, as shown in FIG. 1 , at least one
여기서, 네트워크는, 복수의 단말 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크의 일 예에는 RF, 3GPP(3rd Generation Partnership Project) 네트워크, LTE(Long Term Evolution) 네트워크, 5GPP(5th Generation Partnership Project) 네트워크, WIMAX(World Interoperability for Microwave Access) 네트워크, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 블루투스(Bluetooth) 네트워크, NFC 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.Here, the network refers to a connection structure in which information exchange is possible between each node, such as a plurality of terminals and servers, and examples of such networks include RF, 3rd Generation Partnership Project (3GPP) network, and Long Term (LTE). Evolution) network, 5th Generation Partnership Project (5GPP) network, WIMAX (World Interoperability for Microwave Access) network, Internet, LAN (Local Area Network), Wireless LAN (Wireless Local Area Network), WAN (Wide Area Network) , PAN (Personal Area Network), Bluetooth (Bluetooth) network, NFC network, satellite broadcasting network, analog broadcasting network, DMB (Digital Multimedia Broadcasting) network, etc. include, but are not limited thereto.
하기에서, 적어도 하나의 라는 용어는 단수 및 복수를 포함하는 용어로 정의되고, 적어도 하나의 라는 용어가 존재하지 않더라도 각 구성요소가 단수 또는 복수로 존재할 수 있고, 단수 또는 복수를 의미할 수 있음은 자명하다 할 것이다. 또한, 각 구성요소가 단수 또는 복수로 구비되는 것은, 실시예에 따라 변경가능하다 할 것이다.In the following, the term at least one is defined as a term including the singular and the plural, and even if the at least one term does not exist, each element may exist in the singular or plural, and may mean the singular or plural. it will be self-evident In addition, that each component is provided in singular or plural may be changed according to embodiments.
적어도 하나의 질의단말(200)은, 법률질문에 대한 수치화된 AI 답변서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 검색 키워드를 입력하고 검색 결과를 수신하는 단말일 수 있다. 그리고, 적어도 하나의 질의단말(200)은, 검색 결과에 대한 긍정 및 부정답변을 수치적 정보로 수신한 후, 게이지 형태로 표시하는 단말일 수 있다.The at least one
여기서, 적어도 하나의 질의단말(200)은, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다. 이때, 적어도 하나의 사용자 단말(100)은, 네트워크를 통해 원격지의 서버나 단말에 접속할 수 있는 단말로 구현될 수 있다. 적어도 하나의 사용자 단말(100)은, 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 네비게이션, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(smartphone), 스마트 패드(smartpad), 타블렛 PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.Here, the at least one
다음으로, AI 법률/질의응답서버(300)는, 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 긍정 및 부정 각각의 수치값으로 제공하는 구성일 수 있다.Next, the AI law/
상기 AI 법률/질의응답서버(300)는 법률질문에 대한 수치화된 AI 답변서비스 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 제공하는 서버일 수 있다. AI 법률/질의응답서버(300)는 질의내용의 형태, 질의내용 내에 포함된 단어 또는 문장의 키워드를 검출하고, 상기 키워드와 상호연관성 또는 유사도가 높은 기 설정된 개수의 판례정보 및 법률상담정보를 추출한 후, 추출한 판례정보들 및 법률상담정보의 답변결과(긍정 및 부정)를 수치정보로 제공하는 구성일 수 있다.The AI legal/
여기서, AI 법률/질의응답서버(300)는 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다.Here, the AI law/
도 2를 참조하면, AI 법률/질의응답서버(300)는 수집부(310), 전처리부(320), 데이터베이스화부(330), 기계 학습부(340), 자연어 처리부(350), 질의 및 유사도 분석/추출부(360), 긍정/부정 수치화부(370), 결과값 제공부(380)를 포함한다.Referring to FIG. 2 , the AI law/
본 발명의 일 실시예에 따른 AI 법률/질의응답서버(300)나 연동되어 동작하는 다른 서버(미도시)가 적어도 하나의 질의단말(200), 및 적어도 하나의 정보 제공 서버(미도시)로 법률질문에 대한 수치화된 AI 답변서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 전송하는 경우, 적어도 하나의 질의단말(200)은, 해당 서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 설치하거나 열 수 있다. 또한, 웹 브라우저에서 실행되는 스크립트를 이용하여 서비스 프로그램이 적어도 하나의 질의단말(200)에서 구동될 수도 있다. The AI law/
여기서, 웹 브라우저는 웹(WWW: world wide web) 서비스를 이용할 수 있게 하는 프로그램으로 HTML(hyper text mark-up language)로 서술된 하이퍼 텍스트를 받아서 보여주는 프로그램을 의미하며, 예를 들어 넷스케이프(Netscape), 익스플로러(Explorer), 크롬(chrome) 등을 포함한다. 또한, 애플리케이션은 단말 상의 응용 프로그램(application)을 의미하며, 예를 들어, 모바일 단말(스마트폰)에서 실행되는 앱(app)을 포함한다.Here, the web browser is a program that enables the use of a web (WWW: world wide web) service. It means a program that receives and displays hypertext written in HTML (hyper text mark-up language), for example, Netscape. , Explorer, Chrome, etc. In addition, the application means an application on the terminal, for example, includes an app (app) executed in a mobile terminal (smartphone).
도 2를 참조하면, 상기 수집부(310)는 적어도 하나 이상의 외부서버로부터 판례 로우(Raw) 데이터 및 법률 상담(Q&A)데이터를 수집하는 구성일 수 있다.Referring to FIG. 2 , the
여기서, 외부서버는 대한민국 국가벌률정보센터(www.law.go.kr)의 서버일 수 있고, 판례 로우(Raw) 데이터는 지방법원, 고등법원 및 대법원의 판례 빅데이터일 수 있다. 또한, 법률 상담(Q&A)정보는 판례에 대한 변호사들의 답변 및 답변에 근거법률정보를 포함한다.Here, the external server may be a server of the National Penalty Information Center ( www.law.go.kr ) of the Republic of Korea, and the raw precedent data may be precedent big data of the district court, the high court, and the Supreme Court. In addition, legal consultation (Q&A) information includes legal information based on lawyers' answers to cases and answers.
상기 수집부(310)는 Selenium 알고리즘을 이용할 판례정보 및 법률상담정보를 수집할 수 있다. 이때, 수집부(310)는 판례정보 및 법률상담정보를 스크랩핑(Scraping)하여 수집할 수 있는 프로그램이라면 모두 적용할 수 있다.The
상기 전처리부(320)는 사건판례정보의 로우(Raw) 데이터 및 법률 상담데이터를 인덱스(index), 질문, 답변, 카테고리, 판례번호, 근거법률, 판례결과 및 상담답변을 긍정/부정의 카테고리로 분류/정렬/편집하는 과정일 수 있다.The
여기서, 전처리부(320)는 사건판례 데이터를 자연어 처리알고리즘을 이용하여 질문(Q) 및 답변(A)의 형태로 변환가공 처리할 수 있다.Here, the
일 예로, 보통의 판례 데이터는 <판시사항>, <판결요지>, <참조조문>, <참조판례> 등 많은 부분으로 이루어져 있고 그 내용도 복잡하다. 따라서 본 발명에서는 판례 데이터의 필요한 부분만 추출하여 전처리(카테고리화 함)해 향후 유사도 분석 및 이용자들에게 수치화된 답변을 제공할 수 있도록 한다.For example, general case data is composed of many parts, such as <judgment matters>, <judgment summary>, <reference articles>, and <reference precedents>, and the contents are also complex. Therefore, in the present invention, only necessary parts of case data are extracted and pre-processed (categorized) so that similarity analysis and numerical answers can be provided to users in the future.
즉, 전처리부(320)는 판례 데이터 중 <판시사항>의 쟁점내용을 기초로 판결문의 어감을 '긍정' 및 '부정'으로 분류하고, 수치화한다.That is, the
예컨대, 국가법률정보센터에서 제공하는 판례 데이터에는 모두 <판시사항>이라는 일관된 항목이 존재하고 해당 항목 밑에는 [1], [2] 형태로 된 쟁점들이 나타난다. For example, in the case data provided by the National Legal Information Center, there is a consistent item called <judgment matter>, and issues in the form of [1] and [2] appear under the item.
예컨대 <판시사항>에서 [3]까지의 번호는 해당 판례의 쟁점이 세 개 존재한다는 뜻이다. 각 번호에는 쟁점이 무엇이고 해당 쟁점에 대한 판사의 판결을 긍정(“적극”) 및 부정(“소극”)으로 표시된 것을 볼 수 있다. For example, the numbers from <Judgment Matters> to [3] mean that there are three issues in the case. In each number you can see what the issue is and the judge's decision on that issue, marked as positive (“positive”) and negative (“passive”).
다음으로, 법률 데이터베이스화부(330)는 전처리부에서 전처리된 인덱스, 질문, 답변, 질문에 대한 태깅 카테고리, 판례번호, 근거법률, 판례결과 및 상담답변의 긍정/부정 태깅을 카테고리로 분류/정렬/편집하여 데이터베이스에 구축하는 구성일 수 있다.Next, the legal
여기서, 인덱스는 데이터베이스에 등록된 데이터에 부여된 고유번호(고유주소)일 수 있다.Here, the index may be a unique number (unique address) assigned to data registered in the database.
질문은 자연어 질문의 로우(Raw) 데이터이다. 답변은 사용자의 질문에 대한 변호사가 제공한 답변일 수 있다.A question is the raw data of a natural language question. The answer may be an answer provided by a lawyer to the user's question.
상기 태깅 카테고리는 질문 관련 연상키워드로서, 예컨대, 임대차, 퇴직, 해고 등일 수 있다. 근거법률은 사건에 대한 변호사의 답변에 대한 근거 법률일 수 있다.The tagging category is an associative keyword related to a question, and may be, for example, lease, retirement, dismissal, and the like. The grounding law may be the grounding law for the attorney's answer to the case.
부정/긍정 태깅은 사용자의 질문형태가 긍정형으로 끝나는 지, 부정형으로 끝나는 지 판별한 태깅정보이다.Negative/positive tagging is tagging information that determines whether the user's question form ends in an affirmative or negative form.
상기 부정/긍정 태깅은 사용자에게 제공될 수치값에 적용된다. 예들어서 질문이 '명예훼손에 해당되나요?'라면 긍정형이고, '명예훼손에 해당 되지 않는 것인가요?'라면 부정형이다. 이와 같은 태깅을 하는 경우는 수치형 답변에서 긍정형 질문의 20%와, 부정형 질문의 20%는 의미하는 바가 다르기 때문이다. The negative/positive tagging is applied to the numerical value to be provided to the user. For example, if the question is 'Is it defamation?', it's positive, and if it's 'Isn't it defamatory?', it's negative. This is because the meaning of 20% of positive questions and 20% of negative questions in numerical answers is different in the case of such tagging.
따라서 추후 부정형 질문의 수치형 답변을 긍정형으로 치환하는 경우, (100 - 수치형답변) = 치환한 수치형 답변으로 할 수 있도록 하기 위한 정보일 수 있다.Therefore, in the case of substituting an affirmative form for a numerical answer of a negative question later, (100 - Numerical answer) = This may be information to enable a substituted numerical answer.
다음으로, 기계 학습부(340)는 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정하고, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 기능을 수행한다.Next, the
즉, 상기 기계 학습부(340)는 Cosine similarity, Jaccard similarity를 기반으로 임베딩된 문장 벡터들 사이의 유사도를 구할수 있다. 또한, 문장간 유사도가 가장 높은 10개 문장을 선정할 수 있고, 이에 한정되는 것은 아니다.That is, the
또한, 선정된 10개의 문장에 대해 실제 인간이 느끼는 유사도에 대해 인간이 직접 0(유사), 1(비유사)을 태깅하여 BERT(Bidirectional Encoder Representations from Transformers) NLP(Natural Language Processing)를 학습시킬 데이터를 생성한 후, BERT NLP를 학습하도록 동작한다..In addition, data for learning BERT (Bidirectional Encoder Representations from Transformers) NLP (Natural Language Processing) by directly tagging 0 (similarity) and 1 (dissimilarity) for the degree of similarity felt by real humans to the selected 10 sentences After creating , it operates to learn BERT NLP.
참고로, BERT는 문장 형태와 위치에 따라 동일한 단어도 다른 임베딩을 갖게 되도록 함으로써, 중의성을 해소하도록 설계하였다. 예를 들어 “account”와 “of the river”의 bank는 Word2Vec 또는 GloVe에서는 동일한 벡터를 갖는다. 그러나 이 단어는 문맥에 따라 전혀 다른 의미를 지녀야 하며 실제로 ELMo 또는 BERT에서는 전혀 다른 벡터를 갖는다. 도면에 도시된 예제는 1) 나는 너를 사랑해 2) 나는 너를 사랑했다 3) 사랑 누가 말했나. 이 세 문장에 대한 형태소 분석 결과를 입력값으로 코사인 디스턴스를 확인하면, 모두 동일하게 '사랑' 위치에 대한 워드 임베딩 값을 취했고 코사인 디스턴스를 출력했다. 이 중 문장이 비슷한 1번과 2번의 '사랑' 벡터는 매우 가까운 거리로 나타난다. 반면, 문장이 전혀 다른 3번은 동일한 '사랑'이라도 거리가 상당히 멀게 표시된다.For reference, BERT is designed to eliminate ambiguity by allowing the same word to have different embeddings depending on the sentence shape and position. For example, the banks of “account” and “of the river” have the same vector in Word2Vec or GloVe. However, this word should have a completely different meaning depending on the context, and in fact it has a completely different vector in ELMo or BERT. The example shown in the drawing is 1) I love you 2) I loved you 3) Love Who said it? If the cosine distance was checked with the result of morphological analysis of these three sentences as an input value, the word embedding value for the 'love' position was equally taken and the cosine distance was outputted. Among them, the 'love' vectors of Nos. 1 and 2, which have similar sentences, appear very close. On the other hand, the three sentences with completely different sentences are displayed quite far apart even if they are the same 'love'.
다른 예로, BERT는 문장 또는 단어 벡터들 간의 코사인 유사도를 통해 유사의미를 벡터거리로 제공할 수 있다.As another example, BERT may provide a similarity as a vector distance through cosine similarity between sentence or word vectors.
가령, 2번, 3번 '사랑' 벡터의 단순 Sum으로 1번 '사랑' 벡터와의 거리를 측정해 볼 경우, 두 벡터 Sum과의 거리는 0.17 정도다. 이 중 거리가 가까운 2번 벡터에 가중치를 부여한 Weighted Sum과의 거리를 살펴본다. 거리가 훨씬 가까워졌다. 반대로 거리가 먼 3번 벡터에 가중치를 부여해본다. 더 멀어지는 것을 확인할 수 있다. 코사인 디스턴스는 앵글을 측정하기 때문에 벡터가 커져도 거리는 동일하며, 아래는 벡터를 10배 더 크게 해도 동일한 거리를 나타내는 경우를 보여준다. 보다 자세한 내용은 코사인 유사도의 의미에서 확인할 수 있다.For example, when measuring the distance to 'love'
다음으로, 자연어 처리부(350)는 자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 구성일 수 있다.Next, the natural
자연어 처리부(350)는 질문 내용을 분석하는 데 있어, 해당 질문의 의미 분석 벡터화 과정, 부정/긍정 태깅화 과정 및 카테고리 태깅화 과정을 수행한다.In analyzing the question content, the natural
여기서, 의미 분석 벡터화 과정은 질문의 의미를 기반으로 파악한 다차원 공간 상의 벡터좌표로 해당 질의내용을 처리하는 과정일 수 있다. 이때, Universal Sentence Encoder와 BERT 등의 자연어 처리 알고리즘이 사용된다. 이를 통해 의미가 비슷한 질문들은 거리가 가까운 고유 좌표를 갖을 수 있다.Here, the semantic analysis vectorization process may be a process of processing the query content with vector coordinates in a multidimensional space grasped based on the meaning of the question. In this case, natural language processing algorithms such as Universal Sentence Encoder and BERT are used. This allows questions with similar meanings to have unique coordinates that are close to each other.
다음으로, 부정/긍정 태깅화 과정은 사용자의 질문이 긍정형으로 끝나는 지, 부정형으로 끝나는 지 판별하여 태깅하는 과정이다.Next, the negative/positive tagging process is a process of tagging by determining whether the user's question ends in an affirmative or negative form.
예를 들어서 질문이 '명예훼손에 해당되나요?'라면 긍정형이고, '명예훼손에 해당 되지 않는 것인가요?'라면 부정형이다. 이와 같은 태깅을 하는 경우는 수치형 답변에서 긍정형 질문의 20%와, 부정형 질문의 20%는 의미하는 바가 다르기 때문이다. 따라서 추후 부정형 질문의 수치형 답변을 긍정형으로 치환하는 경우, (100 - 수치형답변) = 치환한 수치형 답변으로 할 수 있다.For example, if the question is 'Is it defamation?', it's positive, and if it's 'Isn't it defamatory?', it's negative. This is because the meaning of 20% of positive questions and 20% of negative questions in numerical answers is different in the case of such tagging. Therefore, in the case of substituting an affirmative form for a numerical answer to a negative question later, (100 - Numerical answer) = a substituted numerical answer.
다음으로, 카테고리 태깅화 과정은 질문내용과 관련된 키워드를 태깅화하는 과정으로, 예컨대, 질문내용에 대한 분야 키워드 또는 핵심 키워드인 임대차, 퇴직, 해고 등에 대한 키워드를 태깅화하는 과정일 수 있다.Next, the category tagging process is a process of tagging keywords related to the content of the question, for example, it may be a process of tagging keywords for lease, retirement, dismissal, etc., which are field keywords or core keywords for the question content.
다음으로, 질의 및 유사도 분석/추출부(360)는 상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 데이터베이스 내의 정보와 비교분석하는 구성일 수 있다.Next, the query and similarity analysis/
즉, 질의 및 유사도 분석/추출부(360)는 질의내용의 카테고리와 유사한 카테고리를 갖는 판례정보 및 법률상담정보를 데이터베이스에서 1차 추출한 후, 질의내용의 다차원 공간 벡터좌표와 유사한(좌표거리가 가장 가까운) 다차원 공간 벡터좌표를 갖는 정보를 1차 추출한 정보에서 2차 추출하는 구성일 수 있다.That is, the query and similarity analysis/
한편, 질의 및 유사도 분석/추출부(360)는 상술한 과정으로 질의내용과 연관된 법률사례를 추출할 수 있다.Meanwhile, the query and similarity analysis/
긍정/부정 수치화부(370)는 질의 및 유사도 분석/추출부(360)에서 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보 각각의 답변에 대한 긍정 및 부정 카테고리(수치값)의 평균값을 산출하는 구성일 수 있다.The positive/
상기 긍정/부정 수치화부(370)는 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공한다.The positive/negative
상기 결과값 제공부(380)는 긍정/부정 수치화부(370)에서 산출된 긍정 및 부정의 수치값을 게이지 형태의 그래프로 제공한다.The result
상기 결과값 제공부(380)는 앙상블(Ensemble) 기법에서 최종 의사결정에서 스택킹(Stacking)을 사용하는 방식과 유사하게 여려 사례의 수치를 입력값으로 사용해서 비선형 모델을 통해 제공할 수 있다.The
도 10은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법의 흐름도이고, 도 11은 도 10에 도시된 S720 과정의 세부 흐름도이다. 10 is a flowchart of a method of providing a numerical AI answer service to a legal question according to an embodiment of the present invention, and FIG. 11 is a detailed flowchart of the process S720 shown in FIG.
도 10에 도시된 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법은 도 1에 도시된 시스템을 통해 구현될 수 있다.A method of providing a numerical AI answer service to a legal question shown in FIG. 10 may be implemented through the system shown in FIG. 1 .
도 10 및 도 11을 참조하면, 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법(S700)은 먼저, 질의단말(200)에서 법률질문에 대한 수치화된 AI 답변서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 질의내용에 대한 법률자문 또는 법률답변을 AI 법률/질의응답서버로 요청(S710)한다.10 and 11 , the method ( S700 ) of providing a numerical AI answer service to a legal question according to an embodiment of the present invention is first, a numerical AI answer to a legal question in the
여기서, 상기 질의단말(200)에서 실행된 법률질문에 대한 수치화된 AI 답변서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션은 후술하는 AI 법률/질의응답서버에서 제공된 법률답변에 대한 수치값을 게이지 형태로 사용자에게 표시할 수 있다.Here, the numerical value of the AI answer service related web page, app page, program or application to the legal question executed in the
질의내용이 접수되면, AI 법률/질의응답서버(300)에서 상기 질의내용과 유사한 법률사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 보유한 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 수치값으로 제공(S720)한다. When a query is received, the AI law/
보다 구체적으로, 상기 S720 과정은 상기 적어도 하나 이상의 외부서버로부터 수집된 사건판례정보 및 법률상담정보를 질문과 답변 형태로 변환한 후, 상기 답변의 성향을 '긍정(적극)' 및 '부정(소극)' 중 어느 하나로 분류하여 상기 데이터베이스로 구축하는 과정을 포함할 수 있다.More specifically, the S720 process converts the case precedent information and legal consultation information collected from the at least one or more external servers into a question-and-answer format, and then changes the tendency of the answer to 'positive (active)' and 'negative (passive)' )' may include the process of classifying it into any one of ' and building the database.
또한, 상기 질문 및 답변을 데이터베이스로 구축 시, 상기 질문 및 답변에 대한 로우(Raw)데이터, 질문에 대한 카테고리, 판례번호, 근거법률 중 적어도 하나 이상이 포함되도록 구축하는 과정을 포함할 수 있다.In addition, when constructing the question and answer as a database, it may include a process of constructing to include at least one of raw data for the question and answer, a category for the question, a case number, and a grounding law.
또한, 상기 사용자의 질의내용에 대한 어감을 긍정 및 부정 중 어느 하나로 판단하는 과정을 포함할 수 있다.In addition, it may include a process of determining the sense of the user's query as any one of positive and negative.
또한, 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정한 후, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 과정을 포함할 수 있다.In addition, after calculating sentence vectors of a plurality of questions and answers constructed in the database using the sentence vector similarity algorithm, 10 sentences (questions and answers) with the highest similarity between sentences are selected, and then, After defining the perceived similarity felt by humans as '0' or '1', learning the defined sentences using the natural language processing learning algorithm (BERT NLP), re-learning the learned data to derive learning data. can do.
또한, 자연어 처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 과정을 포함할 수 있다.In addition, it may include a process of extracting a semantic analysis, negative or positive tone of the query content, and a preset category using a natural language processing learning algorithm (BERT NLP).
또한, 상기 자연어처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용 내의 문장내용(의미)을 다차원 공간 벡터좌표로 가공처리하는 과정을 포함할 수 있다.In addition, the process may include processing the sentence content (meaning) in the query content into multidimensional space vector coordinates using the natural language processing learning algorithm (BERT NLP).
또한, 상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 포함하는 사건판례정보 및 법률상담정보를 데이터베이스에서 추출하는 과정을 포함할 수 있다.In addition, it may include a process of extracting from the database case precedent information and legal consultation information including a category and multidimensional space vector coordinates similar to the category of the query content and multidimensional space vector coordinates.
또한, 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값을 상기 수치값으로 제공하는 과정을 포함할 수 있다.In addition, it may include the process of providing the average value of the positive and negative categories (numeric values) of the extracted at least one or more case precedent information and legal consultation information as the numerical value.
또한, 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공하는 과정을 더 포함할 수 있다.In addition, if the positive or negative numerical value among the average values of the positive and negative categories (numeric values) of at least one or more case precedent information and legal consultation information extracted is calculated to be more than a relatively preset number, a numerical value reflecting the weight is provided The process may further include
보다 구체적으로, 상기 S720 과정은 AI 법률/질의응답서버(300)에서 실행되는 과정으로, 수집부(310)에서 적어도 하나 이상의 외부서버로부터 판례 로우(Raw) 데이터 및 법률 상담(Q&A)데이터를 대한민국 국가벌률정보센터(www.law.go.kr)의 서버와 같은 외부서버에서 수집한다. 이때, 판례 로우(Raw) 데이터는 지방법원, 고등법원 및 대법원의 판례 빅데이터일 수 있다. 또한, 법률 상담(Q&A)정보는 판례에 대한 변호사들의 답변 및 답변에 근거법률정보를 포함한다.More specifically, the S720 process is a process executed by the AI legal/
이후, 전처리부(320)에서 사건판례정보의 로우(Raw) 데이터 및 법률 상담데이터를 인덱스(index), 질문, 답변, 카테고리, 판례번호, 근거법률, 판례결과 및 상담답변을 긍정/부정의 카테고리로 분류/정렬/편집하는 과정 및 사건판례 데이터를 자연어 처리알고리즘을 이용하여 질문(Q) 및 답변(A)의 형태로 변환가공 처리하는 과정을 수행한다.Then, in the
전처리부(320)의 동작이 완료되면, 기계 학습부(340)에서 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정하고, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 기능을 수행한다.When the operation of the
즉, 상기 기계 학습부(340)는 Cosine similarity, Jaccard similarity를 기반으로 임베딩된 문장 벡터들 사이의 유사도를 구할수 있다. 또한, 문장간 유사도가 가장 높은 10개 문장을 선정할 수 있고, 이에 한정되는 것은 아니다.That is, the
또한, 선정된 10개의 문장에 대해 실제 인간이 느끼는 유사도에 대해 인간이 직접 0(유사), 1(비유사)을 태깅하여 BERT(Bidirectional Encoder Representations from Transformers) NLP(Natural Language Processing)를 학습시킬 데이터를 생성한 후, BERT NLP를 학습하도록 동작한다.In addition, data for learning BERT (Bidirectional Encoder Representations from Transformers) NLP (Natural Language Processing) by directly tagging 0 (similarity) and 1 (dissimilarity) for the degree of similarity felt by real humans to the selected 10 sentences After creating , it operates to learn BERT NLP.
다음으로, 자연어 처리부(350)에서 자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출 및 질문 내용을 분석하는 데 있어, 해당 질문의 의미 분석 벡터화 과정, 부정/긍정 태깅화 과정 및 카테고리 태깅화 과정을 수행한다.Next, when the natural
여기서, 의미 분석 벡터화 과정은 질문의 의미를 기반으로 파악한 다차원 공간 상의 벡터좌표로 해당 질의내용을 처리하는 과정일 수 있다. 이때, Universal Sentence Encoder와 BERT 등의 자연어 처리 알고리즘이 사용된다. 이를 통해 의미가 비슷한 질문들은 거리가 가까운 고유 좌표를 갖을 수 있다.Here, the semantic analysis vectorization process may be a process of processing the query content with vector coordinates in a multidimensional space grasped based on the meaning of the question. In this case, natural language processing algorithms such as Universal Sentence Encoder and BERT are used. This allows questions with similar meanings to have unique coordinates that are close to each other.
다음으로, 부정/긍정 태깅화 과정은 사용자의 질문이 긍정형으로 끝나는 지, 부정형으로 끝나는 지 판별하여 태깅하는 과정이다.Next, the negative/positive tagging process is a process of tagging by determining whether the user's question ends in an affirmative or negative form.
예를 들어서 질문이 '명예훼손에 해당되나요?'라면 긍정형이고, '명예훼손에 해당 되지 않는 것인가요?'라면 부정형이다. 이와 같은 태깅을 하는 경우는 수치형 답변에서 긍정형 질문의 20%와, 부정형 질문의 20%는 의미하는 바가 다르기 때문이다. 따라서 추후 부정형 질문의 수치형 답변을 긍정형으로 치환하는 경우, (100 - 수치형답변) = 치환한 수치형 답변으로 할 수 있다.For example, if the question is 'Is it defamation?', it's positive, and if it's 'Isn't it defamatory?', it's negative. This is because the meaning of 20% of positive questions and 20% of negative questions in numerical answers is different in the case of such tagging. Therefore, in the case of substituting an affirmative form for a numerical answer to a negative question later, (100 - Numerical answer) = a substituted numerical answer.
다음으로, 카테고리 태깅화 과정은 질문내용과 관련된 키워드를 태깅화하는 과정으로, 예컨대, 질문내용에 대한 분야 키워드 또는 핵심 키워드인 임대차, 퇴직, 해고 등에 대한 키워드를 태깅화하는 과정일 수 있다.Next, the category tagging process is a process of tagging keywords related to the content of the question, for example, it may be a process of tagging keywords for lease, retirement, dismissal, etc., which are field keywords or core keywords for the question content.
자연어 처리부(350)의 역할이 완료되면, 질의 및 유사도 분석/추출부(360)에서 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 데이터베이스 내의 정보와 비교분석하는 과정을 수행한다.When the role of the natural
여기서, 질의 및 유사도 분석/추출부(360)는 질의내용의 카테고리와 유사한 카테고리를 갖는 판례정보 및 법률상담정보를 데이터베이스에서 1차 추출한 후, 질의내용의 다차원 공간 벡터좌표와 유사한(좌표거리가 가장 가까운) 다차원 공간 벡터좌표를 갖는 정보를 1차 추출한 정보에서 2차 추출하는 구성일 수 있다.Here, the query and similarity analysis/
또한, 질의 및 유사도 분석/추출부(360)에서 상술한 과정으로 질의내용과 연관된 법률사례를 추출하는 과정을 수행한다.In addition, the query and similarity analysis/
이후, 긍정/부정 수치화부(370)에서 질의 및 유사도 분석/추출부(360)에서 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보 각각의 답변에 대한 긍정 및 부정 카테고리(수치값)의 평균값을 산출하는 과정 및 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공한다.Thereafter, the average value of the positive and negative categories (numeric values) for each answer of at least one case precedent information and legal consultation information extracted from the query and similarity analysis/
마지막으로, 결과값 제공부(380)에서 긍정/부정 수치화부(370)에서 산출된 긍정 및 부정의 수치값을 게이지 형태의 그래프를 질의단말(200)로 제공한다. 여기서, 결과값 제공부(380)는 앙상블(Ensemble) 기법에서 최종 의사결정에서 스택킹(Stacking)을 사용하는 방식과 유사하게 여려 사례의 수치를 입력값으로 사용해서 비선형 모델을 통해 제공할 수 있다.Finally, the result
따라서, 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 이용하면, 사용자는 간편하게 자신이 궁금하거나 또는 자신에게 벌어진 사건들에 대한 법률적 지식 또는 법률적 적용여부에 대한 답변을 긍정 및 부정의 수치가 포함된 게이지 형태로 제공받을 수 있고, 이와 유사한 판례 및 사례를 제공받을 수 있다는 이점이 있다.Therefore, by using the system and method for providing a numerical AI answer service to a legal question according to an embodiment of the present invention, the user can conveniently be curious about himself or have legal knowledge or legal knowledge about the events that have occurred to him. It has the advantage of being able to receive an answer on whether to apply it in the form of a gauge including positive and negative values, and to receive similar precedents and cases.
도 12는 본 명세서에 개진된 하나 이상의 실시예가 구현될 수 있는 예시적인 컴퓨팅 환경을 도시하는 도면으로, 상술한 하나 이상의 실시예를 구현하도록 구성된 컴퓨팅 디바이스(1100)를 포함하는 시스템(1000)의 예시를 도시한다. 예를 들어, 컴퓨팅 디바이스(1100)는 개인 컴퓨터, 서버 컴퓨터, 핸드헬드 또는 랩탑 디바이스, 모바일 디바이스(모바일폰, PDA, 미디어 플레이어 등), 멀티프로세서 시스템, 소비자 전자기기, 미니 컴퓨터, 메인프레임 컴퓨터, 임의의 전술된 시스템 또는 디바이스를 포함하는 분산 컴퓨팅 환경 등을 포함하지만, 이것으로 한정되는 것은 아니다.12 is a diagram illustrating an example computing environment in which one or more embodiments disclosed herein may be implemented, and is an illustration of a
컴퓨팅 디바이스(1100)는 적어도 하나의 프로세싱 유닛(1110) 및 메모리(1120)를 포함할 수 있다. 여기서, 프로세싱 유닛(1110)은 예를 들어 중앙처리장치(CPU), 그래픽처리장치(GPU), 마이크로프로세서, 주문형 반도체(Application Specific Integrated Circuit, ASIC), Field Programmable Gate Arrays(FPGA) 등을 포함할 수 있으며, 복수의 코어를 가질 수 있다. 메모리(1120)는 휘발성 메모리(예를 들어, RAM 등), 비휘발성 메모리(예를 들어, ROM, 플래시 메모리 등) 또는 이들의 조합일 수 있다. 또한, 컴퓨팅 디바이스(1100)는 추가적인 스토리지(1130)를 포함할 수 있다. 스토리지(1130)는 자기 스토리지, 광학 스토리지 등을 포함하지만 이것으로 한정되지 않는다. 스토리지(1130)에는 본 명세서에 개진된 하나 이상의 실시예를 구현하기 위한 컴퓨터 판독 가능한 명령이 저장될 수 있고, 운영 시스템, 애플리케이션 프로그램 등을 구현하기 위한 다른 컴퓨터 판독 가능한 명령도 저장될 수 있다. 스토리지(1130)에 저장된 컴퓨터 판독 가능한 명령은 프로세싱 유닛(1110)에 의해 실행되기 위해 메모리(1120)에 로딩될 수 있다. 또한, 컴퓨팅 디바이스(1100)는 입력 디바이스(들)(1140) 및 출력 디바이스(들)(1150)을 포함할 수 있다. The
여기서, 입력 디바이스(들)(1140)은 예를 들어 키보드, 마우스, 펜, 음성 입력 디바이스, 터치 입력 디바이스, 적외선 카메라, 비디오 입력 디바이스 또는 임의의 다른 입력 디바이스 등을 포함할 수 있다. 또한, 출력 디바이스(들)(1150)은 예를 들어 하나 이상의 디스플레이, 스피커, 프린터 또는 임의의 다른 출력 디바이스 등을 포함할 수 있다. 또한, 컴퓨팅 디바이스(1100)는 다른 컴퓨팅 디바이스에 구비된 입력 디바이스 또는 출력 디바이스를 입력 디바이스(들)(1140) 또는 출력 디바이스(들)(1150)로서 사용할 수도 있다.Here, the input device(s) 1140 may include, for example, a keyboard, mouse, pen, voice input device, touch input device, infrared camera, video input device, or any other input device, or the like. Further, the output device(s) 1150 may include, for example, one or more displays, speakers, printers, or any other output device, or the like. Also, the
또한, 컴퓨팅 디바이스(1100)는 컴퓨팅 디바이스(1100)가 다른 디바이스(예를 들어, 컴퓨팅 디바이스(1300))와 통신할 수 있게 하는 통신접속(들)(1160)을 포함할 수 있다.
여기서, 통신 접속(들)(1160)은 모뎀, 네트워크 인터페이스 카드(NIC), 통합 네트워크 인터페이스, 무선 주파수 송신기/수신기, 적외선 포트, USB 접속 또는 컴퓨팅 디바이스(1100)를 다른 컴퓨팅 디바이스에 접속시키기 위한 다른 인터페이스를 포함할 수 있다. 또한, 통신 접속(들)(1160)은 유선 접속 또는 무선 접속을 포함할 수 있다. 상술한 컴퓨팅 디바이스(1100)의 각 구성요소는 버스 등의 다양한 상호접속(예를 들어, 주변 구성요소 상호접속(PCI), USB, 펌웨어(IEEE 1394), 광학적 버스 구조 등)에 의해 접속될 수도 있고, 네트워크(1200)에 의해 상호접속될 수도 있다. 본 명세서에서 사용되는 "구성요소", "시스템" 등과 같은 용어들은 일반적으로 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어, 또는 실행중인 소프트웨어인 컴퓨터 관련 엔티티를 지칭하는 것이다. Here, communication connection(s) 1160 may be a modem, network interface card (NIC), integrated network interface, radio frequency transmitter/receiver, infrared port, USB connection, or other for connecting
예를 들어, 구성요소는 프로세서 상에서 실행중인 프로세스, 프로세서, 객체, 실행 가능물(executable), 실행 스레드, 프로그램 및/또는 컴퓨터일 수 있지만, 이것으로 한정되는 것은 아니다. 예를 들어, 컨트롤러 상에서 구동중인 애플리케이션 및 컨트롤러 모두가 구성요소일 수 있다. 하나 이상의 구성요소는 프로세스 및/또는 실행의 스레드 내에 존재할 수 있으며, 구성요소는 하나의 컴퓨터 상에서 로컬화될 수 있고, 둘 이상의 컴퓨터 사이에서 분산될 수도 있다.For example, a component can be, but is not limited to being, a process running on a processor, a processor, an object, an executable, a thread of execution, a program, and/or a computer. For example, both an application running on a controller and a controller may be a component. One or more components may reside within a process and/or thread of execution, and a component may be localized on one computer or distributed between two or more computers.
이상에서 본 발명은 실시예를 참조하여 상세히 설명되었으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 상기에서 설명된 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 부가 및 변형이 가능할 것임은 당연하며, 이와 같은 변형된 실시 형태들 역시 아래에 첨부한 특허청구범위에 의하여 정하여지는 본 발명의 보호 범위에 속하는 것으로 이해되어야 할 것이다.In the above, the present invention has been described in detail with reference to the embodiments, but those of ordinary skill in the art to which the present invention pertains may make various substitutions, additions and modifications within the scope not departing from the technical spirit described above. Of course, it should be understood that such modified embodiments also fall within the protection scope of the present invention as defined by the appended claims below.
100: 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템
200: 질의단말
300: AI 법률/질의응답서버
310: 수집부
320: 전처리부
330: 데이터베이스화부
340: 기계 학습부
350: 자연어 처리부
360: 질의 및 유사도 분석/추출부
370: 긍정/부정 수치화부
380: 결과값 제공부100: A system that provides numerical AI answering services to legal questions
200: query terminal
300: AI legal / question and answer server
310: collection unit
320: preprocessor
330: database conversion unit
340: machine learning unit
350: natural language processing unit
360: Query and similarity analysis/extraction unit
370: positive / negative digitization unit
380: result value providing unit
Claims (20)
상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 긍정 및 부정 각각의 수치값으로 제공하는 AI 법률/질의응답서버를 포함하고,
상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
Inquiry terminal requesting legal advice on the content of the inquiry: and
After collecting case precedent information and legal consultation information of lawyers to which a case similar to the above query is applied from at least one external server, it is processed into a preset form and built into a database, and the established case precedent information and legal consultation information are stored After analyzing the legal answers to the affirmative and negative for the above query content using an artificial intelligence machine learning algorithm based on it, it includes an AI legal / question-and-answer server that provides numerical values of positive and negative values, respectively,
The system providing a numerical AI answering service to legal questions, characterized in that the query terminal executes a question and answer platform that displays the numerical value to the user in the form of a gauge.
상기 AI 법률/질의응답서버는
상기 적어도 하나 이상의 외부서버로부터 수집된 사건판례정보 및 법률상담정보를 질문과 답변 형태로 변환한 후, 상기 답변의 성향을 '긍정(적극)' 및 '부정(소극)' 중 어느 하나로 분류하여 상기 데이터베이스로 구축하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
According to claim 1,
The AI law/question answer server
After converting the case precedent information and legal consultation information collected from the at least one or more external servers into a question and answer format, the tendency of the answer is classified into either 'positive (positive)' or 'negative (passive)' A system that provides numerical AI answering services to legal questions built into a database.
상기 AI 법률/질의응답서버는
상기 질문 및 답변을 데이터베이스로 구축 시, 상기 질문 및 답변에 대한 로우(Raw)데이터, 질문에 대한 카테고리, 판례번호, 근거법률 중 적어도 하나 이상이 포함되도록 구축하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
3. The method of claim 2,
The AI law/question answer server
Numerical AI answering service to legal questions constructed so that at least one of raw data for the questions and answers, the category for the question, the case number, and the underlying law are included when building the questions and answers as a database system that provides
상기 AI 법률/질의응답서버는
상기 사용자의 질의내용에 대한 어감을 긍정 및 부정 중 어느 하나로 인식하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
According to claim 1,
The AI law/question answer server
A system for providing a numerical AI answering service to a legal question, characterized in that it recognizes the tone of the user's query as either positive or negative.
상기 AI 법률/질의응답서버는
문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정한 후, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
4. The method of claim 3,
The AI law/question answer server
After calculating the sentence vectors of a plurality of questions and answers constructed in the database using the sentence vector similarity algorithm, the 10 sentences (questions and answers) with the highest similarity between sentences are selected, and the human After defining the perceived similarity as '0' or '1', learning the defined sentences using the Natural Language Processing Learning Algorithm (BERT NLP), re-learning the learned data to quantify the legal questions to derive learning data A system that provides an AI response service.
상기 AI 법률/질의응답서버는
자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
3. The method of claim 2,
The AI law/question answer server
A system for providing a numerical AI answer service to legal questions, characterized in that by using a natural language processing algorithm, semantic analysis of the query content, negative or positive tone, and a preset category are extracted.
상기 AI 법률/질의응답서버는
자연어처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용 내의 문장내용(의미)을 다차원 공간 벡터좌표로 가공처리하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
7. The method of claim 6,
The AI law/question answer server
A system that provides a numerical AI answer service to a legal question that processes the sentence content (meaning) in the query content into multidimensional space vector coordinates using a natural language processing learning algorithm (BERT NLP).
상기 AI 법률/질의응답서버는
상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 포함하는 사건판례정보 및 법률상담정보를 데이터베이스에서 추출하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
8. The method of claim 7,
The AI law/question answer server
A system that provides a numerical AI answer service to a legal question that extracts case precedent information and legal consultation information including categories and multidimensional space vector coordinates similar to the category of the query content and multidimensional space vector coordinates from the database.
상기 AI 법률/질의응답서버는
추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값을 상기 수치값으로 제공하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
9. The method of claim 8,
The AI law/question answer server
A system for providing a numerical AI answer service to legal questions that provides the average value of the positive and negative categories (numeric values) of at least one extracted case precedent information and legal consultation information as the numerical value.
상기 AI 법률/질의응답서버는
추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
10. The method of claim 9,
The AI law/question answer server
A law providing a numerical value reflecting a weight when the positive or negative numerical value among the average values of the positive and negative categories (numeric values) of at least one or more extracted case precedent information and legal consultation information is relatively calculated to be greater than or equal to a preset value A system that provides numerical AI answering services to questions.
AI 법률/질의응답서버에서 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 수치값으로 제공단계를 포함하고, 상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
requesting legal advice (answer) on the contents of the inquiry from the inquiry terminal; and
In the AI law/question answer server, case precedent information and legal consultation information of lawyers to which cases similar to the above query are applied are collected from at least one external server, and then processed into a preset form to build a database, and the constructed case After analyzing the legal answers to the affirmation and negation of the query contents using an artificial intelligence machine learning algorithm based on precedent information and legal consultation information, providing a numerical value, wherein the query terminal provides the numerical value A method of providing a numerical AI answering service to legal questions, characterized in that it runs a question-and-answer platform that displays to the user in the form of a gauge.
상기 수치값을 제공하는 단계는
상기 적어도 하나 이상의 외부서버로부터 수집된 사건판례정보 및 법률상담정보를 질문과 답변 형태로 변환한 후, 상기 답변의 성향을 '긍정(적극)' 및 '부정(소극)' 중 어느 하나로 분류하여 상기 데이터베이스로 구축하는 단계를 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
12. The method of claim 11,
The step of providing the numerical value is
After converting the case precedent information and legal consultation information collected from the at least one or more external servers into a question and answer format, the tendency of the answer is classified into either 'positive (positive)' or 'negative (passive)' A method of providing a numerical AI answering service to legal questions including the step of building it into a database.
상기 수치값을 제공하는 단계는
상기 질문 및 답변을 데이터베이스로 구축 시, 상기 질문 및 답변에 대한 로우(Raw)데이터, 질문에 대한 카테고리, 판례번호, 근거법률 중 적어도 하나 이상이 포함되도록 구축하는 단계를 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
13. The method of claim 12,
The step of providing the numerical value is
Numericalization of legal questions, including the step of constructing to include at least one of raw data for the questions and answers, a category for the question, a case number, and the underlying law when building the questions and answers as a database How to provide a customized AI answer service.
상기 수치값을 제공하는 단계는
상기 사용자의 질의내용에 대한 어감을 긍정 및 부정 중 어느 하나로 판단하는 단계를 포함하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
12. The method of claim 11,
The step of providing the numerical value is
A method of providing a numerical AI answer service to a legal question, characterized in that it comprises the step of judging any one of positive and negative tone of the user's query content.
상기 수치값을 제공하는 단계는
문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정한 후, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 단계를 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
14. The method of claim 13,
The step of providing the numerical value is
After calculating the sentence vectors of a plurality of questions and answers constructed in the database using the sentence vector similarity algorithm, the 10 sentences (questions and answers) with the highest similarity between sentences are selected, and the human After defining the perceived similarity as '0' or '1', learning the sentences defined using a natural language processing learning algorithm (BERT NLP), and re-learning the learned data to derive learning data How to provide numerical AI answering service to questions.
상기 수치값을 제공하는 단계는
자연어 처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 단계를 포함하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
13. The method of claim 12,
The step of providing the numerical value is
Using a natural language processing learning algorithm (BERT NLP) to analyze the meaning of the query, negative or positive tone, and extracting a preset category Provides a numerical AI answer service to legal questions How to.
상기 수치값을 제공하는 단계는
상기 자연어처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용 내의 문장내용(의미)을 다차원 공간 벡터좌표로 가공처리하는 단계를 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
17. The method of claim 16,
The step of providing the numerical value is
A method of providing a numerical AI answer service to a legal question, comprising processing the sentence content (meaning) in the query content into multidimensional space vector coordinates using the natural language processing learning algorithm (BERT NLP).
상기 수치값을 제공하는 단계는
상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 포함하는 사건판례정보 및 법률상담정보를 데이터베이스에서 추출하는 단계를 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
18. The method of claim 17,
The step of providing the numerical value is
A method of providing a numerical AI answer service to a legal question, comprising extracting from a database case precedent information and legal consultation information including categories and multidimensional space vector coordinates similar to the category of the query content and multidimensional space vector coordinates .
상기 수치값을 제공하는 단계는
추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값을 상기 수치값으로 제공하는 단계를 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
19. The method of claim 18,
The step of providing the numerical value is
A method of providing a numerical AI answer service to a legal question, comprising the step of providing an average value of positive and negative categories (numeric values) of at least one or more extracted case precedent information and legal consultation information as the numerical value.
상기 수치값을 제공하는 단계는
추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공하는 단계를 더 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.20. The method of claim 19,
The step of providing the numerical value is
When the positive or negative numerical value among the average values of the positive and negative categories (numeric values) of the extracted at least one or more case precedent information and legal consultation information is relatively calculated to be greater than or equal to a preset value, providing a numerical value reflecting the weight How to provide a numerical AI answering service to legal questions that further includes.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200126150A KR20220042838A (en) | 2020-09-28 | 2020-09-28 | Systems and Methods to Provide AI Answering Service for Legal Questions |
KR1020230043428A KR20230051652A (en) | 2020-09-28 | 2023-04-03 | Systems and Methods to Provide AI Answering Service for Legal Questions |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200126150A KR20220042838A (en) | 2020-09-28 | 2020-09-28 | Systems and Methods to Provide AI Answering Service for Legal Questions |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230043428A Division KR20230051652A (en) | 2020-09-28 | 2023-04-03 | Systems and Methods to Provide AI Answering Service for Legal Questions |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220042838A true KR20220042838A (en) | 2022-04-05 |
Family
ID=81182383
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200126150A KR20220042838A (en) | 2020-09-28 | 2020-09-28 | Systems and Methods to Provide AI Answering Service for Legal Questions |
KR1020230043428A KR20230051652A (en) | 2020-09-28 | 2023-04-03 | Systems and Methods to Provide AI Answering Service for Legal Questions |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230043428A KR20230051652A (en) | 2020-09-28 | 2023-04-03 | Systems and Methods to Provide AI Answering Service for Legal Questions |
Country Status (1)
Country | Link |
---|---|
KR (2) | KR20220042838A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102439321B1 (en) * | 2022-05-04 | 2022-09-05 | 한국데이터플랫폼 주식회사 | System for Providing Semantic Analysis Finding and Analyzing Sentence Meaning |
KR102583818B1 (en) * | 2022-09-14 | 2023-10-04 | 주식회사 글로랑 | Method for sampling process of personality test using question and answer network representing group of respondents based on bert |
KR102659523B1 (en) * | 2023-07-18 | 2024-04-19 | 주식회사 더엔젤브릿지 | System for retrieving legal information |
CN117909485A (en) * | 2024-03-19 | 2024-04-19 | 武汉百智诚远科技有限公司 | Legal consultation intelligent interaction method and system based on large language model |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190143583A (en) | 2018-06-21 | 2019-12-31 | 주식회사 머니브레인 | Method and computer readable recording medium for providing answers based on hybrid hierarchical conversation flow model with conversation management model using machine learning |
-
2020
- 2020-09-28 KR KR1020200126150A patent/KR20220042838A/en not_active Application Discontinuation
-
2023
- 2023-04-03 KR KR1020230043428A patent/KR20230051652A/en not_active Application Discontinuation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190143583A (en) | 2018-06-21 | 2019-12-31 | 주식회사 머니브레인 | Method and computer readable recording medium for providing answers based on hybrid hierarchical conversation flow model with conversation management model using machine learning |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102439321B1 (en) * | 2022-05-04 | 2022-09-05 | 한국데이터플랫폼 주식회사 | System for Providing Semantic Analysis Finding and Analyzing Sentence Meaning |
KR20230156242A (en) * | 2022-05-04 | 2023-11-14 | 한국데이터플랫폼 주식회사 | Method for providing meaning search service through semantic analysis |
KR102583818B1 (en) * | 2022-09-14 | 2023-10-04 | 주식회사 글로랑 | Method for sampling process of personality test using question and answer network representing group of respondents based on bert |
KR20240037868A (en) * | 2022-09-14 | 2024-03-22 | 주식회사 글로랑 | Devices, methods and programs for sampling a group of respondents based on artificial intelligence |
KR102659523B1 (en) * | 2023-07-18 | 2024-04-19 | 주식회사 더엔젤브릿지 | System for retrieving legal information |
CN117909485A (en) * | 2024-03-19 | 2024-04-19 | 武汉百智诚远科技有限公司 | Legal consultation intelligent interaction method and system based on large language model |
CN117909485B (en) * | 2024-03-19 | 2024-05-24 | 武汉百智诚远科技有限公司 | Legal consultation intelligent interaction method and system based on large language model |
Also Published As
Publication number | Publication date |
---|---|
KR20230051652A (en) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108829822B (en) | Media content recommendation method and device, storage medium and electronic device | |
WO2021159632A1 (en) | Intelligent questioning and answering method and apparatus, computer device, and computer storage medium | |
KR20220042838A (en) | Systems and Methods to Provide AI Answering Service for Legal Questions | |
CN111241237B (en) | Intelligent question-answer data processing method and device based on operation and maintenance service | |
CN110929038B (en) | Knowledge graph-based entity linking method, device, equipment and storage medium | |
CN113435203B (en) | Multi-modal named entity recognition method and device and electronic equipment | |
CN110674271B (en) | Question and answer processing method and device | |
CN107491436A (en) | A kind of recognition methods of title party and device, server, storage medium | |
CN102663129A (en) | Medical field deep question and answer method and medical retrieval system | |
CN113707299A (en) | Auxiliary diagnosis method and device based on inquiry session and computer equipment | |
CN111651579B (en) | Information query method, device, computer equipment and storage medium | |
CN112347339A (en) | Search result processing method and device | |
CN109977292A (en) | Searching method, calculates equipment and computer readable storage medium at device | |
CN115796182A (en) | Multi-modal named entity recognition method based on entity-level cross-modal interaction | |
CN112307190A (en) | Medical literature sorting method and device, electronic equipment and storage medium | |
CN114519613B (en) | Price data processing method and device, electronic equipment and storage medium | |
CN113342944B (en) | Corpus generalization method, apparatus, device and storage medium | |
CN113569118B (en) | Self-media pushing method, device, computer equipment and storage medium | |
KR101955920B1 (en) | Search method and apparatus using property language | |
CN116956925A (en) | Electronic medical record named entity identification method and device, electronic equipment and storage medium | |
CN116680401A (en) | Document processing method, document processing device, apparatus and storage medium | |
CN116719999A (en) | Text similarity detection method and device, electronic equipment and storage medium | |
CN111460114A (en) | Retrieval method, device, equipment and computer readable storage medium | |
CN117009456A (en) | Medical query text processing method, device, equipment, medium and electronic product | |
CN114398482A (en) | Dictionary construction method and device, electronic equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
E601 | Decision to refuse application | ||
E801 | Decision on dismissal of amendment |