KR20230051652A - Systems and Methods to Provide AI Answering Service for Legal Questions - Google Patents
Systems and Methods to Provide AI Answering Service for Legal Questions Download PDFInfo
- Publication number
- KR20230051652A KR20230051652A KR1020230043428A KR20230043428A KR20230051652A KR 20230051652 A KR20230051652 A KR 20230051652A KR 1020230043428 A KR1020230043428 A KR 1020230043428A KR 20230043428 A KR20230043428 A KR 20230043428A KR 20230051652 A KR20230051652 A KR 20230051652A
- Authority
- KR
- South Korea
- Prior art keywords
- legal
- question
- positive
- information
- negative
- Prior art date
Links
- 238000000034 method Methods 0.000 title abstract description 68
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 28
- 238000010801 machine learning Methods 0.000 claims abstract description 14
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 6
- 230000004044 response Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 abstract description 49
- 238000003058 natural language processing Methods 0.000 description 38
- 239000013598 vector Substances 0.000 description 37
- 238000004458 analytical method Methods 0.000 description 19
- 238000009223 counseling Methods 0.000 description 14
- 238000000605 extraction Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000007792 addition Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Economics (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Human Computer Interaction (AREA)
- Technology Law (AREA)
- Medical Informatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
본 발명은 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법에 관한 것이다.The present invention relates to a system and method for providing a digitized AI answer service to legal questions.
법무관련 영역은 기본적으로 상담을 필수로 하고 있지만, 전문가와 상담을 연결하는 다양한 수단 또는 양식(또 는 Form)을 제공하고 사전 조사형태로 진행되는정도에 그치는 것이 현재로서는 대부분이다. Consultation is basically required in the legal field, but at present, most of them are limited to providing various means or forms (or forms) to connect experts and counseling and proceeding in the form of preliminary investigation.
이는 상담을 정형화하여 ARS 방식으로 각종 단계와 조건을 확인하며 처리하게 되므로 서비스 진행 속도가 매우 지루하고 서비스 경험이 나빠 해당 서비스의 자동화된 처리에 매우 큰 장애요소가 된다. 하지만 자연어 처리를 통해 상담이 가능하게 하면 기계학습에 따라 상담의 정밀도가 높아지고 유관산업의 활성 화를 시간과 공간의 제약없이 할 수 있게 된다.This standardizes counseling and checks and processes various stages and conditions in the ARS method, so the service progress is very tedious and the service experience is poor, which is a very big obstacle to the automated processing of the service. However, if consultation is made possible through natural language processing, the precision of consultation will increase according to machine learning, and related industries can be revitalized without time and space limitations.
이에 본 발명은 사용자의 법률질문에 대한 답변을 AI 학습알고리즘을 이용하여 제공할 수 있는 시스템 및 방법을 개시하고자 한다.Accordingly, the present invention intends to disclose a system and method capable of providing answers to users' legal questions using an AI learning algorithm.
본 발명이 해결하고자 하는 과제는 종래의 문제점을 해결할 수 있는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 제공하는 데 그 목적이 있다.The object of the present invention is to provide a system and method for providing a digitized AI answer service to legal questions that can solve conventional problems.
상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템은 질의내용에 대한 법률자문을 요청하는 질의단말: 및 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 긍정 및 부정 각각의 수치값으로 제공하는 AI 법률/질의응답서버를 포함하고, 상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 한다.A system for providing a digitized AI answer service to legal questions according to an embodiment of the present invention to solve the above problems is an inquiry terminal requesting legal advice on the inquiry: and a case to which an event similar to the above inquiry is applied. After collecting case precedent information and legal counseling information from at least one external server, processing it in a preset form and constructing a database, affirming and An AI legal/question answering server that analyzes legal answers to injustice using artificial intelligence machine learning algorithms and provides them as numerical values of positive and negative values, and the inquiry terminal provides the numerical values to the user in the form of gauges. It is characterized in that it executes a question and answer platform displayed to.
일 실시예에서, 상기 AI 법률/질의응답서버는 상기 적어도 하나 이상의 외부서버로부터 수집된 사건판례정보 및 법률상담정보를 질문과 답변 형태로 변환한 후, 상기 답변의 성향을 '긍정(적극)' 및 '부정(소극)' 중 어느 하나로 분류하여 상기 데이터베이스로 구축하는 것을 특징으로 한다.In one embodiment, the AI legal/question response server converts the case precedent information and legal consultation information collected from the at least one external server into a question and answer format, and then sets the inclination of the answer to 'positive (positive)'. and 'negative (negative)', characterized in that the database is constructed.
일 실시예에서, 상기 AI 법률/질의응답서버는 상기 질문 및 답변을 데이터베이스로 구축 시, 상기 질문 및 답변에 대한 로우(Raw)데이터, 질문에 대한 카테고리, 판례번호, 근거법률 중 적어도 하나 이상이 포함되도록 구축하는 것을 특징으로 한다.In one embodiment, when the AI law/question answering server builds the questions and answers into a database, at least one or more of the raw data for the questions and answers, the category for the question, the case number, and the underlying law It is characterized by being built to include.
일 실시예에서, 상기 AI 법률/질의응답서버는 상기 사용자의 질의내용에 대한 어감을 긍정 및 부정 중 어느 하나로 인식하는 것을 특징으로 한다.In one embodiment, the AI legal/question response server is characterized in recognizing the user's query content as either positive or negative.
일 실시예에서, 상기 AI 법률/질의응답서버는 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정한 후, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 것을 특징으로 한다.In one embodiment, the AI legal/question answering server calculates sentence vectors of a plurality of questions and answers constructed as a database using a sentence vector similarity algorithm, and then selects 10 sentences (questions and answers) having the highest similarity between sentences. ) is selected, and the similarity felt by humans for the selected sentences is defined as '0' or '1', and then the defined sentences are learned using a natural language processing learning algorithm (BERT NLP), and the learned data It is characterized in that the learning data is derived by re-learning.
일 실시예에서, 상기 AI 법률/질의응답서버는 자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 것을 특징으로 한다.In one embodiment, the AI legal/question response server is characterized in that it extracts a semantic analysis, a negative or positive sense, and a preset category for the content of the query using a natural language processing algorithm.
일 실시예에서, 상기 AI 법률/질의응답서버는 자연어처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용 내의 문장내용(의미)을 다차원 공간 벡터좌표로 가공처리하는 것을 특징으로 한다.In one embodiment, the AI law/question response server is characterized in that it processes the sentence content (meaning) in the query content into multi-dimensional space vector coordinates using a natural language processing learning algorithm (BERT NLP).
일 실시예에서, 상기 AI 법률/질의응답서버는 상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 포함하는 사건판례정보 및 법률상담정보를 데이터베이스에서 추출하는 것을 특징으로 한다.In one embodiment, the AI legal/question response server extracts case precedent information and legal consultation information including categories and multidimensional space vector coordinates similar to the categories of the inquiry contents and multidimensional space vector coordinates from the database. .
일 실시예에서, 상기 AI 법률/질의응답서버는 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값을 상기 수치값으로 제공하는 것을 특징으로 한다.In one embodiment, the AI legal/question response server is characterized in that it provides an average value of positive and negative categories (numerical values) of at least one extracted case precedent information and legal consultation information as the numerical value.
일 실시예에서, 상기 AI 법률/질의응답서버는 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공하는 것을 특징으로 한다.In one embodiment, the AI legal/question response server has a positive or negative numerical value among the average values of positive and negative categories (numeric values) of at least one case case precedent information and legal consultation information extracted relative to a predetermined value or more. When calculated as , it is characterized in that it provides a numerical value reflecting the weight.
상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법은 질의단말에서 질의내용에 대한 법률자문을 요청하는 단계; 및 AI 법률/질의응답서버에서 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 수치값으로 제공단계를 포함하고, 상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 하는 한다.A method for providing a digitized AI answer service for legal questions according to an embodiment of the present invention for solving the above problems includes requesting legal advice on inquiry contents from an inquiry terminal; And in the AI legal/question response server, case precedent information and legal counseling information of lawyers to which cases similar to the above query were applied are collected from at least one external server, processed in a preset form, and built into a database. Based on case precedent information and legal consultation information, analyzing legal answers to positive and negative questions about the contents of the inquiry using an artificial intelligence machine learning algorithm, and then providing them as numerical values, wherein the inquiry terminal includes the numerical values It is characterized by executing a question answering platform that displays a value to a user in the form of a gauge.
본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 이용하면, 사용자는 간편하게 자신이 궁금하거나 또는 자신에게 벌어진 사건들에 대한 법률적 지식 또는 법률적 적용여부에 대한 답변을 긍정 및 부정의 수치가 포함된 게이지 형태로 제공받을 수 있고, 이와 유사한 판례 및 사례를 제공받을 수 있다는 이점이 있다.Using the system and method for providing a digitized AI answer service to legal questions according to an embodiment of the present invention, users can easily inquire about themselves or legal knowledge or legal application of cases that have occurred to them. There is an advantage in that answers to can be provided in the form of gauges containing positive and negative values, and similar precedents and cases can be provided.
도 1은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템의 네트워크 구성도이다.
도 2는 도 1에 도시된 AI 법률/질의응답서버의 세부 구성도이다.
도 3은 도 1에 도시된 데이터베이스의 데이터 구축형태를 나타낸 일 예시도이다.
도 4 내지 도 6은 자연어처리 학습알고리즘(BERT NLP)을 설명하기 위한 일 예시도이다.
도 7 및 도 8은 도 2에 도시된 질의 및 유사도 분석/추출부의 실행과정을 설명하기 위한 일 예시도이다.
도 9는 질의단말에서 도 2에 도시된 결과 제공부에서 제공한 수치값이 반영된 게이지 바의 일 예시도이다.
도 10은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법의 흐름도이다.
도 11은 도 10에 도시된 S720 과정의 세부 흐름도이다.
도 12는 본 명세서에 개진된 하나 이상의 실시예가 구현될 수 있는 예시적인 컴퓨팅 환경을 도시한 도이다.1 is a network configuration diagram of a system that provides a digitized AI answer service to legal questions according to an embodiment of the present invention.
2 is a detailed configuration diagram of the AI legal/question response server shown in FIG.
FIG. 3 is an exemplary view showing a data construction form of the database shown in FIG. 1 .
4 to 6 are exemplary diagrams for explaining a natural language processing learning algorithm (BERT NLP).
7 and 8 are exemplary diagrams for explaining an execution process of the query and similarity analysis/extraction unit shown in FIG. 2 .
FIG. 9 is an exemplary view of a gauge bar in which a numerical value provided by a result providing unit shown in FIG. 2 is reflected in a query terminal.
10 is a flowchart of a method of providing a digitized AI answer service to legal questions according to an embodiment of the present invention.
FIG. 11 is a detailed flowchart of the process S720 shown in FIG. 10 .
12 is an illustration of an example computing environment in which one or more embodiments set forth herein may be implemented.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, embodiments of the present invention will be described in detail so that those skilled in the art can easily practice the present invention with reference to the accompanying drawings. However, the present invention may be embodied in many different forms and is not limited to the embodiments described herein. And in order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Throughout the specification, when a part is said to be "connected" to another part, this includes not only the case where it is "directly connected" but also the case where it is "electrically connected" with another element interposed therebetween. . In addition, when a part "includes" a certain component, this means that it may further include other components, not excluding other components, unless otherwise stated, and one or more other characteristics. However, it should be understood that it does not preclude the possibility of existence or addition of numbers, steps, operations, components, parts, or combinations thereof.
명세서 전체에서 사용되는 정도의 용어 "약", "실질적으로" 등은 언급된 의미에 고유한 제조 및 물질 허용오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본 발명의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다. 본 발명의 명세서 전체에서 사용되는 정도의 용어 "~(하는) 단계" 또는 "~의 단계"는 "~ 를 위한 단계"를 의미하지 않는다. As used throughout the specification, the terms "about", "substantially", etc., are used at or approximating that value when manufacturing and material tolerances inherent in the stated meaning are given, and do not convey an understanding of the present invention. Accurate or absolute figures are used to help prevent exploitation by unscrupulous infringers of the disclosed disclosure. The term "step of (doing)" or "step of" as used throughout the specification of the present invention does not mean "step for".
본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체 지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.In this specification, a "unit" includes a unit realized by hardware, a unit realized by software, and a unit realized using both. Further, one unit may be realized using two or more hardware, and two or more units may be realized by one hardware. On the other hand, '~ unit' is not limited to software or hardware, and '~ unit' may be configured to be in an addressable storage medium or configured to reproduce one or more processors. Thus, as an example, '~unit' refers to components such as software components, object-oriented software components, class components, and task components, processes, functions, properties, and procedures. , subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays and variables. Functions provided within components and '~units' may be combined into smaller numbers of components and '~units' or further separated into additional components and '~units'. In addition, components and '~units' may be implemented to play one or more CPUs in a device or a secure multimedia card.
본 명세서에 있어서 단말, 장치 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말, 장치 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말, 장치 또는 디바이스에서 수행될 수도 있다. In this specification, some of the operations or functions described as being performed by a terminal, device, or device may be performed instead by a server connected to the terminal, device, or device. Likewise, some of the operations or functions described as being performed by the server may also be performed by a terminal, apparatus, or device connected to the server.
본 명세서에 있어서, 단말과 매핑(Mapping) 또는 매칭(Matching)으로 기술된 동작이나 기능 중 일부는, 단말의 식별 정보(Identifying Data)인 단말기의 고유번호나 개인의 식별정보를 매핑 또는 매칭한다는 의미로 해석될 수 있다.In this specification, some of the operations or functions described as mapping or matching with the terminal mean mapping or matching the terminal's unique number or personal identification information, which is the terminal's identifying data. can be interpreted as
이하, 첨부된 도면들에 기초하여 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 보다 상세하게 설명하도록 한다.Hereinafter, based on the accompanying drawings, a system and method for providing a digitized AI answer service to legal questions according to an embodiment of the present invention will be described in more detail.
도 1은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템의 네트워크 구성도이고, 도 2는 도 1에 도시된 AI 법률/질의응답서버의 세부 구성도이고, 도 3은 도 1에 도시된 데이터베이스의 데이터 구축형태를 나타낸 일 예시도이고, 도 4 내지 도 6은 자연어처리 학습알고리즘(BERT NLP)을 설명하기 위한 일 예시도이고, 도 7 및 도 8은 도 2에 도시된 질의 및 유사도 분석/추출부의 실행과정을 설명하기 위한 일 예시도이고, 도 9는 질의단말에서 도 2에 도시된 결과 제공부에서 제공한 수치값이 반영된 게이지 바의 일 예시도이다.1 is a network configuration diagram of a system that provides a digitized AI answer service for legal questions according to an embodiment of the present invention, and FIG. 2 is a detailed configuration diagram of the AI legal/question response server shown in FIG. 1, 3 is an exemplary diagram showing a data construction form of the database shown in FIG. 1, FIGS. 4 to 6 are exemplary diagrams for explaining a natural language processing learning algorithm (BERT NLP), and FIGS. 7 and 8 are diagrams. 2 is an exemplary diagram for explaining the execution process of the query and similarity analysis/extraction unit, and FIG. 9 is an exemplary diagram of a gauge bar reflecting numerical values provided by the result providing unit shown in FIG. 2 in a query terminal. .
먼저, 도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템(100)은 질의단말(200) 및 AI 법률/질의응답서버(300)를 포함한다.First, as shown in FIG. 1, the
다만, 도 1의 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템(100)은, 본 발명의 일 실시예에 불과함으로, 도 1을 통하여 본 발명이 한정 해석되는 것은 아니다.However, since the
이때, 도 1의 각 구성요소들은 일반적으로 네트워크를 통해 연결된다. 예를들어, 도 1에 도시된 바와 같이, 적어도 하나 이상의 질의단말(200)은 네트워크를 통해 AI 법률/질의응답서버(300)와 연결될 수 있다.At this time, each component of FIG. 1 is generally connected through a network. For example, as shown in FIG. 1 , at least one
여기서, 네트워크는, 복수의 단말 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크의 일 예에는 RF, 3GPP(3rd Generation Partnership Project) 네트워크, LTE(Long Term Evolution) 네트워크, 5GPP(5th Generation Partnership Project) 네트워크, WIMAX(World Interoperability for Microwave Access) 네트워크, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 블루투스(Bluetooth) 네트워크, NFC 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.Here, the network means a connection structure capable of exchanging information between each node, such as a plurality of terminals and servers, and examples of such networks include RF, 3rd Generation Partnership Project (3GPP) network, Long Term LTE Evolution) network, 5GPP (5th Generation Partnership Project) network, WIMAX (World Interoperability for Microwave Access) network, Internet, LAN (Local Area Network), Wireless LAN (Wireless Local Area Network), WAN (Wide Area Network) , PAN (Personal Area Network), Bluetooth (Bluetooth) network, NFC network, satellite broadcasting network, analog broadcasting network, DMB (Digital Multimedia Broadcasting) network, etc. are included, but are not limited thereto.
하기에서, 적어도 하나의 라는 용어는 단수 및 복수를 포함하는 용어로 정의되고, 적어도 하나의 라는 용어가 존재하지 않더라도 각 구성요소가 단수 또는 복수로 존재할 수 있고, 단수 또는 복수를 의미할 수 있음은 자명하다 할 것이다. 또한, 각 구성요소가 단수 또는 복수로 구비되는 것은, 실시예에 따라 변경가능하다 할 것이다.In the following, the term at least one is defined as a term including singular and plural, and even if at least one term does not exist, each component may exist in singular or plural, and may mean singular or plural. It will be self-evident. In addition, the singular or plural number of each component may be changed according to embodiments.
적어도 하나의 질의단말(200)은, 법률질문에 대한 수치화된 AI 답변서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 검색 키워드를 입력하고 검색 결과를 수신하는 단말일 수 있다. 그리고, 적어도 하나의 질의단말(200)은, 검색 결과에 대한 긍정 및 부정답변을 수치적 정보로 수신한 후, 게이지 형태로 표시하는 단말일 수 있다.At least one
여기서, 적어도 하나의 질의단말(200)은, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다. 이때, 적어도 하나의 사용자 단말(100)은, 네트워크를 통해 원격지의 서버나 단말에 접속할 수 있는 단말로 구현될 수 있다. 적어도 하나의 사용자 단말(100)은, 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 네비게이션, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(smartphone), 스마트 패드(smartpad), 타블렛 PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.Here, at least one
다음으로, AI 법률/질의응답서버(300)는, 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 긍정 및 부정 각각의 수치값으로 제공하는 구성일 수 있다.Next, the AI legal/
상기 AI 법률/질의응답서버(300)는 법률질문에 대한 수치화된 AI 답변서비스 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 제공하는 서버일 수 있다. AI 법률/질의응답서버(300)는 질의내용의 형태, 질의내용 내에 포함된 단어 또는 문장의 키워드를 검출하고, 상기 키워드와 상호연관성 또는 유사도가 높은 기 설정된 개수의 판례정보 및 법률상담정보를 추출한 후, 추출한 판례정보들 및 법률상담정보의 답변결과(긍정 및 부정)를 수치정보로 제공하는 구성일 수 있다.The AI legal/
여기서, AI 법률/질의응답서버(300)는 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다.Here, the AI law/
도 2를 참조하면, AI 법률/질의응답서버(300)는 수집부(310), 전처리부(320), 데이터베이스화부(330), 기계 학습부(340), 자연어 처리부(350), 질의 및 유사도 분석/추출부(360), 긍정/부정 수치화부(370), 결과값 제공부(380)를 포함한다.Referring to FIG. 2, the AI law/
본 발명의 일 실시예에 따른 AI 법률/질의응답서버(300)나 연동되어 동작하는 다른 서버(미도시)가 적어도 하나의 질의단말(200), 및 적어도 하나의 정보 제공 서버(미도시)로 법률질문에 대한 수치화된 AI 답변서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 전송하는 경우, 적어도 하나의 질의단말(200)은, 해당 서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 설치하거나 열 수 있다. 또한, 웹 브라우저에서 실행되는 스크립트를 이용하여 서비스 프로그램이 적어도 하나의 질의단말(200)에서 구동될 수도 있다. The AI law/
여기서, 웹 브라우저는 웹(WWW: world wide web) 서비스를 이용할 수 있게 하는 프로그램으로 HTML(hyper text mark-up language)로 서술된 하이퍼 텍스트를 받아서 보여주는 프로그램을 의미하며, 예를 들어 넷스케이프(Netscape), 익스플로러(Explorer), 크롬(chrome) 등을 포함한다. 또한, 애플리케이션은 단말 상의 응용 프로그램(application)을 의미하며, 예를 들어, 모바일 단말(스마트폰)에서 실행되는 앱(app)을 포함한다.Here, the web browser is a program that enables the use of web (WWW: world wide web) services and means a program that receives and displays hypertext described in HTML (hyper text mark-up language). For example, Netscape , Explorer, Chrome, etc. In addition, an application means an application on a terminal, and includes, for example, an app running on a mobile terminal (smart phone).
도 2를 참조하면, 상기 수집부(310)는 적어도 하나 이상의 외부서버로부터 판례 로우(Raw) 데이터 및 법률 상담(Q&A)데이터를 수집하는 구성일 수 있다.Referring to FIG. 2 , the
여기서, 외부서버는 대한민국 국가벌률정보센터(www.law.go.kr)의 서버일 수 있고, 판례 로우(Raw) 데이터는 지방법원, 고등법원 및 대법원의 판례 빅데이터일 수 있다. 또한, 법률 상담(Q&A)정보는 판례에 대한 변호사들의 답변 및 답변에 근거법률정보를 포함한다.Here, the external server may be a server of the National Penalty Information Center ( www.law.go.kr ) of the Republic of Korea, and the precedent raw data may be precedent big data of district courts, high courts, and the Supreme Court. In addition, legal advice (Q&A) information includes legal information based on lawyers' answers and answers to precedents.
상기 수집부(310)는 Selenium 알고리즘을 이용할 판례정보 및 법률상담정보를 수집할 수 있다. 이때, 수집부(310)는 판례정보 및 법률상담정보를 스크랩핑(Scraping)하여 수집할 수 있는 프로그램이라면 모두 적용할 수 있다.The
상기 전처리부(320)는 사건판례정보의 로우(Raw) 데이터 및 법률 상담데이터를 인덱스(index), 질문, 답변, 카테고리, 판례번호, 근거법률, 판례결과 및 상담답변을 긍정/부정의 카테고리로 분류/정렬/편집하는 과정일 수 있다.The
여기서, 전처리부(320)는 사건판례 데이터를 자연어 처리알고리즘을 이용하여 질문(Q) 및 답변(A)의 형태로 변환가공 처리할 수 있다.Here, the
일 예로, 보통의 판례 데이터는 <판시사항>, <판결요지>, <참조조문>, <참조판례> 등 많은 부분으로 이루어져 있고 그 내용도 복잡하다. 따라서 본 발명에서는 판례 데이터의 필요한 부분만 추출하여 전처리(카테고리화 함)해 향후 유사도 분석 및 이용자들에게 수치화된 답변을 제공할 수 있도록 한다.For example, ordinary precedent data consists of many parts such as <judgment matter>, <judgment gist>, <reference clause>, and <reference precedent>, and the contents are also complex. Therefore, in the present invention, only necessary parts of precedent data are extracted and preprocessed (categorized) so that future similarity analysis and numerical answers can be provided to users.
즉, 전처리부(320)는 판례 데이터 중 <판시사항>의 쟁점내용을 기초로 판결문의 어감을 '긍정' 및 '부정'으로 분류하고, 수치화한다.That is, the
예컨대, 국가법률정보센터에서 제공하는 판례 데이터에는 모두 <판시사항>이라는 일관된 항목이 존재하고 해당 항목 밑에는 [1], [2] 형태로 된 쟁점들이 나타난다. For example, in the precedent data provided by the National Legal Information Center, there is a consistent item called <Judgement>, and issues in the form of [1] and [2] appear under that item.
예컨대 <판시사항>에서 [3]까지의 번호는 해당 판례의 쟁점이 세 개 존재한다는 뜻이다. 각 번호에는 쟁점이 무엇이고 해당 쟁점에 대한 판사의 판결을 긍정(“적극”) 및 부정(“소극”)으로 표시된 것을 볼 수 있다. For example, the number from <Judgement> to [3] means that there are three issues in the case. Each number shows what the issue is and the judge's decision on that issue, marked affirmatively (“positive”) and negatively (“negatively”).
다음으로, 법률 데이터베이스화부(330)는 전처리부에서 전처리된 인덱스, 질문, 답변, 질문에 대한 태깅 카테고리, 판례번호, 근거법률, 판례결과 및 상담답변의 긍정/부정 태깅을 카테고리로 분류/정렬/편집하여 데이터베이스에 구축하는 구성일 수 있다.Next, the
여기서, 인덱스는 데이터베이스에 등록된 데이터에 부여된 고유번호(고유주소)일 수 있다.Here, the index may be a unique number (unique address) given to data registered in the database.
질문은 자연어 질문의 로우(Raw) 데이터이다. 답변은 사용자의 질문에 대한 변호사가 제공한 답변일 수 있다.A question is the raw data of a natural language question. The answer may be an answer provided by an attorney to the user's question.
상기 태깅 카테고리는 질문 관련 연상키워드로서, 예컨대, 임대차, 퇴직, 해고 등일 수 있다. 근거법률은 사건에 대한 변호사의 답변에 대한 근거 법률일 수 있다.The tagging category is a question-related association keyword, and may be, for example, lease, retirement, or dismissal. The grounding law may be the grounding law for the lawyer's answer to the case.
부정/긍정 태깅은 사용자의 질문형태가 긍정형으로 끝나는 지, 부정형으로 끝나는 지 판별한 태깅정보이다.Negative/positive tagging is tagging information that determines whether the user's question form ends in a positive or negative form.
상기 부정/긍정 태깅은 사용자에게 제공될 수치값에 적용된다. 예들어서 질문이 '명예훼손에 해당되나요?'라면 긍정형이고, '명예훼손에 해당 되지 않는 것인가요?'라면 부정형이다. 이와 같은 태깅을 하는 경우는 수치형 답변에서 긍정형 질문의 20%와, 부정형 질문의 20%는 의미하는 바가 다르기 때문이다. The negative/positive tagging is applied to numerical values to be presented to the user. For example, if the question is 'Is it applicable to defamation?', it is a positive type, and if 'Is it not applicable to defamation?', it is a negative type. This kind of tagging is because 20% of positive questions and 20% of negative questions in numerical answers have different meanings.
따라서 추후 부정형 질문의 수치형 답변을 긍정형으로 치환하는 경우, (100 - 수치형답변) = 치환한 수치형 답변으로 할 수 있도록 하기 위한 정보일 수 있다.Therefore, when the numerical answer of a negative question is replaced with a positive one later, (100 - numeric answer) = may be information for replacing the numerical answer.
다음으로, 기계 학습부(340)는 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정하고, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 기능을 수행한다.Next, the
즉, 상기 기계 학습부(340)는 Cosine similarity, Jaccard similarity를 기반으로 임베딩된 문장 벡터들 사이의 유사도를 구할수 있다. 또한, 문장간 유사도가 가장 높은 10개 문장을 선정할 수 있고, 이에 한정되는 것은 아니다.That is, the
또한, 선정된 10개의 문장에 대해 실제 인간이 느끼는 유사도에 대해 인간이 직접 0(유사), 1(비유사)을 태깅하여 BERT(Bidirectional Encoder Representations from Transformers) NLP(Natural Language Processing)를 학습시킬 데이터를 생성한 후, BERT NLP를 학습하도록 동작한다..In addition, data for learning BERT (Bidirectional Encoder Representations from Transformers) NLP (Natural Language Processing) by manually tagging 0 (similar) and 1 (dissimilar) for the similarity felt by humans for the selected 10 sentences After generating, it operates to learn BERT NLP.
참고로, BERT는 문장 형태와 위치에 따라 동일한 단어도 다른 임베딩을 갖게 되도록 함으로써, 중의성을 해소하도록 설계하였다. 예를 들어 “account”와 “of the river”의 bank는 Word2Vec 또는 GloVe에서는 동일한 벡터를 갖는다. 그러나 이 단어는 문맥에 따라 전혀 다른 의미를 지녀야 하며 실제로 ELMo 또는 BERT에서는 전혀 다른 벡터를 갖는다. 도면에 도시된 예제는 1) 나는 너를 사랑해 2) 나는 너를 사랑했다 3) 사랑 누가 말했나. 이 세 문장에 대한 형태소 분석 결과를 입력값으로 코사인 디스턴스를 확인하면, 모두 동일하게 '사랑' 위치에 대한 워드 임베딩 값을 취했고 코사인 디스턴스를 출력했다. 이 중 문장이 비슷한 1번과 2번의 '사랑' 벡터는 매우 가까운 거리로 나타난다. 반면, 문장이 전혀 다른 3번은 동일한 '사랑'이라도 거리가 상당히 멀게 표시된다.For reference, BERT is designed to resolve ambiguity by making the same word have different embeddings depending on the sentence form and position. For example, banks of “account” and “of the river” have the same vectors in Word2Vec or GloVe. However, this word should have a completely different meaning depending on the context, and in fact it has a completely different vector in ELMo or BERT. Examples shown in the drawing are 1) I love you 2) I loved you 3) Love Who Said. When the cosine distance is checked using the morphological analysis results for these three sentences as input values, the word embedding value for the position of 'love' is identically taken and the cosine distance is output. Among them, the 'love' vectors of No. 1 and No. 2, which have similar sentences, appear at a very close distance. On the other hand, in the case of
다른 예로, BERT는 문장 또는 단어 벡터들 간의 코사인 유사도를 통해 유사의미를 벡터거리로 제공할 수 있다.As another example, BERT may provide similar meaning as a vector distance through cosine similarity between sentence or word vectors.
가령, 2번, 3번 '사랑' 벡터의 단순 Sum으로 1번 '사랑' 벡터와의 거리를 측정해 볼 경우, 두 벡터 Sum과의 거리는 0.17 정도다. 이 중 거리가 가까운 2번 벡터에 가중치를 부여한 Weighted Sum과의 거리를 살펴본다. 거리가 훨씬 가까워졌다. 반대로 거리가 먼 3번 벡터에 가중치를 부여해본다. 더 멀어지는 것을 확인할 수 있다. 코사인 디스턴스는 앵글을 측정하기 때문에 벡터가 커져도 거리는 동일하며, 아래는 벡터를 10배 더 크게 해도 동일한 거리를 나타내는 경우를 보여준다. 보다 자세한 내용은 코사인 유사도의 의미에서 확인할 수 있다.For example, when measuring the distance from the first 'love' vector with the simple sum of the second and third 'love' vectors, the distance between the two vectors sum is about 0.17. Among them, look at the distance with the Weighted Sum, which weights the
다음으로, 자연어 처리부(350)는 자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 구성일 수 있다.Next, the natural
자연어 처리부(350)는 질문 내용을 분석하는 데 있어, 해당 질문의 의미 분석 벡터화 과정, 부정/긍정 태깅화 과정 및 카테고리 태깅화 과정을 수행한다.The natural
여기서, 의미 분석 벡터화 과정은 질문의 의미를 기반으로 파악한 다차원 공간 상의 벡터좌표로 해당 질의내용을 처리하는 과정일 수 있다. 이때, Universal Sentence Encoder와 BERT 등의 자연어 처리 알고리즘이 사용된다. 이를 통해 의미가 비슷한 질문들은 거리가 가까운 고유 좌표를 갖을 수 있다.Here, the semantic analysis vectorization process may be a process of processing the corresponding query content with vector coordinates in a multidimensional space identified based on the meaning of the question. At this time, natural language processing algorithms such as Universal Sentence Encoder and BERT are used. Through this, questions with similar meanings can have unique coordinates with a close distance.
다음으로, 부정/긍정 태깅화 과정은 사용자의 질문이 긍정형으로 끝나는 지, 부정형으로 끝나는 지 판별하여 태깅하는 과정이다.Next, the negative/positive tagging process is a process of tagging after determining whether the user's question ends in a positive or negative form.
예를 들어서 질문이 '명예훼손에 해당되나요?'라면 긍정형이고, '명예훼손에 해당 되지 않는 것인가요?'라면 부정형이다. 이와 같은 태깅을 하는 경우는 수치형 답변에서 긍정형 질문의 20%와, 부정형 질문의 20%는 의미하는 바가 다르기 때문이다. 따라서 추후 부정형 질문의 수치형 답변을 긍정형으로 치환하는 경우, (100 - 수치형답변) = 치환한 수치형 답변으로 할 수 있다.For example, if the question is 'Is it applicable to defamation?', it is a positive type, and if 'Is it not applicable to defamation?', it is a negative type. This kind of tagging is because 20% of positive questions and 20% of negative questions in numerical answers have different meanings. Therefore, if the numerical answer of a negative question is replaced with a positive one in the future, (100 - numerical answer) = the replaced numerical answer.
다음으로, 카테고리 태깅화 과정은 질문내용과 관련된 키워드를 태깅화하는 과정으로, 예컨대, 질문내용에 대한 분야 키워드 또는 핵심 키워드인 임대차, 퇴직, 해고 등에 대한 키워드를 태깅화하는 과정일 수 있다.Next, the category tagging process is a process of tagging keywords related to the question content, and may be, for example, a process of tagging field keywords related to the question content or key keywords such as leasing, retirement, and dismissal.
다음으로, 질의 및 유사도 분석/추출부(360)는 상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 데이터베이스 내의 정보와 비교분석하는 구성일 수 있다.Next, the query and similarity analysis/
즉, 질의 및 유사도 분석/추출부(360)는 질의내용의 카테고리와 유사한 카테고리를 갖는 판례정보 및 법률상담정보를 데이터베이스에서 1차 추출한 후, 질의내용의 다차원 공간 벡터좌표와 유사한(좌표거리가 가장 가까운) 다차원 공간 벡터좌표를 갖는 정보를 1차 추출한 정보에서 2차 추출하는 구성일 수 있다.That is, the query and similarity analysis/
한편, 질의 및 유사도 분석/추출부(360)는 상술한 과정으로 질의내용과 연관된 법률사례를 추출할 수 있다.Meanwhile, the query and similarity analysis/
긍정/부정 수치화부(370)는 질의 및 유사도 분석/추출부(360)에서 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보 각각의 답변에 대한 긍정 및 부정 카테고리(수치값)의 평균값을 산출하는 구성일 수 있다.The positive/
상기 긍정/부정 수치화부(370)는 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공한다.The positive/
상기 결과값 제공부(380)는 긍정/부정 수치화부(370)에서 산출된 긍정 및 부정의 수치값을 게이지 형태의 그래프로 제공한다.The result
상기 결과값 제공부(380)는 앙상블(Ensemble) 기법에서 최종 의사결정에서 스택킹(Stacking)을 사용하는 방식과 유사하게 여려 사례의 수치를 입력값으로 사용해서 비선형 모델을 통해 제공할 수 있다.The result
도 10은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법의 흐름도이고, 도 11은 도 10에 도시된 S720 과정의 세부 흐름도이다. 10 is a flowchart of a method for providing a digitized AI answer service for legal questions according to an embodiment of the present invention, and FIG. 11 is a detailed flowchart of the S720 process shown in FIG.
도 10에 도시된 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법은 도 1에 도시된 시스템을 통해 구현될 수 있다.The method of providing a digitized AI answer service to legal questions shown in FIG. 10 can be implemented through the system shown in FIG.
도 10 및 도 11을 참조하면, 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법(S700)은 먼저, 질의단말(200)에서 법률질문에 대한 수치화된 AI 답변서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 질의내용에 대한 법률자문 또는 법률답변을 AI 법률/질의응답서버로 요청(S710)한다.10 and 11, in the method of providing a digitized AI answer service to legal questions according to an embodiment of the present invention (S700), first, the
여기서, 상기 질의단말(200)에서 실행된 법률질문에 대한 수치화된 AI 답변서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션은 후술하는 AI 법률/질의응답서버에서 제공된 법률답변에 대한 수치값을 게이지 형태로 사용자에게 표시할 수 있다.Here, the web page, app page, program, or application related to the digitized AI answer service to the legal question executed in the
질의내용이 접수되면, AI 법률/질의응답서버(300)에서 상기 질의내용과 유사한 법률사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 보유한 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 수치값으로 제공(S720)한다. When the inquiry contents are received, the AI legal/
보다 구체적으로, 상기 S720 과정은 상기 적어도 하나 이상의 외부서버로부터 수집된 사건판례정보 및 법률상담정보를 질문과 답변 형태로 변환한 후, 상기 답변의 성향을 '긍정(적극)' 및 '부정(소극)' 중 어느 하나로 분류하여 상기 데이터베이스로 구축하는 과정을 포함할 수 있다.More specifically, in the S720 process, after converting the case precedent information and legal consultation information collected from the at least one external server into a question and answer form, the inclination of the answer is 'positive (active)' and 'negative (negative)' )', and building the database into the database.
또한, 상기 질문 및 답변을 데이터베이스로 구축 시, 상기 질문 및 답변에 대한 로우(Raw)데이터, 질문에 대한 카테고리, 판례번호, 근거법률 중 적어도 하나 이상이 포함되도록 구축하는 과정을 포함할 수 있다.In addition, when building the database with the questions and answers, a process of constructing the database to include at least one of raw data for the questions and answers, categories for the questions, case numbers, and supporting laws may be included.
또한, 상기 사용자의 질의내용에 대한 어감을 긍정 및 부정 중 어느 하나로 판단하는 과정을 포함할 수 있다.In addition, a process of determining one of positive and negative feelings about the query contents of the user may be included.
또한, 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정한 후, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 과정을 포함할 수 있다.In addition, after calculating sentence vectors of a plurality of questions and answers constructed as a database using a sentence vector similarity algorithm, after selecting 10 sentences (questions and answers) with the highest similarity between sentences, After defining the sensory similarity felt by humans as '0' or '1', learning the defined sentences using the natural language processing learning algorithm (BERT NLP), and relearning the learned data to derive the learning data. can do.
또한, 자연어 처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 과정을 포함할 수 있다.In addition, a process of analyzing the meaning of the query content, extracting a negative or positive sense, and a preset category using a natural language processing learning algorithm (BERT NLP) may be included.
또한, 상기 자연어처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용 내의 문장내용(의미)을 다차원 공간 벡터좌표로 가공처리하는 과정을 포함할 수 있다.In addition, a process of processing the sentence content (meaning) in the query content into multi-dimensional space vector coordinates using the natural language processing learning algorithm (BERT NLP) may be included.
또한, 상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 포함하는 사건판례정보 및 법률상담정보를 데이터베이스에서 추출하는 과정을 포함할 수 있다.In addition, a process of extracting case case precedent information and legal consultation information including the categories of the query contents and categories similar to the multidimensional space vector coordinates and multidimensional space vector coordinates may be included from the database.
또한, 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값을 상기 수치값으로 제공하는 과정을 포함할 수 있다.In addition, a process of providing an average value of positive and negative categories (numerical values) of at least one or more extracted case precedent information and legal counseling information as the numerical value may be included.
또한, 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공하는 과정을 더 포함할 수 있다.In addition, if the positive or negative numerical value among the average values of the positive and negative categories (numeric values) of the extracted at least one case case precedent information and legal consultation information is relatively calculated to be more than a preset value, a numerical value reflecting the weight is provided. It may further include the process of
보다 구체적으로, 상기 S720 과정은 AI 법률/질의응답서버(300)에서 실행되는 과정으로, 수집부(310)에서 적어도 하나 이상의 외부서버로부터 판례 로우(Raw) 데이터 및 법률 상담(Q&A)데이터를 대한민국 국가벌률정보센터(www.law.go.kr)의 서버와 같은 외부서버에서 수집한다. 이때, 판례 로우(Raw) 데이터는 지방법원, 고등법원 및 대법원의 판례 빅데이터일 수 있다. 또한, 법률 상담(Q&A)정보는 판례에 대한 변호사들의 답변 및 답변에 근거법률정보를 포함한다.More specifically, the S720 process is a process executed in the AI legal/
이후, 전처리부(320)에서 사건판례정보의 로우(Raw) 데이터 및 법률 상담데이터를 인덱스(index), 질문, 답변, 카테고리, 판례번호, 근거법률, 판례결과 및 상담답변을 긍정/부정의 카테고리로 분류/정렬/편집하는 과정 및 사건판례 데이터를 자연어 처리알고리즘을 이용하여 질문(Q) 및 답변(A)의 형태로 변환가공 처리하는 과정을 수행한다.Then, in the
전처리부(320)의 동작이 완료되면, 기계 학습부(340)에서 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정하고, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 기능을 수행한다.When the operation of the
즉, 상기 기계 학습부(340)는 Cosine similarity, Jaccard similarity를 기반으로 임베딩된 문장 벡터들 사이의 유사도를 구할수 있다. 또한, 문장간 유사도가 가장 높은 10개 문장을 선정할 수 있고, 이에 한정되는 것은 아니다.That is, the
또한, 선정된 10개의 문장에 대해 실제 인간이 느끼는 유사도에 대해 인간이 직접 0(유사), 1(비유사)을 태깅하여 BERT(Bidirectional Encoder Representations from Transformers) NLP(Natural Language Processing)를 학습시킬 데이터를 생성한 후, BERT NLP를 학습하도록 동작한다.In addition, data for learning BERT (Bidirectional Encoder Representations from Transformers) NLP (Natural Language Processing) by manually tagging 0 (similar) and 1 (dissimilar) for the similarity felt by humans for the selected 10 sentences After generating, it operates to learn BERT NLP.
다음으로, 자연어 처리부(350)에서 자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출 및 질문 내용을 분석하는 데 있어, 해당 질문의 의미 분석 벡터화 과정, 부정/긍정 태깅화 과정 및 카테고리 태깅화 과정을 수행한다.Next, when the natural
여기서, 의미 분석 벡터화 과정은 질문의 의미를 기반으로 파악한 다차원 공간 상의 벡터좌표로 해당 질의내용을 처리하는 과정일 수 있다. 이때, Universal Sentence Encoder와 BERT 등의 자연어 처리 알고리즘이 사용된다. 이를 통해 의미가 비슷한 질문들은 거리가 가까운 고유 좌표를 갖을 수 있다.Here, the semantic analysis vectorization process may be a process of processing the corresponding query content with vector coordinates in a multidimensional space identified based on the meaning of the question. At this time, natural language processing algorithms such as Universal Sentence Encoder and BERT are used. Through this, questions with similar meanings can have unique coordinates with a close distance.
다음으로, 부정/긍정 태깅화 과정은 사용자의 질문이 긍정형으로 끝나는 지, 부정형으로 끝나는 지 판별하여 태깅하는 과정이다.Next, the negative/positive tagging process is a process of tagging after determining whether the user's question ends in a positive or negative form.
예를 들어서 질문이 '명예훼손에 해당되나요?'라면 긍정형이고, '명예훼손에 해당 되지 않는 것인가요?'라면 부정형이다. 이와 같은 태깅을 하는 경우는 수치형 답변에서 긍정형 질문의 20%와, 부정형 질문의 20%는 의미하는 바가 다르기 때문이다. 따라서 추후 부정형 질문의 수치형 답변을 긍정형으로 치환하는 경우, (100 - 수치형답변) = 치환한 수치형 답변으로 할 수 있다.For example, if the question is 'Is it applicable to defamation?', it is a positive type, and if 'Is it not applicable to defamation?', it is a negative type. This kind of tagging is because 20% of positive questions and 20% of negative questions in numerical answers have different meanings. Therefore, if the numerical answer of a negative question is replaced with a positive one in the future, (100 - numerical answer) = the replaced numerical answer.
다음으로, 카테고리 태깅화 과정은 질문내용과 관련된 키워드를 태깅화하는 과정으로, 예컨대, 질문내용에 대한 분야 키워드 또는 핵심 키워드인 임대차, 퇴직, 해고 등에 대한 키워드를 태깅화하는 과정일 수 있다.Next, the category tagging process is a process of tagging keywords related to the question content, and may be, for example, a process of tagging field keywords related to the question content or key keywords such as leasing, retirement, and dismissal.
자연어 처리부(350)의 역할이 완료되면, 질의 및 유사도 분석/추출부(360)에서 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 데이터베이스 내의 정보와 비교분석하는 과정을 수행한다.When the role of the natural
여기서, 질의 및 유사도 분석/추출부(360)는 질의내용의 카테고리와 유사한 카테고리를 갖는 판례정보 및 법률상담정보를 데이터베이스에서 1차 추출한 후, 질의내용의 다차원 공간 벡터좌표와 유사한(좌표거리가 가장 가까운) 다차원 공간 벡터좌표를 갖는 정보를 1차 추출한 정보에서 2차 추출하는 구성일 수 있다.Here, the inquiry and similarity analysis/
또한, 질의 및 유사도 분석/추출부(360)에서 상술한 과정으로 질의내용과 연관된 법률사례를 추출하는 과정을 수행한다.In addition, the query and similarity analysis/
이후, 긍정/부정 수치화부(370)에서 질의 및 유사도 분석/추출부(360)에서 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보 각각의 답변에 대한 긍정 및 부정 카테고리(수치값)의 평균값을 산출하는 과정 및 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공한다.Thereafter, the positive/
마지막으로, 결과값 제공부(380)에서 긍정/부정 수치화부(370)에서 산출된 긍정 및 부정의 수치값을 게이지 형태의 그래프를 질의단말(200)로 제공한다. 여기서, 결과값 제공부(380)는 앙상블(Ensemble) 기법에서 최종 의사결정에서 스택킹(Stacking)을 사용하는 방식과 유사하게 여려 사례의 수치를 입력값으로 사용해서 비선형 모델을 통해 제공할 수 있다.Finally, the result
따라서, 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 이용하면, 사용자는 간편하게 자신이 궁금하거나 또는 자신에게 벌어진 사건들에 대한 법률적 지식 또는 법률적 적용여부에 대한 답변을 긍정 및 부정의 수치가 포함된 게이지 형태로 제공받을 수 있고, 이와 유사한 판례 및 사례를 제공받을 수 있다는 이점이 있다.Therefore, by using the system and method for providing a digitized AI answer service to legal questions according to an embodiment of the present invention, users can easily find out what they are curious about or legal knowledge or legal knowledge about events that have happened to them. It has the advantage of being able to receive an answer on whether or not to apply in the form of a gauge that includes positive and negative values, and to be provided with similar precedents and cases.
도 12는 본 명세서에 개진된 하나 이상의 실시예가 구현될 수 있는 예시적인 컴퓨팅 환경을 도시하는 도면으로, 상술한 하나 이상의 실시예를 구현하도록 구성된 컴퓨팅 디바이스(1100)를 포함하는 시스템(1000)의 예시를 도시한다. 예를 들어, 컴퓨팅 디바이스(1100)는 개인 컴퓨터, 서버 컴퓨터, 핸드헬드 또는 랩탑 디바이스, 모바일 디바이스(모바일폰, PDA, 미디어 플레이어 등), 멀티프로세서 시스템, 소비자 전자기기, 미니 컴퓨터, 메인프레임 컴퓨터, 임의의 전술된 시스템 또는 디바이스를 포함하는 분산 컴퓨팅 환경 등을 포함하지만, 이것으로 한정되는 것은 아니다.12 is a diagram illustrating an example computing environment in which one or more embodiments set forth herein may be implemented, an illustration of a
컴퓨팅 디바이스(1100)는 적어도 하나의 프로세싱 유닛(1110) 및 메모리(1120)를 포함할 수 있다. 여기서, 프로세싱 유닛(1110)은 예를 들어 중앙처리장치(CPU), 그래픽처리장치(GPU), 마이크로프로세서, 주문형 반도체(Application Specific Integrated Circuit, ASIC), Field Programmable Gate Arrays(FPGA) 등을 포함할 수 있으며, 복수의 코어를 가질 수 있다. 메모리(1120)는 휘발성 메모리(예를 들어, RAM 등), 비휘발성 메모리(예를 들어, ROM, 플래시 메모리 등) 또는 이들의 조합일 수 있다. 또한, 컴퓨팅 디바이스(1100)는 추가적인 스토리지(1130)를 포함할 수 있다. 스토리지(1130)는 자기 스토리지, 광학 스토리지 등을 포함하지만 이것으로 한정되지 않는다. 스토리지(1130)에는 본 명세서에 개진된 하나 이상의 실시예를 구현하기 위한 컴퓨터 판독 가능한 명령이 저장될 수 있고, 운영 시스템, 애플리케이션 프로그램 등을 구현하기 위한 다른 컴퓨터 판독 가능한 명령도 저장될 수 있다. 스토리지(1130)에 저장된 컴퓨터 판독 가능한 명령은 프로세싱 유닛(1110)에 의해 실행되기 위해 메모리(1120)에 로딩될 수 있다. 또한, 컴퓨팅 디바이스(1100)는 입력 디바이스(들)(1140) 및 출력 디바이스(들)(1150)을 포함할 수 있다.
여기서, 입력 디바이스(들)(1140)은 예를 들어 키보드, 마우스, 펜, 음성 입력 디바이스, 터치 입력 디바이스, 적외선 카메라, 비디오 입력 디바이스 또는 임의의 다른 입력 디바이스 등을 포함할 수 있다. 또한, 출력 디바이스(들)(1150)은 예를 들어 하나 이상의 디스플레이, 스피커, 프린터 또는 임의의 다른 출력 디바이스 등을 포함할 수 있다. 또한, 컴퓨팅 디바이스(1100)는 다른 컴퓨팅 디바이스에 구비된 입력 디바이스 또는 출력 디바이스를 입력 디바이스(들)(1140) 또는 출력 디바이스(들)(1150)로서 사용할 수도 있다.Here, input device(s) 1140 may include, for example, a keyboard, mouse, pen, voice input device, touch input device, infrared camera, video input device, or any other input device. Output device(s) 1150 may also include, for example, one or more displays, speakers, printers, or any other output devices, or the like. Additionally,
또한, 컴퓨팅 디바이스(1100)는 컴퓨팅 디바이스(1100)가 다른 디바이스(예를 들어, 컴퓨팅 디바이스(1300))와 통신할 수 있게 하는 통신접속(들)(1160)을 포함할 수 있다.
여기서, 통신 접속(들)(1160)은 모뎀, 네트워크 인터페이스 카드(NIC), 통합 네트워크 인터페이스, 무선 주파수 송신기/수신기, 적외선 포트, USB 접속 또는 컴퓨팅 디바이스(1100)를 다른 컴퓨팅 디바이스에 접속시키기 위한 다른 인터페이스를 포함할 수 있다. 또한, 통신 접속(들)(1160)은 유선 접속 또는 무선 접속을 포함할 수 있다. 상술한 컴퓨팅 디바이스(1100)의 각 구성요소는 버스 등의 다양한 상호접속(예를 들어, 주변 구성요소 상호접속(PCI), USB, 펌웨어(IEEE 1394), 광학적 버스 구조 등)에 의해 접속될 수도 있고, 네트워크(1200)에 의해 상호접속될 수도 있다. 본 명세서에서 사용되는 "구성요소", "시스템" 등과 같은 용어들은 일반적으로 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어, 또는 실행중인 소프트웨어인 컴퓨터 관련 엔티티를 지칭하는 것이다. Here, communication connection(s) 1160 may be a modem, network interface card (NIC), integrated network interface, radio frequency transmitter/receiver, infrared port, USB connection, or other device for connecting
예를 들어, 구성요소는 프로세서 상에서 실행중인 프로세스, 프로세서, 객체, 실행 가능물(executable), 실행 스레드, 프로그램 및/또는 컴퓨터일 수 있지만, 이것으로 한정되는 것은 아니다. 예를 들어, 컨트롤러 상에서 구동중인 애플리케이션 및 컨트롤러 모두가 구성요소일 수 있다. 하나 이상의 구성요소는 프로세스 및/또는 실행의 스레드 내에 존재할 수 있으며, 구성요소는 하나의 컴퓨터 상에서 로컬화될 수 있고, 둘 이상의 컴퓨터 사이에서 분산될 수도 있다.For example, a component may be, but is not limited to, a process running on a processor, a processor, an object, an executable, a thread of execution, a program, and/or a computer. For example, both the application running on the controller and the controller may be components. One or more components can reside within a process and/or thread of execution and a component can be localized on one computer or distributed between two or more computers.
이상에서 본 발명은 실시예를 참조하여 상세히 설명되었으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 상기에서 설명된 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 부가 및 변형이 가능할 것임은 당연하며, 이와 같은 변형된 실시 형태들 역시 아래에 첨부한 특허청구범위에 의하여 정하여지는 본 발명의 보호 범위에 속하는 것으로 이해되어야 할 것이다.In the above, the present invention has been described in detail with reference to the examples, but those skilled in the art to which the present invention belongs will be able to make various substitutions, additions, and modifications without departing from the technical idea described above. Of course, it should be understood that such modified embodiments also belong to the protection scope of the present invention, which is defined by the appended claims below.
100: 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템
200: 질의단말
300: AI 법률/질의응답서버
310: 수집부
320: 전처리부
330: 데이터베이스화부
340: 기계 학습부
350: 자연어 처리부
360: 질의 및 유사도 분석/추출부
370: 긍정/부정 수치화부
380: 결과값 제공부100: A system that provides digitized AI answering services to legal questions
200: query terminal
300: AI Legal/Q&A server
310: collection unit
320: pre-processing unit
330: database conversion unit
340: machine learning unit
350: natural language processing unit
360: query and similarity analysis/extraction unit
370: positive/negative quantification unit
380: result value provider
Claims (1)
상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 긍정 및 부정 각각의 수치값으로 제공하는 AI 법률/질의응답서버를 포함하고,
상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
Inquiry terminal requesting legal advice on the contents of inquiry: and
Case precedent information and legal consultation information of lawyers to which cases similar to the above query were applied are collected from at least one or more external servers, processed into a preset form, and built into a database, and the constructed case precedent information and legal consultation information Based on this, it includes an AI legal/question response server that analyzes legal answers to positive and negative questions about the contents of the inquiry using an artificial intelligence machine learning algorithm and provides them as numerical values of positive and negative values,
The query terminal provides a digitized AI answer service for legal questions, characterized in that for executing a question answering platform that displays the numerical value to the user in the form of a gauge.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020230043428A KR20230051652A (en) | 2020-09-28 | 2023-04-03 | Systems and Methods to Provide AI Answering Service for Legal Questions |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200126150A KR20220042838A (en) | 2020-09-28 | 2020-09-28 | Systems and Methods to Provide AI Answering Service for Legal Questions |
KR1020230043428A KR20230051652A (en) | 2020-09-28 | 2023-04-03 | Systems and Methods to Provide AI Answering Service for Legal Questions |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200126150A Division KR20220042838A (en) | 2020-09-28 | 2020-09-28 | Systems and Methods to Provide AI Answering Service for Legal Questions |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230051652A true KR20230051652A (en) | 2023-04-18 |
Family
ID=81182383
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200126150A KR20220042838A (en) | 2020-09-28 | 2020-09-28 | Systems and Methods to Provide AI Answering Service for Legal Questions |
KR1020230043428A KR20230051652A (en) | 2020-09-28 | 2023-04-03 | Systems and Methods to Provide AI Answering Service for Legal Questions |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200126150A KR20220042838A (en) | 2020-09-28 | 2020-09-28 | Systems and Methods to Provide AI Answering Service for Legal Questions |
Country Status (1)
Country | Link |
---|---|
KR (2) | KR20220042838A (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102439321B1 (en) * | 2022-05-04 | 2022-09-05 | 한국데이터플랫폼 주식회사 | System for Providing Semantic Analysis Finding and Analyzing Sentence Meaning |
KR102583818B1 (en) * | 2022-09-14 | 2023-10-04 | 주식회사 글로랑 | Method for sampling process of personality test using question and answer network representing group of respondents based on bert |
KR102659523B1 (en) * | 2023-07-18 | 2024-04-19 | 주식회사 더엔젤브릿지 | System for retrieving legal information |
CN117909485B (en) * | 2024-03-19 | 2024-05-24 | 武汉百智诚远科技有限公司 | Legal consultation intelligent interaction method and system based on large language model |
CN118152542B (en) * | 2024-05-09 | 2024-07-16 | 广东知得失网络科技有限公司 | Chat method, chat system and chat robot for intellectual property related topics |
CN118277538A (en) * | 2024-06-04 | 2024-07-02 | 杭州昊清科技有限公司 | Legal intelligent question-answering method based on retrieval enhancement language model |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190143583A (en) | 2018-06-21 | 2019-12-31 | 주식회사 머니브레인 | Method and computer readable recording medium for providing answers based on hybrid hierarchical conversation flow model with conversation management model using machine learning |
-
2020
- 2020-09-28 KR KR1020200126150A patent/KR20220042838A/en not_active Application Discontinuation
-
2023
- 2023-04-03 KR KR1020230043428A patent/KR20230051652A/en not_active Application Discontinuation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190143583A (en) | 2018-06-21 | 2019-12-31 | 주식회사 머니브레인 | Method and computer readable recording medium for providing answers based on hybrid hierarchical conversation flow model with conversation management model using machine learning |
Also Published As
Publication number | Publication date |
---|---|
KR20220042838A (en) | 2022-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20230051652A (en) | Systems and Methods to Provide AI Answering Service for Legal Questions | |
CN111274365B (en) | Intelligent inquiry method and device based on semantic understanding, storage medium and server | |
EP2499569B1 (en) | Clustering method and system | |
EP3717984B1 (en) | Method and apparatus for providing personalized self-help experience | |
CN110688452B (en) | Text semantic similarity evaluation method, system, medium and device | |
CN113239071B (en) | Retrieval query method and system for scientific and technological resource subject and research topic information | |
CN113569578B (en) | User intention recognition method and device and computer equipment | |
KR102682244B1 (en) | Method for learning machine-learning model with structured ESG data using ESG auxiliary tool and service server for generating automatically completed ESG documents with the machine-learning model | |
CN109977292A (en) | Searching method, calculates equipment and computer readable storage medium at device | |
CN115796182A (en) | Multi-modal named entity recognition method based on entity-level cross-modal interaction | |
CN117112595A (en) | Information query method and device, electronic equipment and storage medium | |
Lathabai et al. | x-index: Identifying core competency and thematic research strengths of institutions using an NLP and network based ranking framework | |
CN113342944B (en) | Corpus generalization method, apparatus, device and storage medium | |
CN116127367A (en) | Method and device for auditing service evaluation and computer readable storage medium | |
CN111104492B (en) | Civil aviation field automatic question and answer method based on layering Attention mechanism | |
CN116680401A (en) | Document processing method, document processing device, apparatus and storage medium | |
CN116775875A (en) | Question corpus construction method and device, question answering method and device and storage medium | |
CN117077680A (en) | Question and answer intention recognition method and device | |
KR102678306B1 (en) | System and method for providing artificial intelligence-based positive and negative numerical legal answer services | |
CN114398482A (en) | Dictionary construction method and device, electronic equipment and storage medium | |
CN116226320A (en) | Method and device for predicting context information, electronic equipment and storage medium | |
CN111985217A (en) | Keyword extraction method and computing device | |
CN111611379A (en) | Text information classification method, device, equipment and readable storage medium | |
Vazquez et al. | Retrieving and Ranking Relevant JavaScript Technologies from Web Repositories | |
CN114416925B (en) | Sensitive word recognition method, device, equipment, storage medium and program product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal |