KR20230051652A - Systems and Methods to Provide AI Answering Service for Legal Questions - Google Patents

Systems and Methods to Provide AI Answering Service for Legal Questions Download PDF

Info

Publication number
KR20230051652A
KR20230051652A KR1020230043428A KR20230043428A KR20230051652A KR 20230051652 A KR20230051652 A KR 20230051652A KR 1020230043428 A KR1020230043428 A KR 1020230043428A KR 20230043428 A KR20230043428 A KR 20230043428A KR 20230051652 A KR20230051652 A KR 20230051652A
Authority
KR
South Korea
Prior art keywords
legal
question
positive
information
negative
Prior art date
Application number
KR1020230043428A
Other languages
Korean (ko)
Inventor
박광렬
김성원
이남경
심희정
Original Assignee
한국에이아이소프트 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국에이아이소프트 주식회사 filed Critical 한국에이아이소프트 주식회사
Priority to KR1020230043428A priority Critical patent/KR20230051652A/en
Publication of KR20230051652A publication Critical patent/KR20230051652A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Human Computer Interaction (AREA)
  • Technology Law (AREA)
  • Medical Informatics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

A system for providing an AI digitized answering service for a legal question according to one embodiment of the present invention, which enables a user to receive an answer for legal knowledge or legal application in a gauge form including a positive or negative numerical value, comprises: a question terminal that requests legal advice on question content; and an AI legal/question answering server that collects case precedent information, in which a case similar to the question content is applied, and legal counsel information of layers from at least one external server to process the same in a pre-set form and then be constructed as a database, and analyzes a positive or negative legal answer for the question content by using an artificial intelligence machine learning algorithm based on the constructed case precedent information and legal counsel information to provide the positive or negative legal answer as a numerical value. The question terminal executes a question answering platform that displays the numerical value in a gauge form for a user.

Description

법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법{Systems and Methods to Provide AI Answering Service for Legal Questions}Systems and Methods to Provide AI Answering Service for Legal Questions}

본 발명은 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법에 관한 것이다.The present invention relates to a system and method for providing a digitized AI answer service to legal questions.

법무관련 영역은 기본적으로 상담을 필수로 하고 있지만, 전문가와 상담을 연결하는 다양한 수단 또는 양식(또 는 Form)을 제공하고 사전 조사형태로 진행되는정도에 그치는 것이 현재로서는 대부분이다. Consultation is basically required in the legal field, but at present, most of them are limited to providing various means or forms (or forms) to connect experts and counseling and proceeding in the form of preliminary investigation.

이는 상담을 정형화하여 ARS 방식으로 각종 단계와 조건을 확인하며 처리하게 되므로 서비스 진행 속도가 매우 지루하고 서비스 경험이 나빠 해당 서비스의 자동화된 처리에 매우 큰 장애요소가 된다. 하지만 자연어 처리를 통해 상담이 가능하게 하면 기계학습에 따라 상담의 정밀도가 높아지고 유관산업의 활성 화를 시간과 공간의 제약없이 할 수 있게 된다.This standardizes counseling and checks and processes various stages and conditions in the ARS method, so the service progress is very tedious and the service experience is poor, which is a very big obstacle to the automated processing of the service. However, if consultation is made possible through natural language processing, the precision of consultation will increase according to machine learning, and related industries can be revitalized without time and space limitations.

이에 본 발명은 사용자의 법률질문에 대한 답변을 AI 학습알고리즘을 이용하여 제공할 수 있는 시스템 및 방법을 개시하고자 한다.Accordingly, the present invention intends to disclose a system and method capable of providing answers to users' legal questions using an AI learning algorithm.

공개특허공보 제10-2019-0143583호 (발명의 명칭: 대화 이해 AI 시스템에 의하여, 머신러닝을 대화 관리 기술에 적용한 하이브리드 계측적 대화 흐름 모델을 기초로 답변을 제공하는 방법 및 컴퓨터 판독가능한 기록 매체)Publication No. 10-2019-0143583 (Title of Invention: A method for providing answers based on a hybrid instrumental dialog flow model applying machine learning to dialog management technology by a conversation understanding AI system and a computer readable recording medium )

본 발명이 해결하고자 하는 과제는 종래의 문제점을 해결할 수 있는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 제공하는 데 그 목적이 있다.The object of the present invention is to provide a system and method for providing a digitized AI answer service to legal questions that can solve conventional problems.

상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템은 질의내용에 대한 법률자문을 요청하는 질의단말: 및 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 긍정 및 부정 각각의 수치값으로 제공하는 AI 법률/질의응답서버를 포함하고, 상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 한다.A system for providing a digitized AI answer service to legal questions according to an embodiment of the present invention to solve the above problems is an inquiry terminal requesting legal advice on the inquiry: and a case to which an event similar to the above inquiry is applied. After collecting case precedent information and legal counseling information from at least one external server, processing it in a preset form and constructing a database, affirming and An AI legal/question answering server that analyzes legal answers to injustice using artificial intelligence machine learning algorithms and provides them as numerical values of positive and negative values, and the inquiry terminal provides the numerical values to the user in the form of gauges. It is characterized in that it executes a question and answer platform displayed to.

일 실시예에서, 상기 AI 법률/질의응답서버는 상기 적어도 하나 이상의 외부서버로부터 수집된 사건판례정보 및 법률상담정보를 질문과 답변 형태로 변환한 후, 상기 답변의 성향을 '긍정(적극)' 및 '부정(소극)' 중 어느 하나로 분류하여 상기 데이터베이스로 구축하는 것을 특징으로 한다.In one embodiment, the AI legal/question response server converts the case precedent information and legal consultation information collected from the at least one external server into a question and answer format, and then sets the inclination of the answer to 'positive (positive)'. and 'negative (negative)', characterized in that the database is constructed.

일 실시예에서, 상기 AI 법률/질의응답서버는 상기 질문 및 답변을 데이터베이스로 구축 시, 상기 질문 및 답변에 대한 로우(Raw)데이터, 질문에 대한 카테고리, 판례번호, 근거법률 중 적어도 하나 이상이 포함되도록 구축하는 것을 특징으로 한다.In one embodiment, when the AI law/question answering server builds the questions and answers into a database, at least one or more of the raw data for the questions and answers, the category for the question, the case number, and the underlying law It is characterized by being built to include.

일 실시예에서, 상기 AI 법률/질의응답서버는 상기 사용자의 질의내용에 대한 어감을 긍정 및 부정 중 어느 하나로 인식하는 것을 특징으로 한다.In one embodiment, the AI legal/question response server is characterized in recognizing the user's query content as either positive or negative.

일 실시예에서, 상기 AI 법률/질의응답서버는 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정한 후, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 것을 특징으로 한다.In one embodiment, the AI legal/question answering server calculates sentence vectors of a plurality of questions and answers constructed as a database using a sentence vector similarity algorithm, and then selects 10 sentences (questions and answers) having the highest similarity between sentences. ) is selected, and the similarity felt by humans for the selected sentences is defined as '0' or '1', and then the defined sentences are learned using a natural language processing learning algorithm (BERT NLP), and the learned data It is characterized in that the learning data is derived by re-learning.

일 실시예에서, 상기 AI 법률/질의응답서버는 자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 것을 특징으로 한다.In one embodiment, the AI legal/question response server is characterized in that it extracts a semantic analysis, a negative or positive sense, and a preset category for the content of the query using a natural language processing algorithm.

일 실시예에서, 상기 AI 법률/질의응답서버는 자연어처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용 내의 문장내용(의미)을 다차원 공간 벡터좌표로 가공처리하는 것을 특징으로 한다.In one embodiment, the AI law/question response server is characterized in that it processes the sentence content (meaning) in the query content into multi-dimensional space vector coordinates using a natural language processing learning algorithm (BERT NLP).

일 실시예에서, 상기 AI 법률/질의응답서버는 상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 포함하는 사건판례정보 및 법률상담정보를 데이터베이스에서 추출하는 것을 특징으로 한다.In one embodiment, the AI legal/question response server extracts case precedent information and legal consultation information including categories and multidimensional space vector coordinates similar to the categories of the inquiry contents and multidimensional space vector coordinates from the database. .

일 실시예에서, 상기 AI 법률/질의응답서버는 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값을 상기 수치값으로 제공하는 것을 특징으로 한다.In one embodiment, the AI legal/question response server is characterized in that it provides an average value of positive and negative categories (numerical values) of at least one extracted case precedent information and legal consultation information as the numerical value.

일 실시예에서, 상기 AI 법률/질의응답서버는 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공하는 것을 특징으로 한다.In one embodiment, the AI legal/question response server has a positive or negative numerical value among the average values of positive and negative categories (numeric values) of at least one case case precedent information and legal consultation information extracted relative to a predetermined value or more. When calculated as , it is characterized in that it provides a numerical value reflecting the weight.

상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법은 질의단말에서 질의내용에 대한 법률자문을 요청하는 단계; 및 AI 법률/질의응답서버에서 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 수치값으로 제공단계를 포함하고, 상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 하는 한다.A method for providing a digitized AI answer service for legal questions according to an embodiment of the present invention for solving the above problems includes requesting legal advice on inquiry contents from an inquiry terminal; And in the AI legal/question response server, case precedent information and legal counseling information of lawyers to which cases similar to the above query were applied are collected from at least one external server, processed in a preset form, and built into a database. Based on case precedent information and legal consultation information, analyzing legal answers to positive and negative questions about the contents of the inquiry using an artificial intelligence machine learning algorithm, and then providing them as numerical values, wherein the inquiry terminal includes the numerical values It is characterized by executing a question answering platform that displays a value to a user in the form of a gauge.

본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 이용하면, 사용자는 간편하게 자신이 궁금하거나 또는 자신에게 벌어진 사건들에 대한 법률적 지식 또는 법률적 적용여부에 대한 답변을 긍정 및 부정의 수치가 포함된 게이지 형태로 제공받을 수 있고, 이와 유사한 판례 및 사례를 제공받을 수 있다는 이점이 있다.Using the system and method for providing a digitized AI answer service to legal questions according to an embodiment of the present invention, users can easily inquire about themselves or legal knowledge or legal application of cases that have occurred to them. There is an advantage in that answers to can be provided in the form of gauges containing positive and negative values, and similar precedents and cases can be provided.

도 1은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템의 네트워크 구성도이다.
도 2는 도 1에 도시된 AI 법률/질의응답서버의 세부 구성도이다.
도 3은 도 1에 도시된 데이터베이스의 데이터 구축형태를 나타낸 일 예시도이다.
도 4 내지 도 6은 자연어처리 학습알고리즘(BERT NLP)을 설명하기 위한 일 예시도이다.
도 7 및 도 8은 도 2에 도시된 질의 및 유사도 분석/추출부의 실행과정을 설명하기 위한 일 예시도이다.
도 9는 질의단말에서 도 2에 도시된 결과 제공부에서 제공한 수치값이 반영된 게이지 바의 일 예시도이다.
도 10은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법의 흐름도이다.
도 11은 도 10에 도시된 S720 과정의 세부 흐름도이다.
도 12는 본 명세서에 개진된 하나 이상의 실시예가 구현될 수 있는 예시적인 컴퓨팅 환경을 도시한 도이다.
1 is a network configuration diagram of a system that provides a digitized AI answer service to legal questions according to an embodiment of the present invention.
2 is a detailed configuration diagram of the AI legal/question response server shown in FIG.
FIG. 3 is an exemplary view showing a data construction form of the database shown in FIG. 1 .
4 to 6 are exemplary diagrams for explaining a natural language processing learning algorithm (BERT NLP).
7 and 8 are exemplary diagrams for explaining an execution process of the query and similarity analysis/extraction unit shown in FIG. 2 .
FIG. 9 is an exemplary view of a gauge bar in which a numerical value provided by a result providing unit shown in FIG. 2 is reflected in a query terminal.
10 is a flowchart of a method of providing a digitized AI answer service to legal questions according to an embodiment of the present invention.
FIG. 11 is a detailed flowchart of the process S720 shown in FIG. 10 .
12 is an illustration of an example computing environment in which one or more embodiments set forth herein may be implemented.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, embodiments of the present invention will be described in detail so that those skilled in the art can easily practice the present invention with reference to the accompanying drawings. However, the present invention may be embodied in many different forms and is not limited to the embodiments described herein. And in order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Throughout the specification, when a part is said to be "connected" to another part, this includes not only the case where it is "directly connected" but also the case where it is "electrically connected" with another element interposed therebetween. . In addition, when a part "includes" a certain component, this means that it may further include other components, not excluding other components, unless otherwise stated, and one or more other characteristics. However, it should be understood that it does not preclude the possibility of existence or addition of numbers, steps, operations, components, parts, or combinations thereof.

명세서 전체에서 사용되는 정도의 용어 "약", "실질적으로" 등은 언급된 의미에 고유한 제조 및 물질 허용오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본 발명의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다. 본 발명의 명세서 전체에서 사용되는 정도의 용어 "~(하는) 단계" 또는 "~의 단계"는 "~ 를 위한 단계"를 의미하지 않는다. As used throughout the specification, the terms "about", "substantially", etc., are used at or approximating that value when manufacturing and material tolerances inherent in the stated meaning are given, and do not convey an understanding of the present invention. Accurate or absolute figures are used to help prevent exploitation by unscrupulous infringers of the disclosed disclosure. The term "step of (doing)" or "step of" as used throughout the specification of the present invention does not mean "step for".

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체 지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.In this specification, a "unit" includes a unit realized by hardware, a unit realized by software, and a unit realized using both. Further, one unit may be realized using two or more hardware, and two or more units may be realized by one hardware. On the other hand, '~ unit' is not limited to software or hardware, and '~ unit' may be configured to be in an addressable storage medium or configured to reproduce one or more processors. Thus, as an example, '~unit' refers to components such as software components, object-oriented software components, class components, and task components, processes, functions, properties, and procedures. , subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays and variables. Functions provided within components and '~units' may be combined into smaller numbers of components and '~units' or further separated into additional components and '~units'. In addition, components and '~units' may be implemented to play one or more CPUs in a device or a secure multimedia card.

본 명세서에 있어서 단말, 장치 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말, 장치 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말, 장치 또는 디바이스에서 수행될 수도 있다. In this specification, some of the operations or functions described as being performed by a terminal, device, or device may be performed instead by a server connected to the terminal, device, or device. Likewise, some of the operations or functions described as being performed by the server may also be performed by a terminal, apparatus, or device connected to the server.

본 명세서에 있어서, 단말과 매핑(Mapping) 또는 매칭(Matching)으로 기술된 동작이나 기능 중 일부는, 단말의 식별 정보(Identifying Data)인 단말기의 고유번호나 개인의 식별정보를 매핑 또는 매칭한다는 의미로 해석될 수 있다.In this specification, some of the operations or functions described as mapping or matching with the terminal mean mapping or matching the terminal's unique number or personal identification information, which is the terminal's identifying data. can be interpreted as

이하, 첨부된 도면들에 기초하여 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 보다 상세하게 설명하도록 한다.Hereinafter, based on the accompanying drawings, a system and method for providing a digitized AI answer service to legal questions according to an embodiment of the present invention will be described in more detail.

도 1은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템의 네트워크 구성도이고, 도 2는 도 1에 도시된 AI 법률/질의응답서버의 세부 구성도이고, 도 3은 도 1에 도시된 데이터베이스의 데이터 구축형태를 나타낸 일 예시도이고, 도 4 내지 도 6은 자연어처리 학습알고리즘(BERT NLP)을 설명하기 위한 일 예시도이고, 도 7 및 도 8은 도 2에 도시된 질의 및 유사도 분석/추출부의 실행과정을 설명하기 위한 일 예시도이고, 도 9는 질의단말에서 도 2에 도시된 결과 제공부에서 제공한 수치값이 반영된 게이지 바의 일 예시도이다.1 is a network configuration diagram of a system that provides a digitized AI answer service for legal questions according to an embodiment of the present invention, and FIG. 2 is a detailed configuration diagram of the AI legal/question response server shown in FIG. 1, 3 is an exemplary diagram showing a data construction form of the database shown in FIG. 1, FIGS. 4 to 6 are exemplary diagrams for explaining a natural language processing learning algorithm (BERT NLP), and FIGS. 7 and 8 are diagrams. 2 is an exemplary diagram for explaining the execution process of the query and similarity analysis/extraction unit, and FIG. 9 is an exemplary diagram of a gauge bar reflecting numerical values provided by the result providing unit shown in FIG. 2 in a query terminal. .

먼저, 도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템(100)은 질의단말(200) 및 AI 법률/질의응답서버(300)를 포함한다.First, as shown in FIG. 1, the system 100 for providing a digitized AI answer service to legal questions according to an embodiment of the present invention includes a query terminal 200 and an AI legal/question response server 300 includes

다만, 도 1의 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템(100)은, 본 발명의 일 실시예에 불과함으로, 도 1을 통하여 본 발명이 한정 해석되는 것은 아니다.However, since the system 100 for providing a digitized AI answer service to legal questions in FIG. 1 is only an embodiment of the present invention, the present invention is not limited to interpretation through FIG. 1 .

이때, 도 1의 각 구성요소들은 일반적으로 네트워크를 통해 연결된다. 예를들어, 도 1에 도시된 바와 같이, 적어도 하나 이상의 질의단말(200)은 네트워크를 통해 AI 법률/질의응답서버(300)와 연결될 수 있다.At this time, each component of FIG. 1 is generally connected through a network. For example, as shown in FIG. 1 , at least one query terminal 200 may be connected to the AI legal/question response server 300 through a network.

여기서, 네트워크는, 복수의 단말 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크의 일 예에는 RF, 3GPP(3rd Generation Partnership Project) 네트워크, LTE(Long Term Evolution) 네트워크, 5GPP(5th Generation Partnership Project) 네트워크, WIMAX(World Interoperability for Microwave Access) 네트워크, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 블루투스(Bluetooth) 네트워크, NFC 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.Here, the network means a connection structure capable of exchanging information between each node, such as a plurality of terminals and servers, and examples of such networks include RF, 3rd Generation Partnership Project (3GPP) network, Long Term LTE Evolution) network, 5GPP (5th Generation Partnership Project) network, WIMAX (World Interoperability for Microwave Access) network, Internet, LAN (Local Area Network), Wireless LAN (Wireless Local Area Network), WAN (Wide Area Network) , PAN (Personal Area Network), Bluetooth (Bluetooth) network, NFC network, satellite broadcasting network, analog broadcasting network, DMB (Digital Multimedia Broadcasting) network, etc. are included, but are not limited thereto.

하기에서, 적어도 하나의 라는 용어는 단수 및 복수를 포함하는 용어로 정의되고, 적어도 하나의 라는 용어가 존재하지 않더라도 각 구성요소가 단수 또는 복수로 존재할 수 있고, 단수 또는 복수를 의미할 수 있음은 자명하다 할 것이다. 또한, 각 구성요소가 단수 또는 복수로 구비되는 것은, 실시예에 따라 변경가능하다 할 것이다.In the following, the term at least one is defined as a term including singular and plural, and even if at least one term does not exist, each component may exist in singular or plural, and may mean singular or plural. It will be self-evident. In addition, the singular or plural number of each component may be changed according to embodiments.

적어도 하나의 질의단말(200)은, 법률질문에 대한 수치화된 AI 답변서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 검색 키워드를 입력하고 검색 결과를 수신하는 단말일 수 있다. 그리고, 적어도 하나의 질의단말(200)은, 검색 결과에 대한 긍정 및 부정답변을 수치적 정보로 수신한 후, 게이지 형태로 표시하는 단말일 수 있다.At least one query terminal 200 may be a terminal that inputs a search keyword and receives a search result using a web page, app page, program, or application related to a digitized AI answer service for legal questions. In addition, at least one query terminal 200 may be a terminal that receives positive and negative answers to search results as numerical information and then displays them in the form of a gauge.

여기서, 적어도 하나의 질의단말(200)은, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다. 이때, 적어도 하나의 사용자 단말(100)은, 네트워크를 통해 원격지의 서버나 단말에 접속할 수 있는 단말로 구현될 수 있다. 적어도 하나의 사용자 단말(100)은, 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 네비게이션, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(smartphone), 스마트 패드(smartpad), 타블렛 PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.Here, at least one query terminal 200 may be implemented as a computer capable of accessing a remote server or terminal through a network. Here, the computer may include, for example, a laptop, a desktop, a laptop, and the like equipped with a navigation system and a web browser. In this case, at least one user terminal 100 may be implemented as a terminal capable of accessing a remote server or terminal through a network. At least one user terminal 100 is, for example, a wireless communication device that ensures portability and mobility, navigation, PCS (Personal Communication System), GSM (Global System for Mobile communications), PDC (Personal Digital Cellular), PHS (Personal Handyphone System), PDA (Personal Digital Assistant), IMT (International Mobile Telecommunication)-2000, CDMA (Code Division Multiple Access)-2000, W-CDMA (W-Code Division Multiple Access), Wibro (Wireless Broadband Internet ) may include all kinds of handheld-based wireless communication devices such as terminals, smartphones, smart pads, tablet PCs, and the like.

다음으로, AI 법률/질의응답서버(300)는, 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 긍정 및 부정 각각의 수치값으로 제공하는 구성일 수 있다.Next, the AI legal/question response server 300 collects case precedent information and legal counseling information of lawyers to which cases similar to the above query were applied, from at least one external server, and then processes them in a preset form to create a database. After analyzing the positive and negative legal answers to the above inquiries using an artificial intelligence machine learning algorithm based on the case precedent information and legal consultation information, each positive and negative numerical value is provided. It may be a configuration that

상기 AI 법률/질의응답서버(300)는 법률질문에 대한 수치화된 AI 답변서비스 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 제공하는 서버일 수 있다. AI 법률/질의응답서버(300)는 질의내용의 형태, 질의내용 내에 포함된 단어 또는 문장의 키워드를 검출하고, 상기 키워드와 상호연관성 또는 유사도가 높은 기 설정된 개수의 판례정보 및 법률상담정보를 추출한 후, 추출한 판례정보들 및 법률상담정보의 답변결과(긍정 및 부정)를 수치정보로 제공하는 구성일 수 있다.The AI legal/question response server 300 may be a server that provides digitized AI answer service web pages, app pages, programs or applications for legal questions. The AI legal/question response server 300 detects the form of the query content and keywords of words or sentences included in the query content, and extracts a preset number of precedent information and legal consultation information having a high degree of correlation or similarity with the keywords. Afterwards, it may be configured to provide the extracted precedent information and the result of the answer (positive or negative) of the legal consultation information as numerical information.

여기서, AI 법률/질의응답서버(300)는 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다.Here, the AI law/question response server 300 may be implemented as a computer capable of accessing a remote server or terminal through a network. Here, the computer may include, for example, a laptop, a desktop, a laptop, and the like equipped with a navigation system and a web browser.

도 2를 참조하면, AI 법률/질의응답서버(300)는 수집부(310), 전처리부(320), 데이터베이스화부(330), 기계 학습부(340), 자연어 처리부(350), 질의 및 유사도 분석/추출부(360), 긍정/부정 수치화부(370), 결과값 제공부(380)를 포함한다.Referring to FIG. 2, the AI law/question response server 300 includes a collection unit 310, a pre-processing unit 320, a database building unit 330, a machine learning unit 340, a natural language processing unit 350, a query and similarity It includes an analysis/extraction unit 360, a positive/negative digitization unit 370, and a result value providing unit 380.

본 발명의 일 실시예에 따른 AI 법률/질의응답서버(300)나 연동되어 동작하는 다른 서버(미도시)가 적어도 하나의 질의단말(200), 및 적어도 하나의 정보 제공 서버(미도시)로 법률질문에 대한 수치화된 AI 답변서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 전송하는 경우, 적어도 하나의 질의단말(200)은, 해당 서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 설치하거나 열 수 있다. 또한, 웹 브라우저에서 실행되는 스크립트를 이용하여 서비스 프로그램이 적어도 하나의 질의단말(200)에서 구동될 수도 있다. The AI law/question response server 300 according to an embodiment of the present invention or another server (not shown) operating in conjunction with at least one query terminal 200 and at least one information providing server (not shown) In the case of transmitting a digitized AI answer service application, program, app page, web page, etc. to legal questions, at least one query terminal 200 installs or opens the corresponding service application, program, app page, web page, etc. can Also, a service program may be run in at least one query terminal 200 using a script executed in a web browser.

여기서, 웹 브라우저는 웹(WWW: world wide web) 서비스를 이용할 수 있게 하는 프로그램으로 HTML(hyper text mark-up language)로 서술된 하이퍼 텍스트를 받아서 보여주는 프로그램을 의미하며, 예를 들어 넷스케이프(Netscape), 익스플로러(Explorer), 크롬(chrome) 등을 포함한다. 또한, 애플리케이션은 단말 상의 응용 프로그램(application)을 의미하며, 예를 들어, 모바일 단말(스마트폰)에서 실행되는 앱(app)을 포함한다.Here, the web browser is a program that enables the use of web (WWW: world wide web) services and means a program that receives and displays hypertext described in HTML (hyper text mark-up language). For example, Netscape , Explorer, Chrome, etc. In addition, an application means an application on a terminal, and includes, for example, an app running on a mobile terminal (smart phone).

도 2를 참조하면, 상기 수집부(310)는 적어도 하나 이상의 외부서버로부터 판례 로우(Raw) 데이터 및 법률 상담(Q&A)데이터를 수집하는 구성일 수 있다.Referring to FIG. 2 , the collection unit 310 may be configured to collect precedent raw data and legal consultation (Q&A) data from at least one external server.

여기서, 외부서버는 대한민국 국가벌률정보센터(www.law.go.kr)의 서버일 수 있고, 판례 로우(Raw) 데이터는 지방법원, 고등법원 및 대법원의 판례 빅데이터일 수 있다. 또한, 법률 상담(Q&A)정보는 판례에 대한 변호사들의 답변 및 답변에 근거법률정보를 포함한다.Here, the external server may be a server of the National Penalty Information Center ( www.law.go.kr ) of the Republic of Korea, and the precedent raw data may be precedent big data of district courts, high courts, and the Supreme Court. In addition, legal advice (Q&A) information includes legal information based on lawyers' answers and answers to precedents.

상기 수집부(310)는 Selenium 알고리즘을 이용할 판례정보 및 법률상담정보를 수집할 수 있다. 이때, 수집부(310)는 판례정보 및 법률상담정보를 스크랩핑(Scraping)하여 수집할 수 있는 프로그램이라면 모두 적용할 수 있다.The collection unit 310 may collect precedent information and legal counseling information using the Selenium algorithm. At this time, the collection unit 310 can apply any program that can collect precedent information and legal counseling information by scraping.

상기 전처리부(320)는 사건판례정보의 로우(Raw) 데이터 및 법률 상담데이터를 인덱스(index), 질문, 답변, 카테고리, 판례번호, 근거법률, 판례결과 및 상담답변을 긍정/부정의 카테고리로 분류/정렬/편집하는 과정일 수 있다.The pre-processing unit 320 converts raw data and legal counseling data of case precedent information into an index, question, answer, category, case number, ground law, precedent result, and counseling answer into positive/negative categories. It can be a process of sorting/sorting/editing.

여기서, 전처리부(320)는 사건판례 데이터를 자연어 처리알고리즘을 이용하여 질문(Q) 및 답변(A)의 형태로 변환가공 처리할 수 있다.Here, the pre-processing unit 320 may convert and process case precedent data in the form of a question (Q) and an answer (A) using a natural language processing algorithm.

일 예로, 보통의 판례 데이터는 <판시사항>, <판결요지>, <참조조문>, <참조판례> 등 많은 부분으로 이루어져 있고 그 내용도 복잡하다. 따라서 본 발명에서는 판례 데이터의 필요한 부분만 추출하여 전처리(카테고리화 함)해 향후 유사도 분석 및 이용자들에게 수치화된 답변을 제공할 수 있도록 한다.For example, ordinary precedent data consists of many parts such as <judgment matter>, <judgment gist>, <reference clause>, and <reference precedent>, and the contents are also complex. Therefore, in the present invention, only necessary parts of precedent data are extracted and preprocessed (categorized) so that future similarity analysis and numerical answers can be provided to users.

즉, 전처리부(320)는 판례 데이터 중 <판시사항>의 쟁점내용을 기초로 판결문의 어감을 '긍정' 및 '부정'으로 분류하고, 수치화한다.That is, the pre-processing unit 320 classifies the sense of the judgment sentence into 'positive' and 'negative' based on the content of the issue of <judicial matters> among the precedent data, and digitizes it.

예컨대, 국가법률정보센터에서 제공하는 판례 데이터에는 모두 <판시사항>이라는 일관된 항목이 존재하고 해당 항목 밑에는 [1], [2] 형태로 된 쟁점들이 나타난다. For example, in the precedent data provided by the National Legal Information Center, there is a consistent item called <Judgement>, and issues in the form of [1] and [2] appear under that item.

예컨대 <판시사항>에서 [3]까지의 번호는 해당 판례의 쟁점이 세 개 존재한다는 뜻이다. 각 번호에는 쟁점이 무엇이고 해당 쟁점에 대한 판사의 판결을 긍정(“적극”) 및 부정(“소극”)으로 표시된 것을 볼 수 있다. For example, the number from <Judgement> to [3] means that there are three issues in the case. Each number shows what the issue is and the judge's decision on that issue, marked affirmatively (“positive”) and negatively (“negatively”).

다음으로, 법률 데이터베이스화부(330)는 전처리부에서 전처리된 인덱스, 질문, 답변, 질문에 대한 태깅 카테고리, 판례번호, 근거법률, 판례결과 및 상담답변의 긍정/부정 태깅을 카테고리로 분류/정렬/편집하여 데이터베이스에 구축하는 구성일 수 있다.Next, the legal database unit 330 classifies/sorts/categorizes positive/negative tagging of the preprocessed index, question, answer, question tagging category, case number, ground law, precedent result, and counseling answer preprocessed in the preprocessing unit. It can be a configuration that you edit and build into a database.

여기서, 인덱스는 데이터베이스에 등록된 데이터에 부여된 고유번호(고유주소)일 수 있다.Here, the index may be a unique number (unique address) given to data registered in the database.

질문은 자연어 질문의 로우(Raw) 데이터이다. 답변은 사용자의 질문에 대한 변호사가 제공한 답변일 수 있다.A question is the raw data of a natural language question. The answer may be an answer provided by an attorney to the user's question.

상기 태깅 카테고리는 질문 관련 연상키워드로서, 예컨대, 임대차, 퇴직, 해고 등일 수 있다. 근거법률은 사건에 대한 변호사의 답변에 대한 근거 법률일 수 있다.The tagging category is a question-related association keyword, and may be, for example, lease, retirement, or dismissal. The grounding law may be the grounding law for the lawyer's answer to the case.

부정/긍정 태깅은 사용자의 질문형태가 긍정형으로 끝나는 지, 부정형으로 끝나는 지 판별한 태깅정보이다.Negative/positive tagging is tagging information that determines whether the user's question form ends in a positive or negative form.

상기 부정/긍정 태깅은 사용자에게 제공될 수치값에 적용된다. 예들어서 질문이 '명예훼손에 해당되나요?'라면 긍정형이고, '명예훼손에 해당 되지 않는 것인가요?'라면 부정형이다. 이와 같은 태깅을 하는 경우는 수치형 답변에서 긍정형 질문의 20%와, 부정형 질문의 20%는 의미하는 바가 다르기 때문이다. The negative/positive tagging is applied to numerical values to be presented to the user. For example, if the question is 'Is it applicable to defamation?', it is a positive type, and if 'Is it not applicable to defamation?', it is a negative type. This kind of tagging is because 20% of positive questions and 20% of negative questions in numerical answers have different meanings.

따라서 추후 부정형 질문의 수치형 답변을 긍정형으로 치환하는 경우, (100 - 수치형답변) = 치환한 수치형 답변으로 할 수 있도록 하기 위한 정보일 수 있다.Therefore, when the numerical answer of a negative question is replaced with a positive one later, (100 - numeric answer) = may be information for replacing the numerical answer.

다음으로, 기계 학습부(340)는 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정하고, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 기능을 수행한다.Next, the machine learning unit 340 calculates sentence vectors of a plurality of questions and answers constructed as a database using a sentence vector similarity algorithm, and then selects 10 sentences (questions and answers) having the highest similarity between sentences. After defining the sensory similarity felt by humans as '0' or '1' for the selected sentences, learning the defined sentences using a natural language processing learning algorithm (BERT NLP) and relearning the learned data It performs the function of deriving learning data.

즉, 상기 기계 학습부(340)는 Cosine similarity, Jaccard similarity를 기반으로 임베딩된 문장 벡터들 사이의 유사도를 구할수 있다. 또한, 문장간 유사도가 가장 높은 10개 문장을 선정할 수 있고, 이에 한정되는 것은 아니다.That is, the machine learning unit 340 may obtain a degree of similarity between embedded sentence vectors based on cosine similarity and Jaccard similarity. In addition, 10 sentences having the highest similarity between sentences may be selected, but the present invention is not limited thereto.

또한, 선정된 10개의 문장에 대해 실제 인간이 느끼는 유사도에 대해 인간이 직접 0(유사), 1(비유사)을 태깅하여 BERT(Bidirectional Encoder Representations from Transformers) NLP(Natural Language Processing)를 학습시킬 데이터를 생성한 후, BERT NLP를 학습하도록 동작한다..In addition, data for learning BERT (Bidirectional Encoder Representations from Transformers) NLP (Natural Language Processing) by manually tagging 0 (similar) and 1 (dissimilar) for the similarity felt by humans for the selected 10 sentences After generating, it operates to learn BERT NLP.

참고로, BERT는 문장 형태와 위치에 따라 동일한 단어도 다른 임베딩을 갖게 되도록 함으로써, 중의성을 해소하도록 설계하였다. 예를 들어 “account”와 “of the river”의 bank는 Word2Vec 또는 GloVe에서는 동일한 벡터를 갖는다. 그러나 이 단어는 문맥에 따라 전혀 다른 의미를 지녀야 하며 실제로 ELMo 또는 BERT에서는 전혀 다른 벡터를 갖는다. 도면에 도시된 예제는 1) 나는 너를 사랑해 2) 나는 너를 사랑했다 3) 사랑 누가 말했나. 이 세 문장에 대한 형태소 분석 결과를 입력값으로 코사인 디스턴스를 확인하면, 모두 동일하게 '사랑' 위치에 대한 워드 임베딩 값을 취했고 코사인 디스턴스를 출력했다. 이 중 문장이 비슷한 1번과 2번의 '사랑' 벡터는 매우 가까운 거리로 나타난다. 반면, 문장이 전혀 다른 3번은 동일한 '사랑'이라도 거리가 상당히 멀게 표시된다.For reference, BERT is designed to resolve ambiguity by making the same word have different embeddings depending on the sentence form and position. For example, banks of “account” and “of the river” have the same vectors in Word2Vec or GloVe. However, this word should have a completely different meaning depending on the context, and in fact it has a completely different vector in ELMo or BERT. Examples shown in the drawing are 1) I love you 2) I loved you 3) Love Who Said. When the cosine distance is checked using the morphological analysis results for these three sentences as input values, the word embedding value for the position of 'love' is identically taken and the cosine distance is output. Among them, the 'love' vectors of No. 1 and No. 2, which have similar sentences, appear at a very close distance. On the other hand, in the case of number 3, which has a completely different sentence, the distance is marked as very far even though it is the same 'love'.

다른 예로, BERT는 문장 또는 단어 벡터들 간의 코사인 유사도를 통해 유사의미를 벡터거리로 제공할 수 있다.As another example, BERT may provide similar meaning as a vector distance through cosine similarity between sentence or word vectors.

가령, 2번, 3번 '사랑' 벡터의 단순 Sum으로 1번 '사랑' 벡터와의 거리를 측정해 볼 경우, 두 벡터 Sum과의 거리는 0.17 정도다. 이 중 거리가 가까운 2번 벡터에 가중치를 부여한 Weighted Sum과의 거리를 살펴본다. 거리가 훨씬 가까워졌다. 반대로 거리가 먼 3번 벡터에 가중치를 부여해본다. 더 멀어지는 것을 확인할 수 있다. 코사인 디스턴스는 앵글을 측정하기 때문에 벡터가 커져도 거리는 동일하며, 아래는 벡터를 10배 더 크게 해도 동일한 거리를 나타내는 경우를 보여준다. 보다 자세한 내용은 코사인 유사도의 의미에서 확인할 수 있다.For example, when measuring the distance from the first 'love' vector with the simple sum of the second and third 'love' vectors, the distance between the two vectors sum is about 0.17. Among them, look at the distance with the Weighted Sum, which weights the vector 2, which has a short distance. The distance has gotten much closer. Conversely, try to assign weights to vector 3, which is far away. You can see it goes farther away. Since cosine distance measures an angle, the distance remains the same even if the vector is increased. More detailed information can be found in the meaning of cosine similarity.

다음으로, 자연어 처리부(350)는 자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 구성일 수 있다.Next, the natural language processing unit 350 may be a component that analyzes the meaning of the query content, extracts a negative or positive sense, and a preset category using a natural language processing algorithm.

자연어 처리부(350)는 질문 내용을 분석하는 데 있어, 해당 질문의 의미 분석 벡터화 과정, 부정/긍정 태깅화 과정 및 카테고리 태깅화 과정을 수행한다.The natural language processing unit 350 performs a meaning analysis vectorization process, a negative/positive tagging process, and a category tagging process of the question in analyzing the content of the question.

여기서, 의미 분석 벡터화 과정은 질문의 의미를 기반으로 파악한 다차원 공간 상의 벡터좌표로 해당 질의내용을 처리하는 과정일 수 있다. 이때, Universal Sentence Encoder와 BERT 등의 자연어 처리 알고리즘이 사용된다. 이를 통해 의미가 비슷한 질문들은 거리가 가까운 고유 좌표를 갖을 수 있다.Here, the semantic analysis vectorization process may be a process of processing the corresponding query content with vector coordinates in a multidimensional space identified based on the meaning of the question. At this time, natural language processing algorithms such as Universal Sentence Encoder and BERT are used. Through this, questions with similar meanings can have unique coordinates with a close distance.

다음으로, 부정/긍정 태깅화 과정은 사용자의 질문이 긍정형으로 끝나는 지, 부정형으로 끝나는 지 판별하여 태깅하는 과정이다.Next, the negative/positive tagging process is a process of tagging after determining whether the user's question ends in a positive or negative form.

예를 들어서 질문이 '명예훼손에 해당되나요?'라면 긍정형이고, '명예훼손에 해당 되지 않는 것인가요?'라면 부정형이다. 이와 같은 태깅을 하는 경우는 수치형 답변에서 긍정형 질문의 20%와, 부정형 질문의 20%는 의미하는 바가 다르기 때문이다. 따라서 추후 부정형 질문의 수치형 답변을 긍정형으로 치환하는 경우, (100 - 수치형답변) = 치환한 수치형 답변으로 할 수 있다.For example, if the question is 'Is it applicable to defamation?', it is a positive type, and if 'Is it not applicable to defamation?', it is a negative type. This kind of tagging is because 20% of positive questions and 20% of negative questions in numerical answers have different meanings. Therefore, if the numerical answer of a negative question is replaced with a positive one in the future, (100 - numerical answer) = the replaced numerical answer.

다음으로, 카테고리 태깅화 과정은 질문내용과 관련된 키워드를 태깅화하는 과정으로, 예컨대, 질문내용에 대한 분야 키워드 또는 핵심 키워드인 임대차, 퇴직, 해고 등에 대한 키워드를 태깅화하는 과정일 수 있다.Next, the category tagging process is a process of tagging keywords related to the question content, and may be, for example, a process of tagging field keywords related to the question content or key keywords such as leasing, retirement, and dismissal.

다음으로, 질의 및 유사도 분석/추출부(360)는 상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 데이터베이스 내의 정보와 비교분석하는 구성일 수 있다.Next, the query and similarity analysis/extraction unit 360 may be a component that compares and analyzes categories and multidimensional space vector coordinates similar to the categories and multidimensional space vector coordinates of the query content with information in the database.

즉, 질의 및 유사도 분석/추출부(360)는 질의내용의 카테고리와 유사한 카테고리를 갖는 판례정보 및 법률상담정보를 데이터베이스에서 1차 추출한 후, 질의내용의 다차원 공간 벡터좌표와 유사한(좌표거리가 가장 가까운) 다차원 공간 벡터좌표를 갖는 정보를 1차 추출한 정보에서 2차 추출하는 구성일 수 있다.That is, the query and similarity analysis/extraction unit 360 first extracts precedent information and legal consultation information having a category similar to that of the query content from the database, and then, after first extracting the query content, has a similar multidimensional spatial vector coordinate (the coordinate distance is the largest). It may be a configuration of secondarily extracting information having multidimensional space vector coordinates from firstly extracted information.

한편, 질의 및 유사도 분석/추출부(360)는 상술한 과정으로 질의내용과 연관된 법률사례를 추출할 수 있다.Meanwhile, the query and similarity analysis/extraction unit 360 may extract legal cases related to the query contents through the above-described process.

긍정/부정 수치화부(370)는 질의 및 유사도 분석/추출부(360)에서 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보 각각의 답변에 대한 긍정 및 부정 카테고리(수치값)의 평균값을 산출하는 구성일 수 있다.The positive/negative digitization unit 370 calculates an average value of positive and negative categories (numerical values) for each of the at least one case precedent information and legal consultation information extracted from the query and similarity analysis/extraction unit 360. can be config.

상기 긍정/부정 수치화부(370)는 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공한다.The positive/negative digitization unit 370 is configured when the positive or negative numerical value among the average values of the positive and negative categories (numeric values) of the extracted at least one case case precedent information and legal counseling information is calculated to be relatively higher than a preset value. , provides a numerical value reflecting the weight.

상기 결과값 제공부(380)는 긍정/부정 수치화부(370)에서 산출된 긍정 및 부정의 수치값을 게이지 형태의 그래프로 제공한다.The result value providing unit 380 provides the positive and negative numerical values calculated by the positive/negative digitizing unit 370 as a graph in the form of a gauge.

상기 결과값 제공부(380)는 앙상블(Ensemble) 기법에서 최종 의사결정에서 스택킹(Stacking)을 사용하는 방식과 유사하게 여려 사례의 수치를 입력값으로 사용해서 비선형 모델을 통해 제공할 수 있다.The result value providing unit 380 may provide it through a non-linear model by using the numerical values of several cases as input values, similar to the method of using stacking in the final decision-making in the ensemble technique.

도 10은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법의 흐름도이고, 도 11은 도 10에 도시된 S720 과정의 세부 흐름도이다. 10 is a flowchart of a method for providing a digitized AI answer service for legal questions according to an embodiment of the present invention, and FIG. 11 is a detailed flowchart of the S720 process shown in FIG.

도 10에 도시된 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법은 도 1에 도시된 시스템을 통해 구현될 수 있다.The method of providing a digitized AI answer service to legal questions shown in FIG. 10 can be implemented through the system shown in FIG.

도 10 및 도 11을 참조하면, 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법(S700)은 먼저, 질의단말(200)에서 법률질문에 대한 수치화된 AI 답변서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 질의내용에 대한 법률자문 또는 법률답변을 AI 법률/질의응답서버로 요청(S710)한다.10 and 11, in the method of providing a digitized AI answer service to legal questions according to an embodiment of the present invention (S700), first, the inquiry terminal 200 digitized AI answers to legal questions Using the service-related web page, app page, program, or application, request legal advice or legal answers to the AI legal/question-answering server (S710).

여기서, 상기 질의단말(200)에서 실행된 법률질문에 대한 수치화된 AI 답변서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션은 후술하는 AI 법률/질의응답서버에서 제공된 법률답변에 대한 수치값을 게이지 형태로 사용자에게 표시할 수 있다.Here, the web page, app page, program, or application related to the digitized AI answer service to the legal question executed in the query terminal 200 uses the numerical value of the legal answer provided from the AI legal/question response server described later in the form of a gauge. can be displayed to the user.

질의내용이 접수되면, AI 법률/질의응답서버(300)에서 상기 질의내용과 유사한 법률사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 보유한 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 수치값으로 제공(S720)한다. When the inquiry contents are received, the AI legal/question response server 300 collects case precedent information and legal consultation information of lawyers to which a similar legal case to the above inquiry contents is applied, from at least one external server, and then converts them into a preset form. It is processed and built into a database, and based on the built case case precedent information and legal consultation information, legal answers to positive and negative questions are analyzed using artificial intelligence machine learning algorithms, and then provided as numerical values ( S720).

보다 구체적으로, 상기 S720 과정은 상기 적어도 하나 이상의 외부서버로부터 수집된 사건판례정보 및 법률상담정보를 질문과 답변 형태로 변환한 후, 상기 답변의 성향을 '긍정(적극)' 및 '부정(소극)' 중 어느 하나로 분류하여 상기 데이터베이스로 구축하는 과정을 포함할 수 있다.More specifically, in the S720 process, after converting the case precedent information and legal consultation information collected from the at least one external server into a question and answer form, the inclination of the answer is 'positive (active)' and 'negative (negative)' )', and building the database into the database.

또한, 상기 질문 및 답변을 데이터베이스로 구축 시, 상기 질문 및 답변에 대한 로우(Raw)데이터, 질문에 대한 카테고리, 판례번호, 근거법률 중 적어도 하나 이상이 포함되도록 구축하는 과정을 포함할 수 있다.In addition, when building the database with the questions and answers, a process of constructing the database to include at least one of raw data for the questions and answers, categories for the questions, case numbers, and supporting laws may be included.

또한, 상기 사용자의 질의내용에 대한 어감을 긍정 및 부정 중 어느 하나로 판단하는 과정을 포함할 수 있다.In addition, a process of determining one of positive and negative feelings about the query contents of the user may be included.

또한, 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정한 후, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 과정을 포함할 수 있다.In addition, after calculating sentence vectors of a plurality of questions and answers constructed as a database using a sentence vector similarity algorithm, after selecting 10 sentences (questions and answers) with the highest similarity between sentences, After defining the sensory similarity felt by humans as '0' or '1', learning the defined sentences using the natural language processing learning algorithm (BERT NLP), and relearning the learned data to derive the learning data. can do.

또한, 자연어 처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 과정을 포함할 수 있다.In addition, a process of analyzing the meaning of the query content, extracting a negative or positive sense, and a preset category using a natural language processing learning algorithm (BERT NLP) may be included.

또한, 상기 자연어처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용 내의 문장내용(의미)을 다차원 공간 벡터좌표로 가공처리하는 과정을 포함할 수 있다.In addition, a process of processing the sentence content (meaning) in the query content into multi-dimensional space vector coordinates using the natural language processing learning algorithm (BERT NLP) may be included.

또한, 상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 포함하는 사건판례정보 및 법률상담정보를 데이터베이스에서 추출하는 과정을 포함할 수 있다.In addition, a process of extracting case case precedent information and legal consultation information including the categories of the query contents and categories similar to the multidimensional space vector coordinates and multidimensional space vector coordinates may be included from the database.

또한, 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값을 상기 수치값으로 제공하는 과정을 포함할 수 있다.In addition, a process of providing an average value of positive and negative categories (numerical values) of at least one or more extracted case precedent information and legal counseling information as the numerical value may be included.

또한, 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공하는 과정을 더 포함할 수 있다.In addition, if the positive or negative numerical value among the average values of the positive and negative categories (numeric values) of the extracted at least one case case precedent information and legal consultation information is relatively calculated to be more than a preset value, a numerical value reflecting the weight is provided. It may further include the process of

보다 구체적으로, 상기 S720 과정은 AI 법률/질의응답서버(300)에서 실행되는 과정으로, 수집부(310)에서 적어도 하나 이상의 외부서버로부터 판례 로우(Raw) 데이터 및 법률 상담(Q&A)데이터를 대한민국 국가벌률정보센터(www.law.go.kr)의 서버와 같은 외부서버에서 수집한다. 이때, 판례 로우(Raw) 데이터는 지방법원, 고등법원 및 대법원의 판례 빅데이터일 수 있다. 또한, 법률 상담(Q&A)정보는 판례에 대한 변호사들의 답변 및 답변에 근거법률정보를 포함한다.More specifically, the S720 process is a process executed in the AI legal/question response server 300, and the collection unit 310 collects precedent raw data and legal consultation (Q & A) data from at least one external server in Korea Collected from an external server such as the server of the National Penalty Information Center ( www.law.go.kr ). In this case, the precedent raw data may be precedent big data of the district court, the high court, and the Supreme Court. In addition, legal advice (Q&A) information includes legal information based on lawyers' answers and answers to precedents.

이후, 전처리부(320)에서 사건판례정보의 로우(Raw) 데이터 및 법률 상담데이터를 인덱스(index), 질문, 답변, 카테고리, 판례번호, 근거법률, 판례결과 및 상담답변을 긍정/부정의 카테고리로 분류/정렬/편집하는 과정 및 사건판례 데이터를 자연어 처리알고리즘을 이용하여 질문(Q) 및 답변(A)의 형태로 변환가공 처리하는 과정을 수행한다.Then, in the pre-processing unit 320, raw data and legal counseling data of case precedent information are indexed, questions, answers, categories, case number, ground law, precedent results, and counseling answers are categorized as positive/negative. The process of classifying/sorting/editing and converting case precedent data into the form of questions (Q) and answers (A) using natural language processing algorithms is performed.

전처리부(320)의 동작이 완료되면, 기계 학습부(340)에서 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정하고, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 기능을 수행한다.When the operation of the pre-processing unit 320 is completed, the machine learning unit 340 calculates sentence vectors of a plurality of questions and answers constructed as a database using a sentence vector similarity algorithm, and then selects 10 sentence vectors having the highest similarity between sentences. Sentences (questions and answers) are selected, and the similarity felt by humans for the selected sentences is defined as '0' or '1', and then the defined sentences are learned using a natural language processing learning algorithm (BERT NLP), , It performs the function of deriving learning data by re-learning the learned data.

즉, 상기 기계 학습부(340)는 Cosine similarity, Jaccard similarity를 기반으로 임베딩된 문장 벡터들 사이의 유사도를 구할수 있다. 또한, 문장간 유사도가 가장 높은 10개 문장을 선정할 수 있고, 이에 한정되는 것은 아니다.That is, the machine learning unit 340 may obtain a degree of similarity between embedded sentence vectors based on cosine similarity and Jaccard similarity. In addition, 10 sentences having the highest similarity between sentences may be selected, but the present invention is not limited thereto.

또한, 선정된 10개의 문장에 대해 실제 인간이 느끼는 유사도에 대해 인간이 직접 0(유사), 1(비유사)을 태깅하여 BERT(Bidirectional Encoder Representations from Transformers) NLP(Natural Language Processing)를 학습시킬 데이터를 생성한 후, BERT NLP를 학습하도록 동작한다.In addition, data for learning BERT (Bidirectional Encoder Representations from Transformers) NLP (Natural Language Processing) by manually tagging 0 (similar) and 1 (dissimilar) for the similarity felt by humans for the selected 10 sentences After generating, it operates to learn BERT NLP.

다음으로, 자연어 처리부(350)에서 자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출 및 질문 내용을 분석하는 데 있어, 해당 질문의 의미 분석 벡터화 과정, 부정/긍정 태깅화 과정 및 카테고리 태깅화 과정을 수행한다.Next, when the natural language processing unit 350 analyzes the meaning of the query content, extracts a negative or positive sense, and analyzes the question content using a natural language processing algorithm, a process of analyzing the meaning of the question and vectorizing the question content , negative/positive tagging process and category tagging process are performed.

여기서, 의미 분석 벡터화 과정은 질문의 의미를 기반으로 파악한 다차원 공간 상의 벡터좌표로 해당 질의내용을 처리하는 과정일 수 있다. 이때, Universal Sentence Encoder와 BERT 등의 자연어 처리 알고리즘이 사용된다. 이를 통해 의미가 비슷한 질문들은 거리가 가까운 고유 좌표를 갖을 수 있다.Here, the semantic analysis vectorization process may be a process of processing the corresponding query content with vector coordinates in a multidimensional space identified based on the meaning of the question. At this time, natural language processing algorithms such as Universal Sentence Encoder and BERT are used. Through this, questions with similar meanings can have unique coordinates with a close distance.

다음으로, 부정/긍정 태깅화 과정은 사용자의 질문이 긍정형으로 끝나는 지, 부정형으로 끝나는 지 판별하여 태깅하는 과정이다.Next, the negative/positive tagging process is a process of tagging after determining whether the user's question ends in a positive or negative form.

예를 들어서 질문이 '명예훼손에 해당되나요?'라면 긍정형이고, '명예훼손에 해당 되지 않는 것인가요?'라면 부정형이다. 이와 같은 태깅을 하는 경우는 수치형 답변에서 긍정형 질문의 20%와, 부정형 질문의 20%는 의미하는 바가 다르기 때문이다. 따라서 추후 부정형 질문의 수치형 답변을 긍정형으로 치환하는 경우, (100 - 수치형답변) = 치환한 수치형 답변으로 할 수 있다.For example, if the question is 'Is it applicable to defamation?', it is a positive type, and if 'Is it not applicable to defamation?', it is a negative type. This kind of tagging is because 20% of positive questions and 20% of negative questions in numerical answers have different meanings. Therefore, if the numerical answer of a negative question is replaced with a positive one in the future, (100 - numerical answer) = the replaced numerical answer.

다음으로, 카테고리 태깅화 과정은 질문내용과 관련된 키워드를 태깅화하는 과정으로, 예컨대, 질문내용에 대한 분야 키워드 또는 핵심 키워드인 임대차, 퇴직, 해고 등에 대한 키워드를 태깅화하는 과정일 수 있다.Next, the category tagging process is a process of tagging keywords related to the question content, and may be, for example, a process of tagging field keywords related to the question content or key keywords such as leasing, retirement, and dismissal.

자연어 처리부(350)의 역할이 완료되면, 질의 및 유사도 분석/추출부(360)에서 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 데이터베이스 내의 정보와 비교분석하는 과정을 수행한다.When the role of the natural language processing unit 350 is completed, the query and similarity analysis/extraction unit 360 performs a process of comparing and analyzing the categories and multidimensional space vector coordinates similar to those of the query content with information in the database. do.

여기서, 질의 및 유사도 분석/추출부(360)는 질의내용의 카테고리와 유사한 카테고리를 갖는 판례정보 및 법률상담정보를 데이터베이스에서 1차 추출한 후, 질의내용의 다차원 공간 벡터좌표와 유사한(좌표거리가 가장 가까운) 다차원 공간 벡터좌표를 갖는 정보를 1차 추출한 정보에서 2차 추출하는 구성일 수 있다.Here, the inquiry and similarity analysis/extraction unit 360 first extracts precedent information and legal consultation information having a category similar to that of the inquiry contents from the database, and then, after first extracting from the database, the query and similarity analysis/extraction unit 360 is similar to the multidimensional space vector coordinates of the inquiry contents (the coordinate distance is the most It may be a configuration of secondarily extracting information having multidimensional space vector coordinates from firstly extracted information.

또한, 질의 및 유사도 분석/추출부(360)에서 상술한 과정으로 질의내용과 연관된 법률사례를 추출하는 과정을 수행한다.In addition, the query and similarity analysis/extraction unit 360 performs the process of extracting legal cases related to the query contents through the above-described process.

이후, 긍정/부정 수치화부(370)에서 질의 및 유사도 분석/추출부(360)에서 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보 각각의 답변에 대한 긍정 및 부정 카테고리(수치값)의 평균값을 산출하는 과정 및 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공한다.Thereafter, the positive/negative quantification unit 370 calculates the average value of positive and negative categories (numerical values) for each of the at least one case precedent information and legal consultation information extracted from the query and similarity analysis/extraction unit 360. If the positive or negative numerical value of the average value of the positive and negative categories (numerical value) of the calculation process and at least one extracted case case precedent information and legal consultation information is calculated to be relatively higher than the predetermined value, the numerical value reflecting the weight provides

마지막으로, 결과값 제공부(380)에서 긍정/부정 수치화부(370)에서 산출된 긍정 및 부정의 수치값을 게이지 형태의 그래프를 질의단말(200)로 제공한다. 여기서, 결과값 제공부(380)는 앙상블(Ensemble) 기법에서 최종 의사결정에서 스택킹(Stacking)을 사용하는 방식과 유사하게 여려 사례의 수치를 입력값으로 사용해서 비선형 모델을 통해 제공할 수 있다.Finally, the result value providing unit 380 provides the query terminal 200 with a gauge-type graph of the positive and negative numerical values calculated by the positive/negative digitization unit 370 . Here, the result value providing unit 380 may use the numerical values of several cases as input values and provide them through a nonlinear model, similar to the method of using stacking in the final decision-making in the ensemble technique. .

따라서, 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 이용하면, 사용자는 간편하게 자신이 궁금하거나 또는 자신에게 벌어진 사건들에 대한 법률적 지식 또는 법률적 적용여부에 대한 답변을 긍정 및 부정의 수치가 포함된 게이지 형태로 제공받을 수 있고, 이와 유사한 판례 및 사례를 제공받을 수 있다는 이점이 있다.Therefore, by using the system and method for providing a digitized AI answer service to legal questions according to an embodiment of the present invention, users can easily find out what they are curious about or legal knowledge or legal knowledge about events that have happened to them. It has the advantage of being able to receive an answer on whether or not to apply in the form of a gauge that includes positive and negative values, and to be provided with similar precedents and cases.

도 12는 본 명세서에 개진된 하나 이상의 실시예가 구현될 수 있는 예시적인 컴퓨팅 환경을 도시하는 도면으로, 상술한 하나 이상의 실시예를 구현하도록 구성된 컴퓨팅 디바이스(1100)를 포함하는 시스템(1000)의 예시를 도시한다. 예를 들어, 컴퓨팅 디바이스(1100)는 개인 컴퓨터, 서버 컴퓨터, 핸드헬드 또는 랩탑 디바이스, 모바일 디바이스(모바일폰, PDA, 미디어 플레이어 등), 멀티프로세서 시스템, 소비자 전자기기, 미니 컴퓨터, 메인프레임 컴퓨터, 임의의 전술된 시스템 또는 디바이스를 포함하는 분산 컴퓨팅 환경 등을 포함하지만, 이것으로 한정되는 것은 아니다.12 is a diagram illustrating an example computing environment in which one or more embodiments set forth herein may be implemented, an illustration of a system 1000 that includes a computing device 1100 configured to implement one or more embodiments described above. shows For example, computing device 1100 may be a personal computer, server computer, handheld or laptop device, mobile device (mobile phone, personal digital assistant, media player, etc.), multiprocessor system, consumer electronics, mini computer, mainframe computer, distributed computing environments that include any of the foregoing systems or devices; and the like.

컴퓨팅 디바이스(1100)는 적어도 하나의 프로세싱 유닛(1110) 및 메모리(1120)를 포함할 수 있다. 여기서, 프로세싱 유닛(1110)은 예를 들어 중앙처리장치(CPU), 그래픽처리장치(GPU), 마이크로프로세서, 주문형 반도체(Application Specific Integrated Circuit, ASIC), Field Programmable Gate Arrays(FPGA) 등을 포함할 수 있으며, 복수의 코어를 가질 수 있다. 메모리(1120)는 휘발성 메모리(예를 들어, RAM 등), 비휘발성 메모리(예를 들어, ROM, 플래시 메모리 등) 또는 이들의 조합일 수 있다. 또한, 컴퓨팅 디바이스(1100)는 추가적인 스토리지(1130)를 포함할 수 있다. 스토리지(1130)는 자기 스토리지, 광학 스토리지 등을 포함하지만 이것으로 한정되지 않는다. 스토리지(1130)에는 본 명세서에 개진된 하나 이상의 실시예를 구현하기 위한 컴퓨터 판독 가능한 명령이 저장될 수 있고, 운영 시스템, 애플리케이션 프로그램 등을 구현하기 위한 다른 컴퓨터 판독 가능한 명령도 저장될 수 있다. 스토리지(1130)에 저장된 컴퓨터 판독 가능한 명령은 프로세싱 유닛(1110)에 의해 실행되기 위해 메모리(1120)에 로딩될 수 있다. 또한, 컴퓨팅 디바이스(1100)는 입력 디바이스(들)(1140) 및 출력 디바이스(들)(1150)을 포함할 수 있다. Computing device 1100 may include at least one processing unit 1110 and memory 1120 . Here, the processing unit 1110 may include, for example, a central processing unit (CPU), a graphics processing unit (GPU), a microprocessor, an Application Specific Integrated Circuit (ASIC), a Field Programmable Gate Arrays (FPGA), and the like. and may have a plurality of cores. The memory 1120 may be volatile memory (eg, RAM, etc.), non-volatile memory (eg, ROM, flash memory, etc.), or a combination thereof. Additionally, computing device 1100 may include additional storage 1130 . Storage 1130 includes, but is not limited to, magnetic storage, optical storage, and the like. The storage 1130 may store computer readable instructions for implementing one or more embodiments disclosed herein, and may also store other computer readable instructions for implementing an operating system, application programs, and the like. Computer readable instructions stored in storage 1130 may be loaded into memory 1120 for execution by processing unit 1110 . Computing device 1100 can also include input device(s) 1140 and output device(s) 1150 .

여기서, 입력 디바이스(들)(1140)은 예를 들어 키보드, 마우스, 펜, 음성 입력 디바이스, 터치 입력 디바이스, 적외선 카메라, 비디오 입력 디바이스 또는 임의의 다른 입력 디바이스 등을 포함할 수 있다. 또한, 출력 디바이스(들)(1150)은 예를 들어 하나 이상의 디스플레이, 스피커, 프린터 또는 임의의 다른 출력 디바이스 등을 포함할 수 있다. 또한, 컴퓨팅 디바이스(1100)는 다른 컴퓨팅 디바이스에 구비된 입력 디바이스 또는 출력 디바이스를 입력 디바이스(들)(1140) 또는 출력 디바이스(들)(1150)로서 사용할 수도 있다.Here, input device(s) 1140 may include, for example, a keyboard, mouse, pen, voice input device, touch input device, infrared camera, video input device, or any other input device. Output device(s) 1150 may also include, for example, one or more displays, speakers, printers, or any other output devices, or the like. Additionally, computing device 1100 may use an input device or output device included in another computing device as input device(s) 1140 or output device(s) 1150 .

또한, 컴퓨팅 디바이스(1100)는 컴퓨팅 디바이스(1100)가 다른 디바이스(예를 들어, 컴퓨팅 디바이스(1300))와 통신할 수 있게 하는 통신접속(들)(1160)을 포함할 수 있다. Computing device 1100 may also include communication connection(s) 1160 that allow computing device 1100 to communicate with other devices (eg, computing device 1300).

여기서, 통신 접속(들)(1160)은 모뎀, 네트워크 인터페이스 카드(NIC), 통합 네트워크 인터페이스, 무선 주파수 송신기/수신기, 적외선 포트, USB 접속 또는 컴퓨팅 디바이스(1100)를 다른 컴퓨팅 디바이스에 접속시키기 위한 다른 인터페이스를 포함할 수 있다. 또한, 통신 접속(들)(1160)은 유선 접속 또는 무선 접속을 포함할 수 있다. 상술한 컴퓨팅 디바이스(1100)의 각 구성요소는 버스 등의 다양한 상호접속(예를 들어, 주변 구성요소 상호접속(PCI), USB, 펌웨어(IEEE 1394), 광학적 버스 구조 등)에 의해 접속될 수도 있고, 네트워크(1200)에 의해 상호접속될 수도 있다. 본 명세서에서 사용되는 "구성요소", "시스템" 등과 같은 용어들은 일반적으로 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어, 또는 실행중인 소프트웨어인 컴퓨터 관련 엔티티를 지칭하는 것이다. Here, communication connection(s) 1160 may be a modem, network interface card (NIC), integrated network interface, radio frequency transmitter/receiver, infrared port, USB connection, or other device for connecting computing device 1100 to other computing devices. May contain interfaces. Further, communication connection(s) 1160 may include a wired connection or a wireless connection. Each component of the aforementioned computing device 1100 may be connected by various interconnections such as a bus (eg, peripheral component interconnection (PCI), USB, firmware (IEEE 1394), optical bus structure, etc.) and may be interconnected by the network 1200. Terms such as "component" and "system" as used herein generally refer to a computer-related entity that is hardware, a combination of hardware and software, software, or software in execution.

예를 들어, 구성요소는 프로세서 상에서 실행중인 프로세스, 프로세서, 객체, 실행 가능물(executable), 실행 스레드, 프로그램 및/또는 컴퓨터일 수 있지만, 이것으로 한정되는 것은 아니다. 예를 들어, 컨트롤러 상에서 구동중인 애플리케이션 및 컨트롤러 모두가 구성요소일 수 있다. 하나 이상의 구성요소는 프로세스 및/또는 실행의 스레드 내에 존재할 수 있으며, 구성요소는 하나의 컴퓨터 상에서 로컬화될 수 있고, 둘 이상의 컴퓨터 사이에서 분산될 수도 있다.For example, a component may be, but is not limited to, a process running on a processor, a processor, an object, an executable, a thread of execution, a program, and/or a computer. For example, both the application running on the controller and the controller may be components. One or more components can reside within a process and/or thread of execution and a component can be localized on one computer or distributed between two or more computers.

이상에서 본 발명은 실시예를 참조하여 상세히 설명되었으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 상기에서 설명된 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 부가 및 변형이 가능할 것임은 당연하며, 이와 같은 변형된 실시 형태들 역시 아래에 첨부한 특허청구범위에 의하여 정하여지는 본 발명의 보호 범위에 속하는 것으로 이해되어야 할 것이다.In the above, the present invention has been described in detail with reference to the examples, but those skilled in the art to which the present invention belongs will be able to make various substitutions, additions, and modifications without departing from the technical idea described above. Of course, it should be understood that such modified embodiments also belong to the protection scope of the present invention, which is defined by the appended claims below.

100: 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템
200: 질의단말
300: AI 법률/질의응답서버
310: 수집부
320: 전처리부
330: 데이터베이스화부
340: 기계 학습부
350: 자연어 처리부
360: 질의 및 유사도 분석/추출부
370: 긍정/부정 수치화부
380: 결과값 제공부
100: A system that provides digitized AI answering services to legal questions
200: query terminal
300: AI Legal/Q&A server
310: collection unit
320: pre-processing unit
330: database conversion unit
340: machine learning unit
350: natural language processing unit
360: query and similarity analysis/extraction unit
370: positive/negative quantification unit
380: result value provider

Claims (1)

질의내용에 대한 법률자문을 요청하는 질의단말: 및
상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 긍정 및 부정 각각의 수치값으로 제공하는 AI 법률/질의응답서버를 포함하고,
상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
Inquiry terminal requesting legal advice on the contents of inquiry: and
Case precedent information and legal consultation information of lawyers to which cases similar to the above query were applied are collected from at least one or more external servers, processed into a preset form, and built into a database, and the constructed case precedent information and legal consultation information Based on this, it includes an AI legal/question response server that analyzes legal answers to positive and negative questions about the contents of the inquiry using an artificial intelligence machine learning algorithm and provides them as numerical values of positive and negative values,
The query terminal provides a digitized AI answer service for legal questions, characterized in that for executing a question answering platform that displays the numerical value to the user in the form of a gauge.
KR1020230043428A 2020-09-28 2023-04-03 Systems and Methods to Provide AI Answering Service for Legal Questions KR20230051652A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230043428A KR20230051652A (en) 2020-09-28 2023-04-03 Systems and Methods to Provide AI Answering Service for Legal Questions

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020200126150A KR20220042838A (en) 2020-09-28 2020-09-28 Systems and Methods to Provide AI Answering Service for Legal Questions
KR1020230043428A KR20230051652A (en) 2020-09-28 2023-04-03 Systems and Methods to Provide AI Answering Service for Legal Questions

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020200126150A Division KR20220042838A (en) 2020-09-28 2020-09-28 Systems and Methods to Provide AI Answering Service for Legal Questions

Publications (1)

Publication Number Publication Date
KR20230051652A true KR20230051652A (en) 2023-04-18

Family

ID=81182383

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020200126150A KR20220042838A (en) 2020-09-28 2020-09-28 Systems and Methods to Provide AI Answering Service for Legal Questions
KR1020230043428A KR20230051652A (en) 2020-09-28 2023-04-03 Systems and Methods to Provide AI Answering Service for Legal Questions

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020200126150A KR20220042838A (en) 2020-09-28 2020-09-28 Systems and Methods to Provide AI Answering Service for Legal Questions

Country Status (1)

Country Link
KR (2) KR20220042838A (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102439321B1 (en) * 2022-05-04 2022-09-05 한국데이터플랫폼 주식회사 System for Providing Semantic Analysis Finding and Analyzing Sentence Meaning
KR102583818B1 (en) * 2022-09-14 2023-10-04 주식회사 글로랑 Method for sampling process of personality test using question and answer network representing group of respondents based on bert
KR102659523B1 (en) * 2023-07-18 2024-04-19 주식회사 더엔젤브릿지 System for retrieving legal information
CN117909485B (en) * 2024-03-19 2024-05-24 武汉百智诚远科技有限公司 Legal consultation intelligent interaction method and system based on large language model
CN118152542B (en) * 2024-05-09 2024-07-16 广东知得失网络科技有限公司 Chat method, chat system and chat robot for intellectual property related topics
CN118277538A (en) * 2024-06-04 2024-07-02 杭州昊清科技有限公司 Legal intelligent question-answering method based on retrieval enhancement language model

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190143583A (en) 2018-06-21 2019-12-31 주식회사 머니브레인 Method and computer readable recording medium for providing answers based on hybrid hierarchical conversation flow model with conversation management model using machine learning

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190143583A (en) 2018-06-21 2019-12-31 주식회사 머니브레인 Method and computer readable recording medium for providing answers based on hybrid hierarchical conversation flow model with conversation management model using machine learning

Also Published As

Publication number Publication date
KR20220042838A (en) 2022-04-05

Similar Documents

Publication Publication Date Title
KR20230051652A (en) Systems and Methods to Provide AI Answering Service for Legal Questions
CN111274365B (en) Intelligent inquiry method and device based on semantic understanding, storage medium and server
EP2499569B1 (en) Clustering method and system
EP3717984B1 (en) Method and apparatus for providing personalized self-help experience
CN110688452B (en) Text semantic similarity evaluation method, system, medium and device
CN113239071B (en) Retrieval query method and system for scientific and technological resource subject and research topic information
CN113569578B (en) User intention recognition method and device and computer equipment
KR102682244B1 (en) Method for learning machine-learning model with structured ESG data using ESG auxiliary tool and service server for generating automatically completed ESG documents with the machine-learning model
CN109977292A (en) Searching method, calculates equipment and computer readable storage medium at device
CN115796182A (en) Multi-modal named entity recognition method based on entity-level cross-modal interaction
CN117112595A (en) Information query method and device, electronic equipment and storage medium
Lathabai et al. x-index: Identifying core competency and thematic research strengths of institutions using an NLP and network based ranking framework
CN113342944B (en) Corpus generalization method, apparatus, device and storage medium
CN116127367A (en) Method and device for auditing service evaluation and computer readable storage medium
CN111104492B (en) Civil aviation field automatic question and answer method based on layering Attention mechanism
CN116680401A (en) Document processing method, document processing device, apparatus and storage medium
CN116775875A (en) Question corpus construction method and device, question answering method and device and storage medium
CN117077680A (en) Question and answer intention recognition method and device
KR102678306B1 (en) System and method for providing artificial intelligence-based positive and negative numerical legal answer services
CN114398482A (en) Dictionary construction method and device, electronic equipment and storage medium
CN116226320A (en) Method and device for predicting context information, electronic equipment and storage medium
CN111985217A (en) Keyword extraction method and computing device
CN111611379A (en) Text information classification method, device, equipment and readable storage medium
Vazquez et al. Retrieving and Ranking Relevant JavaScript Technologies from Web Repositories
CN114416925B (en) Sensitive word recognition method, device, equipment, storage medium and program product

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E90F Notification of reason for final refusal