KR20220042838A - Systems and Methods to Provide AI Answering Service for Legal Questions - Google Patents

Systems and Methods to Provide AI Answering Service for Legal Questions Download PDF

Info

Publication number
KR20220042838A
KR20220042838A KR1020200126150A KR20200126150A KR20220042838A KR 20220042838 A KR20220042838 A KR 20220042838A KR 1020200126150 A KR1020200126150 A KR 1020200126150A KR 20200126150 A KR20200126150 A KR 20200126150A KR 20220042838 A KR20220042838 A KR 20220042838A
Authority
KR
South Korea
Prior art keywords
legal
question
answer
numerical
providing
Prior art date
Application number
KR1020200126150A
Other languages
Korean (ko)
Inventor
박광렬
김성원
이남경
심희정
Original Assignee
한국에이아이소프트 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국에이아이소프트 주식회사 filed Critical 한국에이아이소프트 주식회사
Priority to KR1020200126150A priority Critical patent/KR20220042838A/en
Publication of KR20220042838A publication Critical patent/KR20220042838A/en
Priority to KR1020230043428A priority patent/KR20230051652A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Technology Law (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

One embodiment of the present invention relates to a system for providing a scored artificial intelligence (AI) answering service for legal questions, which displays negative and positive scores to a user in a gauge type. According to the present invention, the system comprises: an inquiry terminal requesting legal advice on inquiry content; and an AI legal question/answer server collecting case precedent information and legal consultation information of lawyers, to which cases similar to the inquiry content were applied, from at least one external server, processing the collected information to build a database, analyzing positive and negative legal answers to the inquiry content on the basis of the built case precedent information and legal consultation information by using an AI machine learning algorithm, and providing as positive and negative scores. The query terminal executes a question/answer platform displaying the scores to the user in a gauge type.

Description

법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법{Systems and Methods to Provide AI Answering Service for Legal Questions}Systems and Methods to Provide AI Answering Service for Legal Questions

본 발명은 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법에 관한 것이다.The present invention relates to a system and method for providing a numerical AI answer service to legal questions.

법무관련 영역은 기본적으로 상담을 필수로 하고 있지만, 전문가와 상담을 연결하는 다양한 수단 또는 양식(또 는 Form)을 제공하고 사전 조사형태로 진행되는정도에 그치는 것이 현재로서는 대부분이다. In the legal field, counseling is basically required, but at present, most of them provide various means or forms (or forms) to connect experts and counseling and proceed only in the form of a preliminary investigation.

이는 상담을 정형화하여 ARS 방식으로 각종 단계와 조건을 확인하며 처리하게 되므로 서비스 진행 속도가 매우 지루하고 서비스 경험이 나빠 해당 서비스의 자동화된 처리에 매우 큰 장애요소가 된다. 하지만 자연어 처리를 통해 상담이 가능하게 하면 기계학습에 따라 상담의 정밀도가 높아지고 유관산업의 활성 화를 시간과 공간의 제약없이 할 수 있게 된다.This standardizes the consultation and processes it by checking various steps and conditions in the ARS method, so the speed of the service is very tedious and the service experience is poor, which is a very big obstacle to the automated processing of the service. However, if consultation is made possible through natural language processing, the precision of consultation will increase according to machine learning, and the revitalization of related industries will be possible without time and space limitations.

이에 본 발명은 사용자의 법률질문에 대한 답변을 AI 학습알고리즘을 이용하여 제공할 수 있는 시스템 및 방법을 개시하고자 한다.Accordingly, the present invention intends to disclose a system and method that can provide an answer to a user's legal question using an AI learning algorithm.

공개특허공보 제10-2019-0143583호 (발명의 명칭: 대화 이해 AI 시스템에 의하여, 머신러닝을 대화 관리 기술에 적용한 하이브리드 계측적 대화 흐름 모델을 기초로 답변을 제공하는 방법 및 컴퓨터 판독가능한 기록 매체)Unexamined Patent Publication No. 10-2019-0143583 (Title of the Invention: A method and computer-readable recording medium for providing an answer based on a hybrid metrological conversation flow model in which machine learning is applied to a conversation management technology by a conversation understanding AI system )

본 발명이 해결하고자 하는 과제는 종래의 문제점을 해결할 수 있는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 제공하는 데 그 목적이 있다.An object of the present invention is to provide a system and method for providing a numerical AI answering service to legal questions that can solve conventional problems.

상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템은 질의내용에 대한 법률자문을 요청하는 질의단말: 및 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 긍정 및 부정 각각의 수치값으로 제공하는 AI 법률/질의응답서버를 포함하고, 상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 한다.A system for providing a numerical AI answer service to a legal question according to an embodiment of the present invention for solving the above problem is a query terminal requesting legal advice on the query content: and a case to which an event similar to the query content is applied After collecting case law information and legal consultation information of lawyers from at least one or more external servers, it is processed into a preset form and built into a database. After analyzing legal answers to negation using an artificial intelligence machine learning algorithm, it includes an AI legal/question answer server that provides numerical values of positive and negative values respectively, and the query terminal uses the numerical values in the form of gauges for users It is characterized by running a question-and-answer platform that is displayed to

일 실시예에서, 상기 AI 법률/질의응답서버는 상기 적어도 하나 이상의 외부서버로부터 수집된 사건판례정보 및 법률상담정보를 질문과 답변 형태로 변환한 후, 상기 답변의 성향을 '긍정(적극)' 및 '부정(소극)' 중 어느 하나로 분류하여 상기 데이터베이스로 구축하는 것을 특징으로 한다.In one embodiment, the AI legal/question answering server converts the case precedent information and legal consultation information collected from the at least one or more external servers into a question-and-answer format, and then changes the tendency of the answer to 'positive (actively)' and 'negative (negative)' is characterized in that it is classified into any one of 'negative' and constructed as the database.

일 실시예에서, 상기 AI 법률/질의응답서버는 상기 질문 및 답변을 데이터베이스로 구축 시, 상기 질문 및 답변에 대한 로우(Raw)데이터, 질문에 대한 카테고리, 판례번호, 근거법률 중 적어도 하나 이상이 포함되도록 구축하는 것을 특징으로 한다.In one embodiment, when the AI law/question answer server builds the question and answer into a database, at least one or more of raw data for the question and answer, a category for the question, a case number, and the grounding law It is characterized in that it is built to be included.

일 실시예에서, 상기 AI 법률/질의응답서버는 상기 사용자의 질의내용에 대한 어감을 긍정 및 부정 중 어느 하나로 인식하는 것을 특징으로 한다.In one embodiment, the AI law/question answering server is characterized in that it recognizes the sense of the user's query content as either positive or negative.

일 실시예에서, 상기 AI 법률/질의응답서버는 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정한 후, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 것을 특징으로 한다.In one embodiment, the AI law/question answer server calculates sentence vectors of a plurality of questions and answers constructed in a database using a sentence vector similarity algorithm, and then calculates the sentence vectors of the 10 sentences with the highest similarity between sentences (questions and answers). ), define the perceived similarity that humans feel for the selected sentences as '0' or '1', then learn the defined sentences using the natural language processing learning algorithm (BERT NLP), and use the learned data It is characterized in that learning data is derived by re-learning.

일 실시예에서, 상기 AI 법률/질의응답서버는 자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 것을 특징으로 한다.In one embodiment, the AI law/question answer server is characterized in that it uses a natural language processing algorithm to extract semantic analysis, negative or positive tone, and a preset category for the query content.

일 실시예에서, 상기 AI 법률/질의응답서버는 자연어처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용 내의 문장내용(의미)을 다차원 공간 벡터좌표로 가공처리하는 것을 특징으로 한다.In an embodiment, the AI law/question answer server processes the sentence content (meaning) in the query content into multidimensional space vector coordinates using a natural language processing learning algorithm (BERT NLP).

일 실시예에서, 상기 AI 법률/질의응답서버는 상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 포함하는 사건판례정보 및 법률상담정보를 데이터베이스에서 추출하는 것을 특징으로 한다.In an embodiment, the AI legal/question answering server extracts case precedent information and legal consultation information including a category and multidimensional space vector coordinates similar to the category of the query content and multidimensional space vector coordinates from the database. .

일 실시예에서, 상기 AI 법률/질의응답서버는 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값을 상기 수치값으로 제공하는 것을 특징으로 한다.In one embodiment, the AI legal/question answering server is characterized in that it provides the average value of the positive and negative categories (numeric values) of the extracted at least one or more case precedent information and legal consultation information as the numerical value.

일 실시예에서, 상기 AI 법률/질의응답서버는 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공하는 것을 특징으로 한다.In one embodiment, the AI legal/question answering server has a positive or negative numerical value among the average values of the positive and negative categories (numeric values) of the extracted at least one or more case precedent information and legal consultation information is more than a relatively preset value When calculated as , it is characterized in that the numerical value reflecting the weight is provided.

상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법은 질의단말에서 질의내용에 대한 법률자문을 요청하는 단계; 및 AI 법률/질의응답서버에서 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 수치값으로 제공단계를 포함하고, 상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 하는 한다.A method of providing a numerical AI answering service to a legal question according to an embodiment of the present invention for solving the above problem includes the steps of: requesting legal advice on the content of a query from a query terminal; And the AI law/question answer server collects case precedent information to which cases similar to the above query are applied and legal consultation information of lawyers from at least one or more external servers, then processes them into a preset form to build a database, Based on case precedent information and legal consultation information, after analyzing legal answers to the affirmative and negation of the query contents using an artificial intelligence machine learning algorithm, providing a numerical value, wherein the query terminal uses the numerical value Characterized in executing a question-and-answer platform that displays the value to the user in the form of a gauge.

본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 이용하면, 사용자는 간편하게 자신이 궁금하거나 또는 자신에게 벌어진 사건들에 대한 법률적 지식 또는 법률적 적용여부에 대한 답변을 긍정 및 부정의 수치가 포함된 게이지 형태로 제공받을 수 있고, 이와 유사한 판례 및 사례를 제공받을 수 있다는 이점이 있다.By using the system and method for providing a numerical AI answer service to a legal question according to an embodiment of the present invention, the user can conveniently find out whether the user is curious about himself or whether he has legal knowledge or legal application to the incidents that have occurred to him or her. There is an advantage in that answers to the questions can be provided in the form of gauges containing positive and negative figures, and similar precedents and cases can be provided.

도 1은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템의 네트워크 구성도이다.
도 2는 도 1에 도시된 AI 법률/질의응답서버의 세부 구성도이다.
도 3은 도 1에 도시된 데이터베이스의 데이터 구축형태를 나타낸 일 예시도이다.
도 4 내지 도 6은 자연어처리 학습알고리즘(BERT NLP)을 설명하기 위한 일 예시도이다.
도 7 및 도 8은 도 2에 도시된 질의 및 유사도 분석/추출부의 실행과정을 설명하기 위한 일 예시도이다.
도 9는 질의단말에서 도 2에 도시된 결과 제공부에서 제공한 수치값이 반영된 게이지 바의 일 예시도이다.
도 10은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법의 흐름도이다.
도 11은 도 10에 도시된 S720 과정의 세부 흐름도이다.
도 12는 본 명세서에 개진된 하나 이상의 실시예가 구현될 수 있는 예시적인 컴퓨팅 환경을 도시한 도이다.
1 is a network configuration diagram of a system that provides a numerical AI answering service to legal questions according to an embodiment of the present invention.
FIG. 2 is a detailed configuration diagram of the AI law/question answer server shown in FIG. 1. Referring to FIG.
3 is an exemplary diagram illustrating a data construction form of the database shown in FIG. 1 .
4 to 6 are exemplary views for explaining a natural language processing learning algorithm (BERT NLP).
7 and 8 are exemplary diagrams for explaining the execution process of the query and similarity analysis/extraction unit shown in FIG. 2 .
FIG. 9 is an exemplary diagram of a gauge bar in which the numerical value provided by the result providing unit shown in FIG. 2 is reflected in the query terminal.
10 is a flowchart of a method of providing a numerical AI answering service to a legal question according to an embodiment of the present invention.
11 is a detailed flowchart of the process S720 illustrated in FIG. 10 .
12 illustrates an example computing environment in which one or more embodiments disclosed herein may be implemented.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art can easily implement them. However, the present invention may be embodied in several different forms and is not limited to the embodiments described herein. And in order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미하며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Throughout the specification, when a part is "connected" with another part, this includes not only the case of being "directly connected" but also the case of being "electrically connected" with another element interposed therebetween. . In addition, when a part "includes" a certain component, it means that other components may be further included, rather than excluding other components, unless otherwise stated, and one or more other features However, it is to be understood that the existence or addition of numbers, steps, operations, components, parts, or combinations thereof is not precluded in advance.

명세서 전체에서 사용되는 정도의 용어 "약", "실질적으로" 등은 언급된 의미에 고유한 제조 및 물질 허용오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본 발명의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다. 본 발명의 명세서 전체에서 사용되는 정도의 용어 "~(하는) 단계" 또는 "~의 단계"는 "~ 를 위한 단계"를 의미하지 않는다. The terms "about", "substantially", etc. to the extent used throughout the specification are used in or close to the numerical value when manufacturing and material tolerances inherent in the stated meaning are presented, and are intended to enhance the understanding of the present invention. To help, precise or absolute figures are used to prevent unfair use by unconscionable infringers of the stated disclosure. As used throughout the specification of the present invention, the term "step of (to)" or "step of" does not mean "step for".

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체 지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.In this specification, a "part" includes a unit realized by hardware, a unit realized by software, and a unit realized using both. In addition, one unit may be implemented using two or more hardware, and two or more units may be implemented by one hardware. Meanwhile, '~ unit' is not limited to software or hardware, and '~ unit' may be configured to be in an addressable storage medium or to reproduce one or more processors. Thus, as an example, '~' denotes components such as software components, object-oriented software components, class components, and task components, and processes, functions, properties, and procedures. , subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays and variables. The functions provided in the components and '~ units' may be combined into a smaller number of components and '~ units' or further separated into additional components and '~ units'. In addition, components and '~ units' may be implemented to play one or more CPUs in a device or secure multimedia card.

본 명세서에 있어서 단말, 장치 또는 디바이스가 수행하는 것으로 기술된 동작이나 기능 중 일부는 해당 단말, 장치 또는 디바이스와 연결된 서버에서 대신 수행될 수도 있다. 이와 마찬가지로, 서버가 수행하는 것으로 기술된 동작이나 기능 중 일부도 해당 서버와 연결된 단말, 장치 또는 디바이스에서 수행될 수도 있다. Some of the operations or functions described as being performed by the terminal, apparatus, or device in the present specification may be performed instead of by a server connected to the terminal, apparatus, or device. Similarly, some of the operations or functions described as being performed by the server may also be performed in a terminal, apparatus, or device connected to the server.

본 명세서에 있어서, 단말과 매핑(Mapping) 또는 매칭(Matching)으로 기술된 동작이나 기능 중 일부는, 단말의 식별 정보(Identifying Data)인 단말기의 고유번호나 개인의 식별정보를 매핑 또는 매칭한다는 의미로 해석될 수 있다.In this specification, some of the operations or functions described as mapping or matching with the terminal means mapping or matching the terminal's unique number or personal identification information, which is the identification data of the terminal. can be interpreted as

이하, 첨부된 도면들에 기초하여 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 보다 상세하게 설명하도록 한다.Hereinafter, based on the accompanying drawings, a system and method for providing a numerical AI answering service to a legal question according to an embodiment of the present invention will be described in more detail.

도 1은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템의 네트워크 구성도이고, 도 2는 도 1에 도시된 AI 법률/질의응답서버의 세부 구성도이고, 도 3은 도 1에 도시된 데이터베이스의 데이터 구축형태를 나타낸 일 예시도이고, 도 4 내지 도 6은 자연어처리 학습알고리즘(BERT NLP)을 설명하기 위한 일 예시도이고, 도 7 및 도 8은 도 2에 도시된 질의 및 유사도 분석/추출부의 실행과정을 설명하기 위한 일 예시도이고, 도 9는 질의단말에서 도 2에 도시된 결과 제공부에서 제공한 수치값이 반영된 게이지 바의 일 예시도이다.1 is a network configuration diagram of a system that provides a numerical AI answering service to legal questions according to an embodiment of the present invention, and FIG. 2 is a detailed configuration diagram of the AI legal/question answering server shown in FIG. 3 is an exemplary diagram illustrating a data construction form of the database shown in FIG. 1 , FIGS. 4 to 6 are exemplary views for explaining a natural language processing learning algorithm (BERT NLP), and FIGS. 7 and 8 are FIG. It is an exemplary view for explaining the execution process of the query and similarity analysis/extraction unit shown in 2, and FIG. 9 is an exemplary view of a gauge bar in which the numerical value provided by the result providing unit shown in FIG. 2 is reflected in the query terminal. .

먼저, 도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템(100)은 질의단말(200) 및 AI 법률/질의응답서버(300)를 포함한다.First, as shown in FIG. 1 , the system 100 for providing a numerical AI answer service to a legal question according to an embodiment of the present invention includes a query terminal 200 and an AI legal/question answer server 300 . includes

다만, 도 1의 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템(100)은, 본 발명의 일 실시예에 불과함으로, 도 1을 통하여 본 발명이 한정 해석되는 것은 아니다.However, since the system 100 for providing a numerical AI answer service to a legal question of FIG. 1 is only an embodiment of the present invention, the present invention is not limitedly interpreted through FIG. 1 .

이때, 도 1의 각 구성요소들은 일반적으로 네트워크를 통해 연결된다. 예를들어, 도 1에 도시된 바와 같이, 적어도 하나 이상의 질의단말(200)은 네트워크를 통해 AI 법률/질의응답서버(300)와 연결될 수 있다.At this time, each component of FIG. 1 is generally connected through a network. For example, as shown in FIG. 1 , at least one query terminal 200 may be connected to the AI law/question answer server 300 through a network.

여기서, 네트워크는, 복수의 단말 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 이러한 네트워크의 일 예에는 RF, 3GPP(3rd Generation Partnership Project) 네트워크, LTE(Long Term Evolution) 네트워크, 5GPP(5th Generation Partnership Project) 네트워크, WIMAX(World Interoperability for Microwave Access) 네트워크, 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 블루투스(Bluetooth) 네트워크, NFC 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함되나 이에 한정되지는 않는다.Here, the network refers to a connection structure in which information exchange is possible between each node, such as a plurality of terminals and servers, and examples of such networks include RF, 3rd Generation Partnership Project (3GPP) network, and Long Term (LTE). Evolution) network, 5th Generation Partnership Project (5GPP) network, WIMAX (World Interoperability for Microwave Access) network, Internet, LAN (Local Area Network), Wireless LAN (Wireless Local Area Network), WAN (Wide Area Network) , PAN (Personal Area Network), Bluetooth (Bluetooth) network, NFC network, satellite broadcasting network, analog broadcasting network, DMB (Digital Multimedia Broadcasting) network, etc. include, but are not limited thereto.

하기에서, 적어도 하나의 라는 용어는 단수 및 복수를 포함하는 용어로 정의되고, 적어도 하나의 라는 용어가 존재하지 않더라도 각 구성요소가 단수 또는 복수로 존재할 수 있고, 단수 또는 복수를 의미할 수 있음은 자명하다 할 것이다. 또한, 각 구성요소가 단수 또는 복수로 구비되는 것은, 실시예에 따라 변경가능하다 할 것이다.In the following, the term at least one is defined as a term including the singular and the plural, and even if the at least one term does not exist, each element may exist in the singular or plural, and may mean the singular or plural. it will be self-evident In addition, that each component is provided in singular or plural may be changed according to embodiments.

적어도 하나의 질의단말(200)은, 법률질문에 대한 수치화된 AI 답변서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 검색 키워드를 입력하고 검색 결과를 수신하는 단말일 수 있다. 그리고, 적어도 하나의 질의단말(200)은, 검색 결과에 대한 긍정 및 부정답변을 수치적 정보로 수신한 후, 게이지 형태로 표시하는 단말일 수 있다.The at least one query terminal 200 may be a terminal for inputting a search keyword and receiving a search result using a web page, an app page, a program, or an application related to a numerical AI answering service to a legal question. In addition, the at least one query terminal 200 may be a terminal that receives positive and negative answers to the search results as numerical information and then displays them in the form of a gauge.

여기서, 적어도 하나의 질의단말(200)은, 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다. 이때, 적어도 하나의 사용자 단말(100)은, 네트워크를 통해 원격지의 서버나 단말에 접속할 수 있는 단말로 구현될 수 있다. 적어도 하나의 사용자 단말(100)은, 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 네비게이션, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말, 스마트폰(smartphone), 스마트 패드(smartpad), 타블렛 PC(Tablet PC) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.Here, the at least one query terminal 200 may be implemented as a computer capable of accessing a remote server or terminal through a network. Here, the computer may include, for example, navigation, a laptop equipped with a web browser, a desktop, and a laptop. In this case, the at least one user terminal 100 may be implemented as a terminal capable of accessing a remote server or terminal through a network. At least one user terminal 100 is, for example, as a wireless communication device that guarantees portability and mobility, navigation, PCS (Personal Communication System), GSM (Global System for Mobile communications), PDC (Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) ) terminal, a smart phone, a smart pad, a tablet PC, etc. may include all types of handheld-based wireless communication devices.

다음으로, AI 법률/질의응답서버(300)는, 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 긍정 및 부정 각각의 수치값으로 제공하는 구성일 수 있다.Next, the AI law/question answer server 300 collects case precedent information to which a case similar to the above query is applied and legal consultation information of lawyers from at least one external server, and then processes it in a preset form to the database Based on the established case precedent information and legal consultation information, the legal answers to the positive and negative answers to the above questions are analyzed using an artificial intelligence machine learning algorithm, and then provided as numerical values of positive and negative values respectively. It may be a configuration that

상기 AI 법률/질의응답서버(300)는 법률질문에 대한 수치화된 AI 답변서비스 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 제공하는 서버일 수 있다. AI 법률/질의응답서버(300)는 질의내용의 형태, 질의내용 내에 포함된 단어 또는 문장의 키워드를 검출하고, 상기 키워드와 상호연관성 또는 유사도가 높은 기 설정된 개수의 판례정보 및 법률상담정보를 추출한 후, 추출한 판례정보들 및 법률상담정보의 답변결과(긍정 및 부정)를 수치정보로 제공하는 구성일 수 있다.The AI legal/question answer server 300 may be a server that provides a numerical AI answer service web page, app page, program or application to legal questions. AI law / question and answer server 300 detects the form of the query content, keywords of words or sentences included in the query content, and extracts a preset number of case law information and legal consultation information with high correlation or similarity with the keyword. After that, it may be of a configuration in which the extracted judgment information and the answer results (positive and negative) of the legal consultation information are provided as numerical information.

여기서, AI 법률/질의응답서버(300)는 네트워크를 통하여 원격지의 서버나 단말에 접속할 수 있는 컴퓨터로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 네비게이션, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(Desktop), 랩톱(Laptop) 등을 포함할 수 있다.Here, the AI law/question answer server 300 may be implemented as a computer that can connect to a remote server or terminal through a network. Here, the computer may include, for example, navigation, a laptop equipped with a web browser, a desktop, and a laptop.

도 2를 참조하면, AI 법률/질의응답서버(300)는 수집부(310), 전처리부(320), 데이터베이스화부(330), 기계 학습부(340), 자연어 처리부(350), 질의 및 유사도 분석/추출부(360), 긍정/부정 수치화부(370), 결과값 제공부(380)를 포함한다.Referring to FIG. 2 , the AI law/question answer server 300 includes a collection unit 310 , a preprocessor 320 , a database conversion unit 330 , a machine learning unit 340 , a natural language processing unit 350 , and a query and similarity level. It includes an analysis/extraction unit 360 , a positive/negative quantification unit 370 , and a result value providing unit 380 .

본 발명의 일 실시예에 따른 AI 법률/질의응답서버(300)나 연동되어 동작하는 다른 서버(미도시)가 적어도 하나의 질의단말(200), 및 적어도 하나의 정보 제공 서버(미도시)로 법률질문에 대한 수치화된 AI 답변서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 전송하는 경우, 적어도 하나의 질의단말(200)은, 해당 서비스 애플리케이션, 프로그램, 앱 페이지, 웹 페이지 등을 설치하거나 열 수 있다. 또한, 웹 브라우저에서 실행되는 스크립트를 이용하여 서비스 프로그램이 적어도 하나의 질의단말(200)에서 구동될 수도 있다. The AI law/question answer server 300 or another server (not shown) operating in conjunction with at least one query terminal 200 and at least one information providing server (not shown) according to an embodiment of the present invention When transmitting a numerical AI answer service application, program, app page, web page, etc. to legal questions, at least one query terminal 200 installs or opens the corresponding service application, program, app page, web page, etc. can In addition, the service program may be driven in at least one query terminal 200 using a script executed in a web browser.

여기서, 웹 브라우저는 웹(WWW: world wide web) 서비스를 이용할 수 있게 하는 프로그램으로 HTML(hyper text mark-up language)로 서술된 하이퍼 텍스트를 받아서 보여주는 프로그램을 의미하며, 예를 들어 넷스케이프(Netscape), 익스플로러(Explorer), 크롬(chrome) 등을 포함한다. 또한, 애플리케이션은 단말 상의 응용 프로그램(application)을 의미하며, 예를 들어, 모바일 단말(스마트폰)에서 실행되는 앱(app)을 포함한다.Here, the web browser is a program that enables the use of a web (WWW: world wide web) service. It means a program that receives and displays hypertext written in HTML (hyper text mark-up language), for example, Netscape. , Explorer, Chrome, etc. In addition, the application means an application on the terminal, for example, includes an app (app) executed in a mobile terminal (smartphone).

도 2를 참조하면, 상기 수집부(310)는 적어도 하나 이상의 외부서버로부터 판례 로우(Raw) 데이터 및 법률 상담(Q&A)데이터를 수집하는 구성일 수 있다.Referring to FIG. 2 , the collection unit 310 may be configured to collect precedent raw data and legal consultation (Q&A) data from at least one or more external servers.

여기서, 외부서버는 대한민국 국가벌률정보센터(www.law.go.kr)의 서버일 수 있고, 판례 로우(Raw) 데이터는 지방법원, 고등법원 및 대법원의 판례 빅데이터일 수 있다. 또한, 법률 상담(Q&A)정보는 판례에 대한 변호사들의 답변 및 답변에 근거법률정보를 포함한다.Here, the external server may be a server of the National Penalty Information Center ( www.law.go.kr ) of the Republic of Korea, and the raw precedent data may be precedent big data of the district court, the high court, and the Supreme Court. In addition, legal consultation (Q&A) information includes legal information based on lawyers' answers to cases and answers.

상기 수집부(310)는 Selenium 알고리즘을 이용할 판례정보 및 법률상담정보를 수집할 수 있다. 이때, 수집부(310)는 판례정보 및 법률상담정보를 스크랩핑(Scraping)하여 수집할 수 있는 프로그램이라면 모두 적용할 수 있다.The collection unit 310 may collect case law information and legal consultation information using the Selenium algorithm. In this case, the collection unit 310 may apply any program that can be collected by scraping case law information and legal consultation information.

상기 전처리부(320)는 사건판례정보의 로우(Raw) 데이터 및 법률 상담데이터를 인덱스(index), 질문, 답변, 카테고리, 판례번호, 근거법률, 판례결과 및 상담답변을 긍정/부정의 카테고리로 분류/정렬/편집하는 과정일 수 있다.The pre-processing unit 320 converts raw data and legal consultation data of case precedent information into an index, question, answer, category, case number, ground law, precedent result and consultation answer into affirmative/negative categories It can be a process of sorting/sorting/editing.

여기서, 전처리부(320)는 사건판례 데이터를 자연어 처리알고리즘을 이용하여 질문(Q) 및 답변(A)의 형태로 변환가공 처리할 수 있다.Here, the pre-processing unit 320 may transform the case precedent data into the form of a question (Q) and an answer (A) using a natural language processing algorithm.

일 예로, 보통의 판례 데이터는 <판시사항>, <판결요지>, <참조조문>, <참조판례> 등 많은 부분으로 이루어져 있고 그 내용도 복잡하다. 따라서 본 발명에서는 판례 데이터의 필요한 부분만 추출하여 전처리(카테고리화 함)해 향후 유사도 분석 및 이용자들에게 수치화된 답변을 제공할 수 있도록 한다.For example, general case data is composed of many parts, such as <judgment matters>, <judgment summary>, <reference articles>, and <reference precedents>, and the contents are also complex. Therefore, in the present invention, only necessary parts of case data are extracted and pre-processed (categorized) so that similarity analysis and numerical answers can be provided to users in the future.

즉, 전처리부(320)는 판례 데이터 중 <판시사항>의 쟁점내용을 기초로 판결문의 어감을 '긍정' 및 '부정'으로 분류하고, 수치화한다.That is, the pre-processing unit 320 classifies the wording of the judgment into 'positive' and 'negative' based on the content of the issue of <judgment matters> among the case data, and quantifies it.

예컨대, 국가법률정보센터에서 제공하는 판례 데이터에는 모두 <판시사항>이라는 일관된 항목이 존재하고 해당 항목 밑에는 [1], [2] 형태로 된 쟁점들이 나타난다. For example, in the case data provided by the National Legal Information Center, there is a consistent item called <judgment matter>, and issues in the form of [1] and [2] appear under the item.

예컨대 <판시사항>에서 [3]까지의 번호는 해당 판례의 쟁점이 세 개 존재한다는 뜻이다. 각 번호에는 쟁점이 무엇이고 해당 쟁점에 대한 판사의 판결을 긍정(“적극”) 및 부정(“소극”)으로 표시된 것을 볼 수 있다. For example, the numbers from <Judgment Matters> to [3] mean that there are three issues in the case. In each number you can see what the issue is and the judge's decision on that issue, marked as positive (“positive”) and negative (“passive”).

다음으로, 법률 데이터베이스화부(330)는 전처리부에서 전처리된 인덱스, 질문, 답변, 질문에 대한 태깅 카테고리, 판례번호, 근거법률, 판례결과 및 상담답변의 긍정/부정 태깅을 카테고리로 분류/정렬/편집하여 데이터베이스에 구축하는 구성일 수 있다.Next, the legal database conversion unit 330 classifies/sorts/categorizes the indexes, questions, answers, and tagging categories for questions preprocessed in the preprocessing unit, case numbers, ground law, case results, and affirmative/negative tagging of counseling answers into categories It may be a configuration that you edit and build into the database.

여기서, 인덱스는 데이터베이스에 등록된 데이터에 부여된 고유번호(고유주소)일 수 있다.Here, the index may be a unique number (unique address) assigned to data registered in the database.

질문은 자연어 질문의 로우(Raw) 데이터이다. 답변은 사용자의 질문에 대한 변호사가 제공한 답변일 수 있다.A question is the raw data of a natural language question. The answer may be an answer provided by a lawyer to the user's question.

상기 태깅 카테고리는 질문 관련 연상키워드로서, 예컨대, 임대차, 퇴직, 해고 등일 수 있다. 근거법률은 사건에 대한 변호사의 답변에 대한 근거 법률일 수 있다.The tagging category is an associative keyword related to a question, and may be, for example, lease, retirement, dismissal, and the like. The grounding law may be the grounding law for the attorney's answer to the case.

부정/긍정 태깅은 사용자의 질문형태가 긍정형으로 끝나는 지, 부정형으로 끝나는 지 판별한 태깅정보이다.Negative/positive tagging is tagging information that determines whether the user's question form ends in an affirmative or negative form.

상기 부정/긍정 태깅은 사용자에게 제공될 수치값에 적용된다. 예들어서 질문이 '명예훼손에 해당되나요?'라면 긍정형이고, '명예훼손에 해당 되지 않는 것인가요?'라면 부정형이다. 이와 같은 태깅을 하는 경우는 수치형 답변에서 긍정형 질문의 20%와, 부정형 질문의 20%는 의미하는 바가 다르기 때문이다. The negative/positive tagging is applied to the numerical value to be provided to the user. For example, if the question is 'Is it defamation?', it's positive, and if it's 'Isn't it defamatory?', it's negative. This is because the meaning of 20% of positive questions and 20% of negative questions in numerical answers is different in the case of such tagging.

따라서 추후 부정형 질문의 수치형 답변을 긍정형으로 치환하는 경우, (100 - 수치형답변) = 치환한 수치형 답변으로 할 수 있도록 하기 위한 정보일 수 있다.Therefore, in the case of substituting an affirmative form for a numerical answer of a negative question later, (100 - Numerical answer) = This may be information to enable a substituted numerical answer.

다음으로, 기계 학습부(340)는 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정하고, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 기능을 수행한다.Next, the machine learning unit 340 calculates sentence vectors of a plurality of questions and answers constructed in the database using the sentence vector similarity algorithm, and then selects 10 sentences (questions and answers) having the highest similarity between sentences. After defining the similarity of human feeling for the selected sentences as '0' or '1', learning the defined sentences using the natural language processing learning algorithm (BERT NLP), and re-learning the learned data. It performs the function of deriving learning data.

즉, 상기 기계 학습부(340)는 Cosine similarity, Jaccard similarity를 기반으로 임베딩된 문장 벡터들 사이의 유사도를 구할수 있다. 또한, 문장간 유사도가 가장 높은 10개 문장을 선정할 수 있고, 이에 한정되는 것은 아니다.That is, the machine learning unit 340 may obtain a similarity between embedded sentence vectors based on cosine similarity and Jaccard similarity. In addition, 10 sentences having the highest similarity between sentences may be selected, but the present invention is not limited thereto.

또한, 선정된 10개의 문장에 대해 실제 인간이 느끼는 유사도에 대해 인간이 직접 0(유사), 1(비유사)을 태깅하여 BERT(Bidirectional Encoder Representations from Transformers) NLP(Natural Language Processing)를 학습시킬 데이터를 생성한 후, BERT NLP를 학습하도록 동작한다..In addition, data for learning BERT (Bidirectional Encoder Representations from Transformers) NLP (Natural Language Processing) by directly tagging 0 (similarity) and 1 (dissimilarity) for the degree of similarity felt by real humans to the selected 10 sentences After creating , it operates to learn BERT NLP.

참고로, BERT는 문장 형태와 위치에 따라 동일한 단어도 다른 임베딩을 갖게 되도록 함으로써, 중의성을 해소하도록 설계하였다. 예를 들어 “account”와 “of the river”의 bank는 Word2Vec 또는 GloVe에서는 동일한 벡터를 갖는다. 그러나 이 단어는 문맥에 따라 전혀 다른 의미를 지녀야 하며 실제로 ELMo 또는 BERT에서는 전혀 다른 벡터를 갖는다. 도면에 도시된 예제는 1) 나는 너를 사랑해 2) 나는 너를 사랑했다 3) 사랑 누가 말했나. 이 세 문장에 대한 형태소 분석 결과를 입력값으로 코사인 디스턴스를 확인하면, 모두 동일하게 '사랑' 위치에 대한 워드 임베딩 값을 취했고 코사인 디스턴스를 출력했다. 이 중 문장이 비슷한 1번과 2번의 '사랑' 벡터는 매우 가까운 거리로 나타난다. 반면, 문장이 전혀 다른 3번은 동일한 '사랑'이라도 거리가 상당히 멀게 표시된다.For reference, BERT is designed to eliminate ambiguity by allowing the same word to have different embeddings depending on the sentence shape and position. For example, the banks of “account” and “of the river” have the same vector in Word2Vec or GloVe. However, this word should have a completely different meaning depending on the context, and in fact it has a completely different vector in ELMo or BERT. The example shown in the drawing is 1) I love you 2) I loved you 3) Love Who said it? If the cosine distance was checked with the result of morphological analysis of these three sentences as an input value, the word embedding value for the 'love' position was equally taken and the cosine distance was outputted. Among them, the 'love' vectors of Nos. 1 and 2, which have similar sentences, appear very close. On the other hand, the three sentences with completely different sentences are displayed quite far apart even if they are the same 'love'.

다른 예로, BERT는 문장 또는 단어 벡터들 간의 코사인 유사도를 통해 유사의미를 벡터거리로 제공할 수 있다.As another example, BERT may provide a similarity as a vector distance through cosine similarity between sentence or word vectors.

가령, 2번, 3번 '사랑' 벡터의 단순 Sum으로 1번 '사랑' 벡터와의 거리를 측정해 볼 경우, 두 벡터 Sum과의 거리는 0.17 정도다. 이 중 거리가 가까운 2번 벡터에 가중치를 부여한 Weighted Sum과의 거리를 살펴본다. 거리가 훨씬 가까워졌다. 반대로 거리가 먼 3번 벡터에 가중치를 부여해본다. 더 멀어지는 것을 확인할 수 있다. 코사인 디스턴스는 앵글을 측정하기 때문에 벡터가 커져도 거리는 동일하며, 아래는 벡터를 10배 더 크게 해도 동일한 거리를 나타내는 경우를 보여준다. 보다 자세한 내용은 코사인 유사도의 의미에서 확인할 수 있다.For example, when measuring the distance to 'love' vector 1 with the simple Sum of 'love' vectors 2 and 3, the distance between the two vectors Sum is about 0.17. Among them, we examine the distance from the weighted sum to which a weight is given to the second vector, which is close to each other. The distance was much closer. Conversely, we give weight to vector 3, which is farther away. You can see it goes further. Since cosine distance measures an angle, the distance is the same even if the vector increases, and the following shows the case where the vector shows the same distance even if the vector is 10 times larger. More details can be found in  The meaning of cosine similarity.

다음으로, 자연어 처리부(350)는 자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 구성일 수 있다.Next, the natural language processing unit 350 may be configured to extract a semantic analysis, negative or positive tone, and a preset category for the query content using a natural language processing algorithm.

자연어 처리부(350)는 질문 내용을 분석하는 데 있어, 해당 질문의 의미 분석 벡터화 과정, 부정/긍정 태깅화 과정 및 카테고리 태깅화 과정을 수행한다.In analyzing the question content, the natural language processing unit 350 performs a semantic analysis vectorization process, negative/positive tagging process, and category tagging process of the corresponding question.

여기서, 의미 분석 벡터화 과정은 질문의 의미를 기반으로 파악한 다차원 공간 상의 벡터좌표로 해당 질의내용을 처리하는 과정일 수 있다. 이때, Universal Sentence Encoder와 BERT 등의 자연어 처리 알고리즘이 사용된다. 이를 통해 의미가 비슷한 질문들은 거리가 가까운 고유 좌표를 갖을 수 있다.Here, the semantic analysis vectorization process may be a process of processing the query content with vector coordinates in a multidimensional space grasped based on the meaning of the question. In this case, natural language processing algorithms such as Universal Sentence Encoder and BERT are used. This allows questions with similar meanings to have unique coordinates that are close to each other.

다음으로, 부정/긍정 태깅화 과정은 사용자의 질문이 긍정형으로 끝나는 지, 부정형으로 끝나는 지 판별하여 태깅하는 과정이다.Next, the negative/positive tagging process is a process of tagging by determining whether the user's question ends in an affirmative or negative form.

예를 들어서 질문이 '명예훼손에 해당되나요?'라면 긍정형이고, '명예훼손에 해당 되지 않는 것인가요?'라면 부정형이다. 이와 같은 태깅을 하는 경우는 수치형 답변에서 긍정형 질문의 20%와, 부정형 질문의 20%는 의미하는 바가 다르기 때문이다. 따라서 추후 부정형 질문의 수치형 답변을 긍정형으로 치환하는 경우, (100 - 수치형답변) = 치환한 수치형 답변으로 할 수 있다.For example, if the question is 'Is it defamation?', it's positive, and if it's 'Isn't it defamatory?', it's negative. This is because the meaning of 20% of positive questions and 20% of negative questions in numerical answers is different in the case of such tagging. Therefore, in the case of substituting an affirmative form for a numerical answer to a negative question later, (100 - Numerical answer) = a substituted numerical answer.

다음으로, 카테고리 태깅화 과정은 질문내용과 관련된 키워드를 태깅화하는 과정으로, 예컨대, 질문내용에 대한 분야 키워드 또는 핵심 키워드인 임대차, 퇴직, 해고 등에 대한 키워드를 태깅화하는 과정일 수 있다.Next, the category tagging process is a process of tagging keywords related to the content of the question, for example, it may be a process of tagging keywords for lease, retirement, dismissal, etc., which are field keywords or core keywords for the question content.

다음으로, 질의 및 유사도 분석/추출부(360)는 상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 데이터베이스 내의 정보와 비교분석하는 구성일 수 있다.Next, the query and similarity analysis/extraction unit 360 may be configured to compare and analyze categories and multidimensional space vector coordinates similar to the category and multidimensional space vector coordinates of the query content with information in the database.

즉, 질의 및 유사도 분석/추출부(360)는 질의내용의 카테고리와 유사한 카테고리를 갖는 판례정보 및 법률상담정보를 데이터베이스에서 1차 추출한 후, 질의내용의 다차원 공간 벡터좌표와 유사한(좌표거리가 가장 가까운) 다차원 공간 벡터좌표를 갖는 정보를 1차 추출한 정보에서 2차 추출하는 구성일 수 있다.That is, the query and similarity analysis/extraction unit 360 first extracts case law information and legal consultation information having a category similar to the category of the query content from the database, and is similar to the multidimensional space vector coordinate of the query content (the coordinate distance is the most Near) information having multidimensional space vector coordinates may be secondarily extracted from information extracted first.

한편, 질의 및 유사도 분석/추출부(360)는 상술한 과정으로 질의내용과 연관된 법률사례를 추출할 수 있다.Meanwhile, the query and similarity analysis/extraction unit 360 may extract a legal case related to the query content through the above-described process.

긍정/부정 수치화부(370)는 질의 및 유사도 분석/추출부(360)에서 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보 각각의 답변에 대한 긍정 및 부정 카테고리(수치값)의 평균값을 산출하는 구성일 수 있다.The positive/negative quantification unit 370 calculates the average value of positive and negative categories (numeric values) for each answer of at least one case precedent information and legal consultation information extracted from the query and similarity analysis/extraction unit 360 It can be configuration.

상기 긍정/부정 수치화부(370)는 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공한다.The positive/negative numerical value unit 370 is a positive or negative numerical value among the average values of positive and negative categories (numeric values) of at least one or more extracted case precedent information and legal consultation information. , provides a numerical value reflecting the weight.

상기 결과값 제공부(380)는 긍정/부정 수치화부(370)에서 산출된 긍정 및 부정의 수치값을 게이지 형태의 그래프로 제공한다.The result value providing unit 380 provides the positive/negative numerical values calculated by the positive/negative numerical value unit 370 in the form of a gauge graph.

상기 결과값 제공부(380)는 앙상블(Ensemble) 기법에서 최종 의사결정에서 스택킹(Stacking)을 사용하는 방식과 유사하게 여려 사례의 수치를 입력값으로 사용해서 비선형 모델을 통해 제공할 수 있다.The result providing unit 380 may use numerical values of several cases as input values and provide them through a nonlinear model similar to the method of using stacking in final decision making in the ensemble technique.

도 10은 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법의 흐름도이고, 도 11은 도 10에 도시된 S720 과정의 세부 흐름도이다. 10 is a flowchart of a method of providing a numerical AI answer service to a legal question according to an embodiment of the present invention, and FIG. 11 is a detailed flowchart of the process S720 shown in FIG.

도 10에 도시된 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법은 도 1에 도시된 시스템을 통해 구현될 수 있다.A method of providing a numerical AI answer service to a legal question shown in FIG. 10 may be implemented through the system shown in FIG. 1 .

도 10 및 도 11을 참조하면, 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법(S700)은 먼저, 질의단말(200)에서 법률질문에 대한 수치화된 AI 답변서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 질의내용에 대한 법률자문 또는 법률답변을 AI 법률/질의응답서버로 요청(S710)한다.10 and 11 , the method ( S700 ) of providing a numerical AI answer service to a legal question according to an embodiment of the present invention is first, a numerical AI answer to a legal question in the query terminal 200 . Requests legal advice or legal answers to the query contents to the AI legal/question answer server (S710) using a service-related web page, app page, program or application.

여기서, 상기 질의단말(200)에서 실행된 법률질문에 대한 수치화된 AI 답변서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션은 후술하는 AI 법률/질의응답서버에서 제공된 법률답변에 대한 수치값을 게이지 형태로 사용자에게 표시할 수 있다.Here, the numerical value of the AI answer service related web page, app page, program or application to the legal question executed in the query terminal 200 is a gauge form can be displayed to the user.

질의내용이 접수되면, AI 법률/질의응답서버(300)에서 상기 질의내용과 유사한 법률사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 보유한 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 수치값으로 제공(S720)한다. When a query is received, the AI law/question answer server 300 collects case precedent information to which a legal case similar to the above query is applied and legal consultation information of lawyers from at least one external server, and then in a preset form It is processed and built into a database, and legal answers to the affirmative and negative answers to the above questions are analyzed using artificial intelligence machine learning algorithms based on the established case precedent information and legal consultation information, and then provided as numerical values ( S720).

보다 구체적으로, 상기 S720 과정은 상기 적어도 하나 이상의 외부서버로부터 수집된 사건판례정보 및 법률상담정보를 질문과 답변 형태로 변환한 후, 상기 답변의 성향을 '긍정(적극)' 및 '부정(소극)' 중 어느 하나로 분류하여 상기 데이터베이스로 구축하는 과정을 포함할 수 있다.More specifically, the S720 process converts the case precedent information and legal consultation information collected from the at least one or more external servers into a question-and-answer format, and then changes the tendency of the answer to 'positive (active)' and 'negative (passive)' )' may include the process of classifying it into any one of ' and building the database.

또한, 상기 질문 및 답변을 데이터베이스로 구축 시, 상기 질문 및 답변에 대한 로우(Raw)데이터, 질문에 대한 카테고리, 판례번호, 근거법률 중 적어도 하나 이상이 포함되도록 구축하는 과정을 포함할 수 있다.In addition, when constructing the question and answer as a database, it may include a process of constructing to include at least one of raw data for the question and answer, a category for the question, a case number, and a grounding law.

또한, 상기 사용자의 질의내용에 대한 어감을 긍정 및 부정 중 어느 하나로 판단하는 과정을 포함할 수 있다.In addition, it may include a process of determining the sense of the user's query as any one of positive and negative.

또한, 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정한 후, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 과정을 포함할 수 있다.In addition, after calculating sentence vectors of a plurality of questions and answers constructed in the database using the sentence vector similarity algorithm, 10 sentences (questions and answers) with the highest similarity between sentences are selected, and then, After defining the perceived similarity felt by humans as '0' or '1', learning the defined sentences using the natural language processing learning algorithm (BERT NLP), re-learning the learned data to derive learning data. can do.

또한, 자연어 처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 과정을 포함할 수 있다.In addition, it may include a process of extracting a semantic analysis, negative or positive tone of the query content, and a preset category using a natural language processing learning algorithm (BERT NLP).

또한, 상기 자연어처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용 내의 문장내용(의미)을 다차원 공간 벡터좌표로 가공처리하는 과정을 포함할 수 있다.In addition, the process may include processing the sentence content (meaning) in the query content into multidimensional space vector coordinates using the natural language processing learning algorithm (BERT NLP).

또한, 상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 포함하는 사건판례정보 및 법률상담정보를 데이터베이스에서 추출하는 과정을 포함할 수 있다.In addition, it may include a process of extracting from the database case precedent information and legal consultation information including a category and multidimensional space vector coordinates similar to the category of the query content and multidimensional space vector coordinates.

또한, 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값을 상기 수치값으로 제공하는 과정을 포함할 수 있다.In addition, it may include the process of providing the average value of the positive and negative categories (numeric values) of the extracted at least one or more case precedent information and legal consultation information as the numerical value.

또한, 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공하는 과정을 더 포함할 수 있다.In addition, if the positive or negative numerical value among the average values of the positive and negative categories (numeric values) of at least one or more case precedent information and legal consultation information extracted is calculated to be more than a relatively preset number, a numerical value reflecting the weight is provided The process may further include

보다 구체적으로, 상기 S720 과정은 AI 법률/질의응답서버(300)에서 실행되는 과정으로, 수집부(310)에서 적어도 하나 이상의 외부서버로부터 판례 로우(Raw) 데이터 및 법률 상담(Q&A)데이터를 대한민국 국가벌률정보센터(www.law.go.kr)의 서버와 같은 외부서버에서 수집한다. 이때, 판례 로우(Raw) 데이터는 지방법원, 고등법원 및 대법원의 판례 빅데이터일 수 있다. 또한, 법률 상담(Q&A)정보는 판례에 대한 변호사들의 답변 및 답변에 근거법률정보를 포함한다.More specifically, the S720 process is a process executed by the AI legal/question answer server 300, and the collection unit 310 collects precedent raw data and legal consultation (Q&A) data from at least one external server in Korea. It is collected from an external server such as the server of the National Penalty Information Center ( www.law.go.kr ). In this case, raw case data may be case data of the district court, the high court, and the Supreme Court. In addition, legal consultation (Q&A) information includes legal information based on lawyers' answers to cases and answers.

이후, 전처리부(320)에서 사건판례정보의 로우(Raw) 데이터 및 법률 상담데이터를 인덱스(index), 질문, 답변, 카테고리, 판례번호, 근거법률, 판례결과 및 상담답변을 긍정/부정의 카테고리로 분류/정렬/편집하는 과정 및 사건판례 데이터를 자연어 처리알고리즘을 이용하여 질문(Q) 및 답변(A)의 형태로 변환가공 처리하는 과정을 수행한다.Then, in the preprocessor 320, the raw data and legal consultation data of case precedent information are indexed, questions, answers, categories, case numbers, ground laws, case results and counseling answers are positive/negative categories. It carries out the process of classifying/sorting/editing the data and converting and processing the case precedent data into the form of a question (Q) and an answer (A) using a natural language processing algorithm.

전처리부(320)의 동작이 완료되면, 기계 학습부(340)에서 문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정하고, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 기능을 수행한다.When the operation of the preprocessor 320 is completed, the machine learning unit 340 calculates the sentence vectors of a plurality of questions and answers constructed in the database using the sentence vector similarity algorithm, After selecting a sentence (question and answer), defining the similarity of feeling that humans feel to the selected sentences as '0' or '1', learning the defined sentences using the natural language processing learning algorithm (BERT NLP), , it performs the function of deriving learning data by re-learning the learned data.

즉, 상기 기계 학습부(340)는 Cosine similarity, Jaccard similarity를 기반으로 임베딩된 문장 벡터들 사이의 유사도를 구할수 있다. 또한, 문장간 유사도가 가장 높은 10개 문장을 선정할 수 있고, 이에 한정되는 것은 아니다.That is, the machine learning unit 340 may obtain a similarity between embedded sentence vectors based on cosine similarity and Jaccard similarity. In addition, 10 sentences having the highest similarity between sentences may be selected, but the present invention is not limited thereto.

또한, 선정된 10개의 문장에 대해 실제 인간이 느끼는 유사도에 대해 인간이 직접 0(유사), 1(비유사)을 태깅하여 BERT(Bidirectional Encoder Representations from Transformers) NLP(Natural Language Processing)를 학습시킬 데이터를 생성한 후, BERT NLP를 학습하도록 동작한다.In addition, data for learning BERT (Bidirectional Encoder Representations from Transformers) NLP (Natural Language Processing) by directly tagging 0 (similarity) and 1 (dissimilarity) for the degree of similarity felt by real humans to the selected 10 sentences After creating , it operates to learn BERT NLP.

다음으로, 자연어 처리부(350)에서 자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출 및 질문 내용을 분석하는 데 있어, 해당 질문의 의미 분석 벡터화 과정, 부정/긍정 태깅화 과정 및 카테고리 태깅화 과정을 수행한다.Next, when the natural language processing unit 350 uses a natural language processing algorithm to analyze the meaning of the query content, to extract a negative or positive tone, to extract a preset category, and to analyze the question content, the semantic analysis vectorization process of the question , a negative/positive tagging process and a category tagging process are performed.

여기서, 의미 분석 벡터화 과정은 질문의 의미를 기반으로 파악한 다차원 공간 상의 벡터좌표로 해당 질의내용을 처리하는 과정일 수 있다. 이때, Universal Sentence Encoder와 BERT 등의 자연어 처리 알고리즘이 사용된다. 이를 통해 의미가 비슷한 질문들은 거리가 가까운 고유 좌표를 갖을 수 있다.Here, the semantic analysis vectorization process may be a process of processing the query content with vector coordinates in a multidimensional space grasped based on the meaning of the question. In this case, natural language processing algorithms such as Universal Sentence Encoder and BERT are used. This allows questions with similar meanings to have unique coordinates that are close to each other.

다음으로, 부정/긍정 태깅화 과정은 사용자의 질문이 긍정형으로 끝나는 지, 부정형으로 끝나는 지 판별하여 태깅하는 과정이다.Next, the negative/positive tagging process is a process of tagging by determining whether the user's question ends in an affirmative or negative form.

예를 들어서 질문이 '명예훼손에 해당되나요?'라면 긍정형이고, '명예훼손에 해당 되지 않는 것인가요?'라면 부정형이다. 이와 같은 태깅을 하는 경우는 수치형 답변에서 긍정형 질문의 20%와, 부정형 질문의 20%는 의미하는 바가 다르기 때문이다. 따라서 추후 부정형 질문의 수치형 답변을 긍정형으로 치환하는 경우, (100 - 수치형답변) = 치환한 수치형 답변으로 할 수 있다.For example, if the question is 'Is it defamation?', it's positive, and if it's 'Isn't it defamatory?', it's negative. This is because the meaning of 20% of positive questions and 20% of negative questions in numerical answers is different in the case of such tagging. Therefore, in the case of substituting an affirmative form for a numerical answer to a negative question later, (100 - Numerical answer) = a substituted numerical answer.

다음으로, 카테고리 태깅화 과정은 질문내용과 관련된 키워드를 태깅화하는 과정으로, 예컨대, 질문내용에 대한 분야 키워드 또는 핵심 키워드인 임대차, 퇴직, 해고 등에 대한 키워드를 태깅화하는 과정일 수 있다.Next, the category tagging process is a process of tagging keywords related to the content of the question, for example, it may be a process of tagging keywords for lease, retirement, dismissal, etc., which are field keywords or core keywords for the question content.

자연어 처리부(350)의 역할이 완료되면, 질의 및 유사도 분석/추출부(360)에서 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 데이터베이스 내의 정보와 비교분석하는 과정을 수행한다.When the role of the natural language processing unit 350 is completed, the query and similarity analysis/extraction unit 360 compares and analyzes the category and multidimensional space vector coordinates similar to the category and multidimensional space vector coordinates of the query content with information in the database. do.

여기서, 질의 및 유사도 분석/추출부(360)는 질의내용의 카테고리와 유사한 카테고리를 갖는 판례정보 및 법률상담정보를 데이터베이스에서 1차 추출한 후, 질의내용의 다차원 공간 벡터좌표와 유사한(좌표거리가 가장 가까운) 다차원 공간 벡터좌표를 갖는 정보를 1차 추출한 정보에서 2차 추출하는 구성일 수 있다.Here, the query and similarity analysis/extraction unit 360 primarily extracts case law information and legal consultation information having a category similar to the category of the query content from the database, and then is similar to the multidimensional space vector coordinate of the query content (the coordinate distance is the most Near) information having multidimensional space vector coordinates may be secondarily extracted from information extracted first.

또한, 질의 및 유사도 분석/추출부(360)에서 상술한 과정으로 질의내용과 연관된 법률사례를 추출하는 과정을 수행한다.In addition, the query and similarity analysis/extraction unit 360 performs a process of extracting a legal case related to the query content through the above-described process.

이후, 긍정/부정 수치화부(370)에서 질의 및 유사도 분석/추출부(360)에서 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보 각각의 답변에 대한 긍정 및 부정 카테고리(수치값)의 평균값을 산출하는 과정 및 추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공한다.Thereafter, the average value of the positive and negative categories (numeric values) for each answer of at least one case precedent information and legal consultation information extracted from the query and similarity analysis/extraction unit 360 in the positive/negative quantification unit 370 If the positive or negative numerical value among the average values of the positive and negative categories (numeric values) of the calculation process and the extracted at least one case precedent information and legal consultation information is relatively more than a preset value, the numerical value reflecting the weight provides

마지막으로, 결과값 제공부(380)에서 긍정/부정 수치화부(370)에서 산출된 긍정 및 부정의 수치값을 게이지 형태의 그래프를 질의단말(200)로 제공한다. 여기서, 결과값 제공부(380)는 앙상블(Ensemble) 기법에서 최종 의사결정에서 스택킹(Stacking)을 사용하는 방식과 유사하게 여려 사례의 수치를 입력값으로 사용해서 비선형 모델을 통해 제공할 수 있다.Finally, the result value providing unit 380 provides a graph of the positive and negative numerical values calculated by the positive/negative digitizing unit 370 to the query terminal 200 in the form of a gauge. Here, the result providing unit 380 may use the numerical values of several cases as input values and provide them through a nonlinear model similar to the method of using stacking in final decision making in the ensemble technique. .

따라서, 본 발명의 일 실시예에 따른 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템 및 방법을 이용하면, 사용자는 간편하게 자신이 궁금하거나 또는 자신에게 벌어진 사건들에 대한 법률적 지식 또는 법률적 적용여부에 대한 답변을 긍정 및 부정의 수치가 포함된 게이지 형태로 제공받을 수 있고, 이와 유사한 판례 및 사례를 제공받을 수 있다는 이점이 있다.Therefore, by using the system and method for providing a numerical AI answer service to a legal question according to an embodiment of the present invention, the user can conveniently be curious about himself or have legal knowledge or legal knowledge about the events that have occurred to him. It has the advantage of being able to receive an answer on whether to apply it in the form of a gauge including positive and negative values, and to receive similar precedents and cases.

도 12는 본 명세서에 개진된 하나 이상의 실시예가 구현될 수 있는 예시적인 컴퓨팅 환경을 도시하는 도면으로, 상술한 하나 이상의 실시예를 구현하도록 구성된 컴퓨팅 디바이스(1100)를 포함하는 시스템(1000)의 예시를 도시한다. 예를 들어, 컴퓨팅 디바이스(1100)는 개인 컴퓨터, 서버 컴퓨터, 핸드헬드 또는 랩탑 디바이스, 모바일 디바이스(모바일폰, PDA, 미디어 플레이어 등), 멀티프로세서 시스템, 소비자 전자기기, 미니 컴퓨터, 메인프레임 컴퓨터, 임의의 전술된 시스템 또는 디바이스를 포함하는 분산 컴퓨팅 환경 등을 포함하지만, 이것으로 한정되는 것은 아니다.12 is a diagram illustrating an example computing environment in which one or more embodiments disclosed herein may be implemented, and is an illustration of a system 1000 including a computing device 1100 configured to implement one or more embodiments described above. shows For example, computing device 1100 may be a personal computer, server computer, handheld or laptop device, mobile device (mobile phone, PDA, media player, etc.), multiprocessor system, consumer electronics, minicomputer, mainframe computer, distributed computing environments including any of the aforementioned systems or devices, and the like.

컴퓨팅 디바이스(1100)는 적어도 하나의 프로세싱 유닛(1110) 및 메모리(1120)를 포함할 수 있다. 여기서, 프로세싱 유닛(1110)은 예를 들어 중앙처리장치(CPU), 그래픽처리장치(GPU), 마이크로프로세서, 주문형 반도체(Application Specific Integrated Circuit, ASIC), Field Programmable Gate Arrays(FPGA) 등을 포함할 수 있으며, 복수의 코어를 가질 수 있다. 메모리(1120)는 휘발성 메모리(예를 들어, RAM 등), 비휘발성 메모리(예를 들어, ROM, 플래시 메모리 등) 또는 이들의 조합일 수 있다. 또한, 컴퓨팅 디바이스(1100)는 추가적인 스토리지(1130)를 포함할 수 있다. 스토리지(1130)는 자기 스토리지, 광학 스토리지 등을 포함하지만 이것으로 한정되지 않는다. 스토리지(1130)에는 본 명세서에 개진된 하나 이상의 실시예를 구현하기 위한 컴퓨터 판독 가능한 명령이 저장될 수 있고, 운영 시스템, 애플리케이션 프로그램 등을 구현하기 위한 다른 컴퓨터 판독 가능한 명령도 저장될 수 있다. 스토리지(1130)에 저장된 컴퓨터 판독 가능한 명령은 프로세싱 유닛(1110)에 의해 실행되기 위해 메모리(1120)에 로딩될 수 있다. 또한, 컴퓨팅 디바이스(1100)는 입력 디바이스(들)(1140) 및 출력 디바이스(들)(1150)을 포함할 수 있다. The computing device 1100 may include at least one processing unit 1110 and a memory 1120 . Here, the processing unit 1110 may include, for example, a central processing unit (CPU), a graphic processing unit (GPU), a microprocessor, an Application Specific Integrated Circuit (ASIC), Field Programmable Gate Arrays (FPGA), etc. and may have a plurality of cores. The memory 1120 may be a volatile memory (eg, RAM, etc.), a non-volatile memory (eg, ROM, flash memory, etc.), or a combination thereof. Additionally, computing device 1100 may include additional storage 1130 . Storage 1130 includes, but is not limited to, magnetic storage, optical storage, and the like. The storage 1130 may store computer readable instructions for implementing one or more embodiments disclosed herein, and other computer readable instructions for implementing an operating system, an application program, and the like. Computer readable instructions stored in storage 1130 may be loaded into memory 1120 for execution by processing unit 1110 . Computing device 1100 may also include input device(s) 1140 and output device(s) 1150 .

여기서, 입력 디바이스(들)(1140)은 예를 들어 키보드, 마우스, 펜, 음성 입력 디바이스, 터치 입력 디바이스, 적외선 카메라, 비디오 입력 디바이스 또는 임의의 다른 입력 디바이스 등을 포함할 수 있다. 또한, 출력 디바이스(들)(1150)은 예를 들어 하나 이상의 디스플레이, 스피커, 프린터 또는 임의의 다른 출력 디바이스 등을 포함할 수 있다. 또한, 컴퓨팅 디바이스(1100)는 다른 컴퓨팅 디바이스에 구비된 입력 디바이스 또는 출력 디바이스를 입력 디바이스(들)(1140) 또는 출력 디바이스(들)(1150)로서 사용할 수도 있다.Here, the input device(s) 1140 may include, for example, a keyboard, mouse, pen, voice input device, touch input device, infrared camera, video input device, or any other input device, or the like. Further, the output device(s) 1150 may include, for example, one or more displays, speakers, printers, or any other output device, or the like. Also, the computing device 1100 may use an input device or an output device included in another computing device as the input device(s) 1140 or the output device(s) 1150 .

또한, 컴퓨팅 디바이스(1100)는 컴퓨팅 디바이스(1100)가 다른 디바이스(예를 들어, 컴퓨팅 디바이스(1300))와 통신할 수 있게 하는 통신접속(들)(1160)을 포함할 수 있다. Computing device 1100 may also include communication connection(s) 1160 that enable computing device 1100 to communicate with another device (eg, computing device 1300 ).

여기서, 통신 접속(들)(1160)은 모뎀, 네트워크 인터페이스 카드(NIC), 통합 네트워크 인터페이스, 무선 주파수 송신기/수신기, 적외선 포트, USB 접속 또는 컴퓨팅 디바이스(1100)를 다른 컴퓨팅 디바이스에 접속시키기 위한 다른 인터페이스를 포함할 수 있다. 또한, 통신 접속(들)(1160)은 유선 접속 또는 무선 접속을 포함할 수 있다. 상술한 컴퓨팅 디바이스(1100)의 각 구성요소는 버스 등의 다양한 상호접속(예를 들어, 주변 구성요소 상호접속(PCI), USB, 펌웨어(IEEE 1394), 광학적 버스 구조 등)에 의해 접속될 수도 있고, 네트워크(1200)에 의해 상호접속될 수도 있다. 본 명세서에서 사용되는 "구성요소", "시스템" 등과 같은 용어들은 일반적으로 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어, 또는 실행중인 소프트웨어인 컴퓨터 관련 엔티티를 지칭하는 것이다. Here, communication connection(s) 1160 may be a modem, network interface card (NIC), integrated network interface, radio frequency transmitter/receiver, infrared port, USB connection, or other for connecting computing device 1100 to another computing device. It may include interfaces. Also, the communication connection(s) 1160 may include a wired connection or a wireless connection. Each component of the above-described computing device 1100 may be connected by various interconnections such as a bus (eg, peripheral component interconnection (PCI), USB, firmware (IEEE 1394), optical bus structure, etc.) and may be interconnected by a network 1200 . As used herein, terms such as "component," "system," and the like, generally refer to a computer-related entity that is hardware, a combination of hardware and software, software, or software in execution.

예를 들어, 구성요소는 프로세서 상에서 실행중인 프로세스, 프로세서, 객체, 실행 가능물(executable), 실행 스레드, 프로그램 및/또는 컴퓨터일 수 있지만, 이것으로 한정되는 것은 아니다. 예를 들어, 컨트롤러 상에서 구동중인 애플리케이션 및 컨트롤러 모두가 구성요소일 수 있다. 하나 이상의 구성요소는 프로세스 및/또는 실행의 스레드 내에 존재할 수 있으며, 구성요소는 하나의 컴퓨터 상에서 로컬화될 수 있고, 둘 이상의 컴퓨터 사이에서 분산될 수도 있다.For example, a component can be, but is not limited to being, a process running on a processor, a processor, an object, an executable, a thread of execution, a program, and/or a computer. For example, both an application running on a controller and a controller may be a component. One or more components may reside within a process and/or thread of execution, and a component may be localized on one computer or distributed between two or more computers.

이상에서 본 발명은 실시예를 참조하여 상세히 설명되었으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 상기에서 설명된 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 부가 및 변형이 가능할 것임은 당연하며, 이와 같은 변형된 실시 형태들 역시 아래에 첨부한 특허청구범위에 의하여 정하여지는 본 발명의 보호 범위에 속하는 것으로 이해되어야 할 것이다.In the above, the present invention has been described in detail with reference to the embodiments, but those of ordinary skill in the art to which the present invention pertains may make various substitutions, additions and modifications within the scope not departing from the technical spirit described above. Of course, it should be understood that such modified embodiments also fall within the protection scope of the present invention as defined by the appended claims below.

100: 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템
200: 질의단말
300: AI 법률/질의응답서버
310: 수집부
320: 전처리부
330: 데이터베이스화부
340: 기계 학습부
350: 자연어 처리부
360: 질의 및 유사도 분석/추출부
370: 긍정/부정 수치화부
380: 결과값 제공부
100: A system that provides numerical AI answering services to legal questions
200: query terminal
300: AI legal / question and answer server
310: collection unit
320: preprocessor
330: database conversion unit
340: machine learning unit
350: natural language processing unit
360: Query and similarity analysis/extraction unit
370: positive / negative digitization unit
380: result value providing unit

Claims (20)

질의내용에 대한 법률자문을 요청하는 질의단말: 및
상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 긍정 및 부정 각각의 수치값으로 제공하는 AI 법률/질의응답서버를 포함하고,
상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
Inquiry terminal requesting legal advice on the content of the inquiry: and
After collecting case precedent information and legal consultation information of lawyers to which a case similar to the above query is applied from at least one external server, it is processed into a preset form and built into a database, and the established case precedent information and legal consultation information are stored After analyzing the legal answers to the affirmative and negative for the above query content using an artificial intelligence machine learning algorithm based on it, it includes an AI legal / question-and-answer server that provides numerical values of positive and negative values, respectively,
The system providing a numerical AI answering service to legal questions, characterized in that the query terminal executes a question and answer platform that displays the numerical value to the user in the form of a gauge.
제1항에 있어서,
상기 AI 법률/질의응답서버는
상기 적어도 하나 이상의 외부서버로부터 수집된 사건판례정보 및 법률상담정보를 질문과 답변 형태로 변환한 후, 상기 답변의 성향을 '긍정(적극)' 및 '부정(소극)' 중 어느 하나로 분류하여 상기 데이터베이스로 구축하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
According to claim 1,
The AI law/question answer server
After converting the case precedent information and legal consultation information collected from the at least one or more external servers into a question and answer format, the tendency of the answer is classified into either 'positive (positive)' or 'negative (passive)' A system that provides numerical AI answering services to legal questions built into a database.
제2항에 있어서,
상기 AI 법률/질의응답서버는
상기 질문 및 답변을 데이터베이스로 구축 시, 상기 질문 및 답변에 대한 로우(Raw)데이터, 질문에 대한 카테고리, 판례번호, 근거법률 중 적어도 하나 이상이 포함되도록 구축하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
3. The method of claim 2,
The AI law/question answer server
Numerical AI answering service to legal questions constructed so that at least one of raw data for the questions and answers, the category for the question, the case number, and the underlying law are included when building the questions and answers as a database system that provides
제1항에 있어서,
상기 AI 법률/질의응답서버는
상기 사용자의 질의내용에 대한 어감을 긍정 및 부정 중 어느 하나로 인식하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
According to claim 1,
The AI law/question answer server
A system for providing a numerical AI answering service to a legal question, characterized in that it recognizes the tone of the user's query as either positive or negative.
제3항에 있어서,
상기 AI 법률/질의응답서버는
문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정한 후, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
4. The method of claim 3,
The AI law/question answer server
After calculating the sentence vectors of a plurality of questions and answers constructed in the database using the sentence vector similarity algorithm, the 10 sentences (questions and answers) with the highest similarity between sentences are selected, and the human After defining the perceived similarity as '0' or '1', learning the defined sentences using the Natural Language Processing Learning Algorithm (BERT NLP), re-learning the learned data to quantify the legal questions to derive learning data A system that provides an AI response service.
제2항에 있어서,
상기 AI 법률/질의응답서버는
자연어 처리알고리즘을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
3. The method of claim 2,
The AI law/question answer server
A system for providing a numerical AI answer service to legal questions, characterized in that by using a natural language processing algorithm, semantic analysis of the query content, negative or positive tone, and a preset category are extracted.
제6항에 있어서,
상기 AI 법률/질의응답서버는
자연어처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용 내의 문장내용(의미)을 다차원 공간 벡터좌표로 가공처리하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
7. The method of claim 6,
The AI law/question answer server
A system that provides a numerical AI answer service to a legal question that processes the sentence content (meaning) in the query content into multidimensional space vector coordinates using a natural language processing learning algorithm (BERT NLP).
제7항에 있어서,
상기 AI 법률/질의응답서버는
상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 포함하는 사건판례정보 및 법률상담정보를 데이터베이스에서 추출하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
8. The method of claim 7,
The AI law/question answer server
A system that provides a numerical AI answer service to a legal question that extracts case precedent information and legal consultation information including categories and multidimensional space vector coordinates similar to the category of the query content and multidimensional space vector coordinates from the database.
제8항에 있어서,
상기 AI 법률/질의응답서버는
추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값을 상기 수치값으로 제공하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
9. The method of claim 8,
The AI law/question answer server
A system for providing a numerical AI answer service to legal questions that provides the average value of the positive and negative categories (numeric values) of at least one extracted case precedent information and legal consultation information as the numerical value.
제9항에 있어서,
상기 AI 법률/질의응답서버는
추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 시스템.
10. The method of claim 9,
The AI law/question answer server
A law providing a numerical value reflecting a weight when the positive or negative numerical value among the average values of the positive and negative categories (numeric values) of at least one or more extracted case precedent information and legal consultation information is relatively calculated to be greater than or equal to a preset value A system that provides numerical AI answering services to questions.
질의단말에서 질의내용에 대한 법률자문(답변)을 요청하는 단계; 및
AI 법률/질의응답서버에서 상기 질의내용과 유사한 사건이 적용된 사건판례정보 및 법률가들의 법률상담정보를 적어도 하나 이상의 외부서버로부터 수집한 후, 기 설정된 형태로 가공처리하여 데이터베이스로 구축하고, 구축된 사건판례정보 및 법률상담정보를 기초로 상기 질의내용에 대한 긍정 및 부정에 대한 법률답변을 인공지능 기계학습 알고리즘을 이용하여 분석한 후, 수치값으로 제공단계를 포함하고, 상기 질의단말은 상기 수치값을 게이지 형태로 사용자에게 표시하는 질의답변 플랫폼을 실행하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
requesting legal advice (answer) on the contents of the inquiry from the inquiry terminal; and
In the AI law/question answer server, case precedent information and legal consultation information of lawyers to which cases similar to the above query are applied are collected from at least one external server, and then processed into a preset form to build a database, and the constructed case After analyzing the legal answers to the affirmation and negation of the query contents using an artificial intelligence machine learning algorithm based on precedent information and legal consultation information, providing a numerical value, wherein the query terminal provides the numerical value A method of providing a numerical AI answering service to legal questions, characterized in that it runs a question-and-answer platform that displays to the user in the form of a gauge.
제11항에 있어서,
상기 수치값을 제공하는 단계는
상기 적어도 하나 이상의 외부서버로부터 수집된 사건판례정보 및 법률상담정보를 질문과 답변 형태로 변환한 후, 상기 답변의 성향을 '긍정(적극)' 및 '부정(소극)' 중 어느 하나로 분류하여 상기 데이터베이스로 구축하는 단계를 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
12. The method of claim 11,
The step of providing the numerical value is
After converting the case precedent information and legal consultation information collected from the at least one or more external servers into a question and answer format, the tendency of the answer is classified into either 'positive (positive)' or 'negative (passive)' A method of providing a numerical AI answering service to legal questions including the step of building it into a database.
제12항에 있어서,
상기 수치값을 제공하는 단계는
상기 질문 및 답변을 데이터베이스로 구축 시, 상기 질문 및 답변에 대한 로우(Raw)데이터, 질문에 대한 카테고리, 판례번호, 근거법률 중 적어도 하나 이상이 포함되도록 구축하는 단계를 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
13. The method of claim 12,
The step of providing the numerical value is
Numericalization of legal questions, including the step of constructing to include at least one of raw data for the questions and answers, a category for the question, a case number, and the underlying law when building the questions and answers as a database How to provide a customized AI answer service.
제11항에 있어서,
상기 수치값을 제공하는 단계는
상기 사용자의 질의내용에 대한 어감을 긍정 및 부정 중 어느 하나로 판단하는 단계를 포함하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
12. The method of claim 11,
The step of providing the numerical value is
A method of providing a numerical AI answer service to a legal question, characterized in that it comprises the step of judging any one of positive and negative tone of the user's query content.
제13항에 있어서,
상기 수치값을 제공하는 단계는
문장 벡터 유사도 알고리즘을 이용하여 데이터베이스로 구축된 복수의 질문 및 답변의 문장 벡터를 산출한 후, 문장간 유사도가 가장 높은 10개의 문장(질문 및 답변)을 선정한 후, 선정된 문장들에 대해 인간이 느끼는 체감유사도를 '0' 또는 '1'로 정의한 후, 자연어처리 학습알고리즘(BERT NLP)을 이용하여 정의된 문장들을 학습하고, 학습된 데이터를 재학습하여 학습데이터를 파생시키는 단계를 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
14. The method of claim 13,
The step of providing the numerical value is
After calculating the sentence vectors of a plurality of questions and answers constructed in the database using the sentence vector similarity algorithm, the 10 sentences (questions and answers) with the highest similarity between sentences are selected, and the human After defining the perceived similarity as '0' or '1', learning the sentences defined using a natural language processing learning algorithm (BERT NLP), and re-learning the learned data to derive learning data How to provide numerical AI answering service to questions.
제12항에 있어서,
상기 수치값을 제공하는 단계는
자연어 처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용에 대한 의미분석, 부정 또는 긍정의 어감, 기 설정된 카테고리를 추출하는 단계를 포함하는 것을 특징으로 하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
13. The method of claim 12,
The step of providing the numerical value is
Using a natural language processing learning algorithm (BERT NLP) to analyze the meaning of the query, negative or positive tone, and extracting a preset category Provides a numerical AI answer service to legal questions How to.
제16항에 있어서,
상기 수치값을 제공하는 단계는
상기 자연어처리 학습알고리즘(BERT NLP)을 이용하여 상기 질의내용 내의 문장내용(의미)을 다차원 공간 벡터좌표로 가공처리하는 단계를 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
17. The method of claim 16,
The step of providing the numerical value is
A method of providing a numerical AI answer service to a legal question, comprising processing the sentence content (meaning) in the query content into multidimensional space vector coordinates using the natural language processing learning algorithm (BERT NLP).
제17항에 있어서,
상기 수치값을 제공하는 단계는
상기 질의내용의 카테고리 및 다차원 공간 벡터좌표와 유사한 카테고리 및 다차원 공간 벡터좌표를 포함하는 사건판례정보 및 법률상담정보를 데이터베이스에서 추출하는 단계를 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
18. The method of claim 17,
The step of providing the numerical value is
A method of providing a numerical AI answer service to a legal question, comprising extracting from a database case precedent information and legal consultation information including categories and multidimensional space vector coordinates similar to the category of the query content and multidimensional space vector coordinates .
제18항에 있어서,
상기 수치값을 제공하는 단계는
추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값을 상기 수치값으로 제공하는 단계를 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
19. The method of claim 18,
The step of providing the numerical value is
A method of providing a numerical AI answer service to a legal question, comprising the step of providing an average value of positive and negative categories (numeric values) of at least one or more extracted case precedent information and legal consultation information as the numerical value.
제19항에 있어서,
상기 수치값을 제공하는 단계는
추출된 적어도 하나 이상의 사건판례정보 및 법률상담정보의 긍정 및 부정 카테고리(수치값)의 평균값 중 긍정 또는 부정의 수치값이 상대적으로 기 설정된 수치 이상으로 산출되면, 가중치를 반영한 수치값을 제공하는 단계를 더 포함하는 법률질문에 대한 수치화된 AI 답변서비스를 제공하는 방법.
20. The method of claim 19,
The step of providing the numerical value is
When the positive or negative numerical value among the average values of the positive and negative categories (numeric values) of the extracted at least one or more case precedent information and legal consultation information is relatively calculated to be greater than or equal to a preset value, providing a numerical value reflecting the weight How to provide a numerical AI answering service to legal questions that further includes.
KR1020200126150A 2020-09-28 2020-09-28 Systems and Methods to Provide AI Answering Service for Legal Questions KR20220042838A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020200126150A KR20220042838A (en) 2020-09-28 2020-09-28 Systems and Methods to Provide AI Answering Service for Legal Questions
KR1020230043428A KR20230051652A (en) 2020-09-28 2023-04-03 Systems and Methods to Provide AI Answering Service for Legal Questions

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200126150A KR20220042838A (en) 2020-09-28 2020-09-28 Systems and Methods to Provide AI Answering Service for Legal Questions

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020230043428A Division KR20230051652A (en) 2020-09-28 2023-04-03 Systems and Methods to Provide AI Answering Service for Legal Questions

Publications (1)

Publication Number Publication Date
KR20220042838A true KR20220042838A (en) 2022-04-05

Family

ID=81182383

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020200126150A KR20220042838A (en) 2020-09-28 2020-09-28 Systems and Methods to Provide AI Answering Service for Legal Questions
KR1020230043428A KR20230051652A (en) 2020-09-28 2023-04-03 Systems and Methods to Provide AI Answering Service for Legal Questions

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020230043428A KR20230051652A (en) 2020-09-28 2023-04-03 Systems and Methods to Provide AI Answering Service for Legal Questions

Country Status (1)

Country Link
KR (2) KR20220042838A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102439321B1 (en) * 2022-05-04 2022-09-05 한국데이터플랫폼 주식회사 System for Providing Semantic Analysis Finding and Analyzing Sentence Meaning
KR102583818B1 (en) * 2022-09-14 2023-10-04 주식회사 글로랑 Method for sampling process of personality test using question and answer network representing group of respondents based on bert
KR102659523B1 (en) * 2023-07-18 2024-04-19 주식회사 더엔젤브릿지 System for retrieving legal information
CN117909485A (en) * 2024-03-19 2024-04-19 武汉百智诚远科技有限公司 Legal consultation intelligent interaction method and system based on large language model

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190143583A (en) 2018-06-21 2019-12-31 주식회사 머니브레인 Method and computer readable recording medium for providing answers based on hybrid hierarchical conversation flow model with conversation management model using machine learning

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190143583A (en) 2018-06-21 2019-12-31 주식회사 머니브레인 Method and computer readable recording medium for providing answers based on hybrid hierarchical conversation flow model with conversation management model using machine learning

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102439321B1 (en) * 2022-05-04 2022-09-05 한국데이터플랫폼 주식회사 System for Providing Semantic Analysis Finding and Analyzing Sentence Meaning
KR20230156242A (en) * 2022-05-04 2023-11-14 한국데이터플랫폼 주식회사 Method for providing meaning search service through semantic analysis
KR102583818B1 (en) * 2022-09-14 2023-10-04 주식회사 글로랑 Method for sampling process of personality test using question and answer network representing group of respondents based on bert
KR20240037868A (en) * 2022-09-14 2024-03-22 주식회사 글로랑 Devices, methods and programs for sampling a group of respondents based on artificial intelligence
KR102659523B1 (en) * 2023-07-18 2024-04-19 주식회사 더엔젤브릿지 System for retrieving legal information
CN117909485A (en) * 2024-03-19 2024-04-19 武汉百智诚远科技有限公司 Legal consultation intelligent interaction method and system based on large language model
CN117909485B (en) * 2024-03-19 2024-05-24 武汉百智诚远科技有限公司 Legal consultation intelligent interaction method and system based on large language model

Also Published As

Publication number Publication date
KR20230051652A (en) 2023-04-18

Similar Documents

Publication Publication Date Title
CN108829822B (en) Media content recommendation method and device, storage medium and electronic device
WO2021159632A1 (en) Intelligent questioning and answering method and apparatus, computer device, and computer storage medium
KR20220042838A (en) Systems and Methods to Provide AI Answering Service for Legal Questions
CN111241237B (en) Intelligent question-answer data processing method and device based on operation and maintenance service
CN110929038B (en) Knowledge graph-based entity linking method, device, equipment and storage medium
CN113435203B (en) Multi-modal named entity recognition method and device and electronic equipment
CN110674271B (en) Question and answer processing method and device
CN107491436A (en) A kind of recognition methods of title party and device, server, storage medium
CN102663129A (en) Medical field deep question and answer method and medical retrieval system
CN113707299A (en) Auxiliary diagnosis method and device based on inquiry session and computer equipment
CN111651579B (en) Information query method, device, computer equipment and storage medium
CN112347339A (en) Search result processing method and device
CN109977292A (en) Searching method, calculates equipment and computer readable storage medium at device
CN115796182A (en) Multi-modal named entity recognition method based on entity-level cross-modal interaction
CN112307190A (en) Medical literature sorting method and device, electronic equipment and storage medium
CN114519613B (en) Price data processing method and device, electronic equipment and storage medium
CN113342944B (en) Corpus generalization method, apparatus, device and storage medium
CN113569118B (en) Self-media pushing method, device, computer equipment and storage medium
KR101955920B1 (en) Search method and apparatus using property language
CN116956925A (en) Electronic medical record named entity identification method and device, electronic equipment and storage medium
CN116680401A (en) Document processing method, document processing device, apparatus and storage medium
CN116719999A (en) Text similarity detection method and device, electronic equipment and storage medium
CN111460114A (en) Retrieval method, device, equipment and computer readable storage medium
CN117009456A (en) Medical query text processing method, device, equipment, medium and electronic product
CN114398482A (en) Dictionary construction method and device, electronic equipment and storage medium

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
E601 Decision to refuse application
E801 Decision on dismissal of amendment