KR102625553B1 - The Method And The Computer-Readable Recording Medium To Extract Regulatory Legal Provisions Associated With Inputted Query, And The Computing System Performing That Same - Google Patents

The Method And The Computer-Readable Recording Medium To Extract Regulatory Legal Provisions Associated With Inputted Query, And The Computing System Performing That Same Download PDF

Info

Publication number
KR102625553B1
KR102625553B1 KR1020230064699A KR20230064699A KR102625553B1 KR 102625553 B1 KR102625553 B1 KR 102625553B1 KR 1020230064699 A KR1020230064699 A KR 1020230064699A KR 20230064699 A KR20230064699 A KR 20230064699A KR 102625553 B1 KR102625553 B1 KR 102625553B1
Authority
KR
South Korea
Prior art keywords
score
regulatory
legal provisions
legal
query
Prior art date
Application number
KR1020230064699A
Other languages
Korean (ko)
Inventor
정지은
이희준
전정현
Original Assignee
주식회사 코딧
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 코딧 filed Critical 주식회사 코딧
Priority to KR1020230064699A priority Critical patent/KR102625553B1/en
Application granted granted Critical
Publication of KR102625553B1 publication Critical patent/KR102625553B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법, 컴퓨터-판독가능 기록매체 및 이를 수행하는 컴퓨팅시스템으로서, 사용자로부터 규제관련법률 혹은 규제관련검색어를 입력받으면, 입력받은 정보와 유사한 법률조항을 1 이상의 인공신경망 기반 추론모델을 사용하여 도출한 유사도스코어에 기초하여 도출하고, 도출된 유사한 법률조항 가운데 학습된 규제분류모델을 사용하여 도출한 규제스코어가 기설정된 기준 이상인 법률조항을 도출하여, 사용자가 요구하는 규제와 관련된 규제법률조항 리스트를 사용자에게 제공하는, 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법, 컴퓨터-판독가능 기록매체 및 이를 수행하는 컴퓨팅시스템에 관한 것이다.The present invention provides a method for deriving regulatory legal provisions related to an inputted query, a computer-readable recording medium, and a computing system for performing the same. When a regulatory-related law or regulation-related search word is input from a user, legal provisions similar to the inputted information are provided. is derived based on the similarity score derived using one or more artificial neural network-based inference models, and among the similar legal provisions derived, legal provisions whose regulatory score derived using the learned regulatory classification model are higher than the preset standard are derived, It relates to a method of deriving regulatory legal provisions related to an inputted query, a computer-readable recording medium, and a computing system for performing the same, which provides the user with a list of regulatory legal provisions related to the regulations requested by the user.

Description

입력된 쿼리와 관련된 규제법률조항을 도출하는 방법, 컴퓨터-판독가능 기록매체 및 이를 수행하는 컴퓨팅시스템{The Method And The Computer-Readable Recording Medium To Extract Regulatory Legal Provisions Associated With Inputted Query, And The Computing System Performing That Same}The Method And The Computer-Readable Recording Medium To Extract Regulatory Legal Provisions Associated With Inputted Query, And The Computing System Performing That Same}

본 발명은 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법, 컴퓨터-판독가능 기록매체 및 이를 수행하는 컴퓨팅시스템으로서, 사용자로부터 규제관련법률 혹은 규제관련검색어를 입력받으면, 입력받은 정보와 유사한 법률조항을 1 이상의 인공신경망 기반 추론모델을 사용하여 도출한 유사도스코어에 기초하여 도출하고, 도출된 유사한 법률조항 가운데 학습된 규제분류모델을 사용하여 도출한 규제스코어가 기설정된 기준 이상인 법률조항을 도출하여, 사용자가 요구하는 규제와 관련된 규제법률조항 리스트를 사용자에게 제공하는, 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법, 컴퓨터-판독가능 기록매체 및 이를 수행하는 컴퓨팅시스템에 관한 것이다.The present invention provides a method for deriving regulatory legal provisions related to an inputted query, a computer-readable recording medium, and a computing system for performing the same. When a regulatory-related law or regulation-related search word is input from a user, legal provisions similar to the inputted information are provided. is derived based on the similarity score derived using one or more artificial neural network-based inference models, and among the similar legal provisions derived, legal provisions whose regulatory score derived using the learned regulatory classification model are higher than the preset standard are derived, It relates to a method of deriving regulatory legal provisions related to an inputted query, a computer-readable recording medium, and a computing system for performing the same, which provides the user with a list of regulatory legal provisions related to the regulations requested by the user.

정부는 국민과 기업 등 정책수요자에게 규제의 내용을 알기 쉽게 제공함과 동시에 규제개혁의 질적 관리수단으로 활용하기 위해 1998년 행정규제기본법 시행과 함께 규제등록제도를 도입하였다. 더 구체적으로, 규제개혁위원회에서 발간한 <규제개혁백서> (1998;2015;2016.)에 따르면, 중앙행정기관의 장은 소관 규제를 신설 또는 변경하는 경우 규제 법령 등이 공포된 날부터 30일 이내에 규제의 명칭, 내용, 존속기한 등을 규제개혁위원회에 등록해야 하고, 규제개혁위원회는 등록된 규제를 규제등록카드의 형태로 인터넷 홈페이지 등을 통해 국민에게 알리고 매년 6월 말까지 국회에 제출해야 한다. 이후, 2015년 전면적으로 개편된 규제등록제도는 모든 규제를 조 단위로 등록하고, 등록된 규제를 규제정보포털과 국가 법령정보센터에 실시간으로 공개하면서 국민들에게 규제에 대한 정보를 제공하고 있다. The government introduced the regulatory registration system with the enforcement of the Framework Act on Administrative Regulations in 1998 in order to provide the contents of regulations in an easy-to-understand manner to policy users such as citizens and businesses and at the same time use it as a means of quality management of regulatory reform. More specifically, according to the <Regulatory Reform White Paper> (1998; 2015; 2016.) published by the Regulatory Reform Committee, when the head of a central administrative agency establishes or changes a relevant regulation, he or she shall do so within 30 days from the date of promulgation of the regulatory law, etc. The name, content, and duration of the regulation must be registered with the Regulatory Reform Committee, and the Regulatory Reform Committee must inform the public of the registered regulations in the form of a regulation registration card through the Internet website and submit them to the National Assembly by the end of June every year. . Since then, the regulatory registration system, which was completely revamped in 2015, registers all regulations in trillions and discloses registered regulations in real time to the regulatory information portal and the National Law Information Center, providing information on regulations to the public.

한편, 전술한 규제정보포털이나 국가 법령정보센터에서 제공되는 법률조항들은 법 분야별, 소관부처별로 나열한 분류체계로 상위법 폴더 안에 하위법을 열도록 구조화되어 있고, 법 분야의 내용 관계와 관련없이 단순 나열되어 있어, 사업체 혹은 정부에서 신산업분야에 대한 규제법령정보를 찾아보고자 할 때 관련 지식이나 정보가 충분하지 않은 경우, 기 분류된 수많은 분야 중 사용자에 필요한 특정 분야를 선택하는 것이 어려울 뿐 아니라, 특히 중소기업 및 창업기업이 융합서비스를 제공하면서 여러 분야 및 소관부처가 중복적으로 해당하는 경우 해당 플랫폼에서 흩어진 정보를 동시에 확인하는 것이 어렵다는 문제가 있다.Meanwhile, the legal provisions provided in the aforementioned regulatory information portal or national legal information center are structured to open lower-level laws within higher-level law folders in a classification system listed by legal field and relevant ministries, and are simply listed without relation to the content of the legal field. Therefore, when a business or government tries to find regulatory information on a new industrial field and does not have sufficient relevant knowledge or information, it is not only difficult to select the specific field needed for the user among the numerous fields already classified, but especially for small and medium-sized businesses. When a start-up company provides convergence services and multiple fields and relevant ministries overlap, there is a problem that it is difficult to simultaneously check scattered information on the platform.

또한, 전술한 플랫폼에서 제공하는 '주제별 생활법령'분류의 경우에도 실생활과 관련된 주제로 이루어진 카테고리를 토대로 분류체계를 세우고 있어, 중소기업 및 스타트업 기업이 산업영역을 토대로 상기 플랫폼에서 제공하는 분류체계를 이용하려는 경우, 원하는 검색결과를 얻어내기 어려운 문제점도 존재한다.In addition, in the case of the 'life laws and regulations by topic' classification provided by the above-mentioned platform, a classification system is being established based on categories consisting of topics related to real life, so small and medium-sized businesses and startup companies can use the classification system provided by the platform based on industrial area. When trying to use it, there are also problems that make it difficult to obtain the desired search results.

전술한 문제점과 관련하여 사용자가 보다 쉽게 법률조항을 검색하기 위한 종래 기술로는 대한민국 공개특허 제10-2022-0122429호 등이 있으나, 전술한 바와 같이 정부부처 혹은 사업체에서 요구하는 규제법률조항을 효과적으로 찾아줄 수 있는 내용에 대해서는 전혀 시사하는 바가 없다. 따라서, 사용자가 원하는 규제법률조항을 효과적으로 찾을 수 있는 기술이 요구되는 실정이다.In relation to the above-mentioned problem, there is a conventional technology for users to more easily search for legal provisions, such as Republic of Korea Patent Publication No. 10-2022-0122429. However, as described above, regulatory legal provisions required by government ministries or businesses can be effectively searched. There is absolutely no indication as to what can be found. Therefore, there is a need for technology that can effectively find regulatory provisions that users want.

대한민국 공개특허 제10-2022-0122429호 (2022.09.02.)Republic of Korea Patent Publication No. 10-2022-0122429 (2022.09.02.)

본 발명은 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법, 컴퓨터-판독가능 기록매체 및 이를 수행하는 컴퓨팅시스템으로서, 사용자로부터 규제관련법률 혹은 규제관련검색어를 입력받으면, 입력받은 정보와 유사한 법률조항을 1 이상의 인공신경망 기반 추론모델을 사용하여 도출한 유사도스코어에 기초하여 도출하고, 도출된 유사한 법률조항 가운데 학습된 규제분류모델을 사용하여 도출한 규제스코어가 기설정된 기준 이상인 법률조항을 도출하여, 사용자가 요구하는 규제와 관련된 규제법률조항 리스트를 사용자에게 제공하는, 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법, 컴퓨터-판독가능 기록매체 및 이를 수행하는 컴퓨팅시스템을 제공하는 것을 목적으로 한다.The present invention provides a method for deriving regulatory legal provisions related to an inputted query, a computer-readable recording medium, and a computing system for performing the same. When a regulatory-related law or regulation-related search word is input from a user, legal provisions similar to the inputted information are provided. is derived based on the similarity score derived using one or more artificial neural network-based inference models, and among the similar legal provisions derived, legal provisions whose regulatory score derived using the learned regulatory classification model are higher than the preset standard are derived, The purpose is to provide a method for providing users with a list of regulatory legal provisions related to regulations requested by the user, a method for deriving regulatory legal provisions related to an input query, a computer-readable recording medium, and a computing system for performing the same.

상기와 같은 과제를 해결하기 위하여, 본 발명의 일 실시예는, 1 이상의 프로세서 및 1 이상의 메모리를 포함하는 컴퓨팅시스템에서 수행되는, 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법으로서, 복수의 법률조항 중 규제카드정보가 있는 법률조항의 규제카드정보로 학습된 규제분류모델을 이용하여 데이터베이스에 저장된 복수의 법률조항 각각이 규제와 얼마나 관련되어 있는지를 나타내는 규제스코어를 도출하는 규제스코어도출단계; 1 이상의 인공신경망 기반 추론모델을 사용하여 사용자로부터 입력받은 쿼리와 상기 복수의 법률조항 각각과의 유사도에 따른 유사도스코어를 도출하는 유사도스코어도출단계; 및 상기 규제스코어 및 상기 유사도스코어에 기초하여 상기 쿼리와 관련된 규제법률조항을 기설정된 기준에 따라 분류 및 정렬하여 상기 사용자에게 제공하는 관련규제법률제공단계;를 포함하는, 규제법률조항을 도출하는 방법을 제공한다. In order to solve the above problems, an embodiment of the present invention is a method of deriving regulatory legal provisions related to an input query, which is performed on a computing system including one or more processors and one or more memories, and includes a plurality of laws. A regulatory score derivation step of deriving a regulatory score indicating how related each of a plurality of legal provisions stored in the database is to the regulation using a regulatory classification model learned with the regulatory card information of the legal provisions with regulatory card information among the provisions; A similarity score derivation step of deriving a similarity score according to the similarity between a query input from a user and each of the plurality of legal provisions using one or more artificial neural network-based inference models; and a related regulatory law providing step of classifying and sorting regulatory legal provisions related to the query according to preset standards based on the regulatory score and the similarity score and providing the relevant regulatory legal provisions to the user. provides.

본 발명의 일 실시예에서는, 상기 유사도스코어도출단계는, 인공신경망 기반의 제1추론모델에 사용자로부터 입력받은 쿼리와 상기 데이터베이스에 저장된 복수의 법률조항 각각을 입력하여 키워드매칭스코어를 도출하는 키워드매칭스코어도출단계; 및 상기 데이터베이스에 저장된 법률조항 각각과 사용자로부터 입력받은 쿼리 사이의 코사인유사도스코어를 도출하는 코사인유사도스코어도출단계;를 포함할 수 있다.In one embodiment of the present invention, the similarity score derivation step involves inputting a query input from a user and a plurality of legal provisions stored in the database into a first inference model based on an artificial neural network to derive a keyword matching score. Score derivation step; and a cosine similarity score derivation step of deriving a cosine similarity score between each legal provision stored in the database and a query input from the user.

본 발명의 일 실시예에서는, 상기 키워드매칭스코어도출단계는, 상기 사용자로부터 입력받은 쿼리로부터 키워드를 추출하는 단계; 추출된 복수의 키워드 각각을 1 이상의 차원을 가지는 벡터로 변환한 뒤, 변환된 복수의 벡터를 하나의 키워드벡터로 도출하는 단계; 및 인공신경망 기반의 제1추론모델에 법률조항과 키워드벡터를 입력함으로써, 입력된 법률조항과 키워드벡터와의 유사도를 나타내는 키워드매칭스코어를 도출하는 단계;를 포함할 수 있다.In one embodiment of the present invention, the keyword matching score deriving step includes extracting keywords from a query input from the user; Converting each of the extracted plurality of keywords into a vector having a dimension of 1 or more, and then deriving the converted plurality of vectors into one keyword vector; and entering a legal provision and a keyword vector into a first inference model based on an artificial neural network, thereby deriving a keyword matching score indicating the similarity between the input legal provision and the keyword vector.

본 발명의 일 실시예에서는, 상기 코사인유사도스코어도출단계는, 상기 사용자로부터 입력받은 쿼리에 대해 인공신경망 기반의 워드임베딩모델을 통해 쿼리벡터를 도출하는 단계; 및 상기 데이터베이스에 저장된 모든 법률조항 각각과 상기 쿼리벡터 사이에 대해 도출된 코사인유사도에 기초하는 코사인유사도스코어를 도출하는 단계;를 포함할 수 있다.In one embodiment of the present invention, the cosine similarity score deriving step includes deriving a query vector for a query input from the user through an artificial neural network-based word embedding model; and deriving a cosine similarity score based on the cosine similarity derived between each of all legal provisions stored in the database and the query vector.

본 발명의 일 실시예에서는, 상기 유사도스코어도출단계는, 상기 키워드매칭스코어와 상기 코사인유사도스코어에 기초하여 도출한 법률조항과 입력받은 쿼리를 인공신경망 기반의 제2추론모델에 입력하여 상기 도출한 법률조항과 상기 입력받은 쿼리 사이의 연관성을 나타내는 연관성스코어를 도출하는 연관성스코어도출단계를 더 포함하고, 상기 키워드매칭스코어, 상기 코사인유사도스코어, 및 상기 연관성스코어에 기초하여 상기 복수의 법률조항 각각에 대한 유사도스코어를 도출할 수 있다.In one embodiment of the present invention, the similarity score derivation step is performed by inputting the legal provisions and the input query derived based on the keyword matching score and the cosine similarity score into a second inference model based on an artificial neural network to obtain the derived query. It further includes a relevance score derivation step of deriving a relevance score indicating the correlation between a legal provision and the input query, and each of the plurality of legal provisions based on the keyword matching score, the cosine similarity score, and the relevance score. A similarity score can be derived.

본 발명의 일 실시예에서는, 상기 관련규제법률제공단계는, 상기 유사도스코어에 기초하여 상기 쿼리와 관련된 규제법률조항을 분류하되, 기설정된 규제스코어 이상의 법률조항을 규제법률조항으로 결정한 뒤, 결정된 규제법률조항을 기설정된 조건에 따른 순서로 나열된 리스트 형태로 사용자에게 제공할 수 있다.In one embodiment of the present invention, the relevant regulatory law provision step classifies regulatory legal provisions related to the query based on the similarity score, determines legal provisions higher than the preset regulatory score as regulatory legal provisions, and then determines the regulatory legal provisions. Legal provisions can be provided to users in the form of a list arranged in order according to preset conditions.

본 발명의 일 실시예에서는, 상기 관련규제법률제공단계는, 상기 유사도스코어에 기초하여 상기 쿼리와 관련된 규제법률조항을 분류하되, 기설정된 개수의 상위 유사도스코어를 가지는 법률조항의 규제스코어에 기초하여 산출된 기준규제스코어 이상의 법률조항을 규제법률조항으로 결정한 뒤, 결정된 규제법률조항을 기설정된 조건에 따른 순서로 나열된 리스트 형태로 사용자에게 제공할 수 있다.In one embodiment of the present invention, the step of providing relevant regulatory laws classifies regulatory legal provisions related to the query based on the similarity score, and classifies regulatory legal provisions related to the query based on the regulatory scores of legal provisions having a preset number of higher similarity scores. After determining the legal provisions above the calculated standard regulatory score as regulatory legal provisions, the determined regulatory legal provisions can be provided to the user in the form of a list arranged in order according to preset conditions.

상기와 같은 과제를 해결하기 위하여, 본 발명의 일 실시예는, 1 이상의 프로세서 및 1 이상의 메모리를 포함하고, 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법을 수행하는 컴퓨팅시스템으로서, 복수의 법률조항 중 규제카드정보가 있는 법률조항의 규제카드정보로 학습된 규제분류모델을 이용하여 데이터베이스에 저장된 복수의 법률조항 각각이 규제와 얼마나 관련되어 있는지를 나타내는 규제스코어를 도출하는 규제스코어도출부; 1 이상의 인공신경망 기반 추론모델을 사용하여 사용자로부터 입력받은 쿼리와 상기 복수의 법률조항 각각과의 유사도에 따른 유사도스코어를 도출하는 유사도스코어도출부; 및 상기 규제스코어 및 상기 유사도스코어에 기초하여 상기 쿼리와 관련된 규제법률조항을 기설정된 기준에 따라 분류 및 정렬하여 상기 사용자에게 제공하는 관련규제법률제공부;를 포함하는, 컴퓨팅시스템을 제공한다.In order to solve the above problems, an embodiment of the present invention is a computing system that includes one or more processors and one or more memories and performs a method of deriving regulatory legal provisions related to an input query, and includes a plurality of laws. A regulatory score derivation unit that derives a regulatory score indicating how related each of a plurality of legal provisions stored in the database is to the regulation using a regulatory classification model learned with the regulatory card information of the legal provisions with regulatory card information among the provisions; a similarity score deriving unit that uses one or more artificial neural network-based inference models to derive a similarity score according to the similarity between a query input from a user and each of the plurality of legal provisions; and a related regulation law provision unit that classifies and sorts regulatory law provisions related to the query according to preset standards based on the regulation score and the similarity score and provides the information to the user.

상기와 같은 과제를 해결하기 위하여, 본 발명의 일 실시예는, 1 이상의 프로세서 및 1 이상의 메모리를 포함하는 컴퓨팅시스템에서 수행되는, 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법을 구현하기 위한 컴퓨터-판독가능 기록매체로서, 상기 컴퓨터-판독가능 기록매체는, 상기 컴퓨팅시스템으로 하여금 이하의 단계들을 수행하도록 하는 명령들을 저장하며, 상기 이하의 단계들은: 복수의 법률조항 중 규제카드정보가 있는 법률조항의 규제카드정보로 학습된 규제분류모델을 이용하여 데이터베이스에 저장된 복수의 법률조항 각각이 규제와 얼마나 관련되어 있는지를 나타내는 규제스코어를 도출하는 규제스코어도출단계; 1 이상의 인공신경망 기반 추론모델을 사용하여 사용자로부터 입력받은 쿼리와 상기 복수의 법률조항 각각과의 유사도에 따른 유사도스코어를 도출하는 유사도스코어도출단계; 및 상기 규제스코어 및 상기 유사도스코어에 기초하여 상기 쿼리와 관련된 규제법률조항을 기설정된 기준에 따라 분류 및 정렬하여 상기 사용자에게 제공하는 관련규제법률제공단계;를 포함하는, 컴퓨터-판독가능 기록매체를 제공한다.In order to solve the above problems, an embodiment of the present invention is a computer for implementing a method of deriving regulatory provisions related to an input query, which is performed on a computing system including one or more processors and one or more memories. - A readable recording medium, wherein the computer-readable recording medium stores instructions for causing the computing system to perform the following steps, the following steps being: a law containing regulatory card information among a plurality of legal provisions; A regulatory score derivation step of deriving a regulatory score indicating how related each of a plurality of legal provisions stored in the database is to the regulation using a regulatory classification model learned with the regulation card information of the provision; A similarity score derivation step of deriving a similarity score according to the similarity between a query input from a user and each of the plurality of legal provisions using one or more artificial neural network-based inference models; and a related regulatory law providing step of classifying and sorting regulatory legal provisions related to the query according to preset standards based on the regulatory score and the similarity score and providing the relevant regulatory law provisions to the user. to provide.

본 발명의 일 실시예에 따르면, 정부에서 지정한 규제법률조항에 대한 정보를 그대로 제공하지 않고, 학습된 규제분류모델을 통해 도출된 규제스코어에 기초하여 규제법률조항을 도출함으로써 규제로 분류되지 않은 법률조항 중 규제로 인식되는 그림자규제조항을 쉽게 찾을 수 있는 효과를 발휘할 수 있다.According to one embodiment of the present invention, laws that are not classified as regulations are derived by deriving regulatory legal provisions based on regulatory scores derived through a learned regulatory classification model without providing information on regulatory legal provisions designated by the government as is. This can have the effect of making it easier to find shadow regulation provisions that are recognized as regulations.

본 발명의 일 실시예에 따르면, 기업 등에서 신사업 검토 또는 창업을 준비할 때 진행하려는 사업과 관련된 규제법률조항을 손쉽게 찾을 수 있는 효과를 발휘할 수 있다.According to one embodiment of the present invention, when a company, etc., is reviewing a new business or preparing to start a business, it is possible to easily find regulatory provisions related to the business to be conducted.

본 발명의 일 실시예에 따르면, 규제를 검토하는 정부 부처, 입법 기관, 및 국책 연구소 등에서 특정 분야에 관련된 법률조항을 쉽게 찾을 수 있어, 입법 혹은 개정이 필요한 법률조항들을 용이하게 모니터링할 수 있는 효과를 발휘할 수 있다.According to one embodiment of the present invention, government ministries, legislative bodies, and national research institutes reviewing regulations can easily find legal provisions related to a specific field, which has the effect of easily monitoring legal provisions that require legislation or revision. can be demonstrated.

본 발명의 일 실시예에 따르면, 사용자가 다양한 형식의 검색어를 입력할 수 있어 법률 용어 등 법적 지식이 충분하지 않더라도 자신이 찾고자 하는 분야의 규제법률조항을 손쉽게 검색할 수 있는 효과를 발휘할 수 있다.According to one embodiment of the present invention, users can enter search terms in various formats, allowing users to easily search for regulatory provisions in the field they are looking for even if they do not have sufficient legal knowledge such as legal terms.

본 발명의 일 실시예에 따르면, 법률의 분야나 소관부처별로 분류된 리스트가 아니라 실제 법 조문 내용에 기반한 주제별로 분류된 규제법률리스트를 제공함으로써 사용자가 입력한 검색어 혹은 검색문과 실질적으로 관련된 법률조항을 제공할 수 있는 효과를 발휘할 수 있다.According to one embodiment of the present invention, by providing a list of regulatory laws classified by topic based on the contents of actual legal provisions, rather than a list classified by field of law or relevant ministry, legal provisions substantially related to the search word or search statement entered by the user It can be effective in providing .

도 1은 본 발명의 일 실시예에 따른 규제법률조항을 도출하는 방법의 수행단계 및 이를 수행하는 컴퓨팅시스템의 구성을 개략적으로 도시한다.
도 2는 본 발명의 일 실시예에 따른 컴퓨팅시스템에서 관련규제법률 리스트를 도출하는 과정을 개략적으로 도시한다.
도 3은 본 발명의 일 실시예에 따른 규제분류모델이 학습되는 과정을 개략적으로 도시한다.
도 4는 본 발명의 일 실시예에 따른 학습된 규제분류모델을 통해 각각의 법률조항에 대해 규제스코어를 도출하는 과정을 개략적으로 도시한다.
도 5는 본 발명의 일 실시예에 따른 유사도스코어도출단계의 수행단계를 개략적으로 도시한다.
도 6 내지 도 7은 본 발명의 몇 실시예에 따른 키워드매칭스코어도출단계의 수행과정을 개략적으로 도시한다.
도 8은 본 발명의 일 실시예에 따른 코사인유사도스코어도출단계의 수행과정을 개략적으로 도시한다.
도 9는 본 발명의 일 실시예에 따른 후보법률조항을 도출하는 과정을 개략적으로 도시한다.
도 10은 본 발명의 일 실시예에 따른 유사도스코어를 도출하는 과정을 개략적으로 도시한다.
도 11은 본 발명의 일 실시예에 따른 규제법률조항을 결정하는 과정을 개략적으로 도시한다.
도 12는 본 발명의 일 실시예에 따른 사용자에게 제공되는 규제법률리스트를 개략적으로 도시한다.
도 13은 본 발명의 일 실시예에 따른 컴퓨팅장치의 내부 구성을 예시적으로 도시한다.
Figure 1 schematically shows the execution steps of a method for deriving regulatory legal provisions according to an embodiment of the present invention and the configuration of a computing system that performs the same.
Figure 2 schematically shows the process of deriving a list of related regulatory laws in a computing system according to an embodiment of the present invention.
Figure 3 schematically shows the process of learning a regulatory classification model according to an embodiment of the present invention.
Figure 4 schematically shows the process of deriving a regulatory score for each legal provision through a learned regulatory classification model according to an embodiment of the present invention.
Figure 5 schematically shows the execution steps of the similarity score derivation step according to an embodiment of the present invention.
Figures 6 and 7 schematically show the execution process of the keyword matching score derivation step according to several embodiments of the present invention.
Figure 8 schematically shows the process of performing the cosine similarity score derivation step according to an embodiment of the present invention.
Figure 9 schematically shows the process of deriving candidate legal provisions according to an embodiment of the present invention.
Figure 10 schematically shows the process of deriving a similarity score according to an embodiment of the present invention.
Figure 11 schematically shows the process of determining regulatory legal provisions according to an embodiment of the present invention.
Figure 12 schematically shows a list of regulatory laws provided to users according to an embodiment of the present invention.
Figure 13 exemplarily shows the internal configuration of a computing device according to an embodiment of the present invention.

이하에서는, 다양한 실시예들 및/또는 양상들이 이제 도면들을 참조하여 개시된다. 하기 설명에서는 설명을 목적으로, 하나 이상의 양상들의 전반적 이해를 돕기 위해 다수의 구체적인 세부사항들이 개시된다. 그러나, 이러한 양상(들)은 이러한 구체적인 세부사항들 없이도 실행될 수 있다는 점 또한 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 인식될 수 있을 것이다. 이후의 기재 및 첨부된 도면들은 하나 이상의 양상들의 특정한 예시적인 양상들을 상세하게 기술한다. 하지만, 이러한 양상들은 예시적인 것이고 다양한 양상들의 원리들에서의 다양한 방법들 중 일부가 이용될 수 있으며, 기술되는 설명들은 그러한 양상들 및 그들의 균등물들을 모두 포함하고자 하는 의도이다.BRIEF DESCRIPTION OF THE DRAWINGS Various embodiments and/or aspects are now disclosed with reference to the drawings. In the following description, for purposes of explanation, numerous specific details are set forth to facilitate a general understanding of one or more aspects. However, it will also be appreciated by those skilled in the art that this aspect(s) may be practiced without these specific details. The following description and accompanying drawings set forth in detail certain example aspects of one or more aspects. However, these aspects are illustrative and some of the various methods in the principles of the various aspects may be utilized, and the written description is intended to encompass all such aspects and their equivalents.

또한, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.Additionally, terms including ordinal numbers, such as first, second, etc., may be used to describe various components, but the components are not limited by the terms. The above terms are used only for the purpose of distinguishing one component from another. For example, a first component may be named a second component, and similarly, the second component may also be named a first component without departing from the scope of the present invention. The term and/or includes any of a plurality of related stated items or a combination of a plurality of related stated items.

또한, 본 발명의 실시예들에서, 별도로 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 발명의 실시예에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.In addition, in the embodiments of the present invention, unless otherwise defined, all terms used herein, including technical or scientific terms, are generally understood by those skilled in the art to which the present invention pertains. It has the same meaning as Terms defined in commonly used dictionaries should be interpreted as having a meaning consistent with the meaning in the context of the related technology, and unless clearly defined in the embodiments of the present invention, have an ideal or excessively formal meaning. It is not interpreted as

한편, 이하에서 언급되는 "법률조항"은 법률, 시행령, 시행규칙, 및 행정규칙을 모두 포함하는 개념이며, 본 발명의 일 실시예에 따르면, 판례, 행정지도, 감독행정 및 구두지시 등을 더 포함할 수 있다.Meanwhile, the "legal provisions" mentioned below are a concept that includes all laws, enforcement decrees, enforcement regulations, and administrative rules, and according to one embodiment of the present invention, precedents, administrative guidance, supervisory administration, and oral instructions are further included. It can be included.

도 1은 본 발명의 일 실시예에 따른 규제법률조항을 도출하는 방법의 수행단계 및 이를 수행하는 컴퓨팅시스템(1000)의 구성을 개략적으로 도시하고, 도 2는 본 발명의 일 실시예에 따른 컴퓨팅시스템(1000)에서 관련규제법률 리스트를 도출하는 과정을 개략적으로 도시한다.Figure 1 schematically shows the performance steps of a method for deriving regulatory legal provisions according to an embodiment of the present invention and the configuration of a computing system 1000 that performs this, and Figure 2 shows a computing system 1000 according to an embodiment of the present invention. The process of deriving a list of related regulatory laws from the system 1000 is schematically shown.

도 1에 도시된 바와 같이, 1 이상의 프로세서 및 1 이상의 메모리를 포함하는 컴퓨팅시스템(1000)에서 수행되는, 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법으로서, 복수의 법률조항 중 규제카드정보가 있는 법률조항의 규제카드정보로 학습된 규제분류모델(2100)을 이용하여 데이터베이스(2000)에 저장된 복수의 법률조항 각각이 규제와 얼마나 관련되어 있는지를 나타내는 규제스코어를 도출하는 규제스코어도출단계(S100); 1 이상의 인공신경망 기반 추론모델을 사용하여 사용자로부터 입력받은 쿼리와 상기 복수의 법률조항 각각과의 유사도에 따른 유사도스코어를 도출하는 유사도스코어도출단계(S200); 및 상기 규제스코어 및 상기 유사도스코어에 기초하여 상기 쿼리와 관련된 규제법률조항을 기설정된 기준에 따라 분류 및 정렬하여 상기 사용자에게 제공하는 관련규제법률제공단계(S300);를 포함한다.As shown in FIG. 1, a method of deriving regulatory legal provisions related to an input query, performed in a computing system 1000 including one or more processors and one or more memories, includes regulatory card information among a plurality of legal provisions. A regulatory score derivation step (S100) that uses the regulatory classification model 2100 learned with the regulation card information of the existing legal provisions to derive a regulatory score indicating how related each of the plurality of legal provisions stored in the database 2000 is to the regulation. ); A similarity score derivation step (S200) of deriving a similarity score according to the similarity between a query input from a user and each of the plurality of legal provisions using one or more artificial neural network-based inference models; and a related regulatory law provision step (S300) in which regulatory legal provisions related to the query are classified and sorted according to preset standards based on the regulatory score and the similarity score and provided to the user.

개략적으로, 도 1의 (a)는 규제법률조항을 도출하는 방법의 수행단계를 도시하고, 도 1의 (b)는 상기 규제법률조항을 도출하는 방법을 수행하는 컴퓨팅시스템(1000)의 구성을 도시한다.Schematically, Figure 1 (a) shows the execution steps of the method for deriving regulatory legal provisions, and Figure 1 (b) shows the configuration of the computing system 1000 that performs the method for deriving the regulatory legal provisions. It shows.

구체적으로, 상기 컴퓨팅시스템(1000)의 규제스코어도출부(1100)는 데이터베이스(2000)에 저장된 모든 법률조항 각각에 대하여 규제스코어를 도출하는 규제스코어도출단계(S100)를 수행한다. 상기 데이터베이스(2000)에는 복수의 법률조항과 각각의 법률조항에 해당하는 정보가 저장된다. 상기 법률조항에 해당하는 정보로는, 법률 제목, 법률조항 원문, 해당법률의 상위법 정보, 소관부서, 공표일, 시행일 및 규제정보 등을 포함한다. 상기 규제정보는 규제개혁위원회에서 공개하는 규제등록카드에 포함되는 정보에 해당하는 것이 바람직하다.Specifically, the regulatory score derivation unit 1100 of the computing system 1000 performs a regulatory score derivation step (S100) of deriving a regulatory score for each of all legal provisions stored in the database 2000. The database 2000 stores a plurality of legal provisions and information corresponding to each legal provision. Information corresponding to the above legal provisions includes the title of the law, the original text of the legal provisions, information on the upper law of the relevant law, relevant department, date of promulgation, date of enforcement, and regulatory information. It is desirable that the above regulatory information corresponds to the information included in the regulatory registration card released by the Regulatory Reform Committee.

상기 규제스코어도출부(1100)는 규제정보가 존재하는 법률조항을 학습한 규제분류모델(2100)을 이용하여 상기 데이터베이스(2000)에 저장된 모든 법률조항 각각에 대해 규제스코어를 도출한다. 본 발명의 일 실시예에 따르면, 상기 규제분류모델(2100)은 상기 데이터베이스(2000)에 저장된다. 상기 규제스코어도출단계(S100)에 대한 추가적인 설명은 도 3 내지 도 4에서 후술하도록 하며, 상기 컴퓨팅장치는 상기 규제스코어도출단계(S100) 이후 사용자로부터 입력된 쿼리(query)정보(이하, 쿼리)에 기초하여 유사도스코어도출단계(S200) 및 관련규제법률제공단계(S300)를 수행함으로써 사용자에게 입력된 쿼리정보와 관련된 규제법률조항을 도출한다.The regulatory score derivation unit 1100 derives a regulatory score for each of all legal provisions stored in the database 2000 using a regulatory classification model 2100 that has learned legal provisions containing regulatory information. According to one embodiment of the present invention, the regulatory classification model 2100 is stored in the database 2000. Additional explanation of the regulatory score derivation step (S100) will be described later with reference to FIGS. 3 and 4, and the computing device provides query information (hereinafter referred to as query) input from the user after the regulatory score derivation step (S100). Based on this, the similarity score derivation step (S200) and the related regulatory law provision step (S300) are performed to derive regulatory law provisions related to the query information entered by the user.

도 2에 도시된 바와 같이, 사용자는 자신의 단말기 등을 통해 검색어 혹은 검색문을 입력할 수 있고, 상기 단말기는 입력받은 검색어 혹은 검색문에 기초하여 쿼리를 생성하고, 생성한 쿼리를 컴퓨팅시스템(1000)으로 송신한다. 혹은 본 발명의 다른 실시예로서, 상기 단말기는 입력받은 검색어 혹은 검색문을 상기 컴퓨팅시스템(1000)에 송신하고, 상기 컴퓨팅시스템(1000)에서 수신한 검색어 혹은 검색문을 쿼리정보로 생성할 수 있다. 이를 수신한 컴퓨팅시스템(1000)은 상기 쿼리에 포함된 데이터와 관련된 규제법률조항을 도출하여 규제법률 리스트를 생성하고, 생성된 리스트를 사용자에게 제공할 수 있다.As shown in FIG. 2, the user can input a search word or search statement through his or her terminal, and the terminal generates a query based on the input search word or search statement, and sends the generated query to the computing system ( 1000). Or, as another embodiment of the present invention, the terminal may transmit the input search word or search sentence to the computing system 1000, and generate the search word or search sentence received from the computing system 1000 as query information. . The computing system 1000 that has received this may derive regulatory law provisions related to the data included in the query, generate a list of regulatory laws, and provide the generated list to the user.

사용자는 상기 검색어 혹은 검색문으로서, 자신이 원하는 분야의 법률조항을 입력하는 것이 바람직하다. 예를 들어, 사용자가 임상시험에 관한 규제법률을 알고 싶은 경우, 사용자는 검색어로서 '의약품 임상시험 계획 승인 절차 및 기준'을 입력하거나, 혹은 '의약품 등의 안전에 관한 규칙 제24조'를 입력하거나, 혹은 검색문으로서 상기 의약품 등의 안전에 관한 규칙 제24조의 조항 전문을 입력할 수 있다. It is desirable for the user to enter legal provisions in the field he or she desires as the search word or search statement. For example, if the user wants to know the regulatory laws regarding clinical trials, the user enters ‘Drug clinical trial plan approval procedures and standards’ as a search term, or ‘Article 24 of the Rules on the Safety of Pharmaceuticals, etc.’ Alternatively, you can enter the full text of Article 24 of the Rules on the Safety of Medicines, etc. as a search query.

한편, 본 발명의 다른 실시예에 따르면, 사용자는 검색문으로서 '바이오 헬스케어 분야에서 임상시험과 관련된 규제법률을 알려줘,'라는 문장을 입력할 수 있으며, 본 발명의 또 다른 실시예에 따르면, 사용자는 '바이오 헬스케어, 임상시험, 규제'와 같이 핵심 키워드만을 검색어로 입력할 수 있다.Meanwhile, according to another embodiment of the present invention, the user can input the sentence 'Please tell me the regulatory laws related to clinical trials in the bio healthcare field' as a search sentence, and according to another embodiment of the present invention, Users can enter only key keywords as search terms, such as 'bio healthcare, clinical trials, and regulations'.

이와 같은 검색어 혹은 검색문과 관련된 데이터를 포함하는 쿼리를 수신한 유사도스코어도출부(1200)는, 1 이상의 인공신경망 기반 추론모델을 사용하여 사용자로부터 입력받은 쿼리와 상기 복수의 법률조항 각각과의 유사도에 따른 유사도스코어를 도출하는 유사도스코어도출단계(S200)를 수행한다. 개략적으로 상기 유사도스코어도출단계(S200)는 키워드매칭스코어도출단계(S210) 및 코사인유사도스코어도출단계(S220)를 포함하고, 상기 유사도스코어도출부(1200)는 이를 통해 도출된 키워드매칭스코어 및 코사인유사도스코어에 기초하여 입력된 쿼리와 법률조항 사이의 유사도스코어를 도출한다. 상기 유사도스코어도출단계(S200)에 대한 보다 구체적인 설명은 도 5 내지 도 10에 대한 설명에서 후술하도록 한다.The similarity score deriving unit 1200, which has received a query containing data related to such a search term or search statement, uses one or more artificial neural network-based inference models to determine the similarity between the query input from the user and each of the plurality of legal provisions. A similarity score derivation step (S200) is performed to derive a similarity score according to the present invention. Briefly, the similarity score derivation step (S200) includes a keyword matching score derivation step (S210) and a cosine similarity score derivation step (S220), and the similarity score derivation unit 1200 calculates the keyword matching score and cosine derived through this. Based on the similarity score, the similarity score between the input query and the legal provisions is derived. A more detailed description of the similarity score derivation step (S200) will be described later in the description of FIGS. 5 to 10.

데이터베이스(2000)에 저장된 법률조항 각각에 대해 규제스코어가 도출되고, 입력된 쿼리와 상기 법률조항 각각과의 유사도스코어가 도출되면, 관련규제법률제공부(1300)는 상기 유사도스코어 및 규제스코어에 기초하여 입력된 쿼리와 관련된 규제법률조항을 도출하는 관련규제법률제공단계(S300)를 수행한다.When a regulatory score is derived for each legal provision stored in the database (2000) and a similarity score between the input query and each of the legal provisions is derived, the related regulation law provision unit 1300 determines the score based on the similarity score and the regulatory score. A related regulatory law provision step (S300) is performed to derive regulatory legal provisions related to the entered query.

더 구체적으로, 관련규제법률은 사용자가 입력한 쿼리와 관련된 규제법률조항을 의미하고, 상기 관련규제법률은 정부기관 등에서 지정한 규제법률을 포함하고, 추가적으로 규제법률로 지정되지 않은 법률조항일지라도 사실상 규제의 역할을 하는, 이른바 '그림자규제'에 해당하는 법률조항을 더 포함할 수 있는 것을 특징으로 한다.More specifically, relevant regulatory laws refer to regulatory legal provisions related to the query entered by the user, and the relevant regulatory laws include regulatory laws designated by government agencies, etc. In addition, even if they are legal provisions that are not designated as regulatory laws, they are in fact regulatory provisions. It is characterized by the ability to further include legal provisions corresponding to so-called 'shadow regulations' that play a role.

다시 말해, 본 발명은 전술한 규제스코어도출단계(S100) 및 유사도스코어도출단계(S200)를 통해 도출된 규제스코어와 유사도스코어에 기초하여 사용자가 원하는 분야의 현행법에서 정부에서 지정한 규제법률과 그림자규제에 해당하는 법률조항을 도출할 수 있고, 이를 통해 사용자는 자신이 법적 지식이 충분하지 않더라도 자신이 진행하거나 검토하려는 분야와 관련된 규제법률조항을 손쉽게 찾을 수 있는 효과를 발휘할 수 있다.In other words, the present invention applies regulatory laws and shadow regulations designated by the government in the current law in the field desired by the user based on the regulatory score and similarity score derived through the above-described regulatory score derivation step (S100) and similarity score derivation step (S200). The corresponding legal provisions can be derived, and through this, users can easily find regulatory legal provisions related to the field they wish to proceed or review even if they do not have sufficient legal knowledge.

또한, 상기 관련규제법률제공단계(S300)는, 도출된 관련규제법률에 대해 실제 법 조문 내용에 기반한 주제별로 분류된 규제법률리스트를 제공함으로써 사용자가 입력한 검색어 혹은 검색문과 실질적으로 관련된 법률조항을 제공하는 효과를 발휘할 수 있어, 종래 기술 혹은 종래의 관련 플랫폼 등에서 법률조항을 단순히 소관부처별로 나열한 분류체계로 상위법 폴더 안에 하위법을 열도록 구조화되는 방식으로 제공하거나, 또는 실생활과 관련된 주제로 이루어진 카테고리를 토대로 분류체계를 세워 제공하는 방식에 비하여 실무진들이 좀 더 실질적이고 필요한 법률조항들을 효과적으로 제공할 수 있다.In addition, the relevant regulatory law provision step (S300) provides a list of regulatory laws classified by topic based on the actual legal provisions for the derived related regulatory laws, thereby providing legal provisions substantially related to the search word or search statement entered by the user. It can be effective in providing legal provisions in a way that is structured so that lower-level laws are opened within a higher-level law folder in a classification system that simply lists legal provisions by relevant ministries in conventional technology or related platforms, or in a category composed of topics related to real life. Compared to the method of providing a classification system based on , working-level staff can effectively provide more practical and necessary legal provisions.

이하에서는, 전술한 규제스코어도출단계(S100), 유사도스코어도출단계(S200), 및 관련규제법률제공단계(S300)에 대하여 관련 도면과 함께 더 구체적으로 설명하도록 한다.Below, the above-described regulatory score derivation step (S100), similarity score derivation step (S200), and related regulatory law provision step (S300) will be described in more detail along with related drawings.

도 3은 본 발명의 일 실시예에 따른 규제분류모델(2100)이 학습되는 과정을 개략적으로 도시한다.Figure 3 schematically shows the process of learning the regulatory classification model 2100 according to an embodiment of the present invention.

구체적으로, 데이터베이스(2000)에는 복수의 법률조항과 상기 복수의 법률조항 각각에 대한 법률정보가 같이 저장된다. 상기 법률정보는, 도 1에 대한 설명에서 전술한 바와 같이, 법률 제목, 법률조항 원문, 해당법률의 상위법 정보, 소관부서, 공표일, 시행일 및 규제정보가 포함되며, 본 명세서의 [발명의 배경이 되는 기술]에 기재된 바와 같이, 상기 규제정보는 규제등록카드의 형태로 저장될 수 있다. 상기 규제등록카드에는 규제사무명, 규제요지, 공포일, 시행일, 일몰정보, 법령명, 주요검색어, 연관법령, 및 소관부처명 등의 정보가 포함되고, 정부에서 지정된 규제법령이 아닌 법률조항의 경우, 해당 법률조항의 규제정보는 없다.Specifically, the database 2000 stores a plurality of legal provisions and legal information for each of the plurality of legal provisions. The legal information, as described above in the description of Figure 1, includes the title of the law, the original text of the law, information on the higher law of the law, relevant department, date of promulgation, date of enforcement, and regulatory information, and in the [Background of the invention] in this specification As described in [Technology that becomes this], the regulatory information may be stored in the form of a regulatory registration card. The regulatory registration card includes information such as regulatory office name, regulatory summary, promulgation date, enforcement date, sunset information, name of law, main search words, related laws, and name of relevant ministry. In the case of legal provisions other than regulatory laws designated by the government, There is no regulatory information in legal provisions.

도 3에 도시된 바와 같이, 규제분류모델(2100)은 데이터베이스(2000)에 저장된 모든 법률조항 가운데 상기 규제정보(도 3에서는 규제카드정보)가 존재하는 법률조항에 대해 학습하는 과정을 수행한다. 추가적으로, 상기 규제법률모델은 전술한 규제정보뿐만 아니라, 규제정보가 존재하는 법률조항의 원문 내용 전체도 같이 학습한다. 이를 통해 상기 규제분류모델(2100)은 입력되는 법률조항의 원문 내용을 분석하여 입력된 법률조항이 규제와 얼마나 관련되어 있는지를 나타내는 규제스코어를 도출한다.As shown in FIG. 3, the regulatory classification model 2100 performs a process of learning about legal provisions for which the regulatory information (regulation card information in FIG. 3) exists among all legal provisions stored in the database 2000. Additionally, the regulatory legal model learns not only the aforementioned regulatory information, but also the entire original text of the legal provisions in which the regulatory information exists. Through this, the regulatory classification model 2100 analyzes the original text of the input legal provision and derives a regulatory score indicating how related the input legal provision is to the regulation.

즉, 처음부터 규제법률조항으로 분류되지 않은 법률조항일지라도, 학습한 규제법률조항에서 도출해낸 규칙이 일정 수준 이상 나타나는 법률조항의 경우 특정 수치 이상의 규제스코어가 본 발명의 규제스코어도출단계(S100)를 통해 도출되게 되고, 이에 따라 해당 법률조항을 규제법률조항으로 분류하는 것을 기술적 특징으로 한다.In other words, even if it is a legal provision that was not classified as a regulatory legal provision from the beginning, in the case of a legal provision in which the rules derived from the learned regulatory legal provisions appear at a certain level or higher, a regulatory score higher than a certain value is performed in the regulatory score derivation step (S100) of the present invention. It is derived through this method, and the technical feature is that the relevant legal provisions are classified as regulatory legal provisions accordingly.

상기 규제법률조항에서 도출해낸 규칙의 일 예로는 "'규제', '의무', '~해야 한다'와 같이 강제성 혹은 당위성을 가지는 단어가 기설정된 개수 이상 포함되는 경우 이를 규제법률조항으로 분류한다" 등이 있을 수 있다. 위와 같이 학습된 규제분류모델(2100)을 통해 규제스코어를 도출하는 과정을 도 4에 대한 설명에서 서술하도록 한다.An example of a rule derived from the above regulatory legal provisions is "If it contains words with mandatory or necessary force, such as 'regulation', 'obligation', or 'must', more than a preset number, it is classified as a regulatory legal provision." There may be etc. The process of deriving the regulatory score through the regulatory classification model 2100 learned as above will be described in the explanation of FIG. 4.

도 4는 본 발명의 일 실시예에 따른 학습된 규제분류모델(2100)을 통해 각각의 법률조항에 대해 규제스코어를 도출하는 과정을 개략적으로 도시한다.Figure 4 schematically shows the process of deriving a regulatory score for each legal provision through the learned regulatory classification model 2100 according to an embodiment of the present invention.

개략적으로, 도 4의 (a)는 규제분류모델(2100)에 분류되지 않은 법률조항을 입력함으로써 해당 법률조항의 규제스코어를 도출하는 과정을 도시하고, 도 4의 (b)는 규제스코어 리스트의 일 실시예를 도시한다.Schematically, Figure 4(a) shows the process of deriving the regulatory score of the corresponding legal provision by inputting an unclassified legal provision into the regulatory classification model 2100, and Figure 4(b) shows the process of deriving the regulatory score of the regulatory score list. One embodiment is shown.

구체적으로, 도 3의 내용을 참고하여, 도 4의 (a)에 도시된 바와 같이, 규제스코어도출단계(S100)는 규제분류모델(2100)에 법률조항을 입력하면, 해당 법률조항에 대한 규제스코어를 도출한다. 바람직하게는, 상기 규제스코어도출단계(S100)는, 사용자로부터 쿼리를 입력받기 전 데이터베이스(2000)에 저장된 모든 법률조항에 대해 수행될 수 있다. 상기 규제스코어는 도 4의 (b)에 도시된 바와 같이 0 내지 1 사이의 실수로 표현될 수 있으며, 1에 가까울수록 해당 법률조항이 규제와 밀접하게 관련된 법률조항임을 의미한다. Specifically, with reference to the contents of FIG. 3, as shown in (a) of FIG. 4, in the regulatory score derivation step (S100), when a legal provision is entered into the regulatory classification model (2100), the regulation for the corresponding legal provision is Derive a score. Preferably, the regulatory score derivation step (S100) may be performed on all legal provisions stored in the database 2000 before receiving a query from the user. The regulatory score can be expressed as a real number between 0 and 1, as shown in (b) of FIG. 4, and the closer it is to 1, the closer it is to 1, meaning that the relevant legal provision is closely related to regulation.

본 발명의 일 실시예로서, 관련규제법률제공부(1300)는, 상기 규제스코어도출단계(S100)를 통해 도출된 규제스코어에 기초하여 기설정된 기준 이상의 규제스코어를 가진 법률조항에 대해 규제법률로 판단할 수 있다. 예를 들어, 규제스코어가 0.800 이상인 법률조항을 규제법률로서 판단할 수 있다.As an embodiment of the present invention, the relevant regulatory law provision unit 1300 converts legal provisions with regulatory scores greater than or equal to a preset standard into regulatory laws based on the regulatory score derived through the regulatory score derivation step (S100). You can judge. For example, a legal provision with a regulatory score of 0.800 or higher can be judged as a regulatory law.

즉, 본 발명의 규제스코어도출단계(S100)는 정부 등에 의해 지정된 규제법률을 학습한 규제분류모델(2100)을 이용하여 정부 등에 의해 규제법률로 지정되지 않았으나 실제 해당 법령이 적용되는 현장에서 규제법률로서 작용될 수 있는 그림자규제에 해당하는 규제법률을 도출할 수 있는 효과를 발휘할 수 있다.In other words, the regulatory score derivation step (S100) of the present invention uses a regulatory classification model (2100) that has learned regulatory laws designated by the government, etc., to determine regulatory laws in the field where the relevant laws are actually applied even though they have not been designated as regulatory laws by the government, etc. It can have the effect of deriving regulatory laws corresponding to shadow regulations that can act as.

도 5는 본 발명의 일 실시예에 따른 유사도스코어도출단계(S200)의 수행단계를 개략적으로 도시한다.Figure 5 schematically shows the execution steps of the similarity score derivation step (S200) according to an embodiment of the present invention.

도 5에 도시된 바와 같이, 유사도스코어도출부(1200)에 의하여 수행되는 유사도스코어도출단계(S200)는, 키워드매칭스코어를 도출하는 키워드매칭스코어도출단계(S210); 코사인유사도스코어를 도출하는 코사인유사도스코어도출단계(S220); 및 입력된 쿼리와 상기 유사도스코어도출단계(S200) 및 키워드매칭스코어도출단계(S210)를 통해 도출된 후보법률조항과 실질적으로 얼마나 연관되었는지를 나타내는 연관성스코어를 도출하는 연관성스코어도출단계(S230);를 포함한다.As shown in Figure 5, the similarity score derivation step (S200) performed by the similarity score derivation unit 1200 includes a keyword matching score derivation step (S210) of deriving a keyword matching score; A cosine similarity score derivation step (S220) of deriving a cosine similarity score; and a relevance score derivation step (S230) for deriving a relevance score indicating how substantially the input query is related to the candidate legal provisions derived through the similarity score derivation step (S200) and the keyword matching score derivation step (S210); Includes.

본 발명의 일 실시예로서 도 5에서는 상기 키워드매칭스코어도출단계(S210)가 상기 코사인유사도스코어도출단계(S220)보다 선행되는 것으로 도시되었으나, 본 발명의 다른 실시예에 따르면, 상기 코사인유사도스코어도출단계(S220)가 상기 키워드매칭스코어도출단계(S210)보다 선행될 수 있으며, 이는 본 발명의 발명자에 의도에 따라 얼마든지 설계변경될 수 있는 사항에 해당한다.As an embodiment of the present invention, in FIG. 5, the keyword matching score derivation step (S210) is shown as preceding the cosine similarity score derivation step (S220). However, according to another embodiment of the present invention, the cosine similarity score derivation step (S220) is shown in FIG. Step (S220) may precede the keyword matching score derivation step (S210), and this corresponds to a matter that can be changed in design as much as desired by the inventor of the present invention.

따라서, 상기 유사도스코어도출부(1200)는 상기 키워드매칭스코어, 상기 코사인유사도스코어, 및 상기 연관성스코어에 도출하여 사용자로부터 입력받은 쿼리와 데이터베이스(2000)에 저장된 복수의 법률조항 각각과의 유사도스코어를 도출하는 유사도스코어도출단계(S200)를 수행한다.Therefore, the similarity score derivation unit 1200 derives the keyword matching score, the cosine similarity score, and the relevance score to calculate a similarity score between the query input from the user and each of the plurality of legal provisions stored in the database 2000. Perform the similarity score derivation step (S200).

도 6 내지 도 7은 본 발명의 몇 실시예에 따른 키워드매칭스코어도출단계(S210)의 수행과정을 개략적으로 도시한다.Figures 6 and 7 schematically show the execution process of the keyword matching score derivation step (S210) according to several embodiments of the present invention.

도 6 내지 도 7에 도시된 바와 같이, 상기 유사도스코어도출단계(S200)는, 인공신경망 기반의 제1추론모델(2300)에 사용자로부터 입력받은 쿼리와 상기 데이터베이스(2000)에 저장된 복수의 법률조항 각각을 입력하여 키워드매칭스코어를 도출하는 키워드매칭스코어도출단계(S210)를 포함한다.As shown in Figures 6 and 7, the similarity score derivation step (S200) is a query input from a user in the first inference model 2300 based on an artificial neural network and a plurality of legal provisions stored in the database 2000. It includes a keyword matching score derivation step (S210) in which each keyword is entered to derive a keyword matching score.

또한, 도 7에 도시된 바와 같이, 상기 키워드매칭스코어도출단계(S210)는, 상기 사용자로부터 입력받은 쿼리로부터 키워드를 추출하는 단계; 추출된 복수의 키워드 각각을 1 이상의 차원을 가지는 벡터로 변환한 뒤, 변환된 복수의 벡터를 하나의 키워드벡터로 도출하는 단계; 및 인공신경망 기반의 제1추론모델(2300)에 법률조항과 키워드벡터를 입력함으로써, 입력된 법률조항과 키워드벡터와의 유사도를 나타내는 키워드매칭스코어를 도출하는 단계;를 포함한다. Additionally, as shown in FIG. 7, the keyword matching score derivation step (S210) includes extracting keywords from a query input from the user; Converting each of the extracted plurality of keywords into a vector having a dimension of 1 or more, and then deriving the converted plurality of vectors into one keyword vector; and entering a legal provision and a keyword vector into the first inference model 2300 based on an artificial neural network, thereby deriving a keyword matching score indicating the similarity between the input legal provision and the keyword vector.

구체적으로, 도 6은 본 발명의 일 실시예로서, 키워드매칭스코어를 도출하는 과정을 개략적으로 도시한다. 도 6의 (a)에 도시된 바와 같이, 유사도스코어도출부(1200)는, 명사추출기(2200)나 명사구추출기, 혹은 키워드도출모델 등을 이용하여 사용자로부터 입력받은 쿼리에 대한 복수의 키워드(A, B, C, D)를 도출하는 단계를 수행한다. 도 6 내지 도 7에서는 하나의 쿼리에서 4개의 키워드(A, B, C, D)를 도출한 예를 도시하지만 실제 본 발명에서 도출되는 키워드의 수를 도 6 내지 도 7에 도시된 바로 한정하지 않는다.Specifically, Figure 6 schematically shows the process of deriving a keyword matching score as an embodiment of the present invention. As shown in (a) of FIG. 6, the similarity score deriving unit 1200 extracts a plurality of keywords (A , B, C, D) are derived. Figures 6 and 7 show an example of deriving four keywords (A, B, C, D) from one query, but the number of keywords actually derived in the present invention is not limited to those shown in Figures 6 and 7. No.

이후 상기 유사도스코어도출부(1200)는 도 6의 (b)에 도시된 바와 같이, 사용자로부터 입력된 쿼리의 키워드 집합 {A, B, C, D}과 데이터베이스(2000)에 저장된 법률조항 각각을 인공지능 기반의 제1추론모델(2300)에 입력하여 키워드매칭스코어를 도출한다. Afterwards, as shown in (b) of FIG. 6, the similarity score deriving unit 1200 calculates the keyword set {A, B, C, D} of the query entered by the user and each of the legal provisions stored in the database 2000. The keyword matching score is derived by inputting it into the first inference model (2300) based on artificial intelligence.

상기 키워드매칭스코어는 상기 제1추론모델(2300)에 입력되는 법률조항에 상기 키워드 집합 {A, B, C, D}에 속한 키워드(A, B, C, D)가 얼마나 출현하는지, 혹은 상기 키워드 집합 {A, B, C, D}에 속한 키워드(A, B, C, D}와 관련된 명사구가 얼마나 출현하는지를 수치화한 스코어로서, 키워드매칭스코어가 높은 법률조항일수록 상기 쿼리의 키워드가 많이 포함되거나, 높은 빈도로 출현하는 법률조항으로 이해될 수 있다.The keyword matching score determines how many keywords (A, B, C, D) belonging to the keyword set {A, B, C, D} appear in the legal provisions input to the first inference model 2300, or the number of keywords (A, B, C, D) belonging to the keyword set {A, B, C, D}. It is a score that quantifies the occurrence of noun phrases related to keywords (A, B, C, D) belonging to the keyword set {A, B, C, D}. The higher the keyword matching score, the more keywords in the query are included in the legal provisions. Alternatively, it can be understood as a legal provision that appears with high frequency.

한편, 키워드매칭스코어는, 본 발명의 다른 실시예로서, 도 7에 도시된 바와 같이, 키워드 집합 {A, B, C, D}을 바로 상기 제1추론모델(2300)에 입력하는 것이 아니라, 키워드 집합 {A, B, C, D}을 키워드벡터로 변환한 뒤, 상기 키워드벡터와 데이터베이스(2000)에 저장된 법률조항 각각을 상기 제1추론모델(2300)에 입력하여 키워드매칭스코어를 도출할 수 있다.Meanwhile, the keyword matching score is another embodiment of the present invention, as shown in FIG. 7, rather than directly inputting the keyword set {A, B, C, D} into the first inference model 2300, After converting the keyword set {A, B, C, D} into a keyword vector, each of the keyword vector and the legal provisions stored in the database (2000) is input into the first inference model (2300) to derive a keyword matching score. You can.

더 구체적으로, 상기 유사도스코어도출부(1200)는 도 6의 (a)에 도시된 과정을 통해 키워드 집합 {A, B, C, D}을 도출한 뒤, 단어를 1 이상의 차원을 가지는 벡터로 변환하는 매트릭스에 상기 키워드 집합에 속한 키워드 각각을 입력하여, 해당 키워드 각각에 대한 벡터(VA, VB, VC, VD)를 도출할 수 있다. 본 발명의 여러 실시예에 따르면, 상기 매트릭스에 의하여 수행되는 기능은 W2V과 같이 텍스트를 이에 상응하는 벡터로 변환시키는 모델 혹은 알고리즘에 의해 수행될 수도 있다. 상기 키워드(VA, VB, VC, VD) 각각에 대한 벡터가 도출되면, 상기 유사도스코어도출부(1200)는, 도 7의 (a)에 도시된 바와 같이, 이를 하나의 키워드벡터(VA+B+C+D)로 도출한다. 예를 들어, 상기 키워드(VA, VB, VC, VD) 각각에 대한 벡터를 모두 합하는 방식으로 해당 키워드벡터를 도출할 수 있다.More specifically, the similarity score deriving unit 1200 derives a keyword set {A, B, C, D} through the process shown in (a) of FIG. 6 and then converts the words into a vector with a dimension of 1 or more. By entering each keyword belonging to the keyword set into the conversion matrix, vectors (V A , V B , V C , V D ) for each keyword can be derived. According to various embodiments of the present invention, the function performed by the matrix may be performed by a model or algorithm that converts text into a corresponding vector, such as W2V. When a vector for each of the keywords (V A , V B , V C , V D ) is derived, the similarity score deriving unit 1200 converts them into one keyword vector, as shown in (a) of FIG. 7. Derived as (V A+B+C+D ). For example, the corresponding keyword vector can be derived by adding up the vectors for each of the keywords (V A , V B , V C , and V D ).

키워드벡터(VA+B+C+D)가 도출되면, 상기 유사도스코어도출부(1200)는 도출된 키워드벡터(VA+B+C+D)와 법률조항을 상기 제1추론모델(2300)에 입력함으로써 해당 법률조항과 쿼리 사이의 키워드매칭스코어를 도출할 수 있다.When the keyword vector (V A+B+C+D ) is derived, the similarity score derivation unit 1200 combines the derived keyword vector (V A+B+C+D ) and the legal provisions with the first inference model (2300). ), you can derive the keyword matching score between the relevant legal provisions and the query.

도 8은 본 발명의 일 실시예에 따른 코사인유사도스코어도출단계(S220)의 수행과정을 개략적으로 도시한다.Figure 8 schematically shows the process of performing the cosine similarity score derivation step (S220) according to an embodiment of the present invention.

도 8에 도시된 바와 같이, 상기 코사인유사도스코어도출단계(S220)는, 상기 사용자로부터 입력받은 쿼리에 대해 인공신경망 기반의 워드임베딩모델(2400)을 통해 쿼리벡터를 도출하는 단계; 및 상기 데이터베이스(2000)에 저장된 모든 법률조항 각각과 상기 쿼리벡터 사이에 대해 도출된 코사인유사도에 기초하는 코사인유사도스코어를 도출하는 단계;를 포함한다.As shown in FIG. 8, the cosine similarity score derivation step (S220) includes deriving a query vector for the query input from the user through an artificial neural network-based word embedding model (2400); and deriving a cosine similarity score based on the cosine similarity derived between each of all legal provisions stored in the database 2000 and the query vector.

개략적으로, 도 8의 (a)는 사용자로부터 입력받은 쿼리를 워드임베딩모델(2400)에 입력하여 쿼리벡터(Vquery)를 도출하는 과정을 도시하고, 도 8의 (b)는 데이터베이스(2000)에 저장된 복수의 법률조항 각각을 상기 워드임베딩모델(2400)에 입력하여 상기 법률조항 각각에 대한 법률벡터(Vlaw)를 도출하는 과정을 도시하고, 도 8의 (c)는 상기 쿼리벡터(Vquery)와 상기 법률벡터(Vlaw) 사이의 코사인유사도스코어를 도출하는 과정을 도시한다.Schematically, Figure 8(a) shows the process of deriving a query vector (V query) by inputting a query input from a user into the word embedding model 2400, and Figure 8(b) shows the process of deriving a query vector (V query ) from the database 2000. Shows the process of deriving a legal vector (V law ) for each legal provision by inputting each of a plurality of legal provisions stored in the word embedding model 2400, and Figure 8 (c) shows the query vector (V The process of deriving the cosine similarity score between query ) and the law vector (V law ) is shown.

구체적으로, 유사도스코어도출부(1200)는 도 8에 도시된 워드임베딩모델(2400)에 사용자로부터 입력받은 쿼리와 데이터베이스(2000)에 저장된 법률조항 각각을 입력하여 쿼리벡터(Vquery) 및 복수의 법률벡터(Vlaw)를 도출한 뒤, 상기 쿼리벡터(Vquery) 및 법률벡터(Vlaw) 사이의 코사인유사도를 도출하여 상기 쿼리와 상기 데이터베이스(2000)에 저장된 법률조항 각각에 대한 코사인유사도스코어를 도출한다. 상기 워드임베딩모델(2400)은 키워드매칭스코어도출단계(S210)에서의 매트릭스와 유사한 기능을 수행하나, 서로 상이한 모델 혹은 알고리즘에 해당하는 것이 바람직하다. 즉 상기 키워드벡터(VA+B+C+D)와 상기 쿼리벡터(Vquery) 모두 쿼리에 대한 벡터를 의미하나, 서로 상이한 벡터에 해당한다.Specifically, the similarity score deriving unit 1200 inputs each of the query input from the user and the legal provisions stored in the database 2000 into the word embedding model 2400 shown in FIG. 8 to generate a query vector (V query ) and a plurality of After deriving a legal vector (V law ), cosine similarity is derived between the query vector (V query ) and the law vector (V law ) to obtain a cosine similarity score for each of the query and the legal provisions stored in the database (2000). Derive . The word embedding model 2400 performs a similar function to the matrix in the keyword matching score derivation step (S210), but preferably corresponds to a different model or algorithm. That is, both the keyword vector (V A+B+C+D ) and the query vector (V query ) mean vectors for queries, but they correspond to different vectors.

도 8에 도시된 Vlaw1, Vlaw2, Vlaw3, Vlaw4, Vlaw5, 및 Vlaw6 각각은, 도 2를 참고하여, LAW#1, LAW#2, LAW#3, LAW#4, LAW#5, 및 LAW#6을 상기 워드임베딩모델(2400)에 입력하여 출력된 1 이상의 차원을 가지는 벡터에 해당하며, 상기 법률벡터(Vlaw)를 구하는 과정은 데이터베이스(2000)에 저장된 모든 법률조항에 대해 수행되는 것이 바람직하다.V law1 , V law2 , V law3 , V law4 , V law5 , and V law6 shown in FIG. 8 are LAW#1, LAW#2, LAW#3, LAW#4, and LAW#, respectively, with reference to FIG. 2. 5, and LAW #6 correspond to a vector with a dimension of 1 or more output by inputting it into the word embedding model (2400), and the process of obtaining the legal vector (V law ) is based on all legal provisions stored in the database (2000). It is desirable to carry out

다시 말해, 상기 유사도스코어도출부(1200)는, 상기 워드임베딩모델(2400)을 통해 쿼리벡터(Vquery)와 복수의 법률벡터(Vlaw)를 도출한 뒤, 도 8의 (c)에 도시된 바와 같이, 쿼리벡터(Vquery)와 복수의 법률벡터(Vlaw) 각각과의 코사인유사도를 산출한 뒤, 산출한 코사인유사도에 기초하여 코사인유사도스코어를 도출한다.In other words, the similarity score deriving unit 1200 derives a query vector (V query ) and a plurality of law vectors (V law ) through the word embedding model 2400, as shown in (c) of FIG. 8. As described above, the cosine similarity between each of the query vector (V query ) and the plurality of law vectors (V law ) is calculated, and then the cosine similarity score is derived based on the calculated cosine similarity.

상술한 바와 같이, 유사도스코어도출부(1200)는 상이한 방식으로 도출된 상이한 스코어(키워드매칭스코어 및 코사인유사도스코어)에 기초하여 사용자로부터 입력받은 쿼리와 법률조항 사이의 유사도에 따른 유사도스코어를 도출할 수 있으며, 이를 통해 한 가지 방식으로 유사도스코어를 도출하는 것보다 정확하게 유사도스코어를 도출할 수 있다.As described above, the similarity score deriving unit 1200 derives a similarity score according to the similarity between the query input from the user and the legal provisions based on different scores (keyword matching score and cosine similarity score) derived in different ways. Through this, the similarity score can be derived more accurately than deriving the similarity score using a single method.

도 9는 본 발명의 일 실시예에 따른 후보법률조항을 도출하는 과정을 개략적으로 도시하고, 도 10은 본 발명의 일 실시예에 따른 유사도스코어를 도출하는 과정을 개략적으로 도시한다.Figure 9 schematically shows a process for deriving candidate legal provisions according to an embodiment of the present invention, and Figure 10 schematically shows a process for deriving a similarity score according to an embodiment of the present invention.

도 9 내지 도 10에 도시된 바와 같이, 상기 유사도스코어도출단계(S200)는, 상기 키워드매칭스코어와 상기 코사인유사도스코어에 기초하여 도출한 법률조항과 입력받은 쿼리를 인공신경망 기반의 제2추론모델(2500)에 입력하여 상기 도출한 법률조항과 상기 입력받은 쿼리 사이의 연관성을 나타내는 연관성스코어를 도출하는 연관성스코어도출단계(S230)를 더 포함하고, 상기 키워드매칭스코어, 상기 코사인유사도스코어, 및 상기 연관성스코어에 기초하여 상기 복수의 법률조항 각각에 대한 유사도스코어를 도출한다.As shown in Figures 9 and 10, the similarity score derivation step (S200) is a second inference model based on an artificial neural network based on legal provisions and input queries derived based on the keyword matching score and the cosine similarity score. It further includes a relevance score derivation step (S230) of entering into (2500) and deriving a relevance score indicating the correlation between the derived legal provision and the input query, wherein the keyword matching score, the cosine similarity score, and the Based on the relevance score, a similarity score is derived for each of the plurality of legal provisions above.

구체적으로, 본 발명의 일 실시예에 따르면, 상기 유사도스코어도출부(1200)는 상기 키워드매칭스코어 및 상기 코사인유사도스코어에 기초하여 해당 법률조항의 유사도스코어를 도출할 수 있다. 한편, 바람직하게는, 본 발명의 다른 실시예로서, 상기 키워드매칭스코어, 상기 코사인유사도스코어, 및 상기 연관성스코어에 기초하여 상기 복수의 법률조항 각각에 대한 유사도스코어를 도출할 수 있다.Specifically, according to one embodiment of the present invention, the similarity score deriving unit 1200 may derive the similarity score of the relevant legal provision based on the keyword matching score and the cosine similarity score. Meanwhile, preferably, as another embodiment of the present invention, a similarity score for each of the plurality of legal provisions can be derived based on the keyword matching score, the cosine similarity score, and the relevance score.

도 9의 (a)에 도시된 바와 같이, 상기 유사도스코어도출부(1200)는, 상기 데이터베이스(2000)에 저장된 모든 법률조항에 대한 상기 키워드매칭스코어 및 코사인유사도스코어에 기초하여 법률조항별로 중간스코어를 도출하고, 도 9의 (b)에 도시된 바와 같이, 상기 모든 법률조항들을 상기 중간스코어 순으로 나열한다.As shown in (a) of FIG. 9, the similarity score deriving unit 1200 calculates an intermediate score for each legal provision based on the keyword matching score and cosine similarity score for all legal provisions stored in the database 2000. is derived, and as shown in (b) of Figure 9, all the legal provisions are listed in order of the intermediate score.

이후, 상기 모든 법률조항들 가운데 일부 법률조항을 기설정된 조건에 따라 후보법률조항으로 선정한다. 도 9에서는 상위 100개의 중간스코어를 가지는 법률조항들을 후보법률조항으로 선정하는 실시예를 도시하였으나, 본 발명의 후보법률조항을 선정하는 구성을 상술한 실시예로 한정하지 않으며 다양한 실시예를 통해 소정의 개수의 후보법률조항을 선정할 수 있다.Afterwards, among all the above legal provisions, some are selected as candidate legal provisions according to pre-established conditions. In Figure 9, an embodiment of selecting legal provisions with the top 100 intermediate scores as candidate legal provisions is shown. However, the configuration of selecting candidate legal provisions of the present invention is not limited to the above-described embodiment and can be selected through various embodiments. A number of candidate legal provisions can be selected.

이와 같이, 후보법률조항으로 선정된 복수의 법률조항 각각과 상기 사용자로부터 입력받은 쿼리를 인공지능 기반의 제2추론모델(2500)에 입력하여 상기 쿼리와 후보법률조항 각각 사이의 연관성스코어를 도출하는 연관성스코어도출단계(S230)가 유사도스코어도출부(1200)에 의하여 수행된다. 바람직한 실시예로서, 상기 연관성스코어는 하드 네거티브 믹싱(hard negative mixing)방식을 이용한 자기 지도 학습에 기초하여 도출될 수 있다.In this way, each of the plurality of legal provisions selected as candidate legal provisions and the query input from the user are entered into the artificial intelligence-based second inference model 2500 to derive a correlation score between the query and each candidate legal provision. The relevance score derivation step (S230) is performed by the similarity score derivation unit 1200. In a preferred embodiment, the relevance score may be derived based on self-supervised learning using a hard negative mixing method.

상기 유사도스코어도출부(1200)는, 전술한 과정을 통해 도출된 키워드매칭스코어, 코사인유사도스코어, 및 연관성스코어에 기초하여 입력된 쿼리와 법률조항 상이의 유사도스코어를 도출한다. 이후, 도 1에 대한 설명을 참소하여, 상기 컴퓨팅시스템(1000)의 관련규제법률제공부(1300)는 상기 규제스코어와 상기 유사도스코어에 기초하여 사용자가 입력한 쿼리와 관련된 규제법률조항을 도출하고, 사용자에게 제공한다.The similarity score derivation unit 1200 derives a similarity score different from the input query and the legal provisions based on the keyword matching score, cosine similarity score, and relevance score derived through the above-described process. Thereafter, referring to the explanation of FIG. 1, the relevant regulatory law provision unit 1300 of the computing system 1000 derives regulatory law provisions related to the query entered by the user based on the regulatory score and the similarity score, and , provided to the user.

도 11은 본 발명의 일 실시예에 따른 규제법률조항을 결정하는 과정을 개략적으로 도시하고, 도 12는 본 발명의 일 실시예에 따른 사용자에게 제공되는 규제법률리스트를 개략적으로 도시한다.Figure 11 schematically shows the process of determining regulatory law provisions according to an embodiment of the present invention, and Figure 12 schematically shows a list of regulatory laws provided to users according to an embodiment of the present invention.

도 11 내지 도 12에 도시된 바와 같이, 본 발명의 일 실시예로서, 상기 관련규제법률제공단계(S300)는, 상기 유사도스코어에 기초하여 상기 쿼리와 관련된 규제법률조항을 분류하되, 기설정된 규제스코어 이상의 법률조항을 규제법률조항으로 결정한 뒤, 결정된 규제법률조항을 기설정된 조건에 따른 순서로 나열된 리스트 형태로 사용자에게 제공한다.As shown in Figures 11 and 12, as an embodiment of the present invention, the relevant regulatory law provision step (S300) classifies regulatory legal provisions related to the query based on the similarity score, and preset regulations After determining the legal provisions higher than the score as regulatory legal provisions, the determined regulatory legal provisions are provided to the user in the form of a list arranged in order according to preset conditions.

한편, 본 발명의 다른 실시예로서, 상기 관련규제법률제공단계(S300)는, 상기 유사도스코어에 기초하여 상기 쿼리와 관련된 규제법률조항을 분류하되, 기설정된 개수의 사위 유사도스코어를 가지는 법률조항의 규제스코어에 기초하여 산출된 기준규제스코어 이상의 법률조항을 규제법률조항으로 결정한 뒤, 결정된 규제법률조항을 기설정된 조건에 따른 순서로 나열된 리스트 형태로 사용자에게 제공한다.Meanwhile, in another embodiment of the present invention, the relevant regulatory law providing step (S300) classifies regulatory legal provisions related to the query based on the similarity score, and classifies the regulatory legal provisions related to the query based on the similarity score, After determining the legal provisions above the standard regulatory score calculated based on the regulatory score as regulatory legal provisions, the determined regulatory legal provisions are provided to the user in the form of a list arranged in order according to preset conditions.

구체적으로, 도 11에 도시된 바와 같이, 관련규제법률제공부(1300)는 법률조항에 대해 해당 법률조항에 대한 유사도스코어와 규제스코어에 기초하여 해당 법률조항이 관련규제법률조항인지를 판단하고, 관련규제법률조항으로 판단된 복수의 법률조항들을 리스트 형태로 제공하는 관련규제법률제공단계(S300)를 수행한다.Specifically, as shown in FIG. 11, the relevant regulatory law provision unit 1300 determines whether the relevant legal provision is a relevant regulatory legal provision based on the similarity score and regulatory score for the legal provision, The relevant regulatory law provision step (S300) is performed in which a plurality of legal provisions determined to be relevant regulatory legal provisions are provided in the form of a list.

상기 리스트 형태로 제공되는 관련규제법률조항의 일 실시예를 도 12에 도시한다. 도 12에 도시된 바와 같이, 리스트에는, 도 3에 대한 설명을 참고하여, 법률 제목, 법률조항 원문, 해당법률의 상위법 정보, 소관부서, 공표일, 시행일 및 규제정보가 포함되며, 설명의 편의를 위해 도 12에는 법률 제목, 법률조항원문, 해당 법률조항의 유사도스코어, 및 해당 법률조항의 규제스코어만을 도시한다. 상기 유사도스코어는 도 4에 대한 설명에서 전술한 규제스코어와 마찬가지로 0 내지 1 사이의 실수로 표현될 수 있으며, 1에 가까울수록 해당 법률조항이 입력된 쿼리와 밀접하게 유사한 법률조항임을 의미한다.An example of the relevant regulatory provisions provided in the form of the list is shown in FIG. 12. As shown in Figure 12, with reference to the explanation of Figure 3, the list includes the title of the law, the original text of the law, information on the higher law of the law, relevant department, date of publication, date of enforcement, and regulation information, for convenience of explanation. For this purpose, Figure 12 shows only the title of the law, the text of the legal provision, the similarity score of the relevant legal provision, and the regulatory score of the relevant legal provision. The similarity score can be expressed as a real number between 0 and 1, similar to the regulation score described above in the description of FIG. 4, and the closer it is to 1, the closer the legal provision is to the entered query.

상기 관련규제법률제공단계(S300)는, 사용자가 입력한 쿼리에 대한 유사도스코어 순서대로 상기 리스트를 생성할 수 있다. 이 때, 기설정된 규제스코어 이상인 법률조항만을 상기 리스트에 포함시키거나 혹은, 특정 규칙에 따라 기준규제스코어를 산출한 뒤, 상기 기준규제스코어 이상인 법률조항만을 상기 리스트에 포함시킬 수 있다.The relevant regulatory law provision step (S300) may generate the list in order of similarity scores for queries entered by the user. At this time, only legal provisions that are higher than a preset regulatory score can be included in the list, or after calculating the standard regulatory score according to a specific rule, only legal provisions that are higher than the standard regulatory score can be included in the list.

본 발명의 일 실시예로서, 상기 기준규제스코어는, 규제스코어와 상관없이 순수 유사도스코어만을 기준으로 복수의 법률조항들을 나열했을 때 기설정된 개수의 상위 유사도스코어를 가지는 법률조항들의 규제스코어에 기초하여 도출될 수 있다. 예를 들어, 유사도스코어를 기준으로 복수의 법률조항들을 나열했을 때 상위 50개의 법률조항들의 규제스코어의 평균값을 상기 기준규제스코어로 결정할 수 있다.As an embodiment of the present invention, the standard regulatory score is based on the regulatory scores of legal provisions with a preset number of higher similarity scores when listing a plurality of legal provisions based only on the pure similarity score, regardless of the regulatory score. can be derived. For example, when a plurality of legal provisions are listed based on the similarity score, the average value of the regulatory scores of the top 50 legal provisions can be determined as the standard regulatory score.

본 발명은 전술한 실시예를 통해 도출한 관련규제법률 리스트를 사용자에게 제공함으로써, 사용자는 단순히 검색어 혹은 검색문을 입력함으로써, 자신이 찾고자 하는 분야의 규제법률조항을 손쉽게 검색할 수 있는 효과를 발휘할 수 있으며, 종래 기술 혹은 종래의 관련 플랫폼 등에서 법률조항을 단순히 소관부처별로 나열한 분류체계로 상위법 폴더 안에 하위법을 열도록 구조화되는 방식으로 제공하거나, 또는 실생활과 관련된 주제로 이루어진 카테고리를 토대로 분류체계를 세워 제공하는 방식에 비하여 실무진들이 좀 더 실질적이고 필요한 법률조항들을 효과적으로 제공할 수 있다.The present invention provides users with a list of related regulatory laws derived through the above-described embodiments, so that users can easily search for regulatory laws and regulations in the field they are looking for by simply entering a search word or search statement. It can be provided in a structured way to open lower-level laws within a higher-level law folder in a classification system that simply lists legal provisions by relevant ministries in the prior art or related platforms, or provides a classification system based on categories made up of topics related to real life. Compared to the provision method, working-level staff can provide more practical and necessary legal provisions more effectively.

도 13는 본 발명의 일 실시예에 따른 컴퓨팅장치(11000)의 내부 구성을 예시적으로 도시한다.FIG. 13 exemplarily illustrates the internal configuration of a computing device 11000 according to an embodiment of the present invention.

도 1에 대한 설명에서 언급된 컴퓨팅시스템(1000)은 후술하는 도 13에 도시된 컴퓨팅장치(11000)의 구성요소를 포함할 수 있다.The computing system 1000 mentioned in the description of FIG. 1 may include components of the computing device 11000 shown in FIG. 13, which will be described later.

도 13에 도시한 바와 같이, 컴퓨팅장치(11000)는 적어도 하나의 프로세서(processor)(11100), 메모리(memory)(11200), 주변장치 인터페이스(peripheral interface)(11300), 입/출력 서브시스템(I/O subsystem)(11400), 전력 회로(11500) 및 통신 회로(11600)를 적어도 포함할 수 있다. As shown in FIG. 13, the computing device 11000 includes at least one processor 11100, a memory 11200, a peripheral interface 11300, and an input/output subsystem ( It may include at least an I/O subsystem (11400), a power circuit (11500), and a communication circuit (11600).

구체적으로, 상기 메모리(11200)는, 일례로 고속 랜덤 액세스 메모리(high-speed random access memory), 자기 디스크, 에스램(SRAM), 디램(DRAM), 롬(ROM), 플래시 메모리 또는 비휘발성 메모리를 포함할 수 있다. 상기 메모리(11200)는 상기 컴퓨팅장치(11000)의 동작에 필요한 소프트웨어 모듈, 명령어 집합 또는 그 밖에 다양한 데이터를 포함할 수 있다.Specifically, the memory 11200 may be, for example, high-speed random access memory, magnetic disk, SRAM, DRAM, ROM, flash memory, or non-volatile memory. may include. The memory 11200 may include software modules, instruction sets, or other various data necessary for the operation of the computing device 11000.

이때, 상기 프로세서(11100)나 상기 주변장치 인터페이스(11300) 등의 다른 컴포넌트에서 상기 메모리(11200)에 액세스하는 것은 상기 프로세서(11100)에 의해 제어될 수 있다. 상기 프로세서(11100)은 단일 혹은 복수로 구성될 수 있고, 연산처리속도 향상을 위하여 GPU 및 TPU 형태의 프로세서를 포함할 수 있다.At this time, access to the memory 11200 from other components such as the processor 11100 or the peripheral device interface 11300 may be controlled by the processor 11100. The processor 11100 may be composed of a single processor or a plurality of processors, and may include GPU and TPU type processors to improve calculation processing speed.

상기 주변장치 인터페이스(11300)는 상기 컴퓨팅장치(11000)의 입력 및/또는 출력 주변장치를 상기 프로세서(11100) 및 상기 메모리 (11200)에 결합시킬 수 있다. 상기 프로세서(11100)는 상기 메모리(11200)에 저장된 소프트웨어 모듈 또는 명령어 집합을 실행하여 상기 컴퓨팅장치(11000)를 위한 다양한 기능을 수행하고 데이터를 처리할 수 있다.The peripheral device interface 11300 may couple input and/or output peripheral devices of the computing device 11000 to the processor 11100 and the memory 11200. The processor 11100 may execute a software module or set of instructions stored in the memory 11200 to perform various functions for the computing device 11000 and process data.

상기 입/출력 서브시스템(11400)은 다양한 입/출력 주변장치들을 상기 주변장치 인터페이스(11300)에 결합시킬 수 있다. 예를 들어, 상기 입/출력 서브시스템(11400)은 모니터나 키보드, 마우스, 프린터 또는 필요에 따라 터치스크린이나 센서 등의 주변장치를 상기 주변장치 인터페이스(11300)에 결합시키기 위한 컨트롤러를 포함할 수 있다. 다른 측면에 따르면, 상기 입/출력 주변장치들은 상기 입/출력 서브시스템(11400)을 거치지 않고 상기 주변장치 인터페이스(11300)에 결합될 수도 있다.The input/output subsystem 11400 can couple various input/output peripheral devices to the peripheral device interface 11300. For example, the input/output subsystem 11400 may include a controller for coupling peripheral devices such as a monitor, keyboard, mouse, printer, or, if necessary, a touch screen or sensor to the peripheral device interface 11300. there is. According to another aspect, the input/output peripheral devices may be coupled to the peripheral interface 11300 without going through the input/output subsystem 11400.

상기 전력 회로(11500)는 단말기의 컴포넌트의 전부 또는 일부로 전력을 공급할 수 있다. 예를 들어 상기 전력 회로(11500)는 전력 관리 시스템, 배터리나 교류(AC) 등과 같은 하나 이상의 전원, 충전 시스템, 전력 실패 감지 회로(power failure detection circuit), 전력 변환기나 인버터, 전력 상태 표시자 또는 전력 생성, 관리, 분배를 위한 임의의 다른 컴포넌트들을 포함할 수 있다.The power circuit 11500 may supply power to all or part of the components of the terminal. For example, the power circuit 11500 may include a power management system, one or more power sources such as batteries or alternating current (AC), a charging system, a power failure detection circuit, a power converter or inverter, a power status indicator, or It may include any other components for power generation, management, and distribution.

상기 통신 회로(11600)는 적어도 하나의 외부 포트를 이용하여 다른 컴퓨팅장치와 통신을 가능하게 할 수 있다. 또는, 상술한 바와 같이 필요에 따라 상기 통신 회로(11600)는 RF 회로를 포함하여 전자기 신호(electromagnetic signal)라고도 알려진 RF 신호를 송수신함으로써, 다른 컴퓨팅장치와 통신을 가능하게 할 수도 있다.The communication circuit 11600 may enable communication with another computing device using at least one external port. Alternatively, as described above, if necessary, the communication circuit 11600 may include an RF circuit to transmit and receive RF signals, also known as electromagnetic signals, to enable communication with other computing devices.

이러한 도 13의 실시예는, 상기 컴퓨팅장치(11000)의 일례일 뿐이고, 상기 컴퓨팅장치(11000)는 도 13에 도시된 일부 컴포넌트가 생략되거나, 도 13에 도시되지 않은 추가의 컴포넌트를 더 구비하거나, 2 개 이상의 컴포넌트를 결합시키는 구성 또는 배치를 가질 수 있다. 예를 들어, 모바일 환경의 통신 단말을 위한 컴퓨팅장치는 도 13에 도시된 컴포넌트들 외에도, 터치스크린이나 센서 등을 더 포함할 수도 있으며, 상기 통신 회로(1160)에 다양한 통신방식(Wi-Fi, 3G, LTE, 5G, 6G, Bluetooth, NFC, Zigbee 등)의 RF 통신을 위한 회로가 포함될 수도 있다. 상기 컴퓨팅장치(11000)에 포함 가능한 컴포넌트들은 하나 이상의 신호 처리 또는 어플리케이션에 특화된 집적 회로를 포함하는 하드웨어, 소프트웨어, 또는 하드웨어 및 소프트웨어 양자의 조합으로 구현될 수 있다.This embodiment of FIG. 13 is only an example of the computing device 11000, and the computing device 11000 may omit some components shown in FIG. 13 or further include additional components not shown in FIG. 13. , may have a configuration or arrangement that combines two or more components. For example, a computing device for a communication terminal in a mobile environment may further include a touch screen or a sensor in addition to the components shown in FIG. 13, and the communication circuit 1160 may include various communication methods (Wi-Fi, Circuits for RF communication (3G, LTE, 5G, 6G, Bluetooth, NFC, Zigbee, etc.) may be included. Components that can be included in the computing device 11000 may be implemented as hardware, software, or a combination of both hardware and software, including an integrated circuit specialized for one or more signal processing or applications.

본 발명의 실시예에 따른 방법들은 다양한 컴퓨팅장치를 통하여 수행될 수 있는 프로그램 명령(instruction) 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 특히, 본 실시예에 따른 프로그램은 PC 기반의 프로그램 또는 모바일 단말 전용의 어플리케이션으로 구성될 수 있다. 본 발명이 적용되는 어플리케이션은 파일 배포 시스템이 제공하는 파일을 통해 이용자 단말에 설치될 수 있다. 일 예로, 파일 배포 시스템은 이용자 단말이기의 요청에 따라 상기 파일을 전송하는 파일 전송부(미도시)를 포함할 수 있다.Methods according to embodiments of the present invention may be implemented in the form of program instructions that can be executed through various computing devices and recorded on a computer-readable medium. In particular, the program according to this embodiment may be composed of a PC-based program or a mobile terminal-specific application. The application to which the present invention is applied can be installed on a user terminal through a file provided by a file distribution system. As an example, the file distribution system may include a file transmission unit (not shown) that transmits the file according to a request from the user terminal.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 컨트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 컨트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The device described above may be implemented with hardware components, software components, and/or a combination of hardware components and software components. For example, devices and components described in embodiments may include, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA), etc. , may be implemented using one or more general-purpose or special-purpose computers, such as a programmable logic unit (PLU), microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. Additionally, a processing device may access, store, manipulate, process, and generate data in response to the execution of software. For ease of understanding, a single processing device may be described as being used; however, those skilled in the art will understand that a processing device includes multiple processing elements and/or multiple types of processing elements. It can be seen that it may include. For example, a processing device may include multiple processors or one processor and one controller. Additionally, other processing configurations, such as parallel processors, are possible.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로 (collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨팅장치 상에 표준편차되어서, 표준편차된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.Software may include a computer program, code, instructions, or a combination of one or more of these, which may configure a processing unit to operate as desired, or may be processed independently or collectively. You can command the device. Software and/or data may be used by any type of machine, component, physical device, virtual equipment, computer storage medium or device to be interpreted by or to provide instructions or data to a processing device. , or may be permanently or temporarily embodied in a transmitted signal wave. Software may be stored or executed in a standardized manner on a networked computing device. Software and data may be stored on one or more computer-readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc., singly or in combination. Program instructions recorded on the medium may be specially designed and configured for the embodiment or may be known and available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. -Includes optical media (magneto-optical media) and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, etc. Examples of program instructions include machine language code, such as that produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter, etc. The hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

본 발명의 일 실시예에 따르면, 정부에서 지정한 규제법률조항에 대한 정보를 그대로 제공하지 않고, 학습된 규제분류모델을 통해 도출된 규제스코어에 기초하여 규제법률조항을 도출함으로써 규제로 분류되지 않은 법률조항 중 규제로 인식되는 그림자규제조항을 쉽게 찾을 수 있는 효과를 발휘할 수 있다.According to one embodiment of the present invention, laws that are not classified as regulations are derived by deriving regulatory legal provisions based on regulatory scores derived through a learned regulatory classification model without providing information on regulatory legal provisions designated by the government as is. This can have the effect of making it easier to find shadow regulation provisions that are recognized as regulations.

본 발명의 일 실시예에 따르면, 기업 등에서 신사업 검토 또는 창업을 준비할 때 진행하려는 사업과 관련된 규제법률조항을 손쉽게 찾을 수 있는 효과를 발휘할 수 있다.According to one embodiment of the present invention, when a company, etc., is reviewing a new business or preparing to start a business, it is possible to easily find regulatory provisions related to the business to be conducted.

본 발명의 일 실시예에 따르면, 규제를 검토하는 정부 부처, 입법 기관, 및 국책 연구소 등에서 특정 분야에 관련된 법률조항을 쉽게 찾을 수 있어, 입법 혹은 개정이 필요한 법률조항들을 용이하게 모니터링할 수 있는 효과를 발휘할 수 있다.According to one embodiment of the present invention, government ministries, legislative bodies, and national research institutes reviewing regulations can easily find legal provisions related to a specific field, which has the effect of easily monitoring legal provisions that require legislation or revision. can be demonstrated.

본 발명의 일 실시예에 따르면, 사용자가 다양한 형식의 검색어를 입력할 수 있어 법률 용어 등 법적 지식이 충분하지 않더라도 자신이 찾고자 하는 분야의 규제법률조항을 손쉽게 검색할 수 있는 효과를 발휘할 수 있다.According to one embodiment of the present invention, users can enter search terms in various formats, allowing users to easily search for regulatory provisions in the field they are looking for even if they do not have sufficient legal knowledge such as legal terms.

본 발명의 일 실시예에 따르면, 법률의 분야나 소관부처별로 분류된 리스트가 아니라 실제 법 조문 내용에 기반한 주제별로 분류된 규제법률리스트를 제공함으로써 사용자가 입력한 검색어 혹은 검색문와 실질적으로 관련된 법률조항을 제공할 수 있는 효과를 발휘할 수 있다.According to one embodiment of the present invention, by providing a list of regulatory laws classified by subject based on the contents of actual legal provisions rather than a list classified by field of law or relevant ministry, legal provisions substantially related to the search word or search statement entered by the user It can be effective in providing .

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.As described above, although the embodiments have been described with limited examples and drawings, various modifications and variations can be made by those skilled in the art from the above description. For example, the described techniques are performed in a different order than the described method, and/or components of the described system, structure, device, circuit, etc. are combined or combined in a different form than the described method, or other components are used. Alternatively, appropriate results may be achieved even if substituted or substituted by an equivalent. Therefore, other implementations, other embodiments, and equivalents of the claims also fall within the scope of the claims described below.

Claims (9)

1 이상의 프로세서 및 1 이상의 메모리를 포함하는 컴퓨팅시스템에서 수행되는, 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법으로서,
복수의 법률조항 중 규제카드정보가 있는 법률조항의 규제카드정보로 학습된 규제분류모델을 이용하여 데이터베이스에 저장된 복수의 법률조항 각각이 규제와 얼마나 관련되어 있는지를 나타내는 규제스코어를 도출하되, 상기 규제스코어는 0 내지 1 사이의 실수에 해당하고, 1에 가까울수록 해당 법률조항이 규제와 밀접하게 관련된 법률조항을 의미하는 규제스코어도출단계;
1 이상의 인공신경망 기반 추론모델을 사용하여 사용자로부터 입력받은 검색어 혹은 검색문과 관련된 데이터를 포함하는 쿼리와 상기 복수의 법률조항 각각과의 유사도에 따른 유사도스코어를 도출하되, 상기 유사도스코어는 0 내지 1 사이의 실수로서, 1에 가까울수록 해당 법률조항이 입력된 쿼리와 유사한 법률조항을 의미하는 유사도스코어도출단계; 및
상기 유사도스코어에 기초하여 상기 쿼리와 관련된 규제법률조항을 분류하되, 유사도스코어에 따라 복수의 법률조항을 나열한 리스트를 생성하고, 상기 리스트에서 기설정된 개수의 상위 유사도스코어를 가지는 법률조항의 규제스코어에 기초하여 산출된 기준규제스코어 이상의 규제스코어에 해당하는 법률조항들을 규제법률조항으로 결정한 뒤, 결정된 규제법률조항을 기설정된 조건에 따른 순서로 나열된 리스트 형태로 사용자에게 제공하는 관련규제법률제공단계;를 포함하고,
상기 유사도스코어도출단계는,
인공신경망 기반의 제1추론모델에 사용자로부터 입력받은 쿼리와 상기 데이터베이스에 저장된 복수의 법률조항 각각을 입력하여 키워드매칭스코어를 도출하는 키워드매칭스코어도출단계;
상기 데이터베이스에 저장된 법률조항 각각과 사용자로부터 입력받은 쿼리 사이의 코사인유사도스코어를 도출하는 코사인유사도스코어도출단계;
상기 데이터베이스에 저장된 모든 법률조항에 대한 상기 키워드매칭스코어 및 코사인유사도스코어에 기초하여 법률조항별로 중간스코어를 도출하고, 모든 법률조항들을 상기 중간스코어 순으로 나열한 뒤, 상기 모든 법률조항들 가운데 일부 법률조항들을 기설정된 조건에 따라 후보법률조항으로 선정하는 단계; 및
상기 후보법률조항과 입력받은 쿼리를 인공신경망 기반의 제2추론모델에 입력하여 상기 후보법률조항과 상기 입력받은 쿼리 사이의 연관성을 나타내는 연관성스코어를 도출하되, 상기 연관성스코어는 하드 네거티브 믹싱 방식을 이용한 자기 지도 학습에 기초하여 도출되는, 연관성스코어도출단계;를 포함하고,
상기 키워드매칭스코어, 상기 코사인유사도스코어, 및 상기 연관성스코어에 기초하여 상기 복수의 법률조항 각각에 대한 유사도스코어를 도출하는, 규제법률조항을 도출하는 방법.
A method of deriving regulatory provisions related to an input query, performed on a computing system including one or more processors and one or more memories,
Among the plurality of legal provisions, a regulatory score indicating how related each of the plurality of legal provisions stored in the database is to the regulation is derived using a regulatory classification model learned with the regulation card information of the legal provisions with regulatory card information, and the regulation score is derived. A regulatory score derivation step where the score corresponds to a real number between 0 and 1, and the closer it is to 1, the closer the legal provision is to regulation.
One or more artificial neural network-based inference models are used to derive a similarity score based on the similarity between a query containing data related to a search word or search statement entered by the user and each of the plurality of legal provisions, where the similarity score is between 0 and 1. A similarity score derivation step, where the closer to 1 the closer the legal provision is to the entered query, the more similar the legal provision is to the entered query; and
Based on the similarity score, the regulatory legal provisions related to the query are classified, a list listing a plurality of legal provisions is created according to the similarity score, and the regulatory score of the legal provisions with a preset number of higher similarity scores in the list is generated. A related regulatory law provision step of determining legal provisions corresponding to a regulatory score higher than the standard regulatory score calculated based on the regulatory legal provisions as regulatory legal provisions, and then providing the determined regulatory legal provisions to the user in the form of a list arranged in order according to preset conditions; Contains,
The similarity score derivation step is,
A keyword matching score derivation step of deriving a keyword matching score by inputting a query input from a user and a plurality of legal provisions stored in the database into a first inference model based on an artificial neural network;
A cosine similarity score deriving step of deriving a cosine similarity score between each legal provision stored in the database and a query input from a user;
Based on the keyword matching score and cosine similarity score for all legal provisions stored in the database, an intermediate score is derived for each legal provision, all legal provisions are listed in order of the intermediate score, and some legal provisions are selected among all legal provisions. Selecting them as candidate legal provisions according to preset conditions; and
The candidate legal provisions and the input query are entered into a second inference model based on an artificial neural network to derive a correlation score indicating the correlation between the candidate legal provisions and the input query, and the correlation score is calculated using a hard negative mixing method. It includes a correlation score derivation step derived based on self-supervised learning,
A method of deriving regulatory legal provisions, wherein a similarity score for each of the plurality of legal provisions is derived based on the keyword matching score, the cosine similarity score, and the relevance score.
삭제delete 청구항 1에 있어서,
상기 키워드매칭스코어도출단계는,
상기 사용자로부터 입력받은 쿼리로부터 키워드를 추출하는 단계;
추출된 복수의 키워드 각각을 1 이상의 차원을 가지는 벡터로 변환한 뒤, 변환된 복수의 벡터를 하나의 키워드벡터로 도출하는 단계; 및
인공신경망 기반의 제1추론모델에 법률조항과 키워드벡터를 입력함으로써, 입력된 법률조항과 키워드벡터와의 유사도를 나타내는 키워드매칭스코어를 도출하는 단계;를 포함하는, 규제법률조항을 도출하는 방법.
In claim 1,
The keyword matching score derivation step is,
extracting keywords from a query input from the user;
Converting each of the extracted plurality of keywords into a vector having a dimension of 1 or more, and then deriving the converted plurality of vectors into one keyword vector; and
A method of deriving regulatory legal provisions, comprising: inputting legal provisions and keyword vectors into a first inference model based on an artificial neural network, thereby deriving a keyword matching score indicating the similarity between the input legal provisions and the keyword vectors.
청구항 1에 있어서,
상기 코사인유사도스코어도출단계는,
상기 사용자로부터 입력받은 쿼리에 대해 인공신경망 기반의 워드임베딩모델을 통해 쿼리벡터를 도출하는 단계; 및
상기 데이터베이스에 저장된 모든 법률조항 각각과 상기 쿼리벡터 사이에 대해 도출된 코사인유사도에 기초하는 코사인유사도스코어를 도출하는 단계;를 포함하는, 규제법률조항을 도출하는 방법.
In claim 1,
The cosine similarity score derivation step is,
Deriving a query vector for the query input from the user through an artificial neural network-based word embedding model; and
A method of deriving regulatory legal provisions comprising: deriving a cosine similarity score based on cosine similarity derived between each of all legal provisions stored in the database and the query vector.
삭제delete 삭제delete 삭제delete 1 이상의 프로세서 및 1 이상의 메모리를 포함하고, 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법을 수행하는 컴퓨팅시스템으로서,
복수의 법률조항 중 규제카드정보가 있는 법률조항의 규제카드정보로 학습된 규제분류모델을 이용하여 데이터베이스에 저장된 복수의 법률조항 각각이 규제와 얼마나 관련되어 있는지를 나타내는 규제스코어를 도출하되, 상기 규제스코어는 0 내지 1 사이의 실수에 해당하고, 1에 가까울수록 해당 법률조항이 규제와 밀접하게 관련된 법률조항을 의미하는 규제스코어도출부;
1 이상의 인공신경망 기반 추론모델을 사용하여 사용자로부터 입력받은 검색어 혹은 검색문과 관련된 데이터를 포함하는 쿼리와 상기 복수의 법률조항 각각과의 유사도에 따른 유사도스코어를 도출하되, 상기 유사도스코어는 0 내지 1 사이의 실수로서, 1에 가까울수록 해당 법률조항이 입력된 쿼리와 유사한 법률조항을 의미하는 유사도스코어도출부; 및
상기 유사도스코어에 기초하여 상기 쿼리와 관련된 규제법률조항을 분류하되, 유사도스코어에 따라 복수의 법률조항을 나열한 리스트를 생성하고, 상기 리스트에서 기설정된 개수의 상위 유사도스코어를 가지는 법률조항의 규제스코어에 기초하여 산출된 기준규제스코어 이상의 규제스코어에 해당하는 법률조항들을 규제법률조항으로 결정한 뒤, 결정된 규제법률조항을 기설정된 조건에 따른 순서로 나열된 리스트 형태로 사용자에게 제공하는 관련규제법률제공부;를 포함하고,
상기 유사도스코어도출부는,
인공신경망 기반의 제1추론모델에 사용자로부터 입력받은 쿼리와 상기 데이터베이스에 저장된 복수의 법률조항 각각을 입력하여 키워드매칭스코어를 도출하는 키워드매칭스코어도출단계;
상기 데이터베이스에 저장된 법률조항 각각과 사용자로부터 입력받은 쿼리 사이의 코사인유사도스코어를 도출하는 코사인유사도스코어도출단계;
상기 데이터베이스에 저장된 모든 법률조항에 대한 상기 키워드매칭스코어 및 코사인유사도스코어에 기초하여 법률조항별로 중간스코어를 도출하고, 모든 법률조항들을 상기 중간스코어 순으로 나열한 뒤, 상기 모든 법률조항들 가운데 일부 법률조항들을 기설정된 조건에 따라 후보법률조항으로 선정하는 단계; 및
상기 후보법률조항과 입력받은 쿼리를 인공신경망 기반의 제2추론모델에 입력하여 상기 후보법률조항과 상기 입력받은 쿼리 사이의 연관성을 나타내는 연관성스코어를 도출하되, 상기 연관성스코어는 하드 네거티브 믹싱 방식을 이용한 자기 지도 학습에 기초하여 도출되는, 연관성스코어도출단계;를 수행하고,
상기 키워드매칭스코어, 상기 코사인유사도스코어, 및 상기 연관성스코어에 기초하여 상기 복수의 법률조항 각각에 대한 유사도스코어를 도출하는, 컴퓨팅시스템.
A computing system comprising one or more processors and one or more memories, and performing a method of deriving regulatory provisions related to an input query,
Among the plurality of legal provisions, a regulatory score indicating how related each of the plurality of legal provisions stored in the database is to the regulation is derived using a regulatory classification model learned with the regulation card information of the legal provisions with regulatory card information, and the regulation score is derived. The score corresponds to a real number between 0 and 1, and the closer it is to 1, the closer the legal provision is to regulation, meaning that the legal provision is closely related to the regulation.
One or more artificial neural network-based inference models are used to derive a similarity score based on the similarity between a query containing data related to a search word or search statement entered by the user and each of the plurality of legal provisions, where the similarity score is between 0 and 1. As a real number, the closer to 1, the similarity score derivation section indicates that the corresponding legal provision is similar to the entered query; and
Based on the similarity score, the regulatory legal provisions related to the query are classified, a list listing a plurality of legal provisions is created according to the similarity score, and the regulatory score of the legal provisions with a preset number of higher similarity scores in the list is generated. A related regulatory law provision department that determines the legal provisions corresponding to a regulatory score higher than the standard regulatory score calculated based on the regulatory legal provisions as regulatory legal provisions and provides the determined regulatory legal provisions to the user in the form of a list arranged in order according to preset conditions; Contains,
The similarity score derivation unit,
A keyword matching score derivation step of deriving a keyword matching score by inputting a query input from a user and a plurality of legal provisions stored in the database into a first inference model based on an artificial neural network;
A cosine similarity score deriving step of deriving a cosine similarity score between each legal provision stored in the database and a query input from a user;
Based on the keyword matching score and cosine similarity score for all legal provisions stored in the database, an intermediate score is derived for each legal provision, all legal provisions are listed in order of the intermediate score, and some legal provisions are selected among all legal provisions. Selecting them as candidate legal provisions according to preset conditions; and
The candidate legal provisions and the input query are entered into a second inference model based on an artificial neural network to derive a correlation score indicating the correlation between the candidate legal provisions and the input query, and the correlation score is calculated using a hard negative mixing method. Perform a correlation score derivation step derived based on self-supervised learning,
A computing system that derives a similarity score for each of the plurality of legal provisions based on the keyword matching score, the cosine similarity score, and the relevance score.
1 이상의 프로세서 및 1 이상의 메모리를 포함하는 컴퓨팅시스템에서 수행되는, 입력된 쿼리와 관련된 규제법률조항을 도출하는 방법을 구현하기 위한 컴퓨터-판독가능 기록매체로서,
상기 컴퓨터-판독가능 기록매체는, 상기 컴퓨팅시스템으로 하여금 이하의 단계들을 수행하도록 하는 명령들을 저장하며,
상기 이하의 단계들은:
복수의 법률조항 중 규제카드정보가 있는 법률조항의 규제카드정보로 학습된 규제분류모델을 이용하여 데이터베이스에 저장된 복수의 법률조항 각각이 규제와 얼마나 관련되어 있는지를 나타내는 규제스코어를 도출하되, 상기 규제스코어는 0 내지 1 사이의 실수에 해당하고, 1에 가까울수록 해당 법률조항이 규제와 밀접하게 관련된 법률조항을 의미하는 규제스코어도출단계;
1 이상의 인공신경망 기반 추론모델을 사용하여 사용자로부터 입력받은 검색어 혹은 검색문과 관련된 데이터를 포함하는 쿼리와 상기 복수의 법률조항 각각과의 유사도에 따른 유사도스코어를 도출하되, 상기 유사도스코어는 0 내지 1 사이의 실수로서, 1에 가까울수록 해당 법률조항이 입력된 쿼리와 유사한 법률조항을 의미하는 유사도스코어도출단계; 및
상기 유사도스코어에 기초하여 상기 쿼리와 관련된 규제법률조항을 분류하되, 유사도스코어에 따라 복수의 법률조항을 나열한 리스트를 생성하고, 상기 리스트에서 기설정된 개수의 상위 유사도스코어를 가지는 법률조항의 규제스코어에 기초하여 산출된 기준규제스코어 이상의 규제스코어에 해당하는 법률조항들을 규제법률조항으로 결정한 뒤, 결정된 규제법률조항을 기설정된 조건에 따른 순서로 나열된 리스트 형태로 사용자에게 제공하는 관련규제법률제공단계;를 포함하고,
상기 유사도스코어도출단계는,
인공신경망 기반의 제1추론모델에 사용자로부터 입력받은 쿼리와 상기 데이터베이스에 저장된 복수의 법률조항 각각을 입력하여 키워드매칭스코어를 도출하는 키워드매칭스코어도출단계;
상기 데이터베이스에 저장된 법률조항 각각과 사용자로부터 입력받은 쿼리 사이의 코사인유사도스코어를 도출하는 코사인유사도스코어도출단계;
상기 데이터베이스에 저장된 모든 법률조항에 대한 상기 키워드매칭스코어 및 코사인유사도스코어에 기초하여 법률조항별로 중간스코어를 도출하고, 모든 법률조항들을 상기 중간스코어 순으로 나열한 뒤, 상기 모든 법률조항들 가운데 일부 법률조항들을 기설정된 조건에 따라 후보법률조항으로 선정하는 단계; 및
상기 후보법률조항과 입력받은 쿼리를 인공신경망 기반의 제2추론모델에 입력하여 상기 후보법률조항과 상기 입력받은 쿼리 사이의 연관성을 나타내는 연관성스코어를 도출하되, 상기 연관성스코어는 하드 네거티브 믹싱 방식을 이용한 자기 지도 학습에 기초하여 도출되는, 연관성스코어도출단계;를 포함하고,
상기 키워드매칭스코어, 상기 코사인유사도스코어, 및 상기 연관성스코어에 기초하여 상기 복수의 법률조항 각각에 대한 유사도스코어를 도출하는, 컴퓨터-판독가능 기록매체.
A computer-readable recording medium for implementing a method of deriving regulatory legal provisions related to an inputted query, performed on a computing system comprising at least one processor and at least one memory, comprising:
The computer-readable recording medium stores instructions that cause the computing system to perform the following steps,
The steps below are:
Among the plurality of legal provisions, a regulatory score indicating how related each of the plurality of legal provisions stored in the database is to the regulation is derived using a regulatory classification model learned with the regulation card information of the legal provisions with regulatory card information, and the regulation score is derived. A regulatory score derivation step where the score corresponds to a real number between 0 and 1, and the closer it is to 1, the closer the legal provision is to regulation.
One or more artificial neural network-based inference models are used to derive a similarity score based on the similarity between a query containing data related to a search word or search statement entered by the user and each of the plurality of legal provisions, where the similarity score is between 0 and 1. A similarity score derivation step, where the closer to 1 the closer the legal provision is to the entered query, the more similar the legal provision is to the entered query; and
Based on the similarity score, the regulatory legal provisions related to the query are classified, a list listing a plurality of legal provisions is created according to the similarity score, and the regulatory score of the legal provisions with a preset number of higher similarity scores in the list is generated. A related regulatory law provision step of determining legal provisions corresponding to a regulatory score higher than the standard regulatory score calculated based on the regulatory legal provisions as regulatory legal provisions, and then providing the determined regulatory legal provisions to the user in the form of a list arranged in order according to preset conditions; Contains,
The similarity score derivation step is,
A keyword matching score derivation step of deriving a keyword matching score by inputting a query input from a user and a plurality of legal provisions stored in the database into a first inference model based on an artificial neural network;
A cosine similarity score deriving step of deriving a cosine similarity score between each legal provision stored in the database and a query input from a user;
Based on the keyword matching score and cosine similarity score for all legal provisions stored in the database, an intermediate score is derived for each legal provision, all legal provisions are listed in order of the intermediate score, and some legal provisions are selected among all legal provisions. Selecting them as candidate legal provisions according to preset conditions; and
The candidate legal provisions and the input query are entered into a second inference model based on an artificial neural network to derive a correlation score indicating the correlation between the candidate legal provisions and the input query, and the correlation score is calculated using a hard negative mixing method. It includes a correlation score derivation step derived based on self-supervised learning,
A computer-readable recording medium for deriving a similarity score for each of the plurality of legal provisions based on the keyword matching score, the cosine similarity score, and the relevance score.
KR1020230064699A 2023-05-19 2023-05-19 The Method And The Computer-Readable Recording Medium To Extract Regulatory Legal Provisions Associated With Inputted Query, And The Computing System Performing That Same KR102625553B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230064699A KR102625553B1 (en) 2023-05-19 2023-05-19 The Method And The Computer-Readable Recording Medium To Extract Regulatory Legal Provisions Associated With Inputted Query, And The Computing System Performing That Same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230064699A KR102625553B1 (en) 2023-05-19 2023-05-19 The Method And The Computer-Readable Recording Medium To Extract Regulatory Legal Provisions Associated With Inputted Query, And The Computing System Performing That Same

Publications (1)

Publication Number Publication Date
KR102625553B1 true KR102625553B1 (en) 2024-01-16

Family

ID=89719247

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230064699A KR102625553B1 (en) 2023-05-19 2023-05-19 The Method And The Computer-Readable Recording Medium To Extract Regulatory Legal Provisions Associated With Inputted Query, And The Computing System Performing That Same

Country Status (1)

Country Link
KR (1) KR102625553B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117829140A (en) * 2024-03-04 2024-04-05 证通股份有限公司 Automatic comparison method and system for regulations and regulations
CN117829140B (en) * 2024-03-04 2024-05-31 证通股份有限公司 Automatic comparison method and system for regulations and regulations

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180082035A (en) * 2017-01-09 2018-07-18 고려대학교 산학협력단 Server and method for content providing based on context information
KR20220122429A (en) 2021-02-26 2022-09-02 주식회사 까리용 Method, server and computer program for providing legal documents clustering search service using artificial intelligence
KR102491947B1 (en) * 2022-03-30 2023-01-27 주식회사 코딧 Apparatus and method for providing information on regulatory laws based on artificial intelligence learning
KR102519033B1 (en) * 2022-03-30 2023-04-07 주식회사 코딧 Artificial intelligence learning-based monitoring method for artificial intelligence learning-based laws and regulations and a program for this
KR102526211B1 (en) * 2023-01-17 2023-04-27 주식회사 코딧 The Method And The Computer-Readable Recording Medium To Extract Similar Legal Documents Or Parliamentary Documents For Inputted Legal Documents Or Parliamentary Documents, And The Computing System for Performing That Same

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180082035A (en) * 2017-01-09 2018-07-18 고려대학교 산학협력단 Server and method for content providing based on context information
KR20220122429A (en) 2021-02-26 2022-09-02 주식회사 까리용 Method, server and computer program for providing legal documents clustering search service using artificial intelligence
KR102491947B1 (en) * 2022-03-30 2023-01-27 주식회사 코딧 Apparatus and method for providing information on regulatory laws based on artificial intelligence learning
KR102519033B1 (en) * 2022-03-30 2023-04-07 주식회사 코딧 Artificial intelligence learning-based monitoring method for artificial intelligence learning-based laws and regulations and a program for this
KR102526211B1 (en) * 2023-01-17 2023-04-27 주식회사 코딧 The Method And The Computer-Readable Recording Medium To Extract Similar Legal Documents Or Parliamentary Documents For Inputted Legal Documents Or Parliamentary Documents, And The Computing System for Performing That Same

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117829140A (en) * 2024-03-04 2024-04-05 证通股份有限公司 Automatic comparison method and system for regulations and regulations
CN117829140B (en) * 2024-03-04 2024-05-31 证通股份有限公司 Automatic comparison method and system for regulations and regulations

Similar Documents

Publication Publication Date Title
JP5936698B2 (en) Word semantic relation extraction device
US11604926B2 (en) Method and system of creating and summarizing unstructured natural language sentence clusters for efficient tagging
US20150120738A1 (en) System and method for document classification based on semantic analysis of the document
US20160188568A1 (en) System and method for determining the meaning of a document with respect to a concept
US20230117206A1 (en) Computerized natural language processing with insights extraction using semantic search
CN107315798A (en) Structuring processing method and processing device based on multi-threaded semantic label information MAP
Mokammel et al. Automatic requirements extraction, analysis, and graph representation using an approach derived from computational linguistics
Anandarajan et al. Sentiment analysis of movie reviews using R
Zhu et al. LTL model checking based on binary classification of machine learning
Ratnayaka et al. Shift-of-perspective identification within legal cases
Dias et al. State of the Art in Artificial Intelligence applied to the Legal Domain
Kimelfeld Database principles in information extraction
Ramakrishnan et al. Using ilp to construct features for information extraction from semi-structured text
CN113554172A (en) Referee rule knowledge extraction method and system based on case text
CN113157887A (en) Knowledge question-answering intention identification method and device and computer equipment
KR102526211B1 (en) The Method And The Computer-Readable Recording Medium To Extract Similar Legal Documents Or Parliamentary Documents For Inputted Legal Documents Or Parliamentary Documents, And The Computing System for Performing That Same
KR102625553B1 (en) The Method And The Computer-Readable Recording Medium To Extract Regulatory Legal Provisions Associated With Inputted Query, And The Computing System Performing That Same
Nahshon et al. Incorporating information extraction in the relational database model
Al Otaibi et al. Machine learning and conceptual reasoning for inconsistency detection
KR102596842B1 (en) The Method And The Computer-Readable Medium To Generate Information-Hierarchical-Tree For Each Issue Containing Regulatory Information, And The Computing System Performing That Same
CN114328813A (en) Word standardization method, device, equipment and storage medium
Van Landeghem et al. HIGH‐PRECISION BIO‐MOLECULAR EVENT EXTRACTION FROM TEXT USING PARALLEL BINARY CLASSIFIERS
Povoda et al. Genetic optimization of big data sentiment analysis
Kang et al. A transfer learning algorithm for automatic requirement model generation
Kumar et al. Extraction of causality and related events using text analysis

Legal Events

Date Code Title Description
AMND Amendment
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant