KR102522954B1 - System and method for providing predictive information by artificial intelligence-based data analysis - Google Patents

System and method for providing predictive information by artificial intelligence-based data analysis Download PDF

Info

Publication number
KR102522954B1
KR102522954B1 KR1020220131780A KR20220131780A KR102522954B1 KR 102522954 B1 KR102522954 B1 KR 102522954B1 KR 1020220131780 A KR1020220131780 A KR 1020220131780A KR 20220131780 A KR20220131780 A KR 20220131780A KR 102522954 B1 KR102522954 B1 KR 102522954B1
Authority
KR
South Korea
Prior art keywords
keyword
data
analysis
information
learning model
Prior art date
Application number
KR1020220131780A
Other languages
Korean (ko)
Inventor
이동근
Original Assignee
이동근
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이동근 filed Critical 이동근
Priority to KR1020220131780A priority Critical patent/KR102522954B1/en
Application granted granted Critical
Publication of KR102522954B1 publication Critical patent/KR102522954B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

본 개시는 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템 및 방법에 관한 것으로, 적어도 하나의 입력데이터를 송신하고, 그에 대한 응답으로 예측정보를 수신하는 사용자 단말; 및 적어도 하나의 입력데이터가 수신되면, 인공지능 기반 제1 학습모델을 통해 기 구축된 데이터베이스를 기반으로 상기 적어도 하나의 입력데이터에 대한 적어도 하나의 유사키워드를 추출하여 제1 분석정보 및 제2 분석정보를 생성하고, 상기 제1 학습모델 및 제2 학습모델을 통해 웹 크롤링을 기반으로 상기 적어도 하나의 입력데이터에 대한 적어도 하나의 관련키워드를 추출하여 제3 분석정보를 생성한 후, 상기 제1 분석정보, 상기 제2 분석정보 및 상기 제3 분석정보를 포함하는 예측정보를 상기 사용자 단말로 송신하는 서버를 포함하며, 상기 제1 분석정보는, 상기 적어도 하나의 유사키워드 중 적어도 하나의 유전자키워드를 이용하여 생성되는 정보이고, 상기 제2 분석정보는, 상기 적어도 하나의 유사키워드에서 상기 적어도 하나의 유전자키워드를 제외한 나머지 키워드 중 기 설정된 조건을 만족하는 적어도 하나의 만족키워드를 이용하여 생성되는 정보일 수 있다.The present disclosure relates to a system and method for providing predictive information based on artificial intelligence-based data analysis, comprising: a user terminal that transmits at least one input data and receives predictive information in response thereto; and if at least one input data is received, at least one similar keyword for the at least one input data is extracted based on a database pre-established through the artificial intelligence-based first learning model to obtain first analysis information and second analysis information. After generating information, generating third analysis information by extracting at least one related keyword for the at least one input data based on web crawling through the first learning model and the second learning model, the first and a server configured to transmit prediction information including analysis information, the second analysis information, and the third analysis information to the user terminal, wherein the first analysis information includes at least one genetic keyword among the at least one similar keyword. and the second analysis information is information generated using at least one satisfactory keyword that satisfies a preset condition among keywords other than the at least one genetic keyword from the at least one similar keyword. can be

Description

인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템 및 방법{SYSTEM AND METHOD FOR PROVIDING PREDICTIVE INFORMATION BY ARTIFICIAL INTELLIGENCE-BASED DATA ANALYSIS}System and method for providing predictive information by artificial intelligence-based data analysis {SYSTEM AND METHOD FOR PROVIDING PREDICTIVE INFORMATION BY ARTIFICIAL INTELLIGENCE-BASED DATA ANALYSIS}

본 개시는 인공지능 기반 예측정보 제공 시스템 및 방법에 관한 것이다. 보다 상세하게는, 본 개시는 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템 및 방법에 관한 것이다.The present disclosure relates to an artificial intelligence-based predictive information providing system and method. More specifically, the present disclosure relates to a system and method for providing predictive information based on artificial intelligence-based data analysis.

일반적으로, 사용자가 키워드를 입력하면, 그 키워드를 포함하는 모든 데이터들을 데이터베이스 또는 웹 상에서 서치하여 제공하게 된다.Generally, when a user inputs a keyword, all data including the keyword is searched on a database or web and provided.

사용자는 그 제공된 데이터들을 일일이 확인하여 자신이 찾고자 하는 데이터에 해당하는지를 직접 판단하는 것은 물론, 그 데이터들을 각 카테고리 별로 직접 분류하여야 한다.The user has to check the provided data one by one to directly determine whether or not it corresponds to the data he or she is looking for, as well as to directly classify the data for each category.

그렇기 때문에, 사용자는 원하는 데이터를 획득하고, 이를 분류하기 위해 번거로운 작업을 수행해야하고, 그 작업에 많은 시간을 소요해야만 하므로, 시간적 및 경제적 낭비가 발생할 수밖에 없다.Therefore, since the user has to perform cumbersome work to obtain desired data and classify it, and spend a lot of time on the work, time and economic waste inevitably occurs.

따라서, 인공지능을 기반으로 사용자로부터 입력되는 입력데이터를 이용하여 원하는 키워드를 기 설정된 카테고리 별로 분류하고, 그에 대응하는 근거데이터와 함께 제공하도록 하고, 아울러 그 생성된 정보들을 데이터베이스 상에 구축하여 관리하도록 하는 기술이 개발될 필요가 있다.Therefore, based on artificial intelligence, by using the input data input from the user, the desired keyword is classified by preset category, provided along with the corresponding evidence data, and the generated information is built and managed on the database. technology needs to be developed.

한국등록특허공보 제10-1007613호 (등록일: 2011년 01월 05일)Korean Registered Patent Publication No. 10-1007613 (registration date: January 05, 2011)

본 개시에 개시된 실시예는 연구내용 또는 실험에 대한 데이터를 입력하면, 그 입력되는 데이터를 이용하여 적어도 하나의 근거데이트로부터 키워드들을 추출 또는 예측함으로써 생성된 예측정보는 물론, 각 키워드들 간 관계도를 제공함에 따라 유의성이 얼마나 있는지 출력해줄 수 있도록 하는 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템 및 방법을 제공하는 것이다.In the embodiments disclosed in the present disclosure, when data on research content or experiments is input, prediction information generated by extracting or predicting keywords from at least one evidence date using the input data, as well as the relationship between each keyword It is to provide a system and method for providing predictive information by artificial intelligence-based data analysis that can output how much significance there is by providing.

본 개시가 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The problems to be solved by the present disclosure are not limited to the problems mentioned above, and other problems not mentioned will be clearly understood by those skilled in the art from the description below.

상술한 기술적 과제를 달성하기 위한 본 개시에 일 측면에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템은, 적어도 하나의 입력데이터를 송신하고, 그에 대한 응답으로 예측정보를 수신하는 사용자 단말; 및 적어도 하나의 입력데이터가 수신되면, 인공지능 기반 제1 학습모델을 통해 기 구축된 데이터베이스를 기반으로 상기 적어도 하나의 입력데이터에 대한 적어도 하나의 유사키워드를 추출하여 제1 분석정보 및 제2 분석정보를 생성하고, 상기 제1 학습모델 및 제2 학습모델을 통해 웹 크롤링을 기반으로 상기 적어도 하나의 입력데이터에 대한 적어도 하나의 관련키워드를 추출하여 제3 분석정보를 생성한 후, 상기 제1 분석정보, 상기 제2 분석정보 및 상기 제3 분석정보를 포함하는 예측정보를 상기 사용자 단말로 송신하는 서버를 포함하며, 상기 제1 분석정보는, 상기 적어도 하나의 유사키워드 중 적어도 하나의 유전자키워드를 이용하여 생성되는 정보이고, 상기 제2 분석정보는, 상기 적어도 하나의 유사키워드에서 상기 적어도 하나의 유전자키워드를 제외한 나머지 키워드 중 기 설정된 조건을 만족하는 적어도 하나의 만족키워드를 이용하여 생성되는 정보일 수 있다.A system for providing prediction information by artificial intelligence-based data analysis according to an aspect of the present disclosure for achieving the above technical problem includes a user terminal that transmits at least one input data and receives prediction information in response thereto; and if at least one input data is received, at least one similar keyword for the at least one input data is extracted based on a database pre-established through the artificial intelligence-based first learning model to obtain first analysis information and second analysis information. After generating information, generating third analysis information by extracting at least one related keyword for the at least one input data based on web crawling through the first learning model and the second learning model, the first and a server configured to transmit prediction information including analysis information, the second analysis information, and the third analysis information to the user terminal, wherein the first analysis information includes at least one genetic keyword among the at least one similar keyword. and the second analysis information is information generated using at least one satisfactory keyword that satisfies a preset condition among keywords other than the at least one genetic keyword from the at least one similar keyword. can be

또한, 본 개시에 일 측면에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 방법은, 사용자 단말로부터 적어도 하나의 입력데이터가 수신되면, 인공지능 기반 제1 학습모델을 통해 기 구축된 데이터베이스를 기반으로 상기 적어도 하나의 입력데이터에 대한 적어도 하나의 유사키워드를 추출하는 단계; 상기 적어도 하나의 유사키워드를 기반으로 제1 분석정보 및 제2 분석정보를 생성하는 단계; 상기 제1 학습모델 및 제2 학습모델을 통해 웹 크롤링을 기반으로 상기 적어도 하나의 입력데이터에 대한 적어도 하나의 관련키워드를 추출하여 제3 분석정보를 생성하는 단계; 상기 제1 분석정보, 상기 제2 분석정보 및 상기 제3 분석정보를 포함하는 예측정보를 상기 사용자 단말로 송신하는 단계를 포함하며, 상기 제1 분석정보는, 상기 적어도 하나의 유사키워드 중 적어도 하나의 유전자키워드를 이용하여 생성되는 정보이고, 상기 제2 분석정보는, 상기 적어도 하나의 유사키워드에서 상기 적어도 하나의 유전자키워드를 제외한 나머지 키워드 중 기 설정된 조건을 만족하는 적어도 하나의 만족키워드를 이용하여 생성되는 정보일 수 있다.In addition, a method for providing predictive information by artificial intelligence-based data analysis according to an aspect of the present disclosure, when at least one input data is received from a user terminal, based on a database previously built through an artificial intelligence-based first learning model extracting at least one similar keyword for the at least one input data; generating first analysis information and second analysis information based on the at least one similar keyword; generating third analysis information by extracting at least one related keyword for the at least one input data based on web crawling through the first learning model and the second learning model; and transmitting prediction information including the first analysis information, the second analysis information, and the third analysis information to the user terminal, wherein the first analysis information includes at least one of the at least one similar keyword. The second analysis information is information generated using a genetic keyword of, and the second analysis information is obtained by using at least one satisfying keyword that satisfies a predetermined condition among keywords excluding the at least one genetic keyword from the at least one similar keyword. It may be generated information.

이 외에도, 본 개시를 구현하기 위한 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램이 더 제공될 수 있다.In addition to this, a computer program stored in a computer readable recording medium for executing a method for implementing the present disclosure may be further provided.

이 외에도, 본 개시를 구현하기 위한 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공될 수 있다.In addition to this, a computer readable recording medium recording a computer program for executing a method for implementing the present disclosure may be further provided.

본 개시의 전술한 과제 해결 수단에 의하면, 연구내용 또는 실험에 대한 데이터를 입력하면, 그 입력되는 데이터를 이용하여 적어도 하나의 근거데이트로부터 키워드들을 추출 또는 예측함으로써 생성된 예측정보는 물론, 각 키워드들 간 관계도를 제공함에 따라 유의성이 얼마나 있는지 출력해줄 수 있도록 한다.According to the above-described problem solving means of the present disclosure, when data on research content or experiments is input, prediction information generated by extracting or predicting keywords from at least one evidence data using the input data, as well as each keyword By providing a relationship between them, it is possible to output how much significance there is.

본 개시의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The effects of the present disclosure are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the description below.

도 1은 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템의 네트워크 구조를 나타내는 도면
도 2는 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 방법을 나타내는 흐름도
도 3은 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템에서 서버의 구성을 나타내는 도면
도 4는 본 개시의 일 실시예에 따라 적어도 하나의 입력데이터를 기반으로 생성되는 제1 분석정보, 제2 분석정보 및 제3 분석정보의 구성을 나타내는 도면
도 5는 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 방법을 나타내는 순서도
도 6은 본 개시의 제1 실시예에 따라 제1 분석정보를 생성하는 동작을 나타내는 순서도
도 7은 본 개시의 제1 실시예에 따라 제2 분석정보를 생성하는 동작을 나타내는 순서도
도 8은 본 개시의 제1 실시예에 따라 제3 분석정보를 생성하는 동작을 나타내는 순서도
도 9는 본 개시의 제2 실시예에 따라 제1 분석정보를 생성하는 동작을 나타내는 순서도
도 10은 본 개시의 제2 실시예에 따라 제2 분석정보를 생성하는 동작을 나타내는 순서도
도 11은 본 개시의 제2 실시예에 따라 제3 분석정보를 생성하는 동작을 나타내는 순서도
도 12는 본 개시의 제3 실시예에 따라 제3 분석정보를 생성하는 동작을 나타내는 순서도
도 13은 본 개시의 제1 실시예에 따라 입력데이터로서 단일 키워드가 수신된 경우에 생성되는 관계도의 일 예를 나타내는 도면
도 14는 본 개시의 제2 실시예에 따라 입력데이터로서 단일 키워드가 수신된 경우에 생성되는 관계도의 일 예를 나타내는 도면
도 15는 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 시스템의 네트워크 구조를 나타내는 도면
도 16은 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 방법을 나타내는 흐름도
도 17은 본 개시의 일 실시예에 따른 분석세트의 구성을 나타내는 도면
도 18은 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 방법에서 공개분석세트의 존재 여부에 따라 예측정보를 생성하는 구체적인 동작을 나타내는 도면
도 19은 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 방법에서 적어도 하나의 입력키워드 및 공개분석세트에 포함된 적어도 하나의 분석키워드 간 동일 여부에 따라 예측정보를 생성하는 구체적인 동작을 나타내는 도면
도 20은 본 개시의 일 실시예에 따라 각각 하나의 단일 키워드를 포함하는 분석세트들 간의 관계를 나타내는 관계도의 일 예를 나타내는 도면
도 21은 본 개시의 일 실시예에 따라 입력데이터로서 각각 복수의 키워드를 포함하는 분석세트들 간의 관계를 나타내는 관계도의 일 예를 나타내는 도면
1 is a diagram showing a network structure of a system for providing prediction information based on artificial intelligence-based data analysis according to an embodiment of the present disclosure.
2 is a flowchart illustrating a method of providing prediction information by artificial intelligence-based data analysis according to an embodiment of the present disclosure.
3 is a diagram showing the configuration of a server in a system for providing prediction information based on artificial intelligence-based data analysis according to an embodiment of the present disclosure.
4 is a diagram showing the configuration of first analysis information, second analysis information, and third analysis information generated based on at least one input data according to an embodiment of the present disclosure;
5 is a flowchart illustrating a method of providing prediction information by artificial intelligence-based data analysis according to an embodiment of the present disclosure.
6 is a flowchart illustrating an operation of generating first analysis information according to a first embodiment of the present disclosure.
7 is a flowchart illustrating an operation of generating second analysis information according to a first embodiment of the present disclosure;
8 is a flowchart illustrating an operation of generating third analysis information according to the first embodiment of the present disclosure.
9 is a flowchart illustrating an operation of generating first analysis information according to a second embodiment of the present disclosure.
10 is a flowchart illustrating an operation of generating second analysis information according to a second embodiment of the present disclosure.
11 is a flowchart illustrating an operation of generating third analysis information according to a second embodiment of the present disclosure.
12 is a flowchart illustrating an operation of generating third analysis information according to a third embodiment of the present disclosure.
13 is a diagram illustrating an example of a relationship diagram generated when a single keyword is received as input data according to the first embodiment of the present disclosure.
14 is a diagram showing an example of a relationship diagram generated when a single keyword is received as input data according to the second embodiment of the present disclosure.
15 is a diagram showing a network structure of an artificial intelligence-based database management system according to an embodiment of the present disclosure.
16 is a flowchart illustrating an artificial intelligence-based database management method according to an embodiment of the present disclosure.
17 is a diagram showing the configuration of an analysis set according to an embodiment of the present disclosure
18 is a diagram illustrating a specific operation of generating prediction information according to whether an open analysis set exists in an artificial intelligence-based database management method according to an embodiment of the present disclosure.
19 is a diagram illustrating a specific operation of generating prediction information according to whether at least one input keyword and at least one analysis keyword included in an open analysis set are identical in an artificial intelligence-based database management method according to an embodiment of the present disclosure.
20 is a diagram showing an example of a relationship diagram showing a relationship between analysis sets each including one single keyword according to an embodiment of the present disclosure;
21 is a diagram showing an example of a relationship diagram showing a relationship between analysis sets each including a plurality of keywords as input data according to an embodiment of the present disclosure;

본 개시의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 개시는 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 개시가 완전하도록 하고, 본 개시가 속하는 기술 분야의 통상의 기술자에게 본 개시의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 개시는 청구항의 범주에 의해 정의될 뿐이다.Advantages and features of the present disclosure, and methods of achieving them, will become clear with reference to the embodiments described below in detail in conjunction with the accompanying drawings. However, the present disclosure is not limited to the embodiments disclosed below and may be implemented in various different forms, only the present embodiments are intended to make the present disclosure complete, and to those skilled in the art to which the present disclosure belongs. It is provided to fully inform the scope of the disclosure, which is only defined by the scope of the claims.

본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 개시를 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 개시의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.Terminology used herein is for describing the embodiments and is not intended to limit the present disclosure. In this specification, singular forms also include plural forms unless specifically stated otherwise in a phrase. As used herein, "comprises" and/or "comprising" does not exclude the presence or addition of one or more other elements other than the recited elements. Like reference numerals throughout the specification refer to like elements, and “and/or” includes each and every combination of one or more of the recited elements. Although "first", "second", etc. are used to describe various components, these components are not limited by these terms, of course. These terms are only used to distinguish one component from another. Accordingly, it goes without saying that the first element mentioned below may also be the second element within the technical spirit of the present disclosure.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 개시가 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.Unless otherwise defined, all terms (including technical and scientific terms) used in this specification may be used with meanings commonly understood by those skilled in the art to which this disclosure belongs. In addition, terms defined in commonly used dictionaries are not interpreted ideally or excessively unless explicitly specifically defined.

본 개시 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 개시가 실시예들의 모든 요소들을 설명하는 것은 아니며, 본 개시가 속하는 기술분야에서 일반적인 내용 또는 실시예들 간에 중복되는 내용은 생략한다. 명세서에서 사용되는 "부" 또는 “모듈”이라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부" 또는 “모듈”은 어떤 역할들을 수행한다. 그렇지만 "부" 또는 “모듈”은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부" 또는 “모듈”은 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부" 또는 “모듈”은 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부" 또는 “모듈”들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부" 또는 “모듈”들로 결합되거나 추가적인 구성요소들과 "부" 또는 “모듈”들로 더 분리될 수 있다.Like reference numbers designate like elements throughout this disclosure. The present disclosure does not describe all elements of the embodiments, and general content or overlapping content between the embodiments in the technical field to which the present disclosure belongs is omitted. The term "unit" or "module" used in the specification means a hardware component such as software, FPGA or ASIC, and "unit" or "module" performs certain roles. However, "unit" or "module" is not meant to be limited to software or hardware. A “unit” or “module” may be configured to reside in an addressable storage medium and may be configured to reproduce one or more processors. Thus, as an example, a “unit” or “module” may refer to components such as software components, object-oriented software components, class components, and task components, processes, functions, properties, procedures, subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays and variables. Functions provided within components and "units" or "modules" may be combined into smaller numbers of components and "units" or "modules" or may be combined into additional components and "units" or "modules". can be further separated.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 간접적으로 연결되어 있는 경우를 포함하고, 간접적인 연결은 무선 통신망을 통해 연결되는 것을 포함한다.Throughout the specification, when a part is said to be "connected" to another part, this includes not only the case of being directly connected but also the case of being indirectly connected, and indirect connection includes being connected through a wireless communication network. do.

또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.In addition, when a certain component is said to "include", this means that it may further include other components without excluding other components unless otherwise stated.

명세서 전체에서, 어떤 부재가 다른 부재 "상에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.Throughout the specification, when a member is said to be located “on” another member, this includes not only a case where a member is in contact with another member, but also a case where another member exists between the two members.

제1, 제2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위해 사용되는 것으로, 구성요소가 전술된 용어들에 의해 제한되는 것은 아니다. Terms such as first and second are used to distinguish one component from another, and the components are not limited by the aforementioned terms.

단수의 표현은 문맥상 명백하게 예외가 있지 않는 한, 복수의 표현을 포함한다.Expressions in the singular number include plural expressions unless the context clearly dictates otherwise.

각 단계들에 있어 식별부호는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다. In each step, the identification code is used for convenience of description, and the identification code does not explain the order of each step, and each step may be performed in a different order from the specified order unless a specific order is clearly described in context. there is.

이하 설명에서 사용되는 용어에 대하여 정의하면 하기와 같다.Terms used in the following description are defined as follows.

본 개시를 설명함에 있어서, 서버로 한정하였으나, 컴퓨터 및/또는 휴대용 단말기를 더 포함하거나, 또는 그 중 어느 하나의 형태가 될 수 있다.In the description of the present disclosure, although limited to a server, it may further include a computer and/or a portable terminal, or may be in the form of any one of them.

여기에서, 상기 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop), 태블릿 PC, 슬레이트 PC 등을 포함할 수 있다.Here, the computer may include, for example, a laptop computer, a desktop computer, a laptop computer, a tablet PC, a slate PC, and the like equipped with a web browser.

상기 서버는 외부 장치와 통신을 수행하여 정보를 처리하는 서버로써, 애플리케이션 서버, 컴퓨팅 서버, 데이터베이스 서버, 파일 서버, 게임 서버, 메일 서버, 프록시 서버 및 웹 서버 등을 포함할 수 있다.The server is a server that processes information by communicating with an external device, and may include an application server, a computing server, a database server, a file server, a game server, a mail server, a proxy server, and a web server.

상기 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), WiBro(Wireless Broadband Internet) 단말, 스마트 폰(Smart Phone) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치와 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD) 등과 같은 웨어러블 장치를 포함할 수 있다.The portable terminal is, for example, a wireless communication device that ensures portability and mobility, and includes a Personal Communication System (PCS), a Global System for Mobile communications (GSM), a Personal Digital Cellular (PDC), a Personal Handyphone System (PHS), and a PDA. (Personal Digital Assistant), IMT (International Mobile Telecommunication)-2000, CDMA (Code Division Multiple Access)-2000, W-CDMA (W-Code Division Multiple Access), WiBro (Wireless Broadband Internet) terminal, smart phone ) and wearable devices such as watches, rings, bracelets, anklets, necklaces, glasses, contact lenses, or head-mounted-devices (HMDs). can include

이하 첨부된 도면들을 참고하여 본 개시의 작용 원리 및 실시예들에 대해 설명한다.Hereinafter, the working principle and embodiments of the present disclosure will be described with reference to the accompanying drawings.

도 1은 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템의 네트워크 구조를 나타내는 도면이다.1 is a diagram showing a network structure of a system for providing prediction information based on artificial intelligence-based data analysis according to an embodiment of the present disclosure.

도 1을 참조하면, 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템(이하, '에측정보 제공 시스템'이라 칭함)(10)은 서버(100) 및 사용자 단말(200)을 포함할 수 있다. Referring to FIG. 1 , a system for providing prediction information based on artificial intelligence-based data analysis (hereinafter referred to as 'system for providing prediction information') 10 may include a server 100 and a user terminal 200.

서버(100)는 사용자 단말(200)로부터 적어도 하나로부터 입력데이터가 수신되면, 인공지능 기반 제1 학습모델을 이용하여 기 구축된 데이터베이스를 기반으로 적어도 하나의 입력데이터에 대한 적어도 하나의 유사키워드를 추출하여 제1 분석정보 및 제2 분석정보를 생성한다. 또한, 서버(100)는 제1 학습모델 및 제2 학습모델을 이용하여 웹 크롤링을 기반으로 적어도 하나의 입력데이터에 대한 적어도 하나의 관련키워드를 추출하여 제3 분석정보를 생성한 후, 제1 분석정보 내지 제3 분석정보를 이용하여 예측정보를 생성한다. 이후, 서버(100)는 사용자 단말(200)로 그 예측정보를 송신한다. 여기서, 제1 학습모델은 LSTM(Long short-term memory), BERT(Bidirectional encoder representations form transformers) 기반 자연어 처리(Natural Language Processing, NLP) 방식을 이용할 수 있고, 제2 학습모델은 코사인 유사도, 자카드 유사도, 맨하탄 유사도, 유클리드 거리 및 마할라노비스 거리 중 적어도 하나를 이용할 수 있다. 구체적으로, 제1 분석정보 내지 제3 분석정보를 생성함에 있어서, 제1 학습모델을 통해 키워드를 추출하고, 제2 학습모델을 통해 유사도를 산출한다.When the server 100 receives at least one input data from the user terminal 200, the server 100 generates at least one similar keyword for at least one input data based on a database previously constructed using the artificial intelligence-based first learning model. By extracting, first analysis information and second analysis information are generated. In addition, the server 100 extracts at least one related keyword for at least one input data based on web crawling using the first learning model and the second learning model to generate third analysis information, and then first Prediction information is generated using the analysis information to the third analysis information. After that, the server 100 transmits the prediction information to the user terminal 200 . Here, the first learning model may use a natural language processing (NLP) method based on long short-term memory (LSTM) and bidirectional encoder representations form transformers (BERT), and the second learning model is cosine similarity, jacquard similarity , at least one of Manhattan similarity, Euclidean distance, and Mahalanobis distance may be used. Specifically, in generating the first to third analysis information, keywords are extracted through the first learning model and similarities are calculated through the second learning model.

사용자 단말(200)은 예측정보를 제공받고자 하는 사용자의 단말로서, 적어도 하나의 입력데이터를 서버(100)로 송신함으로써, 그 적어도 하나의 입력데이터에 대한 예측정보의 제공을 요청할 수 있다. 그 요청에 따라 사용자 단말(200)은 서버(100)로부터 예측정보를 수신한다.The user terminal 200 is a terminal of a user who wants to receive prediction information, and can request provision of prediction information for the at least one input data by transmitting at least one input data to the server 100 . According to the request, the user terminal 200 receives prediction information from the server 100 .

이때, 도 1에서는 사용자 단말(200)을 하나만 도시하였으나, 적어도 하나 이상일 수 있으며, 그 개수를 한정하지 않는다. 다만, 이하에서 도 1 내지 도 14를 설명함에 있어서는 그 설명의 편의를 위하여 서버(100)가 사용자 단말(200)로 예측정보를 제공하는 경우로 한정하여 설명하도록 한다.In this case, although only one user terminal 200 is shown in FIG. 1 , at least one may be used, and the number is not limited. However, in the following description of FIGS. 1 to 14 , for convenience of description, the description will be limited to the case where the server 100 provides prediction information to the user terminal 200 .

도 2는 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 방법을 나타내는 흐름도이다.2 is a flowchart illustrating a method of providing prediction information by artificial intelligence-based data analysis according to an embodiment of the present disclosure.

도 2를 참조하면, 사용자는 사용자 단말(200)를 통해 적어도 하나의 입력데이터를 입력하여 서버(100)로 송신한다(S101).Referring to FIG. 2 , the user inputs at least one input data through the user terminal 200 and transmits it to the server 100 (S101).

서버(100)는 사용자 단말(200)로부터 적어도 하나의 입력데이터가 수신되면, 그 적어도 하나의 입력데이터를 인공지능 기반 제1 학습모델에 입력함으로써, 제1 분석정보 내지 제3 분석정보를 생성한다.When at least one input data is received from the user terminal 200, the server 100 generates first to third analysis information by inputting the at least one input data to the artificial intelligence-based first learning model. .

구체적으로, 서버(100)는 적어도 하나의 입력데이터에 대한 적어도 하나의 유사키워드를 추출하여 제1 분석정보를 생성한 후(S103), 제2 분석정보를 생성한다(S105). 그 다음으로, 서버(100)는 웹 크롤링을 기반으로 적어도 하나의 입력데이터에 대한 적어도 하나의 관련키워드를 추출하여 제3 분석정보를 생성한 다(S107). 그러나, 이는 하나의 실시예일 뿐, S103 단계 내지 S107 단계는 동시에 수행될 수 있으며 그 생성되는 순서는 변경 가능하다.Specifically, the server 100 generates first analysis information by extracting at least one similar keyword for at least one input data (S103), and then generates second analysis information (S105). Next, the server 100 generates third analysis information by extracting at least one related keyword for at least one input data based on web crawling (S107). However, this is just one embodiment, and steps S103 to S107 may be performed simultaneously and the order in which they are generated may be changed.

그 다음으로, 서버(100)는 S103 단계 내지 S107 단계에 의해 생성된 제1 분석정보, 제2 분석정보 및 제3 분석정보를 이용하여 예측정보를 생성한다.Next, the server 100 generates prediction information using the first analysis information, the second analysis information, and the third analysis information generated by steps S103 to S107.

도 3은 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템에서 서버의 구성을 나타내는 도면이다.3 is a diagram showing the configuration of a server in a system for providing prediction information based on artificial intelligence-based data analysis according to an embodiment of the present disclosure.

도 3을 참조하면, 본 개시의 일 실시예에 따른 서버(100)는 통신모듈(110), 저장모듈(130) 및 제어모듈(150)을 포함할 수 있다.Referring to FIG. 3 , the server 100 according to an embodiment of the present disclosure may include a communication module 110, a storage module 130, and a control module 150.

통신모듈(110)은 외부 장치와 통신을 가능하게 하는 하나 이상의 구성 요소를 포함할 수 있으며, 예를 들어, 유선 통신 모듈, 무선 통신 모듈 및 근거리 통신 모듈 중 적어도 하나를 포함할 수 있으며, 이를 기반으로 신호를 송수신하도록 한다.The communication module 110 may include one or more components enabling communication with an external device, and may include, for example, at least one of a wired communication module, a wireless communication module, and a short-distance communication module. to transmit and receive signals.

여기서, 유선 통신 모듈은, 지역 통신(Local Area Network; LAN) 모듈, 광역 통신(Wide Area Network; WAN) 모듈 또는 부가가치 통신(Value Added Network; VAN) 모듈 등 다양한 유선 통신 모듈뿐만 아니라, USB(Universal Serial Bus), HDMI(High Definition Multimedia Interface), DVI(Digital Visual Interface), RS-232(recommended standard), 전력선 통신, 또는 POTS(plain old telephone service) 등 다양한 케이블 통신 모듈을 포함할 수 있다. Here, the wired communication module includes not only various wired communication modules such as a Local Area Network (LAN) module, a Wide Area Network (WAN) module, or a Value Added Network (VAN) module, but also a Universal Serial Bus (USB) module. Serial Bus), High Definition Multimedia Interface (HDMI), Digital Visual Interface (DVI), recommended standard (RS-232), power line communication, or plain old telephone service (POTS).

무선 통신 모듈은 와이파이(Wifi) 모듈, 와이브로(Wireless broadband) 모듈 외에도, GSM(global System for Mobile Communication), CDMA(Code Division Multiple Access), WCDMA(Wideband Code Division Multiple Access), UMTS(universal mobile telecommunications system), TDMA(Time Division Multiple Access), WLAN(Wireless LAN), DLNA(Digital Living Network Alliance), WiBro(Wireless Broadband), WiMAX(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access), HSUPA(High Speed Uplink Packet Access), LTE(Long Term Evolution), 4G, 5G, 6G 등 다양한 무선 통신 방식을 지원하는 무선 통신 모듈을 포함할 수 있다.In addition to the WiFi module and the WiBro module, wireless communication modules include global system for mobile communication (GSM), code division multiple access (CDMA), wideband code division multiple access (WCDMA), and universal mobile telecommunications system (UMTS). ), Time Division Multiple Access (TDMA), Wireless LAN (WLAN), Digital Living Network Alliance (DLNA), Wireless Broadband (WiBro), World Interoperability for Microwave Access (WiMAX), High Speed Downlink Packet Access (HSDPA), HSUPA ( It may include a wireless communication module supporting various wireless communication schemes such as High Speed Uplink Packet Access), Long Term Evolution (LTE), 4G, 5G, and 6G.

근거리 통신 모듈은 근거리 통신(Short range communication)을 위한 것으로서, 블루투스(Bluetooth??), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee, NFC(Near Field Communication), Wi-Fi(Wireless-Fidelity), Wi-Fi Direct, Wireless USB(Wireless Universal Serial Bus) 기술 중 적어도 하나를 이용하여, 근거리 통신을 지원할 수 있다.The short-range communication module is for short-range communication, and includes Bluetooth (Bluetooth??), RFID (Radio Frequency Identification), infrared data association (IrDA), UWB (Ultra Wideband), ZigBee, NFC (Near Field Communication), Wi-Fi (Wireless-Fidelity), Wi-Fi Direct, and wireless USB (Wireless Universal Serial Bus) technology may be used to support short-distance communication.

저장모듈(130)은 서버(100)의 다양한 기능을 지원하는 데이터 및/또는 각종 정보들을 저장한다. 서버(100)에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application)), 서버(100)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 외부 서버로부터 다운로드 될 수 있다. 한편, 응용 프로그램은, 저장모듈(130)에 구비된 적어도 하나의 메모리에 저장되고, 서버(100) 상에 설치되어, 제어모듈(150)에 구비된 적어도 하나의 프로세서에 의하여 동작(또는 기능)을 수행하도록 구동될 수 있다.The storage module 130 stores data and/or various information supporting various functions of the server 100 . A plurality of application programs (application programs or applications) running in the server 100, data for operation of the server 100, and commands may be stored. At least some of these application programs may be downloaded from an external server through wireless communication. Meanwhile, the application program is stored in at least one memory provided in the storage module 130, installed on the server 100, and operated (or functions) by at least one processor provided in the control module 150. can be driven to do.

한편, 적어도 하나의 메모리는 플래시 메모리 타입(flash memory type), 하드 디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory) 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 아울러, 메모리는 일시적, 영구적 또는 반영구적으로 정보를 저장할 수 있으며, 내장형 또는 탈착형으로 제공될 수 있다.Meanwhile, the at least one memory is a flash memory type, a hard disk type, a multimedia card micro type, or a card type memory (for example, SD or XD memory). , RAM (Random Access Memory, RAM), SRAM (Static Random Access Memory), ROM (Read-Only Memory, ROM), EEPROM (Electrically Erasable Programmable Read-Only Memory), PROM (Programmable Read-Only Memory) magnetic memory, It may include a storage medium of at least one type of a magnetic disk and an optical disk. In addition, the memory may store information temporarily, permanently or semi-permanently, and may be provided in a built-in or removable type.

저장모듈(130)은 인공지능을 활용한 데이터 분석을 통해 예측정보를 제공하기 위한 데이터베이스를 구축하여 구비할 수 있다.The storage module 130 may build and have a database for providing prediction information through data analysis using artificial intelligence.

제어모듈(150)은 적어도 하나의 프로세서를 구비할 수 있으며, 서버(100) 내 모든 구성들을 제어하여 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나, 적어도 하나의 메모리에 저장된 명령어, 알고리즘, 응용 프로그램을 실행하여 각종 프로세스를 수행하며, 인공지능을 활용한 데이터 분석을 통해 예측정보를 제공하거나, 데이터베이스를 관리하기 위한 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.The control module 150 may include at least one processor, and controls all components in the server 100 to process input or output signals, data, information, etc., or to process commands, algorithms, and the like stored in at least one memory. It can execute various processes by executing application programs, provide prediction information through data analysis using artificial intelligence, or provide or process appropriate information or functions for database management.

구체적으로, 제어모듈(150)은, 사용자 단말(200)로부터 적어도 하나의 입력데이터가 수신되면, 그 적어도 하나의 입력데이터를 인공지능 기반 제1 학습모델에 입력함으로써, 제1 분석정보 내지 제3 분석정보를 생성하여 예측정보를 생성한다.Specifically, when at least one input data is received from the user terminal 200, the control module 150 inputs the at least one input data to the artificial intelligence-based first learning model, thereby providing first analysis information to third analysis information. Analysis information is generated to generate prediction information.

이 제어모듈(150)이 제1 분석정보 내지 제3 분석정보를 생성하는 동작에 대해서는 이하의 도 5 내지 도 12를 기반으로 구체적으로 설명하도록 한다. 그에 앞서, 도 4를 기반으로 제1 분석정보 내지 제3 분석정보의 구성에 대해 설명하도록 한다.An operation of generating the first to third analysis information by the control module 150 will be described in detail with reference to FIGS. 5 to 12 below. Prior to that, the configuration of the first to third analysis information will be described based on FIG. 4 .

도 4는 본 개시의 일 실시예에 따라 적어도 하나의 입력데이터를 기반으로 생성되는 제1 분석정보, 제2 분석정보 및 제3 분석정보의 구성을 나타내는 도면이다.4 is a diagram illustrating configurations of first analysis information, second analysis information, and third analysis information generated based on at least one piece of input data according to an embodiment of the present disclosure.

서버(100)는 적어도 하나의 입력키워드(110)를 이용하여 기 구축된 데이터베이스 상에서 적어도 하나의 유사키워드(111)를 추출하고, 또한 웹 크롤링을 통해 웹 상에서 적어도 하나의 관련키워드(112)를 추출한다.The server 100 extracts at least one similar keyword 111 from a pre-built database using at least one input keyword 110, and also extracts at least one related keyword 112 from the web through web crawling. do.

이후, 서버(100)는 적어도 하나의 유사키워드(111)로부터 적어도 하나의 유전자키워드를 추출하여 제1 키워드리스트(1211)를 생성하고, 적어도 하나의 유사키워드(111)에서 적어도 하나의 유전자키워드를 제외한 나머지 키워드 중 기 설정된 조건을 만족하는 적어도 하나의 만족키워드를 추출하여 제2 키워드리스트(1221)를 생성한다. 이때, 유전자키워드는 유전자명일 수 있고, 기 설정된 조건은 사용자가 데이터 분석에 이용하고자 하는 키워드가 추출될 수 있도록 설정하는 조건으로서 특정 기술분야 등이 될 수 있다. 예를 들어, 기 설정된 조건은 생물학분야에 대한 키워드로서, 질병, 약물, 주제어, 미생물 등에 해당할 수 있다.Thereafter, the server 100 generates a first keyword list 1211 by extracting at least one genetic keyword from at least one similar keyword 111, and extracts at least one genetic keyword from the at least one similar keyword 111. A second keyword list 1221 is created by extracting at least one satisfactory keyword that satisfies a preset condition among the remaining keywords. In this case, the gene keyword may be a gene name, and the predetermined condition may be a specific technical field as a condition set so that a keyword that the user wants to use for data analysis can be extracted. For example, the preset conditions are keywords for the field of biology and may correspond to diseases, drugs, key words, microorganisms, and the like.

즉, 제1 키워드리스트(1211)는 적어도 하나의 유사키워드(111)로부터 추출된 적어도 하나의 유전자키워드를 리스트 형태로 생성한 것이고, 제2 키워드리스트(1221)는 적어도 하나의 유사키워드(111)로부터 추출된 적어도 하나의 만족키워드를 리스트 형태로 생성한 것이다.That is, the first keyword list 1211 is generated by generating at least one genetic keyword extracted from at least one similar keyword 111 in the form of a list, and the second keyword list 1221 includes at least one similar keyword 111 At least one satisfaction keyword extracted from is created in the form of a list.

한편, 서버(100)는 적어도 하나의 관련키워드(112)로부터 적어도 하나의 유전자키워드를 추출하여 제1 예측데이터(1231)를 생성하고, 적어도 하나의 관련키워드(112)에서 적어도 하나의 유전자키워드를 제외한 나머지 키워드 중 기 설정된 조건을 만족하는 적어도 하나의 만족키워드를 추출하여 제2 예측데이터(1232)를 생성한다.Meanwhile, the server 100 extracts at least one genetic keyword from at least one related keyword 112 to generate first prediction data 1231, and extracts at least one genetic keyword from at least one related keyword 112. Second prediction data 1232 is generated by extracting at least one satisfactory keyword that satisfies a preset condition among the remaining keywords.

즉, 제1 예측데이터(1231)는 적어도 하나의 관련키워드(112)로부터 추출된 적어도 하나의 유전자키워드를 리스트 형태로 생성한 것이고, 제1 예측데이터(1232)는 적어도 하나의 관련키워드(112)로부터 추출된 적어도 하나의 만족키워드를 리스트 형태로 생성한 것이다.That is, the first prediction data 1231 is generated by generating at least one genetic keyword extracted from at least one related keyword 112 in the form of a list, and the first prediction data 1232 includes at least one related keyword 112 At least one satisfaction keyword extracted from is created in the form of a list.

한편, 서버(100)는 적어도 하나의 입력데이터(110)의 형태에 따라 제3 예측데이터(1233)를 더 생성하여 제3 분석정보에 포함시킬 수 있다. 이때, 제3 예측데이터(1233)는 적어도 하나의 입력데이터(110)를 이용하여 웹 크롤링을 통해 웹 상에서 추출되는 적어도 하나의 유사문장을 이용하여 생성되는 데이터이다. 구체적으로, 제3 예측데이터(1233)는 적어도 하나의 유사문장을 리스트 형태로 생성한 문장리스트 및 그 적어도 하나의 유사문장을 제3 학습모델에 입력하여 생성된 새로운 문장을 포함한다.Meanwhile, the server 100 may further generate third prediction data 1233 according to the shape of at least one input data 110 and include it in the third analysis information. In this case, the third prediction data 1233 is data generated using at least one similar sentence extracted from the web through web crawling using at least one input data 110 . Specifically, the third prediction data 1233 includes a sentence list in which at least one similar sentence is generated in the form of a list and a new sentence generated by inputting the at least one similar sentence to the third learning model.

한편, 제1 키워드리스트, 제2 키워드리스트, 제1 예측데이터, 제2 예측데이터 및 제3 예측데이터에 각각 포함되는 키워드들은 기 설정된 우선순위를 기반으로 정렬되며, 그 각각의 키워드에 대응하는 근거데이터를 함께 병기할 수 있다. 이때, 근거데이터는 각종 학술 논문, 저서, 프로젝트 등일 수 있다.Meanwhile, the keywords included in the first keyword list, the second keyword list, the first prediction data, the second prediction data, and the third prediction data, respectively, are sorted based on preset priorities, and the basis corresponding to each keyword Data can be written together. At this time, the evidence data may be various academic papers, books, projects, and the like.

도 5는 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 방법을 나타내는 순서도로서, 예측정보 제공 시스템(10)의 서버(100)에서 수행되는 동작이다.5 is a flowchart illustrating a method of providing predictive information by artificial intelligence-based data analysis according to an embodiment of the present disclosure, which is an operation performed in the server 100 of the predictive information providing system 10.

도 5를 참조하면, 서버(100)는 사용자 단말(200)로부터 적어도 하나의 입력데이터가 수신되면(S210), 그 적어도 하나의 입력데이터를 이용하여 제1 학습모델을 통해 기 구축된 데이터베이스를 기반으로 적어도 하나의 유사키워드를 추출한다(S220).Referring to FIG. 5 , when at least one input data is received from the user terminal 200 (S210), the server 100 uses the at least one input data based on the database previously built through the first learning model. At least one similar keyword is extracted with (S220).

그 다음으로, 서버(100)는 S220 단계에 의해 추출된 적어도 하나의 유사키워드를 이용하여 제1 분석정보 및 제2 분석정보를 생성한다(S230).Next, the server 100 generates first analysis information and second analysis information using at least one similar keyword extracted in step S220 (S230).

그 다음으로, 서버(100)는 그 적어도 하나의 입력데이터를 이용하여 제1 학습모델을 통해 웹 상에서 적어도 하나의 관련키워드를 추출하고(S240), 그 추출된 적어도 하나의 관련키워드를 이용하여 제3 분석정보를 생성한다(S250).Next, the server 100 extracts at least one related keyword from the web through the first learning model using the at least one input data (S240), and uses the extracted at least one related keyword 3 Analysis information is generated (S250).

이때, 제1 분석정보 내지 제3 분석정보는 S210 단계에 의해 수신된 적어도 하나의 입력데이터의 형태에 따라 상이한 동작을 통해 생성될 수 있다. 예를 들어, 적어도 하나의 입력데이터가 단일 키워드인 경우(제1 실시예), 복수의 키워드인 경우(제2 실시예) 및 문장/문단인 경우(제3 실시예)로 구분될 수 있다. 다만, 제3 실시예의 경우, 즉, 적어도 하나의 입력데이터가 문장 또는 문단인 경우에는 그 문장 또는 문단으로부터 단일 키워드 또는 복수의 키워드를 추출하여 이용하도록 할 수 있다.In this case, the first to third analysis information may be generated through different operations according to the type of at least one input data received in step S210. For example, it can be classified into a case in which at least one input data is a single keyword (first embodiment), a plurality of keywords (second embodiment), and a sentence/paragraph (third embodiment). However, in the case of the third embodiment, that is, when at least one input data is a sentence or paragraph, a single keyword or a plurality of keywords may be extracted and used from the sentence or paragraph.

도 6은 본 개시의 제1 실시예에 따라 제1 분석정보를 생성하는 동작을 나타내는 순서도이다.6 is a flowchart illustrating an operation of generating first analysis information according to a first embodiment of the present disclosure.

도 6을 참조하면, 적어도 하나의 입력데이터가 단일 키워드인 제1 실시예의 경우, 서버(100)는 제1 학습모델을 통해 기 구축된 데이터베이스 상에 저장된 적어도 하나의 근거데이터를 구성하는 키워드 및 단일 키워드 각각의 연관도를 산출하고(S2311), 그 산출된 각각의 연관도를 기반으로 기 설정된 제1 임계값 이상의 연관도를 갖는 적어도 하나의 유사키워드를 추출한다(S2312).Referring to FIG. 6, in the case of the first embodiment in which at least one input data is a single keyword, the server 100 includes a keyword and a single keyword constituting at least one evidence data stored in a database pre-built through the first learning model. The degree of relevance of each keyword is calculated (S2311), and at least one similar keyword having a degree of relevance equal to or higher than a preset first threshold is extracted based on the calculated degree of relevance (S2312).

그 다음으로, 서버(100)는 제1 학습모델을 통해 S2312 단계에 의해 추출된 적어도 하나의 유사키워드 중 적어도 하나의 유전자키워드를 추출하고(S2313), 그 추출된 적어도 하나의 유전자키워드를 이용하여 제1 키워드리스트를 생성한다(S2314).Next, the server 100 extracts at least one genetic keyword from among the at least one similar keyword extracted in step S2312 through the first learning model (S2313), and uses the extracted at least one genetic keyword A first keyword list is created (S2314).

그 다음으로, 서버(100)는 제1 키워드리스트를 이용하여 제1 분석정보를 생성한다(S2315). 이때, 제1 분석정보는 제1 키워드리스트 외에 제1 키워드리스트를 구성하는 적어도 하나의 유전자키워드 및 단일 키워드 간 관계도를 제3 학습모델을 통해 생성하여 더 포함할 수 있다.Next, the server 100 generates first analysis information using the first keyword list (S2315). At this time, the first analysis information may further include, in addition to the first keyword list, a relationship between at least one genetic keyword constituting the first keyword list and a single keyword generated through a third learning model.

도 7은 본 개시의 제1 실시예에 따라 제2 분석정보를 생성하는 동작을 나타내는 순서도이다.7 is a flowchart illustrating an operation of generating second analysis information according to the first embodiment of the present disclosure.

도 7을 참조하면, 적어도 하나의 입력데이터가 단일 키워드인 제1 실시예의 경우, 서버(100)는 제1 학습모델을 통해 도 6의 S2312 단계에 의해 추출된 적어도 하나의 유사키워드 중 S2313 단계의 의해 추출된 적어도 하나의 유전자키워드를 제외한 나머지 키워드만을 추출하고(S2321), 그 나머지 키워드 및 기 설정된 조건에 따른 설정키워드 각각의 연관도를 산출한다(S2322).Referring to FIG. 7 , in the case of the first embodiment in which at least one input data is a single keyword, the server 100 uses the first learning model to generate a sequence of at least one similar keyword extracted in step S2312 of FIG. 6 in step S2313. Only the remaining keywords except for the at least one genetic keyword extracted by are extracted (S2321), and the degree of association between the remaining keywords and each set keyword according to a preset condition is calculated (S2322).

그 다음으로, 서버(100)는 S2322 단계에 의해 산출된 연관도를 기반으로 기 설정된 제2 임계값 이상의 연관도를 갖는 적어도 하나의 만족키워드를 추출하고(S2323), 그 추출된 적어도 하나의 만족키워드를 이용하여 제2 키워드리스트를 생성한다(S2324).Next, the server 100 extracts at least one satisfaction keyword having a degree of relevance greater than or equal to a preset second threshold value based on the degree of relevance calculated in step S2322 (S2323), and the extracted at least one satisfaction keyword A second keyword list is generated using the keywords (S2324).

그 다음으로, 서버(100)는 제2 키워드리스트를 이용하여 제2 분석정보를 생성한다(S2325). 이때, 제2 분석정보는 제2 키워드리스트 외에 제2 키워드리스트를 구성하는 적어도 하나의 만족키워드 및 단일 키워드 간 관계도를 제3 학습모델을 통해 생성하여 더 포함할 수 있다.Next, the server 100 generates second analysis information using the second keyword list (S2325). In this case, the second analysis information may further include, in addition to the second keyword list, a relationship between at least one satisfactory keyword constituting the second keyword list and a single keyword generated through a third learning model.

도 8은 본 개시의 제1 실시예에 따라 제3 분석정보를 생성하는 동작을 나타내는 순서도이다.8 is a flowchart illustrating an operation of generating third analysis information according to the first embodiment of the present disclosure.

도 8을 참조하면, 적어도 하나의 입력데이터가 단일 키워드인 제1 실시예의 경우, 서버(100)는 제2 학습모델을 통해 웹 상에 존재하는 키워드 및 단일 키워드 각각의 유사도 산출하고(S2331), 그 산출된 각각의 유사도를 기반으로 기 설정된 제1 임계범위 이내의 유사도를 갖는 적어도 하나의 관련키워드를 추출한다(S2332).Referring to FIG. 8 , in the case of the first embodiment in which at least one input data is a single keyword, the server 100 calculates a similarity between a keyword existing on the web and a single keyword through a second learning model (S2331), At least one related keyword having a similarity within a preset first threshold range is extracted based on each calculated similarity (S2332).

여기서, 제2 학습모델은 단일모델, 합성모델 및 Node2vec 모델 중 어느 하나의 형태로 구성될 수 있으며, 유사도는 코사인 유사도, 자카드 유사도, 맨하탄 유사도, 유클리드 거리 및 마할라노비스 거리 중 적어도 하나를 이용하여 산출될 수 있다. 또한, 그 외 유사도를 산출할 수 있는 방식이라면 적용 가능하며, 그 종류 및 개수를 한정하지 않는다.Here, the second learning model may be configured in the form of any one of a single model, a composite model, and a Node2vec model, and the similarity is determined by using at least one of cosine similarity, Jacquard similarity, Manhattan similarity, Euclidean distance, and Mahalanobis distance. can be derived. In addition, any method that can calculate other similarity can be applied, and the type and number are not limited.

그 다음으로, 서버(100)는 제1 학습모델을 통해 S2332 단계에 의해 추출된 적어도 하나의 관련키워드 중 적어도 하나의 유전자키워드를 추출하고(S2333), 그 추출된 적어도 하나의 유전자키워드를 이용하여 제1 예측데이터를 생성한다(S2334).Next, the server 100 extracts at least one genetic keyword from among the at least one related keyword extracted in step S2332 through the first learning model (S2333), and uses the extracted at least one genetic keyword First prediction data is generated (S2334).

그 다음으로, 서버(100)는 제1 학습모델을 통해 S2332 단계에 의해 추출된 적어도 하나의 관련키워드 중 S2333 단계의 의해 추출된 적어도 하나의 유전자키워드를 제외한 나머지 키워드만을 추출하고(S2335), 제2 학습모델을 통해 그 나머지 키워드 및 기 설정된 조건에 따른 설정키워드 각각의 유사도를 산출한다(S2336).Next, the server 100 extracts only the keywords other than the at least one genetic keyword extracted in step S2333 from among the at least one related keyword extracted in step S2332 through the first learning model (S2335), and The similarity of each of the remaining keywords and the set keyword according to the preset condition is calculated through the 2 learning model (S2336).

그 다음으로, 서버(100)는 S2336 단계에 의해 산출된 유사도를 기반으로 기 설정된 제2 임계범위 이내의 유사도를 갖는 적어도 하나의 예측키워드를 추출하고(S2337), 그 추출된 적어도 하나의 예측키워드를 이용하여 제2 예측데이터를 생성한다(S2338).Next, the server 100 extracts at least one predicted keyword having a similarity within a preset second threshold range based on the similarity calculated in step S2336 (S2337), and the extracted at least one predicted keyword Second prediction data is generated using (S2338).

그 다음으로, 서버(100)는 제1 예측데이터 및 제2 예측데이터를 이용하여 제3 분석정보를 생성한다(S2339). 이때, 제1 예측데이터 및 제2 예측데이터 각각은 그 내(제1 예측데이터/제2 예측데이터)에 포함된 각각의 키워드들 및 단일 키워드 간 관계도를 더 포함할 수 있다.Next, the server 100 generates third analysis information using the first prediction data and the second prediction data (S2339). In this case, each of the first prediction data and the second prediction data may further include each keyword included therein (first prediction data/second prediction data) and a relationship between single keywords.

도 9는 본 개시의 제2 실시예에 따라 제1 분석정보를 생성하는 동작을 나타내는 순서도이다.9 is a flowchart illustrating an operation of generating first analysis information according to a second embodiment of the present disclosure.

도 9를 참조하면, 적어도 하나의 입력데이터가 복수의 키워드인 제2 실시예의 경우, 서버(100)는 제1 학습모델을 통해 기 구축된 데이터베이스 상에 저장된 적어도 하나의 근거데이터를 구성하는 키워드 및 복수의 키워드 각각의 연관도를 산출하고(S2341), 그 산출된 각각의 연관도를 기반으로 기 설정된 제1 임계값 이상의 연관도를 갖는 적어도 하나의 유사키워드를 추출한다(S2342).Referring to FIG. 9, in the case of the second embodiment in which at least one input data is a plurality of keywords, the server 100 includes at least one keyword and The degree of relevance of each of a plurality of keywords is calculated (S2341), and at least one similar keyword having a degree of relevance equal to or higher than a predetermined first threshold value is extracted based on the degree of relevance of each of the calculated terms (S2342).

그 다음으로, 서버(100)는 제1 학습모델을 통해 S2342 단계에 의해 추출된 적어도 하나의 유사키워드 중 적어도 하나의 유전자키워드를 1차적으로 추출하고(S2343), 그 추출된 적어도 하나의 유전자키워드 중 복수의 키워드 각각에 공통적으로 연관된 적어도 하나의 제1 공통키워드를 2차적으로 추출한다(S2344).Next, the server 100 primarily extracts at least one genetic keyword from among the at least one similar keyword extracted in step S2342 through the first learning model (S2343), and the extracted at least one genetic keyword Among them, at least one first common keyword commonly associated with each of a plurality of keywords is secondarily extracted (S2344).

그 다음으로, 서버(100)는 제1 학습모델을 통해 S2344 단계에 의해 추출된 적어도 하나의 제1 공통키워드를 이용하여 제1 키워드리스트를 생성하고(S2345), 그 제1 키워드리스트를 이용하여 제1 분석정보를 생성한다(S2346). 이때, 제1 분석정보는 제1 키워드리스트 외에 제1 키워드리스트를 구성하는 적어도 하나의 유전자키워드 및 복수의 키워드 간 관계도를 제3 학습모델을 통해 생성하여 더 포함할 수 있다.Next, the server 100 generates a first keyword list using at least one first common keyword extracted in step S2344 through the first learning model (S2345), and uses the first keyword list First analysis information is generated (S2346). At this time, the first analysis information may further include, in addition to the first keyword list, a relationship between at least one genetic keyword constituting the first keyword list and a plurality of keywords generated through a third learning model.

도 10은 본 개시의 제2 실시예에 따라 제2 분석정보를 생성하는 동작을 나타내는 순서도이다.10 is a flowchart illustrating an operation of generating second analysis information according to a second embodiment of the present disclosure.

도 10을 참조하면, 적어도 하나의 입력데이터가 복수의 키워드인 제2 실시예의 경우, 서버(100)는 제1 학습모델을 통해 도 9의 S2342 단계에 의해 추출된 적어도 하나의 유사키워드 중 S2343 단계의 의해 추출된 적어도 하나의 유전자키워드를 제외한 나머지 키워드만을 추출하고(S2351), 그 나머지 키워드 및 기 설정된 조건에 따른 설정키워드 각각의 연관도를 산출한다(S2352).Referring to FIG. 10 , in the case of the second embodiment in which at least one input data is a plurality of keywords, the server 100 performs step S2343 of at least one similar keyword extracted by step S2342 of FIG. 9 through the first learning model. Only the remaining keywords except for the at least one genetic keyword extracted by are extracted (S2351), and the degree of association between the remaining keywords and each set keyword according to a preset condition is calculated (S2352).

그 다음으로, 서버(100)는 제1 학습모델을 통해 S2352 단계에 의해 산출된 연관도를 기반으로 기 설정된 제2 임계값 이상의 연관도를 갖는 적어도 하나의 만족키워드를 1차적으로 추출하고(S2353), 그 추출된 적어도 하나의 만족키워드 중 복수의 키워드 각각에 공통적으로 연관된 적어도 하나의 제2 공통키워드를 2차적으로 추출한다(S2354).Next, the server 100 primarily extracts at least one satisfaction keyword having a degree of relevance equal to or greater than a preset second threshold based on the degree of relevance calculated in step S2352 through the first learning model (S2353 ), and secondarily extracts at least one second common keyword commonly related to each of a plurality of keywords among the extracted at least one satisfying keyword (S2354).

그 다음으로, 서버(100)는 제1 학습모델을 통해 S2354 단계에 의해 추출된 적어도 하나의 제2 공통키워드를 이용하여 제2 키워드리스트를 생성하고(S2355), 그 제2 키워드리스트를 이용하여 제2 분석정보를 생성한다(S2356). 이때, 제2 분석정보는 제2 키워드리스트 외에 제2 키워드리스트를 구성하는 적어도 하나의 만족키워드 및 복수의 키워드 간 관계도를 제3 학습모델을 통해 생성하여 더 포함할 수 있다.Next, the server 100 generates a second keyword list using at least one second common keyword extracted in step S2354 through the first learning model (S2355), and uses the second keyword list Second analysis information is generated (S2356). In this case, the second analysis information may further include, in addition to the second keyword list, at least one satisfaction keyword constituting the second keyword list and a relationship between a plurality of keywords generated through the third learning model.

도 11은 본 개시의 제2 실시예에 따라 제3 분석정보를 생성하는 동작을 나타내는 순서도이다.11 is a flowchart illustrating an operation of generating third analysis information according to a second embodiment of the present disclosure.

도 11을 참조하면, 적어도 하나의 입력데이터가 복수의 키워드인 제2 실시예의 경우, 서버(100)는 제2 학습모델을 통해 웹 상에 존재하는 키워드 및 복수의 키워드 각각의 유사도 산출하고(S2361), 그 산출된 각각의 유사도를 기반으로 기 설정된 제1 임계범위 이내의 유사도를 갖는 적어도 하나의 관련키워드를 추출한다(S2362).Referring to FIG. 11, in the case of the second embodiment in which at least one input data is a plurality of keywords, the server 100 calculates the similarity between the keyword existing on the web and each of the plurality of keywords through the second learning model (S2361 ), at least one related keyword having a similarity within a preset first threshold range is extracted based on the calculated similarity (S2362).

그 다음으로, 서버(100)는 제1 학습모델을 통해 S2362 단계에 의해 추출된 적어도 하나의 관련키워드 중 적어도 하나의 유전자키워드를 1차적으로 추출하고(S2363), 그 추출된 적어도 하나의 유전자키워드 중 복수의 키워드 각각에 공통적으로 연관된 적어도 하나의 제3 공통키워드를 2차적으로 추출한다(S2364).Next, the server 100 primarily extracts at least one genetic keyword from among the at least one related keyword extracted in step S2362 through the first learning model (S2363), and the extracted at least one genetic keyword Among them, at least one third common keyword commonly associated with each of a plurality of keywords is secondarily extracted (S2364).

그 다음으로, 서버(100)는 S2364 단계에 의해 추출된 적어도 하나의 제3 공통키워드를 이용하여 제1 예측데이터를 생성하고(S2365), 앞서 S2362 단계에 의해 추출된 적어도 하나의 관련키워드 중 S2363 단계의 의해 추출된 적어도 하나의 유전자키워드를 제외한 나머지 키워드만을 추출한다(S2366).Next, the server 100 generates first prediction data using at least one third common keyword extracted by step S2364 (S2365), and among at least one related keyword extracted by step S2362, S2363 Except for the at least one genetic keyword extracted by the step, only the remaining keywords are extracted (S2366).

그 다음으로, 서버(100)는 제2 학습모델을 통해 그 나머지 키워드 및 기 설정된 조건에 따른 설정키워드 각각의 유사도를 산출하고(S2367), 그 산출된 유사도를 기반으로 기 설정된 제2 임계범위 이내의 유사도를 갖는 적어도 하나의 예측키워드를 1차적으로 추출한다(S2368).Next, the server 100 calculates the similarity of each of the remaining keywords and the set keyword according to the preset condition through the second learning model (S2367), and based on the calculated similarity, within a preset second threshold range. At least one predicted keyword having a similarity of is firstly extracted (S2368).

그 다음으로, 서버(100)는 제1 학습모델을 통해 S2368 단계에 의해 추출된 적어도 하나의 예측키워드 중 복수의 키워드 각각에 공통적으로 연관된 적어도 하나의 제4 공통키워드를 2차적으로 추출한다(S2369), 그 적어도 하나의 제4 공통키워드를 이용하여 제2 예측데이터를 생성한다(S2370). Next, the server 100 secondarily extracts at least one fourth common keyword commonly associated with each of a plurality of keywords among the at least one predicted keyword extracted in step S2368 through the first learning model (S2369 ), second prediction data is generated using the at least one fourth common keyword (S2370).

그 다음으로, 서버(100)는 제1 예측데이터 및 제2 예측데이터를 이용하여 제3 분석정보를 생성한다(S2371). 이때, 제1 예측데이터 및 제2 예측데이터 각각은 그 내(제1 예측데이터/제2 예측데이터)에 포함된 각각의 키워드들 및 복수의 키워드 간 관계도를 더 포함할 수 있다.Next, the server 100 generates third analysis information using the first prediction data and the second prediction data (S2371). In this case, each of the first prediction data and the second prediction data may further include respective keywords included therein (first prediction data/second prediction data) and a relationship between a plurality of keywords.

도 12는 본 개시의 제3 실시예에 따라 제3 분석정보를 생성하는 동작을 나타내는 순서도이다.12 is a flowchart illustrating an operation of generating third analysis information according to a third embodiment of the present disclosure.

앞서 설명한 바와 같이, 적어도 하나의 입력데이터가 문장 또는 문단인 제3 실시예의 경우에는 그 문장 또는 문단으로부터 단일 키워드 또는 복수의 키워드를 추출한 후, 그 추출된 단일 키워드 또는 복수의 키워드를 이용하여 제3 분석정보를 생성하도록 할 수 있다. 이때, 서버(100)는 제1 학습모델을 통해 문장 또는 문단으로부터 단일 키워드 또는 복수의 키워드를 추출할 수 있다. 즉, 특정 키워드를 추출하기 위해서 텍스트 코퍼스(corpus)를 제작하여 자연어 처리를 통해 문장에서 특정 텍스트들을 추출한 후, 그룹으로 분류한다.As described above, in the case of the third embodiment in which at least one input data is a sentence or paragraph, after extracting a single keyword or a plurality of keywords from the sentence or paragraph, analysis information can be generated. In this case, the server 100 may extract a single keyword or a plurality of keywords from the sentence or paragraph through the first learning model. That is, in order to extract specific keywords, a text corpus is produced, specific texts are extracted from sentences through natural language processing, and then classified into groups.

그렇기 때문에, 단일 키워드가 추출된 경우에는 도 8과 동일한 동작을 수행하여 제1 예측데이터 및 제2 예측데이터를 생성하고, 복수의 키워드가 추출된 경우에는 도 11과 동일한 동작을 수행하여 제1 예측데이터 및 제2 예측데이터를 생성한다.Therefore, when a single keyword is extracted, the same operation as in FIG. 8 is performed to generate first prediction data and second prediction data, and when a plurality of keywords are extracted, the same operation as in FIG. 11 is performed to generate the first prediction data. Data and second prediction data are generated.

다만, 적어도 하나의 입력데이터가 문장 또는 문단인 제3 실시예의 경우에는, 추가적으로 제3 예측데이터를 생성하는 동작을 더 수행하여 제3 분석정보를 생성하는 것으로, 도 12는 그 제3 에측데이터를 생성하는 동작에 관한 것이다.However, in the case of the third embodiment in which at least one input data is a sentence or a paragraph, an operation of generating third prediction data is additionally performed to generate third analysis information, and FIG. 12 shows the third prediction data It's about creating motion.

도 12를 참조하면, 서버(100)는 제2 학습모델을 통해 적어도 하나의 입력데이터로서 수신된 문장(또는 문단에 포함된 문장들) 및 앞서 S2362 단계에 의해 추출된 적어도 하나의 관련키워드를 포함하는 문장 각각의 유사도를 산출하고(S2372), 그 산출된 유사도를 기반으로 기 설정된 제3 임계범위 이내의 유사도를 갖는 적어도 하나의 유사문장을 추출한다(S2373).Referring to FIG. 12, the server 100 includes a sentence (or sentences included in a paragraph) received as at least one input data through the second learning model and at least one related keyword extracted by step S2362 above. The similarity of each sentence is calculated (S2372), and at least one similar sentence having a similarity within a preset third threshold range is extracted based on the calculated similarity (S2373).

그 다음으로, 서버(100)는 그 추출된 적어도 하나의 유사문장을 이용하여 제3 예측데이터를 생성하고(S2374), 제1 예측데이터, 제2 예측데이터 및 제3 예측데이터를 이용하여 제3 분석정보를 생성한다(S2375). 이때, 제3 예측데이터는 S2373 단계에 의해 추출된 적어도 하나의 유사문장을 리스트 형태로 구성한 문장리스트와, 그 추출된 적어도 하나의 유사문장을 이용하여 제3 학습모델에 의해 생성된 새로운 문장을 포함한다.Next, the server 100 generates third prediction data using the extracted at least one similar sentence (S2374), and uses the first prediction data, the second prediction data, and the third prediction data to generate the third prediction data. Analysis information is generated (S2375). At this time, the third prediction data includes a sentence list composed of at least one similar sentence extracted in step S2373 in the form of a list, and a new sentence generated by the third learning model using the extracted at least one similar sentence. do.

앞서, 제1 실시예 내지 제3 실시예에서 제1 분석정보 및 제2 분석정보를 생성하기 위해 이용되는 기 설정된 제1 임계값 및/또는 제2 임계값은 서버(100)의 관리자 또는 사용자 단말(200)의 사용자에 의해 변경되어 설정 가능한 것으로, 그 값이 상이하거나 동일할 수 있으며, 이를 한정하지 않는다. 마찬가지로, 제1 실시예 내지 제3 실시예에서 제3 분석정보를 생성하기 위해 이용되는 기 설정된 제1 임계범위 및/또는 제2 임계범위는 서버(100)의 관리자 또는 사용자 단말(200)의 사용자에 의해 변경되어 설정 가능한 것으로, 그 값이 상이하거나 동일할 수 있으며, 이를 한정하지 않는다.Previously, in the first to third embodiments, the first threshold and/or the second threshold used to generate the first analysis information and the second analysis information are the manager of the server 100 or the user terminal. It can be changed and set by the user of (200), and the value may be different or the same, but is not limited thereto. Similarly, the preset first threshold range and/or the second threshold range used to generate the third analysis information in the first to third embodiments are the manager of the server 100 or the user of the user terminal 200. It can be changed and set by , and the value may be different or the same, but is not limited thereto.

한편, 키워드를 추출하기 위해 언급되는 연관도는 적어도 하나의 근거데이터 상에서 그 적어도 하나의 입력데이터가 설명된 설명횟수일 수 있다. 즉, 그 설명횟수가 클수록 높은 연관도를 갖는 것으로 판단할 수 있다.On the other hand, the degree of relevance referred to for extracting a keyword may be the number of times that at least one input data is explained on at least one ground data. That is, it can be determined that the higher the number of explanations, the higher the degree of association.

도 13은 본 개시의 제1 실시예에 따라 입력데이터로서 단일 키워드가 수신된 경우에 생성되는 관계도의 일 예를 나타내는 도면이다.13 is a diagram illustrating an example of a relationship diagram generated when a single keyword is received as input data according to the first embodiment of the present disclosure.

도 13을 참조하면, 적어도 하나의 입력데이터(110)가 단일 키워드인 제1 실시예의 경우, 그 단일 키워드를 타겟 데이터로 표시하고, 이를 기반으로 제1 학습모델을 통해 제1 분석정보 내지 제3 분석정보를 생성할 시에 각각 추출된 적어도 하나의 유전자키워드, 적어도 하나의 만족키워드 및 적어도 하나의 예측데이터를 추출키워드로서 표시한다.Referring to FIG. 13, in the case of the first embodiment in which at least one input data 110 is a single keyword, the single keyword is displayed as target data, and based on this, first analysis information to third analysis information through the first learning model are displayed. At least one genetic keyword, at least one satisfaction keyword, and at least one prediction data, each extracted when generating analysis information, are displayed as extracted keywords.

도 13에는 타겟키워드에 대한 추출키워드가 제1 추출키워드 내지 제10 추출키워드로 총 10개가 추출된 경우에 대해 도시한 것으로, 이때, 타겟데이터와 적어도 하나의 근거데이터에서 함께 설명된 제1 추출키워드, 제2 추출키워드, 제3 추출키워드 및 제6 추출키워드는 직접적인 관계를 가지는 것으로, 타겟데이터에 직접 연결하여 타겟데이터와의 제1차 관계를 표시한다. 한편, 타겟데이터와 적어도 하나의 근거데이터 상에서 함께 설명되지는 않았으나, 1차 관계를 갖는 제1 추출키워드, 제2 추출키워드, 제3 추출키워드 및 제6 추출키워드와 적어도 하나의 근거데이터 상에서 함께 설명된 제4 추출키워드, 제5 추출키워드, 제7 추출키워드, 제8추출키워드, 제9 추출키워드 및 제10 키워드를 해당 추출키워드에 연결하여 타겟데이터와의 제2차 관계를 표시한다.13 shows a case where a total of 10 extraction keywords are extracted from the first extraction keyword to the 10th extraction keyword for the target keyword. In this case, the first extraction keyword described together in the target data and at least one source data , the second extraction keyword, the third extraction keyword, and the sixth extraction keyword have a direct relationship, and display a primary relationship with the target data by directly connecting to the target data. On the other hand, although not described together on the target data and at least one source data, the first extraction keyword, the second extraction keyword, the third extraction keyword, and the sixth extraction keyword having a primary relationship and the at least one source data are described together. The fourth extraction keyword, the fifth extraction keyword, the seventh extraction keyword, the eighth extraction keyword, the ninth extraction keyword, and the tenth extraction keyword are connected to the corresponding extraction keyword to display a secondary relationship with the target data.

다만, 도 13에는 제2차 관계까지 표시하였으나, 각 키워드 간의 연결 관계에 따라 제1차부터 제n차까지 확장되어 표시될 수 있다.However, although the second relationship is shown in FIG. 13, it may be extended and displayed from the first to the nth order according to the connection relationship between each keyword.

도 14는 본 개시의 제2 실시예에 따라 입력데이터로서 단일 키워드가 수신된 경우에 생성되는 관계도의 일 예를 나타내는 도면이다.14 is a diagram illustrating an example of a relationship diagram generated when a single keyword is received as input data according to the second embodiment of the present disclosure.

도 14를 참조하면, 적어도 하나의 입력데이터(110)가 복수의 키워드인 제2 실시예의 경우, 예를 들어, 키워드가 2개 입력되었다고 가정하면, 그 복수의 키워드, 그 2개의 키워드를 각각 제1 타겟키워드 및 제2 타겟키워드로 표시하고, 이를 기반으로 제1 학습모델을 통해 제1 분석정보 내지 제3 분석정보를 생성할 시에 각각 추출된 적어도 하나의 유전자키워드, 적어도 하나의 만족키워드 및 적어도 하나의 예측데이터를 추출키워드로서 표시하되, 그 중 제1 타겟키워드 및 제2 타겟키워드 각각에 공통적으로 연관된 적어도 하나의 제1 공통키워드, 제2 공통키워드, 제3 공통키워드 및 제4 공통키워드를 시각적으로 상이하게 표시한다.Referring to FIG. 14, in the case of the second embodiment in which at least one input data 110 is a plurality of keywords, for example, assuming that two keywords are input, the plurality of keywords and the two keywords are respectively At least one genetic keyword, at least one satisfaction keyword and Display at least one predicted data as an extraction keyword, among which at least one first common keyword, second common keyword, third common keyword, and fourth common keyword commonly related to each of the first target keyword and the second target keyword are visually displayed differently.

도 14에는 제1 타겟키워드 및 제2 타겟키워드에 대한 추출키워드가 제1 추출키워드 내지 제20 추출키워드로 총 20개가 추출된 경우에 대해 도시한 것이다.FIG. 14 shows a case in which a total of 20 extracted keywords are extracted from the first to twentieth extraction keywords for the first target keyword and the second target keyword.

구체적으로, 제1 타겟데이터와 적어도 하나의 근거데이터에서 함께 설명된 제1 추출키워드, 제2 추출키워드, 제3 추출키워드 및 제4 추출키워드는 직접적인 관계를 가지는 것으로, 제1 타겟데이터에 직접 연결하여 제1 타겟데이터와의 제1차 관계를 표시한다. 또한, 제1 타겟데이터와 적어도 하나의 근거데이터 상에서 함께 설명되지는 않았으나, 1차 관계를 갖는 제1 추출키워드, 제2 추출키워드, 제3 추출키워드 및 제4 추출키워드와 적어도 하나의 근거데이터 상에서 함께 설명된 제5 추출키워드, 제6 추출키워드, 제9 추출키워드, 제13 추출키워드, 제15 추출키워드 및 제18 추출키워드를 해당 추출키워드에 연결하여 제1 타겟데이터와의 제2차 관계를 표시한다.Specifically, the first extraction keyword, the second extraction keyword, the third extraction keyword, and the fourth extraction keyword described together in the first target data and at least one source data have a direct relationship and are directly connected to the first target data. to display the first order relationship with the first target data. In addition, although not described together on the first target data and at least one source data, on the first extraction keyword, the second extraction keyword, the third extraction keyword, and the fourth extraction keyword and at least one source data having a primary relationship The fifth extraction keyword, the sixth extraction keyword, the ninth extraction keyword, the thirteenth extraction keyword, the fifteenth extraction keyword, and the eighteenth extraction keyword described together are connected to the corresponding extraction keyword to obtain a secondary relationship with the first target data. display

한편, 제2 타겟데이터와 적어도 하나의 근거데이터에서 함께 설명된 제7 추출키워드, 제8 추출키워드, 제11 추출키워드 및 제12 추출키워드는 직접적인 관계를 가지는 것으로, 제2 타겟데이터에 직접 연결하여 제2 타겟데이터와의 제1차 관계를 표시한다. 또한, 제2 타겟데이터와 적어도 하나의 근거데이터 상에서 함께 설명되지는 않았으나, 1차 관계를 갖는 제7 추출키워드, 제8 추출키워드, 제11 추출키워드 및 제12 추출키워드와 적어도 하나의 근거데이터 상에서 함께 설명된 제10 추출키워드, 제6 추출키워드, 제9 추출키워드, 제13 추출키워드, 제14 추출키워드, 제16 추출키워드, 제17 추출키?d드 및 제20 추출키워드를 해당 추출키워드에 연결하여 제2 타겟데이터와의 제2차 관계를 표시한다.On the other hand, the seventh extraction keyword, the eighth extraction keyword, the eleventh extraction keyword, and the twelfth extraction keyword described together in the second target data and at least one source data have a direct relationship, and are directly connected to the second target data The first order relationship with the second target data is displayed. In addition, although not described together on the second target data and at least one source data, the 7th extraction keyword, the 8th extraction keyword, the 11th extraction keyword, and the 12th extraction keyword and at least one source data having a primary relationship The 10th extraction keyword, the 6th extraction keyword, the 9th extraction keyword, the 13th extraction keyword, the 14th extraction keyword, the 16th extraction keyword, the 17th extraction keyword, and the 20th extraction keyword described together are assigned to the corresponding extraction keyword. It is connected to display the secondary relationship with the secondary target data.

이때, 제1 타겟데이터 및 제2 타겟데이터에 공통적으로 연결 관계를 갖는 제13 추출키워드가 존재하므로, 이를 A와 같이 시각적으로 표시해줄 수 있다.At this time, since the thirteenth extraction keyword having a connection relationship in common with the first target data and the second target data exists, it can be visually displayed as shown in A.

마찬가지로, 도 14에는 제2차 관계까지 표시하였으나, 각 키워드 간의 연결 관계에 따라 제1차부터 제n차까지 확장되어 표시될 수 있다.Similarly, in FIG. 14, the 2nd order relationship is displayed, but according to the connection relationship between each keyword, the 1st order to the nth order may be extended and displayed.

한편, 제3 실시예의 경우에도, 문장 또는 문단으로부터 단일 키워드 또는 복수의 키워드를 추출하여 이용하는 바, 그 관계도는 도 13 또는 도 14와 같이 표시될 수 있다.Meanwhile, even in the case of the third embodiment, since a single keyword or a plurality of keywords are extracted and used from a sentence or paragraph, the relationship diagram may be displayed as shown in FIG. 13 or FIG. 14 .

도 1 내지 도 14는 인공지능을 기반으로 데이터를 분석하여 예측정보를 생성 및 제공하는 것에 관련한 것으로, 그 예측정보를 사용자 단말(200)로 제공한 이후에는 데이터베이스를 구축하거나 기 구축된 데이터베이스를 업데이트 하는 등의 관리를 위해 분석세트를 생성하여 저장한다.1 to 14 relate to generating and providing prediction information by analyzing data based on artificial intelligence, and after providing the prediction information to the user terminal 200, a database is built or a previously built database is updated. Analysis sets are created and stored for management.

이하에서는 도 15 내지 도 21을 참조하여 인공지능 기반의 데이터베이스 관리 시스템 및 방법에 대해 설명하도록 한다.Hereinafter, an artificial intelligence-based database management system and method will be described with reference to FIGS. 15 to 21.

도 15는 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 시스템의 네트워크 구조를 나타내는 도면이다.15 is a diagram showing a network structure of an artificial intelligence-based database management system according to an embodiment of the present disclosure.

도 15를 참조하면, 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 시스템(이하, '데이터베이스 관리 시스템'이라 칭함)(20)은 서버(100), 제1 사용자 단말(210) 및 제2 사용자 단말(220)을 포함할 수 있다.Referring to FIG. 15, an artificial intelligence-based database management system (hereinafter, referred to as a 'database management system') 20 according to an embodiment of the present disclosure includes a server 100, a first user terminal 210, and a second A user terminal 220 may be included.

서버(100)는 제1 사용자 단말(210)로부터 적어도 하나의 입력데이터가 수신되면, 인공지능 기반 제4 학습모델을 이용하여 그 적어도 하나의 입력데이터로부터 적어도 하나의 입력키워드를 확인하고, 기 구축된 데이터베이스 상에 그 적어도 하나의 입력키워드 중 적어도 하나를 포함하는 공개분석세트를 확인한다. 즉, 기 구축된 데이터베이스에는 적어도 하나의 분석세트가 저장될 수 있는데, 그 중 공개 설정된 공개분석세트의 분석키워드를 확인함으로써, 적어도 하나의 입력키워드를 적어도 하나 이상 분석키워드로서 포함하는 공개분석세트를 확인한다.When at least one input data is received from the first user terminal 210, the server 100 checks at least one input keyword from the at least one input data using the artificial intelligence-based fourth learning model, An open analysis set including at least one of the at least one input keyword is identified on the database. That is, at least one analysis set may be stored in a pre-constructed database. Among them, an open analysis set including at least one input keyword as at least one analysis keyword is obtained by checking an analysis keyword of an open analysis set set open among them. Check.

그 확인 결과, 공개분석세트가 확인되는 경우, 서버(100)는 그 확인된 공개분석세트를 이용하여 예측정보를 생성하고, 공개분석세트가 확인되지 않는 경우, 웹 크롤링을 통해 적어도 하나의 입력키워드에 대한 분석데이터(제1 분석정보 내지 제3 분석정보, 각각의 관계도 등을 모두 포함함)를 생성하여 새로운 예측정보를 생성한다. 그 예측정보를 생성하는 구체적인 동작에 대해서는 하기에서 도 18 및 도 19를 통해 설명하도록 한다.As a result of the check, when the open analysis set is confirmed, the server 100 generates prediction information using the identified open analysis set, and when the open analysis set is not confirmed, at least one input keyword is entered through web crawling. New prediction information is generated by generating analysis data (including all of the first to third analysis information, respective relationship diagrams, etc.) for. A detailed operation of generating the prediction information will be described below with reference to FIGS. 18 and 19.

한편, 서버(100)는 새로운 예측정보와 그 예측정보를 생성하기 위해 이용한 적어도 하나의 입력키워드를 분석키워드로 하여 분석세트로 저장한다. 이때, 서버(100)는 그 분석세트를 저장할 시, 사용자의 설정에 따라 해당 분석세트를 공개분석세트 또는 비공개분석세트로 설정할 수 있다.Meanwhile, the server 100 stores new prediction information and at least one input keyword used to generate the prediction information as an analysis keyword as an analysis set. In this case, when the server 100 stores the analysis set, the corresponding analysis set may be set as an open analysis set or a closed analysis set according to a user's setting.

한편, 서버(100)는 기 설정된 주기에 따라 기 구축된 데이터베이스 상에 저장된 공개분석세트들 간의 병합가능 여부 또는, 공개분석세트 및 비공개분석세트 간의 병합가능 여부를 확인하고, 병합 가능한 것으로 확인한 경우, 각각의 사용자 단말로 병합가능알림을 송신한다. 그에 대한 응답으로 각각의 사용자 단말로부터 병합요청이 수신되면, 두 분석세트를 병합하여 기 구축된 데이터베이스를 업데이트 할 수 있다. 이때, 공개분석세트 및 비공개분석세트가 병합가능한 것으로 확인된 경우에는, 공개분석세트에 대응하는 사용자 단말 및 비공개분석세트에 대응하는 사용자 단말로 송신하는 병합가능알림이 상이할 수 있다. 즉, 병합가능알림에는 각각 두 분석세트에 대한 정보가 포함되는데, 예를 들어, 공개분석세트에 대응하는 사용자 단말로 송신하기 위한 병합가능알림에는 비공개분석세트에 대한 정보를 선택적으로 포함시킬 수 있다. 또한, 비공개분석세트에 대응하는 사용자 단말로는 그 병합가능알림을 비공개적으로 송신할 수도 있다.Meanwhile, the server 100 checks whether merging is possible between open analysis sets stored in a pre-established database or whether merging is possible between an open analysis set and a closed analysis set is possible according to a preset cycle, and when it is confirmed that merging is possible, A merge possibility notification is transmitted to each user terminal. When a merge request is received from each user terminal as a response thereto, the previously constructed database may be updated by merging the two analysis sets. In this case, when it is confirmed that the open analysis set and the closed analysis set can be merged, merge possibility notifications transmitted to the user terminal corresponding to the open analysis set and the user terminal corresponding to the closed analysis set may be different. That is, the mergeable notification includes information on the two analysis sets, respectively. For example, information on the private analysis set may be selectively included in the mergeable notification to be transmitted to the user terminal corresponding to the open analysis set. . In addition, the merge possibility notification may be privately transmitted to the user terminal corresponding to the undisclosed analysis set.

한편, 제1 사용자 단말(210)의 요청에 따라 예측정보를 생성하기 위해 확인된 공개분석세트가 제2 사용자 단말(220)에 대응하는 분석세트라면, 병합가능알림을 제1 사용자 단말(210) 및 제2 사용자 단말(220)로 각각 송신하고, 그에 대한 응답을 기반으로 두 분석세트 간 병합을 수행할 수 있다.Meanwhile, if the open analysis set identified to generate prediction information according to the request of the first user terminal 210 is an analysis set corresponding to the second user terminal 220, a merge possibility notification is sent to the first user terminal 210. and the second user terminal 220, respectively, and merging between the two analysis sets may be performed based on a response thereto.

한편, 제1 사용자 단말(210) 및 제2 사용자 단말(220)은 예측정보를 제공받고자 하는 사용자의 단말로서, 각각 서버(100)로 적어도 하나의 입력데이터를 송신하여 그에 대한 예측정보를 제공받는 것은 물론, 그 예측정보를 포함하는 분석세트에 대한 병합가능알림이 수신되면, 이를 확인하여 병합여부에 대한 결정 정보를 송신한다. 즉, 병합을 원하는 경우, 병합요청을 서버(100)로 송신하여 병합이 수행되도로 할 수 있다.On the other hand, the first user terminal 210 and the second user terminal 220 are terminals of users who want to receive prediction information, and each transmits at least one input data to the server 100 to receive prediction information therefor. Of course, when a merge possibility notification for the analysis set including the prediction information is received, it is checked and decision information on whether or not to merge is transmitted. That is, when merging is desired, a merging request may be transmitted to the server 100 so that merging is performed.

앞서, 도 15에서는 제1 사용자 단말(210) 및 제2 사용자 단말(220)만을 도시하였으나, 적어도 하나 이상일 수 있으며, 그 개수를 한정하지 않는다.Previously, in FIG. 15, only the first user terminal 210 and the second user terminal 220 were shown, but there may be at least one or more, and the number is not limited.

다만, 도 15에는 설명의 편의를 위하여 사용자 단말을 2개로 도시하였으나, 그 개수를 한정하지 않는다.However, although FIG. 15 shows two user terminals for convenience of description, the number is not limited.

도 16은 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 방법을 나타내는 흐름도이다.16 is a flowchart illustrating an artificial intelligence-based database management method according to an embodiment of the present disclosure.

도 16을 참조하면, 서버(100)는 제1 사용자 단말(210)로부터 적어도 하나의 입력데이터가 수신되면(S301), 그 적어도 하나의 입력데이터를 통해 적어도 하나의 입력키워드를 확인한다(S303). 그런나, 이는 하나의 실시예일, 제1 사용자 단말(210)로부터 적어도 하나의 입력키워드가 직접 수신될 수도 있다.Referring to FIG. 16 , when at least one input data is received from the first user terminal 210 (S301), the server 100 checks at least one input keyword through the at least one input data (S303). . However, this is one embodiment, and at least one input keyword may be directly received from the first user terminal 210 .

그 다음으로, 서버(100)는 제4 학습모델을 이용하여 기 구축된 데이터베이스 상에 저장된 적어도 하나의 공개분석세트 중 S303 단계에 의해 확인된 적어도 하나의 입력키워드를 적어도 하나 이상 분석키워드로서 포함하고 있는 공개분석세트를 확인하고(S305), 그 확인 결과에 따라 공개분석세트를 이용하여 예측정보를 생성하거나, S303 단계에 의해 확인된 적어도 하나의 입력키워드를 이용하여 예측정보를 생성한다(S307). 즉, S305 단계에 따른 확인 결과, 공개분석세트가 확인되면 이를 이용하여 예측정보를 생성하도록 하고, 공개분석세트가 학인되지 않으면 앞서 도 1 내지 도 15를 통해 설명한 바와 같이 적어도 하나의 입력데이터(적어도 하나의 입력키워드)를 이용하여 예측정보를 생성한다.Next, the server 100 includes, as at least one analysis keyword, at least one input keyword identified in step S303 among at least one open analysis set stored in the database previously constructed using the fourth learning model, and An open analysis set is checked (S305), and predictive information is generated using the open analysis set according to the check result, or predictive information is generated using at least one input keyword confirmed in step S303 (S307). . That is, as a result of the confirmation in step S305, if the open analysis set is confirmed, predictive information is generated using this, and if the open analysis set is not confirmed, at least one input data (at least One input keyword) is used to generate prediction information.

그 다음으로, 서버(100)는 그 예측정보를 제1 사용자 단말(210)로 송신하고, 그 에측정보와 그에 대응하는 적어도 하나의 입력키워드를 분석키워드로서 하께 포함하는 분석세트를 생성하여 기 구축된 데이터베이스에 저장한다(S311). 이때, 분석세트는 제1 사용자 단말(210)을 사용하는 사용자의 설정에 따라 공개분석세트로 저장되거나, 비공개분석세트로 저장된다. 이로써, 기 구축된 데이터베이스에는 적어도 하나의 공개분석세트 및/또는 적어도 하나의 비공개분석세트가 저장될 수 있다. Next, the server 100 transmits the prediction information to the first user terminal 210, and generates an analysis set including the prediction information and at least one input keyword corresponding to the prediction information as an analysis keyword. stored in the database (S311). In this case, the analysis set is stored as an open analysis set or a closed analysis set according to the setting of the user using the first user terminal 210 . Accordingly, at least one open analysis set and/or at least one closed analysis set may be stored in the pre-built database.

그 다음으로, 서버(100)는 기 설정된 주기에 따라 기 구축된 데이터베이스 상에 저장된 공개분석세트들 간 또는, 공개분석세트 및 비공개분석세트 간의 병합가능여부를 확인하고(S313), 그 확인 결과, 병합 가능한 분석세트들이 확인된 경우에는 제4 학습모델을 이용하여 그 병합 가능한 분석세트들 간 병합을 수행함으로써 기 구축된 데이터베이스를 업데이트 한다(S321). 이때, 제4 학습모델은 데이터 병합을 위해 사전 학습된 모델로서, 병합 가능한 분석세트들을 입력하면 하나의 분석세트로 병합되어 생성될 수 있다.Next, the server 100 checks whether it is possible to merge between open analysis sets stored in a pre-established database or between an open analysis set and a closed analysis set according to a preset cycle (S313), and as a result of the check, When analysis sets that can be merged are identified, the previously built database is updated by performing merging between the analysis sets that can be merged using the fourth learning model (S321). In this case, the fourth learning model is a model pre-learned for data merging, and can be generated by merging analysis sets that can be merged into one analysis set.

다만, 병합 가능한 분석세트들 중 비공개분석세트가 존재하는 경우에는 병합을 수행하기에 앞서 그 비공개분석세트에 대응하는 사용자 단말로 병합가능알림을 송신하여 병합이 허용되면, 그때 병합을 수행하도록 한다.However, if a non-public analysis set exists among analysis sets that can be merged, a merge possibility notification is transmitted to the user terminal corresponding to the non-public analysis set prior to merging, and if merging is permitted, merging is performed at that time.

예를 들어, S313 단계의 확인 결과, 제1 사용자 단말(210)의 공개분석세트 및 제2 사용자 단말(220)의 비공개분석세트 간 병합이 가능한 것으로 확인된 경우, 그 분석세트를 저장할 시에 공개를 허용하여 공개분석세트로 저장한 제1 사용자 단말(210)에게는 병합가능알림을 송신하지 않고, 비공개분석세트로 저장한 제2 사용자 단말(220)에게만 병합가능알림을 송신한다(S315).For example, as a result of the check in step S313, if it is confirmed that the merge between the open analysis set of the first user terminal 210 and the private analysis set of the second user terminal 220 is possible, the analysis set is disclosed when the analysis set is stored. A mergeable notification is not transmitted to the first user terminal 210 that has been allowed and stored as an open analysis set, but a mergeable notification is transmitted only to the second user terminal 220 that has been stored as an undisclosed analysis set (S315).

그 다음으로, 제2 사용자 단말(220)이 그 병합가능알림을 확인한 후(S317), 그 병합을 허용하는 경우에는 그 병합가능알림 대한 응답으로 병합요청을 송신한다(S319). 이후, 서버(100)는 제2 사용자 단말(220)로부터 병합요청이 수신되면, 그때 병합을 수행하도록 한다(S321).Next, after the second user terminal 220 confirms the merging possible notification (S317), and when the merging is allowed, it transmits a merging request as a response to the merging possible notification (S319). Thereafter, when a merge request is received from the second user terminal 220, the server 100 performs merging (S321).

즉, 도 16의 S315 단계 내지 S319 단계는 병합 가능한 분석세트들 중 비공개분석세트가 존재하는 경우에만 수행되는 것으로, 병합 가능한 분석세트들이 모두 공개분석세트인 경우에는 생략될 수 있다.That is, steps S315 to S319 of FIG. 16 are performed only when there is an undisclosed analysis set among mergeable analysis sets, and may be omitted if all mergeable analysis sets are open analysis sets.

도 17은 본 개시의 일 실시예에 따른 분석세트의 구성을 나타내는 도면이다.17 is a diagram showing the configuration of an analysis set according to an embodiment of the present disclosure.

도 17을 참조하면, 분석세트는 제1 분석정보(121), 제2 분석정보(122) 및 제3 분석정보(123)를 포함하는 예측정보와, 그 예측정보를 생성하기 위해 수신되는 적어도 하나의 입력데이터를 분석키워드(110)로서 포함한다(적어도 하나의 입력데이터가 분석키워드로 저장되는 바, 그 식별번호를 동일하게 표시함).Referring to FIG. 17, an analysis set includes prediction information including first analysis information 121, second analysis information 122, and third analysis information 123, and at least one received to generate the prediction information. The input data of is included as the analysis keyword 110 (at least one input data is stored as an analysis keyword, and its identification number is identically indicated).

도 18은 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 방법에서 공개분석세트의 존재 여부에 따라 예측정보를 생성하는 구체적인 동작을 나타내는 순서도이다.18 is a flowchart illustrating a specific operation of generating prediction information according to whether an open analysis set exists in an artificial intelligence-based database management method according to an embodiment of the present disclosure.

도 18을 참조하면, 서버(100)는 적어도 하나의 입력키워드 중 적어도 하나를 포함하는 공개분석세트를 확인하고(S410), 그 확인 결과, 공개분석세트가 확인되면, 그 확인된 공개분석세트를 이용하여 예측정보를 생성한다(S420).Referring to FIG. 18, the server 100 checks the open analysis set including at least one of the at least one input keyword (S410), and if the open analysis set is confirmed as a result of the check, the identified open analysis set is selected. Prediction information is generated by using (S420).

한편, 서버(100)는 공개분석세트가 미확인되면, 즉, 확인되지 않으면, 웹 크롤링을 기반으로 적어도 하나의 입력데이터에 대한 분석데이터를 생성하여 새로운 예측정보를 생성하고(S430), 그 새로운 예측정보를 이용하여 기 구축된 데이터베이스를 업데이트 한다(S440)On the other hand, if the open analysis set is unconfirmed, that is, if it is not confirmed, the server 100 generates new prediction information by generating analysis data for at least one input data based on web crawling (S430), and the new prediction Updating the previously built database using the information (S440)

도 19은 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 방법에서 적어도 하나의 입력키워드 및 공개분석세트에 포함된 적어도 하나의 분석키워드 간 동일 여부에 따라 예측정보를 생성하는 구체적인 동작을 나타내는 순서도이다.19 is a flowchart illustrating a specific operation of generating prediction information according to whether at least one input keyword and at least one analysis keyword included in an open analysis set are identical in an artificial intelligence-based database management method according to an embodiment of the present disclosure. am.

도 19를 참조하면, 서버(100)는 확인된 공개분석세트에 포함된 적어도 하나의 분석키워드를 확인하고(S431), 적어도 하나의 입력키워드 및 적어도 하나의 분석키워드 간 동일 여부를 확인한다(S432).Referring to FIG. 19, the server 100 checks at least one analysis keyword included in the confirmed open analysis set (S431), and checks whether the at least one input keyword and at least one analysis keyword are identical (S432). ).

그 확인 결과, 공개분석세트에 포함된 분석키워드 및 적어도 하나의 입력키워드가 완전하게 동일한 경우, 서버(100)는 확인된 공개분석세트에 포함되 분석데이터를 그대로 이용하여 예측정보를 생성한다(S433).As a result of the confirmation, if the analysis keyword included in the open analysis set and at least one input keyword are completely the same, the server 100 generates prediction information by using the analysis data included in the confirmed open analysis set as it is (S433). ).

한편, 그 확인 결과, 공개분석세트에 포함된 분석키워드가 적어도 하나의 입력키워드와 일부만 동일한 경우, 그 분석키워드가 포함하고 있는 키워드를 제외한 나머지 키워드를 적어도 하나의 검색데이터로 추출하고(S434), 웹 크롤링을 기반으로 적어도 하나의 검색키워드를 이용하여 데이터를 수집한다(S435). 이때, 수집된 데이터는 적어도 하나의 검색키워드와 연관도를 갖는 적어도 하나의 키워드 및 문장/문단 중 적어도 하나일 수 있다.On the other hand, as a result of the confirmation, if the analysis keyword included in the open analysis set is identical to at least one input keyword only in part, extracting the remaining keywords excluding the keyword included in the analysis keyword as at least one search data (S434), Data is collected using at least one search keyword based on web crawling (S435). In this case, the collected data may be at least one of at least one keyword and sentence/paragraph having a degree of relevance with at least one search keyword.

그 다음으로, 서버(100)는 S435 단계에 의해 수집된 데이터를 이용하여 추가분석세트를 생성하고, 제4 학습모델을 이용하여 그 확인된 공개분석세트 및 추가분석세트를 병합한다(S437). 이로써, 병합된 두 세트에 대한 예측정보를 생성할 수 있다(S438).Next, the server 100 generates an additional analysis set using the data collected in step S435, and merges the confirmed open analysis set and additional analysis set using the fourth learning model (S437). In this way, it is possible to generate prediction information for the two merged sets (S438).

이때, 서버(100)는 단순히 두 분석세트를 합쳐서 저장하는 것이 아니라, 하나의 분석세트로 통합하여 그 분석데이터를 확장하기 위해 분석키워드(110)를 통합한 후, 도 5 내지 도 12의 구체적인 동작들을 통해 제1 분석정보, 제2 분석정보 및 제3 분석정보를 생성하고, 그에 대한 각각의 관계도를 생성하여 저장하도록 한다. 이 경우에는 키워드를 추출하기 위해 제1 학습모델을 이용하고, 제3 예측데이터를 생성할 시 새로운 문장을 생성하기 위해 제2 학습모델을 이용하게 된다.At this time, the server 100 does not simply store the two analysis sets together, but integrates them into one analysis set to expand the analysis data, after integrating the analysis keywords 110, the specific operations of FIGS. 5 to 12 The first analysis information, the second analysis information, and the third analysis information are generated through , and respective relationship diagrams thereof are created and stored. In this case, the first learning model is used to extract keywords, and the second learning model is used to generate new sentences when generating third prediction data.

앞서 설명한 바와 같이 각 정보들은 추출된 키워드들에 대한 관계도를 포함하는데, 이 관계도는 제3 학습모델을 통해 positive, negative, neutral, unknown으로 그 관계가 형성될 수 있다. 이를 위해, 학습 시, 적어도 하나의 학습데이터를 직접 라벨링하여 각 문장에서 키워드들 사이의 관계를 입력하도록 하고, 그 라벨링 된 적어도 하나의 학습데이터를 트랜스포머(transformer) 기반 제3 학습모델을 통해 학습하여 모든 문장에 대한 키워드들 사이의 관계를 예측하도록 한다. 그 키워드들이 관계도 예측을 통해서 출력되는 모든 조합을 학습데이터에서 나오는 수로 카운트하고, 그 카운트된 학습데이터를 토대로 키워드들 간 유사도를 산출한다. 여기서, 유사도의 의미는 카워드들 간의 상관관계(correlation)을 의미한다. 유사도 점수가 1에 가까울수록 두 키워드들 간에는 밀접한 연관이 있음을 의미하고, 0에 가까울수록 서로 독립적인 것을 의미할 수 있다. 즉, 제3 학습모델에 적어도 하나의 키워드를 입력하면, 유사도 순으로 키워드들이 출력되고, 그 키워드들 간의 관계는 1차 관계부터 n차까지의 복잡한 관계를 출력할 수 있다. 그렇기 때문에, 제3 학습모델에 입력하는 키워드가 많을수록 교집합적으로 연관되는 정보들을 정교하게 제공받을 수 있다.As described above, each piece of information includes a relationship diagram for the extracted keywords, and the relationship can be formed as positive, negative, neutral, or unknown through the third learning model. To this end, during learning, at least one learning data is directly labeled to input the relationship between keywords in each sentence, and the labeled at least one learning data is learned through a transformer-based third learning model. Predict the relationship between keywords for all sentences. All combinations of the keywords output through the relationship prediction are counted as a number from the learning data, and the similarity between the keywords is calculated based on the counted learning data. Here, the similarity means a correlation between keywords. The closer the similarity score is to 1, the closer the two keywords are to each other, and the closer to 0, the closer the two keywords are to each other. That is, when at least one keyword is input to the third learning model, the keywords are output in order of similarity, and the relationship between the keywords may output a complex relationship from the first to the nth order. Therefore, as the number of keywords input to the third learning model increases, intersectingly related information can be elaborately provided.

도 20은 본 개시의 일 실시예에 따라 각각 하나의 단일 키워드를 포함하는 분석세트들 간의 관계를 나타내는 관계도의 일 예를 나타내는 도면이다.20 is a diagram illustrating an example of a relationship diagram showing a relationship between analysis sets each including one single keyword according to an embodiment of the present disclosure.

도 21은 본 개시의 일 실시예에 따라 입력데이터로서 각각 복수의 키워드를 포함하는 분석세트들 간의 관계를 나타내는 관계도의 일 예를 나타내는 도면이다.21 is a diagram illustrating an example of a relationship diagram showing a relationship between analysis sets each including a plurality of keywords as input data according to an embodiment of the present disclosure.

도 20 및 도 21은 앞서 설명한 도 13 및 도 14와 그 기본적인 개념은 유사하지만, 도 20은 두 분석세트를 병합할 시, 두 분석세트에 각각 포함된 단일 키워드 간 연결 관계를 시각적으로 표시한 것이고, 도 21은 두 분석세트에 각각 포함된 복수의 키워드 간 연결 관계를 시각적으로 표시한 것이다, 20 and 21 are similar in basic concept to FIGS. 13 and 14 described above, but FIG. 20 visually displays the connection relationship between single keywords respectively included in the two analysis sets when merging the two analysis sets. , FIG. 21 visually displays the connection relationship between a plurality of keywords included in each of the two analysis sets.

구체적으로, 도 20을 참조하면, 제1 분석세트 및 제2 분석세트에 포함된 각각의 분석키워드가 단일 키워드인 경우, 제1 분석세트 및 제2 분석세트 각각의 단일 키워드를 제1-1 타겟키워드 및 제2-1 타겟키워드로 표시하고, 제1-1 타겟키워드 및 제2-1 타겟키워드와 제1차 내지 제n차의 연결 관계를 갖는 적어도 하나의 추출키워드를 연결한다.Specifically, referring to FIG. 20 , when each analysis keyword included in the first analysis set and the second analysis set is a single keyword, a single keyword in each of the first analysis set and the second analysis set is set to the 1-1 target. The keyword and the 2-1st target keyword are displayed, and the 1-1st target keyword and the 2-1st target keyword are connected with at least one extraction keyword having a 1st to nth order connection relationship.

도 20의 경우, 제1-1 타겟키워드와 1차 연결관계를 갖는 제8 추출키워드와, 제2-1 타겟키워드와 1차 연결 관계를 갖는 제2 추출키워드가 제9 추출키워드를 통해 연결됨에 따라, 제9 추출키워드는 제1-1 타겟키워드 및 제2-1 타겟키워드의 공통키워드가 될 수 있으며, 이를 시각적으로 상이하게 표시할 수 있다. 또한, 제1-1 타겟키워드와 1차 연결 관계를 갖는 제10 추출키워드와, 제2-1 타겟키워드와 1차 연결 관계를 갖는 제4 추출키워드가 제14 추출키워드를 통해 연결됨에 따라, 제14 추출키워드 또한 제1-1 타겟키워드 및 제2-1 타겟키워드의 공통키워드가 될 수 있으며, 이 또한 시각적으로 상이하게 표시할 수 있다. 또한, 그 각각의 교집합 영역을 A 및 B와 같이 표시할 수 있다.In the case of FIG. 20, the 8th extraction keyword having a primary connection relationship with the 1-1 target keyword and the 2nd extraction keyword having a primary connection relationship with the 2-1 target keyword are connected through the 9th extraction keyword. Accordingly, the ninth extracted keyword may be a common keyword of the 1-1 target keyword and the 2-1 target keyword, and may be visually displayed differently. In addition, as the 10th extraction keyword having a primary connection relationship with the 1-1 target keyword and the 4th extraction keyword having a primary connection relationship with the 2-1 target keyword are connected through the 14th extraction keyword, 14 The extraction keyword may also be a common keyword of the 1-1 target keyword and the 2-1 target keyword, and this may also be visually displayed differently. In addition, the respective intersection regions can be indicated as A and B.

한편, 도 21을 참조하면, 제1 분석세트 및 제2 분석세트에 포함된 각각의 분석키워드가 복수의 키워드인 경우, 제1 분석세트의 복수의 키워드를 제1-1 타겟키워드 및 제1-2 타겟키워드로 표시하고, 제2 분석세트의 복수의 키워드를 제2-1 타겟키워드 및 제2-2 타겟키워드로 표시한 후, 제1-1 타겟키워드, 제1-2 타겟키워드, 제2-1 타겟키워드 및 제2-2 타겟키워드와 제1차 내지 제n차의 연결 관계를 갖는 적어도 하나의 추출키워드를 연결한다.Meanwhile, referring to FIG. 21 , when each of the analysis keywords included in the first analysis set and the second analysis set is a plurality of keywords, the plurality of keywords in the first analysis set are the 1-1 target keyword and the 1-1 target keyword. 2 target keyword, displaying a plurality of keywords of the second analysis set as the 2-1 target keyword and the 2-2 target keyword, and then the 1-1 target keyword, the 1-2 target keyword, and the second target keyword The -1 target keyword and the 2-2 target keyword are connected with at least one extraction keyword having a 1st to nth order connection relationship.

도 21의 경우, 제1-1 타겟키워드와 1차 연결관계를 갖는 제1 추출키워드, 제1-2와 1차 연결 관계를 갖는 제4 추출키워드, 제2-1 타겟키워드와 1차 연결 관계를 갖는 제5 추출키워드 및 제2-2 타겟키워드와 1차 연결 관계를 갖는 재9 추출키워드가 모두 제10 추출키워드를 통해 연결됨에 따라, 제10 추출키워드는 제1-1 타겟키워드, 제1-2 타겟키워드, 제2-1 타겟키워드 및 제2-2 타겟키워드의 공통키워드가 될 수 있으며, 이를 시각적으로 상이하게 표시할 수 있다. 또한, 그 각각의 교집합 영역을 A와 같이 표시할 수 있다.21, the first extraction keyword having a primary connection relationship with the 1-1 target keyword, the fourth extraction keyword having a primary connection relationship with the 1-2, and the primary connection relationship with the 2-1 target keyword As the 5th extraction keyword having and the 9th extraction keyword having a primary connection relationship with the 2-2 target keyword are all connected through the 10th extraction keyword, the 10th extraction keyword is the 1-1 target keyword, the 1st extraction keyword. It may be a common keyword of the -2 target keyword, the 2-1 target keyword, and the 2-2 target keyword, and it may be visually displayed differently. In addition, each intersection region can be expressed as shown in A.

한편, 개시된 실시예들은 컴퓨터에 의해 실행 가능한 명령어를 저장하는 기록매체의 형태로 구현될 수 있다. 명령어는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 프로그램 모듈을 생성하여 개시된 실시예들의 동작을 수행할 수 있다. 기록매체는 컴퓨터로 읽을 수 있는 기록매체로 구현될 수 있다.Meanwhile, the disclosed embodiments may be implemented in the form of a recording medium storing instructions executable by a computer. Instructions may be stored in the form of program codes, and when executed by a processor, create program modules to perform operations of the disclosed embodiments. The recording medium may be implemented as a computer-readable recording medium.

컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터에 의하여 해독될 수 있는 명령어가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다. Computer-readable recording media include all types of recording media in which instructions that can be decoded by a computer are stored. For example, there may be read only memory (ROM), random access memory (RAM), magnetic tape, magnetic disk, flash memory, optical data storage device, and the like.

이상에서와 같이 첨부된 도면을 참조하여 개시된 실시예들을 설명하였다. 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자는 본 개시의 기술적 사상이나 필수적인 특징을 변경하지 않고도, 개시된 실시예들과 다른 형태로 본 개시가 실시될 수 있음을 이해할 것이다. 개시된 실시예들은 예시적인 것이며, 한정적으로 해석되어서는 안 된다.As above, the disclosed embodiments have been described with reference to the accompanying drawings. Those skilled in the art to which the present disclosure pertains will understand that the present disclosure may be implemented in a form different from the disclosed embodiments without changing the technical spirit or essential features of the present disclosure. The disclosed embodiments are illustrative and should not be construed as limiting.

10: 예측정보 제공 시스템 100: 서버
200: 사용자 단말 101: 통신모듈
103: 저장모듈 105: 제어모듈
110: 적어도 하나의 입력데이터 111: 적어도 하나의 유사키워드
112: 적어도 하나의 관련키워드 121: 제1 분석정보
122: 제2 분석정보 123: 제3 분석정보
1211: 제1 키워드리스트 1221: 제2 키워드리스트
1231: 제1 예측데이터 1232: 제2 예측데이터
1233: 제3 예측데이터
20: 예측정보 제공 시스템 100: 서버
210: 제1 사용자 단말 220: 제2 사용자 단말
10: prediction information providing system 100: server
200: user terminal 101: communication module
103: storage module 105: control module
110: at least one input data 111: at least one similar keyword
112: at least one related keyword 121: first analysis information
122: second analysis information 123: third analysis information
1211: first keyword list 1221: second keyword list
1231: first prediction data 1232: second prediction data
1233: third prediction data
20: prediction information providing system 100: server
210: first user terminal 220: second user terminal

Claims (10)

인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템에 있어서,
적어도 하나의 입력데이터를 송신하고, 그에 대한 응답으로 예측정보를 수신하는 사용자 단말; 및
적어도 하나의 입력데이터가 수신되면, 인공지능 기반 제1 학습모델을 통해 기 구축된 데이터베이스를 기반으로 상기 적어도 하나의 입력데이터에 대한 적어도 하나의 유사키워드를 추출하여 제1 분석정보 및 제2 분석정보를 생성하고, 상기 제1 학습모델 및 제2 학습모델을 통해 웹 크롤링을 기반으로 웹 상에서 상기 적어도 하나의 입력데이터에 대한 적어도 하나의 관련키워드 및 적어도 하나의 문장을 추출하고, 상기 적어도 하나의 관련키워드 및 상기 적어도 하나의 문장을 기반으로 제3 분석정보를 생성한 후, 상기 제1 분석정보, 상기 제2 분석정보 및 상기 제3 분석정보를 포함하는 예측정보를 상기 사용자 단말로 송신하는 서버를 포함하며,
상기 제1 분석정보는, 상기 적어도 하나의 유사키워드 중 적어도 하나의 유전자키워드를 이용하여 생성되는 정보이고,
상기 제2 분석정보는, 상기 적어도 하나의 유사키워드에서 상기 적어도 하나의 유전자키워드를 제외한 나머지 키워드 중 기 설정된 조건을 만족하는 적어도 하나의 만족키워드를 이용하여 생성되는 정보이고,
상기 제3 분석정보는, 상기 웹 상에서 추출된 적어도 하나의 관련키워드를 기반으로 생성된 제1 예측데이터, 제2 예측데이터를 포함하고, 상기 웹 상에서 추출된 상기 적어도 하나의 문장을 기반으로 생성된 제3 예측데이터를 포함하는 정보이고,
상기 적어도 하나의 문장은 상기 서버의 상기 제1 학습모델을 통해 추출되며, 상기 적어도 하나의 입력데이터와 기 설정된 제3 임계범위 이내의 유사도를 갖는 문장이고,
상기 제1 예측데이터는, 상기 제1 학습모델을 통해 상기 적어도 하나의 관련키워드 중 유전자키워드를 적어도 하나 이상 추출하여 생성되는 데이터이고,
상기 제2 예측데이터는, 상기 제1 학습모델을 통해 상기 적어도 하나의 관련키워드 중 상기 기 설정된 조건을 만족하는 만족키워드를 적어도 하나 이상 추출하여 생성되는 데이터이고,
상기 제3 예측데이터는, 상기 적어도 하나의 입력데이터가 문장 또는 문단인 경우에만 더 생성되는 데이터로서, 상기 적어도 하나의 문장으로 구성된 문장리스트 및 트랜스포머 기반의 제3 학습모델에 의해 상기 적어도 하나의 문장을 기반으로 생성된 새로운 문장을 포함하는 것을 특징으로 하는,
인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템.
In the predictive information providing system by artificial intelligence-based data analysis,
A user terminal that transmits at least one input data and receives prediction information in response thereto; and
When at least one input data is received, at least one similar keyword for the at least one input data is extracted based on a database pre-established through the artificial intelligence-based first learning model, and the first analysis information and the second analysis information are extracted. generating, extracting at least one related keyword and at least one sentence for the at least one input data on the web based on web crawling through the first learning model and the second learning model; After generating third analysis information based on a keyword and the at least one sentence, a server for transmitting prediction information including the first analysis information, the second analysis information, and the third analysis information to the user terminal. contains,
The first analysis information is information generated using at least one genetic keyword among the at least one similar keyword,
The second analysis information is information generated using at least one satisfactory keyword satisfying a predetermined condition among keywords other than the at least one genetic keyword from the at least one similar keyword,
The third analysis information includes first prediction data and second prediction data generated based on at least one related keyword extracted from the web, and generated based on the at least one sentence extracted from the web. Information including third prediction data,
The at least one sentence is extracted through the first learning model of the server, and is a sentence having a similarity with the at least one input data within a preset third threshold range,
The first prediction data is data generated by extracting at least one genetic keyword from among the at least one related keyword through the first learning model,
The second prediction data is data generated by extracting at least one or more satisfactory keywords satisfying the preset condition from among the at least one related keyword through the first learning model;
The third prediction data is data that is further generated only when the at least one input data is a sentence or a paragraph, and the at least one sentence is generated by a third learning model based on a sentence list composed of the at least one sentence and a transformer. Characterized in that it includes a new sentence generated based on,
Predictive information providing system based on artificial intelligence-based data analysis.
제1항에 있어서,
상기 적어도 하나의 입력데이터는,
단일 키워드, 복수의 키워드, 문장 및 문단 중 적어도 하나의 형태이고,
상기 서버는,
상기 적어도 하나의 입력데이터가 문장 또는 문단인 경우, 상기 제1 학습모델을 통해 상기 문장 또는 상기 문단으로부터 상기 단일 키워드 또는 상기 복수의 키워드를 추출한 후 이용하는 것을 특징으로 하는,
인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템.
According to claim 1,
The at least one input data,
It is in the form of at least one of a single keyword, a plurality of keywords, sentences and paragraphs,
The server,
Characterized in that, when the at least one input data is a sentence or a paragraph, the single keyword or the plurality of keywords are extracted from the sentence or the paragraph through the first learning model and then used.
Predictive information providing system based on artificial intelligence-based data analysis.
제2항에 있어서,
상기 서버는,
상기 적어도 하나의 입력데이터가 단일 키워드인 경우,
상기 제1 학습모델을 통해 상기 기 구축된 데이터베이스를 기반으로 상기 단일 키워드와 기 설정된 제1 임계값 이상의 연관도를 갖는 상기 적어도 하나의 유사키워드를 추출하고, 추출된 상기 적어도 하나의 유사키워드에서 상기 적어도 하나의 유전자키워드를 추출하여 제1 키워드리스트를 생섬함으로써 상기 제1 분석정보를 생성하고, 상기 나머지 키워드에서 상기 기 설정된 조건에 따른 설정키워드와 기 설정된 제2 임계값 이상의 연관도를 갖는 상기 적어도 하나의 만족키워드를 추출하여 제2 키워드리스트를 생성함으로써 상기 제2 분석정보를 생성하고,
상기 제2 학습모델을 통해 상기 웹 크롤링을 기반으로 상기 웹 상에서 상기 단일 키워드와 기 설정된 임계범위 이내의 유사도를 갖는 상기 적어도 하나의 관련키워드를 추출하여 상기 제1 예측데이터 및 상기 제2 예측데이터를 각각 생성함으로써 상기 제3 분석정보를 생성하는 것을 특징으로 하는,
인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템.
According to claim 2,
The server,
When the at least one input data is a single keyword,
Based on the pre-constructed database through the first learning model, the at least one similar keyword having a degree of association with the single keyword and a predetermined first threshold value or higher is extracted, and the at least one similar keyword is extracted from the extracted at least one similar keyword. The first analysis information is generated by extracting at least one genetic keyword and creating a first keyword list, and the at least one having a degree of association of a preset second threshold value or higher with a set keyword according to the preset condition in the remaining keywords. Generating the second analysis information by extracting one satisfactory keyword and generating a second keyword list;
The first prediction data and the second prediction data are obtained by extracting the at least one related keyword having a similarity with the single keyword on the web based on the web crawling through the second learning model and within a predetermined threshold range. Characterized in that the third analysis information is generated by generating each,
Predictive information providing system based on artificial intelligence-based data analysis.
제2항에 있어서,
상기 서버는,
상기 적어도 하나의 입력데이터가 복수의 키워드인 경우,
상기 제1 학습모델을 통해 상기 기 구축된 데이터베이스을 기반으로 상기 복수의 키워드 각각에 대해 기 설정된 제1 임계값 이상의 연관도를 갖는 상기 적어도 하나의 유사키워드를 추출하고, 상기 적어도 하나의 유사키워드에서 상기 적어도 하나의 유전자키워드를 1차적으로 추출하고, 상기 적어도 하나의 유전자키워드 중 상기 복수의 키워드에 포함된 적어도 두 개의 키워드에 공통적으로 연관된 적어도 하나의 제1 공통키워드를 2차적으로 추출하여 제1 키워드리스트를 생성함으로써 상기 제1 분석정보를 생성하고, 상기 나머지 키워드에서 상기 기 설정된 조건에 따른 설정키워드와 기 설정된 제2 임계값 이상의 연관도를 갖는 상기 적어도 하나의 만족키워드를 1차적으로 추출하고, 상기 적어도 하나의 만족키워드 중 상기 복수의 키워드에 포함된 적어도 두 개의 키워드에 공통적으로 연관된 적어도 하나의 제2 공통키워드를 2차적으로 추출하여 제2 키워드리스트를 생성함으로써 상기 제2 분석정보를 생성하고,
상기 제2 학습모델을 통해 상기 웹 크롤링을 기반으로 웹 상에서 상기 복수의 키워드 각각에 대해 기 설정된 제1 임계범위 이내의 유사도를 갖는 상기 적어도 하나의 관련키워드를 추출하고, 상기 제1 학습모델을 통해 상기 적어도 하나의 관련키워드에서 상기 적어도 하나의 유전자키워드를 1차적으로 추출한 후, 상기 적어도 하나의 관련키워드에서 상기 적어도 하나의 유전자키워드를 제외한 상태에서 상기 복수의 키워드에 포함된 적어도 두 개의 키워드에 공통적으로 연관된 적어도 하나의 제3 공통키워드를 2차적으로 추출하여 제1 예측데이터를 생성하고, 상기 제2 학습모델을 통해 상기 적어도 하나의 관련키워드에서 상기 적어도 하나의 유전자키워드를 제외한 상태에서 상기 기 설정된 조건에 따른 설정키워드와 기 설정된 제2 임계범위 이내의 유사도를 갖는 상기 적어도 하나의 예측키워드를 1차적으로 추출하고, 상기 제1 학습모델을 통해 상기 적어도 하나의 예측키워드 중 상기 복수의 키워드에 포함된 적어도 두 개의 키워드에 공통적으로 연관된 적어도 하나의 제4 공통키워드를 2차적으로 추출하여 제2 예측데이터를 생성함으로써 상기 제3 분석정보를 생성하는 것을 특징으로 하는,
인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템.
According to claim 2,
The server,
When the at least one input data is a plurality of keywords,
Based on the pre-built database through the first learning model, the at least one similar keyword having a degree of relevance equal to or higher than a predetermined first threshold value is extracted for each of the plurality of keywords, and the at least one similar keyword is extracted from the at least one similar keyword. A first keyword by first extracting at least one genetic keyword, and secondarily extracting at least one first common keyword commonly associated with at least two keywords included in the plurality of keywords among the at least one genetic keyword. Generating the first analysis information by generating a list, and primarily extracting the at least one satisfaction keyword having a degree of association greater than or equal to a preset second threshold value with a set keyword according to the preset condition from the remaining keywords; generating the second analysis information by generating a second keyword list by secondarily extracting at least one second common keyword commonly associated with at least two keywords included in the plurality of keywords among the at least one satisfying keyword; and ,
Based on the web crawling through the second learning model, the at least one related keyword having a similarity within a preset first threshold range is extracted for each of the plurality of keywords on the web, and through the first learning model After the at least one genetic keyword is primarily extracted from the at least one related keyword, the at least one genetic keyword is excluded from the at least one related keyword, and the at least two keywords included in the plurality of keywords are common. At least one third common keyword associated with is secondarily extracted to generate first prediction data, and the at least one genetic keyword is excluded from the at least one related keyword through the second learning model. The at least one prediction keyword having a similarity with a set keyword according to a condition within a predetermined second threshold range is primarily extracted, and included in the plurality of keywords among the at least one prediction keyword through the first learning model. Characterized in that the third analysis information is generated by generating second prediction data by secondarily extracting at least one fourth common keyword commonly associated with at least two keywords,
Predictive information providing system based on artificial intelligence-based data analysis.
삭제delete 제4항에 있어서,
상기 기 구축된 데이터베이스는, 적어도 하나의 근거데이터를 포함하고,
상기 연관도는, 상기 적어도 하나의 근거데이터 상에서 상기 적어도 하나의 입력데이터가 설명된 설명횟수이고,
상기 서버는,
상기 제1 키워드리스트, 상기 제2 키워드리스트, 상기 제1 예측데이터, 상기 제2 예측데이터 및 상기 제3 예측데이터에 각각 포함되는 키워드가 복수개인 경우, 복수개의 키워드를 기 설정된 우선순위를 기반으로 정렬하고, 상기 복수개의 키워드 각각에 대응하는 근거데이터를 함께 병기하되,
상기 근거데이터는, 학술, 논문, 저서 및 프로젝트 중 적어도 하나를 포함하는 것을 특징으로 하는,
인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템.
According to claim 4,
The pre-built database includes at least one source data,
The degree of association is the number of times the at least one input data is explained on the at least one ground data,
The server,
When there are a plurality of keywords respectively included in the first keyword list, the second keyword list, the first prediction data, the second prediction data, and the third prediction data, a plurality of keywords are selected based on preset priorities. Sort, and write together the evidence data corresponding to each of the plurality of keywords,
Characterized in that the evidence data includes at least one of academics, theses, books, and projects,
Predictive information providing system based on artificial intelligence-based data analysis.
제4항에 있어서,
상기 제1 분석정보는, 상기 적어도 하나의 입력데이터 및 상기 적어도 하나의 유사키워드로부터 추출된 상기 적어도 하나의 유전자키워드 간 관계도를 더 포함하고,
상기 제2 분석정보는, 상기 적어도 하나의 입력데이터 및 상기 적어도 하나의 유사키워드로부터 추출된 상기 적어도 하나의 만족키워드 간 관계도를 더 포함하고,
상기 제3 분석정보는, 상기 적어도 하나의 입력데이터 및 상기 적어도 하나의 관련키워드로부터 추출된 상기 적어도 하나의 유전자키워드 간 관계도를 포함하며,
상기 관계도는, 상기 적어도 하나의 입력데이터 각각에 대한 해당 키워드의 직접 연관 또는 간접 연관 여부에 따라 제1차 내지 제n차로 연결되어 표시되는 것을 특징으로 하는,
인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템.
According to claim 4,
The first analysis information further includes a relationship between the at least one input data and the at least one genetic keyword extracted from the at least one similar keyword,
The second analysis information further includes a relationship between the at least one input data and the at least one satisfaction keyword extracted from the at least one similar keyword;
The third analysis information includes a relationship between the at least one input data and the at least one genetic keyword extracted from the at least one related keyword,
Characterized in that the relationship diagram is connected and displayed in the first to nth order according to whether the keyword is directly related or indirectly related to each of the at least one input data,
Predictive information providing system based on artificial intelligence-based data analysis.
제7항에 있어서,
상기 제1 학습모델은, 상기 기 구축된 데이터베이스에서 상기 적어도 하나의 입력데이터와 연관도를 갖는 키워드 또는 문장을 추출하기 위해 학습된 모델이고,
상기 제2 학습모델은, 상기 웹 상에서 상기 적어도 하나의 입력데이터와 유사도를 갖는 키워드 또는 문장을 추출하기 위해 학습된 모델이고,
상기 제3 학습모델은, 상기 제1 분석정보, 상기 분석정보 및 상기 제3 분석정보를 생성할 시에 상기 관계도를 생성하고, 상기 제3 예측데이터를 생성할 시에 상기 새로운 문장을 생성하기 위해 학습된 모델인 것을 특징으로 하는,
인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템.
According to claim 7,
The first learning model is a model learned to extract a keyword or sentence having a degree of association with the at least one input data from the pre-built database,
The second learning model is a model learned to extract a keyword or sentence having a similarity with the at least one input data on the web,
The third learning model generates the relationship diagram when generating the first analysis information, the analysis information, and the third analysis information, and generates the new sentence when generating the third prediction data. Characterized in that it is a model learned for
Predictive information providing system based on artificial intelligence-based data analysis.
제1항에 있어서,
상기 서버는,
기 설정된 제1 주기에 따라 웹 크롤링을 통해 상기 기 구축된 데이터베이스를 업데이트하고, 상기 업데이트가 수행될 때마다 또는 기 설정된 제2 주기마다 상기 예측정보를 생성하여 상기 사용자 단말로 송신하는 것을 특징으로 하는,
인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템.
According to claim 1,
The server,
Updating the pre-built database through web crawling according to a preset first cycle, generating the prediction information every time the update is performed or every preset second cycle, and transmitting it to the user terminal ,
Predictive information providing system based on artificial intelligence-based data analysis.
인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템의 서버에 의해 수행되는, 인공지능 기반 데이터 분석에 의한 예측정보 제공 방법에 있어서,
사용자 단말로부터 적어도 하나의 입력데이터가 수신되면, 인공지능 기반 제1 학습모델을 통해 기 구축된 데이터베이스를 기반으로 상기 적어도 하나의 입력데이터에 대한 적어도 하나의 유사키워드를 추출하는 단계;
상기 적어도 하나의 유사키워드를 기반으로 제1 분석정보 및 제2 분석정보를 생성하는 단계;
상기 제1 학습모델 및 제2 학습모델을 통해 웹 크롤링을 기반으로 웹 상에서 상기 적어도 하나의 입력데이터에 대한 적어도 하나의 관련키워드 및 적어도 하나의 문장을 추출하고, 상기 적어도 하나의 관련키워드 및 상기 적어도 하나의 문장을 기반으로 제3 분석정보를 생성하는 단계;
상기 제1 분석정보, 상기 제2 분석정보 및 상기 제3 분석정보를 포함하는 예측정보를 상기 사용자 단말로 송신하는 단계를 포함하며,
상기 제1 분석정보는, 상기 적어도 하나의 유사키워드 중 적어도 하나의 유전자키워드를 이용하여 생성되는 정보이고,
상기 제2 분석정보는, 상기 적어도 하나의 유사키워드에서 상기 적어도 하나의 유전자키워드를 제외한 나머지 키워드 중 기 설정된 조건을 만족하는 적어도 하나의 만족키워드를 이용하여 생성되는 정보이고,
상기 제3 분석정보는, 상기 웹 상에서 추출된 적어도 하나의 관련키워드를 기반으로 생성된 제1 예측데이터, 제2 예측데이터를 포함하고, 상기 웹 상에서 추출된 상기 적어도 하나의 문장을 기반으로 생성된 제3 예측데이터를 포함하는 정보이고,
상기 적어도 하나의 문장은 상기 서버의 상기 제1 학습모델을 통해 추출되며, 상기 적어도 하나의 입력데이터와 기 설정된 제3 임계범위 이내의 유사도를 갖는 문장이고,
상기 제1 예측데이터는, 상기 제1 학습모델을 통해 상기 적어도 하나의 관련키워드 중 유전자키워드를 적어도 하나 이상 추출하여 생성되는 데이터이고,
상기 제2 예측데이터는, 상기 제1 학습모델을 통해 상기 적어도 하나의 관련키워드 중 상기 기 설정된 조건을 만족하는 만족키워드를 적어도 하나 이상 추출하여 생성되는 데이터이고,
상기 제3 예측데이터는, 상기 적어도 하나의 입력데이터가 문장 또는 문단인 경우에만 더 생성되는 데이터로서, 상기 적어도 하나의 문장으로 구성된 문장리스트 및 트랜스포머 기반의 제3 학습모델에 의해 상기 적어도 하나의 문장을 기반으로 생성된 새로운 문장을 포함하는 것을 특징으로 하는,
인공지능 기반 데이터 분석에 의한 예측정보 제공 방법.
In the method of providing predictive information by artificial intelligence-based data analysis, performed by a server of a system for providing predictive information by artificial intelligence-based data analysis,
If at least one input data is received from a user terminal, extracting at least one similar keyword for the at least one input data based on a database previously constructed through a first artificial intelligence-based learning model;
generating first analysis information and second analysis information based on the at least one similar keyword;
At least one related keyword and at least one sentence for the at least one input data are extracted from the web based on web crawling through the first learning model and the second learning model, and the at least one related keyword and the at least one sentence are extracted. generating third analysis information based on one sentence;
Transmitting prediction information including the first analysis information, the second analysis information, and the third analysis information to the user terminal,
The first analysis information is information generated using at least one genetic keyword among the at least one similar keyword,
The second analysis information is information generated using at least one satisfactory keyword satisfying a predetermined condition among keywords other than the at least one genetic keyword from the at least one similar keyword,
The third analysis information includes first prediction data and second prediction data generated based on at least one related keyword extracted from the web, and generated based on the at least one sentence extracted from the web. Information including third prediction data,
The at least one sentence is extracted through the first learning model of the server, and is a sentence having a similarity with the at least one input data within a preset third threshold range,
The first prediction data is data generated by extracting at least one genetic keyword from among the at least one related keyword through the first learning model,
The second prediction data is data generated by extracting at least one or more satisfactory keywords satisfying the preset condition from among the at least one related keyword through the first learning model;
The third prediction data is data that is further generated only when the at least one input data is a sentence or a paragraph, and the at least one sentence is generated by a third learning model based on a sentence list composed of the at least one sentence and a transformer. Characterized in that it includes a new sentence generated based on,
A method for providing predictive information through artificial intelligence-based data analysis.
KR1020220131780A 2022-10-13 2022-10-13 System and method for providing predictive information by artificial intelligence-based data analysis KR102522954B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220131780A KR102522954B1 (en) 2022-10-13 2022-10-13 System and method for providing predictive information by artificial intelligence-based data analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220131780A KR102522954B1 (en) 2022-10-13 2022-10-13 System and method for providing predictive information by artificial intelligence-based data analysis

Publications (1)

Publication Number Publication Date
KR102522954B1 true KR102522954B1 (en) 2023-04-17

Family

ID=86133811

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220131780A KR102522954B1 (en) 2022-10-13 2022-10-13 System and method for providing predictive information by artificial intelligence-based data analysis

Country Status (1)

Country Link
KR (1) KR102522954B1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101007613B1 (en) 2003-03-12 2011-01-12 토요엔지니어링 카부시키가이샤 Data registration/search support device using a keyword
KR20120043977A (en) * 2010-10-27 2012-05-07 한국생명공학연구원 A method for retrieving a gene-disease-chemical relationship using multi-dimensional indexes from huge bio-literatures
KR20220069327A (en) * 2020-11-20 2022-05-27 주식회사 오퍼스원 Method of operating a providing health care services reflects the DNA test information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101007613B1 (en) 2003-03-12 2011-01-12 토요엔지니어링 카부시키가이샤 Data registration/search support device using a keyword
KR20120043977A (en) * 2010-10-27 2012-05-07 한국생명공학연구원 A method for retrieving a gene-disease-chemical relationship using multi-dimensional indexes from huge bio-literatures
KR20220069327A (en) * 2020-11-20 2022-05-27 주식회사 오퍼스원 Method of operating a providing health care services reflects the DNA test information

Similar Documents

Publication Publication Date Title
US10489512B2 (en) Utilizing machine learning models to identify insights in a document
CN110569366B (en) Text entity relation extraction method, device and storage medium
Tubishat et al. Improved whale optimization algorithm for feature selection in Arabic sentiment analysis
US20190188260A1 (en) Capturing rich response relationships with small-data neural networks
Gupta et al. Application and techniques of opinion mining
KR102169382B1 (en) Artificial Intelligence-Based Personalized Expert Cross Matching and Proposal System
US20200027446A1 (en) Visualization interface for voice input
CN110633577A (en) Text desensitization method and device
US20200117751A1 (en) Context-aware computing apparatus and method of determining topic word in document using the same
Jeong et al. How to improve text summarization and classification by mutual cooperation on an integrated framework
US20160085757A1 (en) Information display device, information display method, and storage medium
US20200074002A1 (en) Query recommendation to locate an application programming interface
Tyagi et al. Demystifying the role of natural language processing (NLP) in smart city applications: background, motivation, recent advances, and future research directions
McQuillan Zero waste design thinking
Song et al. Modeling knowledge need awareness using the problematic situations elicited from questions and answers
KR102522954B1 (en) System and method for providing predictive information by artificial intelligence-based data analysis
KR102503443B1 (en) System and method for managing databases based on artificial intelligence
CN113807089A (en) Text data processing method, neural network training method and related equipment
Zhang et al. A multi-domain named entity recognition method based on part-of-speech attention mechanism
KR102198780B1 (en) Method for providing correlation based internet search service specialized in professional areas
Walker et al. Reductionism or holism? The two faces of biology
Düntsch et al. Simplifying contextual structures
Indira et al. Profile screening and recommending using natural language processing (NLP) and leverage Hadoop framework for big data
Ito et al. Concept cloud-based sentiment visualization for financial reviews
Iorliam et al. A Comparative Analysis of Generative Artificial Intelligence Tools for Natural Language Processing

Legal Events

Date Code Title Description
GRNT Written decision to grant