KR102503443B1 - 인공지능 기반 데이터베이스 관리 시스템 및 방법 - Google Patents

인공지능 기반 데이터베이스 관리 시스템 및 방법 Download PDF

Info

Publication number
KR102503443B1
KR102503443B1 KR1020220131779A KR20220131779A KR102503443B1 KR 102503443 B1 KR102503443 B1 KR 102503443B1 KR 1020220131779 A KR1020220131779 A KR 1020220131779A KR 20220131779 A KR20220131779 A KR 20220131779A KR 102503443 B1 KR102503443 B1 KR 102503443B1
Authority
KR
South Korea
Prior art keywords
analysis
keyword
analysis set
open
information
Prior art date
Application number
KR1020220131779A
Other languages
English (en)
Inventor
이동근
Original Assignee
이동근
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이동근 filed Critical 이동근
Priority to KR1020220131779A priority Critical patent/KR102503443B1/ko
Application granted granted Critical
Publication of KR102503443B1 publication Critical patent/KR102503443B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/235Update request formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 개시는 인공지능 기반 데이터베이스 관리 시스템 및 방법에 관한 것으로, 적어도 하나의 입력키워드를 송신하고, 그에 대한 응답으로 예측정보를 수신하는 적어도 하나의 사용자 단말; 및 적어도 하나의 입력키워드가 수신되면, 인공지능 기반 제4 학습모델을 이용하여 기 구축된 데이터베이스 상에서 상기 적어도 하나의 입력키워드 중 적어도 하나를 포함하는 공개분석세트를 확인하고, 공개분석세트가 확인되는 경우, 상기 확인된 공개분석세트를 이용하여 예측정보를 생성하고, 공개분석세트가 확인되지 않는 경우, 웹 크롤링을 통해 상기 적어도 하나의 입력키워드에 대한 분석데이터를 생성하여 새로운 예측정보를 생성하는 서버를 포함하며, 상기 기 구축된 데이터베이스는, 적어도 하나의 공개분석세트 및 적어도 하나의 비공개분석세트를 포함하며, 상기 서버는, 상기 새로운 예측정보 생성한 후, 설정정보에 따라 상기 적어도 하나의 입력키워드에 대한 공개분석세트 또는 비공개분석세트를 생성하여 상기 기 구축된 데이터베이스를 업데이트할 수 있다.

Description

인공지능 기반 데이터베이스 관리 시스템 및 방법{SYSTEM AND METHOD FOR MANAGING DATABASES BASED ON ARTIFICIAL INTELLIGENCE}
본 개시는 인공지능 기반 데이터베이스 관리 시스템 및 방법에 관한 것이다. 보다 상세하게는, 본 개시는 인공지능 기반으로 적어도 하나의 분석세트를 포함하는 데이터베이스 관리 시스템 및 방법에 관한 것이다.
일반적으로, 사용자가 키워드를 입력하면, 그 키워드를 포함하는 모든 데이터들을 데이터베이스 또는 웹 상에서 서치하여 제공하게 된다.
사용자는 그 제공된 데이터들을 일일이 확인하여 자신이 찾고자 하는 데이터에 해당하는지를 직접 판단하는 것은 물론, 그 데이터들을 각 카테고리 별로 직접 분류하여야 한다.
그렇기 때문에, 사용자는 원하는 데이터를 획득하고, 이를 분류하기 위해 번거로운 작업을 수행해야하고, 그 작업에 많은 시간을 소요해야만 하므로, 시간적 및 경제적 낭비가 발생할 수밖에 없다.
따라서, 인공지능을 기반으로 사용자로부터 입력되는 입력데이터를 이용하여 원하는 키워드를 기 설정된 카테고리 별로 분류하고, 그에 대응하는 근거데이터와 함께 제공하도록 하고, 아울러 그 생성된 정보들을 데이터베이스 상에 구축하여 관리하도록 하는 기술이 개발될 필요가 있다.
한국등록특허공보 제10-1007613호 (등록일: 2011년 01월 05일)
본 개시에 개시된 실시예는 사용자 단말의 요청에 따라 예측정보를 생성한 후, 그에 대한 분석세트를 저장하여 관리함으로써, 추후 다른 사용자 단말의 요청이 발생하면, 그 분석세트를 활용하도록 하여 보다 효율적인 정보 제공이 가능하도록 하는 것은 물론, 병합 가능한 분석세트를 병합하도록 함에 따라 데이터베이스에 대한 계속적인 증강이 가능하도록 하는 인공지능 기반 데이터베이스 관리 시스템 및 방법을 제공하는 것이다.
본 개시가 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상술한 기술적 과제를 달성하기 위한 본 개시에 일 측면에 따른 인공지능 기반 데이터베이스 관리 시스템은, 적어도 하나의 입력키워드를 송신하고, 그에 대한 응답으로 예측정보를 수신하는 적어도 하나의 사용자 단말; 및 적어도 하나의 입력키워드가 수신되면, 인공지능 기반 제4 학습모델을 이용하여 기 구축된 데이터베이스 상에서 상기 적어도 하나의 입력키워드 중 적어도 하나를 포함하는 공개분석세트를 확인하고, 공개분석세트가 확인되는 경우, 상기 확인된 공개분석세트를 이용하여 예측정보를 생성하고, 공개분석세트가 확인되지 않는 경우, 웹 크롤링을 통해 상기 적어도 하나의 입력키워드에 대한 분석데이터를 생성하여 새로운 예측정보를 생성하는 서버를 포함하며, 상기 기 구축된 데이터베이스는, 적어도 하나의 공개분석세트 및 적어도 하나의 비공개분석세트를 포함하며, 상기 서버는, 상기 새로운 예측정보 생성한 후, 설정정보에 따라 상기 적어도 하나의 입력키워드에 대한 공개분석세트 또는 비공개분석세트를 생성하여 상기 기 구축된 데이터베이스를 업데이트할 수 있다.
또한, 본 개시에 일 측면에 따른 인공지능 기반 데이터베이스 관리 방법은, 사용자 단말로부터 적어도 하나의 입력키워드가 수신되면, 기 구축된 데이터베이스 상에서 상기 적어도 하나의 입력키워드 중 적어도 하나를 포함하는 공개분석세트를 확인하는 단계; 공개분석세트가 확인되는지 여부에 따라 상이한 방식으로 예측정보를 생성하는 단계; 및 상기 예측정보를 상기 사용자 단말로 송신하는 단계;를 포함하며, 상기 예측정보를 생성하는 단계는, 공개분석세트가 확인되는 경우, 상기 확인된 공개분석세트를 이용하여 예측정보를 생성하고, 공개분석세트가 확인되지 않는 경우, 웹 크롤링을 통해 상기 적어도 하나의 입력키워드에 대한 분석데이터를 생성하여 새로운 예측정보를 생성하며, 상기 예측정보를 생성하는 단계는, 설정정보에 따라 상기 적어도 하나의 입력키워드에 대한 공개분석세트 또는 비공개분석세트를 생성하여 상기 기 구축된 데이터베이스를 업데이트 하는 단계를 더 포함하며, 상기 기 구축된 데이터베이스는, 적어도 하나의 공개분석세트 및 적어도 하나의 비공개분석세트를 포함할 수 있다.
이 외에도, 본 개시를 구현하기 위한 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램이 더 제공될 수 있다.
이 외에도, 본 개시를 구현하기 위한 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공될 수 있다.
본 개시의 전술한 과제 해결 수단에 의하면, 사용자 단말의 요청에 따라 예측정보를 생성한 후, 그에 대한 분석세트를 저장하여 관리함으로써, 추후 다른 사용자 단말의 요청이 발생하면, 그 분석세트를 활용하도록 하여 보다 효율적인 정보 제공이 가능하도록 하는 것은 물론, 병합 가능한 분석세트를 병합하도록 함에 따라 데이터베이스에 대한 계속적인 증강이 가능하도록 한다.
또한, 본 개시의 전술한 과제 해결 수단에 의하면, 다중 모드를 지원하는 적어도 하나의 응원용 조명장치 각각의 상태를 확인하여 관리하고, 연결 이력을 기반으로 빠른 연결이 가능하도록 함으로써, 신속하고 원활한 연결이 가능하도록 한다.
본 개시의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템의 네트워크 구조를 나타내는 도면
도 2는 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 방법을 나타내는 흐름도
도 3은 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템에서 서버의 구성을 나타내는 도면
도 4는 본 개시의 일 실시예에 따라 적어도 하나의 입력데이터를 기반으로 생성되는 제1 분석정보, 제2 분석정보 및 제3 분석정보의 구성을 나타내는 도면
도 5는 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 방법을 나타내는 순서도
도 6은 본 개시의 제1 실시예에 따라 제1 분석정보를 생성하는 동작을 나타내는 순서도
도 7은 본 개시의 제1 실시예에 따라 제2 분석정보를 생성하는 동작을 나타내는 순서도
도 8은 본 개시의 제1 실시예에 따라 제3 분석정보를 생성하는 동작을 나타내는 순서도
도 9는 본 개시의 제2 실시예에 따라 제1 분석정보를 생성하는 동작을 나타내는 순서도
도 10은 본 개시의 제2 실시예에 따라 제2 분석정보를 생성하는 동작을 나타내는 순서도
도 11은 본 개시의 제2 실시예에 따라 제3 분석정보를 생성하는 동작을 나타내는 순서도
도 12는 본 개시의 제3 실시예에 따라 제3 분석정보를 생성하는 동작을 나타내는 순서도
도 13은 본 개시의 제1 실시예에 따라 입력데이터로서 단일 키워드가 수신된 경우에 생성되는 관계도의 일 예를 나타내는 도면
도 14는 본 개시의 제2 실시예에 따라 입력데이터로서 단일 키워드가 수신된 경우에 생성되는 관계도의 일 예를 나타내는 도면
도 15는 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 시스템의 네트워크 구조를 나타내는 도면
도 16은 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 방법을 나타내는 흐름도
도 17은 본 개시의 일 실시예에 따른 분석세트의 구성을 나타내는 도면
도 18은 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 방법에서 공개분석세트의 존재 여부에 따라 예측정보를 생성하는 구체적인 동작을 나타내는 도면
도 19은 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 방법에서 적어도 하나의 입력키워드 및 공개분석세트에 포함된 적어도 하나의 분석키워드 간 동일 여부에 따라 예측정보를 생성하는 구체적인 동작을 나타내는 도면
도 20은 본 개시의 일 실시예에 따라 각각 하나의 단일 키워드를 포함하는 분석세트들 간의 관계를 나타내는 관계도의 일 예를 나타내는 도면
도 21은 본 개시의 일 실시예에 따라 입력데이터로서 각각 복수의 키워드를 포함하는 분석세트들 간의 관계를 나타내는 관계도의 일 예를 나타내는 도면
본 개시의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 개시는 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 개시가 완전하도록 하고, 본 개시가 속하는 기술 분야의 통상의 기술자에게 본 개시의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 개시는 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 개시를 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 개시의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 개시가 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
본 개시 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 개시가 실시예들의 모든 요소들을 설명하는 것은 아니며, 본 개시가 속하는 기술분야에서 일반적인 내용 또는 실시예들 간에 중복되는 내용은 생략한다. 명세서에서 사용되는 "부" 또는 “모듈”이라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부" 또는 “모듈”은 어떤 역할들을 수행한다. 그렇지만 "부" 또는 “모듈”은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부" 또는 “모듈”은 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부" 또는 “모듈”은 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부" 또는 “모듈”들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부" 또는 “모듈”들로 결합되거나 추가적인 구성요소들과 "부" 또는 “모듈”들로 더 분리될 수 있다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 간접적으로 연결되어 있는 경우를 포함하고, 간접적인 연결은 무선 통신망을 통해 연결되는 것을 포함한다.
또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
명세서 전체에서, 어떤 부재가 다른 부재 "상에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.
제1, 제2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위해 사용되는 것으로, 구성요소가 전술된 용어들에 의해 제한되는 것은 아니다.
단수의 표현은 문맥상 명백하게 예외가 있지 않는 한, 복수의 표현을 포함한다.
각 단계들에 있어 식별부호는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다.
이하 설명에서 사용되는 용어에 대하여 정의하면 하기와 같다.
본 개시를 설명함에 있어서, 서버로 한정하였으나, 컴퓨터 및/또는 휴대용 단말기를 더 포함하거나, 또는 그 중 어느 하나의 형태가 될 수 있다.
여기에서, 상기 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop), 태블릿 PC, 슬레이트 PC 등을 포함할 수 있다.
상기 서버는 외부 장치와 통신을 수행하여 정보를 처리하는 서버로써, 애플리케이션 서버, 컴퓨팅 서버, 데이터베이스 서버, 파일 서버, 게임 서버, 메일 서버, 프록시 서버 및 웹 서버 등을 포함할 수 있다.
상기 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), WiBro(Wireless Broadband Internet) 단말, 스마트 폰(Smart Phone) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치와 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD) 등과 같은 웨어러블 장치를 포함할 수 있다.
이하 첨부된 도면들을 참고하여 본 개시의 작용 원리 및 실시예들에 대해 설명한다.
도 1은 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템의 네트워크 구조를 나타내는 도면이다.
도 1을 참조하면, 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템(이하, '에측정보 제공 시스템'이라 칭함)(10)은 서버(100) 및 사용자 단말(200)을 포함할 수 있다.
서버(100)는 사용자 단말(200)로부터 적어도 하나로부터 입력데이터가 수신되면, 인공지능 기반 제1 학습모델을 이용하여 기 구축된 데이터베이스를 기반으로 적어도 하나의 입력데이터에 대한 적어도 하나의 유사키워드를 추출하여 제1 분석정보 및 제2 분석정보를 생성한다. 또한, 서버(100)는 제1 학습모델 및 제2 학습모델을 이용하여 웹 크롤링을 기반으로 적어도 하나의 입력데이터에 대한 적어도 하나의 관련키워드를 추출하여 제3 분석정보를 생성한 후, 제1 분석정보 내지 제3 분석정보를 이용하여 예측정보를 생성한다. 이후, 서버(100)는 사용자 단말(200)로 그 예측정보를 송신한다. 여기서, 제1 학습모델은 LSTM(Long short-term memory), BERT(Bidirectional encoder representations form transformers) 기반 자연어 처리(Natural Language Processing, NLP) 방식을 이용할 수 있고, 제2 학습모델은 코사인 유사도, 자카드 유사도, 맨하탄 유사도, 유클리드 거리 및 마할라노비스 거리 중 적어도 하나를 이용할 수 있다. 구체적으로, 제1 분석정보 내지 제3 분석정보를 생성함에 있어서, 제1 학습모델을 통해 키워드를 추출하고, 제2 학습모델을 통해 유사도를 산출한다.
사용자 단말(200)은 예측정보를 제공받고자 하는 사용자의 단말로서, 적어도 하나의 입력데이터를 서버(100)로 송신함으로써, 그 적어도 하나의 입력데이터에 대한 예측정보의 제공을 요청할 수 있다. 그 요청에 따라 사용자 단말(200)은 서버(100)로부터 예측정보를 수신한다.
이때, 도 1에서는 사용자 단말(200)을 하나만 도시하였으나, 적어도 하나 이상일 수 있으며, 그 개수를 한정하지 않는다. 다만, 이하에서 도 1 내지 도 14를 설명함에 있어서는 그 설명의 편의를 위하여 서버(100)가 사용자 단말(200)로 예측정보를 제공하는 경우로 한정하여 설명하도록 한다.
도 2는 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 방법을 나타내는 흐름도이다.
도 2를 참조하면, 사용자는 사용자 단말(200)를 통해 적어도 하나의 입력데이터를 입력하여 서버(100)로 송신한다(S101).
서버(100)는 사용자 단말(200)로부터 적어도 하나의 입력데이터가 수신되면, 그 적어도 하나의 입력데이터를 인공지능 기반 제1 학습모델에 입력함으로써, 제1 분석정보 내지 제3 분석정보를 생성한다.
구체적으로, 서버(100)는 적어도 하나의 입력데이터에 대한 적어도 하나의 유사키워드를 추출하여 제1 분석정보를 생성한 후(S103), 제2 분석정보를 생성한다(S105). 그 다음으로, 서버(100)는 웹 크롤링을 기반으로 적어도 하나의 입력데이터에 대한 적어도 하나의 관련키워드를 추출하여 제3 분석정보를 생성한 다(S107). 그러나, 이는 하나의 실시예일 뿐, S103 단계 내지 S107 단계는 동시에 수행될 수 있으며 그 생성되는 순서는 변경 가능하다.
그 다음으로, 서버(100)는 S103 단계 내지 S107 단계에 의해 생성된 제1 분석정보, 제2 분석정보 및 제3 분석정보를 이용하여 예측정보를 생성한다.
도 3은 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템에서 서버의 구성을 나타내는 도면이다.
도 3을 참조하면, 본 개시의 일 실시예에 따른 서버(100)는 통신모듈(110), 저장모듈(130) 및 제어모듈(150)을 포함할 수 있다.
통신모듈(110)은 외부 장치와 통신을 가능하게 하는 하나 이상의 구성 요소를 포함할 수 있으며, 예를 들어, 유선 통신 모듈, 무선 통신 모듈 및 근거리 통신 모듈 중 적어도 하나를 포함할 수 있으며, 이를 기반으로 신호를 송수신하도록 한다.
여기서, 유선 통신 모듈은, 지역 통신(Local Area Network; LAN) 모듈, 광역 통신(Wide Area Network; WAN) 모듈 또는 부가가치 통신(Value Added Network; VAN) 모듈 등 다양한 유선 통신 모듈뿐만 아니라, USB(Universal Serial Bus), HDMI(High Definition Multimedia Interface), DVI(Digital Visual Interface), RS-232(recommended standard), 전력선 통신, 또는 POTS(plain old telephone service) 등 다양한 케이블 통신 모듈을 포함할 수 있다.
무선 통신 모듈은 와이파이(Wifi) 모듈, 와이브로(Wireless broadband) 모듈 외에도, GSM(global System for Mobile Communication), CDMA(Code Division Multiple Access), WCDMA(Wideband Code Division Multiple Access), UMTS(universal mobile telecommunications system), TDMA(Time Division Multiple Access), WLAN(Wireless LAN), DLNA(Digital Living Network Alliance), WiBro(Wireless Broadband), WiMAX(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access), HSUPA(High Speed Uplink Packet Access), LTE(Long Term Evolution), 4G, 5G, 6G 등 다양한 무선 통신 방식을 지원하는 무선 통신 모듈을 포함할 수 있다.
근거리 통신 모듈은 근거리 통신(Short range communication)을 위한 것으로서, 블루투스(Bluetooth??), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee, NFC(Near Field Communication), Wi-Fi(Wireless-Fidelity), Wi-Fi Direct, Wireless USB(Wireless Universal Serial Bus) 기술 중 적어도 하나를 이용하여, 근거리 통신을 지원할 수 있다.
저장모듈(130)은 서버(100)의 다양한 기능을 지원하는 데이터 및/또는 각종 정보들을 저장한다. 서버(100)에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application)), 서버(100)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 외부 서버로부터 다운로드 될 수 있다. 한편, 응용 프로그램은, 저장모듈(130)에 구비된 적어도 하나의 메모리에 저장되고, 서버(100) 상에 설치되어, 제어모듈(150)에 구비된 적어도 하나의 프로세서에 의하여 동작(또는 기능)을 수행하도록 구동될 수 있다.
한편, 적어도 하나의 메모리는 플래시 메모리 타입(flash memory type), 하드 디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory) 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 아울러, 메모리는 일시적, 영구적 또는 반영구적으로 정보를 저장할 수 있으며, 내장형 또는 탈착형으로 제공될 수 있다.
저장모듈(130)은 인공지능을 활용한 데이터 분석을 통해 예측정보를 제공하기 위한 데이터베이스를 구축하여 구비할 수 있다.
제어모듈(150)은 적어도 하나의 프로세서를 구비할 수 있으며, 서버(100) 내 모든 구성들을 제어하여 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나, 적어도 하나의 메모리에 저장된 명령어, 알고리즘, 응용 프로그램을 실행하여 각종 프로세스를 수행하며, 인공지능을 활용한 데이터 분석을 통해 예측정보를 제공하거나, 데이터베이스를 관리하기 위한 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.
구체적으로, 제어모듈(150)은, 사용자 단말(200)로부터 적어도 하나의 입력데이터가 수신되면, 그 적어도 하나의 입력데이터를 인공지능 기반 제1 학습모델에 입력함으로써, 제1 분석정보 내지 제3 분석정보를 생성하여 예측정보를 생성한다.
이 제어모듈(150)이 제1 분석정보 내지 제3 분석정보를 생성하는 동작에 대해서는 이하의 도 5 내지 도 12를 기반으로 구체적으로 설명하도록 한다. 그에 앞서, 도 4를 기반으로 제1 분석정보 내지 제3 분석정보의 구성에 대해 설명하도록 한다.
도 4는 본 개시의 일 실시예에 따라 적어도 하나의 입력데이터를 기반으로 생성되는 제1 분석정보, 제2 분석정보 및 제3 분석정보의 구성을 나타내는 도면이다.
서버(100)는 적어도 하나의 입력키워드(110)를 이용하여 기 구축된 데이터베이스 상에서 적어도 하나의 유사키워드(111)를 추출하고, 또한 웹 크롤링을 통해 웹 상에서 적어도 하나의 관련키워드(112)를 추출한다.
이후, 서버(100)는 적어도 하나의 유사키워드(111)로부터 적어도 하나의 유전자키워드를 추출하여 제1 키워드리스트(1211)를 생성하고, 적어도 하나의 유사키워드(111)에서 적어도 하나의 유전자키워드를 제외한 나머지 키워드 중 기 설정된 조건을 만족하는 적어도 하나의 만족키워드를 추출하여 제2 키워드리스트(1221)를 생성한다. 이때, 유전자키워드는 유전자명일 수 있고, 기 설정된 조건은 사용자가 데이터 분석에 이용하고자 하는 키워드가 추출될 수 있도록 설정하는 조건으로서 특정 기술분야 등이 될 수 있다. 예를 들어, 기 설정된 조건은 생물학분야에 대한 키워드로서, 질병, 약물, 주제어, 미생물 등에 해당할 수 있다.
즉, 제1 키워드리스트(1211)는 적어도 하나의 유사키워드(111)로부터 추출된 적어도 하나의 유전자키워드를 리스트 형태로 생성한 것이고, 제2 키워드리스트(1221)는 적어도 하나의 유사키워드(111)로부터 추출된 적어도 하나의 만족키워드를 리스트 형태로 생성한 것이다.
한편, 서버(100)는 적어도 하나의 관련키워드(112)로부터 적어도 하나의 유전자키워드를 추출하여 제1 예측데이터(1231)를 생성하고, 적어도 하나의 관련키워드(112)에서 적어도 하나의 유전자키워드를 제외한 나머지 키워드 중 기 설정된 조건을 만족하는 적어도 하나의 만족키워드를 추출하여 제2 예측데이터(1232)를 생성한다.
즉, 제1 예측데이터(1231)는 적어도 하나의 관련키워드(112)로부터 추출된 적어도 하나의 유전자키워드를 리스트 형태로 생성한 것이고, 제1 예측데이터(1232)는 적어도 하나의 관련키워드(112)로부터 추출된 적어도 하나의 만족키워드를 리스트 형태로 생성한 것이다.
한편, 서버(100)는 적어도 하나의 입력데이터(110)의 형태에 따라 제3 예측데이터(1233)를 더 생성하여 제3 분석정보에 포함시킬 수 있다. 이때, 제3 예측데이터(1233)는 적어도 하나의 입력데이터(110)를 이용하여 웹 크롤링을 통해 웹 상에서 추출되는 적어도 하나의 유사문장을 이용하여 생성되는 데이터이다. 구체적으로, 제3 예측데이터(1233)는 적어도 하나의 유사문장을 리스트 형태로 생성한 문장리스트 및 그 적어도 하나의 유사문장을 제2 학습모델에 입력하여 생성된 새로운 문장을 포함한다.
한편, 제1 키워드리스트, 제2 키워드리스트, 제1 예측데이터, 제2 예측데이터 및 제3 예측데이터에 각각 포함되는 키워드들은 기 설정된 우선순위를 기반으로 정렬되며, 그 각각의 키워드에 대응하는 근거데이터를 함께 병기할 수 있다. 이때, 근거데이터는 각종 학술 논문, 저서, 프로젝트 등일 수 있다.
도 5는 본 개시의 일 실시예에 따른 인공지능 기반 데이터 분석에 의한 예측정보 제공 방법을 나타내는 순서도로서, 예측정보 제공 시스템(10)의 서버(100)에서 수행되는 동작이다.
도 5를 참조하면, 서버(100)는 사용자 단말(200)로부터 적어도 하나의 입력데이터가 수신되면(S210), 그 적어도 하나의 입력데이터를 이용하여 제1 학습모델을 통해 기 구축된 데이터베이스를 기반으로 적어도 하나의 유사키워드를 추출한다(S220).
그 다음으로, 서버(100)는 S220 단계에 의해 추출된 적어도 하나의 유사키워드를 이용하여 제1 분석정보 및 제2 분석정보를 생성한다(S230).
그 다음으로, 서버(100)는 그 적어도 하나의 입력데이터를 이용하여 제1 학습모델을 통해 웹 상에서 적어도 하나의 관련키워드를 추출하고(S240), 그 추출된 적어도 하나의 관련키워드를 이용하여 제3 분석정보를 생성한다(S250).
이때, 제1 분석정보 내지 제3 분석정보는 S210 단계에 의해 수신된 적어도 하나의 입력데이터의 형태에 따라 상이한 동작을 통해 생성될 수 있다. 예를 들어, 적어도 하나의 입력데이터가 단일 키워드인 경우(제1 실시예), 복수의 키워드인 경우(제2 실시예) 및 문장/문단인 경우(제3 실시예)로 구분될 수 있다. 다만, 제3 실시예의 경우, 즉, 적어도 하나의 입력데이터가 문장 또는 문단인 경우에는 그 문장 또는 문단으로부터 단일 키워드 또는 복수의 키워드를 추출하여 이용하도록 할 수 있다.
도 6은 본 개시의 제1 실시예에 따라 제1 분석정보를 생성하는 동작을 나타내는 순서도이다.
도 6을 참조하면, 적어도 하나의 입력데이터가 단일 키워드인 제1 실시예의 경우, 서버(100)는 제1 학습모델을 통해 기 구축된 데이터베이스 상에 저장된 적어도 하나의 근거데이터를 구성하는 키워드 및 단일 키워드 각각의 연관도를 산출하고(S2311), 그 산출된 각각의 연관도를 기반으로 기 설정된 제1 임계값 이상의 연관도를 갖는 적어도 하나의 유사키워드를 추출한다(S2312).
그 다음으로, 서버(100)는 제1 학습모델을 통해 S2312 단계에 의해 추출된 적어도 하나의 유사키워드 중 적어도 하나의 유전자키워드를 추출하고(S2313), 그 추출된 적어도 하나의 유전자키워드를 이용하여 제1 키워드리스트를 생성한다(S2314).
그 다음으로, 서버(100)는 제1 키워드리스트를 이용하여 제1 분석정보를 생성한다(S2315). 이때, 제1 분석정보는 제1 키워드리스트 외에 제1 키워드리스트를 구성하는 적어도 하나의 유전자키워드 및 단일 키워드 간 관계도를 제3 학습모델을 통해 생성하여 더 포함할 수 있다.
도 7은 본 개시의 제1 실시예에 따라 제2 분석정보를 생성하는 동작을 나타내는 순서도이다.
도 7을 참조하면, 적어도 하나의 입력데이터가 단일 키워드인 제1 실시예의 경우, 서버(100)는 제1 학습모델을 통해 도 6의 S2312 단계에 의해 추출된 적어도 하나의 유사키워드 중 S2313 단계의 의해 추출된 적어도 하나의 유전자키워드를 제외한 나머지 키워드만을 추출하고(S2321), 그 나머지 키워드 및 기 설정된 조건에 따른 설정키워드 각각의 연관도를 산출한다(S2322).
그 다음으로, 서버(100)는 S2322 단계에 의해 산출된 연관도를 기반으로 기 설정된 제2 임계값 이상의 연관도를 갖는 적어도 하나의 만족키워드를 추출하고(S2323), 그 추출된 적어도 하나의 만족키워드를 이용하여 제2 키워드리스트를 생성한다(S2324).
그 다음으로, 서버(100)는 제2 키워드리스트를 이용하여 제2 분석정보를 생성한다(S2325). 이때, 제2 분석정보는 제2 키워드리스트 외에 제2 키워드리스트를 구성하는 적어도 하나의 만족키워드 및 단일 키워드 간 관계도를 제3 학습모델을 통해 생성하여 더 포함할 수 있다.
도 8은 본 개시의 제1 실시예에 따라 제3 분석정보를 생성하는 동작을 나타내는 순서도이다.
도 8을 참조하면, 적어도 하나의 입력데이터가 단일 키워드인 제1 실시예의 경우, 서버(100)는 제2 학습모델을 통해 웹 상에 존재하는 키워드 및 단일 키워드 각각의 유사도 산출하고(S2331), 그 산출된 각각의 유사도를 기반으로 기 설정된 제1 임계범위 이내의 유사도를 갖는 적어도 하나의 관련키워드를 추출한다(S2332).
여기서, 제2 학습모델은 단일모델, 합성모델 및 Node2vec 모델 중 어느 하나의 형태로 구성될 수 있으며, 유사도는 코사인 유사도, 자카드 유사도, 맨하탄 유사도, 유클리드 거리 및 마할라노비스 거리 중 적어도 하나를 이용하여 산출될 수 있다. 또한, 그 외 유사도를 산출할 수 있는 방식이라면 적용 가능하며, 그 종류 및 개수를 한정하지 않는다.
그 다음으로, 서버(100)는 제1 학습모델을 통해 S2332 단계에 의해 추출된 적어도 하나의 관련키워드 중 적어도 하나의 유전자키워드를 추출하고(S2333), 그 추출된 적어도 하나의 유전자키워드를 이용하여 제1 예측데이터를 생성한다(S2334).
그 다음으로, 서버(100)는 제1 학습모델을 통해 S2332 단계에 의해 추출된 적어도 하나의 관련키워드 중 S2333 단계의 의해 추출된 적어도 하나의 유전자키워드를 제외한 나머지 키워드만을 추출하고(S2335), 제2 학습모델을 통해 그 나머지 키워드 및 기 설정된 조건에 따른 설정키워드 각각의 유사도를 산출한다(S2336).
그 다음으로, 서버(100)는 S2336 단계에 의해 산출된 유사도를 기반으로 기 설정된 제2 임계범위 이내의 유사도를 갖는 적어도 하나의 예측키워드를 추출하고(S2337), 그 추출된 적어도 하나의 예측키워드를 이용하여 제2 예측데이터를 생성한다(S2338).
그 다음으로, 서버(100)는 제1 예측데이터 및 제2 예측데이터를 이용하여 제3 분석정보를 생성한다(S2339). 이때, 제1 예측데이터 및 제2 예측데이터 각각은 그 내(제1 예측데이터/제2 예측데이터)에 포함된 각각의 키워드들 및 단일 키워드 간 관계도를 더 포함할 수 있다.
도 9는 본 개시의 제2 실시예에 따라 제1 분석정보를 생성하는 동작을 나타내는 순서도이다.
도 9를 참조하면, 적어도 하나의 입력데이터가 복수의 키워드인 제2 실시예의 경우, 서버(100)는 제1 학습모델을 통해 기 구축된 데이터베이스 상에 저장된 적어도 하나의 근거데이터를 구성하는 키워드 및 복수의 키워드 각각의 연관도를 산출하고(S2341), 그 산출된 각각의 연관도를 기반으로 기 설정된 제1 임계값 이상의 연관도를 갖는 적어도 하나의 유사키워드를 추출한다(S2342).
그 다음으로, 서버(100)는 제1 학습모델을 통해 S2342 단계에 의해 추출된 적어도 하나의 유사키워드 중 적어도 하나의 유전자키워드를 1차적으로 추출하고(S2343), 그 추출된 적어도 하나의 유전자키워드 중 복수의 키워드 각각에 공통적으로 연관된 적어도 하나의 제1 공통키워드를 2차적으로 추출한다(S2344).
그 다음으로, 서버(100)는 제1 학습모델을 통해 S2344 단계에 의해 추출된 적어도 하나의 제1 공통키워드를 이용하여 제1 키워드리스트를 생성하고(S2345), 그 제1 키워드리스트를 이용하여 제1 분석정보를 생성한다(S2346). 이때, 제1 분석정보는 제1 키워드리스트 외에 제1 키워드리스트를 구성하는 적어도 하나의 유전자키워드 및 복수의 키워드 간 관계도를 제3 학습모델을 통해 생성하여 더 포함할 수 있다.
도 10은 본 개시의 제2 실시예에 따라 제2 분석정보를 생성하는 동작을 나타내는 순서도이다.
도 10을 참조하면, 적어도 하나의 입력데이터가 복수의 키워드인 제2 실시예의 경우, 서버(100)는 제1 학습모델을 통해 도 9의 S2342 단계에 의해 추출된 적어도 하나의 유사키워드 중 S2343 단계의 의해 추출된 적어도 하나의 유전자키워드를 제외한 나머지 키워드만을 추출하고(S2351), 그 나머지 키워드 및 기 설정된 조건에 따른 설정키워드 각각의 연관도를 산출한다(S2352).
그 다음으로, 서버(100)는 제1 학습모델을 통해 S2352 단계에 의해 산출된 연관도를 기반으로 기 설정된 제2 임계값 이상의 연관도를 갖는 적어도 하나의 만족키워드를 1차적으로 추출하고(S2353), 그 추출된 적어도 하나의 만족키워드 중 복수의 키워드 각각에 공통적으로 연관된 적어도 하나의 제2 공통키워드를 2차적으로 추출한다(S2354).
그 다음으로, 서버(100)는 제1 학습모델을 통해 S2354 단계에 의해 추출된 적어도 하나의 제2 공통키워드를 이용하여 제2 키워드리스트를 생성하고(S2355), 그 제2 키워드리스트를 이용하여 제2 분석정보를 생성한다(S2356). 이때, 제2 분석정보는 제2 키워드리스트 외에 제2 키워드리스트를 구성하는 적어도 하나의 만족키워드 및 복수의 키워드 간 관계도를 제3 학습모델을 통해 생성하여 더 포함할 수 있다.
도 11은 본 개시의 제2 실시예에 따라 제3 분석정보를 생성하는 동작을 나타내는 순서도이다.
도 11을 참조하면, 적어도 하나의 입력데이터가 복수의 키워드인 제2 실시예의 경우, 서버(100)는 제2 학습모델을 통해 웹 상에 존재하는 키워드 및 복수의 키워드 각각의 유사도 산출하고(S2361), 그 산출된 각각의 유사도를 기반으로 기 설정된 제1 임계범위 이내의 유사도를 갖는 적어도 하나의 관련키워드를 추출한다(S2362).
그 다음으로, 서버(100)는 제1 학습모델을 통해 S2362 단계에 의해 추출된 적어도 하나의 관련키워드 중 적어도 하나의 유전자키워드를 1차적으로 추출하고(S2363), 그 추출된 적어도 하나의 유전자키워드 중 복수의 키워드 각각에 공통적으로 연관된 적어도 하나의 제3 공통키워드를 2차적으로 추출한다(S2364).
그 다음으로, 서버(100)는 S2364 단계에 의해 추출된 적어도 하나의 제3 공통키워드를 이용하여 제1 예측데이터를 생성하고(S2365), 앞서 S2362 단계에 의해 추출된 적어도 하나의 관련키워드 중 S2363 단계의 의해 추출된 적어도 하나의 유전자키워드를 제외한 나머지 키워드만을 추출한다(S2366).
그 다음으로, 서버(100)는 제2 학습모델을 통해 그 나머지 키워드 및 기 설정된 조건에 따른 설정키워드 각각의 유사도를 산출하고(S2367), 그 산출된 유사도를 기반으로 기 설정된 제2 임계범위 이내의 유사도를 갖는 적어도 하나의 예측키워드를 1차적으로 추출한다(S2368).
그 다음으로, 서버(100)는 제1 학습모델을 통해 S2368 단계에 의해 추출된 적어도 하나의 예측키워드 중 복수의 키워드 각각에 공통적으로 연관된 적어도 하나의 제4 공통키워드를 2차적으로 추출한다(S2369), 그 적어도 하나의 제4 공통키워드를 이용하여 제2 예측데이터를 생성한다(S2370).
그 다음으로, 서버(100)는 제1 예측데이터 및 제2 예측데이터를 이용하여 제3 분석정보를 생성한다(S2371). 이때, 제1 예측데이터 및 제2 예측데이터 각각은 그 내(제1 예측데이터/제2 예측데이터)에 포함된 각각의 키워드들 및 복수의 키워드 간 관계도를 더 포함할 수 있다.
도 12는 본 개시의 제3 실시예에 따라 제3 분석정보를 생성하는 동작을 나타내는 순서도이다.
앞서 설명한 바와 같이, 적어도 하나의 입력데이터가 문장 또는 문단인 제3 실시예의 경우에는 그 문장 또는 문단으로부터 단일 키워드 또는 복수의 키워드를 추출한 후, 그 추출된 단일 키워드 또는 복수의 키워드를 이용하여 제3 분석정보를 생성하도록 할 수 있다. 이때, 서버(100)는 제1 학습모델을 통해 문장 또는 문단으로부터 단일 키워드 또는 복수의 키워드를 추출할 수 있다. 즉, 특정 키워드를 추출하기 위해서 텍스트 코퍼스(corpus)를 제작하여 자연어 처리를 통해 문장에서 특정 텍스트들을 추출한 후, 그룹으로 분류한다.
그렇기 때문에, 단일 키워드가 추출된 경우에는 도 8과 동일한 동작을 수행하여 제1 예측데이터 및 제2 예측데이터를 생성하고, 복수의 키워드가 추출된 경우에는 도 11과 동일한 동작을 수행하여 제1 예측데이터 및 제2 예측데이터를 생성한다.
다만, 적어도 하나의 입력데이터가 문장 또는 문단인 제3 실시예의 경우에는, 추가적으로 제3 예측데이터를 생성하는 동작을 더 수행하여 제3 분석정보를 생성하는 것으로, 도 12는 그 제3 에측데이터를 생성하는 동작에 관한 것이다.
도 12를 참조하면, 서버(100)는 제2 학습모델을 통해 적어도 하나의 입력데이터로서 수신된 문장(또는 문단에 포함된 문장들) 및 앞서 S2362 단계에 의해 추출된 적어도 하나의 관련키워드를 포함하는 문장 각각의 유사도를 산출하고(S2372), 그 산출된 유사도를 기반으로 기 설정된 제3 임계범위 이내의 유사도를 갖는 적어도 하나의 유사문장을 추출한다(S2373).
그 다음으로, 서버(100)는 그 추출된 적어도 하나의 유사문장을 이용하여 제3 예측데이터를 생성하고(S2374), 제1 예측데이터, 제2 예측데이터 및 제3 예측데이터를 이용하여 제3 분석정보를 생성한다(S2375). 이때, 제3 예측데이터는 S2373 단계에서 제1 학습모델에 의해 추출된 적어도 하나의 유사문장을 리스트 형태로 구성한 문장리스트와, 그 추출된 적어도 하나의 유사문장을 이용하여 제3 학습모델에 의해 생성된 새로운 문장을 포함한다.
앞서, 제1 실시예 내지 제3 실시예에서 제1 분석정보 및 제2 분석정보를 생성하기 위해 이용되는 기 설정된 제1 임계값 및/또는 제2 임계값은 서버(100)의 관리자 또는 사용자 단말(200)의 사용자에 의해 변경되어 설정 가능한 것으로, 그 값이 상이하거나 동일할 수 있으며, 이를 한정하지 않는다. 마찬가지로, 제1 실시예 내지 제3 실시예에서 제3 분석정보를 생성하기 위해 이용되는 기 설정된 제1 임계범위 및/또는 제2 임계범위는 서버(100)의 관리자 또는 사용자 단말(200)의 사용자에 의해 변경되어 설정 가능한 것으로, 그 값이 상이하거나 동일할 수 있으며, 이를 한정하지 않는다.
한편, 키워드를 추출하기 위해 언급되는 연관도는 적어도 하나의 근거데이터 상에서 그 적어도 하나의 입력데이터가 설명된 설명횟수일 수 있다. 즉, 그 설명횟수가 클수록 높은 연관도를 갖는 것으로 판단할 수 있다.
도 13은 본 개시의 제1 실시예에 따라 입력데이터로서 단일 키워드가 수신된 경우에 생성되는 관계도의 일 예를 나타내는 도면이다.
도 13을 참조하면, 적어도 하나의 입력데이터(110)가 단일 키워드인 제1 실시예의 경우, 그 단일 키워드를 타겟 데이터로 표시하고, 이를 기반으로 제1 학습모델을 통해 제1 분석정보 내지 제3 분석정보를 생성할 시에 각각 추출된 적어도 하나의 유전자키워드, 적어도 하나의 만족키워드 및 적어도 하나의 예측데이터를 추출키워드로서 표시한다.
도 13에는 타겟키워드에 대한 추출키워드가 제1 추출키워드 내지 제10 추출키워드로 총 10개가 추출된 경우에 대해 도시한 것으로, 이때, 타겟데이터와 적어도 하나의 근거데이터에서 함께 설명된 제1 추출키워드, 제2 추출키워드, 제3 추출키워드 및 제6 추출키워드는 직접적인 관계를 가지는 것으로, 타겟데이터에 직접 연결하여 타겟데이터와의 제1차 관계를 표시한다. 한편, 타겟데이터와 적어도 하나의 근거데이터 상에서 함께 설명되지는 않았으나, 1차 관계를 갖는 제1 추출키워드, 제2 추출키워드, 제3 추출키워드 및 제6 추출키워드와 적어도 하나의 근거데이터 상에서 함께 설명된 제4 추출키워드, 제5 추출키워드, 제7 추출키워드, 제8추출키워드, 제9 추출키워드 및 제10 키워드를 해당 추출키워드에 연결하여 타겟데이터와의 제2차 관계를 표시한다.
다만, 도 13에는 제2차 관계까지 표시하였으나, 각 키워드 간의 연결 관계에 따라 제1차부터 제n차까지 확장되어 표시될 수 있다.
도 14는 본 개시의 제2 실시예에 따라 입력데이터로서 단일 키워드가 수신된 경우에 생성되는 관계도의 일 예를 나타내는 도면이다.
도 14를 참조하면, 적어도 하나의 입력데이터(110)가 복수의 키워드인 제2 실시예의 경우, 예를 들어, 키워드가 2개 입력되었다고 가정하면, 그 복수의 키워드, 그 2개의 키워드를 각각 제1 타겟키워드 및 제2 타겟키워드로 표시하고, 이를 기반으로 제1 학습모델을 통해 제1 분석정보 내지 제3 분석정보를 생성할 시에 각각 추출된 적어도 하나의 유전자키워드, 적어도 하나의 만족키워드 및 적어도 하나의 예측데이터를 추출키워드로서 표시하되, 그 중 제1 타겟키워드 및 제2 타겟키워드 각각에 공통적으로 연관된 적어도 하나의 제1 공통키워드, 제2 공통키워드, 제3 공통키워드 및 제4 공통키워드를 시각적으로 상이하게 표시한다.
도 14에는 제1 타겟키워드 및 제2 타겟키워드에 대한 추출키워드가 제1 추출키워드 내지 제20 추출키워드로 총 20개가 추출된 경우에 대해 도시한 것이다.
구체적으로, 제1 타겟데이터와 적어도 하나의 근거데이터에서 함께 설명된 제1 추출키워드, 제2 추출키워드, 제3 추출키워드 및 제4 추출키워드는 직접적인 관계를 가지는 것으로, 제1 타겟데이터에 직접 연결하여 제1 타겟데이터와의 제1차 관계를 표시한다. 또한, 제1 타겟데이터와 적어도 하나의 근거데이터 상에서 함께 설명되지는 않았으나, 1차 관계를 갖는 제1 추출키워드, 제2 추출키워드, 제3 추출키워드 및 제4 추출키워드와 적어도 하나의 근거데이터 상에서 함께 설명된 제5 추출키워드, 제6 추출키워드, 제9 추출키워드, 제13 추출키워드, 제15 추출키워드 및 제18 추출키워드를 해당 추출키워드에 연결하여 제1 타겟데이터와의 제2차 관계를 표시한다.
한편, 제2 타겟데이터와 적어도 하나의 근거데이터에서 함께 설명된 제7 추출키워드, 제8 추출키워드, 제11 추출키워드 및 제12 추출키워드는 직접적인 관계를 가지는 것으로, 제2 타겟데이터에 직접 연결하여 제2 타겟데이터와의 제1차 관계를 표시한다. 또한, 제2 타겟데이터와 적어도 하나의 근거데이터 상에서 함께 설명되지는 않았으나, 1차 관계를 갖는 제7 추출키워드, 제8 추출키워드, 제11 추출키워드 및 제12 추출키워드와 적어도 하나의 근거데이터 상에서 함께 설명된 제10 추출키워드, 제6 추출키워드, 제9 추출키워드, 제13 추출키워드, 제14 추출키워드, 제16 추출키워드, 제17 추출키?d드 및 제20 추출키워드를 해당 추출키워드에 연결하여 제2 타겟데이터와의 제2차 관계를 표시한다.
이때, 제1 타겟데이터 및 제2 타겟데이터에 공통적으로 연결 관계를 갖는 제13 추출키워드가 존재하므로, 이를 A와 같이 시각적으로 표시해줄 수 있다.
마찬가지로, 도 14에는 제2차 관계까지 표시하였으나, 각 키워드 간의 연결 관계에 따라 제1차부터 제n차까지 확장되어 표시될 수 있다.
한편, 제3 실시예의 경우에도, 문장 또는 문단으로부터 단일 키워드 또는 복수의 키워드를 추출하여 이용하는 바, 그 관계도는 도 13 또는 도 14와 같이 표시될 수 있다.
도 1 내지 도 14는 인공지능을 기반으로 데이터를 분석하여 예측정보를 생성 및 제공하는 것에 관련한 것으로, 그 예측정보를 사용자 단말(200)로 제공한 이후에는 데이터베이스를 구축하거나 기 구축된 데이터베이스를 업데이트 하는 등의 관리를 위해 분석세트를 생성하여 저장한다.
이하에서는 도 15 내지 도 21을 참조하여 인공지능 기반의 데이터베이스 관리 시스템 및 방법에 대해 설명하도록 한다.
도 15는 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 시스템의 네트워크 구조를 나타내는 도면이다.
도 15를 참조하면, 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 시스템(이하, '데이터베이스 관리 시스템'이라 칭함)(20)은 서버(100), 제1 사용자 단말(210) 및 제2 사용자 단말(220)을 포함할 수 있다.
서버(100)는 제1 사용자 단말(210)로부터 적어도 하나의 입력데이터가 수신되면, 인공지능 기반 제4 학습모델을 이용하여 그 적어도 하나의 입력데이터로부터 적어도 하나의 입력키워드를 확인하고, 기 구축된 데이터베이스 상에 그 적어도 하나의 입력키워드 중 적어도 하나를 포함하는 공개분석세트를 확인한다. 즉, 기 구축된 데이터베이스에는 적어도 하나의 분석세트가 저장될 수 있는데, 그 중 공개 설정된 공개분석세트의 분석키워드를 확인함으로써, 적어도 하나의 입력키워드를 적어도 하나 이상 분석키워드로서 포함하는 공개분석세트를 확인한다.
그 확인 결과, 공개분석세트가 확인되는 경우, 서버(100)는 그 확인된 공개분석세트를 이용하여 예측정보를 생성하고, 공개분석세트가 확인되지 않는 경우, 웹 크롤링을 통해 적어도 하나의 입력키워드에 대한 분석데이터(제1 분석정보 내지 제3 분석정보, 각각의 관계도 등을 모두 포함함)를 생성하여 새로운 예측정보를 생성한다. 그 예측정보를 생성하는 구체적인 동작에 대해서는 하기에서 도 18 및 도 19를 통해 설명하도록 한다.
한편, 서버(100)는 새로운 예측정보와 그 예측정보를 생성하기 위해 이용한 적어도 하나의 입력키워드를 분석키워드로 하여 분석세트로 저장한다. 이때, 서버(100)는 그 분석세트를 저장할 시, 사용자의 설정에 따라 해당 분석세트를 공개분석세트 또는 비공개분석세트로 설정할 수 있다.
한편, 서버(100)는 기 설정된 주기에 따라 기 구축된 데이터베이스 상에 저장된 공개분석세트들 간의 병합가능 여부 또는, 공개분석세트 및 비공개분석세트 간의 병합가능 여부를 확인하고, 병합 가능한 것으로 확인한 경우, 각각의 사용자 단말로 병합가능알림을 송신한다. 그에 대한 응답으로 각각의 사용자 단말로부터 병합요청이 수신되면, 두 분석세트를 병합하여 기 구축된 데이터베이스를 업데이트 할 수 있다. 이때, 공개분석세트 및 비공개분석세트가 병합가능한 것으로 확인된 경우에는, 공개분석세트에 대응하는 사용자 단말 및 비공개분석세트에 대응하는 사용자 단말로 송신하는 병합가능알림이 상이할 수 있다. 즉, 병합가능알림에는 각각 두 분석세트에 대한 정보가 포함되는데, 예를 들어, 공개분석세트에 대응하는 사용자 단말로 송신하기 위한 병합가능알림에는 비공개분석세트에 대한 정보를 선택적으로 포함시킬 수 있다. 또한, 비공개분석세트에 대응하는 사용자 단말로는 그 병합가능알림을 비공개적으로 송신할 수도 있다.
한편, 제1 사용자 단말(210)의 요청에 따라 예측정보를 생성하기 위해 확인된 공개분석세트가 제2 사용자 단말(220)에 대응하는 분석세트라면, 병합가능알림을 제1 사용자 단말(210) 및 제2 사용자 단말(220)로 각각 송신하고, 그에 대한 응답을 기반으로 두 분석세트 간 병합을 수행할 수 있다.
한편, 제1 사용자 단말(210) 및 제2 사용자 단말(220)은 예측정보를 제공받고자 하는 사용자의 단말로서, 각각 서버(100)로 적어도 하나의 입력데이터를 송신하여 그에 대한 예측정보를 제공받는 것은 물론, 그 예측정보를 포함하는 분석세트에 대한 병합가능알림이 수신되면, 이를 확인하여 병합여부에 대한 결정 정보를 송신한다. 즉, 병합을 원하는 경우, 병합요청을 서버(100)로 송신하여 병합이 수행되도로 할 수 있다.
앞서, 도 15에서는 제1 사용자 단말(210) 및 제2 사용자 단말(220)만을 도시하였으나, 적어도 하나 이상일 수 있으며, 그 개수를 한정하지 않는다.
다만, 도 15에는 설명의 편의를 위하여 사용자 단말을 2개로 도시하였으나, 그 개수를 한정하지 않는다.
도 16은 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 방법을 나타내는 흐름도이다.
도 16을 참조하면, 서버(100)는 제1 사용자 단말(210)로부터 적어도 하나의 입력데이터가 수신되면(S301), 그 적어도 하나의 입력데이터를 통해 적어도 하나의 입력키워드를 확인한다(S303). 그런나, 이는 하나의 실시예일, 제1 사용자 단말(210)로부터 적어도 하나의 입력키워드가 직접 수신될 수도 있다.
그 다음으로, 서버(100)는 제4 학습모델을 이용하여 기 구축된 데이터베이스 상에 저장된 적어도 하나의 공개분석세트 중 S303 단계에 의해 확인된 적어도 하나의 입력키워드를 적어도 하나 이상 분석키워드로서 포함하고 있는 공개분석세트를 확인하고(S305), 그 확인 결과에 따라 공개분석세트를 이용하여 예측정보를 생성하거나, S303 단계에 의해 확인된 적어도 하나의 입력키워드를 이용하여 예측정보를 생성한다(S307). 즉, S305 단계에 따른 확인 결과, 공개분석세트가 확인되면 이를 이용하여 예측정보를 생성하도록 하고, 공개분석세트가 학인되지 않으면 앞서 도 1 내지 도 15를 통해 설명한 바와 같이 적어도 하나의 입력데이터(적어도 하나의 입력키워드)를 이용하여 예측정보를 생성한다.
그 다음으로, 서버(100)는 그 예측정보를 제1 사용자 단말(210)로 송신하고, 그 에측정보와 그에 대응하는 적어도 하나의 입력키워드를 분석키워드로서 하께 포함하는 분석세트를 생성하여 기 구축된 데이터베이스에 저장한다(S311). 이때, 분석세트는 제1 사용자 단말(210)을 사용하는 사용자의 설정에 따라 공개분석세트로 저장되거나, 비공개분석세트로 저장된다. 이로써, 기 구축된 데이터베이스에는 적어도 하나의 공개분석세트 및/또는 적어도 하나의 비공개분석세트가 저장될 수 있다.
그 다음으로, 서버(100)는 기 설정된 주기에 따라 기 구축된 데이터베이스 상에 저장된 공개분석세트들 간 또는, 공개분석세트 및 비공개분석세트 간의 병합가능여부를 확인하고(S313), 그 확인 결과, 병합 가능한 분석세트들이 확인된 경우에는 제4 학습모델을 이용하여 그 병합 가능한 분석세트들 간 병합을 수행함으로써 기 구축된 데이터베이스를 업데이트 한다(S321). 이때, 제4 학습모델은 데이터 병합을 위해 사전 학습된 모델로서, 병합 가능한 분석세트들을 입력하면 하나의 분석세트로 병합되어 생성될 수 있다.
다만, 병합 가능한 분석세트들 중 비공개분석세트가 존재하는 경우에는 병합을 수행하기에 앞서 그 비공개분석세트에 대응하는 사용자 단말로 병합가능알림을 송신하여 병합이 허용되면, 그때 병합을 수행하도록 한다.
예를 들어, S313 단계의 확인 결과, 제1 사용자 단말(210)의 공개분석세트 및 제2 사용자 단말(220)의 비공개분석세트 간 병합이 가능한 것으로 확인된 경우, 그 분석세트를 저장할 시에 공개를 허용하여 공개분석세트로 저장한 제1 사용자 단말(210)에게는 병합가능알림을 송신하지 않고, 비공개분석세트로 저장한 제2 사용자 단말(220)에게만 병합가능알림을 송신한다(S315).
그 다음으로, 제2 사용자 단말(220)이 그 병합가능알림을 확인한 후(S317), 그 병합을 허용하는 경우에는 그 병합가능알림 대한 응답으로 병합요청을 송신한다(S319). 이후, 서버(100)는 제2 사용자 단말(220)로부터 병합요청이 수신되면, 그때 병합을 수행하도록 한다(S321).
즉, 도 16의 S315 단계 내지 S319 단계는 병합 가능한 분석세트들 중 비공개분석세트가 존재하는 경우에만 수행되는 것으로, 병합 가능한 분석세트들이 모두 공개분석세트인 경우에는 생략될 수 있다.
도 17은 본 개시의 일 실시예에 따른 분석세트의 구성을 나타내는 도면이다.
도 17을 참조하면, 분석세트는 제1 분석정보(121), 제2 분석정보(122) 및 제3 분석정보(123)를 포함하는 예측정보와, 그 예측정보를 생성하기 위해 수신되는 적어도 하나의 입력데이터를 분석키워드(110)로서 포함한다(적어도 하나의 입력데이터가 분석키워드로 저장되는 바, 그 식별번호를 동일하게 표시함).
도 18은 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 방법에서 공개분석세트의 존재 여부에 따라 예측정보를 생성하는 구체적인 동작을 나타내는 순서도이다.
도 18을 참조하면, 서버(100)는 적어도 하나의 입력키워드 중 적어도 하나를 포함하는 공개분석세트를 확인하고(S410), 그 확인 결과, 공개분석세트가 확인되면, 그 확인된 공개분석세트를 이용하여 예측정보를 생성한다(S420).
한편, 서버(100)는 공개분석세트가 미확인되면, 즉, 확인되지 않으면, 웹 크롤링을 기반으로 적어도 하나의 입력데이터에 대한 분석데이터를 생성하여 새로운 예측정보를 생성하고(S430), 그 새로운 예측정보를 이용하여 기 구축된 데이터베이스를 업데이트 한다(S440)
도 19은 본 개시의 일 실시예에 따른 인공지능 기반 데이터베이스 관리 방법에서 적어도 하나의 입력키워드 및 공개분석세트에 포함된 적어도 하나의 분석키워드 간 동일 여부에 따라 예측정보를 생성하는 구체적인 동작을 나타내는 순서도이다.
도 19를 참조하면, 서버(100)는 확인된 공개분석세트에 포함된 적어도 하나의 분석키워드를 확인하고(S431), 적어도 하나의 입력키워드 및 적어도 하나의 분석키워드 간 동일 여부를 확인한다(S432).
그 확인 결과, 공개분석세트에 포함된 분석키워드 및 적어도 하나의 입력키워드가 완전하게 동일한 경우, 서버(100)는 확인된 공개분석세트에 포함되 분석데이터를 그대로 이용하여 예측정보를 생성한다(S433).
한편, 그 확인 결과, 공개분석세트에 포함된 분석키워드가 적어도 하나의 입력키워드와 일부만 동일한 경우, 그 분석키워드가 포함하고 있는 키워드를 제외한 나머지 키워드를 적어도 하나의 검색데이터로 추출하고(S434), 웹 크롤링을 기반으로 적어도 하나의 검색키워드를 이용하여 데이터를 수집한다(S435). 이때, 수집된 데이터는 적어도 하나의 검색키워드와 연관도를 갖는 적어도 하나의 키워드 및 문장/문단 중 적어도 하나일 수 있다.
그 다음으로, 서버(100)는 S435 단계에 의해 수집된 데이터를 이용하여 추가분석세트를 생성하고, 제4 학습모델을 이용하여 그 확인된 공개분석세트 및 추가분석세트를 병합한다(S437). 이로써, 병합된 두 세트에 대한 예측정보를 생성할 수 있다(S438).
이때, 서버(100)는 단순히 두 분석세트를 합쳐서 저장하는 것이 아니라, 하나의 분석세트로 통합하여 그 분석데이터를 확장하기 위해 분석키워드(110)를 통합한 후, 도 5 내지 도 12의 구체적인 동작들을 통해 제1 분석정보, 제2 분석정보 및 제3 분석정보를 생성하고, 그에 대한 각각의 관계도를 생성하여 저장하도록 한다. 이 경우에는 키워드를 추출하기 위해 제1 학습모델을 이용하고, 제3 예측데이터를 생성할 시 새로운 문장을 생성하기 위해 제2 학습모델을 이용하게 된다.
앞서 설명한 바와 같이 각 정보들은 추출된 키워드들에 대한 관계도를 포함하는데, 이 관계도는 제3 학습모델을 통해 positive, negative, neutral, unknown으로 그 관계가 형성될 수 있다. 이를 위해, 학습 시, 적어도 하나의 학습데이터를 직접 라벨링하여 각 문장에서 키워드들 사이의 관계를 입력하도록 하고, 그 라벨링 된 적어도 하나의 학습데이터를 트랜스포머(transformer) 기반 제3 학습모델을 통해 학습하여 모든 문장에 대한 키워드들 사이의 관계를 예측하도록 한다. 그 키워드들이 관계도 예측을 통해서 출력되는 모든 조합을 학습데이터에서 나오는 수로 카운트하고, 그 카운트된 학습데이터를 토대로 키워드들 간 유사도를 산출한다. 여기서, 유사도의 의미는 카워드들 간의 상관관계(correlation)을 의미한다. 유사도 점수가 1에 가까울수록 두 키워드들 간에는 밀접한 연관이 있음을 의미하고, 0에 가까울수록 서로 독립적인 것을 의미할 수 있다. 즉, 제3 학습모델에 적어도 하나의 키워드를 입력하면, 유사도 순으로 키워드들이 출력되고, 그 키워드들 간의 관계는 1차 관계부터 n차까지의 복잡한 관계를 출력할 수 있다. 그렇기 때문에, 제3 학습모델에 입력하는 키워드가 많을수록 교집합적으로 연관되는 정보들을 정교하게 제공받을 수 있다.
도 20은 본 개시의 일 실시예에 따라 각각 하나의 단일 키워드를 포함하는 분석세트들 간의 관계를 나타내는 관계도의 일 예를 나타내는 도면이다.
도 21은 본 개시의 일 실시예에 따라 입력데이터로서 각각 복수의 키워드를 포함하는 분석세트들 간의 관계를 나타내는 관계도의 일 예를 나타내는 도면이다.
도 20 및 도 21은 앞서 설명한 도 13 및 도 14와 그 기본적인 개념은 유사하지만, 도 20은 두 분석세트를 병합할 시, 두 분석세트에 각각 포함된 단일 키워드 간 연결 관계를 시각적으로 표시한 것이고, 도 21은 두 분석세트에 각각 포함된 복수의 키워드 간 연결 관계를 시각적으로 표시한 것이다,
구체적으로, 도 20을 참조하면, 제1 분석세트 및 제2 분석세트에 포함된 각각의 분석키워드가 단일 키워드인 경우, 제1 분석세트 및 제2 분석세트 각각의 단일 키워드를 제1-1 타겟키워드 및 제2-1 타겟키워드로 표시하고, 제1-1 타겟키워드 및 제2-1 타겟키워드와 제1차 내지 제n차의 연결 관계를 갖는 적어도 하나의 추출키워드를 연결한다.
도 20의 경우, 제1-1 타겟키워드와 1차 연결관계를 갖는 제8 추출키워드와, 제2-1 타겟키워드와 1차 연결 관계를 갖는 제2 추출키워드가 제9 추출키워드를 통해 연결됨에 따라, 제9 추출키워드는 제1-1 타겟키워드 및 제2-1 타겟키워드의 공통키워드가 될 수 있으며, 이를 시각적으로 상이하게 표시할 수 있다. 또한, 제1-1 타겟키워드와 1차 연결 관계를 갖는 제10 추출키워드와, 제2-1 타겟키워드와 1차 연결 관계를 갖는 제4 추출키워드가 제14 추출키워드를 통해 연결됨에 따라, 제14 추출키워드 또한 제1-1 타겟키워드 및 제2-1 타겟키워드의 공통키워드가 될 수 있으며, 이 또한 시각적으로 상이하게 표시할 수 있다. 또한, 그 각각의 교집합 영역을 A 및 B와 같이 표시할 수 있다.
한편, 도 21을 참조하면, 제1 분석세트 및 제2 분석세트에 포함된 각각의 분석키워드가 복수의 키워드인 경우, 제1 분석세트의 복수의 키워드를 제1-1 타겟키워드 및 제1-2 타겟키워드로 표시하고, 제2 분석세트의 복수의 키워드를 제2-1 타겟키워드 및 제2-2 타겟키워드로 표시한 후, 제1-1 타겟키워드, 제1-2 타겟키워드, 제2-1 타겟키워드 및 제2-2 타겟키워드와 제1차 내지 제n차의 연결 관계를 갖는 적어도 하나의 추출키워드를 연결한다.
도 21의 경우, 제1-1 타겟키워드와 1차 연결관계를 갖는 제1 추출키워드, 제1-2와 1차 연결 관계를 갖는 제4 추출키워드, 제2-1 타겟키워드와 1차 연결 관계를 갖는 제5 추출키워드 및 제2-2 타겟키워드와 1차 연결 관계를 갖는 재9 추출키워드가 모두 제10 추출키워드를 통해 연결됨에 따라, 제10 추출키워드는 제1-1 타겟키워드, 제1-2 타겟키워드, 제2-1 타겟키워드 및 제2-2 타겟키워드의 공통키워드가 될 수 있으며, 이를 시각적으로 상이하게 표시할 수 있다. 또한, 그 각각의 교집합 영역을 A와 같이 표시할 수 있다.
한편, 개시된 실시예들은 컴퓨터에 의해 실행 가능한 명령어를 저장하는 기록매체의 형태로 구현될 수 있다. 명령어는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 프로그램 모듈을 생성하여 개시된 실시예들의 동작을 수행할 수 있다. 기록매체는 컴퓨터로 읽을 수 있는 기록매체로 구현될 수 있다.
컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터에 의하여 해독될 수 있는 명령어가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다.
이상에서와 같이 첨부된 도면을 참조하여 개시된 실시예들을 설명하였다. 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자는 본 개시의 기술적 사상이나 필수적인 특징을 변경하지 않고도, 개시된 실시예들과 다른 형태로 본 개시가 실시될 수 있음을 이해할 것이다. 개시된 실시예들은 예시적인 것이며, 한정적으로 해석되어서는 안 된다.
10: 예측정보 제공 시스템 100: 서버
200: 사용자 단말 101: 통신모듈
103: 저장모듈 105: 제어모듈
110: 적어도 하나의 입력데이터 111: 적어도 하나의 유사키워드
112: 적어도 하나의 관련키워드 121: 제1 분석정보
122: 제2 분석정보 123: 제3 분석정보
1211: 제1 키워드리스트 1221: 제2 키워드리스트
1231: 제1 예측데이터 1232: 제2 예측데이터
1233: 제3 예측데이터
20: 예측정보 제공 시스템 100: 서버
210: 제1 사용자 단말 220: 제2 사용자 단말

Claims (10)

  1. 인공지능 기반 데이터베이스 관리 시스템에 있어서,
    적어도 하나의 입력키워드를 송신하고, 그에 대한 응답으로 예측정보를 수신하는 적어도 하나의 사용자 단말; 및
    상기 적어도 하나의 입력키워드가 수신되면, 인공지능 기반의 학습모델을 이용하여 기 구축된 데이터베이스 상에서 상기 적어도 하나의 입력키워드를 포함하는 공개분석세트를 확인하고, 상기 확인된 공개분석세트를 이용하여 예측정보를 생성하고, 상기 공개분석세트가 확인되지 않는 경우, 웹 크롤링을 통해 상기 적어도 하나의 입력키워드에 대한 분석데이터를 생성하여 새로운 예측정보를 생성하는 서버를 포함하며,
    상기 기 구축된 데이터베이스는,
    적어도 하나의 공개분석세트 및 적어도 하나의 비공개분석세트를 포함하며,
    상기 서버는,
    상기 새로운 예측정보 생성한 후, 설정정보에 따라 상기 적어도 하나의 입력키워드에 대한 공개분석세트 또는 비공개분석세트를 생성하여 상기 기 구축된 데이터베이스를 업데이트 하고,
    상기 서버는
    상기 확인된 공개분석세트에 포함된 적어도 하나의 분석키워드가 상기 적어도 하나의 입력키워드와 완전히 동일한 경우에만 상기 공개분석세트에 포함된 분석데이터를 그대로 이용하여 상기 예측정보를 생성하고,
    상기 서버는,
    상기 확인된 공개분석세트에 포함된 적어도 하나의 분석키워드가 상기 적어도 하나의 입력키워드 중 일부만을 포함한 경우에는 상기 적어도 하나의 입력키워드 중 상기 적어도 하나의 분석키워드에 포함되지 않은 키워드를 적어도 하나의 검색키워드로 추출하여 상기 웹 크롤링을 기반으로 웹 상에서 데이터를 수집하고, 상기 수집된 데이터를 이용하여 추가분석세트를 생성한 후, 상기 학습모델을 이용하여 상기 확인된 공개분석세트 및 상기 추가분석세트를 병합하여 상기 예측정보를 생성함에 따라 상기 기 구축된 데이터베이스를 업데이트 하고,
    상기 서버는,
    기 설정된 주기에 따라 상기 기 구축된 데이터베이스 상에 저장된 분석세트들 간 병합가능 여부를 확인하고, 병합 가능한 것으로 확인된 분석세트들 중 비공개분석세트가 존재하면, 상기 확인된 비공개분석세트에 대응하는 사용자의 단말로 병합가능알림을 비공개적으로 송신하고, 그에 대한 응답으로 병합이 허용되면 병합을 수행하고,
    상기 병합 시, 상기 공개분석세트 및 상기 추가분석세트, 또는 병합 가능한 것으로 확인된 분석세트들, 각각의 분석키워드를 통합한 후, 상기 각각의 분석키워드에 대한 관계도를 생성하여 함께 저장하는 것을 특징으로 하는,
    인공지능 기반 데이터베이스 관리 시스템.
  2. 제1항에 있어서,
    상기 설정정보는,
    상기 적어도 하나의 입력키워드에 대한 분석세트를 공개할지 또는 비공개할지 여부가 설정된 정보로서,
    상기 서버는,
    상기 설정정보가 공개로 설정된 경우, 상기 적어도 하나의 입력키워드에 대한 공개분석세트를 생성하고,
    상기 설정정보가 비공개로 설정된 경우, 상기 적어도 하나의 입력키워드에 대한 비공개분석세트를 생성하는 것을 특징으로 하는,
    인공지능 기반 데이터베이스 관리 시스템.
  3. 삭제
  4. 삭제
  5. 제1항에 있어서,
    상기 서버는,
    기 구축된 데이터베이스 상에서 상기 적어도 하나의 입력키워드 중 적어도 하나를 포함하는 공개분석세트를 확인할 시,
    상기 적어도 하나의 입력키워드 및 상기 기 구축된 데이터베이스에 포함된 적어도 하나의 공개분석세트 각각의 코사인 유사도를 산출하여 확인하되, 상기 코사인 유사도가 기 설정된 제1 임계범위 이내인 경우에만, 상기 적어도 하나의 입력키워드에 대응하는 공개분석세트가 존재하는 것으로 판단하는 것을 특징으로 하는,
    인공지능 기반 데이터베이스 관리 시스템.
  6. 제1항에 있어서,
    상기 기 구축된 데이터베이스는, 적어도 하나의 분석세트를 포함하고,
    상기 적어도 하나의 분석세트는, 공개분석세트 및 비공개분석세트 중 적어도 하나로 구성되는 것을 특징으로 하는,
    인공지능 기반 데이터베이스 관리 시스템.
  7. 제6항에 있어서,
    상기 서버는,
    상기 기 설정된 주기에 따라 상기 적어도 하나의 분석세트 중 공개분석세트 간 코사인 유사도를 산출하고, 상기 공개분석세트 간 코사인 유사도가 기 설정된 제2 임계범위 이내인 공개분석세트들을 추출하고, 상기 학습모델을 이용하여 상기 추출된 공개분석세트들에 대한 병합을 수행하여 상기 기 구축된 데이터베이스를 업데이트 하는 것을 특징으로 하는,
    인공지능 기반 데이터베이스 관리 시스템.
  8. 제6항에 있어서,
    상기 서버는,
    상기 기 설정된 주기에 따라 상기 적어도 하나의 분석세트 중 공개분석세트 및 비공개분석세트 간 코사인 유사도를 산출하고, 상기 공개분석세트 및 비공개분석세트 간 코사인 유사도가 기 설정된 제2 임계범위 이내인 공개분석세트 및 비공개분석세트를 추출하여 각각의 사용자 단말로 상기 병합가능알림을 송신하고, 상기 각각의 사용자 단말로부터 병합요청이 수신되면, 상기 학습모델을 이용하여 상기 추출된 공개분석세트 및 비공개분석세트 간 병합을 수행하여 상기 기 구축된 데이터베이스를 업데이트 하는 것을 특징으로 하는,
    인공지능 기반 데이터베이스 관리 시스템.
  9. 제8항에 있어서,
    상기 서버는,
    상기 병합가능알림을 생성할 시, 상기 추출된 공개분석세트 및 비공개분석세트에 대한 정보를 포함시키되, 상기 비공개분석세트에 대한 정보는 선택적으로 포함시키고,
    상기 병합가능알림을 송신할 시, 상기 비공개분석세트의 사용자에게는 상기 병합가능알림을 비공개적으로 송신하는 것을 특징으로 하는,
    인공지능 기반 데이터베이스 관리 시스템.
  10. 장치에 의해 수행되는, 인공지능 기반 데이터베이스 관리 방법에 있어서,
    사용자 단말로부터 적어도 하나의 입력키워드가 수신되면, 인공지능 기반의 학습모델을 이용하여 기 구축된 데이터베이스 상에서 상기 적어도 하나의 입력키워드를 포함하는 공개분석세트를 확인하는 단계;
    공개분석세트가 확인되는지 여부에 따라 상이한 방식으로 예측정보를 생성하는 단계; 및
    상기 예측정보를 상기 사용자 단말로 송신하는 단계;를 포함하며,
    상기 예측정보를 생성하는 단계는,
    상기 공개분석세트가 확인되는 경우, 상기 확인된 공개분석세트를 이용하여 예측정보를 생성하고, 상기 공개분석세트가 확인되지 않는 경우, 웹 크롤링을 통해 상기 적어도 하나의 입력키워드에 대한 분석데이터를 생성하여 새로운 예측정보를 생성하며,
    상기 예측정보를 생성하는 단계는,
    설정정보에 따라 상기 적어도 하나의 입력키워드에 대한 공개분석세트 또는 비공개분석세트를 생성하여 상기 기 구축된 데이터베이스를 업데이트 하는 단계를 더 포함하며,
    상기 기 구축된 데이터베이스는,
    적어도 하나의 공개분석세트 및 적어도 하나의 비공개분석세트를 포함하고,
    상기 예측정보를 생성하는 단계는,
    상기 확인된 공개분석세트에 포함된 적어도 하나의 분석키워드가 상기 적어도 하나의 입력키워드와 완전히 동일한 경우에만 상기 공개분석세트에 포함된 분석데이터를 그대로 이용하여 상기 예측정보를 생성하고,
    상기 예측정보를 생성하는 단계는,
    상기 확인된 공개분석세트에 포함된 적어도 하나의 분석키워드가 상기 적어도 하나의 입력키워드 중 일부만을 포함한 경우에는 상기 적어도 하나의 입력키워드 중 상기 적어도 하나의 분석키워드에 포함되지 않은 키워드를 적어도 하나의 검색키워드로 추출하여 상기 웹 크롤링을 기반으로 웹 상에서 데이터를 수집하고, 상기 수집된 데이터를 이용하여 추가분석세트를 생성한 후, 상기 학습모델을 이용하여 상기 확인된 공개분석세트 및 상기 추가분석세트를 병합하여 상기 예측정보를 생성함에 따라 상기 기 구축된 데이터베이스를 업데이트 하고,
    기 설정된 주기에 따라 상기 기 구축된 데이터베이스 상에 저장된 분석세트들 간 병합가능 여부를 확인하고, 병합 가능한 것으로 확인된 분석세트들 중 비공개분석세트가 존재하면, 상기 확인된 비공개분석세트에 대응하는 사용자의 단말로 병합가능알림을 비공개적으로 송신하고, 그에 대한 응답으로 병합이 허용되면 병합을 수행하고,
    상기 병합 시, 상기 공개분석세트 및 상기 추가분석세트, 또는 병합 가능한 것으로 확인된 분석세트들, 각각의 분석키워드를 통합한 후, 상기 각각의 분석키워드에 대한 관계도를 생성하여 함께 저장하는 것을 특징으로 하는,
    인공지능 기반 데이터베이스 관리 방법.
KR1020220131779A 2022-10-13 2022-10-13 인공지능 기반 데이터베이스 관리 시스템 및 방법 KR102503443B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220131779A KR102503443B1 (ko) 2022-10-13 2022-10-13 인공지능 기반 데이터베이스 관리 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220131779A KR102503443B1 (ko) 2022-10-13 2022-10-13 인공지능 기반 데이터베이스 관리 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR102503443B1 true KR102503443B1 (ko) 2023-02-23

Family

ID=85329884

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220131779A KR102503443B1 (ko) 2022-10-13 2022-10-13 인공지능 기반 데이터베이스 관리 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102503443B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101007613B1 (ko) 2003-03-12 2011-01-12 토요엔지니어링 카부시키가이샤 키워드를 이용한 데이터의 등록, 검색을 지원하는 장치
KR101035039B1 (ko) * 2010-11-02 2011-05-19 한국과학기술정보연구원 질의에 따른 연관정보 제공 장치 및 방법
KR101887629B1 (ko) * 2018-02-14 2018-08-10 대신네트웍스 주식회사 자연어기반 정보공개분류시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101007613B1 (ko) 2003-03-12 2011-01-12 토요엔지니어링 카부시키가이샤 키워드를 이용한 데이터의 등록, 검색을 지원하는 장치
KR101035039B1 (ko) * 2010-11-02 2011-05-19 한국과학기술정보연구원 질의에 따른 연관정보 제공 장치 및 방법
KR101887629B1 (ko) * 2018-02-14 2018-08-10 대신네트웍스 주식회사 자연어기반 정보공개분류시스템

Similar Documents

Publication Publication Date Title
US10489512B2 (en) Utilizing machine learning models to identify insights in a document
Tuarob et al. Automated discovery of lead users and latent product features by mining large scale social media networks
US20190347329A1 (en) Capturing rich response relationships with small-data neural networks
Negi et al. Semeval-2019 task 9: Suggestion mining from online reviews and forums
Rubio-Drosdov et al. Seamless human-device interaction in the internet of things
CN110633577A (zh) 文本脱敏方法以及装置
US20200117751A1 (en) Context-aware computing apparatus and method of determining topic word in document using the same
EP3598436A1 (en) Structuring and grouping of voice queries
Bradley Representation of libraries in artificial intelligence regulations and implications for ethics and practice
Pichler et al. Sharing and debating Wittgenstein by using an ontology
CN113157931A (zh) 一种融合图谱构建方法及装置
KR20180072049A (ko) 사용자 맞춤형 전문가 매칭 및 검색 시스템 및 그 방법
US20190392325A1 (en) Train a digital assistant with expert knowledge
WO2020222999A1 (en) Method, system, and data storage device for automating solution prompts based upon semantic representation
Ordonez et al. Automated context aware composition of Advanced Telecom Services for environmental early warnings
Tonelli et al. Boosting collaborative ontology building with key-concept extraction
Lei et al. Event prediction based on causality reasoning
KR102503443B1 (ko) 인공지능 기반 데이터베이스 관리 시스템 및 방법
Sarker et al. A light-weight text summarization system for fast access to medical evidence
KR102522954B1 (ko) 인공지능 기반 데이터 분석에 의한 예측정보 제공 시스템 및 방법
CN113342944A (zh) 一种语料泛化方法、装置、设备及存储介质
US20220327147A1 (en) Method for updating information of point of interest, electronic device and storage medium
KR20220101787A (ko) Etl 장치 및 그것의 제어방법
Mashiko Big data, IoT, AI, and smart cities
Indira et al. Profile screening and recommending using natural language processing (NLP) and leverage Hadoop framework for big data

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant