KR102041915B1 - 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법 - Google Patents

인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법 Download PDF

Info

Publication number
KR102041915B1
KR102041915B1 KR1020180016053A KR20180016053A KR102041915B1 KR 102041915 B1 KR102041915 B1 KR 102041915B1 KR 1020180016053 A KR1020180016053 A KR 1020180016053A KR 20180016053 A KR20180016053 A KR 20180016053A KR 102041915 B1 KR102041915 B1 KR 102041915B1
Authority
KR
South Korea
Prior art keywords
event
data
event data
economic
group
Prior art date
Application number
KR1020180016053A
Other languages
English (en)
Other versions
KR20190100533A (ko
Inventor
최재원
Original Assignee
(주)다음소프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)다음소프트 filed Critical (주)다음소프트
Priority to KR1020180016053A priority Critical patent/KR102041915B1/ko
Publication of KR20190100533A publication Critical patent/KR20190100533A/ko
Application granted granted Critical
Publication of KR102041915B1 publication Critical patent/KR102041915B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q99/00Subject matter not provided for in other groups of this subclass

Abstract

본 발명의 기술적 사상에 의한 일 양태에 따른 인공지능을 활용한 데이터베이스 모듈은, 인터넷정보로부터 복수의 이벤트 데이터를 수집하는 이벤트 수집부, 및 상기 이벤트 데이터와 관련되는 키워드벡터를 수집하는 키워드벡터 수집부를 포함하는 수집부, 상기 복수의 이벤트 데이터를 유사한 이벤트 데이터끼리 묶어 복수의 이벤트군을 구성하는 이벤트군 구성부, 및 상기 이벤트 데이터를 대응되는 상기 이벤트군에 매칭시키는 이벤트 매칭부를 포함하고, 상기 이벤트군 구성부는 상기 복수의 이벤트 데이터 간 상기 키워드벡터의 매칭성에 따라 상기 유사한 이벤트 데이터 여부를 판단하여 상기 이벤트군을 구성하는 것을 특징으로 하며, 유사한 이벤트 데이터끼리 묶어 이벤트군을 구성함으로써 인터넷정보로부터 수집되는 많은 양의 이벤트 데이터들을 효과적으로 분류할 수 있고 이에 따라 경제데이터를 용이하게 분석할 수 있는 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법을 제공한다.

Description

인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법{Database module using artificial intelligence, economic data providing system and method using the same}
본 발명은 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법에 관련된 것이다.
글로벌 경제시대의 도래에 따라 기업이나 산업 등 경제 전반에 영향을 미치는 많은 이벤트들이 발생하고 있으며, 금융위기, 부동산 경기 위축, 환율 위기, 일본 대지진 등 국내외의 변수로 인해 재무위기에 빠지거나 도산에 이르는 기관이나 기업들이 발생하고 있다.
또한, 금융 산업의 발전에 발맞추어 리스크 관리(Risk Management)에 대한 인식이 확산됨에 따라 금융 기관은 다양한 방법으로 기업의 신용과 재무상태, 주가 등을 평가할 수 있는 기법을 개발하고 실제 업무에 적용하고 있는 상황이다. 그러나, 상기와 같이 국내외에서 많은 이벤트들이 발생하고 있어 금융 산업의 리스크 관리에도 어려움이 있으며, 이러한 이벤트들이 기업이나 산업 등 경제 전반에 미치는 영향을 쉽게 알기 어려운 상황이다.
한편, 최근 초고속 인터넷이 급속도로 보급됨에 따라 인터넷은 현대 생활에 없어서는 안될 필수품이 되고 있다. 많은 사용자가 인터넷을 통하여 뉴스 기사 검색, 전자상거래 등의 다양한 서비스를 이용하고 있다. 이에 따라 수많은 언론사로부터 뉴스 기사가 생성되어 인터넷을 통해 사용자에게 배포되고 있는 상황이며, 소셜네트워크(SNS), 블로그 등이 발달되어 기존의 웹서버에 저장되어 있는 정보까지 포함한 많은 양의 데이터들이 생성되어 배포되고 있다.
따라서, 이러한 많은 양의 데이터들을 정리하여 기업 정보, 산업 정보, 거시경제 정보 등 경제상황을 용이하게 분석할 수 있는 시스템이 필요한 실정이다.
본 발명의 기술적 사상이 이루고자 하는 기술적 과제는, 많은 양의 데이터를 유사도에 따라 정리하여 경제데이터를 용이하게 분석할 수 있는 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법을 제공하기 위한 것이다.
본 발명의 기술적 사상에 의한 일 양태에 따른 인공지능을 활용한 데이터베이스 모듈은, 인터넷정보로부터 복수의 이벤트 데이터를 수집하는 이벤트 수집부, 및 상기 이벤트 데이터와 관련되는 키워드벡터를 수집하는 키워드벡터 수집부를 포함하는 수집부, 상기 복수의 이벤트 데이터를 유사한 이벤트 데이터끼리 묶어 복수의 이벤트군을 구성하는 이벤트군 구성부, 및 상기 이벤트 데이터를 대응되는 상기 이벤트군에 매칭시키는 이벤트 매칭부를 포함하고, 상기 이벤트군 구성부는 상기 복수의 이벤트 데이터 간 상기 키워드벡터의 매칭성에 따라 상기 유사한 이벤트 데이터 여부를 판단하여 상기 이벤트군을 구성할 수 있다.
예시적인 실시예에 따르면, 상기 이벤트군 구성부는 상기 수집부가 새로운 이벤트 데이터를 수집함에 따라 새로운 이벤트군을 생성하거나 상기 이벤트군을 수정할 수 있다.
예시적인 실시예에 따르면, 상기 이벤트 매칭부는 상기 수집부가 새로운 이벤트 데이터를 수집함에 따라 특정 이벤트 데이터가 매칭되는 이벤트군을 변경할 수 있다.
예시적인 실시예에 따르면, 상기 복수의 이벤트군은 복수의 상위 이벤트군, 및 각각의 상기 상위 이벤트군에 포함되는 복수의 하위 이벤트군을 포함할 수 있다.
예시적인 실시예에 따르면, 상기 복수의 이벤트군은 정치 이벤트군, 경제 이벤트군, 사회 이벤트군, 과학기술 이벤트군, 예술문화체육 이벤트군, 및 자연 이벤트군 중 적어도 하나를 포함할 수 있다.
예시적인 실시예에 따르면, 상기 인터넷정보로부터 기업이 생산하는 제품 정보를 수집하는 제품 수집부, 및 동일한 상기 제품 정보를 갖는 기업끼리 묶어 복수의 기업군을 구성하는 기업군 구성부를 더 포함할 수 있다.
예시적인 실시예에 따르면, 특정 기업에 대한 경쟁사 정보 요청을 받으면, 상기 기업군 구성부에서 상기 기업에 매칭되는 기업군을 확인하여, 상기 기업군에 속하는 다른 기업과 관련된 정보를 경쟁사 정보로 출력할 수 있다.
본 발명의 기술적 사상에 의한 일 양태에 따른 인공지능을 활용한 경제데이터 제공 시스템은, 인공지능을 활용한 데이터베이스 모듈을 포함하고, 상기 수집부가 수집한 상기 복수의 이벤트 데이터 중 적어도 하나를 대상 이벤트로 선정하거나 또는 사용자 입력을 통해 대상 이벤트를 선정하는 이벤트 선정부, 상기 대상 이벤트보다 이전에 발생된 동일 이벤트 데이터 또는 유사 이벤트 데이터를 상기 인공지능을 활용한 데이터베이스 모듈에서 탐색하여, 상기 동일 이벤트 데이터 또는 유사 이벤트 데이터 중 적어도 하나를 과거 이벤트 데이터로 선정하는 이벤트 탐색부, 및 상기 과거 이벤트 데이터 발생 시의 제1 경제데이터를 추출하는 경제데이터 추출부를 더 포함하며, 상기 동일 이벤트 데이터는 상기 대상 이벤트와 동일한 이벤트 데이터이고, 상기 유사 이벤트 데이터는 상기 대상 이벤트와 동일한 이벤트군에 매칭되는 다른 이벤트 데이터일 수 있다.
예시적인 실시예에 따르면, 상기 이벤트 탐색부는 상기 동일 이벤트 데이터를 상기 유사 이벤트 데이터보다 우선시하여 상기 과거 이벤트 데이터로 선정할 수 있다.
예시적인 실시예에 따르면, 상기 대상 이벤트 이전에 발생된 상기 동일 이벤트 데이터가 상기 인공지능을 활용한 데이터베이스 모듈에 있는 경우 상기 동일 이벤트 데이터를 상기 과거 이벤트 데이터로 선정하고, 상기 대상 이벤트 이전에 발생된 상기 동일 이벤트 데이터가 상기 인공지능을 활용한 데이터베이스 모듈에 없는 경우 상기 유사 이벤트 데이터를 상기 과거 이벤트 데이터로 선정할 수 있다.
예시적인 실시예에 따르면, 상기 이벤트 탐색부는 상기 대상 이벤트와 동일한 이벤트군에 매칭되는 복수의 상기 유사 이벤트 데이터 중 가장 유사한 유사 이벤트 데이터를 상기 과거 이벤트 데이터로 선정할 수 있다.
예시적인 실시예에 따르면, 상기 이벤트 탐색부는 상기 대상 이벤트의 상기 키워드벡터와 복수의 상기 유사 이벤트 데이터의 상기 키워드벡터의 매칭성에 따라 상기 대상 이벤트와 복수의 상기 유사 이벤트 데이터 간 유사도를 판단할 수 있다.
예시적인 실시예에 따르면, 상기 이벤트 탐색부는 상기 대상 이벤트와 동일한 이벤트군에 매칭되는 복수의 상기 유사 이벤트 데이터를 추출하여 제시하고, 사용자가 적어도 하나의 상기 유사 이벤트 데이터를 선택하면 선택된 상기 유사 이벤트 데이터를 과거 이벤트 데이터로 선정할 수 있다.
예시적인 실시예에 따르면, 상기 제1 경제데이터를 통해 상기 대상 이벤트 발생 시의 제2 경제데이터를 추정하는 경제데이터 추정부를 더 포함할 수 있다.
예시적인 실시예에 따르면, 상기 경제데이터 추출부는 상기 제1 경제데이터 변화를 추출하고, 상기 경제데이터 추정부는 상기 제1 경제데이터 변화를 통해 상기 제2 경제데이터 변화를 추정할 수 있다.
예시적인 실시예에 따르면, 상기 경제데이터 추정부는 상기 제1 경제데이터 변화 비율을 상기 제2 경제데이터에 적용하여 상기 제2 경제데이터 변화를 추정할 수 있다.
예시적인 실시예에 따르면, 사용자로부터 관심항목을 입력받는 입력부를 더 포함하고, 상기 경제데이터 추출부는 상기 관심항목과 관련된 상기 제1 경제데이터를 추출할 수 있다.
예시적인 실시예에 따르면, 상기 이벤트 선정부는, 상기 인공지능을 활용한 데이터베이스 모듈에서 후보 이벤트를 추출하여 제시하고, 사용자가 적어도 하나의 상기 후보 이벤트를 선택하면, 선택된 상기 후보 이벤트를 대상 이벤트로 선정할 수 있다.
본 발명의 기술적 사상에 의한 일 양태에 따른 인공지능을 활용한 경제데이터 제공 방법은, 인공지능을 활용한 데이터베이스 모듈을 준비하는 단계, 상기 수집부가 수집한 상기 복수의 이벤트 데이터 중 적어도 하나를 대상 이벤트로 선정하거나 또는 사용자 입력을 통해 대상 이벤트를 선정하는 단계, 상기 대상 이벤트보다 이전에 발생된 동일 이벤트 데이터 또는 유사 이벤트 데이터를 상기 인공지능을 활용한 데이터베이스 모듈에서 탐색하여, 상기 동일 이벤트 데이터 및 유사 이벤트 데이터 중 적어도 하나를 과거 이벤트 데이터로 선정하는 단계, 및 상기 과거 이벤트 데이터 발생 시의 제1 경제데이터를 추출하는 단계를 포함하고, 상기 동일 이벤트 데이터는 상기 대상 이벤트와 동일한 이벤트 데이터이고, 상기 유사 이벤트 데이터는 상기 대상 이벤트와 동일한 이벤트군에 매칭되는 다른 이벤트 데이터일 수 있다.
예시적인 실시예에 따르면, 상기 제1 경제데이터를 추출하는 단계 이후에, 상기 제1 경제데이터를 통해 상기 대상 이벤트 발생 시의 제2 경제데이터를 추정하는 단계를 더 포함할 수 있다.
본 발명의 특징 및 이점들은 첨부도면에 의거한 다음의 상세한 설명으로부터 더욱 명백해질 것이다.
이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이고 사전적인 의미로 해석되어서는 아니 되며, 발명자가 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합되는 의미와 개념으로 해석되어야만 한다.
본 발명의 기술적 사상에 의한 실시예들에 따른 인공지능을 활용한 데이터베이스 모듈 및 이를 이용한 경제데이터 제공 시스템 및 방법은, 유사한 이벤트 데이터끼리 묶어 이벤트군을 구성함으로써 인터넷정보로부터 수집되는 많은 양의 이벤트 데이터들을 효과적으로 분류할 수 있고, 이에 따라 경제데이터를 용이하게 분석할 수 있다.
또한, 본 발명에 따르면 대상 이벤트와 동일한 이벤트 데이터가 없는 경우 동일한 이벤트군에 속하는 다른 이벤트 데이터를 유사 이벤트 데이터로 탐색함으로써, 새로운 대상 이벤트 발생의 경우에도 경제데이터를 추출 또는 추정할 수 있다.
또한, 본 발명에 따르면 과거 이벤트 데이터 발생 시의 제1 경제데이터를 통해 대상 이벤트 발생 시의 제2 경제데이터를 추정함으로써, 사용자가 보다 정확한 투·융자 활동 등 금융활동을 하는데 도움을 줄 수 있다.
도 1은 본 발명의 일 실시예에 따른 인공지능을 활용한 데이터베이스 모듈의 연결관계를 나타낸 도면이다.
도 2는 도 1에 도시한 인공지능을 활용한 데이터베이스 모듈의 세부구성을 나타낸 도면이다.
도 3은 도 2에 도시한 인공지능을 활용한 데이터베이스 모듈의 수집부가 수집하는 이벤트 데이터와 키워드벡터의 일 예를 나타낸 도면이다.
도 4는 도 1에 도시한 인공지능을 활용한 데이터베이스 모듈의 이벤트군 구성부가 구성하는 복수의 이벤트군을 예시적으로 나타낸 도면이다.
도 5는 도 1에 도시한 인공지능을 활용한 데이터베이스 모듈의 이벤트 매칭부가 이벤트 데이터를 대응되는 이벤트군에 매칭시키는 것을 나타낸 도면이다.
도 6은 본 발명의 다른 실시예에 따른 인공지능을 활용한 데이터베이스 모듈의 세부구성을 나타낸 도면이다.
도 7은 도 6에 도시한 인공지능을 활용한 데이터베이스 모듈이 경쟁사를 탐색하는 프로세스를 나타낸 도면이다.
도 8은 본 발명의 또 다른 실시예에 따른 인공지능을 활용한 데이터베이스 모듈의 세부구성을 나타낸 도면이다.
도 9는 도 2에 도시한 데이터베이스 모듈을 포함하는 인공지능을 활용한 경제데이터 제공 시스템의 세부구성을 나타낸 도면이다.
도 10는 도 9에 도시한 인공지능을 활용한 경제데이터 제공 시스템의 대상 이벤트 선정과정에 대한 사용자 단말기의 화면을 나타낸 도면이다.
도 11은 도 9에 도시한 인공지능을 활용한 경제데이터 제공 시스템의 이벤트 탐색부가 과거 이벤트 데이터를 선정하는 프로세스를 나타낸 도면이다.
도 12는 다른 실시예에 따른 도 9에 도시한 인공지능을 활용한 경제데이터 제공 시스템의 이벤트 탐색부가 과거 이벤트 데이터를 선정하는 프로세스를 나타낸 도면이다.
도 13은 도 9에 도시한 인공지능을 활용한 경제데이터 제공 시스템의 경제데이터 추출부가 제1 경제데이터를 추출하여 제시한 사용자 단말기의 화면을 나타낸 도면이다.
도 14는 본 발명의 다른 실시예에 따른 인공지능을 활용한 경제데이터 제공 시스템의 세부구성을 나타낸 도면이다.
도 15는 본 발명의 또 다른 실시예에 따른 인공지능을 활용한 경제데이터 제공 시스템의 세부구성을 나타낸 도면이다.
도 16은 본 발명의 일 실시예에 따른 인공지능을 활용한 경제데이터 제공 방법을 설명하기 위한 순서도이다.
본 발명의 목적, 특정한 장점들 및 신규한 특징들은 첨부된 도면들과 연관되는 이하의 상세한 설명과 실시예로부터 더욱 명백해질 것이다. 본 명세서에서 각 도면의 구성요소들에 참조번호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 번호를 가지도록 하고 있음에 유의하여야 한다. 또한, 제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 또한, 본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명은 생략한다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110a)의 연결관계를 나타낸 도면이다. 이하, 이를 참조하여 본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110a)의 연결관계에 대해 살펴보기로 한다.
도 1에 도시한 바와 같이, 본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110a)은 인터넷정보를 제공하는 다양한 외부 데이터 제공서버(300)와 네트워크로 연결되어, 상호간 데이터를 송수신할 수 있다. 여기서, 네트워크는 예를 들어, WiFi(wireless fidelity)와 같은 무선인터넷, WiBro(wireless broadband internet) 또는 WiMax(world interoperability for microwave access)와 같은 휴대인터넷, GSM(global system for mobile communication) 또는 CDMA(code division multiple access)와 같은 2G 이동통신망, WCDMA(wideband code division multiple access) 또는 CDMA2000과 같은 3G 이동통신망, HSDPA(high speed downlink packet access) 또는 HSUPA(high speed uplink packet access)와 같은 3.5G 이동통신망, LTE(long term evolution)망 또는 LTE-Advanced 망과 같은 4G 이동통신망 등과 같은 다양한 네트워크로 구현될 수 있다. 또한, 외부 데이터 제공서버(300)는 네트워크를 통해 외부 뉴스, 신문, SNS, 기업의 재무제표, 산업, 국가 또는 거시경제 정보 등의 데이터를 인공지능을 활용한 데이터베이스 모듈(110a)에 제공할 수 있고 인공지능을 활용한 데이터베이스 모듈(110a)에 이러한 데이터들의 전부 또는 일부, 또는 식별정보 등이 수집될 수 있다.
한편, 본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110a)은 추가적으로 사용자 단말기(200)와 연결될 수 있는데, 사용자 단말기(200)는 인공지능을 활용한 데이터베이스 모듈(110a)과 연결되는 통신 기능과 이미지나 텍스트를 출력할 수 있는 디스플레이 기능을 갖춘 장치라면 특별히 한정되지 않는다. 예를 들어, 사용자 단말기(200)는, 데스크탑 컴퓨터(desktop computer), 랩탑 컴퓨터(laptop computer), 태블릿(tablet) PC, 무선전화기(wireless phone), 모바일폰(mobile phone), 스마트폰(smart phone), 스마트 워치(smart watch), 스마트 글래스(smart glass), e-book 리더기, PMP(portable multimedia player), 휴대용 게임기, 내비게이션(navigation) 장치, 디지털 카메라(digital camera), DMB(digital multimedia broadcasting) 재생기, 디지털 음성 녹음기(digital audio recorder), 디지털 음성 재생기(digital audio player), 디지털 영상 녹화기(digital picture recorder), 디지털 영상 재생기(digital picture player), 디지털 동영상 녹화기(digital video recorder), 디지털 동영상 재생기(digital video player) 등을 포함할 수 있으나, 이에 한정되는 것은 아니다.
도 2는 도 1에 도시한 인공지능을 활용한 데이터베이스 모듈(110a)의 세부구성을 나타낸 도면이다. 이하, 이를 참조하여 본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110a)의 세부구성에 대해 살펴보기로 한다. 도 2에 도시한 바와 같이, 본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110a)은 수집부(113), 이벤트군 구성부(114), 및 이벤트 매칭부(115)를 포함할 수 있다.
본 발명의 구성요소를 설명함에 앞서, 본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110a)의 세부구성 중 적어도 하나는 빅데이터 분석 기술과 인공지능 활용 기술을 포함할 수 있다.
여기서, 빅데이터란 기존 데이터의 수집, 저장, 관리, 분석 역량을 넘어서는 데이터 세트를 의미한다. 빅데이터는 정형화 정도에 따라 정형 데이터, 반정형 데이터, 및 비정형 데이터로 분류될 수 있다. 정형 데이터(structured data)는 고정된 필드에 저장되는 데이터, 즉 일정한 형식을 갖추고 저장되는 데이터를 의미할 수 있다. 반정형 데이터(semi-structured data)는 고정된 필드에 저장되어 있지는 않지만, 메타데이터나 스키마를 포함하는 데이터를 의미하는데, XML(Extensible Mark-up Language) 및 HTML(Hypertext Mark-up Language) 등을 예로 들 수 있다. 비정형 데이터(unstructured data)는 고정된 필드에 저장되어 있지 않은 데이터를 의미하는데, 텍스트 문서, 이미지 데이터, 동영상 데이터, 및 음성 데이터를 예로 들 수 있다.
본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110a)은 상술한 바와 같은 빅데이터를 수집하고 분석할 수 있다. 빅데이터 분석 기술로는 텍스트 마이닝(text mining), 평판 분석(opinion mining), 소셜 네트워크 분석, 군집 분석(cluster analysis), 신경망 분석(neural network analysis), 및 마코브 모델(markov model)을 예로 들 수 있으나, 예시된 분석 기술들로 한정되는 것은 아니다. 텍스트 마이닝은 반정형 텍스트 데이터 또는 비정형 텍스트 데이터에서 자연 언어 처리 기술에 기반하여 유용한 정보를 추출, 가공하는 기술일 수 있다. 자연 언어 처리(Natural Language Processing; NLP) 기술은 자연 언어 이해와 자연 언어 생성이 가능하도록 하는 기술이며, 자연 언어란 사람이 의사소통을 하기 위해 사용하는 용어로 인공 언어(컴퓨터 언어)와 반대되는 개념일 수 있다. 자연 언어 이해란 자연 언어를 기계적으로 분석해서 컴퓨터가 이해할 수 있는 형태로 만드는 것을 의미할 수 있다. 자연 언어 생성은 컴퓨터가 자연 언어를 출력할 수 있도록 하는 것을 의미할 수 있다. 자연 언어 처리 기술은 형태소 분석, 구문 분석, 의미 분석, 및 화용 분석으로 이루어질 수 있다. 평판 분석은 블로그(blog), 소셜 네트워크 서비스(Social Network Service; SNS), 위키(Wiki), 손수제작물(UCC), 마이크로 블로그(Micro-Blog) 등과 같은 소셜 미디어(social media)에서 정형 텍스트 및 비정형 텍스트를 수집 및 분석하여, 제품이나 서비스에 대한 평판(예를 들어, 긍정, 부정, 중립)을 판별하는 기술일 수 있다. 소셜 네트워크 분석은 소셜 네트워크 연결구조 및 연결강도 등에 기초하여, 사용자의 영향력, 관심사, 및 성향을 분석하고, 추출하는 기술일 수 있다. 군집 분석은 비슷한 특성을 가진 개체를 합쳐가면서 최종적으로 유사한 특성을 가진 군을 발굴하는 기술일 수 있다.
한편, 인공지능(AI: Artificial Intelligence)이라는 용어가 등장한 지는 오랜 시간이 흘렀지만 컴퓨터, 연산 등 특정 영역에 국한됐던 과거와는 달리 현대에는 인지, 학습, 추론 등 인간의 고차원적 정보처리 활동을 연구해 ICT를 통해 구현하는 기반 기술 전체를 아우르는 포괄적 개념이 되었다. 알파고 못지않게 인공지능 분야의 최강자라고 할 수 있는 IBM의 경우, 지난 2011년 미국 유명 퀴즈쇼 '제퍼디'에서 우승한 슈퍼컴퓨터 '왓슨'을 발전시켜 인지컴퓨팅(Cognitive computing)이라는 새로운 영역으로 확대시켰다. 즉, 인공지능을 통해 인지 학습이 가능하다는 것이다. 여기서, 인지 학습(cognitive learning)이란 학습의 한 형태로 가시적 또는 직접적으로 관찰할 수 없는 심리적 과정, 특히 인지적 과정을 통해 일어나는 학습 형태를 의미할 수 있다. 구체적으로, 인지 학습에 포함되는 하위 유형은 통찰 학습(insight learning), 잠재 학습(latent learning), 관찰 학습(observational learning) 등이 있을 수 있다.
최근 인공지능 기술의 발전과 관심이 증가하면서 이를 응용한 기술들이 등장하고 있다. 인공지능 기술의 한 분야로서 머신러닝(Machine Learning)이 각종 매체를 통해 집중 조명을 받고 있다. 기계학습이라고도 불리는 머신러닝은 컴퓨터가 데이터를 통해 학습하고, 사람처럼 어떤 대상 혹은 상황을 이해할 수 있게 하는 기술일 수 있는데, 컴퓨터를 학습시켜 패턴을 찾아내 분류하는 기술적 방식으로 컴퓨터가 데이터를 분석할 수 있게 하는 알고리즘이 핵심일 수 있다. 데이터를 활용하는 알고리즘을 정교하게 만들면 컴퓨터가 학습해가며 사용자들에게 의미 있는 결과물을 제공할 수 있다.
도 3은 도 2에 도시한 인공지능을 활용한 데이터베이스 모듈(110a)의 수집부(113)가 수집하는 이벤트 데이터와 키워드벡터의 일 예를 나타낸 도면이다. 이하, 도 1 내지 도 3을 참조하여 본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110a)의 수집부(113)에 대해 살펴보기로 한다.
수집부(113)는 인터넷정보로부터 복수의 이벤트 데이터를 수집하는 이벤트 수집부(113a)를 포함할 수 있다. 여기서, 이벤트 수집부(113a)는 이벤트 데이터를 시계열적으로 수집할 수 있으며, 인터넷정보, 예를 들어 뉴스, 신문, 소셜네트워크, 웹페이지, 블로그, 기업의 재무제표, 유가, 환율 등이 저장되어 있는 외부 데이터 제공서버(300)로부터 여러 이벤트 데이터를 수집하여 데이터베이스 모듈(110a)에 구비된 데이터베이스에 저장시킬 수 있다.
한편, 수집부(113)는 이벤트 데이터와 함께 이벤트 데이터와 관련된 키워드벡터를 수집하는 키워드벡터 수집부(113b)를 더 포함할 수 있다. 여기서, 키워드벡터는 이벤트 데이터를 수집할 때 인터넷정보 상에서 이벤트 데이터와 함께 자주 등장하는 키워드로 볼 수 있는데, 예를 들어 도 3에 도시한 바와 같이 이벤트 데이터가 최근 이슈가 되고 있는 "가상화폐"일 때 키워드벡터는 "가상화폐"와 자주 등장하는 키워드로서 "폭등", "정부 개입", "거래소", "폭락", "로또", "환율", "블록체인", "신기술" 등이 될 수 있다.
이때, 이벤트 수집부(113a)는 상기에서 설명한 빅데이터 기술이나 인공지능 기술을 활용하여 인터넷정보로부터 이벤트 데이터(도 3에서 "가상화폐")를 선정하여 수집할 수 있다. 일 예로서 이벤트 수집부(113a)는 특정 키워드나 내용의 발현량을 통해 이벤트 데이터를 추출하고 수집할 수 있는데, 좀 더 구체적인 예시로서 포털사이트에서 검색량 순위를 살펴 발현량이 높은 키워드나 내용을 이벤트 데이터로서 수집할 수 있다. 또한, 키워드벡터 수집부(113b)는 이벤트 데이터와 관련되어 이벤트 데이터와 함께 자주 등장하는 키워드나 내용을 키워드벡터(도 3에서 "폭등", "정부 개입" 등)로서 수집할 수 있다. 일 예로 키워드벡터 수집부(113b)는 'Word2vec' 또는 'Doc2vec' 기술을 활용할 수 있고, 혹은 사전을 이용한 전통적인 방식으로 해당 키워드가 포함된 문서의 벡터를 수집할 수 있다. 단, 본 발명이 이러한 예시적인 방법으로 한정되는 것은 아닐 수 있다.
Word2vec 알고리즘은, 텍스트마이닝을 위한 알고리즘으로 각 단어 간의 앞, 뒤 관계를 보고 근접도를 정하는 알고리즘이며, 비지도 학습 알고리즘일 수 있다. Word2vec 알고리즘은 이름이 나타내는 바와 같이 단어의 의미를 벡터 형태로 표현하는 계량 기법이며, 각 단어를 200차원 정도의 공간에서 백터로 표현할 수 있다. Word2vec 알고리즘을 이용하면, 각 단어마다 단어에 해당하는 벡터를 구할 수 있으며, 입력한 말뭉치의 문장에 있는 단어와 인접 단어의 관계를 이용해 단어의 의미를 학습할 수 있다. Word2vec 알고리즘은 인공 신경망에 근거한 것으로, 같은 맥락을 지닌 단어는 가까운 의미를 지니고 있다는 전제에서 출발하며, 텍스트 문서를 통해 학습을 진행하고 한 단어에 대해 근처(전후 5 내지 10 단어 정도)에 출현하는 다른 단어들을 관련 단어로서 인공 신경망에 학습시킬 수 있다. 연관된 의미의 단어들은 문서 상에서 가까운 곳에 출현할 가능성이 높기 때문에 학습을 반복해 나가는 과정에서 두 단어는 점차 가까운 벡터를 지닐 수 있다. Word2vec 알고리즘의 학습 방법은 CBOW(Continous Bag Of Words) 방식과 skip-gram 방식이 있는데, CBOW 방식은 주변 단어가 만드는 맥락을 이용해 타겟 단어를 예측하는 것이고, skip-gram 방식은 한 단어를 기준으로 주변에 올 수 있는 단어를 예측하는 것일 수 있다. 또한, Doc2Vec은 Word2Vec과 유사하지만 단어가 아닌 문장, 문단, 문서를 통해 벡터를 만드는 것으로서, 단어 간의 유사성뿐만 아니라 문서의 구성요소간의 유사성을 정의하고 계산할 수 있다. 이렇게 수집된 키워드(특정 이벤트 데이터를 의미하는 키워드 또는 특정 이벤트 데이터의 명칭 그 자체)에 대한 벡터, 즉 키워드벡터가 수집되면 서로 다른 이벤트 데이터(또는 키워드)의 키워드벡터를 비교함으로써 이벤트 데이터(키워드)의 유사도를 계량적으로 측정할 수 있다. 한편, 수집부(113)의 이벤트 데이터와 키워드벡터 선정 방식은 상기에서 언급한 방식으로 한정되지 않으며, 딥러닝, 머신러닝 등을 통한 인공지능 기능을 통해 지속적으로 학습되어 바뀔 수도 있다.
본 실시예에 따른 수집부(113)는 추가적으로 대표 이벤트 데이터로의 변환 기능을 더 포함할 수 있다. 예를 들어 "가상화폐"와 "암호화폐"는 비트코인, 이더리움 등을 뜻하는 동일한 의미를 갖고 있는데, 수집부(113)가 이를 다른 키워드로 인식을 하게 되면 발생 빈도, 시기, 위치 등 중요도 선정 방식에 문제가 발생될 수 있다. 따라서, 딥러닝, 머신러닝 등을 통한 인공지능 기능을 활용하여, 동의어에 대하여 대표적인 키워드를 지정함으로써 이러한 문제점을 해결할 수 있다. 예시적으로, 수집부(113)는 "가상화폐"와 "암호화폐"를 대표어인 "가상화폐"로 변환하여 이벤트 데이터로 수집할 수 있다.
또한, 수집부(113)는 이벤트 데이터들과 키워드벡터들을 시계열적으로 수집할 수 있다. 즉, 각 이벤트 데이터와 키워드벡터가 발생된 시점이 기록될 수 있다.
도 4는 도 1에 도시한 인공지능을 활용한 데이터베이스 모듈(110a)의 이벤트군 구성부(114)가 구성하는 복수의 이벤트군(111, 112)을 예시적으로 나타낸 도면이다. 이하, 도 2 및 도 4를 참조하여 본 실시예에 따른 이벤트군 구성부(114)에 대해 살펴보기로 한다.
이벤트군 구성부(114)는 수집부(113)가 수집한 이벤트 데이터를 유사한 이벤트 데이터끼리 묶어 복수의 이벤트군(111, 112)을 구성하는 부재이다. 여기서, 이벤트군 구성부(114)는 예를 들어 복수의 상위 이벤트군(111)과 복수의 하위 이벤트군(112)을 구성할 수 있으며, 하위 이벤트군(112)는 유사한 이벤트 데이터들끼리 묶여 구성될 수 있고 상위 이벤트군(111)은 유사한 하위 이벤트군(112)들끼리 묶여 구성될 수 있다.
예를 들어, 도 4에 도시한 바와 같이, 이벤트군 구성부(114)는 가장 상위 이벤트군(111)의 개념으로서, 정치 이벤트군, 경제 이벤트군, 사회 이벤트군, 과학기술 이벤트군, 예술문화체육 이벤트군, 자연 이벤트군을 구성할 수 있으며, 이러한 각 상위 이벤트군(111)에 하위 이벤트군(112)이 복수로 포함될 수 있다. 예시적으로 정치 이벤트군은 북한 이벤트군, 테러 이벤트군, 국내 정치 이벤트군, 외교 이벤트군 등을 하위 이벤트군(112)으로 포함할 수 있으며, 경제 이벤트군은 환율 이벤트군, 유가 이벤트군, 주가 이벤트군, 금리 이벤트군 등을 하위 이벤트군(112)으로 포함할 수 있다. 또한, 사회 이벤트군은 윤리 이벤트군, 횡령 이벤트군, 대기업 이벤트군, 교육 이벤트군 등을 하위 이벤트군(112)으로 포함할 수 있으며, 과학기술 이벤트군은 과학 이벤트군, 기술 이벤트군, 제품 이벤트군, 기업 이벤트군 등을 하위 이벤트군(112)으로 포함할 수 있다. 또한, 예술문화체육 이벤트군은 문화 이벤트군, 스포츠 이벤트군, 예술 이벤트군, 연예계 이벤트군 등을 하위 이벤트군(112)으로 포함할 수 있고, 자연 이벤트군은 기상 이벤트군, 재해 이벤트군, 환경 이벤트군, 동식물 이벤트군 등을 하위 이벤트군(112)으로 포함할 수 있다. 단, 이러한 하위 이벤트군(112)의 나열은 예시적인 것으로 볼 수 있고 이벤트 데이터 간의 유사성에 따라 다양하게 구성될 수 있을 것이다.
일 예로서, 유사한 이벤트 데이터인 "지진"과 "해일"이라는 이벤트 데이터는 상위 이벤트군(111)으로서 "자연 이벤트군"에, 하위 이벤트군(112)으로서 "재해 이벤트군"에 속할 수 있으며 각각 "자연_재해_지진", "자연_재해_해일"이라 인덱싱될 수 있다. 또한 다른 예시로, 유사한 이벤트 데이터인 "성추행", "뺑소니"라는 이벤트 데이터는 상위 이벤트군(111)으로서 "사회 이벤트군"에, 하위 이벤트군(112)으로서 "윤리 이벤트군"에 속할 수 있으며 각각 "사회_윤리_성추행", "사회_윤리_뺑소니"라 인덱싱될 수 있다.
이와 같이 이벤트군 구성부(114)는 관련 있는 유사한 이벤트 데이터들끼리 묶어 하나의 하위 이벤트군(112)을 구성할 수 있으며, 이러한 하위 이벤트군(112)들을 다시 유사성에 따라 묶어 상위 개념의 이벤트군(111)을 구성하는 것도 가능하다. 또한, 하위 이벤트군(112)에 하하위 이벤트군을 두는 것도 가능하며 더욱 상세하게 분류하여 더욱 하위 개념의 이벤트군을 만드는 것도 가능하다 할 것이다.
또한, 이벤트군 구성부(114)는 머신러닝이나 학습 또는 인공지능 기능을 통해 수집부(113)가 새로운 이벤트 데이터를 수집함에 따라 이러한 이벤트군(111, 112)을 새로이 생성하거나 수정하는 것도 가능할 수 있다. 예를 들어 "가상화폐"가 새로운 이벤트 데이터로 수집되었을 때 기존의 "IT버블"이란 이벤트 데이터와 유사하다고 판단되면, 이들을 묶어 새로운 이벤트군인 "신기술투자"라는 이벤트군을 생성하거나 또는 기존의 이벤트군을 수정할 수 있을 것이다.
한편, 이벤트군 구성부(114)가 유사한 이벤트 데이터들을 묶어 이벤트군을 구성하기 위해서는 이벤트 데이터들 간의 유사도, 연관관계 등을 파악하는 것이 중요할 수 있다. 이때, 이러한 이벤트 데이터들 간의 유사도, 연관관계 등의 파악은 키워드벡터 수집부(113b)가 수집한 키워드벡터로 가능할 수 있다. 구체적으로, 이벤트 수집부(113a)가 이벤트 데이터를 수집할 때 키워드벡터 수집부(113b)는 수집한 이벤트 데이터와 관련되는 키워드벡터를 각각 수집할 수 있다. 이러한 키워드벡터는 하나의 이벤트 데이터에 대하여 복수로 수집될 수도 있는데, 이벤트군 구성부(114)는 각 이벤트 데이터와 관련되는 키워드벡터가 서로 다른 이벤트 데이터 간 얼마나 매칭 내지는 중첩되는지에 따라 이벤트 데이터 간 유사성을 판단할 수 있다.
일 예로서, 최근 이슈가 되는 이벤트 데이터인 "가상화폐"의 경우 뉴스, SNS 등 인터넷정보를 파악하면 키워드벡터로 "폭등", "정부 개입", "폭락", "신기술" 등이 수집될 수 있다. 이러한 "가상화폐"와 유사했던 과거 사례를 보자면 1998년~2000년 사이의 이벤트 데이터인 "IT버블"을 들 수 있다. "IT버블"의 키워드벡터로는 "폭등", "투자", "폭락", "신기술" 등이 수집될 수 있으며 "가상화폐"와 "IT버블" 간 키워드벡터가 중첩되는 정도가 높아 "가상화폐"와 "IT버블"은 동일한 이벤트군, 예를 들어 "투자 이벤트군"과 같은 동일한 이벤트군으로 매칭될 수 있다.
또한, 2008년에 이슈가 되었던 이벤트 데이터인 "키코사태"도 "가상화폐"와 유사한 이벤트로 판단될 수 있다. 키코(KIKO)는 환헷지를 위한 파생상품으로서, 약정환율과 환율변동의 상한(knock-in)과 하한(knock-out)을 정해놓고 환율이 일정 범위에서 변동한다면 미리 정한 약정환율에 달러를 팔 수 있어 환율변동에 따른 위험을 줄일 수 있는데, 환율이 상한 이상으로 오르게 되면 약정액의 1∼2배를 같은 고정환율에 매도해야 한다는 옵션이 붙고 환율이 하한 이하로 떨어지면 계약이 해지되어 환손실을 입는 상품이다. 2008년 당시 환율변동으로 인해 발생하는 위험을 피하기 위해 키코에 가입한 수출중소기업들이 상당하였는데, 2008년 글로벌 금융위기 당시 달러 환율 급등으로 인해 상한(knock-in) 구간에 들어가게 되어 중소기업들이 큰 손실을 보았다. 2008년 당시 이벤트 데이터인 "키코사태"와 관련성이 높은 키워드벡터는 "폭등(환율폭등)", "정부 개입 필요" 등으로 수집될 수 있으며, 이에 따라 "가상화폐"와 "키코사태"는 키워드벡터의 매칭성이 높아 동일한 이벤트군으로 매칭될 수 있다.
도 5는 도 1에 도시한 인공지능을 활용한 데이터베이스 모듈(110a)의 이벤트 매칭부(115)가 이벤트 데이터를 대응되는 이벤트군에 매칭시키는 것을 나타낸 도면이다. 이하, 도 2 및 도 5를 참조하여 본 실시예에 따른 이벤트 매칭부(115)에 대해 살펴보기로 한다.
이벤트 매칭부(115)는 이벤트 수집부(113a)가 수집한 이벤트 데이터를 이벤트군 구성부(114)가 구성한 복수의 이벤트군 중 대응되는 이벤트군에 매칭시키는 부분이다. 여기서, 이벤트 매칭부(115)는 새롭게 수집된 이벤트 데이터에 대하여, 함께 수집된 키워드벡터를 특정 이벤트군에 포함된 다른 이벤트 데이터의 키워드벡터와 매칭시키고, 매칭성이 기설정된 값 이상일 경우 해당 이벤트군에 해당 이벤트 데이터를 매칭시킬 수 있다.
한편, 이벤트 매칭부(115)는 상기와 같이 새롭게 수집한 이벤트 데이터의 매칭뿐만 아니라 기존에 특정 이벤트군에 매칭되어 있던 이벤트 데이터의 이벤트군을 변경할 수도 있다. 일 예시로서 도 5에 도시한 바와 같이 기존에 A라는 이벤트 데이터와 B라는 이벤트 데이터가 a라는 이벤트군에 속해 있는데, 이때 이벤트 수집부(113a)가 새롭게 C라는 이벤트 데이터를 수집하여 기존 A, B 이벤트 데이터와 키워드벡터 매칭성을 살펴볼 수 있다. 이러한 키워드벡터 매칭성 판단에 따라 A와 C 이벤트 데이터의 매칭성이 A와 B 이벤트 데이터의 매칭성 또는 B와 C 이벤트 데이터의 매칭성에 비해 현저히 크다고 판단되면, 이벤트 매칭부(115)는 a 이벤트군에 A와 C 이벤트 데이터를 매칭시키고, B 이벤트 데이터는 유사도가 높은 다른 이벤트군인 b 이벤트군에 매칭시킬 수 있다. 즉, 새로운 이벤트 데이터가 수집됨에 따라 기존 이벤트 데이터가 매칭되는 이벤트군이 이벤트 매칭부(115)에 의해 변경될 수 있다. 따라서, 동일한 이벤트군에 속하는 이벤트 데이터 간 유사성이 점차 향상될 수 있으며, 이때 딥러닝, 머신러닝 등을 통한 인공지능 기능을 활용할 수도 있다.
도 6은 본 발명의 다른 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110b)의 세부구성을 나타낸 도면이고, 도 7은 도 6에 도시한 인공지능을 활용한 데이터베이스 모듈(110b)이 경쟁사를 탐색하는 프로세스를 나타낸 도면이다. 이하, 도 6 및 도 7을 참조하여 본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110b)에 대해 살펴보기로 한다. 여기서, 이전 실시예와 동일한 구성요소는 동일한 참조부호로 표시되며 이전 실시예와 중복되는 설명은 생략하기로 한다.
도 6에 도시한 바와 같이, 본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110b)은 이전 실시예의 구성과 같은 수집부(113), 이벤트군 구성부(114), 이벤트 매칭부(115) 외에 제품 수집부(116)와 기업군 구성부(117)를 더 포함할 수 있다.
제품 수집부(116)는 인터넷정보로부터 기업이 생산하는 제품 정보를 수집하는 부분이다. 여기서, 제품 수집부(116)는 뉴스, SNS, 한국거래소 보고서, 신용평가기관의 신용평가보고서, 기술평가기관의 기술평가보고서 등에 등장하는 기업 관련 인터넷정보에서 키워드 추출 분석을 통해 기업이 생산하는 제품이 무엇인지 파악하고 이를 수집할 수 있다. 이때, 제품 수집부(116)가 키워드 중 제품에 해당하는 것이 무엇인지 파악할 수 있도록, 예를 들어 미리 제품 관련 단어를 제품표로 구비해두고 추출된 키워드를 상기 제품표와 비교하는 방식을 이용할 수 있다.
한편, 기업군 구성부(117)는 제품 수집부(116)가 수집한 제품 정보에 따라 동일한 제품을 생산하는 기업들을 복수의 기업군 단위로 묶어서 구성할 수 있다. 따라서, 도 7에 도시한 바와 같이 사용자가 사용자 단말기(200; 도 1에 도시) 또는 별도의 입력장치를 통해 특정 기업에 대한 경쟁사 정보 요청을 하는 경우(S101), 본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110b)은 우선 기업군 구성부(117)에서 해당 기업이 속해 있는 기업군을 확인하고(S102), 해당 기업군에 속해있는 다른 기업과 관련된 정보를 경쟁사 정보로 출력할 수 있다(S103).
도 8은 본 발명의 또 다른 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110c)의 세부구성을 나타낸 도면이다. 이하, 도 8을 참조하여 본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110c)에 대해 살펴보기로 한다. 여기서, 이전 실시예와 동일한 구성요소는 동일한 참조부호로 표시되며 이전 실시예와 중복되는 설명은 생략하기로 한다.
도 8에 도시한 바와 같이, 본 실시예에 따른 인공지능을 활용한 데이터베이스 모듈(110c)은 이전 실시예의 구성과 같은 수집부(113), 이벤트군 구성부(114), 이벤트 매칭부(115) 외에 산업 수집부(118)를 더 포함할 수 있다.
산업 수집부(118)는 인터넷정보로부터 특정 산업에 대한 전방산업과 후방산업 정보를 추출하여 수집하는 부분이다. 여기서, 산업 수집부(118)는 뉴스, SNS, 한국거래소 보고서, 신용평가기관의 신용평가보고서, 기술평가기관의 기술평가보고서 등에 등장하는 산업 관련 인터넷정보에서 키워드 추출 분석을 통해 특정 산업에 대한 전방산업과 후방산업이 무엇인지 파악하고 각 산업에 속하는 기업들까지 수집할 수 있다. 이때, 산업 수집부(118)가 키워드 중 산업에 해당하는 것이 무엇인지 파악할 수 있도록, 예를 들어 미리 산업 관련 단어를 산업표로 구비해두고 추출된 키워드를 상기 산업표와 비교하는 방식을 이용할 수 있다.
도 9는 도 2에 도시한 데이터베이스 모듈(110a)을 포함하는 인공지능을 활용한 경제데이터 제공 시스템(100a)의 세부구성을 나타낸 도면이다. 이하, 이를 참조하여 본 실시예에 따른 인공지능을 활용한 경제데이터 제공 시스템(100a)에 대해 살펴보기로 한다.
도 9에 도시한 바와 같이 본 실시예에 따른 인공지능을 활용한 경제데이터 제공 시스템(100a)은 인공지능을 활용한 데이터베이스 모듈(110a), 대상 이벤트를 선정하는 이벤트 선정부(120), 과거 이벤트 데이터를 선정하는 이벤트 탐색부(130), 및 제1 경제데이터를 추출하는 경제데이터 추출부(140)를 포함할 수 있으며, 이러한 구성요소 중 적어도 하나는 빅데이터/인공지능 기술을 활용할 수 있다.
도 10는 도 9에 도시한 인공지능을 활용한 경제데이터 제공 시스템(100a)의 대상 이벤트 선정과정에 대한 사용자 단말기(200)의 화면을 나타낸 도면이다. 이하, 도 9 및 도 10을 참조하여 본 실시예에 따른 이벤트 선정부(120)에 대해 살펴보기로 한다.
이벤트 선정부(120)는 인공지능을 활용한 데이터베이스 모듈(110a) 또는 사용자의 입력을 통해 대상 이벤트를 선정하는 부분이다. 여기서, 이벤트 선정부(120)가 대상 이벤트를 선정하는 방식은 다양하게 구현될 수 있는데, 하나씩 살펴보면 다음과 같다.
먼저, 이벤트 선정부(120)가 인공지능을 활용한 데이터베이스 모듈(110a)을 통해 자동으로 대상 이벤트를 선정하는 방식이다. 이때, 이벤트 선정부(120)는 빅데이터와 인공지능 기능 등을 통해 수집부(113)가 수집한 여러 이벤트 데이터를 살펴 이러한 이벤트 데이터의 출현 시기 정보, 출현 횟수 정보, 출현 지속성 정보 등을 종합함으로써 최근 뉴스, SNS, 웹페이지 등에서 이슈가 되고 있는 대상 이벤트를 선정할 수 있다. 예를 들어 특정 이벤트 데이터가 최근에 출현 됐을수록, 뉴스나 포털사이트 등에서의 발현량이 클수록, 또한 지속적으로 출현되고 있을수록 대상 이벤트로 선정될 가능성이 높아질 수 있다. 또한, 대상 이벤트를 선정할 때 인공지능을 활용한 데이터베이스 모듈(110a)에 수집된 전체 기간의 이벤트 데이터를 이용할 수도 있고 또는 기 설정된 기간 내, 예를 들어 6개월 이내 발생된 이벤트 데이터만을 이용하는 것도 가능하다. 상기와 같이 기간을 설정해 놓는 경우 비교적 최신 이슈를 추출하기 용이할 수 있다. 이러한 대상 이벤트는 설정에 따라 1회에 한 개만 선정될 수도 있고 또는 복수 개가 선정될 수도 있다. 또한, 이벤트 선정부(120)는 인공지능 기능을 이용하여 대상 이벤트를 선정하는 방식이나 기준 등을 기계적 학습에 따라 바꾸는 것도 가능할 수 있다.
다음 두 번째 방식은 이벤트 선정부(120)가 사용자의 입력을 받아 대상 이벤트를 선정하는 방식이다. 사용자 단말기(200)의 화면 또는 별도의 입력장치를 통해 대상 이벤트를 입력할 수 있도록 구성하고, 이벤트 선정부(120)는 사용자가 입력한 것을 대상 이벤트로 선정하도록 구성할 수 있는데, 예를 들어 사용자가 사용자 단말기(200)에 "지진"을 입력하면 대상 이벤트로 "지진"을 선정하는 방식이다. 앞선 첫 번째 방식의 경우 이벤트 선정부(120)가 데이터베이스 모듈(110a)을 통해 대상 이벤트를 선정하므로 그러한 대상 이벤트는 현 시점에 발생했거나 또는 과거에 발생한 것일 수밖에 없는데, 두 번째 방식의 경우 사용자가 직접 입력하는 방식이므로 발생여부에 무관하게 대상 이벤트가 선정될 수 있다. 예를 들어, "한라산 분화"의 경우 첫 번째 방식으로는 대상 이벤트로 선정되기 어려우나, 두 번째 방식으로는 사용자가 입력을 하면 대상 이벤트로 선정될 수도 있을 것이다.
다음 세 번째 방식은 앞선 두 가지 방식을 융합한 방식이다. 도 10에 도시한 바와 같이 이벤트 선정부(120)는 수집부(113)가 수집한 여러 이벤트 데이터를 살펴 이러한 이벤트 데이터의 출현 시기 정보, 출현 횟수 정보, 출현 지속성 정보 등을 종합함으로써 최근 뉴스, SNS, 웹페이지 등에서 이슈가 되고 있는 후보 이벤트(121)를 선정할 수 있으며, 이를 사용자 단말기(200)에 표시할 수 있다. 이때, 이벤트 선정부(120)는 인공지능 기능을 포함하여 기계적 학습을 통해 사용자들이 더 많은 관심을 가졌던 후보 이벤트부터 차례로 사용자 단말기(200)의 화면에 표시하여, 사용자가 대상 이벤트를 선택 입력하는데 도움을 줄 수 있다. 사용자는 사용자 단말기(200)에 표시된 후보 이벤트(121) 중 마음에 드는 후보 이벤트(121)를 선택 입력할 수 있으며, 이벤트 선정부(120)는 선택 입력된 후보 이벤트(121)를 대상 이벤트로 선정할 수 있다. 세 번째 방식의 경우에도 첫 번째 방식과 동일하게 아직 발생되지 않은 이벤트는 대상 이벤트로 선정되기 어려우며, 이미 발생되어 데이터베이스 모듈(110a)에 수집된 이벤트 데이터가 후보 이벤트(121)를 거쳐 대상 이벤트로 선정될 수 있다.
본 실시예를 설명함에 있어 위와 같은 세 가지 방식을 예시적으로 설명하였으나, 본 발명은 이에 한정되지 않고 빅데이터나 인공지능 등과 관련된 다른 기술로 구현되는 것도 가능하다 할 것이다.
도 11은 도 9에 도시한 인공지능을 활용한 경제데이터 제공 시스템(100a)의 이벤트 탐색부(130)가 과거 이벤트 데이터를 선정하는 프로세스를 나타낸 도면이고, 도 12는 다른 실시예에 따른 도 9에 도시한 인공지능을 활용한 경제데이터 제공 시스템(100a)의 이벤트 탐색부(130)가 과거 이벤트 데이터를 선정하는 프로세스를 나타낸 도면이다. 이하, 도 9, 도 11, 및 도 12를 참조하여 본 실시예에 따른 이벤트 탐색부(130)에 대해 살펴보기로 한다.
이벤트 탐색부(130)는 이벤트 선정부(120)가 선정한 대상 이벤트보다 이전에 발생된 동일 이벤트 데이터 또는 유사 이벤트 데이터를 인공지능을 활용한 데이터베이스 모듈(110a)에서 탐색하여, 이 중 적어도 하나를 과거 이벤트 데이터로 선정하는 부분이다. 여기서, 동일 이벤트 데이터란 수집부(113)가 수집한 복수의 이벤트 데이터 중 대상 이벤트와 동일한 과거 발생된 이벤트를 의미하고, 유사 이벤트 데이터란 대상 이벤트와 동일하지는 않지만 대상 이벤트와 동일한 이벤트군에 매칭되는 다른 과거 발생된 이벤트 데이터를 의미할 수 있다. 다만 여기서 "동일 이벤트 데이터"란 문자 그대로 완전히 동일한 이벤트 데이터가 될 수도 있지만 경우에 따라 유사도가 매우 높아(예를 들어 키워드벡터 매칭성에 따른 유사도 90% 이상) 실질적으로 동일한 이벤트 데이터로 볼 수 있는 경우도 포함한다 할 것이다.
구체적으로, 이벤트 데이터는 데이터베이스 모듈(110a)에 수집될 때 하위 이벤트군(112; 도 4에 도시됨)과 상위 이벤트군(111; 도 4에 도시됨)에 속하게 되는데, 유사한 이벤트란 대상 이벤트와 동일하지는 않지만 동일한 하위 이벤트군(112) 내지는 상위 이벤트군(111)에 속하는 이벤트 데이터로 정의할 수 있다. 예를 들어 대상 이벤트가 "지진"인 경우 대상 이벤트와 동일한 이벤트는 "지진"이며, 유사한 이벤트는 "지진"의 하위 이벤트군(112)인 "재해 이벤트군"에 속하는 다른 이벤트 데이터, 예컨대 "태풍", "해일" 등에 해당할 수 있다. 또는 유사한 이벤트는 "지진"의 상위 이벤트군(111)인 "자연 이벤트군"에 속하는 다른 이벤트 데이터, 예를 들어 하위 이벤트군(112)인 "기상 이벤트군"에 속하는 "황사", "미세먼지" 등에 해당할 수 있다.
이러한 유사 이벤트 데이터 개념은 이벤트 선정부(120)가 선정한 대상 이벤트가 과거에 전혀 없었던 경우 유용할 수 있다. 예를 들어 최근에 이슈가 되는 "가상화폐"를 이벤트 선정부(120)가 대상 이벤트로 선정한 경우 "가상화폐"와 동일한 이벤트 데이터는 이전에 없었으므로 대상 이벤트와 동일한 동일 이벤트 데이터를 탐색할 수 없다. 이때, "가상화폐"란 이벤트 데이터가 수집될 때 이벤트군 구성부(114)는 키워드벡터 수집부(113b)가 수집한 키워드벡터의 상호 매칭성을 살펴 이벤트군을 구성할 수 있는데, 구체적으로 "가상화폐"와 기존 이벤트 데이터인 "IT버블"이 "폭등", "신기술", "투자" 등의 키워드벡터가 매칭되어 하나의 이벤트군으로 구성될 수 있다. 따라서, 이벤트 선정부(120)가 "가상화폐"를 대상 이벤트로 선정하였을 때, 이벤트 탐색부(130)가 "가상화폐"와 동일한 동일 이벤트 데이터를 탐색할 수는 없지만 동일한 이벤트군에 속하는 "IT버블"이란 유사 이벤트 데이터를 과거 이벤트 데이터로 선정할 수 있다.
또 다른 예시로서는 최근 이슈가 되고 있는 폴란드의 EU 연합 탈퇴를 의미하는 "폴렉시트"를 들 수 있는데, 과거에 폴란드가 EU 연합을 탈퇴했던 동일 이벤트 데이터가 없는 상황이다. 이때에도 "폴렉시트"라는 새로운 이벤트 데이터가 수집될 때 이벤트군 구성부(114)가 "폴렉시트"와 "브렉시트"를 동일한 이벤트군으로 구성할 수 있고, 이벤트 선정부(120)가 "폴렉시트"를 이벤트 데이터로 선정한 경우 이벤트 탐색부(130)가 "폴렉시트"의 유사 이벤트 데이터인 "브렉시트"를 탐색하여 과거 이벤트 데이터로 선정할 수 있다.
한편, 이벤트 탐색부(130)는 유사 이벤트 데이터보다는 동일 이벤트 데이터를 우선시 탐색하여 과거 이벤트 데이터로 선정할 수 있다. 구체적으로, 도 11에 도시한 바와 같이 이벤트 탐색부(130)는 먼저 동일 이벤트 데이터를 탐색하고(S131), 수집부(113)가 수집한 복수의 이벤트 데이터 중 동일 이벤트 데이터가 있는지를 판단하여(S132), 있는 경우 유사 이벤트 데이터를 탐색하지 않고도 동일 이벤트 데이터를 과거 이벤트 데이터로 선정할 수 있으며(S133), 만일 동일 이벤트 데이터가 없다면 유사 이벤트 데이터를 탐색하여(S134), 유사 이벤트 데이터를 과거 이벤트 데이터로 선정할 수 있다(S135). 이때, 이벤트 탐색부(130)의 정확성을 높이기 위해서는 유사 이벤트 데이터를 탐색할 때에도 대상 이벤트와 동일한 하위 이벤트군(112)에 매칭되는 유사 이벤트 데이터를 상위 이벤트군(111)에 매칭되는 유사 이벤트 데이터에 비해 우선시하는 것이 바람직할 수 있다.
한편, 이벤트 탐색부(130)가 반드시 동일 이벤트 데이터를 탐색하는 프로세스를 거쳐야 하는 것은 아닐 수 있다. 예를 들어 동일한 "제주도 태풍"의 경우에도 어느 시기에 어떤 상황에서 발생했는지에 따라 동일 이벤트 데이터가 아닌 유사 이벤트라 볼 수 있다. 따라서, 관점에 따라서는 완전히 동일한 동일 이벤트 데이터는 없다라고 볼 수 있으며, 이러한 관점에서는 도 12에 도시한 바와 같이 이벤트 탐색부(130)가 동일 이벤트 데이터에 대한 탐색 없이 유사 이벤트 데이터만을 탐색할 수 있고(S136), 대상 이벤트와 동일한 이벤트군에 속하면서 예시적으로 'Word2vec' 알고리즘 등을 이용한 대상 이벤트 데이터와의 키워드벡터 매칭성에 따라 가장 유사한 유사 이벤트 데이터를 과거 이벤트 데이터로 선정할 수 있다(S137).
또한, 앞서 설명한 이벤트 탐색부(130)는 자동으로 과거 이벤트 데이터를 선정하고 있는데, 여기에 사용자의 선택 입력을 부가하여 선정하도록 구성하는 것도 가능하다. 구체적으로, 이벤트 탐색부(130)는 복수의 유사 이벤트 데이터를 사용자 단말기(200)에 표시하고, 사용자가 복수의 유사 이벤트 데이터 중 어느 하나를 선택하면 이를 과거 이벤트 데이터로 선정할 수 있다. 이러한 방식의 경우 사용자 맞춤형 결과에 더욱 도움이 될 수 있다. 또한, 이벤트 탐색부(130)는 인공지능 기능을 포함하여 기계적 학습을 통해 사용자들이 더 많은 관심을 가졌던 유사 이벤트 데이터부터 차례로 사용자 단말기(200)의 화면에 표시하여, 사용자가 과거 이벤트 데이터를 선택하는데 도움을 줄 수 있다.
도 13은 도 9에 도시한 인공지능을 활용한 경제데이터 제공 시스템(100a)의 경제데이터 추출부(140)가 제1 경제데이터를 추출하여 제시한 사용자 단말기(200)의 화면을 나타낸 도면이다. 이하, 도 9 및 도 13을 참조하여 본 실시예에 따른 경제데이터 추출부(140)에 대해 살펴보기로 한다.
경제데이터 추출부(140)는 이벤트 탐색부(130)가 선정한 과거 이벤트 데이터 발생 시의 제1 경제데이터를 추출하는 부분이다. 여기서, 경제데이터 추출부(140)는 인공지능을 활용한 데이터베이스 모듈(110a)로부터 또는 별도의 데이터베이스로부터 제1 경제데이터를 추출할 수 있다. 이때, 별도의 데이터베이스는 신용평가회사, 한국거래소, 한국은행 등 본 실시예에 따른 인공지능을 활용한 경제데이터 제공 시스템(100a)의 외부에 설치된 데이터베이스이거나 또는 인공지능을 활용한 경제데이터 제공 시스템(100a)에 포함되는 개념일 수 있으며, 인공지능을 활용한 경제데이터 제공 시스템(100a)에 포함되는 개념일 경우 인공지능을 활용한 데이터베이스 모듈(110a)과는 구분되어 설치되어 있거나 또는 물리적으로 함께 설치된 경우도 가능하다 할 것이다.
또한, 경제데이터 추출부(140)가 추출하는 제1 경제데이터란 기업관련 정보(예를 들어 차입금의 규모, 금리, 재무제표, 재무비율 등의 재무데이터, 주가, 채권, 종업원 수, 제품 종류와 개수 등 비재무데이터), 산업관련 정보(산업의 규모, 성장성, 경쟁상황, 환경요인 등), 그 외 경제 정보(거시경제변수와 관련된 GDP, GNP, 환율, 유가, 원자재, 외환 보유고, 주가, 금시장 정보, 가상화폐 정보, 국가경쟁력, 국채, 기준금리, 보험증권, 물가지수, 국제수지, 무역지수, 경제심리지수, 신용도 등) 등 경제와 관련된 전체 데이터 중 적어도 하나라 볼 수 있다. 일 예로, 도 13에 도시한 바와 같이, 경제데이터 추출부(140)는 재무 상황(141), 주가 상황(142), 금리 상황(143) 등의 정보를 표, 그림, 그래프, 수치 등을 통해 사용자 단말기(200)에 표시할 수 있다.
한편, 경제데이터 추출부(140)는 제1 경제데이터 각 항목을 가공 없이 추출하여 제시하는 것도 가능하고 또는 제1 경제데이터 변화, 예를 들어 환율, 유가 등의 항목 변화를 비율 등으로 추출하여 제시하는 것도 가능하다. 예를 들어, 대상 이벤트인 "IT버블"이 발생했을 당시 경제 항목인 유가, 환율, 주가 등의 변화를 비율로 추출하여 표, 수치, 그래프 등으로 제시할 수 있다. 이러한 경우 사용자는 대상 이벤트가 기업, 산업, 국가 등의 경제에 미친 영향을 쉽게 파악할 수 있으며 유사한 이벤트가 발생한다면 어떤 방향으로 경제에 영향을 미칠지 추정해볼 수 있을 것이다.
한편, 경제데이터 추출부(140)는 도 13과 같이 사용자 단말기(200) 화면에 경제데이터를 표시하는 것을 넘어서 자동으로 보고서를 작성하는 것도 가능할 수 있다. 이러한 경우 보고서 작성까지 거의 실시간으로 이루어질 수 있으며, 이는 기존의 애널리스트, 산업분석 전문가, 신용평가사, 기업 대출담당자 등이 과거 유사한 이벤트 발생 시의 경제데이터 변화를 나타낸 보고서를 작성하는 것 대비, 시간과 노력을 매우 효과적으로 절감할 수 있다.
도 14는 본 발명의 다른 실시예에 따른 인공지능을 활용한 경제데이터 제공 시스템(100b)의 세부구성을 나타낸 도면이다. 이하, 이를 참조하여 본 실시예에 따른 인공지능을 활용한 경제데이터 제공 시스템(100b)에 대해 살펴보기로 한다. 여기서, 이전 실시예와 동일한 구성요소는 동일한 도면부호로 표시되며 이전 실시예와 중복되는 구성에 대한 설명은 생략하기로 한다.
도 14에 도시한 바와 같이, 본 실시예에 따른 인공지능을 활용한 경제데이터 제공 시스템(100b)은 인공지능을 활용한 데이터베이스 모듈(110a), 대상 이벤트를 선정하는 이벤트 선정부(120), 과거 이벤트 데이터를 선정하는 이벤트 탐색부(130), 및 제1 경제데이터를 추출하는 경제데이터 추출부(140)를 포함하되, 제2 경제데이터를 추정하는 경제데이터 추정부(150)를 더 포함할 수 있다.
경제데이터 추정부(150)는 경제데이터 추출부(140)가 추출한 제1 경제데이터를 통해 대상 이벤트 발생 또는 선정 시(대상 이벤트를 입력하는 방식의 경우) 제2 경제데이터를 추정하는 부분이다. 일 예로서, 경제데이터 추정부(150)는 다음과 같은 방식으로 제2 경제데이터를 추정할 수 있다.
먼저, 경제데이터 추출부(140)가 대상 이벤트와 동일 또는 유사한 이벤트 데이터 중 선정된 과거 이벤트 데이터 발생 시 제1 경제데이터의 변화를 추출할 수 있다. 예를 들어, "IT버블"이라는 과거 이벤트 데이터가 발생했을 당시 유가, 환율 등 거시경제변수와 관련된 제1 경제데이터 변화를 비율로 산출할 수 있다.
다음, 경제데이터 추정부(150)는 이러한 제1 경제데이터의 변화를 제2 경제데이터에 적용하여, 대상 이벤트 발생 또는 선정 시 제2 경제데이터 변화를 추정할 수 있다. 예를 들어, "가상화폐"라는 대상 이벤트가 현재 또는 미래에 발생하는 경우 유가, 환율 등 거시경제변수와 관련된 제2 경제데이터에 어떠한 변화가 일어날지, 과거 제1 경제데이터 변화 비율을 적용하여 추정할 수 있다. 예를 들어 과거 이벤트 데이터인 "IT버블"이 발생했을 당시 유가가 1.5배가 되었다면, 현재 대상 이벤트인 "가상화폐"가 발생했을 당시 유가가 1.5배 될 것으로 추정할 수 있다. 즉, 과거 경제데이터 변화를 통해 현재 경제데이터가 어떻게 변화될지 추정하는데 본 시스템을 이용할 수 있다.
이때, 경제데이터 추정부(150)는 사용자 단말기(200)에 이러한 변화 비율을 표시하는 것도 가능하고, 또는 단순히 "긍정(Positive)", "부정(Negative)" 등으로만 표시하여 방향성만 제시하는 것도 가능하다. 예를 들어, "가상화폐"라는 이슈가 발생했을 때 "유가 ⇒ 부정", "환율 ⇒ 긍정", "무역수지 ⇒ 부정"이라고 표시될 수 있다는 의미일 수 있다. 또한 그래프로 표현하는 것도 가능할 것이며 변화 비율뿐 아니라 구체적인 수치(매출액, 영업이익 등)를 표현하는 것도 가능하고, 알림 표시를 색상으로 제공하는 것도 가능하다 할 것이다.
한편, 경제데이터 추정부(150)는 단순히 화면에 제2 경제데이터를 표시하는 것을 넘어서 자동으로 보고서를 작성하는 것도 가능할 수 있다. 이러한 경우 보고서 작성까지 거의 실시간으로 이루어질 수 있으며, 이는 기존의 애널리스트, 산업분석 전문가, 신용평가사, 기업 대출담당자 등이 경제데이터를 추정하는 보고서를 작성하는 것 대비, 시간과 노력을 매우 효과적으로 절감할 수 있다.
한편, 경제데이터 추정부(150)가 제2 경제데이터를 추정하는 방식은 상기 방식에 국한되지 아니하며 빅데이터 분석, 인공지능 등을 이용하여 더욱 다양한 방식으로 구현할 수 있을 것이다.
도 15는 본 발명의 또 다른 실시예에 따른 인공지능을 활용한 경제데이터 제공 시스템(100c)의 세부구성을 나타낸 도면이다. 이하, 이를 참조하여 본 실시예에 따른 인공지능을 활용한 경제데이터 제공 시스템(100c)에 대해 살펴보기로 한다. 여기서, 이전 실시예와 동일한 구성요소는 동일한 도면부호로 표시되며 이전 실시예와 중복되는 구성에 대한 설명은 생략하기로 한다.
도 15에 도시한 바와 같이, 본 실시예에 따른 인공지능을 활용한 경제데이터 제공 시스템(100c)은 인공지능을 활용한 데이터베이스 모듈(110a), 대상 이벤트를 선정하는 이벤트 선정부(120), 과거 이벤트 데이터를 선정하는 이벤트 탐색부(130), 및 제1 경제데이터를 추출하는 경제데이터 추출부(140)를 포함하되, 사용자로부터 관심항목을 입력받는 입력부(160)를 더 포함할 수 있다.
사용자는 사용자 단말기(200) 또는 별도의 입력장치를 통해 관심이 있는 항목, 예를 들어 특정 기업이나 산업, 국가, 또는 유가 등의 경제변수를 관심항목으로 입력할 수 있으며, 입력부(160)는 이를 전달받아 경제데이터 추출부(140)로 전달할 수 있다. 이러한 경우 경제데이터 추출부(140)는 사용자의 관심항목을 고려하여 이와 관련된 제1 경제데이터를 추출할 수 있다. 이때, 이벤트 선정부(120)가 선정하는 대상 이벤트는 사용자의 관심항목과 관련된 이벤트 데이터가 되도록 설정하거나 또는 관련이 없도록 구성하는 것도 가능할 수 있다.
예시적으로, 입력부(160)가 사용자로부터 관심항목으로서 "A전자"를 입력받은 경우 경제데이터 추출부(140)는 "A전자"와 관련된 재무제표, 재무비율, 금리, 주가 등의 자료를 제1 경제데이터로 추출할 수 있다. 또 다른 예시로서 입력부(160)가 사용자로부터 관심항목으로서 "달러환율"을 입력받은 경우 경제데이터 추출부(140)는 환율과 관련된 자료 등을 제1 경제데이터로 추출할 수 있다.
만일 본 실시예에 이전 실시예에서 설명한 경제데이터 추정부(150)가 추가된다면, 경제데이터 추정부(150)가 추정하는 제2 경제데이터도 사용자의 관심항목과 관련된 내용일 수 있다.
도 16은 본 발명의 일 실시예에 따른 인공지능을 활용한 경제데이터 제공 방법을 설명하기 위한 순서도이다. 이하, 이를 참조하여 본 실시예에 따른 인공지능을 활용한 경제데이터 제공 방법에 대해 살펴보기로 한다.
도 16에 도시한 바와 같이, 인공지능을 활용한 경제데이터 제공 방법은 데이터베이스 모듈을 준비하는 단계(S110), 대상 이벤트를 선정하는 단계(S120), 과거 이벤트 데이터를 선정하는 단계(S130), 및 제1 경제데이터를 추출하는 단계(S140)를 포함할 수 있으며, 선택적으로 제2 경제데이터를 추정하는 단계(S150)를 더 포함할 수 있다.
먼저, 도 2에 도시한 인공지능을 활용한 데이터베이스 모듈(110a)을 준비할 수 있다(S110). 이때, 이벤트군 구성부(114)에 의해 유사한 이벤트 데이터끼리 묶여 이벤트군을 구성할 수 있으며, 이벤트 수집부(113a)가 수집한 이벤트 데이터는 이벤트 매칭부(115)에 의해 대응되는 이벤트군에 매칭될 수 있다.
다음, 대상 이벤트를 선정할 수 있다(S120). 이때, 대상 이벤트는 인공지능을 활용한 데이터베이스 모듈(110a)에서 최근 이슈가 되는 이벤트를 자동으로 추출하는 방식, 사용자가 입력하는 방식, 또는 인공지능을 활용한 데이터베이스 모듈(110a)에서 후보 이벤트(121)를 추출하고 사용자의 선택 입력에 따라 대상 이벤트를 선정하는 방식 등을 이용할 수 있다.
다음, 동일 이벤트 데이터 및 유사 이벤트 데이터 중 과거 이벤트 데이터를 선정할 수 있다(S130). 이때, 유사 이벤트 데이터보다 동일 이벤트 데이터를 우선시 탐색하여 과거 이벤트 데이터로 선정할 수 있으며, 과거 이벤트 데이터는 대상 이벤트보다 이전에 발생한 이벤트일 수 있다.
다음, 과거 이벤트 데이터 발생 시의 제1 경제데이터를 추출할 수 있다(S140). 이때, 사용자 단말기(200)를 통해 이러한 제1 경제데이터를 정리하여 표시할 수 있다.
다음, 선택적으로 제1 경제데이터를 통해 제2 경제데이터를 추정할 수 있다(S150). 이때, 제1 경제데이터는 과거 이벤트 데이터가 발생했을 때의 경제데이터이고, 제2 경제데이터는 대상 이벤트가 발생 또는 선정됐을 때의 경제데이터일 수 있다. 즉, 본 단계에서는 과거 동일/유사한 이벤트 발생 당시의 경제데이터를 통해 현재 대상 이벤트 발생 또는 선정 당시의 경제데이터를 추정해볼 수 있다.
상기와 같은 방식으로 본 실시예에 따른 인공지능을 활용한 경제데이터 제공 방법을 수행할 수 있다.
이상 본 발명을 구체적인 실시예를 통하여 상세히 설명하였으나, 이는 본 발명을 구체적으로 설명하기 위한 것으로, 본 발명에 따른 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템과 방법은 이에 한정되지 않으며, 본 발명의 기술적 사상 내에서 당해 분야의 통상의 지식을 가진 자에 의해 그 변형이나 개량이 가능함은 명백하다고 할 것이다.
본 발명의 단순한 변형 내지 변경은 모두 본 발명의 영역에 속하는 것으로 본 발명의 구체적인 보호 범위는 첨부된 특허청구범위에 의하여 명확해질 것이다.
100a, 100b, 100c : 인공지능을 활용한 경제데이터 제공 시스템
110a, 110b, 110c : 인공지능을 활용한 데이터 베이스 모듈
113 : 수집부
113a : 이벤트 수집부
113b : 키워드벡터 수집부
114 : 이벤트군 구성부
115 : 이벤트 매칭부
116 : 제품 수집부
117 : 기업군 구성부
118 : 산업 수집부
120 : 이벤트 선정부
130 : 이벤트 탐색부
140 : 경제데이터 추출부
150 : 경제데이터 추정부
160 : 입력부
200 : 사용자 단말기
300 : 외부 데이터 제공서버

Claims (20)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 인터넷정보로부터 복수의 이벤트 데이터를 수집하는 이벤트 수집부 및 상기 이벤트 데이터와 관련되는 키워드벡터를 수집하는 키워드벡터 수집부를 포함하는 수집부, 상기 복수의 이벤트 데이터를 유사한 이벤트 데이터끼리 묶어 복수의 이벤트군을 구성하는 이벤트군 구성부, 및 상기 이벤트 데이터를 대응되는 상기 이벤트군에 매칭시키는 이벤트 매칭부를 포함하는 인공지능을 활용한 데이터베이스 모듈;
    상기 수집부가 수집한 상기 복수의 이벤트 데이터 중 적어도 하나를 대상 이벤트로 선정하거나 또는 사용자 입력을 통해 대상 이벤트를 선정하는 이벤트 선정부;
    상기 대상 이벤트보다 이전에 발생된 동일 이벤트 데이터 또는 유사 이벤트 데이터를 상기 인공지능을 활용한 데이터베이스 모듈에서 탐색하여, 상기 동일 이벤트 데이터 또는 유사 이벤트 데이터 중 적어도 하나를 과거 이벤트 데이터로 선정하는 이벤트 탐색부; 및
    상기 과거 이벤트 데이터 발생 시의 제1 경제데이터를 추출하는 경제데이터 추출부;
    를 포함하며,
    상기 이벤트군 구성부는 상기 복수의 이벤트 데이터 간 상기 키워드벡터의 매칭성에 따라 상기 유사한 이벤트 데이터 여부를 판단하여 상기 이벤트군을 구성하고,
    상기 복수의 이벤트군은 복수의 상위 이벤트군 및 각각의 상기 상위 이벤트군에 포함되는 복수의 하위 이벤트군을 포함하며,
    상기 동일 이벤트 데이터는 상기 대상 이벤트와 동일한 이벤트 데이터이고, 상기 유사 이벤트 데이터는 상기 대상 이벤트와 동일한 이벤트군에 매칭되는 다른 이벤트 데이터이며,
    상기 이벤트 탐색부는 상기 동일 이벤트 데이터를 상기 유사 이벤트 데이터보다 우선시하여 상기 과거 이벤트 데이터로 선정하고,
    상기 이벤트 탐색부는 상기 대상 이벤트와 동일한 상기 하위 이벤트군에 매칭되는 상기 유사 이벤트 데이터를 상기 대상 이벤트와 동일한 상기 상위 이벤트군에 매칭되는 상기 유사 이벤트 데이터보다 우선시하여 상기 과거 이벤트 데이터로 선정하며,
    상기 이벤트 매칭부는 새롭게 수집되는 상기 이벤트 데이터에 대하여 함께 수집된 상기 키워드벡터를 특정한 상기 이벤트군에 포함된 다른 이벤트 데이터의 키워드벡터와 매칭시켜 매칭성이 기설정된 값 이상일 경우 해당하는 상기 이벤트군에 상기 새롭게 수집되는 이벤트 데이터를 매칭시키는 인공지능을 활용한 경제데이터 제공 시스템.
  9. 삭제
  10. 제8항에 있어서,
    상기 대상 이벤트 이전에 발생된 상기 동일 이벤트 데이터가 상기 인공지능을 활용한 데이터베이스 모듈에 있는 경우 상기 동일 이벤트 데이터를 상기 과거 이벤트 데이터로 선정하고,
    상기 대상 이벤트 이전에 발생된 상기 동일 이벤트 데이터가 상기 인공지능을 활용한 데이터베이스 모듈에 없는 경우 상기 유사 이벤트 데이터를 상기 과거 이벤트 데이터로 선정하는 것을 특징으로 하는 인공지능을 활용한 경제데이터 제공 시스템.
  11. 제8항에 있어서,
    상기 이벤트 탐색부는 상기 대상 이벤트와 동일한 이벤트군에 매칭되는 복수의 상기 유사 이벤트 데이터 중 가장 유사한 유사 이벤트 데이터를 상기 과거 이벤트 데이터로 선정하는 것을 특징으로 하는 인공지능을 활용한 경제데이터 제공시스템.
  12. 제11항에 있어서,
    상기 이벤트 탐색부는 상기 대상 이벤트의 상기 키워드벡터와 복수의 상기 유사 이벤트 데이터의 상기 키워드벡터의 매칭성에 따라 상기 대상 이벤트와 복수의 상기 유사 이벤트 데이터 간 유사도를 판단하는 것을 특징으로 하는 인공지능을 활용한 경제데이터 제공시스템.
  13. 제8항에 있어서,
    상기 이벤트 탐색부는 상기 대상 이벤트와 동일한 이벤트군에 매칭되는 복수의 상기 유사 이벤트 데이터를 추출하여 제시하고,
    사용자가 적어도 하나의 상기 유사 이벤트 데이터를 선택하면 선택된 상기 유사 이벤트 데이터를 과거 이벤트 데이터로 선정하는 것을 특징으로 하는 인공지능을 활용한 경제데이터 제공시스템.
  14. 제8항에 있어서,
    상기 제1 경제데이터를 통해 상기 대상 이벤트 발생 또는 선정 시의 제2 경제데이터를 추정하는 경제데이터 추정부;
    를 더 포함하는 것을 특징으로 하는 인공지능을 활용한 경제데이터 제공 시스템.
  15. 제14항에 있어서,
    상기 경제데이터 추출부는 상기 제1 경제데이터 변화를 추출하고,
    상기 경제데이터 추정부는 상기 제1 경제데이터 변화를 통해 상기 제2 경제데이터 변화를 추정하는 것을 특징으로 하는 인공지능을 활용한 경제데이터 제공 시스템.
  16. 제15항에 있어서,
    상기 경제데이터 추정부는 상기 제1 경제데이터 변화 비율을 상기 제2 경제데이터에 적용하여 상기 제2 경제데이터 변화를 추정하는 것을 특징으로 하는 인공지능을 활용한 경제데이터 제공 시스템.
  17. 제8항에 있어서,
    사용자로부터 관심항목을 입력받는 입력부;
    를 더 포함하고,
    상기 경제데이터 추출부는 상기 관심항목과 관련된 상기 제1 경제데이터를 추출하는 것을 특징으로 하는 인공지능을 활용한 경제데이터 제공 시스템.
  18. 제8항에 있어서,
    상기 이벤트 선정부는,
    상기 인공지능을 활용한 데이터베이스 모듈에서 후보 이벤트를 추출하여 제시하고,
    사용자가 적어도 하나의 상기 후보 이벤트를 선택하면, 선택된 상기 후보 이벤트를 대상 이벤트로 선정하는 것을 특징으로 하는 인공지능을 활용한 경제데이터 제공 시스템.
  19. 인터넷정보로부터 복수의 이벤트 데이터를 수집하는 이벤트 수집부 및 상기 이벤트 데이터와 관련되는 키워드벡터를 수집하는 키워드벡터 수집부를 포함하는 수집부, 상기 복수의 이벤트 데이터를 유사한 이벤트 데이터끼리 묶어 복수의 이벤트군을 구성하는 이벤트군 구성부, 및 상기 이벤트 데이터를 대응되는 상기 이벤트군에 매칭시키는 이벤트 매칭부를 포함하는 인공지능을 활용한 데이터베이스 모듈을 준비하는 단계;
    상기 수집부가 수집한 상기 복수의 이벤트 데이터 중 적어도 하나를 대상 이벤트로 선정하거나 또는 사용자 입력을 통해 대상 이벤트를 선정하는 단계;
    상기 대상 이벤트보다 이전에 발생된 동일 이벤트 데이터 또는 유사 이벤트 데이터를 상기 인공지능을 활용한 데이터베이스 모듈에서 탐색하여, 상기 동일 이벤트 데이터 및 유사 이벤트 데이터 중 적어도 하나를 과거 이벤트 데이터로 선정하는 단계; 및
    상기 과거 이벤트 데이터 발생 시의 제1 경제데이터를 추출하는 단계;
    를 포함하며,
    상기 이벤트군 구성부는 상기 복수의 이벤트 데이터 간 상기 키워드벡터의 매칭성에 따라 상기 유사한 이벤트 데이터 여부를 판단하여 상기 이벤트군을 구성하고,
    상기 복수의 이벤트군은 복수의 상위 이벤트군 및 각각의 상기 상위 이벤트군에 포함되는 복수의 하위 이벤트군을 포함하며,
    상기 동일 이벤트 데이터는 상기 대상 이벤트와 동일한 이벤트 데이터이고, 상기 유사 이벤트 데이터는 상기 대상 이벤트와 동일한 이벤트군에 매칭되는 다른 이벤트 데이터이며,
    상기 과거 이벤트 데이터로 선정하는 단계에서 상기 동일 이벤트 데이터를 상기 유사 이벤트 데이터보다 우선시하여 상기 과거 이벤트 데이터로 선정하고,
    상기 과거 이벤트 데이터로 선정하는 단계에서 상기 대상 이벤트와 동일한 상기 하위 이벤트군에 매칭되는 상기 유사 이벤트 데이터를 상기 대상 이벤트와 동일한 상기 상위 이벤트군에 매칭되는 상기 유사 이벤트 데이터보다 우선시하여 상기 과거 이벤트 데이터로 선정하며,
    상기 이벤트 매칭부는 새롭게 수집되는 상기 이벤트 데이터에 대하여 함께 수집된 상기 키워드벡터를 특정한 상기 이벤트군에 포함된 다른 이벤트 데이터의 키워드벡터와 매칭시켜 매칭성이 기설정된 값 이상일 경우 해당하는 상기 이벤트군에 상기 새롭게 수집되는 이벤트 데이터를 매칭시키는 인공지능을 활용한 경제데이터 제공 방법.
  20. 제19항에 있어서,
    상기 제1 경제데이터를 추출하는 단계 이후에,
    상기 제1 경제데이터를 통해 상기 대상 이벤트 발생 또는 선정 시의 제2 경제데이터를 추정하는 단계;
    를 더 포함하는 것을 특징으로 하는 인공지능을 활용한 경제데이터 제공 방법.
KR1020180016053A 2018-02-09 2018-02-09 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법 KR102041915B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180016053A KR102041915B1 (ko) 2018-02-09 2018-02-09 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180016053A KR102041915B1 (ko) 2018-02-09 2018-02-09 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20190100533A KR20190100533A (ko) 2019-08-29
KR102041915B1 true KR102041915B1 (ko) 2019-11-07

Family

ID=67776080

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180016053A KR102041915B1 (ko) 2018-02-09 2018-02-09 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102041915B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113553407B (zh) * 2021-06-18 2022-09-27 北京百度网讯科技有限公司 事件追溯方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101585670B1 (ko) * 2015-04-20 2016-01-14 주식회사 기가코리아 맞춤형 쇼핑 서비스 제공 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101169377B1 (ko) * 2010-09-27 2012-07-30 한국과학기술연구원 핫 토픽 이벤트 추출에 기반한 실시간 이벤트의 하이라이트 제공 시스템 및 이를 이용한 하이라이트 서비스 제공방법
KR101526312B1 (ko) * 2013-11-27 2015-06-10 한국과학기술정보연구원 현안 키워드 대응 연구개발 정보 서비스 시스템 및 방법
KR20140139466A (ko) * 2014-11-12 2014-12-05 변동삼 데이터 크롤링 및 관리자 입력에 기반한 판매 예측 자동화 장치
KR101831532B1 (ko) * 2015-11-24 2018-02-22 윤정호 특허 라이센스 대상기업 예측 방법 및 시스템

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101585670B1 (ko) * 2015-04-20 2016-01-14 주식회사 기가코리아 맞춤형 쇼핑 서비스 제공 방법

Also Published As

Publication number Publication date
KR20190100533A (ko) 2019-08-29

Similar Documents

Publication Publication Date Title
US11663254B2 (en) System and engine for seeded clustering of news events
US11416535B2 (en) User interface for visualizing search data
US20230020599A1 (en) Method and system for sentiment analysis of information
CN103729359B (zh) 一种推荐搜索词的方法及系统
CN104899273B (zh) 一种基于话题和相对熵的网页个性化推荐方法
CN102236663B (zh) 一种基于垂直搜索的查询方法、系统和装置
WO2018040069A1 (zh) 信息推荐系统及方法
CN103324665A (zh) 一种基于微博的热点信息提取的方法和装置
CN103425687A (zh) 一种基于关键词的检索方法和系统
Nguyen et al. Real-time event detection using recurrent neural network in social sensors
US10002187B2 (en) Method and system for performing topic creation for social data
US11263523B1 (en) System and method for organizational health analysis
CN110232126B (zh) 热点挖掘方法及服务器和计算机可读存储介质
CN104077417A (zh) 社交网络中的人物标签推荐方法和系统
CN103309869A (zh) 数据对象的展示关键词推荐方法及系统
CA2956627A1 (en) System and engine for seeded clustering of news events
CN109241403A (zh) 项目推荐方法、装置、机器设备和计算机可读存储介质
CN112818230B (zh) 内容推荐方法、装置、电子设备和存储介质
EP3961426A2 (en) Method and apparatus for recommending document, electronic device and medium
CN114330329A (zh) 一种业务内容搜索方法、装置、电子设备及存储介质
Al Mostakim et al. Bangla content categorization using text based supervised learning methods
Wegrzyn-Wolska et al. Tweets mining for French presidential election
de Koning et al. News recommendation with CF-IDF+
Wei et al. Online education recommendation model based on user behavior data analysis
KR102041915B1 (ko) 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right