KR20200000789A

KR20200000789A - 투자 포트폴리오 구축 방법, 투자 포트폴리오 서비스 제공 방법 및 이를 지원하는 장치

Info

Publication number: KR20200000789A
Application number: KR1020180153802A
Authority: KR
Inventors: 안태욱; 김재윤; 정재필; 양태민
Original assignee: 주식회사 딥서치
Priority date: 2018-06-25
Filing date: 2018-12-03
Publication date: 2020-01-03
Also published as: KR102378062B1; KR20200119752A; KR102163562B1

Abstract

투자 포트폴리오 구축 방법, 투자 포트폴리오 서비스 제공 방법 및 이를 지원하는 장치가 제공된다. 본 개시의 몇몇 실시예들에 따른 투자 포트폴리오 구축 방법은 기 수집된 복수의 콘텐츠를 클러스터링하여 토픽 클러스터를 구축하는 단계, 상기 구축된 토픽 클러스터를 이용하여 상기 관심 콘텐츠와 연관된 제1 토픽을 결정하는 단계, 상기 제1 토픽과의 관련도를 기초로 복수의 투자 후보 기업 중에서 투자 대상 기업을 선별하는 단계 및 상기 선별된 투자 대상 기업을 기초로 상기 관심 콘텐츠에 대한 투자 포트폴리오를 구축하는 단계를 포함할 수 있다.

Description

투자 포트폴리오 구축 방법, 투자 포트폴리오 서비스 제공 방법 및 이를 지원하는 장치{METHOD FOR CONSTRUCTING AN INVESTMENT PORTFOLIO, PROVIDING AN INVESTMENT PORTFOLIO SERVICE, AND APPARATUS SUPPORTING THE SAME}

본 개시는 투자 포트폴리오 구축 방법, 투자 포트폴리오 서비스 제공 방법 및 그 방법들을 지원하는 장치에 관한 것이다. 보다 자세하게는, 인터넷 뉴스 등의 각종 콘텐츠를 기초로 투자 포트폴리오를 구축하고, 구축된 투자 포트폴리오에 기반하여 사용자에게 투자 서비스를 제공하는 방법 및 그 방법들을 지원하는 장치에 관한 것이다.

주식은 기업의 가치를 반영하고 있는 가치 척도이며, 그 가치는 국내외의 정치, 경제 및 산업의 동향에 따라 민감하게 결정된다. 따라서, 투자자들은 다양한 정보들을 고려하여 투자 대상 기업을 선택하여야 한다.

인터넷 서비스가 활성화됨에 따라, 투자자들은 포털 사이트에 게시된 각종 뉴스 콘텐츠를 투자 자료로 참고할 수 있게 되었다. 그러나, 전문적인 투자자라 하더라도, 다양한 기업들 중에서 특정 뉴스 콘텐츠와 연관된 기업을 선별하거나, 특정 뉴스 콘텐츠를 기초로 투자 포트폴리오를 구축하는 것은 매우 어려운 문제이다.

이에 따라, 종래에 비해 투자 여건은 훨씬 나아졌음에도 불구하고, 투자 시장은 그만큼 활성화되고 있지 않으며, 여전히 투자자들의 참여는 저조한 상황이다. 특히, 개인 투자자들은 여전히 투자 시장에 진입하는 것을 어려워하고 있다.

따라서, 개인 투자자들의 참여를 장려하고, 투자 시장을 보다 활성화하기 위해, 다양한 콘텐츠에 기반하여 자동으로 투자 대상 기업을 선별하고, 선별된 기업을 바탕으로 투자 포트폴리오를 구축하는 방법, 구축된 투자 포트폴리오에 기반하여 다양한 투자 서비스를 제공하는 방법이 요구된다.

한국공개특허 제10-2016-0028701호 (16.03.14 공개)

본 개시의 실시예들을 통해 해결하고자 하는 기술적 과제는, 특정 콘텐츠에 기반하여 자동으로 투자 대상 기업을 선별하고, 선별된 투자 대상 기업을 바탕으로 투자 포트폴리오를 구축하는 방법 및 그 방법을 지원하는 장치를 제공하는 것이다.

본 개시의 실시예들을 통해 해결하고자 하는 다른 기술적 과제는, 상기 구축된 투자 포트폴리오를 기반으로 사용자에게 투자 포트폴리오 서비스를 제공하는 방법 및 그 방법을 지원하는 장치를 제공하는 것이다.

본 개시의 실시예들을 통해 해결하고자 하는 또 다른 기술적 과제는, 실시간으로 수집된 콘텐츠를 기초로 토픽을 추출하는 방법 및 그 방법을 지원하는 장치를 제공하는 것이다.

본 개시가 해결하고자 하는 또 다른 기술적 과제는, 다양한 투자 후보 기업들 중에서 특정 토픽과 연관된 투자 대상 기업을 결정하는 방법 및 그 방법을 지원하는 장치를 제공하는 것이다.

본 개시가 해결하고자 하는 또 다른 기술적 과제는, 합리적인 기준 하에 각 투자 대상 기업에 대한 투자 비중을 결정함으로써 활용도 높은 투자 포트폴리오를 구축하는 방법 및 그 방법을 지원하는 장치를 제공하는 것이다.

본 개시의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 개시의 기술분야에서의 통상의 기술자에게 명확하게 이해될 수 있을 것이다.

상기 기술적 과제를 해결하기 위한, 본 개시의 몇몇 실시예들에 따른 투자 포트폴리오 구축 방법은, 컴퓨팅 장치에서 관심 콘텐츠에 대한 투자 포트폴리오를 구축하는 방법으로서, 기 수집된 복수의 콘텐츠를 클러스터링하여 토픽 클러스터를 구축하는 단계, 상기 구축된 토픽 클러스터를 이용하여 상기 관심 콘텐츠와 연관된 제1 토픽을 결정하는 단계, 상기 제1 토픽과의 관련도를 기초로 복수의 투자 후보 기업 중에서 투자 대상 기업을 선별하는 단계 및 상기 선별된 투자 대상 기업을 기초로 상기 관심 콘텐츠에 대한 투자 포트폴리오를 구축하는 단계를 포함할 수 있다.

몇몇 실시예에서, 상기 토픽 클러스터를 구축하는 단계는, TF-IDF(Term Frequency-Invert Document Frequency) 기법을 적용하여 상기 복수의 콘텐츠 각각을 키워드 벡터로 변환하는 단계 및 상기 변환된 키워드 벡터에 대하여 밀도 기반 클러스터링(density based clustering)을 수행하는 단계를 포함할 수 있다.

몇몇 실시예에서, 상기 제1 토픽을 결정하는 단계는, 상기 관심 콘텐츠로부터 주요 키워드를 추출하는 단계, 상기 구축된 토픽 클러스터 중에서 상기 주요 키워드에 매칭되는 제1 토픽 클러스터를 결정하는 단계 및 상기 제1 토픽 클러스터에 대응되는 토픽을 상기 제1 토픽으로 결정하는 단계를 포함할 수 있다.

몇몇 실시예에서, 상기 투자 대상 기업을 선별하는 단계는, 상기 제1 토픽의 클러스터에 속한 콘텐츠와 연관된 기업을 제1 투자 후보 기업으로 추출하는 단계 및 상기 관심 콘텐츠에 포함된 주요 키워드로 상기 기 수집된 복수의 콘텐츠를 검색하고, 상기 검색된 콘텐츠와 연관된 기업을 제2 투자 후보 기업으로 추출하는 단계 및 상기 제1 투자 후보 기업과 상기 제2 투자 후보 기업 중에서 상기 투자 대상 기업을 선별하는 단계를 포함할 수 있다.

몇몇 실시예에서, 상기 투자 포트폴리오를 구축하는 단계는, 상기 제1 토픽과 관련도를 기초로 각 투자 대상 기업의 투자 비중을 결정하는 단계를 포함할 수 있다.

몇몇 실시예에서, 상기 선별된 투자 대상 기업의 수는 사용자의 투자 성향에 따라 달라질 수 있다.

몇몇 실시예에서, 상기 투자 포트폴리오를 구축하는 단계는, 사용자의 요청에 응답하여, 상기 투자 포트폴리오를 구축하는 단계 및 상기 구축된 투자 포트폴리오를 상기 사용자에게 제공하는 단계를 포함할 수 있다.

상술한 기술적 과제를 해결하기 위한 본 개시의 다른 몇몇 실시예들에 따른 투자 포트폴리오 구축 방법은, 컴퓨팅 장치에서 관심 토픽에 대한 투자 포트폴리오를 구축하는 방법으로서, 기 수집된 복수의 콘텐츠를 클러스터링하여 토픽 클러스터를 구축하는 단계, 상기 구축된 토픽 클러스터 중에서 상기 관심 토픽에 매칭되는 제1 토픽 클러스터를 결정하는 단계, 상기 제1 토픽 클러스터에 속한 콘텐츠에서 언급된 기업을 투자 후보 기업으로 추출하는 단계, 상기 관심 토픽과의 관련도를 기초로 상기 투자 후보 기업 중에서 적어도 하나의 투자 대상 기업을 선정하는 단계 및 상기 선정된 투자 대상 기업을 기초로 상기 관심 토픽에 대한 투자 포트폴리오를 구축하는 단계를 포함할 수 있다.

상술한 기술적 과제를 해결하기 위한 본 개시의 또 다른 몇몇 실시예들에 따른 투자 포트폴리오 서비스 제공 방법은, 컴퓨팅 장치에서 투자 포트폴리오 서비스를 제공하는 방법으로서, 기 수집된 복수의 콘텐츠로부터 복수의 토픽을 추출하는 단계, 상기 복수의 토픽에 대한 중요도를 산정하는 단계, 상기 산정된 중요도를 기초로 상기 복수의 토픽 중 제1 토픽을 선정하는 단계, 상기 제1 토픽과 연관된 적어도 하나의 투자 대상 기업을 선정하는 단계, 상기 선정된 투자 대상 기업을 기초로 투자 포트폴리오를 구축하는 단계 및 상기 구축된 투자 포트폴리오를 제공하는 단계를 포함할 수 있다.

몇몇 실시예에서, 상기 제1 토픽의 중요도는, 상기 제1 토픽과 연관된 콘텐츠 중 현재 시점으로부터 일정 기간 이내에 발행된 최근 콘텐츠의 개수 또는 상기 최근 콘텐츠의 평균 발행 시간에 기초하여 산정될 수 있다.

몇몇 실시예에서, 상기 제1 토픽의 중요도는, 전체 콘텐츠 제공자의 수 대비 상기 제1 토픽과 연관된 콘텐츠의 제공자 수에 기초하여 산정될 수 있다.

상술한 기술적 과제를 해결하기 위한 본 개시의 또 다른 몇몇 실시예들에 따른 관심 토픽에 대한 연관 기업 추출 방법은, 컴퓨팅 장치에서 관심 토픽과 연관된 기업을 추출하는 방법으로서, 복수의 콘텐츠를 획득하는 단계, 상기 복수의 콘텐츠 중에서 상기 관심 토픽과 연관된 연관 콘텐츠를 결정하는 단계, 상기 연관 콘텐츠에 언급된 기업을 후보 기업으로 추출하는 단계, 상기 후보 기업과 상기 관심 토픽 간의 관련도를 산출하는 단계 및 상기 산출된 관련도에 기초하여 상기 후보 기업 중에서 상기 관심 토픽과 연관된 기업을 선별하는 단계를 포함할 수 있다.

몇몇 실시예에서, 상기 연관 콘텐츠를 결정하는 단계는, 상기 복수의 콘텐츠를 클러스터링하여 토픽 클러스터를 구축하는 단계, 상기 구축된 토픽 클러스터 중에서 상기 관심 토픽과 매칭되는 제1 토픽 클러스터를 선정하는 단계, 및 상기 제1 토픽 클러스터에 속한 콘텐츠를 제1 연관 콘텐츠로 결정하는 단계를 포함할 수 있다.

몇몇 실시예에서, 상기 관련도를 산출하는 단계는, 공시 문서를 분석하여 상기 관심 토픽과 연관된 기업 리스트를 추출하는 단계 및 상기 후보 기업 중 제1 후보 기업이 상기 추출된 기업 리스트에 포함되었다는 판정에 응답하여, 상기 제1 후보 기업의 관련도에 가산점을 부여하는 단계를 포함할 수 있다.

몇몇 실시예에서, 상기 관심 토픽과 연관된 기업 리스트를 추출하는 단계는, 임베딩(embedding) 기법을 통해 상기 공시 문서를 벡터 공간 상에 매핑하는 단계, 상기 벡터 공간 상에서 상기 공시 문서 간의 위치 관계를 이용하여 상기 관심 토픽과 연관된 공시 문서를 결정하는 단계 및 상기 결정된 공시 문서의 발행 기업을 추출하는 단계를 포함할 수 있다.

몇몇 실시예에서, 상기 공시 문서를 벡터 공간 상에 매핑하는 단계는, 상기 공시 문서 중에서 사업 보고서를 선별하는 단계, 상기 선별된 사업 보고서에서 사업의 개요 항목을 추출하는 단계 및 상기 추출된 사업의 개요 항목에 상기 임베딩 기법을 적용하는 단계를 포함할 수 있다.

도 1은 본 개시의 제1 실시예에 따른 투자 포트폴리오 서비스 제공 시스템을 나타내는 예시적인 구성도이다.
도 2는 본 개시의 몇몇 실시예에서 참조될 수 있는 투자 포트폴리오 제공 방식을 설명하기 위한 예시도이다.
도 3은 본 개시의 제2 실시예에 따른 투자 포트폴리오 서비스 제공 시스템을 나타내는 예시적인 구성도이다.
도 4는 본 개시의 몇몇 실시예들에 따른 서비스 제공 서버를 나타내는 예시적인 블록도이다.
도 5는 본 개시의 몇몇 실시예들에 따른 투자 포트폴리오를 개략적으로 나타내는 예시적인 흐름도이다.
도 6은 본 개시의 몇몇 실시예들에 따른 토픽 추출 방법을 나타내는 예시적인 흐름도이다.
도 7은 본 개시의 몇몇 실시예들에 따라 주기적으로 토픽 클러스터를 구축하는 예를 도시한다.
도 8은 본 개시의 몇몇 실시예들에 따른 클러스터링 과정을 설명하기 위한 예시도이다.
도 9 및 도 10은 본 개시의 몇몇 실시예에서 참조될 수 있는 DBSCAN 클러스터링 기법을 설명하기 위한 예시도이다.
도 11 내지 도 13은 본 개시의 몇몇 실시예에 따른 토픽 관련 정보 추출 방법을 설명하기 위한 예시도이다.
도 14는 본 개시의 몇몇 실시예들에 따른 투자 후보 기업 추출 방법을 나타내는 흐름도이다.
도 15 및 도 16은 본 개시의 몇몇 실시예들에 따른 투자 후보 기업 추출 방법을 부연 설명하기 위한 예시도이다.
도 17 내지 도 20은 본 개시의 몇몇 실시예들에 따른 투자 후보 기업과 관심 토픽(또는 관심 콘텐츠) 간의 관련도 산출 방법을 설명하기 위한 예시도이다.
도 21 및 도 22는 본 개시의 몇몇 실시예들에 따른 투자 비중 결정 방법을 설명하기 위한 예시적인 흐름도이다.
도 23은 본 개시의 제1 실시예에 따른 투자 포트폴리오 서비스 제공 방법을 나타내는 예시적인 흐름도이다.
도 24는 본 개시의 제2 실시예에 따른 투자 포트폴리오 서비스 제공 방법을 나타내는 예시적인 흐름도이다.
도 25는 본 개시의 다양한 실시예들에 따른 장치들을 구현할 수 있는 예시적인 컴퓨팅 장치를 나타내는 예시적인 하드웨어 구성도이다.

이하, 첨부된 도면을 참조하여 본 개시의 바람직한 실시예들을 상세히 설명한다. 본 개시의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 개시는 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 이하의 실시예들은 본 개시의 기술적 사상을 완전하도록 하고, 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 개시의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 개시는 청구항의 범주에 의해 정의될 뿐이다.

각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 개시를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 개시의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 개시를 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.

또한, 본 개시의 구성 요소를 설명하는 데 있어서, 제1, 제2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.

명세서에서 사용되는 "포함한다 (comprises)" 및/또는 "포함하는 (comprising)"은 언급된 구성 요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성 요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.

이하, 본 개시의 다양한 실시예들에 대하여 첨부된 도면에 따라 상세하게 설명한다.

도 1은 본 개시의 제1 실시예들에 따른 투자 포트폴리오 서비스 제공 시스템을 나타내는 예시적인 구성도이다.

도 1에 도시된 바와 같이, 상기 투자 포트폴리오 서비스 제공 시스템은 하나 이상의 사용자 단말(10-1 내지 10-n)에게 투자 포트폴리오 서비스를 제공하는 시스템이다. 상기 투자 포트폴리오 서비스 제공 시스템은 서비스 제공 서버(100) 및 하나 이상의 데이터 소스(20-1 내지 20-n)를 포함할 수 있다. 단, 이는 본 개시의 목적을 달성하기 위한 바람직한 실시예일 뿐이며, 필요에 따라 일부 구성 요소가 추가되거나 삭제될 수 있음은 물론이다.

또한, 도 1에 도시된 투자 포트폴리오 서비스 제공 시스템의 각각의 구성 요소들은 기능적으로 구분되는 기능 요소들을 나타낸 것으로서, 적어도 하나의 구성 요소가 실제 물리적 환경에서는 서로 통합되는 형태로 구현될 수도 있음에 유의한다.

물론, 상기 각각의 구성 요소들이 실제 물리적 환경에서는 세부 기능 요소들로 구분되는 형태로 구현될 수도 있다. 가령, 서비스 제공 서버(100)의 기능은 제1 컴퓨팅 장치에서 구현되고, 제2 기능은 제2 컴퓨팅 장치에서 구현될 수도 있다.

이하의 서술에서, 사용자 단말(10-1 내지 10-n)을 총칭하거나, 임의의 사용자 단말(10-1 or 10-2 or ? or 10-n)을 지칭할 때에는 참조번호 10을 사용하도록 한다. 마찬가지로, 데이터 소스(20-1 내지 20-n)를 총칭하거나, 임의의 데이터 소스(20-1 or 20-2 or ? or 20-n)을 지칭할 때에는 참조번호 20를 사용하도록 한다. 이하, 상기 투자 포트폴리오 서비스 제공 시스템의 각 구성 요소에 대하여 설명하도록 한다.

상기 투자 포트폴리오 서비스 제공 시스템에서, 서비스 제공 서버(100)는 사용자에게 투자 포트폴리오 서비스를 제공하는 컴퓨팅 장치이다. 여기서, 상기 컴퓨팅 장치는 노트북, 데스크톱(desktop), 랩탑(laptop) 등이 될 수 있으나, 이에 국한되는 것은 아니며 컴퓨팅 기능 및 통신 기능이 구비된 모든 종류의 장치를 포함할 수 있다. 다만, 다수의 사용자에게 투자 포트폴리오 서비스를 제공하는 환경이라면, 서비스 제공 서버(100)는 고성능의 서버급 컴퓨팅 장치로 구현되는 것이 바람직할 수 있다. 상기 컴퓨팅 장치의 일 예는 도 25을 참조하도록 한다.

서비스 제공 서버(100)는 데이터 소스(20)로부터 수집된 각종 콘텐츠를 기초 자료로 활용하여 투자 포트폴리오를 구축하고, 다양한 방식으로 투자 포트폴리오 서비스를 제공할 수 있다. 이때, 상기 콘텐츠는 텍스트 형식의 콘텐츠뿐만 아니라 텍스트 형식으로 변환될 수 있는 임의의 형식(e.g. 음성, 영상 등)의 콘텐츠도 포함할 수 있다. 또한, 서비스 제공 서버(100)는 데이터 소스(20)를 크롤링(crawling)함으로써 실시간으로 콘텐츠를 수집할 수 있으나, 서비스 제공 서버(100)가 콘텐츠를 수집하는 방식이 이에 한정되는 것은 아니다.

몇몇 실시예에서, 서비스 제공 서버(100)는 다양한 데이터 소스(20)으로부터 각종 콘텐츠(e.g. 뉴스, 공시 문서 등)를 수집하고, 수집된 각종 콘텐츠로부터 다양한 토픽과 상기 토픽과 연계된 토픽 관련 정보를 추출할 수 있다. 여기서, 상기 토픽 관련 정보는 해당 토픽을 나타내는 대표 키워드, 해당 토픽의 대표 제목, 토픽과 연관된 기업, 토픽의 중요도 등 토픽과 관련된 각종 정보를 포함할 수 있다.

또한, 서비스 제공 서버(100)는 상기 추출된 정보를 토대로 관심 콘텐츠와 연관된 토픽을 결정하고, 결정된 토픽과 관련된 기업들을 투자 대상 기업으로 선정할 수 있다. 여기서, 상기 관심 콘텐츠는 사용자가 관심을 갖고 잇는 콘텐츠뿐만 아니라 관심을 가질만한 콘텐츠를 총칭하는 용어이다. 뿐만 아니라, 서비스 제공 서버(100)는 각 투자 대상 기업에 대한 투자 비중을 결정함으로써 상기 관심 콘텐츠와 연관된 투자 포트폴리오를 구축할 수 있다. 본 실시예에 따르면, 일련의 과정을 통해 관심 콘텐츠로부터 투자 포트폴리오가 구축될 수 있다. 이렇게 구축된 투자 포트폴리오는 사용자에게 제공됨으로써, 사용자들의 투자 참여를 독려할 수 있다. 본 실시예에 대한 보다 자세한 설명은 도 5 내지 도 22를 참조하여 후술하도록 한다.

몇몇 실시예에서, 서비스 제공 서버(100)는 각종 콘텐츠로부터 추출된 다양한 토픽 중에서 중요도가 높은 토픽(e.g. 핫 토픽, 이슈 토픽)을 관심 토픽으로 선정하고, 상기 관심 토픽에 관한 투자 대상 기업을 결정하거나, 투자 포트폴리오를 구축할 수 있다. 본 실시예에 따르면, 현재 투자 시장에 큰 영향을 미치고 있는 핫 토픽, 이슈 토픽 등에 관한 투자 포트폴리오가 자동으로 구축될 수 있다. 이에 따라, 사용자에게 가치있는 투자 정보가 제공될 수 있으며, 투자 시장은 활성화될 수 있다. 본 실시예에 대한 자세한 설명은 도 5 내지 도 22, 도 24를 참조하여 후술하도록 한다.

전술한 실시예들과 같이, 투자 포트폴리오 구축 기능과 연관된 실시예들에 한하여, 서비스 제공 서버(100)는 투자 포트폴리오 구축 장치(100)로 명명될 수도 있다.

한편, 서비스 제공 서버(100)는 전술한 실시예들에 의해 구축된 투자 포트폴리오를 이용하여 다양한 투자 서비스를 제공할 수 있다. 물론, 투자 포트폴리오 서비스가 제공되는 형태는 실시예들에 따라 얼마든지 달라질 수 있다.

몇몇 실시예에서, 서비스 제공 서버(100)는 온디맨드(on-demand) 방식으로 투자 포트폴리오 서비스를 제공할 수 있다. 즉, 서비스 제공 서버(100)는 사용자 단말(10)의 요청에 응답하여 즉각적으로 투자 포트폴리오를 구축하고 제공할 수 있다. 여기서, 사용자 단말(10)의 요청은 서비스 제공 서버(100)에 대한 직접적인 요청뿐만 아니라 간접적인 요청도 포함할 수 있다. 가령, 서비스 제공 서버(100)가 인지할 수만 있다면, 사용자가 단말(10)을 통해 포털 사이트에 접속하여 관심 콘텐츠를 클릭하는 행위도 상기 요청에 포함될 수 있다. 이와 같은 경우, 서비스 제공 서버(100)는, 도 2에 도시된 바와 같이, 단말(10)의 웹 브라우저(30)를 통해 상기 클릭된 콘텐츠, 콘텐츠에 대한 투자 정보(e.g. 연관된 토픽, 토픽 관련 정보 등), 상기 콘텐츠에 대한 투자 포트폴리오(37) 등을 제공할 수도 있다. 즉, 서비스 제공 서버(100)는 단말(10)의 웹 브라우저(30) 상의 제1 영역(31)에 관심 콘텐츠가 표시되도록 하고, 제2 영역(33)에 상기 관심 콘텐츠에 대한 투자 정보가 표시되도록 하며, 제3 영역(35)에 투자 포트폴리오(37)가 표시되도록 할 수 있다. 본 실시예에 대한 추가적인 설명에 대해서는 도 23를 더 참조하도록 한다.

몇몇 실시예에서, 서비스 제공 서버(100)는 구독(subscription) 서비스의 신청자(즉, 구독자)에게 투자 포트폴리오 서비스를 제공할 수 있다. 가령, 서비스 제공 서버(100)는 수집된 콘텐츠를 토대로 관심 토픽(e.g. 핫 토픽, 이슈 토픽) 및/또는 관심 콘텐츠(e.g. 핫 콘텐츠, 이슈 콘텐츠)를 선정하고, 이를 기반하여 투자 포트폴리오를 구축하며, 구축된 투자 포트폴리오를 정기적 또는 비정기적으로 구독자에게 제공할 수 있다. 본 실시예에 따르면, 구독자에 한정하여 정기적으로 투자 포트폴리오, 이슈 토픽 등의 투자 정보가 제공될 수 있다. 이와 같은 서비스는 과금을 통해 서비스 사업자 측의 비즈니스 모델로 활용될 수 있다. 본 실시예에 대한 자세한 설명은 도 24를 참조하여 후술하도록 한다.

전술한 실시예들에서, 관심 콘텐츠 및/또는 관심 토픽은 사용자에 의해 결정될 수 있고, 서비스 제공 서버(100)에 의해 자동으로 결정될 수도 있음은 물론이다. 서비스 제공 서버(100)의 구성 및 동작에 보다 자세한 대한 설명은 도 4 이하의 도면을 참조하여 후술하도록 한다.

상기 투자 포트폴리오 서비스 제공 시스템에서, 데이터 소스(20)는 각종 콘텐츠를 제공하는 저장소 또는 장치이다. 가령, 데이터 소스(20)는 정치, 경제, 산업 동향에 대한 다양한 뉴스 콘텐츠를 제공하는 웹 서버(e.g. 포털 사이트의 웹 서버), 공시 문서 등을 제공하는 전자 공시 시스템 등을 포함할 수 있다. 그러나, 본 개시의 기술적 범위가 이에 한정되는 것은 아니다.

상기 투자 포트폴리오 서비스 제공 시스템에서, 사용자 단말(10)은 투자 포트폴리오 서비스를 제공받는 사용자 측의 장치이다. 사용자 단말(10)은 데스크탑, 랩탑, 스마트폰 등 어떠한 장치로 구현되더라도 무방하다.

도 1에 도시된 투자 포트폴리오 서비스 제공 시스템의 적어도 일부의 구성 요소(e.g. 10, 20, 100)들은 네트워크를 통해 통신할 수 있다. 여기서, 상기 네트워크는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN), 이동 통신망(mobile radio communication network), Wibro(Wireless Broadband Internet) 등과 같은 모든 종류의 유/무선 네트워크로 구현될 수 있다.

도 3은 본 개시의 제2 실시예에 따른 투자 포트폴리오 서비스 제공 시스템을 나타내는 구성도이다.

도 3에 도시된 바와 같이, 상기 제2 실시예에 따른 투자 포트폴리오 서비스 제공 시스템의 전반적인 구성은 전술한 제1 실시예와 유사하다. 다만, 상기 제2 실시예에서는, 거래소 서버(40)가 투자 포트폴리오 서비스 제공 시스템에 더 포함될 수 있다.

거래소 서버(40)는 주식 거래 등과 같이 실제 투자 서비스를 제공하는 거래소 측 장치이다. 가령, 거래소 서버(40)는 HTS(Home Trading System)와 연동하여 각종 투자 서비스를 제공하는 증권사 서버로 구현될 수 있으나, 본 개시의 범위가 이에 한정되는 것은 아니다.

본 실시예에서, 사용자는 서비스 제공 서버(100)로부터 제공받은 투자 포트폴리오에 기반하여 거래소 서버(40)를 통해 실제 투자를 수행할 수 있다. 가령, 사용자는 상기 투자 포트폴리오를 사용자 단말(10)에 탑재된 HTS에 입력함으로써 실제 투자를 수행할 수 있다.

몇몇 실시예에서, 서비스 제공 서버(100)가 거래소 서버(40)와 연동하여 사용자 편의적인 투자 서비스를 제공할 수도 있다. 구체적으로, 서비스 제공 서버(100)가 사용자 단말(10)에게 투자 포트폴리오를 제공한 다음에, 사용자 단말(10)로부터 투자 포트폴리오에 대한 투자 승인(e.g. 전부 승인, 일부 승인 등)을 받으면, 상기 투자 승인에 응답하여 서비스 제공 서버(100)는 상기 거래소 서버(40)와 연동하여 실제 투자를 수행할 수 있다.

지금까지 도 3을 참조하여 본 개시의 제2 실시예에 따른 투자 포트폴리오 서비스 제공 시스템에 대하여 설명하였다. 이하에서는, 도 4를 참조하여 본 개시의 몇몇 실시예들에 따른 서비스 제공 서버(100)의 구성 및 동작에 대하여 설명하도록 한다.

도 4는 본 개시의 몇몇 실시예에 따른 서비스 제공 서버(100)를 나타내는 예시적인 블록도이다.

도 4에 도시된 바와 같이, 서비스 제공 서버(100)는 수집부(110), 토픽 추출부(120), 정보 획득부(130), 투자 대상 기업 결정부(140), 포트폴리오 구축부(150) 및 포트폴리오 제공부(160)를 포함할 수 있다. 다만, 도 4에는 본 개시의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 개시가 속한 기술분야의 통상의 기술자라면 도 4에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다. 또한, 도 4에 도시된 서비스 제공 서버(100)의 각각의 구성 요소들은 기능적으로 구분되는 기능 요소들을 나타낸 것으로서, 복수의 구성 요소가 실제 물리적 환경에서는 서로 통합되는 형태로 구현될 수도 있음에 유의한다. 이하, 각 구성 요소에 대하여 살펴본다.

수집부(110)는 데이터 소스(20)로부터 각종 콘텐츠를 수집한다. 도 4에 도시된 바와 같이, 상기 각종 콘텐츠는 공시 문서(51), IR 문서(53), 뉴스(55) 및 증권사 리포트(57) 등을 포함할 수 있으나, 이에 한정되는 것은 아니다. 또한, 수집부(110)가 콘텐츠를 수집하는 방식 또한 어떠한 방식이 되더라도 무방한다.

다음으로, 토픽 추출부(120)는 수집된 콘텐츠로부터 다양한 토픽을 추출한다. 가령, 토픽 추출부(120)는 클러스터링을 통해 토픽을 추출할 수 있는데, 이때 클러스터링 결과로 생성된 각각의 토픽 클러스터는 하나의 토픽에 대응될 수 있다.

또한, 토픽 추출부(120)는 상기 수집된 콘텐츠로부터 토픽 관련 정보를 더 추출할 수 있다. 이때, 상기 토픽 관련 정보는 토픽의 대표 제목, 토픽의 대표 키워드, 토픽의 중요도, 토픽과 연관된 기업 등을 포함할 수 있다.

중복된 설명을 배제하기 위해, 토픽 추출부(120)의 동작에 대한 보다 자세한 설명은 도 5 내지 도 13을 참조하여 후술하도록 한다.

다음으로, 정보 획득부(130)는 투자 대상 기업을 결정하거나 포트폴리오 구축에 이용되는 각종 정보를 획득한다. 상기 각종 정보는 관심 콘텐츠, 관심 토픽, 관심 키워드, 투자 성향 등이 될 수 있으나, 이에 한정되는 것은 아니다. 정보 획득부(130)는 관심 콘텐츠에서 주요 키워드를 추출할 수도 있다.

몇몇 실시예에서, 정보 획득부(130)는 관심 콘텐츠 및/또는 관심 키워드를 직접 결정할 수도 있다. 예를 들어, 정보 획득부(130)는 수집된 콘텐츠 중에서 투자자들의 관심이 집중된 콘텐츠, 이슈 토픽과 연관된 콘텐츠 등을 관심 콘텐츠로 결정할 수 있다. 다른 예를 들어, 정보 획득부(130)는 토픽 추출부(120)에서 추출된 다양한 토픽 중에서 중요도가 높은 특정 토픽을 관심 토픽으로 결정할 수 있다. 또 다른 예를 들어, 정보 획득부(130)는 관심 콘텐츠에서 추출된 주요 키워드, 관심 토픽과 연관된 키워드(e.g. 대표 키워드, 대표 제목 등에서 추출된 키워드) 등을 관심 키워드로 결정할 수도 있다.

다음으로, 투자 대상 기업 결정부(140)는 관심 콘텐츠 및/또는 관심 토픽과 연관된 투자 대상 기업을 결정한다.

몇몇 실시예에서, 투자 대상 기업 결정부(140)는 토픽 추출부(120)에 의해 추출된 다양한 토픽 중에서 관심 콘텐츠와 연관된 토픽을 결정하고, 상기 토픽과의 관련도를 기초로 다양한 투자 후보 기업 중에서 투자 대상 기업을 결정할 수 있다.

물론, 정보 획득부(130)로부터 관심 토픽이 주어진 경우라면, 투자 대상 기업 결정부(140)는 상기 관심 토픽과의 관련도를 기초로 투자 대상 기업을 선별할 수 있다.

중복된 설명을 배제하기 위해, 투자 대상 기업 결정부(140)의 동작에 대한 보다 자세한 설명은 도 5, 도 14 내지 도 20을 참조하여 후술하도록 한다.

다음으로, 포트폴리오 구축부(150)는 각 투자 대상 기업의 투자 비중을 결정함으로써 투자 포트폴리오를 구축한다. 포트폴리오 구축부(150)는 사용자의 투자 성향, 투자 대상 기업의 시총비중, 거래량, 투자 대상 기업과 토픽과의 관련도 등 다양한 요소를 고려하여 투자 비중을 결정할 수 있다.

중복된 설명을 배제하기 위해, 포트폴리오 구축부(150)의 동작에 대한 보다 자세한 설명은 도 5, 도 21 및 도 22를 참조하여 후술하도록 한다.

다음으로, 포트폴리오 제공부(160)는 구축된 투자 포트폴리오를 사용자에게 제공한다.

몇몇 실시예에서, 포트폴리오 제공부(160)는 사용자의 요청에 의해 즉각적으로 구축된 투자 포트폴리오를 상기 사용자에게 제공할 수 있다. 이와 경우, 온디맨드 기반의 투자 포트폴리오 서비스가 제공될 수 있다.

몇몇 실시예에서, 포트폴리오 제공부(160)는 투자 포트폴리오 서비스의 구독자에 정기적 또는 비정기적으로 투자 포트폴리오를 제공할 수 있다. 이와 같은 경우, 구독 기반의 투자 포트폴리오 서비스가 제공될 수 있다.

중복된 설명을 배제하기 위해, 포트폴리오 제공부(160)의 동작에 대한 보다 자세한 설명은 도 23 및 도 24를 참조하여 후술하도록 한다.

한편, 도 4에 도시된 구성 요소들 모두가 서비스 제공 서버(100)를 구현하기 위한 필수적인 요소는 아닐 수도 있음에 유의하여야 한다. 즉, 본 개시의 다른 몇몇 실시예들에 따른 서비스 제공 서버(100)는 도 4에 도시된 구성 요소들 중 일부에 의해 구현될 수도 있다.

도 4에 도시된 각 구성 요소는 소프트웨어(Software) 또는, FPGA(Field Programmable Gate Array)나 ASIC(Application-Specific Integrated Circuit)과 같은 하드웨어(Hardware)를 의미할 수 있다. 그렇지만, 상기 구성 요소들은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, 어드레싱(Addressing)할 수 있는 저장 매체에 있도록 구성될 수도 있고, 하나 또는 그 이상의 프로세서들을 실행시키도록 구성될 수도 있다. 상기 구성 요소들 안에서 제공되는 기능은 더 세분화된 구성 요소에 의하여 구현될 수 있으며, 복수의 구성 요소들을 합하여 특정한 기능을 수행하는 하나의 구성 요소로 구현될 수도 있다.

이하에서는, 도 5 내지 도 24를 참조하여 본 개시의 다양한 실시예들에 따른 방법들에 대하여 설명하도록 한다. 이하에서 후술될 방법들의 각 단계는 컴퓨팅 장치에 의해 수행될 수 있다. 다시 말하면, 상기 방법들의 각 단계는 컴퓨팅 장치의 프로세서에 의해 실행되는 하나 이상의 인스트럭션들로 구현될 수 있다. 상기 방법들에 포함되는 모든 단계는 하나의 물리적인 컴퓨팅 장치에 의하여 실행될 수도 있을 것이나, 상기 방법들의 제1 단계들은 제1 컴퓨팅 장치에 의하여 수행되고, 상기 방법들의 제2 단계들은 제2 컴퓨팅 장치에 의하여 수행될 수도 있다. 이하에서는, 상기 방법들의 각 단계가 서비스 제공 서버(100)에 의해 수행되는 것을 가정하여 설명을 이어가도록 한다. 다만, 설명의 편의 상, 상기 방법들에 포함되는 각 단계의 동작 주체는 그 기재가 생략될 수도 있다.

먼저 도 5 내지 도 22를 참조하여 본 개시의 몇몇 실시예들에 따른 투자 포트폴리오 구축 방법에 대하여 설명하도록 한다.

도 5는 본 개시의 몇몇 실시들에 따른 투자 포트폴리오 구축 방법을 개략적으로 나타내는 예시적인 흐름도이다. 단, 이는 본 개시의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다.

도 5에 도시된 바와 같이, 상기 투자 포트폴리오 구축 방법은 복수의 콘텐츠를 수집하고 수집된 복수의 콘텐츠를 클러스터링하여 토픽을 추출하는 단계 S100에서 시작된다. 즉, 본 단계 S100에서, 복수의 콘텐츠를 클러스터링하여 토픽 클러스터가 형성된다. 본 단계 S100에 대한 자세한 설명은 도 6 내지 도 10을 참조하여 후술하도록 한다.

단계 S200에서, 추출된 토픽 중에서 이용하여 관심 콘텐츠와 연관된 토픽(즉, 관심 토픽)이 결정된다. 전술한 바와 같이, 상기 관심 콘텐츠는 사용자에 의해 결정될 수 있고, 서비스 제공 서버(100)에 의해 결정될 수도 있다.

몇몇 실시예에서, 상기 관심 콘텐츠에 대한 클러스터링을 통해 상기 관심 콘텐츠가 속한 클러스터가 결정되고, 결정된 클러스터의 토픽이 상기 관심 콘텐츠와 연관된 토픽으로 결정된다.

다른 몇몇 실시예에서, 상기 관심 콘텐츠에서 주요 키워드가 추출되고, 상기 주요 키워드로 토픽 클러스터를 검색한 결과에 의해 상기 관심 콘텐츠와 연관된 토픽이 결정된다. 본 실시예에 대한 보다 자세한 설명은 도 14 내지 도 16을 참조하여 후술하도록 한다.

몇몇 실시예에서, 관심 토픽이 바로 제공된 경우, 본 단계 S200은 생략될 수도 있다.

단계 S300에서, 이전 단계 S200에서 결정된 관심 토픽과 연관된 투자 후보 기업이 추출된다.

몇몇 실시예에서, 관심 토픽의 클러스터에 속한 콘텐츠에서 언급된 기업들, 상기 콘텐츠를 발행한 기업들이 투자 후보 기업으로 추출된다. 본 실시예에 대한 추가적인 내용에 대해서는 도 14 내지 도 16에 대한 설명 부분을 참조하도록 한다.

몇몇 실시예에서, 관심 콘텐츠의 주요 키워드로 전체 콘텐츠가 검색되고, 검색된 콘텐츠와 연관된 기업들이 투자 후보 기업으로 추출된다. 이때, 상기 연관된 기업들은 상기 검색된 콘텐츠에 언급된 기업들, 상기 검색된 콘텐츠를 생성 또는 발행한 기업들을 포함할 수 있으나, 본 개시의 기술적 범위가 이에 한정되는 것은 아니다. 본 실시예에 대한 추가적인 내용에 대해서도 도 14 내지 도 16에 대한 설명 부분을 참조하도록 한다.

몇몇 실시예에서, 전술한 실시예들의 조합에 따라 투자 후보 기업이 추출될 수 있다.

단계 S400에서, 관심 토픽과의 관련도를 기초로 투자 후보 기업 중에서 투자 대상 기업이 선정된다. 본 단계 S400에 대한 보다 자세한 설명은 도 17 내지 도 20을 참조하여 후술하도록 한다.

단계 S500에서, 각 투자 대상 기업의 투자 비중을 결정함으로써 투자 포트폴리오가 구축된다. 여기서, 투자 비중은 관심 토픽과의 관련도, 시총비중, 거래량 등의 다양한 요소에 기초하여 결정될 수 있는데, 이에 대한 자세한 설명은 도 21 및 도 22를 참조하여 후술하도록 한다.

참고로, 전술한 단계 S100 내지 S500 중에서, 단계 S100은 수집부(110)와 토픽 추출부(120)에 의해 수행되고, 단계 S200 내지 단계 S400은 투자 대상 기업 결정부(140)에 의해 수행될 수 있다. 또한, 단계 S500은 포트폴리오 구축부(150)에 의해 수행될 수 있다.

지금까지 도 5를 참조하여 본 개시의 몇몇 실시예들에 따른 투자 포트폴리오 구축 방법에 대하여 개략적으로 설명하였다. 이하에서는, 상기 투자 포트폴리오 구축 방법에 포함된 각 단계에 적용될 수 있는 방법들에 대하여 설명하도록 한다.

먼저, 도 6 내지 도 13을 참조하여 전술한 단계 S100에 적용될 수 있는 토픽 추출 방법에 대하여 설명하도록 한다.

도 6은 본 개시의 몇몇 실시예들에 따른 토픽 추출 방법을 나타내는 예시적인 흐름도이다. 단, 이는 본 개시의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다.

도 6에 도시된 바와 같이, 상기 토픽 추출 방법은 콘텐츠를 수집하는 단계 S110에서 시작된다. 전술한 바와 같이, 상기 콘텐츠는 뉴스, 공시 문서, IR 문서, 증권사 리포트 등을 포함할 수 있다. 그러나, 본 개시의 기술적 범위가 이에 한정되는 것은 아니다.

단계 S120 및 단계 S130에서, 지정된 조건이 만족된다는 판정에 응답하여, 수집된 콘텐츠에 대해 클러스터링이 수행된다. 상기 기 지정된 조건은 일종의 업데이트 조건일 수 있다. 즉, 시간에 따라 토픽이 변동되는 점을 반영하기 위해, 상기 기 지정된 조건이 만족될 때마다 클러스터링이 반복하여 수행될 수 있다. 이에 대한 예는 도 7에 도시되어 있다.

도 7에 도시된 바와 같이, 클러스터링을 수행하여 제1 시점(T₁)에 제1 토픽 클러스터(63)가 구축되고, 지정된 조건이 만족되는 제2 시점(T₂)에 다시 클러스터링을 수행하여 제2 토픽 클러스터(67)가 구축될 수 있다. 여기서, 서비스 제공 서버(100)는 제1 시점(T₁)으로부터 일정 기간(e.g. 12시간) 내에 수집된(or 생성된) 콘텐츠(61)를 클러스터링하여 제1 토픽 클러스터(63)를 구축할 수 있다. 유사하게, 제2 시점(T₂)으로부터 일정 기간(e.g. 12시간) 내에 수집된(or 생성된) 콘텐츠(65)를 기초로 제2 토픽 클러스터(67)가 구축될 수 있다.

제2 시점(T₂)과 제1 시점(T₁) 간의 시간 간격(즉, 클러스터링 주기)은 일정할 수도 있고, 상황에 따라 변동될 수도 있다. 이는, 단계 S120의 조건이 어떻게 정의되는지에 따라 달라질 수 있다.

몇몇 실시예에서, 상기 조건은 일정 시간 간격에 기초하여 정의될 수 있다. 이와 같은 경우, 일정 시간 간격(e.g. 10분)마다 토픽 클러스터가 구축될 수 있다.

몇몇 실시예에서, 상기 조건은 수집된 콘텐츠의 개수로 기초하여 정의될 수 있다. 이와 같은 경우, 기준치 이상의 콘텐츠가 수집될 때마다 토픽 클러스터가 구축될 수 있다.

몇몇 실시예에서, 상기 조건은 특별한 이슈(e.g. 투자 환경에 영향을 미치는 정치, 경제, 사회 전반의 이슈)가 발생하는 경우와 같이 지정된 이벤트에 기초하여 정의될 수 있다. 이와 같은 경우, 상기 지정된 이벤트가 발생될 때마다 토픽 클러스터가 구축될 수 있다. 가령, 서비스 제공 서버(100)는 자산(e.g. 주가) 가치가 급변하거나, 수집되는 뉴스 콘텐츠의 개수가 급변하는 것 등을 감지하여 특별한 이슈가 발생되는지 여부를 탐지할 수 있다.

몇몇 실시예에서, 상기 조건은 전술한 다양한 실시예의 조합에 기초하여 정의될 수도 있다.

본 단계 S130에서, 클러스터링을 수행하기 위해, 수집된 각각의 콘텐츠가 키워드 벡터로 변환된다. 또한, 변환된 각각의 키워드 벡터에 대해 클러스터링이 수행될 수 있다. 콘텐츠를 키워드 벡터로 변환하는 과정은 도 8에 도시되어 있다.

도 8에 도시된 바와 같이, 수집된 각각의 콘텐츠(e.g. C1, C2, ..., Cm)는 소정의 키워드 벡터(71-1 내지 71-m)로 변환될 수 있다. 또한, 키워드 벡터(71-1, 내지 71-m) 값에 기초하여 상기 각각의 콘텐츠(e.g. C1, C2, ..., Cm)는 벡터 공간 상에 매핑될 수 있다. 가령, 제1 키워드 벡터(71-1)를 통해 제1 콘텐츠(C1)가 벡터 공간 상의 제1 포인트(73)에 매핑되고, 제2 키워드 벡터(71-2)를 통해 제2 콘텐츠(C2)가 벡터 공간 상의 제2 포인트(75)에 매핑될 수 있다. 동일하게, 제m 콘텐츠(Cm)은 벡터 공간 상의 제m 포인트(77)에 매핑될 수 있다.

수집된 콘텐츠(e.g. C1, C2, ..., Cm)를 키워드 벡터(71-1 내지 71-m)로 변환하기 위해, 각 콘텐츠에서 키워드가 추출될 수 있다. 이때, 불용어 사전을 이용하여 불용어를 제거하는 전처리 과정을 수행될 수 있다. 또는, 투자 관련 키워드를 누락없이 추출하기 위해, 투자 관련 키워드가 정의된 핵심어 사전이 이용될 수도 있다. 각각의 콘텐츠를 키워드 벡터로 변환하는 구체적인 방식은 실시예에 따라 달라질 수 있다.

몇몇 실시예에서, TF-IDF(Term Frequency-Inverse Document Frequency) 기법이 활용될 수 있다. 즉, 서비스 제공 서버(100)는 콘텐츠에 포함된 키워드의 TF-IDF 가중치 값(e.g. 도 8의 W11, W12, etc.)을 벡터의 요소 값으로 설정함으로써 상기 콘텐츠를 키워드 벡터로 변환할 수 있다. 당해 기술 분야의 종사자라면 TF-IDF 기법을 적용하여 콘텐츠를 벡터로 변환하는 바에 대하여 자명하게 이해할 수 있을 것인 바, 더 이상의 설명은 생략하도록 한다.

다른 몇몇 실시예에서, 단어 임베딩, 문서 임베딩 등의 임베딩(embedding) 기법이 활용될 수 있다.

본 단계 S130에서, 수집된 콘텐츠가 벡터 공간 상에 매핑되면, 매핑된 포인트에 대해 클러스터링이 수행될 수 있다. 클러스터링을 수행하는 구체적인 방식 또한 실시예에 따라 달라질 수 있다.

몇몇 실시예에서, 도 9에 도시된 바와 같이, DBSCAN(Density-Based Spatial Clustering of Applications with Noise)과 같은 밀도 기반 클러스터링 기법이 활용될 수 있다. 특히, 도 9는 DBSCAN에서 사용되는 몇몇 용어를 도시하고 있는데, 이해의 편의를 제공하기 위해, 몇몇 용어에 대하여 간략하게 설명하도록 한다.

도 9를 참조하면, 코어 포인트(core point)는 N개 이상의 이웃 포인트를 갖는 데이터 포인트를 의미한다. 여기서, N은 클러스터로 인정되기 위해 필요한 최소 포인트의 수이다. 또한, 이웃 포인트(neighborhood of a point)는 한 데이터 포인트로부터 지정된 반경 내에 존재하는 다른 데이터 포인트를 의미한다. 경계 포인트(border point)는 클러스터에는 속하지만, 코어 포인트에는 해당하지 않는 포인트를 의미한다. 노이즈 포인트(noise point)는 어떠한 클러스터에도 속해지지 않는 데이터 포인트를 의미한다. 이와 같은 경우, DBSCAN은 하나의 코어 포인트에 대하여 접근 가능한 N개 이상의 포인트(density-reachable)들을 클러스터로 형성하는 기법이다. 이러한 DBSCAN은 클러스터의 밀도에 따라 클러스터가 서로 연결될 수 있기 때문에 도 10에 도시된 바와 같이 일반적인 모양의 클러스터(81)뿐만 아니라 기하학적인 모양을 갖는 클러스터(83)도 잘 찾을 수 있다. 따라서, 다양한 콘텐츠로부터 동적으로 토픽을 추출하기에 적합하며, k-평균 클러스터링 기법과는 달리 미리 클러스터의 개수를 설정할 필요가 없다는 장점도 있다.

다른 몇몇 실시예에서, k-평균 클러스터링(k-means clustering) 등과 같이 다른 종류의 클러스터링 기법을 활용될 수 있다. 상기 k-평균 클러스터링 기법은 하이퍼파라미터 "k"를 통해 클러스터의 개수를 사전에 설정할 수 있다. 따라서, 추출되는 토픽의 개수를 사전에 설정하고 싶은 경우에는, k-평균 클러스터링 기법이 활용될 수 있다.

다시 도 6을 참조하여 설명을 이어가도록 한다.

단계 S140 내지 S170은 각 토픽 클러스터 내의 콘텐츠를 이용하여 토픽 관련 정보들을 추출하는 과정들이다.

단계 S140에서, 각 토픽 클러스터 별로 대표 제목이 선정된다. 각 토픽 클러스터에 속한 콘텐츠의 제목(e.g. 뉴스 제목) 중에서 높은 중요도를 갖는 제목이 대표 제목으로 선정될 수 있다. 이해의 편의를 제공하기 위해 도 11을 참조하여 부연 설명하도록 한다.

도 11에 도시된 바와 같이, 제목의 중요도를 산출하기 위해, 토픽 클러스터 내의 콘텐츠(A, B, ?, F)의 각 제목(91 내지 95)을 정점으로 갖는 그래프(97)가 구성될 수 있다. 그래프(97)의 에지(edge)는 제목 간의 유사도가 기준치 이상인 경우에 생성될 수 있는데, 상기 유사도는 자카드 계수(jaccard coefficient) 또는 해밍 거리(hamming distance) 중 어느 하나에 기초하여 산정될 수 있다. 그러나, 이에 한정되지 않고, 타니모토 유사도(tanimoto similarity), 코사인 유사도(cosine similarity) 등이 이용될 수도 있다.

그래프(97)가 구성되면, 하기의 수학식 1에 기초하여 각 제목의 중요도가 산정될 수 있다. 하기의 수학식 1은 특정 키워드에 따른 가중치를 반영하기 위해 종래의 페이지 랭크 알고리즘을 변형한 것이다. 즉, 하기의 수학식 1은 변형된 페이지 랭크 알고리즘을 통해 중요도를 산정하는 수식이다.

상기 수학식 1에서, T_n은 제목 A에 해당되는 정점에 연결된 다른 정점을 가리킨다. PR(T_n)은 정점(T_n)에 변형된 페이지랭크 알고리즘을 적용하여 산출된 중요도이다. 즉, PR(T_n)은 정점(T_n ₎의 페이지랭크 값이다. C(T_n)은 정점(T_n)에 부속된 에지의 수이다. 그리고, d는 댐핑 팩터(damping factor)의 역할을 수행하는 파라미터로, d의 값은 0.85로 설정될 수 있으나, 이에 한정되는 것은 아니다.

상기 수학식 1에서, W(T_n)은 정점(T_n)에 해당되는 제목에 부여되는 가중치이다. 몇몇 실시예에서, W(T_n)은 정점(T_n)에 대응되는 제목 내에서 특정 키워드가 출현하는 빈도 또는 위치에 기초하여 결정될 수 있다. 예를 들어, 상기 특정 키워드의 출현 빈도가 높을수록 W(T_n)은 큰 값으로 결정될 수 있다. 다른 예를 들어, 정점(T_n)에 대응되는 제목에 총 20개의 토큰이 포함되어 있고 특정 키워드가 제목의 앞에서부터 4번째의 위치에 출현한 경우, 상위 20%에 해당되는 값이 W(T_n)의 가중치 값으로 결정될 수 있다. 여기서, 상기 특정 키워드는 토픽과 연관된 키워드(e.g. 토픽 클러스터의 대표 키워드)로 설정될 수 있을 것이나, 본 개시의 기술적 범위가 이에 한정되는 것은 아니다.

도 11의 오른편에는 상기 수학식 1에 따라 각 제목의 중요도를 산정한 결과(99)가 도시되어 있다. 이와 같이 제목의 중요도가 산정되면, 중요도가 가장 높은 제목 또는 임계치 이상의 중요도를 갖는 제목이 해당 토픽 클러스터의 대표 제목으로 선정될 수 있다.

각 제목의 중요도를 산정하는 방법에 대한 보다 자세한 설명은 공지된 한국 등록 특허 제10-1656245호를 더 참조하도록 하며, 상기 한국 등록 특허에 기재된 전체 내용은 본 명세서에서 참조로 포함될 수 있음에 유의한다.

몇몇 실시예에서, 변형되지 않은 페이지랭크 알고리즘을 통해 각 제목의 중요도가 산정될 수도 있다.

또한, 몇몇 실시예에서, 콘텐츠에 제목이 존재하지 않는 경우, 텍스트 마이닝(text-mining) 기법을 통해 요약문이 추출되고, 상기 추출된 요약문이 상기 콘텐츠의 제목으로 이용될 수 있다. 이때, 상기 텍스트 마이닝 기법은 페이지랭크 알고리즘, 상기 수학식 1에 따른 변형된 페이지랭크 알고리즘 등이 될 수 있을 것이나, 본 개시의 기술적 범위가 이에 한정되는 것은 아니다.

다시 도 6을 참조하여 설명을 이어가도록 한다.

단계 S150에서, 각 토픽 클러스터 별로 해당 토픽과 연관된 기업이 추출된다. 상기 연관 기업은 콘텐츠의 내용 상에서 언급된 언급 기업과 콘텐츠를 발행한 발행 기업을 포함할 수 있다.

단계 S160에서, 각 토픽 클러스터 별로 대표 키워드가 추출된다. 상기 대표 키워드는 클러스터에 속한 콘텐츠를 대상으로 TF-IDF 기법, BM25(Best Matching) 기법 등을 적용하여 추출될 수 있다. 그러나, 본 개시의 기술적 범위가 상기 열거된 기법에 한정되는 것은 아니며, 얼마든지 다른 방식으로 대표 키워드가 추출될 수도 있다.

단계 S170에서, 각 토픽 클러스터 별로 중요도(즉, 토픽의 중요도)가 산정된다. 본 단계 S170에서, 토픽의 중요도를 산정하는 구체적인 방식은 실시예에 따라 달라질 수 있다.

제1 실시예에서, 토픽 클러스터에 소속된 콘텐츠의 개수에 기초하여 토픽의 중요도가 산정될 수 있다. 가령, 제1 토픽의 클러스터에 속한 콘텐츠의 개수가 많을수록, 상기 제1 토픽의 중요도는 높은 값으로 산출될 수 있다.

제2 실시예에서, 토픽 클러스터의 밀집도에 기초하여 토픽의 중요도가 산정될 수 있다. 가령, 제1 토픽의 클러스터의 밀집도(e.g. 면적 대비 콘텐츠의 개수)가 높을수록, 상기 제1 토픽의 중요도는 높은 값으로 산정될 수 있다.

제3 실시예에서, 토픽 클러스터에 속한 콘텐츠가 업데이트된 정도에 기초하여 토픽의 중요도가 산정될 수 있다. 가령, 제1 토픽의 클러스터에 업데이트 빈도가 높은 콘텐츠(e.g. 뉴스 1보, 2보 3보 등)가 많이 포함될수록 상기 제1 토픽의 중요도는 높은 값으로 산정될 수 있다. 또는, 이전 시점에 구축된 제1 토픽의 클러스터와 현재 시점에 구축된 상기 제1 토픽의 클러스터를 비교했을 때, 콘텐츠의 개수가 많이 증가한 경우, 상기 제1 토픽의 중요도는 높은 값으로 산정될 수 있다.

제4 실시예에서, 토픽 클러스터에 속한 콘텐츠의 출처(즉, 콘텐츠 제공자)에 기초하여 토픽의 중요도가 산정될 수 있다. 가령, 제1 토픽의 클러스터에 신뢰도 높은 기관(e.g. 공신력 있는 언론 기관)에서 발행된 콘텐츠가 많을수록, 상기 제1 토픽의 중요도는 높은 값으로 산정될 수 있다. 다른 예를 들어, 콘텐츠 제공자의 기여도에 기초하여 토픽의 중요도가 산정될 수도 있다. 이때, 제1 토픽에 대한 콘텐츠 제공자의 기여도는 일정 기간 동안에 콘텐츠를 발행한 전체 제공자의 수 대비 상기 제1 토픽과 연관된 콘텐츠 제공자 수에 기초하여 산출될 수 있다.

제5 실시예에서, 토픽 클러스터에 속한 콘텐츠의 댓글 개수에 기초하여 토픽의 중요도가 산정될 수 있다. 가령, 제1 토픽의 클러스터에 다수의 댓글이 달린 콘텐츠가 많을수록, 상기 제1 토픽의 중요도는 높은 값으로 산정될 수 있다.

제6 실시예에서, 토픽 클러스터에 속한 최근 콘텐츠의 개수 또는 최근에 발행된 n개(단, n은 1 이상의 자연수)의 콘텐츠의 평균 발행 시간에 기초하여 토픽의 중요도가 산정될 수 있다. 이때, 최근 콘텐츠인지 여부는 현재 시점을 기준으로 일정 기간 이내에 발행된 것인지에 따라 결정될 수 있고, 상기 일정 기간은 어떻게 정해지더라도 무방하다. 본 실시예에서, 제1 토픽의 클러스터에 최근 콘텐츠의 개수가 많을수록 또는 상기 평균 발행 시간이 최근일수록 상기 제1 토픽의 중요도는 높은 값으로 산정될 수 있다.

제7 실시예에서, 토픽 클러스터의 언급 기업의 자산 가치와 토픽 간의 밀접성에 기초하여 토픽의 중요도가 산정될 수 있다. 가령, 도 12에 도시된 바와 같이, 제1 토픽의 클러스터의 소속 콘텐츠들(111)에서 언급된 기업의 자산 가치(113)가 추적될 수 있다. 또한, 가치 변동 시점과 상기 제1 토픽의 이슈화 시점이 유사할수록, 상기 제1 토픽의 중요도가 높은 값으로 산정될 수 있다. 이때, 상기 제1 토픽의 이슈화 시점은 연관된 콘텐츠의 개수가 급증한 시점, 콘텐츠에 달린 댓글이 급증할 시점 등으로부터 추정될 수 있을 것이나, 본 개시의 기술적 범위가 이에 한정되는 것은 아니다.

제8 실시예에서, 하기의 수학식 2에 기초하여 토픽의 중요도가 산정될 수 있다. 하기의 수학식 2에서, score는 토픽의 중요도를 가리키고, N_c는 해당 클러스터에 속한 콘텐츠의 개수를 가리키며, T_A는 최근 n개의 콘텐츠의 평균 발행 시간(e.g. 최근에 발행될수록 작은 값으로 산출됨)을 가리킨다. 또한, C는 중요도를 조절하는 위한 상수(constant) 값이고, G는 중요도의 비중을 조절하기 위한 상수이며, W는 해당 토픽에 대한 콘텐츠 제공자의 기여도(이전 실시예의 내용 참조)를 가리킨다.

제9 실시예에서, 전술한 다양한 실시예들의 조합에 기초하여 토픽의 중요도가 산출될 수 있다. 예를 들어, 상기 제1 내지 제8 실시예들 중 적어도 둘 이상에 따라 산출된 중요도들을 종합(e.g. 가중치 합)하여 토픽의 최종 중요도가 산정될 수 있다.

도 13은 전술한 실시예들에 따라 구축된 토픽 클러스터의 토픽 관련 정보를 예시한다.

도 13에 도시된 바와 같이, 각각의 토픽 클러스터(e.g. 123)에 대하여 다양한 토픽 관련 정보(e.g. 121)가 추출될 수 있고, 상기 토픽 관련 정보(e.g. 121)는 토픽의 대표 키워드, 대표 제목, 언급 기업의 목록, 토픽의 중요도 등을 포함할 수 있다.

지금까지 도 6 내지 도 13을 참조하여 본 개시의 몇몇 실시예들에 따른 토픽 추출 방법에 대하여 설명하였다. 이하에서는, 도 14 내지 도 16을 참조하여 관심 콘텐츠와 연관된 투자 후보 기업을 추출하는 방법에 대하여 설명하도록 한다. 후술할 방법들은 전술한 단계 S300에 적용될 수 있다.

도 14는 본 개시의 몇몇 실시예들에 따른 투자 후보 기업 추출 방법을 나타내는 예시적인 흐름도이다. 단, 이는 본 개시의 목적을 달성하기 위한 바람직한 실시예일뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다.

도 14에 도시된 흐름도에서, 단계 S310 및 S320은 관심 콘텐츠와 연관된 토픽을 결정하는 단계 S200에 대응될 수 있다. 즉, 도 14는 관심 콘텐츠가 주어졌을 때, 상기 관심 콘텐츠와 연관된 토픽(즉, 관심 토픽)과 투자 후보 기업을 추출하는 과정을 일괄하여 도시한 것이다. 또한, 도 14에 도시된 방법은 특정 키워드(e.g. S310의 주요 키워드)를 이용하여 투자 후보 기업을 추출하는 경우 등과 같이 다양한 경우에 활용될 수 있다.

도 14에 도시된 바와 같이, 상기 투자 후보 기업 추출 방법은 관심 콘텐츠의 주요 키워드를 검색 키워드로 설정하는 단계 S310에서 시작된다. 여기서, 상기 주요 키워드는 어떠한 방식으로 추출되더라도 무방하다. 이를 테면, TF-IDF, BM25 기법이 적용될 수 있고, 투자 관련 키워드가 정의된 핵심어 사전이 이용될 수도 있다.

단계 S320에서, 검색 키워드로 토픽 클러스터가 검색된다. 보다 구체적으로, 검색 키워드로 토픽 클러스터의 토픽 관련 정보(e.g. 대표 제목, 대표 키워드, 언급 기업 등)가 검색되고, 검색 결과로 상기 검색 키워드에 매칭되는 토픽 클러스터가 결정된다. 가령, 도 15에 도시된 바와 같이, 관심 콘텐츠(131)에서 추출된 주요 키워드(#1 내지 #3)으로 토픽 클러스터(137, 139)의 토픽 관련 정보(133, 135)가 검색될 수 있다.

몇몇 실시예에서, 현재 토픽 클러스터 외에도 과거 토픽 클러스터에도 검색이 수행될 수 있다. 가령, 도 16에 도시된 바와 같이, 가장 최근에 구축된 현재 토픽 클러스터(133) 외에 과거 시점에 구축된 과거 토픽 클러스터(131)에 대해서도 검색이 수행될 수 있다. 또한, 현재 토픽 클러스터(133)에 대한 제1 검색 결과와 과거 토픽 클러스터(131)에 대한 제2 검색 결과를 모두 고려하여 검색 키워드에 매칭되는 토픽 클러스터가 결정될 수 있다. 예를 들어, 상기 제1 검색 결과와 상기 제2 검색 결과의 교집합 또는 합집합 등에 기초하여 상기 검색 키워드에 매칭되는 토픽 클러스터로 결정될 수 있다. 교집합이 수행되는 경우, 노이즈 결과가 제거될 수 있는 바, 관심 토픽과 연관된 투자 후보 기업이 보다 정확하게 추출될 수 있다.

다시 도 14를 참조하여 설명을 이어가도록 한다.

단계 S330에서, 검색 키워드에 매칭되는 토픽 클러스터의 연관 기업(e.g. 언급 기업, 발행 기업 등)들이 투자 후보 기업으로 추출된다.

단계 S340 및 단계 S350은 다른 방식으로 투자 후보 기업을 추출하는 과정에 관헌 것이다.

단계 S340에서, 검색 키워드로 전체 콘텐츠에 대한 검색이 수행된다. 즉, 본 단계 S340에서는 토픽 관련 정보에 대해 검색하는 것이 아니라, 토픽 클러스터에 관계없이 전체 콘텐츠에 대해서 광범위한 검색이 수행된다. 이는, 관심 콘텐츠와 연관된 투자 후보 기업이 누락되는 것을 방지하기 위한 것이다.

여기서, 토픽 클러스터 구축에 이용된 콘텐츠와 상기 전체 콘텐츠는 서로 동일할 수도 상이할 수도 있다. 예를 들어, 뉴스 콘텐츠를 기초로 토픽 클러스터가 구축된 경우, 상기 전체 콘텐츠는 상기 뉴스 콘텐츠 외에도 공시 문서, IR 문서, 증권사 리포트 등을 더 포함할 수 있다. 다른 예를 들어, 상기 전체 콘텐츠는 토픽 클러스터 구축에 이용된 모든 콘텐츠를 의미할 수도 있다.

단계 S350에서, 검색된 콘텐츠와 연관된 기업들도 투자 후보 기업들로 추출된다. 이때, 상기 연관된 기업들은 상기 검색된 콘텐츠에서 언급된 기업, 상기 검색된 콘텐츠를 발행한 기업 등을 포함할 수 있다.

한편, 본 개시의 몇몇 실시예들에 따르면, 기간 정보를 검색 값으로 더 이용하여 투자 후보 기업이 추출될 수도 있다. 가령, 기간 정보가 주어진 경우, 주어진 기간 사이에 구축된 토픽 클러스터를 대상으로 단계 S320 및 S330이 수행될 수 있다. 또한, 수집된 전체 콘텐츠 중에서 상기 주어진 기간 내에 발행되거나 수집된 콘텐츠들을 대상으로 단계 S340 및 S350이 수행될 수 있다.

지금까지 도 14 내지 도 16을 참조하여 투자 후보 기업을 추출하는 방법에 대하여 설명하였다. 상술한 방법에 따르면, 관심 토픽 및/또는 관심 콘텐츠와 연관된 기업들이 누락없이 추출될 수 있기 때문에, 투자 대상 기업 또한 정확하게 선별될 수 있게 된다.

이하에서는, 도 17 내지 도 20을 참조하여 투자 대상 기업을 선별하기 위해 관심 토픽과의 관련도를 산출하는 다양한 방법에 대하여 설명하도록 한다. 후술될 방법들은 전술한 단계 S400에서 관심 토픽과 투자 후보 기업 간의 관련도를 산출하는데 적용될 수 있다.

몇몇 실시예에서, 공시 문서(e.g. 사업 보고서)와 같이 기업의 사업 내용이 담긴 문서들을 분석하여 관심 콘텐츠 및/또는 관심 토픽과 연관된 기업들의 리스트가 추출될 수 있다. 또한, 투자 후보 기업 중에서 상기 추출된 목록에 포함된 기업들에게 가산점(즉, 관련도 스코어)이 부여될 수 있다. 공시 문서를 분석하여 기업 리스트를 추출하는 방법의 예시는 도 17에 도시되어 있다.

도 17에 도시된 바와 같이, 서비스 제공 서버(100)는 공시 문서(151)에 임베딩 기법(e.g. doc2vec)을 적용하여 각 문서들을 벡터 공간 상에 매핑할 수 있다. 보다 자세하게는, 서비스 제공 서버(100)는 공시 문서(151) 중 사업 보고서를 선별하고, 상기 사업 보고서에서 사업의 개요 항목을 추출하며, 상기 사업의 개요 항목에 대해 임베딩 기법을 적용할 수 있다. 이와 같은 경우, 벡터 공간 상에서 유사한 사업의 개요를 가진 기업들의 문서가 인접하여 위치하게 된다. 따라서, 벡터 공간 상에서의 문서들 간의 위치 관계를 이용하여, 사업의 개요에 포함된 특정 키워드와 연관이 있는 기업들 또는 특정 기업과 유사한 사업 개요를 가진 기업들의 리스트가 추출될 수 있다. 가령, 도 17에 도시된 바와 같이, 일정 공간(153) 내에 위치한 문서의 기업들을 추출하여 유사한 사업 개요를 갖는 기업 리스트(155)가 구성될 수 있다.

공시 문서를 통해 관심 콘텐츠와 연관된 기업들의 리스트를 추출하는 경우, 사업의 개요에 상기 관심 콘텐츠의 주요 키워드가 포함된 제1 기업들과, 상기 제1 기업들과 유사한 사업 개요를 가진 제2 기업들 등이 상기 연관 기업으로 추출될 수 있다. 또는, 벡터 공간 상에서 상기 주요 키워드에 대응되는 위치를 기준으로 일정 거리 이내에 위치한 공시 문서의 발행 기업들이 상기 연관 기업으로 추출될 수도 있다.

관심 토픽과 연관된 기업들의 리스트를 추출하는 경우라면, 상기 관심 토픽을 나타내는 키워드를 이용하여 연관 기업들의 리스트가 추출될 수 있다.

한편, 지금까지 공시 문서를 한정하여 설명하였으나, 전술한 설명 내용은 증권사 리포트, IR 문서 등과 같이 다른 종류의 문서에도 적용될 수 있음은 물론이다.

몇몇 실시예에서, 투자 후보 기업이 언급된 위치에 기초하여 적어도 일부는 차등적인 가산점이 부여될 수 있다. 가령, 도 18에 도시된 표(161)와 같이, 해당 기업의 언급 위치 별로 가중치가 미리 설정되어 있을 수 있고, 상기 가중치에 따른 가산점이 각 투자 후보 기업에게 부여될 수 있다. 이를 테면, 제1 투자 후보 기업이 토픽 클러스터의 대표 제목에 언급된 경우, W₁에 비례하는 가산점이 상기 제1 투자 후보 기업에게 부여될 수 있다. 유사하게, 제2 투자 후보 기업이 연관된 토픽 클러스터 외부에서 언급된 경우, W₄에 비례하는 가산점이 상기 제2 투자 후보 기업에게 부여될 수 있다.

도 18에 도시된 표(161)에서, 언급된 위치에 따른 가중치는 W₁, W2, W3, W4 순서대로 큰 값을 갖도록 설정될 수 있을 것이나, 본 개시의 기술적 범위가 이에 한정되는 것은 아니다.

몇몇 실시예에서, 투자 후보 기업이 언급된 콘텐츠(또는 투자 후보 기업과 연관된 콘텐츠)의 유형에 기초하여 적어도 일부는 차등적인 가산점이 부여될 수 있다. 가령, 도 19에 도시된 표(163)와 같이, 콘텐츠의 유형 별로 가중치가 미리 설정되어 있을 수 있고, 상기 가중치에 따른 가산점이 각 투자 후보 기업에게 부여될 수 있다. 이를 테면, 제1 투자 후보 기업과 연관된 콘텐츠의 유형이 뉴스인 경우, W₁에 비례하는 가산점이 상기 제1 투자 후보 기업에게 부여될 수 있다. 유사하게, 제2 투자 후보 기업과 연관된 콘텐츠의 유형이 공시 문서인 경우, W₂에 비례하는 가산점이 상기 제2 투자 후보 기업에게 부여될 수 있다.

도 19에 도시된 표(163)에서, 콘텐츠 유형에 따른 가중치는 실시예에 따라 달라질 수 있을 것이다.

몇몇 실시예에서, 콘텐츠 내에서 투자 후보 기업이 언급된 위치 또는 언급된 항목의 중요도에 기초하여 적어도 일부는 차등적인 가산점이 부여될 수 있다. 즉, 제1 투자 후보 기업과 제2 투자 후보 기업이 동일한 유형의 콘텐츠에서 언급되었다고 하더라도, 콘텐츠 내의 언급 위치(또는 언급된 항목의 중요도)에 따라 서로 다른 가산점이 부여될 수 있다. 가령, 도 20에 도시된 바와 같이, 사업 보고서(170, 180)가 사업 개요(171, 181)와 사업 배경(173, 183) 항목을 포함한다고 가정하자. 또한, 기업 A(175)는 사업 개요 항목(171)에서 언급되고, 기업 B(185)는 사업 배경 항목(183)에서 언급되었다고 가정하자. 이와 같은 경우, 사업 개요(171)에 언급된 기업 A(175)에게 더 높은 가산점이 부여될 수 있다. 사업 개요 항목에는 일반적으로 사업 배경 항목보다 중요한 내용이 포함되기 때문이다. 다른 예를 들어, 제1 투자 후보 기업이 콘텐츠 내에서 중간 부분에서 언급된 경우보다 앞 부분에서 언급된 경우에 더 높은 가산점이 부여될 수 있다.

전술한 실시예들에 따라, 각 투자 후보 기업에 대해 관련도 스코어가 가산점으로 부여되면, 최종 관련도 스코어가 기준치 이상인 기업 또는 상기 최종 관련도 스코어가 상위에 랭크된 k개(단, k는 1 이상의 자연수)의 기업 등이 투자 대상 기업으로 선정될 수 있다.

몇몇 실시예에서, 상기 투자 대상 기업의 수는 사용자의 투자 성향에 따라 달라질 수 있다. 가령, 안정적인 투자 성향일수록 투자 대상 기업의 수는 증가될 수 있다. 투자가 분산될수록 투자 손실은 줄어들 것이기 때문이다. 반대로, 공격적인 투자 성향을 가진 사용자에 대해서는 투자 대상 기업의 수가 감소될 수 있다. 본 실시예에 따르면, 사용자의 투자 성향에 따른 맞춤형 투자 포트폴리오가 구축되는 효과가 있다.

몇몇 실시예에서, 관심 토픽이 복수개인 경우, 제1 관심 토픽에 대한 투자 대상 기업의 수와 제2 관심 토픽에 대한 투자 대상 기업의 수는 관심 토픽의 상대적 중요도에 기초하여 결정될 수 있다. 가령, 제1 관심 토픽의 중요도가 더 높은 경우, 제1 관심 토픽에 대해서는 n개의 투자 대상 기업이 선별되고, 제2 관심 토픽에 대해서는 k개(단, k는 n보다 작은 자연수)의 투자 대상 기업이 선별될 수 있다. 다른 몇몇 실시예에서는, 관심 토픽의 상대적 중요도에 따라 투자 비중이 결정될 수도 있다. 즉, 제1 관심 토픽의 중요도가 제2 관심 토픽보다 높은 경우, 제1 관심 토픽과 연관된 제1 투자 대상 기업에게 더 많은 투자 비중(또는, 투자 금액)이 할당될 수 있다.

지금까지 도 17 내지 도 20을 참조하여 본 개시의 몇몇 실시예들에 따른 관련도 산출 방법에 대하여 설명하였다. 이하에서는, 도 21 및 도 22를 참조하여 본 개시의 몇몇 실시예들에 따른 투자 비중 결정 방법에 대하여 설명하도록 한다. 후술될 투자 비중 결정 방법은 전술한 단계 S500에서 투자 포트폴리오를 구축하기 위해 활용될 수 있다.

전술한 바에 따라 투자 대상 기업이 선정되면, 각 투자 대상 기업의 투자 비중을 결정함으로써 투자 포트폴리오가 구축될 수 있다. 이때, 투자 비중을 결정하는 구체적인 방식은 실시예에 따라 달라질 수 있다.

제1 실시예에서, 상기 투자 비중은 모든 투자 대상 기업에 대하여 균등하게 결정될 수 있다.

제2 실시예에서, 도 21에 도시된 바와 같이, 상기 투자 비중은 투자 대상 기업과 관심 토픽과의 관련도에 기초하여 결정될 수 있다(S510). 즉, 관련도가 높을수록 해당 기업의 투자 비중 또한 높은 값으로 결정될 수 있다. 상기 관련도를 산출하는 방법은 전술한 바와 같으므로, 이에 대한 설명은 생략하도록 한다.

제3 실시예에서, 도 22에 도시된 바와 같이, 상기 투자 비중은 각 투자 대상 기업의 시총비중(또는 시가총액)에 기초하여 결정될 수 있다. 즉, 시총비중이 높을수록 해당 기업의 투자 비중 또한 높은 값으로 결정될 수 있다.

제4 실시예에서, 투자 대상 기업의 가치 변동 추세에 기초하여 투자 비중이 결정될 수 있다. 가령, 자산 가치가 상승하고 있는 제1 투자 대상 기업의 투자 비중은 증가되고, 상기 자산 가치가 감소되고 있는 제2 투자 대상 기업의 투자 비중은 감소될 수 있다.

제5 실시예에서, 투자 대상 기업의 거래량에 기초하여 투자 비중이 결정될 수 있다. 즉, 거래량이 많을수록 해당 기업의 투자 비중 또한 높은 값으로 결정될 수 있다.

제6 실시예에서, 사용자의 투자 성향에 기초하여 투자 비중이 결정될 수 있다. 가령, 공격적인 투자를 지향하는 사용자의 경우, 가치 변동이 심한 기업의 투자 비중이 증가될 수 있다. 반대로, 안전한 투자를 지향하는 사용자의 경우, 가치 변동이 심하지 않는 기업, 우량 기업, 시총비중이 높은 기업, 거래량이 많은 기업의 투자 비중이 증가될 수 있다.

제7 실시예에서, 전술한 다양한 실시예들의 조합에 기초하여 투자 비중이 결정될 수 있다. 가령, 시총비중과 토픽과의 관련도를 함께 고려하여 투자 비중이 결정될 수도 있다.

한편, 본 개시의 몇몇 실시예들에 따르면, 서비스 제공 서버(100)는 복수의 투자 포트폴리오를 구성하여 사용자에게 제공할 수 있다. 예를 들어, 서비스 제공 서버(100)는 투자 성향 별로 복수의 투자 포트폴리오를 구성하여 제공할 수 있다. 다른 예를 들어, 서비스 제공 서버(100)는 투자 자산(e.g. 주식, 채권 등) 별로 복수의 투자 포트폴리오를 제공할 수도 있다.

지금까지 도 6 내지 도 22를 참조하여 본 개시의 몇몇 실시예들에 따른 투자 포트폴리오 구축 방법에 대하여 설명하였다. 상술한 방법에 따르면, 관심 콘텐츠 또는 관심 토픽에 대한 투자 포트폴리오가 자동으로 구축될 수 있다. 그렇게 구축된 투자 포트폴리오는 투자 자료로 사용자에게 제공되어, 투자 시장 활성화에 기여할 수 있다.

이하에서는, 도 23 및 도 24를 참조하여 본 개시의 다양한 실시예들에 따른 투자 포트폴리오 서비스 제공 방법에 대하여 설명하도록 한다. 이하의 서술에서는, 명세서의 명료함을 위해, 투자 포트폴리오 구축에 대한 설명은 생략하도록 한다.

도 23은 본 개시의 제1 실시예들에 투자 포트폴리오 서비스 제공 방법을 나타내는 예시적인 흐름도이다.

도 23에 도시된 바와 같이, 상기 제1 실시예는 온디맨드 방식으로 투자 포트폴리오 서비스를 제공하는 방법에 관한 것이다. 따라서, 상기 제1 실시예에서는, 사용자 단말(e.g. 도 1의 10)로부터 투자 포트폴리오를 요청받는 단계 S610에서 시작된다.

전술한 바와 같이, 상기 요청은 서비스 제공 서버(100)에 대한 직접적인 요청 외에도, 서비스 제공 서버(100)가 인지할 수 있는 간접적인 요청(e.g. 특정 뉴스 콘텐츠를 클릭하는 것)도 포함할 수 있다.

단계 S630 및 단계 S650에서, 상기 요청에 응답하여 즉각적으로 투자 포트폴리오가 구축된다. 투자 포트폴리오를 구축하는 방법은 도 6 내지 도 22에 대한 설명 부분을 참조하도록 한다.

단계 S670에서, 구축된 투자 포트폴리오가 요청자에게 제공된다.

참고로, 전술한 단계 S610 내지 S670 중에서, 단계 S610 내지 단계 S650은 투자 대상 기업 결정부(140)와 포트폴리오 구축부(150)에 의해 수행되고, 단계 S670은 포트폴리오 제공부(160)에 의해 수행될 수 있다.

도 24는 본 개시의 제2 실시예들에 투자 포트폴리오 서비스 제공 방법을 나타내는 예시적인 흐름도이다.

도 24에 도시된 바와 같이, 상기 제2 실시예는 서비스 제공 서버(100)가 사용자들이 관심을 가질만한 토픽(e.g. 핫 토픽, 이슈 토픽)을 선정하고, 선정된 토픽에 대한 투자 포트폴리오를 제공하는 방법에 관한 것이다.

도 24에 도시된 바와 같이, 상기 제2 실시예는 수집된 복수의 콘텐츠를 클러스터링하여 토픽을 추출하는 단계 S710에서 시작된다.

단계 S730 및 S750에서, 각 토픽에 대한 중요도가 산정되고, 상기 중요도에 기초하여 관심 토픽이 선정된다.

단계 S770에서, 관심 토픽에 대한 투자 포트폴리오가 구축된다.

단계 S790에서, 구축된 투자 포트폴리오가 사용자에게 제공된다. 가령, 투자 포트폴리오 서비스의 구독자에게 상기 투자 포트폴리오가 정기적 또는 비정기적으로 제공될 수 있다. 또한, 상기 관심 토픽에 대한 정보(e.g. 대표 키워드, 대표 제목, 연관 기업, 연관 콘텐츠 등)도 함께 제공될 수 있다.

참고로, 전술한 단계 S710 내지 S790 중에서, 단계 S710 및 단계 S730은 수집부(110)와 토픽 추출부(120)에 의해 수행되고, 단계 S750 및 단계 S770은 정보 획득부(130), 투자 대상 기업 결정부(140) 및 포트폴리오 구축부(150)에 의해 수행될 수 있다. 또한, 단계 S790은 포트폴리오 제공부(160)에 의해 수행될 수 있다.

지금까지 도 23 및 도 24를 참조하여 본 개시의 다양한 실시예들에 따른 투자 포트폴리오 서비스 제공 방법에 대하여 설명하였다. 상술한 방법에 따르면, 관심 토픽, 관심 콘텐츠 등과 관련된 투자 포트폴리오가 자동으로 구축되어 사용자에게 제공될 수 있다. 이에 따라, 사용자에게 투자 참여를 유도하고, 투자 시장이 더욱 활성화되는 효과가 달성될 수 있다. 나아가, 핫 토픽, 이슈 토픽, 관련 기업 등과 같은 가치 있는 투자 정보가 사용자에게 제공될 수 있다.

이하에서는, 도 25를 참조하여 본 개시의 다양한 실시예들에 따른 장치를 구현할 수 있는 컴퓨팅 장치에 대하여 설명하도록 한다.

도 25는 본 개시의 다양한 실시예들에 따른 장치(e.g. 도 1의 100)를 구현할 수 있는 예시적인 컴퓨팅 장치(200)를 나타내는 예시적인 하드웨어 구성도이다.

도 25에 도시된 바와 같이, 컴퓨팅 장치(200)는 하나 이상의 프로세서(210), 버스(250), 네트워크 인터페이스(270), 프로세서(210)에 의하여 수행되는 컴퓨터 프로그램을 로드(load)하는 메모리(230)와, 컴퓨터 프로그램(291)을 저장하는 스토리지(290)를 포함할 수 있다. 다만, 도 25에는 본 개시의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 개시가 속한 기술분야의 통상의 기술자라면 도 25에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.

프로세서(210)는 컴퓨팅 장치(200)의 각 구성의 전반적인 동작을 제어한다. 프로세서(210)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 또는 본 개시의 기술 분야에 잘 알려진 임의의 형태의 프로세서를 포함하여 구성될 수 있다. 또한, 프로세서(210)는 본 개시의 다양한 실시예들에 따른 방법/동작을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있다. 컴퓨팅 장치(200)는 하나 이상의 프로세서를 구비할 수 있다.

메모리(230)는 각종 데이터, 명령 및/또는 정보를 저장한다. 메모리(230)는 본 개시의 다양한 실시예들에 따른 방법/동작을 실행하기 위하여 스토리지(290)로부터 하나 이상의 프로그램(291)을 로드할 수 있다. 가령, 본 개시의 몇몇 실시예들에 따른 투자 포트폴리오 서비스 제공 방법을 실행하기 위한 프로그램이 메모리(230)에 로드되면, 메모리(230) 상에 도 4에 도시된 바와 같은 모듈들이 로직의 형태로 구현될 수 있다. 메모리(230)는 RAM과 같은 휘발성 메모리로 구현될 수 있을 것이나, 본 개시의 기술적 범위가 이에 한정되는 것은 아니다.

버스(250)는 컴퓨팅 장치(200)의 구성 요소 간 통신 기능을 제공한다. 버스(250)는 주소 버스(Address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다.

네트워크 인터페이스(270)는 컴퓨팅 장치(200)의 유무선 인터넷 통신을 지원한다. 또한, 네트워크 인터페이스(270)는 인터넷 통신 외의 다양한 통신 방식을 지원할 수도 있다. 이를 위해, 네트워크 인터페이스(270)는 본 개시의 기술 분야에 잘 알려진 통신 모듈을 포함하여 구성될 수 있다.

스토리지(290)는 상기 하나 이상의 프로그램(291)을 비임시적으로 저장할 수 있다. 스토리지(290)는 ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 개시가 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다.

컴퓨터 프로그램(291)은 메모리(230)에 로드될 때 프로세서(210)로 하여금 본 개시의 다양한 실시예들에 따른 방법/동작을 수행하도록 하는 하나 이상의 인스트럭션들(instructions)을 포함할 수 있다. 즉, 프로세서(210)는 상기 하나 이상의 인스트럭션들을 실행함으로써 본 개시의 다양한 실시예들에 따른 방법/동작을 수행할 수 있다. 여기서, 상기 인스트럭션은 컴퓨터 판독가능한 명령어들로써, 컴퓨터 프로그램의 구성 요소이자 프로세서에 의해 실행되는 것을 의미한다.

예를 들어, 컴퓨터 프로그램(291)은 기 수집된 복수의 콘텐츠를 클러스터링하여 토픽 클러스터를 구축하는 동작, 상기 구축된 토픽 클러스터를 이용하여 상기 관심 콘텐츠와 연관된 제1 토픽을 결정하는 동작, 상기 제1 토픽과의 관련도를 기초로 복수의 투자 후보 기업 중에서 투자 대상 기업을 선별하는 동작 및 상기 선별된 투자 대상 기업을 기초로 상기 관심 콘텐츠에 대한 투자 포트폴리오를 구축하는 동작을 수행하도록 하는 하나 이상의 인스트럭션들을 포함할 수 있다. 이와 같은 경우, 컴퓨팅 장치(200)를 통해 몇몇 실시예들에 따른 서비스 제공 서버(100)가 구현될 수 있다.

다른 예를 들어, 컴퓨터 프로그램(291)은 기 수집된 복수의 콘텐츠로부터 복수의 토픽을 추출하는 동작, 상기 복수의 토픽에 대한 중요도를 산정하는 동작, 상기 산정된 중요도를 기초로 상기 복수의 토픽 중 제1 토픽을 선정하는 동작, 상기 제1 토픽과 연관된 적어도 하나의 투자 대상 기업을 선정하는 동작, 상기 선정된 투자 대상 기업을 기초로 투자 포트폴리오를 구축하는 동작 및 상기 구축된 투자 포트폴리오를 제공하는 동작을 수행하도록 하는 하나 이상의 인스트럭션들을 포함할 수 있다. 이와 같은 경우, 컴퓨팅 장치(200)를 통해 다른 몇몇 실시예들에 따른 서비스 제공 서버(100)가 구현될 수 있다.

지금까지 도 25를 참조하여 본 개시의 다양한 실시예들에 따른 장치(e.g. 도 1의 100)를 구현할 수 있는 예시적인 컴퓨팅 장치(200)에 대하여 설명하였다.

지금까지 도 1 내지 도 25를 참조하여 본 개시의 몇몇 실시예들 및 그 실시예들에 따른 효과들을 언급하였다. 본 개시의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.

지금까지 도 1 내지 도 25를 참조하여 설명된 본 개시의 개념은 컴퓨터가 읽을 수 있는 매체 상에 컴퓨터가 읽을 수 있는 코드로 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체는, 예를 들어 이동형 기록 매체(CD, DVD, 블루레이 디스크, USB 저장 장치, 이동식 하드 디스크)이거나, 고정식 기록 매체(ROM, RAM, 컴퓨터 구비 형 하드 디스크)일 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체에 기록된 상기 컴퓨터 프로그램은 인터넷 등의 네트워크를 통하여 다른 컴퓨팅 장치에 전송되어 상기 다른 컴퓨팅 장치에 설치될 수 있고, 이로써 상기 다른 컴퓨팅 장치에서 사용될 수 있다.

이상에서, 본 개시의 실시예를 구성하는 모든 구성 요소들이 하나로 결합되거나 결합되어 동작하는 것으로 설명되었다고 해서, 본 개시가 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 개시의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.

도면에서 동작들이 특정한 순서로 도시되어 있지만, 반드시 동작들이 도시된 특정한 순서로 또는 순차적 순서로 실행되어야만 하거나 또는 모든 도시 된 동작들이 실행되어야만 원하는 결과를 얻을 수 있는 것으로 이해되어서는 안 된다. 특정 상황에서는, 멀티태스킹 및 병렬 처리가 유리할 수도 있다. 더욱이, 위에 설명한 실시예들에서 다양한 구성들의 분리는 그러한 분리가 반드시 필요한 것으로 이해되어서는 안 되고, 설명된 프로그램 컴포넌트들 및 시스템들은 일반적으로 단일 소프트웨어 제품으로 함께 통합되거나 다수의 소프트웨어 제품으로 패키지 될 수 있음을 이해하여야 한다.

이상 첨부된 도면을 참조하여 본 개시의 실시예들을 설명하였지만, 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자는 본 개시가 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 개시의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 개시의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims

컴퓨팅 장치에서 관심 콘텐츠에 대한 투자 포트폴리오를 구축하는 방법으로서,
기 수집된 복수의 콘텐츠를 클러스터링하여 토픽 클러스터를 구축하는 단계;
상기 구축된 토픽 클러스터를 이용하여 상기 관심 콘텐츠와 연관된 제1 토픽을 결정하는 단계;
상기 제1 토픽과의 관련도를 기초로 복수의 투자 후보 기업 중에서 투자 대상 기업을 선별하는 단계; 및
상기 선별된 투자 대상 기업을 기초로 상기 관심 콘텐츠에 대한 투자 포트폴리오를 구축하는 단계를 포함하는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
제1 항에 있어서,
상기 토픽 클러스터를 구축하는 단계는,
TF-IDF(Term Frequency-Invert Document Frequency) 기법을 적용하여 상기 복수의 콘텐츠 각각을 키워드 벡터로 변환하는 단계; 및0
상기 변환된 키워드 벡터에 대하여 밀도 기반 클러스터링(density based clustering)을 수행하는 단계를 포함하는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
제1 항에 있어서,
상기 토픽 클러스터를 구축하는 단계는,
기 설정된 조건이 만족될 때마다, 상기 조건의 만족 시점으로부터 일정 기간 내에 수집된 콘텐츠를 기초로 다시 토픽 클러스터를 구축하는 단계를 포함하는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
제1 항에 있어서,
상기 제1 토픽을 결정하는 단계는,
상기 관심 콘텐츠로부터 주요 키워드를 추출하는 단계;
상기 구축된 토픽 클러스터 중에서 상기 주요 키워드에 매칭되는 제1 토픽 클러스터를 결정하는 단계; 및
상기 제1 토픽 클러스터에 대응되는 토픽을 상기 제1 토픽으로 결정하는 단계를 포함하는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
제4 항에 있어서,
상기 토픽 클러스터를 구축하는 단계는,
각각의 토픽 클러스터에 대하여 대표 키워드를 추출하는 단계를 포함하고,
상기 제1 토픽 클러스터는 상기 대표 키워드와 상기 주요 키워드 간의 매칭 결과에 기초하여 결정되는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
제1 항에 있어서,
상기 투자 대상 기업을 선별하는 단계는,
상기 제1 토픽의 클러스터에 속한 콘텐츠와 연관된 기업을 제1 투자 후보 기업으로 추출하는 단계; 및
상기 관심 콘텐츠에 포함된 주요 키워드로 상기 기 수집된 복수의 콘텐츠를 검색하고, 상기 검색된 콘텐츠와 연관된 기업을 제2 투자 후보 기업으로 추출하는 단계; 및
상기 제1 투자 후보 기업과 상기 제2 투자 후보 기업 중에서 상기 투자 대상 기업을 선별하는 단계를 포함하는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
제6 항에 있어서,
상기 제1 투자 후보 기업은 상기 제1 토픽의 클러스터에 속한 콘텐츠 내에서 언급된 기업을 포함하는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
제1 항에 있어서,
상기 제1 토픽은 제1-1 토픽과 제1-2 토픽을 포함하고,
상기 투자 대상 기업을 선별하는 단계는,
상기 제1-1 토픽과의 관련도를 기초로 제1 개수의 투자 대상 기업을 선별하는 단계; 및
상기 제1-2 토픽과의 관련도를 기초로 제2 개수의 투자 대상 기업을 선별하는 단계를 포함하되,
상기 제1 개수와 상기 제2 개수는 토픽의 상대적 중요도에 기초하여 결정되는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
제1 항에 있어서,
상기 투자 포트폴리오를 구축하는 단계는,
상기 제1 토픽과 관련도를 기초로 각 투자 대상 기업의 투자 비중을 결정하는 단계를 포함하는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
제9 항에 있어서,
상기 투자 비중을 결정하는 단계는,
상기 각 투자 대상 기업의 시총비중에 더 기초하여 상기 각 투자 대상 기업의 투자 비중을 결정하는 단계를 포함하는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
제1 항에 있어서,
상기 선별된 투자 대상 기업의 수는 사용자의 투자 성향에 따라 달라지는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
제1 항에 있어서,
상기 투자 포트폴리오를 구축하는 단계는,
사용자의 요청에 응답하여, 상기 투자 포트폴리오를 구축하는 단계; 및
상기 구축된 투자 포트폴리오를 상기 사용자에게 제공하는 단계를 포함하는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
컴퓨팅 장치에서 관심 토픽에 대한 투자 포트폴리오를 구축하는 방법으로서,
기 수집된 복수의 콘텐츠를 클러스터링하여 토픽 클러스터를 구축하는 단계;
상기 구축된 토픽 클러스터 중에서 상기 관심 토픽에 매칭되는 제1 토픽 클러스터를 결정하는 단계;
상기 제1 토픽 클러스터에 속한 콘텐츠에서 언급된 기업을 투자 후보 기업으로 추출하는 단계;
상기 관심 토픽과의 관련도를 기초로 상기 투자 후보 기업 중에서 적어도 하나의 투자 대상 기업을 선정하는 단계; 및
상기 선정된 투자 대상 기업을 기초로 상기 관심 토픽에 대한 투자 포트폴리오를 구축하는 단계를 포함하는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
제13 항에 있어서,
상기 토픽 클러스터를 구축하는 단계는,
각각의 토픽 클러스터에 대하여 대표 키워드를 추출하는 단계를 더 포함하고,
상기 제1 토픽 클러스터를 결정하는 단계는,
상기 관심 토픽과 연관된 키워드를 획득하는 단계; 및
상기 획득된 키워드와 상기 대표 키워드 간의 매칭 결과에 기초하여 상기 제1 토픽 클러스터를 결정하는 단계를 포함하는 것을 특징으로 하는,
투자 포트폴리오 구축 방법.
컴퓨팅 장치에서 투자 포트폴리오 서비스를 제공하는 방법으로서,
기 수집된 복수의 콘텐츠로부터 복수의 토픽을 추출하는 단계;
상기 복수의 토픽에 대한 중요도를 산정하는 단계;
상기 산정된 중요도를 기초로 상기 복수의 토픽 중 제1 토픽을 선정하는 단계;
상기 제1 토픽과 연관된 적어도 하나의 투자 대상 기업을 선정하는 단계;
상기 선정된 투자 대상 기업을 기초로 투자 포트폴리오를 구축하는 단계; 및
상기 구축된 투자 포트폴리오를 제공하는 단계를 포함하는 것을 특징으로 하는,
투자 포트폴리오 서비스 제공 방법.
제15 항에 있어서,
상기 제1 토픽의 중요도는,
상기 제1 토픽과 연관된 콘텐츠 중 현재 시점으로부터 일정 기간 이내에 발행된 최근 콘텐츠의 개수 또는 상기 최근 콘텐츠의 평균 발행 시간에 기초하여 산정되는 것을 특징으로 하는,
투자 포트폴리오 서비스 제공 방법.
제15 항에 있어서,
상기 제1 토픽의 중요도는,
전체 콘텐츠 제공자의 수 대비 상기 제1 토픽과 연관된 콘텐츠의 제공자 수에 기초하여 산정되는 것을 특징으로 하는,
투자 포트폴리오 서비스 제공 방법.
제15 항에 있어서,
상기 구축된 투자 포트폴리오를 제공하는 단계는,
상기 투자 포트폴리오 서비스의 구독자에게 상기 구축된 투자 포트폴리오를 제공하는 단계를 포함하는 것을 특징으로 하는,
투자 포트폴리오 서비스 제공 방법.
컴퓨팅 장치에서 관심 토픽과 연관된 기업을 추출하는 방법으로서,
복수의 콘텐츠를 획득하는 단계;
상기 복수의 콘텐츠 중에서 상기 관심 토픽과 연관된 연관 콘텐츠를 결정하는 단계;
상기 연관 콘텐츠에 언급된 기업을 후보 기업으로 추출하는 단계;
상기 후보 기업과 상기 관심 토픽 간의 관련도를 산출하는 단계; 및
상기 산출된 관련도에 기초하여 상기 후보 기업 중에서 상기 관심 토픽과 연관된 기업을 선별하는 단계를 포함하는 것을 특징으로 하는,
관심 토픽과 연관된 기업을 추출하는 방법.
제19 항에 있어서,
상기 연관 콘텐츠를 결정하는 단계는,
상기 복수의 콘텐츠를 클러스터링하여 토픽 클러스터를 구축하는 단계;
상기 구축된 토픽 클러스터 중에서 상기 관심 토픽과 매칭되는 제1 토픽 클러스터를 선정하는 단계; 및
상기 제1 토픽 클러스터에 속한 콘텐츠를 제1 연관 콘텐츠로 결정하는 단계를 포함하는 것을 특징으로 하는,
관심 토픽과 연관된 기업을 추출하는 방법.
제20 항에 있어서,
상기 제1 토픽 클러스터를 선정하는 단계는,
상기 구축된 토픽 클러스터 각각에 대하여 대표 키워드를 추출하는 단계; 및
상기 관심 토픽과 연관된 키워드와 상기 대표 키워드 간의 매칭 결과에 기초하여 상기 제1 토픽 클러스터를 선정하는 단계를 포함하는 것을 특징으로 하는,
관심 토픽과 연관된 기업을 추출하는 방법.
제20 항에 있어서,
상기 제1 토픽 클러스터를 선정하는 단계는,
상기 구축된 토픽 클러스터 각각에 대하여 소속 콘텐츠의 제목을 기초로 대표 제목을 결정하는 단계; 및
상기 관심 토픽와 연관된 키워드와 상기 대표 제목 간의 매칭 결과에 기초하여 상기 제1 토픽 클러스터를 선정하는 단계를 포함하는 것을 특징으로 하는,
관심 토픽과 연관된 기업을 추출하는 방법.
제20 항에 있어서,
상기 연관 콘텐츠를 결정하는 단계는,
상기 관심 토픽과 연관된 키워드로 상기 복수의 콘텐츠를 검색하고, 상기 검색된 콘텐츠를 제2 연관 콘텐츠로 결정하는 단계를 더 포함하는 것을 특징으로 하는,
관심 토픽과 연관된 기업을 추출하는 방법.
제20 항에 있어서,
상기 토픽 클러스터를 구축하는 단계는,
각각의 토픽 클러스터에 대하여 대표 제목을 결정하는 단계; 및
각각의 토픽 클러스터에 대하여 대표 키워드를 추출하는 단계를 더 포함하고,
상기 관련도는 상기 후보 기업이 언급된 위치에 기초하여 산출되되,
상기 언급된 위치의 종류는 토픽 클러스터의 대표 제목, 토픽 클러스터의 대표 키워드 및 콘텐츠 내부를 포함하는 것을 특징으로 하는,
관심 토픽과 연관된 기업을 추출하는 방법.
제19 항에 있어서,
상기 관련도는 상기 연관 콘텐츠 내에서 상기 후보 기업이 언급된 위치에 기초하여 산출되는 것을 특징으로 하는,
관심 토픽과 연관된 기업을 추출하는 방법.
제19 항에 있어서,
상기 관련도는 상기 후보 기업이 언급된 연관 콘텐츠의 유형 및 출처 중 적어도 하나에 기초하여 산출되는 것을 특징으로 하는,
관심 토픽과 연관된 기업을 추출하는 방법.
제19 항에 있어서,
상기 관련도를 산출하는 단계는,
공시 문서를 분석하여 상기 관심 토픽과 연관된 기업 리스트를 추출하는 단계; 및
상기 후보 기업 중 제1 후보 기업이 상기 추출된 기업 리스트에 포함되었다는 판정에 응답하여, 상기 제1 후보 기업의 관련도에 가산점을 부여하는 단계를 포함하는 것을 특징으로 하는,
관심 토픽과 연관된 기업을 추출하는 방법.
제27 항에 있어서,
상기 관심 토픽과 연관된 기업 리스트를 추출하는 단계는,
임베딩(embedding) 기법을 통해 상기 공시 문서를 벡터 공간 상에 매핑하는 단계;
상기 벡터 공간 상에서 상기 공시 문서 간의 위치 관계를 이용하여 상기 관심 토픽과 연관된 공시 문서를 결정하는 단계; 및
상기 결정된 공시 문서의 발행 기업을 추출하는 단계를 포함하는 것을 특징으로 하는,
관심 토픽과 연관된 기업을 추출하는 방법.
제28 항에 있어서,
상기 공시 문서를 벡터 공간 상에 매핑하는 단계는,
상기 공시 문서 중에서 사업 보고서를 선별하는 단계;
상기 선별된 사업 보고서에서 사업의 개요 항목을 추출하는 단계; 및
상기 추출된 사업의 개요 항목에 상기 임베딩 기법을 적용하는 단계를 포함하는 것을 특징으로 하는,
관심 토픽과 연관된 기업을 추출하는 방법.