KR102000519B1 - 유사 성향 고객의 투자 패턴을 이용한 주식 종목 추천 방법 및 이를 이용한 시스템 - Google Patents

유사 성향 고객의 투자 패턴을 이용한 주식 종목 추천 방법 및 이를 이용한 시스템 Download PDF

Info

Publication number
KR102000519B1
KR102000519B1 KR1020170140986A KR20170140986A KR102000519B1 KR 102000519 B1 KR102000519 B1 KR 102000519B1 KR 1020170140986 A KR1020170140986 A KR 1020170140986A KR 20170140986 A KR20170140986 A KR 20170140986A KR 102000519 B1 KR102000519 B1 KR 102000519B1
Authority
KR
South Korea
Prior art keywords
customer
stock
customers
history
group
Prior art date
Application number
KR1020170140986A
Other languages
English (en)
Other versions
KR20190047285A (ko
Inventor
박지원
고경훈
Original Assignee
주식회사 코스콤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 코스콤 filed Critical 주식회사 코스콤
Priority to KR1020170140986A priority Critical patent/KR102000519B1/ko
Publication of KR20190047285A publication Critical patent/KR20190047285A/ko
Application granted granted Critical
Publication of KR102000519B1 publication Critical patent/KR102000519B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Technology Law (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

고객들의 성향을 분석하여 성향별로 고객을 분류하여 주식 종목을 추천하는 방법 및 시스템이 제공된다.
고객들을 성향별로 분류하는 방법은, 고객 거래 정보를 통해서 분류하는 단계와 주식 매매 이력을 점수화하여 소정의 계산식을 이용해서 분류하는 단계, 매매한 주식 종목과 매매 이력 점수가 일정 범위내로 유사한 고객별로 고객 그룹을 생성하는 단계, 고객 그룹별 구매 이력을 점수화하여 이를 소정의 계산식에 대입하여 유사한 고객별로 분류하는 단계가 있다.
유사한 성향별로 분류된 고객들 사이에서는 주식을 구매하는 취향이 비슷한 것으로 보고 이들 사이에서 다른 고객들이 매수하였으나 특정 고객은 매수하지 않은 주식 종목을 상기 특정 고객에게 추천하게 된다.

Description

유사 성향 고객의 투자 패턴을 이용한 주식 종목 추천 방법 및 이를 이용한 시스템{A method of recommending stock items using investment patterns of clients having similar tendency and system thereof}
본 발명은 주식 종목 추천 방법 및 이를 이용한 시스템에 관한 것으로서, 보다 상세하게는 유사한 성향을 가진 고객의 투자 패턴을 이용하여 주식 종목을 추천하는 방법에 관한 것이다.
주식 종목 추천 방법으로는 다양한 방법이 존재하고 있으며, 주식 종목을 추천함에 있어서 고려해야 할 중요한 요소 중 하나는 고객의 투자 성향이다. 유사한 투자 성향을 가진 고객들에게는 유사한 주식 종목을 추천하는 것이 바람직하기 때문이다. 투자 성향으로는 절대 안정 추구형, 안정 추구형, 안정 수익 추구형, 수익 추구형, 고수익 추구형 등 다양한 성향이 존재한다. 절대 안정 추구형은 투자한 원금에 대한 손실을 원하지 않고 기대 수익률이 낮더라도 원금 손실이 거의 없는 안전한 금융상품에 주로 투자하고 미래의 확실한 원금 보전과 환금성을 고려한 투자 계획을 구성한다. 안정 추구형은 안정성 위주의 금융 상품에 투자를 결정하고 일정 부분까지는 위험을 허용하지만 대부분 투자 원금이 보호되는 자산에 투자하기를 희망한다. 안정 수익 추구형은 일부 투자 자산에 대해서는 추가 수익을 기대하며 일정 수준의 원금 손실을 인정하고 주식형 상품은 일부만 포함하고 위험이 작은 상품이나 채권형 중심으로 자산을 구성한다. 수익 추구형은 유동성 확보를 위한 일부 자산을 제외하고는 위험이 높은 자산에 투자하고 고수익을 추구하는 투자자로서 높은 수익을 내는 데에는 위험도 함께 증가한다는 것을 잘 인식한다. 고수익 추구형은 수익 추구형 투자자와 마찬가지로 위험을 기꺼이 감수하고서라도 고수익을 추구하며 예상 수익이 높다고 판단되면 주식이나 파생 상품과 같은 위험이 큰 투자 상품에도 기꺼이 투자한다.
종래에는 고객에게 고객의 투자 성향 설문 조사 결과나 거래 정보를 통해서 파악하였다. 즉, 고객이 생각하기에 본인의 투자 성향이 어떠한지를 물어보고 이에 맞추어서 주식 종목을 추천하거나, 고객의 거래 정보를 토대로 투자 성향을 파악하여 주식 종목을 추천하기도 하였다.
또한, 주식 투자를 희망하는 사용자의 단말로부터 제공되는 개인 정보를 이용하여 해당 사용자의 개인 성향을 판단하고, 상기 판단된 개인 성향을 근거로 주식 종목을 추천하는 방법도 존재한다. 이는 단순히 종목 분석을 통하여 주식 종목을 추천하는 대신에 개인 성향에 근거하여 주식 종목을 추천함으로써 올바른 투자 방향을 설정하도록 하기 위함이다.
주식 종목을 추천함에 있어서 주식 투자자들의 투자 성향을 고려해서 주식 종목을 추천하는 것이 바람직하므로 주식 투자자들의 성향을 파악하기 위한 방법이 다양하게 시도되고 있다.
본 발명이 이루고자 하는 기술적 과제는 고객의 주식 정보 데이터를 활용하여 고객의 주식 매매 이력을 점수화하여 유사한 성향을 가진 고객을 분류하고, 분류된 고객들 사이에서 다른 고객들은 구매하였으나 특정 고객은 구매하지 않은 주식 종목을 특정 고객에게 추천하는 주식 종목 추천 방법과 시스템을 제공하는데 있다.
본 발명의 목적은 이상에서 언급된 목적으로 제한되지 않으며, 언급되지 않은 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상기 기술적 과제를 이루기 위한 본 발명의 일 양태에 따르면, 유사 성향 고객의 투자 패턴을 이용한 주식 종목 추천 방법은 증권사로부터 고객 거래정보를 포함하는 고객 정보 데이터와 종목 정보 데이터를 입수하는 단계와, 상기 입수된 고객 정보 데이터와 종목 정보 데이터를 기초로 고객 유형별로 고객들을 분류하는 단계, 상기 분류된 고객의 주식 매매 이력 정보를 이용하여 상기 고객의 보유 종목별로 주식 거래의 최근성, 주식 거래 빈도, 주식 거래 규모 별로 평가값을 설정하여 주식 매매 이력을 점수화하는 단계, 상기 점수화된 주식 매매 이력에 기초하여 매매한 주식종목과 매매 이력 점수가 일정 범위내로 유사한 고객별로 상기 고객을 분류하여 고객 그룹을 생성하는 단계와 상기 생성된 고객 그룹에 속하는 고객들에게 주식 종목을 추천하는 단계를 포함한다.
다른 실시예에서, 상기 주식 종목을 추천하는 단계는, 상기 생성된 고객 그룹에 속한 다른 고객들이 구매하였지만 특정 고객은 구매하지 않은 주식 종목을, 상기 특정 고객에게 추천하는 단계를 포함할 수 있다.
또 다른 실시예에서, 상기 주식 매매 이력을 점수화하는 단계 이후에 수학식 1을 이용하여 분산값(V)을 최소화하는 고객 그룹집합 Si를 탐색하여 고객을 분류하는 단계를 포함하고, 상기 고객 그룹을 생성하는 단계는 상기 탐색된 고객 그룹 집합 Si별로 분류된 고객들 정보에 기초할 수 있다.
[수학식 1]
Figure 112017106438217-pat00001
(ui는 i번째 그룹의 중심이 되는 고객의 주식 매매 이력 점수 데이터이고, xj는 각 고객의 주식 매매 이력 점수 데이터이고, Si는 그룹에 속하는 고객의 집합이고, i는 고객 그룹의 번호를 의미하고, j는 그룹에 속하는 고객을 식별하는 변수임.)
또 다른 실시예에서, 상기 주식 종목을 추천하는 단계는, 상기 생성된 고객 그룹에 있어서, 고객 계좌 정보를 활용하여 고객 그룹별 구매 이력을 생성하는 단계, 상기 고객 그룹별 구매 이력을 이용하여 주식 구매의 최근성, 주식 구매 빈도, 주식 구매 규모 별로 평가값을 설정하여 주식 구매 이력을 점수화하는 단계, 상기 생성된 고객 그룹별 구매 이력을 기초로 상기 그룹별 고객이 공통으로 구매한 주식 종목에 대한 구매 이력 평가값을 수학식2에 입력하여 고객간의 유사도를 계산하는 단계, 상기 계산된 유사도를 기초로 상기 고객 그룹 중에서 유사도가 가장 가까운 고객들 순서대로 미리 정해진 인원수만큼 선택하는 단계와 상기 선택된 고객들 중 다른 고객들이 구매하였지만 특정 고객은 구매하지 않은 주식 종목을 상기 특정 고객에게 추천하는 단계를 포함할 수 있다.
[수학식 2]
Figure 112017106438217-pat00002
(여기서, x,y는 유사도의 계산 대상이 되는 두 고객이고, rx,i 는 공통으로 구매한 주식종목(Ixy)에 대한 고객 x의 점수이고, ry,i 는 공통으로 구매한 주식종목(Ixy)에 대한 고객 y의 점수이고, Ix 는 x가 구매한 주식종목이고, Iy는 y가 구매한 주식종목임.)
또 다른 실시예에서, 상기 고객 그룹별 구매 이력을 생성하기 위하여 활용되는 고객 계좌 정보는 종목정보, 거래수량, 매수 평균 단가, 계좌당 거래보유 종목 수에 관한 데이터를 기초로 할 수 있다.
또 다른 실시예에서, 상기 고객 정보 데이터와 종목 정보 데이터에 기초하여 고객을 분류하는 단계는, 기존 고객의 경우는 고객 정보 데이터의 고객 기본 정보를 기초로 기본적인 고객 투자 성향을 파악하여 고객을 분류하는 단계와, 신규 고객의 경우는 가입시 작성한 투자 성향 설문을 활용하여 고객을 분류하는 단계를 포함할 수 있다.
또 다른 실시예에서, 상기 주식 매매 이력 정보는 주식 매매 종목 정보, 주식 매매 종목 단가, 매매 수량, 예수금, 증거금으로 구성될 수 있다.
또 다른 실시예에서, 상기 주식 매매 이력을 점수화함에 있어서 사용되는 변수는 종목 정보, 종목 단가, 수량, 예수금, 증거금이고, 상기 주식 거래의 최근성은 소정 기간 내에 유가증권 표준코드로 식별되는 주식 종목을 거래한 시점을 기준으로 점수를 산정하고, 상기 주식 거래 빈도는 소정 기간 내에 상기 주식 종목의 거래 수량으로 점수를 산정하고, 상기 주식 거래 규모는 상기 주식 종목의 거래에 사용된 총 금액으로써, 종목 단가에 수량을 곱한 금액에 예수금과 증거금을 합해서 점수를 산정할 수 있다.
또 다른 실시예에서, 유사 성향 고객의 투자 패턴을 이용한 주식 종목 추천 시스템은, 증권사로부터 고객 거래정보를 포함하는 고객 정보 데이터와 종목 정보 데이터를 입수하는 데이터 입수부, 상기 입수된 고객 정보 데이터와 종목 정보 데이터를 기초로 고객 유형별로 고객들을 분류하는 고객 분류부, 상기 분류된 고객의 주식 매매 이력 정보를 이용하여 주식 거래의 최근성, 주식 거래 빈도, 주식 거래 규모 별로 점수를 설정하여 주식 매매 이력을 점수화하는 매매 이력 분류부, 상기 점수화된 주식 매매 이력에 기초하여 매매한 주식 종목과 매매 이력 점수가 일정 범위내로 유사한 고객별로 상기 고객을 분류하여 고객 그룹을 생성하는 고객 그룹 생성부, 상기 생성된 고객 그룹에 속하는 고객들에게 주식 종목을 추천하는 주식 종목 추천부를 포함할 수 있다.
기타 실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
본 발명에 따르면, 소정의 알고리즘을 통한 점수화로 주식 매매 이력을 분류하여 투자 성향이 유사한 고객들로 분류가 가능하다. 그리고 점수화된 매매 이력을 기초로 유사한 점수를 가지는 고객들 별로 고객 그룹을 생성함으로써 유사한 성향을 가지는 고객 그룹으로 분류가 가능하다.
또한, 소정의 유사도 모델링을 통해서 유사한 성향을 가지는 고객들을 선정함으로써 고객들을 더욱 세분화하여 분류할수 있고, 이들 사이에서 주식 종목을 추천함으로써 비슷한 사용자 간에 실매매 기반 주식 종목 추천이 가능하다.
따라서 기존의 수익률과 위험성향 기반의 주식 종목 추천 방법과는 달리, 고객들을 성향별로 분류하여 성향에 맞게 주식 종목을 추천하여 주는 것이므로 고객들에게 보다 적합한 주식 종목 추천이 가능하다.
도 1은 본 발명의 일 실시예에 따른 주식 종목 추천 시스템의 구성도이다.
도 2는 고객 정보 데이터베이스와 종목 정보 데이터베이스의 구성도이다.
도 3은 매매이력 분류부의 구성도이다.
도 4는 고객 그룹 분류부의 구성도이다.
도 5는 고객 그룹 생성부의 구성도이다.
도 6은 고객 그룹별 구매 이력 생성부의 구성도이다.
도 7은 구매 이력 분류부의 구성도이다.
도 8은 유사도 계산부의 구성도이다.
도 9는 유사 고객 선택부의 구성도이다.
도 10은 본 발명의 다른 실시예에 따른 주식 종목 추천 방법을 나타낸 순서도이다.
도 11은 고객을 분류하는 방법을 나타낸 순서도이다.
도 12는 고객간의 유사도 계산을 통한 주식 종목 추천 방법을 나타낸 순서도이다.
이하, 첨부한 도면들 및 후술되어 있는 내용을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 그러나, 본 발명은 여기서 설명되어지는 실시예들에 한정되지 않고 다른 형태로 구체화될 수도 있다. 오히려, 여기서 소개되는 실시예들은 개시된 내용이 철저하고 완전해질 수 있도록 그리고 당업자에게 본 발명의 사상이 충분히 전달될 수 있도록 하기 위해 제공되는 것이다. 명세서 전체에 걸쳐서 동일한 참조번호들은 동일한 구성요소들을 나타낸다. 한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급되지 않는 한 복수형도 포함된다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소, 단계, 동작 및/또는 소자가 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
또한, “부”내지 모듈 이란, 일반적으로 논리적으로 분리 가능한 소프트웨어(컴퓨터·프로그램), 하드웨어 등의 부품을 가리킨다. 따라서, 본 실시형태에 있어서의 모듈은 컴퓨터·프로그램에 있어서의 모듈뿐만 아니라, 하드웨어 구성에 있어서의 모듈도 가리킨다. 그 때문에, 본 실시형태는, 그것들을 모듈로서 기능시키기 위한 컴퓨터·프로그램(컴퓨터에 각각의 단계를 실행시키기 위한 프로그램, 컴퓨터를 각각의 수단으로서 기능시키기 위한 프로그램, 컴퓨터에 각각의 기능을 실현시키기 위한 프로그램), 시스템 및 방법의 설명도 겸하고 있다. 다만, 설명의 형편상, 「저장한다」, 「저장시킨다」, 이것들과 동등한 문언을 이용하지만, 이들 문언은, 실시형태가 컴퓨터·프로그램일 경우에는, 기억 장치에 기억시키는, 또는 기억 장치에 기억시키는 것과 같이 제어하는 것을 의미한다. 또한, “부” 내지 모듈은 기능에 일대일로 대응하고 있어도 되지만, 실장에 있어서는, 1모듈을 1프로그램으로 구성해도 되고, 복수 모듈을 1프로그램으로 구성해도 되고, 반대로 1모듈을 복수 프로그램으로 구성해도 된다. 또한, 복수 모듈은 1컴퓨터에 의해 실행되어도 되고, 분산 또는 병렬 환경에 있어서의 컴퓨터에 의해 1모듈이 복수 컴퓨터로 실행되어도 된다. 또한, 1개의 모듈에 다른 모듈이 포함되어 있어도 된다. 또한, 이하, 「접속」이란 물리적인 접속 외에, 논리적인 접속(데이터의 주고받기, 지시, 데이터간의 참조 관계 등)일 경우에도 채용한다. 「미리 정해진」이란, 대상으로 하고 있는 처리 전에 정해져 있음을 말하고, 본 실시형태에 의한 처리가 개시되기 전은 물론이고, 본 실시형태에 의한 처리가 개시된 후에도, 대상으로 하고 있는 처리 전이면, 그 때의 상황·상태에 따라, 또는 그때까지의 상황·상태에 따라 정해지는 것의 의미를 포함해서 이용한다.
또한, 시스템 또는 장치란, 복수의 컴퓨터, 하드웨어, 장치 등이 네트워크(일대 일 대응의 통신 접속을 포함함) 등의 통신 수단에 의해 접속되어 구성되는 것 외에, 1개의 컴퓨터, 하드웨어, 장치 등에 의해 실현될 경우도 포함된다. 「장치」와 「시스템」이란, 서로 동의(同意)의 용어로서 이용한다. 물론이지만, 「시스템」에는, 인위적인 결정인 사회적인 「기구」(사회 시스템)에 지나지 않는 것은 포함하지 않는다.
또한, 각 부 내지 각 모듈에 의한 처리마다 또는 각 부 내지 모듈 내에서 복수의 처리를 행할 경우는 그 처리마다, 대상이 되는 정보를 기억 장치로부터 판독 입력하고, 그 처리를 행한 후에, 처리 결과를 기억 장치에 기입하는 것이다. 따라서, 처리 전의 기억 장치로부터의 판독 입력, 처리 후의 기억 장치에의 기입에 관해서는, 설명을 생략할 경우가 있다. 또한, 여기에서의 기억 장치로서는, 하드디스크, RAM(Random Access Memory), 외부 기억 매체, 통신 회선을 통한 기억 장치, CPU(Central Processing Unit) 내의 레지스터 등을 포함하고 있어도 된다.
이하, 도 1 내지 도 9를 참조하여, 본 발명의 주식 종목 추천 시스템에 대하여 상세히 설명하기로 한다. 도 1은 본 발명의 일 실시예에 따른 주식 종목 추천 시스템의 구성도이다. 도 2는 고객정보데이터베이스와 종목정보데이터베이스의 구성도이다. 또한, 도 3은 매매이력 분류부의 구성도이고, 도 4는 고객 그룹 분류부의 구성도이고, 도 5는 고객 그룹 생성부의 구성도, 도 6은 고객 그룹별 구매 이력 생성부의 구성도이고, 도 7은 구매 이력 분류부의 구성도이다. 도 8은 유사도 계산부의 구성도이고, 도 9는 유사 고객 선택부의 구성도이다.
주식 종목 추천 시스템(1)은 고객과 주식 종목에 관한 데이터를 입수하여 고객을 분류하고, 매매 이력을 점수화하여 이를 이용하여 고객 그룹을 더 세분화하여 분류하거나 고객 간의 유사한 정도를 나타내는 유사도를 계산하는데 사용한다. 유사한 그룹별로 분류된 고객들은 다른 유사한 고객들이 구매하였지만 자신은 구매하지 않은 주식 종목을 추천받게 된다.
구체적으로, 주식 종목 추천 시스템(1)은 고객 정보 데이터베이스(20)와 종목 정보 데이터베이스(30)로부터 고객 거래 정보와 주식 정보를 입수하는 데이터 입수부(100), 입수한 데이터를 기초로 고객을 분류하는 고객 분류부(200), 고객의 매매 이력 정보를 기초로 매매 이력을 점수화하여 매매 이력을 분류하는 매매 이력 분류부(300), 고객 기본 정보로 분류된 고객을 소정의 알고리즘을 통해서 K개의 군집으로 분류하는 고객 그룹 분류부(400), 사용자 기반 협업 필터링(User-Based CF)을 이용하여 고객 그룹을 생성하는 고객 그룹 생성부(500)를 포함한다.
또한, 주식 종목 추천 시스템(1)은 고객 계좌 정보를 수집하여 고객 그룹별 구매 이력을 생성하는 고객 그룹별 구매 이력 생성부(600), 고객 그룹별 구매 이력을 기초로 구매 이력을 점수화하는 구매 이력 분류부(700), 점수화된 구매 이력을 기초로 고객간의 유사도를 계산하는 유사도 계산부(800), 유사도 계산 결과 고객들 중 가장 유사한 N명을 선택하는 유사 고객 선택부(900), 유사한 패턴을 보이는 고객간에 다른 고객은 매수하였으나 특정 고객은 매수하지 않은 주식 종목을 추천하는 주식 종목 추천부(1000)를 포함한다.
데이터 입수부(100)는 고객 정보 데이터베이스(20)로부터 고객에 대한 정보를 입수하고, 종목 정보 데이터(30)로부터 주식 종목에 대한 정보를 입수한다.
고객 정보 데이터(20)는 성별, 연령, 고객 정보 코드 등을 포함하는 고객 기본 정보와 상품 유형 코드, 계좌 상태 코드 등을 포함하는 계좌 기본 정보, 주소 유형 코드, 동이상 주소 등을 포함하는 종합 계좌 주소, 종목 코드, 단가, 수량 등을 포함하는 일별 주식 잔고, 예수금 등을 포함하는 일별 계좌 정보, 증거금 등을 포함하는 일별 계좌 증거금, 그리고 PB 단말기 접속 정보 등의 데이터로 이루어진다.
종목 정보 데이터(30)는 시가 총액 규모 코드, 액면가, 상장 주식수 등을 주요 칼럼으로 하는 코스피(KOSPI), 코스닥(KOSDAQ) 종목에 대한 정보를 포함하는 종목 마스터와 바이오 관련주, 태양광 발전 관련주 등과 같은 주요 테마로 하는 테마주 정보 데이터로 이루어진다. 상장 폐지 종목과 신주 인수권부 사채(BW), 주식 워런트 증권(ELW)은 분석 대상에서 제외한다.
고객 분류부(200)는 데이터 입수부(100)로부터 입수한 고객 정보 데이터베이스(20)와 종목 정보 데이터베이스(30)의 정보를 기초로 고객을 분류하게 된다.
구체적으로, 기존 고객의 경우는 고객 거래 정보를 통해서 고객을 분류할 수 있다. 기존 고객의 경우 고객 거래 정보를 통해서 고객의 투자 성향을 파악할 수 있기 때문이다. 투자 성향은 보통 공격 투자형, 위험 중립형, 안정 추구형, 안정형등으로 나뉜는데, 이러한 분류로 제한되는 것은 아니다. 공격 투자형은 높은 수준의 투자 수익을 추구하며, 이를 위해 자산 가치의 변동성에 따른 손실 위험을 적극 수용하며 투자 대금 대부분을 주식, 주식형 펀드 또는 파생 상품 등의 위험 자산에 투자할 의향이 있는 유형이다. 위험 중립형은 투자에 상응하는 투자 위험이 있음을 충분히 인식하고 있으며, 예금, 적금보다 높은 수익을 기대할 수 있다면 일정 수준의 손실 위험을 감수할 수 있는 유형이다. 안정 추구형은 투자 원금의 손실 위험을 최소화하고, 이자 소득이나 배당 소득 수준의 안정적인 투자를 목표로 하는 유형이다. 안정형은 예금 또는 적금 수준의 수익률을 기대하며, 투자 원금에 손실이 발생하는 것을 원하지 않는 유형이다.
신규 고객의 경우는 주식 종목에 대한 과거 매매 이력이 없어서 거래 정보로 고객을 분류하기가 불가능하다. 따라서, 거래 이력 자료가 아닌 성별, 연령, 직업, 지역등 가입시 알 수 있는 정보를 통해서 고객을 분류한다. 예를 들어서 가입시 작성한 투자 성향 설문이 있다면 이를 활용하여 고객을 분류할 수 있다.
고객 분류부(200)에서 분류된 고객의 주식 매매 이력 정보를 점수화 변수 설정부(310)에서 수집하고 이를 이용하여 매매 이력 점수화부(320)에서 고객의 매매 이력을 점수화하여 매매 이력을 분류한다.
고객의 주식 매매 이력 정보는 고객이 과거에 매매한 종목들을 분석하여 자료를 구성하는 것이다. 고객이 과거에 매매한 주식의 종목 정보, 수량, 금액, 예수금, 증거금 등의 데이터를 활용하여 자료를 구성할 수 있다. 종목 정보는 어느 종목을 매매하였는지에 관한 것으로서 유가증권 표준코드를 통해서 알 수 있다. 예수금은 주식을 거래할 때 증권사에서 증권 계좌를 개설하고 주식 거래를 위해 계좌에 돈을 넣고 거래하는데, 이때 입금된 돈을 말한다. 증거금은 투자 거래를 원하는 투자자가 브로커에게 주는 소정의 돈을 말한다. 이와 같은 주식 매매 이력 정보를 기초로 점수화 변수 설정부(310)에서 주식 매매 이력 정보를 수집하게 된다.
점수화 변수 설정부(310)의 고객 매매 이력 정보를 기초로 매매 이력 점수화부(320)에서는 거래의 최근성(321), 거래 빈도(322), 거래 규모(323)를 통해서 고객의 주식 매매 이력을 점수화하게 된다.
구체적으로, 유가증권 표준코드(311), 수량(312), 증거금(313), 종목단가(314), 예수금(315)의 변수들을 설정한다. 그리고 매매 이력 점수화부(320)에서는 거래의 최근성(321), 거래빈도(322), 거래규모(323)를 고려해서 매매 이력을 점수화하게 되는데, 이때 기간은 소정 기간 내의 거래를 기준으로 한다. 거래의 최근성(321)(Recency)에서는 어느 종목을 소정 기간 내에 언제 매매하였는지로, 거래 빈도(322)(Frequency)에서는 소정 기간 내에 해당 주식의 매매 수량으로, 거래 규모(323)(Monetary)에서는 소정 기간 내에 해당 주식의 매매에 사용된 총금액으로 점수를 설정할 수 있다. 점수화된 매매 이력으로 매매 이력 분류부(300)에서는 고객의 주식 매매 이력을 분류한다. 예를 들어 설명하면, 고객의 매매 이력을 (1,1,1) 또는 (3,1,2) 또는 (5,1,3)과 같은 방식으로 점수화하여 분류할 수 있다.
매매 이력 분류부(300)에서 점수화된 매매 이력을 이용하여, 고객 그룹 분류부(400)에서 수학식 1을 사용함으로써 고객 그룹을 분류할 수 있다.
구체적으로, 그룹의 중심이 되는 고객의 점수와 각 분류된 고객 그룹내 고객의 점수를 하기 수학식 1에 입력하여 거리의 제곱 합인 분산값(V)을 최소로 하는 각 분류된 고객들의 집합을 찾게 된다.
[수학식 1]
Figure 112017106438217-pat00003
(ui는 i번째 그룹의 중심이 되는 고객의 주식 매매 이력 점수 데이터이고, xj는 각 고객의 주식 매매 이력 점수 데이터이고, Si는 그룹에 속하는 고객의 집합이고, i는 고객 그룹의 번호를 의미하고, j는 그룹에 속하는 고객을 식별하는 변수임.)
순서는 ① 매매 이력 분류부(300)에서 분류된 고객을 K 개의 그룹으로 임의로 분류하고, ② 각 그룹에 중심이 되는 고객을 1명씩 임의로 선정한다. ③ 그 다음 임의로 선정된 중심 고객의 점수로부터 가장 근접한 거리를 갖는 고객순으로 고객을 분류한 후, ④ 각 분류된 고객 그룹 내의 고객들의 점수의 평균값으로 새로운 중심이 되는 고객을 선정한다. ⑤ 각 분류된 고객 그룹의 중심이 되는 고객의 변화가 없을때까지 상기 ③, ④ 과정을 반복한다. 그렇게 하면 중심이 되는 고객을 기준으로 K 개의 그룹으로 고객들을 분류할 수 있게 된다.
고객 그룹 분류부(400)에서 이와 같이 고객들을 분류하는 과정은 고객 거래 정보를 통해서 분류된 고객들을 더욱 세분화하여 분류하기 위함이다. 더 세분화하여 분류된 고객들을 대상으로 주식 종목을 추천하는 경우, 그렇지 않은 경우에 비해서 보다 적합한 주식 종목 추천이 가능하기 때문이다. 상기 고객 그룹을 분류하는 고객 그룹 분류부(400)의 과정은 필요에 따라서 생략할 수도 있다.
고객 그룹 분류부(400)에서 분류된 고객은 고객 그룹 생성부(500)의 유사 고객 판단부(510)는 매매한 주식 종목과 매매 이력 점수를 기초로 일정 범위내로 유사한 고객을 판단하고, 고객 그룹화부(520)는 유사하게 판단된 고객별로 고객들을 분류하여 그룹화하게 된다.
유사 고객 판단부(510)는 고객이 매매한 주식 종목에 대한 정보와 고객의 매매 이력 점수를 기초로 유사한 고객들을 판단한다. 고객이 매매한 주식 종목에 대한 정보는 고객 거래 정보를 포함하는 고객 정보 데이터로부터 알 수 있고, 고객의 매매 이력 점수는 매매 이력 분류부(300)에서 점수화된 고객의 매매 이력을 이용한다. 매매한 주식 종목과 매매 이력 점수가 일정 범위내로 유사한 고객들을 판단하는 것은, 예를 들어 설명하면, 철강과 바이오에 관한 주식을 매매한 고객들은 서로 유사한 주식 종목을 매매한 고객들로 볼 수 있고, 매매 이력 점수가 (3,4,3), (3,4,4) 로 크게 차이가 나지 않는 고객들은 매매 이력 점수가 유사한 고객들로 볼 수 있다. 유사 범위의 설정은 제한된 것은 아니며, 주식 종목을 추천함에 있어서 보다 적합하도록 자유롭게 설정할 수 있다.
고객 그룹화부(520)에서는 유사 고객 판단부(510)에서 판단된 유사한 고객들 중 일정 범위내로 유사한 고객별로 고객들을 그룹화하게 되는데, 구체적으로 사용자 기반 협업 필터링(User-Based CF)을 사용한다. 사용자 기반 협업 필터링(User-Based CF)은 사용자가 기준이 되는 기법으로 비슷한 사용자 그룹(Neighbor)을 알아내고, 그 그룹에 속한 사용자들이 공통적으로 관심을 가지는 주식 종목을 추천하는 방식이다. 상기 협업 필터링(CF)은 사용자들로부터 얻은 기호 정보를 토대로 과거의 경향(패턴)이 미래에도 유지될 것이라는 전제를 기반으로 한다. 예를 들어, 과거에 특정 주식 종목의 구매를 선호하는 고객은 미래에도 그 주식 종목을 구매하는 것을 선호할 것이라는 전제가 기반이 되는 것이다. 사용자 기반 협업 필터링(User-Based CF)은 능동 필터링의 일종으로서 점수화하여 분류된 매매 이력을 기초로 고객들의 관심을 분석하여 비슷한 취향을 가진 고객들을 선별한다. 고객들의 행동을 예측하기 위해 고객들의 행동을 수치화(점수화)하여 사용하는 방법으로서, 점수가 비슷하면 해당 종목에 대한 관심이 비슷한 것으로 본다. 따라서 유사 고객 판단부(510)에서 판단된 유사한 고객들은 매매한 주식 종목 점수가 비슷하므로, 취향이 비슷하여 예측되는 행동도 비슷할 것이기 때문에 상기 매매한 주식종목과 점수가 비슷한 고객 별로 고객을 그룹화하여 고객 그룹을 생성한다.
이러한 사용자 기반 협업 필터링(User-Based CF)은 특정 주식 종목에 관심을 가진 고객들이 주식 종목을 실제로 평가한 것을 기초로 주식 종목을 추천하는 방법이므로 근거 있는 설명과 순위를 신뢰성 있는 정보로부터 생성할 수 있다는 장점이 있다.
고객 그룹 생성부(500)에서 그룹화된 고객이 구매한 주식 종목 정보, 구매한 주식 수량, 매수 평균 단가, 계좌당 거래 보유 종목 수에 관한 일정 기간 내의 데이터를 고객 계좌 정보 수집부(610)에서 수집한 후 구매 이력 생성부(620)에서 이를 이용하여 고객 그룹별 구매 이력을 생성한다.
고객 계좌 정보 수집부(610)에서는 고객이 구매한 주식 종목 정보, 구매 수량, 매수 평균 단가 등의 정보를 수집한다. 이때 수집되는 정보는 고객 거래 정보를 통해서 얻을 수 있다. 수집된 고객 계좌 정보를 구매 이력 생성부(620)에서 이용하여 고객 그룹별 구매 이력을 생성하게 된다.
고객 그룹별 구매 이력 생성부(600)에서 생성된 고객들의 구매 이력을 기초로 구매 이력 분류부(700)에서는 고객들의 구매 이력을 점수화 하게 된다.
구체적으로, 점수화 변수 설정부(710)에서는 유가증권 표준코드(711), 주식 구매 수량(712), 증거금(713), 종목 단가(714), 예수금(715)의 정보를 수집한다. 유가증권 표준코드(711)를 통해서 구매한 주식 종목 정보를 얻을수 있다. 점수화 변수 설정부(710)에서 수집된 고객들의 주식 구매 정보를 활용해서 구매 이력 점수화부(720)에서는 구매의 최근성(721), 구매 빈도(722), 구매 규모(723)를 통해서 고객의 주식 구매 이력을 점수화하게 된다. 점수화하는데에 있어서는, RFM 분류 방법을 사용해서 점수화하게 된다.
구체적으로, 유가증권 표준코드(711), 수량(712), 증거금(713), 종목단가(714), 예수금(715)의 변수들을 설정한다. 그리고 구매 이력 점수화부(720)에서는 구매의 최근성(721), 구매빈도(722), 구매규모(723)를 고려해서 구매 이력을 점수화하게 되는데, 이때 기간은 소정 기간 내의 거래를 기준으로 한다. 구매의 최근성(721)(Recency)에서는 어느 종목을 소정 기간 내에 언제 구매하였는지로, 구매 빈도(722)(Frequency)에서는 소정 기간 내에 해당 주식의 구매 수량으로, 구매 규모(723)(Monetary)에서는 소정 기간 내에 해당 주식의 구매에 사용된 총금액으로 점수를 설정할 수 있다. 점수화된 구매 이력으로 구매 이력 분류부(700)에서는 고객의 주식 구매 이력을 분류한다. 예를 들어 고객들의 주식 구매 이력은 (3,1,1), (2,3,4) 등의 점수로 분류될 수 있다.
유사도 계산부(800)에서는 구매 이력 분류부(700)에서 점수화된 고객의 주식 종목에 대한 평가값을 수학식 2에 입력하여 고객간의 유사도를 계산한다.
구체적으로, 구매 이력 수집부(810)에서 고객이 공통으로 구매한 주식 종목에 대한 정보를 수집하는데 이는 구매 이력 분류부(700)에서 점수화된 고객들의 구매 이력을 수집하는 것이다. 그리고 평가값 대입부(820)에서는 상기 고객이 공통으로 구매한 주식 종목에 대한 평가값을 아래의 수학식 2에 대입하여 고객들간의 유사도를 계산하게 된다.
[수학식 2]
Figure 112017106438217-pat00004
(여기서, x,y는 유사도의 계산 대상이 되는 두 고객이고, rx,i 는 공통으로 구매한 주식종목(Ixy)에 대한 고객 x의 점수이고, ry,i 는 공통으로 구매한 주식종목(Ixy)에 대한 고객 y의 점수이고, Ix 는 x가 구매한 주식종목이고, Iy는 y가 구매한 주식종목임.)
유사 고객 선택부(900)에서는 유사도 계산부(800)에서 계산된 유사도를 기초로 유사한 고객들을 선정하게 되는데, 구체적으로 인원수 결정부(910)에서는 선택될 고객 인원수를 미리 결정한다. 즉, 유사도 계산 결과 점수가 유사한 고객들을 선정해야 하는데 미리 몇명의 고객을 선정할지를 인원수 결정부(910)에서 결정하는 것이다. 그 다음 고객 선정부(920)에서는 유사도 계산 결과 그 값이 1에 가장 가까워서 가장 유사한 고객들을 상기 미리 결정된 인원수만큼 선정한다. 코사인 유사도는 그 값이 -1 에서 1 까지의 값을 가지게 되는데 유사도 계산 결과가 1에 가까울수록 더 유사한 것이다. 따라서 유사도 계산 결과가 1에 가까운 고객들을 선정하는 것이다.
유사 고객 선택부(900)에서 선정된 유사한 고객들에게 주식 종목 추천부(1000)에서는 고객이 구매할 주식 종목을 추천한다.
구체적으로, 상기 선택된 가장 유사한 고객들 사이에서 다른 고객들은 구매하였지만 특정 고객은 구매하지 않은 주식 종목을, 상기 특정 고객에게 추천한다. 예를 들어 설명하면, 유사한 A, B, C 라는 고객이 선정 되었는데, A 와 B 가 철강관련 주식과 방위산업 관련 주식, 그리고 바이오 관련 주식을 구매하였는데 C 는 철강 관련 주식과 방위산업 관련 주식은 구매하였지만 바이오 관련 주식을 구매하지 않은 경우, C 에게 바이오 관련 주식을 추천하는 것이다.
주식 종목 추천부(1000)에서는 이와 같이 고객들의 성향을 분석하여 성향이 유사한 고객들에게 그들 사이에서 공통으로 구매한 주식 종목을, 이를 구매하지 않은 다른 유사한 고객에게 추천함으로써 보다 적합한 주식 종목 추천이 가능하다. 상기 과정을 살펴보면 여러 단계에 걸쳐서 고객들을 유사한 고객별로 분류하고 있으나, 앞서 설명한 바와 같이 수학식 1(이에 관하여는 전술함)를 사용하여 고객을 분류하는 고객 그룹 분류부(400)의 과정을 생략하고 고객들을 분류하여 주식 종목을 추천할 수도 있다. 또한, 경우에 따라서는 고객 그룹 생성부(500)까지의 과정으로 고객을 분류한 다음, 고객 그룹별 구매 이력을 생성하여 유사도를 계산하고 유사 고객을 선정하는 과정을 생략한 상태로 주식 종목을 추천하는 것도 가능하다. 여러 단계를 거쳐서 고객을 성향에 따라서 분류하면 고객 사이의 성향의 유사한 정도는 커질수 있으나, 계산의 복잡성을 줄이고 빠른 주식 종목을 추천하기 위해서는 상황에 따라서 고객들을 분류하는 과정을 일부 생략할 수 있는 것이다.
이하, 도 1 내지 도 12를 참조하여 주식 종목 추천 방법에 대하여 상세히 설명하기로 한다.
도 10은 본 발명의 일 실시예에 따른 주식 종목 추천 방법의 순서도이고, 도 11은 고객을 분류하는 방법을 나타낸 순서도이고, 도 12는 고객간의 유사도 계산을 통한 주식 종목 추천 과정을 나타낸 순서도이다.
데이터 입수부(100)는 고객 정보 데이터베이스(20)로부터 고객에 대한 정보를 입수하고, 종목 정보 데이터베이스(30)로부터 주식 종목에 대한 정보를 입수한다(S110).
고객 정보 데이터(20)는 성별, 연령, 고객 정보 코드 등을 포함하는 고객 기본 정보와 상품 유형 코드, 계좌 상태 코드 등을 포함하는 계좌 기본 정보, 주소 유형 코드, 동이상 주소 등을 포함하는 종합 계좌 주소, 종목 코드, 단가, 수량 등을 포함하는 일별 주식 잔고, 예수금 등을 포함하는 일별 계좌 정보, 증거금 등을 포함하는 일별 계좌 증거금, 그리고 PB 단말기 접속 정보 등의 데이터로 이루어진다.
종목 정보 데이터(30)는 시가 총액 규모 코드, 액면가, 상장 주식수 등을 주요 칼럼으로 하는 코스피(KOSPI), 코스닥(KOSDAQ) 종목에 대한 정보를 포함하는 종목 마스터와 바이오 관련주, 태양광 발전 관련주 등을 주요 테마로 하는 테마주 정보 데이터로 이루어진다. 상장 폐지 종목과 신주 인수권부 사채(BW), 주식 워런트 증권(ELW)은 분석 대상에서 제외한다.
이어서, 고객 분류부(200)는 데이터 입수부(100)로부터 입수한 고객 정보 데이터베이스(20)와 종목 정보 데이터베이스(30)의 정보를 기초로 고객을 분류하게 된다.(S120)
구체적으로, 기존 고객의 경우는 고객 거래 정보를 통해서 고객을 분류할 수 있다. 기존 고객의 경우 고객 거래 정보를 통해서 고객의 투자 성향을 파악할 수 있기 때문이다. 예컨데, 투자 성향은 보통 공격 투자형, 위험 중립형, 안정 추구형, 안정형으로 나뉘고, 이에 따라 고객을 개략 분류한다.
신규 고객의 경우는 주식 종목에 대한 과거 매매 이력이 없어서 거래 정보로 고객을 분류하기가 불가능하다. 따라서, 거래 이력 자료가 아닌 성별, 연령, 직업, 지역등 가입시 알 수 있는 정보를 통해서 고객을 분류한다. 예를 들어서 가입시 작성한 투자 성향 설문이 있다면 이를 활용하여 고객을 분류할 수 있다.
다음으로, 매매 이력 분류부(300)에서는 매매 이력을 분류하는데, 고객 분류부(200)에서 분류된 고객의 주식 매매 이력 정보를 점수화 변수 설정부(310)에서 수집하고, 이를 이용하여 매매 이력 점수화부(320)에서 고객의 매매 이력을 점수화하여 매매 이력을 분류한다.(S130)
고객의 주식 매매 이력 정보는 고객이 과거에 매매한 종목들을 분석하여 자료를 구성하는 것이다. 고객이 과거에 매매한 주식의 종목 정보, 수량, 금액, 예수금, 증거금 등의 데이터를 활용하여 자료를 구성할 수 있다. 종목 정보는 어느 종목을 매매하였는지에 관한 것으로서 유가증권 표준코드를 통해서 알 수 있다. 예수금은 주식을 거래할 때 증권사에서 증권 계좌를 개설하고 주식 거래를 위해 계좌에 돈을 넣고 거래하는데, 이때 입금된 돈을 말한다. 증거금은 투자 거래를 원하는 투자자가 브로커에게 주는 소정의 돈을 말한다. 이와 같은 주식 매매 이력 정보를 기초로 점수화 변수 설정부(310)에서 주식 매매 이력 정보를 수집하게 된다.
점수화 변수 설정부(310)의 고객 매매 이력 정보를 기초로 매매 이력 점수화부(320)에서는 거래의 최근성(321), 거래 빈도(322), 거래 규모(323)를 통해서 고객의 주식 매매 이력을 점수화하게 된다. 점수화하는데에 있어서는, RFM 분류 방법을 사용해서 점수화하게 되는데, 이는 주로 마케팅에서 많이 사용되는 방법으로 고객을 분류할수 있는 간단하면서도 유용하게 사용될수 있는 방법이다.
구체적으로, 유가증권 표준코드(311), 수량(312), 증거금(313), 종목단가(314), 예수금(315)의 변수들을 설정한다. 그리고 매매 이력 점수화부(320)에서는 거래의 최근성(321), 거래빈도(322), 거래규모(323)를 고려해서 매매 이력을 점수화하게 되는데, 이때 기간은 소정 기간 내의 거래를 기준으로 한다. 거래의 최근성(321)(Recency)에서는 어느 종목을 소정 기간 내에 언제 매매하였는지로, 거래 빈도(322)(Frequency)에서는 소정 기간 내에 해당 주식의 매매 수량으로, 거래 규모(323)(Monetary)에서는 소정 기간 내에 해당 주식의 매매에 사용된 총금액으로 점수를 설정할 수 있다. 점수화된 매매 이력으로 매매 이력 분류부(300)에서는 고객의 주식 매매 이력을 분류한다. 예를 들어 설명하면, 고객의 매매 이력을 (1, 1, 1) 또는 (3, 1, 2) 또는 (5, 1, 3)과 같은 방식으로 점수화하여 분류할 수 있다.
다음으로, 고객 그룹 분류부(400)에서는 매매 이력 분류부(300)에서 점수화된 매매 이력을 이용하여 수학식1을 사용하여 고객 그룹을 분류할 수 있다(S140).
[수학식 1]
Figure 112017106438217-pat00005
(ui는 i번째 그룹의 중심이 되는 고객의 주식 매매 이력 점수 데이터이고, xj는 각 고객의 주식 매매 이력 점수 데이터이고, Si는 그룹에 속하는 고객의 집합이고, i는 고객 그룹의 번호를 의미하고, j는 그룹에 속하는 고객을 식별하는 변수임.)
즉, 그룹의 중심이 되는 고객의 점수와 각 분류된 고객 그룹내 고객의 점수를 수학식 1에 입력하여 거리의 제곱 합인 분산값(V)을 최소화 하는 각 분류된 고객들의 집합을 찾게 된다.
도 11을 참조하여 구체적으로 설명하면, 순서는 ① 고객 기본 정보로 분류된 고객을 K 개의 그룹으로 임의로 분류하고(S141), ② 각 그룹에 중심이 되는 고객을 1명씩 임의로 선정한다(S142). ③ 그 다음 임의로 선정된 중심 고객의 점수로부터 가장 근접한 거리를 갖는 고객 순으로 고객을 분류한 후(S143), ④ 각 분류된 고객 그룹 내의 고객들의 점수의 평균값으로 새로운 중심이 되는 고객을 선정한다(S144). ⑤ 각 분류된 고객 그룹의 중심이 되는 고객의 변화가 있는지 여부를 살핀다(S145). 만일 그룹의 중심이 되는 고객의 변화가 있다면, 다시 ③, ④, ⑤의 과정을 그룹의 중심이 되는 고객의 변화가 없을때까지 반복한다. 그룹의 중심이 되는 고객의 변화가 없게 되면 그룹의 중심이 되는 고객을 기준으로 K개의 그룹으로 고객들을 분류하게 된다(S146).
고객 그룹 분류부(400)에서 이와 같이 고객들을 분류하는 과정은 고객 거래 정보를 통해서 분류된 고객들을 더욱 세분화하여 분류하기 위함이다. 더 세분화하여 분류된 고객들을 대상으로 주식 종목을 추천하는 경우, 그렇지 않은 경우에 비해서 보다 적합한 주식 종목 추천이 가능하기 때문이다. 상기 고객 그룹을 분류하는 고객 그룹 분류부(400)의 방법은 필요에 따라 생략할 수도 있다.
다음으로, 고객 그룹 생성부(500)에서는 고객 그룹 분류부(400)에 분류된 고객이 매매한 주식 종목과 매매 이력 점수를 기초로 유사 고객 판단부(510)에서 일정 범위내로 유사한 고객을 판단하고, 고객 그룹화부(520)에서 유사하게 판단된 고객별로 고객들을 분류하여 그룹화하게 된다(S150).
구체적으로, 유사 고객 판단부(510)는 고객이 매매한 주식 종목에 대한 정보와 고객의 매매 이력 점수를 기초로 유사한 고객들을 판단한다. 고객이 매매한 주식 종목에 대한 정보는 고객 거래 정보를 포함하는 고객 정보 데이터로부터 알 수 있고, 고객의 매매 이력 점수는 매매 이력 분류부(300)에서 점수화된 고객의 매매 이력을 이용한다. 매매한 주식 종목과 매매 이력 점수가 일정 범위내로 유사한 고객들을 판단하는 것은, 예를 들어 설명하면, 철강과 바이오에 관한 주식을 매매한 고객들은 서로 유사한 주식 종목을 매매한 고객들로 볼 수 있고, 매매 이력 점수가 (3, 4, 3), (3, 4, 4)로 크게 차이가 나지 않는 고객들은 매매 이력 점수가 유사한 고객들로 볼 수 있다. 유사범위의 설정은 제한된 것은 아니며, 주식 종목을 추천함에 있어서 보다 적합하도록 자유롭게 설정할 수 있다.
그리고, 고객 그룹화부(520)에서는 유사 고객 판단부(510)에서 판단된 유사한 고객들 중 일정 범위내로 유사한 고객별로 고객들을 그룹화하게 되는데, 구체적으로 사용자 기반 협업 필터링(User-Based CF)을 사용한다. 상세한 설명은 전술하였으므로 생략하기로 한다.
주식 종목 추천부(1000)에서는 고객 그룹 생성부(500)에서 그룹화된 고객들에게 주식 종목을 추천하게 되는데, 분류된 고객들을 보다 세분화하여 분류한 다음 주식 종목을 추천할 수도 있다(S160).
S160 단계에 대해 도12를 참조하여 설명하면, 고객 그룹별 구매 이력 생성부(600)의 고객 계좌 정보 수집부(610)에서 고객 그룹 생성부(500)에서 그룹화된 고객의 계좌 정보인 고객이 구매한 주식 종목 정보, 구매한 주식 수량, 매수 평균 단가, 계좌당 거래 보유 종목 수에 관한 일정 기간 내의 데이터를 수집하고, 구매 이력 생성부(620)에서 이를 이용하여 고객 그룹별 구매 이력을 생성한다(S161).
이어서, 고객 그룹별 구매 이력 생성부(600)에서 생성된 고객들의 구매 이력을 기초로 구매 이력 분류부(700)에서는 고객들의 구매 이력을 점수화 한다(S162).
점수화 변수 설정부(710)에서는 유가증권 표준코드(711), 주식 구매 수량(712), 증거금(713), 종목 단가(714), 예수금(715)의 정보를 수집한다. 유가증권 표준코드(711)를 통해서 구매한 주식 종목 정보를 얻을 수 있다. 점수화 변수 설정부(710)에서 수집된 고객들의 주식 구매 정보를 활용해서 구매 이력 점수화부(720)에서는 구매의 최근성(721), 구매 빈도(722), 구매 규모(723)를 통해서 고객의 주식 구매 이력을 점수화하게 된다.
구체적으로, 유가증권 표준코드(711), 수량(712), 증거금(713), 종목단가(714), 예수금(715)의 변수들을 설정한다. 그리고 구매 이력 점수화부(720)에서는 구매의 최근성(721), 구매빈도(722), 구매규모(723)를 고려해서 구매 이력을 점수화하게 되는데, 이때 기간은 소정 기간 내의 거래를 기준으로 한다. 구매의 최근성(721)(Recency)에서는 어느 종목을 소정 기간 내에 언제 구매하였는지로, 구매빈도(722)(Frequency)에서는 소정 기간 내에 해당 주식의 구매 수량으로, 구매규모(723)(Monetary)에서는 소정 기간 내에 해당 주식의 구매에 사용된 총금액으로 점수를 설정할 수 있다. 점수화된 구매 이력으로 구매 이력 분류부(700)에서는 고객의 주식 구매 이력을 분류한다. 예를 들어 설명하면, 고객들의 주식 구매 이력은 (3, 1, 1), (2, 3, 4) 등의 점수로 분류될 수 있다.
다음으로, 유사도 계산부(800)에서는 구매 이력 분류부(700)에서 점수화된 고객의 주식 종목에 대한 평가값을 수학식 2에 입력하여 고객간의 유사도를 계산한다(S163).
[수학식 2]
Figure 112017106438217-pat00006
(여기서, x,y는 유사도의 계산 대상이 되는 두 고객이고, rx,i 는 공통으로 구매한 주식종목(Ixy)에 대한 고객 x의 점수이고, ry,i 는 공통으로 구매한 주식종목(Ixy)에 대한 고객 y의 점수이고, Ix 는 x가 구매한 주식종목이고, Iy는 y가 구매한 주식종목임.)
구체적으로, 구매 이력 수집부(810)에서 고객이 공통으로 구매한 주식 종목에 대한 정보를 수집하는데 이는 구매 이력 분류부(700)에서 점수화된 고객들의 구매 이력을 수집하는 것이다. 그리고 평가값 대입부(820)에서는 상기 고객이 공통으로 구매한 주식 종목에 대한 평가값을 소정의 계산식(계산식인 수학식 2에 대하여는 전술함)에 대입하여 고객들간의 유사도를 계산하게 된다.
유사 고객 선택부(900)에서는 유사도 계산부(800)에서 계산된 유사도를 기초로 유사한 고객들을 선정한다(S164).
구체적으로, 인원수 결정부(910)에서는 선택될 고객 인원수를 미리 결정한다. 즉, 유사도 계산 결과 점수가 유사한 고객들을 선정해야 하는데 미리 몇명의 고객을 선정할지를 인원수 결정부(910)에서 결정한다. 그 다음 고객 선정부(920)에서는 유사도 계산 결과 그 값이 1에 가장 가까워서 유사한 고객들을 상기 미리 결정된 인원수만큼 선정한다. 코사인 유사도는 그 값이 -1 에서 1까지의 값을 가지는데 유사도 계산 결과가 1에 가까울수록 더 유사한 것이다. 따라서 유사도 계산 결과가 1에 가까운 고객들로 선정한다.
주식 종목 추천부(1000)에서는 유사 고객 선택부(900)에서 선정된 고객들에게 그들이 구매할 주식 종목을 추천한다(S165).
구체적으로, 상기 선택된 가장 유사한 고객들 사이에서 다른 고객들은 구매하였지만, 특정 고객은 구매하지 않은 주식 종목을 상기 특정 고객에게 추천한다. 예를 들어 설명하면, 유사한 A ,B, C 라는 고객이 선정 되었는데, A 와 B가 철강 관련 주식과 방위산업 관련 주식, 그리고 바이오 관련 주식을 구매하였는데, C는 철강 관련 주식과 방위산업 관련 주식은 구매하였지만 바이오 관련 주식은 구매하지 않은 경우, C 에게 바이오 관련 주식을 추천하는 것이다.
이상에서 대표적인 실시예를 통하여 본 발명에 대하여 상세하게 설명하였으나, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 상술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다. 그러므로 본 발명의 권리 범위는 설명된 실시예에 국한되어 정해져서는 안되며, 후술하는 청구범위뿐만 아니라 이 청구범위와 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태에 의하여 정해져야 한다.
1 : 주식 종목 추천 시스템 10 : 주식 정보 데이터
100 : 데이터 입수부 200 : 고객 분류부
300 : 매매 이력 분류부 400 : 고객 그룹 분류부
500 : 고객 그룹 생성부 600 : 고객 그룹별 구매 이력 생성부
1000 : 주식 종목 추천부

Claims (9)

  1. 컴퓨터에 의해 자동적으로 수행되는 주식 종목 추천방법에 있어서,
    증권사로부터 고객 거래정보를 포함하는 고객 정보 데이터와 종목 정보 데이터를 입수하는 단계;
    상기 입수된 고객 정보 데이터와 종목 정보 데이터를 기초로 고객 유형별로 고객들을 분류하는 단계;
    상기 분류된 고객의 주식 매매 이력 정보를 이용하여 상기 고객의 보유 종목별로 주식 거래의 최근성, 주식 거래 빈도, 주식 거래 규모별로 평가값을 설정하여 주식 매매 이력을 점수화하는 단계;
    상기 점수화된 주식 매매 이력에 기초하여 수학식 1에 의해 분산값(V)를 최소화하는 고객 그룹 집합 Si를 탐색하여 고객을 분류하는 단계;
    상기 탐색된 고객 그룹 집합 Si별로 분류된 고객들이 매매한 주식 종목과 매매 이력 점수가 일정 범위내로 유사한 고객별로 상기 고객을 분류하여 고객 그룹을 생성하는 단계 및;
    상기 생성된 고객 그룹에 속하는 고객들에게 주식 종목을 추천하는 단계를 포함하고,
    〔수학식 1〕
    Figure 112019016075474-pat00021

    (ui는 i번째 그룹의 중심이 되는 고객의 주식 매매 이력 점수 데이터이고, xj는 각 고객의 주식 매매 이력 점수 데이터이고, Si는 그룹에 속하는 고객의 집합이고, i는 고객 그룹의 번호를 의미하고, j는 그룹에 속하는 고객을 식별하는 변수임)
    인 주식 종목 추천 방법.
  2. 제 1 항에 있어서,
    상기 주식 종목을 추천하는 단계는,
    상기 생성된 고객 그룹에 속한 다른 고객들이 구매하였지만 특정 고객은 구매하지 않은 주식 종목을, 상기 특정 고객에게 추천하는 단계를 포함하는 주식 종목 추천 방법.
  3. 삭제
  4. 제 1 항에 있어서,
    상기 주식 종목을 추천하는 단계는,
    상기 생성된 고객 그룹에 있어서, 고객 계좌 정보를 활용하여 고객 그룹별 구매 이력을 생성하는 단계;
    상기 고객 그룹별 구매 이력을 이용하여 주식 구매의 최근성, 주식 구매 빈도, 주식 구매 규모별로 평가값을 설정하여 주식 구매 이력을 점수화하는 단계;
    상기 생성된 고객 그룹별 구매 이력을 기초로, 상기 그룹별 고객이 공통으로 구매한 주식 종목에 대한 구매 이력 평가값을 수학식 2에 입력하여 고객간의 유사도를 계산하는 단계;
    상기 계산된 유사도를 기초로 상기 고객 그룹 중에서 유사도가 가장 가까운 고객들 순서대로 미리 정해진 인원수만큼 선택하는 단계;
    상기 선택된 고객들 중 다른 고객들이 구매하였지만 특정 고객은 구매하지 않은 주식 종목을, 상기 특정 고객에게 추천하는 단계를 포함하는 주식 종목 추천 방법.
    [수학식 2]
    Figure 112017106438217-pat00008

    (여기서, x,y는 유사도의 계산 대상이 되는 두 고객이고, rx,i 는 공통으로 구매한 주식종목(Ixy)에 대한 고객 x의 점수이고, ry,i 는 공통으로 구매한 주식종목(Ixy)에 대한 고객 y의 점수이고, Ix 는 x가 구매한 주식종목이고, Iy는 y가 구매한 주식종목임.)
  5. 제 4 항에 있어서,
    상기 고객 그룹별 구매 이력을 생성하기 위하여 활용되는 고객 계좌 정보는 종목정보, 거래수량, 매수 평균 단가, 계좌당 거래보유 종목 수에 관한 데이터를 기초로 하는 주식 종목 추천 방법.
  6. 제 1 항에 있어서,
    상기 고객 정보 데이터와 종목 정보 데이터에 기초하여 고객을 분류하는 단계는,
    기존 고객의 경우는 고객 정보 데이터의 고객 거래 정보를 기초로 기본적인 고객 투자 성향을 파악하여 고객을 분류하는 단계;
    신규 고객의 경우는 가입시 작성한 투자 성향 설문을 활용하여 고객을 분류하는 단계를 포함하는 주식 종목 추천 방법.
  7. 제 1 항에 있어서,
    상기 주식 매매 이력 정보는 주식 매매 종목 정보, 주식 매매 종목 단가, 매매 수량, 예수금, 증거금으로 구성되는 주식 종목 추천 방법.
  8. 제 1 항에 있어서,
    상기 주식 매매 이력을 점수화함에 있어서 사용되는 변수는 종목 정보, 종목 단가, 수량, 예수금, 증거금이고,
    상기 주식 거래의 최근성은 소정 기간 내에 유가증권 표준코드로 식별되는 주식 종목을 거래한 시점을 기준으로 점수를 산정하고,
    상기 주식 거래 빈도는 소정 기간 내에 상기 주식 종목의 거래 수량으로 점수를 산정하고,
    상기 주식 거래 규모는 상기 주식 종목의 거래에 사용된 총 금액으로써, 종목 단가에 수량을 곱한 금액에 예수금과 증거금을 합해서 점수를 산정하는 주식 종목 추천 방법.
  9. 컴퓨터에 의해 자동적으로 수행되는 주식종목 추천 시스템에 있어서,
    증권사로부터 고객 거래정보를 포함하는 고객 정보 데이터와 종목 정보 데이터를 입수하는 데이터 입수부;
    상기 입수된 고객 정보 데이터와 종목 정보 데이터를 기초로 고객 유형별로 고객들을 분류하는 고객 분류부;
    상기 분류된 고객의 주식 매매 이력 정보를 이용하여 주식 거래의 최근성, 주식 거래 빈도, 주식 거래 규모 별로 점수를 설정하여 주식 매매 이력을 점수화하는 매매 이력 분류부;
    상기 점수화된 주식 매매 이력에 기초하여 수학식 1에 의해 분산값(V)를 최소화하는 고객 그룹 집합 Si를 탐색하여 고객을 분류하는 고객 그룹 분류부;
    상기 탐색된 고객 그룹 집합 Si별로 분류된 고객들이 매매한 주식 종목과 매매 이력 점수가 일정 범위내로 상기 고객을 분류하여 고객 그룹을 생성하는 고객 그룹 생성부; 및
    상기 생성된 고객 그룹에 속하는 고객들에게 주식 종목을 추천하는 주식 종목 추천부를 포함하고,
    〔수학식 1〕
    Figure 112019016075474-pat00022

    (ui는 i번째 그룹의 중심이 되는 고객의 주식 매매 이력 점수 데이터이고, xj는 각 고객의 주식 매매 이력 점수 데이터이고, Si는 그룹에 속하는 고객의 집합이고, i는 고객 그룹의 번호를 의미하고, j는 그룹에 속하는 고객을 식별하는 변수임)
    인 주식 종목 추천 시스템.
KR1020170140986A 2017-10-27 2017-10-27 유사 성향 고객의 투자 패턴을 이용한 주식 종목 추천 방법 및 이를 이용한 시스템 KR102000519B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170140986A KR102000519B1 (ko) 2017-10-27 2017-10-27 유사 성향 고객의 투자 패턴을 이용한 주식 종목 추천 방법 및 이를 이용한 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170140986A KR102000519B1 (ko) 2017-10-27 2017-10-27 유사 성향 고객의 투자 패턴을 이용한 주식 종목 추천 방법 및 이를 이용한 시스템

Publications (2)

Publication Number Publication Date
KR20190047285A KR20190047285A (ko) 2019-05-08
KR102000519B1 true KR102000519B1 (ko) 2019-07-16

Family

ID=66580318

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170140986A KR102000519B1 (ko) 2017-10-27 2017-10-27 유사 성향 고객의 투자 패턴을 이용한 주식 종목 추천 방법 및 이를 이용한 시스템

Country Status (1)

Country Link
KR (1) KR102000519B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102079232B1 (ko) 2019-06-28 2020-02-19 (주)아키텍처소프트 주식 종목별 추이 분석장치 및 방법
KR102642850B1 (ko) * 2023-06-27 2024-03-04 에이블사이언스파마 주식회사 인공지능 기반 재고량을 고려한 의약품 판매 시스템

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000058811A (ko) * 2000-02-19 2000-10-05 이광재 증권 정보 제공 장치
KR20000036476A (ko) * 2000-03-16 2000-07-05 박진상 주식일임매매 웹사이트의 구성 및 운영방법(증권투자사이트 운영방법), 비지니스 모델에 관한 건
KR20060097499A (ko) * 2005-03-11 2006-09-14 송현종 데이터통신망을 이용한 계좌연동형 주식통합 매매시스템 및그 방법
KR100907744B1 (ko) * 2006-11-13 2009-07-14 에스케이커뮤니케이션즈 주식회사 협업 필터링 시스템 및 그 방법
KR20120007343A (ko) * 2010-07-14 2012-01-20 (주)팍스넷 맞춤형 정보 제공 방법 및 이를 이용한 광고 방법
KR20120032606A (ko) * 2010-09-29 2012-04-06 서석기 증권투자고객 참여 가능 증권투자 시스템 및 그 방법
KR101270090B1 (ko) * 2011-04-19 2013-06-03 삼성증권주식회사 개인화 가능한 리더 투자자 연동 증권거래 시스템 및 그 제공방법
KR20170038412A (ko) * 2015-09-30 2017-04-07 주식회사 쇼앤리 역 크라우드 펀드 운영 방법 및 시스템

Also Published As

Publication number Publication date
KR20190047285A (ko) 2019-05-08

Similar Documents

Publication Publication Date Title
Huang et al. Deep learning in finance and banking: A literature review and classification
US8930247B1 (en) System and methods for content-based financial decision making support
Deng et al. Hybrid method of multiple kernel learning and genetic algorithm for forecasting short-term foreign exchange rates
US20050004862A1 (en) Identifying the probability of violative behavior in a market
Kao et al. An analysis of the market risk to participants in the compound protocol
Aubry et al. Biased auctioneers
Pang et al. Cryptocurrency price prediction using time series and social sentiment data
Liu et al. A gradient-boosting decision-tree approach for firm failure prediction: an empirical model evaluation of Chinese listed companies
Hosker et al. Improving VIX futures forecasts using machine learning methods
KR102000519B1 (ko) 유사 성향 고객의 투자 패턴을 이용한 주식 종목 추천 방법 및 이를 이용한 시스템
Adegboye et al. Algorithmic trading with directional changes
Wellman et al. Strategic agent-based modeling of financial markets
Kaur et al. Application and performance of data mining techniques in stock market: A review
Fulga et al. Portfolio optimization with prior stock selection
KR20240002900A (ko) 데이터 이코노미에서 금융 데이터 가치 측정 방법 및 이러한 방법을 수행하는 장치
Khoa et al. Long Short-Term Memory Recurrent Neural Network for Predicting the Return of Rate Underframe the Fama-French 5 Factor
Fatah et al. Data mining for cryptocurrencies price prediction
Akpan et al. Comprehensive analysis of non-fungible tokens valuation and accounting under IFRS: challenges and artificial intelligence implications
Rose et al. Automated Stock Market Trading Using Machine Learning
Tran et al. Bilinear input normalization for neural networks in financial forecasting
Tu An application of web‐based data mining: selling strategies for online auctions
Shvimer et al. Comparative empirical study of binomial call-option pricing methods using S&P 500 index data
Teimoori-Boghsani et al. Effectiveness of Stop-Loss Trading Strategy VS Buy-And-Hold Strategy
Liu et al. Enhancing financial decision-making using social behavior modeling
Deepa et al. Identification of persisting trend in the Indian stock markets using AI

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant