KR102339793B1 - Han 기반의 상품 추천 장치 및 방법 - Google Patents

Han 기반의 상품 추천 장치 및 방법 Download PDF

Info

Publication number
KR102339793B1
KR102339793B1 KR1020210069471A KR20210069471A KR102339793B1 KR 102339793 B1 KR102339793 B1 KR 102339793B1 KR 1020210069471 A KR1020210069471 A KR 1020210069471A KR 20210069471 A KR20210069471 A KR 20210069471A KR 102339793 B1 KR102339793 B1 KR 102339793B1
Authority
KR
South Korea
Prior art keywords
data
unit
input
vector
recommendation
Prior art date
Application number
KR1020210069471A
Other languages
English (en)
Inventor
정효용
윤창오
김은지
정민성
보아동
지성영
Original Assignee
주식회사 애자일소다
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 애자일소다 filed Critical 주식회사 애자일소다
Priority to KR1020210069471A priority Critical patent/KR102339793B1/ko
Application granted granted Critical
Publication of KR102339793B1 publication Critical patent/KR102339793B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Technology Law (AREA)
  • Operations Research (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

HAN 기반의 상품 추천 장치 및 방법을 개시한다. 본 발명은 계층적 네트워크(Hierarchical Network)를 기반으로 사용자의 행동 정보를 이벤트 발생 순서에 따라 분석하여 추천 정보를 제공함으로써, 추천 모델의 성능을 개선할 수 있다.

Description

HAN 기반의 상품 추천 장치 및 방법{APPARATUS AND METHOD FOR RECOMMENDING PRODUCTS BASED ON HIERARCHICAL ATTENTION NETWORK}
본 발명은 HAN 기반의 상품 추천 장치 및 방법에 관한 발명으로서, 더욱 상세하게는 계층적 네트워크(Hierarchical Network)를 기반으로 사용자의 행동 정보를 이벤트 발생 순서에 따라 분석하여 추천 모델의 성능을 개선한 HAN 기반의 상품 추천 장치 및 방법에 관한 것이다.
고객에게 상품을 추천함에 있어, 다양한 추천 알고리즘 기술을 활용하려는 움직임이 발생하고 있다.
그러나, 과거의 추천 알고리즘인 협업 필터링(Collaborative Filtering) 기법은 새로운 패턴에 대한 추천이 어렵다는 단점이 있고, 과거의 추천 알고리즘인 콘텐츠 기반 필터링(Contents Based Filtering) 기법은 추천되는 상품의 다양성이 떨어진다는 단점이 있어, 과거의 추천 알고리즘들을 복잡하고 정교한 상품에 적용하기에는 다소 어려움이 있다.
이에 따라, 최근에는 딥러닝(Deep Learning) 기술을 이용하여 고객에게 적합한 상품을 맞춤형으로 추천하는 기술에 대한 연구가 주목받고 있다.
일반적으로, 딥러닝 기술은 인공지능 기술 중 하나로 컴퓨터가 데이터 축적을 통해 인간의 학습능력을 지니도록 할 수 있다.
이러한 딥러닝 기술이 접목된 새로운 추천 알고리즘을 상품에 적용하게 되면, 사람들의 개인정보 및 상품에 대한 구매이력 등의 데이터를 축적함으로써, 정확도 높은 분석이 가능하게 되어 개인별 맞춤형 상품을 추천할 수 있게 된다.
따라서, 딥러닝 기술이 접목된 새로운 추천 알고리즘을 상품에 적용하여 개인별 맞춤형 상품을 추천할 수 있도록 하는 기법에 대한 연구가 필요하다.
한국 공개특허공보 공개번호 제10-2021-0028365호(발명의 명칭: 인공지능 기반의 기계학습을 통한 사용자 맞춤형 상품 추천 장치)
이러한 문제점을 해결하기 위하여, 본 발명은 계층적 네트워크(Hierarchical Network)를 기반으로 사용자의 행동 정보를 이벤트 발생 순서에 따라 분석하여 추천 모델의 성능을 개선한 HAN 기반의 상품 추천 장치 및 방법을 제공하는 것을 목적으로 한다.
상기한 목적을 달성하기 위하여 본 발명의 일 실시 예는 HAN 기반의 상품 추천 장치로서, 일정 기간 단위로 구분된 임의의 이벤트 데이터와 임의의 사용자 프로파일 데이터가 입력되면, 서로 다른 머신러닝 네트워크를 이용하여 상품 추천 정보를 예측하되, 상기 서로 다른 머신러닝 네트워크는 이벤트 데이터를 일정 기간 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제1 네트워크와, 사용자 프로파일 데이터를 일 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제2 네트워크가 병렬로 구성되고, 상기 제1 및 제2 네트워크는 양방향 GRU(Gated Recurrent Unit)를 통해 발생 순서에 대한 내용을 반영하며, 상기 발생 순서에 대한 내용이 반영된 이벤트 데이터와 사용자 프로파일 데이터의 벡터 값을 더하여 추천 정보를 출력하는 추천 모델부;를 포함하는 것을 특징으로 한다.
또한, 상기 실시 예에 따른 제1 네트워크는 HAN(Hierarchical Attention Networks) 아키텍처를 기반으로 이벤트 데이터를 구분하는 것을 특징으로 한다.
또한, 상기 실시 예에 따른 이벤트 데이터는 행동, 날짜 및 횟수를 포함하는 시간 단위 데이터이고, 상기 사용자 프로파일 데이터는 항목 및 항목 값을 포함하는 정형 데이터인 것을 특징으로 한다.
또한, 상기 실시 예에 따른 행동은 증권사의 계좌 개설, 수수료 문의, 환율 문의, 종목 추천 검색, 실시간 시세 검색, 환전 우대 검색, 수익률 검색, 급등주 검색, 성장주 검색, 저평가주 검색, 테마주 검색, 매도/매수 요청, 관심 종목 검색 중 적어도 하나이고, 상기 날짜는 증권사를 이용한 날짜이며, 상기 횟수는 증권사를 이용한 횟수이고, 상기 항목은 나이, 투자 기간 및 투자 종목수 중 적어도 하나이며, 상기 항목 값은 나이, 투자 기간 및 투자 종목수 중 적어도 하나를 포함한 수치이고, 상기 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 주식 투자 상품인 것을 특징으로 한다.
또한, 상기 실시 예에 따른 행동은 전자 상거래 업체에서 구매에 의해 발생된 구매 상품명이고, 상기 날짜는 전자 상거래 업체를 이용한 날짜이며, 상기 횟수는 전자 상거래 업체를 이용한 횟수이고, 상기 항목은 나이, 구매 금액, 과거 방문일 및 구매 횟수 중 적어도 하나 이며, 상기 항목 값은 나이, 구매 금액, 과거 방문일 및 구매 횟수 중 적어도 하나를 포함하는 수치이며, 상기 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 구매 추천 상품인 것을 특징으로 한다.
또한, 상기 실시 예에 따른 행동은 사용자의 카드 사용에 따른 카드 사용 내역 정보 중 상품을 구매한 상품명 또는 가맹점의 이름 중 어느 하나이고, 상기 날짜는 가맹점을 이용한 날짜이며, 상기 횟수는 가맹점을 이용한 횟수이고, 상기 항목은 나이 및 성별 중 적어도 하나이며, 상기 항목 값은 나이 및 성별 중 적어도 하나를 포함하는 수치이고, 상기 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 카드 상품인 것을 특징으로 한다.
또한, 상기 실시 예에 따른 행동은 가맹점에서 결제에 따른 가맹점 결제 내역 정보 중 이용한 업종 정보 또는 가맹점 이름 중 어느 하나이고, 상기 날짜는 가맹점을 이용한 날짜이며, 상기 횟수는 가맹점을 이용한 횟수이고, 상기 항목은 상기 고객의 나이 및 성별 중 적어도 하나이며, 상기 항목 값은 고객의 나이 및 성별 중 적어도 하나를 포함하는 수치이고, 상기 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 카드 가맹점 정보인 것을 특징으로 한다.
또한, 상기 실시 예에 따른 행동은 사용자가 컨텐츠 데이터의 사용에 따라 시청한 프로그램 이름이고, 상기 날짜는 프로그램을 시청한 날짜이며, 상기 횟수는 프로그램을 시청한 횟수이고, 상기 항목은 고객의 나이 및 성별 중 적어도 하나이며, 상기 항목 값은 고객의 나이 및 성별 중 적어도 하나를 포함하는 수치이고, 상기 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 프로그램인 것을 특징으로 한다.
또한, 상기 실시 예에 따른 입력부는 입력 데이터 중에서 텍스트 기반의 데이터를 인식하여 텍스트만 추출하여 출력하는 텍스트 입력부; 및 상기 입력 데이터 중에서 데이터 개체(Entity), 속성(Attribute), 관계(Relationship)에 따른 스키마(Schema) 형태, 연산 가능 여부, 데이터 특성, 숫자 및 범주형 데이터 중 적어도 하나로 이루어진 정형 데이터를 추출하여 출력하는 정형 데이터 입력부;를 포함하는 것을 특징으로 한다.
또한, 상기 실시 예에 따른 입력부는 입력된 데이터에서 음성 기반의 데이터를 인식하면, 상기 음성 기반의 데이터를 텍스트 데이터로 변환하여 텍스트만 추출하는 STT 입력부를 더 포함하는 것을 특징으로 한다.
또한, 상기 실시 예에 따른 추천 모델부는 입력된 이벤트 데이터를 임베딩을 통해 벡터 값으로 변환하고, 변환된 이벤트 데이터를 HAN(Hierarchical Attention Networks) 아키텍처를 기반으로 일정 기간 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제1 네트워크부; 입력된 사용자 프로파일 데이터를 임베딩을 통해 벡터 값으로 변환하고, 변환된 사용자 프로파일 데이터를 HAN(Hierarchical Attention Networks) 아키텍처를 기반으로 시간 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제2 네트워크부; 및 상기 제1 네트워크부와 제2 네트워크부를 통해 출력되는 벡터 값을 합한 연산 결과를 출력하는 연산부;를 포함하는 것을 특징으로 한다.
또한, 상기 실시 예에 따른 추천 모델부는 연산부에서 출력되는 연산 결과가 입력 벡터로 입력되기 전 입력 벡터와 입력 벡터들 사이의 어텐션(Attention)을 구하여 입력 자체에 상황을 인코딩하는 어텐션 스코어(Attention Score)를 산출하여 출력하는 제3 네트워크를 더 포함하는 것을 특징으로 한다.
또한, 상기 실시 예에 따른 추천 모델부를 통해 예측된 추천 정보를 출력하는 출력부를 더 포함하는 것을 특징으로 한다.
또한, 본 발명의 일 실시 예는 HAN 기반의 상품 추천 방법으로서, a) 입력부가 임의의 데이터를 입력받으면, 이벤트 데이터와 사용자 프로파일 데이터로 분류하는 단계; 및 b) 분류 처리부가 분류된 이벤트 데이터와 사용자 프로파일 데이터를 일정 기간 단위로 구분하고, 추천 모델부가 구분된 이벤트 데이터와 사용자 프로파일 데이터를 입력받아 서로 다른 머신러닝 네트워크를 이용하여 상품 추천 정보를 예측하는 단계;를 포함하고, 상기 서로 다른 머신러닝 네트워크는 이벤트 데이터를 일정 기간 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제1 네트워크와, 사용자 프로파일 데이터를 일 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제2 네트워크가 병렬로 구성되며, 상기 제1 및 제2 네트워크는 양방향 GRU(Gated Recurrent Unit)를 통해 발생 순서에 대한 내용을 반영하며, 상기 발생 순서에 대한 내용이 반영된 이벤트 데이터와 사용자 프로파일 데이터의 벡터 값을 기반으로 예측된 추천 정보를 출력하는 것을 특징으로 한다.
또한, 상기 실시 예에 따른 제1 네트워크는 HAN(Hierarchical Attention Networks) 아키텍처를 기반으로 이벤트 데이터를 구분하는 것을 특징으로 한다.
또한, 상기 실시 예에 따른 상품 추천 정보를 예측하는 단계는 추천 모델부가 셀프 어텐션(Self-Attention)을 기반으로 어텐션 스코어(Attention Score)를 산출하여 출력하는 단계를 더 포함하는 것을 특징으로 한다.
또한, 상기 실시 예에 따른 추천 모델부가 예측된 추천 정보를 출력부를 통해 출력하는 단계;를 더 포함하는 것을 특징으로 한다.
본 발명은 계층적 네트워크(Hierarchical Network)를 기반으로 사용자의 행동 정보를 이벤트 발생 순서에 따라 분석하여 추천 정보를 제공함으로써, 추천 모델의 성능을 개선할 수 있는 장점이 있다.
도1은 본 발명의 일 실시 예에 따른 HAN 기반의 상품 추천 장치를 나타낸 블록도.
도2는 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 입력부 구성을 나타낸 블록도.
도3은 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 분류 모델부 구성을 나타낸 블록도.
도4는 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 HAN 아키텍처를 나타낸 예시도.
도5는 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 추천 모델부 구성을 나타낸 블록도.
도6은 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 제3 네트워크부 구성을 나타낸 블록도.
도7은 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 주식투자 상품 추천과정을 설명하기 위해 나타낸 예시도.
도8은 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 전자 상거래 업체의 상품 추천 과정을 설명하기 위해 나타낸 예시도.
도9는 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 카드 상품 추천 과정을 설명하기 위해 나타낸 예시도.
도10은 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 가맹점 상품 추천 과정을 설명하기 위해 나타낸 예시도.
도11은 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 OTT 상품 추천 과정을 설명하기 위해 나타낸 예시도.
도12는 본 발명의 일 실시 예에 따른 HAN 기반의 상품 추천 방법을 설명하기 위해 나타낸 흐름도.
이하에서는 본 발명의 바람직한 실시 예 및 첨부하는 도면을 참조하여 본 발명을 상세히 설명하되, 도면의 동일한 참조부호는 동일한 구성요소를 지칭함을 전제하여 설명하기로 한다.
본 발명의 실시를 위한 구체적인 내용을 설명하기에 앞서, 본 발명의 기술적 요지와 직접적 관련이 없는 구성에 대해서는 본 발명의 기술적 요지를 흩뜨리지 않는 범위 내에서 생략하였음에 유의하여야 할 것이다.
또한, 본 명세서 및 청구범위에 사용된 용어 또는 단어는 발명자가 자신의 발명을 최선의 방법으로 설명하기 위해 적절한 용어의 개념을 정의할 수 있다는 원칙에 입각하여 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 할 것이다.
본 명세서에서 어떤 부분이 어떤 구성요소를 "포함"한다는 표현은 다른 구성요소를 배제하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다.
또한, "‥부", "‥기", "‥모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어, 또는 그 둘의 결합으로 구분될 수 있다.
또한, "적어도 하나의" 라는 용어는 단수 및 복수를 포함하는 용어로 정의되고, 적어도 하나의 라는 용어가 존재하지 않더라도 각 구성요소가 단수 또는 복수로 존재할 수 있고, 단수 또는 복수를 의미할 수 있음은 자명하다 할 것이다.
또한, 각 구성요소가 단수 또는 복수로 구비되는 것은, 실시 예에 따라 변경가능하다 할 것이다.
이하, 첨부된 도면을 참조하여 본 발명의 일 실시 예에 따른 HAN 기반의 상품 추천 장치 및 방법의 바람직한 실시 예를 상세하게 설명한다.
도1은 본 발명의 일 실시 예에 따른 HAN 기반의 상품 추천 장치를 나타낸 블록도이고, 도2는 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 입력부 구성을 나타낸 블록도이며, 도3은 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 분류 모델부 구성을 나타낸 블록도이고, 도4는 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 HAN 아키텍처를 나타낸 예시도이며, 도5는 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 추천 모델부 구성을 나타낸 블록도이고, 도6은 도1의 실시 예에 따른 HAN 기반의 상품 추천 장치의 제3 네트워크부 구성을 나타낸 블록도이다.
도1 내지 도6을 참조하면, 본 발명의 일 실시 예에 따른 HAN 기반의 상품 추천 장치(100)는, 계층적 네트워크(Hierarchical Network)를 기반으로 사용자의 행동 정보를 이벤트 발생 순서에 따라 분석하여 추천 모델의 성능이 개선될 수 있도록 일정 기간 단위로 구분된 임의의 이벤트 데이터와 임의의 사용자 프로파일 데이터가 입력되면, 서로 다른 머신러닝 네트워크를 이용하여 상품 추천 정보를 예측한다.
또한, 본 발명의 일 실시 예에 따른 상품 추천 장치(100)는 머신러닝 네트워크가 이벤트 데이터를 일정 기간 단위 - 이때, 기간 단위는 예를 들어, 시간 단위, 일 단위 임 - 로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제1 네트워크와, 사용자 프로파일 데이터를 일 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제2 네트워크가 병렬로 구성될 수 있다.
또한, 본 발명의 일 실시 예에 따른 상품 추천 장치(100)는 제1 네트워크 및 제2 네트워크가 양방향 GRU(Gated Recurrent Unit)를 통해 발생 순서에 대한 내용을 반영하도록 구성될 수 있다.
또한, 본 발명의 일 실시 예에 따른 상품 추천 장치(100)는 발생 순서에 대한 내용이 반영된 이벤트 데이터와 사용자 프로파일 데이터의 벡터 값을 더하여 예측된 추천 정보를 출력하도록 입력부(110)와, 분류 처리부(120)와, 추천 모델부(130)와, 출력부(140)를 포함하여 구성될 수 있다.
입력부(110)는 임의의 입력 데이터가 입력되면 텍스트만을 추출하고, 추출된 텍스트를 정형 데이터와 비정형 데이터로 분류하여 데이터 처리부(120)로 출력하는 구성으로서, 텍스트 입력부(111)와, 정형 데이터 입력부(112)를 포함하여 구성될 수 있다.
예를 들어, "A 카드사 100만 원"이 입력 데이터로 입력되면, 입력 내용을 단순히 비정형 데이터인 이벤트 데이터에 기반하여 분류하는 경우, 정확한 분류가 이루어지지 못하게 된다.
따라서, 입력부(110)는 입력 데이터로부터 주기성, 금액, 결제, 취소 환불 등을 추가 파악하여 예를 들어, "A 카드사로부터 100만 원이 결제 취소에 따라 입금된 환불금"과 같이 입력 데이터의 정확한 분류가 이루어질 수 있도록 한다.
텍스트 입력부(111)는 입력 데이터를 분석하여 텍스트 기반의 데이터로 인식되면, 입력 데이터로부터 텍스트만을 추출하여 출력한다.
또한, 텍스트 입력부(111)는 텍스트 데이터와 함께, 예를 들어, 주기성, 비용, 결제 요청, 결제 승인, 결제 취소 등의 추출된 텍스트의 내용을 파악하여 분류에 활용할 수 있는 이벤트 데이터와 사용자 프로파일 데이터를 추출할 수도 있다.
또한, 입력부(110)는 입력 데이터를 분석하여 음성 기반의 데이터가 인식되면, STT(Speech To Text)를 이용하여 입력된 음성 기반의 데이터를 텍스트 데이터로 변환하고, 변환된 텍스트 데이터를 인식하여 텍스트만을 추출한 데이터를 출력하는 STT 입력부(111a)가 추가 구성될 수도 있다.
또한, STT 입력부(111a)는 텍스트 데이터와 함께, 음성 데이터의 시간, 음성 발화자의 목소리 높낮이, 음성 발화자의 나이, 음성 기반 데이터의 분류 카테고리 등의 사용자 프로파일 데이터를 추출할 수도 있다.
정형 데이터 입력부(112)는 입력 데이터 중에서 예를 들어, 데이터 개체(Entity), 속성(Attribute), 관계(Relationship) 등의 스키마(Schema) 형태, 연산 가능 여부, 데이터 특성, 숫자 및 범주형 데이터 등에 따라 정형 데이터를 추출하여 사용자 프로파일 데이터로 출력한다.
정형 데이터(Structured Data)는 미리 정해 놓은 형식과 구조에 따라 저장되도록 구성하여 고정된 필드에 저장된 데이터로서, 관계형 데이터베이스의 테이블 형태로 저장될 수 있다.
또한, 정형 데이터는 정해진 형식과 저장 구조를 바탕으로 쉽게 데이터에 대한 부분 검색 및 선택, 갱신, 삭제 등의 연산을 수행할 수 있다.
비정형 데이터(Unstructured Data)는 일반적으로 문서가 있고, 문서는 텍스트 중심으로 되어 구성될 수 있으며, 날짜, 숫자, 사실, 도표, 그림과 같은 데이터도 포함할 수 있다.
또한, 비정형 데이터는 텍스트 마이닝, 웹 마이닝, 오피니언 마이닝 또는 파일인 경우 파일을 데이터 형태로 파싱해야 하기 때문에 수집 데이터 처리가 어렵다
또한, 비정형 데이터는 규격화의 어려움이 있어 저장, 관리의 어려움이 있으며, 대규모로 저장된 데이터 안에서 체계적이고 자동으로 통계적 규칙이나 패턴을 분석하여 가치 있는 정보를 추출하여 분석할 수 있다.
또한, 비정형 데이터는 일정 집단에 대하여 미리 정의된 특성 정의를 통해 분류(Classification) 및 구분을 추론할 수 있고, 구체적인 특성을 공유하는 군집화(Clustering)와, 동시에 발생한 사건 간의 관계를 정의하는 연관성(Association)과, 대용량 데이터 집합 내의 패턴을 기반으로 미래를 예측하는 연속성(Forecasting) 등을 통해 이벤트 데이터로서의 특성 값을 설정할 수 있다.
분류 처리부(120)는 이벤트 데이터와 사용자 프로파일 데이터로 분류하고, 이벤트 데이터는 일정 기간 단위로 구분하는 분류 모델부(121)와, 입력된 데이터를 적절한 형식으로 변환하는 전처리 과정을 수행하는 데이터 전처리부(122)를 포함하여 구성될 수 있다.
추천 모델부(130)는 일정 기간 단위로 구분된 임의의 이벤트 데이터와 임의의 사용자 프로파일 데이터가 입력되면, 서로 다른 머신러닝 네트워크를 이용하여 상품 추천 정보를 예측한다.
여기서, 머신러닝 네트워크는 이벤트 데이터를 일정 기간 단위 - 이때, 기간 단위는 시간 단위, 일 단위 임 - 로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제1 네트워크와, 사용자 프로파일 데이터를 일 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제2 네트워크가 병렬로 구성될 수 있다.
또한, 제1 네트워크와 제2 네트워크는 양방향 GRU(Gated Recurrent Unit)를 통해 발생 순서에 대한 내용이 반영될 수 있도록 구성되는 것이 바람직하다.
또한, 추천 모델부(130)는 발생 순서에 대한 내용이 반영된 이벤트 데이터와 사용자 프로파일 데이터의 벡터 값은 더하여 추천 정보로 출력할 수 있도록 제1 네트워크부(131)와, 제2 네트워크부(132)와, 연산부(133)와, 제3 네트워크부(134)와, 분류기(135)를 포함하여 구성될 수 있다.
제1 네트워크부(131)는 입력된 이벤트 데이터를 벡터 값으로 변환하여 출력하는 구성으로서, 제1 임베딩 레이어(131a)와, 제1 시간 단위 레이어(131b)와, 제1 일 단위 레이어(131c)가 계층적으로 구성된 HAN(Hierarchical Attention Networks) 아키텍처를 기반으로 구성될 수 있다.
HAN 아키텍처에서 임베딩으로는 Event Embedding을 사용하고, GRU를 통과한 각 단어 벡터에 어텐션 레이어의 이벤트별 가중치를 적용하여 합한 값이 문장 벡터가 된다.
이후, 단어에서 문장으로 진행된 과정을 Event Embedding 대신 앞에서 구한 시간 단위 이벤트 벡터를 이용하여 일 단위 이벤트 벡터를 구하고, 구한 일 단위 이벤트 벡터에 소프트 맥스(softmax)를 적용하여 확률을 구한다.
여기서, 소프트 맥스는 입력받은 값을 출력으로 0~1 사이의 값으로 모두 정규화하며, 출력 값들의 총합은 항상 1이 되는 특성을 가진 함수이다.
또한, HAN 아키텍처는 도4에 나타낸 바와 같이, 서브 네트워크로 시간 단위 이벤트 인코더(Hour Event Encoder), 시간 단위 이벤트 어텐션(Hour Event Attention), 일 단위 인코더(Day Encoder), 일 단위 어텐션(Day Attention), 그리고 분류기로 구성될 수 있다.
즉, HAN 구조는 어텐션 메커니즘 두개를 겹쳐 놓은 것과 동일하고, 이벤트 레벨에서는 GRU를 통과한 각 이벤트 벡터에 어텐션 레이어의 이벤트별 가중치를 적용하여 합한 값이 일 단위 이벤트 벡터가 된다.
또한, 문장 레벨에서 이전에 얻은 문장 벡터에 어텐션 레이어의 일 단위별 가중치를 적용하여 합한 것에 대한 전체 이벤트 벡터를 만들고, 만들어진 전체 이벤트 벡터에 소프트 맥스를 적용하여 확률 값을 구하게 되는 구조이다.
제1 임베딩 레이어(131a)는 입력된 이벤트 데이터가 임베딩을 통해 제1 임베딩 벡터(131a') 값으로 변환되도록 한다.
제1 시간 단위 레이어(131b)는 복수의 제1 임베딩 벡터(131a')들을 시간 단위로 구분하여 제1 임베딩 벡터(131a')에 대한 제1 시간 단위 벡터(131b')를 만들어 출력한다.
제1 일 단위 레이어(131c)는 제1 시간 단위 벡터(131b')들을 일 단위로 구분하여 제1 시간 단위 벡터(131b')에 대한 제1 일 단위 벡터(131c')를 만든다.
제2 네트워크부(132)는 입력된 사용자 프로파일 데이터를 임베딩을 통해 벡터 값으로 변환하고, 변환된 사용자 프로파일 데이터를 HAN(Hierarchical Attention Networks) 아키텍처를 기반으로 시간 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 구성으로서, 제2 임베딩 레이어(132a)와, 제2 시간 단위 레이어(132b)를 포함하여 구성될 수 있다.
제2 임베딩 레이어(132a)는 입력된 사용자 프로파일 데이터가 임베딩을 통해 제2 임베딩 벡터(132a') 값으로 변환되도록 한다.
제2 시간 단위 레이어(132b)는 복수의 제2 임베딩 벡터(132a')들을 시간 단위로 구분하여 제2 임베딩 벡터(132a')에 대한 제2 시간 단위 벡터(132b')를 만들어 출력한다.
연산부(133)는 제1 네트워크부(131)와 제2 네트워크부(132)를 통해 출력되는 벡터 값을 합하여 연산한 결과를 출력한다.
한편, 본 발명의 실시 예에 따른 입력 데이터는 행동과 같은 이벤트 데이터와 날짜 및 횟수를 포함한 항목 및 항목 값 등의 사용자 프로파일 데이터를 포함하여 구성될 수 있다.
여기서, 행동은 사용자의 액션(Action)에 의해 발생된 로그로서, 사용자가 행동한 결과로 쌓인 정보, 예를 들어, 가맹점 정보, 업종, 금액 등의 로그 기록일 수 있다.
이를 더욱 상세하게 설명하면, 행동은 도7과 같이 이벤트의 발생 순서에 따라 증권사의 계좌 개설, 수수료 문의, 환율 문의, 종목 추천 검색, 실시간 시세 검색, 환전 우대 검색, 수익률 검색, 급등주 검색, 성장주 검색, 저평가주 검색, 테마주 검색, 매도/매수 요청, 관심 종목 검색 중 적어도 하나일 수 있고, 날짜는 증권사를 이용한 날짜 또는 행동의 발생 날짜일 수 있으며, 횟수는 증권사를 이용한 횟수 또는 행동을 실행한 횟수일 수 있고, 이러한 정보들은 제1 네트워크부의 입력 값으로 제공될 수 있다.
또한, 항목은 사용자 프로파일 데이터로서 나이, 투자 기간 및 투자 종목 수 중 적어도 하나일 수 있고, 항목 값은 나이, 투자 기간 및 투자 종목 수 중 적어도 하나를 포함한 수치일 수 있으며, 이러한 정보들은 제2 네트워크부의 입력 값으로 제공될 수 있다.
또한, 제1 네트워크부와 제2 네트워크부의 출력 벡터를 연산한 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 주식 투자 상품일 수 있다.
또한, 도8과 같이 행동은 전자 상거래 업체에서 구매에 의해 발생된 구매 상품명일 수 있고, 날짜는 전자 상거래 업체를 이용한 날짜일 수 있으며, 횟수는 전자 상거래 업체를 이용한 횟수일 수 있고, 이러한 정보들은 제1 네트워크부의 입력 값으로 제공될 수 있다.
또한, 항목은 사용자 프로파일 데이터로서, 나이, 구매 금액, 과거 방문일 및 구매 횟수 중 적어도 하나일 수 있고, 항목 값은 나이, 구매 금액, 과거 방문일 및 구매 횟수 중 적어도 하나를 포함하는 수치일 수 있으며, 제2 네트워크부의 입력 값으로 제공될 수 있다.
또한, 제1 네트워크부와 제2 네트워크부의 출력 벡터를 연산한 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 추천 정보는 구매 추천 상품일 수 있다.
또한, 도9와 같이, 행동은 사용자의 카드 사용에 따른 카드 사용 내역 정보 중 상품을 구매한 상품명 또는 가맹점의 이름 중 어느 하나일 수 있고, 날짜는 가맹점을 이용한 날짜일 수 있으며, 횟수는 가맹점을 이용한 횟수일 수 있고, 제1 네트워크부의 입력 값으로 제공될 수 있다.
또한, 항목은 나이 및 성별 중 적어도 하나일 수 있고, 항목 값은 나이 및 성별 중 적어도 하나를 포함하는 수치일 수 있으며, 제2 네트워크부의 입력 값으로 제공될 수 있다.
또한, 제1 네트워크부와 제2 네트워크부의 출력 벡터를 연산한 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 카드 상품일 수 있다.
또한, 도10과 같이 행동은 가맹점에서 결제에 따른 가맹점 결제 내역 정보 중 이용한 업종 또는 가맹점 이름 중 어느 하나일 수 있고, 날짜는 가맹점을 이용한 날짜일 수 있으며, 횟수는 가맹점을 이용한 횟수일 수 있고, 제1 네트워크부의 입력 값으로 제공될 수 있다.
또한, 항목은 고객의 나이 및 성별 중 적어도 하나일 수 있고, 항목 값은 고객의 나이 및 성별 중 적어도 하나를 포함하는 수치일 수 있으며, 제2 네트워크부의 입력 값으로 제공될 수 있다.
또한, 제1 네트워크부와 제2 네트워크부의 출력 벡터를 연산한 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 카드 가맹점 정보일 수 있다.
또한, 도11과 같이 행동은 사용자가 컨텐츠 데이터의 사용에 따라 시청한 프로그램 이름일 수 있고, 날짜는 프로그램을 시청한 날짜일 수 있으며, 횟수는 프로그램을 시청한 횟수일 수 있고, 제1 네트워크부의 입력 값으로 제공될 수 있다.
또한, 항목은 고객의 나이 및 성별 중 적어도 하나일 수 있고, 항목 값은 고객의 나이 및 성별 중 적어도 하나를 포함하는 수치일 수 있으며, 제2 네트워크부의 입력 값으로 제공될 수 있다.
또한, 제1 네트워크부와 제2 네트워크부의 출력 벡터를 연산한 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 프로그램일 수 있다.
한편, 본 실시 예에서는 설명의 편의를 위해 상기된 행동과 그에 대응하는 항목 및 항목 값을 이용하여 기재하였지만, 이에 한정되는 것은 아니고, 영화 추천, 음식 메뉴 추천, 맛집 또는 음식점 추천, 여행지 추천, 데이터 코스 추천, 자동차 추천, 매입 주택 추천, 매입 건물 추천, 전세물 추천, 금융 상품 추천, 채용 직원 추천, 외주사 추천, 공급 업체 추천, 진학 학교 추천, 학원 추천, 결혼 상대 추천, 호텔 추천, 항공 예약 추천, 선박 예약 추천, 가전제품 추천, 전자기기 추천, 변호사 추천, 변리사 추천, 전문의 추천, 전문가 추천, 학원 강사 추천, 서적 추천, 병원 추천, 게임 추천, 소프트웨어 추천 등 다양한 행동들에 대하여 예측된 결과를 제공할 수도 있다.
다시 도1 내지 도6을 참조하면, 제3 네트워크부(134)는 연산부(133)에서 출력되는 연산 결과가 입력 벡터로 입력되기 전에 입력 벡터와 입력 벡터들 사이의 어텐션(Attention)을 구하여 입력 자체에 상황을 인코딩하는 어텐션 스코어(Attention Score)를 산출하여 출력할 수 있다.
즉, 임의의 주어진 입력 벡터에 어떠한 처리를 통해 '상황'이 담긴 벡터를 출력하는 경우, RNN 레이어(134a)로 입력 상황을 부여하여 벡터 행렬 곱(134c)을 수행할 때, 현재 디코더의 시점에서 추천 정보를 예측하기 위해 인코더의 모든 은닉 상태 각각이 디코더의 현시점의 은닉 상태와 얼마나 유사한지를 판단한 어텐션 스코어(134b)를 산출하여 제공함으로써, 추천 정보에 대한 이유를 알 수 있도록 한다.
분류기(135)는 Classifier를 기반으로 출력되는 벡터 값에 따라 추천 항목을 분류한다.
출력부(140)는 추천 모델부(130)를 통해 예측된 추천 정보를 시각적, 청각적으로 인식할 수 있도록 출력한다.
다음은 본 발명의 일 실시 예에 따른 HAN 기반의 상품 추천 방법을 설명한다.
도12는 본 발명의 일 실시 예에 따른 HAN 기반의 상품 추천 방법을 설명하기 위해 나타낸 흐름도로서, 도1 내지 도6과 도12를 참조하여 설명한다.
입력부(110)가 임의의 데이터를 입력받으면, 입력 데이터로부터 텍스트만을 추출하고, 추출된 텍스트를 정형 데이터인 사용자 프로파일 데이터와 비정형 데이터인 이벤트 데이터로 분류(S100)한다.
S100 단계에서, 입력부(110)는 입력 데이터를 분석하여 텍스트 기반의 데이터로 인식되면, 입력 데이터로부터 텍스트만을 추출할 수 있다.
한편, S100 단계에서 입력부(100)는 입력 데이터가 음성 기반의 데이터로 인식되는 경우, 입력된 음성 기반의 데이터를 텍스트 데이터로 변환하여 변환된 텍스트 데이터를 인식하여 텍스트만을 추출할 수도 있다.
이때, 입력부(110)는 추출된 텍스트를 분석하여 예를 들어, 데이터 개체(Entity), 속성(Attribute), 관계(Relationship) 등의 스키마(Schema) 형태, 연산 가능 여부, 데이터 특성 등에 따라 데이터를 비정형 데이터인 이벤트 데이터와 정형 데이터인 사용자 프로파일 데이터로 분류할 수 있다.
S100 단계에서 분류된 사용자 프로파일 데이터와 이벤트 데이터는 분류 처리부(120)에서 이벤트 데이터와 사용자 프로파일 데이터를 일정 기간 단위로 구분하고, 추천 모델부(130)는 구분된 이벤트 데이터와 사용자 프로파일 데이터를 입력받아 서로 다른 머신러닝 네트워크를 이용하여 상품 추천 정보를 예측(S200, S300)한다.
즉, S200 단계에서, 머신러닝 네트워크는 추천 모델부(130)의 제1 네트워크부(131)를 통해 이벤트 데이터를 일정 기간 단위 - 이때, 기간 단위는 시간 단위, 일 단위 임 - 로 구분한 입력 값을 사용하여 벡터 값으로 변환하고, 양방향 GRU(Gated Recurrent Unit)를 통해 발생 순서에 대한 내용을 반영하여 발생 순서에 대한 내용이 반영된 이벤트 데이터의 벡터 값을 기반으로 추천 정보를 예측한다.
또한, GRU를 통과한 각 이벤트 벡터에 어텐션 레이어의 이벤트별 가중치를 적용하여 합한 값이 일 단위 이벤트 벡터가 될 수 있도록 하고, 이전에 얻은 벡터에 어텐션 레이어의 일 단위별 가중치를 적용하여 합한 것에 대한 전체 이벤트 벡터를 만들고, 만들어진 전체 이벤트 벡터에 소프트 맥스를 적용하여 확률 값을 구한다.
또한, S300 단계에서, 머신러닝 네트워크는 추천 모델부(130)의 제2 네트워크부(132)를 통해 사용자 프로파일 데이터를 시간 단위(또는 일 단위)로 구분한 입력 값을 사용하여 벡터 값으로 변환하고, 양방향 GRU(Gated Recurrent Unit)를 통해 발생 순서에 대한 내용을 반영하여 발생 순서에 대한 내용이 반영된 사용자 프로파일 데이터의 벡터 값을 기반으로 추천 정보를 예측한다.
계속해서, 추천 모델부(130)는 추천 정보에 대한 이유를 알 수 있도록 어텐션 메커니즘(Attention Mechanism)을 기반으로 GRU 레이어(134a)로 입력 상황을 부여하고 벡터 행렬 곱(134c)을 수행할 때, 어느 행동이 추천할 때 유의미 한지 판단할 수 있는 어텐션 스코어(134b)를 산출하여 제공(S400)할 수 있다.
또한, 추천 모델부(130)는 예측된 추천 정보를 출력부(140)를 통해 시각적, 청각적으로 인식할 수 있도록 출력(S500)한다.
따라서, 계층적 네트워크를 기반으로 사용자의 행동 정보를 이벤트 발생 순서에 따라 분석하여 추천 정보를 제공함으로써, 추천 모델의 성능을 개선할 수 있게 된다.
상기와 같이, 본 발명의 바람직한 실시 예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자라면 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
또한, 본 발명의 특허청구범위에 기재된 도면번호는 설명의 명료성과 편의를 위해 기재한 것일 뿐 이에 한정되는 것은 아니며, 실시예를 설명하는 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다.
또한, 상술된 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있으므로, 이러한 용어들에 대한 해석은 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
또한, 명시적으로 도시되거나 설명되지 아니하였다 하여도 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기재사항으로부터 본 발명에 의한 기술적 사상을 포함하는 다양한 형태의 변형을 할 수 있음은 자명하며, 이는 여전히 본 발명의 권리범위에 속한다.
또한, 첨부하는 도면을 참조하여 설명된 상기의 실시예들은 본 발명을 설명하기 위한 목적으로 기술된 것이며 본 발명의 권리범위는 이러한 실시예에 국한되지 아니한다.
100 : 상품 추천 장치 110 : 입력부
111 : 텍스트 입력부 111a : STT 입력부
112 : 정형 데이터 입력부 120 : 분류 처리부
121 : 분류 모델부 121a : 비정형 데이터
121a' : 비정형 데이터 1 122 : 데이터 전처리부
122a : 정형 데이터 122a' : 정형 데이터 1
130 : 추천 모델부 131 : 제1 네트워크부
131a : 제1 임베딩 레이어 131a' : 제1 임베딩 데이터
131b : 제1 시간 단위 레이어 131b' : 제1 시간 단위 벡터
131c : 제1 일 단위 레이어 131c' : 제1 일 단위 벡터
132 : 제2 네트워크부 132a : 제2 임베딩 레이어
132a' : 제2 임베딩 벡터 132b : 제2 시간 단위 레이어
132b' : 제2 시간 단위 벡터 133 : 연산부
134 : 제3 네트워크부 134a : GRU 레이어
134b : 어텐션 스코어 134c : 벡터 행렬 곱
135 : 분류기 140 : 출력부

Claims (17)

  1. 임의의 입력 데이터로부터 텍스트를 추출하고, 추출된 텍스트를 정형 데이터인 사용자 프로파일 데이터와 비정형 데이터인 이벤트 데이터로 분류하는 입력부(110);
    상기 분류된 이벤트 데이터와 사용자 프로파일 데이터를 일정 기간 단위로 구분하는 분류 처리부(120); 및
    상기 일정 기간 단위로 구분된 임의의 이벤트 데이터와 임의의 사용자 프로파일 데이터를 서로 다른 머신러닝 네트워크를 이용하여 상품 추천 정보를 예측하되,
    상기 서로 다른 머신러닝 네트워크는 이벤트 데이터를 일정 기간 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제1 네트워크와, 사용자 프로파일 데이터를 일 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제2 네트워크가 병렬로 구성되고,
    상기 제1 및 제2 네트워크는 양방향 GRU(Gated Recurrent Unit)를 통해 발생 순서에 대한 내용을 반영하며, 상기 발생 순서에 대한 내용이 반영된 이벤트 데이터와 사용자 프로파일 데이터의 벡터 값을 더하여 추천 정보를 출력하는 추천 모델부(130);를 포함하고,
    상기 추천 모델부(130)는 입력된 이벤트 데이터를 임베딩을 통해 벡터 값으로 변환하고, 변환된 이벤트 데이터를 HAN(Hierarchical Attention Networks) 아키텍처를 기반으로 일정 기간 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하되, GRU를 통과한 각 단어 벡터에 어텐션 레이어의 이벤트별 가중치를 적용하여 합한 값을 문장 벡터로 생성하고, 단어에서 문장으로 진행된 과정을 시간 단위 이벤트 벡터를 이용하여 일 단위 이벤트 벡터를 구하며, 상기 일 단위 이벤트 벡터에 기반하여 확률을 산출하는 제1 네트워크부(131);
    입력된 사용자 프로파일 데이터를 임베딩을 통해 벡터 값으로 변환하고, 변환된 사용자 프로파일 데이터를 HAN(Hierarchical Attention Networks) 아키텍처를 기반으로 시간 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제2 네트워크부(132);
    상기 제1 네트워크부(131)와 제2 네트워크부(132)를 통해 출력되는 벡터 값을 합한 연산 결과를 출력하는 연산부(133); 및
    상기 연산부(133)에서 출력되는 연산 결과가 입력 벡터로 입력되기 전 추천 정보에 대한 이유를 알 수 있도록 어텐션 메커니즘(Attention Mechanism)을 기반으로 GRU 레이어로 입력 상황을 부여하고, 벡터 행렬 곱을 수행할 때, 어느 행동이 추천할 때 유의미 한지 판단할 수 있도록 입력 자체에 상황을 인코딩하는 어텐션 스코어(Attention Score)를 산출하여 출력하는 제3 네트워크부(134);를 포함하는 것을 특징으로 하는 HAN 기반의 상품 추천 장치.
  2. 삭제
  3. 제 1 항에 있어서,
    상기 이벤트 데이터는 행동, 날짜 및 횟수를 포함하는 이벤트 데이터이고, 상기 사용자 프로파일 데이터는 항목 및 항목 값을 포함하는 정형 데이터인 것을 특징으로 하는 HAN 기반의 상품 추천 장치.
  4. 제 3 항에 있어서,
    상기 행동은 증권사의 계좌 개설, 수수료 문의, 환율 문의, 종목 추천 검색, 실시간 시세 검색, 환전 우대 검색, 수익률 검색, 급등주 검색, 성장주 검색, 저평가주 검색, 테마주 검색, 매도/매수 요청, 관심 종목 검색 중 적어도 하나이고,
    상기 날짜는 증권사를 이용한 날짜이며,
    상기 횟수는 증권사를 이용한 횟수이고,
    상기 항목은 나이, 투자 기간 및 투자 종목수 중 적어도 하나이며,
    상기 항목 값은 나이, 투자 기간 및 투자 종목수 중 적어도 하나를 포함한 수치이고,
    상기 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 주식 투자 상품인 것을 특징으로 하는 HAN 기반의 상품 추천 장치.
  5. 제3 항에 있어서,
    상기 행동은 전자 상거래 업체에서 구매에 의해 발생된 구매 상품명이고,
    상기 날짜는 전자 상거래 업체를 이용한 날짜이며,
    상기 횟수는 전자 상거래 업체를 이용한 횟수이고,
    상기 항목은 나이, 구매 금액, 과거 방문일 및 구매 횟수 중 적어도 하나 이며,
    상기 항목 값은 나이, 구매 금액, 과거 방문일 및 구매 횟수 중 적어도 하나를 포함하는 수치이며,
    상기 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 구매 추천 상품인 것을 특징으로 하는 HAN 기반의 상품 추천 장치.
  6. 제 3 항에 있어서,
    상기 행동은 사용자의 카드 사용에 따른 카드 사용 내역 정보 중 상품을 구매한 상품명 또는 가맹점의 이름 중 어느 하나이고,
    상기 날짜는 가맹점을 이용한 날짜이며,
    상기 횟수는 가맹점을 이용한 횟수이고,
    상기 항목은 나이 및 성별 중 적어도 하나이며,
    상기 항목 값은 나이 및 성별 중 적어도 하나를 포함하는 수치이고,
    상기 추천 정보는 이벤트 데이터와 사용자 프로파일 데이터를 기반으로 예측된 카드 상품인 것을 특징으로 하는 HAN 기반의 상품 추천 장치.
  7. 제 3 항에 있어서,
    상기 행동은 가맹점에서 결제에 따른 가맹점 결제 내역 정보 중 이용한 업종 정보 또는 가맹점 이름 중 어느 하나이고,
    상기 날짜는 가맹점을 이용한 날짜이며,
    상기 횟수는 가맹점을 이용한 횟수이고,
    상기 항목은 고객의 나이 및 성별 중 적어도 하나이며,
    상기 항목 값은 고객의 나이 및 성별 중 적어도 하나를 포함하는 수치이고,
    상기 추천 정보는 이벤트 데이터 및 사용자 프로파일 데이터를 기반으로 예측된 카드 가맹점 정보인 것을 특징으로 하는 HAN 기반의 상품 추천 장치.
  8. 제 3 항에 있어서,
    상기 행동은 사용자가 컨텐츠 데이터의 사용에 따라 시청한 프로그램 이름이고,
    상기 날짜는 프로그램을 시청한 날짜이며,
    상기 횟수는 프로그램을 시청한 횟수이고,
    상기 항목은 고객의 나이 및 성별 중 적어도 하나이며,
    상기 항목 값은 고객의 나이 및 성별 중 적어도 하나를 포함하는 수치이고,
    상기 추천 정보는 이벤트 데이터 및 사용자 프로파일 데이터를 기반으로 예측된 프로그램인 것을 특징으로 하는 HAN 기반의 상품 추천 장치.
  9. 제 1 항에 있어서,
    상기 입력부(110)는 입력 데이터 중에서 텍스트 기반의 데이터를 인식하여 텍스트만 추출하여 출력하는 텍스트 입력부(111); 및
    상기 입력 데이터 중에서 데이터 개체(Entity), 속성(Attribute), 관계(Relationship)에 따른 스키마(Schema) 형태, 연산 가능 여부, 데이터 특성, 숫자 및 범주형 데이터 중 적어도 하나로 이루어진 정형 데이터를 추출하여 출력하는 정형 데이터 입력부(112);를 포함하는 것을 특징으로 하는 HAN 기반의 상품 추천 장치.
  10. 제 9 항에 있어서,
    상기 입력부(110)는 입력된 데이터에서 음성 기반의 데이터를 인식하면, 상기 음성 기반의 데이터를 텍스트 데이터로 변환하여 텍스트만 추출하는 STT 입력부(111a)를 더 포함하는 것을 특징으로 하는 HAN 기반의 상품 추천 장치.
  11. 삭제
  12. 삭제
  13. 제 1 항에 있어서,
    상기 추천 모델부(130)를 통해 예측된 추천 정보를 출력하는 출력부(140)를 더 포함하는 것을 특징으로 하는 HAN 기반의 상품 추천 장치.
  14. a) 입력부(110)가 임의의 입력 데이터로부터 텍스트를 추출하고, 추출된 텍스트를 정형 데이터인 사용자 프로파일 데이터와 비정형 데이터인 이벤트 데이터로 분류하는 단계; 및
    b) 분류 처리부(120)가 분류된 이벤트 데이터와 사용자 프로파일 데이터를 일정 기간 단위로 구분하고, 추천 모델부(130)가 일정 기간 단위로 구분된 이벤트 데이터와 사용자 프로파일 데이터를 입력받아 서로 다른 머신러닝 네트워크를 이용하여 상품 추천 정보를 예측하는 단계;를 포함하고,
    상기 b) 단계의 추천 모델부(130)는 입력된 이벤트 데이터를 임베딩을 통해 벡터 값으로 변환하고, 변환된 이벤트 데이터를 HAN(Hierarchical Attention Networks) 아키텍처를 기반으로 일정 기간 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하되, GRU를 통과한 각 단어 벡터에 어텐션 레이어의 이벤트별 가중치를 적용하여 합한 값을 문장 벡터로 생성하고, 단어에서 문장으로 진행된 과정을 시간 단위 이벤트 벡터를 이용하여 일 단위 이벤트 벡터를 구하며, 상기 일 단위 이벤트 벡터에 기반하여 확률을 산출하는 제1 네트워크부(131);
    입력된 사용자 프로파일 데이터를 임베딩을 통해 벡터 값으로 변환하고, 변환된 사용자 프로파일 데이터를 HAN(Hierarchical Attention Networks) 아키텍처를 기반으로 시간 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제2 네트워크부(132);
    상기 제1 네트워크부(131)와 제2 네트워크부(132)를 통해 출력되는 벡터 값을 합한 연산 결과를 출력하는 연산부(133); 및
    상기 연산부(133)에서 출력되는 연산 결과가 입력 벡터로 입력되기 전 추천 정보에 대한 이유를 알 수 있도록 어텐션 메커니즘(Attention Mechanism)을 기반으로 GRU 레이어로 입력 상황을 부여하고, 벡터 행렬 곱을 수행할 때, 어느 행동이 추천할 때 유의미 한지 판단할 수 있도록 입력 자체에 상황을 인코딩하는 어텐션 스코어(Attention Score)를 산출하여 출력하는 제3 네트워크부(134);를 포함하며,
    상기 서로 다른 머신러닝 네트워크는 이벤트 데이터를 일정 기간 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제1 네트워크와, 사용자 프로파일 데이터를 일 단위로 구분한 입력 값을 사용하여 벡터 값으로 변환하는 제2 네트워크가 병렬로 구성되며, 상기 제1 및 제2 네트워크는 양방향 GRU(Gated Recurrent Unit)를 통해 발생 순서에 대한 내용을 반영하며, 상기 발생 순서에 대한 내용이 반영된 이벤트 데이터와 사용자 프로파일 데이터의 벡터 값을 기반으로 예측된 추천 정보를 출력하는 것을 특징으로 하는 HAN 기반의 상품 추천 방법.
  15. 삭제
  16. 제 14 항에 있어서,
    상기 상품 추천 정보를 예측하는 단계는 추천 모델부(130)가 셀프 어텐션(Self-Attention)을 기반으로 어텐션 스코어(Score)를 산출하여 출력하는 단계를 더 포함하는 것을 특징으로 하는 HAN 기반의 상품 추천 방법.
  17. 제 14 항에 있어서,
    상기 추천 모델부(130)가 예측된 추천 정보를 출력부(140)를 통해 출력하는 단계;를 더 포함하는 것을 특징으로 하는 HAN 기반의 상품 추천 방법.
KR1020210069471A 2021-05-28 2021-05-28 Han 기반의 상품 추천 장치 및 방법 KR102339793B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210069471A KR102339793B1 (ko) 2021-05-28 2021-05-28 Han 기반의 상품 추천 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210069471A KR102339793B1 (ko) 2021-05-28 2021-05-28 Han 기반의 상품 추천 장치 및 방법

Publications (1)

Publication Number Publication Date
KR102339793B1 true KR102339793B1 (ko) 2021-12-16

Family

ID=79033309

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210069471A KR102339793B1 (ko) 2021-05-28 2021-05-28 Han 기반의 상품 추천 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102339793B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200119358A (ko) * 2019-03-15 2020-10-20 (주) 데이터뱅크 인공지능 기계학습 기반 자동채점을 이용한 토플 강의 추천 서비스 제공 시스템
KR20210028365A (ko) 2019-09-04 2021-03-12 (주)투비소프트 인공지능 기반의 기계학습을 통한 사용자 맞춤형 상품 추천 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200119358A (ko) * 2019-03-15 2020-10-20 (주) 데이터뱅크 인공지능 기계학습 기반 자동채점을 이용한 토플 강의 추천 서비스 제공 시스템
KR20210028365A (ko) 2019-09-04 2021-03-12 (주)투비소프트 인공지능 기반의 기계학습을 통한 사용자 맞춤형 상품 추천 장치

Similar Documents

Publication Publication Date Title
Safara A computational model to predict consumer behaviour during COVID-19 pandemic
Çalı et al. Improved decisions for marketing, supply and purchasing: Mining big data through an integration of sentiment analysis and intuitionistic fuzzy multi criteria assessment
US11507850B2 (en) System and method for call centre management
US10803249B2 (en) Convolutional state modeling for planning natural language conversations
Li et al. Tourism companies' risk exposures on text disclosure
Mankad et al. Understanding online hotel reviews through automated text analysis
KR101531970B1 (ko) 소셜 미디어 데이터 및 증시 관련 웹데이터 분석을 통한 주가 예측 방법 및 이를 적용한 주가 예측 시스템
Khan Development of an e-commerce sales Chatbot
US20200356725A1 (en) System and method for automatically tagging customer messages using artificial intelligence models
Ho et al. Harnessing aspect-based sentiment analysis: how are tweets associated with forecast accuracy?
CN114547475A (zh) 一种资源推荐方法、装置及系统
Chiang et al. Using an ontology-based neural network and DEA to discover deficiencies of hotel services
Muzindutsi et al. Effects of country risk shocks on the South African bond market performance under changing regimes
Kim et al. The method for generating recommended candidates through prediction of multi-criteria ratings using cnn-bilstm
Sahebi et al. A new approach in marketing research: Identifying the customer expected value through machine learning and big data analysis in the tourism industry
Dael et al. Stock Market Prediction Using Generative Adversarial Networks (GANs): Hybrid Intelligent Model.
Bari et al. Ensembles of text and time-series models for automatic generation of financial trading signals from social media content
Asemi et al. A novel combined business recommender system model using customer investment service feedback
KR102339793B1 (ko) Han 기반의 상품 추천 장치 및 방법
Alquhtani et al. Analytics in support of e-commerce systems using machine learning
KR102505204B1 (ko) 사용자 후기 분석 장치 및 방법
Chashmi et al. Predicting customer turnover using recursive neural networks
CN115375361A (zh) 一种在线广告投放目标人群的选择方法、装置及电子设备
Imani et al. Customer segmentation to identify key customers based on RFM model by using data mining techniques
Feizian et al. Cryptocurrency Price Prediction Model Based on Sentiment Analysis and Social Influence

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant