KR101887196B1 - 빅데이터 딥러닝 기반의 t커머스 방송편성정보 제공방법 - Google Patents

빅데이터 딥러닝 기반의 t커머스 방송편성정보 제공방법 Download PDF

Info

Publication number
KR101887196B1
KR101887196B1 KR1020170018034A KR20170018034A KR101887196B1 KR 101887196 B1 KR101887196 B1 KR 101887196B1 KR 1020170018034 A KR1020170018034 A KR 1020170018034A KR 20170018034 A KR20170018034 A KR 20170018034A KR 101887196 B1 KR101887196 B1 KR 101887196B1
Authority
KR
South Korea
Prior art keywords
sales
product
time
information
programming
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020170018034A
Other languages
English (en)
Other versions
KR20180071906A (ko
Inventor
김인중
나기현
양소희
장재민
김윤종
신원영
Original Assignee
한동대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한동대학교 산학협력단 filed Critical 한동대학교 산학협력단
Publication of KR20180071906A publication Critical patent/KR20180071906A/ko
Application granted granted Critical
Publication of KR101887196B1 publication Critical patent/KR101887196B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/254Management at additional data server, e.g. shopping server, rights management server
    • H04N21/2542Management at additional data server, e.g. shopping server, rights management server for selling goods, e.g. TV shopping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
    • H04N21/4666Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms using neural networks, e.g. processing the feedback provided by the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Economics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법에 관한 것이다. 본 발명의 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법은, 인공지능 매출 예측 모듈이 상품정보, 판매시간 정보, 외부요인 정보를 기초로 각 상품의 시간별 예상 매출을 학습하고 상품별 및 편성시간별 예상매출을 출력하는 단계와, 매출 최적화 방송 편성 모듈이 상기 인공지능 매출 예측 모듈로부터 수신한 상품 및 편성시간별 예상매출에 기초하여 상품과 편성시간별 예상 매출을 가중치로 배정하고, 최대 가중치 알고리즘에 따라 최대 가중치를 매칭하여 방송편성정보를 생성하는 단계를 포함한다.

Description

빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법{METHOD OF PROVIDING T-COMMERCE ELECTRONIC PROGRAM GUIDE BASED ON BIGDATA DEEP LEARNING}
본 발명은 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법에 관한 것으로, 특히 상품정보, 판매시간대 정보, 외부요인 등의 빅데이터를 분석하여 매출을 예측하고 최대 매출을 위한 방송편성정보를 제공하는 방법에 관한 것이다.
T커머스(T Commerce)는 디지털 TV를 이용한 전자상거래를 말하며, 인터넷 전자상거래를 의미하는 E커머스와 비교되는 개념이다. 양방향 데이터 방송기술을 기반으로 TV를 시청하다가 리모컨을 조작해 상품 구매 의사를 밝히면 즉시 주문과 결제가 이루어진다.
양방향 데이터 방송기술은 기존의 방송처럼 방송국에서 프로그램을 일방적으로 전송하는 것이 아니라, 시청자와 방송국 간에 서로 상호작용이 가능한 서비스이다. 이를 위하여 방송국은 프로그램 이외에 양방향 기능이 구현된 콘텐츠를 추가로 제작하여 시청자에게 전송하고, 시청자는 리턴 채널을 통하여 의사를 표현할 수 있다. 이러한 양방향 방송 서비스에 이용되는 방송 편성 정보(EPG; Electronic Program Guide)는 방송국마다 그날의 프로그램 목록을 데이터 방송으로 송출하여 사용자가 참고할 수 있도록 하는 일종의 데이터 방송 서비스이다.
한편, 홈쇼핑 및 T-커머스에서는 각 시간에 어떤 상품을 판매하느냐에 따라 매출이 크게 좌우한다. 현재 홈쇼핑 및 T-커머스의 방송 편성은 편성 담당자의 경험 및 직관에 의존하고 있으며, 상품정보, 판매시간대 정보, 외부요인 등을 빅데이터를 분석하여 방송 편성을 최적화 및 체계화가 요청되고 있다.
공개특허공보 제10-2011-0061234호는 양방향 통신 기반의 방송 편성정보 제공 시스템 및 방법에 대한 것으로, 방송편성정보를 통신망을 통하여 단순 편성정보의 제공이 아닌 다양한 콘텐츠를 이용할 수 있는 부가 서비스의 제공이 가능한 시스템 및 방법을 제공하고 있으나, 빅데이터 분석을 통한 지능화 방송 편성에 대한 내용은 제시하고 있지 않고 있다.
본 발명은 이와 같은 종래기술의 문제점을 해결하기 위해 안출된 것으로, 본 발명의 목적은 인공지능 딥러닝 기술을 이용해 각 상품을 특정시간대에 편성했을 때 매출을 예측하고 이를 기반으로 예상 매출을 최대화하도록 방송을 편성하는 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법을 제공하는 것이다.
본 발명의 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법은, 인공지능 매출 예측 모듈이 상품정보, 판매시간 정보, 외부요인 정보를 기초로 각 상품의 시간별 예상 매출을 학습하고 상품별 및 편성시간별 예상매출을 출력하는 단계와, 매출 최적화 방송 편성 모듈이 상기 인공지능 매출 예측 모듈로부터 수신한 상품 및 편성시간별 예상매출에 기초하여 상품과 편성시간별 예상 매출을 가중치로 배정하고, 최대 가중치 알고리즘에 따라 최대 가중치를 매칭하여 방송편성정보를 생성하는 단계를 포함한다.
본 발명은 상품정보, 판매시간대 정보, 외부요인 데이터 분석을 통해 지능형 방송 편성 정보를 제공하여 매출이 최대화될 수 있다.
또한, 인공지능 딥러닝 알고리즘을 적용하여 데이터가 누적될수록 매출 예측 정확도가 개선되어 실제 매출이 증가하는 효과가 있다.
도 1은 본 발명의 일실시예에 따른 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법을 설명하는 순서도이다.
도 2는 본 발명의 일실시예에 따른 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법을 설명하는 개념도이다.
도 3은 본 발명의 일실시예에 따른 심층신경망 매출예측기를 설명하는 도면이다.
도 4는 본 발명의 일실시예에 따른 상품별 매출 예상 결과를 이분 그래프로 표현하여 최적 방송편성을 얻는 방법을 설명하는 도면이다.
도 5는 본 발명의 일실시예에 따른 최대 가중치 매칭 알고리즘(헝가리안 알고리즘)을 설명하는 도면이다.
도 6과 도 7는 본 발명의 일실시예에 따른 매출 증가 추세를 반영한 상품별 매출 예상 결과를 도시한 그래프이다
본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시 예들에 대해서 특정한 구조적 또는 기능적 설명은 단지 본 발명의 개념에 따른 실시 예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시 예들은 다양한 형태들로 실시될 수 있으며 본 명세서에 설명된 실시 예들에 한정되지 않는다.
본 발명의 개념에 따른 실시 예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시 예들을 도면에 예시하고 본 명세서에서 상세하게 설명하고자 한다. 그러나 이는 본 발명의 개념에 따른 실시 예들을 특정한 개시 형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물, 또는 대체물을 포함한다.
본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로서, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 본 명세서에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
먼저 본 발명에서 기술하는 딥러닝은 다수의 계층으로 구성된 심층신경망(DNN; deep neural networks)을 기반으로 데이터로부터 높은 수준으로 추상화된 정보를 학습한다. 인공신경망은 다수의 뉴런 계층으로 구성되어 입력 정보와 출력 정보 간의 상관관계를 학습/근사한다. 인공신경망의 각 뉴런은 뇌세포의 동작을 모방하여 입력 정보를 가중합의 형태로 조합하여 좀 더 높은 수준의 정보로 변환한 후 다음 뉴런으로 전달한다. 이를 수식으로 나타내면 다음과 같다.
Figure 112017013556596-pat00001
이때, oj는 출력 뉴런의 값, xj는 입력 뉴런의 값, wij은 oj와 xj간의 연결 가중치,θi는 편향(bias)을 나타낸다. 인공신경망에서 지식은 연결 가중치 wij의 집합에 의해 표현되며 연결 가중치는 학습 알고리즘에 의해 데이터로부터 학습된다. 인공신경망의 학습은 기울기 강하(gradient descent) 알고리즘에 의해 오차를 최소화하는 방향으로 진행된다. 먼저, 기대 출력(desired output)과 인공신경망의 실제 출력(output)간의 차를 오차함수 E를 정의한다. 그리고, 랜덤하게 초기화된 가중치 wij를 학습데이터 기울기의 반대 방향으로 이동하면서 오차를 감소시킨다.
Figure 112017013556596-pat00002
인공신경망의 각 계층은 이와 같은 뉴런들을 다수 포함하고 있으며, 각 계층은 각각 하위 계층으로부터 전달받은 정보를 좀더 높은 수준의 정보로 추상화한다.딥러닝에 사용하는 심층신경망은 많은 수의 계층으로 구성되어 일반적인 신경망보다 더 높은 수준의 추상화를 수행할 수 있다. 특히, 심층신경망의 학습을 위해서는 비지도 학습 알고리즘을 이용한 사전학습 (pre-training)이 많이 사용되는데, 이를 위해서는 RBM (restricted Boltzmann machine), SAE (stacked auto-encoder) 등이 사용된다
이하, 본 명세서에 첨부된 도면들을 참조하여 본 발명의 실시 예들을 상세히 설명한다.
도 1은 본 발명의 일실시예에 따른 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법을 설명하는 도면이다.
도 1을 참조하면, 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법은, 먼저 인공지능 매출 예측 모듈이 상품정보, 판매시간 정보, 외부요인 정보를 기초로 각 상품의 시간별 예상 매출을 학습하고(S110), 상품별 및 편성시간별 예상매출을 출력한다(S120).
이후에, 매출 최적화 방송 편성 모듈이 상기 인공지능 매출 예측 모듈로부터 수신한 상품 및 편성시간별 예상매출에 기초하여 상품과 편성시간별 예상 매출을 가중치로 배정하고(S130), 최대 가중치 알고리즘에 따라 최대 가중치를 매칭하여 방송편성정보를 생성한다(S140). 이때, 판매상품, 판매시간 및 예상 매출을 이분그래프로 표현한 후 이분그래프 매칭을 이용해 최적 방송 편성을 제공할 수 있다.
상기 상품정보는 과거 판매기록, 상품 구매한 사용자 정보를 포함할 수 있고, 상기 외부요인정보는 날씨 정보, 소비자의 구매에 영향을 미치는 심리적인 요인, 경쟁사의 편성정보 중 적어도 하나일 수 있다.
한편, 판매된 기록이 없거나 부족하여 예상매출 학습이 잘 이루어지지 않는 상황을 해결하기 위한 단계를 포함할 수 있고, 동일 상품이 연속된 시간대에 배치되는 것을 예방하는 단계를 더 포함할 수 있다.
도 2는 본 발명의 일실시예에 따른 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법을 설명하는 개념도이다.
도 2를 참조하면, 본 발명은 인공지능 매출예측 모듈과 매출최적화 방송편성 모듈로 구성된다. 인공지능 매출예측 모듈은 머신러닝 기술을 이용해 과거 매출 데이터로부터 각 상품의 시간대별 매출을 예측하고, 매출최적화 방송편성 모듈은 예측된 상품별 및 시간대별 매출로부터 최적 상품 및 시간대 매칭(방송편성)을 결정한다.
먼저, 과거 매출 기록과 외부요인(날씨 등)을 이용해 머신러닝 모델(예: 심층신경망, SVM, 통계적 모델, 회기분석 등)이 각 상품의 시간별 예상 매출을 학습시킨다. 머신러닝 모델의 입력은 상품정보, 판매시간 정보 및 외부요인(날씨, 경쟁사 편성정보 등)이다. 머신러닝 모델의 출력은 각 상품별/편성시간별 예상 매출이다.
이후에, 머신러닝 모델의 학습되면 상품종류, 판매시간, 외부요인을 입력으로 받아 편성대상기간(미래)의 상품별/편성시간 별 예상 매출을 출력한다.
인공지능 매출예측 모듈은 심층신경망 예측기와 통계적 예측기의 조합으로 구성된다. 심층신경망 예측기는 판매기록이 있는 상품-시간대 조합에 대해 좋은 성능을 보이며, 날씨, 휴일 등 다양한 입력 변수들을 반영할 수 있다. 반면, 통계적 예측기는 심층신경망보다 간단하여 학습데이터가 부족으로 인한 오버피팅 문제가 적게 발생하며, 평활화, SVD 등의 기법을 통해 데이터에 희박성을 완화할 수 있다. 두 모델이 출력한 예상 매출은 다음 식과 같이 가중평균에 의해 결합된다.
Figure 112017013556596-pat00003
,여기에서
Figure 112017013556596-pat00004
Figure 112017013556596-pat00005
은 각각 심층신경망 예측기와 통계적 예측기가 출력한 상품 x를 시간 y에 편성했을 때 예상되는 매출이며,
Figure 112017013556596-pat00006
는 심층신경망의 가중치를 나타낸다.
도 3을 참조하면, 심층신경망 예측기의 입력 변수로는 상품정보 x, 판매시간 y, 외부정보(날씨, 휴일여부) z가 포함된다. 출력 노드는 1개이며 상품 x를 시간대 y에 편성했을 때의 예상 매출(분당판매량)
Figure 112017013556596-pat00007
이다. T-커머스에서 각 상품은 상품코드로 구분된다. 각 상품코드를 1-of-C 코딩을 통해 표현하였다. 즉, 각 상품 x 에 대하여 x번째 노드는 1, 다른 노드는 0을 입력으로 한다. 판매 시간은 주 단위로 표현하였다. T-커머스의 방송 편성은 보통 주 단위로 이루어지므로 판매 시간대를 24시간 * 7일 = 168개로 구분하였다. 예를 들어, 일요일 오전 7시는 7번째 노드 (24 * 0(일) + 7 = 7)에 대응하고, 토요일 15시는 159번째 노드 (24*6(토)+15=159)에 대응한다. 그런데, 이와 같이 일주일 내 168개 시간대만으로 구분할 경우 연중 날짜나 계절 정보가 반영되지 않는다. 이를 보완하기 위해 판매일이 1년 중 몇 주차에 해당하는지를 입력 정보에 포함하였다. 1년은 52주로 구성되므로 52개의 입력 노드로 표현한다. 휴일여부는 0, 또는 1로 표현하였으며, 날씨는 기온, 강수량, 풍속, 강설량, 구름의 양, 체감온도 등 6가지 수치를 min-max 정규화하여 사용하였다. 심층신경망의 입력 정보는 모두 623차원 벡터로 구성되며 요약하면 표 1과 같다.
Categories Input Information Coding Feature dim.
Product Goods code 1-of-C 396
Timeslot Day of week (0~6) and hour (0~23) 1-of-C 168
Week of year (1~52) 1-of-C 52
External
factors
Holiday 0(non-holiday) or 1(holiday) 1
Weather
(temperature, rainfall,wind speed,snowfall,cloud,effective temperature)
value
(min-max minimized)
6
심층신경망의 학습은 예상 매출과 학습데이터의 실제 매출간 오차를 최소화함으로써 이루어진다. 목적함수에 해당하는 매출 오차는 다음과 같이 정의한다.
Figure 112017013556596-pat00008
,
Figure 112017013556596-pat00009
는 심층신경망이 출력한 예측치를 의미하고,
Figure 112017013556596-pat00010
는 학습데이터에 포함된 실제 매출을 의미한다. 매출 오차를 최소화하기 위해서는 SGD(stochastic gradient descent)알고리즘을 사용하였으며, 배치의 크기는 64로 하였다.
통계적 예측기는 각 상품의 판매 시간의 편중에 의한 데이터 희박성 문제에 대하여 심층신경망을 보완하는 것을 목적으로 한다. 먼저, 과거의 판매기록으로부터 상품들이 168가지 시간대에 편성되었을 때 각 상품-시간대 조합별 분당판매량의 평균을 기반으로 매출을 예측한다. 그런데, 예측대상일로부터의 거리가 가까울수록 예측에 중요하기 때문에 예측대상일과 과거의 판매일 간 시간거리에 반비례하는 가중치를 적용한 가중평균을 사용한다. 가중평균의 계산식은 다음과 같다.
Figure 112017013556596-pat00011
,
Figure 112017013556596-pat00012
,
Figure 112017013556596-pat00013
Figure 112017013556596-pat00014
는 판매기록 중 날짜
Figure 112017013556596-pat00015
에 상품 x가 시간대 y에 판매된 분당판매량을 나타낸다.
Figure 112017013556596-pat00016
는 예측대상일을 의미하며
Figure 112017013556596-pat00017
는 해당 판매기록의 가중치이다. 이와 같은, 분당판매량의 가중 평균은 심층신경망보다 단순해서 오버피팅이나 데이터 부족에 의한 문제가 다소 적지만, 판매기록이 없는 상품-시간대 조합에 대한 예측이 어렵다는 문제는 여전히 존재한다. 이를 극복하기 위해 본 연구에서는 시간축에 대한 가우시안 평활화(Gaussian smoothing)와 SVD 등 두 가지 기법을 적용하였다. 동일상품의 유사시간대 예상 매출은 서로 유사하다고 가정할 경우 매출기록이 없는 상품-시간대 조합의 예상 매출을 주변 시간대의 예상 매출로부터 다음과 같이 추정한다.
Figure 112017013556596-pat00018
,
Figure 112017013556596-pat00019
는 가우시안 평활화를 통해 추정한 예상 매출을 의미하며,
Figure 112017013556596-pat00020
은 평균이 0, 표준편차가
Figure 112017013556596-pat00021
인 가우시안 분포를 나타낸다.
추가적으로 추천시스템에 많이 사용되는 특이값 분해 (SVD, singular value decomposition)를 적용하였다. 희박한 행렬을 A가 주어졌을 때 SVD를 적용하면 A를 U, D, VT등 세 개의 행렬로 분해할 수 있다. 여기에서 D는 특이값(singular values)으로 구성된 대각행렬이고, U와 VT는 각각 좌측, 우측 특이벡터(singular vectors)로 구성되는 행렬이다. 여기에서 각 행렬의 특이값 및 특이벡터를 특이값이 큰 순서로 k개만 사용하여 다시 원래 행렬을 구성할 경우 데이터의 분별에 중요도가 낮은 차원은 무시된다. 그 결과, 노이즈가 제거되고 비슷한 행과 열은 좀 더 유사해지는 특성을 갖게 되는데, 이 과정에 행렬의 희박성 문제가 완화된다.
SVD를 이용해 희박성 문제를 완화한 예는 아래 표와 같다.
(a) 상품별/시간대별 예상 매출SVD 적용 전
Figure 112017013556596-pat00022
(b) 상품별/시간대별 예상 매출SVD 적용 후
Figure 112017013556596-pat00023
그런데, 특정 상품이 오랫동안 편성되지 않았다면 편성담당자가 해당 시간에는 그 제품의 경쟁력이 낮다고 판단한 것으로 추정할 수 있다. 따라서, 최종판매일이 오래된 경우 예상 매출을 감소시키는 감소 모델을 적용하였다. 최종적으로 통계적 모델의 예상 매출은 다음 식에 의해 계산된다.
Figure 112017013556596-pat00024
도 4를 참조하면, 매출최적화 방송편성 모듈은 이분그래프(bipartite graph) 매칭 알고리즘을 이용해 예상 매출을 최대화 하도록 방송을 편성한다. 판매상품과 편성시간의 관계는 판매상품을 한 그룹에, 편성시간대를 다른 그룹에 대응시키는 이분그래프로 표현할 수 있다. 각 상품 x과 편성시간 y간 연결에지(x,y)에는 그 상품 x를 시간대 y에 편성했을 때의 예상 매출을 가중치로 배정한다. 이와 같은 이분그래프에서 X,Y간 에지 가중치의 합을 최대화하는 매칭은 최적 예상 매출을 최대화하는 방송편성을 나타낸다.
최적 편성이란 이러한 그래프 G에서 각 시간대 y를 각 판매 상품 x와 연결하면서, 선택된 min(|X|, |Y|)개 에지들의 연결가중치w(x, y)의총합을 최대화하는 매칭을 찾는 문제이다. 그 식은 다음과 같다.
Figure 112017013556596-pat00025
따라서, 최적 방송 편성은 이분그래프의 최대 가중치 매칭 문제로 볼 수 있고, 이러한 문제의 해결 알고리즘으로는 헝가리안 알고리즘이 있다. 이분그래프의 에지들 중 매칭에 포함되는 에지를 매칭 에지, 매칭에 포함되지 않은 에지를 비매칭 에지라 한다. 매칭 에지와 비매칭 에지가 교대로 연결된 패스를 교대 패스(alternating path)라 한다.교대 패스 중에서도 두 끝단의 노드가 매칭 에지에 연결되지 않은 경우 이를 확장 패스(augmenting path)라 한다.
도 5를 참조하면, 헝가리안 알고리즘은 확장패스를 이용해 단계적으로 매칭의 크기를 늘려나가는 알고리즘이다. 확장 패스는 양 끝의 에지가 비매칭 에지이고, 그 사이는 매칭 에지와 비매칭 에지가 교대로 연결되어 있는 에지이다. 확장 패스의 에지 수는 항상 홀수이며 비매칭 에지의 수는 매칭 에지의 수보다 하나가 더 많다.이때, 비매칭 에지를 매칭 에지로, 매칭 에지를 비매칭 에지로 전환하면 기존 매칭보다 매칭 에지가 하나 더 추가된 새로운 매칭으로 확장할 수 있다. 이렇게 확장 패스를 만들며 매칭의 수를 늘려 나가는 방식으로, 최적 매칭을 위해 중간에 매칭을 수정하기도 하며, Min(|X|, |Y|)개의 매칭 에지를 만든다.
그런데, 기존의 헝가리안 알고리즘을 T-커머스 최적 방송 편성에 적용하기 위해서는 몇 가지 수정이 요구된다. 헝가리안 알고리즘은 1:1 매칭을 찾는다. 그러나, T-커머스 방송편성에서는 같은 상품이 하루에 최대 N번(예: N=3)까지 편성될 수 있기 때문에, 판매 상품과 시간대간 1:N매칭이 가능해야 한다. 이를 위해, 판매 상품의 집합 X 대신, X의 각 판매 상품 x를 각각 N개씩 포함하는 확장 판매 상품 집합 X'를 Y와 연결한 이분그래프 G'를 사용하였다. 곧, X'는 X의 모든 원소를 포함하고, 추가로(N - 1)회만큼 재포함한 집합이다. 이 때, 재포함한 상품과 각 편성 시간대 사이를 연결하는 에지의 연결가중치는, 처음으로 포함되었던 상품 연결가중치에 상수 K(0 < K < 1,예: K=0.9)를 재포함 횟수 만큼 거듭 곱한 값으로 설정한다. 예를 들어,N=3이고,상품 a가 두 번째로 재포함될 경우의 복사된 노드를 a2라고 하면, a2와 모든 시간대 y 사이의 연결가중치 w(a2, y)는기존 상품의 연결가중치 w(a, y)에 K2(예:K=0.9이면 0.92)를 곱한 값이 된다. 이는 하루 동안 한 상품이 시간차를 두고 반복해서 방송에 노출될 시, 여러 번 노출될수록 판매 건수가 점점 하락한다는 전문가 경험을 반영하기 위한 것이다.
또한, T-커머스에는 특정 상품을 반드시 특정 시간대에 편성해야 하는 경우가 발생하는데, 이러한 경우 편성 담당자가 해당 상품을 해당 시간대에 미리 고정한다. 방송편성 알고리즘은 이와 같이 방송 시간이 미리 배정된 고정상품을 해당 시간에 매칭되도록 보존해야 한다. 이를 위해, 고정상품과 배정된 시간대 사이의 연결가중치는 매우 큰 값으로 설정하고, 다른 상품들과 해당 시간대 사이의 연결 가중치는 0으로 설정한다. 이와 같이 연결가중치를 지정한 후 헝가리안 알고리즘을 적용하면 고정상품은 담당자가 편성한 시간대에 배정된다.
본 발명에서는 이분그래프 매칭 알고리즘(예:헝거리안 알고리즘,Kuhn-Munkres알고리즘)을 확장해서 최적 매칭을 얻는다. 기본적으로 Kuhn-Munkres 알고리즘을 적용하되, 동일 상품이 연속된 시간대에 반복해 편성되는 것을 방지하도록 변형한다.
실험예로서, 도 6 내지 도 7을 참조하면, 실험 데이터로는 ㈜더블유쇼핑의 2015년 7월부터 2016년 9월까지의 15개월간의 판매 데이터를 사용했다. 그중 2016년 8월까지의 14개월간의 데이터를 학습에 사용하였고, 2016년 9월 1개월의 데이터를 테스트에 사용했다. 매출예측기의 출력과 실제 매출 데이터를 비교하기 위해서는 NMAE (normalized mean absolute error)를 사용하였다. MNAE의 계산식은 다음과 같다.
Figure 112017013556596-pat00026
1. 매출예측결과
먼저 심층신경망을 이용한 매출 예측기의 성능을 평가하였다. 학습데이터의 구성과 관련해 14개월간의 데이터를 모두 학습에 사용한 경우와, 최근 3개월에 해당하는 2016년 6-8월의 데이터만을 이용해 학습한 경우로 구분하였다. 전자의 경우 학습에 많은 데이터가 사용된다는 장점이 있는 반면, 후자의 경우 최근의 매출을 집중적으로 반영함으로써 최근 트랜드와 계절 등이 강조된다는 장점이 있다. 두 경우 2016년 9월 매출을 예측한 후 실제 매출과 비교하였다. 도 6은 14개월간 데이터로 학습후 매출 예측그래프이고, 도 7은 3개월간 데이터로 학습 후 매출 예측 그래프이다. 도 6의 그래프는 제안하는 매출 예측 알고리즘이 실제 매출의 트랜드를 효과적으로 예측하고 있음을 보여준다. 그런데,14개월간의 전체 데이터로 학습한 경우보다 최근 3개월만의 데이터로 학습한 경우가 근소하게 더 낮은 NMAE를 보였다. 이는 오래된 과거 데이터에는 예측대상일과 다른 환경에서의 데이터가 많이 포함되기 때문에 오히려 좋지 않은 영향을 주기 때문인 것으로 추정된다. 반면, 최근 3개월의 데이터만으로 학습할 경우 최근 트랜드 및 계절에 집중하기 때문에 더 좋은 결과를 낸 것으로 추정된다.
동일한 학습 데이터를 사용한 경우 심층신경망 예측기가 통계적 예측기보다 훨씬 좋은 성능을 보였다. 그러나, 심층신경망만 사용한 경우 구매 기록이 없는 상품-시간대 조합에 대하여 잘못된 결과를 출력하는 현상이 발견되었는데, 이는 T-커머스 방송 편성에 잘못된 영향을 끼칠 수 있다. 통계적 예측기의 경우 그러한 조합의 예상 매출을 낮춰주는 효과가 있어 심층신경망 예측기의 문제점을 보완해 주는 효과가 있었다. 심층신경망과 통계적 예측기를 함께 사용한 경우 심층신경망과 유사한 NMAE를 보이면서도 구매 기록이 없는 상품-시간대 조합에 대하여 낮은 예상 매출을 출력하여 좀 더 안정적인 동작을 보였다.
시간별 매출 예측기의 성능(NMAE)은 표2와 같다.
Predictors Training data
14months 3months
DNN predictor 0.13 0.12
Statistical predictor 0.19 0.18
DNN +Stat 0.13 0.12
본 발명은 도면에 도시된 실시 예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시 예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.
없음.

Claims (3)

  1. 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법에 있어서,
    (a) 인공지능 매출 예측 모듈이 상품정보, 판매시간 정보, 외부요인 정보를 기초로 각 상품의 시간별 예상 매출을 학습하고 상품별 및 편성시간별 예상매출을 출력하는 단계; 및
    (b) 매출 최적화 방송 편성 모듈이 상기 인공지능 매출 예측 모듈로부터 수신한 상품 및 편성시간별 예상매출에 기초하여 상품과 편성시간별 예상 매출을 가중치로 배정하고, 최대 가중치 알고리즘에 따라 최대 가중치를 매칭하여 방송편성정보를 생성하는 단계;를 포함하고,
    상기 인공지능 매출 예측 모듈은 심층신경망 예측기와 통계적 예측기로 구성되되, 상기 심층신경망 예측기는 판매기록이 있는 상품-시간대 조합에 대해 예측하고 날씨, 휴일 변수를 반영하고, 상기 통계적 예측기는 평활화 또는 SVD 기법을 통해 데이터에 희박성을 완화하고,
    상기 심층신경망 예측기와 상기 통계적 예측기가 출력한 예상 매출은 아래 식과 같이 가중평균에 의해 결합되는 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법.
    Figure 112018022099320-pat00034
    ,
    Figure 112018022099320-pat00035
    은 심층신경망 예측기가 출력한 상품 x를 시간 y에 편성했을 때 예상되는 매출,
    Figure 112018022099320-pat00036
    은 통계적 예측기가 출력한 상품 x를 시간 y에 편성했을 때 예상되는 매출,
    Figure 112018022099320-pat00037
    는 심층신경망의 가중치
  2. 제1항에 있어서,
    상기 (a) 단계는,
    상품정보, 판매시간 정보, 외부요인 정보를 기반으로 과거 매출 기록으로부터 예상 매출을 학습하는 단계를 포함하는 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법.
  3. 제1항에 있어서,
    상기 (b) 단계는,
    판매상품, 판매시간 및 예상 매출을 이분그래프로 표현한 후 이분그래프 매칭을 이용해 최적 방송 편성을 제공하고,
    동일 상품이 연속된 시간대에 배치되는 것을 예방하는 단계를 더 포함하고,
    상기 최적 방송 편성은,
    각 상품 x과 편성시간 y간 연결에지(x,y)에는 그 상품 x를 시간대 y에 편성했을 때의 예상 매출을 가중치로 배정하고, 이분그래프에서 X,Y간 에지 가중치의 합을 최대화하는 매칭은 최적 예상 매출을 최대화하는 방송편성을 의미하고, 이러한 그래프 G에서 각 시간대 y를 각 판매 상품 x와 연결하면서, 선택된 min(|X|, |Y|)개 에지들의 연결가중치w(x, y)의 총합을 최대화하기 위해 아래 식에 따라 매칭을 찾는 빅데이터 딥러닝 기반의 T커머스 방송편성정보 제공방법.
    Figure 112018022099320-pat00038
KR1020170018034A 2016-12-20 2017-02-09 빅데이터 딥러닝 기반의 t커머스 방송편성정보 제공방법 Active KR101887196B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020160174542 2016-12-20
KR20160174542 2016-12-20

Publications (2)

Publication Number Publication Date
KR20180071906A KR20180071906A (ko) 2018-06-28
KR101887196B1 true KR101887196B1 (ko) 2018-09-06

Family

ID=62780558

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170018034A Active KR101887196B1 (ko) 2016-12-20 2017-02-09 빅데이터 딥러닝 기반의 t커머스 방송편성정보 제공방법

Country Status (1)

Country Link
KR (1) KR101887196B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110599234A (zh) * 2019-08-13 2019-12-20 广东工业大学 一种产品销售预测方法
KR102385407B1 (ko) * 2020-11-17 2022-04-11 에스케이스토아 주식회사 방송 연출 정보 생성 방법 및 그 장치
KR102522676B1 (ko) * 2020-11-17 2023-04-17 에스케이스토아 주식회사 데이터 분석 서버, 송출 예정된 커머스 컨텐츠에 대한 예상 판매 정도를 산출하는 방법 및 컴퓨터 프로그램

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101467707B1 (ko) * 2013-12-23 2014-12-02 포항공과대학교 산학협력단 지식 베이스의 개체 매칭 방법 및 이를 위한 장치

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2010203781B9 (en) * 2009-01-07 2013-12-05 3M Innovative Properties Company System and method for concurrently conducting cause-and-effect experiments on content effectiveness and adjusting content distribution to optimize business objectives

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101467707B1 (ko) * 2013-12-23 2014-12-02 포항공과대학교 산학협력단 지식 베이스의 개체 매칭 방법 및 이를 위한 장치

Also Published As

Publication number Publication date
KR20180071906A (ko) 2018-06-28

Similar Documents

Publication Publication Date Title
CN112183818A (zh) 一种推荐概率预测方法、装置、电子设备及存储介质
WO2017106977A1 (en) End-to-end deep collaborative filtering
EP2071473A9 (en) Method for solving minimax and linear programming problems
KR101887196B1 (ko) 빅데이터 딥러닝 기반의 t커머스 방송편성정보 제공방법
US10496651B2 (en) User recommendation generation
CN109417644A (zh) 跨屏广告投放的收益优化
Lakshmanan et al. Sales demand forecasting using LSTM network
CN116739665A (zh) 信息投放方法、装置、电子设备及存储介质
Müller-Navarra et al. Sales forecasting with partial recurrent neural networks: Empirical insights and benchmarking results
CN117436955A (zh) 一种基于用户行为的商品推荐系统及方法
Bandeira et al. Comparison of selection and combination strategies for demand forecasting methods
Ahmadov et al. Deep learning-based approach for forecasting intermittent online sales
Wang et al. Prediction of loan rate for mortgage data: Deep learning versus robust regression
KR102642595B1 (ko) 광고물 주문 수요 예측 시스템 및 그의 동작 방법
CN114880575B (zh) 用户行为预测方法、装置、设备、介质及产品
Shahjalal et al. A user rating based collaborative filtering approach to predict movie preferences
Suzuki et al. TV advertisement scheduling by learning expert intentions
Mendel Type-1 Fuzzy Systems: Design Methods and Applications
CN116932657A (zh) 数据处理方法、装置、设备、存储介质及计算机程序产品
Godoy et al. Demand Forecasting of Fast-Moving Consumer Goods by Deep Learning-Based Time Series Analysis
Khanarsa et al. Self-identification deep learning ARIMA
Singh et al. Optimal production policy for multi-product with inventory-level-dependent demand in segmented market
TW202221548A (zh) 階層式時間序列預測方法
Wan et al. Forecasting E-commerce Key Performance Indicators
Jones Short-term traffic forecasting for a smart satellite communications system

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20170209

PA0201 Request for examination
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20180104

Patent event code: PE09021S01D

PG1501 Laying open of application
E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20180724

PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20180803

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20180806

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20210723

Start annual number: 4

End annual number: 4

PR1001 Payment of annual fee

Payment date: 20220707

Start annual number: 5

End annual number: 5

PR1001 Payment of annual fee

Payment date: 20230720

Start annual number: 6

End annual number: 6

PR1001 Payment of annual fee

Payment date: 20240716

Start annual number: 7

End annual number: 7