KR101435096B1 - 소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법 - Google Patents

소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법 Download PDF

Info

Publication number
KR101435096B1
KR101435096B1 KR1020120102920A KR20120102920A KR101435096B1 KR 101435096 B1 KR101435096 B1 KR 101435096B1 KR 1020120102920 A KR1020120102920 A KR 1020120102920A KR 20120102920 A KR20120102920 A KR 20120102920A KR 101435096 B1 KR101435096 B1 KR 101435096B1
Authority
KR
South Korea
Prior art keywords
data
sns
marker
sns data
product
Prior art date
Application number
KR1020120102920A
Other languages
English (en)
Other versions
KR20140037384A (ko
Inventor
김경현
이형우
김의기
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Priority to KR1020120102920A priority Critical patent/KR101435096B1/ko
Publication of KR20140037384A publication Critical patent/KR20140037384A/ko
Application granted granted Critical
Publication of KR101435096B1 publication Critical patent/KR101435096B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

상품 수요 예측 시, 기설정된 상품에 대한 매출 통계 데이터를 수집하고, 기설정된 상품에 대한 매출 통계 데이터를 수집하여 저장하고, 원본 SNS 데이터를 수집하여 저장하고, 저장된 SNS 데이터로부터 상품과 관련된 기설정된 키워드 중 적어도 하나가 포함된 유효 SNS 데이터를 추출하고, 유효 SNS 데이터에 포함된 단어 별 사용 빈도와 매출 통계 데이터와의 상관도에 기초하여 유효 SNS 데이터의 단어들로부터 마커를 결정하고, 저장된 SNS 데이터 내에서의 마커의 사용 비율을 산출하고, 마커의 사용 비율 및 매출 통계 데이터에 기초하여 예측 목표일에 대응하는 상품 수요 예측 값을 산출한다.

Description

소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법{APPARATUS AND METHOD FOR PREDICTION OF MERCHANDISE DEMAND USING SOCIAL NETWORK SERVICE DATA}
본 발명은 소셜 네트워크 서비스(SNS, Social Network Service) 데이터에 기반하여 상품의 수요를 예측하는 상품 수요 예측 장치 및 방법에 관한 것이다.
정확한 수요 예측은 기업에서 제품이나 서비스에 대한 미래의 소비자 수요를 추정하는 것으로서, 기업에서 가장 중요한 경영의 바로미터이기도 하다. 이러한, 수요 예측은 기업 전략 및 생산 계획을 연결시켜 주는 기능을 하며, 정확한 수요 예측은 정확한 판매 예측 및 생산 계획을 가능하게 한다. 이를 통해, 기업의 경영 방침 및 생산 계획이 소비자 요구 및 수요 변화에 정확히 대응하도록 수립할 수 있으며, 효율적인 생산 능력 및 재고 관리를 가능하게 한다.
그런데, 최근의 세계 경제 상황의 급변, 소비 트랜드의 잦은 변화 및 대체 기술의 부상 등으로 인해 상품 수요 수명의 주기가 짧아지고 있으며 수요의 변동이 불확실해져 안정된 생산 계획을 수립하기 위한 수요 예측의 중요성이 더욱 커지고 있는 상황이다. 특히, 기업 경영 입장에서는 수요 예측 시 큰 수요 결정도 문제가 되지만, 너무 적은 수요 결정도 매우 위험한 결과를 가져오게 되므로 정확한 수요 예측이 필요하다.
이와 같은 문제를 해결하기 위하여 기존에는 기업 경영 결정에 필요한 과학적 근거로서 상품 및 매출에 관한 방대한 자료 수집하거나 통계적인 예측 기법을 도입하여 상품 수요 예측을 수행하여 왔다. 구체적으로, 기존의 수요 예측 시 단순히 판매 자료에 의존하여 전년도 또는 전분기의 실적을 참고하거나, 상품에 관한 소비자와 시장의 특성, 상품의 종류, 수량, 및 품질 등의 복잡한 데이터 분석이 필요하다는 점에서 수요 예측의 신뢰성 및 간편성에서 한계가 있었다.
이와 관련하여, 대한민국공개특허 제2010-003117호(영업상황 종합분석 대시보드 지원 시스템)에서는, 기 저장되어 있던 각종 영업상황정보를 활용하여, 분석대상항목별 평가지표값을 산출할 수 있는 전산모듈, 각 분석대상항목별 평가지표값을 활용하여, 해당 분석대상항목별 평가지표값들의 분석정보를 산출할 수 있는 전산모듈, 산출 완료된 각 분석대상항목별 평가지표값 및 해당 데이터들의 분석정보를 취합한 후, 이를 하나의 정보제시화면 내에 일괄 표시한 DAB를 생성하고, 생성 완료된 DAB를 일선 영업업무를 담당하는 영업관계자 측에 지원할 수있는 전산모듈 등을 포함하는 영업상황 종합분석 대시보드 지원 시스템을 개시하고 있다.
본 발명의 일 실시예는 SNS 데이터를 이용하여 상품의 수요를 예측 분석하여 수요 예측 정보를 제공하는 수요 예측 장치 및 방법을 제공하고자 한다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 측면에 따른 상품 수요 예측 장치는, 상품 별 매출 통계 데이터를 입력 받아 저장하는 매출 통계 자료 저장부; 소셜 네트워크 서비스 서버가 제공하는 원본 SNS 데이터를 수집하여 저장하는 SNS 자료 수집부; 상기 저장된 SNS 데이터로부터 목표 상품과 관련된 기설정된 키워드 중 적어도 하나가 포함된 유효 SNS 데이터를 추출하는 유효 데이터 추출부; 상기 유효 SNS 데이터에 포함된 단어 별 사용 빈도와 상기 매출 통계 데이터와의 상관도에 기초하여 상기 유효 SNS 데이터의 단어들로부터 마커를 결정하는 마커 선별부; 상기 저장된 SNS 데이터 내에서의 상기 마커의 사용 비율을 산출하고, 상기 마커의 사용 비율 및 상기 매출 통계 데이터에 기초하여 예측 목표일에 대응하는 상품 수요 예측 값을 산출하는 상품 수요 예측부; 및 상기 산출된 상품 수요 예측 값에 기초한 상품 수요 예측 정보를 생성하여 제공하는 상품 수요 예측 정보 제공부를 포함한다.
또한, 본 발명의 다른 측면에 따른 상품 수요 예측 장치의 상품 수요 예측 방법은, (a) 소셜 네트워크 서비스 서버로부터 수집된 원본 SNS 데이터 및 입력된 상품 별 매출 통계 데이터를 각각 저장하는 단계; (b) 상기 저장된 SNS 데이터로부터 목표 상품과 관련된 기설정된 키워드 중 적어도 하나를 포함하는 유효 SNS 데이터를 추출하는 단계; (c) 상기 유효 SNS 데이터에 포함된 단어 별 사용 빈도와 상기 매출 통계 데이터와의 상관도에 기초하여 상기 유효 SNS 데이터의 단어들로부터 마커를 결정하는 단계; (d) 기설정된 기간의 상기 저장된 SNS 데이터 내 상기 마커에 대한 마커 사용 비율 값을 산출하는 단계; (e) 상기 마커 사용 비율 값 및 상기 매출 통계 데이터에 대해 선형 회귀 분석 처리하여 예측 목표일에 대응하는 상품 수요 예측 값을 산출하는 단계; 및 (f) 상기 산출된 상품 수요 예측 값에 기초한 상품 수요 예측 정보를 생성하여 사용자 단말에 제공하는 단계를 포함한다.
전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, SNS 데이터로부터 추출한 상품에 관련된 마커 데이터의 사용 빈도와 실제 상품의 매출 통계 데이터를 비교 분석함으로써 실시간으로 상품 수요 예측 분석의 결과를 모니터링할 수 있다. 즉, 기존의 수요 예측 방식에서는 상품과 관련하여 방대한 분야의 자료 수집 및 분석에 수 개월의 기간이 소요되는 반면, 본 발명에서는 실시간 SNS 데이터에 기반하여 상품의 수요 예측 분석을 수행함으로써 상품 수요 예측을 위한 자료의 획득 및 분석을 간편하고 신속하게 수행할 수 있다는 효과가 있다.
그리고, 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 대용량의 누적된 SNS 데이터 타임-라인을 정량화된 통계 데이터로 구축함으로써, SNS 데이터에 기반한 수요 예측 정보의 신뢰성 및 정확성을 높이는 효과가 있다.
그리고 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 다양한 상품에 대한 각각의 상품 수요 예측 분석을 수행하여 그 예측 정보를 제공할 수 있다는 효과가 있다.
또한, 본 발명의 과제 해결 수단 중 어느 하나에 의하면, SNS 데이터 중 특정 언어(특히, 한글) 별로 적합한 데이터 가공 처리를 하여 실제 매출 통계 데이터와 상관도가 높은 SNS 데이터를 상품 수요 예측 분석의 조건으로 사용함으로써 예측의 정확도를 높일 수 있다는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 상품 수요 예측 장치의 구성을 나타내는 블록도이다.
도 2는 본 발명의 일 실시예에서 SNS 데이터 내 상품 별 마커 단어의 월 사용 횟수를 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에서 SNS 데이터 내 상품 별 마커 단어의 월 사용 빈도를 나타낸 그래프이다.
도 4는 본 발명의 일 실시예에서 LASSO(Least-Absolute Shrinkage And Selection Operator) 분석을 통한 마커 선별 방식을 설명하기 위한 상품 별 매출 통계 데이터 및 마커 사용 빈도 간의 상관도를 나타낸 그래프의 일례이다.
도 5는 본 발명의 일 실시예에서 SNS 데이터 내 마커의 사용 비율과 상품의 매출 통계 데이터에 기초하여 상품 수요 예측 분석을 수행한 결과를 나타내는 그래프의 일례이다.
도 6은 본 발명의 일 실시예에서 제공하는 기간 별 상품 수요 예측 분석 정보의 일례를 나타내는 그래프이다.
도 7은 본 발명의 일 실시예에 따른 상품 수요 예측 분석의 다른 상품에 대한 적용에 따른 SNS 데이터를 이용한 상품 수요 예측 분석의 결과를 설명하기 위한 그래프의 일례이다.
도 8은 본 발명의 일 실시예에 따른 상품 수요 예측 방법을 설명하기 위한 순서도이다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
도 1은 본 발명의 일 실시예에 따른 상품 수요 예측 장치의 구성을 나타내는 블록도이다.
도 1에 도시한 바와 같이, 본 발명의 일 실시예에 따른 상품 수요 예측 장치(100)는 SNS 자료 수집부(110), 매출 통계 자료 저장부(120), 데이터베이스(130), 유효 데이터 추출부(140), 마커 선별부(150), 마커 매트릭스 생성부(160), 상품 수요 예측부(170) 및 상품 수요 예측 정보 제공부(180)를 포함하여 구성된다.
SNS 자료 수집부(110)는 소셜 네트워크 서비스 서버(10)가 제공하는 SNS 데이터(이하, ‘원본 SNS 데이터’라고 함)를 수집하여 데이터베이스(130)에 저장(이하, ‘저장 SNS 데이터’라고 함)하되, 사전에 저장되어 있던 일별 저장 SNS 데이터에 업데이트하여 저장한다. 참고로, SNS 서버(10)로부터 제공되는 SNS 데이터는 가공되지 않은 상태의 데이터 즉, 미가공 데이터(raw data)이다. 그리고, SNS 데이터는 복수의 계정 별 사용자가 SNS 서버(10) 상에 업로드하는 텍스트(text) 데이터를 의미한다.
본 발명의 실시예에서는 다수의 SNS 별로 제공하는 작성 툴(tool)을 이용하여 사용자가 일회에 작성(즉, 업로드)하는 텍스트 데이터의 기본 단위(예를 들어, ‘멘션’, ‘트윗’ 등의 용어로 지칭되는 단위)를 개별 SNS 데이터라 지칭하도록 하며, 이러한 개별 SNS 데이터는 음절, 단어, 구, 절, 및 문장 중 적어도 하나의 단위가 포함된다.
그리고, 본 발명의 일 실시예에서는 SNS 서버(10)가 SNS 데이터를 불특정 다수에게 랜덤 제공하는 오픈형 SNS 서버인 것을 예로서 설명하나, SNS 자료 수집부(110)가 인터넷에서 상용되고 있는 SNS 데이터 수집 장치 또는 애플리케이션을 통해 실시간으로 발행되는 SNS 데이터를 수집하는 것도 가능하다.
한편, SNS 자료 수집부(110)는 상품 수요 예측 분석을 위한SNS 데이터를 효율적으로 검출하여 제공하기 위하여, 원본 SNS 데이터를 관계형 데이터베이스 형태로 저장할 수 있다. 예를 들어, 원본 SNS 데이터를 사용자 계정 별로 분류하여 테이블 형태로 저장할 수 있다.
또한, SNS 자료 수집부(110)는 원본 SNS 데이터를 기설정된 추출 조건에 따라 선별하여 데이터베이스(130)에 저장함으로써 저장 SNS 데이터를 구성 할 수 있다.
구체적으로, SNS 자료 수집부(110)는 원본 SNS 데이터 중 기설정된 특정 언어의 SNS 데이터를 검출하거나, 하이퍼링크(hyper link)를 포함하는 SNS 데이터를 제거하거나, 기설정된 스팸(SPAM) 단어를 포함하는 SNS 데이터를 제거하거나, 각 SNS 계정 별로 해당 계정의 사용자 이외의 사용자에 의해 작성된 SNS 데이터(예를 들어, 리트윗(RT, Retweet) 등)를 제거하는 것 중 적어도 하나의 처리를 통해 저장할 SNS 데이터를 선별할 수 있다. 참고로, 이상의 SNS 데이터 선별 방법은 원본 SNS 데이터에 대해 각 처리가 공통 또는 별개로 적용되거나, 동시 또는 단계 별로 적용될 수 있다.
본 발명의 일 실시예에서는, SNS 자료 수집부(110)가 한글로 작성된 SNS 데이터를 선별하여, 선별된 한글 SNS 데이터에 대해 나머지 추출 조건에 따른 선별 및 이를 이용한 상품 수요 예측 분석을 처리하는 것을 설명하도록 한다. 이는, 다른 종류의 언어 중에서도 한글이 가지고 있는 특성 중, 구성 방식, 다양한 어미 변화, 다양한 동음이의어, 다양한 단어 활용형, 신조어, 및 띄어 쓰기 등을 적용한 분석을 효율적으로 처리하는 방식을 설명하기 위한 것으로서, 다른 종류의 언어에도 각각 적합한 데이터 가공 전처리를 적용할 수 있다.
한편, 이하 도 2 내지 도 7을 통해 설명할 본 발명의 일 실시예에 따른 상품 수요 예측 장치(100)에서 상품 수요 예측 분석 시 사용한 SNS 데이터들은 1년 이상 누적된 2억 6천만건 이상의 SNS 데이터의 타임-라인으로서, 이와 같은 대용량의 SNS 데이터에 기반하여 수요 예측 분석을 수행함으로써 수요 예측 시 실제 매출 통계 데이터와의 긴밀성(즉, 정확성)을 높일 수 있다.
매출 통계 자료 저장부(120)는 적어도 하나의 상품에 대한 매출 통계 데이터(예를 들어, 기간 별 매출액 데이터 등)를 저장하되, 상품 수요 예측 장치(100)에 자체적으로 포함되어 있거나 연동되는 입력 장치(미도시)를 통해 매출 통계 데이터를 입력 받아 데이터베이스(130)에 저장한다. 이때, 매출 통계 자료 저장부(120)는 입력된 매출 통계 데이터를 사전에 데이터베이스(130)에 기저장되어 있던 상품 별 매출 통계 데이터에 업데이트하여 저장한다.
참고로, 본 발명의 일 실시예에서 매출 통계 데이터는 각 상품의 생산 및 판매 사업체에서 자체적으로 생성하여 제공하는 매출 관련 통계 데이터이거나, 매출 통계 자료 저장부(120)가 자체적으로 외부 장치로부터 수집한 매출 관련 통계 데이터 일 수 있다. 또한, 본 발명의 일 실시예에서 상품은 물리적으로 생산 및 판매되는 재화뿐만 아니라 소비자에게 제공되는 서비스 등의 무형의 상품을 포함하는 개념이다.
구체적으로, 매출 통계 자료 저장부(120)는 매출 통계 데이터 수집 모듈(121)을 포함할 수 있으며, 매출 통계 데이터 수집 모듈(121)은 상품에 관련된 매출 통계 데이터를 제공하는 외부 장치로부터 상품 별 매출 통계 데이터를 획득하여 데이터베이스(130)에 저장할 수 있다.
예를 들어, 도 1에 도시한 바와 같이 매출 통계 데이터 수집 모듈(121)은 웹 사이트를 제공하는 웹 서버(20) 등의 외부 장치에 접속하여, 상기 웹 사이트를 통해 목표 상품 별로 매출 통계 데이터를 검색하여 그 결과로서 상품에 관련된 매출 통계 데이터를 획득할 수 있다.
이때, 매출 통계 자료 데이터 수집 모듈(121)은 상품과 관련된 월별 매출 자료 관련 기사를 수집하여 매출 통계 데이터를 획득하고, 획득된 월별 매출 데이터를 기설정된 수학적 보간법(interpolation)을 통해 일별 매출액으로 환산하여 저장할 수 있다.
데이터베이스(130)는 SNS 자료 수집부(110)로부터 수집된 SNS 데이터 및 매출 통계 자료 저장부(120)를 통해 저장된 매출 통계 데이터를 포함하여, 상품 수요 예측 분석 처리에 필요한 기준 데이터들을 저장한다. 그리고, 데이터베이스(130)는 상품 수요 예측 장치(100)의 각 구성 요소(즉, 유효 데이터 추출부(140), 마커 선별부(150), 마커 매트릭스 생성부(160), 상품 수요 예측부(170) 및 상품 수요 예측 정보 제공부(180))가 요청하는 데이터들을 검출하여 제공한다.
또한, 도 1에는 각 데이터를 저장하고 있는 데이터베이스(130)를 하나의 개념으로 나타내었으나, 데이터베이스(130)의 기능 및 저장되어 있는 데이터의 종류에 따라 다수의 분리된 데이터베이스(130) 형태로 포함되는 것도 가능하다.
예를 들어, 본 발명의 일 실시예에 따른 데이터베이스(130)는 SNS 데이터, 매출 통계 데이터, 유효 SNS 데이터 추출을 위한 기준인 키워드 데이터, 스팸형 SNS 데이터를 제거하기 위한 기준인 스팸 단어 데이터, SNS 데이터 내 단어들의 각 기본형을 검출하기 위한 단어 활용형 데이터, 및 예측 분석에 유효한 SNS 데이터를 선별하기 위해 적합한 키워드의 사용을 검출하기 위한 동음이의어 데이터를 각각 저장하는 복수의 데이터베이스들(미도시)이 분리되어 구비될 수 있다. 참고로, 키워드 데이터, 스팸 단어 데이터, 단어 활용형 데이터, 및 동음이의어 데이터 등의 기준 데이터들은 ‘언어 온톨로지’ 형태일 수 있으며, ‘언어 온톨로지’는 단어와 그 관계들로 구성된 일종의 사전일 수 있다.
유효 데이터 추출부(140)는 원본 SNS 데이터로부터 수요를 예측하고자 하는 목표 상품과 관련된 기설정된 키워드 중 적어도 하나가 포함된 유효 SNS 데이터를 추출한다. 이때, 유효 데이터 추출부(140)는 사용자의 요청의 또는 사전에 설정된 예측 목표일의 원본 SNS 데이터로부터 유효 SNS 데이터를 추출하거나, 주/일/시 별로 원본 SNS 데이터 중 유효 SNS 데이터를 자동 추출할 수 있다.
구체적으로, 유효 데이터 추출부(140)는 원본 SNS 데이터 중 SNS 자료 수집부(110)가 선별한 SNS 데이터(즉, 상기 추출 조건을 만족하는 한글 SNS 데이터)로부터, 목표 상품과 관련하여 사전에 설정된 키워드들을 포함하는 SNS 데이터를 유효 SNS 데이터로 추출한다. 일례로서, 상품의 이름, 해당 상품 관련 광고 문구, 상품의 품목, 상품의 특징 등을 키워드로 사용할 수 있다.
또한, 유효 데이터 추출부(140)는 키워드를 포함하는 SNS 데이터 중 키워드와 관련하여 키워드와의 동음이의어를 포함하는 SNS 데이터를 선택적으로 제거 처리하여 유효 SNS 데이터를 추출할 수 있다.
구체적으로, 유효 데이터 추출부(140)는 사전에 저장되어 있는 동음이의어 데이터에 기초하여 개별 SNS 데이터를 분석한다. 예를 들어 설정된 목표 상품의 품목이 ‘라면’이고, 키워드 중 어느 하나를 ‘라면’으로 설정한 경우, 저장 SNS 데이터 중 "한국에는 볼 것이 아주 많은데..1박 2일이라면 자는 시간도 아깝겠다."와 같이 키워드(즉, ‘라면’)의 동음이의어를 포함하는 개별 SNS 데이터를 제거할 수 있다. 예를 들어, 유효 데이터 추출부(140)는 기저장된 키워드 별 동음이의어와 상용적으로 함께 사용되는 적어도 하나의 단어가 개별 SNS 데이터 내에 포함되어 있을 경우 해당 SNS 데이터를 제거할 수 있다. 또한, 유효 데이터 추출부(140)는 키워드의 띄어쓰기 여부에 따라 키워드의 앞 및 뒤 중 적어도 하나에 음절이 결합된 형태에 기준하여 해당 키워드의 동음이의어 여부를 판단하는 것도 가능하다. 이처럼, 키워드를 포함하는 SNS 데이터 중 키워드를 포함하되 키워드와 직접적으로 또는 내용적으로 연관이 없는 SNS 데이터를 선택적으로 필터링하여 상품의 수요 예측 분석의 유효성을 높일 수 있다.
마커 선별부(150)는 유효 SNS 데이터에 포함된 단어 별 사용 빈도를 산출하고, 산출된 단어 별 사용 빈도와 매출 통계 데이터 간의 상관도를 분석하여, 분석의 결과에 기초하여 유효 SNS 데이터에 포함된 단어 중 마커를 결정한다.
이때, 마커 선별부(150)는 유효 SNS 데이터들에 포함된 단어 별 사용 빈도와 매출 통계 데이터에 대해 LASSO 분석을 수행한다. 그리고, 마커 선별부(150)는 LASSO 분석을 통해 산출된 단어 별 상관 계수가 기설정된 임계치 이상인 단어이거나 상관 계수의 값이 높은 순서에 따라 기설정된 순위 범위까지의 단어를 마커로 설정할 수 있다.
구체적으로, 마커 선별부(150)는 유효 SNS 데이터에 포함된 개별 SNS 데이터들을 각각 빈칸에 기준하여 개별 단어로 구분하고, 사전에 저장된 단어활용형 데이터에 기초하여 상기 구분된 단어 별로 각각 매칭되는 기본형을 검출하여, 동일한 기본형을 갖는 단어들의 유효 SNS 데이터들 내 사용 횟수를 총합하여 단어 별 사용 빈도를 산출한다. 참고로, 기본형 단어는 대상 단어에서 어미와 조사를 제거한 형태의 단어를 기저장된 단어활용형 데이터와 비교하여 결정할 수 있다.
그리고, 마커 선별부(150)는 단어 사용 빈도가 높은 순서에 따라 기설정된 순위 범위까지의 단어 또는 기설정된 기준 사용 빈도 이상으로 사용된 단어를 판단하여, 판단된 적어도 하나의 단어를 마커 후보 단어로 선별한다.
이처럼, 유효 SNS 데이터 내 사용 빈도가 높은 단어를 마커 후보 단어로 선별함으로써 목표 상품의 매출 통계 데이터와의 관련도가 상대적으로 높은 단어들을 추출할 수 있다.
참고로, 하기 도 2 내지 도 4에서와 같이 SNS 데이터 내 포함되는 단어 중 마커 후보 단어의 사용 빈도와 해당 상품의 매출 통계 데이터와의 높은 관련도를 확인할 수 있다.
도 2는 본 발명의 일 실시예에서 SNS 데이터 내 상품 별 마커 단어의 월 사용 횟수를 설명하기 위한 도면이다. 그리고, 도 3은 본 발명의 일 실시예에서 SNS 데이터 내 상품 별 마커 단어의 월 사용 빈도를 나타낸 그래프이다.
도 2에서는, 수집된 SNS 데이터 중 기간 별 유효 SNS 데이터의 개수와 각 상품 별 마커 단어의 사용 횟수를 나타내었다. 이때, 도 2에서는 상품의 품목 중 ‘라면’에 포함되는 다양한 상품들과 관련하여 각각 해당 상품의 상품명(도 2에서는, ‘A 라면’ 내지 ‘S 라면’으로 나타냄)가 마커 후보 단어 중 하나로 설정된 것을 나타내었다. 이에 따라, 도 3에서와 같이 각 상품 별로 기간에 따라 유효 SNS 데이터 내 마커 단어(즉, 상품명)의 사용 빈도를 그래프로 나타낼 수 있다.
한편, 마커 선별부(150)는 마커 후보 단어 별 사용 빈도와 목표 상품의 매출 통계 데이터를 LASSO 분석하고, 마커 후보 단어 별로 매출 통계 데이터와의 상관 계수(Weighting coefficient)를 산출한다. 참고로, 유효 SNS 데이터 내 단어들은 각각 매출 통계 데이터와의 상관 관계도에 따라 '+' 또는 '-'의 상관 계수 값으로 표현될 수 있다. 이때, 마커 선별부(150)는 상관 계수가 기설정된 임계치 이상이거나 상관 계수 값이 높은 순서에 따라 기설정된 순위 범위까지의 단어를 마커로 결정한다.
예를 들어, 도 4는 본 발명의 일 실시예에서 LASSO 분석을 통한 마커 선별 방식을 설명하기 위한 상품 별 매출 통계 데이터 및 마커 사용 빈도 간의 상관도를 나타낸 그래프의 일례이다.
도 4의 (a) 및 (b)에서는 각각 도 2에서의 상품 중 ‘B 라면’과 ‘C 라면’의 각 마커 단어(즉, 상품명)의 기간 별 사용 빈도와, 동일 기간 내 특정 기간의 해당 상품의 매출 통계 데이터(도 4에서는 ‘매출액’을 나타냄) 간의 상관도를 그래프 형태로 나타내었다.
도 4에서는, 상품 별로 유효 SNS 데이터 내 사용 빈도가 높은 마커 후보 단어 중 어느 하나의 마커 단어(즉, 상품명)에 대한 기간 별 사용 빈도와 상품의 매출 통계 데이터와의 상관도 만을 예시적으로 나타내었으나, 본 발명의 일 실시예에서는 각 마커 후보 단어 별 사용 빈도와 매출 통계 데이터 간의 LASSO 분석을 통해 복수개의 마커를 선별함으로써 다수의 마커를 이용하여 매출 통계 데이터와의 상관도가 더욱 긴밀해지도록 할 수 있다.
다시 도 1로 돌아가서, 마커 매트릭스 생성부(160)는 저장 SNS 데이터 내에서 기설정된 기간 단위(예를 들어, 일 단위 또는 주 단위 등)의 마커의 사용 횟수와 해당 기간 단위의 저장 SNS 데이터 총 개수를 추출하여 마커 매트릭스를 생성한다.
구체적으로, 마커 매트릭스 생성부(160)는 상품 수요 예측부(170)의 입력 데이터로서 활용될 저장 SNS 데이터 내 마커의 기간 단위 총 사용 횟수 및 동일 기간의 저장 SNS 데이터의 총 개수를 포함하는 마커 매트릭스를 생성한다.
상품 수요 예측부(170)는 마커 매트릭스 생성부(160)에서 생성된 마커 매트릭스를 이용하여 저장 SNS 데이터 내에서의 마커의 사용 비율을 산출하고, 마커의 사용 비율 및 매출 통계 데이터에 기초하여 예측 목표일에 대응하는 상품 수요 예측 값을 산출한다.
구체적으로, 상품 수요 예측부(170)는 마커 매트릭스에 포함된 저장 SNS 데이터 내에서의 마커의 총 사용 횟수 및 동일 기간의 저장 SNS 데이터의 총 개수에 기초하여, 마커의 총 사용 횟수를 저장 SNS 데이터의 총 개수로 나눈 값을 마커 사용 비율 값으로 산출한다. 그리고, 상품 수요 예측부(170)는 마커 사용 비율 값 및 매출 통계 데이터에 대해 선형 회귀(linear regression) 분석을 수행하여 상품 수요 예측 값을 산출한다.
예를 들어, 도 5는 본 발명의 일 실시예에서 SNS 데이터 내 마커의 사용 비율과 상품의 매출 통계 데이터에 기초하여 상품 수요 예측 분석을 수행한 결과를 나타내는 그래프의 일례이다.
도 5에서는, 복수 개의 마커를 이용하여 선형 회귀 예측 분석을 수행한 결과와 동일 기간에서의 매출 통계 데이터 간의 상관 관계를 나타내었다. 이처럼, SNS 데이터 내 마커의 사용 비율에 기초하여 매출 통계 데이터와의 선형 회귀 분석을 수행함으로써, 실제 상품 수요의 변화 패턴과 거의 동일한 수요 예측 패턴을 산출할 수 있다. 참고로, 앞서 도 4에서 설명한 바와 같이 사용되는 마커의 개수가 많을수록 산출된 상품 수요 예측 값과 매출 통계 데이터 간의 상관 관계는 더욱 긴밀해진다.
한편, 상품의 소비 특성에 따라 실제 상품 소비 패턴은 유행 시즌 별로 유사할 수 있고, SNS 데이터 사용자 들의 글쓰기 습관 또한 일정하게 유지된다고 가정할 수 있다.
이에 따라, 상품 수요 예측부(170)는 상품의 이전 유행 시즌(예를 들어, 년 또는 월 단위)의 데이터가 확보되지 않은 경우, 현재 유행 시즌의 매출 통계 데이터 및 SNS 데이터와 현재 유행 시즌의 매출 통계 데이터 및 SNS 데이터로부터 추출된 마커 데이터 중 적어도 하나의 데이터를 이전 유행 시즌 데이터로서 중복(즉, 대체) 사용할 수 있다. 이는, 상품 수요 예측의 정밀한 산출을 위해서는 이전 유행 시즌의 데이터들이 중요하기 때문이다. 즉, 현재 유행 시즌의 데이터만을 이용하여 선형 회귀 분석을 수행한 상품 수요 예측 결과보다, 이전 유행 시즌의 데이터를 포함한 데이터를 이용하여 선형 회귀 분석을 수행한 상품 수요 예측 결과 값이 매출 통계 데이터와의 상관 관계가 긴밀할 수 있다.
이때, 상품 수요 예측부(170) 사전에 상품의 특성이 매년 유행 시즌이 존재하는 상품으로 설정된 경우, 상기에서와 같이 현재 유행 시즌의 데이터를 이전 유행 시즌의 데이터를 대체하여 중복 사용할 수 있다.
다시 도 1로 돌아가서, 상품 수요 예측 정보 제공부(180)는 상품 수요 예측부(170)가 산출한 상품 수요 예측 값에 기초하여, SNS 데이터에 기반한 상품 수요 예측 정보를 제공한다. 예를 들어, 상품 수요 예측 정보 제공부(180)는 산출된 상품 수요 예측 값의 날짜 별 변화를 그래프 형태로 출력할 수 있다.
예를 들어, 도 6은 본 발명의 일 실시예에서 제공하는 기간 별 상품 수요 예측 분석 정보의 일례를 나타내는 그래프이다.
도 6에서는, 상품 중 ‘B 라면’의 2011년 10월부터 2012년 4월까지의 매출 통계 데이터(매출액)의 변화 패턴과, 매출 통계 기간을 포함하는 기설정된 기간 동안의 마커 사용 비율 및 상품 수요 예측 분석 값을 그래프 상에 비교하여 나타내었다. 참고로, 도 6에서 마커 사용 비율은 복수의 마커(도 6에서는 50개의 마커를 나타냄)의 사용 비율의 기간 별 변화량을 나타내었다.
도 6에서와 같이, SNS 데이터 기반의 상품 수요 예측 분석을 통해 상품의 매출 통계 기간 이후(즉, 도 6에서의 2012년 5월부터 2012년 7월까지)의 상품 수요 예측 정보를 제공할 수 있다. 참고로, 사실상 매출 통계 데이터는 업데이트(또는 저장) 당일로부터 대략 수일 또는 수 개월 이전의 상품 매출 데이터를 통계한 것인데 비해, 본 발명의 실시예에서는 SNS 데이터에 기초하여 상품 수요 예측 값을 산출함으로써 상품에 대한 매출 통계 데이터가 수집되지 않은 상태에서 또는 매출 통계 데이터의 통계일보다 최신의 상품 수요를 실시간으로 예측할 수 있다.
상품 수요 예측 정보 제공부(180)는 사용자 단말(미도시) 또는 자체적으로 포함한 출력부를 통해 상품 수요 예측 정보가 출력될 수 있도록 포맷화된 상품 수요 예측 정보를 제공할 수 있다. 참고로, 사용자 단말(미도시)은 개인 단말이거나, 상품을 생산 또는 사업체의 단말 등 다양한 사용자의 단말을 의미한다.
한편, 상품 수요 예측 정보 제공부(180)가 제공하는 상품 수요 예측 정보는 상품 수요 예측 값 및 매출 통계 데이터의 변화를 비교한 그래프 형태의 정보를 포함하되, 각 사용자 단말에서는 목적에 따라 상기 상품 수요 예측 정보를 이용할 수 있다.
일례로, 사용자 단말이 개인 사용자의 스마트 폰인 경우, 사전에 설치된 애플리케이션을 통해 상품 상황 예측을 요청할 수 있으며, 이에 따라 상품 수요 예측 장치(100)로부터 예측 목표일에 대한 상품 수요 예측 값을 포함하는 상품 수요 예측 정보를 수신하여 출력할 수 있다.
구체적으로, 상품 수요 예측 정보 제공부(180)가 사용자 단말(스마트 폰)로 예측 목표일의 상품 수요 예측 값을 포함하는 상품 수요 예측 정보를 제공하여, 사용자 단말(스마트 폰)의 화면에, 기간 별 상품 매출 통계 데이터 및 상품 수요 예측 데이터가 서로 비교될 수 있도록 그래프 형태로 출력될 수 있다. 또한, 사용자 단말(스마트 폰)의 화면에 SNS 데이터에 포함된 GPS 정보를 이용한 지역별 상품 수요가 지도 상에 매핑되어 출력될 수 있으며, 상품의 예측 수요 변화에 대한 진단 및 생산 계획 등에 대한 정보가 출력될 수 있다.
한편, 이상에서는 본 발명의 일 실시예에 따른 상품 수요 예측 장치(100)가 ‘라면’ 품목에 대한 매출 통계 데이터 및 SNS 데이터를 이용하여 상품 수요를 예측하는 것을 설명하였으나, 다른 상품에 대해서도 동일한 방식으로 상품 수요를 예측할 수 있다.
예를 들어, 도 7은 본 발명의 일 실시예에 따른 상품 수요 예측 분석의 다른 상품에 대한 적용에 따른 SNS 데이터를 이용한 상품 수요 예측 분석의 결과를 설명하기 위한 그래프의 일례이다.
도 7에서는, ‘커피 전문점’에 대한 상품 수요 예측을 수행한 결과를 나타내었다.
구체적으로, 도 7에서는 상품 중 ‘커피 전문점’의 A 매장의 년간 매출액의 월별 변화 패턴과, 커피 전문점의 대표 상품인 커피와 관련된 키워드를 이용하여 선별된 SNS 데이터 내 복수의 단어를 매출액 데이터와 LASSO 분석하여 선별한 복수 개의 마커의 사용 비율 값의 변화 패턴과, 마커의 사용 비율 값 및 매출액 데이터를 선형 회귀 분석하여 획득한 상품의 수요 예측 값의 변화 패턴을 그래프로 나타내었다. 이때, 도 7에서와 같이, 커피전문점 A 매장의 실제 매출액 데이터에 근접하며, 매출액 데이터가 존재하지 않는 2012년 6월 이후의 매출(즉, 수요)을 추정할 수 있는 수요 예측 정보를 제공할 수 있다. 참고로 도 7에서 점선으로 표시한 ‘실제 매출’은 사전에 수집되거나 저장되어 있던 매출 통계 데이터를 이용하여 수요 예측 분석을 수행한 이후에 실제로 획득된 매출 통계 데이터이다. 이를 통해, 상품 수요 예측 장치(100)를 통해 분석된 상품 수요 예측 값과 이후에 실제 매출 데이터의 상관도가 매우 긴밀한 것을 확인할 수 있다.
이하, 도 8을 참고하여 본 발명의 일 실시예에 따른 상품 수요 예측 방법에 대해서 상세히 설명하도록 한다.
도 8은 본 발명의 일 실시예에 따른 상품 수요 예측 방법을 설명하기 위한 순서도이다.
먼저, 소셜 네트워크 서비스 서버가 제공하는 원본 SNS 데이터 및 기설정된 상품에 대한 매출 통계 데이터를 수집하여 저장한다(S110).
이때, 원본 SNS 데이터(즉, 수집되어 저장되는 ‘저장SNS 데이터’)는 시간 또는 일 단위로 매일 업데이트되며, 매출 통계 데이터는 일/주/월 단위로 외부로부터 입력 또는 수집(웹 페이지 검색 등을 통해)되어 업데이트되거나 사전에 저장되어 있을 수 있다.
또한, 원본 SNS 데이터 중 기설정된 특정 언어를 사용하거나, 하이퍼링크(hyper link)의 불포함, 기설정된 스팸(SPAM) 단어의 불포함, 및 SNS 계정 별로 계정 사용자 이외의 사용자에 의해 작성된 데이터 불포함 중 적어도 하나의 조건을 만족하는 SNS 데이터를 수집하여 저장할 수 있다.
그런 다음, 수집한 원본 SNS 데이터로부터 상품과 관련된 기설정된 키워드를 적어도 하나 포함하는 유효 SNS 데이터를 추출한다(S120).
이때, 키워드를 포함하는 SNS 데이터 중 키워드와 관련하여 기설정된 키워드와의 동음이의어를 포함하는 SNS 데이터를 제거하여 유효 SNS 데이터를 추출할 수 있다.
다음으로, 유효 SNS 데이터 내의 단어 별 사용 횟수와 매출 통계 데이터에 기초하여, 유효 SNS 데이터 내의 단어 중에서 상품 수요 예측 분석을 위한 마커를 선별한다(S130).
구체적으로, 유효 SNS 데이터에 포함된 단어 별 사용 빈도를 산출하고, 단어 별 사용 빈도와 매출 통계 데이터에 대해 LASSO 분석을 하고, LASSO 분석 처리의 결과 산출된 유효 SNS 데이터에 포함된 단어 별 상관 계수에 기초하여 마커를 결정한다.
그런 후, 저장 SNS 데이터 내 마커 사용 비율 및 매출 통계 데이터에 대한 선형 회귀 분석 처리를 하여(S140), 예측 목표일의 상품 수요 예측 값을 산출한다(S150).
구체적으로, 저장 SNS 데이터에 대한 마커의 총 사용 횟수 및 저장 SNS 데이터의 총 개수에 기초하여 마커 사용 비율 값을 산출한 후, 마커 사용 비율 값 및 상기 매출 통계 데이터에 대해 선형 회귀 분석 처리하여 상기 상품 수요 예측 값을 산출한다.
다음으로, 산출된 상품 수요 예측 값을 포함하는 상품 수요 예측 정보를 제공한다(S160).
예를 들어, 날짜 별 상품 수요 예측 값 및 매출 통계 데이터의 변화를 비교한 그래프를 상품 수요 예측 정보로서 제공할 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.
또한, 본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수도 있다.
본 발명의 범위는 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
10: SNS 서버
20: 웹 서버
100: 상품 수요 예측 장치
110: SNS 자료 수집부
120: 매출 통계 자료 저장부
130: 데이터베이스
140: 유효 데이터 추출부
150: 마커 선별부
160: 마커 매트릭스 생성부
170: 상품 수요 예측부
180: 상품 수요 예측 정보 제공부

Claims (15)

  1. 상품 수요 예측 장치에 있어서,
    상품 별 매출 통계 데이터를 입력 받아 저장하는 매출 통계 자료 저장부;
    소셜 네트워크 서비스(SNS, Social Network Service) 서버가 제공하는 원본 SNS 데이터를 수집하여 저장하는 SNS 자료 수집부;
    상기 저장된 SNS 데이터로부터 목표 상품과 관련된 기설정된 키워드 중 적어도 하나가 포함된 유효 SNS 데이터를 추출하는 유효 데이터 추출부;
    상기 유효 SNS 데이터에 포함된 단어 별 사용 빈도와 상기 매출 통계 데이터와의 상관도에 기초하여 상기 유효 SNS 데이터의 단어들로부터 마커를 결정하는 마커 선별부;
    상기 저장된 SNS 데이터 내에서의 상기 마커의 사용 비율을 산출하고, 상기 마커의 사용 비율 및 상기 매출 통계 데이터에 기초하여 예측 목표일에 대응하는 상품 수요 예측 값을 산출하는 상품 수요 예측부; 및
    상기 산출된 상품 수요 예측 값에 기초한 상품 수요 예측 정보를 생성하여 제공하는 상품 수요 예측 정보 제공부를 포함하되,
    상기 상품 수요 예측부는,
    기설정된 기간의 상기 저장된 SNS 데이터에 대한 상기 마커의 총 사용 횟수 및 상기 저장된 SNS 데이터의 총 개수에 기초하여 마커 사용 비율 값을 산출하고, 상기 마커 사용 비율 값 및 상기 매출 통계 데이터에 대해 선형 회귀(linear regression) 분석을 수행하여 상기 상품 수요 예측 값을 산출하는 상품 수요 예측 장치.
  2. 제 1 항에 있어서,
    상기 마커 선별부는,
    상기 유효 SNS 데이터에 포함된 단어 별 사용 빈도와 상기 매출 통계 데이터에 대해 LASSO(Least-Absolute Shrinkage And Selection Operator) 분석을 수행하고,
    상기 LASSO 분석을 통해 산출된 상기 유효 SNS 데이터에 포함된 단어 별 상관 계수에 기초하여 상기 마커를 결정하는 상품 수요 예측 장치.
  3. 제 1 항에 있어서,
    상기 마커 선별부는,
    상기 유효 SNS 데이터의 단어 별로 기본형을 판단하여, 상기 기본형 별 총 사용 횟수를 상기 단어 사용 빈도로 산출하는, 상품 수요 예측 장치.
  4. 제 1 항에 있어서,
    기설정된 기간의 상기 저장된 SNS 데이터로부터 상기 마커의 사용 횟수 및 상기 기설정된 기간의 상기 저장된 SNS 데이터의 총 개수를 포함하는 마커 매트릭스를 생성하는 마커 매트릭스 생성부를 더 포함하는 상품 수요 예측 장치.
  5. 제 1 항에 있어서,
    상기 SNS 자료 수집부는,
    상기 원본 SNS 데이터 중 기설정된 추출 조건을 만족하는 SNS 데이터를 선별하여 수집하되,
    상기 추출 조건은,
    기설정된 특정 언어의 사용, 하이퍼링크(hyper link)의 불포함, 기설정된 스팸(SPAM) 단어의 불포함, 및 SNS 계정 별로 계정 사용자 이외의 사용자에 의해 작성된 데이터 불포함 중 적어도 하나를 포함하는 것인, 상품 수요 예측 장치.
  6. 제 1 항에 있어서,
    상기 유효 데이터 추출부는,
    상기 원본 SNS 데이터 중 상기 키워드와의 동음이의어를 포함하는 SNS 데이터를 제거 처리하는, 상품 수요 예측 장치.
  7. 제 1 항에 있어서,
    상기 상품 수요 예측 정보 제공부는,
    상기 상품 수요 예측 값의 날짜 별 변화를 그래프 형태로 출력하는 상품 수요 예측 장치.
  8. 제 1 항에 있어서,
    상기 매출 통계 자료 저장부는,
    기설정된 웹 사이트를 통해 상기 상품의 매출 통계 데이터를 검색하여 상기 매출 통계 데이터를 수집하는, 상품 수요 예측 장치.
  9. 상품 수요 예측 장치를 통한 상품 수요 예측 방법에 있어서,
    (a) 소셜 네트워크 서비스(SNS, Social Network Service) 서버로부터 수집된 원본 SNS 데이터 및 입력된 상품 별 매출 통계 데이터를 각각 저장하는 단계;
    (b) 상기 저장된 SNS 데이터로부터 목표 상품과 관련된 기설정된 키워드 중 적어도 하나를 포함하는 유효 SNS 데이터를 추출하는 단계;
    (c) 상기 유효 SNS 데이터에 포함된 단어 별 사용 빈도와 상기 매출 통계 데이터와의 상관도에 기초하여 상기 유효 SNS 데이터의 단어들로부터 마커를 결정하는 단계;
    (d) 기설정된 기간의 상기 저장된 SNS 데이터에 대한 상기 마커의 총 사용 횟수 및 상기 저장된 SNS 데이터의 총 개수에 기초하여 상기 기설정된 기간의 상기 저장된 SNS 데이터 내 상기 마커에 대한 마커 사용 비율 값을 산출하는 단계;
    (e) 상기 마커 사용 비율 값 및 상기 매출 통계 데이터에 대해 선형 회귀(linear regression) 분석 처리하여 예측 목표일에 대응하는 상품 수요 예측 값을 산출하는 단계; 및
    (f) 상기 산출된 상품 수요 예측 값에 기초한 상품 수요 예측 정보를 생성하여 사용자 단말에 제공하는 단계를 포함하는 상품 수요 예측 방법.
  10. 제 9 항에 있어서,
    상기 (c) 단계는,
    (c-1) 상기 유효 SNS 데이터에 포함된 단어 별 사용 빈도를 산출하는 단계;
    (c-2) 상기 단어 별 사용 빈도와 상기 매출 통계 데이터에 대해 LASSO(Least-Absolute Shrinkage And Selection Operator) 분석 처리하는 단계; 및
    (c-3) 상기 LASSO 분석 처리의 결과 산출된 상기 유효 SNS 데이터에 포함된 단어 별 상관 계수에 기초하여 상기 마커를 결정하는 단계를 포함하는, 상품 수요 예측 방법.
  11. 삭제
  12. 제 9 항에 있어서,
    상기 (d) 단계 이전에,
    상기 기설정된 기간의 상기 저장된 SNS 데이터로부터 상기 마커의 사용 횟수 및 상기 기설정된 기간의 상기 저장된 SNS 데이터의 총 개수를 포함하는 마커 매트릭스를 생성하는 단계를 더 포함하되,
    상기 (d) 단계는,
    상기 마커 매트릭스를 이용하여 상기 마커 사용 비율 값을 산출하는, 상품 수요 예측 방법.
  13. 제 9 항에 있어서,
    상기 (a) 단계는,
    상기 원본 SNS 데이터 중 기설정된 특정 언어의 사용, 하이퍼링크(hyper link)의 불포함, 기설정된 스팸(SPAM) 단어의 불포함, 및 SNS 계정 별로 계정 사용자 이외의 사용자에 의해 작성된 데이터 불포함 중 적어도 하나의 조건을 만족하는 SNS 데이터를 저장하는, 상품 수요 예측 방법.
  14. 제 9 항에 있어서,
    상기 (b) 단계는,
    상기 원본 SNS 데이터 중 상기 키워드와 관련하여 기설정된 키워드와의 동음이의어를 포함하는 SNS 데이터를 제거 처리하여 상기 유효 SNS 데이터를 추출하는, 상품 수요 예측 방법.
  15. 제 9 항에 있어서,
    상기 (f) 단계는,
    상기 상품 수요 예측 값의 날짜 별 변화를 그래프 형태로 출력하는 상품 수요 예측 방법.
KR1020120102920A 2012-09-17 2012-09-17 소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법 KR101435096B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120102920A KR101435096B1 (ko) 2012-09-17 2012-09-17 소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120102920A KR101435096B1 (ko) 2012-09-17 2012-09-17 소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20140037384A KR20140037384A (ko) 2014-03-27
KR101435096B1 true KR101435096B1 (ko) 2014-09-01

Family

ID=50646201

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120102920A KR101435096B1 (ko) 2012-09-17 2012-09-17 소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101435096B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101671314B1 (ko) * 2015-08-31 2016-11-01 주식회사 라온랩 여행상품 검색 로그 데이터 분석 시스템
KR102421684B1 (ko) 2022-05-03 2022-07-14 이명수 인공지능 기반 온라인 상의 판매대상 아이템 도출 방법, 장치 및 시스템

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6863044B2 (ja) * 2017-04-26 2021-04-21 大日本印刷株式会社 発注補助装置及びプログラム
KR102197110B1 (ko) * 2018-12-13 2020-12-30 윤영훈 블록체인을 기반으로 한 자산 거래 및 이력 추적 시스템
KR102405503B1 (ko) * 2020-04-10 2022-06-07 주식회사 제로투원파트너스 소비 데이터와 소셜 데이터를 이용한 소비동향 예측 지수 생성 방법과 이를 적용한 소비동향 예측 지수 생성 시스템 및 이를 위한 컴퓨터 프로그램
CN114881677A (zh) * 2021-02-05 2022-08-09 漳州立达信光电子科技有限公司 一种用户需求分析方法、装置及设备
KR102509553B1 (ko) * 2022-05-17 2023-03-10 백승훈 빅데이터 분석 프레임워크 플랫폼을 활용한 소비 패턴 분석 및 미래 수요 예측 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006227965A (ja) * 2005-02-18 2006-08-31 Dainippon Printing Co Ltd トレンド予測装置およびトレンド予測方法
JP2012133694A (ja) * 2010-12-24 2012-07-12 Hitachi Ltd 需要予測方法
JP2012150671A (ja) 2011-01-19 2012-08-09 Toshiba Tec Corp 需要予測装置、及びそのプログラム
KR20120100164A (ko) * 2011-03-03 2012-09-12 주식회사 디에스이트레이드 수요 예측을 통한 공급망 관리 시스템 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006227965A (ja) * 2005-02-18 2006-08-31 Dainippon Printing Co Ltd トレンド予測装置およびトレンド予測方法
JP2012133694A (ja) * 2010-12-24 2012-07-12 Hitachi Ltd 需要予測方法
JP2012150671A (ja) 2011-01-19 2012-08-09 Toshiba Tec Corp 需要予測装置、及びそのプログラム
KR20120100164A (ko) * 2011-03-03 2012-09-12 주식회사 디에스이트레이드 수요 예측을 통한 공급망 관리 시스템 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101671314B1 (ko) * 2015-08-31 2016-11-01 주식회사 라온랩 여행상품 검색 로그 데이터 분석 시스템
KR102421684B1 (ko) 2022-05-03 2022-07-14 이명수 인공지능 기반 온라인 상의 판매대상 아이템 도출 방법, 장치 및 시스템

Also Published As

Publication number Publication date
KR20140037384A (ko) 2014-03-27

Similar Documents

Publication Publication Date Title
KR101435096B1 (ko) 소셜 네트워크 서비스 데이터에 기반한 상품 수요 예측 장치 및 방법
Pan et al. Forecasting destination weekly hotel occupancy with big data
Li et al. A MIDAS modelling framework for Chinese inflation index forecast incorporating Google search data
USRE46902E1 (en) System and method for customized sentiment signal generation through machine learning based streaming text analytics
CN111401777B (zh) 企业风险的评估方法、装置、终端设备及存储介质
US20110173130A1 (en) Method and system for informing a user by utilizing time based reviews
Yiu et al. Nowcasting Chinese GDP: information content of economic and financial data
US20120011139A1 (en) Unified numerical and semantic analytics system for decision support
JP2015076076A (ja) 顧客データ解析システム
KR20140053444A (ko) 시장규모예측장치, 시장규모예측방법 및 시장규모를 예측하는 프로그램을 저장하는 저장매체
Ayeh et al. ‘Estimating tomorrow’s tourist arrivals’: forecasting the demand for China’s tourism using the general-to-specific approach
KR20200039852A (ko) 기업 경영 현황 분석 예측 모델링을 위한 기계학습 알고리즘 제공 방법
KR20140133185A (ko) 소셜 데이터의 분석을 통한 주가 예측 방법 및 이를 적용한 주가 예측 시스템
Buono et al. Big data econometrics: Now casting and early estimates
Davis et al. Social sentiment indices powered by x-scores
CN110209944B (zh) 一种股票分析师推荐方法、装置、计算机设备和存储介质
KR20140146437A (ko) 특허정보를 이용한 기업성과 예측 장치 및 방법
KR102405503B1 (ko) 소비 데이터와 소셜 데이터를 이용한 소비동향 예측 지수 생성 방법과 이를 적용한 소비동향 예측 지수 생성 시스템 및 이를 위한 컴퓨터 프로그램
CN115619571A (zh) 一种理财规划方法、系统及装置
KR101725014B1 (ko) 시계열 모델을 이용한 주택매매지수 예측 장치 및 그 방법
Pham et al. Do Fintech-Related keywords influence bank return? A case study from Vietcombank and Sacombank in Vietnam
Gong et al. Forecasting stock volatility with a large set of predictors: A new forecast combination method
Tenorio et al. GDP nowcasting with machine learning and unstructured data to Peru
CN112686448A (zh) 基于属性数据的流失预警方法及系统
Kourentzesa et al. Increasing knowledge base for nowcasting GDP by quantifying the sentiment about the state of economy

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170707

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180801

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190717

Year of fee payment: 6