KR20210009906A - 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법 - Google Patents

인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법 Download PDF

Info

Publication number
KR20210009906A
KR20210009906A KR1020190087061A KR20190087061A KR20210009906A KR 20210009906 A KR20210009906 A KR 20210009906A KR 1020190087061 A KR1020190087061 A KR 1020190087061A KR 20190087061 A KR20190087061 A KR 20190087061A KR 20210009906 A KR20210009906 A KR 20210009906A
Authority
KR
South Korea
Prior art keywords
data
product purchase
purchase
product
artificial intelligence
Prior art date
Application number
KR1020190087061A
Other languages
English (en)
Other versions
KR102237399B1 (ko
Inventor
정화민
Original Assignee
정화민
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정화민 filed Critical 정화민
Priority to KR1020190087061A priority Critical patent/KR102237399B1/ko
Publication of KR20210009906A publication Critical patent/KR20210009906A/ko
Application granted granted Critical
Publication of KR102237399B1 publication Critical patent/KR102237399B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법에 관한 것으로, 상기 장치는 쇼핑몰을 이용하는 구매고객의 상품구매 예측을 위한 구매고객 객체의 인구통계적 특성, 구매계절 특성, 구매시기 특성, 구매가격 변동 및 구매상품을 포함하는 상품구매 데이터를 수집하여 데이터 웨어하우스(warehouse)를 구축하는 데이터 웨어하우스 구축부; 상기 상품구매 데이터를 기초로 구매고객별 라이프 스타일을 검증하여 상기 데이터 웨어하우스에 추가하는 데이터 웨어하우스 갱신부; 상기 데이터 웨어하우스로부터 랜덤하게 추출되는 복수의 후보 데이터들을 후보 데이터 모집단으로서 생성하고 통계적 기준을 충족하는 예측 독립변수를 결정하는 후보 데이터 모집단 생성부; 상기 후보 데이터 모집단을 기초로 상기 예측 독립변수에 대해 복수의 인공지능 알고리즘들을 적용하여 상품구매 예측도가 가장 높은 상품구매 예측 모델을 예측 독립변수별 최적화 모델로서 결정하는 최적화 모델 결정부를 포함한다.

Description

인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법{APPARATUS AND METHOD FOR PROVIDING FORECASTING PLATFORM FOR SHOPPING MALL BASED ON ARTIFICIAL INTELLIGENCE}
본 발명은 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 기술에 관한 것으로, 더욱 상세하게는 인공지능 알고리즘을 활용하여 쇼핑몰 구매고객의 상품구매를 예측할 수 있는 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법에 관한 것이다.
현재 쇼핑몰 구매고객의 인구 통계적 특성과 구매 패턴에 대한 빈도 분석 수준의 고객 세분화로 고객에 대한 과학적인 분석이 부족하고 상품 추천도 마케팅 매니저의 직관이나 과거 행태에서 추천하는 경향이 많고 과학적인 상품추천이 이루어지지 않고 있다는 문제점이 존재한다. 이를 해결하기 위하여 구매 고객의 검색시간 단축 및 최적의 쇼핑몰 추천 기술 개발이 필요하며 이를 통해 쇼핑몰 사업자의 경쟁력을 높일 수 있다.
한국공개특허 제10-2009-0001974(2009.01.09)호는 모바일 알에프아이디 기반의 통계분석을 통한 상품 판매예측 시스템 및 방법에 관한 것으로, RFID 태그와 리더의 무선통신 기술을 이용하여 다양한 종류의 정보를 제공함으로써 판매자에게 각종 상품들에 대한 판매 경향을 통계적으로 예측 가능하게 하고, 구매자가 상품 가격을 조회하거나 구매정보를 확인하는 경우에 구매의도를 파악하여 잠재수요로서 통계정보를 얻어내거나 상품 배치에 따른 실질 구매 통계, 구매자의 관심도에 대한 통계 데이터를 확보할 수 있다.
한국공개특허 제10-2004-0076448(2004.09.01)호는 네트워크 기반 가상 구매를 통한 상품 구매 방법 및 시스템에 관한 것으로, 사용자가 무선 단말기를 이용하여 일정 회수 가상 구매를 하면, 실제 상품 구매 시에 할인 혜택이 함께 제공되는 실제 구매 정보를 메시지로 전송할 수 있도록 하고, 상기 단문 메시지를 통해 상품 구매 화면에 접속하여 상품을 구매할 수 있도록 하는 기술을 개시하고 있다.
한국공개특허 제10-2009-0001974(2009.01.09)호 한국공개특허 제10-2004-0076448(2004.09.01)호
본 발명의 일 실시예는 인공지능 알고리즘을 활용하여 쇼핑몰 구매고객의 상품구매를 예측할 수 있는 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법을 제공하고자 한다.
본 발명의 일 실시예는 쇼핑몰 고객의 인구 통계적 특성, 라이프 스타일, 상징적 소비경향 등 상품구매 데이터를 세분화하고 인공지능 알고리즘을 적용하여 고객의 상품 구매패턴 분석, 계절 특성, 시기 특성, 구매 가격 변동에 따른 상품구매 예측 플랫폼을 제공할 수 있는 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법을 제공하고자 한다.
본 발명의 일 실시예는 구매 고객의 검색시간 단축 및 최적의 쇼핑몰 추천 기술 개발에 기여할 수 있고 이를 통해 쇼핑몰 사업자의 경쟁력을 높일 수 있는 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법을 제공하고자 한다.
실시예들 중에서, 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치는 쇼핑몰을 이용하는 구매고객의 상품구매 예측을 위한 구매고객 객체의 인구통계적 특성, 구매계절 특성, 구매시기 특성, 구매가격 변동 및 구매상품을 포함하는 상품구매 데이터를 수집하여 데이터 웨어하우스(warehouse)를 구축하는 데이터 웨어하우스 구축부; 상기 상품구매 데이터를 기초로 구매고객별 라이프 스타일을 검증하여 상기 데이터 웨어하우스에 추가하는 데이터 웨어하우스 갱신부; 상기 데이터 웨어하우스로부터 랜덤하게 추출되는 복수의 후보 데이터들을 후보 데이터 모집단으로서 생성하고 통계적 기준을 충족하는 예측 독립변수를 결정하는 후보 데이터 모집단 생성부; 상기 후보 데이터 모집단을 기초로 상기 예측 독립변수에 대해 복수의 인공지능 알고리즘들을 적용하여 상품구매 예측도가 가장 높은 상품구매 예측 모델을 예측 독립변수별 최적화 모델로서 결정하는 최적화 모델 결정부를 포함한다.
상기 데이터 웨어하우스 갱신부는 상기 상품구매 데이터를 기초로 구매고객 별로 사전에 정의된 라이프 스타일로서 유행 추구형, 행복 추구형, 정보 선호형, 외제품 선호형 및 광고 선호형 중 어느 하나를 결정할 수 있다.
상기 후보 데이터 모집단 생성부는 상기 데이터 웨어하우스로부터 n(n은 자연수) 개의 후보 데이터들을 랜덤하게 선별하여 후보 데이터 모집단을 생성하는 제1 단계; 상기 후보 데이터 모집단에 대해 인공지능 알고리즘을 적용하여 상기 통계적 기준을 충족하는 후보 독립변수를 결정하는 제2 단계; 및 상기 제1 및 제2 단계들을 반복 수행하여 결정되는 후보 독립변수의 중복 횟수를 기초로 상기 예측 독립변수를 최종 결정하는 제3 단계를 수행할 수 있다.
상기 후보 데이터 모집단 생성부는 상기 제2 단계에서, 상기 통계적 기준으로서 유의수준을 0.05로 설정하고 유의확률 p가 상기 유의수준 미만인 경우 상기 통계적 기준을 충족하는 것으로 결정할 수 있다.
상기 후보 데이터 모집단 생성부는 상기 제2 단계에서, 상기 인공지능 알고리즘으로서 로지스틱 회귀(Logistic Regression), 결정 트리(Decision Tree) 및 인공 신경망(Artificial Neural Network) 중 어느 하나를 사용할 수 있다.
상기 최적화 모델 결정부는 상기 후보 데이터 모집단을 분할하여 학습 데이터 모집단과 검증 데이터 모집단을 생성하는 단계; 상기 복수의 인공지능 알고리즘들 각각을 이용하여 상기 학습 데이터 모집단에 대해 상기 예측 독립변수에 관한 학습을 통해 상품구매 예측 모델을 구축하는 단계; 상기 상품구매 예측 모델을 이용하여 상기 검증 데이터 모집단을 검증하는 단계; 및 상기 검증의 결과 상품구매 예측도가 가장 높은 상품구매 예측 모델을 상기 최적화 모델로서 결정하는 단계를 수행할 수 있다.
상기 쇼핑몰 상품구매 예측 플랫폼 제공 장치는 상기 최적화 모델을 기초로 특정 구매고객에 대한 상품구매를 예측하여 추천 상품을 제공하는 상품구매 예측 제공부를 더 포함할 수 있다.
실시예들 중에서, 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 방법은 쇼핑몰을 이용하는 구매고객의 상품구매 예측을 위한 구매고객 객체의 인구통계적 특성, 구매계절 특성, 구매시기 특성, 구매가격 변동 및 구매상품을 포함하는 상품구매 데이터를 수집하여 데이터 웨어하우스(warehouse)를 구축하는 단계; 상기 상품구매 데이터를 기초로 구매고객별 라이프 스타일을 검증하여 상기 데이터 웨어하우스에 추가하는 단계; 상기 데이터 웨어하우스로부터 랜덤하게 추출되는 복수의 후보 데이터 집합들 중에서 통계적 기준을 충족하는 데이터 집합을 선별하여 후보 데이터 모집단을 생성하는 단계; 상기 데이터 웨어하우스로부터 랜덤하게 추출되는 복수의 후보 데이터들을 후보 데이터 모집단으로서 생성하고 통계적 기준을 충족하는 예측 독립변수를 결정하는 단계; 및 상기 후보 데이터 모집단을 기초로 상기 예측 독립변수에 대해 복수의 인공지능 알고리즘들을 적용하여 상품구매 예측도가 가장 높은 상품구매 예측 모델을 예측 독립변수별 최적화 모델로서 결정하는 단계를 포함한다.
개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
본 발명의 일 실시예에 따른 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법은 쇼핑몰 고객의 인구 통계적 특성, 라이프 스타일, 상징적 소비경향 등 상품구매 데이터를 세분화하고 인공지능 알고리즘을 적용하여 고객의 상품 구매패턴 분석, 계절 특성, 시기 특성, 구매 가격 변동에 따른 상품구매 예측 플랫폼을 제공할 수 있다.
본 발명의 일 실시예에 따른 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법은 구매 고객의 검색시간 단축 및 최적의 쇼핑몰 추천 기술 개발에 기여할 수 있고 이를 통해 쇼핑몰 사업자의 경쟁력을 높일 수 있다.
도 1은 본 발명에 따른 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 시스템의 구성을 설명하는 도면이다.
도 2는 도 1에 있는 상품구매 예측 플랫폼 제공 장치의 물리적 구성을 설명하는 블록도이다.
도 3은 도 1에 있는 상품구매 예측 플랫폼 제공 장치의 기능적 구성을 설명하는 블록도이다.
도 4는 도 1에 있는 상품구매 예측 플랫폼 제공 장치에서 수행되는 인공지능 기반의 상품구매 예측 플랫폼 제공 과정을 설명하는 순서도이다.
도 5는 본 발명에 따른 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 시스템에서 사용하는 데이터 웨어하우스의 일 실시예를 설명하는 예시도이다.
도 6은 본 발명에 따른 상품구매 예측 플랫폼 제공 장치의 전체적인 동작을 설명하는 개념도이다.
도 7 및 8은 R프로그래밍을 이용하여 유의미한 데이터 도출 과정을 설명하는 예시도이다.
본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다"또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
본 발명은 컴퓨터가 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있고, 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.
도 1은 본 발명에 따른 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 시스템의 구성을 설명하는 도면이다.
도 1을 참조하면, 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 시스템(100)은 사용자 단말(110), 상품구매 예측 플랫폼 제공 장치(130) 및 데이터베이스(150)를 포함할 수 있다.
사용자 단말(110)은 온라인 쇼핑몰에 접속하여 상품구매를 수행하고 상품구매 예측을 통한 상품 추천을 제공받을 수 있는 컴퓨팅 장치에 해당할 수 있고, 스마트폰, 노트북 또는 컴퓨터로 구현될 수 있으며, 반드시 이에 한정되지 않고, 태블릿 PC 등 다양한 디바이스로도 구현될 수 있다. 사용자 단말(110)은 상품구매 예측 플랫폼 제공 장치(130)와 네트워크를 통해 연결될 수 있고, 복수의 사용자 단말(110)들은 상품구매 예측 플랫폼 제공 장치(130)와 동시에 연결될 수 있다.
상품구매 예측 플랫폼 제공 장치(130)는 사용자들로부터 상품구매와 관련한 데이터를 수집하고 이를 분석하여 상품구매를 예측할 수 있으며, 이를 통해 사용자들에게 최적화된 추천 상품을 제공할 수 있는 컴퓨터 또는 프로그램에 해당하는 서버로 구현될 수 있다. 상품구매 예측 플랫폼 제공 장치(130)는 사용자 단말(110)과 블루투스, WiFi, 통신망 등을 통해 무선으로 연결될 수 있고, 네트워크를 통해 사용자 단말(110)과 데이터를 주고 받을 수 있다.
일 실시예에서, 상품구매 예측 플랫폼 제공 장치(130)는 데이터베이스(150)와 연동하여 쇼핑몰 구매고객의 상품구매 예측을 위한 데이터를 저장할 수 있다. 한편, 상품구매 예측 플랫폼 제공 장치(130)는 도 1과 달리, 데이터베이스(150)를 내부에 포함하여 구현될 수 있다. 또한, 상품구매 예측 플랫폼 제공 장치(130)는 프로세서, 메모리, 사용자 입출력부 및 네트워크 입출력부를 포함하여 구현될 수 있으며, 이에 대해서는 도 2에서 보다 자세히 설명한다.
데이터베이스(150)는 쇼핑몰 구매고객의 상품구매를 예측하여 관련 정보를 제공하는 과정에서 필요한 다양한 정보들을 저장하는 저장장치에 해당할 수 있다. 데이터베이스(150)는 복수의 사용자 단말(110)들로부터 수집한 사용자의 인구통계적 정보를 저장할 수 있고, 쇼핑몰의 상품구매에 관한 정보를 저장할 수 있으며, 반드시 이에 한정되지 않고, 상품구매 예측 플랫폼 제공 장치(130)가 상품구매를 예측하고 상품 추천을 제공하는 과정에서 다양한 형태로 수집 또는 가공된 정보들을 저장할 수 있다.
도 2는 도 1에 있는 상품구매 예측 플랫폼 제공 장치의 물리적 구성을 설명하는 블록도이다.
도 2를 참조하면, 상품구매 예측 플랫폼 제공 장치(130)는 프로세서(210), 메모리(230), 사용자 입출력부(250) 및 네트워크 입출력부(270)를 포함하여 구현될 수 있다.
프로세서(210)는 쇼핑몰 구매고객의 상품구매 데이터를 수집하고 분석하여 상품구매를 예측하는 과정에서의 각 동작들을 처리하는 프로시저를 실행할 수 있고, 그 과정 전반에서 읽혀지거나 작성되는 메모리(230)를 관리할 수 있으며, 메모리(230)에 있는 휘발성 메모리와 비휘발성 메모리 간의 동기화 시간을 스케줄할 수 있다. 프로세서(210)는 상품구매 예측 플랫폼 제공 장치(130)의 동작 전반을 제어할 수 있고, 메모리(230), 사용자 입출력부(250) 및 네트워크 입출력부(270)와 전기적으로 연결되어 이들 간의 데이터 흐름을 제어할 수 있다. 프로세서(210)는 상품구매 예측 플랫폼 제공 장치(130)의 CPU(Central Processing Unit)로 구현될 수 있다.
메모리(230)는 SSD(Solid State Drive) 또는 HDD(Hard Disk Drive)와 같은 비휘발성 메모리로 구현되어 상품구매 예측 플랫폼 제공 장치(130)에 필요한 데이터 전반을 저장하는데 사용되는 보조기억장치를 포함할 수 있고, RAM(Random Access Memory)과 같은 휘발성 메모리로 구현된 주기억장치를 포함할 수 있다.
사용자 입출력부(250)는 사용자 입력을 수신하기 위한 환경 및 사용자에게 특정 정보를 출력하기 위한 환경을 포함할 수 있다. 예를 들어, 사용자 입출력부(250)는 터치 패드, 터치 스크린, 화상 키보드 또는 포인팅 장치와 같은 어댑터를 포함하는 입력장치 및 모니터 또는 터치스크린과 같은 어댑터를 포함하는 출력장치를 포함할 수 있다. 일 실시예에서, 사용자 입출력부(250)는 원격 접속을 통해 접속되는 컴퓨팅 장치에 해당할 수 있고, 그러한 경우, 상품구매 예측 플랫폼 제공 장치(130)는 서버로서 수행될 수 있다.
네트워크 입출력부(270)은 네트워크를 통해 외부 장치 또는 시스템과 연결하기 위한 환경을 포함하고, 예를 들어, LAN(Local Area Network), MAN(Metropolitan Area Network), WAN(Wide Area Network) 및 VAN(Value Added Network) 등의 통신을 위한 어댑터를 포함할 수 있다.
도 3은 도 1에 있는 상품구매 예측 플랫폼 제공 장치의 기능적 구성을 설명하는 블록도이다.
도 3을 참조하면, 상품구매 예측 플랫폼 제공 장치(130)는 웨어하우스 구축부(310), 웨어하우스 갱신부(320), 후보 데이터 모집단 생성부(330), 최적화 모델 결정부(340), 상품구매 예측 제공부(350) 및 제어부(360)를 포함할 수 있다.
웨어하우스 구축부(310)는 쇼핑몰을 이용하는 구매고객의 상품구매 예측을 위한 구매고객 객체의 인구통계적 특성, 구매계절 특성, 구매시기 특성, 구매가격 변동 및 구매상품을 포함하는 상품구매 데이터를 수집하여 데이터 웨어하우스(warehouse)를 구축할 수 있다. 여기에서, 데이터 웨어하우스는 쇼핑몰을 이용하는 구매고객의 쇼핑몰을 이용하는 과정에서 발생하는 관련 데이터를 수집하여 보관하는 데이터베이스(150)에 해당할 수 있다.
이 경우, 도 1의 데이터베이스(150)는 데이터 웨어하우스로서 동작할 수 있고, 복수의 부분 데이터베이스들이 각각의 데이터를 분산 저장하는 형태로 구현될 수 있다. 도 5에서, 데이터베이스(150)는 구매고객을 객체로 설정하여 인구통계적 특성, 구매계절 특성, 구매시기 특성, 구매가격 변동, 구매상품 및 라이프 스타일에 대한 데이터를 각각 독립적인 데이터 집합으로 구성하여 저장할 수 있다.
인구통계적 특성은 구매고객에 대한 개인정보를 포함할 수 있고, 예를 들어, 구매고객 식별을 위한 식별자로서 ID 정보, 나이, 성별, 거주지 등을 포함할 수 있다. 웨어하우스 구축부(310)는 쇼핑몰을 이용하는 구매고객의 사용자 단말(110)로부터 인구통계적 특성과 연관된 정보를 수집할 수 있고, 쇼핑몰 가입 또는 결제시 입력한 사용자 정보를 기초로 인구통계적 특성에 관한 정보를 수집할 수 있으며, 반드시 이에 한정되지 않고, 다양한 방법을 통해 인구통계적 특성을 수집할 수 있다.
구매계절 특성은 구매고객의 상품구매 시점에 관한 정보로서 상품구매가 이루어진 시점의 계절 정보, 계절별 구매 횟수, 계절별 구매 금액 등을 포함할 수 있다. 구매시기 특성은 구매고객의 상품구매 시점에 관한 정보로서 상품구매가 이루어진 시점의 시간 정보, 시간별 구매 횟수, 시간별 구매 금액 등을 포함할 수 있다.
구매가격 변동은 상품구매와 연관된 상품구매 가격에 관한 정보로서 상품구매 가격, 할인 가격, 결제 가격 등을 포함할 수 있다. 구매상품은 상품구매의 대상이 되는 상품에 관한 정보로서, 상품명, 브랜드명, 제조일자, 유통기한, 용량, 원재료 등을 포함할 수 있다. 라이프 스타일은 구매고객의 상품구매와 연관된 개인 구매패턴에 해당할 수 있고, 상품구매 데이터의 통계적 정보에 기초하여 미리 정의될 수 있다.
웨어하우스 갱신부(320)는 상품구매 데이터를 기초로 구매고객별 라이프 스타일을 검증하여 데이터 웨어하우스에 추가할 수 있다. 필요에 따라, 데이터베이스(150)는 기 구축된 데이터 웨어하우스와 별도로 구매고객별 라이프 스타일을 저장할 수 있는 별도의 부분 데이터베이스를 구축할 수 있다. 웨어하우스 갱신부(320)는 상품구매 데이터를 기초로 다양한 방법을 통해 구매고객별 라이프 스타일을 검증할 수 있다.
예를 들어, 웨어하우스 갱신부(320)는 상품구매 데이터를 기초로 클러스터링 알고리즘을 적용하여 적어도 하나의 집합으로 분류할 수 있고, 각 집합별 데이터들의 대표적인 특성을 결정하여 미리 정의된 복수의 라이프 스타일들 중 어느 하나와 연관시킬 수 있다. 또한, 웨어하우스 갱신부(320)는 기계학습을 통해 생성된 분류 모델에 특정 구매고객의 상품구매 데이터를 기초로 생성된 입력 벡터를 입력하여 출력으로서 라이프 스타일에 대한 분류 결과를 획득할 수 있다.
일 실시예에서, 웨어하우스 갱신부(320)는 상품구매 데이터를 기초로 구매고객 별로 사전에 정의된 라이프 스타일로서 유행 추구형, 행복 추구형, 정보 선호형, 외제품 선호형 및 광고 선호형 중 어느 하나를 결정할 수 있다. 여기에서, 라이프 스타일은 쇼핑몰 구매고객의 상품구매에 영향을 줄 수 있는 개인 생활패턴에 관한 정보에 해당할 수 있다.
유행 추구형은 유행에 맞춰 구매할 상품을 선택하는 구매패턴에 해당할 수 있고, 행복 추구형은 상품구매에 있어 개인의 만족도를 최우선으로 고려하는 구매패턴에 해당할 수 있으며, 정보 선호형은 유행이나 만족도에 상관없이 정보 수집을 통해 최상의 상품을 선택하는 구매패턴에 해당할 수 있다. 또한, 외제품 선호형은 동일한 조건이면 국내산 제품보다 외국산 제품을 더 선호하는 구매패턴에 해당할 수 있고, 광고 선호형은 상품보다는 상품의 광고에 따라 구매를 결정하는 구매패턴에 해당할 수 있다.
후보 데이터 모집단 생성부(330)는 데이터 웨어하우스로부터 랜덤하게 추출되는 복수의 후보 데이터들을 후보 데이터 모집단으로서 생성하고 통계적 기준을 충족하는 예측 독립변수를 결정할 수 있다. 후보 데이터 모집단은 데이터 웨어하우스에 저장된 상품구매 데이터들 중에서 랜덤하게 선택된 데이터들로 구성될 수 있고, 상품구매 예측을 위한 학습에 사용되는 학습 데이터에 해당할 수 있다.
즉, 후보 데이터 모집단 생성부(330)는 데이터 웨어하우스에 저장된 상품구매 데이터 중에서 랜덤하게 선택된 데이터를 기초로 상품구매 예측에 영향을 줄 수 있는 유의미한 독립변수를 예측 독립변수로서 결정할 수 있고, 예측 독립변수에 해당하는 데이터만을 추출하여 상품구매 예측에 활용함으로써 상품구매 예측의 정확도를 향상시킬 수 있다. 후보 데이터 모집단 생성부(330)는 예측 독립변수 선별을 위하여 통계적 기준을 사전에 설정하여 활용할 수 있으며, 이 때 통계적 기준은 상품구매 데이터들에 포함된 다양한 독립변수들 중에서 실제 구매고객의 상품구매 과정에 유의미한 영향을 줄 수 있는 독립변수를 결정하는데 사용되는 기준에 해당할 수 있다. 따라서, 후보 데이터 모집단 생성부(330)는 후보 데이터 모집단의 각 독립변수에 대해 도출되는 통계적 수치를 통계적 기준과 비교하여 특정 조건을 만족하는 경우에만 예측 독립변수로서 결정할 수 있다.
일 실시예에서, 후보 데이터 모집단 생성부(330)는 데이터 웨어하우스로부터 n(n은 자연수) 개의 후보 데이터들을 랜덤하게 선별하여 후보 데이터 모집단을 생성하는 제1 단계, 후보 데이터 모집단에 대해 인공지능 알고리즘을 적용하여 통계적 기준을 충족하는 후보 독립변수를 결정하는 제2 단계 및 제1, 제2 단계들을 반복 수행하여 결정되는 후보 독립변수의 중복 횟수를 기초로 예측 독립변수를 최종 결정하는 제3 단계를 수행할 수 있다.
보다 구체적으로, 후보 데이터 모집단 생성부(330)는 데이터 웨어하우스에 저장된 상품구매 데이터를 랜덤하게 추출할 수 있으며, 미리 설정된 n개의 상품구매 데이터를 추출한 후 이를 후보 데이터 모집단으로서 생성할 수 있다. 다음으로, 후보 데이터 모집단 생성부(330)는 후보 데이터 모집단에 대해 인공지능 알고리즘을 적용하여 통계적 기준을 충족하는 후보 독립변수를 결정할 수 있다.
다음으로, 후보 데이터 모집단 생성부(330)는 제1과 제2 단계를 미리 설정된 횟수만큼 반복할 수 있고, 반복에 의해 결정된 후보 독립변수의 중복 횟수를 기초로 예측 독립변수를 최종 결정할 수 있다. 즉, 반복 과정에서 후보 독립변수로 일정 횟수 이상 중복적으로 결정된 후보 독립변수를 예측 독립변수로서 최종 결정될 수 있다.
후보 데이터 모집단 생성부(330)는 데이터 웨어하우스로부터 랜덤하게 후보 데이터 모집단을 생성할 수 있고, 후보 독립변수를 결정하는 과정은 반복적으로 수행될 수 있으며, 이를 위하여 반복 과정에서 수행되는 각 단계의 동작을 수행하는 독립적인 모듈들로 구성될 수 있다.
일 실시예에서, 후보 데이터 모집단 생성부(330)는 제3 단계에서, 제1 및 제2 단계들을 반복 수행하여 결정되는 후보 독립변수의 중복 횟수와 독립변수 간의 연관성 지수를 기초로 예측 독립변수를 최종 결정할 수 있다. 여기에서, 독립변수 간의 연관성 지수는 독립변수 간의 다중공선성(Multicollinearity)에 해당할 수 있다. 즉, 후보 데이터 모집단 생성부(330)는 후보 독립변수의 중복 횟수를 기초로 예측 독립변수를 1차 결정할 수 있고, 1차 결정된 예측 독립변수 중에서 연관성 지수가 임계 기준을 초과하는 경우 해당 예측 독립변수 중 어느 하나만을 최종 결정할 수 있다. 이 때, 독립변수 간의 연관성 지수는 분산팽창계수(VIF, Variation Inflation Factor), 공차한계(Tolerance) 또는 상태지수(CN) 등을 통해 측정할 수 있다.
일 실시예에서, 후보 데이터 모집단 생성부(330)는 제2 단계에서, 통계적 기준으로서 유의수준을 0.05로 설정하고 유의확률 p가 유의수준 미만인 경우 통계적 기준을 충족하는 것으로 결정할 수 있다. 여기에서, 유의수준(significance level)은 통계적 결정에서 제1종 오류를 범할 확률의 최대값에 해당할 수 있고, α로 표현될 수 있다. 유의확률 p(significance probability)는 현재의 데이터에 대해 귀무가설(검증의 대상이 되는 가설)을 기각할 수 있는 최소한의 확률에 해당할 수 있다. 따라서, 유의수준(α)를 0.05로 설정한 경우 계산된 유의확률(p)이 0.05 미만인 경우 귀무가설을 기각하고 대립가설(귀무가설에 반대되는 사실로서 주장의 대상이 되는 가설)을 채택할 수 있다.
보다 구체적으로, 후보 데이터 모집단 생성부(330)는 통계적 기준으로서 유의수준을 0.05로 설정하고 후보 데이터 모집단에 대해 각 독립변수에 인공지능 알고리즘을 적용하여 유의확률 p와 유의수준을 비교함으로써 유의미한 변수를 도출할 수 있다. 결과적으로, 유의미한 변수는 쇼핑몰 구매고객의 상품구매 예측에 영향을 주는 주요 변수로서 통계적 기준과 후보 데이터 모집단에 따라 결정될 수 있다.
일 실시예에서, 후보 데이터 모집단 생성부(330)는 제2 단계에서, 인공지능 알고리즘으로서 로지스틱 회귀(Logistic Regression), 결정 트리(Decision Tree) 및 인공 신경망(Artificial Neural Network) 중 어느 하나를 사용할 수 있다.
로지스틱 회귀(Logistic Regression)는 D.R.Cox가 제안한 확률 모델로서 독립변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는데 사용되는 통계 기법에 해당할 수 있다. 로지스틱 회귀의 목적은 일반적인 회귀 분석의 목표와 동일하게 종속변수와 독립변수 간의 관계를 구체적인 함수로 나타내어 향후 예측 모델에 사용하는 것으로, 선형 회귀 분석과 달리 종속변수가 범주형 데이터를 대상으로 하며 입력 데이터가 주어졌을 때 해당 데이터의 결과가 특정 분류로 나뉘기 때문에 일종의 분류 기법에 해당할 수 있다.
후보 데이터 모집단 생성부(330)는 종속변수를 0(구매하지 않는다)과 1(구매한다)의 이분형 자료로서 범주형으로 구성할 수 있고, 이 경우 종속변수는 사건이 일어날 확률로서 예측 값은 0 ~ 1 사이로 한정되어 표현될 수 있다. 또한, 후보 데이터 모집단 생성부(330)는 그래프 내의 공식으로 독립변수들(인구통계적 특성, 구매계절 특성, 구매시기 특성, 구매가격, 구매상품 및 라이프 스타일)에 대한 데이터가 1 변할 때 종속변수에 영향을 주는 크기와 그 사건이 일어날 확률인 Exp(B) 값을 기준으로 유의확률 p가 0.05 미만인 값들을 유의미한 변수로서 도출할 수 있다.
결정 트리(Decision Tree)는 어떤 항목에 대한 관측 값과 목표 값을 연결시켜 주는 예측 모델에 해당할 수 있고, 통계학과 데이터 마이닝 및 기계 학습에서 사용되는 예측 모델링 방법 중 하나에 해당할 수 있다. 후보 데이터 모집단 생성부(330)는 구매고객의 행동 관련 데이터를 이용하여 데이터 간의 관련성, 유사성 등을 고려하여 구매고객을 분류할 수 있다.
예를 들어, 분석 알고리즘은 Chi-squared automatic interaction detection 방법으로 종속변수가 양적이나 질적변수 관계없이 카이제곱량이나 F검정이 사용될 수 있다. 후보 데이터 모집단 생성부(330)는 카이제곱 통계량이 크고 이에 대한 유의확률 p < 0.05를 만족하는 부모 노드에 대해 자식 노드를 형성하는 유용한 변수로서 선정할 수 있다.
인공 신경망(Artificial Neural Network)은 기계학습과 인지과학에서 생물학의 신경망(동물의 중추 신경계 중 특히 뇌)에서 영감을 얻은 통계학적 학습 알고리즘에 해당할 수 있고, 시냅스의 결합으로 네트워크를 형성한 인공 뉴런(노드)이 학습을 통해 시냅스의 결합 세기를 변화시켜, 문제 해결 능력을 가지는 모델에 해당할 수 있다.
후보 데이터 모집단 생성부(330)는 인공신경망을 이용하여 복잡하고 비선형적이며 관계성을 갖는 다변량 데이터를 분석할 수 있고, 미래 특정 상황에 발생할 확률을 예측하거나 또는 고객의 특정 행동에 관한 추정을 수행할 수 있다. 후보 데이터 모집단 생성부(330)는 다음의 단계를 통해 구체적인 분석을 수행할 수 있다. (i)후보 데이터 모집단 생성부(330)는 데이터 웨어하우스의 데이터를 대상으로 무작위로 학습용 데이터 70%, 검증용 데이터 30%를 분할 할당할 수 있다.
또한, (ii)후보 데이터 모집단 생성부(330)는 데이터 입력 공변량 변수로서 쇼핑몰 구매고객의 인구통계적 특성, 구매계절 특성, 구매시기 특성 등을 사용하여 해당 공변량 변수에 따른 네트워크 다이어그램을 생성할 수 있다. (iii)후보 데이터 모집단 생성부(330)는 히든 레이어에 활성화 함수로 쌍곡 탄젠트 함수를 적용하고 출력 레이어에 활성화 함수로 소프트맥스(Softmax) 함수를 적용할 수 있다. 이 경우, 다이어그램에서 시냅스 가중치은 주어진 레이어와 다음 레이어 사이에서의 관련성을 의미할 수 있다.
또한, (iv)후보 데이터 모집단 생성부(330)는 R 프로그래밍에 의한 ROC 곡선(Receiver Operating Characteristic curve)을 생성할 수 있고 독립변수의 중요도 분석 결과를 확인하기 위한 학습용 데이터와 검증용 데이터의 비율과 정확도를 각각 도출할 수 있다. (v)후보 데이터 모집단 생성부(330)는 후보 독립변수 도출을 위해 네트워크 다이어그램의 변수별 은닉층에 굵은 실선으로 그려진 변수를 후보 독립변수로서 결정할 수 있다.
최적화 모델 결정부(340)는 후보 데이터 모집단을 기초로 예측 독립변수에 대해 복수의 인공지능 알고리즘들을 적용하여 상품구매 예측도가 가장 높은 상품구매 예측 모델을 예측 독립변수별 최적화 모델로서 결정할 수 있다. 최적화 모델 결정부(340)는 상품구매 데이터를 이용하여 예측 독립변수 별로 구매고객의 상품구매 여부에 관한 정보를 인공지능 알고리즘에 적용하여 학습할 수 있고, 학습 결과로서 상품구매 예측 모델을 생성할 수 있다.
여기에서, 상품구매 예측 모델은 특정 예측 독립변수를 입력하면 상품구매 확률을 출력하는 확률 모델에 해당할 수 있고, 최적화 모델 결정부(340)는 상품구매 확률을 기초로 상품구매에 관한 예측을 수행할 수 있다. 최적화 모델 결정부(340)는 상품구매 예측 모델을 통해 예측된 결과와 실제 상품구매 데이터를 통해 확인할 수 있는 상품구매 결과를 비교하여 해당 상품구매 예측 모델에 대한 상품구매 예측도를 산출할 수 있다. 이 때, 상품구매 예측도는 예측 횟수에 대한 일치 횟수의 비율로서 산출될 수 있고, 필요한 경우 특정 범위의 값을 갖도록 정규화를 수행할 수 있다.
결과적으로, 최적화 모델 결정부(340)는 예측 독립변수 별로 복수의 인공지능 알고리즘들을 적용할 수 있고, 각각 생성된 상품구매 예측 모델 중에서 상품구매 예측도가 가장 높은 모델을 결정하여 해당 예측 독립변수에 대한 최적화 모델로서 결정할 수 있다.
일 실시예에서, 최적화 모델 결정부(340)는 후보 데이터 모집단을 분할하여 학습 데이터 모집단과 검증 데이터 모집단을 생성하는 단계, 복수의 인공지능 알고리즘들 각각을 이용하여 학습 데이터 모집단에 대한 학습을 통해 상품구매 예측 모델을 구축하는 단계, 상품구매 예측 모델을 이용하여 검증 데이터 모집단을 검증하는 단계 및 검증의 결과 상품구매 예측도가 가장 높은 상품구매 예측 모델을 최적화 모델로서 결정하는 단계를 수행할 수 있다.
이 때, 최적화 모델 결정부(340)는 후보 데이터 모집단 생성부(330)에 의해 결정된 예측 독립변수 별로 최적화 모델을 결정할 수 있고, 이를 위하여 후보 데이터 모집단의 상품구매 데이터로부터 예측 독립변수만을 추출한 후 학습을 수행할 수 있다. 즉, 최적화 모델 결정부(340)는 예측 독립변수 별로, 그리고 인공지능 알고리즘 별로 각각 학습을 수행하여 최적화 모델을 결정할 수 있다.
일 실시예에서, 최적화 모델 결정부(340)는 후보 데이터 모집단에 대한 학습 데이터 모집단과 검증 데이터 모집단의 분할 비율을 후보 데이터 모집단의 크기, 인공지능 알고리즘의 개수 및 예측 독립변수의 개수를 기초로 산출할 수 있다. 보다 구체적으로, 최적화 모델 결정부(340)는 후보 데이터 모집단의 크기가 클수록, 또는 인공지능 알고리즘의 개수가 많을수록, 또는 예측 독립변수의 개수가 많을수록 학습 데이터 모집단과 검증 데이터 모집단의 크기가 유사해지도록 분할 비율을 결정할 수 있다.
예를 들어, 학습 데이터 모집단과 검증 데이터 모집단의 기본 분할 비율이 7:3인 경우 최적화 모델 결정부(340)는 후보 데이터 모집단의 크기가 클수록, 또는 인공지능 알고리즘의 개수가 많을수록, 또는 예측 독립변수의 개수가 많을수록 분할 비율이 5:5에 가까워지도록 분할 비율을 결정할 수 있다.
상품구매 예측 제공부(350)는 최적화 모델 결정부(240)에 의해 결정된 최적화 모델을 기초로 특정 구매고객에 대한 상품구매를 예측하여 추천 상품을 제공할 수 있다. 예를 들어, 상품구매 예측 제공부(350)는 특정 구매고객이 쇼핑몰을 이용할 경우 상품별 상품구매 여부를 예측할 수 있고, 해당 구매고객이 구매할 확률이 가장 높거나, 구매할 것으로 예측된 상품들을 추천 상품으로서 제공할 수 있다.
제어부(360)는 상품구매 예측 플랫폼 제공 장치(130)의 전체적인 동작을 제어하고, 웨어하우스 구축부(310), 웨어하우스 갱신부(320), 후보 데이터 모집단 생성부(330), 최적화 모델 결정부(340) 및 상품구매 예측 제공부(350) 간의 제어 흐름 또는 데이터 흐름을 관리할 수 있다.
도 4는 도 1에 있는 상품구매 예측 플랫폼 제공 장치에서 수행되는 인공지능 기반의 상품구매 예측 플랫폼 제공 과정을 설명하는 순서도이다.
도 4를 참조하면, 상품구매 예측 플랫폼 제공 장치(130)는 웨어하우스 구축부(310)를 통해 쇼핑몰을 이용하는 구매고객의 상품구매 예측을 위한 구매고객 객체의 인구통계적 특성, 구매계절 특성, 구매시기 특성, 구매가격 변동 및 구매상품을 포함하는 상품구매 데이터를 수집하여 데이터 웨어하우스(warehouse)를 구축할 수 있다(단계 S410). 상품구매 예측 플랫폼 제공 장치(130)는 웨어하우스 갱신부(320)를 통해 상품구매 데이터를 기초로 구매고객별 라이프 스타일을 검증하여 데이터 웨어하우스에 추가할 수 있다(단계 S430).
또한, 상품구매 예측 플랫폼 제공 장치(130)는 후보 데이터 모집단 생성부(330)를 통해 데이터 웨어하우스로부터 랜덤하게 추출되는 복수의 후보 데이터 집합들 중에서 통계적 기준을 충족하는 데이터 집합을 선별하여 후보 데이터 모집단을 생성할 수 있다(단계 S450). 상품구매 예측 플랫폼 제공 장치(130)는 최적화 모델 결정부(340)를 통해 후보 데이터 모집단에 대해 복수의 인공지능 알고리즘들을 적용하여 상품구매 예측도가 가장 높은 상품구매 예측 모델을 최적화 모델로서 결정할 수 있다(단계 S470).
또한, 상품구매 예측 플랫폼 제공 장치(130)는 상품구매 예측 제공부(350)를 통해 최적화 모델을 기초로 특정 구매고객에 대한 상품구매를 예측하여 추천 상품을 제공할 수 있다(단계 S490).
도 6은 본 발명에 따른 상품구매 예측 플랫폼 제공 장치의 전체적인 동작을 설명하는 개념도이다.
도 6을 참조하면, 상품구매 예측 플랫폼 제공 장치(130)는 상품구매 예측을 위한 데이터 웨어하우스를 구축할 수 있고, 데이터 웨어하우스는 구매고객 객체 별로 인구통계적 특성, 구매계절 특성, 구매시기 특성, 구매가격 변동 및 구매상품에 관한 데이터를 각각 수집하여 보관할 수 있다. 이를 위하여 데이터베이스(150)는 복수의 부분 데이터베이스들로 구성될 수 있고, 네트워크를 통해 분산 저장 및 관리될 수 있다.
또한, 상품구매 예측 플랫폼 제공 장치(130)는 구축된 데이터 웨어하우스를 통해 구매고객별 라이프 스타일을 검증할 수 있다. 이 경우, 라이프 스타일을 저장하는 독립된 데이터베이스를 구축할 수 있고, 기 구축된 데이터 웨어하우스에 추가하여 업데이트할 수 있다. 상품구매 예측 플랫폼 제공 장치(130)는 다양한 인공지능 알고리즘과 통계적 기준을 통해 상품구매 예측을 위한 유의미한 변수를 도출할 수 있고, 유의미한 변수는 상품구매 예측에 영향을 줄 수 있는 독립변수에 해당할 수 있다.
상품구매 예측 플랫폼 제공 장치(130)는 유의미한 독립변수 만을 활용하여 상품구매 예측의 정확성을 높일 수 있고, 최적화 모델링 구축을 위해 데이터 수집, 분석 및 모델링 과정을 반복적으로 수행할 수 있다. 상품구매 예측 플랫폼 제공 장치(130)는 인공지능 기반의 상품구매 예측 플랫폼 중 상품구매 예측도가 가장 우수한 모델을 선정하고 N차시까지 여러번 추가적인 데이터를 확보하여 쇼핑몰 구매고객 상품구매 예측률을 높일 수 있다.
도 7 및 8은 R프로그래밍을 이용하여 유의미한 데이터 도출 과정을 설명하는 예시도이다.
도 7을 참조하면, 그림 (a)는 데이터 타당성 검정을 수행하는 소스코드이고, 그림 (b)는 데이터 신뢰도 검정을 수행하는 소스코드이며, 그림 (c)는 유의미한 변수 도출을 수행하는 소스코드이다.
도 7의 그림 (a)에서, 데이터의 타당성 검정을 위한 'psych' 패키지의 인스톨과 라이브러리 호출을 수행할 수 있다(S710). 또한, Shopping customer data의 타당성을 검증하기 위하여 각 데이터를 행렬 구조로 검정할 수 있다. 보다 구체적으로, 각 데이터를 행렬 구조로 Varimax 방법으로 회전하여 유사한 성분들을 2개로 분류할 수 있다(S720).
도 7의 그림 (b)에서, 데이터의 신뢰성 검정을 위한 'psych' 패키지 인스톨과 라이브러리 호출을 수행할 수 있다(S730). 또한, R 프로그램의 'psych' 패키지의 alpha 함수로 Shopping customer data의 신뢰성 지수인 Cronbach alpha값을 도출할 수 있다(S740).
도 7의 그림 (c)에서, Shopping customer data의 분석할 각 변수들을 input 벡터로 저장할 수 있다(S750). print 명령을 통해 Shopping customer data의 변수가 잘 정리되었는지 확인할 수 있다(S760). 다음으로, Shopping customer data의 outcome을 종속변수, 나머지 성별, 나이, 구매물품 종류, 판매물품 종류 등을 독립변수로 한 Linear Model(lm)분석하여 model 벡터로 저장할 수 있고(S770), Shopping customer data 벡터 model의 결과값을 출력하여 확인한 후(S780), Shopping customer data 벡터 model의 유의확률을 도출(p값)하여 Signif. code가 0'***', 0.001'**', 0.01'*' 로 나타난 변수를 유의미한 변수로 선택할 수 있다(S790).
도 8을 참조하면, 그림 (a)는 인공지능 알고리즘 중 로지스틱 회귀(Logistic Regression)를 수행하는 소스코드이고, 그림 (b)는 결정 트리(Decision Tree)를 수행하는 소스코드이며, 그림 (c)는 인공 신경망(Artificial Neural Network)을 수행하는 소스코드이다.
도 8의 그림 (a)에서, Shopping customer data의 유의미한 변수를 기준으로 이분형 로지스틱 인공지능 알고리즘(logistic regression)을 소환하여 분석한 결과를 BLR_shop_cus_data의 벡터로 저장할 수 있고(S810), BLR_shop_cus_data의 glm 함수의 결과를 도출할 수 있다(S820).
도 8의 그림 (b)에서, R 프로그램의 'party' 패키지를 인스톨하여 라이브러리를 호출할 수 있고(S830), shop_cus_data를 인공지능 알고리즘 중 ctree(의사결정 알고리즘)의 함수를 이용해 분석한 결과를 DT_shop_cus_data의 벡터로 저장할 수 있으며(S840), DT_shop_cus_data의 의사결정트리를 plot 함수를 써서 tree형태의 분류모형으로 구현할 수 있다(S850).
도 8의 그림 (c)에서, R 프로그램의 'nnet' 패키지를 인스톨하여 라이브러리를 호출할 수 있고(S860), 'nnet'의 인공신경망 함수를 이용하여 은닉층이 3개인 인공신경망 생성 후 nnet_shop_cus_data 벡터로 저장할 수 있으며(S870), nnet_shop_cus_data를 인공신경망 함수를 이용하여 분류를 예측할 수 있다(S880).
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 시스템
110: 사용자 단말
130: 상품구매 예측 플랫폼 제공 장치
150: 데이터베이스
210: 프로세서 230: 메모리
250: 사용자 입출력부 270: 네트워크 입출력부
310: 웨어하우스 구축부 320: 웨어하우스 갱신부
330: 후보 데이터 모집단 생성부 340: 최적화 모델 결정부
350: 상품구매 예측 제공부 360: 제어부

Claims (8)

  1. 쇼핑몰을 이용하는 구매고객의 상품구매 예측을 위한 구매고객 객체의 인구통계적 특성, 구매계절 특성, 구매시기 특성, 구매가격 변동 및 구매상품을 포함하는 상품구매 데이터를 수집하여 데이터 웨어하우스(warehouse)를 구축하는 데이터 웨어하우스 구축부;
    상기 상품구매 데이터를 기초로 구매고객별 라이프 스타일을 검증하여 상기 데이터 웨어하우스에 추가하는 데이터 웨어하우스 갱신부;
    상기 데이터 웨어하우스로부터 랜덤하게 추출되는 복수의 후보 데이터들을 후보 데이터 모집단으로서 생성하고 통계적 기준을 충족하는 예측 독립변수를 결정하는 후보 데이터 모집단 생성부;
    상기 후보 데이터 모집단을 기초로 상기 예측 독립변수에 대해 복수의 인공지능 알고리즘들을 적용하여 상품구매 예측도가 가장 높은 상품구매 예측 모델을 예측 독립변수별 최적화 모델로서 결정하는 최적화 모델 결정부를 포함하는 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치.
  2. 제1항에 있어서, 상기 데이터 웨어하우스 갱신부는
    상기 상품구매 데이터를 기초로 구매고객 별로 사전에 정의된 라이프 스타일로서 유행 추구형, 행복 추구형, 정보 선호형, 외제품 선호형 및 광고 선호형 중 어느 하나를 결정하는 것을 특징으로 하는 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치.
  3. 제1항에 있어서, 상기 후보 데이터 모집단 생성부는
    상기 데이터 웨어하우스로부터 n(n은 자연수) 개의 후보 데이터들을 랜덤하게 선별하여 후보 데이터 모집단을 생성하는 제1 단계;
    상기 후보 데이터 모집단에 대해 인공지능 알고리즘을 적용하여 상기 통계적 기준을 충족하는 후보 독립변수를 결정하는 제2 단계; 및
    상기 제1 및 제2 단계들을 반복 수행하여 결정되는 후보 독립변수의 중복 횟수를 기초로 상기 예측 독립변수를 최종 결정하는 제3 단계를 수행하는 것을 특징으로 하는 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치.
  4. 제3항에 있어서, 상기 후보 데이터 모집단 생성부는
    상기 제2 단계에서, 상기 통계적 기준으로서 유의수준을 0.05로 설정하고 유의확률 p가 상기 유의수준 미만인 경우 상기 통계적 기준을 충족하는 것으로 결정하는 것을 특징으로 하는 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치.
  5. 제3항에 있어서, 상기 후보 데이터 모집단 생성부는
    상기 제2 단계에서, 상기 인공지능 알고리즘으로서 로지스틱 회귀(Logistic Regression), 결정 트리(Decision Tree) 및 인공 신경망(Artificial Neural Network) 중 어느 하나를 사용하는 것을 특징으로 하는 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치.
  6. 상기 제1항에 있어서, 상기 최적화 모델 결정부는
    상기 후보 데이터 모집단을 분할하여 학습 데이터 모집단과 검증 데이터 모집단을 생성하는 단계;
    상기 복수의 인공지능 알고리즘들 각각을 이용하여 상기 학습 데이터 모집단에 대해 상기 예측 독립변수에 관한 학습을 통해 상품구매 예측 모델을 구축하는 단계;
    상기 상품구매 예측 모델을 이용하여 상기 검증 데이터 모집단을 검증하는 단계; 및
    상기 검증의 결과 상품구매 예측도가 가장 높은 상품구매 예측 모델을 상기 최적화 모델로서 결정하는 단계를 수행하는 것을 특징으로 하는 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치.
  7. 제1항에 있어서,
    상기 최적화 모델을 기초로 특정 구매고객에 대한 상품구매를 예측하여 추천 상품을 제공하는 상품구매 예측 제공부를 더 포함하는 것을 특징으로 하는 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치.
  8. 쇼핑몰 상품구매 예측 플랫폼 제공 장치에서 수행되는 방법에 있어서,
    쇼핑몰을 이용하는 구매고객의 상품구매 예측을 위한 구매고객 객체의 인구통계적 특성, 구매계절 특성, 구매시기 특성, 구매가격 변동 및 구매상품을 포함하는 상품구매 데이터를 수집하여 데이터 웨어하우스(warehouse)를 구축하는 단계;
    상기 상품구매 데이터를 기초로 구매고객별 라이프 스타일을 검증하여 상기 데이터 웨어하우스에 추가하는 단계;
    상기 데이터 웨어하우스로부터 랜덤하게 추출되는 복수의 후보 데이터 집합들 중에서 통계적 기준을 충족하는 데이터 집합을 선별하여 후보 데이터 모집단을 생성하는 단계;
    상기 데이터 웨어하우스로부터 랜덤하게 추출되는 복수의 후보 데이터들을 후보 데이터 모집단으로서 생성하고 통계적 기준을 충족하는 예측 독립변수를 결정하는 단계; 및
    상기 후보 데이터 모집단을 기초로 상기 예측 독립변수에 대해 복수의 인공지능 알고리즘들을 적용하여 상품구매 예측도가 가장 높은 상품구매 예측 모델을 예측 독립변수별 최적화 모델로서 결정하는 단계를 포함하는 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 방법.

KR1020190087061A 2019-07-18 2019-07-18 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법 KR102237399B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190087061A KR102237399B1 (ko) 2019-07-18 2019-07-18 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190087061A KR102237399B1 (ko) 2019-07-18 2019-07-18 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20210009906A true KR20210009906A (ko) 2021-01-27
KR102237399B1 KR102237399B1 (ko) 2021-04-07

Family

ID=74238619

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190087061A KR102237399B1 (ko) 2019-07-18 2019-07-18 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102237399B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102369757B1 (ko) * 2021-09-01 2022-03-03 주식회사 오늘바스켓 Ai기반 o2o 전자상거래 시스템
KR20220119969A (ko) 2021-02-22 2022-08-30 주식회사 시스펜 광고물 주문 수요 예측 시스템 및 그의 동작 방법
KR102461018B1 (ko) * 2021-05-11 2022-11-01 김동주 정보 처리 방법, 서버 및 정보 제공 방법
KR20230023262A (ko) * 2021-08-10 2023-02-17 (주)케이앤엘정보시스템 Ai기반 편물 추천 및 주문시스템과 그 주문방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102303534B1 (ko) 2021-05-26 2021-09-23 (주)파켓 사용자 맞춤형 상품 정보 제공 장치
KR102475513B1 (ko) 2021-09-09 2022-12-08 오브젠 주식회사 고객생애 단계별 고객생애가치(clv) 예측 모델 자동 생성 방법 및 시스템

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040076448A (ko) 2003-02-25 2004-09-01 주식회사 케이티프리텔 네트워크 기반 가상 구매를 통한 상품 구매 방법 및 시스템
KR20090001974A (ko) 2007-05-30 2009-01-09 제주대학교 산학협력단 모바일 알에프아이디 기반의 통계분석을 통한 상품 판매예측 시스템 및 방법
KR20160069485A (ko) * 2014-12-08 2016-06-16 주식회사 엘지씨엔에스 개인화 추천 방법, 시스템 및 기록 매체
KR20160118195A (ko) * 2016-09-30 2016-10-11 에스케이플래닛 주식회사 추천 아이템 제공 방법, 이를 위한 프로그램을 기록한 기록 매체 및 장치
KR20170017378A (ko) * 2015-08-06 2017-02-15 주식회사 메디비앙 구매데이터 기반 구매자와 판매자 매칭시스템 및 방법
JP2019511773A (ja) * 2016-03-03 2019-04-25 テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド サービス・パラメータ選択方法及び関連するデバイス

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040076448A (ko) 2003-02-25 2004-09-01 주식회사 케이티프리텔 네트워크 기반 가상 구매를 통한 상품 구매 방법 및 시스템
KR20090001974A (ko) 2007-05-30 2009-01-09 제주대학교 산학협력단 모바일 알에프아이디 기반의 통계분석을 통한 상품 판매예측 시스템 및 방법
KR20160069485A (ko) * 2014-12-08 2016-06-16 주식회사 엘지씨엔에스 개인화 추천 방법, 시스템 및 기록 매체
KR20170017378A (ko) * 2015-08-06 2017-02-15 주식회사 메디비앙 구매데이터 기반 구매자와 판매자 매칭시스템 및 방법
JP2019511773A (ja) * 2016-03-03 2019-04-25 テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド サービス・パラメータ選択方法及び関連するデバイス
KR20160118195A (ko) * 2016-09-30 2016-10-11 에스케이플래닛 주식회사 추천 아이템 제공 방법, 이를 위한 프로그램을 기록한 기록 매체 및 장치

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220119969A (ko) 2021-02-22 2022-08-30 주식회사 시스펜 광고물 주문 수요 예측 시스템 및 그의 동작 방법
KR102461018B1 (ko) * 2021-05-11 2022-11-01 김동주 정보 처리 방법, 서버 및 정보 제공 방법
KR20230023262A (ko) * 2021-08-10 2023-02-17 (주)케이앤엘정보시스템 Ai기반 편물 추천 및 주문시스템과 그 주문방법
KR102369757B1 (ko) * 2021-09-01 2022-03-03 주식회사 오늘바스켓 Ai기반 o2o 전자상거래 시스템
KR20230057918A (ko) * 2021-09-01 2023-05-02 주식회사 오늘바스켓 쇼핑몰 구매고객의 상품구매 예측이 가능한 전자상거래 시스템
KR20230057917A (ko) * 2021-09-01 2023-05-02 주식회사 오늘바스켓 인공지능 알고리즘을 활용한 전자상거래 시스템
KR20230057915A (ko) * 2021-09-01 2023-05-02 주식회사 오늘바스켓 식품 거래를 위한 전자상거래 시스템
KR20230057916A (ko) * 2021-09-01 2023-05-02 주식회사 오늘바스켓 도매상과 소매상 간의 거래를 위한 전자상거래 시스템

Also Published As

Publication number Publication date
KR102237399B1 (ko) 2021-04-07

Similar Documents

Publication Publication Date Title
KR102237399B1 (ko) 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법
CN109657805B (zh) 超参数确定方法、装置、电子设备及计算机可读介质
US11487941B2 (en) Techniques for determining categorized text
JP7276757B2 (ja) モデル公平性のためのシステムおよび方法
Min et al. Hybrid genetic algorithms and support vector machines for bankruptcy prediction
US11693917B2 (en) Computational model optimizations
Anwar et al. Machine learning techniques for book recommendation: an overview
Alghanam et al. Data mining model for predicting customer purchase behavior in e-commerce context
CN114997916A (zh) 潜在用户的预测方法、系统、电子设备和存储介质
US20210350448A1 (en) Computing techniques to predict locations to obtain products utilizing machine-learning
Liu et al. Extreme gradient boosting trees with efficient Bayesian optimization for profit-driven customer churn prediction
Zhang et al. E‐Commerce Information System Management Based on Data Mining and Neural Network Algorithms
Mahmood et al. Identification of critical factors for assessing the quality of restaurants using data mining approaches
Nagaraju et al. Methodologies used for customer churn detection in customer relationship management
KR102532679B1 (ko) 인공지능 알고리즘을 활용한 전자상거래 시스템
Chashmi et al. Predicting customer turnover using recursive neural networks
CN112328899B (zh) 信息处理方法、信息处理装置、存储介质与电子设备
CN111400567B (zh) 一种基于ai的用户数据的处理方法、装置及系统
Baderiya et al. Customer buying Prediction Using Machine-Learning Techniques: A Survey
US20230169564A1 (en) Artificial intelligence-based shopping mall purchase prediction device
Kingawa et al. Customer Churn Prediction Using Machine Learning Techniques: the case of Lion Insurance
Shi et al. Data-driven hybrid algorithm with multi-evolutionary sampling strategy for energy-saving buffer allocation in green manufacturing
Kumar et al. Driving E-commerce Success with Advanced Machine Learning: Customer Purchase Pattern Insights
US11593388B2 (en) Indexing based on feature importance
Klepac Particle Swarm Optimization Algorithm as a Tool for Profiling from Predictive Data Mining Models

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant