KR20240076323A - 국가별 역직구 판매상품 및 판매가 추천 방법 - Google Patents

국가별 역직구 판매상품 및 판매가 추천 방법 Download PDF

Info

Publication number
KR20240076323A
KR20240076323A KR1020220158796A KR20220158796A KR20240076323A KR 20240076323 A KR20240076323 A KR 20240076323A KR 1020220158796 A KR1020220158796 A KR 1020220158796A KR 20220158796 A KR20220158796 A KR 20220158796A KR 20240076323 A KR20240076323 A KR 20240076323A
Authority
KR
South Korea
Prior art keywords
sales
product
data
price
country
Prior art date
Application number
KR1020220158796A
Other languages
English (en)
Inventor
김진석
정지원
Original Assignee
(주) 네오포스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주) 네오포스 filed Critical (주) 네오포스
Priority to KR1020220158796A priority Critical patent/KR20240076323A/ko
Publication of KR20240076323A publication Critical patent/KR20240076323A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0206Price or cost determination based on market factors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 국가별 역직구 판매상품 및 판매가 추천 방법에 관한 것으로서, 더욱 상세하게는 다양한 인공지능을 이용하여 판매상품 추천 모델과 판매가 추천 모델을 적절하게 생성하고, 이를 학습시킴으로써 각 추천 모델에 사용자가 질의를 입력하면 해당 국가에 역직구하기 위한 추천 판매상품과 추천 판매가가 출력되게 하는 역직구 판매상품 및 판매가를 추천하는 방법에 관한 것이다.

Description

국가별 역직구 판매상품 및 판매가 추천 방법{Reverse direct purchase sales products by country and method of recommending sales price}
본 발명은 국가별 역직구 판매상품 및 판매가 추천 방법에 관한 것으로서, 더욱 상세하게는 다양한 인공지능 알고리즘을 이용하여 판매상품 추천 모델과 판매가 추천 모델을 적절하게 생성하고, 이를 학습시킴으로써 각 추천 모델에 사용자가 질의를 입력하면 해당 국가에 역직구하기 위한 추천 판매상품과 추천 판매가가 출력되게 하는 국가별 역직구 판매상품 및 판매가를 추천방법에 관한 것이다.
2030년까지 세계 경제의 약 80%가 글로벌 시장으로 전환될 것으로 전망되는 가운데 해외 소비자가 대한민국의 온라인 쇼핑몰에서 상품을 구매하는 역직구(reverse direct purchase) 상품 수출액이 연평균 55%로 성장하고 있는 추세이다.
2021년 기준 대한민국의 역직구 판매는 4,000만 건을 돌파하여 전년도 2,689만 건 보다 50.6%, 1,361만 건이 증가하였다.
이러한 역직구 시장의 급격한 증가는 코로나 19 시대에 소비자의 비대면 상품 구매에 대한 선호도 증가뿐아니라 국가간 경계가 점점 희석되어가는 글로벌 경제시대 온라인 소비패턴의 활성화에 기인한다.
특히, 대한민국의 역직구 시장은 한류 열풍이 시작된 2010년 이후 한류 콘텐츠가 글로벌 시장으로 뻗어 나가기 시작하면서 화장품, 패션, 액세서리 등 한류와 연관된 상품에도 관심이 집중되고 판매량의 증가로 이어졌다.
온라인 소비 트렌드의 가속화로 글로벌 대형유통업체들은 역직구 플랫폼을 정비하고 판매망을 넓히는 등 영토 확장에 나서고 있으며, 소규모 셀러도 참여가 늘고 있어 2020년 아마존 등 글로벌 전자상거래 플랫폼에 신규 등록한 대한민국의 온라인 판매 업체는 10만8724개로 전년(7만9033개) 대비 38% 증가하였다.
그런데 소규모 셀러인 중소기업의 경우, 전문인력 및 역량부족으로 인해 시장규모를 분석하고 동향을 예측하는 등의 활동을 수행하기 어려운 한계가 있기 때문에 해외시장을 목표로하여 수출 전략을 결정하기 어려운 문제가 있다.
또한, 일반적으로 빅데이터를 활용하거나, 인공지능을 기반으로 사용자 맞춤형 상품을 추천하는 기술 등에 대해서는 등록특허공보 제10-2404511호, 등록특허공보 제10-2225212호 등을 포함하는 종래기술들과 같이, 많은 연구가 이루어지고 있다.
하지만, 역직구 시장의 경우, 일반적인 상품 추천과는 다른 알고리즘에 의해 상품의 추천이 이루어져야 하기 때문에 종래의 상품 추천 기술을 적용하기는 어려워 역직구 시장에 알맞은 상품 추천 방법 및 시스템에 대해 요구되고 있는 실정이다.
등록특허공보 제10-2404511호 (2022.05.27.등록) 등록특허공보 제10-2225212호 (2021.03.03.등록)
본 발명은 상기 종래기술이 갖는 문제점을 해결하기 위하여 창출된 것으로서, 본 발명에서 해결하고자 하는 과제는 다양한 인공지능 알고리즘을 이용하여 판매상품 추천 모델과 판매가 추천 모델을 적절하게 생성하고, 이를 학습시킴으로써 각 추천 모델에 사용자가 질의를 입력하면 해당 국가에 역직구하기 위한 추천 판매상품과 추천 판매가가 출력되게 하는 국가별 역직구 판매상품 및 판매가를 추천방법을 제공하는 것이다.
본 발명은 선정된 온라인 쇼핑몰에서 판매 중인 상품에 대한 각종 판매 데이터를 수집하는 판매 데이터 수집단계; 수집된 판매 데이터를 전처리하는 판매 데이터 전처리 단계; 전처리된 데이터로부터 학습에 사용될 기본특성, 통계적 특성, 랭킹정보, 연관성 점수 및 그룹군 정보를 추출하여 학습데이터를 생성하는 학습 데이터 생성단계; 연관성 점수를 예측하도록 판매상품 추천 모델을 생성하며, 판매상품의 평균판매가를 예측하도록 평균판매가 추천 모델을 생성하고, 판매상품의 상세판매가에 대한 그룹군을 예측하도록 상세판매가 분류 모델을 생성하는 학습모델 생성단계; 및 사용자가 학습모델에 하나 이상의 질의를 입력하면 질의에 대응하는 판매상품 및 판매가를 추천하는 판매상품 및 판매가 추천단계;를 포함하는 것을 특징으로 한다.
이때, 상기 판매 데이터 전처리 단계는, 수집된 각 상품에 대한 상품코드를 대한민국 표준 코드(KAN : korea article number)의 분류체계에 따라 매핑하고, 각 상품에 대한 판매가의 화폐 단위를 단일화하는 데이터 통합단계; 및 데이터 통합단계 이후 통합 데이터에서 중복된 데이터를 삭제하고, 다중 칸코드 상품를 단일 칸코드로 매핑하는 데이터 정제단계;를 포함할 수 있다.
한편, 상기 학습데이터 생성단계에서는, 전처리된 판매 데이터를 분석하여 기본특성을 추출하고, 추출된 기본특성을 통해 통계적 특성을 추출하며, 추출된 통계적 특성을 이용하여 랭킹정보를 추출하며, 추출된 랭킹정보를 이용하여 연관성 점수를 추출할 수 있다.
이때, 상기 랭킹정보는, 통계적 특성들의 평균랭킹과 이로부터 추출 가능한 종합랭킹을 포함하며, 상기 평균랭킹은, 하나의 상품에 대한 각 통계적 특성들에 대해 각각 랭킹을 매긴 뒤, 이들의 평균값을 추출하는 것으로 획득하며, 상기 종합랭킹은, 판매상품의 기본특성 중 가격, 평점, 리뷰수 및 판매량을 포함하는 주요특징을 통계적으로 조합하여 종합 랭킹값을 산정하고, 산정된 종합 랭킹값을 정렬하여 매긴 순위로 설정할 수 있다.
한편, 연관성 점수는, 파레토 분석을 통해 종합랭킹의 빈도를 측정하고, 분석에 사용된 확률밀도함수와 누적분포함수 중 분포가 고르게 나타난 함수에 대한 분석 값을 선택하며, 선택한 분석 값을 기반으로 일정 범위에 분할점을 형성하여 이를 연관성 점수로 설정할 수 있다.
상기 그룹군은, 분할클러스터링 알고리즘에 의해 하나의 판매상품에 대한 판매가 분포에 따라 서로 다른 가격대의 분포로 복수 개로 형성하고, 형성된 그룹군 중 판매상품의 판매가에 대응하는 그룹군에 각각의 판매가를 분류함으로써 추출할 수 있다.
한편, 판매상품 추천 모델은, 러닝 투 랭크(learning to rank:LTR)기법에 의해 엑스지부스트(extreme gradient boosting:XGBoost)와 람다마트(lambdaMART) 알고리즘을 혼합하여 모델링되되, 연관성 점수를 예측 대상으로 하도록 모델링할 수 있다.
한편, 학습모델의 모델링 시, 두 개 이상의 분류 알고리즘에 학습 데이터를 입력하여 학습 및 테스트하여 그룹군의 분류에 대한 정확도가 가장 높은 알고리즘을 선정하여 상세판매가격군의 예측에 사용하되, 두 개 이상의 회귀 알고리즘에 학습 데이터를 입력하여 학습 및 테스트하여 평균판매가에 대한 정확도가 가장 높은 알고리즘을 선정하여 평균판매가의 예측에 사용할 수 있다.
한편, 판매상품 및 판매가 추천단계에서는, 연관성 점수가 가장 높은 상품을 추천 상품으로 출력할 수 있다.
한편, 판매상품 및 판매가 추천단계에서는, 복수 개로 분류된 각 그룹의 평균판매가를 추천 판매가로 출력할 수 있다.
본 발명에 따르면, 다양한 인공지능 알고리즘을 이용하여 판매상품 추천 모델과 판매가 추천 모델을 적절하게 생성하고, 이를 학습시킴으로써 각 추천 모델에 사용자가 질의를 입력하면 해당 국가에 역직구하기 위한 추천 판매상품과 추천 판매가가 출력되게 함에 따라 특정 상품의 수출 가능성 여부를 판단하거나 수출하고자 하는 상품의 자본 규모를 판단하는 등 다양한 경제적 지표로 사용할 수 있는 장점이 있다.
도 1은 본 발명에 따른 국가별 역직구 판매상품 및 판매가 추천 방법의 순서도.
도 2는 본 발명의 실시예에 따른 바디오일 상품 데이터에 대한 선형 보간법 사례 그래프.
도 3은 도 2를 파레트 분석함으로써 데이터를 연관성 점수에 매핑하여 변환한 그래프.
도 4는 본 발명의 실시예에 따른 엑스지부스트&람다마트(Pair-wise) 모델에서의 특징별 중요도 분석 그래프.
도 5는 본 발명의 실시예에 따른 엑스지부스트&람다마트(List-wise) 모델에서의 특징별 중요도 분석 그래프.
도 6은 본 발명의 실시예에 따른 2022-06월 일반린스 상품의 클러스터링을 통한 판매가분류군 분류 결과를 도시한 표.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예를 더욱 상세하게 설명한다.
본 발명은 국가별 역직구 판매상품 및 판매가 추천 방법에 관한 것으로서, 더욱 상세하게는 다양한 인공지능 알고리즘을 이용하여 판매상품 추천 모델과 판매가 추천 모델을 적절하게 생성하고, 이를 학습시킴으로써 각 추천 모델에 사용자가 질의를 입력하면 해당 국가에 역직구하기 위한 추천 판매상품과 추천 판매가가 출력되게 하는 국가별 역직구 판매상품 및 판매가를 추천방법에 관한 것이다.
한편, 도 1은 본 발명에 따른 국가별 역직구 판매상품 및 판매가 추천 방법의 순서도로서, 이에 따르면, 본 발명은 크게 판매 데이터 수집단계, 판매 데이터 전처리 단계, 학습 데이터 생성단계, 학습모델 생성단계 및 판매상품 및 판매가 추천단계를 포함한다.
1. 판매 데이터 수집단계
판매 데이터 수집단계는 선정된 온라인 쇼핑몰에서 판매 중인 상품에 대한 각종 판매 데이터를 수집하는 과정이다.
상술하면, 상기 판매 데이터 수집단계에서는 각 나라별 온라인 쇼핑몰 중 시장 점유율이 높은 순서, 또는 사용자가 많은 순서, 또는 노출이 많은 순서 등 다양한 조건에 따라 하나 이상의 쇼핑몰을 선정하고, 각 쇼핑몰에서 판매 중인 상품에 대한 각종 판매 데이터를 수집할 수 있다.
이때, 판매 데이터에는 상품코드, 판매가, 평점, 수량, 리뷰 수 및 수집 일자 등의 다양한 정보를 포함한다.
2. 판매 데이터 전처리 단계
판매 데이터 전처리 단계는 수집된 판매 데이터를 전처리하는 과정으로, 상기 판매 데이터 전처리 단계에서는 데이터 통합단계 및 데이터 정제단계를 포함한다.
2-1) 데이터 통합단계
데이터 통합단계는 수집된 각 상품에 대한 상품코드를 대한민국 표준 코드(KAN : korea article number)의 분류체계에 따라 매핑하고, 각 상품에 대한 판매가의 화폐 단위를 단일화하는 과정이다.
상술하면, 상기 데이터 통합단계에서는 판매 데이터를 공통적으로 활용하기 위해 각 상품의 상품코드를 칸코드(KAN code)를 이용하여 일관되게 매핑하는 한편, 각 상품의 판매가를 정확하게 비교할 수 있도록 하나의 화폐 단위로 단일화함으로써 통합데이터를 추출할 수 있다.
이때, 단일화하는 화폐는 적용하고자 하는 나라에 따라 적절하게 선택하여 사용할 수 있는데, 본 발명의 하기 실시예에서는 달러 단위로 단일화하여 사용하였다.
2-2) 데이터 정제단계
데이터 정제단계는 데이터 통합단계 이후 통합 데이터에서 중복된 데이터를 삭제하고, 다중 칸코드인 상품을 단일 칸코드의 상품으로 매핑하는 과정이다.
상술하면, 본 발명에서는 판매 데이터 수집단계에서 여러 쇼핑몰으로부터 상품 데이터를 수집하기 때문에 중복 데이터가 존재하게 되는 바, 상기 데이터 정제단계에서는 이러한 중복 데이터를 제거하여 판매 데이터의 정확도를 높일 수 있다.
아울러, 다중 칸코드인 상품의 경우, 해당 상품이 갖는 칸코드를 오름차순 또는 내림차순으로 정렬한 뒤, 가장 상위에 있는 칸코드로 정열함으로써 칸코드의 단일화를 수행할 수 있다.
한편, 상기 데이터 정제단계에서는 일부 누락된 데이터로 인해 값이 정확하게 산출되지 않는 경우를 보완하기 위해 선형 보간법을 이용하여 누락된 데이터를 추론할 수 있다.
상기와 같이 판매 데이터 전처리 단계에서는 수집한 판매 데이터를 가공 및 정제하여 신뢰성 있는 데이터를 생성할 수 있다. 이때, 전처리된 데이터는 각 국가별 및 쇼핑몰별로 저장 관리된다.
3. 학습 데이터 생성단계
학습 데이터 생성단계는 전처리된 데이터로부터 학습에 사용될 기본특성, 통계적 특성, 랭킹정보, 연관성 점수 및 그룹군 정보를 추출하여 학습데이터를 생성하는 과정이다.
즉, 학습 데이터는 기본특성, 통계적 특성, 랭킹정보, 연관성 점수 및 그룹군을 포함한다.
상기 기본특성은 전처리된 판매 데이터에 포함된 칸코드, 판매가, 평점, 리뷰수 및 판매량 등을 포함한다.
한편, 통계적 특성은 추출된 기본특성들로부터 각 값들에 대한 월별평균, 최대값, 최소값 및 중앙값 등을 포함한다.
아울러, 통계적 특성은 각 판매상품의 판매 추세 추정을 위한 가격평균, 평점평균, 리뷰평균, 판매량평균 등의 각각의 값들로부터 추출한 이동평균값(단순이동평균값, 지수이동평균값, 누적이동평균값) 및 전월대비증감율을 더 포함할 수 있다.
한편, 랭킹정보는 통계적 특성들의 평균랭킹 및 종합랭킹을 포함한다.
상기 평균랭킹은 하나의 상품에 대한 통계적 특성들에 대해 각각 랭킹을 매긴 뒤, 이들의 평균값을 추출하는 것으로 획득할 수 있다.
상기 종합랭킹은 판매상품의 기본특성 중 가격, 평점, 리뷰수 및 판매량을 포함하는 주요특징을 통계적으로 조합하여 종합 랭킹값을 산정하고, 산정된 종합 랭킹값을 정렬하여 매긴 순위로 설정한다.
한편, 연관성 점수는 파레토 분석을 통해 상기 종합랭킹의 빈도를 측정하고, 분석에 사용된 확률밀도함수와 누적분포함수 중 분포가 고르게 나타난 함수에 대한 분석 값을 선택하고, 선택한 분석 값을 기반으로 일정 범위에 분할점을 형성하여 이를 연관성 점수로 설정한다.
한편, 상기 그룹군은 분할클러스터링 알고리즘에 의해 하나의 판매상품에 대한 판매가 분포에 따라 서로 다른 가격대의 분포로 복수 개로 형성하고, 형성된 그룹군 중 판매상품의 판매가에 대응하는 그룹군에 각각의 판매가를 분류함으로써 추출된다.
상술하면, 동일한 판매제품이더라도 판매자에 따라 판매가는 상이하게 이루어지기 때문에 하나의 판매제품에 대한 판매가 정보를 수집하면 a,b,c,d,e 등의 다양한 판매가 정보가 수집되는데, 이를 분할 클러스터링 알고리즘을 이용하여 A 가격분포의 그룹, B 가격분포의 그룹, C 가격분포의 그룹, D 가격분포의 그룹 등과 같이, 복수 개의 그룹군을 형성한 뒤, a의 가격이 A 그룹의 가격대에 속하는 판매가이고, b의 가격이 C 그룹의 가격대에 속하는 판매가인 경우, a를 A 그룹으로 분류하고, b를 C 그룹으로 분류하게 된다.
이때, 본 발명에서는 가격분포에 따라 4개의 그룹군을 형성하고 있는데, 저렴한 가격분포가 저렴한 그룹군부터 순차적으로 이코노미(economy), 레귤러(regular), 프리미엄(premium) 및 럭셔리(luxury) 그룹으로 매핑하여 사용된다.
이때, 다중 그룹으로 매핑되는 상품을 찾아 단일 그룹으로 정제하여 보다 정확하게 각각의 그룹군을 분류할 수 있다.
4. 학습모델 생성단계
학습모델 생성 단계는 연관성 점수를 예측하도록 판매상품 추천 모델을 생성하며, 판매상품의 평균판매가를 예측하도록 평균판매가 추천 모델을 생성하고, 판매상품의 상세판매가에 대한 그룹군을 예측하도록 상세판매가 분류 모델을 생성하는 과정이다.
이때, 판매상품 추천 모델은 러닝 투 랭크(learning to rank:LTR) 기법을에 의해 엑스지부스트(extreme gradient boosting:XGBoost)와 람다마트(lambdaMART) 알고리즘의 혼합(조합)으로 모델링되되, 연관성 점수를 예측 대상으로 하도록 모델링될 수 있다.
더욱 상세하게 설명하면, 판매상품 추천 모델은 러닝 투 랭크의 접근법 중 Pair-wise접근법과 List-wise접근법을 사용하였으며, 그중에서도 엑스지부스트와 람다마트 알고리즘을 혼합한 알고리즘을 이용하여 판매상품 추천 모델을 생성하고, 해당 모델을 바탕으로 연관성 점수를 예측함으로써 국가별 판매상품 추천을 가능하게 한다.
여기서 Pair-wise는 한 번에 한 쌍의 아이템을 고려하여 둘 사이의 비교를 통해 최적의 순서를 도출하는 방법이고, list-wise는 목록의 전체 정보를 활용하여 최적의 순서를 도출하는 방법이다.
한편, 평균판매가 추천 모델은 평균판매가 추천 모델은 회귀(regression) 모델로 구성되어, 학습 데이터의 그룹군 정보를 이용하여 평균판매가의 예측에 사용하도록 생성되는데, 상술하면, 각 그룹군에 포함된 판매상품의 판매가를 전달받아 각 그룹군의 평균판매가를 추출하도록 설정된다.
한편, 상세판매가격군 분류 모델은 분류(classification) 모델로 구성되는데, 예측대상이 판매가에 대해 복수 개의 그룹군 중 하나가 선택되게 모델링된다.
상술하면, 상기 상세판매가 분류 모델은 학습 데이터와 평균판매가 추천 모델로부터 도출된 평균판매가에 대한 데이터를 입력하여 판매상품의 판매가에 따른 그룹군 분류 정보를 학습시켜, 이는 판매상품의 가격정보를 입력하면 복수 개의 그룹군 중 분류되어야 할 그룹군을 예측하여 출력할 수 있게 모델링된다.
한편, 본 발명에서 학습모델의 모델링 시, 두 개 이상의 회귀 알고리즘에 학습 데이터를 입력하여 학습 및 테스트하여 평균판매가에 대한 정확도가 가장 높은 알고리즘을 선정하여 평균판매가의 추출되고, 두 개 이상의 분류 알고리즘에 학습 데이터를 입력하여 학습 및 테스트하여 상세판매가의 예측에 대한 정확도가 가장 높은 알고리즘을 선정하여 사용된다.
본원발명에서는 각 알고리즘의 성능 평가 결과에 따라 분류 알고리즘에서는 XGBoost를 선정하여 사용하고, 회귀 알고리즘에서는 GBM(gradient boost machine)를 선정하여 사용할 수 있으며, 이에 대해서는 이후 더욱 상세하게 설명하기로 한다.
5. 판매상품 및 판매가 추천단계
판매상품 및 판매가 추천단계는 사용자가 학습모델에 하나 이상의 질의를 입력하면 질의에 대응하는 판매상품 및 판매가를 추천하는 과정이다.
상술하면, 판매상품 및 판매가 추천단계에서는 학습모델에 사용자가 판매상품의 정보를 원하는 국가에 대한 정보를 입력하면, 해당 국가에서 판매중인 상품 중 연관성 점수가 가장 높은 상품을 추천 상품으로 출력할 수 있다.
아울러, 학습모델에 사용자가 원하는 국가 및 판매상품에 대한 정보를 입력하면, 이코노미(economy), 레귤러(regular), 프리미엄(premium) 및 럭셔리(luxury) 그룹에 대한 각각의 평균판매가를 추천 판매가로 출력할 수 있다.
또한, 상세판매가격군 분류 모델에 사용자가 판매를 원하는 상품과 판매하고자 하는 판매가를 입력하게 되면, 해당 판매가가 위치하는 그룹군을 출력할 수 있다.
상기와 같이 본 발명에서는 인공지능 알고리즘을 이용하여 판매상품과 판매가에 대한 추천 결과를 제공하는 모델을 구성함으로써, 특정 상품의 수출 가능성 여부를 판단하거나 수출하고자 하는 상품의 자본 규모를 판단하는 등 다양한 경제적 지표로 사용할 수 있다.
하기에서는 본 발명에 따른 국가별 역직구 판매상품 및 판매가 추천 방법에 대한 이해를 돕기 위해 실시예를 기준으로 설명하기로 한다.
먼저, 실시예에서는 2021년 10월 ~ 2022년 10월까지 미국의 아마존, 중국의 타오바오, 베트남의 쇼피 등의 쇼핑몰로부터 판매 데이터를 수집하여, 약 총 1300만개의 판매상품에 대한 판매 데이터를 수집하였다.
이후, 수집한 판매 데이터를 전처리하여 전처리 데이터를 생성하는데, 이때, 화폐는 달러로 단일화 하였으며, 달러 변환시, 데이터의 수집기간 중 환율의 평균값을 환율로서 설정함으로써 데이터 통합단계를 수행한 뒤, 데이터 정제단계를 수행하여 중복된 데이터를 삭제한 후 도 2와 같이 선형 보간법에 따라 상품 데이터에서 누락된 데이터를 추론하여 그래프로 도출함으로써 데이터의 전처리 과정을 완료하였다.
이후, 전처리된 데이터로부터 학습 데이터로 사용할 각 특성들을 추출하고, 연관성 점수는 파레토 분석을 통해 추출하여 도 3과 같은 그래프로 도출하며, 도 4 및 도 5와 같이 추출한 특성에 대한 중요도를 분석하는데, 이때, 본 발명의 학습모델에 사용된 Pair-wise 접근법과 List-wise 접근법에 따라 각 특성들의 중요도를 각각 분석하여 도시하였다.
한편, 상기와 같은 학습 데이터의 추출 이후, 본원발명의 학습모델 생성단계에 의해 각각의 학습모델을 생성한 뒤, 각각의 학습모델에 학습 데이터를 입력함으로써 학습을 수행하고, 정확도를 평가하였다.
상술하면, 판매상품 추천 모델은 scikit-learn에서 제공하는 XGBoost를 라이브러리로 사용하고, 목적함수(objective function)는
Figure pat00001
로 정의될 수 있는데, 이때, 목적함수는 기본값이 아닌 Pair-wise 손실이 최소화되는 LambdaMART와 NDCG(Normalized Discounted Cumulative Gain)가 최대화되는 List-wise 접근법의 LambdaMART로 설정하여 모델을 구성하였다.
아울러, 모델 파라미터로는 트리에서의 레이어 수 10개, gradient bossted tree수를 칸코드의 수만큼 설정하였다.
이때, 학습 데이터들 중 2021년 10월부터 2022년 5월까지의 데이터는 훈련데이터로서 각 모델의 학습에 사용하고, 2022년6월 데이터는 정확도 평가를 위한 테스트 데이터로 사용하여 모델 평가를 실시하였다.
이에 따르면, 판매상품 추천 모델의 성능평가 지수는 하기 표 1과 같이 나타날 수 있는데, NDCG(Normalized Discounted Cumulative Gain)는 러닝 투 랭크와 같이 순위를 측정하는 것을 목적으로 하는 인공지능을 평가하기 위한 일반적인 방법으로, 하기 표 1에 따르면, 엑스지부스트&람다마트(Pair-wise) 알고리즘과 및 엑스지부스트&람다마트(list-wise) 알고리즘에 따른 판매상품 추천 모델은 각각 98%의 종은 성능을 보이고 있다.
평가 지표 MSE RMSE NDCG
Pair-wise model 10.39 3.21 0.98
List-wise model 13.51 3.67 0.98
한편, 본원발명에 따라 도 6과 같이 그룹군을 분류하고, 각 그룹군의 평균판매가를 산출할 수 있다.
이는 머신러닝 및 모델 관리 툴인 Pycaret 라이브러리로 사용하고, 모델 파라미터로는 multicollinearity_threshold를 0.95로 설정 및 데이터 정규화를 하였고, transformaion을 통해 데이터를 정규 분포와 가깝게 처리함으로써 구성되었다.
이때, 학습 데이터들 중 2021년 10월부터 2022년 5월까지의 데이터는 훈련데이터로서 각 모델의 학습에 사용하고, 2022년6월 데이터는 정확도 평가를 위한 테스트 데이터로 사용하여 모델 평가를 실시하였다.
한편, 본 발명에서는 19개의 분류 알고리즘 모델과 15개의 회귀 알고리즘 모델의 성능을 모두 테스트하여 가장 성능이 좋은 것을 선정하여 판매가 추천 모델링에 사용하였다.
하기 표 2는 회귀 알고리즘 모델 중 상위 5개의 모델의 성능 평가 결과이고, 표 3은 분류 알고리즘 모델 중 상위 5개의 모델의 성능 평가 결과로서, 결과에 따라 회귀 알고리즘 모델은 EXGboost로 선정하고, 분류 알고리즘은 GBM으로 선정하였다.
Model MAE MSE RMSE R2
Extreme Gradient Boosting 12.5863 119978.38 121.9403 0.921
Gradient Boosting Regressor 12.8837 121629.98 121.8854 0.9206
Decision Tree Regressor 14.1816 120291.37 129.6951 0.9118
Random Forest Regressor 14.0503 126779.31 139.9091 0.8906
AdaBoost Regressor 37.0856 124430.79 150.5369 0.8441
Model Accuracy AUC Recall Prec. F1 Kappa MCC
Gradient Boosting Classifier 0.789 0.9371 0.7901 0.7953 0.7905 0.7185 0.7196
Extreme Gradient Boosting 0.7802 0.9379 0.7816 0.784 0.7809 0.7069 0.7078
Logistic Regression 0.7781 0.9314 0.7797 0.7736 0.7744 0.7042 0.7053
Random Forest Classifier 0.7723 0.9274 0.774 0.7707 0.7709 0.6965 0.6969
Extra Trees Classifier 0.764 0.9213 0.7656 0.7608 0.7611 0.6854 0.6863
이상에서 본 발명의 바람직한 실시 예를 설명하였으나, 본 발명의 권리범위는 이에 한정되지 아니하며 본 발명의 실시 예와 실질적으로 균등한 범위에 있는 것까지 본 발명의 권리범위가 미치는 것으로 이해되어야 하며, 본 발명의 정신을 벗어나지 않는 범위 내에서 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형 실시가 가능하다.

Claims (10)

  1. 선정된 온라인 쇼핑몰에서 판매 중인 상품에 대한 각종 판매 데이터를 수집하는 판매 데이터 수집단계;
    수집된 판매 데이터를 전처리하는 판매 데이터 전처리 단계;
    전처리된 데이터로부터 학습에 사용될 기본특성, 통계적 특성, 랭킹정보, 연관성 점수 및 그룹군 정보를 추출하여 학습데이터를 생성하는 학습 데이터 생성단계;
    연관성 점수를 예측하도록 판매상품 추천 모델을 생성하며, 판매상품의 평균판매가를 예측하도록 평균판매가 추천 모델을 생성하고, 판매상품의 상세판매가에 대한 그룹군을 예측하도록 상세판매가 분류 모델을 생성하는 학습모델 생성단계; 및
    사용자가 학습모델에 하나 이상의 질의를 입력하면 질의에 대응하는 판매상품 및 판매가를 추천하는 판매상품 및 판매가 추천단계;
    를 포함하는 것을 특징으로 하는 국가별 역직구 판매상품 및 판매가 추천 방법.
  2. 청구항 1에 있어서,
    상기 판매 데이터 전처리 단계는,
    수집된 각 상품에 대한 상품코드를 대한민국 표준 코드(KAN : korea article number)의 분류체계에 따라 매핑하고, 각 상품에 대한 판매가의 화폐 단위를 단일화하는 데이터 통합단계; 및
    데이터 통합단계 이후 통합 데이터에서 중복된 데이터를 삭제하고, 다중 칸코드 상품를 단일 칸코드로 매핑하는 데이터 정제단계;
    를 포함하는 것을 특징으로 하는 국가별 역직구 판매상품 및 판매가 추천 방법.
  3. 청구항 1에 있어서,
    상기 학습데이터 생성단계에서는,
    전처리된 판매 데이터를 분석하여 기본특성을 추출하고, 추출된 기본특성을 통해 통계적 특성을 추출하며, 추출된 통계적 특성을 이용하여 랭킹정보를 추출하며, 추출된 랭킹정보를 이용하여 연관성 점수를 추출하는 것을 특징으로 하는 국가별 역직구 판매상품 및 판매가 추천 방법.
  4. 청구항 3에 있어서,
    상기 랭킹정보는, 통계적 특성들의 평균랭킹과 이로부터 추출 가능한 종합랭킹을 포함하며,
    상기 평균랭킹은, 하나의 상품에 대한 각 통계적 특성들에 대해 각각 랭킹을 매긴 뒤, 이들의 평균값을 추출하는 것으로 획득하며,
    상기 종합랭킹은, 판매상품의 기본특성 중 가격, 평점, 리뷰수 및 판매량을 포함하는 주요특징을 통계적으로 조합하여 종합 랭킹값을 산정하고, 산정된 종합 랭킹값을 정렬하여 매긴 순위로 설정하는 것을 특징으로 하는 국가별 역직구 판매상품 및 판매가 추천 방법.
  5. 청구항 4에 있어서,
    연관성 점수는,
    파레토 분석을 통해 종합랭킹의 빈도를 측정하고, 분석에 사용된 확률밀도함수와 누적분포함수 중 분포가 고르게 나타난 함수에 대한 분석 값을 선택하며, 선택한 분석 값을 기반으로 일정 범위에 분할점을 형성하여 이를 연관성 점수로 설정하는 것을 특징으로 하는 국가별 역직구 판매상품 및 판매가 추천 방법.
  6. 청구항 1에 있어서,
    상기 그룹군은,
    분할클러스터링 알고리즘에 의해 하나의 판매상품에 대한 판매가 분포에 따라 서로 다른 가격대의 분포로 복수 개로 형성하고, 형성된 그룹군 중 판매상품의 판매가에 대응하는 그룹군에 각각의 판매가를 분류함으로써 추출하는 것을 특징으로 하는 국가별 역직구 판매상품 및 판매가 추천 방법.
  7. 청구항 1에 있어서,
    판매상품 추천 모델은,
    러닝 투 랭크(learning to rank:LTR)기법에 의해 엑스지부스트(extreme gradient boosting:XGBoost)와 람다마트(lambdaMART) 알고리즘을 혼합하여 모델링되되, 연관성 점수를 예측 대상으로 하도록 모델링되는 것을 특징으로 하는 국가별 역직구 판매상품 및 판매가 추천 방법.
  8. 청구항 1에 있어서,
    학습모델의 모델링 시, 두 개 이상의 분류 알고리즘에 학습 데이터를 입력하여 학습 및 테스트하여 그룹군의 분류에 대한 정확도가 가장 높은 알고리즘을 선정하여 상세판매가격군의 예측에 사용하되, 두 개 이상의 회귀 알고리즘에 학습 데이터를 입력하여 학습 및 테스트하여 평균판매가에 대한 정확도가 가장 높은 알고리즘을 선정하여 평균판매가의 예측에 사용하는 것을 특징으로 하는 국가별 역직구 판매상품 및 판매가 추천 방법.
  9. 청구항 1에 있어서,
    판매상품 및 판매가 추천단계에서는,
    연관성 점수가 가장 높은 상품을 추천 상품으로 출력하는 것을 특징으로 하는 국가별 역직구 판매상품 및 판매가 추천 방법.
  10. 청구항 1에 있어서,
    판매상품 및 판매가 추천단계에서는,
    복수 개로 분류된 각 그룹의 평균판매가를 추천 판매가로 출력하는 것을 특징으로 하는 국가별 역직구 판매상품 및 판매가 추천 방법.
KR1020220158796A 2022-11-23 2022-11-23 국가별 역직구 판매상품 및 판매가 추천 방법 KR20240076323A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220158796A KR20240076323A (ko) 2022-11-23 2022-11-23 국가별 역직구 판매상품 및 판매가 추천 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220158796A KR20240076323A (ko) 2022-11-23 2022-11-23 국가별 역직구 판매상품 및 판매가 추천 방법

Publications (1)

Publication Number Publication Date
KR20240076323A true KR20240076323A (ko) 2024-05-30

Family

ID=91275819

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220158796A KR20240076323A (ko) 2022-11-23 2022-11-23 국가별 역직구 판매상품 및 판매가 추천 방법

Country Status (1)

Country Link
KR (1) KR20240076323A (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102225212B1 (ko) 2020-09-29 2021-03-09 이대성 인공지능 기반의 고객 맞춤형 쇼핑몰 상품 추천 및 상품 페이지 자동 구성 시스템
KR102404511B1 (ko) 2022-02-17 2022-06-07 주식회사 로원홀딩스 인공지능 기반 사용자 맞춤형 상품 정보 추천 방법, 장치 및 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102225212B1 (ko) 2020-09-29 2021-03-09 이대성 인공지능 기반의 고객 맞춤형 쇼핑몰 상품 추천 및 상품 페이지 자동 구성 시스템
KR102404511B1 (ko) 2022-02-17 2022-06-07 주식회사 로원홀딩스 인공지능 기반 사용자 맞춤형 상품 정보 추천 방법, 장치 및 시스템

Similar Documents

Publication Publication Date Title
CN108564286B (zh) 一种基于大数据征信的人工智能金融风控授信评定方法和系统
CN106485562B (zh) 一种基于用户历史行为的商品信息推荐方法及系统
CN102841946B (zh) 商品数据检索排序及商品推荐方法和系统
CN109063945B (zh) 一种基于价值评估体系的售电公司360度客户画像构建方法
CN107679946A (zh) 基金产品推荐方法、装置、终端设备及存储介质
CN110458627A (zh) 一种面向用户动态偏好的商品序列个性化推荐方法
CN112559900B (zh) 产品推荐方法、装置、计算机设备和存储介质
CN110956273A (zh) 融合多种机器学习模型的征信评分方法及系统
CN108898479A (zh) 信用评价模型的构建方法及装置
CN108921602B (zh) 一种基于集成神经网络的用户购买行为预测方法
CN106447075B (zh) 行业用电需求预测方法与系统
CN109919737B (zh) 一种生产销售商品的推荐方法及系统
CN109711424A (zh) 一种基于决策树的行为规则获取方法、装置及设备
CN110443290A (zh) 一种基于大数据的产品竞争关系量化生成方法及装置
JP5391637B2 (ja) データ類似度計算システム、データ類似度計算方法およびデータ類似度計算プログラム
Wanke et al. Revisiting camels rating system and the performance of Asean banks: a comprehensive mcdm/z-numbers approach
Chessa MARS: A method for defining products and linking barcodes of item relaunches
Ghasemzadeha et al. Machine learning algorithms for time series in financial markets
Chou et al. The RFM Model Analysis for VIP Customer: A case study of golf clothing brand
KR20240076323A (ko) 국가별 역직구 판매상품 및 판매가 추천 방법
CN115858939A (zh) 一种同行召回方法、系统及存储介质
CN114266594A (zh) 一种基于东南亚跨境电商平台的大数据分析方法
KR101960863B1 (ko) 기술가치 평가 시스템
CN107291722B (zh) 一种描述词的分类方法及设备
Roszkowska Application the TOPSIS methods for ordering offers in buyer-seller transaction