KR102602448B1 - Cnn과 annoy 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템 - Google Patents

Cnn과 annoy 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템 Download PDF

Info

Publication number
KR102602448B1
KR102602448B1 KR1020220119430A KR20220119430A KR102602448B1 KR 102602448 B1 KR102602448 B1 KR 102602448B1 KR 1020220119430 A KR1020220119430 A KR 1020220119430A KR 20220119430 A KR20220119430 A KR 20220119430A KR 102602448 B1 KR102602448 B1 KR 102602448B1
Authority
KR
South Korea
Prior art keywords
data
evaluation
demand
graph
product
Prior art date
Application number
KR1020220119430A
Other languages
English (en)
Inventor
백승훈
Original Assignee
백승훈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 백승훈 filed Critical 백승훈
Priority to KR1020220119430A priority Critical patent/KR102602448B1/ko
Application granted granted Critical
Publication of KR102602448B1 publication Critical patent/KR102602448B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 제품의 수요에 영향을 미치는 평가요소들을 선정하고 평가요소들의 데이터를 수집하고, 온라인 사이트에서 이미지 데이터들을 수집한 후 CNN 기법과 ANNOY 기법을 활용하여 상기 수집된 이미지 데이터들의 상품이미지 세트를 형성하며, 상기 상품이미지 세트와 평가요소들을 매칭시키는 데이터 수집부와, 상기 평가요소들의 관계도와 가중치를 계산하여 평가요소들을 재조합하는 데이터 분석부와, 상기 데이터 분석부에서 재조합된 데이터를 토대로 제품의 미래 수요를 예측하는 수요예측부를 포함하는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템을 개시한다.

Description

CNN과 ANNOY 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템 { SYSTEM OF PREDICTING FUTURE DEMAND USING DEEP-LEARNING ANALYSIS OF CONVOLUTIONAL NEURAL NETWORK AND ARTIFICIAL NEURAL NETWORK OH YEAH }
본 발명은 CNN 과 ANNOY 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템에 관한 것으로서, 보다 자세하게는 CNN 기법과 ANNOY 기법을 활용하여 상품의 이미지 정보에 데이터의 속성을 부여하고 상품의 유사도를 수치화하여 미래의 수요 예측에 활용하는 CNN 과 ANNOY 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템에 관한 것이다.
종래에는 이미지 검색을 위해 이미지를 텍스트 기반으로 분류한 후 이를 키워드로 정의하고 이를 다시 검색을 통해 관련된 이미지를 제공하는 방식으로 이루어졌다. 하지만, 이러한 방식의 이미지 검색 방법으로는 이미지를 이용한 통계 분석이 어렵다는 문제가 있다.
구체적으로, 실시간으로 이미지를 분석하는 것이 아니라 그동안 누적된 정보를 제공하는 것만 가능하고 제공되는 정보의 업데이트가 어려워 이러한 정보를 활용하는 것이 불가능하다.
이러한 문제를 해결하기 위해 대한민국 등록특허 제10-2166547호 '이미지 기반 정보 예측 시스템 및 그 방법'(이하 '특허문헌 1'이라 함)에서는 이미지화 한 통계 정보를 두가지 카테고리로 분류하여 딥러닝 알고리즘을 학습하고, 학습된 딥러닝 알고리즘을 이용하여 분류한 통계 정보를 분류하는 기준값을 미래의 목표 정보로 예측하는 방법을 제시하고 있다.
하지만, CNN(Convolutional Neaural Network)을 기반으로 하는 딥러닝 모델에은 처리 속도가 느려 실시간 분석이 필요한 수요 예측 시스템에는 적용이 쉽지 않다.
대한민국 등록특허 제10-2190303호 'CNN 기반의 딥러닝 모델 학습장치 및 그 방법'(이하 '특허문헌 2'라 함)에서는 일정수준으로 학습된 CNN기반의 딥러닝 모델을 이용하여 학습에 사용된 전제 학습 데이터 각각의 정확도를 산출하여 정확도가 상대적으로 낮은 학습 데이터들만 추가로 재학습을 수행하는 방법을 수행함으로써 상대적으로 적은 연산자원에서도 원활하게 학습을 수행할 수 있는 방법을 제시하고 있다. 하지만, 특허문헌 2의 방법으로 처리 속도가 다소 빨라질 수는 있지만 여전히 실시간으로 데이터를 처리하기에는 어려움이 있다.
또한, 비특허문헌 1 및 비특허문헌 2에서는 CNN과 ANNOY 분석기법을 활용하여 의류 이미지 유사도를 분석하는 방법이 개시되어 있으나, 학술적으로 이미지 분석 가능성을 제시하고 있을 뿐 이를 활용하여 미래 수요를 예측할 수 있는 구체적인 방법이 개시되어 있지 않다.
이에 보다 빠른 이미지 분석 방법을 활용하여 상품 이미지 데이터를 미래 수요 예측에 활용할 수 있는 실용적인 시스템에 대한 연구가 진행되고 있다.
대한민국 등록특허 제10-2166547호 '이미지 기반 정보 예측 시스템 및 그 방법' 대한민국 등록특허 제10-2190303호 'CNN 기반의 딥러닝 모델 학습장치 및 그 방법' 대한민국 등록특허 제10-2412461호 '상품의 비주얼 스키마를 이용한 수요 예측 방법 및 그 시스템'
Journal of Information Technology and Architecture Vol. 17, No. 2, June 2020, Pages 15-165 'CNN/ANNOY 기술을 이용한 의류 이미지 유사도 분석 2020년도 한국인터넷정보학회 춘계학술발표대회 논문집 제21권 제1호 'CNN/ANNOY 딥러닝 기술 기반 의류 유사도 성능에 관한 연구'
본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로서, 상품의 이미지 정보를 미래 수요 예측에 접목시킬 수 있는 CNN과 ANNOY 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템을 제공하는 것을 목적으로 한다.
상기와 같은 과제를 해결하기 위해 본 발명은 제품의 수요에 영향을 미치는 평가요소들을 선정하고 평가요소들의 데이터를 수집하고, 온라인 사이트에서 이미지 데이터들을 수집한 후 CNN 기법과 ANNOY 기법을 활용하여 상기 수집된 이미지 데이터들의 상품이미지 세트를 형성하며, 상기 상품이미지 세트와 평가요소들을 매칭시키는 데이터 수집부와, 상기 평가요소들의 관계도와 가중치를 계산하여 평가요소들을 재조합하는 데이터 분석부와, 상기 데이터 분석부에서 재조합된 데이터를 토대로 제품의 미래 수요를 예측하는 수요예측부를 포함하는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템을 개시한다.
본 발명의 일 실시예에 따르면, 상기 데이터 분석부는 상기 선정된 평가요소들의 관계도를 계산하고, 계산된 관계도에 근거하여 평가요소들을 그룹화하고, 상기 그룹화된 평가요소들의 순위를 설정하고, 순위가 높은 평가요소에 순위가 낮은 평가요소 데이터를 병합하여 수요 예측 그래프를 생성시키는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템을 개시한다.
본 발명의 일 실시예에 따르면, 상기 수요예측부는 상기 수요 예측 그래프를 통해 선택된 제품의 수요 예측 데이터를 출력하고, 상기 선택된 제품과 유사 제품의 수요 예측 데이터를 비교하여 상기 선택된 제품의 수요 예측 데이터를 보정하도록 형성되는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템을 개시한다.
본 발명의 일 실시예에 따르면, 상기 평가요소들의 순위는 설정된 구간 범위 내에서 데이터의 최대값과 최소값의 차이가 클수록 높은 순위를 갖는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템을 개시한다.
본 발명의 일 실시예에 따르면, 상기 데이터 분석부는 가장 높은 순위(1순위)의 평가요소를 제외한 다른 평가요소들의 데이터에 변환 팩터를 곱하여 데이터의 변화폭을 상기 1순위 데이터와 일치시킨 후 최초 구간에서 평가요소들이 동일한 값을 갖도록 데이터를 보정하는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템을 개시한다.
본 발명의 일 실시예에 따르면, 상기 데이터 분석부는 상기 평가요소들의 다항식 추세선을 추정한 후 상기 다항식 추세선의 미분 그래프를 작성하여 변곡점의 위치를 파악하고, 상기 변곡점의 위치를 기준으로 평가요소들의 데이터를 병합하여 수요 예측 그래프를 작성하는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템을 개시한다.
본 발명의 일 실시예에 따르면, 상기 수요예측부는 상기 수요 예측 그래프에 의하여 예측된 1순위 평가요소의 값과 최근 측정된 1순위 평가요소의 값의 비율에 근거하여 미래 수요를 예측하는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템을 개시한다.
본 발명의 일 실시예에 따르면, 상기 평가요소들의 데이터 병합은 두번째 순위(2순위)의 평가요소 추세선의 변곡점을 확인하고, 상기 변곡점 이후의 구간들에서 상기 1순위 평가요소의 데이터들을 상기 2순위 평가요소의 데이터와 상기 1순위 평가요소의 데이터의 평균값으로 치환하는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템을 개시한다.
본 발명의 일 실시예에 따르면, 상기 수요 예측 그래프는 상기 병합된 1순위 평가요소의 데이터들 중 상기 변곡점 직전 구간부터 최근 측정된 구간 이후의 구간까지의 다항식 추세선으로 그려지는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템을 개시한다.
본 발명의 일 실시예에 따르면, 상기 수요 예측 그래프는 상기 2순위 평가요소의 변곡점의 수에 1을 더한 차수의 다항식 추세선인 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템을 개시한다.
본 발명에 따르면 CNN 분석 기법과 ANNOY 분석 기법을 병행하여 제품 이미지를 분석하여 유사도를 높임과 동시에 소요시간을 줄이는 것이 가능하다.
또한, 본 발명은 실시간으로 획득되는 제품 이미지 데이터를 분석하여 시장 수요를 예측함으로써 시장 분석 모델로서의 활용도를 높일 수 있다.
또한, 본 발명에 따르면 소비 패턴에 따라 각 세대별, 국가별 분석이 가능하게 하여 세대간의 행동 유형 분석과 해외 소비 패턴을 이용해 각각의 대상에 따른 맞춤형 수요 예측을 가능하게 한다.
아울러, 본 발명에서는 수요에 영향을 미치는 복수의 요소들의 순위를 매기고 낮은 순위 요소의 변화율을 높은 순위 요소의 변화율에 병합함으로써 수요의 변화율을 보다 정확하게 예측하는 것이 가능해진다.
도 1은 본 발명의 일 실시예에 따른 미래 수요 예측 시스템의 구조를 설명하기 위한 도면이다.
도 2는 상품정보의 수집에서 수요자에게 미래 수요 예측 데이터를 전달하는 과정을 설명하기 위한 개념도이다.
도 3은 본 발명의 일 실시예에 따른 데이터 처리 구조를 나타내는 개념도이다.
도 4는 미래 수요 예측을 의한 상품 이미지 전처리 과정을 설명하기 위한 순서도이다.
도 5는 시스템에서 상품들의 정보를 수집하는 방법을 설명하기 위한 예시도이다.
도 6는 본 발명의 일 실시예에 따른 소비 패턴 분석 및 미래 수요 예측 방법을 설명하는 순서도이다.
도 7는 도 6에 도시된 '평가요소들을 재조합 하는 단계'를 구체적으로 설명하기 위한 순서도이다.
도 8은 도 6에 도시된 '제품의 수요를 예측하는 단계'를 구체적으로 설명하기 위한 순서도이다.
도 9은 도 7에 도시된 '수요예측 그래프를 생성하는 단계'를 구체적으로 설명하기 위한 순서도이다.
도 8은 본 발명에 따른 BAFP를 활용할 수 있는 분야들의 예시를 나타낸 도면이다.
도 10a는 수요예측 그래프를 생성하기 위하여 원본 그래프를 생성하는 단계를 설명하는 도면이다.
도 10b는 수요예측 그래프를 생성하기 위하여 배율 변환에 따른 초기값 일치 그래프를 생성하는 단계를 설명하는 도면이다.
도 10c는 수요예측 그래프를 생성하기 위하여 상승폭 및 초기값 보정 그래프를 생성하는 단계를 설명하는 도면이다.
도 10d는 수요예측 그래프를 생성하기 위하여 다항식(Polynomial) 추세선 그래프를 생성하는 단계를 설명하는 도면이다.
도 10e는 수요예측 그래프를 생성하기 위하여 다항식(Polynomial) 추세선의 미분 그래프를 생성하는 단계를 설명하는 도면이다.
도 10f는 수요예측 그래프를 생성하기 위하여 1차 병합 그래프를 생성하는 단계를 설명하는 도면이다.
도 10g는 수요예측 그래프를 생성하기 위하여 2차 병합 그래프를 생성하는 단계를 설명하는 도면이다.
도 10h는 수요예측 그래프를 생성하기 위하여 3차 병합 그래프를 생성하는 단계를 설명하는 도면이다.
도 10h는 추세 예측 그래프를 통해 미래 수요를 예측하는 방법을 설명하는 도면이다.
도 11은 미래 수요 예측 결과에 근거한 리포팅 예시를 나타낸 도면이다.
이하, 본 발명에 대하여 도면을 참조하여 보다 상세하게 설명한다. 본 명세서에서는 서로 다른 실시예라도 동일·유사한 구성에 대해서는 동일·유사한 참조번호를 부여하고, 그 설명은 처음 설명으로 갈음한다. 본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도는 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 명세서에 기재된 "...부", "...유닛", "...모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
도 1은 본 발명의 일 실시예에 따른 미래 수요 예측 시스템 동작 구조를 설명하기 위한 도면이고, 도 2는 상품정보의 수집에서 수요자에게 미래 수요 예측 데이터를 전달하는 과정을 설명하기 위한 개념도이다.
도 1 및 도 2를 참조하면, 수요 예측 시스템은 서버를 통해 유저, 다른 서버, 인터넷 통신망에 연결될 수 있다.
서버는 인터넷 사이트들로부터 이미지 데이터를 수집하여 데이터 베이스에 저장하고, 시스템은 수집된 데이터들로부터 가공된 정보를 활용하여 상품들의 미래 수요를 예측하여 사용자들(user1, user2, …, user N)에게 제공한다.
상기 인터넷 사이트는 쇼핑몰 사이트(11), 블로그 사이트(12), 카페 사이트(13) 등을 포함할 수 있고, 상기 사용자들은 개인 사용자, 기업 사용자, 서버나 시스템 관리자 일 수 있다.
본 발명에서는 효율적인 데이터 수집을 위해 동일한 2대의 서버를 사용하여 상품의 데이터를 수집할 수 있다. 예를 들어, 제1 서버는 사이트의 제품 리스트 주소를 수집하고 데이터베이스에 데이터를 저장하고, 제2 서버는 상기 제1 서버에서 수집된 제품 리스트 주소를 수신받아 각각 상품의 이미지, 가격, 분류 정보를 수집한다.
수집된 데이터는 사이트명, 상품의 URL, 제품명, 제품분류, 이미지, 가격, 제품설명, 후기, 문의, 수집시간 등의 항목으로 분류하여 데이터베이스에 저장된다.
수요 예측 시스템은 데이터 수집부, 데이터 분석부, 수요예측부, 관리부 등을 포함할 수 있다. 이러한 '부(part)'들은 수요 예측 시스템의 기능을 설명하기 위해 구분한 것일 뿐 하드웨어적으로 분리되지 않을 수 있다. 또한, 도 3에 도시된 '부' 말고 다른 '부'가 더 존재하거나, 복수의 '부'들이 하나로 합쳐지는 것도 가능하다.
데이터 수집부는 통신 모듈(111)과 데이터베이스(112)를 포함할 수 있다.
통신모듈(111)은 수요 예측 시스템과 서버 사이의 유/무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다.
데이터베이스(112)는 수요 예측 시스템이 수집한 데이터들과 데이터 분석부(120), 수요예측부(130), 관리부(140) 등에서 수집, 분석, 가공한 데이터들을 저장한다.
데이터 수집부(110)는 웹 크롤러 방식으로 데이터를 수집할 수 있다.
웹 크롤러(web crawler)는 조직적, 자동화된 방법으로 월드와이드웹을 탐색하는 컴퓨터 프로그램이다. 일반적으로 웹 크롤러가 하는 작업을 웹 크롤링 혹은 스파이더링(spidering)이라 부른다. 검색 엔진과 같은 여러 사이트에서는 데이터의 최신 상태 유지를 위해 웹 크롤링을 수행한다. 웹 크롤러는 그 방문한 사이트의 모든 페이지의 복사본을 생성하는 데 사용되며, 검색 엔진은 이렇게 생성된 페이지를 빠르게 검색하기 위해 인덱싱을 수행한다. 또한 크롤러는 링크 체크나 HTML 코드 검증과 같은 웹 사이트의 자동 유지 관리 작업을 위해 사용되기도 하며, 자동 이메일 수집과 같은 웹 페이지의 특정 형태의 정보를 수집하는 데도 사용된다.
웹 크롤러는 봇이나 소프트웨어 에이전트의 한 형태이다. 웹 크롤러는 대개 시드(seeds)라고 불리는 URL 리스트에서부터 시작하는데, 페이지의 모든 하이퍼링크를 인식하여 URL 리스트를 갱신한다. 갱신된 URL 리스트는 재귀적으로 다시 방문한다.
이처럼 조직적, 자동화된 방법으로 월드와이드웹을 탐색하는 기능을 갖춘 컴퓨터 프로그램 검색엔진의 작동 구조는 웹 크롤링(Web crawling), 인덱싱 (Indexing), 추출(Searching)의 세 단계로 작동한다.
먼저, 웹 크롤링 과정은 사이트의 모든 페이지를 복사한다. 이는 최신 데이터를 우선으로 이루어진다. 그리고, 인덱싱 과정은 정확하고 빠른 검색이 가능하도록 데이터를 수집, 저장, 분석한다. 마지막으로, 추출 과정은 검색어를 구성하는 단어가 포함된 제목, 주제 등을 추출한다.
이러한 일련의 과정을 통해 검색이 이루어진다. 검색엔진의 검색능력은 검색어와 데이터 간의 관련성에 의해 결정된다. 그 검색된 수많은 웹 페이지들 중에서 검색 키워드와 상대적으로 연관성이 더 높은 페이지가 존재하기 마련인데, 검색엔진은 가장 연관성이 높은 결과를 우선순위값에 대한 인덱싱(Indexing) 분석을 통해 피드백(feedback)을 지속적으로 조정한다.
데이터 분석부(120)는 데이터 수집부(110)에서 수집한 데이터들을 분석하여 사용자들이 활용할 수 있는 형태로 편집하거나 가공한다.
예를 들어, 데이터 분석부(120)는 빅데이터 내에서 서로 연관성이 있는 평가요소들을 선정하고, 평가요소들의 관계도와 가중치를 계산하고, 관계도에 따라 평가요소들을 그룹화 하거나, 평가요소들의 가중치에 따라 배열하는 등의 작업을 수행하여 빅데이터를 사용자에게 의미있는 형태로 가공할 수 있다.
수요예측부(130)는 데이터 분석부(120)에서 분석한 데이터를 토대로 미래 수요 예측 매커니즘을 생성하여 특정 상품에 대한 수요자들의 미래 수요를 예측한다.
관리부(140)는 수요 예측 시스템의 전반적인 구동을 관리한다. 예를 들어, 시스템이 데이터를 수집하고 저장하며, 데이터를 분석하여 수요를 예측하는 동작 전반을 관리한다. 또한, 관리부(140)는 사용자들이 데이터에 접근할 수 있는 권한 또는 데이터를 변경할 수 있는 권한을 설정할 수 있다. 또한, 관리부(140)는 본 발명에서 미래 수요를 예측하기 위한 매커니즘을 관리하고 변경할 수 있다.
도 3은 본 발명의 일 실시예에 따른 데이터 처리 구조를 나타내는 개념도이다.
본 발명의 일 실시예에 따르면, 시스템은 실시간으로 수집된 이미지 데이터들의 연관성을 정의하여 연산 세트(set)를 구성하며, 연산된 세트 데이터들(case 1, case 2, case 3 등)을 비교하여 오차를 보정한다.
즉, 시스템은 쇼핑몰, 블로그, 카페 등에 업로드된 이미지를 수집해 수요를 분석하고자 하는 상품의 유사 이미지들을 선별할 수 있다. 통상적으로 온라인 쇼핑몰에서는 제품의 명칭 뿐 아니라 제품의 출시년도, 제품의 버전, 시리얼 넘버 등도 함께 기재되기 때문에 유사 제품을 검색하는 것이 쉽다. 하지만, 블로그나 카페 등에서는 제품의 이미지만 업로드되고 제품의 상세 내역은 업로드 되지 않는 경우가 많다. 따라서 이미지 분석을 통한 유사 제품 선별 작업을 거치는 경우 보다 정확한 수요 예측이 가능해진다.
시스템은 이미지 데이터를 처리하기 위해 CNN과 ANNOY 분석 기법을 활용한다.
CNN은 하위 계층부터 상위 계층을 통과하며 점차 수준이 높은 특징을 추출한다. 최근 CNN 기술을 활용 하여 대규모 이미지 검색을 위한 기술이 연구되었으며, 특히 의학계에서는 질병의 사례 데이터셋을 활용해 질 병 진단율에 대한 연구에 활용하거나 기계장비 오류를 검출하기 위한 연구가 활발히 진행되고 있다.
CNN 기술의 확장성을 통해 다양한 분야에서 CNN 을 활용한 연구가 진행되고 있으며 특히 대규모 이미지 비교를 위한 기술은 성능이 뛰어나 많은 연구가 진행되 고 있다. 분석을 위한 이미지는 컨볼루션 레이어(Convolutional Layer)를 통해 입력되어 이미지의 작은 특징들을 추출하고 풀링 레이어(Pooling Layer)를 통해 유효 값을 확인한다. 이러한 반복 수행을 통하여 입력한 이미지의 전체 특징을 모델링한다.
ANNOY(Approximate Nearest Neighbors Oh Yeah) 기술은 이미지의 픽셀을 분석하여 이미지별 유사 도에 따라 바이너리 트리(binary tree) 기법을 사용하여 유사도를 탐색하고 해당 이미지와 가장 가까운 벡터값 을 갖는 구역에 할당한다.
ANNOY 기술은 CNN 기술을 통해 얻은 유사 이미지 결과를 바탕으로 ANNOY 의 유사도 권역 레이아웃을 구성한다. 새로운 입력 이미지는 바이너리 트리를 통해 기존 이미지와의 유사도를 탐색하여 유사도에 따른 이미지 권역을 구성하고 할당한다.
테스트 과정에서 CNN 모델은 수집된 데이터세트 4만개를 전이학습을 통해 자체 모델을 구축하여 백본을 구축하였으며 이렇게 구축된 백본을 활용하여 테스트 데이터 2만개 제품 중 랜덤하게 500개의 제품을 선정하여 리스트화 하였다. 아래 표 1은 이를 적용하여 CNN과 ANNOY를 수행하고 각 제품별 소요 시간과 유사도를 테스트한 결과이다.
CNN ANNOY
이미지 소요시간(ms) 유사도(%) 소요시간(ms) 유사도(%)
제품 1 1974.9780 46.56 0.6356 45.36
제품 2 1976.3556 62.62 0.6249 65.01
제품 3 2012.4453 78.59 0.6886 73.2
제품 4 1979.8871 65.08 0.6731 63.18
제품 5 1983.4177 74.91 0.6030 72.73
평균 1985.4167 65.552 0.6450 63.896
상기 표 1에 따르면, CNN 기술은 Resnet152 백본을 이용하여 모든 이미지 샘플을 검색하여 유사 제품의 이미지를 추출하는 반면, ANNOY 기술은 바이너리 트리노드(binary tree node) 기법을 사용한 최근접 이웃 탐색 (Nearest neighbor search) 방식을 사용하기 때문에 모든 이미지 샘플들을 탐색하는 CNN 기술보다 이미지 유사도는 감소하지만 유사 이미지 검색 처리 속도는 월등히 증가하는 것을 확인할 수 있다.
이러한 결과에 따르면, 유사 이미지 검색을 위해 ANNOY 기술을 적용하는 경우 기존 CNN 기술보다 유사도는 약 633% 감소하지만 처리 속도는 1/3000 감소하는 것을 확인할 수 있다. 또한 ANNOY 기술을 사용한 유사 이미지 기술은 제품의 소재, 스타일 등 다른 제품 대비 많은 특징들을 갖고 있는 제품의 이미지 유사도 검색에 탁월한 성능을 나타내는 것을 확인할 수 있다.
이러한 탐색속도 개선으로 인해 딥러닝 시스템 도입의 비용이 낮아지는 효과가 있으며 빠른 이미지 연산 처리가 가능하므로 동일한 시간 내에 더 많은 이미지 검색 결과를 도출할 수 있기 때문에 유사상품 검색 서비스와 트랜드 분석, 상품 추천과 같은 다양한 형태로 활용할 수 있다.
본 발명에서는 CNN과 ANNOY 기술을 선택적 또는 상호보완적으로 적용하여 분류된 제품의 유사 이미지를 이용하여 다양한 인터넷 쇼핑몰, 블로그 등을 실시간으로 찾아내고 각각의 사이트에서 서로 연관성이 있는 여러 요소들의 변화율을 조합하여 수요자들의 소비 패턴을 분석하는 것이 가능해진다.
도 3을 참조하면, 수요 예측 시스템은 실시간으로 수집된 데이터들의 연관성을 정의하여 연산 세트(set)를 구성하며, 연산된 세트 데이터들(case 1, case 2, case 3 등)을 비교하여 오차를 보정할 수 있다.
첫번째 단계(I)에서는 분석된 이미지 데이터들로부터 상품들을 선별하고, 선별된 상품의 평가요소 연관성을 정의하여 평가요소 세트(set)를 구성한다.
예를 들어, 온라인 판매량을 분석하고자 하는 경우 판매량과 연관성이 있는 요소들을 세트에 포함시킨다. 이 경우 평가요소 세트에는 조회수, 좋아요수, 댓글수, 후기, 평점, 해쉬태그 등이 포함될 수 있다.
수요 예측 시스템은 판매량과 평가요소들의 연관성을 계산한 후 연관성이 낮은 요소를 세트에서 제외하고 연관성이 높은 요소를 세트에 추가할 수 있다. 예를 들어, 판매량이 증가하고 있는데 좋아요수가 급격히 감소하는 것으로 분석되는 경우 모듈은 좋아요수와 판매량의 연관성을 낮게 평가하여 좋아요수 데이터를 세트에서 제외시킬 수 있다.
두번째 단계(II)에서는 세트에 포함된 평가요소들의 관계도와 가중치를 계산하여 평가요소들을 재조합한다.
예들 들어, 댓글수 데이터(B), 평점평균 데이터(C), 조회수 데이터(D) 간의 관계도와 가중치를 계산하여 관계도가 높은 평가요소들끼리 재조합하며 이 때 가중치가 높은 평가요소에 가중치가 낮은 평가요소를 병합시키는 방식으로 데이터를 재조합할 수 있다.
재조합 시 2개의 데이터만 재조합할 수도 있고, 복수개의 데이터가 모두 관계도가 높다고 판단되는 경우 관련 데이터들을 모두 재조합할 수도 있다.
도 3에서 case1은 ABC의 재조합 데이터, case 2는 ACD의 재조합 데이터, case 3은 BCD의 재조합 데이터를 나타내고 있다. 각 case 에서는 서로 다른 평가요소들을 이용해 데이터를 추출하였기 때문에 오차가 발생할 수 있다. 시스템은 각 case 에서 추출한 데이터들을 비교하여 오차를 보정한다.
도 4는 미래 수요 예측을 의한 상품 이미지 전처리 과정을 설명하기 위한 순서도이고, 도 5는 시스템에서 상품들의 정보를 수집하는 방법을 설명하기 위한 예시도이다.
도 4를 참조하면, 미래 수요 예측 방법은 제1 서버에서 사이트의 제품 리스트 주소를 수집하고 데이터베이스에 저장하는 단계(S10)와, 제2 서버에서 수집된 제품 리스트 주소를 수신받아 상품들의 이미지, 가격, 분류 정보 등을 수집하는 단계(S20)와, 수집된 정보를 CNN 기술과 ANNOY 기술을 사용하여 재분류 하는 단계(S30)와, ANNOY 기술에 의해 분류된 상품 정보와 CNN 기술에 의해 분류된 상품정보를 비교하고 상품 이미지 세트를 형성하는 단계(S40)와, 상품이미지 세트와 평가요소들을 매칭하는 단계(S50) 등을 포함한다.
S10 단계에서는 제1 서버를 통해 사이트들에 노출된 제품 리스트를 수집한다. 상기 사이트들은 온라인 쇼핑몰, 블로그, 카페 및 각종 SNS를 포함한다. 제1 서버는 상기 사이트들에 업로드된 이미지들을 확인하고 확인된 이미지가 어떤 제품에 관한 것인지를 분석하여 데이터베이스에 저장한다.
S20 단계에서는 제2 서버를 통해 제품들의 세부 정보를 수집한다. 구체적으로, 제2 서버는 인터넷 사이트에 접속하여 제품의 이미지, 가격, 분류 등의 정보를 수집하여 데이터베이스에 저장한다. 이 때 제2 서버는 제1 서버를 통해 데이터베이스에 수집된 인터넷 사이트 주소를 이용하여 검색 시간을 줄일 수 있다.
S20 단계를 통해 수집된 데이터는 도 5와 같은 형태로 저장될 수 있다.
도 5를 참조하면, 제품의 이미지(a)에 제품의 대분류(b), 제품의 소분류(c) 및 제품의 세부 특징(d) 등이 매칭되어 저장된다.
이렇게 저장된 데이터들은 S30 단계에서 CNN 기법 및/또는 ANNOY 기법을 통해 유사 상품군별로 재분류된다.
S30 단계에서, 시스템은 상기 CNN 기법과 ANNOY 기법 중 어느 한가지 기법을 선택하거나 두 기법을 동시에 적용하여 데이터를 분류할 수 있다.
예를 들어, 시스템은 제품에 대한 검색량을 통해 어느 하나의 기법을 선택하거나, 수집된 데이터 양이 많을 경우 빠른 처리를 위해 ANNOY 기법을 사용하고 수집된 데이터의 양이 적을 경우 정확도를 높이기 위해 CNN 기법을 사용할 수 있다. 마찬가지로, 업데이트 속도가 빠른 제품의 경우 ANNOY 기법을 사용하여 추세 변화를 빠르게 반영하고, 업데이트 속도가 느린 제품의 경우 보다 정확한 분석을 위해 CNN 기법을 사용할 수 있다.
다른 실시예로, ANNOY 기법을 통해 실시간 분석 데이터를 제공하며 일정 시간 간격으로 CNN 기법을 통한 분석 결과를 ANNOY 분석 데이터에 병합하는 것도 가능하다. 데이터 병합 주기는 사용자가 임의로 정해놓을 수 있다.
S40 단계에서는 ANNOY 기법에 의해 분류된 상품 정보와 CNN 기법에 의해 분류된 상품 분류를 취합하여 정확도를 향상시킬 수 있다. 또한 상품 분류를 구분한 후 상품이미지 세트를 형성하여 미래 수요 예측에 사용할 수 있게 한다.
S50 단계에서는 S40 단계에서 형성된 상품이미지 세트와 평가요소들을 매칭한다. 예를 들어, 상품이미지가 티셔츠로 분류된 경우 티셔츠에 대한 평가요소 세트(조회수, 좋아요수, 댓글수, 후기, 평점, 해쉬태그 등)를 매칭시킨다. 마찬가지로 상품이미지가 블라우스로 분류된 경우 블라우스에 대한 평가요소 세트(조회수, 좋아요수, 댓글수, 후기, 평점, 해쉬태그 등)를 매칭시킨다. 이를 통해, 인터넷 사이트에 제품의 명칭이 기재되어 있지 않거나 다른 명칭이 기재되어 있더라도, 사진이나 이미지가 업로드 되어 있다면 미래 수요 예측을 위한 평가요소에 반영하는 것이 가능해진다.
이하에서는 도 6 내지 도 11을 참조하여 본 발명의 시스템이 미래 수요 예측을 하는 방법을 구체적으로 설명한다.
도 6는 본 발명의 일 실시예에 따른 소비 패턴 분석 및 미래 수요 예측 방법을 설명하는 순서도이고, 도 7 내지 도 9은 이를 보다 구체적으로 설명하는 순서도이다.
구체적으로 도 7에서는 '평가요소들을 재조합 하는 단계'를 구체적으로 설명하고, 도 8에서는 '제품의 수요를 예측하는 단계'를 구체적으로 설명하며, 도 9에서는 '수요예측 그래프를 생성하는 단계'를 구체적으로 설명한다.
도 6을 참조하면, 소비 패턴 분석 및 미래 수요 예측 방법은 평가요소들을 선정하는 단계(S100)와, 평가요소들의 데이터를 수집하는 단계(S200)와, 평가요소들의 관계도와 가중치를 계산하여 평가요소들을 재조합하는 단계(S300)와, 제품의 수요를 예측하는 단계(S400) 등을 포함한다.
평가요소들을 선정하는 단계(S100)와 평가요소들의 데이터를 수집하는 단계(S200)는 서로 순서가 바뀔 수 있다. 다시 말해, 시스템은 특정 평가요소들을 선정한 후 해당 평가요소들에 대한 데이터를 수집하거나, 이미 수집된 데이터들 중에서 평가요소들을 선정하여 해당 평가요소들에 대한 데이터를 추출하는 것이 가능하다.
평가요소들은 판매량, 조회수, 좋아요수, 댓글수, 후기의 숫자 또는 내용, 평점, 해쉬태그의 숫자 또는 내용 등이 포함될 수 있다.
도 3을 참조하면, 평가요소들을 선정하는 단계(S100)는 I단계에서 이루어진다. 위에서 설명한 판매량, 조회수, 좋아요수, 댓글수, 후기의 숫자 또는 내용, 평점, 해쉬태그의 숫자 또는 내용 등의 평가요소들이 I 단계에 표시된 A 내지 D 데이터에 대응될 수 있다.
평가요소들의 데이터를 수집하는 단계(S200)에서는 시스템이 데이터 수집부(110)를 통해 데이터를 수집한다. 위에서 설명한 바와 같이 데이터 수집부(110)는 웹 크롤러 방식으로 데이터를 수집하여 데이터베이스에 저장하여 빅데이터를 생성할 수 있다.
평가요소들의 관계도와 가중치를 계산하여 평가요소들을 재조합하는 단계(S300)에서는 S100 및 S200 단계에서 선정되고 수집된 평가요소들의 데이터를 분석하여 수요 예측에 활용할 수 있는 형태로 가공한다.
본 발명의 일 실시예에 따르면 평가요소들을 재조합 하는 단계(S300)는 평가요소들의 관계도를 계산하는 단계(S310)와, 관계도에 따라 평가요소들을 그룹화 하는 단계(S320)와, 그룹 내 평가요소들을 가중치에 따라 배열하는 단계(S330)와, 평가요소들의 변화율을 그래프화 하여 표시하는 단계(S430)와, 가중치가 높은 평가요소의 그래프에 가중치가 낮은 평가요소의 그래프를 병합하여 수요예측 그래프를 생성하는 단계(S350) 등을 포함할 수 있다.
평가요소들의 관계도를 계산하는 단계(S310)에서는 평가요소들 간의 경향성을 분석한다. 예를 들어, 특정 상품에 대한 조회수나, 댓글수가 증가할 때 판매량이 증가하였다면 조회수와 댓글수는 판매량과의 관계도가 높은 것으로 판단할 수 있다. 또한, 특정 평가요소가 증가하였는데 판매량의 변화가 미비하다면 상기 특정 평가요소와 판매량은 관계도가 낮은 것으로 판단할 수 있다.
관계도에 따라 평가요소들을 그룹화 하는 단계(S320)에서는 관계도가 높은 평가요소들을 하나의 그룹으로 묶을 수 있다. 예를 들어, 도 3의 II에 도시된 것과 같이 평가요소들(A data, B data, C data, D data)들 중 관계도가 높은 (A,B,C) 그룹과, (B,C,D) 그룹과, (A,C,D) 그룹을 만들고 각 그룹별로 각각 분석을 진행할 수 있다.
그룹 내 평가요소들을 가중치에 따라 배열하는 단계(S330)에서는 그룹 내 평가요소 데이터들 중 베이스가 되는 데이터를 선정하고, 각 데이터들에 가중치를 부여하여 순위에 맞게 데이터들을 배열한다.
베이스가 되는 데이터 선정 기준은 다양한 방식으로 이루어질 수 있다.
본 발명의 일 실시예에 따르면, 측정 구간 내 변화 폭이 가장 큰 평가요소를 베이스 데이터로 선정하고, 다른 평가요소들에 변환 팩터를 곱하여 변화폭을 일치시킨다. 이에 대해서는 아래에서 도 10c를 참조하여 보다 구체적으로 설명한다.
평가요소들의 변화율을 그래프화 하여 표시하는 단계(S340)에서는 이전 단계들에서 수집되고 분석된 데이터들을 그래프로 표시한다.
예를 들어, 시스템은 도 10a 내지 도 10i에 도시된 그래프와 같이 평가요소들의 수치를 그래프화 할 수 있다. 또한, 시스템은 이러한 평가요소들의 수치 그래프들의 다항식 추세선 그래프를 생성시킬 수 있고, 다항식 추세선 그래프들의 미분 그래프를 작성한 후 상기 다항식 추세선 그래프의 변곡점 값을 확인할 수 있다. 이렇게 확인한 그래프들의 기울기 값 또는 변곡점 값을 이용해 평가요소들의 변화율, 변화의 동향, 변화의 상관관계 등을 확인할 수 있다.
가중치가 높은 평가요소의 그래프에 가중치가 낮은 평가요소의 그래프를 병합하여 수요예측 그래프를 생성하는 단계(S350)에서는 평가요소들의 비교 기준을 설정한 후 변환 팩터(factor)를 계산하여 그래프들의 스케일을 맞추고 다항식 추세선 그래프, 미분 그래프, 변곡점 데이터 등을 이용하여 그래프들을 병합하고 수요예측 그래프를 생성시킨다.
이를 위해 가중치가 높은 평가요소의 그래프에 가중치가 낮은 평가요소의 그래프를 병합하여 수요예측 그래프를 생성하는 단계(S350)는 평가요소들의 데이터를 시계열 그래프로 표현하는 단계(S351)와, 시계열 그래프를 다항식 추세선으로 변환하는 단계(S352)와, 다항식 추세선의 미분 그래프를 작성하는 단계(S353)와, 변곡점 발생 시점 이후의 평가요소 A의 다항식 추세선과 평가요소 B의 추세선을 합성하는 단계(S355)와, 합성 추세선을 토대로 수요예측 그래프를 작성하는 단계(S356) 등을 포함할 수 있다.
제품의 수요를 예측하는 단계(S400)에서는 S300 단계에서 생성된 수요예측 그래프를 활용하여 특정 제품의 미래 수요를 예측한다.
제품의 수요를 예측하는 단계(S400)는 수요예측 그래프를 통해 선택된 제품의 수요 예측 데이터를 출력하는 단계(S410)와, 선택된 제품과 유사 제품의 수요예측 데이터를 비교하는 단계(S420)와, 선택된 제품의 수요 예측 데이터를 보정하는 단계(S430) 등을 포함할 수 있다.
위에서 설명한 단계들은 반드시 기재한 순서대로 이루어져야 하는 것은 아니다. 또한, 필요에 따라 특정 단계를 생략하거나 다른 단계들이 더 포함되는 것도 가능하다.
도 8은 본 발명에 따른 BAFP를 활용할 수 있는 분야들의 예시를 나타낸 도면이다. 도 8을 참조하면, 타사 홈피사이트에서 필요한 정보를 수집하는 변수 데이터 분류법, 상관도 가중치 조정 방식은 다양하게 구현될 수 있다.
예를 들어, 1) 시간, 요일, 계절별 분포도 분석, 2) 상승도, 하락도의 변화 분석, 3) 산발적 급변화 분석, 4) 매출분포 분석, 5) 시장점유율 분석 등을 통해 각각 추출된 수치를 기준으로 각각 다른 시각적 분석을 통해 전반적인 아이템에 대한 자동리포팅 평가서를 제공할 수 있다.
이하에서는 본 시스템에서 제품의 수요를 예측하는 방법을 구체적인 실시예를 통해 자세히 설명한다. 이하의 실시예에서는 미래 판매수량 또는 제품의 미래 수요를 예측하기 위해, 관련성이 있는 평가요소들 중 '좋아요수', '댓글수', '평점평균', '조회수' 데이터를 활용하여 수요예측 그래프를 작성하는 방법을 살펴본다.
아래 표 2를 참조하면, 특정 제품에 관련된 좋아요수, 댓글수, 평점평균, 조회수의 수치 변화를 확인할 수 있다. 표 2에서는 구간을 12개로 나누어 수치값을 기록하였다. 본 발명의 실시예에서는 1구간을 1개월 단위로 정의하고 있으나, 1구간을 1개월 단위로 한정할 필요는 없으며 필요에 따라 구간을 1일 단위, 1주일 단위, 1월 단위 등으로 정의하거나 조사기간을 늘리거나 줄이는 것도 가능하다.
본 발명의 일 실시예에서는 어느 한 태스크(task, 도 2 참조)에 속하는 평가요소들만을 사용하는 것이 바람직하지만 서로 다른 태스크에 속하는 동일한 평가요소들의 총 합을 이용하거나 이들의 평균치를 이용하는 것도 가능하다.
예를 들어, 네이버 쇼핑 사이트를 통해 수집한 좋아요수, 댓글수, 평점평균, 조회수 데이터를 이용하여 미래 수요를 분석하는 것이 바람직하지만, 필요에 따라 네이버 쇼핑, 쿠팡, G마켓 사이트에서 좋아요수, 댓글수, 평점평균, 조회수 데이터 또는 이들 데이터에 대응되는 데이터들을 수집하여 분석하는 것도 가능하다.
도 10a는 표 2에 기재된 수치값들을 꺾은선 그래프로 표현한 것이다.
표 2 및 도 10a를 참조하면, 좋아요수는 최초 조사 구간(1구간)에서 15회로 최저값으로 기록되어 있으며 6구간에서 31회로 최고값으로 기록되어 있다. 좋아요수의 최저값과 최고값 차이는 16회이다.
댓글수는 1구간에서 8개로 최저값으로 기록되어 있으며, 4구간에서 16개로 최대값으로 기록되어 있다. 댓글수는 최저값과 최고값 차이는 8개이다.
평점평균은 1구간에서 4.5점으로 최저값으로 기록되어 있으며, 4구간에서 4.8점으로 최저값으로 기록되어 있다. 평점평균의 최저값과 최고값 차이는 0.3점이다.
조회수는 2구간에서 66회로 최저값으로 기록되어 있으며, 7구간에서 81회로 최고값으로 기록되어 있다. 조회수의 최저값과 최고값 차이는 15회이다.
이와 같이 평가요소들의 변화값이 제각각이기 때문에 이들을 바로 비교하기에는 어려움이 있다. 따라서, 본 발명에서는 평가요소들에 변환 팩터를 곱하여 변화폭을 일치시킨 후 평가요소들의 변화율을 확인해 본다.
본 실시예에서는 변화 폭이 가장 큰 평가요소를 베이스 데이터로 선택한다. 베이스 데이터에 해당하는 평가요소의 변화폭과 일치시키도록 다른 평가요소들에 가중치 값(변환 팩터)을 곱한다. 아래 표 2에는 평가요소별 변환 팩터 값을 기재하였다.
평가요소 변화폭 변환 팩터
좋아요수 16 1
댓글수 9 1.778
평점평균 0.3 53.333
조회수 15 1.0667
도 10b는 수요예측 그래프를 생성하기 위하여 배율 변환에 따른 초기값 일치 그래프를 생성하는 단계를 설명하는 도면이고, 도 10c는 수요예측 그래프를 생성하기 위하여 상승폭 및 초기값 보정 그래프를 생성하는 단계를 설명하는 도면이다.
본 발명의 시스템은 도 10b와 도 10c에 도시된 것과 같이 수집된 데이터들의 배율을 변환하여 이를 비교한 후, 상승폭을 일치시켜 비교한다.
도 10b를 참조하면 시스템은 각 평가요소들에 특정값을 곱하여 초기값을 일치시킨다. 예를 들어, 댓글수의 초기값은 8이므로 1.875를 곱하여 15로 변환하고, 평점평균의 초기값은 4.5이므로 3.333을 곱하여 15로 변환하고, 조회수의 초기값은 67이므로 0.224를 곱하여 15로 변환한다.
이와 같이 변환을 하면 특정시점(초기값) 이후로 각 평가요소들의 변화 동향을 확인하는 것이 가능하다. 하지만, 이 경우 평가요소들의 동향을 파악할 수 있을 뿐 평가요소 그래프들을 합성하는데는 어려움이 있다. 따라서, 평가요소들의 변화폭을 일치시킬 필요가 있다.
도 10c를 참조하면 시스템은 표 2에서 계산한 변환 팩터를 각 평가요소에 곱하여 아래 표 4와 같은 데이터를 생성한다.
그 후 시스템은 초기값 이후 평가요소들의 변화 동향을 확인할 수 있도록 초기값을 일치시키는 보정을 수행한다. 이 때 변화폭은 동일하게 유지시켜야 하므로 이 단계에서는 합 또는 차를 통해 초기값을 일치시킨다.
아래 표 5는 상기 표 3에서 댓글수, 평점평균, 조회수 데이터에 특정 값을 더하거나 빼서 초기값을 15로 맞춘 데이터이다.
표 5의 데이터를 이용해 그래프를 그리면 도 10c와 같은 그래프를 얻을 수 있다.
도 10d는 수요예측 그래프를 생성하기 위하여 다항식(Polynomial) 추세선 그래프를 생성하는 단계를 설명하는 도면이다.
도 10c의 각 평가요소 그래프의 추세선 그래프를 그려보면 도 10d와 같다. 도 10d에서는 편의상 각 평가요소들의 6차 다항식 추세선 그래프를 확인해 본다.
이에 따르면, 좋아요수의 6차 다항식 추세선 수식은 아래 수학식 1과 같고, 댓글수의 6차 다항식 추세선 수식은 아래 수학식 2와 같고, 평점평균의 6차 다항식 추세선 수식은 아래 수학식 3과 같고, 조회수의 6차 다항식 추세선 수식은 아래 수학식 4와 같다.
Figure 112022099435682-pat00004
Figure 112022099435682-pat00005
Figure 112022099435682-pat00006
Figure 112022099435682-pat00007
도 10d와 위의 수학식들을 살펴보면 각 그래프들은 서로 유사하지만 다른 지점에서 증가와 감소를 반복하고 있다. 즉, 평가요소들은 전체적으로 비슷한 동향을 보이지만 세부적으로 살펴보면 특정 시점에서 어떤 요소들은 증가하는 경향을 보이는 반면 다른 요소들은 감소하는 경향을 보이기도 한다.
본 발명에서는 이와 같이 서로 연관된 평가요소들이 서로 다른 평가요소들에 미치는 영향을 반영하여 미래 수요를 예측한다.
구체적으로, 수요에 가장 영향을 크게 미치는 평가요소를 베이스 데이터로 설정한 후 차순위 평가요소의 증가율을 반영시킨다. 이와 같이 순차적으로 모든 평가요소들의 증가율을 반영하여 추세선을 그릴 경우 어느 한 데이터만을 가지고 예측하는 것보다 전체적인 추세를 정확히 예측할 수 있게 된다.
이를 위해 각 그래프에서 변화율이 양에서 음으로 바뀌는 시점과 변화율이 음에서 양으로 바뀌는 시점을 확인할 필요가 있다. 변화율이 양에서 음으로 바뀌는 시점(또는 변화율이 음에서 양으로 바뀌는 시점)은 수요자들의 관심도가 급격히 변하는 임계 시점이므로 이를 수요 예측에 반영할 필요가 있다.
도 10e는 수요예측 그래프를 생성하기 위하여 다항식(Polynomial) 추세선의 미분 그래프를 생성하는 단계를 설명하는 도면이다. 시스템은 추세선의 변곡점을 확인하기 위해 다항식 미분 그래프를 분석한다.
좋아요수의 미분 추세선 수식은 아래 수학식 5과 같고, 댓글수의 미분 추세선 수식은 아래 수학식 6와 같고, 평점평균의 미분 추세선 수식은 아래 수학식 7과 같고, 조회수의 미분 추세선 수식은 아래 수학식 8와 같다.
Figure 112022099435682-pat00008
Figure 112022099435682-pat00009
Figure 112022099435682-pat00010
Figure 112022099435682-pat00011
수학식 5 내지 8, 도 10e를 참조하면 각 그래프의 변곡점은 아래 표 6과 같다.
평가요소 변곡점
좋아요수 5.678(감소)
댓글수 4.802(감소), 9.133(증가)
평점평균 10.651(증가)
조회수 6.512(감소)
도 10f는 수요예측 그래프를 생성하기 위하여 1차 병합 그래프를 생성하는 단계를 설명하는 도면이다. 본 발명의 일 실시예에 따르면 시스템은 위에서 확인한 변곡점 데이터를 이용해 1차 병합 그래프를 생성한다. 도 10b를 참조하면, 시스템은 가중치 순위를 1순위 좋아요수, 2순위 댓글수, 3순위 조회수, 4순위 평점평균 순서로 설정하였다.
1차 병합 그래프에서는 3순위 데이터에 4순위 데이터를 병합하여 그래프를 생성시킨다.
4순위 평점평균 데이터는 위 표 5에서 확인할 수 있는 바와 같이 10.651 이후 큰 변화가 생긴다. 구체적으로, 평점평균의 변화율이 10.651에서 마이너스(감소추세)에서 플러스(증가추세)로 변하는 것을 확인할 수 있다. 이러한 평점평균의 추세 변화는 3순위 조회수의 변화를 선반영 하거나 조회수의 변화에 영향을 미칠 수 있으므로 시스템은 10.651 이후 구간의 조회수 그래프에 평점평균 데이터를 반영한다.
본 실시예에서는 최종 추세 예측 그래프를 생성하는 것을 목적으로 하므로 그래프의 변화 동향을 파악하는 것이 중요하다. 이를 위해 본 실시예에서는 10.651 이후 구간에서 3순위 데이터와 4순위 데이터의 평균값을 계산하여 추세선을 보정한다.
이를 반영한 1차 병합 그래프는 도 10f와 같다.
도 10f를 참조하면, 1차 병합 전 조회수 그래프보다 1차 병합 후 그래프의 감소율이 줄어든 것을 확인할 수 있다. 즉, 조회수 데이터만을 가지고 미래 수요를 예측할 때 보다 평점평균 데이터를 반영하였을 때 미래 수요에 대한 예측치가 증가한 것을 확인할 수 있다.
정성적으로 해석할 때도, 특정 상품에 대한 구매자들의 평가가 좋아졌다면 추후 평점 리뷰를 보고 제품을 선택하는 수요자들이 증가할 것이며, 이는 좋아요수의 증가로 이어질 수 있기 때문에 상기 1차 병합 데이터는 병합 전 데이터보다 정확도가 높다고 생각할 수 있다.
도 10g는 수요예측 그래프를 생성하기 위하여 2차 병합 그래프를 생성하는 단계를 설명하는 도면이다. 본 발명의 일 실시예에 따르면 시스템은 위에서 생성한 1차 병합 데이터를 이용해 2차 병합 그래프를 생성한다.
2차 병합 그래프는 2순위 댓글수 데이터에 1차 병합 데이터를 병합하여 그래프를 생성시킨다.
3순위 조회수 데이터는 위 표 5에서 확인할 수 있는 바와 같이 6.510 이후 큰 변화가 생긴다. 구체적으로, 조회수의 변화율이 6.510에서 플러스(증가추세)에서 마이너스(감소추세)로 변하는 것을 확인할 수 있다. 이러한 조회수의 추세 변화는 2순위 댓글수의 변화를 선반영 하거나 댓글수의 변화에 영향을 미칠 수 있으므로 시스템은 6.510 이후 구간의 댓글수 그래프에 조회수 데이터를 반영한다. 보다 정확한 예측을 위해 이 때 반영되는 조회수 데이터는 4순위 데이터에 의하여 보정된 데이터(앞에서 생성된 1차 병합 데이터)인 것이 바람직하다.
이를 반영한 2차 병합 그래프는 도 10g와 같다.
도 10g를 참조하면, 2차 병합 전 댓글수 그래프보다 2차 병합 후 댓글수 그래프의 변화폭이 줄어든 것을 확인할 수 있다. 즉, 댓글수 데이터만을 가지고 미래 수요를 예측할 때는 수요가 급격히 증가할 것으로 예상되지만, 조회수 및 평점평균 데이터를 반영하여 예측하는 경우 미래 수요가 완만히 증가할 것으로 예상된다.
정성적으로 해석할 때도, 최근 댓글수는 증가하였지만 조회수가 감소추세로 전환되었다면 앞으로의 수요가 급격히 증가한다고 예상하는 것은 바람직하지 못하다. 즉, 정성적인 측면에서 볼 때 2차 병합 데이터를 통한 미래 수요 예측이 댓글수 만으로 수요를 예측하는 것보다 정확할 것이라는 것을 확인할 수 있다.
도 10h는 수요예측 그래프를 생성하기 위하여 3차 병합 그래프를 생성하는 단계를 설명하는 도면이다. 본 발명의 일 실시예에 따르면 시스템은 위에서 생성한 2차 병합 데이터를 이용해 3차 병합 그래프를 생성한다.
3차 병합 그래프는 1순위 좋아요수 데이터에 2차 병합 데이터를 병합하여 그래프를 생성시킨다.
2순위 댓글수 데이터는 위 표 6에서 확인할 수 있는 바와 같이 4.802와, 9.133 값에서 큰 변화가 생긴다. 구체적으로, 댓글수의 변화율은 4.802에서 플러스(증가추세)에서 마이너스(감소추세)로 변화고, 9.133에서 마이너스(감소추세)에서 플러스(증가추세)로 변화는 것을 확인할 수 있다.
이러한 댓글수의 추세 변화는 1순위 좋아요수의 변화를 선반영 하거나 좋아요수의 변화에 영향을 미칠 수 있으므로 시스템은 4.802 및 9.133 이후 구간의 좋아요수 그래프에 댓글수 데이터를 반영한다. 보다 정확한 예측을 위해 이 때 반영되는 댓글수 데이터는 3,4순위 데이터에 의하여 보정된 데이터(앞에서 생성된 2차 병합 데이터)인 것이 바람직하다.
이를 반영한 3차 병합 그래프는 도 10h와 같다.
도 10h를 참조하면, 3차 병합 후 좋아요수 그래프는 3차 병합 전 좋아요수 그래프보다 감소추세가 줄어든 것을 확인할 수 있다. 즉, 좋아요수 데이터만을 가지고 미래 수요를 예측할 때는 수요가 감소할 것으로 예상되지만, 댓글수, 조회수 및 평점평균 데이터를 반영하여 예측하는 경우 미래 수요가 증가 추세로 변할 것이라는 것을 예상할 수 있다.
정성적으로 해석할 때도, 좋아요수는 아직 감소하고 있지만 다른 모든 평가요소들(댓글수, 평점평균, 조회수)이 증가 추세로 전환되고 있다면 추후 좋아요수도 증가추세로 전환될 것이라고 예상하는 것이 바람직하다. 즉, 정성적인 측면에서 볼 때 3차 병합 데이터를 통한 미래 수요 예측이 좋아요수 만으로 수요를 예측하는 것보다 정확할 것이라는 것을 확인할 수 있다.
도 10h는 추세 예측 그래프를 통해 미래 수요를 예측하는 방법을 설명하는 도면이다.
시스템은 위에 설명한 방식으로 3차 병합 그래프를 생성한 후 이를 토대로 추세 예측 그래프를 생성한다.
추세 예측 그래프에서는 변곡점 발생 직전 구간(4구간)부터 최근 구간(12구간)까지의 데이터를 이용하여 추세 예측 그래프를 생성하고, 최근 구간 보다 2구간 이후의 값을 예측한다.
추세 예측 그래프는 다항식(Polynomial) 추세선 그래프로 생성되며 다항식의 차수는 '(2순위 데이터의 변곡점의 수)+1'로 한다. 변곡점의 수는 그래프의 미분값이 0이 되는 x 값의 갯수를 말하기 때문에 그래프의 차수는 이를 적분한 값인 '(2순위 데이터의 변곡점의 수)+1'이 되는 것이 바람직하다.
따라서, 본 실시예에서 추세 예측 그래프는 3차 다항식 추세선 그래프로 이루어지며, 이러한 3차 다항식 추세선 그래프에 따르면 14 구간에서 y 값은 대략 26이 된다.
시스템은 이러한 수요 예측 결과를 이용하여 사용자에게 리포팅 결과를 제시한다.
도 11은 이래 수요 예측 결과에 근거한 리포팅 예시를 나타낸 도면이다.
도 11에서 상/하락도 수치는 (예측된 구간의 값/최근 구간의 값)으로 계산한다.
본 실시예에서는 예측된 구간(14구간)의 값은 26이고, 최근 구간(12구간)의 값은 20.3이므로 상/하락도 수치는 약 1.28이 된다.
도 11을 참조하면, 시스템은 상/하락도 수치 1.28에 대응되는 '트랜드에는 적합하나 성장성이 약함으로 신중한 접근이 필요한 아이템입니다' 라는 리포팅을 사용자에게 제공한다.
도 11에 기재된 분석 예제 리포팅 멘트는 본 발명을 설명하기 위한 예시일 뿐 필요에 따라 구체적인 문구를 변경하는 것이 가능하다.
상기에서 살펴본 본 발명의 적어도 일 실시예에 따르면, CNN 분석 기법과 ANNOY 분석 기법을 병행하여 제품 이미지를 분석하여 유사도를 높임과 동시에 소요시간을 줄이는 것이 가능하고, 실시간으로 획득되는 제품 이미지 데이터를 분석하여 시장 수요를 예측함으로써 시장 분석 모델로서의 활용도를 높일 수 있으며, 소비 패턴에 따라 각 세대별, 국가별 분석이 가능하게 하여 세대간의 행동 유형 분석과 해외 소비 패턴을 이용해 각각의 대상에 따른 맞춤형 수요 예측을 가능하게 하며, 수요에 영향을 미치는 복수의 요소들의 순위를 매기고 낮은 순위 요소의 변화율을 높은 순위 요소의 변화율에 병합함으로써 수요의 변화율을 보다 정확하게 예측하는 것이 가능해지는 등 종래기술에 비해 양적/질적으로 향상된 효과를 기대할 수 있다.
본 명세서에서 설명되는 실시예와 첨부된 도면은 본 발명에 포함되는 기술적 사상의 일부를 예시적으로 설명하는 것에 불과하다. 따라서, 본 명세서에 개시된 실시예는 본 발명의 기술적 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이므로, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아님은 자명하다. 본 발명의 명세서 및 도면에 포함된 기술적 사상의 범위 내에서 당업자가 용이하게 유추할 수 있는 변형예와 구체적인 실시예는 모두 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
10 : 인터넷 사이트들
11 : 쇼핑몰 사이트
12 : 블로그 사이트
13 : 카페 사이트
50 : 서버
51 : 제1 서버
52 : 제2 서버
100 : 수요 예측 시스템
110 : 데이터 수집부
111 : 통신 모듈
112 : 데이터베이스
120 : 데이터 분석부
130 : 수요예측부
140 : 관리부

Claims (10)

  1. 제품의 수요에 영향을 미치는 평가요소들을 선정하고 평가요소들의 데이터를 수집하고, 온라인 사이트에서 이미지 데이터들을 수집한 후 CNN 기법과 ANNOY 기법을 활용하여 상기 수집된 이미지 데이터들의 상품이미지 세트를 형성하며, 상기 상품이미지 세트와 평가요소들을 매칭시키는 데이터 수집부;
    상기 평가요소들의 관계도와 가중치를 계산하여 평가요소들을 재조합하는 데이터 분석부; 및
    상기 데이터 분석부에서 재조합된 데이터를 토대로 제품의 미래 수요를 예측하는 수요예측부를 포함하며,
    상기 데이터 분석부는,
    상기 선정된 평가요소들의 관계도를 계산하고, 계산된 관계도에 근거하여 평가요소들을 그룹화하고, 상기 그룹화된 평가요소들의 순위를 설정하고, 순위가 높은 평가요소에 순위가 낮은 평가요소 데이터를 병합하여 수요 예측 그래프를 생성시키며,
    상기 평가요소들의 순위는,
    설정된 구간 범위 내에서 데이터의 최대값과 최소값의 차이가 클수록 높은 순위를 갖는 것을 특징으로 하며,
    상기 데이터 분석부는,
    가장 높은 순위(1순위)의 평가요소를 제외한 다른 평가요소들의 데이터에 변환 팩터를 곱하여 데이터의 변화폭을 상기 1순위 데이터와 일치시킨 후 최초 구간에서 평가요소들이 동일한 값을 갖도록 데이터를 보정하는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템.
  2. 삭제
  3. 제1항에 있어서,
    상기 수요예측부는,
    상기 수요 예측 그래프를 통해 선택된 제품의 수요 예측 데이터를 출력하고, 상기 선택된 제품과 유사 제품의 수요 예측 데이터를 비교하여 상기 선택된 제품의 수요 예측 데이터를 보정하도록 형성되는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템.
  4. 삭제
  5. 삭제
  6. 제1항에 있어서,
    상기 데이터 분석부는,
    상기 평가요소들의 다항식 추세선을 추정한 후 상기 다항식 추세선의 미분 그래프를 작성하여 변곡점의 위치를 파악하고, 상기 변곡점의 위치를 기준으로 평가요소들의 데이터를 병합하여 수요 예측 그래프를 작성하는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템.
  7. 제6항에 있어서,
    상기 수요예측부는,
    상기 수요 예측 그래프에 의하여 예측된 1순위 평가요소의 값과 최근 측정된 1순위 평가요소의 값의 비율에 근거하여 미래 수요를 예측하는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템.
  8. 제6항에 있어서,
    상기 평가요소들의 데이터 병합은,
    두번째 순위(2순위)의 평가요소 추세선의 변곡점을 확인하고, 상기 변곡점 이후의 구간들에서 상기 1순위 평가요소의 데이터들을 상기 2순위 평가요소의 데이터와 상기 1순위 평가요소의 데이터의 평균값으로 치환하는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템.
  9. 제8항에 있어서,
    상기 수요 예측 그래프는,
    상기 병합된 1순위 평가요소의 데이터들 중 상기 변곡점 직전 구간부터 최근 측정된 구간 이후의 구간까지의 다항식 추세선으로 그려지는 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템.
  10. 제9항에 있어서,
    상기 수요 예측 그래프는,
    상기 2순위 평가요소의 변곡점의 수에 1을 더한 차수의 다항식 추세선인 것을 특징으로 하는 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템.
KR1020220119430A 2022-09-21 2022-09-21 Cnn과 annoy 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템 KR102602448B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220119430A KR102602448B1 (ko) 2022-09-21 2022-09-21 Cnn과 annoy 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220119430A KR102602448B1 (ko) 2022-09-21 2022-09-21 Cnn과 annoy 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템

Publications (1)

Publication Number Publication Date
KR102602448B1 true KR102602448B1 (ko) 2023-11-14

Family

ID=88744992

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220119430A KR102602448B1 (ko) 2022-09-21 2022-09-21 Cnn과 annoy 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템

Country Status (1)

Country Link
KR (1) KR102602448B1 (ko)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200107087A (ko) * 2019-03-06 2020-09-16 베스핀글로벌 주식회사 판매량 예측 장치 및 방법
KR102166547B1 (ko) 2018-10-31 2020-10-16 한국전력공사 이미지 기반 정보 예측 시스템 및 그 방법
KR102190303B1 (ko) 2018-11-30 2020-12-14 서울대학교 산학협력단 Cnn기반의 딥러닝 모델 학습장치 및 그 방법
KR102190897B1 (ko) * 2019-09-19 2020-12-15 (주)어반유니온 빅데이터기반 패션 트렌드 분석방법 및 장치
KR102276427B1 (ko) * 2020-12-01 2021-07-12 주식회사 빌리뷰 신규 리뷰 작성에 대한 추정 가치 산출 장치 및 방법
KR102412461B1 (ko) 2020-09-02 2022-06-22 이현정 상품의 비주얼 스키마를 이용한 수요 예측 방법 및 그 시스템

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102166547B1 (ko) 2018-10-31 2020-10-16 한국전력공사 이미지 기반 정보 예측 시스템 및 그 방법
KR102190303B1 (ko) 2018-11-30 2020-12-14 서울대학교 산학협력단 Cnn기반의 딥러닝 모델 학습장치 및 그 방법
KR20200107087A (ko) * 2019-03-06 2020-09-16 베스핀글로벌 주식회사 판매량 예측 장치 및 방법
KR102190897B1 (ko) * 2019-09-19 2020-12-15 (주)어반유니온 빅데이터기반 패션 트렌드 분석방법 및 장치
KR102412461B1 (ko) 2020-09-02 2022-06-22 이현정 상품의 비주얼 스키마를 이용한 수요 예측 방법 및 그 시스템
KR102276427B1 (ko) * 2020-12-01 2021-07-12 주식회사 빌리뷰 신규 리뷰 작성에 대한 추정 가치 산출 장치 및 방법

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
2020년도 한국인터넷정보학회 춘계학술발표대회 논문집 제21권 제1호 'CNN/ANNOY 딥러닝 기술 기반 의류 유사도 성능에 관한 연구'
Journal of Information Technology and Architecture Vol. 17, No. 2, June 2020, Pages 15-165 'CNN/ANNOY 기술을 이용한 의류 이미지 유사도 분석
백승훈 외 3명. ‘CNN/ANNOY 기술을 이용한 의류 이미지 유사도 분석’. 정보화 연구. 한국EA학회. 제17권 제2호, 2020년 6월, pp.157-165* *

Similar Documents

Publication Publication Date Title
CN107391687B (zh) 一种面向地方志网站的混合推荐系统
JP7104244B2 (ja) ユーザタグ生成方法並びにその、装置、コンピュータプログラム及びコンピュータ機器
CN109918563B (zh) 一种基于公开数据的图书推荐的方法
Wang et al. Beyond ranking: Optimizing whole-page presentation
CN109684538A (zh) 一种基于用户个人特征的推荐方法及推荐系统
US20130212104A1 (en) System and method for document analysis, processing and information extraction
CN111190968A (zh) 基于知识图谱的数据预处理和内容推荐方法
CN110119478B (zh) 一种结合多种用户反馈数据的基于相似度的物品推荐方法
Yigit et al. Extended topology based recommendation system for unidirectional social networks
CN115130008B (zh) 一种基于机器学习模型算法的搜索排序方法
Wu et al. Discovery of associated consumer demands: Construction of a co-demanded product network with community detection
JP5424393B2 (ja) 単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置
CN116304299A (zh) 一种融和用户兴趣演化和梯度提升算法的个性化推荐方法
Lalmas et al. Evaluating XML retrieval effectiveness at INEX
CN112989215B (zh) 一种基于稀疏用户行为数据的知识图谱增强的推荐系统
AL-Bakri et al. Multi label restaurant classification using support vector machine
Ramadhan et al. Collaborative filtering recommender system based on memory based in twitter using decision tree learning classification (case study: Movie on netflix)
KR102594165B1 (ko) 기온 변화에 대한 판매량 예측 모델을 활용한 미래 수요 예측 시스템
KR102602448B1 (ko) Cnn과 annoy 딥러닝 분석 기술을 활용한 미래 수요 예측 시스템
CN113420096B (zh) 指标体系的构建方法、装置、设备及存储介质
Zhang et al. Identification of factors predicting clickthrough in Web searching using neural network analysis
KR102509553B1 (ko) 빅데이터 분석 프레임워크 플랫폼을 활용한 소비 패턴 분석 및 미래 수요 예측 시스템
Huang Bayesian recommender system for social information sharing: Incorporating tag-based personalized interest and social relationships
Lokesh A comparative study of recommendation systems
Chongwarin et al. Enhancing book recommendation accuracy through user rating analysis and collaborative filtering techniques: An empirical analysis

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant