KR102397882B1 - 정보 처리 방법 및 장치 - Google Patents

정보 처리 방법 및 장치 Download PDF

Info

Publication number
KR102397882B1
KR102397882B1 KR1020190173423A KR20190173423A KR102397882B1 KR 102397882 B1 KR102397882 B1 KR 102397882B1 KR 1020190173423 A KR1020190173423 A KR 1020190173423A KR 20190173423 A KR20190173423 A KR 20190173423A KR 102397882 B1 KR102397882 B1 KR 102397882B1
Authority
KR
South Korea
Prior art keywords
information
variable
characteristic
matrix
customer
Prior art date
Application number
KR1020190173423A
Other languages
English (en)
Other versions
KR20210081161A (ko
Inventor
진달래
손혜령
정해주
Original Assignee
주식회사 엘지씨엔에스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지씨엔에스 filed Critical 주식회사 엘지씨엔에스
Priority to KR1020190173423A priority Critical patent/KR102397882B1/ko
Publication of KR20210081161A publication Critical patent/KR20210081161A/ko
Application granted granted Critical
Publication of KR102397882B1 publication Critical patent/KR102397882B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0454
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

일 실시 예에 따르면, 정보 처리 방법에 있어서, 1차원 형식으로 표현되고 범주형 변수를 포함하는 제 1 정보를 수신하는 단계; 상기 제 1 정보에 포함된 상기 범주형 변수의 특성에 기초하여 상기 제 1 정보의 재정렬에 이용되는 하나 이상의 기준을 결정하는 단계; 상기 하나 이상의 기준에 기초하여 상기 제 1 정보를 2차원 형식으로 변환하여 제 2 정보를 획득하는 단계; 및 상기 2차원 형식으로 변환된 상기 제 2 정보에 CNN(Convolutional Neural Network)을 적용하여 상기 제 1 정보의 특성을 결정하는 단계;를 포함하는, 방법이 제공된다.

Description

정보 처리 방법 및 장치{DATA PROCESSING METHOD AND APPARATUS}
본 발명은 정보 처리 방법 및 장치에 관한 것으로, 더욱 상세하게는, 범주형 변수를 포함하는 1차원 형식의 제 1 정보를 2차원 형식의 제 2 정보로 변환하여 CNN에 적용함으로써, 인접한 비트간에 관련성이 없는 랜덤성의 범주형 변수에 대해서도 국소적 상관관계를 분석할 수 있어 수많은 범주형 변수에 대한 유의미한 데이터 분석을 효율적으로 수행할 수 있는 방법 및 장치에 관한 것이다.
종래의 고객 행동 데이터를 분석하여 활용하는 기술은 변수를 추출하여 머신러닝 모델을 이용하거나 상품 선호도로 변환하여 선형 모형에 적합하는 방법을 이용한다. 전자의 경우에는 변수 추출 과정에서 많은 작업이 요구되고 현업 전문가의 직관이 반영되어 편향이 반영된다는 단점이 있고, 후자의 경우에는 고객과 상품의 관계를 선형으로 모델링할 수밖에 없다는 단점이 있다.
이러한 종래의 기술은 일반적으로 통계학적 변수 생성 및 분석에 용이한 데이터로 여겨지는 정형 데이터를 주로 이용하지만, 변수량이 많고 분석 과제가 복잡할 경우에는 데이터에 대한 특성 공학(feature engineering)이 어떻게 수행되는지가 모델 성능을 크게 좌우하게 된다. 이에, 정형 데이터에서 특성을 추출하여 고객 행동 데이터를 분석하는 머신러닝 모델에 관한 다양한 기술이 개발되고 있다.
일반적으로 고객 행동 데이터에서 특성을 추출하는 경우의 수는 수천에서 수만가지일 수 있으나, 대부분의 변수가 연속형 변수 또는 서열 척도가 아닌 범주형 변수라는 측면에서 수치화하거나 단순하게 표현하기 어려운 단점이 있으며, 분석을 위한 처리 과정에서 변수 수가 폭증하게 된다.
종래 기술은 매일 조건에 맞는 고객을 추출하여 프로모션을 제공하는 마케팅의 측면에서, 이러한 변수를 매번 다 생성하기는 현실적으로 어려우며, 매일 변동하는 고객의 상태를 저장하는 것도 사실상 불가능하다는 한계가 있다. 이를 해결하기 위한 방법으로, 종래 기술은 폭증되는 변수들 중 일부만 선별하여 특성을 추출하는 방식을 이용하지만, 이러한 방식은 분석가의 직관, 상식, 편향 등이 반영될 수밖에 없는 구조이기 때문에, 결과적으로 제한적인 정보만을 이용하게 되어, 결과의 정확성이 떨어지는 단점이 있다.
이에, 고객의 생활 및 구매 패턴을 분석하기 위한 고객 행동 데이터의 전처리 과정에서 발생하는 대량의 변수들을 분석에 반영하여 좋은 학습 결과를 얻을 수 있는 기술에 대한 수요가 꾸준히 증가하고 있다.
한국공개특허 제10-2017-0096298호는 컨볼루션 신경망 기반의 영상 패턴화를 이용한 딥러닝 시스템 및 이를 이용한 영상 학습방법에 관한 것으로, 입력 영상을 입력하는 영상 입력부; 영상 입력부로부터 받은 입력 영상을 패턴화된 다수의 패턴 영상으로 생성하는 패턴화 모듈; 영상 입력부로부터 받은 입력 영상과 패턴화 모듈로부터 수신 받은 패턴 영상을 학습시키는 컨볼루션 신경망(CNN: Convolution Neural Network)을 기반으로 하는 CNN 학습부; 상기 CNN 학습부로부터 학습정보와 상기 영상 입력부로부터 받은 입력 영상을 전달받는 CNN 실행부; 및 상기 CNN 실행부로부터 영상 정보를 받아 영상 정보의 객체를 종류별로 분류하는 최종 분류부를 포함한다.
본 발명의 일 실시 예는 정보 처리 방법 및 장치를 제공하여 상기한 종래 기술의 문제점을 해결할 수 있고, 더욱 상세하게는, 범주형 변수를 포함하는 1차원 형식의 제 1 정보를 2차원 형식의 제 2 정보로 변환하여 CNN에 적용함으로써, 인접한 비트간에 관련성이 없는 랜덤성의 범주형 변수에 대해서도 국소적 상관관계를 분석할 수 있어 수많은 범주형 변수에 대한 유의미한 데이터 분석을 효율적으로 수행할 수 있고, 변수의 개수가 늘어나더라도 저장 용량의 측면에서 효율적인 효과를 제공할 수 있다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.
본 개시의 제 1 측면에 따른 정보 처리 방법은 1차원 형식으로 표현되고 범주형 변수를 포함하는 제 1 정보를 수신하는 단계; 상기 제 1 정보에 포함된 상기 범주형 변수의 특성에 기초하여 상기 제 1 정보의 재정렬에 이용되는 하나 이상의 기준을 결정하는 단계; 상기 하나 이상의 기준에 기초하여 상기 제 1 정보를 2차원 형식으로 변환하여 제 2 정보를 획득하는 단계; 및 상기 2차원 형식으로 변환된 상기 제 2 정보에 CNN(Convolutional Neural Network)을 적용하여 상기 제 1 정보의 특성을 결정하는 단계;를 포함할 수 있다.
또한, 상기 CNN을 적용하여 상기 제 1 정보의 특성을 결정하는 단계는 상기 제 2 정보에 포함된 정보의 위치 간의 국소적 특성에 기초하여 상기 제 1 정보의 속성을 결정할 수 있다.
또한, 상기 범주형 변수는 명목형 변수를 포함하고, 상기 제 1 정보는 상기 명목형 변수가 나타내는 변수들에 대한 정보가 순차적으로 제공되는 비트스트림을 포함할 수 있다.
또한, 상기 범주형 변수는 순서형 변수를 더 포함하고, 상기 하나 이상의 기준은 상기 순서형 변수의 기준이 되는 순서를 포함할 수 있다.
또한, 상기 제 1 정보는 구매 정보를 포함하고, 상기 범주형 변수는 구매가 발생하는 제품에 대한 카테고리 정보를 포함하고, 상기 하나 이상의 기준은 상기 카테고리를 포함할 수 있다.
또한, 상기 제 1 정보는 구매 정보를 포함하고, 상기 범주형 변수는 구매가 발생하는 상권 또는 업종에 대한 정보를 포함하고, 상기 하나 이상의 기준은 상기 상권 또는 상기 업종을 포함할 수 있다.
또한, 상기 제 2 정보는 상기 제 1 정보를 포함하고, 상기 CNN을 적용하여 상기 제 1 정보의 특성을 결정하는 단계는 상기 제 2 정보를 필터링하여 주요 정보를 획득하는 단계; 및 상기 주요 정보에 기초하여 상기 제 1 정보의 특성을 결정하는 단계;를 포함할 수 있다.
또한, 상기 정보 처리 방법은 상기 하나 이상의 기준에 따라 상기 제 1 정보를 제 1 매트릭스, 제 2 매트릭스 및 제 3 매트릭스로 분류하는 단계; 상기 제 1 매트릭스, 상기 제 2 매트릭스 및 상기 제 3 매트릭스가 각각 R, G, B로 표현된 이미지를 획득하는 단계; 및 상기 이미지에 상기 CNN을 적용하여 상기 제 1 정보의 특성을 결정하는 단계;를 더 포함할 수 있다.
또한, 상기 제 1 정보는 수치형 변수를 더 포함하고, 상기 정보 처리 방법은 상기 제 1 정보로부터 상기 범주형 변수로 구성된 제 1-1 정보 및 상기 수치형 변수로 구성된 제 1-2 정보를 획득하는 단계; 상기 범주형 변수의 특성에 기초하여 상기 제 1-1 정보를 2차원 형식으로 변환하여 제 2-1 정보를 획득하는 단계; 상기 수치형 변수의 특성에 기초하여 상기 제 1-2 정보를 2차원 형식으로 변환하여 제 2-2 정보를 획득하는 단계; 상기 제 2-1 정보에 포함된 정보의 위치간 국소적 특성 및 상기 제 2-2 정보에 포함된 정보의 위치간 국소적 특성에 기초하여 상기 제 2-1 정보 및 상기 제 2-2 정보에 상기 CNN을 각각 적용하는 단계; 및 상기 제 2-1 정보 및 상기 제 2-2 정보에 대한 상기 CNN의 적용 결과를 이용하여 상기 제 1 정보의 특성을 결정하는 단계;를 더 포함할 수 있다.
상기 정보 처리 방법은 상기 제 1-1 정보로부터 상기 명목형 변수로 구성된 제 1-3 정보 및 상기 순서형 변수로 구성된 제 1-4 정보를 획득하는 단계; 상기 명목형 변수의 특성에 기초하여 상기 제 1-3 정보를 2차원 형식으로 변환하여 제 2-3 정보를 획득하는 단계; 상기 순서형 변수의 특성에 기초하여 상기 제 1-4 정보를 2차원 형식으로 변환하여 제 2-4 정보를 획득하는 단계; 상기 제 2-3 정보에 포함된 정보의 위치간 국소적 특성 및 상기 제 2-4 정보에 포함된 정보의 위치간 국소적 특성에 기초하여 상기 제 2-3 정보 및 상기 제 2-4 정보에 상기 CNN을 각각 적용하는 단계; 및 상기 제 2-3 정보 및 상기 제 2-4 정보에 대한 상기 CNN의 적용 결과를 이용하여 상기 제 1 정보의 특성을 결정하는 단계;를 더 포함할 수 있다.
본 개시의 제 2 측면에 따른 정보 처리 장치는 1차원 형식으로 표현되고 범주형 변수를 포함하는 제 1 정보를 수신하는 통신부; 및 상기 제 1 정보에 포함된 상기 범주형 변수의 특성에 기초하여 상기 제 1 정보의 재정렬에 이용되는 하나 이상의 기준을 결정하고, 상기 하나 이상의 기준에 기초하여 상기 제 1 정보를 2차원 형식으로 변환하여 제 2 정보를 획득하고, 상기 2차원 형식으로 변환된 상기 제 2 정보에 CNN(Convolutional Neural Network)을 적용하여 상기 제 1 정보의 특성을 결정하는 프로세서;를 포함할 수 있다.
또한, 상기 프로세서는 상기 제 2 정보에 포함된 정보의 위치 간의 국소적 특성에 기초하여 상기 제 1 정보의 속성을 결정할 수 있다.
또한, 상기 범주형 변수는 명목형 변수를 포함하고, 상기 제 1 정보는 상기 명목형 변수가 나타내는 변수들에 대한 정보가 순차적으로 제공되는 비트스트림을 포함할 수 있다.
또한, 상기 범주형 변수는 순서형 변수를 더 포함하고, 상기 하나 이상의 기준은 상기 순서형 변수의 기준이 되는 순서를 포함할 수 있다.
또한, 상기 제 1 정보는 구매 정보를 포함하고, 상기 범주형 변수는 구매가 발생하는 제품에 대한 카테고리 정보를 포함하고, 상기 하나 이상의 기준은 상기 카테고리를 포함할 수 있다.
또한, 상기 제 1 정보는 구매 정보를 포함하고, 상기 범주형 변수는 구매가 발생하는 상권 또는 업종에 대한 정보를 포함하고, 상기 하나 이상의 기준은 상기 상권 또는 상기 업종을 포함할 수 있다.
또한, 상기 제 2 정보는 상기 제 1 정보를 포함하고, 상기 프로세서는 상기 제 2 정보를 필터링하여 주요 정보를 획득하고, 상기 주요 정보에 기초하여 상기 제 1 정보의 특성을 결정할 수 있다.
또한, 상기 프로세서는 상기 하나 이상의 기준에 따라 상기 제 1 정보를 제 1 매트릭스, 제 2 매트릭스 및 제 3 매트릭스로 분류하고, 상기 제 1 매트릭스, 상기 제 2 매트릭스 및 상기 제 3 매트릭스가 각각 R, G, B로 표현된 이미지를 획득하고, 상기 이미지에 상기 CNN을 적용하여 상기 제 1 정보의 특성을 결정할 수 있다.
또한, 상기 제 1 정보는 수치형 변수를 더 포함하고, 상기 프로세서는 상기 제 1 정보로부터 상기 범주형 변수로 구성된 제 1-1 정보 및 상기 수치형 변수로 구성된 제 1-2 정보를 획득하고, 상기 범주형 변수의 특성에 기초하여 상기 제 1-1 정보를 2차원 형식으로 변환하여 제 2-1 정보를 획득하고, 상기 수치형 변수의 특성에 기초하여 상기 제 1-2 정보를 2차원 형식으로 변환하여 제 2-2 정보를 획득하고, 상기 제 2-1 정보에 포함된 정보의 위치간 국소적 특성 및 상기 제 2-2 정보에 포함된 정보의 위치간 국소적 특성에 기초하여 상기 제 2-1 정보 및 상기 제 2-2 정보에 상기 CNN을 각각 적용하고, 상기 제 2-1 정보 및 상기 제 2-2 정보에 대한 상기 CNN의 적용 결과를 이용하여 상기 제 1 정보의 특성을 결정할 수 있다.
또한, 상기 프로세서는 상기 제 1-1 정보로부터 상기 명목형 변수로 구성된 제 1-3 정보 및 상기 순서형 변수로 구성된 제 1-4 정보를 획득하고, 상기 명목형 변수의 특성에 기초하여 상기 제 1-3 정보를 2차원 형식으로 변환하여 제 2-3 정보를 획득하고, 상기 순서형 변수의 특성에 기초하여 상기 제 1-4 정보를 2차원 형식으로 변환하여 제 2-4 정보를 획득하고, 상기 제 2-3 정보에 포함된 정보의 위치간 국소적 특성 및 상기 제 2-4 정보에 포함된 정보의 위치간 국소적 특성에 기초하여 상기 제 2-3 정보 및 상기 제 2-4 정보에 상기 CNN을 각각 적용하고, 상기 제 2-3 정보 및 상기 제 2-4 정보에 대한 상기 CNN의 적용 결과를 이용하여 상기 제 1 정보의 특성을 결정할 수 있다.
본 개시의 제 3 측면은 제 1 측면에 따른 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공할 수 있다. 또는, 본 개시의 제 4 측면은 제 1 측면에 따른 방법을 구현하기 위하여 기록매체에 저장된 컴퓨터 프로그램을 제공할 수 있다.
본 발명의 일 실시 예에 따르면, 수많은 변수들을 하나의 이미지에 압축 반영하여 고객의 구매 속성을 결정하는 모델의 학습 효율을 향상시키고 모델의 결정 정확성을 개선시킬 수 있다.
또한, 이미지 기반의 CNN 학습을 통해 상하좌우 관계가 없어 인접한 비트간에 관련성이 없는 랜덤성의 범주형 변수에 대해서도 국소적 상관관계를 읽어낼 수 있어 수많은 범주형 변수에 대한 유의미한 데이터 분석을 수행할 수 있다.
또한, 사용자가 자신의 편향에 따라 좋은 변수만 편집하여 넣지 않더라도 수많은 주요 변수들을 데이터 분석에 적용할 수 있다.
또한, 수많은 변수들을 생성하는 대신 하나의 매트릭스 정보에 압축하여 저장할 수 있어 변수의 개수가 늘어나더라도 저장 용량의 측면에서 효율적인 효과가 있다.
본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.
도 1은 일 실시 예에 따른 정보 처리 장치의 구성의 일 예를 도시한 블록도이다.
도 2는 도 1에 있는 정보 처리 장치가 정보 처리를 수행하는 방법의 일 예를 도시한 흐름도이다.
도 3은 도 1에 있는 정보 처리 장치가 1차원 형식으로 표현되는 제 1 정보를 2차원 형식으로 표현되는 제 2 정보로 변환하고 제 2 정보를 CNN을 적용하여 제 1 정보의 특성을 결정하는 동작의 일 예시를 설명하기 위한 도면이다.
도 4는 도 1에 있는 정보 처리 장치가 복수의 학습 모델을 적용하여 제 1 정보의 특성을 결정한 결과를 평가하는 동작의 일 예시를 설명하기 위한 도면이다.
도 5는 도 1에 있는 정보 처리 장치가 제 1 정보의 재정렬에 이용되는 하나 이상의 기준을 결정하는 동작의 일 예시를 설명하기 위한 도면이다.
도 6은 도 1에 있는 정보 처리 장치가 하나 이상의 기준에 기초하여 제 1 정보를 2차원 형식으로 변환하여 제 2 정보를 획득하는 동작의 다양한 실시 예들을 설명하기 위한 도면이다.
이하에서는 첨부한 도면을 참조하여 본 발명을 설명하기로 한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 따라서 여기에서 설명하는 실시 예로 한정되는 것은 아니다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 부재를 사이에 두고 "간접적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 구비할 수 있다는 것을 의미한다.
이하 첨부된 도면을 참고하여 실시 예를 상세히 설명하기로 한다.
도 1은 일 실시 예에 따른 정보 처리 장치(100)의 구성의 일 예를 도시한 블록도이다.
도 1을 참조하면, 일 실시 예에 따른 정보 처리 장치(100)는 통신부(110), 프로세서(120) 및 저장부(130)를 포함할 수 있다.
일 실시 예에 따른 통신부(110)는 네트워크를 통해 다른 디바이스(예: 단말, 서버)와 연결될 수 있고, 예를 들면, 다른 디바이스와 통신 가능한 모든 종류의 유무선 통신 장치를 포함할 수 있다. 여기에서, 네트워크는 유선 및 무선 등과 같은 다양한 통신망을 통해 구성될 수 있고, 예를 들면, 근거리 통신망(LAN: Local Area Network), 도시권 통신망(MAN: Metropolitan Area Network), 광역 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다.
일 실시 예에 따른 통신부(110)는 1차원 형식으로 표현되는 제 1 정보를 수신할 수 있다. 예를 들면, 통신부(110)는 하나 이상의 단말(예: 가맹점 단말 등)이나 서버(예: 결제 서버)로부터 비트 스트림으로 표현되는 정형 데이터에 해당되는 제 1 정보를 수집할 수 있다.
일 실시 예에서, 제 1 정보는 고객의 신상 정보(예: 성별, 나이, 연소득 등), 구매 정보(예: 구매 여부, 구매 금액, 구매 상품/서비스, 구매 상품/서비스 카테고리, 구매 가맹점, 구매 업종, 구매 품종, 구매 위치, 결제 수단 종류 등), 행동 정보(예: 사이트 접속 여부, 상품 정보 조회 여부, 문의 전화 여부 등) 및 위치 정보(예: 고객 이동 히스토리, 구매 위치 히스토리 등) 중 적어도 하나를 포함할 수 있다.
일 실시 예에서, 고객의 행동 정보는 특정 카테고리(또는 제품)에 대한 고객의 클릭 여부(예: 고객의 조회 입력에 따라 상품/서비스 정보가 제공되었는지 여부), 클릭 횟수(예: 고객의 조회 입력에 따라 상품/서비스 정보가 제공된 횟수) 및 클릭 순서(예: 고객의 조회 입력에 따라 상품/서비스 정보가 제공된 카테고리의 시계열적 순서) 중 적어도 하나를 포함할 수 있다.
여기에서, 카테고리는 상품 또는 서비스에 대한 분류 카테고리를 나타내며, 일 실시 예에서, 기설정된 복수의 등급에 따라 카테고리의 종류 및 구체화 수준이 결정될 수 있다. 예를 들면, 등급의 값이 클수록 상대적으로 하위 카테고리를 나타내도록 카테고리 체계가 정의된 1등급 ~ 6등급 중에서 2 등급에 대응되는 카테고리가 상술한 고객의 제 1 정보에 포함되거나 후술할 하나 이상의 기준으로 이용될 수 있다.
일 실시 예에서, 제 1 정보는 범주형 변수를 포함할 수 있다. 여기에서, 범주형 변수는 몇 개의 동일한 성질을 갖는 부류나 범위로 분류될 수 있는 변수를 나타낸다. 예를 들면, 제 1 정보가 고객의 구매 정보를 포함하는 경우, 제 1 정보에 포함된 범주형 변수는 구매가 발생하는 제품에 대한 카테고리, 상권 또는 업종에 대한 정보를 포함할 수 있다.
일 실시 예에서, 제 1 정보에 포함된 범주형 변수는 명목형 변수를 포함할 수 있고, 제 1 정보는 명목형 변수가 나타내는 변수들에 대한 정보가 순차적으로 제공되는 비트스트림을 포함할 수 있다. 여기에서, 명목형 변수는 변수의 값 사이에 순서를 정할 수 없는 변수로서, 항목들 간의 순서나 척도가 무의미하여 정보의 순서에 전후 상관관계가 없는 변수를 나타낸다. 예를 들면, 제 1 정보가 고객의 구매 정보를 포함하는 경우, 제 1 정보에 포함된 명목형 변수는 구매가 발생하는 제품에 대한 카테고리(예: 여성패션, 공기청정기 등), 상권(예: 명동거리, 홍대, 시청 등) 및 업종(예: 음식점, 금융, 소매 등)에 대한 정보를 포함할 수 있다.
일 실시 예에서, 제 1 정보에 포함된 범주형 변수는 순서형 변수를 더 포함할 수도 있다. 여기에서, 순서형 변수는 변수의 값 사이에 서열이나 순서가 있는 변수로서, 항목들 간의 순서나 척도가 유의미하여 정보의 순서에 전후 상관관계가 있는 유한한 변수를 나타낸다. 예를 들면, 제 1 정보가 고객의 신상 정보 및 구매 정보를 포함하는 경우, 제 1 정보에 포함된 순서형 변수는 고객의 구매 등급(예: A~D 등급)이나 연령대(예: 20대, 30대 등)에 대한 정보를 포함할 수 있다.
일 실시 예에서, 제 1 정보는 수치형 변수를 더 포함할 수도 있다. 여기에서, 수치형 변수는 셀 수 있거나 연속적인 속성이 있어 정보의 순서에 전후 상관관계가 자명한 변수를 나타낸다. 예를 들면, 제 1 정보가 고객의 구매 정보 또는 행동 정보를 포함하는 경우, 제 1 정보에 포함된 수치형 변수는 특정 제품(또는 카테고리)에 대한 고객의 구매 횟수(예: 10회)나 클릭 횟수(예: 5회)에 대한 정보를 포함할 수 있다.
일 실시 예에 따른 프로세서(120)는 수신된 제 1 정보를 저장부(130)에 저장 및 관리할 수 있고, 제 1 정보에 대한 통계 분석을 통해 기설정 기간(예: 최근 14일) 동안 제 1 정보에 대한 통계화된 정보를 생성하여 제 1 정보에 포함시킬 수 있다.
일 실시 예에 따른 프로세서(120)는 제 1 정보에 포함된 범주형 변수의 특성에 기초하여 제 1 정보의 재정렬에 이용되는 하나 이상의 기준을 결정할 수 있다. 일 실시 예에서, 하나 이상의 기준은 구매가 발생하는 제품에 대한 카테고리, 상권 및 업종 중 하나 이상에 대한 정보를 포함할 수 있으나, 이에 제한되지 않으며, 그 외에도 제품(또는 카테고리)에 대한 구매 또는 조회가 발생된 날짜, 구매 금액, 구매 횟수, 구매 순서, 구매 여부, 클릭 횟수, 클릭 여부 등을 더 포함할 수 있다.
예를 들면, 프로세서(120)는 제 1 정보가 구매 정보를 포함하고 제 1 정보에 포함된 범주형 변수가 구매가 발생하는 제품에 대한 카테고리 정보를 포함하는 경우, 해당 범주형 변수의 특성(예: 구매가 발생하는 제품에 대한 카테고리 정보)이 기설정 특정 조건(예: 고객 ID, 카테고리 정보 및 카테고리에 대한 고객의 구매 횟수를 포함)을 충족하면, 해당 조건에 대응되는 복수의 기준(예: 고객ID, 구매가 발생하는 제품에 대한 카테고리, 카테고리에 대한 고객의 구매 횟수)을 제 1 정보의 재정렬에 이용하도록 결정할 수 있다.
일 실시 예에 따른 프로세서(120)는 결정된 하나 이상의 기준에 기초하여 제 1 정보를 2차원 형식으로 변환하여 제 2 정보를 획득할 수 있다. 예를 들면, 프로세서(120)는 결정된 하나 이상의 기준 각각을 기설정 사이즈의 매트릭스의 축(예: X축, Y축, Z축) 또는 값(예: 각 행렬의 값)에 적용하여 각각의 기준에 따라 제 1 정보를 배열하는 방식으로 고객별 카테고리별 구매 횟수를 나타내는 2차원 형식의 매트릭스 정보를 생성하여 제 2 정보로서 생성할 수 있다.
일 실시 예에서, 제 2 정보는 제 1 정보를 포함할 수 있고, 2차원 형식의 매트릭스 정보이거나 2차원 형식의 이미지일 수 있다. 예를 들면, 프로세서(120)는 상술한 하나 이상의 기준을 기초로 제 1정보를 재배열하여 2차원 형식의 매트릭스 정보를 생성할 수 있고, 획득된 매트릭스 정보를 기저장된 이미지 알고리즘에 적용하여 매트릭스의 위치에 대응되는 이미지의 픽셀에 매트릭스의 값에 대응되는 이미지 출력값(예: 0 이상 255 이하의 정수)을 할당하는 방식으로 이미지 변환을 수행할 수 있고, 이에 따라, R, G 및 B 채널 중 적어도 하나 이상을 통해 표현되는 이미지를 제 2 정보로서 생성할 수 있다. 이렇게 생성된 제 2 정보는 제 1 정보의 형식(예: 정형 데이터의 형식)과는 다른 형식(예: 이미지 형식)으로 제 1 정보를 포함할 수 있다.
일 실시 예에서, 정보 처리 장치(100)는 제 1 정보가 범주형 변수를 포함하는 경우, 구매가 발생하는 제품에 대한 카테고리, 상권 및 업종 중 하나 이상을 포함하는 하나 이상의 기준을 이용하여 제 1 정보를 2차원 형식의 제 2 정보로 변환할 수 있다. 예를 들면, 정보 처리 장치(100)는 제 1 정보에 각 고객의 신상 정보(예: 고객 ID), 제품에 대한 카테고리 정보 및 구매 정보(예: 구매 여부)가 포함된 경우, 매트릭스의 제 1축(예: X축)에 고객의 신상 정보의 기준을 적용하고, 제 2축(예: Y축)에 카테고리 정보의 기준을 적용하고, 각 행렬 값에 고객의 구매 여부의 기준을 적용하여, 매트릭스에 고객별 카테고리별 고객의 구매 여부에 대한 정보를 순차 배열하여 매트릭스 정보를 획득할 수 있으며, 매트릭스를 RGB 채널 중 하나를 통해 표현되는 이미지로 변환하여 제 2 정보를 생성할 수 있다. 이렇게 생성된 제 2 정보는 고객별로 어떤 카테고리의 제품을 주로 구매하는지를 분석하여 카테고리별 고객의 구매 가능성을 예측하기 위한 정보 특성 결정 모델에 이용될 수 있다.
다른 일 실시 예에서, 정보 처리 장치(100)는 제 1 정보에 포함된 범주형 변수가 순서형 변수를 더 포함하는 경우, 순서형 변수의 기준이 되는 순서를 포함하는 하나 이상의 기준을 이용하여 제 1 정보를 2차원 형식의 제 2 정보로 변환할 수 있다. 예를 들면, 정보 처리 장치(100)는 제 1 정보에 범주형 변수로서 각 고객의 신상 정보(예: 고객 ID) 및 제품에 대한 카테고리 정보가 포함되고, 순서형 변수로서 제품에 대한 고객의 클릭 시간이 포함된 경우, 매트릭스의 제 1축(예: X축)에 제품에 대한 카테고리 정보의 기준을 적용하고, 제 2축(예: Y축)에 고객의 클릭 시간의 기준이 되는 순서의 기준을 적용하며, 각 행렬 값에 고객의 신상 정보(예: 고객 ID)의 기준을 적용하여, 매트릭스에 카테고리별 클릭 순서에 따른 고객의 신상 정보(예: 고객 ID)를 순차 배열하여 매트릭스 정보를 획득할 수 있으며, 매트릭스를 RGB 채널 중 하나를 통해 표현되는 이미지로 변환하여 제 2 정보를 생성할 수 있다. 이렇게 생성된 제 2 정보는 고객별로 어떤 카테고리의 제품을 우선적으로 클릭하는지 또는 카테고리별로 어떤 고객이 주로 클릭하는지를 분석하여 카테고리별 고객의 조회 가능성을 예측하기 위한 정보 특성 결정 모델에 이용될 수 있다.
또 다른 일 실시 예에서, 정보 처리 장치(100)는 제 1 정보가 구매 정보를 포함하고 제 1 정보에 포함된 범주형 변수가 구매가 발생하는 제품에 대한 카테고리 정보를 포함하는 경우, 카테고리를 포함하는 하나 이상의 기준을 이용하여 제 1 정보를 2차원 형식의 제 2 정보로 변환할 수 있다. 예를 들면, 정보 처리 장치(100)는 제 1 정보에 카테고리에 대한 각 고객의 구매 횟수가 포함되고 범주형 변수로서 해당 구매와 연관된 카테고리 정보가 포함된 경우, 매트릭스의 제 1축(예: X축)에 카테고리 정보의 기준을 적용하고, 제 2축(예: Y축)에 고객의 신상 정보(예: 고객 ID)의 기준을 적용하며, 각 행렬 값에 고객의 구매 횟수의 기준을 적용하여, 매트릭스에 카테고리별 고객별 구매 횟수를 순차 배열하여 매트릭스 정보를 획득할 수 있으며, 매트릭스를 RGB 채널 중 하나를 통해 표현되는 이미지로 변환하여 제 2 정보를 생성할 수 있다. 이렇게 생성된 제 2 정보는 고객이 어떤 카테고리의 제품을 더 많이 구매하는지를 분석하여 카테고리별 고객의 구매 가능성을 예측하기 위한 정보 특성 결정 모델에 이용될 수 있다.
또 다른 일 실시 예에서, 정보 처리 장치(100)는 제 1 정보가 구매 정보를 포함하고 제 1 정보에 포함된 범주형 변수가 구매가 발생하는 상권 또는 업종에 대한 정보를 포함하는 경우, 상권 또는 업종을 포함하는 하나 이상의 기준을 이용하여 제 1 정보를 2차원 형식의 제 2 정보로 변환할 수 있다. 예를 들면, 정보 처리 장치(100)는 제 1 정보에 카테고리에 대한 각 고객의 구매 횟수가 포함되고 범주형 변수로서 해당 구매와 연관된 상권 및 업종에 대한 정보가 포함된 경우, 매트릭스의 제 1축(예: X축)에 상권의 기준을 적용하고, 제 2축(예: Y축)에 업종의 기준을 적용하며, 각 행렬 값에 고객의 구매 횟수의 기준을 적용하여, 매트릭스에 상권별 업종별 고객의 구매 횟수를 순차 배열하여 매트릭스 정보를 획득할 수 있으며, 매트릭스를 RGB 채널 중 하나를 통해 표현되는 이미지로 변환하여 제 2 정보를 생성할 수 있다. 이렇게 생성된 제 2 정보는 고객이 어떤 상권에서 어떤 업종의 제품을 주로 구매하는지를 분석하여 상권별 업종별 구매 가능성을 예측하기 위한 정보 특성 결정 모델에 이용될 수 있다.
일 실시 예에 따른 정보 처리 장치(100)가 하나 이상의 기준에 기초하여 제 1 정보를 2차원 형식의 제 2 정보로 변환하는 동작에 관한 다양한 실시 예들은 이하에서 도 6을 참조하며 추가적으로 후술하도록 한다.
일 실시 예에 따른 프로세서(120)는 2차원 형식으로 변환된 제 2 정보에 CNN(Convolutional Neural Network)을 적용하여 제 1 정보의 특성을 결정할 수 있다. 일 실시 예에서, 제 1 정보의 특성은 고객의 구매 속성을 포함할 수 있고, 고객의 구매 속성은 시간에 따른 고객의 특정 제품에 대한 구매 확률을 포함할 수 있으며, 예를 들면, 특정 기간 또는 특정 시간대에 고객이 특정 제품을 실제로 구매할지 여부를 수치화한 구매 확률을 포함할 수 있다.
여기에서, CNN은 합성곱 층(Convolutional Layer)을 이용하여 변수 특징을 추출한 뒤 원하는 출력값을 내는 심층 신경망의 한 종류에 해당하고, 일 실시 예에서, CNN은 합성곱 층을 사용하지 않는 DNN(Deep Neural Network)과 대조적으로 인접한 변수의 조합에 기반한 지역적 특성을 학습하는 것이 가능하고, 합성곱 층의 설계에 따라 시간 순서에 따른 정보 학습이 가능하며, RNN(Recurrent Neural Networks)에 비하여 메모리 사용량이 적고 학습 및 추론 속도가 빠른 특징이 있다.
예를 들면, 프로세서(120)는 제 1 정보에 대한 변환을 통해 2차원 형식의 RGB로 표현되는 이미지가 획득되면, 획득된 이미지를 기저장된 CNN 알고리즘에 적용하여 정보 특성 결정 모델을 생성하고, 생성된 정보 특성 결정 모델에 특정 카테고리 정보를 입력하여 제 1 정보의 특성에 포함되는 시간에 따른 고객의 특정 제품 또는 카테고리에 대한 구매 확률을 결정할 수 있다. 또한, 프로세서(120)는 수집된 정보들로부터 변환된 복수의 이미지들을 학습 데이터셋으로 이용하여 CNN 기반의 딥러닝을 통해 정보 특성 결정 모델의 성능을 개선시킬 수 있다.
일 실시 예에 따른 프로세서(120)는 제 2 정보에 포함된 정보의 위치 간의 국소적 특성에 기초하여 제 1 정보의 속성을 결정할 수 있다. 예를 들면, 프로세서(120)는 2차원 형식의 이미지로 변환된 제 2 정보에 CNN을 적용하여 학습을 수행함으로써 CNN을 통해 이미지에 반영된 인접한 변수의 조합을 분석하여 국소적 상관관계를 읽어낼 수 있다.
이때, 제 2 정보에 포함된 범주형 변수들에 대한 정보들은 랜덤한 특징을 가질 수 있으며, 여기에서, 랜덤이라는 것은 상하좌우 관계가 없어 인접한 비트간에 관련성이 없음을 의미할 수 있다. 즉, 프로세서(120)는 제 2 정보에 수많은 변수들이 압축되어 반영될 수 있고, 제 2 정보에 포함된 수많은 범주형 변수들이 랜덤한 특징이 있음에도, 이미지로 표현되는 제 2 정보의 상하좌우로 인접한 픽셀 간의 조합을 분석하여 위치 간의 국소적 특성을 분석함으로써 이를 유의미하게 이용할 수 있다.
이에 따라, 프로세서(120)는 이미지에 포함된 범주형 변수들에 대한 정보의 특성을 CNN의 합성곱 층을 통해 효과적으로 추출할 수 있으며, 이미지를 이용하여 CNN 기반의 딥러닝을 수행함으로써 수많은 변수들을 효율적으로 반영하여 고객의 구매 속성을 결정하는 모델의 성능을 크게 향상시킬 수 있다.
일 실시 예에 따른 프로세서(120)는 제 2 정보를 필터링하여 주요 정보를 획득하고, 획득된 주요 정보에 기초하여 제 1 정보의 특성을 결정할 수 있다. 예를 들면, 프로세서(120)는 CNN을 통해 제 2 정보로부터 명목형 변수, 순서형 변수 또는 수치형 변수에 해당하는 복수의 변수들에 대한 정보를 추출할 수 있고, 추출된 정보에 대한 필터링을 통해 기설정된 하나 이상의 주요 변수(예: 고객이 구매하는 제품에 대한 카테고리, 고객 ID, 구매금액, 구매 시간 등)에 대한 정보들을 포함하는 주요 정보를 획득할 수 있으며, 필터링된 주요 변수에 대한 정보들을 정보 특성 결정 모델에 입력하여 고객의 구매 속성을 결정할 수 있다.
일 실시 예에 따른 프로세서(120)는 결정된 하나 이상의 기준에 따라 제 1 정보를 제 1 매트릭스, 제 2 매트릭스 및 제 3 매트릭스로 분류하고, 제 1 매트릭스, 제 2 매트릭스 및 제 3 매트릭스가 각각 R, G, B로 표현된 이미지를 획득할 수 있으며, 획득된 이미지에 CNN을 적용하여 제 1 정보의 특성을 결정할 수 있다.
예를 들면, 프로세서(120)는 상술한 예시에 따라 고객별 카테고리별 고객의 구매 여부에 대한 정보가 순차 배열된 매트릭스를 생성하되, 고객이 구매한 카테고리 정보를 동일 기간(예: 주별)으로 수합하여, 최근 1주차의 기간에 구매한 카테고리가 반영된 제 1 매트릭스, 최근 2주차의 기간에 구매한 카테고리가 반영된 제 2 매트릭스 및 최근 3주차의 기간에 구매한 카테고리가 반영된 제 3 매트릭스를 생성할 수 있다. 또한, 프로세서(120)는 생성된 제 1 매트릭스, 제 2 매트릭스 및 제 3 매트릭스를 각각 R채널, G채널 및 B채널을 통해 변환하여 RGB로 표현된 이미지를 생성할 수 있다.
일 실시 예에 따른 프로세서(120)는 제 1 정보가 수치형 변수를 더 포함하는 경우, 제 1 정보로부터 범주형 변수로 구성된 제 1-1 정보 및 수치형 변수로 구성된 제 1-2 정보를 획득할 수 있다. 또한, 프로세서(120)는 범주형 변수의 특성에 기초하여 제 1-1 정보를 2차원 형식으로 변환하여 제 2-1 정보를 획득하고, 수치형 변수의 특성에 기초하여 제 1-2 정보를 2차원 형식으로 변환하여 제 2-2 정보를 획득할 수 있다. 또한, 프로세서(120)는 제 2-1 정보에 포함된 정보의 위치간 국소적 특성 및 제 2-2 정보에 포함된 정보의 위치간 국소적 특성에 기초하여 제 2-1 정보 및 제 2-2 정보에 CNN을 각각 적용하고, 제 2-1 정보 및 제 2-2 정보에 대한 CNN의 적용 결과를 이용하여 제 1 정보의 특성을 결정할 수 있다.
예를 들면, 프로세서(120)는 제 1 정보를 고객의 ID, 제품에 대한 카테고리 정보 및 고객의 구매 여부로 구성된 제 1-1 정보와, 카테고리에 대한 고객의 구매 횟수 및 구매 시간으로 구성된 제 1-2 정보로 분류하고, 고객별 카테고리별 구매 여부를 나타내는 제 2-1 이미지 및 시간에 따른 카테고리별 구매 횟수를 나타내는 제 2-2 이미지를 생성하고, 제 2-1 및 제 2-2 이미지를 CNN에 적용하여 각 이미지의 국소적 특성을 분석하여 고객이 특정 시간대에 특정 카테고리의 제품을 구매할지 여부를 나타내는 고객의 구매 확률을 결정할 수 있다.
일 실시 예에 따른 프로세서(120)는 제 1-1 정보로부터 명목형 변수로 구성된 제 1-3 정보 및 순서형 변수로 구성된 제 1-4 정보를 획득하고, 명목형 변수의 특성에 기초하여 제 1-3 정보를 2차원 형식으로 변환하여 제 2-3 정보를 획득하고, 순서형 변수의 특성에 기초하여 제 1-4 정보를 2차원 형식으로 변환하여 제 2-4 정보를 획득하고, 제 2-3 정보에 포함된 정보의 위치간 국소적 특성 및 제 2-4 정보에 포함된 정보의 위치간 국소적 특성에 기초하여 제 2-3 정보 및 제 2-4 정보에 CNN을 각각 적용하고, 제 2-3 정보 및 제 2-4 정보에 대한 CNN의 적용 결과를 이용하여 제 1 정보의 특성을 결정할 수 있다.
예를 들면, 프로세서(120)는 제 1-1 정보를 제품에 대한 카테고리 정보 및 고객의 구매 여부로 구성된 제 1-3 정보와, 고객의 구매 등급(예: 1~6등급) 및 시간대(예: 오전, 오후, 저녁, 밤)으로 구성된 1-4 정보로 분류하고, 고객별 카테고리별 구매 여부를 나타내는 제 2-3 이미지 및 시간대별 구매 등급별 구매 여부를 나타내는 제 2-4 이미지를 생성하고, 제 2-3 및 제 2-4 이미지를 CNN에 적용하여 각 이미지의 국소적 특성을 분석하여 특정 구매 등급의 고객이 특정 시간대에 특정 카테고리의 제품을 구매할지 여부를 나타내는 고객의 구매 확률을 결정할 수 있다.
일 실시 예에 따른 프로세서(120)는 제 2-2 정보(예: 수치형 변수)에 포함된 정보의 위치 간의 관련성을 나타내는 제 1 국소적 특성, 제 2-3 정보(예: 명목형 변수)에 포함된 정보의 위치 간의 관련성을 나타내는 제 2 국소적 특성 및 제 2-4 정보(예: 순서형 변수)에 포함된 정보의 위치 간의 관련성을 나타내는 제 3 국소적 특성을 획득하고, 제 1 국소적 특성, 제 2 국소적 특성 및 제 3 국소적 특성에 서로 상이한 가중치를 적용하여 제 1 정보의 특성을 결정할 수 있다.
일 실시 예에서, 프로세서(120)는 제 1 국소적 특성에 적용되는 가중치인 제 1 가중치, 제 3 국소적 특성에 적용되는 가중치인 제 3 가중치 및 제 2 국소적 특성에 적용되는 가중치인 제 2 가중치 순으로 큰 값을 부여할 수 있다(예: 제 1 가중치 > 제 3 가중치 > 제 2 가중치).
이에 따라, 프로세서(120)는 수치형 변수에 가장 높은 가중치를 부여하고 명목형 변수에 가장 낮은 가중치를 부여함으로써, 수치형 변수에 포함된 위치 간의 상관관계를 더 많이 반영하여 제 1 정보의 특성을 결정할 수 있다. 일반적으로, 수치형 변수의 국소적 특성이 순서형 변수의 국소적 특성보다 더 유의미하고, 순서형 변수의 국소적 특성이 명목형 변수의 국소적 특성보다 더 유의미하기 때문에, 프로세서(120)는 가중치를 기반으로 유의미한 정보의 반영 비율을 결정할 수 있어 고객의 구매 확률을 보다 높은 정확성으로 예측할 수 있다.
일 실시 예에서, 제 2 가중치는 범주형 변수에 포함된 범주의 개수에 따라서 결정되고, 범주의 개수가 2보다 작거나 같을 경우, 제 1 가중치, 제 2 가중치 및 제 3 가중치 순으로 큰 값을 부여할 수 있다(예: 제 1 가중치 > 제 2 가중치 > 제 3 가중치). 예를 들면, 명목형 변수의 범주가 1개 또는 2개라면 동일 범주 내의 값들의 관련성은 순서형 변수에서의 관련성보다 더 유의미할 수 있으므로, 프로세서(120)는 범주의 개수를 기반으로 유의미한 정보의 반영 비율을 조정할 수 있다.
일 실시 예에 따른 프로세서(120)는 정보 처리 장치(100)의 동작 전반을 제어하는 CPU(central processor unit)로 구현될 수 있고, 통신부(110) 및 저장부(130)와 전기적으로 연결되어 이들 간의 데이터 흐름을 제어할 수 있다.
일 실시 예에 따른 저장부(130)는 제 1 정보 및 제 2 정보를 저장할 수 있고, 그밖에 정보 처리 장치(100)의 동작 전반에 필요한 데이터를 저장할 수 있다. 일 실시 예에서, 저장부(130)는 SSD(Solid State Disk) 또는 HDD(Hard Disk Drive)와 같은 비휘발성 메모리로 구현된 보조기억장치 또는 RAM(Random Access Memory)과 같은 휘발성 메모리로 구현된 주기억장치를 포함할 수 있다. 또한, 일 실시 예에서, 저장부(130)는 데이터베이스로 구현되거나 클라우드 또는 별도의 저장 서버로 구현되어 유무선 통신망을 통해 정보 처리 장치(100)에 필요한 데이터 및 저장 공간을 제공할 수 있다.
또한, 도 1에 도시된 구성요소들 외에 다른 범용적인 구성요소들이 정보 처리 장치(100)에 더 포함될 수 있음을 관련 기술 분야에서 통상의 지식을 가진 자라면 이해할 수 있다. 예를 들면 정보 처리 장치(100)은 CNN 기반의 학습 모델을 구현하기 위한 알고리즘을 포함할 수 있고, 그 밖에도 사용자 입력을 수신하거나 출력하기 위한 입출력 인터페이스나 출력 정보를 시각화하기 위한 디스플레이 등을 더 포함할 수 있다. 또한, 다른 실시 예에 따를 경우, 도 1에 도시된 구성요소들 중 일부는 생략될 수 있다. 또한, 일 실시 예에 따른 정보 처리 장치(100)는 하나 이상의 서버로 구현될 수 있다.
도 2는 도 1에 있는 정보 처리 장치(100)가 정보 처리를 수행하는 방법의 일 예를 도시한 흐름도이다.
단계 S210 에서 일 실시 예에 따른 정보 처리 장치(100)는 1차원 형식으로 표현되고 범주형 변수를 포함하는 제 1 정보를 수신할 수 있다. 일 실시 예에서, 제 1 정보는 고객의 신상 정보, 구매 정보, 행동 정보 및 위치 정보 중 적어도 하나를 포함할 수 있고, 명목형 변수, 순서형 변수 및 수치형 변수 중 적어도 하나를 포함할 수 있다.
단계 S220 에서 일 실시 예에 따른 정보 처리 장치(100)는 제 1 정보에 포함된 범주형 변수의 특성에 기초하여 제 1 정보의 재정렬에 이용되는 하나 이상의 기준을 결정할 수 있다. 일 실시 예에서, 하나 이상의 기준은 구매가 발생하는 제품에 대한 카테고리 정보, 상권 또는 업종에 대한 정보 중 적어도 하나를 포함할 수 있다.
단계 S230 에서 일 실시 예에 따른 정보 처리 장치(100)는 하나 이상의 기준에 기초하여 상기 제 1 정보를 2차원 형식으로 변환하여 제 2 정보를 획득할 수 있다. 일 실시 예에서, 범주형 변수는 명목형 변수를 포함하고, 제 1 정보는 명목형 변수가 나타내는 변수들에 대한 정보가 순차적으로 제공되는 비트스트림을 포함할 수 있다. 또한, 범주형 변수는 순서형 변수를 더 포함하고, 하나 이상의 기준은 순서형 변수의 기준이 되는 순서를 포함할 수 있다. 또한, 범주형 변수는 순서형 변수를 더 포함하고, 하나 이상의 기준은 순서형 변수의 기준이 되는 순서를 포함할 수 있다. 또한, 제 1 정보는 구매 정보를 포함하고, 범주형 변수는 구매가 발생하는 제품에 대한 카테고리 정보를 포함하고, 하나 이상의 기준은 카테고리를 포함할 수 있다. 또한, 제 1 정보는 구매 정보를 포함하고, 범주형 변수는 구매가 발생하는 상권 또는 업종에 대한 정보를 포함하고, 하나 이상의 기준은 상권 또는 업종을 포함할 수 있다.
단계 S240 에서 일 실시 예에 따른 정보 처리 장치(100)는 2차원 형식으로 변환된 제 2 정보에 CNN을 적용하여 제 1 정보의 특성을 결정할 수 있다. 일 실시 예에서, 정보 처리 장치(100)는 제 2 정보에 포함된 정보의 위치 간의 국소적 특성에 기초하여 제 1 정보의 속성을 결정할 수 있다. 또한, 정보 처리 장치(100)는 제 2 정보를 필터링하여 주요 정보를 획득하고, 주요 정보에 기초하여 제 1 정보의 특성을 결정할 수 있다.
본 발명의 일 실시 예에 따르면, 사용자가 자신의 편향에 따라 좋은 변수들을 편집하여 넣지 않더라도 수많은 주요 변수들을 이미지에 압축하여 CNN 기반의 데이터 분석에 반영할 수 있어 변수의 개수가 늘어나더라도 저장 용량의 측면에서 효율적인 효과가 있다.
본 발명의 일 실시 예에 따르면, 1차원 형식으로 표현되는 범주형 변수들을 2차원 형식의 이미지로 변환하고 CNN을 기반으로 이미지에 대한 학습을 수행함으로써, 수많은 변수들을 하나의 이미지에 압축 반영하여 학습 효율을 향상시킬 수 있다.
도 3은 도 1에 있는 정보 처리 장치(100)가 1차원 형식으로 표현되는 제 1 정보를 2차원 형식으로 표현되는 제 2 정보로 변환하고 제 2 정보를 CNN을 적용하여 제 1 정보의 특성을 결정하는 동작의 일 예시를 설명하기 위한 도면이다.
도 3을 참조하면, 일 실시 예에 따른 정보 처리 장치(100)는 식별번호 310 내지 320에 도시된 일 예시와 같이, 고객의 신상 정보 및 고객의 구매 정보(예: 식별번호 310 참조)를 관리하는 서버(예: 고객 정보 관리 서버)로부터 1차원 형식으로 표현되고 범주형 변수를 포함하는 제 1 정보(예: 식별번호 310 내지 320 참조)을 수신할 수 있다.
또한, 정보 처리 장치(100)는 식별번호 330에 도시된 일 예시와 같이, 제 1 정보에 포함된 범주형 변수의 특성에 기초하여 제 1 정보의 재정렬에 이용되는 하나 이상의 기준을 결정하고, 결정된 하나 이상의 기준에 기초하여 제 1 정보를 2차원 형식의 매트릭스 정보(예: 식별번호 330 참조)로 변환하여 제 2 정보를 획득할 수 있다.
또한, 정보 처리 장치(100)는 식별번호 340에 도시된 일 예시와 같이, 2차원 형식의 매트릭스 정보로 변환된 제 2 정보에 CNN을 적용할 수 있고(예: 식별번호 340 참조), CNN 기반의 딥러닝을 통해 정보 특성 결정 모델을 생성하고 학습하여 개선시킬 수 있다.
또한, 정보 처리 장치(100)는 식별번호 340에 도시된 일 예시와 같이, 제 2 정보에 포함된 정보의 위치 간의 국소적 특성에 기초하여 제 1 정보의 속성을 결정할 수 있고, 예를 들면, 특정 제품에 대한 고객의 구매 확률(예: 식별번호 350 참조)을 결정할 수 있다.
도 4는 도 1에 있는 정보 처리 장치(100)가 복수의 학습 모델을 적용하여 제 1 정보의 특성을 결정한 결과를 평가하는 동작의 일 예시를 설명하기 위한 도면이다.
도 4를 참조하면, 정보 처리 장치(100)는 고객의 구매 정보를 복수의 학습 모델에 적용하고, 학습을 통해 성능을 개선시킨 각 학습 모델을 이용하여 각 카테고리에 대한 고객의 구매 확률의 예측값을 결정하며, 예측값과 실제값을 비교하여 각 학습 모델에 대한 대한 성능 지표를 산출할 수 있다.
일 실시 예에서, 복수의 학습 모델은 RF, LighGBM, MLP, DNN, 1차원 CNN 및 2차원 CNN 중 적어도 하나를 포함할 수 있다. 예를 들면, 학습 모델이 CNN을 기반으로 하는 경우, 정보 처리 장치(100)는 상술한 방법에 따라 1차원 형식으로 표현되는 제 1 정보를 2차원 형식의 매트릭스 또는 이미지로 표현되는 제 2 정보로 변환하고 변환된 제 2 정보에 CNN을 적용하여 각 카테고리에 대한 고객의 구매 확률의 예측값을 결정할 수 있다. 또한, 학습 모델이 CNN이 아닌 다른 학습 알고리즘을 기반으로 하는 경우, 정보 처리 장치(100)는 1차원 형식으로 표현되는 제 1 정보에 해당 학습 알고리즘을 적용하여 각 카테고리에 대한 고객의 구매 확률의 예측값을 결정할 수 있다.
일 실시 예에서, 정보 처리 장치(100)는 MSE(Mean Squared Error)를 기반으로 제 1 성능 지표를 산출할 수 있다. 여기에서, MSE는 실제값과 예측값의 차이의 제곱을 평균한 값으로서, 값이 작을수록 실제값을 잘 예측하였음을 나타낸다.
일 실시 예에서, 정보 처리 장치(100)는 하기의 수학식 1에 따라 제 2 성능 지표를 나타내는 리프트(Lift)를 산출할 수 있다. 예를 들면, 리프트는 무작위로 선택된 고객들에 비해 각 모델이 예측한 구매 점수 기준 상위 고객들이 실제로 해당 카테고리의 상품을 얼마나 더 구매했는지에 대한 비율을 나타내며, 값이 클수록 실제값을 잘 예측하였음을 나타낼 수 있다. 이에 따라, 정보 처리 장치(100)는 예측 상품수가 높은 고객에 대한 상품 구매 여부를 평가함으로써 보다 높은 정밀하게 성능 지표를 산출할 수 있다.
[수학식 1]
Figure 112019133179862-pat00001
(여기에서, NT는 전체 고객 수를 나타내고, NC는 해당 카테고리의 제품을 구매한 고객 수를 나타내고, NX는 모델이 예측한 구매점수 상위 X%에 해당하는 고객의 수를 나타내고, NXC는 해당 상위 고객 중 실제 해당 카테고리의 제품을 구매한 고객 수를 나타내며, X는 사용자에 의해 설정될 수 있음)
도 4에 도시된 테스트 결과의 일 예시처럼, 본 발명의 일 실시 예에 따라 범주형 변수를 포함하는 1차원 형식의 제 1 정보를 2차원 형식의 제 2 정보로 변환하여 CNN에 적용한 경우, 높은 리프트 값과 낮은 MSE 값이 산출되어 높은 성능을 보이는 것을 확인할 수 있다.
즉, 본 발명의 일 실시 예에 따르면, 범주형 변수를 포함하는 수많은 변수들을 2차원 형식으로 효율적으로 압축하여 CNN에 반영함으로써, 저장 용량의 측면에서 효율적이고 학습 모델의 높은 성능 개선 또한 이룰 수 있고, 상하좌우 관계가 없어 인접한 비트간에 관련성이 없는 랜덤성의 범주형 변수에 대해서도 국소적 상관관계를 읽어낼 수 있어 수많은 범주형 변수에 대해 효율적으로 유의미한 데이터 분석을 수행할 수 있다.
도 5는 도 1에 있는 정보 처리 장치(100)가 제 1 정보의 재정렬에 이용되는 하나 이상의 기준을 결정하는 동작의 일 예시를 설명하기 위한 도면이다.
도 5를 참조하면, 일 실시 예에 따른 정보 처리 장치(100)는 제 1 정보에 포함된 정보의 종류가 기저장된 복수의 조건 중 어느 하나를 충족하면, 해당 조건에 대응되는 변환 방법을 이용하여 제 1 정보를 재정렬하도록 결정할 수 있다. 여기에서, 복수의 조건은 제 1 정보에 포함된 정보의 종류별 조합에 따른 경우의 수를 의미한다.
일 실시 예에서, 각각의 변환 방법은 제 1 정보의 재정렬을 위한 하나 이상의 기준을 포함하고, 예를 들면, 도 5에 도시된 바와 같이, 시간 정보 제시 여부, 고객의 특성 정보(demographics data) 제시 방법, 전체 정보 제시 방법, 신경망 및 우선 순위 중 적어도 하나에 대한 정보를 포함할 수 있다.
일 실시 예에서, 시간 정보 제시 여부는 제 1 정보를 2차원 형식으로 재정렬하는 과정에서, 시간 정보를 제시하는 방법(예: 조회 순서별, 일자별, 고밀도, 저밀도 등)에 대한 정보를 나타내고, 고객의 특성 정보 제시 방법은 제 1 정보를 제시하는 방법(예: 별도 반영, 섞어 넣기, RGB 채널 중 별도 채널 이용)에 대한 정보를 나타내고, 전체 정보 제시 방법은 전체 정보를 매트릭스에 배열하는 방법(예: 순서 제시, 랜덤 제시)에 대한 정보를 나타내고, 신경망은 딥러닝에 이용할 CNN 신경망 구조(예: 1차원, 2차원)에 대한 정보를 나타내고, 우선 순위는 우선적으로 결정하고자 하는 변환 방법에 부여되는 가중치에 대한 정보를 나타낸다.
예를 들면, 프로세서(120)는 제 1 정보에 포함된 고객의 신상 정보 및 고객의 행동 정보 중 카테고리별 고객의 클릭 횟수가 포함되면, 시간 정보 제시 여부를 '비제시'로, 고객의 특성 정보 제시 방법을 '섞어 넣기'로, 전체 정보 제시 방법을 '순서 제시'로, 신경망을 '2차원'으로 결정하는 제 1 변환 방법(예: BCL, 도 3a 참조)에 따라서, 고객 ID와 최근 14일 동안 카테고리별 고객의 클릭 횟수에 대한 정보를 순차적으로 2차원 형식의 매트릭스에 배열할 수 있다. 즉, 시간을 기준으로 하지 않고, 고객 ID와 카테고리별 클릭 횟수에 대한 정보가 하나의 매트릭스 내에 혼합되어 제시되면서 각각이 순차적으로 제시되도록 기준을 결정하여 제 1 정보를 2차원 형식으로 재정렬할 수 있다.
일 실시 예에 따른 정보 처리 장치(100)는 제 1 정보에 포함된 정보의 종류가 기저장된 복수의 조건 중 둘 이상을 충족하는 경우에는 기설정 우선 순위가 높은 변환 방법을 우선적으로 결정할 수 있다.
일 실시 예에서, 도 2에 도시된 변환 방법의 명칭(예: ACL, BCR 등)은 시간 정보를 제시하면 A, 시간 정보를 제시하지 않으면 B, RGB 채널 중 이용하는 채널 개수가 1개면 C, 채널 개수가 3개면 D, 순서 제시에 따라 제시되는 정보의 순서에 상관관계 정보가 있으면 L, 상관관계 정보가 없으면 R을 부가하는 방식으로 관리될 수 있고, 이에 따라, 각 변환 방법의 특성을 관리자가 용이하게 확인할 수 있도록 지원할 수 있다.
도 6은 도 1에 있는 정보 처리 장치(100)가 하나 이상의 기준에 기초하여 제 1 정보를 2차원 형식으로 변환하여 제 2 정보를 획득하는 동작의 다양한 실시 예들을 설명하기 위한 도면이다.
도 6a를 참조하면, 제 1 실시 예에 따른 정보 처리 장치(100)는 고객의 신상 정보 및 고객의 기설정 기간 동안 각각의 카테고리에 대한 클릭 횟수에 대한 정보에 기초하여 제 1 정보를 2차원 형식으로 변환할 수 있다.
제 1 실시 예에서, 제 1 정보는 고객의 신상 정보(예: 고객 ID) 및 고객의 기설정 기간(예: 최근 14일) 동안 각각의 카테고리에 대한 클릭 횟수에 대한 정보를 포함하고, 정보 처리 장치(100)는 제 1 정보를 고객의 신상 정보 및 고객의 기설정 기간 동안 각각의 카테고리에 대한 클릭 횟수에 대한 정보가 구별되어 배치된 매트릭스 정보를 획득할 수 있다.
예를 들면, 정보 처리 장치(100)는 제 1 정보에 포함된 각 고객의 신상 정보, 이용 정보 및 카테고리별 선호 정보를 기설정된 순서에 따라 특정 위치에 따른 점으로 입력하여 산포도(scatter plot)의 형태로 나타내는 제 1 변환 방법(예: BCL)에 따라 변환을 수행할 수 있고, 구체적으로는, 각 고객의 신상정보(예: 고객 ID) 및 사이트 이용 정보를 더미화하고, 마지막 구매 직전의 14일간 발생한 최근 본 상품의 2 등급 카테고리 정보를 합산한 벡터의 원소를 기설정 사이즈의 매트릭스에 순서대로 배치하여 2차원 형식의 매트릭스 정보를 획득할 수 있다(식별번호 601 참조).
예를 들면, 정보 처리 장치(100)는 매트릭스에 행렬 순으로 기설정 개수(예: 고객수)의 고객별 신상 정보(예: 고객 ID)를 먼저 순차 배열하고, 이어서 기설정 개수(예: 2등급 카테고리의 개수)의 카테고리별 클릭 횟수를 순차 배열할 수 있다.
도 6b를 참조하면, 제 2 실시 예에 따른 정보 처리 장치(100)는 고객의 신상 정보 및 고객의 기설정 기간 동안 각각의 카테고리에 대한 클릭 횟수에 대한 정보에 기초하여 제 1 정보를 2차원 형식으로 변환할 수 있다.
제 2 실시 예에서, 제 1 정보는 고객의 신상 정보(예: 고객 ID) 및 고객의 기설정 기간(예: 최근 14일) 동안 각각의 카테고리에 대한 클릭 횟수에 대한 정보를 포함하고, 정보 처리 장치(100)는 제 1 정보를 고객의 신상 정보 및 고객의 기설정 기간 동안 각각의 카테고리에 대한 상기 클릭 횟수에 대한 정보가 랜덤하게 배치된 매트릭스 정보를 획득할 수 있다.
예를 들면, 정보 처리 장치(100)는 제 1 정보에 포함된 각 고객의 신상 정보, 이용 정보 및 카테고리별 선호 정보를 설정된 순서 없이 랜덤하게 특정 위치에 따른 점으로 입력하여 산포도의 형태로 나타내는 제 2 변환 방법(예: BCR)에 따라 변환을 수행하며, 구체적으로는, 상술한 제 1 실시 예에 따라 생성된 매트릭스의 원소를 기설정 사이즈의 매트릭스에 랜덤하게 배치하여 2차원 형식의 매트릭스 정보를 획득할 수 있다(식별번호 602 참조).
예를 들면, 정보 처리 장치(100)는 매트릭스에 행렬 순으로 기설정 개수(예: 고객수)의 고객별 신상 정보(예: 고객 ID) 및 기설정 개수(예: 2등급 카테고리의 개수)의 카테고리별 클릭 횟수를 랜덤하게 배열할 수 있다.
이에 따라, 정보 처리 장치(100)는 매트릭스의 원소를 랜덤한 위치에 배치함으로써, 변수 순서 등으로 반영되는 인접 픽셀 간 상관관계 정보가 제거된 매트릭스 정보를 학습 데이터셋으로 이용하여 고객의 구매 속성의 결정 정확성을 보다 향상시킬 수 있다.
도 6c을 참조하면, 제 3 실시 예에 따른 정보 처리 장치(100)는 클릭 순서 및 제품에 대한 카테고리에 기초하여 제 1 정보를 2차원 형식으로 변환할 수 있다.
제 3 실시 예에서, 상술한 하나 이상의 기준은 클릭 순서 및 제품에 대한 카테고리를 포함하고, 매트릭스 정보는 각각의 카테고리에 대한 고객의 클릭 순서를 나타내는 정보를 포함할 수 있다.
예를 들면, 정보 처리 장치(100)는 제 1 정보에 포함된 각 고객의 신상 정보, 이용 정보 및 카테고리별 선호 정보를 고객의 상품 조회(또는 사이트 이용) 발생 시점마다 기록하여 이에 대한 순서를 나타내는 제 3 변환 방법(예: ACL)에 따라 변환을 수행하며, 구체적으로는, 각 고객마다 최근 본 상품별로 해당 카테고리의 마지막 조회일부터 최근 조회일까지 순서대로 배치하고, 고객의 신상 정보 및 사이트 이용 정보를 모든 조회 발생 열(row)에 입력하고, 전체 이미지 길이를 최대 최근 본 상품 건수인 54로 설정할 수 있으며, 이와 같이 각각의 카테고리에 대한 고객의 클릭 순서에 대한 시간의 흐름에 따라 카테고리 정보를 배치하여 2차원 형식의 매트릭스 정보를 획득할 수 있다(식별번호 603 참조).
예를 들면, 정보 처리 장치(100)는 매트릭스의 제 1축(예: X축)에 클릭 순서를 나타내기 위한 시간의 기준을 적용하고, 제 2축(예: Y축)에 카테고리 정보의 기준을 적용하고, 각 행렬 값에 고객의 클릭 여부의 기준을 적용하여, 매트릭스에 시간별 카테고리별 고객의 클릭 여부에 대한 정보를 순차 배열할 수 있다. 일 실시 예에서, 카테고리의 종류 및 배열 순서는 초기에 랜덤하게 결정된 후 고정적으로 이용될 수 있다.
도 6d를 참조하면, 제 4 실시 예에 따른 정보 처리 장치(100)는 날짜 및 제품에 대한 카테고리에 기초하여 제 1 정보를 2차원 형식으로 변환할 수 있다. 제 4 실시 예에서, 상술한 하나 이상의 기준은 날짜 및 제품에 대한 카테고리를 포함하고, 매트릭스 정보는 각각의 날짜에 대응되는 각각의 카테고리에 대한 고객의 클릭 횟수에 대한 정보를 포함할 수 있다.
예를 들면, 정보 처리 장치(100)는 제 1 정보에 포함된 각 고객의 신상 정보, 이용 정보 및 카테고리별 선호 정보를 일별로 합산하여 일자별로 고객의 정보 변동 또는 발생 내역을 기록하고 나타내는 제 4 변환 방법(예: A2CL)에 따라 변환을 수행하며, 구체적으로는, 상술한 제 3 실시 예에 따라 생성된 매트릭스의 카테고리 정보를 동일일자에 발생한 상품별로 합산하여 기설정 개수(예: 14개)의 열로 정렬하여 배치하고, 개인정보를 모든 열에 입력하여 2차원 형식의 매트릭스 정보를 획득할 수 있다(식별번호 604 참조).
예를 들면, 정보 처리 장치(100)는 매트릭스의 제 1축(예: X축)에 날짜의 기준을 적용하고, 제 2축(예: Y축)에 카테고리 정보의 기준을 적용하고, 각 행렬 값에 고객의 클릭 횟수의 기준을 적용하여, 매트릭스에 날짜별 카테고리별 고객의 클릭 횟수에 대한 정보를 순차 배열할 수 있다.
도 6e를 참조하면, 제 5 실시 예에 따른 정보 처리 장치(100)는 시간 및 구매 히스토리에 대한 업종에 기초하여 제 1 정보를 2차원 형식으로 변환할 수 있다. 제 5 실시 예에서, 상술한 하나 이상의 기준은 시간 및 구매 히스토리에 대한 업종을 포함하고, 매트릭스 정보는 각각의 시간대에 대응되는 각각의 업종에 대한 고객의 구매 금액에 대한 정보를 포함할 수 있다.
예를 들면, 정보 처리 장치(100)는 제 1 정보에 포함된 각 고객별 월별 업종별 가맹점 이용 금액을 요일 및 시간대로 나누어 합산하고, 각 고객의 최근 업종이용여부 및 업종별 이용금액을 하나의 매트릭스에 배열하는 제 5 변환 방법에 따라 2차원 형식의 매트릭스 정보를 획득할 수 있다(식별번호 605 참조).
예를 들면, 정보 처리 장치(100)는 매트릭스의 제 1축(예: X축)에 업종의 기준을 적용하고, 제 2축(예: Y축)에 요일(또는 시간대)의 기준을 적용하고, 각 행렬 값에 고객의 구매 금액의 기준을 적용하여, 매트릭스에 업종별 요일(또는 시간대)별 고객의 구매 금액에 대한 정보를 순차 배열할 수 있다.
도 6f를 참조하면, 제 6 실시 예에 따른 정보 처리 장치(100)는 시간 및 구매 히스토리에 대한 업종에 기초하여 제 1 정보를 2차원 형식으로 변환할 수 있다. 제 6 실시 예에서, 상술한 하나 이상의 기준은 시간 및 구매 히스토리에 대한 업종을 포함하고, 매트릭스 정보는 각각의 시간대에 대응되는 각각의 업종에 대한 고객의 구매 횟수에 대한 정보를 포함할 수 있다.
예를 들면, 정보 처리 장치(100)는 제 1 정보에 포함된 각 고객별 월별 업종별 가맹점 이용 횟수를 요일 및 시간대로 나누어 합산하고, 각 고객의 최근 업종이용여부 및 업종별 이용빈도를 하나의 매트릭스에 배열하는 제 6 변환 방법에 따라 2차원 형식의 매트릭스 정보를 획득할 수 있다(식별번호 606 참조).
예를 들면, 정보 처리 장치(100)는 매트릭스의 제 1축(예: X축)에 업종의 기준을 적용하고, 제 2축(예: Y축)에 요일(또는 시간대)의 기준을 적용하고, 각 행렬 값에 고객의 구매 횟수의 기준을 적용하여, 매트릭스에 업종별 요일(또는 시간대)별 고객의 구매 횟수에 대한 정보를 순차 배열할 수 있다.
제 5 내제 제 6 실시 예에 따라 획득된 매트리스 정보는 고객 시간대별 업종별 사용 가능성을 예측하기 위한 정보 특성 결정 모델에 이용될 수 있고, RGB 채널 중 하나 이상의 이미지 채널 특성을 이용하여 여러 매트릭스 정보를 하나의 이미지에 겹쳐서 나타낼 수 있으며, 상술한 시간대와 요일의 개수는 정보 합산의 기준에 따라 조정될 수 있다.
도 6g를 참조하면, 제 7 실시 예에 따른 정보 처리 장치(100)는 시간 및 구매 히스토리에 대한 업종에 기초하여 제 1 정보를 2차원 형식으로 변환할 수 있다. 제 7 실시 예에서, 상술한 하나 이상의 기준은 시간 및 구매 히스토리에 대한 업종을 포함하고, 매트릭스 정보는 각각의 시간대에 대응되는 각각의 업종에 대한 고객의 구매 금액 및 구매 횟수에 대한 정보를 포함할 수 있다.
예를 들면, 정보 처리 장치(100)는 제 1 정보에 포함된 각 고객별 구매 정보를 기설정 기간 단위(예: 1개월 단위 또는 1주 단위)로 수합하여 이를 둘 이상의 채널(예: 3번째 차원 방향)으로 조합하여 고객의 월별 또는 주별로 변화하는 구매 패턴을 나타내는 제 7 변환 방법에 따라 2차원 형식의 매트릭스 정보를 획득할 수 있다(식별번호 607 참조).
예를 들면, 정보 처리 장치(100)는 매트릭스의 제 1축(예: X축)에 업종의 기준을 적용하고, 제 2축(예: Y축)에 요일(또는 시간대)의 기준을 적용하고, 제 3축(예: Z축)에 기간(예: 1주 단위)의 기준을 적용하고, 각 행렬 값에 고객의 구매 횟수의 기준을 적용하여, 각각의 매트릭스에 업종별 요일(또는 시간대)별 고객의 구매 횟수(또는 구매 금액에 대한 정보를 순차 배열하고, 복수의 매트릭스를 제 3축에 따라 정렬하여 매트릭스 정보에 주별(또는 월별) 구매 패턴이 나타나도록 할 수 있다.
제 7 실시 예에 따라 획득된 매트리스 정보는 고객의 차주 요일 시간대별 구매 가능성을 예측하기 위한 정보 특성 결정 모델에 이용될 수 있고, 상술한 시간대와 요일의 개수는 정보 합산의 기준에 따라 조정될 수 있다.
도 6h를 참조하면, 제 8 실시 예에 따른 정보 처리 장치(100)는 시간 및 구매 히스토리에 대한 상권에 기초하여 제 1 정보를 2차원 형식으로 변환할 수 있다. 제 8 실시 예에서, 상술한 하나 이상의 기준은 시간 및 구매 히스토리에 대한 상권을 포함하고, 매트릭스 정보는 각각의 주에 대응되는 각각의 상권에 대한 고객의 구매 여부에 대한 정보를 포함할 수 있다.
예를 들면, 정보 처리 장치(100)는 제 1 정보에 포함된 기설정 기간별로(예: 각 주별로) 고객의 구매가 발생한 가맹점이 위치한 상권별로 고객의 구매 여부를 코딩하여 1년 간의 위치 정보를 분석하고, 각 주별로 상권에 대한 고객의 구매 여부를 매트릭스에 배열하는 제 8 변환 방법에 따라 2차원 형식의 매트릭스 정보를 획득할 수 있다(식별번호 608 참조).
예를 들면, 정보 처리 장치(100)는 매트릭스의 제 1축(예: X축)에 상권의 기준을 적용하고, 제 2축(예: Y축)에 주의 기준을 적용하여, 매트릭스에 상권별 주별 고객의 구매 여부에 대한 정보를 순차 배열할 수 있다.
도 6i를 참조하면, 제 9 실시 예에 따른 정보 처리 장치(100)는 시간 및 구매 히스토리에 대한 상권에 기초하여 제 1 정보를 2차원 형식으로 변환할 수 있다. 제 9 실시 예에서, 상술한 하나 이상의 기준은 시간 및 구매 히스토리에 대한 상권을 포함하고, 매트릭스 정보는 각각의 주에 대응되는 각각의 상권에 대한 상기 고객의 구매 횟수에 대한 정보를 포함할 수 있다.
예를 들면, 정보 처리 장치(100)는 제 1 정보에 포함된 기설정 기간별로(예: 각 주별로) 고객의 구매가 발생한 가맹점이 위치한 상권별로 고객의 구매 횟수를 코딩하여 1년 간의 위치 정보를 분석하고, 각 주별로 상권에 대한 고객의 구매 횟수를 매트릭스에 배열하는 제 9 변환 방법에 따라 2차원 형식의 매트릭스 정보를 획득할 수 있다(식별번호 609 참조).
예를 들면, 정보 처리 장치(100)는 매트릭스의 제 1축(예: X축)에 상권의 기준을 적용하고, 제 2축(예: Y축)에 주의 기준을 적용하여, 매트릭스에 상권별 주별 고객의 구매 횟수에 대한 정보를 순차 배열할 수 있다.
제 8 내제 제 9 실시 예에 따라 획득된 매트리스 정보는 고객이 요일시간대별로 어느 위치에 있을지를 예측하기 위한 정보 특성 결정 모델에 이용될 수 있고, 이를 고객의 상권 선호 히스토리에 대한 학습에 반영하여 정보 특성 결정 모델을 개선시킬 수 있다. 또한, 고객의 예상 위치 및 과거 위치 히스토리를 고려한 구매 가능성을 예측하기 위한 정보 특성 결정 모델, 상권별 방문 고객군을 예측하기 위한 정보 특성 결정 모델 및 고객별 위치 히스토리 기반 상권별 방문 가능성을 예측하기 위한 정보 특성 결정 모델에 이용될 수 있고, 타겟팅에 고객 TPO별 예상 위치를 반영하여 정확성을 향상시킬 수 있다.
도 6j를 참조하면, 제 10 실시 예에 따른 정보 처리 장치(100)는 요일 및 시간대에 기초하여 제 1 정보를 2차원 형식으로 변환할 수 있다. 제 10 실시 예에서, 상술한 하나 이상의 기준은 요일 및 시간대를 포함하고, 매트릭스 정보는 각각의 요일 및 각각의 시간대에 대응되는 고객의 구매 횟수에 대한 정보를 포함할 수 있다.
예를 들면, 정보 처리 장치(100)는 제 1 정보에 포함된 각 고객 별로 기설정 기간별(예: 월별 또는 주별) 해당 기간 내에 발생한 구매건에 대해 업종별, 전체구매 또는 주요업종에 대해 시계열에 따라 배치하는 형태로 구매 횟수를 합산하여 매트릭스에 배열하는 제 10 변환 방법에 따라 2차원 형식의 매트릭스 정보를 획득할 수 있다(식별번호 610 참조).
예를 들면, 정보 처리 장치(100)는 매트릭스의 제 1축(예: X축)에 시간대의 기준을 적용하고, 제 2축(예: Y축)에 요일의 기준을 적용하여, 매트릭스에 시간대별 요일별 고객의 구매 횟수의 합에 대한 정보를 순차 배열할 수 있다.
제 10 실시 예에 따라 획득된 매트리스 정보는 고객의 구매 발생 패턴, 시간 및 요일 활용 패턴을 예측하기 위한 정보 특성 결정 모델에 이용될 수 있다. 또한, 정보 처리 장치(100)는 사용자(예: 관리자)에 의해 선택된 몇 가지 업종(예: 편의점, 온라인, 식당 등의 빈발 업종)을 R, G 및 B의 채널별로 분리하여 각각의 매트릭스에 배열할 수도 있다.
도 6k를 참조하면, 제 11 실시 예에 따른 정보 처리 장치(100)는 구매 히스토리에 대한 상권 및 업종에 기초하여 제 1 정보를 2차원 형식으로 변환할 수 있다. 제 11 실시 예에서, 상술한 하나 이상의 기준은 구매 히스토리에 대한 상권 및 업종을 포함하고, 매트릭스 정보는 각각의 상권 및 각각의 업종에 대응되는 상기 고객의 구매 횟수에 대한 정보를 포함할 수 있다.
예를 들면, 정보 처리 장치(100)는 제 1 정보에 포함된 각 고객별로 최근 3개월간 발생한 구매내역에 대하여 각 업종별 상권별로 고객의 구매 횟수를 합산하여 코딩하고, 주요상권에 따라 업종 별로 고객의 구매 횟수를 나타내는 제 11 변환 방법에 따라 2차원 형식의 매트릭스 정보를 획득할 수 있다(식별번호 612 참조).
예를 들면, 정보 처리 장치(100)는 매트릭스의 제 1축(예: X축)에 상권의 기준을 적용하고, 제 2축(예: Y축)에 업종의 기준을 적용하여, 매트릭스에 상권별 업종별 고객의 구매 횟수의 합에 대한 정보를 순차 배열할 수 있다. 일 실시 예에서, 상권은 행정구역을 포함할 수 있다.
이에 따라, 정보 처리 장치(100)는 고객이 어떤 상권에서 어떤 업종을 주로 소비하는 지에 대한 매트릭스 정보를 도출하여 사용자(예: 관리자)에 의해 선택된 몇 가지 업종(예: 편의점, 온라인, 식당 등의 빈발 업종)을 R, G 및 B의 채널별로 분리하여 각각의 매트릭스에 배열할 수도 있다.
제 11 실시 예에 따라 획득된 매트리스 정보는 고객이 어떤 상권에서 어떤 업종을 주로 소비하는지를 분석하고 상권별 업종별 고객의 구매 가능성을 예측하기 위한 정보 특성 결정 모델에 이용될 수 있다.
도 6l를 참조하면, 제 12 실시 예에 따른 정보 처리 장치(100)는 시간, 구매 히스토리에 대한 상권 및 업종에 기초하여 제 1 정보를 2차원 형식으로 변환할 수 있다.
제 12 실시 예에서, 상술한 하나 이상의 기준은 시간, 구매 히스토리에 대한 상권 및 업종을 포함하고, 매트릭스 정보는 각각의 시간대에 대응되는 각각의 업종에 대한 상기 고객의 구매 금액 또는 구매 횟수에 대한 정보를 포함하는 제 1 매트릭스 정보, 각각의 주에 대응되는 각각의 상권에 대한 상기 고객의 구매 여부 또는 구매 횟수에 대한 정보를 포함하는 제 2 매트릭스 정보 및 각각의 상권 및 각각의 업종에 대응되는 상기 고객의 구매 횟수에 대한 정보를 포함하는 제 3 매트릭스 정보를 포함할 수 있다.
예를 들면, 정보 처리 장치(100)는 제 1 정보에 포함된 기설정 기간별(예: 월별, 주별, 연도별 등) 기간 구획에 따라 해당 기간 동안 발생한 고객의 구매 이력의 업종, 요일, 시간 및 상권을 두 개의 쌍으로 구분하고, 해당 영역 별로 발생한 구매 횟수를 합산하여 코딩하고, 생성된 3 개의 매트릭스를 시간, 상권 및 업종 각각의 축에 따라 고객의 구매 횟수를 나타내는 제 12 변환 방법에 따라 2차원 형식의 매트릭스 정보를 획득할 수 있다(식별번호 612 참조).
예를 들면, 정보 처리 장치(100)는 매트릭스의 제 1축(예: X축)에 요일(또는 시간)의 기준을 적용하고, 제 2축(예: Y축)에 상권의 기준을 적용하고, 제 3축(예: Z축)에 업종의 기준을 적용하여, 매트릭스에 해당 축에 따른 고객의 구매 횟수의 합에 대한 정보를 순차 배열하고, 복수의 매트릭스를 복수의 축에 따라 정렬할 수 있다.
제 12 실시 예에 따라 획득된 매트리스 정보는 고객이 어떤 상권에서 어떤 업종을 어떤 시간대에 주로 소비하는지를 분석하고 상권별 업종별 시간대별 고객의 구매 가능성을 예측하기 위한 정보 특성 결정 모델에 이용될 수 있다.
도 6m을 참조하면, 제 13 실시 예에 따른 정보 처리 장치(100)는 시간, 구매 히스토리에 대한 상권 및 업종에 기초하여 제 1 정보를 변환할 수 있다.
예를 들면, 정보 처리 장치(100)는 상술한 제 5 변환 방법, 제 9 변환 방법 및 제 11 변환 방법 각각에 따라 2차원 형식의 제 1 매트릭스 정보, 제 2 매트릭스 정보 및 제 3 매트릭스 정보를 획득할 수 있고, 제 1축(예: X축)에 요일(또는 시간)의 기준을 적용하고, 제 2축(예: Y축)에 상권의 기준을 적용하고, 제 3축(예: Z축)에 업종의 기준을 적용하여, 제 1 매트릭스 정보, 제 2 매트릭스 정보 및 제 3 매트릭스 정보를 각 축에 따라 정렬할 수 있다.
도 6n을 참조하면, 제 14 실시 예에 따른 정보 처리 장치(100)는 시간, 구매 히스토리에 대한 상권 및 업종에 기초하여 제 1 정보를 변환할 수 있다.
예를 들면, 정보 처리 장치(100)는 상술한 제 1 변환 방법 내지 제 4 변환 방법 중 어느 하나에 따라 동일한 시간 구간을 가지는 기간별로 2차원 형식의 매트릭스 정보를 3개 획득하여 R, G 및 B의 다채널로 정렬할 수 있다.
예를 들면, 구매 속성 결정 장치(100)는 각 고객별로 고객이 구매한 카테고리 정보를 동일 기간(예: 일별, 주별, 월별 등)으로 수합하고, 해당 정보를 1주차에 구매 카테고리 정보를 R채널로, 2주차에 구매한 카테고리 정보를 G채널로, 3주차에 구매한 카테고리 정보를 B채널로 정렬할 수 있다.
이에 따라, 구매 속성 결정 장치(100)는 시점 정보에 관계 없이 하나의 값으로 축약되는 값들이 시점 정보를 기준으로 분리되어 축약이 감소되는 효과를 제공할 수 있다. 즉, 저장되는 정보의 양은 늘어나지만 저장 용량은 그대로 유지되거나 줄어들 수 있어 보다 효율적인 방식으로 이미지를 생성할 수 있다.
제 14 실시 예에 따라 획득된 매트리스 정보는 고객이 특정 기간(예: 최근 3주) 동안 구매한 카테고리 정보를 기반으로 차주에 구매할 카테고리 정보를 예측하기 위한 정보 특성 결정 모델에 이용될 수 있다.
한편, 상술한 방법은 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 또한, 상술한 방법에서 사용된 데이터의 구조는 컴퓨터로 읽을 수 있는 기록매체에 여러 수단을 통하여 기록될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 램, USB, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100: 정보 처리 장치
110: 통신부 120: 프로세서
130: 저장부

Claims (21)

  1. 정보 처리 방법에 있어서,
    1차원 형식으로 표현되고 범주형 변수를 포함하는 제 1 정보를 수신하는 단계;
    상기 제 1 정보에 포함된 상기 범주형 변수의 특성에 기초하여 상기 제 1 정보의 재정렬에 이용되는 하나 이상의 기준을 결정하는 단계;
    상기 하나 이상의 기준에 기초하여 상기 제 1 정보를 2차원 형식으로 변환하여 제 2 정보를 획득하는 단계; 및
    상기 2차원 형식으로 변환된 상기 제 2 정보에 CNN(Convolutional Neural Network)을 적용하여 상기 제 1 정보의 특성을 결정하는 단계;를 포함하고,
    상기 하나 이상의 기준에 따라 상기 제 1 정보를 제 1 매트릭스, 제 2 매트릭스 및 제 3 매트릭스로 분류하는 단계;
    상기 제 1 매트릭스, 상기 제 2 매트릭스 및 상기 제 3 매트릭스가 각각 R, G, B로 표현된 이미지를 획득하는 단계; 및
    상기 이미지에 상기 CNN을 적용하여 상기 제 1 정보의 특성을 결정하는 단계;를 더 포함하는, 방법.
  2. 제 1 항에 있어서,
    상기 CNN을 적용하여 상기 제 1 정보의 특성을 결정하는 단계는
    상기 제 2 정보에 포함된 정보의 위치 간의 국소적 특성에 기초하여 상기 제 1 정보의 속성을 결정하는, 방법.
  3. 제 2 항에 있어서,
    상기 범주형 변수는 명목형 변수를 포함하고,
    상기 제 1 정보는 상기 명목형 변수가 나타내는 변수들에 대한 정보가 순차적으로 제공되는 비트스트림을 포함하는, 방법.
  4. 제 3 항에 있어서,
    상기 범주형 변수는 순서형 변수를 더 포함하고,
    상기 하나 이상의 기준은 상기 순서형 변수의 기준이 되는 순서를 포함하는, 방법.
  5. 제 1 항에 있어서,
    상기 제 1 정보는 구매 정보를 포함하고, 상기 범주형 변수는 구매가 발생하는 제품에 대한 카테고리 정보를 포함하고,
    상기 하나 이상의 기준은 상기 카테고리를 포함하는, 방법.
  6. 제 1 항에 있어서,
    상기 제 1 정보는 구매 정보를 포함하고, 상기 범주형 변수는 구매가 발생하는 상권 또는 업종에 대한 정보를 포함하고,
    상기 하나 이상의 기준은 상기 상권 또는 상기 업종을 포함하는, 방법.
  7. 제 1 항에 있어서,
    상기 제 2 정보는 상기 제 1 정보를 포함하고,
    상기 CNN을 적용하여 상기 제 1 정보의 특성을 결정하는 단계는
    상기 제 2 정보를 필터링하여 주요 정보를 획득하는 단계; 및
    상기 주요 정보에 기초하여 상기 제 1 정보의 특성을 결정하는 단계;를 포함하는, 방법.
  8. 삭제
  9. 제 4 항에 있어서,
    상기 제 1 정보는 수치형 변수를 더 포함하고,
    상기 제 1 정보로부터 상기 범주형 변수로 구성된 제 1-1 정보 및 상기 수치형 변수로 구성된 제 1-2 정보를 획득하는 단계;
    상기 범주형 변수의 특성에 기초하여 상기 제 1-1 정보를 2차원 형식으로 변환하여 제 2-1 정보를 획득하는 단계;
    상기 수치형 변수의 특성에 기초하여 상기 제 1-2 정보를 2차원 형식으로 변환하여 제 2-2 정보를 획득하는 단계;
    상기 제 2-1 정보에 포함된 정보의 위치간 국소적 특성 및 상기 제 2-2 정보에 포함된 정보의 위치간 국소적 특성에 기초하여 상기 제 2-1 정보 및 상기 제 2-2 정보에 상기 CNN을 각각 적용하는 단계; 및
    상기 제 2-1 정보 및 상기 제 2-2 정보에 대한 상기 CNN의 적용 결과를 이용하여 상기 제 1 정보의 특성을 결정하는 단계;를 더 포함하는 방법.
  10. 제 9항에 있어서,
    상기 제 1-1 정보로부터 상기 명목형 변수로 구성된 제 1-3 정보 및 상기 순서형 변수로 구성된 제 1-4 정보를 획득하는 단계;
    상기 명목형 변수의 특성에 기초하여 상기 제 1-3 정보를 2차원 형식으로 변환하여 제 2-3 정보를 획득하는 단계;
    상기 순서형 변수의 특성에 기초하여 상기 제 1-4 정보를 2차원 형식으로 변환하여 제 2-4 정보를 획득하는 단계;
    상기 제 2-3 정보에 포함된 정보의 위치간 국소적 특성 및 상기 제 2-4 정보에 포함된 정보의 위치간 국소적 특성에 기초하여 상기 제 2-3 정보 및 상기 제 2-4 정보에 상기 CNN을 각각 적용하는 단계; 및
    상기 제 2-3 정보 및 상기 제 2-4 정보에 대한 상기 CNN의 적용 결과를 이용하여 상기 제 1 정보의 특성을 결정하는 단계;를 더 포함하고,
    상기 CNN을 적용하여 상기 제 1 정보의 특성을 결정하는 단계는
    제 2-2 정보에 포함된 정보의 위치 간의 관련성을 나타내는 제 1 국소적 특성, 제 2-3 정보에 포함된 정보의 위치 간의 관련성을 나타내는 제 2 국소적 특성 및 제 2-4 정보에 포함된 정보의 위치 간의 관련성을 나타내는 제 3 국소적 특성을 획득하고,
    상기 제 1 국소적 특성, 상기 제 2 국소적 특성 및 상기 제 3 국소적 특성에 서로 상이한 가중치를 적용하여 상기 제 1 정보의 특성을 결정하는, 방법.
  11. 정보 처리 장치에 있어서,
    1차원 형식으로 표현되고 범주형 변수를 포함하는 제 1 정보를 수신하는 통신부; 및
    상기 제 1 정보에 포함된 상기 범주형 변수의 특성에 기초하여 상기 제 1 정보의 재정렬에 이용되는 하나 이상의 기준을 결정하고, 상기 하나 이상의 기준에 기초하여 상기 제 1 정보를 2차원 형식으로 변환하여 제 2 정보를 획득하고, 상기 2차원 형식으로 변환된 상기 제 2 정보에 CNN(Convolutional Neural Network)을 적용하여 상기 제 1 정보의 특성을 결정하는 프로세서;를 포함하고,
    상기 프로세서는
    하나 이상의 기준에 따라 상기 제 1 정보를 제 1 매트릭스, 제 2 매트릭스 및 제 3 매트릭스로 분류하고,
    상기 제 1 매트릭스, 상기 제 2 매트릭스 및 상기 제 3 매트릭스가 각각 R, G, B로 표현된 이미지를 획득하고,
    상기 이미지에 상기 CNN을 적용하여 상기 제 1 정보의 특성을 결정하는, 장치.
  12. 제 11 항에 있어서,
    상기 프로세서는
    상기 제 2 정보에 포함된 정보의 위치 간의 국소적 특성에 기초하여 상기 제 1 정보의 속성을 결정하는, 장치.
  13. 제 12 항에 있어서,
    상기 범주형 변수는 명목형 변수를 포함하고,
    상기 제 1 정보는 상기 명목형 변수가 나타내는 변수들에 대한 정보가 순차적으로 제공되는 비트스트림을 포함하는, 장치.
  14. 제 13 항에 있어서,
    상기 범주형 변수는 순서형 변수를 더 포함하고,
    상기 하나 이상의 기준은 상기 순서형 변수의 기준이 되는 순서를 포함하는, 장치.
  15. 제 11 항에 있어서,
    상기 제 1 정보는 구매 정보를 포함하고, 상기 범주형 변수는 구매가 발생하는 제품에 대한 카테고리 정보를 포함하고,
    상기 하나 이상의 기준은 상기 카테고리를 포함하는, 장치.
  16. 제 11 항에 있어서,
    상기 제 1 정보는 구매 정보를 포함하고, 상기 범주형 변수는 구매가 발생하는 상권 또는 업종에 대한 정보를 포함하고,
    상기 하나 이상의 기준은 상기 상권 또는 상기 업종을 포함하는, 장치.
  17. 제 11 항에 있어서,
    상기 제 2 정보는 상기 제 1 정보를 포함하고,
    상기 프로세서는
    상기 제 2 정보를 필터링하여 주요 정보를 획득하고, 상기 주요 정보에 기초하여 상기 제 1 정보의 특성을 결정하는, 장치.
  18. 삭제
  19. 제 14 항에 있어서,
    상기 제 1 정보는 수치형 변수를 더 포함하고,
    상기 프로세서는
    상기 제 1 정보로부터 상기 범주형 변수로 구성된 제 1-1 정보 및 상기 수치형 변수로 구성된 제 1-2 정보를 획득하고,
    상기 범주형 변수의 특성에 기초하여 상기 제 1-1 정보를 2차원 형식으로 변환하여 제 2-1 정보를 획득하고,
    상기 수치형 변수의 특성에 기초하여 상기 제 1-2 정보를 2차원 형식으로 변환하여 제 2-2 정보를 획득하고,
    상기 제 2-1 정보에 포함된 정보의 위치간 국소적 특성 및 상기 제 2-2 정보에 포함된 정보의 위치간 국소적 특성에 기초하여 상기 제 2-1 정보 및 상기 제 2-2 정보에 상기 CNN을 각각 적용하고,
    상기 제 2-1 정보 및 상기 제 2-2 정보에 대한 상기 CNN의 적용 결과를 이용하여 상기 제 1 정보의 특성을 결정하는, 장치.
  20. 제 19항에 있어서,
    상기 프로세서는
    상기 제 1-1 정보로부터 상기 명목형 변수로 구성된 제 1-3 정보 및 상기 순서형 변수로 구성된 제 1-4 정보를 획득하고,
    상기 명목형 변수의 특성에 기초하여 상기 제 1-3 정보를 2차원 형식으로 변환하여 제 2-3 정보를 획득하고,
    상기 순서형 변수의 특성에 기초하여 상기 제 1-4 정보를 2차원 형식으로 변환하여 제 2-4 정보를 획득하고,
    상기 제 2-3 정보에 포함된 정보의 위치간 국소적 특성 및 상기 제 2-4 정보에 포함된 정보의 위치간 국소적 특성에 기초하여 상기 제 2-3 정보 및 상기 제 2-4 정보에 상기 CNN을 각각 적용하고,
    상기 제 2-3 정보 및 상기 제 2-4 정보에 대한 상기 CNN의 적용 결과를 이용하여 상기 제 1 정보의 특성을 결정하고,
    상기 프로세서는
    제 2-2 정보에 포함된 정보의 위치 간의 관련성을 나타내는 제 1 국소적 특성, 제 2-3 정보에 포함된 정보의 위치 간의 관련성을 나타내는 제 2 국소적 특성 및 제 2-4 정보에 포함된 정보의 위치 간의 관련성을 나타내는 제 3 국소적 특성을 획득하고,
    상기 제 1 국소적 특성, 상기 제 2 국소적 특성 및 상기 제 3 국소적 특성에 서로 상이한 가중치를 적용하여 상기 제 1 정보의 특성을 결정하는, 장치.
  21. 제 1 항 내지 제 7 항 및 제 9 항 내지 제 10 항 중 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020190173423A 2019-12-23 2019-12-23 정보 처리 방법 및 장치 KR102397882B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190173423A KR102397882B1 (ko) 2019-12-23 2019-12-23 정보 처리 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190173423A KR102397882B1 (ko) 2019-12-23 2019-12-23 정보 처리 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20210081161A KR20210081161A (ko) 2021-07-01
KR102397882B1 true KR102397882B1 (ko) 2022-05-16

Family

ID=76860226

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190173423A KR102397882B1 (ko) 2019-12-23 2019-12-23 정보 처리 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102397882B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230163858A (ko) 2022-05-24 2023-12-01 한국전력공사 이중 신경망 오토인코더 기반 이상탐지 방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101955361B1 (ko) * 2018-02-23 2019-03-08 주식회사 라인웍스 심층 신경망 기반의 보험심사청구명세서 학습방법 및 심사장치

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9818048B2 (en) * 2015-01-19 2017-11-14 Ebay Inc. Fine-grained categorization
KR20190031421A (ko) * 2017-09-16 2019-03-26 조영록 지정 항목 추천 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101955361B1 (ko) * 2018-02-23 2019-03-08 주식회사 라인웍스 심층 신경망 기반의 보험심사청구명세서 학습방법 및 심사장치

Also Published As

Publication number Publication date
KR20210081161A (ko) 2021-07-01

Similar Documents

Publication Publication Date Title
Sebastian Explaining job polarisation in Spain from a task perspective
Shmueli et al. Data mining for business intelligence: Concepts, techniques, and applications in Microsoft Office Excel with XLMiner
Verbeke et al. New insights into churn prediction in the telecommunication sector: A profit driven data mining approach
Mishra et al. Predictive analytics: A survey, trends, applications, oppurtunities & challenges
US6877012B2 (en) Method and system for database management for data mining
Chan Intelligent value-based customer segmentation method for campaign management: A case study of automobile retailer
US20090319931A1 (en) Visual Intelligence Systems
US20100153332A1 (en) Data mining model interpretation, optimization, and customization using statistical techniques
US10776738B1 (en) Natural experiment finder
Mansingh et al. Profiling internet banking users: A knowledge discovery in data mining process model based approach
WO2015170315A1 (en) An automatic statistical processing tool
Umayaparvathi et al. Attribute selection and customer churn prediction in telecom industry
Orogun et al. Predicting consumer behaviour in digital market: a machine learning approach
Yang et al. fullROC: An R package for generating and analyzing eyewitness-lineup ROC curves
KR102397882B1 (ko) 정보 처리 방법 및 장치
CN114139725A (zh) 业务对象的预测方法、设备及存储介质
Zhuang et al. Auto insurance business analytics approach for customer segmentation using multiple mixed-type data clustering algorithms
Swani et al. Predictive Modelling Analytics through Data Mining
US20140330620A1 (en) Computer-implemented system and method for benchmarking, accounting, analysis, and cost forecasting
KR102365504B1 (ko) 고객의 구매 속성을 결정하는 방법 및 장치
Selvamuthu et al. Descriptive statistics
US11568177B2 (en) Sequential data analysis apparatus and program
CN112818215A (zh) 产品数据的处理方法、装置、设备及存储介质
Han A study on a predictive model of customer defection in a hotel reservation website
Huang et al. Novel Approach to Tourism Analysis with Multiple Outcome Capability Using Rough Set Theory

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant