KR102154411B1 - A recommendation system for product purchase using collaborative filtering algorism and method thereof - Google Patents

A recommendation system for product purchase using collaborative filtering algorism and method thereof Download PDF

Info

Publication number
KR102154411B1
KR102154411B1 KR1020180169851A KR20180169851A KR102154411B1 KR 102154411 B1 KR102154411 B1 KR 102154411B1 KR 1020180169851 A KR1020180169851 A KR 1020180169851A KR 20180169851 A KR20180169851 A KR 20180169851A KR 102154411 B1 KR102154411 B1 KR 102154411B1
Authority
KR
South Korea
Prior art keywords
purchase
value
product
combination
customer
Prior art date
Application number
KR1020180169851A
Other languages
Korean (ko)
Other versions
KR20200080024A (en
Inventor
황욱연
Original Assignee
동아대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동아대학교 산학협력단 filed Critical 동아대학교 산학협력단
Priority to KR1020180169851A priority Critical patent/KR102154411B1/en
Publication of KR20200080024A publication Critical patent/KR20200080024A/en
Application granted granted Critical
Publication of KR102154411B1 publication Critical patent/KR102154411B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템 및 방법에 관한 것으로서, 복수 개의 상품에 대한 상품 정보를 저장하는 단계와, 소정 기간 동안 상기 복수 개의 상품 중 적어도 하나를 구매한 기존 고객에 대한 기존 고객 정보를 저장하는 단계와, 상기 복수 개의 상품 각각에 대한 상기 기존 고객의 상품별 구매 여부 및 구매 빈도수에 기초한 구매 데이터를 생성하는 단계와, 상기 구매 데이터에 양 또는 음의 피어슨 상관관계를 적용한 결과에 기초하여 소정 상품에 대한 신규 고객의 구매 가능성에 해당하는 추천 점수를 산출하는 단계를 포함하는 것을 특징으로 한다.
이에 따라, 소정 상품에 대한 추천 점수 산출 시 기존 고객이 해당 상품을 구매한 경우와 그렇지 않은 경우 각각의 피어슨 상관관계에 대한 데이터의 기여도 비율을 함께 고려하여 추천 성능을 향상시킬 수 있는 효과가 있다.
The present invention relates to a product purchase-related recommendation system and method using a collaborative filter algorithm, the step of storing product information for a plurality of products, and for existing customers who have purchased at least one of the plurality of products for a predetermined period. Storing existing customer information, generating purchase data based on whether or not the existing customer has purchased each product for each of the plurality of products and the frequency of purchase, and a result of applying a positive or negative Pearson correlation to the purchase data And calculating a recommendation score corresponding to a purchase possibility of a new customer for a predetermined product.
Accordingly, when calculating a recommendation score for a given product, it is possible to improve recommendation performance by considering the contribution ratio of data to each Pearson correlation when the existing customer purchased the product and when not.

Description

협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템 및 방법{A RECOMMENDATION SYSTEM FOR PRODUCT PURCHASE USING COLLABORATIVE FILTERING ALGORISM AND METHOD THEREOF}A recommendation system and method related to product purchase using a collaborative filter algorithm {A RECOMMENDATION SYSTEM FOR PRODUCT PURCHASE USING COLLABORATIVE FILTERING ALGORISM AND METHOD THEREOF}

본 발명은 협업적 필터 알고리즘을 이용한 소정 상품에 대한 추천 점수의 산출 시 기존 고객이 해당 상품을 구매한 경우와 구매하지 않은 경우를 모두 고려하여 추천 성능이 향상되는 상품 구매 관련 추천 시스템 및 방법에 관한 것이다.The present invention relates to a product purchase-related recommendation system and method in which recommendation performance is improved by considering both the case where the existing customer purchased the product and the case not purchased when calculating a recommendation score for a predetermined product using a collaborative filter algorithm. will be.

추천 시스템은 검색 분야, 광고 마케팅 분야, 전자 상거래 분야, 멀티미디어 컨텐츠 유통 분야 등의 온라인 비즈니스에서 서비스 공급자들의 경쟁력을 좌우하는 요소가 되고 있다. 개인화된 표적 추천 시스템은 온라인 상에서 고객이 원하는 아이템에 도달하기까지 걸리는 시간을 단축시키고 일대일 마케팅을 제공하여 소비를 유도하여 기업 성과에 큰 영향을 줄 수 있다.The recommendation system has become an element that determines the competitiveness of service providers in online businesses such as search, advertisement marketing, e-commerce, and multimedia content distribution. The personalized targeted recommendation system can significantly affect corporate performance by shortening the time it takes to reach an item that a customer wants online, and inducing consumption by providing one-on-one marketing.

지금까지 다양한 추천 기법들이 제안되어 왔지만, 그중 가장 성공적인 추천 기법 중 하나는 협업 필터링 추천 기법(Collaborative Filtering, CF)이다. 다수의 고객들의 구매 성향을 각자의 과거 구매 기록을 통해 대규모로 분석하고, 특정 고객과 구매 성향에서 높은 상관 관계를 가지는 다른 고객이 구매한 구매 기록을 참조하여 특정 고객에게 아이템을 추천하는 기법이다. 다수의 성공적인 전자 상거래 업체들이 이러한 협업 필터링 추천 기법을 이용하여 고객들에게 아이템을 추천하고 있다.Various recommendation techniques have been proposed so far, but one of the most successful recommendation techniques among them is Collaborative Filtering (CF). It is a technique that analyzes the purchase propensity of multiple customers on a large scale through their respective past purchase records, and recommends an item to a specific customer by referring to the purchase record purchased by another customer having a high correlation in the purchase propensity with a specific customer. Many successful e-commerce companies are recommending items to customers using this collaborative filtering recommendation technique.

그러나, 협업 필터링 추천 기법은 과거의 구매 기록을 바탕으로 추천하기 때문에, 아이템 수에 비해 구매 기록이 부족하여 상관 관계를 도출할 데이터가 희박(sparsity)할 경우에도 추천 성능이 떨어지고, 추천 점수의 고려 시 일반적으로 다른 고객이 상품을 구매한 경우만을 고려하고 있어 실질적인 상품 구매 가능성에 대한 예측 결과의 정확도가 떨어질 수 있다는 문제점이 있다.However, since the collaborative filtering recommendation method recommends based on past purchase records, the recommendation performance is degraded even when the data to derive the correlation is sparse due to insufficient purchase records compared to the number of items, and the recommendation score is considered. In general, there is a problem in that the accuracy of the prediction result for the actual product purchase possibility may be deteriorated because only the case where the product is purchased by another customer is considered.

KRKR 10-156768410-1567684 B1B1 KRKR 10-156721710-1567217 B1B1

본 발명의 목적은 상기 문제점을 해결하기 위한 것으로서, 소정 상품에 대한 추천 점수의 산출 시 기존 고객이 해당 상품을 구매한 경우와 구매하지 않은 경우를 모두 고려하여 추천 성능을 향상시킬 수 있는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템 및 방법을 제공하는 것을 목적으로 한다.An object of the present invention is to solve the above problems, and when calculating a recommendation score for a predetermined product, a collaborative filter capable of improving recommendation performance by considering both the case where the existing customer purchased the product and the case not purchased The object of the present invention is to provide a system and method for recommending product purchases using algorithms.

상기와 같은 목적을 달성하기 위한 본 발명의 일면에 따른 상품 구매 관련 추천 방법은, 복수 개의 상품에 대한 상품 정보를 저장하는 단계와, 소정 기간 동안 상기 복수 개의 상품 중 적어도 하나를 구매한 기존 고객에 대한 기존 고객 정보를 저장하는 단계와, 상기 복수 개의 상품 각각에 대한 상기 기존 고객의 상품별 구매 여부 및 구매 빈도수에 기초한 구매 데이터를 생성하는 단계와, 상기 구매 데이터에 양 또는 음의 피어슨 상관관계를 적용한 결과에 기초하여 소정 상품에 대한 신규 고객의 구매 가능성에 해당하는 추천 점수를 산출하는 단계를 포함하는 것을 특징으로 한다.A method for recommending product purchase according to an aspect of the present invention for achieving the above object includes storing product information for a plurality of products, and for existing customers who have purchased at least one of the plurality of products for a predetermined period. Storing existing customer information for each of the plurality of products, generating purchase data based on whether the existing customer has purchased each product and the frequency of purchase for each of the plurality of products, and applying a positive or negative Pearson correlation to the purchase data And calculating a recommendation score corresponding to a purchase possibility of a new customer for a predetermined product based on the result.

또한, 본 발명의 다른 일면에 따른 상품 구매 관련 추천 시스템은, 복수 개의 상품에 대한 상품 정보와, 소정 기간 동안 상기 복수 개의 상품 중 적어도 하나를 구매한 기존 고객에 대한 기존 고객 정보를 각각 저장하는 저장부와, 상기 복수 개의 상품 각각에 대한 상기 기존 고객의 상품별 구매 여부 및 구매 빈도수에 기초한 구매 데이터를 생성하는 구매 데이터 생성부와, 상기 구매 데이터에 양 또는 음의 피어슨 상관관계를 적용한 결과에 기초하여 소정 상품에 대한 신규 고객의 구매 가능성에 해당하는 추천 점수를 산출하는 추천 점수 산출부를 포함하는 것을 특징으로 한다.In addition, a product purchase-related recommendation system according to another aspect of the present invention is a storage for storing product information for a plurality of products and existing customer information for an existing customer who has purchased at least one of the plurality of products for a predetermined period. Based on the wealth, a purchase data generation unit that generates purchase data based on whether the existing customer purchases each product for each of the plurality of products and the purchase frequency, and a result of applying a positive or negative Pearson correlation to the purchase data It characterized in that it comprises a recommendation score calculation unit that calculates a recommendation score corresponding to the purchase possibility of a new customer for a predetermined product.

본 발명에 따르면, 소정 상품에 대한 추천 점수 산출 시 기존 고객이 해당 상품을 구매한 경우와 그렇지 않은 경우 각각의 피어슨 상관관계에 대한 데이터의 기여도 비율을 함께 고려하여 추천 성능을 향상시킬 수 있는 효과가 있다.According to the present invention, when calculating a recommendation score for a predetermined product, the effect of improving the recommendation performance by considering the contribution ratio of the data for each Pearson correlation when the existing customer purchased the product and when not. have.

또한, 본 발명에 따르면, 기존 고객의 구매 여부 및 구매 빈도에 기초한 신규 고객의 예상 구매 가능성에 따른 최적 조합을 선택하는 간단한 알고리즘을 통해 다양한 유형의 상품에 대한 추천 점수의 산출 시 범용적으로 적용 가능한 이점이 있다.In addition, according to the present invention, it is universally applicable when calculating recommendation scores for various types of products through a simple algorithm that selects the optimal combination according to the expected purchase possibility of new customers based on the purchase status of existing customers and the purchase frequency. There is an advantage.

도 1은 본 발명의 일 실시예에 따른 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템의 구성을 나타내는 블록도이고,
도 2는 도 1의 추천 점수 산출부에 의해 추천 점수를 산출하는 과정을 설명하기 위한 도면이고,
도 3은 본 발명의 일 실시예에 따른 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 방법을 나타낸 순서도이다.
1 is a block diagram showing the configuration of a product purchase-related recommendation system using a collaborative filter algorithm according to an embodiment of the present invention.
2 is a diagram for explaining a process of calculating a recommendation score by the recommendation score calculation unit of FIG. 1,
3 is a flow chart showing a method for recommending product purchases using a collaborative filter algorithm according to an embodiment of the present invention.

이상과 같은 본 발명에 대한 해결하려는 과제, 과제의 해결수단, 발명의 효과를 포함한 구체적인 사항들은 다음에 기재할 실시예 및 도면에 포함되어 있다. 본 발명의 이점 및 특징, 그리고 그것을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예를 참조하면 명확해질 것이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.Specific matters, including the problems to be solved, means for solving the problems, and effects of the invention as described above, are included in the following examples and drawings. Advantages and features of the present invention, and a method of achieving the same will become apparent with reference to the embodiments described later in detail together with the accompanying drawings. The same reference numerals refer to the same components throughout the specification.

도 1은 본 발명의 일 실시예에 따른 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템의 구성을 나타내는 블록도이고, 도 2는 도 1의 추천 점수 산출부에 의해 추천 점수를 산출하는 과정을 설명하기 위한 도면이다.1 is a block diagram showing the configuration of a product purchase-related recommendation system using a collaborative filter algorithm according to an embodiment of the present invention, and FIG. 2 is a diagram illustrating a process of calculating a recommendation score by the recommendation score calculation unit of FIG. 1 It is a drawing to do.

이하, 전술한 도면들을 참조하여 본 발명의 일 실시예에 따른 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템에 대해 설명하도록 한다.Hereinafter, a system for recommending a product purchase using a collaborative filter algorithm according to an embodiment of the present invention will be described with reference to the aforementioned drawings.

도 1을 참조하면, 본 발명의 일 실시예에 따른 상품 구매 관련 추천 시스템은 크게 저장부(100), 구매 데이터 생성부(300) 및 추천 점수 산출부(500)를 포함하여 구성된다.Referring to FIG. 1, a product purchase-related recommendation system according to an embodiment of the present invention largely includes a storage unit 100, a purchase data generation unit 300, and a recommendation score calculation unit 500.

저장부(100)는 소정의 데이터베이스 형태로 마련될 수 있으며, 복수 개의 상품에 대한 상품 정보(101)와, 소정 기간 동안 상기 복수 개의 상품 중 적어도 하나를 구매한 기존 고객(i)에 대한 기존 고객 정보(102)를 각각 저장한다.The storage unit 100 may be provided in a predetermined database format, product information 101 for a plurality of products, and an existing customer for an existing customer i who has purchased at least one of the plurality of products for a predetermined period Each of the information 102 is stored.

여기서, 상기 상품 정보(101)는 복수 개의 상품 각각의 상품명 및 상품 종류에 대한 정보를 포함하고, 상기 기존 고객 정보(102)는 고객명과 해당 고객이 구매한 상품에 대응되는 상품명에 대한 정보를 포함할 수 있다.Here, the product information 101 includes information on product names and product types of each of a plurality of products, and the existing customer information 102 includes information on a customer name and a product name corresponding to the product purchased by the customer. can do.

이때, 상기 상품 정보(101)에 대응되는 상품은 해당 상품을 구입하여 소유할 수 있는 유형의 물체에 한정되지 않으며, 소정의 티켓값을 지급하는 구매 행위를 통해 관람 또는 영위할 수 있는 무형적인 가치가 있는 문화상품(예컨대, 영화, 공연, 콘서트 등)을 포함할 수도 있다.At this time, the product corresponding to the product information 101 is not limited to a tangible object that can be owned by purchasing the product, and an intangible value that can be viewed or operated through a purchase act of paying a predetermined ticket value. It may also include cultural products (eg, movies, performances, concerts, etc.).

구매 데이터 생성부(300)는 저장부(100)에 기저장된 복수 개의 상품 각각에 대한 기존 고객(i)의 상품별 구매 여부(Wp) 및 구매 빈도수(Fp)에 기초한 구매 데이터(D)를 생성한다.The purchase data generation unit 300 generates purchase data D based on whether the existing customer i purchases each product (Wp) and the purchase frequency (Fp) for each of the plurality of products previously stored in the storage unit 100 .

여기서, 구매 데이터 생성부(300)는, 저장부(100)에 기저장된 복수 개의 상품 각각을 하나의 열로 하고 저장부(100)에 기저장된 복수의 고객 각각을 하나의 행으로 하는 소정의 제1 매트릭스(M1)를 구성한 후, 소정 고객의 상품별 구매 여부에 대한 이진수 형태의 상태값을 이에 대응되는 행과 열 위치에 매칭시킨 제1 구매 데이터(D1)를 생성할 수 있다.Here, the purchase data generation unit 300 includes a first predetermined number in which each of a plurality of products previously stored in the storage unit 100 is used as one column and each of a plurality of customers previously stored in the storage unit 100 is used as a row. After the matrix M1 is configured, first purchase data D 1 in which a status value in a binary form of whether a predetermined customer purchases each product may be matched with corresponding row and column positions may be generated.

이때, 상기 상태값은 1비트 방식의 이진수 형태로서, 해당 행에 대응되는 고객이 해당 열에 대응되는 상품을 구매한 경우에 1비트의 이진수인 1을 상태값으로 가지고, 구매하지 않은 경우에 상품을 구매한 경우의 상태값과 다른 1비트의 이진수인 0을 상태값으로 가지는 것일 수 있다.At this time, the status value is a 1-bit binary format, and when the customer corresponding to the row purchases the product corresponding to the column, the status value is 1, which is a 1-bit binary number. It may have a status value of 0, which is a 1-bit binary number different from the status value when purchased.

아래의 표 1은 전술한 제1 매트릭스(M1)에 대응되는 소정의 행렬 구성으로 생성된 제1 구매 데이터(D1)의 일례를 나타낸 것이다.Table 1 below shows an example of first purchase data D 1 generated in a predetermined matrix configuration corresponding to the aforementioned first matrix M1.

여기서, 제1 매트릭스(M1)는 저장부(100)에 기저장된 고객 정보의 총 개수가 'n'이고 상품 정보의 총 개수가 'm'인 경우, 총 n개의 행과 총 m개의 열로 구성되는 'n×m' 행렬 형태로 구성될 수 있다.Here, the first matrix M1 is composed of a total of n rows and a total of m columns when the total number of customer information previously stored in the storage unit 100 is'n' and the total number of product information is'm'. It can be configured in the form of an'n×m' matrix.

Figure 112018130624324-pat00001
Figure 112018130624324-pat00001

예컨대, 상기 표 1을 참조하면, 제1 구매 데이터(D)에서 '고객 1'의 경우 '상품 1'은 구매하고 '상품 2'는 비구매함에 따라, '상품 1'에 대응되는 1번째 행의 1번째 열의 위치에는 "1"의 상태값을 가지고, '상품 2'에 대응되는 1번째 행의 2번째 열의 위치에는 "0"의 상태값을 가질 수 있다.For example, referring to Table 1, in the case of'customer 1'in the first purchase data (D), as'product 1'is purchased and'product 2'is not purchased, the first row corresponding to'product 1' The position of the first column may have a status value of "1", and the position of the second column of the first row corresponding to "Product 2" may have a status value of "0".

또한, 제1 구매 데이터(D)에서 '고객 n'의 경우 '상품 2'는 비구매하고 '상품 m'은 구매함에 따라, '상품 2'에 대응되는 n번째 행의 2번째 열의 위치에는 "0"의 상태값을 가지고, '상품 m'에 대응되는 n번째 행의 m번째 열의 위치에는 "1"의 상태값을 가질 수 있다.In addition, in the case of'customer n'in the first purchase data (D), as'product 2'is non-purchased and'product m'is purchased, the position of the second column of the nth row corresponding to'product 2'is "0". It has a status value of ", and may have a status value of "1" at a position of the m-th column of the n-th row corresponding to'product m'.

여기서, 구매 데이터 생성부(300)는, 소정 상품에 대한 기존 고객(i)의 구매 여부에 따른 각각의 상태값을 하나의 열로 하고 해당 상품에 대한 신규 고객(a)의 구매 여부에 따른 각각의 상태값을 하나의 행으로 하는 소정의 제2 매트릭스(M2)를 구성한 후, 기존 고객(i)과 신규 고객(a)이 각각 소정의 상태값을 가질 때 이에 대응되는 경우의 구매 빈도수(Fp)를 이에 대응되는 행과 열 위치에 매칭시킨 제2 구매 데이터(D2)를 생성할 수 있다.Here, the purchase data generation unit 300 sets each state value according to whether or not the existing customer i has purchased a predetermined product as one column, and each state value according to whether or not a new customer a has purchased the product. After configuring a second matrix M2 with a status value as one row, when the existing customer i and the new customer a each have a predetermined status value, the number of purchases (Fp) corresponding thereto Second purchase data D 2 matching the corresponding row and column positions may be generated.

이때, 상기 상태값은 1비트 방식의 이진수 형태로서, 구매 데이터 생성부(300)는 소정의 행에 대응되는 신규 고객(a)의 구매 여부에 대한 제1 상태값("0" 또는 "1")과 소정의 열에 대응되는 기존 고객(i)의 구매 여부에 대한 제2 상태값("0" 또는 "1")을 포함하며, 어느 하나의 특정한 행과 열에 대응되는 위치에는 해당 행과 열에 각각 대응되는 상기 제1 상태값 및 상기 제2 상태값을 순차적으로 나열한 값, 즉 제1 상태값과 제2 상태값의 조합으로서 기존 고객과 신규 고객 모두 구매하지 않은 경우인 제1조합에 따른 이진비트열인 "00", 기존 고객은 구매하지 않고 신규 고객은 구매한 경우인 제2조합에 따른 이진비트열인 "01", 기존 고객은 구매하고 신규 고객은 구매하지 않은 경우인 제3조합에 따른 이진비트열인 "10", 기존 고객과 신규고객 모두 구매한 경우인 제4조합에 따른 이진비트열인 "11" 각각에 대응되는 구매 빈도수를 매칭시킨 제2 구매 데이터를 생성하는 것일 수 있다.At this time, the status value is a 1-bit binary number format, and the purchase data generation unit 300 includes a first status value ("0" or "1") of whether a new customer a corresponding to a predetermined row has been purchased. ) And a second status value ("0" or "1") of whether the existing customer (i) has purchased or not corresponding to a predetermined column, and at a position corresponding to any one specific row and column, each row and column Binary bits according to the first combination in which the corresponding first state value and the second state value are sequentially listed, that is, a combination of the first state value and the second state value, when neither existing customer nor new customer has purchased "00", which is a row, "01", which is a binary bit string according to the second combination, when the existing customer does not purchase and the new customer purchases, and the third combination is when existing customers purchase and new customers do not. The second purchase data may be generated by matching the purchase frequency corresponding to the binary bit string "10" and the binary bit string "11" according to the fourth combination when both existing and new customers have purchased.

아래의 표 2는 전술한 제2 매트릭스(M2)에 대응되는 소정의 행렬 구성으로 생성된 제2 구매 데이터(D)의 일례를 나타낸 것이다.Table 2 below shows an example of second purchase data D generated in a predetermined matrix structure corresponding to the above-described second matrix M2.

Figure 112018130624324-pat00002
Figure 112018130624324-pat00002

예컨대, 상기 표 2를 참조하면, 제2 구매 데이터(D)에서 '신규 고객(a)'이 소정 상품을 구매하지 않은 경우의 제1 상태값은 '0(비구매)'이 되고, '기존 고객(i)'이 해당 상품을 구매한 경우의 제2 상태값은 '1(구매)'이 될 때, 상기 제1 상태값('0') 및 상기 제2 상태값('1') 각각에 대응되는 행과 열에 대한 빈도는 "10"이 된다.For example, referring to Table 2, in the second purchase data D, the first state value when the'new customer (a)' does not purchase a predetermined product is '0 (non-purchase)', and the'existing customer (a)' (i) When '1 (purchase)' is the second status value when the product is purchased, each of the first status value ('0') and the second status value ('1') The frequency for the corresponding row and column is "10".

또한, '신규 고객(a)'이 해당 상품을 구매한 경우의 제1 상태값은 '1(구매)'이 되고, '기존 고객(i)'이 해당 상품을 구매한 경우의 제2 상태값은 '1(구매)'이 될 때, 상기 제1 상태값('1') 및 상기 제2 상태값('1') 각각에 대응되는 행과 열에 대한 빈도는 "11"이 된다.In addition, the first status value when the'new customer (a)' purchases the product is '1 (purchase)', and the second status value when the'existing customer (i)' purchases the product When is '1 (purchase)', the frequency of the row and column corresponding to each of the first state value ('1') and the second state value ('1') is "11".

이 경우, '신규 고객(a)'의 구매 여부와 관계없이 '기존 고객(i)'이 해당 상품을 구매한 경우의 상태값들을 합한 값은 "10"과 "11"의 합에 해당하는 값을 가질 수 있다.In this case, the sum of the status values when the'existing customer (i)' purchased the product regardless of whether the'new customer (a)' has purchased the product is the sum of "10" and "11" Can have

추천 점수 산출부(500)는 구매 데이터 생성부(300)에 의해 생성된 구매 데이터(D)에 양 또는 음의 피어슨 상관관계를 적용한 결과에 기초하여 소정 상품에 대한 신규 고객(a)의 구매 가능성에 해당하는 추천 점수(Pak)를 산출한다.The recommendation score calculation unit 500 is based on the result of applying a positive or negative Pearson correlation to the purchase data D generated by the purchase data generation unit 300, the possibility of purchasing a new customer a for a predetermined product. A recommendation score (P ak ) corresponding to is calculated.

여기서, 추천 점수 산출부(500)는, 기존 고객(i)이 상품을 구매한 경우(vij=1)와 기존 고객(i)이 상품을 구매하지 않은 경우(vij=0)에 각각 양의 피어슨 상관관계와 음의 피어슨 상관관계를 적용한 결과에 기초한 유사가중치값(w(a,i), 이하 'w'라고 함)을 모두 반영하여 추천 점수(Pak)를 산출할 수 있다.Here, the recommendation score calculation unit 500 is the amount when the existing customer (i) purchases the product (v ij = 1) and the existing customer (i) does not purchase the product (v ij = 0). A recommendation score (P ak ) can be calculated by reflecting all of the similar weight values (w(a,i), hereinafter referred to as'w') based on the result of applying the Pearson correlation of and the negative Pearson correlation.

이때, 상기 피어슨 상관관계는 두 연속형 변수 간의 선형 연관성을 검정하기 위해 사용되는 일종의 통계 분석 방법에 해당하는 것으로서, 예컨대, "-1" 내지 "+1" 사이의 상관계수가 도출되는데, 상기 상관계수가 "+1"에 가까운 양(+)의 값을 가지는 경우엔 두 변수 간에 양의 선형 연관성이 있는 것으로 판단하고, 상기 상관계수가 "-1"에 가까운 음(-)의 값을 가지는 경우엔 두 변수 간에 음의 선형 연관성이 있는 것으로 판단할 수 있다.At this time, the Pearson correlation corresponds to a kind of statistical analysis method used to test a linear association between two continuous variables, for example, a correlation coefficient between "-1" to "+1" is derived, the correlation If the coefficient has a positive (+) value close to "+1", it is determined that there is a positive linear relationship between the two variables, and the correlation coefficient has a negative (-) value close to "-1" It can be determined that there is a negative linear relationship between the two variables.

여기서, 추천 점수 산출부(500)는 전술한 유사가중치값(w)을 산출함에 있어서, 신규 고객(a)의 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제1 상태값(vaj)과 상품별 구매 여부에 대한 제1 평균 상태값(

Figure 112018130624324-pat00003
)의 제1 차분값(dv1)과, 기존 고객(i)의 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제2 상태값(vij)과 상품별 구매 여부에 대한 제2 평균 상태값(
Figure 112018130624324-pat00004
)의 제2 차분값(dv2)을 산출한 후, 복수 개의 상품 각각에 대하여 상기 제1 차분값(dv1)과 상기 제2 차분값(dv2)을 곱해서 합한 값을 분자로 하고, 복수 개의 상품 각각에 대한 상기 제1 차분값(dv1)의 제곱합과 상기 제2 차분값(dv2)의 제곱합의 곱의 제곱근값을 분모로 하여 유사가중치값(w)을 산출할 수 있다.Here, the recommendation score calculation unit 500 calculates the above-described similar weight value w, the first state value (v aj) for whether to purchase any one specific product among the plurality of products of the new customer (a). ) And the first average state value (
Figure 112018130624324-pat00003
) A first difference value (dv 1) and a second state value (v 2 average state of whether ij) and Product Purchase on any one of whether to buy a particular item of the plurality of items of an existing customer (i) the value(
Figure 112018130624324-pat00004
) A second difference value (dv 2) then calculated, and the for each of a plurality of product sum by multiplying said first difference value (dv 1) and the second difference value (dv 2) values in the molecule, a plurality of The similar weight value w may be calculated using a square root value of a product of the sum of squares of the first difference value dv 1 and the sum of squares of the second difference value dv 2 for each of the products as a denominator.

이와 관련하여, 상기 도 2를 참조하면, 저장부(100)에 기저장된 상품 정보(101)의 총 개수가 'm'개이고 기존 고객 정보(102)의 총 개수가 'n'개일 때, 'i×j'영역은 기존 고객(i)이 구매한 j번째 상품에 대응되는 상태값에 대한 행렬 데이터이고, 'a×j'영역은 신규 고객(a)이 구매한 j번째 상품에 대응되는 상태값에 대한 행렬 데이터일 수 있다.In this regard, referring to FIG. 2, when the total number of product information 101 previously stored in the storage unit 100 is'm' and the total number of existing customer information 102 is'n','i The xj' area is matrix data for the status value corresponding to the j-th product purchased by the existing customer (i), and the'a×j' area is the status value corresponding to the j-th product purchased by the new customer (a). May be matrix data for.

이때, j는 1부터 m까지에 해당하는 자연수 중 어느 하나의 값에 해당하고 i는 1부터 n까지에 해당하는 자연수 중 어느 하나의 값에 해당할 수 있다.In this case, j may correspond to any one of natural numbers from 1 to m, and i may correspond to any one of natural numbers from 1 to n.

이 경우, 'vij'는 'i×j'영역에 대응되는 값으로서 기존 고객(i)의 총 m개의 상품 중 j번째 순서에 대응되는 상품의 구매 여부에 대한 상태값을 나타내고, 'vaj'는 'a×j'영역에 대응되는 값으로서 신규 고객(a)의 총 m개의 상품 중 j번째 순서에 대응되는 상품의 구매 여부에 대한 상태값을 나타낼 수 있다.In this case,'v ij ' is a value corresponding to the'i ×j' area and indicates the status value of whether or not the product corresponding to the j-th order of the total m products of the existing customer (i) has been purchased, and'v aj 'Is a value corresponding to the'a×j' area, and may indicate a status value of whether or not a product corresponding to the j-th order of the total m products of the new customer a is purchased.

아래의 수학식 1은 전술한 유사가중치값(w)을 제1 상태값(vaj), 제1 평균 상태값(

Figure 112018130624324-pat00005
), 제2 상태값(vij) 및 제2 평균 상태값(
Figure 112018130624324-pat00006
)을 이용하여 수식으로 나타낸 것이다.Equation 1 below represents the above-described similar weight value (w) as a first state value (v aj ) and a first average state value (
Figure 112018130624324-pat00005
), the second state value (v ij ), and the second average state value (
Figure 112018130624324-pat00006
It is expressed as an equation using ).

Figure 112018130624324-pat00007
Figure 112018130624324-pat00007

또한, 아래의 수학식 2 및 수학식 3은 제1 평균 상태값(

Figure 112018130624324-pat00008
)과 제2 평균 상태값(
Figure 112018130624324-pat00009
)을 각각 수식으로 나타낸 것이다.In addition, Equation 2 and Equation 3 below are the first average state value (
Figure 112018130624324-pat00008
) And the second average state value (
Figure 112018130624324-pat00009
) Is represented by an equation.

Figure 112018130624324-pat00010
Figure 112018130624324-pat00010

Figure 112018130624324-pat00011
Figure 112018130624324-pat00011

여기서, 'm'은 상품의 총 개수를 나타내고, 'vaj'는 신규 고객(a)의 총 m개의 상품 중 j번째 순서에 대응되는 상품의 구매 여부에 대한 제1 상태값을 나타내고, 'vij'는 기존 고객(i)의 총 m개의 상품 중 j번째 순서에 대응되는 상품의 구매 여부에 대한 제2 상태값을 나타낸다.Here,'m' denotes the total number of products,'v aj ' denotes a first state value for whether a product corresponding to the j-th order of the total m products of the new customer (a) has been purchased, and'v ij ' represents a second state value of whether or not a product corresponding to the j-th order is purchased among a total of m products of the existing customer i.

아래의 표 3은 전술한 제2 상태값(vij)과 유사가중치값(w)의 부호에 따른 조합별로 대응되는 사칙 연산의 종류를 정리하여 나타낸 것이다.Table 3 below summarizes the types of four rule operations corresponding to combinations according to the signs of the above-described second state value (v ij ) and similar weight value (w).

이때, 상기 사칙 연산이 '덧셈(add(+))'인 경우엔 추천 점수(Pak)의 산출 시 해당 조합에 대응되는 유사가중치값(w)을 합산하고, 상기 사칙 연산이 '뺄셈(subtract(-))'인 경우엔 추천 점수(Pak)의 산출 시 해당 조합에 대응되는 유사가중치값(w)을 감산할 수 있다.In this case, when the four-rule operation is'add(+)', the similar weight value (w) corresponding to the combination is added when calculating the recommended score (P ak ), and the four-law operation is'subtract. In the case of (-))', the similar weight value (w) corresponding to the combination can be subtracted when calculating the recommendation score (P ak ).

Figure 112018130624324-pat00012
Figure 112018130624324-pat00012

예컨대, 상기 표 3을 참조하면, 제2 상태값(vij)이 "1"일 때, 즉, 기존 고객(i)이 j번째 상품을 구매하였을 때, 만일 제1 유사가중치값(w)이 양(w > 0)의 값을 가진다면, 추천 점수(Pak)의 산출 시 제1 유사가중치값(w)은 합산(+)되고, 반대로 제2 유사가중치값(w)이 음(w < 0)의 값을 가진다면, 추천 점수(Pak)의 산출 시 제2 유사가중치값(w)은 감산(-)될 수 있다.For example, referring to Table 3, when the second state value (v ij ) is "1", that is, when an existing customer (i) purchases the j-th product, if the first similar weight value (w) is If the value is positive (w> 0), when calculating the recommendation score (P ak ), the first similar weight value (w) is summed (+), and the second similar weight value (w) is negative (w < If it has a value of 0), the second similar weight value w may be subtracted (-) when calculating the recommendation score (P ak ).

또한, 제2 상태값(vij)이 "0"일 때, 즉, 기존 고객(i)이 j번째 상품을 구매하지 않았을 때, 만일 제1 유사가중치값(w)이 양(w > 0)의 값을 가진다면, 추천 점수(Pak)의 산출 시 제1 유사가중치값(w)은 감산(-)되고, 반대로 제2 유사가중치값(w)이 음(w < 0)의 값을 가진다면, 추천 점수(Pak)의 산출 시 제2 유사가중치값(w)은 합산(+)될 수 있다.In addition, when the second state value (v ij ) is "0", that is, when the existing customer (i) does not purchase the j-th product, if the first similar weight value (w) is positive (w> 0) If it has a value of, the first similar weight value (w) is subtracted (-) when calculating the recommendation score (P ak ), and conversely, the second similar weight value (w) is negative (w <0). If so, the second similarity weight value w may be summed (+) when calculating the recommendation score Pak .

구체적으로, 추천 점수 산출부(500)는, 기존 고객(i)이 소정 상품을 구매한 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제1 유사가중치값(w(a,i)1, 이하 w1이라고 함)과, 기존 고객(i)이 해당 상품을 구매한 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제2 유사가중치값(w(a,i)2, 이하 w2라고 함)과, 기존 고객(i)이 해당 상품을 구매하지 않은 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제3 유사가중치값(w(a,i)3, 이하 w3이라고 함)과, 기존 고객(i)이 해당 상품을 구매하지 않은 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제4 유사가중치값(w(a,i)4, 이하 w4라고 함)을 각각 산출한 후, 상기 제1 유사가중치값(w1), 상기 제2 유사가중치값(w2), 상기 제3 유사가중치값(w3) 및 상기 제4 유사가중치값(w4) 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 추천 점수(Pak)를 산출할 수 있다.Specifically, the recommendation score calculation unit 500 includes a first similar weight value (w(a, i) 1, or less) based on a result of applying a positive Pearson correlation when an existing customer i purchases a predetermined product. w 1 ) and a second similar weight value based on the result of applying negative Pearson correlation when the existing customer (i) purchased the product (w(a,i) 2, hereinafter referred to as w 2 ) And, a third similar weight value (w(a,i) 3, hereinafter referred to as w 3 ) based on the result of applying a positive Pearson correlation when the existing customer (i) did not purchase the product, and the existing customer (i) After calculating the fourth similar weight value (w(a,i) 4, hereinafter referred to as w 4 ) based on the result of applying the negative Pearson correlation when this product is not purchased , 1 Sum or subtract depending on whether each of the similar weight value (w 1 ), the second similar weight value (w 2 ), the third similar weight value (w 3 ), and the fourth similar weight value (w 4 ) is selected. A recommendation score (P ak ) may be calculated based on one result.

아래의 수학식 4는 기존 고객(i)과 신규 고객(a)의 구매 여부와 피어슨 상관관계를 고려한 추천 점수(Pak)에 대한 수식을 정리하여 나타낸 것이고, 수학식 5는 소정의 이득 상수 'ka'에 대한 수식을 유사가중치값(w)을 이용하여 나타낸 것이다.Equation 4 below is a summary of the formula for the recommendation score (P ak ) in consideration of the Pearson correlation and whether the existing customer (i) and the new customer (a) are purchased, and Equation 5 is a predetermined gain constant ' The equation for k a 'is expressed using the similar weight value (w).

Figure 112018130624324-pat00013
Figure 112018130624324-pat00013

Figure 112018130624324-pat00014
Figure 112018130624324-pat00014

여기서, w(a,i)1은 제1 유사가중치값이고, w(a,i)2는 제2 유사가중치값이고, w(a,i)3는 제3 유사가중치값이고, w(a,i)4는 제4 유사가중치값이다.Here, w(a,i) 1 is the first similar weight value, w(a,i) 2 is the second similar weight value, w(a,i) 3 is the third similar weight value, and w(a) ,i) 4 is the fourth pseudo-weighted value.

또한, l1은 제1 유사가중치값의 선택 여부를 나타낸 것이고, l2는 제2 유사가중치값의 선택 여부를 나타낸 것이고, l3은 제3 유사가중치값의 선택 여부를 나타낸 것이고, l4는 제4 유사가중치값의 선택 여부를 나타낸 것이며, 전술한 l1 내지 l4는 모두 선택한 경우엔 '1'의 값을 가지고 선택하지 않은 경우엔 '0'의 값을 가질 수 있다.In addition, l 1 indicates whether the first similar weight value is selected, l 2 indicates whether or not the second similar weight value is selected, l 3 indicates whether or not the third similar weight value is selected, and l 4 is It indicates whether or not the fourth similar weight value is selected, and the above-described l 1 to l 4 may have a value of '1' when all are selected, and a value of '0' when not selected.

이때, 상기 수학식 4에서 제1 유사가중치값(w1), 제2 유사가중치값(w2), 제3 유사가중치값(w3) 및 제4 유사가중치값(w4) 각각의 앞에 붙은 사칙 연산 부호('+' 또는 '-')는 전술한 상기 표 3에 기초한 것일 수 있다.At this time, in Equation 4, the first similar weight value (w 1 ), the second similar weight value (w 2 ), the third similar weight value (w 3 ), and the fourth similar weight value (w 4 ) The four rule operation codes ('+'or'-') may be based on Table 3 above.

이 경우, 기존 고객(i)이 j번째 상품을 구매하는 경우에 대응되는 제1 유사가중치값(w1)과 제2 유사가중치값(w2)은 각각 양(w > 0)의 값과 음(w < 0)의 값을 가짐에 따라, 제1 유사가중치값(w)은 추천 점수(Pak)의 산출 시 합산(+)되고 제2 유사가중치값(w)은 추천 점수(Pak)의 산출 시 감산(-)될 수 있다.In this case, the first similar weight value (w 1 ) and the second similar weight value (w 2 ) corresponding to the case where the existing customer (i) purchases the j-th product are positive (w> 0) and negative values, respectively. As it has a value of (w <0), the first similarity weight value (w) is summed (+) when calculating the recommendation score (P ak ), and the second similarity weight value (w) is the recommendation score (P ak ) It can be subtracted (-) when calculating.

또한, 기존 고객(i)이 j번째 상품을 구매하지 않는 경우에 대응되는 제3 유사가중치값(w3)과 제4 유사가중치값(w4)은 각각 양(w > 0)의 값과 음(w < 0)의 값을 가짐에 따라, 제3 유사가중치값(w3)은 추천 점수(Pak)의 산출 시 감산(-)되고 제4 유사가중치값(w4)은 추천 점수(Pak)의 산출 시 합산(+)될 수 있다.In addition, when the existing customer (i) does not purchase the j-th product, the corresponding third similarity weight value (w 3 ) and the fourth similarity weight value (w 4 ) are positive (w> 0) and negative values, respectively. As it has a value of (w <0), the third similarity weight value (w 3 ) is subtracted (-) when calculating the recommendation score (P ak ), and the fourth similarity weight value (w 4 ) is the recommendation score (P When ak ) is calculated, it can be summed (+).

한편, 추천 점수 산출부(500)는, 제1 유사가중치값(w1)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제1 기여도 계수를 곱한 제1값과, 제2 유사가중치값(w2)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제2 기여도 계수를 곱한 제2값과, 제3 유사가중치값(w3)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제3 기여도 계수를 곱한 제3값과, 제4 유사가중치값(w4)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제4 기여도 계수를 곱한 제4값을 각각 산출한 후, 상기 제1값, 상기 제2값, 상기 제3값 및 상기 제4값 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 추천 점수(Pak)를 산출할 수도 있다.On the other hand, the recommendation score calculation unit 500 is the purchase frequency according to the first similar weight value (w 1 ) and the corresponding status values (v ij ,v aj ) of each of the existing customers (i) and new customers (a) The first value multiplied by the first contribution factor based on (Fp), the second similar weight value (w 2 ), and the corresponding status values (v ij ,v aj ) of the existing customers (i) and new customers (a) The second value multiplied by the second contribution factor based on the purchase frequency (Fp) according to ), the third similar weight value (w 3 ), and the corresponding status value of each of the existing customers (i) and new customers (a) ( The third value multiplied by the third contribution factor based on the purchase frequency (Fp) according to v ij ,v aj ), the fourth similar weight value (w 4 ) and corresponding existing customers (i) and new customers (a) After calculating a fourth value obtained by multiplying the fourth contribution coefficient based on the purchase frequency Fp according to each state value (v ij ,v aj ), the first value, the second value, the third value, and A recommendation score Pak may be calculated based on a result of adding or subtracting each of the fourth values according to whether or not each of the fourth values is selected.

아래의 수학식 6은 기존 고객(i)과 신규 고객(a)의 구매 여부 및 구매 빈도에 따른 기여도와 피어슨 상관관계를 고려한 추천 점수(Pak)에 대한 수식을 정리하여 나타낸 것이다.Equation 6 below is a summary of the formula for the recommendation score (P ak ) in consideration of the Pearson correlation and the contribution according to the purchase or not and the purchase frequency of the existing customer (i) and the new customer (a).

Figure 112018130624324-pat00015
Figure 112018130624324-pat00015

또한, 아래의 수학식 7 내지 수학식 10은 전술한 상기 제1값, 상기 제2값, 상기 제3값 및 상기 제4값 각각에 대한 수식을 정리하여 나타낸 것이다.In addition, Equations 7 to 10 below are a summary of equations for each of the first value, the second value, the third value, and the fourth value described above.

Figure 112018130624324-pat00016
Figure 112018130624324-pat00016

Figure 112018130624324-pat00017
Figure 112018130624324-pat00017

Figure 112018130624324-pat00018
Figure 112018130624324-pat00018

Figure 112018130624324-pat00019
Figure 112018130624324-pat00019

여기서,

Figure 112018130624324-pat00020
은 제1 기여도 계수를 나타내고,
Figure 112018130624324-pat00021
은 제2 기여도 계수를 나타내고,
Figure 112018130624324-pat00022
은 제3 기여도 계수를 나타내고,
Figure 112018130624324-pat00023
은 제4 기여도 계수를 나타낸다.here,
Figure 112018130624324-pat00020
Represents the first contribution coefficient,
Figure 112018130624324-pat00021
Represents the second contribution coefficient,
Figure 112018130624324-pat00022
Represents the third contribution coefficient,
Figure 112018130624324-pat00023
Represents the fourth contribution factor.

이때, "00"은 제1조합에 따른 이진비트열인 "00"에 대응되는 구매 빈도수, 즉 기존 고객(i)의 상태값이 '0(비구매)'이고 신규 고객(a)의 상태값이 '0(비구매)'인 경우에 대응되는 위치인 (0,0)에 대한 구매 빈도수를 나타내고, "11"은 제4조합에 따른 이진비트열인 "11"에 대응되는 구매 빈도수, 즉 기존 고객(i)의 상태값이 '1(구매)'이고 신규 고객(a)의 상태값이 '1(구매)'인 경우에 대응되는 위치인 (1,1)에 대한 구매 빈도수를 나타내고, "10"은 제3조합에 따른 이진비트열인 "10"에 대응되는 구매 빈도수, 즉 기존 고객(i)의 상태값이 '1(구매)'이고 신규 고객(a)의 상태값이 '0(비구매)'인 경우에 대응되는 위치인 (1,0)에 대한 구매 빈도수를 나타내고, "01"은 제2조합에 따른 이진비트열인 "01"에 대응되는 구매빈도수, 즉 기존 고객(i)의 상태값이 '0(비구매)'이고 신규 고객(a)의 상태값이 '1(구매)'인 경우에 대응되는 위치인 (0,1)에 대한 구매 빈도수를 나타내는 것일 수 있다.At this time, "00" is the number of purchases corresponding to "00", which is a binary bit string according to the first combination, that is, the status value of the existing customer (i) is '0 (non-purchase)' and the status value of the new customer (a) is In the case of '0 (non-purchase)', it indicates the number of purchases for (0,0), which is the corresponding location, and "11" is the number of purchases corresponding to "11", which is a binary bit string according to the fourth combination, that is, existing customers When the status value of (i) is '1 (purchase)' and the status value of new customer (a) is '1 (purchase)', it indicates the frequency of purchase for the location (1,1), and "10 "Is the purchase frequency corresponding to "10", which is a binary bit string according to the third combination, that is, the status value of the existing customer (i) is '1 (purchase)' and the status value of the new customer (a) is '0 (non-purchase) )'represents the number of purchases for the location (1,0), which corresponds to the case of the second combination, and "01" is the number of purchases corresponding to the binary bit string "01" according to the second combination, that is, the In the case where the status value is '0 (non-purchase)' and the status value of the new customer (a) is '1 (purchase)', it may indicate the frequency of purchase for the corresponding location (0,1).

여기서, 전술한 바와 마찬가지로, w(a,i)1은 제1 유사가중치값이고, w(a,i)2는 제2 유사가중치값이고, w(a,i)3는 제3 유사가중치값이고, w(a,i)4는 제4 유사가중치값이다.Here, as described above, w(a,i) 1 is the first similar weight value, w(a,i) 2 is the second similar weight value, and w(a,i) 3 is the third similar weight value. And w(a,i) 4 is the fourth similar weight value.

또한, l1은 제1 유사가중치값들의 합의 선택 여부를 나타낸 것이고, l2는 제2 유사가중치값들의 합의 선택 여부를 나타낸 것이고, l3은 제3 유사가중치값들의 합의 선택 여부를 나타낸 것이고, l4는 제4 유사가중치값들의 합의 선택 여부를 나타낸 것이며, 전술한 l1 내지 l4는 모두 선택한 경우엔 '1'의 값을 가지고 선택하지 않은 경우엔 '0'의 값을 가질 수 있다.In addition, l 1 indicates whether the sum of the first similar weight values is selected, l 2 indicates whether or not the sum of the second similar weight values is selected, and l 3 indicates whether or not the sum of the third similar weight values is selected. l 4 indicates whether or not the sum of the fourth similar weight values is selected, and l 1 to l 4 described above may have a value of '1' when all are selected and a value of '0' when not selected.

이하, 전술한 본 발명에 따른 협업적 필터링 알고리즘을 이용한 상품 구매 관련 데이터 분석 장치를 이용하여 추천 점수를 산출하는 실시예에 대해 설명하면 다음과 같다.Hereinafter, an embodiment of calculating a recommendation score using the device for analyzing data related to product purchase using a collaborative filtering algorithm according to the present invention will be described as follows.

여기서, 본 발명에 따른 상품 구매 관련 데이터 분석 장치는 전술한 구성들, 즉, 저장부(100), 구매 데이터 생성부(300) 및 추천 점수 산출부(500)를 모두 포함할 수 있다.Here, the apparatus for analyzing data related to product purchase according to the present invention may include all of the above-described components, that is, the storage unit 100, the purchase data generation unit 300, and the recommendation score calculation unit 500.

아래의 표 4는 추천 점수 산출부(500)에 의해 도 2에 도시된 복수 개의 영역에 기초하여 각각의 영역별로 대응되는 고객수, 상품 개수, 구매횟수 및 구매 비율을 정리하여 나타낸 것이다.Table 4 below shows the number of customers, the number of products, the number of purchases, and the purchase rate corresponding to each area based on a plurality of areas shown in FIG. 2 by the recommendation score calculation unit 500.

Figure 112018130624324-pat00024
Figure 112018130624324-pat00024

또한, 아래의 표 5는 상기 표 4에 기초한 데이터를 상기 수학식 6에 적용하여 추천 점수(Pak)를 산출하되, 기존 고객(i)이 구매한 경우에 기초한 제1 유사가중치값(w1) 및 제2 유사가중치값(w2)만 반영하여 산출한 제1 추천 점수와, 기존 고객(i)이 구매한 경우에 기초한 제1 유사가중치값(w1) 및 제2 유사가중치값(w2)과 더불어 기존 고객(i)이 구매하지 않은 경우에 기초한 제3 유사가중치값(w3) 및 제4 유사가중치값(w4)을 모두 반영하여 산출한 제2 추천점수를 상품별(N=1,2,3,4,5)로 정리하여 나타낸 것이다.In addition, in Table 5 below, a recommendation score (P ak ) is calculated by applying the data based on Table 4 to Equation 6, but the first similar weight value (w 1 ) based on a purchase by an existing customer (i) ) And the second similarity weight value (w 2 ), the first recommendation score calculated by reflecting only the first similarity weight value (w 1 ) and the second similarity weight value (w) based on the purchase by an existing customer (i) In addition to 2 ), the second recommendation score calculated by reflecting both the third similar weight value (w 3 ) and the fourth similar weight value (w 4 ) based on the case that the existing customer (i) did not purchase is calculated by product (N = 1,2,3,4,5).

여기서, 제1 유사가중치값(w1)은 기존 고객(i)이 소정 상품을 구매한 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 것이고, 제2 유사가중치값(w2)은 기존 고객(i)이 해당 상품을 구매한 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 것이고, 제3 유사가중치값(w3)은 기존 고객(i)이 해당 상품을 구매하지 않은 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 것이고, 제4 유사가중치값(w4)은 기존 고객(i)이 해당 상품을 구매하지 않은 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 것일 수 있다.Here, the first similar weight value (w 1 ) is based on the result of applying a positive Pearson correlation when the existing customer (i) purchases a predetermined product, and the second similar weight value (w 2 ) is the existing customer ( i) is based on the result of applying negative Pearson correlation when the product is purchased, and the third pseudo-weight value (w 3 ) is positive Pearson correlation when the existing customer (i) does not purchase the product. It is based on a result of applying the relationship, and the fourth similar weight value w 4 may be based on a result of applying a negative Pearson correlation when the existing customer i does not purchase the corresponding product.

Figure 112018130624324-pat00025
Figure 112018130624324-pat00025

예컨대, 상기 표 5를 참조하여 제1 추천 정확도와 제2 추천 정확도를 비교해보면, 한 개의 상품을 추천한 경우, 두 개의 상품을 추천한 경우, 세 개의 상품을 추천한 경우, 네 개의 상품을 추천한 경우에서 제1 추천 정확도보다 제2 추천 정확도가 더 높은 것을 확인할 수 있으므로, 기존 고객(i)이 구매한 경우와 구매하지 않은 경우를 모두 고려하였을 때의 추천 성능이 가장 높다는 것을 알 수 있게 된다.For example, referring to Table 5 above, comparing the accuracy of the first recommendation and the accuracy of the second recommendation, when recommending one product, recommending two products, recommending three products, recommending four products. In one case, it can be seen that the second recommendation accuracy is higher than the first recommendation accuracy, so it can be seen that the recommendation performance is highest when both the case where the existing customer (i) purchased and the case not purchased is considered. .

도 3은 본 발명의 일 실시예에 따른 협업적 필터 알고리즘을 이용한 상품 구매 관련 데이터 분석 방법을 나타낸 순서도이다.3 is a flowchart showing a method of analyzing data related to product purchase using a collaborative filter algorithm according to an embodiment of the present invention.

이하, 도 3 및 전술한 도면들을 참조하여 본 발명의 일 실시예에 따른 협업적 필터 알고리즘을 이용한 상품 구매 관련 데이터 분석 방법에 대해 설명하도록 한다.Hereinafter, a method of analyzing product purchase-related data using a collaborative filter algorithm according to an embodiment of the present invention will be described with reference to FIG. 3 and the above-described drawings.

먼저, 복수 개의 상품에 대한 상품 정보를 저장한다(S100).First, product information for a plurality of products is stored (S100).

여기서, 상기 상품 정보(101)는 복수 개의 상품 각각의 상품명 및 상품 종류에 대한 정보를 포함할 수 있다.Here, the product information 101 may include information on product names and product types of each of a plurality of products.

이때, 상기 상품 정보(101)에 대응되는 상품은 해당 상품을 구입하여 소유할 수 있는 유형의 물체에 한정되지 않으며, 소정의 티켓값을 지급하는 구매 행위를 통해 관람 또는 영위할 수 있는 무형적인 가치가 있는 문화상품(예컨대, 영화, 공연, 콘서트 등)을 포함할 수도 있다.At this time, the product corresponding to the product information 101 is not limited to a tangible object that can be owned by purchasing the product, and an intangible value that can be viewed or operated through a purchase act of paying a predetermined ticket value. It may also include cultural products (eg, movies, performances, concerts, etc.).

다음으로, 소정 기간 동안 S100 단계에 기저장된 복수 개의 상품 중 적어도 하나를 구매한 기존 고객에 대한 기존 고객 정보를 저장한다(S200).Next, existing customer information about an existing customer who has purchased at least one of a plurality of products previously stored in step S100 for a predetermined period is stored (S200).

여기서, 상기 기존 고객 정보(102)는 고객명과 해당 고객이 구매한 상품에 대응되는 상품명에 대한 정보를 포함할 수 있다.Here, the existing customer information 102 may include information on a customer name and a product name corresponding to a product purchased by the customer.

다음으로, 복수 개의 상품 각각에 대한 기존 고객(i)의 상품별 구매 여부(Wp) 및 구매 빈도수(Fp)에 기초한 구매 데이터(D)를 생성한다(S300).Next, purchase data D based on whether the existing customer i purchases each product (Wp) and the purchase frequency (Fp) for each of the plurality of products is generated (S300).

여기서, 구매 데이터(D)를 생성하는 단계(S300)는, S100 단계에 기저장된 복수 개의 상품 각각을 하나의 열로 하고 S200 단계에 기저장된 복수의 고객 각각을 하나의 행으로 하는 소정의 제1 매트릭스(M1)를 구성한 후, 소정 고객의 상품별 구매 여부에 대한 이진수 형태의 상태값을 이에 대응되는 행과 열 위치에 매칭시킨 제1 구매 데이터(D1)를 생성하는 단계(S320)를 포함할 수 있다.Here, the step of generating the purchase data (D) (S300) is a predetermined first matrix in which each of the plurality of products previously stored in step S100 is used as one column, and each of the plurality of customers previously stored in step S200 is used as one row. After configuring (M1), it may include a step (S320) of generating first purchase data (D 1 ) in which a status value in the binary form of whether or not a predetermined customer purchases each product is matched with corresponding row and column positions. have.

이때, 상기 상태값은 1비트 방식의 이진수 형태로서, 해당 행에 대응되는 고객이 해당 열에 대응되는 상품을 구매한 경우에 '1'의 값을 가지고 그렇지 않은 경우에 '0'의 값을 가지는 것일 수 있다.At this time, the status value is a 1-bit binary format, and has a value of '1' when a customer corresponding to the row purchases a product corresponding to the column, and a value of '0' otherwise. I can.

또한, 구매 데이터(D)를 생성하는 단계(S300)는, 소정 상품에 대한 기존 고객(i)의 구매 여부에 따른 각각의 상태값을 하나의 열로 하고 해당 상품에 대한 신규 고객(a)의 구매 여부에 따른 각각의 상태값을 하나의 행으로 하는 소정의 제2 매트릭스(M2)를 구성한 후, 기존 고객(i)과 신규 고객(a)이 각각 소정의 상태값을 가질 때 이에 대응되는 경우의 구매 빈도수(Fp)를 이에 대응되는 행과 열 위치에 매칭시킨 제2 구매 데이터(D2)를 생성하는 단계(S340)를 더 포함할 수 있다.In addition, in the step of generating purchase data (D) (S300), each state value according to whether or not the existing customer (i) has purchased a predetermined product as one column, and the purchase of a new customer (a) for the product When a predetermined second matrix (M2) in which each status value according to whether or not is set as one row is constructed, when the existing customer (i) and the new customer (a) each have a predetermined status value, the corresponding A step S340 of generating second purchase data D 2 in which the purchase frequency Fp is matched to corresponding row and column positions (S340) may be further included.

이때, 상기 상태값은 1비트 방식의 이진수 형태로서, 소정의 행에 대응되는 신규 고객(a)의 구매 여부에 대한 제1 상태값("0" 또는 "1")과 소정의 열에 대응되는 기존 고객(i)의 구매 여부에 대한 제2 상태값("0" 또는 "1")을 포함하며, 어느 하나의 특정한 행과 열에 대응되는 위치에는 해당 행과 열에 각각 대응되는 상기 제1 상태값 및 상기 제2 상태값을 순차적으로 나열한 값, 예컨대, "00", "01", "10", "11"이 매칭되는 것일 수 있다.At this time, the status value is a 1-bit binary number format, and the first status value ("0" or "1") for the purchase of a new customer (a) corresponding to a predetermined row and an existing value corresponding to a predetermined column. It includes a second status value ("0" or "1") of whether the customer (i) has purchased or not, and the first status value corresponding to the row and column, respectively, at a position corresponding to any one specific row and column, and Values sequentially listing the second state values, for example, "00", "01", "10", and "11" may be matched.

다음으로, 상기 구매 데이터에 양 또는 음의 피어슨 상관관계를 적용한 결과에 기초하여 소정 상품에 대한 신규 고객의 구매 가능성에 해당하는 추천 점수(Pak)를 산출한다(S400).Next, based on the result of applying a positive or negative Pearson correlation to the purchase data, a recommendation score (P ak ) corresponding to the purchase possibility of a new customer for a predetermined product is calculated (S400).

여기서, 추천 점수(Pak)를 산출하는 단계(S400)는, 기존 고객(i)이 상품을 구매한 경우(vij=1)와 기존 고객(i)이 상품을 구매하지 않은 경우(vij=0)에 각각 양의 피어슨 상관관계와 음의 피어슨 상관관계를 적용한 결과에 기초한 유사가중치값(w(a,i), 이하 'w'라고 함)을 모두 반영하여 추천 점수(Pak)를 산출할 수 있다.Here, the step (S400) of calculating the recommendation score (P ak ) is when the existing customer (i) purchases the product (v ij = 1) and the existing customer (i) does not purchase the product (v ij =0), each of the similar weight values (w(a,i), hereinafter referred to as'w') based on the result of applying the positive and negative Pearson correlations are reflected and the recommendation score (P ak ) is calculated. Can be calculated.

이때, 상기 피어슨 상관관계는 두 연속형 변수 간의 선형 연관성을 검정하기 위해 사용되는 일종의 통계 분석 방법에 해당하는 것으로서, 예컨대, "-1" 내지 "+1" 사이의 상관계수가 도출되는데, 상기 상관계수가 "+1"에 가까운 양(+)의 값을 가지는 경우엔 두 변수 간에 양의 선형 연관성이 있는 것으로 판단하고, 상기 상관계수가 "-1"에 가까운 음(-)의 값을 가지는 경우엔 두 변수 간에 음의 선형 연관성이 있는 것으로 판단할 수 있다.At this time, the Pearson correlation corresponds to a kind of statistical analysis method used to test a linear association between two continuous variables, for example, a correlation coefficient between "-1" to "+1" is derived, the correlation If the coefficient has a positive (+) value close to "+1", it is determined that there is a positive linear relationship between the two variables, and the correlation coefficient has a negative (-) value close to "-1" It can be determined that there is a negative linear relationship between the two variables.

여기서, 추천 점수(Pak)를 산출하는 단계(S400)는, 전술한 유사가중치값(w)을 산출함에 있어서, 신규 고객(a)의 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제1 상태값(vaj)과 상품별 구매 여부에 대한 제1 평균 상태값(

Figure 112018130624324-pat00026
)의 제1 차분값(dv1)과, 기존 고객(i)의 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제2 상태값(vij)과 상품별 구매 여부에 대한 제2 평균 상태값(
Figure 112018130624324-pat00027
)의 제2 차분값(dv2)을 산출한 후, 복수 개의 상품 각각에 대하여 상기 제1 차분값(dv1)과 상기 제2 차분값(dv2)을 곱해서 합한 값을 분자로 하고, 복수 개의 상품 각각에 대한 상기 제1 차분값(dv1)의 제곱합과 상기 제2 차분값(dv2)의 제곱합의 곱의 제곱근값을 분모로 하여 유사가중치값(w)을 산출할 수 있다.Here, in the step (S400) of calculating the recommendation score (P ak ), in calculating the above-described similar weight value (w), whether or not to purchase any one specific product among a plurality of products of the new customer (a) The first state value (v aj ) and the first average state value (
Figure 112018130624324-pat00026
) A first difference value (dv 1) and a second state value (v 2 average state of whether ij) and Product Purchase on any one of whether to buy a particular item of the plurality of items of an existing customer (i) the value(
Figure 112018130624324-pat00027
) A second difference value (dv 2) then calculated, and the for each of a plurality of product sum by multiplying said first difference value (dv 1) and the second difference value (dv 2) values in the molecule, a plurality of The similar weight value w may be calculated using a square root value of a product of the sum of squares of the first difference value dv 1 and the sum of squares of the second difference value dv 2 for each of the products as a denominator.

이와 관련하여, 상기 도 2를 참조하면, S100 단계 및 S200 단계에 각각 기저장된 상품 정보(101)의 총 개수가 'm'개이고 기존 고객 정보(102)의 총 개수가 'n'개일 때, 'i×j'영역은 기존 고객(i)이 구매한 j번째 상품에 대응되는 상태값에 대한 행렬 데이터이고, 'a×j'영역은 신규 고객(a)이 구매한 j번째 상품에 대응되는 상태값에 대한 행렬 데이터일 수 있다.In this regard, referring to FIG. 2, when the total number of product information 101 previously stored in step S100 and step S200 is'm' and the total number of existing customer information 102 is'n', ' The i×j' area is the matrix data for the status value corresponding to the j-th product purchased by the existing customer (i), and the'a×j' area is the status corresponding to the j-th product purchased by the new customer (a). It may be matrix data for values.

이때, j는 1부터 m까지에 해당하는 자연수 중 어느 하나의 값에 해당하고 i는 1부터 n까지에 해당하는 자연수 중 어느 하나의 값에 해당할 수 있다.In this case, j may correspond to any one of natural numbers from 1 to m, and i may correspond to any one of natural numbers from 1 to n.

이 경우, 'vij'는 'i×j'영역에 대응되는 값으로서 기존 고객(i)의 총 m개의 상품 중 j번째 순서에 대응되는 상품의 구매 여부에 대한 상태값을 나타내고, 'vaj'는 'a×j'영역에 대응되는 값으로서 신규 고객(a)의 총 m개의 상품 중 j번째 순서에 대응되는 상품의 구매 여부에 대한 상태값을 나타낼 수 있다.In this case,'v ij ' is a value corresponding to the'i ×j' area and indicates the status value of whether or not the product corresponding to the j-th order of the total m products of the existing customer (i) has been purchased, and'v aj 'Is a value corresponding to the'a×j' area, and may indicate a status value of whether or not a product corresponding to the j-th order of the total m products of the new customer a is purchased.

구체적으로, 추천 점수(Pak)를 산출하는 단계(S400)는, 기존 고객(i)이 소정 상품을 구매한 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제1 유사가중치값(w(a,i)1, 이하 w1이라고 함)과, 기존 고객(i)이 해당 상품을 구매한 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제2 유사가중치값(w(a,i)2, 이하 w2라고 함)과, 기존 고객(i)이 해당 상품을 구매하지 않은 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제3 유사가중치값(w(a,i)3, 이하 w3이라고 함)과, 기존 고객(i)이 해당 상품을 구매하지 않은 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제4 유사가중치값(w(a,i)4, 이하 w4라고 함)을 각각 산출한 후, 상기 제1 유사가중치값(w1), 상기 제2 유사가중치값(w2), 상기 제3 유사가중치값(w3) 및 상기 제4 유사가중치값(w4) 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 추천 점수(Pak)를 산출할 수 있다.Specifically, the step (S400) of calculating the recommendation score (P ak ) is a first similar weight value (w(a)) based on the result of applying a positive Pearson correlation when an existing customer (i) purchases a predetermined product. ,i) 1, hereinafter referred to as w 1 ) and a second similar weight value (w(a,i) 2, based on the result of applying negative Pearson correlation when an existing customer (i) purchased the product) , Hereinafter referred to as w 2 ) and a third similar weight value (w(a,i) 3, hereinafter referred to as w 3 ) based on the result of applying a positive Pearson correlation when the existing customer (i) did not purchase the product. ) And the fourth similar weight value (w(a,i) 4, hereinafter referred to as w 4 ) based on the result of applying the negative Pearson correlation when the existing customer (i) did not purchase the product, respectively. After calculation, each of the first similar weight value (w 1 ), the second similar weight value (w 2 ), the third similar weight value (w 3 ), and the fourth similar weight value (w 4 ) is selected. Depending on whether or not, a recommendation score (P ak ) may be calculated based on the result of adding or subtracting.

이와 관련하여, 기존 고객(i)과 신규 고객(a)의 구매 여부와 피어슨 상관관계를 고려한 추천 점수(Pak)에 대한 수식에 해당하는 수학식 4를 이용할 수 있으며, 상기 수학식 4에 관한 구체적인 내용은 이미 서술한 바 생략하도록 한다.In this regard, Equation 4 corresponding to the equation for the recommendation score (P ak ) in consideration of the Pearson's correlation and whether the existing customer (i) and the new customer (a) are purchased, can be used, and Details are omitted as already described.

이 경우, 기존 고객(i)이 j번째 상품을 구매하는 경우에 대응되는 제1 유사가중치값(w1)과 제2 유사가중치값(w2)은 각각 양(w > 0)의 값과 음(w < 0)의 값을 가짐에 따라, 제1 유사가중치값(w)은 추천 점수(Pak)의 산출 시 합산(+)되고 제2 유사가중치값(w)은 추천 점수(Pak)의 산출 시 감산(-)될 수 있다.In this case, the first similar weight value (w 1 ) and the second similar weight value (w 2 ) corresponding to the case where the existing customer (i) purchases the j-th product are positive (w> 0) and negative values, respectively. As it has a value of (w <0), the first similarity weight value (w) is summed (+) when calculating the recommendation score (P ak ), and the second similarity weight value (w) is the recommendation score (P ak ) It can be subtracted (-) when calculating.

한편, 추천 점수(Pak)를 산출하는 단계(S400)는, 제1 유사가중치값(w1)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제1 기여도 계수를 곱한 제1값(p1)과, 제2 유사가중치값(w2)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제2 기여도 계수를 곱한 제2값(p2)과, 제3 유사가중치값(w3)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제3 기여도 계수를 곱한 제3값(p3)과, 제4 유사가중치값(w4)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제4 기여도 계수를 곱한 제4값(p4)을 각각 산출한 후, 상기 제1값(p1), 상기 제2값(p2), 상기 제3값(p3) 및 상기 제4값(p4) 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 추천 점수(Pak)를 산출할 수도 있다.On the other hand, in the step (S400) of calculating the recommendation score (P ak ), the first similar weight value (w 1 ) and the corresponding state values (v ij ,v) of the existing customers (i) and new customers (a) The first value (p 1 ) multiplied by the first contribution coefficient based on the purchase frequency (Fp) according to aj ), the second similar weight value (w 2 ), and corresponding existing customers (i) and new customers (a) The second value (p 2 ) multiplied by the second contribution factor based on the purchase frequency (Fp) according to each status value (v ij ,v aj ), the third similarity weight value (w 3 ), and the corresponding existing customers The third value (p 3 ) multiplied by the third contribution coefficient based on the purchase frequency (Fp) according to the status value (v ij ,v aj ) of each of the (i) and new customers (a), and the fourth similar weight value ( w 4 ) and the fourth value (p 4) multiplied by the fourth contribution coefficient based on the purchase frequency (Fp) according to the status values (v ij ,v aj ) of each of the existing customers (i) and new customers (a) corresponding thereto. ) Is calculated, and then summed or added according to the selection of each of the first value (p 1 ), the second value (p 2 ), the third value (p 3 ), and the fourth value (p 4 ). A recommendation score (P ak ) may be calculated based on the subtraction result.

이와 관련하여, 기존 고객(i)과 신규 고객(a)의 구매 여부 및 구매 빈도에 따른 기여도와 피어슨 상관관계를 고려한 추천 점수(Pak)에 대한 수식에 해당하는 수학식 6을 이용할 수 있으며, 상기 수학식 6에 관한 구체적인 내용은 이미 서술한 바 생략하도록 한다.In this regard, Equation 6 corresponding to the formula for the recommendation score (P ak ) in consideration of the Pearson correlation and the contribution according to the purchase status and purchase frequency of the existing customer (i) and the new customer (a) can be used, Detailed contents of Equation 6 will be omitted as already described.

이에 따라, 전술한 본 발명에 의하면, 소정 상품에 대한 추천 점수 산출 시 기존 고객이 해당 상품을 구매한 경우와 그렇지 않은 경우 각각의 피어슨 상관관계에 대한 데이터의 기여도 비율을 함께 고려하여 추천 성능을 향상시킬 수 있는 효과가 있다.Accordingly, according to the present invention described above, when calculating a recommendation score for a predetermined product, when the existing customer purchases the product and when not, the recommendation performance is improved by considering the contribution ratio of the data to each Pearson correlation. There is an effect that can be made.

또한, 본 발명에 의하면, 기존 고객의 구매 여부 및 구매 빈도에 기초한 신규 고객의 예상 구매 가능성에 따른 최적 조합을 선택하는 간단한 알고리즘을 통해 다양한 유형의 상품에 대한 추천 점수의 산출 시 범용적으로 적용 가능한 이점이 있다.In addition, according to the present invention, through a simple algorithm that selects the optimal combination according to the expected purchase possibility of new customers based on the purchase status of existing customers and the frequency of purchase, it is universally applicable when calculating recommendation scores for various types of products. There is an advantage.

이상, 바람직한 실시예를 통하여 본 발명에 관하여 상세히 설명하였으나, 본 발명은 이에 한정되는 것은 아니며 특허청구범위 내에서 다양하게 실시될 수 있다.As described above, the present invention has been described in detail through preferred embodiments, but the present invention is not limited thereto and may be variously implemented within the scope of the claims.

특히, 전술한 내용은 후술할 발명의 청구범위를 더욱 잘 이해할 수 있도록 본 발명의 특징과 기술적 강점을 다소 폭넓게 상술하였으므로, 상술한 본 발명의 개념과 특정 실시예는 본 발명과 유사 목적을 수행하기 위한 다른 형상의 설계나 수정의 기본으로써 즉시 사용될 수 있음이 해당 기술 분야의 숙련된 사람들에 의해 인식되어야 한다.In particular, the above-described content has been somewhat broadly described in terms of features and technical strengths of the present invention so that the claims of the invention to be described later can be better understood. Therefore, the concept and specific embodiments of the present invention described above are intended to serve similar purposes to the present invention. It should be recognized by those skilled in the art that it can be used immediately as a basis for designing or modifying other shapes for.

또한, 상기에서 기술된 실시예는 본 발명에 따른 하나의 실시예일 뿐이며, 해당 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술적 사상의 범위에서 다양한 수정 및 변경된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 따라서, 개시된 실시예는 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 하고, 이러한 다양한 수정 및 변경 또한 본 발명의 기술적 사상의 범위에 속하는 것으로 전술한 본 발명의 청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.In addition, it is understood that the above-described embodiment is only one embodiment according to the present invention, and can be implemented in various modifications and altered forms within the scope of the technical idea of the present invention by those of ordinary skill in the art. You can understand. Accordingly, the disclosed embodiments should be considered from a descriptive point of view rather than a limiting point of view, and such various modifications and changes are also indicated in the claims of the present invention as falling within the scope of the technical idea of the present invention, and the scope equivalent thereto All differences within will be construed as being included in the present invention.

100: 저장부
300: 구매 데이터 생성부
500: 추천 점수 산출부
100: storage
300: purchase data generation unit
500: recommendation score calculation unit

Claims (10)

복수 개의 상품에 대한 상품 정보와, 소정 기간 동안 상기 복수 개의 상품 중 적어도 하나를 구매한 기존 고객에 대한 기존 고객 정보를 각각 저장하는 저장부, 상기 복수 개의 상품 각각에 대한 상기 기존 고객의 상품별 구매 여부 및 구매 빈도수에 기초한 구매 데이터를 생성하는 구매 데이터 생성부 및 상기 구매 데이터에 기초하여 상기 기존 고객이 구매한 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제1 유사가중치값과, 상기 기존 고객이 구매한 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제2 유사가중치값과, 상기 기존 고객이 구매하지 않은 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제3 유사가중치값과, 상기 기존 고객이 구매하지 않은 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제4 유사가중치값을 각각 산출하며, 상기 제1 유사가중치값, 상기 제2 유사가중치값, 상기 제3 유사가중치값 및 상기 제4 유사가중치값 각각의 선택 여부에 따라 선택된 유사가중치값을 합산 또는 감산한 결과에 기초하여 추천 점수를 산출하는 추천 점수 산출부를 포함하는 시스템을 이용한 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 방법에 관한 것으로,
상기 저장부에서 복수 개의 상품에 대한 상품 정보를 저장하는 단계;
상기 저장부에서 소정 기간 동안 상기 복수 개의 상품 중 적어도 하나를 구매한 기존 고객에 대한 기존 고객 정보를 저장하는 단계;
상기 구매 데이터 생성부에서 기저장된 고객 정보와 대응되는 갯수의 행과 상기 복수 개의 상품 각각에 대응되는 갯수의 열로 구성되며, 각 고객의 어느 하나의 상품에 대한 구매여부에 따라 상기 고객에 대응되는 행에서 상기 상품에 대응되는 열에 기존 고객이 구매한 경우 1비트의 이진수인 상태값을 가지며, 기존 고객이 구매하지 않은 경우 상기 상태값과는 다른 1비트의 이진수인 상태값을 가지는 제1 구매 데이터를 생성하는 단계;
상기 구매 데이터 생성부에서 소정 상품에 대한 신규 고객의 구매 여부에 따른 제1 상태값과 대응되는 두 개의 행과 상기 상품에 대한 기존 고객의 구매 여부에 따른 제2 상태값과 대응되는 두 개의 열로 구성되며, 제1 상태값과 제2 상태값에 대응되는 행과 열의 위치에, 상기 제1 상태값과 상기 제2 상태값의 조합으로서 기존 고객과 신규 고객 모두 구매하지 않은 경우인 제1조합에 따른 이진비트열, 기존 고객은 구매하지 않고 신규 고객은 구매한 경우인 제2조합에 따른 이진비트열, 기존 고객은 구매하고 신규 고객은 구매하지 않은 경우인 제3조합에 따른 이진비트열, 기존 고객과 신규 고객 모두 구매한 경우인 제4조합에 따른 이진비트열 각각에 대응되는 구매 빈도수를 매칭시킨 제2 구매 데이터를 생성하는 단계;
상기 추천 점수 산출부에서 상기 기존 고객이 상기 상품을 구매한 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제1 유사가중치값과, 상기 기존 고객이 상기 상품을 구매한 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제2 유사가중치값과, 상기 기존 고객이 상기 상품을 구매하지 않은 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제3 유사가중치값과, 상기 기존 고객이 상기 상품을 구매하지 않은 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제4 유사가중치값을 각각 산출하는 단계;
상기 추천 점수 산출부에서 상기 제1 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 상태값에 따른 구매 빈도수에 기초한 제1 기여도 계수를 곱한 제1값과, 상기 제2 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 상태값에 따른 구매 빈도수에 기초한 제2 기여도 계수를 곱한 제2값과, 상기 제3 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 상태값에 따른 구매 빈도수에 기초한 제3 기여도 계수를 곱한 제3값과, 상기 제4 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 상태값에 따른 구매 빈도수에 기초한 제4 기여도 계수를 곱한 제4값을 각각 산출하는 단계; 및
상기 추천 점수 산출부에서 상기 제1값, 상기 제2값, 상기 제3값, 상기 제4값 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 추천점수를 산출하는 단계; 를 포함하고,
상기 제1 기여도 계수는 상기 제2 구매 데이터의 제4조합에 따른 이진비트열에 대응되는 구매 빈도수를, 제4조합에 따른 이진비트열에 대응되는 구매 빈도수와 제1조합에 따른 이진비트열에 대응되는 구매 빈도수를 더한 값으로 나눔에 따른 값을 가지는 것이며,
상기 제2 기여도 계수는 상기 제2 구매 데이터의 제2조합에 따른 이진비트열에 대응되는 구매 빈도수를, 제2조합에 따른 이진비트열에 대응되는 구매 빈도수와 제3조합에 따른 이진비트열에 대응되는 구매 빈도수를 더한 값으로 나눔에 따른 값을 가지는 것이고,
상기 제3 기여도 계수는 상기 제2 구매 데이터의 제3조합에 따른 이진비트열에 대응되는 구매 빈도수를, 제3조합에 따른 이진비트열에 대응되는 구매 빈도수와 제2조합에 따른 이진비트열에 대응되는 구매 빈도수를 더한 값으로 나눔에 따른 값을 가지는 것이며,
상기 제4 기여도 계수는 상기 제2 구매 데이터의 제1조합에 따른 이진비트열에 대응되는 구매 빈도수를, 제1조합에 따른 이진비트열에 대응되는 구매 빈도수와 제4조합에 따른 이진비트열에 대응되는 구매 빈도수를 더한 값으로 나눔에 따른 값을 가지는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 방법.
A storage unit that stores product information for a plurality of products and existing customer information for an existing customer who has purchased at least one of the plurality of products for a predetermined period, whether the existing customer has purchased each product for each of the plurality of products And a purchase data generation unit that generates purchase data based on the purchase frequency, and a first similar weight value based on a result of applying a positive Pearson correlation when the existing customer makes a purchase based on the purchase data, and the existing customer A second similarity weight value based on the result of applying a negative Pearson correlation in the case of purchase, a third similarity weight value based on the result of applying a positive Pearson correlation when the existing customer has not purchased, and the existing customer When the purchase is not made, a fourth similarity weight value is calculated based on a result of applying a negative Pearson correlation, and the first similarity weight value, the second similarity weight value, the third similarity weight value, and the fourth The present invention relates to a product purchase-related recommendation method using a collaborative filter algorithm using a system including a recommendation score calculation unit that calculates a recommendation score based on the result of adding or subtracting the similar weight value selected according to the selection of each similar weight value. ,
Storing product information for a plurality of products in the storage unit;
Storing existing customer information about an existing customer who has purchased at least one of the plurality of products for a predetermined period in the storage unit;
Consists of a number of rows corresponding to the customer information stored in the purchase data generation unit and a number of columns corresponding to each of the plurality of products, and a row corresponding to the customer according to whether each customer has purchased any one product. In the column corresponding to the product, the first purchase data having a 1-bit binary status value when purchased by an existing customer and a 1-bit binary status value different from the status value when the existing customer has not purchased Generating;
The purchase data generation unit consists of two rows corresponding to a first status value according to whether a new customer has purchased a predetermined product, and two columns corresponding to a second status value according to whether an existing customer has purchased the product. In the row and column positions corresponding to the first state value and the second state value, the combination of the first state value and the second state value, according to the first combination, in which neither the existing customer nor the new customer has purchased. Binary bit string, binary bit string according to the second combination when existing customers do not purchase and new customers purchase, binary bit string according to the third combination when existing customers purchase and new customers do not, existing customers Generating second purchase data obtained by matching a purchase frequency corresponding to each of the binary bit strings according to the fourth combination when both the and new customers have purchased;
A first similar weight value based on the result of applying a positive Pearson correlation when the existing customer purchases the product in the recommendation score calculation unit, and a negative Pearson correlation when the existing customer purchases the product. A second similar weight value based on the result of applying the product, a third similar weight value based on the result of applying a positive Pearson correlation when the existing customer does not purchase the product, and the existing customer does not purchase the product. Calculating fourth similar weight values based on a result of applying the negative Pearson's correlation in the case of not being the same;
A first value obtained by multiplying the first similarity weight value by the recommendation score calculation unit and a first contribution coefficient based on a purchase frequency according to the state values of the existing and new customers corresponding thereto, and the second similarity weight value And a second value obtained by multiplying a second contribution coefficient based on a purchase frequency according to the status value of each of the existing and new customers corresponding thereto, and the third similar weight value and the corresponding existing and new customers respectively A third value multiplied by a third contribution coefficient based on the purchase frequency according to the status value of, and the fourth similar weight value and a fourth contribution based on the purchase frequency according to the status values of the existing and new customers corresponding thereto. Calculating fourth values obtained by multiplying the coefficients, respectively; And
Calculating a recommendation score based on a result of adding or subtracting the first value, the second value, the third value, and the fourth value, respectively, in the recommendation score calculation unit; Including,
The first contribution coefficient is a purchase frequency corresponding to a binary bit string according to a fourth combination of the second purchase data, a purchase frequency corresponding to a binary bit string according to a fourth combination, and a purchase corresponding to a binary bit string according to the first combination. It has a value by dividing by the sum of the frequency,
The second contribution coefficient is a purchase frequency corresponding to a binary bit string according to a second combination of the second purchase data, a purchase frequency corresponding to a binary bit string according to a second combination, and a purchase corresponding to a binary bit string according to a third combination. It has a value by dividing by the sum of the frequency,
The third contribution coefficient is a purchase frequency corresponding to a binary bit string according to a third combination of the second purchase data, a purchase frequency corresponding to a binary bit string according to a third combination, and a purchase corresponding to a binary bit string according to the second combination. It has a value by dividing by the sum of the frequency,
The fourth contribution coefficient is a purchase frequency corresponding to the binary bit string according to the first combination of the second purchase data, the purchase frequency corresponding to the binary bit string according to the first combination and the purchase corresponding to the binary bit string according to the fourth combination A recommendation method related to product purchase using a collaborative filter algorithm, characterized in that it has a value obtained by dividing by a value obtained by adding a frequency number.
삭제delete 삭제delete 삭제delete 제1항에 있어서,
상기 유사가중치값을 각각 산출하는 단계에서 상기 추천 점수 산출부는,
상기 신규 고객의 상기 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제1 상태값과 상품별 구매 여부에 대한 제1 평균 상태값의 제1 차분값과, 상기 기존 고객의 상기 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제2 상태값과 상품별 구매 여부에 대한 제2 평균 상태값의 제2 차분값을 산출한 후,
상기 복수 개의 상품 각각에 대하여 상기 제1 차분값과 상기 제2 차분값을 곱해서 합한 값을 분자로 하고, 상기 복수 개의 상품 각각에 대한 상기 제1 차분값의 제곱합과 상기 제2 차분값의 제곱합의 곱의 제곱근값을 분모로 하여 상기 유사가중치값을 산출하는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 방법.
The method of claim 1,
In the step of calculating each of the similar weight values, the recommendation score calculation unit,
Among the plurality of products of the existing customer, a first difference value between a first state value for whether a particular product is purchased by the new customer and a first average state value for whether to purchase each product. After calculating a second difference value between the second status value for the purchase of any one specific product and the second average status value for the purchase of each product,
A numerator is a value obtained by multiplying the first difference value and the second difference value for each of the plurality of products, and a sum of squares of the first difference value and the second difference value for each of the plurality of products. A method for recommending product purchase using a collaborative filter algorithm, characterized in that the similar weight value is calculated by using the square root value of the product as a denominator.
복수 개의 상품에 대한 상품 정보와, 소정 기간 동안 상기 복수 개의 상품 중 적어도 하나를 구매한 기존 고객에 대한 기존 고객 정보를 각각 저장하는 저장부;
기저장된 고객 정보와 대응되는 갯수의 행과 상기 복수 개의 상품 각각에 대응되는 갯수의 열로 구성되며, 각 고객의 어느 하나의 상품에 대한 구매여부에 따라 상기 고객에 대응되는 행에서 상기 상품에 대응되는 열에 기존 고객이 구매한 경우 1비트의 이진수인 상태값을 가지며, 기존 고객이 구매하지 않은 경우 상기 상태값과는 다른 1비트의 이진수인 상태값을 가지는 제1 구매 데이터를 생성하고, 소정 상품에 대한 신규 고객의 구매 여부에 따른 제1 상태값과 대응되는 두 개의 행과 상기 상품에 대한 기존 고객의 구매 여부에 따른 제2 상태값과 대응되는 두 개의 열로 구성되며, 제1 상태값과 제2 상태값에 대응되는 행과 열의 위치에, 상기 제1 상태값과 상기 제2 상태값의 조합으로서 기존 고객과 신규 고객 모두 구매하지 않은 경우인 제1조합에 따른 이진비트열, 기존 고객은 구매하지 않고 신규 고객은 구매한 경우인 제2조합에 따른 이진비트열, 기존 고객은 구매하고 신규 고객은 구매하지 않은 경우인 제3조합에 따른 이진비트열, 기존 고객과 신규 고객 모두 구매한 경우인 제4조합에 따른 이진비트열 각각에 대응되는 구매 빈도수를 매칭시킨 제2 구매 데이터를 생성하는 구매 데이터 생성부; 및
상기 구매 데이터에 기초하여 상기 기존 고객이 구매한 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제1 유사가중치값과, 상기 기존 고객이 구매한 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제2 유사가중치값과, 상기 기존 고객이 구매하지 않은 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제3 유사가중치값과, 상기 기존 고객이 구매하지 않은 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제4 유사가중치값을 각각 산출하고, 상기 제1 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 상태값에 따른 구매 빈도수에 기초한 제1 기여도 계수를 곱한 제1값과, 상기 제2 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 상태값에 따른 구매 빈도수에 기초한 제2 기여도 계수를 곱한 제2값과, 상기 제3 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 상태값에 따른 구매 빈도수에 기초한 제3 기여도 계수를 곱한 제3값과, 상기 제4 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 상태값에 따른 구매 빈도수에 기초한 제4 기여도 계수를 곱한 제4값을 각각 산출하여, 상기 제1값, 상기 제2값, 상기 제3값, 상기 제4값 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 추천점수를 산출하는 추천 점수 산출부; 를 포함하고,
상기 제1 기여도 계수는 상기 제2 구매 데이터의 제4조합에 따른 이진비트열에 대응되는 구매 빈도수를, 제4조합에 따른 이진비트열에 대응되는 구매 빈도수와 제1조합에 따른 이진비트열에 대응되는 구매 빈도수와 "11"에 대응되는 구매 빈도수를 더한 값으로 나눔에 따른 값을 가지는 것이며,
상기 제2 기여도 계수는 상기 제2 구매 데이터의 제2조합에 따른 이진비트열에 대응되는 구매 빈도수를, 제2조합에 따른 이진비트열에 대응되는 구매 빈도수와 제3조합에 따른 이진비트열에 대응되는 구매 빈도수를 더한 값으로 나눔에 따른 값을 가지는 것이고,
상기 제3 기여도 계수는 상기 제2 구매 데이터의 제3조합에 따른 이진비트열에 대응되는 구매 빈도수를, 제3조합에 따른 이진비트열에 대응되는 구매 빈도수와 제2조합에 따른 이진비트열에 대응되는 구매 빈도수를 더한 값으로 나눔에 따른 값을 가지는 것이며,
상기 제4 기여도 계수는 상기 제2 구매 데이터의 제4조합에 따른 이진비트열에 대응되는 구매 빈도수를, 제4조합에 따른 이진비트열에 대응되는 구매 빈도수와 제1조합에 따른 이진비트열에 대응되는 구매 빈도수를 더한 값으로 나눔에 따른 값을 가지는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템.
A storage unit for storing product information on a plurality of products and existing customer information on existing customers who have purchased at least one of the plurality of products for a predetermined period;
It is composed of a number of rows corresponding to pre-stored customer information and a number of columns corresponding to each of the plurality of products, and corresponding to the product in a row corresponding to the customer according to whether each customer has purchased any one product. In the column, when an existing customer purchases, it has a 1-bit binary status value, and when an existing customer does not purchase, first purchase data having a 1-bit binary status value different from the status value is generated, and It consists of two rows corresponding to the first status value according to whether a new customer has purchased or not, and two columns corresponding to the second status value according to whether or not an existing customer has purchased the product, and a first status value and a second status value. At the position of the row and column corresponding to the status value, as a combination of the first status value and the second status value, a binary bit string according to the first combination when neither the existing customer nor the new customer has purchased. Binary bit string according to the 2nd combination when new customers have purchased it, binary bit string according to the 3rd combination when existing customers have purchased but not new customers, and when both existing and new customers have purchased A purchase data generation unit that generates second purchase data obtained by matching the purchase frequency corresponding to each binary bit string according to the four combinations; And
A first similarity weight value based on the result of applying a positive Pearson correlation when the existing customer makes a purchase based on the purchase data, and a first similar weight value based on the result of applying a negative Pearson correlation when the existing customer makes a purchase. 2 A similar weight value, a third similar weight value based on the result of applying a positive Pearson correlation when the existing customer did not purchase, and a result of applying a negative Pearson correlation when the existing customer did not purchase. A first value obtained by calculating each of the based fourth similarity weight values and multiplying the first similarity weight value and a first contribution coefficient based on a purchase frequency according to the state values of the existing and new customers corresponding thereto, and the A second value obtained by multiplying a second similar weight value and a second contribution coefficient based on the purchase frequency according to the status values of the existing and new customers corresponding thereto, and the third similar weight value and the corresponding existing customer And a third value multiplied by a third contribution coefficient based on a purchase frequency according to the status value of each of the new customers, the fourth similar weight value, and the number of purchase frequencies according to the status values of the existing and new customers corresponding thereto. Each of the fourth values multiplied by the fourth contribution coefficient based on is calculated, and is recommended based on the result of summation or subtraction depending on whether the first value, the second value, the third value, and the fourth value are selected. A recommendation score calculation unit that calculates a score; Including,
The first contribution coefficient is a purchase frequency corresponding to the binary bit string according to the fourth combination of the second purchase data, the purchase frequency corresponding to the binary bit string according to the fourth combination and the purchase corresponding to the binary bit string according to the first combination It has a value obtained by dividing by the sum of the frequency and the purchase frequency corresponding to "11",
The second contribution coefficient is a purchase frequency corresponding to a binary bit string according to a second combination of the second purchase data, a purchase frequency corresponding to a binary bit string according to a second combination, and a purchase corresponding to a binary bit string according to a third combination It has a value by dividing by the sum of the frequency,
The third contribution coefficient is a purchase frequency corresponding to a binary bit string according to a third combination of the second purchase data, a purchase frequency corresponding to a binary bit string according to a third combination, and a purchase corresponding to a binary bit string according to the second combination. It has a value by dividing by the sum of the frequency,
The fourth contribution factor is a purchase frequency corresponding to a binary bit string according to a fourth combination of the second purchase data, a purchase frequency corresponding to a binary bit string according to the fourth combination, and a purchase corresponding to the binary bit string according to the first combination. A product purchase-related recommendation system using a collaborative filter algorithm, characterized in that it has a value obtained by dividing by a value obtained by adding a frequency number.
삭제delete 삭제delete 삭제delete 제6항에 있어서,
상기 추천 점수 산출부는,
상기 신규 고객의 상기 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제1 상태값과 상품별 구매 여부에 대한 제1 평균 상태값의 제1 차분값과, 상기 기존 고객의 상기 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제2 상태값과 상품별 구매 여부에 대한 제2 평균 상태값의 제2 차분값을 산출한 후,
상기 복수 개의 상품 각각에 대하여 상기 제1 차분값과 상기 제2 차분값을 곱해서 합한 값을 분자로 하고, 상기 복수 개의 상품 각각에 대한 상기 제1 차분값의 제곱합과 상기 제2 차분값의 제곱합의 곱의 제곱근값을 분모로 하여 상기 유사가중치값을 산출하는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템.
The method of claim 6,
The recommended score calculation unit,
Among the plurality of products of the existing customer, a first difference value between a first state value for whether a particular product is purchased by the new customer and a first average state value for whether to purchase each product. After calculating a second difference value between the second status value for the purchase of any one specific product and the second average status value for the purchase of each product,
A numerator is a value obtained by multiplying the first difference value and the second difference value for each of the plurality of products, and a sum of squares of the first difference value and the second difference value for each of the plurality of products. A product purchase-related recommendation system using a collaborative filter algorithm, characterized in that the similar weight value is calculated by using the square root of the product as a denominator.
KR1020180169851A 2018-12-26 2018-12-26 A recommendation system for product purchase using collaborative filtering algorism and method thereof KR102154411B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180169851A KR102154411B1 (en) 2018-12-26 2018-12-26 A recommendation system for product purchase using collaborative filtering algorism and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180169851A KR102154411B1 (en) 2018-12-26 2018-12-26 A recommendation system for product purchase using collaborative filtering algorism and method thereof

Publications (2)

Publication Number Publication Date
KR20200080024A KR20200080024A (en) 2020-07-06
KR102154411B1 true KR102154411B1 (en) 2020-09-09

Family

ID=71571670

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180169851A KR102154411B1 (en) 2018-12-26 2018-12-26 A recommendation system for product purchase using collaborative filtering algorism and method thereof

Country Status (1)

Country Link
KR (1) KR102154411B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102399808B1 (en) 2020-09-28 2022-05-18 연세대학교 산학협력단 Recommendation System and Recommendation Method for Repeat-purchase Products using Modified Self Similarity
US10999416B1 (en) 2020-12-09 2021-05-04 Coupang Corp. Systems and methods for recurrent and adaptive electronic notifications
KR102455108B1 (en) * 2020-12-31 2022-10-14 현대위아 주식회사 Application recommendation methods for machine tools

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101567684B1 (en) * 2014-03-31 2015-11-10 경희대학교 산학협력단 Method for selecting recommendation type in product recommeding system

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101034101B1 (en) * 2008-05-28 2011-05-13 경희대학교 산학협력단 System and Method for providing product recommendation service
KR101216969B1 (en) * 2009-08-19 2013-01-02 주식회사 디디에이치 Goods recommendation system and method considering price of goods
KR101567217B1 (en) 2014-05-29 2015-11-17 연세대학교 산학협력단 Method and system for recommendation with collaborative filtering using social network analysis
KR20180064324A (en) * 2016-12-05 2018-06-14 주식회사 원소프트다임 Appartus for recommendating of product and method using the same

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101567684B1 (en) * 2014-03-31 2015-11-10 경희대학교 산학협력단 Method for selecting recommendation type in product recommeding system

Also Published As

Publication number Publication date
KR20200080024A (en) 2020-07-06

Similar Documents

Publication Publication Date Title
Cui et al. Predicting product return volume using machine learning methods
Snyder Facility location under uncertainty: a review
KR102154411B1 (en) A recommendation system for product purchase using collaborative filtering algorism and method thereof
US7979445B2 (en) Processes for assessing user affinities for particular item categories of a hierarchical browse structure
CN109242633A (en) A kind of commodity method for pushing and device based on bigraph (bipartite graph) network
US20140278778A1 (en) Method, apparatus, and computer-readable medium for predicting sales volume
US9846885B1 (en) Method and system for comparing commercial entities based on purchase patterns
EP2960849A1 (en) Method and system for recommending an item to a user
CN112200601B (en) Item recommendation method, device and readable storage medium
US20130325551A1 (en) System and method for modeling demand and optimizing prices with immunity to out-of-stock events
Sharma et al. Latent root regression: An alternate procedure for estimating parameters in the presence of multicollinearity
Pourakbar et al. End‐of‐life inventory problem with phaseout returns
Wu et al. Comparison of different machine learning algorithms for multiple regression on black friday sales data
US20130054498A1 (en) System and Method For Providing Personalized Recommendations
JP2005174313A (en) Method and apparatus for calculating economic value of patent or technology
Pinçe et al. The role of contract expirations in service parts management
US20100100421A1 (en) Methodology for selecting causal variables for use in a product demand forecasting system
US7493277B1 (en) Business opportunity analytics with dependence
CN111008861A (en) Intelligent prediction-based commodity online transaction system and method
JP6085802B2 (en) Method and system for identifying defective products based on user purchase behavior
Chu et al. Deep graph embedding for ranking optimization in e-commerce
JP2023017700A (en) Machine learning method, training method, forecasting system, and non-transitory computer readable medium
Demgne et al. Modelling and numerical assessment of a maintenance strategy with stock through piecewise deterministic Markov processes and quasi Monte Carlo methods
Aouadni et al. Supplier selection: an analytic network process and imprecise goal programming model integrating the decision-maker’s preferences
Singh et al. Improving customer segmentation in e-commerce using predictive neural network

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant