KR20200080024A - A recommendation system for product purchase using collaborative filtering algorism and method thereof - Google Patents

A recommendation system for product purchase using collaborative filtering algorism and method thereof Download PDF

Info

Publication number
KR20200080024A
KR20200080024A KR1020180169851A KR20180169851A KR20200080024A KR 20200080024 A KR20200080024 A KR 20200080024A KR 1020180169851 A KR1020180169851 A KR 1020180169851A KR 20180169851 A KR20180169851 A KR 20180169851A KR 20200080024 A KR20200080024 A KR 20200080024A
Authority
KR
South Korea
Prior art keywords
value
product
purchase
pseudo
customer
Prior art date
Application number
KR1020180169851A
Other languages
Korean (ko)
Other versions
KR102154411B1 (en
Inventor
황욱연
Original Assignee
동아대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동아대학교 산학협력단 filed Critical 동아대학교 산학협력단
Priority to KR1020180169851A priority Critical patent/KR102154411B1/en
Publication of KR20200080024A publication Critical patent/KR20200080024A/en
Application granted granted Critical
Publication of KR102154411B1 publication Critical patent/KR102154411B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement

Abstract

The present invention relates to a system for making a recommendation related to product purchase using collaborative filter algorithm and a method thereof. The method comprises the steps of: storing product information on a plurality of products; storing existing customer information on an existing customer who has purchased at least one of the plurality of products for a predetermined period; generating purchase data based on whether the existing customer purchases each product and the frequency of purchase, with respect to each of the plurality of products; and calculating a recommendation score corresponding to the purchase possibility of a new customer for a predetermined product based on a result of applying a positive or negative Pearson correlation to the purchase data. Accordingly, when calculating the recommendation score for the predetermined product, the contribution ratio of the data on the Pearson correlation in each of two cases in which the existing customer purchased or did not purchase the product is considered together, thereby increasing the recommendation performance.

Description

협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템 및 방법{A RECOMMENDATION SYSTEM FOR PRODUCT PURCHASE USING COLLABORATIVE FILTERING ALGORISM AND METHOD THEREOF}A RECOMMENDATION SYSTEM FOR PRODUCT PURCHASE USING COLLABORATIVE FILTERING ALGORISM AND METHOD THEREOF}

본 발명은 협업적 필터 알고리즘을 이용한 소정 상품에 대한 추천 점수의 산출 시 기존 고객이 해당 상품을 구매한 경우와 구매하지 않은 경우를 모두 고려하여 추천 성능이 향상되는 상품 구매 관련 추천 시스템 및 방법에 관한 것이다.The present invention relates to a product purchasing related recommendation system and method for improving recommendation performance in consideration of both a case where an existing customer purchases a product and a case where a product is not purchased when calculating a recommendation score for a given product using a collaborative filter algorithm will be.

추천 시스템은 검색 분야, 광고 마케팅 분야, 전자 상거래 분야, 멀티미디어 컨텐츠 유통 분야 등의 온라인 비즈니스에서 서비스 공급자들의 경쟁력을 좌우하는 요소가 되고 있다. 개인화된 표적 추천 시스템은 온라인 상에서 고객이 원하는 아이템에 도달하기까지 걸리는 시간을 단축시키고 일대일 마케팅을 제공하여 소비를 유도하여 기업 성과에 큰 영향을 줄 수 있다.The recommendation system has become a factor influencing the competitiveness of service providers in online businesses such as the search field, advertising marketing field, e-commerce field, and multimedia content distribution field. The personalized target recommendation system can significantly reduce the time it takes for customers to reach the desired item online and provide one-on-one marketing to drive consumption, which can have a great impact on corporate performance.

지금까지 다양한 추천 기법들이 제안되어 왔지만, 그중 가장 성공적인 추천 기법 중 하나는 협업 필터링 추천 기법(Collaborative Filtering, CF)이다. 다수의 고객들의 구매 성향을 각자의 과거 구매 기록을 통해 대규모로 분석하고, 특정 고객과 구매 성향에서 높은 상관 관계를 가지는 다른 고객이 구매한 구매 기록을 참조하여 특정 고객에게 아이템을 추천하는 기법이다. 다수의 성공적인 전자 상거래 업체들이 이러한 협업 필터링 추천 기법을 이용하여 고객들에게 아이템을 추천하고 있다.Various recommendation techniques have been proposed so far, but one of the most successful recommendation techniques is collaborative filtering (CF). This is a technique that analyzes the purchase propensity of multiple customers on a large scale through their past purchase records, and recommends items to specific customers by referring to purchase records purchased by other customers who have a high correlation with specific customers. Many successful e-commerce companies use this collaborative filtering recommendation technique to recommend items to customers.

그러나, 협업 필터링 추천 기법은 과거의 구매 기록을 바탕으로 추천하기 때문에, 아이템 수에 비해 구매 기록이 부족하여 상관 관계를 도출할 데이터가 희박(sparsity)할 경우에도 추천 성능이 떨어지고, 추천 점수의 고려 시 일반적으로 다른 고객이 상품을 구매한 경우만을 고려하고 있어 실질적인 상품 구매 가능성에 대한 예측 결과의 정확도가 떨어질 수 있다는 문제점이 있다.However, since the collaborative filtering recommendation technique recommends based on past purchase records, recommendation performance is deteriorated even when data to derive correlation is sparse because of insufficient purchase records compared to the number of items, and the recommendation score is considered In general, there is a problem that the accuracy of the prediction result for the actual product purchasing possibility may be deteriorated because only the case in which another customer purchases the product is considered.

KRKR 10-156768410-1567684 B1B1 KRKR 10-156721710-1567217 B1B1

본 발명의 목적은 상기 문제점을 해결하기 위한 것으로서, 소정 상품에 대한 추천 점수의 산출 시 기존 고객이 해당 상품을 구매한 경우와 구매하지 않은 경우를 모두 고려하여 추천 성능을 향상시킬 수 있는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템 및 방법을 제공하는 것을 목적으로 한다.An object of the present invention is to solve the above problems, and when calculating a recommendation score for a given product, a collaborative filter capable of improving recommendation performance by considering both the case where the existing customer purchases the product and the case where the product is not purchased It is an object of the present invention to provide a recommendation system and method related to product purchase using an algorithm.

상기와 같은 목적을 달성하기 위한 본 발명의 일면에 따른 상품 구매 관련 추천 방법은, 복수 개의 상품에 대한 상품 정보를 저장하는 단계와, 소정 기간 동안 상기 복수 개의 상품 중 적어도 하나를 구매한 기존 고객에 대한 기존 고객 정보를 저장하는 단계와, 상기 복수 개의 상품 각각에 대한 상기 기존 고객의 상품별 구매 여부 및 구매 빈도수에 기초한 구매 데이터를 생성하는 단계와, 상기 구매 데이터에 양 또는 음의 피어슨 상관관계를 적용한 결과에 기초하여 소정 상품에 대한 신규 고객의 구매 가능성에 해당하는 추천 점수를 산출하는 단계를 포함하는 것을 특징으로 한다.A product purchasing-related recommendation method according to an aspect of the present invention for achieving the above object is to store product information for a plurality of products, and to an existing customer who has purchased at least one of the plurality of products for a predetermined period of time. Storing existing customer information about the product; generating purchase data based on purchase and frequency of purchase of each existing product for each of the plurality of products; and applying a positive or negative Pearson correlation to the purchase data. And calculating a recommendation score corresponding to a new customer's purchase possibility for a given product based on the result.

또한, 본 발명의 다른 일면에 따른 상품 구매 관련 추천 시스템은, 복수 개의 상품에 대한 상품 정보와, 소정 기간 동안 상기 복수 개의 상품 중 적어도 하나를 구매한 기존 고객에 대한 기존 고객 정보를 각각 저장하는 저장부와, 상기 복수 개의 상품 각각에 대한 상기 기존 고객의 상품별 구매 여부 및 구매 빈도수에 기초한 구매 데이터를 생성하는 구매 데이터 생성부와, 상기 구매 데이터에 양 또는 음의 피어슨 상관관계를 적용한 결과에 기초하여 소정 상품에 대한 신규 고객의 구매 가능성에 해당하는 추천 점수를 산출하는 추천 점수 산출부를 포함하는 것을 특징으로 한다.In addition, the product purchase-related recommendation system according to another aspect of the present invention stores storage of product information for a plurality of products and existing customer information for an existing customer who has purchased at least one of the plurality of products for a predetermined period, respectively. Based on the result of applying a positive or negative Pearson correlation to the purchase data, and a purchase data generation unit for generating purchase data based on purchase frequency and purchase frequency of each existing customer for each of the plurality of products. And a recommendation score calculating unit that calculates a recommendation score corresponding to a new customer's purchase possibility for a given product.

본 발명에 따르면, 소정 상품에 대한 추천 점수 산출 시 기존 고객이 해당 상품을 구매한 경우와 그렇지 않은 경우 각각의 피어슨 상관관계에 대한 데이터의 기여도 비율을 함께 고려하여 추천 성능을 향상시킬 수 있는 효과가 있다.According to the present invention, when calculating a recommendation score for a given product, if an existing customer purchases the corresponding product or not, an effect of improving recommendation performance by considering the ratio of data contribution to each Pearson correlation is also obtained. have.

또한, 본 발명에 따르면, 기존 고객의 구매 여부 및 구매 빈도에 기초한 신규 고객의 예상 구매 가능성에 따른 최적 조합을 선택하는 간단한 알고리즘을 통해 다양한 유형의 상품에 대한 추천 점수의 산출 시 범용적으로 적용 가능한 이점이 있다.In addition, according to the present invention, it is universally applicable when calculating recommendation scores for various types of products through a simple algorithm that selects the optimal combination according to the expected purchaseability of a new customer based on the purchase frequency and purchase frequency of an existing customer. There is an advantage.

도 1은 본 발명의 일 실시예에 따른 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템의 구성을 나타내는 블록도이고,
도 2는 도 1의 추천 점수 산출부에 의해 추천 점수를 산출하는 과정을 설명하기 위한 도면이고,
도 3은 본 발명의 일 실시예에 따른 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 방법을 나타낸 순서도이다.
1 is a block diagram showing the configuration of a product purchasing related recommendation system using a collaborative filter algorithm according to an embodiment of the present invention,
FIG. 2 is a view for explaining a process of calculating a recommendation score by the recommendation score calculation unit of FIG. 1,
3 is a flowchart illustrating a product purchasing related recommendation method using a collaborative filter algorithm according to an embodiment of the present invention.

이상과 같은 본 발명에 대한 해결하려는 과제, 과제의 해결수단, 발명의 효과를 포함한 구체적인 사항들은 다음에 기재할 실시예 및 도면에 포함되어 있다. 본 발명의 이점 및 특징, 그리고 그것을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예를 참조하면 명확해질 것이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.The problems to be solved for the present invention as described above, the means for solving the problems, and specific matters including the effects of the invention are included in the following examples and drawings. Advantages and features of the present invention, and a method of achieving the same will be apparent with reference to embodiments described below in detail together with the accompanying drawings. The same reference numerals refer to the same components throughout the specification.

도 1은 본 발명의 일 실시예에 따른 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템의 구성을 나타내는 블록도이고, 도 2는 도 1의 추천 점수 산출부에 의해 추천 점수를 산출하는 과정을 설명하기 위한 도면이다.1 is a block diagram showing the configuration of a product purchasing-related recommendation system using a collaborative filter algorithm according to an embodiment of the present invention, and FIG. 2 illustrates a process of calculating a recommendation score by the recommendation score calculating unit of FIG. 1 It is a drawing for doing.

이하, 전술한 도면들을 참조하여 본 발명의 일 실시예에 따른 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템에 대해 설명하도록 한다.Hereinafter, a recommendation system related to product purchase using a collaborative filter algorithm according to an embodiment of the present invention will be described with reference to the drawings.

도 1을 참조하면, 본 발명의 일 실시예에 따른 상품 구매 관련 추천 시스템은 크게 저장부(100), 구매 데이터 생성부(300) 및 추천 점수 산출부(500)를 포함하여 구성된다.Referring to FIG. 1, a recommendation system related to product purchase according to an embodiment of the present invention is largely configured to include a storage unit 100, a purchase data generation unit 300, and a recommendation score calculation unit 500.

저장부(100)는 소정의 데이터베이스 형태로 마련될 수 있으며, 복수 개의 상품에 대한 상품 정보(101)와, 소정 기간 동안 상기 복수 개의 상품 중 적어도 하나를 구매한 기존 고객(i)에 대한 기존 고객 정보(102)를 각각 저장한다.The storage unit 100 may be provided in the form of a predetermined database, product information 101 for a plurality of products, and an existing customer for an existing customer i who has purchased at least one of the plurality of products for a predetermined period of time. Each of the information 102 is stored.

여기서, 상기 상품 정보(101)는 복수 개의 상품 각각의 상품명 및 상품 종류에 대한 정보를 포함하고, 상기 기존 고객 정보(102)는 고객명과 해당 고객이 구매한 상품에 대응되는 상품명에 대한 정보를 포함할 수 있다.Here, the product information 101 includes information on the product name and product type of each of a plurality of products, and the existing customer information 102 includes information on the customer name and the product name corresponding to the product purchased by the customer. can do.

이때, 상기 상품 정보(101)에 대응되는 상품은 해당 상품을 구입하여 소유할 수 있는 유형의 물체에 한정되지 않으며, 소정의 티켓값을 지급하는 구매 행위를 통해 관람 또는 영위할 수 있는 무형적인 가치가 있는 문화상품(예컨대, 영화, 공연, 콘서트 등)을 포함할 수도 있다.At this time, the product corresponding to the product information 101 is not limited to an object of a type that can be purchased and owned, and an intangible value that can be viewed or operated through a purchase act that pays a predetermined ticket value. It may also include cultural products (eg, movies, performances, concerts, etc.).

구매 데이터 생성부(300)는 저장부(100)에 기저장된 복수 개의 상품 각각에 대한 기존 고객(i)의 상품별 구매 여부(Wp) 및 구매 빈도수(Fp)에 기초한 구매 데이터(D)를 생성한다.The purchase data generation unit 300 generates purchase data D based on whether the existing customer i purchases by product (Wp) and purchase frequency (Fp) for each of a plurality of products previously stored in the storage unit 100. .

여기서, 구매 데이터 생성부(300)는, 저장부(100)에 기저장된 복수 개의 상품 각각을 하나의 열로 하고 저장부(100)에 기저장된 복수의 고객 각각을 하나의 행으로 하는 소정의 제1 매트릭스(M1)를 구성한 후, 소정 고객의 상품별 구매 여부에 대한 이진수 형태의 상태값을 이에 대응되는 행과 열 위치에 매칭시킨 제1 구매 데이터(D1)를 생성할 수 있다.Here, the purchase data generation unit 300 is a predetermined first that sets each of a plurality of products pre-stored in the storage unit 100 as one column and each of a plurality of customers pre-stored in the storage unit 100 as one row. After constructing the matrix M1, the first purchase data D 1 may be generated by matching a binary value state value of whether a particular customer purchases each product to a corresponding row and column position.

이때, 상기 상태값은 1비트 방식의 이진수 형태로서, 해당 행에 대응되는 고객이 해당 열에 대응되는 상품을 구매한 경우에 '1'의 값을 가지고 그렇지 않은 경우에 '0'의 값을 가지는 것일 수 있다.At this time, the status value is a 1-bit binary format, and if a customer corresponding to a corresponding row purchases a product corresponding to a corresponding column, it has a value of '1' and a value of '0' otherwise. Can.

아래의 표 1은 전술한 제1 매트릭스(M1)에 대응되는 소정의 행렬 구성으로 생성된 제1 구매 데이터(D1)의 일례를 나타낸 것이다.Table 1 below shows an example of the first purchase data D 1 generated in a predetermined matrix configuration corresponding to the above-described first matrix M1.

여기서, 제1 매트릭스(M1)는 저장부(100)에 기저장된 고객 정보의 총 개수가 'n'이고 상품 정보의 총 개수가 'm'인 경우, 총 n개의 행과 총 m개의 열로 구성되는 'n×m' 행렬 형태로 구성될 수 있다.Here, when the total number of customer information pre-stored in the storage unit 100 is'n' and the total number of product information is'm', the first matrix M1 is composed of a total of n rows and a total of m columns. It can be configured in the form of an'n×m' matrix.

Figure pat00001
Figure pat00001

예컨대, 상기 표 1을 참조하면, 제1 구매 데이터(D)에서 '고객 1'의 경우 '상품 1'은 구매하고 '상품 2'는 비구매함에 따라, '상품 1'에 대응되는 1번째 행의 1번째 열의 위치에는 "1"의 상태값을 가지고, '상품 2'에 대응되는 1번째 행의 2번째 열의 위치에는 "0"의 상태값을 가질 수 있다.For example, referring to Table 1 above, in the case of'Customer 1'in the first purchase data D,'Product 1'is purchased and'Product 2'is not purchased, so the first row corresponding to'Product 1' The position of the first column may have a status value of "1", and the position of the second column of the first row corresponding to "Product 2" may have a status value of "0".

또한, 제1 구매 데이터(D)에서 '고객 n'의 경우 '상품 2'는 비구매하고 '상품 m'은 구매함에 따라, '상품 2'에 대응되는 n번째 행의 2번째 열의 위치에는 "0"의 상태값을 가지고, '상품 m'에 대응되는 n번째 행의 m번째 열의 위치에는 "1"의 상태값을 가질 수 있다.In addition, in the case of'customer n'in the first purchase data D,'product 2'is not purchased and'product m'is purchased, so the position of the second column of the n-th row corresponding to'product 2'is "0." It has a status value of ", and may have a status value of "1" at the position of the m-th column of the n-th row corresponding to'product m'.

여기서, 구매 데이터 생성부(300)는, 소정 상품에 대한 기존 고객(i)의 구매 여부에 따른 각각의 상태값을 하나의 열로 하고 해당 상품에 대한 신규 고객(a)의 구매 여부에 따른 각각의 상태값을 하나의 행으로 하는 소정의 제2 매트릭스(M2)를 구성한 후, 기존 고객(i)과 신규 고객(a)이 각각 소정의 상태값을 가질 때 이에 대응되는 경우의 구매 빈도수(Fp)를 이에 대응되는 행과 열 위치에 매칭시킨 제2 구매 데이터(D2)를 생성할 수 있다.Here, the purchase data generation unit 300 sets each state value according to whether or not an existing customer (i) for a given product is purchased as one column, and each of the respective states according to whether or not a new customer (a) for the corresponding product is purchased. After constructing the predetermined second matrix M2 having the status value as one row, the purchase frequency (Fp) in the case where the existing customer (i) and the new customer (a) respectively have a predetermined status value and correspond to it May generate the second purchase data D 2 matched to the corresponding row and column positions.

이때, 상기 상태값은 1비트 방식의 이진수 형태로서, 소정의 행에 대응되는 신규 고객(a)의 구매 여부에 대한 제1 상태값("0" 또는 "1")과 소정의 열에 대응되는 기존 고객(i)의 구매 여부에 대한 제2 상태값("0" 또는 "1")을 포함하며, 어느 하나의 특정한 행과 열에 대응되는 위치에는 해당 행과 열에 각각 대응되는 상기 제1 상태값 및 상기 제2 상태값을 순차적으로 나열한 값, 예컨대, "00", "01", "10", "11"이 매칭되는 것일 수 있다.At this time, the status value is a binary form of a 1-bit method, and the first status value ("0" or "1") for whether or not a new customer (a) corresponding to a predetermined row is purchased and an existing one corresponding to a predetermined column It includes a second state value ("0" or "1") of whether or not the customer i is purchased, and the first state value corresponding to the corresponding row and column, respectively, at a position corresponding to any one specific row and column, and The values sequentially listing the second status values, for example, “00”, “01”, “10”, and “11” may be matched.

아래의 표 2는 전술한 제2 매트릭스(M2)에 대응되는 소정의 행렬 구성으로 생성된 제2 구매 데이터(D)의 일례를 나타낸 것이다.Table 2 below shows an example of the second purchase data D generated in a predetermined matrix configuration corresponding to the above-described second matrix M2.

Figure pat00002
Figure pat00002

예컨대, 상기 표 2를 참조하면, 제2 구매 데이터(D)에서 '신규 고객(a)'이 소정 상품을 구매하지 않은 경우의 제1 상태값은 '0(비구매)'이 되고, '기존 고객(i)'이 해당 상품을 구매한 경우의 제2 상태값은 '1(구매)'이 될 때, 상기 제1 상태값('0') 및 상기 제2 상태값('1') 각각에 대응되는 행과 열에 대한 빈도는 "10"이 된다.For example, referring to Table 2 above, in the second purchase data D, the first state value when'new customer (a)' does not purchase a predetermined product becomes '0 (non-purchase)' and'existing customer' When (i)' purchases the product, the second state value becomes '1 (purchase)', and the first state value ('0') and the second state value ('1') The frequency for the corresponding row and column is "10".

또한, '신규 고객(a)'이 해당 상품을 구매한 경우의 제1 상태값은 '1(구매)'이 되고, '기존 고객(i)'이 해당 상품을 구매한 경우의 제2 상태값은 '1(구매)'이 될 때, 상기 제1 상태값('1') 및 상기 제2 상태값('1') 각각에 대응되는 행과 열에 대한 빈도는 "11"이 된다.In addition, the first state value when'new customer (a)' purchases the product becomes '1 (purchase)', and the second state value when'existing customer (i)' purchases the product. When is 1 (purchase), the frequency for rows and columns corresponding to each of the first state value ('1') and the second state value ('1') is "11".

이 경우, '신규 고객(a)'의 구매 여부와 관계없이 '기존 고객(i)'이 해당 상품을 구매한 경우의 상태값들을 합한 값은 "10"과 "11"의 합에 해당하는 값을 가질 수 있다.In this case, regardless of whether'new customer (a)' is purchased or not, the sum of the status values when'existing customer (i)' purchases the product corresponds to the sum of "10" and "11" Can have

추천 점수 산출부(500)는 구매 데이터 생성부(300)에 의해 생성된 구매 데이터(D)에 양 또는 음의 피어슨 상관관계를 적용한 결과에 기초하여 소정 상품에 대한 신규 고객(a)의 구매 가능성에 해당하는 추천 점수(Pak)를 산출한다.The recommendation score calculating unit 500 is based on the result of applying a positive or negative Pearson correlation to the purchase data D generated by the purchase data generation unit 300, the possibility of purchasing a new customer a for a given product The recommended score (P ak ) corresponding to is calculated.

여기서, 추천 점수 산출부(500)는, 기존 고객(i)이 상품을 구매한 경우(vij=1)와 기존 고객(i)이 상품을 구매하지 않은 경우(vij=0)에 각각 양의 피어슨 상관관계와 음의 피어슨 상관관계를 적용한 결과에 기초한 유사가중치값(w(a,i), 이하 'w'라고 함)을 모두 반영하여 추천 점수(Pak)를 산출할 수 있다.Here, the recommendation score calculating unit 500 is positive when the existing customer (i) purchases the product (v ij =1) and when the existing customer (i) does not purchase the product (v ij = 0), respectively. The recommendation score P ak may be calculated by reflecting all of the similar weighting values (w(a,i), hereinafter referred to as'w') based on the results of applying the Pearson correlation and negative Pearson correlation.

이때, 상기 피어슨 상관관계는 두 연속형 변수 간의 선형 연관성을 검정하기 위해 사용되는 일종의 통계 분석 방법에 해당하는 것으로서, 예컨대, "-1" 내지 "+1" 사이의 상관계수가 도출되는데, 상기 상관계수가 "+1"에 가까운 양(+)의 값을 가지는 경우엔 두 변수 간에 양의 선형 연관성이 있는 것으로 판단하고, 상기 상관계수가 "-1"에 가까운 음(-)의 값을 가지는 경우엔 두 변수 간에 음의 선형 연관성이 있는 것으로 판단할 수 있다.In this case, the Pearson correlation corresponds to a kind of statistical analysis method used to test a linear correlation between two continuous variables, for example, a correlation coefficient is derived between "-1" to "+1". When the coefficient has a positive value close to "+1", it is determined that there is a positive linear correlation between the two variables, and the correlation coefficient has a negative value close to "-1" It can be judged that there is a negative linear relationship between the two variables.

여기서, 추천 점수 산출부(500)는 전술한 유사가중치값(w)을 산출함에 있어서, 신규 고객(a)의 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제1 상태값(vaj)과 상품별 구매 여부에 대한 제1 평균 상태값(

Figure pat00003
)의 제1 차분값(dv1)과, 기존 고객(i)의 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제2 상태값(vij)과 상품별 구매 여부에 대한 제2 평균 상태값(
Figure pat00004
)의 제2 차분값(dv2)을 산출한 후, 복수 개의 상품 각각에 대하여 상기 제1 차분값(dv1)과 상기 제2 차분값(dv2)을 곱해서 합한 값을 분자로 하고, 복수 개의 상품 각각에 대한 상기 제1 차분값(dv1)의 제곱합과 상기 제2 차분값(dv2)의 제곱합의 곱의 제곱근값을 분모로 하여 유사가중치값(w)을 산출할 수 있다.Here, the recommendation score calculating unit 500, in calculating the above-described similar weight value (w), a first state value (v aj ) of whether or not to purchase any one of a plurality of products of the new customer (a) ) And the first average status value for purchase by product (
Figure pat00003
)'S first difference value (dv 1 ), and a second state value (v ij ) of whether or not to purchase one specific product among a plurality of products of the existing customer (i) and a second average state of whether to purchase by product value(
Figure pat00004
) A second difference value (dv 2) then calculated, and the for each of a plurality of product sum by multiplying said first difference value (dv 1) and the second difference value (dv 2) values in the molecule, a plurality of The pseudo-weight value w may be calculated by using the square root of the product of the square sum of the first difference value dv 1 and the square sum of the second difference value dv 2 for each of the products.

이와 관련하여, 상기 도 2를 참조하면, 저장부(100)에 기저장된 상품 정보(101)의 총 개수가 'm'개이고 기존 고객 정보(102)의 총 개수가 'n'개일 때, 'i×j'영역은 기존 고객(i)이 구매한 j번째 상품에 대응되는 상태값에 대한 행렬 데이터이고, 'a×j'영역은 신규 고객(a)이 구매한 j번째 상품에 대응되는 상태값에 대한 행렬 데이터일 수 있다.In this regard, referring to FIG. 2, when the total number of product information 101 pre-stored in the storage unit 100 is'm' and the total number of existing customer information 102 is'n','i The area'xj' is the matrix data for the state value corresponding to the j-th product purchased by the existing customer (i), and the area'a×j' is the state value corresponding to the j-th product purchased by the new customer (a). It may be matrix data for.

이때, j는 1부터 m까지에 해당하는 자연수 중 어느 하나의 값에 해당하고 i는 1부터 n까지에 해당하는 자연수 중 어느 하나의 값에 해당할 수 있다.At this time, j may correspond to any one of natural numbers corresponding to 1 to m, and i may correspond to any one of natural numbers corresponding to 1 to n.

이 경우, 'vij'는 'i×j'영역에 대응되는 값으로서 기존 고객(i)의 총 m개의 상품 중 j번째 순서에 대응되는 상품의 구매 여부에 대한 상태값을 나타내고, 'vaj'는 'a×j'영역에 대응되는 값으로서 신규 고객(a)의 총 m개의 상품 중 j번째 순서에 대응되는 상품의 구매 여부에 대한 상태값을 나타낼 수 있다.In this case,'v ij 'is a value corresponding to the'i ×j' area, and indicates a status value of whether to purchase a product corresponding to the j-th order among m products of the existing customer (i), and'v aj 'Is a value corresponding to the'a×j' area, and may indicate a status value of whether to purchase a product corresponding to the j-th order among m products of the new customer a.

아래의 수학식 1은 전술한 유사가중치값(w)을 제1 상태값(vaj), 제1 평균 상태값(

Figure pat00005
), 제2 상태값(vij) 및 제2 평균 상태값(
Figure pat00006
)을 이용하여 수식으로 나타낸 것이다.In Equation 1 below, the above-described pseudo-weighted value w is the first state value v aj and the first average state value (
Figure pat00005
), the second state value (v ij ) and the second average state value (
Figure pat00006
).

Figure pat00007
Figure pat00007

또한, 아래의 수학식 2 및 수학식 3은 제1 평균 상태값(

Figure pat00008
)과 제2 평균 상태값(
Figure pat00009
)을 각각 수식으로 나타낸 것이다.In addition, Equation 2 and Equation 3 below are the first average state values (
Figure pat00008
) And the second average state value (
Figure pat00009
) Respectively.

Figure pat00010
Figure pat00010

Figure pat00011
Figure pat00011

여기서, 'm'은 상품의 총 개수를 나타내고, 'vaj'는 신규 고객(a)의 총 m개의 상품 중 j번째 순서에 대응되는 상품의 구매 여부에 대한 제1 상태값을 나타내고, 'vij'는 기존 고객(i)의 총 m개의 상품 중 j번째 순서에 대응되는 상품의 구매 여부에 대한 제2 상태값을 나타낸다.Here,'m' denotes the total number of products, and'v aj 'denotes a first state value of whether to purchase a product corresponding to the j-th order among m products of the new customer a. ij 'represents a second status value of whether to purchase a product corresponding to the j-th order among m products of the existing customer i.

아래의 표 3은 전술한 제2 상태값(vij)과 유사가중치값(w)의 부호에 따른 조합별로 대응되는 사칙 연산의 종류를 정리하여 나타낸 것이다.Table 3 below summarizes the types of arithmetic operations corresponding to each combination according to the sign of the second state value v ij and the similar weight value w.

이때, 상기 사칙 연산이 '덧셈(add(+))'인 경우엔 추천 점수(Pak)의 산출 시 해당 조합에 대응되는 유사가중치값(w)을 합산하고, 상기 사칙 연산이 '뺄셈(subtract(-))'인 경우엔 추천 점수(Pak)의 산출 시 해당 조합에 대응되는 유사가중치값(w)을 감산할 수 있다.At this time, when the arithmetic operation is'add (+)', when calculating the recommendation score P ak , the similar weight value w corresponding to the corresponding combination is summed, and the arithmetic operation is'subtract. In the case of (-))', when calculating the recommendation score P ak , the similar weight value w corresponding to the combination can be subtracted.

Figure pat00012
Figure pat00012

예컨대, 상기 표 3을 참조하면, 제2 상태값(vij)이 "1"일 때, 즉, 기존 고객(i)이 j번째 상품을 구매하였을 때, 만일 제1 유사가중치값(w)이 양(w > 0)의 값을 가진다면, 추천 점수(Pak)의 산출 시 제1 유사가중치값(w)은 합산(+)되고, 반대로 제2 유사가중치값(w)이 음(w < 0)의 값을 가진다면, 추천 점수(Pak)의 산출 시 제2 유사가중치값(w)은 감산(-)될 수 있다.For example, referring to Table 3, when the second status value v ij is “1”, that is, when the existing customer i purchases the j-th product, if the first pseudo-weight value w is If it has a positive value (w> 0), the first pseudo-weight value (w) is summed (+) when calculating the recommended score (P ak ), and conversely, the second pseudo-weight value (w) is negative (w < If it has a value of 0), when calculating the recommendation score P ak , the second pseudo-weighted value w may be subtracted (-).

또한, 제2 상태값(vij)이 "0"일 때, 즉, 기존 고객(i)이 j번째 상품을 구매하지 않았을 때, 만일 제1 유사가중치값(w)이 양(w > 0)의 값을 가진다면, 추천 점수(Pak)의 산출 시 제1 유사가중치값(w)은 감산(-)되고, 반대로 제2 유사가중치값(w)이 음(w < 0)의 값을 가진다면, 추천 점수(Pak)의 산출 시 제2 유사가중치값(w)은 합산(+)될 수 있다.Also, when the second status value v ij is “0”, that is, when the existing customer i has not purchased the j-th product, the first pseudo-weighted value w is positive (w> 0). If the value of, the first pseudo-weight value (w) is subtracted (-) when calculating the recommended score (P ak ), the second pseudo-weight value (w) is negative (w <0). If it is, the second pseudo-weighted value w may be summed (+) when calculating the recommendation score P ak .

구체적으로, 추천 점수 산출부(500)는, 기존 고객(i)이 소정 상품을 구매한 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제1 유사가중치값(w(a,i)1, 이하 w1이라고 함)과, 기존 고객(i)이 해당 상품을 구매하지 않은 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제2 유사가중치값(w(a,i)2, 이하 w2라고 함)과, 기존 고객(i)이 해당 상품을 구매한 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제3 유사가중치값(w(a,i)3, 이하 w3이라고 함)과, 기존 고객(i)이 해당 상품을 구매하지 않은 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제4 유사가중치값(w(a,i)4, 이하 w4라고 함)을 각각 산출한 후, 상기 제1 유사가중치값(w1), 상기 제2 유사가중치값(w2), 상기 제3 유사가중치값(w3) 및 상기 제4 유사가중치값(w4) 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 추천 점수(Pak)를 산출할 수 있다.Specifically, the recommendation score calculating unit 500, the first similar weight value (w (a, i) 1, based on the result of applying a positive Pearson correlation when the existing customer (i) purchased a predetermined product, 1, or less w 1 ) and the second pseudo-weighted value (w(a,i) 2, less than w 2 ) based on the result of applying a negative Pearson correlation when the existing customer (i) has not purchased the product. ), and a third pseudo-weighted value (w(a,i) 3, hereinafter referred to as w 3 ) based on the result of applying a negative Pearson correlation when an existing customer (i) purchased the product, and an existing customer When (i) does not purchase the product, after calculating the fourth pseudo-weighted value (w(a,i) 4, hereinafter referred to as w 4 ) based on the result of applying the positive Pearson correlation, respectively, 1 Addition or subtraction depending on whether the pseudo-weight value (w 1 ), the second pseudo-weight value (w 2 ), the third pseudo-weight value (w 3 ), and the fourth pseudo-weight value (w 4 ) are selected respectively Based on one result, a recommendation score P ak may be calculated.

아래의 수학식 4는 기존 고객(i)과 신규 고객(a)의 구매 여부와 피어슨 상관관계를 고려한 추천 점수(Pak)에 대한 수식을 정리하여 나타낸 것이고, 수학식 5는 소정의 이득 상수 'ka'에 대한 수식을 유사가중치값(w)을 이용하여 나타낸 것이다.Equation 4 below shows the formula for the recommended score (P ak ) considering the correlation between the purchase of the existing customer (i) and the new customer (a) and Pearson, and the equation (5) is a predetermined gain constant. The equation for k a'is expressed using the pseudo-weight value (w).

Figure pat00013
Figure pat00013

Figure pat00014
Figure pat00014

여기서, w(a,i)1은 제1 유사가중치값이고, w(a,i)2는 제2 유사가중치값이고, w(a,i)3는 제3 유사가중치값이고, w(a,i)4는 제4 유사가중치값이다.Here, w(a,i) 1 is the first pseudo-weighted value, w(a,i) 2 is the second pseudo-weighted value, w(a,i) 3 is the third pseudo-weighted value, and w(a ,i) 4 is the fourth pseudo-weighted value.

또한, l1은 제1 유사가중치값의 선택 여부를 나타낸 것이고, l2는 제2 유사가중치값의 선택 여부를 나타낸 것이고, l3은 제3 유사가중치값의 선택 여부를 나타낸 것이고, l4는 제4 유사가중치값의 선택 여부를 나타낸 것이며, 전술한 l1 내지 l4는 모두 선택한 경우엔 '1'의 값을 가지고 선택하지 않은 경우엔 '0'의 값을 가질 수 있다.In addition, l 1 indicates whether a first pseudo-weight value is selected, l 2 indicates whether a second pseudo-weight value is selected, l 3 indicates whether a third pseudo-weight value is selected, and l 4 The fourth pseudo-weighted value is selected, and the above-described l 1 to l 4 may have a value of '1' when all are selected, and a value of '0' if not selected.

이때, 상기 수학식 4에서 제1 유사가중치값(w1), 제2 유사가중치값(w2), 제3 유사가중치값(w3) 및 제4 유사가중치값(w4) 각각의 앞에 붙은 사칙 연산 부호('+' 또는 '-')는 전술한 상기 표 3에 기초한 것일 수 있다.At this time, in Equation 4, the first pseudo-weight value (w 1 ), the second pseudo-weight value (w 2 ), the third pseudo-weight value (w 3 ) and the fourth pseudo-weight value (w 4 ) attached to each The arithmetic operation code ('+'or'-') may be based on Table 3 above.

이 경우, 기존 고객(i)이 j번째 상품을 구매하는 경우에 대응되는 제1 유사가중치값(w1)과 제2 유사가중치값(w2)은 각각 양(w > 0)의 값과 음(w < 0)의 값을 가짐에 따라, 제1 유사가중치값(w)은 추천 점수(Pak)의 산출 시 합산(+)되고 제2 유사가중치값(w)은 추천 점수(Pak)의 산출 시 감산(-)될 수 있다.In this case, the first pseudo-weighted value w 1 and the second pseudo-weighted value w 2 corresponding to the case where the existing customer i purchases the j-th product are positive (w> 0) and negative, respectively. As it has a value of (w <0), the first pseudo-weighted value (w) is summed (+) when calculating the recommended score (P ak ) and the second pseudo-weighted value (w) is the recommended score (P ak ) It can be subtracted (-) when calculating.

또한, 기존 고객(i)이 j번째 상품을 구매하지 않는 경우에 대응되는 제3 유사가중치값(w3)과 제4 유사가중치값(w4)은 각각 양(w > 0)의 값과 음(w < 0)의 값을 가짐에 따라, 제3 유사가중치값(w3)은 추천 점수(Pak)의 산출 시 감산(-)되고 제4 유사가중치값(w4)은 추천 점수(Pak)의 산출 시 합산(+)될 수 있다.In addition, the third pseudo-weighted value w 3 and the fourth pseudo-weighted value w 4 corresponding to the case where the existing customer i does not purchase the j-th product are positive (w> 0) and negative, respectively. As it has a value of (w <0), the third pseudo-weighted value (w 3 ) is subtracted (-) when calculating the recommended score (P ak ) and the fourth pseudo-weighted value (w 4 ) is the recommended score (P) When calculating ak ), it can be summed (+).

한편, 추천 점수 산출부(500)는, 제1 유사가중치값(w1)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제1 기여도 계수를 곱한 제1값과, 제2 유사가중치값(w2)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제2 기여도 계수를 곱한 제2값과, 제3 유사가중치값(w3)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제3 기여도 계수를 곱한 제3값과, 제4 유사가중치값(w4)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제4 기여도 계수를 곱한 제4값을 각각 산출한 후, 상기 제1값, 상기 제2값, 상기 제3값 및 상기 제4값 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 추천 점수(Pak)를 산출할 수도 있다.On the other hand, the recommendation score calculation unit 500, the first similar weight value (w 1 ) and corresponding to the existing customer (i) and new customer (a) of each state value (v ij , v aj ) frequency of purchase The first value multiplied by the first contribution factor based on (Fp), the second pseudo-weighted value (w 2 ), and the corresponding state values (v ij ,v aj ) of each of the existing customers (i) and new customers (a). ), the second value multiplied by the second contribution factor based on the purchase frequency (Fp), and the third pseudo-weighted value (w 3 ) and the corresponding status values of the existing customers (i) and new customers (a) ( The third value multiplied by the third contribution factor based on the purchase frequency (Fp) according to v ij ,v aj ), and the fourth pseudo-weighted value (w 4 ) and the corresponding existing customer (i) and new customer (a) After calculating the fourth value multiplied by the fourth contribution coefficient based on the purchase frequency Fp according to the respective state values v ij and v aj , the first value, the second value, the third value, and The recommendation score Pak may be calculated based on the sum or subtraction result depending on whether each of the fourth values is selected.

아래의 수학식 6은 기존 고객(i)과 신규 고객(a)의 구매 여부 및 구매 빈도에 따른 기여도와 피어슨 상관관계를 고려한 추천 점수(Pak)에 대한 수식을 정리하여 나타낸 것이다.Equation 6 below summarizes the formulas for the recommendation score (P ak ) considering the correlation between the existing customers (i) and the new customers (a) and the purchase frequency and the contribution and Pearson correlation.

Figure pat00015
Figure pat00015

또한, 아래의 수학식 7 내지 수학식 10은 전술한 상기 제1값, 상기 제2값, 상기 제3값 및 상기 제4값 각각에 대한 수식을 정리하여 나타낸 것이다.In addition, Equation 7 to Equation 10 below are a summary of equations for each of the first value, the second value, the third value, and the fourth value.

Figure pat00016
Figure pat00016

Figure pat00017
Figure pat00017

Figure pat00018
Figure pat00018

Figure pat00019
Figure pat00019

여기서,

Figure pat00020
은 제1 기여도 계수를 나타내고,
Figure pat00021
은 제2 기여도 계수를 나타내고,
Figure pat00022
은 제3 기여도 계수를 나타내고,
Figure pat00023
은 제4 기여도 계수를 나타낸다.here,
Figure pat00020
Denotes a first contribution coefficient,
Figure pat00021
Denotes the second contribution coefficient,
Figure pat00022
Denotes the third contribution coefficient,
Figure pat00023
Indicates the fourth contribution coefficient.

이때, "00"은 기존 고객(i)의 상태값이 '0(비구매)'이고 신규 고객(a)의 상태값이 '0(비구매)'인 경우에 대응되는 위치인 (0,0)에 대한 구매 빈도수를 나타내고, "11"은 기존 고객(i)의 상태값이 '1(구매)'이고 신규 고객(a)의 상태값이 '1(구매)'인 경우에 대응되는 위치인 (1,1)에 대한 구매 빈도수를 나타내고, "10"은 기존 고객(i)의 상태값이 '1(구매)'이고 신규 고객(a)의 상태값이 '0(비구매)'인 경우에 대응되는 위치인 (1,0)에 대한 구매 빈도수를 나타내고, "01"은 기존 고객(i)의 상태값이 '0(비구매)'이고 신규 고객(a)의 상태값이 '1(구매)'인 경우에 대응되는 위치인 (0,1)에 대한 구매 빈도수를 나타내는 것일 수 있다.At this time, "00" is the location corresponding to (0,0) where the status value of the existing customer (i) is '0 (non-purchase)' and the status value of the new customer (a) is '0 (non-purchase)'. "11" is the location corresponding to the case where the status value of the existing customer (i) is '1 (purchase)' and the status value of the new customer (a) is '1 (purchase)'. ,1) indicates the frequency of purchase, and "10" corresponds to the case where the status value of the existing customer (i) is '1 (purchase)' and the status value of the new customer (a) is '0 (non-purchase)'. Represents the frequency of purchase for location (1,0), and "01" means that the status value of the existing customer (i) is '0 (non-purchase)' and the status value of the new customer (a) is '1 (purchase)'. It may indicate the purchase frequency for (0,1), which is a corresponding location.

여기서, 전술한 바와 마찬가지로, w(a,i)1은 제1 유사가중치값이고, w(a,i)2는 제2 유사가중치값이고, w(a,i)3는 제3 유사가중치값이고, w(a,i)4는 제4 유사가중치값이다.Here, as described above, w(a,i) 1 is the first pseudo-weighted value, w(a,i) 2 is the second pseudo-weighted value, and w(a,i) 3 is the third pseudo-weighted value And w(a,i) 4 is the fourth pseudo-weighted value.

또한, l1은 제1 유사가중치값들의 합의 선택 여부를 나타낸 것이고, l2는 제2 유사가중치값들의 합의 선택 여부를 나타낸 것이고, l3은 제3 유사가중치값들의 합의 선택 여부를 나타낸 것이고, l4는 제4 유사가중치값들의 합의 선택 여부를 나타낸 것이며, 전술한 l1 내지 l4는 모두 선택한 경우엔 '1'의 값을 가지고 선택하지 않은 경우엔 '0'의 값을 가질 수 있다.In addition, l 1 indicates whether the sum of the first pseudo-weighted values is selected, l 2 indicates whether the sum of the second pseudo-weighted values is selected, l 3 indicates whether the sum of the third pseudo-weighted values is selected, l 4 indicates whether the sum of the fourth pseudo-weighted values is selected, and l 1 to l 4 described above may have a value of '1' when all are selected and a value of '0' if not selected.

이하, 전술한 본 발명에 따른 협업적 필터링 알고리즘을 이용한 상품 구매 관련 데이터 분석 장치를 이용하여 추천 점수를 산출하는 실시예에 대해 설명하면 다음과 같다.Hereinafter, an embodiment in which the recommendation score is calculated using the data analysis device related to product purchase using the collaborative filtering algorithm according to the present invention will be described.

여기서, 본 발명에 따른 상품 구매 관련 데이터 분석 장치는 전술한 구성들, 즉, 저장부(100), 구매 데이터 생성부(300) 및 추천 점수 산출부(500)를 모두 포함할 수 있다.Here, the product purchase related data analysis apparatus according to the present invention may include all of the above-described components, that is, the storage unit 100, the purchase data generation unit 300, and the recommendation score calculation unit 500.

아래의 표 4는 추천 점수 산출부(500)에 의해 도 2에 도시된 복수 개의 영역에 기초하여 각각의 영역별로 대응되는 고객수, 상품 개수, 구매횟수 및 구매 비율을 정리하여 나타낸 것이다.Table 4 below shows the customer number, product number, number of purchases, and purchase rate corresponding to each area based on the plurality of areas shown in FIG. 2 by the recommendation score calculating unit 500.

Figure pat00024
Figure pat00024

또한, 아래의 표 5는 상기 표 4에 기초한 데이터를 상기 수학식 6에 적용하여 추천 점수(Pak)를 산출하되, 기존 고객(i)이 구매한 경우에 기초한 제1 유사가중치값(w1) 및 제2 유사가중치값(w2)만 반영하여 산출한 제1 추천 점수와, 기존 고객(i)이 구매한 경우에 기초한 제1 유사가중치값(w1) 및 제2 유사가중치값(w2)과 더불어 기존 고객(i)이 구매하지 않은 경우에 기초한 제3 유사가중치값(w3) 및 제4 유사가중치값(w4)을 모두 반영하여 산출한 제2 추천점수를 상품별(N=1,2,3,4,5)로 정리하여 나타낸 것이다.In addition, Table 5 below applies the data based on Table 4 to Equation (6) to calculate the recommended score (P ak ), but the first pseudo-weighted value (w 1 ) based on the case where the existing customer (i) purchased ) And the second similar weight value (w 2 ), the first recommendation score calculated by reflecting only, and the first similar weight value (w 1 ) and the second similar weight value (w) based on the purchase by the existing customer (i) In addition to 2 ), the second recommended score calculated by reflecting both the third similar weight value (w 3 ) and the fourth similar weight value (w 4 ) based on the case where the existing customer (i) has not purchased by product (N= 1,2,3,4,5).

여기서, 제1 유사가중치값(w1)은 기존 고객(i)이 소정 상품을 구매한 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 것이고, 제2 유사가중치값(w2)은 기존 고객(i)이 해당 상품을 구매하지 않은 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 것이고, 제3 유사가중치값(w3)은 기존 고객(i)이 해당 상품을 구매한 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 것이고, 제4 유사가중치값(w4)은 기존 고객(i)이 해당 상품을 구매하지 않은 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 것일 수 있다.Here, the first similar weight value (w 1 ) is based on the result of applying a positive Pearson correlation when the existing customer (i) purchases a predetermined product, and the second similar weight value (w 2 ) is the existing customer ( i) is based on the result of applying the negative Pearson correlation when the product is not purchased, and the third pseudo-weighted value (w 3 ) is negative Pearson's correlation when the existing customer (i) purchases the product. It is based on the result of applying the relationship, and the fourth pseudo-weighted value w 4 may be based on the result of applying the positive Pearson correlation when the existing customer i has not purchased the product.

Figure pat00025
Figure pat00025

예컨대, 상기 표 5를 참조하여 제1 추천 정확도와 제2 추천 정확도를 비교해보면, 한 개의 상품을 추천한 경우, 두 개의 상품을 추천한 경우, 세 개의 상품을 추천한 경우, 네 개의 상품을 추천한 경우에서 제1 추천 정확도보다 제2 추천 정확도가 더 높은 것을 확인할 수 있으므로, 기존 고객(i)이 구매한 경우와 구매하지 않은 경우를 모두 고려하였을 때의 추천 성능이 가장 높다는 것을 알 수 있게 된다.For example, when comparing the first recommendation accuracy and the second recommendation accuracy with reference to Table 5, when one product is recommended, two products are recommended, three products are recommended, and four products are recommended In one case, since it can be confirmed that the second recommendation accuracy is higher than the first recommendation accuracy, it can be seen that the recommended performance is highest when considering both the case where the existing customer i purchased and the case where the existing recommendation is not purchased. .

도 3은 본 발명의 일 실시예에 따른 협업적 필터 알고리즘을 이용한 상품 구매 관련 데이터 분석 방법을 나타낸 순서도이다.3 is a flowchart illustrating a method for analyzing data related to product purchase using a collaborative filter algorithm according to an embodiment of the present invention.

이하, 도 3 및 전술한 도면들을 참조하여 본 발명의 일 실시예에 따른 협업적 필터 알고리즘을 이용한 상품 구매 관련 데이터 분석 방법에 대해 설명하도록 한다.Hereinafter, a method for analyzing data related to product purchase using a collaborative filter algorithm according to an embodiment of the present invention will be described with reference to FIG. 3 and the aforementioned drawings.

먼저, 복수 개의 상품에 대한 상품 정보를 저장한다(S100).First, product information for a plurality of products is stored (S100).

여기서, 상기 상품 정보(101)는 복수 개의 상품 각각의 상품명 및 상품 종류에 대한 정보를 포함할 수 있다.Here, the product information 101 may include information about a product name and a product type of each of a plurality of products.

이때, 상기 상품 정보(101)에 대응되는 상품은 해당 상품을 구입하여 소유할 수 있는 유형의 물체에 한정되지 않으며, 소정의 티켓값을 지급하는 구매 행위를 통해 관람 또는 영위할 수 있는 무형적인 가치가 있는 문화상품(예컨대, 영화, 공연, 콘서트 등)을 포함할 수도 있다.At this time, the product corresponding to the product information 101 is not limited to an object of a type that can be purchased and owned, and an intangible value that can be viewed or operated through a purchase act that pays a predetermined ticket value. It may also include cultural products (eg, movies, performances, concerts, etc.).

다음으로, 소정 기간 동안 S100 단계에 기저장된 복수 개의 상품 중 적어도 하나를 구매한 기존 고객에 대한 기존 고객 정보를 저장한다(S200).Next, existing customer information about an existing customer who purchased at least one of a plurality of products previously stored in step S100 for a predetermined period is stored (S200).

여기서, 상기 기존 고객 정보(102)는 고객명과 해당 고객이 구매한 상품에 대응되는 상품명에 대한 정보를 포함할 수 있다.Here, the existing customer information 102 may include information on a customer name and a product name corresponding to the product purchased by the customer.

다음으로, 복수 개의 상품 각각에 대한 기존 고객(i)의 상품별 구매 여부(Wp) 및 구매 빈도수(Fp)에 기초한 구매 데이터(D)를 생성한다(S300).Next, purchase data D based on whether the existing customer i purchases by product (Wp) and purchase frequency (Fp) for each of the plurality of products is generated (S300).

여기서, 구매 데이터(D)를 생성하는 단계(S300)는, S100 단계에 기저장된 복수 개의 상품 각각을 하나의 열로 하고 S200 단계에 기저장된 복수의 고객 각각을 하나의 행으로 하는 소정의 제1 매트릭스(M1)를 구성한 후, 소정 고객의 상품별 구매 여부에 대한 이진수 형태의 상태값을 이에 대응되는 행과 열 위치에 매칭시킨 제1 구매 데이터(D1)를 생성하는 단계(S320)를 포함할 수 있다.Here, the step (S300) of generating purchase data D is a predetermined first matrix in which each of a plurality of products pre-stored in step S100 is a column and each of a plurality of customers pre-stored in step S200 is a row. After configuring (M1), it may include a step (S320) of generating the first purchase data (D 1 ) by matching the status values in binary form for whether or not a given customer purchases by product to corresponding row and column positions. have.

이때, 상기 상태값은 1비트 방식의 이진수 형태로서, 해당 행에 대응되는 고객이 해당 열에 대응되는 상품을 구매한 경우에 '1'의 값을 가지고 그렇지 않은 경우에 '0'의 값을 가지는 것일 수 있다.At this time, the status value is a 1-bit binary format, and if a customer corresponding to a corresponding row purchases a product corresponding to a corresponding column, it has a value of '1' and a value of '0' otherwise. Can.

또한, 구매 데이터(D)를 생성하는 단계(S300)는, 소정 상품에 대한 기존 고객(i)의 구매 여부에 따른 각각의 상태값을 하나의 열로 하고 해당 상품에 대한 신규 고객(a)의 구매 여부에 따른 각각의 상태값을 하나의 행으로 하는 소정의 제2 매트릭스(M2)를 구성한 후, 기존 고객(i)과 신규 고객(a)이 각각 소정의 상태값을 가질 때 이에 대응되는 경우의 구매 빈도수(Fp)를 이에 대응되는 행과 열 위치에 매칭시킨 제2 구매 데이터(D2)를 생성하는 단계(S340)를 더 포함할 수 있다.In addition, in the step of generating purchase data D (S300), each status value according to whether or not an existing customer i for a given product is purchased is set as one column, and a new customer (a) is purchased for the corresponding product. When a predetermined second matrix (M2) having each status value as one row according to whether or not is configured, and when the existing customer (i) and the new customer (a) each have a predetermined status value, corresponding to this The method may further include generating the second purchase data D 2 matching the purchase frequency Fp to the corresponding row and column positions (S340 ).

이때, 상기 상태값은 1비트 방식의 이진수 형태로서, 소정의 행에 대응되는 신규 고객(a)의 구매 여부에 대한 제1 상태값("0" 또는 "1")과 소정의 열에 대응되는 기존 고객(i)의 구매 여부에 대한 제2 상태값("0" 또는 "1")을 포함하며, 어느 하나의 특정한 행과 열에 대응되는 위치에는 해당 행과 열에 각각 대응되는 상기 제1 상태값 및 상기 제2 상태값을 순차적으로 나열한 값, 예컨대, "00", "01", "10", "11"이 매칭되는 것일 수 있다.At this time, the status value is a binary form of a 1-bit method, and the first status value ("0" or "1") for whether or not a new customer (a) corresponding to a predetermined row is purchased and an existing one corresponding to a predetermined column It includes a second state value ("0" or "1") of whether or not the customer i is purchased, and the first state value corresponding to the corresponding row and column, respectively, at a position corresponding to any one specific row and column, and The values sequentially listing the second status values, for example, “00”, “01”, “10”, and “11” may be matched.

다음으로, 상기 구매 데이터에 양 또는 음의 피어슨 상관관계를 적용한 결과에 기초하여 소정 상품에 대한 신규 고객의 구매 가능성에 해당하는 추천 점수(Pak)를 산출한다(S400).Next, based on the result of applying the positive or negative Pearson correlation to the purchase data, a recommendation score (P ak ) corresponding to a new customer's purchase possibility for a predetermined product is calculated (S400).

여기서, 추천 점수(Pak)를 산출하는 단계(S400)는, 기존 고객(i)이 상품을 구매한 경우(vij=1)와 기존 고객(i)이 상품을 구매하지 않은 경우(vij=0)에 각각 양의 피어슨 상관관계와 음의 피어슨 상관관계를 적용한 결과에 기초한 유사가중치값(w(a,i), 이하 'w'라고 함)을 모두 반영하여 추천 점수(Pak)를 산출할 수 있다.Here, in the step of calculating the recommendation score P ak (S400), when the existing customer (i) purchases the product (v ij =1) and when the existing customer (i) does not purchase the product (v ij) The recommended score (P ak ) is reflected by reflecting all the similar weight values (w(a,i), hereinafter referred to as'w') based on the result of applying the positive Pearson correlation and the negative Pearson correlation to =0), respectively. Can be calculated.

이때, 상기 피어슨 상관관계는 두 연속형 변수 간의 선형 연관성을 검정하기 위해 사용되는 일종의 통계 분석 방법에 해당하는 것으로서, 예컨대, "-1" 내지 "+1" 사이의 상관계수가 도출되는데, 상기 상관계수가 "+1"에 가까운 양(+)의 값을 가지는 경우엔 두 변수 간에 양의 선형 연관성이 있는 것으로 판단하고, 상기 상관계수가 "-1"에 가까운 음(-)의 값을 가지는 경우엔 두 변수 간에 음의 선형 연관성이 있는 것으로 판단할 수 있다.In this case, the Pearson correlation corresponds to a kind of statistical analysis method used to test a linear correlation between two continuous variables, for example, a correlation coefficient is derived between "-1" to "+1". When the coefficient has a positive value close to "+1", it is determined that there is a positive linear correlation between the two variables, and the correlation coefficient has a negative value close to "-1" It can be judged that there is a negative linear relationship between the two variables.

여기서, 추천 점수(Pak)를 산출하는 단계(S400)는, 전술한 유사가중치값(w)을 산출함에 있어서, 신규 고객(a)의 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제1 상태값(vaj)과 상품별 구매 여부에 대한 제1 평균 상태값(

Figure pat00026
)의 제1 차분값(dv1)과, 기존 고객(i)의 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제2 상태값(vij)과 상품별 구매 여부에 대한 제2 평균 상태값(
Figure pat00027
)의 제2 차분값(dv2)을 산출한 후, 복수 개의 상품 각각에 대하여 상기 제1 차분값(dv1)과 상기 제2 차분값(dv2)을 곱해서 합한 값을 분자로 하고, 복수 개의 상품 각각에 대한 상기 제1 차분값(dv1)의 제곱합과 상기 제2 차분값(dv2)의 제곱합의 곱의 제곱근값을 분모로 하여 유사가중치값(w)을 산출할 수 있다.Here, in the step of calculating the recommendation score (P ak ) (S400), in calculating the above-mentioned similar weight value (w), whether or not to purchase any one of a plurality of products of the new customer (a) The first state value (v aj ) and the first average state value for purchase by product (
Figure pat00026
)'S first difference value (dv 1 ), and a second state value (v ij ) of whether or not to purchase one specific product among a plurality of products of the existing customer (i) and a second average state of whether to purchase by product value(
Figure pat00027
) A second difference value (dv 2) then calculated, and the for each of a plurality of product sum by multiplying said first difference value (dv 1) and the second difference value (dv 2) values in the molecule, a plurality of The pseudo-weight value w may be calculated by using the square root of the product of the square sum of the first difference value dv 1 and the square sum of the second difference value dv 2 for each of the products.

이와 관련하여, 상기 도 2를 참조하면, S100 단계 및 S200 단계에 각각 기저장된 상품 정보(101)의 총 개수가 'm'개이고 기존 고객 정보(102)의 총 개수가 'n'개일 때, 'i×j'영역은 기존 고객(i)이 구매한 j번째 상품에 대응되는 상태값에 대한 행렬 데이터이고, 'a×j'영역은 신규 고객(a)이 구매한 j번째 상품에 대응되는 상태값에 대한 행렬 데이터일 수 있다.In this regard, referring to FIG. 2, when the total number of product information 101 previously stored in steps S100 and S200 is'm' and the total number of existing customer information 102 is'n', ' The i×j' area is matrix data for the state value corresponding to the j-th product purchased by the existing customer (i), and the'a×j' area corresponds to the j-th product purchased by the new customer (a). It may be matrix data for a value.

이때, j는 1부터 m까지에 해당하는 자연수 중 어느 하나의 값에 해당하고 i는 1부터 n까지에 해당하는 자연수 중 어느 하나의 값에 해당할 수 있다.At this time, j may correspond to any one of natural numbers corresponding to 1 to m, and i may correspond to any one of natural numbers corresponding to 1 to n.

이 경우, 'vij'는 'i×j'영역에 대응되는 값으로서 기존 고객(i)의 총 m개의 상품 중 j번째 순서에 대응되는 상품의 구매 여부에 대한 상태값을 나타내고, 'vaj'는 'a×j'영역에 대응되는 값으로서 신규 고객(a)의 총 m개의 상품 중 j번째 순서에 대응되는 상품의 구매 여부에 대한 상태값을 나타낼 수 있다.In this case,'v ij 'is a value corresponding to the'i ×j' area, and indicates a status value of whether to purchase a product corresponding to the j-th order among m products of the existing customer (i), and'v aj 'Is a value corresponding to the'a×j' area, and may indicate a status value of whether to purchase a product corresponding to the j-th order among m products of the new customer a.

구체적으로, 추천 점수(Pak)를 산출하는 단계(S400)는, 기존 고객(i)이 소정 상품을 구매한 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제1 유사가중치값(w(a,i)1, 이하 w1이라고 함)과, 기존 고객(i)이 해당 상품을 구매하지 않은 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제2 유사가중치값(w(a,i)2, 이하 w2라고 함)과, 기존 고객(i)이 해당 상품을 구매한 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제3 유사가중치값(w(a,i)3, 이하 w3이라고 함)과, 기존 고객(i)이 해당 상품을 구매하지 않은 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제4 유사가중치값(w(a,i)4, 이하 w4라고 함)을 각각 산출한 후, 상기 제1 유사가중치값(w1), 상기 제2 유사가중치값(w2), 상기 제3 유사가중치값(w3) 및 상기 제4 유사가중치값(w4) 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 추천 점수(Pak)를 산출할 수 있다.Specifically, in the step of calculating the recommendation score P ak (S400), when the existing customer i purchases a predetermined product, the first pseudo-weighted value based on the result of applying the positive Pearson correlation (w(a ,i) 1, hereinafter referred to as w 1 ) and the second pseudo-weighted value (w(a,i) 2 ) based on the result of applying a negative Pearson correlation when the existing customer (i) has not purchased the product. , Hereinafter referred to as w 2 ) and a third pseudo-weighted value (w(a,i) 3, less than w 3 ) based on the result of applying a negative Pearson correlation when an existing customer (i) purchases the product ) And the fourth pseudo-weighted value (w(a,i) 4, hereinafter referred to as w 4 ) based on the result of applying a positive Pearson correlation when the existing customer (i) has not purchased the product. After calculation, selection of each of the first pseudo-weighted value w 1 , the second pseudo-weighted value w 2 , the third pseudo-weighted value w 3 and the fourth pseudo-weighted value w 4 The recommendation score Pak may be calculated based on the summation or subtraction result depending on whether or not.

이와 관련하여, 기존 고객(i)과 신규 고객(a)의 구매 여부와 피어슨 상관관계를 고려한 추천 점수(Pak)에 대한 수식에 해당하는 수학식 4를 이용할 수 있으며, 상기 수학식 4에 관한 구체적인 내용은 이미 서술한 바 생략하도록 한다.In this regard, Equation 4 corresponding to the equation for the recommendation score P ak considering the correlation between the purchase of the existing customer (i) and the new customer (a) and Pearson may be used, and the equation 4 The detailed contents will be omitted as already described.

이 경우, 기존 고객(i)이 j번째 상품을 구매하는 경우에 대응되는 제1 유사가중치값(w1)과 제2 유사가중치값(w2)은 각각 양(w > 0)의 값과 음(w < 0)의 값을 가짐에 따라, 제1 유사가중치값(w)은 추천 점수(Pak)의 산출 시 합산(+)되고 제2 유사가중치값(w)은 추천 점수(Pak)의 산출 시 감산(-)될 수 있다.In this case, the first pseudo-weighted value w 1 and the second pseudo-weighted value w 2 corresponding to the case where the existing customer i purchases the j-th product are positive (w> 0) and negative, respectively. As it has a value of (w <0), the first pseudo-weighted value (w) is summed (+) when calculating the recommended score (P ak ) and the second pseudo-weighted value (w) is the recommended score (P ak ) It can be subtracted (-) when calculating.

한편, 추천 점수(Pak)를 산출하는 단계(S400)는, 제1 유사가중치값(w1)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제1 기여도 계수를 곱한 제1값(p1)과, 제2 유사가중치값(w2)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제2 기여도 계수를 곱한 제2값(p2)과, 제3 유사가중치값(w3)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제3 기여도 계수를 곱한 제3값(p3)과, 제4 유사가중치값(w4)과 이에 대응되는 기존 고객(i) 및 신규 고객(a) 각각의 상태값(vij,vaj)에 따른 구매 빈도수(Fp)에 기초한 제4 기여도 계수를 곱한 제4값(p4)을 각각 산출한 후, 상기 제1값(p1), 상기 제2값(p2), 상기 제3값(p3) 및 상기 제4값(p4) 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 추천 점수(Pak)를 산출할 수도 있다.On the other hand, in the step of calculating the recommendation score P ak (S400), the first pseudo-weighted value w 1 and the corresponding state values of the existing customers i and new customers a, respectively v ij ,v aj ), the first value (p 1 ) multiplied by the first contribution factor based on the purchase frequency (Fp), the second similar weight value (w 2 ), and the corresponding existing customer (i) and new customer (a) The second value (p 2 ) multiplied by the second contribution factor based on the purchase frequency (Fp) according to each state value (v ij ,v aj ), and the third similar weight value (w 3 ) and the corresponding existing customer (i) and a new customer (a) a third value (p 3 ) multiplied by a third contribution factor based on the purchase frequency (Fp) according to the respective state values (v ij ,v aj ) and a fourth pseudo-weighted value ( w 4 ) and the fourth value (p 4) multiplied by the fourth contribution factor based on the purchase frequency (Fp) according to the status values (v ij ,v aj ) of the existing customers (i) and new customers (a) corresponding thereto. ), and then summed according to whether each of the first value (p 1 ), the second value (p 2 ), the third value (p 3 ), and the fourth value (p 4 ) is selected or The recommendation score Pak may be calculated based on the subtracted result.

이와 관련하여, 기존 고객(i)과 신규 고객(a)의 구매 여부 및 구매 빈도에 따른 기여도와 피어슨 상관관계를 고려한 추천 점수(Pak)에 대한 수식에 해당하는 수학식 6을 이용할 수 있으며, 상기 수학식 6에 관한 구체적인 내용은 이미 서술한 바 생략하도록 한다.In this regard, Equation (6) corresponding to the formula for the recommendation score (P ak ) considering the contribution and Pearson correlation according to the purchase frequency and purchase frequency of the existing customer (i) and the new customer (a) may be used, The detailed description of Equation 6 will be omitted as already described.

이에 따라, 전술한 본 발명에 의하면, 소정 상품에 대한 추천 점수 산출 시 기존 고객이 해당 상품을 구매한 경우와 그렇지 않은 경우 각각의 피어슨 상관관계에 대한 데이터의 기여도 비율을 함께 고려하여 추천 성능을 향상시킬 수 있는 효과가 있다.Accordingly, according to the present invention described above, when calculating the recommendation score for a given product, the existing customer purchases the product and otherwise, considers the contribution ratio of data for each Pearson correlation together to improve the recommendation performance There is an effect that can be made.

또한, 본 발명에 의하면, 기존 고객의 구매 여부 및 구매 빈도에 기초한 신규 고객의 예상 구매 가능성에 따른 최적 조합을 선택하는 간단한 알고리즘을 통해 다양한 유형의 상품에 대한 추천 점수의 산출 시 범용적으로 적용 가능한 이점이 있다.In addition, according to the present invention, it is possible to apply universally when calculating recommendation scores for various types of products through a simple algorithm that selects the optimal combination according to the expected purchaseability of a new customer based on the purchase frequency and purchase frequency of an existing customer. There is an advantage.

이상, 바람직한 실시예를 통하여 본 발명에 관하여 상세히 설명하였으나, 본 발명은 이에 한정되는 것은 아니며 특허청구범위 내에서 다양하게 실시될 수 있다.As described above, the present invention has been described in detail through preferred embodiments, but the present invention is not limited thereto and may be variously implemented within the scope of the claims.

특히, 전술한 내용은 후술할 발명의 청구범위를 더욱 잘 이해할 수 있도록 본 발명의 특징과 기술적 강점을 다소 폭넓게 상술하였으므로, 상술한 본 발명의 개념과 특정 실시예는 본 발명과 유사 목적을 수행하기 위한 다른 형상의 설계나 수정의 기본으로써 즉시 사용될 수 있음이 해당 기술 분야의 숙련된 사람들에 의해 인식되어야 한다.In particular, the foregoing has described the features and technical strengths of the present invention somewhat broadly to better understand the claims of the invention, which will be described later, so that the concept and specific embodiments of the present invention described above perform similar purposes to the present invention. It should be appreciated by those skilled in the art that it can be used immediately as the basis for designing or modifying other shapes for.

또한, 상기에서 기술된 실시예는 본 발명에 따른 하나의 실시예일 뿐이며, 해당 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술적 사상의 범위에서 다양한 수정 및 변경된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 따라서, 개시된 실시예는 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 하고, 이러한 다양한 수정 및 변경 또한 본 발명의 기술적 사상의 범위에 속하는 것으로 전술한 본 발명의 청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.In addition, the above-described embodiments are only one embodiment according to the present invention, and can be implemented in various modified and changed forms within the scope of the technical spirit of the present invention by those skilled in the art. You will understand. Therefore, the disclosed embodiments are to be considered in terms of explanation rather than limitation, and such various modifications and changes are also indicated in the claims of the present invention described above as belonging to the scope of the technical spirit of the present invention, and equivalent scope thereof. All differences within should be construed as being included in the present invention.

100: 저장부
300: 구매 데이터 생성부
500: 추천 점수 산출부
100: storage
300: purchase data generation unit
500: recommended score calculation unit

Claims (10)

복수 개의 상품에 대한 상품 정보를 저장하는 단계;
소정 기간 동안 상기 복수 개의 상품 중 적어도 하나를 구매한 기존 고객에 대한 기존 고객 정보를 저장하는 단계;
상기 복수 개의 상품 각각에 대한 상기 기존 고객의 상품별 구매 여부 및 구매 빈도수에 기초한 구매 데이터를 생성하는 단계; 및
상기 구매 데이터에 양 또는 음의 피어슨 상관관계를 적용한 결과에 기초하여 소정 상품에 대한 신규 고객의 구매 가능성에 해당하는 추천 점수를 산출하는 단계;를 포함하는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 방법.
Storing product information for a plurality of products;
Storing existing customer information about an existing customer who purchased at least one of the plurality of products for a predetermined period;
Generating purchase data based on whether each of the plurality of products is purchased for each product by the existing customer and the frequency of purchase; And
And calculating a recommendation score corresponding to a new customer's purchase possibility for a given product based on a result of applying a positive or negative Pearson correlation to the purchase data. How to recommend purchasing.
제1항에 있어서,
상기 추천 점수를 산출하는 단계는,
상기 기존 고객이 상기 상품을 구매한 경우와 상기 기존 고객이 상기 상품을 구매하지 않은 경우에 각각 양의 피어슨 상관관계와 음의 피어슨 상관관계를 적용한 결과에 기초한 유사가중치값을 모두 반영하여 상기 추천 점수를 산출하는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 방법.
According to claim 1,
The step of calculating the recommended score,
The recommendation score reflects all the similar weights based on the result of applying the positive Pearson correlation and the negative Pearson correlation, respectively, when the existing customer purchases the product and when the existing customer does not purchase the product Product recommendation-related recommendation method using a collaborative filter algorithm, characterized in that for calculating.
제2항에 있어서,
상기 추천 점수를 산출하는 단계는,
상기 기존 고객이 상기 상품을 구매한 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제1 유사가중치값과, 상기 기존 고객이 상기 상품을 구매하지 않은 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제2 유사가중치값과, 상기 기존 고객이 상기 상품을 구매한 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제3 유사가중치값과, 상기 기존 고객이 상기 상품을 구매하지 않은 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제4 유사가중치값을 각각 산출한 후,
상기 제1 유사가중치값, 상기 제2 유사가중치값, 상기 제3 유사가중치값 및 상기 제4 유사가중치값 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 상기 추천 점수를 산출하는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 방법.
According to claim 2,
The step of calculating the recommended score,
A first pseudo-weighted value based on a result of applying a positive Pearson correlation when the existing customer purchases the product, and a result based on applying a negative Pearson correlation when the existing customer does not purchase the product. A second similar weight value, a third similar weight value based on a result of applying a negative Pearson correlation when the product is purchased by the existing customer, and a positive Pearson when the existing customer does not purchase the product After calculating the fourth similar weight value based on the result of applying the correlation,
The recommendation score is calculated based on the sum or subtraction result according to whether each of the first pseudo-weight value, the second pseudo-weight value, the third pseudo-weight value, and the fourth pseudo-weight value is selected. Product purchasing recommendation method using collaborative filter algorithm.
제3항에 있어서,
상기 추천 점수를 산출하는 단계는,
상기 제1 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 구매 여부에 대한 상태값에 따른 구매 빈도수에 기초한 제1 기여도 계수를 곱한 제1값과,
상기 제2 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 구매 여부에 대한 상태값에 따른 구매 빈도수에 기초한 제2 기여도 계수를 곱한 제2값과,
상기 제3 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 구매 여부에 대한 상태값에 따른 구매 빈도수에 기초한 제3 기여도 계수를 곱한 제3값과,
상기 제4 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 구매 여부에 대한 상태값에 따른 구매 빈도수에 기초한 제4 기여도 계수를 곱한 제4값을 각각 산출한 후,
상기 제1값, 상기 제2값, 상기 제3값 및 상기 제4값 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 상기 추천 점수를 산출하는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 방법.
According to claim 3,
The step of calculating the recommended score,
A first value multiplied by a first contribution factor based on a purchase frequency according to a status value for each purchase of the first pseudo-weighted value and the corresponding existing customer and the new customer;
A second value multiplied by a second contribution factor based on a purchase frequency according to a status value of whether the second pseudo-weighted value corresponds to the purchase status of each of the existing customers and the new customers corresponding thereto;
A third value multiplied by the third similarity value and a third contribution factor based on the purchase frequency according to the status value of each of the existing customers and the new customers corresponding to the purchase, and
After calculating the fourth similarity value and the fourth value multiplied by the fourth contribution coefficient based on the purchase frequency according to the status value for each purchase of each of the existing customers and the new customers corresponding thereto,
A product using a collaborative filter algorithm, characterized in that the recommendation score is calculated based on a sum or subtraction result depending on whether each of the first value, the second value, the third value, and the fourth value is selected. How to recommend purchasing.
제2항에 있어서,
상기 추천 점수를 산출하는 단계는,
상기 신규 고객의 상기 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제1 상태값과 상품별 구매 여부에 대한 제1 평균 상태값의 제1 차분값과, 상기 기존 고객의 상기 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제2 상태값과 상품별 구매 여부에 대한 제2 평균 상태값의 제2 차분값을 산출한 후,
상기 복수 개의 상품 각각에 대하여 상기 제1 차분값과 상기 제2 차분값을 곱해서 합한 값을 분자로 하고, 상기 복수 개의 상품 각각에 대한 상기 제1 차분값의 제곱합과 상기 제2 차분값의 제곱합의 곱의 제곱근값을 분모로 하여 상기 유사가중치값을 산출하는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 방법.
According to claim 2,
The step of calculating the recommended score,
Among the plurality of products of the existing customer and a first difference value between a first state value for whether to purchase a specific product among the plurality of products of the new customer and a first average state value for whether to purchase by product, etc. After calculating the second difference value between the second status value for whether or not to purchase one specific product and the second average status value for whether or not to purchase each product,
For each of the plurality of products, a product obtained by multiplying the first difference value and the second difference value is a numerator, and the sum of squares of the first difference value and the second difference value for each of the plurality of products A product-related recommendation method using a collaborative filter algorithm, characterized in that the square weight value of a product is used as a denominator to calculate the similar weight value.
복수 개의 상품에 대한 상품 정보와, 소정 기간 동안 상기 복수 개의 상품 중 적어도 하나를 구매한 기존 고객에 대한 기존 고객 정보를 각각 저장하는 저장부;
상기 복수 개의 상품 각각에 대한 상기 기존 고객의 상품별 구매 여부 및 구매 빈도수에 기초한 구매 데이터를 생성하는 구매 데이터 생성부; 및
상기 구매 데이터에 양 또는 음의 피어슨 상관관계를 적용한 결과에 기초하여 소정 상품에 대한 신규 고객의 구매 가능성에 해당하는 추천 점수를 산출하는 추천 점수 산출부;를 포함하는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템.
A storage unit for storing product information for a plurality of products and existing customer information for existing customers who have purchased at least one of the plurality of products for a predetermined period;
A purchase data generation unit for generating purchase data based on whether each of the plurality of products is purchased by each of the existing customers and purchased frequency; And
And a recommendation score calculating unit that calculates a recommendation score corresponding to a new customer's purchase possibility for a given product based on a result of applying a positive or negative Pearson correlation to the purchase data. Product recommendation system related to product purchase.
제6항에 있어서,
상기 추천 점수 산출부는,
상기 기존 고객이 상기 상품을 구매한 경우와 상기 기존 고객이 상기 상품을 구매하지 않은 경우에 각각 양의 피어슨 상관관계와 음의 피어슨 상관관계를 적용한 결과에 기초한 유사가중치값을 모두 반영하여 상기 추천 점수를 산출하는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템.
The method of claim 6,
The recommended score calculation unit,
The recommendation score reflects all the similar weights based on the result of applying the positive Pearson correlation and the negative Pearson correlation, respectively, when the existing customer purchases the product and when the existing customer does not purchase the product Product purchasing-related recommendation system using a collaborative filter algorithm, characterized in that to calculate.
제7항에 있어서,
상기 추천 점수 산출부는,
상기 기존 고객이 구매한 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제1 유사가중치값과, 상기 기존 고객이 구매하지 않은 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제2 유사가중치값과, 상기 기존 고객이 구매한 경우에 음의 피어슨 상관관계를 적용한 결과에 기초한 제3 유사가중치값과, 상기 기존 고객이 구매하지 않은 경우에 양의 피어슨 상관관계를 적용한 결과에 기초한 제4 유사가중치값을 각각 산출한 후,
상기 제1 유사가중치값, 상기 제2 유사가중치값, 상기 제3 유사가중치값 및 상기 제4 유사가중치값 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 상기 추천 점수를 산출하는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템.
The method of claim 7,
The recommended score calculation unit,
A first pseudo-weighted value based on the result of applying a positive Pearson correlation when the existing customer purchased, and a second pseudo-weighted value based on the result of applying a negative Pearson correlation if the existing customer did not purchase , A third pseudo-weighted value based on the result of applying a negative Pearson correlation when the existing customer purchased, and a fourth pseudo-weighted value based on the result of applying a positive Pearson correlation if the existing customer did not purchase After calculating each,
The recommendation score is calculated based on the sum or subtraction result according to whether each of the first pseudo-weight value, the second pseudo-weight value, the third pseudo-weight value, and the fourth pseudo-weight value is selected. Product purchasing related recommendation system using collaborative filter algorithm.
제8항에 있어서,
상기 추천 점수 산출부는,
상기 제1 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 상태값에 따른 구매 빈도수에 기초한 제1 기여도 계수를 곱한 제1값과,
상기 제2 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 상태값에 따른 구매 빈도수에 기초한 제2 기여도 계수를 곱한 제2값과,
상기 제3 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 상태값에 따른 구매 빈도수에 기초한 제3 기여도 계수를 곱한 제3값과,
상기 제4 유사가중치값과 이에 대응되는 상기 기존 고객 및 상기 신규 고객 각각의 상태값에 따른 구매 빈도수에 기초한 제4 기여도 계수를 곱한 제4값을 각각 산출한 후,
상기 제1값, 상기 제2값, 상기 제3값 및 상기 제4값 각각의 선택 여부에 따라 합산 또는 감산한 결과에 기초하여 상기 추천 점수를 산출하는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템.
The method of claim 8,
The recommended score calculation unit,
A first value multiplied by a first contribution factor based on a frequency of purchase according to the first pseudo-weighted value and the respective state values of the existing customers and the new customers corresponding thereto;
A second value multiplied by the second similarity weight value and a second contribution factor based on the frequency of purchase according to the status value of each of the existing and corresponding new customers;
A third value multiplied by the third similarity value and a third contribution factor based on the frequency of purchase according to the status values of each of the existing customers and the new customers corresponding thereto;
After calculating a fourth value multiplied by a fourth contribution factor based on the frequency of purchase according to each of the fourth pseudo-weighted value and the corresponding state values of the existing customers and the new customers, respectively,
A product using a collaborative filter algorithm, characterized in that the recommendation score is calculated based on a result of adding or subtracting according to whether each of the first value, the second value, the third value, and the fourth value is selected. Purchase-related recommendation system.
제7항에 있어서,
상기 추천 점수 산출부는,
상기 신규 고객의 상기 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제1 상태값과 상품별 구매 여부에 대한 제1 평균 상태값의 제1 차분값과, 상기 기존 고객의 상기 복수 개의 상품 중 어느 하나의 특정 상품의 구매 여부에 대한 제2 상태값과 상품별 구매 여부에 대한 제2 평균 상태값의 제2 차분값을 산출한 후,
상기 복수 개의 상품 각각에 대하여 상기 제1 차분값과 상기 제2 차분값을 곱해서 합한 값을 분자로 하고, 상기 복수 개의 상품 각각에 대한 상기 제1 차분값의 제곱합과 상기 제2 차분값의 제곱합의 곱의 제곱근값을 분모로 하여 상기 유사가중치값을 산출하는 것을 특징으로 하는 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템.
The method of claim 7,
The recommended score calculation unit,
Among the plurality of products of the existing customer and a first difference value between a first state value for whether to purchase a specific product among the plurality of products of the new customer and a first average status value for whether to purchase by product, etc. After calculating the second difference value between the second status value for whether or not one particular product is purchased and the second average status value for whether each product is purchased,
For each of the plurality of products, a product obtained by multiplying the first difference value and the second difference value is a numerator, and the sum of squares of the first difference value and the second difference value for each of the plurality of products A product recommendation system related to product purchase using a collaborative filter algorithm, characterized in that the square weight value of a product is used as a denominator to calculate the similar weight value.
KR1020180169851A 2018-12-26 2018-12-26 A recommendation system for product purchase using collaborative filtering algorism and method thereof KR102154411B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180169851A KR102154411B1 (en) 2018-12-26 2018-12-26 A recommendation system for product purchase using collaborative filtering algorism and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180169851A KR102154411B1 (en) 2018-12-26 2018-12-26 A recommendation system for product purchase using collaborative filtering algorism and method thereof

Publications (2)

Publication Number Publication Date
KR20200080024A true KR20200080024A (en) 2020-07-06
KR102154411B1 KR102154411B1 (en) 2020-09-09

Family

ID=71571670

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180169851A KR102154411B1 (en) 2018-12-26 2018-12-26 A recommendation system for product purchase using collaborative filtering algorism and method thereof

Country Status (1)

Country Link
KR (1) KR102154411B1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220042582A (en) 2020-09-28 2022-04-05 연세대학교 산학협력단 Recommendation System and Recommendation Method for Repeat-purchase Products using Modified Self Similarity
KR20220083636A (en) * 2020-12-09 2022-06-20 쿠팡 주식회사 Systems and methods for repeatable and adaptive electronic notifications
KR20220096342A (en) * 2020-12-31 2022-07-07 현대위아 주식회사 Application recommendation methods for machine tools and the systems used there

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090123398A (en) * 2008-05-28 2009-12-02 경희대학교 산학협력단 System and method for providing product recommendation service
KR20110019289A (en) * 2009-08-19 2011-02-25 서울대학교산학협력단 Goods recommendation system and method considering price of goods
KR101567684B1 (en) 2014-03-31 2015-11-10 경희대학교 산학협력단 Method for selecting recommendation type in product recommeding system
KR101567217B1 (en) 2014-05-29 2015-11-17 연세대학교 산학협력단 Method and system for recommendation with collaborative filtering using social network analysis
KR20180064324A (en) * 2016-12-05 2018-06-14 주식회사 원소프트다임 Appartus for recommendating of product and method using the same

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090123398A (en) * 2008-05-28 2009-12-02 경희대학교 산학협력단 System and method for providing product recommendation service
KR20110019289A (en) * 2009-08-19 2011-02-25 서울대학교산학협력단 Goods recommendation system and method considering price of goods
KR101567684B1 (en) 2014-03-31 2015-11-10 경희대학교 산학협력단 Method for selecting recommendation type in product recommeding system
KR101567217B1 (en) 2014-05-29 2015-11-17 연세대학교 산학협력단 Method and system for recommendation with collaborative filtering using social network analysis
KR20180064324A (en) * 2016-12-05 2018-06-14 주식회사 원소프트다임 Appartus for recommendating of product and method using the same

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220042582A (en) 2020-09-28 2022-04-05 연세대학교 산학협력단 Recommendation System and Recommendation Method for Repeat-purchase Products using Modified Self Similarity
KR20220083636A (en) * 2020-12-09 2022-06-20 쿠팡 주식회사 Systems and methods for repeatable and adaptive electronic notifications
US11489906B2 (en) 2020-12-09 2022-11-01 Coupang Corp. Systems and methods for recurrent and adaptive electronic notifications
KR20220096342A (en) * 2020-12-31 2022-07-07 현대위아 주식회사 Application recommendation methods for machine tools and the systems used there

Also Published As

Publication number Publication date
KR102154411B1 (en) 2020-09-09

Similar Documents

Publication Publication Date Title
De Felice et al. Performance measurement model for the supplier selection based on AHP
US20230018311A1 (en) Systems and methods for quantity determinations without predicting out of stock events
Mentzer et al. Logistics service quality as a segment-customized process
CN109242633A (en) A kind of commodity method for pushing and device based on bigraph (bipartite graph) network
US10387925B2 (en) System and method for integrating retail price optimization for revenue and profit with business rules
US9715702B2 (en) System and method for determining retail-business-rule coefficients from current prices
Rabby et al. Artificial intelligence in digital marketing influences consumer behaviour: A review and theoretical foundation for future research
KR20200080024A (en) A recommendation system for product purchase using collaborative filtering algorism and method thereof
US20080015910A1 (en) Ranking-based method and system for evaluating customer predication models
Chiu et al. Developing e-store marketing strategies to satisfy customers' needs using a new hybrid gray relational model
Bamansoor et al. Efficient Online Shopping Platforms in Southeast Asia
Seymen et al. Customer churn prediction using deep learning
Nasiri et al. Incorporating sales and marketing considerations into a competitive multi-echelon distribution network design problem with pricing strategy in a stochastic environment
CN114463028A (en) Alternative merchandise boosting service
Joo Rational inattention as an empirical framework: Application to the welfare effects of new-product introduction
JP7423694B2 (en) Machine learning methods, training methods, prediction systems, and non-transitory computer-readable media
Chen et al. Managing the personalized order-holding problem in online retailing
US10210530B1 (en) Selecting a report
Aouadni et al. Supplier selection: an analytic network process and imprecise goal programming model integrating the decision-maker’s preferences
Vinodh et al. Application of QFD for supplier selection in an Indian electronics switches manufacturing organisation
Ajay et al. Analyzing and Predicting the Sales Forecasting using Modified Random Forest and Decision Tree Algorithm
Shen et al. Integrated multi-criteria decision-making (MCDM) method combined with decision making trial and evaluation laboratory (DEMATEL) and analytic network process (ANP) in food supplier selection
Rama et al. List Price Optimization Using Customized Decision Trees
Naser SadrAbadi et al. Process-oriented improvement: a modern look at drawing the organizational progress roadmap
KR102347305B1 (en) Binary classification system and method using secondary verification

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant