KR20150113644A - 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법 - Google Patents

협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법 Download PDF

Info

Publication number
KR20150113644A
KR20150113644A KR1020140037910A KR20140037910A KR20150113644A KR 20150113644 A KR20150113644 A KR 20150113644A KR 1020140037910 A KR1020140037910 A KR 1020140037910A KR 20140037910 A KR20140037910 A KR 20140037910A KR 20150113644 A KR20150113644 A KR 20150113644A
Authority
KR
South Korea
Prior art keywords
recommendation
sample
user
users
network
Prior art date
Application number
KR1020140037910A
Other languages
English (en)
Other versions
KR101567684B1 (ko
Inventor
김재경
문현실
Original Assignee
경희대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 경희대학교 산학협력단 filed Critical 경희대학교 산학협력단
Priority to KR1020140037910A priority Critical patent/KR101567684B1/ko
Publication of KR20150113644A publication Critical patent/KR20150113644A/ko
Application granted granted Critical
Publication of KR101567684B1 publication Critical patent/KR101567684B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Library & Information Science (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 협업 필터링 기반의 상품 추천 방법에 관한 것으로, 보다 구체적으로 상품 구매 데이터베이스의 데이터 특성에 기초하여 상품 구매 데이터베이스를 다수의 샘플 네트워크로 구성하고 각 샘플 네트워크에서 유의성을 가지는 특성으로 전체 상품 구매 데이터의 추천 성과를 판단하여 상품 구매 데이터베이스에 가장 적합한 추천 기법을 선택하는 방법에 관한 것이다.

Description

협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법{Method for selecting recommendation type in product recommeding system}
본 발명은 협업 필터링 기반의 상품 추천 방법에 관한 것으로, 보다 구체적으로 상품 구매 데이터베이스의 데이터 특성에 기초하여 상품 구매 데이터베이스를 다수의 샘플 네트워크로 구성하고 각 샘플 네트워크에서 유의성을 가지는 특성으로 전체 상품 구매 데이터의 추천 성과를 판단하여 상품 구매 데이터베이스에 가장 적합한 추천 기법을 선택하는 방법에 관한 것이다.
전자상거래의 급성장으로 기업들의 성장을 위한 경쟁은 더욱 심화되어 다른 경쟁업체보다 경쟁우위를 가질 수 있는 마케팅 전략이 필요하게 되었고, 고객은 상품 정보의 과다로 인하여 효과적으로 상품을 선택할 수 없게 되는 상품 과부하 현상을 야기시켰다.
이러한 문제를 해결하기 위한 정보기술 중의 하나가 고객의 선호도에 부합하는 상품을 찾도록 도와주는 상품 추천 시스템이다. 상품 추천 시스템은 고객들에게 추천 상품 목록을 제공하여 고객들이 구매 가능성이 있는 상품을 쉽게 찾도록 도와주는 개인화된 정보 필터링 기술이다. 상품 추천 시스템에서는 사용자에 적합한 상품을 추천하기 위하여 다양한 추천 기법들이 사용되고 있는데, 협업 필터링에 기반한 추천 기법은 상품 추천 시스템 중에서 가장 성공적인 상품 추천 기법으로 알려져 있으며 현재 많이 이용되고 있다. 협업 필터링은 웹을 기반으로 하는 전자 쇼핑몰에서 이용되고 있는 성공적인 상품 추천 기법 중의 하나로서, 목표 고객과 유사한 구매 이력을 보이는 유사 고객들의 상품에 대한 선호도를 바탕으로 목표 고객에게 유용한 상품을 추천하는 방법이다.
그러나 종래의 협업 필터링 기반의 상품 추천 시스템은 상품 구매 데이터베이스의 데이터 특성에 따라 다음과 같은 문제점을 가진다.
첫째, 종래 협업 필터링 기반의 상품 추천 시스템은 상품 수에 비해 상품 구매 데이터베이스의 구매 데이터가 부족한 경우 목표 고객과 주변 고객 사이의 유사도를 정확하게 계산하기 곤란하다. 즉, 데이터 희박성(sparsity)의 문제점을 가진다.
둘째, 종래 협업 필터링 기반의 상품 추천 시스템은 목표 고객이 이질적이고 독특한 구매 행위를 가지는 경우 상품 구매 데이터베이스의 주변 고객과 유사도를 측정하기 곤란하다는 문제점을 가진다.
셋째, 종래 협업 필터링 기반의 상품 추천 시스템은 목표 고객이 신규 고객인 경우 목표 고객의 구매 정보가 없어 상품 구매 데이터베이스의 주변 고객과 유사도를 측정하기 곤란하다는 문제점을 가진다.
넷째, 종래 협업 필터링 기반의 상품 추천 시스템은 상품 구매 데이터베이스에서 특정 주변 고객으로 군집화가 이루어진 경우 특정 주변 고객을 기준으로 상품 추천이 이루어지기 때문에 목표 고객이 구매하지 않았지만 높은 흥미를 가질 것으로 예상되는 다른 상품의 추천이 곤란하다는 문제점을 가진다. 즉, 추천 상품의 우연성(senendipity)이 적다는 문제점을 가진다.
매우 다양한 협업 필터링 기반의 추천 기법들이 개발되어 사용되고 있는데, 위에서 살펴본 바와 같이 종래 협업 필터링 기반의 상품 추천 기법은 상품 구매 데이터베이스의 종류에 따라 서로 상이한 문제점을 가질 수 있으며, 따라서 상품 구매 데이터베이스의 데이터 특성에 따라 서로 상이한 추천 기법을 선택하여 상품 추천 시스템을 운영할 필요가 있다. 그러나 종래 협업 필터링 기반의 상품 추천 시스템에서는 상품 구매 데이터베이스의 특성에 따라 다양한 추천 기법 중에서 적절한 추천 기법을 선택하는 기술이 전혀 없었으며, 다만 상품 추천 시스템 설계자의 경험에 기초하여 추천 기법을 설계하였다.
본 발명은 위에서 언급한 종래 협업 필터링 기법의 추천 기법이 가지는 문제점을 해결하기 위한 것으로, 본 발명이 이루고자 하는 목적은 상품 구매 데이터베이스의 데이터 특성에 기초하여 다양한 추천 기법 중 상품 구매 데이터베이스에 적합한 추천 기법을 선택하는 방법을 제공하는 것이다.
본 발명이 이루고자 하는 다른 목적은 네트워크 이론을 도입하여 상품 구매 데이터베이스로부터 다수의 샘플 네트워크를 생성하고 각 샘플 네트워크에서 공통적으로 유의한 데이터 특성을 추출하여 유의한 데이터 특성을 전체 상품 구매 데이터베이스로 이루어진 전체 네트워크에 적용하여 상품 구매 데이터베이스의 데이터 특성에 적합한 추천 기법을 선택하는 방법을 제공하는 것이다.
본 발명의 목적을 달성하기 위하여 본 발명에 따른 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법은 상품 구매 데이터베이스로부터 생성되는 샘플 그룹에 포함되어 있는 사용자 사이의 상품 구매 유사도에 기초하여 샘플 네트워크를 생성하고 샘플 네트워크의 특성을 나타내는 샘플 특성 계수를 계산하는 단계와, 샘플 네트워크에 대해 서로 상이한 적어도 1개 이상의 협업 필터링 기반의 추천 기법을 적용하여 각 추천 기법에 대한 상기 샘플 네트워크의 추천 성공율을 계산하는 단계와, 샘플 특성 계수를 독립 변인으로 하고 추천 성공율을 종속 변인으로 하여 각 추천 기법별로 다중 회귀식을 생성하며 각 추천 기법별 다중 회귀식에서 샘플 특성 계수의 유의성을 판단하는 단계와, 상품 구매 데이터베이스를 구성하는 모든 사용자로 이루어진 전체 네트워크를 기준으로 추천 기법의 다중 회귀식에서 공통적으로 유의성을 가지는 전체 특성 계수를 계산하는 단계와, 전체 특성 계수를 각 추천 기법의 다중 회귀식에 적용하여 가장 높은 추천값을 가지는 추천 기법을 상품 구매 데이터베이스의 추천 기법으로 선택하는 단계를 포함하는 것을 특징으로 한다.
여기서 샘플 그룹은 사용자의 상품 구매 데이터베이스에서 무작위로 선택된 설정된 수의 사용자로 적어도 1개 이상 생성되는 것을 특징으로 한다.
바람직하게, 샘플 네트워크의 특성을 나타내는 샘플 특성 계수를 계산하는 단계는 샘플 그룹을 구성하는 사용자 사이의 구매 유사도를 계산하는 단계와, 구매 유사도가 임계 유사도 이상인 사용자 사이를 연결하여 샘플 네트워크를 생성하는 단계와, 샘플 네트워크에서 사용자 사이의 연결 관계를 이용하여 샘플 네트워크의 특성을 나타내는 샘플 특성 계수를 계산하는 단계를 포함하는 것을 특징으로 한다.
여기서 샘플 네트워크의 특성을 나타내는 샘플 특성 계수는 샘플 네트워크(Si)를 구성하는 사용자의 연결 관계에 기초하여 사용자가 얼마나 긴밀하게 연결되어 있는지를 나타내는 밀도 계수(DEN(Si)), 샘플 네트워크(Si)를 구성하는 사용자의 연결 관계에 기초하여 주변 사용자와 연결되지 않는 사용자의 비율을 나타내는 포괄 계수(DIV(Si)), 샘플 네트워크를 구성하는 사용자의 연결 관계에 기초하여 사용자와 연결되어 있는 주변 사용자 사이의 연결 정도를 나타내는 군집 계수(CLU(Si)) 및 샘플 네트워크를 구성하는 사용자의 연결 관계에 기초하여 사용자를 중심으로 주변 사용자와 얼마나 집중적으로 연결되어 있는지를 나타내는 집중 계수(CEN(Si)) 중 적어도 어느 하나인 것을 특징으로 한다.
밀도 계수(DEN(Si))는 아래의 수학식(1)에 의해 계산되며,
[수학식 1]
Figure pat00001
여기서 ki는 샘플 네트워크(Si)의 전체 연결 수를 의미하며, ni은 샘플 네트워크(Si)를 구성하는 전체 사용자 수인 것을 특징으로 한다.
포괄 계수(DIV(Si))는 아래의 수학식(2)에 의해 계산되며,
[수학식 2]
Figure pat00002
여기서 nit는 샘플 네트워크(Si)에서 주변 사용자와 연결되어 있지 않은 사용자의 수인 것을 특징으로 한다.
군집 계수(CLU(Si))는 아래의 수학식(3)에 의해 계산되며,
[수학식 3]
Figure pat00003
여기서 nv는 주변 사용자와 2개 이상의 연결을 가지는 사용자의 수를 의미하며, V는 주변 사용자와 2개 이상의 연결을 가지는 사용자 집합을 의미하며, clu(p)는 주변 사용자와 2개 이상의 연결을 가지는 사용자 집합 중 어느 하나의 사용자(p)의 개별 군집 계수로 아래의 수학식(4)와 같이 계산되며,
[수학식 4]
Figure pat00004
여기서 triplep는 사용자(p)에 2명의 주변 사용자가 연결되어 있는 수를 의미하며, trianglep는 사용자(p)에 연결되어 있는 2명의 주변 사용자가 서로 연결되어 있는 수를 의미하는 것을 특징으로 한다.
집중 계수(CEN(Si))는 아래의 수학식(5)에 의해 계산되며,
[수학식 5]
Figure pat00005
여기서 cen(ul)은 샘플 네트워크(Si)를 구성하는 사용자(ul)의 개별 집중 계수를 의미하며, cen(u*)는 샘플 네트워크(Si)를 구성하는 사용자 중 가장 높은 개별 집주 계수를 의미하며,
여기서 개별 집중 계수는 아래의 수학식(6)에 의해 계산되며,
[수학식 6]
Figure pat00006
여기서 mj는 사용자 Ul이 샘플 네트워크와 주변 사용자(Uj)와 연결되어 있으며 1의 값을 가지며 주변 사용자 (Uj)와 연결되어 있지 않은 경우 0의 값을 가지는 것을 특징으로 한다.
바람직하게, 샘플 네트워크 추천 성공율을 계산하는 단계는 샘플 네트워크를 구성하는 사용자를 설정된 수의 훈련 데이터 그룹과 테스트 데이터 그룹으로 구분하여 생성하는 단계와, 훈련 데이터 그룹에 서로 상이한 적어도 1개 이상의 협업 필터링 기반의 추천 기법을 적용하여 추천 기법별로 추천 상품을 추출하는 단계와, 추출한 상품과 테스트 데이터 그룹의 사용자가 실제 구매한 상품을 비교하여 추천 기법별로 샘플 네트워크의 추천 성공율을 계산하는 단계를 포함하는 것을 특징으로 한다.
바람직하게, 전체 특성 계수를 계산하는 단계는 각 추천 기법별 다중 회귀식에서 공통으로 유의한 샘플 특성 계수의 종류를 판단하고, 판단한 종류의 전체 특성 계수를 각 추천 기법의 다중 회귀식에 적용하여 가장 높은 추천값을 가지는 추천 기법을 상품 구매 데이터베이스의 추천 기법으로 최종 선택하는 것을 특징으로 한다.
본 발명의 목적을 달성하기 위하여 본 발명에 따른 협업 필터링 기반의 상품 추천 시스템에서 추천 기법의 선택 장치는 사용자의 상품 구매 데이터베이스에서 무작위로 선택된 설정된 수의 사용자로 적어도 1개 이상 샘플 그룹을 생성하고 상품 구매 데이터베이스로부터 생성되는 샘플 그룹에 포함되어 있는 사용자 사이의 상품 구매 유사도에 기초하여 샘플 네트워크를 생성하는 네트워크 생성부와, 샘플 네트워크를 기준으로 샘플 네트워트의 특성을 나타내는 샘플 특성 계수 또는 상품 구매 데이터베이스를 구성하는 모든 사용자로 이루어진 전체 네트워크를 기준으로 전체 네트워크의 특성을 나타내는 전체 특성 계수를 계산하는 특성 계수 계산부와, 샘플 네트워크에 대해 서로 상이한 적어도 1개 이상의 협업 필터링 기반의 추천 기법을 적용하여 각 추천 기법에 대한 샘플 네트워크의 추천 성공율을 계산하는 추천 성공율 계산부와, 특성 계수를 독립 변인으로 하고 추천 성공율을 종속 변인으로 하여 각 추천 기법별로 다중 회귀식을 생성하며 각 추천 기법별 다중 회귀식에서 특성 계수의 유의성을 판단하는 유의성 판단부와, 추천 기법의 다중 회귀식에서 공통적으로 유의성을 가지는 전체 특성 계수를 각 추천 기법의 다중 회귀식에 적용하여 가장 높은 추천값을 가지는 추천 기법을 상품 구매 데이터베이스의 추천 기법으로 선택하는 추천 기법 선택부를 포함하는 것을 특징으로 한다.
바람직하게, 네트워크 생성부는 사용자의 상품 구매 데이터베이스에서 무작위로 선택된 설정된 수의 사용자로 적어도 1개 이상 샘플 그룹을 생성하는 샘플 그룹 생성부와, 샘플 그룹을 구성하는 사용자 사이의 구매 유사도를 계산하는 유사도 계산부와, 구매 유사도가 임계 유사도 이상인 사용자 사이를 연결하여 샘플 네트워크를 형성하는 샘플 네트워크 생성부를 포함하는 것을 특징으로 한다.
바람직하게, 추천 성공율 계산부는 샘플 네트워크를 구성하는 사용자를 설정된 수의 훈련 데이터 그룹과 테스트 데이터 그룹으로 생성하는 데이터 그룹 생성부와, 훈련 데이터 그룹에 서로 상이한 적어도 1개 이상의 협업 필터링 기반의 추천 기법을 적용하여 추천 기법별로 추천 상품을 추출하는 추천 상품 추출부와, 추출한 상품과 테스트 데이터 그룹의 사용자가 실제 구매한 상품을 비교하여 추천 기법별로 샘플 네트워크의 추천 성공율을 계산하는 성공율 계산부를 포함하는 것을 특징으로 한다.
본 발명에 따른 협업 필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법은 상품 구매 데이터베이스의 데이터 특성에 기초하여 다양한 추천 기법 중 상품 구매 데이터베이스에 적합한 추천 기법을 선택함으로써, 데이터 특성에 따라 사용자에 가장 적절한 상품을 추천할 수 있다.
또한, 본 발명에 따른 협업 필터링 기반의 상품 추천 시스템에서 추천 기법의 선택 방법은 네트워크 이론을 도입하여 상품 구매 데이터베이스로부터 다수의 샘플 네트워크를 생성하고 각 샘플 네트워크에서 공통적으로 유의한 데이터 특성만을 추출함으로써, 유의한 데이터 특성을 전체 상품 구매 데이터베이스로 이루어진 전체 네트워크에 적용하여 상품 구매 데이터베이스의 데이터 특성에 적합한 추천 기법을 정확하게 선택할 수 있다.
도 1은 본 발명에 따른 협업 필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 장치를 설명하기 위한 기능 블록도이다.
도 2는 본 발명에 따른 네트워크 생성부를 보다 구체적으로 설명하기 위한 기능 블록도이다.
도 3은 본 발명에 따른 전체 그룹과 샘플 그룹의 일 예를 설명하기 위한 도면이다.
도 4는 본 발명에 따른 추천 성공율 계산부(140)를 보다 구체적으로 설명하기 위한 기능 블록도이다.
도 5는 본 발명에 따른 협업 필터링 기반의 상품 추천 시스템에서 상품 구매 데이터베이스의 데이터 특성에 따라 추천 기법을 선택하는 방법을 설명하기 위한 흐름도이다.
도 6은 본 발명에 따른 샘플 특성 계수를 계산하는 단계를 보다 구체적으로 설명하기 위한 흐름도이다.
도 7은 도 7은 상품 구매 데이터베이스의 일 예를 도시하고 있다.
도 8은 군집 계수를 설명하기 위한 도면이다.
도 9는 본 발명에 따른 추천 성공율을 계산하는 단계를 보다 구체적으로 설명하기 위한 흐름도이다.
이하 첨부한 도면을 참고로 본 발명에 따른 협업 필터링 기반의 상품 추천 시스템에서 추천 기법을 설명하기 위한 도면이다.
도 1은 본 발명에 따른 협업 필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 장치를 설명하기 위한 기능 블록도이다.
도 1을 참고로 보다 구체적으로 살펴보면, 네트워크 생성부(110)는 상품 구매 데이터베이스(120)에서 무작위로 선택된 설정된 수의 사용자로 적어도 1개 이상 샘플 그룹을 생성하고 상품 구매 데이터베이스(120)로부터 생성되는 샘플 그룹에 포함되어 있는 사용자 사이의 상품 구매 유사도에 기초하여 샘플 네트워크를 생성한다. 상품 구매 데이터베이스(120)에는 상품 추천 시스템에서 관리하는 사용자 정보(예를 들어 사용자 이름, 성별, 나이, 주소, 직업 등), 사용자가 상품 추천 시스템을 통해 현재까지 구매한 상품의 리스트에 대한 데이터가 저장되어 있다.
특성 계수 계산부(130)는 생성한 샘플 네트워크를 기준으로 샘플 네트워트의 특성을 나타내는 샘플 특성 계수를 계산한다. 여기서 샘플 특성 계수로 샘플 네트워크의 특성을 나타내는 계수로 본 발명에서 샘플 특성 계수는 샘플 네트워크(Si)를 구성하는 사용자의 연결 관계에 기초하여 사용자가 얼마나 긴밀하게 연결되어 있는지를 나타내는 밀도 계수(DEN(Si)), 샘플 네트워크(Si)를 구성하는 사용자의 연결 관계에 기초하여 주변 사용자와 연결되지 않는 사용자의 비율을 나타내는 포괄 계수(DIV(Si)), 샘플 네트워크를 구성하는 사용자의 연결 관계에 기초하여 사용자와 연결되어 있는 주변 사용자 사이의 연결 정도를 나타내는 군집 계수(CLU(Si)), 및 샘플 네트워크를 구성하는 사용자의 연결 관계에 기초하여 사용자를 중심으로 주변 사용자와 얼마나 집중적으로 연결되어 있는지를 나타내는 집중 계수(CEN(Si))가 사용된다.
추천 성공율 계산부(140)는 샘플 네트워크에 대해 서로 상이한 적어도 1개 이상의 협업 필터링 기반의 추천 기법을 적용하여 각 추천 기법에 대한 샘플 네트워크의 추천 성공율을 계산하는데, 추천 성공율 계산부(140)는 샘플 네트워크를 구성하는 사용자를 설정된 수의 훈련 데이터 그룹과 테스트 데이터 그룹으로 분리하고 각 훈련 데이터 그룹에 각 협업 필터링 기반의 추천 기법을 적용하여 추출한 상품 중 테스트 데이터 그룹에서 사용자가 실제 구매한 상품의 비율로 각 추천 기법의 추천 성공율을 계산한다.
유의성 판단부(150)는 특성 계수를 독립 변인으로 하고 추천 성공율을 종속 변인으로 하여 각 추천 기법별로 다중 회귀식을 생성하며, 각 추천 기법별 다중 회귀식에서 특성 계수 중 유의한 특성 계수를 판단한다.
추천 기법 선택부(160)는 유의성 판단부(150)에서 판단한, 각 추천 기법의 다중 회귀식에서 공통적으로 유의성을 가지는 특성 계수를 판단하고, 특성 계수 판단부(130)로 하여금 공통적으로 유의성을 가지는 특성 계수만에 대해 상품 구매 데이터베이스(120)를 구성하는 모든 사용자로 이루어진 전체 네트워크를 기준으로 전체 네트워크의 특성을 나타내는 전체 특성 계수를 계산하도록 한다. 특성 계수 판단부(130)는 전체 특성 계수를 계산하며, 추천 기법 선택부(160)는 전체 특성 계수를 각 추천 기법의 다중 회귀식에 적용하여 가장 높은 추천값을 가지는 추천 기법을 상품 구매 데이터베이스(120)의 추천 기법으로 선택한다.
도 2는 본 발명에 따른 네트워크 생성부를 보다 구체적으로 설명하기 위한 기능 블록도이다.
도 2를 참고로 살펴보면, 샘플 그룹 생성부(111)는 사용자의 상품 구매 데이터베이스에서 무작위로 선택된 설정된 수의 사용자로 적어도 1개 이상 샘플 그룹을 생성한다. 도 3에 도시되어 있는 바와 같이, 상품 구매 데이터베이스를 구성하는 사용자를 전체 그룹(TG)으로, 그리고 전체 그룹 중에서 설정된 수로 무작위로 사용자를 선택하여 각 샘플 그룹(SG)을 생성한다. 여기서 각 샘플 그룹에 포함되어 있는 사용자는 다른 샘플 그룹에 동시에 포함되지 않으며, 각 샘플 그룹을 구성하는 사용자는 최소 100명 이상으로 설정한 경우 각 샘플의 특성을 정확하게 계산할 수 있는 것으로 연구 결과 확인할 수 있었다.
유사도 계산부(113)는 샘플 그룹을 구성하는 사용자의 상품 구매 데이터베이스에서 사용자가 실제 구매한 상품의 동일 여부로 구매 유사도를 계산하고, 샘플 네트워크 생성부(115)는 구매 유사도가 임계 유사도 이상인 사용자 사이를 에지로 연결하여 각 샘플 그룹 단위로 샘플 네트워크를 형성한다.
도 4는 본 발명에 따른 추천 성공율 계산부(140)를 보다 구체적으로 설명하기 위한 기능 블록도이다.
도 4를 참고로 보다 구체적으로 살펴보면, 데이터 그룹 생성부(141)는 샘플 네트워크를 구성하는 사용자를 설정된 수의 훈련 데이터 그룹과 테스트 데이터 그룹으로 생성한다. 예를 들어, 각 샘플 네트워크가 100명의 사용자로 이루어진 경우, 샘플 네트워크에서 80%를 무작위로 추출하여 훈련 데이터 그룹을 생성하고 나머지 20%로 테스트 데이터 그룹을 생성한다.
추천 상품 추출부(143)는 훈련 데이터 그룹에 서로 상이한 적어도 1개 이상의 협업 필터링 기반의 추천 기법을 적용하여 각 추천 기법별로 추천 상품을 추출하며, 성공율 계산부(145)는 각 추천 기법별로 추출한 상품과 테스트 데이터 그룹의 사용자가 실제 구매한 상품을 비교하여 각 추천 기법별로 샘플 네트워크의 추천 성공율을 계산한다. 예를 들어, 협업 필터링 기반의 추천 기법1, 협업 필터링 기반의 추천 기법2, 협업 필터링 기반의 추천 기법3이 존재하는 경우, 샘플 네트워크에 추천 기법1, 추천 기법2, 추천 기법3을 적용하여 훈련 데이터 그룹에서 추천할 상품을 추출하고, 테스트 데이터 그룹에서 실제 사용자가 구매한 상품과 추천한 상품의 동일 여부의 비율로 추천 성공율을 계산한다.
도 5는 본 발명에 따른 협업 필터링 기반의 상품 추천 시스템에서 상품 구매 데이터베이스의 데이터 특성에 따라 추천 기법을 선택하는 방법을 설명하기 위한 흐름도이다.
도 5를 참고로 보다 구체적으로 살펴보면, 상품 구매 데이터베이스로부터 생성되는 샘플 그룹을 생성한다(S110). 샘플 그룹에 포함되어 있는 사용자 사이의 상품 구매 유사도에 기초하여 샘플 네트워크를 생성하고, 샘플 네트워크의 특성을 나타내는 샘플 특성 계수를 계산한다(S120). 본 발명에서 샘플 네트워크(Si)의 특성을 나타내는 샘플 특성 계수로, 밀도 계수(DEN(Si)), 포괄 계수(DIV(Si)), 군집 계수(CLU(Si)), 중심 계수(CEN(Si))를 사용할 수 있다.
밀도 계수는 샘플 네트워크(Si)를 구성하는 사용자의 연결 관계에 기초하여 사용자가 얼마나 긴밀하게 연결되어 있는지를 나타내는 계수이며, 포괄 계수는 샘플 네트워크(Si)를 구성하는 사용자의 연결 관계에 기초하여 주변 사용자와 연결되지 않는 사용자의 비율을 나타내는 계수이며, 군집 계수는 샘플 네트워크를 구성하는 사용자의 연결 관계에 기초하여 사용자와 연결되어 있는 주변 사용자 사이의 연결 정도를 나타내는 계수이며, 중심 계수는 샘플 네트워크를 구성하는 사용자의 연결 관계에 기초하여 사용자를 중심으로 주변 사용자와 얼마나 집중적으로 연결되어 있는지를 나타내는 계수이다.
밀도 계수(DEN(Si))는 아래의 수학식(1)에 의해 계산되며,
[수학식 1]
Figure pat00007
여기서 ki는 샘플 네트워크(Si)의 전체 연결 수를 의미하며, ni은 샘플 네트워크(Si)를 구성하는 전체 사용자 수인 것을 특징으로 한다. 밀도 계수의 특성 계수는 샘플 구매 데이터베이스의 데이터 희박성의 문제점을 극복하기 위한 것으로, 밀도 계수의 증가는 데이터 희박성의 감소를 의미한다.
포괄 계수(DIV(Si))는 아래의 수학식(2)에 의해 계산되며,
[수학식 2]
Figure pat00008
여기서 nit는 샘플 네트워크(Si)에서 주변 사용자와 연결되어 있지 않은 사용자의 수인 것을 특징으로 한다. 포괄 계수의 특성 계수는 샘플 구매 데이터베이스에서 이질적이고 독특한 구매 행위를 가지는 사용자에 상품 추천을 하는 경우에 발생하는 문제점을 해결하기 위한 것으로, 포괄 계수의 증가는 독특한 구매 행위를 가지는 고객의 감소를 의미한다.
군집 계수(CLU(Si))는 아래의 수학식(3)에 의해 계산되며,
[수학식 3]
Figure pat00009
여기서 nv는 주변 사용자와 2개 이상의 연결을 가지는 사용자의 수를 의미하며, V는 주변 사용자와 2개 이상의 연결을 가지는 사용자 집합을 의미하며, clu(p)는 주변 사용자와 2개 이상의 연결을 가지는 사용자 집합 중 어느 하나의 사용자(p)의 개별 군집 계수로 아래의 수학식(4)와 같이 계산되며,
[수학식 4]
Figure pat00010
여기서 triplep는 사용자(p)에 2명의 주변 사용자가 연결되어 있는 수를 의미하며, trianglep는 사용자(p)에 연결되어 있는 2명의 주변 사용자가 서로 연결되어 있는 수를 의미하는 것을 특징으로 한다. 예를 들어, 도 8에 도시되어 있는 바와 같이, 사용자 A가 주변 사용자 B, C, D와 연결되어 있으며, 주변 사용자 B와 C가 서로 연결되어 있는 경우, 사용자 A는 주변 사용자 (B, C), 주변 사용자 (B, D), 주변 사용자 (B, D)와 연결되어 있어 사용자 A의 triplep는 3개이며, 사용자 A의 주변 사용자 (B, C)는 서로 연결되어 있어 사용자 A의 trianglep는 1이다. 군집 계수의 증가는 샘플 구매 데이터베이스에서 우연성에 의한 상품 추천이 어려움을 의미한다.
집중 계수(CEN(Si))는 아래의 수학식(5)에 의해 계산되며,
[수학식 5]
Figure pat00011
여기서 cen(ul)은 샘플 네트워크(Si)를 구성하는 사용자(ul)의 개별 집중 계수를 의미하며, cen(u*)는 샘플 네트워크(Si)를 구성하는 사용자 중 가장 높은 개별 집주 계수를 의미하며,
여기서 개별 집중 계수는 아래의 수학식(6)에 의해 계산되며,
[수학식 6]
Figure pat00012
여기서 mj는 사용자 Ul이 샘플 네트워크와 주변 사용자(Uj)와 연결되어 있으며 1의 값을 가지며 주변 사용자 (Uj)와 연결되어 있지 않은 경우 0의 값을 가지는 것을 특징으로 한다. 집중 계수의 증가는 특정 사용자에 의존하여 상품을 추천함으로써 다양한 상품의 추천이 불가능하며 추천 범위의 감소를 의미한다.
샘플 네트워크(Si)에 대해 서로 상이한 적어도 1개 이상의 협업 필터링 기반의 추천 기법(Rj)을 적용하여 각 추천 기법에 대한 샘플 네트워크의 추천 성공율(F(Si, Rj))을 계산하고(S130), 샘플 특성 계수를 독립 변인으로 하고 추천 성공율을 종속 변인으로 하여 각 추천 기법별로 다중 회귀식을 생성하는데, 각 추천 기법별 다중 회귀식에서 샘플 특성 계수의 유의성을 판단한다(S140). 다중회귀분석(multiple regression analysis)은 독립변수의 수가 여러 개인 회귀분석을 의미하는 것으로, 변수의 개수가 같아도 포함된 변수에 따라 모형은 다르게 나타날 수 있으며, 여러 개의 변수 중에서 통계적으로 유의한 것만을 선택할 수 있다.
아래의 수학식(7)은 본 발명에서 사용되는 다중 회귀 분석식의 일 예를 나타낸 것으로,
[수학식 7]
Figure pat00013
여기서 Rj는 협업 필터링 기반의 여러 추천 기법 중 j번째 추천 기법을 의미한다.
본 발명에서는 샘플 특성 계수를 독립 변인으로 하고 추천 성공율을 종속 변인으로 하여 SAS (Statistical Analysis System), SPSS (Statistical Package for the Social Sciences), LISREL (Linear Structural RELation), EQS (Equations), AMOS (Analysis of Moment Structure) 등의 다중회귀분석 알고리즘을 이용하여 다중회귀분석식의 표준계수(β1, β2, β3, β4)를 계산함으로써 각 샘플 특성 계수의 유의성을 판단할 수 있는데 이에 대한 상세한 설명은 생략한다.
각 추천 기법의 다중 회귀식에서 공통적으로 유의성을 가지는 것으로 판단되는 특성 계수에 대해서만 상품 구매 데이터베이스를 구성하는 모든 사용자로 이루어진 전체 네트워크를 기준으로 전체 특성 계수를 계산하고(S150), 전체 특성 계수를 각 추천 기법의 다중 회귀식에 적용하여 가장 높은 추천값을 가지는 추천 기법을 상품 구매 데이터베이스의 추천 기법으로 선택한다(S160). 전체 특성 계수는 앞서 설명한 샘플 특성 계수와 동일한 방식으로 전체 네트워크를 기준으로 계산된다.
여기서 유의성이란 샘플집단에 대한 가설이 가지는 통계적 의미를 말한다. 다시 말해서, 어떤 실험 결과 자료를 두고 "통계적으로 유의하다."라고 하는 것은 확률적으로 봐서 단순한 우연이라고 생각되지 않을 정도로 의미가 있다는 뜻이다. 반대로 "통계적으로 유의하지 않다."라고 하는 것은 실험 결과가 단순한 우연일 수도 있다는 뜻이다.
도 6은 본 발명에 따른 샘플 특성 계수를 계산하는 단계를 보다 구체적으로 설명하기 위한 흐름도이다.
도 6을 참고로 보다 구체적으로 살펴보면, 샘플 그룹을 구성하는 사용자 사이의 구매 유사도를 계산하고(S121), 구매 유사도가 임계 유사도 이상인 사용자 사이를 연결하여 샘플 네트워크를 생성한다. 도 7은 상품 구매 데이터베이스의 일 예를 도시하고 있는데, 각 사용자별로 구매한 상품의 리스트가 행렬 형태로 저장되어 사용자가 상품을 구매한 경우 1의 값이 할당되며 사용자가 상품을 구매하지 않은 경우 0의 값이 할당된다. 상품 구매 데이터베이스에서 무작위로 설정된 수의 사용자를 추출하여 샘플 그룹을 생성하고, 샘플 그룹을 구성하는 사용자의 상품 구매 유사도를 계산하는데, 전체 상품 수에서 사용자 사이 공통으로 구매한 상품의 수의 비율로 상품 구매 유사도를 계산한다. 본 발명이 적용되는 분야에 따라 상품 구매 유사도를 계산하기 위하여 피어슨 상관 계수(Pearson’s correlation coefficient)를 사용할 수 있으며, 이는 본 발명의 범위에 속한다.
샘플 네트워크에서 사용자 사이의 연결 관계를 이용하여 샘플 네트워크의 특성을 나타내는 샘플 특성 계수를 계산한다(S125).
도 9는 본 발명에 따른 추천 성공율을 계산하는 단계를 보다 구체적으로 설명하기 위한 흐름도이다.
도 9를 참고로 살펴보면, 상기 샘플 네트워크를 구성하는 사용자를 설정된 수의 훈련 데이터 그룹과 테스트 데이터 그룹으로 구분하여 생성하고(S131), 훈련 데이터 그룹에 서로 상이한 적어도 1개 이상의 협업 필터링 기반의 추천 기법을 적용하여 추천 기법별로 추천 상품을 추출한다(S133).
추출한 상품과 테스트 데이터 그룹의 사용자가 실제 구매한 상품을 비교하여 추천 기법별로 샘플 네트워크의 추천 성공율을 계산한다(S135). 본 발명에서 추천 성공율은 정확성(precision)과 재현율(recall)에 기초하여 아래의 수학식(8)과 같이 계산할 수 있다.
[수학식 8]
Figure pat00014
여기서 Cre는 재현율을 의미하는데 재현율은 전체 상품 수와 추천에 의해 구매한 상품의 수의 비율로 계산되며, Cpre는 정확성을 의미하는데 추천 상품 수와 추천에 구매한 상품의 수의 비율로 계산된다.
한편, 상술한 본 발명의 실시 예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록 매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.
상기 컴퓨터로 읽을 수 있는 기록 매체는 전기 또는 자기식 저장 매체(예를 들어, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장 매체를 포함한다.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.
110: 네트워크 생성부 120: 상품 구매 데이터베이스
130: 특성 계수 계산부 140: 추천 성공율 계산부
150: 유의성 판단부 160: 추천 기법 선택부

Claims (15)

  1. 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법에 있어서,
    상품 구매 데이터베이스로부터 생성되는 샘플 그룹에 포함되어 있는 사용자 사이의 상품 구매 유사도에 기초하여 샘플 네트워크를 생성하고, 상기 샘플 네트워크의 특성을 나타내는 샘플 특성 계수를 계산하는 단계;
    상기 샘플 네트워크에 대해 서로 상이한 적어도 1개 이상의 협업 필터링 기반의 추천 기법을 적용하여 각 추천 기법에 대한 상기 샘플 네트워크의 추천 성공율을 계산하는 단계;
    상기 샘플 특성 계수를 독립 변인으로 하고 상기 추천 성공율을 종속 변인으로 하여 상기 각 추천 기법별로 다중 회귀식을 생성하며, 상기 각 추천 기법별 다중 회귀식에서 상기 샘플 특성 계수의 유의성을 판단하는 단계;
    상기 상품 구매 데이터베이스를 구성하는 모든 사용자로 이루어진 전체 네트워크를 기준으로 상기 추천 기법의 다중 회귀식에서 공통적으로 유의성을 가지는 전체 특성 계수를 계산하는 단계; 및
    상기 전체 특성 계수를 각 추천 기법의 다중 회귀식에 적용하여 가장 높은 추천값을 가지는 추천 기법을 상기 상품 구매 데이터베이스의 추천 기법으로 선택하는 단계를 포함하는 것을 특징으로 하는 추천 기법의 선택 방법.
  2. 제 1 항에 있어서, 상기 샘플 그룹은
    상기 사용자의 상품 구매 데이터베이스에서 무작위로 선택된 설정된 수의 사용자로 적어도 1개 이상 생성되는 것을 특징으로 하는 추천 기법의 선택 방법.
  3. 제 2 항에 있어서, 상기 샘플 네트워크의 특성을 나타내는 샘플 특성 계수를 계산하는 단계는
    상기 샘플 그룹을 구성하는 사용자 사이의 구매 유사도를 계산하는 단계;
    상기 구매 유사도가 임계 유사도 이상인 사용자 사이를 연결하여 샘플 네트워크를 생성하는 단계; 및
    상기 샘플 네트워크에서 사용자 사이의 연결 관계를 이용하여 상기 샘플 네트워크의 특성을 나타내는 샘플 특성 계수를 계산하는 단계를 포함하는 것을 특징으로 하는 추천 기법의 선택 방법.
  4. 제 3 항에 있어서, 상기 샘플 네트워크의 특성을 나타내는 샘플 특성 계수는
    상기 샘플 네트워크(Si)를 구성하는 사용자의 연결 관계에 기초하여 사용자가 얼마나 긴밀하게 연결되어 있는지를 나타내는 밀도 계수(DEN(Si)), 상기 샘플 네트워크(Si)를 구성하는 사용자의 연결 관계에 기초하여 주변 사용자와 연결되지 않는 사용자의 비율을 나타내는 포괄 계수(DIV(Si)), 상기 샘플 네트워크를 구성하는 사용자의 연결 관계에 기초하여 사용자와 연결되어 있는 주변 사용자 사이의 연결 정도를 나타내는 군집 계수(CLU(Si)) 및 상기 샘플 네트워크를 구성하는 사용자의 연결 관계에 기초하여 사용자를 중심으로 주변 사용자와 얼마나 집중적으로 연결되어 있는지를 나타내는 집중 계수(CEN(Si)) 중 적어도 어느 하나인 것을 특징으로 하는 추천 기법의 선택 방법.
  5. 제 4 항에 있어서, 상기 밀도 계수(DEN(Si))는 아래의 수학식(1)에 의해 계산되며,
    [수학식 1]
    Figure pat00015

    여기서 ki는 샘플 네트워크(Si)의 전체 연결 수를 의미하며, ni은 샘플 네트워크(Si)를 구성하는 전체 사용자 수인 것을 특징으로 하는 추천 기법의 선택 방법.
  6. 제 4 항에 있어서, 상기 포괄 계수(DIV(Si))는 아래의 수학식(2)에 의해 계산되며,
    [수학식 2]
    Figure pat00016

    여기서 nit는 샘플 네트워크(Si)에서 주변 사용자와 연결되어 있지 않은 사용자의 수인 것을 특징으로 하는 추천 기법의 선택 방법.
  7. 제 4 항에 있어서, 상기 군집 계수(CLU(Si))는 아래의 수학식(3)에 의해 계산되며,
    [수학식 3]
    Figure pat00017

    여기서 nv는 주변 사용자와 2개 이상의 연결을 가지는 사용자의 수를 의미하며, V는 주변 사용자와 2개 이상의 연결을 가지는 사용자 집합을 의미하며, clu(p)는 주변 사용자와 2개 이상의 연결을 가지는 사용자 집합 중 어느 하나의 사용자(p)의 개별 군집 계수로 아래의 수학식(4)와 같이 계산되며,
    [수학식 4]
    Figure pat00018

    여기서 triplep는 사용자(p)에 2명의 주변 사용자가 연결되어 있는 수를 의미하며, trianglep는 사용자(p)에 연결되어 있는 2명의 주변 사용자가 서로 연결되어 있는 수를 의미하는 것을 특징으로 하는 추천 기법의 선택 방법.
  8. 제 4 항에 있어서, 상기 집중 계수(CEN(Si))는 아래의 수학식(5)에 의해 계산되며,
    [수학식 5]
    Figure pat00019

    여기서 cen(ul)은 샘플 네트워크(Si)를 구성하는 사용자(ul)의 개별 집중 계수를 의미하며, cen(u*)는 샘플 네트워크(Si)를 구성하는 사용자 중 가장 높은 개별 집주 계수를 의미하며,
    여기서 개별 집중 계수는 아래의 수학식(6)에 의해 계산되며,
    [수학식 6]
    Figure pat00020

    여기서 mj는 사용자 Ul이 샘플 네트워크와 주변 사용자(Uj)와 연결되어 있으며 1의 값을 가지며 주변 사용자 (Uj)와 연결되어 있지 않은 경우 0의 값을 가지는 것을 특징으로 하는 추천 기법의 선택 방법.
  9. 제 4 항에 있어서, 상기 샘플 네트워크 추천 성공율을 계산하는 단계는
    상기 샘플 네트워크를 구성하는 사용자를 설정된 수의 훈련 데이터 그룹과 테스트 데이터 그룹으로 구분하여 생성하는 단계;
    상기 훈련 데이터 그룹에 서로 상이한 적어도 1개 이상의 협업 필터링 기반의 추천 기법을 적용하여 상기 추천 기법별로 추천 상품을 추출하는 단계; 및
    추출한 상기 상품과 테스트 데이터 그룹의 사용자가 실제 구매한 상품을 비교하여 상기 추천 기법별로 상기 샘플 네트워크의 추천 성공율을 계산하는 단계를 포함하는 것을 특징으로 하는 추천 기법의 선택 방법.
  10. 제 4 항에 있어서, 상기 전체 특성 계수를 계산하는 단계는
    상기 각 추천 기법별 다중 회귀식에서 공통으로 유의한 샘플 특성 계수의 종류를 판단하고, 상기 판단한 종류의 전체 특성 계수를 상기 각 추천 기법의 다중 회귀식에 적용하여 가장 높은 추천값을 가지는 추천 기법을 상기 상품 구매 데이터베이스의 추천 기법으로 최종 선택하는 것을 특징으로 하는 추천 기법의 선택 방법.
  11. 사용자의 상품 구매 데이터베이스에서 무작위로 선택된 설정된 수의 사용자로 적어도 1개 이상 샘플 그룹을 생성하고 상품 구매 데이터베이스로부터 생성되는 샘플 그룹에 포함되어 있는 사용자 사이의 상품 구매 유사도에 기초하여 샘플 네트워크를 생성하는 네트워크 생성부;
    상기 샘플 네트워크를 기준으로 상기 샘플 네트워트의 특성을 나타내는 샘플 특성 계수 또는 상기 상품 구매 데이터베이스를 구성하는 모든 사용자로 이루어진 전체 네트워크를 기준으로 상기 전체 네트워크의 특성을 나타내는 전체 특성 계수를 계산하는 특성 계수 계산부;
    상기 샘플 네트워크에 대해 서로 상이한 적어도 1개 이상의 협업 필터링 기반의 추천 기법을 적용하여 각 추천 기법에 대한 상기 샘플 네트워크의 추천 성공율을 계산하는 추천 성공율 계산부;
    상기 특성 계수를 독립 변인으로 하고 상기 추천 성공율을 종속 변인으로 하여 상기 각 추천 기법별로 다중 회귀식을 생성하며, 상기 각 추천 기법별 다중 회귀식에서 상기 특성 계수의 유의성을 판단하는 유의성 판단부; 및
    상기 추천 기법의 다중 회귀식에서 공통적으로 유의성을 가지는 전체 특성 계수를 각 추천 기법의 다중 회귀식에 적용하여 가장 높은 추천값을 가지는 추천 기법을 상기 상품 구매 데이터베이스의 추천 기법으로 선택하는 추천 기법 선택부를 포함하는 것을 특징으로 하는 추천 기법의 선택 장치.
  12. 제 11 항에 있어서, 상기 네트워크 생성부는
    사용자의 상품 구매 데이터베이스에서 무작위로 선택된 설정된 수의 사용자로 적어도 1개 이상 샘플 그룹을 생성하는 샘플 그룹 생성부;
    상기 샘플 그룹을 구성하는 사용자 사이의 구매 유사도를 계산하는 유사도 계산부; 및
    상기 구매 유사도가 임계 유사도 이상인 사용자 사이를 연결하여 샘플 네트워크를 형성하는 샘플 네트워크 생성부를 포함하는 것을 특징으로 하는 추천 기법의 선택 장치.
  13. 제 12 항에 있어서, 상기 특성 계수 계산부는
    상기 샘플 네트워크(Si) 또는 상기 전체 네트워크(T)를 구성하는 사용자의 연결 관계에 기초하여 사용자가 얼마나 긴밀하게 연결되어 있는지를 나타내는 밀도 계수(DEN(Si)), 상기 샘플 네트워크(Si) 또는 상기 전체 네트워크(T)를 구성하는 사용자의 연결 관계에 기초하여 주변 사용자와 연결되지 않는 사용자의 비율을 나타내는 포괄 계수(DIV(Si)), 상기 샘플 네트워크 또는 상기 전체 네트워크(T)를 구성하는 사용자의 연결 관계에 기초하여 사용자와 연결되어 있는 주변 사용자 사이의 연결 정도를 나타내는 군집 계수(CLU(Si)) 및 상기 샘플 네트워크 또는 상기 전체 네트워크(T)를 구성하는 사용자의 연결 관계에 기초하여 사용자를 중심으로 주변 사용자와 얼마나 집중적으로 연결되어 있는지를 나타내는 집중 계수(CEN(Si)) 중 적어도 어느 하나인 것을 특징으로 하는 추천 기법의 선택 장치.
  14. 제 13 항에 있어서, 상기 추천 성공율 계산부는
    상기 샘플 네트워크를 구성하는 사용자를 설정된 수의 훈련 데이터 그룹과 테스트 데이터 그룹으로 생성하는 데이터 그룹 생성부;
    상기 훈련 데이터 그룹에 서로 상이한 적어도 1개 이상의 협업 필터링 기반의 추천 기법을 적용하여 상기 추천 기법별로 추천 상품을 추출하는 추천 상품 추출부; 및
    추출한 상기 상품과 테스트 데이터 그룹의 사용자가 실제 구매한 상품을 비교하여 상기 추천 기법별로 상기 샘플 네트워크의 추천 성공율을 계산하는 성공율 계산부를 포함하는 것을 특징으로 하는 추천 기법의 선택 장치.
  15. 제 13 항에 있어서, 상기 추천 기법 선택부는
    상기 각 추천 기법별 다중 회귀식에서 공통으로 유의한 샘플 특성 계수의 종류를 판단하고, 상기 판단한 종류의 전체 특성 계수를 상기 각 추천 기법의 다중 회귀식에 적용하여 가장 높은 추천값을 가지는 추천 기법을 상기 상품 구매 데이터베이스의 추천 기법으로 최종 선택하는 것을 특징으로 하는 추천 기법의 선택 장치.
KR1020140037910A 2014-03-31 2014-03-31 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법 KR101567684B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140037910A KR101567684B1 (ko) 2014-03-31 2014-03-31 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140037910A KR101567684B1 (ko) 2014-03-31 2014-03-31 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법

Publications (2)

Publication Number Publication Date
KR20150113644A true KR20150113644A (ko) 2015-10-08
KR101567684B1 KR101567684B1 (ko) 2015-11-10

Family

ID=54346539

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140037910A KR101567684B1 (ko) 2014-03-31 2014-03-31 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법

Country Status (1)

Country Link
KR (1) KR101567684B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114202395A (zh) * 2022-01-21 2022-03-18 福州大学 基于关键商品识别的在线商品推荐方法及系统
KR102497016B1 (ko) * 2022-10-27 2023-02-07 강나영 농산물 추천 방법 및 장치
KR102620250B1 (ko) * 2023-05-23 2023-12-29 국방과학연구소 사건 정보 할당 방법 및 장치

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102070049B1 (ko) 2017-08-08 2020-04-01 한국과학기술원 보조정보를 이용하는 조건부 변분 오토인코더 기반의 협업 필터링 방법 및 장치
KR102154411B1 (ko) 2018-12-26 2020-09-09 동아대학교 산학협력단 협업적 필터 알고리즘을 이용한 상품 구매 관련 추천 시스템 및 방법
KR102183083B1 (ko) 2019-03-18 2020-11-25 동아대학교 산학협력단 구매 데이터에 기초한 양방향 추천 점수 산출 방법 및 장치
KR102248268B1 (ko) 2019-04-02 2021-05-03 동아대학교 산학협력단 조건부 확률 기반의 상품 추천점수 산출 방법 및 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114202395A (zh) * 2022-01-21 2022-03-18 福州大学 基于关键商品识别的在线商品推荐方法及系统
KR102497016B1 (ko) * 2022-10-27 2023-02-07 강나영 농산물 추천 방법 및 장치
KR102620250B1 (ko) * 2023-05-23 2023-12-29 국방과학연구소 사건 정보 할당 방법 및 장치

Also Published As

Publication number Publication date
KR101567684B1 (ko) 2015-11-10

Similar Documents

Publication Publication Date Title
KR101567684B1 (ko) 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법
Koohi et al. A new method to find neighbor users that improves the performance of collaborative filtering
Bauer et al. Recommender systems based on quantitative implicit customer feedback
KR100907744B1 (ko) 협업 필터링 시스템 및 그 방법
JP6261547B2 (ja) 判定装置、判定方法及び判定プログラム
JP7210958B2 (ja) 商品推薦装置及びプログラム
WO2012161740A2 (en) System and method for generating recommendations
US11216518B2 (en) Systems and methods of providing recommendations of content items
US20240029107A1 (en) Automatic Item Placement Recommendations Based on Entity Similarity
Modani et al. Fairness aware recommendations on behance
CN111127074B (zh) 一种数据推荐方法
KR20150122307A (ko) 광고 제공 방법 및 서버 장치
Fuadi et al. Halal marketplace: The influence of attitude, subjective norms, and perceived behavior control on purchase intention of Muslim consumers
Novotová Exploring customer loyalty to fashion brands on facebook fan pages
CN111340522A (zh) 资源推荐方法、装置、服务器及存储介质
JP2017201535A (ja) 判定装置、学習装置、判定方法及び判定プログラム
Murty et al. Content-based collaborative filtering with hierarchical agglomerative clustering using user/item based ratings
Xinchang et al. Movie recommendation algorithm using social network analysis to alleviate cold-start problem
CN115511582B (zh) 一种基于人工智能的商品推荐系统及方法
Won et al. A hybrid collaborative filtering model using customer search keyword data for product recommendation
Rossi et al. A comparison of two preference elicitation approaches for museum recommendations
CN110287373A (zh) 基于评分预测和用户特征的协同过滤电影推荐方法及系统
Regi et al. A survey on recommendation techniques in E-Commerce
KR102576123B1 (ko) 제품 공동구매 연계 시스템 및 방법
Horváth et al. The Impact of Influencers on Consumers’ Purchasing Decisions When Shopping Online

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20181001

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20191001

Year of fee payment: 5