KR20120047079A

KR20120047079A - 집단지성을 이용한 추천 시스템 및 방법

Info

Publication number: KR20120047079A
Application number: KR1020100108755A
Authority: KR
Inventors: 이채현
Original assignee: 엔에이치엔(주)
Priority date: 2010-11-03
Filing date: 2010-11-03
Publication date: 2012-05-11
Also published as: JP5809527B2; JP2012099115A; KR101565339B1

Abstract

집단지성을 이용한 추천 시스템 및 방법이 개시된다. 집단지성을 이용한 추천 시스템은 상품과 관련되어 인터넷 상에 게시된 평점 정보를, 평점 정보를 게시한 사용자 및 상품과 연관하여 수집하는 평점 정보 수집부; 평점 정보를 이용하여 사용자 간의 유사도를 측정한 후, 사용자 간의 유사도에 따라 사용자를 클러스터링 한 클러스터를 생성하는 유사성향 사용자 클러스터 생성부; 및 서비스 대상자가 속하는 클러스터에 포함된 사용자의 평점 정보를 근거로 서비스 대상자에게 상품에 대한 추천 서비스를 제공하는 서비스 제공부를 포함한다.

Description

집단지성을 이용한 추천 시스템 및 방법{RECOMMENDATION SYSTEM USING COLLECTIVE INTELLIGENCE AND METHOD THEREOF}

본 발명의 실시예들은 집단지성을 이용하여 비슷한 성향을 가진 사람들이 추천하는 상품을 제공할 수 있는 추천 시스템 및 방법에 관한 것이다.

영화나 소설과 같은 문화재를 소비할 때는, 절대적인 평가보다는 취향에 따른 상대적인 평가가 더 중요한 역할을 할 수 있다.

포털 사이트나 인터넷 서점에 남기는 영화 감사평이나, 책의 후기 등을 이용하면 해당 작품에 대한 대중의 평가는 쉽게 알 수 있지만, 나와 비슷한 취향을 가진 사람들이 이 작품을 어떻게 평가했는지를 알기는 힘들다.

집단지성을 이용한 추천 시스템은 많은 분야에 응용되고 있으나, 우선 많은 사용자들의 평가 데이터베이스를 구축하기가 힘들다. 또한, 해당 서비스를 제대로 사용하기 위해서는 나의 정보(예를 들어, 내가 좋아하는 상품 등)를 먼저 입력해야 하는 진입 장벽이 존재하기 마련이다.

마이크로블로그, 포털 사이트의 평점 사이트 등에서 개인들이 상품의 평점을 기록한 평가 문서를 수집하여 집단의 상품 평가 데이터베이스를 구축할 수 있는 집단지성을 이용한 추천 시스템 및 방법이 제공된다.

집단의 상품 평가 데이터베이스를 이용하여 유사한 성향을 가진 사용자들이 추천하는 상품 정보를 제시할 수 있는 집단지성을 이용한 추천 시스템 및 방법이 제공된다.

상품과 관련되어 인터넷 상에 게시된 평점 정보를, 평점 정보를 게시한 사용자 및 상품과 연관하여 수집하는 평점 정보 수집부; 평점 정보를 이용하여 사용자 간의 유사도를 측정한 후, 사용자 간의 유사도에 따라 사용자를 클러스터링 한 클러스터를 생성하는 유사성향 사용자 클러스터 생성부; 및 서비스 대상자가 속하는 클러스터에 포함된 사용자의 평점 정보를 근거로 서비스 대상자에게 상품에 대한 추천 서비스를 제공하는 서비스 제공부를 포함하는 집단지성을 이용한 추천 시스템이 제공된다.

일측에 따르면, 집단지성을 이용한 추천 시스템은 인터넷 상에 게시된 게시 문서를 수집하는 문서 수집부; 게시 문서 중 상품과 관련된 게시 문서를 추출하는 문서 필터링부; 및 게시 문서에 대한 단어 긍정도를 계산하는 긍정도 계산부를 더 포함할 수 있다. 이때, 평점 정보 수집부는 단어 긍정도를 상품의 평점 정보로 수집할 수 있다.

다른 측면에 따르면, 집단지성을 이용한 추천 시스템은 상품과 관련된 적어도 하나의 키워드를 유지하는 상품 키워드 데이터베이스를 더 포함할 수 있다. 이때, 문서 필터링부는 상품 키워드 데이터베이스를 기반으로 키워드와 매칭되는 단어가 포함된 게시 문서를 추출할 수 있다.

또 다른 측면에 따르면, 집단지성을 이용한 추천 시스템은 긍정어에 해당되는 긍정적 키워드 및 긍정적 키워드 별로 부여된 긍정어 가중치와, 부정어에 해당되는 부정적 키워드 및 부정적 키워드 별로 부여된 부정어 가중치를 유지하는 긍정/부정 키워드 데이터베이스를 더 포함할 수 있다. 이때, 긍정도 계산부는 긍정/부정 키워드 데이터베이스를 기반으로 게시 문서에서 긍정적 키워드 또는 부정적 키워드에 매칭되는 단어를 추출한 후, 추출된 단어에 대응되는 긍정어 가중치 또는 부정어 가중치를 이용하여 단어 긍정도를 계산할 수 있다.

또 다른 측면에 따르면, 평점 정보 수집부는 적어도 하나의 웹 사이트로부터 수집된 사용자의 사이트 ID 및 사이트 ID 별로 할당된 유니크 키를 유지하는 사용자 데이터베이스; 및 사용자 데이터베이스를 기반으로 사용자가 게시한 평점 정보를 상품의 ID 및 사용자의 유니크 키 값에 따라 관리하는 평점 정보 데이터베이스를 포함할 수 있다. 이때, 사용자 데이터베이스는 사이트 ID 중 ID가 동일한 사이트 ID에 대하여 서로 다른 값의 유니크 키가 할당되되, 사용자의 인증을 통해 동일 사용자로 판단되면 유니크 키가 같은 값으로 재 할당될 수 있다.

또 다른 측면에 따르면, 사용자 간의 유사도는 사용자 간에 동일한 상품의 평점 정보를 비교한 값이며, 유사성향 사용자 클러스터 생성부는 사용자 별로 각기 다른 사용자와의 유사도를 유지하는 유사도 데이터베이스; 및 사용자 간의 유사도가 설정치 이상인 사용자를 같은 클러스터로 관리하는 클러스터 데이터베이스를 포함할 수 있다.

또 다른 측면에 따르면, 집단지성을 이용한 추천 시스템은 서비스 대상자가 클러스터에 포함되어 있지 않은 경우, 인터넷 상에 평점 정보를 게시한 사용자를 대상으로 서비스 대상자와의 유사도가 설정치 이상인 사용자를 검색하는 유사성향 사용자 검색부; 및 서비스 대상자에 대한 상기 검색된 사용자와의 유사도를 유사도 데이터베이스에 갱신한 후 해당 서비스 대상자를 클러스터 데이터베이스에 추가하는 데이터베이스 갱신부를 더 포함할 수 있다.

또 다른 측면에 따르면, 서비스 제공부는 서비스 대상자가 속한 클러스터에 대하여, 상품 별로 사용자의 평점 정보에 해당 사용자와의 유사도를 곱한 가중치의 합계를 사용자 간 유사도의 합계로 나누어 상품에 대한 최종 평점을 산출하는 최종 평점 산출부; 및 최종 평점을 기준으로 상품을 추천하는 상품 추천부를 포함할 수 있다.

집단지성을 이용하여 상품을 추천하는 추천 방법에 있어서, 상품과 관련되어 인터넷 상에 게시된 평점 정보를, 평점 정보를 게시한 사용자 및 상품과 연관하여 수집하는 평점 정보 수집단계; 평점 정보를 이용하여 사용자 간의 유사도를 측정한 후, 사용자 간의 유사도에 따라 사용자를 클러스터링 한 클러스터를 생성하는 유사성향 사용자 클러스터 생성단계; 및 서비스 대상자가 속하는 클러스터에 포함된 사용자의 평점 정보를 근거로 서비스 대상자에게 상품에 대한 추천 서비스를 제공하는 서비스 제공단계를 포함하는 집단지성을 이용한 추천 방법이 제공된다.

포털 사이트의 평점 사이트 또는 개인들이 사용하는 마이크로블로그를 수집하여 집단의 상품 평가 데이터베이스를 구축함으로써 서비스 대상자가 별도의 취향 정보를 입력하지 않더라도 유사 성향을 가진 사용자의 평점을 기초로 한 추천 서비스를 제공할 수 있다. 따라서, 집단 지성의 데이터베이스를 이용하면 서비스 대상자와 비슷한 취향을 가진 사용자들이 추천하는 상품 정보를 얻을 수 있다.

도 1은 본 발명의 일실시예에 있어서, 유사 성향 집단의 상품 평가 데이터베이스를 구축하여 이를 통해 추천 서비스를 제공하는 집단지성을 이용한 추천 시스템의 내부 구성을 도시한 블록도이다.
도 2는 평점 정보를 수집하는 일례를 설명하기 위한 도면이다.
도 3은 본 발명의 일실시예에 있어서, 인터넷 상에 게시된 평점 정보와 이를 게시한 사용자를 수집하여 데이터베이스화 한 평점 정보 수집부의 구성을 도시한 블록도이다.
도 4는 본 발명의 일실시예에 있어서, 마이크로블로그에서 수집된 게시 문서의 필터링을 통해 평점 정보와 사용자를 데이터베이스 화 하는 집단지성을 이용한 추천 시스템의 추가 구성을 도시한 블록도이다.
도 5는 본 발명의 일실시예에 있어서, 유사성향의 사용자를 클러스터링 한 유사성향 사용자 클러스터 생성부의 구성을 도시한 블록도이다.
도 6은 유사한 성향의 사용자를 클러스터링 하는 일례를 설명하기 위한 도면이다.
도 7은 본 발명의 일실시예에 있어서, 데이터베이스에 포함되지 않은 사용자에 대한 유사성향의 사용자를 검색하여 데이터베이스를 갱신하는 집단지성을 이용한 추천 시스템의 추가 구성을 도시한 블록도이다.
도 8은 본 발명의 일실시예에 있어서, 유사성향을 가진 사용자의 평점 정보를 이용하여 상품을 추천하는 서비스 제공부의 구성을 도시한 블록도이다.
도 9는 본 발명의 일실시예에 있어서, 유사 성향 집단의 상품 평가 데이터베이스를 구축하여 이를 통해 추천 서비스를 제공하는 집단지성을 이용한 추천 방법을 도시한 흐름도이다.

이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.

도 1은 본 발명의 일실시예에 있어서, 유사 성향을 보이는 집단의 상품 평가 데이터베이스를 구축하여 이를 통해 추천 서비스를 제공하는 집단지성을 이용한 추천 시스템의 내부 구성을 도시한 블록도이다. 도 1은 상품에 대한 대중의 평가를 토대로 서비스 대상자에게 상품을 추천하는 집단지성을 이용한 추천 시스템(100)을 도시한 것이다.

본 명세서에서, '상품'은 영화, 연극, 소설 등의 문화재뿐 아니라, 판매를 목적으로 하는 물건이나 서비스 등을 포괄하여 의미할 수 있다.

일실시예에 따른 추천 시스템(100)은 평점 정보 수집부(110), 유사성향 사용자 클러스터 생성부(120), 서비스 제공부(130)를 포함할 수 있다.

평점 정보 수집부(110)는 상품과 관련되어 인터넷 상에 게시된 평점 정보를, 게시자인 사용자 및 해당 상품과 연관하여 수집 및 저장하는 수단을 의미한다. 평점 정보 수집부(110)는 상품을 소개하는 상품 소개 사이트(예를 들어, 영화 소개 사이트)인 평점 사이트에서 평점 정보를 수집하는 방식, 또는 마이크로블로그(microblog)에 게시된 게시 문서에서 평점 정보를 추출하여 수집하는 방식에 의해 사용자 별 평점 정보를 데이터베이스로 구축할 수 있다.

유사성향 사용자 클러스터 생성부(120)는 사용자 별 평점 정보를 기초로 측정된 사용자 간의 유사도에 따라 사용자를 클러스터링(clustering) 한 사용자 클러스터를 생성하는 역할을 수행한다. 아울러, 유사성향 사용자 클러스터 생성부(120)는 사용자 간의 유사도, 및 사용자 클러스터를 저장하는 수단을 의미한다. 즉, 유사성향 사용자 클러스터 생성부(120)에 의해 사용자 별로 각기 다른 사용자와의 유사도를 유지 및 관리하고, 유사 성향의 사용자를 같은 클러스터로 유지 및 관리할 수 있다.

서비스 제공부(130)는 추천 서비스를 제공받고자 하는 서비스 대상자가 속하는 클러스터를 확인한 후, 서비스 대상자가 속한 클러스터 내 사용자들의 평점 정보를 근거로 서비스 대상자에게 상품에 대한 추천 서비스를 제공할 수 있다. 다시 말해, 서비스 제공부(130)는 클러스터를 통해 서비스 대상자와 유사 성향을 가지는 사용자의 평점 정보를 이용하여 유사 성향의 사용자들이 추천하는 상품을 대상으로 서비스할 수 있다.

도 2 내지 도 8을 참조하여, 일실시예에 따른 집단지성을 이용한 추천 시스템의 구성 및 작용을 상세히 설명하기로 한다.

평점 정보 수집부

먼저, 평점 사이트에서 사용자 별 평점 정보를 수집하는 방식을 설명한다.

도 2에 도시한 바와 같이, 평점 정보 수집부(110)는 포털 사이트에서 제공되는 상품 소개 페이지 등의 평점 사이트(210)에서 사용자의 사이트 ID(201)와 사용자들이 평점 사이트(210)에 남기는 평점 정보(202)를 수집할 수 있다. 도 2와 같이, 평점 사이트(210)에 평점을 남긴 웹 페이지가 다수 페이지인 경우, 평점 정보 수집부(110)는 페이지를 바꿔가며 사용자의 사이트 ID(201)와 평점 정보(202)를 수집할 수 있다.

평점 정보 수집부(110)는 수집된 사용자 별 평점 정보를 데이터베이스로 구축한다. 도 3에 도시한 바와 같이, 평점 정보 수집부(300)는 사용자 데이터베이스(310)와, 평점 정보 데이터베이스(320)로 구성될 수 있다.

사용자 데이터베이스(310)는 표 1과 같이 적어도 하나의 웹 사이트로부터 수집된 사용자의 사이트 ID, 및 사이트 ID 별로 할당된 유니크 키를 유지 및 관리한다. 사용자 데이터베이스(310)는 기본적으로 사이트 별로 사이트 ID가 같더라도 다른 사용자로 판단하여 서로 다른 값의 유니크 키를 할당하고, 차후에 사용자가 본인 인증을 한 경우 동일 사용자로 간주하여 표 1과 같이 동일한 유니크 키를 재 할당할 수 있다.

id	사이트 ID(사용자)	사이트 명	유니크 키
1	xlos	naver	1
2	xlos	Yes24	1
3	chaehyun	interpark	1
4	nomad	buxmovie	2

평점 정보 데이터베이스(320)는 사용자 데이터베이스(310)를 기반으로 표 2와 같이 사용자가 게시한 평점 정보를 상품의 ID와 사용자의 유니크 키 값과 연관하여 유지 및 관리한다. 즉, 평점 정보 데이터베이스(320)는 사용자 데이터베이스(310)에 구축된 각 사용자가 남기는 상품 별 평점을 기록한다. 이때, 평점 정보는 -1에서 1 이내로 정규화 되어 저장되는 값을 의미한다. 특히, 평점이 -1에 가까울수록 상품에 대한 부정적 의견이, 1에 가까울수록 상품에 대한 긍정적 의견이 반영된 값을 의미한다.

id	상품 ID	유니크 키	평점(grade)
1	1	1	1
2	1	2	1
2	1	2	1
4	2	2	-0.4

모든 상품에 대하여 사용자 별 평점 정보를 수집하여 평점 정보 데이터베이스(320)를 구축할 수 있으며, 또는 지난 일정 기간(기간 변경 가능) 동안 사용자들이 남긴 평점이 높은 순으로 일정 개수(n개)의 상품을 선별하여 평점 정보 데이터베이스(320)를 구축할 수 있다.

상기한 구성에 의하면, 평점 정보 수집부(300)는 평점 사이트로부터 평점 정보를 수집하여, 각 상품과 연관된 사용자 별 평점 정보를 데이터베이스화 하여 유지 및 관리할 수 있다.

다음으로, 마이크로블로그에서 사용자 별 평점 정보를 수집하는 방식을 설명한다.

이를 위한 구성으로, 도 4에 도시한 바와 같이 일실시예에 따른 집단지성을 이용한 추천 시스템(400)은 문서 수집부(410), 상품 키워드 데이터베이스(420), 문서 필터링부(430), 긍정/부정 키워드 데이터베이스(440), 긍정도 계산부(450)를 추가 구성으로 더 포함할 수 있다.

문서 수집부(410)는 표 3과 같이 마이크로 블로깅 사이트에서 사용자의 사이트 ID 및 사용자가 게시한 게시 문서를 수집한다. 여기서, 마이크로블로그는 한두 문장 정도의 짧은 메시지를 이용하여 여러 사람과 소통할 수 있는 소셜 네트워크 서비스의 일종으로, 트위터(twitter), 판오우(fanfou) 등의 해외 사이트와, 미투데이(me2day), 요즘(yozm) 등의 국내 사이트가 대표적인 마이크로블로그에 해당된다.

id	사이트 명	사이트 ID (사용자)	게시문서(text)	게시일
1	me2day	xlos	인셉션 정말 최고였음!!	2010.08.02 12:22:40
2	twitter	nomad	이끼.. 정말 최악의 영화	2010.07.22 22:15:23
3	me2day	xlos	오늘 너무 졸리다 ㅠ.ㅠ	2010.08.01 10:12:40
4	twitter	chae	연극 라이어2 추천~~~	2010.05.05 12:15:23
5	me2day	xlos	오늘 미드 데미지스 봤는데, 완전 재밌었음. ㅎㅎ	2010.08.02 10:00:15

상품 키워드 데이터베이스(420)는 상품과 관련된 적어도 하나의 키워드를 유지하는 역할을 수행한다. 이때, 상품 키워드 데이터베이스(420)는 표 4와 같이 상품 별로 대표 키워드, 및 관련 키워드를 대응시켜 유지 및 관리할 수 있다. 또한, 상품 키워드 데이터베이스(420)는 각 상품을 카테고리 별로 구분하여 상품 별 키워드를 데이터베이스화 할 수 있다.

id	카테고리	키워드	관련 키워드
1	movie	인셉션	inception
2	movie	이끼
3	play	라이어2	lier2
4	drama	damages	데미지스, 데미지

문서 필터링부(430)는 상품 키워드 데이터베이스(420)를 기반으로 상품과 관련된 게시문서를 필터링 하는 역할을 수행한다. 다시 말해, 문서 필터링부(430)는 표 3에 수집된 게시문서 중 상품 키워드 데이터베이스(420) 내의 키워드와 매칭되는 단어가 포함된 게시문서를 추출한다. 표 5에서, 음영이 지정된 게시문서가 키워드 매칭을 통해 추출한, 상품과 관련된 게시문서에 해당된다.

긍정/부정 키워드 데이터베이스(440)는 긍정어와 부정어를 분류하여 표 6과 같이 데이터베이스를 구축하는 것으로, 긍정어에 해당되는 긍정적 키워드 및 긍정적 키워드 별로 부여된 긍정어 가중치, 부정어에 해당되는 부정적 키워드 및 부정적 키워드 별로 부여된 부정어 가중치를 유지하는 역할을 수행한다. 긍정/부정 키워드 데이터베이스(440)는 사전에 기계 학습(machine learning)을 통해 학습하여 준비할 수 있다.

id	분류(category)	키워드(긍정/부정)	가중치(weight)
1	긍정어(POSITIVE)	추천	1
2	긍정어(POSITIVE)	좋다	1
3	긍정어(POSITIVE)	재미있다	0.7
4	긍정어(POSITIVE)	최고	1
5	부정어(NEGATIVE)	비추	-1
6	부정어(NEGATIVE)	최악	-1
7	부정어(NEGATIVE)	졸리다	-0.5

긍정도 계산부(450)는 긍정/부정 키워드 데이터베이스(440)를 기반으로 필터링을 거쳐 추출된 표 5의 게시 문서의 단어 긍정도를 계산한다. 긍정도 계산부(450)는 게시 문서에서 긍정적 키워드 또는 부정적 키워드에 매칭되는 단어를 추출한 후, 추출된 단어에 대응되는 긍정어 가중치 또는 부정어 가중치를 이용하여 단어 긍정도를 계산할 수 있다. 일례로, 긍정도 계산부(450)는 수학식 1에 의해 게시 문서의 단어 긍정도를 계산할 수 있다.

긍정도 계산부(450)는 게시 문서를 형태소 단위의 단어로 분류하여 분류된 단어 중 긍정적 키워드 또는 부정적 키워드에 매칭되는 단어에 할당된 긍정어 가중치 또는 부정어 가중치를 키워드 가중치(keyword weight)로 판단한다. 이어, 긍정도 계산부(450)는 수학식 2에 의해 문장거리 가중치(sentence distance weight)를 계산할 수 있다.

다시 말해, 긍정도 계산부(450)는 게시 문서를 문장 단위의 구절로 분류하여 분류된 전체 구절 수에서, 긍정적 키워드 또는 부정적 키워드에 매칭되는 단어를 포함하는 구절과 상품과 관련된 키워드와 매칭되는 단어를 포함하는 구절 간의 거리를 뺀 값을, 전체 구절 수로 나누어 문장거리 가중치를 계산한다.

예를 들어, 게시 문서가 '인셉션을 봤다. 이거 생각보다 재밌군~ 추천합니다~'인 경우, 다음과 같은 방식으로 단어 긍정도가 계산된다.

(1) 게시 문서를 형태소 단위로 쪼갠다.

<인셉션을 봤다. 이거 생각보다 재밌군~ 추천합니다~> -> <[인셉셥], [보다], [이거], [생각], [재미있다], [추천하다]>

(2) 키워드 가중치를 계산한다.

[재미]= 0.7

[추천]=1.0

(3) 게시 문서를 문장 단위로 쪼갠다.

<인셉션을 봤다. 이거 생각보다 재밌군~ 추천합니다~> -> <[인셉션을 봤다], [이거 생각보다 재밌군], [추천합니다]>

(4) 문장거리 가중치를 계산한다.

[인셉션을 봤다] = (3-0) / 3 = 1

[이거 생각보다 재밌군] = (3-1) / 3 = 0.66

[추천합니다] = (3-2) / 3 = 0.33

(5) 키워드 가중치와 문장거리 가중치를 이용하여 단어 긍정도를 최종 판단한다.

단어 긍정도 = [재미](0.7 * 0.66) + [추천](1.0 * 0.33) = 0.79

상기한 과정을 통해 계산된 단어 긍정도가 양수이면 게시 문서에 게시된 상품의 평점이 긍정이고, 음수이면 상품의 평점이 부정인 것으로 판단할 수 있다.

아울러, 긍정도 계산부(450)는 각 상품에 대하여 사용자 별 단어 긍정도를 합산한 다음, 합산한 값을 -1에서 1 이내로 정규화한다. 여기서, 게시 문서의 단어 긍정도는 게시 문서에 관련된 상품에 대한 사용자의 평점 정보로 이용할 수 있다.

상기한 구성을 통해, 평점 정보 수집부(300)는 마이크로블로그에서 수집된 사용자를 대상으로 사용자의 사이트 ID 별로 유니크 키를 할당한, 표 1과 같은 사용자 데이터베이스(310)를 구축할 수 있다. 또한, 평점 정보 수집부(300)는 긍정도 계산부(450)에서 계산된 게시 문서의 단어 긍정도를 해당 상품의 평점 정보로 저장함으로써 마이크로블로그에서 수집된 평점 정보를 대상으로 각 상품과 연관된 사용자 별 평점 정보를 표 2와 같은 평점 정보 데이터베이스(320)로 구축할 수 있다.

유사성향 사용자 클러스터 생성부

도 5는 유사성향의 사용자를 클러스터링 한 유사성향 사용자 클러스터 생성부(500)를 도시한 것이다. 도시한 바와 같이, 유사성향 사용자 클러스터 생성부(500)는 유사도 데이터베이스(510)와, 클러스터 데이터베이스(520)로 구성될 수 있다.

유사도 데이터베이스(510)는 사용자 별 각기 다른 사용자와의 유사도를 유지 및 관리하는 역할을 수행한다. 사용자들의 성향에 대한 유사도는 피어슨 상관점수, 유클리디안 거리, 자카드 계수, 맨하튼 거리 등을 이용한 여러 방식에 의해 측정될 수 있다. 일례로, 피어스 상관점수는 두 개의 데이터 집합이 한 직선으로 얼마나 잘 표현되는가를 나타내는 측정값을 의미하는 것으로, 피어슨 상관점수를 이용하여 사용자 간의 유사도를 측정할 수 있다. 예를 들어, 특정 사용자가 평가한 상품과 동일한 상품을 평가한 다른 사용자들을 찾은 후, 두 사용자들이 상품에 남긴 평점을 비교하여 두 사용자의 피어슨 상관점수를 계산할 수 있다. 이때, 피어슨 상관점수는 -1에서 1 이내의 값으로 나오며 그 중 1은 두 사람이 모든 상품에 같은 점수를 주었음을 나타낸다. 즉, 유사도 데이터베이스(510)는 사용자와 다른 사용자의 상품 별 평점 정보를 기초로 계산된 사용자 간의 유사도를 표 7과 같이 구축할 수 있다.

사용자ID_1	사용자ID_2	유사도
1	2	0.8
1	3	0.9
1	4	0.1

클러스터 데이터베이스(520)는 사용자 간의 유사도가 설정치 이상인 사용자를 같은 클러스터로 관리하는 역할을 수행한다. 각 상품과 연관된 사용자 별 평점 정보를 유지하는 평점 정보 데이터베이스(320)에는 매우 많은 사용자가 존재하고, 각 사용자 간의 유사도를 매번 계산하려면 많은 시간이 소요되기 때문에, 주기적으로 평점 정보 데이터베이스(320)를 기반으로 각 사용자 간의 유사도를 계산한 다음, 유사도 데이터베이스(510)를 갱신하고, 아울러 유사한 성향을 지닌 사용자를 클러스터링 하여 클러스터 데이터베이스(520)를 갱신할 수 있다. 일례로, 사용자들이 남긴 평점이 높은 순에 따라 선택된 일정 개수(n개)의 상품을 대상으로 하는 경우, n개의 상품에 평점을 남긴 사용자들을 대상으로 사용자 간의 유사도를 계산할 수 있다. 도 6을 참조하면, 유사도에 설정치를 적용하여 유사도 값이 설정치를 넘은 사용자들끼리 그래프(601)(602)로 연결하고 동일한 그래프(601)(602)로 묶이는 사용자들을 표 8과 같이 같은 클러스터로 저장할 수 있다.

사용자ID	클러스터 ID
1	1
2	1
3	1

상기한 구성에 따르면, 유사성향 사용자 클러스터 생성부(500)는 사용자 간 유사도를 기반으로 생성된 클러스터를 통해 유사 성향의 사용자들을 관리할 수 있도록 사용자 별 클러스터를 클러스터 데이터베이스(520)로 구축할 수 있다.

서비스 제공부

일실시예에 따른 집단지성을 이용한 추천 시스템은 추천 서비스를 제공하기에 앞서, 서비스 대상자가 속한 클러스터를 확인하여 서비스 대상자가 클러스터에 포함되지 않은 사용자인 경우, 서비스 대상자를 클러스터에 추가하는 기능을 제공할 수 있다.

이를 위한 구성으로, 도 7에 도시한 바와 같이 일실시예에 따른 집단지성을 이용한 추천 시스템(700)은 유사성향 사용자 검색부(710), 데이터베이스 갱신부(720)를 추가 구성으로 더 포함할 수 있다.

유사성향 사용자 검색부(710)는 서비스 대상자가 개인 정보(예를 들어, 사이트 ID)를 입력하면 개인 정보를 통해 서비스 대상자가 클러스터 데이터베이스(520) 내의 클러스터에 포함된 사용자인지 여부를 확인한다. 그리고, 유사성향 사용자 검색부(710)는 서비스 대상자가 클러스터에 포함되지 않은 경우 클러스터에 포함된 사용자를 대상으로 서비스 대상자와의 유사도가 설정치 이상인 사용자를 찾을 수 있다. 또한, 유사성향 사용자 검색부(710)는 클러스터에 포함된 사용자 중 서비스 대상자와 유사한 성향을 가진 사용자가 존재하지 않는 경우 클러스터에 포함되어 있지 않더라도 상품 별 평점 정보가 구축되어 있는 사용자를 대상으로 하거나, 실시간으로 상품 별 평점 정보를 게시하는 사용자를 대상으로 서비스 대상자와의 유사도가 설정치 이상인 사용자를 찾을 수 있다.

데이터베이스 갱신부(720)는 신규 사용자인 서비스 대상자에 대하여 유사도 데이터베이스(510)와 클러스터 데이터베이스(520)를 갱신하는 역할을 수행한다. 다시 말해, 클러스터 데이터베이스(520) 내의 클러스터에서 서비스 대상자와 유사한 성향을 가진 사용자를 찾으면 해당 사용자가 속하는 클러스터에 서비스 대상자를 추가하고, 클러스터 이외의 사용자를 대상으로 하여 서비스 대상자와 유사한 성향을 가진 사용자를 찾으면 해당 사용자와 서비스 대상자로 이루어진 클러스터를 추가로 생성하여 클러스터 데이터베이스(520)를 갱신할 수 있다. 또한, 데이터베이스 갱신부(720)는 서비스 대상자와 유사한 성향을 가진 사용자를 찾으면 서비스 대상자에 대한 사용자와의 유사도를 유사도 데이터베이스(510)에 추가 갱신할 수 있다.

더욱이, 일실시예에 따른 집단지성을 이용한 추천 시스템은 서비스 대상자와 서비스 대상자가 속한 클러스터에 포함된 사용자 간의 유사도, 및 해당 클러스터에 포함된 사용자의 평점 정보를 이용하여 서비스 대상자에게 상품 추천을 서비스할 수 있다.

이를 위한 구성으로, 일실시예에 따른 집단지성을 이용한 추천 시스템에서 서비스 제공부(800)는 도 8에 도시한 바와 같이 최종 평점 산출부(810), 상품 추천부(820)로 구성될 수 있다.

최종 평점 산출부(810)는 평점 정보 데이터베이스(320), 유사도 데이터베이스(510), 클러스터 데이터베이스(520)를 이용하여 서비스 대상자가 속한 클러스터에서, 해당 클러스터에 포함된 사용자 간의 유사도 점수와, 상품 별 사용자의 평점 정보를 추출한다. 이때, 서비스 대상자가 속한 클러스터에 포함된 사용자 목록과, 각 사용자와의 유사도 점수와, 상품 별 평점 정보는 도 9와 같이 정리될 수 있다.

사용자	유사도	이끼 평점	이끼 가중치	인셉션 평점	인셉션 가중치	라이어 평점	라이어 가중치
이채현	0.99	0.90	0.89	0.60	0.59	0.70	0.69
홍길동	0.38	0.40	0.15	0.40	0.15	1.00	0.38
홍길순	0.78	0.70	0.55			0.90	0.70
김철수	0.67	0.80	0.54	0.90	0.60
가중치 합계			2.13		1.35		1.78
유사도 합계			2.82		2.04		2.15
정규화 (최종평점)			0.75		0.66		0.83

상세하게, 최종 평점 산출부(810)는 각 상품의 평점에 유사도를 곱한 가중치의 합계(weighted sum)를 구하고, 동일한 상품에 평점을 남긴 사용자들의 유사도 합계를 산출한 후, 가중치의 합계를 유사도 합계로 나눈 정규화 값을 구한다. 이때, 정규화 값이 상품에 대한 최종 평점이 된다.

상품 추천부(820)는 상품 별 최종 평점을 기준으로 서비스 대상자에게 상품을 추천한다. 일례로, 상품 추천부(820)는 서비스 대상자가 추천 서비스를 제공하는 사이트에 로그인하는 경우, 카테고리(예를 들어, 영화, 소설, 연극 등) 별로 구분하여 최종 평점이 높은 순으로 상품을 추천할 수 있다. 다른 일례로, 상품 추천부(820)는 서비스 대상자가 추천 서비스를 제공하는 사이트에 로그인하고 특정 카테고리를 선택하는 경우 서비스 대상장가 선택한 카테고리에 해당되는 상품을 최종 평점이 높은 순으로 추천할 수 있다. 또 다른 일례로, 상품 추천부(820)는 서비스 대상자가 상품을 검색하는 경우, 해당 상품에 대한 일반적인 평점 정보(즉, 모든 사용자들이 남긴 평점의 평균)와 함께, 서비스 대상자와 유사한 성향을 가진 사용자들의 평점 정보를 근거로 산출된 상품 별 최종 평점을 보여줄 수 있다. 또 다른 일례로, 상품 추천부(820)는 서비스 대상자가 상품을 검색하는 경우, 해당 상품과 관련하여 서비스 대상자와 비슷한 성향의 사용자들이 추천하는 상품들을 추천할 수 있다.

상기한 구성에 의하면, 서비스 제공부(800)는 서비스 대상자와 유사 성향을 가지는 사용자의 평점 정보 및 사용자 간의 유사도를 이용하여 상품 별 최종 평점을 산출하고, 상품 별 최종 평점을 기준으로 하여 상품을 추천할 수 있다.

도 9는 본 발명의 일실시예에 있어서, 유사 성향 집단의 상품 평가 데이터베이스를 구축하여 이를 통해 추천 서비스를 제공하는 집단지성을 이용한 추천 방법을 도시한 흐름도이다. 본 실시예에 따른 집단지성을 이용한 추천 방법은 도 1과 도 4를 통해 설명한 추천 시스템에 의해 각각의 단계가 수행될 수 있다.

단계(910)에서 추천 시스템은 상품과 관련되어 인터넷 상에 게시된 평점 정보를, 게시자인 사용자 및 해당 상품과 연관하여 평점 정보 데이터베이스를 구축한다.

평점 정보 데이터베이스를 구축하기 위한 일례로, 단계(911)에서 추천 시스템은 상품 소개 사이트(예를 들어, 영화 소개 사이트)인 평점 사이트에서 평점 정보를 수집하는 방식을 이용할 수 있다. 즉, 포털 사이트에서 제공되는 상품 소개 페이지 등의 평점 사이트에서 사용자의 사이트 ID와 사용자들이 평점 사이트에 남기는 평점 정보를 수집할 수 있다.

평점 정보 데이터베이스를 구축하기 위한 다른 일례로, 단계(912)에서 추천 시스템은 마이크로블로그에 게시된 게시 문서에서 평점 정보를 추출하여 수집하는 방식을 이용할 수 있다. 즉, 추천 시스템은 마이크로 블로깅 사이트에서 사용자의 사이트 ID 및 사용자가 게시한 게시 문서를 수집한다. 단계(913)에서 추천 시스템은 상품과 관련된 적어도 하나의 키워드를 유지하는 상품 키워드 데이터베이스를 기반으로 단계(912)에서 수집된 게시 문서 중 상품과 관련된 키워드가 포함된 게시 문서를 추출한다. 단계(914)에서 추천 시스템은 긍정어에 해당되는 긍정적 키워드 및 긍정적 키워드 별로 부여된 긍정어 가중치, 부정어에 해당되는 부정적 키워드 및 부정적 키워드 별로 부여된 부정어 가중치를 유지하는 긍정/부정 키워드 데이터베이스를 기반으로, 단계(913)에서 필터링을 거쳐 추출된 게시 문서의 단어 긍정도를 계산한다. 추천 시스템은 게시 문서에서 긍정적 키워드 또는 부정적 키워드에 매칭되는 단어를 추출한 후, 추출된 단어에 대응되는 긍정어 가중치 또는 부정어 가중치를 이용하여 단어 긍정도를 계산할 수 있다. 이때, 게시 문서의 단어 긍정도는 평점 정보 데이터베이스를 구축하는데 상품 별 사용자의 평점 정보로 저장될 수 있다.

단계(920)에서 추천 시스템은 사용자 별로 각기 다른 사용자와의 유사도를 유지하는 유사도 데이터베이스, 및 사용자 간의 유사도에 따라 사용자를 클러스터링 한 사용자 클러스터를 유지하는 클러스터 데이터베이스를 구축한다. 일례로, 추천 시스템은 특정 사용자가 평가한 상품과 동일한 상품을 평가한 다른 사용자들을 찾은 후, 두 사용자들이 상품에 남긴 평점을 비교하여 두 사용자 간의 유사도를 계산할 수 있다. 그리고, 추천 시스템은 사용자 별로 다른 사용자와의 유사도를 데이터베이스로 구축하고, 아울러 사용자 간의 유사도가 설정치 이상인 사용자들을 클러스터로 묶어 클러스터 별 사용자 그룹을 데이터베이스로 구축할 수 있다. 즉, 추천 시스템은 사용자 별로 다른 사용자와의 유사도를 유지 및 관리하고, 상품 평점에 있어 유사 성향을 가지는 사용자들을 같은 클러스터로 유지 및 관리할 수 있다.

단계(930)에서 추천 시스템은 단계(910)에서 구축된 평점 정보 데이터베이스, 및 단계(920)에서 구축된 유사도 데이터베이스와 클러스터 데이터베이스를 이용하여 추천 서비스를 제공받고자 하는 서비스 대상자에게 서비스 대상자와 유사 성향을 가지는 사용자들이 추천하는 상품을 추천할 수 있다. 추천 시스템은 서비스 대상자가 속한 클러스터를 통해 사용자 간의 유사도 및, 상품 별 사용자의 평점 정보를 추출한 후, 평점 정보에 유사도를 곱한 가중치의 합계를 사용자 간의 유사도 합계로 나누어 상품 별 최종 평점을 산출할 수 있다. 이에, 추천 시스템은 서비스 대상자에게 최종 평점이 높은 순으로 상품을 추천할 수 있다.

이와 같이, 본 발명의 실시예들에 따르면, 포털 사이트의 평점 사이트 또는 개인들이 사용하는 마이크로블로그에서 상품에 대한 사용자 별 평점 정보를 수집하여 집단의 상품 평가 데이터베이스를 구축할 수 있다. 이를 통해, 서비스 대상자가 별도의 취향 정보를 입력하지 않더라도 서비스 대상자와 유사 성향을 가진 사용자의 평점을 기초로 한 추천 서비스를 제공할 수 있다.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.

그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

110: 평점 정보 수집부
120: 유사성향 사용자 클러스터 생성부
130: 서비스 제공부

Claims

상품과 관련되어 인터넷 상에 게시된 평점 정보를, 상기 평점 정보를 게시한 사용자 및 상기 상품과 연관하여 수집하는 평점 정보 수집부;
상기 평점 정보를 이용하여 상기 사용자 간의 유사도를 측정한 후, 상기 사용자 간의 유사도에 따라 상기 사용자를 클러스터링 한 클러스터를 생성하는 유사성향 사용자 클러스터 생성부; 및
서비스 대상자가 속하는 상기 클러스터에 포함된 상기 사용자의 평점 정보를 근거로 상기 서비스 대상자에게 상기 상품에 대한 추천 서비스를 제공하는 서비스 제공부
를 포함하는 집단지성을 이용한 추천 시스템.
제1항에 있어서,
상기 평점 정보 수집부는,
상기 인터넷 상에 게시된 게시 문서의 단어 긍정도를 상기 상품의 평점 정보로 수집하는 것
을 특징으로 하는 집단지성을 이용한 추천 시스템.
제1항에 있어서,
상기 추천 시스템은,
상기 인터넷 상에 게시된 게시 문서를 수집하는 문서 수집부;
상기 게시 문서 중 상기 상품과 관련된 게시 문서를 추출하는 문서 필터링부; 및
상기 게시 문서에 대한 단어 긍정도를 계산하는 긍정도 계산부
를 더 포함하고,
상기 평점 정보 수집부는,
상기 단어 긍정도를 상기 상품의 평점 정보로 수집하는 것
을 특징으로 하는 집단지성을 이용한 추천 시스템.
제3항에 있어서,
상기 문서 필터링부는,
상기 상품과 관련된 적어도 하나의 키워드를 유지하는 상품 키워드 데이터베이스를 기반으로 상기 게시 문서 중 상기 키워드와 매칭되는 단어가 포함된 게시 문서를 추출하는 것
을 특징으로 하는 집단지성을 이용한 추천 시스템.
제2항에 있어서,
상기 추천 시스템은,
상기 단어 긍정도를 계산하는 긍정도 계산부
를 더 포함하고,
상기 긍정도 계산부는,
상기 게시 문서에서 긍정적 키워드 또는 부정적 키워드에 매칭되는 단어를 추출한 후, 상기 추출된 단어에 대응되는 상기 긍정적 키워드의 긍정어 가중치 또는 상기 부정적 키워드의 부정어 가중치를 이용하여 상기 단어 긍정도를 계산하는 것
을 특징으로 하는 집단지성을 이용한 추천 시스템.
제5항에 있어서,
상기 긍정도 계산부는,
상기 게시 문서를 형태소 단위의 단어로 분류하여 키워드 가중치를 계산하고 상기 게시 문서를 문장 단위의 구절로 분류하여 문장거리 가중치를 계산한 후, 상기 키워드 가중치에 상기 문장거리 가중치를 반영한 값을 상기 단어 긍정도로 판단하되,
상기 키워드 가중치는,
상기 형태소 단위의 각 단어에 대응되는 상기 긍정어 가중치 또는 상기 부정어 가중치로 계산되고,
상기 문장거리 가중치는,
상기 게시 문서를 이루는 상기 구절의 수와, 상기 긍정적 키워드 또는 상기 부정적 키워드를 포함하는 구절에서 상기 상품과 관련된 키워드를 포함하는 구절까지의 구절 간 거리로 계산되는 것
을 특징으로 하는 집단지성을 이용한 추천 시스템.
제1항에 있어서,
상기 평점 정보 수집부는,
적어도 하나의 웹 사이트로부터 수집된 상기 사용자의 사이트 ID 및 상기 사이트 ID 별로 할당된 유니크 키(unique key)를 유지하는 사용자 데이터베이스; 및
상기 사용자 데이터베이스를 기반으로 상기 사용자가 게시한 상기 평점 정보를 상기 상품의 ID 및 상기 사용자의 유니크 키 값에 따라 관리하는 평점 정보 데이터베이스
를 포함하고,
상기 사용자 데이터베이스는,
상기 사이트 ID 중 ID가 동일한 사이트 ID에 대하여 서로 다른 값의 유니크 키가 할당되되, 상기 사용자의 인증을 통해 동일 사용자로 판단되면 상기 유니크 키가 같은 값으로 재 할당되는 것
을 특징으로 하는 집단지성을 이용한 추천 시스템.
제1항에 있어서,
상기 사용자 간의 유사도는,
상기 사용자 간에 동일한 상품의 평점 정보를 비교한 값이며,
상기 유사성향 사용자 클러스터 생성부는,
상기 사용자 별로 각기 다른 사용자와의 유사도를 유지하는 유사도 데이터베이스; 및
상기 사용자 간의 유사도가 설정치(threshold) 이상인 사용자를 같은 클러스터로 관리하는 클러스터 데이터베이스
를 포함하는 집단지성을 이용한 추천 시스템.
제8항에 있어서,
상기 추천 시스템은,
상기 서비스 대상자가 상기 클러스터에 포함되어 있지 않은 경우, 상기 인터넷 상에 상기 평점 정보를 게시한 사용자를 대상으로 상기 서비스 대상자와의 유사도가 상기 설정치 이상인 사용자를 검색하는 유사성향 사용자 검색부; 및
상기 서비스 대상자에 대한 상기 검색된 사용자와의 유사도를 상기 유사도 데이터베이스에 갱신한 후 상기 서비스 대상자를 상기 클러스터 데이터베이스에 추가하는 데이터베이스 갱신부
를 더 포함하는 집단지성을 이용한 추천 시스템.
제1항에 있어서,
상기 서비스 제공부는,
상기 서비스 대상자와 상기 서비스 대상자가 속한 클러스터에 포함된 사용자 간의 유사도, 및 해당 클러스터에 포함된 사용자에 의해 게시된 상기 평점 정보를 이용하여 상기 서비스 대상자에게 상기 상품을 추천하는 것
을 특징으로 하는 집단지성을 이용한 추천 시스템.
제10항에 있어서,
상기 서비스 제공부는,
상기 서비스 대상자가 속한 클러스터에 대하여, 상기 상품 별로 상기 사용자의 평점 정보에 해당 사용자와의 유사도를 곱한 가중치의 합계를 상기 사용자 간 유사도의 합계로 나누어 상기 상품에 대한 최종 평점을 산출하는 최종 평점 산출부; 및
상기 최종 평점을 기준으로 상기 상품을 추천하는 상품 추천부
를 포함하는 집단지성을 이용한 추천 시스템.
집단지성을 이용하여 상품을 추천하는 추천 방법에 있어서,
상기 추천 방법은,
상품과 관련되어 인터넷 상에 게시된 평점 정보를, 상기 평점 정보를 게시한 사용자 및 상기 상품과 연관하여 수집하는 평점 정보 수집단계;
상기 평점 정보를 이용하여 상기 사용자 간의 유사도를 측정한 후, 상기 사용자 간의 유사도에 따라 상기 사용자를 클러스터링 한 클러스터를 생성하는 유사성향 사용자 클러스터 생성단계; 및
서비스 대상자가 속하는 상기 클러스터에 포함된 상기 사용자의 평점 정보를 근거로 상기 서비스 대상자에게 상기 상품에 대한 추천 서비스를 제공하는 서비스 제공단계를 포함하는 집단지성을 이용한 추천 방법.
제12항에 있어서,
상기 평점 정보 수집단계는,
상기 인터넷 상에 게시된 게시 문서의 단어 긍정도를 상기 상품의 평점 정보로 수집하는 것
을 특징으로 하는 집단지성을 이용한 추천 방법.
제12항에 있어서,
상기 추천 방법은,
상기 인터넷 상에 게시된 게시 문서를 수집하는 문서 수집단계;
상기 게시 문서 중 상기 상품과 관련된 게시 문서를 추출하는 문서 필터링단계; 및
상기 게시 문서에 대한 단어 긍정도를 계산하는 긍정도 계산단계
를 더 포함하고,
상기 평점 정보 수집단계는,
상기 단어 긍정도를 상기 상품의 평점 정보로 수집하는 것
을 특징으로 하는 집단지성을 이용한 추천 방법.
제14항에 있어서,
상기 문서 필터링단계는,
상기 상품과 관련된 적어도 하나의 키워드를 유지하는 상품 키워드 데이터베이스를 기반으로 상기 게시 문서 중 상기 키워드와 매칭되는 단어가 포함된 게시 문서를 추출하는 것
을 특징으로 하는 집단지성을 이용한 추천 방법.
제13항에 있어서,
상기 추천 방법은,
상기 단어 긍정도를 계산하는 긍정도 계산단계
를 더 포함하고,
상기 긍정도 계산단계는,
상기 게시 문서에서 긍정적 키워드 또는 부정적 키워드에 매칭되는 단어를 추출한 후, 상기 추출된 단어에 대응되는 상기 긍정적 키워드의 긍정어 가중치 또는 상기 부정적 키워드의 부정어 가중치를 이용하여 상기 단어 긍정도를 계산하는 것
을 특징으로 하는 집단지성을 이용한 추천 방법.
제16항에 있어서,
상기 긍정도 계산단계는,
상기 게시 문서를 형태소 단위의 단어로 분류하여 키워드 가중치를 계산하고 상기 게시 문서를 문장 단위의 구절로 분류하여 문장거리 가중치를 계산한 후, 상기 키워드 가중치에 상기 문장거리 가중치를 반영한 값을 상기 단어 긍정도로 판단하되,
상기 키워드 가중치는,
상기 형태소 단위의 각 단어에 대응되는 상기 긍정어 가중치 또는 상기 부정어 가중치로 계산되고,
상기 문장거리 가중치는,
상기 게시 문서를 이루는 상기 구절의 수와, 상기 긍정적 키워드 또는 상기 부정적 키워드를 포함하는 구절에서 상기 상품과 관련된 키워드를 포함하는 구절까지의 구절 간 거리로 계산되는 것
을 특징으로 하는 집단지성을 이용한 추천 방법.
제12항에 있어서,
상기 평점 정보 수집단계는,
적어도 하나의 웹 사이트로부터 수집된 상기 사용자의 사이트 ID 및 상기 사이트 ID 별로 할당된 유니크 키를 유지하는 사용자 데이터베이스를 구축하는 단계; 및
상기 사용자 데이터베이스를 기반으로 상기 사용자가 게시한 상기 평점 정보를 상기 상품의 ID 및 상기 사용자의 유니크 키 값에 따라 관리하는 평점 정보 데이터베이스를 구축하는 단계
를 포함하고,
상기 사용자 데이터베이스는,
상기 사이트 ID 중 ID가 동일한 사이트 ID에 대하여 서로 다른 값의 유니크 키가 할당되되, 상기 사용자의 인증을 통해 동일 사용자로 판단되면 상기 유니크 키가 같은 값으로 재 할당되는 것
을 특징으로 하는 집단지성을 이용한 추천 방법.
제12항에 있어서,
상기 사용자 간의 유사도는,
상기 사용자 간에 동일한 상품의 평점 정보를 비교한 값이며,
상기 유사성향 사용자 클러스터 생성단계는,
상기 사용자 별로 각기 다른 사용자와의 유사도를 유지하는 유사도 데이터베이스를 구축하는 단계; 및
상기 사용자 간의 유사도가 설정치 이상인 사용자를 같은 클러스터로 관리하는 클러스터 데이터베이스를 구축하는 단계
를 포함하는 집단지성을 이용한 추천 방법.
제19항에 있어서,
상기 추천 방법은,
상기 서비스 대상자가 상기 클러스터에 포함되어 있지 않은 경우, 상기 인터넷 상에 상기 평점 정보를 게시한 사용자를 대상으로 상기 서비스 대상자와의 유사도가 상기 설정치 이상인 사용자를 검색하는 유사성향 사용자 검색단계; 및
상기 서비스 대상자에 대한 상기 검색된 사용자와의 유사도를 상기 유사도 데이터베이스에 갱신한 후 상기 서비스 대상자를 상기 클러스터 데이터베이스에 추가하는 데이터베이스 갱신단계
를 더 포함하는 집단지성을 이용한 추천 방법.
제12항에 있어서,
상기 서비스 제공단계는,
상기 서비스 대상자와 상기 서비스 대상자가 속한 클러스터에 포함된 사용자 간의 유사도, 및 해당 클러스터에 포함된 사용자에 의해 게시된 상기 평점 정보를 이용하여 상기 서비스 대상자에게 상기 상품을 추천하는 것
을 특징으로 하는 집단지성을 이용한 추천 방법.
제21항에 있어서,
상기 서비스 제공단계는,
상기 서비스 대상자가 속한 클러스터에 대하여, 상기 상품 별로 상기 사용자의 평점 정보에 해당 사용자와의 유사도를 곱한 가중치의 합계를 상기 사용자 간 유사도의 합계로 나누어 상기 상품에 대한 최종 평점을 산출하는 최종 평점 산출단계; 및
상기 최종 평점을 기준으로 상기 상품을 추천하는 상품 추천단계
를 포함하는 집단지성을 이용한 추천 방법.