KR101274419B1 - 사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법 - Google Patents

사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법 Download PDF

Info

Publication number
KR101274419B1
KR101274419B1 KR1020100138879A KR20100138879A KR101274419B1 KR 101274419 B1 KR101274419 B1 KR 101274419B1 KR 1020100138879 A KR1020100138879 A KR 1020100138879A KR 20100138879 A KR20100138879 A KR 20100138879A KR 101274419 B1 KR101274419 B1 KR 101274419B1
Authority
KR
South Korea
Prior art keywords
document
keyword
data
data set
user group
Prior art date
Application number
KR1020100138879A
Other languages
English (en)
Other versions
KR20120077055A (ko
Inventor
최재걸
김유원
박연하
김혜영
반동현
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020100138879A priority Critical patent/KR101274419B1/ko
Priority to US13/337,741 priority patent/US9262790B2/en
Priority to JP2011289464A priority patent/JP5865076B2/ja
Publication of KR20120077055A publication Critical patent/KR20120077055A/ko
Application granted granted Critical
Publication of KR101274419B1 publication Critical patent/KR101274419B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes

Abstract

사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법이 개시된다. 키워드 순위 결정 시스템은, 웹로그의 데이터를 기선정된 주제별로 분류하는 데이터 분류부, 주제별로 분류된 데이터에 해당하는 문서의 주제에 대한 집중 정도를 나타내는 문서집중도를 계산하고, 문서집중도에 따른 가중치를 데이터에 부여하는 가중치 부여부, 가중치가 부여된 데이터를 검색의도별로 분류하여 적어도 하나의 데이터 집합을 생성하는 데이터 집합 생성부, 데이터 집합간의 순위를 주제별로 결정하는 순위 결정부 및 데이터 집합을 대표하는 대표 키워드를 결정하는 대표 키워드 결정부를 포함한다.

Description

사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법{SYSTEM AND MEHTOD FOR DETERMINING RANK OF KEYWORD FOR EACH USER GROUP}
본 발명의 실시예들은 사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법에 관한 것이다.
종래기술에 따른 인기검색어 제공 방법에서는 실시간 인기검색어, 일간 급상승 인기검색어, 주간 급상승 인기검색어와 같이, 전체적인 분야에서 인기가 급상승한 검색어(키워드)를 제공한다. 그러나, 이러한 종래기술에 따른 인기검색어 제공 방법은 전체 사용자들에 대해 제공되기 때문에, 주제, 성별, 연령 등과 같이 세분화된 그룹 각각에 대한 인기검색어를 제공하지 못하는 문제점이 있다.
본 명세서에서는 효과적으로 사용자 그룹별 키워드 순위를 제공할 수 있는 시스템 및 방법이 제공된다.
사용자 클러스터링 정보를 이용하여 사용자 그룹별로 인기검색어를 순위별로 제공하여 새로운 정보를 제공하고 새로운 쿼리 카운트(query count)를 유발할 수 있는 키워드 순위 결정 시스템 및 방법이 제공된다.
같은 검색의도를 갖는 키워드들을 하나의 데이터 집합으로 모아 표시하고, 각 데이터 집합의 검색점유율을 계산하여 순위를 결정하여 검색점유율과 데이터 집합의 대표 키워드를 제공함으로써, 새로운 정보를 제공하고, 사용자의 흥미를 유발할 수 있는 키워드 순위 결정 시스템 및 방법이 제공된다.
웹로그의 데이터를 기선정된 주제별로 분류하는 데이터 분류부, 주제별로 분류된 데이터에 해당하는 문서의 주제에 대한 집중 정도를 나타내는 문서집중도를 계산하고, 문서집중도에 따른 가중치를 데이터에 부여하는 가중치 부여부, 가중치가 부여된 데이터를 검색의도별로 분류하여 적어도 하나의 데이터 집합을 생성하는 데이터 집합 생성부, 데이터 집합간의 순위를 주제별로 결정하는 순위 결정부 및 데이터 집합을 대표하는 대표 키워드를 결정하는 대표 키워드 결정부를 포함하는 키워드 순위 결정 시스템이 제공된다.
일측에 따르면, 웹로그의 데이터는, 문서, 문서의 선택에 이용된 키워드 및 키워드를 통해 문서가 선택된 선택횟수 중 둘 이상에 대한 정보를 포함할 수 있고, 가중치 부여부는 문서가 분류된 주제에 해당하는 문서일 확률 및 문서가 전체 주제 각각에 해당하는 문서일 확률을 이용하여 문서별로 문서집중도를 계산하고, 문서집중도를 가중치로서 부여하여 문서에 대한 선택횟수를 조정할 수 있다.
다른 측면에 따르면, 순위 결정부는 문서별로 조정된 선택횟수를 이용하여 주제에 포함된 데이터 집합별로 점유율을 계산하고, 계산된 점유율에 따라 주제에서의 데이터 집합간의 순위를 결정할 수 있다.
또 다른 측면에 따르면, 점유율은 데이터 집합에서의 선택횟수의 합 및 전체 데이터 집합에 대한 전체 선택횟수의 합을 이용하여 계산될 수 있다.
또 다른 측면에 따르면, 데이터 집합 생성부는 동일한 문서에 대한 정보를 포함하는 데이터들을 서로 동일한 검색의도로 분류하고, 동일한 키워드 또는 키워드간 유사도가 기선정된 값 이상인 키워드들을 포함하는 데이터들을 서로 동일한 검색의도로 분류하여 데이터 집합을 생성할 수 있다.
또 다른 측면에 따르면, 데이터 집합 생성부는 문서별로 해당 문서의 선택에 이용된 키워드들에 대해 키워드간 유사도를 이용하여 문서를 클러스터링하여 동일한 문서를 포함하는 데이터들을 동일한 데이터 집합으로서 생성할 수 있다.
또 다른 측면에 따르면, 대표 키워드 결정부는 데이터 집합에 포함된 키워드들을 형태소 분석하여 계산된 형태소별 중복 횟수에 기초한 가중치, 해당 키워드를 통해 발생한 문서의 선택횟수에 따른 가중치 및 키워드의 길이에 따른 가중치 중 적어도 하나의 가중치를 이용하여 키워드들 중에서 대표 키워드를 결정할 수 있다.
또 다른 측면에 따르면, 형태소별 중복 횟수에 기초한 가중치는, 가장 많은 중복 횟수를 갖는 형태소의 포함 여부에 따라 결정될 수 있다.
또 다른 측면에 따르면, 기선정된 주제는 B-쿠키를 통해 사용자를 분류하여 결정된 사용자 그룹에 따라 분류될 수 있다.
웹로그의 데이터를 기선정된 주제별로 분류하는 단계, 주제별로 분류된 데이터에 해당하는 문서의 주제에 대한 집중 정도를 나타내는 문서집중도를 계산하고, 문서집중도에 따른 가중치를 데이터에 부여하는 단계, 가중치가 부여된 데이터를 검색의도별로 분류하여 적어도 하나의 데이터 집합을 생성하는 단계, 데이터 집합간의 순위를 주제별로 결정하는 단계 및 데이터 집합을 대표하는 대표 키워드를 결정하는 단계를 포함하는 키워드 순위 결정 방법이 제공된다.
사용자 클러스터링 정보를 이용하여 사용자 그룹별로 인기검색어를 순위별로 제공하여 새로운 정보를 제공하고 새로운 쿼리 카운트(query count)를 유발할 수 있다.
같은 검색의도를 갖는 키워드들을 하나의 데이터 집합으로 모아 표시하고, 각 데이터 집합의 검색점유율을 계산하여 순위를 결정하여 검색점유율과 데이터 집합의 대표 키워드를 제공함으로써, 새로운 정보를 제공하고, 사용자의 흥미를 유발할 수 있다.
도 1은 본 발명의 일실시예에 있어서, 사용자 그룹별 인기검색어를 제공하기 위한 전체 구조의 일례를 나타낸 도면이다.
도 2는 본 발명의 일실시예에 있어서, 키워드 순위 결정 방법을 도시한 흐름도이다.
도 3은 본 발명의 일실시예에 있어서, 키워드 순위 결정 시스템의 내부 구성을 설명하기 위한 블록도이다.
도 4는 본 발명의 일실시예에 있어서, 키워드 순위를 결정하는 일례를 나타낸 도면이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 있어서, 사용자 그룹별 인기검색어를 제공하기 위한 전체 구조의 일례를 나타낸 도면이다.
여기서, 웹로그(110)는 사이트를 통해 사용자에게 노출된 문서가 사용자에 의해 선택되는 경우, 사용자가 어떠한 키워드를 통해 접근하였는가에 대한 정보, 어떠한 사용자가 접근하였는가에 대한 정보 및 어떠한 문서가 선택되었는가에 대한 정보 중 적어도 하나의 정보를 포함할 수 있다. 예를 들어, 특정 사이트에 대한 방문자 수, 방문 유형, 각 웹 페이지별 방문 횟수, 방문 시간 등을 나타내는 정보들이 웹로그(110)에 기록될 수 있다.
여기서, "사이트"는 유무선 네트워크를 통해 사용자에게 제공 가능한 모든 종류의 웹사이트를 포함할 수 있으며, 웹사이트를 구성하는 하나의 웹페이지를 포함할 수도 있다. 또한, "사용자"는 사용자의 식별자, 사용자의 단말기에 대한 식별자 및 단말기의 웹브라우저에 대한 쿠키에 대응하는 식별자 중 적어도 하나를 통해 식별될 수 있다.
또한, 문서의 "노출"은 사이트를 통해 해당 문서와 연관된 텍스트, 이미지, 동영상, 하이퍼 링크 등의 컨텐츠가 해당 사이트의 방문자에게 제공되는 것을 포함하도록 해석될 수 있다. 또한, 노출된 문서에 대한 "선택"은 사용자(사이트 방문자)가 제공된 텍스트, 이미지 등의 컨텐츠에 대해 마우스 클릭 등의 반응을 보이는 것을 의미할 수 있다.
분석 시스템(120)은 이러한 웹로그(110)를 이용하여 기선정된 간격(일례로, 1분)마다 실시간 로그를 파싱함으로써, 기선정된 간격마다 적어도 하나의 데이터를 생성할 수 있다. 여기서, 분석 시스템(120)은 본 발명의 실시예들에 따른 키워드 순위 결정 시스템에 포함되거나 또는 키워드 순위 결정 시스템과 연계되어 동작할 수 있다.
제1 점선박스(130)는 분석 시스템(120)을 통해 생성된 복수의 데이터들은 나타내고 있다. 이때, 제2 점선박스(131)는 슬라이딩 윈도우(sliding window)를 의미하는 것으로, 기선정된 최근 기간 이내에 생성된 데이터만을 선택하기 위해 이용될 수 있다. 예를 들어, 슬라이딩 윈도우의 크기를 40분으로 설정하는 것은, 최근 40분 이내에 생성된 데이터만을 선택하여 이용함을 의미할 수 있다. 여기서, 웹로그(110)에 의해 생성된 "데이터"는 특정 키워드를 통해 특정 문서가 선택된 적어도 한번의 선택에 대해, 키워드와 문서 각각의 정보를 포함할 수 있다.
이와 같이, 선택된 데이터들은 각 주제별로 분류되고, 가중치가 부여될 수 있다. 제3 점선박스(140)는 상술한 주제에 대한 일례로, 선택된 데이터들이 사용자 그룹에 따라 분류되는 모습을 나타내고 있다. 도 1에서는 사용자 그룹별로 8개의 그룹을 나타내고 있으나, 선택된 데이터들이 분류되는 주제가 이러한 8개의 사용자 그룹으로 한정되는 것은 아니다. 필요에 따라, "대학생" 대신 "남자대학생" 및 "여자대학생"과 같이 그룹을 대체/추가하거나 "남자대학생>스포츠매니아", "싱글여성>문화생활족"과 같이 계층화할 수도 있다. 또한, 사용자 그룹이 아닌 다른 기준에 따라 주제가 분류될 수도 있다. 본 명세서에서는 설명의 편의를 위해, 이미 도 1의 일례로 제공된 8개의 사용자 그룹을 통해 키워드 순위 결정 시스템 및 키워드 순위 결정 방법에 대해 설명한다.
이때, 사용자 그룹별로 분류된 데이터들은 검색의도별로 다시 분류되어 데이터 집합을 구성할 수 있고, 각각의 데이터 집합은 점유율에 따라 순위가 결정될 수 있다. 예를 들어, 사용자 그룹 '미혼남성'에 대해, 키워드 '코란도', '코란도 가격' 및 '쌍용자동차'를 포함하는 데이터 집합이 16.34%의 점유율로 1위, 키워드 '김그림', '슈퍼스타k2' 및 '슈퍼스타 욕설'을 포함하는 데이터 집합이 11.22%로 2위와 같이 나타날 수 있다.
여기서, 데이터들의 사용자 그룹별 분류나 데이터 집합별 점유율의 계산, 점유율에 따른 키워드 순위 결정 등은 상술한 키워드 순위 결정 시스템에 의해 수행될 수 있다.
도 2는 본 발명의 일실시예에 있어서, 키워드 순위 결정 방법을 도시한 흐름도이다. 본 실시예에 따른 키워드 순위 결정 방법은 도 1을 통해 설명한 키워드 순위 결정 시스템에 의해 수행될 수 있다.
단계(210)에서 키워드 순위 결정 시스템은 웹로그의 데이터를 기선정된 주제별로 분류한다. 여기서, 웹로그는 도 1을 통해 설명한 웹로그(110)에 대응될 수 있다. 이러한 웹로그의 데이터는 문서, 상기 문서의 선택에 이용된 키워드 및 상기 키워드를 통해 상기 문서가 선택된 선택횟수 중 둘 이상에 대한 정보를 포함할 수 있다. 또한, 기선정된 주제는 일례로, 사용자 그룹에 따라 분류될 수 있고, 사용자 그룹은 B-쿠키를 통해 사용자를 분류하여 결정될 수 있다. 이미 설명한 바와 같이, 이러한 주제는 사용자 그룹으로 한정되는 것이 아니라, 운영자에 의해 분류된 기준들에 따라 분류될 수도 있다.
단계(220)에서 키워드 순위 결정 시스템은 주제별로 분류된 데이터에 해당하는 문서의 주제에 대한 집중 정도를 나타내는 문서집중도를 계산하고, 문서집중도에 따른 가중치를 데이터에 부여한다. 즉, 그룹별로 분류된 데이터의 키워드들과 문서들은 해당 그룹만의 특성을 나타낸다고 보기 어렵다. 예를 들어, 키워드 "자동차"가 사용자 그룹 "미혼남성"으로 분류된 데이터에도 포함되고, 사용자 그룹 "기혼남성"으로 분류된 데이터에도 포함될 수 있기 때문에 단순히 키워드 "자동차" 그리고 해당 키워드를 통해 발생한 선택횟수(예를 들어, 클릭수)만을 통해서는 키워드 "자동차"가 특정 사용자 그룹만의 특성을 나타낸다고 단정짓기 어렵다. 또한, 특정 문서와 특정 문서에 발생한 선택횟수만을 통해서도 특정 문서 A가 특정 사용자 그룹만의 특성을 나타낸다고 단정짓기 어렵다. 따라서, 키워드 순위 결정 방법에서는 단계(220)에서와 같이, 문서의 주제에 대한 집중 정도를 나타내는 문서집중도를 계산하고, 이러한 문서집중도에 따른 가중치를 데이터에 부여함으로써, 주제에 대한 집중 정도가 높은 문서를 포함하는 데이터가 이후 점유율의 계산에 보다 큰 영향을 미치도록 할 수 있다. 혹은 주제에 대한 집중 정도가 낮은 문서가 점유율의 계산에 보다 낮은 영향을 미치도록 할 수도 있다.
이를 위해, 키워드 순위 결정 시스템은 문서가 분류된 주제에 해당하는 문서일 확률 및 문서가 전체 주제 각각에 해당하는 문서일 확률을 이용하여 문서별로 문서집중도를 계산하고, 문서집중도를 가중치로서 부여하여 문서에 대한 선택횟수를 조정할 수 있다.
예를 들어, 문서를 'd', 전체 주제의 집합을 'T', 주제의 집합에 포함된 각각의 주제를 't'(∈ T), 그리고 문서 'd'가 주제 't'에 해당하는 문서일 확률을 'Pd(t)'라고 하면, 문서 'd'의 주제 't'에서의 문서집중도 'Qd(t)'는 아래 수학식 1과 같이 계산될 수 있다.
Figure 112010087624619-pat00001
이때, 주제 't'에서 문서 'd'에 대해 발생한 선택횟수(클릭수)를 'Cd , t- naive'라고 하면, 최종적으로 조정된 선택횟수 'Cd , t- weighted'는 아래 수학식 2와 같이 계산될 수 있다.
Figure 112010087624619-pat00002
여기서, 'θ'를 통해 패널티로 적용되는 가중치의 적용 정도가 조절될 수 있다.
단계(230)에서 키워드 순위 결정 시스템은 가중치가 부여된 데이터를 검색의도별로 분류하여 적어도 하나의 데이터 집합을 생성하고, 데이터 집합간의 순위를 상기 주제별로 결정한다.
기본적으로, 동일한 '검색의도'를 갖는 데이터들을 하나의 집합으로 묶기 위해, 아래 (1), (2)와 같은 기본 원칙이 정의될 수 있다.
(1) 같은 문서가 클릭되었다면, 사용된 키워드가 달라도 같은 검색의도이다.
(2) 다른 문서가 클릭되었더라도, 검색어가 같거나 혹은 유사하면 같은 검색의도이다.
이러한 기본 원칙을 이용하여, 키워드 순위 결정 시스템은 동일한 문서에 대한 정보를 포함하는 데이터들을 서로 동일한 검색의도로 분류하고, 동일한 키워드 또는 키워드간 유사도가 기선정된 값 이상인 키워드들을 포함하는 데이터들을 서로 동일한 검색의도로 분류하여 상기 데이터 집합을 생성할 수 있다. 다른 실시예로, 키워드 순위 결정 시스템은 문서별로 해당 문서의 선택에 이용된 키워드들에 대해 키워드간 유사도를 이용하여 문서를 클러스터링하여 동일한 문서를 포함하는 데이터들을 동일한 데이터 집합으로서 생성할 수 있다.
이와 같이, 동일한 검색의도를 갖는 데이터들을 묶어 데이터 집합을 생성한 후에는 데이터 집합에 포함된 데이터들에 대해 조정된 선택횟수의 합을 이용하여 데이터 집합의 크기를 구할 수 있고, 데이터 집합의 크기 비율을 점유율로서 계산할 수 있다. 즉, 키워드 순위 결정 시스템은 문서별로 조정된 선택횟수를 이용하여 주제에 포함된 상기 데이터 집합별로 점유율을 계산하고, 계산된 점유율에 따라 주제에서의 데이터 집합간의 순위를 결정할 수 있다. 이러한 점유율을 통해 어떤 사용자 그룹에서 어떤 검색의도에 따라 어느 정도의 점유율로 클릭이 발생되고 있는가를 나타낼 수 있다. 이때, 전체 데이터 집합 'C'에 대해 특정 데이터 집합 'c'(∈ C)에서의 선택횟수의 합을 N(c)라고 할 때, 데이터 집합 'c'의 점유율 'P(c)'는 아래 수학식 3과 같이 계산될 수 있다.
Figure 112010087624619-pat00003
단계(240)에서 키워드 순위 결정 시스템은 데이터 집합을 대표하는 대표 키워드를 데이터 집합별로 결정한다. 즉, 데이터 집합 내에는 복수의 데이터들이 포함되어 있고, 따라서, 데이터 집합 내에는 동일한 검색의도를 갖는 다양한 키워드들이 포함되어 있다. 이때, 키워드 순위 결정 시스템은 하나의 데이터 집합을 표현하기 위한 가장 적절한 키워드를 찾아 대표 키워드로서 결정할 수 있다.
예를 들어, 키워드 순위 결정 시스템은 아래 (a), (b) 및 (c)의 조건을 이용하여 대표 키워드를 결정할 수 있다.
(a) 형태소 분석을 통해 얻어진 형태소 중 포함된 횟수가 가장 많은 키워드를 반드시 포함하는 키워드
(b) 기선정된 횟수 이상의 클릭을 발생시키는데 이용된 키워드
(c) 키워드의 길이가 긴 키워드
이러한 조건은 신뢰성이 있으면서, 가장 많은 정보를 포함하고 있는 키워드를 대표 키워드로 결정하기 위한 것이다.
아래 표 1은 하나의 데이터 집합에 포함된 문서에 대한 정보와 해당 문서가 선택되는데 이용된 키워드들에 대한 정보를 포함하고 있다.
Figure 112010087624619-pat00004
아래 표 2는 표 1의 키워드들을 형태소 분석하여 추출된 각각의 형태소가 포함된 횟수를 나타내고 있다.
Figure 112010087624619-pat00005
이 경우, 가장 많은 횟수가 포함된 형태소 '푸틴'이 포함된 키워드들이 우선, 대표 키워드의 후보가 될 수 있다.
아래 표 3은 형태소 '푸틴'을 포함하는 키워드들의 길이와 선택에 이용된 횟수를 나타내고 있다.
Figure 112010087624619-pat00006
대상이 된 키워드들에 대해 우선, 선택횟수의 제한을 2 이상으로 두면, 키워드 '푸틴 딸'과 '푸틴 딸 결혼'이 해당 데이터 집합의 대표 키워드에 대한 후보가 될 수 있다. 이때, 키워드 '푸틴 딸'이 선택횟수 4회로, 선택횟수가 3회인 키워드 '푸틴 딸 결혼'보다 높지만, 키워드 '푸틴 딸 결혼'의 길이가 키워드 '푸틴 딸'보다 길기 때문에 해당 데이터 집합의 대표 키워드로 선택될 수 있다. 즉, '푸틴 딸 결혼'이 대표성을 잃지 않으면서도 가장 많은 설명력을 지니고 있다고 판단할 수 있다.
이러한 조건은 필요에 따라 변경될 수 있다. 기본적으로, 본 실시예에 따른 키워드 순위 결정 시스템은 데이터 집합에 포함된 키워드들을 형태소 분석하여 계산된 형태소별 중복 횟수에 기초한 가중치, 해당 키워드를 통해 발생한 문서의 선택횟수에 따른 가중치 및 키워드의 길이에 따른 가중치 중 적어도 하나의 가중치를 이용하여 키워드들 중에서 대표 키워드를 결정할 수 있다. 여기서, 형태소별 중복 횟수에 기초한 가중치는 가장 많은 중복 횟수를 갖는 형태소의 포함 여부에 따라 결정될 수 있다.
아래 표 5, 표 6 및 표 7은 각각 사용자 그룹 '미혼남성', '기혼남성' 및 '재테크족'에 대한 키워드 순위를 나타내고 있다. 표 5, 6, 7에서는 12위까지만 나타내고 있으나, 필요에 따라 나타내는 순위는 조절될 수 있다.
Figure 112010087624619-pat00007
Figure 112010087624619-pat00008
Figure 112010087624619-pat00009
도 3은 본 발명의 일실시예에 있어서, 키워드 순위 결정 시스템의 내부 구성을 설명하기 위한 블록도이다. 본 실시예에 따른 키워드 순위 결정 시스템(300)은 도 3에 도시된 바와 같이, 데이터 분류부(310), 가중치 부여부(320), 순위 결정부(330) 및 대표 키워드 결정부(340)를 포함한다.
데이터 분류부(310)는 웹로그의 데이터를 기선정된 주제별로 분류한다. 여기서, 웹로그는 도 1을 통해 설명한 웹로그(110)에 대응될 수 있다. 이러한 웹로그의 데이터는 문서, 상기 문서의 선택에 이용된 키워드 및 상기 키워드를 통해 상기 문서가 선택된 선택횟수 중 둘 이상에 대한 정보를 포함할 수 있다. 또한, 기선정된 주제는 일례로, 사용자 그룹에 따라 분류될 수 있고, 사용자 그룹은 B-쿠키를 통해 사용자를 분류하여 결정될 수 있다. 이미 설명한 바와 같이, 이러한 주제는 사용자 그룹으로 한정되는 것이 아니라, 운영자에 의해 분류된 기준들에 따라 분류될 수도 있다.
가중치 부여부(320)는 주제별로 분류된 데이터에 해당하는 문서의 주제에 대한 집중 정도를 나타내는 문서집중도를 계산하고, 문서집중도에 따른 가중치를 데이터에 부여한다. 즉, 그룹별로 분류된 데이터의 키워드들과 문서들은 해당 그룹만의 특성을 나타낸다고 보기 어렵다. 예를 들어, 키워드 "자동차"가 사용자 그룹 "미혼남성"으로 분류된 데이터에도 포함되고, 사용자 그룹 "기혼남성"으로 분류된 데이터에도 포함될 수 있기 때문에 단순히 키워드 "자동차" 그리고 해당 키워드를 통해 발생한 선택횟수(예를 들어, 클릭수)만을 통해서는 키워드 "자동차"가 특정 사용자 그룹만의 특성을 나타낸다고 단정짓기 어렵다. 또한, 특정 문서와 특정 문서에 발생한 선택횟수만을 통해서도 특정 문서 A가 특정 사용자 그룹만의 특성을 나타낸다고 단정짓기 어렵다. 따라서, 키워드 순위 결정 시스템(300)은 가중치 부여부(320)를 통해 문서의 주제에 대한 집중 정도를 나타내는 문서집중도를 계산하고, 이러한 문서집중도에 따른 가중치를 데이터에 부여함으로써, 주제에 대한 집중 정도가 높은 문서를 포함하는 데이터가 이후 점유율의 계산에 보다 큰 영향을 미치도록 할 수 있다. 혹은 주제에 대한 집중 정도가 낮은 문서가 점유율의 계산에 보다 낮은 영향을 미치도록 할 수도 있다.
이를 위해, 가중치 부여부(320)는 문서가 분류된 주제에 해당하는 문서일 확률 및 문서가 전체 주제 각각에 해당하는 문서일 확률을 이용하여 문서별로 문서집중도를 계산하고, 문서집중도를 가중치로서 부여하여 문서에 대한 선택횟수를 조정할 수 있다.
예를 들어, 문서를 'd', 전체 주제의 집합을 'T', 주제의 집합에 포함된 주제를 't'(∈ T), 그리고 문서 'd'가 주제 't'에 해당하는 문서일 확률을 'Pd(t)'라고 하면, 문서 'd'의 주제 't'에서의 문서집중도 'Qd(t)'는 상술한 수학식 1과 같이 계산될 수 있다.
이때, 주제 't'에서 문서 'd'에 대해 발생한 선택횟수(클릭수)를 'Cd , t- naive'라고 하면, 최종적으로 조정된 선택횟수 'Cd , t- weighted'는 상술한 수학식 2와 같이 계산될 수 있다.
순위 결정부(330)는 가중치가 부여된 데이터를 검색의도별로 분류하여 적어도 하나의 데이터 집합을 생성하고, 데이터 집합간의 순위를 상기 주제별로 결정한다.
기본적으로, 동일한 '검색의도'를 갖는 데이터들을 하나의 집합으로 묶기 위해, 아래 (1), (2)와 같은 기본 원칙이 정의될 수 있다.
(1) 같은 문서가 클릭되었다면, 사용된 키워드가 달라도 같은 검색의도이다.
(2) 다른 문서가 클릭되었더라도, 검색어가 같거나 혹은 유사하면 같은 검색의도이다.
이러한 기본 원칙을 이용하여, 순위 결정부(330)는 동일한 문서에 대한 정보를 포함하는 데이터들을 서로 동일한 검색의도로 분류하고, 동일한 키워드 또는 키워드간 유사도가 기선정된 값 이상인 키워드들을 포함하는 데이터들을 서로 동일한 검색의도로 분류하여 상기 데이터 집합을 생성할 수 있다. 다른 실시예로, 순위 결정부(330)는 문서별로 해당 문서의 선택에 이용된 키워드들에 대해 키워드간 유사도를 이용하여 문서를 클러스터링하여 동일한 문서를 포함하는 데이터들을 동일한 데이터 집합으로서 생성할 수 있다.
이와 같이, 동일한 검색의도를 갖는 데이터들을 묶어 데이터 집합을 생성한 후에는 데이터 집합에 포함된 데이터들에 대해 조정된 선택횟수의 합을 이용하여 데이터 집합의 크기를 구할 수 있고, 데이터 집합의 크기 비율을 점유율로서 계산할 수 있다. 즉, 순위 결정부(330)는 문서별로 조정된 선택횟수를 이용하여 주제에 포함된 상기 데이터 집합별로 점유율을 계산하고, 계산된 점유율에 따라 주제에서의 데이터 집합간의 순위를 결정할 수 있다. 이러한 점유율을 통해 어떤 사용자 그룹에서 어떤 검색의도에 따라 어느 정도의 점유율로 클릭이 발생되고 있는가를 나타낼 수 있다. 이때, 전체 데이터 집합 'C'에 대해 특정 데이터 집합 'c'(∈ C)에서의 선택횟수의 합을 N(c)라고 할 때, 데이터 집합 'c'의 점유율 'P(c)'는 상술한 수학식 3과 같이 계산될 수 있다.
대표 키워드 결정부(340)는 데이터 집합을 대표하는 대표 키워드를 데이터 집합별로 결정한다. 즉, 데이터 집합 내에는 복수의 데이터들이 포함되어 있고, 따라서, 데이터 집합 내에는 동일한 검색의도를 갖는 다양한 키워드들이 포함되어 있다. 이때, 대표 키워드 결정부(340)는 하나의 데이터 집합을 표현하기 위한 가장 적절한 키워드를 찾아 대표 키워드로서 결정할 수 있다.
예를 들어, 대표 키워드 결정부(340)는 상술한 (a), (b) 및 (c)의 조건을 이용하여 대표 키워드를 결정할 수 있다. 이러한 조건은 신뢰성이 있으면서, 가장 많은 정보를 포함하고 있는 키워드를 대표 키워드로 결정하기 위한 것이다.
이러한 조건은 필요에 따라 변경될 수 있다. 기본적으로, 본 실시예에 따른 키워드 순위 결정 시스템(300)의 대표 키워드 결정부(340)는 데이터 집합에 포함된 키워드들을 형태소 분석하여 계산된 형태소별 중복 횟수에 기초한 가중치, 해당 키워드를 통해 발생한 문서의 선택횟수에 따른 가중치 및 키워드의 길이에 따른 가중치 중 적어도 하나의 가중치를 이용하여 키워드들 중에서 대표 키워드를 결정할 수 있다. 여기서, 형태소별 중복 횟수에 기초한 가중치는 가장 많은 중복 횟수를 갖는 형태소의 포함 여부에 따라 결정될 수 있다.
도 4는 본 발명의 일실시예에 있어서, 문서에 대한 선택횟수를 조정하는 일례를 나타낸 도면이다. 제1 점선박스(410)는 제1 문서에 대해 발생한 선택횟수(클릭수) '40'이 제1 키워드를 통해 35회, 제2 키워드를 통해 5회 발생하였음을 나타내고 있다. 이때, 제2 점선박스(420)는 상술한 수학식 1, 2를 통해 제1 문서에 대해 발생한 선택횟수가 조정될 수 있음을 나타내고 있다. 이때, 제1 문서에 대해 발생한 선택횟수는 '40'에서 '15'로 조정되었고, 이 경우, 문서에 대한 선택횟수 '15'를 넘어서는 제1 키워드에 대한 선택횟수 '35'가 '15'로 변경되었음을 나타내고 있다. 즉, 문서의 선택횟수가 변경되는 경우, 변경된 선택횟수보다 더 큰 선택횟수를 갖는 키워드의 선택횟수는 변경된 선택횟수로 함께 조정될 수 있다. 점유율의 계산에는 문서의 선택횟수가 이용될 수 있고, 대표 키워드를 선택하는 경우에는 키워드별의 선택횟수가 이용될 수 있다.
이와 같이, 본 발명의 실시예들에 따른 시스템 및 방법을 이용하면, 사용자 클러스터링 정보를 이용하여 사용자 그룹별로 인기검색어를 순위별로 제공하여 새로운 정보를 제공하고 새로운 쿼리 카운트(query count)를 유발할 수 있고, 같은 검색의도를 갖는 키워드들을 하나의 데이터 집합으로 모아 표시하고, 각 데이터 집합의 검색점유율을 계산하여 순위를 결정하여 검색점유율과 데이터 집합의 대표 키워드를 제공함으로써, 새로운 정보를 제공하고, 사용자의 흥미를 유발할 수 있다.
본 발명의 실시예에 따른 방법들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 또한, 상술한 파일 시스템은 컴퓨터 판독이 가능한 기록 매체에 기록될 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
300: 키워드 순위 결정 시스템
310: 데이터 분류부
320: 가중치 부여부
330: 순위 결정부
340: 대표 키워드 결정부

Claims (19)

  1. B(Browser)-쿠키를 통해 사용자를 분류함으로써 사용자 그룹을 결정하고 상기 결정된 사용자 그룹별로 웹로그의 데이터를 기선정된 주제별로 분류하는 데이터 분류부;
    상기 사용자 그룹별로 분류된 데이터에 해당하는 문서의 상기 주제에 대한 집중 정도를 나타내는 문서집중도를 계산하고, 상기 문서집중도에 따른 가중치를 상기 데이터에 부여하는 가중치 부여부;
    상기 가중치가 부여된 데이터를 상기 사용자 그룹의 검색의도별로 분류하여 적어도 하나의 데이터 집합을 생성하고, 상기 데이터 집합간의 순위를 상기 사용자 그룹별로 결정하는 순위 결정부; 및
    상기 데이터 집합을 대표하는 대표 키워드를 상기 데이터 집합별로 결정하는 대표 키워드 결정부
    를 포함하는 키워드 순위 결정 시스템.
  2. 제1항에 있어서,
    상기 웹로그의 데이터는, 문서, 상기 문서의 선택에 이용된 키워드 및 상기 키워드를 통해 상기 문서가 선택된 선택횟수 중 둘 이상에 대한 정보를 포함하고,
    상기 가중치 부여부는,
    상기 문서가 상기 분류된 사용자 그룹에 해당하는 문서일 확률 및 상기 문서가 전체 사용자 그룹 각각에 해당하는 문서일 확률을 이용하여 문서별로 상기 문서집중도를 계산하고, 상기 문서집중도를 상기 가중치로서 부여하여 상기 문서에 대한 선택횟수를 조정하는, 키워드 순위 결정 시스템.
  3. 제2항에 있어서,
    상기 순위 결정부는,
    상기 문서별로 조정된 선택횟수를 이용하여 상기 사용자 그룹에 포함된 상기 데이터 집합별로 점유율을 계산하고, 상기 계산된 점유율에 따라 상기 사용자 그룹에서의 데이터 집합간의 순위를 결정하는, 키워드 순위 결정 시스템.
  4. 제3항에 있어서,
    상기 점유율은 상기 데이터 집합에서의 상기 선택횟수의 합 및 전체 데이터 집합에 대한 전체 선택횟수의 합을 이용하여 계산되는, 키워드 순위 결정 시스템.
  5. 제1항에 있어서,
    상기 웹로그의 데이터는, 문서, 상기 문서의 선택에 이용된 키워드 및 상기 키워드를 통해 상기 문서가 선택된 선택횟수 중 둘 이상에 대한 정보를 포함하고,
    상기 순위 결정부는,
    동일한 문서에 대한 정보를 포함하는 데이터들을 서로 동일한 검색의도로 분류하고, 동일한 키워드 또는 키워드간 유사도가 기선정된 값 이상인 키워드들을 포함하는 데이터들을 서로 동일한 검색의도로 분류하여 상기 데이터 집합을 생성하는, 키워드 순위 결정 시스템.
  6. 제1항에 있어서,
    상기 웹로그의 데이터는, 문서, 상기 문서의 선택에 이용된 키워드 및 상기 키워드를 통해 상기 문서가 선택된 선택횟수 중 둘 이상에 대한 정보를 포함하고,
    상기 순위 결정부는,
    문서별로 해당 문서의 선택에 이용된 키워드들에 대해 키워드간 유사도를 이용하여 문서를 클러스터링하여 동일한 문서를 포함하는 데이터들을 동일한 데이터 집합으로서 생성하는, 키워드 순위 결정 시스템.
  7. 제1항에 있어서,
    상기 대표 키워드 결정부는,
    상기 데이터 집합에 포함된 키워드들을 형태소 분석하여 계산된 형태소별 중복 횟수에 기초한 가중치, 해당 키워드를 통해 발생한 문서의 선택횟수에 따른 가중치 및 키워드의 길이에 따른 가중치 중 적어도 하나의 가중치를 이용하여 상기 키워드들 중에서 상기 대표 키워드를 결정하는, 키워드 순위 결정 시스템.
  8. 제7항에 있어서,
    상기 형태소별 중복 횟수에 기초한 가중치는, 가장 많은 중복 횟수를 갖는 형태소의 포함 여부에 따라 결정되는, 키워드 순위 결정 시스템.
  9. 삭제
  10. 데이터 분류부, 가중치 부여부, 순위 결정부 및 대표 키워드 결정부를 포함하는 키워드 순위 결정 시스템이 수행하는 키워드 순위 결정 방법에 있어서,
    상기 데이터 분류부가 B(Browser)-쿠키를 통해 사용자를 분류함으로써 사용자 그룹을 결정하고 상기 결정된 사용자 그룹별로 웹로그의 데이터를 기선정된 주제별로 분류하는 단계;
    상기 가중치 부여부가 상기 사용자 그룹별로 분류된 데이터에 해당하는 문서의 상기 주제에 대한 집중 정도를 나타내는 문서집중도를 계산하고, 상기 문서집중도에 따른 가중치를 상기 데이터에 부여하는 단계;
    상기 순위 결정부가 상기 가중치가 부여된 데이터를 상기 사용자 그룹의 검색의도별로 분류하여 적어도 하나의 데이터 집합을 생성하고, 상기 데이터 집합간의 순위를 상기 사용자 그룹별로 결정하는 단계; 및
    상기 키워드 결정부가 상기 데이터 집합을 대표하는 대표 키워드를 상기 데이터 집합별로 결정하는 단계
    를 포함하는 키워드 순위 결정 방법.
  11. 제10항에 있어서,
    상기 웹로그의 데이터는, 문서, 상기 문서의 선택에 이용된 키워드 및 상기 키워드를 통해 상기 문서가 선택된 선택횟수 중 둘 이상에 대한 정보를 포함하고,
    상기 가중치를 상기 데이터에 부여하는 단계는,
    상기 문서가 상기 분류된 사용자 그룹에 해당하는 문서일 확률 및 상기 문서가 전체 사용자 그룹 각각에 해당하는 문서일 확률을 이용하여 문서별로 문서집중도를 계산하고, 상기 문서집중도를 상기 가중치로서 부여하여 상기 문서에 대한 선택횟수를 조정하는, 키워드 순위 결정 방법.
  12. 제11항에 있어서,
    상기 데이터 집합간의 순위를 상기 사용자 그룹별로 결정하는 단계는,
    상기 문서별로 조정된 선택횟수를 이용하여 상기 사용자 그룹에 포함된 상기 데이터 집합별로 점유율을 계산하고, 상기 계산된 점유율에 따라 상기 사용자 그룹에서의 데이터 집합간의 순위를 결정하는, 키워드 순위 결정 방법.
  13. 제12항에 있어서,
    상기 점유율은 상기 데이터 집합에서의 상기 선택횟수의 합 및 전체 데이터 집합에 대한 전체 선택횟수의 합을 이용하여 계산되는, 키워드 순위 결정 방법.
  14. 제10항에 있어서,
    상기 웹로그의 데이터는, 문서, 상기 문서의 선택에 이용된 키워드 및 상기 키워드를 통해 상기 문서가 선택된 선택횟수 중 둘 이상에 대한 정보를 포함하고,
    상기 데이터 집합간의 순위를 상기 사용자 그룹별로 결정하는 단계는,
    동일한 문서에 대한 정보를 포함하는 데이터들을 서로 동일한 검색의도로 분류하고, 동일한 키워드 또는 키워드간 유사도가 기선정된 값 이상인 키워드들을 포함하는 데이터들을 서로 동일한 검색의도로 분류하여 상기 데이터 집합을 생성하는, 키워드 순위 결정 방법.
  15. 제10항에 있어서,
    상기 웹로그의 데이터는, 문서, 상기 문서의 선택에 이용된 키워드 및 상기 키워드를 통해 상기 문서가 선택된 선택횟수 중 둘 이상에 대한 정보를 포함하고,
    상기 데이터 집합간의 순위를 상기 사용자 그룹별로 결정하는 단계는,
    문서별로 해당 문서의 선택에 이용된 키워드들에 대해 키워드간 유사도를 이용하여 문서를 클러스터링하여 동일한 문서를 포함하는 데이터들을 동일한 데이터 집합으로서 생성하는, 방법.
  16. 제10항에 있어서,
    상기 데이터 집합을 대표하는 대표 키워드를 상기 데이터 집합별로 결정하는 단계는,
    상기 데이터 집합에 포함된 키워드들을 형태소 분석하여 계산된 형태소별 중복 횟수에 기초한 가중치, 해당 키워드를 통해 발생한 문서의 선택횟수에 따른 가중치 및 키워드의 길이에 따른 가중치 중 적어도 하나의 가중치를 이용하여 상기 키워드들 중에서 상기 대표 키워드를 결정하는, 키워드 순위 결정 방법.
  17. 제16항에 있어서,
    상기 형태소별 중복 횟수에 기초한 가중치는, 가장 많은 중복 횟수를 갖는 형태소의 포함 여부에 따라 결정되는, 키워드 순위 결정 방법.
  18. 삭제
  19. 제10항 내지 제17항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.
KR1020100138879A 2010-12-30 2010-12-30 사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법 KR101274419B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020100138879A KR101274419B1 (ko) 2010-12-30 2010-12-30 사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법
US13/337,741 US9262790B2 (en) 2010-12-30 2011-12-27 System and method for determining ranking of keywords for each user group
JP2011289464A JP5865076B2 (ja) 2010-12-30 2011-12-28 ユーザグループごとにキーワードの順位を決定するシステムおよび方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100138879A KR101274419B1 (ko) 2010-12-30 2010-12-30 사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20120077055A KR20120077055A (ko) 2012-07-10
KR101274419B1 true KR101274419B1 (ko) 2013-06-17

Family

ID=46381712

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100138879A KR101274419B1 (ko) 2010-12-30 2010-12-30 사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법

Country Status (3)

Country Link
US (1) US9262790B2 (ko)
JP (1) JP5865076B2 (ko)
KR (1) KR101274419B1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104685493A (zh) * 2012-09-27 2015-06-03 日本电气株式会社 用于监视文本信息的字典创建装置、用于监视文本信息的字典创建方法和用于监视文本信息的字典创建程序
CN104077407B (zh) * 2014-07-10 2017-06-16 中国工商银行股份有限公司 一种智能数据搜索系统及方法
CN105574015A (zh) * 2014-10-13 2016-05-11 阿里巴巴集团控股有限公司 搜索推荐方法和装置
KR101708444B1 (ko) * 2015-11-16 2017-02-22 주식회사 위버플 키워드 및 자산 가격 관련성 평가 방법 및 그 장치
KR101931859B1 (ko) * 2016-09-29 2018-12-21 (주)시지온 전자문서의 대표 단어 선정 방법, 전자 문서 제공 방법, 및 이를 수행하는 컴퓨팅 시스템
CN109660580B (zh) * 2017-10-11 2021-06-22 苏州跃盟信息科技有限公司 一种信息推送方法及装置
CN108776679B (zh) * 2018-05-30 2021-12-07 百度在线网络技术(北京)有限公司 一种搜索词的分类方法、装置、服务器及存储介质
JP2022096218A (ja) * 2020-12-17 2022-06-29 キヤノン株式会社 情報処理装置、情報処理システム、その制御方法及びプログラム
CN113449145B (zh) * 2021-06-29 2023-11-10 乐视云网络技术(北京)有限公司 视频搜索结果排序调整方法、装置、电子设备和计算机可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090013367A (ko) * 2007-08-01 2009-02-05 주식회사 다음커뮤니케이션 카테고리별 키워드 추천 시스템 및 방법

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5864848A (en) * 1997-01-31 1999-01-26 Microsoft Corporation Goal-driven information interpretation and extraction system
US6493703B1 (en) * 1999-05-11 2002-12-10 Prophet Financial Systems System and method for implementing intelligent online community message board
US20020035619A1 (en) * 2000-08-02 2002-03-21 Dougherty Carter D. Apparatus and method for producing contextually marked-up electronic content
WO2002059857A1 (en) * 2001-01-23 2002-08-01 Educational Testing Service Methods for automated essay analysis
US7028026B1 (en) * 2002-05-28 2006-04-11 Ask Jeeves, Inc. Relevancy-based database retrieval and display techniques
US8086619B2 (en) * 2003-09-05 2011-12-27 Google Inc. System and method for providing search query refinements
KR100452086B1 (ko) * 2003-12-22 2004-10-13 엔에이치엔(주) 카테고리 별 키워드의 입력 순위를 제공하기 위한 검색서비스 시스템 및 그 방법
US7689585B2 (en) 2004-04-15 2010-03-30 Microsoft Corporation Reinforced clustering of multi-type data objects for search term suggestion
US20060218153A1 (en) * 2005-03-28 2006-09-28 Voon George H H Building social networks using shared content data relating to a common interest
US20060265362A1 (en) * 2005-05-18 2006-11-23 Content Analyst Company, Llc Federated queries and combined text and relational data
US20060282303A1 (en) * 2005-06-08 2006-12-14 Microsoft Corporation Distributed organizational analyzer
US7421429B2 (en) * 2005-08-04 2008-09-02 Microsoft Corporation Generate blog context ranking using track-back weight, context weight and, cumulative comment weight
US7765209B1 (en) * 2005-09-13 2010-07-27 Google Inc. Indexing and retrieval of blogs
US20070271146A1 (en) * 2005-10-20 2007-11-22 Ebags.Com Method and apparatus for matching and/or coordinating shoes handbags and other consumer products
US7685091B2 (en) * 2006-02-14 2010-03-23 Accenture Global Services Gmbh System and method for online information analysis
KR100785754B1 (ko) 2006-03-22 2007-12-18 엔에이치엔(주) 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간키워드 순위 결정 시스템
US8296168B2 (en) * 2006-09-13 2012-10-23 University Of Maryland System and method for analysis of an opinion expressed in documents with regard to a particular topic
US20080282186A1 (en) * 2007-05-11 2008-11-13 Clikpal, Inc. Keyword generation system and method for online activity
KR100892851B1 (ko) * 2007-05-31 2009-04-10 엔에이치엔(주) 키워드 추천 방법 및 그 시스템
US20100131455A1 (en) * 2008-11-19 2010-05-27 Logan James D Cross-website management information system
MX2011006340A (es) * 2008-12-12 2011-10-28 Atigeo Llc Suministro de recomendaciones utilizando la informacion determinada para dominios de interés.
US8290926B2 (en) * 2010-01-21 2012-10-16 Microsoft Corporation Scalable topical aggregation of data feeds

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090013367A (ko) * 2007-08-01 2009-02-05 주식회사 다음커뮤니케이션 카테고리별 키워드 추천 시스템 및 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
성기윤외1. 개체명을 이용한 주제기반 웹 문서 클러스터링. 한국콘텐츠학회논문지. 2010년 5월, 제10권, 제5호, 29-36 *
허준희외3. 문서의 주제어별 가중치와 말뭉치를 이용한 한국어 문서의 자동 분류 : 베이지안 분류자. 한국정보과학회 가을 학술발표논문집. 1999년, 제26권, 제2호, 154-156 *

Also Published As

Publication number Publication date
US20120173542A1 (en) 2012-07-05
US9262790B2 (en) 2016-02-16
JP2012141985A (ja) 2012-07-26
JP5865076B2 (ja) 2016-02-17
KR20120077055A (ko) 2012-07-10

Similar Documents

Publication Publication Date Title
KR101274419B1 (ko) 사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법
KR101721338B1 (ko) 검색 엔진 및 그의 구현 방법
US10521469B2 (en) Image Re-ranking method and apparatus
KR101700352B1 (ko) 이력적 검색 결과들을 사용한 향상된 문서 분류 데이터 생성
JP6167493B2 (ja) 情報を管理するための方法、コンピュータプログラム、記憶媒体及びシステム
US9053115B1 (en) Query image search
JP6196316B2 (ja) ユーザ投稿に基づいたコンテンツの配信の調整
WO2017020451A1 (zh) 信息推送方法和装置
US9443008B2 (en) Clustering of search results
US8103650B1 (en) Generating targeted paid search campaigns
US20130246383A1 (en) Cursor Activity Evaluation For Search Result Enhancement
US20120296918A1 (en) Credibility Information in Returned Web Results
JP6428795B2 (ja) モデル生成方法、単語重み付け方法、モデル生成装置、単語重み付け装置、デバイス、コンピュータプログラム及びコンピュータ記憶媒体
Yamasaki et al. Social popularity score: Predicting numbers of views, comments, and favorites of social photos using only annotations
KR100954842B1 (ko) 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체
JP2006318398A (ja) ベクトル生成方法及び装置及び情報分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記憶媒体
TWI480749B (zh) 識別有機搜索引擎優化機會之方法
US8745059B1 (en) Clustering queries for image search
KR101178208B1 (ko) 키워드 추출 장치 및 방법
JP5084796B2 (ja) 関連性判定装置、関連性判定方法およびプログラム
Bagdouri et al. Profession-based person search in microblogs: Using seed sets to find journalists
KR101180371B1 (ko) 폭소노미 기반 개인화 웹 검색 방법 및 이를 수행하는 시스템
WO2014027415A1 (ja) 情報提供装置、情報提供方法、及びプログラム
Xu et al. Personalized semantic ranking for collaborative recommendation
KR20110114969A (ko) 관심 정보 제공 시스템 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 5