KR101076522B1 - 사이트 클러스터링 시스템 및 사이트 클러스터링 방법 - Google Patents

사이트 클러스터링 시스템 및 사이트 클러스터링 방법 Download PDF

Info

Publication number
KR101076522B1
KR101076522B1 KR1020090134033A KR20090134033A KR101076522B1 KR 101076522 B1 KR101076522 B1 KR 101076522B1 KR 1020090134033 A KR1020090134033 A KR 1020090134033A KR 20090134033 A KR20090134033 A KR 20090134033A KR 101076522 B1 KR101076522 B1 KR 101076522B1
Authority
KR
South Korea
Prior art keywords
site
cluster
topic
clustering
generating
Prior art date
Application number
KR1020090134033A
Other languages
English (en)
Other versions
KR20110077445A (ko
Inventor
정윤영
황민희
김재은
최재걸
오정우
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020090134033A priority Critical patent/KR101076522B1/ko
Priority to JP2010294003A priority patent/JP5634859B2/ja
Publication of KR20110077445A publication Critical patent/KR20110077445A/ko
Application granted granted Critical
Publication of KR101076522B1 publication Critical patent/KR101076522B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

사이트 클러스터링 시스템 및 사이트 클러스터링 방법이 개시된다. 사이트 클러스터링 시스템은 사용자들의 사이트 클릭 로그를 이용하여 연관 사이트를 추출하는 연관 사이트 추출부 및 상기 추출된 연관 사이트의 연관 관계를 이용하여 유사한 속성을 갖는 연관 사이트에 대한 사이트 클러스터를 생성하는 클러스터 생성부를 포함할 수 있다.
사이트, 클러스터, 연관 사이트, 주제

Description

사이트 클러스터링 시스템 및 사이트 클러스터링 방법 {SYSTEM AND METHOD FOR SITE CLUSTERING}
본 발명은 사이트 클러스터링 시스템 및 사이트 클러스터링 방법에 관한 것으로, 보다 자세하게는, 사이트 클릭 로그로부터 연관 사이트를 추출하고, 연결 관계에 따라 사이트 클러스터를 생성하여 주제별로 분류하는 사이트 클러스터링 시스템 및 방법에 관한 것이다.
인터넷 사용이 보편화되면서, 현재 인터넷 상에는 수많은 사이트들이 존재한다. 기획자들은 인터넷 상에 분포하는 수많은 사이트들을 구조적으로 이해하려고 노력하고 있다. 즉, 웹사이트를 어떻게 조직화하여 어떻게 가치있는 형태로 활용할 것인가에 대한 요구가 존재한다.
이러한 웹사이트는 일반적으로 사용자들이 검색 엔진에 검색어를 입력하여 검색을 수행함으로써 검색되는 경우가 많다. 간혹, 사용자가 직접 웹사이트 URL을 입력하여 웹사이트를 방문하기는 하지만, 주로 검색 엔진을 통해 검색하여 방문하는 경우가 훨씬 많다.
따라서, 이러한 사용자의 검색 패턴을 이용하여 인터넷 상에 분포하는 사이 트를 분석하고 이를 활용하고자 하는 방법이 요구되고 있다.
본 발명은 사용자에 의해 생성된 사이트 클릭 로그로부터 연관 사이트를 추출하고, 연관 사이트의 연결 관계를 통해 사이트 클러스터를 생성함으로써 인터넷 상에 분포하는 사이트들을 일정 기준에 따라 조직화할 수 있는 시스템 및 방법을 제공한다.
본 발명은 생성된 사이트 클러스터를 유입 키워드를 통해 주제로 분류함으로써, 인터넷 상에 분포하는 사이트들을 보다 효율적으로 활용할 수 있는 시스템 및 방법을 제공한다.
본 발명은 주제로 분류된 사이트 클러스터에 대한 분석 결과를 제공함으로써, 사이트 클러스터링한 결과를 다양한 분야에서 활용할 수 있도록 하는 시스템 및 방법을 제공한다.
본 발명의 일실시예에 따른 사이트 클러스터링 시스템은 사용자들의 사이트 클릭 로그를 이용하여 연관 사이트를 추출하는 연관 사이트 추출부 및 상기 추출된 연관 사이트의 연관 관계를 이용하여 유사한 속성을 갖는 연관 사이트에 대한 사이트 클러스터를 생성하는 클러스터 생성부를 포함할 수 있다.
본 발명의 일실시예에 따른 사이트 클러스터링 시스템은 생성된 사이트 클러스터를 유사한 주제로 분류하는 클러스터 분류부를 더 포함할 수 있다.
본 발명의 일실시예에 따른 사이트 클러스터링 시스템은 주제에 따라 분류 된 사이트 클러스터를 분석하여 분석 결과를 제공하는 클러스터 분석부를 더 포함할 수 있다.
본 발명의 일실시예에 따른 사이트 클러스터링 방법은 사용자들의 사이트 클릭 로그를 이용하여 연관 사이트를 추출하는 단계 및 상기 추출된 연관 사이트의 연관 관계를 이용하여 유사한 속성을 갖는 연관 사이트에 대한 사이트 클러스터를 생성하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따른 사이트 클러스터링 방법은 생성된 사이트 클러스터를 유사한 주제로 분류하는 단계를 더 포함할 수 있다.
본 발명의 일실시예에 따른 사이트 클러스터링 시스템은 주제에 따라 분류된 사이트 클러스터를 분석하여 분석 결과를 제공하는 단계를 더 포함할 수 있다.
본 발명의 일실시예에 따르면, 사용자에 의해 생성된 사이트 클릭 로그로부터 연관 사이트를 추출하고, 연관 사이트의 연결 관계를 통해 사이트 클러스터를 생성함으로써 인터넷 상에 분포하는 사이트들을 일정 기준에 따라 조직화할 수 있다.
본 발명의 일실시예에 따르면, 생성된 사이트 클러스터를 유입 키워드를 통해 주제로 분류함으로써, 인터넷 상에 분포하는 사이트들을 보다 효율적으로 활용할 수 있다.
본 발명의 일실시예에 따르면, 주제로 분류된 사이트 클러스터에 대한 분석 결과를 제공함으로써, 사이트 클러스터링한 결과를 다양한 분야에서 활용할 수 있 다.
이하, 첨부된 도면들에 기재된 내용들을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다. 다만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다. 본 발명의 일실시예에 따른 사이트 클러스터링 방법은 사이트 클러스터링 시스템에 의해 수행될 수 있다.
도 1은 본 발명의 일실시예에 따른 사이트 클러스터링 시스템의 세부 구성을 도시한 블록 다이어그램이다.
도 1을 참고하면, 사이트 클러스터링 시스템(100)은 연관 사이트 추출부(101), 클러스터 생성부(102), 클러스터 분류부(103) 및 클러스터 분석부(104)를 포함할 수 있다.
연관 사이트 추출부(101)는 사용자들의 사이트 클릭 로그를 이용하여 연관 사이트를 추출할 수 있다. 일례로, 연관 사이트 추출부(101)는 동일한 시간 구간에서 사용자별로 클릭한 사이트 정보를 수집하고, 수집한 사이트 정보에 연관 규칙을 적용하여 연관 사이트를 추출할 수 있다.
연관 사이트는 사이트 내에 포함된 컨텐츠가 유사하거나 사이트의 속성이 유사한 것을 의미할 수 있다. 또는, 연관 사이트는 사용자가 입력한 검색 사이트 이후에 특정 시간 이내에 입력되어 검색되는 비율이 높은 사이트를 의미할 수 있다. 즉, 연관 사이트는 사용자들이 자신의 검색 의도에 부합하는 검색 결과를 도 출할 수 있도록 함께 검색하는 경향이 높은 사이트들을 의미할 수 있다. 다시 말해서, 검색 사이트에 대한 연관 사이트는 사용자의 검색 의도를 파악할 수 있는 하나의 수단이 될 수 있다.
일례로, 연관 사이트 추출부(101)는 사용자들의 사이트 클릭 로그를 통해 일정 기간 동안 검색 횟수가 미리 설정한 검색 횟수 이상인 검색 사이트에 대해 연관 사이트를 추출할 수 있다. 예를 들면, 최근 일주일 검색 횟수(Query Count: QC)가 300 이상인 검색 사이트에 대해 연관 사이트를 추출할 수 있다. 즉, 일정 수 이상의 검색 횟수를 나타내는 검색 사이트에 대해 연관 사이트를 추출함으로써, 검색 사이트를 입력한 사용자의 검색 의도를 좀더 정확하게 파악할 수 있다.
이 때, 연관 사이트 추출부(101)는 사이트의 검색 횟수에 따른 연관 규칙, 사용자의 IP 주소에 따른 연관 규칙 또는 사용자 식별 정보에 따른 연관 규칙 중 어느 하나의 연관 규칙에 기초하여 연관 사이트를 추출할 수 있다. 이에 대해서는, 도 2에서 보다 구체적으로 설명하기로 한다.
클러스터 생성부(102)는 연관 사이트의 연관 관계를 이용하여 유사한 속성을 갖는 연관 사이트에 대한 사이트 클러스터를 생성할 수 있다. 즉, 사이트 클러스터는 유사한 속성을 갖는 연관 사이트를 그룹핑하는 것을 의미할 수 있다. 또한, 사이트 클러스터는 사용자별로 일정 시간 내에 동일한 검색 의도로 클릭하는 사이트들을 그룹핑하는 것을 의미할 수 있다.
일례로, 클러스터 생성부(102)는 추출된 연관 사이트에 따라 대표 사이트 및 연관 사이트 쌍을 생성하여 사이트 클러스터를 생성할 수 있다. 이 때, 클러스 터 생성부(102)는 대표 사이트 및 연관 사이트 쌍에서 공통된 연관 사이트를 이용하여 연관 사이트에 대한 연결 관계를 생성할 수 있다. 이 때, 대표 사이트에 대해 공통되는 연관 사이트에 기초하여 연결 관계가 생성될 수 있다. 공통되는 연관 사이트가 많을수록, 대표 사이트에 대한 연결 강도가 증가할 수 있다.
그리고, 클러스터 생성부(102)는 연결 관계에 범주형 클러스터링 기법을 적용하여 사이트 클러스터를 생성할 수 있다. 즉, 클러스터 생성부(102)는 범주형 클러스터링 기법을 적용하여 사이트 클러스터를 생성함으로써, 연관 관계를 통해 대표 사이트 간 유사도를 판단하고, 유사도가 높은 대표 사이트들을 그룹화하여 사이트 클러스터를 생성할 수 있다.
클러스터 분류부(103)는 생성된 사이트 클러스터를 유사한 주제로 분류할 수 있다. 하나의 주제에 적어도 하나의 사이트 클러스터가 포함될 수 있다. 이 때, 주제는 사용자의 검색 의도를 의미할 수 있다. 일례로, 클러스터 분류부(103)는 사이트 클러스터를 구성하는 사이트별 유입 키워드에 대한 주제를 고려하여 사이트 클러스터를 유사한 주제로 분류할 수 있다. 여기서, 사이트별 유입 키워드는 사이트 클러스터에 속하는 사이트를 검색하기 위해 입력한 키워드를 의미한다. 사용자의 검색 의도는 사이트별 유입 키워드를 통해 파악할 수 있으며, 사이트별 유입 키워드도 주제별로 분류될 수 있다.
이 때, 클러스터 분류부(103)는 최초로 생성된 사이트 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하고, 생성된 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 사이트 클러스터를 주제별로 분류할 수도 있다.
클러스터 분석부(104)는 주제에 따라 분류된 사이트 클러스터를 분석하여 분석 결과를 제공할 수 있다. 일례로, 클러스터 분석부(104)는 사이트 클러스터의 주제에 따라 시계열적 분석, 주제별 분포도, 클릭 횟수, 주제별 사이트 리스트, 주제별 관심 사용자수 또는 사용자 방문 행동 결과 중 적어도 하나의 분석 결과를 제공할 수 있다. 분석 결과는 상기 언급한 사항에 한정되지 않고, 시스템의 구성에 따라 사이트 클러스터에 대한 분석 결과는 달라질 수 있다.
특히, 클러스터 분석부(104)는 주제를 포함하는 제1 계층, 주제로 분류된 사이트 클러스터를 포함하는 제2 계층 및 사이트 클러스터에 대한 연관 사이트를 포함하는 제3 계층을 포함하여 시각적으로 도식화된 데이터 계층도를 제공할 수 있다. 이 때, 클러스터 분석부(104)는 주제에 포함된 사이트 클러스터의 검색 횟수에 따라 제1 계층에 대한 주제별 사이즈를 결정할 수 있다. 그리고, 클러스터 분석부(104)는 사이트 클러스터에 포함된 연관 사이트의 검색 횟수에 따라 제2 계층에 대한 사이트 클러스터별 사이즈를 결정할 수 있다. 또한, 클러스터 분석부(104)는 연관 사이트의 검색 횟수에 따라 제3 계층에 대한 연관 사이트별 사이즈를 결정할 수 있다.
도 2는 본 발명의 일실시예에 따른 연관 사이트를 추출하는 과정을 도시한 도면이다.
사이트 클러스터링 시스템(100)은 사용자들의 사이트 클릭 로그(201)를 이용하여 연관 사이트를 추출할 수 있다. 사이트 클릭 로그(201)는 사용자별로 일정 시간 내에 사이트의 URL에 대한 사용자 클릭수로 구성될 수 있다. 사이트 클릭 로그(201)를 살펴보면, 쿠키는 사용자가 일정 시간 내에 검색을 수행한 검색 세션에 대응할 수 있다. 예를 들어, 쿠키 A를 살펴보면, 사용자가 일정 시간 내에 사이트를 a1, a2 및 a3를 순차적으로 입력한 것을 의미한다. 이러한 사이트 클릭 로그(201)는 사용자가 사이트를 검색하려는 의도를 내포하고 있다.
사이트 클러스터링 시스템(100)은 사이트 클릭 로그(201)에 연관 규칙을 적용하여 연관 사이트를 추출할 수 있다. 이 때, 사이트 클러스터링 시스템(100)은 연관 규칙에 기초하여 검색 키워드에 대한 연관 키워드를 추출할 수 있다. 예를 들면, 사용자가 X라는 키워드를 입력하여 사이트 A를 검색한 후 보다 상세한 검색 결과를 얻기 위해 연속하여 사이트 B를 검색한 경우, B라는 키워드를 입력한 경우, 사이트 A가 검색된 후 사이트 B가 입력되는 조건이 미리 설정한 임계치 이상이라면 사이트 B는 사이트 A에 대한 연관 사이트로 정의될 수 있다.
일례로, 사이트 클러스터링 시스템(100)은 사이트의 검색 횟수에 따른 연관 규칙을 이용하여 사이트 클릭 로그(201)로부터 연관 사이트를 추출할 수 있다. 구체적으로, 사이트 클러스터링 시스템(100)은 사이트 A의 검색 횟수, 사이트 B의 검색 횟수 및 사이트 A가 검색된 이후 특정 시간 이내 사이트 B의 검색 횟수를 통해 조건부 확률(A가 검색된 후 B가 이어서 검색될 확률) 및 사이트 간 상관 관계를 결정하고, 조건부 확률 및 상관 관계에 기초하여 사이트 A와 사이트 B가 연관 관계에 있는 지 판단할 수 있다. 이 때, 사이트 클러스터링 시스템(100)은 사이트 A와 사이트 B가 연관 관계에 있는 지 판단하기 위해 검색 횟수, 조건부 확률 및 상관 관계 정도에 임계치를 설정할 수 있다.
다른 일례로, 사이트 클러스터링 시스템(100)은 사이트를 검색한 사용자의 IP 주소에 따른 연관 규칙을 이용하여 사이트 클릭 로그(201)로부터 연관 사이트를 추출할 수 있다. 구체적으로, 사이트 클러스터링 시스템(100)은 사이트 A를 검색한 사용자의 IP 주소 정보, 사이트 B를 검색한 사용자의 IP 주소 정보 및 사이트 A가 검색된 후 사이트 B가 검색된 경우 사이트 B를 입력한 사용자의 IP 주소 정보를 통해 조건부 확률을 결정하고, 조건부 확률에 기초하여 사이트 A와 사이트 B가 연관 관계에 있는 지 여부를 판단할 수 있다. 이 때, 사이트 클러스터링 시스템(100)은 사이트 A와 사이트 B가 연관 관계에 있는 지 판단하기 위해 IP 주소수, 조건부 확률에 임계치를 설정할 수 있다.
또 다른 일례로, 사이트 클러스터링 시스템(100)은 사이트를 검색한 사용자의 사용자 식별 정보(UID)에 따른 연관 규칙을 이용하여 사이트 클릭 로그(201)로부터 연관 사이트를 추출할 수 있다. 사용자 식별 정보에 따른 연관 규칙은 사용자의 IP 주소에 따른 연관 규칙을 이용한 방법에 동일한 형태로 적용할 수 있다.
이러한 과정을 통해 사이트 클릭 로그(201)로부터 연관 사이트가 추출되면, 사이트 클러스터링 시스템(100)은 표(202)와 같이 대표 사이트와 연관 사이트 간에 쌍(pair)을 생성할 수 있다. 대표 사이트는 연관 사이트들 중 대표적인 연관 사이트를 의미한다. 대표 사이트는 시스템의 구성에 따라 다르게 결정될 수 있다. 대표 사이트에 대해 적어도 하나의 연관 사이트가 연결되어 하나의 그룹을 형성할 수 있다. 이러한 그룹에 범주형 클러스터링을 적용하여 사이트 클러스터가 생성될 수 있다.
도 3은 본 발명의 일실시예에 따른 연관 사이트로부터 사이트 클러스터를 생성하는 과정을 도시한 도면이다.
사이트 클러스터링 시스템(100)은 연관 사이트의 연관 관계를 이용하여 유사한 속성을 갖는 연관 사이트에 대한 사이트 클러스터를 생성할 수 있다. 일례로, 사이트 클러스터링 시스템(100)은 대표 사이트 및 연관 사이트 쌍에서 공통된 연관 사이트를 이용하여 연관 사이트에 대한 연결 관계를 생성하고, 연결 관계에 범주형 클러스터링 기법을 적용하여 사이트 클러스터를 생성할 수 있다.
도 3에서, 사이트 X, 사이트 Y, 사이트 Z, 사이트 W는 연관 사이트에 대한 대표 사이트를 의미한다. 그리고, X1, X2, X3, X4, X5, X6는 대표 사이트인 사이트 X와 연결 관계에 있는 연관 사이트를 의미한다. 그리고, Z1, Z2, Z3, Z4, Z5, X3, X4, X5는 대표 사이트인 사이트 Z와 연결 관계에 있는 연관 사이트를 의미한다. 마찬가지로, Y1, Y2, Y3, Y4, Y5, Y6, X2는 대표 사이트인 사이트 Y와 연결 관계에 있는 연관 사이트를 의미한다. 또한, W1, W2, W3, W4, W5, W6, Z3, Y3는 대표 사이트인 사이트 W와 연결 관계에 있는 연관 사이트를 의미한다. 즉, 도 3은 공통된 연관 사이트에 기초한 대표 사이트들 간의 연결 관계를 나타낸다.
사이트 클러스터링 시스템(100)은 연결 관계에 범주형 클러스터링 기법을 적용하여 사이트 클러스터를 생성할 수 있다. 구체적으로, 사이트 클러스터링 시스템(100)은 대표 사이트들 간의 연결 관계로부터 연결 강도에 기초하여 사이트 클러스터를 생성할 수 있다.
사이트 클러스터를 생성하기 위해 연관 사이트에 대응하는 기준 연결 강도 가 2라고 설정한다고 할 때, 대표 사이트 X와 대표 사이트 Z는 공통되는 연관 사이트가 X5, X4, X6로 3개가 있어 사이트 클러스터 1(301)를 형성할 수 있다. 그리고, 대표 사이트 Y의 경우, 대표 사이트 X와 대표 사이트 W 간에 공통되는 연관 사이트가 존재하나, 기준 연결 강도를 초과하지 못해 대표 사이트 X와 대표 사이트 W에 대해 사이트 클러스터를 생성할 수 없다. 따라서, 대표 사이트 Y는 연관 사이트인 Y1, Y2, Y3, Y4, Y5, Y6와 함께 사이트 클러스터 2(302)를 형성할 수 있다.
마찬가지로, 대표 사이트 W의 경우, 대표 사이트 Z와 대표 사이트 Y 간에 공통되는 연관 사이트가 존재하나, 기준 연결 강도를 초과하지 못해 대표 사이트 Y와 대표 사이트 Z에 대해 사이트 클러스터를 생성할 수 없다. 따라서, 대표 사이트 W는 연관 사이트인 W1, W2, W3, W4, W5, W6와 함께 사이트 클러스터 3(303)을 형성할 수 있다.
도 4는 본 발명의 일실시예에 따른 주제별 사이트 클러스터를 생성하는 전체 과정을 도시한 블록 다이어그램이다.
복수의 사용자들에 의해 사이트 클릭 로그(401)가 생성된다. 사이트 클릭 로그(401)는 사용자가 일정 시간동안 동일한 검색 의도를 가지고 사이트를 클릭한 정보를 수집한 것이다. 사이트 클러스터링 시스템(100)은 사이트 클릭 로그(401)에 연관 규칙을 적용하여 적어도 하나의 연관 사이트(402)를 추출할 수 있다. 그런 후, 사이트 클러스터링 시스템(100)은 연관 사이트(402)로부터 유사한 속성을 갖는 연관 사이트에 대한 사이트 클러스터(403)를 생성할 수 있다. 즉, 사이트 클러스터링 시스템(100)은 연관 사이트(402)를 유사한 정도에 따라 그룹핑할 수 있 다.
사이트 클러스터 시스템(100)은 사이트 클러스터(403)를 게임, 유아, 쇼핑, 금융/비즈와 같은 주제(404)로 분류할 수 있다. 이 때, 사이트 클러스터 시스템(100)은 사이트 클러스터(403)에 속한 사이트별 유입 키워드의 주제를 고려하여 주제(404)로 분류할 수 있다. 사이트 클러스터 시스템(100)은 주제(404)로 분류된 사이트 클러스터(403)를 이용하여 주제별 분석 결과(405)를 추출할 수 있다. 주제별 분석 결과(405)는 사이트 클러스터의 주제에 따라 시계열적 분석, 주제별 분포도, 클릭 횟수, 주제별 사이트 리스트, 주제별 관심 사용자수 또는 사용자 방문 행동 결과 중 적어도 하나의 분석 결과를 포함할 수 있다.
시계열적 분석은 시간대별, 일별, 주별, 월별, 연별로 주제에 따른 사이트 검색 횟수/분포도, 사이트 클릭 횟수/분포도 등을 의미한다. 그리고, 주제별 분포도는 다양한 주제별로 사이트 클러스터의 개수를 통해 결정될 수 있다. 클릭 횟수는 주제별로 사이트 클러스터에 속한 연관 사이트를 사용자가 클릭한 횟수를 의미한다. 주제별 사이트 리스트는 주제로 분류된 사이트 클러스터에 속하는 연관 사이트의 목록을 의미한다. 주제별 관심 사용자수는 주제로 분류된 사이트 클러스터에 속한 연관 사이트에 클릭하여 방문한 사용자를 의미한다. 사용자 방문 행동 결과는 주제로 분류된 사이트 클러스터에 속한 연관 사이트에 방문하여 사이트에 가입하거나 사이트에서 판매하는 물품을 구매하는 행위를 추적하여 분석한 결과를 의미한다.
이러한 분석 결과를 통해 사용자에 대한 타겟 광고를 수행할 수 있고, 사용 자의 검색 의도를 파악하여 검색 엔진을 좀더 최적화할 수 있으며, 광고주에게 주제별 분석 결과를 제공하여 광고를 판매할 수 있다.
또한, 주제별 분석 결과(405)는 주제를 포함하는 제1 계층, 주제로 분류된 사이트 클러스터를 포함하는 제2 계층 및 사이트 클러스터에 대한 연관 사이트를 포함하는 제3 계층으로 구성된 데이터 계층도를 포함할 수 있다.
도 5는 본 발명의 일실시예에 따른 사이트 클러스터를 주제별로 분류하여 일별로 클러스터링하는 것을 도시한 도면이다.
일례로, 사이트 클러스터링 시스템(100)은 최초로 생성된 검색 키워드 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하고, 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 검색 키워드 클러스터를 주제별로 분류할 수 있다.
도 5를 참고하면, 2008년 7월 17일부터 2008년 10월 30일까지 일별 검색 키워드 클러스터를 생성하여 검색 키워드 클러스터를 분류하는 과정이 도시되어 있다.
먼저, 2008년 7월 17일에 최초로 사이트 클러스터(501)(cluster 40214, cluster 27584, cluster 73920, cluster 58134, cluster 21276, cluster 15865)가 생성되면, 사이트 클러스터링 시스템(100)은 사이트 클러스터(501)를 복수의 주제(501) 각각으로 분류할 수 있다. 도 5에서, X1, X2, X3, X4는 사이트 클러스터인 cluster 40214에 속한 연관 사이트를 의미한다.
도 5에서 볼 수 있듯이, cluster 40214, cluster 27584는 "대중음악"으로 분류되고, cluster 73920는 "게임"으로 분류될 수 있다. 마찬가지로, cluster 58134는 "의류/잡화"로 분류되고, cluster 21276, cluster 15865는 "여행"으로 분류될 수 있다. 이렇게 주제별로 분류된 사이트 클러스터(501)가 시드 클러스터가 될 수 있다.
그러면, 다음날 2008년 7월 18일에 생성된 사이트 클러스터는 복수의 시드 클러스터 각각이 속한 주제로 분류될 수 있으며, 이러한 과정은 2008년 10월 30일까지 매일 반복될 수 있다.
일별로 생성된 사이트 클러스터는 시드 클러스터가 속한 주제로 분류될 수 있으며, 최종적으로, 검색 키워드가 복수의 주제 각각으로 분류될 수 있다. 주제는 사용자의 검색 의도와 대응될 수 있으므로, 동일한 주제에 포함된 사이트 클러스터는 동일한 사용자의 검색 의도를 나타내는 것을 의미할 수 있다. 이 때, 주제는 미리 설정한 개수만큼 설정될 수 있다.
도 6은 본 발명의 일실시예에 따른 주제, 사이트 클러스터 및 연관 사이트 간의 계층 관계를 나타내는 일례를 도시한 도면이다.
본 발명의 일실시예에 따른 사이트 클러스터링 시스템(100)은 연관 사이트->사이트 클러스터->주제의 3단계의 계층을 도출할 수 있다. 이 때, 사이트 클러스터링 시스템(100)은 주제를 포함하는 제1 계층(601), 주제로 분류된 사이트 클러스터를 포함하는 제2 계층(602) 및 사이트 클러스터에 대한 연관 사이트를 포함하는 제3 계층(603)으로 구성된 데이터 계층도를 생성할 수 있다.
일례로, 사이트 클러스터링 시스템(100)은 주제에 포함된 연관 사이트의 검 색 횟수에 따라 제1 계층(601)에 대한 주제별 사이즈를 결정할 수 있다. 그리고, 사이트 클러스터링 시스템(100)은 사이트 클러스터에 포함된 연관 사이트의 검색 횟수에 따라 제2 계층(602)에 대한 사이트 클러스터별 사이즈를 결정할 수 있다. 또한, 사이트 클러스터링 시스템(100)은 연관 사이트의 검색 횟수에 따라 제3 계층(603)에 대한 연관 사이트별 사이즈를 결정할 수 있다.
제1 계층(601)에 포함된 사각형의 넓이는 주제별 사이즈를 의미하며, 사각형의 넓이가 넓을수록 해당 사각형에 대응하는 주제에 포함된 연관 사이트의 검색 횟수가 많은 것을 의미할 수 있다. 그리고, 제2 계층(602)에 포함된 사각형의 넓이는 사이트 클러스터별 사이즈를 의미하며, 사각형의 넓이가 넓을수록 해당 사각형에 대응하는 사이트 클러스터에 포함된 연관 사이트의 검색 횟수가 많은 것을 의미할 수 있다. 또한, 제3 계층(603)에 포함된 사각형의 넓이는 연관 사이트별 사이즈를 의미하며, 사각형의 넓이가 넓을수록 해당 사각형에 대응하는 연관 사이트의 검색 횟수가 많은 것을 의미할 수 있다.
사이트 클러스터링 시스템(100)은 제1 계층(601), 제2 계층(602) 및 제3 계층(603)을 시각적/정량적으로 제공할 수 있다. 만약, 제1 계층(601)에서 주제 X(604)가 선택되면, 사이트 클러스터링 시스템(100)은 주제 X(604)로 분류된 사이트 클러스터에 대한 제2 계층(602)을 표시할 수 있다. 그리고, 제2 계층(602)에서 사이트 클러스터 Y(605)가 선택되면, 사이트 클러스터링 시스템(100)은 사이트 클러스터 Y(605)에 포함된 연관 사이트에 대한 제3 계층(603)을 표시할 수 있다. 도 6에 표시된 데이터 계층도는 일례에 불과하고, 시스템의 구성에 따라 다른 형태로 표시될 수 있다.
도 7은 본 발명의 일실시예에 따른 사이트 클러스터링 방법을 도시한 플로우차트이다.
사이트 클러스터링 시스템(100)은 사용자들의 사이트 클릭 로그를 이용하여 연관 사이트를 추출할 수 있다(S701). 일례로, 사이트 클러스터링 시스템(100)은 동일한 시간 구간에서 사용자별로 클릭한 사이트 정보를 수집하고, 수집한 사이트 정보에 연관 규칙을 적용하여 연관 사이트를 추출할 수 있다. 구체적으로, 사이트 클러스터링 시스템(100)은 사이트의 검색 횟수에 따른 연관 규칙, 사용자의 IP 주소에 따른 연관 규칙 또는 사용자 식별 정보에 따른 연관 규칙 중 어느 하나의 연관 규칙에 기초하여 연관 사이트를 추출할 수 있다.
사이트 클러스터링 시스템(100)은 추출된 연관 사이트의 연관 관계를 이용하여 유사한 속성을 갖는 연관 사이트에 대한 사이트 클러스터를 생성할 수 있다(S702). 일례로, 사이트 클러스터링 시스템(100)은 추출된 연관 사이트에 따라 대표 사이트 및 연관 사이트 쌍을 생성하여 사이트 클러스터를 생성할 수 있다. 이 때, 사이트 클러스터링 시스템(100)은 대표 사이트 및 연관 사이트 쌍에서 공통된 연관 사이트를 이용하여 연관 사이트에 대한 연결 관계를 생성할 수 있다. 그리고, 사이트 클러스터링 시스템(100)은 연결 관계에 범주형 클러스터링 기법을 적용하여 사이트 클러스터를 생성할 수 있다.
사이트 클러스터링 시스템(100)은 생성된 사이트 클러스터를 유사한 주제로 분류할 수 있다(S703). 일례로, 사이트 클러스터링 시스템(100)은 사이트 클러스 터를 구성하는 사이트별 유입 키워드에 대한 주제를 고려하여 사이트 클러스터를 유사한 주제로 분류할 수 있다. 또한, 사이트 클러스터링 시스템(100)은 최초로 생성된 사이트 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하고, 생성된 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 사이트 클러스터를 주제별로 분류할 수 있다.
사이트 클러스터링 시스템(100)은 주제에 따라 분류된 사이트 클러스터를 분석하여 분석 결과를 제공할 수 있다(S704). 일례로, 사이트 클러스터링 시스템(100)은 주제를 포함하는 제1 계층, 주제로 분류된 사이트 클러스터를 포함하는 제2 계층 및 사이트 클러스터에 대한 연관 사이트를 포함하는 제3 계층으로 구성된 데이터 계층도를 제공할 수 있다. 또한, 사이트 클러스터링 시스템(100)은 사이트 클러스터의 주제에 따라 시계열적 분석, 주제별 분포도, 클릭 횟수, 주제별 사이트 리스트, 주제별 관심 사용자수 또는 사용자 방문 행동 결과 중 적어도 하나의 분석 결과를 제공할 수 있다.
도 7에서 설명되지 않은 사항은 도 1 내지 도 6의 설명을 참고할 수 있다.
또한 본 발명의 일실시예에 따른 사이트 클러스터링 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.
도 1은 본 발명의 일실시예에 따른 사이트 클러스터링 시스템의 세부 구성을 도시한 블록 다이어그램이다.
도 2는 본 발명의 일실시예에 따른 연관 사이트를 추출하는 과정을 도시한 도면이다.
도 3은 본 발명의 일실시예에 따른 연관 사이트로부터 사이트 클러스터를 생성하는 과정을 도시한 도면이다.
도 4는 본 발명의 일실시예에 따른 주제별 사이트 클러스터를 생성하는 전체 과정을 도시한 블록 다이어그램이다.
도 5는 본 발명의 일실시예에 따른 사이트 클러스터를 주제별로 분류하여 일별로 클러스터링하는 것을 도시한 도면이다.
도 6은 본 발명의 일실시예에 따른 주제, 사이트 클러스터 및 연관 사이트 간의 계층 관계를 나타내는 일례를 도시한 도면이다.
도 7은 본 발명의 일실시예에 따른 사이트 클러스터링 방법을 도시한 플로우차트이다.
<도면의 주요 부분에 대한 부호의 설명>
100: 사이트 클러스터링 시스템 101: 연관 사이트 추출부
102: 클러스터 생성부 103: 클러스터 분류부
104: 클러스터 분석부

Claims (23)

  1. 사용자들의 사이트 클릭 로그를 이용하여 연관 사이트를 추출하는 연관 사이트 추출부; 및
    상기 추출된 연관 사이트의 연관 관계를 이용하여 유사한 속성을 갖는 연관 사이트에 대한 사이트 클러스터를 생성하는 클러스터 생성부
    를 포함하고,
    상기 클러스터 생성부는,
    상기 추출된 연관 사이트에 따라 대표 사이트 및 연관 사이트 쌍을 생성하여 사이트 클러스터를 생성하는 것을 특징으로 하는 사이트 클러스터링 시스템.
  2. 제1항에 있어서,
    상기 생성된 사이트 클러스터를 유사한 주제로 분류하는 클러스터 분류부
    를 더 포함하는 사이트 클러스터링 시스템.
  3. 제1항에 있어서,
    상기 연관 사이트 추출부는,
    동일한 시간 구간에서 사용자별로 클릭한 사이트 정보를 수집하고, 상기 수집한 사이트 정보에 연관 규칙을 적용하여 연관 사이트를 추출하는 것을 특징으로 하는 사이트 클러스터링 시스템.
  4. 제3항에 있어서,
    상기 연관 사이트 추출부는,
    사이트의 검색 횟수에 따른 연관 규칙, 사용자의 IP 주소에 따른 연관 규칙 또는 사용자 식별 정보에 따른 연관 규칙 중 어느 하나의 연관 규칙에 기초하여 연관 사이트를 추출하는 것을 특징으로 하는 사이트 클러스터링 시스템.
  5. 삭제
  6. 제1항에 있어서,
    상기 클러스터 생성부는,
    상기 대표 사이트 및 연관 사이트 쌍에서 공통된 연관 사이트를 이용하여 연관 사이트에 대한 연결 관계를 생성하고, 상기 연결 관계에 범주형 클러스터링 기법을 적용하여 사이트 클러스터를 생성하는 것을 특징으로 하는 사이트 클러스터링 시스템.
  7. 제2항에 있어서,
    상기 클러스터 분류부는,
    상기 사이트 클러스터를 구성하는 사이트별 유입 키워드에 대한 주제를 고려하여 상기 사이트 클러스터를 유사한 주제로 분류하는 것을 특징으로 하는 사이 트 클러스터링 시스템.
  8. 제2항에 있어서,
    상기 클러스터 분류부는,
    최초로 생성된 사이트 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하고, 상기 생성된 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 사이트 클러스터를 주제별로 분류하는 것을 특징으로 하는 사이트 클러스터링 시스템.
  9. 제2항에 있어서,
    상기 주제에 따라 분류된 사이트 클러스터를 분석하여 분석 결과를 제공하는 클러스터 분석부
    를 더 포함하는 사이트 클러스터링 시스템.
  10. 제9항에 있어서,
    상기 클러스터 분석부는,
    상기 주제를 포함하는 제1 계층, 상기 주제로 분류된 사이트 클러스터를 포함하는 제2 계층 및 상기 사이트 클러스터에 대한 연관 사이트를 포함하는 제3 계층으로 구성된 데이터 계층도를 제공하는 것을 특징으로 하는 사이트 클러스터링 시스템.
  11. 제9항에 있어서,
    상기 클러스터 분석부는,
    상기 사이트 클러스터의 주제에 따라 시계열적 분석, 주제별 분포도, 클릭 횟수, 주제별 사이트 리스트, 주제별 관심 사용자수 또는 사용자 방문 행동 결과 중 적어도 하나의 분석 결과를 제공하는 것을 특징으로 하는 사이트 클러스터링 시스템.
  12. 사용자들의 사이트 클릭 로그를 이용하여 연관 사이트를 추출하는 단계; 및
    상기 추출된 연관 사이트의 연관 관계를 이용하여 유사한 속성을 갖는 연관 사이트에 대한 사이트 클러스터를 생성하는 단계
    를 포함하고,
    상기 연관 사이트에 대한 사이트 클러스터를 생성하는 단계는,
    상기 추출된 연관 사이트에 따라 대표 사이트 및 연관 사이트 쌍을 생성하여 사이트 클러스터를 생성하는 것을 특징으로 하는 사이트 클러스터링 방법.
  13. 제12항에 있어서,
    상기 생성된 사이트 클러스터를 유사한 주제로 분류하는 단계
    를 더 포함하는 사이트 클러스터링 방법.
  14. 제12항에 있어서,
    상기 연관 사이트를 추출하는 단계는,
    동일한 시간 구간에서 사용자별로 클릭한 사이트 정보를 수집하고, 상기 수집한 사이트 정보에 연관 규칙을 적용하여 연관 사이트를 추출하는 것을 특징으로 하는 사이트 클러스터링 방법.
  15. 제14항에 있어서,
    상기 연관 사이트를 추출하는 단계는,
    사이트의 검색 횟수에 따른 연관 규칙, 사용자의 IP 주소에 따른 연관 규칙 또는 사용자 식별 정보에 따른 연관 규칙 중 어느 하나의 연관 규칙에 기초하여 연관 사이트를 추출하는 것을 특징으로 하는 사이트 클러스터링 방법.
  16. 삭제
  17. 제12항에 있어서,
    상기 연관 사이트에 대한 사이트 클러스터를 생성하는 단계는,
    상기 대표 사이트 및 연관 사이트 쌍에서 공통된 연관 사이트를 이용하여 연관 사이트에 대한 연결 관계를 생성하는 단계; 및
    상기 연결 관계에 범주형 클러스터링 기법을 적용하여 사이트 클러스터를 생성하는 단계
    를 포함하는 사이트 클러스터링 방법.
  18. 제13항에 있어서,
    상기 생성된 사이트 클러스터를 유사한 주제로 분류하는 단계는,
    상기 사이트 클러스터를 구성하는 사이트별 유입 키워드에 대한 주제를 고려하여 상기 사이트 클러스터를 유사한 주제로 분류하는 것을 특징으로 하는 사이트 클러스터링 방법.
  19. 제13항에 있어서,
    상기 생성된 사이트 클러스터를 유사한 주제로 분류하는 단계는,
    최초로 생성된 사이트 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하는 단계; 및
    상기 생성된 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 사이트 클러스터를 주제별로 분류하는 단계
    를 포함하는 사이트 클러스터링 방법.
  20. 제13항에 있어서,
    상기 주제에 따라 분류된 사이트 클러스터를 분석하여 분석 결과를 제공하는 단계
    를 더 포함하는 사이트 클러스터링 방법.
  21. 제20항에 있어서,
    상기 사이트 클러스터를 분석하여 분석 결과를 제공하는 단계는,
    상기 주제를 포함하는 제1 계층, 상기 주제로 분류된 사이트 클러스터를 포함하는 제2 계층 및 상기 사이트 클러스터에 대한 연관 사이트를 포함하는 제3 계층으로 구성된 데이터 계층도를 제공하는 것을 특징으로 하는 사이트 클러스터링 방법.
  22. 제20항에 있어서,
    상기 사이트 클러스터를 분석하여 분석 결과를 제공하는 단계는,
    상기 사이트 클러스터의 주제에 따라 시계열적 분석, 주제별 분포도, 클릭 횟수, 주제별 사이트 리스트, 주제별 관심 사용자수 또는 사용자 방문 행동 결과 중 적어도 하나의 분석 결과를 제공하는 것을 특징으로 하는 사이트 클러스터링 방법.
  23. 제12항 내지 제15항, 제17항 내지 제22항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한 기록 매체.
KR1020090134033A 2009-12-30 2009-12-30 사이트 클러스터링 시스템 및 사이트 클러스터링 방법 KR101076522B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020090134033A KR101076522B1 (ko) 2009-12-30 2009-12-30 사이트 클러스터링 시스템 및 사이트 클러스터링 방법
JP2010294003A JP5634859B2 (ja) 2009-12-30 2010-12-28 サイトクラスタシステムおよびサイトクラスタ方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090134033A KR101076522B1 (ko) 2009-12-30 2009-12-30 사이트 클러스터링 시스템 및 사이트 클러스터링 방법

Publications (2)

Publication Number Publication Date
KR20110077445A KR20110077445A (ko) 2011-07-07
KR101076522B1 true KR101076522B1 (ko) 2011-10-24

Family

ID=44349807

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090134033A KR101076522B1 (ko) 2009-12-30 2009-12-30 사이트 클러스터링 시스템 및 사이트 클러스터링 방법

Country Status (2)

Country Link
JP (1) JP5634859B2 (ko)
KR (1) KR101076522B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5944878B2 (ja) * 2013-10-18 2016-07-05 ヤフー株式会社 判定装置、判定方法及び判定プログラム
RU2632149C2 (ru) * 2015-05-06 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Система, способ и постоянный машиночитаемый носитель для проверки веб-страниц

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080010291A1 (en) 2006-07-05 2008-01-10 Krishna Leela Poola Techniques for clustering structurally similar web pages

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005148846A (ja) * 2003-11-11 2005-06-09 Nippon Telegr & Teleph Corp <Ntt> コンテンツ分類システムおよび方法、コンピュータプログラムおよび記録媒体
JP2007323334A (ja) * 2006-05-31 2007-12-13 Waakuatto:Kk Webページ抽出システム、これを用いた広告配信システムおよび広告配信プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080010291A1 (en) 2006-07-05 2008-01-10 Krishna Leela Poola Techniques for clustering structurally similar web pages

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
배옥현외, 웹 페이지 클러스터를 이용한 사용자 분류 기법, 한국정보과학회, 2000 가을 학술발표논문집(Ⅰ), 2000 Oct. , pp.201-203.*

Also Published As

Publication number Publication date
JP5634859B2 (ja) 2014-12-03
JP2011138517A (ja) 2011-07-14
KR20110077445A (ko) 2011-07-07

Similar Documents

Publication Publication Date Title
CN102473190B (zh) 为网页分配关键词
Baumgarten et al. User-driven navigation pattern discovery from internet data
KR100792700B1 (ko) 신경망을 가지는 협업 필터링 시스템을 이용하여 클릭패턴에 기초한 웹 광고 추천 방법 및 그 시스템
Peng et al. Discovering the influence of sarcasm in social media responses
White et al. From devices to people: Attribution of search activity in multi-user settings
Park et al. Cyberattack detection model using community detection and text analysis on social media
KR101076522B1 (ko) 사이트 클러스터링 시스템 및 사이트 클러스터링 방법
Sahni et al. Topic modeling on online news extraction
Zhang et al. Web usage mining based on fuzzy clustering in identifying target group
Lagopoulos et al. Content-aware web robot detection
Dennis et al. Data mining approach for user profile generation on advertisement serving
Wei et al. Algorithm of mining sequential patterns for web personalization services
Lalitha et al. Potential Web Content Identification and Classification System using NLP and Machine Learning Techniques
Saste et al. Predicting demographic attributes from web usage: Purpose and methodologies
Palomino et al. Web Pattern Navigation Profiling for Online Marketing Campaigns Design Support Under a Data Science Approach.
Wang et al. Intent mining in search query logs for automatic search script generation
Al-Abdullatif et al. Using online hotel customer reviews to improve the booking process
Munilatha et al. A study on issues and techniques of web mining
Rahi Business intelligence: a rapidly growing option through web mining
Carragher et al. Detection and Discovery of Misinformation Sources using Attributed Webgraphs
Saura et al. Does SEO matter for early-stage startups? Insights from visual data mining and topic-modeling techniques
Chavda et al. Recent trends and novel approaches in web usage mining
Ting et al. Applying Social Network Embedding and Word Embedding for Socialbots Detection
Wibawa et al. Development of Marketplace Product Data Mining and Analysis Application as a Reference in Running a Business
Ishimwe Identifying Privacy Policy in Service Terms Using Natural Language Processing

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140925

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151008

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20161010

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20171011

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20181008

Year of fee payment: 8