KR100975502B1 - 블로그 포스트의 랭킹 판단 방법 및 시스템 - Google Patents

블로그 포스트의 랭킹 판단 방법 및 시스템 Download PDF

Info

Publication number
KR100975502B1
KR100975502B1 KR1020080009809A KR20080009809A KR100975502B1 KR 100975502 B1 KR100975502 B1 KR 100975502B1 KR 1020080009809 A KR1020080009809 A KR 1020080009809A KR 20080009809 A KR20080009809 A KR 20080009809A KR 100975502 B1 KR100975502 B1 KR 100975502B1
Authority
KR
South Korea
Prior art keywords
post
score
blogger
authority
hub
Prior art date
Application number
KR1020080009809A
Other languages
English (en)
Other versions
KR20090083801A (ko
Inventor
김상욱
김광현
이상호
도영주
황원석
이재범
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020080009809A priority Critical patent/KR100975502B1/ko
Publication of KR20090083801A publication Critical patent/KR20090083801A/ko
Application granted granted Critical
Publication of KR100975502B1 publication Critical patent/KR100975502B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Abstract

포스트(Post)에 대한 블로거(Blogger)의 액션(Action)을 링크로 포함하는 링크 정보를 사용하는 본 발명의 일 실시예에 따른 블로그 포스트의 랭킹 판단 방법은 포스트와 블로거간의 링크가 상기 포스트에 대한 상기 블로거의 액션으로 정의되는 링크 정보를 생성하는 단계; 상기 링크 정보 상의 블로거를 허브 노드로, 포스트를 권위 노드로 사용하여 상기 포스트의 권위 점수를 산출하는 단계; 및 상기 권위 점수에 따라 상기 포스트의 랭킹을 판단하는 단계를 포함하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
블로그, 포스트, 랭킹

Description

블로그 포스트의 랭킹 판단 방법 및 시스템{System and Method for Determining Ranking of Blog Post}
본 발명은 블로그 포스트의 랭킹 판단 방법 및 시스템에 관한 것으로서 보다 상세하게는 블로거의 포스트에 대한 액션이 링크로 정의되는 링크 정보를 통해 블로그 포스트의 랭킹을 판단하는 방법 및 시스템에 관한 것이다.
블로그(Blog)는 개인의 생각이나 의견을 웹 페이지인 포스트(Post)로 남기는 일종의 개인 웹 사이트이고, 포스트는 엔트리(Entry)라고도 부르며 블로그에 올려 진 글, 이미지, 사진, 동영상 등을 말한다.
블로그의 사용자가 늘어남에 따라 블로그 내에 포스트도 증가하게 되었으며, 웹 페이지에 대한 검색처럼 블로그의 포스트에 대한 검색도 필요하게 되었다. 따라서, 쿼리에 대한 너무 많은 포스트 검색 결과가 나타나게 되는 경우, 사용자가 원하는 웹 페이지를 효율적으로 검색하게 하기 위해 웹 페이지 랭킹을 제공하는 것처럼, 포스트 검색 결과 역시 이러한 랭킹의 제공이 필요하게 되었다.
그런데, 기존의 웹 페이지 랭킹 판단 방법을 블로그의 포스트에 그대로 적용하는 경우, 기존의 웹 페이지 랭킹 판단 방법에서는 페이지 사이의 링크에 의해 랭 킹이 부여되지만, 블로그에서는 포스트 사이의 링크가 거의 없기 때문에 거의 대부분의 포스트가 랭킹을 부여 받지 못하게 되는 문제점이 있었다.
또한, 블로그의 포스트에서는 기존의 하이퍼링크 뿐만 아니라 블로거(Blogger)의 덧글, 스크랩, 엮인글, 참조 등의 포스트에 대한 다양한 액션이 존재하며, 액션을 행한 시간 정보가 존재한다. 따라서, 기존의 웹 페이지 랭킹 판단 방법에서는 하이퍼링크를 이용하여 링크 정보를 구성하였으므로, 기존의 웹 페이지 랭킹 판단 방법을 블로그의 포스트에 적용하는 경우, 상기 다양한 액션에 의한 영향과, 시간 정보 등을 랭킹 제공 시 활용하지 못하게 되는 문제점이 있었다.
또한, 웹 페이지의 랭킹 판단 방법을 블로그 환경에 적합한 블로그 포스트의 랭킹 판단 방법으로 확장하는 경우, 그 확장 방법 또는 다양한 변형 방법이 명확하지 않다는 문제점이 있었다.
본 발명은 상술한 문제점을 해결하기 위한 것으로서, 하이퍼링크로 구성된 링크 정보 없이도 포스트의 랭킹을 제공할 수 있는 블로그 포스트의 랭킹 판단 방법 및 시스템을 제공하는 것을 그 기술적 과제로 한다.
또한, 본 발명은 기존의 하이퍼링크 대신에 블로거의 포스트에 대한 다양한 액션과 액션을 행한 시간 정보를 활용할 수 있는 블로그 포스트의 랭킹 판단 방법 및 시스템을 제공하는 것을 그 기술적 과제로 한다.
또한, 본 발명은 웹 페이지의 랭킹 판단 방법을 블로그 환경에 적합하게 확 장 또는 변형할 수 있는 블로그 포스트의 랭킹 판단 방법 및 시스템을 제공하는 것을 그 기술적 과제로 한다.
상술한 목적을 달성하기 위한 본 발명의 일 측면에 따른 블로그 포스트의 랭킹 판단 방법은 포스트와 블로거간의 링크가 상기 포스트에 대한 상기 블로거의 액션으로 정의되는 링크 정보를 생성하는 단계; 상기 링크 정보 상의 블로거를 허브 노드로, 포스트를 권위 노드로 사용하여 상기 포스트의 권위 점수를 산출하는 단계; 및 상기 권위 점수에 따라 상기 포스트의 랭킹을 판단하는 단계를 포함하는 것을 특징으로 한다.
상술한 목적을 달성하기 위한 본 발명의 일 측면에 따른 블로그 포스트의 랭킹 판단 시스템은 포스트와 블로거간의 링크가 상기 포스트에 대한 상기 블로거의 액션으로 정의되는 링크 정보를 생성하는 링크 정보 생성부; 상기 링크 정보 상의 블로거를 허브 노드로, 포스트를 권위 노드로 사용하여 상기 포스트의 권위 점수를 산출하는 권위 점수 산출부; 및 상기 권위 점수를 통해 상기 포스트의 랭킹을 판단하는 랭킹 판단부를 포함하는 것을 특징으로 한다.
상술한 바와 같이 본 발명에 따르면, 블로거를 허브 노드로, 포스트는 권위 노드로 사용하고 블로거의 포스트에 대한 액션을 링크로 포함하는 링크 정보를 사용함으로써, 포스트 간의 하이퍼링크 없이도 블로그 환경에 적합한 링크 정보를 통해 포스트의 랭킹을 제공할 수 있는 효과가 있다.
또한, 본 발명에 따르면, 블로거의 포스트에 대한 다양한 액션과 상기 액션을 행한 시간 정보를 포스트 랭킹 판단 방법에 활용함으로써, 블로그 환경에서 사용자의 행동을 잘 반영하는 포스트의 랭킹을 제공할 수 있는 효과가 있다.
또한, 본 발명에 따르면, 기존의 웹 페이지 랭킹 판단 방법을 블로거, 포스트 및 블로거의 포스트에 대한 액션을 포함하는 링크 정보를 통해 확장 또는 변형하여 사용할 수 있는 효과가 있다.
본 발명의 실시예에 대한 상세한 설명을 하기 이전에 본 발명에서 사용된 용어에 대해 간략히 설명한다.
액션이란 포스트(Post)를 작성 또는 게시한 블로거(Blogger)와 다른 블로거 사이의 의견 교환을 위해 사용되는 기능으로서 스크랩, 덧글, 엮인글, 참조, 하이퍼링크 등이 있다. 스크랩은 다른 블로거의 포스트를 자신의 블로그(Blog)로 복사하여 가져오는 기능이고, 덧글은 포스트에 다른 블로거나 자신의 의견을 남길 수 있도록 하는 기능이다. 또한 엮인글은 다른 블로그의 포스트에 링크를 남기고, 자신의 블로그 포스트와 서로 엮는 기능이다
인접 행렬(Adjacency Matrix)은 블로거와 포스트의 링크 정보를 표현한 행렬이다. 그리고, 블로거를 허브 노드(Hub Node)로, 포스트를 권위 노드(Authoritative Node)로 사용하며, 상기 노드들의 링크 관계를 표현한다. 여기서, 링크 정보는 블로거의 포스트에 대한 액션을 링크로 포함한다. 또한, 인접 행렬은 블로거와 포스트의 작성 관계를 나타낼 수 있다.
인접 행렬 산출 시 링크가 중복되어 나타나는 경우 하나의 링크만을 이용한다. 자신을 참조하는(Self-loop) 링크와 자신의 노드를 순회(Navigation)하기 위한 목적으로 생성한 링크는 제거한다. 또한, 다른 포스트를 참조하지도 않고 다른 블로거에게 참조되지도 않는 완전히 고립된 노드는 제거된다. 이러한 인접 행렬은 다음과 같이 표현할 수 있다.
인접 행렬 M: M(i,j) = 1, 노드 i에서 j로의 링크가 존재하는 경우
M(i,j) = 0, 노드 i에서 j로의 링크가 존재하지 않는 경우
블로그의 포스트 랭킹 판단 방법의 입력으로 인접 행렬과 n-차원 벡터가 사용된다. 페이지 랭킹 판단 방법의 수행 결과로 나오는 n-차원 벡터의 i번째 요소는 포스트 i의 랭킹을 위한 점수로 사용된다.
링크 정보에서 노드 i에 역방향 링크로 이어진 노드의 집합은 B(i)로 표현되고, 정방향 링크로 이어진 노드의 집합은 F(i)로 표현된다. 어떤 노드가 갖는 정방향 링크의 개수를 외부 차수(Out-degree)라고 하고, 역방향 링크의 개수를 내부 차수(In-degree)라고 한다. 이때, 외부 차수는 |F(i)|로 내부 차수는 |B(i)|로 나타낼 수 있다.
권위 노드는 다른 노드로부터 참조되는 내부 차수가 0이상인 노드를 의미한다. 즉, 다른 노드로부터 적어도 한 번 이상 액션이 행해 진 노드이다. 이러한 권위 노드에 알고리즘을 통해 부여된 점수를 권위 점수라고 한다. 허브 노드는 다른 노드를 참조하는 외부 차수가 0이상인 노드를 의미한다. 즉, 다른 노드에 적어도 한 번 이상 액션을 행한 노드이다. 이러한 허브 노드에 알고리즘을 통해 부여된 점 수를 허브 점수라고 한다.
이하 첨부된 도면을 참조하여 본 발명의 실시예에 대해 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 블로그 포스트의 랭킹 판단 시스템의 개략적인 블록도이다.
도시된 바와 같이, 본 발명의 일 실시예에 따른 블로그 포스트의 랭킹 판단 시스템(102)은 링크 정보 생성부(104), 권위 점수 산출부(106), 랭킹 판단부(108)를 포함하며, 소정의 데이터베이스(110)와 연결된다.
블로그 포스트의 랭킹 판단 시스템(102)은 특정 쿼리(Query)와 그에 대한 랭킹 제공 요청을 수신하면, 데이터베이스(110)에 기 저장된 블로그 정보를 통해 상기 쿼리에 대한 검색 결과인 포스트의 랭킹을 제공한다. 여기서, 블로그 포스트의 랭킹 판단 시스템(102)은 데이터베이스(110)로부터 블로그 정보를 수신한다. 상기 블로그 정보는 블로그의 포스트, 블로거 및 상기 블로거의 포스트에 대한 액션 정보를 포함한다.
또한, 본 발명의 일 실시예에서는 상기 블로그 포스트의 랭킹 판단 시스템(102)은 데이터베이스(110)와 분리된 것으로 설명하였으나, 변형된 실시예에서는 상기 데이터베이스(110)를 포함할 수 있다.
링크 정보 생성부(104)는 포스트와 블로거간의 링크가 상기 포스트에 대한 상기 블로거의 액션으로 정의되는 링크 정보를 생성한다. 여기서, 상기 액션은 스크랩, 덧글, 엮인글, 참조 및 하이퍼링크 중 적어도 하나를 포함할 수 있다.
도 2는 본 발명의 일 실시예에 따른 블로거, 포스트, 및 액션을 포함하는 링 크 정보를 나타내는 도면이다. 도 2를 참조하면, 링크 정보는 사각형의 포스트(202), 원 모양의 블로거(204), 및 블로거(204)의 포스트(202)에 대한 액션(206)을 포함한다.
기존의 웹 페이지 랭킹 판단 방법은 하이퍼링크와 웹 페이지들을 포함하는 링크 정보를 통해 웹 페이지의 랭킹을 판단하였다. 그러나, 본 발명의 일 실시예에 따른 블로그 포스트 랭킹 판단 방법은 도 2와 같은 포스트(202), 블로거(204), 및 액션(206)을 포함하는 링크 정보를 통해 랭킹을 판단한다.
도시된 바와 같이 본 발명의 일 실시예에 따른 링크 정보는 블로거(204)와 포스트(202)의 관계로 이루어져 있으며, 블로거(204)와 포스트(202)로 이루어진 이분 그래프(Bipartite Graph)형태로 나타낼 수 있다. 블로거(204)는 허브 노드로 구성되고 포스트(202)는 권위 노드로 구성되며, 허브 점수를 블로거(204)에, 권위 점수를 포스트(202)에 부여하여 포스트(202)의 랭킹을 판단한다. 이하, 포스트(202)에 부여하는 권위 점수를 ai로, 블로거(204)에 부여하는 허브 점수를 bi로 나타내겠다.
블로거(204)는 포스트(202)에 대한 스크랩, 덧글, 엮인글, 참조, 하이퍼링크 등과 같은 액션(206)을 남길 수 있다. 링크 정보는 액션(206)을 링크로 포함하며, 어떤 포스트(202)에도 액션(206)을 행하지 않은 고립된 블로거(204)와 어떤 블로거(204)로부터도 액션(206)이 행해 지지 않은 고립된 포스트(202)는 제거된다. 또한, 중복되어 나타나는 액션(206)의 경우 이를 동일한 액션(206)으로 판단한다.
다시 도 1을 참조하면, 권위 점수 산출부(106)는 링크 정보 상의 블로거를 허브 노드로, 포스트를 권위 노드로 사용하여 상기 포스트의 권위 점수를 산출한다.
이하, 권위 점수 산출부(106)가 링크 정보를 사용하여 포스트의 권위 점수를 산출하는 방법을 여러 실시예를 통해 설명하겠다.
제1 실시예에 있어서, 권위 점수 산출부(106)는 링크 정보를 참조하여 포스트에 대한 액션의 수를 획득하고, 상기 액션의 수를 통해 상기 포스트의 권위 점수를 산출한다. 이하, 제1 실시예에 따른 포스트의 권위 점수 판단 방법을 InDegree라 하겠다.
InDegree는 권위 노드인 포스트에 대한 허브 노드인 블로거의 액션의 개수를 포스트의 권위 점수로 이용하며, 하기 <수학식 1>과 같이 표현 될 수 있다.
ai = |B(i)|
여기서 ai는 포스트 i의 권위 점수를 나타내고, |B(i)|는 포스트 i의 외부 차수를 나타낸다.
제2 실시예에 있어서, 권위 점수 산출부(106)는 블로거에 의해 작성된 포스트의 초기 권위 점수의 합에 따라 상기 블로거의 허브 점수를 산출하고, 상기 링크 정보를 참조하여 상기 포스트에 액션을 행한 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출한다. 이하, 제2 실시예에 따른 포스트의 권위 점수 판 단 방법을 PostRank라 하겠다.
PostRank는 좋은 블로거가 평가하는 포스트는 좋은 포스트라는 개념으로서, 좋은 블로거는 자신이 작성한 포스트에 다른 블로거가 많은 액션을 남긴 블로거이다. 이는 웹 페이지 랭킹 판단 방법인 PageRank를 변형 및 확장한 방법이다.
도 3은 PostRank를 설명하기 위한 도면으로서, 링크 정보에 포함된 액션(306)뿐만 아니라, 블로거(304a,304b)가 작성한 포스트(302a,302b)가 어떤 것인지를 나타내는 포스트 작성 정보(308)가 필요하다.
도 3을 참조하면, 가운데 상위 4개의 포스트(302a)는 왼쪽에 있는 블로거(304a)가 작성한 것이고, 오른쪽에 있는 블로거(304b)는 이들 포스트(302a)에 액션(306)을 행함으로써 링크되어 있다. 왼쪽의 블로거(304a) 중 아래쪽에 있는 블로거(304a)가 다른 블로거(304b)에게 많은 액션(306)을 받았으므로, 아래쪽 블로거(304a)는 좋은 블로거(304a)가 된다. 이 블로거(304a)가 액션을 행한 맨 아래쪽의 포스트(302b)는 좋은 포스트(304a)로 좋은 권위 점수를 받게 된다.
PostRank에서는 액션으로 이루어진 그래프뿐만 아니라 블로거가 작성한 포스트가 어떤 것인지 나타내는 링크 정보가 필요하다. 블로거가 작성한 포스트를 나타내는 인접 행렬을 W라고 하고, 블로거의 포스트에 대한 액션을 나타내는 인접 행렬을 M이라고 하면, PostRank는 하기의 <수학식 2>를 사용하여 권위 점수를 산출할 수 있다.
Figure 112008007976124-pat00001
Figure 112008007976124-pat00002
= MTW
여기서,
Figure 112008007976124-pat00003
는 포스트들의 권위 점수를 표현하기 위한 벡터이며, 행렬 MTW의 주 고유벡터를 구하여 얻을 수 있다. MT는 M의 전치 행렬(Transpose Matrix)이다
일 예로서, 주 고유 벡터를 구하기 위해서 파워 방법(Power Method)을 사용하는 경우,
Figure 112008007976124-pat00004
에 소정의 초기치를 대입하는 제1 단계 및
Figure 112008007976124-pat00005
W연산을 통해 블로거가 작성한 포스트의 권위 점수를 반영하여 블로거의 허브 점수(
Figure 112008007976124-pat00006
)를 산출하는 제2 단계를 수행한다. 그리고, 제2 단계의 결과값과 MT행렬을 곱함으로써 포스트에 액션을 행한 블로거의 허브 점수를 반영하여 포스트의 권위 점수를 산출하는 제3 단계,
Figure 112008007976124-pat00007
Figure 112008007976124-pat00008
를 단위 벡터로 정규화 하는 제4 단계, 및 상기 제2 단계 내지 제4 단계를 반복하여 수렴되는
Figure 112008007976124-pat00009
를 찾아내는 제5 단계를 수행한다. 여기서, 수렴되는
Figure 112008007976124-pat00010
가 주 고유 벡터로서 권위 점수를 나타내는 벡터가 된다.
다시 도 1을 참조하면, 제3 실시예에 있어서, 권위 점수 산출부(106)는 상기 링크 정보를 참조하여 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합에 따라 상기 블로거의 허브 점수를 산출하고, 상기 포스트에 액션을 행한 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출한다. 이하, 제3 실시예에 따른 포스트의 권위 점수 판단 방법을 AuthHub라 하겠다.
AuthHub는 허브 노드를 블로거로 권위 노드를 포스트로 하여 좋은 포스트에 액션을 많이 남긴 블로거가 참조하는 포스트가 좋은 포스트가 되는 개념이다. 즉, 권위 점수가 높은 포스트에 액션을 많이 행한 블로거들이 존재하는 경우, 상기 해당 블로거들이 액션을 행한 포스트의 권위 점수를 높게 산출하는 방법이다.
따라서 권위 점수는, 먼저 포스트의 권위 점수를 반영하여 상기 포스트에 액션을 행한 블로거의 허브 점수를 계산하고, 계산된 허브 점수를 반영하여 블로거가 액션을 행한 포스트의 권위 점수를 계산하는 과정의 반복으로 구해 질 수 있다. 이러한, 권위 점수와 허브 점수의 반영 과정은 하기의 <수학식 3>으로 표현된다.
Figure 112008007976124-pat00011
Figure 112008007976124-pat00012
그리고,
<수학식 3>을 인접 행렬과 벡터 형태로 표현하면 하기 <수학식 4>와 같다.
Figure 112008007976124-pat00013
Figure 112008007976124-pat00014
Figure 112008007976124-pat00015
Figure 112008007976124-pat00016
=M 그리고, = MT
즉,
Figure 112008007976124-pat00017
= MTM
Figure 112008007976124-pat00018
또는
Figure 112008007976124-pat00019
= MTM
Figure 112008007976124-pat00020
로 표현될 수 있기 때문에, 포스트의 권위 점수는 행렬 MTM의 주 고유 벡터로 계산된다.
이하, 권위 점수 산출부(106)가 AuthHub로 권위 점수를 산출하는 과정을 구체적으로 설명하겠다.
먼저, 권위 점수 산출부(106)는 상기 링크 정보 생성부(104)에서 생성된 링크 정보를 참조하여, 권위 노드인 포스트 및 허브 노드인 블로거를 모두 1로 초기 화한다. 그리고, 블로거가 액션을 행한 포스트의 초기 권위 점수의 합을 통해 블로거의 허브 점수를 산출한 후, 포스트에 액션을 행한 블로거의 허브 점수의 합을 통해 포스트의 권위 점수를 산출한다.
그리고, 포스트의 권위 점수 벡터와 블로거의 허브 점수 벡터를 단위 벡터로 정규화하고, 권위 점수가 수렴하는지 판단한다.
상기 권위 점수가 수렴하면, 행렬 MTM의 주 고유 벡터가 구해 진 것으로 판단하고 수렴된 권위 점수를 포스트에 부여한다.
만약, 상기 권위 점수가 수렴하지 않으면, 상기 포스트마다 초기 권위 점수를 상기 산출된 권위 점수로 치환하는 과정, 허브 점수를 구하는 과정, 권위 점수를 구하는 과정, 및 수렴 여부를 판단하는 과정을 수렴할 때까지 반복적으로 수행한다.
제4 실시예에 있어서, 권위 점수 산출부(106)는 링크 정보를 참조하여 블로거가 액션을 행한 포스트의 초기 권위 점수의 합을 상기 블로거가 액션을 행한 포스트의 수로 나눈 값에 따라 상기 블로거의 허브 점수를 산출하고, 상기 포스트에 액션을 행한 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출한다. 이하, 제4 실시예에 따른 포스트의 권위 점수 판단 방법을 Auth(1/N)Hub라 하겠다.
Auth(1/N)Hub는 AuthHub을 변형한 방법으로 권위 노드에서 허브 노드로 점수를 부여할 때, 무작위 이동(Random Walk)을 적용한 것이다. 즉, 하기 <수학식 5>를 통해 개념을 설명할 수 있다.
Figure 112008007976124-pat00021
Figure 112008007976124-pat00022
그리고,
여기서, 상기 <수학식 5>에 상응하는 인접 행렬과 벡터의 표현식은
Figure 112008007976124-pat00023
=Mr
Figure 112008007976124-pat00024
그리고,
Figure 112008007976124-pat00025
= MT
Figure 112008007976124-pat00026
로 표현할 수 있으므로, 포스트의 권위 점수는 대해 하기 <수학식 6>으로 표현할 수 있다.
Figure 112008007976124-pat00027
Figure 112008007976124-pat00028
= MT Mr
상기 <수학식 6>에서 Mr은 블로거의 포스트에 대한 액션을 나타내는 인접 행렬의 행 벡터를 1/|B(j)|로 정규화한 것이다. 따라서, MT Mr행렬의 주 고유 벡터를 구함으로서, 포스트의 권위 점수를 산출할 수 있다.
제5 실시예에 있어서, 권위 점수 산출부(106)는 링크 정보를 참조하여 블로거가 액션을 행한 포스트의 초기 권위 점수의 합에 따라 상기 블로거의 허브 점수를 산출하고, 포스트에 액션을 행한 블로거의 허브 점수의 합을 상기 포스트로 액션을 행한 블로거의 수로 나눈 값에 따라 상기 포스트의 권위 점수를 산출한다. 이하, 제5 실시예에 따른 포스트의 권위 점수 판단 방법을 AuthHub(1/N)라 하겠다.
AuthHub(1/N)는 AuthHub을 변형한 방법으로 허브 노드에서 권위 노드로 점수를 부여할 때, 무작위 이동을 적용한 것이다. 즉, 하기 <수학식 7>을 통해 개념을 설명할 수 있다.
Figure 112008007976124-pat00029
Figure 112008007976124-pat00030
그리고,
따라서, 상기 <수학식 7>에 상응하는 인접 벡터들을 생성하고, 그 곱행렬인 Mc TM의 주 고유 벡터를 구함으로서, 포스트의 권위 점수를 산출한다. 여기서, Mc는 인접 행렬의 열벡터가 1/|F(j)|로 정규화된 것이다.
제6 실시예에 있어서, 권위 점수 산출부(106)는 링크 정보를 참조하여 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합을 상기 블로거가 액션을 행한 포스트의 수로 나눈 값에 따라 허브 점수를 산출하고, 포스트에 액션을 행한 블로거의 허브 점수의 합을 상기 포스트로 액션을 행한 블로거의 수로 나눈 값에 따라 포스트의 권위 점수를 산출한다. 이하, 제6 실시예에 따른 포스트의 권위 점수 판단 방법을 Auth(1/N)Hub(1/N)라 하겠다.
Auth(1/N)Hub(1/N)는 AuthHub을 변형한 방법으로 권위 노드에서 허브노드로 점수를 부여할 때와 허브 노드에서 권위 노드로 점수를 부여할 때, 무작위 이동을 적용한 것이다. 즉, 하기 <수학식 8>을 통해 개념을 설명할 수 있다.
Figure 112008007976124-pat00031
Figure 112008007976124-pat00032
그리고,
따라서, 상기 <수학식 8>에 상응하는 인접 벡터들을 생성하고, 그 곱행렬의 주 고유 벡터를 구함으로서, 포스트의 권위 점수를 산출한다. 이에 대한 설명은 제4 실시예 또는 제5 실시예를 통해 이해될 수 있으므로 생략하기로 한다.
제7 실시예에 있어서, 권위 점수 산출부(106)는 링크 정보를 참조하여 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합을 상기 블로거가 액션을 행한 포스트의 수의 제곱근으로 나눈 값에 따라 상기 블로거의 허브 점수를 산출하고, 상기 포스트에 액션을 행한 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출한다. 이하, 제7 실시예에 따른 포스트의 권위 점수 판단 방법을 SNR(Square Root Normalization)이라 하겠다.
권위 노드는 다른 허브 노드의 참조에 의해서 권위 점수가 결정되기 때문에 블로거가 이를 악용하는 것을 방지하는데 어려움이 있다. 즉, 허브 노드는 참조하는 권위 노드에 따라 그 점수가 달라지므로, 권위 노드를 인위적으로 참조하여 자신의 점수를 높이고 다른 포스트의 점수를 높이는 악용이 쉽게 이루어 질 수 있다. 이러한 이유로 상기 악용을 방지하기 위해 AuthHub를 이용하되, 허브 점수를 제한하는 SNR을 제시한 것이다.
SNR은 AuthHub(1/N)에서 외부 차수로 허브 점수를 나누어 주는 것과 유사하게 외부 차수의 제곱근으로 허브 점수를 나누어 준다. 즉, 하기 <수학식 9>를 통해 개념을 설명할 수 있다.
Figure 112008007976124-pat00033
따라서, 상기 <수학식 9>에 상응하는 인접 벡터들을 생성하고, 그 곱행렬의 주 고유 벡터를 구함으로서, 포스트의 권위 점수를 산출한다.
제8 실시예에 있어서, 권위 점수 산출부(106)는 AuthHub와 같은 방식으로 권위 점수를 산출하지만, 허브 점수를 산출하는데 필요한 상기 초기 권위 점수의 합은 상기 초기 권위 점수가 상위 k번째 이내인 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합이다. 이하, 제8 실시예에 따른 포스트의 권위 점수 판단 방법을 PAT(k)(Post Authority Threshold)라 하겠다.
PAT(k)는 AuthHub에 SNR과 마찬가지로 허브 점수 제한 방법을 적용한 것으로서, 상위 k개의 권위 점수를 갖는 포스트의 권위 점수를 블로거의 허브 점수로 가져온다.
제9 실시예에 있어서, 권위 점수 산출부(106)는 AuthHub와 같은 방식으로 권위 점수를 산출하지만, 상기 포스트에 액션을 행한 블로거의 허브 점수는 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합에 따라 산출된 상기 블로거의 허브 점수를 구간을 나누어 상기 구간마다 서로 다른 값으로 치환한 값이다. 이하, 제9 실시예에 따른 포스트의 권위 점수 판단 방법을 HubDisc(HubDiscretization)라 하겠다.
HubDisc는 허브 점수를 제한하는 방법으로 허브 점수가 속한 구간에 따라 허 브 점수를 특정한 값으로 치환하여 주는 방법이다. 이 방법은 허브 점수를 일정한 구간으로 나누어 높은 점수를 받은 구간에는 높은 점수를, 낮은 점수를 받은 구간에는 낮은 점수를 주어 허브 점수를 일정한 값으로 치환한다. AuthHub에서는 높은 점수를 받은 허브 노드는 더 높은 점수를 받게 되고, 낮은 점수를 받는 허브 노드는 더 낮은 점수를 받게 된다. 그러나 이 방법은 구간에 따라 허브 점수의 크기를 일정하게 하기 때문에 점수의 분포를 일정하게 한다.
도 4는 HubDisc에서 허브 점수의 구간을 나누는 일 예를 나타낸 도면이다.
도 4를 참조하면, 일반적으로 허브 점수는 멱함수의 법칙을 따른다. y축은 블로거의 수를 의미하고, x축은 블로거가 받은 허브 점수의 크기를 나타낸다. 점선은 허브 점수에 따라 나누어 지는 구간을 나타낸다.
노드의 개수를 이용하여 그 구간을 나눌 경우 대부분의 허브 노드가 높은 점수를 받게 된다. 따라서 허브 점수의 구간을 나눌 때 허브 점수의 크기를 이용하여 구간을 나눈다. 다양한 방법으로 허브 점수의 구간을 나눌 수 있지만 도 4의 예에서는 3단계로 나누기로 한다.
전체 허브 점수 중 높은 허브 점수 구간(402)을 30%, 중간 크기의 허브 점수 구간(404)을 40%, 낮은 크기의 허브 점수 구간(406)을 30%로 하여 구간을 나눈다. 각 구간에 부여하는 점수 또한 다양한 방법으로 줄 수 있지만, 도 4의 예에서는 높은 구간부터 각각 3점, 2점, 1점을 부여한다. 허브 점수의 구간을 나누는 방법이나 점수의 수치를 부여하는 방법에 따라 다양한 랭킹이 나타날 수 있음을 미리 밝혀 둔다.
제10 실시예에 있어서, 권위 점수 산출부(106)는 AuthHub와 같은 방식으로 권위 점수를 산출하지만, 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합에 따라 산출된 상기 블로거의 허브 점수에 Log함수를 적용한 값에 따라 포스트의 권위 점수를 산출한다. 이하, 제10 실시예에 따른 포스트의 권위 점수 판단 방법을 LOGSCORE라 하겠다.
LOGSCORE는 허브 점수를 제한하는 방법으로 전체 허브 점수에 Log함수를 적용하는 것이다. Log함수를 적용하는 이유는 허브 점수가 너무 큰 값을 갖지 못하도록 점수를 낮추어 각 허브 노드가 갖는 허브 점수의 차이를 줄이기 위해서이다.
AuthHub는 각 단계에서 모든 권위 점수와 허브 점수는 단위 벡터로 정규화 한다. 정규화가 된 권위 점수와 허브 점수는 모두 0과 1사이의 값을 갖는다. 따라서 허브 점수에 바로 Log함수를 취하는 경우 그 값이 0 이하의 음수 값으로 나타난다. 따라서 LOGSCORE는 모든 허브 점수에 1을 더하여 Log함수를 취한다. 이는 하기 <수학식 10>으로 표현할 수 있다.
Figure 112008007976124-pat00034
상기 <수학식 10>을 이용한 LOGSCORE의 계산 방법은 다음과 같다. 먼저, 모든 포스트의 권위 점수와 블로거의 허브 점수를 1로 초기화하는 제1 단계를 수행한다. 그리고, 모든 허브 노드에 대해서
Figure 112008007976124-pat00035
를 계산하는 제2 단계,
Figure 112008007976124-pat00036
를 계산하는 제3 단계,
Figure 112008007976124-pat00037
Figure 112008007976124-pat00038
벡터를 단위 벡터로 정규화하는 제4 단계, 및
Figure 112008007976124-pat00039
로 허브 점수를 업데이트 하는 제5 단계를 수행한다. 그리고, 상기 제2 단계 내지 제5 단계를 권위 점수가 수렴할 때까지 반복한다.
제11 실시예에 있어서, 권위 점수 산출부(106)는 AuthHub와 같은 방식으로 권위 점수를 산출하지만, 상기 권위 점수는 상기 포스트에 행한 액션의 순서에 따른 가중치를 부여 받은 상기 블로거의 허브 점수를 통해 산출한다. 이하, 제11 실시예에 따른 포스트의 권위 점수 판단 방법을 ERA(Equivalent Ratio Attenuation)라 하겠다.
블로그 포스트의 액션에는 웹 페이지와는 달리 링크에 시간에 대한 정보가 포함되어 있다. 이러한 부가적인 정보를 이용한다면 포스트 랭킹의 정확도를 높일 수 있다. ERA는 포스트 랭킹 판단 방법에서 액션을 행한 시간 정보를 활용하는 방법이며, 일 예로 AuthHub를 확장하는 방법이 될 수 있다.
ERA는 포스트에 먼저 액션을 남긴 블로거에게 높은 점수를 부여하는 방법이다. 좋은 블로거는 좋은 포스트를 다른 블로거에 비해 빠르게 알아낼 수 있다고 가정한다. 따라서 이러한 블로거에게 높은 점수를 주어 포스트에 먼저 액션을 남긴 블로거에게 높은 점수를 부여하고 그 이후의 블로거들에게는 낮은 점수를 준다.
이를 위해 링크에 가중치를 주고, 그 가중치를 포스트의 권위 점수에 곱하여 블로거에게 부여한다. 가중치를 주는 방법은 다음과 같다. 먼저, 가장 먼저 포스트에 액션을 남긴 블로거에게 가장 높은 가중치인 1을 준다. 그 이후의 블로거에 대 해서 1보다 작고 각각 다른 가중치를 부여하다.
가중치를 나타내는 수식은 ρorder이다. 여기서, ρ는 감쇄하는 정도를 나타내는 값이며 0~1사이의 값이다. order는 블로거가 액션을 남긴 순서를 나타낸다. order는 첫 번째 액션의 경우 0이 되고, 다음 액션마다 1씩 증가한다. 따라서 액션이 증가할수록 해당 가중치가 작아 진다.
도 5는 제11 실시예에 따른 ERA를 설명하기 위한 도면이다. 도 5를 참조하면, 왼쪽에 있는 블로거일수록 포스트에 먼저 액션을 남긴 블로거이다. ρ의 값을 0.95로 정하고 위의 수식을 적용할 경우 왼쪽에 있는 블로거부터 차례대로 낮은 가중치를 부여 받는다. ρ의 값은 다양한 값으로 부여할 수 있다.
다시 도 1을 참조하면, 제12 실시예에 있어서, 권위 점수 산출부(106)는 ERA 방법으로 권위 점수를 산출하지만, 상기 가중치를 부여 받은 상기 블로거의 허브 점수는 기준값 이상이다. 이하, 제12 실시예에 따른 포스트의 권위 점수 판단 방법을 MinEG(Minimum Equivalent Gap)라 하겠다.
ERA에서 포스트에 액션을 행하는 블로거의 수가 많아 지는 경우, 액션을 나중에 행하는 블로거일수록 그 블로거의 허브 점수가 점점 낮아지게 되는 문제가 있다. 이러한 문제를 해결하기 위해 MinEG에서는 블로거에게 최소의 가중치를 주어 기준값 이상의 허브 점수를 받을 수 있도록 한다. MinEG는 ERA와 마찬가지로 포스트에 먼저 액션을 남긴 포스트 일수록 높은 점수를 받게 된다.
MinEG의 가중치를 부여하는 방법은 하기 <수학식 11>을 이용한다.
Figure 112008007976124-pat00040
여기서 min은 블로거가 받을 수 있는 최소 가중치를 의미하고, degree는 포스트의 내부 차수이고 order는 블로거가 포스트에 액션을 남긴 순서이다.
도 6은 MinEG에서 min값을 0.5로 정하고, 하나의 포스트에 5명의 블로거가 액션을 남긴 경우 블로거가 받을 수 있는 가중치를 나타낸 도면이다. 도 5와 마찬가지로 왼쪽에 있는 블로거는 가장 먼저 포스트에 액션을 남긴 블로거이고 오른쪽에 있는 블로거일수록 나중에 포스트에 액션을 남긴 블로거이다.
도시된 바와 같이, t4의 시간에 액션을 행한 가장 오른쪽의 블로거의 허브 점수는 0.5의 최소 가중치가 곱해 져서 포스트의 권위 점수 산출에 사용되게 된다.
다시 도 1을 참조하면, 제13 실시예에 있어서, 권위 점수 산출부(106)는 상기 링크 정보에서 블로거 및 포스트가 각각 노드로서 정의되고, 상기 노드를 상기 포스트에 인접하게 링크된 1단계 노드부터 순차적으로 링크된 N단계 노드까지 구분하는 제1 단계, 상기 포스트에 링크된 상기 1단계 노드부터 N단계 노드까지 단계 별로 노드 수를 산출하여 각각 다른 가중치를 부여하는 제2 단계, 및 상기 1단계 노드부터 상기 N단계 노드까지 상기 각각 다른 가중치를 부여 받은 노드 수의 합을 통해 상기 권위 점수를 산출하는 제3 단계를 수행함으로써, 포스트의 권위 점수를 산출한다. 이하, 제13 실시예에 따른 포스트의 권위 점수 판단 방법을 PBFS(Post Breadth First Search)라 하겠다.
InDegree는 한 포스트의 권위점수를 구할 때 오직 직접 관계가 있는 블로거만을 고려하고 링크 정보에 존재하는 다른 블로거 무시한다. Authhub에서는 노드 주변의 링크 정보를 우선 고려하고, 전체 링크 정보를 대상으로 한다. 그런데, PBFS는 InDegree에서 한 단계 이웃만을 고려하는 것과 달리, 여러 단계 이웃을 고려하여 권위 점수 부여하며, 다 단계 이웃을 구성하는 방법은 Authhub를 이용한다. 즉, 하나의 포스트로부터 Authhub의 방식으로 도달 가능한 노드의 개수에 의해 점수를 부여한다. 여기서, 노드는 포스트의 권위 노드와 블로거의 허브 노드를 포함한다.
Authhub 방식으로 도달 가능한 노드 j가 페이지 i에 영향을 미치는 정도는 단계에 따라 차이가 있다. 즉, Authhub 방식으로 도달 가능한 노드j와 포스트 i의 거리가 멀수록 포스트 i에 영향을 미치는 정도는 줄어들게 된다. 이를 반영하여 포스트의 권위 점수를 산출하는 방법은 하기 <수학식 12>와 같다.
Figure 112008007976124-pat00041
PBFS는 노드 i에서 출발하여 n 단계를 거치거나 노드 i에서 도달 가능한 노드가 없을 때까지 방문하여 권위 점수를 산출한다.
여기서, 하나의 노드부터 도달 가능한 경로까지 단계에 따라 지수적으로 점수를 감쇄하는 방법이 적용된다. 지수적으로 점수를 감쇄한다는 것은 포스트 i의 권위 점수 산출 시 거리가 먼 노드의 영향력을 줄이겠다는 의미이다. 상기 <수학식 12>에서, 노드의 영향력은 단계를 지수로하는 1/2의 지수함수를 통해 감쇄하게 된다.
제14 실시예에 있어서, 권위 점수 산출부(106)는 상기 링크 정보를 참조하여 상기 블로거로부터 액션이 행해 질 확률에 따른 가중치가 부여된 상기 포스트의 권위 점수의 합에 따라 상기 블로거의 허브 점수를 산출하고, 상기 포스트에 액션을 행할 확률에 따른 가중치가 부여된 상기 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출한다. 이하, 제14 실시예에 따른 포스트의 권위 점수 판단 방법을 RAuthHub(Randomized AuthHub)라 하겠다.
RAuthHub는 AuthHub에 개인화 벡터를 적용한다. 즉, 권위 점수 산출 시 해당 포스트에 액션을 행할 확률에 따라 블로거의 허브 점수를 반영하고, 허브 점수 산출 시 해당 블로거의 액션을 받을 확률에 따라 포스트의 권위 점수를 반영한다. 이는 포스트가 어느 정도 마음에 들지만 액션을 남길 정도는 아니거나 아직 포스트를 보지 못하여 액션을 남기지 못한 포스트이기 때문에 액션을 남길 수 있는 가능성이 있다고 가정한 것이다. 여기서, 링크 정보는 특정 블로거가 특정 포스트에 액션을 행할 확률과, 특정 포스트가 특정 블로거로부터 액션을 받을 확률에 대한 정보를 포함한다.
랭킹 판단부(108)는 권위 점수 산출부(106)에서 산출된 포스트들의 권위 점수를 통해 포스트들의 랭킹을 판단한다. 일 실시예에 있어서, 랭킹 판단 방법은 권위 점수의 순서에 따라 포스트의 랭킹을 정할 수 있다.
랭킹 판단부(108)는 특정 쿼리에 대한 랭킹 제공 요청을 수신하면, 권위 점 수 산출부(106)에 의해 권위 점수가 산출된 포스트들 중에서 상기 쿼리에 해당하는 포스트들을 추출한다. 그리고, 추출된 포스트들의 권위 점수에 따라 랭킹을 정하고 제공한다.
변형된 실시예에 있어서, 도 1에는 랭킹 판단부(108)가 권위 점수 산출부(106)로부터 권위 점수가 산출된 포스트들을 제공받는 것으로 도시되어 있으나, 권위 점수 산출부(106)에서 권위 점수가 정해진 포스트들은 데이터베이스(110) 또는 결과 데이터베이스(미도시)에 저장될 수 있고, 쿼리에 대한 랭킹 제공 요청 시, 랭킹 판단부(108)는 데이터베이스(110) 또는 결과 데이터베이스로부터 상기 쿼리의 검색 결과이며 권위 점수가 산출된 포스트들을 제공받을 수 있다.
도 7은 본 발명의 일 실시예에 따른 블로그 포스트의 랭킹 판단 방법을 나타낸 순서도이다.
먼저, 소정의 데이터베이스로부터 블로그 정보를 수신하여 포스트 및 블로거를 노드로서 포함하고, 블로거의 포스트에 대한 액션을 링크로서 포함하는 링크 정보를 생성한다(S702). 일 실시예에 있어서, 상기 액션은 덧글, 스크랩, 엮인글, 참조 및 하이퍼링크 중 적어도 하나를 포함할 수 있다.
이어, 상기 링크 정보 상의 블로거를 허브 노드, 포스트를 권위 노드로 사용하여 포스트의 권위 점수 산출한다(S704).
이어, 상기 권위 점수에 따라 상기 포스트의 랭킹을 판단한다(S706). 일 실시예에 있어서, 상기 권위 점수의 크기 순서로 상기 포스트의 랭킹을 판단할 수 있다.
이하, 상기 S704 단계에 기재된 포스트의 권위 점수 산출을 위한 다양한 실시예에 대해 보다 구체적으로 설명한다.
제1 실시예에 따른 포스트의 권위 점수 산출 방법의 경우, 링크 정보를 참조하여 포스트에 대해 블로거가 행한 액션의 수를 획득하고, 액션의 수를 통해 포스트의 권위 점수를 산출할 수 있다.
한편, 제2 실시예에 따른 포스트의 권위 점수 산출 방법의 경우, 블로거에 의해 작성된 포스트의 초기 권위 점수의 합에 따라 상기 블로거의 허브 점수를 산출하고, 링크 정보를 참조하여 포스트에 액션을 행한 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출할 수 있다.
도 8은 제3 실시예에 따른 포스트의 권위 점수 산출 방법을 나타낸 순서도이다.
먼저, 도시된 바와 같이, 링크 정보를 참조하여 권위 노드인 포스트 및 허브 노드인 블로거를 모두 1로 초기화한다(S802).
이어, 블로거가 액션을 행한 포스트의 초기 권위 점수의 합을 통해 블로거의 허브 점수를 산출하고(S804), 포스트에 액션을 행한 블로거의 허브 점수의 합을 통해 포스트의 권위 점수를 산출한다(S806).
이어, 포스트의 권위 점수 벡터와 블로거의 허브 점수 벡터를 단위 벡터로 정규화하고(S808), 권위 점수가 수렴하는지 판단한다(S810).
상기 권위 점수가 수렴하면, 상기 수렴한 권위 점수를 포스트의 최종적인 권위 점수로 판단한다(S812). 만약, 상기 권위 점수가 수렴하지 않으면, 상기 포스트 마다 초기 권위 점수를 상기 산출된 권위 점수로 치환하고(S814), 권위 점수가 수렴할 때까지 S804, S806, S808, S810 및 S814 단계를 반복적으로 수행한다.
한편, 제4 실시예에 따른 포스트의 권위 점수 산출 방법의 경우, 링크 정보를 참조하여 블로거가 액션을 행한 포스트의 초기 권위 점수의 합을 상기 블로거가 액션을 행한 포스트의 수로 나눈 값에 따라 상기 블로거의 허브 점수를 산출하고, 포스트에 액션을 행한 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출할 수 있다.
한편, 제5 실시예에 따른 포스트의 권위 점수 산출 방법의 경우, 링크 정보를 참조하여 블로거가 액션을 행한 포스트의 초기 권위 점수의 합에 따라 상기 블로거의 허브 점수를 산출하고, 포스트에 액션을 행한 블로거의 허브 점수의 합을 상기 포스트로 액션을 행한 블로거의 수로 나눈 값에 따라 포스트의 권위 점수를 산출할 수 있다.
한편, 제6 실시예에 따른 포스트의 권위 점수 산출 방법의 경우, 링크 정보를 참조하여 블로거가 액션을 행한 포스트의 초기 권위 점수의 합을 상기 블로거가 액션을 행한 포스트의 수로 나눈 값에 따라 허브 점수를 산출하고, 포스트에 액션을 행한 블로거의 허브 점수의 합을 상기 포스트로 액션을 행한 블로거의 수로 나눈 값에 따라 포스트의 권위 점수를 산출할 수 있다.
한편, 제7 실시예에 따른 포스트의 권위 점수 산출 방법의 경우, 링크 정보를 참조하여 블로거가 액션을 행한 포스트의 초기 권위 점수의 합을 상기 블로거가 액션을 행한 포스트의 수의 제곱근으로 나눈 값에 따라 상기 블로거의 허브 점수를 산출하고, 포스트에 액션을 행한 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출할 수 있다.
한편, 제8 실시예에 따른 포스트의 권위 점수 산출 방법의 경우, 제3 실시예와 같은 방식으로 권위 점수를 산출하지만, 허브 점수를 산출하는데 필요한 상기 초기 권위 점수의 합은 상기 초기 권위 점수가 상위 k번째 이내인 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합으로써 산출할 수 있다.
한편, 제9 실시예에 따른 포스트의 권위 점수 산출 방법의 경우, 제3 실시예와 같은 방식으로 권위 점수를 산출하지만, 포스트에 액션을 행한 블로거의 허브 점수는 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합에 따라 산출된 상기 블로거의 허브 점수를 구간을 나누어 상기 구간마다 서로 다른 값으로 치환한 값일 수 있다.
한편, 제10 실시예에 따른 포스트의 권위 점수 산출 방법의 경우, 제3 실시예와 같은 방식으로 권위 점수를 산출하지만, 블로거가 액션을 행한 포스트의 초기 권위 점수의 합에 따라 산출된 상기 블로거의 허브 점수에 Log함수를 적용한 값에 따라 포스트의 권위 점수를 산출할 수 있다.
한편, 제11 실시예에 따른 포스트의 권위 점수 산출 방법의 경우, 권위 점수는 포스트에 행한 액션의 순서에 따른 가중치를 부여 받은 블로거의 허브 점수를 통해 산출할 수 있다.
한편, 제12 실시예에 따른 포스트의 권위 점수 산출 방법의 경우, 제11 실시예와 같은 방식으로 권위 점수를 산출하지만, 가중치를 부여 받은 블로거의 허브 점수는 기준값 이상일 수 있다.
도 9는 제13 실시예에 따른 포스트의 권위 점수 산출 방법을 나타낸 순서도이다.
먼저, 도시된 바와 같이, 링크 정보에서 블로거 및 포스트를 각각 노드로서 정의함으로써 상기 노드를 상기 포스트에 인접하게 링크된 1단계 노드부터 순차적으로 링크된 N단계 노드까지 구분한다(S902). 여기서, 상기 링크는 블로거가 허브 노드로서 행하고 포스트가 권위 노드로서 받은 액션이다.
이어, 포스트에 링크된 상기 1단계 노드부터 N단계 노드까지 단계 별로 노드 수를 산출하여 각각 다른 가중치를 부여한다(S904).
이어, 1단계 노드부터 N단계 노드까지 각각 다른 가중치를 부여 받은 노드 수의 합을 다 더하여 해당 포스트의 권위 점수를 산출한다(S906).
한편, 제14 실시예에 따른 포스트의 권위 점수 산출 방법의 경우, 링크 정보를 참조하여 블로거로부터 액션이 행해 질 확률에 따른 가중치가 부여된 포스트의 권위 점수의 합에 따라 상기 블로거의 허브 점수를 산출하고, 포스트에 액션을 행할 확률에 따른 가중치가 부여된 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출할 수 있다.
블로그 포스트의 랭킹 판단 방법은 다양한 컴퓨터 수단을 이용하여 수행될 수 있는 프로그램 형태로도 구현될 수 있는데, 이때 블로그 포스트의 랭킹 판단 방법을 수행하기 위한 프로그램은 하드 디스크, CD-ROM, DVD, 롬(ROM), 램, 또는 플래시 메모리와 같은 컴퓨터로 판독할 수 있는 기록 매체에 저장된다.
본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다.
그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
도 1은 본 발명의 일 실시예에 따른 블로그 포스트의 랭킹 판단 시스템의 개략적인 블록도.
도 2는 본 발명의 일 실시예에 따른 블로거, 포스트, 및 액션을 포함하는 링크 정보를 나타내는 도면.
도 3은 PostRank를 설명하기 위한 도면.
도 4는 HubDisc에서 허브 점수의 구간을 나누는 일 예를 나타낸 도면.
도 5는 ERA를 설명하기 위한 도면.
도 6은 MinEG에서 블로거가 받을 수 있는 가중치를 나타낸 도면.
도 7은 본 발명의 일 실시예에 따른 블로그 포스트의 랭킹 판단 방법을 나타낸 순서도.
도 8은 제3 실시예에 따른 포스트의 권위 점수 산출 방법을 나타낸 순서도.
도 9는 제13 실시예에 따른 포스트의 권위 점수를 산출 방법을 나타낸 순서도.
<도면의 주요부분에 대한 부호의 설명>
102: 블로그 포스트의 랭킹 판단 시스템 104: 링크 정보 생성부
106: 권위 점수 산출부 108: 랭킹 판단부
110: 데이터베이스

Claims (25)

  1. 링크 정보 생성부가 포스트(Post)와 블로거(Blogger)간의 링크가 상기 포스트에 대한 상기 블로거의 액션(Action)으로 정의되는 링크 정보를 생성하는 단계;
    권위 점수 산출부가 상기 링크 정보 상의 블로거를 허브 노드로, 포스트를 권위 노드로 사용하여 상기 포스트의 권위 점수를 산출하는 단계; 및
    랭킹 판단부가 상기 권위 점수에 따라 상기 포스트의 랭킹을 판단하는 단계;
    를 포함하고,
    상기 권위 점수는 상기 포스트의 권위 점수를 반영하여 상기 포스트에 액션을 행한 블로거의 허브 점수를 계산하고, 계산된 허브 점수를 반영하여 블로거가 액션을 행한 포스트의 권위 점수를 계산하는 과정의 반복으로 구하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  2. 제1항에 있어서,
    상기 권위 점수를 산출하는 단계는,
    상기 링크 정보를 참조하여 상기 포스트에 대한 상기 액션의 수를 획득하는 단계; 및
    상기 액션의 수를 통해 상기 포스트의 권위 점수를 산출하는 단계;
    를 포함하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  3. 제1항에 있어서,
    상기 권위 점수를 산출하는 단계는,
    상기 블로거에 의해 작성된 포스트의 초기 권위 점수의 합에 따라 상기 블로거의 허브 점수를 산출하는 단계; 및
    상기 링크 정보를 참조하여 상기 포스트에 액션을 행한 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출하는 단계;
    를 포함하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  4. 제1항에 있어서,
    상기 권위 점수는 상기 블로거와 포스트의 작성 관계에 대한 제1 인접 행렬 및 상기 블로거와 포스트의 액션 관계에 대한 제2 인접 행렬을 순차적으로 사용하는 연산의 주 고유 벡터 값인 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  5. 제1항에 있어서,
    상기 권위 점수를 산출하는 단계는,
    상기 링크 정보를 참조하여 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합에 따라 상기 블로거의 허브 점수를 산출하는 단계; 및
    상기 포스트에 액션을 행한 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출하는 단계;
    를 포함하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  6. 제5항에 있어서,
    상기 허브 점수는 상기 초기 권위 점수의 합을 상기 블로거가 액션을 행한 포스트의 수로 나눈 값에 따라 산출되는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  7. 제5항에 있어서,
    상기 권위 점수는 상기 허브 점수의 합을 상기 포스트에 액션을 행한 블로거의 수로 나눈 값에 따라 산출되는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  8. 제5항에 있어서,
    상기 허브 점수는 상기 초기 권위 점수의 합을 상기 블로거가 액션을 행한 포스트의 수로 나눈 값에 따라 산출되고, 상기 권위 점수는 상기 허브 점수의 합을 상기 포스트에 액션을 행한 블로거의 수로 나눈 값에 따라 산출되는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  9. 제5항에 있어서,
    상기 허브 점수는 상기 초기 권위 점수의 합을 상기 블로거가 액션을 행한 포스트의 수의 제곱근으로 나눈 값에 따라 산출되는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  10. 제5항에 있어서,
    상기 초기 권위 점수의 합은 상기 초기 권위 점수가 상위 k번째 이내인 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합인 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  11. 제5항에 있어서,
    상기 포스트에 액션을 행한 블로거의 허브 점수는 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합에 따라 산출된 상기 블로거의 허브 점수를 구간별로 나누어 구간마다 서로 다른 값으로 치환한 값인 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  12. 제5항에 있어서,
    상기 포스트에 액션을 행한 블로거의 허브 점수는 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합에 따라 산출된 상기 블로거의 허브 점수에 Log함수를 적용한 값인 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  13. 제1항에 있어서,
    상기 권위 점수는 상기 블로거와 포스트의 액션 관계에 대한 제1 인접 행렬 및 상기 블로거와 포스트의 액션 관계에 대한 제2 인접 행렬을 순차적으로 사용하는 연산의 주 고유 벡터 값인 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  14. 제1항에 있어서,
    상기 권위 점수를 산출하는 단계는,
    상기 링크 정보에서 블로거 및 포스트가 각각 노드로서 정의되고, 상기 노드를 상기 포스트에 인접하게 링크된 1단계 노드부터 순차적으로 링크된 N단계 노드까지 구분하는 단계;
    상기 포스트에 링크된 상기 1단계 노드부터 N단계 노드까지 단계 별로 노드 수를 산출하여 각각 다른 가중치를 부여하는 단계; 및
    상기 1단계 노드부터 상기 N단계 노드까지 상기 각각 다른 가중치를 부여 받은 노드 수의 합을 통해 상기 권위 점수를 산출하는 단계;
    를 포함하는 것을 특징으로 하는 하는 블로그 포스트의 랭킹 판단 방법.
  15. 제1항에 있어서,
    상기 권위 점수를 산출하는 단계는,
    상기 링크 정보를 참조하여 상기 블로거로부터 액션이 행해 질 확률에 따른 가중치가 부여된 상기 포스트의 권위 점수의 합에 따라 상기 블로거의 허브 점수를 산출하는 단계; 및
    상기 포스트에 액션을 행할 확률에 따른 가중치가 부여된 상기 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출하는 단계;
    를 포함하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  16. 제1항에 있어서,
    상기 권위 점수는 상기 포스트에 행한 액션의 순서에 따른 가중치를 부여 받은 상기 블로거의 허브 점수를 통해 산출되는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  17. 제16항에 있어서,
    상기 가중치를 부여 받은 상기 블로거의 허브 점수는 기준값 이상인 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  18. 제1항에 있어서,
    상기 액션은 스크랩, 덧글, 엮인글, 참조 및 하이퍼링크 중 적어도 하나를 포함하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 방법.
  19. 제1항 내지 제18항 중 어느 하나의 항에 기재된 방법을 수행하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체.
  20. 포스트와 블로거간의 링크가 상기 포스트에 대한 상기 블로거의 액션으로 정의되는 링크 정보를 생성하는 링크 정보 생성부;
    상기 링크 정보 상의 블로거를 허브 노드로, 포스트를 권위 노드로 사용하여 상기 포스트의 권위 점수를 산출하는 권위 점수 산출부; 및
    상기 권위 점수를 통해 상기 포스트의 랭킹을 판단하는 랭킹 판단부;
    를 포함하고,
    상기 권위 점수는 상기 포스트의 권위 점수를 반영하여 상기 포스트에 액션을 행한 블로거의 허브 점수를 계산하고, 계산된 허브 점수를 반영하여 블로거가 액션을 행한 포스트의 권위 점수를 계산하는 과정의 반복으로 구하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 시스템.
  21. 제20항에 있어서,
    상기 권위 점수 산출부는 상기 링크 정보를 참조하여 상기 포스트에 대한 액션의 수를 획득하고, 상기 액션의 수를 통해 상기 포스트의 권위 점수를 산출하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 시스템.
  22. 제20항에 있어서,
    상기 권위 점수 산출부는 상기 블로거에 의해 작성된 포스트의 초기 권위 점수의 합에 따라 상기 블로거의 허브 점수를 산출하고, 상기 링크 정보를 참조하여 상기 포스트에 액션을 행한 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 시스템.
  23. 제20항에 있어서,
    상기 권위 점수 산출부는 상기 링크 정보를 참조하여 상기 블로거가 액션을 행한 포스트의 초기 권위 점수의 합에 따라 상기 블로거의 허브 점수를 산출하고, 상기 포스트에 액션을 행한 블로거의 허브 점수의 합에 따라 상기 포스트의 권위 점수를 산출하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 시스템.
  24. 제20항에 있어서,
    상기 권위 점수 산출부는 상기 권위 점수를 상기 포스트에 행한 액션의 순서에 따른 가중치를 부여 받은 상기 블로거의 허브 점수를 통해 산출하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 시스템.
  25. 제20항에 있어서,
    상기 액션은 스크랩, 덧글, 엮인글, 참조 및 하이퍼링크 중 적어도 하나를 포함하는 것을 특징으로 하는 블로그 포스트의 랭킹 판단 시스템.
KR1020080009809A 2008-01-30 2008-01-30 블로그 포스트의 랭킹 판단 방법 및 시스템 KR100975502B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080009809A KR100975502B1 (ko) 2008-01-30 2008-01-30 블로그 포스트의 랭킹 판단 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080009809A KR100975502B1 (ko) 2008-01-30 2008-01-30 블로그 포스트의 랭킹 판단 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20090083801A KR20090083801A (ko) 2009-08-04
KR100975502B1 true KR100975502B1 (ko) 2010-08-11

Family

ID=41204536

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080009809A KR100975502B1 (ko) 2008-01-30 2008-01-30 블로그 포스트의 랭킹 판단 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR100975502B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190013277A (ko) 2017-08-01 2019-02-11 (주)레드테이블 빅데이터를 이용한 모바일 커머스 정보 추천 시스템 및 방법
KR20190013276A (ko) 2017-08-01 2019-02-11 (주)레드테이블 빅데이터를 이용한 모바일 커머스 시스템 및 서비스 방법
KR101951354B1 (ko) 2018-07-18 2019-02-22 비스냅(주) 게시물 순위 결정방법

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101139544B1 (ko) * 2010-04-22 2012-04-27 한양대학교 산학협력단 블로그 포스트의 랭킹 결정 방법 및 시스템
US10460359B1 (en) 2019-03-28 2019-10-29 Coupang, Corp. Computer-implemented method for arranging hyperlinks on a graphical user-interface

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060047856A (ko) * 2004-05-14 2006-05-18 마이크로소프트 코포레이션 유형 내 및 유형 간 관계에 기초하여 객체들을 순위화하기위한 방법 및 시스템
US20070061297A1 (en) * 2005-09-13 2007-03-15 Andriy Bihun Ranking blog documents

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060047856A (ko) * 2004-05-14 2006-05-18 마이크로소프트 코포레이션 유형 내 및 유형 간 관계에 기초하여 객체들을 순위화하기위한 방법 및 시스템
US20070061297A1 (en) * 2005-09-13 2007-03-15 Andriy Bihun Ranking blog documents

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190013277A (ko) 2017-08-01 2019-02-11 (주)레드테이블 빅데이터를 이용한 모바일 커머스 정보 추천 시스템 및 방법
KR20190013276A (ko) 2017-08-01 2019-02-11 (주)레드테이블 빅데이터를 이용한 모바일 커머스 시스템 및 서비스 방법
KR101951354B1 (ko) 2018-07-18 2019-02-22 비스냅(주) 게시물 순위 결정방법

Also Published As

Publication number Publication date
KR20090083801A (ko) 2009-08-04

Similar Documents

Publication Publication Date Title
KR101130533B1 (ko) 이종 관계에 기초하여 객체들의 유사성을 결정하기 위한방법 및 시스템
US8244737B2 (en) Ranking documents based on a series of document graphs
Phan et al. NeuPL: Attention-based semantic matching and pair-linking for entity disambiguation
JP5391633B2 (ja) オントロジー空間を規定するタームの推奨
US9286396B2 (en) Query expansion and query-document matching using path-constrained random walks
Okamoto et al. Ranking of closeness centrality for large-scale social networks
US8880548B2 (en) Dynamic search interaction
KR101130535B1 (ko) 다양성과 정보 풍부성을 향상시키기 위해 서치 결과의문서들을 랭킹하기 위한 방법 및 시스템
US20100049498A1 (en) Determining utility of a question
JP2009093650A (ja) 文書の段落分析によるその文書のタグの選択
KR100975502B1 (ko) 블로그 포스트의 랭킹 판단 방법 및 시스템
EP1910943A1 (en) Method and apparatus for constructing a link structure between documents
EP3940582A1 (en) Method for disambiguating between authors with same name on basis of network representation and semantic representation
Park et al. Greedy filtering: A scalable algorithm for k-nearest neighbor graph construction
CN107239554B (zh) 一种基于匹配度检索英文文本的方法
US7774340B2 (en) Method and system for calculating document importance using document classifications
CN109684185B (zh) 基于启发式遍历的超级计算机大数据处理能力测试方法
WO2019208199A1 (ja) 回答選択装置、モデル学習装置、回答選択方法、モデル学習方法、プログラム
Pang et al. Query expansion and query fuzzy with large-scale click-through data for microblog retrieval
KR101290000B1 (ko) 논문 랭킹 방법 및 장치
Atkinson et al. Redundancy-based trust in question-answering systems
CN113297854A (zh) 文本到知识图谱实体的映射方法、装置、设备及存储介质
Kamphuis et al. Radboud University at TREC 2019.
Chang et al. Authorrank: a new scheme for identifying field-specific key researchers
Pang et al. History-Aware Expansion and Fuzzy for Query Reformulation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130626

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150722

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160725

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170704

Year of fee payment: 8