KR101130374B1

KR101130374B1 - 유형 내 및 유형 간 관계에 기초하여 객체들을 순위화하기위한 방법 및 시스템

Info

Publication number: KR101130374B1
Application number: KR1020050039981A
Authority: KR
Inventors: 벤유 즈항; 후아-준 젱; 웨이-잉 마; 웬시 자이; 즈헹 첸
Original assignee: 마이크로소프트 코포레이션
Priority date: 2004-05-14
Filing date: 2005-05-13
Publication date: 2012-04-12
Also published as: MXPA05005208A; US7346621B2; US20050256832A1; JP2005327293A; CA2507337C; KR20060047856A; JP4965086B2; AU2005202017A1; CN1716259B; CN1716259A; CA2507337A1; RU2387005C2; RU2005114665A; EP1596315A1; BRPI0503929A

Abstract

상이한 객체 유형의 객체들과의 관계들에 기초하여 객체들을 순위화하기 위한 방법 및 시스템이 제공된다. 순위화 시스템은 객체의 각 유형의 각 속성에 대한 방정식을 정의한다. 방정식들은 속성 값들을 정의하며, 속성과, 동일한 유형의 객체 및 상이한 유형의 객체들에 관련된 속성들 사이의 관계들에 기초한다. 순위화 시스템은 속성 값들이 해에 수렴할 때까지 방정식들을 사용하여 객체들에 대한 속성 값들을 반복적으로 계산한다. 그 후 순위화 시스템은 속성 값들에 기초하여 객체들을 순위화한다.

순위화, 관계, 동일한 유형, 상이한 유형

Description

유형 내 및 유형 간 관계에 기초하여 객체들을 순위화하기 위한 방법 및 시스템{METHOD AND SYSTEM FOR RANKING OBJECTS BASED ON INTRA-TYPE AND INTER-TYPE RELATIONSHIPS}

도 1은 일 실시예에서 순위화 시스템의 컴포넌트들을 도시하는 블럭도.

도 2는 일 실시예에서 객체 순위화 컴포넌트의 프로세싱을 도시하는 흐름도.

도 3은 일 실시예에서 관계 수립 컴포넌트의 프로세싱을 도시하는 흐름도.

도 4는 일 실시예에서 스코어 계산 컴포넌트의 프로세싱을 도시하는 흐름도.

<도면의 주요부분에 대한 부호의 설명>

101: 웹 사이트

102: 통신 링크

110: 순위화 시스템

111: 객체 순위화

112: 객체 수집

113: 관계 수립

114: 스코어 계산

115: 객체 순서화

본 발명은 일반적으로 객체들의 순위화(ranking), 특히 객체 관계들에 기초한 순위화에 관한 것이다.

구글(Google) 및 오버츄어(Overture)와 같은 많은 검색 엔진 서비스가 인터넷을 통해 액세스가능한 정보에 대한 검색을 제공한다. 이러한 검색 엔진 서비스들은 사용자들에게 관심있을 수 있는 웹 페이지와 같은 디스플레이 페이지들을 사용자들이 검색하도록 허용한다. 사용자가 검색 용어를 포함하는 검색 요청("질의"로도 언급됨)을 제출한 후, 검색 엔진 서비스는 그러한 검색 용어들에 관련될 수 있는 웹 페이지들을 식별한다. 관련 웹 페이지들을 신속히 식별하기 위하여, 검색 엔진 서비스는 웹 페이지에 대한 키워드의 매핑을 유지할 수 있다. 검색 엔진 서비스는 각 웹 페이지의 키워드들을 추출하기 위하여 웹(즉, 월드 와이드 웹)을 "크롤링(crawling)"함으로써 이러한 매핑을 생성할 수 있다. 웹을 크롤링하기 위하여, 검색 엔진 서비스는 루트 웹 페이지들의 리스트를 사용할 수 있으며, 그러한 루트 웹 페이지들을 통하여 액세스가능한 모든 웹 페이지들을 식별할 수 있다. 임의의 특정 웹 페이지의 키워드들은 헤드라인의 단어들, 웹 페이지의 메타데이터에서 제공된 단어들, 하이라이트된 단어들 등을 식별하는 것과 같은 다양한 공지된 정보 검색 기술을 사용하여 추출될 수 있다. 검색 엔진 서비스는 각 매치의 근접성, 웹 페이지 인기도(예를 들어, 구글의 PageRank) 등에 기초하여 각 웹 페이지가 검색 요청에 얼마나 관련있는지를 나타내는 관련성 스코어(relevance score)를 계 산할 수 있다. 그 후 검색 엔진 서비스는 웹 페이지로의 링크들을 웹 페이지들의 관련성에 기초한 순서로 사용자에게 디스플레이한다. 검색 엔진들은 더욱 일반적으로 임의의 컬렉션의 문서들에 있는 정보에 대한 검색을 제공할 수 있다. 예를 들어, 문서들의 컬렉션들은 모든 미국 특허, 모든 연방 법원 의견, 회사의 모든 보관 문서 등을 포함할 수 있다.

웹 페이지들을 순위화하기 위한 두 가지 공지된 기술은 PageRank와 HITS("Hyperlinked-Induced Topic Search")이다. PageRank는 웹 페이지들이 중요한 웹 페이지들로의 링크(즉, "아웃고잉 링크(outgoing link)")를 가질 것이라는 원리에 기초한다. 따라서, 웹 페이지의 중요성은 그 웹 페이지로 링크하는(즉, "인커밍 링크(incoming link)") 다른 웹 페이지들의 수 및 중요성에 기초한다. 단순한 형태로, 웹 페이지들 사이의 링크들이 행렬 A로 표현될 수 있고, A_ij는 웹 페이지 i로부터 웹 페이지 j로의 아웃고잉 링크들의 수를 나타낸다. 웹 페이지 j에 대한 중요성 스코어 w_j는 다음 방정식에 의해 표현될 수 있다.

이 방정식은 다음 방정식에 기초한 반복적 계산에 의해 풀릴 수 있다.

여기서 w는 웹 페이지들에 대한 중요성 스코어들의 벡터이고 A^T의 주요 고유 벡터(principal eigenvector)이다.

HITS 기술은 부가적으로 다른 중요한 웹 페이지들로의 많은 링크들을 가지는 웹 페이지 자체가 중요할 수 있다는 원리에 기초한다. 따라서, HITS는 웹 페이지들의 "중요성"을 두 가지 관련 속성 - "허브(hub)" 및 "권한(authority)" - 으로 나눈다. 허브는 웹 페이지가 연결하는 웹 페이지들의 "권한" 스코어에 의해 측정되고, "권한"은 그 웹 페이지로 연결하는 웹 페이지들의 "허브" 스코어에 의해 측정된다. 질의와 독립적으로 웹 페이지들의 중요성을 계산하는 PageRank와는 대조적으로, HITS는 결과의 웹 페이지들, 및 뒤따르는 인커밍 및 아웃고잉 링크들에 의한 결과의 웹 페이지들에 관련되는 웹 페이지들에 기초하여 중요성을 계산한다. HITS는 검색 엔진 서비스에 질의를 제출하고, 그 결과의 웹 페이지들을 웹 페이지들의 초기 집합으로서 사용한다. HITS는 인커밍 링크들의 목적지인 웹 페이지들, 및 결과의 웹 페이지들의 아웃고잉 링크들의 소스인 웹 페이지들을 집합에 추가한다. 그 후 HITS는 반복적 알고리즘을 사용하여 각 웹 페이지의 권한 및 허브 스코어를 계산한다. 권한 및 허브 스코어들은 다음 방정식에 의해 표현될 수 있다.

여기서 a(p)는 웹 페이지 p에 대한 권한 스코어를 나타내고 h(p)는 웹 페이지 p에 대한 허브 스코어를 나타낸다. HITS는 링크들을 표현하기 위하여 인접성 행렬(adjacency matrix) A를 사용한다. 인접성 행렬은 다음 방정식에 의해 표현된다.

벡터 a 및 h는 집합에 있는 모든 웹 페이지의 권한 및 허브 스코어에 각각 대응하고, 다음 방정식들에 의해 표현될 수 있다.

따라서, a 및 h는 행렬 A^TA 및 AA^T의 고유벡터들이다. HITS는 방문 횟수에 의해 측정된 것과 같은 웹 페이지의 인기도를 고려하도록 수정될 수도 있다. 웹 로그의 분석에 기초하여, 사용자가 웹 페이지 i로부터 웹 페이지 j로 이동할 때마다 인접성 행렬의 b_ij가증가될 수 있다.

이러한 웹 페이지 순위화 기술들은 주로 웹 페이지 자체의 속성들에 기초하여 순위화한다. 이러한 속성들은 한 웹 페이지로부터 또다른 웹 페이지로의 링크를 포함하고 한 웹 페이지로부터 또다른 웹 페이지로의 이동을 포함한다. 순위화 기술들은 웹 페이지들에 직접 관련되지 않는 속성들을 고려하지 않는다. 예를 들어, 웹 페이지의 중요성은 웹 페이지를 액세스하는 사용자들의 전문 기술이 고려될 때 더욱 정확하게 결정될 수 있다. 웹 페이지들에 직접 관련되지 않는 속성들에 기초하여 웹 페이지들의 중요성을 계산하기 위한 기술을 가지는 것이 바람직할 것이다. 더욱 일반적으로, 또다른 유형의 객체들(예를 들어, 사용자들)로의 관계에 기초하여 한 유형의 객체(예를 들어, 웹 페이지들)에 대한 스코어를 생성하는 것이 바람직할 것이다.

상이한 객체 유형의 객체들과의 관계에 기초하여 객체들을 순위화하기 위한 방법 및 시스템이 제공된다. 순위화 시스템은 객체의 각 유형의 각 속성에 대한 방정식을 정의한다. 방정식들은 속성 값들을 정의하며 속성과, 동일한 유형의 객체 및 상이한 유형의 객체들과 관련된 속성들 사이의 관계에 기초한다. 하나의 속성이 또다른 속성의 용어로 정의될 수 있고 반대도 마찬가지인 식으로 속성 값들은 서로 의존적일 수 있기 때문에, 방정식은 속성들의 재귀적 정의를 표현한다. 순위화 시스템은 속성 값들이 해(solution)에 수렴할 때까지 방정식을 사용하여 객체들에 대한 속성 값들을 반복적으로 계산한다. 그 후 순위화 시스템은 속성 값들에 기초하여 객체들을 순위화한다.

동일하거나 또다른 데이터 객체 유형의 데이터 객체들과의 관계에 기초하여 하나의 데이터 객체 유형의 데이터 객체들을 순위화하기 위한 방법 및 시스템이 제공된다. 일 실시예에서, 순위화 시스템은 다양한 데이터 객체 유형들의 데이터 객체들을 식별한다. 예를 들어, 하나의 데이터 객체 유형은 웹 페이지들일 수 있고, 또다른 데이터 객체 유형은 질의들일 수 있으며, 또다른 데이터 객체 유형은 사용자들일 수 있다. 각 데이터 객체 유형은 다양한 유형-특유의 속성들을 가질 수 있다. 예를 들어, 웹 페이지는 권한 속성을 가질 수 있고, 사용자는 전문기술 속성을 가질 수 있다. 웹 페이지의 권한 속성은 그 웹 페이지의 인커밍 링크들의 수에 기초할 수 있다. 사용자의 전문기술 속성은 사용자가 높은 권한 속성 값을 갖는 웹 페이지들을 액세스할 때 증가될 수 있다. 순위화 시스템은 데이터 객체들에 대 한 속성 값들을 계산하고 그들의 속성 값들에 기초하여 데이터 객체들을 순위화할 수 있다.

순위화 시스템은 각 객체가 단일 속성을 포함하도록 객체들의 "유형"을 정의한다. 예를 들어, 순위화 시스템은 웹 페이지의 권한 속성에 대응하는 유형 및 웹 페이지의 허브 속성에 대응하는 또다른 유형을 정의할 수 있다. 따라서, 두 유형이 동일한 기본 데이터 객체(예를 들어, 웹 페이지)를 표현할 수 있다. 순위화 시스템은 유형 내 관계(intra-type relationship)로 불리는 동일한 유형의 객체들 사이, 및 유형 간 관계(inter-type relationship)로 불리는 상이한 유형의 객체들 사이의 다양한 관계를 결정한다. 예를 들어, 질의가 제출되면, 순위화 시스템은 권위 유형의 객체들로서 결과들을 사용할 수 있고, 전문기술 유형의 객체들로서 웹 페이지들을 액세스한 사용자들을 식별하기 위하여 웹 로그를 사용할 수 있다. 권한 유형의 유형 내 관계 객체들은 웹 페이지들의 인커밍 링크 및 아웃고잉 링크 관계를 포함할 수 있다. 예를 들어, 만약 웹 페이지가 또다른 웹 페이지로의 링크를 가진다면, 그 웹 페이지는 나머지 웹 페이지로의 아웃고잉 링크 관계를 가지고, 나머지 웹 페이지는 그 웹 페이지로의 인커밍 링크 관계를 가진다. 권한 유형과 전문기술 유형의 객체 사이의 유형 간 관계들은 웹 페이지들로의 사용자 액세스에 기초할 수 있다. 예를 들어, 만약 사용자가 웹 페이지를 액세스한다면, 웹 페이지와 사용자는 액세스 관계를 가진다. 순위화 시스템은 유형 내 관계들을 사용하여 그리고 다른 유형의 객체들의 속성 값들과 결합된 유형 간 관계들을 사용하여 특정 유형의 객체들에 대한 속성들에 대한 값들을 유도한다. 예를 들어, 순위화 시스템 은 웹 페이지의 권한 및 허브 속성과 사용자들의 전문기술 속성을 유도하기 위하여 인커밍 및 아웃고잉 링크 관계 및 사용자 액세스 관계를 사용할 수 있다.

일 실시예에서, 순위화 시스템은 선형 방정식(linear equation)과 같은 방정식들의 집합을 사용하여 관계 및 속성을 표현한다. 순위화 시스템은 또다른 유형의 속성 값들에 기초하여 재귀적으로 정의될 수 있는 선형 방정식을 사용하여 각 유형의 속성 값들을 표현한다. 예를 들어, 권한 속성에 대한 선형 방정식은 전문기술 속성의 속성 값들에 기초하여 정의될 수 있고, 반대도 마찬가지이다. 선형 방정식들이 재귀적으로 정의될 수 있기 때문에, 순위화 시스템은 속성 값들이 해에 수렴할 때까지 각 선형 방정식의 속성 값들을 재귀적으로 계산함으로써 선형 방정식들을 푼다. 선형 방정식들을 푼 후에, 순위화 시스템은 속성 값들에 기초하여 데이터 객체들을 순위화할 수 있다. 예를 들어, 순위화 시스템은 권한 속성 값들에 기초하여 웹 페이지들을 순위화할 수 있다.

순위화 시스템은 객체들의 유형 내 및 유형 간 관계들에 기초하여 객체들에 대한 속성 값들을 표현한다. 속성의 값은 다음 방정식에 의해 표현될 수 있다.

여기서 F_i는 객체 i와 관련된 속성 값을 나타내고, R_i는 객체 i의 유형의 객체들 사이의 유형 내 관계들을 나타내며, R_ji는 객체 i의 유형의 객체들과 기타 유형들 j 사이의 유형 간 관계들을 나타낸다. 두 가지 유형의 객체들 x={x₁,x₂,...,x_m}, y={y₁,y₂,...,y_n}이 있다면, 그들의 유형 내 관계들은 R_x및 R_Y로 표현될 수 있고, 그들의 유형 간 관계들은 R_XY 및 R_YX로 표현될 수 있다. 순위화 시스템은 관계 정보를 표현하기 위하여 인접성 행렬을 사용한다. L_X 및 L_Y는 각각 집합 X 및 Y 내에서 유형 내 관계들의 인접성 행렬들을 나타낸다. L_XY및 L_YX는 X에 있는 객체들로부터 Y에 있는 객체들로의 유형 간 관계의 인접성 행렬 및 Y에 있는 객체들로부터 X에 있는 객체들로의 유형 간 관계의 인접성 행렬을 각각 나타낸다. 순위화 시스템은 다음에 의해 인접성 행렬을 나타낸다.

여기서 L_XY(i,j)는 집합 X에 있는 객체 i로부터 집합 Y에 있는 객체 j로의 관계("링크"로도 불림)가 존재하는지를 나타낸다. 속성 값들에 대한 선형 방정식들이 다음 방정식들로서 표현될 수 있다.

(1)

여기서 w_x는 X에 있는 객체들의 속성 벡터이고, w_y는 Y에 있는 객체들의 속성 벡터이다. 방정식 1은 다음 형태로 일반화될 수 있다.

(2)

여기서 M은 속성 벡터들의 행렬을 나타낸다.

객체들 사이에 서로 보충하는 관계들이 객체들에 부적당한 속성 값들을 제공 할 수 있기 때문에, 순위화 시스템은 하나의 인접성 행렬에서 한 객체가 n 개의 다른 객체들에 관련된다면, 객체에 관련된 각각은 속성 값의 1/n^th을 얻는 방식으로 이진(binary) 인접성 행렬들을 정규화할 수 있다. 순위화 시스템은 랜덤 관계들을 시뮬레이트하기 위하여 PageRank의 랜덤 서퍼 모델(random surfer model)을 또한 도입할 수 있고, 따라서 하기에 기술된 바와 같이 계산하는 동안 싱크 노드(sink node)들을 피할 수 있다. 또한, 상이한 유형들로부터의 속성들은 각 기타 속성에 상이한 중요성을 가질 수 있기 때문에, 순위화 시스템은 유형들의 각 조합에 대하여 가중치들을 사용할 수 있다. 따라서, 순위화 시스템은 다음 방정식에 의하여 속성 값들을 표현하기 위하여 정규화, 랜덤 서퍼 모델, 및 가중치를 고려할 수 있다.

(3)

여기서 U는 균등 전이 확률(uniform transition probability)의 전이 행렬(모든 i, j에 대하여 u_ij=1/n ; n은 데이터 스페이스 N에 있는 객체들의 총 개수임)을 나타내고, L_M 및 L_NM은 정규화된 인접성 행렬들이며, δ 및 ε는 행렬 L_M 및 L_NM에서 랜덤 관계들을 시뮬레이트하기 위하여 사용된 스무딩 팩터(smoothing factor)이며, α_M 및 β_NM은 관계들의 가중치들을 나타낸다. 순위화 시스템은 방정식 3이 수 렴할 때까지 반복적으로 계산한다. 방정식 3은 다음 방정식에 의해 표현되는 통합 정방 행렬(unified square matrix) A에 의해 표현될 수 있다.

(4)

행렬 A는 대각선에 L'_M을 가지고, 통합 행렬의 다른 부분들에는 L'_NM을 가진다. 순위화 시스템은 행렬 A를 사용하여 상이한 데이터 스페이스들에 있는 모든 데이터 객체들의 속성 벡터인 벡터 w를 변환하기 위하여 반복적 접근법(예를 들어, w=A^Tw)을 사용한다. 반복이 수렴하면, 벡터 w는 행렬 A의 주요 고유벡터이다.

M 및 N이 이종 데이터 스페이스일 때, 순위화 시스템은 관계 없음(no relationship)을 나타내기 위하여 랜덤 관계를 사용한다. M에 있는 객체가 N에 있는 임의의 객체들에 링크하는 관계를 갖지 않으면, 부행렬(sub-matrix) L'_NM ^T는 0이 될 것이며, 계산들에 의해 모든 속성 값을 할당받을 수 있는 "싱크 노드(sink node)"로 될 것이다. 이것을 방지하기 위하여, 순위화 시스템은 부행렬 L'_NM ^T의 대응하는 행에 있는 모든 구성요소들을 1/n로 설정하는데, 여기서 n은 데이터 스페이스 N에 있는 객체들의 총 개수이다. 대안적으로, 순위화 시스템은 바람직하지 않은 유형 내 및 유형 간 관계들에 대해 대응하는 가중치들을 0으로 설정할 수 있다. 그러나, 만약 β_MN이 0보다 크면, 반복적 계산이 수렴하려면 β_NM이 0보다 커야할 필 요가 있다. 따라서, L'_NM ^T의 관계가 바람직하지 않다면, 순위화 시스템은 L'_NM ^T의 영향을 감소시키기 위하여 β_NM을 매우 작은 양수 가중치로 설정한다.

모든 인접성 행렬들을 사용하여 통합 행렬을 구성함으로써, 순위화 시스템은 상이한 유형들의 객체들을 포함하는 통합 데이터 스페이스를 구성한다. 따라서, 이전의 유형 간 관계들은 통합 스페이스에서 유형 내 관계들로서 고려될 수 있고, 순위화 시스템은 단일 데이터 스페이스에서 링크 분석으로 효율적으로 귀결한다.

도 1은 일 실시예에서 순위화 시스템의 컴포넌트들을 도시하는 흐름도이다. 순위화 시스템(110)은 통신 링크(102)를 통해 다양한 웹 사이트(101)에 연결된다. 순위화 시스템은 객체 수집 컴포넌트(112)를 인보크하는 객체 순위화 컴포넌트(111), 관계 수립 컴포넌트(113), 스코어 계산 컴포넌트(114), 및 객체들을 순위화하기 위한 객체 순서화 컴포넌트(115)를 포함한다. 객체 순위화 컴포넌트는 웹 페이지들의 집합을 수신하고 유형 내 및 유형 간 관계들에 기초하여 웹 페이지들을 순위화할 수 있다. 객체 수집 컴포넌트는 다양한 유형의 객체들에 관련된 관계 정보를 검색한다. 예를 들어, 객체 수집 컴포넌트는 어떤 사용자들이 어떤 웹 페이지들을 액세스하는지를 식별하기 위하여 웹 사이트들의 웹 로그를 액세스할 수 있다. 관계 수립 컴포넌트는 유형 내 및 유형 간 관계 행렬들을 생성한다. 예를 들어, 관계 행렬은 사용자들을 그들이 액세스하는 웹 페이지들에 매핑할 수 있다. 스코어 계산 컴포넌트는 속성 값이 해에 수렴할 때까지 방정식 3을 사용하여 속성 값들을 재귀적으로 계산한다. 객체 순서화 컴포넌트는 속성 값들에 기초하여 데이 터 객체들을 정렬한다. 예를 들어, 객체 순서화 컴포넌트는 웹 페이지들을 정렬하기 위하여 웹 페이지에 대한 권한 속성의 값을 사용할 수 있다.

순위화 시스템이 구현될 수 있는 컴퓨팅 장치는 중앙 처리 장치, 메모리, 입력 장치(예를 들어, 키보드 및 포인팅 장치), 출력 장치(예를 들어, 디스플레이 장치), 및 저장 장치(예를 들어, 디스크 드라이브)를 포함할 수 있다. 메모리 및 저장 장치들은 순위화 시스템을 구현하는 명령어들을 포함할 수 있는 컴퓨터 판독가능 매체이다. 또한, 데이터 구조 및 메시지 구조들이 저장되거나 통신 링크상의 신호와 같은 데이터 전송 매체를 통해 전송될 수 있다. 인터넷, LAN, WAN, 또는 점대점 전화 연결과 같은 다양한 통신 링크들이 사용될 수 있다.

순위화 시스템은 다양한 운영 환경에서 구현될 수 있다. 사용에 적합할 수 있는 다양한 공지된 컴퓨팅 시스템, 환경 및 구성은 개인용 컴퓨터, 서버 컴퓨터, 포켓형 또는 랩탑 장치, 멀티프로세서 시스템, 마이크로프로세서 기반 시스템, 프로그래밍 가능한 가전기기, 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, 상기 시스템 또는 장치들 중 임의의 것을 포함하는 분산 컴퓨팅 환경 등을 포함한다.

순위화 시스템은 프로그램 모듈과 같이 하나 이상의 컴퓨터 또는 기타 장치에 의해 실행될 수 있는 컴퓨터 실행가능 명령어들의 일반적인 문맥으로 기술될 수 있다. 일반적으로, 프로그램 모듈은 특정 태스크를 수행하거나 특정 추상 데이터 유형을 구현하는 루틴, 프로그램, 객체, 컴포넌트, 데이터 구조 등을 포함한다. 전형적으로, 프로그램 모듈의 기능은 다양한 실시예에서 원하는 대로 결합되거나 분산될 수 있다.

도 2는 일 실시예에서 객체 순위화 컴포넌트의 프로세싱을 도시하는 흐름도이다. 컴포넌트는 객체 정보를 수집하고, 객체들 사이의 관계를 수립하고, 객체들에 대한 속성 값들을 계산하며, 속성에 기초하여 객체들을 순서화한다. 블럭(201)에서, 컴포넌트는 다양한 객체들에 관련된 정보를 수집한다. 블럭(202)에서, 컴포넌트는 인접성 행렬들을 생성하기 위하여 관계 수립 컴포넌트를 인보크한다. 관계 수립 컴포넌트는 α 및 β 가중치들을 검색하고 조정할 수도 있다. 블럭(203)에서, 컴포넌트는 해에 수렴할 때까지 속성 값들을 반복적으로 계산하기 위하여 스코어 계산 컴포넌트를 인보크한다. 블럭(204)에서, 컴포넌트는 속성의 값에 기초하여 데이터 객체들을 순서화한다. 예를 들어, 컴포넌트는 권한 속성에 기초하여 웹 페이지들을 순서화할 수 있다.

도 3은 일 실시예에서 관계 수립 컴포넌트의 프로세싱을 도시하는 흐름도이다. 블럭들(301-303)에서, 컴포넌트는 각 유형에 대한 인접성 행렬들을 수립하기 위하여 루핑한다. 블럭(301)에서, 컴포넌트는 다음 유형을 선택한다. 결정 블럭(302)에서, 모든 유형이 이미 선택되었다면 컴포넌트는 리턴하고, 그렇지 않으면 컴포넌트는 블럭(303)에서 계속된다. 블럭(303)에서, 컴포넌트는 선택된 유형의 객체들과 모든 유형의 객체들 사이의 관계들을 수립한다. 예를 들어, 컴포넌트는 권한 유형과 허브 유형, 및 권한 유형과 전문기술 유형 사이의 관계를 수립할 것이다. 그 후 컴포넌트는 다음 유형을 선택하기 위하여 블럭(301)으로 루핑한다.

도 4는 일 실시예에서 스코어 계산 컴포넌트의 프로세싱을 도시하는 흐름도이다. 컴포넌트는 속성 값들이 수렴할 때까지 방정식을 반복적으로 계산한다. 블 럭(401)에서, 컴포넌트는 인접성 행렬들에 의해 표현된 객체 관계들을 검색한다. 블럭(402)에서, 컴포넌트는 유형 내 및 유형 간 관계들에 대한 가중치들 α 및 β를 검색한다. 블럭(403)에서, 컴포넌트는 그 유형의 각 객체에 대해 동일한 속성 값을 갖기 위하여 각 유형에 대한 벡터 w를 초기화한다. 컴포넌트는 각 값을 1/m로 설정할 수 있는데, 여기서 m은 그 유형의 객체들의 개수이다. 예를 들어, 만약 10명의 사용자가 있다면, 컴포넌트는 전문기술 유형에 대한 초기 속성 값들을 1/10로 설정한다. 컴포넌트는 또한 각 유형에 대한 차이 변수(difference variable)를 큰 값으로 초기화하여 결정 블럭(405)의 테스트를 초기에 통과할 것이다. 컴포넌트는 계산들이 해에 수렴하는지를 결정하기 위한 각 반복의 끝에서 각 차이 변수에 대한 새로운 값을 계산한다. 블럭들(404-409)에서, 컴포넌트는 계산들이 해에 수렴할 때까지 방정식 3의 계산을 수행한다. 블럭(404)에서, 컴포넌트는 다음 반복을 시작한다. 결정 블럭(405)에서, 만약 마지막 반복 동안 계산된 차이들의 합이 차이 임계값보다 작으면, 계산들은 해에 수렴하고 컴포넌트는 리턴하며, 그렇지 않으면 컴포넌트는 블럭(406)에서 계속된다. 블럭(406)에서, 컴포넌트는 다음 유형을 선택한다. 결정 블럭(407)에서, 모든 유형이 이미 선택되었다면, 컴포넌트는 다음 반복을 시작하기 위하여 블럭(404)으로 루핑하고, 그렇지 않으면 컴포넌트는 블럭(408)에서 계속된다. 블럭(408)에서, 컴포넌트는 이전의 반복에서 계산된 값들에 기초하여 선택된 유형에 대한 값들을 계산한다. 블럭(409)에서, 컴포넌트는 선택된 유형에 대하여 이번 반복의 값들과 이전 반복의 값들 사이의 차이를 계산한다. 그 후 컴포넌트는 다음 유형을 선택하기 위하여 블럭(406)으로 루핑한다.

예시의 목적으로 본 발명에서는 순위화 시스템의 특정 실시예들이 기술되었지만 본 발명의 취지 및 범위를 벗어나지 않고서 다양한 변경이 행해질 수 있다는 점을 본 분야에서 숙련된 기술을 가진 자들은 잘 알 것이다. 예를 들어, 본 분야에서 숙련된 기술을 가진 자들은 속성 값들을 표현하기 위하여 비선형 방정식들이 사용될 수 있다는 것을 잘 알 것이다. 또한, 순위화 시스템은 서로 소정의 관계를 가지는 모든 유형의 객체들에 대해 사용될 수 있다. 예를 들어, 순위화 시스템은 학생 또는 지원자 및 교수와의 관계를 사용하는 "중요성"에 기초하여 대학을 순위화하기 위하여 사용될 수 있으며, 여기서 대학, 학생 및 교수는 상이한 유형의 객체들을 나타낸다. 따라서, 본 발명은 첨부되는 특허청구범위에 의해서를 제외하면 제한되지 않는다.

상이한 객체 유형의 객체들과의 관계들에 기초하여 객체들을 순위화하기 위한 방법 및 시스템이 제공된다.

Claims

컴퓨터 시스템에서 객체들의 속성들에 대한 속성 값들을 결정하기 위한 방법으로서, 상기 컴퓨터 시스템은 객체 순위화 컴포넌트, 객체 수집 컴포넌트, 관계 수립 컴포넌트, 스코어 계산 컴포넌트, 객체 순서화 컴포넌트 및 메모리를 포함하고, 상기 방법은,

상기 객체 순위화 컴포넌트에 의해 상기 객체 수집 컴포넌트로 유형들을 제공하는 단계 - 각각의 유형은 유형 특유의 속성(type-specific attribute)을 가짐 -,

상기 객체 수집 컴포넌트에 의해 객체들을 식별하는 단계 - 각각의 객체는 유형에 관련됨 -,

각각의 유형에 대하여, 상기 관계 수립 컴포넌트에 의해 한 유형에 대하여 상기 한 유형에 관련된 객체들 사이의 관계들을 식별하고, 상기 한 유형에 대하여 상기 한 유형에 관련된 객체와 다른 유형들에 관련된 객체 사이의 관계들을 식별하는 단계,

각각의 유형에 대하여, 상기 스코어 계산 컴포넌트에 의해 그 유형에 대한 속성 값을 계산하는, 각각의 유형에 대한 함수를 이용하여, 상기 식별된 관계들에 기초하여 객체의 속성에 대한 값(value)을 계산하는 단계 - 상기 함수는,

로서 정의되며, 여기서 F_i는 객체 i와 관련된 속성 값을 나타내고, R_i는 상기 객체 i의 유형의 객체들 사이의 유형 내 관계(intra-type relationship)들을 나타내며, R_ji는 상기 객체 i의 유형의 객체들과 다른 유형들 j의 객체들 사이의 유형 간 관계(inter-type relationship)들을 나타냄 -, 및

상기 객체 순위화 컴포넌트에 의해 상기 계산된 값들을 메모리에 저장하는 단계

를 포함하는 방법.
제1항에 있어서,

상기 유형들은 인커밍 링크들의 개수에 기초한 권한 유형(authority type), 아웃고잉 링크들의 개수에 기초한 허브 유형(hub type), 및 사용자에 의해 액세스되는 웹 페이지들의 권한 속성들의 값들에 기초한 전문기술 유형(expertise type)을 포함하는 방법.
제1항에 있어서,

동일한 유형의 객체들 사이의 관계들은 유형 내 관계들인 방법.
제1항에 있어서,

상이한 유형들의 객체들 사이의 관계들은 유형 간 관계들인 방법.
제1항에 있어서, 상기 객체 순서화 컴포넌트에 의해 한 유형의 객체들을 그 속성 값들에 기초하여 순위화(ranking)하는 단계를 포함하는 방법.
제1항에 있어서, 상기 객체 순위화 컴포넌트에 의해 각각의 유형에 대하여, 그 유형의 속성 값들을 정의하는 이하와 같이 정의되는 방정식을 상기 스코어 계산 컴포넌트로 제공하는 단계

를 포함하는 방법.
컴퓨터 시스템에서 객체의 속성 값을 결정하기 위한 방법으로서, 상기 컴퓨터 시스템은 객체 순위화 컴포넌트, 스코어 계산 컴포넌트 및 메모리를 포함하고,

상기 객체 순위화 컴포넌트에 의해 한 유형의 객체들과 또다른 유형 특유의 속성을 갖는 또다른 유형의 객체들 사이의 관계들에 기초하여, 상기 한 유형의 객체들에 대한 유형 특유의 속성에 대한 속성 값들을 계산하는 함수를 상기 스코어 컴포넌트로 제공하는 단계 - 상기 제공된 함수는 상기 한 유형의 객체들 사이의 관계들에 또한 기초하여 속성 값들을 계산하며,

상기 함수는

이며, 여기서 F_i는 객체 i와 관련된 속성 값을 나타내고, R_i는 상기 객체 i의 유형의 객체들 사이의 유형 내 관계들을 나타내며, R_ji는 상기 객체 i의 유형의 객체들과 다른 유형들 j의 객체들 사이의 유형 간 관계들을 나타냄 -,

상기 객체 순위화 컴포넌트에 의해 상기 한 유형의 객체들과 나머지 유형의 객체들 사이의 관계들을 명기(specifying)하는 데이터를 수신하는 단계,

상기 스코어 계산 컴포넌트에 의해 상기 한 유형의 객체들의 속성 값들을 결정하기 위하여 상기 제공된 함수를 계산하는 단계, 및

상기 객체 순위화 컴포넌트에 의해 상기 결정된 속성 값들을 상기 메모리에 저장하는 단계

를 포함하는 방법.
제7항에 있어서, 상기 객체 순위화 컴포넌트에 의해 다른 유형의 객체들에 대한 유형 특유의 속성에 대한 속성 값들을 계산하기 위한 함수를 제공하는 단계를 포함하는 방법.
방법에 의해, 객체들의 속성 값들을 결정하기 위하여 컴퓨터 시스템을 제어하기 위한 명령어들을 포함하는 컴퓨터 판독가능 기록 매체로서, 상기 컴퓨터 시스템은 객체 순위화 컴포넌트, 스코어 계산 컴포넌트 및 메모리를 포함하고, 상기 방법은,

상기 객체 순위화 컴포넌트에 의해 제1 유형의 객체들과 제2 유형 특유의 속성을 가지는 제2 유형의 객체들 사이의 관계들에 기초하여 상기 제1 유형의 객체들에 대한 제1 유형 특유의 속성에 대한 속성 값들을 계산하는 제1 함수를 상기 스코어 계산 컴포넌트로 제공하는 단계,

상기 객체 순위화 컴포넌트에 의해 상기 제2 유형의 객체들에 대한 상기 제2 유형 특유의 속성에 대한 속성 값들을 계산하는 제2 함수를 상기 스코어 계산 컴포넌트로 제공하는 단계,

상기 객체 순위화 컴포넌트에 의해 상기 제1 유형의 객체들과 상기 제2 유형의 객체들 사이의 관계들을 명기하는 데이터를 수신하는 단계,

상기 스코어 계산 컴포넌트에 의해 상기 제1 유형 및 상기 제2 유형의 객체들의 속성 값들을 결정하는 상기 제공된 함수들을 계산하는 단계, 및

상기 객체 순위화 컴포넌트에 의해 상기 결정된 속성값들을 상기 메모리에 저장하는 단계

를 포함하고,

상기 함수들은

로서 정의되며, 여기서 F_i는 객체 i와 관련된 속성 값을 나타내고, R_i는 상기 객체 i의 유형의 객체들 사이의 유형 내 관계들을 나타내며, R_ji는 상기 객체 i의 유형의 객체들과 다른 유형들 j의 객체들 사이의 유형 간 관계들을 나타내는 컴퓨터 판독가능 기록 매체.
제9항에 있어서,

상기 제2 함수는 상기 제2 유형의 객체들 사이의 관계에 기초하여 상기 속성 값들을 계산하는 컴퓨터 판독가능 기록 매체.
제9항에 있어서,

상기 제1 함수는 또한 상기 제1 유형의 객체들 사이의 관계에 기초하여 상기 속성 값들을 계산하는 컴퓨터 판독가능 기록 매체.
제9항에 있어서,

상기 제2 함수는 상기 제1 유형의 객체의 속성 값들에 기초하여 속성 값들을 계산하는 컴퓨터 판독가능 기록 매체.
제9항에 있어서,

상기 함수들은 재귀적으로 정의되는 컴퓨터 판독가능 기록 매체.
제9항에 있어서,

상기 함수들은 선형 방정식들을 나타내는 컴퓨터 판독가능 기록 매체.
컴퓨터 시스템에서 객체들의 속성들에 대한 속성 값들을 결정하기 위한 방법으로서, 상기 컴퓨터 시스템은 객체 순위화 컴포넌트, 객체 수집 컴포넌트, 관계 수립 컴포넌트, 스코어 계산 컴포넌트, 객체 순서화 컴포넌트 및 메모리를 포함하고, 상기 방법은,

상기 객체 순위화 컴포넌트에 의해 유형들을 상기 객체 수집 컴포넌트로 제공하는 단계 - 각각의 유형은 유형 특유의 속성을 가짐 -,

상기 객체 수집 컴포넌트에 의해 객체들을 식별하는 단계 - 각각의 객체는 유형에 관련됨 -,

각각의 유형에 대하여, 상기 관계 수립 컴포넌트에 의해 한 유형에 대하여 상기 한 유형에 관련된 객체들 사이의 관계들을 식별하고, 상기 한 유형에 대하여 상기 한 유형에 관련된 객체와 다른 유형들에 관련된 객체 사이의 관계들을 식별하는 단계,

각각의 유형에 대하여, 상기 스코어 계산 컴포넌트에 의해 그 유형에 대한 속성 값을 계산하는, 각각의 유형에 대한 함수를 이용하여, 상기 식별된 관계들에 기초하여 객체의 속성에 대한 값(value)을 계산하는 단계 - 상기 함수는,

으로 정의됨 -, 및

상기 객체 순위화 컴포넌트에 의해 상기 계산된 값들을 상기 메모리에 저장하는 단계

를 포함하는 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제