KR101130374B1 - 유형 내 및 유형 간 관계에 기초하여 객체들을 순위화하기위한 방법 및 시스템 - Google Patents

유형 내 및 유형 간 관계에 기초하여 객체들을 순위화하기위한 방법 및 시스템 Download PDF

Info

Publication number
KR101130374B1
KR101130374B1 KR1020050039981A KR20050039981A KR101130374B1 KR 101130374 B1 KR101130374 B1 KR 101130374B1 KR 1020050039981 A KR1020050039981 A KR 1020050039981A KR 20050039981 A KR20050039981 A KR 20050039981A KR 101130374 B1 KR101130374 B1 KR 101130374B1
Authority
KR
South Korea
Prior art keywords
type
objects
component
relationships
delete delete
Prior art date
Application number
KR1020050039981A
Other languages
English (en)
Other versions
KR20060047856A (ko
Inventor
벤유 즈항
후아-준 젱
웨이-잉 마
웬시 자이
즈헹 첸
Original Assignee
마이크로소프트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크로소프트 코포레이션 filed Critical 마이크로소프트 코포레이션
Publication of KR20060047856A publication Critical patent/KR20060047856A/ko
Application granted granted Critical
Publication of KR101130374B1 publication Critical patent/KR101130374B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/954Relational
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/955Object-oriented
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/962Entity-attribute-value
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Abstract

상이한 객체 유형의 객체들과의 관계들에 기초하여 객체들을 순위화하기 위한 방법 및 시스템이 제공된다. 순위화 시스템은 객체의 각 유형의 각 속성에 대한 방정식을 정의한다. 방정식들은 속성 값들을 정의하며, 속성과, 동일한 유형의 객체 및 상이한 유형의 객체들에 관련된 속성들 사이의 관계들에 기초한다. 순위화 시스템은 속성 값들이 해에 수렴할 때까지 방정식들을 사용하여 객체들에 대한 속성 값들을 반복적으로 계산한다. 그 후 순위화 시스템은 속성 값들에 기초하여 객체들을 순위화한다.
순위화, 관계, 동일한 유형, 상이한 유형

Description

유형 내 및 유형 간 관계에 기초하여 객체들을 순위화하기 위한 방법 및 시스템{METHOD AND SYSTEM FOR RANKING OBJECTS BASED ON INTRA-TYPE AND INTER-TYPE RELATIONSHIPS}
도 1은 일 실시예에서 순위화 시스템의 컴포넌트들을 도시하는 블럭도.
도 2는 일 실시예에서 객체 순위화 컴포넌트의 프로세싱을 도시하는 흐름도.
도 3은 일 실시예에서 관계 수립 컴포넌트의 프로세싱을 도시하는 흐름도.
도 4는 일 실시예에서 스코어 계산 컴포넌트의 프로세싱을 도시하는 흐름도.
<도면의 주요부분에 대한 부호의 설명>
101: 웹 사이트
102: 통신 링크
110: 순위화 시스템
111: 객체 순위화
112: 객체 수집
113: 관계 수립
114: 스코어 계산
115: 객체 순서화
본 발명은 일반적으로 객체들의 순위화(ranking), 특히 객체 관계들에 기초한 순위화에 관한 것이다.
구글(Google) 및 오버츄어(Overture)와 같은 많은 검색 엔진 서비스가 인터넷을 통해 액세스가능한 정보에 대한 검색을 제공한다. 이러한 검색 엔진 서비스들은 사용자들에게 관심있을 수 있는 웹 페이지와 같은 디스플레이 페이지들을 사용자들이 검색하도록 허용한다. 사용자가 검색 용어를 포함하는 검색 요청("질의"로도 언급됨)을 제출한 후, 검색 엔진 서비스는 그러한 검색 용어들에 관련될 수 있는 웹 페이지들을 식별한다. 관련 웹 페이지들을 신속히 식별하기 위하여, 검색 엔진 서비스는 웹 페이지에 대한 키워드의 매핑을 유지할 수 있다. 검색 엔진 서비스는 각 웹 페이지의 키워드들을 추출하기 위하여 웹(즉, 월드 와이드 웹)을 "크롤링(crawling)"함으로써 이러한 매핑을 생성할 수 있다. 웹을 크롤링하기 위하여, 검색 엔진 서비스는 루트 웹 페이지들의 리스트를 사용할 수 있으며, 그러한 루트 웹 페이지들을 통하여 액세스가능한 모든 웹 페이지들을 식별할 수 있다. 임의의 특정 웹 페이지의 키워드들은 헤드라인의 단어들, 웹 페이지의 메타데이터에서 제공된 단어들, 하이라이트된 단어들 등을 식별하는 것과 같은 다양한 공지된 정보 검색 기술을 사용하여 추출될 수 있다. 검색 엔진 서비스는 각 매치의 근접성, 웹 페이지 인기도(예를 들어, 구글의 PageRank) 등에 기초하여 각 웹 페이지가 검색 요청에 얼마나 관련있는지를 나타내는 관련성 스코어(relevance score)를 계 산할 수 있다. 그 후 검색 엔진 서비스는 웹 페이지로의 링크들을 웹 페이지들의 관련성에 기초한 순서로 사용자에게 디스플레이한다. 검색 엔진들은 더욱 일반적으로 임의의 컬렉션의 문서들에 있는 정보에 대한 검색을 제공할 수 있다. 예를 들어, 문서들의 컬렉션들은 모든 미국 특허, 모든 연방 법원 의견, 회사의 모든 보관 문서 등을 포함할 수 있다.
웹 페이지들을 순위화하기 위한 두 가지 공지된 기술은 PageRank와 HITS("Hyperlinked-Induced Topic Search")이다. PageRank는 웹 페이지들이 중요한 웹 페이지들로의 링크(즉, "아웃고잉 링크(outgoing link)")를 가질 것이라는 원리에 기초한다. 따라서, 웹 페이지의 중요성은 그 웹 페이지로 링크하는(즉, "인커밍 링크(incoming link)") 다른 웹 페이지들의 수 및 중요성에 기초한다. 단순한 형태로, 웹 페이지들 사이의 링크들이 행렬 A로 표현될 수 있고, Aij는 웹 페이지 i로부터 웹 페이지 j로의 아웃고잉 링크들의 수를 나타낸다. 웹 페이지 j에 대한 중요성 스코어 wj는 다음 방정식에 의해 표현될 수 있다.
Figure 112005025061777-pat00001
이 방정식은 다음 방정식에 기초한 반복적 계산에 의해 풀릴 수 있다.
Figure 112005025061777-pat00002
여기서 w는 웹 페이지들에 대한 중요성 스코어들의 벡터이고 AT의 주요 고유 벡터(principal eigenvector)이다.
HITS 기술은 부가적으로 다른 중요한 웹 페이지들로의 많은 링크들을 가지는 웹 페이지 자체가 중요할 수 있다는 원리에 기초한다. 따라서, HITS는 웹 페이지들의 "중요성"을 두 가지 관련 속성 - "허브(hub)" 및 "권한(authority)" - 으로 나눈다. 허브는 웹 페이지가 연결하는 웹 페이지들의 "권한" 스코어에 의해 측정되고, "권한"은 그 웹 페이지로 연결하는 웹 페이지들의 "허브" 스코어에 의해 측정된다. 질의와 독립적으로 웹 페이지들의 중요성을 계산하는 PageRank와는 대조적으로, HITS는 결과의 웹 페이지들, 및 뒤따르는 인커밍 및 아웃고잉 링크들에 의한 결과의 웹 페이지들에 관련되는 웹 페이지들에 기초하여 중요성을 계산한다. HITS는 검색 엔진 서비스에 질의를 제출하고, 그 결과의 웹 페이지들을 웹 페이지들의 초기 집합으로서 사용한다. HITS는 인커밍 링크들의 목적지인 웹 페이지들, 및 결과의 웹 페이지들의 아웃고잉 링크들의 소스인 웹 페이지들을 집합에 추가한다. 그 후 HITS는 반복적 알고리즘을 사용하여 각 웹 페이지의 권한 및 허브 스코어를 계산한다. 권한 및 허브 스코어들은 다음 방정식에 의해 표현될 수 있다.
Figure 112005025061777-pat00003
여기서 a(p)는 웹 페이지 p에 대한 권한 스코어를 나타내고 h(p)는 웹 페이지 p에 대한 허브 스코어를 나타낸다. HITS는 링크들을 표현하기 위하여 인접성 행렬(adjacency matrix) A를 사용한다. 인접성 행렬은 다음 방정식에 의해 표현된다.
Figure 112005025061777-pat00004
벡터 a 및 h는 집합에 있는 모든 웹 페이지의 권한 및 허브 스코어에 각각 대응하고, 다음 방정식들에 의해 표현될 수 있다.
Figure 112005025061777-pat00005
따라서, a 및 h는 행렬 ATA 및 AAT의 고유벡터들이다. HITS는 방문 횟수에 의해 측정된 것과 같은 웹 페이지의 인기도를 고려하도록 수정될 수도 있다. 웹 로그의 분석에 기초하여, 사용자가 웹 페이지 i로부터 웹 페이지 j로 이동할 때마다 인접성 행렬의 bij 증가될 수 있다.
이러한 웹 페이지 순위화 기술들은 주로 웹 페이지 자체의 속성들에 기초하여 순위화한다. 이러한 속성들은 한 웹 페이지로부터 또다른 웹 페이지로의 링크를 포함하고 한 웹 페이지로부터 또다른 웹 페이지로의 이동을 포함한다. 순위화 기술들은 웹 페이지들에 직접 관련되지 않는 속성들을 고려하지 않는다. 예를 들어, 웹 페이지의 중요성은 웹 페이지를 액세스하는 사용자들의 전문 기술이 고려될 때 더욱 정확하게 결정될 수 있다. 웹 페이지들에 직접 관련되지 않는 속성들에 기초하여 웹 페이지들의 중요성을 계산하기 위한 기술을 가지는 것이 바람직할 것이다. 더욱 일반적으로, 또다른 유형의 객체들(예를 들어, 사용자들)로의 관계에 기초하여 한 유형의 객체(예를 들어, 웹 페이지들)에 대한 스코어를 생성하는 것이 바람직할 것이다.
상이한 객체 유형의 객체들과의 관계에 기초하여 객체들을 순위화하기 위한 방법 및 시스템이 제공된다. 순위화 시스템은 객체의 각 유형의 각 속성에 대한 방정식을 정의한다. 방정식들은 속성 값들을 정의하며 속성과, 동일한 유형의 객체 및 상이한 유형의 객체들과 관련된 속성들 사이의 관계에 기초한다. 하나의 속성이 또다른 속성의 용어로 정의될 수 있고 반대도 마찬가지인 식으로 속성 값들은 서로 의존적일 수 있기 때문에, 방정식은 속성들의 재귀적 정의를 표현한다. 순위화 시스템은 속성 값들이 해(solution)에 수렴할 때까지 방정식을 사용하여 객체들에 대한 속성 값들을 반복적으로 계산한다. 그 후 순위화 시스템은 속성 값들에 기초하여 객체들을 순위화한다.
동일하거나 또다른 데이터 객체 유형의 데이터 객체들과의 관계에 기초하여 하나의 데이터 객체 유형의 데이터 객체들을 순위화하기 위한 방법 및 시스템이 제공된다. 일 실시예에서, 순위화 시스템은 다양한 데이터 객체 유형들의 데이터 객체들을 식별한다. 예를 들어, 하나의 데이터 객체 유형은 웹 페이지들일 수 있고, 또다른 데이터 객체 유형은 질의들일 수 있으며, 또다른 데이터 객체 유형은 사용자들일 수 있다. 각 데이터 객체 유형은 다양한 유형-특유의 속성들을 가질 수 있다. 예를 들어, 웹 페이지는 권한 속성을 가질 수 있고, 사용자는 전문기술 속성을 가질 수 있다. 웹 페이지의 권한 속성은 그 웹 페이지의 인커밍 링크들의 수에 기초할 수 있다. 사용자의 전문기술 속성은 사용자가 높은 권한 속성 값을 갖는 웹 페이지들을 액세스할 때 증가될 수 있다. 순위화 시스템은 데이터 객체들에 대 한 속성 값들을 계산하고 그들의 속성 값들에 기초하여 데이터 객체들을 순위화할 수 있다.
순위화 시스템은 각 객체가 단일 속성을 포함하도록 객체들의 "유형"을 정의한다. 예를 들어, 순위화 시스템은 웹 페이지의 권한 속성에 대응하는 유형 및 웹 페이지의 허브 속성에 대응하는 또다른 유형을 정의할 수 있다. 따라서, 두 유형이 동일한 기본 데이터 객체(예를 들어, 웹 페이지)를 표현할 수 있다. 순위화 시스템은 유형 내 관계(intra-type relationship)로 불리는 동일한 유형의 객체들 사이, 및 유형 간 관계(inter-type relationship)로 불리는 상이한 유형의 객체들 사이의 다양한 관계를 결정한다. 예를 들어, 질의가 제출되면, 순위화 시스템은 권위 유형의 객체들로서 결과들을 사용할 수 있고, 전문기술 유형의 객체들로서 웹 페이지들을 액세스한 사용자들을 식별하기 위하여 웹 로그를 사용할 수 있다. 권한 유형의 유형 내 관계 객체들은 웹 페이지들의 인커밍 링크 및 아웃고잉 링크 관계를 포함할 수 있다. 예를 들어, 만약 웹 페이지가 또다른 웹 페이지로의 링크를 가진다면, 그 웹 페이지는 나머지 웹 페이지로의 아웃고잉 링크 관계를 가지고, 나머지 웹 페이지는 그 웹 페이지로의 인커밍 링크 관계를 가진다. 권한 유형과 전문기술 유형의 객체 사이의 유형 간 관계들은 웹 페이지들로의 사용자 액세스에 기초할 수 있다. 예를 들어, 만약 사용자가 웹 페이지를 액세스한다면, 웹 페이지와 사용자는 액세스 관계를 가진다. 순위화 시스템은 유형 내 관계들을 사용하여 그리고 다른 유형의 객체들의 속성 값들과 결합된 유형 간 관계들을 사용하여 특정 유형의 객체들에 대한 속성들에 대한 값들을 유도한다. 예를 들어, 순위화 시스템 은 웹 페이지의 권한 및 허브 속성과 사용자들의 전문기술 속성을 유도하기 위하여 인커밍 및 아웃고잉 링크 관계 및 사용자 액세스 관계를 사용할 수 있다.
일 실시예에서, 순위화 시스템은 선형 방정식(linear equation)과 같은 방정식들의 집합을 사용하여 관계 및 속성을 표현한다. 순위화 시스템은 또다른 유형의 속성 값들에 기초하여 재귀적으로 정의될 수 있는 선형 방정식을 사용하여 각 유형의 속성 값들을 표현한다. 예를 들어, 권한 속성에 대한 선형 방정식은 전문기술 속성의 속성 값들에 기초하여 정의될 수 있고, 반대도 마찬가지이다. 선형 방정식들이 재귀적으로 정의될 수 있기 때문에, 순위화 시스템은 속성 값들이 해에 수렴할 때까지 각 선형 방정식의 속성 값들을 재귀적으로 계산함으로써 선형 방정식들을 푼다. 선형 방정식들을 푼 후에, 순위화 시스템은 속성 값들에 기초하여 데이터 객체들을 순위화할 수 있다. 예를 들어, 순위화 시스템은 권한 속성 값들에 기초하여 웹 페이지들을 순위화할 수 있다.
순위화 시스템은 객체들의 유형 내 및 유형 간 관계들에 기초하여 객체들에 대한 속성 값들을 표현한다. 속성의 값은 다음 방정식에 의해 표현될 수 있다.
Figure 112005025061777-pat00006
여기서 Fi는 객체 i와 관련된 속성 값을 나타내고, Ri는 객체 i의 유형의 객체들 사이의 유형 내 관계들을 나타내며, Rji는 객체 i의 유형의 객체들과 기타 유형들 j 사이의 유형 간 관계들을 나타낸다. 두 가지 유형의 객체들 x={x1,x2,...,xm}, y={y1,y2,...,yn}이 있다면, 그들의 유형 내 관계들은 Rx 및 RY로 표현될 수 있고, 그들의 유형 간 관계들은 RXY 및 RYX로 표현될 수 있다. 순위화 시스템은 관계 정보를 표현하기 위하여 인접성 행렬을 사용한다. LX 및 LY는 각각 집합 X 및 Y 내에서 유형 내 관계들의 인접성 행렬들을 나타낸다. LXY 및 LYX는 X에 있는 객체들로부터 Y에 있는 객체들로의 유형 간 관계의 인접성 행렬 및 Y에 있는 객체들로부터 X에 있는 객체들로의 유형 간 관계의 인접성 행렬을 각각 나타낸다. 순위화 시스템은 다음에 의해 인접성 행렬을 나타낸다.
Figure 112005025061777-pat00007
여기서 LXY(i,j)는 집합 X에 있는 객체 i로부터 집합 Y에 있는 객체 j로의 관계("링크"로도 불림)가 존재하는지를 나타낸다. 속성 값들에 대한 선형 방정식들이 다음 방정식들로서 표현될 수 있다.
Figure 112005025061777-pat00008
(1)
여기서 wx는 X에 있는 객체들의 속성 벡터이고, wy는 Y에 있는 객체들의 속성 벡터이다. 방정식 1은 다음 형태로 일반화될 수 있다.
Figure 112005025061777-pat00009
(2)
여기서 M은 속성 벡터들의 행렬을 나타낸다.
객체들 사이에 서로 보충하는 관계들이 객체들에 부적당한 속성 값들을 제공 할 수 있기 때문에, 순위화 시스템은 하나의 인접성 행렬에서 한 객체가 n 개의 다른 객체들에 관련된다면, 객체에 관련된 각각은 속성 값의 1/nth을 얻는 방식으로 이진(binary) 인접성 행렬들을 정규화할 수 있다. 순위화 시스템은 랜덤 관계들을 시뮬레이트하기 위하여 PageRank의 랜덤 서퍼 모델(random surfer model)을 또한 도입할 수 있고, 따라서 하기에 기술된 바와 같이 계산하는 동안 싱크 노드(sink node)들을 피할 수 있다. 또한, 상이한 유형들로부터의 속성들은 각 기타 속성에 상이한 중요성을 가질 수 있기 때문에, 순위화 시스템은 유형들의 각 조합에 대하여 가중치들을 사용할 수 있다. 따라서, 순위화 시스템은 다음 방정식에 의하여 속성 값들을 표현하기 위하여 정규화, 랜덤 서퍼 모델, 및 가중치를 고려할 수 있다.
Figure 112005025061777-pat00010
(3)
여기서 U는 균등 전이 확률(uniform transition probability)의 전이 행렬(모든 i, j에 대하여 uij=1/n ; n은 데이터 스페이스 N에 있는 객체들의 총 개수임)을 나타내고, LM 및 LNM은 정규화된 인접성 행렬들이며, δ 및 ε는 행렬 LM 및 LNM에서 랜덤 관계들을 시뮬레이트하기 위하여 사용된 스무딩 팩터(smoothing factor)이며, αM 및 βNM은 관계들의 가중치들을 나타낸다. 순위화 시스템은 방정식 3이 수 렴할 때까지 반복적으로 계산한다. 방정식 3은 다음 방정식에 의해 표현되는 통합 정방 행렬(unified square matrix) A에 의해 표현될 수 있다.
Figure 112005025061777-pat00011
(4)
행렬 A는 대각선에 L'M을 가지고, 통합 행렬의 다른 부분들에는 L'NM을 가진다. 순위화 시스템은 행렬 A를 사용하여 상이한 데이터 스페이스들에 있는 모든 데이터 객체들의 속성 벡터인 벡터 w를 변환하기 위하여 반복적 접근법(예를 들어, w=ATw)을 사용한다. 반복이 수렴하면, 벡터 w는 행렬 A의 주요 고유벡터이다.
M 및 N이 이종 데이터 스페이스일 때, 순위화 시스템은 관계 없음(no relationship)을 나타내기 위하여 랜덤 관계를 사용한다. M에 있는 객체가 N에 있는 임의의 객체들에 링크하는 관계를 갖지 않으면, 부행렬(sub-matrix) L'NM T는 0이 될 것이며, 계산들에 의해 모든 속성 값을 할당받을 수 있는 "싱크 노드(sink node)"로 될 것이다. 이것을 방지하기 위하여, 순위화 시스템은 부행렬 L'NM T의 대응하는 행에 있는 모든 구성요소들을 1/n로 설정하는데, 여기서 n은 데이터 스페이스 N에 있는 객체들의 총 개수이다. 대안적으로, 순위화 시스템은 바람직하지 않은 유형 내 및 유형 간 관계들에 대해 대응하는 가중치들을 0으로 설정할 수 있다. 그러나, 만약 βMN이 0보다 크면, 반복적 계산이 수렴하려면 βNM이 0보다 커야할 필 요가 있다. 따라서, L'NM T의 관계가 바람직하지 않다면, 순위화 시스템은 L'NM T의 영향을 감소시키기 위하여 βNM을 매우 작은 양수 가중치로 설정한다.
모든 인접성 행렬들을 사용하여 통합 행렬을 구성함으로써, 순위화 시스템은 상이한 유형들의 객체들을 포함하는 통합 데이터 스페이스를 구성한다. 따라서, 이전의 유형 간 관계들은 통합 스페이스에서 유형 내 관계들로서 고려될 수 있고, 순위화 시스템은 단일 데이터 스페이스에서 링크 분석으로 효율적으로 귀결한다.
도 1은 일 실시예에서 순위화 시스템의 컴포넌트들을 도시하는 흐름도이다. 순위화 시스템(110)은 통신 링크(102)를 통해 다양한 웹 사이트(101)에 연결된다. 순위화 시스템은 객체 수집 컴포넌트(112)를 인보크하는 객체 순위화 컴포넌트(111), 관계 수립 컴포넌트(113), 스코어 계산 컴포넌트(114), 및 객체들을 순위화하기 위한 객체 순서화 컴포넌트(115)를 포함한다. 객체 순위화 컴포넌트는 웹 페이지들의 집합을 수신하고 유형 내 및 유형 간 관계들에 기초하여 웹 페이지들을 순위화할 수 있다. 객체 수집 컴포넌트는 다양한 유형의 객체들에 관련된 관계 정보를 검색한다. 예를 들어, 객체 수집 컴포넌트는 어떤 사용자들이 어떤 웹 페이지들을 액세스하는지를 식별하기 위하여 웹 사이트들의 웹 로그를 액세스할 수 있다. 관계 수립 컴포넌트는 유형 내 및 유형 간 관계 행렬들을 생성한다. 예를 들어, 관계 행렬은 사용자들을 그들이 액세스하는 웹 페이지들에 매핑할 수 있다. 스코어 계산 컴포넌트는 속성 값이 해에 수렴할 때까지 방정식 3을 사용하여 속성 값들을 재귀적으로 계산한다. 객체 순서화 컴포넌트는 속성 값들에 기초하여 데이 터 객체들을 정렬한다. 예를 들어, 객체 순서화 컴포넌트는 웹 페이지들을 정렬하기 위하여 웹 페이지에 대한 권한 속성의 값을 사용할 수 있다.
순위화 시스템이 구현될 수 있는 컴퓨팅 장치는 중앙 처리 장치, 메모리, 입력 장치(예를 들어, 키보드 및 포인팅 장치), 출력 장치(예를 들어, 디스플레이 장치), 및 저장 장치(예를 들어, 디스크 드라이브)를 포함할 수 있다. 메모리 및 저장 장치들은 순위화 시스템을 구현하는 명령어들을 포함할 수 있는 컴퓨터 판독가능 매체이다. 또한, 데이터 구조 및 메시지 구조들이 저장되거나 통신 링크상의 신호와 같은 데이터 전송 매체를 통해 전송될 수 있다. 인터넷, LAN, WAN, 또는 점대점 전화 연결과 같은 다양한 통신 링크들이 사용될 수 있다.
순위화 시스템은 다양한 운영 환경에서 구현될 수 있다. 사용에 적합할 수 있는 다양한 공지된 컴퓨팅 시스템, 환경 및 구성은 개인용 컴퓨터, 서버 컴퓨터, 포켓형 또는 랩탑 장치, 멀티프로세서 시스템, 마이크로프로세서 기반 시스템, 프로그래밍 가능한 가전기기, 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, 상기 시스템 또는 장치들 중 임의의 것을 포함하는 분산 컴퓨팅 환경 등을 포함한다.
순위화 시스템은 프로그램 모듈과 같이 하나 이상의 컴퓨터 또는 기타 장치에 의해 실행될 수 있는 컴퓨터 실행가능 명령어들의 일반적인 문맥으로 기술될 수 있다. 일반적으로, 프로그램 모듈은 특정 태스크를 수행하거나 특정 추상 데이터 유형을 구현하는 루틴, 프로그램, 객체, 컴포넌트, 데이터 구조 등을 포함한다. 전형적으로, 프로그램 모듈의 기능은 다양한 실시예에서 원하는 대로 결합되거나 분산될 수 있다.
도 2는 일 실시예에서 객체 순위화 컴포넌트의 프로세싱을 도시하는 흐름도이다. 컴포넌트는 객체 정보를 수집하고, 객체들 사이의 관계를 수립하고, 객체들에 대한 속성 값들을 계산하며, 속성에 기초하여 객체들을 순서화한다. 블럭(201)에서, 컴포넌트는 다양한 객체들에 관련된 정보를 수집한다. 블럭(202)에서, 컴포넌트는 인접성 행렬들을 생성하기 위하여 관계 수립 컴포넌트를 인보크한다. 관계 수립 컴포넌트는 α 및 β 가중치들을 검색하고 조정할 수도 있다. 블럭(203)에서, 컴포넌트는 해에 수렴할 때까지 속성 값들을 반복적으로 계산하기 위하여 스코어 계산 컴포넌트를 인보크한다. 블럭(204)에서, 컴포넌트는 속성의 값에 기초하여 데이터 객체들을 순서화한다. 예를 들어, 컴포넌트는 권한 속성에 기초하여 웹 페이지들을 순서화할 수 있다.
도 3은 일 실시예에서 관계 수립 컴포넌트의 프로세싱을 도시하는 흐름도이다. 블럭들(301-303)에서, 컴포넌트는 각 유형에 대한 인접성 행렬들을 수립하기 위하여 루핑한다. 블럭(301)에서, 컴포넌트는 다음 유형을 선택한다. 결정 블럭(302)에서, 모든 유형이 이미 선택되었다면 컴포넌트는 리턴하고, 그렇지 않으면 컴포넌트는 블럭(303)에서 계속된다. 블럭(303)에서, 컴포넌트는 선택된 유형의 객체들과 모든 유형의 객체들 사이의 관계들을 수립한다. 예를 들어, 컴포넌트는 권한 유형과 허브 유형, 및 권한 유형과 전문기술 유형 사이의 관계를 수립할 것이다. 그 후 컴포넌트는 다음 유형을 선택하기 위하여 블럭(301)으로 루핑한다.
도 4는 일 실시예에서 스코어 계산 컴포넌트의 프로세싱을 도시하는 흐름도이다. 컴포넌트는 속성 값들이 수렴할 때까지 방정식을 반복적으로 계산한다. 블 럭(401)에서, 컴포넌트는 인접성 행렬들에 의해 표현된 객체 관계들을 검색한다. 블럭(402)에서, 컴포넌트는 유형 내 및 유형 간 관계들에 대한 가중치들 α 및 β를 검색한다. 블럭(403)에서, 컴포넌트는 그 유형의 각 객체에 대해 동일한 속성 값을 갖기 위하여 각 유형에 대한 벡터 w를 초기화한다. 컴포넌트는 각 값을 1/m로 설정할 수 있는데, 여기서 m은 그 유형의 객체들의 개수이다. 예를 들어, 만약 10명의 사용자가 있다면, 컴포넌트는 전문기술 유형에 대한 초기 속성 값들을 1/10로 설정한다. 컴포넌트는 또한 각 유형에 대한 차이 변수(difference variable)를 큰 값으로 초기화하여 결정 블럭(405)의 테스트를 초기에 통과할 것이다. 컴포넌트는 계산들이 해에 수렴하는지를 결정하기 위한 각 반복의 끝에서 각 차이 변수에 대한 새로운 값을 계산한다. 블럭들(404-409)에서, 컴포넌트는 계산들이 해에 수렴할 때까지 방정식 3의 계산을 수행한다. 블럭(404)에서, 컴포넌트는 다음 반복을 시작한다. 결정 블럭(405)에서, 만약 마지막 반복 동안 계산된 차이들의 합이 차이 임계값보다 작으면, 계산들은 해에 수렴하고 컴포넌트는 리턴하며, 그렇지 않으면 컴포넌트는 블럭(406)에서 계속된다. 블럭(406)에서, 컴포넌트는 다음 유형을 선택한다. 결정 블럭(407)에서, 모든 유형이 이미 선택되었다면, 컴포넌트는 다음 반복을 시작하기 위하여 블럭(404)으로 루핑하고, 그렇지 않으면 컴포넌트는 블럭(408)에서 계속된다. 블럭(408)에서, 컴포넌트는 이전의 반복에서 계산된 값들에 기초하여 선택된 유형에 대한 값들을 계산한다. 블럭(409)에서, 컴포넌트는 선택된 유형에 대하여 이번 반복의 값들과 이전 반복의 값들 사이의 차이를 계산한다. 그 후 컴포넌트는 다음 유형을 선택하기 위하여 블럭(406)으로 루핑한다.
예시의 목적으로 본 발명에서는 순위화 시스템의 특정 실시예들이 기술되었지만 본 발명의 취지 및 범위를 벗어나지 않고서 다양한 변경이 행해질 수 있다는 점을 본 분야에서 숙련된 기술을 가진 자들은 잘 알 것이다. 예를 들어, 본 분야에서 숙련된 기술을 가진 자들은 속성 값들을 표현하기 위하여 비선형 방정식들이 사용될 수 있다는 것을 잘 알 것이다. 또한, 순위화 시스템은 서로 소정의 관계를 가지는 모든 유형의 객체들에 대해 사용될 수 있다. 예를 들어, 순위화 시스템은 학생 또는 지원자 및 교수와의 관계를 사용하는 "중요성"에 기초하여 대학을 순위화하기 위하여 사용될 수 있으며, 여기서 대학, 학생 및 교수는 상이한 유형의 객체들을 나타낸다. 따라서, 본 발명은 첨부되는 특허청구범위에 의해서를 제외하면 제한되지 않는다.
상이한 객체 유형의 객체들과의 관계들에 기초하여 객체들을 순위화하기 위한 방법 및 시스템이 제공된다.

Claims (35)

  1. 컴퓨터 시스템에서 객체들의 속성들에 대한 속성 값들을 결정하기 위한 방법으로서, 상기 컴퓨터 시스템은 객체 순위화 컴포넌트, 객체 수집 컴포넌트, 관계 수립 컴포넌트, 스코어 계산 컴포넌트, 객체 순서화 컴포넌트 및 메모리를 포함하고, 상기 방법은,
    상기 객체 순위화 컴포넌트에 의해 상기 객체 수집 컴포넌트로 유형들을 제공하는 단계 - 각각의 유형은 유형 특유의 속성(type-specific attribute)을 가짐 -,
    상기 객체 수집 컴포넌트에 의해 객체들을 식별하는 단계 - 각각의 객체는 유형에 관련됨 -,
    각각의 유형에 대하여, 상기 관계 수립 컴포넌트에 의해 한 유형에 대하여 상기 한 유형에 관련된 객체들 사이의 관계들을 식별하고, 상기 한 유형에 대하여 상기 한 유형에 관련된 객체와 다른 유형들에 관련된 객체 사이의 관계들을 식별하는 단계,
    각각의 유형에 대하여, 상기 스코어 계산 컴포넌트에 의해 그 유형에 대한 속성 값을 계산하는, 각각의 유형에 대한 함수를 이용하여, 상기 식별된 관계들에 기초하여 객체의 속성에 대한 값(value)을 계산하는 단계 - 상기 함수는,
    Figure 112011063903760-pat00020
    로서 정의되며, 여기서 Fi는 객체 i와 관련된 속성 값을 나타내고, Ri는 상기 객체 i의 유형의 객체들 사이의 유형 내 관계(intra-type relationship)들을 나타내며, Rji는 상기 객체 i의 유형의 객체들과 다른 유형들 j의 객체들 사이의 유형 간 관계(inter-type relationship)들을 나타냄 -, 및
    상기 객체 순위화 컴포넌트에 의해 상기 계산된 값들을 메모리에 저장하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서,
    상기 유형들은 인커밍 링크들의 개수에 기초한 권한 유형(authority type), 아웃고잉 링크들의 개수에 기초한 허브 유형(hub type), 및 사용자에 의해 액세스되는 웹 페이지들의 권한 속성들의 값들에 기초한 전문기술 유형(expertise type)을 포함하는 방법.
  3. 제1항에 있어서,
    동일한 유형의 객체들 사이의 관계들은 유형 내 관계들인 방법.
  4. 제1항에 있어서,
    상이한 유형들의 객체들 사이의 관계들은 유형 간 관계들인 방법.
  5. 제1항에 있어서, 상기 객체 순서화 컴포넌트에 의해 한 유형의 객체들을 그 속성 값들에 기초하여 순위화(ranking)하는 단계를 포함하는 방법.
  6. 제1항에 있어서, 상기 객체 순위화 컴포넌트에 의해 각각의 유형에 대하여, 그 유형의 속성 값들을 정의하는 이하와 같이 정의되는 방정식을 상기 스코어 계산 컴포넌트로 제공하는 단계
    Figure 112011063903760-pat00023
    를 포함하는 방법.
  7. 컴퓨터 시스템에서 객체의 속성 값을 결정하기 위한 방법으로서, 상기 컴퓨터 시스템은 객체 순위화 컴포넌트, 스코어 계산 컴포넌트 및 메모리를 포함하고,
    상기 객체 순위화 컴포넌트에 의해 한 유형의 객체들과 또다른 유형 특유의 속성을 갖는 또다른 유형의 객체들 사이의 관계들에 기초하여, 상기 한 유형의 객체들에 대한 유형 특유의 속성에 대한 속성 값들을 계산하는 함수를 상기 스코어 컴포넌트로 제공하는 단계 - 상기 제공된 함수는 상기 한 유형의 객체들 사이의 관계들에 또한 기초하여 속성 값들을 계산하며,
    상기 함수는
    Figure 112011063903760-pat00012
    이며, 여기서 Fi는 객체 i와 관련된 속성 값을 나타내고, Ri는 상기 객체 i의 유형의 객체들 사이의 유형 내 관계들을 나타내며, Rji는 상기 객체 i의 유형의 객체들과 다른 유형들 j의 객체들 사이의 유형 간 관계들을 나타냄 -,
    상기 객체 순위화 컴포넌트에 의해 상기 한 유형의 객체들과 나머지 유형의 객체들 사이의 관계들을 명기(specifying)하는 데이터를 수신하는 단계,
    상기 스코어 계산 컴포넌트에 의해 상기 한 유형의 객체들의 속성 값들을 결정하기 위하여 상기 제공된 함수를 계산하는 단계, 및
    상기 객체 순위화 컴포넌트에 의해 상기 결정된 속성 값들을 상기 메모리에 저장하는 단계
    를 포함하는 방법.
  8. 제7항에 있어서, 상기 객체 순위화 컴포넌트에 의해 다른 유형의 객체들에 대한 유형 특유의 속성에 대한 속성 값들을 계산하기 위한 함수를 제공하는 단계를 포함하는 방법.
  9. 방법에 의해, 객체들의 속성 값들을 결정하기 위하여 컴퓨터 시스템을 제어하기 위한 명령어들을 포함하는 컴퓨터 판독가능 기록 매체로서, 상기 컴퓨터 시스템은 객체 순위화 컴포넌트, 스코어 계산 컴포넌트 및 메모리를 포함하고, 상기 방법은,
    상기 객체 순위화 컴포넌트에 의해 제1 유형의 객체들과 제2 유형 특유의 속성을 가지는 제2 유형의 객체들 사이의 관계들에 기초하여 상기 제1 유형의 객체들에 대한 제1 유형 특유의 속성에 대한 속성 값들을 계산하는 제1 함수를 상기 스코어 계산 컴포넌트로 제공하는 단계,
    상기 객체 순위화 컴포넌트에 의해 상기 제2 유형의 객체들에 대한 상기 제2 유형 특유의 속성에 대한 속성 값들을 계산하는 제2 함수를 상기 스코어 계산 컴포넌트로 제공하는 단계,
    상기 객체 순위화 컴포넌트에 의해 상기 제1 유형의 객체들과 상기 제2 유형의 객체들 사이의 관계들을 명기하는 데이터를 수신하는 단계,
    상기 스코어 계산 컴포넌트에 의해 상기 제1 유형 및 상기 제2 유형의 객체들의 속성 값들을 결정하는 상기 제공된 함수들을 계산하는 단계, 및
    상기 객체 순위화 컴포넌트에 의해 상기 결정된 속성값들을 상기 메모리에 저장하는 단계
    를 포함하고,
    상기 함수들은
    Figure 112011063903760-pat00021
    로서 정의되며, 여기서 Fi는 객체 i와 관련된 속성 값을 나타내고, Ri는 상기 객체 i의 유형의 객체들 사이의 유형 내 관계들을 나타내며, Rji는 상기 객체 i의 유형의 객체들과 다른 유형들 j의 객체들 사이의 유형 간 관계들을 나타내는 컴퓨터 판독가능 기록 매체.
  10. 제9항에 있어서,
    상기 제2 함수는 상기 제2 유형의 객체들 사이의 관계에 기초하여 상기 속성 값들을 계산하는 컴퓨터 판독가능 기록 매체.
  11. 제9항에 있어서,
    상기 제1 함수는 또한 상기 제1 유형의 객체들 사이의 관계에 기초하여 상기 속성 값들을 계산하는 컴퓨터 판독가능 기록 매체.
  12. 제9항에 있어서,
    상기 제2 함수는 상기 제1 유형의 객체의 속성 값들에 기초하여 속성 값들을 계산하는 컴퓨터 판독가능 기록 매체.
  13. 제9항에 있어서,
    상기 함수들은 재귀적으로 정의되는 컴퓨터 판독가능 기록 매체.
  14. 제9항에 있어서,
    상기 함수들은 선형 방정식들을 나타내는 컴퓨터 판독가능 기록 매체.
  15. 컴퓨터 시스템에서 객체들의 속성들에 대한 속성 값들을 결정하기 위한 방법으로서, 상기 컴퓨터 시스템은 객체 순위화 컴포넌트, 객체 수집 컴포넌트, 관계 수립 컴포넌트, 스코어 계산 컴포넌트, 객체 순서화 컴포넌트 및 메모리를 포함하고, 상기 방법은,
    상기 객체 순위화 컴포넌트에 의해 유형들을 상기 객체 수집 컴포넌트로 제공하는 단계 - 각각의 유형은 유형 특유의 속성을 가짐 -,
    상기 객체 수집 컴포넌트에 의해 객체들을 식별하는 단계 - 각각의 객체는 유형에 관련됨 -,
    각각의 유형에 대하여, 상기 관계 수립 컴포넌트에 의해 한 유형에 대하여 상기 한 유형에 관련된 객체들 사이의 관계들을 식별하고, 상기 한 유형에 대하여 상기 한 유형에 관련된 객체와 다른 유형들에 관련된 객체 사이의 관계들을 식별하는 단계,
    각각의 유형에 대하여, 상기 스코어 계산 컴포넌트에 의해 그 유형에 대한 속성 값을 계산하는, 각각의 유형에 대한 함수를 이용하여, 상기 식별된 관계들에 기초하여 객체의 속성에 대한 값(value)을 계산하는 단계 - 상기 함수는,
    Figure 112011063903760-pat00022
    으로 정의됨 -, 및
    상기 객체 순위화 컴포넌트에 의해 상기 계산된 값들을 상기 메모리에 저장하는 단계
    를 포함하는 방법.
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
KR1020050039981A 2004-05-14 2005-05-13 유형 내 및 유형 간 관계에 기초하여 객체들을 순위화하기위한 방법 및 시스템 KR101130374B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/846,835 US7346621B2 (en) 2004-05-14 2004-05-14 Method and system for ranking objects based on intra-type and inter-type relationships
US10/846,835 2004-05-14

Publications (2)

Publication Number Publication Date
KR20060047856A KR20060047856A (ko) 2006-05-18
KR101130374B1 true KR101130374B1 (ko) 2012-04-12

Family

ID=34939836

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050039981A KR101130374B1 (ko) 2004-05-14 2005-05-13 유형 내 및 유형 간 관계에 기초하여 객체들을 순위화하기위한 방법 및 시스템

Country Status (10)

Country Link
US (1) US7346621B2 (ko)
EP (1) EP1596315A1 (ko)
JP (1) JP4965086B2 (ko)
KR (1) KR101130374B1 (ko)
CN (1) CN1716259B (ko)
AU (1) AU2005202017A1 (ko)
BR (1) BRPI0503929A (ko)
CA (1) CA2507337C (ko)
MX (1) MXPA05005208A (ko)
RU (1) RU2387005C2 (ko)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005022403A1 (en) * 2003-08-27 2005-03-10 Sox Limited Method of building persistent polyhierarchical classifications based on polyhierarchies of classification criteria
US7346621B2 (en) 2004-05-14 2008-03-18 Microsoft Corporation Method and system for ranking objects based on intra-type and inter-type relationships
US7437382B2 (en) * 2004-05-14 2008-10-14 Microsoft Corporation Method and system for ranking messages of discussion threads
US9286387B1 (en) * 2005-01-14 2016-03-15 Wal-Mart Stores, Inc. Double iterative flavored rank
EP1691277B1 (en) * 2005-02-11 2009-06-24 Sap Ag Context menu providing dependency relationships for objects of different type
JP4421502B2 (ja) * 2005-03-25 2010-02-24 株式会社東芝 文書管理システム
US7921106B2 (en) * 2006-08-03 2011-04-05 Microsoft Corporation Group-by attribute value in search results
US8195734B1 (en) 2006-11-27 2012-06-05 The Research Foundation Of State University Of New York Combining multiple clusterings by soft correspondence
US7849104B2 (en) * 2007-03-01 2010-12-07 Microsoft Corporation Searching heterogeneous interrelated entities
US7552131B2 (en) * 2007-03-05 2009-06-23 International Business Machines Corporation Autonomic retention classes
JP4781466B2 (ja) * 2007-03-16 2011-09-28 富士通株式会社 文書重要度算出プログラム
US7636715B2 (en) * 2007-03-23 2009-12-22 Microsoft Corporation Method for fast large scale data mining using logistic regression
US9535810B1 (en) 2007-04-24 2017-01-03 Wal-Mart Stores, Inc. Layout optimization
US7953724B2 (en) * 2007-05-02 2011-05-31 Thomson Reuters (Scientific) Inc. Method and system for disambiguating informational objects
US9183290B2 (en) * 2007-05-02 2015-11-10 Thomas Reuters Global Resources Method and system for disambiguating informational objects
US20090083048A1 (en) * 2007-09-21 2009-03-26 Mandelbaum Steven J System and method for providing an application service
US8862608B2 (en) * 2007-11-13 2014-10-14 Wal-Mart Stores, Inc. Information retrieval using category as a consideration
KR100975502B1 (ko) * 2008-01-30 2010-08-11 엔에이치엔(주) 블로그 포스트의 랭킹 판단 방법 및 시스템
WO2009107412A1 (ja) * 2008-02-27 2009-09-03 日本電気株式会社 グラフ構造推定装置、グラフ構造推定方法およびプログラム
WO2009107416A1 (ja) * 2008-02-27 2009-09-03 日本電気株式会社 グラフ構造変化検出装置、グラフ構造変化検出方法およびプログラム
US8140550B2 (en) * 2008-08-20 2012-03-20 Satyam Computer Services Limited Of Mayfair Centre System and method for bounded analysis of multimedia using multiple correlations
US8650195B2 (en) * 2010-03-26 2014-02-11 Palle M Pedersen Region based information retrieval system
US8490056B2 (en) * 2010-04-28 2013-07-16 International Business Machines Corporation Automatic identification of subroutines from test scripts
US8533319B2 (en) * 2010-06-02 2013-09-10 Lockheed Martin Corporation Methods and systems for prioritizing network assets
US8538949B2 (en) * 2011-06-17 2013-09-17 Microsoft Corporation Interactive web crawler
CN103425711B (zh) * 2012-05-25 2017-08-25 株式会社理光 基于多对象实例的对象值对齐方法
JP5928248B2 (ja) * 2012-08-27 2016-06-01 富士通株式会社 評価方法、情報処理装置およびプログラム
US9501503B2 (en) * 2013-05-09 2016-11-22 Microsoft Technology Licensing, Llc Inferring entity attribute values
KR101761999B1 (ko) 2014-06-12 2017-07-28 경희대학교 산학협력단 관계 유형을 고려한 코칭 방법 및 시스템
CN112114941A (zh) * 2019-06-19 2020-12-22 中国移动通信集团浙江有限公司 数据作业的评价方法、装置及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001022279A1 (fr) 1999-09-24 2001-03-29 France Telecom Procede de classification thematique de documents, module de classification thematique et moteur de recherche incorporant un tel module
US6601075B1 (en) * 2000-07-27 2003-07-29 International Business Machines Corporation System and method of ranking and retrieving documents based on authority scores of schemas and documents

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7346621B2 (en) 2004-05-14 2008-03-18 Microsoft Corporation Method and system for ranking objects based on intra-type and inter-type relationships

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001022279A1 (fr) 1999-09-24 2001-03-29 France Telecom Procede de classification thematique de documents, module de classification thematique et moteur de recherche incorporant un tel module
US6601075B1 (en) * 2000-07-27 2003-07-29 International Business Machines Corporation System and method of ranking and retrieving documents based on authority scores of schemas and documents

Also Published As

Publication number Publication date
MXPA05005208A (es) 2005-12-06
US7346621B2 (en) 2008-03-18
US20050256832A1 (en) 2005-11-17
JP2005327293A (ja) 2005-11-24
CA2507337C (en) 2013-04-23
KR20060047856A (ko) 2006-05-18
JP4965086B2 (ja) 2012-07-04
AU2005202017A1 (en) 2005-12-01
CN1716259B (zh) 2012-05-23
CN1716259A (zh) 2006-01-04
CA2507337A1 (en) 2005-11-14
RU2387005C2 (ru) 2010-04-20
RU2005114665A (ru) 2006-11-20
EP1596315A1 (en) 2005-11-16
BRPI0503929A (pt) 2007-01-23

Similar Documents

Publication Publication Date Title
KR101130374B1 (ko) 유형 내 및 유형 간 관계에 기초하여 객체들을 순위화하기위한 방법 및 시스템
KR101130533B1 (ko) 이종 관계에 기초하여 객체들의 유사성을 결정하기 위한방법 및 시스템
JP2005327293A5 (ko)
US7577650B2 (en) Method and system for ranking objects of different object types
CN100573513C (zh) 用于排列搜索结果的文档以改进多样性和信息丰富度的方法和系统
US6738678B1 (en) Method for ranking hyperlinked pages using content and connectivity analysis
KR20080106192A (ko) 라벨링된 다튜먼트로부터 언라벨링된 다큐먼트로의 관련성 전파 시스템, 및 컴퓨터 판독가능 매체
JP2012069171A (ja) 階層を考慮したウェブページのランク付け
US20070198504A1 (en) Calculating level-based importance of a web page
Kumari et al. Comparative study of page rank and weighted page rank algorithm
Bidoni et al. A generalization of the pagerank algorithm
Choudhary et al. Role of ranking algorithms for information retrieval
CN110162580A (zh) 基于分布式预警平台的数据挖掘与深度分析方法及应用
Xiao et al. Clustering web-search results using transduction-based relevance model
Jain et al. A survey on web page ranking algorithms
Pawar et al. Effective utilization of page ranking and HITS in significant information retrieval
Ma et al. Matching query processing in high-dimensional space
Kumar et al. Review of link structure based ranking algorithms and hanging pages
Gholap et al. An Effective Information Retrieval System Using Keyword Search Technique
Rawat et al. Study of Web Page Rank algorithms
Jain et al. Web Structure Mining using Link Analysis Algorithms
Jayanthi et al. Segregating unique service object from multi-web sources for effective visualization
Du et al. PerturbationRank: A Non-monotone Ranking Algorithm
Ola et al. MODIFIED PAGE RANKING SYSTEM
Srivastava et al. International Journal of Emerging Technologies in Computational and Applied Sciences (IJETCAS) www. iasir. net

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee