KR20090117109A - 랭킹 장치 및 그 방법과, 온톨로지에 기반한 시맨틱 검색랭킹 시스템 및 그 방법 - Google Patents

랭킹 장치 및 그 방법과, 온톨로지에 기반한 시맨틱 검색랭킹 시스템 및 그 방법 Download PDF

Info

Publication number
KR20090117109A
KR20090117109A KR1020080043012A KR20080043012A KR20090117109A KR 20090117109 A KR20090117109 A KR 20090117109A KR 1020080043012 A KR1020080043012 A KR 1020080043012A KR 20080043012 A KR20080043012 A KR 20080043012A KR 20090117109 A KR20090117109 A KR 20090117109A
Authority
KR
South Korea
Prior art keywords
triple
ranking
importance
ontology
calculating
Prior art date
Application number
KR1020080043012A
Other languages
English (en)
Inventor
박석근
유치훈
최호준
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020080043012A priority Critical patent/KR20090117109A/ko
Publication of KR20090117109A publication Critical patent/KR20090117109A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web

Abstract

본 발명은 랭킹 장치 및 그 방법과, 그를 이용한 온톨로지에 기반한 시맨틱 검색 랭킹 시스템 및 그 방법에 관한 것으로, 웹 문서를 기반으로 제작된 온톨로지 정보인 개념(Concept)과 관계(Relationship) 정보와 웹 문서 검색 이용자로부터의 질의 정보(질의어)를 기반으로 선택된 온톨로지 부분 그래프의 랭킹(우선순위)을 정하고, 상기 랭킹된 온톨로지 부분 그래프를 기반으로 생성된 트리플의 랭킹(우선순위)를 정하고, 상기 랭킹된 트리플을 기반으로 웹 문서를 검색한 후 검색 결과 문서의 랭킹(우선순위)을 정하기 위한, 랭킹 장치 및 그 방법과, 그를 이용한 온톨로지에 기반한 시맨틱 검색 랭킹 시스템 및 그 방법을 제공하고자 한다.
이를 위하여, 본 발명은 시맨틱 검색 랭킹 시스템에 있어서, 온톨로지의 개념(Concept)과 관계(Relationship) 정보, 검색 이용자로부터의 질의 정보를 이용하여 선택된 부분 그래프 집합에 대해 각 부분 그래프의 우선순위를 결정하기 위한 부분 그래프 랭킹 수단; 상기 부분 그래프 랭킹 수단에서 우선순위가 결정된 부분 그래프 집합을 기반으로 변환된 트리플 집합에 대해 각 트리플의 우선순위를 결정하기 위한 트리플 랭킹 수단; 및 상기 트리플 랭킹 수단에서 우선순위가 결정된 트리플 집합을 기반으로 검색된 검색 결과 집합에 대해 각 검색 결과의 우선순위를 결정하기 위한 검색 결과 랭킹 수단을 포함한다.
시맨틱 검색 랭킹, 시맨틱 웹, 온톨로지, 부분 그래프, 트리플, 부분 그래프 랭킹, 트리플 랭킹, 문서 랭킹, 요소 가중치, 중요도 계산

Description

랭킹 장치 및 그 방법과, 온톨로지에 기반한 시맨틱 검색 랭킹 시스템 및 그 방법{Ranking apparatus and method thereof, and system for semantic search ranking based on ontology and method thereof}
본 발명은 웹 문서의 우선순위를 결정하기 위한, 랭킹 장치 및 그 방법과, 그를 이용한 온톨로지에 기반한 시맨틱 검색 랭킹 시스템 및 그 방법에 관한 것으로, 더욱 상세하게는 웹 문서 기반으로 제작된 온톨로지(Ontology) 정보인 개념(Concept)과 관계(Relationship), 그리고 검색 대상자인 이용자가 선택한 정보(질의 정보)를 기반으로 생성된, 온톨로지의 개념과 관계의 부분 그래프들의 중요도를 계산한 후에 중요도에 따른 랭킹(우선순위)을 정하고, 상기 랭킹된 부분 그래프를 기반으로 생성된 트리플(Subject, Predicate, Object로 이루어진 SPO 형태의 단위)의 중요도를 계산한 후에 중요도에 따른 랭킹을 정하고, 상기 랭킹된 트리플을 기반으로 웹 문서들(인덱싱되어 있는 웹 문서임)을 검색하여 각 검색 문서들의 중요도를 계산한 후에 중요도에 따른 검색 결과 문서의 랭킹을 제공하기 위한, 랭킹 장치 및 그 방법과, 그를 이용한 온톨로지에 기반한 시맨틱 검색 랭킹 시스템 및 그 방법에 관한 것이다.
이하의 일실시예에서는 부분 그래프, 트리플, 및 문서들의 랭킹을 위해 계산하는 중요도에 사용되는 각 요소들은 특별한 경우를 예로 들어 설명하나, 본 발명이 이 요소들에 한정되는 것이 아님을 미리 밝혀둔다.
종래의 키워드 기반 검색에서의 문서 랭킹은 질의어와 매칭되는 키워드의 빈도수와 문서 내에서의 그 비율에 기초한 단순한 형태였다. 즉, 하나의 문서에 단어가 여러 번 출현하면 문서의 우선순위가 올라가지만, 해당 단어가 여러 문서에 출현한 경우 문서의 우선순위는 낮아지게 되는 원리는 이용하였다. 그러나 단순히 키워드의 빈도수가 높다고 하여 사용자가 원하는 검색 결과라고 보기는 힘들며, 빈도수를 조작함으로써 인위적으로 문서의 우선순위를 높일 수 있는 문제점이 있다.
이것을 보완하여 HTML(HyperText Markup Language)의 하이퍼링크(HyperLink) 구조를 분석하고 이를 랭킹에 반영한 것이 "Google"의 페이지랭크(PageRank) 기법으로, 모든 문서의 외부 링크를 검사하여 링크가 많이 걸린 문서에 우선순위를 주자는 아이디어이다. 이 기법은 사용자가 원하는 문서는 다른 문서로부터 많이 참조된 문서라는 가정 하에서 시작한다. 즉, 인기가 많은 페이지가 우선순위가 높다는 의미이기도 하다. 하기의 [수학식 1]은 페이지랭크(PageRank) 기법의 알고리즘을 수식화한 것이다.
PR(A)=(1-d)+d(PR(T1)/C(T1)+...+PR(Tn)/C(Tn))
C(A) : 페이지 A에서 나가는 링크의 수
PR(A) : 페이지 A의 페이지 랭크
d : 댐핑 인자(damping factor)
이는 확률 (1-d)를 가지고 임의의 페이지로 넘어가거나, 확률 d를 가지고 현재 페이지 상에서 임의의 하이퍼링크(HyperLink)를 따라가는 것과 같이, 웹에서 임의로 항해하는 사용자를 모의실험하고 있는 것과 같으며, 이미 탐색된 하이퍼링크(HyperLink)의 후방을 따라 앞서 방문한 웹 문서로 돌아가지 않는다는 가정을 하고 있다. 그 결과, 인기가 많은 문서는 더 인기가 많아지기 쉬운 반면에, 인기가 없는 문서는 더욱 사용자에게 전달되기 힘든 구조를 가지게 된다. 즉, 이러한 “Rich-get-Richer”현상은 사용자가 원하는 내용을 포함하는 새로운 문서가 있더라도 상위 우선순위를 가지지 못하게 되는 문제점이 있다.
상기와 같은 키워드 기반 검색 문서 랭킹의 근본적인 문제점은 문서의 내용이나 사용자의 질의어의 의미에 기반하지 않고, 단지 키워드라는 단순한 글자의 형태와 문서의 외적인 측면을 기반으로 하여 문서의 우선순위를 정하기 때문에 사용자에게 보다 만족도 높은 검색 결과를 제공할 수 없다.
또한, 종래의 키워드 기반 검색 시스템에서는 단어의 외적 형태만으로 검색 결과를 제공함으로써, 의미적으로 연관된 문서를 얻기 위해서는 또 다른 방법의 검 색이나 사용자의 추가적인 행동이 필요한 문제점이 있다.
따라서 현재 다양하게 생산되고 있는 웹 문서에 대해 기존의 검색 랭킹 기술을 개선하여 사용자에게 원하는 정보를 효율적이고 편리하게 검색할 수 있도록 하기 위해, 단순한 글자의 형태 및 문서의 외적인 측면이 아닌 사용자(검색 이용자)의 질의어와 문서 내의 내용을 의미적으로 해석하여 문서 랭킹에 적용하는, 온톨로지 기반의 시맨틱 검색 랭킹 시스템이 절실히 요구되고 있다.
전술한 바와 같이, 상기와 같은 종래 기술은 웹 문서에 대한 검색 빈도 증가와 대량의 웹 문서로 인하여 웹 문서 검색에 필요한 투입 시간의 증가 및 인지적 부담, 문서의 조작을 통한 우선순위를 높일 수 있는 부작용, 그리고 "Rich-get-Richer" 현상으로 인한 올바르지 않은 웹 문서 구조 등이 가중되는 문제점이 있고, 또한 검색 이용자가 원하는 정보를 찾기 어려울 뿐만 아니라 의미적으로 연관된 컨텐츠를 얻기 위해 또 다른 방법의 검색이나 사용자의 추가적인 행동이 필요한 문제점이 있으며, 이러한 문제점을 해결하고 상기 요구에 부응하고자 하는 것이 본 발명의 과제이다.
따라서 본 발명은 키워드 자체의 외적 특성 또는 웹 문서 자체의 외적 특성보다는 웹 문서 내에 존재하는 단어의 의미를 표현하고 있는 온톨로지 정보와 검색 이용자의 질의 정보를 기반으로 검색 결과 문서의 랭킹(우선순위)을 제공하기 위한, 랭킹 장치 및 그 방법과, 그를 이용한 온톨로지에 기반한 시맨틱 검색 랭킹 시스템 및 그 방법을 제공하는데 그 목적이 있다.
즉, 본 발명은 웹 문서를 기반으로 제작된 온톨로지 정보인 개념(Concept)과 관계(Relationship) 정보와 웹 문서 검색 이용자로부터의 질의 정보(질의어)를 기반으로 선택된 온톨로지 부분 그래프의 랭킹(우선순위)을 정하고, 상기 랭킹된 온톨로지 부분 그래프를 기반으로 생성된 트리플의 랭킹(우선순위)를 정하고, 상기 랭킹된 트리플을 기반으로 웹 문서를 검색한 후 검색 결과 문서의 랭킹(우선순위) 을 정하기 위한, 랭킹 장치 및 그 방법과, 그를 이용한 온톨로지에 기반한 시맨틱 검색 랭킹 시스템 및 그 방법을 제공하고자 한다.
즉, 본 발명은 웹 문서 기반으로 제작된 온톨로지(Ontology) 정보인 개념(Concept)과 관계(Relationship), 그리고 검색 대상자인 이용자가 선택한 정보(질의 정보)를 기반으로 생성된, 온톨로지의 개념과 관계의 부분 그래프들의 중요도를 계산한 후에 중요도에 따른 랭킹(우선순위)을 정하고, 상기 랭킹된 부분 그래프를 기반으로 생성된 트리플(Subject, Predicate, Object로 이루어진 SPO 형태의 단위)의 중요도를 계산한 후에 중요도에 따른 랭킹을 정하고, 상기 랭킹된 트리플을 기반으로 웹 문서들(인덱싱되어 있는 웹 문서임)을 검색하여 각 검색 문서들의 중요도를 계산한 후에 중요도에 따른 검색 결과 문서의 랭킹을 제공하기 위한, 랭킹 장치 및 그 방법과, 그를 이용한 온톨로지에 기반한 시맨틱 검색 랭킹 시스템 및 그 방법을 제공하고자 한다.
본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명의 시스템은, 시맨틱 검색 랭킹 시스템에 있어서, 온톨로지의 개념(Concept)과 관계(Relationship) 정보, 검색 이용자로부터의 질의 정보를 이용하여 선택된 부분 그래프 집합에 대해 각 부분 그래프의 우선순위를 결정하기 위한 부분 그래프 랭킹 수단; 상기 부분 그래프 랭킹 수단에서 우선순위가 결정된 부분 그래프 집합을 기반으로 변환된 트리플 집합에 대해 각 트리플의 우선순위를 결정하기 위한 트리플 랭킹 수단; 및 상기 트리플 랭킹 수단에서 우선순위가 결정된 트리플 집합을 기반으로 검색된 검색 결과 집합에 대해 각 검색 결과의 우선순위를 결정하기 위한 검색 결과 랭킹 수단을 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명의 장치는, 부분 그래프 랭킹 장치에 있어서, 기 제작된 온톨로지의 개념(Concept)과 관계(Relationship) 정보, 검색 이용자로부터의 질의 정보를 이용하여 선택된 부분 그래프 집합에 대해 부분 그래프 요소인 온톨로지 내의 개념과 관계의 요소 가중치를 계산하기 위한 부분 그래프 요소 가중치 계산 수단; 상기 부분 그래프 요소 가중치 계산 수단에서 계산된 요소 가중치를 기반으로 각 부분 그래프의 중요도를 계산하기 위한 부분 그래프 중요도 계산 수단; 및 상기 부분 그래프 중요도 계산 수단에서 계산된 각 부분 그래프의 중요도에 따라 부분 그래프의 우선순위를 결정하기 위한 부분 그래프 순위 결정 수단을 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명의 다른 장치는, 트리플 랭킹 장치에 있어서, 트리플 집합에 대해 각 트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship)의 요소 가중치를 계산하기 위한 트리플 요소 가중치 계산 수단; 상기 트리플 요소 가중치 계산 수단에서 계산된 요소 가중 치를 기반으로 각 트리플의 중요도를 계산하기 위한 트리플 중요도 계산 수단; 및 상기 트리플 중요도 계산 수단에서 계산된 각 트리플의 중요도에 따라 트리플의 우선순위를 결정하기 위한 트리플 순위 결정 수단을 포함한다.
한편, 상기 목적을 달성하기 위한 본 발명의 방법은, 시맨틱 검색 랭킹 방법에 있어서, 온톨로지의 개념(Concept)과 관계(Relationship) 정보, 검색 이용자로부터의 질의 정보를 이용하여 선택된 부분 그래프 집합에 대해 각 부분 그래프의 우선순위를 결정하는 부분 그래프 랭킹 단계; 상기 우선순위가 결정된 부분 그래프 집합을 기반으로 변환된 트리플 집합에 대해 각 트리플의 우선순위를 결정하는 트리플 랭킹 단계; 및 상기 우선순위가 결정된 트리플 집합을 기반으로 검색된 검색 결과 집합에 대해 각 검색 결과의 우선순위를 결정하는 검색 결과 랭킹 단계를 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명의 다른 방법은, 부분 그래프 랭킹 방법에 있어서, 기 제작된 온톨로지의 개념(Concept)과 관계(Relationship) 정보, 검색 이용자로부터의 질의 정보를 이용하여 선택된 부분 그래프 집합에 대해 부분 그래프 요소인 온톨로지 내의 개념과 관계의 요소 가중치를 계산하는 부분 그래프 요소 가중치 계산 단계; 상기 계산된 요소 가중치를 기반으로 각 부분 그래프의 중요도를 계산하는 부분 그래프 중요도 계산 단계; 및 상기 계산된 각 부분 그래프의 중요도에 따라 부분 그래프의 우선순위를 결정하는 부분 그래프 순위 결정 단계를 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명의 또 다른 방법은, 트리플 랭킹 방법에 있어서, 트리플 집합에 대해 각 트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship)의 요소 가중치를 계산하는 트리플 요소 가중치 계산 단계; 상기 계산된 요소 가중치를 기반으로 각 트리플의 중요도를 계산하는 트리플 중요도 계산 단계; 및 상기 계산된 각 트리플의 중요도에 따라 트리플의 우선순위를 결정하는 트리플 순위 결정 단계를 포함한다.
상기와 같은 본 발명은, 웹 문서에 나타난 키워드의 단순한 글자 형태와 문서의 외적인 측면보다는 웹 문서의 내용과 관련된 의미에 기반한 온톨로지 정보와 검색 이용자의 질의 정보를 기반으로 부분 그래프의 우선순위를 정하고, 부분 그래프에서 변환된 트리플의 우선순위를 정한 후 관련된 웹 문서를 검색하여 웹 문서의 우선순위를 정함으로써, 즉 다단계에 걸쳐 우선순위를 정함으로써, 효율적인 온톨로지 기반 시맨틱 검색 랭킹 시스템을 제공할 수 있다.
또한, 본 발명은 다단계에 걸쳐 우선순위를 정함으로써, 최근 웹 문서에 대한 검색 빈도 증가와 대량의 웹 문서로 인하여 웹 문서 검색에 필요한 투입 시간의 증가 및 인지적 부담, 문서의 조작을 통한 우선순위를 높일 수 있는 부작용, 그리고 "Rich-get-Richer" 현상으로 인한 올바르지 않은 웹 문서 구조 등이 가중되는 문제점을 최소화하고, 검색 이용자가 원하는 진정한 의미와 관련된 컨텐츠를 손쉽게 획득할 수 있도록 하는 탁월한 효과가 있다.
또한, 본 발명에 따라 생성된 부분 그래프의 랭킹 정보, 트리플 랭킹 정보, 그리고 웹 문서 랭킹 정보는 문서 검색 분야뿐만 아니라 기타 온톨로지를 이용한 타 시맨틱 응용 분야(예 : 멀티미디어 검색 시스템, 여행 정보 시스템 등)에서 컨텐츠가 다양할 때, 효과적인 컨텐츠 전달수단으로 적용하기에 적합하다.
상술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되어 있는 상세한 설명을 통하여 보다 명확해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다.
먼저, 본 발명의 이해를 돕기 위하여 시맨틱 웹 기술에 대해 살펴보기로 한다.
팀 버너스-리(Tim Berners-Lee)는 1989년에 웹(World Wide Web)을 처음으로 제안하여, 기존에 널리 쓰이고 있던 클라이언트-서버(Client-Server) 구조와 HTML(HyperText Markup Language)의 마크업 언어로 인터넷 환경에서 어디에서나 개인의 정보를 웹에 올릴 수 있고, 브라우저를 통해 그 정보에 접근할 수 있는 정보의 공유 인프라를 갖출 수 있도록 하였다. 이에 따라, 수많은 정보가 인터넷에 올려지게 되고 유통되는 과정을 거치면서 대량의 정보가 인터넷상에 존재하게 되었 고, 이를 상호 공유함으로써 사회 발전과 기술 발전을 촉진하고, 결과적으로 정보사회의 혁신을 이끄는 계기가 되었다.
그러나 정보의 양이 방대해짐으로써 자신이 원하는 정보를 찾기에 드는 노력과 시간이 점점 더 많아지는 현상이 발생하게 되었고, 웹을 이용한 다양한 응용 프로그램 및 서비스가 등장하면서 이 역시 유효하고 적절하게 찾아 이용하기에는 많은 어려움이 발생하게 되었다.
특히, 기존의 웹을 기반으로 한 검색 방법은 키워드에 의한 검색이 주류로서, 주로 단어의 빈도수나 어휘 정보를 이용하여 웹 문서의 우선순위를 결정하는 방식으로, 정작 사용자가 원하는 웹 문서를 찾는 데는 한계가 있다. 또한, 관련된 웹 문서를 확장하거나 통합, 공유하는 것이 매우 어렵다. 이러한 문제점은 기존의 웹과 마크업 언어가 인간 중심이고 인간이 보고 이해할 수 있도록 웹 브라우저의 표현 기술에 초점을 맞추고 있기 때문이다. 결국, 기존의 웹은 컴퓨터가 스스로 필요한 정보를 효과적으로 추출하고, 해석하고, 가공하는 기능을 충분히 제공하지 못하는 인간 중심의 정보 처리 기술이라고 할 수 있다.
이후, 기존의 웹을 확장하여 컴퓨터가 이해할 수 있는 잘 정의된 의미를 기반으로 의미적 상호 운용성(semantic interoperability)을 실현하고 인간과 컴퓨터 간의 효과적인 협동 체제를 구축할 수 있는 기술로서 시맨틱(Semantic) 웹이 등장하게 되었다.
팀 버너스-리는 시맨틱 웹이 기존의 웹과 완전히 구별되는 새로운 웹의 개념이 아니라 현재 웹을 확장하여 웹에 올라오는 정보에 잘 정의된 의미를 부여하고 이를 통해 컴퓨터와 사람이 협동적으로 작업을 수행할 수 있도록 하는 패러다임이라고 그 역할을 정의하였다. 시맨틱 웹은 웹상에 존재하는 정보를 사람뿐만 아니라 기계(컴퓨터)가 의미를 파악하여 사용자의 요구에 적합한 지능형 서비스를 제공하거나, 사람과 기계 또는 기계와 기계 상호 간에 협업을 원활히 수행함으로써 사람을 대신하여 자동적인 서비스가 가능한 웹을 말한다.
즉, 시맨틱 웹은 컴퓨터가 정보 자원의 의미를 이해하고, 자동화하고, 통합하고, 재사용할 수 있는 차세대 웹 기술로서, 다음의 3가지 주요 요소로 이루어진다.
1) 온톨로지(ontology)
온톨로지는 공유된 개념화에 대한 형식적 명세 체계로서, 도메인 어휘의 의미 정보를 제공한다. 온톨로지는 일종의 지식 표현으로, 컴퓨터는 온톨로지로 표현된 개념을 이해하고 지식처리를 할 수 있다. 추론 등의 처리를 위해서는 온톨로지의 공리(axiom)와 규칙(rule) 체계가 필요하다.
2) 의미적으로 주석화된 웹(semantically annotated Web)
의미적으로 주석화된 웹이란 온톨로지로 주석화된 웹으로, 일종의 지식 베이스(knowledge base)이다. 시맨틱 웹에서는 인터넷의 분산 정보 자원을 의미적으로 통합하는 거대한 지식 베이스를 구축할 수 있다. 좁은 의미에서 기업 또는 기관의 정보 자원에 대한 지식 베이스를 구축할 수도 있다.
3) 에이전트(agent)
에이전트(agent)는 사람(사용자)을 대신하여 정보 자원을 수집·검색하고 추 론하며, 다른 에이전트와 상호 정보를 교환하는 등의 일을 수행하는 지능형 에이전트이다. 지능형 에이전트는 시맨틱 웹 기반 응용 시스템의 핵심이라 할 수 있다.
시맨틱 웹은 온톨로지와 에이전트 기술을 활용하여 의미적 상호 운용성을 실현하며, 그에 따라 기존의 정보 표현 중심의 웹을 지식 기반 의미 중심의 웹으로 도약시킬 수 있게 되었다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하기로 한다.
도 1은 본 발명의 바람직한 일실시예에 따른 온톨로지에 기반한 시맨틱 검색 랭킹 시스템의 구성도이다.
도 1을 참조하여 살펴보면, 본 발명에 따른 온톨로지에 기반한 시맨틱 검색 랭킹 시스템은, 웹 문서를 기반으로 제작된 온톨로지 정보와 검색 이용자의 질의 정보를 이용하여 관련 정보를 찾는 온톨로지 기반 시맨틱 검색 엔진부(20)로부터 출력되는 각각의 과정에 해당되는 결과 정보와 온톨로지의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 과정의 결과 정보의 중요도와 우선순위를 정하는 "온톨로지에 기반한 시맨틱 검색 랭킹 시스템(10)"을 일컫는다.
이를 위하여, 검색 대상이 되는 웹 문서를 저장하고 있는 웹 문서 저장소(30)와, 웹 문서 기반으로 제작된 온톨로지(Ontology) 정보인 개념(Concept)과 관계(Relationship) 정보를 저장하고 있는 온톨로지 저장소(40)가 구비되어 있다.
즉, 검색 대상이 되는 웹 문서는 웹 문서 저장소(30)에 웹 컨텐츠 제공사로 부터 획득하거나, 자동 웹 문서 수집기(Crawler) 등을 통해 얻는 등의 다른 방법을 통해 이미 저장되어 있다고 가정한다. 마찬가지로, 온톨로지 저장소(40) 또한 온톨로지의 개념(Concept)과 관계(relationship) 등이 웹 문서를 기반으로 제작되어 이미 저장되어 있다고 가정한다.
여기서, 온톨로지 기반 시맨틱 검색 엔진부(20)는 본 발명의 관심대상이 아니므로 간략하게 설명하기로 하고, 본 발명의 대상인 "온톨로지에 기반한 시맨틱 검색 랭킹 시스템(10)"에 대해서는 자세히 설명하기로 한다.
도 1에 도시된 바와 같이, 본 발명에 따른 온톨로지에 기반한 시맨틱 검색 랭킹 시스템(10)은, 웹 문서를 기반으로 제작된 온톨로지의 개념(Concept)과 관계(Relationship) 정보, 웹 문서 검색 이용자로부터의 질의 정보를 이용하여 탐색(선택)된 부분 그래프 집합에 대해 각 부분 그래프의 우선순위를 결정하기 위한 부분 그래프 랭킹부(110), 상기 부분 그래프 랭킹부(110)에서 우선순위가 결정된 부분 그래프 집합을 기반으로 변환된 트리플 집합에 대해 각 트리플의 우선순위를 결정하기 위한 트리플 랭킹부(120), 및 상기 트리플 랭킹부(120)에서 우선순위가 결정된 트리플 집합을 기반으로 검색된 웹 문서 집합에 대해 각 웹 문서의 우선순위를 결정하기 위한 문서 랭킹부(130)를 포함한다.
다음으로, 상기 온톨로지에 기반한 시맨틱 검색 랭킹 시스템(10)의 각 구성 요소에 대해 좀 더 상세히 살펴보면 다음과 같다.
먼저, 부분 그래프 랭킹부(110)는 온톨로지 기반 시맨틱 검색 엔진부(20)의 구성 요소인 부분 그래프 선택부(220)에서 선택된 부분 그래프 집합을 기반으로 각 부분 그래프에 대해 중요도를 계산하여 우선순위를 결정하고, 중요도가 특정 값(예 : 중요도가 0~10의 범위를 가지는 경우 중간값인 5, 또는 상위 순위를 가지는 5개 등) 이하인 경우 해당 부분 그래프를 부분 그래프 집합에서 제거함으로써 검색 이용자의 질의어(질의 정보)와 관련성이 낮은 부분 그래프를 걸러내게 된다. 상기 부분 그래프 랭킹부(110)에 대해서는 도 2를 참조하여 상세히 후술하기로 한다.
그리고 트리플 랭킹부(120)는 온톨로지 기반 시맨틱 검색 엔진부(20)의 구성 요소인 트리플 변환부(230)에서 변환된 트리플 집합을 기반으로 각 트리플에 대해 중요도를 계산하여 우선순위를 결정하고, 중요도가 특정 값(예 : 중요도가 0~10의 범위를 가지는 경우 중간값인 5, 또는 상위 순위를 가지는 5개 등) 이하인 경우 해당 트리플을 트리플 집합에서 제거함으로써 검색 이용자의 질의어(질의 정보)와 관련성이 낮은 트리플을 걸러내게 된다. 여기서, 트리플 변환부(230)에서 변환된 트리플 집합은 부분 그래프 선택부(220)에서 선택되고 부분 그래프 랭킹부(110)에서 랭킹 처리된 부분 그래프 집합을 변환한 트리플들로 이루어져 있다. 상기 트리플 랭킹부(120)에 대해서는 도 3을 참조하여 상세히 후술하기로 한다.
그리고 문서 랭킹부(130)는 온톨로지 기반 시맨틱 검색 엔진부(20)의 구성 요소인 문서 검색 수행부(240)에서 검색된 문서 집합을 기반으로 각 문서에 대해 중요도를 계산하여 우선순위를 결정하고, 중요도가 특정 값(예 : 중요도가 0~10의 범위를 가지는 경우 중간값인 5, 또는 상위 순위를 가지는 5개 등) 이하인 경우 해당 문서를 문서 집합에서 제거함으로써 검색 이용자의 질의어(질의 정보)와 관련성이 낮은 문서를 걸러내게 된다. 여기서, 검색된 문서 집합은 트리플 변환부(230)에 서 변환되고 트리플 랭킹부(120)에서 랭킹 처리된 트리플 집합을 기반으로 문서 검색 수행부(240)가 웹 문서 저장소(30)로부터 검색한 문서들로 이루어져 있다. 상기 문서 랭킹부(130)에 대해서는 도 4를 참조하여 상세히 후술하기로 한다.
도 2는 본 발명의 바람직한 일실시예에 따른 도 1의 부분 그래프 랭킹부(110)의 상세 구성도이다.
도 2에 도시된 바와 같이, 본 발명에 따른 부분 그래프 랭킹부(110)는, 웹 문서를 기반으로 제작된 온톨로지의 개념(Concept)과 관계(Relationship) 정보, 웹 문서 검색 이용자로부터의 질의 정보를 이용하여 탐색(선택)된 부분 그래프 집합에 대해 부분 그래프 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship)의 요소 가중치를 계산하기 위한 부분 그래프 요소 가중치 계산기(201), 상기 부분 그래프 요소 가중치 계산기(201)에서 계산된 요소 가중치를 기반으로 각 부분 그래프의 중요도를 계산하기 위한 부분 그래프 중요도 계산기(202), 및 상기 부분 그래프 중요도 계산기(202)에서 계산된 각 부분 그래프의 중요도에 따라 부분 그래프의 우선순위를 결정하기 위한 부분 그래프 순위 결정기(203)를 포함한다.
여기서, 상기 부분 그래프 요소 가중치 계산기(201)는, 상기 선택(탐색)된 부분 그래프를 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하거나, 온톨로지 내의 개념체계를 이용하여 페널티(penalty) 값과 리워드(reward) 값을 계산한다.
한편, 다른 일예로, 상기 부분 그래프 요소 가중치 계산기(201)는, 상기 선택(탐색)된 부분 그래프를 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하고, 온톨로지 내의 개념체계를 이용하여 페널티(penalty) 값과 리워드(reward) 값을 계산한다.
그리고 상기 부분 그래프 중요도 계산기(202)는, 상기 부분 그래프 요소 가중치 계산기(201)에서 계산된 요소 가중치 값과 기타 부분 그래프와 관련된 외부 요소(예 : 부분그래프의 길이)를 고려하여 각 부분 그래프의 중요도를 계산한다.
그리고 상기 부분 그래프 순위 결정기(203)는, 상기 부분 그래프 중요도 계산기(202)에서 계산된 각 부분 그래프의 중요도에 따라 부분 그래프의 우선순위를 결정하고 특정 값 이하의 중요도를 가진 부분 그래프를 제거한다.
도 3은 본 발명의 바람직한 일실시예에 따른 도 1의 트리플 랭킹부(120)의 상세 구성도이다.
도 3에 도시된 바와 같이, 본 발명에 따른 트리플 랭킹부(120)는, 상기 부분 그래프 랭킹부(110)에서 우선순위가 결정된 부분 그래프 집합을 기반으로 변환된 트리플 집합에 대해 각 트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship)의 요소 가중치를 계산하기 위한 트리플 요소 가중치 계산기(301), 상기 트리플 요소 가중치 계산기(301)에서 계산된 요소 가중치를 기반으로 각 트리플의 중요도를 계산하기 위한 트리플 중요도 계산기(302), 및 상기 트리플 중요도 계산기(302)에서 계산된 각 트리플의 중요도에 따라 트리플의 우선순위를 결정하기 위한 트리플 순위 결정기(303)를 포함한다.
여기서, 상기 트리플 요소 가중치 계산기(301)는, 상기 변환된 트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하고, 온톨로지 내의 개념 및 관계와 상기 검색 이용자의 질의어(질의 정보)와의 거리 등을 계산한다.
그리고 상기 트리플 중요도 계산기(302)는, 상기 트리플 요소 가중치 계산기(301)에서 계산된 요소 가중치 값과 기타 트리플과 관련된 외부 요소(예 : 트리플의 최신성)를 고려하여 각 트리플의 중요도를 계산한다.
그리고 상기 트리플 순위 결정기(303)는, 상기 트리플 중요도 계산기(302)에서 계산된 각 트리플의 중요도에 따라 트리플의 우선순위를 결정하고 특정 값 이하의 중요도를 가진 트리플을 제거한다.
도 4는 본 발명의 바람직한 일실시예에 따른 도 1의 문서 랭킹부(130)의 상세 구성도이다.
도 4에 도시된 바와 같이, 본 발명에 따른 문서 랭킹부(130)는, 상기 트리플 랭킹부(120)에서 우선순위가 결정된 트리플 집합을 기반으로 검색된 웹 문서 집합에 대해 우선순위 결정을 위한 요소들의 요소 가중치를 계산하기 위한 문서 요소 가중치 계산기(401), 상기 문서 요소 가중치 계산기(401)에서 계산된 요소 가중치를 기반으로 각 웹 문서의 중요도를 계산하기 위한 문서 중요도 계산기(402), 및 상기 문서 중요도 계산기(402)에서 계산된 각 웹 문서의 중요도에 따라 웹 문서의 우선순위를 결정하기 위한 문서 순위 결정기(403)를 포함한다.
여기서, 상기 문서 요소 가중치 계산기(401)는, 상기 검색된 웹 문서와 관련된 요소인 트리플의 추출 위치 정보 값, 해당 웹 문서의 발행 시간과 웹 문서의 출처를 고려한 가중치, 및 해당 웹 문서를 검색 이용자들이 얼마나 읽었는지의 비율을 이용한 인기도 등을 계산한다.
그리고 상기 문서 중요도 계산기(402)는, 상기 문서 요소 가중치 계산기(401)에서 계산된 요소 가중치 값과 기타 웹 문서와 관련된 외부 요소(예 : 내/외부로의 링크 수, 도메인 명 클래스, 파일 크기 등)를 고려하여 각 웹 문서의 중요도를 계산한다.
그리고 상기 문서 순위 결정기(403)는, 상기 문서 중요도 계산기(402)에서 계산된 각 웹 문서의 중요도에 따라 웹 문서의 우선순위를 결정하고 특정 값 이하의 중요도를 가진 웹 문서를 제거한다.
다음으로, 상기 온톨로지에 기반한 시맨틱 검색 랭킹 시스템(10)의 검색 랭킹 과정에 대하여 좀 더 상세히 살펴보면 다음과 같다.
도 5는 본 발명의 바람직한 일실시예에 따른 온톨로지에 기반한 시맨틱 검색 랭킹 방법에 대한 전체 흐름도이다.
먼저, 부분 그래프 랭킹부(110)는 웹 문서를 기반으로 제작된 온톨로지의 개념(Concept)과 관계(Relationship) 정보, 웹 문서 검색 이용자로부터의 질의 정보 를 이용하여 탐색(선택)된 부분 그래프 집합에 대해 각 부분 그래프의 우선순위를 결정한다(501).
이후, 트리플 랭킹부(120)는 상기 부분 그래프 랭킹부(110)에서 우선순위가 결정된 부분 그래프 집합을 기반으로 변환된 트리플 집합에 대해 각 트리플의 우선순위를 결정한다(502).
이후, 문서 랭킹부(130)는 상기 트리플 랭킹부(120)에서 우선순위가 결정된 트리플 집합을 기반으로 검색된 웹 문서 집합에 대해 각 웹 문서의 우선순위를 결정한다(503).
다음으로, 상기 각 과정(501 내지 503)에 대하여 좀 더 상세히 살펴보면 다음과 같다.
먼저, 검색 이용자는 본인이 원하는 웹 문서를 검색하기 위해 관련된 검색어(질의 정보)를 입력하게 되고, 이 검색어는 질의 정보 수신부(210)에 의해 수신되어 처리된다. 즉, 질의 정보 수신부(210)는 검색 이용자로부터 입력되는 검색어(질의 정보)를 수신하여 웹 문서 기반으로 제작된 온톨로지와 어떤 관련성이 있는지를 분석하고, 검색에 용이하도록 검색 엔진 내부에서 처리 가능한 형태로 질의 정보를 변경한 후 부분 그래프 선택부(220)로 전달한다.
그러면, 부분 그래프 선택부(220)는 검색 이용자로부터의 질의 정보와 온톨로지 정보를 기반으로 온톨로지 저장소(40) 내의 그래프 구조에서 질의어(질의 정보)와 관련된 부분 그래프를 탐색하여 온톨로지 부분 그래프 집합을 생성(선택)해 낸다. 그리고 부분 그래프 선택부(220)는 생성된 부분 그래프 집합을 부분 그래프 랭킹부(110)로 전달함으로써, 검색 이용자의 질의어(질의 정보)와 관련성이 적거나 덜 중요한 요소(부분 그래프)를 제거할 수 있도록 한다.
그에 따라, 부분 그래프 랭킹부(110)는 상기 부분 그래프 선택부(220)에서 선택된 부분 그래프 집합을 전달받아 각 부분 그래프의 구성 요소 정보와 검색 이용자의 질의 정보를 토대로 중요도를 계산해낸다. 중요도 계산 후 각 부분 그래프의 우선순위를 정하고 특정 값 이하의 중요도를 가진 부분 그래프를 제거함으로써, 그 이후 단계에 처리해야 하는 각 과정들에 대해 불필요한 리소스 및 처리 과정을 줄일 수 있도록 한다. 상기와 같이 우선순위가 정해진 부분 그래프 집합은 트리플 변환부(230)로 전달되어 웹 문서 검색에 용이한 형태로 변환된다.
즉, 트리플 변환부(230)는 상기 부분 그래프 랭킹부(110)에서 우선순위가 정해진 부분 그래프 집합을 기반으로 그래프를 탐색해가며 부분 그래프를 트리플 형태로 변환한다. 여기서, 트리플은 웹 문서 저장소(30)에서 웹 문서를 검색해 내기 위한 최소의 단위로서, 웹 문서 내의 내용을 담고 있는 하나의 의미 단위라 볼 수 있다. 또한, 온톨로지 기반 시맨틱 검색 엔진부(20)에서 웹 문서의 내용을 트리플 형태로 인덱싱하고 트리플을 기반으로 검색해내므로, 트리플은 검색 엔진 내부의 하나의 단위라 볼 수 있다. 그리고 트리플 변환부(230)는 변환된 트리플을 트리플 랭킹부(110)로 전달함으로써, 검색 이용자의 질의어(질의 정보)와 관련성이 적거나 덜 중요한 요소(트리플)를 제거할 수 있도록 한다.
그에 따라, 트리플 랭킹부(120)는 상기 트리플 변환부(230)에서 변환된 트리플 집합을 전달받아 각 트리플의 구성 요소 정보와 검색 이용자의 질의 정보를 토 대로 중요도를 계산해낸다. 중요도 계산 후 각 트리플의 우선순위를 정하고 특정 값 이하의 중요도를 가진 트리플을 제거함으로써, 다음 단계에 처리해야 하는 각 과정들에 대해 불필요한 리소스 및 처리 과정을 줄일 수 있도록 한다. 상기와 같이 우선순위가 정해진 트리플 집합은 문서 검색 수행부(240)로 전달되어 웹 문서 저장소(30)로부터 검색이 수행될 수 있도록 한다.
그에 따라, 문서 검색 수행부(240)는 상기 트리플 랭킹부(120)에서 우선순위가 정해진 트리플 집합을 기반으로, 트리플 형태를 기반으로 인덱싱되어 있는 웹 문서를 웹 문서 저장소(30)로부터 검색해 내어 웹 문서 집합을 생성해 낸다. 이 단계까지의 웹 문서들은 검색 이용자가 질의한 질의어(질의 정보)와 관련성이 높은 내용을 가진 웹 문서이며, 그 중요도와 순서는 명확하지 않은 단계이다. 따라서 이 웹 문서 집합을 문서 랭킹부(130)로 전달함으로써, 검색 이용자의 질의어(질의 정보)와 가장 관련성 있는 순서대로 문서들을 정렬하도록 한다.
그에 따라, 문서 랭킹부(130)는 검색 이용자의 질의어(질의 정보)와 관련 있는 내용을 가지는 웹 문서들의 집합을 기반으로 웹 문서의 구성 요소 및 웹 문서의 외적 요소 등을 고려해 웹 문서의 중요도를 계산해 내고 그 중요도에 따라 우선순위를 정함으로써, 검색 이용자에게 가장 중요한 문서 순서대로 검색 결과를 제공하여 검색 서비스의 품질을 높일 수 있도록 한다. 상기 문서 랭킹부(130)를 통해 우선순위가 결정된 문서 집합을 검색 결과 처리부(250)로 전달함으로써, 검색 이용자에게 친근한 화면 구성으로 검색 결과를 제공하도록 한다.
그에 따라, 검색 결과 처리부(250)는 검색 이용자의 질의어와 관련 있는 순 서대로 전달된 웹 문서 집합을 사용자 관점의 화면 구성으로 제공함으로써, 검색 이용자가 검색 결과를 편리하게 제공받게 하는 등의 검색 서비스 품질을 높이는 역할을 수행한다.
상기와 같이, 검색 이용자가 질의 정보를 입력하는 과정에서부터 검색 결과를 처리하는 과정까지가 하나의 큰 과정이며, 이러한 검색 입력 과정에서 검색 결과 제공 과정에 이르는 각 과정은 계속적으로 순환된다.
도 6은 본 발명의 바람직한 일실시예에 따른 도 5의 부분 그래프 랭킹 과정(501)에 대한 상세 흐름도이다.
전술한 바와 같이, 질의 정보 수신부(210)에서 검색 이용자의 질의 정보를 전달받아 분석하고 부분 그래프 선택부(220)로 전달하면, 부분 그래프 선택부(220)에서는 온톨로지 정보와 검색 이용자의 질의 정보를 기반으로 질의 정보와 관련성 있는 온톨로지 내의 부분 그래프를 탐색(선택)하여 부분 그래프 집합을 생성해낸다.
상기와 같이 생성된 부분 그래프 집합은 부분 그래프 랭킹부(110)로 전달되고, 그에 따라 부분 그래프 랭킹부(110)의 부분 그래프 요소 가중치 계산기(201)는 상기 생성된 부분 그래프 집합에 대해 부분 그래프 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship)의 요소 가중치를 계산한다(601).
이때 사용될 수 있는 요소 가중치로는 부분 그래프를 구성하고 있는 온톨로지 내의 개념(Concept)들의 인기도 측정값을 이용한 부분 그래프 자체의 인기도, 부분 그래프를 구성하고 있는 온톨로지 내의 관계(Relationship)의 정보량을 이용한 부분 그래프 정보량, 온톨로지 내의 개념체계를 이용한 페널티(penalty)값 및 리워드(reward)값 등이 될 수 있다.
일례로, 온톨로지 개념들의 인기도는 개념이 나온 웹 문서를 총 웹 문서의 개수로 나눈 값으로 하고, 부분 그래프의 인기도는 부분 그래프 상에서 그 개념들의 인기도들의 곱으로 할 수 있다. 또한, 부분 그래프를 구성하고 있는 관계의 정보량은 고유 정보량과 상대 정보량을 측정하고, 이 값의 합을 사용할 수 있다. 그리고 온톨로지 내의 개념체계를 이용하여 상위 개념으로 갈수록 페널티(penalty) 값을 주고, 하위 개념으로 내려가 상세한 정보를 가진 부분 그래프에 대해서는 리워드(reward) 값을 준다.
이후, 부분 그래프 랭킹부(110)의 부분 그래프 중요도 계산기(202)는 상기 계산된 요소 가중치 값을 기반으로 기타 부분 그래프와 관련된 외부 요소를 고려하여 각 부분 그래프의 중요도를 계산한다(602).
이후, 부분 그래프 랭킹부(110)의 부분 그래프 순위 결정기(203)는 상기 계산된 각 부분 그래프의 중요도에 따라 부분 그래프의 우선순위(랭킹)를 결정하고, 검색 이용자의 질의 정보와 관련성이 떨어지거나 그 중요도가 현저히 떨어진다고 판단되는 특정 값 이하의 중요도를 가지는 부분 그래프를 제거함으로써, 그 이후 단계에 처리해야 하는 각 과정들에 대해 불필요한 리소스 및 처리 과정을 줄일 수 있게 한다(603).
도 7은 본 발명의 바람직한 일실시예에 따른 도 5의 트리플 랭킹 과정(502)에 대한 상세 흐름도이다.
전술한 바와 같이, 부분 그래프 랭킹 과정을 거친 부분 그래프 집합을 기반으로 트리플 변환부(230)에서 각 부분 그래프를 웹 문서 검색에 사용될 트리플 집합으로 변환하고, 이렇게 변환된 트리플 집합은 트리플 랭킹부(120)로 전달된다.
그에 따라, 트리플 랭킹부(110)의 트리플 요소 가중치 계산기(301)는 상기 변환된 트리플 집합에 대해 각 트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship)의 요소 가중치를 계산한다(701).
이때 사용될 수 있는 요소 가중치로는 트리플을 구성하고 있는 온톨로지 내의 개념(Concept)들의 인기도 측정값, 온톨로지 내의 관계(Relationship)의 정보량, 그리고 트리플을 구성하고 있는 온톨로지 내의 개념 및 관계와 검색 이용자의 질의어와의 거리 등이 될 수 있다.
특히, 상기 트리플은 전술한 부분 그래프와 형식상 동일하므로 비슷한 요소 가중치를 이용할 수 있다. 여기서, 트리플을 구성하고 있는 온톨로지 내의 개념 및 관계와 검색 이용자의 질의어와의 거리는 검색 이용자의 질의어를 온톨로지 내의 개념이나 관계에 매핑한 후 이 둘 사이의 최단 거리를 이용할 수 있다.
이후, 트리플 랭킹부(110)의 트리플 중요도 계산기(302)는 상기 계산된 요소 가중치 값을 기반으로 기타 트리플과 관련된 외부 요소를 고려하여 각 트리플의 중요도를 계산한다(702).
이후, 트리플 랭킹부(110)의 트리플 순위 결정기(303)는 상기 계산된 각 트 리플의 중요도에 따라 트리플의 우선순위(랭킹)를 결정하고, 검색 이용자의 질의 정보와 관련성이 떨어지거나 그 중요도가 현저히 떨어진다고 판단되는 특정 값 이하의 중요도를 가지는 트리플을 제거함으로써, 그 이후 단계에 처리해야 하는 각 과정들에 대해 불필요한 리소스 및 처리 과정을 줄일 수 있게 한다(703).
도 8은 본 발명의 바람직한 일실시예에 따른 도 5의 문서 랭킹 과정(503)에 대한 상세 흐름도이다.
전술한 바와 같이, 트리플 랭킹 과정을 거친 트리플 집합을 기반으로 문서 검색 수행부(240)에서 웹 문서 저장소(30)에 트리플 형태로 인덱싱되어 있는 각 웹 문서를 검색해내어 웹 문서 집합을 생성해낸다. 이렇게 검색된 웹 문서 집합은 문서 랭킹부(130)로 전달된다.
그에 따라, 문서 랭킹부(110)의 문서 요소 가중치 계산기(401)는 상기 검색된 웹 문서 집합에 대해 우선순위 결정을 위한 요소들의 요소 가중치를 계산한다(801).
이때 사용될 수 있는 요소 가중치로는 웹 문서를 검색하는데 사용된 웹 문서의 내용과 관련있는 트리플의 추출 위치 정보값, 해당 웹 문서의 발행 시간과 웹 문서의 출처를 고려한 가중치, 그리고 해당 웹 문서를 검색 이용자들이 얼마나 읽었는지에 대한 비율을 이용한 인기도 등이 될 수 있다.
일례로, 해당 웹 문서의 내용과 관련 있는 트리플의 추출 위치 정보가 웹 문서의 제목(Title)에서 나온 경우 가중값을 주고, 현재시간과 해당 웹 문서의 발행 시간과의 차이가 적으면서(즉, 최신의 웹 문서일수록) 신뢰성있는 웹 사이트(예를 들어, 대형 포털 사이트에서 발행한 웹 문서)가 출처인 웹 문서인 경우 가중값을 주며, 해당 웹 문서를 일정 기간 동안 읽은 검색 이용자가 많을수록 가중값을 주는 등의 요소 가중치를 사용할 수 있다.
이후, 문서 랭킹부(110)의 문서 중요도 계산기(402)는 상기 계산된 요소 가중치 값을 기반으로 기타 웹 문서와 관련된 외부 요소를 고려하여 각 웹 문서의 중요도를 계산한다(802).
이후, 문서 랭킹부(110)의 문서 순위 결정기(403)는 상기 계산된 각 웹 문서의 중요도에 따라 웹 문서의 우선순위(랭킹)를 결정하고, 검색 이용자의 질의 정보와 관련성이 떨어지거나 그 중요도가 현저히 낮다고 판단되는 특정 값 이하의 중요도를 가지는 웹 문서를 제거함으로써, 검색 이용자가 좀 더 질의 정보와 가까운 정확한 웹 문서 검색 결과를 획득할 수 있도록 한다(803).
상기와 같이 검색된 웹 문서와 그 우선순위 정보는 검색 결과 처리부(250)로 전달되고, 그에 따라 검색 결과 처리부(250)가 검색 이용자 관점에서 화면을 구성하여 검색 결과를 제공함으로써, 검색 이용자가 보다 높은 검색 서비스 품질을 경험할 수 있도록 한다.
한편, 전술한 바와 같은 본 발명의 방법은 컴퓨터 프로그램으로 작성이 가능하다. 그리고 상기 프로그램을 구성하는 코드 및 코드 세그먼트는 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 작성된 프로그램 은 컴퓨터가 읽을 수 있는 기록매체(정보저장매체)에 저장되고, 컴퓨터에 의하여 판독되고 실행됨으로써 본 발명의 방법을 구현한다. 그리고 상기 기록매체는 컴퓨터가 판독할 수 있는 모든 형태의 기록매체를 포함한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
본 발명은 하나의 정확한 정답을 추출해내는 시스템이 아닌, 이용자가 원하는 다양한 정보를 제공하는 온톨로지 기반의 시맨틱 검색 랭킹 시스템 등에 광범위하게 이용될 수 있다. 또한, 본 발명은 웹 문서가 아닌 기타 컨텐츠(이미지나 멀티미디어)를 대상으로 한 시맨틱 검색 시스템 등에 이용될 수 있다.
도 1은 본 발명의 바람직한 일실시예에 따른 온톨로지에 기반한 시맨틱 검색 랭킹 시스템의 구성도,
도 2는 본 발명의 바람직한 일실시예에 따른 도 1의 부분 그래프 랭킹부의 상세 구성도,
도 3은 본 발명의 바람직한 일실시예에 따른 도 1의 트리플 랭킹부의 상세 구성도,
도 4는 본 발명의 바람직한 일실시예에 따른 도 1의 문서 랭킹부의 상세 구성도,
도 5는 본 발명의 바람직한 일실시예에 따른 온톨로지에 기반한 시맨틱 검색 랭킹 방법에 대한 전체 흐름도,
도 6은 본 발명의 바람직한 일실시예에 따른 도 5의 부분 그래프 랭킹 과정에 대한 상세 흐름도,
도 7은 본 발명의 바람직한 일실시예에 따른 도 5의 트리플 랭킹 과정에 대한 상세 흐름도,
도 8은 본 발명의 바람직한 일실시예에 따른 도 5의 문서 랭킹 과정에 대한 상세 흐름도이다.
* 도면의 주요 부분에 대한 부호의 설명
10 : 온톨로지에 기반한 시맨틱 검색 랭킹 시스템
20 : 온톨로지 기반 시맨틱 검색 엔진부
30 : 웹 문서 저장소 40 : 온톨로지 저장소
110 : 부분 그래프 랭킹부 120 : 트리플 랭킹부
130 : 문서 랭킹부 210 : 질의 정보 수신부
220 : 부분 그래프 선택부 230 : 트리플 변환부
240 : 문서 검색 수행부 250 : 검색 결과 처리부
201 : 부분 그래프 요소 가중치 계산기
202 : 부분 그래프 중요도 계산기 203 : 부분 그래프 순위 결정기
301 : 트리플 요소 가중치 계산기 302 : 트리플 중요도 계산기
303 : 트리플 순위 결정기 401 : 문서 요소 가중치 계산기
402 : 문서 중요도 계산기 403 : 문서 순위 결정기

Claims (38)

  1. 시맨틱 검색 랭킹 시스템에 있어서,
    온톨로지의 개념(Concept)과 관계(Relationship) 정보, 검색 이용자로부터의 질의 정보를 이용하여 선택된 부분 그래프 집합에 대해 각 부분 그래프의 우선순위를 결정하기 위한 부분 그래프 랭킹 수단;
    상기 부분 그래프 랭킹 수단에서 우선순위가 결정된 부분 그래프 집합을 기반으로 변환된 트리플 집합에 대해 각 트리플의 우선순위를 결정하기 위한 트리플 랭킹 수단; 및
    상기 트리플 랭킹 수단에서 우선순위가 결정된 트리플 집합을 기반으로 검색된 검색 결과 집합에 대해 각 검색 결과의 우선순위를 결정하기 위한 검색 결과 랭킹 수단
    을 포함하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  2. 제 1 항에 있어서,
    상기 부분 그래프 랭킹 수단은,
    기 제작된 온톨로지의 개념(Concept)과 관계(Relationship) 정보, 검색 이용자로부터의 질의 정보를 이용하여 선택된 부분 그래프 집합에 대해 부분 그래프 요소인 온톨로지 내의 개념과 관계의 요소 가중치를 계산하기 위한 부분 그래프 요소 가중치 계산 수단;
    상기 부분 그래프 요소 가중치 계산 수단에서 계산된 요소 가중치를 기반으로 각 부분 그래프의 중요도를 계산하기 위한 부분 그래프 중요도 계산 수단; 및
    상기 부분 그래프 중요도 계산 수단에서 계산된 각 부분 그래프의 중요도에 따라 부분 그래프의 우선순위를 결정하기 위한 부분 그래프 순위 결정 수단
    을 포함하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  3. 제 2 항에 있어서,
    상기 부분 그래프 요소 가중치 계산 수단은,
    상기 선택된 부분 그래프를 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하거나, 온톨로지 내의 개념체계를 이용하여 페널티(penalty) 값과 리워드(reward) 값을 계산하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  4. 제 2 항에 있어서,
    상기 부분 그래프 요소 가중치 계산 수단은,
    상기 선택된 부분 그래프를 구성하고 있는 구성 요소인 온톨로지 내의 개 념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하고, 온톨로지 내의 개념체계를 이용하여 페널티(penalty) 값과 리워드(reward) 값을 계산하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  5. 제 2 항에 있어서,
    상기 부분 그래프 중요도 계산 수단은,
    상기 부분 그래프 요소 가중치 계산 수단에서 계산된 요소 가중치와, 부분 그래프와 관련된 외부 요소를 고려하여 각 부분 그래프의 중요도를 계산하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  6. 제 2 항에 있어서,
    상기 부분 그래프 순위 결정 수단은,
    상기 부분 그래프 중요도 계산 수단에서 계산된 각 부분 그래프의 중요도에 따라 부분 그래프의 우선순위를 결정하고, 제 1 특정 값 이하의 중요도를 가진 부분 그래프를 제거하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  7. 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
    상기 트리플 랭킹 수단은,
    상기 부분 그래프 랭킹 수단에서 우선순위가 결정된 부분 그래프 집합을 기반으로 변환된 트리플 집합에 대해 각 트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship)의 요소 가중치를 계산하기 위한 트리플 요소 가중치 계산 수단;
    상기 트리플 요소 가중치 계산 수단에서 계산된 요소 가중치를 기반으로 각 트리플의 중요도를 계산하기 위한 트리플 중요도 계산 수단; 및
    상기 트리플 중요도 계산 수단에서 계산된 각 트리플의 중요도에 따라 트리플의 우선순위를 결정하기 위한 트리플 순위 결정 수단
    을 포함하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  8. 제 7 항에 있어서,
    상기 트리플 요소 가중치 계산 수단은,
    상기 변환된 트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하고, 온톨로지 내의 개념 및 관계와 질의 정보와의 거리를 계산하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  9. 제 7 항에 있어서,
    상기 트리플 중요도 계산 수단은,
    상기 트리플 요소 가중치 계산 수단에서 계산된 요소 가중치와, 트리플과 관련된 외부 요소를 고려하여 각 트리플의 중요도를 계산하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  10. 제 7 항에 있어서,
    상기 트리플 순위 결정 수단은,
    상기 트리플 중요도 계산 수단에서 계산된 각 트리플의 중요도에 따라 트리플의 우선순위를 결정하고, 제 2 특정 값 이하의 중요도를 가진 트리플을 제거하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  11. 제 7 항에 있어서,
    상기 검색 결과 랭킹 수단은,
    상기 트리플 랭킹 수단에서 우선순위가 결정된 트리플 집합을 기반으로 검색된 문서 집합에 대해 우선순위 결정을 위한 요소들의 요소 가중치를 계산하기 위한 문서 요소 가중치 계산 수단;
    상기 문서 요소 가중치 계산 수단에서 계산된 요소 가중치를 기반으로 각 문서의 중요도를 계산하기 위한 문서 중요도 계산 수단; 및
    상기 문서 중요도 계산 수단에서 계산된 각 문서의 중요도에 따라 문서의 우선순위를 결정하기 위한 문서 순위 결정 수단
    을 포함하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  12. 제 11 항에 있어서,
    상기 문서 요소 가중치 계산 수단은,
    상기 검색된 문서와 관련된 요소인 트리플의 추출 위치 정보 값, 해당 문서의 발행 시간과 문서의 출처를 고려한 가중치, 및 해당 문서를 검색 이용자들이 읽은 비율을 이용한 인기도를 계산하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  13. 제 11 항에 있어서,
    상기 문서 중요도 계산 수단은,
    상기 문서 요소 가중치 계산 수단에서 계산된 요소 가중치와, 문서와 관련된 외부 요소를 고려하여 각 문서의 중요도를 계산하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  14. 제 11 항에 있어서,
    상기 문서 순위 결정 수단은,
    상기 문서 중요도 계산 수단에서 계산된 각 문서의 중요도에 따라 문서의 우선순위를 결정하고, 제 3 특정 값 이하의 중요도를 가진 웹 문서를 제거하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 시스템.
  15. 부분 그래프 랭킹 장치에 있어서,
    기 제작된 온톨로지의 개념(Concept)과 관계(Relationship) 정보, 검색 이용자로부터의 질의 정보를 이용하여 선택된 부분 그래프 집합에 대해 부분 그래프 요소인 온톨로지 내의 개념과 관계의 요소 가중치를 계산하기 위한 부분 그래프 요소 가중치 계산 수단;
    상기 부분 그래프 요소 가중치 계산 수단에서 계산된 요소 가중치를 기반으로 각 부분 그래프의 중요도를 계산하기 위한 부분 그래프 중요도 계산 수단; 및
    상기 부분 그래프 중요도 계산 수단에서 계산된 각 부분 그래프의 중요도에 따라 부분 그래프의 우선순위를 결정하기 위한 부분 그래프 순위 결정 수단
    을 포함하는 부분 그래프 랭킹 장치.
  16. 제 15 항에 있어서,
    상기 부분 그래프 요소 가중치 계산 수단은,
    상기 선택된 부분 그래프를 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하거나, 온톨로지 내의 개념체계를 이용하여 페널티(penalty) 값과 리워드(reward) 값을 계산하는 것을 특징으로 하는 부분 그래프 랭킹 장치.
  17. 제 15 항에 있어서,
    상기 부분 그래프 요소 가중치 계산 수단은,
    상기 선택된 부분 그래프를 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하고, 온톨로지 내의 개념체계를 이용하여 페널티(penalty) 값과 리워드(reward) 값을 계산하는 것을 특징으로 하는 부분 그래프 랭킹 장치.
  18. 제 15 항에 있어서,
    상기 부분 그래프 중요도 계산 수단은,
    상기 부분 그래프 요소 가중치 계산 수단에서 계산된 요소 가중치와, 부분 그래프와 관련된 외부 요소를 고려하여 각 부분 그래프의 중요도를 계산하는 것을 특징으로 하는 부분 그래프 랭킹 장치.
  19. 제 15 항 내지 제 18 항 중 어느 한 항에 있어서,
    상기 부분 그래프 순위 결정 수단은,
    상기 부분 그래프 중요도 계산 수단에서 계산된 각 부분 그래프의 중요도에 따라 부분 그래프의 우선순위를 결정하고, 특정 값 이하의 중요도를 가진 부분 그래프를 제거하는 것을 특징으로 하는 부분 그래프 랭킹 장치.
  20. 트리플 랭킹 장치에 있어서,
    트리플 집합에 대해 각 트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship)의 요소 가중치를 계산하기 위한 트리플 요소 가중치 계산 수단;
    상기 트리플 요소 가중치 계산 수단에서 계산된 요소 가중치를 기반으로 각 트리플의 중요도를 계산하기 위한 트리플 중요도 계산 수단; 및
    상기 트리플 중요도 계산 수단에서 계산된 각 트리플의 중요도에 따라 트리플의 우선순위를 결정하기 위한 트리플 순위 결정 수단
    을 포함하는 트리플 랭킹 장치.
  21. 제 20 항에 있어서,
    상기 트리플 요소 가중치 계산 수단은,
    트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하고, 온톨로지 내의 개념 및 관계와 질의 정보와의 거리를 계산하는 것을 특징으로 하는 트리플 랭킹 장치.
  22. 제 21 항에 있어서,
    상기 트리플 중요도 계산 수단은,
    상기 트리플 요소 가중치 계산 수단에서 계산된 요소 가중치와, 트리플과 관련된 외부 요소를 고려하여 각 트리플의 중요도를 계산하는 것을 특징으로 하는 트리플 랭킹 장치.
  23. 제 20 항 내지 제 22 항 중 어느 한 항에 있어서,
    상기 트리플 순위 결정 수단은,
    상기 트리플 중요도 계산 수단에서 계산된 각 트리플의 중요도에 따라 트리플의 우선순위를 결정하고, 특정 값 이하의 중요도를 가진 트리플을 제거하는 것을 특징으로 하는 트리플 랭킹 장치.
  24. 시맨틱 검색 랭킹 방법에 있어서,
    온톨로지의 개념(Concept)과 관계(Relationship) 정보, 검색 이용자로부터의 질의 정보를 이용하여 선택된 부분 그래프 집합에 대해 각 부분 그래프의 우선순위를 결정하는 부분 그래프 랭킹 단계;
    상기 우선순위가 결정된 부분 그래프 집합을 기반으로 변환된 트리플 집합에 대해 각 트리플의 우선순위를 결정하는 트리플 랭킹 단계; 및
    상기 우선순위가 결정된 트리플 집합을 기반으로 검색된 검색 결과 집합에 대해 각 검색 결과의 우선순위를 결정하는 검색 결과 랭킹 단계
    를 포함하는 온톨로지에 기반한 시맨틱 검색 랭킹 방법.
  25. 제 24 항에 있어서,
    상기 부분 그래프 랭킹 단계는,
    기 제작된 온톨로지의 개념(Concept)과 관계(Relationship) 정보, 검색 이용자로부터의 질의 정보를 이용하여 선택된 부분 그래프 집합에 대해 부분 그래프 요소인 온톨로지 내의 개념과 관계의 요소 가중치를 계산하는 부분 그래프 요소 가중치 계산 단계;
    상기 부분 그래프 요소 가중치 계산 단계에서 계산된 요소 가중치를 기반으로 각 부분 그래프의 중요도를 계산하는 부분 그래프 중요도 계산 단계; 및
    상기 부분 그래프 중요도 계산 단계에서 계산된 각 부분 그래프의 중요도에 따라 부분 그래프의 우선순위를 결정하고, 제 1 특정 값 이하의 중요도를 가진 부분 그래프를 제거하는 부분 그래프 순위 결정 단계
    를 포함하는 온톨로지에 기반한 시맨틱 검색 랭킹 방법.
  26. 제 25 항에 있어서,
    상기 부분 그래프 요소 가중치 계산 단계는,
    상기 선택된 부분 그래프를 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하거나, 온톨로지 내의 개념체계를 이용하여 페널티(penalty) 값과 리워드(reward) 값을 계산하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 방법.
  27. 제 25 항에 있어서,
    상기 부분 그래프 요소 가중치 계산 단계는,
    상기 선택된 부분 그래프를 구성하고 있는 구성 요소인 온톨로지 내의 개 념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하고, 온톨로지 내의 개념체계를 이용하여 페널티(penalty) 값과 리워드(reward) 값을 계산하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 방법.
  28. 제 24 항 내지 제 27 항 중 어느 한 항에 있어서,
    상기 트리플 랭킹 단계는,
    상기 우선순위가 결정된 부분 그래프 집합을 기반으로 변환된 트리플 집합에 대해 각 트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship)의 요소 가중치를 계산하는 트리플 요소 가중치 계산 단계;
    상기 트리플 요소 가중치 계산 단계에서 계산된 요소 가중치를 기반으로 각 트리플의 중요도를 계산하는 트리플 중요도 계산 단계; 및
    상기 트리플 중요도 계산 단계에서 계산된 각 트리플의 중요도에 따라 트리플의 우선순위를 결정하고, 제 2 특정 값 이하의 중요도를 가진 트리플을 제거하는 트리플 순위 결정 단계
    를 포함하는 온톨로지에 기반한 시맨틱 검색 랭킹 방법.
  29. 제 28 항에 있어서,
    상기 트리플 요소 가중치 계산 단계는,
    상기 변환된 트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하고, 온톨로지 내의 개념 및 관계와 질의 정보와의 거리를 계산하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 방법.
  30. 제 28 항에 있어서,
    상기 검색 결과 랭킹 단계는,
    상기 우선순위가 결정된 트리플 집합을 기반으로 검색된 문서 집합에 대해 우선순위 결정을 위한 요소들의 요소 가중치를 계산하는 문서 요소 가중치 계산 단계;
    상기 문서 요소 가중치 계산 단계에서 계산된 요소 가중치를 기반으로 각 문서의 중요도를 계산하는 문서 중요도 계산 단계; 및
    상기 문서 중요도 계산 단계에서 계산된 각 문서의 중요도에 따라 문서의 우선순위를 결정하고, 제 3 특정 값 이하의 중요도를 가진 웹 문서를 제거하는 문서 순위 결정 단계
    를 포함하는 온톨로지에 기반한 시맨틱 검색 랭킹 방법.
  31. 제 30 항에 있어서,
    상기 문서 요소 가중치 계산 단계는,
    상기 검색된 문서와 관련된 요소인 트리플의 추출 위치 정보 값, 해당 문서의 발행 시간과 문서의 출처를 고려한 가중치, 및 해당 문서를 검색 이용자들이 읽은 비율을 이용한 인기도를 계산하는 것을 특징으로 하는 온톨로지에 기반한 시맨틱 검색 랭킹 방법.
  32. 부분 그래프 랭킹 방법에 있어서,
    기 제작된 온톨로지의 개념(Concept)과 관계(Relationship) 정보, 검색 이용자로부터의 질의 정보를 이용하여 선택된 부분 그래프 집합에 대해 부분 그래프 요소인 온톨로지 내의 개념과 관계의 요소 가중치를 계산하는 부분 그래프 요소 가중치 계산 단계;
    상기 계산된 요소 가중치를 기반으로 각 부분 그래프의 중요도를 계산하는 부분 그래프 중요도 계산 단계; 및
    상기 계산된 각 부분 그래프의 중요도에 따라 부분 그래프의 우선순위를 결정하는 부분 그래프 순위 결정 단계
    를 포함하는 부분 그래프 랭킹 방법.
  33. 제 32 항에 있어서,
    상기 부분 그래프 요소 가중치 계산 단계는,
    상기 선택된 부분 그래프를 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하거나, 온톨로지 내의 개념체계를 이용하여 페널티(penalty) 값과 리워드(reward) 값을 계산하는 것을 특징으로 하는 부분 그래프 랭킹 방법.
  34. 제 32 항에 있어서,
    상기 부분 그래프 요소 가중치 계산 단계는,
    상기 선택된 부분 그래프를 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하고, 온톨로지 내의 개념체계를 이용하여 페널티(penalty) 값과 리워드(reward) 값을 계산하는 것을 특징으로 하는 부분 그래프 랭킹 방법.
  35. 제 32 항 내지 제 34 항 중 어느 한 항에 있어서,
    상기 부분 그래프 순위 결정 단계는,
    상기 계산된 각 부분 그래프의 중요도에 따라 부분 그래프의 우선순위를 결정하고, 특정 값 이하의 중요도를 가진 부분 그래프를 제거하는 것을 특징으로 하 는 부분 그래프 랭킹 방법.
  36. 트리플 랭킹 방법에 있어서,
    트리플 집합에 대해 각 트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship)의 요소 가중치를 계산하는 트리플 요소 가중치 계산 단계;
    상기 계산된 요소 가중치를 기반으로 각 트리플의 중요도를 계산하는 트리플 중요도 계산 단계; 및
    상기 계산된 각 트리플의 중요도에 따라 트리플의 우선순위를 결정하는 트리플 순위 결정 단계
    를 포함하는 트리플 랭킹 방법.
  37. 제 36 항에 있어서,
    상기 트리플 요소 가중치 계산 단계는,
    트리플을 구성하고 있는 구성 요소인 온톨로지 내의 개념(Concept)과 관계(Relationship) 정보를 이용하여 각 요소의 인기도 및 정보량을 계산하고, 온톨로지 내의 개념 및 관계와 질의 정보와의 거리를 계산하는 것을 특징으로 하는 트리플 랭킹 방법.
  38. 제 36 항 또는 제 37 항에 있어서,
    상기 트리플 순위 결정 단계는,
    상기 계산된 각 트리플의 중요도에 따라 트리플의 우선순위를 결정하고, 특정 값 이하의 중요도를 가진 트리플을 제거하는 것을 특징으로 하는 트리플 랭킹 방법.
KR1020080043012A 2008-05-08 2008-05-08 랭킹 장치 및 그 방법과, 온톨로지에 기반한 시맨틱 검색랭킹 시스템 및 그 방법 KR20090117109A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080043012A KR20090117109A (ko) 2008-05-08 2008-05-08 랭킹 장치 및 그 방법과, 온톨로지에 기반한 시맨틱 검색랭킹 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080043012A KR20090117109A (ko) 2008-05-08 2008-05-08 랭킹 장치 및 그 방법과, 온톨로지에 기반한 시맨틱 검색랭킹 시스템 및 그 방법

Publications (1)

Publication Number Publication Date
KR20090117109A true KR20090117109A (ko) 2009-11-12

Family

ID=41601637

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080043012A KR20090117109A (ko) 2008-05-08 2008-05-08 랭킹 장치 및 그 방법과, 온톨로지에 기반한 시맨틱 검색랭킹 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR20090117109A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101290000B1 (ko) * 2011-01-31 2013-08-07 한양대학교 산학협력단 논문 랭킹 방법 및 장치
KR20170056480A (ko) * 2015-09-29 2017-05-23 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 리소스조합 처리방법, 장치, 설비 및 컴퓨터 저장매체
KR20180035477A (ko) * 2016-09-29 2018-04-06 (주)시지온 전자문서의 대표 단어 선정 방법, 전자 문서 제공 방법, 및 이를 수행하는 컴퓨팅 시스템

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101290000B1 (ko) * 2011-01-31 2013-08-07 한양대학교 산학협력단 논문 랭킹 방법 및 장치
KR20170056480A (ko) * 2015-09-29 2017-05-23 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 리소스조합 처리방법, 장치, 설비 및 컴퓨터 저장매체
US10521437B2 (en) 2015-09-29 2019-12-31 Baidu Online Network Technology (Beijing) Co., Ltd. Resource portfolio processing method, device, apparatus and computer storage medium
KR20180035477A (ko) * 2016-09-29 2018-04-06 (주)시지온 전자문서의 대표 단어 선정 방법, 전자 문서 제공 방법, 및 이를 수행하는 컴퓨팅 시스템

Similar Documents

Publication Publication Date Title
US10846346B2 (en) Search suggestion and display environment
US9336318B2 (en) Rich content for query answers
Vijayarajan et al. A generic framework for ontology-based information retrieval and image retrieval in web data
Bedi et al. Focused crawling of tagged web resources using ontology
US20150294015A1 (en) Techniques for presenting content to a user based on the user's preferences
US9183499B1 (en) Evaluating quality based on neighbor features
US20110246456A1 (en) Dynamic reranking of search results based upon source authority
Haribabu et al. A novel approach for ontology focused inter-domain personalized search based on semantic set expansion
US20120233160A1 (en) System and method for assisting a user to identify the contexts of search results
AU2017221807B2 (en) Preference-guided data exploration and semantic processing
US10810181B2 (en) Refining structured data indexes
RU2733481C2 (ru) Способ и система генерирования признака для ранжирования документа
WO2017011465A1 (en) Images for query answers
Dhingra et al. Towards intelligent information retrieval on web
Kaur et al. IHWC: intelligent hidden web crawler for harvesting data in urban domains
KR20090117109A (ko) 랭킹 장치 및 그 방법과, 온톨로지에 기반한 시맨틱 검색랭킹 시스템 및 그 방법
Wang et al. Towards services discovery based on service goal extraction and recommendation
Fafalios et al. Exploratory professional search through semantic post-analysis of search results
KR20100003084A (ko) 온톨로지 부분 그래프 추출 장치 및 그 방법과, 그를이용한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치및 그 방법
Arai et al. Efficiency improvement of e-learning document search engine for mobile browser
Vijaya et al. Metasearch engine: a technology for information extraction in knowledge computing
Jay et al. An approach to identify user interest by reranking personalize web
Ezhilarasi et al. Literature survey: Analysis on semantic web information retrieval methodologies
Al-Akashi Using Wikipedia Knowledge and Query Types in a New Indexing Approach for Web Search Engines
Hannech et al. Multi-space Projection Based Search Engine: Theoretical Model Instantiation and Prototype

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination