KR20100003084A - 온톨로지 부분 그래프 추출 장치 및 그 방법과, 그를이용한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치및 그 방법 - Google Patents

온톨로지 부분 그래프 추출 장치 및 그 방법과, 그를이용한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치및 그 방법 Download PDF

Info

Publication number
KR20100003084A
KR20100003084A KR1020080063189A KR20080063189A KR20100003084A KR 20100003084 A KR20100003084 A KR 20100003084A KR 1020080063189 A KR1020080063189 A KR 1020080063189A KR 20080063189 A KR20080063189 A KR 20080063189A KR 20100003084 A KR20100003084 A KR 20100003084A
Authority
KR
South Korea
Prior art keywords
ontology
graph
partial graph
weight
arcs
Prior art date
Application number
KR1020080063189A
Other languages
English (en)
Inventor
최은정
최호준
최지영
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020080063189A priority Critical patent/KR20100003084A/ko
Publication of KR20100003084A publication Critical patent/KR20100003084A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 온톨로지 부분 그래프 추출 장치 및 그 방법과, 그를 이용한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치 및 그 방법에 관한 것으로, 검색 사용자의 질의어와 의미적으로 부합하는 온톨로지 부분 그래프 집합을 추출하기 위한 온톨로지 부분 그래프 추출 장치 및 그 방법과, 웹 문서의 내용을 트리플(triple) 형태로 표현하고 있는 온톨로지를 기반으로 검색 사용자의 질의와 의미적으로 부합하는 트리플들을 그래프 이론을 적용하여 추출함으로써 상기 추출된 트리플들을 내용으로 포함하는 웹 문서들을 검색할 수 있도록 하기 위한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치 및 그 방법을 제공하고자 한다.
이를 위하여, 본 발명은 온톨로지 부분 그래프 추출 장치에 있어서, 질의와의 의미적 연관도에 따라 온톨로지 그래프 상의 각 노드와 아크에 가중치 값을 부여(설정)하기 위한 가중치 설정 수단; 상기 가중치 설정 수단에서 부여된 가중치가 높은 노드들과 아크들을 포함하는 온톨로지 부분 그래프를 탐색하기 위한 온톨로지 부분 그래프 탐색 수단; 및 상기 온톨로지 부분 그래프 탐색 수단에서 탐색된 온톨로지 부분 그래프의 가중치가 임계값 이상인 온톨로지 부분 그래프 집합을 생성하기 위한 온톨로지 부분 그래프 집합 생성 수단을 포함한다.
시맨틱 웹, 온톨로지, 트리플, 온톨로지 그래프, 부분 그래프, 추출, 의미적 매칭, 검색

Description

온톨로지 부분 그래프 추출 장치 및 그 방법과, 그를 이용한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치 및 그 방법{Apparatus and method for extracting partial ontology graph, and apparatus and method for semantic matching between user's question and ontology using thereof}
본 발명은 온톨로지 부분 그래프 추출 장치 및 그 방법과, 그를 이용하여 온톨로지를 기반으로 검색 사용자의 질의어와 의미적으로 부합하는 정보를 포함하는 웹 문서들을 제공하도록 하기 위한, 검색 사용자 질의와 온톨로지의 의미적 매칭 장치 및 그 방법에 관한 것으로, 더욱 상세하게는 검색 사용자의 질의어와 의미적으로 부합하는 온톨로지 부분 그래프 집합을 추출하기 위한 온톨로지 부분 그래프 추출 장치 및 그 방법과, 웹 문서 내용을 트리플(triple, 주어-서술어-목적어) 형태로 표현하고 있는 온톨로지를, 각 트리플의 주어와 목적어를 노드(node)로 서술어를 아크(arc)로 갖는 온톨로지 그래프로 변환하고, 검색 사용자의 질의어와 의미적으로 부합하는 온톨로지 부분 그래프 집합을 추출한 후, 다시 트리플 집합으로 변환함으로써, 상기 변환된 트리플들을 내용으로 가지는 웹 문서들을 검색할 수 있도록 하기 위한, 검색 사용자 질의와 온톨로지의 의미적 매칭 장치 및 그 방법에 관한 것이다.
이하의 일실시예에서는, 검색 사용자의 질의어와 의미적으로 연관된 온톨로지 부분 그래프 집합을 추출하기 위해, 온톨로지 그래프 상의 각 노드와 아크에 가중치를 부여하고, 온톨로지 부분 그래프를 탐색하는 과정에서도 온톨로지 부분 그래프의 가중치를 제한하는데, 이때 각 가중치 함수에 사용되는 가중치 요소들을 예로 들어 설명하나, 본 발명이 이에 한정되는 것이 아님을 미리 밝혀둔다.
종래의 검색 시스템은 웹 문서의 내용을 기반으로 하는 검색이 아닌, 단순 키워드 매칭(matching) 검색, 즉 질의어의 키워드를 포함하는 문서들을 검색 사용자들에게 보여줌으로써 정보를 제공하는 방식을 취하고 있어, 사용자의 검색 의도를 파악하는데 한계가 있다.
예를 들어, 검색 사용자가 ‘최근 인기있는 연예인과 자동차’라는 질의어를 입력했다고 가정하자. 종래의 키워드 매칭 검색 시스템은 ‘최근’, ‘인기있는’, ‘연예인’, ‘자동차’라는 키워드를 포함하는 웹 문서들을 검색해 줄 것이다. 하지만, 검색 사용자가 원하는 것은 ‘아이비의 자동차’라든지, ‘채연의 GX2 런칭 페스티벌’과 같은 내용의 문서일 것이다.
이 경우에, 만약 검색 사용자가 질의어와 의미적으로 연관된 웹 문서들을 얻기 위해서는 또 다른 방법의 검색(예 : ‘아이비 채연 자동차’ 검색)이나 사용자의 추가적인 행동이 필요한 문제점이 있다.
또한, 현재 다양하게 기하급수적으로 생산되고 있는 웹 문서들을 고려해 볼 때, 기존의 검색 서비스와 검색 기술을 개선하여 사용자에게 인지적 부담(cognitive load)을 최소화하면서 검색 사용자가 원하는 정보를 효율적이고 편리하게 검색할 수 있도록 하는 기술 개발이 필요하며, 특히 웹 문서에 대한 내용 기반 검색을 가능하게 하는, 온톨로지 부분 그래프 추출 방식과 그를 이용한 검색 사용자 질의와 웹 문서 내용 기반 온톨로지의 의미적 매칭 방식을 활용한 시맨틱 검색 시스템이 절실히 요구되고 있다.
따라서 상기와 같은 종래 기술은 웹 문서에 대한 검색 빈도 증가와 대량의 웹 문서들로 인하여 웹 문서 검색 및 관리에 소요되는 투입 시간, 인지적 부담, 및 심리적 부담 등이 가중되는 문제점이 있고, 또한 검색 사용자가 원하는 정보를 찾기 어려울 뿐만 아니라 의미적으로 연관된 웹 문서들을 얻기 위해 또 다른 방법의 검색이나 사용자의 추가적인 행동이 필요한 문제점이 있으며, 이러한 문제점을 해결하고 상기 요구에 부응하고자 하는 것이 본 발명의 과제이다.
따라서 본 발명은 검색 사용자의 질의어와 의미적으로 부합하는 온톨로지 부분 그래프 집합을 추출하기 위한, 온톨로지 부분 그래프 추출 장치 및 그 방법을 제공하는데 그 목적이 있다.
또한, 본 발명은 단순 키워드 매칭 검색이 아닌, 웹 문서의 내용을 트리플(triple) 형태로 표현하고 있는 온톨로지를 기반으로, 검색 사용자의 질의와 의미적으로 부합하는 트리플들을 그래프 이론을 적용하여 추출함으로써, 상기 추출된 트리플들을 내용으로 포함하는 웹 문서들을 검색할 수 있도록 하기 위한, 검색 사용자 질의와 온톨로지의 의미적 매칭 장치 및 그 방법을 제공하는데 다른 목적이 있다.
즉, 본 발명은 웹 문서의 내용을 트리플 형태로 표현한 온톨로지를 노드-아크 형태의 온톨로지 그래프로 변환하고, 상기 변환된 온톨로지 그래프에서 검색 사용자의 질의(질의어)와 의미적으로 연관된 온톨로지 부분 그래프 집합을 추출한 후, 다시 트리플 집합으로 변환함으로써, 상기 변환된 트리플들을 내용으로 가지는 웹 문서들을 검색할 수 있도록 하기 위한, 검색 사용자 질의와 온톨로지의 의미적 매칭 장치 및 그 방법을 제공하는데 다른 목적이 있다.
본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명의 장치는, 온톨로지 부분 그래프 추출 장치에 있어서, 질의와의 의미적 연관도에 따라 온톨로지 그래프 상의 각 노드와 아크에 가중치 값을 부여(설정)하기 위한 가중치 설정 수단; 상기 가중치 설정 수단에서 부여된 가중치가 높은 노드들과 아크들을 포함하는 온톨로지 부분 그래프를 탐색하기 위한 온톨로지 부분 그래프 탐색 수단; 및 상기 온톨로지 부분 그래프 탐색 수단에서 탐색된 온톨로지 부분 그래프의 가중치가 임계값 이상인 온톨로지 부분 그래프 집합을 생성하기 위한 온톨로지 부분 그래프 집합 생성 수단을 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명의 방법은, 온톨로지 부분 그래프 추출 방법에 있어서, 질의와의 의미적 연관도에 따라 온톨로지 그래프 상의 각 노 드와 아크에 가중치 값을 부여(설정)하는 가중치 설정 단계; 상기 부여된 가중치가 높은 노드들과 아크들을 포함하는 온톨로지 부분 그래프를 탐색하는 온톨로지 부분 그래프 탐색 단계; 및 상기 탐색된 온톨로지 부분 그래프의 가중치가 임계값 이상인 온톨로지 부분 그래프 집합을 생성하는 온톨로지 부분 그래프 집합 생성 단계를 포함한다.
한편, 상기 다른 목적을 달성하기 위한 본 발명의 장치는, 검색 사용자 질의와 온톨로지의 의미적 매칭 장치에 있어서, 트리플 기반 온톨로지를 노드-아크 형태의 온톨로지 그래프로 변환하기 위한 온톨로지 그래프 변환 수단; 상기 온톨로지 그래프 변환 수단에서 변환된 온톨로지 그래프로부터 검색 사용자의 질의와 의미적으로 연관된 온톨로지 부분 그래프 집합을 추출하기 위한 온톨로지 부분 그래프 추출 수단; 및 상기 온톨로지 부분 그래프 추출 수단에서 추출된 온톨로지 부분 그래프 집합을 트리플 집합으로 변환하기 위한 트리플 변환 수단을 포함한다.
또한, 상기 다른 목적을 달성하기 위한 본 발명의 방법은, 검색 사용자 질의와 온톨로지의 의미적 매칭 방법에 있어서, 트리플 기반 온톨로지를 노드-아크 형태의 온톨로지 그래프로 변환하는 온톨로지 그래프 변환 단계; 상기 변환된 온톨로지 그래프로부터 검색 사용자의 질의와 의미적으로 연관된 온톨로지 부분 그래프 집합을 추출하는 온톨로지 부분 그래프 추출 단계; 및 상기 추출된 온톨로지 부분 그래프 집합을 트리플 집합으로 변환하는 트리플 변환 단계를 포함한다.
상기와 같은 본 발명은, 검색 사용자의 질의어와 의미적으로 부합하는 온톨로지 부분 그래프 집합을 추출할 수 있는 효과가 있다.
또한, 본 발명은 웹 문서의 내용을 트리플 형태로 표현한 온톨로지를 노드-아크 형태의 온톨로지 그래프로 변환하고, 상기 변환된 온톨로지 그래프에서 검색 사용자의 질의(질의어)와 의미적으로 연관된 온톨로지 부분 그래프 집합을 추출한 후, 다시 트리플 집합으로 변환함으로써, 상기 변환된 트리플들을 내용으로 가지는 웹 문서들을 검색할 수 있도록 한다.
또한, 본 발명은 단순 키워드 매칭 검색이 아닌, 웹 문서의 내용을 기반으로 하는 시맨틱 검색 서비스를 가능하게 함으로써, 기존 키워드 매칭 검색 서비스에 대한 근본적인 문제점들을 해결하고, 또한 검색 사용자의 만족도를 크게 향상시킬 수 있다.
또한, 본 발명은 최근 웹 문서에 대한 검색 빈도 증가와 대량의 웹 문서들로 인하여 웹 문서 검색 및 관리의 비용에 해당하는 사용자의 투입 시간, 인지적 부담, 및 심리적 부담 등을 최소화하고, 검색의 이익인 효율성과 편리성을 최대화할 수 있을 뿐만 아니라, 의미적으로 관련된 컨텐츠를 부가적으로 손쉽게 취득할 수 있도록 하는 탁월한 효과가 있다.
상술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되어 있는 상세한 설명을 통하여 보다 명확해 질 것이며, 그에 따라 본 발명이 속하는 기 술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하기로 한다.
먼저, 본 발명의 이해를 돕기 위하여 시맨틱 웹 기술에 대해 좀 더 살펴보기로 한다.
팀 버너스-리(Tim Berners-Lee)는 1989년에 웹(World Wide Web)을 처음으로 제안하여, 기존에 널리 쓰이고 있던 클라이언트-서버(Client-Server) 구조와 HTML(HyperText Markup Language)의 마크업 언어로 인터넷 환경에서 어디에서나 개인의 정보를 웹에 올릴 수 있고, 브라우저를 통해 그 정보에 접근할 수 있는 정보의 공유 인프라를 갖출 수 있도록 하였다. 이에 따라, 수많은 정보가 인터넷에 올려지게 되고 유통되는 과정을 거치면서 대량의 정보가 인터넷상에 존재하게 되었고, 이를 상호 공유함으로써 사회 발전과 기술 발전을 촉진하고, 결과적으로 정보사회의 혁신을 이끄는 계기가 되었다.
그러나 정보의 양이 방대해짐으로써 자신이 원하는 정보를 찾기에 드는 노력과 시간이 점점 더 많아지는 현상이 발생하게 되었고, 웹을 이용한 다양한 응용 프로그램 및 서비스가 등장하면서 이 역시 유효하고 적절하게 찾아 이용하기에는 많은 어려움이 발생하게 되었다.
특히, 기존의 웹을 기반으로 한 검색 방법은 키워드에 의한 검색이 주류로서, 주로 단어의 빈도수나 어휘 정보를 이용하여 웹 문서의 우선순위를 결정하는 방식으로, 정작 사용자가 원하는 웹 문서를 찾는 데는 한계가 있다. 또한, 관련된 웹 문서를 확장하거나 통합, 공유하는 것이 매우 어렵다. 이러한 문제점은 기존의 웹과 마크업 언어가 인간 중심이고 인간이 보고 이해할 수 있도록 웹 브라우저의 표현 기술에 초점을 맞추고 있기 때문이다. 결국, 기존의 웹은 컴퓨터가 스스로 필요한 정보를 효과적으로 추출하고, 해석하고, 가공하는 기능을 충분히 제공하지 못하는 인간 중심의 정보 처리 기술이라고 할 수 있다.
이후, 기존의 웹을 확장하여 컴퓨터가 이해할 수 있는 잘 정의된 의미를 기반으로 의미적 상호 운용성(semantic interoperability)을 실현하고 인간과 컴퓨터 간의 효과적인 협동 체제를 구축할 수 있는 기술로서 시맨틱(Semantic) 웹이 등장하게 되었다.
팀 버너스-리는 시맨틱 웹이 기존의 웹과 완전히 구별되는 새로운 웹의 개념이 아니라 현재 웹을 확장하여 웹에 올라오는 정보에 잘 정의된 의미를 부여하고 이를 통해 컴퓨터와 사람이 협동적으로 작업을 수행할 수 있도록 하는 패러다임이라고 그 역할을 정의하였다. 시맨틱 웹은 웹상에 존재하는 정보를 사람뿐만 아니라 기계(컴퓨터)가 의미를 파악하여 사용자의 요구에 적합한 지능형 서비스를 제공하거나, 사람과 기계 또는 기계와 기계 상호 간에 협업을 원활히 수행함으로써 사람을 대신하여 자동적인 서비스가 가능한 웹을 말한다.
즉, 시맨틱 웹은 컴퓨터가 정보 자원의 의미를 이해하고, 자동화하고, 통합 하고, 재사용할 수 있는 차세대 웹 기술로서, 다음의 3가지 주요 요소로 이루어진다.
1) 온톨로지(ontology)
온톨로지는 공유된 개념화에 대한 형식적 명세 체계로서, 도메인 어휘의 의미 정보를 제공한다. 온톨로지는 일종의 지식 표현으로, 컴퓨터는 온톨로지로 표현된 개념을 이해하고 지식처리를 할 수 있다. 추론 등의 처리를 위해서는 온톨로지의 공리(axiom)와 규칙(rule) 체계가 필요하다.
2) 의미적으로 주석화된 웹(semantically annotated Web)
의미적으로 주석화된 웹이란 온톨로지로 주석화된 웹으로, 일종의 지식 베이스(knowledge base)이다. 시맨틱 웹에서는 인터넷의 분산 정보 자원을 의미적으로 통합하는 거대한 지식 베이스를 구축할 수 있다. 좁은 의미에서 기업 또는 기관의 정보 자원에 대한 지식 베이스를 구축할 수도 있다.
3) 에이전트(agent)
에이전트(agent)는 사람(사용자)을 대신하여 정보 자원을 수집·검색하고 추론하며, 다른 에이전트와 상호 정보를 교환하는 등의 일을 수행하는 지능형 에이전트이다. 지능형 에이전트는 시맨틱 웹 기반 응용 시스템의 핵심이라 할 수 있다.
시맨틱 웹은 온톨로지와 에이전트 기술을 활용하여 의미적 상호 운용성을 실현하며, 그에 따라 기존의 정보 표현 중심의 웹을 지식 기반 의미 중심의 웹으로 도약시킬 수 있게 되었다.
도 1은 본 발명의 바람직한 일실시예에 따른 검색 사용자 질의와 온톨로지의 의미적 매칭 장치 및 그를 이용한 시맨틱 검색 시스템의 구성도이다.
도 1에 도시된 바와 같이, 본 발명이 적용되는 시맨틱 검색 시스템은, 웹 컨텐츠 제공자 또는 자동 웹 문서 수집기(Crawler) 등을 통해 수집된 웹 문서들을 저장하고 있는 웹 문서 저장소(10), 상기 웹 문서 저장소(10)에 저장되어 있는 웹 문서의 내용을 트리플(주어-서술어-목적어) 형태로 인덱싱하여 구축한 온톨로지를 저장하고 있는 트리플 기반 온톨로지 저장소(20), 검색 사용자로부터 질의 정보(질의어)를 수신하기 위한 질의 정보 수신부(40), 상기 트리플 기반 온톨로지 저장소(20)에서 상기 질의 정보 수신부(40)로부터의 검색 사용자 질의어와 의미적으로 연관성이 있는 트리플들을 그래프 이론을 적용하여 추출하기 위한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치(30), 상기 검색 사용자 질의와 온톨로지의 의미적 매칭 장치(30)에서 추출된 트리플들을 내용으로 가지는 웹 문서들을 상기 웹 문서 저장소(10)에서 검색하기 위한 웹 문서 검색 수행부(50), 및 상기 웹 문서 검색 수행부(50)에서 검색된 웹 문서들을 내용 유사도에 따라 분류하거나 우선순위를 매겨 검색 사용자에게 친숙한 형태로 검색 결과를 보여주기 위한 검색 결과 처리부(60)를 포함한다.
다음으로, 상기 검색 사용자 질의와 온톨로지의 의미적 매칭 장치(30)의 각 구성 요소에 대하여 좀 더 상세히 살펴보면 다음과 같다.
도 1에 도시된 바와 같이, 상기 검색 사용자 질의와 온톨로지의 의미적 매칭 장치(30)는, 상기 트리플 기반 온톨로지 저장소(20)에 저장되어 있는 온톨로지, 즉 웹 문서의 내용을 트리플 형태로 표현한 온톨로지(트리플 기반 온톨로지)를 노드-아크 형태의 온톨로지 그래프로 변환하기 위한 온톨로지 그래프 변환부(31), 상기 온톨로지 그래프 변환부(31)에서 변환된 온톨로지 그래프에서 검색 사용자의 질의(질의어)와 의미적으로 연관된 온톨로지 부분 그래프 집합을 추출하기 위한 온톨로지 부분 그래프 추출부(32), 및 상기 온톨로지 부분 그래프 추출부(32)에서 추출된 온톨로지 부분 그래프 집합을 트리플 집합으로 변환하여 상기 웹 문서 검색 수행부(50)로 전달하기 위한 트리플 변환부(33)를 포함한다.
여기서, 상기 검색 사용자 질의와 온톨로지의 의미적 매칭 장치(30)의 동작에 대하여 간략하게 살펴보면 다음과 같다.
먼저, 웹 문서 내용을 트리플(주어-서술어-목적어) 형태로 표현하고 있는 온톨로지를, 온톨로지 그래프 변화부(31)를 통해 각 트리플 별로 주어와 목적어를 노드로 서술어를 아크로 갖는 온톨로지 그래프로 변환한다. 여기서, 트리플은 주어(subject), 서술어(property), 및 목적어(object)로 이루어지며, 간단히 (s,p,o)로 표시한다.
이렇게 온톨로지 그래프로 변환되면, 질의 정보 수신부(40)에서 획득한 질의(질의어)와 의미적으로 연관된 온톨로지 부분 그래프 집합을 온톨로지 부분 그래프 추출부(32)를 통해 추출한다. 즉, 상기 온톨로지 부분 그래프 추출부(32)는 상기 질의 정보 수신부(40)로부터의 질의(질의어)와의 의미적 연관도에 따라, 상기 온톨로지 그래프 변환부(31)에서 변환된 온톨로지 그래프 상의 각 노드와 아크의 가중치를 계산하여 부여하고, 상기 부여한 가중치의 제약이 있는 온톨로지 부분 그 래프를 탐색하여 온톨로지 부분 그래프 집합을 생성한다.
이렇게 생성된 온톨로지 부분 그래프 집합은 트리플 변환부(33)를 통해 트리플 집합으로 변환되고, 상기 변환된 트리플들을 내용으로 가지는 웹 문서들은 웹 문서 검색 수행부(50)를 통해 웹 문서 저장소(10)로부터 검색된다.
도 2는 본 발명의 바람직한 일실시예에 따른 도 1의 온톨로지 부분 그래프 추출부(32)의 상세 구성도이다.
도 2에 도시된 바와 같이, 상기 온톨로지 부분 그래프 추출부(32)는, 질의(질의어)와의 의미적 연관도에 따라 온톨로지 그래프 상의 각 노드와 아크에 가중치 값을 부여(설정)하기 위한 가중치 설정부(201), 상기 가중치 설정부(201)에서 부여된 가중치가 높은 노드들과 아크들을 포함하는 온톨로지 부분 그래프를 탐색하기 위한 온톨로지 부분 그래프 탐색부(202), 및 상기 온톨로지 부분 그래프 탐색부(202)에서 탐색된 온톨로지 부분 그래프의 가중치가 임계값 이상인 온톨로지 부분 그래프 집합을 생성하기 위한 온톨로지 부분 그래프 집합 생성부(203)를 포함한다.
여기서, 상기 온톨로지 부분 그래프 추출부(32)의 동작 및 그 구체적인 실시예에 대하여 좀 더 상세히 살펴보면 다음과 같다.
먼저, 가중치 설정부(201)에서는 질의(질의어)와의 의미적 연관도에 따라 온톨로지 그래프 상의 각 노드와 아크의 가중치 값을 계산하여 부여(설정)한다. 이때, 노드 및 아크의 가중치 값을 계산하여 부여하는 가중치 함수는 다음과 같은 8 가지 항목을 요소 가중치 값으로 고려할 수 있다.
1. 연관성(Relevance),
2. 정보량(Longtail),
3. 선호도(Preference),
4. 인기도(Popularity),
5. 신뢰도(Authority),
6. 중요도(Importance),
7. 최신성(Aging),
8. 문맥성(Context).
즉, 상기 가중치 설정부(201)는 노드와 아크의 요소 가중치 값들(연관성, 정보량, 선호도, 인기도, 신뢰도, 중요도, 최신성, 문맥성 등)과 온톨로지 그래프 상에서 질의어와 상기 노드 또는 아크와의 거리 등을 고려하여 노드와 아크의 가중치를 계산하여 부여(설정)한다.
여기서, 일예로 노드의 가중치 함수는 노드의 인기도(총 웹 문서 개수에 대한 상기 노드의 단어가 출현한 웹 문서의 개수)가 높을수록, 인기도가 최근에 높을수록, 그리고 질의어와 온톨로지 그래프 상의 거리가 가까울수록 높은 가중치를 부여할 수 있다.
이렇게 온톨로지 그래프 상의 각 노드와 아크에 가중치를 부여하는 방식에 대하여 좀 더 구체적으로 살펴보면 다음과 같다.
예를 들어, 노드 e의 가중치 함수 W(e)는 아래의 4가지 방식들 중 어느 하나 를 선택할 수 있다.
첫 번째 방식은 하기의 [수학식 1]과 같이 노드 e의 고유 인기도 P(e)가 높을수록 높은 가중치를 갖는 가중치 함수를 선택한다.
Figure 112008047367874-PAT00001
두 번째 방식은 하기의 [수학식 2]와 같이 노드 e의 상대 인기도 P'(e)가 높을수록 높은 가중치를 갖는 가중치 함수를 선택한다.
Figure 112008047367874-PAT00002
단, e'는 e의 상위 개념들이다.
세 번째 방식은 하기의 [수학식 3]과 같이 노드 e의 고유 인기도 P(e)에 최신성 A(e)를 함께 고려한 가중치 함수를 선택한다.
Figure 112008047367874-PAT00003
단, A(e)는 현재를 기준으로 e를 포함하는 기사 날짜들(하루 전, 일주일 전 등)의 평균값 또는 중간값(medium)이 작을수록, 즉 최근일수록, [0,1] 사이의 높은 값을 갖도록 하는 도 5와 같은 스텝사이즈(stepwise) 함수로 정의한다.
도 5에서, 예를 들면, d1은 일주일 전, d2는 일개월 전 등으로 표시할 수 있다.
네 번째 방식은 노드 e의 상대 인기도 P'(e)에 최신성 A(e)를 함께 고려한 가중치 함수를 선택한다.
Figure 112008047367874-PAT00004
한편, 아크 p의 가중치 함수 W(p)는 아래의 7가지 방식들 중 어느 하나를 선택할 수 있다.
첫 번째 방식은 하기의 [수학식 5]와 같이 아크 p의 고유 정보량 I(p)를 고려한 가중치 함수를 선택한다.
정보이론에 의하면 발생 확률이 낮은 사건일수록 많은 정보를 담고 있다. 이 를 활용하여 발생 확률이 낮은, 즉 p를 포함하는 트리플(s,p,o)의 개수가 적은 것일수록 높은 가중치를 준다.
Figure 112008047367874-PAT00005
두 번째 방식은 하기의 [수학식 6]과 같이 아크 p의 희귀성(Rarity) rar(p)를 고려한 가중치 함수를 선택한다.
정보이론에 의해 발생 빈도가 낮은 p일수록 높은 가중치를 부여한다.
Figure 112008047367874-PAT00006
참고로, p와 유사 의미의 프로퍼티(property)들이란, 예로 p가 '사귀다'일 때, '열애하다', '사랑하다' 등이 유사 의미의 프로퍼티(property)들이 될 수 있다.
세 번째 방식은 하기의 [수학식 7]과 같이 아크 p의 상대 정보량과 희귀성을 고려한 가중치 함수를 선택한다.
Figure 112008047367874-PAT00007
단, X(p)는 p와 유사한 의미를 갖는 프로퍼티(property)들의 집합이다.
네 번째 방식은 하기의 [수학식 8]과 같이 트리플
Figure 112008047367874-PAT00008
에서 아크 pi의 고유 정보량 I(pi)와 인기도 P(pi)를 고려한 가중치 함수를 선택한다.
Figure 112008047367874-PAT00009
단,
Figure 112008047367874-PAT00010
이다.
다섯 번째 방식은 하기의 [수학식 9]와 같이 트리플
Figure 112008047367874-PAT00011
에서 아크 pi의 희귀성 rar(pi)와 인기도 P(pi)를 고려한 가중치 함수를 선택한다.
Figure 112008047367874-PAT00012
여섯 번째 방식은 하기의 [수학식 10]과 같이 트리플
Figure 112008047367874-PAT00013
에서 아크 pi의 고유 정보량 I(pi), 인기도 P(pi) 및 최신성 A(pi)를 고려한 가중치 함수를 선택한다.
Figure 112008047367874-PAT00014
단, A(pi)는 앞에서 정의한 A(e)와 비슷하게, 현재를 기준으로 트리플
Figure 112008047367874-PAT00015
를 포함하는 기사 날짜들의 평균값 또는 중간값이 작을수록, 즉 최근일수록, [0,1] 사이의 높은 값을 갖도록 하는 스텝와이즈(stepwise) 함수로 정의한다.
일곱 번째 방식은 하기의 [수학식 11]과 같이 트리플
Figure 112008047367874-PAT00016
에서 아크 pi의 희귀성 rar(pi), 인기도 P(pi) 및 최신성 A(pi)를 고려한 가중치 함수를 선택한다.
Figure 112008047367874-PAT00017
다음으로, 온톨로지 부분 그래프 탐색부(202)는 상기 가중치 설정부(201)에서 부여된 가중치가 높은 노드들과 아크들을 포함하는 온톨로지 부분 그래프를 탐색한다. 즉, 상기 온톨로지 부분 그래프 탐색부(202)는 가중치가 높은 노드들과 아크들을 우선적으로 포함시키는 온톨로지 부분 그래프 탐색 알고리즘을 수행한다. 즉, 상기 온톨로지 부분 그래프 탐색부(202)는 온톨로지 부분 그래프의 가중치 제약을 고려하면서, 가중치 값이 높을수록 노드들과 아크들을 우선적으로 포함시키는 온톨로지 부분 그래프 탐색 알고리즘을 수행한다. 상기 온톨로지 부분 그래프 탐색 알고리즘은 해(solution)를 온톨로지 부분 그래프 집합으로 제공하고, 상용 검색 엔진에 적용할 수 있는 실용적인 알고리즘이며, 또한 다양한 형태의 질의어를 처리할 수 있다. 예를 들어, 질의어가 ‘향수’인 경우, 몸에 뿌리는 ‘향수’, 영화 ‘향수’, 고향에 대한 ‘향수’ 등 개별 의미에 대한 온톨로지 부분 그래프 집합이 주어진다.
이렇게 가중치가 높은 노드들과 아크들을 포함하는 온톨로지 부분 그래프를 탐색하는 방식(즉, 가중치 제약이 있는 온톨로지 부분 그래프 검색 방식)에 대하여 좀 더 구체적으로 살펴보면 다음과 같다.
예를 들어, 질의어를 포함하고 가중치 제약이 있는 온톨로지 부분 그래프를 탐색하되, 온톨로지 부분 그래프의 가중치를 최대화시키는 모델을 하기의 [수학식 12]와 같이 정의할 수 있다.
단, W(g)는 온톨로지 부분 그래프 g의 가중치이고, G'는 질의어를 모두 포함하고 있으며, 가중치 제약을 만족시키는 온톨로지 부분 그래프들의 집합이다.
이때, 온톨로지 부분 그래프의 가중치 W(g)는 하기의 [수학식 13]과 같이 노드와 아크들의 가중치의 곱으로 표현될 수 있는데, 이는 온톨로지 부분 그래프의 크기가 커지면 사용자의 질의 의도와 멀어질 가능성이 있으므로, 크기가 커질수록 온톨로지 부분 그래프의 가중치를 낮게 주기 위함이다.
Figure 112008047367874-PAT00019
상기 [수학식 13]의 목적식에 로그(log)를 취하면 하기의 [수학식 14]와 같다.
Figure 112008047367874-PAT00020
여기에 노드와 아크의 가중치는 모두 (0,1) 사이의 값으로 log 값이 음수가 되므로, 양쪽에 음수(-)를 취하면 최종 목적식은 하기의 [수학식 15]와 같이 정의될 수 있다.
Figure 112008047367874-PAT00021
그러면, 일반 모델은 하기의 [수학식 16]과 같이 정의될 수 있는데, 목적식이 선형(linear)식으로 표현됨으로써 기존에 잘 알려진 최적화 문제로 모델링할 수 있고, 또한 그 모델에 대해 성능이 우수하다고 알려진 알고리즘을 적용할 수도 있다.
Figure 112008047367874-PAT00022
상기 일반 모델은, 상용화를 위해 다양한 형태의 질의어를 처리할 수 있도록 질의어 타입별로 구체적인 모델과 알고리즘을 정의하는 것이 필요하다. 또한, 알고리즘은 하나의 온톨로지 부분 그래프가 아닌 온톨로지 부분 그래프 집합을 해(solution)로 제공하여 여러 가지 현실적인(practical) 방식을 제공할 수 있어야 한다.
첫째, 질의어가 1개일 때
명사 1개(e): 노드 e에서 온톨로지 그래프의 나머지 모든 노드들 간의 최단 경로를 찾는 최단경로문제(shortest path problem)로 정의할 수 있으며, 최단경로문제의 알고리즘으로 잘 알려진 "dijstra" 알고리즘을 이용하여 경로들을 찾을 수 있다. 이때, 경로를 찾는 과정에서 기준치(임계치) 이하의 가중치를 갖는 경로들은 검색을 중단함으로써 가중치 제약을 만족하는 경로들만 취한다.
서술어 1개(p): 단순히 기준치 이상의 가중치를 갖는 p를 포함하는 트리플들의 집합을 찾는다.
둘째, 질의어가 2개일 때
명사 2개(e1, e2): 노드들 e1, e2 사이에 k개의 최단경로들(shortest paths)을 찾는 문제, 즉 k-최단경로문제(k-shortest path problem)로 정의할 수 있으며, k-최단경로(k-shortest path) 알고리즘을 적용하는 과정에서 기준치 이상의 가중치를 갖는 경로들만 선택한다.
명사 1개, 서술어 1개(e, p): 노드 e와 p로 시작하면서 나머지 모든 노드들 간의 최단경로를 찾는 문제로 정의할 수 있으며, "dijstra" 알고리즘을 이용하여 경로들 중 가중치가 기준치 이상인 경로들의 집합을 구한다. 만약, e와 p가 직접 연결되어 있지 않은 경우 p는 무시하고 명사 1개일 때와 같이 해를 구한다.
서술어 2개(p1, p2): p1, p2가 이웃한 경로들을 찾거나 p1, p2가 가까이 연결된(예: 1 홉(hop) 이내) 경로들을 찾는데, 이때 각 경로들의 가중치가 기준치 이상인 것들만 선택한다.
셋째, 질의어가 3개일 때
명사 3개(e1, e2, e3): e1, e2, e3를 포함하는 k개의 최소 스테이너 트리들(minimun steiner trees)을 찾는 문제, 즉 k-최소 스테이너 트리 문제(k-minimum steiner tree problem)로 모델링할 수 있으며, 그것의 알고리즘을 적용하되, 기준치 이상의 가중치를 갖는 트리(tree)들만을 해로 갖는다.
명사 2개, 서술어 1개(e1, e2, p3): e1, e2 간의 k-최단경로문제(k-shortest path problem)를 풀되, p는 e1 또는 e2와 직접 연결되어 있는 경우를 우선적으로 고려한다. 만약, 직접 연결되지 않은 경우 p는 무시하고 명사 2개일 때와 같이 해를 구한다.
명사 1개, 서술어 2개(e, p1, p2): e에서 시작하는 경로들 중에서 p1, p2가 이웃한 경로를 찾거나 p1, p2가 가까이 연결된 경로를 찾는다.
서술어 3개(p1, p2, p3): p1, p2, p3가 연결된 경우를 찾거나 서술어의 각 쌍(pair)에 대해서 이웃한 경로를 찾는다.
다음으로, 온톨로지 부분 그래프 집합 생성부(203)는 상기 온톨로지 부분 그래프 탐색부(202)에서 탐색된 온톨로지 부분 그래프의 가중치가 임계값 이상인 온톨로지 부분 그래프 집합을 생성한다.
이때, 온톨로지 부분 그래프의 가중치 함수는 온톨로지 부분 그래프 내의 노드들과 아크들의 가중치 값들, 상기 노드들과 아크들의 온톨로지 그래프 내 위치 등을 가중치 요소로 활용할 수 있으며, 그것들의 함수로 표현될 수 있다.
예를 들어, 온톨로지 부분 그래프의 가중치 함수는, 온톨로지 부분 그래프 내 노드들의 인기도 값들의 곱과 온톨로지 부분 그래프 내 아크들의 정보량의 합 및 온톨로지 전체 그래프 계층구조 내에서 온톨로지 부분 그래프 노드들의 위치 등을 가중치 요소로 활용할 수 있다.
즉, 상기 온톨로지 부분 그래프 집합 생성부(203)는 온톨로지 부분 그래프의 요소 가중치 값들(연관성, 정보량, 선호도, 인기도, 신뢰도, 중요도, 최신성, 문맥성 등)과 온톨로지 전체 그래프의 계층구조 내에서 온톨로지 부분 그래프 노드들의 위치, 즉 노드의 위치가 상위에 있으면 개념이 추상화되므로 벌점(penalty)을 매기고, 하위에 있으면 구체화되므로 보상(reward)을 주는 것 등을 가중치 요소로 고려한다.
도 3은 본 발명의 바람직한 일실시예에 따른 검색 사용자 질의와 온톨로지의 의미적 매칭 방법에 대한 흐름도로서, 그 구체적인 실시예는 전술한 바와 같으므로, 여기서는 그 동작 요지만을 간략하게 설명하기로 한다.
먼저, 온톨로지 그래프 변환부(31)가 웹 문서의 내용을 트리플 형태로 표현한 온톨로지(트리플 기반 온톨로지)를 노드-아크 형태의 온톨로지 그래프로 변환한다(301). 즉, 상기 온톨로지 그래프 변환부(31)는 웹 문서 내용을 트리플(주어-서술어-목적어) 형태로 표현하고 있는 온톨로지를, 각 트리플 별로 주어와 목적어를 노드로 서술어를 아크로 갖는 온톨로지 그래프로 변환한다.
이후, 온톨로지 부분 그래프 추출부(32)가 상기 온톨로지 그래프 변환부(31)에서 변환된 온톨로지 그래프로부터 검색 사용자의 질의(질의어)와 의미적으로 연관된 온톨로지 부분 그래프 집합을 추출한다(302). 즉, 온톨로지 부분 그래프 추출부(32)는 상기 검색 사용자의 질의(질의어)와의 의미적 연관도에 따라, 상기 온톨로지 그래프 변환부(31)에서 변환된 온톨로지 그래프 상의 각 노드와 아크의 가중치를 계산하여 부여하고, 상기 부여한 가중치의 제약이 있는 온톨로지 부분 그래프를 탐색하여 온톨로지 부분 그래프 집합을 생성한다.
이후, 트리플 변환부(33)가 상기 온톨로지 부분 그래프 추출부(32)에서 추출된 온톨로지 부분 그래프 집합을 트리플 집합으로 변환한다(303). 즉, 상기 트리플 변환부(33)는 상기 온톨로지 부분 그래프 추출부(32)에서 추출된 온톨로지 부분 그래프 집합을 트리플 집합으로 변환하여 웹 문서 검색 수행부(50)로 전달한다.
그러면, 웹 문서 검색 수행부(50)는 상기 트리플 변환부(33)에서 변환된 트리플들을 내용으로 가지는 웹 문서들을 웹 문서 저장소(10)로부터 검색한다. 즉, 온톨로지에 상기 트리플들로 인덱싱되어 있는 웹 문서들을 검색한다.
도 4는 본 발명의 바람직한 일실시예에 따른 도 3의 온톨로지 부분 그래프 추출 과정에 대한 상세 흐름도로서, 그 구체적인 실시예는 전술한 바와 같으므로, 여기서는 그 동작 요지만을 간략하게 설명하기로 한다.
먼저, 가중치 설정부(201)가 질의(질의어)와의 의미적 연관도에 따라 온톨로지 그래프 상의 각 노드와 아크의 가중치 값을 계산하여 부여(설정)한다(401).
이후, 온톨로지 부분 그래프 탐색부(202)는 상기 가중치 설정부(201)에서 부여된 가중치가 높은 노드들과 아크들을 포함하는 온톨로지 부분 그래프를 탐색한다. 즉, 상기 온톨로지 부분 그래프 탐색부(202)는 가중치가 높은 노드들과 아크들을 우선적으로 포함시키는 온톨로지 부분 그래프 탐색 알고리즘을 수행한다(402).
이후, 온톨로지 부분 그래프 집합 생성부(203)는 상기 온톨로지 부분 그래프 탐색부(202)에서 탐색된 온톨로지 부분 그래프의 가중치가 임계값 이상인 온톨로지 부분 그래프 집합을 생성한다(403).
한편, 전술한 바와 같은 본 발명의 방법은 컴퓨터 프로그램으로 작성이 가능하다. 그리고 상기 프로그램을 구성하는 코드 및 코드 세그먼트는 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 작성된 프로그램은 컴퓨터가 읽을 수 있는 기록매체(정보저장매체)에 저장되고, 컴퓨터에 의하여 판독되고 실행됨으로써 본 발명의 방법을 구현한다. 그리고 상기 기록매체는 컴퓨 터가 판독할 수 있는 모든 형태의 기록매체를 포함한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
본 발명은 기존 키워드 매칭 검색 시스템들의 근본적인 문제점, 즉 질의어의 키워드를 포함하는 웹 문서들만으로 사용자가 원하는 정보를 제공할 수 없다는 한계를 극복하고, 질의어와 의미적으로 연관성이 있는 웹 문서들을 다양하게 제공함으로써, 정확성(precision)과 재현성(recall) 측면에서 높은 사용자 만족도를 가지는 시맨틱 검색 시스템 등을 구축하는데 이용될 수 있다.
도 1은 본 발명의 바람직한 일실시예에 따른 검색 사용자 질의와 온톨로지의 의미적 매칭 장치 및 그를 이용한 시맨틱 검색 시스템의 구성도,
도 2는 본 발명의 바람직한 일실시예에 따른 도 1의 온톨로지 부분 그래프 추출부의 상세 구성도,
도 3은 본 발명의 바람직한 일실시예에 따른 검색 사용자 질의와 온톨로지의 의미적 매칭 방법에 대한 흐름도,
도 4는 본 발명의 바람직한 일실시예에 따른 도 3의 온톨로지 부분 그래프 추출 과정에 대한 상세 흐름도,
도 5는 일반적인 스텝와이즈(stepwise) 함수에 대한 일예시도이다.
* 도면의 주요 부분에 대한 부호의 설명
10 : 웹 문서 저장소 20 : 트리플 기반 온톨로지 저장소
30 : 검색 사용자 질의와 온톨로지의 의미적 매칭 장치
40 : 질의 정보 수신부 50 : 웹 문서 검색 수행부
60 : 검색 결과 처리부 31 : 온톨로지 그래프 변환부
32 : 온톨로지 부분 그래프 추출부 33 : 트리플 변환부
201 : 가중치 설정부 202 : 온톨로지 부분 그래프 탐색부
203 : 온톨로지 부분 그래프 집합 생성부

Claims (24)

  1. 온톨로지 부분 그래프 추출 장치에 있어서,
    질의와의 의미적 연관도에 따라 온톨로지 그래프 상의 각 노드와 아크에 가중치 값을 부여(설정)하기 위한 가중치 설정 수단;
    상기 가중치 설정 수단에서 부여된 가중치가 높은 노드들과 아크들을 포함하는 온톨로지 부분 그래프를 탐색하기 위한 온톨로지 부분 그래프 탐색 수단; 및
    상기 온톨로지 부분 그래프 탐색 수단에서 탐색된 온톨로지 부분 그래프의 가중치가 임계값 이상인 온톨로지 부분 그래프 집합을 생성하기 위한 온톨로지 부분 그래프 집합 생성 수단
    을 포함하는 온톨로지 부분 그래프 추출 장치.
  2. 제 1 항에 있어서,
    상기 가중치 설정 수단은,
    노드와 아크의 요소 가중치 값들과 온톨로지 그래프 상에서 질의어와 노드 또는 아크와의 거리를 고려하여 노드와 아크의 가중치를 계산하여 부여(설정)하는 것을 특징으로 하는 온톨로지 부분 그래프 추출 장치.
  3. 제 2 항에 있어서,
    상기 노드와 아크의 요소 가중치 값은,
    연관성(Relevance), 정보량(Longtail), 선호도(Preference), 인기도(Popularity), 신뢰도(Authority), 중요도(Importance), 최신성(Aging), 및 문맥성(Context) 중에서 하나 이상을 포함하는 것을 특징으로 하는 온톨로지 부분 그래프 추출 장치.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 온톨로지 부분 그래프 탐색 수단은,
    온톨로지 부분 그래프의 가중치 제약을 고려하면서, 가중치 값이 높을수록 노드들과 아크들을 우선적으로 포함시키는 온톨로지 부분 그래프 탐색 알고리즘을 수행하는 것을 특징으로 하는 온톨로지 부분 그래프 추출 장치.
  5. 제 4 항에 있어서,
    상기 온톨로지 부분 그래프 집합 생성 수단은,
    온톨로지 부분 그래프 내의 노드들과 아크들의 가중치 값들, 노드들과 아크들의 온톨로지 그래프 내 위치를 가중치 요소로 고려하는 것을 특징으로 하는 온톨로지 부분 그래프 추출 장치.
  6. 검색 사용자 질의와 온톨로지의 의미적 매칭 장치에 있어서,
    트리플 기반 온톨로지를 노드-아크 형태의 온톨로지 그래프로 변환하기 위한 온톨로지 그래프 변환 수단;
    상기 온톨로지 그래프 변환 수단에서 변환된 온톨로지 그래프로부터 검색 사용자의 질의와 의미적으로 연관된 온톨로지 부분 그래프 집합을 추출하기 위한 온톨로지 부분 그래프 추출 수단; 및
    상기 온톨로지 부분 그래프 추출 수단에서 추출된 온톨로지 부분 그래프 집합을 트리플 집합으로 변환하기 위한 트리플 변환 수단
    을 포함하는 검색 사용자 질의와 온톨로지의 의미적 매칭 장치.
  7. 제 6 항에 있어서,
    상기 온톨로지 그래프 변환 수단은,
    웹 문서 내용을 트리플(주어-서술어-목적어) 형태로 표현하고 있는 온톨로지를, 각 트리플 별로 주어와 목적어를 노드로 서술어를 아크로 갖는 온톨로지 그래프로 변환하는 것을 특징으로 하는 검색 사용자 질의와 온톨로지의 의미적 매칭 장치.
  8. 제 6 항 또는 제 7 항에 있어서,
    상기 온톨로지 부분 그래프 추출 수단은,
    상기 온톨로지 그래프 변환 수단에서 변환된 온톨로지 그래프 상의 각 노드와 아크에 질의와의 의미적 연관도에 따라 가중치 값을 부여(설정)하기 위한 가중치 설정 수단;
    상기 가중치 설정 수단에서 부여된 가중치가 높은 노드들과 아크들을 포함하는 온톨로지 부분 그래프를 탐색하기 위한 온톨로지 부분 그래프 탐색 수단; 및
    상기 온톨로지 부분 그래프 탐색 수단에서 탐색된 온톨로지 부분 그래프의 가중치가 임계값 이상인 온톨로지 부분 그래프 집합을 생성하기 위한 온톨로지 부분 그래프 집합 생성 수단
    을 포함하는 검색 사용자 질의와 온톨로지의 의미적 매칭 장치.
  9. 제 8 항에 있어서,
    상기 가중치 설정 수단은,
    노드와 아크의 요소 가중치 값들과 온톨로지 그래프 상에서 질의어와 노드 또는 아크와의 거리를 고려하여 노드와 아크의 가중치를 계산하여 부여(설정)하는 것을 특징으로 하는 검색 사용자 질의와 온톨로지의 의미적 매칭 장치.
  10. 제 9 항에 있어서,
    상기 노드와 아크의 요소 가중치 값은,
    연관성(Relevance), 정보량(Longtail), 선호도(Preference), 인기도(Popularity), 신뢰도(Authority), 중요도(Importance), 최신성(Aging), 및 문맥성(Context) 중에서 하나 이상을 포함하는 것을 특징으로 하는 검색 사용자 질의와 온톨로지의 의미적 매칭 장치.
  11. 제 8 항에 있어서,
    상기 온톨로지 부분 그래프 탐색 수단은,
    온톨로지 부분 그래프의 가중치 제약을 고려하면서, 가중치 값이 높을수록 노드들과 아크들을 우선적으로 포함시키는 온톨로지 부분 그래프 탐색 알고리즘을 수행하는 것을 특징으로 하는 검색 사용자 질의와 온톨로지의 의미적 매칭 장치.
  12. 제 8 항에 있어서,
    상기 온톨로지 부분 그래프 집합 생성 수단은,
    온톨로지 부분 그래프 내의 노드들과 아크들의 가중치 값들, 노드들과 아크들의 온톨로지 그래프 내 위치를 가중치 요소로 고려하는 것을 특징으로 하는 검색 사용자 질의와 온톨로지의 의미적 매칭 장치.
  13. 온톨로지 부분 그래프 추출 방법에 있어서,
    질의와의 의미적 연관도에 따라 온톨로지 그래프 상의 각 노드와 아크에 가중치 값을 부여(설정)하는 가중치 설정 단계;
    상기 부여된 가중치가 높은 노드들과 아크들을 포함하는 온톨로지 부분 그래프를 탐색하는 온톨로지 부분 그래프 탐색 단계; 및
    상기 탐색된 온톨로지 부분 그래프의 가중치가 임계값 이상인 온톨로지 부분 그래프 집합을 생성하는 온톨로지 부분 그래프 집합 생성 단계
    를 포함하는 온톨로지 부분 그래프 추출 방법.
  14. 제 13 항에 있어서,
    상기 가중치 설정 단계는,
    노드와 아크의 요소 가중치 값들과 온톨로지 그래프 상에서 질의어와 노드 또는 아크와의 거리를 고려하여 노드와 아크의 가중치를 계산하여 부여(설정)하는 것을 특징으로 하는 온톨로지 부분 그래프 추출 방법.
  15. 제 14 항에 있어서,
    상기 노드와 아크의 요소 가중치 값은,
    연관성(Relevance), 정보량(Longtail), 선호도(Preference), 인기도(Popularity), 신뢰도(Authority), 중요도(Importance), 최신성(Aging), 및 문맥성(Context) 중에서 하나 이상을 포함하는 것을 특징으로 하는 온톨로지 부분 그래프 추출 방법.
  16. 제 13 항 내지 제 15 항 중 어느 한 항에 있어서,
    상기 온톨로지 부분 그래프 탐색 단계는,
    온톨로지 부분 그래프의 가중치 제약을 고려하면서, 가중치 값이 높을수록 노드들과 아크들을 우선적으로 포함시키는 온톨로지 부분 그래프 탐색 알고리즘을 수행하는 것을 특징으로 하는 온톨로지 부분 그래프 추출 방법.
  17. 제 16 항에 있어서,
    상기 온톨로지 부분 그래프 집합 생성 단계는,
    온톨로지 부분 그래프 내의 노드들과 아크들의 가중치 값들, 노드들과 아크들의 온톨로지 그래프 내 위치를 가중치 요소로 고려하는 것을 특징으로 하는 온톨로지 부분 그래프 추출 방법.
  18. 검색 사용자 질의와 온톨로지의 의미적 매칭 방법에 있어서,
    트리플 기반 온톨로지를 노드-아크 형태의 온톨로지 그래프로 변환하는 온톨로지 그래프 변환 단계;
    상기 변환된 온톨로지 그래프로부터 검색 사용자의 질의와 의미적으로 연관된 온톨로지 부분 그래프 집합을 추출하는 온톨로지 부분 그래프 추출 단계; 및
    상기 추출된 온톨로지 부분 그래프 집합을 트리플 집합으로 변환하는 트리플 변환 단계
    를 포함하는 검색 사용자 질의와 온톨로지의 의미적 매칭 방법.
  19. 제 18 항에 있어서,
    상기 온톨로지 그래프 변환 단계는,
    웹 문서 내용을 트리플(주어-서술어-목적어) 형태로 표현하고 있는 온톨로지를, 각 트리플 별로 주어와 목적어를 노드로 서술어를 아크로 갖는 온톨로지 그래프로 변환하는 것을 특징으로 하는 검색 사용자 질의와 온톨로지의 의미적 매칭 방법.
  20. 제 18 항 또는 제 19 항에 있어서,
    상기 온톨로지 부분 그래프 추출 단계는,
    상기 변환된 온톨로지 그래프 상의 각 노드와 아크에 질의와의 의미적 연관도에 따라 가중치 값을 부여(설정)하는 가중치 설정 단계;
    상기 부여된 가중치가 높은 노드들과 아크들을 포함하는 온톨로지 부분 그래프를 탐색하는 온톨로지 부분 그래프 탐색 단계; 및
    상기 탐색된 온톨로지 부분 그래프의 가중치가 임계값 이상인 온톨로지 부분 그래프 집합을 생성하는 온톨로지 부분 그래프 집합 생성 단계
    를 포함하는 검색 사용자 질의와 온톨로지의 의미적 매칭 방법.
  21. 제 20 항에 있어서,
    상기 가중치 설정 단계는,
    노드와 아크의 요소 가중치 값들과 온톨로지 그래프 상에서 질의어와 노드 또는 아크와의 거리를 고려하여 노드와 아크의 가중치를 계산하여 부여(설정)하는 것을 특징으로 하는 검색 사용자 질의와 온톨로지의 의미적 매칭 방법.
  22. 제 21 항에 있어서,
    상기 노드와 아크의 요소 가중치 값은,
    연관성(Relevance), 정보량(Longtail), 선호도(Preference), 인기도(Popularity), 신뢰도(Authority), 중요도(Importance), 최신성(Aging), 및 문맥 성(Context) 중에서 하나 이상을 포함하는 것을 특징으로 하는 검색 사용자 질의와 온톨로지의 의미적 매칭 방법.
  23. 제 20 항에 있어서,
    상기 온톨로지 부분 그래프 탐색 단계는,
    온톨로지 부분 그래프의 가중치 제약을 고려하면서, 가중치 값이 높을수록 노드들과 아크들을 우선적으로 포함시키는 온톨로지 부분 그래프 탐색 알고리즘을 수행하는 것을 특징으로 하는 검색 사용자 질의와 온톨로지의 의미적 매칭 방법.
  24. 제 20 항에 있어서,
    상기 온톨로지 부분 그래프 집합 생성 단계는,
    온톨로지 부분 그래프 내의 노드들과 아크들의 가중치 값들, 노드들과 아크들의 온톨로지 그래프 내 위치를 가중치 요소로 고려하는 것을 특징으로 하는 검색 사용자 질의와 온톨로지의 의미적 매칭 방법.
KR1020080063189A 2008-06-30 2008-06-30 온톨로지 부분 그래프 추출 장치 및 그 방법과, 그를이용한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치및 그 방법 KR20100003084A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080063189A KR20100003084A (ko) 2008-06-30 2008-06-30 온톨로지 부분 그래프 추출 장치 및 그 방법과, 그를이용한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080063189A KR20100003084A (ko) 2008-06-30 2008-06-30 온톨로지 부분 그래프 추출 장치 및 그 방법과, 그를이용한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치및 그 방법

Publications (1)

Publication Number Publication Date
KR20100003084A true KR20100003084A (ko) 2010-01-07

Family

ID=41813037

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080063189A KR20100003084A (ko) 2008-06-30 2008-06-30 온톨로지 부분 그래프 추출 장치 및 그 방법과, 그를이용한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치및 그 방법

Country Status (1)

Country Link
KR (1) KR20100003084A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160065372A (ko) 2014-11-28 2016-06-09 (주)아이와즈 구조화된 지식정보와 문서수집을 이용한 지식확장 및 검증 시스템, 그 방법, 기록매체
KR102147854B1 (ko) * 2020-06-08 2020-08-25 한화시스템(주) 전장상황 다중추론 시스템 및 방법
KR20220022701A (ko) * 2020-08-19 2022-02-28 경기대학교 산학협력단 지식 그래프 추론 기반의 오픈 도메인 질문 응답 시스템

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160065372A (ko) 2014-11-28 2016-06-09 (주)아이와즈 구조화된 지식정보와 문서수집을 이용한 지식확장 및 검증 시스템, 그 방법, 기록매체
KR102147854B1 (ko) * 2020-06-08 2020-08-25 한화시스템(주) 전장상황 다중추론 시스템 및 방법
KR20220022701A (ko) * 2020-08-19 2022-02-28 경기대학교 산학협력단 지식 그래프 추론 기반의 오픈 도메인 질문 응답 시스템

Similar Documents

Publication Publication Date Title
KR100815563B1 (ko) Dbms 기반 지식 확장 및 추론 서비스 시스템 및 그방법
Vijayarajan et al. A generic framework for ontology-based information retrieval and image retrieval in web data
Hildebrand et al. An analysis of search-based user interaction on the semantic web
Dong et al. A survey in semantic search technologies
Binding et al. KOS at your service: Programmatic access to knowledge organisation systems
Thangaraj et al. An architectural design for effective information retrieval in semantic web
Singh et al. Information retrieval (IR) through semantic web (SW): an overview
Wang et al. Multi-source knowledge integration based on machine learning algorithms for domain ontology
CN109948150A (zh) 一种多域环境中基于知识图谱的高性能服务语境发现方法
Both et al. A service-oriented search framework for full text, geospatial and semantic search
Marx et al. Exploring term networks for semantic search over RDF knowledge graphs
KR20100003084A (ko) 온톨로지 부분 그래프 추출 장치 및 그 방법과, 그를이용한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치및 그 방법
Wang et al. Towards services discovery based on service goal extraction and recommendation
KR20100070084A (ko) 대용량 온톨로지에서 사용자 질의 관련 지식을 실시간으로 검색하기 위한 장치 및 그 방법
Khan et al. Semantic search revisited
Cudré-Mauroux Semantic Search.
John et al. A personalised user preference and feature based semantic information retrieval system in semantic web search
Unni et al. Overview of approaches to semantic web search
Singh et al. Semantic web mining: survey and analysis
KR20090117109A (ko) 랭킹 장치 및 그 방법과, 온톨로지에 기반한 시맨틱 검색랭킹 시스템 및 그 방법
Carmagnola Handling semantic heterogeneity in interoperable distributed user models
Sahu et al. Analytical study on intelligent information retrieval system using semantic network
Ezhilarasi et al. Literature survey: Analysis on semantic web information retrieval methodologies
Paul et al. Enterprise geographic information system (E-GIS): A service-based architecture for geo-spatial data interoperability
Czerski et al. What NEKST?—semantic search engine for polish internet

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination