KR100522839B1 - Incremental construction of thesauri,selective-spreading based browsing and intelligent query processing in electronic commerce - Google Patents

Incremental construction of thesauri,selective-spreading based browsing and intelligent query processing in electronic commerce Download PDF

Info

Publication number
KR100522839B1
KR100522839B1 KR10-2001-0019683A KR20010019683A KR100522839B1 KR 100522839 B1 KR100522839 B1 KR 100522839B1 KR 20010019683 A KR20010019683 A KR 20010019683A KR 100522839 B1 KR100522839 B1 KR 100522839B1
Authority
KR
South Korea
Prior art keywords
thesaurus
query
objects
instances
categories
Prior art date
Application number
KR10-2001-0019683A
Other languages
Korean (ko)
Other versions
KR20010084917A (en
Inventor
양재동
최재훈
Original Assignee
(주)케이테크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)케이테크 filed Critical (주)케이테크
Priority to KR10-2001-0019683A priority Critical patent/KR100522839B1/en
Publication of KR20010084917A publication Critical patent/KR20010084917A/en
Application granted granted Critical
Publication of KR100522839B1 publication Critical patent/KR100522839B1/en

Links

Landscapes

  • Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)

Abstract

본 발명은 객체지향 패러다임을 이용하여 전자 상거래에서 상품 검색을 지능적으로 구축하고 관리할 수 있는 객체지향 방식의 시소러스 구축, 브라우징 그리고 질의 방법에 관한 것이다. 이 패러다임의 상속 메커니즘은 시소러스에 표현된 개념들간의 관계를 구조적으로 파악할 수 있게 하여 전문가가 시소러스를 점진적으로 그리고 편리하게 구축할 수 있도록 지원한다. 특히, 방대한 시소러스를 여러 전문가들이 서로 다른 호스트에서 구축할 경우, 이 메커니즘에 의해 파악된 정보는 시소러스의 의미적 일관성을 유지시킬 수 있도록 도와주며, 전문가가 직접 개념들간의 관련 정도를 모두 명시해야 하는 부담을 최소화하기 때문에 시소러스 구축 비용을 감소시킬 수 있다. 본 지능형 객체 지향 시소러스 시스템은 또한 선택적 확장 브라우징 기능과 객체-지향 방식에 근거한 지능적 질의 처리 기능을 제공한다.The present invention relates to an object-oriented thesaurus construction, browsing and query method that can intelligently build and manage product search in an electronic commerce using an object-oriented paradigm. This paradigm's inheritance mechanism allows the expert to build the thesaurus progressively and conveniently by providing a structural grasp of the relationships between the concepts expressed in the thesaurus. In particular, when a large thesaurus is built by different experts on different hosts, the information captured by this mechanism helps maintain the thesaurus's semantic consistency, and the expert must specify all the relevance of the concepts. Minimizing the burden can reduce the cost of building a thesaurus. The intelligent object-oriented thesaurus system also provides selective extended browsing and intelligent query processing based on object-oriented methods.

Description

전자상거래에서 효과적으로 상품을 검색하기 위한 시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징 그리고 지능형 질의 방식{Incremental construction of thesauri,selective-spreading based browsing and intelligent query processing in electronic commerce}Incremental construction of the sauri, selective-spreading based browsing and intelligent query processing in electronic commerce}

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

본 발명은 전자 상거래의 정보 시스템에서 인테리어, 화학 사이트, 전자 쇼핑몰 등 특정 정보를 효과적으로 검색할 수 있도록 지원하는 도메인 지식 구축 방법에 대한 기술 분야에 속한다. 특히, 객체지향 패러다임을 시소러스에 적용함으로써 시스템의 용어 추천 방식의 구축, 개념화(conceptualization) 방식의 브라우징 그리고 지능형 질의 방식의 직접 접근 방법을 지원하는 시소러스 시스템 개발에 관한 기술이다.The present invention belongs to the technical field of the domain knowledge construction method for supporting effective search for specific information such as interior, chemical sites, electronic shopping malls in the information system of the electronic commerce. In particular, it is a technique for developing a thesaurus system that supports the establishment of a term recommendation method, a conceptual browsing method, and an intelligent query method direct approach by applying an object-oriented paradigm to a thesaurus.

최근, 정보 검색 시스템의 속도 향상과 함께 정확률 및 재현률이 역시 중요해짐에 따라 시소러스를 구축하고 효과적으로 이용할 수 있게 하는 시스템에 관한 많은 연구들이 진행되고 있다. 특히, 시소러스에 대한 종래의 기술은 응용 도메인에 관련된 문서들로부터 개념들의 동시 출현 빈도를 분석해서 네트워크 구조의 시소러스를 자동으로 구축하고 이들을 질의 처리에 이용하는 기술과 도메인 전문가가 ISO(International Standardization Organization) 2788 과 5964 표준에 따라 계층 구조의 시소러스를 직접 구축하고 지능적인 추론을 통해 사용자가 원하는 시소러스 개념들을 추출하여 검색에 이용하는 기술로 구분된다. 이 시스템들은 기본적으로 시소러스 구축 및 유지 기능, 개념 탐색 기능 그리고 검색 시스템과의 연동 기능을 제공한다.Recently, as the accuracy and reproducibility become important as well as the speed of information retrieval system, many researches have been conducted on a system for constructing and effectively using a thesaurus. In particular, the prior art for thesaurus is the International Standardization Organization (ISO) 2788, which is a technology and domain expert that analyzes the frequency of simultaneous appearance of concepts from documents related to the application domain and automatically constructs thesaurus of the network structure and uses them for query processing. And 5964 standard, thesaurus structure is built directly, and the thesaurus concept that user wants is extracted and extracted through intelligent inference. These systems basically provide thesaurus building and maintenance, concept searching, and interworking with search systems.

네트워크 구조의 시소러스를 구축하는 대표적인 시스템으로는 "PhraseFinder", "RBT" 그리고 "SSOM" 등이 있으며, 이들은 일반적으로 개념들 사이의 연관성을 관련 정도로 표현한다. 여기서, 관련 정도는 도메인 문서들로부터 개념들의 동시 출현 빈도에 대한 통계적 정보를 통해 자동 평가된다. 특히, 동시 출현 빈도는 단어들간의 상관 관계 행렬 구성과 종속도 결정 등에 사용되며, 상관 관계 행렬과 단어 종속도는 확장된 벡터 공간 모델과 확률 모델에서 각각 유용한 것으로 알려져 있다. 그러나, 도메인 통계 정보에 의해 자동 구축되는 이 시소러스는 관련 정도만으로 개념들 간의 의미 관계를 정확히 명시할 수 없으며, 우리의 직관과 일치하지 않는 무의미한 관계들을 필연적으로 생성하게 된다. 또한, 이 개념들 사이의 의미 관계를 사용자가 파악하여 원하는 개념을 참조하기란 매우 어렵다는 단점을 가지고 있다.Representative systems for constructing the network structure thesaurus include "PhraseFinder", "RBT", and "SSOM", which generally represent the degree of association between concepts. Here, the degree of relevance is automatically assessed through statistical information on the frequency of simultaneous appearance of concepts from domain documents. In particular, the co-occurrence frequency is used for constructing the correlation matrix and determining the dependency between words. The correlation matrix and the word dependency are known to be useful in the extended vector space model and the probability model, respectively. However, this thesaurus, which is automatically constructed by domain statistics, cannot accurately specify semantic relationships between concepts by the degree of relevance alone, and inevitably creates meaningless relationships that do not match our intuition. In addition, it has a disadvantage in that it is very difficult for a user to grasp the semantic relation between these concepts and refer to a desired concept.

계층화된 구조의 시소러스를 구축하는 대표적인 시스템으로는 "IBM Thesaurus Administrator", "WordNet", "NCI Thesaurus System", "BEAT", "Hierarch", "MultiTes", "TCS" 그리고 "STRID"이 있으며, 시소러스에는 "NASA", "INSPEC" 그리고 "Roget Thesaurus" 등이 있다. 이 시소러스에서 서로 관련된 개념들의 의미 관계 및 관련 정도는 전문가의 수작업에 의해 직접 명시된다. 또한, 정확한 의미 구조의 시소러스를 일관성 있게 구축하고 유동적 특성을 가진 개념들을 유지 보수하기 위해 전문가는 개념들 사이의 복잡한 의미 구조를 모두 파악해야 하는 어려움이 있다. 특히, 방대한 시소러스는 여러 전문가들에 의해 동시에 구축될 수 있기 때문에 구축 과정에서 상호 의미적 일관성을 유지시킬 수 있어야 하며, 구축된 시소러스 개념들을 쉽게 접근할 수 있는 기능을 포함해야 한다. 그러나, 계층화된 시소러스를 구축하기 위한 이 시스템들은 시소러스로부터 사용자가 원하는 개념을 탐색하기 위해 하이퍼링크 방식의 매우 단순한 순차 접근 방법만을 지원하고 있다.Representative systems for building a layered thesaurus include "IBM Thesaurus Administrator", "WordNet", "NCI Thesaurus System", "BEAT", "Hierarch", "MultiTes", "TCS" and "STRID". Thesaurus includes "NASA", "INSPEC" and "Roget Thesaurus". The semantic relationship and degree of relevance of the concepts involved in this thesaurus are specified directly by the expert. In addition, in order to consistently construct thesaurus of accurate semantic structures and to maintain concepts with fluid characteristics, the expert has difficulty in grasping all the complex semantic structures among the concepts. In particular, because a large thesaurus can be built by multiple experts at the same time, it must be able to maintain mutual semantic consistency in the construction process, and it must include the ability to easily access the constructed thesaurus concepts. However, these systems for building a layered thesaurus only support a very simple sequential approach with hyperlinks to explore the user's desired concept from the thesaurus.

또한 앞서 언급한 바 대로 Naver 나 Empas 그리고 심마니등의 대부분 정보 검색 엔진들은, 질의에 포함되어 있는 용어들을 이용하여 지능적으로 사용자의 의도를 분석해 내는 본 방식과는 달리, 시소러스를 거의 동의어 수준으로만 사용하고 있는 실정이다.Also, as mentioned earlier, most information search engines, such as Naver, Empas, and Simmani, use the thesaurus almost synonymously, unlike this method of intelligently analyzing the user's intentions using terms contained in the query. I'm doing it.

본 발명은 객체지향 패러다임을 시소러스에 적용함으로써 도메인 지식을 보다 구조적이고 지능적으로 표현할 수 있는 지능형 객체지향 시소러스 시스템 개발 방법에 관한 기술이다. 이 시스템에서 이루고자 하는 기술적 과제는 위에서 설명한 기존 시소러스 시스템의 문제점들을 해결하기 위한 기술로 다음과 같이 4 가지로 요약된다.The present invention relates to a method for developing an intelligent object-oriented thesaurus system that can express domain knowledge more structurally and intelligently by applying an object-oriented paradigm to a thesaurus. The technical problem to be achieved in this system is to solve the problems of the existing thesaurus system described above.

첫째, 도메인 지식의 의미적 구조를 정확히 표현하기 위해 객체지향 패러다임의 구조적 특성을 시소러스에 적용한다. 즉, 시소러스 개념을 객체로 간주하여 기존에 BT/NT 로 표현되었던 객체들 사이의 의미 관계를 일반화 또는 클래스화 관계로 정의하여 객체 계층을 형성하도록 하였다. 따라서, 도메인 개념들의 상당 부분이 인스턴스 객체로 분류되고 이들은 많은 인스턴스 객체들을 포함하는 개념 객체에 의해 효과적으로 관리될 수 있다. 또한, 다양한 의미로 해석되던 RT 를 집성화 관계나 연관화 관계, 그리고 사용자가 정하는 관계등으로 세분화하여 정의하며 한 객체와 연관화/집성화 관계에 있는 객체들은 하위 객체에 상속될 수 있는 속성 객체가 된다.First, the structural characteristics of the object-oriented paradigm are applied to the thesaurus to accurately represent the semantic structure of domain knowledge. In other words, the thesaurus concept was regarded as an object, and the semantic relationship between objects previously expressed in BT / NT was defined as a generalization or classifying relationship to form an object hierarchy. Thus, many of the domain concepts are classified as instance objects and they can be effectively managed by concept objects that include many instance objects. In addition, RT, which has been interpreted in various meanings, is defined by subdividing into an aggregation relationship, an association relationship, and a relationship defined by the user. Objects that are associated with an object / aggregation relationship are property objects that can be inherited by subordinate objects. Becomes

둘째, 객체지향 패러다임의 상속 성질을 시소러스 구축 메커니즘으로 이용함으로써 일관성 있는 의미 구조의 시소러스를 시스템 용어 추천 방식으로 구축하고 유지할 수 있게 한다. 즉, 상위 객체들 사이의 관계 정보를 시스템이 구조적으로 파악하여 하위 객체의 관계 정보로 상속한다. 이 상속 메커니즘은 시스템의 용어 추천 방식의 시소러스 구축을 지원하여 시소러스 구축 비용을 최소화할 수 있으며, 방대한 시소러스를 여러 전문가들이 서로 다른 호스트에서 구축할 때, 시소러스의 의미적 일관성을 유지시켜 줄 수 있다.Second, by using the inheritance property of object-oriented paradigm as a thesaurus construction mechanism, it is possible to construct and maintain thesaurus with consistent semantic structure in the system term recommendation method. That is, the system structurally grasps relationship information between upper objects and inherits the relationship information of lower objects. This inheritance mechanism supports the system's term recommendation-based thesaurus construction, minimizing thesaurus construction costs and maintaining the thesaurus's semantic consistency when multiple thesauruses are deployed on different hosts.

셋째, 객체지향 패러다임의 개념화 기법을 이용하여 사용자의 다양한 관점에 따라 시소러스를 브라우징할 수 있게 한다. 객체지향 시소러스의 개념, 인스턴스의 소속성 그리고 객체들 사이의 관계 정보를 추상화하여 사용자 요구에 적합한 형태로 시소러스를 순차적으로 브라우징 할 수 있다. 개념 추상화는 일반적인 의미의 객체로부터 구체적인 객체를 점진적으로 브라우징하는 방법이다. 특히, 이 기능은 하나의 최상위 개념으로부터 파생되는 많은 하위 개념들 중에서 사용자가 의도한 방향에 있는 개념들만을 순차적으로 브라우징할 수 있게 한다.Third, it is possible to browse the thesaurus according to various viewpoints of the user by using the conceptualization technique of object-oriented paradigm. By abstracting the concept of object-oriented thesaurus, instance membership and relationship information between objects, you can sequentially browse thesaurus in a form that suits your needs. Conceptual abstraction is a way of progressively browsing concrete objects from objects in the general sense. In particular, this feature allows one to sequentially browse only the concepts in the user's intended direction among many sub-concepts derived from one top-level concept.

넷째, 사용자가 여러 개념들과 연관된 시소러스 개념들을 질의 기반으로 직접 접근할 수 있게 한다. 특히, 이 기능은 사용자가 의도한 개념들을 찾기 위해 대용량의 복잡한 시소러스를 여러 단계 브라우징해야 하는 단점을 보완할 수 있는 시소러스 직접 참조 방법을 지원한다. 즉, 사용자가 자신이 의도한 정확한 객체들을 찾기 위해 연관되는 개념들을 이용하여 시소러스 참조 질의를 표현하면, 시스템은 이 질의와 의미적으로 일치하는 객체들을 추론하고, 이 객체들로부터 검색 질의를 자동으로 또는 선택적으로 구성할 수 있게 한다. 따라서, 이 방법으로 구성된 검색 질의는 높은 정확률의 검색을 보장할 수 있을 것이다.Fourth, it allows users to directly access thesaurus based query concepts. In particular, this feature supports a thesaurus direct reference method that can compensate for the disadvantage of multi-step browsing a large, complex thesaurus to find the user's intended concepts. That is, when a user expresses a thesaurus reference query using the concepts associated to find the exact objects he or she intended, the system infers objects that are semantically identical to the query and automatically derives the search query from these objects. Or optionally configured. Therefore, a search query constructed in this way will ensure a high accuracy search.

다섯째, 원하는 검색어를 찾는 과정에서 사용하는 질의 처리는 지능적으로 이루어 지는 데, 예를 들어, DVD 또는 CDRW 와 의미적으로 동일한 제품들을 찾아달라는 요구에 대해 시스템은 이 질의를 해석해서 보조기억 장치를 원한다는 사실을 인식한 뒤,CD ROM, 그리고 DVCR 등을 검색해 준다. Fifth, the query processing used in the process of searching for the desired search is intelligent. For example, the system interprets this query in response to a request to find products that are semantically identical to the DVD or CDRW. After recognizing the facts, it searches for CD ROMs and DVCRs.

그림 1 은 최상위 객체가 '컴퓨터 부품'인 객체 계층을 포함하는 지능형 객체지향 시소러스의 예이다. 이 예에서 나타나는 시소러스 개념들은 전자 쇼핑몰에 관련된 문서에서 자주 사용되는 용어들로 구성되었다. 여기서, 노드는 객체를 의미하며, 링크는 객체들 사이의 관계를 나타낸다. 다음 설명은 이 예에 대한 시스템의 용어 추천 방식의 구축, 개념화 방식의 브라우징 그리고 지능형 시소러스 참조 질의 처리 흐름도를 첨부된 도면을 통해 자세히 설명한다.Figure 1 is an example of an intelligent object-oriented thesaurus that includes an object hierarchy where the top-level object is a 'computer part'. Thesaurus concepts in this example consist of terms that are often used in documents related to electronic shopping malls. Here, a node means an object and a link represents a relationship between the objects. The following description details the implementation of the term recommendation scheme, conceptualized browsing and intelligent thesaurus reference query processing flow diagram of the system for this example in detail with the accompanying drawings.

본 발명인 지능형 객체지향 시소러스 시스템은 크게 구축 모듈, 브라우징 모듈 그리고 지능형 시소러스 참조 질의 처리 모듈로 구성된다. 다음은 첨부된 도면을 참조하여 위에서 서술된 본 발명의 기술적 과제를 상세히 설명한다. 제 1 도는 본 발명이 적용되는 하드웨어 시스템에 대한 기본 구성 도이다. 각 구성 요소들의 기능은 다음과 같다. 시스템의 메인 메모리(101)에는 시소러스 시스템이 탑재된다. 중앙 처리 보드(102)는 메인 메모리에 탑재된 시스템을 실행시키는 보드이다. 입/출력 장치(103)에서는 시소러스 내용을 입력하고 CRT 화면, 텍스트 그리고 포스트 스크립트 파일로 출력한다. 이때, 도메인 전문가가 입력한 시소러스 정보는 객체지향 시소러스 시스템(105)에 의해 처리되어 객체지향 데이터베이스(104)에 저장된다. 유닉스 운영체제가 상기 보드 및 장치를 제어하고, 각 보드 및 장치간에 상호 주고 받는 메시지나 정보들은 시스템 버스(106)를 통해 이루어진다.The intelligent object-oriented thesaurus system of the present invention is largely composed of a construction module, a browsing module, and an intelligent thesaurus reference query processing module. The following describes the technical problem of the present invention described above with reference to the accompanying drawings in detail. 1 is a basic configuration diagram of a hardware system to which the present invention is applied. The functions of each component are as follows. The main memory 101 of the system is equipped with a thesaurus system. The central processing board 102 is a board for executing a system mounted in the main memory. The input / output device 103 inputs the thesaurus content and outputs the CRT screen, text, and PostScript file. At this time, the thesaurus information input by the domain expert is processed by the object-oriented thesaurus system 105 and stored in the object-oriented database 104. The Unix operating system controls the boards and devices, and messages and information exchanged between the boards and devices are performed through the system bus 106.

제 2 도는 객체지향 시소러스 시스템에 대한 기본 처리 흐름도이다. 사용자는 (201)에서 시스템의 명령 모드를 선택한다. 즉, a 는 시스템의 용어 추천 방식의 시소러스 구축(203)을 위한 모드이고, b 는 개념화 방식의 시소러스 브라우징(204)을 위한 모드이다. c 는 특정 의미의 연관된 개념들을 시소러스로부터 지능적으로 추출하기 위한 시소러스 참조 질의 처리 (205) 모드이다. (206)은 구축된 시소러스 계층 및 관련 정보와 각각의 개념화된 시소러스 정보를 브라우징한다. 사용자 의도에 따라 시소러스 참조 질의의 결과로 처리된 관련 참조 객체들과 이들의 시소러스 참조 그래프는 (208)에서 시각화된다. 이 처리 과정은 (208)에서 반복될 수 있다.2 is a basic process flow diagram for an object-oriented thesaurus system. The user selects the command mode of the system at 201. That is, a is a mode for thesaurus construction 203 of the term recommendation scheme of the system, and b is a mode for thesaurus browsing 204 of the conceptualization scheme. c is a thesaurus reference query processing 205 mode for intelligently extracting the associated concepts of a specific meaning from the thesaurus. 206 browses the constructed thesaurus hierarchy and related information and respective conceptualized thesaurus information. Relevant reference objects and their thesaurus reference graphs processed as a result of the thesaurus reference query according to user intention are visualized at 208. This process may be repeated at 208.

제 3 도는 최상위 객체를 시소러스에 생성하였을 때, 구축 모듈의 처리 흐름도이며 그림 2를 통해 이 과정을 자세히 설명한다.'운영체제','컴퓨터 부품회사' 그리고 '가전제품'의 객체 계층이 이미 여러 다른 전문가에 의해 구축되었다면, 하나의 최상위 객체 '컴퓨터 부품'은 다음과 같은 과정에 따라 생성된다. 먼저, 도메인 전문가가 (301)에서 '컴퓨터 부품'을 생성하면 (302)에서 다른 객체 계층의 최상위 객체를 연관화 객체로 제시한다. 이들 중 '운영체제'와 '컴퓨터 부품회사'를 선택하면 연관화 관계에 미리 정의된 관련 정도 0.7 이 이들 사이의 관계에 자동으로 명시된다. 같은 방법으로, (304)에서 제시한 객체들 중 집성화 객체 'LCD', '반도체소자', 'CASE' 그리고 '가전제품'이 순차적으로 선택되면, 0.8 이 (305)에서 자동으로 할당된다. 자동으로 부여된 관련 정도는 전문가에 의해 재정의될 수 있으며, 이 예에서는 <part-of, 컴퓨터 부품, 가전제품, 0.8>의 관련 정도를 0.85 로 재정의하였다.Figure 3 is a flow chart of the build module when the top-level object is created in the thesaurus, and this process is illustrated in detail in Figure 2. The object hierarchy of the 'operating system', 'computer component companies' and 'home appliances' has already been different. If built by an expert, one top-level object 'computer part' is created according to the following process. First, when the domain expert creates a 'computer component' at 301, at 302, presents the top-level object of another object hierarchy as an association object. Among them, when 'Operating System' and 'Computer Component Company' are selected, the degree of association 0.7 predefined in the association relationship is automatically specified in the relationship between them. In the same way, if the aggregation objects 'LCD', 'semiconductor device', 'CASE' and 'home appliances' are sequentially selected among the objects presented in (304), 0.8 is automatically assigned at (305). The degree of relevance automatically assigned can be redefined by an expert. In this example, the relevance of <part-of, computer parts, appliances, 0.8> has been redefined to 0.85.

제 4 도는 상속 메커니즘을 이용한 시스템의 용어 추천 방식의 하위 객체 구축에 대한 처리 흐름도이며, 그림 3 을 통해 이 처리 과정을 설명한다. 먼저, (401)에서 선택된 최상위 객체 '컴퓨터 부품'에 하위 개념 'VGA'을 (402)를 통해 삽입함으로써 일반화 관계를 설정한다 (403). 여기서, 일반화 관계의 무시적 관련 정도 0.9 가 자동으로 명시된다. 이 과정에서 전문가가 삽입되는 개념인 'VGA'과 집성화 그리고 연관화 관계를 가지는 객체들을 모두 파악하여 의미적으로 일관된 관계를 명시하기란 매우 어렵다. 이때, 객체지향 시소러스의 상속 메커니즘이 매우 유용하게 이용된다. 즉, 'VGA'의 집성화/연관화 객체들은 '컴퓨터 부품'과 집성화/연관화 관계를 가지는 개념들의 하위 객체들 중에서 선택되기 때문에 이 후보 객체들은 시스템에 의해 쉽게 파악될 수 있다. 먼저, 전문가가 (404)에서 관계 설정을 묵시적(no) 또는 명시적(yes)으로 할 수 있다. 묵시적 관계 설정의 경우, (405)와 (406)은 상속 메커니즘에 의해 파악된 집성화/연관화 객체들와 그 관련 정도를 이용하여 해당 관계를 자동으로 설정한다.4 is a flow chart for constructing the sub-objects of the term recommendation method of the system using the inheritance mechanism, and FIG. 3 illustrates this process. First, a generalization relationship is established by inserting the subordinate concept 'VGA' into the top-level object 'computer part' selected in 401 through 402 (403). Here, the negligible degree of 0.9 of the generalization relationship is automatically specified. In this process, it is very difficult to identify semantically coherent relationships by identifying all the objects that have an integration relationship and 'VGA', which is an expert inserted. In this case, the inheritance mechanism of the object-oriented thesaurus is very useful. In other words, the candidate objects are easily identified by the system because the aggregation / association objects of 'VGA' are selected among sub-objects of concepts having an aggregation / association relationship with the 'computer component'. First, the expert may set the relationship at 404 to either implicit (no) or explicit (yes). In the case of implicit relationship establishment, 405 and 406 automatically establish the relationship using the aggregation / association objects identified by the inheritance mechanism and the degree of association.

그림 4 는 명시적 관계 설정에서 상속 메커니즘을 이용하여 'VGA'의 연관화 후보 객체 및 그 관련 정도를 파악하는 과정을 설명하고 있다(407). 이 파악된 관계 정보는 전문가에게 제시되고 전문가는 (408)에서 이 정보들 중 적절한 것들만을 선택하여 연관화 관계를 설정할 수 있다. 선택된 관계 정보들 중 관련 정도는 필요한 경우 적절히 재정의될 수 있다. 이 과정은 집성화 관계 설정 (409)와 (410)에 같은 방법으로 적용된다.Figure 4 illustrates the process of identifying association candidate objects of 'VGA' and the degree of their relevance using the inheritance mechanism in explicit relationship establishment (407). This identified relationship information is presented to the expert and the expert can select only appropriate ones of this information at 408 to establish an association relationship. The degree of relevance among the selected relationship information may be appropriately redefined if necessary. This process is applied in the same way to the aggregation relationship setting 409 and 410.

시소러스에서 인스턴스 객체들은 가장 구체적인 의미의 객체들로 개념들 보다 빈번히 변화되며, 질의 평가에 많이 이용된다. 따라서, 정확한 인스턴스들의 관계를 명시는 매우 중요하다. 객체지향 시소러스에서 클래스화 관계는 많은 객체들이 인스턴스로 처리되는 도메인에서 시소러스를 효율적으로 유지할 수 있도록 한다. 즉, 상속 메커니즘을 클래스 관계에 적용함으로써, 전문가가 인스턴스 관계를 개별적으로 명시할 때 보다 적은 비용으로 일관성 있는 정확한 관계를 설정할 수 있다. 이 과정을 그림 5 를 통해 설명한다.In thesaurus, instance objects are the most specific objects that change more frequently than concepts, and are often used for query evaluation. Therefore, specifying the relationship of the exact instances is very important. Classifying relationships in object-oriented thesaurus allow you to efficiently maintain the thesaurus in the domain where many objects are treated as instances. In other words, by applying inheritance mechanisms to class relationships, experts can establish consistent and accurate relationships at lower cost when specifying instance relationships individually. This process is illustrated in Figure 5.

그림 5 에서 'GeForce'이 (401)에서 선택된 'VGA'과 '보조기억장치'의 하위 인스턴스 객체로 각각 0.93 과 0.92 의 관련 정도로 (402)에서 삽입되어 일반화 관계를 설정하고 있다(403). 이때, 전문가에 의해 명시적으로 기술되는 이들의 관련 정도는 클래스화 관계에 미리 할당된 묵시적 관련 정도 0.9 보다 우선한다. 다음으로 상속 메커니즘을 이용하여 'GeForce'은 <association-of, VGA, 주변기기 회사, 0.75>에 의해 'Trident','Cirus Logic' 그리고 'Creative Lab'와 (405)에서 묵시적 상속 관계 'association-of/0.69'가 설정된다. 집성화 관계 역시 (406)에서 같은 방법으로 설정된다. 명시적으로 집성화/연관화 관계를 명시해야 할 경우, 상속 메커니즘에 의해 자동으로 파악된 집성화 객체와 관련 정도를 (407)에서 제시한다. 이들 중에서 전문가가 'Trident'을 선택하면, 묵시적 상속 관련 정도 0.69 대신 상위 객체들의 관계 <association-of, VGA, 주변기기 회사, 0.75>의 관련 정도 0.75 를 자동으로 제시하고 사용자는 이 관련 정도를 적절히 수정하여 명시할 수 있다(408). 시스템은 연속하여 같은 방법으로 연관화 관계 <association-of, 컴퓨터 부품, 운영체제, 0.7>에 의해 '운영체제'의 인스턴스 'Win','Unix','Win XP' 그리고 'Linux'를 후보 객체들로 파악하여 관계를 설정할 수 있다. 집성화 관계 역시 같은 방법으로 설정된다.In Figure 5, 'GeForce' is a sub-instance object of 'VGA' and 'secondary storage device' selected in (401), and is inserted at (402) to a degree of relevance of 0.93 and 0.92, respectively, to establish generalization relationship (403). At this point, their degree of relevance explicitly described by the expert takes precedence over the implicit relevance degree 0.9 previously assigned to the classifying relationship. Next, using the inheritance mechanism, 'GeForce' is used by <association-of, VGA, Peripheral Company, 0.75> by 'Trident', 'Cirus Logic' and 'Creative Lab' and the implicit inheritance relationship 'association-of' (405). /0.69 'is set. The aggregation relationship is also set up in the same way at 406. If it is necessary to explicitly specify the aggregation / association relationship, the degree of association with the aggregation object automatically identified by the inheritance mechanism is presented at (407). If the expert selects `` Trident '', instead of the implied inheritance degree 0.69, it automatically suggests the relative degree 0.75 of the relationship <association-of, VGA, peripheral company, 0.75> of the parent object and the user corrects this degree accordingly. Can be specified (408). The system subsequently uses the associations <association-of, computer component, operating system, 0.7> in the same way to make candidate instances of Win, Unix, Win XP, and Linux the operating system. To establish relationships. The aggregation relationship is also set up in the same way.

제 5 도는 개념화 방식으로 구축된 시소러스를 브라우징하는 처리 흐름도이다. 이 처리는 매우 복잡하게 표현된 시소러스로부터 사용자의 관점에 따라 객체들을 순차적으로 브라우징할 수 있게 한다. 객체지향 시소러스의 의미 구조가 객체지향 패러다임으로 표현되기 때문에 다음과 같은 3 가지 개념화된 사용자 관점에 따라 객체들 사이를 브라우징할 수 있는 선택 모드(501)를 지원한다.5 is a process flow diagram for browsing a thesaurus constructed in a conceptualized manner. This process allows for sequential browsing of objects from the very complex thesaurus according to the user's point of view. Since the semantic structure of the object-oriented thesaurus is expressed in the object-oriented paradigm, it supports the selection mode 501 for browsing between objects according to the following three conceptualized user perspectives.

"객체 개념화" 모드는 객체 개념화를 통한 브라우징 방법으로 일반적인 의미의 객체로부터 구체적인 객체를 점진적으로 브라우징 한다. 특히, 이 기능은 하나의 최상위 개념으로부터 파생되는 많은 하위 객체들 중에서 사용자가 의도한 방향에 있는 객체들만을 순차적으로 브라우징할 수 있게 한다. 그림 1 의 예로부터 (502)에서 사용자가 일반적인 의미의 최상위 객체 '컴퓨터 부품'을 선택하면, (503)은 이 객체로부터 파생된 하위 객체들 'VGA', '멀티미디어 키트', '보조기억장치', 그리고 '사운드 카드'을 파악한다. 파악된 정보인 하위 객체들과 해당 관계는 (504)에서 브라우징된다. 또한, 브라우징된 객체들 중 'VGA'를 선택함으로써 'GeForce'를 점진적으로 브라우징한다.The "object conceptualization" mode is a browsing method through object conceptualization, which gradually browses a specific object from a general meaning object. In particular, this feature allows the user to sequentially browse only the objects in the user's intended direction among many sub-objects derived from one top-level concept. From 502 of Figure 1, when the user selects the top-level object 'computer part' in the general sense, (503) the sub-objects 'VGA', 'Multimedia Kit', 'Auxiliary Storage' derived from this object. , And identify the 'sound card'. The sub-objects and their relationships, which are identified information, are browsed at 504. Also, 'GeForce' is gradually browsed by selecting 'VGA' among the browsed objects.

"인스턴스 소속성 개념화" 모드는 하나 이상의 개념들에 공통적으로 소속된 인스턴스들을 브라우징하는 방법이다. 일반적으로 하나의 개념은 많은 인스턴스들을 가지며, 하나의 인스턴스는 여러 개념에 속하게 된다. 이때, 이 소속성 개념화를 통한 브라우징은 사용자가 인스턴스의 소속 관계를 명확하게 판단할 수 있게 한다. 그림 1 의 예로부터 (505)에서 사용자가 'VGA'과 '보조기억장치'을 동시에 선택하면, (506)은 이 두 객체에 공통적으로 소속된 인스턴스 'GeForce'과 '밀레니엄'을 파악하고 (504)에서 이 파악된 객체들과 해당 관계를 브라우징한다. 이 기능은 특히 방대한 양의 인스턴스들을 가지는 응용 환경에 적합한 기능이다.The "Instance Affiliation Conceptualization" mode is a way of browsing instances that belong to one or more concepts in common. In general, a concept has many instances, and an instance belongs to several concepts. At this time, browsing through this conceptualization of the organization enables the user to clearly determine the relationship of the instance. If the user selects 'VGA' and 'secondary storage' at the same time from 505 in the example of Figure 1, (506) identifies the instances 'GeForce' and 'Millenium' that are common to these two objects (504). ) Browse these identified objects and their relationships. This feature is especially suitable for application environments with a large number of instances.

"관계 개념화" 모드는 하나의 객체로부터 사용자가 원하는 관계를 가지는 객체들만을 선별적으로 브라우징하는 방법이다. 그림 1 의 예로부터 사용자가 'GeForce'과 집성화/연관화 관계를 가지는 객체들 중 '이어폰'의 정보를 참조하기 위해 (507)에서 'GeForce'를 선택하고 (508)에서 관계 뷰 명령을 실행한다. (509)는 'GeForce'의 집성화/연관화 객체를 파악하고 (504)에서 이들을 브라우징한다.The "conceptual relation" mode is a method of selectively browsing only objects having a relationship desired by a user from one object. From the example of Figure 1, the user selects 'GeForce' at 507 and executes the relationship view command at 508 to refer to the information of the 'earphone' among the objects that have an aggregation / association relationship with 'GeForce'. do. 509 identifies the aggregation / association objects of 'GeForce' and browses them at 504.

제 6 도는 복잡한 관계들로 표현된 객체 기반 시소러스로부터 사용자가 요구하는 객체들을 질의 기반으로 직접 참조할 수 있는 시소러스 참조 질의 처리에 대한 처리 흐름도이다. 먼저, (601)에서 사용자는 참조를 원하는 개념들에 대한 시소러스 참조 질의를 입력하고, (602)는 이 질의의 구문을 Lax/Yacc 통해 분석한다. 이때, 시소러스 참조 질의는 [MAIN_QUERY, RESTRICTION_QUERY]과 같이 두 개의 부분 질의로 구성되며, 여기서 MAIN_QUERY 는 사용자가 참조를 원하는 계층의 특정 범위를 포괄적인 형태로 선택한다. RESTRICTION_QUERY 는 MAIN_QUERY 에 의해 파악된 개념들의 범위를 더욱 구체적으로 한정하게 된다. 즉, 는 MAIN_QUERY에 의해 파악된 개념들 중에서 모든 와 동시에 집성화/연관화 관계를 가지는 개념들로 한정하며, 는 적어도 하나의 와 집성화/연관화 관계에 있는 개념들로 한정한다. (603)은 시소러스 참조 질의의 의미를 분석하여 시소러스로부터 적절한 참조 객체들과 그 관련 정도를 추론하고 이들에 대한 참조 그래프를 시각화한다(604). 이때, 참조 그래프는 추론 객체들의 모든 상·하위 개념들과 각각에 대한 관계들로 구성된 계층 그래프이다. 참조 객체들을 이용한 검색 질의 구성을 위해 사용자는 (605)에서 자동 또는 선택적인 모드를 선택할 수 있다. (606)은 관련 정도를 포함하는 모든 참조 객체들과 부울 연산자 "or"를 이용하여 검색 질의를 자동으로 구성한다. (607)에서는 참조 객체들 중 사용자가 원하는 객체들과 적절한 부울 연산자 "or"와 "and"를 이용하여 사용자가 직접 검색 질의를 구성한다. 전자의 질의는 정확률을 상당 부분 보장하면서 높은 재현률을 요구하는 경우에 유용하게 이용될 수 있으며, 후자의 매우 높은 정확률이 요구되는 경우에 이용될 수 있다. 이 들은 정보 검색 시스템과 통합되기 위한 방법으로 이용된다.6 is a process flow diagram for a thesaurus reference query processing that can directly reference objects required by a user from an object-based thesaurus expressed in complex relationships. First, at 601 a user enters a thesaurus reference query for concepts that they want to refer to, and 602 parses the syntax of this query via Lax / Yacc. At this time, the thesaurus reference query consists of two partial queries, such as [MAIN_QUERY, RESTRICTION_QUERY], where MAIN_QUERY selects a specific range of the hierarchy that the user wants to refer to in a comprehensive form. RESTRICTION_QUERY will further narrow the scope of concepts identified by MAIN_QUERY. In other words, Is one of the concepts identified by MAIN_QUERY. And at the same time it is limited to concepts that have an aggregation / association relationship, Is at least one It is limited to the concepts that are related to the integration and association with. 603 analyzes the meaning of the thesaurus reference query to infer appropriate reference objects and their degree of association from the thesaurus and visualize a reference graph for them (604). In this case, the reference graph is a hierarchical graph composed of all the high and low concepts of the inference objects and their relations. The user can select an automatic or optional mode at 605 for constructing a search query using reference objects. 606 automatically constructs a search query using all the reference objects including the degree of relevance and the Boolean operator "or". In (607), the user constructs a search query by using the user's desired objects among the reference objects and the appropriate Boolean operators "or" and "and". The former query can be useful in cases where a high reproducibility is required while ensuring a high degree of accuracy, and the latter can be used when a very high accuracy rate is required. They are used as a way to integrate with information retrieval systems.

제 7 도는 (603)의 시소러스 객체 참조 및 참조 그래프 생성에 대한 상세 처리 흐름도이다. 먼저, (701)은 MAIN_QUERY 의 유형을 일반화되는 질의 또는 구체화되는 질의 으로 분류한다. 각 경우에 대해 그림 6 과 그림 7 의 예를 통해 설명한다.7 is a detailed process flow diagram of the thesaurus object reference and reference graph generation of 603. First, 701 is a query that generalizes the type of MAIN_QUERY. Or query materialized Classify as Each case is illustrated by the examples in Figure 6 and Figure 7.

구체화되는 질의 경우는 (702)에서 모든 객체 가 공통으로 포함하는 하위 객체들의 집합 LBS 을 평가한다. 즉, 시소러스 참조 질의가 [VGA∧보조기억장치, *]일 때, 'VGA'과 'VGA'의 공통 하위 객체 집합 LBS={GeForce, 밀레니엄}를 평가한다. (703)은 LBS 의 모든 객체에 대해 가장 일반적인 의미의 객체들의 집합 GLBS 를 계산하며, 예에서는 GLBS=LBS 이다. 이 객체들은 시소러스 참조 질의의 MAIN_QUERY 와 동일한 의미의 객체이다. (706)에서는 GLBS 의 각 객체에 대해 모든 상하위 객체들의 집합 M 를 추론하게 된다. 만약, RESTRICTION_QUERY 가 존재하지 않는다면 (707)에서 M 의 모든 객체들은 GLBS 객체들과의 최대 관련 정도를 객체 계층을 통해 평가하여 퍼지 참조 객체 집합을 계산하고 각각에 해당하는 일반화 관계를 참조 그래프로 생성한다. 그림 6 에서 회색의 부분은 참조 객체들과 참조 그래프를 나타내고 있다.If the query is to be embodied, all objects at 702 Evaluates the set of sub-objects LBS contains in common. That is, when the thesaurus reference query is [VGA∧ secondary memory, *], the common sub-object set LBS = {GeForce, Millennium} of 'VGA' and 'VGA' is evaluated. (703) computes the set GLBS of the most common meanings for all objects in the LBS, in the example GLBS = LBS. These objects have the same meaning as MAIN_QUERY in the thesaurus reference query. In 706, for each object of GLBS, the set M of all parent objects is inferred. If RESTRICTION_QUERY does not exist, at 707, all objects of M evaluate the maximum degree of association with GLBS objects through the object hierarchy to compute a set of fuzzy reference objects and generate the corresponding generalization relationships as reference graphs. . The shaded parts in Figure 6 show the reference objects and the reference graph.

일반화되는 질의 경우는 (704)에서 모든 객체 가 공통으로 포함되는 상위 객체들의 집합 UBS 을 평가한다. 예를 들어 시소러스 참조 질의 [GeForce ∨ 부드, *]에서 'GeForce'과 '부드' 각각 대해 상위 객체들의 공통 집합은 UBS={VGA, 컴퓨터 부품}이다. (705)은 UBS 의 모든 객체에 대해 가장 구체적인 의미의 객체들의 집합 LUBS 를 추론하며, LUBS={VGA}이다. 이 객체들은 시소러스 참조 질의의 MAIN_QUERY 와 동일한 의미의 객체이다. (706)에서는 LUBS 의 각 객체에 대해 모든 상하위 객체들의 집합 M={VGA, 컴퓨터 부품, GeForce, 부드, 밀레니엄}를 파악하게 된다. 구체화 되는 GLBS 객체들과 일반화 되는 LUBS 객체들 간에는 GLBS 연산과 LUBS 연산이 반복적으로(recursively) 다시 적용될 수 있다.For generalized query cases, all objects at 704 Evaluates the set of parent objects UBS that are commonly included. For example, in the thesaurus reference query [GeForce ∨ Bud, *], the common set of ancestor objects for each of 'GeForce' and 'Bud' is UBS = {VGA, computer part}. 705 deduces the set LUBS of the objects in the most specific sense for every object of the UBS, where LUBS = {VGA}. These objects have the same meaning as MAIN_QUERY in the thesaurus reference query. In 706, for each object of LUBS, a set M = {VGA, computer component, GeForce, Bird, Millennium} of all the parent objects is identified. Between the materialized GLBS objects and the generalized LUBS objects, GLBS operations and LUBS operations can be reapplied repeatedly.

만약, RESTRICTION_QUERY 가 존재하면, MAIN_QUERY 에 의해 추론된 객체 집합 M 을 RESTRICTION_QUERY 에 대해 (708)과 (709)를 수행한다. (708)은 M 의 객체들 중 i=1,...,m 에 대해 과 집성화/연관화 관계를 가지는 객체 집합 Si 를 계산한다. 이들은 (809)에서 합집합 연산을 수행한 결과를 통해 (706)을 다시 수행한다. 그림 8 에서 M={컴퓨터 부품, VGA, GeForce, 부드, 밀레니엄}이고 RESTRICTION_QUERY='Win XP' AND 'Trident' AND '이어폰'일 때, (708)와 (709)에서 'Win XP', 'Trident' 그리고 '이어폰'과 동시 집성화 연관화 관계를 가지는 M의 원소 S={GeForce}를 구할 수 있다. 다음으로 (706)에서 'Geforce'의 모든 상하위 객체 집합 M={컴퓨터 부품, VGA, 보조기억장치, GeForce}를 다시 파악한다. 이때, 참조 객체 집합은 집합 S 와 M 의 모든 객체들의 최대 관련 정도를 객체 계층을 통해 평가하여 제시되며, 그림 8 과 같은 참조 그래프를 생성한다. 참조질의는 점진적 시소러스 구축에도 사용될 수 있다. 즉, 시소러스 용어를 이용한 확장질의의 목표가 되는 DB 에 대해 시소러스 구축시에도 기 구축된 시소러스를 이용한 참조질의 기반의 확장 검색을 수행함으로써 관련 문서들로부터 추가될 후보 시소러스 용어들을 용이하게 찾아낼 수 있고, 또 추가된 시소러스 용어들을 다시 확장질의에 이용함으로써 점진적 시소러스 구축을 가능하게 한다.If RESTRICTION_QUERY exists, perform 708 and 709 on the RESTRICTION_QUERY object set M deduced by MAIN_QUERY. (708) for i = 1, ..., m of the objects of M Compute an object set, S i, that has an aggregation / association relationship with. They perform 706 again through the result of performing the union operation at 809. In Figure 8, when M = {Computer Component, VGA, GeForce, Bud, Millennium} and RESTRICTION_QUERY = 'Win XP' AND 'Trident' AND 'Earphones', 'Win XP', 'Trident' at (708) and (709) And the element S = {GeForce} of M having a co-aggregation association with the earphone. Next, at 706, all the upper and lower object sets M = {computer part, VGA, auxiliary storage device, GeForce} of 'Geforce' are re-identified. At this time, the reference object set is presented by evaluating the maximum degree of relevance of all the objects of the set S and M through the object hierarchy, and generates the reference graph as shown in Figure 8. Reference queries can also be used to build progressive thesaurus. That is, even when the thesaurus is constructed, the candidate query thesaurus terms to be added from related documents can be easily found by performing the extended search based on the reference query using the built-in thesaurus even for the DB that is the target of the expansion query using the thesaurus terms. The additional thesaurus terms are used again in the expansion query to allow for progressive thesaurus construction.

시소러스 시스템은 시소러스를 보다 효과적으로 구축하고 유지할 수 있게 하며, 구축된 시소러스를 검색 시스템이나 사용자들이 쉽게 이용할 수 있게 하여 검색 성능을 향상시킨다는 점에서 매우 중요한 의미를 가진다. 이를 위해 본 발명에서는 객체지향 시소러스 시스템의 개발 방법을 발명하였다. 이 시스템은 크게 시소러스를 구축하는 기능, 개념화 기법을 이용하여 관련된 개념들을 순차적으로 브라우징하는 기능 그리고 참조 질의를 통해 원하는 개념들을 지능적으로 참조하는 기능으로 구성되었다. 구축 과정에 적용된 객체지향 패러다임은 객체들 사이의 관계를 정확하게 표현할 수 있게 하며, 전문가의 직관과 일치하는 시소러스를 구축할 수 있게 한다. 특히, 이 패러다임의 상속 메커니즘에 의해 구조적으로 파악된 정보는 시스템의 추천에 의해 시소러스 구축에 적극 활용되며, 방대한 시소러스를 여러 전문가들이 서로 다른 호스트에서 구축할 때, 시소러스의 의미적 일관성을 유지시켜 줄 수 있으며 구축 비용 역시 감소시킬 수 있게 한다. 브라우징 기능과 질의기반 참조 기능은 사용자가 의도한 개념들을 순차적으로 또는 직접 탐색 할 수 있게 하여 정확한 검색 질의를 구성할 수 있도록 하였다. 특히, 이 질의 구성 방법은 높은 재현률을 요구하는 도메인에 유용하게 이용될 수 있으며, 대표적인 응용 도메인으로 소프트웨어 재사용 부품 검색 시스템을 들 수 있다.Thesaurus system is very important in that the thesaurus can be built and maintained more effectively, and the thesaurus can be easily used by the search system or users to improve the search performance. To this end, the present invention invented a method for developing an object-oriented thesaurus system. This system consists of the function of constructing a thesaurus, the sequential browsing of related concepts using the conceptualization technique, and the intelligent reference of desired concepts through the reference query. The object-oriented paradigm applied in the construction process enables to accurately represent the relationships between objects and to build a thesaurus consistent with the intuition of the expert. In particular, the information structurally grasped by this paradigm's inheritance mechanism is actively used to construct thesaurus by recommendation of the system, and maintains the thesaurus's semantic consistency when multiple experts build on different hosts. It can also reduce the cost of deployment. Browsing and query-based referencing enable users to search the intended concepts sequentially or directly to construct accurate search queries. In particular, this method of query construction can be usefully used for domains that require high recall rates. A typical application domain is a software reusable parts search system.

제 1 도: 하드웨어 시스템에 대한 기본 구성도Figure 1: Basic Diagram of Hardware System

제 2 도: 지능형 객체지향 시소러스 시스템에 대한 처리 흐름도Figure 2: Processing Flow for an Intelligent Object-Oriented Thesaurus System

제 3 도: 최상위 시소러스 객체 구축에 대한 처리 흐름도Figure 3: Process Flow for Constructing Top-Level Thesaurus Objects

제 4 도: 점진적 구축 방식의 시소러스 하위 객체 구축에 대한 처리 흐름도Figure 4: Process flow for constructing a thesaurus sub-object with progressive build

제 5 도: 선택적 확장 방식의 브라우징에 대한 처리 흐름도Fig. 5: Process flow diagram for selective extended browsing

제 6 도: 지능적 질의 처리에 대한 흐름도Figure 6: Flowchart for Intelligent Query Processing

제 7 도: 지능형 객체-지향 시소러스 용어 참조 및 검색에 대한 처리 흐름도Figure 7: Processing Flow for Intelligent Object-Oriented Thesaurus Terminology Reference and Retrieval

Claims (5)

일반화 계층이 트리 형태로 시각화된 그래픽 시소러스 사용자 인터페이스상에서 객체지향 패러다임의 개념화를 이용한 시소러스 카테고리들의 계층구조가 상위개념을 더블클릭하면 하위 개념들을 볼 수 있고 하위개념을 더블클릭하면 그와 관계를 맺고 있는 인스턴스들을 볼 수 있으며, 다시 상위의 개념을 더블클릭하면 계층구조가 단순화되는 형태의 1단계(관련도면 제 5 도); 상기 제 1 단계를 통한 시소러스의 카테고리 계층을 자유롭게 이동해가며 찾아보는 제 2 단계; 이상 두 단계를 응용한 시소러스 관리 방법 The hierarchy of thesaurus categories using the concept of object-oriented paradigm on the graphical thesaurus user interface visualized in a tree form can be viewed by double clicking on the upper concept, and by double clicking on the lower concept. One step (figure 5 of related drawing) in which the instances can be viewed and the hierarchy is simplified by double clicking on the upper concept again; A second step of freely moving and searching the category hierarchy of the thesaurus through the first step; Thesaurus management method using the above two steps 같은 수준으로 개념화된 여러개의 트리들에 속한 시소러스 카테고리 및 인스턴스들간에 설정되어 있던 관계정도가 동시에 그래픽 및 수치로 보여지게 되는 1 단계; 상기 제 1 단계에서 관계정도가 설정된 다른 트리내의 카테고리 및 인스턴스를 선택하여 이동한 뒤, 다시 이 카테고리 및 인스턴스를 중심으로 개념화를 이용해 상위 및 하위카테고리 또는 인스턴스로 이동하거나 다시 상위카테고리로 단순화하거나 펼쳐서 찾아보는 제 2 단계; 이상 두 단계를 응용한 시소러스 관리 방법(관련도면 제 5 도) A step 1 in which graphically and numerically the relationship between the thesaurus categories and instances belonging to several trees conceptualized at the same level is simultaneously displayed; In the first step, select and move the category and instance in the other tree whose relation is set, and then move to the upper and lower categories or instances using conceptualization centering on the category and the instance, or to simplify or expand to the upper category again. Seeing second step; Thesaurus management method using the above two steps (relevant drawing 5) 일반화 계층에서 상위 두 카테고리들간에 관련정도가 설정되면, 각각의 하위카테고리 및 인스턴스들에게 또한 이 관련정도가 상속 되어, 각각의 특정 하위 카테고리 및 인스턴스들끼리 또한 이 관련정도가 상속 되어, 각각의 특정 하위 카테고리 및 인스턴스들끼리 관련지어질 수 있도록 계층내의 후보 카테고리 및 인스턴스들을 제시 추천해주는 제 1 단계; 제시되는 후보 카테고리 및 인스턴스들 중의 일부를 구축자가 선택하기만 하면, 관련 종류나 관련정도가 자동으로 상속되어 설정되는 제 2 단계(관련도면 제 4 도); 이상 두 단계를 시각화된 환경에서 채용하는 시소러스 관리 방법 If a relevance is set between the top two categories in the generalization hierarchy, then each subcategory and instance also inherits this relevance, and each particular subcategory and instance also inherits this relevance. A first step of presenting and recommending candidate categories and instances in the hierarchy so that subcategories and instances may be associated with each other; A second step in which a related type or degree of inheritance is automatically inherited and set only by a builder selecting some of the candidate categories and instances presented (relevant drawing 4); Thesaurus management method employing these two steps in a visualized environment 질의내에 범위를 나타내는 용어의 시소러스내 하위 카테고리 및 인스턴스들 중에서 질의내 한정을 명시하는 또다른 용어들과 특정 관계를 맺고있는(또는 이들에 의해 한정되는) 시소러스 용어들을 찾아, 이들을 이용해서 웹 문서를 검색한 후, 그 결과로부터 적절한 시소러스 후보 용어들을 제시해 주는 1 단계(관련도면 제 4 도); 시소러스 후보 용어들을 선별애서 시소러스 트리에 추가한 후 상기 1 단계를 반복함으로써 전진적 시소러스의 구축을 가능하게 하는 2 단계; 상기 두 단계를 반복적으로 적용하는 시소러스 관리 방법 Find thesaurus terms that have a specific relationship with (or defined by) the other terms in the thesaurus that specify scope in the query among subcategory subcategories and instances of the term representing the scope within the query, and use them to After searching, step 1 suggesting appropriate thesaurus candidate terms from the results (relevant figure 4); Adding the thesaurus candidate terms to the thesaurus tree for selection and repeating step 1 to enable construction of a progressive thesaurus; Thesaurus management method applying the above two steps repeatedly 용어들간의 OR 연산으로 구성된 사용자 질의로부터 이들을 일반화시킬 수 있는 한두 상위 카테고리를 검색해내는 제 1 단계; 용어들간의 AND 연산으로 구성된 사용자 질의로부터 이들을 대표할 수 있는 구체적인 한두개의 하위 카테고리 또는 인스턴스를 검색해내는 제 2 단계; 상기 두 단계를 조합해서 질의가 의미하는 결론을 추론해 내는 관계성 추론 기반 참조질의 제 3 단계; 이상 세 단계를 이용하는 시소러스 관리 방법(관련도면 제 6 도, 제 7 도) A first step of retrieving one or two higher categories that can generalize them from a user query consisting of an OR operation between terms; A second step of retrieving one or two specific subcategories or instances that can represent them from a user query consisting of an AND operation between terms; A third step of relational inference based reference query combining the two steps to infer a conclusion meant by the query; Thesaurus management method using the above three steps (relevant drawings 6 and 7)
KR10-2001-0019683A 2001-04-06 2001-04-06 Incremental construction of thesauri,selective-spreading based browsing and intelligent query processing in electronic commerce KR100522839B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2001-0019683A KR100522839B1 (en) 2001-04-06 2001-04-06 Incremental construction of thesauri,selective-spreading based browsing and intelligent query processing in electronic commerce

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0019683A KR100522839B1 (en) 2001-04-06 2001-04-06 Incremental construction of thesauri,selective-spreading based browsing and intelligent query processing in electronic commerce

Publications (2)

Publication Number Publication Date
KR20010084917A KR20010084917A (en) 2001-09-07
KR100522839B1 true KR100522839B1 (en) 2005-10-19

Family

ID=19708179

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0019683A KR100522839B1 (en) 2001-04-06 2001-04-06 Incremental construction of thesauri,selective-spreading based browsing and intelligent query processing in electronic commerce

Country Status (1)

Country Link
KR (1) KR100522839B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020006616A (en) * 2001-11-28 2002-01-23 양재동 O-Thesaurus knowledge base manager for personalized searching for documents
US7565627B2 (en) * 2004-09-30 2009-07-21 Microsoft Corporation Query graphs indicating related queries

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962702A (en) * 1995-08-30 1997-03-07 Oki Electric Ind Co Ltd Information retrieving method
US5761388A (en) * 1995-02-28 1998-06-02 Mitsubishi Denki Kabushiki Kaisha Fuzzy thesaurus generator
KR19980050164A (en) * 1996-12-20 1998-09-15 양승택 Object-based Library Search Method for Software Reuse
JPH11265385A (en) * 1998-03-16 1999-09-28 Nippon Telegr & Teleph Corp <Ntt> Information retrieving device and method and storage medium storing information retrieving program
KR19990086011A (en) * 1998-05-25 1999-12-15 정선종 How to Format Queries in Information Retrieval
KR20010019746A (en) * 1999-08-30 2001-03-15 정선종 Query-Based Reference Method For Extraction Of Thesaurus Terms
KR20020064052A (en) * 2001-01-31 2002-08-07 (주)시리 Article thesaurus and system for searching article information based article thesaurus

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761388A (en) * 1995-02-28 1998-06-02 Mitsubishi Denki Kabushiki Kaisha Fuzzy thesaurus generator
JPH0962702A (en) * 1995-08-30 1997-03-07 Oki Electric Ind Co Ltd Information retrieving method
KR19980050164A (en) * 1996-12-20 1998-09-15 양승택 Object-based Library Search Method for Software Reuse
JPH11265385A (en) * 1998-03-16 1999-09-28 Nippon Telegr & Teleph Corp <Ntt> Information retrieving device and method and storage medium storing information retrieving program
KR19990086011A (en) * 1998-05-25 1999-12-15 정선종 How to Format Queries in Information Retrieval
KR20010019746A (en) * 1999-08-30 2001-03-15 정선종 Query-Based Reference Method For Extraction Of Thesaurus Terms
KR20020064052A (en) * 2001-01-31 2002-08-07 (주)시리 Article thesaurus and system for searching article information based article thesaurus

Also Published As

Publication number Publication date
KR20010084917A (en) 2001-09-07

Similar Documents

Publication Publication Date Title
Popescul et al. Statistical relational learning for link prediction
CA2461196C (en) Hierarchical data-driven search and navigation system and method for information retrieval
US5768578A (en) User interface for information retrieval system
CA2461195C (en) Scalable hierarchical data-driven navigation system and method for information retrieval
US6768987B1 (en) System and method for filtering explain tables
US20120203727A1 (en) Method and apparatus for information surveying
US20020091696A1 (en) Tagging data assets
Popescul et al. Structural logistic regression for link analysis
Kongthon A text mining framework for discovering technological intelligence to support science and technology management
Knoll et al. An integrated approach to semantic evaluation and content-based retrieval of multimedia documents
KR100522839B1 (en) Incremental construction of thesauri,selective-spreading based browsing and intelligent query processing in electronic commerce
Fowler et al. Information retrieval using pathfinder networks
Fowler et al. Information navigator: An information system using associative networks for display and retrieval
Kwon et al. Recommendation of e-commerce sites by matching category-based buyer query and product e-catalogs
Vicente-López et al. Personalization of Parliamentary Document Retrieval Using Different User Profiles.
KR20010019746A (en) Query-Based Reference Method For Extraction Of Thesaurus Terms
KR20070037809A (en) Information query system based semantic web and searching method thereof
EP1224570A1 (en) A system for composing applications based on explicit semantic models, event driven autonomous agents, and resource proxies
Choi et al. Text database discovery on the Web: Neural net based approach
Bordogna et al. Extending a graph-based data model to manage fuzzy and uncertain information
Yao et al. Asynchronous information space analysis architecture using content and structure-based service brokering
Haller et al. Enabling Exploratory Search on Manufacturing Knowledge Graphs.
Rhee et al. Semantic relevance measure between resources based on a graph structure
Ashman Relations modelling sets of hypermedia links and navigation
Konopnicki et al. Database-inspired search

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
E902 Notification of reason for refusal
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120914

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20131011

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20141013

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee