KR20010084917A - 전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식 - Google Patents

전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식 Download PDF

Info

Publication number
KR20010084917A
KR20010084917A KR1020010019683A KR20010019683A KR20010084917A KR 20010084917 A KR20010084917 A KR 20010084917A KR 1020010019683 A KR1020010019683 A KR 1020010019683A KR 20010019683 A KR20010019683 A KR 20010019683A KR 20010084917 A KR20010084917 A KR 20010084917A
Authority
KR
South Korea
Prior art keywords
thesaurus
objects
sub
browsing
query
Prior art date
Application number
KR1020010019683A
Other languages
English (en)
Other versions
KR100522839B1 (ko
Inventor
양재동
최재훈
Original Assignee
양재동
(주)케이테크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 양재동, (주)케이테크 filed Critical 양재동
Priority to KR10-2001-0019683A priority Critical patent/KR100522839B1/ko
Publication of KR20010084917A publication Critical patent/KR20010084917A/ko
Application granted granted Critical
Publication of KR100522839B1 publication Critical patent/KR100522839B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus

Landscapes

  • Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)

Abstract

본 발명은 객체지향 패러다임을 이용하여 전자 상거래에서 상품 검색을 지능적으로 구축하고 관리할 수 있는 객체지향 방식의 시소러스 구축, 브라우징 그리고 질의 방법에 관한 것이다. 이 패러다임의 상속 메커니즘은 시소러스에 표현된 개념들간의 관계를 구조적으로 파악할 수 있게 하여 전문가가 시소러스를 점진적으로 그리고 편리하게 구축할 수 있도록 지원한다. 특히, 방대한 시소러스를 여러 전문가들이 서로 다른 호스트에서 구축할 경우, 이 메커니즘에 의해 파악된 정보는 시소러스의 의미적 일관성을 유지시킬 수 있도록 도와주며, 전문가가 직접 개념들간의 관련 정도를 모두 명시해야 하는 부담을 최소화하기 때문에 시소러스 구축 비용을 감소시킬 수 있다. 본 지능형 객체 지향 시소러스 시스템은 또한 선택적 확장 브라우징 기능과 객체-지향 방식에 근거한 지능적 질의 처리 기능을 제공한다.

Description

전자상거래에서 효과적으로 상품을 검색하기 위한 시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징 그리고 지능형 질의 방식{Incremental construction of thesauri,selective-spreading based browsing and intelligent query processing in electronic commerce}
본 발명은 전자 상거래에서 상품 정보를 보다 지능적으로 검색할 수 있도록 시소러스를 구축하고 관리할 수 있는 객체-지향 방식의 지능형 상품 시소러스 관리시스템의 개발을 목적으로 하고 있다. 이 시스템은 점진적 구축, 선택적 확장식의브라우징 그리고 지능적으로 질의에 답하는 상품 검색 기능을 지원한다. 정보 검색시스템의 높은 재현률과 정확률을 위해 최근 시소러스를 효율적으로 구축하고 이용할 수 있게 하는 시소러스 시스템에 관한 많은 연구들이 수행되고 있다. 이 시스템들에 의해 구축되는 시소러스는 그 구조에 따라 네트워크 시소러스와 계층화된 시소러스로 구분된다.
도메인 통계 정보에 의해 자동 구축되는 네트워크 시소러스는 관련 정도만으로 개념들 간의 의미 관계를 정확히 명시할 수 없으며, 우리의 직관과 일치하지 않는 무의미한 관계들을 필연적으로 생성하게 된다.
계층화된 구조의 시소러스에서 서로 관련된 개념들의 의미 관계 및 관련 정도는 전문가의 수작업에 의해 직접 명시된다. 문제점은 방대한 시소러스를 전문가가 직접 구축하기 위해서 많은 시간과 노력이 필요하게 된다. 또한, 정확한 의미 구조의 시소러스를 일관성 있게 구축하고 유동적 특성을 가진 개념들을 유지 보수하기 위해 전문가는 개념들 사이의 복잡한 의미 구조를 모두 파악해야 하는 어려움이 있다. 이 시소러스 시스템은 사용자의 순차 접근 방법만을 지원하고 있기 때문에 여러 개념들과 복합적으로 연관된 사용자 관심 개념을 여러 단계의 순차인 접근 과정을 통해 탐색해야 하는 단점을 가지고 있다. 즉, 매우 복잡한 구조의 시소러스에서 사용자가 자신이 의도한 개념을 순차적으로 탐색할 경우 탐색 방향성을 상실할 수 있다.
또한 최근 Naver 나 Empas 그리고 심마니등에서 사용하는 동의어 수준의 시소러스 및 시소러스 이용 검색 방식과는 달리 본 방식은 지능적으로 시소러스 용어들을 검색해 낸다는 점이 큰 특징이다. 예를 들어, walkman AND computer memory 의 질의에 대해 기존의 검색 시스템은 walkman 과 computer memory 두 용어가 들어있는 문서, 또는 동의어들을 검색해 내지만, 본 시소러스 참조 질의는 두 단어들을 추론을 통하여 얻어낸 결론인 mp3 player 를 결과 용어로 제시하고, 이를 포함하는 문서들을 검색해 낼 수 있도록 한다.
따라서, 본 시소러스 시스템의 발명의 목적은 다음과 같다. 첫째, 사용자의 직관과 일치할 수 있는 시소러스를 최소한의 비용으로 시스템 용어 추천 방식으로 구축할 수 있도록 지원한다. 둘째, 여러 전문가가 동시에 시소러스를 구축할 경우, 개념들 사이의 의미 구조를 시스템이 미리 파악하여 전문가들에게 제시함으로써 시소러스의 의미적 일관성을 유지시킬 수 있도록 한다. 셋째, 시소러스 개념의 순차 접근 방법뿐만 아니라 질의 방식으로 직접 접근할 수 있는 방법을 모두 지원하여 복잡한 시소러스로부터 사용자가 의도한 개념을 효과적이고 지능적으로 참조할 수 있도록 한다.
본 발명은 전자 상거래의 정보 시스템에서 인테리어, 화학 사이트, 전자 쇼핑몰 등 특정 정보를 효과적으로 검색할 수 있도록 지원하는 도메인 지식 구축 방법에 대한 기술 분야에 속한다. 특히, 객체지향 패러다임을 시소러스에 적용함으로써 시스템의 용어 추천 방식의 구축, 추상화 방식의 브라우징 그리고 지능형 질의 방식의 직접 접근 방법을 지원하는 시소러스 시스템 개발에 관한 기술이다.
최근, 정보 검색 시스템의 속도 향상과 함께 정확률 및 재현률이 역시 중요해짐에 따라 시소러스를 구축하고 효과적으로 이용할 수 있게 하는 시스템에 관한많은 연구들이 진행되고 있다. 특히, 시소러스에 대한 종래의 기술은 응용 도메인에 관련된 문서들로부터 개념들의 동시 출현 빈도를 분석해서 네트워크 구조의 시소러스를 자동으로 구축하고 이들을 질의 처리에 이용하는 기술과 도메인 전문가가 ISO(International Standardization Organization) 2788 과 5964 표준에 따라 계층 구조의 시소러스를 직접 구축하고 지능적인 추론을 통해 사용자가 원하는 시소러스 개념들을 추출하여 검색에 이용하는 기술로 구분된다. 이 시스템들은 기본적으로 시소러스 구축 및 유지 기능, 개념 탐색 기능 그리고 검색 시스템과의 연동 기능을 제공한다.
네트워크 구조의 시소러스를 구축하는 대표적인 시스템으로는 "PhraseFinder", "RBT" 그리고 "SSOM" 등이 있으며, 이들은 일반적으로 개념들 사이의 연관성을 관련 정도로 표현한다. 여기서, 관련 정도는 도메인 문서들로부터 개념들의 동시 출현 빈도에 대한 통계적 정보를 통해 자동 평가된다. 특히, 동시 출현 빈도는 단어들간의 상관 관계 행렬 구성과 종속도 결정 등에 사용되며, 상관 관계 행렬과 단어 종속도는 확장된 벡터 공간 모델과 확률 모델에서 각각 유용한 것으로 알려져 있다. 그러나, 도메인 통계 정보에 의해 자동 구축되는 이 시소러스는 관련 정도만으로 개념들 간의 의미 관계를 정확히 명시할 수 없으며, 우리의 직관과 일치하지 않는 무의미한 관계들을 필연적으로 생성하게 된다. 또한, 이 개념들 사이의 의미 관계를 사용자가 파악하여 원하는 개념을 참조하기란 매우 어렵다는 단점을 가지고 있다.
계층화된 구조의 시소러스를 구축하는 대표적인 시스템으로는 "IBMThesaurus Administrator", "WordNet", "NCI Thesaurus System", "BEAT", "Hierarch", "MultiTes", "TCS" 그리고 "STRID"이 있으며, 시소러스에는 "NASA", "INSPEC" 그리고 "Roget Thesaurus" 등이 있다. 이 시소러스에서 서로 관련된 개념들의 의미 관계 및 관련 정도는 전문가의 수작업에 의해 직접 명시된다. 또한, 정확한 의미 구조의 시소러스를 일관성 있게 구축하고 유동적 특성을 가진 개념들을 유지 보수하기 위해 전문가는 개념들 사이의 복잡한 의미 구조를 모두 파악해야 하는 어려움이 있다. 특히, 방대한 시소러스는 여러 전문가들에 의해 동시에 구축될 수 있기 때문에 구축 과정에서 상호 의미적 일관성을 유지시킬 수 있어야 하며, 구축된 시소러스 개념들을 쉽게 접근할 수 있는 기능을 포함해야 한다. 그러나, 계층화된 시소러스를 구축하기 위한 이 시스템들은 시소러스로부터 사용자가 원하는 개념을 탐색하기 위해 하이퍼링크 방식의 매우 단순한 순차 접근 방법만을 지원하고 있다.
또한 앞서 언급한 바 대로 Naver 나 Empas 그리고 심마니등의 대부분 정보 검색 엔진들은, 질의에 포함되어 있는 용어들을 이용하여 지능적으로 사용자의 의도를 분석해 내는 본 방식과는 달리, 시소러스를 거의 동의어 수준으로만 사용하고 있는 실정이다.
본 발명은 객체지향 패러다임을 시소러스에 적용함으로써 도메인 지식을 보다 구조적이고 지능적으로 표현할 수 있는 지능형 객체지향 시소러스 시스템 개발 방법에 관한 기술이다. 이 시스템에서 이루고자 하는 기술적 과제는 위에서 설명한기존 시소러스 시스템의 문제점들을 해결하기 위한 기술로 다음과 같이 4 가지로 요약된다.
첫째, 도메인 지식의 의미적 구조를 정확히 표현하기 위해 객체지향 패러다임의 구조적 특성을 시소러스에 적용한다. 즉, 시소러스 개념을 객체로 간주하여 기존에 BT/NT 로 표현되었던 객체들 사이의 의미 관계를 일반화 또는 클래스화 관계로 정의하여 객체 계층을 형성하도록 하였다. 따라서, 도메인 개념들의 상당 부분이 인스턴스 객체로 분류되고 이들은 많은 인스턴스 객체들을 포함하는 개념 객체에 의해 효과적으로 관리될 수 있다. 또한, 다양한 의미로 해석되던 RT 를 집성화 관계나 연관화 관계, 그리고 사용자가 정하는 관계등으로 세분화하여 정의하며 한 객체와 연관화/집성화 관계에 있는 객체들은 하위 객체에 상속될 수 있는 속성 객체가 된다.
둘째, 객체지향 패러다임의 상속 성질을 시소러스 구축 메커니즘으로 이용함으로써 일관성 있는 의미 구조의 시소러스를 시스템 용어 추천 방식으로 구축하고 유지할 수 있게 한다. 즉, 상위 객체들 사이의 관계 정보를 시스템이 구조적으로 파악하여 하위 객체의 관계 정보로 상속한다. 이 상속 메커니즘은 시스템의 용어 추천 방식의 시소러스 구축을 지원하여 시소러스 구축 비용을 최소화할 수 있으며, 방대한 시소러스를 여러 전문가들이 서로 다른 호스트에서 구축할 때, 시소러스의 의미적 일관성을 유지시켜 줄 수 있다.
셋째, 객체지향 패러다임의 추상화 기법을 이용하여 사용자의 다양한 관점에 따라 시소러스를 브라우징할 수 있게 한다. 객체지향 시소러스의 개념, 인스턴스의소속성 그리고 객체들 사이의 관계 정보를 추상화하여 사용자 요구에 적합한 형태로 시소러스를 순차적으로 브라우징 할 수 있다. 개념 추상화는 일반적인 의미의 객체로부터 구체적인 객체를 점진적으로 브라우징하는 방법이다. 특히, 이 기능은 하나의 최상위 개념으로부터 파생되는 많은 하위 개념들 중에서 사용자가 의도한 방향에 있는 개념들만을 순차적으로 브라우징할 수 있게 한다.
넷째, 사용자가 여러 개념들과 연관된 시소러스 개념들을 질의 기반으로 직접 접근할 수 있게 한다. 특히, 이 기능은 사용자가 의도한 개념들을 찾기 위해 대용량의 복잡한 시소러스를 여러 단계 브라우징해야 하는 단점을 보완할 수 있는 시소러스 직접 참조 방법을 지원한다. 즉, 사용자가 자신이 의도한 정확한 객체들을 찾기 위해 연관되는 개념들을 이용하여 시소러스 참조 질의를 표현하면, 시스템은 이 질의와 의미적으로 일치하는 객체들을 추론하고, 이 객체들로부터 검색 질의를 자동으로 또는 선택적으로 구성할 수 있게 한다. 따라서, 이 방법으로 구성된 검색 질의는 높은 정확률의 검색을 보장할 수 있을 것이다.
다섯째, 원하는 검색어를 찾는 과정에서 사용하는 질의 처리는 지능적으로 이루어 지는 데, 예를 들어, DVD 또는 CDRW 와 의미적으로 동일한 제품들을 찾아달라는 요구에 대해 시스템은 이 질의를 해석해서 보조기억 장치를 원한다는 사실을 인식한 뒤,CD ROM, 그리고 DVCR 등을 검색해 준다.
그림 1 은 최상위 객체가 '컴퓨터 부품'인 객체 계층을 포함하는 지능형 객체지향 시소러스의 예이다. 이 예에서 나타나는 시소러스 개념들은 전자 쇼핑몰에 관련된 문서에서 자주 사용되는 용어들로 구성되었다. 여기서, 노드는 객체를 의미하며, 링크는 객체들 사이의 관계를 나타낸다. 다음 설명은 이 예에 대한 시스템의 용어 추천 방식의 구축, 추상화 방식의 브라우징 그리고 지능형 시소러스 참조 질의 처리 흐름도를 첨부된 도면을 통해 자세히 설명한다.
제 1 도: 하드웨어 시스템에 대한 기본 구성도
제 2 도: 지능형 객체지향 시소러스 시스템에 대한 처리 흐름도
제 3 도: 최상위 시소러스 객체 구축에 대한 처리 흐름도
제 4 도: 점진적 구축 방식의 시소러스 하위 객체 구축에 대한 처리 흐름도
제 5 도: 선택적 확장 방식의 브라우징에 대한 처리 흐름도
제 6 도: 지능적 질의 처리에 대한 흐름도
제 7 도: 지능형 객체-지향 시소러스 용어 참조 및 검색에 대한 처리 흐름도
본 발명인 지능형 객체지향 시소러스 시스템은 크게 구축 모듈, 브라우징 모듈 그리고 지능형 시소러스 참조 질의 처리 모듈로 구성된다. 다음은 첨부된 도면을 참조하여 위에서 서술된 본 발명의 기술적 과제를 상세히 설명한다. 제 1 도는 본 발명이 적용되는 하드웨어 시스템에 대한 기본 구성 도이다. 각 구성 요소들의기능은 다음과 같다. 시스템의 메인 메모리(101)에는 시소러스 시스템이 탑재된다. 중앙 처리 보드(102)는 메인 메모리에 탑재된 시스템을 실행시키는 보드이다. 입/출력 장치(103)에서는 시소러스 내용을 입력하고 CRT 화면, 텍스트 그리고 포스트 스크립트 파일로 출력한다. 이때, 도메인 전문가가 입력한 시소러스 정보는 객체지향 시소러스 시스템(105)에 의해 처리되어 객체지향 데이터베이스(104)에 저장된다. 유닉스 운영체제가 상기 보드 및 장치를 제어하고, 각 보드 및 장치간에 상호 주고 받는 메시지나 정보들은 시스템 버스(106)를 통해 이루어진다.
제 2 도는 객체지향 시소러스 시스템에 대한 기본 처리 흐름도이다. 사용자는 (201)에서 시스템의 명령 모드를 선택한다. 즉, a 는 시스템의 용어 추천 방식의 시소러스 구축(203)을 위한 모드이고, b 는 추상화 방식의 시소러스 브라우징(204)을 위한 모드이다. c 는 특정 의미의 연관된 개념들을 시소러스로부터 지능적으로 추출하기 위한 시소러스 참조 질의 처리 (205) 모드이다. (206)은 구축된 시소러스 계층 및 관련 정보와 각각의 추상화된 시소러스 정보를 브라우징한다. 사용자 의도에 따라 시소러스 참조 질의의 결과로 처리된 관련 참조 객체들과 이들의 시소러스 참조 그래프는 (208)에서 시각화된다. 이 처리 과정은 (208)에서 반복될 수 있다.
제 3 도는 최상위 객체를 시소러스에 생성하였을 때, 구축 모듈의 처리 흐름도이며 그림 2를 통해 이 과정을 자세히 설명한다.'운영체제','컴퓨터 부품회사' 그리고 '가전제품'의 객체 계층이 이미 여러 다른 전문가에 의해 구축되었다면, 하나의 최상위 객체 '컴퓨터 부품'은 다음과 같은 과정에 따라 생성된다. 먼저, 도메인 전문가가 (301)에서 '컴퓨터 부품'을 생성하면 (302)에서 다른 객체 계층의 최상위 객체를 연관화 객체로 제시한다. 이들 중 '운영체제'와 '컴퓨터 부품회사'를 선택하면 연관화 관계에 미리 정의된 관련 정도 0.7 이 이들 사이의 관계에 자동으로 명시된다. 같은 방법으로, (304)에서 제시한 객체들 중 집성화 객체 'LCD', '반도체소자', 'CASE' 그리고 '가전제품'이 순차적으로 선택되면, 0.8 이 (305)에서 자동으로 할당된다. 자동으로 부여된 관련 정도는 전문가에 의해 재정의될 수 있으며, 이 예에서는 <part-of, 컴퓨터 부품, 가전제품, 0.8>의 관련 정도를 0.85 로재정의하였다.
제 4 도는 상속 메커니즘을 이용한 시스템의 용어 추천 방식의 하위 객체 구축에 대한 처리 흐름도이며, 그림 3 을 통해 이 처리 과정을 설명한다. 먼저, (401)에서 선택된 최상위 객체 '컴퓨터 부품'에 하위 개념 'VGA'을 (402)를 통해 삽입함으로써 일반화 관계를 설정한다 (403). 여기서, 일반화 관계의 무시적 관련 정도 0.9 가 자동으로 명시된다. 이 과정에서 전문가가 삽입되는 개념인 'VGA'과 집성화 그리고 연관화 관계를 가지는 객체들을 모두 파악하여 의미적으로 일관된 관계를 명시하기란 매우 어렵다. 이때, 객체지향 시소러스의 상속 메커니즘이 매우 유용하게 이용된다. 즉,'VGA'의 집성화/연관화 객체들은 '컴퓨터 부품'과 집성화/연관화 관계를 가지는 개념들의 하위 객체들 중에서 선택되기 때문에 이 후보 객체들은 시스템에 의해 쉽게 파악될 수 있다. 먼저, 전문가가 (404)에서 관계 설정을묵시적(no) 또는 명시적(yes)으로 할 수 있다. 묵시적 관계 설정의 경우, (405)와 (406)은 상속 메커니즘에 의해 파악된 집성화/연관화 객체들와 그 관련 정도를 이용하여 해당 관계를 자동으로 설정한다.
그림 4 는 명시적 관계 설정에서 상속 메커니즘을 이용하여 'VGA'의 연관화 후보 객체 및 그 관련 정도를 파악하는 과정을 설명하고 있다(407). 이 파악된 관계 정보는 전문가에게 제시되고 전문가는 (408)에서 이 정보들 중 적절한 것들만을 선택하여 연관화 관계를 설정할 수 있다. 선택된 관계 정보들 중 관련 정도는 필요한 경우 적절히 재정의될 수 있다. 이 과정은 집성화 관계 설정 (409)와 (410)에 같은 방법으로 적용된다.
시소러스에서 인스턴스 객체들은 가장 구체적인 의미의 객체들로 개념들 보다 빈번히 변화되며, 질의 평가에 많이 이용된다. 따라서, 정확한 인스턴스들의 관계를 명시는 매우 중요하다. 객체지향 시소러스에서 클래스화 관계는 많은 객체들이 인스턴스로 처리되는 도메인에서 시소러스를 효율적으로 유지할 수 있도록 한다. 즉, 상속 메커니즘을 클래스 관계에 적용함으로써, 전문가가 인스턴스 관계를개별적으로 명시할 때 보다 적은 비용으로 일관성 있는 정확한 관계를 설정할 수 있다. 이 과정을 그림 5 를 통해 설명한다.
그림 5 에서 'GeForce'이 (401)에서 선택된 'VGA'과 '보조기억장치'의 하위 인스턴스 객체로 각각 0.93 과 0.92 의 관련 정도로 (402)에서 삽입되어 일반화 관계를 설정하고 있다(403). 이때, 전문가에 의해 명시적으로 기술되는 이들의 관련 정도는 클래스화 관계에 미리 할당된 묵시적 관련 정도 0.9 보다 우선한다. 다음으로 상속 메커니즘을 이용하여 'GeForce'은 <association-of, VGA, 주변기기 회사, 0.75>에 의해 'Trident','Cirus Logic' 그리고 'Creative Lab'와 (405)에서 묵시적 상속 관계 'association-of/0.69'가 설정된다. 집성화 관계 역시 (406)에서 같은 방법으로 설정된다. 명시적으로 집성화/연관화 관계를 명시해야 할 경우, 상속 메커니즘에 의해 자동으로 파악된 집성화 객체와 관련 정도를 (407)에서 제시한다.이들 중에서 전문가가 'Trident'을 선택하면, 묵시적 상속 관련 정도 0.69 대신 상위 객체들의 관계 <association-of, VGA, 주변기기 회사, 0.75>의 관련 정도 0.75 를 자동으로 제시하고 사용자는 이 관련 정도를 적절히 수정하여 명시할 수 있다(408). 시스템은 연속하여 같은 방법으로 연관화 관계 <association-of, 컴퓨터 부품, 운영체제, 0.7>에 의해 '운영체제'의 인스턴스 'Win','Unix','Win XP' 그리고 'Linux'를 후보 객체들로 파악하여 관계를 설정할 수 있다. 집성화 관계 역시 같은 방법으로 설정된다.
제 5 도는 추상화 방식으로 구축된 시소러스를 브라우징하는 처리 흐름도이다. 이 처리는 매우 복잡하게 표현된 시소러스로부터 사용자의 관점에 따라 객체들을 순차적으로 브라우징할 수 있게 한다. 객체지향 시소러스의 의미 구조가 객체지향 패러다임으로 표현되기 때문에 다음과 같은 3 가지 추상화된 사용자 관점에 따라 객체들 사이를 브라우징할 수 있는 선택 모드(501)를 지원한다.
"객체 추상화" 모드는 객체 추상화를 통한 브라우징 방법으로 일반적인 의미의 객체로부터 구체적인 객체를 점진적으로 브라우징 한다. 특히, 이 기능은 하나의 최상위 개념으로부터 파생되는 많은 하위 객체들 중에서 사용자가 의도한 방향에 있는 객체들만을 순차적으로 브라우징할 수 있게 한다. 그림 1 의 예로부터 (502)에서 사용자가 일반적인 의미의 최상위 객체 '컴퓨터 부품'을 선택하면, (503)은 이 객체로부터 파생된 하위 객체들 'VGA', '멀티미디어 키트', '보조기억장치', 그리고 '사운드 카드'을 파악한다. 파악된 정보인 하위 객체들과 해당 관계는 (504)에서 브라우징된다. 또한, 브라우징된 객체들 중 'VGA'를 선택함으로써'GeForce'를 점진적으로 브라우징한다.
"인스턴스 소속성 추상화" 모드는 하나 이상의 개념들에 공통적으로 소속된 인스턴스들을 브라우징하는 방법이다. 일반적으로 하나의 개념은 많은 인스턴스들을 가지며, 하나의 인스턴스는 여러 개념에 속하게 된다. 이때, 이 소속성 추상화를 통한 브라우징은 사용자가 인스턴스의 소속 관계를 명확하게 판단할 수 있게 한다. 그림 1 의 예로부터 (505)에서 사용자가 'VGA'과 '보조기억장치'을 동시에 선택하면, (506)은 이 두 객체에 공통적으로 소속된 인스턴스 'GeForce'과 '밀레니엄'을 파악하고 (504)에서 이 파악된 객체들과 해당 관계를 브라우징한다. 이 기능은 특히 방대한 양의 인스턴스들을 가지는 응용 환경에 적합한 기능이다.
"관계 추상화" 모드는 하나의 객체로부터 사용자가 원하는 관계를 가지는 객체들만을 선별적으로 브라우징하는 방법이다. 그림 1 의 예로부터 사용자가 'GeForce'과 집성화/연관화 관계를 가지는 객체들 중 '이어폰'의 정보를 참조하기 위해 (507)에서 'GeForce'를 선택하고 (508)에서 관계 뷰 명령을 실행한다. (509)는 'GeForce'의 집성화/연관화 객체를 파악하고 (504)에서 이들을 브라우징한다.
제 6 도는 복잡한 관계들로 표현된 객체 기반 시소러스로부터 사용자가 요구하는 객체들을 질의 기반으로 직접 참조할 수 있는 시소러스 참조 질의 처리에 대한 처리 흐름도이다. 먼저, (601)에서 사용자는 참조를 원하는 개념들에 대한 시소러스 참조 질의를 입력하고, (602)는 이 질의의 구문을 Lax/Yacc 통해 분석한다. 이때, 시소러스 참조 질의는 [MAIN_QUERY, RESTRICTION_QUERY]과 같이 두 개의 부분 질의로 구성되며, 여기서 MAIN_QUERY 는 사용자가 참조를 원하는 계층의 특정범위를 포괄적인 형태로 선택한다. RESTRICTION_QUERY 는 MAIN_QUERY 에 의해 파악된 개념들의 범위를 더욱 구체적으로 한정하게 된다. 즉,는 MAIN_QUERY에 의해 파악된 개념들 중에서 모든와 동시에 집성화/연관화 관계를 가지는 개념들로 한정하며,는 적어도 하나의와 집성화/연관화 관계에 있는 개념들로 한정한다. (603)은 시소러스 참조 질의의 의미를 분석하여 시소러스로부터 적절한 참조 객체들과 그 관련 정도를 추론하고 이들에 대한 참조 그래프를 시각화한다(604). 이때, 참조 그래프는 추론 객체들의 모든 상·하위 개념들과 각각에 대한 관계들로 구성된 계층 그래프이다. 참조 객체들을 이용한 검색 질의 구성을 위해 사용자는 (605)에서 자동 또는 선택적인 모드를 선택할 수 있다. (606)은 관련 정도를 포함하는 모든 참조 객체들과 부울 연산자 "or"를 이용하여 검색 질의를 자동으로 구성한다. (607)에서는 참조 객체들 중 사용자가 원하는 객체들과 적절한 부울 연산자 "or"와 "and"를 이용하여 사용자가 직접 검색 질의를 구성한다. 전자의 질의는 정확률을 상당 부분 보장하면서 높은 재현률을 요구하는 경우에 유용하게 이용될 수 있으며, 후자의 매우 높은 정확률이 요구되는 경우에 이용될 수 있다. 이 들은 정보 검색 시스템과 통합되기 위한 방법으로 이용된다.
제 7 도는 (603)의 시소러스 객체 참조 및 참조 그래프 생성에 대한 상세 처리 흐름도이다. 먼저, (701)은 MAIN_QUERY 의 유형을 일반화되는 질의또는구체화되는 질의으로 분류한다. 각 경우에 대해 그림 6 과 그림 7 의 예를 통해 설명한다.
구체화되는 질의 경우는 (702)에서 모든 객체가 공통으로 포함하는 하위 객체들의 집합 LBS 을 평가한다. 즉, 시소러스 참조 질의가 [VGA∧보조기억장치, *]일 때,'VGA'과 'VGA'의 공통 하위 객체 집합 LBS={GeForce, 밀레니엄}를 평가한다. (703)은 LBS 의 모든 객체에 대해 가장 일반적인 의미의 객체들의 집합 GLBS 를 계산하며, 예에서는 GLBS=LBS 이다. 이 객체들은 시소러스 참조 질의의 MAIN_QUERY 와 동일한 의미의 객체이다. (706)에서는 GLBS 의 각 객체에 대해 모든 상하위 객체들의 집합 M 를 추론하게 된다. 만약, RESTRICTION_QUERY 가 존재하지 않는다면 (707)에서 M 의 모든 객체들은 GLBS 객체들과의 최대 관련 정도를 객체 계층을 통해 평가하여 퍼지 참조 객체 집합을 계산하고 각각에 해당하는 일반화 관계를 참조 그래프로 생성한다. 그림 6 에서 회색의 부분은 참조 객체들과 참조 그래프를 나타내고 있다.
일반화되는 질의 경우는 (704)에서 모든 객체가 공통으로 포함되는 상위 객체들의 집합 UBS 을 평가한다. 예를 들어 시소러스 참조 질의 [GeForce ∨ 부드, *]에서 'GeForce'과 '부드' 각각 대해 상위 객체들의 공통 집합은 UBS={VGA, 컴퓨터 부품}이다. (705)은 UBS 의 모든 객체에 대해 가장 구체적인 의미의 객체들의 집합 LUBS 를 추론하며, LUBS={VGA}이다. 이 객체들은 시소러스 참조 질의의 MAIN_QUERY 와 동일한 의미의 객체이다. (706)에서는 LUBS 의 각 객체에 대해 모든 상하위 객체들의 집합 M={VGA, 컴퓨터 부품, GeForce, 부드, 밀레니엄}를 파악하게된다.
만약, RESTRICTION_QUERY 가 존재하면, MAIN_QUERY 에 의해 추론된 객체 집합 M 을 RESTRICTION_QUERY 에 대해 (708)과 (709)를 수행한다. (708)은 M 의 객체들 중 i=1,...,m 에 대해과 집성화/연관화 관계를 가지는 객체 집합 Si를 계산한다. 이들은 (809)에서 합집합 연산을 수행한 결과를 통해 (706)을 다시 수행한다. 그림 8 에서 M={컴퓨터 부품, VGA, GeForce, 부드, 밀레니엄}이고 RESTRICTION_QUERY='Win XP' AND 'Trident' AND '이어폰'일 때, (708)와 (709)에서 'Win XP', 'Trident' 그리고 '이어폰'과 동시 집성화 연관화 관계를 가지는 M 의 원소 s={GeForce}를 구할 수 있다. 다음으로 (706)에서 'Geforce'의 모든 상하위객체 집합 M={컴퓨터 부품, VGA, 보조기억장치, GeForce}를 다시 파악한다. 이때, 참조 객체 집합은 집합 S 와 M 의 모든 객체들의 최되 관련 정도를 객체 계층을 통해 평가하여 제시되며, 그림 8 과 같은 참조 그래프를 생성한다.
시소러스 시스템은 시소러스를 보다 효과적으로 구축하고 유지할 수 있게 하며, 구축된 시소러스를 검색 시스템이나 사용자들이 쉽게 이용할 수 있게 하여 검색 성능을 향상시킨다는 점에서 매우 중요한 의미를 가진다. 이를 위해 본 발명에서는 객체지향 시소러스 시스템의 개발 방법을 발명하였다. 이 시스템은 크게 시소러스를 구축하는 기능, 추상화 기법을 이용하여 관련된 개념들을 순차적으로 브라우징하는 기능 그리고 참조 질의를 통해 원하는 개념들을 지능적으로 참조하는 기능으로 구성되었다. 구축 과정에 적용된 객체지향 패러다임은 객체들 사이의 관계를 정확하게 표현할 수 있게 하며, 전문가의 직관과 일치하는 시소러스를 구축할 수 있게 한다. 특히, 이 패러다임의 상속 메커니즘에 의해 구조적으로 파악된 정보는 시스템의 추천에 의해 시소러스 구축에 적극 활용되며, 방대한 시소러스를 여러 전문가들이 서로 다른 호스트에서 구축할 때, 시소러스의 의미적 일관성을 유지시켜 줄 수 있으며 구축 비용 역시 감소시킬 수 있게 한다. 브라우징 기능과 질의기반 참조 기능은 사용자가 의도한 개념들을 순차적으로 또는 직접 탐색 할 수 있게 하여 정확한 검색 질의를 구성할 수 있도록 하였다. 특히, 이질의 구성 방법은 높은 재현률을 요구하는 도메인에 유용하게 이용될 수 있으며, 대표적인 응용 도메인으로 소프트웨어 재사용 부품 검색 시스템을 들 수 있다.

Claims (3)

1. 지능적으로 시소러스 용어들간의 구조적 정보를 활용하여 시스템이 최대한 구축자를 지원하는 방식으로 시소러스를 구축하는 단계
2. 추상화 방식의 시소러스 브라우징 단계
3. 지능형 시소러스 참조 질의 처리 단계
1. 제 1 항의 지능적인 시스템 용어 추천 방식의 시소러스 구축 단계에서 최상위 객체 구축에 대한 소단계; 하위 객체 구축에 대한 소단계
2. 제 1 항의 추상화 방식의 시소러스 브라우징 단계에서 객체 추상화를 통한 브라우징 소단계; 인스턴스 소속성 추상화를 통한 브라우징 소단계; 관계 추상화를 통한 브라우징 소단계;
3. 제 1 항의 시소러스 참조 질의 처리 단계에서 지능적 질의 구문 분석 소단계; 사용자 관심 객체 참조 소단계; 참조 그래프 생성 소단계; 참조 객체를 통한 검색 질의 자동 및 선택적 구성 소단계
1. 제 2 항의 시스템의 용어 추천 방식의 최상위 객체 구축 단계에서 집성화 객체를 제시하는 소단계; 연관화 객체를 제시하는 소단계
2. 제 2 항의 시스템의 용어 추천 방식의 하위 객체 구축 단계에서 일반화 관계를 설정하는 소단계; 상속 메커니즘에 의한 묵시적 연관화 관계를 지능적으로자동 설정하는 소단계; 집성화 관계를 지능적으로 자동 설정하는 소단계; 집성화 객체 및 관련 정도를 지능적으로 자동 제시하는 소단계; 연관화 객체 및 관련 정도를 지능적으로 자동 제시하는 소단계
3. 제 2 항의 객체 추상화 단계에서 선택된 개념의 하위 객체를 파악하는 소단계
4. 제 2 항의 인스턴스 소속성 추상화 단계에서 여러 객체에 공통으로 소속된 인스턴스 객체를 파악하는 소단계
5. 제 2 항의 관계 추상화 단계에서 관계 뷰를 설정하는 소단계; 집성화/연관화 객체를 파악하는 소단계
6. 제 2 항의 사용자 관심 객체 참조 및 참조 그래프 생성 단계에서 LBS 객체를 파악하는 소단계; GLBS 객체를 파악 소단계; UBS 객체를 파악하는 소단계; LUBS 객체를 파악하는 소단계; 객체와 집성화/연관화 관계에 있는 객체 집합을 파악하는 소단계; 참조 객체에 대한 관련 정도를 평가하는 소단계; RESTRICTION_QUERY 를 처리하는 소단계
KR10-2001-0019683A 2001-04-06 2001-04-06 전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식 KR100522839B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2001-0019683A KR100522839B1 (ko) 2001-04-06 2001-04-06 전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0019683A KR100522839B1 (ko) 2001-04-06 2001-04-06 전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식

Publications (2)

Publication Number Publication Date
KR20010084917A true KR20010084917A (ko) 2001-09-07
KR100522839B1 KR100522839B1 (ko) 2005-10-19

Family

ID=19708179

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0019683A KR100522839B1 (ko) 2001-04-06 2001-04-06 전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식

Country Status (1)

Country Link
KR (1) KR100522839B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020006616A (ko) * 2001-11-28 2002-01-23 양재동 맞춤식 web문서 검색을 위한 시소러스 지식 관리
KR101150099B1 (ko) * 2004-09-30 2012-05-25 마이크로소프트 코포레이션 쿼리 그래프

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3275612B2 (ja) * 1995-02-28 2002-04-15 三菱電機株式会社 ファジィシソーラス生成装置
JPH0962702A (ja) * 1995-08-30 1997-03-07 Oki Electric Ind Co Ltd 情報検索方法
KR19980050164A (ko) * 1996-12-20 1998-09-15 양승택 소프트웨어 재사용을 위한 객체기반 라이브러리 검색방법
JPH11265385A (ja) * 1998-03-16 1999-09-28 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置及び方法及び情報検索プログラムを格納した記憶媒体
KR100312591B1 (ko) * 1998-05-25 2001-12-12 오길록 정보 검색에서의 질의 형식화 방법
KR20010019746A (ko) * 1999-08-30 2001-03-15 정선종 시소러스 개념 추출을 위한 질의 기반 참조 방법
KR20020064052A (ko) * 2001-01-31 2002-08-07 (주)시리 물품시소러스 및 이에 기반한 물품정보 검색 시스템

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020006616A (ko) * 2001-11-28 2002-01-23 양재동 맞춤식 web문서 검색을 위한 시소러스 지식 관리
KR101150099B1 (ko) * 2004-09-30 2012-05-25 마이크로소프트 코포레이션 쿼리 그래프

Also Published As

Publication number Publication date
KR100522839B1 (ko) 2005-10-19

Similar Documents

Publication Publication Date Title
Popescul et al. Statistical relational learning for link prediction
CA2461196C (en) Hierarchical data-driven search and navigation system and method for information retrieval
Li et al. Developing engineering ontology for information retrieval
CA2461195C (en) Scalable hierarchical data-driven navigation system and method for information retrieval
Su A text categorization perspective for ontology mapping
Pakari et al. Web service discovery methods and techniques: A review
Necib et al. Ontology based query processing in database management systems
Bouakkaz et al. Efficiently mining frequent itemsets applied for textual aggregation
Kongthon A text mining framework for discovering technological intelligence to support science and technology management
KR100522839B1 (ko) 전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식
Koutrika et al. Rule-based query personalization in digital libraries
Vicente-López et al. Personalization of Parliamentary Document Retrieval Using Different User Profiles.
Kwon et al. Recommendation of e-commerce sites by matching category-based buyer query and product e-catalogs
Pankowski et al. Data access based on faceted queries over ontologies
Choi et al. Text database discovery on the Web: Neural net based approach
Rhee et al. Semantic relevance measure between resources based on a graph structure
Yao et al. Asynchronous information space analysis architecture using content and structure-based service brokering
Aloui et al. A new approach for flexible queries using fuzzy ontologies
Sacco Guided interactive information access for e-citizens
Catarci et al. A light-weight Web-at-a-Glance system for intelligent information retrieval
Kollapudi et al. Integrated framework for semantic text mining and ontology construction using inference engine
Sacco Dynamic taxonomies for intelligent information access
Aundhakar et al. A Survey on User Personalization Using Ontology
Liu et al. OntoPlan: semantic Web based planning
Oleshchuk Ontology-based service matching and discovery

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
E902 Notification of reason for refusal
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120914

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20131011

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20141013

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee