KR20020006616A - 맞춤식 web문서 검색을 위한 시소러스 지식 관리 - Google Patents

맞춤식 web문서 검색을 위한 시소러스 지식 관리 Download PDF

Info

Publication number
KR20020006616A
KR20020006616A KR1020010075571A KR20010075571A KR20020006616A KR 20020006616 A KR20020006616 A KR 20020006616A KR 1020010075571 A KR1020010075571 A KR 1020010075571A KR 20010075571 A KR20010075571 A KR 20010075571A KR 20020006616 A KR20020006616 A KR 20020006616A
Authority
KR
South Korea
Prior art keywords
thesaurus
terms
relation
documents
menu
Prior art date
Application number
KR1020010075571A
Other languages
English (en)
Inventor
양재동
최재훈
Original Assignee
양재동
(주)케이테크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 양재동, (주)케이테크 filed Critical 양재동
Priority to KR1020010075571A priority Critical patent/KR20020006616A/ko
Publication of KR20020006616A publication Critical patent/KR20020006616A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

본 발명은 web 검색엔진들이 개개인에게 맞춤식으로 특화된 서비스를 하기 위해 필요한 지식 베이스를 구축하고 유지해 주며 보수 변경이 시각화된 환경에서 제한 없이 이루어지도록 개발되었다. 본발명은 신조어가 끊임없이 생성되며 분류 기준 및 관심을 가지는 관점이 자주 바뀌는 첨단 분야 전문 정보 검색 응용에 최적이다. 본 시스템은 시각화된 환경에서 용어 지식베이스를 관계성에 따라 항해하듯이 브라우징 할 수 있어서 사용자에게 보다 편리한 뷰를 제공한다. 기존의 불리언 질의와는 다른 차원의 지능형 용어 검색을 지원하며 이 검색을 이용하여 확장된 사용자 질의를 기존의 empas 나 naver등의 검색 사이트로 보내어 보다 정교한 결과를 얻을 수도 있다. 또한 시소러스 입력이 여러 site에서 동시 다발적으로 일어난다고 하더라도 시소러스 구축은 장소와 무관하게 client/server 방식으로 통합된 DB상에서 이루어지기 때문에 시소러스 관리자가 이를 일관되고 체계적으로 제어할 수 있다. 따라서 통합관리가 용이하고 양질의 시소러스 구축이 가능하다. 본 발명으로 기존의 정보 검색 엔진들은 쉽게 도메인 지식 및 추론 메카니즘을 활용할 수 있어서 보다 양질의 전문화된 검색, 맞춤식 검색 서비스를 제공할 수 있다.

Description

맞춤식 web문서 검색을 위한 시소러스 지식 관리 {O-Thesaurus knowledge base manager for personalized searching for documents}
O-Thesaurus Manager 는 정보검색분야에서 도메인 종속적인 시소러스를 포함하는 지식베이스 관리기로서, 현재 시소러스 편집기는 국내에는 오롬테크, 한국 정보공학 그리고 3소프트 등에서 각자의 시소러스 구축 사업을 원활하게 하기 위해자체 개발해 사용하고 있는 레코드 입력 형식의 시스템이다. 따라서 본 시스템이 지원하는 시각화된 환경, 무제한 적인 시소러스 유지 보수 변경 등은 불가능하다. 최근 본인이 특허 출원한 바 있는 객체-지향 시소러스 편집기는 반자동 구축과 시소러스 내 용어들에 대한 지능적 검색을 지원한다. 그러나, 이 편집기도, 시각화된 구축 환경과 제약 없는 시소러스 구조 갱신, Empas 나 Naver등으로의 맞춤 검색은 지원하지 못한다. 국제적으로는 네트워크 구조의 시소러스를 구축하는 대표적인 시스템으로 "PhraseFinder", "RBT" 그리고 "SSOM" 등이 있으며, 계층화된 구조의 시소러스를 구축하는 대표적인 시스템으로는 "IBM Thesaurus Administrator", "WordNet", "NCI Thesaurus System", "BEAT", "Hierarch", "MultiTes", "TCS" 그리고 "STRID"이 있다. 그러나, 계층화된 시소러스를 구축하기 위한 이 시스템들은 시소러스로부터 사용자가 원하는 개념을 탐색하기 위해 하이퍼링크 방식의 매우 단순한 순차 접근 방법만을 지원하고 있다. 또한, 이 시스템들은 직접 접근 방법을 지원하고 있지 않기 때문에 여러 개념들과 복합적으로 연관된 사용자 관심 개념을 여러 단계의 순차인 접근 과정을 통해 탐색해야 하는 단점을 가지고 있다.
본 발명이 추구하는 기술적 과제는 다음과 같다.
1. 완벽하게 시각화된 환경에서 지식베이스 구조의 변경, 용어 추가, 삭제, 갱신 등을 거의 제한 없이 가능하게 함으로써 유지 보수 비용을 절감한다.
2.다수의 도메인 전문가들이 동시에 시소러스를 구축할 경우에 시스템이 서로 다른 전문가들이 구축한 용어들 사이의 관련성 및 제약사항을 구조적으로 파악해서 조언해줌으로써 시소러스 구축작업을 보다 용이하게 하고 일관성 있는 시소러스가 구축될 수 있도록 지원한다.
3. 시각화된 환경에서 용어 지식베이스를 BT/NT, part-of, association 등의 관계성에 따라 항해하듯이 브라우징 할 수 있으며 spreading activation 방식으로 용어 관계성 에지들이 확장/축소되므로 용어 지식베이스가 적절히 추상화 시킨다.
4. 질의자가 직접 적절한 탐색어를 용어 지식베이스 상에서 찾고자 할 때 참조 질의를 통해 원하는 용어들이 있는 곳으로 직접 브라우징 할 수 있도록 지원하며, 이 용어들을 이용하여 확장된 사용자 질의를 기존의 empas 나 naver등의 검색 사이트로 보내어 보다 정교한 결과를 얻을 수 있도록 한다. 이러한 기능은 지식베이스에 내장되는 도메인 용어 확장 드라이버가 지식베이스내의 관계성 링크간을 추론함으로써 가능하다.
5. 전문가가 용어 지식베이스를 구축시 삽입될 관련 용어들을 쉽게 수집할 수 있게 하기 위해 해당 범주에 관련된 문서들을 웹상에서 검색한 뒤 분류해서 제시하는데 이 기능은 지식베이스 구축자가 용어를 수집하기 위해 웹을 포함하여 신문, 관련 전문서적, 사전 등을 참조하면서 보내는 시간 낭비를 최소화 하도록 해준다.
6. 시소러스 입력이 여러 site에서 동시 다발적으로 일어난다고 하더라도 시소러스 구축은 장소와 무관하게 client/server 방식으로 통합된 DB상에서 이루어지기 때문에 시소러스 관리자가 이를 일관되고 체계적으로 제어할 수 있게 한다. 따라서 통합관리가 용이하고 양질의 시소러스 구축이 가능하다. 예를 들어 타 전문가가 잘못된 방향으로 시소러스를 구축하고 있을 경우, 관리자는 본 관리기를 통해 시소러스 구조를 곧바로 개조해 주거나 모범적인 시소러스 구축 모델을 예시함으로써 시정해 줄 수 있다.
제1도는 시소러스 구축 흐름도
제2도는 시스템의 시작 화면 구성도
제3도는 시스템 제안 방식의 시소러스 관계성 명세도
제4도는 Spreading activation 및 항해 방식의 시소러스 브라우징 처리 흐름도
제5도는 참조질의 방식의 브라우징 및 지능형 질의 검색 처리 흐름도
제6도는 검색된 내용을 이용한 조건에 맞는 웹 검색 처리 흐름도
제7도는 시소러스 계층구조 변경 처리 흐름도
제8도는 시소러스 구조의 동적 변경 처리 흐름도
시스템의 풀다운 메뉴와 아이콘 메뉴의 구성은 아래 그림1과 같다.
시스템의 시작 화면은 브라우저와 뷰 윈도우가 함께 구성되어 있으며, 동시에 관련정도 바를 참조할 수가 있어 편리하다(도 2 참조).
시스템 제안 방식의 시소러스 관계성 명세 기능으로 시스템이 용어간 연관성 링크관계를 추적해서 연관성이 있는 가능한 모든 용어들을 제안해주고 구축자는 이들로부터 연관성이 큰 용어를 선택하는 방식의 용어간 명세가 가능하다(도 3 참조).
시각화된 환경에서 시소러스를 BT/NT, part-of, association 등의 관계성에 따라 항해하듯이 브라우징 할 수 있으며 spreading activation 방식으로 시소러스 관계성 edge 들이 확장/축소되므로 시소러스가 적절히 추상화되고 따라서 사용자에게 보다 편리한 뷰를 제공하게 된다(도 4 참조).
참조질의 방식의 브라우징 및 지능형 질의 검색이 가능하여 참조하고자하는 용어를 선택한 후 오른쪽 버튼을 클릭하여 팝업메뉴의 View Relationship을 선택하면 참조결과가 새로운 창으로 나타나므로 모든 관계정보를 한눈에 파악할 수 있어 편리하다. 질의자가 직접 적절한 탐색어를 시소러스 상에서 찾고자 할 때 참조 질의를 통해 원하는 용어들이 있는 곳으로 직접 브라우징할 수 있도록 지원한다. 예를 들어, PDA 중 무선전화 기능이 있는 제품명들을 시소러스에서 모두 검색해내는 것이 가능하다(도 5 참조).
검색된 내용을 이용하여 조건에 맞게 웹에서 검색이 가능하다. Instance Object List에서 검색하고자 하는 인스턴스를 더블클릭하고, Query Operators를 이용하여 검색조건을 만든다. 찾고자 하는 검색조건을 입력한 후 Retrieval 버튼을누르고 취소하고 싶으면 Cancel 버튼을 누른다. 다양한 검색사이트 중 하나를 선택하여 검색할 수 있으며 Retrieval 버튼을 누르면 검색사이트가 새창으로 열리면서 검색 결과를 보여준다(도 6 참조).
시소러스 계층구조의 변경이 가능하다. 해당 인스턴스를 선택한 후 팝업메뉴의 Make Group 을 선택하여 그룹명과 그룹화할 인스턴스를 축가하고 OK버튼을 누르면 그룹이 만들어지면서 계층구조가 바뀌게 된다(도 7 참조).
시소러스 구조의 동적 변경 기능을 지원한다. 용어들간의 복잡한 관계성이 설정되어 있는 시소러스의 구조를 거의 제한 없이 변경할 수 있기 때문에 시소러스 구축시의 Quality 제어와 시행착오로부터 오는 시간 낭비를 최소화하게 된다. 이미 입력한 하위개념이 현재의 상위개념보다 더 적절한 다른 객체의 하위개념으로 바꾸고 싶을 때, 이 개념과 이 개념 밑의 모든 객체들을 지우고 다시 생성할 필요없이 Cut and Paste 기능을 이용하면 모든 Relationship을 유지하면서 개념 계층에서의 소속을 변경할 수 있다(도 8 참조).
1. 통합 시소러스 구축이 용이하므로 많은 전문인력이 동시 다발적으로 시소러스를 구축하더라도 총괄적으로 통제, 가이드, 의사소통이 용이하므로 단기간에 대용량의 시소러스 구축이 가능하다. 또 시각적 환경에서의 통합적 관리가 가능하므로 양질의 컨텐트를 보장할 수 있다. 특히, 유지 보수가 용이하므로 신조어가 많이 발생하는 전자 정보통신 분야의 정보 검색용 시소러스 구축에 최적이다.
2. 시소러스 검색기는 용어들간의 관련성 링크를 이용하여 사용자가 원하는정보를 효과적으로 찾기 위한 개념들을 선정해 주기 때문에 정교하고 지능적인 검색이 요구되는 인터넷 홈쇼핑몰 응용에 최적이다. 또, 검색시 상당한 정도의 전문성이 요구되는 전문 사이트에서 사용자들이 상식적인 질문을 하더라도 이를 해석, 적절한 전문 용어들로 바꾸어 주기 때문에 도메인 지식이 없는 사용자들도 고객으로 유치 가능하다.
3. 감성에 관련되는 용어들간의 상관 관계를 추론을 통하여 정확히 모델링 해 내기 때문에 섬세하게 원하는 정보를 검색할 수 있도록 지원한다. 예를들어, 낭만적인 응접실의 정보를 사용자가 요구할 경우 핑크 색의 소파나 소품이 있는 거실도 보여주므로 사용자의 만족을 극대화 한다.
4. 사용자가 찾고자 하는 문서의 제목과 개념적으로 관련되는 문서들을 상당 부분 검색해줄 수 있는 도서 검색 시스템 구축에 활용할 수 있다. 예를 들어 웹 인터페이스 프로그램에 관련된 도서를 찾는 사용자에게 시소러스를 이용하여 PHP, ASP, JSP 등에 관련된 도서들도 검색해줌으로써 사용자들의 만족을 최대화 한다.
본 시스템의 정성적 효과는 다음과 같다.
一 일관되고 체계적인 시소러스 구축이 가능
一 대용량 시소러스 통합 및 quality control 이 용이
一 시소러스 유지/보수/구조 변경이 아주 용이
一 시각화된 환경에서 시소러스 구축/유지/보수가 가능하도록 지원함으로써 구축자의 편의성을 극대화
一 DB 를 통한 시소러스 구축으로 안정성 보장
一 client/server 방식의 시소러스 구축환경지원으로 시소러스 통합 및 시소러스 구축시 관리를 체계적으로 지원
본 시스템의 정량적 효과는 다음과 같다.
一 반자동 방식의 시소러스 구축환경 지원으로 시소러스 구축 시간 대폭 절감
一 대용량이고 양질의 시소러스를 최소한의 비용으로 구축
一 시소러스 편집기 내장으로 시소러스 upgrade 비용을 최소화

Claims (5)

  1. 완벽하게 시각화된 환경에서의 시소러스 입력, 자동 확장/축소 방식의 브라우징, 용어간 관계성 항해기능
  2. 시각화된 환경에서 관계의 일관성을 유지하면서의 동적인 시스러스 구조/변경 기능, 즉 시소러스 BT/NT 트리의 일부분을 다른 트리로 cut/paste, BT/NT 시소러스 용어간에 새로운 용어를 추가하여 구조를 변경 그리고 동일한 용어명의 두 시소러스 용어를 동치관계로 설정하는 기능.
  3. 시각적인 환경에서 통합 시소러스 관리자가 다른 시소러스 구축자의 구축 사항을 일목 요연하게 모니터 할 수 있고 시소러스 구조 변경, 검증, 에러 교정등을 통한 가이드로 양질의 시소러스를 보장해 주는 기능
  4. 추론을 통하여 얻어낸 용어를 이용한 확장 질의를 시소러스 관리기내에서 empas나 naver 등으로 보내 이들을 맞춤식의 검색 엔진으로 만들어 주는 기능
  5. 시소러스 구축시 문서 분류를 통한 관련 용어 추출.
    전문가가 시소러스 구축시 삽입될 관련 용어들을 쉽게 수집할 수 있게 하기 위해 해당 범주에 관련된 문서들을 web상에서 검색한 뒤 분류해서 제시한다. 이 기능은 시소러스 구축자가 시소러스 용어를 수집하기 위해 web을 포함하여 신문, 관련 전문서적, 사전등을 참조하면서 보내는 시간 낭비를 최소화한다.
KR1020010075571A 2001-11-28 2001-11-28 맞춤식 web문서 검색을 위한 시소러스 지식 관리 KR20020006616A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020010075571A KR20020006616A (ko) 2001-11-28 2001-11-28 맞춤식 web문서 검색을 위한 시소러스 지식 관리

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010075571A KR20020006616A (ko) 2001-11-28 2001-11-28 맞춤식 web문서 검색을 위한 시소러스 지식 관리

Publications (1)

Publication Number Publication Date
KR20020006616A true KR20020006616A (ko) 2002-01-23

Family

ID=19716519

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010075571A KR20020006616A (ko) 2001-11-28 2001-11-28 맞춤식 web문서 검색을 위한 시소러스 지식 관리

Country Status (1)

Country Link
KR (1) KR20020006616A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100475362B1 (ko) * 2002-11-08 2005-03-11 주식회사 제로원시스템 웹브라우저 표면에서 새로운 필드 생성 및 내용 갱신 방법
WO2010058913A2 (ko) * 2008-11-21 2010-05-27 한국과학기술원 이즈-어 관계 자동 추론 방법 및 상기 이즈-어 관계 자동 추론 방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수 있는 기록매체

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0232470A (ja) * 1988-07-22 1990-02-02 Nippon Telegr & Teleph Corp <Ntt> シソーラス編集装置
KR20010019746A (ko) * 1999-08-30 2001-03-15 정선종 시소러스 개념 추출을 위한 질의 기반 참조 방법
KR20010056963A (ko) * 1999-12-17 2001-07-04 서휘 시소러스 자동구축 및 자동검색 방법
KR20010084917A (ko) * 2001-04-06 2001-09-07 양재동 전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식
KR20010107810A (ko) * 2001-10-12 2001-12-07 주식회사 케이랩 웹 검색시스템 및 그 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0232470A (ja) * 1988-07-22 1990-02-02 Nippon Telegr & Teleph Corp <Ntt> シソーラス編集装置
KR20010019746A (ko) * 1999-08-30 2001-03-15 정선종 시소러스 개념 추출을 위한 질의 기반 참조 방법
KR20010056963A (ko) * 1999-12-17 2001-07-04 서휘 시소러스 자동구축 및 자동검색 방법
KR20010084917A (ko) * 2001-04-06 2001-09-07 양재동 전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식
KR20010107810A (ko) * 2001-10-12 2001-12-07 주식회사 케이랩 웹 검색시스템 및 그 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
논문(1999.09.00 ) *
논문.[시소러스 브라우저 구현 (p298-p299) 참조](2000.06.00) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100475362B1 (ko) * 2002-11-08 2005-03-11 주식회사 제로원시스템 웹브라우저 표면에서 새로운 필드 생성 및 내용 갱신 방법
WO2010058913A2 (ko) * 2008-11-21 2010-05-27 한국과학기술원 이즈-어 관계 자동 추론 방법 및 상기 이즈-어 관계 자동 추론 방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수 있는 기록매체
WO2010058913A3 (ko) * 2008-11-21 2010-08-05 한국과학기술원 이즈-어 관계 자동 추론 방법 및 상기 이즈-어 관계 자동 추론 방법을 컴퓨터에서 실행시키기 위한 프로그램을 포함하는 컴퓨터로 읽을 수 있는 기록매체

Similar Documents

Publication Publication Date Title
JP3053153B2 (ja) 文書管理システムのアプリケーション起動方法
JP3891909B2 (ja) 情報検索支援システム、アプリケーションサーバ、情報検索方法、およびプログラム
US5644740A (en) Method and apparatus for displaying items of information organized in a hierarchical structure
US6356920B1 (en) Dynamic, hierarchical data exchange system
KR100337810B1 (ko) 인터넷상의 검색전문웹사이트 및 그 검색방법
WO1995023371A1 (en) Apparatus and method for retrieving information
JPH07319917A (ja) 文書データべース管理装置および文書データべースシステム
Ceri et al. Extending WebML for modeling multi-channel context-aware web applications
CN107291940A (zh) 页面内容管理方法、装置及相关服务器
CN100489846C (zh) 信息管理装置和方法
JP3590726B2 (ja) データベース検索システム,検索用サーバ装置,クライアント端末およびサーバ用プログラム記録媒体
KR20000049456A (ko) 홈페이지 자동생성 및 관리방법
Davies et al. Next generation knowledge access
JPH07129448A (ja) ファイル選択システム
CN1504929A (zh) 描述供利用的商务和技术信息的方法
JP2000231570A (ja) インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
KR20020006616A (ko) 맞춤식 web문서 검색을 위한 시소러스 지식 관리
US7269592B2 (en) Computer system
Falquet et al. Design and Analysis of Active Hypertext Views on Databases
KR20030051577A (ko) 검색사이트의 검색결과 표시방법
JPH11288412A (ja) 文書作成方法及びシステム及び文書作成プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11282882A (ja) 文書管理方法
EP1304640A2 (en) System and method for using web based wizards and tools
Lee et al. Favorite folders: A configurable, scalable file browser
JP3493354B2 (ja) 文書検索方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application