KR20010034973A - 전문검색과 웹 게시판 자료연동에 의한 데이터 구축 및검색 시스템 - Google Patents

전문검색과 웹 게시판 자료연동에 의한 데이터 구축 및검색 시스템 Download PDF

Info

Publication number
KR20010034973A
KR20010034973A KR1020000024880A KR20000024880A KR20010034973A KR 20010034973 A KR20010034973 A KR 20010034973A KR 1020000024880 A KR1020000024880 A KR 1020000024880A KR 20000024880 A KR20000024880 A KR 20000024880A KR 20010034973 A KR20010034973 A KR 20010034973A
Authority
KR
South Korea
Prior art keywords
data
database
full
search
ftr
Prior art date
Application number
KR1020000024880A
Other languages
English (en)
Inventor
이용희
공현민
태광호
장희경
강효성
신현주
정병완
이의백
Original Assignee
이병철
세림정보기술 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이병철, 세림정보기술 주식회사 filed Critical 이병철
Priority to KR1020000024880A priority Critical patent/KR20010034973A/ko
Publication of KR20010034973A publication Critical patent/KR20010034973A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

가. 청구범위에 기재된 발명이 속하는 기술분야.
본 발명은 웹 상에서 사용되는 웹 게시판과 Full-Text 검색엔진(FTR)을 연동 하여 기능별로 구분되어진 각각의 웹 게시판에 대한 데이터 베이스와 FTR 데이터 베이스에 대한 자료구축과 이들 자료에 대한 FTR에 의한 통합 전문검색을 제공함으로 보다 효율적인 검색 및 자료구축 시스템을 제공하기 위한 것이다.
나. 발명이 해결하려는 기술적 과제.
현재 웹 게시판의 경우 정형화된 자료에 국한된 검색 기능을 포함하고 있어 대용량 자료 관리 측면에서는 바람직하나 일반데이터의 검색에 어려움이 있으므로 대부분의 웹사이트에는 다수의 게시판(방명록, 질문·답변, 자료실 등)을 가지고 있으므로 해당 홈페이지 사이트 구성을 전반적으로 잘 모를 경우, 이러한 게시판의 이용을 위해서는 데이터 흐름에 대한 전반적인 이해가 선행되어야 하며, 그렇지 못한 경우 자료에 대한 적극적인 활용을 기대할 수가 없어, 웹 게시판에 의한 자료 관리 및 검색 방식은 일반 사용자가 웹에서 접근하여 자신이 원하는 자료를 얻기 위해 일일이 각각의 메뉴를 찾아 다녀야하는 문제점이 있는 것이다.
다. 발명의 해결방법의 요지.
웹 게시판과 Full-Text 검색엔진(FTR)을 연동 하는 것으로, 웹 게시판 검색의 제약성을 극복하기 위해 자료구축 시 관계형 데이터베이스로의 자료구축과 더불어 형태소 분석에 의한 검색전용 Full-Text 데이터베이스의 동시 자료구축으로 정형화된 자료 및 비 정형화된 자료의 검색이 가능하도록 한다.
또한 사용자는 비정형 데이터 검색 시 한글 검색 입력어에 대해 형태소 분석기를 활용한 색인어휘의 탐색 및 시소러스(즉, 관련 용어 리스트)사용에 의한 확장 검색, 확률 통계 분석기를 활용한 정확도 측정 등으로 SQL92 표준인 LIKE절을 이용한 SELECT보다 빠르고 폭넓은 검색 결과를 도출할 수 있다. 이러한 시스템 구성을 위해 일반 사용자가 웹 게시판에 자료를 입력했을 때, 입력된 내용은 관계형 데이터베이스의 자료로 구축되고, 동시에 한글 형태소 분석에 의한 색인을 작성하여 FTR 데이터베이스의 자료로 최종 생성되어, 이후 웹 게시판 검색 시 사용자 선택에 의해 정형화된 데이터의 검색과 비 정형화된 데이터 검색이라는 두 가지 방법으로 자료를 검색하게 된다.
라. 발명의 중요한 용도
홈페이지의 게시판에 대한 FTR 지원

Description

전문검색과 웹 게시판 자료연동에 의한 데이터 구축 및 검색 시스템{Construct and reference by FTR and peristalsis of data in the web bulletin board}
본 발명은 웹 상에서 이용되는 웹 게시판과 Full-Text 검색엔진(FTR) 연동을 통하여 데이터베이스 자료 구축과 이들 자료에 대한 효율적인 검색을 제공하는 시스템에 관한 것이다.
현재 웹 게시판의 경우 대부분 정형화된 자료에 국한된 검색 기능을 포함하고 있어 대용량에 대한 자료 관리라는 측면에서는 바람직하나 일반데이터의 검색에 어려움이 있으므로 대부분의 웹사이트에는 다수의 게시판(방명록, 질문·답변, 자료실 등)을 가지고 있으므로 해당 홈페이지 사이트 구성을 전반적으로 잘 모를 경우, 이러한 게시판의 이용을 위해서는 데이터 흐름에 대한 전반적인 이해가 선행되어야 하며, 그렇지 못한 경우 자료에 대한 적극적인 활용을 기대할 수가 없는 것이다.
따라서 현행의 웹 게시판에 의한 자료 관리 및 검색 방식은 일반 사용자가 웹에서 접근하여 자신이 원하는 자료를 얻기 위해 일일이 각각의 메뉴를 찾아 다녀야하는 문제점이 있는 것이다.
본 발명은 현행의 웹 게시판 문제점을 해결하기 위한 것으로, 웹 상에서 사용되는 웹 게시판과 Full-Text 검색엔진(FTR)을 연동 하여 기능별로 구분되어진 각각의 웹 게시판에 대한 데이터 베이스와 FTR 데이터 베이스에 대한 자료구축과 이들 자료에 대한 FTR에 의한 통합 전문검색을 제공함으로 보다 효율적인 검색 및 자료구축을 하기 위한 것이다.
도 1은 본 발명의 시스템 구성도.
도 2는 웹 게시판 생성 과정에 대한 흐름도.
도 3은 자료 입력 및 검색에 대한 흐름도.
이하에서는 첨부 도면을 참조하여 본 발명의 가장 바람직한 일 실시 예를 상세히 설명하기로 한다.
도1에 도시한 바와 같이 본 발명의 구성은, 고객(Client)(1)이 인터넷(2)을 통해 웹 게시판에 자료를 올리게 된다.
이렇게 입력된 자료는 게시판 분류에 해당하는 데이터베이스 테이블(Database Table)인 ORDB(3)에 저장하고, 저장된 내용 중 검색의 주요 내용이 되는 자료의 제목, 내용과 자료가 저장된 ORDB(2)의 테이블(Table)위치와 데이터베이스 식별자로 이용되는 것으로 데이터 베이스의 일종인 오라클의 식별자인 RowID와 포스크래스의 식별자인 OID 등의 데이터 베이스 해당 식별자(PK, Primary Key) 등을 포함한 문서를 색인(Indexer)(5)에 저장한다.
색인(5)에 저장된 문서의 형태소 분석에 의한 색인(5) 리스트는 전문검색기(FTR Database:Full Text Retrieval Database)(6)에 저장된다.
이러한 상태에서 고객(1)이 인터넷(2)을 통해 자료 검색을 할 경우, 입력된 검색 질의어는 검색 엔진(Search Engine)(8)을 통해 입력되어 형태소 분석기(7)를 통해 각각의 형태소로 나누어지고, 색인(5)을 통해 전문검색 데이터베이스(6)를 통해 형태소 분석에 의한 색인 목록을 통해 형태소로 나누어진 검색 어와 일치되는 것을 찾아, 검색 엔진(8)을 통해 이용자에게 응답하게 되는 것이다.
이를 도2와 도3에 도시된 흐름 도를 통해 상세히 설명하면 다음과 같다.
도2는 관리자가 웹 게시판을 생성하는 과정을 나타내는 것으로 관리자가 새로운 게시판을 만들고자 한다면, 먼저 접속된 이용자가 관리자인지 아닌지를 확인하는 단계(S100)를 거쳐 관리자 인증을 한 후에 관리자가 아니면 에러 메시지(S110)와 함께 종료하고, 관리자인 경우에는 게시판 생성 단계(S120)를 거치고 첨부 파일과 디렉토리 생성단계(S130)를 거쳐 종료하게 된다.
도3은 이용자에 의한 자료 입력과 검색을 나타내는 것으로, 이용자가 게시판에서 주어진 메뉴를 선택하는 게시판 메뉴 선택(S200)단계를 통해 메뉴를 선택하면, List 화면 출력(S210)단계를 통해 화면에 선택된 메뉴의 목록을 나열하게 되고, 검색 선택(S220)에서 이용자가 자료 검색이 아닌 자료 입력을 선택하면, 이용자가 자신이 가지고 있는 자료를 게시판에 입력하는 자료 입력(S230)단계로 넘어가고, 입력된 자료를 통해 데이터베이스를 구축하는 데이터베이스(DB) 구축(S240)단계를 거쳐 구축된 데이터베이스를 통해 입력된 자료에 대한 상세 내용과 자료에 해당하는 상세 정보를 통해 만들어진 문서를 형태소 분석기를 통해 만들어낸 데이터를 이용하여 전문검색(FTR) 색인을 구축하는 전문검색 색인 구축(S250)단계를 거치게 된다.
만일 이용자가 자료 검색(S220)을 원하면 전체 검색(S260)단계로 넘어가고 이용자가 전체검색을 원하지 않는다면 현재 게시판 검색 결과 목록 및 그 자료와 연관되는 곳을 연결하는 사이트 링크를 제공하는 현재 게시판 검색 결과 List 및 Link(S270)제공 단계를 거치게 된다.
전체 검색(S280)을 원한다면 입력된 자료의 내용과 상세 정보에 대한 문서를 형태소 분석기를 통해 작성된 문서를 전문 검색한 결과와 그 결과와 연결된 문서에 대한 결과를 제공하는 단계인 전문검색(FTR) 전체 검색결과 List 및 Link (S280)단계를 거치며 이용자가 보다 상세한 정보를 요구할 경우 상세 정보(S290)요청 단계를 통해 이용자가 상세 정보를 요구할 경우에는 ORDB 쿼리 결과 Display(S300)단계를 거쳐 종료하게 된다.
따라서 기존의 웹 게시판의 제약성, 보편성을 극복하기 위해 정형화된 관계형 데이터베이스의 자료구축 및 비 정형화된 검색 전용 Full-Text 데이터베이스의 동시 자료구축으로 기능별 또는 DB Table에 종속적인 검색에서 벗어나, 전체 웹 게시판에 대한 자료 및 특정 웹 게시판에 대한 자료의 검색이 가능하며, 각각의 경우에 대해 한글 형태소 분석기 및 시소러스를 사용하여 데이터베이스를 구축하고 확률 통계분석기를 활용한 정확도 측정에 의한 주제어를 식별하게 되는 것이다.
상술한 바와 같이 본 발명은 웹 상에서 사용되는 웹 게시판과 Full-Text 검색엔진(FTR)을 연동하여 기능별로 구분되어진 데이터베이스(Database)에 의한 자료 구축과 이들 자료에 대한 FTR에 의한 통합 전문검색으로 보다 효율적인 검색 및 자료 구축이 가능하다.

Claims (3)

  1. 웹 게시판을 통해 데이터베이스를 구축하여 데이터베이스에 구축된 자료를 바탕으로 검색 전용 전문 검색 엔진(Full Text DB)을 구축하여 전체 자료와 부분 자료의 검색이 가능하도록 하는 전문 검색엔진과 웹 게시판 연동을 특징으로 하는 것.
  2. 청구항 1에 있어서, 입력된 자료에 대한 내용과 데이터 정보를 이용해 만든 문서를 형태소 분석기를 통해 형태소 분석에 의한 결과를 전문 검색 데이터베이스(FTR Database, Full Text Retrieval database)에 저장하는 것을 특징으로 하는 것.
  3. 이용자가 검색을 원할 경우에는 이용자가 입력한 검색 key-word를 이용하여 검색 엔진을 통하여 전문 검색(FTR) 결과 목록과 그와 관련된 연결 문서를 제공하는 것을 특징으로 하는 것.
KR1020000024880A 2000-05-10 2000-05-10 전문검색과 웹 게시판 자료연동에 의한 데이터 구축 및검색 시스템 KR20010034973A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000024880A KR20010034973A (ko) 2000-05-10 2000-05-10 전문검색과 웹 게시판 자료연동에 의한 데이터 구축 및검색 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000024880A KR20010034973A (ko) 2000-05-10 2000-05-10 전문검색과 웹 게시판 자료연동에 의한 데이터 구축 및검색 시스템

Publications (1)

Publication Number Publication Date
KR20010034973A true KR20010034973A (ko) 2001-05-07

Family

ID=19668322

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000024880A KR20010034973A (ko) 2000-05-10 2000-05-10 전문검색과 웹 게시판 자료연동에 의한 데이터 구축 및검색 시스템

Country Status (1)

Country Link
KR (1) KR20010034973A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020022741A (ko) * 2002-02-01 2002-03-27 박홍순 정보 콘텐츠에 관련 통계 데이터베이스를 연동시켜 통합콘텐츠를 생성하는 자동 시스템 및 방법
KR100562276B1 (ko) * 2004-07-27 2006-03-22 최태헌 전자문서 분철기술과 전문검색기술을 통합한 페이지 검색정보 제공 시스템 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020022741A (ko) * 2002-02-01 2002-03-27 박홍순 정보 콘텐츠에 관련 통계 데이터베이스를 연동시켜 통합콘텐츠를 생성하는 자동 시스템 및 방법
KR100562276B1 (ko) * 2004-07-27 2006-03-22 최태헌 전자문서 분철기술과 전문검색기술을 통합한 페이지 검색정보 제공 시스템 및 방법

Similar Documents

Publication Publication Date Title
He et al. Automatic integration of web search interfaces with wise-integrator
Cafarella et al. Webtables: exploring the power of tables on the web
Motro BAROQUE: A browser for relational databases
Lashkari et al. Efficient indexing for semantic search
JP4769822B2 (ja) ページグループを用いた情報検索サービス提供サーバー、方法及びシステム
Zaı̈ane Building virtual web views
Mihaila et al. Equal time for data on the internet with websemantics
Sarda et al. Mragyati: A system for keyword-based searching in databases
JPH09212517A (ja) 情報代行検索方法及び装置
KR20010034973A (ko) 전문검색과 웹 게시판 자료연동에 의한 데이터 구축 및검색 시스템
US7490082B2 (en) System and method for searching internet domains
Curry et al. Querying and searching heterogeneous knowledge graphs in real-time linked dataspaces
JP2000330979A (ja) 検索対象となる電子文書の解析方法及び電子文書登録システム
KR20010107810A (ko) 웹 검색시스템 및 그 방법
Wan et al. Experiments with automatic indexing and a relational thesaurus in a Chinese information retrieval system
Vickers Ontology-based free-form query processing for the semantic web
JP3578045B2 (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
Frieder et al. On scalable information retrieval systems
Chow et al. Index design for structured documents based on abstraction
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
Tekli et al. Upgraded semindex prototype supporting intelligent database keyword queries through disambiguation, query as you type, and parallel search algorithms
Li et al. Structured querying of annotation-rich web text with shallow semantics
Minock Natural language access to relational databases through STEP
Wouda Similarity between Index Expressions
JP2007133505A (ja) 情報検索支援システム、情報検索支援方法及び情報検索支援プログラム

Legal Events

Date Code Title Description
G15R Request for early opening
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application