KR100741283B1 - 정보 검색시스템에서의 정보 검색을 위한 부분검색 장치 및 그 방법과 이의 인덱스 테이블 구축 방법 - Google Patents

정보 검색시스템에서의 정보 검색을 위한 부분검색 장치 및 그 방법과 이의 인덱스 테이블 구축 방법 Download PDF

Info

Publication number
KR100741283B1
KR100741283B1 KR1019990057609A KR19990057609A KR100741283B1 KR 100741283 B1 KR100741283 B1 KR 100741283B1 KR 1019990057609 A KR1019990057609 A KR 1019990057609A KR 19990057609 A KR19990057609 A KR 19990057609A KR 100741283 B1 KR100741283 B1 KR 100741283B1
Authority
KR
South Korea
Prior art keywords
code
information
index
search
index table
Prior art date
Application number
KR1019990057609A
Other languages
English (en)
Other versions
KR20010056171A (ko
Inventor
유광일
이혜림
홍희경
신은경
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1019990057609A priority Critical patent/KR100741283B1/ko
Publication of KR20010056171A publication Critical patent/KR20010056171A/ko
Application granted granted Critical
Publication of KR100741283B1 publication Critical patent/KR100741283B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 정보 검색시스템에서의 정보 검색을 위한 부분검색 장치 및 그 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은, 전화번호 검색시스템, 웹 검색시스템, 도서관, 자료실, 쇼핑몰시스템 등과 같은 검색시스템에서 데이터베이스관리시스템(DBMS)내에 저장된 정보의 검색시에, 구조적 질의언어(SQL)를 통해 부분검색을 수행함으로써, 온라인 트랜잭션하에서 완벽하게 특정 데이터의 부분검색을 지원하기 위한 부분검색 장치 및 그 방법과, 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명은, 정보 검색시스템에서 특정 데이터를 부분검색하는 방법에 있어서, 정렬규칙에 따라 인덱스 정보가 정렬된 인덱스 테이블을 구축하는 단계; 입력 질의어를 코드로 변환하는 단계; 상기 변환된 질의어 코드를 소정의 음절 단위로 분리하는 단계; 상기 음절 단위로 분리된 코드를 질의어로 하여 사용자 정의 함수(UDF)에 의해 구조적 질의언어(SQL)로 사용자 정의 함수(UDF)에 의해 구조적 질의언어(SQL)로 상기 인덱스 테이블을 검색하여 유일키를 추출하는 단계; 및 상기 유일키를 이용하여 원하는 정보를 검색하는 단계를 포함함.
4. 발명의 중요한 용도
본 발명은 정보 검색시스템 등에 이용됨.
부분검색, 정보검색, 인덱스, 구조적 질의언어(SQL), 사용자 정의 함수(UDF)

Description

정보 검색시스템에서의 정보 검색을 위한 부분검색 장치 및 그 방법과 이의 인덱스 테이블 구축 방법{Apparatus and method for searching pattern matching information in information searching system}
도 1 은 일반적인 사용자 입력 검색어 기반의 검색시스템의 구성도.
도 2 는 본 발명에 따른 부분검색 장치의 일실시예 구성도.
도 3 은 본 발명에 따른 부분검색 방법을 위한 인데스 테이블 구축 과정에 대한 일실시예 흐름도.
도 4 는 본 발명에 따른 부분검색 방법에 대한 일실시예 흐름도.
*도면의 주요 부분에 대한 부호의 설명
21 : 검색 인터페이스부 22 : 데이터베이스 검색부
23 : 검색어 데이터베이스
본 발명은 전화번호 검색시스템, 웹 검색시스템, 도서관, 자료실, 쇼핑몰시스템 등과 같은 검색시스템에서 데이터베이스관리시스템(DBMS : Database Management System)내에 저장된 정보의 검색시에, 구조적 질의언어(SQL : Structured Query Language)를 통해 부분검색을 수행할 수 있는 부분검색 장치 및 그 방법과 이의 인덱스 테이블 구축 방법과, 상기 방법들을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
먼저, 구조적 질의언어(SQL)에 대해 살펴보면 다음과 같다.
SQL은 데이터베이스에서 정보를 얻거나 갱신하기 위한 표준화된 언어로서 대화형으로 이용하거나, 프로그램내에 삽입하여 쓸 수 있다.
SQL이 "ANSI"와 "ISO"의 표준이긴 하지만 표준으로 정해진 사항에 덧붙여, 독자적인 확장 SQL을 지원하는 데이터베이스도 많다.
데이터를 다루는 SQL 문장을 특히 DML(Data Manipulation Language)이라고 하는데, 다음과 같은 종류가 있다.
Select ; 검색조건에 맞는 데이터를 선택
Insert ; 새로운 데이터를 삽입
Update ; 기존의 데이터를 수정
Delete ; 기존의 데이터를 삭제
예를 들면, SELECT ALL WHERE age > 24 AND sex = "F"라는 질의(query) 문장 은 "나이가 25살 이상인 모든 여자(성별에서 여자를 "F"로 했다고 가정)를 찾아라"는 검색 요청이 된다.
정보 검색시스템은 방대한 자료들에 대한 다양한 형태의 검색 방법을 제공하는 시스템이다.
최근들어, 웹 환경의 발달 등에 힘입어, 정보 검색시스템은 사용자가 직접 검색어를 입력하고, 이와 일치되는 자료들을 찾는 방식으로 서비스되고 있다. 이러한 형태의 검색시스템에서 일반적인 자료와 패턴 매칭을 위한 자료 검색 기법은 많은 연구가 되어 왔으며, 효과적인 검색 기법이 제안되어 왔다.
그런데, 종래에는 DBMS내에서 부분검색을 지원하기 위해서는 배치작업에 의해 데이터를 분석하고, 분석된 자료를 프로그램내의 기능을 이용하여 메모리에 올려놓고 처리하는 기술이 대부분이었다.
그러나, DBMS를 이용한 테이블에서 특정 컬럼의 부분검색을 지원하기 위해서는 특별한 검색 기법이 필요하다. 즉, SQL에 의한 부분정보 검색을 지원하기 위해서는 DBMS의 엔진 레벨로 사용자가 구현한 방법을 이차 인덱싱 방법(Second Indexing Method)을 구현해야 한다.
이처럼, 종래에는 대용량의 데이터를 검색할 때 대부분 DBMS가 제공하는 순방향 매칭(Forward Matching)에 의한 검색 방법만을 제공하고, 부분검색을 수행하기 위해서는 데이터베이스에서 정보를 따로 구축하여 저장한 다음 일반적인 프로그램으로 검색하는 방법을 지원하지만, 이 방법은 시스템 자원이나, 메모리 사용량 등 속도에서 현저한 저하를 가져오고 있으며, 무엇보다도 온라인 트랜잭션 처리를 하는데 있어서 문제를 가지고 있다. 이를 도 1을 통해 보다 상세히 설명한다.
도 1 은 일반적인 사용자 입력 검색어 기반의 검색시스템의 구성도로서, 도면에서 "11"은 검색 인터페이스부, "12"는 질의어 분석부, "13"은 메모리 정렬부, "14"는 검색어 인터페이스 검색부, "15"는 검색어 데이터베이스를 각각 나타낸다.
도 1에 도시된 바와 같이, 일반적인 사용자 입력 검색어 기반의 검색시스템은, 검색 인터페이스부(11)를 통해 입력된 사용자 입력 검색어를 이용하여 질의어 분석부(12)에서 질의어를 분석하고, 검색어 데이터베이스 검색부(14)에서 분석된 질의어로 검색어 데이터베이스(15)를 검색하여 일치하는 자료를 검색한 후, 시스템의 메모리에 올려놓고 메모리 정렬부(13)에서 정렬한 다음 이 결과를 검색 인터페이스(11)를 통해 사용자에게 반환한다.
그러나, 일반적인 사용자 입력 검색어 기반의 검색시스템은, 사용자가 입력한 질의어로 검색한 결과가 검색어 데이터베이스(15)에 다수 존재하면, 시스템의 부하 및 정렬에 많은 시간과 시스템 자원을 사용하게 되는 문제점을 가지고 있다. 또한, 검색어 데이터베이스(15)를 갱신할 경우에, 갱신된 결과가 즉시 반영되지 않기 때문에 일정기간이 지난 경우에는 다시 정렬 테이블을 구축해야 하기 때문에 불편하고 데이터의 일관성을 유지할 수 없는 문제점이 있었다.
상기한 바와 같은 문제점을 해결하기 위하여 안출된 본 발명은, 전화번호 검색시스템, 웹 검색시스템, 도서관, 자료실, 쇼핑몰시스템 등과 같은 검색시스템에 서 데이터베이스관리시스템(DBMS)내에 저장된 정보의 검색시에, 구조적 질의언어(SQL)를 통해 부분검색을 수행함으로써, 온라인 트랜잭션하에서 완벽하게 특정 데이터의 부분검색을 지원하기 위한 부분검색 장치 및 그 방법과, 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
상기 목적을 달성하기 위한 본 발명은, 정보 검색시스템에서 특정 데이터를 부분검색하는 장치에 있어서, 정렬규칙에 따라 인덱스 정보가 정렬된 인덱스 테이블을 관리하기 위한 관리수단; 질의어를 입력받아, 상기 질의어에 대한 정렬된 검색결과를 사용자에게 알리기 위한 사용자 인터페이싱 수단; 및 상기 질의어를 코드로 변환한 후 질의어 코드를 분리법칙에 의해 음절 단위로 분리하고, 분리된 음절 단위의 코드를 질의어로 하여 사용자 정의 함수(UDF)에 의해 구조적 질의언어(SQL)로 상기 인덱스 테이블을 검색하여 상기 정렬된 검색결과를 상기 사용자 인터페이싱 수단으로 전달하는 검색수단을 포함하여 이루어진 것을 특징으로 한다.
한편, 본 발명은, 정보 검색시스템에서 특정 데이터를 부분검색하는 방법에 있어서, 정렬규칙에 따라 인덱스 정보가 정렬된 인덱스 테이블을 구축하는 단계; 입력 질의어를 코드로 변환하는 단계; 상기 변환된 질의어 코드를 소정의 음절 단위로 분리하는 단계; 상기 음절 단위로 분리된 코드를 질의어로 하여 사용자 정의 함수(UDF)에 의해 구조적 질의언어(SQL)로 상기 인덱스 테이블을 검색하여 유일키를 추출하는 단계; 및 상기 유일키를 이용하여 원하는 정보를 검색하는 단계를 포함하여 이루어진 것을 특징으로 한다.
다른 한편, 본 발명은, 부분검색을 위한 인덱스 테이블 구축 방법에 있어서, 데이터를 로딩하여 구조적 질의언어(SQL) 레벨로 인덱스를 생성하는 단계; 인덱스하려는 컬럼을 코드로 변환하고, 변환된 코드를 외부 사전과 역화일 기법에 의해 소정의 음절 단위로 분리하는 단계; 및 상기 컬럼을 정렬(Sorting)하기 위하여, 원래의 인덱스 컬럼정보를 가지고 복합키로 상기 소정의 개수로 분리된 음절 단위의 코드와 함께 상기 인덱스 테이블에 저장하는 단계를 포함하여 이루어진 것을 특징으로 한다.
또 다른 한편, 본 발명은, 프로세서를 구비한 부분검색 시스템에, 정렬규칙에 따라 인덱스 정보가 정렬된 인덱스 테이블을 구축하는 기능; 입력 질의어를 코드로 변환하는 기능; 상기 변환된 질의어 코드를 소정의 음절 단위로 분리하는 기능; 상기 음절 단위로 분리된 코드를 질의어로 하여 사용자 정의 함수(UDF)에 의해 구조적 질의언어(SQL)로 상기 인덱스 테이블을 검색하여 유일키를 추출하는 기능; 및 상기 유일키를 이용하여 원하는 정보를 검색하는 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
본 발명은 DBMS를 이용하여 부분검색을 수행할 때 효과적으로 할 수 없었던 검색방법, 갱신방법을 가능하게 한다. 즉, DBMS내에 저장된 정보를 검색하는데 있어서 DBMS가 제공해 주지 못하는 부분검색을 SQL기반으로 검색함으로써, 기존의 방 법보다 저장속도와 효율성을 향상시키며, 온라인 트랜잭션하에서 완벽하게 특정 데이터의 부분검색을 지원할 수 있다.
이를 위해, 본 발명은 사용자가 입력한 질의어를 분리법칙에 의해 음절을 분리한 다음 분리된 음절을 이용하여 SQL의 사용자 정의 함수(UDF : User Defined Function)에 의해 인덱스 테이블을 검색한 후에 실제 정보가 저장되어 있는 정보를 읽어오게 된다.
이로써, 본 발명은 기존의 방법보다 저장속도와 효율성, 온라인 트랜잭션 처리에 효과적이며, 일반적인 검색시스템, 예를 들면 한미르 전화번호 검색시스템, 웹 검색시스템, 자료실, 쇼핑몰시스템 등 검색을 필요로 하는 모든 시스템에 적용될 수 있다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 2 는 본 발명에 따른 부분검색 장치의 일실시예 구성도로서, 도면에서 "21"은 검색 인터페이스부, "22"는 데이터베이스 검색부, 그리고 "23"은 검색어 데이터베이스를 각각 나타낸다.
도 2에 도시된 바와 같이, 본 발명에 따른 부분검색 장치는, 정보 검색시스템에서 특정 데이터를 부분검색하는 장치에 있어서, 정렬규칙에 따라 인덱스 정보가 정렬된 인덱스 테이블을 관리하기 위한 검색어 데이터베이스(23)와, 사용자로부터 질의어를 입력받고, 질의어에 대한 정렬된 검색결과를 사용자에게 알리기 위한 검색 인터페이스부(21)와, 질의어를 코드로 변환한 후 질의어 코드를 분리법칙에 의해 음절 단위로 분리하고 분리된 음절 단위의 코드를 질의어로 하여 사용자 정의 함수(UDF)에 의해 구조적 질의언어(SQL)(즉, 함수는 특정한 작업을 수행하는 코드를 묶어서 프로그램에서 필요할 때마다 호출해서 사용하는 것으로, 본 발명에서는 SQL에 인덱스 테이블 검색을 위한 사용자 정의 함수를 만들어 사용함)로 인덱스 테이블을 검색하여 정렬된 검색결과를 검색 인터페이스부(21)로 전달하는 데이터베이스 검색부(22)를 포함한다.
본 발명에 따른 부분검색 장치는 DBMS내에 저장된 정보를 검색하는데 있어서 DBMS가 제공해 주지 못하는 부분검색을 SQL기반으로 검색할 수 있도록 한다.
이를 위해, 본 발명은 사용자가 입력한 질의어를 분리법칙에 의해 음절을 분리한 다음 분리된 음절을 이용하여 SQL의 사용자 정의 함수(UDF)에 의해 인덱스 테이블을 검색한 후에 실제 정보가 저장되어 있는 정보를 읽어오게 된다. 이때, 검색된 결과는 본 발명에서 제안한 인덱스 정보의 정렬규칙을 이용하여 이미 정렬이 되어 있는 정보이기 때문에 소팅할 필요가 없다.
따라서, 시스템의 메모리와 자원을 사용하지 않기 때문에 빠른 검색 속도와 부분검색을 지원할수 있다. 또한, SQL로의 검색과 갱신이 가능하기 때문에 온라인 트랜잭션에서 처리가 가능하다.
구체적으로 대용량 데이터로 부분검색을 지원하는 인덱싱 과정을 도 3을 통해 설명하면 다음과 같다.
도 3 은 본 발명에 따른 부분검색 방법을 위한 인덱스 테이블 구축 과정에 대한 일실시예 흐름도이다.
도 3에 도시된 바와 같이, 본 발명에 따른 인덱스 테이블 구축 과정은, 먼저 테이블에 데이터를 로딩한후 SQL 레벨로 인덱스를 생성한다(301). 이때, 인덱스는 DBMS의 특정 테이블에 B-트리(B-tree)로 생성한다. 여기서, B-tree는 대용량의 파 일을 효율적으로 검색하고 갱신하기 위해 제안된 트리형태의 데이터구조이다. 이는 노드가 2개 이하의 에지를 가질 수 있는 2진 트리의 일반화된 자료구조이다.
이후, 인덱스하려는 특정 컬럼을 코드로 변환하고(302), 변환된 코드를 외부사전과 역화일 기법(정보검색을 위한 자료구조 및 알고리즘)에 의해 특정 음절씩 분리한다(즉, 음절 단위의 코드로 분리함)(303). 이때, 외부사전은 명사사전, 유사어, 관련어 사전일 수 있다.
공지의 기술을 바탕으로, 역화일(Inverted file) 기법에 대해 살펴보면 다음과 같다. 색인어를 추출할 때 해당 색인어가 어느 문서의 어느 곳에 있었는가 하는 위치 정보도 함께 추출한다. 이러한 정보는 나중에 사용자의 질의에 따라 해당 문서를 검색할 때 사용되는데 색인어를 키워드로 하고 해당 색인어에 대한 위치 정보를 쉽게 제공할 수 있도록 만들어진 화일을 역화일(Inverted file)이라고 한다. 정보 검색 모델에 따라 역화일 구조에 다소 차이는 있으나 대개 문서 번호, 위치 정보, 빈도수, 중요도 등의 정보가 저장된다[William B. Frakes and Ricardo Baeza-Yates, 1992].
다음으로, 특정 컬럼의 정렬(Sorting)을 위해서 원래의 인덱스 컬럼정보를 가지고 복합키로 n개로 분리된 음절 단위의 코드와 함께 인덱스 테이블에 저장한다(304).
이러한 과정(302 내지 304)은 테이블의 끝에 도달할 때까지 반복 수행된다.
이제, 상기 도 3에서 구축된 인덱스 정보를 이용하여 부분검색하는 방법에 대해서 살펴보기로 한다.
도 4 는 본 발명에 따른 부분검색 방법에 대한 일실시예 흐름도이다.
도 4에 도시된 바와 같이, 본 발명에 따른 부분검색 방법은, 먼저 사용자의 질의어를 코드로 변환한다(401).
이후, 변환된 질의어 코드를 사전 및 역화일 기법에 의해 음절 단위의 코드로 분리한다(402). 이후에, 이 음절 단위로 분리된 코드를 질의어로 하여 사용자 정의 함수(UDF)에 의해 SQL로 인덱스 테이블을 검색하여(즉, SQL의 사용자 정의 함수에 의해 인덱스 테이블을 검색함) 유일키를 얻는다(403). 이때, 얻어진 유일키는 이미 구축할 때 소팅된 형태로 저장되어 있기 때문에, 이 유일키를 이용하여 원하는 정보를 읽는다(404).
마지막으로, 검색된 결과를 사용자에게 전송한다(405).
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.
상기한 바와 같은 본 발명은, DBMS를 이용하여 부분검색을 수행할 때 효과적으로 할수 없었던 검색방법, 갱신방법을 가능하게 하여 기존의 방법에 비해 저장속도와 효율성, 온라인 트랜잭션 처리에 매우 우수하고, DB 서버와 전화번호 검색시스템의 부하를 줄일 수 있으며, DBMS를 이용하는 한미르 전화번호 검색시스템, 웹검색시스템, 자료실, 쇼핑몰시스템 등과 같은 검색을 필요로 하는 모든 정보 검색시스템에 활용할 수 있는 효과가 있다.

Claims (8)

  1. 정보 검색시스템에서 특정 데이터를 부분검색하는 장치에 있어서,
    정렬규칙에 따라 인덱스 정보가 정렬된 인덱스 테이블을 관리하기 위한 관리수단;
    질의어를 입력받아, 상기 질의어에 대한 정렬된 검색결과를 사용자에게 알리기 위한 사용자 인터페이싱 수단; 및
    상기 질의어를 코드로 변환한 후 질의어 코드를 분리법칙에 의해 음절 단위로 분리하고, 분리된 음절 단위의 코드를 질의어로 하여 사용자 정의 함수(UDF)에 의해 구조적 질의언어(SQL)로 상기 인덱스 테이블을 검색하여 상기 정렬된 검색결과를 상기 사용자 인터페이싱 수단으로 전달하는 검색수단
    을 포함하는 정보 검색을 위한 부분검색 장치.
  2. 제 1 항에 있어서,
    상기 관리수단에서 관리되는 상기 인덱스 테이블에는,
    데이터를 로딩하여 구조적 질의언어(SQL) 레벨로 인덱스를 생성한 후,
    인덱스하려는 컬럼을 코드로 변환하고, 변환된 코드를 외부 사전과 역화일 기법에 의해 소정의 음절 단위로 분리한 후,
    상기 컬럼을 정렬(Sorting)하기 위하여, 원래의 인덱스 컬럼정보를 가지고 복합키로 상기 소정의 개수로 분리된 음절 단위의 코드와 함께 저장되는 것을 특징으로 하는 정보 검색을 위한 부분검색 장치.
  3. 제 2 항에 있어서,
    상기 외부 사전은,
    명사사전, 유사어 사전, 관련어 사전을 포함하는 것을 특징으로 하는 정보 검색을 위한 부분검색 장치.
  4. 정보 검색시스템에서 특정 데이터를 부분검색하는 방법에 있어서,
    정렬규칙에 따라 인덱스 정보가 정렬된 인덱스 테이블을 구축하는 단계;
    입력 질의어를 코드로 변환하는 단계;
    상기 변환된 질의어 코드를 소정의 음절 단위로 분리하는 단계;
    상기 음절 단위로 분리된 코드를 질의어로 하여 사용자 정의 함수(UDF)에 의해 구조적 질의언어(SQL)로 상기 인덱스 테이블을 검색하여 유일키를 추출하는 단계; 및
    상기 유일키를 이용하여 원하는 정보를 검색하는 단계
    를 포함하는 정보 검색을 위한 부분검색 방법.
  5. 제 4 항에 있어서,
    상기 인덱스 테이블은, 정렬규칙에 따라 인덱스 정보가 정렬되어 있으며,
    상기 인덱스 테이블을 구축하는 과정은, 데이터를 로딩하여 구조적 질의언어(SQL) 레벨로 인덱스를 생성하고; 인덱스하려는 컬럼을 코드로 변환하고, 변환된 코드를 외부 사전과 역화일 기법에 의해 소정의 음절 단위로 분리한 후; 상기 컬럼을 정렬(Sorting)하기 위하여, 원래의 인덱스 컬럼정보를 가지고 복합키로 상기 소정의 개수로 분리된 음절과 함께 상기 인덱스 테이블에 저장하는 하는 것을 특징으로 하는 정보 검색을 위한 부분검색 방법.
  6. 제 5 항에 있어서,
    상기 외부사전은,
    실질적으로, 명사사전, 유사어 사전, 관련어 사전을 포함하는 것을 특징으로 하는 정보 검색을 위한 부분검색 방법.
  7. 부분검색을 위한 인덱스 테이블 구축 방법에 있어서,
    데이터를 로딩하여 구조적 질의언어(SQL) 레벨로 인덱스를 생성하는 단계;
    인덱스하려는 컬럼을 코드로 변환하고, 변환된 코드를 외부 사전과 역화일 기법에 의해 소정의 음절 단위로 분리하는 단계; 및
    상기 컬럼을 정렬(Sorting)하기 위하여, 원래의 인덱스 컬럼정보를 가지고 복합키로 상기 소정의 개수로 분리된 음절 단위의 코드와 함께 상기 인덱스 테이블에 저장하는 단계
    를 포함하는 인덱스 테이블 구축 방법.
  8. 프로세서를 구비한 부분검색 시스템에,
    정렬규칙에 따라 인덱스 정보가 정렬된 인덱스 테이블을 구축하는 기능;
    입력 질의어를 코드로 변환하는 기능;
    상기 변환된 질의어 코드를 소정의 음절 단위로 분리하는 기능;
    상기 음절 단위로 분리된 코드를 질의어로 하여 사용자 정의 함수(UDF)에 의해 구조적 질의언어(SQL)로 상기 인덱스 테이블을 검색하여 유일키를 추출하는 기능; 및
    상기 유일키를 이용하여 원하는 정보를 검색하는 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1019990057609A 1999-12-14 1999-12-14 정보 검색시스템에서의 정보 검색을 위한 부분검색 장치 및 그 방법과 이의 인덱스 테이블 구축 방법 KR100741283B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990057609A KR100741283B1 (ko) 1999-12-14 1999-12-14 정보 검색시스템에서의 정보 검색을 위한 부분검색 장치 및 그 방법과 이의 인덱스 테이블 구축 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990057609A KR100741283B1 (ko) 1999-12-14 1999-12-14 정보 검색시스템에서의 정보 검색을 위한 부분검색 장치 및 그 방법과 이의 인덱스 테이블 구축 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020070030922A Division KR20070048677A (ko) 2007-03-29 2007-03-29 정보 검색시스템에서의 정보 검색을 위한 부분검색 방법

Publications (2)

Publication Number Publication Date
KR20010056171A KR20010056171A (ko) 2001-07-04
KR100741283B1 true KR100741283B1 (ko) 2007-07-19

Family

ID=19625780

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990057609A KR100741283B1 (ko) 1999-12-14 1999-12-14 정보 검색시스템에서의 정보 검색을 위한 부분검색 장치 및 그 방법과 이의 인덱스 테이블 구축 방법

Country Status (1)

Country Link
KR (1) KR100741283B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030035248A (ko) * 2001-10-30 2003-05-09 주식회사 아이버스 트리구조로 등록된 어휘를 이용한 검색 방법 및 이를구현할 수 있는 프로그램이 수록된 기록매체
KR100737359B1 (ko) * 2006-10-04 2007-07-10 (주)이글로벌시스템 암호화된 컬럼의 인덱스 구축방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332767A (ja) * 1993-05-24 1994-12-02 Nec Corp ネットワークデータベースアクセス方法
KR0133406B1 (ko) * 1994-12-23 1998-05-15 양승택 한글정보 검색에 관한 검색문 동적변환방법(Dynamic Coversion Method of Retrieval Statement Concering Korean Language Information Retrieval)
KR19980037145A (ko) * 1996-11-20 1998-08-05 김광호 컴퓨터 시스템에서의 데이터 베이스 검색방법
JPH1153401A (ja) * 1997-08-01 1999-02-26 Nec Corp データベースの索引自動生成システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332767A (ja) * 1993-05-24 1994-12-02 Nec Corp ネットワークデータベースアクセス方法
KR0133406B1 (ko) * 1994-12-23 1998-05-15 양승택 한글정보 검색에 관한 검색문 동적변환방법(Dynamic Coversion Method of Retrieval Statement Concering Korean Language Information Retrieval)
KR19980037145A (ko) * 1996-11-20 1998-08-05 김광호 컴퓨터 시스템에서의 데이터 베이스 검색방법
JPH1153401A (ja) * 1997-08-01 1999-02-26 Nec Corp データベースの索引自動生成システム

Also Published As

Publication number Publication date
KR20010056171A (ko) 2001-07-04

Similar Documents

Publication Publication Date Title
US6665661B1 (en) System and method for use in text analysis of documents and records
Faloutsos Access methods for text
CN1552032B (zh) 数据库
US6523030B1 (en) Sort system for merging database entries
JPH02271468A (ja) データ処理方法
JP2004110808A (ja) ネットワークを介してデータを検索及び提示する方法及びマシン可読記憶装置
WO2005083597A1 (en) Intelligent search and retrieval system and method
Rocchio et al. Information search optimization and interactive retrieval techniques
CN112231321B (zh) 一种Oracle二级索引及索引实时同步方法
Willett A fast procedure for the calculation of similarity coefficients in automatic classification
JP3178421B2 (ja) テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体
KR100741283B1 (ko) 정보 검색시스템에서의 정보 검색을 위한 부분검색 장치 및 그 방법과 이의 인덱스 테이블 구축 방법
US7039646B2 (en) Method and system for compressing varying-length columns during index high key generation
JPH09198396A (ja) 文書検索装置
KR100659370B1 (ko) 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법
JPS63198124A (ja) 文例検索装置
KR20000041817A (ko) 음절 단위 패턴으로 구성한 패턴 테이블을 이용한 문자열 부분검색 시스템 및 그 방법
JPH04340163A (ja) キーワード検索方式
JP2000231560A (ja) 文書自動分類方式
KR20070048677A (ko) 정보 검색시스템에서의 정보 검색을 위한 부분검색 방법
JP3578045B2 (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
KR100434718B1 (ko) 문서 색인 시스템 및 그 방법
JP2001052024A (ja) 類似特徴量の検索方法及び装置及び類似特徴量の検索プログラムを格納した記憶媒体
CN116628129B (zh) 一种汽车配件搜索方法及系统
Ng et al. A physical storage model for efficient statistical query processing

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
J201 Request for trial against refusal decision
A107 Divisional application of patent
AMND Amendment
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100708

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee