KR20010076315A - 데이터 압축방법, 데이터 검색방법, 데이터 검색장치,기록방법 및 데이터 패킷신호 - Google Patents

데이터 압축방법, 데이터 검색방법, 데이터 검색장치,기록방법 및 데이터 패킷신호 Download PDF

Info

Publication number
KR20010076315A
KR20010076315A KR1020010002680A KR20010002680A KR20010076315A KR 20010076315 A KR20010076315 A KR 20010076315A KR 1020010002680 A KR1020010002680 A KR 1020010002680A KR 20010002680 A KR20010002680 A KR 20010002680A KR 20010076315 A KR20010076315 A KR 20010076315A
Authority
KR
South Korea
Prior art keywords
data
key
search
compressed
characters
Prior art date
Application number
KR1020010002680A
Other languages
English (en)
Inventor
마에노타마키
아사노아키라
Original Assignee
이데이 노부유끼
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이데이 노부유끼, 소니 가부시끼 가이샤 filed Critical 이데이 노부유끼
Publication of KR20010076315A publication Critical patent/KR20010076315A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24526Internal representations for queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

주데이터와 주데이터를 효율적으로 검색하기 위해 압축된 검색데이터를 가지는 데이터 패킷을 생성하는 방법, 복수의 패킷들로 주어진 검색키에 의해 주데이터를 효율적으로 검색하기 위한 검색방법 및 검색장치, 이러한 복수의 데이터패킷이 기록된 기록매체 및 주데이터와 상기 주데이터를 효율적으로 검색하기 위해 압축된 검색데이터를 가지는 데이터 패킷신호.

Description

데이터 압축방법, 데이터 검색방법, 데이터 검색장치, 기록방법 및 데이터 패킷신호{Data compression method, data retrieval method, data retrieval apparatus, recording method and data packet signal}
본 발명은 일반적으로 주데이터와 주데이터를 효율적으로 검색하기 위해 압축된 검색데이터를 포함하는 데이터 패킷을 생성하는 방법에 관한 것이다. 게다가, 본 발명은 입력된 선택키에 의거해 주데이터 및 주데이터의 효율적인 검색을 위해 압축된 검색데이터를 포함하는 복수의 데이터 패킷으로부터 주데이터를 효율적으로 검색하는 데이터 검색방법에 관한 것이다. 또한, 본 발명은 입력된 선택키에 의거해 주데이터 및 주데이터의 효율적인 검색을 위해 압축된 검색데이터를 포함하는 복수의 데이터 패킷으로부터 주데이터를 효율적으로 검색하는 데이터 검색장치에 관한 것이다. 또한, 주데이터 및 주데이터의 효율적인 검색을 위해 압축된 검색데이터를 포함하는 복수의 데이터 패킷을 기록하는 기록매체에 관한 것이다. 또한, 본 발명은 주데이터 및 주데이터의 효율적인 검색을 위해서 압축된 검색데이터를 포함하는 데이터 패키신호에 관한 것이다.
소위 데이터베이스 검색장치 및 소위 전자사전장치는 검색될 데이터의 문자열의 전부 또는 일부가 입력되고 검색된 데이터 또는 문자가 표시되는데 널리 사용되고 있다. 동일한 기능이 개인용 컴퓨터 상에서 동작하는 전자사전 프로그램 및 데이터베이스 프로그램에 의해서도 실행된다.
검색을 위한 데이터가 CD-ROM(Compact Disc-Read Only Memory) 또는 반도체메모리 등의 정보기록매체에 기록되는 종래의 데이터베이스 검색장치에서 데이터 검색처리를 도 1을 참조해서 이후에 설명한다.
검색키로서 검색되는 데이터에 대응하는 입력된 문자열을 이용하여, 데이터 검색장치는 정보저장매체에 저장된 인덱스(11)에 의거해 데이터에 대해서 미리 정보저장매체에 기록된 본문 데이터베이스(12)를 검색한다. 이후에 데이터 검색장치는 검색데이터를 표시한다.
인덱스(index)(11)는 소위 전방 일치검색(forward matching search)용 데이터이며 제 1인덱스블록층에 속하는 하나의 인덱스블록(21), 제 2인덱스블록층에 속하는 n인덱스블록(22-1 ∼ 22-n) 및 제 3인덱스블록층에 속하는 m인덱스블록(23-1 ∼ 23-m)으로 구성되어 있다.
인덱스(11)는 예를 들면 전방 일치검색 및 후방 일치검색(backward matching search) 등의 검색방법에 따라서 구성되며, 각각의 인덱스는 정보저장매체에 미리 저장되어 있다. 좀 더 구체적으로, 데이터베이스 검색장치가 예를 들면 전방 일치검색과 후방 일치검색을 실행하면, 정보저장매체는 전방 일치검색 인덱스와 후방 일치검색 인덱스를 저장한다.
인덱스블록(21), 인덱스블록(22-1 ∼ 22-n) 및 인덱스블록(23-1 ∼ 23-m) 각각은 검색키와 비교되는 "AP" 및 "BO" 등의 비교키 및 비교키에 대응하는 어드레스 또는 데이터 어드레스를 갖는다. 비교키는 알파벳의 오름차순으로 배열된다.
인덱스블록(21)의 각 어드레스는 제 2인덱스 블록층에 속하는 인덱스블록(22-1 ∼ 22-n) 중 어느 하나의 선두 저장위치를 나타낸다. 각각의인덱스블록(22-1 ∼ 22-n)의 각 어드레스는 제 3인덱스 블록층에 속하는 인덱스블록(23-1 ∼ 23-n) 중 어느 하나의 선두 저장위치를 나타낸다. 각각의 인덱스블록(23-1 ∼ 23-m)의 각 본문 어드레스는 본문 데이터베이스(12)에 저장된 소정 데이터의 저장위치를 나타낸다.
검색될 데이터에 대응하는 문자열이 입력되면, 데이터 검색장치는 입력된 문자열을 검색키로 이용하여 검색키의 선두 2개의 문자와 인덱스블록(21)의 비교키를 비교한다. 이 비교에 의거해, 데이터 검색장치는 이들 2개의 문자가 인덱스블록(21)의 비교키 전후에 알파벳순으로 위치되는지의 여부 또는 이 비교키와 동일한지의 여부를 판정한다.
검색키의 선두 2개의 문자가 인덱스블록(21)의 비교키 뒤에 알파벳순으로 배열된 것으로 판정되면, 데이터 검색장치는 검색키의 선두 2개의 문자와 인덱스블록(21)의 다음 비교키와 비교한다.
검색키의 선두 2개의 문자가 인덱스블록(21)의 비교키 앞 또는 이 비교키와 동일한 위치에 알파벳순으로 배열된 것으로 판정되면, 데이터 검색장치는 인덱스블록(21)의 이 비교키에 대응하는 어드레스에 의거해 2차 인덱스블록층에 속하는 인덱스블록(22-1 ∼ 22-n) 중 대응하는 하나를 지정한다.
이후에 데이터베이스 검색장치는 검색키의 선두 2개의 문자와 지정된 인덱스블록(22-1 ∼ 22-n)의 어느 하나의 비교키와 비교하여 인덱스블록(21)과 동일한 처리를 실행한다. 이 비교에 의거해, 데이터베이스 검색장치는 검색키의 선두 2개의 문자가 지정된 인덱스블록(22-1 ∼ 22-n) 중 어느 하나의 비교키 전후에 알파벳순으로 위치되는지의 여부 또는 이 비교키와 동일한지의 여부를 판정한다.
검색키의 선두 2개의 문자가 지정된 인덱스블록(22-1 ∼ 22-n) 중 어느 하나의 비교키 뒤에 알파벳순으로 배치된 것으로 판정되면, 데이터 검색장치는 검색키의 선두 2개의 문자와 지정된 인덱스블록(22-1 ∼ 22-n) 중 어느 하나의 다음 비교키와 비교한다.
검색키의 선두 2개의 문자가 지정된 인덱스블록(22-1 ∼ 22-n) 중 어느 하나의 다음 비교키 앞 또는 이 비교키와 동일하게 알파벳순으로 배열된 것으로 판정되면, 데이터베이스 검색장치는 지정된 인덱스블록(22-1 ∼ 22-n)의 이 비교키에 대응하는 어드레스에 의거해 제 3차 인덱스블록층에 속하는 인덱스블록(23-1 ∼ 23-m) 중 대응하는 하나를 지정한다.
이후에, 데이터베이스 검색장치는 검색키의 모든 문자와 지정된 인덱스블록(23-1 ∼ 23-m) 중 어느 하나의 비교키와 비교한다. 이 비교에 의거해, 데이터베이스 검색장치는 검색키가 지정된 인덱스블록(23-1 ∼ 23-m)중 어느 하나의 비교키 뒤에 알파벳순으로 위치되는지, 비교키와 동일한지 또는 비교키에 포함되는지의 여부를 판정한다.
검색키가 지정된 인덱스블록(23-1 ∼ 23-m)중 어느 하나의 비교키 뒤에 알파벳순으로 위치되는 것으로 판정되면, 데이터베이스 검색장치는 검색키와 지정된 인덱스블록(23-1 ∼ 23-m) 중 어느 하나의 다음 비교키와 비교한다.
검색키가 비교키와 동일한 것으로 판정되거나 비교키에 포함되면, 데이터베이스 검색장치는 지정된 인덱스블록(23-1 ∼ 23-m)중 어느 하나의 비교키에 대응하는 데이터의 어드레스에 의거해 본문 데이터베이스(12)에 저장된 대응하는 본문을 지정한다.
구체적으로, 문자열 "abroad"가 검색될 데이터로서 입력되면, 검색키는 "ABROAD"가 되고 선두 2개의 문자 "AB"는 도 1에 나타낸 바와 같이 위에서부터 아래로 순서대로 인덱스블록(21)의 비교키와 비교된다. 검색키의 선두 2개의 문자 "AB"가 인덱스블록(21)의 선두 비교키 "AP" 앞에 알파벳순으로 배열되기 때문에, 데이터베이스 검색장치는, 비교키 "AP"에 대응하는 어드레스에 의거해 제 2인덱스블록층에 속하는 인덱스블록(22-1)을 지정한다.
검색키의 선두 2개의 문자 "AB"가 인덱스블록(22-1)의 선두 비교키 "AC" 앞에 알파벳순으로 위치되기 때문에, 데이터베이스 검색장치는, 비교키 "AC"에 대응하는 어드레스에 의거해 제 3인덱스블록층에 속하는 인덱스블록(23-1)을 지정한다.
데이터베이스 검색장치는 검색키 "ABROAD"에 대응하는 인덱스블록(23-1)의 선두에서 제 3비교키 "ABROAD"를 검출하고, 이 비교키 "ABROAD"에 대응하는 데이터의 어드레스에 의거해 본문 데이터베이스로부터 데이터를 독출하여 표시한다.
다른 정보저장매체에서는, 인덱스가 사용되지 않는다. 즉, 키워드는 주데이터에 따라서 미리 본문 데이터베이스(12)에 저장된다. 데이터베이스 검색장치는 저장된 키워드에 의거해 주데이터를 검색한다.
도 2를 참조해서, 키워드가 주데이터에 따라서 미리 저장된 종래의 본문 데이터베이스(31)의 일예를 나타낸다. 본문 데이터베이스(31)는 알파벳의 오름차순으로 주데이터를 저장한다.
본문 데이터베이스(31)의 "TOP"은 주데이터에 대한 헤더(header) 앞에 위치된 식별자를 나타낸다. 본문 데이터베이스(31)의 "KW"는 주데이터에 대한 키워드 앞에 위치된 식별자를 나타내고 "00"의 값을 가지는 식별자는 키워드 뒤에 위치된다.
주데이터는 "00"의 값을 가지는 식별자 다음에 위치된다.
도 2를 참조해서, 데이터에 있어서 제 1식별자 "TOP"과 제 2식별자 "KW" 사이에 위치한 " TOP ap·ple KW appLE 00 A kind of fruits", "ap·ple"는 헤더를 나타낸다. 제 2식별자 "KW"와 제 3식별자 "00" 사이에 위치된 "APPLE"은 헤더 "ap·ple"에 대한 키워드를 나타낸다. 제 3식별자 "00" 뒤에 위치한 " A kind of fruits"는 헤더 "ap·ple" 및 키워드 "APPLE"에 대한 주데이터를 나타낸다.
동일하게, 데이터에 있어서 본문 데이터베이스(31)의 "TOP Ap·ple·seed KW APPLESEED OO Johnny(John Chapman)", 식별자 "TOP" 및 식별자 "KW" 사이에 위치한 "Ap·ple·seed"는 헤더를 나타낸다. 식별자 "KW" 및 식별자 "00" 사이에 위치된 "APPLESEED"는 "Ap·ple·seed"에 대한 키워드를 나타낸다. 식별자 "00" 뒤에 위치한 "Johnny(John Chapman)"은 헤더 "Ap·ple·seed"에 대한 주데이터 및 키워드 "APPLESEED"를 나타낸다.
도 3에 나타낸 플로차트를 참조해서, 본문 데이터베이스(31)를 위해 종래의 데이터베이스 검색장치로 실행되는 검색키와 선택된 키워드 사이의 비교처리를 이후에 설명한다. 스텝(S11)에 있어서, 데이터베이스 검색장치는 검색키의 선두 문자를 독출한다.
스텝(S12)에 있어서, 데이터베이스 검색장치는 선택된 키워드의 선두 문자를 독출한다.
스텝(S13)에 있어서, 데이터베이스 검색장치는 검색키의 선두 문자와 선택된 키워드의 선두 문자가 일치하는지의 여부를 판정한다. 일치하는 것으로 판정되면, 스텝(S14)에서, 데이터베이스 검색장치는 검색키의 선두 문자와 선택된 키워드의 선두 문자가 이들의 마지막 문자인지 아닌지 여부를 판정한다.
스텝(S14)에 있어서, 판정이 예이면, 스텝(S15)에서 데이터베이스 검색장치는 검색키가 선택된 키워드와 일치하는 것을 나타내는 메시지를 출력하고 처리를 종료한다.
스텝(S13)에 있어서, 판정이 아니오 이면, 스텝(S16)에서 데이터베이스 검색장치는 검색키가 선택된 키워드와 일치하지 않는 것을 나타내는 메시지를 출력하고 처리를 종료한다.
스텝(S14)에 있어서, 판정이 예이면, 스텝(S17)에서 데이터베이스 검색장치가 검색키의 다음 문자를 독출 하도록 비교될 문자가 남아 있는 것을 의미한다. 스텝(S18)에 있어서, 데이터베이스 검색장치는 키워드의 다음 문자를 독출한다. 이후에, 스텝(S13)으로 복귀하고, 데이터베이스 검색장치는 상기 비교처리를 반복한다.
그러나 인덱스를 이용하는 데이터 검색은 소정의 데이터량이 주데이터와 함께 정보저장매체에 저장되어야 하는 문제를 포함하기 때문에, 큰 저장영역을 가지는 정보저장매체가 필요하게 된다. 예를 들면, 60,000단어 내지 70,000단어의 본문을 포함하는 주데이터는 30megabytes가 되는 반면에 인덱스는 8megabytes가 된다.
인덱스를 이용하는 것 이외에, 주데이터에 배치된 키워드를 이용하는 주데이터 검색은 다수의 문자들간에 비교가 필요하고 검색처리에 많은 시간이 걸린다.
본 발명의 목적은 비교적 적은 저장영역에 주데이터를 저장하여 종래의 데이터 검색보다 현저하게 빠른 데이터 검색을 이루기 위한 데이터 압축방법, 데이터 검색방법, 데이터 검색장치, 기록매체 및 데이터 패킷신호를 제공하는 것이다.
본 발명을 실행하는데 있어서 그리고 그 일 양태에 따르면, 주데이터를 검색하기 위해 키데이터를 효율적으로 검색하고 기록매체에 기록될 상기 키데이터의 데이터량을 압축하기 위한 데이터 압축방법에 있어서,
제 1문자수로 구성된 제 1키데이터와 상기 제 1키데이터의 상기 제 1문자수보다 큰 제 2문자수로 구성된 제 2키데이터를 비교하는 단계와, 상기 제 1키데이터와 상기 제 2키데이터 사이의 비교결과에 의거해, 제 1키데이터와 제 2키데이터 사이에 일치하는 문자수를 검출하고, 상기 제 2키데이터로부터 상기 제 1키데이터와 일치하는 문자를 삭제하고, 상기 제 2키데이터로부터 상기 제 1키데이터와 일치하는 문자를 삭제함으로써 얻어진 상기 일치하는 문자 및 비일치하는 문자수를 가지는 데이터 패킷을 생성하는 단계와, 상기 데이터 패킷을 상기 기록매체에 기록하는 단계로 이루어진 것을 특징으로 하는 데이터 압축방법이 제공된다.
본 발명을 실행하는데 있어서 그리고 그 다른 양태에 따르면, 상기 주데이터로 구성된 데이터 패킷의 주데이터와 입력 검색키 및 상기 압축키데이터에 의거해, 상기 주데이터와 관련된 키데이터와 인접한 키데이터 사이의 복제문자수 및 상기 키데이터로부터 복제 문자를 제거함으로써 얻은 비일치 문자로 구성된 압축키 데이터를 검색하는 데이터 검색방법에 있어서, 상기 키데이터가 상기 비일치 문자와 동일한 상기 데이터 패킷을 검색하는 단계와, 검색단계에서 검색된 상기 데이터 패킷의 상기 압축키데이터의 비일치 문자와 상기 검색키 사이의 비일치 부분을 검출하는 단계와, 상기 비일치 부분이 상기 압축키데이터의 상기 비일치 문자와 상기 검색키 사이에서 검출되면, 상기 데이터 패킷에 인접한 데이터 패킷의 상기 압축키데이터의 비일치 문자와 상기 검출된 비일치 부분 사이의 비일치 부분을 검출하는 단계로 이루어진 것을 특징으로 하는 데이터 검색방법을 제공한다.
본 발명을 실행하는데 있어서 그리고 그 또 다른 양태에 따르면, 상기 주데이터로 구성된 데이터 패킷을 기록하는 기록매체로부터 주데이터 및 상기 주데이터와 관련된 키데이터와 인접한 키데이터 사이의 복제 문자와 입력 검색키 및 상기 압축키데이터에 의거해 상기 키데이터로부터 복제 문자를 제거함으로써 얻은 비일치 문자수로 구성된 압축키데이터를 검색하는 데이터 검색장치에 있어서, 상기 데이터 검색장치는, 상기 기록매체로부터 상기 데이터 패킷을 독출하는 기록매체 접근수단과, 상기 키데이터가 상기 비일치 문자와 동일한 상기 데이터 패킷을 검색하는 검색수단과, 소정의 데이터 패킷에서 상기 압축키데이터의 비일치 문자와 비교를 위한 입력 문자열 사이의 비일치 문자부분을 검출하는 비일치 검출수단과, 상기 키데이터가 상기 비일치 문자와 동일한 상기 데이터 패킷이 검색되도록 상기 검색수단을 제어하는 제어수단을 포함하고, 검색데이터 패킷과 상기 비일치 검출수단을 제어함으로써 상기 입력된 검색키 사이의 비일치 부분을 검출하고, 상기 비일치 부분이 검출되면, 검출된 비일치 부분과 상기 기록매체 접근수단을 제어함으로써 독출된 상기 검색수단에 의해 검색된 데이터 패킷에 인접한 데이터 패킷 사이의 비일치 부분을 상기 비일치 검출수단에 의해 검출하는 것을 특징으로 하는 데이터 검색장치를 제공한다.
본 발명을 실행하는데 있어서 그리고 그 또 다른 양태에 따르면, 상기 주데이터로 구성된 데이터 패킷을 기록하는 기록매체로부터 주데이터 및 상기 주데이터와 관련된 키데이터와 인접한 키데이터 사이의 복제 문자와 입력 검색키 및 상기 압축키데이터에 의거해 상기 키데이터로부터 복제 문자를 제거함으로써 얻은 비일치 문자수로 구성된 압축키데이터를 검색하는 데이터 검색장치에 있어서, 상기 데이터 검색장치는, 상기 기록매체로부터 상기 데이터 패킷을 독출하는 기록매체 접근수단과, 상기 검색키를 입력하는 조작수단과, 상기 검색된 주데이터를 표시하는 표시수단과, 상기 기록매체로부터 독출된 상기 데이터 패킷으로부터 상기 압축키데이터를 검색하는 압축키데이터 검색수단과, 상기 압축키데이터의 비일치 문자와 상기 검색키를 비교하는 제 1비교수단과, 상기 제 1비교수단에 의한 비교결과에 의거해 상기 검색키를 갖춘 상기 압축키데이터의 비일치 문자 사이의 비일치 문자수를 유지하는 유지수단과, 상기 유지수단에 유지된 문자수와 압축된 문자수를 나타내는 데이터와 비교하는 제 2비교수단과, 상기 조작수단으로부터 입력된 상기 검색키와 상기 압축키데이터 검색수단에 의해 검색된 압축키데이터의 비일치 문자수와 비교하도록 상기 제 1비교수단을 제어하고, 상기 제 1비교수단의 비교로 얻은 상기 검색키와 상기 압축키데이터 사이의 비일치 문자수를 상기 유지수단에 유지하고, 인접 데이터패킷의 상기 비일치 문자와 상기 비교수단에 의해 비일치로 판정된 상기 검색키의 문자열를 비교하고, 이와 같이 검색된 상기 주데이터를 상기 표시수단에 표시하는 제어수단을 포함하는 것을 특징으로 하는 데이터 검색장치를 제공한다.
본 발명을 실행하는데 있어서 그리고 그 또 다른 양태에 따르면, 주데이터 및 상기 주데이터를 검색하는 검색문자열을 가지는 데이터 패킷신호에 있어서, 주데이터 신호부와, 상기 주데이터를 검색하는 키데이터 및 다른 주데이터를 위한 키데이터 사이의 일치 문자부분을 압축한 후 남겨지는 비일치 신호부와, 압축데이터의 문자수를 나타내는 압축문자 카운트 신호부를 포함하여 이루어진 것을 특징으로 하는 데이터 패킷신호를 제공한다.
본 발명을 실행하는데 있어서 그리고 그 또 다른 양태에 따르면, 상기 주데이터의 내용을 나타내는 헤더워드부를 더 포함하는 것을 특징으로 하는 데이터 패킷신호를 제공한다.
본 발명의 이들 이외의 다른 목적은 첨부된 도면과 관련하여 기술을 참조해서 알 수 있다.
도 1은 종래의 데이터베이스 검색장치에 있어서 데이터처리를 설명하는 개략도이다.
도 2는 종래의 본문 데이터베이스의 일예를 나타내는 도면이다.
도 3은 종래의 검색키와 선택된 키워드간의 압축처리를 설명하는 플로차트이다.
도 4는 본 발명의 바람직한 실시예로서 실행된 데이터 검색장치의 구성을 설명하는 블록도이다.
도 5는 본문 데이터베이스(110)를 구성하는 패킷을 설명하는 도면이다.
도 6a는 본문 데이터베이스(110)의 필드(1)를 설명하는 도면이다.
도 6b는 본문 데이터베이스(110)의 필드(2)를 설명하는 도면이다.
도 7a는 본문 데이터베이스(110)의 헤더 "ap·ple"을 위한 패킷을 설명하는 도면이다.
도 7b는 본문 데이터베이스(110)의 헤더 "Apple"을 위한 패킷을 설명하는 도면이다.
도 7c는 본문 데이터베이스(110)의 헤더 "ap·ple·seed"를 위한 패킷을 설명하는 도면이다.
도 7d는 본문 데이터베이스(110)의 헤더 "applet"을 위한 패킷을 설명하는 도면이다.
도 8은 표시패널(57)에 표시되는 검색결과를 설명하는 도면이다.
도 9는 본문 데이터베이스(110)의 분할부를 설명하는 도면이다.
도 10은 압축키워드의 구성을 설명하는 도면이다.
도 11a 및 11b는 검색키와 비압축키워드 사이의 압축처리와 비교해서 검색키와 압축키워드 사이의 압축처리를 설명하는 도면이다.
도 12는 필드정보테이블을 설명하는 도면이다.
도 13은 본문 데이터베이스(110)의 검색처리를 설명하는 플로차트이다.
도 14는 검색키와 선택된 압축키워드 사이의 비교처리를 설명하는 도면이다.
도 15는 검색키의 선두로부터 k문자와 압축키워드의 선두로부터의 k문자 사이의 비교처리를 설명하는 플로차트이다.
도 16은 본문 데이터베이스(110)를 기술하기 위한 다이어그램이다.
* 도면의 주요부분에 대한 부호설명
51. CPU 52. ROM
53. RAM 54. 키조작블록
55. 사전ROM 56. 표시제어기
57. 표시패널 58. 인터페이스
59. 드라이브 64. 통신블록
본 발명을 첨부된 도면을 참조해서 더 상세히 설명한다.
도 4를 참조해서, CPU(Central Processing Unit)(51)는 예를 들면 MPU(Micro Processing Unit)로 구성되며, ROM(Read-Only Memory)(52)에 기억된 제어프로그램을 실행하여 키조작블록(54)으로부터 입력된 신호에 의거해 데이터베이스 검색장치 전체를 제어하는 동시에, 입력된 문자열에 대응하는 주데이터를 검색하는 처리를 실행한다.
예를 들어 마스크롬(mask ROM), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM) 또는 플래시메모리로 구성된 ROM(52)은 예를 들면 제어프로그램을 실해하기 위해 기본적으로 필요한 고정 파라미터 및 폰트 데이터(문자형태를 나타내는 데이터)를 저장한다.
예를 들어 DRAM(Dynamic RAM) 또는 SRAM(Static RAM)으로 구성된 RAM(Random Access Memory)(53)은 제어프로그램이 실행됨에 따라서 값이 변하는 데이터 예를 들면, 검색처리의 결과로서 일시적으로 저장된 일치 문자수(이후에 기술한다)를 저장한다. 키조작블록(54)은 소정의 조작키 및 스위치를 가지며 데이터베이스 검색장치의 사용자에 의한 조작에 따라서 생성된 신호를 CPU(51)에 출력한다.
데이터베이스로 사용되는 사전ROM(55)은 마스크 ROM, EPROM, EEROM, 플래시메모리 등의 저장매체 또는 하드디스크, 광자기디스크 등의 자기디스크 또는 광디스크로 구성되며, 본문데이터 등을 저장한다. 표시제어기(56)는 CPU(51)의 제어하에 예를 들면 검색결과를 나타내는 소정의 문자에 대응하는 폰트데이터를 ROM(52)으로부터 수신하고 그 수신된 문자를 표시패널(57)에 표시한다. LCD(Licquid Crystal Display) 등으로 구성된 표시패널(57)은 표시제어기(56)의 제어하에 소정의 문자 또는 화상을 표시한다.
드라이브(59)는 장착된 자기디스크(60), 광디스크(61) 또는광자기디스크(62)로부터 데이터(예를 들면 본문 데이터) 또는 프로그램(제어프로그램을 포함하여)을 독출하고 그 데이터 또는 프로그램을 인터페이스(58)를 통해서 CPU(51)에 공급한다. CPU(51)의 제어하에, 인터페이스(58)는 드라이브(59)에서 수신한 데이터 또는 프로그램을 CPU(51)에 공급하는 동시에, 인터페이스(58)에 장착된 반도체 메모리(63)로부터 제어프로그램을 포함하는 본문데이터 또는 프로그램 등의 데이터를 독출하고 이것을 CPU(51)에 공급한다.
라우터(router), 모뎀 또는 소정의 통신기구에 대응하는 통신회로로 구성된 통신블록(64)은 도시하지 않은 국부영역네트워크(local area network), 인터넷 및 디지털 위성방송 등의 유무선 통신매체를 통해서 소정의 데이터 또는 프로그램을 수신하고, 그 수신된 데이터 및 프로그램을 CPU(51)에 공급한다.
도 5를 참조해서, 데이터베이스로서 사전ROM(55)에 저장되는 주데이터에 대한 데이터 형식을 나타낸다. 도시된 바와 같이, 주데이터의 각 부분은 본문 데이터로 불리는 패킷에 패킷화 된다. 주데이터는 소정의 순서로 저장된다. 각 패킷은 헤더로부터 시작한다. 본 실시예에 있어서는, 길이가 고정된 헤더가 "1F41"로 할당된다. 헤더는 주데이터의 개요를 나타내는 헤더워드(header word)를 뒤따른다. 헤더워드는 길이가 변할 수 있으며 헤더워드 엔드코드(header word end code)로 종료한다. 본 실시예에서, 헤더워드 엔드코드는 "1F61"이다. 헤더워드 엔드코드는 일치카운트(match count)를 뒤따른다. 일치카운트는 이후에 기술되는 압축키워드의 압축문자수를 나타낸다. 일치카운트에 의거해, 키워드는 이후에 기술되는 바와 같이 압축복원 된다. 일치카운트는 압축키워드를뒤따른다. 압축키워드의 끝은 주데이터의 시작을 나타내는 주데이터 식별데이터 "00"에 의해 식별된다. 주데이터 식별데이터는 주데이터를 뒤따른다. 주데이터의 일부분을 위한 패킷은 주데이터의 마직막에 종료한다.
도 6a 및 도 6b는 도 5를 참조해서 기술되는 것 중 복수의 패킷들이 사전ROM(55)에 저장되는 상태를 나타낸다. 도 6a 및 6b는 사전ROM(55)의 저장영역이 소정의 크기로 분할함으로써 얻은 블록을 나타낸다. 각각의 블록을 필드(field)라고 부른다. 필드내에서 저장영역을 분할하는 것은 물리적으로 또는 논리적으로 이루어질 수 있다. 어떠한 방법으로 분할이 이루어지더라도, 그 결과의 필드로 접근하는 데에는 차이가 없다. 필드 1 및 필드 2는 사전ROM(55)에 저장되기 때문에 이들은 연속적으로 독출될 수 있다. 그러므로, 헤더워드(4)는 필드 1 및 필드 2에 걸쳐서 저장된다. 독출조작에 있어서, 필드 1의 헤더워드 및 필드 2의 헤더워드는 서로 링크 된다.
도 6a 및 6b에 나타낸 바와 같이, 각 필드에 복수의 패킷들이 연속적으로 저장된다. 필드 1은 주데이터 1을 위한 패킷 1, 주데이터 2를 위한 패킷 2, 주데이터 3을 위한 패킷 3과 주데이터 4를 위한 패킷 4를 포함한다. 필드 2는 패킷 4의 나머지 부분, 주데이터 5를 위한 패킷 5를 포함한다.
도 5에 나타낸 바와 같이, 각 패킷은 "1F41"로 시작에서 주데이터로 종료한다. 도 6a 및 6b에 나타낸 바와 같이 패킷들이 연속적으로 저장되기 때문에, 각 패킷의 끝은 다음 패킷의 헤더인 "1F41"을 검색함으로써 용이하게 검출될 수 있다. 예를 들면, 패킷 1에 대해서, 헤더워드 2 바로 앞에 위치한 "1F41"의 검출은 주데이터 1의 끝과 패킷 1의 끝점에서 검출할 수 있다.
도 7a, 7b, 7c는 예를 통한 구체적인 패킷들을 나타낸다. 도 7a는 키워드가 "APPLE"인 데이터에 대한 패킷을 나타낸다. 도 7b는 키워드가 "APPLE"인 데이터에 대한 패킷을 나타낸다. 도 7c는 키워드가 "APPLESEED"인 데이터에 대한 패킷을 나타낸다. 도 7d는 키워드가 "APPLET"인 데이터에 대한 패킷을 나타낸다.
도 8을 참조해서, 도 10에 나타낸 본문데이터(110)가 검색키로서 사용된 "APPLE"를 갖춘 전방 일치검색으로 검색될 때 본 발명에 따른 데이터 검색장치로 실행되는 표시패널(57)상의 표시예를 나타낸다.
도 8에 나타낸 바와 같이, "1F41"값을 가지는 식별자, "1F61"값을 가지는 식별자, "00"값을 가지는 식별자 및 압축키워드는 표시패널(57)에 표시되지 않는다. 본 발명에 따른 데이터베이스 검색장치는 표시패널(57)의 좌측에 검색된 헤더워드를 표시하고, 그 대응하는 주데이터를 그 아래에 들여 쓰기 방식(indented manner)으로 표시한다.
두 개 이상의 검색된 헤더워드와 본문이 있으면, 본 발명에 따른 데이터베이스 검색장치는 다음 헤더워드를 뒤따르는 검색된 하나의 본문을 새로운 라인에 표시한다.
구체적으로, 헤더워드 "ap·ple"은 표시패널(57)의 좌측 상부에 표시된다. 이 헤더워드에 대응하는 주데이터 "A kind of fruits"는 그 아래에 표시된다. 헤더워드 "Apple"은 주데이터 "A kind of fruits" 아래에 표시된다. 헤더워드"Apple"에 대응하는 본문 "Lable of records"는 그 아래에 표시된다.
도 9를 다시 참조해서, 본문데이터(110)의 "1F41 Apple 1F61 01 00"으로 나타낸 데이터에서 식별자 "1F41" 및 "1F61" 사이의 "Apple"은 헤더워드를 나타낸다.
식별자 "1F61" 및 "00" 사이의 "05"는 헤더 "Apple"용 압축키워드를 나타낸다. 식별자 "00" 뒤의 "Label of records"는 헤더 "Apple"용 주데이터 및 압축키워드 "05"를 나타낸다.
동일하게, 예를 들면 본문데이터(110)의 "1F41 Ap·ple·seed 1f61 05 seed Johnny(John Chapman)"로 나타낸 데이터에서 식별자 "1F41" 및 "1F61" 사이의 "Ap·ple·seed"는 헤더워드를 나타낸다. 식별자 "1F61" 및 "00" 사이의 "05 seed"는 헤더워드 "Ap·ple·seed"용 압축키워드를 나타낸다.
식별자 "00" 뒤의 "Johnny(John Chapman)"는 헤더워드 "Ap·ple·seed" 및 압축키워드 "05 seed"에 대응하는 주데이터를 나타낸다.
본문데이터(110)는 소정의 저장영역을 가지는 필드(111-1 ∼111-2)로 분할된다. 도 9에 나타낸 예에서, 본문데이터(110)는 2개의 필드(111-1 및 111-2)로 분할된다. 본문데이터(110)는 2개 이상의 필드로 분할될 수도 있다.
다음에는 도 10을 참조해서 압축키워드의 구성을 설명한다. 도면에서, 좌측란은 압축 전의 키워드를 나타내고 우측란은 대응하는 압축키워드를 나타낸다.
구체적으로, 압축전의 키워드가 "APPLE", "APPLE", "APPLESEED" 및 "APPLET"순으로 본문데이터에 배열되면, 압축된 본문데이터(110)에서, 압축된 키워드들은 일치문자카운트가 "00"이며 나머지 키워드는 "APPLE"인 압축키워드, 일치문자카운트가 "05"이며 나머지 키워드는 존재하지 않는 압축키워드, 일치문자카운트가 "05"이며 나머지 키워드는 "SEED" 인 압축키워드 및 일치문자카운트가 "05"이며 나머지 키워드는 "T"인 압축키워드이다.
즉, 압축된 본문데이터(110)에 있어서, 압축전의 키워드 "APPLE"은 일치문자카운트가 "00"이며 나머지 키워드가 "APPLE"인 키워드로 대체되며, 압축전의 키워드 "APPLE"(도면에서 맨 위에서 두 번째)은 일치문자카운트가 "05" 이며 나머지 키워드는 존재하지 않는 압축키워드로 대체되며, 압축전의 키워드 "APPLESEED" 는 일치문자카운트가 "05" 이며 나머지 키워드가 "SEED"인 압축키워드로 대체된다.
동일하게, 압축된 본문데이터(110)에 있어서, 압축전의 키워드 "APPLET"는 일치문자카운트가 "05" 이며 나머지 키워드는 "T"인 압축키워드로 대체된다.
압축키워드 각각의 일치문자카운트는 압축키워드 이전에 대응하는 비압축키워드의 제 1문자열의 문자수를 압축키워드의 문자수를 일치시키는 문자수로 세트시킨다.
나머지 압축키워드는 비압축키워드의 선두로부터 일치문자를 삭제로 생긴 나머지 문자를 세트한다.
예를 들면, 비압축키워드 "APPLE"이 비압축키워드 "APPLE"를 뒤따르면, 이들 키워드는 선두 5개의 문자에서 서로 일치한다. 그러므로, "05"는 비압축키워드 "APPLE"(도 10의 맨 위부터 2번째)에 대응하는 압축키워드의 일치문자 카운트에 세트되고, 이들 2개의 비압축키워드 "APPLE"이 서로 취소됨으로써 아무 것도 남지 않기 때문에 나머지 키워드에는 아무 것도 세트되지 않는다.
즉, 동일한 철자지만 다른 의미를 가지는 단어에 대해서, "APPLE"은 동일한 철자지만 다른 의미를 가지는 이전 단어에 나머지 키워드로서 설정되고 동일한 철자지만 다른 의미를 가지는 다음 단어에 대한 나머지 키워드는 존재하지 않게 된다.
비압축키워드 "APPLESEED"가 비압축키워드 "APPLE"를 뒤따르면, 비압축키워드 "APPLESEED"는 선두 5개의 문자에서 이전의 비압축키워드와 일치하기 때문에, "05"는 비압축키워드 "APPLE"에 대응하는 압축키워드의 일치문자카운트에 설정되며 "APPLESEED"로 선두 5개의 문자를 삭제하여 생긴 "SEED"는 나머지 키워드에 세트된다.
예를 들면, 비압축키워드 "APPLET"가 비압축키워드 "APPLESEED"를 뒤따르면, 이들 키워드는 선두 5개의 문자에서 서로 일치하기 때문에 "05"는 비압축키워드 "APPLET"에 대응하는 압축키워드의 일치문자카운트에 설정되며 "APPLET"에서 선두 5개의 문자를 삭제함으로써 생긴 "T"는 나머지 문자에 세트된다.
도 11a 및 11b를 참조해서 검색키와 압축키 사이의 비교와 비교해서 검색키와 압축키 사이의 비교처리를 이후에 설명한다.
도 11a에 나타낸 비압축키워드를 사용하는 검색에 있어서, 키워드 "APPLE", 키워드 "APPLESEED" 및 키워드 "APPLET"가 이러한 순서로 본문데이터에 배열되고 검색키가 "APPLET"이면, 데이터 검색장치는 우선 검색키 "APPLET"와 키워드 "APPLET"를 비교한다.
데이터베이스 검색장치는 검색키 "APPLET"의 선두 문자 "A"와 비압축키워드"APPLE"의 선두 문자 "A"와 비교한다. 양자가 서로 일치하기 때문에, 데이터베이스 검색장치는 이후에 검색키 "APPLET"의 두 번째 문자 "P"와 비압축키워드 "APPLE"의 두 번째 문자 "P"를 비교한다.
양자가 서로 일치하기 때문에, 데이터베이스 검색장치는 다음에 검색키 "APPLESEED"의 세 번째 문자 "P"와 비압축키워드 "APPLE"의 세 번째 문자 "P"와 비교한다. 양자가 서로 일치하기 때문에, 데이터베이스 검색장치는 다음에 검색키의 네 번째 문자 "L"과 비압축키워드의 네 번째 문자 "L"과 비교한다.
양자가 서로 일치하기 때문에, 데이터베이스 검출장치는 다음에 검색키 "APPLET"의 다섯 번째 문자 "E"와 비압축키워드 "APPLE"의 다섯 번째 문자 "E"를 비교한다. 양자가 서로 일치하기 때문에, 데이터베이스 검출장치는 다음에 검색키 "APPLET"의 여섯 번째 문자 "T"와 비압축키워드의 여섯 번째 문자와 비교한다.
그러나, 검색키의 여섯 번째 문자 "T"와 비교될 비압축키워드에서 여섯 번째 ASN자가 없기 때문에, 데이터베이스 검색장치는 검색키 "APPLET"가 비압축키워드 "APPLE"와 일치하지 않는 것으로 판정한다.
다음에, 데이터베이스 검색장치는 검색키 "APPLET"와 비압축키워드 "APPLESEED"와 비교한다. 상기한 바와 같이, 데이터베이스 검출장치는 검색키 "APPLET"와 이들 문자열의 처음부터 순차적으로 비압축키워드 "APPLESEED"와 비교한다. 검색키 "APPLET"의 여섯 번째 문자 "T"를 비압축키워드 "APPLESEED"의 여섯 번째 문자 "S"와 비교하면, 일치하는 것이 없기 때문에 데이터베이스 검색장치는 검색키 "APPLET"가 비압축키워드 "APPLESEED"와 일치하지 않는 것으로 판정한다.
데이터베이스 검색장치는 검색키 "APPLET"와 비압축키워드 "APPLET"를 비교한다. 데이터베이스 검색장치는 검색키 "APPLET"의 문자와 키워드 "APPLET"를 그 선두로부터 순차적으로 비교한다. 데이터베이스 검색장치가 검색키 "APPLET"의 여섯 번째 문자 "T"와 비압축키워드 "APPLET"의 여섯 번째 문자 "T"와 비교하여 양자가 서로 일치하는 것으로 판정하면, 데이터베이스 검색장치는 양자가 검색키 및 비압축키워드의 문자열의 마지막인지 아닌지를 판정한다. 양자가 마지막 문자이기 때문에, 데이터베이스 검색장치는 검색키와 비압축키데이터 사이가 일치하는 것으로 판정한다.
다음에는 압축키워드들에 의거한 데이터 검색처리를 기술한다. 본문 데이터(110)가 압축키워드 "00 APPLE", "05 SEED" 및 "05 T"를 이러한 순서로 포함하고 검색키가 "APPLET"이면, 데이터베이스 검색장치는 검색키 "APPLET"를 압축키워드 "00 APPLE"와 비교한다.
일치문자카운트가 "00"이기 때문에, 데이터베이스 검색장치는 검색키 "APPLET"의 선두 문자 "A"와 압축키워드의 나머지 키워드 "APPLE"의 선두 문자 "A"를 비교한다. 양자가 서로 일치하기 때문에, 데이터베이스 검색장치는 이후에 검색키 "APPLET"의 두 번째 문자 "P"와 나머지 키워드 "APPLE"의 두 번째 문자 "P"와 비교한다.
양자가 서로 일치하기 때문에, 데이터베이스 검색장치는 이후에 검색키의 세 번째 문자 "P"와 나머지 키워드 "P"의 세 번째 문자 "P"와 비교한다. 양자가 서로일치하기 때문에, 데이터베이스 검색장치는 이후에 검색키 "APPLET"의 네 번째 문자 "L"과 나머지 키워드 "APPLE"의 네 번째 문자 "L"을 비교한다.
양자가 서로 일치하기 때문에, 데이터베이스 검색장치는 이후에 검색키 "APPLE"의 다섯 번째 문자 "E"와 나머지 키워드 "APPLE"의 다섯 번째 문자 "E"를 비교한다.
양자가 서로 일치하기 때문에, 데이터베이스 검색장치는 이후에 검색키 "APPLET"의 여섯 번째 문자 "T"와 나머지 키워드 "APPLE"의 여섯 번째 문자를 비교한다. 그러나 나머지 키워드에는 여섯 번째 문자가 존재하지 않기 때문에, 데이터베이스 검색장치는 검색키 "APPLET"와 압축키워드 "00APPLE"간에 일치하지 않는 것으로 판정한다.
결과적으로, 데이터베이스 검색장치는 선두 5개의 문자에 있어서 검색키 "APPLET"와 압축키워드 "00 APPLE" 간에 일치하는 것을 저장한다.
다음에, 데이터베이스 검색장치는 검색키 "APPLET"와 압축키워드 "05 SEED"를 비교한다. 데이터베이스 검색장치가 선두 5개의 문자에 있어서 검색키 "APPLET"와 압축키워드 "OO APPLE" 사이의 마지막 비교에서 검출된 일치를 저장하고 압축키워드 "05 SEED"의 일치문자카운트가 "05"이기 때문에, 데이터베이스 검색장치는 검색키 "APPLET"의 여섯 번째 문자 "T"를 압축키워드의 나머지 키워드 "SEED"의 선두 문자 "S"를 비교한다.
양자가 서로 일치하지 않기 때문에, 데이터베이스 검색장치는 검색키 "APPLET"와 압축키워드 "05 SEED" 사이에 일치하지 않는 것을 판정한다.
결과적으로, 데이터베이스 검색장치는 선두 5개의 문자에서 선택키 "APPLET" 및 압축키워드 "05 SEED" 사이의 일치하는 것을 저장한다.
다음에, 데이터베이스 검색장치는 검색키 "APPLE" 와 압축키워드 "05 T"를 비교한다. 데이터베이스 검색장치가 선두 5개의 문자에 있어서 검색키 "APPLET"와 압축키워드 "05 SEED" 사이의 일치하는 것을 저장하고 압축키워드 "05 T"의 일치문자카운트가 "05"이기 때문에, 데이터베이스 검색장치는 검색키 "APPLET"의 여섯 번째 문자 "T"를 압축키워드 "T"의 선두 문자 "T"와 비교한다.
양자가 서로 일치하기 때문에, 데이터베이스 검색장치는 검색키 "APPLET"의 여섯 번째 문자 "T"와 압축키워드의 나머지 키워드 "T" 모두가 마지막 문자인지 아닌지를 판정한다. 이들 문자들 모두가 마지막 문자이기 때문에, 데이터베이스 검색장치는 검색키 "APPLE"와 압축키워드 "05 T"간에 일치하는 것이 있는지를 판정한다.
따라서, 압축키워드를 이용함으로써, 데이터베이스 검색장치는 압축전의 키워드에 대응하는 단어 또는 문장을 검색할 수 있다. 압축키워드를 이용한 본문데이터(110)의 검색이 복수의 키워드에 포함된 동일한 문자열을 종종 비교하지 않기 때문에, 데이터베이스 검색장치는 비압축키워드에 의거해 비교될 때 문자열 사이에 여러 번 비교하는 것을 줄일 수 있도록 한다.
도 12를 참조해서 사전ROM(55)에 저장된 필드저장테이블(91)을 이후에 기술한다. 필드저장테이블(91)은 본문데이터(110)의 필드(111-1 및 111-2)에 저장된 마지막 헤더워드를 나타내는 데이터를 저장한다. 예를 들면, 도 12에 나타낸 예에서, 필드저장테이블(91)은 필드(111-1)에 저장된 마지막 헤더워드는 "Ap·ple·seed"(헤더워드의 선두문자는 필드(111-1)에 저장된다)이며 필드(111-2)에 저장된 마지막 헤더워드는 "applet"인 것을 나타낸다.
이후에, 필드(111-1 및 111-2)는 특별히 언급할 필요가 없는 경우에는 일반적으로 필드(111)로 부른다.
다음에 도 13을 참조해서 ROM(52)에 저장된 제어프로그램으로 지시된 바와 같이 CPU(51)에 의해 본문데이터(110)에 실행되는 검색처리를 기술한다. 우선, 스텝(S51)에 있어서, 키조작블록(54)에서 공급된 신호에 의거한 제어프로그램은 검색키를 독출한다. 스텝(S52)에서, 제어프로그램은 사전ROM(55)에 저장된 필드정보테이블을 조회해서 검색키에 대응하는 압축키워드를 포함한 필드(111)를 식별한다.
소정의 저장영역을 가지는 필드(111)가 식별되어 식별된 필드(111)에 저장된 압축키워드를 검색하기 때문에, 데이터베이스 검색장치는 본문데이터(110) 전체가 검색되는 방식과 비교해서 비교될 압축키워드의 수를 줄일 수 있다.
스텝(S53)에서, 제어프로그램은 스텝(S52)에서 식별된 필드(111)의 선두에 위치된 압축키워드를 선택한다. 스텝(S54)에서, 제어프로그램은 검색키와 그 선택된 압축키워드 사이에 비교를 행한다. 스텝(S54)에 대한 처리는 도 14에 나타낸 플로차트를 참조해서 상세히 설명한다.
스텝(S55)에서, 제어프로그램은 스텝(S54)의 처리결과에 의거해 검색키 및 선택된 압축키워드 간에 일치하는 것이 있는지의 여부를 판정한다. 판정이 예이면, 스텝(S56)에서 제어프로그램은 사전ROM(55)에 저장된 본문데이터(110)에서 압축키워드에 대응하는 본문을 독출하고 표시제어기(56)는 검색된 본문을 표시패널(57)에 표시하여 처리를 종료시킨다.
스텝(S55)에서 판정이 아니오 이면, 제어프로그램은 사전ROM(55)에 저장된 본문데이터(110)로부터 다음 압축키워드를 선택하여 스텝(S54)으로 복귀시켜 상기 비교처리를 반복한다.
따라서, 데이터베이스 검색장치는 본문데이터(110)에 저장된 압축키워드에 의거해 지정된 본문을 검색한다.
도 14에 나타낸 플로차트를 참조해서 ROM(52)에 저장된 제어프로그램으로 지시된 바와 같이 CPU(51)에 의해 실행되는 검색키와 선택된 압축키워드 간에 스텝(S54)에 대응하는 비교처리를 이후에 설명한다. 스텝(S81)에 있어서, 제어프로그램은 사전ROM(55)에서 선택된 압축키워드의 일치문자카운트 n을 독출 한다.
스텝(S82)에서, 제어프로그램은 압축키워드의 일치문자카운트 n이 0인지 아닌지를 판정한다. 일치문자카운트 n이 0이 아니면 스텝(S83)에서 제어프로그램은 검색키의 선두로부터의 n문자와 바로 앞에 있는 압축키워드의 선두로부터의 n문자간에 비교처리를 실행한다. 스텝(S83)의 처리를 도 15에 나타낸 플로차트를 참조해서 상세히 설명한다.
검색키의 일치문자카운트 및 바로 앞에 있는 압축키워드가 저장되고 이후에 기술될 스텝(S90)과 스텝(S110)에서 검색키의 선두로부터의 n문자와 바로 앞에 있는 압축키워드의 선두로부터의 문자 사이에 일치하는 것이 검출되면, 스텝(S83)은다음으로 진행된다.
스텝(S84)에 있어서, 스텝(S83)의 처리결과에 의거해 제어프로그램은 검색키의 선두로부터의 n문자와 바로 앞에 있는 압축키워드의 선두로부터의 n문자 사이에 일치하는 것이 있는지를 판정한다. 일치하는 것이 판정되면, 제어프로그램은 스텝(S85)에서 검색키의 n+1문자를 독출한다. 스텝(S86)에서, 제어프로그램은 사전ROM(55)에서 저장된 본문데이터(110)로부터의 압축키워드의 나머지 키워드의 선두 문자를 독출한다.
스텝(S87)에서, 제어프로그램은 검색키의 독출 문자와 나머지 키워드의 독출 문자 사이에 일치하는 것이 있는지를 판정한다. 일치하는 것이 판정되면, 제어프로그램은 독출 문자가 스텝(S88)에 있어서 검색키 및 나머지 키워드의 마지막 문자인지를 판정한다.
스텝(S88)에 있어서 독출 문자가 마지막 문자이면, 스텝(S89)에 있어서 제어프로그램은 검색키와 압축키워드 사이에 일치하는 것을 저장하고, 처리를 종료한다.
검색키의 선두로부터의 n문자와 바로 앞에 있는 압축키워드의 선두로부터의 n문자간에 일치하지 않는 것이 스텝(S84)에서 판정되고, 검색키의 독출 문자와 나머지 키워드의 독출 문자간에 일치하지 않는 것이 스텝(S87)에서 판정되면, 스텝(S90)에서 제어프로그램은 검색키와 압축키워드 사이의 비일치하는 것을 저장한다. 이후에, 제어프로그램은 검색키와 압축키워드 사이의 비일치 문자수를 저장하고, 저리를 종료한다.
스텝(S88)에서 독출 문자가 마지막 문자가 아닌 것으로 판정되면, 제어프로그램은 스텝(S91)에서 검색키의 다음 문자를 독출 한다. 스텝(S92)에 있어서, 제어프로그램은 사전ROM(55)에 저장된 본문데이터(110)로부터 압축키워드의 나머지 키워드의 다음 문자를 독출하여 스텝(S87)으로 진행하고 문자비교처리를 반복한다.
스텝(S82)에서 압축키워드의 일치문자카운트 n이 0으로 판정되면, 일치문자카운트를 위한 처리가 필요 없기 때문에, 제어프로그램은 스텝(S85)으로 진행하여 문자비교를 실행한다.
따라서, 데이터베이스 검색장치는 검색키와 선택 압축키워드간에 비교를 행하고 그들 사이의 일치 또는 비일치하는 것을 저장한다.
도 15에 나타낸 플로차트를 참조해서 ROM(52)에 저장된 제어프로그램에 의거한 CPU(51)에 의해 검색키의 선두로부터의 k문자와 압축키워드의 선두로부터의 k문자간에 스텝(S83)에 대한 비교처리가 실행된다. 우선, 스텝(S101)에 있어서, 제어프로그램은 사전ROM(55)으로부터 압축키워드의 일치문자카운트 m을 독출한다.
스텝(S102)에 있어서, 제어프로그램은 압축키워드의 일치문자카운트 m 이 0인지 아닌지를 판정한다. 판정이 아니오 이면, 제어프로그램은 스텝(S103)으로 진행하여 검색키의 선두로부터의 m문자와 바로 앞에 있는 압축키워드의 선두로부터의 m문자간에 비교를 행한다.
즉, 제어프로그램은 검색키의 선두로부터의 k문자와 압축키워드의 선두로부터의 k문자간에 비교를 반복적으로 실행한다.
검색키 및 바로 앞에 있는 압축키워드의 일치문자카운트가 저장되고스텝(S90) 및 스텝(S110)에서 검색키의 선두로부터의 m문자와 바로 앞에 있는 압축키워드의 선두로부터의 m문자간에 일치하는 것이 판정되면, 스텝(S103)은 다음으로 진행된다.
스텝(S104)에 있어서, 제어프로그램은 스텝(S103)에서 실행된 처리결과에 의거해, 검색키의 선두로부터의 m문자와 바로 앞에 있는 압축키워드의 선두로부터의 m문자간에 일치하는 것이 있는지를 판정한다. 일치하는 것이 판정되면, 제어프로그램을 스텝(S105)으로 진행하고 검색키의 m+1문자를 독출한다. 스텝(S106)에 있어서, 제어프로그램은 사전ROM(55)에 저장된 본문데이터(110)로부터 압축키워드의 나머지 키워드의 첫 번째 문자를 독출한다.
스텝(S107)에 있어서, 검색키의 독출 문자와 나머지 키워드의 문자 사이에 일치하는 것이 있는 것을 판정한다. 일치하는 것이 판정되면, 제어프로그램은 스텝(S108)으로 진행하여 독출 문자가 검색키 및 압축키워드의 k번째 문자인지를 판정한다.
독출 문자가 스텝(S108)에서 검색키 및 압축키워드의 k번째 문자인 것으로 판정되면, 제어프로그램은 스텝(S109)으로 진행하고 검색키의 선두로부터의 k문자와 압축키워드의 선두로부터의 k문자간에 일치하는 것을 저장하고 처리를 종료한다.
스텝(S104)에서 검색키의 선두로부터 m문자와 바로 앞에 있는 압축키워드의 선두로부터의 m문자간에 일치하지 않는 것으로 판정되어 스텝(S107)에서 검색키의 독출 문자와 나머지 키워드의 문자간에 일치하지 않는 것으로 판정되면, 제어프로그램은 스텝(S110)으로 진행하여 검색키의 선두로부터의 k문자와 압축키워드의 선두로부터의 k문자간에 비일치하는 것을 저장한다. 이후에, 제어프로그램은 검색키와 압축키워드 사이의 비일치 문자수를 저장하고 처리를 종료한다.
스텝(S108)에서 독출 문자가 검색키와 압축키워드의 k번째 문자가 없는 것으로 판정하면, 제어프로그램은 스텝(S111)으로 진행하여 검색키의 다음 문자를 독출한다. 스텝(S112)에 있어서, 사전ROM(55)에 저장된 본문데이터(110)로부터 압축키워드의 나머지 키워드의 다음 문자를 독출하여 스텝(S107)으로 진행하고 문자비교처리를 반복한다.
압축키워드의 일치문자카운트 m이 스텝(S102)에서 O으로 판정되면, 비일치문자카운트용 처리가 필요 없기 때문에, 제어프로그램은 스텝(S105)으로 진행하여 문자비교처리를 행한다.
따라서, 데이터베이스 검색장치는 검색키의 선두로부터의 k문자와 압축키워드의 선두로부터의 k문자간에 비교를 행하여 이들 k문자간에 일치하는 것이 있는 것을 나타내는 결과를 저장한다.
도 16을 참조해서, 사전ROM(55)에 저장된 본문 데이터(101)의 다른 일부를 기술하는 다이어그램을 나타낸다. 다른 압축키워드가 비압축키워드를 뒤따르고 이들 압축키워드의 첫 번째 문자열이 서로 일치하지 않는 경우에, 본문 데이터(101)의 압축키워드의 일치문자 카운트는 "00"으로 세트된다. 비압축키워드의 이들 문자열에 있어서 일치문자수가 1개 이상이면, 압축키워드의 일치문자수는 "0"이후에 "1"로 세트된다.
예를 들면, 비압축키워드 "APPLESEED"가 비압축키워드 "APPLE"를 뒤따르면, 선두 5개의 문자에서 앞뒤가 서로 일치하기 때문에, "011111"은 비압축키워드 "APPLESEED"에 따른 압축키워드의 일치문자카운트에 세트하고 "APPLESEED"의 첫 번째 5개의 문자를 삭제함으로 생긴 "SEED"는 나머지 키워드에 세트된다.
본문 데이터(101)는 소정의 저장영역을 각각 가지는 필드(102-1 ∼ 102-2)로 분할된다. 도 16에 나타낸 예에서, 본문 데이터(101)는 2개의 필드(102-1 ∼ 102-2)로 분할된다. 그러나, 본문 데이터(101)는 2개 이상으로 분할될 수 있다.
따라서, 본문 데이터(110 또는 101)의 검색에는 인덱스가 필요 없다. 게다가, 종래의 컴퓨터보다 적은 문자로 구성된 압축키워드는 본문 데이터(110 또는 101)에 저장된다. 결과적으로 이것은 본문 데이터(110 또는 101)를 저장하기 위한 저장영역의 크기를 줄일 수 있다. 예를 들면, 소정의 식별자를 포함하는 대략 1.5megabytes의 압축키워드는 60,000 ∼ 70,000단어의 본문을 저장하는 본문 데이터에 저장된다.
또한, 압축키워드에 의거한 검색처리는 보다 적은 문자수 때문에 종래의 기술과 비교해서 더 빠르다.
상기 실시예에 있어서, 사전ROM(55)은 본문 데이터(110)를 저장하는데 사용된다. 본문 데이터(110)가 자기디스크(60), 광디스크(61), 광자기디스크(62) 또는 반도체메모리(63)에 저장될 수 있다는 것은 이 기술에 숙련된자들에게는 명백해질 것이다. 즉, 본 발명과 관련된 정보기록매체는 예를 들면 사전ROM(55), 자기디스크(60), 광디스크(61), 광자기디스크(62) 또는 반도체메모리(63)로 구성된다.
상기 구성에 있어서, 사전ROM(55)은 미리 본문 데이터(110)를 저장한다. 예를 들어 사전ROM(55)은 EEPROM으로 구성되어 통신블록(64)을 통해서 본문 데이터(110)를 저장할 수 있는 것은 이 기술에 숙련된자들에게 명백해진다.
상기 처리조작순서는 소프트웨어뿐만 아니라 하드웨어로 실행될 수 있다. 소프트웨어에 의한 실행에 대해서, 컴퓨터는 이 소프트웨어를 구성하는 프로그램이 전용 하드웨어 장치에 저장되는데 사용된다. 그렇지 않으면, 예를 들어 일반적인 목적의 개인용 컴퓨터는 이들 프로그램이 프로그램 저장매체로부터 설치는데 사용된다.
컴퓨터로 독출가능하며 실행가는 프로그램은 자기디스크(60)(플로피디스크를 포함하는), 광디스크(61)(CD-ROM(Compact Disc-Read Only Memory)를 포함하는) 및 DVD(Digital Versatile Disc), 광자기디스크(62)(MD(Mini Disc)를 포함하는) 또는 반도체메모리(63), 프로그램이 일시적으로 또는 영구적으로 저장되는 ROM(52) 또는 도시하지 않은 하드디스크로 구성된 패키지 매체일 수 있다.
필요에 따라 라우터 또는 모뎀으로 구성된 통신블록(64)을 거쳐서 국부영역네트워크, 인터넷 및 디지털 위성방송 등의 유무선매체로부터 프로그램매체에 저장된다.
프로그램 저장매체에 저장되는 프로그램을 기술하는 스텝은 순차기술에서 시간의존 방식뿐만 아니라 수평 또는 구체적인 방식으로 실행될 수 있다.
본 발명의 바람직한 실시예가 구체적인 용어를 이용하여 기술되었지만, 이러한 기술은 단지 설명을 목적으로 하는 것이며, 첨부된 청구항의 진의와 범위에서 벗어나지 않는 한 변경 및 수정이 이루어질 수 있는 것을 알 수 있다.
본 발명에 의하면, 본 발명의 본문 데이터 검색에는 인덱스가 필요 없다. 따라서, 종래의 컴퓨터보다 적은 문자로 구성된 압축키워드가 본문 데이터에 저장된다. 따라서 본 발명은 본문 데이터를 저장하기 위한 저장영역의 크기를 줄일 수 있다. 예를 들면, 소정의 식별자를 포함하는 대략 1.5megabytes의 압축키워드가 60,000 ∼ 70,000단어의 본문을 저장하는 본문 데이터에 저장된다. 또한, 압축키워드에 의거한 검색처리는 보다 적은 문자수 때문에 종래의 기술과 비교해서 더 빠르게 된다.

Claims (20)

  1. 주데이터를 검색하기 위해 키데이터를 효율적으로 검색하고 기록매체에 기록될 상기 키데이터의 데이터량을 압축하기 위한 데이터 압축방법에 있어서,
    제 1문자수로 구성된 제 1키데이터와 상기 제 1키데이터의 상기 제 1문자수보다 큰 제 2문자수로 구성된 제 2키데이터를 비교하는 단계와,
    상기 제 1키데이터와 상기 제 2키데이터 사이의 비교결과에 의거해, 제 1키데이터와 제 2키데이터 사이에 일치하는 문자수를 검출하고, 상기 제 2키데이터로부터 상기 제 1키데이터와 일치하는 문자를 삭제하고, 상기 제 2키데이터로부터 상기 제 1키데이터와 일치하는 문자를 삭제함으로써 얻어진 상기 일치하는 문자 및 비일치하는 문자수를 가지는 데이터 패킷을 생성하는 단계와,
    상기 데이터 패킷을 상기 기록매체에 기록하는 단계로 이루어진 것을 특징으로 하는 데이터 압축방법.
  2. 제 1항에 있어서,
    상기 제 1키데이터 및 제 2키데이터가 소정의 배열 규칙으로 서로 이웃해서 위치되는 것을 특징으로 하는 데이터 압축방법.
  3. 제 1항에 있어서,
    상기 기록매체는 소정의 저장영역을 각각 가지는 복수의 저장영역을 갖고,
    상기 방법은,
    상기 기록매체상의 상기 복수의 기록영역의 각각에 기록되는 상기 데이터 패킷들 중에서 적어도 하나의 패킷에서 키데이터를 선택하는 단계와,
    상기 키데이터를 상기 복수의 기록영역의 각각에 관련시킴으로써 상기 복수의 기록영역마다 선택된 상기 키데이터를 상기 기록매체에 기록하는 단계로 이루어진 것을 특징으로 하는 데이터 압축방법.
  4. 상기 주데이터로 구성된 데이터 패킷의 주데이터와 입력 검색키 및 상기 압축키데이터에 의거해, 상기 주데이터와 관련된 키데이터와 인접한 키데이터 사이의 복제 문자수 및 상기 키데이터로부터 복제 문자를 제거함으로써 얻은 비일치 문자로 구성된 압축키 데이터를 검색하는 데이터 검색방법에 있어서,
    상기 키데이터가 상기 비일치 문자와 동일한 상기 데이터 패킷을 검색하는 단계와,
    검색단계에서 검색된 상기 데이터 패킷의 상기 압축키데이터의 비일치 문자와 상기 검색키 사이의 비일치 부분을 검출하는 단계와,
    상기 비일치 부분이 상기 압축키데이터의 상기 비일치 문자와 상기 검색키 사이에서 검출되면, 상기 데이터 패킷에 인접한 데이터 패킷의 상기 압축키데이터의 비일치 문자와 상기 검출된 비일치 부분 사이의 비일치 부분을 검출하는 단계로 이루어진 것을 특징으로 하는 데이터 검색방법.
  5. 제 4항에 있어서,
    상기 기록매체는 소정의 저장키 크기를 각각 가지는 복수의 저장영역과 상기 복수의 저장영역을 검색하기 위한 복수의 저장영역 검색키를 가지며, 상기 키데이터가 상기 비일치 문자와 일치하는 상기 데이터 패킷을 검색하는 단계는,
    상기 검색키 및 상기 저장영역 검색키에 의거해 검색데이터 패킷이 저장되는 저장영역 근처의 저장영역을 미리 검색하는 단계를 더 포함하는 것을 특징으로 하는 데이터 검색방법.
  6. 제 4항에 있어서,
    상기 기록매체에 기록된 데이터 패킷들은 소정의 배열규칙에 따라서 배열되는 것을 특징으로 하는 데이터 검색방법.
  7. 상기 주데이터로 구성된 데이터 패킷을 기록하는 기록매체로부터 주데이터 및 상기 주데이터와 관련된 키데이터와 인접한 키데이터 사이의 복제 문자와 입력 검색키 및 상기 압축키데이터에 의거해 상기 키데이터로부터 복제 문자를 제거함으로써 얻은 비일치 문자수로 구성된 압축키데이터를 검색하는 데이터 검색장치에 있어서,
    상기 데이터 검색장치는,
    상기 기록매체로부터 상기 데이터 패킷을 독출하는 기록매체 접근수단과,
    상기 키데이터가 상기 비일치 문자와 동일한 상기 데이터 패킷을 검색하는검색수단과,
    소정의 데이터 패킷에서 상기 압축키데이터의 비일치 문자와 비교를 위한 입력 문자열 사이의 비일치 문자부분을 검출하는 비일치 검출수단과,
    상기 키데이터가 상기 비일치 문자와 동일한 상기 데이터 패킷이 검색되도록 상기 검색수단을 제어하는 제어수단을 포함하고,
    검색데이터 패킷과 상기 비일치 검출수단을 제어함으로써 상기 입력된 검색키 사이의 비일치 부분을 검출하고, 상기 비일치 부분이 검출되면, 검출된 비일치 부분과 상기 기록매체 접근수단을 제어함으로써 독출된 상기 검색수단에 의해 검색된 데이터 패킷에 인접한 데이터 패킷 사이의 비일치 부분을 상기 비일치 검출수단에 의해 검출하는 것을 특징으로 하는 데이터 검색장치.
  8. 제 7항에 있어서,
    상기 제어수단의 제어하에 상기 검색키로 검색된 상기 데이터 패킷에 포함된 주데이터를 표시하는 표시수단을 더 포함하는 것을 특징으로 하는 데이터 검색장치.
  9. 제 7항에 있어서,
    상기 검색키를 입력하는 입력수단을 더 포함하고, 상기 제어수단은 상기 입력수단으로부터 입력된 상기 검색키에 의거해 상기 데이터 패킷을 검색하는 것을 특징으로 하는 데이터 검색장치.
  10. 제 7항에 있어서,
    상기 데이터 패킷은 상기 주데이터와 관련된 서브 데이터를 더 가지며, 상기 데이터 검색장치는 상기 검색된 주데이터를 표시하기 전에 상기 표시수단에 상기 서브 데이터를 표시하는 것을 특징으로 하는 데이터 검색장치.
  11. 제 7항에 있어서,
    상기 기록매체는 상기 데이터 패킷들 중 적어도 하나를 기록하기 위한 소정의 기록크기를 각각 가지는 복수의 패킷기록영역과 상기 복수의 패킷기록영역에 기록된 상기 데이터 패킷들 중 적어도 하나를 기록하는 식별데이터 기록영역을 가지며, 상기 식별데이터는 상기 복수의 기록영역들 각각에 관해서 기록되며,
    상기 데이터 검색장치는 상기 식별데이터 기록영역으로부터 상기 식별데이터를 독출하는 실별데이터 접근수단과,
    검색될 데이터 패킷이 기록되는 패킷기록영역에 근접한 패킷기록영역으로부터 검색을 개시하기 위해 상기 입력 검색키에 의거해 상기 식별데이터 접근수단을 제어하는 제어수단을 더 포함하는 것을 특징으로 하는 데이터 검색장치.
  12. 상기 주데이터로 구성된 데이터 패킷을 기록하는 기록매체로부터 주데이터 및 상기 주데이터와 관련된 키데이터와 인접한 키데이터 사이의 복제 문자와 입력 검색키 및 상기 압축키데이터에 의거해 상기 키데이터로부터 복제 문자를 제거함으로써 얻은 비일치 문자수로 구성된 압축키데이터를 검색하는 데이터 검색장치에 있어서,
    상기 데이터 검색장치는,
    상기 기록매체로부터 상기 데이터 패킷을 독출하는 기록매체 접근수단과,
    상기 검색키를 입력하는 조작수단과,
    상기 검색된 주데이터를 표시하는 표시수단과,
    상기 기록매체로부터 독출된 상기 데이터 패킷으로부터 상기 압축키데이터를 검색하는 압축키데이터 검색수단과,
    상기 압축키데이터의 비일치 문자와 상기 검색키를 비교하는 제 1비교수단과,
    상기 비교수단에 의한 비교결과에 의거해 상기 검색키를 갖춘 상기 압축키데이터의 비일치 문자 사이의 비일치 문자수를 유지하는 유지수단과,
    상기 유지수단에 유지된 문자수와 압축된 문자수를 나타내는 데이터와 비교하는 제 2비교수단과,
    상기 조작수단으로부터 입력된 상기 검색키와 상기 압축키데이터 검색수단에 의해 검색된 압축키데이터의 비일치 문자수와 비교하도록 상기 제 1비교수단을 제어하고, 상기 제 1비교수단의 비교로 얻은 상기 검색키와 상기 압축키데이터 사이의 비일치 문자수를 상기 유지수단에 유지하고, 인접 데이터패킷의 상기 비일치 문자와 상기 비교수단에 의해 비일치로 판정된 상기 검색키의 문자열를 비교하고, 이와 같이 검색된 상기 주데이터를 상기 표시수단에 표시하는 제어수단을 포함하는것을 특징으로 하는 데이터 검색장치.
  13. 주데이터 및 상기 주데이터를 검색하는 검색문자열을 가지는 데이터 패킷신호에 있어서,
    주데이터 신호부와,
    상기 주데이터를 검색하는 키데이터 및 다른 주데이터를 위한 키데이터 사이의 일치 문자부분을 압축한 후 남겨지는 비일치 신호부와,
    압축데이터의 문자수를 나타내는 압축문자 카운트 신호부를 포함하여 이루어진 것을 특징으로 하는 데이터 패킷신호.
  14. 제 13항에 있어서,
    상기 주데이터의 내용을 나타내는 헤더워드부를 더 포함하는 것을 특징으로 하는 데이터 패킷신호.
  15. 제 13항에 있어서,
    상기 주데이터를 검색하는 상기 키데이터가 상기 다른 주데이터의 상기 키데이터와 일치할 때 상기 비일치 신호부가 압축으로 인해 삭제되는 것을 특징으로 하는 데이터 패킷신호.
  16. 제 13항에 있어서,
    상기 데이터 패킷신호의 개시를 나타내는 헤더신호와,
    상기 헤더워드신호의 종료를 나타내는 헤더워드종료신호와,
    상기 주데이터를 나타내는 주데이터 개시신호를 포함하여 구성되는 것을 특징으로 하는 데이터 패킷신호.
  17. 주데이터와 상기 주데이터를 검색하는 압축데이터를 가지는 데이터 패킷을 기록하는 기록매체에 있어서,
    상기 주데이터는,
    상기 주데이터를 검색하는 검색데이터와 인접한 데이터패킷의 주데이터를 검색하는 검색데이터 사이의 비일치 문자를 삭제한 후 남겨지는 비일치 데이터와,
    일치 결과로서 삭제된 문자수를 나타내는 압축된 문자수를 포함하여 이루어진 것을 특징으로 하는 기록매체.
  18. 제 17항에 있어서,
    압축을 위한 인접하는 검색데이터는 소정의 배열규칙에 따라서 배열된 상기 데이터 패킷 앞에 위치된 데이터 패킷인 것을 특징으로 하는 기록매체.
  19. 제 17항에 있어서,
    상기 데이터 패킷은 상기 주데이터를 식별하기 위한 헤더워드를 더 갖는 것을 특징으로 하는 기록매체.
  20. 제 17항에 있어서,
    하나 이상의 데이터 패킷들이 조립되는 블록을 검색하기 위한 블록키 데이터를 기록하는 블록키 데이터 기록영역을 더 가지는 것을 특징으로 하는 기록매체.
KR1020010002680A 2000-01-25 2001-01-17 데이터 압축방법, 데이터 검색방법, 데이터 검색장치,기록방법 및 데이터 패킷신호 KR20010076315A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2000-015617 2000-01-25
JP2000015617 2000-01-25
JP2001-002277 2001-01-10
JP2001002277A JP2001282820A (ja) 2000-01-25 2001-01-10 データ圧縮方法、検索方法、検索装置、データパケット信号および記録媒体

Publications (1)

Publication Number Publication Date
KR20010076315A true KR20010076315A (ko) 2001-08-11

Family

ID=26584086

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010002680A KR20010076315A (ko) 2000-01-25 2001-01-17 데이터 압축방법, 데이터 검색방법, 데이터 검색장치,기록방법 및 데이터 패킷신호

Country Status (6)

Country Link
US (1) US20010022792A1 (ko)
JP (1) JP2001282820A (ko)
KR (1) KR20010076315A (ko)
CN (1) CN1316707A (ko)
HK (1) HK1043411A1 (ko)
TW (1) TW482965B (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011007956A3 (ko) * 2009-07-17 2011-03-24 주식회사 이스트소프트 데이터의 압축방법
KR101403356B1 (ko) * 2012-10-22 2014-06-05 (주)티베로 데이터 압축 장치, 데이터 압축 방법 및 그 방법을 위한 컴퓨터 판독 가능한 기록 매체

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003096230A2 (en) * 2002-05-10 2003-11-20 Oracle International Corporation Storing and querying relational data in compressed storage format
US6857001B2 (en) 2002-06-07 2005-02-15 Network Appliance, Inc. Multiple concurrent active file systems
EP1565842A2 (en) * 2002-11-28 2005-08-24 International Business Machines Corporation Method and system for hyperlinking files
US20040187083A1 (en) * 2003-03-18 2004-09-23 Tracey Bryan D. System and method for reducing the size of wireless communications
US7386562B2 (en) * 2003-11-25 2008-06-10 Abb Technology Ag Generic product finder system and method
JP4433290B2 (ja) * 2004-05-19 2010-03-17 ソニー株式会社 コンテンツ提示装置、コンテンツ提示方法及びコンテンツ提示プログラム
CN100367278C (zh) * 2004-11-29 2008-02-06 中兴通讯股份有限公司 历史数据归档和查询装置及方法
CN100365629C (zh) * 2005-01-17 2008-01-30 佳能信息技术(北京)有限公司 网页搜索的显示方法及其客户端设备
CN100410934C (zh) * 2005-01-21 2008-08-13 林修平 使用于通讯系统中的实时数据搜寻系统
CN100403306C (zh) * 2005-03-11 2008-07-16 谢永强 实现不同平台间信息网站移植的方法
CN100405368C (zh) * 2005-03-25 2008-07-23 威盛电子股份有限公司 多国语言软件执行系统及方法
CN100354865C (zh) * 2006-02-20 2007-12-12 南京工业大学 仿人工细粒度网页信息采集方法
CN100399337C (zh) * 2006-04-29 2008-07-02 哈尔滨工业大学 一种铸件凝固时搜索孤立区的方法
CN100424699C (zh) * 2006-04-30 2008-10-08 华中科技大学 一种属性可扩展的对象文件系统
CN100465959C (zh) * 2006-05-25 2009-03-04 中国工商银行股份有限公司 本地化数据采集方法和系统
CN100401301C (zh) * 2006-05-30 2008-07-09 南京大学 基于本体学习的智能主题式网络爬虫系统构建方法
CN100392658C (zh) * 2006-05-30 2008-06-04 南京大学 基于本体的主题式网络爬虫系统构建方法
US9069547B2 (en) 2006-09-22 2015-06-30 Intel Corporation Instruction and logic for processing text strings
US9591086B2 (en) 2007-07-25 2017-03-07 Yahoo! Inc. Display of information in electronic communications
US9584343B2 (en) 2008-01-03 2017-02-28 Yahoo! Inc. Presentation of organized personal and public data using communication mediums
KR20100050072A (ko) * 2008-11-05 2010-05-13 삼성전자주식회사 데이터 압축 방법 및 이를 이용한 데이터 통신 시스템
WO2010141216A2 (en) 2009-06-02 2010-12-09 Xobni Corporation Self populating address book
US9514466B2 (en) 2009-11-16 2016-12-06 Yahoo! Inc. Collecting and presenting data including links from communications sent to or from a user
US9760866B2 (en) 2009-12-15 2017-09-12 Yahoo Holdings, Inc. Systems and methods to provide server side profile information
US8423545B2 (en) 2010-02-03 2013-04-16 Xobni Corporation Providing user input suggestions for conflicting data using rank determinations
US8924956B2 (en) * 2010-02-03 2014-12-30 Yahoo! Inc. Systems and methods to identify users using an automated learning process
US8982053B2 (en) 2010-05-27 2015-03-17 Yahoo! Inc. Presenting a new user screen in response to detection of a user motion
US9549197B2 (en) * 2010-08-16 2017-01-17 Dolby Laboratories Licensing Corporation Visual dynamic range timestamp to enhance data coherency and potential of metadata using delay information
JP5939259B2 (ja) 2011-11-04 2016-06-22 富士通株式会社 照合制御プログラム、照合制御装置および照合制御方法
US20160127771A1 (en) * 2014-10-30 2016-05-05 Broadcom Corporation System and method for transporting hd video over hdmi with a reduced link rate

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4058672A (en) * 1976-11-10 1977-11-15 International Telephone And Telegraph Corporation Packet-switched data communications system
US5881104A (en) * 1996-03-25 1999-03-09 Sony Corporation Voice messaging system having user-selectable data compression modes
US6618366B1 (en) * 1997-12-05 2003-09-09 The Distribution Systems Research Institute Integrated information communication system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011007956A3 (ko) * 2009-07-17 2011-03-24 주식회사 이스트소프트 데이터의 압축방법
KR101049699B1 (ko) * 2009-07-17 2011-07-15 (주)이스트소프트 데이터의 압축방법
KR101403356B1 (ko) * 2012-10-22 2014-06-05 (주)티베로 데이터 압축 장치, 데이터 압축 방법 및 그 방법을 위한 컴퓨터 판독 가능한 기록 매체

Also Published As

Publication number Publication date
CN1316707A (zh) 2001-10-10
TW482965B (en) 2002-04-11
HK1043411A1 (zh) 2002-09-13
JP2001282820A (ja) 2001-10-12
US20010022792A1 (en) 2001-09-20

Similar Documents

Publication Publication Date Title
KR20010076315A (ko) 데이터 압축방법, 데이터 검색방법, 데이터 검색장치,기록방법 및 데이터 패킷신호
US6493709B1 (en) Method and apparatus for digitally shredding similar documents within large document sets in a data processing environment
US6243713B1 (en) Multimedia document retrieval by application of multimedia queries to a unified index of multimedia data for a plurality of multimedia data types
JP2832988B2 (ja) データ検索システム
US7143086B2 (en) File search method and apparatus, and index file creation method and device
US8996571B2 (en) Text search apparatus and text search method
JP2693914B2 (ja) 検索システム
EP1116137B1 (en) Database, and methods of data storage and retrieval
JPH0785080A (ja) 全文書検索システム
JP4116434B2 (ja) 計算ユニットにおけるテキスト処理方法及び計算ユニット
JP3531344B2 (ja) 情報検索装置
JPH0561910A (ja) 全文インデツクス検索方法
KR20080082985A (ko) 데이터 파일 조작 방법 및 장치
US20040196494A1 (en) Method for determining the format type of a print data stream
JPH05128159A (ja) キーワード抽出方法及び装置
JP3548263B2 (ja) 文書登録方法および文書検索方法
JP2000076254A (ja) キーワード抽出装置、このキーワード抽出装置を用いた類似文献検索装置、キーワード抽出方法及び記録媒体
JP2008203997A (ja) 文書検索装置及びプログラム
JPH08161344A (ja) ファイル検索管理用のキーワードデータベースファイル作成方法および装置
JP2002245063A (ja) データベースの管理及び検索方法
JPH06266764A (ja) 文書検索装置
CN112052369A (zh) 一种大数据智能检索方法
JPH05158984A (ja) 文字列抽出装置
JP2739589B2 (ja) 情報検索装置
JPH11306198A (ja) 検索データベース構築方法及び検索データ構築システム並びに記録媒体

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid