KR100811838B1 - 정보 검색 장치 및 그 제어 방법 - Google Patents

정보 검색 장치 및 그 제어 방법 Download PDF

Info

Publication number
KR100811838B1
KR100811838B1 KR1020060072333A KR20060072333A KR100811838B1 KR 100811838 B1 KR100811838 B1 KR 100811838B1 KR 1020060072333 A KR1020060072333 A KR 1020060072333A KR 20060072333 A KR20060072333 A KR 20060072333A KR 100811838 B1 KR100811838 B1 KR 100811838B1
Authority
KR
South Korea
Prior art keywords
list
document
posting
information
term
Prior art date
Application number
KR1020060072333A
Other languages
English (en)
Other versions
KR20080011594A (ko
Inventor
박종호
이상호
Original Assignee
(주)닷넷소프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)닷넷소프트 filed Critical (주)닷넷소프트
Priority to KR1020060072333A priority Critical patent/KR100811838B1/ko
Publication of KR20080011594A publication Critical patent/KR20080011594A/ko
Application granted granted Critical
Publication of KR100811838B1 publication Critical patent/KR100811838B1/ko

Links

Images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)

Abstract

본 발명은 정보 검색 장치 및 그 제어 방법에 관한 것으로서, 정보 검색 장치는, 적어도 하나의 용어(term)를 포함하는 복수의 문서(document)와, 각 용어마다 마련되어 당해 용어가 포함된 문서의 위치 정보를 포함하는 복수의 제1포스팅 리스트와, 각 문서마다 마련되어 당해 문서에 대응하는 제1포스팅 리스트의 위치 정보를 포함하는 복수의 제2포스팅 리스트가 저장된 정보 저장부와; 복수의 제2포스팅 리스트 중에서 사용자의 의해 선택된 문서에 대응하는 어느 하나의 제2포스팅 리스트를 선택하고, 선택된 제2포스팅 리스트에 포함된 위치 정보에 기초하여 제1포스팅 리스트를 검색하는 검색 수행부를 포함한다. 이에 의하여, 신속하고 효율적으로 정보의 수정을 수행할 수 있다.

Description

정보 검색 장치 및 그 제어 방법{INFORMATION SEARCHING APPARATUS AND CONTROL METHOD THEREOF}
도 1(a) 및 (b)는 종래의 역 인덱스 구조를 설명하기 위한 도면이며,
도 2는 본 발명의 일실시예에 의한 정보 검색 장치의 구성을 도시한 블록도이며,
도 3은 본 발명의 일실시예에 의한 역 인덱스 구조를 설명하기 위한 도면이며,
도 4는 본 실시예에 의한 정보 검색 장치의 문서의 삭제 동작을 도시한 흐름도이며,
도 5는 본 실시예에 의한 정보 검색 장치의 문서의 추가 동작을 도시한 흐름도이다.
* 도면의 주요 부분에 대한 부호의 설명 *
100 : 정보 검색 장치 110 : 정보 저장부
120 : 검색 수행부 130 : 사용자인터페이스
본 발명은 정보 검색 장치 및 그 제어 방법에 관한 것이다. 더욱 상세하게는, 본 발명은 신속하고 효율적으로 정보의 수정을 수행할 수 있는 정보 검색 장치 및 그 제어 방법에 관한 것이다.
컴퓨터와 통신 기술의 발전으로 개인 휴대용 전자 기기인 PDA와 같은 정보 검색 장치의 성능과 저장 공간이 증가하고 있다. 이로 인해, 정보 검색 장치에 보다 많은 정보를 저장하고 이를 처리하게 되었다. 예컨대, 네비게이션 등으로 응용되는 정보 검색 장치에서 수백만 건의 지역 정보를 저장하고 검색하는 것이다. 이와 같은 환경에서는, 많은 정보에서 사용자가 원하는 정보를 신속하게 찾아주는 것과 같이, 정보 검색 장치의 검색 속도에 관한 중요성이 높아졌다. 정보 검색 장치는 적어도 하나의 키워드(이하, "용어(term)"라고도 한다)를 포함하는 정보(이하, "문서(document)"라고도 한다)로부터 키워드를 추출하고 이에 기초하여 인덱스(index)를 구축한다. 이어, 정보 검색 장치는 구축된 인덱스를 사용하여 사용자의 질의(query)에 적합한 문서를 검색해 준다.
정보 검색 장치의 기술 분야에서 가장 널리 사용되고 있는 인덱스의 구조는, 검색하고자 하는 용어가 주어졌을 때 이를 포함하고 있는 문서를 찾아 주는 것을 특징으로 하는 역 인덱스(Inverted Index)이다. 역 인덱스는 용어 별로 해당 용어를 포함하고 있는 문서의 검색에 관한 정보(이하, "문서의 검색 정보"라고도 한다)로 구성된 포스팅 리스트(Posting List)를 저장한다.
도 1(a) 및 (b)는 종래의 역 인덱스 구조를 설명하기 위한 도면이다. 참조부호 11은 용어(t1, t2, …)의 인덱스를, 참조부호 "12"는 용어(t1, t2, …)에 각각 대응하는 복수의 포스팅 리스트를 나타낸다. 각 포스팅 리스트(12)는 용어(t1, t2, …) 각각에 대응하여 마련된다. 한편, 참조부호 13은 용어(t1, t2, …)를 포함하는 복수의 문서(D1, D2 … 참조)의 저장 상태를 나타낸다.
각 포스팅 리스트(12)는 용어(t1, t2, …)가 포함된 문서의 검색 정보를 포함한다. 문서의 검색 정보는 당해 용어(t1)가 포함된 문서가 저장된 문서의 위치 정보(D1, D2, …)를 나타낸다. 또한, 문서의 검색 정보 중 "5", "10" 등은 문서(D1 참조) 내에서 당해 용어(t1)가 발견되는 위치(예컨대, 5번째 단어, 10번째 단어 등)를 나타낸다.
이러한 정보 검색 장치에서는 문서 및/또는 용어의 삽입, 삭제 등과 같은 수정(이하, "문서의 수정"이라고도 한다)이 동적으로 발생하기 때문에, 역 인덱스도 동적으로 이루어지는 문서의 수정에 대응하여 문서들을 효율적으로 관리할 수 있는 구조이어야 한다. 만일 그렇지 않으면, 시스템에 많은 부하(load)가 발생하여 사용자가 얻고자 하는 정보를 신속하게 제공할 수 없게 된다.
이러한 관점에서 볼 때, 역 인덱스 구조는 구현이 간단하다는 장점이 있는 반면에, 문서의 수정을 신속하게 수행하는 것이 곤란하다는 단점이 있다. 즉, 문서의 수정에는 해당 문서의 검색 정보의 삭제 등과 같은 포스팅 리스트의 수정도 수반되는데, 특정 문서에 대응하는 포스팅 리스트를 검색하기 위하여는, 당해 문서에 포함된 용어를 키워드로서 이용하여야 하기 때문이다. 이에 따라, 당해 문서에서 용어를 추출하는 과정이 필요하고, 이러한 과정은 시간이 많이 소요되며 비효율적이다.
한편, 역 인덱스 구조와 관련하여 대한민국 등록특허공보 10-0285265에는, "서브 인덱스를 이용한 역 인덱스 구조"에 관한 기술이 개시되어 있다. 이에 의하면, 종래의 단순한 형태의 역 인덱스 구조의 단점인 검색 속도를 향상시키기 위하여, 각 포스팅 리스트에 독립된 인덱스를 두는 것을 제시하고 있다. 그러나 이러한 구조에서도 문서의 수정을 위해서는 수정될 문서로부터 용어를 다시 추출해야 하는 단점은 여전히 존재한다.
통상적으로, 문서로부터 용어를 추출하기 위해서는, 문서 내의 각 용어에 대하여 어휘 사전으로부터 어휘 정보를 구해야 하기 때문에, 용어 추출은 시스템에 많은 부하를 요구하는 연산이다. 따라서 키워드 추출 연산을 줄이는 것은 정보 검색 시스템의 성능 향상에 있어서 중요한 요소가 된다. 그러나 종래의 역 인덱스 구조는 문서를 수정하는 경우에는, 문서의 수정이 있을 때마다 용어 추출 연산을 수행해야 한다.
나아가, 문서의 수정 시에는, 이전 버전의 문서를 용어 추출을 위해서 다른 저장 장소에 보관해야 하는 오버헤드가 발생한다. 이와 같은 문제점을 해결할 수 있는 간단한 방법은 각 문서에서 추출한 용어들을 정보 검색 장치에서 유지하는 것인데, 이는 메모리 요구량이 증가한다는 다른 문제를 야기한다. PDA와 같은 휴대용 전자 기기에서는 가용 메모리에 제한이 있기 때문에 더욱 큰 문제가 된다.
본 발명은 상기 문제점을 해결하기 위한 것으로서, 신속하고 효율적으로 정보의 수정을 수행하는 정보 검색 장치 및 그 제어 방법을 제공하는 것을 목적으로 한다.
상기 목적을 달성하기 위하여, 본 발명은, 정보 검색 장치에 있어서, 적어도 하나의 용어(term)를 포함하는 복수의 문서(document)와, 상기 각 용어마다 마련되어 당해 용어가 포함된 상기 문서의 위치 정보를 포함하는 복수의 제1포스팅 리스트와, 상기 각 문서마다 마련되어 당해 문서에 대응하는 상기 제1포스팅 리스트의 위치 정보를 포함하는 복수의 제2포스팅 리스트가 저장된 정보 저장부와; 상기 복수의 제2포스팅 리스트 중에서 사용자의 의해 선택된 문서에 대응하는 어느 하나의 제2포스팅 리스트를 선택하고, 상기 선택된 제2포스팅 리스트에 포함된 상기 위치 정보에 기초하여 상기 제1포스팅 리스트를 검색하는 검색 수행부를 포함하는 것을 특징으로 하는 정보 검색 장치를 제공한다.
상기 검색 수행부는 상기 검색된 제1포스팅 리스트에서 상기 선택된 문서의 위치 정보를 삭제할 수 있다. 상기 검색 수행부는, 상기 검색된 제1포스팅 리스트에 상기 문서의 위치 정보가 더 이상 존재하지 않는 경우, 상기 선택된 제2포스팅 리스트에서 당해 제1포스팅 리스트의 위치 정보를 삭제할 수 있다.
상기 정보 저장부에는, 상기 복수의 제1포스팅 리스트 각각에 대응하는 상기 복수의 용어의 목록이 더 저장되며, 상기 검색 수행부는, 상기 검색된 제1포스팅 리스트에 상기 문서의 위치 정보가 더 이상 존재하지 않는 경우, 상기 복수의 용어의 목록에서 당해 제1포스팅 리스트에 대응하는 용어의 항목을 삭제할 수 있다.
상기 정보 저장부에는, 상기 복수의 제2포스팅 리스트 각각에 대응하는 상기 복수의 문서의 목록이 더 저장되며, 상기 검색 수행부는, 상기 문서의 목록에서 상기 선택된 문서의 항목을 삭제할 수 있다.
상기 검색 수행부는, 신규의 문서에 포함된 적어도 하나의 신규의 용어에 대응하는 신규의 제1포스팅 리스트와, 상기 신규의 제1포스팅 리스트의 위치 정보를 포함하는 신규의 제2포스팅 리스트를 생성하여 상기 정보 저장부에 저장할 수 있다. 상기 검색 수행부는, 상기 문서의 목록에 상기 신규의 문서의 항목을 추가할 수 있다.
본 발명의 상기 목적은, 적어도 하나의 용어(term)를 포함하는 복수의 문서(document)와, 상기 각 용어마다 마련되어 당해 용어가 포함된 상기 문서의 위치 정보를 포함하는 복수의 제1포스팅 리스트가 저장된 정보 저장부를 구비하는 정보 검색 장치의 제어 방법에 있어서, 상기 각 문서마다 마련되어 당해 문서에 대응하는 상기 제1포스팅 리스트의 위치 정보를 포함하는 복수의 제2포스팅 리스트를 저장하는 단계와; 상기 복수의 제2포스팅 리스트 중에서 사용자의 의해 선택된 문서에 대응하는 어느 하나의 제2포스팅 리스트를 선택하는 단계와; 상기 선택된 제2포스팅 리스트에 포함된 상기 위치 정보에 기초하여 상기 제1포스팅 리스트를 검색하는 단계를 포함할 수 있다.
상기 정보 검색 장치의 제어 방법은, 상기 검색된 제1포스팅 리스트에서 상기 선택된 문서의 위치 정보를 삭제하는 단계를 더 포함할 수 있다. 상기 정보 검색 장치의 제어 방법은, 상기 검색된 제1포스팅 리스트에 상기 문서의 위치 정보가 더 이상 존재하지 않는 경우, 상기 선택된 제2포스팅 리스트에서 당해 제1포스팅 리스트의 위치 정보를 삭제하는 단계를 더 포함할 수 있다.
상기 정보 저장부에는, 상기 복수의 제1포스팅 리스트 각각에 대응하는 상기 복수의 용어의 목록이 더 저장되며, 상기 정보 검색 장치의 제어 방법은, 상기 검색된 제1포스팅 리스트에 상기 문서의 위치 정보가 더 이상 존재하지 않는 경우, 상기 복수의 용어의 목록에서 당해 제1포스팅 리스트에 대응하는 용어의 항목을 삭제하는 단계를 더 포함할 수 있다.
상기 정보 검색 장치의 제어 방법은, 상기 복수의 제2포스팅 리스트 각각에 대응하는 상기 복수의 문서의 목록을 저장하는 단계와, 상기 문서의 목록에서 상기 선택된 문서의 항목을 삭제하는 단계를 더 포함할 수 있다.
상기 정보 검색 장치의 제어 방법은, 신규의 문서에 포함된 적어도 하나의 신규의 용어에 대응하는 신규의 제1포스팅 리스트와, 상기 신규의 제1포스팅 리스트의 위치 정보를 포함하는 신규의 제2포스팅 리스트를 생성하여 저장하는 단계를 더 포함할 수 있다. 상기 정보 검색 장치의 제어 방법은, 상기 문서의 목록에 상기 신규의 문서의 항목을 추가하는 단계를 더 포함할 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 관하여 상세히 설명한다. 도 2는 본 발명의 일실시예에 의한 정보 검색 장치(100)의 구성을 도시한 블록도이다. 정보 검색 장치(100)는 PDA, 네비게이션 등과 같은 휴대용 전자 기기일 수 있다. 정보 검색 장치(100)는 적어도 하나의 용어를 포함하는 문서와 같은 정보를 저장하고, 사용자의 검색 요청에 대하여 당해 용어가 포함된 문서를 검색하여 출력한다. 나아가, 문서의 수정이 필요한 경우, 정보 검색 장치(100)는 수정될 문서를 키워드로 하여 검색을 수행함으로써, 당해 문서의 검색 정보를 수정한다.
정보 검색 장치(100)는, 도 2에 도시된 바와 같이, 정보 저장부(110)와, 검색 수행부(120)와, 사용자인터페이스(130)를 포함한다. 정보 저장부(110)에는, 적어도 하나의 용어가 포함된 복수의 문서(111)와, 문서(111)에 포함된 용어의 목록(112)과, 복수의 용어 각각에 대응하여 마련되며, 당해 용어가 포함된 문서(111)의 검색 정보를 포함하는 복수의 제1포스팅 리스트(113)와, 복수의 문서(111)의 목록(114)과, 복수의 문서(111) 각각에 대응하여 마련되며, 당해 문서(111)에 대응하는 제1포스팅 리스트(113)의 검색 정보를 포함하는 복수의 제2포스팅 리스트(115)가 저장된다.
문서(111)의 저장 상태는 도 1(b)에 도시된 바와 동일 내지는 유사하다. 도 3은 본 발명의 일실시예에 의한 역 인덱스 구조를 설명하기 위한 도면이다. 용어의 목록(112)은 복수의 용어(t1, t2, …, t17, …)를 포함한다. 복수의 제1포스팅 리스트(113)는 복수의 용어(t1, t2, …, t17, …)에 각각 대응한다. 각 제1포스팅 리스트(113)는 소정의 용어(t1, t2, …, t17, …)가 포함된 문서(111)의 검색 정보(D1, D2 …)를 포함한다. 문서(111)의 검색 정보(D1, D2 …)는 특정 용어(t1, t2, …, t17, …)가 포함된 문서(111)의 위치 정보를 나타낸다.
문서의 목록(114)은 복수의 문서(111)의 항목(d1, d2, …, d35, …)을 포함한다. 복수의 제2포스팅 리스트(115)는 복수의 문서(111)의 항목(d1, d2, …, d35, …)에 각각 대응한다. 각 제2포스팅 리스트(115)는 제1포스팅 리스트(113)의 검색 정보(P1, P2 …)를 포함한다. 제1포스팅 리스트(113)의 검색 정보(P1, P2 …)는 특 정 문서(111)에 대응하는 제1포스팅 리스트(113)의 위치 정보를 나타낸다. 도 3에 도시된 복수의 제1포스팅 리스트(113)는 위에서 아래로 "P1", "P2" … 에 각각 대응된다.
용어의 목록(112)과 문서의 목록(114)을 위해서 사용될 수 있는 인덱스 구조는 가장 일반적으로 사용되는 "B+-트리"가 사용될 수 있다.
용어(t1, t2, …)를 키워드로 하여 문서(111)를 검색하는 경우, 검색 수행부(120)는 용어의 목록(112)을 이용하여 질의된 용어(t1, t2, …)에 대응하는 제1포스팅 리스트(113)를 선택하고, 선택된 제1포스팅 리스트(113)에서 위치 정보(D1, D2 …)를 참조하여 질의된 용어(t1, t2, …)를 포함하는 문서(111)를 검색한다.
한편, 문서(111)의 수정이 있는 경우, 검색 수행부(120)는 문서의 목록(114)을 이용하여 복수의 제2포스팅 리스트(115) 중에서 질의된 문서(d1, d2, …)에 대응하는 제2포스팅 리스트(115)를 선택하고, 선택된 제2포스팅 리스트(115)에 포함된 위치 정보(P1, P2 …)를 참조하여 찾고자 하는 제1포스팅 리스트(113)를 검색한다.
한편, 사용자인터페이스(130)는 사용자로부터 질의 또는 지시를 입력 받아 검색 수행부(120)에 전달하고, 검색 수행부(130)에 의해 수행된 수행 결과를 사용자에 알려준다. 사용자인터페이스(130)는 질의 또는 지시를 입력을 위한 키패드, 수행 결과의 표시를 위한 디스플레이 등을 포함할 수 있다.
도 4 및 도 5를 참조하여 본 실시예에 의한 정보 검색 장치(100)의 동작을 상세히 설명한다. 도 4는 본 실시예에 의한 정보 검색 장치(100)의 문서(111)의 삭 제 동작을 도시한 흐름도이다. 먼저, 사용자에 의해 복수의 문서(111) 중 어느 하나의 삭제 요청이 있으면(S101), 검색 수행부(120)는 문서의 목록(114)을 이용하여 복수의 제2포스팅 리스트(115) 중에서 삭제하고자 하는 문서(d1, d2, …)에 대응하는 제2포스팅 리스트(115)를 선택하고, 선택된 제2포스팅 리스트(115)에 포함된 위치 정보(P1, P2 …)를 참조하여 찾고자 하는 제1포스팅 리스트(113)를 검색한다(S102).
다음으로, 검색 수행부(120)는 검색된 제1포스팅 리스트(113)에서 삭제하고자 하는 문서(d1, d2, …)의 위치 정보(D1, D2, …)를 삭제한다(S103). 다음으로, 검색 수행부(120)는 당해 제1포스팅 리스트(113)에 더 이상의 위치 정보(D1, D2, …)가 존재하지 않는지 여부를 판단하고(S104), 만일 더 이상 하나도 존재하지 않는 경우, 당해 제1포스팅 리스트(113)를 삭제한다(S105). 다음으로, 검색 수행부(120)는 삭제하고자 하는 문서(d1, d2, …)에 대응하는 제2포스팅 리스트(115)에서 삭제된 제1포스팅 리스트(113)의 위치 정보(P1, P2 …)를 삭제한다(S106).
다음으로, 검색 수행부(120)는 문서의 목록(114)에서 삭제하고자 하는 문서의 항목(d1, d2, …)을 삭제한다(S107). 한편, 위치 정보(D1, D2, …)가 적어도 하나 존재하는 경우에는, 검색 수행부(120)는 단계 S104에서 단계 S107을 바로 수행한다.
도 5는 본 실시예에 의한 정보 검색 장치(100)의 문서(111)의 추가 동작을 도시한 흐름도이다. 먼저, 사용자에 의해 신규의 문서(111)의 추가 요청이 있으면(S201), 검색 수행부(120)는 추가하고자 하는 문서(111)에 포함된 용어를 추출한 다(S202). 검색 수행부(120)는 용어의 목록(112)을 참조하여 추가하고자 하는 문서(111)에 포함된 용어가 용어의 목록(112)에 포함되지 않은 신규의 용어인지 여부를 판단한다(S203).
만일, 추가하고자 하는 문서(111)에 포함된 용어가 용어의 목록(112)에 포함되지 않은 신규의 용어인 경우, 검색 수행부(120)는 용어의 목록(112)에 신규의 용어를 추가한다(S204). 다음으로, 검색 수행부(120)는 추가된 신규의 용어에 대응하는 제1포스팅 리스트(113)를 생성한다(S205). 한편, 추가하고자 하는 문서(111)에 포함된 용어가 용어의 목록(112)에 포함되어 신규의 용어가 아닌 경우에는, 검색 수행부(120)는 복수의 제1포스팅 리스트(113) 중에서 당해 용어에 대응하는 제1포스팅 리스트(113)를 선택한다(S206).
다음으로, 검색 수행부(120)는 단계 S205에서 생성 또는 단계 S206에서 선택된 제1포스팅 리스트(113)의 위치 정보(P1, P2, …)를 포함하는 제2포스팅 리스트(115)를 추가하고자 하는 문서(111)에 대응시켜 생성한다(S207). 다음으로, 검색 수행부(120)는 문서의 목록(114)에 추가하고자 하는 문서(111)의 항목(d1, d2, …)을 추가한다(S208).
한편, 문서(111)의 변경은, 정보 저장부(110)에 이미 저장되어 있는 해당 문서(111)를 삭제한 후, 변경하고자 하는 문서(111)를 정보 저장부(110)에 새로이 추가함으로써 수행될 수 있다.
본 실시예의 검색 수행부(120)는 컴퓨터프로그램으로 구현될 수 있다. 이 경우 검색 수행부(120)는 컴퓨터프로그램이 저장되는 ROM 및 RAM과, 컴퓨터프로그램 을 실행하는 마이크로프로세서를 포함할 수 있다.
이상, 바람직한 실시예를 통하여 본 발명에 관하여 상세히 설명하였으나, 본 발명은 이에 한정되는 것은 아니며 특허청구범위 내에서 다양하게 실시될 수 있다.
상기한 바와 같이, 본 발명에 의하면, 신속하고 효율적으로 정보의 수정을 수행하는 정보 검색 장치 및 그 제어 방법을 제공할 수 있다.
즉, 종래의 역 인덱스 구조에서 문서를 삭제하기 위해서는, 삭제할 문서 내에 있는 용어를 먼저 추출해야만 하고, 이는 시스템에 많은 오버헤드를 유발시켜 PDA와 같은 휴대용 기기의 성능을 크게 저하시킨다. 그러나, 본 발명에 의하면, 문서의 목록을 통해 삭제하고자 하는 문서를 키워드로 하여 대응하는 포스팅 리스트를 바로 검색하므로, 효율적으로 문서를 삭제할 수 있다.
또한, 저장된 문서 각각에 포함된 용어를 추출하여 메모리에 저장해 두는 경우에 비하여, 포스팅 리스트의 위치 정보만을 유지하므로 메모리 오버헤드도 적다.
또한, 본 발명에 의하면, 문서의 변경은 기존 문서의 삭제 후에 변경된 문서의 추가로 수행되므로, 효율적인 문서의 삭제를 이용하면 문서의 변경도 효율적으로 지원할 수 있다.
또한, 본 발명에 의한 역 인덱스 구조는 다른 역 인덱스 구조와 독립적인 성질을 가지기 때문에 다른 우수한 역 인덱스와 통합이 가능하다. 예컨대, 본 발명에 의한 역 인덱스 구조와 이른바 "서브 인덱스를 이용한 역 인덱스 구조"를 통합하여 검색 성능을 더욱 향상 시킬 수 있다.
또한, 본 발명에 의한 용어의 목록과 문서의 목록에서 사용되는 인덱스 구조는 특정 인덱스 구조에 종속되지 않기 때문에, B+-트리 인덱스 구조뿐 만 아니라 다른 우수한 인덱스 구조를 사용하여 검색 성능을 더욱 향상시킬 수 있다.

Claims (14)

  1. 정보 검색 장치에 있어서,
    적어도 하나의 용어(term)를 포함하는 복수의 문서(document)와, 상기 각 용어마다 마련되어 당해 용어가 포함된 상기 문서의 위치 정보를 포함하는 복수의 제1포스팅 리스트와, 상기 각 문서마다 마련되어 당해 문서에 대응하는 상기 제1포스팅 리스트의 위치 정보를 포함하는 복수의 제2포스팅 리스트가 저장된 정보 저장부와;
    상기 복수의 제2포스팅 리스트 중에서 사용자의 의해 선택된 문서에 대응하는 어느 하나의 제2포스팅 리스트를 선택하고, 상기 선택된 제2포스팅 리스트에 포함된 상기 위치 정보에 기초하여 상기 제1포스팅 리스트를 검색하는 검색 수행부를 포함하는 것을 특징으로 하는 정보 검색 장치.
  2. 제1항에 있어서,
    상기 검색 수행부는 상기 검색된 제1포스팅 리스트에서 상기 선택된 문서의 위치 정보를 삭제하는 것을 특징으로 하는 정보 검색 장치.
  3. 제2항에 있어서,
    상기 검색 수행부는, 상기 검색된 제1포스팅 리스트에 상기 문서의 위치 정보가 더 이상 존재하지 않는 경우, 상기 선택된 제2포스팅 리스트에서 당해 제1포 스팅 리스트의 위치 정보를 삭제하는 것을 특징으로 하는 정보 검색 장치.
  4. 제1항 내지 제3항 중 어느 하나에 있어서,
    상기 정보 저장부에는, 상기 복수의 제1포스팅 리스트 각각에 대응하는 상기 복수의 용어의 목록이 더 저장되며,
    상기 검색 수행부는, 상기 검색된 제1포스팅 리스트에 상기 문서의 위치 정보가 더 이상 존재하지 않는 경우, 상기 복수의 용어의 목록에서 당해 제1포스팅 리스트에 대응하는 용어의 항목을 삭제하는 것을 특징으로 하는 정보 검색 장치.
  5. 제1항 내지 제3항 중 어느 하나에 있어서,
    상기 정보 저장부에는, 상기 복수의 제2포스팅 리스트 각각에 대응하는 상기 복수의 문서의 목록이 더 저장되며,
    상기 검색 수행부는, 상기 문서의 목록에서 상기 선택된 문서의 항목을 삭제하는 것을 특징으로 하는 정보 검색 장치.
  6. 제1항 내지 제3항 중 어느 하나에 있어서,
    상기 검색 수행부는, 신규의 문서에 포함된 적어도 하나의 신규의 용어에 대응하는 신규의 제1포스팅 리스트와, 상기 신규의 제1포스팅 리스트의 위치 정보를 포함하는 신규의 제2포스팅 리스트를 생성하여 상기 정보 저장부에 저장하는 것을 특징으로 하는 정보 검색 장치.
  7. 제6항에 있어서,
    상기 검색 수행부는, 상기 문서의 목록에 상기 신규의 문서의 항목을 추가하는 것을 특징으로 하는 정보 검색 장치.
  8. 적어도 하나의 용어(term)를 포함하는 복수의 문서(document)와, 상기 각 용어마다 마련되어 당해 용어가 포함된 상기 문서의 위치 정보를 포함하는 복수의 제1포스팅 리스트가 저장된 정보 저장부를 구비하는 정보 검색 장치의 제어 방법에 있어서,
    상기 각 문서마다 마련되어 당해 문서에 대응하는 상기 제1포스팅 리스트의 위치 정보를 포함하는 복수의 제2포스팅 리스트를 저장하는 단계와;
    상기 복수의 제2포스팅 리스트 중에서 사용자의 의해 선택된 문서에 대응하는 어느 하나의 제2포스팅 리스트를 선택하는 단계와;
    상기 선택된 제2포스팅 리스트에 포함된 상기 위치 정보에 기초하여 상기 제1포스팅 리스트를 검색하는 단계를 포함하는 것을 특징으로 하는 정보 검색 장치의 제어 방법.
  9. 제8항에 있어서,
    상기 검색된 제1포스팅 리스트에서 상기 선택된 문서의 위치 정보를 삭제하는 단계를 더 포함하는 것을 특징으로 하는 정보 검색 장치의 제어 방법.
  10. 제9항에 있어서,
    상기 검색된 제1포스팅 리스트에 상기 문서의 위치 정보가 더 이상 존재하지 않는 경우, 상기 선택된 제2포스팅 리스트에서 당해 제1포스팅 리스트의 위치 정보를 삭제하는 단계를 더 포함하는 것을 특징으로 하는 정보 검색 장치의 제어 방법.
  11. 제8항 내지 제10항 중 어느 하나에 있어서,
    상기 정보 저장부에는, 상기 복수의 제1포스팅 리스트 각각에 대응하는 상기 복수의 용어의 목록이 더 저장되며,
    상기 검색된 제1포스팅 리스트에 상기 문서의 위치 정보가 더 이상 존재하지 않는 경우, 상기 복수의 용어의 목록에서 당해 제1포스팅 리스트에 대응하는 용어의 항목을 삭제하는 단계를 더 포함하는 것을 특징으로 하는 정보 검색 장치의 제어 방법.
  12. 제8항 내지 제10항 중 어느 하나에 있어서,
    상기 복수의 제2포스팅 리스트 각각에 대응하는 상기 복수의 문서의 목록을 저장하는 단계와,
    상기 문서의 목록에서 상기 선택된 문서의 항목을 삭제하는 단계를 더 포함하는 것을 특징으로 하는 정보 검색 장치의 제어 방법.
  13. 제8항 내지 제10항 중 어느 하나에 있어서,
    신규의 문서에 포함된 적어도 하나의 신규의 용어에 대응하는 신규의 제1포스팅 리스트와, 상기 신규의 제1포스팅 리스트의 위치 정보를 포함하는 신규의 제2포스팅 리스트를 생성하여 저장하는 단계를 더 포함하는 것을 특징으로 하는 정보 검색 장치의 제어 방법.
  14. 제13항에 있어서,
    상기 문서의 목록에 상기 신규의 문서의 항목을 추가하는 단계를 더 포함하는 것을 특징으로 하는 정보 검색 장치의 제어 방법.
KR1020060072333A 2006-07-31 2006-07-31 정보 검색 장치 및 그 제어 방법 KR100811838B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060072333A KR100811838B1 (ko) 2006-07-31 2006-07-31 정보 검색 장치 및 그 제어 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060072333A KR100811838B1 (ko) 2006-07-31 2006-07-31 정보 검색 장치 및 그 제어 방법

Publications (2)

Publication Number Publication Date
KR20080011594A KR20080011594A (ko) 2008-02-05
KR100811838B1 true KR100811838B1 (ko) 2008-03-10

Family

ID=39340098

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060072333A KR100811838B1 (ko) 2006-07-31 2006-07-31 정보 검색 장치 및 그 제어 방법

Country Status (1)

Country Link
KR (1) KR100811838B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101503714B1 (ko) 2008-02-05 2015-03-20 삼성전자주식회사 Gui 제공방법 및 이를 적용한 멀티미디어 기기
KR100920745B1 (ko) * 2008-03-04 2009-10-07 재단법인대구경북과학기술원 질의 처리 방법, 역 리스트 관리 방법, 역 리스트 관리를위한 압축 방법, 및 구문 역 리스트 관리 방법
EP2693346A1 (en) * 2012-07-30 2014-02-05 ExB Asset Management GmbH Resource efficient document search

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990070838A (ko) * 1998-02-25 1999-09-15 윤덕용 데이터 베이스 관리 시스템과 정보 검색의 밀결합을 위하여 서브 인덱스와 대용량 객체를 이용한 역 인덱스 저장 구조
KR20040039691A (ko) * 2002-11-04 2004-05-12 엘지전자 주식회사 정보 검색 시스템의 인덱싱 방법
KR20060048780A (ko) * 2004-07-26 2006-05-18 구글, 인코포레이티드 정보 검색 시스템에서의 문구 기반 인덱싱
KR20060048778A (ko) * 2004-07-26 2006-05-18 구글, 인코포레이티드 정보 검색 시스템에서의 문구 기반 서치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990070838A (ko) * 1998-02-25 1999-09-15 윤덕용 데이터 베이스 관리 시스템과 정보 검색의 밀결합을 위하여 서브 인덱스와 대용량 객체를 이용한 역 인덱스 저장 구조
KR20040039691A (ko) * 2002-11-04 2004-05-12 엘지전자 주식회사 정보 검색 시스템의 인덱싱 방법
KR20060048780A (ko) * 2004-07-26 2006-05-18 구글, 인코포레이티드 정보 검색 시스템에서의 문구 기반 인덱싱
KR20060048778A (ko) * 2004-07-26 2006-05-18 구글, 인코포레이티드 정보 검색 시스템에서의 문구 기반 서치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
논문

Also Published As

Publication number Publication date
KR20080011594A (ko) 2008-02-05

Similar Documents

Publication Publication Date Title
US8825623B2 (en) Fast index with supplemental store
US8224870B1 (en) Data structure for incremental search
JP5437557B2 (ja) 検索処理方法及び検索システム
US9020951B2 (en) Methods for indexing and searching based on language locale
JP4438448B2 (ja) 構造化文書表示処理装置、構造化文書表示方法、構造化文書表示プログラム
US8099416B2 (en) Generalized language independent index storage system and searching method
US20070043714A1 (en) Combined title prefix and full-word content searching
US20080313564A1 (en) System and method for text disambiguation and context designation in incremental search
CN103164408B (zh) 基于垂直搜索引擎的信息存储、查询方法及其装置
CN101099129A (zh) 组织指向对象的指针
US9378304B2 (en) Searchable, mutable data structure
KR100811838B1 (ko) 정보 검색 장치 및 그 제어 방법
US20130159315A1 (en) Methods for prefix indexing
WO2005008527A1 (ja) 動的にカテゴライズされるブックマーク管理装置
CN103220387A (zh) 一种触摸屏手机用搜索方法及装置
CN116150093B (zh) 一种对象存储列举对象的实现方法及电子设备
KR100269114B1 (ko) 캐쉬 운영방법
KR20040039691A (ko) 정보 검색 시스템의 인덱싱 방법
US9020995B2 (en) Hybrid relational, directory, and content query facility
US20100174744A1 (en) Search methods
TWI408564B (zh) 搜尋文件方法及其人機介面裝置
US9323753B2 (en) Method and device for representing digital documents for search applications
US8688668B1 (en) Method and apparatus for improved navigation among search results
JP5530334B2 (ja) 情報検索装置、及び情報検索プログラム
JP2007025831A (ja) コンテンツ検索装置及びその方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130304

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140403

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150303

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160303

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170303

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180305

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20190304

Year of fee payment: 12