KR100899922B1 - 문구 기반 검색 시스템 및 검색 방법과 그 방법을 수행하기위한 프로그램이 기록된 컴퓨터로 판독가능한 기록매체 - Google Patents

문구 기반 검색 시스템 및 검색 방법과 그 방법을 수행하기위한 프로그램이 기록된 컴퓨터로 판독가능한 기록매체 Download PDF

Info

Publication number
KR100899922B1
KR100899922B1 KR20070031099A KR20070031099A KR100899922B1 KR 100899922 B1 KR100899922 B1 KR 100899922B1 KR 20070031099 A KR20070031099 A KR 20070031099A KR 20070031099 A KR20070031099 A KR 20070031099A KR 100899922 B1 KR100899922 B1 KR 100899922B1
Authority
KR
South Korea
Prior art keywords
query
index
word
index word
phrase
Prior art date
Application number
KR20070031099A
Other languages
English (en)
Other versions
KR20080088287A (ko
Inventor
김진희
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR20070031099A priority Critical patent/KR100899922B1/ko
Publication of KR20080088287A publication Critical patent/KR20080088287A/ko
Application granted granted Critical
Publication of KR100899922B1 publication Critical patent/KR100899922B1/ko

Links

Images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computational Linguistics (AREA)

Abstract

사용자가 문구로 된 검색 질의어를 입력하는 경우 문구 질의어 자체가 포함된 검색결과를 제공할 수 있는 본 발명의 일 실시예에 따른 문구 기반 검색 방법은 사용자로부터 입력되는 제1 질의어가 문구 질의어인지를 판단하는 단계; 상기 제1 질의어가 문구 질의어인 경우 상기 제1 질의어에 대한 전처리 과정을 수행하여 제2 질의어를 생성하는 단계; 및 상기 제2 질의어에 대한 검색을 수행하여 상기 제2 질의어에 상응하는 검색결과를 상기 사용자에게 제공하는 단계;를 포함하는 것을 특징으로 한다. 여기서, 제2 질의어를 생성하는 단계는, 사전에 정해진 규칙에 따라 상기 제1 질의어로부터 색인어를 추출하는 단계; 추출된 상기 색인어에 색인어 번호를 지정하는 단계; 추출된 상기 색인어를 상기 색인어 번호와 함께 색인어 리스트에 기록하는 단계; 및 상기 색인어 리스트에 기록된 상기 색인어를 이용해서 제2 질의어를 생성하는 단계;를 포함한다. 따라서, 본 발명에 따르면 사용자가 검색 질의어로 문구를 입력하는 경우 입력된 문구 자체가 포함되어 있는 검색결과를 사용자에게 제공하므로 검색결과의 완전성을 증가시킬 수 있다는 효과가 있다.
Figure R1020070031099
검색, 문구, 질의, 전처리

Description

문구 기반 검색 시스템 및 검색 방법과 그 방법을 수행하기 위한 프로그램이 기록된 컴퓨터로 판독가능한 기록매체{System and Method for Searching based on Phrase and Computer Readable Storage Medium for Storing Program for Carring Out The Method}
도 1은 본 발명의 일 실시예에 따른 문구 기반 검색 시스템이 포함된 네트워크 구성도.
도 2는 입력창에 문구 질의어가 입력되는 것을 보여주는 도면.
도 3은 본 발명의 일 실시예에 따른 문구 기반 검색 방법을 보여주는 플로우차트
도 4는 제1 질의어의 전처리 및 제2 질의어 생성 방법을 보여주는 플로우차트
도 5a 내지 도 5f는 색인어 추출 및 제2 질의어 생성에 대한 예를 보여주는 도면.
<도면의 주요부분에 대한 부호의 설명>
10: 문구 기반 검색 시스템 12: 인터넷
14: 사용자 단말기 16: 질의어 판단부
18: 질의어 전처리부 19: 색인어 추출부
20: 색인어 리스트 21: 제2 질의어 생성부
22: 검색부 24: 검색 데이터베이스
26: 검색결과 제공부 28: 하이라이팅용 질의어 생성부
30: 질의어 입력창
본 발명은 검색 시스템 및 검색 방법에 관한 것으로서, 보다 구체적으로, 사용자가 문구로 된 질의어를 입력하는 경우 그에 상응하는 검색결과를 제공할 수 있는 문구 기반 검색 시스템 및 검색 방법에 관한 것이다.
일반적으로, 인터넷상에 존재하는 수많은 웹사이트들과 웹문서 중 자신이 원하는 정보를 획득하기 위해 사용자는 검색서비스를 제공하는 검색사이트에 접속한 다음 검색사이트에서 제공하는 검색창에 검색 질의어를 입력함으로써 검색을 수행하게 된다. 이때 사용자는 검색창에 자신이 찾고자 하는 정보와 관련된 단어들을 단순 나열식으로 입력하거나, 단어들을 검색 사이트가 지원하는 검색 연산자와 결합하여 입력하게 된다. 예컨대, 사용자가 '그리스 배낭여행 패키지'에 관련된 정보를 찾고자 하는 경우 검색창에 '그리스', '배낭여행', 및 '패키지'를 단순 나열식으로 입력하거나, 불리언 연산자 중 AND 연산자를 사용하여 검색창에 '그리스 and 배낭여행 and 패키지'라는 검색 질의어를 입력하게 되는 것이다.
그러나, 이러한 종래의 검색 방법을 이용하게 되는 경우 사용자가 찾고자 하 는 '그리스 배낭여행 패키지'라는 문구가 포함된 문서 이외에도 단순히 '그리스'와 '배낭여행'과 '패키지'라는 단어가 포함되어 있는 문서들도 함께 검색되어 사용자에게 제공되므로 사용자가 원하지 않는 정보도 사용자에게 제공된다는 문제점이 있다.
이러한 종래기술에 따른 검색방법은 사용자가 입력하는 질의어 내에 포함된 단어들 사이에서의 순서가 중요한 것인 경우 더욱 심각해진다 할 것이다. 예컨대 사용자가 책이나 영화를 검색하기 위해 책속에 포함된 문장의 일부나 영화제목과 같은 질의어를 입력하는 경우, 질의어 내에 포함된 단어들 사이의 순서를 무시한 채 종래와 같이 단순히 질의어 내에 포함된 단어들만이 포함된 문서만을 검색하여 그 결과를 제공한다면 검색결과 중 많은 부분이 질의어와 관련없는 것이어서 사용자는 제공된 검색결과 중에서 원하는 검색결과를 다시 찾아야 한다는 문제점이 있다.
본 발명은 상술한 문제점을 해결하기 위한 것으로서, 사용자가 문구로 된 검색 질의어를 입력하고 상기 문구에 포함된 단어들의 순서가 의미가 있는 것인 경우, 입력된 문구 자체가 포함되어 있는 검색결과를 사용자에게 제공함으로써 검색결과의 완전성을 증가시킬 수 있는 문구 기반 검색 시스템 및 그 방법과 그 방법을 수행하기 위한 프로그램이 기록된 컴퓨터로 판독가능한 기록매체를 제공하는 것을 그 기술적 과제로 한다.
또한 본 발명은 사용자가 입력한 검색 질의어를 전처리 하고 전처리 된 검색 질의어로 실제 검색을 수행함으로써 문구 기반 검색의 효율성을 높일 수 있는 문구 기반 검색 시스템 및 그 방법과 그 방법을 수행하기 위한 프로그램이 기록된 컴퓨터로 판독가능한 기록매체를 제공하는 것을 다른 기술적 과제로 한다.
또한 본 발명은, 사용자가 입력한 검색 질의어의 전처리 과정에서 소정 기준에 따라 WITHIN 연산자와 AND 연산자를 선택적으로 사용하여 전처리 함으로써 검색에 소요되는 시간을 감소시킬 수 있는 문구 기반 검색 시스템 및 그 방법과 그 방법을 수행하기 위한 프로그램이 기록된 컴퓨터로 판독가능한 기록매체를 제공하는 것을 또 다른 기술적 과제로 한다.
또한 본 발명은, 전처리 된 질의어로 실제 검색을 수행함에 있어서 일반적인 검색 시스템에 사용되는 검색 데이터베이스를 그대로 사용함으로써 일반적인 검색 시스템에 용이하게 적용할 수 있는 문구 기반 검색 시스템 및 그 방법과 그 방법을 수행하기 위한 프로그램이 기록된 컴퓨터로 판독가능한 기록매체를 제공하는 것을 또 다른 기술적 과제로 한다.
상술한 목적을 달성하기 위한 본 발명의 일 측면에 따른 문구 기반 검색 방법은 사용자로부터 입력되는 제1 질의어가 문구 질의어인지를 판단하는 단계; 상기 제1 질의어가 문구 질의어인 경우 상기 제1 질의어에 대한 전처리 과정을 수행하여 제2 질의어를 생성하는 단계; 및 상기 제2 질의어에 대한 검색을 수행하여 상기 제2 질의어에 상응하는 검색결과를 상기 사용자에게 제공하는 단계;를 포함하는 것을 특징으로 한다. 여기서, 제2 질의어를 생성하는 단계는, 사전에 정해진 규칙에 따 라 상기 제1 질의어로부터 색인어를 추출하는 단계; 추출된 상기 색인어에 색인어 번호를 지정하는 단계; 추출된 상기 색인어를 상기 색인어 번호와 함께 색인어 리스트에 기록하는 단계; 및 상기 색인어 리스트에 기록된 상기 색인어를 이용해서 제2 질의어를 생성하는 단계;를 포함한다.
추출된 상기 색인어가 복수개인 경우 상기 색인어 번호 지정단계에서는 추출된 상기 각 색인어 내에서 추출의 중심이 되는 단어가 동일한 색인어들에는 동일한 색인어 번호를 지정하고, 상기 색인어 리스트 기록단계에서는 동일한 색인어 번호가 지정된 색인어들의 경우 적어도 하나의 색인어를 선택하여 기록하는 것을 특징으로 한다. 일 실시예에 있어서 동일한 색인어 번호가 지정된 색인어들 중에서 길이가 가장 긴 색인어를 선택하여 상기 색인어 리스트에 기록하거나, 동일한 색인어 번호가 지정된 색인어들 중에서 선택된 상기 색인어가 상기 문구 질의어와 동일한 경우에는 동일한 색인어 번호가 지정된 색인어들 중 가장 긴 색인어를 제외한 나머지 색인어들 중에서 선택하여 상기 색인어 리스트에 기록한다.
상술한 목적을 달성하기 위한 본 발명의 다른 측면에 따른 문구 기반 검색 시스템은 사용자로부터 수신된 제1 질의어가 문구 질의어인지를 판단하는 질의어 판단부; 상기 제1 질의어가 문구 질의어인 경우 상기 제1 질의어를 상기 질의어 판단부로부터 수신하여 상기 제1 질의어에 대해 전처리 과정을 수행한 후 제2 질의어를 생성하는 질의어 전처리부; 상기 질의어 전처리부로부터 생성된 상기 제2 질의어에 대한 검색을 수행하여 상기 제2 질의어에 대한 검색결과를 생성하는 검색부; 및 상기 검색부로부터 제공되는 검색결과를 상기 사용자에게 제공하는 검색결과 제 공부;를 포함하는 것을 특징으로 한다.
여기서, 질의어 전처리부는 소정의 규칙에 의해 상기 제1 질의어로부터 색인어를 추출하고 추출된 색인어에 색인어 번호를 지정하는 색인어 추출부; 상기 색인어 추출부에 의해 추출된 색인어가 색인어 번호와 함께 기록되는 색인어 리스트; 및 상기 색인어 리스트에 기록된 색인어를 이용하여 상기 제2 질의어를 생성하는 제2 질의어 생성부;를 포함한다. 이때, 제1 질의어로부터 복수개의 색인어가 추출되는 경우, 상기 색인어 추출부는 각 색인어 내에서 추출의 중심이 되는 단어가 동일한 색인어들에는 동일한 색인어 번호를 지정하고, 동일한 색인어 번호가 지정된 색인어들의 경우 적어도 하나의 색인어를 선택하여 상기 색인어 리스트에 기록하는데, 동일한 색인어 번호가 지정된 색인어들 중에서 길이가 가장 긴 색인어를 선택하거나, 선택된 상기 색인어가 상기 문구 질의어와 동일한 경우에는 동일한 색인어 번호가 지정된 색인어들 중 가장 긴 색인어를 제외한 나머지 색인어들 중에서 선택하여 상기 색인어 리스트에 기록한다.
이하 첨부되는 도면을 참고하여, 본 발명의 바람직한 실시예를 상세하게 설명한다. 본 발명의 상세한 설명에서 사용되는 '문구'라는 용어는 하나 이상의 단어들이 결합된 것으로 그 결합의 순서에 의미가 있는 것으로 정의하고,'문구 질의어'란 질의어 입력창에 입력되는 질의어가'문구'형태로 입력된 것을 의미한다.
도 1은 본 발명의 일 실시예에 따른 문구 기반 검색 시스템이 포함된 네트워크 구성도의 개략도이다. 도시된 바와 같이 문구 기반 검색 시스템(10)은 인터넷(12)을 통해 사용자 단말기(14a~14n)와 연결되어 사용자 단말기(14a~14n)로부터 사용자에 의해 입력되는 문구 질의어를 수신하고, 수신된 문구 질의어에 해당하는 검색결과를 사용자 단말기(14a~14n)를 통해 사용자에게 전달한다. 이러한 문구 기반 검색 시스템(10)은 질의어 판단부(16), 질의어 전처리부(18), 검색부(22), 검색 데이터베이스(24), 검색결과 제공부(26), 및 하이라이팅용 질의어 생성부(28)를 포함한다.
질의어 판단부(16)는 사용자 단말기(14a~14n)로부터 수신되는 제1 질의어를 분석하여 수신된 제1 질의어가 문구 질의어인지 여부를 판단한다. 먼저, 제1 질의어가 문구 질의어인지 여부를 판단하기 위해 사전에 문구 질의어의 입력 방법이 정의되어야 한다. 일 실시예에 있어서, 문구 질의어는 쌍따옴표(Double Quotation)와 같은 특정기호나 문자로 묶어서 입력하고, 제1 질의어가 문구 질의어인지 여부에 대한 판단은 제1 질의어가 상기 특정기호나 문자에 의해 묶여 있는지 여부로 판단할 수 있다. 예컨대 사용자가 질의어로 longtail search를 입력하기 원하는 경우, 도 2에 도시된 바와 같이 longtail search를 쌍따옴표로 묶어 질의어 입력창(30)에 "longtail search"로 입력하는 것이다. 이러한 실시예에 의한 경우 질의어 판단부(16)는 제1 질의어를 분석하여 제1 질의어가 쌍따옴표로 묶여진 것이라면 문구 질의어인 것으로 판단하게 된다.
비록 상술한 실시예에 있어서는 제1 질의어로 문구 질의어만이 입력되는 것으로 기재하였지만 제1 질의어로 문구 질의어와 일반 질의어(문구 단위로 검색을 수행하지 않아도 되는 질의어를 의미함)가 함께 입력될 수 있고, 이러한 경우 질의어 판단부(16)는 제1 질의어 중 쌍따옴표로 묶여진 질의어는 문구 질의어로 판단하 고, 그렇지 않은 질의어는 일반 질의어로 판단하게 된다.
질의어 전처리부(18)는 제1 질의어가 문구 질의어인 경우 질의어 판단부(16)로부터 제1 질의어를 수신한 후 제1 질의어에 대해 전처리 과정을 수행하여 제2 질의어를 생성하는 것으로서, 이러한 질의어 전처리부(18)는 도 1에 도시된 바와 같이 색인어 추출부(19), 색인어 리스트(20), 및 제2 질의어 생성부(21)를 포함한다.
색인어 추출부(19)는 제1 질의어로부터 제2 질의어 생성에 이용될 색인어를 추출하여 색인어 리스트(20)에 기록한다. 일 실시예에 있어서 색인어 추출부(19)는 일반적인 검색 시스템에서 검색 데이터베이스 형성을 위해 사용되는 'grdy', 'Kgrdy', 또는 'Kqrygrdy'등과 같은 방법을 이용하여 제2 질의어 생성에 이용될 색인어를 추출할 수 있으며, 제1 질의어가 국문인지 영문인지에 따라 또는 질의어로부터 추출될 색인어의 개수에 따라 상술한 색인어 추출 방법들 중 어느 하나가 선택적으로 적용된다. 예컨대, 제1 질의어가 국문이면서 제1질의어로부터 추출될 색인어의 개수가 1개인 경우에는 Kqrygrdy가 적용되고, 제1 질의어가 국문이면서 제1 질의어로부터 추출될 색인어의 개수가 2개 이상인 경우에는 Kgrdy가 적용된다.
이때 색인어는 하나의 색인어가 될 수 있는 음절의 최대 바이트 크기(Maxtermlen) 및 최소 바이트 크기(Mintermlen)에 따라 추출된다. 예컨대, 하나의 색인어가 될 수 있는 최대 바이트 크기가 14이고 최소 바이트 크기가 6으로 설정되어 있다면 추출될 수 있는 색인어의 최대 길이는 14바이트이고 최소 길이는 6바이트가 되는 것이다. 만약 제1 질의어의 전체 길이가 14 바이트 이하인 경우에는 제1 질의어를 분리하여 색인어를 추출할 필요 없이 제1 질의어 자체를 색인어로 추 출한다. 예컨대, 제1 질의어가 "아토피성 질환"인 경우 제1 질의어의 전체 길이가 14바이트 이하이므로 제1 질의어를 분리할 필요 없이 제1 질의어 자체가 색인어로 추출되는 것이다.
추출된 색인어에는 색인어 번호가 지정되는데, 이때 색인어 번호란 하나의 색인어 내에서 추출의 중심이 되는 단어가 제1 질의어 내에서 차지하는 상대적인 위치값으로 정의되며, 추출의 기초가 되는 단어가 동일한 색인어의 경우에는 동일한 색인어 번호가 지정된다. 일 실시예에 있어서, 색인어 번호는 상술한 'grdy', 'Kgrdy', 또는 'Kqrygrdy'등과 같은 색인어 추출방법의 적용시 'Proximity' 옵션을 사용함으로써 지정할 수 있다.
상술한 과정에 의해 추출된 색인어가 1개인 경우에는 추출된 1개의 색인어를 그 번호와 함께 색인어 리스트(20)에 기록하지만, 추출된 색인어가 복수개인 경우에는 복수개의 색인어들 중 일부를 선택하여 그 색인어 번호와 함께 색인어 리스트(20)에 기록한다. 복수개의 색인어들 중에서 색인어 리스트(20) 상에 기록될 색인어를 선택하는 방법에 대해서는 문구 기반 검색 방법의 설명 부분에서 자세히 설명하기로 한다.
제2 질의어 생성부(21)는 색인어 추출부(19)에 의해 추출되어 색인어 리스트(20) 상에 기록된 하나 이상의 색인어를 이용하여 실제 검색에 이용될 제2 질의어를 생성한다. 먼저, 색인어 리스트(20)에 기록된 색인어가 1개인 경우 기록된 1개의 색인어로 제2 질의어를 생성하고, 색인어 리스트(20)에 기록된 색인어가 복수개인 경우 복수개의 색인어를 소정의 검색 연산자를 통해 결합함으로써 제2 질의어 를 생성하게 된다. 이때 사용되는 검색 연산자로는 WITHIN(^n) 연산자 또는 AND(&) 연산자가 사용될 수 있으며, WITHIN(^n) 연산자 또는 AND(&) 연산자 중 어떤 연산자를 사용할 것인지의 여부는 색인어 리스트(20)에 기록되어 있는 색인어들의 개수, 색인어들의 기록 순서, 또는 각 색인어들의 색인어 번호의 차 등에 따라 결정된다.
색인어 리스트(20)에는 색인어 추출부(19)에 의해 추출된 색인어들 중 소정 규칙에 따라 선택된 색인어들이 그 색인어 번호와 함께 기록되되, 각 색인어들은 색인어 번호의 순서에 따라 순차적으로 기록된다.
검색부(22)는 제2 질의어 생성부(21)에 의해 생성된 제2 질의어를 기초로 검색 데이터베이스(24)를 검색하여 제2 질의어에 상응하는 검색결과를 생성하고, 검색결과 제공부(26)는 검색부(22)로부터 제공되는 검색결과를 사용자 단말기(14a~14n)에서 디스플레이될 수 있는 형태로 변환하여 사용자 단말기(14a~14n)로 제공하는 기능을 한다.
일 실시예에 있어서, 검색 데이터베이스(24)는 일반적인 검색 시스템에 포함되는 검색 데이터베이스(24)를 이용한다. 즉, 문구 기반 검색을 수행하기 위하여 별도의 검색 데이터베이스(24)를 구축하지 않고 기존의 검색 시스템에서 사용되고 있는 검색 데이터베이스(24)를 그대로 이용하는 것이다. 이러한 실시예에 의할 때 제2 질의어 생성에 이용되는 색인어들도 일반적인 색인어 추출 방법에 의해 추출된 것이므로 본 발명의 일 실시예에 따른 문구 기반 검색 시스템(10)은 일반적인 검색 시스템에 용이하게 적용될 수 있다.
하이라이팅용 질의어 생성부(28)는 검색결과 제공부(26)에 의해 제공되는 검색결과 내에서 사용자가 입력한 제1 질의어가 하이라이팅되어 디스플레이 되도록 하기 위해 하이라이팅용 질의어를 생성하는 것으로서, 이때 하이라이팅용 질의어는 제2 질의어에서 제2 질의어에 포함되어 있는 검색 연산자를 삭제함으로써 생성된다. 본 실시예에 있어서 이러한 하이라이팅용 질의어 생성부(28)를 별도의 구성요소로서 표시하였지만 이러한 기능은 문구 기반 검색 시스템(10)에 포함된 다른 구성요소들에 의해 수행될 수도 있으며, 하이라이팅 기능은 사용자의 편의를 위해 선택적으로 포함되는 구성요소로서 필요에 따라 문구 기반 검색 시스템(10)에서 제외시킬 수도 있다.
이하에서는 도 1에 도시된 문구 기반 검색 시스템을 이용하여 문구 기반 검색이 수행되는 방법을 도 3 내지 도 5를 참조하여 구체적으로 설명한다.
도 3은 문구 기반 검색이 수행되는 방법을 보여주는 플로우차트이다. 먼저 사용자 단말기(14a~14n)로부터 제1 질의어가 수신되면(제100단계), 제1 질의어를 분석하여 제1 질의어가 문구 질의어인지 여부를 판단한다(제110단계). 제1 질의어가 문구 질의어인지 여부에 대한 판단은 상술한 바와 같이 제1 질의어가 사전에 정해진 특정 기호 또는 문자에 의해 묶여있는지 여부로 판단할 수 있다. 예컨대, 제1 질의어가 쌍따옴표에 의해 묶여 있는 경우 제1 질의어가 문구 질의어인 것으로 판단하는 것이다. 제1 질의어가 문구 질의어가 아닌 일반 질의어인 것으로 판단되는 경우 일반적인 검색방법을 이용하여 제1 질의어를 기초로 검색을 수행한 후 검색결과를 사용자 단말기(14a~14n)를 통해 사용자에게 제공한다(제120단계).
제1 질의어가 문구 질의어인 것으로 판단되는 경우 제1 질의어에 대한 전처리 과정을 수행함으로써 제2 질의어를 생성하고(제130단계), 실제 검색시에는 제2 질의어를 기초로 검색을 수행하여 제2 질의어에 상응하는 검색결과를 사용자 단말기(14a~14n)를 통해 사용자에게 제공하게 된다(제140단계).
도 4는 제1 질의어에 대한 전처리 과정을 수행함으로써 제2 질의어를 생성하는 방법을 상세히 보여주는 플로우차트이다.
먼저, 제1 질의어로부터 색인어를 추출한다(제150단계). 상술한 바와 같이 색인어 추출방법으로는 'grdy', 'Kgrdy', 'Kqrygrdy'등과 같이 일반적인 검색 시스템에서 검색 데이터베이스(24) 형성을 위해 사용되는 색인어 추출 방법이 이용될 수 있다.
이후 추출된 색인어에 대해 색인어 번호를 지정한다(제160단계). 이때 색인어 번호란 하나의 색인어 내에서 추출의 중심이 되는 단어가 제1 질의어 내에서의 차지하는 상대적인 위치값으로 정의되며, 색인어 내에서 추출의 기초가 되는 단어가 동일한 색인어들의 경우에는 동일한 색인어 번호가 지정된다.
제1 질의어로부터 추출된 색인어에 색인어 번호를 지정하는 방법에 대한 예를 도 5a를 참조하여 살펴보면, 먼저 색인어 추출방법으로 "kgrdy"가 이용되었고, 색인어의 최대길이는 14바이트이고, 최소길이는 6바이트로 정해져 있다. 이러한 조건하에서 제1 질의어인 "10대만 들리는 벨소리"로부터 '10대', '10대만', '10대만들리는', '들리는','들리는벨소리', '벨소리' 등의 색인어가 추출될 수 있다. 이때 '10대', '10대만', '10대만들리는'과 같은 색인어의 경우 추출의 중심이 되는 단어 가 '10대'로 동일하기 때문에 동일한 색인어 번호[1]이 지정되고, '들리는','들리는벨소리'와 같은 색인어의 경우 추출의 중심이 되는 단어가 '들리는'으로 동일하기 때문에 동일한 색인어 번호[3]이 지정되며, '벨소리'의 경우에는 색인어 번호[4]가 지정된다.
이러한 방법에 의해 추출된 색인어의 개수를 판단하여(제170단계), 추출된 색인어가 1개인 경우 1개의 색인어를 그 색인어 번호와 함께 색인어 리스트(20)에 기록한 후 기록된 색인어를 이용하여 제2 질의어를 생성한다(제180단계). 제1 질의어로부터 1개의 색인어가 추출되는 예를 도 5b를 통해 구체적으로 살펴보면, 먼저 색인어 추출 방법으로 "Kqrygrdy"를 이용하였고, 추출되는 색인어의 최대길이는 14바이트이며 최소길이는 6바이트로 정해져 있다. 이러한 조건하에서 사용자에 의해 제1 질의어로 "아토피성 질환"이 입력되는 경우 제1 질의어 전체의 길이가 색인어 최대길이인 14바이트보다 작으므로 제1 질의어 자체를 색인어로 추출하여, 제1 질의어와 동일한 '아토피성질환'을 색인어 리스트(20)에 기록하게 된다. 따라서 제2 질의어는 '아토피성질환'이 되는 것이다.
제170단계에서 추출된 색인어가 복수개인 경우 추출된 색인어들 중 적어도 하나의 색인어를 선택하여 색인어 리스트에 기록한다(제190단계). 일 실시예에 있어서, 색인어 리스트에 기록할 색인어들은 색인어 번호마다 각각 하나의 색인어를 선택하되, 하나의 색인어 번호가 복수개의 색인어에 지정되어 있는 경우 복수개의 색인어들 중에서 그 길이가 가장 긴 색인어를 선택한다. 예컨대 도 5a에 도시된 바와 같이 색인어 번호[1]이 지정된 색인어들 중에서 색인어의 길이가 가장 긴 색인 어는 '10대만들리는'이므로 '10대만들리는'이라는 색인어를 선택하여 색인어 번호[1]과 함께 색인어 리스트(20)에 기록하게 된다. 또한 색인어 번호[3]이 지정된 색인어들 중에서는 색인어의 길이가 가장 긴 색인어는 '들리는벨소리'이므로 '들리는벨소리'라는 색인어를 선택하여 색인어 번호[3]과 함께 색인어 리스트(20)에 기록하게 된다. 또한 색인어 번호[4]는 '벨소리'라는 하나의 색인어에만 지정되어 있으므로 '벨소리'라는 색인어를 그 색인어 번호[4]와 함께 색인어 리스트(20)에 기록하게 된다.
그러나, 선택된 색인어가 제1 질의어와 동일한 것인 경우 동일한 색인어 번호가 지정된 색인어들 중에서 두 번째로 길이가 긴 색인어를 선택하여 색인어 리스트(20)에 기록하게 된다. 예컨대 도 5c에 도시된 바와 같이 색인어 번호[1]이 지정된 색인어들 중에서 길이가 가장 긴 색인어는 '세상의중심에서사랑을외치다'이므로 이를 선택하여 색인어 리스트(20)에 기록하여야 하나, 이러한 색인어는 제1 질의어와 동일하므로 색인어 번호[1]이 지정된 색인어들 중에서 두 번째로 길이가 긴 '세상의중심에서'라는 색인어를 선택하여 색인어 리스트(20)에 기록하게 되는 것이다.
다음으로, 색인어 리스트(20) 상에 기록된 색인어들 중 제2 질의어 생성에 필수적이지 않은 색인어들이 존재하는지 여부를 판단하여(제200단계), 그러한 색인어들이 존재하는 경우 색인어 리스트 상에서 제2 질의어 생성에 필수적이지 않은 색인어들을 삭제한다(제210단계). 일 실시예에 있어서 색인어 리스트(20) 상에 기록된 색인어들 중 제2 질의어 생성에 필수적이지 않은 색인어는 '그리고', '또는', and', or'등과 같이 검색 연산자로 인식될 수 있는 색인어 또는 다른 색인어에 포 함되는 색인어를 의미한다. 예컨대, 도 5a에 도시된 바와 같이 색인어 번호[4]가 지정된 색인어인 '벨소리'의 경우 색인어 번호[3]이 지정된 색인어인 '들리는벨소리'에 포함되는 것이므로 색인어 리스트(20) 상에서 삭제하여도 무방한 것이다.
색인어 리스트(20)에 제2 질의어 생성에 필수적이지 않은 색인어가 존재하지 않거나 삭제된 이후, 색인어 리스트(20) 상에 기록된 색인어들과 소정의 검색 연산자를 결합함으로써 실제 검색에 이용될 제2 질의어를 생성한다(제220단계). 일 실시예에 있어서 제2 질의어 생성에 이용되는 검색 연산자로는 'WITHIN(^n)' 연산자가 사용된다. 이때 인접한 글자수 'n'은 색인어 리스트(20)에 기록된 각 색인어들의 색인어 번호의 차이에 의해 결정된다.
예컨대, 도 5d에 도시된 바와 같이 제1 질의어가 "지혜로운 부모가 행복한 아이를 만든다"인 경우 색인어 리스트(20)에는 색인어 번호[1]이 지정된 '지혜로운부모가'라는 색인어와 색인어 번호[2]가 지정된 '부모가행복한'이라는 색인어와 색인어 번호[3]이 지정된 '행복한아이를'이라는 색인어 및 색인어 번호[6]이 지정된 '아이를만든다'라는 색인어가 기록된다. 여기서 '지혜로운부모가'라는 색인어와 '부모가행복한'이라는 색인어의 색인어 번호의 차가 1이므로 인접 글자수 n은 1이고, '부모가행복한'이라는 색인어와 '행복한아이를'이라는 색인어의 색인어 번호의 차가 2이므로 인접 글자수 n은 2이며, '행복한아이를'이라는 색인어와 '아이를만든다'라는 색인어의 색인어 번호의 차가 2이므로 인접 글자수 n은 2이므로, 색인어들을 WITHIN(^n) 연산자를 이용하여 결합하면, '지혜로운부모가 ^1 부모가행복한 ^2 행복한아이를 ^2 아이를만든다'라는 제2 질의어가 생성된다.
상술한 실시예에 있어서는 색인어 리스트(20)에 기록된 모든 색인어들을 WITHIN(^n) 연산자를 이용하여 결합함으로써 제2 연산자를 생성하는 것으로 기재하였지만, 변형된 실시예에 있어서는 색인어 리스트(20)에 기록된 색인어의 수가 소정 개수 이상인 경우 검색에 소요되는 시간을 감소시키기 위해 WITHIN(^n) 연산자와 AND(&) 연산자를 함께 이용할 수도 있다. 예컨대 색인어 리스트(20)에 기록된 색인어가 4개 이하인 경우 모든 색인어들을 WITHIN(^n) 연산자를 이용하여 결합하고, 색인어가 5개 이상인 경우, 색인어 리스트(20)에 기록된 1번째 색인어부터 4번째 색인어까지는 WITHIN(^n)연산자를 이용하여 결합하고, 5번째 색인어부터 8번째 색인어까지는 색인어 번호의 차이가 1이면 WITHIN(^n) 연산자를 사용하여 결합하고, 색인어 번호의 차이가 2이상이면 AND(&) 연산자를 사용하여 결합하며, 9번째 이상의 색인어들은 모두 AND(&) 연산자를 사용하여 결합한다.
예컨대 도 5e에 도시된 바와 같이, 제1 질의어가 "정말 알알하게 내 온몸으로 느낄 수 있는 생의 시간을 자신의 손으로 쥐고 싶었다는 여행을 떠난다"인 경우, 색인어 리스트(20)에 기록된 색인어들을 이용하여 제2 질의어를 생성하면 도시된 바와 같이 '정말알알하게내 ^1 알알하게내온몸 ^1 내온몸으로느낄 ^1 온몸으로느낄수 & 느낄수있는생의 ^1 수있는생의시간 & 생의시간을자신 & 시간을자신의손 & 자신의손으로 & 손으로쥐고 & 쥐고싶었다는 & 싶었다는여행을 & 여행을떠난다'와 같이 된다. 이는 색인어의 개수가 13개로서 5개 이상이므로 WITHIN(^n) 연산자와 AND(&)연산자를 함께 사용해야하는 경우이고, 4번째 색인어까지는 모두 WITHIN(^n) 연산자를 이용하여 결합하여야 하므로 '정말알알하게내'라는 색인어부터 '온몸으로 느낄수'라는 색인어까지는 그 색인어 번호의 차이만큼 인접 글자수를 정의하여 WITHIN(^n) 연산자로 결합하고, 5번째 색인어인 '느길수있는생의'부터 8번째 색인어인 '시간을자신의손' 까지는 색인어 번호의 차이가 1이면 WITHIN(^n) 연산자로써 결합하였고, 색인어 번호의 차이가 2 이상이면 AND(&)연산자를 이용하여 결합하였으며, 9번째 색인어인 '자신의손으로' 이상의 색인어들에 대해서는 모두 AND(&)연산자를 이용하여 결합하였음을 알 수 있다.
또한, 검색에 소요되는 시간을 감소시키기 위해 색인어 리스트(20)에 기록된 모든 색인어들을 이용하여 제2 질의어를 생성하지 않고 색인어 리스트(20)에 기록된 색인어들 중 일부만을 선택하여 제2 질의어를 생성할 수도 있다. 예컨대, 색인어 리스트(20)에 기록된 색인어들 간에 중복되는 부분이 많은 경우, 중복되는 부분이 많은 색인어들을 색인어 리스트(20) 상에서 삭제한 후 제2 질의어를 생성하는 것이다. 이러한 방법을 도 5e에 도시된 예에 적용한 결과가 도 5f에 도시되어 있다. 도시된 바와 같이 색인어 리스트(20)에 기록된 색인어들 중 1번째 색인어와 2번째가 중복되는 부분이 많으므로 2번째 색인어를 색인어 리스트(20)상에서 삭제하고, 3번째 색인어와 4번째가 중복되는 부분이 많으므로 4번째 색인어를 색인어 리스트(20)상에서 삭제하는 것이다. 이러한 방법을 13번째 색인어까지 모두 적용한 뒤 색인어 리스트(20) 상에 기록된 색인어들을 이용하여 제2 질의어를 생성하면 '정말알알하게내 & 내온몸으로느낄 & 느낄수있는생의 & 생의시간을자신 & 자신의손으로 & 쥐고싶었다는 & 여행을떠난다'와 같이 되어 제2 질의어의 길이가 줄어들게 됨을 알 수 있다.
일 실시예에 있어서, 상술한 과정을 통해 색인어들의 개수를 감소시킨 경우, 검색의 완정성을 높이기 위해 색인어들을 모두 AND(&)연산자를 이용하여 결합하지 않고, 소정 개수 까지는 WITHIN(^n) 연산자를 이용하여 결합하고, 그 이후에는 AND(&) 연산자를 이용하여 결합할 수도 있다. 예컨대, 도 5f의 색인어 리스트상에 기록된 색인어들의 경우 '정말알알하게내 ^2 내온몸으로느낄 ^3 느낄수있는생의 ^3 생의시간을자신 & 자신의손으로 & 쥐고싶었다는 & 여행을떠난다'와 같이 4번째 색인어 까지는 WITHIN(^n)연산자를 이용하여 결합하고, 그 이후에는 AND(&)연산자를 이용하여 결합하는 것이다.
한편, 상술한 제2 질의어를 이용하여 검색을 수행한 후 검색결과를 사용자에게 제공하는 과정에서 사용자의 편의를 위해 사용자가 입력한 제1 질의어에 해당하는 부분이 하이라이팅되도록 하여 사용자에게 제공할 수 있다. 이를 위해 하이라이팅용 질의어를 생성하는 것이 필요한데, 하이라이팅용 질의어는 제2 질의어 중 제2 질의어 생성과정에서 삽입된 검색 연산자(WITHIN(^n) 연산자 또는 AND(&) 연산자)를 삭제함으로써 생성된다.
본 발명의 일 실시예에 따른 문구 기반 검색 방법은 다양한 컴퓨터 수단을 이용하여 수행될 수 있는 프로그램 형태로도 구현될 수 있는데, 이때 문구 기반 검색 방법을 수행하기 위한 프로그램은 하드 디스크, CD-ROM, DVD, 롬(ROM), 램, 또는 플래시 메모리와 같은 컴퓨터로 판독할 수 있는 기록 매체에 저장된다.
본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다.
예컨대 상술한 실시예에 있어서는 사용자에 의해 입력되는 제1 질의어 전체를 대상으로 색인어를 추출하는 것으로 기재하였으나, 입력되는 제1 질의어가 소정 글자수나 소정 길이보다 긴 것으로 판단되는 경우 제1 질의어 중 소정 글자수나 소정 길이를 초과하는 부분을 임의로 삭제하는 처리를 수행한 후 색인어를 추출할 수도 있다.
그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
상술한 바와 같이, 본 발명에 따르면 사용자가 검색 질의어로 문구를 입력하고 상기 문구에 포함된 단어들의 순서가 의미가 있는 것인 경우, 입력된 문구 자체가 포함되어 있는 검색결과를 사용자에게 제공하므로 검색결과의 완전성을 증가시킬 수 있다는 효과가 있다.
또한 본 발명에 따르면, 사용자가 입력한 제1 질의어에 대한 전처리 과정을 통해 생성된 제2 질의어를 이용하여 실제 검색을 수행하기 때문에 문구 기반 검색의 효율성을 높일 수 있다는 효과가 있다.
또한 본 발명에 따르면, 제2 질의어 생성시 소정 기준에 따라 WITHIN 연산자 와 AND 연산자를 선택적으로 사용함으로써 입력되는 질의어에 따른 검색에 소요되는 시간을 감소시킬 수 있다는 효과가 있다.
또한 본 발명에 따르면, 일반적인 검색 시스템에 사용되는 검색 데이터베이스를 그대로 사용할 수 있어 본 발명의 문구 기반 검색 시스템을 일반적인 검색 시스템이 용이하게 적용할 수 있다는 효과가 있다.

Claims (22)

  1. 복수개의 어절로 구성된 제1 질의어가 문구 질의어인지를 판단하는 단계;
    상기 제1 질의어가 문구 질의어인 경우 상기 제1 질의어에 대한 전처리 과정을 수행하여 제2 질의어를 생성하는 단계; 및
    상기 제2 질의어에 대한 검색을 수행하여 상기 제2 질의어에 상응하는 검색결과를 사용자에게 제공하는 단계;를 포함하고,
    상기 검색결과에는 상기 제1 질의어가 상기 사용자에 의해 입력된 형태대로 포함되어 있는 것을 특징으로 하는 문구 기반 검색 방법.
  2. 제1항에 있어서 상기 문구 질의어 판단 단계에서 상기 제1 질의어가 문구 질의어인지 여부는 상기 제1 질의어가 사전에 정해진 특정기호나 문자로 묶여 있는지 여부에 의해 판단하는 것을 특징으로 하는 문구 기반 검색 방법.
  3. 제1항에 있어서, 상기 제2 질의어 생성 단계는,
    사전에 정해진 규칙에 따라 상기 제1 질의어로부터 색인어를 추출하는 단계;
    추출된 상기 색인어에 색인어 번호를 지정하는 단계;
    추출된 상기 색인어를 상기 색인어 번호와 함께 색인어 리스트에 기록하는 단계; 및
    상기 색인어 리스트에 기록된 상기 색인어를 이용해서 제2 질의어를 생성하는 단계;
    를 포함하는 것을 특징으로 하는 문구 기반 검색 방법.
  4. 제3항에 있어서, 상기 색인어 추출 단계에서 복수개의 색인어가 추출되는 경우,
    상기 색인어 번호 지정단계에서는 추출된 상기 각 색인어 내에서 추출의 중심이 되는 단어가 동일한 색인어들에는 동일한 색인어 번호를 지정하고,
    상기 색인어 리스트 기록단계에서는 동일한 색인어 번호가 지정된 색인어들의 경우 적어도 하나의 색인어를 선택하여 기록하는 것을 특징으로 하는 문구 기반 검색 방법.
  5. 제4항에 있어서, 동일한 색인어 번호가 지정된 색인어들 중에서 길이가 가장 긴 색인어를 선택하여 상기 색인어 리스트에 기록하는 것을 특징으로 하는 문구 기반 검색 방법.
  6. 제5항에 있어서, 동일한 색인어 번호가 지정된 색인어들 중에서 선택된 상기 색인어가 상기 문구 질의어와 동일한 경우, 동일한 색인어 번호가 지정된 색인어들 중 길이가 가장 긴 색인어를 제외한 나머지 색인어들 중에서 선택하여 상기 색인어 리스트에 기록하는 것을 특징으로 하는 문구 기반 검색 방법.
  7. 제4항에 있어서, 상기 색인어 리스트 상에 기록된 색인어 중 어느 하나가 상 기 색인어 리스트 상에 기록된 다른 색인어에 포함되는 경우 상기 어느 하나의 색인어를 상기 색인어 리스트 상에서 삭제하는 것을 특징으로 하는 문구 기반 검색 방법.
  8. 제4항에 있어서, 상기 선택된 색인어가 검색 연산자로 인식될 수 있는 색인어인 경우 상기 선택된 색인어는 상기 색인어 리스트 상에서 삭제하는 것을 특징으로 하는 문구 기반 검색 방법.
  9. 제4항에 있어서, 상기 제2 질의어 생성단계에서, 상기 색인어 리스트에 기록된 상기 색인어가 복수개인 경우 상기 복수개의 색인어를 WITHIN(^n) 또는 AND(&) 연산자를 이용하여 결합함으로써 상기 제2 질의어를 생성하는 것을 특징으로 하는 문구 기반 검색 방법.
  10. 제9항에 있어서, 검색 연산자로 WITHIN(^n) 연산자가 사용되는 경우 상기 색인어들 사이의 인접 글자수 n은 상기 색인어들의 색인어 번호의 차로 정의되는 것을 특징으로 하는 문구 기반 검색 방법.
  11. 제10항에 있어서, 상기 검색결과의 제공 단계는,
    상기 검색결과 내에서 상기 문구 질의어만을 하이라이팅하기 위해 상기 제2 질의어 중 검색 연산자를 삭제함으로써 하이라이팅용 질의어를 생성하는 단계; 및
    상기 하이라이팅용 질의어에 해당하는 부분이 하이라이팅된 검색결과를 상기 사용자 단말기로 제공하는 단계;
    를 포함하는 것을 특징으로 하는 문구 기반 검색 방법.
  12. 제3항에 있어서, 상기 색인어 추출단계에서, 상기 색인어는 검색이 수행될 검색 데이타베이스 구축을 위해 사용되는 색인어 추출 방법을 이용하여 추출되는 것을 특징으로 하는 문구 기반 검색 방법.
  13. 제1항에 있어서, 상기 문구 질의어의 길이가 사전에 정해진 질의어의 기준 길이보다 긴 것으로 판단되는 경우 상기 문구 질의어 중 일부 문구를 삭제한 후 전처리과정을 수행하는 것을 특징으로 하는 문구 기반 검색 방법.
  14. 제1항 내지 제13항 중 어느 하나의 항에 기재된 방법을 실행하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체.
  15. 복수개의 어절로 구성된 제1 질의어가 문구 질의어인지를 판단하는 질의어 판단부;
    상기 제1 질의어가 문구 질의어인 경우 상기 제1 질의어에 대해 전처리 과정을 수행하여 제2 질의어를 생성하는 질의어 전처리부;
    상기 제2 질의어에 대한 검색을 수행하여 상기 제2 질의어에 대한 검색결과를 생성하는 검색부; 및
    상기 검색결과를 사용자에게 제공하는 검색결과 제공부;를 포함하고,
    상기 검색결과에는 상기 제1 질의어가 상기 사용자에 의해 입력된 형태대로 포함되어 있는 것을 특징으로 하는 문구 기반 검색 시스템.
  16. 제15항에 있어서 상기 질의어 판단부는 상기 제1 질의어가 사전에 정해진 특정기호나 문자로 묶여 있는지 여부로 상기 제1 질의어가 문구 질의어인지를 판단하는 것을 특징으로 하는 문구 기반 검색 시스템.
  17. 제15항에 있어서, 상기 질의어 전처리부는
    소정의 규칙에 의해 상기 제1 질의어로부터 색인어를 추출하고 추출된 색인어에 색인어 번호를 지정하는 색인어 추출부;
    상기 색인어 추출부에 의해 추출된 색인어가 색인어 번호와 함께 기록되는 색인어 리스트; 및
    상기 색인어 리스트에 기록된 색인어를 이용하여 상기 제2 질의어를 생성하는 제2 질의어 생성부;
    를 포함하는 것을 특징으로 하는 문구 기반 검색 시스템.
  18. 제17항에 있어서, 상기 색인어 추출부는 제1 질의어로부터 복수개의 색인어 가 추출되는 경우, 각 색인어 내에서 추출의 중심이 되는 단어가 동일한 색인어들에는 동일한 색인어 번호를 지정하고, 동일한 색인어 번호가 지정된 색인어들의 경우 적어도 하나의 색인어를 선택하여 상기 색인어 리스트에 기록하는 것을 특징으로 하는 문구 기반 검색 시스템.
  19. 제18항에 있어서, 동일한 색인어 번호가 지정된 색인어들 중에서 길이가 가장 긴 색인어를 선택하여 상기 색인어 리스트에 기록하는 것을 특징으로 하는 문구 기반 검색 시스템.
  20. 제19항에 있어서, 동일한 색인어 번호가 지정된 색인어들 중에서 선택된 상기 색인어가 상기 문구 질의어와 동일한 경우 동일한 색인어 번호가 지정된 색인어들 중 길이가 가장 긴 색인어를 제외한 나머지 색인어들 중에서 선택하여 상기 색인어 리스트에 기록하는 것을 특징으로 하는 문구 기반 검색 시스템.
  21. 제18항에 있어서, 상기 제2 질의어 생성부는 상기 색인어 리스트에 기록된 색인어가 1개인 경우 1개의 색인어만으로 상기 제2 질의어를 생성하고, 상기 색인어 리스트에 기록된 색인어가 복수개인 경우 복수개의 색인어를 소정의 검색 연산자를 통해 결합함으로써 상기 제2 질의어를 생성하는 것을 특징으로 하는 문구 기반 검색 시스템.
  22. 제21항에 있어서,
    상기 검색결과 내에서 상기 문구 질의어에 상응하는 부분을 하이라이팅하기 위해 상기 제2 질의어에 삽입된 검색 연산자를 삭제함으로써 하이라이팅용 질의어를 생성하는 하이라이팅용 질의어 생성부를 더 포함하는 것을 특징으로 하는 문구 기반 검색 시스템.
KR20070031099A 2007-03-29 2007-03-29 문구 기반 검색 시스템 및 검색 방법과 그 방법을 수행하기위한 프로그램이 기록된 컴퓨터로 판독가능한 기록매체 KR100899922B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20070031099A KR100899922B1 (ko) 2007-03-29 2007-03-29 문구 기반 검색 시스템 및 검색 방법과 그 방법을 수행하기위한 프로그램이 기록된 컴퓨터로 판독가능한 기록매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20070031099A KR100899922B1 (ko) 2007-03-29 2007-03-29 문구 기반 검색 시스템 및 검색 방법과 그 방법을 수행하기위한 프로그램이 기록된 컴퓨터로 판독가능한 기록매체

Publications (2)

Publication Number Publication Date
KR20080088287A KR20080088287A (ko) 2008-10-02
KR100899922B1 true KR100899922B1 (ko) 2009-05-28

Family

ID=40150589

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20070031099A KR100899922B1 (ko) 2007-03-29 2007-03-29 문구 기반 검색 시스템 및 검색 방법과 그 방법을 수행하기위한 프로그램이 기록된 컴퓨터로 판독가능한 기록매체

Country Status (1)

Country Link
KR (1) KR100899922B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020027088A (ko) * 2000-10-06 2002-04-13 정우성 구문 분석에 의거한 자연어 처리 기술 및 그 응용
JP2004000331A (ja) * 2002-05-31 2004-01-08 Advance Co Ltd 歯科用補綴物の形成方法
KR20060048780A (ko) * 2004-07-26 2006-05-18 구글, 인코포레이티드 정보 검색 시스템에서의 문구 기반 인덱싱
KR20060048778A (ko) * 2004-07-26 2006-05-18 구글, 인코포레이티드 정보 검색 시스템에서의 문구 기반 서치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020027088A (ko) * 2000-10-06 2002-04-13 정우성 구문 분석에 의거한 자연어 처리 기술 및 그 응용
JP2004000331A (ja) * 2002-05-31 2004-01-08 Advance Co Ltd 歯科用補綴物の形成方法
KR20060048780A (ko) * 2004-07-26 2006-05-18 구글, 인코포레이티드 정보 검색 시스템에서의 문구 기반 인덱싱
KR20060048778A (ko) * 2004-07-26 2006-05-18 구글, 인코포레이티드 정보 검색 시스템에서의 문구 기반 서치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
한국산한기술학회논문지 공개일 2004.03.31*

Also Published As

Publication number Publication date
KR20080088287A (ko) 2008-10-02

Similar Documents

Publication Publication Date Title
KR100806936B1 (ko) 자동완성 추천어를 정정하여 노출하는 자동완성 추천어제공 방법 및 시스템
JP5638616B2 (ja) 情報検索方法およびシステム
US9218414B2 (en) System, method, and user interface for a search engine based on multi-document summarization
JP5550669B2 (ja) 検索装置、検索方法およびプログラム
JP2006127509A (ja) 地理的検索機能を提供するシステムおよび方法
EP2643770A2 (en) Text segmentation with multiple granularity levels
US20120323905A1 (en) Ranking data utilizing attributes associated with semantic sub-keys
CN102193903A (zh) 信息处理装置、信息处理方法以及程序
KR102202372B1 (ko) 영상 컨텐츠를 재사용하여 사용자 인터랙션을 인지할 수 있는 인터랙티브 미디어 제작 시스템 및 그 운용방법
US20120317141A1 (en) System and method for ordering of semantic sub-keys
JP5317093B2 (ja) 学習コンテンツ生成装置、学習コンテンツの生成方法、学習コンテンツ生成装置としてコンピュータを機能させるためのプログラム、および当該プログラムを格納したコンピュータ読み取り可能な記録媒体
CN101470701A (zh) 支持基于有限状态机的语义规则的文本分析器及其方法
US20120323904A1 (en) Automatic generation of a search query
JP2012118883A (ja) 翻訳装置、翻訳システム、翻訳方法および翻訳プログラム
KR100899922B1 (ko) 문구 기반 검색 시스템 및 검색 방법과 그 방법을 수행하기위한 프로그램이 기록된 컴퓨터로 판독가능한 기록매체
JP4401269B2 (ja) 対訳判断装置及びプログラム
KR101835994B1 (ko) 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치
US20120317103A1 (en) Ranking data utilizing multiple semantic keys in a search query
JP7180767B2 (ja) 応答処理プログラム、応答処理方法および情報処理装置
US20110041073A1 (en) Key-Based Storage and Retrieval of Information
JP5557469B2 (ja) 文字検索装置、文字検索システム、文字検索方法、入力端末装置、検索サーバおよびプログラム
KR101349969B1 (ko) 추천 질의어 제공 시스템 및 방법
JP2004253011A (ja) 自動要約処理装置および自動要約処理方法
JP2009169513A (ja) 愛称を推定する装置、方法およびプログラム
JPH06348756A (ja) 索引作成装置及び索引利用装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120329

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20190401

Year of fee payment: 11