KR100813806B1 - 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및그를 이용한 정보 검색 시스템 및 그 방법 - Google Patents

중심용어사전을 이용한 표제어의 중심용어 추출 방법 및그를 이용한 정보 검색 시스템 및 그 방법 Download PDF

Info

Publication number
KR100813806B1
KR100813806B1 KR1020010020874A KR20010020874A KR100813806B1 KR 100813806 B1 KR100813806 B1 KR 100813806B1 KR 1020010020874 A KR1020010020874 A KR 1020010020874A KR 20010020874 A KR20010020874 A KR 20010020874A KR 100813806 B1 KR100813806 B1 KR 100813806B1
Authority
KR
South Korea
Prior art keywords
central
term
terminology
word
headword
Prior art date
Application number
KR1020010020874A
Other languages
English (en)
Other versions
KR20010098714A (ko
Inventor
정일형
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Publication of KR20010098714A publication Critical patent/KR20010098714A/ko
Application granted granted Critical
Publication of KR100813806B1 publication Critical patent/KR100813806B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및 그를 이용한 정보 검색 시스템 및 그 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 중심용어사전을 이용하여 표제어의 중심용어를 추출하는 방법, 상기 방법을 이용하여 시스템의 성능을 향상시키고 사용자의 편리성을 높인 정보 검색 시스템 및 그 방법과, 상기 방법들을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체와 상기 중심용어사전의 데이터가 기록된 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 표제어에 대한 중심적 의미를 가지는 용어(이하 "중심용어"라 함)를 찾을 수 있도록 해당 정보를 저장하고 있는 중심용어사전 저장수단; 사용자로부터 질의어를 전달받기 위한 사용자 인터페이싱 수단; 상기 전달받은 질의어에 따라 상기 중심용어사전 저장수단에 저장된 정보를 조회하기 위한 적어도 하나의 표제어를 설정하고, 상기 설정된 표제어를 이용하여 상기 중심용어사전 저장수단을 조회하여 중심용어를 추출하며, 상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보를 검색하기 위한 정보 검색 수단; 및 상기 정보 검색 수단에 의해 검색된 결과를 출력하기 위한 검색 결과 출력 수단을 포함한다.
4. 발명의 중요한 용도
본 발명은 워드프로세서, 전자사전, 오퍼레이팅 시스템, 인터넷 검색 엔진, 형태소 분석 시스템, 자연어 인터페이스 등에 이용됨.
중심용어사전, 표제어의 중심용어, 중심어, 부가어, 정보 검색 시스템

Description

중심용어사전을 이용한 표제어의 중심용어 추출 방법 및 그를 이용한 정보 검색 시스템 및 그 방법{Method and system for retrieving information based meaningful core word}
도 1a 및 도 1b 는 본 발명에 따른 표제어에 대한 중심용어가 등록된 중심용어사전의 구조에 대한 일실시예 설명도.
도 1c 및 도 1d 는 본 발명에 따른 표제어에 대한 중심용어가 등록된 중심용어사전의 구조에 대한 다른 실시예 설명도.
도 1e 는 본 발명에 따른 표제어에 대한 중심용어가 등록된 중심용어사전의 구조에 대한 또 다른 실시예 설명도.
도 2 는 본 발명에 따른 중심용어사전을 이용한 정보 검색 시스템의 일실시예 구성도.
도 3 은 본 발명에 따른 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및 그를 이용한 정보 검색 방법에 대한 일실시예 흐름도.
도 4 는 본 발명에 따른 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및 그를 이용한 정보 검색 방법에 대한 다른 실시예 흐름도.
* 도면의 주요 부분에 대한 부호의 설명
21 : 사용자 인터페이스부 22 : 정보 검색기
23 : 중심용어사전 24 : 결과 출력기
본 발명은 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및 그를 이용한 정보 검색 시스템 및 그 방법에 관한 것으로, 더욱 상세하게는 중심용어사전을 이용하여 표제어의 중심용어(중심어 또는 부가어)를 추출하는 방법, 상기 방법을 이용하여 시스템의 성능을 향상시키고 사용자의 편리성을 높인 정보 검색 시스템 및 그 방법과, 상기 방법들을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체와 상기 중심용어사전의 데이터가 기록된 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
일반적으로 정보검색이라고 불리는 기술은 오래 전부터 도서관의 도서 또는 문헌 정보의 검색을 보다 빠르고 정확하게 그리고 원하는 정보를 쉽게 찾고자 하는 요구에서 시작되었다. 이 요구에 따라 개발된 정보 검색 시스템은 원하는 정보를 찾고자 하는 검색 이용자에게 가장 적합한 정보만을 제공하는 시스템이다. 그런데, 정보의 양이 많아짐에 따라, 실시간에 빠르게 검색을 하기 위하여, 정보 검색 시스템은 각각의 데이터에서 직접 정보를 찾지 않고 데이터를 검색하기 쉬운 형태로 미리 가공하여 저장하는 색인 과정으로 형성된 색인 시스템을 이용하여 검색한다. 이처럼 정보검색은 질의와 색인 그리고 검색의 3가지 과정을 통하여 이루어지는데, 정보를 미리 수집하고 그 내용을 찾기 쉬운 형태로 조작 및 저장하는 과정을 색인 과정이라 하고, 사용자가 정보를 요구하는 과정을 질의 과정이라 하며, 해당 정보를 찾아 제공하는 과정을 검색 과정이라 한다.
이러한 정보검색은 다양한 형태로 서비스될 수 있다. 예를 들어 살펴보면, 컴퓨터 오퍼레이팅 시스템이 하드디스크 및 보조 기억 장치에 저장된 데이터 중에서 특정 화일 및 폴더를 검색하는 경우, 워드프로세서에서 해당 문서 내의 특정 스트링 또는 단어를 검색하는 경우, 전자수첩에서 제공하는 전자사전에서 특정 단어를 찾는 경우, 오프라인 응용소프트웨어로서의 전자사전에서 특정 단어를 찾는 경우, 인터넷 환경에서 운영되는 전자사전 서버 프로그램이 클라이언트에서 요청한 특정 단어와 관련된 정보를 제공해 주는 경우 등이 있을 수 있다.
그런데, 최근에는 컴퓨터에서 이용하는 저장 매체의 용량이 대형화되고, 또한 인터넷의 보급으로 전 세계의 컴퓨터가 하나의 네트워크를 형성하면서 검색대상 정보량이 기하급수적으로 방대해졌다. 따라서 이렇게 방대한 양의 검색 대상 중에서 자신이 원하는 정보만을 보다 쉽고 빠르고 정확하게 찾기가 상당히 어려워지고 있다.
한편, 검색 성능은 재현율과 정확율의 2가지 요소로 측정된다. 재현율이란 시스템이 소장하고 있는 적합 텍스트 가운데 검색된 적합 텍스트의 비율을 말한다. 그리고 정확율이란 검색된 텍스트 가운데 적합 텍스트의 비율을 말한다. 즉, 재현율은 시스템이 적합 텍스트를 검색하는 능력을 나타내며, 정확율은 시스템이 부적합문헌을 검색하지 않는 능력을 나타낸다. 결국 전자는 검색의 완전성을, 후자는 검색의 정확성을 측정하는 것이라고 볼 수 있다.
따라서 가장 완전한 검색 시스템이라면 재현율과 정확율이 각각 100%가 되는 경우이겠으나, 일반적으로 재현율과 정확율은 반비례 관계에 있다. 즉, 높은 재현율을 얻기 위해 질의에 대한 탐색 범위를 확대하면 정확율이 떨어지고, 반대로 정확율을 높이기 위해 탐색 범위를 좁히면 재현율이 떨어지는 상반관계에 있다. 따라서 실제로 재현율과 정확율이 둘 다 높은 경우가 드물기 때문에 정보 검색 시스템마다 이들 두 요소를 동시에 개선시키려는 노력을 하고 있다.
그런데, 최근 인터넷의 출현과 더불어 그 검색 대상이 방대해 짐에 따라서 재현율과 정확율을 파악하기 어렵게 되었다. 인터넷에서처럼 검색 대상 텍스트 수가 많아지면 그 검색 결과도 많아지고, 따라서 그 결과가 전체 검색 대상 중에 얼마나 많은 적합한 텍스트를 검색하였는지를 파악하기가 힘들다. 즉, 질의에 대한 적합한 텍스트임에도 불구하고 검색이 되지 않은 텍스트의 수를 파악하기 불가능하고, 검색된 결과 중에 부적합한 텍스트의 수를 파악하기 위해서는 검색 이용자가 일일이 검사해야 하는 부담이 따른다.
이러한 검색 성능은 색인의 성능과 밀접한 관련이 있다. 색인은 효과적인 정보검색을 위하여 검색 대상인 텍스트 데이터에서 필요한 정보, 즉 색인어를 미리 추출하고 저장하는 것이다. 그리고 정보 검색 시스템은 사용자 질의와 색인과의 비교를 통하여 최적의 텍스트를 사용자에게 제시한다.
색인어 생성 방법은 전문가에 의한 수동 색인과 컴퓨터 프로그램에 의한 자동 색인 방법이 있다. 수동 색인은 자동 색인에 비하여 노동력과 시간이 많이 소모되어 인터넷 상에서의 수많은 텍스트를 색인하기가 현실적으로 어렵고, 또한 색인하는 사람에 따라서 또한 같은 색인자일지라도 색인할 때마다 같은 상황에서 다른 색인어를 선정할 가능성이 높아 그 일관성을 유지하기가 어렵다. 이에 따라서 색인자와 검색 이용자와의 불일치가 발생한다. 자동 색인은 사람을 대신하여 컴퓨터가 색인을 하기 때문에 대량의 텍스트를 고속으로 색인할 뿐만 아니라 시스템이 채택한 자동 색인 방법에 따라서 프로그램이 일관성있는 색인어를 선정하는 장점이 있다. 자동 색인에서는 이러한 장점이 있기는 하지만, 수동 색인에서 제기된 검색 이용자의 검색 질의어와 색인자가 선정한 색인어와의 불일치 문제처럼, 검색 질의어와 색인 프로그램이 선정한 색인어와의 불일치 문제는 여전히 존재한다. 자동 색인 프로그램은 텍스트에서 색인어를 선정하기 때문에 텍스트를 생성한 텍스트 데이터 생성자의 용어 선택의 다양성이 위에서 언급한 자동 색인의 색인어 불일치에 또한 그 원인을 제공한다. 이러한 결점을 없애고 검색 이용자가 같은 검색 질의어를 사용하여 같은 검색 결과를 기대할 수 있도록 하기 위한 자동 색인 방법이 그동안 많이 연구되어 왔다.
한편, 색인의 성능은 두가지 개념, 즉 철저성과 특정성으로 판단된다. 색인의 특정성이란 특정한 개념을 정확히 표현할 수 있는 색인의 능력을 의미한다. 특정성이 높은 색인어일수록 개념의 구체적 표현이 가능하기 때문에 특정 질의에 대한 적합 텍스트를 효과적으로 검색해 낼 수 있다. 따라서 이러한 특정성이 높은 색인어로 구성된 색인 시스템을 이용하는 검색은 그 정확율이 높아지나 재현율이 낮아진다. 색인의 철저성이란 하나의 텍스트가 다루고 있는 개념을 얼마나 많은 색인어로 표현해 주느냐 하는 정도를 의미한다. 텍스트가 다루고 있는 핵심적 개념을 포함하여 주변적 개념까지 모두 색인어로 선택하는 경우에 철저성이 높아지기 때문에 재현율이 높아지는 반면에 주변적 개념을 다룬 텍스트까지 모두 검색되므로 정확율은 낮아진다. 결국 재현율은 색인의 철저성에 좌우되고, 정확율은 색인의 특정성에 따라 좌우된다고 볼 수 있다.
한편, 검색 방법은 색인 방법의 역으로 이루어진다. 일예를 들면, 텍스트에 "정치적(political)"이라는 단어가 포함되어 있는 경우, "정치(politic)"라고 색인을 한다면 검색 시에 질의어 "정치적(political)"으로부터 "정치(politic)"라는 검색어를 생성하여 검색한다. 만약, "정치적(political)"이라고 색인을 한다면 검색 시에 질의어 "정치적(political)"으로부터 "정치적(political)"이라는 검색어를 생성하여 검색한다. 또한, 만약 "정치(politic)"와 "적(al)"이라는 두 개의 스트링으로 색인을 한다면 검색 시에 질의어 "정치적(political)"으로부터 "정치(politic)"와 "적(al)"이라는 두 개의 스트링을 검색어로 생성하여 이 두 개의 스트링이 동시에 존재하는 텍스트를 검색한다. 즉, "정치적(political)"이라고 색인을 하고서 "정치(politic)"라는 검색어를 생성하여 검색한다면 검색에 실패하기 때문이다.
현재 인터넷 상의 수없이 많은 데이터 또는 웹페이지 중에서 사용자가 원하는 정보를 찾아주는 웹 검색 엔진이 수십종에 이른다. 이들은 사용자로부터 질의를 입력받아 이와 가장 근사한 웹문서가 존재하는 위치를 찾아준다. 여기서, 위치란 사용자가 원하는 웹 문서들이 모여있는 디렉토리 또는 패스일 수도 있고(디렉토리 검색, 웹분류 검색), 특정 웹 문서의 인터넷 주소(URL)일 수도 있다(웹페이지 검색).
그런데, 현재까지 알려진 인터넷 검색 시스템들은 모두가 실제로는 검색자가 원하는 정보의 극히 일부분만을 찾아내어 제공함으로써 정보검색의 신뢰도를 저하시키는 문제가 있다. 이는 기존의 검색엔진들이 검색 시에 검색자의 편의성과 검색속도에만 집착하여 공지된 단순한 방법으로 검색 대상을 색인하고 그 색인된 내용과 사용자의 질의어를 비교하여 판단하기 때문에, 이러한 색인 과정과 질의 해석 과정에서 해당 검색 대상의 표현이 조금만 달라지더라도 비교대상에서 제외시키는 결과를 초래한다. 즉, 검색 시스템이 낮은 성능에 머물러 있는 근본적인 이유는 일방적인 정보생산자의 정보 표현과 색인작성자의 색인 표현, 그리고 정보사용자의 질의 표현이 서로 조금씩 다를 수 있기 때문이다.
일예로서, 정보생산자는 그 해당 정보를 "정치가"라고 표현하였고, 색인작성자 및 색인 자동 프로그램이 이를 "정치"라고 색인하였고, 정보 사용자가 "정치인"이라고 질의하였다고 가정하자. 이때, 정보 검색 시스템을 이용하여 사용자 질의인 "정치인"이라고 색인된 정보를 검색할 경우에 "정치"라고 색인된 정보는 제외될 것이다. 또한, 상기의 경우에 "정치가"라고 색인한 경우에도 "정치인"이라는 질의로는 해당 정보가 검색되지 않는다. 이처럼 동일 개념의 용어가 경우에 따라 다양하게 표현되는 점에 기인하여 실질적으로 정보이용자가 원하는 정보가 존재함에도 불구하고 이를 달리 판단하여 해당 정보를 제공하지 못하게 된다. 따라서 이와 같은 방식으로 구현된 종래 검색 시스템들은, 사용자가 "정치"와 관련된 정보를 찾기 위하여 "정치", "정치가", "정치인, "정치적" 등과 같은 관련어들 모두에 대하여 일일이 질의한 경우라야 비로소 해당 질의어와 일치하는 정보들을 제공할 수 있게 되는 사용상의 불편한 문제점과 정보검색의 신뢰도를 저하시키는 문제점을 내포하고 있다.
한편, 다른 예로서, 정보생산자는 그 해당 정보를 "대기업"이라고 표현하였고, 색인작성자 및 색인 자동 프로그램이 이를 "대기"와 "기업"과 "대기업"이라고 색인하였고, 정보 사용자가 "대기"라고 질의하였다고 가정하자. 이때, 정보 검색 시스템을 이용하여 사용자 질의인 "대기"라고 색인된 정보를 검색할 경우에, 상기 "대기"라고 색인된 정보가 검색 결과로 제공될 것이다. 물론, 단어마다의 관념상의 차이를 명확히 인지하고 있는 사람이 수동으로 색인한다면 상기한 바와 같이 "대기업"을 "대기"라고 색인하지는 않을 것이다. 그러나 컴퓨터 프로그램에 의한 자동 색인의 경우에 또는 상기와 같은 색인 결과가 발생할 수 있는 색인 방법을 선택하였을 경우에는 앞에서 예시한 바와 같이 잘못된 검색 결과가 제공되는 문제점이 있다.
이처럼 정보의 생성, 색인 그리고 질의의 다른 표현으로 인한 검색 성능의 저하를 피하기 위하여 기존의 고급형 정보 검색 시스템에서는 색다른 색인 방법과 검색 방법이 사용되기도 하는데, 이러한 정보 검색 시스템에서는 후술하는 바와 같은 다양한 관련 용어들의 표현 정보를 사용하고 있다.
일반적으로, 수집된 표현 정보들은 동의어(의미가 동일한 단어, 예 : 정치가 vs. 정치인), 유사어(스트링은 다르지만 관념적으로 유사한 평면적인 단어, 예 : 대기 vs. 공기, elderly vs. aged vs. retired vs. senior citizens vs. old people vs. golden-agers), 전거어(스트링의 일부분이 다르지만 관념적으로 같은 단어, 예 : 디지틀 vs. 디지털) 그리고 시소러스 등으로 불리운다. 이들 중에서 가장 많은 관계를 포함하는 시소러스는 동의어, 유사어, 확장 개념의 용어인 광의어(예 : 대기 vs. 환경), 축소 개념의 용어인 협의어(예 : 대기 vs. 산소)와 그 이외의 개념들이 포함된 관련어 등이 각 용어의 상호 관계와 관련 용어들로 구성된다.
그러나 이러한 시소러스를 정보 검색 시스템에 사용할 경우에는 사용할 시소러스의 구축 자체가 매우 어렵고, 검색 시에도 너무 많은 용어들의 확장으로 인하여 검색 효율을 현저히 떨어뜨리는 문제가 있어 대부분의 정보 검색 시스템은 이러한 방법을 사용하지 않고 있다. 일예를 들어 살펴보면, 검색 질의어 "신용카드(Credit Card)"의 경우 "카드(Card)"의 유사어인 "트럼프(Trump)"로까지 확장하여서 정확율을 떨어뜨리는 결과를 초래한다. 따라서 설령 시소러스를 사용하는 시스템의 경우라 하더라도 이를 추가적 기능으로 채용하여 검색 결과가 없거나 아주 적은 특정한 경우에만 제한적으로 적용시켜 검색하고 있다.
또 다른 일예를 들어 살펴보면, 검색사용자가 "대기 오염"이라고 질의할 경우에 상기한 바와 같은 시소러스를 허용하는 경우에는 "대기"의 유사어인 "공기", 광의어인 "환경", 협의어인 "산소"로 확장하여 각각 "공기 오염", "환경 오염", "산소 오염" 등과 같이 질의를 상당히 넓게 확장하여 검색함에 따라 검색 효율을 현저히 떨어뜨릴 수 있다. 또한, 앞에서 살펴본 경우처럼 "대기업"을 "대기"로 색인하는 시스템의 경우에는 이러한 시소러스 확장이 그 잘못된 검색 결과를 더욱 증폭시켜 시스템의 검색 성능을 악화시키는 결과를 초래하는 단점이 있다.
한편, 시소러스의 구축에 있어서, 용어의 선정과 그 관계의 설정 그리고 검색에 있어서 사용해야 할 관계의 종류와 그 레벨(또는 수위)의 조절이 이러한 시소러스를 사용하는 정보 검색 시스템의 성능을 좌우하게 되어 정보 검색 시스템의 구축을 곤란하게 하고, 시스템 구축 비용 및 시스템 부하를 증대시키는 요인이 되고 있다.
앞에서 언급한 종래의 방식들이 사용하고 있는 종래 검색 방법의 예를 구체적으로 살펴보면 다음과 같다.
먼저, 언어 지식을 사용하지 않는, 즉 자연어 처리를 하지 않는 단순 스트링 매칭 방법으로는 다음의 두가지 방법이 있다.
첫째, 사용자가 "초고속 인터넷"이라고 질의를 했다고 가정한 경우에, 종래의 검색 방법 중 최장일치만을 검색하는 검색 엔진들은 "초고속"과 "인터넷"이라는 단어가 속한 웹문서만을 검색한다. 즉, 질의어의 표현이 "초고속"과 "고속"으로 다르다 하더라도 "초고속 인터넷"과 "고속 인터넷"의 검색 요구가 거의 동등함이 자명함에도 불구하고, 초고속의 중심어인 "고속"과 "인터넷"이라는 단어가 속한 웹문서를 찾지 못함으로써 그만큼 정보 유실이 존재하게 되는 문제점을 가지고 있다.
둘째, 사용자가 "대기(=air)"라고 질의하였을 경우에, 기존의 검색 방법 중 부분일치를 허용하는 검색 엔진들은 "대기"라는 스트링이 포함된 단어, 즉 "대기업(=a large enterprise)"이 속한 문서를 결과로서 찾아 주게 되는 문제점을 가지고 있다.
상기 두가지 경우와 다르게 일반 사전 그리고 동의어, 유사어, 전거어, 시소러스 등의 언어지식을 사용하여 자연어 처리를 하는 검색 엔진들이 있다. 일반 사전을 사용하는 경우 형태소 분석과 같은 언어처리 과정을 수행하는데 사전에 "대기업"이 표제어로 등록되어 있어서 이를 하나의 질의어로 인식할 뿐 관념적으로 "대기업"의 중심을 이루는 단어인 "기업"이라는 용어에 대한 검색까지는 수행하지 못하는 문제점을 가지고 있다. 결국, 이러한 종래의 검색 엔진을 사용하여 "대기업"이라는 용어로 질의하였을 경우에는 "대기업", "큰기업"이라는 용어를 사용하지 않고 그냥 "기업"이라는 용어만을 사용한 문서 등이 검색되지 않아 중요한 정보의 유실 등으로 인한 검색의 신뢰도를 현저하게 저하시키는 문제점이 있다. 또한, 유사어와 같은 특수 사전 또는 시소러스 등의 언어 정보를 이용하는 경우에는 재현율을 높이는 과정에서 정확률이 떨어지는 역효과가 발생하는 문제점이 있다.
본 발명은 상기 문제점을 해결하기 위하여 안출된 것으로, 중심용어사전을 이용하여 표제어의 중심적 의미를 가지는 용어(중심어 또는 부가어)를 추출하여 표제어를 확장한 후에 검색어에 따라 검색을 수행함으로써, 시스템의 성능을 향상시키고 사용자의 편리성을 높인 정보 검색 시스템 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
또한, 본 발명은, 중심용어사전을 이용하여 표제어의 중심적 의미를 가지는 용어(중심어 또는 부가어)를 추출하여 표제어를 확장한 후에 검색어에 따라 검색을 수행하여 해당 질의에 가장 적합한 우선순으로 검색 결과를 제공함으로써, 시스템의 성능을 향상시키고 사용자의 편리성을 높인 정보 검색 시스템 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 다른 목적이 있다.
또한, 본 발명은, 중심용어사전을 이용하여 표제어의 중심적 의미를 가지는 용어(중심어 또는 부가어)를 추출하는 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 또 다른 목적이 있다.
또한, 본 발명은, 표제어와, 상기 표제어의 종류를 식별하기 위한 식별자와, 상기 표제어의 중심적 의미를 가지는 용어(중심어 또는 부가어)를 포함하는 중심용어사전의 데이터가 기록된 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 또 다른 목적이 있다.
또한, 본 발명은, 중심어인 표제어와 상기 표제어의 중심적 의미를 가지는 부가어를 포함하는 제1 중심용어사전과, 부가어인 표제어와 상기 표제어의 중심적 의미를 가지는 중심어를 포함하는 제2 중심용어사전의 데이터가 서로 연동되어 기록된 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 또 다른 목적이 있다.
또한, 본 발명은, 표제어와 상기 표제어의 중심적 의미를 가지는 용어를 포함하는 중심용어사전의 데이터가 기록된 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 또 다른 목적이 있다.
여기서, 중심어라 함은 하나의 표제어를 구성하는 스트링으로서, 그 스트링의 일부 또는 전부를 포함하며, 그 표제어의 의미의 중심을 이룬다. 그리고 그러한 스트링이 반드시 연속적일 필요는 없다. 표제어 "정치(=politics)", "정치가(=politician)" 그리고 "정치적(=political)"의 중심어는 "정치(=politic)"로서, 그 의미의 중심을 이룬다.
그리고 나머지 "정치가(=politician)"와 "정치적(=political)"은 "정치(=politic)"를 중심어로 하는 부가어가 된다. 이처럼 부가어도 해당 표제어에 대한 중심적 의미를 가지는 단어이다. 예를 들어 표제어가 "정치가(=politician)"라고 하면 중심어는 “정치(=politic)"가 되고, 부가어는 "정치인"과 "정치적(=political)"이 될 수 있어, "정부" 등과 같은 단어를 배제할 수 있다.
다른 예로서 표제어 "요리책(=cookbook)"은 두 개의 단어 "요리(=cook)"와 "책(=book)"으로 형성된 것이다. 따라서 중심어는 이들 중 하나 또는 둘 다가 될 수 있다. 이는 정보 검색 시스템의 성능을 고려하여 중심용어사전을 어떻게 구성할 것인가에 따른 정책의 문제이다. 사용자의 관심을 고려하여 "요리책(=cookbook)"의 중심어는 "요리(=cook)"로 구성하는 것이 일반적이다. "요리(=cook)"와 관련없는 "책(=book)"에 관한 정보보다는 "책(=book)"은 아니지만 "요리(=cook)"와 관련있는 정보에 더 관심이 있을 것으로 판단되기 때문이다. 이와 같은 예로 "레이저프린터" 등이 있을 수 있으며, 여기서는 "프린터"가 중심어가 될 수 있다.
또 다른 예로서 표제어 “영유아"의 경우에 그 중심어는 “영아(infant)”그리고 "유아(baby)"로서 중심어 "영아"의 경우에는 표제어 "영유아"를 구성함에 있어서 비연속적이다. 이와 같은 예로 "청장년기" 등이 있을 수 있으며, 여기서는 "청년기"와 "장년기" 둘 다 중심어가 될 수 있다.
한편, 표제어(사전에 등재된 단어)는 질의어와 다른 개념으로, 표제어가 질의어와 동일할 수도 있으나, 질의어가 자연어 등으로 입력된 경우에는 질의어 중에서 표제어를 선택하여 사용한다. 그리고 표제어는 검색어와도 다른 개념으로, 표제어 자신도 검색어가 될 수 있고, 또한 상기 표제어의 중심적 의미를 가지는 중심어 또는 부가어도 검색어가 될 수 있다.
상기 목적을 달성하기 위한 본 발명의 정보 검색 시스템은, 중심용어사전을 이용한 정보 검색 시스템에 있어서, 표제어에 대한 중심적 의미를 가지는 용어(이하 "중심용어"라 함)를 찾을 수 있도록 해당 정보를 저장하고 있는 중심용어사전 저장수단; 사용자로부터 질의어를 전달받기 위한 사용자 인터페이싱 수단; 상기 전달받은 질의어에 따라 상기 중심용어사전 저장수단에 저장된 정보를 조회하기 위한 적어도 하나의 표제어를 설정하고, 상기 설정된 표제어를 이용하여 상기 중심용어사전 저장수단을 조회하여 중심용어를 추출하며, 상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보를 검색하기 위한 정보 검색 수단; 및 상기 정보 검색 수단에 의해 검색된 결과를 출력하기 위한 검색 결과 출력 수단을 포함한다.
또한, 본 발명의 다른 정보 검색 시스템은, 중심용어사전을 이용한 정보 검색 시스템에 있어서, 표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 해당 정보를 저장하고 있는 중심용어사전 저장수단; 사용자로부터 상기 중심용어사전 저장수단을 이용하여 질의어를 확장할 것인지 여부에 대한 선택 정보와 질의어를 전달받기 위한 사용자 인터페이싱 수단; 상기 전달받은 질의어에 따라 적어도 하나의 표제어를 설정하고, 상기 전달받은 선택 정보가 확장 선택 정보인지 아닌지를 확인하여 확장 선택 정보가 아니면 상기 설정된 표제어를 이용하여 정보 검색을 수행하고, 확장 선택 정보이면 상기 설정된 표제어를 이용하여 상기 중심용어사전 저장수단을 조회하여 중심용어를 추출하며, 상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보를 검색하기 위한 정보 검색 수단; 및 상기 정보 검색 수단에 의해 검색된 결과를 출력하기 위한 검색 결과 출력 수단을 포함한다.
또한, 본 발명의 정보 검색 방법은, 중심용어사전을 이용한 정보 검색 시스템에 적용되는 정보 검색 방법에 있어서, 표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 단계; 사용자로부터 전달받은 질의어에 따라 상기 중심용어사전에 저장된 정보를 조회하기 위한 적어도 하나의 표제어를 설정하는 제 2 단계; 상기 중심용어사전에서 상기 표제어에 대한 중심용어를 추출하여 표제어를 확장하는 제 3 단계; 상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보를 검색하는 제 4 단계; 및 상기 정보 검색 결과를 출력하는 제 5 단계를 포함한다.
또한, 본 발명의 다른 정보 검색 방법은, 중심용어사전을 이용한 정보 검색 시스템에 적용되는 정보 검색 방법에 있어서, 표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 단계; 사용자로부터 상기 중심용어사전을 이용하여 질의어를 확장할 것인지 여부에 대한 선택 정보와 질의어를 전달받는 제 2 단계; 상기 사용자로부터 전달받은 질의어에 따라 적어도 하나의 표제어를 설정하는 제 3 단계; 상기 사용자로부터 전달받은 선택 정보가 상기 중심용어사전을 이용한 확장 선택 정보인지 아닌지를 확인하는 제 4 단계; 상기 제 4 단계의 확인 결과, 확장 선택 정보가 아니면 상기 설정된 표제어를 이용하여 정보 검색을 수행하여 정보 검색 결과를 출력하는 제 5 단계; 및 상기 제 4 단계의 확인 결과, 확장 선택 정보이면 상기 중심용어사전에서 상기 표제어에 대한 중심용어를 추출하여 표제어를 확장한 후에, 상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보를 검색하여 출력하는 제 6 단계를 포함한다.
한편, 상기 또 다른 목적을 달성하기 위한 본 발명의 표제어 중심용어 추출 방법은, 중심용어사전을 이용한 표제어의 중심용어 추출 시스템에 적용되는 표제어의 중심용어 추출 방법에 있어서, 표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 단계; 사용자로부터 전달받은 질의어에 따라 상기 중심용어사전에 저장된 정보를 조회하기 위한 적어도 하나의 표제어를 설정하는 제 2 단계; 및 상기 설정된 표제어를 이용하여 상기 중심용어사전을 조회하여 해당 표제어에 대한 중심적 의미를 가지는 용어를 추출하여 해당 표제어를 확장하는 제 3 단계를 포함한다.
또한, 본 발명의 다른 표제어 중심용어 추출 방법은, 중심용어사전을 이용한 표제어의 중심용어 추출 시스템에 적용되는 표제어의 중심용어 추출 방법에 있어서, 표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 단계; 사용자로부터 상기 중심용어사전을 이용하여 질의어를 확장할 것인지 여부에 대한 선택 정보와 질의어를 전달받는 제 2 단계; 상기 사용자로부터 전달받은 질의어에 따라 적의도 하나의 표제어를 설정하는 제 3 단계; 상기 사용자로부터 전달받은 선택 정보가 상기 중심용어사전을 이용한 확장 선택 정보인지 아닌지를 확인하는 제 4 단계; 상기 제 4 단계의 확인 결과, 확장 선택 정보가 아니면 상기 설정된 표제어를 확장하지 않는 제 5 단계; 및 상기 제 4 단계의 확인 결과, 확장 선택 정보이면 상기 설정된 표제어를 이용하여 상기 중심용어사전을 조회하여 해당 표제어에 대한 중심적 의미를 가지는 용어를 추출하여 해당 표제어를 확장하는 제 6 단계를 포함한다.
한편, 본 발명은, 중심용어사전을 이용하여 정보를 검색하기 위하여, 프로세서를 구비한 정보 검색 시스템에, 표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 기능; 사용자로부터 전달받은 질의어에 따라 상기 중심용어사전에 저장된 정보를 조회하기 위한 적어도 하나의 표제어를 설정하는 제 2 기능; 상기 중심용어사전에서 상기 표제어에 대한 중심용어를 추출하여 표제어를 확장하는 제 3 기능; 상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보를 검색하는 제 4 기능; 및 상기 정보 검색 결과를 출력하는 제 5 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
또한, 본 발명은, 중심용어사전을 이용하여 정보를 검색하기 위하여, 프로세서를 구비한 정보 검색 시스템에, 표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 기능; 사용자로부터 상기 중심용어사전을 이용하여 질의어를 확장할 것인지 여부에 대한 선택 정보와 질의어를 전달받는 제 2 기능; 상기 사용자로부터 전달받은 질의어에 따라 적어도 하나의 표제어를 설정하는 제 3 기능; 상기 사용자로부터 전달받은 선택 정보가 상기 중심용어사전을 이용한 확장 선택 정보인지 아닌지를 확인하는 제 4 기능; 상기 제 4 기능에서의 확인 결과, 확장 선택 정보가 아니면 상기 설정된 표제어를 이용하여 정보 검색을 수행하여 정보 검색 결과를 출력하는 제 5 기능; 및 상기 제 4 기능에서의 확인 결과, 확장 선택 정보이면 상기 중심용어사전에서 상기 표제어에 대한 중심용어를 추출하여 표제어를 확장한 후에, 상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보를 검색하여 출력하는 제 6 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
또한, 본 발명은, 중심용어사전을 이용하여 표제어의 중심용어를 추출하기 위하여, 프로세서를 구비한 표제어의 중심용어 추출 시스템에, 표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 기능; 사용자로부터 전달받은 질의어에 따라 상기 중심용어사전에 저장된 정보를 조회하기 위한 적어도 하나의 표제어를 설정하는 제 2 기능; 및 상기 설정된 표제어를 이용하여 상기 중심용어사전을 조회하여 해당 표제어에 대한 중심적 의미를 가지는 용어를 추출하여 해당 표제어를 확장하는 제 3 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
또한, 본 발명은, 중심용어사전을 이용하여 표제어의 중심용어를 추출하기 위하여, 프로세서를 구비한 표제어의 중심용어 추출 시스템에, 표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 기능; 사용자로부터 상기 중심용어사전을 이용하여 질의어를 확장할 것인지 여부에 대한 선택 정보와 질의어를 전달받는 제 2 기능; 상기 사용자로부터 전달받은 질의어에 따라 적의도 하나의 표제어를 설정하는 제 3 기능; 상기 사용자로부터 전달받은 선택 정보가 상기 중심용어사전을 이용한 확장 선택 정보인지 아닌지를 확인하는 제 4 기능; 상기 제 4 기능에서의 확인 결과, 확장 선택 정보가 아니면 상기 설정된 표제어를 확장하지 않는 제 5 기능; 및 상기 제 4 기능에서의 확인 결과, 확장 선택 정보이면 상기 설정된 표제어를 이용하여 상기 중심용어사전을 조회하여 해당 표제어에 대한 중심적 의미를 가지는 용어를 추출하여 해당 표제어를 확장하는 제 6 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
삭제
삭제
삭제
상기와 같은 본 발명은, 워드프로세서, 전자사전, 오퍼레이팅 시스템, 인터넷 검색 엔진, 형태소 분석시스템, 자연어 인터페이스 등과 같은 모든 환경 및 응용 시스템에서의 검색 방법 및 시스템의 이용 가치를 증대시킬 수 있고, 중심용어사전을 이용하여 표제어의 중심적 의미를 가지는 중심어와 부가어를 제공하여 사용자에게 질의와 관련된 모든 검색 결과를 찾아내고 그 중에서 질의에 가장 적합한 우선순으로 그 결과를 제공할 수 있어, 사용자의 편리성을 크게 향상시킬 수 있다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 1a 및 도 1b 는 본 발명에 따른 표제어에 대한 중심용어가 등록된 중심용어사전의 구조에 대한 일실시예 설명도이다.
도 1a 및 도 1b 에서는 본 발명에 따른 중심용어사전을 하나의 데이터베이스로 구성하고, 각 표제어의 종류를 식별자를 이용하여 구분하여 중심용어사전을 구성하는 방법에 대하여 나타내고 있다.
도면에 도시된 바와 같이, 첫 번째 필드의 표제어 자리에는 중심어 또는 부가어(101,104)를 삽입하고, 두 번째 필드에는 상기 표제어가 중심어인지 또는 부가어인지를 식별할 수 있는 식별자(102,105)를 삽입하며, 세 번째 필드에는 상기 표제어에 대한 중심용어로서, 상기 표제어가 중심어이면 그에 대한 중심적 의미를 가지는 부가어를 삽입하고 상기 표제어가 부가어이면 그에 대한 중심적 의미를 가지는 중심어를 삽입한다(103,106).
즉, 도 1a 에 도시된 바와 같이, 표제어가 중심어이면 첫 번째 필드의 표제어 자리에는 중심어(101)를 삽입하고, 두 번째 필드에는 상기 표제어가 중심어임을 식별할 수 있는 식별자(예:1)(102)를 삽입하며, 세 번째 필드에는 상기 표제어에 대한 중심용어로서 상기 중심어에 대한 중심적 의미를 가지는 부가어를 삽입한다(103).
그리고 도 1b 에 도시된 바와 같이, 표제어가 부가어이면 첫 번째 필드의 표제어 자리에는 부가어(104)를 삽입하고, 두 번째 필드에는 상기 표제어가 부가어임을 식별할 수 있는 식별자(예:2)(105)를 삽입하며, 세 번째 필드에는 상기 표제어에 대한 중심용어로서 상기 부가어에 대한 중심적 의미를 가지는 중심어를 삽입한다(106).
예를 들어, 중심어가 "정치"이고 그에 따른 부가어들이 "정치가", "정치인", "정치적"이라고 할 때, 전술한 바와 같이 하나의 데이터베이스로 구성되는 실시예 를 살펴보면 다음과 같다.
표제어 식별자 중심용어
정치 1 정치가 정치인 정치적
정치가 2 정치
정치인 2 정치
정치적 2 정치

한편, 상술한 바와 같은 중심용어사전의 구조에 대한 일예에서는 하나의 데이터베이스로 중심용어사전을 구현하는 방식에 대하여 설명하고 있으나, 표제어가 중심어인 경우에 상기 중심어에 대한 중심적 의미를 가지는 부가어를 포함하는 제1 데이터베이스와 표제어가 부가어인 경우에 상기 부가어에 대한 중심적 의미를 가지는 중심어를 포함하는 제2 데이터베이스를 따로 구현하여 연동시킬 수도 있다. 단지, 이때에는 데이터베이스가 서로 구분되기 때문에 데이터 구조에 별도의 식별자 필드를 넣지 않아도 된다. 이를 도 1c 및 도 1d 를 참조하여 살펴보면 다음과 같다.
도 1c 및 도 1d 는 본 발명에 따른 표제어에 대한 중심용어가 등록된 중심용어사전의 구조에 대한 다른 실시예 설명도이다.
도 1c 는 표제어가 중심어인 경우의 제1 데이터베이스의 구조도로서, 첫 번째 필드의 표제어 자리에는 중심어(107)를 삽입하고, 두 번째 필드에는 상기 표제어에 대한 중심용어로서 상기 중심어에 대한 중심적 의미를 가지는 부가어를 삽입한다(108).
그리고 도 1d 는 표제어가 부가어인 경우의 제2 데이터베이스의 구조도로서, 첫 번째 필드의 표제어 자리에는 부가어(109)를 삽입하고, 두 번째 필드에는 상기 표제어에 대한 중심용어로서 상기 부가어에 대한 중심적 의미를 가지는 중심어를 삽입한다(110).
예를 들어, 중심어가 "정치"이고 그에 따른 부가어들이 "정치가", "정치인", "정치적"이라고 할 때, 전술한 바와 같이 두 개의 데이터베이스로 구성되는 다른 실시예를 살펴보면, 제1 데이터베이스의 구조는 다음과 같다.
표제어 중심용어
정치 정치가, 정치인, 정치적
그리고 제2 데이터베이스의 구조는 다음과 같다.
표제어 중심용어
정치가 정치
정치인 정치
정치적 정치

한편, 상기 실시예들과 달리 하나의 데이터베이스로 구성하면서도 식별자를 사용하지 않는 방식을 사용할 수도 있다. 대신에 이때에는 표제어에 대한 중심적 의미를 가지는 부가어를 나열해야 한다. 이를 도 1e 를 참조하여 살펴보면 다음과 같다.
도 1e 는 본 발명에 따른 표제어에 대한 중심용어가 등록된 중심용어사전의 구조에 대한 또 다른 실시예 설명도이다.
도 1e 는 식별자없이 하나의 데이터베이스로 구성하는 경우의 구조도로서, 첫 번째 필드의 표제어 자리에는 중심어 또는 부가어(111)를 삽입하고, 두 번째 필드에는 상기 표제어가 중심어인 경우에 상기 표제어에 대한 중심적 의미를 가지는 부가어를 중심용어로서 삽입하고, 상기 표제어가 부가어인 경우에 상기 표제어에 대한 중심적 의미를 가지는 중심어와 부가어들을 중심용어로서 삽입한다(112).
예를 들어, 중심어가 "정치"이고 그에 따른 부가어들이 "정치가", "정치인", "정치적"이라고 할 때, 전술한 바와 같이 식별자없이 하나의 데이터베이스로 구성되는 또 다른 실시예를 살펴보면 다음과 같다.
표제어 중심용어
정치 정치가 정치인 정치적
정치가 정치 정치인 정치적
정치인 정치 정치가 정치적
정치적 정치 정치인 정치가

상기 예들에서 설명한 바와 같이 여러 가지 방법으로 중심용어사전을 구성할 수도 있다. 그러나 본 발명에서 상기와 같은 중심용어사전들을 구성하는 궁극적인 이유는, 표제어에 대한 중심적 의미를 가지는 용어(중심어 또는 부가어)를 찾기 위해서이다.
도 2 는 본 발명에 따른 중심용어사전을 이용한 정보 검색 시스템의 일실시예 구성도이다.
도 2 에 도시된 바와 같이, 본 발명에 따른 정보 검색 시스템은, 표제어와 상기 표제어의 중심적 의미를 가지는 중심어 또는 부가어를 중심용어로서 저장하고 있거나, 표제어와 상기 표제어가 중심어인지 부가어인지를 식별하기 위한 식별자와 상기 표제어의 중심적 의미를 가지는 중심어 또는 부가어를 중심용어로서 저장하고 있는 중심용어사전(23)과, 사용자로부터 질의로서 적어도 하나 이상의 질의어를 입력받기 위한 사용자 인터페이스부(21)와, 사용자로부터 질의로서 입력받은 질의어를 중심용어사전(23)에 접근할 표제어로 설정하고 이 표제어로 중심용어사전(23)에 접근하여 상기 표제어의 중심적 의미를 가지는 용어(중심어 또는 부가어)를 추출하여 표제어를 확장한 후에 상기 설정된 표제어 또는 추출된 중심어 또는 추출된 부가어를 검색어로 하여 검색을 수행하기 위한 정보 검색기(22)와, 상기 정보 검색기(22)에서의 검색 결과를 사용자가 원하는 형태로 보여주기 위한 결과 출력기(24)를 구비한다. 여기서, 사용자로부터 입력받은 질의어로부터 표제어를 설정하는 과정은, 공지의 형태소 분석기 등을 이용하여 질의어를 처리하여 적어도 하나 이상의 표제어를 얻는 공지의 방식을 사용하므로 여기서는 더 이상 상세히 설명하지 않기로 한다.
다음으로, 상기 정보 검색 시스템의 구성 및 동작을 좀 더 상세히 살펴보면 다음과 같다.
본 발명에 따른 정보 검색 시스템은, 표제어와 상기 표제어의 중심적 의미를 가지는 중심어 또는 부가어를 중심용어로서 저장하고 있거나, 표제어와 상기 표제어가 중심어인지 부가어인지를 식별하기 위한 식별자와 상기 표제어의 중심적 의미를 가지는 중심어 또는 부가어를 중심용어로서 저장하고 있는 중심용어사전(23)과, 사용자로부터 질의로서 적어도 하나 이상의 질의어를 입력받기 위한 사용자 인터페이스부(21)와, 사용자로부터 질의로서 입력받은 질의어를 중심용어사전(23)에 접근할 표제어로 설정하고 이 표제어로 중심용어사전(23)에 접근하여 상기 표제어의 중심적 의미를 가지는 용어(중심어 또는 부가어)를 추출하여 표제어를 확장한 후에 상기 설정된 표제어 또는 추출된 중심어 또는 추출된 부가어를 검색어로 하여 검색을 수행하기 위한 정보 검색기(22)와, 확장 전의 검색어(표제어)와 확장 후의 검색어(중심어 또는 부가어)에 가중치를 달리 부여하여, 즉 표제어를 검색어로 하여 검색한 결과와 중심어 또는 부가어를 검색어로 하여 검색한 결과에 가중치를 달리 부여하여 상기 가중치에 따른 우선 순위에 따라 검색 결과를 사용자에게 출력하기 위한 결과 출력기(24)를 포함한다.
그리고 상기 중심용어사전(23)이 식별자를 이용하여 하나의 데이터베이스로 구성된 경우(도 1a 및 도 1b 참조)에 상기 정보 검색기(22)에서의 확장 과정을 좀 더 상세히 살펴보면, 상기 표제어를 중심용어사전(23)에 조회하여 그 식별자를 확인한 결과, 표제어가 중심어이면 상기 표제어의 중심적 의미를 가지는 부가어를 이용하여 표제어를 확장하고, 표제어가 부가어이면 상기 표제어의 중심적 의미를 가지는 중심어를 추출한 후에 상기 추출한 중심어를 표제어로 하여 다시 중심용어사전(23)에 조회하여 추출한 부가어를 이용하여 표제어를 확장한다. 이때, 상기 추출된 중심어도 확장에 이용할 수 있다.
그리고 상기 중심용어사전(23)이 식별자를 이용하지 않고 두 개의 데이터베이스로 구성된 경우(도 1c 및 도 1d 참조)에 상기 정보 검색기(22)에서의 확장 과정을 좀 더 상세히 살펴보면, 상기 표제어를 제1 데이터베이스에 조회하여 해당 표제어가 중심어인지를 확인하여 중심어이면 상기 표제어의 중심적 의미를 가지는 부가어를 이용하여 표제어를 확장하고, 중심어가 아니면 제2 데이터베이스에 조회하여 상기 표제어의 중심적 의미를 가지는 중심어를 추출한 후에 상기 추출한 중심어를 표제어로 하여 다시 상기 제1 데이터베이스에 조회하여 추출한 부가어를 이용하여 표제어를 확장한다.
상기 두 가지 확장 방식에서는 중심어를 질의어로 사용할 수도 있고, 사용하지 않을 수도 있다. 중심어를 질의어로 사용하는 경우에 출력 우선 순위는 표제어를 질의어로 하여 검색된 결과가 최우선이 되고, 중심어를 질의어로 하여 검색된 결과가 다음 순위가 되고, 그외의 부가어로 검색된 결과는 우선 순위없이 출력하는 방식을 사용할 수 있다. 그러나 이는 일예일 뿐이고 실제로는 사용자의 의도에 따라 부가어로 검색된 결과를 중심어로 검색된 결과보다 우선적으로 출력하거나 부가어들로 검색된 결과 간에도 순위를 두어 출력하는 등 다양한 방법이 사용될 수 있다. 그리고 중심어를 질의어로 사용하지 않는 경우에 출력 우선 순위는 표제어를 질의어로 하여 검색된 결과가 최우선이 되고, 그외의 부가어로 검색된 결과는 우선 순위없이 출력하는 방식을 사용할 수 있다. 여기서도 사용자의 의도에 따라 부가어들로 검색된 결과 간에 순위를 두어 출력하는 등의 다양한 방식으로 우선 순위를 달리할 수 있다.
그리고 상기 중심용어사전(23)이 식별자를 이용하지 않고 하나의 데이터베이스로 구성된 경우(도 1e 참조)에 상기 정보 검색기(22)에서의 확장 과정을 좀 더 상세히 살펴보면, 상기 표제어를 중심용어사전(23)에서 조회하여 해당 표제어의 중심적 의미를 가지는 중심어 또는 부가어를 이용하여 표제어를 확장한다. 이 경우에는 중심용어사전(23)을 구성할 때 상기 중심어 또는 부가어에 미리 가중치를 반영하여 구성할 수 있다. 따라서 해당 중심어 또는 부가어로 검색된 결과를 해당 순위로 출력하면 된다.
한편, 전술한 바와 같은 정보 검색 시스템은 정보를 미리 수집하고 그 내용을 찾기 쉬운 형태로 조작 및 저장하는 색인 과정(색인기)을 필요로 한다. 이에 따라 본 발명에서도 전술한 중심용어사전의 개념에 상응하여 색인 데이터베이스를 구성한다. 일예로 정치, 정치가, 정치인 및 정치적 등과 같은 관련어가 들어 있는 정보를 수집한 경우에는 해당 표제어 즉 정치, 정치가, 정치인 및 정치적만을 색인어로서 색인 데이터베이스에 저장한다. 따라서 본 발명의 색인 데이터베이스는 부분 문자열을 모두 색인어로서 색인하는 종래의 색인 데이터베이스에 비하여 그 크기가 현저하게 줄어들게 된다. 또한, 색인어로서 어근만을 색인어로 색인하는 종래의 색인 데이터베이스에 비하여 텍스트의 의미에 충실한 색인이 가능하여 검색 이용자의 요구에 더 적합한 검색 결과를 생성할 수 있다. 그리고 이러한 색인기는 상기 정보 검색기(22)에 포함하여 구성하거나 연동시키는 등의 다양한 방법으로 구성할 수 있다.
도 3 은 본 발명에 따른 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및 그를 이용한 정보 검색 방법에 대한 일실시예 흐름도이다.
도 3 에 도시된 바와 같이, 먼저 사용자 인터페이스부(21)를 통하여 사용자로부터 정보 검색 질의어를 입력받아(301) 질의를 구성하는 적어도 하나 이상의 질의어로부터 중심용어사전(23)에 접근할 표제어를 설정한다(302). 이후에 상기 설정된 표제어로 중심용어사전(23)에 접근하여 상기 표제어의 중심적 의미를 가지는 용어(중심어 또는 부가어)를 추출한다(303). 이후에 상기 추출된 중심용어(중심어 또는 부가어)들을 이용하여 표제어를 확장한다(304). 이후에 상기 설정된 표제어 또는 추출된 중심어 또는 추출된 부가어를 검색어로 하여 정보 검색을 수행한다(305). 그리고 검색 결과를 출력하고(306) 종료한다. 한편, 상기 표제어 확장 과정(304)을 수행한 후에, 표제어가 다수 개인 경우에 사용자에게 확장된 표제어들 중에서 검색어로 사용하고자 하는 표제어를 선택하도록 하는 과정(도면에 도시되지 않음)을 더 수행할 수도 있다. 이는 전술한 시스템에도 동일하게 적용될 수 있다.
상기와 같은 방법을 좀 더 구체적으로 살펴보면 다음과 같다.
먼저, 표제어와 상기 표제어의 중심적 의미를 가지는 중심어 또는 부가어를 중심용어로 설정하여 중심용어사전(하나 이상의 데이터베이스로 구성)을 구성하거나, 또는 표제어와 상기 표제어가 중심어인지 부가어인지를 식별하기 위한 식별자와 상기 표제어의 중심적 의미를 가지는 중심어 또는 부가어를 중심용어로 설정하여 중심용어사전(하나의 데이터베이스로 구성)을 구성거나, 또는 표제어와 상기 표제어의 중심적 의미를 가지는 중심어 또는 부가어를 중심용어로 설정하여 중심용어사전(하나의 데이터베이스로 구성)을 구성한다.
이후, 사용자 인터페이스부(21)가 사용자로부터 적어도 하나 이상의 질의어를 입력받아 정보 검색기(22)로 전달하면(301), 질의어를 전달받은 정보 검색기(22)가 질의어에 따라 중심용어사전(23)에 조회할 표제어를 설정하고(302), 상기 설정된 표제어를 중심용어사전(23)에 조회하여 상기 표제어의 중심적 의미를 가지는 용어(중심어 또는 부가어)를 추출하여(303) 상기 추출된 중심용어(중심어 또는 부가어)를 이용하여 표제어를 확장하며(304), 상기 설정된 표제어 또는 추출된 중심어 또는 추출된 부가어를 검색어로 하여 관련 정보를 검색한다(305). 이후, 결과 출력기(24)가 확장 전의 검색어(표제어)와 확장 후의 검색어(중심어 또는 부가어)에 가중치를 달리 부여하여, 즉 표제어를 검색어로 하여 검색한 결과와 중심 어 또는 부가어를 검색어로 하여 검색한 결과에 가중치를 달리 부여하여 상기 가중치에 따른 우선 순위에 따라 검색 결과를 사용자에게 출력한다(306). 한편, 상기 정보 검색기(22)는 표제어를 확장한 후에, 표제어가 다수 개인 경우에 사용자에게 확장된 표제어들 중에서 검색어로 사용하고자 하는 표제어를 선택하도록 하는 과정(도면에 도시되지 않음)을 더 수행할 수도 있다.
도 4 는 본 발명에 따른 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및 그를 이용한 정보 검색 방법에 대한 다른 실시예 흐름도이다.
먼저, 표제어와 상기 표제어의 중심적 의미를 가지는 중심어 또는 부가어를 중심용어로 설정하여 중심용어사전(하나 이상의 데이터베이스로 구성)을 구성하거나, 또는 표제어와 상기 표제어가 중심어인지 부가어인지를 식별하기 위한 식별자와 상기 표제어의 중심적 의미를 가지는 중심어 또는 부가어를 중심용어로 설정하여 중심용어사전(하나의 데이터베이스로 구성)을 구성거나, 또는 표제어와 상기 표제어의 중심적 의미를 가지는 중심어 또는 부가어를 중심용어로 설정하여 중심용어사전(하나의 데이터베이스로 구성)을 구성한다.
이후, 사용자 인터페이스부(21)가 사용자로부터 검색 질의어와 함께 중심용어사전을 이용하여 질의어를 확장할 것인지 아닌지의 선택 정보를 입력받아 정보 검색기(22)로 전달하면(401) 질의어와 선택 정보를 전달받은 정보 검색기(22)가 질의어에 따라 중심용어사전(23)에 조회할 표제어를 설정하고(402) 전달받은 선택 정보가 중심용어사전을 이용한 확장인지 아닌지를 확인한다(403).
상기 확인 결과, 중심용어사전을 이용한 확장 기능을 사용하기를 원치 않으 면 상기 설정된 현재의 표제어를 이용하여 정보 검색을 수행한 후(406) 그 결과를 출력하고(407) 종료한다.
상기 확인 결과, 중심용어사전을 이용한 확장 기능을 사용하기를 원하면 상기 설정된 표제어를 중심용어사전(23)에 조회하여 상기 표제어의 중심적 의미를 가지는 용어(중심어 또는 부가어)를 추출하여(404) 상기 추출된 중심용어(중심어 또는 부가어)를 이용하여 표제어를 확장하며(405), 상기 설정된 표제어 또는 추출된 중심어 또는 추출된 부가어를 검색어로 하여 관련 정보를 검색한다(406). 이후, 결과 출력기(24)가 확장 전의 검색어(표제어)와 확장 후의 검색어(중심어 또는 부가어)에 가중치를 달리 부여하여, 즉 표제어를 검색어로 하여 검색한 결과와 중심어 또는 부가어를 검색어로 하여 검색한 결과에 가중치를 달리 부여하여 상기 가중치에 따른 우선 순위에 따라 검색 결과를 사용자에게 출력한다(407). 한편, 상기 정보 검색기(22)는 표제어를 확장한 후에(405), 표제어가 다수 개인 경우에 사용자에게 확장된 표제어들 중에서 검색어로 사용하고자 하는 표제어를 선택하도록 하는 과정을 더 수행할 수도 있다(도면에 도시되지 않음).
한편, 상기 다른 실시예에서는 정보 검색 방법에 대해서만 도면을 참조하여 설명하였으나, 이러한 다른 실시예의 정보 검색 시스템도 상기 도 2 에 도시된 정보 검색 시스템과 유사하게 구현할 수 있다. 단지 사용자 인터페이스부(21)의 다음 단에 사용자로부터 전달받은 선택 정보가 중심용어사전을 이용한 확장인지 아닌지를 확인할 수 있는 정보 판정부를 더 구비하면 된다. 이 정보 판정부는 정보 검색기(22) 내에 구현할 수 있다. 그리고 그 전체적인 동작은 도 4 에서 설명한 바와 같다.
한편, 상술한 바와 같은 본 발명에서 설명한 중심용어사전은, 공지의 시소러스 개념, 유사어 개념, 전거어 개념, 자연어 검색 개념 등과 함께 사용 가능하다. 예를 들어, 질의어가 자연어 등으로 입력된 경우에는 질의어 중에서 표제어를 미리 선택한 후에 중심용어사전을 이용하는 방식 등을 사용할 수 있다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다.
이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
상기와 같은 본 발명은, 표제어의 중심용어로서 표제어의 중심적 의미를 가지는 중심어 또는 부가어를 이용함으로써 워드프로세서, 전자사전, 오퍼레이팅 시스템, 인터넷 검색 엔진, 형태소 분석시스템, 자연어 인터페이스 등의 모든 환경 및 응용 시스템에서의 검색 방법 및 검색 시스템의 이용 가치를 증대시킬 수 있고, 사용자의 질의와 관련없는 검색 결과를 배제할 수 있으며, 또한 사용자의 질의와 관련된 것을 모두 검색하여 그 중에서 질의에 가장 적합한 우선순으로 그 결과를 제공할 수 있어, 정보검색의 신뢰도를 크게 향상시킬 수 있을 뿐만 아니라 사용자의 편리성을 크게 향상시킬 수 있는 효과가 있다.
이러한 효과를 구체적인 예를 들어 살펴보면, 본 발명을 적용할 경우에, 중심용어사전에 "대기"는 그 자체가 중심어라는 정보와 "대기업"은 그 중심어가 "기업"이라는 정보를 구성하고, 이를 이용하여 사용자의 "대기"라는 질의에 "대기업"은 검색하지 않으며, "대기업"이라는 질의에 중심어 "기업"과 관련된 정보도 제공할 수 있는 효과가 있다.
또한, 본 발명은 종래의 방법에 비하여 색인 데이터베이스의 크기를 현저하게 줄일 수 있는 효과가 있다.

Claims (57)

  1. 중심용어사전을 이용한 정보 검색 시스템에 있어서,
    표제어에 대한 중심적 의미를 가지는 용어(이하 "중심용어"라 함)를 찾을 수 있도록 해당 정보를 저장하고 있는 중심용어사전 저장수단;
    사용자로부터 질의어를 전달받기 위한 사용자 인터페이싱 수단;
    상기 전달받은 질의어에 따라 상기 중심용어사전 저장수단에 저장된 정보를 조회하기 위한 적어도 하나의 표제어를 설정하고, 상기 설정된 표제어를 이용하여 상기 중심용어사전 저장수단을 조회하여 중심용어를 추출하며, 상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보를 검색하기 위한 정보 검색 수단; 및
    상기 정보 검색 수단에 의해 검색된 결과를 출력하기 위한 검색 결과 출력 수단
    을 포함하는 정보 검색 시스템.
  2. 중심용어사전을 이용한 정보 검색 시스템에 있어서,
    표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 해당 정보를 저장하고 있는 중심용어사전 저장수단;
    사용자로부터 상기 중심용어사전 저장수단을 이용하여 질의어를 확장할 것인지 여부에 대한 선택 정보와 질의어를 전달받기 위한 사용자 인터페이싱 수단;
    상기 전달받은 질의어에 따라 적어도 하나의 표제어를 설정하고, 상기 전달받은 선택 정보가 확장 선택 정보인지 아닌지를 확인하여 확장 선택 정보가 아니면 상기 설정된 표제어를 이용하여 정보 검색을 수행하고, 확장 선택 정보이면 상기 설정된 표제어를 이용하여 상기 중심용어사전 저장수단을 조회하여 중심용어를 추출하며, 상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보를 검색하기 위한 정보 검색 수단; 및
    상기 정보 검색 수단에 의해 검색된 결과를 출력하기 위한 검색 결과 출력 수단
    을 포함하는 정보 검색 시스템.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 정보 검색 수단은,
    상기 추출된 중심용어가 복수개인 경우에, 검색어로 사용하고자 하는 중심용어를 상기 사용자가 선택하도록 하는 기능을 더 수행하는 것을 특징으로 하는 정보 검색 시스템.
  4. 제 1 항 또는 제 2 항에 있어서,
    상기 검색 결과 출력 수단은,
    상기 검색어가 복수개인 경우에, 검색어 별로 가중치를 달리 부여하여 상기 가중치에 의거한 우선 순위에 따라 해당 검색 결과를 출력하는 것을 특징으로 하는 정보 검색 시스템.
  5. 제 1 항 또는 제 2 항에 있어서,
    상기 중심용어사전 저장수단은,
    표제어와 해당 표제어가 중심어인지 부가어인지를 식별하기 위한 식별자와 해당 표제어의 중심적 의미를 가지는 용어를 저장하고 있는 것을 특징으로 하는 정보 검색 시스템.
  6. 제 5 항에 있어서,
    상기 정보 검색 수단은,
    표제어를 상기 중심용어사전 저장수단에 조회하여 해당 식별자를 확인한 결과, 해당 표제어가 중심어이면 해당 표제어의 중심적 의미를 가지는 부가어를 추출하여 해당 표제어를 확장하고, 해당 표제어가 부가어이면 해당 표제어에 대한 중심적 의미를 가지는 중심어를 추출한 후에 상기 추출한 중심어를 표제어로 하여 다시 상기 중심용어사전 저장수단에 조회하여 추출한 부가어를 이용하여 해당 표제어를 확장하는 것을 특징으로 하는 정보 검색 시스템.
  7. 제 5 항에 있어서,
    상기 정보 검색 수단은,
    표제어를 상기 중심용어사전 저장수단에 조회하여 해당 식별자를 확인한 결과, 해당 표제어가 중심어이면 해당 표제어의 중심적 의미를 가지는 부가어를 추출하여 해당 표제어를 확장하고, 해당 표제어가 부가어이면 해당 표제어에 대한 중심적 의미를 가지는 중심어를 추출한 후에 상기 추출된 중심어를 이용하여 해당 표제어를 확장하는 것을 특징으로 하는 정보 검색 시스템.
  8. 제 1 항 또는 제 2 항에 있어서,
    상기 중심용어사전 저장수단은,
    중심어인 표제어와 해당 표제어의 중심적 의미를 가지는 부가어를 저장하고 있는 제1 데이터베이스와, 부가어인 표제어와 해당 표제어의 중심적 의미를 가지는 중심어를 저장하고 있는 제2 데이터베이스를 구비하며, 상기 제1 및 제2 데이터베이스가 연동되는 것을 특징으로 하는 정보 검색 시스템.
  9. 제 8 항에 있어서,
    상기 정보 검색 수단은,
    표제어를 상기 제1 데이터베이스에 조회하여 해당 표제어가 중심어인지를 확인하여 중심어이면 해당 표제어의 중심적 의미를 가지는 부가어를 이용하여 해당 표제어를 확장하고, 중심어가 아니면 상기 제2 데이터베이스에 조회하여 해당 표제어의 중심적 의미를 가지는 중심어를 추출한 후에 상기 추출한 중심어를 표제어로 하여 다시 상기 제1 데이터베이스에 조회하여 추출한 부가어를 이용하여 해당 표제어를 확장하는 것을 특징으로 하는 정보 검색 시스템.
  10. 제 1 항 또는 제 2 항에 있어서,
    상기 중심용어사전 저장수단은,
    표제어와 해당 표제어의 중심적 의미를 가지는 용어를 저장하고 있는 것을 특징으로 하는 정보 검색 시스템.
  11. 제 1 항 또는 제 2 항에 있어서,
    상기 중심용어는,
    표제어에 대한 중심적 의미를 가지는 중심어를 포함하는 것을 특징으로 하는 정보 검색 시스템.
  12. 제 11 항에 있어서,
    상기 중심어는,
    표제어를 구성하는 스트링의 일부 또는 전부 중 어느 하나로 이루어진 것을 특징으로 하는 정보 검색 시스템.
  13. 제 12 항에 있어서,
    상기 중심어는,
    해당 표제어를 구성하는 스트링의 연속적인 스트링으로 이루어진 것을 특징으로 하는 정보 검색 시스템.
  14. 제 12 항에 있어서,
    상기 중심어는,
    해당 표제어를 구성하는 스트링의 불연속적인 스트링으로 이루어진 것을 특징으로 하는 정보 검색 시스템.
  15. 제 1 항 또는 제 2 항에 있어서,
    상기 중심용어는,
    해당 표제어에 대한 중심적 의미를 가지는 부가어를 포함하는 것을 특징으로 하는 정보 검색 시스템.
  16. 제 1 항 또는 제 2 항에 있어서,
    상기 검색어는,
    상기 추출된 표제어와 상기 추출된 표제어의 중심적 의미를 가지는 부가어를 포함하는 것을 특징으로 하는 정보 검색 시스템.
  17. 제 16 항에 있어서,
    상기 검색어는,
    상기 추출된 표제어의 중심적 의미를 가지는 중심어를 더 포함하는 것을 특징으로 하는 정보 검색 시스템.
  18. 중심용어사전을 이용한 정보 검색 시스템에 적용되는 정보 검색 방법에 있어서,
    표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 단계;
    사용자로부터 전달받은 질의어에 따라 상기 중심용어사전에 저장된 정보를 조회하기 위한 적어도 하나의 표제어를 설정하는 제 2 단계;
    상기 중심용어사전에서 상기 표제어에 대한 중심용어를 추출하여 표제어를 확장하는 제 3 단계;
    상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보 를 검색하는 제 4 단계; 및
    상기 정보 검색 결과를 출력하는 제 5 단계
    를 포함하는 정보 검색 방법.
  19. 제 18 항에 있어서,
    상기 검색어가 복수개인 경우에, 검색어 별로 가중치를 정하는 제 6 단계를 더 포함하는 정보 검색 방법.
  20. 제 19 항에 있어서,
    상기 제 5 단계는,
    상기 검색어마다 달리 부여된 상기 가중치에 의거한 우선 순위에 따라 해당 검색 결과를 출력하는 것을 특징으로 하는 정보 검색 방법.
  21. 중심용어사전을 이용한 정보 검색 시스템에 적용되는 정보 검색 방법에 있어서,
    표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 단계;
    사용자로부터 상기 중심용어사전을 이용하여 질의어를 확장할 것인지 여부에 대한 선택 정보와 질의어를 전달받는 제 2 단계;
    상기 사용자로부터 전달받은 질의어에 따라 적어도 하나의 표제어를 설정하는 제 3 단계;
    상기 사용자로부터 전달받은 선택 정보가 상기 중심용어사전을 이용한 확장 선택 정보인지 아닌지를 확인하는 제 4 단계;
    상기 제 4 단계의 확인 결과, 확장 선택 정보가 아니면 상기 설정된 표제어를 이용하여 정보 검색을 수행하여 정보 검색 결과를 출력하는 제 5 단계; 및
    상기 제 4 단계의 확인 결과, 확장 선택 정보이면 상기 중심용어사전에서 상기 표제어에 대한 중심용어를 추출하여 표제어를 확장한 후에, 상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보를 검색하여 출력하는 제 6 단계
    를 포함하는 정보 검색 방법.
  22. 제 21 항에 있어서,
    상기 검색어가 복수개인 경우에, 검색어 별로 가중치를 정하는 제 7 단계를 더 포함하는 정보 검색 방법.
  23. 제 22 항에 있어서,
    상기 제 6 단계는,
    상기 검색어마다 달리 부여된 상기 가중치에 의거한 우선 순위에 따라 해당 검색 결과를 출력하는 것을 특징으로 하는 정보 검색 방법.
  24. 제 18 항 내지 제 23 항 중 어느 한 항에 있어서,
    상기 추출된 중심용어가 복수개인 경우에, 검색어로 사용하고자 하는 중심용어를 상기 사용자가 선택하도록 하는 제 8 단계를 더 포함하는 것을 특징으로 하는 정보 검색 방법.
  25. 제 18 항 내지 제 23 항 중 어느 한 항에 있어서,
    상기 중심용어사전은,
    표제어와 해당 표제어가 중심어인지 부가어인지를 식별하기 위한 식별자와 해당 표제어의 중심적 의미를 가지는 용어를 저장하고 있는 것을 특징으로 하는 정보 검색 방법.
  26. 제 25 항에 있어서,
    상기 중심용어사전에서 상기 표제어에 대한 중심용어를 추출하여 표제어를 확장하는 과정은,
    표제어를 상기 중심용어사전에 조회하여 해당 표제어가 중심어인지 부가어인지를 식별자를 통하여 확인하는 제 8 단계;
    상기 제 8 단계의 확인 결과, 해당 표제어가 중심어이면 해당 표제어에 대한 중심적 의미를 가지는 부가어를 이용하여 표제어를 확장하는 제 9 단계; 및
    상기 제 8 단계의 확인 결과, 해당 표제어가 부가어이면 해당 표제어에 대한 중심적 의미를 가지는 중심어를 추출한 후에 상기 추출한 중심어를 표제어로 하여 다시 상기 중심용어사전에 조회하여 추출한 부가어를 이용하여 해당 표제어를 확장하는 제 10 단계
    를 포함하는 정보 검색 방법.
  27. 제 25 항에 있어서,
    상기 중심용어사전에서 상기 표제어에 대한 중심용어를 추출하여 표제어를 확장하는 과정은,
    표제어를 상기 중심용어사전에 조회하여 해당 표제어가 중심어인지 부가어인지를 식별자를 통하여 확인하는 제 8 단계;
    상기 제 8 단계의 확인 결과, 해당 표제어가 중심어이면 해당 표제어에 대한 중심적 의미를 가지는 부가어를 이용하여 표제어를 확장하는 제 9 단계; 및
    상기 제 8 단계의 확인 결과, 해당 표제어가 부가어이면 해당 표제어에 대한 중심적 의미를 가지는 중심어를 추출한 후에 상기 추출한 중심어를 이용하여 해당 표제어를 확장하는 제 10 단계
    를 포함하는 정보 검색 방법.
  28. 제 18 항 내지 제 23 항 중 어느 한 항에 있어서,
    상기 중심용어사전은,
    제1 데이터베이스에 중심어인 표제어와 해당 표제어의 중심적 의미를 가지는 부가어를 저장하고 있고, 상기 제1 데이터베이스와 연동되는 제2 데이터베이스에 부가어인 표제어와 해당 표제어의 중심적 의미를 가지는 중심어를 저장하고 있는 것을 특징으로 하는 정보 검색 방법.
  29. 제 28 항에 있어서,
    상기 중심용어사전에서 상기 표제어에 대한 중심용어를 추출하여 표제어를 확장하는 과정은,
    표제어를 상기 제1 데이터베이스에 조회하여 해당 표제어가 중심어인지를 확인하는 제 8 단계;
    상기 제 8 단계의 확인 결과, 해당 표제어가 중심어이면 해당 표제어의 중심적 의미를 가지는 부가어를 이용하여 해당 표제어를 확장하는 제 9 단계; 및
    상기 제 8 단계의 확인 결과, 해당 표제어가 중심어가 아니면 상기 제2 데이터베이스에 조회하여 해당 표제어의 중심적 의미를 가지는 중심어를 추출한 후에 상기 추출한 중심어를 표제어로 하여 다시 상기 제1 데이터베이스에 조회하여 추출한 부가어를 이용하여 해당 표제어를 확장하는 제 10 단계
    를 포함하는 정보 검색 방법.
  30. 제 18 항 내지 제 23 항 중 어느 한 항에 있어서,
    상기 중심용어사전은,
    표제어와 해당 표제어의 중심적 의미를 가지는 용어를 저장하고 있는 것을 특징으로 하는 정보 검색 방법.
  31. 제 18 항 내지 제 23 항 중 어느 한 항에 있어서,
    상기 중심용어는,
    표제어에 대한 중심적 의미를 가지는 중심어를 포함하는 것을 특징으로 하는 정보 검색 방법.
  32. 제 31 항에 있어서,
    상기 중심어는,
    표제어를 구성하는 스트링의 일부 또는 전부 중 어느 하나로 이루어진 것을 특징으로 하는 정보 검색 방법.
  33. 제 32 항에 있어서,
    상기 중심어는,
    해당 표제어를 구성하는 스트링의 연속적인 스트링으로 이루어진 것을 특징으로 하는 정보 검색 방법.
  34. 제 32 항에 있어서,
    상기 중심어는,
    해당 표제어를 구성하는 스트링의 불연속적인 스트링으로 이루어진 것을 특징으로 하는 정보 검색 방법.
  35. 제 18 항 내지 제 23 항 중 어느 한 항에 있어서,
    상기 중심용어는,
    해당 표제어에 대한 중심적 의미를 가지는 부가어를 포함하는 것을 특징으로 하는 정보 검색 방법.
  36. 제 18 항 내지 제 23 항 중 어느 한 항에 있어서,
    상기 검색어는,
    상기 추출된 표제어와 상기 추출된 표제어의 중심적 의미를 가지는 부가어를 포함하는 것을 특징으로 하는 정보 검색 방법.
  37. 제 36 항에 있어서,
    상기 검색어는,
    상기 추출된 표제어의 중심적 의미를 가지는 중심어를 더 포함하는 것을 특징으로 하는 정보 검색 방법.
  38. 중심용어사전을 이용한 표제어의 중심용어 추출 시스템에 적용되는 표제어의 중심용어 추출 방법에 있어서,
    표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 단계;
    사용자로부터 전달받은 질의어에 따라 상기 중심용어사전에 저장된 정보를 조회하기 위한 적어도 하나의 표제어를 설정하는 제 2 단계; 및
    상기 설정된 표제어를 이용하여 상기 중심용어사전을 조회하여 해당 표제어에 대한 중심적 의미를 가지는 용어를 추출하여 해당 표제어를 확장하는 제 3 단계
    를 포함하는 표제어의 중심용어 추출 방법.
  39. 중심용어사전을 이용한 표제어의 중심용어 추출 시스템에 적용되는 표제어의 중심용어 추출 방법에 있어서,
    표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 단계;
    사용자로부터 상기 중심용어사전을 이용하여 질의어를 확장할 것인지 여부에 대한 선택 정보와 질의어를 전달받는 제 2 단계;
    상기 사용자로부터 전달받은 질의어에 따라 적의도 하나의 표제어를 설정하는 제 3 단계;
    상기 사용자로부터 전달받은 선택 정보가 상기 중심용어사전을 이용한 확장 선택 정보인지 아닌지를 확인하는 제 4 단계;
    상기 제 4 단계의 확인 결과, 확장 선택 정보가 아니면 상기 설정된 표제어를 확장하지 않는 제 5 단계; 및
    상기 제 4 단계의 확인 결과, 확장 선택 정보이면 상기 설정된 표제어를 이용하여 상기 중심용어사전을 조회하여 해당 표제어에 대한 중심적 의미를 가지는 용어를 추출하여 해당 표제어를 확장하는 제 6 단계
    를 포함하는 표제어의 중심용어 추출 방법.
  40. 제 38 항 또는 제 39 항에 있어서,
    상기 중심용어사전은,
    표제어와 해당 표제어가 중심어인지 부가어인지를 식별하기 위한 식별자와 해당 표제어의 중심적 의미를 가지는 용어를 저장하고 있는 것을 특징으로 하는 표제어의 중심용어 추출 방법.
  41. 제 40 항에 있어서,
    상기 설정된 표제어를 이용하여 상기 중심용어사전을 조회하여 해당 표제어에 대한 중심적 의미를 가지는 용어를 추출하여 해당 표제어를 확장하는 과정은,
    표제어를 상기 중심용어사전에 조회하여 해당 표제어가 중심어인지 부가어인지를 식별자를 통하여 확인하는 제 7 단계;
    상기 제 7 단계의 확인 결과, 표제어가 중심어이면 해당 표제어에 대한 중심적 의미를 가지는 부가어를 이용하여 해당 표제어를 확장하는 제 8 단계; 및
    상기 제 7 단계의 확인 결과, 표제어가 부가어이면 해당 표제어에 대한 중심적 의미를 가지는 중심어를 추출한 후에 상기 추출한 중심어를 표제어로 하여 다시 상기 중심용어사전에 조회하여 추출한 부가어를 이용하여 해당 표제어를 확장하는 제 9 단계
    를 포함하는 표제어의 중심용어 추출 방법.
  42. 제 40 항에 있어서,
    상기 설정된 표제어를 이용하여 상기 중심용어사전을 조회하여 해당 표제어에 대한 중심적 의미를 가지는 용어를 추출하여 해당 표제어를 확장하는 과정은,
    표제어를 상기 중심용어사전에 조회하여 해당 표제어가 중심어인지 부가어인지를 식별자를 통하여 확인하는 제 7 단계;
    상기 제 7 단계의 확인 결과, 표제어가 중심어이면 해당 표제어에 대한 중심적 의미를 가지는 부가어를 이용하여 해당 표제어를 확장하는 제 8 단계; 및
    상기 제 7 단계의 확인 결과, 표제어가 부가어이면 해당 표제어에 대한 중심적 의미를 가지는 중심어를 추출한 후에 상기 추출한 중심어를 이용하여 해당 표제어를 확장하는 제 9 단계
    를 포함하는 표제어의 중심용어 추출 방법.
  43. 제 38 항 또는 제 39 항에 있어서,
    상기 중심용어사전은,
    제1 데이터베이스에 중심어인 표제어와 해당 표제어의 중심적 의미를 가지는 부가어를 저장하고 있고, 상기 제1 데이터베이스와 연동되는 제2 데이터베이스에 부가어인 표제어와 해당 표제어의 중심적 의미를 가지는 중심어를 저장하고 있는 것을 특징으로 하는 표제어의 중심용어 추출 방법.
  44. 제 43 항에 있어서,
    상기 설정된 표제어를 이용하여 상기 중심용어사전을 조회하여 해당 표제어에 대한 중심적 의미를 가지는 용어를 추출하여 해당 표제어를 확장하는 과정은,
    표제어를 상기 제1 데이터베이스에 조회하여 해당 표제어가 중심어인지를 확인하는 제 7 단계;
    상기 제 7 단계의 확인 결과, 표제어가 중심어이면 해당 표제어의 중심적 의미를 가지는 부가어를 이용하여 해당 표제어를 확장하는 제 8 단계; 및
    상기 제 7 단계의 확인 결과, 표제어가 중심어가 아니면 상기 제2 데이터베이스에 조회하여 해당 표제어의 중심적 의미를 가지는 중심어를 추출한 후에 상기 추출한 중심어를 표제어로 하여 다시 상기 제1 데이터베이스에 조회하여 추출한 부가어를 이용하여 해당 표제어를 확장하는 제 9 단계
    를 포함하는 표제어의 중심용어 추출 방법.
  45. 제 38 항 또는 제 39 항에 있어서,
    상기 중심용어사전은,
    표제어와 해당 표제어의 중심적 의미를 가지는 용어를 저장하고 있는 것을 특징으로 하는 표제어의 중심용어 추출 방법.
  46. 제 38 항 또는 제 39 항에 있어서,
    상기 중심용어는,
    표제어에 대한 중심적 의미를 가지는 중심어를 포함하는 것을 특징으로 하는 표제어의 중심용어 추출 방법.
  47. 제 46 항에 있어서,
    상기 중심어는,
    표제어를 구성하는 스트링의 일부 또는 전부 중 어느 하나로 이루어진 것을 특징으로 하는 표제어의 중심용어 추출 방법.
  48. 제 47 항에 있어서,
    상기 중심어는,
    상기 표제어를 구성하는 스트링의 연속적인 스트링으로 이루어진 것을 특징으로 하는 표제어의 중심용어 추출 방법.
  49. 제 47 항에 있어서,
    상기 중심어는,
    상기 표제어를 구성하는 스트링의 불연속적인 스트링으로 이루어진 것을 특징으로 하는 표제어의 중심용어 추출 방법.
  50. 제 38 항 또는 제 39 항에 있어서,
    상기 중심용어는,
    해당 표제어에 대한 중심적 의미를 가지는 부가어를 포함하는 것을 특징으로 하는 표제어의 중심용어 추출 방법.
  51. 중심용어사전을 이용하여 정보를 검색하기 위하여, 프로세서를 구비한 정보 검색 시스템에,
    표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어 사전을 구축하는 제 1 기능;
    사용자로부터 전달받은 질의어에 따라 상기 중심용어사전에 저장된 정보를 조회하기 위한 적어도 하나의 표제어를 설정하는 제 2 기능;
    상기 중심용어사전에서 상기 표제어에 대한 중심용어를 추출하여 표제어를 확장하는 제 3 기능;
    상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보를 검색하는 제 4 기능; 및
    상기 정보 검색 결과를 출력하는 제 5 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  52. 중심용어사전을 이용하여 정보를 검색하기 위하여, 프로세서를 구비한 정보 검색 시스템에,
    표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 기능;
    사용자로부터 상기 중심용어사전을 이용하여 질의어를 확장할 것인지 여부에 대한 선택 정보와 질의어를 전달받는 제 2 기능;
    상기 사용자로부터 전달받은 질의어에 따라 적어도 하나의 표제어를 설정하는 제 3 기능;
    상기 사용자로부터 전달받은 선택 정보가 상기 중심용어사전을 이용한 확장 선택 정보인지 아닌지를 확인하는 제 4 기능;
    상기 제 4 기능에서의 확인 결과, 확장 선택 정보가 아니면 상기 설정된 표제어를 이용하여 정보 검색을 수행하여 정보 검색 결과를 출력하는 제 5 기능; 및
    상기 제 4 기능에서의 확인 결과, 확장 선택 정보이면 상기 중심용어사전에서 상기 표제어에 대한 중심용어를 추출하여 표제어를 확장한 후에, 상기 설정된 표제어와 상기 추출된 중심용어를 검색어로 이용하여 관련 정보를 검색하여 출력하는 제 6 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  53. 중심용어사전을 이용하여 표제어의 중심용어를 추출하기 위하여, 프로세서를 구비한 표제어의 중심용어 추출 시스템에,
    표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 기능;
    사용자로부터 전달받은 질의어에 따라 상기 중심용어사전에 저장된 정보를 조회하기 위한 적어도 하나의 표제어를 설정하는 제 2 기능; 및
    상기 설정된 표제어를 이용하여 상기 중심용어사전을 조회하여 해당 표제어에 대한 중심적 의미를 가지는 용어를 추출하여 해당 표제어를 확장하는 제 3 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  54. 중심용어사전을 이용하여 표제어의 중심용어를 추출하기 위하여, 프로세서를 구비한 표제어의 중심용어 추출 시스템에,
    표제어에 대한 중심적 의미를 가지는 용어를 찾을 수 있도록 상기 중심용어사전을 구축하는 제 1 기능;
    사용자로부터 상기 중심용어사전을 이용하여 질의어를 확장할 것인지 여부에 대한 선택 정보와 질의어를 전달받는 제 2 기능;
    상기 사용자로부터 전달받은 질의어에 따라 적의도 하나의 표제어를 설정하는 제 3 기능;
    상기 사용자로부터 전달받은 선택 정보가 상기 중심용어사전을 이용한 확장 선택 정보인지 아닌지를 확인하는 제 4 기능;
    상기 제 4 기능에서의 확인 결과, 확장 선택 정보가 아니면 상기 설정된 표제어를 확장하지 않는 제 5 기능; 및
    상기 제 4 기능에서의 확인 결과, 확장 선택 정보이면 상기 설정된 표제어를 이용하여 상기 중심용어사전을 조회하여 해당 표제어에 대한 중심적 의미를 가지는 용어를 추출하여 해당 표제어를 확장하는 제 6 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  55. 삭제
  56. 삭제
  57. 삭제
KR1020010020874A 2000-04-18 2001-04-18 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및그를 이용한 정보 검색 시스템 및 그 방법 KR100813806B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020000020398 2000-04-18
KR20000020398 2000-04-18

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020080016877A Division KR20080024172A (ko) 2008-02-25 2008-02-25 중심용어사전의 데이터가 기록된 컴퓨터로 읽을 수 있는기록매체

Publications (2)

Publication Number Publication Date
KR20010098714A KR20010098714A (ko) 2001-11-08
KR100813806B1 true KR100813806B1 (ko) 2008-03-13

Family

ID=19665216

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010020874A KR100813806B1 (ko) 2000-04-18 2001-04-18 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및그를 이용한 정보 검색 시스템 및 그 방법

Country Status (8)

Country Link
US (2) US20030171914A1 (ko)
EP (1) EP1290583A4 (ko)
JP (1) JP2004501424A (ko)
KR (1) KR100813806B1 (ko)
CN (2) CN101051311A (ko)
CA (1) CA2406203A1 (ko)
HK (1) HK1057632A1 (ko)
WO (1) WO2001080077A1 (ko)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030052416A (ko) * 2001-12-21 2003-06-27 윤남규 부동산 거래 싸이트 운영 시스템 및 방법
KR20030094966A (ko) * 2002-06-11 2003-12-18 주식회사 코스모정보통신 통제학습 기반의 문서 자동분류시스템 및 그 방법
US7403939B1 (en) 2003-05-30 2008-07-22 Aol Llc Resolving queries based on automatic determination of requestor geographic location
US20050283473A1 (en) * 2004-06-17 2005-12-22 Armand Rousso Apparatus, method and system of artificial intelligence for data searching applications
US7562069B1 (en) 2004-07-01 2009-07-14 Aol Llc Query disambiguation
CN1315084C (zh) * 2004-07-05 2007-05-09 朱龙安 一种专业化搜索引擎数据搜集方法
US7571157B2 (en) 2004-12-29 2009-08-04 Aol Llc Filtering search results
US7818314B2 (en) 2004-12-29 2010-10-19 Aol Inc. Search fusion
US7272597B2 (en) 2004-12-29 2007-09-18 Aol Llc Domain expert search
US7349896B2 (en) 2004-12-29 2008-03-25 Aol Llc Query routing
US8935269B2 (en) 2006-12-04 2015-01-13 Samsung Electronics Co., Ltd. Method and apparatus for contextual search and query refinement on consumer electronics devices
US8156154B2 (en) * 2007-02-05 2012-04-10 Microsoft Corporation Techniques to manage a taxonomy system for heterogeneous resource domain
US7895197B2 (en) * 2007-04-30 2011-02-22 Sap Ag Hierarchical metadata generator for retrieval systems
WO2009019860A1 (ja) * 2007-08-09 2009-02-12 Panasonic Corporation コンテンツ検索装置
US8938465B2 (en) * 2008-09-10 2015-01-20 Samsung Electronics Co., Ltd. Method and system for utilizing packaged content sources to identify and provide information based on contextual information
CN101770499A (zh) * 2009-01-07 2010-07-07 上海聚力传媒技术有限公司 搜索引擎中的信息检索方法及相应搜索引擎
CN101604324B (zh) * 2009-07-15 2011-11-23 中国科学技术大学 一种基于元搜索的视频服务网站的搜索方法及系统
CN102088635B (zh) * 2009-12-04 2013-04-17 深圳Tcl新技术有限公司 网络电视机记录历史搜索关键字的方法
CN102254039A (zh) * 2011-08-11 2011-11-23 武汉安问科技发展有限责任公司 一种基于搜索引擎的网络搜索方法
US8661049B2 (en) * 2012-07-09 2014-02-25 ZenDesk, Inc. Weight-based stemming for improving search quality
CN103593343B (zh) * 2012-08-13 2019-05-03 北京京东尚科信息技术有限公司 一种电子商务平台中的信息检索方法和装置
CN102929924A (zh) * 2012-09-20 2013-02-13 百度在线网络技术(北京)有限公司 一种基于浏览内容的取词搜索结果生成方法及装置
CN104182432A (zh) * 2013-05-28 2014-12-03 天津点康科技有限公司 基于人体生理参数检测结果的信息检索与发布系统及方法
US11170425B2 (en) * 2014-03-27 2021-11-09 Bce Inc. Methods of augmenting search engines for eCommerce information retrieval
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
CN105528441A (zh) * 2015-12-22 2016-04-27 北京奇虎科技有限公司 基于自动标注的中心词提取方法和装置
WO2017117806A1 (zh) * 2016-01-08 2017-07-13 马岩 网络信息的搜词方法及系统
US10810256B1 (en) * 2017-06-19 2020-10-20 Amazon Technologies, Inc. Per-user search strategies
US11748563B2 (en) 2018-07-30 2023-09-05 Entigenlogic Llc Identifying utilization of intellectual property
US11720558B2 (en) 2018-07-30 2023-08-08 Entigenlogic Llc Generating a timely response to a query
US11176126B2 (en) * 2018-07-30 2021-11-16 Entigenlogic Llc Generating a reliable response to a query
CN109088195B (zh) * 2018-08-03 2023-09-15 昆山杰顺通精密组件有限公司 二合一usb连接器
JP7231190B2 (ja) * 2018-11-02 2023-03-01 株式会社ユニバーサルエンターテインメント 情報提供システム、及び、情報提供制御方法
US11429655B2 (en) * 2019-12-03 2022-08-30 Sap Se Iterative ontology learning
CN111723162B (zh) * 2020-06-19 2023-08-25 北京小鹏汽车有限公司 词典处理方法、处理装置、服务器和语音交互系统
CN112445895B (zh) * 2020-11-16 2024-04-19 深圳市世强元件网络有限公司 一种识别用户搜索场景的方法及系统
CN112580336A (zh) * 2020-12-25 2021-03-30 深圳壹账通创配科技有限公司 信息校准检索方法、装置、计算机设备及可读存储介质
CN114040012B (zh) * 2021-11-01 2023-04-21 东莞深创产业科技有限公司 一种信息查询推送方法、装置及计算机设备
CN114611486B (zh) * 2022-03-09 2022-12-16 上海弘玑信息技术有限公司 信息抽取引擎的生成方法及装置、电子设备
CN114881774B (zh) * 2022-07-12 2022-10-21 华中科技大学同济医学院附属协和医院 基于凭证信息处理的电子档案管理系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175564A (ja) * 1997-12-05 1999-07-02 Oki Electric Ind Co Ltd 文書検索システム
KR20000001201A (ko) * 1998-06-09 2000-01-15 구자홍 시소러스 컴파일 방법
JP2000259671A (ja) * 1999-03-12 2000-09-22 Dainippon Printing Co Ltd 情報生成システム、情報検索システム、及び記録媒体
JP2000331012A (ja) * 1999-05-19 2000-11-30 Oki Electric Ind Co Ltd 電子化文書検索方法
KR100323595B1 (ko) * 1998-12-17 2002-03-08 이계철 전자사전의표제어에대한결합구조정보구성방법및그를이용한전자사전검색방법

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4724523A (en) * 1985-07-01 1988-02-09 Houghton Mifflin Company Method and apparatus for the electronic storage and retrieval of expressions and linguistic information
JPS60159970A (ja) * 1984-01-30 1985-08-21 Hitachi Ltd 情報蓄積検索方式
JPS6320530A (ja) * 1986-07-14 1988-01-28 Brother Ind Ltd 電子辞書における単語検索装置
JPH01307865A (ja) * 1988-06-06 1989-12-12 Nec Corp 文字列検索方式
JPH02108158A (ja) * 1988-10-17 1990-04-20 Fujitsu Ltd 文字列検索装置
US5099426A (en) * 1989-01-19 1992-03-24 International Business Machines Corporation Method for use of morphological information to cross reference keywords used for information retrieval
JPH03280159A (ja) * 1990-03-29 1991-12-11 Toshiba Corp 文字列検索方式
JPH04160566A (ja) * 1990-10-24 1992-06-03 Matsushita Electric Ind Co Ltd 単語解析装置
EP0592402B1 (en) * 1991-02-01 2001-08-01 Wang Laboratories Inc. A text management system
CA2066559A1 (en) * 1991-07-29 1993-01-30 Walter S. Rosenbaum Non-text object storage and retrieval
JP3222193B2 (ja) * 1992-05-13 2001-10-22 富士通株式会社 情報検索装置
US5519840A (en) * 1994-01-24 1996-05-21 At&T Corp. Method for implementing approximate data structures using operations on machine words
US5724594A (en) * 1994-02-10 1998-03-03 Microsoft Corporation Method and system for automatically identifying morphological information from a machine-readable dictionary
JPH0844723A (ja) * 1994-07-27 1996-02-16 Toshiba Corp 文書作成装置または文書作成方法
JP3003915B2 (ja) * 1994-12-26 2000-01-31 シャープ株式会社 単語辞書検索装置
JPH08235191A (ja) * 1995-02-27 1996-09-13 Toshiba Corp 文書検索方法及び文書検索装置
US5704060A (en) * 1995-05-22 1997-12-30 Del Monte; Michael G. Text storage and retrieval system and method
JP3111860B2 (ja) * 1995-08-02 2000-11-27 松下電器産業株式会社 スペルチェック装置
US5963940A (en) * 1995-08-16 1999-10-05 Syracuse University Natural language information retrieval system and method
KR100286649B1 (ko) * 1996-06-27 2001-04-16 이구택 연어패턴에 기초한 어휘 변환방법
US5937422A (en) * 1997-04-15 1999-08-10 The United States Of America As Represented By The National Security Agency Automatically generating a topic description for text and searching and sorting text by topic using the same
US6101492A (en) * 1998-07-02 2000-08-08 Lucent Technologies Inc. Methods and apparatus for information indexing and retrieval as well as query expansion using morpho-syntactic analysis
KR100282546B1 (ko) * 1998-12-29 2001-02-15 이계철 한-일 기계번역 시스템에서의 다어절 변환 단위의 변환 방법
US6708166B1 (en) * 1999-05-11 2004-03-16 Norbert Technologies, Llc Method and apparatus for storing data as objects, constructing customized data retrieval and data processing requests, and performing householding queries
JP3945075B2 (ja) * 1999-05-21 2007-07-18 カシオ計算機株式会社 辞書機能を備えた電子装置及び情報検索処理プログラムを記憶した記憶媒体
US6516337B1 (en) * 1999-10-14 2003-02-04 Arcessa, Inc. Sending to a central indexing site meta data or signatures from objects on a computer network
US6665666B1 (en) * 1999-10-26 2003-12-16 International Business Machines Corporation System, method and program product for answering questions using a search engine
EP1182581B1 (en) * 2000-08-18 2005-01-26 Exalead Searching tool and process for unified search using categories and keywords
US7185001B1 (en) * 2000-10-04 2007-02-27 Torch Concepts Systems and methods for document searching and organizing
US7403938B2 (en) * 2001-09-24 2008-07-22 Iac Search & Media, Inc. Natural language query processing

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175564A (ja) * 1997-12-05 1999-07-02 Oki Electric Ind Co Ltd 文書検索システム
KR20000001201A (ko) * 1998-06-09 2000-01-15 구자홍 시소러스 컴파일 방법
KR100323595B1 (ko) * 1998-12-17 2002-03-08 이계철 전자사전의표제어에대한결합구조정보구성방법및그를이용한전자사전검색방법
JP2000259671A (ja) * 1999-03-12 2000-09-22 Dainippon Printing Co Ltd 情報生成システム、情報検索システム、及び記録媒体
JP2000331012A (ja) * 1999-05-19 2000-11-30 Oki Electric Ind Co Ltd 電子化文書検索方法

Also Published As

Publication number Publication date
JP2004501424A (ja) 2004-01-15
EP1290583A4 (en) 2004-12-08
CA2406203A1 (en) 2001-10-25
EP1290583A1 (en) 2003-03-12
CN1434952A (zh) 2003-08-06
CN101051311A (zh) 2007-10-10
US20090144249A1 (en) 2009-06-04
HK1057632A1 (en) 2004-04-08
CN100535892C (zh) 2009-09-02
WO2001080077A1 (en) 2001-10-25
KR20010098714A (ko) 2001-11-08
AU5273501A (en) 2001-10-30
US20030171914A1 (en) 2003-09-11

Similar Documents

Publication Publication Date Title
KR100813806B1 (ko) 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및그를 이용한 정보 검색 시스템 및 그 방법
US6182063B1 (en) Method and apparatus for cascaded indexing and retrieval
JP5255766B2 (ja) 対話形サーチクエリー改良のためのシステム及び方法
US6772141B1 (en) Method and apparatus for organizing and using indexes utilizing a search decision table
US6826576B2 (en) Very-large-scale automatic categorizer for web content
RU2393533C2 (ru) Предложение родственных терминов для многосмыслового запроса
US5926811A (en) Statistical thesaurus, method of forming same, and use thereof in query expansion in automated text searching
Frakes Introduction to information storage and retrieval systems
US6286000B1 (en) Light weight document matcher
US20020123994A1 (en) System for fulfilling an information need using extended matching techniques
US7024405B2 (en) Method and apparatus for improved internet searching
US8280721B2 (en) Efficiently representing word sense probabilities
TW201027375A (en) Search system, search method and program
JP2008191877A (ja) コミュニティ抽出による検索用インデックス作成方法およびその装置
KR20020089677A (ko) 문서 자동 분류 방법 및 이를 수행하기 위한 시스템
JP5260123B2 (ja) 検索システム、索引作成装置、検索エンジン、索引作成方法、検索方法およびプログラム
Zhang et al. A preprocessing framework and approach for web applications
JP3275813B2 (ja) 文書検索装置、方法及び記録媒体
KR20080024172A (ko) 중심용어사전의 데이터가 기록된 컴퓨터로 읽을 수 있는기록매체
Wan et al. Experiments with automatic indexing and a relational thesaurus in a Chinese information retrieval system
KR100434718B1 (ko) 문서 색인 시스템 및 그 방법
AU785401B2 (en) Method and system for retrieving information based on meaningful core word
KR100493399B1 (ko) 정보검색 관리시스템 및 그 방법
Dallman et al. Automatic keywording of high energy physics
Xiao-Shu et al. Cloud computing oriented retrieval technology based on big data

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130304

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140303

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150302

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee