KR19990086011A - 정보 검색에서의 질의 형식화 방법 - Google Patents

정보 검색에서의 질의 형식화 방법 Download PDF

Info

Publication number
KR19990086011A
KR19990086011A KR1019980018783A KR19980018783A KR19990086011A KR 19990086011 A KR19990086011 A KR 19990086011A KR 1019980018783 A KR1019980018783 A KR 1019980018783A KR 19980018783 A KR19980018783 A KR 19980018783A KR 19990086011 A KR19990086011 A KR 19990086011A
Authority
KR
South Korea
Prior art keywords
search
user
word
query
selection
Prior art date
Application number
KR1019980018783A
Other languages
English (en)
Other versions
KR100312591B1 (ko
Inventor
강현규
김영섬
Original Assignee
정선종
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정선종, 한국전자통신연구원 filed Critical 정선종
Priority to KR1019980018783A priority Critical patent/KR100312591B1/ko
Publication of KR19990086011A publication Critical patent/KR19990086011A/ko
Application granted granted Critical
Publication of KR100312591B1 publication Critical patent/KR100312591B1/ko

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 정보 검색에서의 질의 형식화 방법에 관한 것으로서, 사용자의 자연어 질의 입력이 있으면, 용어를 추출한 후 개념검색어 확장 윈도우에서의 용어들에 대한 동의어나 동음이의어의 존재 여부를 확인하는 제 1 단계; 상기 확인 결과에 따라 사용자의 선택을 요구하는 제 2 단계; 상기 선택 결과에 따라 시소러스 뷰 윈도우에서의 질의 형식화하는 제 3 단계; 상기 선택 결과에 따라 검색어 박스에서의 질의 형식화하는 제 4 단계; 및 상기 선택 결과에 따라 검색 문서 개수 지정 및 검색 시작중 적어도 어느 하나를 수행하는 제 5 단계를 포함하여 이루어진 것을 특징으로 한다.

Description

정보 검색에서의 질의 형식화 방법
본 발명은 정보 검색에서의 질의 형식화 방법에 관한 것이다.
일반적으로, 주요한 정보원으로서의 인터넷의 잠재적인 능력은 인터넷상에서 사람들이 어떻게 원하는 정보를 빠르고 정확하게 찾아낼 수 있느냐에 달려있다. 웹(Web)이 방대해지고 초보적 수준의 사용자들이 늘어남에 따라, 간단한 조작만으로 원하는 정보를 얻어낼 수 있는 도구의 개발이 점점 중요해지고 있다. 사용자들은 컴퓨터에게 원하는 분야를 말하고, 어떤 결과를 얻는다는 개념에는 익숙치 않다. 예를 들어, 사용자가 도서관에 가서 사서에게 정보를 요청한다는 것은 이해할 수 있지만, 인터넷에서 원하는 정보를 찾아내기 위해 검색엔진을 사용하는 것은 비록 두 절차가 논리적으로 동일하다고 해도 사용자들은 쉽게 이해할 수 없다.
도 1 및 도 2는 종래에 사용되는 네이버 및 정보탐정의 정보 검색 엔진을 나타낸 화면이며, 종래의 정보 검색 시스템이나 심마니, 정보탐정, 네이버, 까치네, 와카노 등의 거의 모든 정보 검색 엔진들은 단순히 네모박스 하나만을 제시하고, 이곳에 AND, OR, NOT 등의 불리안 개념을 이용하여 정보를 검색하기 위한 검색어나 단어의 입력을 요구하고 있다. 또한, 질의 형식화를 위한 사용 연산자가 각각의 시스템에 따라 다음과 같이 다양하게 사용되고 있다.
AND 검색 : AND, 그리고, $, *, 와, 과, 및
OR 검색 : OR, 또는, +, |, 혹은
NOT 검색 : NOT, -, ~, !
절단검색 : *, %
유의어 : #
위치검색 : NEAR, ^, { }
구단위검색 : "x x x"
기타 : !&, &!, (x)
아울러, 자연어 질의를 입력받아 자동으로 검색어를 추출하여 이 검색어를 가지고 정보를 검색하기도 한다.
그러나, 정보검색 시스템(검색엔진 포함)의 질의 입력 방법이나 연산자들이 매우 다양하며, 일반 사용자들은 질의를 형식화하는 것이 쉽지 않다. 따라서 사용자가 검색하고자 하는 검색어의 형식화를 쉽게하고, 문서를 검색하지 못하는 경우에 이를 해결할 수 있는 방법이 필요하게 되었다.
정보 검색 시스템이나 정보 검색 엔진에서 많은 검색 연산자를 제공할 지라도 일반 사용자들은 질의 형식화하는 것을 어려워한다. 실생활에서는 도서관 등에 가서 길거나 부정확한 용어를 사용하여 요구사항을 표현하거나, 메뉴를 통해 아이템(item)들을 선택한다. 사용자들은 요구사항을 표현하기 위해, 인위적인 문자열을 사용하는데 익숙치 못하다. 또한, 일반적으로 정보 검색 시스템에서 동음이의어의 검색어로 인하여 정보 검색 시스템의 검색 성능이 떨어지곤 한다. 아울러, 적절한 검색어의 확장은 정보 검색 시스템의 검색 성능이 향상됨이 알려져 있다.
따라서, 본 발명은 일반 사용자가 처음에 정보를 어떻게 검색해야 할지 모를 경우, 우선 인간과 가장 친숙한 자연어를 입력 받은 후, 입력된 자연어로부터 자동으로 동음이의어나 동의어를 시각적으로 표현하고, 상호작용적인(interactive) 방법을 통하여 검색어를 선택할 수 있게 한다. 또한, 개념을 나타내는 시소러스를 시각적으로 보여주고, 사용자가 검색하고자 하는 의도를 나타낼 수 있는 검색어를 확장할 수 있게 한다. 아울러, 선택한 검색어들의 동음이의어 해결을 위한 검색 X나 가중치 조정의 형식화를 통하여 사용하기 쉽고 편리한 방법으로 정보검색의 검색효율을 향상시키는데 그 목적이 있다.
상기한 목적을 달성하기 위한 본 발명은 사용자의 자연어 질의 입력이 있으면, 용어를 추출한 후 개념검색어 확장 윈도우에서의 용어들에 대한 동의어나 동음이의어의 존재 여부를 확인하는 제 1 단계; 상기 확인 결과에 따라 사용자의 선택을 요구하는 제 2 단계; 상기 선택 결과에 따라 시소러스 뷰 윈도우에서의 질의 형식화하는 제 3 단계; 상기 선택 결과에 따라 검색어 박스에서의 질의 형식화하는 제 4 단계; 및 상기 선택 결과에 따라 검색 문서 개수 지정 및 검색 시작중 적어도 어느 하나를 수행하는 제 5 단계를 포함하여 이루어진 것을 특징으로 한다.
도 1 및 도 2는 종래에 사용되는 네이버 및 정보탐정의 정보 검색 엔진을 나타낸 화면.
도 3은 본 발명에 적용되는 시스템의 전체 구성도.
도 4는 본 발명에 적용되는 블록 구성도.
도 5는 본 발명에 적용되는 초기 화면을 나타낸 도면.
도 6은 본 발명에 적용되는 사용자의 자연어 질의문 입력 화면을 나타낸 도면.
도 7은 본 발명에 적용되는 검색어 추출 및 동음이의어, 그리고 동의어 확장 화면을 나타낸 도면.
도 8은 본 발명에 적용되는 개념검색어 확장 윈도우에서의 동음이의어에 관한 화면을 나타낸 도면.
도 9는 본 발명에 적용되는 개념검색어 확장 윈도우에서의 동의어에 관한 화면을 나타낸 도면.
도 10은 본 발명에 적용되는 활성화된 궤도상의 노드 클릭에 관한 화면을 나타낸 도면.
도 11은 본 발명에 적용되는 궤도 선택에 관한 화면을 나타낸 도면.
도 12는 본 발명에 적용되는 선택된 노드의 검색어 박스로의 삽입에 관한 화면을 나타낸 도면.
도 13은 본 발명에 적용되는 6개 이상 노드의 표현을 나타낸 도면.
도 14는 본 발명에 적용되는 시소러스 뷰 윈도우에서의 개념검색어에 관한 화면을 나타낸 도면.
도 15는 본 발명에 적용되는 시소러스의 개념어 표현에 관한 화면을 나타낸 도면.
도 16은 본 발명에 적용되는 회전을 통한 개념어 보기에 관한 화면을 나타낸 도면.
도 17은 본 발명에 적용되는 검색어 박스로 검색어를 삽입에 관한 화면을 나타낸 도면.
도 18은 본 발명에 적용되는 검색어 박스에서의 질의 형식화에 관한 화면을 나타낸 도면.
도 19는 본 발명에 적용되는 검색어 삽입에 관한 화면을 나타낸 도면.
도 20은 본 발명에 적용되는 검색어 입력에 관한 화면을 나타낸 도면.
도 21은 본 발명에 적용되는 검색어 삭제에 관한 화면을 나타낸 도면.
도 22는 본 발명에 적용되는 질의검색어 발자취를 이용한 상태 복원에 관한 화면을 나타낸 도면.
도 23은 본 발명에 적용되는 검색 문서 갯수 지정과 검색 시작에 관한 화면을 나타낸 도면.
도 24는 본 발명에 따른 질의 형식화 흐름도
〈도면의 주요 부분에 대한 부호 설명〉
1 : 서버 2 : 클라이언트
3 : 브라우져 4 : 개념마법사(플러그-인)
10 : 문장입력 모듈 20 : 질의 검색어 발자취 모듈
30 : 개념검색어 확장 모듈 40 : 시소러스 뷰 모듈
50 : 검색어 박스 모듈 60 : 검색문서갯수 콤보박스 모듈
101 : 문장입력 102 : 질의 검색어 발자취
103 : 입력완료 버튼 104 : 검색어 박스
105 : 검색어 정보 106 : 개념검색어 확장 윈도우
107 : 시소러스 뷰 윈도우 108 : 검색 문서 갯수 콤보 박스
109 : 검색 시작 버튼 111 : 큰 궤도
112 : 작은 궤도 113 : 노드
114 및 116 : 시계방향회전 버튼
115 및 117 : 반시계방향회전 버튼
이하, 첨부된 도면을 참조하여 본 발명을 상세히 설명하기로 한다.
도 3은 본 발명에 적용되는 정보 검색 시스템의 전체 구성도로서, 서버(server; 1)와 클라이언트(client; 2)로 구성되며, 클라이언트(2)는 사용자의 자연어 질의를 형식화(formulate)하고 조정(refine)하기 위해, 플러그인(plug-in) 프로그램(4, 이하 "개념마법사"(Concept Wizard : CW)라 칭한다)으로 구성되어 있다.
본 발명은 사용자의 요구에 따라 브라우져(browser; 3)를 통해 서버측(2)의 httpd (hypertext transport protocol daemon)나 CGI(Common Gateway Interface) 를 호출하여 서버(2)와 데이타를 교환한다. 사용자의 검색요구에 의해, 서버(1)는 자연어 질의로부터 키워드(원 질의어)들을 추출하고, 시소러스를 통해 각 키워드에 해당하는 개념 검색어들과 함께 개념마법사(4)로 전송한다. 사용자(2)는 개념 마법사(4)를 이용하여 서버(1)로부터 전송받은 검색어들 중에서 원하는 검색어들을 선택하여 세세한 가중치 조정도 할 수 있으며, 간단한 마우스 조작에 의해 질의의 형식화를 손쉽게 할 수 있다.
도 4는 본 발명에 적용되는 정보 검색 시스템을 도시한 블록 구성도로서, 사용자의 행동에 따른 각 모듈간의 데이터 흐름을 나타내며, 여기서 개념마법사(4)는 문장입력 모듈(10), 질의검색어 발자취 모듈(20), 개념검색어 확장 모듈(30), 시소러스 뷰(View) 모듈(40), 검색어 박스 모듈(50) 및 검색문서갯수 콤보박스 모듈(60)로 구성되어 있다.
문장입력 모듈(10)은 사용자의 질의를 받는 모듈이고, 질의검색어 리스트 모듈(20)은 사용자가 이전에 형식화했던 질의 정보들을 그대로 저장해 놓았다가 사용자에 의해 다시 그 전 상태로 복원시키기 위한 모듈이다. 개념검색어 확장 모듈(30)과 시소러스 뷰(View) 모듈(40)은 사용자가 질의한 원 질의어외에 원 질의어와 관련이 있는 개념 검색어들을 기하학적인 모델을 통해 사용자들에게 적절한 검색어들을 연상시키는 역할을 한다.
사용자에 의해 선택된 모든 검색어들은 검색어 박스 모듈(50)이 처리하게 되고, 단순히 검색어외에 검색어의 중요도에 따라 가중치를 조정할 수 있으며, '검색 X'와 같은 검색어 단위의 동작(operation)을 정의할 수 있다.
그러면, 화면을 통해 정보 검색을 위한 질의 형식화 방법을 순차적으로 설명하기로 한다.
1. 초기화면
도 5은 본 발명에 따른 초기화면을 나타낸 도면으로서, 문장입력(101), 질의 검색어 발자취(102), 입력완료 버튼(103), 검색어 박스(104), 검색어 정보(105), 개념검색어 확장 윈도우(Window)(106), 시소러스 뷰 윈도우(View Window)(107), 검색 문서 갯수 콤보 박스(108) 및 검색 시작 버튼(109)으로 구성되어 있다.
2. 사용자의 자연어 질의문 입력
도 6은 본 발명에 따른 사용자의 자연어 질의문 입력 화면을 나타낸 도면이고, 도 7은 본 발명에 따른 검색어 추출 및 동음이의어 그리고 동의어 확장 화면을 나타낸 도면이다.
사용자는 문장입력(101)을 이용하여 자연어 질의를 할 수 있다. 자연어 질의를 하고 나서 검색어의 추출을 위해 입력완료 버튼(103)을 누른다. 입력완료 버튼(103)을 누르면, 개념마법사(4)는 문장입력 모듈(10)로부터 자연어 질의를 추출하여 'NPN_GetURL'을 사용하여 서버(1)에게 전달한다. 서버(1)가 개념마법사(4)로부터 자연어 질의를 받으면, 질의문으로부터 키워드를 추출한다. 그리고 각 키워드의 동음이의어와 동의어를 시소러스로부터 추출하여 개념마법사(4)에게 추출된 검색어들을 전달한다. 개념마법사(4)는 서버(1)로부터 전달받은 검색어들을 문장입력(101), 질의 검색어 발자취(102), 개념검색어 확장 윈도우(106) 및 검색어 박스(104)로 보낸다. 이 때, 문장입력(101)과 검색어 박스(104)에는 원 질의어만 보내고, 질의 검색어 발자취(102)와 개념검색어 확장 윈도우(106)에는 원 질의어, 동음이의어 및 동의어를 보낸다.
3. 개념검색어 확장 윈도우에서의 개념검색어
도 8은 본 발명에 따른 개념검색어 확장 윈도우에서의 동음이의어 화면을 나타낸 도면으로서, 원 질의어와 그에 해당하는 동음이의어를 원형모델로 나타낸 개념 검색어 확장 윈도우이다. 또한, 도 9는 본 발명에 따른 개념검색어 확장 윈도우에서의 동의어 화면을 나타낸 도면이다.
중앙의 가장 큰 궤도(111; orbit)(화면상에서 붉은색으로 표시됨)는 사용자가 입력한 자연어 질의로부터 추출한 원 질의어를 나타내는 궤도이고, 궤도(111)상의 노드(113; 화면상에서 붉은색으로 표시됨)를 중심점으로 하는 작은 궤도 (112; 화면상에서 푸른색으로 표시됨)는 큰 궤도 노드(113)의 동음이의어들을 나타낸 궤도이다. 동음이의어를 나타내는 궤도는 도 8에 도시된 바와 같이, 노드(113)를 중심점으로 하여 표현하지만, 동의어는 도 9에 도시된 바와 같이, 노드를 외접하는 형태로 표현한다.(예시된 도 9는 자연어 질의로 '말갈과 고구려 발해에 대하여'라고 질의를 내렸을 때의 결과이다.)
도 9에서 가운데 큰 궤도(111)는 활성화된 궤도를 나타내고, 작은 궤도(112) 는 비활성화된 궤도를 나타낸다. 여기서, 활성화된 궤도란 '화면 상의 여러 궤도들에 대해 사용자가 조작할 수 있는 궤도'를 말하고, 다른 말로 표현하면 'focus를 받고 있는 궤도'라고 말하는데, 하기에서 상술하기로 한다.
도 10은 본 발명에 따른 활성화된 궤도상의 노드 클릭을 나타낸 화면이 도시된 도면이고, 도 11은 본 발명에 따른 궤도 선택 화면을 나타낸 도면이다. 또한, 도 12는 본 발명에 따른 선택된 노드의 검색어 박스로의 삽입을 나타낸 도면이고, 도 13은 본 발명에 따른 6개 이상의 노드를 표현한 화면을 나타낸 도면이다.
상기한 활성화된 궤도상의 노드는 도 10과 같이, 마우스로 노드(113)를 클릭하여 선택할 수 있으며, 비활성화된 궤도상의 노드를 선택하려면 먼저 궤도(111 또는 112)를 선택한 후에 노드(113)를 선택해야만 한다.
궤도를 선택하기 위해서는 궤도(111 또는 112)를 클릭하거나, 도 11처럼 궤도(112)의 내부를 클릭하면 활성화가 된다. 또한, 궤도의 내부를 클릭했을 때, 클릭한 위치가 여러 궤도에 속한다면 클릭할 때마다 해당하는 궤도들을 차례로 활성화한다. 그리고, 선택된 노드의 해당 검색어는 검색어 박스(104)에 삽입이 된다. (도 12는 '공전3(운동)'을 선택했을 때, 검색어 박스로 검색어'운동'이 삽입되는 일실시예를 도시한 도면이다.)
하나의 궤도는 최대 6개까지의 검색어들을 나타낼 수 있기 때문에 해당 궤도에 대해 검색어의 갯수가 최대 갯수를 넘었을 경우에 시계방향회전(114)이나 반시계방향회전(115) 버튼을 클릭하여 화면 상에 표시되지 않은 노드들을 볼 수 있다.
도시된 도 13은 자연어 질의 '지구공전 지구공전에대하다 지구 공전 지대 법전'을 자연어 질의로 입력했을 때의 결과를 예시한 것으로서, 가장 큰 궤도 (111) 안에는 최대로 6개의 노드(113)들이 들어가 있기 때문에 더 많은 노드들을 궤도에 표현할 수 없다. 따라서 반시계방향회전(115) 버튼을 사용하여 화면 상의 보이지 않는 노드들까지 볼 수 있도록 하였다.
4. 시소러스 뷰 윈도우에서의 개념검색어
도 14는 본 발명에 따른 시소러스 뷰 윈도우에서의 개념검색어에 대한 화면을 나타낸 도면으로서, 시소러스 뷰 윈도우(107)를 이용하면 동음이의어나 동의어외에 '상위개념어', '하위개념어' 그리고 '관련개념어'를 볼 수 있다.
도 14처럼 검색어 '공전3'의 '관련개념어'를 보기 위해, 노드 상에서 마우스의 오른쪽 버튼을 클릭하면 팝업메뉴가 화면 상에 디스플레이(display) 된다. 사용자는 팝업메뉴로부터 원하는 검색어를 클릭하여 선택할 수 있고, 해당 검색어(예에서는 '공전3')와 메뉴를 통해 선택한 검색어 종류(예에서는 '관련개념어')가 서버(1)로 전송된다. 서버(1)는 개념마법사(4)로부터 받은 검색어와 원하는 검색어 종류를 시소러스를 이용하여 찾아서 개념마법사(4)로 다시 전송한다.
도 15는 본 발명에 따른 시소러스의 개념어 표현에 관한 화면을 나타낸 도면이고, 도 16은 본 발명에 따른 회전을 통한 개념어 보기에 관한 화면을 나타낸 도면이다. 도시된 도 15는 전송받은 검색어들(예에서는 '관련개념어')을 화면상에 표시한 일예를 나타낸 것으로서, 전송받은 검색어들은 나선의 바깥쪽에서 안쪽으로 차례로 디스플레이되며, 검색어들이 많아서 한 화면에 디스플레이될 수 없는 검색어들은 도 16과 같이 왼쪽 하단의 회전버튼을 클릭하여 보이지 않는 검색어들도 볼 수 있도록 하였다.
도시된 도 16은 반시계방향회전(117) 버튼을 클릭하면, 첫번째 검색어'둘레' 가 사라지고 여덟번째 검색어 '위성'이 디스플레이되는 것을 나타내는데, 이것은 시소러스 뷰 윈도우(107)도 개념검색어 확장 윈도우(106)와 같이 노드를 선택하여 검색어 박스(104)로 검색어를 삽입할 수 있기 때문이다.
도 17은 본 발명에 따른 노드 '보데의법칙'을 클릭하여 검색어 박스로 검색어를 삽입하는 화면을 나타낸 도면이다.
5. 검색어 박스에서의 질의 형식화
도 18은 본 발명에 따른 검색어 박스에서의 질의 형식화에 관한 화면을 나타낸 도면이고, 도 19, 도 20 및 도 21은 본 발명에 따른 개념 검색어 삽입, 입력 및 삭제에 관한 화면을 나타낸 도면이다.
사용자가 입력한 자연어 질의문으로부터 추출한 원 질의어뿐만 아니라 개념검색어 확장 윈도우(106)나 시소러스 뷰 윈도우(107)로부터 선택한 개념검색어들은 모두 검색어 박스(104)로 모아지게 된다. 도시된 도 18과 같이, 검색어 박스(104)는 사용자가 직접 질의했거나 선택한 검색어들을 질의 형식화하는 기능을 담당한다. 따라서, 검색어들에 대한 연산을 제공하기위해 '검색 X' 체크 박스와 '검색어 가중치' 슬라이더 바가 각 검색어마다 지정할 수 있도록 되어 있다. '검색 X' 체크 박스는 해당 검색어가 문서 상에 포함되어 있다면, 그 문서는 검색대상에서 제외하기 위한 것이다. 또한 '검색어 가중치' 슬라이더 바는 각 검색어 단위로 가중치를 부여할 수 있도록 하여 사용자가 검색어의 중요도를 지정할 수 있도록 하였다
도시된 도 19와 같이, 사용자는 개념검색어 확장 윈도우(106)나 시소러스 뷰 윈도우(107)를 통해 검색어들을 검색어 박스(104)로 삽입할 수 있지만, 직접 검색어 박스(104)에 검색어를 입력할 수도 있다. 새로운 검색어를 검색어 박스(104)에 삽입하기 위해, 검색어 박스(104) 상에서 마우스의 오른쪽 버튼을 클릭하면 팝업메뉴가 디스플레이된다.
메뉴의 '검색어 삽입'을 선택하면, 도 20과 같이 마우스 커서가 위치한 다음 라인에 빈(empty) 라인이 삽입이 되고, 여기에 새로운 검색어를 입력할 수 있다. 또한, 도 21와 같이 원하지 않는 검색어는 팝업메뉴의 '검색어 삭제'를 선택하여 검색어 박스로부터 검색어를 삭제할 수 있다. 이때, 검색어 '자전'을 삭제하기 위해, 검색어 '자전'이 위치한 라인에서 마우스의 오른쪽 버튼을 클릭하면, 팝업메뉴를 띄운 화면상에서 검색어 수와 검색 X가 선택된 검색어 수가 검색어 정보란에 표시된다.
6. 질의검색어 발자취를 이용한 상태 복원
도 22는 본 발명에 따른 질의검색어 발자취를 이용한 상태 복원에 관한 화면을 나타낸 도면으로서, 검색어들이 원 질의어와 개념검색어로 분류되어 질의검색어 발자취에 저장되어 있는 것을 보여준다. 사용자는 이 중에서 원하는 발자취를 선택하여 이전의 상태로 돌아갈 수 있다.
도 22에 도시된 바와 같이, 개념마법사(4)는 사용자가 질의를 내릴 때마다 검색어 박스(104)에 있는 검색어와 검색어에 대한 정보들을 질의검색어 발자취(102)에 저장한다. 이와 같이 하는 것은 언제라도 개념마법사(4)가 이전의 상태로 돌아갈 수 있도록 하기 위한 것이다. 개념마법사(4)가 검색어들을 저장하는 시기는, '사용자가 자연어 질의를 한 후, 입력완료 버튼(103)을 누를 때'와 '검색시작 버튼(109)을 누를 때'이며, 검색어 박스(104)에 있는 검색어들을 원 질의어와 개념검색어로 나누어 발자취 박스에 저장한다. 이 때 사용자가 직접 입력한 자연어 질의로부터 추출한 검색어들은 원 질의어로 분류하고, 시소러스로부터 얻은 검색어들은 개념검색어로 분류하여 저장한다.
7. 검색 문서 갯수 지정과 검색 시작
도 23은 본 발명에 따른 검색 문서 개수 지정과 검색 시작에 관해 설명하기 위한 도면이다.
도 23에서 처럼, 사용자는 검색어 박스(104)에 있는 검색어들로 서버(1)에게 문서 검색을 위해 질의를 내리게 된다. 문서 검색을 위해 질의를 내릴 때, 사용자는 추출할 문서의 갯수를 지정할 수 있는데, 문서 검색 리스트 박스를 선택하여 지정하거나 직접 입력하여 문서 갯수를 지정할 수 있다. 문서 검색의 갯수를 지정한 후에 검색시작 버튼(109)을 클릭하여 서버(1)에게 검색을 요구할 수 있다.
도 24는 본 발명에 따른 전체적인 질의 형식화를 나타낸 흐름도이다.
사용자의 자연어 질의 입력이 있으면(201), 용어를 추출한 후 개념검색어 확장 윈도우에서의 용어들에 대한 동의어나 동음이의어의 존재 여부를 확인한다(202 및 203). 존재 여부의 확인 결과 동의어나 동음이의어가 없으면, 용어들을 시각화하여 보여준 후 사용자의 선택을 요구한다(205 및 206). 존재 여부의 확인 결과 동의어나 동음이의어가 있으면, 동의어나 동음이의어를 확장하여 시각화하여 보여준 후 사용자의 선택을 요구한다(204 및 206).
상기 선택 결과에 따라, 개념검색어 확장 윈도우 및 시소러스 뷰 윈도우에서의 질의 형식화한다. 사용자가 회전을 선택하면 회전하여 보여주고(207), 사용자가 노드를 선택하면 검색어 박스에 전송된다(208). 사용자가 노드의 오른쪽 버튼을 클릭하면 사용자의 선택이 요구되는데(209), 사용자가 상위 개념어를 클릭하면 상위 개념어를 시각화하고, 하위 개념어를 클릭하면 하위 개념어를 시각화하며, 관련 개념어를 클릭하면 관련 개념어를 시각화한다(210, 211 및 212).
상기 선택 결과에 따라, 검색어 박스에서의 질의 형식화한다. 사용자가 검색 X를 클릭하면 검색 X 마크를 하게된다(213). 사용자가 검색어 박스에서 오른쪽 버튼을 클릭하면, 사용자의 선택이 요구되며(214), 사용자가 검색어 삽입을 클릭하면 검색어를 삽입하고, 검색어 삭제를 클릭하면 검색어를 삭제한다(215 및 216). 사용자가 검색어 가중치를 클릭하면 검색어 가중치가 조정된다(217).
상기 선택 결과에 따라, 사용자가 검색 개수 정의를 클릭하면 개수가 정의되며(218), 사용자가 검색 시작 버튼을 클릭하면 검색이 시작된 후 종료된다(219).
상술한 바와 같이, 본 발명은 사용자 선택에 의해 질의 및 개념어 확장이 가능하고, 동음이의어 및 동의어 처리가 가능하며, 실세계 지식의 부족을 상호작용적(interactive)으로 제시함으로써 확장가능 하도록 하였다. 또한, 일반 사용자가 우선 사용하기 쉬운 자연어 질의를 하고, 쉽게 개념적인 검색어들을 확장할 수 있도록 하며, 검색어들을 조정하게 함으로써 쉽게 정보 검색 시스템을 접근하고 정보 검색 시스템의 검색 성능을 향상할 수 있도록 하였다.
그리고, 본 발명은 웹을 기반으로 하는 검색엔진 및 정보검색 시스템에 적용할 수 있도록 하기 위하여, 네스케이프(Netscape)를 기반으로하는 플러그 인(Plug-in)으로 구성하였다. 개념 마법사가 플러그인 형식을 취하는 것은 서버와 클라이언트의 통신상의 절차를 웹 브라우저가 전담하도록 하기 위한 것으로, 통신 모듈로 인한 클라이언트의 부피를 줄일 수 있으며, 마임 타입에 의한 플러그인의 배포가 쉽다는 장점을 갖는다.

Claims (6)

  1. 사용자의 자연어 질의 입력이 있으면, 용어를 추출한 후 개념검색어 확장 윈도우에서의 용어들에 대한 동의어나 동음이의어의 존재 여부를 확인하는 제 1 단계;
    상기 확인 결과에 따라 사용자의 선택을 요구하는 제 2 단계;
    상기 선택 결과에 따라 시소러스 뷰 윈도우에서의 질의 형식화하는 제 3 단계;
    상기 선택 결과에 따라 검색어 박스에서의 질의 형식화하는 제 4 단계; 및
    상기 선택 결과에 따라 검색 문서 개수 지정 및 검색 시작중 적어도 어느 하나를 수행하는 제 5 단계를 포함하여 이루어진 것을 특징으로 하는 정보 검색에서의 질의 형식화 방법.
  2. 제 1 항에 있어서,
    상기 동의어나 동음이의어 존재 여부를 확인하는 제 1 단계는
    상기 확인 결과 상기 동의어나 동음이의어가 없으면, 용어들을 시각화하여 보여준 후 상기 사용자의 선택을 요구하는 단계; 및
    상기 확인 결과 상기 동의어나 동음이의어가 있으면, 상기 동의어나 동음이의어를 확장하여 시각화하여 보여준 후 상기 사용자의 선택을 요구하는 단계를 포함하여 이루어진 것을 특징으로 하는 정보 검색에서의 질의 형식화 방법.
  3. 제 1 항에 있어서,
    상기 시소러스 뷰 윈도우에서의 질의 형식화하는 제 3 단계는
    상기 사용자가 회전버튼을 클릭하면, 회전하여 보여주는 단계;
    상기 사용자가 노드를 선택하면, 검색어 박스에 검색어를 삽입하는 단계; 및
    상기 사용자가 노드의 오른쪽 버튼을 클릭하면, 상기 사용자의 상위 개념어, 하위 개념어 및 관련 개념어중 어느 하나의 선택이 요구되는 단계를 포함하여 이루어진 것을 특징으로 하는 정보 검색에서의 질의 형식화 방법.
  4. 제 3 항에 있어서,
    상기 사용자의 상위 개념어, 하위 개념어 및 관련 개념어중 어느 하나의 선택이 요구되는 단계는
    상기 선택 결과 사용자가 상위 개념어를 클릭하면, 상위 개념어를 시각화하는 단계;
    상기 선택 결과 사용자가 하위 개념어를 클릭하면, 하위 개념어를 시각화하는 단계; 및
    상기 선택 결과 사용자가 관련 개념어를 클릭하면, 관련 개념어를 시각화하는 단계를 포함하여 이루어진 것을 특징으로 하는 정보 검색에서의 질의 형식화 방법.
  5. 제 1 항에 있어서,
    상기 검색어 박스에서의 질의 형식화하는 제 4 단계는
    상기 사용자가 검색 X를 클릭하면, 검색 X 마크를 하는 단계;
    상기 사용자가 검색어 박스에서 오른쪽 버튼을 클릭하면, 상기 사용자의 검색어 삽입 및 검색어 삭제중 어느 하나의 선택이 요구되는 단계; 및
    상기 사용자가 검색어 가중치를 클릭하면, 검색어 가중치가 조정되는 단계를 포함하여 이루어진 것을 특징으로 하는 정보 검색에서의 질의 형식화 방법.
  6. 제 5 항에 있어서,
    상기 사용자의 검색어 삽입 및 검색어 삭제중 어느 하나의 선택이 요구되는 단계는
    상기 선택 결과 상기 사용자가 검색어 삽입을 클릭하면, 검색어를 삽입하는 단계; 및
    상기 선택 결과 상기 사용자가 검색어 삭제를 클릭하면, 검색어를 삭제하는 단계를 포함하여 이루어진 것을 특징으로 하는 정보 검색에서의 질의 형식화 방법.
KR1019980018783A 1998-05-25 1998-05-25 정보 검색에서의 질의 형식화 방법 KR100312591B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980018783A KR100312591B1 (ko) 1998-05-25 1998-05-25 정보 검색에서의 질의 형식화 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980018783A KR100312591B1 (ko) 1998-05-25 1998-05-25 정보 검색에서의 질의 형식화 방법

Publications (2)

Publication Number Publication Date
KR19990086011A true KR19990086011A (ko) 1999-12-15
KR100312591B1 KR100312591B1 (ko) 2001-12-12

Family

ID=37531244

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980018783A KR100312591B1 (ko) 1998-05-25 1998-05-25 정보 검색에서의 질의 형식화 방법

Country Status (1)

Country Link
KR (1) KR100312591B1 (ko)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000024179A (ko) * 2000-01-26 2000-05-06 조민형 한국어 인터넷 자연어 질의 응답형 정보 검색 엔진 구축방법.
KR20000063555A (ko) * 2000-07-21 2000-11-06 박형준 웹브라우져 상의 텍스트 정보를 이용한 웹사이트 검색방법
KR20010103532A (ko) * 2000-05-10 2001-11-23 제임스 김 다니엘 전자상거래 원클릭 상품 검색방법 및 그 장치
KR100347799B1 (ko) * 2000-02-23 2002-08-07 주식회사 이노디지털 인터넷 정보 검색 방법 및 장치
KR20020080107A (ko) * 2001-04-11 2002-10-23 이은미 정보검색 시스템을 이용한 광고 방법
KR20020088671A (ko) * 2001-05-19 2002-11-29 구교성 대표키워드를 이용한 네트워크 상에서의 정보검색방법
KR100421530B1 (ko) * 2001-03-06 2004-03-09 김시환 정보 검색 방법
KR100467104B1 (ko) * 2001-05-11 2005-01-24 김시환 정보 검색 시스템과 그 방법
KR100501079B1 (ko) * 2001-11-12 2005-07-18 주식회사 아이니드 네트워크 기반의 유사어 검색기술 응용시스템 및 방법
KR100522839B1 (ko) * 2001-04-06 2005-10-19 (주)케이테크 전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식
KR100752460B1 (ko) * 2000-05-29 2007-08-24 소니 가부시끼 가이샤 전자 프로그램 가이드 검색 방법 및 전자 프로그램 가이드검색 장치
KR100835172B1 (ko) * 2006-10-16 2008-06-05 한국전자통신연구원 동의어를 이용한 정보 검색 시스템 및 그 방법
WO2008106473A1 (en) * 2007-02-26 2008-09-04 Microsoft Corporation Automatic disambiguation based on a reference resource
US8805868B2 (en) 2007-08-03 2014-08-12 Electronics And Telecommunications Research Institute Apparatus and method for a query express
CN111368530A (zh) * 2018-12-24 2020-07-03 上海新微技术研发中心有限公司 即时通信软件中防止错发消息的方法以及用户终端

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100378642B1 (ko) * 2000-07-06 2003-03-31 김시환 정보 검색 시스템과 그 방법
KR101248187B1 (ko) * 2010-05-28 2013-03-27 최진근 확장 검색어 선정 시스템 및 확장 검색어 선정 방법
KR101188730B1 (ko) * 2010-07-19 2012-10-10 주식회사 다음커뮤니케이션 검색 서버에서 수행되는 서제스트 검색어 제공 방법
KR101236998B1 (ko) * 2012-04-12 2013-02-25 김수현 성장 식물형 키워드 시스템

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2792287B2 (ja) * 1991-10-31 1998-09-03 日本電気株式会社 情報検索装置

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000024179A (ko) * 2000-01-26 2000-05-06 조민형 한국어 인터넷 자연어 질의 응답형 정보 검색 엔진 구축방법.
KR100347799B1 (ko) * 2000-02-23 2002-08-07 주식회사 이노디지털 인터넷 정보 검색 방법 및 장치
KR20010103532A (ko) * 2000-05-10 2001-11-23 제임스 김 다니엘 전자상거래 원클릭 상품 검색방법 및 그 장치
KR100752460B1 (ko) * 2000-05-29 2007-08-24 소니 가부시끼 가이샤 전자 프로그램 가이드 검색 방법 및 전자 프로그램 가이드검색 장치
KR20000063555A (ko) * 2000-07-21 2000-11-06 박형준 웹브라우져 상의 텍스트 정보를 이용한 웹사이트 검색방법
KR100421530B1 (ko) * 2001-03-06 2004-03-09 김시환 정보 검색 방법
KR100522839B1 (ko) * 2001-04-06 2005-10-19 (주)케이테크 전자상거래에서 효과적으로 상품을 검색하기 위한시소러스의 점진적 구축 방법, 선택적 확장식의 브라우징그리고 지능형 질의 방식
KR20020080107A (ko) * 2001-04-11 2002-10-23 이은미 정보검색 시스템을 이용한 광고 방법
KR100467104B1 (ko) * 2001-05-11 2005-01-24 김시환 정보 검색 시스템과 그 방법
KR20020088671A (ko) * 2001-05-19 2002-11-29 구교성 대표키워드를 이용한 네트워크 상에서의 정보검색방법
KR100501079B1 (ko) * 2001-11-12 2005-07-18 주식회사 아이니드 네트워크 기반의 유사어 검색기술 응용시스템 및 방법
KR100835172B1 (ko) * 2006-10-16 2008-06-05 한국전자통신연구원 동의어를 이용한 정보 검색 시스템 및 그 방법
WO2008106473A1 (en) * 2007-02-26 2008-09-04 Microsoft Corporation Automatic disambiguation based on a reference resource
US8112402B2 (en) 2007-02-26 2012-02-07 Microsoft Corporation Automatic disambiguation based on a reference resource
US9772992B2 (en) 2007-02-26 2017-09-26 Microsoft Technology Licensing, Llc Automatic disambiguation based on a reference resource
US8805868B2 (en) 2007-08-03 2014-08-12 Electronics And Telecommunications Research Institute Apparatus and method for a query express
CN111368530A (zh) * 2018-12-24 2020-07-03 上海新微技术研发中心有限公司 即时通信软件中防止错发消息的方法以及用户终端

Also Published As

Publication number Publication date
KR100312591B1 (ko) 2001-12-12

Similar Documents

Publication Publication Date Title
KR100312591B1 (ko) 정보 검색에서의 질의 형식화 방법
CA2521525C (en) System and method for providing a geographic search function
US6434556B1 (en) Visualization of Internet search information
US6848077B1 (en) Dynamically creating hyperlinks to other web documents in received world wide web documents based on text terms in the received document defined as of interest to user
US6651065B2 (en) Search and index hosting system
US6226655B1 (en) Method and apparatus for retrieving data from a network using linked location identifiers
US6658408B2 (en) Document information management system
US7428705B2 (en) Web map tool
CN109657068B (zh) 面向智慧博物馆的文物知识图谱生成与可视化方法
US20070043706A1 (en) Search history visual representation
JP2005535039A (ja) 地理的なテキスト検索システムを備えたデスクトップクライアントとの対話
US7668859B2 (en) Method and system for enhanced web searching
WO2000054185A1 (en) Method and apparatus for building a user-defined technical thesaurus using on-line databases
US6567801B1 (en) Automatically initiating a knowledge portal query from within a displayed document
US20090024597A1 (en) Forming web search queries from browsing annotated images
Hirata et al. Object-based navigation: An intuitive navigation style for content-oriented integration environment
US20030025724A1 (en) Transmitting Web pages in a plurality of alternate readable modes selectable to direct users having different reading skills to read along a world wide Web page
JP2004054918A (ja) 情報処理システム、情報表示装置、コンピュータプログラム、及び記録媒体
KR100494113B1 (ko) 웹 브라우저를 이용한 정보 검색 시스템
KR20000064069A (ko) 관계형 검색 시스템 및 검색결과의 표현방법
US20080228725A1 (en) Problem/function-oriented searching method for a patent database system
Johnson et al. Geographic information retrieval and the World Wide Web: a match made in electronic space
Semeraro et al. Machine learning techniques for adaptive user interfaces in a corporate digital library service
Albertoni et al. A visualization-based approach to explore geographic metadata
Toney et al. New Web-based interfaces to old databases

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20081001

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee