KR20040101189A - 정보검색방법, 정보검색 프로그램, 정보검색 프로그램을기록한 컴퓨터를 읽을 수 있는 기록매체 - Google Patents

정보검색방법, 정보검색 프로그램, 정보검색 프로그램을기록한 컴퓨터를 읽을 수 있는 기록매체 Download PDF

Info

Publication number
KR20040101189A
KR20040101189A KR10-2004-7005162A KR20047005162A KR20040101189A KR 20040101189 A KR20040101189 A KR 20040101189A KR 20047005162 A KR20047005162 A KR 20047005162A KR 20040101189 A KR20040101189 A KR 20040101189A
Authority
KR
South Korea
Prior art keywords
node
processing unit
search
input
information
Prior art date
Application number
KR10-2004-7005162A
Other languages
English (en)
Other versions
KR100593561B1 (ko
Inventor
코이티 하시다
Original Assignee
도꾸리쯔교세이호징 가가꾸 기쥬쯔 신꼬 기꼬
내셔날 인스티튜트 오브 어드밴스드 인더스트리얼 사이언스 앤드 테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 도꾸리쯔교세이호징 가가꾸 기쥬쯔 신꼬 기꼬, 내셔날 인스티튜트 오브 어드밴스드 인더스트리얼 사이언스 앤드 테크놀로지 filed Critical 도꾸리쯔교세이호징 가가꾸 기쥬쯔 신꼬 기꼬
Publication of KR20040101189A publication Critical patent/KR20040101189A/ko
Application granted granted Critical
Publication of KR100593561B1 publication Critical patent/KR100593561B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

정보검색에 있어서 적당한 정보를 이용자에게 제공함으로써, 유효한 대화를 하여, 검색의 효율과 정밀도를 향상시킨다. CPU는, 삭제된 해답 후보의 집합 G를 공연히 초기 설정하고, 이용자로부터 검색질문 Q의 입력을 받는다(S1). CPU는, 데이터베이스 기억부를 참조하고, 시소러스 T 또는 T의 부분집합 R로 정의되는 라벨간의 유사도를 이용하여, 검색질문 Q에 의한 데이터베이스 D의 검색결과로서 해답 후보 집합 F를 구한다(S2). CPU는, 대화의 단서로서, 해답 후보, 검색질문 Q 등에 관한 정보를, 표시부에 의해 이용자에게 제시한다(S3). 이용자는, 해답 후보 집합 F 중의 해답 후보가 해답인지 아닌지를 체크하거나, 해답 후보 집합 F와 삭제된 해답 후보 집합 G와 시소러스 T 또는 T의 부분집합 R과 검색질문 Q를 변경할 수 있다. CPU는, 재검색의 요구에 따라(S4) 재검색한다.

Description

정보검색방법, 정보검색 프로그램, 정보검색 프로그램을 기록한 컴퓨터를 읽을 수 있는 기록매체{Information Searching Method, Information Searching Program, and Computer-Readable Recording Medium on which Information Searching Program is Recorded}
기술분야
본 발명은 정보검색방법, 정보검색 프로그램, 정보검색 프로그램을 기록한 컴퓨터를 읽을 수 있는 기록매체에 관한 것이다. 보다 구체적으로 본 발명은 라벨부착 그래프에 관한 대화식 정보검색방법, 정보검색 프로그램, 정보검색 프로그램을 기록한 컴퓨터를 읽을 수 있는 기록매체에 관한 것이다.
배경기술
종래의 정보검색은 키워드나 키워드에 대응하는 식별번호를 AND 조건이나 OR 조건 등의 논리식에 의해 조합시킨 것을 검색질문으로 하고, 문자열 조합과 통계적 처리에 의해 검색을 하는 것이었다. 이용자와의 대화를 위해서는, 예를 들어 해답 후보 집합의 몇 개의 부분집합에 대해서, 그 각각을 특징짓는 키워드·어구를 통계적 방법에 의해 구하고, 그들 키워드·어구를 검색요구에 더해지는 키워드·어구의 후보로서 제시하여, 이용자에게 선택시키는 등의 방법이 이용되고 있었다. 종래 기술의 참고문헌으로는 다음의 것이 있다.
·하야시 요시히코·오바시 요시쯔구(1998) WWW상의 검색 서비스의 기술동향. 정보처리, 39권 9호
·후지타 스미오(1999) 자연언어 처리를 이용한 정보의 검색·분류에의 접근. 정보처리, 40권 4호
발명의 개시
일반적으로 정보검색이 어려운 것은, 검색질문과 해답과의 사이의 표현상의 차이를 채우는(검색질문으로부터 답의 표현을 예측하는) 것이 어렵기 때문이다. 예를 들어, 「일본인 비즈니스맨의 해외출장 중의 사고」라는 검색요구에 대해서, 「다나까 사장이 미국에서 차에 치였다」가 해답 후보인 것을 검출하는 경우를 생각하자. 이 경우에는 복잡한 추론이 필요하지만, 그와 같은 추론을 자동화하는 것은 당분간은 기술적으로 불가능하다고 예상된다.
따라서, 이와 같은 추론은 인간과 기계가 대화함으로써 행할 수밖에 없다. 대화를 가능하게 하는데는 검색의 각 장면에서 행해야 하는 것에 관한 힌트를 기계가 인간에게 줄 필요가 있다. 그러나, 상기와 같이 통계적인 방법에 의해 힌트를 주는 종래의 방법에서는 해답 후보 집합의 전반적인 성질은 다루지만, 특정 검색질문에 고유의 구조를 다룰 수는 없다.
또한, 대화를 위한 유효한 힌트를 인간에게 주는데는 검색질문에 고유의 구조를 검색에 반영시킬 필요가 있지만, 종래의 정보검색은 그와 같은 구조를 이용하고 있지 않다. 예를 들어 「일본 비즈니스맨의 해외출장 중의 사고」라는 검색질문은 「일본인」과 「비즈니스맨」, 「비즈니스맨」과 「출장」, 「해외」와 「출장」, 「출장」과 「사고」 사이의 관계를 포함하는 의미적인 구조를 갖지만, 그와 같은 구조는 종래의 정보검색에서는 거의 이용되고 있지 않다. 특히, 대화의 단서로서 체계적으로 이용되는 일은 없었다.
본 발명의 목적의 하나는 정보검색에 있어서 적당한 정보를 이용자에게 제공함으로써 유효한 대화를 하여 검색의 효율과 정밀도를 향상시키는데 있다.
본 발명의 다른 목적은 컨텐츠 및 검색질문에 고유의 의미 구조를 이용하여 검색 범위를 자동적으로 좁히면서 대화식으로 검색질문 및 검색 범위를 입력 또는 변경함으로써 높은 효율과 정밀도로 핀포인트의 정보검색을 행하는데 있다.
본 발명의 또 다른 목적은 검색질문과 검색대상이 자연언어의 문장과 같은 부정형 구조를 갖는 그래프로서 취급되고 그 구조를 단서로 이용자가 검색엔진과 적절한 대화를 행하는 것을 가능하게 하여, 검색의 효율과 정밀도를 향상시키는데 있다.
본 발명의 제1 해결수단에 의하면,
처리부는 노드, 상기 노드의 라벨 및 노드간의 링크에 대한 정보를 포함하는 검색질문 Q의 입력을 입력부로부터 받는 단계;
처리부는 노드의 라벨간의 유사성의 정도를 정의하는 시소러스(thesaurus) T를 기억한 시소러스 기억부를 참조하고, 입력된 링크에 따라 시소러스 T의 부분집합 R로 정의되는 라벨간의 유사성을 이용하고, 입력된 노드 및 라벨을 기억한 데이터베이스 D를 참조하여, 검색질문 Q에 의한 데이터베이스의 검색결과로서 해답 후보 집합 F를 구하는 검색단계;
처리부는 구한 해답 후보 집합 F를 표시부에 표시하는 단계;
처리부는 해답 후보 집합 F의 몇 개의 요소가 해답에 해당하는지 아닌지에 대한 입력정보를 입력부로부터 입력하는 단계;
처리부는 상기 입력정보에 따라, 해답 후보 집합 F의 몇 개의 요소를, 해답 후보 집합 F로부터 삭제하는 단계;
처리부는 입력부로부터의 시소러스 T의 부분집합 R 및/또는 검색질문 Q에 관한 삭제, 추가 또는 변경에 대한 입력정보에 근거하여, 부분집합 R 및/또는 검색질문 Q의 내용을 삭제, 추가 또는 변경하는 단계; 및
이용자로부터 재검색의 요구가 있으면 상기 검색단계로 되돌아가 처리를 반복하고, 한편, 그 요구가 없으면 처리를 종료하는 단계;
를 포함하는 정보검색방법, 정보검색 프로그램, 정보검색 프로그램을 기록한 컴퓨터를 읽을 수 있는 기록매체가 제공된다.
본 발명의 제2 해결수단에 의하면,
처리부는 노드, 상기 노드의 라벨 및 노드간의 링크에 대한 정보를 포함하는 검색질문 Q의 입력을 입력부로부터 받는 단계;
처리부는 노드의 라벨간의 유사도를 정의하는 시소러스 T를 기억한 시소러스 기억부를 참조하고, 입력된 링크에 따라 시소러스 T 중 사용 가능으로 된 부분에 있어서 정의되는 라벨간의 유사도를 이용하고, 입력된 노드 및 라벨을 기억한 데이터베이스 D를 참조하여, 검색질문 Q에 의한 데이터베이스의 검색결과로서 해답 후보 집합 F를 구하는 검색단계;
처리부는 구한 해답 후보 집합 F를 표시부에 표시하는 단계;
처리부는 해답 후보 집합 F의 몇 개의 요소가 해답에 해당하는지 아닌지에 대한 입력정보를 입력부로부터 입력하는 단계;
처리부는 상기 입력정보에 따라, 해답 후보 집합 F의 몇 개의 요소를, 해답 후보 집합 F로부터 삭제하는 단계;
처리부는 입력부로부터의 시소러스 T 및/또는 검색질문 Q에 관한 삭제, 추가 또는 변경에 대한 입력정보에 근거하여, 시소러스 T 및/또는 검색질문 Q의 내용을 삭제, 추가 또는 변경하는 단계; 및
이용자로부터 재검색의 요구가 있으면 상기 검색단계로 되돌아가 처리를 반복하고, 한편 그 요구가 없으면 처리를 종료하는 단계;
를 포함하는 정보검색방법, 정보검색 프로그램, 정보검색 프로그램을 기록한 컴퓨터를 읽을 수 있는 기록매체가 제공된다.
본 발명에 있어서, 처리부는 표시부에 검색질문 Q를 표시하는 단계;
처리부는 검색질문 Q의 두 개의 노드를 연결하는 링크가 없는 경우에 그와 같은 링크를 삽입할 것을 지시하는 입력정보를 입력부로부터 입력하는 단계;
처리부는 상기 입력정보에 따라, 그 링크를 삽입하는 단계;
처리부에는 검색질문 Q의 링크를 삭제할 것을 지시하는 입력정보를 입력부로부터 입력하는 단계;
처리부는 상기 입력정보에 따라, 그 링크를 삭제하는 단계;
처리부에는 검색질문 Q에 새로운 노드를 부가할 것을 지시하는 입력정보가 입력부로부터 입력되는 단계;
처리부는 상기 입력정보에 따라 검색질문 Q에 그 노드를 부가하는 단계;
처리부에는 검색질문 Q의 노드를 삭제할 것을 지시하는 입력정보를 입력부로부터 입력하는 단계; 및
처리부는 상기 입력정보에 따라, 검색질문 Q로부터 그 노드를 삭제하는 단계를 더 포함할 수 있다.
본 발명에 있어서, 처리부는 검색질문 Q의 노드마다 상기 노드의 라벨 L과 다른 라벨 M과의 유사도를 나타내는 값 T(L, M)이 시소러스 기억부 중의 시소러스 T에 있어서 정의되어 있는 바와 같은 데이터베이스 D의 노드의 라벨 M의 리스트를 표시부에 표시하는 단계;
처리부는 상기 라벨 M의 몇 개를 선택 또는 선택하지 않을 것을 지시하는 입력정보와, M의 몇 개에 대한 T(L, M)의 값을 변경할 것을 지시하는 입력정보와, 임의의 몇 개의 라벨 M을 지정하는 입력정보를 입력부로부터 입력하는 단계; 및
처리부는 상기 입력정보에 따라, 선택된 라벨 M에 대해서 시소러스 T에 있어서 T(L, M)의 정의를 사용 가능으로 하고, 또한 선택되지 않은 요소 M에 대해서 T(L, M)의 정의를 사용 불가능으로 하고, 또한, 지정된 M에 대해서 T(L, M)의 값을 지정된 값으로 변경하고, 또한, 지정된 라벨 N에 대하여 T(L, N)의 정의를 사용 가능으로 하여 T(L, N)의 값을 1로 하는 단계;
를 포함할 수 있다.
본 발명에 있어서, 처리부는 검색질문 Q의 노드 x마다, 다음의 리스트를 표시부에 표시하는 단계;
{L | 노드 y 및 노드 z∈F(x)에 대하여,
L은 y의 라벨이고,
링크 y-z는 데이터베이스 D에 포함됨.}
처리부는 그와 같은 라벨의 몇 개를 선택할 것을 지시하는 입력정보가 입력부로부터 입력되는 단계; 및
처리부는 상기 입력정보에 따라, 선택된 각 라벨 L에 대해서, L을 라벨로 하는 노드 Y와 링크 x-Y를 검색질문 Q에 부가하는 단계;
를 포함할 수 있다.
또한, 본 발명에서 처리부는 각 라벨 M에 대하여, 다음 집합의 크기가 미리 설정된 값보다 적은 경우에는, 다음 집합의 모든 요소에 대하여, y 주변의 몇 개의 노드의 라벨을 M에 더한 것을 상기 리스트의 요소로서 표시부에 표시할 수 있다.
{y | y의 라벨은 M.
노드 z∈F(x)에 대하여,
링크 y-z는 데이터베이스 D에 포함됨.}
본 발명에 있어서, 처리부는 표시부에, 검색질문 Q의 링크 x-y마다, 해답 후보 f의 값 영역 중의 노드 f(x)와 f(y)를 연결하는 최단경로가 노드 z를 포함하고,해답 후보 f의 값 영역 f(Q)가 노드 z를 포함하지 않는 해답 후보 f가 존재하는 노드 z의 라벨의 리스트를 표시하는 단계;
처리부는 그와 같은 라벨의 몇 개를 선택할 것을 지시하는 입력정보를 입력부로부터 입력되는 단계; 및
처리부는 상기 입력정보에 따라, 이 리스트의 요소를 라벨로 하는 노드 z와 링크 x-z 및 z-y를 검색질문 Q에 부가하는 단계;
를 포함할 수 있다.
도면의 간단한 설명
도1은 노드, 링크, 검색질문 Q에 대한 설명도이다.
도2는 검색질문 Q에 포함되는 각 라벨의 시소러스 확장에 대한 설명도이다.
도3은 검색질문 Q에 대해서의 해답 후보 및 해답 후보 집합 F에 대한 설명도이다.
도4는 검색장치의 구성도이다.
도5는 정보검색처리의 프로차트이다.
도6은 표시화면의 예를 나타낸 설명도이다.
발명을 실시하기 위한 최선의 형태
본 실시형태에서는 상술한 바와 같은 의미 구조로서, 노드에 라벨이 붙은 그래프(네트워크)를 생각할 수 있다. 검색질문 Q 및 검색대상인 데이터베이스 D는 모두 그와 같은 그래프라 한다. 또한, 그래프 사이의 유사한 조합 등에 근거하여 검색질문 Q나 검색 범위의 대화식 변경이 효과적으로 행해지도록 한다. 문서의 검색인 경우에는 예를 들어 노드는 언어의 지시대상이고, 링크는 그들 사이의 의미적인 관계이고, 라벨은 언어이다.
본 실시형태에서 「검색」이란, 검색질문 Q와 유사한 데이터베이스 D의 부분 그래프를 발견하는 것이다. 검색질문 Q의 각 노드는 그와 같은 부분 그래프의 어느 하나의 노드에 대응한다고 생각할 수 있다. 그 대응관계를 검색질문 Q의 노드로부터 데이터베이스 D의 노드로의 함수에 의해 나타내고, 그 함수를 해답 후보라 부른다. 또한, 각 해답 후보의 스코어(예를 들어, 유사도, 관련도, 확률 등에 관한 값)가 정의된다고 한다. 스코어가 높은 몇 개의 해답 후보의 집합을 해답 후보 집합 F라 하고,
F(x)={f(x)|f∈F} (x는 검색질문 Q의 노드, f(x)는 노드 x에 대응하는 데이터베이스 중의 노드)
f(Q)={f(x)|x는, 검색질문 Q의 노드} (f∈F)
로 한다.
여기에서, 검색질문 Q, 해답 후보 집합 F 등에 대해서 구체예로 설명한다.
도1에, 노드, 링크, 검색질문 Q에 대한 설명도를 나타낸다.
·검색질문 Q의 노드 x와 그 라벨은, 예를 들어 「함수」, 「해석」, 「의미」, 「자동」이다.
·검색질문 Q의 링크는, 「함수-해석」, 「해석-의미」, 「해석-자동」이다.
·검색질문 Q는, 이들 노드와 라벨에 의해 구성되는 도시한 것과 같은 것이다.
도2에, 해답 후보 f에 있어서 검색질문 Q의 노드 x에 대응하는 데이터베이스 중의 노드 f(x), 해답 후보 집합 F에 있어서 x에 대응하는 데이터베이스 중의 노드의 집합 F(x)에 대한 설명도를 나타낸다.
·f(x)는, 예를 들어 노드(라벨) 「함수」에 대해서는, f(함수)로 나타내어지고(f1(함수), f2(함수), …), 「함수」, 「프로그램」, 「단서」, 「관계」, 「서브루틴(subroutine)」, 「사영(射影)」, 「전사(全射)」의 각각을 라벨로 하는 데이터베이스 D의 노드이다.
·F(x)는, 예를 들어 노드(라벨) 「함수」에 대해서는, F(함수)로 나타내어지고, 모든 f∈F에 걸친 f(함수)의 전체 집합 {「함수」, 「프로그램」, 「단서」, 「관계」, 「서브루틴」, 「사영」, 「전사」}를 말한다.
도3에, 검색질문 Q에 대해서의 해답 후보 f의 값 영역 f(Q)나 해답 후보 집합 F에 대한 설명도를 나타낸다. f'(Q), f"(Q), f'''(Q)는 해답 후보 f', f", f'''의 값 영역이다.
·f(Q)는, 「프로그램으로…언어를…분석한다」, 「의도한 투자를…나타내는 함수가」, 「내용을 자동적으로…정리하고 싶다」, 「암시적인…의사를 추측하면서」, 「파악할 수 없는…데이터의 의미를…프로그램에」, 「분석에 이용한 방법을…의미한다」의 각각에 대응한다.
·F는 f의 집합이고, f(Q)의 집합으로서 표시되고, {「프로그램으로…언어를…분석한다」, 「의도한 투자를…나타내는 함수가」, 「내용을 자동적으로…정리하고 싶다」, 「암시적인…의사를 추측하면서」, 「파악할 수 없는…데이터의 의미를…프로그램에」, 「분석에 이용한 방법을…의미한다」}를 말한다.
또한, 이하에 설명하는 본 실시형태에서는, 시소러스 T란, 예를 들어 그래프 중의 노드의 라벨 L과 라벨 M의 조(組)로부터 양자 사이의 유사성의 정도(유사도)를 나타내는 수치 T(L, M)로의 부분 함수이고, 스코어의 계산에 이용한다. 해답 후보 집합 F를 구할 때에는, 시소러스 전체 T가 아니고, 시소러스 T의 부분 집합 R을 이용한다. 이 때, 예를 들어 시소러스 T에는 조작자에 의해, 입력부 또는 기억부로부터 미리 정해진 사용 가능으로 된 부분과 사용 불가능으로 된 부분이 있고, 해답 후보 집합 F를 구할 때에는, T 전체가 아니고, T 중 사용 가능으로 된 부분을 이용한다. 스코어의 정의, 그래프의 표현법, 및 데이터베이스 D와 시소러스 T 또는 T의 부분 집합 R과 검색질문 Q로부터 해답 후보 집합 F를 구하는 방법(후술하는 도5의 프로차트의 「검색실행」 및 그 단계 S2의 설명 부분)에는 공지된 것이 몇 가지 있고, 그것을 적절하게 이용할 수 있기 때문에 여기에서는 상세하게 다루지 않는다.
예를 들어, 라벨 「함수」와 「해석」과의 유사도를 나타내는 스코어가 수치 T(함수, 해석)로서, 시소러스 기억부(6)에 기억된 시소러스 T에 의해 주어진다.
도4에, 검색장치의 구성도를 나타낸다.
검색장치는 표시부(1), 입력부(2), 처리부(CPU)(3), 주기억부(4), 시소러스 기억부(5), 데이터베이스(검색대상)(6), 버스(7)를 갖춘다.
처리부(3)는 입력부(2), 표시부(1), 주기억부(4), 시소러스 기억부(5), 데이터베이스(검색대상)(6)와 버스(7)에 의해 접속되어, 각종 정보를 입출력한다. 표시부(1)는, 예를 들어 검색입력, 검색출력, 검색도중 결과 등을 화면에 표시하기 위한 디스플레이 장치이다. 입력부(2)는 예를 들어 검색질문, 지시, 조건 등의 검색에 필요한 각종 데이터 등을 입력하기 위한 입력수단이고, 키보드, 마우스, 포인팅 디바이스 등의 적절한 장치가 이용된다. 게다가, 다른 장치, 기억매체 등에 데이터를 출력하는 출력부를 갖추도록 해도 좋다. 주기억부(4)에는 검색 프로그램, 초기 설정, 파라미터 등의 각종 데이터나 검색 최종결과, 중간결과 등의 검색상황에 관한 데이터가 기억된다. 시소러스 기억부(5)는 예를 들어 검색에 필요한 각 노드의 관계, 관련도 또는 비관련도, 유사도 또는 상위도, 확률, 확실함 등을 나타내는 데이터인 시소러스 T를 기억한다. 데이터베이스(6)는 검색대상이 되는 데이터(데이터베이스 D)를 기억하고 있고, 노드, 라벨, 링크 등이 기억된다.
도5에, 정보검색 처리의 프로차트를 나타낸다. 검색은 이하의 순서로 행한다.
우선, 초기 입력으로서, 데이터베이스 D가 데이터베이스 기억부(6)에 미리 기억되고, 시소러스 T 또는 T의 일부의 부분집합 R이 시소러스 기억부(5)에 미리 기억되어 있는 것으로 한다.
단계 S1에서는, CPU(3)는 삭제된 해답 후보의 집합 G를 공연히 초기 설정하고, 이용자로부터 노드, 노드의 라벨, 노드간의 링크에 관한 정보를 포함하는 검색질문 Q의 입력을 받는다. CPU(3)는, 검색질문 Q에 관한 데이터를 주기억부(4) 등의적절한 기억부에 기억하고, 필요에 따라 그곳으로부터 읽어낸다.
단계 S2에서는, CPU(3)는 표시부(1)에 표시된 「검색실행 버튼」을 클릭함으로써, 이용자의 요구에 따라 검색(또는 재검색)을 행한다. CPU(3)는, 입력된 검색질문 Q에 따라 시소러스 기억부(5) 및 데이터베이스 기억부(6)를 참조하고, 시소러스 T 중 사용 가능으로 된 부분 R에 있어서 정의되는 라벨간의 유사도를 이용하여, 검색질문 Q에 의한 데이터베이스 D의 검색결과로서 해답 후보 집합 F를 구한다(상술한 바와 같이 그 방법은 공지된 것이기 때문에 여기에서는 서술하지 않는다). 그 때, 삭제된 해답 후보 집합 G의 요소인 해답 후보 및 삭제된 해답 후보 집합 G의 요소를 포함하는 해답 후보는 해답 후보 집합 F에 포함시키지 않는다(해답 후보는 함수이고, 함수는 순서쌍의 집합이기 때문에, 해답 후보 사이에서 포함관계가 성립할 수 있다).
단계 S3에서는, CPU(3)는 대화의 단서로서 이하의 (1)∼(5)의 정보를 표시부(1)에 의해 이용자에게 제시한다((2), (4), (5)의 리스트의 표시는, 예를 들어 리스트의 요소인 라벨을 갖는 노드를 포함하는 해답 후보의 스코어의 최대값의 내림순에 따른다). 이용자는, 하기의 각 정보에 따라 조항 쓰기로 기록한 시방으로 해답 후보 집합 F 중의 해답 후보가 해답인지 아닌지를 체크하거나, 해답 후보 집합 F와 삭제된 해답 후보 집합 G와 시소러스 T 또는 T의 부분집합 R과 검색질문 Q를 변경할 수 있다. CPU(3)는 각각의 케이스(case) 리스트 요소에 대한 정보를 표시부(1)에 표시한다. CPU(3)는, 이용자로부터 입력부(2)에 의해 입력된 입력정보에 따라, 각 케이스 리스트 요소의 삭제, 추가 또는 변경 등을 행하고, 주기억부(4)에기억하고, 이 데이터와 관계 있는 시소러스, 검색대상 등의 데이터를 시소러스 기억부(5), 데이터베이스(6)로부터 적절히 읽어들인다.
도6은, 표시화면의 예를 나타내는 설명도이다. 도6은 자연언어의 문서의 검색에 관하여, 이 순서의 단계 S3에서의 표시와 대화를 서포트하는 인터페이스의 예를 나타낸다. 도면 중 (1)∼(5)는 다음의 (1)∼(5)와 대응한다.
(1) 해답 후보 집합 F
여기에는, 스코어가 높은 해답 후보의 리스트가 표시된다. 도면 중, 굵은 글씨는 검색질문 중 언어의 시소러스 확장에 걸친 언어이다. 이용자는 다음과 같이, 이 표시에 대한 조작이 가능하다.
·해답 후보 집합 F의 몇 개의 요소가 답인지 아닌지를 체크한다. 이것은, 예를 들어 리스트에 표시된 정보만으로 행할 수 있는 것도 있지만, 그것만으로 체크할 수 없는 경우에는, 각 해답 후보를 클릭하여 그 주변의 더 넓은 범위를 표시함으로써 행한다.
·해답 후보 집합 F의 몇 개의 요소를 해답 후보 집합 F로부터 삭제하고, 삭제된 해답 후보 집합 G의 요소로 한다. 이것은 도6에서는, F에 포함되어 있던 해답 후보(도면에서는 ●로 나타낸다)를 F에 포함시키지 않도록(○로 나타낸다) 하는 것이다.
(2) 검색질문 Q
여기에는, 검색질문이 표시된다. 이용자는 다음과 같이 노드의 추가와 삭제, 및 링크의 삽입과 삭제가 가능하다.
·검색질문 Q의 두 개의 노드를 연결하는 링크가 없는 몇 개의 경우에 그와 같은 링크를 삽입한다.
·검색질문 Q의 몇 개의 링크를 삭제한다.
·검색질문 Q에 새로운 노드를 몇 개 부가한다.
·검색질문 Q의 노드를 몇 개 삭제한다.
(3) 여기에는, 검색질문 Q에 포함되는 노드의 라벨(도6에서는 「함수」 등)을 시소러스 확장한 결과로 스코어가 높은 것이 표시된다. 보다 정확하게는, 이 리스트는, (검색질문 Q의 노드 x마다)노드 x의 라벨 L에 대해서 시소러스 T에 있어서의 T(L, M)이 정의되어 있는 데이터베이스 D의 노드의 라벨(요소) M의 리스트이다. 이용자는 다음과 같이 그 각 요소를 검색 범위에 포함시킬지(도6에서는 ●로 나타낸다) 포함시키지 않을지(○로 나타낸다)를 지정할 수 있다.
·이 리스트의 몇 개의 요소 M에 대하여 시소러스 T의 부분집합 R에 있어서 R(L, M)이 정의되어 있지 않은 것에 근거하여, R의 정의를 확장하여 R(L, M)=T(L, M)으로 한다. 또는, 이 리스트의 몇 개의 요소 M에 대해서 시소러스 T에 있어서의 T(L, M)의 정의를 사용 가능으로 한다. 결국, M을 검색 범위에 포함시킨다.
·이 리스트의 몇 개의 요소 M에 대하여 R(L, M)이 정의되어 있는 것에 근거하여, R의 정의를 축소하여 R(L, M)을 미정의로 한다. 또는, 이 리스트의 몇 개의 요소 M에 대해서 T(L, M)의 정의를 사용 가능으로 한다. 결국, M을 검색 범위에 포함시키지 않는다.
(4) 여기에서는, 검색질문 Q의 노드(도6에서는 「함수」 등의 노드)에 직접연결하여 검색질문에 부가할 수 있는 노드의 라벨이 표시된다. 더 상세하게는, 이 리스트는 (검색질문 Q의 노드 x마다)링크 y-z가 데이터베이스 D에 포함되고 y의 라벨이 L인 노드 y와 노드 z∈F(x)가 존재하는 라벨 L의 리스트이다. 라벨 L에 대응하는 노드 y(링크 y-z가 데이터베이스 D에 포함되고 y의 라벨이 L인 노드 z∈F(x)가 존재하는 노드 y)가 적은 경우에는, 그와 같은 y마다 y 주변의 몇 개의 노드의 라벨을 L에 더한 것을 리스트의 요소로서 표시하도록 해도 좋다. 이용자는 다음과 같이 이 리스트의 각 요소에 의해 검색질문 Q를 확장할지(●) 안 할지(○)를 지정할 수 있다.
·이 리스트의 몇 개의 요소 M에 대해서, M을 라벨로 하는 노드 Y와 링크 x-Y를 검색질문 Q에 부가한다. 결국, M에 의해 검색질문 Q를 확장한다. M을 리스트로부터 선택하는 대신에 직접 입력하는 것도 가능하다.
(5) 여기에는, 검색질문 Q에 있어서의 2개의 노드(도6에서는 「함수」와 「해석」등) 사이에 들어가는 노드의 라벨이 표시된다. 더 상세하게는, 이 리스트는 (검색질문 Q의 링크 x-y마다)해답 후보 f 중의 노드 f(x)와 f(y)를 연결하는 최단경로가 노드 z를 포함하고, 해답 후보의 값 영역 f(Q)가 노드 z를 포함하지 않는 해답 후보 f가 존재하는 노드 z의 라벨 리스트이다. 이용자는 다음과 같이 이 리스트의 요소를 검색질문 Q에 삽입할지(도6에서는 ●로 나타낸다) 안 할지(○로 나타낸다)를 지정할 수 있다.
·이 리스트의 요소를 라벨로 하는 노드 z와 링크 x-z와 링크 z-y를 검색질문 Q에 부가한다. 결국, 이 요소를 검색질문 Q에 삽입한다.
단계 S4에서는, 이용자로부터 「검색실행 버튼」에 의해 재검색의 요구가 있으면 단계 S2로 되돌아간다. 한편, 재검색의 요구가 없으면 처리를 종료한다.
본 발명의 정보검색방법 또는 정보검색장치·시스템은, 그 각 순서를 컴퓨터에 실행시키기 위한 정보검색처리 프로그램, 정보검색처리 프로그램을 기록한 컴퓨터를 읽을 수 있는 기록매체, 정보검색처리 프로그램을 포함하고 컴퓨터의 내부 메모리에 로드 가능한 프로그램 제품, 그 프로그램을 포함하는 서버 등의 컴퓨터, 등에 의해 제공될 수 있다.
산업상의 이용가능성
본 발명에 의하면, 이상 설명한 바와 같이, 정보검색에 있어서 적당한 정보를 이용자에게 제공함으로써, 유효한 대화를 행하여, 검색의 효율과 정밀도를 향상시킬 수 있다. 본 발명에 의하면, 데이터베이스 및 검색질문에 고유의 그래프 구조를 이용하여, 검색 범위를 자동적으로 좁히면서 대화식으로 검색질문 및 검색 범위를 입력 또는 변경함으로써 높은 효율과 정밀도로 핀포인트의 정보검색을 행할 수 있다.
게다가, 본 발명에 의하면, 검색질문과 검색대상이 자연언어의 문장과 같은 부정형 구조를 갖는 그래프로서 취급되고, 그 구조를 단서로 이용자가 검색엔진과 적당한 대화를 행할 수 있게 하여, 검색의 효율과 정밀도를 향상시킬 수 있다.

Claims (15)

  1. 처리부는, 노드, 상기 노드의 라벨 및 상기 노드간의 링크에 대한 정보를 포함하는 검색질문 Q의 입력을 입력부로부터 수신하는 단계;
    상기 처리부는, 상기 노드의 라벨간의 유사성의 정도를 정의하는 시소러스 T를 기억한 시소러스 기억부를 참조하고, 입력된 링크에 따라 상기 시소러스 T의 부분집합 R로 정의되는 라벨간의 유사성을 이용하고, 입력된 노드 및 라벨을 기억한 데이터베이스 D를 참조하여, 검색질문 Q에 의한 상기 데이터베이스의 검색결과로서 해답 후보 집합 F를 구하는 검색단계;
    상기 처리부는, 구한 상기 해답 후보 집합 F를 표시부에 표시하는 단계;
    상기 처리부는, 상기 해답 후보 집합 F의 몇 개의 요소가 해답에 해당하는지 아닌지에 대한 입력정보를 상기 입력부로부터 입력하는 단계;
    상기 처리부는, 상기 입력정보에 따라, 상기 해답 후보 집합 F의 몇 개의 요소를 상기 해답 후보 집합 F로부터 삭제하는 단계;
    상기 처리부는, 상기 입력부로부터의 상기 시소러스 T의 부분집합 R 및/또는 상기 검색질문 Q에 관한 삭제, 추가 또는 변경에 대한 입력정보에 기초하여, 상기 부분집합 R 및/또는 검색질문 Q의 내용을 삭제, 추가 또는 변경하는 단계; 및
    이용자로부터 재검색의 요구가 있으면 상기 검색단계로 되돌아가 처리를 반복하고, 한편, 그 요구가 없으면 처리를 종료하는 단계;
    를 포함하여 이루어지는 것을 특징으로 하는 정보검색방법.
  2. 제1항에 있어서,
    상기 처리부는, 상기 표시부에 검색질문 Q를 표시하는 단계;
    상기 처리부에는, 상기 검색질문 Q의 2개의 노드를 연결하는 링크가 없는 경우에 그와 같은 링크를 삽입할 것을 지시하는 입력정보가 상기 입력부로부터 입력되는 단계;
    상기 처리부는, 상기 입력정보에 따라 그 링크를 삽입하는 단계;
    상기 처리부에는, 상기 검색질문 Q의 링크를 삭제할 것을 지시하는 입력정보가 상기 입력부로부터 입력되는 단계;
    상기 처리부는, 상기 입력정보에 따라 그 링크를 삭제하는 단계;
    상기 처리부에는, 검색질문 Q에 새로운 노드를 부가할 것을 지시하는 입력정보가 상기 입력부로부터 입력되는 단계;
    상기 처리부는, 상기 입력정보에 따라 상기 검색질문 Q에 그 노드를 부가하는 단계;
    상기 처리부에는, 상기 검색질문 Q의 노드에서 링크의 끝점이 아닌 것을 삭제할 것을 지시하는 입력정보가 상기 입력부로부터 입력되는 단계; 및
    상기 처리부는, 상기 입력정보에 따라 상기 검색질문 Q로부터 그 노드를 삭제하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 정보검색방법.
  3. 제1항 또는 제2항에 있어서,
    상기 처리부는, 상기 검색질문 Q의 노드 x마다, 상기 노드 x의 라벨 L과 데이터베이스 D의 노드의 라벨 M에 대해서 유사도를 나타내는 값 T(L, M)이 상기 시소러스 기억부 중의 상기 시소러스 T에 정의되어 있는, 데이터베이스 D의 노드의 라벨 M의 리스트를 표시부에 표시하는 단계;
    상기 처리부에는, 상기 라벨 M의 몇 개를 선택 또는 선택하지 않을 것을 지시하는 입력정보가 입력부로부터 입력되는 단계; 및
    상기 처리부는, 상기 입력정보에 따라, 상기 리스트의 몇 개의 요소 M에 대하여 시소러스 T의 부분집합 R에 있어서 R(L, M)이 정의되어 있지 않은 것에 근거하여, 상기 부분집합 R의 정의를 확장하여, R(L, M)=T(L, M)으로 하거나, 상기 리스트의 몇 개의 요소 M에 대하여 R(L, M)이 정의되어 있는 것에 근거하여, R의 정의를 축소하여 R(L, M)을 미정의로 하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 정보검색방법.
  4. 제1항 내지 제3항의 어느 한 항에 있어서,
    상기 처리부는, 표시부에 상기 검색질문 Q의 상기 노드 x마다, 링크 y-z가상기 데이터베이스 D의 링크인 노드 z∈F(x)가 존재하는 노드 y의 라벨 리스트를 표시하는 단계;
    상기 처리부는, 상기 라벨 중에서 몇 개를 선택할 것을 지시하는 입력정보가 상기 입력부로부터 입력되는 단계; 및
    상기 처리부는, 상기 입력정보에 따라, 선택된 라벨 L에 대해서, L을 라벨로 하는 노드 y와 링크 x-y를 상기 검색질문 Q에 부가하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 정보검색방법.
  5. 제1항 내지 제4항의 어느 한 항에 있어서,
    상기 처리부는, 표시부에 상기검색질문 Q의 링크 x-y 각각에 대하여, 해답 후보의 값 영역 중의 노드 f(x)와 f(y)를 연결하는 최단경로가 노드 z를 포함하고, 해답 후보 f의 값 영역 f(Q)가 노드 z를 포함하지 않는 상기 해답 후보 f가 존재하는 노드 z의 라벨의 리스트를 표시하는 단계;
    상기 처리부는, 상기 라벨 중에서 몇 개를 선택할 것을 지시하는 입력정보를 상기 입력부로부터 입력하는 단계; 및
    상기 처리부는, 상기 입력정보에 따라, 상기 리스트의 요소를 라벨로 하는 노드 z와 링크 x-z 및 z-y를 상기 검색질문 Q에 부가하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 정보검색방법.
  6. 처리부는, 노드, 상기 노드의 라벨 및 상기 노드간의 링크에 대한 정보를 포함하는 검색질문 Q의 입력을 입력부로부터 받는 단계;
    상기 처리부는, 상기 노드의 라벨간의 유사성의 정도를 정의하는 시소러스 T를 기억한 시소러스 기억부를 참조하고, 상기 시소러스 T의 부분집합 R로 정의되는 라벨간의 유사성을 이용하고, 입력된 상기 노드 및 라벨을 기억한 데이터베이스 D를 참조하여, 상기 검색질문 Q에 의한 상기 데이터베이스의 검색결과로서 해답 후보 집합 F를 구하는 검색단계;
    상기 처리부는, 구한 상기 해답 후보 집합 F를 표시부에 표시하는 단계;
    상기 처리부는, 상기 해답 후보 집합 F의 몇 개의 요소가 해답에 해당하는지 아닌지에 대한 입력정보를 입력부로부터 입력하는 단계;
    상기 처리부는, 상기 입력정보에 따라, 상기 해답 후보 집합 F의 몇 개의 요소를 상기 해답 후보 집합 F로부터 삭제하는 단계;
    상기 처리부는, 입력부로부터의 시소러스 T의 부분집합 R 및/또는 검색질문 Q에 관한 삭제, 추가 또는 변경에 대한 입력정보에 근거하여, 상기 부분집합 R 및/또는 검색질문 Q의 내용을 삭제, 추가 또는 변경하는 단계; 및
    이용자로부터 재검색의 요구가 있으면 상기 검색단계로 되돌아가 처리를 반복하고, 한편, 그 요구가 없으면 처리를 종료하는 단계;
    를 포함하여 이루어지는 것을 특징으로 하는 정보검색 프로그램.
  7. 처리부는, 노드, 상기 노드의 라벨 및 상기 노드간의 링크에 대한 정보를 포함하는 검색질문 Q의 입력을 입력부로부터 받는 단계;
    상기 처리부는, 상기 노드의 라벨간의 유사성의 정도를 정의하는 시소러스 T를 기억한 시소러스 기억부를 참조하고, 상기 시소러스 T의 부분집합 R로 정의되는 라벨간의 유사성을 이용하고, 입력된 상기 노드 및 라벨을 기억한 데이터베이스 D를 참조하여, 검색질문 Q에 의한 상기 데이터베이스의 검색결과로서 해답 후보 집합 F를 구하는 검색단계;
    상기 처리부는, 구한 상기 해답 후보 집합 F를 표시부에 표시하는 단계;
    상기 처리부는, 상기 해답 후보 집합 F의 몇 개의 요소가 해답에 해당하는지 아닌지에 대한 입력정보를 입력부로부터 입력하는 단계;
    상기 처리부는, 상기 입력정보에 따라 상기 해답 후보 집합 F의 몇 개의 요소를 상기 해답 후보 집합 F로부터 삭제하는 단계;
    상기 처리부는 상기 입력부로부터의 상기 시소러스 T의 부분집합 R 및/또는 상기 검색질문 Q에 관한 삭제, 추가 또는 변경에 대한 입력정보에 근거하여, 상기 부분집합 R 및/또는 검색질문 Q의 내용을 삭제, 추가 또는 변경하는 단계; 및
    이용자로부터 재검색의 요구가 있으면 상기 검색단계로 되돌아가 처리를 반복하고, 한편, 그 요구가 없으면 처리를 종료하는 단계;
    를 포함하여 이루어지는 정보검색 프로그램을 기록한 컴퓨터를 읽을 수 있는 기록매체.
  8. 처리부는, 노드, 상기 노드의 라벨 및 상기 노드간의 링크에 대한 정보를 포함하는 검색질문 Q의 입력을 입력부로부터 받는 단계;
    상기 처리부는, 상기 노드의 라벨간의 유사도를 정의하는 시소러스 T를 기억한 시소러스 기억부를 참조하고, 입력된 검색질문 Q에 따라 상기 시소러스 T 중 사용 가능으로 된 부분에 있어서 정의되는 라벨간의 유사도를 이용하고, 데이터베이스 D를 참조하여, 검색질문 Q에 의한 데이터베이스의 검색결과로서 해답 후보 집합 F를 구하는 검색단계;
    상기 처리부는, 구한 상기 해답 후보 집합 F를 표시부에 표시하는 단계;
    상기 처리부는, 상기 해답 후보 집합 F의 몇 개의 요소가 해답에 해당하는지 아닌지에 대한 입력정보를 입력부로부터 입력하는 단계;
    상기 처리부는, 상기 입력정보에 따라, 상기 해답 후보 집합 F의 몇 개의 요소를 상기 해답 후보 집합 F로부터 삭제하는 단계;
    상기 처리부는, 상기 입력부로부터의 상기 시소러스 T 및/또는 상기 검색질문 Q에 관한 삭제, 추가 또는 변경에 대한 입력정보에 근거하여, 상기 시소러스 T 및/또는 상기 검색질문 Q의 내용을 삭제, 추가 또는 변경하는 단계; 및
    상기 처리부는, 이용자로부터 재검색의 요구가 있으면 상기 검색단계로 되돌아가 처리를 반복하고, 한편, 그 요구가 없으면 처리를 종료하는 단계;
    를 포함하여 이루어지는 것을 특징으로 하는 정보검색방법.
  9. 제8항에 있어서, 상기 처리부는,
    상기 표시부에 상기 검색질문 Q를 표시하는 단계;
    상기 처리부는, 상기 검색질문 Q의 두 개의 노드를 연결하는 링크가 없는 경우에 그와 같은 링크를 삽입할 것을 지시하는 입력정보를 상기 입력부로부터 입력하는 단계;
    상기 처리부는, 상기 입력정보에 따라 그 링크를 삽입하는 단계;
    상기 처리부에는, 검색질문 Q의 링크를 삭제할 것을 지시하는 입력정보를 상기 입력부로부터 입력하는 단계;
    상기 처리부는, 상기 입력정보에 따라 그 링크를 삭제하는 단계;
    상기 처리부에는, 검색질문 Q에 새로운 노드를 부가할 것을 지시하는 입력정보가 입력부로부터 입력되는 단계;
    상기 처리부는, 상기 입력정보에 따라 상기 검색질문 Q에 그 노드를 부가하는 단계;
    상기 처리부에는, 상기 검색질문 Q의 노드를 삭제할 것을 지시하는 입력정보를 상기 입력부로부터 입력하는 단계; 및
    상기 처리부는, 상기 입력정보에 따라 상기 검색질문 Q로부터 그 노드를 삭제하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 정보검색방법.
  10. 제8항 또는 제9항에 있어서,
    상기 처리부는, 상기 검색질문 Q의 노드 x마다, 상기 노드 x의 라벨 L과 데이터베이스 D의 노드의 라벨 M과의 유사도를 나타내는 값 T(L, M)이 상기 시소러스 기억부 중의 시소러스 T에 있어서 정의되어 있는 상기 데이터베이스 D의 노드의 라벨 M의 리스트를 표시부에 표시하는 단계;
    상기 처리부는, 상기 라벨 M의 몇 개를 선택 또는 선택하지 않을 것을 지시하는 입력정보와, M의 몇 개에 대한 T(L, M)의 값을 변경할 것을 지시하는 입력정보와, 임의의 몇 개의 새 라벨 N을 지정하는 입력정보를 상기 입력부로부터 입력하는 단계; 및
    상기 처리부는, 상기 입력정보에 따라 선택된 라벨 M에 대해 시소러스 T에 있어서 T(L, N)의 정의를 사용 가능으로 하고, 또는 선택되지 않은 요소 M에 대하여 T(L, M)의 정의를 사용 불가능으로 하고, 또는 지정된 M에 대해서 T(L, M)의 값을 지정된 값으로 변경하고, 또는 지정된 N에 대해서 T(L, N)의 정의를 사용 가능으로 하여 T(L, N)의 값을 1로 하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 정보검색방법.
  11. 제8항 내지 제10항의 어느 한 항에 있어서,
    상기 처리부는, 상기 검색질문 Q의 노드 x마다, 다음의 리스트를 표시부에 표시하는 단계;
    {L | 노드 y 및 노드 z∈F(x)에 대하여,
    L은 y의 라벨이고,
    링크 y-z는 데이터베이스 D에 포함됨}
    상기 처리부는, 상기 라벨 중에서 몇 개를 선택할 것을 지시하는 입력정보가 상기 입력부로부터 입력되는 단계; 및
    상기 처리부는, 상기 입력정보에 따라 선택된 각 라벨 L에 대해서, L을 라벨로 하는 노드 Y와 링크 x-Y를 상기 검색질문 Q에 부가하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 정보검색방법.
  12. 제8항 내지 제11항의 어느 한 항에 있어서,
    상기 처리부는, 상기 리스트의 각 라벨 M에 대하여, 다음 집합의 크기가 미리 정해진 값보다 적은 경우에는, 다음 집합의 모든 요소마다, y 주변의 몇 개의 노드의 라벨을 M에 더한 것을 리스트의 요소로서 상기 표시부에 표시하는 단계를 더 포함하여 이루어지는 것을 특징으로 하는 정보검색방법:
    {y | y의 라벨은 M.
    노드 z∈F(x)에 대하여,
    링크 y-z는 데이터베이스 D에 포함됨}.
  13. 제8항 내지 제12항의 어느 한 항에 있어서,
    상기 처리부는, 상기 검색질문 Q의 링크 x-y마다, 해답 후보 f의 값 영역 중의 노드 f(x)와 f(y)를 연결하는 최단경로가 노드 z를 포함하고, 해답 후보 f의 값 영역 f(Q)가 노드 z를 포함하지 않는 해답 후보 f가 존재하는 노드 z의 라벨 리스트를 상기 표시부에 표시하는 단계;
    상기 처리부는, 상기 라벨 중에서 몇 개를 선택할 것을 지시하는 입력정보를 입력부로부터 입력하는 단계; 및
    처리부는, 상기 입력정보에 따라 상기 리스트의 요소를 라벨로 하는 노드 z와 링크 x-z 및 z-y를 검색질문 Q에 부가하는 단계;
    를 더 포함하여 이루어지는 것을 특징으로 하는 정보검색방법.
  14. 처리부는, 노드, 상기 노드의 라벨 및 상기 노드간의 링크에 대한 정보를 포함하는 검색질문 Q의 입력을 입력부로부터 받는 단계;
    상기 처리부는, 상기 노드의 라벨간의 유사도를 정의하는 시소러스 T를 기억한 시소러스 기억부를 참조하고, 상기 시소러스 T 중 사용 가능으로 된 부분에 있어서 정의되는 라벨간의 유사도를 이용하고, 입력된 상기 노드 및 라벨을 기억한 데이터베이스 D를 참조하여, 상기 검색질문 Q에 의한 상기 데이터베이스의 검색결과로서 해답 후보 집합 F를 구하는 검색단계;
    상기 처리부는, 구한 상기 해답 후보 집합 F를 표시부에 표시하는 단계;
    상기 처리부는, 상기 해답 후보 집합 F의 몇 개 요소가 해답에 해당하는지 아닌지에 대한 입력정보를 입력부로부터 입력하는 단계;
    상기 처리부는, 상기 입력정보에 따라 상기 해답 후보 집합 F의 몇 개의 요소를 상기 해답 후보 집합 F로부터 삭제하는 단계;
    상기 처리부는, 상기 입력부로부터의 상기 시소러스 T 및/또는 상기 검색질문 Q에 관한 삭제, 추가 또는 변경에 대한 입력정보에 근거하여, 상기 시소러스 T 및/또는 검색질문 Q의 내용을 삭제, 추가 또는 변경하는 단계; 및
    이용자로부터 재검색의 요구가 있으면 상기 검색단계로 되돌아가 처리를 반복하고, 한편, 그 요구가 없으면 처리를 종료하는 단계;
    를 포함하여 이루어지는 것을 특징으로 하는 정보검색 프로그램.
  15. 처리부는, 노드, 상기 노드의 라벨 및 상기 노드간의 링크에 대한 정보를 포함하는 검색질문 Q의 입력을 입력부로부터 받는 단계;
    상기 처리부는, 상기 노드의 라벨간의 유사도를 정의하는 시소러스 T를 기억한 시소러스 기억부를 참조하고, 상기 시소러스 T 중 사용 가능으로 된 부분에 있어서 정의되는 라벨간의 유사도를 이용하고, 입력된 노드 및 라벨을 기억한 데이터베이스 D를 참조하여, 상기 검색질문 Q에 의한 상기 데이터베이스의 검색결과로서해답 후보 집합 F를 구하는 검색단계;
    상기 처리부는, 구한 상기 해답 후보 집합 F를 표시부에 표시하는 단계;
    상기 처리부는, 상기 해답 후보 집합 F의 몇 개의 요소가 해답에 해당하는지 아닌지에 대한 입력정보를 입력부로부터 입력하는 단계;
    상기 처리부는, 상기 입력정보에 따라 상기 해답 후보 집합 F의 몇 개의 요소를 상기 해답 후보 집합 F로부터 삭제하는 단계;
    상기 처리부는, 상기 입력부로부터의 상기 시소러스 T 및/또는 상기 검색질문 Q에 관한 삭제, 추가 또는 변경에 대한 입력정보에 근거하여, 상기 시소러스 T 및/또는 검색질문 Q의 내용을 삭제, 추가 또는 변경하는 단계; 및
    이용자로부터 재검색의 요구가 있으면 상기 검색단계로 되돌아가 처리를 반복하고, 한편, 그 요구가 없으면 처리를 종료하는 단계;
    를 포함하여 이루어지는 것을 특징으로 하는 정보검색 프로그램을 기록한 컴퓨터를 읽을 수 있는 기록매체.
KR1020047005162A 2001-10-17 2002-05-22 정보검색방법, 정보검색 프로그램, 정보검색 프로그램을기록한 컴퓨터를 읽을 수 있는 기록매체 KR100593561B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2001-00319290 2001-10-17
JP2001319290 2001-10-17
PCT/JP2002/004945 WO2003034279A1 (fr) 2001-10-17 2002-05-22 Procede et programme de recherche d'information, support d'enregistrement lisible par ordinateur sur lequel est enregistre le programme de recherche d'information

Publications (2)

Publication Number Publication Date
KR20040101189A true KR20040101189A (ko) 2004-12-02
KR100593561B1 KR100593561B1 (ko) 2006-06-28

Family

ID=19136863

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020047005162A KR100593561B1 (ko) 2001-10-17 2002-05-22 정보검색방법, 정보검색 프로그램, 정보검색 프로그램을기록한 컴퓨터를 읽을 수 있는 기록매체

Country Status (6)

Country Link
US (1) US7346614B2 (ko)
EP (1) EP1445708A4 (ko)
JP (1) JPWO2003034279A1 (ko)
KR (1) KR100593561B1 (ko)
CN (1) CN100419746C (ko)
WO (1) WO2003034279A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7346614B2 (en) 2001-10-17 2008-03-18 Japan Science And Technology Corporation Information searching method, information searching program, and computer-readable recording medium on which information searching program is recorded
JP4385087B2 (ja) * 2003-03-24 2009-12-16 独立行政法人科学技術振興機構 生活情報支援システム
US20040215608A1 (en) 2003-04-25 2004-10-28 Alastair Gourlay Search engine supplemented with URL's that provide access to the search results from predefined search queries
CN100356352C (zh) * 2003-06-20 2007-12-19 华为技术有限公司 基于人机语言对用户进行在线帮助的方法
US7369677B2 (en) * 2005-04-26 2008-05-06 Verance Corporation System reactions to the detection of embedded watermarks in a digital host content
US8375048B1 (en) * 2004-01-20 2013-02-12 Microsoft Corporation Query augmentation
US8417697B2 (en) * 2005-08-22 2013-04-09 Google Inc. Permitting users to remove documents
US7805425B2 (en) * 2006-04-28 2010-09-28 Microsoft Corporation Efficient database lookup operations
US20090055346A1 (en) * 2007-08-23 2009-02-26 Yahoo! Inc. Scalable Ticket Generation in a Database System
US8943164B2 (en) * 2007-12-24 2015-01-27 Qualcomm Incorporated Apparatus and methods for retrieving/ downloading content on a communication device
JP5526396B2 (ja) * 2008-03-11 2014-06-18 クラリオン株式会社 情報検索装置、情報検索システム及び情報検索方法
CN101593181B (zh) * 2008-05-30 2011-03-23 英业达股份有限公司 跨词库字词翻译查询系统及其方法
US8027973B2 (en) * 2008-08-04 2011-09-27 Microsoft Corporation Searching questions based on topic and focus
US8244310B2 (en) 2010-02-16 2012-08-14 Research In Motion Limited Mobile communication device employing power pack with multiple pairs of taps
CN102682001B (zh) * 2011-03-09 2016-12-28 阿里巴巴集团控股有限公司 一种确定推荐词的方法及设备
JP2021117663A (ja) * 2020-01-24 2021-08-10 富士通株式会社 類似度計算装置、類似度計算方法、及びプログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2786194B2 (ja) 1987-11-27 1998-08-13 株式会社日立製作所 情報検索装置及び情報検索方法
JPH045760A (ja) 1990-04-24 1992-01-09 Hitachi Ltd 自然語処理方法および自然語処理システム
JP2943447B2 (ja) * 1991-01-30 1999-08-30 三菱電機株式会社 テキスト情報抽出装置とテキスト類似照合装置とテキスト検索システムとテキスト情報抽出方法とテキスト類似照合方法、及び、質問解析装置
US5421008A (en) * 1991-11-08 1995-05-30 International Business Machines Corporation System for interactive graphical construction of a data base query and storing of the query object links as an object
US6269368B1 (en) * 1997-10-17 2001-07-31 Textwise Llc Information retrieval using dynamic evidence combination
WO1999021110A1 (en) 1997-10-22 1999-04-29 Glaxo Group Ltd. Computer thesaurus manager
US6377259B2 (en) * 1998-07-29 2002-04-23 Inxight Software, Inc. Presenting node-link structures with modification
JP3577972B2 (ja) * 1998-10-19 2004-10-20 日本電信電話株式会社 類似度判定方法及び文書検索装置及び文書分類装置及び文書検索プログラムを格納した記憶媒体及び文書分類プログラムを格納した記憶媒体
JP2000123401A (ja) 1998-10-19 2000-04-28 Sony Corp 情報記録再生装置および方法、並びに光学ピックアップ
JP2001195428A (ja) 1999-11-02 2001-07-19 Atr Media Integration & Communications Res Lab 連想的情報探索装置
JP3581074B2 (ja) 2000-03-07 2004-10-27 日本電信電話株式会社 文書ダイジェスト作成方法、文書検索装置および記録媒体
JP2001282811A (ja) 2000-03-29 2001-10-12 Computer Consultant Kk 知識データ検索装置、知識データ検索方法及び知識データを検索するプログラムを記録したコンピュータ読み取り可能な記録媒体
US7346614B2 (en) 2001-10-17 2008-03-18 Japan Science And Technology Corporation Information searching method, information searching program, and computer-readable recording medium on which information searching program is recorded

Also Published As

Publication number Publication date
CN100419746C (zh) 2008-09-17
JPWO2003034279A1 (ja) 2005-02-03
KR100593561B1 (ko) 2006-06-28
EP1445708A4 (en) 2006-12-27
US7346614B2 (en) 2008-03-18
WO2003034279A1 (fr) 2003-04-24
US20060212424A1 (en) 2006-09-21
EP1445708A1 (en) 2004-08-11
CN1571966A (zh) 2005-01-26

Similar Documents

Publication Publication Date Title
KR100593561B1 (ko) 정보검색방법, 정보검색 프로그램, 정보검색 프로그램을기록한 컴퓨터를 읽을 수 있는 기록매체
US5926808A (en) Displaying portions of text from multiple documents over multiple databases related to a search query in a computer network
US9384245B2 (en) Method and system for assessing relevant properties of work contexts for use by information services
US6101503A (en) Active markup--a system and method for navigating through text collections
US6081804A (en) Method and apparatus for performing rapid and multi-dimensional word searches
US6944609B2 (en) Search results using editor feedback
US6442540B2 (en) Information retrieval apparatus and information retrieval method
US6523030B1 (en) Sort system for merging database entries
US5893094A (en) Method and apparatus using run length encoding to evaluate a database
US5761666A (en) Document retrieval system
JP3849318B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体
CA2245089A1 (en) Search system for providing fulltext search over web pages of world wide web servers
JP2007188509A (ja) 検索結果提供方法および2段階検索システム実施方法
Salton Automatic information retrieval
JP3612769B2 (ja) 情報検索装置および情報検索方法
JP4116599B2 (ja) 質問応答システム、方法及びプログラム
JP3856388B2 (ja) 類義性計算方法、類義性計算プログラム、類義性計算プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1115841A (ja) 情報検索装置及び情報検索プログラムを記録した媒体
KR100659370B1 (ko) 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법
JP5160120B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラム
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
JPH08153112A (ja) 文書作成装置及び文書作成方法
JP2001325293A (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
JPH08235191A (ja) 文書検索方法及び文書検索装置
KR20000012520A (ko) 시나리오를 갖는 정보의 인터넷 서비스 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20090522

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee