JPH11195041A - 文書検索装置、方法及び記録媒体 - Google Patents

文書検索装置、方法及び記録媒体

Info

Publication number
JPH11195041A
JPH11195041A JP10000853A JP85398A JPH11195041A JP H11195041 A JPH11195041 A JP H11195041A JP 10000853 A JP10000853 A JP 10000853A JP 85398 A JP85398 A JP 85398A JP H11195041 A JPH11195041 A JP H11195041A
Authority
JP
Japan
Prior art keywords
keyword
document
attribute
storage device
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10000853A
Other languages
English (en)
Other versions
JP3275813B2 (ja
Inventor
Takahiro Ikeda
崇博 池田
Akitoshi Okumura
明俊 奥村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP00085398A priority Critical patent/JP3275813B2/ja
Publication of JPH11195041A publication Critical patent/JPH11195041A/ja
Application granted granted Critical
Publication of JP3275813B2 publication Critical patent/JP3275813B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ユーザが入力した文に基づいて検索された文
書に対して、当該入力された文の意味内容を反映して順
位付けする。 【解決手段】 属性付キーワード格納装置4には、意味
・構造属性装置3によって意味的及び構造的な属性が付
与されたキーワードと、そのキーワードが属する文書格
納装置1内に格納された文書を特定する情報とが格納さ
れている。ユーザが入力装置5から文から、入力用キー
ワード抽出装置6は、キーワードを抽出する。入力用意
味属性付与装置7は、抽出されたキーワードに意味的な
属性を付与し、検索装置8は、属性付きキーワード格納
装置4を参照して、文書格納装置1から文書を検索す
る。意味・構造的適合度判定装置9によって入力装置5
から入力された文に含まれるキーワードの属性と、検索
された文書のキーワードの属性とが比較され、検索され
た文書と入力された文との適合度が判定される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ユーザが入力した
文に類似する文書を検索する文書検索装置、方法及びこ
の方法を実現するためのプログラムを記憶した記録媒体
に関し、特に、文書に含まれるキーワードの属性に基づ
いて検索された文書を順位付けて出力するものに関す
る。
【0002】
【従来の技術】従来より、大量の文書の中から目的の文
書を検索する方法として、ユーザが入力したキーワード
の組み合わせに従った検索式に適合する文書を検索する
方法や、ユーザが入力した文に類似する文書を検索する
ための検索式を生成し、その検索式に適合する文書を検
索する方法がある。
【0003】しかしながら、このような方法による検索
では、検索式が不適切であると、ユーザが検索したい目
的以外の文書が数多く検索され(検索のノイズ)、検索
結果から目的の文書を取り出すことが困難になるという
問題があった。このような問題点を解消するため、検索
された文書に対して順位付けをして、ユーザが目的の文
書と取り出すための指標を与える方法が、例えば、特開
平8−272783号公報や、特開平9−153066
号公報に開示されている。
【0004】特開平8−272783号公報に開示され
ている文書検索装置(以下、従来例1という)は、文や
段落等の検索単位を指定し、ユーザが入力した文中に含
まれるキーワードすべてを、指定した文書単位の中に含
む文書を優先的に順位付けて出力する。一方、特開平9
−153066号公報に開示されている文書検索装置
(以下、従来例2という)は、検索対象となる文書から
予め構文的な機能単位を抽出し、ユーザが入力した文と
同じ機能単位を含む文書を優先的に順位付けて出力す
る。また、従来例2では、ユーザが入力した文と同じ機
能単位を含む文書のうち、優先順位の高い機能単位を含
む文書を優先的に順位付けて出力するという技術の開示
されている。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来例1及び従来例2では、次に示すような問題があっ
た。例えば、ユーザが「A社を買収する」という文を入
力し、検索対象となる文書として「B社がA社を買収す
る」、「C社をA社が買収する」という2つの文書があ
る場合について考える。この場合、前者の文書の方が、
ユーザが入力した文の意味内容により適合していること
が明らかである。
【0006】このような場合、上記従来例1では、「A
社」及び「買収」というキーワードが抽出され、これら
のキーワードをすべて含む文書単位がある文書が同一の
優先順位で抽出される。従って、この場合は、検索対象
となる2つの文書は、順位付けがされることなく同一順
位で抽出されてしまうという問題点があった。一方、上
記従来例2では、検索対象となる2つの文書のいずれか
らも「A社」及び「買収する」という機能単位が抽出さ
れるため、検索対象となる2つの文書に優先順位を与え
ることができないという問題点があった。
【0007】また、上記従来例1では、キーワードが指
定された範囲内にあるかどうかにより検索された文書を
2群に分けるだけであるので、ユーザに対して十分に順
位付けされた検索結果を提供することができないという
問題点があった。一方、上記従来例2では、ユーザが入
力した文に適合する機能単位を1つも含まない文書に対
しては異なる順位を与えることができないので、やはり
十分に順位付けされた検索結果を提供することができな
いという問題点があった。
【0008】本発明は、上記従来例の問題点を解消する
ためになされたものであり、ユーザが入力した文に基づ
いて検索された文書に対して、当該入力された文の意味
内容を反映して順位付けすることができる文書検索装
置、方法及びこの方法を実現するプログラムを記憶する
記録媒体を提供することを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、本発明の第1の観点にかかる文書検索装置は、検索
対象となる文書を格納する文書格納装置と、前記文書格
納装置に格納される文書に含まれるキーワード及び該キ
ーワードのそれぞれに関する属性と、前記文書格納装置
に格納されている文書を特定するための情報とを関連付
けて格納するキーワード格納装置と、検索すべき文書の
キーワードを与えるキーワード付与装置と、前記キーワ
ード付与装置から与えられたキーワードのそれぞれに属
性を付与する第1の属性付与装置と、前記キーワード付
与装置から与えられたキーワードに基づいて、前記キー
ワード格納装置を参照して、前記文書格納装置から文書
を検索する検索装置と、前記検索装置が検索した文書に
対応する前記キーワード格納装置に格納されたキーワー
ドのそれぞれに関する属性と、前記第1の属性付与装置
によって付与されたキーワードの属性とを比較して、前
記検索装置によって検索された文書に順位付けをする順
位付け装置と、前記順位付け装置による順位付けに従っ
て、前記検索装置が検索した文書を出力する出力装置
と、を備えることを特徴とする。
【0010】上記文書検索装置では、前記順位付け装置
によって検索された文書に順位付けがされる。この順位
付けには、キーワードの属性、例えば、5W1H属性が
用いられ、この属性の一致度に従って検索された文書に
順位付けがされる。このため、前記キーワード付与装置
が与えたキーワードの属性に最も近い文書、すなわち与
えたキーワードの属性に対して最も意味内容が近くなる
ような文書が上位の順位のものとして出力される。従っ
て、意味内容を反映した形での文書の順位付けが可能と
なる。しかも、その一致度に従って細かい順位付けが可
能となる。
【0011】上記文書検索装置は、所望の文を外部から
入力する入力装置と、前記入力装置から入力された文か
らキーワードを抽出する第1のキーワード抽出装置と、
をさらに備えるてもよい。この場合、前記キーワード付
与装置から与えられるキーワードは、前記第1の抽出装
置が抽出したものとすることができる。
【0012】この場合、ユーザは文書の検索をするため
に所望の文を前記入力装置から入力すればよく、入力し
た文の意味内容を反映して検索された文書に順位付けす
ることが可能となる。
【0013】上記文書検索装置は、前記文書格納装置に
格納される文書からキーワードを抽出する第2のキーワ
ード抽出装置と、前記第2のキーワード抽出装置が抽出
したキーワードのそれぞれに属性を付与する第2の属性
付与装置と、をさらに備えるものとしてもよい。この場
合、前記キーワード格納装置に格納される前記キーワー
ドは前記第2のキーワード抽出装置が抽出したものとす
ることができ、前記キーワード格納装置に格納される該
キーワードのそれぞれに関する属性は前記第2の属性付
与装置によって付与されたものとすることができる。
【0014】上記文書検索装置において、前記キーワー
ド格納装置に格納されるキーワードのそれぞれに関する
属性は、例えば、意味的な属性と構造的な属性とからな
るものとすることができる。この場合、前記順位付け装
置は、前記意味的な属性と構造的な属性とに従って、前
記検索された文書に順位付けをするものとすることがで
きる。
【0015】上記文書検索装置は、出力すべき文書の順
位を外部から入力する順位入力装置をさらに備えるても
よい。この場合、前記出力装置は、前記順位付け装置に
よって順位付けされた文書のうち、前記順位入力装置か
ら入力された順位までの文書を出力するものとすること
ができる。
【0016】この場合、ユーザは、前記順位入力装置か
ら出力すべき文書の順位を入力することによって、検索
された文書のうちの所望の量の文書を得ることができ
る。
【0017】上記目的を達成するため、本発明の第2の
観点にかかる文書検索方法は、外部から所望の文を入力
することにより、該入力された文に従って文書格納装置
に格納されている文書を検索する文書検索方法であっ
て、前記文書格納装置に格納される文書からキーワード
を抽出する第1のキーワード抽出ステップと、前記第1
のキーワード抽出ステップで抽出されたキーワードのそ
れぞれに属性を付与する第1の属性付与ステップと、前
記第1のキーワード抽出ステップで抽出されたキーワー
ドと、前記第1の属性付与ステップで付与された前記キ
ーワードの属性とを、前記文書格納装置に格納される文
書を特定するための情報と関連付けてキーワード格納装
置に格納させるキーワード格納ステップと、外部から所
望の文を入力する入力ステップと、前記入力ステップで
入力された文からキーワードを抽出する第2のキーワー
ド抽出ステップと、前記第2のキーワード抽出ステップ
で抽出されたキーワードのそれぞれに属性を付与する第
2の属性付与ステップと、前記第2のキーワード抽出ス
テップで抽出されたキーワードに基づいて、前記キーワ
ード格納装置を参照して、前記文書格納装置から文書を
検索する検索ステップと、前記検索ステップで検索され
た文書に対応する前記キーワード格納装置に格納された
キーワードのそれぞれに関する属性と、前記第2の属性
付与ステップで付与されたキーワードの属性とを比較し
て、前記検索ステップで検索された文書に順位付けする
順位付けステップと、前記順位付けステップにおける順
位付けに従って、前記検索ステップで検索された文書を
出力する出力ステップと、を含むことを特徴とする。
【0018】上記目的を達成するため、本発明の第3の
観点にかかる記録媒体は、外部から所望の文を入力する
ことにより、該入力された文に従って文書格納装置に格
納されている文書を検索するプログラムを実現するため
のプログラムを記録するコンピュータ読み取り可能な記
録媒体であって、前記文書格納装置に格納される文書か
らキーワードを抽出する第1のキーワード抽出ステップ
と、前記第1のキーワード抽出ステップで抽出されたキ
ーワードのそれぞれに属性を付与する第1の属性付与ス
テップと、前記第1のキーワード抽出ステップで抽出さ
れたキーワードと、前記第1の属性付与ステップで付与
された前記キーワードの属性とを、前記文書格納装置に
格納される文書を特定するための情報と関連付けてキー
ワード格納装置に格納させるキーワード格納ステップ
と、外部から所望の文を入力する入力ステップと、前記
入力ステップで入力された文からキーワードを抽出する
第2のキーワード抽出ステップと、前記第2のキーワー
ド抽出ステップで抽出されたキーワードのそれぞれに属
性を付与する第2の属性付与ステップと、前記第2のキ
ーワード抽出ステップで抽出されたキーワードに基づい
て、前記キーワード格納装置を参照して、前記文書格納
装置から文書を検索する検索ステップと、前記検索ステ
ップで検索された文書に対応する前記キーワード格納装
置に格納されたキーワードのそれぞれに関する属性と、
前記第2の属性付与ステップで付与されたキーワードの
属性とを比較して、前記検索ステップで検索された文書
に順位付けする順位付けステップと、前記順位付けステ
ップにおける順位付けに従って、前記検索ステップで検
索された文書を出力する出力ステップと、を実現するプ
ログラムを記憶することを特徴とする。
【0019】
【発明の実施の形態】以下、添付図面を参照して、本発
明の実施の形態について説明する。
【0020】図1は、本発明の実施の形態の文書検索装
置の機能構成を示す機能ブロック図である。この実施の
形態の文書検索装置は、単一のコンピュータシステムに
よって構成され、図示するように、文書格納装置1と、
キーワード抽出装置2と、意味・構造属性付与装置3
と、属性付キーワード格納装置4と、入力装置5と、入
力用キーワード抽出装置6と、入力用意味属性付与装置
7と、検索装置8と、意味・構造的適合度判定装置9
と、出力装置10とを含む。
【0021】文書格納装置1は、磁気ディスクやCD−
ROMなどの記憶媒体によって構成され、検索対象とな
る文書を格納する。文書格納装置1に格納される文書
は、ユーザがキーボードから入力したものや通信回線を
介して配信されたものとすることができる。
【0022】キーワード抽出装置2は、CPU(中央処
理装置)とこのCPUの処理プログラムを記憶した記憶
装置によって構成され、実行されるプログラムに従って
文書格納装置1に格納されている各文書からキーワード
を抽出する。キーワード抽出装置2によるキーワードの
抽出は、文書格納装置1に格納されている文書中の各文
を形態素解析し、名詞や動詞などの特定の品詞を抽出す
ることによって行われる。
【0023】意味・構造属性付与装置3は、CPUとこ
のCPUの処理プログラムを記憶した記憶装置によって
構成され、実行されるプログラムに従ってキーワード抽
出装置2によって抽出されたキーワードに対して文書中
でのそのキーワードの意味的な属性および構造的な属性
を付与する。
【0024】意味・構造属性付与装置3が付与する意味
的な属性として、キーワードの5W1H属性が用いられ
る。ここで、5W1H属性とは、そのキーワードが文書
中で果たしている、Who(だれが)、When(い
つ)、Where(どこで)、What(なにを)、W
hy(なぜ)、How(どうした)という5W1Hの何
れかの役割のことをいう。例えば、「A社が商品Xを発
売した。」という文から「A社」、「商品X」、「発
売」という3つのキーワードが抽出された場合、「A
社」の5W1H属性はWho、「商品X」の5W1H属
性はWhat、「発売」の5W1H属性はHowとな
る。
【0025】各キーワードに付与する5W1H属性は、
文中でキーワードの後に続く単語列やキーワード自身が
含む文字、キーワード自身の品詞等によって判別可能で
ある。例えば、「が」が後に続くキーワードの5W1H
属性はWho、「月」あるいは「日」等の日時を表す文
字を含み、「に」が後に続くキーワードの5W1H属性
はWhen、「県」あるいは「市」等の場所を表す文字
を含み、「に」が後に続くキーワードの5W1H属性は
When、「を」が後に続くキーワードの5W1H属性
はWhat、「のため」が後に続くキーワードの5W1
H属性はWhy、品詞が動詞であるキーワードの5W1
H属性はHowなどとすることができる。このほかに
も、組織名や地名を表す単語等を前もって収集してお
き、キーワードをそれらと照らし合わせて、組織名なら
5W1H属性をWhoに、地名なら5W1H属性をWh
ereにする等も可能である。また、文書が発行された
日をWhen属性のキーワードとして採用する等、文書
の本文以外の文書に付けられている属性を利用すること
もできる。
【0026】意味・構造属性付与装置3が付与する構造
的な属性として、キーワードが属する文書の階層的な構
造の単位が用いられる。ここで、文書の階層的な構造の
最下位の単位として、5W1Hの意味単位がある。例え
ば、「A社は、B社が製造する製品Xを販売する。」と
いう文は、Who=B社、What=製品X、How=
製造という意味単位と、Who=A社、What=製品
X、How=販売という意味単位の2つの意味単位があ
る。さらにこれらの意味単位より上位の構造の単位とし
て、文や段落や章などがある。
【0027】意味・構造属性付与装置3は、これらの構
造の単位のうちのいくつかを、キーワードの構造的な属
性として利用する。例えば、5W1Hの意味単位と、文
とをキーワードの構造的な属性として利用する場合、対
象のキーワードが文書中のどの意味単位に含まれるか、
および、文書中のどの文に含まれるかという情報が、キ
ーワードの構造的な属性になる。それぞれの構造の単位
に、文書中でそれを一意に特定することができる番号を
付与することで、キーワードの構造的な属性は、番号と
して扱うことができる。
【0028】属性付キーワード格納装置4は、意味・構
造属性装置3によって意味的及び構造的な属性が付与さ
れたキーワードと、そのキーワードが属する文書格納装
置1内に格納された文書を特定する情報とを対応付けて
格納する。
【0029】入力装置5は、ユーザーの入力を受け取る
キーボード等の装置によって構成され、ユーザが検索対
象として所望する文を入力する。
【0030】入力用キーワード抽出装置6は、CPUと
このCPUの処理プログラムを記憶した記憶装置によっ
て構成され、実行されるプログラムに従ってユーザーが
入力装置5から入力した文からキーワードを抽出する。
入力用キーワード抽出装置6によるキーワードの抽出方
法は、キーワード入力装置2によるものと同一ものとす
ることができる。
【0031】入力用意味属性付与装置7は、CPUとこ
のCPUの処理プログラムを記憶した記憶装置によって
構成され、実行されるプログラムに従って入力用キーワ
ード抽出装置6によって抽出されたキーワードに対し
て、入力文中でのそのキーワードの意味的な属性を付与
する。入力用意味属性付与装置7による意味的な属性の
付与方法は、意味・構造属性付与装置3によるものと同
一ものとすることができる。
【0032】検索装置8は、属性付キーワード格納装置
3を参照して、入力用キーワード抽出装置6により抽出
されたキーワードをすべて含む文書を文書格納装置1か
ら検索する。
【0033】意味・構造的適合度判定装置9は、CPU
とこのCPUの処理プログラムを記憶した記憶装置によ
って構成され、処理プログラムに従って入力用意味属性
付与装置7により意味的な属性が付与されたキーワード
と、属性付キーワード格納装置3に格納されている、意
味的および構造的な属性が付与されたキーワードとを比
較することにより、入力装置5から入力された文に対す
る検索装置8によって検索された文書の適合度を判定す
る。意味・構造的適合度判定装置9は、適合度を付与し
た文書を、その判定結果に従って適合度が高い順に出力
装置10に供給する。
【0034】出力装置10は、ディスプレイ装置や印刷
装置等によって構成され、意味・構造的適合度判定装置
9から供給された文書を出力する。
【0035】なお、上記の文書検索装置において、文書
格納装置1と属性付キーワード格納装置4とは、同一の
記録媒体によって構成されていても、別の記録媒体によ
って構成されていてもよい。また、キーワード抽出装置
2、意味・構造属性付与装置3、入力用キーワード抽出
装置6、入力用意味属性付与装置7及び意味・構造的適
合度判定装置9は、同一のCPU及び記憶装置によって
構成されている。もっとも、これらは互いに別個のCP
U及び/または記憶装置によって構成されていてもよ
い。
【0036】以下、この実施の形態の文書検索装置にお
ける動作について説明する。この文書検索装置における
動作は、文書から抽出したキーワードを属性付キーワー
ド格納装置3に登録する登録動作と、ユーザーが入力し
た文に類似する文書を検索し、検索された文書を入力さ
れた文との適合度によって順位付けして出力する検索動
作に分けれられる。
【0037】まず、図2のフローチャートを参照して、
この実施の形態の文書検索装置における登録動作につい
て説明する。図2のフローチャートに示す登録動作の処
理は、新しい文書が文書格納装置1に追加される度に実
行される。
【0038】新しい文書が文書格納装置1に追加される
と、キーワード抽出装置2は、その文書からキーワード
を抽出する(ステップA1)。キーワード抽出装置1に
よってキーワードが抽出されると、意味・構造属性付与
装置3は、抽出されたキーワードのそれぞれに対して、
意味的な属性として5W1H属性を付与する(ステップ
A2)。
【0039】抽出されたキーワードのそれぞれに対して
意味的な属性が付与されると、意味・構造属性付与装置
3は、次に、抽出されたキーワードのそれぞれに対して
構造的な属性を付与する(ステップA3)。構造的な属
性のうち、5W1Hの意味単位については、ステップA
2の処理の結果を利用して認定することができる。文や
段落や章などの構造の単位については、句点で区切られ
る部分を文、改行記号と空白文字の連続により区切られ
る部分を段落などとすることにより認定することが可能
である。
【0040】意味・構造属性付与装置3は、さらに、ス
テップA2およびA3で意味的および構造的な属性付与
されたキーワードと、そのキーワードが抽出された文書
を特定する情報とを対応づけて、属性付キーワード格納
装置4に登録する(ステップA4)。キーワードの登録
が終了すると、図2のフローチャートに示す登録動作の
処理が終了する。
【0041】次に、図3のフローチャートを参照して、
本発明の実施の形態における検索動作について説明す
る。図3のフローチャートに示す検索動作の処理は、ユ
ーザーが入力装置4から文を入力する度に行われる。
【0042】ユーザーが入力装置5から文を入力する
と、入力用キーワード抽出装置6は、入力された文から
キーワードを抽出する(ステップB1)。抽出されたキ
ーワードは、入力用属性付与装置7と検索装置8とに渡
される。
【0043】入力用キーワード抽出装置5が抽出したキ
ーワードが渡されると、入力用意味属性付与装置7は、
抽出されたキーワードのそれぞれに対して意味的な属性
として5W1H属性を付与する(ステップB2)。これ
らの処理における入力用キーワード抽出装置6および入
力用意味属性付与装置7の動作は、図2のステップA1
におけるキーワード抽出装置2の動作およびステップA
2における意味・構造属性付与装置3の動作と同一なの
で、詳細な説明は省略する。
【0044】検索装置8は、入力用キーワード抽出装置
6から抽出されたキーワードを受け取ると、属性付キー
ワード格納装置7からこれらの抽出されたキーワードす
べてを含む文書を検索する(ステップB3)。
【0045】意味・構造的適合度判定装置9は、検索装
置8によって検索された文書を、入力文と文書との適合
度に応じて出力する。ここで、入力文と文書との適合度
は、入力文より抽出されたキーワードが検索された文書
中で持つ構造的な属性のうち、すべてのキーワード間で
一致するものが多いほど高いものとする。構造的な属性
は、階層的な構造の単位に対応しているので、キーワー
ド間で下位の構造の単位についての属性が一致している
場合には、上位の構造の単位についても属性は一致す
る。したがって、入力文より抽出されたすべてのキーワ
ード間で、より下位の構造の単位に関する属性まで一致
しているほど、入力文と文書との適合度が高いことにな
る。入力文より抽出されたキーワードが検索された文書
中で持つ構造的な属性すべてが、すべてのキーワード間
で一致する場合には、さらに、入力文より抽出されたす
べてのキーワードについて、各キーワードの意味的な属
性が、そのキーワードが検索された文書中で持つ意味的
な属性と一致している場合に、入力文と文書とは、より
高い適合度を持つものとする。このキーワードの意味的
な属性に基づく適合度の高低は、入力文より抽出された
キーワードが検索された文書中で持つ構造的な属性のう
ち、すべてのキーワード間で一致しないものがある場合
には考慮しない。
【0046】意味・構造的適合度判定装置9は、検索装
置8によって検索された文書のうちもっとも適合度の高
い文書から順に出力するために、出力する文書の適合度
をもっとも高く設定する(ステップB4)。意味・構造
的適合度判定装置9は、属性付キーワード格納装置3を
参照して、検索装置8によって検索された文書のうちス
テップB4で設定した適合度となるものを選択する(ス
テップB5)。
【0047】意味・構造的適合度判定装置9は、選択し
た文書に適合度を付与して出力装置10に供給する。こ
れにより、表示装置への表示或いは印刷装置による用紙
上への印刷によって、意味・構造的適合度判定装置9か
ら出力装置10に供給された文書が出力され、ユーザに
示される(ステップB6)。
【0048】ステップB5及びB6の処理に従って設定
されている適合度に対応する文書が出力されると、意味
・構造的適合度判定装置9は、設定されている適合度が
もっとも低いものかどうかを判定する(ステップB
7)。
【0049】ステップB7で設定されている適合度が最
も低い適合度でないと判定された場合には、適合度を1
レベル低く設定し直し(ステップB8)、ステップB4
ないしB7の処理を繰り返す。一方、ステップB7で設
定されている適合度が最も低い適合度であると判定され
た場合には、図3のフローチャートに示す検索動作の処
理が終了する。
【0050】以下、この実施の形態の文書検索装置にお
ける動作について、より具体的な例をもって説明する。
以下の説明において、文書格納装置1には、図4に示す
#1ないし#4の4つの文書が順に追加されるものとす
る。但し、図4に示す#1乃至#4の文書が登録される
前には、文書格納装置1に格納されている文書はないも
のとする。
【0051】文書格納装置1に#1乃至#4の文書が追
加される毎に、キーワード抽出装置2が追加された文書
からキーワードを抽出し(ステップA1)、意味・構造
属性付与装置3が各キーワードに意味的な属性として5
W1H属性を付与する(ステップA2)。
【0052】ここで、意味・構造属性付与装置3は、以
下のような規則に従い、各キーワードに5W1H属性を
付与するものとする。 (1)助詞「が」または助詞「は」が後に続くキーワー
ドの5W1H属性はWhoとする。 (2)助詞「を」または助詞「に」が後に続くキーワー
ドの5W1H属性はWhatとする。 (3)各文中で最も後ろに出現する、品詞が動詞または
サ行変格活用名詞であるキーワードの5W1H属性はH
owとする。 (4)助詞「と」が後に続くキーワードの5W1H属性
は、次のキーワードの5W1H属性と同一のものにす
る。 (5)5W1H属性がHowであるキーワードの直後の
キーワードは、5W1H属性がHowであるキーワード
の直前のキーワードがWhatであればWhoとし、W
hoであればWhatとする。 このような規則に従って、意味・構造属性付与装置3に
よって5W1H属性が付与されたキーワードは、図5に
示すものとなる。
【0053】意味・構造属性付与装置3は、次に、各キ
ーワードに文書の構造的な属性として、文書が階層的な
構造の単位のどれに属しているかという情報を付与する
(ステップA3)。
【0054】ここでは、階層的な構造の単位として、意
味単位と文とを用いることにすると、意味・構造属性付
与装置3は、ステップA2において5W1H属性を付与
した際の情報を利用して、各キーワードがどの意味単位
にあるかを認定し、句点の位置から、各キーワードがど
の文にあるかを認定する。各キーワードが属する意味単
位の認定は、例えば、以下のような規則に従って行うこ
とができる。 (1)5W1H属性がHowであるキーワードの直前お
よび直後のキーワードは、その5W1H属性がHowで
あるキーワードと同一の意味単位に属するものとする。 (2)5W1H属性がHowであるキーワードの2つ前
のキーワードは、その5W1H属性がHowであるキー
ワードの直後に同じ5W1H属性を持つキーワードがな
い場合に限り、その5W1H属性がHowであるキーワ
ードと同一の意味単位に属するものとする。 この場合、図5で1行に描かれているWho・What
・Howのキーワードの組が、それぞれ1つの意味単位
として認定される。
【0055】意味・構造属性付与装置3は、こうして意
味的および構造的な属性が付与されたキーワードを属性
付キーワード格納装置4に格納する。ここで、属性付キ
ーワード格納装置4は、それぞれの文書中で図5の各意
味単位を上から順に番号をつけて管理するものとし、ま
た、各文を出現する順に番号をつけて管理するものとす
る。すると、この例において属性付きキーワード格納装
置4に格納されるキーワードは、図6に示すものとにな
る。なお、図6では、説明の便宜上、格納されるキーワ
ードとそのキーワードの意味的及び構造的な属性の組か
らなるレコードのそれぞれにレコード番号が付与されて
いる。
【0056】このような状態で、ユーザーが「A社がB
社を提訴する。」という文を入力した場合について考え
る。この文の入力によって、上記の図3に示した検索動
作の処理が行われる。
【0057】まず、入力用キーワード抽出装置6は、ス
テップA1におけるキーワード抽出装置2の処理と同様
の処理を行い、入力された文からキーワードを抽出する
(ステップB1)。この例では、入力文から「A社」、
「B社」、「提訴」という3つのキーワードが抽出され
る。
【0058】次に、入力用意味属性付与装置7は、ステ
ップA2における意味・構造属性付与装置3の処理と同
様の処理を行い、抽出されたキーワードに対して意味的
な属性を付与する(ステップB2)。この例では、「A
社」に対してWho、「B社」に対してWhat、「提
訴」に対してHowという意味的な属性が付与される。
【0059】検索装置8は、入力用キーワード抽出装置
6によって抽出されたキーワードすべてを含む文書を属
性付キーワード格納装置4から検索する(ステップB
3)。この例の場合、図6に示すように、属性付キーワ
ード格納装置4において、「A社」というキーワード
は、レコード番号7、10、14、16、20、24の
レコードに存在している。これらのレコードは、それぞ
れ文書番号1、2、2、3、3、4の文書が対応してお
り、「A社」というキーワードは、図4に示す#1から
#4のすべての文書に含まれている。同様に、「B社」
および「提訴」というキーワードも#1から#4のすべ
ての文書に含まれている。従って、図4に示す#1から
#4のすべての文書が検索装置8によって検索され、検
索結果として意味・構造的適合度判定装置9に渡され
る。
【0060】次に、意味・構造的適合度判定装置9によ
る処理に移る。意味・構造適合度判定装置9は、出力す
る文書の適合度をもっとも高く設定する。ここで、適合
度のレベルとして、以下に示すレベル1(最低)からレ
ベル4(最高)までがあるとすると、意味・構造的適合
度判定装置9は、適合度のレベルをレベル4に設定す
る。 レベル4:「A社」、「B社」、「提訴」の3つのキー
ワードが、文書中で同一の文および意味単位に属し、か
つ、その文書中で「A社」がWho、「B社」がWha
t、「提訴」がHowの意味的な属性を持つ。 レベル3:「A社」、「B社」、「提訴」の3つのキー
ワードが、文書中で同一の文および意味単位に属する
が、その文書中で「A社」がWho、「B社」がWha
t、「提訴」がHowの意味的な属性を持つわけではな
い。 レベル2:「A社」、「B社」、「提訴」の3つのキー
ワードが、文書中で同一の意味単位には属さないが、同
一の文に属する。 レベル1:「A社」、「B社」、「提訴」の3つのキー
ワードが、文書中で同一の意味単位にも同一の文にも属
さない。
【0061】次に、意味・構造的適合度判定装置9は、
属性付キーワード格納装置4を参照して、検索された文
書から適合度がレベル4のものを選択する(ステップB
5)。そして、意味・構造的適合度判定装置9は、選択
したレベル4の適合度を有する文書に対して適合度のレ
ベル4を付与して出力装置10に供給する。ここで供給
された文書は、出力装置10から出力されたユーザに示
される(ステップB6)。
【0062】ここで、図6を参照すると、レコード番号
7のキーワード「A社」、レコード番号8のキーワード
「B社」、レコード番号9のキーワード「提訴」は、文
書番号#1の文書中で同一の文および意味単位に属し、
かつ、その文書中で「A社」がWho、「B社」がWh
at、「提訴」がHowの意味的な属性を持つ。このた
め、文書番号#1の文書は、レベル4の適合度の条件を
満たす。同様に、文書番号#3の文書もレベル4の適合
度の条件を満たす。従って、ここでは、文書番号#1と
#3の文書が、レベル4の文書として出力される。
【0063】次に、ステップB7における判定では、適
合度のレベル4は、最も低いものでないので、適合度の
レベルがレベル3に設定し直されて(ステップB8)、
ステップB5の処理に戻る。この適合度のレベルが3に
設定されているときに、同様の処理によって文書番号#
2の文書が選択されて出力される(ステップB5、B
6)。
【0064】次に、ステップB7における判定では、適
合度のレベル3は、最も低いものでないので、適合度の
レベルがレベル2に設定し直されて(ステップB8)、
ステップB5の処理に戻る。この適合度のレベルが2に
設定されているときに、同様の処理によって文書番号#
4の文書が選択されて出力される(ステップB5、B
6)。
【0065】次に、ステップB7における判定では、適
合度のレベル2は、最も低いものでないので、適合度の
レベルがレベル1に設定し直されて(ステップB8)、
ステップB5の処理に戻る。図6を参照すると、この適
合度のレベルが1に設定されているときには、選択、出
力される文書はない(ステップB5、B6)。そして、
次のステップB7における判定で、適合度のレベル1
は、最も低いものとなっているので、文書検索動作の処
理が終了する。
【0066】以上の結果、この例では、適合度のレベル
4の文書として、#1および#3が、適合度レベル3の
文書として#2が、適合度のレベル2の文書として#4
が出力される。ユーザーが入力した文「A社がB社を提
訴する。」においては、「A社」がWho、「B社」が
What、「提訴」がHowという意味内容になってい
るが、それと同じ意味内容を含む#1および#3がもっ
とも高い適合度の文として出力されている。また、「B
社がA社を提訴する」という、「A社」がWhat、
「B社」がWho、「提訴」がHowという意味内容を
含む文書#2は、その次に適合度が高い文として出力さ
れる。「A社」、「B社」、「提訴」の3つのキーワー
ドが存在するものの「A社」と「B社」の間の「提訴」
についての情報を含んでいない文書#4は、さらに低い
適合度の文として出力されている。
【0067】以上説明したように、この実施の形態の文
書検索装置では、同一の意味単位中に入力された文から
抽出されたキーワードすべてを含み、互いのキーワード
の意味的な属性が一致する文書が、適合度がもっとも高
い文書として出力される。このため、ユーザーが入力装
置5から入力した文の意味内容を、検索された文書の順
位付けに明確に反映することが可能となる。
【0068】この実施の形態の文書検索装置では、各文
書からキーワードを抽出する際に、キーワードに階層的
な構造の単位のどれに属しているかという構造的な属性
を付与される。そして、入力された文から抽出されたキ
ーワードが持つ構造的な属性のうち、一致している属性
をもつキーワードが多い文書ほど、適合度が高くなるよ
うに順序づけされて出力される。このため、ユーザーが
入力した文の内容にもっともよく適合する文書以外の文
書についても、一様に細かく順位を付与することができ
る。
【0069】上記の実施の形態では、キーワード抽出装
置2が文書格納装置1に格納されている文書から抽出し
たキーワード、及び入力用キーワード抽出装置6が入力
装置5から入力された文から抽出したキーワードに意味
的な属性として5W1H属性が付与されていた。しかし
ながら、これらのキーワードに付与する意味的な属性は
5W1H属性である必要はなく、例えば、主語、述語、
直接目的語、間接目的語、或いは補語などとしてもよ
い。
【0070】上記の実施の形態では、適合度に応じて検
索された文書が順に出力されていた。これに対して、図
7に示すように、ユーザーが結果として出力すべき文書
と入力文との適合度を適合度入力装置31から入力し、
意味・構造的適合度判定装置9は、ユーザーが適合度入
力装置31から入力したした適合度に等しいかまたはそ
れより高い適合度を持つ文書のみを出力させるものとし
てもよい。この場合、ユーザーが出力される文書の量に
従って出力すべき文書の適合度を変化させることによっ
て、ユーザーは、入力した文書と適合度が高いものから
順に適切な量の文書を得ることができる。なお、上記の
実施の形態における適合度のレベル数は任意である。
【0071】上記の実施の形態では、本発明の文書検索
装置を単一の情報処理装置で実現した場合について説明
した。しかしながら、クライアント−サーバシステムに
おけるサーバでも、本発明の文書検索装置を実現するこ
とができる。本発明を実現するクライアント−サーバシ
ステムの例を図8及び図9に示す。
【0072】図8に示す例では、サーバSvには、文書
格納装置1と、キーワード抽出装置2と、意味・構造属
性付与装置3と、属性付キーワード格納装置4と、入力
用キーワード抽出装置6と、入力用意味属性付与装置7
と、検索装置8と、意味・構造的適合度判定装置9と、
通信装置11とが含まれる。一方、図9に示す例では、
サーバSvには、文書格納装置1と、キーワード抽出装
置2と、意味・構造属性付与装置3と、属性付キーワー
ド格納装置4と、検索装置8と、意味・構造的適合度判
定装置9と、通信装置11のみが含まれる。
【0073】ここで、図8に示す例では、クライアント
Clの処理装置21は、入力装置22から入力された文
を通信装置23及び通信回線0を介して、サーバSvの
通信装置11に送信すればよい。一方、図9に示す例で
は、クライアントClの処理装置21は、入力用キーワ
ード抽出装置6と、入力用意味属性付与装置7とを有し
ており、入力装置22から入力された文からキーワード
を抽出し、キーワードと意味属性の組を通信装置23及
び通信装置0を介して、サーバSvの通信装置11に送
信すればよい。
【0074】そして、サーバSvでは、上記と同様の処
理によって適合度毎に文書を抽出し、通信装置11から
通信回線0を介してクライアントClの通信装置23に
送信することができる。この場合、クライアントClの
処理装置は、受信した文書を適合度毎に出力装置24か
ら出力することができる。
【0075】ここで、図8に示すクライアント−サーバ
システムと、図9に示すクライアント−サーバシステム
とを比較した場合に、図9に示すシステムでは、サーバ
Svは、キーワード抽出装置2を実現するためのプログ
ラムモジュールと入力用キーワード抽出装置7を実現す
るためのプログラムモジュール、及び意味・構造不要装
置3を実現するためのプログラムモジュールと入力用意
味属性付与装置7を実現するためのプログラムモジュー
ルを共有でき、クライアントClがこのようなプログラ
ムモジュールを有しなくてもよい。このため、図8に示
すシステム構成の方が、図9に示すシステム構成よりも
有利である。なお、図8及び図9において、通信回線0
は、LAN(Local Area Network)回線とWAN(Wide
Area Network)回線とのいずれでもよい。
【0076】上記の実施の形態では、キーワード抽出装
置2、意味・構造属性付与装置3、入力用キーワード抽
出装置6、入力用意味属性付与装置7及び意味・構造的
適合度判定装置9を構成するCPUが実行する処理プロ
グラムは、記憶装置に記憶されているものとした。しか
しながら、これらのCPUが実行するための処理プログ
ラムは、CD−ROMやフロッピーディスクなどの記録
媒体に格納して提供され、記憶装置にインストールされ
て実行されるものとしてもよい。
【0077】
【発明の効果】以上説明したように、本発明によれば、
意味内容を反映した形での文書の順位付けが可能とな
る。
【図面の簡単な説明】
【図1】本発明の実施の形態にかかる文書検索装置の機
能構成を示す機能ブロック図である。
【図2】本発明の実施の形態の文書検索装置における登
録動作を示すフローチャートである。
【図3】本発明の実施の形態の文書検索装置における検
索動作を示すフローチャートである。
【図4】本発明の実施の形態における対象文書のリスト
の例を示す図である。
【図5】本発明の実施の形態において対象文書から抽出
されたキーワードとキーワードに付与された意味的な属
性を示す表の例を示す図である。
【図6】本発明の実施の形態における属性付キーワード
格納装置の内容を示す表の例を示す図である。
【図7】本発明の実施の形態の変形例にかかる文書検索
装置の機能構成を示す機能ブロック図である。
【図8】本発明の実施の形態の変形例にかかる文書検索
システムの機能構成を示す図である。
【図9】本発明の実施の形態の変形例にかかる文書検索
システムの機能構成を示す図である。
【符号の説明】
0 通信回線 1 文書格納装置 2 キーワード抽出装置 3 意味・構造的属性付与装置 4 属性付キーワード格納装置 5 入力装置 6 入力用キーワード抽出装置 7 入力用意味属性付与装置 8 検索装置 9 意味・構造的適合度判定装置 10 出力装置 21 処理装置 22 入力装置 23 通信装置 24 出力装置 31 適合度入力装置 Cl クライアント Sv サーバ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI G06F 15/403 370Z

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】検索対象となる文書を格納する文書格納装
    置と、 前記文書格納装置に格納される文書に含まれるキーワー
    ド及び該キーワードのそれぞれに関する属性と、前記文
    書格納装置に格納されている文書を特定するための情報
    とを関連付けて格納するキーワード格納装置と、 検索すべき文書のキーワードを与えるキーワード付与装
    置と、 前記キーワード付与装置から与えられたキーワードのそ
    れぞれに属性を付与する第1の属性付与装置と、 前記キーワード付与装置から与えられたキーワードに基
    づいて、前記キーワード格納装置を参照して、前記文書
    格納装置から文書を検索する検索装置と、 前記検索装置が検索した文書に対応する前記キーワード
    格納装置に格納されたキーワードのそれぞれに関する属
    性と、前記第1の属性付与装置によって付与されたキー
    ワードの属性とを比較して、前記検索装置によって検索
    された文書に順位付けをする順位付け装置と、 前記順位付け装置による順位付けに従って、前記検索装
    置が検索した文書を出力する出力装置と、を備えること
    を特徴とする文書検索装置。
  2. 【請求項2】所望の文を外部から入力する入力装置と、 前記入力装置から入力された文からキーワードを抽出す
    る第1のキーワード抽出装置と、を備え、 前記キーワード付与装置から与えられるキーワードは、
    前記第1の抽出装置が抽出したものであることを特徴と
    する請求項1に記載の文書検索装置。
  3. 【請求項3】前記文書格納装置に格納される文書からキ
    ーワードを抽出する第2のキーワード抽出装置と、 前記第2のキーワード抽出装置が抽出したキーワードの
    それぞれに属性を付与する第2の属性付与装置と、を備
    え、 前記キーワード格納装置に格納される前記キーワードは
    前記第2のキーワード抽出装置が抽出したものであり、
    前記キーワード格納装置に格納される該キーワードのそ
    れぞれに関する属性は前記第2の属性付与装置によって
    付与されたものであることを特徴とする請求項1または
    2に記載の文書検索装置。
  4. 【請求項4】前記キーワード格納装置に格納されるキー
    ワードのそれぞれに関する属性は、意味的な属性と構造
    的な属性とからなり、 前記順位付け装置は、前記意味的な属性と構造的な属性
    とに従って、前記検索された文書に順位付けをすること
    を特徴とする請求項1乃至3のいずれか1項に記載の文
    書検索装置。
  5. 【請求項5】出力すべき文書の順位を外部から入力する
    順位入力装置を備え、 前記出力装置は、前記順位付け装置によって順位付けさ
    れた文書のうち、前記順位入力装置から入力された順位
    までの文書を出力することを特徴とする請求項1乃至4
    のいずれか1項に記載の文書検索装置。
  6. 【請求項6】外部から所望の文を入力することにより、
    該入力された文に従って文書格納装置に格納されている
    文書を検索する文書検索方法であって、 前記文書格納装置に格納される文書からキーワードを抽
    出する第1のキーワード抽出ステップと、 前記第1のキーワード抽出ステップで抽出されたキーワ
    ードのそれぞれに属性を付与する第1の属性付与ステッ
    プと、 前記第1のキーワード抽出ステップで抽出されたキーワ
    ードと、前記第1の属性付与ステップで付与された前記
    キーワードの属性とを、前記文書格納装置に格納される
    文書を特定するための情報と関連付けてキーワード格納
    装置に格納させるキーワード格納ステップと、 外部から所望の文を入力する入力ステップと、 前記入力ステップで入力された文からキーワードを抽出
    する第2のキーワード抽出ステップと、 前記第2のキーワード抽出ステップで抽出されたキーワ
    ードのそれぞれに属性を付与する第2の属性付与ステッ
    プと、 前記第2のキーワード抽出ステップで抽出されたキーワ
    ードに基づいて、前記キーワード格納装置を参照して、
    前記文書格納装置から文書を検索する検索ステップと、 前記検索ステップで検索された文書に対応する前記キー
    ワード格納装置に格納されたキーワードのそれぞれに関
    する属性と、前記第2の属性付与ステップで付与された
    キーワードの属性とを比較して、前記検索ステップで検
    索された文書に順位付けする順位付けステップと、 前記順位付けステップにおける順位付けに従って、前記
    検索ステップで検索された文書を出力する出力ステップ
    と、を含むことを特徴とする文書検索方法。
  7. 【請求項7】外部から所望の文を入力することにより、
    該入力された文に従って文書格納装置に格納されている
    文書を検索するプログラムを実現するためのプログラム
    を記録するコンピュータ読み取り可能な記録媒体であっ
    て、 前記文書格納装置に格納される文書からキーワードを抽
    出する第1のキーワード抽出ステップと、 前記第1のキーワード抽出ステップで抽出されたキーワ
    ードのそれぞれに属性を付与する第1の属性付与ステッ
    プと、 前記第1のキーワード抽出ステップで抽出されたキーワ
    ードと、前記第1の属性付与ステップで付与された前記
    キーワードの属性とを、前記文書格納装置に格納される
    文書を特定するための情報と関連付けてキーワード格納
    装置に格納させるキーワード格納ステップと、 外部から所望の文を入力する入力ステップと、 前記入力ステップで入力された文からキーワードを抽出
    する第2のキーワード抽出ステップと、 前記第2のキーワード抽出ステップで抽出されたキーワ
    ードのそれぞれに属性を付与する第2の属性付与ステッ
    プと、 前記第2のキーワード抽出ステップで抽出されたキーワ
    ードに基づいて、前記キーワード格納装置を参照して、
    前記文書格納装置から文書を検索する検索ステップと、 前記検索ステップで検索された文書に対応する前記キー
    ワード格納装置に格納されたキーワードのそれぞれに関
    する属性と、前記第2の属性付与ステップで付与された
    キーワードの属性とを比較して、前記検索ステップで検
    索された文書に順位付けする順位付けステップと、 前記順位付けステップにおける順位付けに従って、前記
    検索ステップで検索された文書を出力する出力ステップ
    と、を実現するプログラムを記憶することを特徴とする
    コンピュータ読み取り可能な記録媒体。
JP00085398A 1998-01-06 1998-01-06 文書検索装置、方法及び記録媒体 Expired - Fee Related JP3275813B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00085398A JP3275813B2 (ja) 1998-01-06 1998-01-06 文書検索装置、方法及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00085398A JP3275813B2 (ja) 1998-01-06 1998-01-06 文書検索装置、方法及び記録媒体

Publications (2)

Publication Number Publication Date
JPH11195041A true JPH11195041A (ja) 1999-07-21
JP3275813B2 JP3275813B2 (ja) 2002-04-22

Family

ID=11485212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00085398A Expired - Fee Related JP3275813B2 (ja) 1998-01-06 1998-01-06 文書検索装置、方法及び記録媒体

Country Status (1)

Country Link
JP (1) JP3275813B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008056548A1 (fr) * 2006-11-10 2008-05-15 Panasonic Corporation Dispositif d'estimation cible et procédé d'estimation cible
JP2009075747A (ja) * 2007-09-19 2009-04-09 Toshiba Corp 類似文検索システム及びプログラム
JP2011123530A (ja) * 2009-12-08 2011-06-23 Nec Corp 話題推薦装置、話題推薦装方法およびプログラム
JP2014006770A (ja) * 2012-06-26 2014-01-16 Nec Corp 資産化装置、資産化方法および資産化プログラム
JP2015511746A (ja) * 2012-03-14 2015-04-20 ファーマナー, ギャリーFarmaner, Gary 会話式情報検索システムおよび方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0844771A (ja) * 1994-05-25 1996-02-16 Fuji Xerox Co Ltd 情報検索装置
JPH08161353A (ja) * 1994-12-08 1996-06-21 Fuji Xerox Co Ltd 情報検索装置
JPH09153066A (ja) * 1995-11-29 1997-06-10 Matsushita Electric Ind Co Ltd 文書検索装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0844771A (ja) * 1994-05-25 1996-02-16 Fuji Xerox Co Ltd 情報検索装置
JPH08161353A (ja) * 1994-12-08 1996-06-21 Fuji Xerox Co Ltd 情報検索装置
JPH09153066A (ja) * 1995-11-29 1997-06-10 Matsushita Electric Ind Co Ltd 文書検索装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008056548A1 (fr) * 2006-11-10 2008-05-15 Panasonic Corporation Dispositif d'estimation cible et procédé d'estimation cible
US7949959B2 (en) 2006-11-10 2011-05-24 Panasonic Corporation Target estimation device and target estimation method
JP2009075747A (ja) * 2007-09-19 2009-04-09 Toshiba Corp 類似文検索システム及びプログラム
JP2011123530A (ja) * 2009-12-08 2011-06-23 Nec Corp 話題推薦装置、話題推薦装方法およびプログラム
JP2015511746A (ja) * 2012-03-14 2015-04-20 ファーマナー, ギャリーFarmaner, Gary 会話式情報検索システムおよび方法
JP2014006770A (ja) * 2012-06-26 2014-01-16 Nec Corp 資産化装置、資産化方法および資産化プログラム

Also Published As

Publication number Publication date
JP3275813B2 (ja) 2002-04-22

Similar Documents

Publication Publication Date Title
US7058564B2 (en) Method of finding answers to questions
US8266077B2 (en) Method of analyzing documents
US6286000B1 (en) Light weight document matcher
JP3820242B2 (ja) 質問応答型文書検索システム及び質問応答型文書検索プログラム
US5940624A (en) Text management system
US20180004838A1 (en) System and method for language sensitive contextual searching
JP2001515245A (ja) データ組を選ぶための方法とシステム
JP2006073012A (ja) 予め定められた個数の予め定義された質問に応答することによって情報を管理するシステムおよび方法
JP4200834B2 (ja) 情報検索システム、情報検索方法及び情報検索プログラム
An et al. Semantic deep web: automatic attribute extraction from the deep web data sources
JP3198932B2 (ja) 文書検索装置
JP4967037B2 (ja) 情報検索装置、情報検索方法、端末装置、およびプログラム
JP4177070B2 (ja) 文書検索装置
KR102256007B1 (ko) 자연어 질의를 통한 문서 검색 및 응답 제공 시스템 및 방법
JP4499179B1 (ja) 端末装置
JP3275813B2 (ja) 文書検索装置、方法及び記録媒体
US6973423B1 (en) Article and method of automatically determining text genre using surface features of untagged texts
Brook Wu et al. Finding nuggets in documents: A machine learning approach
AU607963B2 (en) Information retrieval system and method
JPH11259524A (ja) 情報検索システム、情報検索システムにおける情報処理方法および記録媒体
JP2002183195A (ja) 概念検索方式
JP2011076194A (ja) トピック具体表現辞書作成システム、トピック具体表現辞書作成方法及びそのプログラム
JP2005234772A (ja) 文書管理装置および方法
JP4074687B2 (ja) 要約文作成支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH09231233A (ja) ネットワーク検索装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080208

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090208

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100208

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100208

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140208

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees