JP2002230037A - 検索システム、方法及びプログラム - Google Patents

検索システム、方法及びプログラム

Info

Publication number
JP2002230037A
JP2002230037A JP2001024087A JP2001024087A JP2002230037A JP 2002230037 A JP2002230037 A JP 2002230037A JP 2001024087 A JP2001024087 A JP 2001024087A JP 2001024087 A JP2001024087 A JP 2001024087A JP 2002230037 A JP2002230037 A JP 2002230037A
Authority
JP
Japan
Prior art keywords
search
keyword
formula
keywords
narrowing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001024087A
Other languages
English (en)
Inventor
Naoki Inoue
直己 井ノ上
Kazuo Hashimoto
和夫 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2001024087A priority Critical patent/JP2002230037A/ja
Publication of JP2002230037A publication Critical patent/JP2002230037A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 該当検索件数が膨大な数になる場合、自動的
に絞り込み候補のキーワードを提示すると共にそれによ
る検索件数見込み数を提示する。 【解決手段】 最初の検索式により文書データベース5
を検索したときに該当文書数が多ければ、最初の検索式
中の1つのキーワードをピックアップし、共起データベ
ース7を検索して1又は複数の絞り込み候補のキーワー
ドを抽出し、この抽出した絞り込み候補のキーワードの
1つを選択して最初の検索式に追加して文書データベー
スを再検索して絞り込み検索による該当文書数を求め
る。さらに、最初の検索式中から選択した1つのキーワ
ードと共起データベースから抽出された1又は複数の絞
り込み候補のキーワードとの共起割合に基づき、再検索
により求めた該当文書数に対して比例演算によって絞り
込み候補のキーワードそれぞれを最初の検索式に追加し
た絞り込み検索による該当文書見込み数を求めて提示す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、検索システム、方
法及びプログラムに関する。
【0002】
【従来の技術】情報検索システムでは、利用者が入力し
た1又は複数のキーワードに基づき、データベースを検
索してその検索結果を表示する。その際、検索された文
書のタイトルや要約などの概要一覧をまず提示し、その
概要から利用者が望んでいる文書を選択させるのが一般
的である。また、何らかの方法で各文書のスコアを求
め、利用者が必要としていると思われる文書を概要一覧
内で上位にくる工夫も一般的に行われている。一方、検
索結果として一件もヒットしなかった場合は、一般の情
報検索システムでは、単に該当する文書が見つからない
旨を提示するだけである。
【0003】そこで、従来は、最初のキーワード入力に
対してヒット件数が膨大な場合、利用者は絞り込みキー
ワードを入力してヒット件数を削減する工夫をしてい
る。また、ヒット件数が0の場合、利用者は別のキーワ
ードを入力して再検索する。
【0004】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の情報検索システムでは、最初のキーワード入
力に対するヒット件数が多いためにいったん検索した結
果を絞り込む場合、絞り込みのために入力するキーワー
ドによりどの位ヒット件数が削減できるかは利用者には
分からず、必要としている文書を求めるのに効果的な絞
り込みができる保証がなかった。
【0005】また、最初のキーワード入力による検索結
果としてヒット件数が0であった場合、入力したキーワ
ードのうちどのキーワードを削除すればどの位のヒット
件数があるのか予想することもできなかった。さらに入
力したキーワードが事実と齟齬するゆえにヒット件数が
0となった場合でも、ヒット件数がなぜ0であるのか利
用者には分からず、再度同じような事実と反するキーワ
ードを入力する間違いを繰り返すことがある問題点もあ
った。
【0006】本発明はこのような従来の問題点を解決す
るためになされたもので、最初の検索式の入力によりヒ
ット件数が多数にのぼる場合、絞り込みキーワードとし
て、最初の検索式と関連するふさわしいキーワードを提
示し、またそのキーワードの入力によりどの位ヒット件
数が絞り込まれるかをも提示することができる検索技術
を提供することを目的とする。
【0007】本発明はまた、最初の検索式の入力により
ヒット件数が0である場合、入力された検索式からどの
キーワードを削除すればヒット件数がどの位になるかを
提示することができる検索技術を提供することを目的と
する。
【0008】本発明はさらに、入力された検索式が事実
と反する論理を含んでいる場合にそれを指摘することが
できる検索技術を提供することを目的とする。
【0009】
【課題を解決するための手段】請求項1の発明の検索シ
ステムは、複数の文書が登録された文書データベース
と、本システムに登録されているキーワードごとに、前
記文書データベース中のいずれかの文書において共起関
係を持つ他のキーワードとその共起回数とが登録された
共起データベースと、入力された最初の検索式により前
記文書データベースを検索する検索処理部と、前記最初
の検索式中の1つのキーワードをピックアップし、前記
共起データベースを検索して、前記1つのキーワードと
共起関係を持ち、かつ前記最初の検索式中には含まれて
いない1又は複数の絞り込み候補のキーワードを抽出す
ると共に、抽出した絞り込み候補のキーワードの1つを
前記最初の検索式に追加して前記文書データベースを再
検索して該当文書数を求め、前記最初の検索式中の前記
1つのキーワードと前記共起データベースから抽出され
た絞り込み候補のキーワードとの共起割合に基づき、前
記再検索により求めた該当文書数に対して比例演算によ
って絞り込み候補のキーワードそれぞれを前記最初の検
索式に追加して絞り込み検索した場合の該当文書見込み
数を求め、前記絞り込み候補のキーワードごとの該当文
書見込み数を提示する結果解析処理部とを備えたもので
ある。
【0010】請求項2の発明の検索方法は、入力された
最初の検索式により文書データベースを検索するステッ
プ(1)と、前記最初の検索式中の1つのキーワードを
ピックアップし、共起データベースを検索して、1つの
キーワードと共起関係を持ち、かつ前記最初の検索式中
には含まれていない1又は複数の絞り込み候補のキーワ
ードを抽出するステップ(2)と、前記ステップ(2)
で抽出した絞り込み候補のキーワードの1つを前記最初
の検索式に追加して前記文書データベースを再検索して
該当文書数を求めるステップ(3)と、前記最初の検索
式中の前記1つのキーワードと前記共起データベースか
ら抽出された絞り込み候補のキーワードとの共起割合に
基づき、前記ステップ(3)の再検索により求めた該当
文書数に対して比例演算によって絞り込み候補のキーワ
ードそれぞれを前記最初の検索式に追加して絞り込み検
索した場合の該当文書見込み数を求めるステップ(4)
と、前記絞り込み候補のキーワードごとの該当文書見込
み数を提示するステップ(5)とを備えたものである。
【0011】請求項3の発明の検索プログラムは、入力
された最初の検索式により文書データベースを検索する
処理(1)と、前記最初の検索式中の1つのキーワード
をピックアップし、共起データベースを検索して、1つ
のキーワードと共起関係を持ち、かつ前記最初の検索式
中には含まれていない1又は複数の絞り込み候補のキー
ワードを抽出する処理(2)と、前記処理(2)で抽出
した絞り込み候補のキーワードの1つを前記最初の検索
式に追加して前記文書データベースを再検索して該当文
書数を求める処理(3)と、前記最初の検索式中の前記
1つのキーワードと前記共起データベースから抽出され
た絞り込み候補のキーワードとの共起割合に基づき、前
記処理(3)の再検索により求めた該当文書数に対して
比例演算によって絞り込み候補のキーワードそれぞれを
前記最初の検索式に追加して絞り込み検索した場合の該
当文書見込み数を求める処理(4)と、前記絞り込み候
補のキーワードごとの該当文書見込み数を提示する処理
(5)とを実行するものである。
【0012】請求項4の発明は、請求項1に記載の検索
システム、請求項2に記載の検索方法又は請求項3に記
載の検索プログラムにおいて、前記最初の検索式中から
ピックアップするキーワードとして、当該検索式の最初
のキーワードを選択することを特徴とするものである。
【0013】請求項1〜請求項4の発明の検索システ
ム、検索方法又は検索プログラムによれば、利用者が最
初の検索式を入力すれば、検索システムが文書データベ
ースを検索して該当文書を抽出する。そして該当文書数
が多い場合には、最初の検索式中の1つのキーワードを
ピックアップし、共起データベースを検索して、当該キ
ーワードと共起関係を持ち、かつ最初の検索式中には含
まれていない1又は複数の絞り込み候補のキーワードを
抽出し、この抽出した絞り込み候補のキーワードの1つ
を選択して最初の検索式に追加して絞り込み検索式を
得、この絞り込み検索式によって文書データベースを再
検索して該当文書数を求める。
【0014】そしてさらに、最初の検索式中から選択し
た1つのキーワードと共起データベースから抽出された
1又は複数の絞り込み候補のキーワードとの共起割合に
基づき、再検索により求めた該当文書数に対して比例演
算によって絞り込み候補のキーワードそれぞれを最初の
検索式に追加して行う絞り込み検索により得られるであ
ろう該当文書見込み数を求め、絞り込み候補のキーワー
ドごとの該当文書見込み数を提示する。
【0015】これにより、利用者が入力した検索式によ
る検索結果が膨大なヒット件数になるような場合、シス
テム側で自動的にふさわしい絞り込み候補のキーワード
を提示し、またその絞り込み検索による該当文書見込み
数をも利用者に提示することができる。しかも絞り込み
候補のキーワードすべてについて絞り込み検索を実行す
るのではなく、代表的な1のキーワードについて絞り込
み検索を実行すれば、他の絞り込み候補のキーワードに
よる該当文書数については共起データベースのデータを
用いた演算によって概算数を求めるので、演算時間を短
くできる。
【0016】そして、絞り込み候補のキーワードを選択
する際には、検索式中の最初のキーワードを選択し、共
起データベースを利用してこのキーワードと共起関係に
あるキーワードを絞り込み候補とすることにより、通
常、利用者が検索式を入力する場合にはその最初に最も
重要と思うキーワードを入力するので、特にふさわしい
絞り込みキーワードとそのキーワードによる絞り込み検
索結果予想を利用者に提示することができることにな
る。
【0017】請求項5の発明の検索システムは、複数の
文書が登録された文書データベースと、入力された最初
の検索式により前記文書データベースを検索する検索処
理部と、前記検索処理部により検索された該当文書数が
0である場合に、前記最初の検索式中のキーワードの1
つのを削除した緩め検索式によって前記文書データベー
スを再検索し、残されたキーワード又はキーワード群に
よる再検索による該当文書数を求め、削除候補のキーワ
ード及びそのキーワードを削除した緩め検索式による再
検索によって得られた該当文書数を提示する結果解析処
理部とを備えたものである。
【0018】請求項6の発明の検索方法は、入力された
最初の検索式により文書データベースを検索するステッ
プ(1)と、前記ステップ(1)により検索された該当
文書数が0である場合に、前記最初の検索式中のキーワ
ードの1つのを削除した緩め検索式によって前記文書デ
ータベースを再検索し、残されたキーワード又はキーワ
ード群による再検索による該当文書数を求めるステップ
(2)と、削除候補のキーワード及びそのキーワードを
削除した緩め検索式による再検索によって得られた該当
文書数を提示するステップ(3)とを備えたものであ
る。
【0019】請求項7の発明の検索プログラムは、入力
された最初の検索式により文書データベースを検索する
処理(1)と、前記処理(1)により検索された該当文
書数が0である場合に、前記最初の検索式中のキーワー
ドの1つのを削除した緩め検索式によって前記文書デー
タベースを再検索し、残されたキーワード又はキーワー
ド群による再検索による該当文書数を求める処理(2)
と、削除候補のキーワード及びそのキーワードを削除し
た緩め検索式による再検索によって得られた該当文書数
を提示する処理(3)とを実行するものである。
【0020】請求項8の発明は、請求項5に記載の検索
システム、請求項6に記載の検索方法又は請求項7に記
載の検索プログラムにおいて、前記最初の検索式中から
削除するキーワードとして、当該検索式の最後のキーワ
ードを削除することを特徴とするものである。
【0021】請求項5〜8の発明の検索システム、検索
方法又は検索プログラムでは、利用者が最初の検索式を
入力することにより、検索システムが文書データベース
を検索した結果が該当文書数0である場合、最初の検索
式中のキーワードの1つを削除した緩め検索式によって
文書データベースを再検索し、残されたキーワード又は
キーワード群による緩め検索による該当文書数を求め
る。そして、最初の検索式から削除するキーワード候補
及びそのキーワードを削除した後の緩め検索による該当
文書見込み数を提示する。
【0022】これにより、最初の検索式による検索結果
が0件であった場合に、システム側の自動処理により、
利用者に対して元の検索式からあるキーワードを削除し
た緩め検索を行えばどの位の該当文書数になるかを知ら
せることができる。
【0023】そしてこの場合、最初の検索式の最後のキ
ーワードを緩め検索のために削除するキーワードに指定
することにより、通常、利用者が最も重要性が低いと思
うキーワードを最後に入力する傾向にあるので、利用者
にとって望ましい検索式とその緩め検索による該当文書
数を提示することができる。
【0024】請求項9の発明の検索システムは、複数種
の事実データを類別して登録してある知識ベースと、入
力された検索式を、前記知識ベースに登録されている事
実データと照合して論理解析し、事実データと齟齬する
か否か判定する検索式齟齬判定部と、前記事実データと
矛盾すると判定されたときに、前記検索式の齟齬を提示
する検索式齟齬提示部とを備えたものである。
【0025】請求項10の発明の検索方法は、入力され
た検索式を、知識ベースに登録されている事実データと
照合して論理解析し、事実データと齟齬するか否か判定
するステップと、前記事実データと矛盾すると判定され
たときに、前記検索式の齟齬を提示するステップとを備
えたものである。
【0026】請求項11の発明の検索プログラムは、入
力された検索式を、知識ベースに登録されている事実デ
ータと照合して論理解析し、事実データと齟齬するか否
か判定する処理と、前記事実データと矛盾すると判定さ
れたときに、前記検索式の齟齬を提示する処理とを実行
するものである。
【0027】請求項12の発明は、請求項9の検索シス
テム、請求項10の検索方法又は請求項11の検索プロ
グラムにおいて、前記知識ベースの事実データは、生存
者氏名データと、死亡者氏名及び死亡年月日データとで
あり、前記生存者氏名データに含まれる氏名と死亡又は
それに関連するキーワードとが含まれているときに前記
検索式に齟齬ありと判定することを特徴とするものであ
る。
【0028】請求項9〜12の発明の検索技術では、利
用者が事実と反する検索式を入力した場合、検索システ
ム側で検索式が事実と反することを判定して利用者に提
示する。
【0029】そして、検索式に生存者の氏名と死亡もし
くはそれに関連するキーワード、例えば死去、逝去のよ
うなキーワードとが含まれる場合に事実に反する検索式
として当該氏名の人物が生存している旨を提示すること
により、事実と齟齬する検索式であるために検索結果件
数が0となったことを利用者に知らせることができる。
【0030】
【発明の実施の形態】以下、本発明の実施の形態を図に
基づいて詳説する。図1は本発明の検索システムの1つ
の実施の形態の機能的な構成を示している。この検索シ
ステムは、その全体が1つのコンピュータ上に構築され
てもよく、WANやLANのような専用伝送路で結ばれ
た複数のコンピュータ上に分散するようにして構築され
てもよく、さらには、インターネットのような情報通信
回線を介して検索サービスを提供するWebサイト上の検
索サーバー上に構築されてもよい。また、本検索システ
ムが行う検索処理機能が本発明の特徴をなすものであ
り、コンピュータにインストールする検索プログラム、
またその検索プログラムがインストールされたコンピュ
ータシステムが実行する検索方法も本発明の技術的範囲
に含まれる。
【0031】図1に示すように、本実施の形態の検索シ
ステム1は、外部記憶装置上に構築されるデータベース
として、知識ベース3、文書データベース5及び共起デ
ータベース7を備えている。そして検索システム1は処
理機能として、入力された検索式に対して解析を行う入
力解析部11、入力された検索式に基づき文書データベ
ース5を検索して該当する文書データを抽出するデータ
ベースサーチ部13、検索結果を評価し、絞り込み検索
又は緩め検索による該当文書見込み件数を演算する結果
解析処理部15を備えている。
【0032】知識ベース3は多種類の事実データを多数
登録している。例えば、歴史的な出来事とその発生年月
日とを対照させたデータテーブル、動物種とそれに属す
る動物の動物名とを対照させたデータテーブル、また図
2に示すように生存者氏名データテーブル21、死亡者
氏名とその死亡年月日とを対照させたデータテーブル2
2、さらには当該システムが把握できるキーワード辞書
データや類語辞書データ等である。
【0033】例えば、図2に示した生存者氏名データテ
ーブル21には、文書データベース5に登録されている
全文書中に出現した現在生存している人物の氏名、「〇
×一郎」、「〇山一子」等が抽出されて登録されてい
る。また死亡者氏名データテーブル23には、文書デー
タベース5に登録されている全文書中に出現した、現時
点ですでに死亡している人物の氏名がその死亡年月日と
対照させたデータとして登録されている。
【0034】入力解析部11は、利用者の入力した検索
式に対して、例えば形態素解析を実行して検索式に含ま
れるキーワード各々が知識ベース3のキーワード辞書デ
ータ中に登録されているかどうか判定し、該当するキー
ワードが見いだせない場合には検索式に誤りがあること
を利用者に対して提示する。入力解析部11はまた、知
識ベース3の事実データを検索し、検索式に事実と反す
るキーワードの組合せがないかどうか判断し、そのよう
な組合せがある場合には検索式が齟齬ある旨を出力して
利用者に提示する。
【0035】入力解析部11は、解析されたキーワード
のすべてがキーワード辞書データ中に登録されているも
のであり、検索式に事実に反する齟齬がない場合には、
この検索式をデータベースサーチ部13に渡し、文書デ
ータベース5を検索させる。
【0036】文書データベース5には、あらかじめ多数
の文書ファイルが各文書ファイル中に出現するキーワー
ドとその出現回数(スコア)を要素とする文書ベクトル
として登録されている。また文書ファイルごとに、その
内容を示すタイトルデータや概要を示すデータも登録さ
れている。
【0037】データベースサーチ部13は、入力解析部
11から受け取った検索式によりこの文書データベース
5を検索し、該当する文書ファイルごとにそのファイル
名、タイトル、概要を示した該当文書データリストを作
成して結果解析処理部15に出力する。データベースサ
ーチ部13はまた、入力された検索式による文書データ
ベース5の検索により該当する文書件数が0であった場
合にも結果解析処理部15に検索結果を出力する。
【0038】共起データベース7は、文書データベース
5に登録されているすべての文書ファイルから抽出した
キーワード(特に、ここでは名詞(短縮形や外来語、短
縮語も含める)に限定している。しかしながら、動詞も
含めることができる)に対し、1つのキーワードとその
キーワードと共起したキーワード及び共起回数を登録し
たものである。例えば、図3に示す共起データベース7
では、以下で本発明の説明に関連するキーワードだけを
明示しているが、「スポーツ」と「プロ野球」との共起
回数は15000であり、「阪○」と「優勝」との共起
回数は200であり、「古×」と「阪○」との共起は登
録されていないので0であることを示している。
【0039】結果解析処理部15は、データベースサー
チ部13から受け取った検索結果について評価し、所定
個数以上の文書が検索された場合には、後述する方法に
よって共起データベース7を参照して絞り込み検索用の
キーワードを抽出し、データベースサーチ部13に絞り
込み検索を指示し、その絞り込み検索結果を受け取り、
後述するように絞り込み候補となるキーワードのいくつ
かとそれぞれのキーワードを追加して絞り込み検索行っ
たときに得られる該当文書見込み件数を演算し、元の検
索結果と共に出力して利用者に提示する。
【0040】結果解析処理部15はまた、データベース
サーチ部13から受け取った検索結果が0件であった場
合に、元の入力検索式の中の特定のキーワード、例え
ば、検索式の最後のキーワードを削除した緩め検索式を
作成し、これによって文書データベース5を再検索する
ようにデータベースサーチ部13に指示する。そしてそ
の緩め検索結果が有意なものである場合、緩め検索に用
いた緩め検索式とそれによる該当検索件数を出力して利
用者に提示する。
【0041】次に、上記構成の検索システムによる検索
処理について、図4及び図5のフローチャートを用いて
説明する。利用者が検索式を入力すると、入力解析部1
1は知識ベース3を参照し、検索式に誤りがないか、事
実に反する記述がないか解析する(ステップS05)。
【0042】そして、検索式に誤りがあり、あるいは事
実に反する記述があった場合には「齟齬あり」と判断
し、検索式に誤りがあり、あるいは事実に反する記述が
ある旨を出力して利用者に提示する(ステップS10,
S15)。例えば、検索式が「〇×一郎*死亡」であっ
た場合、知識ベース3の死亡者データテーブル23を参
照することになるが、「〇×一郎」は生存者リストには
あっても死亡者リストには登録されていないため、検索
式に事実に反する齟齬があると判断し、例えば、「〇×
一郎は死亡者リストにはありません。」というメッセー
ジを出力し、利用者に提示する。
【0043】この検索式に齟齬がある旨を提示した後、
利用者が検索続行を指示するならば検索を継続する(ス
テップS20)。
【0044】ステップS10において、入力解析部11
が入力された検索式に齟齬がないと判定した場合、ある
いはステップS20において検索式に齟齬ありとしたに
もかかわらず、利用者が検索続行を指示した場合、入力
解析部11はデータベースサーチ部13に検索式を渡
し、文書データベース5を検索させ、検索結果を結果解
析処理部15に渡す(ステップS25)。
【0045】結果解析処理部15は、検索式に該当する
文書ファイルが何件か抽出された場合、検索件数が所定
数M(例えば、M=1000件)を超えているかどうか
判断する(ステップS30,S35)。そして検索件数
が所定数Mを超えない場合、検索件数と共に、検索され
た文書ファイルごとの文書ファイル名、タイトル、概要
などの簡単な情報を出力して、利用者に提示する(ステ
ップS40)。
【0046】しかしながら、データベースサーチ部13
による検索式に対する検索件数が所定数Mを超えた場
合、結果解析処理部15は絞り込み検索を行う(ステッ
プS45)。
【0047】この絞り込み検索処理は、図5のフローチ
ャートに従うものである。つまり、最初の入力検索式か
ら1つのキーワードを選択する(ステップSP1)。こ
のキーワードの選択には、例えば検索式の最初に入力さ
れたキーワードを用いるのがふさわしい。なぜならば、
通常、利用者は最も重要と思うキーワードを検索式の最
初に入力するからである。
【0048】入力検索式から1つのキーワードを選択し
たなら、続いて、共起データベース7を参照し、最も共
起やすいキーワードを選択する(ステップSP2)。例
えば、入力検索式が「阪○*優勝」であり、これに該当
する文書件数が2000件であったとする。このような
場合、この検索結果をそのまま出力するのは膨大な数に
なるため、さらに絞り込み検索が必要であると判断し、
共起データベース7を参照し、検索式の最初のキーワー
ドである「阪○」と共起関係が大きいキーワードを所定
個数、例えばm個だけ選択する(ステップSP2)。こ
のmは限定されないが、最大でもm=5程度とするのが
望ましい。ここでは、「阪○」と共起回数が大きいキー
ワードとして、大きい方から順に、「吉○監督」、「○
ース」の2個が選択される。
【0049】続いて、ステップSP2で選択されたm個
の絞り込み候補のうち、最も共起しやすいキーワード
(つまり、共起回数がいちばん大きいキーワード)「吉
○監督」を用いて、元の検索式から「阪○*優勝*吉○
監督」の絞り込み検索式を作り出す(ステップSP
3)。
【0050】次に、この絞り込み検索式を用いて文書デ
ータベース5の絞り込み検索を行い、検索件数を求める
(ステップSP4)。ここではこの検索件数が、Nであ
ったとする。
【0051】続いて、絞り込み検索により得られた検索
件数Nを用い、ステップSP2で選択したキーワード群
のうち、ステップSP3で用いたキーワード以外にキー
ワードに対し、共起割合に応じて検索の概算値を求める
(ステップSP5)。これを例示すれば、「阪○」と
「吉○監督」との共起回数を100であり、「阪○」と
「○ース」との共起回数は50であるので、100:5
0=2:1の割合である。そこで、「阪○*優勝*吉○
監督」の絞り込み検索結果がN件であれば、「阪○*優
勝*○ース」の絞り込み検索を行えば、N/2件が検索
されると予想するのである。
【0052】このようにして絞り込みキーワード候補の
m個それぞれについての絞り込み検索結果の予想検索件
数を求めると、元の検索式による検索結果と共に、絞り
込み候補のキーワードとそれによる検索件数の概算値を
出力し、利用者に提示する(ステップSP5)。これに
より、上記の例の場合であれば、図6に示すような検索
結果の表示を行うのである。
【0053】さらに、これらの検索結果の表示に対して
利用者が絞り込み検索を指示したならば、ステップS2
0の判定がYESとなり、利用者が絞り込み用のキーワ
ードを追加した絞り込み検索式を用いて、データベース
サーチ部13が文書データベース5を再検索する(ステ
ップS25)。
【0054】このステップS25以降の処理は、上記と
同様であり、検索結果の該当件数がふさわしければ検索
終了とし、該当件数が多くなれば絞り検索を実行し、該
当件数が0であれば後述する緩め検索を実行することに
なる。
【0055】ステップS25の文書検索において検索件
数が0であった場合、ステップS30でYESに分岐
し、緩め検索式を自動的に作成し(ステップS50)、
緩め検索式による文書検索を再実行する(ステップS2
5)。
【0056】この緩め検索は次のようにして行う。検索
件数0であるということは、元の検索式が絞りすぎであ
ると考えられる。そこで、元の検索式のキーワードから
重要性が低いキーワードを指定して削除した緩め検索式
を作成する。通常、利用者は検索式の最後に最も重要性
が低いキーワードを入力することが考えられるので、最
後のキーワードを削除するのが望ましい。しかしながら
特に限定されるわけではなく、最初のキーワードを削除
することにしてもよいし、利用者にいくつかのキーワー
ド候補を提示し、選択させるようにしてもよい。
【0057】例えば、利用者の思いちがいにより、元の
検索式として「優勝*阪○*吉○監督*古×」と入力
し、検索結果が0と出た場合、最後のキーワード「古
×」を削除した緩め検索式「優勝*阪○*吉○監督」を
作成して緩め検索を実行し、図7に示すような検索結果
を出力して表示するのである。
【0058】こうして得られた緩め選択式によるステッ
プS25以降の再検索処理は、上記と同様であり、検索
結果の該当件数がふさわしければ検索終了とし、該当件
数が多くなれば絞り検索を実行し、該当件数が0であれ
ば後述する緩め検索を再実行することになる。
【0059】このようにして、本実施の形態の検索シス
テムによれば、元の検索式による検索結果が膨大な数に
なるとき、絞り込み検索にふさわしいキーワードとその
キーワードを用いた場合の該当見込み件数を自動的に計
算して利用者に提示し、該元の検索式による検索結果が
0である場合には、緩め検索を実行してその結果を利用
者に提示し、さらに事実に反する検索式が入力されたと
きには自動的にその齟齬を利用者に提示することがで
き、ユーザーフレンドリーな検索システムを構築するこ
とができる。
【0060】
【発明の効果】以上のように請求項1〜請求項4の発明
によれば、利用者が入力した検索式による検索結果が膨
大なヒット件数になるような場合、システム側で自動的
にふさわしい絞り込み候補のキーワードを提示し、また
その絞り込み検索による該当文書見込み数をも利用者に
提示することができる。
【0061】請求項5〜8の発明によれば、最初の検索
式による検索結果が0件であった場合に、システム側の
自動処理により、利用者に対して最初の検索式からある
キーワードを削除した緩め検索を行えばどの位の該当文
書数になるかを知らせることができる。
【0062】請求項9〜12の発明によれば、利用者が
事実と反する検索式を入力した場合、検索システム側で
検索式が事実と反することを判定して利用者に提示する
ことができる。
【図面の簡単な説明】
【図1】本発明の1つの実施の形態の検索システムの機
能的な構成を示すブロック図。
【図2】上記の実施の形態における知識ベースのデータ
構造を示す説明図。
【図3】上記の実施の形態における共起データベースの
データ構造を示す説明図。
【図4】上記の実施の形態による検索処理を示すフロー
チャート。
【図5】図4のフローチャートにおける絞り込み検索ル
ーチンの詳しい処理を示すフローチャート。
【図6】上記の実施の形態による絞り込み検索を勧める
検索結果の表示例を示す説明図。
【図7】上記の実施の形態による緩め検索を勧める検索
結果の表示例を示す説明図。
【符号の説明】
1 検索システム 3 知識ベース 5 文書データベース 7 共起データベース 11 入力解析部 13 データベースサーチ部 15 結果解析処理部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/21 570 G06F 17/21 570N Fターム(参考) 5B009 SA12 5B075 ND03 ND20 NK34 NK42 NR05 NR12 PP03 PP13 PP28 PP30 PQ02 PQ32 PQ40 PQ46 QP01 UU05

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 複数の文書が登録された文書データベー
    スと、 本システムに登録されているキーワードごとに、前記文
    書データベース中のいずれかの文書において共起関係を
    持つ他のキーワードとその共起回数とが登録された共起
    データベースと、 入力された最初の検索式により前記文書データベースを
    検索する検索処理部と、 前記最初の検索式中の1つのキーワードをピックアップ
    し、前記共起データベースを検索して、前記1つのキー
    ワードと共起関係を持ち、かつ前記最初の検索式中には
    含まれていない1又は複数の絞り込み候補のキーワード
    を抽出すると共に、抽出した絞り込み候補のキーワード
    の1つを前記最初の検索式に追加して前記文書データベ
    ースを再検索して該当文書数を求め、前記最初の検索式
    中の前記1つのキーワードと前記共起データベースから
    抽出された絞り込み候補のキーワードとの共起割合に基
    づき、前記再検索により求めた該当文書数に対して比例
    演算によって絞り込み候補のキーワードそれぞれを前記
    最初の検索式に追加して絞り込み検索した場合の該当文
    書見込み数を求め、前記絞り込み候補のキーワードごと
    の該当文書見込み数を提示する結果解析処理部とを備え
    て成る検索システム。
  2. 【請求項2】 入力された最初の検索式により文書デー
    タベースを検索するステップ(1)と、 前記最初の検索式中の1つのキーワードをピックアップ
    し、共起データベースを検索して、1つのキーワードと
    共起関係を持ち、かつ前記最初の検索式中には含まれて
    いない1又は複数の絞り込み候補のキーワードを抽出す
    るステップ(2)と、 前記ステップ(2)で抽出した絞り込み候補のキーワー
    ドの1つを前記最初の検索式に追加して前記文書データ
    ベースを再検索して該当文書数を求めるステップ(3)
    と、 前記最初の検索式中の前記1つのキーワードと前記共起
    データベースから抽出された絞り込み候補のキーワード
    との共起割合に基づき、前記ステップ(3)の再検索に
    より求めた該当文書数に対して比例演算によって絞り込
    み候補のキーワードそれぞれを前記最初の検索式に追加
    して絞り込み検索した場合の該当文書見込み数を求める
    ステップ(4)と、 前記絞り込み候補のキーワードごとの該当文書見込み数
    を提示するステップ(5)とを備えて成る検索方法。
  3. 【請求項3】 入力された最初の検索式により文書デー
    タベースを検索する処理(1)と、 前記最初の検索式中の1つのキーワードをピックアップ
    し、共起データベースを検索して、1つのキーワードと
    共起関係を持ち、かつ前記最初の検索式中には含まれて
    いない1又は複数の絞り込み候補のキーワードを抽出す
    る処理(2)と、 前記処理(2)で抽出した絞り込み候補のキーワードの
    1つを前記最初の検索式に追加して前記文書データベー
    スを再検索して該当文書数を求める処理(3)と、 前記最初の検索式中の前記1つのキーワードと前記共起
    データベースから抽出された絞り込み候補のキーワード
    との共起割合に基づき、前記処理(3)の再検索により
    求めた該当文書数に対して比例演算によって絞り込み候
    補のキーワードそれぞれを前記最初の検索式に追加して
    絞り込み検索した場合の該当文書見込み数を求める処理
    (4)と、 前記絞り込み候補のキーワードごとの該当文書見込み数
    を提示する処理(5)とを実行する検索プログラム。
  4. 【請求項4】 前記最初の検索式中からピックアップす
    るキーワードとして、当該検索式の最初のキーワードを
    選択することを特徴とする請求項1に記載の検索システ
    ム、請求項2に記載の検索方法又は請求項3に記載の検
    索プログラム。
  5. 【請求項5】 複数の文書が登録された文書データベー
    スと、 入力された最初の検索式により前記文書データベースを
    検索する検索処理部と、 前記検索処理部により検索された該当文書数が0である
    場合に、前記最初の検索式中のキーワードの1つのを削
    除した緩め検索式によって前記文書データベースを再検
    索し、残されたキーワード又はキーワード群による再検
    索による該当文書数を求め、削除候補のキーワード及び
    そのキーワードを削除した緩め検索式による再検索によ
    って得られた該当文書数を提示する結果解析処理部とを
    備えて成る検索システム。
  6. 【請求項6】 入力された最初の検索式により文書デー
    タベースを検索するステップ(1)と、 前記ステップ(1)により検索された該当文書数が0で
    ある場合に、前記最初の検索式中のキーワードの1つの
    を削除した緩め検索式によって前記文書データベースを
    再検索し、残されたキーワード又はキーワード群による
    再検索による該当文書数を求めるステップ(2)と、 削除候補のキーワード及びそのキーワードを削除した緩
    め検索式による再検索によって得られた該当文書数を提
    示するステップ(3)とを備えて成る検索方法。
  7. 【請求項7】 入力された最初の検索式により文書デー
    タベースを検索する処理(1)と、 前記処理(1)により検索された該当文書数が0である
    場合に、前記最初の検索式中のキーワードの1つのを削
    除した緩め検索式によって前記文書データベースを再検
    索し、残されたキーワード又はキーワード群による再検
    索による該当文書数を求める処理(2)と、 削除候補のキーワード及びそのキーワードを削除した緩
    め検索式による再検索によって得られた該当文書数を提
    示する処理(3)とを実行する検索プログラム。
  8. 【請求項8】 前記最初の検索式中から削除するキーワ
    ードとして、当該検索式の最後のキーワードを削除する
    ことを特徴とする請求項5に記載の検索システム、請求
    項6に記載の検索方法又は請求項7に記載の検索プログ
    ラム。
  9. 【請求項9】 複数種の事実データを類別して登録して
    ある知識ベースと、 入力された検索式を、前記知識ベースに登録されている
    事実データと照合して論理解析し、事実データと齟齬す
    るか否か判定する検索式齟齬判定部と、 前記事実データと矛盾すると判定されたときに、前記検
    索式の齟齬を提示する検索式齟齬提示部とを備えて成る
    検索システム。
  10. 【請求項10】 入力された検索式を、知識ベースに登
    録されている事実データと照合して論理解析し、事実デ
    ータと齟齬するか否か判定するステップと、 前記事実データと矛盾すると判定されたときに、前記検
    索式の齟齬を提示するステップとを備えて成る検索方
    法。
  11. 【請求項11】 入力された検索式を、知識ベースに登
    録されている事実データと照合して論理解析し、事実デ
    ータと齟齬するか否か判定する処理と、 前記事実データと矛盾すると判定されたときに、前記検
    索式の齟齬を提示する処理とを実行する検索プログラ
    ム。
  12. 【請求項12】 前記知識ベースの事実データは、生存
    者氏名データと、死亡者氏名及び死亡年月日データとで
    あり、前記生存者氏名データに含まれる氏名と死亡又は
    それに関連するキーワードとが含まれているときに前記
    検索式に齟齬ありと判定することを特徴とする請求項9
    に記載の検索システム、請求項10に記載の検索方法又
    は請求項11に記載の検索プログラム。
JP2001024087A 2001-01-31 2001-01-31 検索システム、方法及びプログラム Pending JP2002230037A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001024087A JP2002230037A (ja) 2001-01-31 2001-01-31 検索システム、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001024087A JP2002230037A (ja) 2001-01-31 2001-01-31 検索システム、方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2002230037A true JP2002230037A (ja) 2002-08-16

Family

ID=18889284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001024087A Pending JP2002230037A (ja) 2001-01-31 2001-01-31 検索システム、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2002230037A (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005135519A (ja) * 2003-10-30 2005-05-26 Fujitsu Ten Ltd 音楽再生装置
JP2006031624A (ja) * 2004-07-21 2006-02-02 Mitsubishi Electric Corp 検索装置
JP2008052548A (ja) * 2006-08-25 2008-03-06 Fujitsu Ltd 検索プログラム、情報検索装置及び情報検索方法
JP2009080559A (ja) * 2007-09-25 2009-04-16 Fujitsu Ltd 検索システム、方法およびプログラム
JP2009093429A (ja) * 2007-10-09 2009-04-30 Kodansha Ltd 検索システム及び検索方法
JP2010198577A (ja) * 2009-02-27 2010-09-09 Yahoo Japan Corp 検索装置及び方法
JP2012037920A (ja) * 2010-08-03 2012-02-23 Yahoo Japan Corp 広告マッチング装置、方法及びプログラム
JP2012058936A (ja) * 2010-09-08 2012-03-22 Dainippon Printing Co Ltd 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法及びプログラム
JP2012133785A (ja) * 2010-12-23 2012-07-12 Nhn Corp 減少クエリを推薦する検索システムおよび検索方法
JP2012168844A (ja) * 2011-02-16 2012-09-06 Yahoo Japan Corp 検索サジェスト装置及び方法
JP2012198609A (ja) * 2011-03-18 2012-10-18 Kddi Corp Web検索補助装置、Web検索補助システム、Web検索補助方法およびプログラム
EP2838037A2 (en) 2013-07-29 2015-02-18 Fujitsu Limited Information processing system, information processing method, and information processing program
JP2017033387A (ja) * 2015-08-04 2017-02-09 Kddi株式会社 入力支援装置、プログラムおよび入力支援方法
JP2017049836A (ja) * 2015-09-02 2017-03-09 和直 恩田 検索支援装置、検索支援プログラムおよび記憶媒体
WO2019013385A1 (ko) * 2017-07-14 2019-01-17 (주)인터버드 마지막 알파벳 제거 알고리즘을 이용한 반도체 부품 검색 방법
JP2020057195A (ja) * 2018-10-02 2020-04-09 テクマトリックス株式会社 要約生成サーバ、要約生成システム及び要約生成方法

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005135519A (ja) * 2003-10-30 2005-05-26 Fujitsu Ten Ltd 音楽再生装置
JP2006031624A (ja) * 2004-07-21 2006-02-02 Mitsubishi Electric Corp 検索装置
JP4503379B2 (ja) * 2004-07-21 2010-07-14 三菱電機株式会社 検索装置
JP2008052548A (ja) * 2006-08-25 2008-03-06 Fujitsu Ltd 検索プログラム、情報検索装置及び情報検索方法
JP2009080559A (ja) * 2007-09-25 2009-04-16 Fujitsu Ltd 検索システム、方法およびプログラム
JP2009093429A (ja) * 2007-10-09 2009-04-30 Kodansha Ltd 検索システム及び検索方法
JP2010198577A (ja) * 2009-02-27 2010-09-09 Yahoo Japan Corp 検索装置及び方法
JP2012037920A (ja) * 2010-08-03 2012-02-23 Yahoo Japan Corp 広告マッチング装置、方法及びプログラム
JP2012058936A (ja) * 2010-09-08 2012-03-22 Dainippon Printing Co Ltd 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法及びプログラム
JP2012133785A (ja) * 2010-12-23 2012-07-12 Nhn Corp 減少クエリを推薦する検索システムおよび検索方法
JP2012168844A (ja) * 2011-02-16 2012-09-06 Yahoo Japan Corp 検索サジェスト装置及び方法
JP2012198609A (ja) * 2011-03-18 2012-10-18 Kddi Corp Web検索補助装置、Web検索補助システム、Web検索補助方法およびプログラム
EP2838037A2 (en) 2013-07-29 2015-02-18 Fujitsu Limited Information processing system, information processing method, and information processing program
US10614035B2 (en) 2013-07-29 2020-04-07 Fujitsu Limited Information processing system, information processing method, and computer product
JP2017033387A (ja) * 2015-08-04 2017-02-09 Kddi株式会社 入力支援装置、プログラムおよび入力支援方法
JP2017049836A (ja) * 2015-09-02 2017-03-09 和直 恩田 検索支援装置、検索支援プログラムおよび記憶媒体
WO2019013385A1 (ko) * 2017-07-14 2019-01-17 (주)인터버드 마지막 알파벳 제거 알고리즘을 이용한 반도체 부품 검색 방법
KR101945234B1 (ko) * 2017-07-14 2019-02-08 (주)인터버드 마지막 알파벳 제거 알고리즘을 이용한 반도체 부품 검색 방법
JP2019523461A (ja) * 2017-07-14 2019-08-22 インターバード カンパニー,リミテッド 最後のアルファベット除去アルゴリズムを利用した半導体部品検索方法
US10789245B2 (en) 2017-07-14 2020-09-29 Interbird Co., Ltd. Semiconductor parts search method using last alphabet deletion algorithm
JP2020057195A (ja) * 2018-10-02 2020-04-09 テクマトリックス株式会社 要約生成サーバ、要約生成システム及び要約生成方法

Similar Documents

Publication Publication Date Title
US6691107B1 (en) Method and system for improving a text search
JP4944405B2 (ja) 情報検索システムにおけるフレーズに基づくインデックス化方法
US20020073079A1 (en) Method and apparatus for searching a database and providing relevance feedback
US7085761B2 (en) Program for changing search results rank, recording medium for recording such a program, and content search processing method
JP3225912B2 (ja) 情報検索装置、方法及び記録媒体
JP4944406B2 (ja) フレーズに基づく文書説明の生成方法
JP5175005B2 (ja) 情報検索システムにおけるフレーズに基づく検索方法
JP4976666B2 (ja) 情報検索システムにおけるフレーズ識別方法
US6205443B1 (en) Overlapping subdocuments in a vector space search process
US6725217B2 (en) Method and system for knowledge repository exploration and visualization
US20060248078A1 (en) Search engine with suggestion tool and method of using same
US20090094223A1 (en) System and method for classifying search queries
JP2002230037A (ja) 検索システム、方法及びプログラム
US20060041607A1 (en) Point of law search system and method
US20050081146A1 (en) Relation chart-creating program, relation chart-creating method, and relation chart-creating apparatus
JP2000090111A (ja) 情報検索エージェント装置及び情報検索エージェント装置の機能を発揮するプログラムを記録したコンピュータ読み取り可能な記録媒体
US8234584B2 (en) Computer system, information collection support device, and method for supporting information collection
JP4973503B2 (ja) ファイル検索プログラム、方法及び装置
JP2001167096A (ja) 文書検索システム、文書検索方法及びその方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH10269233A (ja) 文書データベースの検索結果表示方法及び装置
WO2000007133A1 (en) Method and system for applying user specified hyperlinks
US6473755B2 (en) Overlapping subdocuments in a vector space search process
US20050071333A1 (en) Method for determining synthetic term senses using reference text
JP3249743B2 (ja) 文書検索システム
JP2002032394A (ja) 関連語情報作成装置、関連語提示装置、文書検索装置、関連語情報作成方法、関連語提示方法、文書検索方法および記憶媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060419

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061101