JPH11161682A - 情報検索装置、情報検索方法及び記録媒体 - Google Patents

情報検索装置、情報検索方法及び記録媒体

Info

Publication number
JPH11161682A
JPH11161682A JP10139539A JP13953998A JPH11161682A JP H11161682 A JPH11161682 A JP H11161682A JP 10139539 A JP10139539 A JP 10139539A JP 13953998 A JP13953998 A JP 13953998A JP H11161682 A JPH11161682 A JP H11161682A
Authority
JP
Japan
Prior art keywords
search
sentence
data
keyword
character data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10139539A
Other languages
English (en)
Inventor
Takayuki Sako
孝之 酒匂
Satoshi Kinoshita
聡 木下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10139539A priority Critical patent/JPH11161682A/ja
Publication of JPH11161682A publication Critical patent/JPH11161682A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ユーザの求めている適切な検索結果を自動的
に呈示することにより、これまで必要であったユーザが
検索結果を絞り込む操作を軽減することを可能とした情
報検索装置を提供すること。 【解決手段】 文書中の単語や熟語の文字データを指定
し、指定された文字データに基づいて所定のデータベー
スから対象となるデータを検索し、該文字データを含む
少なくとも1文を切り出し該文の解析を行ない、該解析
結果に基づいてデータベースから検索された検索結果の
中から特定のデータを選択する。また、文書中の単語や
熟語の文字データを指定し、指定された文字データを含
む少なくとも1文を切り出し、該文の解析を行なってキ
ーワードを抽出し、抽出されたキーワードから検索条件
式を作成し、作成された検索条件に基づいて所定のデー
タベースから対象となるデータを検索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、指定された単語あ
るいは熟語に基づいて情報検索を行う情報検索装置、情
報検索方法及び記録媒体に関する。
【0002】
【従来の技術】計算機の小型化やインターネットの普及
に伴い、文書の作成や閲覧という操作を計算機上で行う
という状況が増えてきており、文書の推敲や辞書引きを
計算機上で行うためのソフトウェアも既に実用化されて
いる。
【0003】例えば、辞書検索ソフトでは辞書データを
CD−ROM等に格納しておき、ユーザが文書を作成し
ているときや文書を読んでいるときに、詳細情報が欲し
い文字列を検索文字列として入力することにより、CD
−ROM等に蓄積されている情報を参照することが可能
になっている。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
データ検索ソフトではCD−ROM等に蓄積されている
データを検索抽出し、抽出に成功したデータを全てユー
ザに呈示するという手法しかとられていなかった。これ
では、ユーザは欲しい情報を得るのに、さらにそれらの
データの中から、自分が必要な情報を手作業で探さなく
てはならず、ユーザにとっての負荷は大きなものであっ
た。
【0005】本発明は、上記事情を考慮してなされたも
ので、これまで必要であった検索結果からさらに必要な
情報をユーザが絞り込むという負荷を軽減させる情報検
索装置、情報検索方法及び記録媒体を提供することを目
的とする。
【0006】
【課題を解決するための手段】本発明(請求項1)に係
る情報検索装置は、文書中の単語あるいは熟語の文字デ
ータを指定する手段と、少なくとも前記文書中における
前記指定された文字データと所定の関係にある部分に基
づいて、1または複数のキーワードを求める手段と、少
なくとも前記指定された文字データおよび前記求められ
たキーワードに基づいて、所定のデータベースに対する
検索結果として提示すべきデータを決定する手段とを備
えたことを特徴とする。
【0007】本発明(請求項2)に係る情報検索装置
は、文書中の単語あるいは熟語の文字データを指定する
手段と、この手段により指定された文字データに基づい
て、所定のデータベースから対象となるデータを検索す
る手段と、前記文字データを含む少なくとも1文を切り
出し、該文の解析を行なう手段と、この手段による文の
解析結果に基づいて、前記データベースから検索された
検索結果の中から特定のデータを選択する手段とを備え
たことを特徴とする。
【0008】好ましくは、前記文の解析結果は、該文の
形態素解析結果によって抽出されたキーワードであるよ
うにしてもよい。
【0009】好ましくは、前記文の解析結果は、該文の
形態素解析結果によって抽出されたキーワードのうち、
距離的に近いもののみを選択したものであるようにして
もよい。
【0010】本発明(請求項5)に係る情報検索装置
は、文書中の単語あるいは熟語の文字データを指定する
手段と、この手段により指定された文字データを含む少
なくとも1文を切り出し、該文の解析を行なってキーワ
ードを抽出する手段と、この手段により抽出されたキー
ワードから検索条件式を作成する手段と、この手段によ
り作成された検索条件に基づいて、所定のデータベース
から対象となるデータを検索する手段とを備えたことを
特徴とする。
【0011】好ましくは、抽出されたキーワードから検
索条件を作成する際に、抽出されたキーワードのうち、
距離的に近いもののみを用いて検索条件を作成するよう
にしてもよい。
【0012】好ましくは、抽出されたキーワードから所
定のデータベースを用いて他の関連するキーワードを抽
出し、それらのキーワードのうち少なくとも1つを用い
て特定のデータを選択するようにしてもよい。
【0013】本発明(請求項8)に係る情報検索方法
は、文書中の単語あるいは熟語の文字データを指定し、
少なくとも前記文書中における前記指定された文字デー
タと所定の関係にある部分に基づいて、1または複数の
キーワードを求め、少なくとも前記指定された文字デー
タおよび前記求められたキーワードに基づいて、所定の
データベースに対する検索結果として提示すべきデータ
を決定することを特徴とする。
【0014】本発明(請求項9)に係る情報検索方法
は、文書中の単語あるいは熟語の文字データを指定し、
指定された文字データに基づいて、所定のデータベース
から対象となるデータを検索し、前記文字データを含む
少なくとも1文を切り出し、該文の解析を行い、解析さ
れた文の解析結果に基づいて、前記データベースから検
索された検索結果の中から特定のデータを選択すること
を特徴とする。
【0015】本発明(請求項10)に係る情報検索方法
は、文書中の単語あるいは熟語の文字データを指定し、
指定された文字データを含む少なくとも1文を切り出
し、該文の解析を行なってキーワードを抽出し、抽出さ
れたキーワードから検索条件式を作成し、作成された検
索条件に基づいて、所定のデータベースから対象となる
データを検索することを特徴とする。
【0016】本発明(請求項11)は、コンピュータ
に、文書中の単語あるいは熟語の文字データの入力を受
けさせ、少なくとも前記文書中における前記指定された
文字データと所定の関係にある部分に基づいて、1また
は複数のキーワードを求めさせ、少なくとも前記指定さ
れた文字データおよび前記求められたキーワードに基づ
いて、所定のデータベースに対する検索結果として提示
すべきデータを決定させるためのプログラムを記録した
コンピュータ読取り可能な記録媒体を要旨とする。
【0017】本発明(請求項12)は、文書中で指定さ
れた単語あるいは熟語の文字データの入力を受け、該文
字データに基づいて、所定のデータベースから対象とな
るデータを検索し、該文字データを含む少なくとも1文
を切り出し、該文の解析を行い、該文の解析結果に基づ
いて、前記データベースから検索された検索結果の中か
ら特定のデータを選択する機能を備えたことを特徴とす
る情報検索のための記録媒体を要旨とする。
【0018】本発明(請求項13)は、文書中で指定さ
れた単語あるいは熟語の文字データの入力を受け、該文
字データを含む少なくとも1文を切り出し、該文の解析
を行なってキーワードを抽出し、抽出されたキーワード
から検索条件式を作成し、作成された検索条件に基づい
て、所定のデータベースから対象となるデータを検索す
る機能を備えたことを特徴とする情報検索のための記録
媒体を要旨とする。
【0019】なお、装置に係る本発明は方法に係る発明
としても成立し、方法に係る本発明は装置に係る発明と
しても成立する。
【0020】また、装置または方法に係る本発明は、コ
ンピュータに当該発明に相当する手順を実行させるため
の(あるいはコンピュータを当該発明に相当する手段と
して機能させるための、あるいはコンピュータに当該発
明に相当する機能を実現させるための)プログラムを記
録したコンピュータ読取り可能な記録媒体としても成立
する。
【0021】本発明では、ユーザが指定した文字列の前
後の情報などを自動的に抽出し、それらの抽出した情報
を使って、検索結果を表示する際に表示させる情報を絞
り込むことができる。
【0022】例えば、文書中の関連する、あるいは詳細
な情報が知りたい単語、熟語等の文字データを指定する
と、指定された文字データに基づいて、所定のデータベ
ースから対象となるデータを検索し、文字データを含む
少なくとも1文を切り出し、該文の解析を行い、解析さ
れた文の解析結果に基づいて、データベースから検索さ
れた検索結果の中から特定のデータを選択する。あるい
は、例えば、指定された文字データを含む少なくとも1
文を切り出し、該文の解析を行なってキーワードを抽出
し、抽出されたキーワードから検索条件式を作成し、作
成された検索条件に基づいて、所定のデータベースから
対象となるデータを検索する。
【0023】本発明によれば、ユーザは必要な情報を効
率良く得ることができ、文章の理解を早めることに効果
がある。つまり、ユーザは必要な情報を自分で絞り込む
ことなく情報が呈示されるため、ユーザの負荷が軽減さ
れるのである。
【0024】
【発明の実施の形態】以下、図面を参照しながら発明の
実施の形態を説明する。
【0025】(第1の実施形態)本発明の第1の実施形
態について説明する。
【0026】図1に本実施形態に係る情報検索装置の構
成例を示す。図1に示されるように、本情報検索装置
は、入力部101、検索制御部102、文解析部10
3、データベース検索部104、解析知識105、デー
タベース106、出力部107を備えている。
【0027】入力部101は、文書を入力するためのも
のであるとともに、また入力された文書中の検索すべき
単語あるいは熟語の指示や検索された表示情報の選択の
指示等を入力するためのものである。
【0028】文書の入力には、例えば、キーボード(キ
ー入力)、記録媒体駆動装置(磁気ディスクや磁気テー
プあるいは光ディスクなどの記録媒体からの読み込
み)、OCR(光学読取り)、ネットワーク接続装置
(通信による取得)などのいずれか、もしくは複数種類
のものを使用する。なお、OCRを使用する場合には、
読み取った文字画像を文字認識してコード列を生成する
機能を用いる。
【0029】ユーザからの指示の入力には、例えば、キ
ーボード、マウスなどを使用する。
【0030】入力部101から入力された文書データ
は、検索制御部102のメモリ(図示せず)に一旦記憶
され、その後、入力部101を介して表示中の文書にお
けるある文字データ(単語や熟語)の検索が指示される
と、文書データの所定の部分(例えば、指示された文字
データを含む1文あるいは該1文を少なくとも含む複数
文)が文解析部103へ渡される。
【0031】入力部101によって検索が指示された文
字データは、検索制御部102を介してデータベース検
索部104に入力される。
【0032】文解析部103は、検索制御部102の制
御の下、該検索制御部102から文字データを受け取っ
て解析知識105を利用して文解析を行い解析結果を出
力する。文解析の方法としては、形態素解析、構文解
析、意味解析など、一般的な手法を用いることができ
る。
【0033】データベース検索部104は、検索制御部
102の制御の下、該検索制御部102から文字データ
を受け取ってデータベース106を参照して検索結果を
出力する。
【0034】検索制御部102は、文解析部103によ
る文解析結果とデータベース検索部104によるデータ
ベース106の検索結果とを利用して、ユーザが求めて
いるデータを選択し、出力部107に渡す。
【0035】出力部107は、入力文書や検索結果をユ
ーザに呈示するためのものである。
【0036】出力部107としては、光学ディスプレイ
やプリンタなどのいずれか、もしくは複数種類のものを
使用する。
【0037】以下、具体例を用いながら本実施形態をよ
り詳しく説明する。
【0038】ここでは文書は既に入力され表示されてい
るものとする。ユーザは入力部101によって、文書内
にある詳細情報が得たい文字列(以下、検索文字列と呼
ぶ)を指示する。
【0039】具体例として、図2に例示するように、
「…。彼はこの映画の監督である。…。…。」といった
文書が表示された表示画面においてユーザがマウス等の
入力部101を利用して「監督」という文字列部分をド
ラッグし、「監督」に関する詳細な情報を得るために指
示したとする。
【0040】検索制御部102は、位置情報等を利用し
ユーザの指示した検索文字列を含む1文を切り出し文解
析部103に送る。また、検索文字列をデータベース検
索部104に送る。
【0041】図2の例では、検索文字列「監督」を含む
1文、「彼はこの映画の監督である。」が切り出され、
文解析部103に送られる。また、検索文字列「監督」
はデータベース検索部104に送られる。
【0042】文解析部103は、検索制御部102から
入力された1文に対して、解析知識105を利用して解
析処理を行い、解析結果を検索制御部102に渡す。こ
こで言う解析処理とは、形態素解析、構文解析、意味解
析等の全て、もしくはその一部を指す。ここでは、一例
として、形態素解析を利用した場合について説明する。
図3に、上記の1文すなわち「彼はこの映画の監督であ
る。」に対して形態素解析を行った場合の解析結果の一
例を示す。
【0043】データベース検索部104は、検索制御部
102から入力された検索文字列「監督」を使ってデー
タベース106の中から対象となるデータを取り出し、
検索制御部102に渡す。
【0044】例えば、データベース106が図4に例示
する国語辞書のようなものであるとすると、検索制御部
102から渡された「監督」という検索文字列を利用し
て、その語義である「人の上に立って指図すること、
人、機関」「映画・演劇などで演出する人」等が取り出
される。
【0045】ここで、図4のデータの“< >”で囲ま
れた部分はタグである。例えば、“<見出し語>”か
ら、“<\見出し語>”で狭まれた部分が辞書の見出し
語となる。この例では辞書の見出し語は“監督”とな
る。次に見出し語に対する品詞情報が記述されている。
ここでは、名詞、動詞「スル」と結び付いてサ行変格活
用を行なう動詞として用いられる名詞であることを示
す。次に見出し語の語義が記述されている。ここでは語
義が3つあり、それぞれが、“語義部1”から“語義部
3”に記述されている。
【0046】なお、本実施形態においては、文解析部1
03による処理とデータベース検索部104による処理
は、これらを同時に実行してもよいし、いずれか一方を
先に他方を後に実行してもよい。
【0047】文解析部103からの解析結果およびデー
タベース検索部104からの検索結果は、検索制御部1
02に返され、ユーザに表示する内容が選択される。
【0048】ここで、図5に本実施形態における検索制
御部102の構成例を示す。図5に示されるように、こ
の検索制御部102は、制御記憶部601、キーワード
抽出部602および表示内容選択部603から構成され
る。
【0049】制御記憶部601は、入力部101から入
力された文書を記憶したり、ユーザからの検索指示を受
け取りデータベース検索部104に送ったり、1文を切
り出し文解析部103に送るといった、検索全体に関わ
る制御を行う。
【0050】キーワード抽出部602は、文解析部10
3から渡された解析結果の中から、表示内容を選択する
のに有効なキーワードを抽出し、キーワードリストを作
成して制御記憶部601に渡す。制御記憶部601は、
キーワードリストとデータベース検索部104からの検
索結果(図4参照)を表示内容選択部603に渡す。
【0051】図6に、キーワード抽出部602のキーワ
ードリスト作成処理の手順の一例を示す。
【0052】まず、変数nに1をセットする(ステップ
S702)。この値は検索文字列(図3の場合、「監
督」)からの距離を表す。ここで言う距離とは、検索文
字列から何語離れているかという値である。
【0053】形態素解析結果は、一語一語キーワードに
なるかどうか判断される(ステップS703、S70
4)。ここで言うキーワードは、検索結果を絞り込むた
めのもので、名詞であるか、固有名詞であるかといった
品詞情報や、コンピュータ用語、経済用語などといった
分野情報等をキーとして抽出された用語を指す。ここで
はキーワード抽出のためのキーを名詞とする。キーワー
ドとなる語はキーワードリストに保管される(ステップ
S705)。
【0054】さらに、変数nがスコープを越えていない
か判断する(ステップS706)。ここで言うスコープ
とは、検索文字列から何語離れた語までをキーワード抽
出の対象とするかを表わす値とする。例えば、スコープ
を5とすると、検索文字列の前後5単語からキーワード
を抽出することになる。本実施形態ではスコープを3と
する。スコープを越えていない場合は、nを1増やし
(ステップS707)、再度キーワードの検索を行う。
越えている場合は、スコープ内の全ての語が検索された
ので処理を終了し(ステップS708)、処理結果であ
るキーワードリストは表示内容選択部603に渡され
る。キーワードが抽出されなかった場合は、空のキーワ
ードリストが表示内容選択部603に渡される。
【0055】以上の処理により、例えば図3に示す形態
素解析結果が入力された場合には、「映画」がキーワー
ドとして抽出され、表示内容選択部603に渡される。
【0056】表示内容選択部603は、キーワード抽出
部602から渡されたキーワードリストとデータベース
検索部104から渡された検索結果とを受けとり、表示
内容を選択するために、検索結果に対して評価点を計算
し、その点数の最も高いものを出力部107に渡す。
【0057】図7に表示内容の選択手法としての手順の
一例を示す。この例では各語義文におけるキーワードの
出現回数を調べ、その回数の最も多いものをユーザに表
示する。本具体例では、表示内容選択部603は、図4
で表わされる検索結果とキーワードリスト「映画」とを
制御記憶部601より受け取ったとする。
【0058】まず、キーワード数テーブルを初期化する
(ステップS902)。キーワード数テーブルは、語義
データの中に表われたキーワードの数を記憶させておく
テーブルで、語義データの数だけ用意し、一対一に対応
させる。図4で表わされる検索結果を受け取った場合、
この検索結果には語義が3つ含まれるので、図8に示す
ように、3つのキーワード数テーブルが用意される。
【0059】次に、変数nに1をセットする(ステップ
S903)。この値は語義データのエントリ番号を表わ
す。
【0060】語義データは、キーワードリスト内の文字
列があるかどうか検索される(ステップS904、S9
05)。キーワードがある場合は、キーワードの個数を
カウントし、語義データと一対一に対応したキーワード
数テーブルに代入する(ステップS906)。
【0061】次の語義データがあるかどうか判断され
(ステップS907)、ある場合はnを1増やし(ステ
ップS908)、再度、語義データ内のキーワード検索
を行う。キーワードがない場合は、処理を終了し(ステ
ップS909)、キーワード数テーブルを利用して、キ
ーワードが最も多く表われた語義が出力部107に送ら
れ、辞書検索結果が表示される。
【0062】本具体例では、語義データの一番目にはキ
ーワードである「映画」が存在しないため、図9に示す
ように、一番目のキーワード数テーブルは0である。二
番目の語義データの中には「映画」が2語存在するた
め、二番目のキーワード数テーブルに2が代入される
(ステップS906)。以下同様にして、各語義データ
についてキーワード数を求める。この結果、最も適切な
語義として図4における二番目の語義データが選ばれ
る。
【0063】そして、例えば、図10に示すように、出
力部107により辞書検索結果が表示される。
【0064】なお、図10の表示例では検索文字列に最
も関連するデータのみを表示しているが、辞書検索結果
の表示の形態にはこの他にも種々のバリエーションが考
えられる。
【0065】例えば、ポップアップしている表示画面
を、マウス等を使ってクリックする等の方法により、他
のデータ(例えば図4における一番目や三番目の語義デ
ータ)を表示するようにしてもよい。次候補は、次にキ
ーワードの出現回数が多いもの、エントリ番号の小さい
ものといったような手法を単独もしくは組み合わせるこ
とによって、各候補に優先順位をつけ、それにより選択
することができる。
【0066】図11に、上記具体例においてユーザが次
候補の表示を指示した場合の表示例を示す。なお、図1
1の例ではエントリ番号の小さいものを優先するという
優先順位を使用している。
【0067】また、例えば、図12に示すように、一つ
の検索結果を選択して表示するのではなく、全ての検索
結果を優先順位で並び替えて表示するようにしてもよ
い。
【0068】なお、本実施形態では、キーワードの検索
範囲として、検索対象語から離れている語数によるスコ
ープを設定し、そのスコープの範囲内の語としたが、同
じ内容を表す要約文、文章の先頭、切り出した一文内、
一文を切出しその文中に見つからない場合はその前後の
文を検索する、といった方法を用いてもよい。
【0069】また、データベース106として種々のも
のを使用することが可能であり、例えばデータベース1
06を類義語辞書のようなものとすると、図13に例示
するように、「監督」に関する類義語を選び、表示させ
ることもできる。
【0070】以上のように本実施形態によれば、検索結
果をそのまま提示するのではなく、よりユーザが望むと
期待されるものだけを選択して提示し、あるいは検索結
果をすべて提示する場合であってもよりユーザが望むと
期待されるものがどれであるかを知らしめる形で提示す
るなどの提示方法をとることができる。この結果、ユー
ザは必要な情報を効率良く得ることができる。つまり、
ユーザは必要な情報を自分で絞り込むことなく情報が呈
示されるため、文章の理解が早まり、従来に比較してユ
ーザの負荷を軽減することができる。
【0071】(第2の実施形態)次に、本発明の第2の
実施形態について説明する。
【0072】第1の実施形態では、文解析部103の解
析結果として形態素解析を利用する場合について説明し
たが、本実施形態では、文解析部103の解析結果とし
て構文解析を利用する場合について説明する。
【0073】なお、以下では、第1の実施形態と相違す
る点を中心に説明する。
【0074】まず、ユーザによる検索指示の入力に応じ
た処理、データベース検索部104による処理は、第1
の実施形態と同様である。
【0075】ここで、図14に、文解析部103の解析
結果として形態素解析・構文解析を利用した場合の出力
結果の一例を示す。文解析部103の解析結果が、図1
4で表わすような構文解析結果(概念依存構造データ)
の場合、検索制御部102のキーワード抽出部602を
変更することにより構文解析結果を利用した場合の情報
検索装置を実現できる。
【0076】図15に構文解析結果を利用する場合にお
ける検索制御部102内のキーワード抽出部602の処
理手順の一例を示す。
【0077】まず、変数nに1をセットする(ステップ
S802)。この値は検索文字列を示すノードからの距
離を表す。ここで言う距離とは、検索文字列から何回リ
ンクを辿ったかという値である。すなわち、図14の
「監督」のノードから見ると「映画」「である」のノー
ドは距離が1で「彼」のノードは距離が2となる。
【0078】構文解析結果は、一語一語キーワードにな
るかどうか判断される(ステップS803、S80
4)。ここで言うキーワードは、検索結果を絞り込むた
めのもので、名詞であるか、固有名詞であるかといった
品詞情報や、コンピュータ用語、経済用語などといった
分野情報等をキーとして抽出された用語を指す。ここで
はキーワード抽出のためのキーを名詞とする。キーワー
ドとなる語は、キーワードリストに保管される(ステッ
プS805)。
【0079】さらに、変数nがスコープを越えていない
か判断する(ステップS806)。ここで言うスコープ
とは、検索文字列を示すノードからの距離がどれだけ離
れたノードまでをキーワード抽出の対象とするかを表わ
す値とする。例えば、スコープを5とすると、検索文字
列を示すノードからの距離が5以下のノードからキーワ
ードを抽出することになる。本実施形態ではスコープを
2とする。スコープを越えていない場合は、nを1増や
し(ステップS807)、再度キーワードの検索を行
う。越えている場合は、スコープ内の全ての語が検索さ
れたので処理を終了し、処理結果であるキーワードリス
トは表示内容選択部603に渡される。キーワードが抽
出されなかった場合は、空のキーワードリストが表示内
容選択部603に渡される。
【0080】以上の処理により、例えば図14に示す構
文解析結果が入力された場合には、「映画」がキーワー
ドとして抽出され、表示内容選択部603に渡される。
【0081】以降は、第1の実施形態と同様に、表示内
容選択部603によりキーワード抽出部602から渡さ
れたキーワードリストとデータベース検索部104から
渡された検索結果とに基づいて提示すべきデータが選択
され、例えば図10に示すように出力部107により辞
書検索結果が表示される。
【0082】なお、本発明は、上記した第1、第2の実
施形態に限定されるものではない。例えば、文解析とし
ては形態素解析や構文解析を利用した例を上げたが、単
純にキーワードを検索するだけでもかまわない。また、
データベースとしては、上記では国語辞書を用いたが、
その他の、例えば、外来語辞書、新語辞書、英和辞書な
どを用いてもよい。
【0083】(第3の実施形態)次に、本発明の第3の
実施形態について説明する。
【0084】第1の実施形態では、指定された単語や熟
語に基づいてデータベース106を検索して得た検索結
果について、文解析結果から抽出したキーワードでさら
に絞り込み等を行うものであったが、本実施形態では、
文解析結果から抽出したキーワード(主たる検索条件)
および指定された単語や熟語(従たる検索条件)に基づ
いてデータベース106に対する検索結果を得るように
したものである。
【0085】本実施形態に係る情報検索装置の構成例は
第1の実施形態と同様とする。すなわち、図1に示され
るように、本情報検索装置は、入力部101、検索制御
部102、文解析部103、データベース検索部10
4、解析知識105、データベース106、出力部10
7を備えている。
【0086】本実施形態では、検索制御部102におけ
る処理内容が第1の実施形態とは相違しているが、その
他は基本的には第1の実施形態と同様である。
【0087】以下では、第1の実施形態と相違する点を
中心に説明する。
【0088】入力部101から入力された文書データ
は、検索制御部102のメモリ(図示せず)に一旦記憶
され、その後、入力部101を介して表示中の文書にお
けるある文字データ(単語や熟語)の検索が指示される
と、文書データの所定の部分(例えば、指示された文字
データを含む1文あるいは該1文を少なくとも含む複数
文)が文解析部103へ渡される。
【0089】文解析部103は、検索制御部102の制
御の下、該検索制御部102から文字データを受け取っ
て解析知識105を利用して文解析を行い解析結果を出
力する。文解析の方法としては、形態素解析、構文解
析、意味解析など、一般的な手法を用いることができ
る。
【0090】検索制御部102は、入力部101から検
索を指示された文字データと文解析部103から渡され
た文解析結果とを利用して、ユーザが求めているデータ
を得るための検索条件式を作成し、データベース検索部
104に与え、検索を指示する。
【0091】データベース検索部104は、検索制御部
102の制御の下、該検索制御部102から渡された検
索条件式を受け取ってデータベース106を参照して検
索結果を出力する。
【0092】検索制御部102は、データベース検索部
104によるデータベース106の検索結果を出力部1
07に渡す。
【0093】以下、具体例を用いながら本実施形態をよ
り詳しく説明する。
【0094】ここでは文書は既に入力されているものと
する。ユーザは入力部101を使い、文書内にある詳細
情報を得たい文字列(すなわち検索文字列)を指示す
る。
【0095】具体例として、図16に例示するように、
「…。彼はジュラシックワールドの監督である。…。
…。」といった文書が表示された表示画面においてユー
ザがマウス等の入力装置を利用して「監督」という文字
列部分をドラッグし、「監督」に関する詳細な情報が得
たいと指示したとする。なお、「ジュラシックワール
ド」は映画名を表す固有名詞であるものとする。
【0096】検索制御部102は、位置情報等を利用し
ユーザの指示した検索文字列を含む1文を切り出し文解
析部103に送る。
【0097】図16の例では、検索文字列「監督」を含
む1文、「彼はジュラシックワールドの監督である。」
が切り出され、文解析部103に送られる。
【0098】文解析部103は、検索制御部102より
渡された1文に対して、解析知識105を利用して解析
処理を行い、解析結果を検索制御部102に渡す。ここ
で言う解析処理とは、形態素解析、構文解析、意味解析
等の全て、もしくはその一部指す。ここでは、第1の実
施形態と同様、一例として、形態素解析を利用した場合
について説明する。図17に、上記の1文すなわち「彼
はジュラシックワールドの監督である。」に対して形態
素解析を行った場合の解析結果の一例を示す。
【0099】検索制御部102は、文解析部103から
の解析結果および検索文字列を利用して検索条件式を作
成しデータベース検索部104に渡す。
【0100】ここで、図18に本実施形態における検索
制御部102の構成例を示す。図18に示されるよう
に、この検索制御部102は、制御記憶部2501、検
索条件式作成部2502から構成される。
【0101】制御記憶部2501は、入力部101から
入力された文書を記憶したり、ユーザからの検索指示を
受け取り、1文を切り出し文解析部103に送ったり、
データベースの検索結果を出力部107に送ったりとい
った、検索全体に関わる制御を行う。
【0102】検索条件式作成部2502は、文解析部1
03からの解析結果の中から、辞書を検索するために有
効なキーワードを抽出し、検索条件式を作成してデータ
ベース検索部104に渡す。
【0103】図19に、検索条件式作成部2502によ
る検索条件式の作成手順の一例を示す。
【0104】まず、変数nに1をセットし(ステップS
2602)、検索文字列(図17の場合、「監督」)か
らのn語離れた語(距離)を抽出する(ステップS26
03)。
【0105】形態素解析結果は、一語一語キーワードに
なるかどうか判断される(ステップS2604)。ここ
で言うキーワードは、検索条件式を作成するために有効
なもので、名詞であるか、固有名詞であるかといった品
詞情報や、コンピュータ用語、経済用語などといった分
野情報等をキーとして抽出された用語を指す。ここでは
キーワード抽出のためのキーを固有名詞とする。キーワ
ードとなる語はキーワードリストに保管される(ステッ
プS2605)。
【0106】さらに、変数nがスコープを越えていない
か判断する(ステップS2606)。ここで言うスコー
プとは、検索文字列から何語離れた語までをキーワード
抽出の対象とするかを表わす値とする。例えば、スコー
プを5とすると、検索文字列の前後5単語からキーワー
ドを抽出することになる。本実施形態ではスコープを3
とする。スコープを越えていない場合は、nを1増やし
(ステップS2607)、再度キーワードの検索を行
う。越えている場合は、キーワードリストと検索文字列
から検索条件式を作成し(ステップS2608)、処理
を終了し(ステップS2609)、検索条件式がデータ
ベース検索部104に渡される。キーワードリストと検
索文字列から検索条件式を作成する手法については、公
知の手法を用いれば良い。
【0107】以上の処理により、例えば図17で示す形
態素解析結果が入力された場合には、「ジュラシックワ
ールド」がキーワードとして抽出され、検索文字列「監
督」と共に「ジュラシックワールドの監督」を検索する
ための検索条件式が図20に示すように作成される。
【0108】データベース検索部104は、検索制御部
102により渡された検索条件式を使ってデータベース
の中から対象となるデータを取り出し検索制御部102
に渡す。
【0109】例えば、データベース106が図21に例
示する映画事典のようなものであるとすると、検索制御
部102から渡された図20に示す検索条件式より「ジ
ュラシックワールド」に関する情報を取り出し、条件式
からその素性として監督が要求されているので、「ステ
ィーブ・○○○○○」という文字列が取り出される。
【0110】ここで、図21のデータの“< >”で囲
まれた部分はタグである。例えば、“<見出し語>”か
ら、“<\見出し語>”で狭まれた部分が事典の見出し
語となる。この例では事典の見出し語は“ジュラシック
ワールド”となる。次に見出し語に対する公開年度が記
述されている。ここでは、1993年に公開されたこと
を示す。次に見出し語の製作者、監督と記述されてい
く。以下記述内容の説明は省略する。なお、「スティー
ブ・○○○○○」等は人名を表しているものとする。
【0111】検索された文字列は、検索制御部102を
介して出力部107に渡され、辞書検索結果が表示され
る。
【0112】例えば、図22に示すように、出力部10
7の出力装置により辞書検索結果が、ユーザに呈示され
る。
【0113】なお、上記では、キーワードリストと検索
文字列とから検索条件式を作成し、この検索条件式によ
りデータベースを検索して得た検索結果を提示するよう
にしたが、その代わりに、キーワードリストから検索条
件式を作成し、この検索条件式によりデータベースを検
索した後に、検索結果のうちから検索文字列に該当する
ものを選択して提示するようにしてもよい。
【0114】(第4の実施形態)次に、本発明の第4の
実施形態について説明する。
【0115】第3の実施形態では、文解析部103の解
析結果として形態素解析を利用する場合について説明し
たが、本実施形態では、文解析部103の解析結果とし
て構文解析を利用する場合について説明する。
【0116】なお、以下では、第3の実施形態と相違す
る点を中心に説明する。
【0117】まず、ユーザにより検索指示が入力される
と、第1の実施形態と同様に、例えば検索文字列「監
督」を含む1文すなわち「彼はジュラシックワールドの
監督である。」が切り出され、文解析部103に送られ
る。
【0118】ここで、図23に、文解析部103の解析
結果として形態素解析・構文解析を利用した場合の出力
結果の一例を示す。文解析部103の解析結果が、図2
3で表わすような構文解析結果(概念依存構造データ)
の場合、検索制御部102の検索条件式作成部2502
を変更することにより構文解析結果を利用した場合の検
索装置を実現できる。
【0119】図24に構文解析結果を利用する場合にお
ける検索制御部102内の検索条件式作成部2502の
処理手順の一例を示す。
【0120】まず、変数nに1をセットする(ステップ
S2702)。
【0121】検索文字列から何回リンクを辿ったかとい
う値nを抽出する(ステップS2703)。この値nは
検索文字列を示すノードからの距離を表す。すなわち、
図23の「監督」のノードから見ると「ジュラシックワ
ールド」「である」のノードは距離が1で「彼」のノー
ドは距離が2となる。
【0122】構文解析結果は、一語一語キーワードにな
るかどうか判断される(ステップS2704)。ここで
言うキーワードは、検索結果を絞り込むためのもので、
名詞であるか、固有名詞であるかといった品詞情報や、
コンピュータ用語、経済用語などといった分野情報等を
キーとして抽出された用語を指す。ここではキーワード
抽出のためのキーを固有名詞とする。キーワードとなる
語は、キーワードリストに保管される(ステップS27
05)。
【0123】さらに、変数nがスコープを越えていない
か判断する(ステップS2706)。ここで言うスコー
プとは、検索文字列を示すノードからの距離がどれだけ
離れたノードまでをキーワード抽出の対象とするかを表
わす値とする。例えば、スコープを5とすると、検索文
字列を示すノードからの距離が5以下のノードからキー
ワードを抽出することになる。本実施形態ではスコープ
を2とする。スコープを越えていない場合は、nを1増
やし(ステップS2707)、再度キーワードの検索を
行う。越えている場合は、スコープ内の全ての語が検索
されたので、キーワードリストと検索文字列から検索条
件式を作成し(ステップS2708)、処理を終了し
(ステップS2709)、検索条件式がデータベース検
索部104に渡される。キーワードリストと検索文字列
から検索条件式を作成する手法については現在の技術で
一般的な手法を用いればよい。
【0124】以上の処理により、例えば図23で示す構
文解析結果が入力された場合には、「ジュラシックワー
ルド」がキーワードとして抽出され、検索文字列「監
督」と共に「ジュラシックワールドの監督」を検索する
ための検索条件式が図20に示すように作成される。
【0125】以降は、第3の実施形態と同様に、データ
ベース検索部104により上記の検索条件式を使ってデ
ータベースの中から対象となるデータが取り出され、例
えば図22に示すように出力部107の出力装置により
辞書検索結果がユーザに呈示される。
【0126】なお、本発明は、上記した第3、第4の実
施形態に限定されるものではない。例えば、文解析は形
態素解析や構文解析を利用した例を上げたが、単純にキ
ーワードを検索するだけでもかまわない。また、データ
ベースとしては、上記では国語辞書を用いたが、その他
の、例えば、国語辞書、外来語辞書、新語辞書、英和辞
書などを用いても構わない。
【0127】また、第1〜第4の実施形態では、キーワ
ード抽出のための文解析の対象として、ユーザの指示し
た検索文字列を含む1文を切出したが、この文解析の対
象とする文の切り出し方については、この他にも種々の
方法が考えられ、例えば、ユーザの指示した検索文字列
を含む1文とその前後複数の文を一纏まりとして切り出
すようにしてもよい。
【0128】(第5の実施形態)次に、本発明の第5の
実施形態について説明する。
【0129】第1〜第4の実施形態では、文解析結果か
ら得たキーワードをそのまま検索もしくは検索結果の選
択に用いたが、本実施形態は、文解析結果から得たキー
ワードに基づいてさらに別の1または複数のキーワード
を求め、前者のキーワードの代わりにあるいは前者のキ
ーワードとともに、後者のキーワードを用いるようにす
るものである。
【0130】この構成は第1〜第4の実施形態のいずれ
にも適用可能であるが、以下では、前述した第1の実施
形態において、文解析結果から抽出されたキーワードか
ら所定のデータベースを用いて他の関連するキーワード
を抽出し、それらのキーワードのうち少なくとも一つを
用いて、検索結果から特定のデータを選択する場合につ
いて説明する。
【0131】以下では、第1の実施形態と相違する点を
中心に説明する。
【0132】本実施形態に係る情報検索装置の構成例は
第1の実施形態と同様とする。すなわち、図1に示され
るように、本情報検索装置は、入力部101、検索制御
部102、文解析部103、データベース検索部10
4、解析知識105、データベース106、出力部10
7を備えている。
【0133】本実施形態では、検索制御部102に上記
のような機能が付加される点が第1の実施形態とは相違
しているが、その他は基本的には第1の実施形態と同様
である。
【0134】以下、具体例を用いながら本実施形態をよ
り詳しく説明する。
【0135】ここでは、文書は既に入力されているもの
とする。ユーザは入力部101を使い、文書内にある詳
細情報が得たい文字列(すなわち検索文字列)を指示す
る。
【0136】具体例として、図16に例示するように、
「…。彼はジュラシックワールドの監督である。…。
…。」といった文書が表示された表示画面においてユー
ザがマウス等の入力装置を利用して「監督」という文字
列部分をドラッグし、「監督」に関する詳細な情報が得
たいと指示したとする。なお、「ジュラシックワール
ド」は映画名を表す固有名詞であるものとする。
【0137】検索制御部102は、位置情報等を利用し
ユーザの指示した検索文字列を含む一文を切り出し、文
解析装103に送る。
【0138】図16の例では、検索文字列「監督」を含
む一文、「彼はジュラシックワールドの監督である。」
が切り出され、文解析部103に送られる。
【0139】文解析部103は、検索制御部102より
渡された1文に対して解析知識105を利用して解析処
理を行い、解析結果を検索制御部102に渡す。ここで
言う解析処理とは、形態素解析、構文解析、意味解析等
の全て、もしくはその一部指す。ここでは、第1の実施
形態と同様、一例として、形態素解析を利用した場合に
ついて説明する。図17に、上記の1文すなわち「彼は
ジュラシックワールドの監督である。」に対して形態素
解析を行った場合の解析結果の一例を示す。
【0140】データベース検索部104は、検索制御部
102から入力された検索文字列「監督」を使ってデー
タベース106の中から対象となるデータを取り出し検
索制御部102に渡す。
【0141】ここでは、第1の実施形態と同様に、デー
タベース106が国語辞書のようなものであり、図4に
例示するような結果が取り出されたものとする。
【0142】文解析部103からの解析結果およびデー
タベース検索部104からの検索結果は、検索制御部1
02に返され、ユーザに表示する内容が選択される。
【0143】ここで、図25に本実施形態における検索
制御部102の構成例を示す。図25に示されるよう
に、この検索制御部102は、制御記憶部2401、キ
ーワード抽出部2402、データベース2403、表示
内容選択部2404から構成される。
【0144】制御記憶部2401は、第1の実施形態と
同様であり、入力部101から入力された文書を記憶し
たり、ユーザからの検索指示を受け取りデータベース検
索部104に送ったり、1文を切り出し文解析部103
に送るといった、検索全体に関わる制御を行う。
【0145】キーワード抽出部2402は、文解析部1
03から渡された解析結果の中からデータベース240
3を参照しつつ、提示すべき内容を選択するのに有効な
キーワードを抽出し、キーワードリストを作成して制御
記憶部2401に渡す。
【0146】本実施形態で使用されるデータベース24
03は、語の概念の上位下位関係を表わすシソーラスデ
ータとする。図26にシソーラスデータの一例を示す。
図26では、「ジュラシックワールド」「デイハード」
の上位概念として「アクション」があり、その上位概念
として「映画」があるといった上位下位関係が示されて
いる。なお、「デイハード」は映画名を表す固有名詞、
「アクション」は映画のジャンルを表す一般名詞である
ものとする。
【0147】図27にキーワード抽出部2402のキー
ワードリスト作成の処理手順の一例を示す。
【0148】まず、変数Nに1をセットする(ステップ
S2902)。この値は検索文字列(図17の場合、
「監督」)からの距離を表わす(ステップS290
3)。ここで言う距離とは、検索文字列から何語離れて
いるかという値である。
【0149】形態素解析結果は、一語一語キーワードに
なるかどうか判断される(ステップS2903、S29
04)。ここで言うキーワードは、検索結果を絞り込む
ためのもので、名詞であるか、固有名詞であるかといっ
た品詞情報や、コンピュータ用語、経済用語といった分
野情報等をキーとして抽出された用語を指す。ここでは
キーワード抽出のためのキーを固有名詞とする。キーワ
ードとなる語はキーワードリストに保管される(ステッ
プS2911)。
【0150】なお、本具体例では、図17に示す形態素
解析結果が入力された場合、変数N=2のときに、「ジ
ュラシックワールド」がキーワードとして抽出される。
【0151】キーワードが抽出されたならば、次に、キ
ーワードに関連する用語を抽出する処理を行う(ステッ
プS2912〜S2917)。
【0152】ここではデータベースとしてシソーラスを
用いそのシソーラス上のキーワードとのノードとの距離
によってキーワード候補を抽出する。ここで言うシソー
ラス上の距離とは、キーワードのノードから何回リンク
を辿ったかという値である。すなわち、図26におい
て、「ジュラシックワールド」のノードから見ると、
「アクション」のノードは距離が1で「デイハード」
「映画」のノードは距離が2となる。
【0153】まず、変数Mに1をセットする(ステップ
S2912)。この値はステップS2904で抽出され
たキーワードを示すノードからのシソーラス上の距離を
表わす。シソーラス上の語は一語一語キーワードとなる
か判断される(ステップS2913、S2914)。シ
ソーラスを使ってキーワード候補を捜すためのキーは、
形態素解析結果を使ってキーワード候補を捜すためのキ
ーと異なっていてもかまわない。ここではキーを一般名
詞とする。キーワードとなる語はキーワードリストに保
管される(ステップS2915)。
【0154】さらに、変数Mがスコープを越えていない
か判断する(ステップS2916)。ここで言うスコー
プとは、キーワードを表わすノードからのシソーラス上
の距離がどれだけ離れたノードまでをキーワード抽出の
対象とするかを表す値とする。例えば、スコープを5と
すると、キーワードを表わすノードからのシソーラス上
の距離が5以下のノードからキーワードを抽出すること
になる。本実施形態ではスコープを2とする。スコープ
を越えていない場合は、Mを1増し(ステップS291
7)、再度キーワードの検索を行う。越えている場合
は、シソーラス中のスコープ内の全ての語が検索された
ので、ステップS2906に戻る。
【0155】本具体例では、キーワードとして「ジュラ
シックワールド」が抽出された場合、該キーワードから
距離が2以下でありかつ一般名詞であるノードとして
「アクション」「映画」が抽出される。
【0156】ステップS2906では、変数Nがスコー
プを越えていないか判断する。ここで言うスコープと
は、検索文字列から何語離れた語までをキーワード抽出
の対象とするかを表わす値とする。例えば、スコープを
5とすると、検索文字列の前後5単語からキーワードを
抽出することになる。本実施形態ではスコープを3とす
る。スコープを越えていない場合は、ステップS290
7でNを1増やし、再度キーワードの検索を行う。越え
ている場合は、スコープ内の全ての語が検索されたので
処理を終了し、処理結果であるキーワードリストは表示
内容選択部に渡される。キーワードが抽出されなかった
場合は、空のキーワードリストが表示内容選択部に渡さ
れる。
【0157】以上の処理により、例えば図17に示す形
態素解析結果が入力された場合には、変数N=2のとき
に、「ジュラシックワールド」「アクション」「映画」
がキーワードとして抽出され、表示内容選択部2404
に渡される。
【0158】表示内容選択部2404は、第1の実施形
態で示した手法を用いて、検索結果の語義に対して評価
点を計算し、その点数の高いものを出力部107に渡
す。本実施形態のキーワード数テーブルを図28に示
す。この結果、最も適切な語義として二番目の語義デー
タが選ばれる。
【0159】そして、例えば、図29に示すように、出
力部107により辞書検索結果が表示される。
【0160】なお、上記では図25のデータベース24
03としてシソーラスを用いたが、これに限定されず、
種々のデータベースを用いることが可能である。
【0161】また、例えば、第1、第2の実施形態にお
いて、入力文書を和文とし、図1の検索対象とするデー
タベース106として和英辞書を用いる場合に、検索結
果として英文データが得られ、日本語のキーワードでは
検索結果の選択ができないようなケースであっても、デ
ータベース2403として和英辞書を用いてキーワード
を英語の訳語に変換することで、検索結果から提示すべ
きデータを選択することができるようになる。もちろ
ん、他の言語の場合も同様である。
【0162】また、例えば、データベース2403とし
て和英(英和)辞書を用いてキーワードを訳語に変換す
ることで、訳語を使用してデータベース検索部104で
データベースを検索することができる。
【0163】また、上記では、文解析により得られたキ
ーワードの上位概念をシソーラスを用いて求めたが(こ
れを1回のキーワードの変換とする)、例えば、まずシ
ソーラスを用いてキーワードの上位概念を求め、次に和
英辞書を用いてその上位概念の訳語を求め、これを検索
等に用いる、というように、2回以上のキーワードの変
換を行うようにしてもよい。
【0164】また、例えば、データベース2403とし
て相異なる複数の辞書を用い、各辞書によりそれぞれ得
られたキーワードを併せて用いるようにしてもよい。
【0165】また、最初に第1〜第4の実施形態のよう
に文解析結果から得たキーワードをそのまま用いて検索
処理を行い、当該キーワードが有効でなかった場合に
(例えば、当該キーワードに一致する語句が検索結果や
見出し語に存在しなかった場合)、本実施形態のように
文解析結果から得たキーワードに基づいて得た別の1ま
たは複数のキーワードを用いて検索処理を行うようにし
てもよい。
【0166】(第6の実施形態)第1〜第5の実施形態
では、検索結果として提示する情報の形態として、文字
データである場合について説明したが、本実施形態で
は、第1〜第5の実施形態において、該形態として、写
真、図、音声、画像、テキスト等といった複数のマルチ
メディア情報を取り扱う場合について説明する。
【0167】検索結果として複数のマルチメディア情報
を取り扱うようにする場合において、任意の検索文字列
に対してすべてのマルチメディア情報が表示(もしくは
再生等)可能というわけではない。例えば、音楽のタイ
トルが文中に出てきた場合に、音声データは出力可能で
あるが、音楽であるため写真等は出力できない、といっ
た状況が考えられる。
【0168】そこで、任意の検索文字列が指定された場
合、その検索文字列で表示可能な情報の種類をポップア
ップメニュー等を使用して、ユーザに提示し、ユーザに
表示する情報を選択させるようにすると好ましい。以下
では、そのいくつかの例を示す。
【0169】ここで、図16の例のような文書すなわち
「…。彼はジュラシックワールドの監督である。…。
…。」がすでに入力されているものとする。
【0170】ユーザは入力部101を使い文書内にある
詳細情報を得たい文字列(すなわち検索文字列)を指示
する。
【0171】例えば、「監督」という文字列の詳細情報
が得たいとすると、図16に例示するように、ユーザは
マウス等の入力装置を利用して「監督」という文字列部
分をドラッグする。すると、検索制御部は、これに応答
して、例えば図30に示すように、表示可能なマルチメ
ディア情報をポップアップメニューでユーザに提示す
る。
【0172】次に、ユーザは、そのポップアップメニュ
ーから自分が得たい詳細情報の種類を選択する。例え
ば、「監督」の「作品」に関する詳細情報が得たい場
合、図30に示すようにマウス等の入力装置を利用して
「作品」の部分を選ぶことにより指示する。
【0173】当該情報検索装置では、すでに説明したよ
うな手法を使って、例えば図31に示すように、ユーザ
の指示した「監督」の「作品」のリストを表示する。な
お、「映画A」、「映画B」、「映画C」および「映画
D」は、映画名を表す固有名詞であるものとする。
【0174】また、図30のポップアップメニューで
「語義」が選択指示されると、例えば図32に示すよう
に、「監督」の語義が表示される。
【0175】なお、上記の指定は、ファンクションキ
ー、マウスのクリック回数、指定アイコンのドラックア
ンドドロップ等で行ってもよい。
【0176】また、上記のように情報の種類を選択して
からデータを検索するのではなく、予めデータを検索し
てから表示等できる情報を提示し、ユーザに指示された
種類に該当する検索結果を表示等するようにしてもよ
い。
【0177】以下では、以上の各実施形態における種々
のバリエーションについて説明する。
【0178】上記では、検索制御部の制御の下で該検索
制御部を介して各部にデータを受け渡しするものとして
説明したが、データ受け渡しにあっては、実データを渡
すようにしてもよいし、その代わりに、実データが格納
されているアドレスなどのポインタ情報を渡すようにし
てもよい。
【0179】また、上記では、データベース106は当
該情報検索装置に備え付けられたものとして説明した
が、データベース106は当該情報検索装置では備え
ず、当該情報検索装置が外部のデータベース106にア
クセスするようにしてもよい。また、いずれの場合にお
いても、データベース106として複数種類のものを検
索可能とし、ユーザが検索対象とする1または複数のデ
ータベースを指定可能としてもよい。
【0180】また、同様に、第5の実施形態では、デー
タベース2403は検索制御部102内に備え付けられ
たものとして説明したが、データベース2403は当該
情報検索装置では備えず、当該情報検索装置が外部のデ
ータベース2403にアクセスするようにしてもよい。
【0181】また、検索結果を表示する際に、検索等に
使用したキーワードを併せて提示するようにしてもよ
い。
【0182】また、上記した各実施形態の検索機能は、
適宜組み合わせて備えてもよい。
【0183】また、以上の各実施形態において説明した
機能は、ソフトウェアによっても実現可能であり、当該
情報検索装置は、専用機として構成することも可能であ
るが、汎用の計算機を利用して構成することも可能であ
る。
【0184】また、以上の各実施形態において説明した
機能は、記録媒体に記憶させたものとして、すなわちコ
ンピュータに所定の手順を実行させるための(あるいは
コンピュータを所定の手段として機能させるための、あ
るいはコンピュータに所定の機能を実現させるための)
プログラムを記録したコンピュータ読取り可能な記録媒
体として実施することもできる。例えば、図1におい
て、検索制御部102、文解析部103、データベース
検索部104を、検索制御機能、文解析機能、データベ
ース検索機能として情報検索のための記録媒体に展開す
ることで実施できる。また、この場合、解析知識105
やデータベース106は、当該記録媒体に記憶して実現
するようにしてもよいし、あるいは当該記録媒体とは別
の記憶媒体(メモリ)に記憶して、検索制御機能、文解
析機能、データベース検索機能が記憶された当該記録媒
体と連携して可動するようにしてもよい。
【0185】また、各実施形態における検索機能は、例
えば、文書を作成もしくは編集するためのソフト、WW
Wや電子メールにより取得した文書を閲覧するためのソ
フト、機械翻訳ソフトなどに組み込む形で実施すること
も可能である。また、例えばネットワークを介するなど
して外部の要求元から文書データと指定の検索文字列と
を受信し、検索結果を該要求元へ送信するような検索サ
ービスシステムとして実施することも可能である。
【0186】本発明は、上述した実施の形態に限定され
るものではなく、その技術的範囲において種々変形して
実施することができる。
【0187】
【発明の効果】本発明によれば、ユーザは必要な情報を
効率良く得ることができ、文章の理解を早めることに効
果がある。つまり、ユーザは必要な情報を自分で絞り込
むことなく情報が呈示されるため、ユーザの負荷が軽減
されるのである。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る情報検索装置の構成
例を示す図
【図2】文書の表示例を示す図
【図3】対象となった文の形態素解析結果の一例を示す
【図4】国語辞書検索結果の一例を示す図
【図5】検索制御部の構成例を示す図
【図6】形態素解析結果を利用したキーワード抽出処理
の手順の一例を示すフローチャート
【図7】表示情報を選択するための処理手順の一例を示
すフローチャート
【図8】キーワード数テーブル(初期状態)の一例を示
す図
【図9】キーワード数テーブル(終了状態)の一例を示
す図
【図10】検索結果の表示例を示す図
【図11】検索結果の表示例を示す図
【図12】検索結果の表示例を示す図
【図13】検索結果の表示例を示す図
【図14】対象となった文の構文解析結果の一例を示す
【図15】構文解析結果を利用したキーワード抽出処理
の手順の一例を示すフローチャート
【図16】文書の表示例を示す図
【図17】対象となった文の形態素解析結果の一例を示
す図
【図18】検索制御部の構成例を示す図
【図19】形態素解析結果を利用したキーワード抽出処
理の手順の一例を示すフローチャート
【図20】検索条件式の一例を示す図
【図21】映画事典検索結果の一例を示す図
【図22】検索結果の表示例を示す図
【図23】対象となった文の構文解析結果の一例を示す
【図24】構文解析結果を利用したキーワード抽出処理
の手順の一例を示すフローチャート
【図25】検索制御部の構成例を示す図
【図26】シソーラスデータの一例を示す図
【図27】表示情報を選択するための処理手順の一例を
示すフローチャート
【図28】キーワード数テーブル(終了状態)の一例を
示す図
【図29】検索結果の表示例を示す図
【図30】ポップアップメニューの表示例を示す図
【図31】検索結果の表示例を示す図
【図32】検索結果の表示例を示す図
【符号の説明】
101…入力部 102…検索制御部 103…文解析部 104…データベース検索部 105…解析知識 106…データベース 107…出力部 601…制御記憶部 602…キーワード抽出部 603…表示内容選択部 2501…制御記憶部 2502…検索条件式作成部 2401…制御記憶部 2402…キーワード抽出部 2403…データベース 2404…表示内容選択部

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】文書中の単語あるいは熟語の文字データを
    指定する手段と、 少なくとも前記文書中における前記指定された文字デー
    タと所定の関係にある部分に基づいて、1または複数の
    キーワードを求める手段と、 少なくとも前記指定された文字データおよび前記求めら
    れたキーワードに基づいて、所定のデータベースに対す
    る検索結果として提示すべきデータを決定する手段とを
    備えたことを特徴とする情報検索装置。
  2. 【請求項2】文書中の単語あるいは熟語の文字データを
    指定する手段と、 この手段により指定された文字データに基づいて、所定
    のデータベースから対象となるデータを検索する手段
    と、 前記文字データを含む少なくとも1文を切り出し、該文
    の解析を行なう手段と、 この手段による文の解析結果に基づいて、前記データベ
    ースから検索された検索結果の中から特定のデータを選
    択する手段とを備えたことを特徴とする情報検索装置。
  3. 【請求項3】前記文の解析結果は、該文の形態素解析結
    果によって抽出されたキーワードであることを特徴とす
    る請求項2に記載の情報検索装置。
  4. 【請求項4】前記文の解析結果は、該文の形態素解析結
    果によって抽出されたキーワードのうち、距離的に近い
    もののみを選択したものであることを特徴とする請求項
    2に記載の情報検索装置。
  5. 【請求項5】文書中の単語あるいは熟語の文字データを
    指定する手段と、 この手段により指定された文字データを含む少なくとも
    1文を切り出し、該文の解析を行なってキーワードを抽
    出する手段と、 この手段により抽出されたキーワードから検索条件式を
    作成する手段と、 この手段により作成された検索条件に基づいて、所定の
    データベースから対象となるデータを検索する手段とを
    備えたことを特徴とする情報検索装置。
  6. 【請求項6】抽出されたキーワードから検索条件を作成
    する際に、抽出されたキーワードのうち、距離的に近い
    もののみを用いて検索条件を作成することを特徴とする
    請求項5に記載の情報検索装置。
  7. 【請求項7】抽出されたキーワードから所定のデータベ
    ースを用いて他の関連するキーワードを抽出し、 それらのキーワードのうち少なくとも1つを用いて特定
    のデータを選択するとを特徴とする請求項2ないし6の
    いずれか1項に記載の情報検索装置。
  8. 【請求項8】文書中の単語あるいは熟語の文字データを
    指定し、 少なくとも前記文書中における前記指定された文字デー
    タと所定の関係にある部分に基づいて、1または複数の
    キーワードを求め、 少なくとも前記指定された文字データおよび前記求めら
    れたキーワードに基づいて、所定のデータベースに対す
    る検索結果として提示すべきデータを決定することを特
    徴とする情報検索方法。
  9. 【請求項9】文書中の単語あるいは熟語の文字データを
    指定し、 指定された文字データに基づいて、所定のデータベース
    から対象となるデータを検索し、 前記文字データを含む少なくとも1文を切り出し、該文
    の解析を行い、 解析された文の解析結果に基づいて、前記データベース
    から検索された検索結果の中から特定のデータを選択す
    ることを特徴とする情報検索方法。
  10. 【請求項10】文書中の単語あるいは熟語の文字データ
    を指定し、 指定された文字データを含む少なくとも1文を切り出
    し、該文の解析を行なってキーワードを抽出し、 抽出されたキーワードから検索条件式を作成し、 作成された検索条件に基づいて、所定のデータベースか
    ら対象となるデータを検索することを特徴とする情報検
    索方法。
  11. 【請求項11】コンピュータに、文書中の単語あるいは
    熟語の文字データの入力を受けさせ、少なくとも前記文
    書中における前記指定された文字データと所定の関係に
    ある部分に基づいて、1または複数のキーワードを求め
    させ、少なくとも前記指定された文字データおよび前記
    求められたキーワードに基づいて、所定のデータベース
    に対する検索結果として提示すべきデータを決定させる
    ためのプログラムを記録したコンピュータ読取り可能な
    記録媒体。
  12. 【請求項12】文書中で指定された単語あるいは熟語の
    文字データの入力を受け、 該文字データに基づいて、所定のデータベースから対象
    となるデータを検索し、 該文字データを含む少なくとも1文を切り出し、該文の
    解析を行い、 該文の解析結果に基づいて、前記データベースから検索
    された検索結果の中から特定のデータを選択する機能を
    備えたことを特徴とする情報検索のための記録媒体。
  13. 【請求項13】文書中で指定された単語あるいは熟語の
    文字データの入力を受け、 該文字データを含む少なくとも1文を切り出し、該文の
    解析を行なってキーワードを抽出し、 抽出されたキーワードから検索条件式を作成し、 作成された検索条件に基づいて、所定のデータベースか
    ら対象となるデータを検索する機能を備えたことを特徴
    とする情報検索のための記録媒体。
JP10139539A 1997-09-29 1998-05-21 情報検索装置、情報検索方法及び記録媒体 Pending JPH11161682A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10139539A JPH11161682A (ja) 1997-09-29 1998-05-21 情報検索装置、情報検索方法及び記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP9-263606 1997-09-29
JP26360697 1997-09-29
JP10139539A JPH11161682A (ja) 1997-09-29 1998-05-21 情報検索装置、情報検索方法及び記録媒体

Publications (1)

Publication Number Publication Date
JPH11161682A true JPH11161682A (ja) 1999-06-18

Family

ID=26472326

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10139539A Pending JPH11161682A (ja) 1997-09-29 1998-05-21 情報検索装置、情報検索方法及び記録媒体

Country Status (1)

Country Link
JP (1) JPH11161682A (ja)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001229203A (ja) * 1999-12-07 2001-08-24 Nec Corp マルチメディア検索サーバーおよび画像音声混合文章生成装置
JP2002197104A (ja) * 2000-12-27 2002-07-12 Communication Research Laboratory 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
JP2003532194A (ja) * 2000-04-24 2003-10-28 マイクロソフト コーポレイション 言語間リーディングウィザードを用いたコンピュータ援用リーディングシステムおよび方法
JP2005085285A (ja) * 2003-09-10 2005-03-31 Microsoft Corp ペンベースのコンピューティングシステムでの注釈の管理
JP2006510123A (ja) * 2002-11-18 2006-03-23 アメリカ オンライン インコーポレーテッド キャラクタ・ストリームに関連するホスト・ベースのインテリジェントな結果
JP2007102767A (ja) * 2005-09-07 2007-04-19 Ricoh Co Ltd 情報処理装置
JP2007164788A (ja) * 2005-12-12 2007-06-28 Fuji Xerox Co Ltd 関連情報決定方法及び装置並びにプログラム
JP2007200321A (ja) * 2006-01-27 2007-08-09 Xerox Corp 言語ユーザインターフェース
JP2007272872A (ja) * 2006-03-08 2007-10-18 Ricoh Co Ltd 情報検索方法、情報検索装置、情報検索システム、及び情報検索プログラム
JP2012138109A (ja) * 2006-03-08 2012-07-19 Ricoh Co Ltd 検索装置、検索システム、情報処理装置、検索結果受信方法、及び情報受信プログラム
US8775538B2 (en) 2003-09-05 2014-07-08 Facebook, Inc. Methods for capturing electronic messages based on capture rules relating to online contexts of users
US8874606B2 (en) 2005-05-26 2014-10-28 Facebook, Inc. Sourcing terms into a search engine
US8874672B2 (en) 2003-03-26 2014-10-28 Facebook, Inc. Identifying and using identities deemed to be known to a user
US8965964B1 (en) 2002-11-18 2015-02-24 Facebook, Inc. Managing forwarded electronic messages
US9203879B2 (en) 2000-03-17 2015-12-01 Facebook, Inc. Offline alerts mechanism
US9203647B2 (en) 2002-11-18 2015-12-01 Facebook, Inc. Dynamic online and geographic location of a user
US9246975B2 (en) 2000-03-17 2016-01-26 Facebook, Inc. State change alerts mechanism
US9356890B2 (en) 2002-11-18 2016-05-31 Facebook, Inc. Enhanced buddy list using mobile device identifiers
US9560000B2 (en) 2002-11-18 2017-01-31 Facebook, Inc. Reconfiguring an electronic message to effect an enhanced notification
US9647872B2 (en) 2002-11-18 2017-05-09 Facebook, Inc. Dynamic identification of other users to an online user
JP2017517052A (ja) * 2014-04-29 2017-06-22 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 表示内容に対応する検索結果の提供
US10187334B2 (en) 2003-11-26 2019-01-22 Facebook, Inc. User-defined electronic message preferences
US10191940B2 (en) 2007-09-04 2019-01-29 Microsoft Technology Licensing, Llc Gesture-based searching
US10778635B2 (en) 2002-11-18 2020-09-15 Facebook, Inc. People lists
WO2023276646A1 (ja) * 2021-07-02 2023-01-05 株式会社LegalOn Technologies 情報処理装置、情報処理方法、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05189492A (ja) * 1992-01-14 1993-07-30 Nec Corp 検索式自動生成装置
JPH0644305A (ja) * 1992-03-18 1994-02-18 Gakushiyuu Joho Tsushin Syst Kenkyusho:Kk 関連項目検索方法およびシステム
JPH07182370A (ja) * 1993-12-22 1995-07-21 Canon Inc テキスト検索装置
JPH0844771A (ja) * 1994-05-25 1996-02-16 Fuji Xerox Co Ltd 情報検索装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05189492A (ja) * 1992-01-14 1993-07-30 Nec Corp 検索式自動生成装置
JPH0644305A (ja) * 1992-03-18 1994-02-18 Gakushiyuu Joho Tsushin Syst Kenkyusho:Kk 関連項目検索方法およびシステム
JPH07182370A (ja) * 1993-12-22 1995-07-21 Canon Inc テキスト検索装置
JPH0844771A (ja) * 1994-05-25 1996-02-16 Fuji Xerox Co Ltd 情報検索装置

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001229203A (ja) * 1999-12-07 2001-08-24 Nec Corp マルチメディア検索サーバーおよび画像音声混合文章生成装置
US9736209B2 (en) 2000-03-17 2017-08-15 Facebook, Inc. State change alerts mechanism
US9203879B2 (en) 2000-03-17 2015-12-01 Facebook, Inc. Offline alerts mechanism
US9246975B2 (en) 2000-03-17 2016-01-26 Facebook, Inc. State change alerts mechanism
JP2003532194A (ja) * 2000-04-24 2003-10-28 マイクロソフト コーポレイション 言語間リーディングウィザードを用いたコンピュータ援用リーディングシステムおよび方法
JP2002197104A (ja) * 2000-12-27 2002-07-12 Communication Research Laboratory 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
US9852126B2 (en) 2002-11-18 2017-12-26 Facebook, Inc. Host-based intelligent results related to a character stream
US9356890B2 (en) 2002-11-18 2016-05-31 Facebook, Inc. Enhanced buddy list using mobile device identifiers
US10389661B2 (en) 2002-11-18 2019-08-20 Facebook, Inc. Managing electronic messages sent to mobile devices associated with electronic messaging accounts
US8005919B2 (en) 2002-11-18 2011-08-23 Aol Inc. Host-based intelligent results related to a character stream
US10033669B2 (en) 2002-11-18 2018-07-24 Facebook, Inc. Managing electronic messages sent to reply telephone numbers
US9894018B2 (en) 2002-11-18 2018-02-13 Facebook, Inc. Electronic messaging using reply telephone numbers
US9203647B2 (en) 2002-11-18 2015-12-01 Facebook, Inc. Dynamic online and geographic location of a user
US9647872B2 (en) 2002-11-18 2017-05-09 Facebook, Inc. Dynamic identification of other users to an online user
US9621376B2 (en) 2002-11-18 2017-04-11 Facebook, Inc. Dynamic location of a subordinate user
US8954534B2 (en) 2002-11-18 2015-02-10 Facebook, Inc. Host-based intelligent results related to a character stream
US8965964B1 (en) 2002-11-18 2015-02-24 Facebook, Inc. Managing forwarded electronic messages
US9560000B2 (en) 2002-11-18 2017-01-31 Facebook, Inc. Reconfiguring an electronic message to effect an enhanced notification
US9313046B2 (en) 2002-11-18 2016-04-12 Facebook, Inc. Presenting dynamic location of a user
JP2006510123A (ja) * 2002-11-18 2006-03-23 アメリカ オンライン インコーポレーテッド キャラクタ・ストリームに関連するホスト・ベースのインテリジェントな結果
US10778635B2 (en) 2002-11-18 2020-09-15 Facebook, Inc. People lists
US8874672B2 (en) 2003-03-26 2014-10-28 Facebook, Inc. Identifying and using identities deemed to be known to a user
US10102504B2 (en) 2003-09-05 2018-10-16 Facebook, Inc. Methods for controlling display of electronic messages captured based on community rankings
US8775538B2 (en) 2003-09-05 2014-07-08 Facebook, Inc. Methods for capturing electronic messages based on capture rules relating to online contexts of users
JP2005085285A (ja) * 2003-09-10 2005-03-31 Microsoft Corp ペンベースのコンピューティングシステムでの注釈の管理
US10187334B2 (en) 2003-11-26 2019-01-22 Facebook, Inc. User-defined electronic message preferences
US9753972B2 (en) 2005-05-26 2017-09-05 Facebook, Inc. Searching based on user interest
US8874606B2 (en) 2005-05-26 2014-10-28 Facebook, Inc. Sourcing terms into a search engine
US8996560B2 (en) 2005-05-26 2015-03-31 Facebook, Inc. Search engine utilizing user navigated documents
JP2007102767A (ja) * 2005-09-07 2007-04-19 Ricoh Co Ltd 情報処理装置
JP2007164788A (ja) * 2005-12-12 2007-06-28 Fuji Xerox Co Ltd 関連情報決定方法及び装置並びにプログラム
JP2007200321A (ja) * 2006-01-27 2007-08-09 Xerox Corp 言語ユーザインターフェース
JP2007272872A (ja) * 2006-03-08 2007-10-18 Ricoh Co Ltd 情報検索方法、情報検索装置、情報検索システム、及び情報検索プログラム
US8386470B2 (en) 2006-03-08 2013-02-26 Ricoh Company, Ltd. Information searching method, information searching apparatus, information searching system, and computer-readable information searching program
JP2012138109A (ja) * 2006-03-08 2012-07-19 Ricoh Co Ltd 検索装置、検索システム、情報処理装置、検索結果受信方法、及び情報受信プログラム
US10191940B2 (en) 2007-09-04 2019-01-29 Microsoft Technology Licensing, Llc Gesture-based searching
JP2017517052A (ja) * 2014-04-29 2017-06-22 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited 表示内容に対応する検索結果の提供
WO2023276646A1 (ja) * 2021-07-02 2023-01-05 株式会社LegalOn Technologies 情報処理装置、情報処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
JPH11161682A (ja) 情報検索装置、情報検索方法及び記録媒体
US6662152B2 (en) Information retrieval apparatus and information retrieval method
JP3666004B2 (ja) 多言語対応文書検索システム
US6396951B1 (en) Document-based query data for information retrieval
US6044365A (en) System for indexing and retrieving graphic and sound data
US5523945A (en) Related information presentation method in document processing system
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
EP0822502A1 (en) Data access system
US20070118519A1 (en) Question answering system, data search method, and computer program
US20060282414A1 (en) Question answering system, data search method, and computer program
US7200808B1 (en) Electronic document processor
JP2002197104A (ja) 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
JP4967037B2 (ja) 情報検索装置、情報検索方法、端末装置、およびプログラム
JP2957875B2 (ja) 文書情報検索装置及び文書検索結果表示方法
JP4499179B1 (ja) 端末装置
JP5439028B2 (ja) 情報検索装置、情報検索方法、およびプログラム
JP4496797B2 (ja) 文書管理装置および方法
JP4384736B2 (ja) 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JP2000105769A (ja) 文書表示方法
JPH09231233A (ja) ネットワーク検索装置
JP4074687B2 (ja) 要約文作成支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145269A (ja) 文書管理支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH08272782A (ja) 文書検索装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050419

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051025