JP2003196308A - 情報検索方法、情報検索装置及び記録媒体 - Google Patents

情報検索方法、情報検索装置及び記録媒体

Info

Publication number
JP2003196308A
JP2003196308A JP2001395807A JP2001395807A JP2003196308A JP 2003196308 A JP2003196308 A JP 2003196308A JP 2001395807 A JP2001395807 A JP 2001395807A JP 2001395807 A JP2001395807 A JP 2001395807A JP 2003196308 A JP2003196308 A JP 2003196308A
Authority
JP
Japan
Prior art keywords
words
word
search
search condition
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001395807A
Other languages
English (en)
Inventor
Kazuyo Ikeda
和世 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001395807A priority Critical patent/JP2003196308A/ja
Publication of JP2003196308A publication Critical patent/JP2003196308A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 検索条件の作成を容易に行うことができると
ともに、検索精度を飛躍的に高めることができる情報検
索方法を提供すること。 【構成】 検索条件入力工程において入力された検索条
件を満たす見出し語を求める情報検索方法において、検
索条件入力工程においては、自然な言葉で表現される検
索条件を入力し、検索条件入力工程によって入力された
検索条件を解析し、検索条件を構成する単語と各単語間
の関係を求める検索条件解析工程と、情報記憶部に格納
されている説明文を解析し、説明文を構成する単語と各
単語間の関係を求める説明文解析工程と、該検索条件解
析工程によって得られた単語及び単語間の関係と、前記
説明文解析工程によって得られた単語及び単語間の関係
を比較し、検索条件の単語を含み、各単語間の関係も全
て一致する説明文又は検索条件の単語の一部を含み、各
単語間の関係も一致する説明文に対応した前記情報記憶
部の見出し語を検索結果として出力する説明文検索工程
を有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータ等に
おける情報検索方法、情報検索装置及び情報検索を実行
させるための制御プログラムを記録したコンピュータ読
み取り可能な記録媒体に関する。
【0002】
【従来の技術】従来、電子化された国語辞典や百科事典
のような電子辞書を検索する手法として、検索条件とし
て電子辞書の見出し語を指定し、指定された検索条件と
一致する見出し語に対応した説明文を出力する方法が行
われている。
【0003】しかしながら、検索者が見出し語を知って
いる場合は上記方法により目的を達成できるが、検索者
が見出し語を知らない場合は、このような検索手法は余
り役に立たない。
【0004】検索者が見出し語を知らない場合で、電子
辞書を検索したい場合として、見出し語に対応した概念
から見出し語を検索する場合が考えられる。例えば、
「おくびょうで気が弱いこと」を一言で表す単語を知り
たい場合が考えられる。又、別の例として、目の前にい
る「足が短くて毛が長い犬」の種類を知りたい場合が考
えられる。
【0005】このような目的に対応するために、従来
は、全文検索の手法を用いて検索条件を単語の論理式で
表し、電子辞書の説明文と比較する方法が用いられてき
た。例えば、前者の例では、検索条件を『「おくびょ
う」∧「気」∧「弱い」』として表現し、「おくびょ
う」と「気」と「弱い」を含む説明文を持つ見出し語を
検索結果として出力することにより目的を達成すること
ができる。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来例では、単に説明文に単語が存在するかどうかによっ
て、検索条件と説明文の一致判定を行っているため、検
索結果が正確でないという欠点があった。例えば、後者
の例では、検索条件を『「足」∧「短い」∧「毛」∧
「長い」∧「犬」』として表現するため、「足が長くて
毛が短い大」のような説明文を持つ見出し語も検索結果
として出力されることになる。
【0007】又、前記従来例では、検索条件を論理式で
示さなけれぱならないため、検索者が検索条件を表現す
るのが難しいという欠点もあった。
【0008】本発明は上記問題に鑑みてなされたもの
で、その目的とする処は、検索条件の作成を容易に行う
ことができるとともに、検索精度を飛躍的に高めること
ができる情報検索方法、情報検索装置及び記録媒体を提
供することにある。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、本発明に係情報検索方法、情報検索装置及び記録媒
体は、見出し語に対して見出し語を自然な言葉で説明す
る説明文を対応させて格納した情報記憶部と、検索条件
を入力する検索条件入力工程と、前記情報記憶部を検索
し、前記検索条件入力工程において入力された検索条件
を満たす見出し語を求める情報検索方法において、前記
検索条件入力工程においては、自然な言葉で表現される
検索条件を入力し、前記検索条件入力工程によって入力
された検索条件を解析し、検索条件を構成する単語と各
単語間の関係を求める検索条件解析工程と、前記情報記
憶部に格納されている説明文を解析し、説明文を構成す
る単語と各単語間の関係を求める説明文解析工程と、該
検索条件解析工程によって得られた単語及び単語間の関
係と、前記説明文解析工程によって得られた単語及び単
語間の関係を比較し、検索条件の単語を含み、各単語間
の関係も全て一致する説明文又は検索条件の単語の一部
を含み、各単語間の関係も一致する説明文に対応した前
記情報記憶部の見出し語を検索結果として出力する説明
文検索工程を有することを特徴とする。
【0010】又、本発明は、見出し語に対して見出し語
を自然な言葉で説明する説明文を対応させて格納した情
報記憶部と、検索条件を入力する検索条件入力手段と、
前記情報記憶部を検索し、前記検索条件入力手段におい
て入力された検索条件を満たす見出し語を求める情報検
索装置において、前記検索条件入力手段においては、自
然な言葉で表現される検索条件を入力し、前記検索条件
入力手段によって入力された検索条件を解析し、検索条
件を構成する単語と各単語間の関係を求める検索条件解
析手段と、前記情報記憶部に格納されている説明文を解
析し、説明文を構成する単語と各単語間の関係を求める
説明文解析手段と、該検索条件解析手段によって得られ
た単語及び単語間の関係と、前記説明文解析手段によっ
て得られた単語及び単語間の関係を比較し、検索条件の
単語を含み、各単語間の関係も全て一致する説明文又は
検索条件の単語の一部を含み、各単語間の関係も一致す
る説明文に対応した前記情報記憶部の見出し語を検索結
果として出力する説明文検索手段を有することを特徴と
する。
【0011】更に、本発明は、見出し語に対して見出し
語を自然な言葉で説明する説明文を対応させて格納した
情報記憶部と、検索条件を入力する検索条件入力工程
と、前記情報記憶部を検索し、前記検索条件入力工程に
おいて入力された検索条件を満たす見出し語を求める情
報検索プログラムを記録した記憶媒体において、前記検
索条件入力工程においては、自然な言葉で表現される検
索条件を入力し、前記検索条件入力工程によって入力さ
れた検索条件を解析し、検索条件を構成する単語と各単
語間の関係を求める検索条件解析工程と、前記情報記憶
部に格納されている説明文を解析し、説明文を構成する
単語と各単語間の関係を求める説明文解析工程と、該検
索条件解析工程によって得られた単語及び単語間の関係
と、前記説明文解析工程によって得られた単語及び単語
間の関係を比較し、検索条件の単語を含み、各単語間の
関係も全て一致する説明文又は検索条件の単語の一部を
含み、各単語間の関係も一致する説明文に対応した前記
情報記憶部の見出し語を検索結果として出力する説明文
検索工程を有する情報検索方法をコンピュータに実行さ
せるプログラムを記録して成ることを特徴とする。
【0012】
【発明の実施の形態】以下に本発明の実施の形態を添付
図面に基づいて説明する。
【0013】図1は本発明に係る情報検索方法及び情報
検索装置の実施例を示す概念図、図2は本発明に係る情
報検索方法及び情報検索装置の実施の形態を示すシステ
ム構成図、図14は本発明に係る情報検索方法のデータ
処理のフローチャートである。
【0014】図1において、文字キー、ファンクション
キー等を備えたキーボード等の入力部101から自然な
言葉で表現された検索条件であるクエリを制御部102
へ入力する。制御部102はマイクロプロセッサから成
り、検索条件解析部103においてクエリを解析し、ク
エリを構成する単語と各単語間の関係を求める。更に、
情報記憶部107に格納された検索対象の説明文を取り
出し、説明文解析部104において、説明文を構成する
単語と各単語間の関係を求める。そして、説明文検索部
105において、クエリを構成する単語と各単語間の関
係と、説明文を構成する単語と各単語間の関係を比較
し、説明文を構成する単語と各単語間の関係がクエリを
構成する単語と各単語間の関係の全て又は一部を含む場
合は、説明文に対応した見出し語を表示部108へ出力
する。
【0015】図2におけるROM202には、図4に示
すように、制御手順プログラム401が格納されてい
る。図2におけるRAM203には、図6に示すよう
に、情報検索プログラム603、電子図鑑604、単語
辞書605、文法辞書606、形態素リスト607、ロ
ールリスト608、検索結果リスト609等が格納され
ている。
【0016】図3はプログラム等が媒体であるCD−R
OM205からコンピュータシステムに供給されること
を示す。図5は記録媒体CD−ROM205中の情報検
索プログラム501、並びに関連データである電子図鑑
502、単語辞書503、文法辞書504の構成を示
す。
【0017】図6はCD−ROM205に格納されてい
る情報検索プログラム50及び関連データである電子図
鑑502、単語辞書503、文法辞書504等がRAM
203にロードされて実行可能となった状態のメモリマ
ップを示す。実行可能となった状態では、情報検索プロ
グラム603、電子図鑑604、単語辞書605、文法
辞書606以外に、情報検索プログラムが使用するメモ
リとして、形態素リスト607、ロールリスト608及
び検索結果リスト609の領域が確保され、初期化され
る。
【0018】図7はRAM203に読み込まれた電子図
鑑604の構成を示した図である。電子図鑑604に
は、見出し語とその見出し語に対する説明文とその見出
し語を表す画像ファイルの名称をそれぞれ1つずつ対応
させたものを1つの項目とし、複数の項目が格納されて
いる。例えば、図中では、1つの項目として、見出し語
「dachsfund」と、説明文「dog with
short legs…」と、画像ファイル「000
01002.jpg」が対応されて格納されている。各
項目は、見出し語によって昇順にソートされている。
【0019】図8はRAM203に読み込まれた単語辞
書605の構成を示した図である。単語辞書605に
は、見出し語とカテゴリをそれぞれ1つずつ対応させた
ものを1つの単語の情報とし、複数の単語の情報が格納
されている。例えば、単語辞書605には、1つの単語
の情報として、見出し語「dog」とカテゴリ「Nou
n」を対応させて格納されている。各単語の情報は、見
出し語によって昇順にソートされている。
【0020】図9はRAM203に読み込まれた文法辞
書606の構成を示した図である。文法辞書606に
は、左カテゴリと右カテゴリとロールとをそれぞれ1つ
ずつ対応させたものを1つの文法ルールとし、複数の文
法ルールが格納されている。各文法ルールにおいて、左
カテゴリと右カテゴリは、単語辞書605に格納されて
いるカテゴリに対応する。各文法ルールの意味は、文中
において、左の単語のカテゴリと右の単語のカテゴリが
それぞれ文法辞書606の1つの文法ルールの左カテゴ
リと右カテゴリに一致した場合、その2つ単語の間の関
係として、左カテゴリと右カテゴリに対応したロールの
関係にある可能性があることを意味している。例えば、
文中において、左の単語のカテゴリがAdverbで、
右の単語のカテゴリがAdjectiveであれば、そ
の2つの単語の間の関係はModifierの可能性が
あることが図示されている。
【0021】図10はRAM203に確保された形態素
リスト607の構成を示した図である。形態素リスト6
07には、キーボード207から入力されたクエリ及び
電子図鑑604中の説明文を形態素解析した結果、各単
語の情報がそれぞれ1つの項目として格納される。各項
目には、IDと単語とカテゴリと順位と重みがそれぞれ
1つずつ対応づけられて格納される。IDには、文の先
頭の番号を1とした、文の先頭からの単語の番号が格納
される。単語には、各単語の語幹が格納される。カテゴ
リには、各単語のカテゴリが格納される。順位には、文
の中心となる単語の順位を1とし、各単語の重要度に応
じて順位を定めた結果が格納される。重みには、各単語
の重要度に応じた重みが格納される。文中の全ての単語
に対応した重みの和をとると必ず1になる。例えば、表
T101には文「dog withvery shor
t leg」に対して、形態素解析等を行った結果を格
納した形態素リストが示されている。
【0022】表T101において、「with」に対応
した順位の値が「−1」になっているが、これは、順位
を付与する対象外の単語であることを意味している。他
の例として、表T104には、文「dog short
leg」に対して、形態素解析等を行った結果を格納
した形態素リストが示されている。表T104におい
て、順位が「1」の単語として「dog」と「shor
t」の2つが存在するが、このように1つの文中で、順
位として同じ値が出現することがある。
【0023】形態素リスト607には、クエリに対して
形態素解析等を行った結果を格納する領域と、説明文に
対して形態素解析等を行った結果を格納する領域との2
つの領域が区別されて存在する。
【0024】図11はRAM203に確保されたロール
リスト608の構成を示した図である。
【0025】ロールリスト608には、キーボード20
7から入力されたクエリ及び電子図鑑604中の説明文
に対して構文解析を行った結果、2つの単語間の各関係
がそれぞれ1つの項目として格納される。各項目には、
左単語IDとロールと右単語IDがそれぞれ1つずつ対
応づけられて格納される。左単語IDと右単語IDに
は、文中の2つの単語のそれぞれ左側の単語と右側の単
語が対応し、形態素リスト607のIDの値が使用され
る。ロールには、2つの単語の間の関係の種類、即ち、
一方の単語が果たす他方の単語へのロール(役割)が格
納される。
【0026】ロールの種類は、文法辞書606のロール
の種類と同じである。例えば、表T201には、文「d
og with very short leg」に対
して、構文解析を行った結果を格納したロールリストが
示してある。この文に対する形態素リストを表T101
に示してあるため、左単語ID「1」に相当する単語
「dog」は、右単語ID「2」に相当する単語「wi
th」に対して、ロールとして「PSubject」、
即ち、「Preposition Subject」の
関係にあることが示されている。ロールリスト608に
は、クエリに対して構文解析等を行った結果を格納する
領域と、説明文に対して構文解析等を行った結果を格納
する領域との2つの領域が区別されて存在する。
【0027】図12はRAM203に確保された検索結
果リスト609の構成を示した図である。
【0028】検索結果リスト609には、キーボード2
07から入力されたクエリに従って電子図鑑604を検
索した結果、クエリの条件を満たす各項目が格納され
る。検索結果リスト609には、1つの項目として、電
子図鑑604の見出し語と、検索の結果得られるスコア
とがそれぞれ1つずつ対応されて格納され、複数の項目
が格納される。
【0029】図13はキーボード207よりクエリを入
力し、検索を指示した後、電子図鑑604を検索した結
果がディスプレイ208に表示された画面の例を示した
図である。図中において、1301はクエリを入力する
ためのテキストボックスである。本テキストボックス1
301内にキーボード207からクエリを入力し、OK
ボタン1302をマウス209でクリックすると、13
03に、クエリの条件を満たす電子図鑑604中の見出
し語と、検索の際得られたスコアが表示される。
【0030】更に、1304には、電子図鑑604中の
見出し語に対応した画像ファイルから得られる画像が表
示され、1305には、見出し語に対応した説明文が表
示される。検索結果は、スコアの大きい順に画面左より
右に向かって表示され、1画面中に収まらないときは、
1306の次画面ボタン語をマウス209でクリックす
ることにより、他の検索結果も画面に表示することがで
きる。本図にはクエリとして「dog with sh
ort leg」を指定した場合の検索後の画面が表示
されており、「dachsfund」がスコア「1.0
0」で、「skye terrier」がスコア「1.
00」で、「shih tzu」がスコア「1.00」
でそれぞれ、検索された場合が示されている。
【0031】次に、図14により本情報検索プログラム
の動作を説明する。
【0032】先ず、CD−ROM205に格納された情
報検索プログラム501及びその関連データの電子図鑑
502、単語辞書503、文法辞書504をCD−RO
Mドライブ204からRAM203にロードし、更にR
AM203に形態素リスト607、ロールリスト60
8、検索結果リスト609の領域を確保し、その他必要
な初期化を行う(ステップS101)。
【0033】次に、オペレータがテキストボックス13
01にキーボード207を用いてクエリを入力し、マウ
ス209を用いてOKボタン1302をクリックする
(ステップS102)。
【0034】次に、ステップS102で入力されたクエ
リと一致する見出し語を電子図鑑604の中から検索
し、見つかった見出し語を検索結果リスト609の先頭
から詰めて格納する。その際、スコアの値は1.00と
しておく(ステップS103)。電子図鑑604中の各
項目は、見出し語によって昇順にソートされているた
め、本処理は同種の電子図鑑や電子辞書において一般に
行われている処理である。
【0035】次に、ステップS102で入力されたクエ
リの解析を行い、形態素リスト607及びロールリスト
608のクエリ用の領域に解析結果を格納する(ステッ
プS104)。本処理は、図15において後述する。
【0036】次に、電子図鑑604の先頭から、順次、
説明文を1つずつ取り出し(ステップS105)、取り
出すことができればステップS107へ、全ての説明文
を取り出し終えていればステップS109へ分岐する
(ステップS106)。
【0037】ステップS107では、ステップS105
で取り出した説明文の解析を行い、形態素リスト607
及びロールリスト608の説明文用の領域に解析結果を
格納する。本処理は、図15において後述する。処理を
終えれば、ステップS108へ進む。
【0038】ステップS108では、ステップS104
で得られたクエリの解析結果と、ステップS107で得
られた説明文の解析結果を比較し、クエリの条件を含む
説明文に対する見出し語を、条件を含む度合いに応じて
算出したスコアとともに、検索結果リスト609に詰め
て格納する。本処理は、図16において後述する。処理
を終えれば、ステップS105へ進む。
【0039】ステップS109では、検索結果リスト6
09に格納された見出し語とその見出し語に対応した情
報を電子図鑑604から求め、ディスプレイ208に表
示する。表示する前に、検索結果リスト609に格納さ
れている各項目をスコアの値によって降順にソートした
後、検索結果リストの先頭から、即ち、スコアの値が大
きいものから順番に図13において説明したように表示
する。ソートする際、スコアの値が同じ場合は、リスト
の先頭に出現する項目が先頭側になるように配置する。
これによって、ステップS103で検索された項目、即
ち、クエリと一致する見出し語を持つ項目が一番最初に
表示されることが保証される。
【0040】図15はステップS104のクエリ解析及
びステップS107の説明文解析の処理を説明するフロ
ーチャートである。
【0041】本処理は、形態素リスト607及びロール
リスト608に解析結果を出力するが、ステップS10
4の場合は、クエリ用の形態素リストとロールリストに
解析結果が出力され、ステップS107の場合は、説明
文用の形態素リストとロールリストに解析結果が出力さ
れる。以降の説明においては、これらの区別を明示的に
は説明していないが、実際には区別されている。
【0042】図15のフローチャートにおいて、先ず、
単語辞書605等を用いて、クエリ又は説明文の形態素
解析を行い、解析結果を形態素リスト607に格納する
(ステップS201)。本処理によって、形態素リスト
607には、図10に示されるような情報が格納され
る。但し、この段階では、形態素リスト607の中で、
ID、単語、カテゴリのフイールドのみに値が格納さ
れ、順位と重みには値は格納されていない。本処理は、
一般に行われている処理であり、特に詳細な説明は行わ
ない。
【0043】次に、形態素リスト607、文法辞書60
6等を用いて、クエリ又は説明文の構文解析を行い、解
析結果をロールリスト608に格納する(ステップ20
2)。本処理によって、ロールリスト608には、図1
1に示されるような情報が格納される。本処理は、依存
文法を用いた構文解析であり、日本語の係り受け解析等
で一般に行われているため、特に詳細な説明は行わな
い。
【0044】次に、形態素リスト607及びロールリス
ト608を用いて、形態素リスト607に格納されてい
る単語のうち、中心となる単語、即ち、中心語を決定す
る(ステップS203)。例えば、「Noun」が一番
強く、次に「verb」、「Adjective」とい
ったように、中心語としてのカテゴリの優先順位を付け
て中心語の候補を絞り込む。更に、形態素リスト607
中に、複数の中心語の候補が存在すれば、ロールリスト
608を用いて、その候補と他の単語との関係によっ
て、中心語を決定する。例えば、形態素リスト607中
に「Noun」が2つ以上存在する場合、他の単語と
「PObject」の関係にある候補は、中心語の候補
から外す等して中心語の候補を絞り込んでいく。
【0045】中心語の候補を絞り込んでいき、最終的に
複数の中心語の候補が存在する場合は、全ての候補を中
心語とする。中心語として認められた単語に対しては、
形態素リストの順位のフィールドに「1」を格納する。
【0046】次に、形態素リスト607中の中心語以外
の単語に対して、順位の値を格納する(ステップS20
4)。ロールリスト608を利用して、中心語と関係が
ある単語に対して順位の値として「2」を格納し、更
に、順位「2」の単語と関係がある単語の順位の値を
「3」とするようにして、中心語からの関係を次々とた
ぐっていくことによって、順位を付与していく。但し、
カテゴリが、「Preposition」等、特定のカ
テゴリを持つ単語は順位の付与対象外となり、順位の値
として、「−1」が格納される。
【0047】中心語からの関係を辿って順位を付与する
場合に、付与対象外の単語が出現した場合は、その単語
をスキップして順位の値が連続するようにする。中心語
から関係する単語を辿っていく場合、1つの単語が複数
の単語と関係する場合があるため、このような場合は、
その単語に関係する単語は同じ順位の値が付与されるこ
とになる。この処理によって、形態素リスト607中の
全ての単語に対する順位に対して値が付与されることに
なる。このようにして付与された順位は、中心語をルー
トとするツリー構造を構成することになる。このツリー
構造を順位ツリーと呼ぶことにする。
【0048】次に、形態素リスト607中の全ての単語
に重みを付与する(ステップS205)。重みは、中心
語に一番大きい値が付与され、順位が大きくなるに従っ
て値が小さくなるように付与する。但し、全ての重みの
値の和が必ず「1.0」になるようにする。又、順位付
与対象外の単語に対しては、重みの値として「0」を格
納する。例えば、形態素リスト607中の中心語の個数
を求める。その際、順位付与対象外の単語に対しては、
重みの値として「0」を格納しておく。
【0049】次に、「1.0」を中心語の個数で割り、
その値を各中心語から連なる順位ツリーの値とする。そ
して、各順位ツリーにおいて、順位ツリーの値に「0.
7」を掛けた値をルートの単語(即ち、中心語)の重み
の値として格納する。但し、順位ツリーが中心語のみか
ら構成される場合は、順位ツリーの値を中心語の重みと
して格納する。又、ルートの下の枝の個数によって、順
位ツリーの値からルートに付与した値を引いた値を割っ
た値を各枝(即ち、サブ順位ツリー)の順位ツリーの値
とする。そして、同様にして、各サブ順位ツリーにおい
て、順位ツリーの値に「0.7」を掛けた値をルートの
単語の重みの値として格納する。但し、順位ツリーがル
ートの単語のみから構成される場合は、順位ツリーの値
をルートの単語の重みとして格納する。
【0050】更に、ルートの下の枝の個数によって、順
位ツリーの値からルートに付与した値を引いた値を割っ
た値を各枝(即ち、サブ順位ツリー)の順位ツリーの値
とする。この処理を繰り返すことによって、全ての単語
に、前述の条件を満たす重みを付与することができる。
【0051】図16はステップS108の処理を説明す
るフローチャートである。
【0052】先ず、フローチャートには記載されていな
いが、スコアの値に初期値の「0」を格納する等、必要
な初期化処理を行う。
【0053】その後、クエリ用の形態素リスト607中
の中心語を順次1つずつ取り出し(ステップS30
1)、取り出すことができればステップS303に分岐
し、全ての中心語を取り出し終えた場合は、ステップS
313へ分岐する(ステップS302。
【0054】ステップS303では、説明文用の形態素
リスト607の中に、ステップS301で取り出した単
語(中心語)と同じ単語が存在するかどうかによって分
岐する。存在する場合はステップS304へ分岐し、存
在しない場合はステップS307へ分岐する。
【0055】ステップS304では、ステップS301
で取り出した単語(中心語)と同じ単語が、説明文用の
形態素リスト607中でも、中心語であるかどうかによ
って分岐する。中心語である場合はステップS305へ
進み、中心語でない場合はステップS306へ進む。
【0056】ステップS305では、ステップS301
で取り出した単語(中心語)に対応した重みをクエリ用
の形態素リスト607から取り出し、スコアに加える処
理である。処理を終えるとステップS307へ進む。
【0057】ステップS306では、ステップS301
で取り出した単語(中心語)に対応した重みをクエリ用
の形態素リスト607から取り出し、その値を2分の1
にした値をスコアに加える処理である。処理を終えると
ステップS307へ進む。
【0058】ステップS307は、クエリ用のロールリ
スト608を利用し、ステップS301で取り出した単
語(中心語)を順次辿って中心語から連なっている単語
を1つずつ取り出す処理である(ステップS307)。
取り出すことができればステップS309へ分岐し、中
心語から連なる単語を全て取り出し終えると、ステップ
S301へ分岐する(ステップS308)。
【0059】ステップS309では、ステップS307
で取り出した単語と同じ単語が説明文用の形態素リスト
607に存在するかどうかによって分岐する処理であ
る。存在すればステップS310へ進み、存在しなけれ
ばステップS307へ進む。
【0060】ステップS310では、ステップS307
で取り出した単語と中心語側への単語との関係が説明文
でも一致しているかどうかによって分岐する処理であ
る。先ず、ステップS307で取り出した単語(以降、
後単語と呼ぶ)と、それより順位の値が1だけ小さい単
語(以降、前単語と呼ぶ)との間のロールをクエリ用の
ロールリストから求める。説明文用の形態素リスト中
に、前単語と同じ単語が存在し、且つ、説明文用のロー
ルリスト中に前単語と同じ単語と後単語と同じ単語に対
応したロールが先程求めたクエリのロールと一致する場
合にのみ、単語の関係が説明文でも一致していると見な
す。一致している場合はステップS311へ進み、一致
していない場合はステップS312へ進む。
【0061】ステップS311は、ステップS307で
取り出した単語に対応した重みをクエリ用の形態素リス
ト607から取り出し、スコアに加える処理である。処
理を終えるとステップS307へ進む。
【0062】ステップS312では、ステップS307
で取り出した単語に対応した重みを、クエリ用の形態素
リスト607から取り出し、その値を2分の1にした値
をスコアに加える処理である。処理を終えるとステップ
S307へ進む。
【0063】ステップS313は、スコアの値によって
分岐する処理である。スコアの値が0であれば本処理を
終了し、スコアの値が0より大きければステップS31
4へ分岐する。
【0064】ステップS314は、検索された結果を検
索結果リスト609へ格納する処理である。対象となっ
ている説明文に対応した見出し語とスコアの値を対応さ
せて検索結果リスト609へ詰めて格納する。処理を終
えると、本処理を終了する。
【0065】以上説明した動作を実際の情報検索の例に
ついてより詳しく説明する。
【0066】クエリとして、「dachshund」が
指定された場合(ステップS102)、図7に示すよう
に、電子図鑑604に見出し語として「dachshu
nd」が格納されているため、検索結果リスト609の
先頭に、見出し語「dachshund」とスコア
「1.0」を対応させた項目が格納される(ステップS
103)。スコアの最大値は「1.0」であり、ステッ
プS109では、スコアの値が大きいものから順番に表
示し、スコアの値が同じ場合はリストの先頭に出現する
項目が最初に表示されるため、ステップS103で検索
された「dachshund」が検索結果として一番最
初にディスプレイ208に表示される(ステップS10
9)。
【0067】次に、クエリとして、「dog with
short legs」が指定された場合の例につい
て説明する。
【0068】ステップS201においてクエリに対する
形態素解析が行われると、図8に示されるように、各単
語のカテゴリが対応づけられているため、クエリ用の形
態素リスト607には図10の表T102に示されるよ
うな情報が格納される。但し、この時点では、順位と重
みには値は格納されていない。
【0069】続いて、ステップS202においてクエリ
に対する構文解析が行われると、図9に示すように、各
カテゴリ間の関係が記載されているため、クエリ用のロ
ールリスト608には図11の表T202に示されるよ
うな情報が格納される。
【0070】続いて、ステップS203において中心語
が決定される。表T102から分かるように、カテゴリ
「Noun」の単語として「dog」と「leg」が存
在するため、この2つの単語に中心語が絞り込まれる。
更に、表T202から分かるように、「leg」は、ロ
ール「PObject」を持つため、中心語の対象から
外され、最終的に「dog」がクエリの中心語であると
決定され、表T102に示すように、クエリ用の形態素
リストの「dog」に対応した順位として「1」が格納
される。
【0071】続いて、ステップS204において、クエ
リ用のロールリストである表T202を利用してクエリ
用の形態素リストの「dog」以外の単語に対して順位
の値が格納される。表T202によると、「dog」に
対応した左単語ID「1」に対して右単語ID「2」が
対応している。
【0072】しかし、単語ID「2」の単語「wit
h」は、表T102によれば、カテゴリが「Prepo
sition」であるため、順位付与対象外の単語とな
り、順位には「−1」が格納される。
【0073】更に、「with」に対応した左単語ID
「2」に対して、右単語ID「4」が対応している。単
語ID「4」の単語「1eg」は、順位付与対象外の単
語でなく、中心語の「dog」から辿って最初の順位付
与の対象となる単語であるため、順位として「2」が格
納される。又、「leg」に対応した右単語ID「4」
に対して、左単語ID「3」が対応している。単語ID
「3」の単語「short」は、順位付与対象外の単語
でなく、中心語の「dog」から辿って「dog」を含
めて3番目の順位付与の対象となる単語であるため、順
位として「3」が格納される。以上によって、クエリ用
の形態素リストに表T102に示されるように順位が格
納される。
【0074】続いて、ステップS205において、クエ
リ用の形態素リストの各単語に対して重みの値が格納さ
れる。先ず、順位付与対象外の単語に対して重みの値と
して「0」を格納しながら、中心語の個数を求める。表
T102によれば、順位の値として「1」を持つのは
「dog」の1個だけであることが分かる。又、順位の
値として「−1」を持つ「with」に対する重みの値
として「0」が格納される。中心語の個数が1個である
ため、順位ツリーの値は「1.0」を「1」で割った
「1.0」になる。次に、中心語の「dog」を取り出
し、順位ツリーの値「1.0」に「0.7」を掛けた値
「0.7」を「dog」に対応する重みに格納する。そ
して、中心語「dog」に続く順位の「2」を持つ単語
は「leg」のみであるため、「1.0」から「0.
7」を引いた値「0.3」を「1」で割った値「0.
3」が「1eg」をルートとするサブ順位ツリーの値と
なる。そして、順位ツリーの値「0.3」に「0.7」
を掛けた値「0.21」が、サブ順位ツリーのルートで
ある「leg」に対応した重みとして格納される。そし
て、「leg」続く順位の「3」を持つ単語は「sho
rt」のみであるため、「0.3」から「0.21」を
引いて「1」で割った値「0.09」が「short」
をルートとするサブ順位ツリーの値となる。「shor
t」をルートとするサブ順位ツリーには、「shor
t」しか残っていないため、順位ツリーの値「0.0
9」がそのまま「short」に対応した重みとして格
納される。このようにして、表T102に示すように、
クエリ用の形態素リストの重みに値が格納される。
【0075】続いて、ステップS105において、説明
文「dog with veryshort leg
s」が取り出された場合について説明する。
【0076】ステップS107において、説明文用の形
態素リスト607とロールリスト608に解析結果が格
納される。解析は、前述のクエリの解析と同様にして行
われ、形態素リストは表T101に、ロールリストは表
T201にそれぞれ示される状態になる。
【0077】続いて、ステップS301において、クエ
リの中心語「dog」が取り出される。説明文の形態素
リストである表T101に「dog」が中心語とし格納
されているため、ステップS305において、スコアの
初期値「0」にクエリの「dog」に対応した重みの値
が加算され、スコアの値は「0.7」になる。
【0078】続いて、ステップS307において、クエ
リの中心語「dog」に関係のある単語を取り出す。表
T202によれば、「dog」と関係する単語は「wi
th」だけであるため、「with」を取り出す。説明
文の形態素リストには「with」が存在し、クエリと
説明文の両方において「dog」と「with」の間の
関係であるロールの値が「PSubject」であるた
め、関係も一致したことになり、ステップS311にお
いて、スコアの値「0.7」にクエリの「with」に
対応した重みの値「0」が加算され、スコアの値は
「0.7」になる。
【0079】続いて、ステップS307において、クエ
リの「with」に関係のある単語を取り出す。表T2
02によれば、既に取り出された単語以外で「wit
h」と関係する単語は「leg」だけであるため、「l
eg」を取り出す。説明文の形態素リストには「sho
rt」が存在し、クエリと説明文の両方において、「w
ith」と「leg」の間の関係であるロールの値が
「PObject」であるため、関係も一致したことに
なり、ステップ311において、スコアの値「0.7」
にクエリの「leg」に対応した重みの値「0.21」
が加算され、スコアの値は「0.91」になる。
【0080】続いて、ステップ307において、クエリ
の「leg」に関係のある単語を取り出す。表T202
によれば、既に取り出された単語以外で「leg」と関
係する単語は「short」だけであるため、「sho
rt」を取り出す。説明文の両方において、「leg」
と「short」の間の関係であるロールの値が「Mo
difier」であるため、関係も一致したことにな
り、ステップ311において、スコアの値「0.91」
にクエリの「short」に対応した重みの値「0.0
9」が加算され、スコアの値は、「1.00」になる。
【0081】続いて、中心語も含めてクエリの全ての単
語を取り出し終え、スコアの値も「0」よりも大きいた
め、検索結果リスト609に、説明文「dog wit
hvery short legs」に対応した見出し
語がスコアの値「1.00」と共に格納される。スコア
の値が「1.0」であるということは、クエリの条件を
完全に満たしていることを意味している。
【0082】続いて、ステップS105において、説明
文「short dog withlong leg
s」が取り出された場合について説明する。
【0083】ステップS107において、説明文用の形
態素リスト607とロールリスト608に解析結果が格
納される。解析は、前述のクエリの解析と同様にして行
われ、形態素リストは表T105に、ロールリストは表
T205にそれぞれ示される状態になる。
【0084】続いて、ステップS301において、クエ
リの中心語「dog」が取り出される。説明文の形態素
リストである表T105に「dog」が中心語として格
納されているため、ステップS305において、スコア
の初期値「0」にクエリの「dog」に対応した重みの
値が加算され、スコアの値は「0.7」になる。
【0085】続いて、ステップS307において、クエ
リの中心語「dog」に関係のある単語を取り出す。表
T202によれば、「dog」と関係する単語は、「w
ith」だけであるため、「with」を取り出す。説
明文の形態素リストには「with」が存在し、クエリ
と説明文の両方において、「dog」と「with」の
間の関係であるロールの値が「PSubject」であ
るため、関係も一致したことになり、ステップS311
において、スコアの値「0.7」にクエリの「wit
h」に対応した重みの値「0」が加算され、スコアの値
は、「0.7」になる。
【0086】続いて、ステップS307において、クエ
リの「with」に関係のある単語を取り出す。表T2
02によれば、既に取り出された単語以外で「wit
h」と関係する単語は「leg」だけであるため、「l
eg」を取り出す。説明文の形態素リストには「le
g」が存在し、クエリと説明文の両方において、「wi
th」と「leg」の間の関係であるロールの値が「P
Object」であるため、関係も一致したことにな
り、ステップS311において、スコアの値「0.7」
にクエリの「1値「0.21」が加算され、スコアの値
は「0.91」になる。
【0087】続いて、ステップS307において、クエ
リの「leg」に関係のある単語を取り出す。表T20
2によれば、既に取り出された単語以外で「1eg」と
関係する単語は「short」だけであるため、「sh
ort」を取り出す。説明文の形態素リストには「sh
ort」が存在するが、表T205によれば、説明文で
は「leg」と「short」の間に関係が存在しない
ため、ステップS312において、スコアの値「0.9
1」にクエリの「short」に対応した重みの値
「0.09」を2分の1した値「0.045」が加算さ
れ、スコアの値は、「0.955」になる。続いて、中
心語も含めて、クエリの全ての単語を取り出し終え、ス
コアの値も「0」よりも大きいため、検索結果リスト6
09に説明文「short dogwith long
legs」に対応した見出し語がスコアの値「0.9
55」と共に格納される。
【0088】続いて、同様に様々な説明文に対して検索
を行った後、ステップS109において、検索結果がデ
ィスプレイに表示されることになるが、その中には説明
文「dog with very short leg
gs」に対応した電子図鑑604の項目がスコアの値
「1.00」として表示され、それ以降に、説明文「s
hort dog with long legs」に
対応した電子図鑑604の項目がスコアの値「0.95
5」と共に表示される。
【0089】「dog with short leg
s」というクエリに対して、「dog with ve
ry short legs」という説明文のスコアは
「1.0」になり、「dog with long l
egs」という説明文のスコアは「0.955」になる
ため、前者の説明文の方がクエリとの一致度が高いこと
が分かる。
【0090】次に、クエリとして「dog with
thick legs」が指定された場合の例について
説明する。
【0091】ステップS104においてクエリに対する
解析が行われ、クエリ用の形態素リストの状態は、表T
103に示される状態になり、クエリ用のロールリスト
の状態は表T203に示される状態になる。
【0092】続いて、ステツプ105において、説明文
「dog with very short leg
s」が取り出された場合について説明する。
【0093】ステップ107において、説明文の形態素
リスト607とロールリスト608に解析結果が格納さ
れる。解析は、前述のクエリの解析と同様にして行わ
れ、形態素リストは表T101に、ロールリストは表T
201にそれぞれ示される状態になる。
【0094】続いて、ステップS301において、クエ
リの中心語「dog」が取り出される。説明文の形態素
リストである表T101に「dog」が中心語として格
納されているため、ステップS305において、スコア
の初期値「0」にクエリの「dog」に対応した重みの
値が加算され、スコアの値は「0.7」になる。
【0095】続いて、ステップS307において、クエ
リの中心語「dog」に関係のある単語を取り出す。表
T203によれば、「dog」と関係する単語は「wi
th」だけであるため、「with」を取り出す。説明
文の形態素リストには「with」が存在し、クエリと
説明文の両方において、「dog」と「with」の間
の関係であるロールの値が「PSubject」である
ため、関係も一致したことになり、ステップ311にお
いて、スコアの値「0.7」にクエリの「with」に
対応した重みの値「0」が加算され、スコアの値は、
「0.7」になる。
【0096】続いて、ステップS307において、クエ
リの「with」に関係のある単語を取り出す。表T2
03によれば、既に取り出された単語以外で「wit
h」と関係する単語は「leg」だけであるため、「l
eg」を取り出す。説明文の形態素リストには「le
g」が存在し、クエリと説明文の両方において、「wi
th」と「leg」の間の関係であるロールの値が「P
Object」であるため、関係も一致したことにな
り、ステップS311において、スコアの値「0.7」
にクエリの「leg」に対応した重みの値「0.21」
が加算され、スコアの値は「0.91」になる。
【0097】続いて、ステップS307において、クエ
リの「leg」に関係のある単語を取り出す。表T20
3によれば、既に取り出された単語以外で「1eg」と
関係する単語は、「thick」だけであるため、「t
hick」を取り出す。説明文の形態素リストには「t
hick」は存在しないため、ステップS312におい
て、スコアの値「0.91」にクエリの「thick」
に対応した重みの値「0.09」を2分の1した値
「0.045」が加算され、スコアの値は、「0.95
5」になる。
【0098】続いて、中心語も含めて、クエリの全ての
単語を取り出し終え、スコアの値も「0」よりも大きい
ため、検索結果リスト609に説明文「dog wit
hvery short legs」に対応した見出し
語がスコアの値「0.955」と共に格納される。
【0099】続いて、同様に様々な説明文に対して検索
を行った後、ステップS109において検索結果がデイ
スプレイに表示されることになるが、その中には、説明
文「dog with very short leg
s」に対応した電子図鑑604の項目がスコアの値
「0.955」として表示されるこのように、クエリの
条件と部分一致する説明文において、重要度の低い条件
のみが一致していない場合は、一致度が高いことが分か
る。
【0100】次に、クエリとして「dog short
legs」が指定された場合の例について説明する。
【0101】この例は、文法的に正しくないクエリが入
力された場合、或は文法的に正しいクエリが入力されて
も、構文解析で使用する文法ルールに不備があり、正し
く解析できない場合を説明するための例である。
【0102】ステップS201においてクエリに対する
形態素解析が行われると、クエリ用の形態素リスト60
7には図10の表T104に示されるような情報が格納
される。但し、この時点では、順位と重みには、値は格
納されていない。
【0103】続いて、ステップS202においてクエリ
に対する構文解析が行われる。
【0104】ここで、文法辞書606に左カテゴリNo
unと右カテゴリAdjectiveに対する文法ルー
ルが記述されておらず、又、左カテゴリNounと右カ
テゴリNounに対する文法ルールが記述されていない
ものとする。すると、クエリ用のロールリスト608に
は図11の表T204に示されるような情報が格納され
る。表T204に示されるように、文法的に正しくない
クエリを解析した場合、或は文法的に正しいクエリが入
力されても、構文解析で使用する文法ルールに不備があ
り、正しく解析できない場合、構文解析の結果として、
1文中の単語と単語の間の関係の連鎖が途切れることに
なる。例えば、表204によれば、「dog」は、クエ
リ中の他の単語との関係がなく、連鎖が途切れている。
【0105】続いて、ステップS203において、中心
語が決定される。表T104から分かるように、カテゴ
リ「Noun」の単語として「dog」と「leg」が
存在するため、この2つの単語に中心語が絞り込まれ
る。
【0106】しかし、「dog」はロールを持たない
し、「leg」はロールとして「Modifier」を
持つだけであるため、これ以上の中心語の絞り込みはで
きず、最終的に「dog」と「leg」がクエリの中心
語であると決定され、表T104に示すように、クエリ
用の形態素リストの「dog」と「leg」に対応した
順位として「1」が格納される。
【0107】絞いて、ステップS204において、クエ
リ用のロールリストである表T204を利用してクエリ
用の形態素リストの「dog」と「leg」以外の単語
に対して順位の値が格納される。表T204によると、
「leg」に対応した右単語ID「3」に対して左単語
ID「2」が対応している。単語ID「2」の単語「s
hort」は、順位付与対象外の単語でなく、中心語の
「leg」から辿って「leg」を含めて2番目の順位
付与の対象となる単語であるため、順位として「2」が
格納される。以上によって、クエリ用の形態素リストに
表T104に示されるように、順位が格納される。
【0108】続いて、ステップS205において、クエ
リ用の形態素リストの各単語に対して重みの値が格納さ
れる。先ず、順位付与対象外の単語に対して重みの値と
して「0」を格納しながら、中心語の個数を求める。表
T104によれば、順位の値として「1」を持つのは、
「dog」と「leg」の2個であることが分かる。中
心語の個数が2個であるため、各順位ツリーの値は
「1.0」を「2」で割った「0.5」になる。次に最
初の中心語の「dog」を取り出す。中心語「dog」
の順位ツリーには「dog」しか存在しないため、順位
ツリーの値「0.5」がそのまま「dog」に対応した
重みとして格納される。
【0109】続いて、次の中心語の「leg」を取り出
し、順位ツリーの値「0.5」に「0.7」を掛けた値
「0.35」を「leg」に対応する重みに格納する。
そして、中心語「leg」続く順位の「2」を持つ単語
は「short」のみであるため、「0.5」から
「0.35」を引いて「1」で割った値「0.15」が
「short」をルートとするサブ順位ツリーの値とな
る。「short」をルートとするサブ順位ツリーには
「short」しか残っていないため、順位ツリーの値
「0.15」がそのまま「short」に対応した重み
として格納される。このようにして、表T104に示さ
れるように、クエリ用の形態素リストの重みに値が格納
される。
【0110】以上示したように、文法的に正しくないク
エリを解析した場合、或は文法的に正しいクエリが入力
されても、構文解析で使用する文法ルールに不備があ
り、正しく解析できない場合に、単語間の関係が一繋が
りの連鎖にならなくなっても、即ち、関係木が1つの木
として構成できず、複数の関係木に分かれたとしても、
各関係木に対して中心語を決定し、各単語の順位と重み
を付与することができる。又、説明文に対しても、同様
に、文法的に正しくない場合や文法ルールに不備場ある
場合でも、各単語の順位と重みを付与することができ
る。
【0111】続いて、ステップS105において説明文
「dog with very short leg
s」が取り出された場合について説明する。
【0112】ステップS107において、説明文用の形
態素リスト607とロールリスト608に、解析結果が
格納される。解析は、前述のクエリの解析と同様にして
行われ、形態素リストは表T101に、ロールリストは
表T201にそれぞれ示される状態になる。
【0113】続いて、ステップS301において、クエ
リの最初の中心語「dog」が取り出される。説明文の
形態素リストである表T101に「dog」が中心語と
して格納されているため、ステップS305において、
スコアの初期値「0」にクエリの「dog」に対応した
重みの値が加算され、スコアの値は「0.5」になる。
【0114】続いて、ステップS307において、クエ
リの中心語「dog」に関係のある単語を取り出す。表
T204によれば、「dog」と関係する単語は存在し
ないため、ステップS308において分岐し、ステップ
S301へ進む。
【0115】続いて、ステップS301において、クエ
リの次の中心語「leg」が取り出される。説明文の形
態素リストである表T101には「leg」は中心語と
しては格納されていないため、ステップS306におい
て、スコアの初期値「0」にクエリの「leg」に対応
した重みを2分の1した値「0.175」が加算され、
スコアの値は「0.675」になる。
【0116】続いて、ステップS307において、クエ
リの「leg」に関係のある単語を取り出す。表T20
4によれば、既に取り出された単語以外で「leg」と
関係する単語は「short」だけであるため、「sh
ort」を取り出す。説明文の形態素リスト表T101
には「short」は存在し、説明文のロールリスト表
201に「short」のロールとして「Modifi
er」とあり、クエリの「short」のロールと一致
するため、ステップS311において、スコアの値
「0.675」にクエリの「short」に対応した重
みの値「0.15」が加算され、スコアの値は、「0.
825」になる。
【0117】続いて、中心語も含めて、クエリの全ての
単語を取り出し終え、スコアの値も「0」よりも大きい
ため、検索結果リスト609に、説明文「dog wi
thvery short legs」に対応した見出
し語がスコアの値「0.825」と共に格納される。
【0118】続いて、同様に様々な説明文に対して検索
を行った後、ステップS109において、検索結果がデ
イスプレイに表示されることになるが、その中には、説
明文「dog with very short le
gs」に対応した電子図鑑604の項目がスコアの値
「0.825」として表示される。
【0119】このように文法的に正しくないクエリを解
析した場合、或は文法的に正しいクエリが入力されて
も、構文解析で使用する文法ルールに不備があり、正し
く解析できない場合に単語間の関係が一繋がりの連鎖に
ならなくなっても、即ち、関係木が1つの木として構成
できず、複数の関係木に分かれたとしても、クエリの関
係木の条件を各関係木の論理積と見なして比較するた
め、説明文との一致度を求めることができることが分か
る。又、説明文に対しても、同様に、文法的に正しくな
い場合や文法ルールに不備場ある場合でも、クエリとの
一致度を求めることができる。
【0120】ところで、本実施の形態では、外部記憶装
置としてCD−ROMから情報検索プログラム及び関連
データを直接RAM203にロードして実行させる例を
示したが、この他に、CD−ROMから情報検索プログ
ラム及び関連データを一旦HD206に格納(インスト
ール)しておき、本情報検索プログラムを動作させる時
点でHD206からRAM203にロードするようにし
ても良い。又、本情報検索プログラムを記録する媒体
は、CD−ROM以外にFD(フロッピー(登録商標)
ディスク)、ICメモリカード等であっても良い。
【0121】更に、本情報検索プログラムをROMに記
録しておき、これをメモリマップの一部となるように構
成し、直接CPUで実行することも可能である。
【0122】又、以上の説明において、クエリ及び説明
文として使用する言語として英語を使用した例を示した
が、本発明は英語のみに適用可能ではなく、日本語を含
めたあらゆる言語に適用可能である。
【0123】又、以上の実施の形態では、電子図鑑を例
に示したが、本発明は電子図鑑だけでなく、国語辞書、
英和辞書、和英辞書、百科事典等、見出し語に対して説
明文が付与されているデータを電子化して格納したもの
であるならば、何にでも適用可能である。
【0124】又、前記実施の形態では、電子図鑑のマル
チメデイア情報として画像が格納されている例を示した
が、画像以外にも映像や音声等を格納しておき、メデイ
アに応じて必要な出力装置を使用して出力するようにし
ても良い。
【0125】又、前記実施の形態では、検索結果として
出力する電子図鑑の項目としてスコアの値が0よりも大
きい説明文に対する項目を出力していたが、この閾値を
オペレータが自由に設定できるようにし、オペレータが
設定した閾値よりも大きいスコアの値を持つ説明文に対
応した見出し語のみを検索結果リストに出力するように
しても良い。
【0126】更に、前記実施の形態では、電子図鑑には
説明文のみが格納された例を示したが、説明文を予め構
文解析した結果を説明文と対応させて格納しておき、ス
テップS107で説明文の解析を行う代わりに、電子図
鑑に格納されている説明文の構文解析結果を取り出すよ
うにしても良い。
【0127】又、前記実施の形態では、ステップS30
3において、説明文に中心語が含まれない場合、ステッ
プS307へ進んで中心語以外の単語に対してもマッチ
ングを行っていたが、この場合にステップS307へ進
む代わりに、ステップS301へ進んで、その中心語を
ルートとする順位ツリーに存在する単語のマッチングは
行わないようにしても良い。そして、この場合、ステッ
プS307へ進む代わりに、ステップS313へ進むよ
うにしても良い。前者の場合は、クエリの中心語が1つ
でも説明文に存在すれば、スコアの値は0より大きくな
り、検索結果リストに出力されるが、後者の場合は、ク
エリの中心語が説明文中に1つでも存在しなければ、検
索結果リストに出力されない。
【0128】その他、前記実施の形態では、ステップS
103において、電子図鑑の見出し語を検索対象とし、
検索条件と見出し語が完全に一致する場合のみ、スコア
の値を1.0として検索結果リストに出力していたが、
その代わりに、ステップS104〜ステップS108ま
でに示される説明文とクエリとのマッチングのように、
クエリと見出し語の両方の解析を行った後、ステップS
108で行うマッチングと同様のマッチングを行った結
果を検索結果リストに出力しても良い。
【0129】
【発明の効果】以上の説明で明らかなように、本発明に
係る情報検索方法、情報検索装置及び記録媒体によれ
ば、自然な言葉によって検索条件を表現できるため、検
索条件の作成を容易に行うことができるという効果が得
られる。
【0130】又、検索条件の単語を含み、各単語間の関
係も全て一致する説明文又は検索条件の単語の一部を含
み、各単語間の関係も一致する説明文に対応した情報記
憶部の見出し語を検索結果として出力するため、検索の
精度を飛躍的に向上させることができるという効果が得
られる。
【図面の簡単な説明】
【図1】本発明に係る情報検索装置を示す概念図であ
る。
【図2】本発明に係る情報検索装置を示すシステム構成
図である。
【図3】プログラム等が媒体からコンピュータシステム
に供給されることを示す図である。
【図4】ROMの構成図である。
【図5】情報検索プログラム等が記録されている媒体の
構成図である。
【図6】処理プログラム実行時におけるRAM上のメモ
リマップの構造を示す説明図である。
【図7】メモリマップ上の電子図鑑の構成図である。
【図8】メモリマップ上の単語辞書の構成図である。
【図9】メモリマップ上の文法辞書の構成図である。
【図10】メモリマップ上の形態素リストの構成図であ
る。
【図11】メモリマップ上のロールリストの構成図であ
る。
【図12】メモリマップ上の検索結果リストの構成図で
ある。
【図13】本発明を実施した場合の表示画面の例を示す
図である。
【図14】本発明に係る情報検索方法のフローチャート
である。
【図15】言語解析方法のフローチャートである。
【図16】マッチング方法のフローチャートである。
【符号の説明】
101 入力部 102 制御部 103 検索条件解析部 104 説明文解析部 105 説明文検索部 106 記憶部 107 情報記憶部 108 表示部 201 CPU(中央制御装置) 202 ROM(読み出し専用メモリ) 203 RAM(随時読み出し書き込みメモリ) 204 CD−ROMドライブ 205 CD−ROM 206 HD(ハードディスク)ドライブ 207 キーボード 208 ディスプレイ 209 マウス 210 プリンタ 211 制御バス

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 見出し語に対して見出し語を自然な言葉
    で説明する説明文を対応させて格納した情報記憶部と、
    検索条件を入力する検索条件入力工程と、前記情報記憶
    部を検索し、前記検索条件入力工程において入力された
    検索条件を満たす見出し語を求める情報検索方法におい
    て、 前記検索条件入力工程においては、自然な言葉で表現さ
    れる検索条件を入力し、前記検索条件入力工程によって
    入力された検索条件を解析し、検索条件を構成する単語
    と各単語間の関係を求める検索条件解析工程と、前記情
    報記憶部に格納されている説明文を解析し、説明文を構
    成する単語と各単語間の関係を求める説明文解析工程
    と、該検索条件解析工程によって得られた単語及び単語
    間の関係と、前記説明文解析工程によって得られた単語
    及び単語間の関係を比較し、検索条件の単語を含み、各
    単語間の関係も全て一致する説明文又は検索条件の単語
    の一部を含み、各単語間の関係も一致する説明文に対応
    した前記情報記憶部の見出し語を検索結果として出力す
    る説明文検索工程を有することを特徴とする情報検索方
    法。
  2. 【請求項2】 前記情報記憶部には、見出し語に対し
    て、見出し語と関係がある画像や映像等のマルチメディ
    ア情報を対応させて格納し、前記説明文検索工程は、検
    索結果どして前記情報記憶部の見出し語とマルチメディ
    ア情報を対応させて出力することを特徴とする請求項1
    記載の情報検索方法。
  3. 【請求項3】 見出し語に対して見出し語を自然な言葉
    で説明する説明文を対応させて格納した情報記憶部と、
    検索条件を入力する検索条件入力工程と、前記情報記憶
    部を検索し、前記検索条件入力工程において入力された
    検索条件を満たす見出し語を求める情報検索方法におい
    て、 前記情報記憶部には、見出し語と対応させて、予め説明
    文を解析して求めた説明文を構成する単語と各単語間の
    関係を説明文解析結果として格納しておき、前記検索条
    件入力工程においては、自然な言葉で表現される検索条
    件を入力し、前記検索条件入力工程によって入力された
    検索条件を解析し、検索条件を構成する単語と各単語間
    の関係を求める検索条件解析工程と、該検索条件解析工
    程によって得られた単語及び単語間の関係と、前記情報
    記憶部の説明文解析結果として格納されている単語及び
    単語間の関係を比較し、検索条件の単語を含み、各単語
    間の関係も全て一致する説明文解析結果又は検索条件の
    単語の一部を含み、各単語間の関係も一致する説明文解
    析結果に対応した前記情報記憶部の見出し語を検索結果
    として出力する説明文検索工程を有することを特徴とす
    る情報検索方法。
  4. 【請求項4】 前記情報記憶部には、見出し語に対し
    て、見出し語と関係がある画像や映像等のマルチメディ
    ア情報を対応させて格納し、前記説明文検索工程は、検
    索結果として前記情報記憶部の見出し語とマルチメディ
    ア情報を対応させて出力することを特徴とする請求項3
    記載の情報検索方法。
  5. 【請求項5】 見出し語に対して見出し語を自然な言葉
    で説明する説明文を対応させて格納した情報記憶部と、
    検索条件を入力する検索条件入力手段と、前記情報記憶
    部を検索し、前記検索条件入力手段において入力された
    検索条件を満たす見出し語を求める情報検索装置におい
    て、 前記検索条件入力手段においては、自然な言葉で表現さ
    れる検索条件を入力し、前記検索条件入力手段によって
    入力された検索条件を解析し、検索条件を構成する単語
    と各単語間の関係を求める検索条件解析手段と、前記情
    報記憶部に格納されている説明文を解析し、説明文を構
    成する単語と各単語間の関係を求める説明文解析手段
    と、該検索条件解析手段によって得られた単語及び単語
    間の関係と、前記説明文解析手段によって得られた単語
    及び単語間の関係を比較し、検索条件の単語を含み、各
    単語間の関係も全て一致する説明文又は検索条件の単語
    の一部を含み、各単語間の関係も一致する説明文に対応
    した前記情報記憶部の見出し語を検索結果として出力す
    る説明文検索手段を有することを特徴とする情報検索装
    置。
  6. 【請求項6】 前記情報記憶部には、見出し語に対し
    て、見出し語と関係がある画像や映像等のマルチメディ
    ア情報を対応させて格納し、前記説明文検索手段は、検
    索結果として前記情報記憶部の見出し語とマルチメディ
    ア情報を対応させて出力することを特徴とする請求項5
    記載の情報検索装置。
  7. 【請求項7】 見出し語に対して見出し語を自然な言葉
    で説明する説明文を対応させて格納した情報記憶部と、
    検索条件を入力する検索条件入力手段と、前記情報記憶
    部を検索し、前記検索条件入力手段において入力された
    検索条件を満たす見出し語を求める情報検索装置におい
    て、 前記情報記憶部には、見出し語と対応させて、予め説明
    文を解析して求めた説明文を構成する単語と各単語間の
    関係を説明文解析結果として格納しておき、前記検索条
    件入力手段においては、自然な言葉で表現される検索条
    件を入力し、前記検索条件入力手段によって入力された
    検索条件を解析し、検索条件を構成する単語と各単語間
    の関係を求める検索条件解析手段と、該検索条件解析手
    段によって得られた単語及び単語間の関係と、前記情報
    記憶部の説明文解析結果として格納されている単語及び
    単語間の関係を比較し、検索条件の単語を含み、各単語
    間の関係も全て一致する説明文解析結果又は検索条件の
    単語の一部を含み、各単語間の関係も一致する説明文解
    析結果に対応した前記情報記憶部の見出し語を検索結果
    として出力する説明文検索手段を有することを特徴とす
    る情報検索装置。
  8. 【請求項8】 前記情報記憶部には、見出し語に対し
    て、見出し語と関係がある画像や映像等のマルチメディ
    ア情報を対応させて格納し、前記説明文検索手段は、検
    索結果として前記情報記憶部の見出し語とマルチメディ
    ア情報を対応させて出力することを特徴とする請求項7
    記載の情報検索装置。
  9. 【請求項9】 見出し語に対して見出し語を自然な言葉
    で説明する説明文を対応させて格納した情報記憶部と、
    検索条件を入力する検索条件入力工程と、前記情報記憶
    部を検索し、前記検索条件入力工程において入力された
    検索条件を満たす見出し語を求める情報検索プログラム
    を記録した記憶媒体において、 前記検索条件入力工程においては、自然な言葉で表現さ
    れる検索条件を入力し、前記検索条件入力工程によって
    入力された検索条件を解析し、検索条件を構成する単語
    と各単語間の関係を求める検索条件解析工程と、前記情
    報記憶部に格納されている説明文を解析し、説明文を構
    成する単語と各単語間の関係を求める説明文解析工程
    と、該検索条件解析工程によって得られた単語及び単語
    間の関係と、前記説明文解析工程によって得られた単語
    及び単語間の関係を比較し、検索条件の単語を含み、各
    単語間の関係も全て一致する説明文又は検索条件の単語
    の一部を含み、各単語間の関係も一致する説明文に対応
    した前記情報記憶部の見出し語を検索結果として出力す
    る説明文検索工程を有する情報検索方法をコンピュータ
    に実行させるプログラムを記録して成ることを特徴とす
    るコンピュータ読み取り可能な記憶媒体。
  10. 【請求項10】 前記情報記憶部には、見出し語に対し
    て、見出し語と関係がある画像や映像等のマルチメディ
    ア情報を対応させて格納し、前記説明文検索工程は、検
    索結果として前記情報記憶部の見出し語とマルチメディ
    ア情報を対応させて出力することを特徴とする情報検索
    方法をコンピュータに実行させるプログラムを記録した
    ことを特徴とする請求項9記載の記憶媒体。
  11. 【請求項11】 見出し語に対して見出し語を自然な言
    葉で説明する説明文を対応させて格納した情報記憶部
    と、検索条件を入力する検索条件入力工程と、前記情報
    記憶部を検索し、前記検索条件入力工程において入力さ
    れた検索条件を満たす見出し語を求める情報検索プログ
    ラムを記録した記憶媒体において、 前記情報記憶部には、見出し語と対応させて、予め説明
    文を解析して求めた説明文を構成する単語と各単語間の
    関係を説明文解析結果として格納しておき、前記検索条
    件入力工程においては、自然な言葉で表現される検索条
    件を入力し、前記検索条件入力工程によって入力された
    検索条件を解析し、検索条件を構成する単語と各単語間
    の関係を求める検索条件解析工程と、前記検索条件解析
    工程によって得られた単語及び単語間の関係と、前記情
    報記憶部の説明文解析結果として格納されている単語及
    び単語間の関係を比較し、検索条件の単語を含み、各単
    語間の関係も全て一致する説明文解析結果又は検索条件
    の単語の一部を含み、各単語間の関係も一致する説明文
    解析結果に対応した前記情報記憶部の見出し語を検索結
    果として出力する説明文検索工程を有する情報検索方法
    をコンピュータに実行させるプログラムを記録して成る
    ことを特徴とするコンピュータ読み取り可能な記憶媒
    体。
  12. 【請求項12】 前記情報記憶部には、見出し語に対し
    て、見出し語と関係がある画像や映像等のマルチメディ
    ア情報を対応させて格納し、前記説明文検索工程は、検
    索結果として前記情報記憶部の見出し語とマルチメディ
    ア情報を対応させて出力することを特徴とする情報検索
    方法をコンピュータに実行させるプログラムを記録した
    ことを特徴とする請求項11記載の記憶媒体。
JP2001395807A 2001-12-27 2001-12-27 情報検索方法、情報検索装置及び記録媒体 Pending JP2003196308A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001395807A JP2003196308A (ja) 2001-12-27 2001-12-27 情報検索方法、情報検索装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001395807A JP2003196308A (ja) 2001-12-27 2001-12-27 情報検索方法、情報検索装置及び記録媒体

Publications (1)

Publication Number Publication Date
JP2003196308A true JP2003196308A (ja) 2003-07-11

Family

ID=27602089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001395807A Pending JP2003196308A (ja) 2001-12-27 2001-12-27 情報検索方法、情報検索装置及び記録媒体

Country Status (1)

Country Link
JP (1) JP2003196308A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012230544A (ja) * 2011-04-26 2012-11-22 Casio Comput Co Ltd 画像検索装置およびプログラム
CN105589954A (zh) * 2015-12-21 2016-05-18 北京奇虎科技有限公司 基于中心词确定搜索建议的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012230544A (ja) * 2011-04-26 2012-11-22 Casio Comput Co Ltd 画像検索装置およびプログラム
CN105589954A (zh) * 2015-12-21 2016-05-18 北京奇虎科技有限公司 基于中心词确定搜索建议的方法及装置

Similar Documents

Publication Publication Date Title
Bojar et al. Findings of the 2016 conference on machine translation (wmt16)
CN106649786B (zh) 基于深度问答的答案检索方法及装置
CN106663125B (zh) 提问句生成装置以及记录介质
US10191892B2 (en) Method and apparatus for establishing sentence editing model, sentence editing method and apparatus
EP3016002A1 (en) Non-factoid question-and-answer system and method
US10496756B2 (en) Sentence creation system
US11531693B2 (en) Information processing apparatus, method and non-transitory computer readable medium
US8812504B2 (en) Keyword presentation apparatus and method
Labusch et al. Named Entity Disambiguation and Linking Historic Newspaper OCR with BERT.
Zad et al. Hell hath no fury? correcting bias in the nrc emotion lexicon
KR102168319B1 (ko) 신규 개체명 단어에 연관된 말뭉치 생성을 위한 문장 자동 생성 장치 및 그 동작 방법
JP4959603B2 (ja) ドキュメントを解析するためのプログラム,装置および方法
JP2004334766A (ja) 単語分類装置、単語分類方法及び単語分類プログラム
JP2013050890A (ja) テキスト検索装置、テキスト検索プログラム、及びテキスト検索方法
US20110106849A1 (en) New case generation device, new case generation method, and new case generation program
JP2003196308A (ja) 情報検索方法、情報検索装置及び記録媒体
CN109284364B (zh) 一种用于语音连麦互动的互动词汇更新方法及装置
JP5733285B2 (ja) 検索装置、検索方法及びプログラム
JP2003173348A (ja) 情報検索方法、情報検索装置、および記憶媒体
JP6447549B2 (ja) テキスト検索装置、テキスト検索方法及びプログラム
JP2005267397A (ja) 語句分類システム、語句分類方法、および語句分類プログラム
JP4336403B2 (ja) 情報検索装置及びその方法、コンピュータ可読メモリ
JP4336404B2 (ja) 情報検索装置及びその方法、コンピュータ可読メモリ
JP2000090110A (ja) 全文検索方法、装置、および全文検索プログラムを記録した記録媒体
JPH1145249A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体