JP2003173348A - 情報検索方法、情報検索装置、および記憶媒体 - Google Patents

情報検索方法、情報検索装置、および記憶媒体

Info

Publication number
JP2003173348A
JP2003173348A JP2001372722A JP2001372722A JP2003173348A JP 2003173348 A JP2003173348 A JP 2003173348A JP 2001372722 A JP2001372722 A JP 2001372722A JP 2001372722 A JP2001372722 A JP 2001372722A JP 2003173348 A JP2003173348 A JP 2003173348A
Authority
JP
Japan
Prior art keywords
word
words
search
search condition
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001372722A
Other languages
English (en)
Inventor
Kazuyo Ikeda
和世 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001372722A priority Critical patent/JP2003173348A/ja
Publication of JP2003173348A publication Critical patent/JP2003173348A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 電子辞書の見出し語を検索する機能と、説明
文を検索する機能を選択する煩わしさをなくして、平易
な電子辞書検索機能を提供する。 【解決手段】 見出し語と説明文を対応させて格納した
情報記憶部108と、自然な言葉で表現される検索条件
を入力する検索条件入力工程と、検索条件を構成する単
語と各単語間の関係を求める検索条件解析工程と、検索
条件を満たす見出し語を出力する見出し語検索工程と、
説明文を構成する単語と各単語間の関係を求める説明文
解析工程と、検索条件の単語を含み、各単語間の関係も
すべて一致する説明文、または、検索条件の単語の一部
を含み、各単語間の関係も一致致する説明文に対応した
見出し語を検索結果として出力する説明文検索工程。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータ等に
おける情報検索方法、情報検索装置、および、情報検索
を実行させるための制御プログラムを記憶したコンピュ
ータ読み取り可能な記憶媒体に関する。
【0002】
【従来の技術】従来、電子化された国語辞典や百科事典
のような電子辞書を検索する一つの用途として、検索者
が見出し語を知っており、その見出し語の語義などの説
明について知りたい場合に電子辞書を検索することがあ
げられる。このような目的を達成する手法として、検索
条件として電子辞書の見出し語を指定し、指定された検
索条件と一致する見出し語に対応した説明文を出力する
方法が行われている。この手法を見出し語検索と呼ぶこ
とにする。
【0003】また、別の電子辞書の検索用途として、検
索者がある概念について知っており、その概念を表す言
葉を知りたい場合に電子辞書を検索することがあげられ
る。このような目的に対応するために、全文検索の手法
を用いて、検索条件を単語の論理式で表し、電子辞書の
説明文と比較する方法が用いられてきた。この手法を説
明文検索と呼ぶことにする。
【0004】
【発明が解決しようとしている課題】しかしながら、上
記従来例では、見出し語検索と説明文検索は、別々の機
能として提供されており、検索者は、必ず、どちらの機
能を使用するのかを決めた上で、検索を行う必要があっ
た。しかし、電子辞書を検索する場合、見出し語もはっ
きりとは覚えておらず、概念もはっきりと表現できない
場合も多く、どちらの機能を使用して良いかわからない
場合や、両方の機能を利用したい場合もあり、このよう
な場合は、2つのうちのどちらかの機能を選んでから検
索を行う行為が煩わしく思われることがあった。
【0005】本発明は、上記従来例の課題を解決するた
めのものである。
【0006】本発明に係る情報検索方法、情報検索装
置、および、記憶媒体は、自然な言葉によって表現され
た検索条件を解析することによって、検索条件を構成す
る単語、および、各単語間の関係を求める。そして、検
索条件を満たす情報記憶部の見出し語を検索結果として
出力する。また、情報記憶部に格納されている説明文を
解析することによって、説明文を構成する単語、およ
び、各単語間の関係を求める。そして、検索条件の単語
を含み、各単語間の関係もすべて一致する説明文、また
は、検索条件の単語の一部を含み、各単語間の関係も一
致する説明文に対応した情報記憶部の見出し語を検索結
果として出力する情報検索方法、情報検索装置、および
記憶媒体を提供することを目的とする。
【0007】
【課題を解決するための手段】この発明は下記の構成を
備えることにより上記課題を解決できるものである。
【0008】(1)見出し語に対して、見出し語を自然
な言葉で説明する説明文を対応させて格納した情報記憶
部と、検索条件を人力する検索条件入力工程と、前記情
報記憶部を検索して、前記検索条件入力工程において入
力された検索条件を満たす見出し語を求める情報検索方
法において、前記検索条件入力工程においては、自然な
言葉で表現される検索条件を入力し、前記検索条件入力
工程によって入力された検索条件を解析し、検索条件を
構成する単語と各単語間の関係を求める検索条件解析工
程と、前記情報記憶部に格納されている説明文を解析
し、説明文を構成する単語と各単語間の関係を求める説
明文解析工程と、前記情報記憶部の見出し語を検索し、
前記検索条件入力工程によって入力された検索条件を満
たす見出し語を検索結果として出力する見出し語検索工
程と、前記検索条件解析工程によって得られた単語およ
び各単語間の関係と、前記説明文解析工程によって得ら
れた単語および各単語間の関係を比較し、検索条件の単
語を含み、各単語間の関係もすべて一致する説明文、ま
たは、検索条件の単語の一部を含み、各単語間の関係も
一致する説明文に対応した前記情報記憶部の見出し語を
検索結果として出力する説明文検索工程を有することを
特徴とする情報検索方法。
【0009】(2)前記情報記憶部に格納されている見
出し語を解析し、見出し語を構成する単語と各単語間の
関係を求める見出し語解析工程を有し、見出し語検索工
程は、前記検索条件解析工程によって得られた単語およ
び各単語間の関係と、前記見出し語解析工程によって得
られた単語および各単語間の関係を比較し、検索条件の
単語を含み、各単語間の関係もすべて一致する見出し
語、または、検索条件の単語の一部を含み、各単語間の
関係も一致する見出し語を検索結果として出力すること
を特徴とする前記(1)記載の情報検索方法。
【0010】(3)見出し語に対して、見出し語を自然
な言葉で説明する説明文を対応させて格納した情報記憶
部と、検索条件を入力する検索条件入力手段と、前記情
報記憶部を検索して、前記検索条件入力手段において入
力された検索条件を満たす見出し語を求める情報検索装
置において、前記検索条件入力手段においては、自然な
言葉で表現される検索条件を入力し、前記検索条件入力
手段によって入力された検索条件を解析し、検索条件を
構成する単語と各単語間の関係を求める検索条件解析手
段と、前記情報記憶部に格納されている説明文を解析
し、説明文を構成する単語と各単語間の関係を求める説
明文解析手段と、前記情報記憶部の見出し語を検索し、
前記検索条件入力手段によって入力された検索条件を満
たす見出し語を検索結果として出力する見出し語検索手
段と、前記検索条件解析手段によって得られた単語およ
び各単語間の関係と、前記説明文解析手段によって得ら
れた単語および各単語間の関係を比較し、検索条件の単
語を含み、各単語間の関係もすべて一致する説明文、ま
たは、検索条件の単語の一部を含み、各単語間の関係も
一致する説明文に対応した前記情報記憶部の見出し語を
検索結果として出力する説明文検索手段を有することを
特徴とする情報検索装置。
【0011】(4)前記情報記憶部に格納されている見
出し語を解析し、見出し語を構成する単語と各単語間の
関係を求める見出し語解析手段を有し、見出し語検索手
段は、前記検索条件解析手段によって得られた単語およ
び各単語間の関係と、前記見出し語解析手段によって得
られた単語および各単語間の関係を比較し、検索条件の
単語を含み、各単語間の関係もすべて一致する見出し
語、または、検索条件の単語の一部を含み、各単語間の
関係も一致する見出し語を検索結果として出力すること
を特徴とする前記(3)記載の情報検索装置。
【0012】(5)見出し語に対して、見出し語を自然
な言葉で説明する説明文を対応させて格納した情報記憶
部と、検索条件を入力する検索条件入力工程と、前記情
報記憶部を検索して、前記検索条件入力工程において入
力された検索条件を満たす見出し語を求める情報検索プ
ログラムを記憶した記憶媒体において、前記検索条件入
力工程においては、自然な言葉で表現される検索条件を
入力し、前記検索条件入力工程によって入力された検索
条件を解析し、検索条件を構成する単語と各単語間の関
係を求める検索条件解析工程と、前記情報記憶部に格納
されている説明文を解析し、説明文を構成する単語と各
単語間の関係を求める説明文解析工程と、前記情報記憶
部の見出し語を検索し、前記検索条件入力工程によって
入力された検索条件を満たす見出し語を検索結果として
出力する見出し語検索工程と、前記検索条件解析工程に
よって得られた単語および各単語間の関係と、前記説明
文解析工程によって得られた単語および各単語間の関係
を比較し、検索条件の単語を含み、各単語間の関係もす
べて一致する説明文、または、検索条件の単語の一部を
含み、各単語間の関係も一致する説明文に対応した前記
情報記憶部の見出し語を検索結果として出力する説明文
検索工程を有することを特徴とする情報検索方法をコン
ピュータに実行させるプログラムを記憶したコンピュー
タ読み取り可能な記憶媒体。
【0013】(6)前記情報記憶部に格納されている見
出し語を解析し、見出し語を構成する単語と各単語間の
関係を求める見出し語解析工程を有し、見出し語検索工
程は、前記検索条件解析工程によって得られた単語およ
び各単語間の関係と、前記見出し語解析工程によって得
られた単語および各単語間の関係を比較し、検索条件の
単語を含み、各単語間の関係もすべて一致する見出し
語、または、検索条件の単語の一部を含み、各単語間の
関係も一致する見出し語を検索結果として出力すること
を特徴とする情報検索方法をコンピュータに実行させる
プログラムを記憶したコンピュータ読み取り可能な前記
(5)に記載の記憶媒体。
【0014】
【発明の実施の形態】以下、図面を参照して本発明を詳
細に説明する。
【0015】図1は、本発明に係る情報検索方法および
情報検索装置の実施例を示す概念図、図2は本発明に係
る情報検索方法および情報検索装置の実施例を示すシス
テム構成図、図14は本発明に係る情報検索方法のデー
タ処理のフローチャートである。
【0016】図1において、文字キー、ファンクション
キーなどを備えたキーボードなどの入力部101から、
自然な言葉で表現された検索条件であるクエリを制御部
102へ入力する。制御部102はマイクロプロセッサ
からなり、検索条件解析部103においてクエリを解析
し、クエリを構成する単語と各単語間の関係を求める。
さらに、情報記憶部108に格納された見出し語を取り
出し、見出し語検索部106において、クエリの条件を
満たす見出し語を表示部109へ出力する。さらに、情
報記憶部108に格納された説明文を取り出し、説明文
解析部104において、説明文を構成する単語と各単語
間の関係を求める。そして、説明文検索部105におい
て、クエリを構成する単語と各単語間の関係と、説明文
を構成する単語と各単語間の関係を比較し、説明文を構
成する単語と各単語間の関係が、クエリを構成する単語
と各単語間の関係の全て、または、一部を含む場合は、
説明文に対応した見出し語を表示部109へ出力する。
【0017】図2におけるROM202には、図4に示
されるように、制御手順プログラム401が格納されて
いる。
【0018】図2におけるRAM203には、図6に示
されるように、情報検索プログラム603、電子図鑑6
04、単語辞書605、文法辞書606、形態素リスト
607、ロールリスト608、検索結果リスト609な
どが格納されている。
【0019】図3は、プログラム等が媒体であるCD−
ROM205からコンピュータシステムに供給されるこ
とを示す。図5は、記憶媒体CD−ROM205中の情
報検索プログラム501、ならびに、関連データである
電子図鑑502、単語辞書503、文法辞書504の構
成を示す。
【0020】図6は、CD−ROM205に格納されて
いる情報検索プログラム501、ならびに、関連データ
である電子図鑑502、単語辞書503、文法辞書50
4などが、RAM203にロードされ実行可能となった
状態のメモリマップを示す。実行可能となった状態で
は、情報検索プログラム603、電子図鑑604、単語
辞書605、文法辞書606以外に、情報検索プログラ
ムが使用するメモリとして、形態素リスト607、ロー
ルリスト608、および、検索結果リスト609の領域
が確保され、初期化される。
【0021】図7は、RAM203に読み込まれた電子
図鑑604の構成を示した図である。電子図鑑604に
は、見出し語とその見出し語に対する説明文とその見出
し語を表す画像ファイルの名称を、それぞれ1つずつ対
応させたものを1つの項目とし、複数の項目が格納され
ている。例えば、図中では、1つの項目として、見出し
語「dachsfund」と、説明文「dog wit
h short legs……」と、画像ファイル「0
0001002.jpg」が対応されて格納されてい
る。各項目は、見出し語によって昇順に−トされてい
る。
【0022】図8は、RAM203に読み込まれた単語
辞書605の構成を示した図である。単語辞書605に
は、見出し語とカテゴリをそれぞれ1つずつ対応させた
ものを1つの単語の情報とし、複数の単語の情報が格納
されている。例えば、単語辞書605には、1つの単語
の情報として、見出し語「dog」とカテゴリ「Nou
n」を対応させて格納されている。各単語の情報は、見
出し語によって昇順にソートされている。
【0023】図9は、RAM203に読み込まれた文法
辞書606の構成を示した図である。文法辞書606に
は、左カテゴリと右カテゴリとロールとをそれぞれ一つ
ずつ対応させたものを1つの文法ルールとし、複数の文
法ルールが格納されている。各文法ルールにおいて、左
カテゴリと右カテゴリは、単語辞書605に格納されて
いるカテゴリに対応する。各文法ルールの意味は、文中
において、左の単語のカテゴリと右の単語のカテゴリ
が、それぞれ、文法辞書606の1つの文法ルールの左
カテゴリと右カテゴリに一致した場合、その2つ単語の
間の関係として、左カテゴリと右カテゴリに対応したロ
ールの関係にある可能性があることを意味している。例
えば、文中において、左の単語のカテゴリがAdver
bで、右の単語のカテゴリがAdjectiveであれ
ば、その2つの単語の間の関係はModifierの可
能性があることが、図示されている。
【0024】図10は、RAM203に確保された形態
素リスト607の構成を示した図である。形態素リスト
607には、キーボード207から入力されたクエリ、
および、電子図鑑604中の説明文を形態素解析した結
果、各単語の情報が、それぞれ、1つの項目として格納
される。各項目には、IDと単語とカテゴリと順位と重
みが、それぞれ1つずつ対応づけられて格納される。I
Dには、文の先頭の番号を1とした、文の先頭からの単
語の番号が格納される。単語には、各単語の語幹が格納
される。カテゴリには、各単語のカテゴリが格納され
る。順位には、文の中心となる単語の順位を1とし、各
単語の重要度に応じて順位を定めた結果が格納される。
重みには、各単語の重要度に応じた重みが格納される。
文中の全ての単語に対応した重みの和をとると、必ず1
になる。例えば、表T101には、文「dog wit
h very short leg」に対して、形態素
解析などを行った結果を格納した形態素リストが示され
ている。表T101において、「with」に対応した
順位の値が「−1」になっているが、これは、順位を付
与する対象外の単語であることを意味している。他の例
として、表T104には、文「dog short l
eg」に対して、形態素解析などを行った結果を格納し
た形態素リストが示されている。表T104において、
順位が「1」の単語として、「dog」と「leg」の
2つが存在するが、このように、一つの文中で、順位と
して、同じ値が出現することがある。形態素リスト60
7には、クエリに対して形態素解析などを行った結果を
格納する領域と、説明文に対して形態素解析などを行っ
た結果を格納する領域との2つの領域が区別されて存在
する。
【0025】図11は、RAM203に確保されたロー
ルリスト608の構成を示した図である。ロールリスト
608には、キーボード207から入力されたクエリ、
および、電子図鑑604中の説明文に対して構文解析を
行った結果、2つの単語間の各関係が、それぞれ、1つ
の項目として格納される。各項目には、左単語IDとロ
ールと右単語IDが、それぞれ1つずつ対応づけられて
格納される。左単語IDと右単語IDには、文中の2つ
の単語の、それぞれ、左側の単語と右側の単語が対応
し、形態素リスト607のIDの値が使用される。ロー
ルには、2つの単語の間の関係の種類、すなわち、一方
の単語が果たす他方の単語へのロール(役割)が格納さ
れる。ロールの種類は、文法辞書606のロールの種類
と同じである。例えば、表T201には、文「dog
with very shortleg」に対して、構
文解析を行った結果を格納したロールリストが示してあ
る。この文に対する形態素リストを表T101に示して
あるので、左単語ID「1」に相当する単語「dog」
は、右単語ID「2」に相当する単語「with」に対
して、ロールとして「PSubject」すなわち、
「Preposition Subject」の関係に
あることが示されている。ロールリスト608には、ク
エリに対して構文解析などを行った結果を格納する領域
と、説明文に対して構文解析などを行った結果を格納す
る領域との2つの領域が区別されて存在する。
【0026】図12は、RAM203に確保された検索
結果リスト609の構成を示した図である。検索結果リ
スト609には、キーボード207から入力されたクエ
リに従って、電子図鑑604を検索した結果、クエリの
条件を満たす各項目が格納される。検索結果リスト60
9には、一つの項目として、電子図鑑604の見出し語
と、検索の結果得られるスコアとが、それぞれ一つずつ
対応されて格納され、複数の項目が格納される。
【0027】図13は、キーボード207よりクエリを
入力し、検索を指示した後、電子図鑑604を検索した
結果がディスプレイ208に表示された画面の例を示し
た図である。図中において、1301は、クエリを入力
するためのテキストボックスである。本テキストボック
ス内にキーボード207からクエリを入力し、1302
のOKボタンをマウス209でクリックすると、130
3に、クエリの条件を満たす電子図鑑604中の見出し
語と、検索の際得られたスコアが表示される。さらに、
1304には、電子図鑑604中の見出し語に対応した
画像ファイルから得られる画像が表示され、1305に
は、見出し語に対応した説明文が表示される。検索結果
は、スコアの大きい順に画面左より右に向かって表示さ
れ、1画面中に収まらないときは、1306の次画面ボ
タン語をマウス209でクリックすることにより、他の
検索結果も画面に表示することができる。本図には、ク
エリとして「dog with short leg」
を指定した場合の検索後の画面が表示されており、「d
achsfund」がスコア「1.00」で、「sky
e terrier」がスコア「1.00」で「shi
h tzu」がスコア「1.00」で、それぞれ、検索
された場合が示されている。
【0028】次に、図14により、本情報検索プログラ
ムの動作を説明する。
【0029】まず、CD−ROM205に格納された情
報検索プログラム501、および、その関連データの電
子図鑑502、単語辞書503、文法辞書504をCD
−ROMドライブ204からRAM203にロードし、
さらに、RAM203に形態素リスト607、ロールリ
スト608、検索結果リスト609の領域を確保し、そ
の他必要な初期化を行う(ステップS101)。
【0030】次に、オペレータが、テキストボックス1
301にキーボード207を用いてクエリを入力し、マ
ウス209を用いてOKボタン1302をクリックする
(ステップS102)。
【0031】次に、ステップS102で入力されたクエ
リと一致する見出し語を電子図鑑604の中かも検索
し、見つかった見出し語を検索結果リスト609の先頭
から詰めて格納する。その際、スコアの値は1.00と
しておく(ステップS103)。電子図鑑604中の各
項目は、見出し語によって昇順にソートされているの
で、本処理は、同種の電子図鑑や電子辞書において、一
般に行われている処理である。
【0032】次に、ステップS102で入力されたクエ
リの解析を行い、形態素リスト607およびロールリス
ト608のクエリ用の領域に、解析結果を格納する(ス
テップS104)。本処理は、図15において後述す
る。
【0033】次に、電子図鑑604の先頭から、順次、
説明文を一つずつ取り出し(ステップS105)、取り
出すことができればステップS107へ、全ての説明文
を取り出し終えていればステップS109へ分岐する
(ステップS106)。
【0034】ステップS107では、ステップS105
で取り出した説明文の解析を行い、形態素リスト607
およびロールリスト608の説明文用の領域に、解析結
果を格納する。本処理は、図15において後述する。処
理を終えれば、ステップS108へ進む。
【0035】ステップS108では、ステップS104
で得られたクエリの解析結果と、ステップS107で得
られた説明文の解析結果を比較し、クエリの条件を含む
説明文に対する見出し語を、条件を含む度合いに応じて
算出したスコアとともに、検索結果リスト609に詰め
て格納する。本処理は、図16において後述する。処理
を終えれば、ステップS105へ進む。
【0036】ステップS109では、検索結果リスト6
09に格納された見出し語とその見出し語に対応した情
報を電子図鑑604から求めて、ディスプレイ208に
表示する。表示する前に、検索結果リスト609に格納
されている各項目を、スコアの値によって降順にソート
した後、検索結果リストの先頭から、すなわち、スコア
の値が大きい物から順番に、図13において説明したよ
うに表示する。ソートする際、スコアの値が同じ場合
は、リストの先頭に出現する項目が先頭側になるように
配置する。これによって、ステップS103で検索され
た項目、すなわち、クエリと一致する見出し語を持つ項
目が、一番最初に表示されることが保証される。
【0037】図15は、ステップS104のクエリ解
析、および、ステップS107の説明文解析の処理を説
明するフローチャートである。本処理は、形態素リスト
607およびロールリスト608に解析結果を出力する
が、ステップS104の場合は、クエリ用の形態素リス
トとロールリストに解析結果が出力され、ステップS1
07の場合は、説明文用の形態素リストとロールリスト
に解析結果が出力される。以降の説明においては、これ
らの区別を明示的には説明していないが、実際には区別
されていることをあらかじめ断っておく。
【0038】図15のフローチャートにおいて、まず、
単語辞書605等を用いて、クエリまたは説明文の形態
素解析を行い、解析結果を形態素リスト607に格納す
る(ステップS201)。本処理によって、形態素リス
ト607には、図10に示されるような情報が格納され
る。ただし、この段階では、形態素リスト607の中
で、ID、単語、カテゴリのフィールドのみに値が格納
され、順位と重みには値は格納されていない。本処理
は、一般に行われている処理であり、特に詳細な説明は
行わない。
【0039】次に、形態素リスト607、文法辞書60
6等を用いて、クエリまたは説明文の構文解析を行い、
解析結果をロールリスト608に格納する(ステップ2
02)。本処理によって、ロールリスト608には、図
11に示されるような情報が格納される。本処理は、依
存文法を用いた構文解析であり、日本語の係り受け解析
などで、一般に行われているので、特に詳細な説明は行
わない。
【0040】次に、形態素リスト607およびロールリ
スト608を用いて、形態素リスト607に格納されて
いる単語のうち、中心となる単語、すなわち、中心語を
決定する(ステップS203)。例えば、「Noun」
が一番強く、次に「Verb」、「Adjectiv
e」といったように、中心語としてのカテゴリの優先順
位をつけて中心語の候補を絞り込むさらに、形態素リス
ト607中に、複数の中心語の候補が存在すれば、ロー
ルリスト608を用いて、その候補と他の単語との関係
によって、中心語を決定する。例えば、形態素リスト6
07中に「Noun」が2つ以上存在する場合、他の単
語と「PObject」の関係にある候補は、中心語の
候補からはずす等として、中心語の候補を絞り込んでい
く。中心語の候補を絞り込んでいき、最終的に複数の中
心語の候補が存在する場合は、全ての候補を中心語とす
る。中心語として認められた単語に対しては、形態素リ
ストの順位のフィールドに、「1」を格納する。
【0041】次に、形態素リスト607中の中心語以外
の単語に対して、順位の値を格納する(ステップS20
4)。ロールリスト608を利用して、中心語と関係が
ある単語に対して順位の値として「2」を格納し、さら
に、順位「2」の単語と関係がある単語の順位の値を
「3」とするようにして、中心語からの関係を次々とた
ぐっていくことによって、順位を付与していく。ただ
し、カテゴリが、「Preposition」など、特
定のカテゴリを持つ単語は、順位の付与対象外となり、
順位の値として、「−1」が格納される。中心語からの
関係をたどって、順位を付与する場合に、付与対象外の
単語が出現した場合は、その単語をスキップして、順位
の値が連続するようにする。中心語から関係する単語を
たどっていく場合、一つの単語が複数の単語と関係する
場合があるので、このような場合は、その単語に関係す
る単語は、同じ順位の値が付与されることになる。この
処理によって、形態素リスト607中の全ての単語に対
する順位に対して、値が付与されることになる。このよ
うにして付与された順位は、中心語をルートとするツリ
ー構造を構成することになる。このツリー構造を順位ツ
リーと呼ぶことにする。
【0042】次に、形態素リスト607中の全ての単語
に重みを付与する(ステップS205)。重みは、中心
語に一番大きい値が付与され、順位が大きくなるに従っ
て、値が小さくなるように付与する。ただし、全ての重
みの値の和が、必ず「1.0」になるようにする。ま
た、順位付与対象外の単語に対しては、重みの値とし
て、「0」を格納する。例えば、形態素リスト中の中心
語の個数を求める。その際、順位付与対象外の単語に対
しては、重みの値として、「0」を格納しておく。次
に、「1.0」を、中心語の個数で割り、その値を、各
中心語から連なる順位ツリーの値とする。そして、各順
位ツリーにおいて、順位ツリーの値に「0.7」を掛け
た値を、ルートの単語(すなわち、中心語)の重みの値
として格納する。ただし、順位ツリーが中心語のみから
構成される場合は、順位ツリーの値を中心語の重みとし
て格納する。さらに、ルートの下の枝の個数によって、
順位ツリーの値からルートに付与した値を引いた値を割
った値を、各枝(すなわち、サブ順位ツリー)の順位ツ
リーの値とする。そして、同様にして、各サブ順位ツリ
ーにおいて、順位ツリーの値に「0.7」を掛けた値
を、ルートの単語の重みの値として格納する。ただし、
順位ツリーがルートの単語のみから構成される場合は、
順位ツリーの値をルートの単語の重みとして格納する。
さらに、ルートの下の枝の個数によって、順位ツリーの
値からルートに付与した値を引いた値を割った値を、各
枝(すなわち、サブ順位ツリー)の順位ツリーの値とす
る。この処理を繰り返すことによって全ての単語に、前
述の条件を満たす重みを付与することができる。
【0043】図16は、ステップS108の処理を説明
するフローチャートである。
【0044】まず、フローチャートには記載されていな
いが、スコアの値に初期値の「0」を格納するなど、必
要な初期化処理を行う。
【0045】その後、クエリ用の形態素リスト607中
の中心語を順次一つずつ取り出し(ステップS30
1)、取り出すことができればステップS303に分岐
し、全ての中心語を取り出し終えた場合は、ステップS
313へ分岐する(ステップS302)。
【0046】ステップS303では、説明文用の形態素
リスト607の中に、ステップS301で取り出した単
語(中心語)と同じ単語が存在するかどうかによって分
岐する。存在する場合はステップS304へ分岐し、存
在しない場合はステップS307へ分岐する。
【0047】ステップS304では、ステップS301
で取り出した単語(中心語)と同じ単語が、説明文用の
形態素リスト607中でも、中心語であるかどうかによ
って分岐する。中心語である場合はステップS305へ
すすみ、中心語でない場合はステップS306へ進む。
【0048】ステップS305では、ステップS301
で取り出した単語(中心語)に対応した重みを、クエリ
用の形態素リスト607から取り出し、スコアに加える
処理である。処理を終えるとステップS307へ進む。
【0049】ステップS306では、ステップS301
で取り出した単語(中心語)に対応した重みを、クエリ
用の形態素リスト607から取り出し、その値を2分の
1にした値をスコアに加える処理である。処理を終える
とステップS307へ進む。
【0050】ステップS307は、クエリ用のロールリ
スト608を利用して、ステップS301で取り出した
単語(中心語)を順次たどって、中心語から連なってい
る単語を一つずつ取り出す処理である(ステップS30
7)。取り出すことができればステップS309へ分岐
し、中心語から連なる単語を全て取り出し終えたら、ス
テップS301へ分岐する(ステップS308)。
【0051】ステップS309では、ステップS307
で取り出した単語と同じ単語が、説明文用の形態素リス
ト607に存在するかどうかによって分岐する処理であ
る。存在すればステップS310へ進み、存在しなけれ
ばステップS307へ進む。
【0052】ステップS310では、ステップS307
で取り出した単語と中心語側への単語との関係が、説明
文でも一致しているかどうかによって分岐する処理であ
る。まず、ステップS307で取り出した単語(以降、
後単語と呼ぶ)と、それより順位の値が1だけ小さい単
語(以降、前単語と呼ぶ)との間のロールをクエリ用の
ロールリストから求める。説明文用の形態素リスト中
に、前単語と同じ単語が存在し、かつ、説明文用のロー
ルリスト中に、前単語と同じ単語と後単語と同じ単語に
対応したロールが、先ほど求めたクエリのロールと一致
する場合にのみ、単語の関係が説明文でも一致している
と見なす。一致している場合はステップS311へ進
み、一致していない場合はステップS312へ進む。
【0053】ステップS311は、ステップS307で
取り出した単語に対応した重みを、クエリ用の形態素リ
スト607から取り出し、スコアに加える処理である。
処理を終えるとステップS307へ進む。
【0054】ステップS312では、ステップS307
で取り出した単語に対応した重みを、クエリ用の形態素
リスト607から取り出し、その値を2分の1にした値
をスコアに加える処理である。処理を終えるとステップ
S307へ進む。
【0055】ステップS313は、スコアの値によって
分岐する処理である。スコアの値が0であれば本処理を
終了し、スコアの値が0より大きければステップS31
4へ分岐する。
【0056】ステップS314は、検索された結果を検
索結果リスト609へ格納する処理である。対象となっ
ている説明文に対応した見出し語とスコアの値を対応さ
せて、検索結果リスト609へ詰めて格納する。処理を
終えると、本処理を終了する。
【0057】以上説明した動作を実際の情報検索の例に
ついて、より詳しく説明する。クエリとして、「dac
hshund」が指定された場合(ステップS1150
2)、図7に示されるように、電子図鑑604に、見出
し語として「dachshund」が格納されているの
で、検索結果リスト609の先頭に、見出し語「dac
hshund」とスコア「1.0」を対応させた項目が
格納される(ステップS103)。スコアの最大値は
「1.0」でありステップS109では、スコアの値が
大きい物から順番に表示し、スコアの値が同じ場合はリ
ストの先頭に出現する項目が最初に表示されるので、ス
テップS103で検索された「dachshund」
が、検索結果として一番最初にディスプレイ208に表
示される(ステップS109)。
【0058】次に、クエリとして、「dog with
short legs」が指定された場合の例を説明
する。
【0059】ステップS201においてクエリに対する
形態素解析が行われると、図8に示されるように、各単
語のカテゴリが対応づけられているので、クエリ用の形
態素リスト607には図10の表T102に示されるよ
うな情報が格納される。ただし、この時点では、順位と
重みには、値は格納されていない。
【0060】続いて、ステップS202においてクエリ
に対する構文解析が行われると、図9に示されるよう
に、各カテゴリ間の関係が記載されているので、クエリ
用のロールリスト608には図11の表T202に示さ
れるような情報が格納される。
【0061】続いて、ステップS203において、中心
語が決定される。表T102からわかるように、カテゴ
リ「Noun」の単語として「dog」と「leg」が
存在するので、この2つの単語に中心語が絞り込まれ
る。さらに、表T202からわかるように、「leg」
は、ロール「PObject」を持つので、中心語の対
象から外され、最終的に「dog」がクエリの中心語で
あると決定され、表T102に示されるように、クエリ
用の形態素リストの「dog」に対応した順位として
「1」が格納される。
【0062】続いて、ステップS204において、クエ
リ用のロールリストである表T202を利用して、クエ
リ用の形態素リストの「dog」以外の単語に対して、
順位の値が格納される。表T202によると、「do
g」に対応した左単語ID「1」に対して、右単語ID
「2」が対応している。しかし、単語ID「2」の単語
「with」は表T102によれば、カテゴリが「Pr
epositon」であるので、順位付与対象外の単語
となり、順位には「−1」が格納される。さらに、「w
ith」に対応した左単語ID「2」に対して、右単語
ID「4」が対応している。単語ID「4」の単語「l
eg」は、順位付与対象外の単語でなく、中心語の「d
og」からたどって、最初の順位付与の対象となる単語
なので、順位として「2」が格納される。さらに、「l
eg」に対応した右単語ID「4」に対して、左単語I
D「3」が対応している。単語ID「3」の単語「sh
ort」は、順位付与対象外の単語でなく、中心語の
「dog」からたどって、「dog」を含めて3番目の
順位付与の対象となる単語なので、順位として「3」が
格納される。以上によって、クエリ用の形態素リストに
表T102に示されるように、順位が格納される。
【0063】続いて、ステップS205において、クエ
リ用の形態素リストの各単語に対して、重みの値が格納
される。まず、順位付与対象外の単語に対して、重みの
値として「0」を格納しながら、中心語の個数を求め
る。表T102によれば、順位の値として「1」を持つ
のは、「dog」の1個だけであることがわかる。ま
た、順位の値として「−1」を持つ「with」に対す
る重みの値として、「0」が格納される。中心語の個数
が1個であるので、順位ツリーの値は「1.0」を
「1」で割った「1.0」になる。次に中心語の「do
g」を取り出し、順位ツリーの値「1.0」に「0.
7」を掛けた値「0.7」を「dog」に対応する重み
に格納する。そして、中心語「dog」に続く順位の
「2」を持つ単語は「leg」のみなので、「1.0」
から「0.7」を引いた値「0.3」を「1」で割った
値「0.3」が、「leg」をルートとするサブ順位ツ
リーの値となる。そして、順位ツリーの値「0.3」に
「0.7」を掛けた値「0.21」が、サブ順位ツリー
のルートである「leg」に対応した重みとして格納さ
れる。そして、「leg」続く順位の「3」を持つ単語
は「short」のみなので、「0.3」から「0.2
1」を引いて「1」で割った値「0.09」が、「sh
ort」をルートとするサブ順位ツリーの値となる。
「short」をルートとするサブ順位ツリーには「s
hort」しか残っていないので、順位ツリーの値
「0.09」が、そのまま、「short」に対応した
重みとして格納される。このようにして、表T102に
示されるように、クエリ用の形態素リストの重みに値が
格納される。
【0064】続いてステップS105において説明文
「dog with very short leg
s」が取り出された場合を説明する。ステップS107
において、説明文用の形態素リスト607とロールリス
ト608に、解析結果が格納される。解析は、前述のク
エリの解析と同様にして行われ、形態素リストは表T1
01に、ロールリストは表T201に、それぞれ示され
る状態になる。
【0065】続いて、ステップS301において、クエ
リの中心語「dog」が取り出される。説明文の形態素
リストである表T101に「dog」が中心語として格
納されているので、ステップS305において、スコア
の初期値「0」に、クエリの「dog」に対応した重み
の値が加算され、スコアの値は「0.7」になる。
【0066】続いて、ステップS307において、クエ
リの中心語「dog」に関係のある単語を取り出す。表
T202によれば、「dog」と関係する単語は、「w
ith」だけであるので、「with」を取り出す。説
明文の形態素リストには「with」が存在し、クエリ
と説明文の両方において「dog」と「with」の間
の関係であるロールの値が「PSubject」である
ので、関係も一致したことになり、ステップS311に
おいて、スコア値「0.7」にクエリの「with」に
対応した重みの値「0」が加算され、スコアの値は、
「0.7」になる。
【0067】続いて、ステップS307において、クエ
リの「with」に関係のある単語を取り出す。表T2
02によれば、すでに取り出された単語以外で「wit
h」と関係する単語は、「leg」だけであるので、
「leg」を取り出す。説明文の形態素リストには「l
eg」が存在し、クエリと説明文の両方において「wi
th」と「leg」の間の関係であるロールの値が「P
Object」であるので、関係も一致したことにな
り、ステップS311において、スコアの値「0.7」
にクエリの「leg」に対応した重みの値「0.21」
が加算され、スコアの値は、「0.91」になる。
【0068】続いて、ステップS307において、クエ
リの「leg」に関係のある単語を取り出す。表T20
2によれば、すでに取り出された単語以外で「leg」
と関係する単語は、「short」だけであるので、
「short」を取り出す。説明文の形態素リストには
「short」が存在し、クエリと説明文の両方におい
て、「leg」と「short」の間の関係であるロー
ルの値が「Modfier」であるので、関係も一致し
たことになり、ステップS311において、スコアの値
「0.91」に、クエリの「short」に対応した重
みの値「0.09」が加算され、スコアの値は、「1.
00」になる。
【0069】続いて、中心語も含めて、クエリの全ての
単語を取り出し終え、スコアの値も「0」よりも大きい
ので、検索結果リスト609に、説明文「dog wi
thvery short legs」に対応した見出
し語が、スコア値「1.00」とともに格納される。ス
コアの値が「1.0」であるということは、クエリの条
件を完全に満たしていることを意味している。
【0070】続いて、ステップS105において、説明
文「short dog withlong leg
s」が取り出された場合を説明する。ステップS107
において、説明文用の形態素リスト607とロールリス
ト608に、解析結果が格納される。解析は、前述のク
エリの解析と同様にして行われ、形態素リストは表T1
05に、ロールリストは表T205に、それぞれ示され
る状態になる。
【0071】続いて、ステップS301において、クエ
リの中心語「dog」が取り出される。説明文の形態素
リストである表T105に「dog」が中心語として格
納されているので、ステップS305において、スコア
の初期値「0」に、クエリの「dog」に対応した重み
の値が加算され、スコアの値は「0.7」になる。
【0072】続いて、ステップS307において、クエ
リの中心語「dog」に関係のある単語を取り出す。表
T202によれば、「dog」と関係する単語は、は
「with」だけであるので、「with」を取り出
す。説明文の形態素リストには「with」が存在し、
クエリと説明文の両方において、「dog」と「wit
h」の間の関係であるロールの値が「PSubjec
t」であるので、関係も一致したことになり、ステップ
S311において、スコアの値「0.7」に、クエリの
「with」に対応した重みの値「0」が加算され、ス
コアの値は、「0.7」になる。
【0073】続いて、ステップS307において、クエ
リの「with」に関係のある単語を取り出す。表T2
02によれば、すでに取り出された単語以外で「wit
h」と関係する単語は、「leg」だけであるので、
「leg」を取り出す。説明文の形態素リストには「l
eg」が存在し、クエリと説明文の両方において、「w
ith」と「leg」の間の関係であるロールの値が
「PObject」であるので、関係も一致したことに
なり、ステップS311において値「0.スコアの値
「0.7」に、クエリの「leg」に対応した重みの値
「0.21」が加算され、スコアの値は、「0.91」
になる。
【0074】続いて、ステップS307において、クエ
リの「leg」に関係のある単語を取り出す。表T20
2によれば、すでに取り出された単語以外で「leg」
と関係する単語は、「short」だけであるので、
「short」取り出す。説明文の形態素リストには
「short」が存在するが、表T205によれば、説
明文では、「leg」と「short」の間に関係が存
在しないので、ステップS312において、スコアの値
「0.91」に、クエリの「short」に対応した重
みの値「0.09」を2分の1した値「0.045」が
加算され、スコアの値は、「0.955」になる。
【0075】続いて、中心語も含めて、クエリの全ての
単語を取り出し終え、スコアの値も「0」よりも大きい
ので、検索結果リスト609に、説明文「short
dog with long legs」に対応した見
出し語が、スコアの値「0.955」とともに格納され
る。
【0076】続いて、同様に様々な説明文に対して、検
索を行った後、ステップS109において、検索結果が
ディスプレイに表示されることになるが、その中には、
説明文「dog with very short l
egs」に対応した電子図鑑604の項目が、スコアの
値「1.00」として表示され、それ以降に、説明文
「short dog with legs」に対応し
た電子図鑑604の項目が、スコアの値「0.955」
とともに表示される。
【0077】「dog with very shor
t legs」というクエリに対して、「dog wi
th very short legs」という説明文
のスコアは「1.0」になり、「dog with l
ong legs」という説明文のスコアは「0.95
5」になるので、前者の説明文の方がクエリとの一致度
が高いことがわかる。
【0078】次に、クエリとして、「dog with
thick legs」が指定された場合の例を説明
する。
【0079】ステップS104においてクエリに対する
解析が行われ、クエリ用の形態リストの状態は、表T1
03に示される状態になり、クエリ用のロールリストの
状態は、表203に示される状態になる。
【0080】続いて、ステップS105において、説明
文「dog with veryshort leg
s」が取り出された場合を説明する。ステップS107
において、説明文用の形態素リスト607とロールリス
ト608に、解析結果が格納される。解析は、前述のク
エリの解析と同様にして行われ、形態素リストは表T1
01に、ロールリストは表T201に、それぞれ示され
る状態になる。
【0081】続いて、ステップS301において、クエ
リの中心語「dog」が取り出される。説明文の形態素
リストである表T101に「dog」が中心語として格
納されているので、ステップS305において、スコア
の初期値「0」に、クエリの「dog」に対応した重み
の値が加算され、スコアの値は「0.7」になる。
【0082】続いて、ステップS307において、クエ
リの中心語「dog」に関係のある単語を取り出す。表
T203によれば、「dog」と関係する単語は、「w
ith」だけであるので、「with」を取り出す。説
明文の形態素リストには「with」が存在し、クエリ
と説明文の両方において、「dog」と「with」の
間の関係であるロールの値が「PSubject」であ
るので、関係も一致したことになり、ステップS311
において、スコアの値「0.7」に、クエリの「wit
h」に対応した重みの値「0」が加算され、スコアの値
は、「0.7」になる。
【0083】続いて、ステップS307において、クエ
リの「with」に関係のある単語を取り出す。表T2
03によれば、すでに取り出された単語以外で「wit
h」と関係する単語は、「leg」だけであるので、
「leg」を取り出す。説明文の形態素リストには「l
eg」が存在し、クエリと説明文の両方において、「w
ith」と「leg」の間の関係であるロールの値が
「PObject」であるので、関係も一致したことに
なり、ステップS311において、スコアの値「0.
7」に、クエリの「leg」に対応した重みの値「0.
21」が加算され、スコアの値は、「0.91」にな
る。
【0084】続いて、ステップS307において、クエ
リの「leg」に関係のある単語を取り出す。表T20
3によれば、すでに取り出された単語以外で「leg」
と関係する単語は、「thick」だけであるので、
「thick」を取り出す。説明文の形態素リストには
「thick」は存在しないので、ステップS312に
おいて、スコア値「0.91」に、クエリの「thic
k」に対応した重みの値「0.09」を2分の1した値
「0.045」が加算され、スコア値は、「0.95
5」になる。
【0085】続いて、中心語も含めて、クエリの全ての
単語を取り出し終え、スコアの値も「0」よりも大きい
ので、検索結果リスト609に、説明文「dog wi
thvery short legs」に対応した見出
し語が、スコアの値「0.955」とともに格納され
る。
【0086】続いて、同様に様々な説明文に対して、検
索を行った後、ステップS109において、検索結果が
ディスプレイに表示されることになるが、その中には、
説明文「dog with very short l
egs」に対応した電子図鑑604の項目が、スコアの
値「0.955」として表示される。
【0087】このように、クエリの条件と部分一致する
説明文において、重要度の低い条件のみが一致していな
い場合は、一致度が高いことがわかる。
【0088】次に、クエリとして、「dog shor
t legs」が指定された場合の例を説明する。この
例は、文法的に正しくないクエリが入力された場合、あ
るいは、文法的に正しいクエリが入力されても、構文解
析で使用する文法ルールに不備があり、正しく解析でき
ない場合を説明するための例である。
【0089】ステップS201においてクエリに対する
形態素解析が行われると、クエリ用の形態素リスト60
7には図10の表T104に示されるような情報が格納
される。ただし、この時点では、順位と重みには、値は
格納されていない。
【0090】続いて、ステップS202においてクエリ
に対する構文解析が行われる。ここで、文法辞書606
に左カテゴリNounと右カテゴリAdjective
に対する文法ルールが記述されておらず、また、左カテ
ゴリNounと右カテゴリNounに対する文法ルール
が記述されていないものとする。すると、クエリ用のロ
ールリスト608には図11の表T204に示されるよ
うな情報が格納される。表T204に示されるように、
文法的に正しくないクエリを解析した場合、あるいは、
文法的に正しいクエリが入力されても、構文解析で使用
する文法ルールに不備があり、正しく解析できない場
合、構文解析の結果として、1文中の単語と単語の間の
関係の連鎖がとぎれることになる。例えば、表T204
によれば、「dog」は、クエリ中の他の単語との関係
がなく、連鎖がとぎれている。
【0091】続いて、ステップS203において、中心
語が決定される。表T104からわかるように、カテゴ
リ「Noun」の単語として「dog」と「leg」が
存在するので、この2つの単語に中心語が絞り込まれ
る。しかし、「dog」はロールを持たないし、「le
g」はロールとして「Modifier」を持つだけな
ので、これ以上の中心語の絞り込みはできず、最終的に
「dog」と「leg」がクエリの中心語であると決定
され、表T104に示されるように、クエリ用の形態素
リストの「dog」と「leg」に対応した順位として
「1」が格納される。
【0092】続いて、ステップS204において、クエ
リ用のロールリストである表T204を利用して、クエ
リ用の形態素リストの「dog」と「leg」以外の単
語に対して、順位の値が格納される。表T204による
と、「leg」に対応した右単語ID「3」に対して、
左単語ID「2」が対応している。単語ID「2」の単
語「short」は、順位付与対象外の単語でなく、中
心語の「leg」からたどって、「leg」を含めて2
番目の順位付与の対象となる単語なので、順位として
「2」が格納される。以上によって、クエリ用の形態素
リストに表T104に示されるように、順位が格納され
る。
【0093】続いて、ステップS205において、クエ
リ用の形態素リストの各単語に対して、重みの値が格納
される。まず、順位付与対象外の単語に対して、重みの
値として「0」を格納しながら、中心語の個数を求め
る。表T104によれば、順位の値として「1」を持つ
のは、「dog」と「leg」の2個であることがわか
る。中心語の個数が2個であるので、各順位ツリーの値
は「1.0」を「2」で割った「0.5」になる。次に
最初の中心語の「dog」を取り出す。中心語「do
g」の順位ツリーには、「dog」しか存在しないの
で、順位ツリーの値「0.5」が、そのまま、「do
g」に対応した重みとして格納される。続いて、次の中
心語の「leg」を取り出し、順位ツリーの値「0.
5」に「0.7」を掛けた値「0.35」を「leg」
に対応する重みに格納する。そして、中心語「leg」
続く順位の「2」を持つ単語は「short」のみなの
で、「0.5」から「0.35」を引いて「1」で割っ
た値「0.15」が、「short」をルートとするサ
ブ順位ツリーの値となる。「short」をルートとす
るサブ順位ツリーには、「short」しか残っていな
いので、順位ツリーの値「0.15」が、そのまま、
「short」に対応した重みとして格納される。この
ようにして、表T104に示されるように、クエリ用の
形態素リストの重みに値が格納される。
【0094】以上示したように、文法的に正しくないク
エリを解析した場合、あるいは、文法的に正しいクエリ
が入力されても、構文解析で使用する文法ルールに不備
があり、正しく解析できない場合に、単語間の関係が一
つながりの連鎖にならなくなっても、すなわち、関係木
が一つの木として構成できず、複数の関係木に分かれた
としても、各関係木に対して中心語を決定し、各単語の
順位と重みを付与することができる。また、説明文に対
しても、同様に、文法的に正しくない場合や、文法ルー
ルに不備場ある場合でも、各単語の順位と重みを付与す
ることができる。
【0095】続いてステップS105において説明文
「dog with very short leg
s」が取り出された場合を説明する。ステップS107
において、説明文用の形態素リスト607とロールリス
ト608に、解析結果が格納される。解析は、前述のク
エリの解析と同様にして行われ、形態素リストは表T1
01に、ロールリストは表T201に、それぞれ示され
る状態になる。
【0096】続いて、ステップS301において、クエ
リの最初の中心語「dog」が取り出される。説明文の
形態素リストである表T101に「dog」が中心語と
して格納されているので、ステップS305において、
スコアの初期値「0」に、クエリの「dog」に対応し
た重みの値が加算され、スコアの値は「0.5」にな
る。
【0097】続いて、ステップS307において、クエ
リの中心語「dog」に関係のある単語を取り出す。表
T204によれば、「dog」と関係する単語は存在し
ないので、ステップS308において分岐し、ステップ
S301へ進む。
【0098】続いて、ステップS301において、クエ
リの次の中心語「leg」が取り出される。説明文の形
態素リストである表T101には「leg」は中心語と
しては格納されていないので、ステップS306におい
て、スコアの初期値「0」に、クエリの「leg」に対
応した重みを2分の1した値「0.175」が加算さ
れ、スコアの値は「0.675」になる。
【0099】続いて、ステップS307において、クエ
リの「leg」に関係のある単語を取り出す。表T20
4によれば、すでに取り出された単語以外で「leg」
と関係する単語は、「short」だけであるので、
「short」を取り出す。説明文の形態素リスト表T
101には「short」は存在し、説明文のロールリ
スト表201に、「short」のロールとして「Mo
difider」とあり、クエリの「short」のロ
ールと一致するので、ステップS311において、スコ
アの値「0.675」に、クエリの「short」に対
応した重みの値「0.15」が加算され、スコアの値
は、「0.825」になる。
【0100】続いて、中心語も含めて、クエリの全ての
単語を取り出し終え、スコアの値も「0」よりも大きい
ので、検索結果リスト609に、説明文「dog wi
thvery short legs」に対応した見出
し語が、スコアの値「0.825」とともに格納され
る。
【0101】続いて、同様に様々な説明文に対して、検
索を行った後、ステップS109において、検索結果が
ディスプレイに表示されることになるが、その中には、
説明文「dog with very short l
egs」に対応した電子図鑑604の項目が、スコアの
値「0.825」として表示される。
【0102】このように文法的に正しくないクエリを解
析した場合、あるいは、文法的に正しいクエリが入力さ
れても、構文解析で使用する文法ルールに不備があり、
正しく解析できない場合に単語間の関係が一つながりの
連鎖にならなくなっても、すなわち、関係木が一つの木
として構成できず、複数の関係木に分かれたとしても、
クエリの関係木の条件を各関係木の論理積と見なして比
較するので、説明文との一致度を求めることができるこ
とがわかる。また、説明文に対しても、同様に、文法的
に正しくない場合や、文法ルールに不備場ある場合で
も、クエリとの一致度を求めることができる。
【0103】(他の実施例)本実施例では、外部記憶装
置としてCD−ROMから情報検索プログラムおよび関
連データを直接RAM203にロードして実行させる例
を示したが、この他に、CD−ROMから情報検索プロ
グラム、および関連データをいったんHD206に格納
(インストール)しておき、本情報検索プログラムを動
作させる時点で、HD206からRAM203にロード
するようにしてもよい。
【0104】また、本情報検索プログラムを記憶する媒
体は、CD−ROM以外にFD(フロッピー(R)ディ
スク)、ICメモリカード等であってもよい。
【0105】更に、本情報検索プログラムを、ROMに
記憶しておき、これをメモリマップの一部となるように
構成し、直接CPUで実行することも可能である。
【0106】また、以上の説明において、クエリおよび
説明文として使用する言語として、英語を使用した例を
示したが、本発明は英語のみに適用可能な発明ではな
く、日本語を含めたあらゆる言語に適用可能な発明であ
る。
【0107】また、上記実施例では、電子図鑑を例に示
したが、本発明は電子図鑑だけでなく、国語辞書、英和
辞書、和英辞書、百科事典など、見出し語に対して、説
明文が付与されているデータを電子化して格納した物な
ら、なんにでも適用可能である。
【0108】また、上記実施例では、電子図鑑のマルチ
メディア情報として、画像が格納されている例を示した
が、画像以外にも、映像や音声などを格納しておき、メ
ディアに応じて必要な出力装置を使用して、出力するよ
うにしても良い。
【0109】また、上記実施例では、検索結果として出
力する電子図鑑の項目として、スコアの値が0よりも大
きい説明文に対する項目を出力していたが、このしきい
値をオペレータが自由に設定できるようにし、オペレー
タが設定したしきい値よりも大きいスコアの値を持つ説
明文に対応した見出し語のみを、検索結果リストに出力
するようにしても良い。
【0110】また、上記実施例では、電子図鑑には、説
明文のみが格納された例を示したが、説明文をあらかじ
め構文解析した結果を説明文と対応させて格納してお
き、ステップS107で説明文の解析を行う代わりに、
電子図鑑に格納されている説明文の構文解析結果を取り
出すようにしても良い。
【0111】また、上記実施例では、ステップS303
において、説明文に中心語が含まれない場合、ステップ
S307へ進んで、中心語以外の単語に対してもマッチ
ングを行っていたが、この場合にステップS307へ進
む代わりに、ステップS301へ進んで、その中心語を
ルートとする順位ツリーに存在する単語のマッチングは
行わないようにしても良い。また、この場合に、ステッ
プS307へ進む代わりに、ステップS313へ進むよ
うにしても良い。前者の場合は、クエリの中心語が一つ
でも説明文に存在すれば、スコアの値は0より大きくな
り、検索結果リストに出力されるが、後者の場合は、ク
エリの中心語が説明文中に一つでも存在しなければ、検
索結果リストに出力されない。
【0112】また、上記実施例では、ステップS103
において、電子図鑑の見出し語を検索対象とし、検索条
件と見出し語が完全に一致する場合のみ、スコアの値を
1.0として、検索結果リストに出力していたが、その
代わりに、ステップS104からステップS108まで
に示される説明文とクエリとのマッチングのように、ク
エリと見出し語の両方の解析を行った後、ステップS1
08で行うマッチングと同様のマッチングを行った結果
を検索結果リストに出力しても良い。
【0113】
【発明の効果】以上に説明したように、本発明に係る情
報検索方法、情報検索装置、および、記憶媒体によれ
ば、入力された検索条件に対して、見出し語検索と説明
文検索の両方を実行するので、検索の機能を選択する煩
わしさがなくなり、平易に検索ができるようになる。
【図面の簡単な説明】
【図1】 本発明に係る情報検索装置の実施例を示す概
念図
【図2】 本発明に係る情報検索装置の実施例を示すシ
ステム構成図
【図3】 プログラム等が媒体からコンピュータシステ
ムに供給されることを示す図
【図4】 ROMの構成図
【図5】 情報検索プログラム等が記憶されている媒体
の構成図
【図6】 処理プログラム実行時におけるRAM上のメ
モリマップの構造を示す説明図
【図7】 メモリマップ上の電子図鑑の構成図
【図8】 メモリマップ上の単語辞書の構成図
【図9】 メモリマップ上の文法辞書の構成図
【図10】 メモリマップ上の形態素リストの構成図
【図11】 メモリマップ上のロールリストの構成図
【図12】 メモリマップ上の検索結果リストの構成図
【図13】 本発明を実施した場合の表示画面の例を示
す図
【図14】 本発明を実施した情報検索方法のフローチ
ャート
【図15】 言語解析方法のフローチャート
【図16】 マッチング方法のフローチャート
【符号の説明】
101 入力部 102 制御部 103 検索条件解析部 104 説明文解析部 105 説明文検索部 106 見出し語検索部 107 記憶部 108 情報記憶部 109 表示部 201 CPU(中央制御装置) 202 ROM(読み出し専用メモリ) 203 RAM(随時読み出し書き込みメモリ) 204 CD−ROMドライブ 205 CD−ROM 206 HD(ハードデイスク)ドライブ 207 キーボード 208 ディスプレイ 209 マウス 210 プリンタ 211 制御バス 300 コンピュータシステム 400 制御プログラム等が格納されているROMの構
成図 401 ROM中の制御手順プログラム 500 プログラム等が記憶されている媒体の構成図 501 記憶媒体中の情報検索プログラム 502 記憶媒体中の電子図鑑 503 記憶媒体中の単語辞書 504 記憶媒体中の文法辞書 600 プログラムが動作するときのメモリマップ 601 メモリマップ上の基本I/Oプログラム 602 メモリマップ上のOS 603 メモリマップ上の情報検索プログラム 604 メモリマップ上の電子図鑑 605 メモリマップ上の単語辞書 606 メモリマップ上の文法辞書 607 メモリマップ上の形態素リスト 608 メモリマップ上のロールリスト 609 メモリマップ上の検索結果リスト 1301 クエリを人力するテキストボックス 1302 検索を指示するOKボタン 1303 検索結果の電子図鑑の見出しとスコアを表示
する領域 1304 検索結果の電子図鑑の見出しに対応する画像
を表示する領域 1305 検索結果の電子図鑑の見出しに対応する説明
文を表示する領誠 1306 次の検索結果の表示を指示するための次画面
ボタン

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 見出し語に対して、見出し語を自然な言
    葉で説明する説明文を対応させて格納した情報記憶部
    と、 検索条件を人力する検索条件入力工程と、 前記情報記憶部を検索して、前記検索条件入力工程にお
    いて入力された検索条件を満たす見出し語を求める情報
    検索方法において、 前記検索条件入力工程においては、自然な言葉で表現さ
    れる検索条件を入力し、 前記検索条件入力工程によって入力された検索条件を解
    析し、検索条件を構成する単語と各単語間の関係を求め
    る検索条件解析工程と、 前記情報記憶部に格納されている説明文を解析し、説明
    文を構成する単語と各単語間の関係を求める説明文解析
    工程と、 前記情報記憶部の見出し語を検索し、前記検索条件入力
    工程によって入力された検索条件を満たす見出し語を検
    索結果として出力する見出し語検索工程と、 前記検索条件解析工程によって得られた単語および各単
    語間の関係と、前記説明文解析工程によって得られた単
    語および各単語間の関係を比較し、検索条件の単語を含
    み、各単語間の関係もすべて一致する説明文、または、
    検索条件の単語の一部を含み、各単語間の関係も一致す
    る説明文に対応した前記情報記憶部の見出し語を検索結
    果として出力する説明文検索工程を有することを特徴と
    する情報検索方法。
  2. 【請求項2】 前記情報記憶部に格納されている見出し
    語を解析し、見出し語を構成する単語と各単語間の関係
    を求める見出し語解析工程を有し、 見出し語検索工程は、前記検索条件解析工程によって得
    られた単語および各単語間の関係と、前記見出し語解析
    工程によって得られた単語および各単語間の関係を比較
    し、検索条件の単語を含み、各単語間の関係もすべて一
    致する見出し語、または、検索条件の単語の一部を含
    み、各単語間の関係も一致する見出し語を検索結果とし
    て出力することを特徴とする請求項1記載の情報検索方
    法。
  3. 【請求項3】 見出し語に対して、見出し語を自然な言
    葉で説明する説明文を対応させて格納した情報記憶部
    と、 検索条件を入力する検索条件入力手段と、 前記情報記憶部を検索して、前記検索条件入力手段にお
    いて入力された検索条件を満たす見出し語を求める情報
    検索装置において、 前記検索条件入力手段においては、自然な言葉で表現さ
    れる検索条件を入力し、 前記検索条件入力手段によって入力された検索条件を解
    析し、検索条件を構成する単語と各単語間の関係を求め
    る検索条件解析手段と、 前記情報記憶部に格納されている説明文を解析し、説明
    文を構成する単語と各単語間の関係を求める説明文解析
    手段と、 前記情報記憶部の見出し語を検索し、前記検索条件入力
    手段によって入力された検索条件を満たす見出し語を検
    索結果として出力する見出し語検索手段と、 前記検索条件解析手段によって得られた単語および各単
    語間の関係と、前記説明文解析手段によって得られた単
    語および各単語間の関係を比較し、検索条件の単語を含
    み、各単語間の関係もすべて一致する説明文、または、
    検索条件の単語の一部を含み、各単語間の関係も一致す
    る説明文に対応した前記情報記憶部の見出し語を検索結
    果として出力する説明文検索手段を有することを特徴と
    する情報検索装置。
  4. 【請求項4】 前記情報記憶部に格納されている見出し
    語を解析し、見出し語を構成する単語と各単語間の関係
    を求める見出し語解析手段を有し、 見出し語検索手段は、前記検索条件解析手段によって得
    られた単語および各単語間の関係と、前記見出し語解析
    手段によって得られた単語および各単語間の関係を比較
    し、検索条件の単語を含み、各単語間の関係もすべて一
    致する見出し語、または、検索条件の単語の一部を含
    み、各単語間の関係も一致する見出し語を検索結果とし
    て出力することを特徴とする請求項3記載の情報検索装
    置。
  5. 【請求項5】 見出し語に対して、見出し語を自然な言
    葉で説明する説明文を対応させて格納した情報記憶部
    と、 検索条件を入力する検索条件入力工程と、 前記情報記憶部を検索して、前記検索条件入力工程にお
    いて入力された検索条件を満たす見出し語を求める情報
    検索プログラムを記憶した記憶媒体において、 前記検索条件入力工程においては、自然な言葉で表現さ
    れる検索条件を入力し、 前記検索条件入力工程によって入力された検索条件を解
    析し、検索条件を構成する単語と各単語間の関係を求め
    る検索条件解析工程と、 前記情報記憶部に格納されている説明文を解析し、説明
    文を構成する単語と各単語間の関係を求める説明文解析
    工程と、 前記情報記憶部の見出し語を検索し、前記検索条件入力
    工程によって入力された検索条件を満たす見出し語を検
    索結果として出力する見出し語検索工程と、 前記検索条件解析工程によって得られた単語および各単
    語間の関係と、前記説明文解析工程によって得られた単
    語および各単語間の関係を比較し、検索条件の単語を含
    み、各単語間の関係もすべて一致する説明文、または、
    検索条件の単語の一部を含み、各単語間の関係も一致す
    る説明文に対応した前記情報記憶部の見出し語を検索結
    果として出力する説明文検索工程を有することを特徴と
    する情報検索方法をコンピュータに実行させるプログラ
    ムを記憶したコンピュータ読み取り可能な記憶媒体。
  6. 【請求項6】 前記情報記憶部に格納されている見出し
    語を解析し、見出し語を構成する単語と各単語間の関係
    を求める見出し語解析工程を有し、 見出し語検索工程は、前記検索条件解析工程によって得
    られた単語および各単語間の関係と、前記見出し語解析
    工程によって得られた単語および各単語間の関係を比較
    し、検索条件の単語を含み、各単語間の関係もすべて一
    致する見出し語、または、検索条件の単語の一部を含
    み、各単語間の関係も一致する見出し語を検索結果とし
    て出力することを特徴とする情報検索方法をコンピュー
    タに実行させるプログラムを記憶したコンピュータ読み
    取り可能な請求項5に記載の記憶媒体。
JP2001372722A 2001-12-06 2001-12-06 情報検索方法、情報検索装置、および記憶媒体 Withdrawn JP2003173348A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001372722A JP2003173348A (ja) 2001-12-06 2001-12-06 情報検索方法、情報検索装置、および記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001372722A JP2003173348A (ja) 2001-12-06 2001-12-06 情報検索方法、情報検索装置、および記憶媒体

Publications (1)

Publication Number Publication Date
JP2003173348A true JP2003173348A (ja) 2003-06-20

Family

ID=19181560

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001372722A Withdrawn JP2003173348A (ja) 2001-12-06 2001-12-06 情報検索方法、情報検索装置、および記憶媒体

Country Status (1)

Country Link
JP (1) JP2003173348A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580336A (zh) * 2020-12-25 2021-03-30 深圳壹账通创配科技有限公司 信息校准检索方法、装置、计算机设备及可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580336A (zh) * 2020-12-25 2021-03-30 深圳壹账通创配科技有限公司 信息校准检索方法、装置、计算机设备及可读存储介质

Similar Documents

Publication Publication Date Title
JP2810650B2 (ja) 自然言語ドキュメントのセンテンスからセンテンスの部分集合を自動的に抽出する方法及び装置
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US10496756B2 (en) Sentence creation system
US7647303B2 (en) Document processing apparatus for searching documents, control method therefor, program for implementing the method, and storage medium storing the program
JPH1145241A (ja) かな漢字変換システムおよびそのシステムの各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003223437A (ja) 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
US11531693B2 (en) Information processing apparatus, method and non-transitory computer readable medium
JP5737079B2 (ja) テキスト検索装置、テキスト検索プログラム、及びテキスト検索方法
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
JP3847273B2 (ja) 単語分類装置、単語分類方法及び単語分類プログラム
JP4959603B2 (ja) ドキュメントを解析するためのプログラム,装置および方法
JP4935243B2 (ja) 検索プログラム、情報検索装置及び情報検索方法
JP2004246440A (ja) 形態素解析装置、自然言語処理装置、形態素解析方法及びプログラム
JPH0844771A (ja) 情報検索装置
JP5447368B2 (ja) 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム
KR20030006201A (ko) 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템
JP2006227914A (ja) 情報検索装置、情報検索方法、プログラム、記憶媒体
JP2003173348A (ja) 情報検索方法、情報検索装置、および記憶媒体
JP2003196308A (ja) 情報検索方法、情報検索装置及び記録媒体
JP4336403B2 (ja) 情報検索装置及びその方法、コンピュータ可読メモリ
JP4336404B2 (ja) 情報検索装置及びその方法、コンピュータ可読メモリ
JP4074687B2 (ja) 要約文作成支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000090110A (ja) 全文検索方法、装置、および全文検索プログラムを記録した記録媒体
JP2009059290A (ja) 外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム
JP2002366556A (ja) 情報検索方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050301