JPH0612451A - 例文検索システム - Google Patents

例文検索システム

Info

Publication number
JPH0612451A
JPH0612451A JP17046092A JP17046092A JPH0612451A JP H0612451 A JPH0612451 A JP H0612451A JP 17046092 A JP17046092 A JP 17046092A JP 17046092 A JP17046092 A JP 17046092A JP H0612451 A JPH0612451 A JP H0612451A
Authority
JP
Japan
Prior art keywords
word
search
main word
sentence
example sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP17046092A
Other languages
English (en)
Other versions
JP3343941B2 (ja
Inventor
Yukinori Terahama
幸徳 寺濱
Kuniaki Ozawa
邦昭 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP17046092A priority Critical patent/JP3343941B2/ja
Publication of JPH0612451A publication Critical patent/JPH0612451A/ja
Application granted granted Critical
Publication of JP3343941B2 publication Critical patent/JP3343941B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【目的】 例文検索システムに関し、主要語(検索文中
の主語、動詞、目的語を一組と考えたもの)を検索キー
ワードとして、類似な主要語を格納した主要語関連辞書
と、例文とその関連情報を格納した例文データベースを
用いて、検索文に類似な例文を検索する例文検索システ
ムを提供する。 【構成】 入力文(検索文)から、ステップ20で検索
文中の主要語を抽出し、主要語が存在するときには、ス
テップ30で主要語、および検索文の関連情報を検索キ
ーとして設定し、ステップ40では、検索キーに類似な
主要語を主要語関連辞書1710から検索した結果を検
索キーとし、ステップ50で、ステップ40で設定した
検索キーにより、例文データベース180を用いて検索
キーを含む、検索文に類似な例文を検索し、ステップ1
00で検索結果を表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、予め蓄積されている例
文の中から、検索文に類似な文を検索するシステムに係
る。
【0002】
【従来の技術】例文を検索する従来技術が、特開平2−
190972に述べられている。そこでは、例文を構成
する単語毎に品詞分類、表記、品詞種類、活用型、意味
等の文法情報に分類され格納されたテキストデータベー
スを用いて、検索対象を文法的に制約する情報を付加し
た検索キーワードにより、例文を検索するシステムにつ
いて述べられている。
【0003】
【発明が解決しようとする課題】上記従来技術は、例文
を検索するにあたって、柔軟に例文検索を行なうため
に、対象を文法的に制約する情報を付加した1語の検索
キーワードを用いている。ところが、複数の語がひとか
たまりとなって、ある意味をなす場合の類似検索におい
ては、1語のシソーラスによる検索だけでは、必ずしも
的確に検索キーワードに対する類似な例文を検索できな
いか、あるいは、絞り込めないという問題がある。
【0004】本発明の目的は、検索文中において、構文
解析により抽出した主要語(主語、動詞、目的語をまと
めて、主要語と定義する。)を検索キーとして、これら
の検索キーあるいは類似な検索キーを含む例文を検索す
ることにある。
【0005】
【課題を解決するための手段】前記目的は、つまり、主
要語がひとかたまりとなってある意味をなす場合に、そ
の中の1語のキーワードでは、シソーラスをたどったと
しても、類似例文を検索できない場合、検索文の主要語
を意味的に類似な主要語に置き換え、その類似な主要語
を含む例文を検索することによって達成される。
【0006】具体的には、検索文から構文解析により主
要語を抽出し、抽出した主要語と意味的に類似な主要語
とを関連付けて格納した主要語関連辞書を用いて、例文
データベースから例文を検索する。例文の検索は、検索
文からの主要語をキーワードとした検索する。例文の検
索に失敗したときは、主要語関連辞書より検索文の主要
語に意味的に類似な主要語(以下類似な主要語と記す)
を検索し、その検索した主要語を用いて例文データベー
スより例文を検索する。例文検索手順を以下に示す。
【0007】(1)検索文から抽出した主要語を検索キー
として、例文を例文データベースより検索する。検索に
成功したときは、該当する例文を表示装置に表示する。
検索に失敗したときは、検索キーとした主要語に類似な
主要語を主要語関連辞書より検索し、検索した類似な主
要語を新たな検索キーとして、例文データベースより例
文を検索する。類似な主要語を含む例文が例文データベ
ースにない場合は、主要語類似辞書を用いて、字面の異
なる主要語どうしを結び付けることにより、検索文に類
似な例文を例文データベースから検索する。主要語類似
辞書は、検索キーとなる主要語中の1語をシソーラスに
よって、他の主要語中の1語と関連しているという情報
を格納したファイルである。また、検索キーとなる類似
な主要語のほかに関連情報である、例文データベース中
の例文の出典分野や、他の例文との意味的な結び付きな
どを示す拡張情報を用いることにより、検索文に類似な
例文を例文データベースから検索する。
【0008】主要語関連辞書に新たな主要語を追加する
場合は、ユーザに主要語関連辞書中の代表的な主要語で
ある代表語を表示することにより、どの代表語と類似関
係にあるかユーザが選択することによって、主要語関連
辞書に登録する。
【0009】(2)検索キーとなる主要語の中に複合語が
含まれている場合、その複合語を分解して簡単な表現に
置き換えるために、複合語を分解するための情報を格納
した複合表現分解辞書を設けることにより、主要語中の
複合語を分解した簡単な表現の主要語に置き換える。次
に、簡単な表現に置き換えた主要語をもとに、主要語関
連辞書を用いて、検索文に類似な例文を例文データベー
スから検索する。
【0010】(3)検索キーとなりうる主要語が検索文中
に存在しない場合には、例文データベースの関連情報で
ある出典分野や、拡張情報をユーザが検索することによ
り、検索文に類似な例文を例文データベースを用いて検
索する。
【0011】なおかつ検索文に類似な例文を例文データ
ベースから検索できなかった場合は、検索を失敗したこ
とを示すメッセージを表示する。
【0012】
【作用】本発明では、読み込んだ検索文を構文解析し、
主語、動詞、目的語(本明細書では、まとめて主要語と
定義している)を抽出する。ただし、構文解析の結果、
主語、動詞、目的語のいずれかを抽出できない場合であ
っても、抽出した主要語を基にして検索できる。つま
り、検索文より抽出した主要語を検索キーとして設定
し、主要語関連辞書を用いて検索キーとなる主要語と一
致する主要語か、それに類似な主要語を選択して、検索
キーとなる主要語を置き換えることにより、例文データ
ベースから検索キーを含む例文を検索する。検索キー
で、例文を検索できなかった場合には、主要語類似辞書
を用いて検索キーとなる主要語と字面の異なる主要語ど
うしを結び付けることにより、例文データベースから検
索キーを含む例文を検索する。これにより、単に検索文
の各単語に対する類似表現を検索するだけではなく、主
要語という複数語の組み合わせによって表わされる意味
合いに類似な主要語を、主要語関連辞書を用いて検索す
ることができ、検索文と意味的に類似な例文を検索する
ことができる。また、検索文における主要語中に複合語
が含まれる場合は、複合表現分解辞書を用いて複合語を
簡単な表現に置き換えたものを、検索キーとすることに
より、主要語関連辞書内の主要語を膨大に増やすことな
く、例文データベースより例文を検索することができ
る。それでも検索文の主要語に類似な主要語を、主要語
関連辞書から検索できなかった場合は、主要語中の1語
をシソーラスによって、他の主要語と関連づけることに
より、主要語間の字面が一致していなくても類似な例文
を検索できる。また、検索キー以外に、検索文の関連情
報として、出典分野や、他の例文との意味的結び付きを
表わした拡張情報をユーザが付加することにより、例文
データベース中に格納されている出典分野、拡張情報か
ら該当する例文を検索することができる。これにより、
検索キーにおいて主要語が欠落していたとしても、検索
文と意味的に類似な例文を検索することができる。
【0013】以上の例文検索によっても、例文を検索で
きなかった場合は、検索に失敗したことを表示すること
により、ユーザに検索に失敗したことを明確に示すこと
ができる。
【0014】
【実施例】以下、本発明の第1の実施例を図1により説
明する。なお、以下の実施例では、検索文より抽出され
た主要語による例文検索を主として説明する。
【0015】ステップ10では、検索の対象となる検索
文を、図7に示す入力装置110より読み込む。ステッ
プ20では、読み込んだ検索文を構文解析し、主要語
(主語、動詞、目的語)を抽出し、図8に示す主要語抽
出テーブル160の検索文欄1502に検索文を格納
し、主要語欄1503の主語欄1504、動詞欄150
5、目的語欄1506に、それぞれ抽出した主要語を格
納する。その格納状況により、検索文中に主語、動詞、
目的語がそれぞれ存在するかどうかを判定する。ここで
用いる構文解析技術は周知の技術であり、その詳細は例
えば、長尾 真監修、日本語情報処理(社団法人 電子
通信学会)の第5章の構文解析に述べられているので、
ここでは説明を省略する。ただし、ここでは構文解析
を、形態素解析及び多品詞解消を含む広い意味で使う。
ステップ20で主要語が検索文中に存在した場合、ステ
ップ30で抽出した主要語の組み合わせで表現される検
索キーを設定する。その詳細については、図2を用いて
後述する。ステップ40では、ステップ30で設定され
た主要語で表現される検索キーと、検索キーに類似な主
要語を格納した主要語関連辞書1710を用いて検索す
る。なお、主要語関連辞書1710の詳細な構成につい
ては、図13を用いて後述し、ステップ40の詳細につ
いては、図3を用いて後述する。次に、ステップ50で
は、ステップ40において検索した主要語をもとに検索
キーとなる主要語を設定し、あらかじめ例文が格納され
た例文データベース180から、検索文に類似な例文を
検索する。ステップ50の詳細については、図4を用い
て後述する。次に、ステップ60では、ステップ50ま
でで検索文に類似な例文を、例文データベースより検索
できたかどうかを判定する。ステップ60で判定した結
果、検索が成功しなかった場合、ステップ70でステッ
プ40での検索時の検索キーが、1語であるかどうかを
判定する。検索キーが1語である場合には、ステップ9
0で検索が失敗したことをユーザに確認できるように、
図7に示す出力装置130に表示する。一方、ステップ
70において、前記の検索キーが1語でない、つまり2
語以上である場合には、ステップ80で前記の検索キー
中の1語を減らす処理を行なう。ステップ70〜90の
詳細については、図5を用いて後述する。ステップ10
0では、ステップ50で検索した結果を出力装置130
(図7)に出力する。ステップ100の詳細について
は、図6を用いて後述する。
【0016】次に、ステップ30の詳細な説明をする。
図2に示したように、まず、ステップ301において、
検索キーとなる主要語を主要語検索キー格納テーブル1
60(図9)内の主要語格納テーブル1610(図1
1)の主要語欄1612の主語欄1613、動詞欄16
14、目的語欄1615に格納する。次に、ステップ3
02において、検索するための情報として、ステップ3
01で格納した主要語とは別に、新たな情報を追加する
かどうかをユーザに問い合わせる。問い合わせ方法は、
出力装置130と入力装置110とによる通常の物であ
り、説明を省略する。ユーザが情報を追加しなかった場
合には、主要語格納テーブル1610の主要語欄161
2に格納された主要語により、ステップ40、ステップ
50において例文データベース180から検索文に類似
な例文を検索する。ステップ302においてユーザが情
報を追加する場合は、ステップ303で、検索文の関連
情報として出典分野情報を、主要語検索キー格納テーブ
ル160の関連情報格納テーブル1620の出典分野欄
1623に格納する。ステップ304では、ユーザがス
テップ301、ステップ303で主要語検索キー格納テ
ーブルに格納された情報に、検索文に関連する情報をさ
らに追加する場合には、主要語検索キー格納テーブル1
60の主要語格納テーブル1610と関連情報格納テー
ブル1620の出典分野欄1623の各情報により、例
文データベース180から検索文に類似な例文を検索す
る。ステップ304において、ユーザが検索文に関連す
る情報をさらに追加する場合には、ステップ305で、
検索文の関連情報として検索文と他の検索文との意味的
な結び付きを表わした拡張情報を、主要語検索キー格納
テーブル160の関連情報格納テーブル1620の拡張
情報欄1624に格納する。そこで、主要語検索キー格
納テーブル160に格納されている関連情報により、例
文データベース180から検索文に類似な例文を検索す
る。
【0017】主要語関連辞書1710の詳細を説明す
る。図13に示すように、主要語関連辞書1710は、
主要語番号欄1711、関連基準語欄1712、代表語
欄1713、関連語欄1714、例文番号欄1715か
ら構成されている。ここで、関連基準語欄1712に
は、関連する主要語を結び付けるための基準となる語を
格納し、代表語欄1713には、関連する主要語の中で
代表となる語を格納する。関連語欄1714には、代表
語欄1713に格納されている主要語に関連する主要語
を格納する。また、例文番号欄1715には、前記例文
番号欄1715の上段に格納されている主要語を含む例
文が格納されている例文番号を格納する。
【0018】次にステップ40の詳細を図3を用いて説
明をする。ステップ401において主要語検索キー格納
テーブル160の情報は、主要語格納テーブル1610
に格納されている情報のみかどうかを判定する。判定の
結果、主要語格納テーブル情報のみである場合は、ステ
ップ402で、主要語検索キー格納テーブル160の主
要語格納テーブル1610に格納されている、検索文か
ら抽出した主要語と一致する主要語を、主要語関連辞書
1710の関連基準語欄1712と代表語欄1713、
または関連基準語欄1712と関連語欄1714に格納
されている主要語から検索する。一方、ステップ401
において判定の結果、主要語検索キー格納テーブル16
0の情報として、主要語格納テーブル1610に格納さ
れている主要語以外に、関連情報格納テーブル1620
に検索文に関連する情報である出典分野情報や拡張情報
が格納されているときには、ステップ403に行く。ス
テップ403では、主要語検索キー格納テーブル160
の関連情報格納テーブル1620に格納されている、検
索文に関する出典分野情報や拡張情報と、例文データベ
ース180の出典分野欄182、または拡張情報欄18
3に格納されている拡張情報が一致する例文を検索す
る。ステップ404では、ステップ402で検索文から
抽出した主要語と一致する主要語が、主要語関連辞書1
710に存在するかどうか判定する。判定の結果、一致
する主要語が主要語関連辞書1710にある場合には、
ステップ405に進む。一方、一致する主要語が主要語
関連辞書1710にない場合は、ステップ406に進
む。ステップ406では、主要語関連辞書1710の代
表語欄1713に格納されている主要語を表示し、ユー
ザが、検索文から抽出した主要語に関連すると思われる
代表語を指定することにより、検索文から抽出した主要
語が、指定した代表語の類似な主要語として、主要語関
連辞書1710の関連語欄1714に登録する。ステッ
プ405では、検索文から抽出した主要語を含む例文
が、例文データベース180に存在するかどうかを判定
する。判定した結果、抽出した主要語を含む例文が、例
文データベース180の例文欄184に存在する場合
は、ステップ50に行き、検索キーとなる主要語を含む
例文を例文データベース180から検索する。一方、抽
出した主要語を含む例文が、例文データベース180に
存在しない場合は、ステップ407に行く。ステップ4
07では、検索文から抽出した主要語に類似な主要語
を、主要語関連辞書1710を用いて検索する。つま
り、検索文から抽出した主要語の中の1語と一致する語
を、主要語関連辞書1710の関連基準語欄1712に
格納された語から検索する。さらに、抽出した主要語の
他の1語と一致する語を代表語欄1713、および関連
語欄1714に格納された語から検索する。その結果、
次のステップ408では、代表語欄1713、および関
連語欄1714から検索された主要語と同じ列のうち、
類似な主要語で例文番号欄1715に例文番号が格納さ
れているものは、すべて検索文の主要語として主要語検
索キー格納テーブル160の主要語格納テーブル161
0に格納される。格納に当って類似な主要語に関して
は、主要語格納テーブル1610の検索番号欄1611
において、最初の検索番号は共通とし、後の検索番号を
1から順に番号を振ったものを格納することとした。こ
の検索キーを用いて、ステップ50において、検索キー
となる主要語を含む例文を例文データベース180から
検索する。
【0019】次にステップ50の詳細な説明をする。図
4に示したように、まず、ステップ501において主要
語検索キー格納テーブル160の主要語格納テーブル1
610の検索番号欄1611に格納されている検索番号
のうち、最初の番号の共通なものの中で後の番号の小さ
い番号から順に主要語が格納されているかどうかを判定
する。格納されている場合には、格納されている主要語
をもとに、主要語関連辞書1710の例文番号欄171
5に格納されている例文番号を用いて、主要語を含む例
文を例文データベース180より検索する。次に、主要
語検索キー格納テーブル1610において先ほど検索し
た主要語の次の類似な主要語について、再びステップ5
01から処理を繰り返す。ステップ501において、こ
れまで処理を行なってきた主要語とは別の主要語が存在
しないと判定された場合は、ステップ50の処理を終了
し、ステップ60に行く。
【0020】次にステップ70〜ステップ90を図5を
用いて詳細に説明する。まず、ステップ70において、
主要語検索キー格納テーブル160の主要語格納テーブ
ル1610に格納されている検索キーが1語、つまり検
索キーとなる主要語が、1語で構成されているかどうか
を判定する。判定の結果、検索キーが2語以上であった
場合には、ステップ801に行く。ステップ801で
は、主要語検索キー格納テーブル160の主要語格納テ
ーブル1610に格納されている主要語(主語、動詞、
目的語)の中から減らしたい1語をユーザが選択する。
次に、ステップ802において、ステップ801で選択
した1語が誤っていないかどうかを表示し、ユーザに誤
っていないかどうかの確認を促す。もし、ステップ70
1において、選択した1語が誤っていたときは、再度ス
テップ701にもどり、検索キーとなる主要語(主語、
動詞、目的語)の中から削除したい1語をユーザが再び
選択する。ステップ802において選択した1語に誤り
がないときは、ステップ803に行く。ステップ803
では、ステップ801で選択した前記検索キーとなる主
要語の中の1語を削除した主要語を改めて検索キーと
し、主要語検索キー格納テーブル160の主要語格納テ
ーブル1610に格納する。次に、ステップ804で
は、ステップ803で設定した検索キーにより、主要語
関連辞書1710を用いて、例文データベース180か
ら、検索キーを含む例文を検索する。その結果、検索で
きたときは、ステップ70〜ステップ90の処理を終了
し、検索できなかったときは、ステップ805に行く。
ステップ805においては、検索キーとなる主要語(主
語、動詞、目的語)のうち何れの語についても削除した
かどうかを判定する。判定の結果、まだ削除したことの
ない語が、主要語中に存在する場合には、ステップ80
7に行く。ステップ807においては、ステップ805
までに削除した1語を再び復活し、まだ削除したことの
ない主要語中の語を対象にしてステップ801から先ほ
どと同じ処理を行なう。一方、ステップ805におい
て、判定の結果、削除したことのない語が、主要語中に
存在しない場合には、ステップ806に行く。ステップ
806においては、検索キーからステップ801でユー
ザが指定した1語を削除した主要語を、改めて検索キー
として主要語検索キー格納テーブル160の主要語格納
テーブル1610に格納し、再びステップ70から処理
を繰り返す。最初のステップ70において、検索キーと
なる主要語を構成している語(主語、動詞、目的語)が
1語であった場合には、ステップ90に行く。ステップ
90においては、検索文から類似な例文を例文データベ
ース180から、検索できなかったということから、検
索が失敗したことをユーザに表示する処理を行なう。
【0021】以上でステップ70〜ステップ90の詳細
な説明を終え、次にステップ100の詳細な説明をす
る。図6に示したように、まず、ステップ1001にお
いては、検索された主要語を含む例文の例文番号を、主
要語関連辞書1710の例文番号欄1715に格納され
ている例文番号から検索する。次に、ステップ1002
において、ステップ1001で検索した例文番号と一致
する例文を、例文データベース180の主要関連番号欄
181と例文欄184から検索し、呼び出す。次に、ス
テップ1003において、ステップ1001で呼び出し
た例文を、図7の出力装置130により表示させる。
【0022】次に、前記の処理を具体的に説明するため
に、次に示す入力文(検索文)を例として取り上げる。
「A氏は、来月行なわれる市長選挙に落ちるかもしれな
い。」まず、前記入力文に対して構文解析処理を行な
い、主要語を抽出する。前記の検索文の場合、主語は
「A氏」であり、動詞は「落ちる」、目的語は「選挙」
となる。抽出した主要語を主要語抽出テーブル150の
検索文欄1502、主要語欄1504の主語欄150
4、動詞欄1505、目的語欄1506にそれぞれ格納
する。検索番号欄1501には、最初の検索文であると
きは、「1」を格納し、以降の検索文については、順次
番号を増やしていく。次に、主要語抽出テーブル150
に格納された主要語を検索キーとして設定し、主要語検
索キー格納テーブル160の主要語格納テーブル161
0の主要語欄1612の主語欄1613に「A氏」、動
詞欄1614に「落ちる」、目的語欄1615に「選
挙」をそれぞれ格納する。次に、ユーザがさらに検索文
の関連情報を追加するかどうかを判断する。ユーザが主
要語のみで検索文に類似な例文を検索すると判断する
と、主要語検索キー格納テーブル160の主要語格納テ
ーブル1610に格納されている主要語と一致する、主
要語関連辞書1710の関連基準語欄1712に格納さ
れている関連基準語を検索する。検索の結果、主要語関
連辞書1710の主要語番号1に、抽出した主要語と一
致する関連基準語である「選挙」が存在するため、これ
を検索する。次に、関連基準語に関連する代表語、およ
び関連語情報の中から主要語検索キー格納テーブル16
0の主要語格納テーブル1610に格納されている主要
語と一致するものを検索する。前記の検索文の場合、主
要語関連辞書1710の関連語欄1714の中に、主要
語中の1語である「落ちる」が存在するので、まず、こ
れを検索する。次に、検索した関連語欄1714の関連
語情報である「落ちる」に対応する例文番号を、例文番
号欄1715から検索する。検索した結果、例文番号欄
1715に例文番号が格納されている場合には、例文番
号に該当する検索文を例文データベース180より検索
する。関連語である「落ちる」に対応する例文番号が、
例文番号欄1715に格納されていないので、このまま
では、例文を検索できない。そこで、関連語である「落
ちる」に類似な表現として格納されている、主要語関連
辞書1710の代表語欄1713、および関連語欄17
14に格納されている情報のうち、対応する例文番号が
例文番号欄1715に格納されているものについて、全
てを対象に検索を行ない、検索した結果を主要語検索キ
ー格納テーブル160の主要語格納テーブル1610に
順次格納する。前記の検索文の場合、関連語「落ちる」
に類似な主要語で、しかも、例文番号情報が格納されて
いる語としては、代表語欄1713に格納されている
「敗れる」と、同じ関連語欄1714に格納されている
「負ける」がある。これら2つの情報、および関連基準
語情報欄1712に格納されている「選挙」を、主要語
検索キー格納テーブル160の主要語格納テーブル16
10に格納する。そのとき、検索文より抽出した主要語
は不要なため、既に主要語検索テーブル1610の主要
語欄1612に格納されている検索文から抽出した主要
語は削除し、改めて主要語関連辞書1710より検索し
た主要語を格納する。なお、主要語格納テーブル161
0の検索番号欄1611には、最初の番号は共通の番号
を付与し、ハイフンの後の番号については、検索順に番
号を付与した検索番号情報を格納する。以上設定した主
要語をもとに、主要語関連辞書1710に格納された例
文番号を用いて、例文データベース180より前記の検
索文に類似な例文を検索する。すなわち、主要語関連辞
書1710の例文番号欄1715に格納されている例文
番号が、それぞれ1−1−A、1−1−Cであるので、
例文データベース180より主要関連番号欄181に格
納されている例文番号とを照合すると、例文欄184よ
り「彼が選挙に敗れる。」という例文と、「Bさんは、
市議会議員選挙に負けるかもしれない。」という例文が
呼び出される。呼び出された例文は、図7の出力装置1
30に送られ、前記の検索文に類似な例文として表示出
力される。以上が、実際に検索文を入力したときの検索
文に類似な例文を検索する処理内容である。
【0023】次に、本実施例を実現する上でのハードウ
エア構成を図7に示す。入力文(検索文)は、入力装置
110から入力され、例文検索は、CPU120で実行
される。次に、例文検索結果は、出力装置130により
表示される。記憶装置140は、大きく分けて、主要語
抽出テーブル150、主要語検索キー格納テーブル16
0、主要語辞書170、例文データベース180、検索
プログラム190を格納するエリアに分かれる。さら
に、主要語検索キー格納テーブル160は、主要語格納
テーブル1610、関連情報格納テーブル1620から
構成されている。また、主要語辞書170は、主要語関
連辞書1710、複合表現分解辞書1720、主要語類
似辞書1730から構成されている。
【0024】なお、前記複合表現分解辞書1720と主
要語類似辞書1730については、本発明の第2の実施
例以降で詳細に説明する。
【0025】次に、本発明の第2の実施例を図17によ
り説明する。
【0026】ステップ10´〜ステップ30´について
は、実施例1のステップ10〜ステップ30と同じ処理
であるので、ここでは説明を省略する。ステップ30´
の次は、ステップ3000に行く。ステップ3000に
おいては、検索キーとなる主要語中に複合語が含まれて
いる場合、複合表現分解辞書1720により、複合語を
分解して基本的な表現に置き換え、検索文より抽出した
検索キーとなる主要語が格納された、主要語検索キー格
納テーブル160の主要語を再設定しなおす。そこで、
ステップ3000について図18を用いて詳細に説明す
る。まず、ステップ3001においては、検索キーとな
る主要語中に複合語が含まれているかどうかを判定す
る。判定の結果、検索キーとなる主要語中に複合語が含
まれているときには、ステップ3002に行く。ステッ
プ3002においては、検索キーとなる主要語中の複合
語を複合表現分解辞書1720を用いて、基本的な表現
に置き換える。ここで、複合表現分解辞書1720の詳
細を説明する。複合表現分解辞書1720は、大きく分
けて複合語を含む主要語欄1712と、基本的な表現の
主要語欄1722から成り立っており、それぞれ主語欄
1723、1726、動詞欄1724、1727、目的
語欄1725、1728から構成されている。次に、ス
テップ3003では、ステップ3002において基本的
な表現に置き換えた主要語を、主要語検索キー格納テー
ブル160の主要語格納テーブル1610の主要語欄1
612の主語欄1613、動詞欄1614、目的語欄1
615に格納する。以上で、ステップ3000の詳細な
説明を終える。次のステップ40´〜ステップ100´
については、実施例1のステップ40〜ステップ100
と同じ処理あるので、ここでは説明を省略する。
【0027】次に、前記の実施例2の処理を具体的に説
明するために、次に示す入力文(検索文)を例として取
り上げる。「彼は、来週行なわれる市議会議員選挙に、
落選するだろう。」まず、前記入力文に対して構文解析
処理を行ない、主要語を抽出する。この場合、主語は
「彼」であり、動詞は「落選する」、目的語は「市議会
議員選挙」となる。次に、主要語抽出テーブル150の
検索文欄1502に前記入力した検索文を格納し、主要
語欄1503の主語欄1504、動詞欄1505、目的
語欄1506に主要語をそれぞれ格納する。次に前記抽
出した主要語中に、複合語が含まれているかどうかを判
定する。判定の結果、主要語中には複合語「落選する」
が存在するので、複合表現分解辞書150を用いて複合
語を基本的な表現に置き換える。つまり、複合語を含む
主要語欄1721の動詞欄1724に格納されている
「落選する」から、基本的な表現の主要語欄1722の
動詞欄1727に格納されている「落ちる」と目的語欄
1728に格納されている「選挙」を参照する。そし
て、複合語「落選する」を「落ちる」と「選挙」に置き
換える。さらに、検索文から抽出し、主要語検索キー格
納テーブル160の主要語格納テーブル1610に格納
された主要語から、複合語を基本的な表現に置き換えた
主要語に置き換えて、主要語格納テーブル1610に格
納する。以上の処理により検索キー格納テーブル160
の主要語格納テーブル1610に格納された主要語をも
とに、主要語関連辞書1710を用いて検索文に類似な
例文を検索する。なお、主要語を用いて例文データベー
ス180より例文を検索する場合については、実施例1
で示した入力文(検索文)の例の場合と同様であるの
で、ここでは説明を省略する。例文データベース180
より検索の結果、検索文に類似な例文は、例文欄184
より「彼が選挙に敗れる。」という例文と、「Bさん
は、市議会議員選挙に負けるかもしれない。」という例
文となる。以上の例文は、図7の出力装置130に表示
される。
【0028】次に、本発明の第3の実施例を図19によ
り説明する。
【0029】ステップ10´´〜ステップ40´´につ
いては、実施例1のステップ10〜ステップ40と同じ
処理であるので、ここでは説明を省略する。次に、ステ
ップ4100では、ステップ40´´で設定した検索キ
ーとなる主要語が、主要語関連辞書1710に格納され
ているかどうかを判定する。判定の結果、検索できなか
ったときは、ステップ4200に行く。ステップ420
0においては、主要語類似辞書1730を用いて検索キ
ーの類似語を検索する。ここで、主要語類似辞書173
0は、シソーラスにおいて上位概念にくる語を基準語と
して、基準語欄1731に格納されており、基準語に属
する類似語が、類似語欄1732に格納されている。つ
まり、ステップ4200においては、検索キーとなる主
要語中の1語と一致する語を類似語欄1732に格納さ
れている類似語から検索し、検索された類似語の上位概
念にあたる語を、基準語欄1731に格納されている基
準語から検索する。さらに、格納されていた検索キーと
なる主要語で、主要語類似辞書1730を用いて検索を
行なった語を、検索された基準語に置き換える。次に、
ステップ4300においては、ステップ4200におい
て、類似語から基準語が検索できたかどうかを判定す
る。判定の結果、結局上位概念となる基準語を検索でき
なかったときは、ステップ4400に行く。ステップ4
400においては、主要語関連辞書1710の関連基準
語欄1712と代表語欄1713に、それぞれ主要語中
の1語を格納する。以上ステップ4400で更新した主
要語関連辞書1730をもとに、再度ステップ40´´
からの処理を繰り返す。一方、ステップ4300におい
て、判定の結果、検索できたときは、前記置き換えられ
た検索キーとなる主要語をもとに、再度ステップ40´
´からの処理を繰り返す。ところで、ステップ4100
において、主要語類似辞書1730を用いることなく検
索キーとなる主要語に類似な主要語を、主要語関連辞書
1710より検索できたときは、ステップ50´´に行
く。なお、ステップ50´´〜ステップ100´´につ
いても、実施例1のステップ50〜ステップ100と同
じ処理であるので、ここでは説明を省略する。
【0030】次に、前記の実施例3の処理を具体的に説
明するために、次に示す入力文(検索文)を例として取
り上げる。「Cさんは、市議選に敗れるだろう。」ま
ず、前記入力文に対して構文解析処理を行ない、主要語
を抽出する。この場合、主語は「Cさん」であり、動詞
は「落選する」、目的語は「市議選」となる。これら検
索文と主要語を主要語抽出テーブル150の検索文欄1
502に前記入力した検索文を格納し、主要語欄150
3の主語欄1504、動詞欄1505、目的語欄150
6にそれぞれ格納する。次に、主要語関連辞書1710
を用いて類似な主要語を検索する。前記の検索文の場
合、主要語関連辞書1710の関連基準語欄1712に
格納されている関連基準語の中に、一致するものが存在
しないために、主要語類似辞書1730を用いて、検索
キーとなる主要語中の1語の類似語を検索する。前記の
検索文の場合、検索キーとなる主要語中の目的語である
「市議選」について、主要語類似辞書1730を用い
て、上位概念である基準語を検索する。検索の結果、目
的語「市議選」の上位概念となる語は、基準語欄173
1に格納されている「選挙」であるので、検索キーとな
る主要語のうち目的語である「市議選」を「選挙」に置
き換える。次に、置き換えた主要語を主要語検索キー格
納テーブル160の主要語格納テーブル1610に格納
し、主要語関連辞書1710を用いて検索文に類似な例
文を検索する。なお、主要語を用いて例文データベース
180より例文を検索する場合については、実施例1で
示した入力文(検索文)の例の場合と同様であるので、
ここでは説明を省略する。例文データベース180より
検索の結果、検索文に類似な例文は、例文欄184より
「彼が選挙に敗れる。」という例文と、「Bさんは、市
議会議員選挙に負けるかもしれない。」という例文とな
る。以上の例文は、図7の出力装置130に表示され
る。
【0031】次に、本発明の第4の実施例を図20によ
り説明する。
【0032】ステップ10´´´〜ステップ100´´
´については、実施例1のステップ10〜ステップ10
0と同じ処理であるので、ここでは説明を省略する。た
だし、ステップ30´´´は、前記実施例1のステップ
30とは異なり、主要語の組み合わせのみによる検索キ
ーの設定を行なう。一方、ステップ20´´´におい
て、検索文中に主要語である主語、動詞、目的語のいず
れも存在しないとき、ステップ5100に行く。ステッ
プ5100においては、検索キー格納テーブル160の
関連情報格納テーブル1620に、検索文の関連情報と
して出典分野情報と、他の例文との意味的な結び付きを
示す拡張情報を関連情報欄1622の出典分野欄162
3の分野欄1625や、詳細情報欄1626、拡張情報
欄1624に格納する。次に、ステップ5200におい
ては、関連情報格納テーブル1620に格納された検索
文の関連情報である出典分野情報と拡張情報を呼び出
す。次に、ステップ5300において、ステップ520
0で呼び出した関連情報を検索キーとして、前記の検索
キーと同じ関連情報を例文データベース180の出典分
野欄182、および拡張情報欄183に持つ例文を、例
文欄184より検索する。その結果、ステップ5400
において、例文検索が成功したときには、ステップ10
0´´´において、例文検索結果を表示し、検索に失敗
したときは、ステップ90´´´において、検索失敗の
表示を行なう。
【0033】次に、前記の実施例4の処理を具体的に説
明するために、次に示す入力文(検索文)を例として取
り上げる。「こんにちは。」まず、入力文に対して構文
解析処理を行ない、主要語を抽出する。しかし、前記検
索文の場合、主要語を抽出するのは不可能であるため、
前記検索文には、主要語である主語、動詞、目的語を主
要語抽出テーブル150に格納することができない。つ
まり、検索文中に主要語が存在しないことになる。そこ
で、前記検索文に関連する情報である出典分野、拡張情
報を、前記主要語検索キー格納テーブル160の関連情
報格納テーブル1620の出典分野欄1623の分野欄
1625には、「あいさつ」を格納し、詳細情報欄16
26には、例えば「人の家を訪問するとき」、拡張情報
欄1624には「昼間に使う表現」をそれぞれ格納す
る。次に、格納した関連情報を検索キーとして、例文デ
ータベース180を用いて検索文に関連する例文を検索
する。その結果、例文データベース180の出典分野情
報欄182に、前記検索キーと同じ「人の家を訪問する
とき」が格納されていることから、例文欄184に格納
されている「ごめんください。」が検索され、呼び出さ
れる。検索された例文は、図7の出力装置130に表示
される。
【0034】
【発明の効果】本発明においては、検索文より抽出した
主要語(主語、動詞、目的語)に類似な主要語を、主要
語関連辞書を用いて検索することにより、その類似な主
要語を含む例文を検索可能とした。つまり、検索文より
主要語を抽出し、その主要語を含む例文を例文デーベー
スを用いて検索する。抽出した主要語を含む例文が、例
文データベースに存在しないときは、検索文より抽出し
た主要語に類似な主要語を、主要語関連辞書を用いて検
索することにより、その類似な主要語を含む、検索文と
意味的に類似な例文を例文データベースを用いて検索可
能とした。また、検索文より主要語が抽出できないとき
は、検索文の関連情報から例文データベースを用いて、
検索文に関連する例文を検索することも可能とした。
【図面の簡単な説明】
【図1】第1の実施例を示す流れ図である。
【図2】ステップ30の詳細図である。
【図3】ステップ40の詳細図である。
【図4】ステップ50の詳細図である。
【図5】ステップ70〜ステップ90の詳細図である。
【図6】ステップ100の詳細図である。
【図7】実施例のハードウエア構成図である。
【図8】主要語抽出テーブルの構成である。
【図9】主要語検索キー格納テーブルである。
【図10】主要語辞書である。
【図11】主要語格納テーブルの構成である。
【図12】関連情報格納テーブルの構成である。
【図13】主要語関連辞書の構成である。
【図14】複合表現分解辞書の構成である。
【図15】主要語類似辞書の構成である。
【図16】例文データベースの構成である。
【図17】第2の実施例を示す流れ図である。
【図18】ステップ3000の詳細図である。
【図19】第3の実施例を示す流れ図である。
【図20】第4の実施例を示す流れ図である。
【符号の説明】
30…主要語および検索文の関連情報により検索キーを
設定する処理、40…検索キーとなる主要語に類似な主
要語を主要語関連辞書より検索する処理、50…検索キ
ーとなる主要語を含む例文を例文データベースから検索
する処理、110…入力装置、120…CPU、130
…出力装置、140…記憶装置、150…主要語検索テ
ーブル、160…主要語検索キー格納テーブル、170
…主要語辞書、1710…主要語関連辞書、1720…
複合表現分解辞書、1730…主要語類似辞書、180
…例文データベース、190…検索プログラム、300
0…複合語を複合表現分解辞書により基本的な表現に変
換する処理、4200…主要語類似辞書より主要語の類
似語をシソーラス検索する処理、5100…検索文の関
連情報を検索キーとして設定する処理、5300…検索
キーとなる関連情報から検索文に関連する例文を例文デ
ータベースより検索する処理。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】例文を格納した例文データベースと、検索
    文から抽出した、主語、動詞および目的語からなる主要
    語を検索キーとして格納した主要語格納テーブルと、類
    似した主要語を格納した主要語関連辞書ファイルと、前
    記検索キーとなる主要語に類似した主要語を前記主要語
    関連辞書から検索する手段と、前記類似した主要語に一
    致した例文の主要語を、前記例文データベースから検索
    する手段とからなる例文検索システム。
  2. 【請求項2】請求項1記載の例文検索システムにおい
    て、前記主要語関連辞書中で意味的に代表となる主要語
    を表示する手段を設けた例文検索システム。
  3. 【請求項3】請求項1記載の例文検索システムにおい
    て、前記例文データベースは例文に関連する出典分野情
    報を有し、前記検索文の出典分野情報と同じ出典分野情
    報を有する例文を検索する手段を設けた例文検索システ
    ム。
  4. 【請求項4】請求項1記載の例文検索システムにおい
    て、検索文に関連して、他の例文との意味的な結び付き
    を表わした拡張情報を付加できるファイルと、前記例文
    データベースに例文に関連した拡張情報を付加した例文
    データベースを用いて、前記検索文と同じ関連情報を検
    索する手段とを設けた例文検索システム。
  5. 【請求項5】請求項1記載の例文検索システムにおい
    て、検索文の主要語に複合語が含まれる場合、前記複合
    語を分解するための情報を格納した複合表現分解辞書フ
    ァイルと、検索文の主要語を前記複合表現分解辞書より
    簡単な表現に置き換える手段と、置き換えた主要語に類
    似した主要語を、前記主要語関連辞書から検索する手段
    と、前記類似した主要語に一致した例文の主要語を、前
    記例文データベースから検索する手段とを設けた例文検
    索システム。
  6. 【請求項6】請求項1記載の例文検索システムにおい
    て、シソーラスによって、主要語中の1語を、他の主要
    語中の1語と関連しているという情報を格納した主要語
    類似辞書ファイルとを設けた例文検索システム。
JP17046092A 1992-06-29 1992-06-29 例文検索システム Expired - Fee Related JP3343941B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17046092A JP3343941B2 (ja) 1992-06-29 1992-06-29 例文検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17046092A JP3343941B2 (ja) 1992-06-29 1992-06-29 例文検索システム

Publications (2)

Publication Number Publication Date
JPH0612451A true JPH0612451A (ja) 1994-01-21
JP3343941B2 JP3343941B2 (ja) 2002-11-11

Family

ID=15905353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17046092A Expired - Fee Related JP3343941B2 (ja) 1992-06-29 1992-06-29 例文検索システム

Country Status (1)

Country Link
JP (1) JP3343941B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007287256A (ja) * 2006-04-18 2007-11-01 Matsushita Electric Ind Co Ltd プレイリスト検索装置およびプレイリスト検索方法
JP2012174239A (ja) * 2011-02-24 2012-09-10 Jvc Kenwood Corp 閲覧情報生成装置および閲覧情報生成方法
JP5723067B1 (ja) * 2014-02-04 2015-05-27 株式会社Ubic データ分析システム、データ分析方法、および、データ分析プログラム
JP2015149085A (ja) * 2015-03-26 2015-08-20 株式会社Ubic データ分析システム、データ分析方法、および、データ分析プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007287256A (ja) * 2006-04-18 2007-11-01 Matsushita Electric Ind Co Ltd プレイリスト検索装置およびプレイリスト検索方法
JP2012174239A (ja) * 2011-02-24 2012-09-10 Jvc Kenwood Corp 閲覧情報生成装置および閲覧情報生成方法
JP5723067B1 (ja) * 2014-02-04 2015-05-27 株式会社Ubic データ分析システム、データ分析方法、および、データ分析プログラム
WO2015118617A1 (ja) * 2014-02-04 2015-08-13 株式会社Ubic データ分析システム、データ分析方法、および、データ分析プログラム
JP2015149085A (ja) * 2015-03-26 2015-08-20 株式会社Ubic データ分析システム、データ分析方法、および、データ分析プログラム

Also Published As

Publication number Publication date
JP3343941B2 (ja) 2002-11-11

Similar Documents

Publication Publication Date Title
US7343371B2 (en) Queries-and-responses processing method, queries-and-responses processing program, queries-and-responses processing program recording medium, and queries-and-responses processing apparatus
US5523945A (en) Related information presentation method in document processing system
US7599828B2 (en) Grammatically correct contraction spelling suggestions for french
EP0378848A2 (en) Method for use of morphological information to cross reference keywords used for information retrieval
JPH0877173A (ja) 文字列修正システムとその方法
JPH02299068A (ja) 入力文字列からワードを分離する方法
JPH1153384A (ja) キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
EP0524694B1 (en) A method of inflecting words and a data processing unit for performing such method
JP2005038395A (ja) データベース検索装置
US5357430A (en) System for text translation
JP3565239B2 (ja) 情報検索装置
JPH08314947A (ja) キーワード自動抽出装置
JP3343941B2 (ja) 例文検索システム
JP3380034B2 (ja) 辞書編集装置
JPH09319767A (ja) 類義語辞書登録方法
JPH05250416A (ja) データベースの登録・検索装置
JPS61248160A (ja) 文書情報登録方式
JPS61187077A (ja) 日本語解析装置
JP3187671B2 (ja) 電子辞書表示装置
JP3360261B2 (ja) 自然語解析装置
JPS6389976A (ja) 言語解析装置
JPH04330565A (ja) 自然言語処理システム
JPH04123264A (ja) 関連語テーブル作成装置及び文書検索装置
JPH05342273A (ja) 例文検索システム
JPH03161865A (ja) 文章の検索方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070830

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees