JPH03161865A - 文章の検索方法 - Google Patents
文章の検索方法Info
- Publication number
- JPH03161865A JPH03161865A JP1300916A JP30091689A JPH03161865A JP H03161865 A JPH03161865 A JP H03161865A JP 1300916 A JP1300916 A JP 1300916A JP 30091689 A JP30091689 A JP 30091689A JP H03161865 A JPH03161865 A JP H03161865A
- Authority
- JP
- Japan
- Prior art keywords
- search
- semantic structure
- retrieving
- noun
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title description 13
- 230000014509 gene expression Effects 0.000 abstract description 5
- 238000012549 training Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 5
- 238000002910 structure generation Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[概 要]
文章を検索キーとして入力して類似した文章を検索する
方法に関し、 僅かに異なる表現のため選に洩れたり、意味の異なる文
章が選ばれることを防止することを目的とし、 文章を該文章内の複数の名詞的概念とそれらの名詞的概
念相互の関係を定義付けた意味構造の形式で格納したデ
ータベースを具備し、入力された検索キーの文字列を解
析して、該文字列中の複数の名詞的概念とそれらの名詞
相互の関係を示す意味構造に変換する検索キー解析部と
、上記検索キー解析部によって生成された意味構造の名
詞的概念を検索キーとして前記データベースを検索し名
詞的概念間の関係が等しい文章を候補として出力する検
索機構とを具備することにより構或する。
方法に関し、 僅かに異なる表現のため選に洩れたり、意味の異なる文
章が選ばれることを防止することを目的とし、 文章を該文章内の複数の名詞的概念とそれらの名詞的概
念相互の関係を定義付けた意味構造の形式で格納したデ
ータベースを具備し、入力された検索キーの文字列を解
析して、該文字列中の複数の名詞的概念とそれらの名詞
相互の関係を示す意味構造に変換する検索キー解析部と
、上記検索キー解析部によって生成された意味構造の名
詞的概念を検索キーとして前記データベースを検索し名
詞的概念間の関係が等しい文章を候補として出力する検
索機構とを具備することにより構或する。
[産業上の利用分野コ
本発明は、データベースからの文章の検索方法に関し、
特に、検索キーで表現される意味と類似する文章を高い
精度で検索する方法に係る。
特に、検索キーで表現される意味と類似する文章を高い
精度で検索する方法に係る。
[従来の技術]
文1;t↑I11報に対ずるti7報検索シスデA9、
用例データベースを持つ英文作或支援システムなどでは
、利用者が指定した検索キーの表現する意味と類似する
内容を有する文章を検索する必要がある。
用例データベースを持つ英文作或支援システムなどでは
、利用者が指定した検索キーの表現する意味と類似する
内容を有する文章を検索する必要がある。
従来、このような文章の検索方法としては、文章を単語
単位に分割してデータベース化しておき、各単語を見出
しとする索引を設けて、人が指定した検索キーを含む文
章を検索する方法がとられていた。
単位に分割してデータベース化しておき、各単語を見出
しとする索引を設けて、人が指定した検索キーを含む文
章を検索する方法がとられていた。
この方法では、例えば「情報検索」などの連11を指足
した場合、データベース中では、「情報」と「検索」が
分かれていることがあり、求める結果が得られないこと
がある。
した場合、データベース中では、「情報」と「検索」が
分かれていることがあり、求める結果が得られないこと
がある。
− 3
そこで、検索キーを予め自動的に単語に分割して、その
上で検索を実施ずるなどの工夫がなされていた。
上で検索を実施ずるなどの工夫がなされていた。
例えば、上述の例では、検索キーとして「情報検索」が
入力されたとき、これを「情報」と「検索」と言う二つ
の単語に分割して、それぞれの単語をキーとして検索す
る。これにより前述のようにデータベース中で「情報」
と「検索」が分かれていても、結果が得られることにな
る。
入力されたとき、これを「情報」と「検索」と言う二つ
の単語に分割して、それぞれの単語をキーとして検索す
る。これにより前述のようにデータベース中で「情報」
と「検索」が分かれていても、結果が得られることにな
る。
しかし、このような従来の方法では、検索+一に含まれ
る単語と一致する文字列を含む文章は検索できても、求
める結果以外の情報(ノイズ)が出力されたり、わずか
な表現の違いで類似の意味の文章が検索結果からもれて
しまうということが生ずる。
る単語と一致する文字列を含む文章は検索できても、求
める結果以外の情報(ノイズ)が出力されたり、わずか
な表現の違いで類似の意味の文章が検索結果からもれて
しまうということが生ずる。
例えば、「情報」と「検索」を含む文章として「情報を
検索する」、「必要な情報を得るために検索を行なう」
・・・・・・等の文章は当然検索されるし、その意味も
至当であると言えるが、「情報」と「検索」と言う単語
を両方含んでい一 4 ても、「検索された情報」、「検索のためのキーとなる
べき情報jなどは所望する結果とは異なる。
検索する」、「必要な情報を得るために検索を行なう」
・・・・・・等の文章は当然検索されるし、その意味も
至当であると言えるが、「情報」と「検索」と言う単語
を両方含んでい一 4 ても、「検索された情報」、「検索のためのキーとなる
べき情報jなどは所望する結果とは異なる。
また、「ソートして情報を求める」と言う文章は「情報
検索」と意味が類似しているが「検索」と言う単語が含
まれていないから選ばれない可能性が大きい。
検索」と意味が類似しているが「検索」と言う単語が含
まれていないから選ばれない可能性が大きい。
木発1リj1よ、このような従来の問題点に鑑み、検索
キーと同一の単語が含まれている文章であっても、その
指向する意味が異なるものは排除し、一方、表現が異な
っていても、同一あるいは類似の意味を有する文章を検
索することのできる方法を捉供することを「1的として
いる。
キーと同一の単語が含まれている文章であっても、その
指向する意味が異なるものは排除し、一方、表現が異な
っていても、同一あるいは類似の意味を有する文章を検
索することのできる方法を捉供することを「1的として
いる。
[課題を解決するための手段]
本発明によれば上述の目的は、前記、特許請求の範囲に
記載した手段により達或される。すなわち、本発明は、
文章を該文章内の複数の名詞的概念とそれらの名詞的概
念相互の関係を定義付けた意味構造の形式で格納したデ
ータベースを具備し、入力された検索キーの文字列を解
析して、該文字列中の複数の名詞的概念とそれらの名詞
相互の関係を示す意味構造に変換する検索キー解析部と
、上記検索キー解析部によって生或された意味構造の名
詞的概念を検索キーとして前記データベースを検索し名
詞的概念間の関係が等しい文章を候補として出力する検
索機構とを具備する文章の検索方法により達戒される。
記載した手段により達或される。すなわち、本発明は、
文章を該文章内の複数の名詞的概念とそれらの名詞的概
念相互の関係を定義付けた意味構造の形式で格納したデ
ータベースを具備し、入力された検索キーの文字列を解
析して、該文字列中の複数の名詞的概念とそれらの名詞
相互の関係を示す意味構造に変換する検索キー解析部と
、上記検索キー解析部によって生或された意味構造の名
詞的概念を検索キーとして前記データベースを検索し名
詞的概念間の関係が等しい文章を候補として出力する検
索機構とを具備する文章の検索方法により達戒される。
[作 用]
第1図は、本発明の原理を説明する図である。
同図において、検索キー解析手段2は、検索キー1の文
字列を解析して検索キー意味構造3に変換するものであ
る。
字列を解析して検索キー意味構造3に変換するものであ
る。
検索機構4は、検索キー意味構造3に一致する文章表現
をデータベース5から検索するものである。この検索を
可能とするために、データベース5中の文章は、単なる
文字列ではなく、データベース5に格納すべき文章を予
め検索キー解析手段2と同様の方法により解析して、検
索キー意味構造3と同様の形式に加工しておく。
をデータベース5から検索するものである。この検索を
可能とするために、データベース5中の文章は、単なる
文字列ではなく、データベース5に格納すべき文章を予
め検索キー解析手段2と同様の方法により解析して、検
索キー意味構造3と同様の形式に加工しておく。
利用者が検索キー1を入力すると、検索キー解析手段2
は、検索キー1中の文字列を解析し単語に分解する。
は、検索キー1中の文字列を解析し単語に分解する。
次に、単語間の意味関係に基づいて、一般に機械翻訳シ
スデムの原文解析段階で用いられている方法などを用い
て、検索;1一一の意味構進3をつくり出ず。
スデムの原文解析段階で用いられている方法などを用い
て、検索;1一一の意味構進3をつくり出ず。
検索キー意味構造3は、検索キーlに含まれる名詞的概
念と、それらの概念相互の関係とで表わされる。
念と、それらの概念相互の関係とで表わされる。
方、データベース5中の文H;7.も、,叙味4+77
iの形式で格納されており、文章中に含まれる名詞的
概念をキーとして転置ファイルなどの方式で索引付けさ
れている。
iの形式で格納されており、文章中に含まれる名詞的
概念をキーとして転置ファイルなどの方式で索引付けさ
れている。
検索機構4では、検索キー意味構造3中の名詞的概念を
キーとしてデータベース5を検索し、抽出した文章のそ
れぞれに対して、概念間の関係が検索キー意味構造3に
おける関係と等しい7 か否かを検査し、検索結果6として出力する。
キーとしてデータベース5を検索し、抽出した文章のそ
れぞれに対して、概念間の関係が検索キー意味構造3に
おける関係と等しい7 か否かを検査し、検索結果6として出力する。
このとき、等しくないものは検索結果から除外する。
[実施例]
第2図は本発明の一実施例を示す図であって、7は検索
キー、8は検索キー解析部、9は意味構造生成部、IO
は検索部、llはデータベース、l2は検索結果格納部
、13は比較部、l4はディスプレイ画面を表わしてい
る。
キー、8は検索キー解析部、9は意味構造生成部、IO
は検索部、llはデータベース、l2は検索結果格納部
、13は比較部、l4はディスプレイ画面を表わしてい
る。
同図において、利用者が「要員育或」という検索キー7
を入力すると検索キー解析部8が解析を11なう。
を入力すると検索キー解析部8が解析を11なう。
意味構造生或部9は、上記解析結果より「要員育或」と
言う検索キーについての意味構造を生成する。この例で
は、概念間の関係については、「要員」と言う概念が「
育戊」と言う概念の対象になっていることが表現されて
いる。また、「育成」については「育てる」と言う概念
が同義語であることも表現されている。
言う検索キーについての意味構造を生成する。この例で
は、概念間の関係については、「要員」と言う概念が「
育戊」と言う概念の対象になっていることが表現されて
いる。また、「育成」については「育てる」と言う概念
が同義語であることも表現されている。
8
一方、データベース1lには、「新規要員の育或」、「
要員を育てる」、「新入社員を育或する要員」等の文章
が登録されているが、これらは、それぞれ第3図に示す
ように意味構造を伴っている。
要員を育てる」、「新入社員を育或する要員」等の文章
が登録されているが、これらは、それぞれ第3図に示す
ように意味構造を伴っている。
すなわち、「新規要員の育戊」については、同図(a)
に示すように、「育或」の対象が「要員」であり、「要
員」は「新規」と言う属性を有していることが、また、
「要員を育てる」については、同図(b)に示すように
「育てる」の対象が「要員」であることが、更に、「新
人社員を育或する要員」については同図(C)に示すよ
うに「育戒」の対象が「新人社員」であり、また、「育
成」の主体が「要員」であることが、それぞれ記されて
いる。
に示すように、「育或」の対象が「要員」であり、「要
員」は「新規」と言う属性を有していることが、また、
「要員を育てる」については、同図(b)に示すように
「育てる」の対象が「要員」であることが、更に、「新
人社員を育或する要員」については同図(C)に示すよ
うに「育戒」の対象が「新人社員」であり、また、「育
成」の主体が「要員」であることが、それぞれ記されて
いる。
第2図の検索部10は、「要員」、「育戊」を検索キー
としてデータベースを検索することにより「要員」 「
育或(育てる)」などの名詞的概念を含む前述のような
文章「新規要員の育戊」、「要員を育てる」、「新人社
員を育或する要員」等を抽出し、これを検索結果格納部
l2に一旦格納する。比較部13は、これらの抽出され
た文章の意味構造を、検索キーの意味構造と比較し、一
致するものを候補として出力する。
としてデータベースを検索することにより「要員」 「
育或(育てる)」などの名詞的概念を含む前述のような
文章「新規要員の育戊」、「要員を育てる」、「新人社
員を育或する要員」等を抽出し、これを検索結果格納部
l2に一旦格納する。比較部13は、これらの抽出され
た文章の意味構造を、検索キーの意味構造と比較し、一
致するものを候補として出力する。
このとき、「新入社員を育戊する要員」については「要
員」が「育戒」の対象ではなく意味構造が異なることか
ら、検索結果からは除外される。
員」が「育戒」の対象ではなく意味構造が異なることか
ら、検索結果からは除外される。
このようにして最終的に得られた結果は、例えば、第2
図のディスプレイ画面l4に表わされているように表示
する。
図のディスプレイ画面l4に表わされているように表示
する。
第4図は上記実施例の動作を流れ図として示したもので
ある。
ある。
同図において、英字符八で示す「キーワードの抽出」は
検索キーを解析して生成した意味構造の中から名詞的概
念を抽出してデータベース検索のためのキーワードとす
るものである。
検索キーを解析して生成した意味構造の中から名詞的概
念を抽出してデータベース検索のためのキーワードとす
るものである。
また、英字符Bで示す点線で囲んだ部分の処理は検索結
果の個数だけ反復して行なう。
果の個数だけ反復して行なう。
[発明の効果]
以上説明したように本発明の方法によれば、検索キーと
一致する文字列を含む文章であっても、意味構造の異な
るものを誤って検出することを防ぐことができる利点が
ある。
一致する文字列を含む文章であっても、意味構造の異な
るものを誤って検出することを防ぐことができる利点が
ある。
更に、検索キーに完全に一致する文字列を含む文章のみ
でなく、意味的に類似した文章まで検索することができ
るから、情報検索システl、や英文作戊システムなどの
性能向上に寄与するところが大きい。
でなく、意味的に類似した文章まで検索することができ
るから、情報検索システl、や英文作戊システムなどの
性能向上に寄与するところが大きい。
第l図は本発明の原理を説明する図、第2図は本発明の
一実施例を示す図、第3図は意味構造の例を示す図、第
4図は実施例の動作を示す流れ図である。
一実施例を示す図、第3図は意味構造の例を示す図、第
4図は実施例の動作を示す流れ図である。
Claims (1)
- 【特許請求の範囲】 文章を該文章内の複数の名詞的概念とそれらの名詞的概
念相互の関係を定義付けた意味構造の形式で格納したデ
ータベースを具備し、 入力された検索キーの文字列を解析して、該文字列中の
複数の名詞的概念とそれらの名詞相互の関係を示す意味
構造に変換する検索キー解析部と、 上記検索キー解析部によって生成された意味構造の名詞
的概念を検索キーとして前記データベースを検索し名詞
的概念間の関係が等しい文章を候補として出力する検索
機構とを具備することを特徴とする文章の検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1300916A JPH03161865A (ja) | 1989-11-21 | 1989-11-21 | 文章の検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1300916A JPH03161865A (ja) | 1989-11-21 | 1989-11-21 | 文章の検索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03161865A true JPH03161865A (ja) | 1991-07-11 |
Family
ID=17890674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1300916A Pending JPH03161865A (ja) | 1989-11-21 | 1989-11-21 | 文章の検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03161865A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100440906B1 (ko) * | 2001-02-15 | 2004-07-19 | 전석진 | 문서 색인 시스템 및 그 방법 |
JP2011175568A (ja) * | 2010-02-25 | 2011-09-08 | Mitsubishi Electric Corp | 文書間距離算出器および文章検索器 |
-
1989
- 1989-11-21 JP JP1300916A patent/JPH03161865A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100440906B1 (ko) * | 2001-02-15 | 2004-07-19 | 전석진 | 문서 색인 시스템 및 그 방법 |
JP2011175568A (ja) * | 2010-02-25 | 2011-09-08 | Mitsubishi Electric Corp | 文書間距離算出器および文章検索器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6662152B2 (en) | Information retrieval apparatus and information retrieval method | |
Gupta et al. | A survey of text question answering techniques | |
US6876998B2 (en) | Method for cross-linguistic document retrieval | |
US6952691B2 (en) | Method and system for searching a multi-lingual database | |
US8024175B2 (en) | Computer program, apparatus, and method for searching translation memory and displaying search result | |
KR20160060253A (ko) | 자연어 질의 응답 시스템 및 방법 | |
JPWO2006090732A1 (ja) | 単語翻訳装置、翻訳方法および翻訳プログラム | |
JP2010519655A (ja) | 名前照合システムの名前インデックス付け | |
JP2005038395A (ja) | データベース検索装置 | |
JPH0844771A (ja) | 情報検索装置 | |
KR20030006201A (ko) | 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템 | |
JPH03161865A (ja) | 文章の検索方法 | |
Al-Taani et al. | Searching concepts and keywords in the Holy Quran | |
JPS61248160A (ja) | 文書情報登録方式 | |
JPH06195371A (ja) | 未登録語獲得方式 | |
KR20000036487A (ko) | 정보검색기술을 이용한 한영번역 데이터베이스 시스템 | |
JPH07134720A (ja) | 文章作成システムにおける関連情報提示方法及び装置 | |
JPH0561902A (ja) | 機械翻訳システム | |
JPH02253474A (ja) | テキストベース検索方法 | |
JPH09245051A (ja) | 自然言語事例検索装置及び自然言語事例検索方法 | |
JPH03229367A (ja) | テキストベース検索方式 | |
JP2752864B2 (ja) | テキストベース情報検索装置 | |
JPH0540783A (ja) | 自然言語解析装置 | |
JPH04123264A (ja) | 関連語テーブル作成装置及び文書検索装置 | |
JPH0821031B2 (ja) | 言語解析装置 |