JPH03161865A - 文章の検索方法 - Google Patents

文章の検索方法

Info

Publication number
JPH03161865A
JPH03161865A JP1300916A JP30091689A JPH03161865A JP H03161865 A JPH03161865 A JP H03161865A JP 1300916 A JP1300916 A JP 1300916A JP 30091689 A JP30091689 A JP 30091689A JP H03161865 A JPH03161865 A JP H03161865A
Authority
JP
Japan
Prior art keywords
search
semantic structure
retrieving
noun
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1300916A
Other languages
English (en)
Inventor
Hiroshi Kushima
串間 洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1300916A priority Critical patent/JPH03161865A/ja
Publication of JPH03161865A publication Critical patent/JPH03161865A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [概 要] 文章を検索キーとして入力して類似した文章を検索する
方法に関し、 僅かに異なる表現のため選に洩れたり、意味の異なる文
章が選ばれることを防止することを目的とし、 文章を該文章内の複数の名詞的概念とそれらの名詞的概
念相互の関係を定義付けた意味構造の形式で格納したデ
ータベースを具備し、入力された検索キーの文字列を解
析して、該文字列中の複数の名詞的概念とそれらの名詞
相互の関係を示す意味構造に変換する検索キー解析部と
、上記検索キー解析部によって生成された意味構造の名
詞的概念を検索キーとして前記データベースを検索し名
詞的概念間の関係が等しい文章を候補として出力する検
索機構とを具備することにより構或する。
[産業上の利用分野コ 本発明は、データベースからの文章の検索方法に関し、
特に、検索キーで表現される意味と類似する文章を高い
精度で検索する方法に係る。
[従来の技術] 文1;t↑I11報に対ずるti7報検索シスデA9、
用例データベースを持つ英文作或支援システムなどでは
、利用者が指定した検索キーの表現する意味と類似する
内容を有する文章を検索する必要がある。
従来、このような文章の検索方法としては、文章を単語
単位に分割してデータベース化しておき、各単語を見出
しとする索引を設けて、人が指定した検索キーを含む文
章を検索する方法がとられていた。
この方法では、例えば「情報検索」などの連11を指足
した場合、データベース中では、「情報」と「検索」が
分かれていることがあり、求める結果が得られないこと
がある。
− 3 そこで、検索キーを予め自動的に単語に分割して、その
上で検索を実施ずるなどの工夫がなされていた。
例えば、上述の例では、検索キーとして「情報検索」が
入力されたとき、これを「情報」と「検索」と言う二つ
の単語に分割して、それぞれの単語をキーとして検索す
る。これにより前述のようにデータベース中で「情報」
と「検索」が分かれていても、結果が得られることにな
る。
しかし、このような従来の方法では、検索+一に含まれ
る単語と一致する文字列を含む文章は検索できても、求
める結果以外の情報(ノイズ)が出力されたり、わずか
な表現の違いで類似の意味の文章が検索結果からもれて
しまうということが生ずる。
例えば、「情報」と「検索」を含む文章として「情報を
検索する」、「必要な情報を得るために検索を行なう」
・・・・・・等の文章は当然検索されるし、その意味も
至当であると言えるが、「情報」と「検索」と言う単語
を両方含んでい一 4 ても、「検索された情報」、「検索のためのキーとなる
べき情報jなどは所望する結果とは異なる。
また、「ソートして情報を求める」と言う文章は「情報
検索」と意味が類似しているが「検索」と言う単語が含
まれていないから選ばれない可能性が大きい。
木発1リj1よ、このような従来の問題点に鑑み、検索
キーと同一の単語が含まれている文章であっても、その
指向する意味が異なるものは排除し、一方、表現が異な
っていても、同一あるいは類似の意味を有する文章を検
索することのできる方法を捉供することを「1的として
いる。
[課題を解決するための手段] 本発明によれば上述の目的は、前記、特許請求の範囲に
記載した手段により達或される。すなわち、本発明は、
文章を該文章内の複数の名詞的概念とそれらの名詞的概
念相互の関係を定義付けた意味構造の形式で格納したデ
ータベースを具備し、入力された検索キーの文字列を解
析して、該文字列中の複数の名詞的概念とそれらの名詞
相互の関係を示す意味構造に変換する検索キー解析部と
、上記検索キー解析部によって生或された意味構造の名
詞的概念を検索キーとして前記データベースを検索し名
詞的概念間の関係が等しい文章を候補として出力する検
索機構とを具備する文章の検索方法により達戒される。
[作 用] 第1図は、本発明の原理を説明する図である。
同図において、検索キー解析手段2は、検索キー1の文
字列を解析して検索キー意味構造3に変換するものであ
る。
検索機構4は、検索キー意味構造3に一致する文章表現
をデータベース5から検索するものである。この検索を
可能とするために、データベース5中の文章は、単なる
文字列ではなく、データベース5に格納すべき文章を予
め検索キー解析手段2と同様の方法により解析して、検
索キー意味構造3と同様の形式に加工しておく。
利用者が検索キー1を入力すると、検索キー解析手段2
は、検索キー1中の文字列を解析し単語に分解する。
次に、単語間の意味関係に基づいて、一般に機械翻訳シ
スデムの原文解析段階で用いられている方法などを用い
て、検索;1一一の意味構進3をつくり出ず。
検索キー意味構造3は、検索キーlに含まれる名詞的概
念と、それらの概念相互の関係とで表わされる。
方、データベース5中の文H;7.も、,叙味4+77
 iの形式で格納されており、文章中に含まれる名詞的
概念をキーとして転置ファイルなどの方式で索引付けさ
れている。
検索機構4では、検索キー意味構造3中の名詞的概念を
キーとしてデータベース5を検索し、抽出した文章のそ
れぞれに対して、概念間の関係が検索キー意味構造3に
おける関係と等しい7 か否かを検査し、検索結果6として出力する。
このとき、等しくないものは検索結果から除外する。
[実施例] 第2図は本発明の一実施例を示す図であって、7は検索
キー、8は検索キー解析部、9は意味構造生成部、IO
は検索部、llはデータベース、l2は検索結果格納部
、13は比較部、l4はディスプレイ画面を表わしてい
る。
同図において、利用者が「要員育或」という検索キー7
を入力すると検索キー解析部8が解析を11なう。
意味構造生或部9は、上記解析結果より「要員育或」と
言う検索キーについての意味構造を生成する。この例で
は、概念間の関係については、「要員」と言う概念が「
育戊」と言う概念の対象になっていることが表現されて
いる。また、「育成」については「育てる」と言う概念
が同義語であることも表現されている。
8 一方、データベース1lには、「新規要員の育或」、「
要員を育てる」、「新入社員を育或する要員」等の文章
が登録されているが、これらは、それぞれ第3図に示す
ように意味構造を伴っている。
すなわち、「新規要員の育戊」については、同図(a)
に示すように、「育或」の対象が「要員」であり、「要
員」は「新規」と言う属性を有していることが、また、
「要員を育てる」については、同図(b)に示すように
「育てる」の対象が「要員」であることが、更に、「新
人社員を育或する要員」については同図(C)に示すよ
うに「育戒」の対象が「新人社員」であり、また、「育
成」の主体が「要員」であることが、それぞれ記されて
いる。
第2図の検索部10は、「要員」、「育戊」を検索キー
としてデータベースを検索することにより「要員」 「
育或(育てる)」などの名詞的概念を含む前述のような
文章「新規要員の育戊」、「要員を育てる」、「新人社
員を育或する要員」等を抽出し、これを検索結果格納部
l2に一旦格納する。比較部13は、これらの抽出され
た文章の意味構造を、検索キーの意味構造と比較し、一
致するものを候補として出力する。
このとき、「新入社員を育戊する要員」については「要
員」が「育戒」の対象ではなく意味構造が異なることか
ら、検索結果からは除外される。
このようにして最終的に得られた結果は、例えば、第2
図のディスプレイ画面l4に表わされているように表示
する。
第4図は上記実施例の動作を流れ図として示したもので
ある。
同図において、英字符八で示す「キーワードの抽出」は
検索キーを解析して生成した意味構造の中から名詞的概
念を抽出してデータベース検索のためのキーワードとす
るものである。
また、英字符Bで示す点線で囲んだ部分の処理は検索結
果の個数だけ反復して行なう。
[発明の効果] 以上説明したように本発明の方法によれば、検索キーと
一致する文字列を含む文章であっても、意味構造の異な
るものを誤って検出することを防ぐことができる利点が
ある。
更に、検索キーに完全に一致する文字列を含む文章のみ
でなく、意味的に類似した文章まで検索することができ
るから、情報検索システl、や英文作戊システムなどの
性能向上に寄与するところが大きい。
【図面の簡単な説明】
第l図は本発明の原理を説明する図、第2図は本発明の
一実施例を示す図、第3図は意味構造の例を示す図、第
4図は実施例の動作を示す流れ図である。

Claims (1)

  1. 【特許請求の範囲】 文章を該文章内の複数の名詞的概念とそれらの名詞的概
    念相互の関係を定義付けた意味構造の形式で格納したデ
    ータベースを具備し、 入力された検索キーの文字列を解析して、該文字列中の
    複数の名詞的概念とそれらの名詞相互の関係を示す意味
    構造に変換する検索キー解析部と、 上記検索キー解析部によって生成された意味構造の名詞
    的概念を検索キーとして前記データベースを検索し名詞
    的概念間の関係が等しい文章を候補として出力する検索
    機構とを具備することを特徴とする文章の検索方法。
JP1300916A 1989-11-21 1989-11-21 文章の検索方法 Pending JPH03161865A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1300916A JPH03161865A (ja) 1989-11-21 1989-11-21 文章の検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1300916A JPH03161865A (ja) 1989-11-21 1989-11-21 文章の検索方法

Publications (1)

Publication Number Publication Date
JPH03161865A true JPH03161865A (ja) 1991-07-11

Family

ID=17890674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1300916A Pending JPH03161865A (ja) 1989-11-21 1989-11-21 文章の検索方法

Country Status (1)

Country Link
JP (1) JPH03161865A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100440906B1 (ko) * 2001-02-15 2004-07-19 전석진 문서 색인 시스템 및 그 방법
JP2011175568A (ja) * 2010-02-25 2011-09-08 Mitsubishi Electric Corp 文書間距離算出器および文章検索器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100440906B1 (ko) * 2001-02-15 2004-07-19 전석진 문서 색인 시스템 및 그 방법
JP2011175568A (ja) * 2010-02-25 2011-09-08 Mitsubishi Electric Corp 文書間距離算出器および文章検索器

Similar Documents

Publication Publication Date Title
US6662152B2 (en) Information retrieval apparatus and information retrieval method
Gupta et al. A survey of text question answering techniques
US6876998B2 (en) Method for cross-linguistic document retrieval
US6952691B2 (en) Method and system for searching a multi-lingual database
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
KR20160060253A (ko) 자연어 질의 응답 시스템 및 방법
JPWO2006090732A1 (ja) 単語翻訳装置、翻訳方法および翻訳プログラム
JP2010519655A (ja) 名前照合システムの名前インデックス付け
JP2005038395A (ja) データベース検索装置
JPH0844771A (ja) 情報検索装置
KR20030006201A (ko) 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템
JPH03161865A (ja) 文章の検索方法
Al-Taani et al. Searching concepts and keywords in the Holy Quran
JPS61248160A (ja) 文書情報登録方式
JPH06195371A (ja) 未登録語獲得方式
KR20000036487A (ko) 정보검색기술을 이용한 한영번역 데이터베이스 시스템
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JPH0561902A (ja) 機械翻訳システム
JPH02253474A (ja) テキストベース検索方法
JPH09245051A (ja) 自然言語事例検索装置及び自然言語事例検索方法
JPH03229367A (ja) テキストベース検索方式
JP2752864B2 (ja) テキストベース情報検索装置
JPH0540783A (ja) 自然言語解析装置
JPH04123264A (ja) 関連語テーブル作成装置及び文書検索装置
JPH0821031B2 (ja) 言語解析装置