JPH0520354A - 日本語文章解析装置 - Google Patents
日本語文章解析装置Info
- Publication number
- JPH0520354A JPH0520354A JP3172806A JP17280691A JPH0520354A JP H0520354 A JPH0520354 A JP H0520354A JP 3172806 A JP3172806 A JP 3172806A JP 17280691 A JP17280691 A JP 17280691A JP H0520354 A JPH0520354 A JP H0520354A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- matching
- case
- japanese
- synonym
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 本発明の目的は日本語文章を入力として、そ
れを処理する日本語文章処理システムにおいて、入力さ
れた日本語文の間の関係を解析する日本語文章解析装置
を提供することである。 【構成】 本発明の構成は日本語文間の関係の解析結果
を入力する入力部(1)と、用言類義語・対義語データ
テーブル(3)を用いて行う用言マッチング部(2)
と、格要素類義語・対義語データテーブル(5)を用い
て行う格要素マッチング部(4)と、用言マッチング部
(2)の結果と格要素マッチング部(4)の結果を統合
して1つの結果とする結果判定部(6)と、用言マッチ
ング部(2)においてアンマッチのものを格要素と用言
の組み合わせによるマッチングを格要素・用言組み合わ
せテーブル(8)を用いて行う格要素・用言組み合わせ
マッチング部(7)と、入力された2つの単位文間の関
係を出力する出力部(9)とを有する。
れを処理する日本語文章処理システムにおいて、入力さ
れた日本語文の間の関係を解析する日本語文章解析装置
を提供することである。 【構成】 本発明の構成は日本語文間の関係の解析結果
を入力する入力部(1)と、用言類義語・対義語データ
テーブル(3)を用いて行う用言マッチング部(2)
と、格要素類義語・対義語データテーブル(5)を用い
て行う格要素マッチング部(4)と、用言マッチング部
(2)の結果と格要素マッチング部(4)の結果を統合
して1つの結果とする結果判定部(6)と、用言マッチ
ング部(2)においてアンマッチのものを格要素と用言
の組み合わせによるマッチングを格要素・用言組み合わ
せテーブル(8)を用いて行う格要素・用言組み合わせ
マッチング部(7)と、入力された2つの単位文間の関
係を出力する出力部(9)とを有する。
Description
【0001】
【産業上の利用分野】本発明は日本語文章解析装置に係
り、特に、複数の日本語文から構成される日本語文章を
入力としてそれを処理する日本語文章処理システムにお
いて、既に入力された日本語文の間の関係を解析する日
本語文章解析装置に関する。
り、特に、複数の日本語文から構成される日本語文章を
入力としてそれを処理する日本語文章処理システムにお
いて、既に入力された日本語文の間の関係を解析する日
本語文章解析装置に関する。
【0002】
【従来の技術】従来の技術は、名詞、動詞のマッチング
によって日本語文間の関係を判定する入力した日本文に
適合した日本文をテキストベースから検索する情報検索
の分野や日本語文章を構成する日本語文間の結びつきに
関する研究の分野で主に行われている。また、このよう
な技術に関して、既に文献等で発表されているもので
は、第1の方法として、2つの文間の類似性についての
み検討しており、対比、詳細化等の文間の意味的関係に
ついては触れられていない(杉山、秋山、伊吹、川崎、
内田:自然言語理解に基づく情報検索システムIRI
S、情報処理学会自然言語処理研究会資料58−5、
(1986))。第2の方法として、対象としている日
本語文間に関係があるか否かについて検討しており、そ
れらの文がどのような関係で結びついているかは検討し
ていない(工藤:文と文の結束性を捕らえるための知
識、情報処理学会自然言語処理研究会資料76−7、
(1990))。
によって日本語文間の関係を判定する入力した日本文に
適合した日本文をテキストベースから検索する情報検索
の分野や日本語文章を構成する日本語文間の結びつきに
関する研究の分野で主に行われている。また、このよう
な技術に関して、既に文献等で発表されているもので
は、第1の方法として、2つの文間の類似性についての
み検討しており、対比、詳細化等の文間の意味的関係に
ついては触れられていない(杉山、秋山、伊吹、川崎、
内田:自然言語理解に基づく情報検索システムIRI
S、情報処理学会自然言語処理研究会資料58−5、
(1986))。第2の方法として、対象としている日
本語文間に関係があるか否かについて検討しており、そ
れらの文がどのような関係で結びついているかは検討し
ていない(工藤:文と文の結束性を捕らえるための知
識、情報処理学会自然言語処理研究会資料76−7、
(1990))。
【0003】
【発明が解決しようとする課題】上記のように従来の技
術では、検索の目的に使用されるために類似に関係しか
扱っておらず対比等の関係については触れられていな
い、あるいは、文間の結びつきの有無を重視してその関
係については検討していないなどの問題があった。本発
明は上記の点に鑑みなされたもので、日本語文章を入力
として、それを処理する日本語文章処理システムにおい
て、入力された日本語文の間の関係を解析する日本語文
章解析装置を提供することを目的とする。
術では、検索の目的に使用されるために類似に関係しか
扱っておらず対比等の関係については触れられていな
い、あるいは、文間の結びつきの有無を重視してその関
係については検討していないなどの問題があった。本発
明は上記の点に鑑みなされたもので、日本語文章を入力
として、それを処理する日本語文章処理システムにおい
て、入力された日本語文の間の関係を解析する日本語文
章解析装置を提供することを目的とする。
【0004】
【課題を解決するための手段】図1は本発明の日本語文
章解析装置の原理構成図を示す。前記目的を達成するた
めに、本発明の日本語文章解析装置は、複数の日本語文
から構成される日本語文章の日本語文間の関係を1つの
述語とその格要素、副詞要素からなる単位文を単位とし
て解析する日本語文章解析装置において、日本語文間の
関係を解析したい2つの単位文の形態要素解析結果及
び、係り受け解析結果を入力する入力部(1)と、用言
の類義語、対義語を予め記述した用言類義語・対義語デ
ータテーブル(3)と、格要素の類義語、対義語を予め
記述した格要素類義語・対義語データテーブル(5)
と、格要素と用言の組み合わせを予め記述した格要素・
用言組み合わせテーブル(8)と、入力部(1)より入
力された2つの単位文の各述語中の用言のマッチングを
行う用言マッチング部(2)と、用言の必須格にある格
要素間のマッチングを行う格要素マッチング部(4)
と、用言マッチング部(2)の結果と前記格要素マッチ
ング部(4)の結果を統合して1つの結果とする結果判
定部(6)と、用言マッチング部(2)においてマッチ
ングがとれなかったものに対して格要素と用言の組み合
わせによるマッチングを行う格要素・用言組み合わせマ
ッチング部(7)と、入力された前記2つの単位文間の
関係を出力する出力部(9)とを有する。
章解析装置の原理構成図を示す。前記目的を達成するた
めに、本発明の日本語文章解析装置は、複数の日本語文
から構成される日本語文章の日本語文間の関係を1つの
述語とその格要素、副詞要素からなる単位文を単位とし
て解析する日本語文章解析装置において、日本語文間の
関係を解析したい2つの単位文の形態要素解析結果及
び、係り受け解析結果を入力する入力部(1)と、用言
の類義語、対義語を予め記述した用言類義語・対義語デ
ータテーブル(3)と、格要素の類義語、対義語を予め
記述した格要素類義語・対義語データテーブル(5)
と、格要素と用言の組み合わせを予め記述した格要素・
用言組み合わせテーブル(8)と、入力部(1)より入
力された2つの単位文の各述語中の用言のマッチングを
行う用言マッチング部(2)と、用言の必須格にある格
要素間のマッチングを行う格要素マッチング部(4)
と、用言マッチング部(2)の結果と前記格要素マッチ
ング部(4)の結果を統合して1つの結果とする結果判
定部(6)と、用言マッチング部(2)においてマッチ
ングがとれなかったものに対して格要素と用言の組み合
わせによるマッチングを行う格要素・用言組み合わせマ
ッチング部(7)と、入力された前記2つの単位文間の
関係を出力する出力部(9)とを有する。
【0005】
【作用】本発明の日本語文章解析装置は、処理対象の日
本語文章を構成する日本語文においてその間の関係を解
析したい2つの単位文の形態素解析結果及び、係り受け
解析結果が入力される。用言マッチング部(2)は、入
力された2つの単位文の各述語中の各用言について、用
言類義語・対義語データテーブル(3)を用いてマッチ
ングを行いその関係を判定する。格要素マッチング部
(4)は、用言マッチング部(2)でマッチングがとれ
た単位文対に対して、その述語の必須格にある格要素に
ついて格要素類義語・対義語データテーブル(5)を用
いてマッチングを行いその関係を判定する。結果判定部
(6)は、格要素マッチング部(4)でマッチングがと
れた単位文対に対して用言マッチング部(2)の結果と
格要素マッチング部(4)の結果を統合し1つの結果と
する。格要素・用言組み合わせマッチング部(7)は、
用言マッチング部(2)においてマッチングがとれなか
った単位文対に対して、格要素と用言の組み合わせにつ
いて格要素・用言組み合わせテーブル(8)を用いてマ
ッチングを行いその関係を判定する。結果判定部(6)
または格要素・用言組み合わせマッチング部(7)の結
果は、入力された単位文対の関係として出力部(9)を
介して出力される。これにより本装置は関係を解析した
い2つの単位文間の関係を用言、格要素のマッチングに
よって解析することができる。
本語文章を構成する日本語文においてその間の関係を解
析したい2つの単位文の形態素解析結果及び、係り受け
解析結果が入力される。用言マッチング部(2)は、入
力された2つの単位文の各述語中の各用言について、用
言類義語・対義語データテーブル(3)を用いてマッチ
ングを行いその関係を判定する。格要素マッチング部
(4)は、用言マッチング部(2)でマッチングがとれ
た単位文対に対して、その述語の必須格にある格要素に
ついて格要素類義語・対義語データテーブル(5)を用
いてマッチングを行いその関係を判定する。結果判定部
(6)は、格要素マッチング部(4)でマッチングがと
れた単位文対に対して用言マッチング部(2)の結果と
格要素マッチング部(4)の結果を統合し1つの結果と
する。格要素・用言組み合わせマッチング部(7)は、
用言マッチング部(2)においてマッチングがとれなか
った単位文対に対して、格要素と用言の組み合わせにつ
いて格要素・用言組み合わせテーブル(8)を用いてマ
ッチングを行いその関係を判定する。結果判定部(6)
または格要素・用言組み合わせマッチング部(7)の結
果は、入力された単位文対の関係として出力部(9)を
介して出力される。これにより本装置は関係を解析した
い2つの単位文間の関係を用言、格要素のマッチングに
よって解析することができる。
【0006】
【実施例】以下、本発明の一実施例を図面を用いて具体
的に説明する。図1に示すように、日本語文章解析装置
は、入力部1、用言マッチング部2、用言類義語・対義
語データテーブル3、格要素マッチング部4、格要素類
義語・対義語データテーブル5、結果判定部6、格要素
・用言組み合わせマッチング部7、格要素・用言組み合
わせテーブル8、及び出力部9から構成される。同図に
おいて、入力部1は処理対象の日本語の文章を構成する
日本語文間の関係を解析したい2つの単位文の形態要素
解析結果及び、係り受け解析結果を入力する。用言マッ
チング部2は入力部1で入力された2つの単位文の各述
語中の各用言について、用言類義語・対義語データが予
め登録してあるテーブルを用いてマッチングを行いその
2つの単位文の関係を判定する。格要素マッチング部4
は用言マッチング2でマッチングした単位文対に対し
て、その述語の必須格にある格要素について格要素類義
語・対義語データテーブル5を用いてマッチングを行い
その関係を判定する。結果判定部6は用言マッチング部
2と格要素マッチング部4より結果を抽出する。図2は
用言類義語・対義語データテーブルの構成の一例を示す
図である。この日本語文章解析装置における用言類義語
・対義語データテーブル3は、同図に示すように、用言
の類義語・対義語をそれぞれリストにして、予め登録し
たものである。図3は、格要素類義語・対義語データテ
ーブル5の構成の一例を示す図である。この日本語文章
解析装置における格要素類義語・対義語データテーブル
5は、同図に示すように、格要素の類義語・対義語をそ
れぞれリストにして、予め登録したものである。図4
は、格要素・用言組み合わせテーブル8の構成の一例を
示す図である。この日本語文章解析装置における格要素
・用言組み合わせテーブル8は、同図に示すように、格
要素と用言の組み合わせによる類義関係を、予め登録し
たものである。
的に説明する。図1に示すように、日本語文章解析装置
は、入力部1、用言マッチング部2、用言類義語・対義
語データテーブル3、格要素マッチング部4、格要素類
義語・対義語データテーブル5、結果判定部6、格要素
・用言組み合わせマッチング部7、格要素・用言組み合
わせテーブル8、及び出力部9から構成される。同図に
おいて、入力部1は処理対象の日本語の文章を構成する
日本語文間の関係を解析したい2つの単位文の形態要素
解析結果及び、係り受け解析結果を入力する。用言マッ
チング部2は入力部1で入力された2つの単位文の各述
語中の各用言について、用言類義語・対義語データが予
め登録してあるテーブルを用いてマッチングを行いその
2つの単位文の関係を判定する。格要素マッチング部4
は用言マッチング2でマッチングした単位文対に対し
て、その述語の必須格にある格要素について格要素類義
語・対義語データテーブル5を用いてマッチングを行い
その関係を判定する。結果判定部6は用言マッチング部
2と格要素マッチング部4より結果を抽出する。図2は
用言類義語・対義語データテーブルの構成の一例を示す
図である。この日本語文章解析装置における用言類義語
・対義語データテーブル3は、同図に示すように、用言
の類義語・対義語をそれぞれリストにして、予め登録し
たものである。図3は、格要素類義語・対義語データテ
ーブル5の構成の一例を示す図である。この日本語文章
解析装置における格要素類義語・対義語データテーブル
5は、同図に示すように、格要素の類義語・対義語をそ
れぞれリストにして、予め登録したものである。図4
は、格要素・用言組み合わせテーブル8の構成の一例を
示す図である。この日本語文章解析装置における格要素
・用言組み合わせテーブル8は、同図に示すように、格
要素と用言の組み合わせによる類義関係を、予め登録し
たものである。
【0007】図1を参照して説明を続けると、入力部1
からは、処理対象の日本語文章を構成する日本語文にお
いて、日本語文間の関係を解析する2つの単位文の形態
素解析結果及び、係り受け解析結果が入力されるものと
する。単位文は、処理対象の日本語文を、既存の形態素
解析、係り受け解析を行う装置にかけることにより得ら
れる形態素解析、係り受け解析結果から1つの述語とそ
の格要素、副詞要素を検出することにより判定できる
が、ここではその手法の詳細は問わない。例として、
「このコマンドを入力すると、データをファイルに保存
します。」に対する既存の単位文判定装置の結果を図示
すると図5のようになる。図5は本発明の一実施例の単
位文判定装置の動作を説明するための図である。「この
コマンドを入力すると、データをファイルに保存しま
す。」という処理対象の日本語文を形態素解析装置に入
力すると、同図に示すように各字面毎に品詞分解された
形態素解析結果が得られる。さらに、係り受け解析装置
により、単語境界(“/”)と文節境界(“//”)に
分けられる。同図の例では2つの単位文に分けられ、
“この//コマンド/を//入力する/と/、/”と
“データ/を//ファイル/に//保存し/ます/。”
の単位文対となる。
からは、処理対象の日本語文章を構成する日本語文にお
いて、日本語文間の関係を解析する2つの単位文の形態
素解析結果及び、係り受け解析結果が入力されるものと
する。単位文は、処理対象の日本語文を、既存の形態素
解析、係り受け解析を行う装置にかけることにより得ら
れる形態素解析、係り受け解析結果から1つの述語とそ
の格要素、副詞要素を検出することにより判定できる
が、ここではその手法の詳細は問わない。例として、
「このコマンドを入力すると、データをファイルに保存
します。」に対する既存の単位文判定装置の結果を図示
すると図5のようになる。図5は本発明の一実施例の単
位文判定装置の動作を説明するための図である。「この
コマンドを入力すると、データをファイルに保存しま
す。」という処理対象の日本語文を形態素解析装置に入
力すると、同図に示すように各字面毎に品詞分解された
形態素解析結果が得られる。さらに、係り受け解析装置
により、単語境界(“/”)と文節境界(“//”)に
分けられる。同図の例では2つの単位文に分けられ、
“この//コマンド/を//入力する/と/、/”と
“データ/を//ファイル/に//保存し/ます/。”
の単位文対となる。
【0008】用言マッチング部2は、入力された単位文
対について、その用言のマッチングを行う。その際、類
義語、対義語に対しては用言類義語・対義語データテー
ブル3を用いて、等価、対比の判定を行う。また、同義
あるいは類義の用言対の片方に否定表現が用いられてい
る場合は、対比の判定を行う。格要素マッチング部4
は、入力部1で入力された単位文対について、その用言
の必須格にある格要素のマッチングを行う。その際、類
義語、対義語に対しては格要素類義語・対義語データテ
ーブル5を用いて、等価、対比、詳細化の判定を行う。
ここで必須格とは、その用言に係る格助詞(が,に,を
等)のことで、各用言ごとに係る必須格が決まっている
のが一般的である。結果判定部6は、用言マッチング部
2、格要素マッチング部4のそれぞれの結果を1つに統
合して単位文間の関係とする。格要素、用言組み合わせ
マッチング部7は、用言マッチング部2において関係が
判定されなかった単位文対に対して、格要素・用言組み
合わせテーブル8を用いて格要素と用言の組み合わせで
マッチングを行い等価、対比の判定を行う。出力部9は
結果判定部6、または格要素・用言組み合わせマッチン
グ部7で判定された単位文間の関係を出力する。
対について、その用言のマッチングを行う。その際、類
義語、対義語に対しては用言類義語・対義語データテー
ブル3を用いて、等価、対比の判定を行う。また、同義
あるいは類義の用言対の片方に否定表現が用いられてい
る場合は、対比の判定を行う。格要素マッチング部4
は、入力部1で入力された単位文対について、その用言
の必須格にある格要素のマッチングを行う。その際、類
義語、対義語に対しては格要素類義語・対義語データテ
ーブル5を用いて、等価、対比、詳細化の判定を行う。
ここで必須格とは、その用言に係る格助詞(が,に,を
等)のことで、各用言ごとに係る必須格が決まっている
のが一般的である。結果判定部6は、用言マッチング部
2、格要素マッチング部4のそれぞれの結果を1つに統
合して単位文間の関係とする。格要素、用言組み合わせ
マッチング部7は、用言マッチング部2において関係が
判定されなかった単位文対に対して、格要素・用言組み
合わせテーブル8を用いて格要素と用言の組み合わせで
マッチングを行い等価、対比の判定を行う。出力部9は
結果判定部6、または格要素・用言組み合わせマッチン
グ部7で判定された単位文間の関係を出力する。
【0009】以下、具体例について説明する。ここで、
処理対象の日本語文章中に以下の3組の単位文対が含ま
れており、それらの間の関係を判定するものとする。 a.「ファイルにデータを保存する」 b.「ファイルにデータの一部を保存する」 a.「ラインを書く」 b.「罫線を消す」 a.「バックアップをとる」 b.「コピーを作る」 入力部1は、処理対象の日本語文間の関係を判定したい
2つの単位文を形態素解析及び、係り受け解説結果と共
に入力して用言マッチング部2に転送する。
処理対象の日本語文章中に以下の3組の単位文対が含ま
れており、それらの間の関係を判定するものとする。 a.「ファイルにデータを保存する」 b.「ファイルにデータの一部を保存する」 a.「ラインを書く」 b.「罫線を消す」 a.「バックアップをとる」 b.「コピーを作る」 入力部1は、処理対象の日本語文間の関係を判定したい
2つの単位文を形態素解析及び、係り受け解説結果と共
に入力して用言マッチング部2に転送する。
【0010】図6は用言マッチング部2の処理のフロー
チャートを示す。用言マッチング部2は2つの単位文の
形態素解析結果及び、係り受け解析結果を入力し(ステ
ップ1)、各単位文の用言を形態素解析結果から検出し
(ステップ2)、用言について字面、品詞のマッチング
を行い(ステップ3)、マッチングがとれたものに対し
て、どちらか一方の述語に否定表現が用いられていれば
(ステップ4)、用言間に対比の関係を付与して格要素
マッチング部4に転送する(ステップ41)。その他の
場合は用言間に等価の関係を付与して格要素マッチング
部4に転送する(ステップ42)。また、ステップ3で
マッチングがとれなかった場合は、用言類義語・対義語
データテーブル3を用いてマッチングを行い(ステップ
5)、類義語でマッチングのとれた場合は、ステップ4
の処理を行い、対義語でマッチングのとれた場合は、用
言間に対比の関係を付与して格要素マッチング部4に転
送し、処理終了後、格要素マッチング部4へ移行する
(ステップ51)。ステップ5でアンマッチの場合は、
NIL(無関係)を単位文対を格要素・用言組み合わせ
マッチング部7に転送し、処理終了後、格要素用言組み
合わせマッチング部7へ移行する(ステップ52)。
チャートを示す。用言マッチング部2は2つの単位文の
形態素解析結果及び、係り受け解析結果を入力し(ステ
ップ1)、各単位文の用言を形態素解析結果から検出し
(ステップ2)、用言について字面、品詞のマッチング
を行い(ステップ3)、マッチングがとれたものに対し
て、どちらか一方の述語に否定表現が用いられていれば
(ステップ4)、用言間に対比の関係を付与して格要素
マッチング部4に転送する(ステップ41)。その他の
場合は用言間に等価の関係を付与して格要素マッチング
部4に転送する(ステップ42)。また、ステップ3で
マッチングがとれなかった場合は、用言類義語・対義語
データテーブル3を用いてマッチングを行い(ステップ
5)、類義語でマッチングのとれた場合は、ステップ4
の処理を行い、対義語でマッチングのとれた場合は、用
言間に対比の関係を付与して格要素マッチング部4に転
送し、処理終了後、格要素マッチング部4へ移行する
(ステップ51)。ステップ5でアンマッチの場合は、
NIL(無関係)を単位文対を格要素・用言組み合わせ
マッチング部7に転送し、処理終了後、格要素用言組み
合わせマッチング部7へ移行する(ステップ52)。
【0011】図7は本発明の一実施例の単位文対に対応
する用言類義語・対義語データテーブルの一例を示す。
用言類義語・対義語データテーブル3は、用言の類義語
・対義語を予め登録したものである。図7のテーブルは
単位文対に対応する用言類義語・対義語データテーブ
ル3の一例である。また、図8は本発明の一実施例の単
位文対及びに対する用言マッチング部の出力を示
す。例えば、図8の単位文対の場合、用言マッチング
部2からは用言のマッチング結果 「[保存する(品詞:他動詞、サ変活用)]=[保存す
る(品詞:他動詞、サ変活用)]」 が付与され、単位文対は格要素マッチング部4に転送
される(=は等価を表す)。
する用言類義語・対義語データテーブルの一例を示す。
用言類義語・対義語データテーブル3は、用言の類義語
・対義語を予め登録したものである。図7のテーブルは
単位文対に対応する用言類義語・対義語データテーブ
ル3の一例である。また、図8は本発明の一実施例の単
位文対及びに対する用言マッチング部の出力を示
す。例えば、図8の単位文対の場合、用言マッチング
部2からは用言のマッチング結果 「[保存する(品詞:他動詞、サ変活用)]=[保存す
る(品詞:他動詞、サ変活用)]」 が付与され、単位文対は格要素マッチング部4に転送
される(=は等価を表す)。
【0012】図9及び図10は本発明の一実施例の格要
素マッチング部の処理のフローチャートを示す。図10
は図9の続きのフローチャートである。格要素マッチン
グ部4は用言マッチング部2で用言間に関係を付与され
た単位文対を入力し(ステップ100)、格用言の同じ
必須格(を格,に格等)にある格要素を検出する(ステ
ップ120)。ここで形態素解析、係り受け解析結果か
ら同じ必須格にある格要素が検出された場合は(ステッ
プ121)格要素について字面、品詞のマッチングを行
い(ステップ140)、マッチングがとれた場合は、格
要素間に等価の関係を付与する(ステップ141)。マ
ッチングがとれなかった場合は、格要素類義語・対義語
データテーブル5を用いてマッチングを行う(ステップ
150)。
素マッチング部の処理のフローチャートを示す。図10
は図9の続きのフローチャートである。格要素マッチン
グ部4は用言マッチング部2で用言間に関係を付与され
た単位文対を入力し(ステップ100)、格用言の同じ
必須格(を格,に格等)にある格要素を検出する(ステ
ップ120)。ここで形態素解析、係り受け解析結果か
ら同じ必須格にある格要素が検出された場合は(ステッ
プ121)格要素について字面、品詞のマッチングを行
い(ステップ140)、マッチングがとれた場合は、格
要素間に等価の関係を付与する(ステップ141)。マ
ッチングがとれなかった場合は、格要素類義語・対義語
データテーブル5を用いてマッチングを行う(ステップ
150)。
【0013】このマッチングで用いる格要素類義語・対
義語データテーブル5は、格要素の類義語、対義語を予
め登録したものである。図11に単位文対に対する格
要素類義語・対義語データテーブル5の一例を示す。類
義語でマッチングのとれた場合は、格要素間に等価の関
係を付与する(ステップ141)。また、類義語でアン
マッチの時は対義語でマッチングを行う(ステップ15
1)。対義語でマッチングのとれた場合は、格要素間に
対比の関係を付与する(ステップ152)マッチングが
とれなかった場合は、格要素のどちらか少なくとも一方
が「AのB」の形になっている場合(ステップ16
0)、マッチング対象をBからAにして(ステップ16
1)の処理を行う(但し、この場合、等価の代わりに詳
細化を関係として付与する)。ステップ160で「Aの
B」の形になっていない場合はNIL(無関係)を出力
する(ステップ162)。また、ステップ121で同じ
必須格にある格要素が検出されなかった場合、ステップ
130で述語が受動態であるか判定し、受動態であれば
その必須格を変換して(ステップ131)格要素検出の
処理を行うステップ121へ戻る。受動態でない場合は
格要素間にNIL(無関係)の関係を付与する(ステッ
プ132)。複数の必須格がある場合は(ステップ17
0)その数だけステップ120からステップ160の処
理を繰り返す。最後に、図10においてNILが1つも
なく対比が1つでもあれば(ステップ180)対比の関
係を格要素間の関係とし(ステップ181)、NIL、
対比が1つもなく詳細化が1つでもあれば(ステップ1
82)詳細化の関係を格要素間の関係とし(ステップ1
83)、その他の場合でNILが1つもなければ等価の
関係を格要素間の関係とし(ステップ185)、NIL
が1つでもあれば(ステップ186)NIL(無関係)
を格要素間の関係として、格要素間の関係と用言間の関
係を付与された単位文対を結果判定部6に転送する。
義語データテーブル5は、格要素の類義語、対義語を予
め登録したものである。図11に単位文対に対する格
要素類義語・対義語データテーブル5の一例を示す。類
義語でマッチングのとれた場合は、格要素間に等価の関
係を付与する(ステップ141)。また、類義語でアン
マッチの時は対義語でマッチングを行う(ステップ15
1)。対義語でマッチングのとれた場合は、格要素間に
対比の関係を付与する(ステップ152)マッチングが
とれなかった場合は、格要素のどちらか少なくとも一方
が「AのB」の形になっている場合(ステップ16
0)、マッチング対象をBからAにして(ステップ16
1)の処理を行う(但し、この場合、等価の代わりに詳
細化を関係として付与する)。ステップ160で「Aの
B」の形になっていない場合はNIL(無関係)を出力
する(ステップ162)。また、ステップ121で同じ
必須格にある格要素が検出されなかった場合、ステップ
130で述語が受動態であるか判定し、受動態であれば
その必須格を変換して(ステップ131)格要素検出の
処理を行うステップ121へ戻る。受動態でない場合は
格要素間にNIL(無関係)の関係を付与する(ステッ
プ132)。複数の必須格がある場合は(ステップ17
0)その数だけステップ120からステップ160の処
理を繰り返す。最後に、図10においてNILが1つも
なく対比が1つでもあれば(ステップ180)対比の関
係を格要素間の関係とし(ステップ181)、NIL、
対比が1つもなく詳細化が1つでもあれば(ステップ1
82)詳細化の関係を格要素間の関係とし(ステップ1
83)、その他の場合でNILが1つもなければ等価の
関係を格要素間の関係とし(ステップ185)、NIL
が1つでもあれば(ステップ186)NIL(無関係)
を格要素間の関係として、格要素間の関係と用言間の関
係を付与された単位文対を結果判定部6に転送する。
【0014】図12は本発明の一実施例の単位文対に
対応する格要素類義語・対義語データテーブル5の例を
示す。例えば、図12の単位文対の場合、格要素マッ
チング部4からは格要素のマッチング結果 「{[ファイル(品詞:名詞、必須格:に格)]=[フ
ァイル(品詞:名詞、必須格:に格)]},{[データ
(品詞:名詞、必須格:を格)]=>「データの一部
(品詞:名詞、必須格:を格)]}から詳細化」 が付与され、用言マッチング部2の結果、格要素マッチ
ング部4の結果と共に単位文対は結果判定部6に転送
される(=は等価を表し、=>は詳細化を表す)。
対応する格要素類義語・対義語データテーブル5の例を
示す。例えば、図12の単位文対の場合、格要素マッ
チング部4からは格要素のマッチング結果 「{[ファイル(品詞:名詞、必須格:に格)]=[フ
ァイル(品詞:名詞、必須格:に格)]},{[データ
(品詞:名詞、必須格:を格)]=>「データの一部
(品詞:名詞、必須格:を格)]}から詳細化」 が付与され、用言マッチング部2の結果、格要素マッチ
ング部4の結果と共に単位文対は結果判定部6に転送
される(=は等価を表し、=>は詳細化を表す)。
【0015】図13は本発明の一実施例の結果判定部6
の処理のフローチャートを示す。結果判定部6は、単位
文対とその単位文対に対する用言マッチング部2と格要
素マッチング部4の結果を入力し(ステップ200)、
用言マッチング部2と格要素マッチング部4の結果を統
合して1つの関係とするための判定を行う(ステップ2
10)。用言マッチング部2の結果が等価ならば、格要
素マッチング部4の結果を出力し(ステップ211)、
用言マッチング部2の結果が等価以外ならば、対比を出
力する(ステップ220)。図13において処理終了
後、単位文対及びに対する結果判定部6の出力を示
す。図14は本発明の一実施例の単位文体及びに対
する結果判定部の出力の例を示す。例えば、同図におい
て、単位文対の場合、用言マッチング部2の結果「等
価」と格要素マッチング部4の結果「詳細化」から結果
判定部6の結果「詳細化」が出力される。
の処理のフローチャートを示す。結果判定部6は、単位
文対とその単位文対に対する用言マッチング部2と格要
素マッチング部4の結果を入力し(ステップ200)、
用言マッチング部2と格要素マッチング部4の結果を統
合して1つの関係とするための判定を行う(ステップ2
10)。用言マッチング部2の結果が等価ならば、格要
素マッチング部4の結果を出力し(ステップ211)、
用言マッチング部2の結果が等価以外ならば、対比を出
力する(ステップ220)。図13において処理終了
後、単位文対及びに対する結果判定部6の出力を示
す。図14は本発明の一実施例の単位文体及びに対
する結果判定部の出力の例を示す。例えば、同図におい
て、単位文対の場合、用言マッチング部2の結果「等
価」と格要素マッチング部4の結果「詳細化」から結果
判定部6の結果「詳細化」が出力される。
【0016】図15は本発明の一実施例の用言組み合わ
せマッチング部の処理のフローチャートを示す。格要素
・用言組み合わせマッチング部7では、マッチングしな
かった単位文対を入力し(ステップ300)、格要素、
用言の組み合わせから格要素・用言組み合わせテーブル
8を用いてマッチングを行う(ステップ310)。格要
素・用言組み合わせテーブル8は格要素と用言の組み合
わせによる等価関係をあらかじめ登録したものである。
図16は本発明の一実施例の単位文対に対応する格要
素・用言組み合わせテーブルの例を示す。ステップ31
0においてマッチングがとれた場合は単位文の述語の素
性を判定し(ステップ320)、どちらか一方が否定の
場合は、単位文対に対比の関係を付与して出力し(ステ
ップ321)、それ以外の場合は単位文対に等価の関係
を付与して出力する(ステップ322)。また、ステッ
プ310でマッチングがとれなかった場合は、単位文対
にNIL(無関係)を付与して出力する(ステップ31
1)。
せマッチング部の処理のフローチャートを示す。格要素
・用言組み合わせマッチング部7では、マッチングしな
かった単位文対を入力し(ステップ300)、格要素、
用言の組み合わせから格要素・用言組み合わせテーブル
8を用いてマッチングを行う(ステップ310)。格要
素・用言組み合わせテーブル8は格要素と用言の組み合
わせによる等価関係をあらかじめ登録したものである。
図16は本発明の一実施例の単位文対に対応する格要
素・用言組み合わせテーブルの例を示す。ステップ31
0においてマッチングがとれた場合は単位文の述語の素
性を判定し(ステップ320)、どちらか一方が否定の
場合は、単位文対に対比の関係を付与して出力し(ステ
ップ321)、それ以外の場合は単位文対に等価の関係
を付与して出力する(ステップ322)。また、ステッ
プ310でマッチングがとれなかった場合は、単位文対
にNIL(無関係)を付与して出力する(ステップ31
1)。
【0017】図17は本発明の一実施例の単位文対に
対する格要素・用言組み合わせマッチング部の出力の例
を示す。以上のようにして判定された単位文間の関係は
出力部9を介して出力される。図18は本発明の他の実
施例における日本語文間の関係を示す。複数の日本語文
から構成される日本語文章を入力として、それを処理す
る日本語文章処理システムでは、日本語文間の関係を解
析する際、日本語文の持つ意味を解析し、その意味から
日本語文間の関係を解析していくことが一般的である。
その時、意味解析からだけでは、付与する関係に多義が
生じることがあり、1つの単位文間の関係を本発明の日
本語文章解析装置によって解析することにより、その多
義の解消を行うことができる。
対する格要素・用言組み合わせマッチング部の出力の例
を示す。以上のようにして判定された単位文間の関係は
出力部9を介して出力される。図18は本発明の他の実
施例における日本語文間の関係を示す。複数の日本語文
から構成される日本語文章を入力として、それを処理す
る日本語文章処理システムでは、日本語文間の関係を解
析する際、日本語文の持つ意味を解析し、その意味から
日本語文間の関係を解析していくことが一般的である。
その時、意味解析からだけでは、付与する関係に多義が
生じることがあり、1つの単位文間の関係を本発明の日
本語文章解析装置によって解析することにより、その多
義の解消を行うことができる。
【0018】以下、具体例について説明する。ここで、
図19は本発明の他の実施例における日本語文章の例を
示す。処理対象の日本語文章中の2つの文が含まれてい
るとする。同図中、アンダーラインで示したところが単
位文である。 キーを押せば、 文字を入力することができます。 a b ここで、例文は「ユーザがある操作をすれば、ユーザ
が別の操作をすることができる。」を表しており、例文
は「ユーザがある操作をすれば、システムがある動作
をする。」を表していることが日本語文章処理システム
の中で解析される。この2つの文の意味から単位文を単
位として文間の関係を解析する。図18に例文,の
意味から考えられる文間の関係を示す。図18のα,β
に示すように、2つの文の意味から関係を考えた場合、
その関係に多義が生じることがある。ここで、図18の
αの単位文−aと単位文−aの間の関係と、βの単
位文−bと単位文−aの間の関係を本発明の日本語
文章解析装置によって求めると、図18のβの単位文
−bと単位文−aの間に等価の関係を解析し、これに
よって例文,間の関係を図18のβとすることがで
きる。
図19は本発明の他の実施例における日本語文章の例を
示す。処理対象の日本語文章中の2つの文が含まれてい
るとする。同図中、アンダーラインで示したところが単
位文である。 キーを押せば、 文字を入力することができます。 a b ここで、例文は「ユーザがある操作をすれば、ユーザ
が別の操作をすることができる。」を表しており、例文
は「ユーザがある操作をすれば、システムがある動作
をする。」を表していることが日本語文章処理システム
の中で解析される。この2つの文の意味から単位文を単
位として文間の関係を解析する。図18に例文,の
意味から考えられる文間の関係を示す。図18のα,β
に示すように、2つの文の意味から関係を考えた場合、
その関係に多義が生じることがある。ここで、図18の
αの単位文−aと単位文−aの間の関係と、βの単
位文−bと単位文−aの間の関係を本発明の日本語
文章解析装置によって求めると、図18のβの単位文
−bと単位文−aの間に等価の関係を解析し、これに
よって例文,間の関係を図18のβとすることがで
きる。
【0019】
【発明の効果】以上説明したように、本発明によれば、
日本語文章を入力として、その処理を行う日本語文章処
理システムにおいて、その間の関係を解析したい2つの
単位文間の関係を用言、格要素のマッチングによって解
析することができ、文書推敲等に有用である。
日本語文章を入力として、その処理を行う日本語文章処
理システムにおいて、その間の関係を解析したい2つの
単位文間の関係を用言、格要素のマッチングによって解
析することができ、文書推敲等に有用である。
【図1】本発明の日本語解析装置の原理構成図である。
【図2】本発明の一実施例の用言類義語・対義語データ
テーブルの構成例を示す図である。
テーブルの構成例を示す図である。
【図3】本発明の一実施例の格要素類義語・対義語デー
タテーブルの構成例を示す図である。
タテーブルの構成例を示す図である。
【図4】本発明の一実施例の格要素・用言組み合わせテ
ーブルの構成例を示す図である。
ーブルの構成例を示す図である。
【図5】本発明の一実施例の単位文を説明するための図
である。
である。
【図6】本発明の一実施例の用言マッチング部の処理フ
ローチャートである。
ローチャートである。
【図7】本発明の一実施例の単位文対に対応する用言類
義語・対義語データテーブルの一例を示す図である。
義語・対義語データテーブルの一例を示す図である。
【図8】本発明の一実施例の単位文対及びに対す
る用言マッチングの出力を示す図である。
る用言マッチングの出力を示す図である。
【図9】本発明の一実施例の格要素マッチング部の処理
のフローチャート(その1)である。
のフローチャート(その1)である。
【図10】本発明の一実施例の格要素マッチング部の処
理のフローチャート(その2)である。
理のフローチャート(その2)である。
【図11】本発明の一実施例の単位文対に対応する格
要素類義語・対義語データテーブルの例を示す図であ
る。
要素類義語・対義語データテーブルの例を示す図であ
る。
【図12】本発明の一実施例の単位文対及びに対す
る格要素マッチング部の出力の例を示す図である。
る格要素マッチング部の出力の例を示す図である。
【図13】本発明の一実施例の結果判定部の処理フロー
チャートである。
チャートである。
【図14】本発明の一実施例の単位文対及びに対す
る結果判定部の出力の例を示す図である。
る結果判定部の出力の例を示す図である。
【図15】本発明の一実施例の格要素・用言組み合わせ
マッチング部の処理のフローチャートである。
マッチング部の処理のフローチャートである。
【図16】本発明の一実施例の単位文対に対応する格
要素・用言組み合わせテーブルの例を示す図である。
要素・用言組み合わせテーブルの例を示す図である。
【図17】本発明の一実施例の単位文対に対する格要
素・用言組み合わせマッチング部の出力の例を示す図で
ある。
素・用言組み合わせマッチング部の出力の例を示す図で
ある。
【図18】本発明の他の実施例における日本語文間の関
係を示す図である。
係を示す図である。
1 入力部 2 用言マッチング部 3 用言類義語対義語データテーブル 4 格要素マッチング部 5 格要素類義語対義語データテーブル 6 結果判定部 7 格要素、用言組み合わせマッチング部 8 格要素・用言組み合わせテーブル 9 出力部
Claims (1)
- 【特許請求の範囲】 【請求項1】 複数の日本語文から構成される日本語文
章を入力とし、該日本語文間の関係を1つの述語とその
格要素、副詞要素からなる単位文を単位として解析する
日本語文章解析装置において、 前記日本語文間の関係を解析したい2つの単位文の形態
要素解析結果及び、係り受け解析結果を入力する入力部
と、 用言の類義語、対義語を予め記述した用言類義語・対義
語データテーブルと、 格要素の類義語、対義語を予め記述した格要素類義語・
対義語データテーブルと、 格要素と用言の組み合わせを予め記述した格要素・用言
組み合わせテーブルと、 前記入力部より入力された2つの単位文の各述語中の用
言のマッチングを行う用言マッチング部と、 用言の必須格にある格要素間のマッチングを行う格要素
マッチング部と、 前記用言マッチング部の結果と前記格要素マッチング部
の結果を統合して1つの結果とする結果判定部と、 前記用言マッチング部においてマッチングがとれなかっ
たものに対して格要素と用言の組み合わせによるマッチ
ングを行う格要素・用言組み合わせマッチング部と、 入力された前記2つの単位文間の関係を出力する出力部
とを有することを特徴とする日本語文章解析装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3172806A JPH0520354A (ja) | 1991-07-12 | 1991-07-12 | 日本語文章解析装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3172806A JPH0520354A (ja) | 1991-07-12 | 1991-07-12 | 日本語文章解析装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0520354A true JPH0520354A (ja) | 1993-01-29 |
Family
ID=15948721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3172806A Pending JPH0520354A (ja) | 1991-07-12 | 1991-07-12 | 日本語文章解析装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0520354A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07244673A (ja) * | 1994-03-04 | 1995-09-19 | Fujitsu Ltd | 文書索引作成システム |
US7525752B2 (en) | 2006-02-15 | 2009-04-28 | Hitachi Global Storage Technologies Netherlands | Media drive and control method for the same |
JP2012053791A (ja) * | 2010-09-02 | 2012-03-15 | Jvc Kenwood Corp | 情報閲覧装置、情報閲覧システム、サーバ装置および情報閲覧方法 |
JP2012185567A (ja) * | 2011-03-03 | 2012-09-27 | Fujitsu Ltd | 表示制御装置、表示制御方法、および表示制御プログラム |
-
1991
- 1991-07-12 JP JP3172806A patent/JPH0520354A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07244673A (ja) * | 1994-03-04 | 1995-09-19 | Fujitsu Ltd | 文書索引作成システム |
US7525752B2 (en) | 2006-02-15 | 2009-04-28 | Hitachi Global Storage Technologies Netherlands | Media drive and control method for the same |
JP2012053791A (ja) * | 2010-09-02 | 2012-03-15 | Jvc Kenwood Corp | 情報閲覧装置、情報閲覧システム、サーバ装置および情報閲覧方法 |
JP2012185567A (ja) * | 2011-03-03 | 2012-09-27 | Fujitsu Ltd | 表示制御装置、表示制御方法、および表示制御プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10296584B2 (en) | Semantic textual analysis | |
JP3266246B2 (ja) | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 | |
KR20040018404A (ko) | 데이터 처리 방법, 데이터 처리 시스템 및 프로그램 | |
JPH0424869A (ja) | 文書処理システム | |
Saggion et al. | Robust generic and query-based summarization | |
JP3198932B2 (ja) | 文書検索装置 | |
JP3596210B2 (ja) | 関連語辞書作成装置 | |
JP3230606B2 (ja) | 固有名詞特定方法 | |
JP2883153B2 (ja) | キーワード抽出装置 | |
JPH0520354A (ja) | 日本語文章解析装置 | |
JP3123836B2 (ja) | テキスト型データベース装置 | |
Husin et al. | Syntactic rule-based approach for extracting concepts from quranic translation text | |
JP2894301B2 (ja) | 文脈情報を用いた文書検索方法および装置 | |
Jassem et al. | Automatic summarization of polish news articles by sentence selection | |
May et al. | Surprise! What's in a Cebuano or Hindi Name? | |
Yeh | Generation of Anaphors in Chinese | |
Lodhi et al. | Detecting Urdu Text Plagiarism Using Similarity Matching Techniques | |
Yahia et al. | An intelligent algorithm for Arabic soundex function using intuitionistic fuzzy logic | |
Sindhu et al. | SRL based plagiarism detection system for Malayalam documents | |
JP3358100B2 (ja) | 日本語質問メッセージ解析方法及び装置 | |
KR20040042196A (ko) | 정보추출을 위한 이벤트 문장의 단문 구조 분석 장치 및그 방법 | |
Kanitha et al. | Issues in Malayalam Text Summarization | |
Poibeau | A corpus-based approach to Information Extraction | |
JPH0320866A (ja) | テキストベース検索方式 | |
JPS6217872A (ja) | 日本語理解装置 |