JP2770555B2 - 自然言語解析システム - Google Patents

自然言語解析システム

Info

Publication number
JP2770555B2
JP2770555B2 JP2164754A JP16475490A JP2770555B2 JP 2770555 B2 JP2770555 B2 JP 2770555B2 JP 2164754 A JP2164754 A JP 2164754A JP 16475490 A JP16475490 A JP 16475490A JP 2770555 B2 JP2770555 B2 JP 2770555B2
Authority
JP
Japan
Prior art keywords
word
syntax
analysis
key
syntax tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2164754A
Other languages
English (en)
Other versions
JPH0454670A (ja
Inventor
諭 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2164754A priority Critical patent/JP2770555B2/ja
Publication of JPH0454670A publication Critical patent/JPH0454670A/ja
Application granted granted Critical
Publication of JP2770555B2 publication Critical patent/JP2770555B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、自然言語解析技術、すなわち、入力文に含
まれる単語を解析する形態素解析ならびに入力文の構造
を解析する構文解析技術に関し、特に文の構造に応じて
単語分割の仕方が異なるような表現に対処可能な自然言
語解析システムに関する。
〔従来の技術〕
従来の一般的な自然言語解析技術においては、文の構
造に応じて単語分割の仕方が異なるような表現は、基本
的に対象外とされ、どちらかのパターンに固定的に分割
されるようになっていた。
例えば、「をめぐる」という表現を例にとった場合、
「真贋をめぐる論争」という表現の場合には、これを一
つの助詞相当語として扱う方が良いが、「湾内をめぐる
観光船」という表現の場合には、これを上記助詞相当語
とするのはまずく、「めぐる」という動詞を抽出する必
要があるというような問題である。
また、上述のいずれかのパターンに固定されるのを防
ぐため、単語分割の段階で、部分的に構文解析を行って
みて、単語分割の仕方を決定するようにして改良方式も
提案されている。
なお、これに関しては、例えば、長尾 真 監修「日
本語情報処理」(電子通信学会刊,昭和60年3月)の記
載が参考になる。また、宮崎正弘による東京工業大学学
位論文「日本文音声出力のための言語処理に関する研
究」(1986年)も参考になる。
〔発明が解決しようとする課題〕
上述の、従来の一般的な自然言語解析技術において
は、どちらか一方の単語分割のパターンにしか分割でき
ないため、単語分割の結果を何等かの手段で監視し、そ
の分割パターンが望ましい結果でない場合には、人手に
よって修正を施す必要があるという問題があった。
また、上記従来技術のうちの後者、すなわち、改良方
式の場合は、形態素解析の基本方式の上に多数の例外処
理を組み込む必要があるため、処理の見通しが悪くなる
という問題があった。また、形態素解析の段階で、部分
的に行う構文解析と、文全体を対象にして行う構文解析
とでは、処理が重複し、効率の低下が避けられないとい
う問題もあった。
なお、上記従来技術のうち、最後に挙げた論文では、
各種の例外処理を適用して処理を行う方法を示している
が、これには、適用範囲を限定してしまうというマイナ
ス面がある。
本発明は上記事情に鑑みてなされたもので、その目的
とするところは、従来の技術における上述の如き問題を
解消し、文の構造に応じて単語分割の仕方が異なるよう
な表現に対処可能な自然言語解析システムを提供するこ
とにある。また、本発明の他の目的は、形態素解析や構
文解析に各種の例外処理を組み込む必要をなくして、処
理の効率化を実現可能とする自然言語解析システムを提
供することにある。
〔課題を解決するための手段〕
上記目的を達成するため、本発明の自然言語解析シス
テムは、自然言語により表現された文を入力する入力手
段1と、この入力手段1から入力された文(自然言語
文)を単語辞書6を用いて形態素解析し、文中の単語の
分割および各単語が従属する上位概念の範疇を抽出する
形態素解析装置2と、この形態素解析装置2の単語分割
に基づき、構文解析ルール7を用いて構文解析し、入力
文の構文木を、各単語の係り受け関係を含み作成する構
文解析装置3と、予め単語(キー単語)別に、このキー
単語およびこのキー単語の係り受け関係にある単語の、
構文木における相対位置関係(X1,X2,X3)と構文構成
(格関係、連体修飾)および上位概念の範疇(〔抽象
物〕、〔場所〕、〔乗り物〕)からなる組み合わせを条
件とし、この条件を満たす場合の、キー単語およびこの
キー単語の係り受け関係にある単語の分割変更例と構文
構成変更例を対応付けたルールを登録した制御テーブル
8と、構文解析手段3で作成された構文木における単語
をキーとして制御テーブル8を検索し、このキーとした
単語に対応するルールを抽出するキー単語検出部41と、
このキー単語検出部41で抽出したルールの条件が、キー
とした単語および該単語の係り受け関係にある単語の前
記構文木における相対位置関係と構文構造および上位概
念の範疇からなる組み合わせと一致するか否かを判別す
るパターン照合部42と、このパターン照合部42での判別
結果が一致である場合に、キー単語検出部41で抽出した
ルールに登録されている分割変更例と構文構成変更例に
従って、構文解析装置3で作成された構文木における単
語の分割の変更および構文木の修正を行う単語・構文木
生成部43と、この単語・構文木生成部43で修正された構
文木を出力する出力装置5とを設けたことを特徴とす
る。
〔作用〕
本発明に係わる自然言語解析システムにおいては、一
旦形態素解析を行い、次いで、構文解析を行った後に、
これらの結果を用いて単語分割の仕来,構文解析の結果
を見直して、文の構造にふさわしい単語情報,構文木を
得るようにしたものである。すなわち、形態素解析の段
階では、構文上の問題とは無関係に、基本単語に分割を
行い、また、構文解析の段階では、基本的な依存関係を
解析すれば良い。そして、この次の段階で、上で得た単
語情報と構文情報を併せて単語分割を見直すことによ
り、必要に応じて、単語の認定し直し,構文木の変更を
行うというものである。
例えば、前述の「めぐる」については、まず、単語分
割により、「を(助詞)」と「めぐる」(動詞・連体
形)」とに分割され、また、構文解析で「真贋を」→
「めぐる」,「湾内を」→「めぐる」の依存関係が得ら
れる。次の段階で、「真贋」と「論争」,「湾内」と
「観光船」という単語情報と構文情報とを併せて単語分
割を見直すことにより、前者では「めぐる」を1単語の
助詞相当語として認定し直すとともに、「真贋をめぐ
る」が連体修飾の関係で「論争」に係るというように構
文木を変更するが、後者は変更しないというものであ
る。
〔実施例〕
以下、本発明の実施例を図面に基づいて詳細に説明す
る。
第1図は、本発明の一実施例である自然言語解析シス
テムの基本ブロック構成を示す図である。図において、
1は自然言語の文を入力するための入力装置、2は単語
辞書6を用いて入力文を単語分割する形態素解析装置、
3は構文解析ルール7を用いて構文解析を行い構文木を
作成する構文解析装置、4は形態素解析装置2で得られ
た単語情報および構文解析装置3で得られた構文木か
ら、制御テーブル8に従って単語の再認定や構文木の修
正を行う単語・構文木再認定装置、5は単語・構文木再
認定装置4による再認定結果を出力する出力装置を示し
ている。
本実施例に示す自然言語解析システムの動作の概要
は、以下の通りである。
入力装置1から入力された自然言語文は、形態素解析
装置2で単語分割される。構文解析装置3では、形態素
解析装置2からの出力に基づいて、構文解析ルール7を
用いて構文解析を行い、構文木が作成される。次に、単
語・構文木再認定装置4では、形態素解析装置2で得ら
れた単語情報および構文解析装置3で得られた構文木か
ら、制御テーブル8に従って単語の再認定や構文木の修
正が行われる。この結果は、出力装置5から出力される
というものである。
第2図は、上述の単語・構文木再認定装置4の処理内
容を示す図であり、キー単語検出部41,パターン照合部4
2,単語・構文木生成部43から構成されているものであ
る。また、第3図は、単語・構文木再認定装置4の動作
を制御する制御テーブル8の構成例を示す図である。
以下、上述の如く構成された本実施例の自然言語解析
システムの動作を、第4図(a)および(b)に示す入
力文例を用いて、詳細に説明する。
まず、第4図(a)に示す入力文aの場合、入力文a
は、形態素解析装置2において、単語分割結果aに示す
如く分割され、また、構文解析装置3において構文解析
結果aに示す如く構文解析される。なお、構文解析結果
は、一般には、例えば、第4図(c)の如く木構造で表
わされるが、ここでは、便宜上、上述の構文解析結果a
の如く示すことにする。
上述の解析結果を受け取った単語・構文木再認定装置
4では、まず、キー単語検出部41が、制御テーブル8を
調べて、「めぐる」に対するルール51を得る。次に、パ
ターン照合部42が、上述のルール51のパターン条件指定
と、構文解析結果とを照合する。すなわち、まず、「め
ぐる」が含まれるルール51のX2と文節3を対応付け、構
成が一致するか否かを判定する。この場合は一致するの
で、次に、X2と文節3が受ける文節としてX1と文節2
を、更に、係る文節としてX3と文節4を対応付け、それ
ぞれ、構成が一致するか否かを判定する。この場合はす
べて一致するので、条件指定「OK」として、照合を完了
する。
次に、単語・構文木生成部43では、ルール51の単語・
構文木の生成に従って、「をめぐる」という単語(助
詞)を生成して文節2の単語構成を変更し、文節3を削
除するとにより、単語分割結果,構文解析結果を第4図
(a)に示す単語分割結果a′,構文解析結果a′のよ
うに修正する。
第4図(b)に示す入力文bの場合も、同図(a)に
示す入力文aの場合と同様に、形態素解析装置2,構文解
析装置3において、単語分割,構文解析され、単語分割
結果bおよび構文解析結果bに示す如く解析される。更
に、単語・構文木再認定装置4では、キー単語検出部41
で、「めぐる」に対するルール51を得てパターン照合部
42に進み、X2と文節3とを対応付けるが、X1と文節2を
対応付けた際、構成がルールでは、“〔抽象物〕+を”
に対して、構文解析結果では“〔場所〕+を”というよ
うに一致しないため、このルールによる単語・構文木の
再認定は行わない。このため、この場合には、第4図
(a)の場合のような修正は行われない。
上述の如き処理を行うことにより、第4図(a)の入
力文aの場合は、助詞相当語「をめぐる」を認定し、同
図(b)の入力文bの場合は、「めぐる」を動作のまま
残すことが可能となる。
また、一方、第1図に示した形態素解析装置2が「を
めぐる」を固定的に抽出するようになっている場合に
も、制御テーブル8に、第3図に示すルール61を登録し
ておくことにより、第5図に示す如く、最初に説明した
例とは逆の動作を制御することも可能となる。
上記実施例によれば、文の構造に応じて単語分割の仕
方が異なるような表現にも容易に対処することができる
ようになうという効果がある。
また、形態素解析や構文解析に各種の例外処理を組み
込む必要がないため、処理の見通しを明快に保ったまま
で、解析の適用範囲を拡大していくことが可能になると
いう効果もある。
なお、上記実施例は本発明の一例として示したもので
あり、本発明はこれに限定されるべきものではないこと
は言うまでもない。
〔発明の効果〕
以上、詳細に説明した如く、本発明によれば、文の構
造に応じて単語分割の仕方が異なるような表現に対処可
能であり、かつ、形態素解析や構文解析に各種の例外処
理を組み込む必要をなくして、処理の効率化を実現可能
とするという顕著な効果を奏するものである。
【図面の簡単な説明】
第1図は本発明の一実施例である自然言語解析システム
の基本ブロック構成を示す図、第2図は単語・構文木再
認定装置の処理内容を示す図、第3図は単語・構文木再
認定装置の動作を制御する制御テーブルの構成例を示す
図、第4図,第5図は単語・構文木再認定装置の動作を
説明するための入力文とその解析結果を示す図である。 1:入力装置、2:形態素解析装置、3:構文解析装置、4:単
語・構文木再認定装置、5:出力装置、6:単語辞書、7:構
文解析ルール、8:制御テーブル。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】自然言語により表現された文を入力する入
    力手段と、 該入力手段から入力された文を予め用意された単語辞書
    を用いて形態素解析し、文中の単語の分割および各単語
    が従属する上位概念の範疇を抽出する形態素解析手段
    と、 該形態素解析手段の単語分割に基づき、予め用意された
    構文解析ルールを用いて構文解析し、前記入力文の構文
    木を、各単語の係り受け関係を含み作成する構文解析手
    段と、 予め単語(キー単語)別に、 該キー単語および該キー単語の係り受け関係にある単語
    の、前記構文木における相対位置関係と構文構成および
    前記上位概念の範疇からなる組み合わせを条件とし、該
    条件を満たす場合の、前記キー単語および該キー単語の
    係り受け関係にある単語の分割変更例と構文構成変更例
    を対応付けたルールをテーブル登録する手段と、 前記構文解析手段で作成された構文木における単語をキ
    ーとして前記テーブルを検索し、該キーとした単語に対
    応するルールを抽出するキー単語検出手段と、 該キー単語検出手段で抽出したルールの条件が、前記キ
    ーとした単語および該単語の係り受け関係にある単語の
    前記構文木における相対位置関係と構文構造および上位
    概念の範疇からなる組み合わせと一致するか否かを判別
    するパターン照合手段と、 該パターン照合手段での判別結果が一致である場合に、
    前記キー単語検出手段で抽出したルールに登録されてい
    る前記分割変更例と構文構成変更例に従って、前記構文
    解析手段で作成された構文木における単語の分割の変更
    および該構文木の修正を行う単語・構文木生成手段と、 該単語・構文木生成手段で修正された構文木を出力する
    出力手段と を設けたことを特徴とする自然言語解析システム。
JP2164754A 1990-06-22 1990-06-22 自然言語解析システム Expired - Lifetime JP2770555B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2164754A JP2770555B2 (ja) 1990-06-22 1990-06-22 自然言語解析システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2164754A JP2770555B2 (ja) 1990-06-22 1990-06-22 自然言語解析システム

Publications (2)

Publication Number Publication Date
JPH0454670A JPH0454670A (ja) 1992-02-21
JP2770555B2 true JP2770555B2 (ja) 1998-07-02

Family

ID=15799290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2164754A Expired - Lifetime JP2770555B2 (ja) 1990-06-22 1990-06-22 自然言語解析システム

Country Status (1)

Country Link
JP (1) JP2770555B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5280642B2 (ja) 2007-04-23 2013-09-04 株式会社船井電機新応用技術研究所 翻訳システム及び翻訳プログラム、並びに、対訳データ生成方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61128372A (ja) * 1984-11-26 1986-06-16 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 英日機械翻訳装置
JPH0262665A (ja) * 1988-08-29 1990-03-02 Nec Corp 形熊素分解方式

Also Published As

Publication number Publication date
JPH0454670A (ja) 1992-02-21

Similar Documents

Publication Publication Date Title
JP2770555B2 (ja) 自然言語解析システム
JP2757731B2 (ja) 文書解析装置
JPH04316164A (ja) 自然言語述語表現解析方法
JPH07121379A (ja) 複数言語混在コンパイラ
JPH06162073A (ja) 自然言語解析方法
JP3287068B2 (ja) 自然言語自動翻訳装置
JP2504449B2 (ja) 日本語文節間係り受け解析装置
JP2742280B2 (ja) 日本語自動解析装置
JPH05257967A (ja) 機械翻訳装置
JP2601547B2 (ja) 内部手続き引数検査装置
JPH1091628A (ja) 構文解析システム
JPH04230572A (ja) 日本語文分割装置
JPH06259467A (ja) 機械翻訳装置
JPH0652218A (ja) 自然言語自動翻訳方法
JPH05143638A (ja) 自然言語解析方法
JPH05108709A (ja) 自然言語変換方法
JPH0573336A (ja) アンパーザ自動生成処理装置
JPH05250404A (ja) 自然言語解析方法
JPH0765001A (ja) 自然言語解析方法
JPH10105552A (ja) 機械翻訳システム
JPH04184677A (ja) 日本語構文解析システム
JPH06236397A (ja) 機械翻訳方式
JPH0756918A (ja) 日本語解析方法
JPH04205463A (ja) 自然言語接続様相解析処理方法
JPH0454671A (ja) 自然言語翻訳装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090417

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090417

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100417

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100417

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110417

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110417

Year of fee payment: 13