JPH05108709A - 自然言語変換方法 - Google Patents

自然言語変換方法

Info

Publication number
JPH05108709A
JPH05108709A JP3272715A JP27271591A JPH05108709A JP H05108709 A JPH05108709 A JP H05108709A JP 3272715 A JP3272715 A JP 3272715A JP 27271591 A JP27271591 A JP 27271591A JP H05108709 A JPH05108709 A JP H05108709A
Authority
JP
Japan
Prior art keywords
syntax
clause
word
syntax tree
natural language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3272715A
Other languages
English (en)
Inventor
Satoshi Shirai
諭 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP3272715A priority Critical patent/JPH05108709A/ja
Publication of JPH05108709A publication Critical patent/JPH05108709A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 本発明の目的は、言語変換における入力文に
含まれる冗長な表現を自動的に除去し、入力文と等価で
簡潔な表現に対する構文解析結果を生成する自然言語変
換方法を提供することである。 【構成】 本発明は入力部(1)から入力された自然言
語文は、形態素解析部(2)で解析辞書(6)を用いて
単語分割され、構文解析部(3)では形態素解析部
(2)の出力に基づいて構文解析ルール(7)を用いて
構文解析を行い、構文木が生成される。次に修正部
(4)において、形態素解析部(2)で得られた単語情
報及び構文解析部で得られた構文木に対して、制御ルー
ル(8)に従って冗長性を除去し、これに基づいて単語
の再認定や構文木の修正が行われる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は自然言語変換方法に係
り、特に、入力文に含まれる単語を解析する形態素解析
及び、入力文の構造を解析する構文解析に関し、解析結
果から入力文構造の冗長性を検出し、等価で且つ簡潔な
表現の文に対応する解析結果に自動的に変換する自然言
語変換方法に関する。
【0002】
【従来の技術】従来は、構文解析結果を簡潔な形に積極
的に変換するという考え方は殆どない。従って、従来の
自然言語解析方法においては、文の構造に即した構文木
が生成されるのが一般的である。もし、解析結果に何ら
かの問題があるような場合は、解析過程の中に例外処理
を組み込むことによって対処している。このような処理
については、文献:( 長尾真監修「日本情報処理」(電
子通信学会刊、1985年3 月 )の記載が参考になる。
【0003】
【発明が解決しようとする課題】従来の自然言語解析の
技術では、入力部の冗長性はそのまま解析結果の構文木
に現れる。勿論、それ自体が悪い訳ではないが、その解
析方法を自然言語処理システム、例えば、機械翻訳シス
テムに適用すると、訳文にもそのまま冗長性が反映され
る。日本語入力、英語出力といった入力言語と出力言語
の性質の違いから極めて読み難い訳文となることがしば
しば起きるという問題がある。
【0004】具体的な例を説明すると、入力言語が日本
語の場合、例えば、「犬もいれば猫もいる」という文の
場合は、従属節の「犬もいれば」の述語「いれば」には
あまりこだわる必要はなく、文全体としては「犬も猫も
いる」と略等価である。また、「川崎から横浜にかけて
雨が降った」では、やはり従属節「川崎から横浜にかけ
て」の述語「かけて」にはこだわらず、文全体として
は、「川崎から横浜まで雨がふった」と略等価である。
いずれにおいても、出力言語を英語として、従属節の述
語にこだわった英文を作ると、意味が不明確になる恐れ
が多分にある。このために、機械翻訳システムでは、前
編集と称して、上述のような冗長表現を人手で除去する
ことが一般に必要である。従って、このような冗長性を
自動的に除去できれば、大変便利である。
【0005】本発明は上記の点に鑑みなされたもので、
入力文に含まれる冗長な表現を自動的に除去し、入力文
と等価で簡潔な表現に対する構文解析結果を生成する自
然言語変換方法を提供することである。
【0006】
【課題を解決するための手段】自然言語で表現される入
力文を単語毎に分割し、入力文を主節と従属節より構成
される構文木に変換し、構文木の従属節を抽出し、従属
節及び主節に含まれる述語及び格要素を対象として、冗
長性を除去するための単語表記及び単語の属性に関する
条件に基づいて従属節を主節に属するいくつかの格要素
に変更することにより構文木を修正し、その修正された
構文木を出力する。
【0007】
【作用】本発明の自然言語変換方法は、構文木の従属節
を抽出し、従属節及び、主節に含まれる述語及び各要素
を対象として、単語表記及び単語属性に関する条件に基
づいて従属節を主節に属するいくつかの格要素に変換
し、この変更に基づいて構文木を修正することにより、
入力文が冗長性を持つ場合においても出力される文で
は、その冗長性を除去することができる。
【0008】
【実施例】以下に図面を用いて本発明の実施例を説明す
る。図1は本発明の一実施例の自然言語変換方法を実施
する自然言語解析システムの構成を示すブロック図であ
る。本実施例における自然言語解析システムは入力部
1、形態素解析部2、構文解析部3、修正部4、解析辞
書6、構文解析ルール7、制御ルール8より構成され
る。
【0009】同図において、入力部1から入力された自
然言語文は形態素解析部2で解析辞書6を用いて単語分
割される。構文解析部3では、形態素解析部2からの出
力に基づいて、構文解析ルール7を用いて構文解析を行
い、主節と従属節を有する構文木が生成される。次に、
修正部4では、形態素解析部2で得られた単語情報及び
構文解析部3で得られた構文木に対して、制御ルール8
に従って冗長性を除去し、冗長性除去後、これに基づい
て単語の再認定や構文木の修正が行われる。この結果は
出力部5から出力される。
【0010】図2は本発明の一実施例の修正部の構成を
示すブロック図である。同図は、本発明が直接関与する
部分である。同図に示すように修正部4はキー単語検出
部41、パターン照合部42、単語・構文木生成部43
から構成され、形態素解析部2からの形態素解析結果
と、構文解析部3からの構文解析結果を入力とし、この
修正部4での修正結果を出力とする。
【0011】図3は本発明の一実施例の制御ルールの内
容を示すものであり、同図は、修正部4の動作を制御す
る制御ルール8の内容を示す説明図である。この制御ル
ール8は、例えば、「犬もいれば、猫もいる。」「川崎
から横浜にかけて、雨が降った。」などという文におい
て、「ば」及び「かけて」は、それぞれの文の従属節の
特徴的な単語である。
【0012】この修正部4は、制御ルール8に基づい
て、キー単語検出部41により「ば」「かける」などを
キー単語として取り上げるとともに、パターン照合部4
2でそれぞれのキー単語にルール番号を付与し、このル
ール番号に対して、従属節ならびに主節の述語と格要素
の単語構成を条件として設定し、単語・構文木生成部4
3ではこれらの条件に基づいて単語の生成及び、構文木
の変更を行うように構成されている。
【0013】なお、図3において、〈動詞1〉は任意の
動詞を表し、“ば”は単語表記が「ば」であることを表
し、〔場所〕は単語属性が「場所」に関係するグループ
に属する名詞であることを表している。
【0014】この例の制御ルールでは、キー単語(ば)
にルール番号101を付与し、その単語の生成及び構文
木の変更のルールとして、“従属節の述語を削除し、従
属節の格要素のの任意の単語“も”を主節の格要素と
する。また、キー単語(かける)にルール番号201を
付与し、その単語の生成及び構文木の変更ルールとし
て、“従属節の述語を削除し、従属節の格要素の〔場
所〕+“まで”に変更し、とを主節の格要素とす
る。
【0015】次に図4と図5に示す入力文を用いて本実
施例の動作を説明する。図4及び図5は本発明の一実施
例の入力文例とその解析結果を示す。図4に示す入力文
aの「犬もいれば猫もいる」の場合、形態素解析部2に
おいて、単語分割結果aのように文節毎に単語分割され
る。例えば、文節1では、「犬も」を“犬/も”とし、
文節2では同様に「いれば」を“いれ/ば”、文節3で
は「猫も」を“猫/も”、文節4では、「いる」を“い
る”のように分割される。
【0016】その後、構文解析部3において、構文解析
結果aのような従属節と主節で構成される構文木が生成
される。修正部4では、入力文に従属節が含まれている
ので、先ず、キー単語検出部41が制御ルール8を調べ
て、従属節の述語に含まれる「ば」に対するルール10
1を得る。次に、パタン照合部42が上述のルール10
1の各条件と単語情報及び構文木とを照合する。即ち、
この例では、照合部42は構文木の構造から、従属節の
述語の条件と文節2、従属節の各要素の条件と文節1、
主節の述語の条件と文節4、主節の格要素の条件と文節
3を照合する。ここで、〈動詞1〉が、従属節の述語と
主節の述語に指定されているので、この2つは同じ動詞
でなければならない。これらが全て、一致するので、パ
ターン照合部42は、照合結果を「OK」として照合を
完了する。
【0017】次に、単語・構文木生成部43ではルール
101の単語の生成及び構文木の変更の指定に従って、
文節1、文節3、文節4は変更なしとし、文節2のみを
削除とする。これにより、文節1からなる各要素の所
属を主節に変更し、この結果、従属節を消滅させる。こ
うして得られた単語分割結果及び構文解析結果は単語分
析結果a’及び構文分析結果a’のようになる。従っ
て、文節1(犬も)、文節2(猫も)、文節4(いる)
となり、これは、入力文を「犬も猫もいる。」とした場
合の解析結果に相当し、入力文の冗長性が除去されてい
る。
【0018】図5に示す入力文bの場合も入力文aの場
合と同様の経過をたどり、キー単語検出部41でルール
201を取り出し、パターン照合部42でルール201
の各条件と単語情報及び構文木とを照合する。その結果
「OK」と判定される。この後、単語・構文木生成部4
3では、ルール201の単語及び構文木の変更の指定に
従って、単語分割結果b’に示すように、文節1、文節
4及び文節5は変更無しとし、文節2に関しては、助詞
の「に」を「まで」に変更するとともに、格要素をと
今変更した文節2からなる格要素の所属を主節に変更
し、文節3を削除し従属節を消滅させる。こうして単語
分割結果b’と構文解析結果b’が得られる。従って、
文節1(川崎から)、文節2(横浜まで)、文節4(雨
が)、文節5(降った)となり、これは、入力文「川崎
から横浜まで雨が降った」に対する解析結果に相当す
る。
【0019】
【発明の効果】上述のように、本発明の自然言語変換方
法によれば、構文木の従属節を抽出し、従属節及び主節
に含まれる述語及び格要素を対象として、単語表記及び
単語属性に関する条件に基づいて、従属節を主節に属す
るいくつかの格要素に変換し、この変換に基づいて構文
木を修正するため、冗長性をもつような入力文であって
も、簡潔な構文木を得ることができ、解析過程の中に例
外処理を組み込むことなく、効率的な自然言語処理シス
テムを構築することができる。従って、機械翻訳等にお
いて、入力文の冗長表現を人手によって除去するのでは
なく、自動的に除去することができる。
【図面の簡単な説明】
【図1】本発明の一実施例の自然言語変換方法を実施す
る自然言語解析システムの構成を示すブロック図であ
る。
【図2】本発明の一実施例の修正部の構成を示すブロッ
ク図である。
【図3】本発明の一実施例の制御ルールの内容を示す図
である。
【図4】本発明の一実施例の入力文例とその解析結果を
示す図である(その1)。
【図5】本発明の一実施例の入力文例とその解析結果を
示す図である(その2)。
【符号の説明】
1 入力部 2 形態素解析部 3 構文解析部 4 修正部 5 出力部 6 解析辞書 7 構文解析ルール 8 制御ルール 41 キー単語検出部 42 パターン照合部 43 単語・構成木生成部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 自然言語で表現される入力文を単語毎に
    分割し、前記入力文を主節と従属節より構成される構文
    木に変換し、 前記構文木の前記従属節を抽出し、前記従属節及び前記
    主節に含まれる述語及び格要素を対象として、冗長性を
    除去するための単語表記及び単語の属性に関する条件に
    基づいて前記従属節を前記主節に属するいくつかの格要
    素に変更することにより前記構文木を修正し、 修正された前記構文木を出力することを特徴とする自然
    言語変換方法。
JP3272715A 1991-10-21 1991-10-21 自然言語変換方法 Pending JPH05108709A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3272715A JPH05108709A (ja) 1991-10-21 1991-10-21 自然言語変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3272715A JPH05108709A (ja) 1991-10-21 1991-10-21 自然言語変換方法

Publications (1)

Publication Number Publication Date
JPH05108709A true JPH05108709A (ja) 1993-04-30

Family

ID=17517782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3272715A Pending JPH05108709A (ja) 1991-10-21 1991-10-21 自然言語変換方法

Country Status (1)

Country Link
JP (1) JPH05108709A (ja)

Similar Documents

Publication Publication Date Title
KR900006671B1 (ko) 언어생성장치
US5608623A (en) Special cooccurrence processing method and apparatus
JPS58192173A (ja) 機械翻訳装置
JPH03260766A (ja) 括弧生成判定機能付翻訳装置
JPH05108709A (ja) 自然言語変換方法
JPH06195383A (ja) 知識ベース構築方式
KR100204068B1 (ko) 개념기반 다국어 번역시스템의 문법 자동수정 방법
JP2008217529A (ja) テキスト分析装置およびテキスト分析プログラム
JP3339006B2 (ja) 機械翻訳装置における並列名詞句処理装置
JP2794919B2 (ja) 機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPS63136265A (ja) 機械翻訳装置
JPH06236394A (ja) 自然言語自動翻訳装置
Carlson et al. Independent transfer using graph unification
JPS61115171A (ja) 機械翻訳システム
JPH05189492A (ja) 検索式自動生成装置
JPH064573A (ja) 機械翻訳装置
JPH05324711A (ja) 自然言語自動翻訳システム
JPH10340264A (ja) 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH04316164A (ja) 自然言語述語表現解析方法
JPH0652218A (ja) 自然言語自動翻訳方法
JPH0490051A (ja) 自然言語自動翻訳装置
Ács et al. Generating IRTG grammars from parallel data
JPH0481971A (ja) 機械翻訳機
JPH01112368A (ja) 機械翻訳装置