JPH0962682A - 英文解析システム - Google Patents

英文解析システム

Info

Publication number
JPH0962682A
JPH0962682A JP7213226A JP21322695A JPH0962682A JP H0962682 A JPH0962682 A JP H0962682A JP 7213226 A JP7213226 A JP 7213226A JP 21322695 A JP21322695 A JP 21322695A JP H0962682 A JPH0962682 A JP H0962682A
Authority
JP
Japan
Prior art keywords
expression
idiomatic
item
syntax
extended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7213226A
Other languages
English (en)
Inventor
Tadayuki Tsunashima
督之 綱島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7213226A priority Critical patent/JPH0962682A/ja
Publication of JPH0962682A publication Critical patent/JPH0962682A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 as…as構文の慣用表現及び慣用類似表現を一
括して扱うことができない。 【解決手段】 入力英文に含まれているas…as構文の慣
用表現又は慣用類似表現を検索できる検索用のキー情報
と、このキー情報に対応付けて、as…as構文の慣用表現
又は慣用類似表現の文内で機能する範囲と、文内で機能
する部分を一まとまりとして扱った場合にそのまとまり
部分についてその後の処理時に必要となる情報とでなる
付与情報を格納している拡張慣用表現参照記憶部を有す
る。この拡張慣用表現参照記憶部のキー情報を参照し
て、入力英文に、所定のas…as構文の慣用表現又は慣用
類似表現が存在するか否かを確認し、存在する場合に、
その入力英文におけるas…as構文として関連がある部分
を一まとまりにし、この一まとまりの部分に上記付与情
報を付与する、形態素解析部の後段に設けられた拡張慣
用表現処理部を有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、英文を解析する英
文解析システムに関し、例えば、英文を解析して適切な
目的言語の文(例えば日本文)に変換して出力する英文
機械翻訳システム(英日機械翻訳システム)に適用し得
るものである。
【0002】
【従来の技術】機械翻訳等の自然言語処理システムにお
いては、最初に入力文の解析が行なわれる。長文は、省
略、倒置、慣用句等の特殊現象が輻輳して複雑になって
いることが多く、このような特殊現象は様々な言語表現
で発生するが、言語表現を特定することによって発生現
象を制限することが可能である。従って、長文解析技術
の高度化のためには、言語表現毎の特殊現象へのアプロ
ーチを進めることが効果的である。
【0003】英文の長文において頻出する言語表現とし
ては、as…asやmore…thanのように「連結詞が分離し、
前後相応じて一個の連結詞としての役目を果たす」相関
的表現があり、特に、as…as構文が実用文において最も
多く頻出する相関的表現である。このような相関的表現
を含む長文の処理を考えた場合、文法書で述べられてい
る文法上の知識のみではうまく解析できない場合があ
り、そのため、相関的表現を含む文に適した解析方法が
検討されており、as…as構文を含む英文の解析方法とし
て、下記文献に記載の方法が既に提案されている。
【0004】文献『桝井文人、綱島督之、杉尾俊之、田
添丈博、相馬陽一、椎野努、「比較構造の特性を利用し
た英日機械翻訳処理の検討」、信学技報、TECHNICAL RE
PORT OF IEICE. NLC93-67 、pp.31-38、1994年3月』 この文献に記載の解析方法では、as…as構文のas対に挟
まれている共通項の特性を抽出する用法認識部と、as…
as構文の左側の範囲と右側の範囲を決定する支配範囲認
識部と、as…as構文の比較構造の特性を生かして基底構
造を復元する構造認識部とより、as…as構文が支配する
統語構造に依存し、構造解析によって意味を把握するこ
とが可能な用法に限定されて、解析処理が行なわれてい
た。
【0005】
【発明が解決しようとする課題】しかしながら、as…as
構文の表現の中にも、慣用的に使用される慣用表現や、
この慣用表現に類似する用法を持つ表現(これ自身が慣
用表現になっていることもあるが、以下では、慣用類似
表現と呼ぶこととする)があり、上述した従来方法で
は、これら慣用表現や慣用類似表現に柔軟に対応でき
ず、as…as構文に対する解析処理としては不十分であっ
て、技術的に満足できるものは得られなかった。
【0006】かかる不都合を解決すべく、as…as構文の
表現の中で慣用的に使用される慣用表現についても、as
…as表現に使用される慣用表現以外の慣用表現と共に、
英日機械翻訳システムの中で慣用表現用のテーブル等を
用いて一括して取扱うことも考えられる。
【0007】しかし、このようにしても、as…as構文の
慣用類似表現には柔軟に対応できず、また、表層的に類
似していて処理の関連性の高い言語現象(as…as構文の
慣用表現や慣用類似表現)を別個に扱うことになり機械
翻訳システムのメインテナンスを困難にし、運用に支障
をきたすことになる。また、慣用表現等を登録する際に
も、その登録操作が煩雑になるという課題がある。すな
わち、as…as構文の慣用表現や慣用類似表現の中には、
用法が同じで構成する語句の多くが重複しているが一部
の語句だけが異なる、“as far as the eye can reach
”と“as far as the eye can see ”とのような表現
があり、このような表現を登録する際には一つ一つ別々
に登録しなくてはならない。また、表現の一部に特定の
単語列の機能が出現するような“as far as (名詞句)
be concerned ”や“ go as far as (不定詞又は動名
詞)”のような表現があり、このような表現を登録する
際には、表現の一部にある特定の機能を指定するように
しなくてはならない。
【0008】そのため、as…as構文の慣用表現や慣用類
似表現の処理として、表層的に類似していて処理の関連
性が高い言語現象としてas…as構文の慣用表現及び慣用
類似表現を一括して扱うことができ、その登録方法にお
いて、表現の一部の語句が重複する場合や表現の一部に
ある特定の機能が出現する場合にも運用可能な英文解析
システムが望まれている。
【0009】
【課題を解決するための手段】かかる課題を解決するた
め、本発明においては、入力部が取り込んだ英文を解析
する英文解析システムにおいて、以下のような拡張慣用
表現参照記憶部と拡張慣用表現処理部とを有することを
特徴とする。
【0010】拡張慣用表現参照記憶部は、as…as構文の
慣用表現又は慣用類似表現について、その表現のas対の
左、中間、右にある左辺語句、共通項語句、右辺語句の
情報を、左辺語句及び右辺語句については語句の種別や
語句群を規定する変数表現を許容して、検索用のキー情
報として格納していると共に、このキー情報に対応付け
て、as…as構文の慣用表現又は慣用類似表現の文内で機
能する範囲を示す機能範囲と、文内で機能する部分を一
まとまりとして扱った場合にそのまとまり部分について
その後の処理時に必要となる情報とでなる付与情報を格
納しているものである。
【0011】拡張慣用表現処理部は、拡張慣用表現参照
記憶部のキー情報を参照して、入力英文に、所定のas…
as構文の慣用表現又は慣用類似表現が存在するか否かを
確認すると共に、as…as構文の慣用表現又は慣用類似表
現が存在する場合に、その入力英文におけるas…as構文
として関連がある部分を一まとまりにし、この一まとま
りの部分に、拡張慣用表現参照記憶部のキー情報に対応
した付与情報を付与する、形態素解析部の後段に設けら
れたものである。
【0012】以上のような拡張慣用表現参照記憶部と拡
張慣用表現処理部を設けたことにより、as…as構文の慣
用表現や慣用類似表現の処理として、表層的に類似して
いて処理の関連性が高い言語現象としてas…as構文の慣
用表現及び慣用類似表現を一括して扱うことができ、そ
の登録方法において、表現の一部の語句が重複する場合
や表現の一部にある特定の機能が出現する場合にも、語
句の種別や語句群の規定方法を用いることで運用可能な
英文解析システムを実現できる。
【0013】
【発明の実施の形態】以下、本発明による英文解析シス
テムを英日機械翻訳システムに適用した一実施形態を図
面を参照しながら詳述する。
【0014】この英日機械翻訳システムは、例えば、入
力装置や処理装置や記憶装置(補助記憶装置を含む)や
出力装置を備えたワークステーション等の情報処理装置
上に構築されるが、機能的には図1に示す構成を有す
る。
【0015】すなわち、この英日機械翻訳システムは、
機能的には、入力部1、形態素解析部2、形態素解析辞
書3、拡張慣用表現処理部4、拡張慣用表現参照テーブ
ル5、解析部6、解析辞書7、変換部8、変換辞書9、
生成部10、生成辞書11、形態素生成部12、形態素
生成辞書13及び出力部14から構成されている。
【0016】入力部1は翻訳対象の英文を読み込むもの
である。形態素解析部2は、読み込まれた英文について
形態素解析辞書3を用いて、単語の分割、及び、分割し
た単語の品詞、用法、訳等の情報を付与する処理を行な
うものである。
【0017】拡張慣用表現処理部4は、形態素解析結果
に基づいて、図2(図3)に示す構成を有する後述する
拡張慣用表現参照テーブル5を用いて、as…as構文の慣
用表現や慣用類似表現の用法、訳を決定する処理を行な
うものである。この拡張慣用表現処理部4による処理
は、as…as構文の慣用表現又は慣用類似表現がas対と共
に特定の語句及び特定の機能を持つ語句の列を伴って現
れることや、関連する複数の語句が文内で簡便な用法と
して機能していることに着目し、as対の特定の位置に出
現する特定の語句及び特定の語句列を手がかりにして、
as…as構文の慣用表現又は慣用類似表現を自動的に選択
し、関連のある部分を一まとまりに変換し、後の処理過
程において簡単に扱えるようにするものである。
【0018】解析部6は、形態素解析結果及び拡張慣用
表現結果に基づいて、解析辞書7を用いて構文の解析を
行なうものである。変換部8は、その解析結果に基づい
て、変換辞書9を用いて英文を日本文に変換するもので
ある。生成部10は、その変換結果に基づいて、生成辞
書11を用いて生成すべき目的言語である日本語の単
語、活用形態及びその語順を決定する処理を行なうもの
である。形態素生成部12は、その生成結果に基づい
て、形態素生成辞書13を用いて日本語の自然な文とし
て整えるものである。出力部14は整えられた文を出力
するものである。
【0019】なお、入力部1〜形態素解析辞書3、及
び、解析部6〜出力部14は、従来の英日機械翻訳シス
テムと同様なものである。言い換えると、この実施形態
に係る英日機械翻訳システムは、拡張慣用表現処理部4
及び拡張慣用表現参照テーブル5を備えている点が、従
来の英日機械翻訳システムと異なっており、特徴をなし
ている。
【0020】図2は、拡張慣用表現処理部4が参照する
上述した拡張慣用表現参照テーブル5の項目構成例を示
す説明図である。なお、図2は、ユーザが拡張慣用表現
(定義は後述する)を編集(登録、変更、削除)する際
の項目面から、拡張慣用表現参照テーブル5の構成を示
したものである。
【0021】拡張慣用表現参照テーブル5は、as…as構
文の慣用表現や慣用類似表現が入力英文に含まれている
か否かを検索するときのキーとなる情報を格納してある
キー項目101と、このキー項目101に対応付けられ
て、入力英文(そのas…as構文)がキー項目に合致した
場合に、形態素解析結果に付与される情報を格納してあ
る付与情報項目102とから構成されており、各慣用表
現(ここではそれに類似する慣用類似表現を含む概念で
あり、以下では必要に応じて、慣用表現とそれに類似す
る慣用類似表現をまとめて拡張慣用表現と呼ぶ)毎に、
キー情報及び付与情報が格納されている。
【0022】キー項目101は、as…as構文の慣用表現
又は慣用類似表現のas対の左にある左辺語句項目103
と、as対に挟まれている共通項語句項目104と、as対
の右にある右辺語句項目105と、左辺又は右辺の語句
中の記述で変数として指定したものの機能107や語句
108を規定する変数条件項目106とから構成されて
いる。変数条件項目106の機能項目107には、左辺
語句項目103、右辺語句項目105の記述において、
変数指定した場合の変数における名詞句、動詞、不定詞
等の機能が格納されている。変数条件項目106の語句
項目108には、左辺語句項目103、右辺語句項目1
05の記述において変数指定した場合の変数が取り得る
語句群(“reach ,see ”等)が格納されている。
【0023】付与情報項目102は、機能範囲項目10
9、用法項目110及び訳項目111から構成されてい
る。機能範囲項目109は、as…as構文の慣用表現又は
慣用類似表現の文内で機能する範囲の情報を、キー項目
101の左辺語句、共通項語句及び又は右辺語句に対応
させて格納している。例えば、左辺だけで機能する場合
には「左」、共通項だけで機能する場合には「共」、右
辺だけで機能する場合には「右」、左辺と共通項で機能
する場合には「左+共」、共通項と右辺で機能する場合
には「共+右」、左辺と共通項と右辺で機能する場合に
は「左+共+右」という略語で記述して格納している。
用法項目110は、機能範囲で記述してある部分を一ま
とまりとして扱った場合の文内での機能(品詞等)を格
納している。訳項目111は、機能範囲で記述してある
部分を一まとまりとして扱った場合の訳を格納してあ
る。この訳項目111は、左辺語句項目103、右辺語
句項目105の記述において変数指定がなされている場
合には、その変数を用いてそのまま変数の訳を用いて使
用できるように変数を指定して記述することもできる。
【0024】例えば、“as far as the eye can reach
”及び“as far as the eye can see ”の拡張慣用表
現参照テーブル5の情報は、キー項目101において、
左辺語句項目103の欄には空白、共通項語句項目10
4の欄には“far ”、右辺語句項目105の欄には変数
“$1”を用いて“the eye (can) $1”が格納されてお
り、また、変数“$1”には語句“reach ”又は“see ”
がくるので、変数条件項目106の機能項目107の欄
には空白、変数条件項目106の語句項目108の欄に
は“$1:reach,see”が格納されており、このキー項目に
対応する付与情報項目102において、機能範囲項目1
09の欄には「共+右」、用法項目110の欄には「副
詞」、訳項目111の欄には「見渡す限り」がそれぞれ
格納されている。
【0025】また例えば、“as far as … be concerne
d ”の拡張慣用表現参照テーブル5の情報は、キー項目
101において、左辺語句項目103の欄には空白、共
通項語句項目104の欄には“far ”、右辺語句項目1
05の欄には“$1”(be) concerned”が格納されてお
り、また、変数“$1”には「名詞句」がくるので、変数
条件項目106の機能項目107の欄は“$1: 名詞
句”、変数条件項目106の語句項目108の欄には空
白がそれぞれ格納されており、このキー項目に対応する
付与情報項目102において、機能範囲項目109の欄
には「共+右」、用法項目110の欄には「副詞」、訳
項目111の欄に「$1に関する限り」がそれぞれ格納さ
れている。
【0026】ここで、右辺語句項目105の欄の“(b
e)”の記述において“( )”がついているのは、その語
句が主語に3人称がきたために'sがついたり、時制が過
去あるいは完了になったために活用し、変化した場合に
も対応するための記述である。この例では、“(be)”
は、“is”、“are ”、“am”等に変化しても対応可能
である。上述したas…as構文における“(can) ”も同様
に時制等の変化に対応可能なものである。
【0027】さらに例えば、“go as far as to do”及
び“go as far as doing”の拡張慣用表現参照テーブル
5の情報は、キー項目101において、左辺語句項目1
03の欄には“(go)”、共通項語句項目104の欄には
“far ”、左辺語句項目105の欄には“$1”が格納さ
れており、また、変数“$1”には「不定詞又は動名詞」
がくるので、変数条件106の機能項目107の欄には
“$1: 不定詞、動名詞”、変数条件項目106の語句項
目108の欄には空白がそれぞれ格納されており、この
キー項目に対応する付与情報項目102において、機能
範囲項目109の欄には「左+共」、用法項目110の
欄には「動詞」、訳項目111の欄には「さえする」が
それぞれ格納されている。
【0028】以上説明した図2は、編集(登録等)を考
慮した項目面から拡張慣用表現参照テーブル5の構成を
説明したが、この拡張慣用表現参照テーブル5に新たな
拡張慣用表現のデータが登録されると、そのキー項目1
01の情報は照合処理に適した形式(照合パターン)に
変換され、この照合パターンもキー項目に対応付けられ
て格納される。照合パターンは、拡張慣用表現テーブル
5のキー項目の中の左辺、共通項、右辺の語句に変数条
件を展開し、左辺、共通項、右辺のそれぞれにまとめ
て、入力英文におけるas…as構文との照合に適した形式
に変換したものであり、キー項目の情報と等価である。
すなわち、照合パターンもキー情報と呼ぶことができ
る。
【0029】図3は、上述した拡張慣用表現参照テーブ
ル5のキー項目と、そのキー項目を展開した場合に得ら
れる照合パターンとを示す説明図である。なお、図3で
は、キー項目に対応した付与情報項目の情報の表記を省
略している。
【0030】図3において、キー項目201は拡張慣用
表現参照テーブル5のキー項目を示し、これに対応する
照合パターンを照合パターン202で示している。照合
パターン202は、左辺項目203、共通項項目204
及び右辺項目205から構成されており、キー項目20
1の変数条件の機能及び語句にデータが記述されている
ときには、その変数が展開されて左辺項目203、共通
項項目204、又は、右辺項目205が生成される。キ
ー項目201の変数条件の機能にデータが記述されてい
るときには、照合パターン202の中でその機能を示す
略記号が挿入される。キー項目201の変数条件の語句
にデータが記述されているときには、照合パターン20
2の中でその語句が挿入される。キー項目201の変数
条件の機能及び語句に複数のデータが記述されていると
きには、その複数に記述されたデータ数だけの照合パタ
ーンが生成される。また、キー項目201の変数条件の
機能及び語句にデータが記述されていないときには、キ
ー項目201の左辺語句、共通項語句、右辺語句がその
まま照合パターン202として生成される。
【0031】例えば、拡張慣用表現参照テーブル5のキ
ー項目の情報が“as far as the eye can reach ”及び
“as far as the eye can see ”を表している、図3に
おける第4行L34の情報の場合、照合パターン202
として、変数条件の機能及び語句が展開され、左辺が空
白、共通項が“far ”、右辺が“the eye can reach”
のパターンと、左辺が空白、共通項が“far ”、右辺が
“the eye can see ”のパターンとが生成されて格納さ
れる。
【0032】また例えば、拡張慣用表現参照テーブル5
のキー項目の情報が“as far as …be concerned ”を
表している、図3における第3行L33の情報の場合、
照合パターン202として、変数条件の機能及び語句が
展開され、左辺が空白、共通項が“far ”、右辺が“[N
-p] (be) concerned”のパターンが生成される。ここ
で、“[N-p] ”は、「名詞句」を表す略記号である。
【0033】さらに例えば、拡張慣用表現参照テーブル
5のキー項目の情報が“go as faras to do”及び“to
as far as doing”を表している、図3における第5行
L35の情報の場合、照合パターン202として、変数
条件の機能及び語句が展開され、左辺が“go”、共通項
が“far ”、右辺が“[to-inf]”のパターンと、左辺が
“go”、共通項が“far ”、右辺が“[ger] ”のパター
ンが生成される。ここで、“[to-inf]”は「“to”が伴
う不定詞」、“[ger] ”は「動名詞」を表す略記号であ
る。
【0034】以上のように、拡張慣用表現参照テーブル
5には、図2に示す編集を考慮した形式での格納情報と
共に、図3に示す照合パターンが格納されている。
【0035】次に、この実施形態における特徴的な機能
部である拡張慣用表現処理部4の動作を図4のフローチ
ャートを参照しながら説明する。すなわち、拡張慣用表
現処理部4が、入力英文にas…as構文の慣用表現又は慣
用類似表現が含まれている場合に、どのように処理する
かを説明する。
【0036】拡張慣用表現処理部4は、形態素解析結果
から、入力された英文がas…asを含んでいると認識した
場合には、まず、この英文からas対に挟まれている共通
項の語句を抽出し、この共通項の語句をキーとして拡張
慣用表現参照テーブル5の照合パターン202の共通項
204との照合を行ない、該当する照合パターンデータ
を全て抽出する(ステップ301)。なお、入力された
英文がas対を含んでいない場合には、拡張慣用表現処理
部4は、形態素解析部2からの形態素解析結果を直ちに
解析部6に引き渡す。
【0037】そして、この抽出処理による結果に基づい
て、拡張慣用表現参照テーブル5に、入力英文の共通項
と一致する共通項を有する照合パターンデータがあるか
否かを判定する(ステップ302)。この判定により、
検索された照合パターンデータが1個も存在しなければ
拡張慣用表現処理を終了し、形態素解析部2からの形態
素解析結果を解析部6に引き渡す。この場合には、as…
asを含む文章部分も、解析部6によって、一般的な構文
解析や、慣用表現及び慣用類似表現以外のas…as構文に
対する解析(上記文献参照)が実行される。
【0038】一方、入力英文の共通項と一致する共通項
を有する照合パターンデータが1以上存在すれば、上述
したステップ301で抽出された各照合パターンデータ
のそれぞれについて、その照合パターンデータの左辺と
入力英文での左辺との照合を行ない、該当する照合パタ
ーンデータが存在すればそのデータを全て抽出する(ス
テップ303)。このような左辺の照合では、検索対象
の照合パターンデータの左辺には機能に関する記述と語
句に関する記述が混在している可能性があるので、例え
ば、各照合パターンデータとの照合では最初に語句に関
する記述の照合を行ない、次に機能に関する記述の照合
を行なう。また、この左辺照合時、入力英文の左辺の語
句は、活用することにより語句が変形している場合があ
るので、活用している左辺の語句を(原形)に変換して
照合する。さらに、照合パターンデータの左辺が空白の
場合には、どの語句でも良いので該当する照合パターン
データとして抽出する。
【0039】そして、このステップ303の抽出処理に
よる結果に基づいて、拡張慣用表現参照テーブル5に、
入力英文の左辺と一致する左辺を有する照合パターンデ
ータがあるか否かを判定する(ステップ304)。左辺
が入力英文に一致する照合パターンデータが1個も存在
しなければ、拡張慣用表現処理を終了し、形態素解析部
2からの形態素解析結果を解析部6に引き渡す。
【0040】これに対して、共通項及び左辺が一致する
照合パターンデータが1以上存在すれば(ステップ30
4でYes )、その各照合パターンデータの右辺と入力英
文の右辺との照合を行ない、該当する照合パターンデー
タが存在すればそのデータを抽出する(ステップ30
5)。このような右辺の照合でも、検索される照合パタ
ーンデータの右辺には機能に関する記述と語句に関する
記述が混在している可能性があるので、例えば各照合パ
ターンデータとの照合では最初に語句に関する記述の照
合を行ない、次に機能に関する記述の照合を行なう。ま
た、この照合時にも、右辺の語句は、活用することによ
り語句が変形している場合があるので、活用している右
辺の語句を(原形)に変換して照合する。
【0041】そして、このステップ305の右辺照合に
基づく抽出処理による結果に基づいて、拡張慣用表現参
照テーブル5に、入力英文の右辺と一致する右辺を有す
る照合パターンデータがあるか否かを判定する(ステッ
プ306)。右辺が入力英文に一致する照合パターンデ
ータが存在しなければ、拡張慣用表現処理を終了し、形
態素解析部2からの形態素解析結果を解析部6に引き渡
す。
【0042】一方、右辺が入力英文に一致する照合パタ
ーンデータが存在すれば、共通項、左辺及び右辺の全て
のデータが一致し、その照合パターンデータが規定する
as…as構文の拡張慣用表現が入力英文に存在するので、
該当する付与情報項目102の機能範囲項目109、用
法項目110及び訳項目111から付与情報を得る(ス
テップ307)。その後、付与情報項目102の機能範
囲項目109から得られた情報をチェックし、この機能
範囲の入力英文中の構造を1まとめにし(ステップ30
8)、このまとめた機能単位に、付与情報項目102の
用法項目110及び訳項目111の情報を付与し、形態
素解析部2からの形態素解析結果と共にこの付与情報を
解析部6に引き渡す(ステップ309)。機能単位に訳
項目111の情報を付与する際において、訳項目111
の情報に変数が含まれている場合には、変数を、入力英
文の形態素解析結果(特に訳語)を利用して日本語訳に
置き換えて付与する。
【0043】以上のような拡張慣用表現処理部4の処理
により、as…as構文の慣用表現又は慣用類似表現の処理
として、表層的に類似し処理の関連性が高い言語現象と
してas…as構文の慣用表現を一括して扱うことができ、
慣用表現又は慣用類似表現として特殊に機能する部分は
一まとまりにして、その後の処理で簡単に扱えることが
可能となる。
【0044】すなわち、拡張慣用表現処理部4より後段
の解析部6、変換部8、生成部10及び形態素生成部1
2において、as…as構文の慣用表現部分が恰も1語句や
1個の句と同様に扱われて、最終的に目的言語文である
日本文が生成され、出力部14から出力される。
【0045】以下では、この拡張慣用表現処理部4の動
作を例文を用いて、具体的に説明する。
【0046】まず、入力された英文が、as…as構文の慣
用表現“as far as the eye can reach ”を含む“Ther
e was nothing but sand as far as the eye could rea
ch.”の場合を説明する。
【0047】この場合には、ステップ301において、
入力英文中の共通項の語句として“far ”が抽出され、
拡張慣用表現参照テーブル5における照合パターン20
2の共通項204と照合されることにより、共通項“fa
r ”を含む図5(A)に示す6個の照合パターンの候補
データが検索される。
【0048】次に、ステップ302において、拡張慣用
表現参照テーブル5から抽出できた照合パターンデータ
があるか否かが判定されるが、この場合には、図5
(A)に示すように、検索された6個の照合パターンデ
ータが存在するので、肯定結果が得られる。
【0049】そのため、ステップ303に進み、上述し
たステップ301で抽出された6個の照合パターンデー
タのそれぞれについて、その左辺と入力英文との照合が
実行される。この例の場合、入力英文の左辺は“sand”
(名詞)であるので、照合時に左辺の語句を(原形)に
変換することは実行されない。この入力英文の場合に
は、このステップ303の照合により、ステップ301
で抽出された6個の照合パターンデータのうち、左辺パ
ターンの指定がないものが候補として残り、左辺パター
ンの語句に関する記述“(go)”が存在するものは排除さ
れ、最終的に、図5(B)に示す4個の照合パターンデ
ータが検索される(候補として残る)。
【0050】次に、ステップ304において、左辺照合
後においても拡張慣用表現参照テーブル5から抽出でき
ている照合パターンデータがあるか否かが判定される
が、この場合には、図5(B)に示すように、検索され
た4個の照合パターンデータが存在するので、肯定結果
が得られる。
【0051】そこで、ステップ305において、上述し
たステップ302で抽出された4個の照合パターンデー
タのそれぞれについて、その照合パターンデータの右辺
と入力英文の右辺との照合を実行される。この入力英文
の場合、as対の右側に活用変化している“could ”があ
るので原形“can ”に変換されて照合される。また、図
5(B)に示す1番目及び4番目の照合パターンデータ
の右辺には、機能に関する記述と語句に関する記述が混
在しているので、これらの照合パターンデータとの照合
では最初に語句に関する記述の照合が行なわれ、次に機
能に関する記述の照合を行なわれる。このステップ30
5での照合により、図5(C)に示す1個の照合パター
ンデータが検索される。
【0052】そのため、次のステップ306で拡張慣用
表現参照テーブル5から抽出できた照合パターンデータ
の有無が判定されても肯定結果が得られ、以下の情報付
与動作に進む。
【0053】次のステップ307においては、検索され
た照合パターンデータに対応する付与情報項目102の
機能範囲項目109からは「共+右」、用法項目110
からは「副詞」、訳項目111から「見渡す限り」がそ
れぞれ抽出される。そして、次のステップ308におい
て、この例では、付与情報項目102の機能範囲項目1
09の情報が「共+右」であるから、“There was noth
ing but sand as faras the eye could reach. ”の入
力英文におけるその機能範囲の構造をまとめて“There
was nothing but sand [as far as the eye could reac
h]. ”のようにし、さらに、その次のステップ309に
おいて、機能範囲にまとめた機能単位 [as far as the
eye could reach]に、付与情報項目102の用法項目1
10の情報「副詞」と、訳項目111の情報「見渡す限
り」とを付与する。
【0054】この後、解析部6、変換部8、生成部1
0、形態素生成部12と処理が順次進んでいくが、入力
英文中の[as far as the eye could reach] の部分が用
法が「副詞」であって訳が「見渡す限り」と扱われるこ
とにより、入力英文“There was nothing but sand as
far as the eye could reach. ”に対する日本文として
「見渡す限り、砂ばかりだった。」が得られる。
【0055】次に、入力された英文が、慣用表現である
“as far as … be concerned ”表現を含む“As far a
s stock market prices are concerned, there is no n
eedto worry about fluctuating exchange rate. ”の
場合を説明する。
【0056】この場合にも、ステップ301において、
入力英文中の共通項の語句として“far ”が抽出され、
拡張慣用表現参照テーブル5における照合パターン20
2の共通項204と照合されることにより、共通項“fa
r ”を含む図6(A)に示す6個の照合パターンの候補
データが検索される。
【0057】次に、ステップ302において、拡張慣用
表現参照テーブル5から抽出できた照合パターンデータ
があるか否かが判定されるが、この場合にも、図6
(A)に示すように、検索された6個の照合パターンデ
ータが存在するので、肯定結果が得られる。
【0058】そのため、ステップ303に進み、上述し
たステップ301で抽出された6個の照合パターンデー
タのそれぞれについて、その左辺と入力英文との照合が
実行される。この例の場合、入力英文の左辺は存在しな
いので、照合時に左辺の語句を(原形)に変換すること
は実行されず、この入力英文の場合には、このステップ
303の照合により、ステップ301で抽出された6個
の照合パターンデータのうち、左辺パターンの指定がな
いものが候補として残り、左辺パターンの語句に関する
記述“(go)”が存在するものは排除され、最終的に、図
6(B)に示す4個の照合パターンデータが検索される
(候補として残る)。
【0059】次に、ステップ304において、左辺照合
後においても拡張慣用表現参照テーブル5から抽出でき
ている照合パターンデータがあるか否かが判定される
が、この場合には、図6(B)に示すように、検索され
た4個の照合パターンデータが存在するので、肯定結果
が得られる。
【0060】そこで、ステップ305において、上述し
たステップ303で抽出された4個の照合パターンデー
タのそれぞれについて、その照合パターンデータの右辺
と入力英文の右辺との照合を実行される。この入力英文
の場合、as対の右側に人称変化している“are ”がある
ので原形“be”に変換されて照合される。また、図6
(B)に示す1番目及び4番目の照合パターンデータの
右辺には、機能に関する記述と語句に関する記述が混在
しているので、これらの照合パターンデータとの照合で
は最初に語句に関する記述の照合が行なわれ、次に機能
“[N-p] ”に関する記述の照合を行なわれる。このステ
ップ305での照合により、図6(C)に示す1個の照
合パターンデータが検索される。
【0061】そのため、次のステップ306で拡張慣用
表現参照テーブル5から抽出できた照合パターンデータ
の有無が判定されても肯定結果が得られ、以下の情報付
与動作に進む。
【0062】次のステップ307においては、検索され
た照合パターンデータの付与情報項目102の機能範囲
項目109からは「共+右」、用法項目110からは
「副詞」、訳項目111から「$1に関する限り」がそれ
ぞれ抽出される。そして、次のステップ308におい
て、この例では、付与情報項目102の機能範囲109
の情報が「共+右」であるから、“As far as stock ma
rket prices are concerned, there is no need to wor
ry about fluctuating exchange rate”の入力英文にお
ける機能範囲の構造をまとめて“[As far as stock ma
rket prices are concerned ], there is no need to
worry about fluctuating exchange rate.”のように
し、さらに、その次のステップ309において、機能範
囲にまとめた機能単位[As far as stock market price
s are concerned ]に、付与情報項目102の用法項目
110の情報「副詞」、訳項目111の情報「$1に関す
る限り」を付与する。このとき、訳項目111の情報に
は変数“$1”が含まれているので、このステップ309
において、変数“$1”に相当する部分“stock market p
rices ”の日本語訳「株式市場の価格に関する限り」が
付与される。
【0063】この後、解析部6、変換部8、生成部1
0、形態素生成部12と処理が順次進んでいくが、入力
英文中の[As far as stock market prices are concer
ned ]の部分が用法が「副詞」であって訳が「株式市場
の価格に関する限り」と扱われることにより、入力英文
“As far as stock market prices are concerned, the
re is no need to worry about fluctuating exchage r
ate.”に対する日本文として「株式市場の価格に関する
限り、変換レートの変動を心配する必要はない。」が得
られる。
【0064】次に、入力された英文が、慣用表現“go a
s far as to do”を含む“He wentas far as to say th
at she is a fool.”の場合について説明する。
【0065】この場合にも、ステップ301において、
入力英文中の共通項の語句として“far ”が抽出され、
拡張慣用表現参照テーブル5における照合パターン20
2の共通項204と照合することにより、共通項“far
”を含む図7(A)に示す6個の照合パターンの候補
データが検索され、ステップ302において、照合パタ
ーンデータが検索されたことが確認される。
【0066】次に、ステップ303において、上述した
ステップ301で抽出された6個の照合パターンデータ
のそれぞれについて、その左辺と入力英文との照合が実
行される。この入力英文の場合、as対の左側に活用変化
している“went”があるので原形“go”に変換されて照
合される。この入力英文の場合には、ステップ301に
おいて、抽出された照合パターンデータの左辺の語句に
関する記述“(go)”が存在するものは候補として残り、
左辺の語句の指定がないものは排除され、図7(B)に
示す2個の照合パターンデータが左辺照合によって検索
(候補として残存)される。
【0067】従って、次のステップ304における拡張
慣用表現参照テーブル5の照合パターンデータの有無判
定によっても肯定結果が得られ、その次のステップ30
5において、ステップ303で抽出された2個の照合パ
ターンデータのそれぞれについて、その右辺と入力英文
との照合が実行される。この右辺の照合では、入力英文
のas対の右側は“to say”であるので、図7(C)に示
すように、右辺の機能に関する記述が“[to-inf]”の照
合パターンデータが検索される。このように検索された
ので、ステップ306で肯定結果が得られる。
【0068】そこで、次のステップ307において、検
索された照合パターンデータに対応する付与情報項目1
02の機能範囲項目109からは「左+共」、用法項目
110からは「動詞」、訳項目111からは「さえす
る」がそれぞれ抽出される。そして、次のステップ30
8において、抽出した付与情報項目102の機能範囲項
目109の情報をチェックし、この例では、付与情報項
目102の機能範囲109の情報は「左+共」であるか
ら、入力英文“He went as far as to say thatshe is
a fool.”を“He [went as far as] to say that she i
s a fool.”に変換する。そして最後に、ステップ30
9において、ステップ308で得た“[went as far a
s]”という機能単位にステップ307で得た付与情報項
目102の用法項目110の情報「動詞」、及び、訳項
目111の情報「さえする」を付与する。
【0069】この後、解析部6、変換部8、生成部1
0、形態素生成部12と処理が順次進んでいくが、入力
英文中の [went as far as] の部分が用法が「動詞」で
あって訳が「さえする」と扱われることにより、入力英
文“He went as far as to saythat she is a fool.”
に対する日本文として「彼は、彼女が愚かであると言い
さえした。」が得られる。
【0070】従って、上記実施形態に係る英日機械翻訳
システムによれば、入力英文に、as…as構文の慣用表現
又は慣用類似表現が存在する場合にそれを検索し得るた
めのグループ指定を許容しているキー項目情報と、この
キー項目情報に対応付けて、as…as構文の慣用表現又は
慣用類似表現が文内で機能する部分を一まとまりとして
扱った場合の用法及び訳といった付与情報とを格納して
いる拡張慣用表現テーブルと、この拡張慣用表現参照テ
ーブルの格納情報に従い、入力英文に、as…as構文の慣
用表現又は慣用類似表現が存在する場合にそれを取出し
て関連がある部分を一まとまりに変換し、この一まとま
りの部分に上述の付与情報を付与する拡張慣用表現処理
部とを備えるようにしたので、これ以降の処理過程にお
いて、入力英文中のas…as構文の慣用表現又は慣用類似
表現の部分を簡単に扱うことができる。
【0071】また、拡張慣用表現テーブル及び拡張慣用
表現処理部を設けて、as…as構文の慣用表現や慣用類似
表現を、他の慣用表現の処理とは異なるようにしたこと
により、従来のようにas…as構文の慣用表現又は慣用類
似表現の処理として、表層的に類似し処理の関連性が高
い言語現象としてas…as構文の慣用表現を一括して扱う
ことができないというようなことはなくなると共に、そ
の登録においては、キー項目のグループ表記(変数表
記)を許容したので、表現の一部の語句が重複する場合
や表現の一部にある特定の機能が出現する場合にも柔軟
に運用することができる。
【0072】なお、上記実施形態の説明においては、本
発明を英日機械翻訳システムに適用したものを示した
が、本発明は英文の解析方法に特徴を有するので、原言
語が英語で目的言語が日本語以外の機械翻訳システムに
本発明を適用することができる。また、本発明は英文の
解析方法に特徴を有するので、機械翻訳システムだけで
はなく、英文の解析を必要とする各種の自然言語処理シ
ステムに適用することができる。この場合、図2に示し
た付与情報項目の付与情報、例えば訳情報は、意味情報
等に置き換えられることになる。
【0073】また、上記実施形態の説明においては、キ
ー項目情報及び付与情報をテーブル構成(拡張慣用表現
参照テーブル)で構成したものを示したが、例えば、共
通項、左辺、右辺の順に枝別れしているツリー構成等の
他の構成で格納したものであっても良い。
【0074】
【発明の効果】以上のように、本発明によれば、入力英
文にas…as構文の慣用表現や慣用類似表現が含まれてい
る場合に機能する拡張慣用表現参照記憶部と拡張慣用表
現処理部とを設けたことにより、as…as構文の慣用表現
や慣用類似表現の処理として、表層的に類似していて処
理の関連性が高い言語現象としてas…as構文の慣用表現
及び慣用類似表現を一括して扱うことができ、その登録
方法において、キー項目情報のグループ表記(変数表
記)を許容したので、表現の一部の語句が重複する場合
や表現の一部にある特定の機能が出現する場合にも運用
可能な英文解析システムを実現できる。
【図面の簡単な説明】
【図1】実施形態の英文解析システムを適用した英日機
械翻訳システムの機能ブロック図である。
【図2】拡張慣用表現参照テーブル5の項目構成例を示
す説明図である。
【図3】キー項目情報を照合パターンデータに変換した
場合の説明図である。
【図4】拡張慣用表現処理部4の処理フローチャートで
ある。
【図5】第1の入力英文例に対する拡張慣用表現処理部
4の処理説明図である。
【図6】第2の入力英文例に対する拡張慣用表現処理部
4の処理説明図である。
【図7】第3の入力英文例に対する拡張慣用表現処理部
4の処理説明図である。
【符号の説明】
1…入力部、2…形態素解析部、3…形態素解析辞書、
4…拡張慣用表現処理部、5…拡張慣用表現参照テーブ
ル、6…解析部、7…解析辞書。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力部が取り込んだ英文を解析する英文
    解析システムにおいて、 as…as構文の慣用表現又は慣用類似表現について、その
    表現のas対の左、中間、右にある左辺語句、共通項語
    句、右辺語句の情報を、左辺語句及び右辺語句について
    は語句の種別や語句群を規定する変数表現を許容して、
    検索用のキー情報として格納していると共に、このキー
    情報に対応付けて、as…as構文の慣用表現又は慣用類似
    表現の文内で機能する範囲を示す機能範囲と、文内で機
    能する部分を一まとまりとして扱った場合にそのまとま
    り部分についてその後の処理時に必要となる情報とでな
    る付与情報を格納している拡張慣用表現参照記憶部と、 この拡張慣用表現参照記憶部のキー情報を参照して、入
    力英文に、所定のas…as構文の慣用表現又は慣用類似表
    現が存在するか否かを確認すると共に、as…as構文の慣
    用表現又は慣用類似表現が存在する場合に、その入力英
    文におけるas…as構文として関連がある部分を一まとま
    りにし、この一まとまりの部分に、上記拡張慣用表現参
    照記憶部のキー情報に対応した付与情報を付与する、形
    態素解析部の後段に設けられた拡張慣用表現処理部とを
    有することを特徴とする英文解析システム。
  2. 【請求項2】 英文翻訳システムに適用される請求項1
    に記載の英文解析システムであって、上記付与情報が機
    能範囲、用法及び訳の情報であることを特徴とする英文
    解析システム。
JP7213226A 1995-08-22 1995-08-22 英文解析システム Pending JPH0962682A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7213226A JPH0962682A (ja) 1995-08-22 1995-08-22 英文解析システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7213226A JPH0962682A (ja) 1995-08-22 1995-08-22 英文解析システム

Publications (1)

Publication Number Publication Date
JPH0962682A true JPH0962682A (ja) 1997-03-07

Family

ID=16635631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7213226A Pending JPH0962682A (ja) 1995-08-22 1995-08-22 英文解析システム

Country Status (1)

Country Link
JP (1) JPH0962682A (ja)

Similar Documents

Publication Publication Date Title
US6721697B1 (en) Method and system for reducing lexical ambiguity
JP3114181B2 (ja) 異言語交信用翻訳方法およびシステム
US5774845A (en) Information extraction processor
JPH0782498B2 (ja) 機械翻訳システム
JPH02308370A (ja) 機械翻訳システム
KR20030094632A (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JPH02165378A (ja) 機械翻訳システム
US5608623A (en) Special cooccurrence processing method and apparatus
JPH10312382A (ja) 類似用例翻訳システム
JPH0962682A (ja) 英文解析システム
JP2002278963A (ja) 事例翻訳装置
JP2688020B2 (ja) 派生語処理方式
KR20010057763A (ko) 부분 대역 패턴 데이터베이스에 기반한 번역문 생성장치및 그 방법
KR100194798B1 (ko) 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법
JP2902343B2 (ja) 言語解析システムおよび方法
JP2938897B2 (ja) 文書作成処理装置
JPH0833895B2 (ja) 機械翻訳システムにおける文生成処理方式
Motavallian et al. An intelligent extension of the training set for the Persian n-gram language model: an enrichment algorithm
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPH09146959A (ja) 機械翻訳システム
JPH10105552A (ja) 機械翻訳システム
JP2608384B2 (ja) 機械翻訳装置及びその方法
JP2001125898A (ja) 言語解析処理の方法、システム
JPH02294779A (ja) 機械翻訳システム
Poibeau Content annotation for the Semantic Web