JPH08166956A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPH08166956A JPH08166956A JP6310495A JP31049594A JPH08166956A JP H08166956 A JPH08166956 A JP H08166956A JP 6310495 A JP6310495 A JP 6310495A JP 31049594 A JP31049594 A JP 31049594A JP H08166956 A JPH08166956 A JP H08166956A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- conversion
- language
- target language
- conversion dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 複雑な変換辞書の記述の手間を軽減し、同時
に辞書の記述に必要な記憶領域の容量を減少させる機械
翻訳装置を提供する。 【構成】 入力された文を内部表現に解析する解析部1
と、原言語の内部表現を目的言語の内部表現に変換する
変換部2と、目的言語の内部表現から目的言語の文を生
成する生成部3と、原言語における構文意味カテゴリー
と目的言語での構文意味カテゴリーとの対応を記述する
共通変換辞書4と、単語ごとの対応関係や例外的な対応
を記述する個別変換辞書5と、これらの辞書を読み出す
ことにより、記述の抽象度の異なる2つの変換辞書を利
用する辞書検索部6手段とを配設した。
に辞書の記述に必要な記憶領域の容量を減少させる機械
翻訳装置を提供する。 【構成】 入力された文を内部表現に解析する解析部1
と、原言語の内部表現を目的言語の内部表現に変換する
変換部2と、目的言語の内部表現から目的言語の文を生
成する生成部3と、原言語における構文意味カテゴリー
と目的言語での構文意味カテゴリーとの対応を記述する
共通変換辞書4と、単語ごとの対応関係や例外的な対応
を記述する個別変換辞書5と、これらの辞書を読み出す
ことにより、記述の抽象度の異なる2つの変換辞書を利
用する辞書検索部6手段とを配設した。
Description
【0001】
【産業上の利用分野】本発明は、機械翻訳装置に関し、
特に計算機を用いてある言語から別の言語へ翻訳する機
械翻訳装置に関するものである。
特に計算機を用いてある言語から別の言語へ翻訳する機
械翻訳装置に関するものである。
【0002】
【従来の技術】最近、計算機を用いてある言語から別の
言語へ翻訳する機械翻訳システムが実用化されている。
機械翻訳の方式としては、例えば、「機械翻訳」(共立
出版、bit別冊)に開示されているように、トランス
ファー方式及び中間言語方式が代表的である。実用シス
テムに用いられている方式としてはトランスファー方式
を用いるものが多い。
言語へ翻訳する機械翻訳システムが実用化されている。
機械翻訳の方式としては、例えば、「機械翻訳」(共立
出版、bit別冊)に開示されているように、トランス
ファー方式及び中間言語方式が代表的である。実用シス
テムに用いられている方式としてはトランスファー方式
を用いるものが多い。
【0003】また、従来、多言語翻訳を実現する方式と
しては、中間言語方式がよく用いられてきた。これに対
して、Coling92の論文集に記載されている論文「Shake
andBake Translation」(Peter Witelock著)に記述さ
れているShake and Bake方式のように、2言語間の翻訳
によく用いられてきたトランスファー方式を多言語翻訳
に用いようという考えが最近発表されている。
しては、中間言語方式がよく用いられてきた。これに対
して、Coling92の論文集に記載されている論文「Shake
andBake Translation」(Peter Witelock著)に記述さ
れているShake and Bake方式のように、2言語間の翻訳
によく用いられてきたトランスファー方式を多言語翻訳
に用いようという考えが最近発表されている。
【0004】トランスファー方式の機械翻訳システム
は、図3に示すように、入力された文を内部表現に解析
する解析部1と、原言語の内部表現を目的言語の内部表
現に変換する変換部2と、目的言語の内部表現から目的
言語の文を生成する生成部3と、原言語における構文意
味カテゴリーと目的言語での構文意味カテゴリーとの対
応、単語ごとの対応関係、例外的な対応を記述する変換
辞書9とを具備している。このような解析部1、変換部
2、生成部3からなる構成は機械翻訳システムの構成と
してごく一般的なものである。図4はShake and Bake方
式による多言語間の機械翻訳システムの構成図である。
図3の変換辞書9の代わりに日英変換辞書10及び日仏
変換辞書11を備えている。
は、図3に示すように、入力された文を内部表現に解析
する解析部1と、原言語の内部表現を目的言語の内部表
現に変換する変換部2と、目的言語の内部表現から目的
言語の文を生成する生成部3と、原言語における構文意
味カテゴリーと目的言語での構文意味カテゴリーとの対
応、単語ごとの対応関係、例外的な対応を記述する変換
辞書9とを具備している。このような解析部1、変換部
2、生成部3からなる構成は機械翻訳システムの構成と
してごく一般的なものである。図4はShake and Bake方
式による多言語間の機械翻訳システムの構成図である。
図3の変換辞書9の代わりに日英変換辞書10及び日仏
変換辞書11を備えている。
【0005】機械翻訳に用いる辞書情報を効率的に記憶
し管理する方式としては、特開平2一140870号公
報に、動詞の解析辞書を各動詞に固有の情報を持った辞
書と共通に利用可能な情報を集めた辞書に分離するとい
う方式が提案されている。また、機械翻訳で使用する辞
書は、辞書に含まれる単語の種類によって次のような3
種類に分けることができる。比較的汎用性の高い単語を
集めたシステム辞書、ユーザーの個別の用途に合わせて
集められた単語を持つユーザー辞書、翻訳対象分野毎の
専門的な単語を集めた専門用語辞書の3種類である。一
般に、システム辞書は、ユーザー辞書や専門用語辞書に
比ベて語数が多く、その内容も複雑である。ユーザー辞
書や専門用語辞書は、システム辞書を補うという性格の
ものである。また、辞書の別の立場からの分類として
は、翻訳処理の各段階で提供する情報の種類に応じて、
解析辞書、変換辞書、生成辞書の3つに分けられる。し
かし、ユーザー辞書や専門用語辞書ではこのような区別
は通常行なわれない。また、システム辞書についても、
区別しない機械翻訳システムもある。
し管理する方式としては、特開平2一140870号公
報に、動詞の解析辞書を各動詞に固有の情報を持った辞
書と共通に利用可能な情報を集めた辞書に分離するとい
う方式が提案されている。また、機械翻訳で使用する辞
書は、辞書に含まれる単語の種類によって次のような3
種類に分けることができる。比較的汎用性の高い単語を
集めたシステム辞書、ユーザーの個別の用途に合わせて
集められた単語を持つユーザー辞書、翻訳対象分野毎の
専門的な単語を集めた専門用語辞書の3種類である。一
般に、システム辞書は、ユーザー辞書や専門用語辞書に
比ベて語数が多く、その内容も複雑である。ユーザー辞
書や専門用語辞書は、システム辞書を補うという性格の
ものである。また、辞書の別の立場からの分類として
は、翻訳処理の各段階で提供する情報の種類に応じて、
解析辞書、変換辞書、生成辞書の3つに分けられる。し
かし、ユーザー辞書や専門用語辞書ではこのような区別
は通常行なわれない。また、システム辞書についても、
区別しない機械翻訳システムもある。
【0006】
【発明が解決しようとする課題】トランスファー方式の
変換辞書を構築する場合、変換のための規則や辞書は、
言語同士の対応が本来複雑なため、非常に複雑かつ大規
模なものになり、その開発と維持管理が大変であるとい
う問題点があった。また、Shake and Bake Translation
のようなトランスファー方式を改良して多言語翻訳に用
いる方式では、変換辞書を言語対毎に持つ必要があり、
変換辞書を作成する手間が中間言語方式に比ベ多くなる
という問題点があった。
変換辞書を構築する場合、変換のための規則や辞書は、
言語同士の対応が本来複雑なため、非常に複雑かつ大規
模なものになり、その開発と維持管理が大変であるとい
う問題点があった。また、Shake and Bake Translation
のようなトランスファー方式を改良して多言語翻訳に用
いる方式では、変換辞書を言語対毎に持つ必要があり、
変換辞書を作成する手間が中間言語方式に比ベ多くなる
という問題点があった。
【0007】トランスファー方式の日英機械翻訳システ
ムの解析辞書と生成辞書の記述例は図8に示すようにな
っている。また、これらの辞書に対応した変換辞書の記
述例は図9に示すようになっている。このように、各言
語の文法の体系が異なると、変換辞書が複雑になり、こ
の方法で変換辞書を言語対毎に用意するのは現実的でな
い。
ムの解析辞書と生成辞書の記述例は図8に示すようにな
っている。また、これらの辞書に対応した変換辞書の記
述例は図9に示すようになっている。このように、各言
語の文法の体系が異なると、変換辞書が複雑になり、こ
の方法で変換辞書を言語対毎に用意するのは現実的でな
い。
【0008】本発明は、上記のような課題を解消するた
めになされたもので、複雑な変換辞書の記述の手間を軽
減し、同時に辞書の記述に必要な記憶領域の容量を減少
させる機械翻訳装置を提供することを目的とする。
めになされたもので、複雑な変換辞書の記述の手間を軽
減し、同時に辞書の記述に必要な記憶領域の容量を減少
させる機械翻訳装置を提供することを目的とする。
【0009】
【課題を解決するための手段】本発明によれば、前述の
目的は、原言語の文を解析して原言語の内部表現を生成
する解析手段と、前記原言語の内部表現を目的言語の内
部表現に変換する変換手段と、前記目的言語の内部表現
から目的言語の文を生成する生成手段とを備える機械翻
訳装置であって、前記原言語の単語と前記目的言語の単
語との対応関係が記述されている個別変換辞書と、原言
語の単語の構文上の意味と目的言語の単語の構文上の意
味との対応関係が記述されている共通変換辞書とを備
え、前記変換手段が前記個別変換辞書と前記共通変換辞
書とを用いて、前記原言語の内部表現を前記目的言語の
内部表現に変換する請求項1の機械翻訳装置によって達
成される。
目的は、原言語の文を解析して原言語の内部表現を生成
する解析手段と、前記原言語の内部表現を目的言語の内
部表現に変換する変換手段と、前記目的言語の内部表現
から目的言語の文を生成する生成手段とを備える機械翻
訳装置であって、前記原言語の単語と前記目的言語の単
語との対応関係が記述されている個別変換辞書と、原言
語の単語の構文上の意味と目的言語の単語の構文上の意
味との対応関係が記述されている共通変換辞書とを備
え、前記変換手段が前記個別変換辞書と前記共通変換辞
書とを用いて、前記原言語の内部表現を前記目的言語の
内部表現に変換する請求項1の機械翻訳装置によって達
成される。
【0010】本発明によれば、前述の目的は、原言語の
文を解析して原言語の内部表現を生成する解析手段と、
前記原言語の内部表現を目的言語の内部表現に変換する
変換手段と、前記目的言語の内部表現から目的言語の文
を生成する生成手段とを備え、所定の言語から複数の言
語への翻訳を行う機械翻訳装置であって、所定の言語の
単語と各目的言語の単語との対応関係が記述されている
複数の個別変換辞書と、複数の言語間の単語の構文上の
意味の対応関係が記述されている多言語間共通変換辞書
とを備え、前記変換手段が原言語と目的言語のための個
別変換辞書と前記多言語間共通変換辞書とを用いて、前
記原言語の内部表現を前記目的言語の内部表現に変換す
る請求項2の機械翻訳装置によって達成される。
文を解析して原言語の内部表現を生成する解析手段と、
前記原言語の内部表現を目的言語の内部表現に変換する
変換手段と、前記目的言語の内部表現から目的言語の文
を生成する生成手段とを備え、所定の言語から複数の言
語への翻訳を行う機械翻訳装置であって、所定の言語の
単語と各目的言語の単語との対応関係が記述されている
複数の個別変換辞書と、複数の言語間の単語の構文上の
意味の対応関係が記述されている多言語間共通変換辞書
とを備え、前記変換手段が原言語と目的言語のための個
別変換辞書と前記多言語間共通変換辞書とを用いて、前
記原言語の内部表現を前記目的言語の内部表現に変換す
る請求項2の機械翻訳装置によって達成される。
【0011】
【作用】請求項1の機械翻訳装置によれば、従来の1つ
の変換辞書に対して、2つの変換辞書、即ち、単語ごと
の対応関係が記述されている個別変換辞書と、原言語の
単語の構文上の意味と目的言語の単語の構文上の意味と
の対応関係が記述されている共通変換辞書を用いて、変
換手段は原言語の内部表現を目的言語の内部表現に変換
する。従って、共通変換辞書で共通なデータを一括して
作成管理することにより、個別変換辞書を小規模化で
き、全体としての変換辞書作成の手間を軽減することが
できる。また、共通変換辞書の変更は、唯一箇所の変更
で他数の単語に共通の変更を実現できるので、個別変換
辞書での個別の単語毎の変更を行なわずに済む。また、
共通変換辞書を持つことにより、辞書管理者の辞書管理
の手間を軽減することができる。
の変換辞書に対して、2つの変換辞書、即ち、単語ごと
の対応関係が記述されている個別変換辞書と、原言語の
単語の構文上の意味と目的言語の単語の構文上の意味と
の対応関係が記述されている共通変換辞書を用いて、変
換手段は原言語の内部表現を目的言語の内部表現に変換
する。従って、共通変換辞書で共通なデータを一括して
作成管理することにより、個別変換辞書を小規模化で
き、全体としての変換辞書作成の手間を軽減することが
できる。また、共通変換辞書の変更は、唯一箇所の変更
で他数の単語に共通の変更を実現できるので、個別変換
辞書での個別の単語毎の変更を行なわずに済む。また、
共通変換辞書を持つことにより、辞書管理者の辞書管理
の手間を軽減することができる。
【0012】請求項2の機械翻訳装置によれば、従来の
1つの変換辞書に対して、2種類の変換辞書、即ち、単
語ごとの対応関係が記述されている個別変換辞書と、複
数の言語間の単語の構文上の意味の対応関係が記述され
ている多言語間共通変換辞書を用いて、変換手段は原言
語の内部表現を目的言語の内部表現に変換する。従っ
て、多言語間共通変換辞書で共通なデータを一括して作
成管理することにより、個別変換辞書を小規模化でき、
複数の変換辞書を作成する手間を全体として軽減するこ
とができる。また、多言語間共通変換辞書の変更は、唯
一固所の変更で他数の単語に共通の変更を実現できるの
で、個別変換辞書での個別の単語毎の変更を行なわずに
済む。また、共通変換辞書を持つことにより、辞書管理
者の辞書管理の手間を軽減できる。更に、共通変換辞書
は、主記憶装置上に常駐させ、個別変換辞書は補助記憶
装置上に置くことで、記憶装置の利用を効率化するとい
う効果もある。
1つの変換辞書に対して、2種類の変換辞書、即ち、単
語ごとの対応関係が記述されている個別変換辞書と、複
数の言語間の単語の構文上の意味の対応関係が記述され
ている多言語間共通変換辞書を用いて、変換手段は原言
語の内部表現を目的言語の内部表現に変換する。従っ
て、多言語間共通変換辞書で共通なデータを一括して作
成管理することにより、個別変換辞書を小規模化でき、
複数の変換辞書を作成する手間を全体として軽減するこ
とができる。また、多言語間共通変換辞書の変更は、唯
一固所の変更で他数の単語に共通の変更を実現できるの
で、個別変換辞書での個別の単語毎の変更を行なわずに
済む。また、共通変換辞書を持つことにより、辞書管理
者の辞書管理の手間を軽減できる。更に、共通変換辞書
は、主記憶装置上に常駐させ、個別変換辞書は補助記憶
装置上に置くことで、記憶装置の利用を効率化するとい
う効果もある。
【0013】
【実施例】以下、請求項1の機械翻訳装置の実施例を図
を参照しながら説明する。
を参照しながら説明する。
【0014】本実施例のハードウェアは、図5に示すよ
うに、各部を制御するCPU12を有しており、CPU
12には、データ等を格納する主記憶装置13と、翻訳
プログラム等を格納する補助記憶装置14とが接続され
ている。また、CPU12には、文章等を入力する入力
手段15と、翻訳結果等を表示する表示装置16が接続
されている。
うに、各部を制御するCPU12を有しており、CPU
12には、データ等を格納する主記憶装置13と、翻訳
プログラム等を格納する補助記憶装置14とが接続され
ている。また、CPU12には、文章等を入力する入力
手段15と、翻訳結果等を表示する表示装置16が接続
されている。
【0015】補助記憶装置14には、図6に示すよう
に、翻訳プログラム、解析辞書、生成辞書、共通変換辞
書、個別変換辞書が格納されており、これらを主記憶装
置13に展開すると、図6に示すように主記憶装置13
に翻訳プログラム及び辞書データが配置される。
に、翻訳プログラム、解析辞書、生成辞書、共通変換辞
書、個別変換辞書が格納されており、これらを主記憶装
置13に展開すると、図6に示すように主記憶装置13
に翻訳プログラム及び辞書データが配置される。
【0016】ここで、共通変換辞書と個別変換辞書で実
際のデータを記述するための記述形式を簡単に説明す
る。
際のデータを記述するための記述形式を簡単に説明す
る。
【0017】共通変換辞書と個別変換辞書の例は、図1
0から図13に示すようになっており、単語とその構文
意味カテゴリーの対応間係は、「が:Particle_synsem
」のように、単語と構文意味カテゴリーの間に”:”
を置いて表す。また、「歩く←1→walk」のように、番
号のついた双方向の矢印によって単語同士の対応を表
す。番号によって、個別変換辞書の単語に対応する共通
変換辞書の変換規則が指定されている。「X」のよう
な、共通変換辞書で用いる大文字のァルファベツト番号
は変数であり、単語同士の対応において、個別変換辞書
にある具体的な単語を当てはめることができることを表
している。また、複数の単語が対応するときは、単語と
単語の間に、”&”を置いて表す。多言語間の共通変換
辞書と個別変換辞書についても同様の記述形式を用い
る。
0から図13に示すようになっており、単語とその構文
意味カテゴリーの対応間係は、「が:Particle_synsem
」のように、単語と構文意味カテゴリーの間に”:”
を置いて表す。また、「歩く←1→walk」のように、番
号のついた双方向の矢印によって単語同士の対応を表
す。番号によって、個別変換辞書の単語に対応する共通
変換辞書の変換規則が指定されている。「X」のよう
な、共通変換辞書で用いる大文字のァルファベツト番号
は変数であり、単語同士の対応において、個別変換辞書
にある具体的な単語を当てはめることができることを表
している。また、複数の単語が対応するときは、単語と
単語の間に、”&”を置いて表す。多言語間の共通変換
辞書と個別変換辞書についても同様の記述形式を用い
る。
【0018】図10及び図11は、図9の変換辞書を共
通変換辞書と個別変換辞書に分けた例であり、この2つ
の辞書は図6のように別々の記憶領域に記憶される。
通変換辞書と個別変換辞書に分けた例であり、この2つ
の辞書は図6のように別々の記憶領域に記憶される。
【0019】本実施例の機械翻訳装置は、図1に示すよ
うに入力文を解析して内部表現に落とす解析手段として
の解析部1を有しており、解析部1には、原言語の内部
表現を目的言語の内部表現に変換する変換手段としての
変換部2が接続されている。そして、変換部2には、目
的言語の内部表現から目的言語の文を生成する生成手段
としての生成部3が接続されており、かつ変換辞書から
変換規則を読み出す辞書検索手段としての辞書検索部6
が接続されている。なお、変換辞書は、共通変換辞書4
と個別変換辞書5からなる。
うに入力文を解析して内部表現に落とす解析手段として
の解析部1を有しており、解析部1には、原言語の内部
表現を目的言語の内部表現に変換する変換手段としての
変換部2が接続されている。そして、変換部2には、目
的言語の内部表現から目的言語の文を生成する生成手段
としての生成部3が接続されており、かつ変換辞書から
変換規則を読み出す辞書検索手段としての辞書検索部6
が接続されている。なお、変換辞書は、共通変換辞書4
と個別変換辞書5からなる。
【0020】次に、本実施例の動作を図7のフローチャ
ートに沿って説明する。
ートに沿って説明する。
【0021】ステップS1では、入力文が解析されて内
部表現に落とされる。そして、ステップS2において、
解析結果の各単語について処理が終了されたかどうかが
調ベられ、処理が終っていれば、ステップS7において
翻訳文が生成され、処理が終了される。また、処理が終
わっていない場合、ステップS3において、辞書検索部
6によって個別変換辞書5が引かれて該当する単語のデ
ータが取り出され、ステップS4において、解析結果か
ら単語の構文意味カテゴリーが取り出される。それか
ら、ステップS5において、辞書検索部6によって、個
別変換辞書に書かれてある番号と単語の構文意味カテゴ
リーが使われて共通変換辞書4が引かれ、目的言語との
変換規則が取り出される。ステップS6では、共通変換
辞書4の内容を基に処理対象の単語と共通変換辞書に”
&”で指定されている単語が解析結果から削除されたも
のが、新たな変換への入力とされて、ステップS2へ戻
る。
部表現に落とされる。そして、ステップS2において、
解析結果の各単語について処理が終了されたかどうかが
調ベられ、処理が終っていれば、ステップS7において
翻訳文が生成され、処理が終了される。また、処理が終
わっていない場合、ステップS3において、辞書検索部
6によって個別変換辞書5が引かれて該当する単語のデ
ータが取り出され、ステップS4において、解析結果か
ら単語の構文意味カテゴリーが取り出される。それか
ら、ステップS5において、辞書検索部6によって、個
別変換辞書に書かれてある番号と単語の構文意味カテゴ
リーが使われて共通変換辞書4が引かれ、目的言語との
変換規則が取り出される。ステップS6では、共通変換
辞書4の内容を基に処理対象の単語と共通変換辞書に”
&”で指定されている単語が解析結果から削除されたも
のが、新たな変換への入力とされて、ステップS2へ戻
る。
【0022】ここで、図8に示す日本語の解析辞書と英
語の生成辞書で用いる構文意味カテゴリーについて説明
する。なお、以下の説明では、図8の日本語の解析辞書
と、英語の生成辞書、図10の共通変換辞書と、図11
の個別変換辞書とを用いる。ga_agt_verb_synsemという
構文意味カテゴリーは、補語として助詞「が」のついた
名詞句をとり、その名詞句の意味分類は動作主(ag
t)になるような種類の動詞を表す。ga_agt_wo_ptr_ve
rb_synsem という構文意味カテゴリーは、補語として助
詞「が」のついた名詞句と助詞「を」のついた名詞句を
とり、これらの名詞句の意味分類はそれぞれ動作主(a
gt)と場所(ptr)になるような種類の動詞を表
す。また、np_synsem、particle_synsemはそれぞれ名詞
句、助詞を表す構文意味カテゴリーである。
語の生成辞書で用いる構文意味カテゴリーについて説明
する。なお、以下の説明では、図8の日本語の解析辞書
と、英語の生成辞書、図10の共通変換辞書と、図11
の個別変換辞書とを用いる。ga_agt_verb_synsemという
構文意味カテゴリーは、補語として助詞「が」のついた
名詞句をとり、その名詞句の意味分類は動作主(ag
t)になるような種類の動詞を表す。ga_agt_wo_ptr_ve
rb_synsem という構文意味カテゴリーは、補語として助
詞「が」のついた名詞句と助詞「を」のついた名詞句を
とり、これらの名詞句の意味分類はそれぞれ動作主(a
gt)と場所(ptr)になるような種類の動詞を表
す。また、np_synsem、particle_synsemはそれぞれ名詞
句、助詞を表す構文意味カテゴリーである。
【0023】また、英語については、np_iv_synsem、np
_pp_iv_synsem は、それぞれ補語として名詞句をとる自
動詞、補語として名詞句と前置詞句をとる動詞を表す構
文意味カテゴリーである。np_synsem、prep_synsemは、
それぞれ、名詞句、前置詞を表す構文意味カテゴリーで
ある。
_pp_iv_synsem は、それぞれ補語として名詞句をとる自
動詞、補語として名詞句と前置詞句をとる動詞を表す構
文意味カテゴリーである。np_synsem、prep_synsemは、
それぞれ、名詞句、前置詞を表す構文意味カテゴリーで
ある。
【0024】図11の個別変換辞書において、「歩く←
1→wa1k」と「歩く←2→wa1k」は、それぞれ
場所格を持つ場合と持たない場合の対応間係を表してお
り、図10における二つの変換規則の1番目の規則と2
番目の規則を用いる。図11の個別変換辞書の「太朗←
3→Taro」は、名詞「太郎」と「Taro」が対応
することを示しており、図10の共通変換辞書の3番目
の規則を用いる。
1→wa1k」と「歩く←2→wa1k」は、それぞれ
場所格を持つ場合と持たない場合の対応間係を表してお
り、図10における二つの変換規則の1番目の規則と2
番目の規則を用いる。図11の個別変換辞書の「太朗←
3→Taro」は、名詞「太郎」と「Taro」が対応
することを示しており、図10の共通変換辞書の3番目
の規則を用いる。
【0025】これらの辞書を用いて、入力文「太郎が歩
く」についての変換処理の派れを説明する。
く」についての変換処理の派れを説明する。
【0026】ステップS1で解析した結果が「太郎:np
_synsem、歩く:ga_agt_verb_synsem、が:particle_sy
nsem 」という内部表現が得られる。ステップS2で
は、すベての単語についての処理が終ったかどうかがチ
ェックされ、処理が終っていないのでステップS3へ遷
移する。ステップS3では、「歩く」について図11の
個別変換辞書が引かれて、変換規則の左辺の文字列と一
致する「歩く←1→wa1k」と「歩く←2→wa1
k」の両方の対応規則が取り出される。次に、ステップ
S4において、解析結果から「歩く」の構文意味カテゴ
リーga_agt_synsemが取り出される。そして、ステップ
S5において、図10の共通変換辞書が引かれ、構文意
味カテゴリーの一致する「歩く←1→wa1k」が選ば
れ、「歩く」を「walk:np_iv_synsem」と対応させる。
また、「が:particle_synsem」を英語の空カテゴリー
と対応させる。ステップS6で、解析結果の「太郎:np
_synsem、歩く:ga_agt_verb_synsem、が:particle_sy
nsem」から「歩く:ga_agt_verb_synsem」と「が:part
icle_synsem 」が取り除かれる。まだ処理すべき解析結
果が残っているのでステップS2からステップS3に遷
移し、「太郎」が個別変換辞書で引かれて、変換規則の
左辺の文字列の一致する「太朗←3→Taro」が取り
出され、ステップS4で、解析結果から太郎の構文意味
カテゴリーnp_synsem が取り出され、ステップS5で共
通変換辞書が参照され、「太郎」の構文意味カテゴリー
np_synsem が「Taro」の構文意味カテゴリーnp_syn
sem とが対応される。ステップS6において、「太郎:
np_synsem 」が解析結果から取り除かれて空にされてス
テップS2へ遷移され、ステップS2では、処理すベき
結果がなくなったのでステップS7へ遷移される。ステ
ップS7の生成部への入力は「Taro:np_synsem,walk:np
_iv_synsem」となり生成が行なわれ、「Taro wa
lks」が訳文として出力される。
_synsem、歩く:ga_agt_verb_synsem、が:particle_sy
nsem 」という内部表現が得られる。ステップS2で
は、すベての単語についての処理が終ったかどうかがチ
ェックされ、処理が終っていないのでステップS3へ遷
移する。ステップS3では、「歩く」について図11の
個別変換辞書が引かれて、変換規則の左辺の文字列と一
致する「歩く←1→wa1k」と「歩く←2→wa1
k」の両方の対応規則が取り出される。次に、ステップ
S4において、解析結果から「歩く」の構文意味カテゴ
リーga_agt_synsemが取り出される。そして、ステップ
S5において、図10の共通変換辞書が引かれ、構文意
味カテゴリーの一致する「歩く←1→wa1k」が選ば
れ、「歩く」を「walk:np_iv_synsem」と対応させる。
また、「が:particle_synsem」を英語の空カテゴリー
と対応させる。ステップS6で、解析結果の「太郎:np
_synsem、歩く:ga_agt_verb_synsem、が:particle_sy
nsem」から「歩く:ga_agt_verb_synsem」と「が:part
icle_synsem 」が取り除かれる。まだ処理すべき解析結
果が残っているのでステップS2からステップS3に遷
移し、「太郎」が個別変換辞書で引かれて、変換規則の
左辺の文字列の一致する「太朗←3→Taro」が取り
出され、ステップS4で、解析結果から太郎の構文意味
カテゴリーnp_synsem が取り出され、ステップS5で共
通変換辞書が参照され、「太郎」の構文意味カテゴリー
np_synsem が「Taro」の構文意味カテゴリーnp_syn
sem とが対応される。ステップS6において、「太郎:
np_synsem 」が解析結果から取り除かれて空にされてス
テップS2へ遷移され、ステップS2では、処理すベき
結果がなくなったのでステップS7へ遷移される。ステ
ップS7の生成部への入力は「Taro:np_synsem,walk:np
_iv_synsem」となり生成が行なわれ、「Taro wa
lks」が訳文として出力される。
【0027】次に、請求項2の機械翻訳装置の実施例を
図を参照しながら説明する。
図を参照しながら説明する。
【0028】本実施例の機械翻訳装置は、図2に示すよ
うに、入力文を解析して内部表現に落とす解析部1を備
えており、解析部1には、原言語の内部表現を目的言語
の内部表現に変換する変換部2が接続されている。そし
て、変換部2には、目的言語の内部表現から目的言語の
文を生成する生成部3が接続されており、かつ変換辞書
から変換規則を読み出す辞書検索部6が接続されてい
る。変換辞書は、多言語間で共有できる多言語共通変換
辞書7と、言語対別の個別変換辞書8とに分けられる。
うに、入力文を解析して内部表現に落とす解析部1を備
えており、解析部1には、原言語の内部表現を目的言語
の内部表現に変換する変換部2が接続されている。そし
て、変換部2には、目的言語の内部表現から目的言語の
文を生成する生成部3が接続されており、かつ変換辞書
から変換規則を読み出す辞書検索部6が接続されてい
る。変換辞書は、多言語間で共有できる多言語共通変換
辞書7と、言語対別の個別変換辞書8とに分けられる。
【0029】次に、本実施例の動作を図14のフローチ
ャートに沿って説明する。
ャートに沿って説明する。
【0030】ステップS8では、どの言語からどの言語
への変換を行なうのかが指定され、ステップS9におい
て、原文の解析が行われて内部表現に落とされる。そし
て、ステップS10において、解析結果の各単語につい
て処理が終了されたかどうかが調ベられ、処理が終って
いれば、ステップS15において目的言語の内部表現か
ら目的言語の文が生成され、処理が終了される。また、
処理が終わっていない場合、ステップS11において、
辞書検索部6によって個別変換辞書8が引かれて該当す
る単語のデータが取り出され、ステップS12におい
て、解析結果から単語の構文意味カテゴリーが取り出さ
れる。それから、ステップS13において、辞書検索部
6によって、個別変換辞書8に書かれてある番号と単語
の構文意味カテゴリーが使われて共通変換辞書5が引か
れ、目的言語との変換規則が取り出される。ステップS
14では、多言語間共通変換辞書7の内容を基に処理対
象の単語と共通変換辞書に”&”で指定されている単語
が解析結果から削除され、変換結果として出力され、ス
テップS10へ戻る。
への変換を行なうのかが指定され、ステップS9におい
て、原文の解析が行われて内部表現に落とされる。そし
て、ステップS10において、解析結果の各単語につい
て処理が終了されたかどうかが調ベられ、処理が終って
いれば、ステップS15において目的言語の内部表現か
ら目的言語の文が生成され、処理が終了される。また、
処理が終わっていない場合、ステップS11において、
辞書検索部6によって個別変換辞書8が引かれて該当す
る単語のデータが取り出され、ステップS12におい
て、解析結果から単語の構文意味カテゴリーが取り出さ
れる。それから、ステップS13において、辞書検索部
6によって、個別変換辞書8に書かれてある番号と単語
の構文意味カテゴリーが使われて共通変換辞書5が引か
れ、目的言語との変換規則が取り出される。ステップS
14では、多言語間共通変換辞書7の内容を基に処理対
象の単語と共通変換辞書に”&”で指定されている単語
が解析結果から削除され、変換結果として出力され、ス
テップS10へ戻る。
【0031】ここで、利用者が日本語からフランス語へ
の翻訳を指定して、「太郎が歩く」を入力した場合の処
理を説明する。
の翻訳を指定して、「太郎が歩く」を入力した場合の処
理を説明する。
【0032】図12に示しように、フランス語では「歩
く」の訳語はmarcher であり、構文意味カテゴリーとし
てnp_vsynsemという分類に属し、「走る」の訳語はcour
irであり、np_vsynsemという分類に属すものとする。こ
のフランス語の構文意味カテゴリーnp_vsynsemは補語と
して名詞句を取る動詞を表している。また、np_synsem
は名詞句を表している。このとき日本語の分類「ga_agt
_verb_synsem」、英語の分類「np_iv_synsem」とフラン
ス語の分類「np_vsynsem」が対応し、また、日本語と英
語、フランス語の「np_synsem 」が対応することを図1
3のように多言語間の共通変換辞書に記述しておく。
く」の訳語はmarcher であり、構文意味カテゴリーとし
てnp_vsynsemという分類に属し、「走る」の訳語はcour
irであり、np_vsynsemという分類に属すものとする。こ
のフランス語の構文意味カテゴリーnp_vsynsemは補語と
して名詞句を取る動詞を表している。また、np_synsem
は名詞句を表している。このとき日本語の分類「ga_agt
_verb_synsem」、英語の分類「np_iv_synsem」とフラン
ス語の分類「np_vsynsem」が対応し、また、日本語と英
語、フランス語の「np_synsem 」が対応することを図1
3のように多言語間の共通変換辞書に記述しておく。
【0033】このときの動作を図14のフローチャート
に沿って詳説する。
に沿って詳説する。
【0034】ステップS8では、日本語からフランス語
への変換であることが装置の各部に伝えられる。ステッ
プS9では、原文が解析され、内部表現「太郎:np_syn
sem、歩く:ga_agt_verb_synsem、が:particle_synsem
」が得られる。ステップS10では、処理すベき内部
表現「太郎:np_synsem、歩く:ga_agt_verb_synsem、
が:particle_synsem 」があるので、ステップS11に
移る。ステップS11では、「歩く」の日仏個別変換辞
書8が引かれて、変換規則の左辺の文字列の一致する
「歩く←1→marcher」と「歩く←2→marcher」の両方
の変換規則が取り出される。ステップS12で、解析結
果から「歩く」の構文意味カテゴリーga_agt_synsem が
取り出され、ステップS13で、2つの多言語間の共通
変換辞書が引かれ、構文意味カテゴリーがga_agt_verb_
synsem であることから、「歩く」に対する規則として
「歩く←1→marcher 」が選択され、「歩く:ga_agt_v
erb_synsem」に「marcher:np_vsynsem」を対応させる。
また、”&”で「歩く」の横に並ベて書いてある「が」
には空のカテゴリーが対応させられる。ステップS14
では、「太郎:np_synsem、歩く:ga_agt_verb_synse
m、が:particle_synsem」から「歩く:ga_agt_verb_sy
nsem」と「が:particle_synsem」が取り除かれる。次
にステップS10から、ステップS11に移り、「太
郎」が日仏個別変換辞書8で引かれて、変換規則の左辺
の文字列の一致する「太郎←3→Taro」が取り出さ
れ、ステップS12で、解析結果から「太郎」の構文意
味カテゴリーnp_synsem が取り出され、ステップS13
で、多言語間の共通変換辞書を見て、「太郎」の構文意
味カテゴリーnp_synsemが「Taro」の構文意味カテ
ゴリーnp_synsemと直接対応させる。ステップS14で
解析結果から「太郎:np_synsem」を取り除い
た空リストが新たな解析結果とされて、ステップS10
に移る。ステップS10では、解析結果が空なのでステ
ップS15に移る。ステップS15では、変換の結果と
して「Taro:np_synsem,marche
r:vsynsem」が生成部により受け取られ、生成
が行なわれて「Taro marcher」が訳文として出力され
る。
への変換であることが装置の各部に伝えられる。ステッ
プS9では、原文が解析され、内部表現「太郎:np_syn
sem、歩く:ga_agt_verb_synsem、が:particle_synsem
」が得られる。ステップS10では、処理すベき内部
表現「太郎:np_synsem、歩く:ga_agt_verb_synsem、
が:particle_synsem 」があるので、ステップS11に
移る。ステップS11では、「歩く」の日仏個別変換辞
書8が引かれて、変換規則の左辺の文字列の一致する
「歩く←1→marcher」と「歩く←2→marcher」の両方
の変換規則が取り出される。ステップS12で、解析結
果から「歩く」の構文意味カテゴリーga_agt_synsem が
取り出され、ステップS13で、2つの多言語間の共通
変換辞書が引かれ、構文意味カテゴリーがga_agt_verb_
synsem であることから、「歩く」に対する規則として
「歩く←1→marcher 」が選択され、「歩く:ga_agt_v
erb_synsem」に「marcher:np_vsynsem」を対応させる。
また、”&”で「歩く」の横に並ベて書いてある「が」
には空のカテゴリーが対応させられる。ステップS14
では、「太郎:np_synsem、歩く:ga_agt_verb_synse
m、が:particle_synsem」から「歩く:ga_agt_verb_sy
nsem」と「が:particle_synsem」が取り除かれる。次
にステップS10から、ステップS11に移り、「太
郎」が日仏個別変換辞書8で引かれて、変換規則の左辺
の文字列の一致する「太郎←3→Taro」が取り出さ
れ、ステップS12で、解析結果から「太郎」の構文意
味カテゴリーnp_synsem が取り出され、ステップS13
で、多言語間の共通変換辞書を見て、「太郎」の構文意
味カテゴリーnp_synsemが「Taro」の構文意味カテ
ゴリーnp_synsemと直接対応させる。ステップS14で
解析結果から「太郎:np_synsem」を取り除い
た空リストが新たな解析結果とされて、ステップS10
に移る。ステップS10では、解析結果が空なのでステ
ップS15に移る。ステップS15では、変換の結果と
して「Taro:np_synsem,marche
r:vsynsem」が生成部により受け取られ、生成
が行なわれて「Taro marcher」が訳文として出力され
る。
【0035】
【発明の効果】請求項1の機械翻訳装置によれば、従来
の1つの変換辞書に対して、2つの変換辞書、即ち、単
語ごとの対応関係が記述されている個別変換辞書と、原
言語の単語の構文上の意味と目的言語の単語の構文上の
意味との対応関係が記述されている共通変換辞書を用い
て、変換手段は原言語の内部表現を目的言語の内部表現
に変換する。従って、共通変換辞書で共通なデータを一
括して作成管理することにより、個別変換辞書を小規模
化でき、全体としての変換辞書作成の手間を軽減するこ
とができる。また、共通変換辞書の変更は、唯一箇所の
変更で他数の単語に共通の変更を実現できるので、個別
変換辞書での個別の単語毎の変更を行なわすに済む。ま
た、共通変換辞書を持つことにより、辞書管理者の秘密
管理の手間を軽減することができる。
の1つの変換辞書に対して、2つの変換辞書、即ち、単
語ごとの対応関係が記述されている個別変換辞書と、原
言語の単語の構文上の意味と目的言語の単語の構文上の
意味との対応関係が記述されている共通変換辞書を用い
て、変換手段は原言語の内部表現を目的言語の内部表現
に変換する。従って、共通変換辞書で共通なデータを一
括して作成管理することにより、個別変換辞書を小規模
化でき、全体としての変換辞書作成の手間を軽減するこ
とができる。また、共通変換辞書の変更は、唯一箇所の
変更で他数の単語に共通の変更を実現できるので、個別
変換辞書での個別の単語毎の変更を行なわすに済む。ま
た、共通変換辞書を持つことにより、辞書管理者の秘密
管理の手間を軽減することができる。
【0036】請求項2の機械翻訳装置によれば、従来の
1つの変換辞書に対して、2種類の変換辞書、即ち、単
語ごとの対応関係が記述されている個別変換辞書と、複
数の言語間の単語の構文上の意味の対応関係が記述され
ている多言語間共通変換辞書を用いて、変換手段は原言
語の内部表現を目的言語の内部表現に変換する。従っ
て、多言語間共通変換辞書で共通なデータを一括して作
成管理することにより、個別変換辞書を小規模化でき、
複数の変換辞書を作成する手間を全体として軽減するこ
とができる。また、多言語間共通変換辞書の変更は、唯
一固所の変更で他数の単語に共通の変更を実現できるの
で、個別変換辞書での個別の単語毎の変更を行なわずに
済む。また、共通変換辞書を持つことにより、辞書管理
者の辞書管理の手間を軽減できる。更に、共通変換辞書
は、主記憶装置上に常駐させ、個別変換辞書は補助記憶
装置上に置くことで、記憶装置の利用を効率化するとい
う効果もある。
1つの変換辞書に対して、2種類の変換辞書、即ち、単
語ごとの対応関係が記述されている個別変換辞書と、複
数の言語間の単語の構文上の意味の対応関係が記述され
ている多言語間共通変換辞書を用いて、変換手段は原言
語の内部表現を目的言語の内部表現に変換する。従っ
て、多言語間共通変換辞書で共通なデータを一括して作
成管理することにより、個別変換辞書を小規模化でき、
複数の変換辞書を作成する手間を全体として軽減するこ
とができる。また、多言語間共通変換辞書の変更は、唯
一固所の変更で他数の単語に共通の変更を実現できるの
で、個別変換辞書での個別の単語毎の変更を行なわずに
済む。また、共通変換辞書を持つことにより、辞書管理
者の辞書管理の手間を軽減できる。更に、共通変換辞書
は、主記憶装置上に常駐させ、個別変換辞書は補助記憶
装置上に置くことで、記憶装置の利用を効率化するとい
う効果もある。
【図1】請求項1の機械翻訳装置の実施例の構成を示す
ブロック図である。
ブロック図である。
【図2】請求項2の機械翻訳装置の実施例の構成を示す
ブロック図である。
ブロック図である。
【図3】一般的なトランスファー方式の機械翻訳システ
ムの構成を示すブロック図である。
ムの構成を示すブロック図である。
【図4】一般的なShake and Bake方式の
機械翻訳システムの構成を示すブロック図である。
機械翻訳システムの構成を示すブロック図である。
【図5】本発明の機械翻訳装置を実現する計算機の構成
を示すブロツク図である。
を示すブロツク図である。
【図6】本発明の辞書の記憶方式による翻訳用辞書、プ
ログラムの主記憶、補助記憶装置上での配置を示す図で
ある。
ログラムの主記憶、補助記憶装置上での配置を示す図で
ある。
【図7】請求項1の翻訳装置の実施例の動作を示すフロ
ーチャートである。
ーチャートである。
【図8】日本語の解析辞書と対応する英語の生成辞書の
記述例を示す図である。
記述例を示す図である。
【図9】日英変換辞書の記述例を示す図である。
【図10】本発明の共通変換辞書の記述例を示す図であ
る。
る。
【図11】本発明の個別変換辞書の記述例を示す図であ
る。
る。
【図12】本発明の日仏の個別変換辞書の記述例を示す
図である。
図である。
【図13】本発明の多言語間の共通変換辞書の例を示す
図である。
図である。
【図14】請求項2の翻訳装置の実施例の動作を示すフ
ローチャートである。
ローチャートである。
1 解析部 2 変換部 3 生成部 4 共通変換辞書 5 個別変換辞書 6 辞書検索部 7 多言語間共通変換辞書 8 言語対毎の個別変換辞書
Claims (2)
- 【請求項1】 原言語の文を解析して原言語の内部表現
を生成する解析手段と、前記原言語の内部表現を目的言
語の内部表現に変換する変換手段と、前記目的言語の内
部表現から目的言語の文を生成する生成手段とを備える
機械翻訳装置であって、前記原言語の単語と前記目的言
語の単語との対応関係が記述されている個別変換辞書
と、原言語の単語の構文上の意味と目的言語の単語の構
文上の意味との対応関係が記述されている共通変換辞書
とを備え、前記変換手段が前記個別変換辞書と前記共通
変換辞書とを用いて、前記原言語の内部表現を前記目的
言語の内部表現に変換することを特徴とする機械翻訳装
置。 - 【請求項2】 原言語の文を解析して原言語の内部表現
を生成する解析手段と、前記原言語の内部表現を目的言
語の内部表現に変換する変換手段と、前記目的言語の内
部表現から目的言語の文を生成する生成手段とを備え、
所定の言語から複数の言語への翻訳を行う機械翻訳装置
であって、所定の言語の単語と各目的言語の単語との対
応関係が記述されている複数の個別変換辞書と、複数の
言語間の単語の構文上の意味の対応関係が記述されてい
る多言語間共通変換辞書とを備え、前記変換手段が原言
語と目的言語のための個別変換辞書と前記多言語間共通
変換辞書とを用いて、前記原言語の内部表現を前記目的
言語の内部表現に変換することを特徴とする機械翻訳装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6310495A JPH08166956A (ja) | 1994-12-14 | 1994-12-14 | 機械翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6310495A JPH08166956A (ja) | 1994-12-14 | 1994-12-14 | 機械翻訳装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08166956A true JPH08166956A (ja) | 1996-06-25 |
Family
ID=18005919
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6310495A Pending JPH08166956A (ja) | 1994-12-14 | 1994-12-14 | 機械翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08166956A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6539420B1 (en) | 1999-06-04 | 2003-03-25 | International Business Machines Corporation | Distribution mechanism for reuse of web based image data |
-
1994
- 1994-12-14 JP JP6310495A patent/JPH08166956A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6539420B1 (en) | 1999-06-04 | 2003-03-25 | International Business Machines Corporation | Distribution mechanism for reuse of web based image data |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0399533B1 (en) | Machine translation system and method of machine translation | |
US7565281B2 (en) | Machine translation | |
EP1349079A1 (en) | Machine translation | |
US5475586A (en) | Translation apparatus which uses idioms with a fixed and variable portion where a variable portion is symbolic of a group of words | |
JPH03278174A (ja) | 異言語交信用翻訳方法およびシステム | |
US5608623A (en) | Special cooccurrence processing method and apparatus | |
EP0398513B1 (en) | Method and apparatus for translating a sentence including a compound word formed by hyphenation | |
JPS58192173A (ja) | 機械翻訳装置 | |
JPH0682377B2 (ja) | 感情情報抽出装置 | |
JPH08166956A (ja) | 機械翻訳装置 | |
JP2005025555A (ja) | シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体 | |
KR100204068B1 (ko) | 개념기반 다국어 번역시스템의 문법 자동수정 방법 | |
JPH0561902A (ja) | 機械翻訳システム | |
JPH0778166A (ja) | 翻訳方法及び機械翻訳装置 | |
KR100282546B1 (ko) | 한-일 기계번역 시스템에서의 다어절 변환 단위의 변환 방법 | |
JP2994080B2 (ja) | 訳語選択方式 | |
JPH0320866A (ja) | テキストベース検索方式 | |
JP2000029882A (ja) | 要約文作成装置 | |
JPH02208775A (ja) | 機械翻訳方式 | |
JPH08241319A (ja) | 機械翻訳装置 | |
JPH09146959A (ja) | 機械翻訳システム | |
JPS6386071A (ja) | 自然言語翻訳方式 | |
JPH01112368A (ja) | 機械翻訳装置 | |
JPH05108705A (ja) | 機械翻訳装置 | |
JPH05334348A (ja) | 翻訳装置 |