JPH10320395A - 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents
機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体Info
- Publication number
- JPH10320395A JPH10320395A JP9126805A JP12680597A JPH10320395A JP H10320395 A JPH10320395 A JP H10320395A JP 9126805 A JP9126805 A JP 9126805A JP 12680597 A JP12680597 A JP 12680597A JP H10320395 A JPH10320395 A JP H10320395A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- information
- dictionary
- language
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 204
- 150000001875 compounds Chemical class 0.000 claims abstract description 78
- 238000006243 chemical reaction Methods 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims description 9
- 230000014616 translation Effects 0.000 abstract description 183
- 230000000877 morphologic effect Effects 0.000 abstract description 18
- 238000010276 construction Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 10
- 230000000474 nursing effect Effects 0.000 description 9
- 239000002245 particle Substances 0.000 description 7
- 239000003550 marker Substances 0.000 description 3
- 230000010365 information processing Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
て単語に分割し、解析部で係り受けなどの解析をして、
入力文のツリー構造を作る。これを変換部で翻訳対象文
の構造に変換し、これをもとに生成部で翻訳対象文のツ
リー構造を生成し、形態素生成部で語形変化などの調整
をして、出力部から翻訳結果を出力する。前記変換部で
参照する翻訳辞書もしくはユーザー辞書の中に、見出し
語である単語が複合語の中で使われたときの訳し方を指
示する情報を付け、この情報があれば、変換部でその情
報に従って複合語のツリー構造を変換し、原文や翻訳対
象文の情報を付けることで、複合語を単に訳の羅列では
なく、自然で適切な訳に翻訳する。
Description
び、その機械翻訳装置を動作させるためのプログラムを
格納した記録媒体に関するものである。
装置を動作させるためのプログラムを格納した記録媒体
では、複数の単語より成る複合語を翻訳する場合には、
その複合語が一語で翻訳辞書もしくはユーザー辞書に登
録されていれば、その訳が出るが、そうでなければ、そ
れぞれの単語の訳が並んで出ているだけであった。例え
ば、第一言語を日本語、第二言語を英語とすると、「大
学卒業」はその見出し語で翻訳辞書もしくはユーザー辞
書に登録されていなければ、「大学」から”unive
rsity”が、「卒業」から”graduatio
n”が出るので、その翻訳結果は”universit
y graduation”であった。
訳結果は間違っており、正しくは”graduatio
n from a university”である。こ
のような訳を出すためには翻訳辞書もしくはユーザー辞
書に「大学卒業」を1つの見出し語として登録すればい
いのであるが、単に各々の単語の訳語を並べて出すだけ
では正しい訳語を得ることができない複合語は「大学卒
業」に限らず数え切れないほどあるため、そのすべてを
翻訳辞書やユーザー辞書に登録するのは不可能である。
になされたものであり、ある単語が複合語の中に出現し
た場合の訳し方を翻訳辞書もしくはユーザー辞書で指定
できるようにすることによって、複合語の平らな構造か
ら、その単語を親ノードとするような上下の関係を持つ
ツリー構造に変換して、さらに英語の前置詞のような第
二言語の情報や、「目的語」などの係り受けの情報をそ
のツリー構造に付与することによって、単に各々の単語
の訳語を羅列するのではなく、ユーザーが翻訳結果を修
正する必要のない自然な訳を出すことができる機械翻訳
装置及び、その機械翻訳装置を動作させるためのプログ
ラムを格納した記録媒体を提供することを目的としてい
る。
に、本発明の請求項1に記載の機械翻訳装置は、第一言
語を入力するための入力部と、翻訳で利用するための翻
訳辞書と、ユーザーが任意に作成するユーザー辞書と、
第一言語を第二言語に翻訳するための翻訳部と、翻訳結
果を出力するための出力部とを備えたものを対象とし
て、特に、前記翻訳部に、ある見出し語が複数の単語よ
り成る複合語の最後に出現した時、前記最後の見出し語
を親ノードとするツリー構造に変換する構造変換手段を
備えている。この構造変換手段によって、複合語の平ら
なツリー構造から、正しい翻訳結果を生成するために適
したツリー構造に変換される。上記構成を有する本発明
の請求項1記載の機械翻訳装置において、入力部は、所
定の国の言語からなり、複数の単語を連結してなる複合
語を入力し、翻訳辞書およびユーザー辞書は、所定の国
の言語の単語に対応して、所定の国以外の他の国の言語
からなる単語をその辞書情報と共に記憶する。また、翻
訳部は、入力部により入力された複合語を翻訳辞書およ
びユーザー辞書に基づいて、他の国の言語に翻訳し、出
力部は、翻訳部により翻訳された結果を出力する。
請求項1に記載の機械翻訳装置の構成において、前記翻
訳辞書およびユーザー辞書に、前記のような構造変換を
行う場合の条件を指定する条件指定手段を備えている。
上記構成を有する請求項2記載の機械翻訳装置におい
て、翻訳辞書およびユーザー辞書は、前記条件指定手段
によって指定された条件を記憶する。
請求項1に記載の機械翻訳装置の構成において、前記翻
訳辞書およびユーザー辞書に、前記のような構造変換を
行った後、第二言語の情報をツリー構造に付与するため
の情報を指定する第二言語情報指定手段を備えている。
上記構成を有する請求項3記載の機械翻訳装置におい
て、翻訳辞書およびユーザー辞書は、例えば英語の前置
詞のような第二言語の情報を記憶する。
は、請求項1に記載の機械翻訳装置の構成において、前
記翻訳辞書およびユーザー辞書に、前記のような構造変
換を行った後、係り受けの情報をツリー構造に付与する
ための情報を指定する係り受け情報指定手段を備えてい
る。上記構成を有する請求項4記載の機械翻訳装置にお
いて、翻訳辞書およびユーザー辞書は、例えば目的語の
ような係り受けの情報を記憶する。
グラムを記録したコンピュータ読み取り可能な記録媒体
は、第一言語を入力するための入力部と、翻訳で利用す
るための翻訳辞書と、ユーザーが任意に作成するユーザ
ー辞書と、第一言語を第二言語に翻訳するための翻訳部
と、翻訳結果を出力するための出力部とを備えたものを
対象として、特に、前記翻訳部に、ある見出し語が複数
の単語より成る複合語の最後に出現した時、前記最後の
見出し語を親ノードとするツリー構造に変換する構造変
換プログラムを格納している。この構造変換プログラム
によって、複合語の平らなツリー構造から、正しい翻訳
結果を生成するために適したツリー構造に変換される。
機械翻訳処理プログラムを記録したコンピュータ読み取
り可能な記録媒体において、入力部は、所定の国の言語
からなり、複数の単語を連結してなる複合語を入力し、
翻訳辞書およびユーザー辞書は、所定の国の言語の単語
に対応して、所定の国以外の他の国の言語からなる単語
をその辞書情報と共に記憶する。また、翻訳部は、入力
部により入力された複合語を翻訳辞書およびユーザー辞
書に基づいて、他の国の言語に翻訳し、出力部は、翻訳
部により翻訳された結果を出力する。
グラムを記録したコンピュータ読み取り可能な記録媒体
は、請求項5に記載の機械翻訳処理プログラムを記録し
たコンピュータ読み取り可能な記録媒体の構成におい
て、前記翻訳辞書およびユーザー辞書に、前記のような
構造変換を行う場合の条件を指定する条件指定プログラ
ムを格納している。上記構成を有する請求項6記載の機
械翻訳処理プログラムを記録したコンピュータ読み取り
可能な記録媒体において、翻訳辞書およびユーザー辞書
は、前記条件指定プログラムによって指定された条件を
記憶する。
グラムを記録したコンピュータ読み取り可能な記録媒体
は、請求項5に記載の機械翻訳処理プログラムを記録し
たコンピュータ読み取り可能な記録媒体の構成におい
て、前記翻訳辞書およびユーザー辞書に、前記のような
構造変換を行った後、第二言語の情報をツリー構造に付
与するための情報を指定する第二言語情報指定プログラ
ムを格納している。上記構成を有する請求項7記載の機
械翻訳処理プログラムを記録したコンピュータ読み取り
可能な記録媒体において、翻訳辞書およびユーザー辞書
は、例えば英語の前置詞のような第二言語の情報を記憶
する。
ログラムを記録したコンピュータ読み取り可能な記録媒
体は、請求項5に記載の機械翻訳処理プログラムを記録
したコンピュータ読み取り可能な記録媒体の構成におい
て、前記翻訳辞書およびユーザー辞書に、前記のような
構造変換を行った後、係り受けの情報をツリー構造に付
与するための情報を指定する係り受け情報指定プログラ
ムを格納している。上記構成を有する請求項8記載の機
械翻訳処理プログラムを記録したコンピュータ読み取り
可能な記録媒体において、翻訳辞書およびユーザー辞書
は、例えば目的語のような係り受けの情報を記憶する。
形態を、第一言語を日本語、第二言語を英語とした場合
の実施例に基づいて説明する。
に示す。この図に示すように、キーボード等からなる日
本語を入力するための入力部10と、CRTに表示した
り、プリンタから印刷するための出力部20は、装置全
体を制御するための中央処理装置であるCPU50に接
続されている。
接続され、入力された日本語文を記憶するための入力バ
ッファ領域61と、翻訳結果の英語文を記憶するための
出力バッファ領域62とワークエリア63に分かれてい
る。
としてのROM70は、CPU50と接続され、その中
には図2のフローチャートで示すプログラムが記憶さ
れ、日本語文を英語文に翻訳する翻訳プログラム30と
翻訳プログラムが参照する翻訳辞書40が格納されてい
る。翻訳プログラム30は日本語文を形態素解析するた
めの形態素解析部31と、日本語文の係り受けなどの解
析をする構文解析部32と、解析された日本語文を英語
の構造に変換する構文変換部33と、変換された英語の
構造から英語を生成する構文生成部34と、語尾変化な
どの調整を行う形態素生成部35に分かれている。
れており、ユーザーが任意に作成するユーザー辞書81
が格納されている。
の動作を示すフローチャートである。
る。他のステップも同様)において、キーボード等から
日本語文を入力する。入力された日本語は翻訳にかける
ために入力バッファ領域61に記憶される(S2)。こ
こに記憶された入力文は形態素解析部31において翻訳
辞書40とユーザー辞書81を参照して該当する単語が
あるかどうかを調べるという形態素解析の処理が行われ
る(S3)。通常、形態素解析ではユーザー辞書があれ
ば翻訳辞書に優先して検索される。一般的に、与えられ
た文の構造を把握するためには、まず文を単語の並びと
して認識し、各単語を品詞などの属性に対応づける処理
が必要である。英語などでは文が単語に分かち書きされ
るので単語と単語の境界を認定する必要はないが、日本
語や中国語では通常分かち書きはされないので、単語の
境界を認定する必要がある。そして、文の中に出現した
単語が活用変化や語尾変化をしている場合には、その活
用形を認識して、原形に戻す操作も必要である。単語の
並びには一定の規則があり、入力された文字列をこの規
則にしたがって翻訳辞書40やユーザー辞書81などの
辞書を使用しながら分割していく処理が「形態素解析」
である。
る単語認定の方式として、一致する候補のうち最長のも
のを優先させる「最長一致法」を採用している。この方
法によると、辞書の日本語見出しとして登録可能な最大
文字数分の文字列を文頭から切り出し、それを検索キー
ワードとしてユーザー辞書81および翻訳辞書40を検
索しに行く。そこで検索されない場合は最大文字数より
1文字少ない文字数分の文字列を文頭から切り出し、そ
れを検索キーワードにして検索する。もし該当する単語
が検索されれば、その単語を確定して、次の文字列から
再度最大文字数分を切り出して検索を続ける。
のが検索される。例えば「大学卒業」は「大学」という
名詞と「卒業」という名詞に形態素解析されるが、もし
「大学卒業」という名詞があればその文字数の方が多い
のでそちらが引けることになる。形態素解析で入力文を
単語に分割し、検索した単語の辞書情報を各々の単語に
付与した後、S4において構文解析部32において、形
態素解析によって得られた単語の並びを解析プログラム
によって解析して、単語を句にまとめ上げたり、主語や
目的語などの係り先を決めるなどして、入力文の内部構
造であるツリー構造を作る。次にS5において、構文の
変換を行う。ここでは、解析された結果に基づいて、ユ
ーザー辞書81と翻訳辞書40を参照しながら、各々の
単語に英語の訳を当てると同時に、翻訳対象言語である
英語のツリー構造に変換する。
与された日本語入力文の情報を英語の情報に付け替え
る。次にS6において構文生成を行う。ここでは、翻訳
辞書57を参照しながら、構文変換部で作られたツリー
構造をもとにして、正しい英文を出すためのツリー構造
にする。また、英語の情報も各々のノードに付与する。
次にS7において、形態素生成を行って語尾変化などの
調整をして、S8で翻訳結果の英文をCRTに表示した
り、プリンタから出力する。
見出し語が複数の単語より成る複合語の最後に出現した
時、前記最後の見出し語を親ノードとするツリー構造に
変換する構造変換プログラムと、どのような条件の場合
に前記のような構造変換を行うかを指定する条件指定プ
ログラムと、前記のような構造変換を行った後、第二言
語の情報をツリー構造に付与するための情報を指定する
第二言語情報指定プログラムと、係り受けの情報をツリ
ー構造に付与するための情報を指定する係り受け指定プ
ログラムがROMに予め格納されたものであるが、本発
明は必ずしもこれに限定されるものではない。例えば、
これらのプログラムをフロッピーディスクやCD‐RO
M等に格納したものを読み取り装置により読み取ってイ
ンストールさせて動作させることができる。
部情報処理装置からプログラムを読み込んで動作させる
ことができる。この場合、前記フロッピーディスクやC
D‐ROMや、外部情報処理装置の当該プログラムを格
納したメモリが本発明の記録媒体を構成することにな
る。
の「彼は大学卒業後に看護科の学校建設に携わった。」
が形態素解析部31で形態素解析されてツリー構造に展
開された結果を表している。この図においてrootと
いうのは入力文のツリー構造の最上部にいつも付く仮の
ノードである。このノードは内部的なツリー構造を下げ
るのに形態素解析から形態素生成までの翻訳プロセスを
通して必要なものであるが、最終的に英文を得るときに
は落とされる。rootのノードの下には検索された辞
書の情報が付与されるが、ここでは便宜上、見出し語と
品詞だけを挙げている。
されツリー構造に展開された結果を表している。roo
tの下には入力文の主動詞である「携わる」が下がって
いる。形態素解析で「た」という過去の助動詞が検索さ
れていたので、「携わる」のノードに時制の情報として
「過去」が付与される。主動詞の下には「彼」と「卒
業」と「建設」の3つのノードが下がっている。
味を持つので係り受けに「主語」が、そして助詞には
「は」が付与されている。それぞれの単語には形態素解
析から引き継いでいる「見出し語」と「品詞」の情報の
他に名詞の場合にはどんな意味分類を持つかという情報
が入っている。「大学卒業」は「大学」と「卒業」の2
語で複合語を構成している。compというのは複合語
を表し、その下に「大学」と「卒業」が下がっている。
compの上には「卒業」というノードがあるが、複合
語の最後の単語である「卒業」の情報が上がっている。
「卒業」には文節接続マーカとして「後」が、助詞とし
て「に」が付与されているが、これは「大学卒業後に」
の部分を構文解析して得られた情報である。
うに構文解析されている。つまり、「看護」という名詞
と「科」という名詞が2語で複合語を構成しているの
で、それをまとめるcompというノードがあり、その
上には複合語の最後の単語である「科」が付いている。
「科」には助詞として「の」が付与されており、それは
「学校」と「建設」から成るcomp(複合語)をまと
める「建設」に下がっている。「携わる」という主動詞
に対して「学校建設」は対象の意味を持つため、「建
設」には係り受け情報として「対象」が、助詞として
「に」が付与されている。
の対訳辞書の情報を示す図である。この図が示すよう
に、見出し語は「卒業」であり、その品詞は「名詞」で
ある。また、訳語は”graduation”であり、
その品詞は「名詞」である。「卒業」は複合語で使われ
たときの訳し分け情報を持っている。つまり、「大学卒
業」のように見出し語の直前に「学校」の意味分類を持
つ名詞が来たときには複合語の平らな構造を変換して、
直前の単語である「大学」のノードに英語の前置詞の”
from”を付与するということである。
の対訳辞書の情報を示す図である。この図が示すよう
に、見出し語は「建設」であり、その品詞は「名詞」で
ある。また、訳語は”build”であり、その品詞は
「動詞」である。「建設」も複合語で使われたときの訳
し分け情報を持っている。つまり、「学校建設」のよう
に見出し語の直前に「建物」の意味分類を持つ名詞が来
たときには複合語の平らな構造を変換して、直前の単語
である「学校」を「建設」の訳語である”build”
の目的語に取るようにするということである。
対訳辞書の情報を示す図である。この図が示すように、
見出し語は「科」であり、その品詞は「名詞」である。
また、訳語は”department”であり、その品
詞は「名詞」である。「科」も同様に複合語で使われた
ときの訳し分け情報を持っている。つまり、「看護科」
のように複合語で使われた場合は直前の名詞がどんな意
味分類を持つ名詞であってもすべて訳語を”depar
tment”から”course”に変更するというも
のである。
に本実施の形態に関する複合語の処理について詳述した
フローチャートである。
書である図5と図6と図7を使って、図4で示した解析
結果のツリー構造を変換する動作について図8を用いて
説明する。
うに活用しない語(一般的に「体言」と呼ばれる)に対
訳辞書を参照して訳語が付与される(S1)。この結
果、訳語として「彼」には”he”、「大学」には”u
niversity”、「卒業」には”graduat
ion”、「看護」には”nurse”、「科」には”
department”、「学校」には”schoo
l”、「建設」には”build”がそれぞれ付与され
る。また同時に、「卒業」と「科」と「建設」には複合
語の中で使われたときの訳し方を指示する複合語訳し分
け情報があるが、この場合には、それを表すように「複
合語訳し分け情報有り」という情報も付与する。
報有り」という情報が付与されているかどうかを調べ
る。「複合語訳し分け情報有り」が付いていなければ
(S2:NO)、複合語の処理は必要ないので、次の処
理(S10)へ飛ぶ。「複合語訳し分け情報有り」であ
れば(S2:YES)、対訳辞書の中の複合語訳し分け
情報を検索しに行く(S3)。対訳辞書には図5と図6
で示すように、複合語の中で特に直前の名詞の意味分類
が特定のものである場合にだけツリー構造を変えるよう
に指定されたものがある。それを判別するためにS4に
おいて、複合語訳し分け情報で意味分類が指定されてい
るかどうかを調べる。
れている場合に(S4:YES)、次にS5において直
前の名詞の意味分類と複合語訳し分け情報の意味分類が
マッチするかどうかを調べる。マッチしなければ(S
5:NO)それ以上の複合語の処理は行わず、次の処理
(S10)へ飛ぶ。図7のように複合語訳し分け情報で
意味分類が指定されていないか(S4:NO)、意味分
類がマッチした場合(S5:YES)には次に複合語訳
し分け情報に記述された情報に従って処理を進める。つ
まり、複合語訳し分け情報の中で「訳変更」と「英語前
置詞」の両方の指定がある場合には、複合語の平らな構
造から、見出し語の単語を親ノードとしてその下に直前
のノードを下げるような構造に変換した上で、見出し語
の単語は「訳変更」で指定された訳語に変更し、その下
のノードには「英語前置詞」で指定された前置詞を付与
する(S6)。
だけが指定されている場合には、複合語の平らな構造か
ら、見出し語の単語を親ノードとしてその下に直前のノ
ードを下げるような構造に変換した上で、その下のノー
ドには「英語前置詞」で指定された前置詞を付与する
(S7)。複合語訳し分け情報の中で「訳変更」のみが
指定されている場合には、構造はそのままで見出し語の
訳だけを「訳変更」で指定された訳語に変更する(S
8)。複合語訳し分け情報の中で「係り受け」が指定さ
れている場合には、複合語の平らな構造から、見出し語
の単語を親ノードとしてその下に直前のノードを下げる
ような構造に変換した上で、その下のノードには「係り
受け」で指定された情報を付与する(S9)もちろん、
ここで「訳変更」も指定されていれば見出し語の訳語の
変更も同様に行う。それが済むと、S10において用言
の訳を付け、S11においてその他の処理を行う。ここ
では日本語の助詞と文節接続マーカに対して適切な英語
の前置詞が当てられる。入力文の中の文節接続マーカの
「後」には英語の”afater”という前置詞が当て
られる。
したときにも過去形で出るように「英語の時制」にも
「過去」が付与される。
た結果のツリー構造を示している。このツリー構造が示
すように、rootのノードの下には主動詞の「携わ
る」が下がっているが、用言の訳が付いて”parti
cipate”という訳語が付与されている。”par
ticipate”の品詞は動詞であるので訳語の品詞
は「動詞」である。また、日本語の時制が過去であった
ので、英語の時制にも「過去」が付与されている。「携
わる」の下には「彼」と「卒業」と「建設」の3つのノ
ードが下がっている。「彼」は入力文では「携わる」の
主語であったが、英語でも”participate”
の主語となるので英語の係り受けも「主語」である。
「彼」の訳語は”he”でありその品詞は「代名詞」で
ある。次に「卒業」と「建設」のノードについては図4
の構文解析された結果できたツリー構造と比較してみる
と違いが明らかになる。
合語の構造となっており、「卒業」と「建設」のノード
の下にはそれぞれ複合語であることを示すcompとい
うノードが下がっており、その下に、複合語を構成する
それぞれの単語が平らに並んでいた。しかし、構文変換
部で参照した対訳辞書の中の複合語訳し分け情報によっ
てこれらの複合語の構造は見出し語を親ノードとして、
その下に直前の単語を下げる構造になっている。「大学
卒業」は「卒業」の対訳辞書の複合語訳し分け情報で直
前に「学校」の意味分類を持つ単語が来たら、構造変換
して直前の単語に英語の前置詞の”from”が付与さ
れるため、「卒業」の下に直前の単語である「大学」が
下がり、「大学」には英語の前置詞の”from”が付
与されている。それぞれの名詞には訳語と訳語の品詞が
付与されるのはすべて同様である。(以降は従って訳語
と訳語の品詞の説明は省く。)「卒業」には訳語と訳語
の品詞の他に、構文解析で付与された文節接続マーカの
「後」に対する英語の前置詞の”after”が付与さ
れている。
の複合語訳し分け情報で直前に「建物」の意味分類を持
つ単語が来たら、構造変換して直前の単語に係り受けの
情報である「目的語」が付与されるため、「建設」の下
に直前の単語である「学校」が下がり、「学校」には複
合語訳し分け情報の係り受けとして「目的語」という情
報が付与される。「建設」は訳語と訳語の品詞の他
に、”participate”に対してどんな関係に
あるのかを示すために英語の係り受けとして「対象」が
付与されている。また、日本語の助詞の「に」に対して
英語の前置詞の”in”が当たるのでそれも付与され
る。「建設」の下には「学校」だけでなく「看護科」と
いう複合語も下がっている。「科」の対訳辞書の複合語
訳し分け情報では訳を変更することだけしか指定されて
いないので「卒業」や「建設」のような構造変換は行わ
れない。つまり、構文解析されてできた複合語の構造の
ままである。ただし、「科」は訳が”departme
nt”から”course”に変更されている。さらに
compのノードの上の「科」には日本語の助詞の
「の」に対する英語の前置詞”of”が付与されてい
る。
造は構文生成部34で英文生成規則を適用して、英語と
して正しいツリー構造が作られ、形態素生成部35で、
英語の動詞の受動態を生成したり、冠詞を出したり、語
尾変形などをして最終的な訳文を得る。名詞の訳語に英
語の動詞が当たっている場合に動名詞(ing形)を出
すのも形態素生成である。
て”nursing”となり、「建設」の訳語の”bu
ild”も”building”となる。構文変換部3
3で構造変換された際に下のノードに複合語訳し分け情
報の係り受けの「目的語」が付与されたが、その場合は
親ノードを動詞と見て、下のノードが目的語として処理
される。つまり、「学校建設」の場合は「建設」の訳語
が”build”という動詞になっており、「学校」の
ノードには複合語訳し分け情報の係り受けとして「目的
語」が付与されているので、構文生成と形態素生成を経
て得られる英文は”building a schoo
l”となる。入力文の「彼は大学卒業後に看護科の学校
建設に携わった。」は上記のような処理を経て、”He
participated in building
a school of thenursing c
ourse.”という英文になって出力部20から出力
される。
請求項1記載の機械翻訳装置によれば、第一言語を入力
するための入力部と、翻訳に利用するための翻訳辞書
と、ユーザーが任意に作成するユーザー辞書と、入力さ
れた第一言語を第二言語に翻訳するための翻訳部と、翻
訳結果を出力するための出力部とを備える機械翻訳装置
において、前記翻訳部に、ある見出し語が複数の単語よ
り成る複合語の最後に出現した時、前記最後の見出し語
を親ノードとするツリー構造に変換する構造変換手段を
備えることによって単に各々の単語の訳を羅列しただけ
の訳語ではなく、自然な訳語を得ることができる。
ば、前記翻訳辞書もしくはユーザー辞書に、どのような
条件の場合に前記のような構造変換を行うかを指定する
条件指定手段を備えることによって、ある条件の場合に
だけその複合語訳し分け情報に指定された訳語に変更す
ることができる。
ば、前記翻訳辞書もしくはユーザー辞書に、前記のよう
な構造変換を行った後、第二言語の情報をツリー構造に
付与するための情報を指定する第二言語情報指定手段を
備えることによって、複合語の中で使われた時に英語の
前置詞などが確定できる場合にはそれを指定することに
よって、誤った第二言語の訳語が付かないようにする。
れば、前記翻訳辞書もしくはユーザー辞書に、前記のよ
うな構造変換を行った後、係り受けの情報をツリー構造
に付与するための情報を指定する係り受け情報指定手段
を備えることによって、正しい係り受けの構造を作っ
て、自然な訳語を生成することができる。つまり、上記
のような手段により、単語の訳が羅列されただけの翻訳
結果をユーザーがいちいち修正したり、翻訳辞書やユー
ザー辞書に複合語を一語で登録したりしなくても、自然
で適切な複合語の訳を出すことができる。これは日本語
のように複合語を作りやすい言語を翻訳するときには特
に効果的である。
ラムを記録したコンピュータ読み取り可能な記録媒体に
よれば、前記翻訳部に、ある見出し語が複数の単語より
成る複合語の最後に出現した時、前記最後の見出し語を
親ノードとするツリー構造に変換する構造変換プログラ
ムを格納することによって単に各々の単語の訳を羅列し
ただけの訳語ではなく、自然な訳語を得ることができ
る。
ラムを記録したコンピュータ読み取り可能な記録媒体に
よれば、前記翻訳辞書もしくはユーザー辞書に、どのよ
うな条件の場合に前記のような構造変換を行うかを指定
する条件指定プログラムを格納することによって、ある
条件の場合にだけその複合語訳し分け情報に指定された
訳語に変更することができる。
ラムを記録したコンピュータ読み取り可能な記録媒体に
よれば、前記翻訳辞書もしくはユーザー辞書に、前記の
ような構造変換を行った後、第二言語の情報をツリー構
造に付与するための情報を指定する第二言語情報指定プ
ログラムを格納することによって、複合語の中で使われ
た時に英語の前置詞などが確定できる場合にはそれを指
定することによって、誤った第二言語の訳語が付かない
ようにする。
グラムを記録したコンピュータ読み取り可能な記録媒体
によれば、前記翻訳辞書もしくはユーザー辞書に、前記
のような構造変換を行った後、係り受けの情報をツリー
構造に付与するための情報を指定する係り受け情報指定
プログラムを格納することによって、正しい係り受けの
構造を作って、自然な訳語を生成することができる。つ
まり、上記のようなプログラムにより、単語の訳が羅列
されただけの翻訳結果をユーザーがいちいち修正した
り、翻訳辞書やユーザー辞書に複合語を一語で登録した
りしなくても、自然で適切な複合語の訳を出すことがで
きる。これは日本語のように複合語を作りやすい言語を
翻訳するときには特に効果的である。
ック図である。
を説明するフローチャートである。
す図である。
す図である。
す図である。
図である。
実施の形態に関する複合語の処理について詳述したフロ
ーチャートである。
す図である。
Claims (8)
- 【請求項1】 第一言語を入力するための入力部と、翻
訳に利用するための翻訳辞書と、ユーザーが任意に作成
するユーザー辞書と、入力された第一言語を第二言語に
翻訳するための翻訳部と、翻訳結果を出力するための出
力部とを備える機械翻訳装置において、 前記翻訳部に、ある見出し語が複数の単語より成る複合
語の最後に出現した時、前記最後の見出し語を親ノード
とするツリー構造に変換する構造変換手段を備えること
を特徴とする機械翻訳装置。 - 【請求項2】 前記翻訳辞書もしくはユーザー辞書に、
どのような条件の場合に前記のような構造変換を行うか
を指定する条件指定手段を備えることを特徴とする請求
項1記載の機械翻訳装置。 - 【請求項3】 前記翻訳辞書もしくはユーザー辞書に、
前記のような構造変換を行った後、第二言語の情報をツ
リー構造に付与するための情報を指定する第二言語情報
指定手段を備えることを特徴とする請求項1記載の機械
翻訳装置。 - 【請求項4】 前記翻訳辞書もしくはユーザー辞書に、
前記のような構造変換を行った後、係り受けの情報をツ
リー構造に付与するための情報を指定する係り受け情報
指定手段を備えることを特徴とする請求項1記載の機械
翻訳装置。 - 【請求項5】 第一言語を入力するための入力部と、翻
訳に利用するための翻訳辞書と、ユーザーが任意に作成
するユーザー辞書と、入力された第一言語を第二言語に
翻訳するための翻訳部と、翻訳結果を出力するための出
力部とを備える記録媒体において、 前記翻訳部に、ある見出し語が複数の単語より成る複合
語の最後に出現した時、前記最後の見出し語を親ノード
とするツリー構造に変換する構造変換プログラムを格納
することを特徴とする機械翻訳処理プログラムを記録し
たコンピュータ読み取り可能な記録媒体。 - 【請求項6】 前記翻訳辞書もしくはユーザー辞書に、
どのような条件の場合に前記のような構造変換を行うか
を指定する条件指定プログラムを格納することを特徴と
する請求項5記載の機械翻訳処理プログラムを記録した
コンピュータ読み取り可能な記録媒体。 - 【請求項7】 前記翻訳辞書もしくはユーザー辞書に、
前記のような構造変換を行った後、第二言語の情報をツ
リー構造に付与するための情報を指定する第二言語情報
指定プログラムを格納することを特徴とする請求項5記
載の機械翻訳処理プログラムを記録したコンピュータ読
み取り可能な記録媒体。 - 【請求項8】 前記翻訳辞書もしくはユーザー辞書に、
前記のような構造変換を行った後、係り受けの情報をツ
リー構造に付与するための情報を指定する係り受け情報
指定プログラムを格納することを特徴とする請求項5記
載の機械翻訳処理プログラムを記録したコンピュータ読
み取り可能な記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP12680597A JP3680489B2 (ja) | 1997-05-16 | 1997-05-16 | 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP12680597A JP3680489B2 (ja) | 1997-05-16 | 1997-05-16 | 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH10320395A true JPH10320395A (ja) | 1998-12-04 |
| JP3680489B2 JP3680489B2 (ja) | 2005-08-10 |
Family
ID=14944405
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP12680597A Expired - Fee Related JP3680489B2 (ja) | 1997-05-16 | 1997-05-16 | 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3680489B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021026586A (ja) * | 2019-08-07 | 2021-02-22 | 前田建設工業株式会社 | 用語辞書作成装置、用語辞書作成方法、及びプログラム |
-
1997
- 1997-05-16 JP JP12680597A patent/JP3680489B2/ja not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021026586A (ja) * | 2019-08-07 | 2021-02-22 | 前田建設工業株式会社 | 用語辞書作成装置、用語辞書作成方法、及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3680489B2 (ja) | 2005-08-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3377290B2 (ja) | イディオム処理機能を持つ機械翻訳装置 | |
| CN100511215C (zh) | 多语种翻译存储器和翻译方法 | |
| US20050137853A1 (en) | Machine translation | |
| JP2002215617A (ja) | 品詞タグ付けをする方法 | |
| JPS62163173A (ja) | 機械翻訳方法 | |
| JPH0335354A (ja) | 機械翻訳装置における略称付き固有名詞処理方法 | |
| KR20030094632A (ko) | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 | |
| JPH0261763A (ja) | 機械翻訳装置 | |
| JP2006127405A (ja) | バイリンガルパラレルテキストをアライメントする方法及びそのためのコンピュータで実行可能なプログラム | |
| JP2632806B2 (ja) | 言語解析装置 | |
| JP3680489B2 (ja) | 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JPH0561902A (ja) | 機械翻訳システム | |
| JP2719453B2 (ja) | 機械翻訳装置 | |
| JP3197110B2 (ja) | 自然言語解析装置および機械翻訳装置 | |
| JPH10340264A (ja) | 機械翻訳装置及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JP2752025B2 (ja) | 機械翻訳装置 | |
| JP2947554B2 (ja) | 機械翻訳装置 | |
| JP3873299B2 (ja) | 仮名漢字変換装置および仮名漢字変換方法 | |
| JP2608384B2 (ja) | 機械翻訳装置及びその方法 | |
| JP4023384B2 (ja) | 自然言語翻訳方法及び装置及び自然言語翻訳プログラム | |
| JP3233800B2 (ja) | 機械翻訳装置 | |
| JP3353873B2 (ja) | 機械翻訳装置 | |
| JP2839419B2 (ja) | イディオム登録機能を持つ機械翻訳装置 | |
| JPH05225232A (ja) | テキスト自動前編集装置 | |
| JPH0345423B2 (ja) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040518 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040720 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040720 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050426 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050509 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080527 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090527 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090527 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100527 Year of fee payment: 5 |
|
| LAPS | Cancellation because of no payment of annual fees |