JP2947554B2 - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JP2947554B2 JP2947554B2 JP63064342A JP6434288A JP2947554B2 JP 2947554 B2 JP2947554 B2 JP 2947554B2 JP 63064342 A JP63064342 A JP 63064342A JP 6434288 A JP6434288 A JP 6434288A JP 2947554 B2 JP2947554 B2 JP 2947554B2
- Authority
- JP
- Japan
- Prior art keywords
- japanese
- sentence
- translated
- unit
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000013519 translation Methods 0.000 title claims description 68
- 230000014616 translation Effects 0.000 description 62
- 230000014509 gene expression Effects 0.000 description 46
- 230000000877 morphologic effect Effects 0.000 description 21
- 238000000034 method Methods 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Description
【発明の詳細な説明】 〔概要〕 主語のない日本語文を外国語に翻訳する機械翻訳装置
に関し, 主語のない日本語文を外国語に翻訳する際,受動態で
表現できない場合に仮主語を用いることによる誤りの発
生を防止することを目的とし, 日本語文を入力する日本語文入力部と,日本語辞書を
検索して入力された日本語文を解析する日本語解析部
と,訳語辞書を検索して訳文を生成する訳文生成部と,
訳文を出力する訳文出力部とからなる機械翻訳装置にお
いて, 訳文生成部は,日本語解析部における日本語の入力文
の解析結果に基づいて,訳語辞書を検索して訳語を選択
し, 選択された訳語で構成される訳文の候補に主語がある
かどうかを判断し,主語がない場合,受動態で構成する
ことができるかどうかを判断し,受動態で表現すること
ができない場合,主語の位置に省略されている主語を代
替表示するアルファベット文字と主語が省略されている
ことを示すアルファベット文字以外の記号とにより構成
される文字記号を挿入して能動態で訳文を生成するよう
に構成する。
に関し, 主語のない日本語文を外国語に翻訳する際,受動態で
表現できない場合に仮主語を用いることによる誤りの発
生を防止することを目的とし, 日本語文を入力する日本語文入力部と,日本語辞書を
検索して入力された日本語文を解析する日本語解析部
と,訳語辞書を検索して訳文を生成する訳文生成部と,
訳文を出力する訳文出力部とからなる機械翻訳装置にお
いて, 訳文生成部は,日本語解析部における日本語の入力文
の解析結果に基づいて,訳語辞書を検索して訳語を選択
し, 選択された訳語で構成される訳文の候補に主語がある
かどうかを判断し,主語がない場合,受動態で構成する
ことができるかどうかを判断し,受動態で表現すること
ができない場合,主語の位置に省略されている主語を代
替表示するアルファベット文字と主語が省略されている
ことを示すアルファベット文字以外の記号とにより構成
される文字記号を挿入して能動態で訳文を生成するよう
に構成する。
本発明は,機械翻訳装置,特に主語のない日本語文を
外国語に翻訳する機械翻訳装置に関する。
外国語に翻訳する機械翻訳装置に関する。
一般に,日本語文では主語を省略してもなんら不自然
ではないが,英語などの外国語では,主語の省略は,特
別の文型以外にはない。
ではないが,英語などの外国語では,主語の省略は,特
別の文型以外にはない。
そこで,機械翻訳システムで主語が省略された日本語
文を外国語に翻訳する場合,目的語を主語にして受動態
で訳文を生成するという方法が採られている。
文を外国語に翻訳する場合,目的語を主語にして受動態
で訳文を生成するという方法が採られている。
本発明は,主語が省略された日本語文を外国語に翻訳
する機械翻訳装置に関するものである。
する機械翻訳装置に関するものである。
第3図は,従来例を示す図である。
第3図は,従来の機械翻訳装置の基本構成を示してい
る。
る。
第3図において,31は日本語文入力部,32は日本語解析
部,33は日本語辞書,34は訳文生成部,35は訳語辞書,36は
訳文出力部である。
部,33は日本語辞書,34は訳文生成部,35は訳語辞書,36は
訳文出力部である。
日本語文入力部31は,翻訳すべき日本語文を入力する
部分である。
部分である。
日本語解析部32は,日本語辞書33を検索して,入力さ
れた日本語文の形態素解析,構文解析,意味解析などを
行う。
れた日本語文の形態素解析,構文解析,意味解析などを
行う。
日本語辞書33には,日本語の単語の品詞,活用形,慣
用表現,接続関係,構文情報,意味などが登録されてい
る。
用表現,接続関係,構文情報,意味などが登録されてい
る。
訳文生成部34は,日本語解析部32の解析結果を基に,
訳語辞書35を検索して,訳語の選択,文構造の選択,単
語列の生成,形態素の合成などを行う。
訳語辞書35を検索して,訳語の選択,文構造の選択,単
語列の生成,形態素の合成などを行う。
訳語辞書35には,訳語の単語の意味,構文情報,活用
形,慣用表現,文法情報などが登録されている。
形,慣用表現,文法情報などが登録されている。
訳文出力部36は,訳文生成部34において生成された訳
文を出力する部分である。
文を出力する部分である。
以下,第3図に示した従来例の動作を説明する。
対話型機械翻訳の場合,日本語文入力部31および訳文
出力部36はキーボードおよびディスプレイからなり,翻
訳すべき日本語文はキーボードから1文ずつ入力し,翻
訳結果はディスプレイ画面上に表示される。また,一括
機械翻訳の場合には,日本語文入力部31および訳文出力
部36はキーボードおよびプリンタからなり,翻訳すべき
日本語文は文章として入力ファイルに格納しておき,翻
訳結果はプリンタにより印刷される。
出力部36はキーボードおよびディスプレイからなり,翻
訳すべき日本語文はキーボードから1文ずつ入力し,翻
訳結果はディスプレイ画面上に表示される。また,一括
機械翻訳の場合には,日本語文入力部31および訳文出力
部36はキーボードおよびプリンタからなり,翻訳すべき
日本語文は文章として入力ファイルに格納しておき,翻
訳結果はプリンタにより印刷される。
機械翻訳は,入力文の解析−内部表現の変換−訳文の
生成,という順序で行われる。
生成,という順序で行われる。
入力された日本語文の解析は日本語解析部32で行わ
れ,内部表現の変換は内部表現変換部(図示せず)で行
われ,訳文の生成は訳文生成部34で行われる。
れ,内部表現の変換は内部表現変換部(図示せず)で行
われ,訳文の生成は訳文生成部34で行われる。
以下に順をおって説明する。
まず,翻訳すべき日本語文を日本語文入力部31へ入力
する。
する。
入力文は,日本語解析部32へ送られる。
日本語解析部32は,日本語辞書33を検索して,入力文
の形態素解析,構文解析,意味解析および文脈解析を行
い,入力文を内部表現に解析する。
の形態素解析,構文解析,意味解析および文脈解析を行
い,入力文を内部表現に解析する。
形態素解析は,入力文を文法属性などの各種の属性を
持った形態素に解析する処理である。
持った形態素に解析する処理である。
構文解析は,入力文の構造を求める処理である。
意味解析は,入力文の意味構造を抽出する処理であ
る。
る。
文脈解析は,入力された文と文との接続関係を求める
処理である。
処理である。
日本語解析部32において解析された結果は内部表現で
表されている。この内部表現は,訳語に適した内部表現
に変換された後,訳文生成部34へ送られる。
表されている。この内部表現は,訳語に適した内部表現
に変換された後,訳文生成部34へ送られる。
訳文生成部34は,訳語辞書35を検索して訳文を生成す
る。
る。
次に,第3図に示したフロー図を用いて,訳文生成部
34における訳文の生成過程を説明する。
34における訳文の生成過程を説明する。
訳語辞書35を検索して,内部表現に訳語を当てはめ
る。
る。
主語があるかどうかを判断する。YESならばの処理
を実行し,NOならば次のの判断へ進む。
を実行し,NOならば次のの判断へ進む。
訳語として選択された動詞に着目し,その動詞の文法
上の性格から訳文が受動態として表現することができる
かどうかを判断する。YESならばの処理を実行し,NOな
らば次のの処理を実行する。
上の性格から訳文が受動態として表現することができる
かどうかを判断する。YESならばの処理を実行し,NOな
らば次のの処理を実行する。
主語の位置に仮主語を挿入する。
訳文を生成する。
以上のようにして生成された訳文は,訳文出力部36へ
出力される。
出力される。
一般に,日本語文では主語を省略してもなんら不自然
ではないが,英語などの外国語では,主語の省略は,特
別の文型以外にはない。
ではないが,英語などの外国語では,主語の省略は,特
別の文型以外にはない。
そこで,機械翻訳装置で主語が省略された日本語文を
外国語に翻訳する場合,目的語を主語にして受動態で訳
文を生成するという方法が採られている。
外国語に翻訳する場合,目的語を主語にして受動態で訳
文を生成するという方法が採られている。
しかし,この方法では,正しい訳文を生成することが
できない場合がある。
できない場合がある。
たとえば,「私は,部屋に入る」という日本語文を英
語に翻訳する場合を考える。この文には主語があるの
で,「I enter a room.」という訳文が生成される。
語に翻訳する場合を考える。この文には主語があるの
で,「I enter a room.」という訳文が生成される。
しかし,「部屋に入る」という日本語文を英語に翻訳
する場合,この文には主語がないので,「A room is en
tered.」という訳文を生成しようとするが,「enter」
という動詞は受動態になれないので,上記の訳文は成立
し得ない。
する場合,この文には主語がないので,「A room is en
tered.」という訳文を生成しようとするが,「enter」
という動詞は受動態になれないので,上記の訳文は成立
し得ない。
強いて訳文を生成しようとすると,「Enter a roo
m.」というように命令文になってしまう。
m.」というように命令文になってしまう。
そこで,従来の装置では,「You」や「It」などの特
定の主語を補って,「You enter a room.」 という訳文を生成していた。
定の主語を補って,「You enter a room.」 という訳文を生成していた。
しかし,この装置では,文脈からみて「You」や「I
t」を使用することが正しくない場合,訳文の後編集の
時に見逃してしまい,誤りを犯すという問題があった。
t」を使用することが正しくない場合,訳文の後編集の
時に見逃してしまい,誤りを犯すという問題があった。
本発明は,主語のない日本語文を外国語に翻訳する
際,受動態で表現できない場合に仮主語を用いることに
よる誤りの発生を防止した機械翻訳装置を提供すること
を目的とする。
際,受動態で表現できない場合に仮主語を用いることに
よる誤りの発生を防止した機械翻訳装置を提供すること
を目的とする。
上記目的を達成するために,本発明の機械翻訳装置
は,日本語文を入力する日本語文入力部と,日本語辞書
を検索して入力された日本語文を解析する日本語解析部
と,訳語辞書を検索して訳文を生成する訳文生成部と,
訳文を出力する訳文出力部とからなる機械翻訳装置にお
いて, 訳文生成部は,日本語解析部における日本語の入力文
の解析結果に基づいて,訳語辞書を検索して訳語を選択
し, 選択された訳語で構成される訳文の候補に主語がある
かどうかを判断し,主語がない場合,受動態で構成する
ことができるかどうかを判断し,受動態で表現すること
ができない場合,主語の位置に省略されている主語を代
替表示するアルファベット文字と主語が省略されている
ことを示すアルファベット文字以外の記号とにより構成
される文字記号を挿入して能動態で訳文を生成するよう
に構成する。
は,日本語文を入力する日本語文入力部と,日本語辞書
を検索して入力された日本語文を解析する日本語解析部
と,訳語辞書を検索して訳文を生成する訳文生成部と,
訳文を出力する訳文出力部とからなる機械翻訳装置にお
いて, 訳文生成部は,日本語解析部における日本語の入力文
の解析結果に基づいて,訳語辞書を検索して訳語を選択
し, 選択された訳語で構成される訳文の候補に主語がある
かどうかを判断し,主語がない場合,受動態で構成する
ことができるかどうかを判断し,受動態で表現すること
ができない場合,主語の位置に省略されている主語を代
替表示するアルファベット文字と主語が省略されている
ことを示すアルファベット文字以外の記号とにより構成
される文字記号を挿入して能動態で訳文を生成するよう
に構成する。
第1図は,本発明の原理説明図である。
第1図は,本発明に係る機械翻訳装置の基本構成を示
している。
している。
第1図において,1は日本語文入力部,2は日本語解析
部,3は日本語辞書,4は訳文生成部,5は訳語辞書,6は訳文
出力部である。
部,3は日本語辞書,4は訳文生成部,5は訳語辞書,6は訳文
出力部である。
日本語文入力部1は,翻訳すべき日本語文を入力する
部分である。
部分である。
日本語解析部2は,日本語辞書3を検索して,入力さ
れた日本語文の形態素解析,構文解析,意味解析などを
行う。
れた日本語文の形態素解析,構文解析,意味解析などを
行う。
日本語辞書3には,日本語の単語の品詞,活用形,慣
用表現,接続関係,構文情報,意味などが登録されてい
る。
用表現,接続関係,構文情報,意味などが登録されてい
る。
訳文生成部4は,日本語解析部2の解析結果を基に,
訳語辞書5を検索して,訳語の選択,文構造の選択,単
語列の生成,形態素の合成などを行う。
訳語辞書5を検索して,訳語の選択,文構造の選択,単
語列の生成,形態素の合成などを行う。
訳語辞書5には,訳語の単語の意味,構文情報,活用
形,慣用表現,文法情報などが登録されている。
形,慣用表現,文法情報などが登録されている。
訳文出力部6は,訳文生成部4において生成された訳
文を出力する部分である。
文を出力する部分である。
第1図を用いて,本発明の作用を説明する。
対話型機械翻訳の場合,日本語文入力部1および訳文
出力部6はキーボードおよびディスプレイからなり,翻
訳すべき日本語文はキーボードから1文ずつ入力し,翻
訳結果はディスプレイ画面上に表示される。また,一括
機械翻訳の場合には,日本語文入力部1および訳文出力
部6はキーボードおよびプリンタからなり,翻訳すべき
日本語文は文章として入力ファイルに格納しておき,翻
訳結果はプリンタにより印刷される。
出力部6はキーボードおよびディスプレイからなり,翻
訳すべき日本語文はキーボードから1文ずつ入力し,翻
訳結果はディスプレイ画面上に表示される。また,一括
機械翻訳の場合には,日本語文入力部1および訳文出力
部6はキーボードおよびプリンタからなり,翻訳すべき
日本語文は文章として入力ファイルに格納しておき,翻
訳結果はプリンタにより印刷される。
機械翻訳は,入力文の解析−内部表現の変換−訳文の
生成,という順序で行われる。
生成,という順序で行われる。
入力された日本語文の解析は日本語解析部2で行わ
れ,内部表現の変換は内部表現変換部(図示せず)で行
われ,訳文の生成は訳文生成部4で行われる。
れ,内部表現の変換は内部表現変換部(図示せず)で行
われ,訳文の生成は訳文生成部4で行われる。
以下に順をおって説明する。
まず,翻訳すべき日本語文を日本語文入力部1へ入力
する。
する。
入力文は,日本語解析部2へ送られる。
日本語解析部2は,日本語辞書3を検索して,入力文
の形態素解析,構文解析,意味解析および文脈解析を行
い,入力文を内部表現に解析する。形態素解析は,入力
文を文法属性などの各種の属性を持った形態素に解析す
る処理である。
の形態素解析,構文解析,意味解析および文脈解析を行
い,入力文を内部表現に解析する。形態素解析は,入力
文を文法属性などの各種の属性を持った形態素に解析す
る処理である。
構文解析は,入力文の構造を求める処理である。
意味解析は,入力文の意味構造を抽出する処理であ
る。
る。
文脈解析は,入力された文と文との接続関係を求める
処理である。
処理である。
日本語解析部2において解析された結果は内部表現で
表されている。この内部表現は,訳語に適した内部表現
に変換された後,訳文生成部4へ送られる。
表されている。この内部表現は,訳語に適した内部表現
に変換された後,訳文生成部4へ送られる。
訳文生成部4は,訳語辞書5を検索して訳文を生成す
る。
る。
次に,第1図に示したフロー図を用いて,訳文生成部
4における訳文の生成過程を説明する。
4における訳文の生成過程を説明する。
訳語辞書5を検索して,内部表現に訳語を当てはめ
る。
る。
主語があるかどうかを判断する。YESならばの処理
を実行し,NOならば次のの判断へ進む。
を実行し,NOならば次のの判断へ進む。
訳語として選択された動詞に着目し,その動詞の文法
上の性格から訳文が受動態として表現することができる
かどうかを判断する。YESならばの処理を実行し,NOな
らば次のの処理を実行する。
上の性格から訳文が受動態として表現することができる
かどうかを判断する。YESならばの処理を実行し,NOな
らば次のの処理を実行する。
主語の位置に,省略されている主語の代替表示を行う
文字記号を挿入する。
文字記号を挿入する。
訳文を生成する。
以上のようにして生成された訳文は,訳文出力部6へ
出力される。
出力される。
次に,本発明による訳文の例を示す。
(日本語入力文) 「部屋に入る」 (訳文) 「(*S)enter a room.」 (*S)は,主語の位置に挿入された,省略されてい
る主語を代替表示する文字記号である。この文字記号に
は,主語省略文であることを警告する作用がある。そし
て,後編集の時に,この(*S)という文字記号の部分
を正しい訳語で置き換える。
る主語を代替表示する文字記号である。この文字記号に
は,主語省略文であることを警告する作用がある。そし
て,後編集の時に,この(*S)という文字記号の部分
を正しい訳語で置き換える。
このように,本発明では,(*S)という文字記号に
よって省略されている主語が代替表示されるので,従来
の装置が単純に(機械的に)付加していた「It」などの
仮主語と異なり,一見して主語省略文であることが分か
る。従来例のように,「It」などを仮主語に用いると,
上述したように文脈からみて「It」などを使用すること
が正しくない場合に,訳文の後編集の時に見逃してしま
い,誤りを犯しやすい。
よって省略されている主語が代替表示されるので,従来
の装置が単純に(機械的に)付加していた「It」などの
仮主語と異なり,一見して主語省略文であることが分か
る。従来例のように,「It」などを仮主語に用いると,
上述したように文脈からみて「It」などを使用すること
が正しくない場合に,訳文の後編集の時に見逃してしま
い,誤りを犯しやすい。
この点本発明では,省略されている主語の代わりに
(*S)という文字記号を表示しているから,一見した
だけで主語省略文であることが判明する。また,本発明
では,(*S)という文字記号を表示しているから,デ
ィスプレイ画面上だけでなく,紙に印刷出力された訳文
からも主語省略文であることが一見しただけで分かる。
(*S)という文字記号を表示しているから,一見した
だけで主語省略文であることが判明する。また,本発明
では,(*S)という文字記号を表示しているから,デ
ィスプレイ画面上だけでなく,紙に印刷出力された訳文
からも主語省略文であることが一見しただけで分かる。
以上のように,本発明に係る装置によれば,後編集の
時に,従来例のように「It」などを仮主語に用いること
による誤りの発生を防止することが可能になる。
時に,従来例のように「It」などを仮主語に用いること
による誤りの発生を防止することが可能になる。
なお,(*S)は省略されている主語を代替表示する
文字記号の1例であり,他の文字記号,例えば<※>や
%S%など,訳文中の単語と粉らわしくない文字記号を
使用できることは勿論である。
文字記号の1例であり,他の文字記号,例えば<※>や
%S%など,訳文中の単語と粉らわしくない文字記号を
使用できることは勿論である。
このように,本発明の装置によれば,後編集の時に,
従来の装置のように仮主語を用いることによる誤りの発
生を防止することができる。
従来の装置のように仮主語を用いることによる誤りの発
生を防止することができる。
第2図は,本発明の1実施例構成図である。
本実施例は,本発明を日本語−英語機械翻訳システム
に適用した例である。
に適用した例である。
第2図において,201は入力部,202は日本語解析部,203
は形態素解析部,204は構文解析部,205は意味解析部,206
は文脈解析部,207は日本語単語辞書,208は日本語活用形
辞書,209は日本語接続関係辞書,210は日本語構文辞書,2
11は日本語単語意味辞書,212は日本語慣用表現辞書,213
は内部表現変換部,214は構造変換辞書,215は訳文生成
部,216は訳語選択部,217は文構造選択部,218は単語列生
成部,219は形態素合成部,220は英語単語意味辞書,221は
英語構文辞書,222は英語単語辞書,223は英語慣用表現辞
書,224は英語形態素辞書,225は出力部である。
は形態素解析部,204は構文解析部,205は意味解析部,206
は文脈解析部,207は日本語単語辞書,208は日本語活用形
辞書,209は日本語接続関係辞書,210は日本語構文辞書,2
11は日本語単語意味辞書,212は日本語慣用表現辞書,213
は内部表現変換部,214は構造変換辞書,215は訳文生成
部,216は訳語選択部,217は文構造選択部,218は単語列生
成部,219は形態素合成部,220は英語単語意味辞書,221は
英語構文辞書,222は英語単語辞書,223は英語慣用表現辞
書,224は英語形態素辞書,225は出力部である。
入力部201は,翻訳すべき日本語文を入力する部分で
あり,入力文が属する文書の種別情報も入力する。
あり,入力文が属する文書の種別情報も入力する。
日本語解析部202は,形態素解析部203,構文解析部20
4,意味解析部205および文脈解析部206からなる。
4,意味解析部205および文脈解析部206からなる。
形態素解析部203は,日本語単語辞書207,日本語活用
形辞書208および日本語接続関係辞書209を検索して,入
力文を形態素に解析する。
形辞書208および日本語接続関係辞書209を検索して,入
力文を形態素に解析する。
構文解析部204は,形態素解析部203において解析され
た形態素を基に,日本語構文辞書210,日本語単語意味辞
書211および日本語慣用表現辞書212を検索して,入力文
の構造を求める。
た形態素を基に,日本語構文辞書210,日本語単語意味辞
書211および日本語慣用表現辞書212を検索して,入力文
の構造を求める。
意味解析部205は,構文解析部204における解析結果を
基に,日本語構文辞書210,日本語単語意味辞書211およ
び日本語慣用表現辞書212を検索して,入力文の意味構
造を抽出する。
基に,日本語構文辞書210,日本語単語意味辞書211およ
び日本語慣用表現辞書212を検索して,入力文の意味構
造を抽出する。
文脈解析部206は,入力された文と文との接続関係を
求める。
求める。
日本語単語辞書207には,日本語の単語の品詞が登録
されている。
されている。
日本語活用形辞書208には,日本語の単語の活用形が
登録されている。
登録されている。
日本語接続関係辞書209には,日本語の単語が前後の
単語とどのように接続することが可能であるかという接
続関係が登録されている。
単語とどのように接続することが可能であるかという接
続関係が登録されている。
日本語構文辞書210には,日本語の構文情報が登録さ
れている。
れている。
日本語単語意味辞書211には,日本語の単語の意味が
登録されている。
登録されている。
日本語慣用表現辞書212には,「おはよう」「こんに
ちは」などの日本語の慣用表現が登録されている。
ちは」などの日本語の慣用表現が登録されている。
内部表現変換部213は,日本語解析部202において入力
された日本語文を解析した結果得られた,日本語特有の
構造をした内部表現を,構造変換辞書214を用いて,英
語に適した構造の内部表現に変換する。
された日本語文を解析した結果得られた,日本語特有の
構造をした内部表現を,構造変換辞書214を用いて,英
語に適した構造の内部表現に変換する。
構造変換辞書214には,日本語特有の構造をした内部
表現を英語に適した構造の内部表現に変換するための規
則が登録されている。
表現を英語に適した構造の内部表現に変換するための規
則が登録されている。
訳文生成部215は,訳語選択部216,文構造選択部217,
単語列生成部218および形態素合成部219からなる。
単語列生成部218および形態素合成部219からなる。
訳語選択部216は,内部表現変換部213において変換さ
れた英語に適した構造の内部表現の各構成要素に,英語
単語意味辞書220を用いて,英語の訳語を付与する。
れた英語に適した構造の内部表現の各構成要素に,英語
単語意味辞書220を用いて,英語の訳語を付与する。
文構造選択部217は,訳語選択部216において英語の訳
語を付与された,英語に適した内部表現に,英語構文辞
書221を検索して英語の構文構造をあてはめる。
語を付与された,英語に適した内部表現に,英語構文辞
書221を検索して英語の構文構造をあてはめる。
単語列生成部218は,文構造選択部217において選択さ
れた英語の文構造に,英語単語辞書222および英語慣用
表現辞書を検索して英語の単語をあてはめて英語の単語
列を生成する。
れた英語の文構造に,英語単語辞書222および英語慣用
表現辞書を検索して英語の単語をあてはめて英語の単語
列を生成する。
形態素合成部219は,単語列生成部218において生成さ
れた英語の単語列を,英語形態素辞書224を検索して,
単語語間の接続関係などから並べ換え,英語の訳文を生
成する。
れた英語の単語列を,英語形態素辞書224を検索して,
単語語間の接続関係などから並べ換え,英語の訳文を生
成する。
英語単語意味辞書220には,英語の単語およびその意
味が登録されている。
味が登録されている。
英語構文辞書221には,英語の構文情報が登録されて
いる。
いる。
英語単語辞書222には,英語の単語およびその活用形
などが登録されている。
などが登録されている。
英語慣用表現辞書223には,Good morningなどの英語の
慣用表現が登録されている。
慣用表現が登録されている。
英語形態素辞書224には,英語の単語の文法情報など
が登録されている。
が登録されている。
出力部225は,英語の訳文を出力する部分である。
以下,第2図に示した日本語−英語機械翻訳システム
の動作を説明する。
の動作を説明する。
対話型機械翻訳の場合,入力部201および出力部225は
キーボードおよびディスプレイからなり,翻訳すべき日
本語文はキーボードから1文ずつ入力し,翻訳結果はデ
ィスプレイ画面上に表示される。また,一括機械翻訳の
場合には,入力部201および出力部225はキーボードおよ
びプリンタからなり,翻訳すべき日本語文は文章として
入力ファイルに格納しておき,翻訳結果はプリンタによ
り印刷される。
キーボードおよびディスプレイからなり,翻訳すべき日
本語文はキーボードから1文ずつ入力し,翻訳結果はデ
ィスプレイ画面上に表示される。また,一括機械翻訳の
場合には,入力部201および出力部225はキーボードおよ
びプリンタからなり,翻訳すべき日本語文は文章として
入力ファイルに格納しておき,翻訳結果はプリンタによ
り印刷される。
日本語−英語機械翻訳は,入力された日本語文の解析
−内部表現の変換−訳文の生成,という順序で行われ
る。
−内部表現の変換−訳文の生成,という順序で行われ
る。
入力された日本語文の解析は日本語解析部202で行わ
れ,内部表現の変換は内部表現変換部213で行われ,訳
文の生成は訳文生成部215で行われる。
れ,内部表現の変換は内部表現変換部213で行われ,訳
文の生成は訳文生成部215で行われる。
以下に順をおって説明する。
まず,翻訳すべき日本語文を入力部201へ入力する。
入力文は,形態素解析部203へ送られる。
形態素解析部203は,日本語単語辞書207,日本語活用
形辞書208および日本語接続関係辞書209を検索して,入
力文を形態素に解析する。各形態素は,文法属性などの
各種の属性を持たされる。
形辞書208および日本語接続関係辞書209を検索して,入
力文を形態素に解析する。各形態素は,文法属性などの
各種の属性を持たされる。
形態素解析部203での解析結果は,構文解析部204へ送
られる。
られる。
構文解析部204は,日本語構文辞書210,日本語単語意
味辞書211および日本語慣用表現辞書212を検索して,入
力文の構造を求める。
味辞書211および日本語慣用表現辞書212を検索して,入
力文の構造を求める。
構文解析部204での解析結果は,意味解析部205へ送ら
れる。
れる。
意味解析部205は,日本語構文辞書210,日本語単語意
味辞書211および日本語慣用表現辞書212を検索して,入
力文の意味構造を抽出する。
味辞書211および日本語慣用表現辞書212を検索して,入
力文の意味構造を抽出する。
意味解析部205での解析結果は,文脈解析部206へ送ら
れる。
れる。
文脈解析部206は,入力された文と文との接続関係を
求める。
求める。
文脈解析部206での解析結果は,内部表現変換部213へ
送られる。
送られる。
内部表現変換部213は,日本語解析部202において入力
された日本語文を解析した結果得られた,日本語特有の
構造をした内部表現を,構造変換辞書214を用いて,英
語に適した構造の内部表現に変換する。
された日本語文を解析した結果得られた,日本語特有の
構造をした内部表現を,構造変換辞書214を用いて,英
語に適した構造の内部表現に変換する。
内部表現変換部213での変換結果は,訳語選択部216へ
送られる。
送られる。
訳語選択部216は,英語に適した構造の内部表現の各
構成要素に,英語単語意味辞書220を用いて,英語の訳
語を付与する。
構成要素に,英語単語意味辞書220を用いて,英語の訳
語を付与する。
訳語選択部216での処理結果は,文構造選択部217へ送
られる。
られる。
文構造選択部217は,英語に適した内部表現に,英語
構文辞書221を検索して英語の構文構造をあてはめる。
この時,主語があるかどうかの判断および主語がない場
合に,受動態で表現することができるかどうかの判断が
なされる。そして,主語がなく,受動態で表現すること
ができない場合には,主語の位置に省略されている主語
を代替表示する文字記号,例えば(*S)を挿入する。
構文辞書221を検索して英語の構文構造をあてはめる。
この時,主語があるかどうかの判断および主語がない場
合に,受動態で表現することができるかどうかの判断が
なされる。そして,主語がなく,受動態で表現すること
ができない場合には,主語の位置に省略されている主語
を代替表示する文字記号,例えば(*S)を挿入する。
文構造選択部217での処理結果は,単語列生成部218へ
送られる。
送られる。
単語列生成部218は,英語単語辞書222および英語慣用
表現辞書223を検索して英語の単語をあてはめて英語の
単語列を生成する。
表現辞書223を検索して英語の単語をあてはめて英語の
単語列を生成する。
単語列生成部218での処理結果は,形態素合成部219へ
送られる。
送られる。
形態素合成部219は,英語形態素辞書224を検索して,
単語語間の接続関係などから英語の訳文を生成する。
単語語間の接続関係などから英語の訳文を生成する。
形態素合成部219で生成された英語の訳文は出力部225
へ出力される。
へ出力される。
本発明では,主語のない日本語文を外国語に機械翻訳
する際に,受動態で表現することができない場合,省略
されている主語を代替表示する文字記号を主語の位置に
挿入して能動態で表現しているので,後編集の時に,主
語省略文であるということを見逃すことがなくなる。
する際に,受動態で表現することができない場合,省略
されている主語を代替表示する文字記号を主語の位置に
挿入して能動態で表現しているので,後編集の時に,主
語省略文であるということを見逃すことがなくなる。
また,従来のように省略されている主語の代わりに
「It」などの仮主語を用いて訳文を生成する時に発生す
る文脈上の誤りの発生を防止することができる。
「It」などの仮主語を用いて訳文を生成する時に発生す
る文脈上の誤りの発生を防止することができる。
第1図は本発明の原理説明図,第2図は本発明の1実施
例構成図,第3図は従来例を示す図である。 第1図において 1:日本語文入力部 2:日本語解析部 3:日本語辞書 4:訳文生成部 5:訳語辞書 6:訳文出力部
例構成図,第3図は従来例を示す図である。 第1図において 1:日本語文入力部 2:日本語解析部 3:日本語辞書 4:訳文生成部 5:訳語辞書 6:訳文出力部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 柿宇土 正博 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (56)参考文献 SANYO TECHNICAL R EVIEW VOL,20 NO.1 F EB,1988,第45〜55頁 (58)調査した分野(Int.Cl.6,DB名) G06F 15/38
Claims (1)
- 【請求項1】日本語文を入力する日本語文入力部と,日
本語辞書を検索して入力された日本語文を解析する日本
語解析部と,訳語辞書を検索して訳文を生成する訳文生
成部と,訳文を出力する訳文出力部とからなる機械翻訳
装置において, 訳文生成部は,日本語解析部における日本語の入力文の
解析結果に基づいて,訳語辞書を検索して訳語を選択
し, 選択された訳語で構成される訳文の候補に主語があるか
どうかを判断し,主語がない場合,受動態で構成するこ
とができるかどうかを判断し,受動態で表現することが
できない場合,主語の位置に省略されている主語を代替
表示するアルファベット文字と主語が省略されているこ
とを示すアルファベット文字以外の記号とにより構成さ
れる文字記号を挿入して能動態で訳文を生成することを
特徴とする機械翻訳装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63064342A JP2947554B2 (ja) | 1988-03-17 | 1988-03-17 | 機械翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63064342A JP2947554B2 (ja) | 1988-03-17 | 1988-03-17 | 機械翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH01236362A JPH01236362A (ja) | 1989-09-21 |
JP2947554B2 true JP2947554B2 (ja) | 1999-09-13 |
Family
ID=13255474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63064342A Expired - Lifetime JP2947554B2 (ja) | 1988-03-17 | 1988-03-17 | 機械翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2947554B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6320567A (ja) * | 1986-07-15 | 1988-01-28 | Ricoh Co Ltd | 翻訳装置 |
-
1988
- 1988-03-17 JP JP63064342A patent/JP2947554B2/ja not_active Expired - Lifetime
Non-Patent Citations (1)
Title |
---|
SANYO TECHNICAL REVIEW VOL,20 NO.1 FEB,1988,第45〜55頁 |
Also Published As
Publication number | Publication date |
---|---|
JPH01236362A (ja) | 1989-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100530154B1 (ko) | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 | |
US20040254783A1 (en) | Third language text generating algorithm by multi-lingual text inputting and device and program therefor | |
US5075851A (en) | System for translating a source language word with a prefix into a target language word with multiple forms | |
JPH0261763A (ja) | 機械翻訳装置 | |
JP2947554B2 (ja) | 機械翻訳装置 | |
JP2719453B2 (ja) | 機械翻訳装置 | |
KR100194798B1 (ko) | 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법 | |
JP2723886B2 (ja) | 機械翻訳装置及びその翻訳規則作成方法 | |
JP2938897B2 (ja) | 文書作成処理装置 | |
JP2608384B2 (ja) | 機械翻訳装置及びその方法 | |
JP2817497B2 (ja) | 辞書編集装置 | |
JP3267168B2 (ja) | 自然言語変換システム | |
JPH10320395A (ja) | 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
KR20110018717A (ko) | 중국어 구조조사 오류의 자동정정 장치 및 방법 | |
JP2004199173A (ja) | 自然言語パターン生成装置、自然言語処理装置、自然言語パターン生成方法、プログラム及び記憶媒体 | |
JPH07141382A (ja) | 外国語文書作成支援装置 | |
JP2002032369A (ja) | 辞書作成装置 | |
JPS60247787A (ja) | 文章変換装置 | |
JPH01236361A (ja) | 日本語文章処理方式 | |
JPH02110771A (ja) | 電訳機 | |
JPH0736892A (ja) | 機械翻訳装置 | |
JPH05197752A (ja) | 機械翻訳装置 | |
JPH0887504A (ja) | 前編集支援方法および装置 | |
JPH05342259A (ja) | 機械翻訳システム | |
JPH0612448A (ja) | 機械翻訳方法及び機械翻訳装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080702 Year of fee payment: 9 |