JPH02308370A - 機械翻訳システム - Google Patents
機械翻訳システムInfo
- Publication number
- JPH02308370A JPH02308370A JP1128722A JP12872289A JPH02308370A JP H02308370 A JPH02308370 A JP H02308370A JP 1128722 A JP1128722 A JP 1128722A JP 12872289 A JP12872289 A JP 12872289A JP H02308370 A JPH02308370 A JP H02308370A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- sentence
- information
- processing
- translated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 111
- 238000000034 method Methods 0.000 claims description 34
- 230000000877 morphologic effect Effects 0.000 claims description 16
- 230000014616 translation Effects 0.000 description 91
- 238000010586 diagram Methods 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 15
- 230000021615 conjugation Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の目的〕
(産業上の利用分野)
本発明は第1言語で記載された原文を第2言語で記述さ
れた訳文に効率良く翻訳処理する機械翻訳システムに関
する。
れた訳文に効率良く翻訳処理する機械翻訳システムに関
する。
(従来の技術)
機械翻訳システムにおいては、入力原文を形態素解析、
構文解析して語(句)等の所定の処理単位に区分し、そ
の処理単位ごとに意味解析を行い、翻訳辞書を検索して
対応する訳語(訳語句)等を見出し、これを所定の訳文
規則にしたがって結合する等してその訳文を得るように
構成されている。
構文解析して語(句)等の所定の処理単位に区分し、そ
の処理単位ごとに意味解析を行い、翻訳辞書を検索して
対応する訳語(訳語句)等を見出し、これを所定の訳文
規則にしたがって結合する等してその訳文を得るように
構成されている。
椅
しかし、従来の都械翻訳システムにおいては、自然言語
の構文・意味解釈技術が十分に確立されていないことも
あり、適切な訳文を確実に得ることは困蒐である。更に
同一文書中に同一または類似した箇所が存在する時には
同様な解釈が行われ同様な訳文が生成される事が望まし
いが、周囲の状況によって、異なった解釈が行われ異な
った訳文が生成されてしまうという欠点があった。
の構文・意味解釈技術が十分に確立されていないことも
あり、適切な訳文を確実に得ることは困蒐である。更に
同一文書中に同一または類似した箇所が存在する時には
同様な解釈が行われ同様な訳文が生成される事が望まし
いが、周囲の状況によって、異なった解釈が行われ異な
った訳文が生成されてしまうという欠点があった。
たとえば、英語を日本語に翻訳するシステムにおいて、
文1 : rYou have this paper
+J文2 : rI wrote the paper
、Jという文が前後して現われるような文書を翻訳する
場合について考えてみる。ここで英単1rpaperJ
に対応する日本語として「紙」と「論文」の2つが設定
されていたとする。文1に対して翻訳処理を行なった段
階では、rpaperJの訳語として1紙」「論文」の
どちらが選択されたとしても、得られる訳文は、[あな
たはこの紙を持っている」「あなたはこの論文を持って
いる。jとなり、双方とも意味的な違和感は感じられな
い。次に文2に対して翻訳処理を行うと、rPaper
Jの訳語としては「論文」を選択する事が適当と判断さ
れ、得られる適切な訳文は、「私はその論文を書いた。
+J文2 : rI wrote the paper
、Jという文が前後して現われるような文書を翻訳する
場合について考えてみる。ここで英単1rpaperJ
に対応する日本語として「紙」と「論文」の2つが設定
されていたとする。文1に対して翻訳処理を行なった段
階では、rpaperJの訳語として1紙」「論文」の
どちらが選択されたとしても、得られる訳文は、[あな
たはこの紙を持っている」「あなたはこの論文を持って
いる。jとなり、双方とも意味的な違和感は感じられな
い。次に文2に対して翻訳処理を行うと、rPaper
Jの訳語としては「論文」を選択する事が適当と判断さ
れ、得られる適切な訳文は、「私はその論文を書いた。
」となる。従って文1中の語rpaperJに対しても
、文2中の語rPaperJと同一の対象を現わしてい
ると判断され、文1の適切な訳は、「あなたはこの論文
を持っている。」となることが予想される。従来の構文
・意味解析や原文の構造から訳文の構造への変換、訳文
の生成の技術を用いては、文2のような文に対しては、
例えばr write Jとr Paper Jの単語
間あるいは単語が表す概念間の共起関係に関する情報を
保持して訳語選択の際にその中から適切な情報を抽出す
る等の手段により、適切な訳語を選択する事が可能であ
る。しかしながら文1のような、単独の文1つだけでは
訳語の選択にあいまいさを生じてしまう文に対しては、
適切な訳語の選択ができないという欠点が生じていた。
、文2中の語rPaperJと同一の対象を現わしてい
ると判断され、文1の適切な訳は、「あなたはこの論文
を持っている。」となることが予想される。従来の構文
・意味解析や原文の構造から訳文の構造への変換、訳文
の生成の技術を用いては、文2のような文に対しては、
例えばr write Jとr Paper Jの単語
間あるいは単語が表す概念間の共起関係に関する情報を
保持して訳語選択の際にその中から適切な情報を抽出す
る等の手段により、適切な訳語を選択する事が可能であ
る。しかしながら文1のような、単独の文1つだけでは
訳語の選択にあいまいさを生じてしまう文に対しては、
適切な訳語の選択ができないという欠点が生じていた。
これは訳語の選択についての例であるが、構文解析時、
意味解析時等のあらゆる処理において特定の1文のみの
独立した処理においてはあいまいさを生じる可能性があ
った。
意味解析時等のあらゆる処理において特定の1文のみの
独立した処理においてはあいまいさを生じる可能性があ
った。
(発明が解決しようとする課題)
この様に従来では特定の1文のみの独立した翻訳処理に
おいて、訳語選択等にあいまいさが生じるという欠点が
有った。
おいて、訳語選択等にあいまいさが生じるという欠点が
有った。
そこで本発明の目的は、たとえば文等の処理単位につい
て翻訳処理を行う際に、同一文書中の前記処理単位以外
の部分より抽出した情報を利用する事を特徴とする機械
翻訳装置を提供することにある。
て翻訳処理を行う際に、同一文書中の前記処理単位以外
の部分より抽出した情報を利用する事を特徴とする機械
翻訳装置を提供することにある。
(課題を解決するための手段)
本発明は翻訳対象となる第1言語の原文を入力するため
の入力手段と、翻訳処理に使用する知識情報を収容した
翻訳辞書と、この翻訳辞書の内容を用いて前記入力原文
を第2言語の訳文に翻訳処理する翻訳手段と、この翻訳
手段より出力された第2言語の訳文を出力する出力手段
とを備え露、前記翻訳手段は翻訳の対象としている部分
の処理に際し、その部分以外の部分から抽出した情報を
用いる事を特徴とするものである。
の入力手段と、翻訳処理に使用する知識情報を収容した
翻訳辞書と、この翻訳辞書の内容を用いて前記入力原文
を第2言語の訳文に翻訳処理する翻訳手段と、この翻訳
手段より出力された第2言語の訳文を出力する出力手段
とを備え露、前記翻訳手段は翻訳の対象としている部分
の処理に際し、その部分以外の部分から抽出した情報を
用いる事を特徴とするものである。
(作用)
本発明によって、単独の文を翻訳処理する際には解釈に
あいまい性が生じる場合についても、同一文書中の他の
箇所より取り出した情報を用いへ解釈のあいまいさを解
消する事が可能になる。
あいまい性が生じる場合についても、同一文書中の他の
箇所より取り出した情報を用いへ解釈のあいまいさを解
消する事が可能になる。
(実施例)
以下1本発明の実施例を図面を用いて説明する。第1図
は本発明の実施例である英日機械翻訳システムの全体ブ
ロック図である。このシステムは、キーボード等からな
る入力部101、 この入力部101 を介して入力さ
れる文字列等から成る英文を翻訳処理の対象となる文と
して記憶した原文記憶部102.翻訳処理を実行する翻
訳部103、翻訳処理に利用する知識情報を収容した翻
訳辞書部104、翻訳の対象となる文書に関する情報を
記憶する文書情報記憶部105、翻訳部からの出力を翻
訳処理の結果となる文として記憶した訳文記憶部106
、訳文記録部106の内容をプリンタ等に出力する出力
部107とにより構成されている。第2図のフローチャ
ートに基き、本実施例における翻訳部での翻訳処理の流
れを説明する。
は本発明の実施例である英日機械翻訳システムの全体ブ
ロック図である。このシステムは、キーボード等からな
る入力部101、 この入力部101 を介して入力さ
れる文字列等から成る英文を翻訳処理の対象となる文と
して記憶した原文記憶部102.翻訳処理を実行する翻
訳部103、翻訳処理に利用する知識情報を収容した翻
訳辞書部104、翻訳の対象となる文書に関する情報を
記憶する文書情報記憶部105、翻訳部からの出力を翻
訳処理の結果となる文として記憶した訳文記憶部106
、訳文記録部106の内容をプリンタ等に出力する出力
部107とにより構成されている。第2図のフローチャ
ートに基き、本実施例における翻訳部での翻訳処理の流
れを説明する。
まずステップ20で翻訳処理の単位となる文を原文記憶
部中の文書の先頭から1つ取り出し、ステツブ21の第
一翻訳処理で一文に対する翻訳処理を行う。ステップ2
1では、文書情報記憶部105中に翻訳処理中で得られ
た、訳語、格関係、形態素情報等の曖昧さが生じなかっ
た情報を蓄積していき、生成された訳文を訳文記憶部に
蓄積する処理は行わない。ステップ21〜23により、
原文記憶部中の文書から文を順に取り出し、取り出した
文に対してそれぞれステップ21の第1翻訳処理を文書
が終了するまで行い、ステップ24に進む。ステップ2
4で、原文記憶部中の文書の先頭に戻って文を一つ取り
出す。次にステップ25〜28のループによって原文記
憶部中の文書中のすべての文に対して順に第2翻訳処理
25を行い、その結果得られた訳文をステップ26の処
理により訳文記憶部106に出力し、処理を終了する。
部中の文書の先頭から1つ取り出し、ステツブ21の第
一翻訳処理で一文に対する翻訳処理を行う。ステップ2
1では、文書情報記憶部105中に翻訳処理中で得られ
た、訳語、格関係、形態素情報等の曖昧さが生じなかっ
た情報を蓄積していき、生成された訳文を訳文記憶部に
蓄積する処理は行わない。ステップ21〜23により、
原文記憶部中の文書から文を順に取り出し、取り出した
文に対してそれぞれステップ21の第1翻訳処理を文書
が終了するまで行い、ステップ24に進む。ステップ2
4で、原文記憶部中の文書の先頭に戻って文を一つ取り
出す。次にステップ25〜28のループによって原文記
憶部中の文書中のすべての文に対して順に第2翻訳処理
25を行い、その結果得られた訳文をステップ26の処
理により訳文記憶部106に出力し、処理を終了する。
第2翻訳処理は、文書情報記憶部105中の情報を利用
して翻訳処理を行う。
して翻訳処理を行う。
次に翻訳部103において行われる処理について説明す
る。第3図は翻訳部103における第1翻訳処理21の
流れを示すフローチャートである。形態素解析部301
では、活用変化辞書104aを検索する事により、入力
原文中の英単語の品詞、原形、活用情報を求める。構文
解析部302では、解析文法104b及び形態素解析部
301で得られた品詞情報を用いて入力原文の構文を解
析し、まだ意味的に解釈の愛味性を内奏させた英語の構
造を生成する。
る。第3図は翻訳部103における第1翻訳処理21の
流れを示すフローチャートである。形態素解析部301
では、活用変化辞書104aを検索する事により、入力
原文中の英単語の品詞、原形、活用情報を求める。構文
解析部302では、解析文法104b及び形態素解析部
301で得られた品詞情報を用いて入力原文の構文を解
析し、まだ意味的に解釈の愛味性を内奏させた英語の構
造を生成する。
在
意味解析部303は、意味解析文法104cを使って解
釈の曖昧性を無くした英語の構造を生成する。構造変換
部304は、変換文法104dを使って英語の構造を日
本語の構造に変換する。構文生成部305は、生成文法
104eに従って日本語の構造から日本語の語順を決定
し単語列に変換する。形態素生成部306は形態素生成
文法104fにより単語の語尾などを変化させて翻訳文
を完成させる。
釈の曖昧性を無くした英語の構造を生成する。構造変換
部304は、変換文法104dを使って英語の構造を日
本語の構造に変換する。構文生成部305は、生成文法
104eに従って日本語の構造から日本語の語順を決定
し単語列に変換する。形態素生成部306は形態素生成
文法104fにより単語の語尾などを変化させて翻訳文
を完成させる。
ここで301〜306の各ステップにおいて曖昧性が生
ずる事なく解析または生成が行われた場合、解析または
生成に関する情報を301〜306の各段階別に分類し
て文書情報記憶部105に蓄積する。ここでいう解析ま
たは生成に関する情報につき、以下例文”I wrot
e the paper、”を翻訳処理する場合に基い
て詳細に説明する。
ずる事なく解析または生成が行われた場合、解析または
生成に関する情報を301〜306の各段階別に分類し
て文書情報記憶部105に蓄積する。ここでいう解析ま
たは生成に関する情報につき、以下例文”I wrot
e the paper、”を翻訳処理する場合に基い
て詳細に説明する。
まずステップ301の形態素解析により、 各単語にお
ける形態素解析結果が第4図に示す様に得られる。 こ
こで文書情報記憶部105中の形態素情報記憶部105
aに第4図中の解析時に曖昧性が生ずる事がなかった項
目を追加する。この場合「I」「νroteJ rth
eJの項目については、辞書引きの結果他の候補が存在
しないのでこれらの項目は形態素情報記憶部105aに
追加される。rpaperJについては品詞をverb
とする解析が存在するので曖昧さが生じたことになり、
形態素情報記憶部105aには追加されない。
ける形態素解析結果が第4図に示す様に得られる。 こ
こで文書情報記憶部105中の形態素情報記憶部105
aに第4図中の解析時に曖昧性が生ずる事がなかった項
目を追加する。この場合「I」「νroteJ rth
eJの項目については、辞書引きの結果他の候補が存在
しないのでこれらの項目は形態素情報記憶部105aに
追加される。rpaperJについては品詞をverb
とする解析が存在するので曖昧さが生じたことになり、
形態素情報記憶部105aには追加されない。
次にステップ302の構文解析により°、第5図に示す
構文解析結果が得られる。これはwriteという動詞
において、■が5ubj−paperがobjという格
を持つ事を表している。この場合解析において曖昧さが
生じなかったものとすると、この2つの格に関する情報
を第6図の形にして構文情報記憶部1osbに付加する
。
構文解析結果が得られる。これはwriteという動詞
において、■が5ubj−paperがobjという格
を持つ事を表している。この場合解析において曖昧さが
生じなかったものとすると、この2つの格に関する情報
を第6図の形にして構文情報記憶部1osbに付加する
。
次にステップ303の意味解析を行い、第7図に示す解
析結果が得られる。この場合ステップ303の構文解析
の出力に曖昧さが生じなかったものとすると、構文情報
と同様の格情報を意味情報記憶部105cに第8図の形
で付加する。
析結果が得られる。この場合ステップ303の構文解析
の出力に曖昧さが生じなかったものとすると、構文情報
と同様の格情報を意味情報記憶部105cに第8図の形
で付加する。
次にステップ304の構造変換により、第9図に示す日
本語の構造を得る。この場合構造変換に曖昧さは生じな
かったものとすると、英語の格構造と日本語の格構造の
対応が第10図の形に表わされ、これは構造変換情報記
憶部105dに付加される。
本語の構造を得る。この場合構造変換に曖昧さは生じな
かったものとすると、英語の格構造と日本語の格構造の
対応が第10図の形に表わされ、これは構造変換情報記
憶部105dに付加される。
次にステップ305の構文生成により第11図に示す単
語列が得られる。この場合、「論文」の後にくる助詞が
「を」として曖昧性が生じる事なく生成されたとすると
、日本語の格構造と生成された助詞の関係が第12図の
形に表され、これは構文生成情報記憶部106bに付加
される。
語列が得られる。この場合、「論文」の後にくる助詞が
「を」として曖昧性が生じる事なく生成されたとすると
、日本語の格構造と生成された助詞の関係が第12図の
形に表され、これは構文生成情報記憶部106bに付加
される。
最後にステップ306の形態素生成により、語幹が「書
」である動詞が過去を作る助動詞「た」を伴って「書い
た」と生成され、各々の形態素を接続して第13図に示
す訳文を得る。ここで「書いた」の生成に曖昧さが生じ
なかったとすると、第14図の形で形態素生成に関する
情報が表され、これは形態素生成情報記憶部106fに
付加される。
」である動詞が過去を作る助動詞「た」を伴って「書い
た」と生成され、各々の形態素を接続して第13図に示
す訳文を得る。ここで「書いた」の生成に曖昧さが生じ
なかったとすると、第14図の形で形態素生成に関する
情報が表され、これは形態素生成情報記憶部106fに
付加される。
以上述べた流れに従い、第1翻訳処理21で文が処理さ
れ、ここでは訳文を蓄積することなく文書情報記憶部1
05に解析または生成に関する曖昧性のない情報を次々
と付加していく。
れ、ここでは訳文を蓄積することなく文書情報記憶部1
05に解析または生成に関する曖昧性のない情報を次々
と付加していく。
次に第2翻訳処理25の流れを第15図のフローチャー
トに基づき説明する。形態素解析部1501では活用変
化辞書104aを検索する事により、入力原文中の英単
語の品詞・原形・活用情報を求める。構文解析部150
2では、解析文法104b及び形態素解析部1501で
得られた品詞情報を用いて入力原文の構文を解析し、ま
だ意味的に解釈の曖昧性を内在させた英語の構造を生成
する。意味解析部1503は、意味解析文法104cを
使って解釈の曖昧性を無くした英語の構造を生成する。
トに基づき説明する。形態素解析部1501では活用変
化辞書104aを検索する事により、入力原文中の英単
語の品詞・原形・活用情報を求める。構文解析部150
2では、解析文法104b及び形態素解析部1501で
得られた品詞情報を用いて入力原文の構文を解析し、ま
だ意味的に解釈の曖昧性を内在させた英語の構造を生成
する。意味解析部1503は、意味解析文法104cを
使って解釈の曖昧性を無くした英語の構造を生成する。
構造変換部1504は、変換文法104dを使って英語
の構造を日本語の構造に変換する。構文生成部805は
、生成文法104eに従って日本語の構造から日本語の
語順を決定し単語列に変換する。形態素生成部806は
、形態素生成文法104fにより単語の語尾などを変化
させて翻訳文を完成させる。ここで1501〜1506
の各ステップにおいて、解析または生成の段階で曖昧性
、すなわち複数の候補が生じた場合、文章情報記憶部1
05を参照し、その結果、候補を1つに絞ることが可能
となる情報が検索された場合にはそれを用いて複数の候
補のうちから1つの候補を選択する。
の構造を日本語の構造に変換する。構文生成部805は
、生成文法104eに従って日本語の構造から日本語の
語順を決定し単語列に変換する。形態素生成部806は
、形態素生成文法104fにより単語の語尾などを変化
させて翻訳文を完成させる。ここで1501〜1506
の各ステップにおいて、解析または生成の段階で曖昧性
、すなわち複数の候補が生じた場合、文章情報記憶部1
05を参照し、その結果、候補を1つに絞ることが可能
となる情報が検索された場合にはそれを用いて複数の候
補のうちから1つの候補を選択する。
そのような情報が検索されなかった場合は、第1翻訳処
理21と同様な手法で候補を選択する。以下例文″’Y
ou have this paper、”を第2翻訳
処理25により翻訳処理する場合に基いて、文書情報記
憶部105中の情報の利用について詳細に説明する。
理21と同様な手法で候補を選択する。以下例文″’Y
ou have this paper、”を第2翻訳
処理25により翻訳処理する場合に基いて、文書情報記
憶部105中の情報の利用について詳細に説明する。
ここで文書情報記憶部105の内容は、形態素生成情報
記憶部105dには第10図、構文生成記憶部105e
には第12図、形態素生成情報記憶部106fには第1
4図であるとする。
記憶部105dには第10図、構文生成記憶部105e
には第12図、形態素生成情報記憶部106fには第1
4図であるとする。
まずステップ1501の形態素解析により、各単語にお
ける形態素解析結果が第16図に得られる。ここで単語
rthisJおよび単語rpaperJの形態素解析に
おいて複数の候補が生じるが、第4図(b)の形態素情
報記憶部105aには単語r thisノrpaper
Jに関する情報が存在しないので曖昧性は解消されず、
形態素解析中に設けられた基準を用いて候補を選択する
。この場合単語r this Jの品詞としてdat、
単語rpaperJの品詞としてnounが選択された
とする。
ける形態素解析結果が第16図に得られる。ここで単語
rthisJおよび単語rpaperJの形態素解析に
おいて複数の候補が生じるが、第4図(b)の形態素情
報記憶部105aには単語r thisノrpaper
Jに関する情報が存在しないので曖昧性は解消されず、
形態素解析中に設けられた基準を用いて候補を選択する
。この場合単語r this Jの品詞としてdat、
単語rpaperJの品詞としてnounが選択された
とする。
次にステップ1502の構文解析により、第17図に示
す構文解析結果が得られ、この場合解析において曖昧さ
が生じなかったとする。従ってこの場合においては構文
情報記憶部105bの参照は行わない。
す構文解析結果が得られ、この場合解析において曖昧さ
が生じなかったとする。従ってこの場合においては構文
情報記憶部105bの参照は行わない。
次にステップ1503の意味解析により、第18図に示
す意味解析結果が得られ、この場合解析において曖昧さ
が生じなかったとする。従ってこの場合においては意味
情報記憶部106bの参照は行わない。
す意味解析結果が得られ、この場合解析において曖昧さ
が生じなかったとする。従ってこの場合においては意味
情報記憶部106bの参照は行わない。
次にステップ1504の構造変換を行う。ここで英単語
rpaparJの訳語としてr紙ノ 「論文」が変換文
法104d中に登録されているとすると、構造変換の出
力として第19図(a) (b)の2通りの候補が生じ
る。第8図の構造変換記憶部105dを参照することに
より、英単語rpaperJの訳語として「論文」が検
索される。これを用いる事により、構造変換の出力とし
て第19図(b)が選択される。
rpaparJの訳語としてr紙ノ 「論文」が変換文
法104d中に登録されているとすると、構造変換の出
力として第19図(a) (b)の2通りの候補が生じ
る。第8図の構造変換記憶部105dを参照することに
より、英単語rpaperJの訳語として「論文」が検
索される。これを用いる事により、構造変換の出力とし
て第19図(b)が選択される。
次にステップ1505の構文生成により、第20図に示
す単語列が得られる。この場合生成の出方に曖昧性が生
じなかったとする。したがって構文生成情報記憶部10
5eを参照する事はない。
す単語列が得られる。この場合生成の出方に曖昧性が生
じなかったとする。したがって構文生成情報記憶部10
5eを参照する事はない。
最後にステップ1506の形態素生成により、第21図
に示す訳文が得られる。この場合生成の出力に曖昧性が
生じなかったとする。したがって、形態素生成情報記憶
部106fを参照する事はない。生成された訳文は、訳
文記憶部106に蓄積される。
に示す訳文が得られる。この場合生成の出力に曖昧性が
生じなかったとする。したがって、形態素生成情報記憶
部106fを参照する事はない。生成された訳文は、訳
文記憶部106に蓄積される。
このように構成された実施例では、翻訳対象となる原文
に一旦翻訳処理を施して解析および生成に関する確かな
情報を抽出し、もう−回翻訳処理を施す際に抽出された
情報を優先した候補の選択を行うことにより、より整合
性のとれた自然な訳文を作成する事が可能になるという
利点がある。
に一旦翻訳処理を施して解析および生成に関する確かな
情報を抽出し、もう−回翻訳処理を施す際に抽出された
情報を優先した候補の選択を行うことにより、より整合
性のとれた自然な訳文を作成する事が可能になるという
利点がある。
なお、第1翻訳処理21は、本実施例では翻訳対象とな
る文書の全体に対して行われているが、必ずしも翻訳対
象となる文書全体に対して行う必要はなく、翻訳対象と
なる文書の一部であってもよい。また、第1翻訳処理2
1は、本実施例では第3図に示すフローチャートに見ら
れるように形態素解析から訳文の生成まで翻訳処理のす
べてを行っているが、必ずしもその必要はなく、翻訳処
理の一部を行うものであってもよい。また、第1翻訳処
理21において、文書情報記憶部105に情報を蓄積す
るための条件として、本実施例では解析あるいは生成の
段階において曖昧さが生じない事となっているが、必ず
しもその必要はなく、曖昧さを生じている情報について
も文書情報記憶部105に蓄積してもよい。また、第1
翻訳処理21および第2翻訳処理25において、本実施
例では文書情報記憶部105中の翻訳処理の各段階に対
応した記憶部に情報を格納し、また格納された情報を参
照する事になっているが、必ずしもその必要はなく、各
階段において、文書情報記憶部105中のどの記憶部に
情報を格納し、またどこの記憶部に格納された情報を参
照してもよい。このように本発明においては、その趣旨
を逸脱しない範囲で種々の変形を行う事が可能である。
る文書の全体に対して行われているが、必ずしも翻訳対
象となる文書全体に対して行う必要はなく、翻訳対象と
なる文書の一部であってもよい。また、第1翻訳処理2
1は、本実施例では第3図に示すフローチャートに見ら
れるように形態素解析から訳文の生成まで翻訳処理のす
べてを行っているが、必ずしもその必要はなく、翻訳処
理の一部を行うものであってもよい。また、第1翻訳処
理21において、文書情報記憶部105に情報を蓄積す
るための条件として、本実施例では解析あるいは生成の
段階において曖昧さが生じない事となっているが、必ず
しもその必要はなく、曖昧さを生じている情報について
も文書情報記憶部105に蓄積してもよい。また、第1
翻訳処理21および第2翻訳処理25において、本実施
例では文書情報記憶部105中の翻訳処理の各段階に対
応した記憶部に情報を格納し、また格納された情報を参
照する事になっているが、必ずしもその必要はなく、各
階段において、文書情報記憶部105中のどの記憶部に
情報を格納し、またどこの記憶部に格納された情報を参
照してもよい。このように本発明においては、その趣旨
を逸脱しない範囲で種々の変形を行う事が可能である。
以上説明したように1本発明によれば、翻訳の対象とし
ている部分の処理を、その部分以外の部分から抽出した
情報を利用する事により、より文書として整合性のとれ
た自然な訳文を生成する事ができるという利点がある。
ている部分の処理を、その部分以外の部分から抽出した
情報を利用する事により、より文書として整合性のとれ
た自然な訳文を生成する事ができるという利点がある。
第1図は本発明の一実施例を示す全体構成図、第2図は
本発明の一実施例で用いる翻訳部での翻訳処理の流れを
示すフローチャート、第3図は本発明の一実施例で用い
る翻訳部での第1翻訳処理の流れを示すフローチャート
、第4図(a)は本発明の一実施例で用いる第1翻訳処
理での形態素解析結果の一例の図、第4図(b)は本発
明の一実施例で用いる文書情報記憶部中の形態素情報記
憶部に格納される情報の一例の図、第5図は本発明の一
実施例で用いる第1翻訳処理での構文解析結果の一例の
図、第6図は本発明の一実施例で用いる文書情報記憶部
中の構文情報記憶部に格納される情報の一例の図、第7
図は本発明の一実施例で用いる第1翻訳処理での意味解
析結果の一例の図、第8図は本発明の一実施例で用いる
文書情報記憶部中の意味情報記憶部に格納される情報の
一例の図、第9図は本発明の一実施例で用いる第1翻訳
処理での構造変換結果の一例の図、第10図は本発明の
一実施例で用いる文書情報記憶部中の構造変換情報記憶
部に格納される情報の一例の図、第11図は本発明の一
実施例で用いる第1翻訳処理での構文生成結果の一例の
図、第12図は本発明の一実施例で用いる文書情報記憶
部中の構文生成情報記憶部に格納される情報の一例の図
、第13図は本発明の一実施例で用いる第1翻訳処理で
の形態素生成結果の一例の図、第14図は本発明の一実
施例で用いる文書情報記憶部中の形態素生成情報記憶部
に格納される情報の一例の図、第15図は本発明の一実
施例で用いる翻訳部での第2翻訳処理の流れを示すフロ
ーチャート、第16図は本発明の一実施例で用いる第2
翻訳処理での形態素解析結果の一例の図、第17図は本
発明の一実施例で用いる第2翻訳処理での構文解析結果
の一例の図、第18図は本発明の一実施例で用いる第2
翻訳処理での意味解析結果の一例の図、第19図(a)
(b)は本発明の一実施例で用いる第2翻訳処理での構
造変換結果の一例の図、第20図は本発明の一実施例で
用いる第2翻訳処理での構文生成結果の一例の図、第2
1図は本発明の一実施例で用いる第2翻訳処理での形態
素生成結果の一例の図である。 101・・・入力部、102・・・原文記憶部、103
・・・翻訳部、 104・・・翻訳辞書部、1
05・・・文書情報記憶部、106・・・訳文記憶部、
107・・・出力部。 代理人 弁理士 則 近 憲 佑 同 松山光之 第3図 (a) 第4図 第5図 第6゜ 第9図 第10図 第11図 第12図 第13図 第14図 第15図 第16図 have ha
ve第17図 第18図 (a) (b) 第19図 A/;/倣△/;粗い J ■’t、−i5.c喝、
t2、る。 第20図 第21図
本発明の一実施例で用いる翻訳部での翻訳処理の流れを
示すフローチャート、第3図は本発明の一実施例で用い
る翻訳部での第1翻訳処理の流れを示すフローチャート
、第4図(a)は本発明の一実施例で用いる第1翻訳処
理での形態素解析結果の一例の図、第4図(b)は本発
明の一実施例で用いる文書情報記憶部中の形態素情報記
憶部に格納される情報の一例の図、第5図は本発明の一
実施例で用いる第1翻訳処理での構文解析結果の一例の
図、第6図は本発明の一実施例で用いる文書情報記憶部
中の構文情報記憶部に格納される情報の一例の図、第7
図は本発明の一実施例で用いる第1翻訳処理での意味解
析結果の一例の図、第8図は本発明の一実施例で用いる
文書情報記憶部中の意味情報記憶部に格納される情報の
一例の図、第9図は本発明の一実施例で用いる第1翻訳
処理での構造変換結果の一例の図、第10図は本発明の
一実施例で用いる文書情報記憶部中の構造変換情報記憶
部に格納される情報の一例の図、第11図は本発明の一
実施例で用いる第1翻訳処理での構文生成結果の一例の
図、第12図は本発明の一実施例で用いる文書情報記憶
部中の構文生成情報記憶部に格納される情報の一例の図
、第13図は本発明の一実施例で用いる第1翻訳処理で
の形態素生成結果の一例の図、第14図は本発明の一実
施例で用いる文書情報記憶部中の形態素生成情報記憶部
に格納される情報の一例の図、第15図は本発明の一実
施例で用いる翻訳部での第2翻訳処理の流れを示すフロ
ーチャート、第16図は本発明の一実施例で用いる第2
翻訳処理での形態素解析結果の一例の図、第17図は本
発明の一実施例で用いる第2翻訳処理での構文解析結果
の一例の図、第18図は本発明の一実施例で用いる第2
翻訳処理での意味解析結果の一例の図、第19図(a)
(b)は本発明の一実施例で用いる第2翻訳処理での構
造変換結果の一例の図、第20図は本発明の一実施例で
用いる第2翻訳処理での構文生成結果の一例の図、第2
1図は本発明の一実施例で用いる第2翻訳処理での形態
素生成結果の一例の図である。 101・・・入力部、102・・・原文記憶部、103
・・・翻訳部、 104・・・翻訳辞書部、1
05・・・文書情報記憶部、106・・・訳文記憶部、
107・・・出力部。 代理人 弁理士 則 近 憲 佑 同 松山光之 第3図 (a) 第4図 第5図 第6゜ 第9図 第10図 第11図 第12図 第13図 第14図 第15図 第16図 have ha
ve第17図 第18図 (a) (b) 第19図 A/;/倣△/;粗い J ■’t、−i5.c喝、
t2、る。 第20図 第21図
Claims (2)
- (1)翻訳対象となる第1言語の文章を入力するための
入力手段と、 翻訳処理に使用する知識情報を収容した翻訳辞書と、 この翻訳辞書の内容を用いて前記第1言語の文章を第2
言語の文章に翻訳処理する翻訳手段と、この翻訳手段よ
り翻訳された第2言語の文章を出力する出力手段とを備
えた機械翻訳システムにおいて、 前記翻訳手段は翻訳の対象としている部分の処理に際し
、第1言語の文章の該部分以外から抽出した情報を用い
ることを特徴とする機械翻訳システム。 - (2)該部分以外から抽出した情報は、第1言語の文章
の該部分以後の文章の形態素解析、構文解析等の情報で
ある請求項1記載の機械翻訳システム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1128722A JPH02308370A (ja) | 1989-05-24 | 1989-05-24 | 機械翻訳システム |
DE69032750T DE69032750T2 (de) | 1989-05-24 | 1990-05-23 | Maschinelles Übersetzungssystem und -verfahren |
EP90109904A EP0399533B1 (en) | 1989-05-24 | 1990-05-23 | Machine translation system and method of machine translation |
US07/527,894 US5088038A (en) | 1989-05-24 | 1990-05-24 | Machine translation system and method of machine translation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1128722A JPH02308370A (ja) | 1989-05-24 | 1989-05-24 | 機械翻訳システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH02308370A true JPH02308370A (ja) | 1990-12-21 |
Family
ID=14991819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1128722A Pending JPH02308370A (ja) | 1989-05-24 | 1989-05-24 | 機械翻訳システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US5088038A (ja) |
EP (1) | EP0399533B1 (ja) |
JP (1) | JPH02308370A (ja) |
DE (1) | DE69032750T2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5844798A (en) * | 1993-04-28 | 1998-12-01 | International Business Machines Corporation | Method and apparatus for machine translation |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03129469A (ja) * | 1989-10-14 | 1991-06-03 | Canon Inc | 自然言語処理装置 |
JP2818052B2 (ja) * | 1991-05-21 | 1998-10-30 | シャープ株式会社 | 光学的文字読み取り装置 |
US5477451A (en) * | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
US5541836A (en) * | 1991-12-30 | 1996-07-30 | At&T Corp. | Word disambiguation apparatus and methods |
GB9209346D0 (en) * | 1992-04-30 | 1992-06-17 | Sharp Kk | Machine translation system |
JPH0668144A (ja) * | 1992-08-14 | 1994-03-11 | Fujitsu Ltd | 電子ニュース翻訳配送装置 |
US5678051A (en) * | 1992-12-24 | 1997-10-14 | Matsushita Electric Industrial C., Ltd. | Translating apparatus with special display mode for supplemented words |
WO1995017729A1 (en) * | 1993-12-22 | 1995-06-29 | Taligent, Inc. | Input methods framework |
US6516296B1 (en) * | 1995-11-27 | 2003-02-04 | Fujitsu Limited | Translating apparatus, dictionary search apparatus, and translating method |
US6363337B1 (en) * | 1999-01-19 | 2002-03-26 | Universal Ad Ltd. | Translation of data according to a template |
US6356865B1 (en) * | 1999-01-29 | 2002-03-12 | Sony Corporation | Method and apparatus for performing spoken language translation |
US6529865B1 (en) | 1999-10-18 | 2003-03-04 | Sony Corporation | System and method to compile instructions to manipulate linguistic structures into separate functions |
US6535886B1 (en) | 1999-10-18 | 2003-03-18 | Sony Corporation | Method to compress linguistic structures |
US6928448B1 (en) | 1999-10-18 | 2005-08-09 | Sony Corporation | System and method to match linguistic structures using thesaurus information |
US6721697B1 (en) * | 1999-10-18 | 2004-04-13 | Sony Corporation | Method and system for reducing lexical ambiguity |
US6330530B1 (en) | 1999-10-18 | 2001-12-11 | Sony Corporation | Method and system for transforming a source language linguistic structure into a target language linguistic structure based on example linguistic feature structures |
US6778949B2 (en) | 1999-10-18 | 2004-08-17 | Sony Corporation | Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures |
AU2002316581A1 (en) | 2001-07-03 | 2003-01-21 | University Of Southern California | A syntax-based statistical translation model |
US7146358B1 (en) * | 2001-08-28 | 2006-12-05 | Google Inc. | Systems and methods for using anchor text as parallel corpora for cross-language information retrieval |
US20030074188A1 (en) * | 2001-10-12 | 2003-04-17 | Tohgo Murata | Method and apparatus for language instruction |
WO2004001623A2 (en) * | 2002-03-26 | 2003-12-31 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
US20040087425A1 (en) * | 2002-10-31 | 2004-05-06 | Ng Tony C. | Process for applying portions of material to a moving web |
US7711545B2 (en) * | 2003-07-02 | 2010-05-04 | Language Weaver, Inc. | Empirical methods for splitting compound words with application to machine translation |
US8548794B2 (en) * | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
US7853473B2 (en) | 2004-08-31 | 2010-12-14 | Revionics, Inc. | Market-based price optimization system |
DE112005002534T5 (de) * | 2004-10-12 | 2007-11-08 | University Of Southern California, Los Angeles | Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet |
US7987087B2 (en) * | 2005-06-15 | 2011-07-26 | Xerox Corporation | Method and system for improved software localization |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US10319252B2 (en) * | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US8433556B2 (en) | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8831928B2 (en) * | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US8548791B2 (en) * | 2007-08-29 | 2013-10-01 | Microsoft Corporation | Validation of the consistency of automatic terminology translation |
KR100911621B1 (ko) * | 2007-12-18 | 2009-08-12 | 한국전자통신연구원 | 한영 자동번역 방법 및 장치 |
US8706477B1 (en) | 2008-04-25 | 2014-04-22 | Softwin Srl Romania | Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code |
KR101023209B1 (ko) * | 2008-10-13 | 2011-03-18 | 한국전자통신연구원 | 문서 번역 장치 및 그 방법 |
US20110320191A1 (en) * | 2009-03-13 | 2011-12-29 | Jean-Pierre Makeyev | Text creation system and method |
US8762131B1 (en) | 2009-06-17 | 2014-06-24 | Softwin Srl Romania | Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates |
US8762130B1 (en) * | 2009-06-17 | 2014-06-24 | Softwin Srl Romania | Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
US10417646B2 (en) * | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
US10592614B1 (en) | 2017-01-19 | 2020-03-17 | Amdocs Development Limited | System, method, and computer program for translating unified ticketing system (UTS) messages |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6140672A (ja) * | 1984-07-31 | 1986-02-26 | Hitachi Ltd | 多品詞解消処理方式 |
JPH0664585B2 (ja) * | 1984-12-25 | 1994-08-22 | 株式会社東芝 | 翻訳編集装置 |
US4800522A (en) * | 1985-05-14 | 1989-01-24 | Sharp Kabushiki Kaisha | Bilingual translation system capable of memorizing learned words |
DE3616751A1 (de) * | 1985-05-20 | 1986-11-20 | Sharp K.K., Osaka | Uebersetzungssystem |
JPS62163173A (ja) * | 1986-01-14 | 1987-07-18 | Toshiba Corp | 機械翻訳方法 |
JPS62203273A (ja) * | 1986-03-04 | 1987-09-07 | Toshiba Corp | 機械翻訳システム |
JP2732563B2 (ja) * | 1986-05-20 | 1998-03-30 | 株式会社東芝 | 機械翻訳方法及び装置 |
US4916614A (en) * | 1986-11-25 | 1990-04-10 | Hitachi, Ltd. | Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words |
-
1989
- 1989-05-24 JP JP1128722A patent/JPH02308370A/ja active Pending
-
1990
- 1990-05-23 EP EP90109904A patent/EP0399533B1/en not_active Expired - Lifetime
- 1990-05-23 DE DE69032750T patent/DE69032750T2/de not_active Expired - Fee Related
- 1990-05-24 US US07/527,894 patent/US5088038A/en not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5844798A (en) * | 1993-04-28 | 1998-12-01 | International Business Machines Corporation | Method and apparatus for machine translation |
Also Published As
Publication number | Publication date |
---|---|
EP0399533A2 (en) | 1990-11-28 |
DE69032750D1 (de) | 1998-12-17 |
EP0399533B1 (en) | 1998-11-11 |
US5088038A (en) | 1992-02-11 |
DE69032750T2 (de) | 1999-05-20 |
EP0399533A3 (en) | 1993-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH02308370A (ja) | 機械翻訳システム | |
US4962452A (en) | Language translator which automatically recognizes, analyzes, translates and reinserts comments in a sentence | |
JP3196868B2 (ja) | テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ | |
US6760695B1 (en) | Automated natural language processing | |
US5321607A (en) | Automatic translating machine | |
KR900009120B1 (ko) | 기계번역장치 | |
JPS62203273A (ja) | 機械翻訳システム | |
JP2000200291A (ja) | 選択された文字列をテキスト内で自動検出する方法 | |
JPH02140868A (ja) | 機械翻訳システム | |
JPH05314166A (ja) | 電子化辞書および辞書検索装置 | |
WO1997040453A1 (en) | Automated natural language processing | |
JP3876014B2 (ja) | 機械翻訳装置 | |
JP2626722B2 (ja) | 日本語生成装置 | |
JP3236027B2 (ja) | 機械翻訳装置 | |
JP4088681B2 (ja) | 複数言語入力での言語処理装置 | |
JPH0561902A (ja) | 機械翻訳システム | |
JPS62203266A (ja) | 機械翻訳システム | |
JP2608384B2 (ja) | 機械翻訳装置及びその方法 | |
JPH09160920A (ja) | 機械翻訳装置 | |
JPH0320866A (ja) | テキストベース検索方式 | |
JPH0778166A (ja) | 翻訳方法及び機械翻訳装置 | |
JPH0973454A (ja) | 文書作成装置及び文書作成方法 | |
JPH0550778B2 (ja) | ||
Jawaid | Machine Translation with Significant Word Reordering and Rich Target-Side Morphology | |
JPH02294779A (ja) | 機械翻訳システム |