JP2007518164A - 自動翻訳装置及びその自動翻訳装置を利用した自動翻訳方法並びにその自動翻訳装置が記録された記録媒体 - Google Patents
自動翻訳装置及びその自動翻訳装置を利用した自動翻訳方法並びにその自動翻訳装置が記録された記録媒体 Download PDFInfo
- Publication number
- JP2007518164A JP2007518164A JP2006546858A JP2006546858A JP2007518164A JP 2007518164 A JP2007518164 A JP 2007518164A JP 2006546858 A JP2006546858 A JP 2006546858A JP 2006546858 A JP2006546858 A JP 2006546858A JP 2007518164 A JP2007518164 A JP 2007518164A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- chinese
- translation
- special
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本発明は、自動翻訳装置及びその自動翻訳装置を利用した自動翻訳方法並びにその自動翻訳装置が記録された記録媒体に関し、より詳しくは、英語を中国語にあるいは中国語を英語に翻訳する場合、目的原語の対訳語文章をより自然かつ正確な翻訳に生成することができる。これは、中国語特有の様々な文法的特性を考慮して作製したアルゴリズムを本発明の自動翻訳装置及び記録媒体に採用することによって実現できた。前記特殊翻訳アルゴリズムは、本発明の基本概念であると同時に主要概念である。
本発明による自動翻訳装置は、辞典DB100、形態素分析手段200、基礎文章成分規定手段300、加工文章要素規定手段400、特殊文章要素翻訳手段500、一般文章要素翻訳手段600、完成翻訳文出力手段700で構成される。特殊文章成分翻訳手段500と連結されている特殊文章要素連結ポインターは、5種類の特殊翻訳モジュール501〜505と連係して作動する。前記100〜700、及び特殊翻訳モジュール501〜505のプロセスを通じて英語と中国語間の翻訳をより自然かつ正確に生成することができる。
本発明は、特許出願者が2003年3月開発した試製品(本発明の核心である特殊翻訳アルゴリズムを適用)により、理論の実際適用が妥当であることが検証された。本発明の実施例(図5、6、7、8、9)は、試製品を実際に作動させて得られた翻訳文の例である。
本発明による自動翻訳装置は、辞典DB100、形態素分析手段200、基礎文章成分規定手段300、加工文章要素規定手段400、特殊文章要素翻訳手段500、一般文章要素翻訳手段600、完成翻訳文出力手段700で構成される。特殊文章成分翻訳手段500と連結されている特殊文章要素連結ポインターは、5種類の特殊翻訳モジュール501〜505と連係して作動する。前記100〜700、及び特殊翻訳モジュール501〜505のプロセスを通じて英語と中国語間の翻訳をより自然かつ正確に生成することができる。
本発明は、特許出願者が2003年3月開発した試製品(本発明の核心である特殊翻訳アルゴリズムを適用)により、理論の実際適用が妥当であることが検証された。本発明の実施例(図5、6、7、8、9)は、試製品を実際に作動させて得られた翻訳文の例である。
Description
本発明は、自動翻訳装置及びその自動翻訳装置を利用した自動翻訳方法並びにその自動翻訳装置が記録された記録媒体に関し、より詳しくは、英語を中国語にあるいは中国語を英語に翻訳する場合、既存の種々の英語と中国語間の自動翻訳装置に比してより精度の高くかつ自然な翻訳文を生成することができる装置に関する。
本発明は、英語を中国語にあるいは中国語を英語に翻訳する際に、中国語文法特有の様々な文法的特性を“特別なアルゴリズム(algorithms)”で処理した技術を利用することによって良質の翻訳を実現することができる。さらに、本発明は、本発明の出願者が2003年3月試製品(Demo Program;中国語特有の文法的特性を特別なアルゴリズム(algorithms)で処理した技術を採用)を開発し、理論上の問題を実証的に検証、証明した。
一般に、コンピュータの記憶装置に一冊の辞書や数冊の文法書などからなる数字、文字、記号などを適切に符号化して記憶させた後、翻訳要請に応じてある国の言語を別の国の言語に翻訳する自動翻訳装置には様々なものが開発されている。
一例として、“プロテクターと構文ノードを有するドアフレームを利用した自動翻訳機(Machine Translator utilizing Doorframe of which including Protector and Syntax Nod:韓国特許登録10−0329109号)以下、MTDと称する。”による翻訳過程は次のとおりである。
MTDのユーザが対訳語に翻訳しようとする原始言語を入力すると、自動翻訳装置は、その入力された原始言語の文章を形態素単位に分析し、その分析された形態素単位の各々の単語の品詞を決定する。
次に、品詞が決定された単語のうち、一つの単語や句として扱われる熟語、複合名詞などのような固定表現化して使われる単語は、一つの品詞として再決定し、その後、原始言語文章の品詞のうち、重要な役割をする品詞(動詞、接続詞、関係詞、記号)が分析されないようにプロテクターで保護し、その保護されたプロテクター間の部分構文が名詞句であるか、あるいは前置詞句であるかを分析し、適切な構文タグを付与する。
このように、プロテクターと部分構文からなる原ドアフレームを原ドアフレームのデータベースとマッチングさせて、保護表示されたプロテクター(動詞、接続詞、関係詞、記号)と対応する対訳ドアフレームを選択する。ここで、対訳ドアフレームには前記原文のプロテクターで表示される各品詞が既に翻訳されており、その後、残りの構文タグが与えられた名詞句または前置詞句などを翻訳して、一つの完全な対訳文をMTDが完成される。
上述したMTDは、英語と韓国語間の翻訳に適合しており、さらに中国語の場合にも、英語と文章要素の配置順序が一部類似するので英語と中国語間の翻訳にも一部適用可能である。しかしながら、次のような中国語特有の文法的特質のために、MTDによる翻訳は不十分であるという問題点がある。
第1に、中国語を構成する品詞のうち動詞が、▲離▼合▲詞▼(中国語文法特有の動詞構文の一つであって、一つの単語が2音節以上を有する動詞の前音節と後音節が離れ、その間に原語文章が過去時制である場合には、過去表示の“了”という文字を挿入し、原語文章に回数の副詞が存在する場合には、それに対応する対訳語を過去表示文字の後に順に位置させる)構文動詞として使われる場合、中国語動詞は変換しないので、英語文章が過去時制であることを表す“了”という文字や英語文章の回数の副詞が動詞を構成する音節の間に挿入されなければならない。しかし、過去時制を表す英語文章を中国語文章に翻訳する場合、“了”という文字や回数の副詞の対訳語を挿入せずに翻訳されるという問題点がある。結果的に、MTDは中国語の▲離▼合▲詞▼構文構造を翻訳することができない。
第2に、中国語を構成する文章要素として補語があり、その補語が程度補語である場合、中国語文章では独特の構文処理が必要である。文章で程度補語が使われたときに、動詞と補語の間に“得”という文字を挿入して、程度を表していることを表示しなければならない。しかしながら、このような中国語の程度補語が使われた英語文章を中国語文章に翻訳する場合、前記のような中国語特有の文法的な機能を反映しないまま翻訳されるので、その意味が不明確になるという問題点がある。結果的に、MTDは中国語特有の程度補語構文構造を翻訳することができない。
第3に、中国語を構成する文章要素として補語があり、その補語が結果補語である場合、中国語文章では独特の構文処理が必要である。文章で結果補語が使われたときに、中国語動詞のすぐ後に補語が位置するように語順を調整して表示しなければならない。しかしながら、このような中国語の結果補語が使われた英語文章を中国語文章に翻訳する場合、前記したような中国語特有の文法的な機能が反映されずに翻訳されるので、その意味が不明確になるという問題点がある。結果的に、MTDは中国語特有の結果補語構文構造を翻訳することができない。
第4に、中国語を構成する文章が被動文である場合、その被動文に使用された中国語対訳文章の動詞が、ヒトや物の動作を支配するか、あるいは影響を与えるかどうかよって、“被”という文字を動詞の前に付けるか否かを決定する。ここで、被動文の英語文章を中国語文章に翻訳する場合、被という文字を付けるかどうか決定する決定手段がないので、翻訳が不明確になるという問題点がある。結果的に、MTDは中国語特有の被動文構文構造を翻訳することができない。
第5に、中国語を構成する文章が形容詞構文である場合、その形容詞構文では英語文章のbe動詞が省略されて翻訳されるべきであるが、形容詞構文の英語文章を中国語文章に翻訳する場合、be動詞も一緒に翻訳されて翻訳が不明確になるという問題点がある。このような問題点は、中国語を英語に翻訳をする場合にも同様に発生する。結果的に、MTDは中国語特有の形容詞構文構造を翻訳することができない。
精度の向上された英語と中国語間の自動翻訳装置を実現するために、上述したような五つの中国語特有の構文構造に対応できる的確な処理が要求される。
本発明は、前記のような従来の問題点を解決するためになされたものであって、その目的は、中国語特有の五つの構文構造に的確に対応することができる翻訳装置を提供することである。
本発明に係る英語と中国語間の自動翻訳装置は、上述したような中国語特有の五つの構文構造に対応できないという問題点を解決するためのものであり、それを解決するために、英語と中国語間の自動翻訳装置に関連する5種類のアルゴリズム理論を発明し、さらにそのアルゴリズム理論に基づいた英語と中国語間の自動翻訳装置の試製品を開発した。これにより、アルゴリズム理論の整合性及び進歩性が検証された。
本発明の自動翻訳装置は、次のように構成する。
1.辞書DB保存手段100:4つの相互関連の辞書データベースを有しており、4つの各辞書データベースには英語単語の全情報と、対訳中国語単語の情報がそれぞれの言語体系に基づいて記録されている。
2.形態素分析手段200:入力された原語文章の単語を形態素単位に分析する。
3.基礎文章要素規定手段300:形態素分析手段200で形態素単位に分析された単語の結果を受信し、各品詞で表示される基礎文章要素として規定し、辞書DB保存手段100に基づき入力した英語単語を中国語の対訳語に1次変換する。
4.加工文章要素規定手段400(変換翻訳モジュール;modulatory translation module):基礎文章要素規定手段300で分析した結果を受信し、処理された各品詞を組み合わせて少なくとも2つ以上の品詞が合成語、熟語、あるいは定型化された慣用語句などに変換できるものがあるかどうかをチェックし、変換できるものが導出される場合、少なくとも2つ以上の該当する品詞を結合して、構文的機能を考慮した品詞に変換し、変換された転成品詞を新たに規定する(すなわち品詞が変わる、品詞の再転成が場合によって発生する)。そして、第1、第2、第3の辞書データーベースDBに基づいて、基礎文章要素規定手段300により1次処理された、入力された英語単語の対訳中国語がここで再処理される。それは、品詞の再転成がここで発生するためである。
5.特殊文章要素翻訳手段500:基礎文章要素規定手段300及び加工文章要素規定手段400の結果、すなわち基礎文章要素あるいは加工文章要素をチェックし、この特殊文章要素翻訳手段500に内蔵されている特殊文章要素連結ポインター(pointer)と連結される識別因子が各単語の文章要素に存在するかどうかを判断する。一つ以上の原言語の文章要素あるいは文章構文から識別因子が検出された場合、一つ以上の原言語の文章要素あるいは文章構文は、500に内蔵された各特殊文章要素翻訳モジュールにより、辞書データベースベースに定型化された対訳中国語の文章要素あるいは文章構文に再処理され、これによって300及び400で処理された対訳中国語も再処理されながら中国語の語順も再処理される。特殊文章要素翻訳手段500に内蔵された各特殊文章要素翻訳モジュールには5種類のモジュール(501〜505)があり、それぞれ独特の文法処理能力を有する連結ポインター(pointer)及び各文章要素に付与された識別因子によって活性化される。
6.一般文章要素翻訳手段600:特殊文章要素翻訳手段500の結果を受信し、特殊文章要素連結ポインターにより再処理された単語を、辞書DB100に記録された中国語の語順規則に従って再構成する必要があるかどうかを判断し、必要に応じて再処理し、残りの原言語の文章要素あるいは文章構文を完成された文章要素に翻訳する一般文章要素翻訳手段600である。さらに、この段階において、中国語文法の独特の規則に従って、(1)最終の中国語の対訳文章で不要な中国語単語を除去し、(2)最終の中国語の対訳文章で必ず必要な中国語単語(対訳語と関係なく)を挿入する過程が含まれる。
7.完成翻訳文出力手段700:完成された対訳中国語文章を出力する。
特殊文章要素翻訳手段500に内蔵された5種類の特殊翻訳モジュール(501〜505)には、それぞれ互いに異なる処理能力を有する特殊文章要素連結ポインターが含まれている。
第1特殊翻訳モジュール501は、原語文章中にある動詞の中国語対訳動詞に特殊文章要素連結ポインター(pointer)が存在するかどうか、さらに、▲離▼合▲詞▼識別因子を有するかどうかをチェックする。その二つが同時に存在する場合には、原語文章が過去時制であるかを調べ、過去時制であれば対訳語の文章要素として動詞を翻訳するとき、その翻訳された対訳語の動詞の音節の間に過去時制を表す“了”という文字を挿入して翻訳し、次いで、原語文章中に回数の副詞が存在するかどうかを調べ、それに対応する対訳語を過去表示の“了”の後に位置させて(原語文章が過去時制でない場合には回数の副詞のみ位置する)翻訳する。
第2特殊翻訳モジュール502は、原言語の文章要素中に中国語対訳動詞の程度を表す中国語の補語性格の単語が含まれているかどうかを特殊文章要素連結ポインターによってチェックし、その中国語の程度補語が中国語対訳動詞を修飾するという識別因子が存在する場合には、対訳語の文章要素である動詞と中国語の補語性格の単語を翻訳するとき、翻訳された対訳語の動詞とその対訳語の程度補語の間に“得”という文字を挿入して翻訳する。
第3特殊翻訳モジュール503は、原言語の文章要素中に中国語対訳動詞の結果を表す中国語の補語性格の単語が含まれているかどうかを特殊文章要素連結ポインターによってチェックし、その対訳された中国語の結果補語が中国語対訳動詞を修飾するという識別因子が存在する場合には、対訳語の文章要素としてその単語を翻訳するとき、翻訳された対訳語の動詞の後にその中国語の対訳語の結果補語を置いて翻訳する。
第4特殊翻訳モジュール504は、原言語の文章要素中に動詞が「be動詞+過去分詞」からなる被動文(受動態)であるかどうか、及び原語文章の過去分詞と対応する中国語対訳動詞がヒトや物の動作を支配するかどうか、また、影響を与えるかどうかを特殊文章要素連結ポインター及び識別因子によってチェックする。その結果、全て該当する場合には、被動文の原語文章を対訳語に翻訳するとき、その翻訳された対訳語文章の対訳動詞の前に“被”という文字を挿入するかを決定し、語順の再構成要求の有無に従って翻訳する。
第5特殊翻訳モジュール505は、原言語の文章要素を構成する構文が「主語+be動詞+形容詞+前置詞」からなる形容詞構文であるかどうかを特殊文章要素連結ポインター及び識別因子によってチェックする。その結果、形容詞構文である場合には、対訳語の文章要素を構成する中国語の形容詞構文に翻訳するときに、be動詞に対応する対訳語の動詞を省略し、語順の再構成要求に従って翻訳する。
辞書データベースに内蔵された4つの辞書のすべての英語単語と中国語単語には、それぞれ形態素情報、基礎文章要素情報、加工文章要素情報、特殊文章要素情報が含まれており、特に、特殊文章要素情報には識別因子検索表示が第1、第2、第3の辞書DBに付与されている。識別因子は、各英語単語の特殊文章要素情報をチェックし、5種類の特殊翻訳モジュール(501〜505)中の特殊文章要素連結ポインターと連係して機能し、特殊文章要素情報を有する各英語単語を最も適切かつ正確に中国語対訳の単語と対応させて対訳結果を生成するようにする。
5種類の特殊翻訳モジュール(501〜505)は、入力された英語文章を当該単語情報の再処理及び再加工過程に誘導し、最も適切かつ正確な最終の中国語対訳文章に変換、生成されるようにする重要な役割をする。
第1辞書DBは一般単語情報を有し、第2、第3辞書DBは合成語、慣用語、熟語などの情報を、第4辞書DBは専門用語情報を有する。
次に、入力された英語文章が中国語の対訳文章に翻訳生成される過程を説明する。
1.英語文章の動詞を中国語の動詞に対訳する際に、該動詞が▲離▼合▲詞▼構文の動詞に対訳されるとき、特殊文章要素連結ポインター及び識別因子は、英語文章が過去時制であるかどうかをチェックし、同時に英語文章に回数の副詞が存在するかどうかをチェックする。
2.中国語対訳文章中に中国語補語(英語文章では主に副詞)が程度補語である場合には、特殊文章要素連結ポインター及び識別因子は、その中国語補語が対訳された中国語動詞を修飾するかどうかをチェックする。
3.中国語対訳文章中に中国語補語(英語文章では主に副詞)が結果補語である場合には、特殊文章要素連結ポインター及び識別因子は、その中国語補語が対訳された中国語動詞を修飾するかどうかをチェックする。
4.入力された英語文章が被動文(be+p.p.)である場合には、特殊文章要素連結ポインター及び識別因子は、対応する中国語対訳動詞がヒトや物の動作を支配するかどうか、また、影響を与えるかどうかを判断する。次いで、英語動詞の後に位置する英語前置詞に対応する中国語の対訳単語が中国語文法に符合するかを判断する。何故ならば、英語前置詞に対応する中国語の対訳単語は、中国語文法上の特別な対訳語条件を満たす必要があるためである。
5.入力された英語文章が形容詞構文である場合には、特殊文章要素連結ポインター及び識別因子がそれをチェックして、入力された英語文章のbe動詞に対応する中国語の対訳単語を除去し、中国語語順規則に従って語順を再配列する。
上述した英語と中国語間の自動翻訳装置及びその自動翻訳生成方法による記録媒体は、次のように構成する。
1.辞書DB保存手段100:4つの相互関連の辞書データベースを有しており、4つの各辞書データベースには英語単語の全情報と、対訳中国語単語の情報がそれぞれの言語体系に基づいて記録されている。
2.形態素分析手段200:入力された原語文章の単語を形態素単位に分析する。
3.基礎文章要素規定手段300:形態素分析手段200で形態素単位に分析された単語の結果を受信し、各品詞で表示される基礎文章要素として規定し、辞書DB保存手段100に基づき入力した英語単語を中国語の対訳語に1次変換する。
4.加工文章要素規定手段400(変換翻訳モジュール;modulatory translation module):基礎文章要素規定手段300で分析した結果を受信し、処理された各品詞を組み合わせて少なくとも2つ以上の品詞が合成語、熟語、あるいは定型化された慣用語句などに変換できるものがあるかどうかをチェックし、変換できるものが導出される場合、少なくとも2つ以上の該当する品詞を結合して、構文的機能を考慮した品詞に変換し、変換された転成品詞を新たに規定する(すなわち品詞が変わる、品詞の再転成が場合によって発生する)。そして、第1、第2、第3の辞書データーベースDBに基づいて、基礎文章要素規定手段300により1次処理された、入力された英語単語の対訳中国語がここで再処理される。それは、品詞の再転成がここで発生するためである。
5.特殊文章要素翻訳手段500:基礎文章要素規定手段300及び加工文章要素規定手段400の結果、すなわち基礎文章要素あるいは加工文章要素をチェックし、この特殊文章要素翻訳手段500に内蔵されている特殊文章要素連結ポインター(pointer)と連結される識別因子が各単語の文章要素に存在するかどうかを判断する。一つ以上の原言語の文章要素あるいは文章構文から識別因子が検出された場合、一つ以上の原言語の文章要素あるいは文章構文は、500に内蔵された各特殊文章要素翻訳モジュールにより、辞書データベースベースに定型化された対訳中国語の文章要素あるいは文章構文に再処理され、これによって300及び400で処理された対訳中国語も再処理されながら中国語の語順も再処理される。特殊文章要素翻訳手段500に内蔵された各特殊文章要素翻訳モジュールには5種類のモジュール(501〜505)があり、それぞれ独特の文法処理能力を有する連結ポインター(pointer)及び各文章要素に付与された識別因子によって活性化される。
6.一般文章要素翻訳手段600:特殊文章要素翻訳手段500の結果を受信し、特殊文章要素連結ポインターにより再処理された単語を、辞書DB100に記録された中国語の語順規則に従って再構成する必要があるかどうかを判断し、必要に応じて再処理し、残りの原言語の文章要素あるいは文章構文を完成された文章要素に翻訳する一般文章要素翻訳手段600である。さらに、この段階において、中国語文法の独特の規則に従って、(1)最終の中国語の対訳文章で不要な中国語単語を除去し、(2)最終の中国語の対訳文章で必ず必要な中国語単語(対訳語と関係なく)を挿入する過程が含まれる。
7.完成翻訳文出力手段700:完成された対訳中国語文章を出力する。
特殊文章要素翻訳手段500に内蔵された5種類の特殊翻訳モジュール(501〜505)には、それぞれ互いに異なる処理能力を有する特殊文章要素連結ポインターが含まれている。
第1特殊翻訳モジュール501は、原語文章中にある動詞の中国語対訳動詞に特殊文章要素連結ポインターが存在するかどうか、さらに、▲離▼合▲詞▼識別因子を有するかどうかをチェックする。その二つが同時に存在する場合には、原語文章が過去時制であるかを調べ、過去時制であれば対訳語の文章要素として動詞を翻訳するとき、その翻訳された対訳語の動詞の音節の間に過去時制を表す“了”という文字を挿入して翻訳し、次いで、原語文章中に回数の副詞が存在するかどうかを調べ、それに対応する対訳語を過去表示の“了”の後に位置させて(原語文章が過去時制でない場合には回数の副詞のみ位置する)翻訳する。
第2特殊翻訳モジュール502は、原言語の文章要素中に中国語対訳動詞の程度を表す中国語の補語性格の単語が含まれているかどうかを特殊文章要素連結ポインターによってチェックし、その中国語の程度補語が中国語対訳動詞を修飾するという識別因子が存在する場合には、対訳語の文章要素である動詞と中国語の補語性格の単語を翻訳するとき、翻訳された対訳語の動詞とその対訳語の程度補語の間に“得”という文字を挿入して翻訳する。
第3特殊翻訳モジュール503は、原言語の文章要素中に中国語対訳動詞の結果を表す中国語の補語性格の単語が含まれているかどうかを特殊文章要素連結ポインターによってチェックし、その対訳された中国語の結果補語が中国語対訳動詞を修飾するという識別因子が存在する場合には、対訳語の文章要素としてその単語を翻訳するとき、翻訳された対訳語の動詞の後にその中国語の対訳語の結果補語を置いて翻訳する。
第4特殊翻訳モジュール504は、原言語の文章要素中に動詞が「be動詞+過去分詞」からなる被動文(受動態)であるかどうか、及び原語文章の過去分詞と対応する中国語対訳動詞がヒトや物の動作を支配するかどうか、また、影響を与えるかどうかを特殊文章要素連結ポインター及び識別因子によってチェックする。その結果、全て該当する場合には、被動文の原語文章を対訳語に翻訳するとき、その翻訳された対訳語文章の対訳動詞の前に“被”という文字を挿入するかを決定し、語順の再構成要求の有無に従って翻訳する。
第5特殊翻訳モジュール505は、原言語の文章要素を構成する構文が「主語+be動詞+形容詞+前置詞」からなる形容詞構文であるかどうかを特殊文章要素連結ポインター及び識別因子によってチェックする。その結果、形容詞構文である場合には、対訳語の文章要素を構成する中国語の形容詞構文に翻訳するときに、be動詞に対応する対訳語の動詞を省略し、語順の再構成要求に従って翻訳する。
辞書データベースに内蔵された4つの辞書のすべての英語単語と中国語単語には、それぞれ形態素情報、基礎文章要素情報、加工文章要素情報、特殊文章要素情報が含まれており、特に、特殊文章要素情報には識別因子検索表示が第1、第2、第3の辞書DBに付与されている。識別因子は、各英語単語の特殊文章要素情報をチェックし、5種類の特殊翻訳モジュール(501〜505)中の特殊文章要素連結ポインターと連係して機能し、特殊文章要素情報を有する各英語単語を最も適切かつ正確に中国語対訳の単語と対応させて対訳結果を生成するようにする。
5種類の特殊翻訳モジュール(501〜505)は、入力された英語文章を当該単語情報の再処理及び再加工過程に誘導し、最も適切かつ正確な最終の中国語対訳文章に変換、生成されるようにする重要な役割をする。
第1辞書DBは一般単語情報を有し、第2、第3辞書DBは合成語、慣用語、熟語などの情報を、第4辞書DBは専門用語情報を有する。
次に、入力された英語文章が中国語の対訳文章に翻訳生成される過程を説明する。
1.英語文章の動詞を中国語の動詞に対訳する際に、該動詞が▲離▼合▲詞▼構文の動詞に対訳されるとき、特殊文章要素連結ポインター及び識別因子は、英語文章が過去時制であるかどうかをチェックし、同時に英語文章に回数の副詞が存在するかどうかをチェックする。
2.中国語対訳文章中に中国語補語(英語文章では主に副詞)が程度補語である場合には、特殊文章要素連結ポインター及び識別因子は、その中国語補語が対訳された中国語動詞を修飾するかどうかをチェックする。
3.中国語対訳文章中に中国語補語(英語文章では主に副詞)が結果補語である場合には、特殊文章要素連結ポインター及び識別因子は、その中国語補語が対訳された中国語動詞を修飾するかどうかをチェックする。
4.入力された英語文章が被動文(be+p.p.)である場合には、特殊文章要素連結ポインター及び識別因子は、対応する中国語対訳動詞がヒトや物の動作を支配するかどうか、また、影響を与えるかどうかを判断する。次いで、英語動詞の後に位置する英語前置詞に対応する中国語の対訳単語が中国語文法に符合するかを判断する。何故ならば、英語前置詞に対応する中国語の対訳単語は、中国語文法上の特別な対訳語条件を満たす必要があるためである。
5.入力された英語文章が形容詞構文である場合には、特殊文章要素連結ポインター及び識別因子がそれをチェックして、入力された英語文章のbe動詞に対応する中国語の対訳単語を除去し、中国語語順規則に従って語順を再配列する。
本発明の自動翻訳方法は、次のように構成する。
ステップS100:原語文章を入力する段階。
ステップS200:入力された原語文章の単語を形態素単位に分析する段階。
ステップS300:形態素単位に分析された単語を各品詞として分析し、基礎文章要素として解釈する段階。
ステップS400:S300で分析された結果を受信し、処理した各品詞を組み合わせ、少なくとも二つ以上の品詞が合成語、熟語、または定型化された慣用語句などに変換できるものがあるかどうかをチェックする。変換できるものが検出される場合には、少なくとも二つ以上の品詞を結合して構文的機能を考慮した品詞に転換し、転換された転成品詞を含む加工文章要素として規定する段階。
ステップS500:基礎文章要素あるいは加工文章要素をチェックし、ステップS500段階に内蔵されている特殊文章要素の連結ポインターと連結される識別因子が各単語の文章要素に存在するかどうかを判断する。一つ以上の原言語の文章要素あるいは文章構文から識別因子が検出される場合には、一つ以上の原言語の文章要素あるいは文章構文は、S500に内蔵された各特殊文章要素の翻訳モジュール501〜505により辞書データベースに定型化された対訳中国語の文章要素あるいは文章構文に再処理される。これによって、S300及びS400で処理された対訳中国語も再処理されながら中国語の語順が再処理される段階。
ステップS600:S500の結果を受信し、特殊文章要素連結ポインターによって再処理された単語を、辞書DBに記録された中国語の語順規則に従って再構成する必要があるかどうかを判断し、必要に応じて再処理し、残りの原言語の文章要素あるいは文章構文を完成された文章要素に翻訳する段階である。さらに、この段階において、中国語文法の独特の規則に従って、(1)最終の中国語の対訳文章で不要な中国語単語を除去し、(2)最終の中国語の対訳文章で必ず必要な中国語単語(対訳語と関係なく)を挿入する過程が含まれる。
ステップS700:完成された対訳文章を出力する段階である。
なお、ステップS500において、500に内蔵された(第1特殊翻訳モジュール501)特殊文章要素連結ポインター及び識別因子は、原言語の文章要素に対応する中国語対訳動詞が▲離▼合▲詞▼であるかどうかを判断し、▲離▼合▲詞▼である場合には、対訳語の文章要素としてその動詞を翻訳するとき、その翻訳された対訳語の動詞の音節の間に過去時制を表す“了”という文字を挿入(原語文章が過去型である場合)したり、原語文章に回数の副詞が存在する場合には、“了”という文字の後に対訳された中国語の回数の副詞の対訳語を挿入(原語文章が過去型ではない場合には“了”は挿入せず、副詞の対訳語のみ挿入する)して翻訳する段階(S501)と、
ステップS500において、対訳された中国語文章の単語のうち、中国語程度補語が存在するかどうか、及びその程度補語が対訳された中国語文章の対訳動詞を修飾するかどうかを500に内蔵された(第2特殊翻訳モジュール502)特殊文章要素連結ポインター及び識別因子が判断する。その結果、中国語対訳動詞を修飾する場合には、中国語対訳動詞と対訳された中国語程度補語の間に“得”という文字を挿入し、その後、該当する対訳語の程度補語を配置して翻訳する段階(S502)と、
ステップS500において、対訳された中国語文章の単語のうち、中国語結果補語が存在するかどうか、及びその結果補語が対訳された中国語文章の対訳動詞を修飾するかどうかを500に内蔵された(第3特殊翻訳モジュール503)特殊文章要素連結ポインター及び識別因子が判断する。その結果、中国語対訳動詞を修飾する場合には、中国語対訳動詞のすぐ後に該当する対訳語の結果補語を置いて翻訳する段階(S503)と、
ステップS500において、第4特殊翻訳モジュール504の特殊文章要素連結ポインター及び識別因子が原語文章の文章構造を「be動詞+過去分詞」からなる被動文(受動態)であるかどうかを判断し、被動文であると判断した場合には、原語文章の過去分詞と対応する中国語対訳動詞がヒトや物の動作を支配するかどうか、また、影響を与えるかどうかを判断する。その結果、全て該当する場合には、被動文の原語文章を対訳語に翻訳するとき、その翻訳された対訳語文章の対訳動詞の前に“被”という文字を挿入するかを決定し、その後、語順の再構成要求の有無に従って翻訳する段階(S504)と、
ステップS500において、第5特殊翻訳モジュール505の特殊文章要素連結ポインター及び識別因子が原語文章の文章構造を「be動詞+形容詞+前置詞」からなる形容詞構文であるかどうかを判断し、形容詞構文であると判断した場合には、対訳語の文章要素を構成する中国語の形容詞構文に翻訳するときに、be動詞に対応する中国語対訳動詞を省略し、語順の再構成要求に従って翻訳する段階(S505)を含む。
ステップS500において、対訳された中国語文章の単語のうち、中国語程度補語が存在するかどうか、及びその程度補語が対訳された中国語文章の対訳動詞を修飾するかどうかを500に内蔵された(第2特殊翻訳モジュール502)特殊文章要素連結ポインター及び識別因子が判断する。その結果、中国語対訳動詞を修飾する場合には、中国語対訳動詞と対訳された中国語程度補語の間に“得”という文字を挿入し、その後、該当する対訳語の程度補語を配置して翻訳する段階(S502)と、
ステップS500において、対訳された中国語文章の単語のうち、中国語結果補語が存在するかどうか、及びその結果補語が対訳された中国語文章の対訳動詞を修飾するかどうかを500に内蔵された(第3特殊翻訳モジュール503)特殊文章要素連結ポインター及び識別因子が判断する。その結果、中国語対訳動詞を修飾する場合には、中国語対訳動詞のすぐ後に該当する対訳語の結果補語を置いて翻訳する段階(S503)と、
ステップS500において、第4特殊翻訳モジュール504の特殊文章要素連結ポインター及び識別因子が原語文章の文章構造を「be動詞+過去分詞」からなる被動文(受動態)であるかどうかを判断し、被動文であると判断した場合には、原語文章の過去分詞と対応する中国語対訳動詞がヒトや物の動作を支配するかどうか、また、影響を与えるかどうかを判断する。その結果、全て該当する場合には、被動文の原語文章を対訳語に翻訳するとき、その翻訳された対訳語文章の対訳動詞の前に“被”という文字を挿入するかを決定し、その後、語順の再構成要求の有無に従って翻訳する段階(S504)と、
ステップS500において、第5特殊翻訳モジュール505の特殊文章要素連結ポインター及び識別因子が原語文章の文章構造を「be動詞+形容詞+前置詞」からなる形容詞構文であるかどうかを判断し、形容詞構文であると判断した場合には、対訳語の文章要素を構成する中国語の形容詞構文に翻訳するときに、be動詞に対応する中国語対訳動詞を省略し、語順の再構成要求に従って翻訳する段階(S505)を含む。
ステップS500において、特殊翻訳モジュール501〜505及び内蔵された特殊文章要素連結ポインター、並びに単語に付与された識別因子が三位一体となって動作する。
以下、本発明の英語と中国語間の自動翻訳装置の実際翻訳過程について例を挙げて説明する。
ユーザがインタフェース(例えば、キーボード)を利用して“I have not chatted with him once.”(図5参照)という原語文章を入力すると、入力された原語文章は翻訳要請画面の原語文章入力部に表示される(S100)。このように、入力した後、翻訳要請画面に備えられた翻訳要請メニューを選択すれば自動翻訳装置が翻訳を開始する。本発明の自動翻訳装置による翻訳過程について説明する。
まず、入力された原語文章“I have not chatted with him once.”は、形態素分析手段200により英語文章を構成する各単語が形態素単位に分析(S200)される。形態素単位に分析された英語文章の各単語は、基礎文章要素規定手段300により順次にデータ保存手段100の第1辞書DBに連結され、代名詞、助動詞、否定副詞、動詞(過去時制)、前置詞、名詞、副詞などの各品詞で表示される基礎文章要素として規定される(S300)。
加工文章要素規定手段400は、300による単語情報データを検索して、合成語、熟語、あるいは定型化された慣用語句などに変換できるものが存在するかどうかを判断し、変換できるものが検出される場合には、少なくとも二つ以上の該当する品詞を辞書DBに連結して構文的機能を考慮した品詞に転換し、変換された転成品詞として新たに規定する。同時に、この過程で品詞が再定義される品詞の再転成が必要に応じて発生する。入力された原文章の主語、動詞句(時制を含む)、名詞句、前置詞句、副詞句等の単語関連データが再定義される(S400)。
次に、特殊文章要素翻訳手段500に入った再定義された主語、動詞句(時制を含む)、名詞句、前置詞句、副詞句などの情報は、特殊文章要素連結ポインター及び特定単語の識別因子情報の検索、並びに特定文章要素の語順配置の検索によってそれぞれの5種類の該当する特殊翻訳モジュール(501〜505)に通報される。この過程により、入力された原英語文章が有する特殊文章要素の機能的意味が出現し、これによって原英語文章は最も適切かつ正確な中国語の対訳文章に生成、翻訳される。
入力された原英語文章“I have not chatted with him once.”は、辞書DBと200、300、400段階を経て分析された情報が特殊文章要素翻訳手段500に送信される。
200、300、400段階により原英語文章の“I”は中国語“我”に、“have”及び“not”は“有”及び“▲没▼”に、“chatted”は“▲間談▼”に、“with”は“跟”に、“him”は“他”に、そして“once”は“一次”に対訳される。
500において、特殊文章要素連結ポインターは原英語文章を検索して、動詞“chatted”に中国語▲離▼合▲詞▼動詞の識別因子が付与されており、過去時制であるとの情報を取得する。特殊文章要素連結ポインター及び識別因子は、この単語が第1特殊翻訳モジュール501で処理されるべきであると判断し、その処理を渡す。第1特殊翻訳モジュール501は、辞書DBを検索して、原英語文章中の動詞“chatted”に対応する最も正確な中国語の対訳語が“▲間談▼”ではなく、▲離▼合▲詞▼動詞の“聊天儿”であると判断する。
次いで、特殊文章要素連結ポインター及び識別因子は、“聊天儿”の音節の間に過去時制を表す中国語の対訳語“了”を挿入する。その結果、中国語の対訳語の動詞は“聊了天儿”になる。
その後、特殊文章要素連結ポインター及び識別因子は、原英語文章を検索して、回数の副詞“once”を認識、これを第1翻訳モジュール501に通知する。通知を受けた第1特殊翻訳モジュール501は、辞書DBを参照して“once”に対応する中国語“一次”を抽出し、第1特殊翻訳モジュール501、特殊文章要素連結ポインター及び識別因子は、抽出された“一次”を翻訳された▲離▼合▲詞▼動詞である“聊了天儿”に挿入して“聊了一次天儿”を生成する。
これのように、入力された原英語文章中の“chatted”と“once”に対する中国語対訳は正確かつ自然に処理することができた。
本自動翻訳装置の第1特殊翻訳モジュール501及び連結ポインター並びに識別因子は、中国語対訳動詞が▲離▼合▲詞▼に属するかどうか、さらに、原英語文章に回数の副詞が存在するかどうかを判断できるようにプログラムされている。
特殊文章要素連結ポインターは、識別因子の付与された品詞が原英語文章にこれ以上存在しないし、また、与えられた語順配置要求も無いと判断する場合、第1特殊翻訳モジュール501は特殊文章要素の翻訳を完了する(S500)。
前記過程により、原英語文章“I have not chatted with him once.”は“我有▲没▼聊了一次天儿跟他.”に対訳される。
その後、一般文章要素翻訳手段600は、直前の段階であるS500の結果を受信し、特殊文章要素連結ポインターによって再処理された単語を辞書DBに記録された中国語語文法の独特の規則に沿って、1)最終の中国語の対訳文章で不要な中国語単語を除去し、2)最終の中国語の対訳文章で必ず必要な中国語単語(対訳語と関係なく)を挿入する過程を行なう。さらに、辞書DBに記録された中国語の語順規則に従って語順を再構成すべきかどうかを判断し、必要に応じて再処理し、残りの原言語の文章要素あるいは文章構文を完成された文章要素に生成、翻訳する。
ステップS600において、入力された英語単語“have”の対訳語“有”が最終の中国語の翻訳文章から除去され、英語単語“with him”の対訳語“跟他”は、中国語の語順規則に従って“▲没▼”の文字のすぐ後に移動配置される。
一般文章要素翻訳手段600により、原英語文章“I have not chatted with him once.”は“我▲没▼跟他聊了一次天儿.”に最終完成された翻訳文として生成される(S600)。
そして、完成翻訳文出力手段700がこれを出力し、本自動翻訳装置の画面に“我▲没▼跟他聊了一次天儿.”を表示する。
このように、本自動翻訳装置を利用して正確かつ自然な対訳文を得ることができた。中国語の▲離▼合▲詞▼構文をここまで正確かつ自然に翻訳する翻訳技術(Technological Algorithm)はこれまでに存在しなかった。
原英語文章の入力から加工文章要素への規定までの過程S100〜S400は、上述した過程と同様の流れにより行なわれる。
次に、特殊文章要素翻訳手段500(特殊翻訳モジュール)が原英語文章の特殊文章要素をどのように扱い処理するか、そして、5種類の特殊翻訳モジュールがどのように作動するかを説明する(図5〜図9参照)。
原英語文章“He always answers correctly.”を入力する(図6参照)。この文章も辞書DBと200、300、400段階を経ることによって分析、処理、再処理、再定義され、中国語の対訳単語を生成する。
入力された原英語文章中の“He”は“他”に、“always”は“▲忠▼是”に、“answers”は“回答”に、“correctly”は“正▲確▼地”に対訳される。
次に、400の情報が500に伝達されると、特殊文章要素連結ポインターが入力された原文章の英語単語を検索しながら中国語の対訳文章を形成し、“He always answers correctly.”は“他▲忠▼是回答正▲確▼地.”に翻訳生成される。
この過程において、すべての英語単語は特殊文章要素連結ポインターにより識別因子が付与されているかどうかチェックされ、“correctly”という単語に識別因子が付与されていると判断する。特殊文章要素連結ポインターは、“correctly”の識別因子と連係して辞書DBに記録された“correctly”関連情報を検索する。
特殊文章要素連結ポインター及び識別因子は、“correctly”という単語を中国語の程度補語として処理すべきであるという情報を取得する。
特殊文章要素連結ポインター及び“correctly”の識別因子は、第2特殊翻訳モジュールで原英語文章が処理されるべきであると判断し、200、300、400過程で導出された中国語の対訳語である“正▲確▼地”が中国語文法に符合しない対訳語であると判断する。第2特殊翻訳モジュール502の特殊文章要素連結ポインター及び“correctly”の識別因子は辞書DBを参照して、原英語文章中の“correctly”に対応する最も正確で自然な中国語の対訳語が“正▲確▼地”ではなく“▲対▼”であると判断する。
第2特殊翻訳モジュール及び特殊文章要素連結ポインター、“correctly”の識別因子は、2次加工対訳語である“▲対▼”が中国語対訳動詞である“回答”(“answers”の対訳語)を修飾するかどうかを判断する。その結果、修飾していると判断され、中国語動詞を修飾する程度補語であると判明されれば、特殊文章要素連結ポインター及び“correctly”の識別因子は、特殊中国語挿入文字“得”を中国語対訳動詞“回答”の後に置き、2次加工対訳語である“▲対▼”を“得”の後に位置させる。中国語の程度補語の構文規則に従って処理したものである。
次に、特殊文章要素翻訳手段500は、入力された原英語文章“He always answers correctly.”に対する中国語の対訳文章が、中国語の語順規則に沿っているかどうかを検査した後、“他▲忠▼是回答得▲対▼.”という文章を提示する。
一般文章要素翻訳手段600は、S500の結果を受信してチェックし、その結果に対して再処理すべき内容がないことを判断する。
その後、一般文章要素翻訳手段600は、中国語の対訳文章“他▲忠▼是回答得▲対▼.”を提示する。
最後に、完成翻訳文出力手段700がそれを出力し、本自動翻訳装置の画面に“他▲忠▼是回答得▲対▼.”を表示する。
このように、本自動翻訳装置を利用してより正確かつ自然な対訳文を得ることができた。中国語の程度補語構文をここまで正確かつ自然に翻訳、生成した技術はこれまでに存在しなかった。
次に、原英語文章“I translated it into English wrongly.”を入力する(図7参照)。この文章も辞書DBと200、300、400過程を経ることにより分析、処理、再処理、再定義され、中国語の対訳単語を生成する。
入力された原英語文章において“I”は“我”に、“translated”は“翻▲訳▼”に、“it”は“那个”に、そして“into”は“成”、“English”は“英▲語▼”、“wrongly”は“▲錯誤▼地”に対訳される。
次いで、400の情報が500に伝達されれば、特殊文章要素連結ポインターが原文章の英語単語を検索しながら中国語の対訳文章を形成し、“I translated it into English wrongly.”は“我翻▲訳▼那个成英▲語錯誤▼地.”に翻訳生成される。
この過程において、すべての英語単語は、特殊文章要素連結ポインターにより識別因子が付与されているかどうかチェックされ、“wrongly”という単語に識別因子が付与されているという情報を得る。特殊文章要素連結ポインターは“wrongly”の識別因子と連係して辞書DBに記録された“wrongly”関連情報を検索する。
特殊文章要素連結ポインター及び識別因子は“wrongly”を中国語語法の結果補語として処理すべきであると判断する。
特殊文章要素連結ポインター及び“wrongly”の識別因子は、第3特殊翻訳モジュールで原英語文章が処理されるべきであると判断し、200、300、400過程で導出された中国語の対訳語である“▲錯誤▼地”が中国語文法に符合しないと判断する。第3特殊翻訳モジュール503の特殊文章要素連結ポインター及び“wrongly”の識別因子は、辞書DBを参照して、原英語文章中の“wrongly”に対応する最も正確で自然な中国語の対訳語が“▲錯誤▼地”ではなく“▲錯▼了”であると判断する。
第3特殊翻訳モジュール及び特殊文章要素連結ポインター、“wrongly”の識別因子は、2次加工対訳語である“▲錯▼了”が中国語対訳動詞である “翻▲訳▼”(“translated”の対訳語)を修飾するかどうかを判断する。その結果、修飾すると判断され、中国語動詞を修飾する結果補語であると判明されれば、特殊文章要素連結ポインター及び“wrongly”の識別因子は2次加工対訳語である“▲錯▼了”を中国語対訳動詞である“翻▲訳▼”のすぐ後に配置する。中国語の結果補語構文規則と中国語の語順規則に従って処理したものである。
その後、一般文章要素翻訳手段600は、直前の段階であるS500の結果を受信し、特殊文章要素連結ポインターにより再処理された単語を、辞書DBに記録された中国語文法の独特の規則に従って、1)最終の中国語の対訳文章で不要な中国語単語を除去し、2)最終の中国語の対訳文章で必ず必要な中国語の単語(対訳語と関係なく)を挿入する過程を行なう。また、辞書DBに記録された中国語の語順規則に従って語順を再構成する必要があるかどうか判断し、必要に応じて再処理し、残りの原言語の文章要素あるいは文章構文を完成された文章要素に生成、翻訳する。
S500の結果を受信した一般文章要素翻訳手段600は、中国語の対訳語“那个”(“it”の中国語の対訳語)のすぐ前に中国語の挿入単語“把”(中国語文法の独特の規則に従って)が位置する必要があると判断する。そして、中国語の対訳語“把那个”は、中国語の語順規則に従って中国語対訳動詞である“翻▲訳▼”のすぐ前に位置する必要があると判断する。このようにして、一般文章要素翻訳手段600は、最終の中国語の対訳文章“我把那个翻▲訳錯▼了成英▲語▼.”を生成する(S600)。
最後に、完成翻訳文出力手段700がそれを出力し、本自動翻訳装置の画面に“我把那个翻▲訳錯▼了成英▲語▼.”(S600)を表示する。
このように、本自動翻訳装置を利用して正確かつ自然な対訳文を得ることができた。中国語の結果補語構文をここまで正確かつ自然に翻訳、生成した翻訳技術(Technological Algorithm)はこれまでに存在しなかった。
次に、原英語文章、“He is besieged with visitors froma broad.”を入力する(図8参照)。この文章も辞書DBと200、300、400過程を経ることによって分析、処理、再処理、再定義され、中国語の対訳単語を生成する。
入力された原英語文章において“He”は“他”に、“is”は“是”に、“besieged”は“包▲囲▼了”に、“with”は“跟”に、“visitors”は“客人”に、“from”は“▲従▼”に、“abroad”は“外国”に対訳される。
次いで、400の情報が500に伝達されれば、特殊文章要素連結ポインターが原文章の英語単語を検索しながら中国語の対訳文章を形成する。即ち、“He is besieged with visitors froma broad.”は“他是包▲囲▼了跟客人▲従▼外国.”に翻訳、生成される。
この過程で入力された全ての英語単語は、特殊文章要素連結ポインターにより識別因子が付与されているかどうかチェックされ、原英語文章の文章構造が「be動詞+過去分詞」からなる被動文(受動態)であると判断するように被動文識別因子を有することが判る。特殊文章要素連結ポインター及び識別因子は、辞書DBを参照して原英語文章の文章構造と単語を検索する。
特殊文章要素連結ポインター及び文章構造識別因子は、第4特殊翻訳モジュール504で原英語文章が処理されるべきであると判断する。第4特殊翻訳モジュール504及び特殊文章要素連結ポインター並びに文章構造識別因子は、辞書DBを参照して原文章中“is besieged”という動詞句を検索すると同時に、中国語の対訳語の動詞“包▲囲▼了”がヒトや物の動作を支配するかどうか、また、影響を与えるかどうかを判断する。その結果、Yesと判断される場合には、翻訳された中国語対訳動詞の前に“被”という文字を挿入することを決定する。第4特殊翻訳モジュール504は、一次的対訳動詞である“包▲囲▼了”を“被包▲囲▼了”に再加工して処理する。
第4特殊翻訳モジュール504の特殊文章要素連結ポインター及び識別因子はまた、入力された被動文の英語動詞の後に位置する英語前置詞に対応する中国語の対訳単語が中国語文法に符合するかを調べる。被動文の英語前置詞に対応する中国語の対訳単語は、中国語文法において確固に存在する特別な英語前置詞の対訳語条件を充足しなければならないためである。
以上のような条件を調べるために、特殊文章要素連結ポインター及び識別因子は、被動文の英語前置詞“with”の中国語の対訳語である“跟”が、被動文の英語前置詞に対応する中国語の対訳語条件を満たしているかどうかを調べる。その結果、NOである場合には、辞書DBを再検索し、入力された被動文の英語文章の前置詞に対応する中国語の対訳語条件(中国語文法)に符合する対訳語が“跟”ではなく“与”であるという情報を取得する。
次いで、第4特殊翻訳モジュール504は辞書DBを参照して、中国語の語順規則に従って原文章の前置詞句“with visitors”を結合した中国語の対訳語句“与客人”を、中国語対訳動詞句である“被包▲囲▼了”のすぐ前に配置する。第4特殊翻訳モジュール504は、原文章の中国語の対訳文章を“他是与客人被包▲囲▼了▲従▼外国.”に再変換して提示する。
その後、一般文章要素翻訳手段600は、直前の段階であるS500の結果を受信し、特殊文章要素連結ポインターにより再処理された単語を辞書DBに記録された中国語文法の独特の規則に従って、最終の中国語対訳文章で不要な中国語単語“是”(動詞beの対訳語)を除去し、辞書DBに記録された中国語の語順規則に従って語順を再構成すべきかどうかを判断する。その結果、前置詞句である“▲従▼外国”(“from abroad”の対訳語)を“与客人”(“with visitors”の対訳語)のすぐ後に位置させる。このようにして、600は最終の中国語の対訳文章として“他与客人▲従▼外国被包▲囲▼了.”を生成する(S600)。
最後に、完成翻訳文出力手段700がそれを出力し、本自動翻訳装置の画面に“他与客人▲従▼外国被包▲囲▼了.”を表示する。
このように、本自動翻訳装置を利用して正確かつ自然な対訳文を得ることができた。中国語の被動文構文をここまで正確かつ自然に翻訳、生成した技術はこれまでに存在しなかった。
次に、原英語文章“He is sensitive to light.”を入力する(図9参照)。この文章も辞書DB及び200、300、400の過程によって分析、処理、再処理、再定義され、中国語の対訳単語を生成する。
入力された原英語文章において、“He”は“他”に、“is”は“是”に、“sensitive”は“敏感”に、“to”は“▲対▼”に、“light”は“光”に対訳される。
次いで、400の情報が500に伝達されれば、特殊文章要素連結ポインターが原入力文章の英語単語を検索しながら、中国語の対訳文章を形成し、“He is sensitive to light.”は“他是敏感▲対▼光.”に翻訳、生成される。
この過程において、入力された全ての英語単語は、特殊文章要素連結ポインターにより識別因子が付与されているかが判断され、特殊文章要素連結ポインターは、識別因子の付与された単語が検索されれば、識別因子を活性化させる。
特殊文章要素連結ポインターは、原英語文章中“is sensitive”の文章構造から識別因子を検出し、「be+形容詞」からなる形容詞構文であると判断する。そして、特殊文章要素連結ポインター及び識別因子は、原英語文章が第5特殊翻訳モジュール505で処理されるべきであると判断する。
第5特殊翻訳モジュール505及び特殊文章要素連結ポインター並びに文章構造識別因子は、辞書DBを参照して原文章中の“is sensitive”という形容詞句に関する情報を検索し、原英語文章中の“is”に対応する中国語対訳動詞“是”を除去し、辞書DBに記録された中国語の語順規則に従って中国語の対訳文章を再構成する。
このようにして、入力された原英語文章“He is sensitive to light.”は“他敏感▲対▼光.”に対訳、生成される(S500)。
その後、一般文章要素翻訳手段600は、直前の段階であるS500の結果を受信し、特殊文章要素連結ポインターにより再処理された単語を、辞書DBに記録された中国語文法の独特の規則に従って、最終の中国語の対訳文章に不要な中国語単語及び必ず必要な中国語単語を調べ、辞書DBに記録された中国語の語順規則に従って語順を再調整する必要があるかどうかを判断する。その結果、前置詞句である“▲対▼光”(“to light”の対訳語)が中国語の形容詞対訳語“敏感”のすぐ前に位置する必要があると判断する。正しい中国語の語順規則に従うためである。これにより、600は、原英語文章の最終の中国語の対訳文章を“他▲対▼光敏感.”のように再構成して生成する(S600)。
その結果、完成翻訳文出力手段700がそれを出力し、本自動翻訳装置の画面に“他▲対▼光敏感.”を表示する。
このように、本自動翻訳装置により正確かつ自然な対訳文を得ることができた。中国語の被動文構文をここまで正確かつ自然に翻訳、生成した技術(Technological Algorithm)はこれまでに存在しなかった。
以上のように、当該発明の属する技術分野における通常の知識を有する者であれば、本発明の思想及び範囲内で様々な変形及び均等な他の実施例が可能であり、そのような多様な変形及び改良形態も本発明の権利範囲に属するものである。
Claims (5)
- 自動翻訳装置は、次のように構成することを特徴とする。
1.辞書DB保存手段100:4つの相互関連の辞書データベースを有しており、4つの各辞書データベースには英語単語の全情報と、対訳中国語単語の情報がそれぞれの言語体系に基づいて記録されている。
2.形態素分析手段200:入力された原語文章の単語を形態素単位に分析する。
3.基礎文章要素規定手段300:形態素分析手段200で形態素単位に分析された単語の結果を受信し、各品詞で表示される基礎文章要素として規定し、辞書DB保存手段100に基づき入力した英語単語を中国語の対訳語に1次変換する。
4.加工文章要素規定手段400(変換翻訳モジュール;modulatory translation module):基礎文章要素規定手段300で分析した結果を受信し、処理された各品詞を組み合わせて少なくとも2つ以上の品詞が合成語、熟語、あるいは定型化された慣用語句などに変換できるものがあるかどうかをチェックし、変換できるものが導出される場合、少なくとも2つ以上の該当する品詞を結合して、構文的機能を考慮した品詞に変換し、変換された転成品詞を新たに規定する(すなわち品詞が変わる、品詞の再転成が場合によって発生する)。そして、第1、第2、第3の辞書データーベースDBに基づいて、基礎文章要素規定手段300により1次処理された、入力された英語単語の対訳中国語がここで再処理される。それは、品詞の再転成がここで発生するためである。
5.特殊文章要素翻訳手段500:基礎文章要素規定手段300及び加工文章要素規定手段400の結果、すなわち基礎文章要素あるいは加工文章要素をチェックし、この特殊文章要素翻訳手段500に内蔵されている特殊文章要素連結ポインター(pointer)と連結される識別因子が各単語の文章要素に存在するかどうかを判断する。一つ以上の原言語の文章要素あるいは文章構文から識別因子が検出された場合、一つ以上の原言語の文章要素あるいは文章構文は、500に内蔵された各特殊文章要素翻訳モジュールにより、辞書データベースベースに定型化された対訳中国語の文章要素あるいは文章構文に再処理され、これによって300及び400で処理された対訳中国語も再処理されながら中国語の語順も再処理される。特殊文章要素翻訳手段500に内蔵された各特殊文章要素翻訳モジュールには5種類のモジュール(501〜505)があり、それぞれ独特の文法処理能力を有する連結ポインター(pointer)及び各文章要素に付与された識別因子によって活性化される。
6.一般文章要素翻訳手段600:特殊文章要素翻訳手段500の結果を受信し、特殊文章要素連結ポインターにより再処理された単語を、辞書DB100に記録された中国語の語順規則に従って再構成する必要があるかどうかを判断し、必要に応じて再処理し、残りの原言語の文章要素あるいは文章構文を完成された文章要素に翻訳する一般文章要素翻訳手段600である。さらに、この段階において、中国語文法の独特の規則に従って、(1)最終の中国語の対訳文章で不要な中国語単語を除去し、(2)最終の中国語の対訳文章で必ず必要な中国語単語(対訳語と関係なく)を挿入する過程が含まれる。
7.完成翻訳文出力手段700:完成された対訳中国語文章を出力する。
特殊文章要素翻訳手段500に内蔵された5種類の特殊翻訳モジュール(501〜505)には、それぞれ互いに異なる処理能力を有する特殊文章要素連結ポインターが含まれている。
第1特殊翻訳モジュール501は、原語文章中にある動詞の中国語対訳動詞に特殊文章要素連結ポインターが存在するかどうか、さらに、▲離▼合▲詞▼識別因子を有するかどうかをチェックする。その二つが同時に存在する場合には、原語文章が過去時制であるかを調べ、過去時制であれば、対訳語の文章要素として動詞を翻訳するとき、その翻訳された対訳語の動詞の音節の間に過去時制を表す“了”という文字を挿入して翻訳し、次いで、原語文章中に回数の副詞が存在するかどうかを調べ、それに対応する対訳語を過去表示の“了”の後に位置させて(原語文章が過去時制でない場合には回数の副詞のみ位置する)翻訳する。
第2特殊翻訳モジュール502は、原言語の文章要素中に中国語対訳動詞の程度を表す中国語の補語性格の単語が含まれているかどうかを特殊文章要素連結ポインターによってチェックし、その中国語の程度補語が中国語対訳動詞を修飾するという識別因子が存在する場合には、対訳語の文章要素である動詞と中国語の補語性格の単語を翻訳するとき、翻訳された対訳語の動詞とその対訳語の程度補語の間に“得”という文字を挿入して翻訳する。
第3特殊翻訳モジュール503は、原言語の文章要素中に中国語対訳動詞の結果を表す中国語の補語性格の単語が含まれているかどうかを特殊文章要素連結ポインターによってチェックし、その対訳された中国語の結果補語が中国語対訳動詞を修飾するという識別因子が存在する場合には、対訳語の文章要素としてその単語を翻訳するとき、翻訳された対訳語の動詞の後にその中国語の対訳語の結果補語を置いて翻訳する。
第4特殊翻訳モジュール504は、原言語の文章要素中に動詞が「be動詞+過去分詞」からなる被動文(受動態)であるかどうか、及び原語文章の過去分詞と対応する中国語対訳動詞がヒトや物の動作を支配するかどうか、また、影響を与えるかどうかを特殊文章要素連結ポインター及び識別因子によってチェックする。その結果、全て該当する場合には、被動文の原語文章を対訳語に翻訳するとき、その翻訳された対訳語文章の対訳動詞の前に“被”という文字を挿入するかを決定し、語順の再構成要求に従って翻訳する。
第5特殊翻訳モジュール505は、原言語の文章要素を構成する構文が「主語+be動詞+形容詞+前置詞」からなる形容詞構文であるかどうかを特殊文章要素連結ポインター及び識別因子によってチェックする。その結果、形容詞構文である場合には、対訳語の文章要素を構成する中国語の形容詞構文に翻訳するときに、be動詞に対応する対訳語の動詞を省略し、語順の再構成要求に従って翻訳する。
辞書データベースに内蔵された4つの辞書のすべての英語単語と中国語単語には、それぞれ形態素情報、基礎文章要素情報、加工文章要素情報、特殊文章要素情報が含まれており、特に、特殊文章要素情報には識別因子検索表示が第1、第2、第3の辞書DBに付与されている。識別因子は、各英語単語の特殊文章要素情報をチェックし、5種類の特殊翻訳モジュール(501〜505)中の特殊文章要素連結ポインターと連係して機能し、特殊文章要素情報を有する各英語単語を最も適切かつ正確に中国語対訳の単語と対応させて対訳結果を生成するようにする。
5種類の特殊翻訳モジュール(501〜505)は、入力された英語文章を当該単語情報の再処理及び再加工過程に誘導し、最も適切かつ正確な最終の中国語対訳文章に変換、生成されるようにする重要な役割をする。
第1辞書DBは一般単語情報を有し、第2、第3辞書DBは合成語、慣用語、熟語などの情報を、第4辞書DBは専門用語情報を有する。 - 請求項1に記載の自動翻訳装置は次のように構成することを特徴とする。
辞書DB100は、英語単語及び対訳中国語単語の情報がそれぞれの言語体系に沿って記録されている4つの辞書データベースを有し、第1、第2、第3の辞書DBには、英語と対応する中国単語の合成語、慣用語、熟語などの特殊文章要素情報が記録されている。
前記辞書DB100を参照して、中国語の対訳語及び入力された原英語単語が特殊文章要素翻訳手段500の特殊文章性分連結ポインターによって調査、検索される(500)。
前記辞書DB100を参照して、特殊文章要素連結ポインターは、中国語対訳動詞及び入力された原英語の動詞に中国語▲離▼合▲詞▼動詞の識別因子が付与されているかどうかをチェックする。また、原英語文章が過去時制であるかどうか、さらに、原英語文章中に回数の副詞が存在するかどうかをチェックする。これが第1特殊翻訳モジュールの過程である(501)。
前記辞書DB100を参照して、特殊文章要素連結ポインターは、中国語対訳単語に程度補語の識別因子が付与されているかどうかをチェックする。そして、その中国語の程度補語単語が中国語対訳動詞を修飾するという識別因子が付与されているかどうかをチェックする。これが第2特殊翻訳モジュールの過程である(502)。
前記辞書DB100を参照して、特殊文章要素連結ポインターは、中国語対訳単語に結果補語の識別因子が付与されているかどうかをチェックする。そして、その中国語の結果補語単語が中国語対訳動詞を修飾するという識別因子が付与されているかどうかをチェックする。これが第3特殊翻訳モジュールの過程である(503)。
前記辞書DB100を参照して、特殊文章要素連結ポインターは、中国語の対訳文及び原英語文に被動文構文を表示する被動文識別因子が付与されているかどうかをチェックする。次いで、原英語文章の過去分詞と対応する中国語対訳動詞がヒトや物の動作を支配するかどうか、また、影響を与えるかどうかを特殊文章要素連結ポインター及び識別因子が判断し、その後、語順の再構成要求の有無及び被動文の英語動詞の後にある英語前置詞に対応する中国語の対訳単語が中国語文法に符合するかどうかを判断する。これが第4特殊翻訳モジュールの過程である(504)。
前記辞書DB100を参照して、特殊文章要素連結ポインターは、中国語対訳構文及び原英語構文に形容詞構文識別因子が付与されているかどうかをチェックする。次いで、形容詞構文である場合には、中国語形容詞構文に翻訳するときに、be動詞に対応する対訳語の動詞を省略し、中国語語順の再構成要求に従って翻訳する。これが第5特殊翻訳モジュールの過程である(505)。 - 前記自動翻訳装置及びその自動翻訳生成方法による記録媒体は、次のように構成することを特徴とする。
1.辞書DB保存手段100:4つの相互関連の辞書データベースを有しており、4つの各辞書データベースには英語単語の全情報と、対訳中国語単語の情報がそれぞれの言語体系に基づいて記録されている。
2.形態素分析手段200:入力された原語文章の単語を形態素単位に分析する。
3.基礎文章要素規定手段300:形態素分析手段200で形態素単位に分析された単語の結果を受信し、各品詞で表示される基礎文章要素として規定し、辞書DB保存手段100に基づき入力した英語単語を中国語の対訳語に1次変換する。
4.加工文章要素規定手段400(変換翻訳モジュール;modulatory translation module):基礎文章要素規定手段300で分析した結果を受信し、処理された各品詞を組み合わせて少なくとも2つ以上の品詞が合成語、熟語、あるいは定型化された慣用語句などに変換できるものがあるかどうかをチェックし、変換できるものが導出される場合、少なくとも2つ以上の該当する品詞を結合して、構文的機能を考慮した品詞に変換し、変換された転成品詞を新たに規定する(すなわち品詞が変わる、品詞の再転成が場合によって発生する)。そして、第1、第2、第3の辞書データーベースDBに基づいて、基礎文章要素規定手段300により1次処理された、入力された英語単語の対訳中国語がここで再処理される。それは、品詞の再転成がここで発生するためである。
5.特殊文章要素翻訳手段500:基礎文章要素規定手段300及び加工文章要素規定手段400の結果、すなわち基礎文章要素あるいは加工文章要素をチェックし、この特殊文章要素翻訳手段500に内蔵されている特殊文章要素連結ポインター(pointer)と連結される識別因子が各単語の文章要素に存在するかどうかを判断する。一つ以上の原言語の文章要素あるいは文章構文から識別因子が検出された場合、一つ以上の原言語の文章要素あるいは文章構文は、500に内蔵された各特殊文章要素翻訳モジュールにより、辞書データベースベースに定型化された対訳中国語の文章要素あるいは文章構文に再処理され、これによって300及び400で処理された対訳中国語も再処理されながら中国語の語順も再処理される。特殊文章要素翻訳手段500に内蔵された各特殊文章要素翻訳モジュールには5種類のモジュール(501〜505)があり、それぞれ独特の文法処理能力を有する連結ポインター(pointer)及び各文章要素に付与された識別因子によって活性化される。
6.一般文章要素翻訳手段600:特殊文章要素翻訳手段500の結果を受信し、特殊文章要素連結ポインターにより再処理された単語を、辞書DB100に記録された中国語の語順規則に従って再構成する必要があるかどうかを判断し、必要に応じて再処理し、残りの原言語の文章要素あるいは文章構文を完成された文章要素に翻訳する一般文章要素翻訳手段600である。さらに、この段階において、中国語文法の独特の規則に従って、(1)最終の中国語の対訳文章で不要な中国語単語を除去し、(2)最終の中国語の対訳文章で必ず必要な中国語単語(対訳語と関係なく)を挿入する過程が含まれる。
7.完成翻訳文出力手段700:完成された対訳中国語文章を出力する。
特殊文章要素翻訳手段500に内蔵された5種類の特殊翻訳モジュール(501〜505)には、それぞれ互いに異なる処理能力を有する特殊文章要素連結ポインターが含まれている。
第1特殊翻訳モジュール501は、原語文章中にある動詞の中国語対訳動詞に特殊文章要素連結ポインターが存在するかどうか、さらに、▲離▼合▲詞▼識別因子を有するかどうかをチェックする。その二つが同時に存在する場合には、原語文章が過去時制であるかを調べ、過去時制であれば対訳語の文章要素として動詞を翻訳するとき、その翻訳された対訳語の動詞の音節の間に過去時制を表す“了”という文字を挿入して翻訳し、次いで、原語文章中に回数の副詞が存在するかどうかを調べ、それに対応する対訳語を過去表示の“了”の後に位置させて(原語文章が過去時制でない場合には回数の副詞のみ位置する)翻訳する。
第2特殊翻訳モジュール502は、原言語の文章要素中に中国語対訳動詞の程度を表す中国語の補語性格の単語が含まれているかどうかを特殊文章要素連結ポインターによってチェックし、その中国語の程度補語が中国語対訳動詞を修飾するという識別因子が存在する場合には、対訳語の文章要素である動詞と中国語の補語性格の単語を翻訳するとき、翻訳された対訳語の動詞とその対訳語の程度補語の間に“得”という文字を挿入して翻訳する。
第3特殊翻訳モジュール503は、原言語の文章要素中に中国語対訳動詞の結果を表す中国語の補語性格の単語が含まれているかどうかを特殊文章要素連結ポインターによってチェックし、その対訳された中国語の結果補語が中国語対訳動詞を修飾するという識別因子が存在する場合には、対訳語の文章要素としてその単語を翻訳するとき、翻訳された対訳語の動詞の後にその中国語の対訳語の結果補語を置いて翻訳する。
第4特殊翻訳モジュール504は、原言語の文章要素中に動詞が「be動詞+過去分詞」からなる被動文(受動態)であるかどうか、及び原語文章の過去分詞と対応する中国語対訳動詞がヒトや物の動作を支配するかどうか、また、影響を与えるかどうかを特殊文章要素連結ポインター及び識別因子によってチェックする。その結果、全て該当する場合には、被動文の原語文章を対訳語に翻訳するとき、その翻訳された対訳語文章の対訳動詞の前に“被”という文字を挿入するかを決定し、語順の再構成要求の有無に従って翻訳する。
第5特殊翻訳モジュール505は、原言語の文章要素を構成する構文が「主語+be動詞+形容詞+前置詞」からなる形容詞構文であるかどうかを特殊文章要素連結ポインター及び識別因子によってチェックする。その結果、形容詞構文である場合には、対訳語の文章要素を構成する中国語の形容詞構文に翻訳するときに、be動詞に対応する対訳語の動詞を省略し、語順の再構成要求に従って翻訳する。
辞書データベースに内蔵された4つの辞書のすべての英語単語と中国語単語には、それぞれ形態素情報、基礎文章要素情報、加工文章要素情報、特殊文章要素情報が含まれており、特に、特殊文章要素情報には識別因子検索表示が第1、第2、第3の辞書DBに付与されている。識別因子は、各英語単語の特殊文章要素情報をチェックし、5種類の特殊翻訳モジュール(501〜505)中の特殊文章要素連結ポインターと連係して機能し、特殊文章要素情報を有する各英語単語を最も適切かつ正確に中国語対訳の単語と対応させて対訳結果を生成するようにする。
5種類の特殊翻訳モジュール(501〜505)は、入力された英語文章を当該単語情報の再処理及び再加工過程に誘導し、最も適切かつ正確な最終の中国語対訳文章に変換、生成されるようにする重要な役割をする。
第1辞書DBは一般単語情報を有し、第2、第3辞書DBは合成語、慣用語、熟語などの情報を、第4辞書DBは専門用語情報を有する。 - 請求項3に記載の自動翻訳装置の記録媒体は次のように構成することを特徴とする。
辞書DB100は、英語単語及び対訳中国語単語の情報がそれぞれの言語体系に沿って記録されている4つの辞書データベースを有し、第1、第2、第3の辞書DBには、英語と対応する中国単語の合成語、慣用語、熟語などの特殊文章要素情報が記録されている。
前記辞書DB100を参照して、中国語の対訳語及び入力された原英語単語が特殊文章要素翻訳手段500の特殊文章性分連結ポインターによって調査、検索される(500)。
前記辞書DB100を参照して、特殊文章要素連結ポインターは、中国語対訳動詞及び入力された原英語の動詞に中国語▲離▼合▲詞▼動詞の識別因子が付与されているかどうかをチェックする。また、原英語文章が過去時制であるかどうか、さらに、原英語文章中に回数の副詞が存在するかどうかをチェックする。これが第1特殊翻訳モジュールの過程である(501)。
前記辞書DB100を参照して、特殊文章要素連結ポインターは、中国語対訳単語に程度補語の識別因子が付与されているかどうかをチェックする。そして、その中国語の程度補語単語が中国語対訳動詞を修飾するという識別因子が付与されているかどうかをチェックする。これが第2特殊翻訳モジュールの過程である(502)。
前記辞書DB100を参照して、特殊文章要素連結ポインターは、中国語対訳単語に結果補語の識別因子が付与されているかどうかをチェックする。そして、その中国語の結果補語単語が中国語対訳動詞を修飾するという識別因子が付与されているかどうかをチェックする。これが第3特殊翻訳モジュールの過程である(503)。
前記辞書DB100を参照して、特殊文章要素連結ポインターは、中国語の対訳文及び原英語文に被動文構文を表示する被動文識別因子が付与されているかどうかをチェックする。次いで、原英語文章の過去分詞と対応する中国語対訳動詞がヒトや物の動作を支配するかどうか、また、影響を与えるかどうかを特殊文章要素連結ポインター及び識別因子が判断し、その後、語順の再構成要求の有無及び被動文の英語動詞の後にある英語前置詞に対応する中国語の対訳単語が中国語文法に符合するかどうかを判断する。これが第4特殊翻訳モジュールの過程である(504)。
前記辞書DB100を参照して、特殊文章要素連結ポインターは、中国語対訳構文及び原英語構文に形容詞構文識別因子が付与されているかどうかをチェックする。次いで、形容詞構文である場合には、中国語形容詞構文に翻訳するときに、be動詞に対応する対訳語の動詞を省略し、中国語語順の再構成要求に従って翻訳する。これが第5特殊翻訳モジュールの過程である(505)。 - 前記自動翻訳装置による翻訳方法は、次の段階を含むことを特徴とする。
ステップS100:原語文章を入力する段階。
ステップS200:入力された原語文章の単語を形態素単位に分析する段階。
ステップS300:形態素単位に分析された単語を各品詞として分析し、基礎文章要素として解釈する段階。
ステップS400:S300で分析された結果を受信し、処理した各品詞を組み合わせ、少なくとも二つ以上の品詞が合成語、熟語、または定型化された慣用語句などに変換できるものがあるかどうかをチェックする。変換できるものが検出される場合には、少なくとも二つ以上の品詞を結合して構文的機能を考慮した品詞に転換し、転換された転成品詞を含む加工文章要素として規定する段階。
ステップS500:基礎文章要素あるいは加工文章要素をチェックし、ステップS500の段階に内蔵されている特殊文章要素の連結ポインター(pointer)と連結される識別因子が各単語の文章要素に存在するかどうかを判断する。一つ以上の原言語の文章要素あるいは文章構文から識別因子が検出される場合には、一つ以上の原言語の文章要素あるいは文章構文は、S500に内蔵された各特殊文章要素の翻訳モジュール501〜505により辞書データベースに定型化された対訳中国語の文章要素あるいは文章構文に再処理される。これによって、S300及びS400で処理された対訳中国語も再処理されながら中国語の語順が再処理される段階。
ステップS600:S500の結果を受信し、特殊文章要素連結ポインターによって再処理された単語を、辞書DBに記録された中国語の語順規則に従って再構成する必要があるかどうかを判断し、必要に応じて再処理し、残りの原言語の文章要素あるいは文章構文を完成された文章要素に翻訳する段階である。さらに、この段階において、中国語文法の独特の規則に従って、(1)最終の中国語の対訳文章で不要な中国語単語を除去し、(2)最終の中国語の対訳文章で必ず必要な中国語単語(対訳語と関係なく)を挿入する過程が含まれる。
ステップS700:完成された対訳文章を出力する段階を含む。
なお、ステップS500において、500に内蔵された(第1特殊翻訳モジュール501)特殊文章要素連結ポインター及び識別因子は、原言語の文章要素に対応する中国語対訳動詞が▲離▼合▲詞▼であるかどうかを判断し、▲離▼合▲詞▼である場合には、対訳語の文章要素としてその動詞を翻訳するとき、その翻訳された対訳語の動詞の音節の間に過去時制を表す“了”という文字を挿入(原語文章が過去型である場合)したり、原語文章に回数の副詞が存在する場合には、“了”という文字の後に対訳された中国語の回数の副詞の対訳語を挿入(原語文章が過去型ではない場合には“了”は挿入せず、副詞の対訳語のみ挿入する)して翻訳する段階(S501)と、
ステップS500において、対訳された中国語文章の単語のうち、中国語程度補語が存在するかどうか、及びその程度補語が対訳された中国語文章の対訳動詞を修飾するかどうかを500に内蔵された(第2特殊翻訳モジュール502)特殊文章要素連結ポインター及び識別因子が判断する。その結果、中国語対訳動詞を修飾する場合には、中国語対訳動詞と対訳された中国語程度補語の間に“得”という文字を挿入し、その後、該当する対訳語の程度補語を配置して翻訳する段階(S502)と、
ステップS500において、対訳された中国語文章の単語のうち、中国語結果補語が存在するかどうか、及びその結果補語が対訳された中国語文章の対訳動詞を修飾するかどうかを500に内蔵された(第3特殊翻訳モジュール503)特殊文章要素連結ポインター及び識別因子が判断する。その結果、中国語対訳動詞を修飾する場合には、中国語対訳動詞のすぐ後に該当する対訳語の結果補語を置いて翻訳する段階(S503)と、
ステップS500において、第4特殊翻訳モジュール504の特殊文章要素連結ポインター及び識別因子が原語文章の文章構造を「be動詞+過去分詞」からなる被動文(受動態)であるかどうかを判断し、被動文であると判断した場合には、原語文章の過去分詞と対応する中国語対訳動詞がヒトや物の動作を支配するかどうか、また、影響を与えるかどうかを判断する。その結果、全て該当する場合には、被動文の原語文章を対訳語に翻訳するとき、その翻訳された対訳語文章の対訳動詞の前に“被”という文字を挿入するかを決定し、その後、語順の再構成要求の有無に従って翻訳する段階(S504)と、
ステップS500において、第5特殊翻訳モジュール505の特殊文章要素連結ポインター及び識別因子が原語文章の文章構造を「be動詞+形容詞+前置詞」からなる形容詞構文であるかどうかを判断し、形容詞構文であると判断した場合には、対訳語の文章要素を構成する中国語の形容詞構文に翻訳するときに、be動詞に対応する中国語対訳動詞を省略し、語順の再構成要求に従って翻訳する段階(S505)を含む。
ステップS500において、特殊翻訳モジュール501〜505及び内蔵された特殊文章要素連結ポインター、並びに単語に付与された識別因子が三位一体となって動作する。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2004-0000801A KR100502460B1 (ko) | 2003-05-16 | 2004-01-06 | 자동번역기, 그 자동번역기를 이용한 자동번역방법 및 그자동번역기가 기록된 기록매체 |
PCT/KR2005/000065 WO2005065061A2 (en) | 2004-01-06 | 2005-01-03 | The auto translator and the method thereof and the recording medium to program it |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007518164A true JP2007518164A (ja) | 2007-07-05 |
Family
ID=36869784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006546858A Pending JP2007518164A (ja) | 2004-01-06 | 2005-01-03 | 自動翻訳装置及びその自動翻訳装置を利用した自動翻訳方法並びにその自動翻訳装置が記録された記録媒体 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20070150256A1 (ja) |
JP (1) | JP2007518164A (ja) |
CN (1) | CN1910574A (ja) |
AU (1) | AU2005203870A1 (ja) |
CA (1) | CA2552622A1 (ja) |
GB (1) | GB2425384A (ja) |
WO (1) | WO2005065061A2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013536468A (ja) * | 2010-08-20 | 2013-09-19 | ヒ ユン,ヒョク | 語学学習システムおよびその制御方法 |
US8676564B2 (en) | 2011-03-08 | 2014-03-18 | International Business Machines Corporation | Method, program and system for finding correspondence between terms |
KR101834436B1 (ko) | 2016-07-13 | 2018-03-05 | 김태완 | 텍스트 생성 방법 및 장치 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2007329240A1 (en) * | 2006-12-08 | 2008-06-12 | Patrick J. Hall | Online computer-aided translation |
CN101246474B (zh) * | 2008-02-18 | 2012-01-11 | 刘树根 | 一种基于语句构件的母语读外文方法 |
KR101023209B1 (ko) * | 2008-10-13 | 2011-03-18 | 한국전자통신연구원 | 문서 번역 장치 및 그 방법 |
US9591052B2 (en) | 2013-02-05 | 2017-03-07 | Apple Inc. | System and method for providing a content distribution network with data quality monitoring and management |
CN103544274B (zh) * | 2013-10-21 | 2019-11-05 | 王冠 | 一种韩语文章汉字显现系统及其方法 |
CN103793378B (zh) * | 2014-01-20 | 2017-05-10 | 中国建设银行股份有限公司 | 一种翻译方法和装置 |
CN105335343A (zh) * | 2014-07-25 | 2016-02-17 | 北京三星通信技术研究有限公司 | 文本编辑方法和装置 |
KR102407630B1 (ko) * | 2015-09-08 | 2022-06-10 | 삼성전자주식회사 | 서버, 사용자 단말 및 이들의 제어 방법. |
CN105512106B (zh) * | 2015-12-09 | 2018-04-06 | 江苏科技大学 | 一种汉语离合词的自动识别方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6014615A (en) * | 1994-08-16 | 2000-01-11 | International Business Machines Corporaiton | System and method for processing morphological and syntactical analyses of inputted Chinese language phrases |
US5893133A (en) * | 1995-08-16 | 1999-04-06 | International Business Machines Corporation | Keyboard for a system and method for processing Chinese language text |
US6067520A (en) * | 1995-12-29 | 2000-05-23 | Lee And Li | System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models |
US5963893A (en) * | 1996-06-28 | 1999-10-05 | Microsoft Corporation | Identification of words in Japanese text by a computer system |
US6341372B1 (en) * | 1997-05-01 | 2002-01-22 | William E. Datig | Universal machine translator of arbitrary languages |
JP2000298667A (ja) * | 1999-04-15 | 2000-10-24 | Matsushita Electric Ind Co Ltd | 構文情報による漢字変換装置 |
KR100327114B1 (ko) * | 1999-12-23 | 2002-03-13 | 오길록 | 문장골격을 기반으로 한 자동번역 시스템 및 그 방법 |
KR20020002527A (ko) * | 2000-06-30 | 2002-01-10 | 조용환 | 실시간 다 국어 다중 번역 대화 장치 및 그 방법 |
KR100481453B1 (ko) * | 2002-11-13 | 2005-04-07 | 한국전자통신연구원 | 동사구 패턴 기반 한중 자동 번역 시스템의 '하다' 동사의번역장치 및 방법 |
-
2005
- 2005-01-03 CN CNA200580002031XA patent/CN1910574A/zh active Pending
- 2005-01-03 US US10/597,016 patent/US20070150256A1/en not_active Abandoned
- 2005-01-03 CA CA002552622A patent/CA2552622A1/en not_active Abandoned
- 2005-01-03 WO PCT/KR2005/000065 patent/WO2005065061A2/en active Application Filing
- 2005-01-03 JP JP2006546858A patent/JP2007518164A/ja active Pending
- 2005-01-03 GB GB0613032A patent/GB2425384A/en not_active Withdrawn
- 2005-01-03 AU AU2005203870A patent/AU2005203870A1/en not_active Abandoned
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013536468A (ja) * | 2010-08-20 | 2013-09-19 | ヒ ユン,ヒョク | 語学学習システムおよびその制御方法 |
US8676564B2 (en) | 2011-03-08 | 2014-03-18 | International Business Machines Corporation | Method, program and system for finding correspondence between terms |
US8682641B2 (en) | 2011-03-08 | 2014-03-25 | International Business Machines Corporation | Method, program and system for finding correspondence between terms |
KR101834436B1 (ko) | 2016-07-13 | 2018-03-05 | 김태완 | 텍스트 생성 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
WO2005065061A2 (en) | 2005-07-21 |
CA2552622A1 (en) | 2005-07-21 |
US20070150256A1 (en) | 2007-06-28 |
WO2005065061A3 (en) | 2005-09-01 |
GB2425384A (en) | 2006-10-25 |
AU2005203870A1 (en) | 2005-07-21 |
GB0613032D0 (en) | 2006-08-23 |
CN1910574A (zh) | 2007-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6385568B1 (en) | Operator-assisted translation system and method for unconstrained source text | |
JP3220560B2 (ja) | 機械翻訳装置 | |
EP1351158A1 (en) | Machine translation | |
KR100530154B1 (ko) | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 | |
EP1349079A1 (en) | Machine translation | |
JP2007518164A (ja) | 自動翻訳装置及びその自動翻訳装置を利用した自動翻訳方法並びにその自動翻訳装置が記録された記録媒体 | |
JP2815714B2 (ja) | 翻訳装置 | |
Gakis et al. | Design and construction of the Greek grammar checker | |
US7620541B2 (en) | Critiquing clitic pronoun ordering in french | |
JP2000259635A (ja) | 翻訳装置及び翻訳方法並びに翻訳プログラムを記録した記録媒体 | |
Aikawa et al. | Generation for multilingual MT | |
Mille et al. | Making Text Resources Accessible to the Reader: the Case of Patent Claims. | |
Aduriz et al. | Finite state applications for basque | |
Olayiwola et al. | Development of an automatic grammar checker for Yorùbá word processing using Government and Binding Theory | |
Fitzgerald | Reconstructing spontaneous speech | |
JP2859661B2 (ja) | 機械翻訳装置 | |
JP2938897B2 (ja) | 文書作成処理装置 | |
KR20040099107A (ko) | 자동번역기, 그 자동번역기를 이용한 자동번역방법 및 그자동번역기가 기록된 기록매체 | |
JP2752025B2 (ja) | 機械翻訳装置 | |
Skadiņa et al. | Comprehension Assistant for Languages of Baltic States | |
Aikawa et al. | Sentence generation for multilingual machine translation | |
Nojoumian | Towards the development of an automatic diacritizer for the Persian orthography based on the Xerox finite state transducer | |
Dutta et al. | Information Extraction from Hindi Texts. | |
JP2004199519A (ja) | 機械翻訳方法、機械翻訳装置、および機械翻訳プログラム | |
JPH04296969A (ja) | 機械翻訳装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101109 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110405 |