JP2005309832A - 自動翻訳装置およびプログラム - Google Patents
自動翻訳装置およびプログラム Download PDFInfo
- Publication number
- JP2005309832A JP2005309832A JP2004126821A JP2004126821A JP2005309832A JP 2005309832 A JP2005309832 A JP 2005309832A JP 2004126821 A JP2004126821 A JP 2004126821A JP 2004126821 A JP2004126821 A JP 2004126821A JP 2005309832 A JP2005309832 A JP 2005309832A
- Authority
- JP
- Japan
- Prior art keywords
- essential
- case
- sentence
- language
- pronoun
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【課題】 自然な翻訳文を得ることのできる自動翻訳装置を提供する。
【解決手段】 本発明は、第1の言語で記述された原文から、この原文中に存在する代名詞あるいは代名詞句であって、第2の言語で記述された翻訳文においては省略可能な代名詞あるいは代名詞句である必須格を抽出する必須格抽出手段と、前記必須格抽出手段により抽出された必須格のうち、省略可能なものを選択する選択手段と、前記選択手段により選択された必須格に対応する代名詞あるいは代名詞句を省略した翻訳文を生成する生成手段と、前記生成手段により確定された翻訳文を出力する出力手段とを有する自動翻訳装置を提供する。
【選択図】 図1
【解決手段】 本発明は、第1の言語で記述された原文から、この原文中に存在する代名詞あるいは代名詞句であって、第2の言語で記述された翻訳文においては省略可能な代名詞あるいは代名詞句である必須格を抽出する必須格抽出手段と、前記必須格抽出手段により抽出された必須格のうち、省略可能なものを選択する選択手段と、前記選択手段により選択された必須格に対応する代名詞あるいは代名詞句を省略した翻訳文を生成する生成手段と、前記生成手段により確定された翻訳文を出力する出力手段とを有する自動翻訳装置を提供する。
【選択図】 図1
Description
本発明は、自動翻訳装置およびプログラムに関する。
近年のグローバルな情報流通、経済活動など、国境を越えた活動の広がりにより、ある言語(例えば、英語)から別の言語(例えば、日本語)への翻訳の需要が高まっている。しかし、翻訳を業者(翻訳者)に依頼すると、一般に価格が高く、また時間もかかるため、コンピュータなどの機械を用いて自動的に翻訳する自動翻訳(機械翻訳)装置の需要が高まっている。
自動翻訳装置を構成するにあたり、英語等の外国語を日本語に翻訳する際には、次のような事項が問題となる。例えば、
(1)I went to a book store. (2)And I bought a book.
上記2つの英文を日本語に訳すと、
(3)私は本屋に行った。(4)そして、本を買った。
のように、第2文の主格代名詞を省略するのが日本語としては自然である。すなわち、第2文を直訳すると、「そして、私は、本を買った。」となるが、第2文の主語「私は」は、第1文から明らかであるため省略されることが多い。このように、主語、目的語等、文の必須成分であるにもかかわらず、文脈、前後の文章、あるいは背景知識等から照応関係が明らかであり、省略されても復元可能なため省略される代名詞のことを「ゼロ代名詞」という。通常の文書および会話で用いられる日本語においては、ゼロ代名詞が頻繁に用いられる。
(1)I went to a book store. (2)And I bought a book.
上記2つの英文を日本語に訳すと、
(3)私は本屋に行った。(4)そして、本を買った。
のように、第2文の主格代名詞を省略するのが日本語としては自然である。すなわち、第2文を直訳すると、「そして、私は、本を買った。」となるが、第2文の主語「私は」は、第1文から明らかであるため省略されることが多い。このように、主語、目的語等、文の必須成分であるにもかかわらず、文脈、前後の文章、あるいは背景知識等から照応関係が明らかであり、省略されても復元可能なため省略される代名詞のことを「ゼロ代名詞」という。通常の文書および会話で用いられる日本語においては、ゼロ代名詞が頻繁に用いられる。
一方、英語においては、日本語のようにゼロ代名詞が用いられることはない。例えば、
(5)彼女は、母親と腕を組んだ。
という和文を英訳すると、
(6)She put her arm through her mother's.
となる。すなわち、「彼女は(彼女の)母親と(彼女の)腕を組んだ。」というように、英語では所有格代名詞を省略することができないため、これらの語を補う必要がある。このように、英語等において省略不可能な格を「必須格」という。日本語におけるゼロ代名詞に対応する代名詞であっても、英語においては必須格であるため省略することはできない。
(5)彼女は、母親と腕を組んだ。
という和文を英訳すると、
(6)She put her arm through her mother's.
となる。すなわち、「彼女は(彼女の)母親と(彼女の)腕を組んだ。」というように、英語では所有格代名詞を省略することができないため、これらの語を補う必要がある。このように、英語等において省略不可能な格を「必須格」という。日本語におけるゼロ代名詞に対応する代名詞であっても、英語においては必須格であるため省略することはできない。
以上で説明したように、英語から日本語への翻訳の際には、必須格のうちいくつかを削除、すなわちゼロ代名詞の使用をしないと自然な日本語を得ることができない。ここで、ある言語から別の言語への翻訳の際に、原文にあった構成要素の一部を削除する技術としては、例えば特許文献1に記載の技術がある。
特開平2−112068
しかし、特許文献1に記載の技術は、原文から冗長な修飾語を取り除き簡略文を生成するものであり、必須格を削除できるものではなかった。また、原文では適切に設定されていたレイアウトが、翻訳文では崩れてしまうという問題もあった。
本発明は上記の事情に鑑みてなされてものであり、自然な翻訳文を得ることのできる自走翻訳装置を提供することを目的とする。さらに、自然な翻訳文を所望のレイアウトで出力可能な自動翻訳装置を提供することを目的とする。
本発明は上記の事情に鑑みてなされてものであり、自然な翻訳文を得ることのできる自走翻訳装置を提供することを目的とする。さらに、自然な翻訳文を所望のレイアウトで出力可能な自動翻訳装置を提供することを目的とする。
上述の課題を解決するため、本発明は、第1の言語で記述された原文から、この原文中に存在する代名詞あるいは代名詞句であって、第2の言語で記述された翻訳文においては省略可能な代名詞あるいは代名詞句である必須格を抽出するルールを記憶する必須格抽出ルール記憶手段と、前記第1の言語で記述された原文を記憶する原文記憶手段と、前記必須格抽出ルールに記憶されたルールに基づいて、前記原文記憶手段に記憶された原文から必須格を抽出する必須格抽出手段と、前記必須格抽出手段により抽出された必須格のうち、省略するものを選択する選択手段と、前記原文記憶手段に記憶された原文に基づき、前記選択手段により選択された必須格に対応する代名詞あるいは代名詞句を省略した前記第2の言語による翻訳文を生成する生成手段と、前記生成手段により確定された翻訳文を出力する出力手段とを有する自動翻訳装置を提供する。この自動翻訳装置によれば、第2の言語においては不要な必須格が省略された自然な翻訳文を得ることができる。
好ましい態様において、必須格抽出ルール記憶手段に記憶されたルールは、LFG(Lexical Functional Grammar)に従った意味解析処理に基づいて必須格を抽出するルールである。
この態様において、本発明に係る自動翻訳装置は、前記必須格抽出手段により抽出された必須格を提示する必須格提示手段と、当該自動翻訳装置に対し指示入力を行う指示入力手段とをさらに有し、前記選択手段が、使用者の指示入力に基づいて省略する必須格を選択する構成としてもよい。この自動翻訳装置によれば、省略する必須格を任意に選択することができる。
この態様において、本発明に係る自動翻訳装置は、前記必須格抽出手段により抽出された必須格を提示する必須格提示手段と、当該自動翻訳装置に対し指示入力を行う指示入力手段とをさらに有し、前記選択手段が、使用者の指示入力に基づいて省略する必須格を選択する構成としてもよい。この自動翻訳装置によれば、省略する必須格を任意に選択することができる。
また、好ましい態様において、文章中に含まれる複数の必須格に、省略可能な優先度を付すルールを記述したルールベースを記憶するルールベース記憶手段と、前記ルールベースに基づいて、前記複数の必須格の各々に優先度を付加する優先度付加手段とをさらに有し、前記選択手段が、前記優先度付加手段により付加された優先度に基づいて、省略する必須格を自動選択する構成としてもよい。この自動翻訳装置によれば、自然な翻訳文を容易に得ることができる。
また、好ましい態様において、本発明に係る自動翻訳装置は、前記翻訳文の出力形式あるいは表示形式を指定する形式指定情報を記憶する形式情報記憶手段と、前記生成手段により生成された翻訳文が前記形式指定情報で指定される出力形式あるいは表示形式に適合しているか判断する判断手段と、をさらに有し、前記選択手段は、まず優先度の最も高い必須格を選択し、前記判断手段による判断結果が否定的な場合に、選択されていない必須格のうち最も優先度の高い必須格をさらに選択する構成としてもよい。この自動翻訳装置によれば、自然な翻訳文を、所望の表示形式で得ることができる。
また、本発明は、コンピュータ装置に、第1の言語で記述された原文を、第2の言語で記述された翻訳文へと翻訳する処理を実行させるプログラムであって、前記原文から、前記原文中に存在する代名詞あるいは代名詞句であって、前記第2の言語においては省略可能な代名詞あるいは代名詞句である必須格を抽出する必須格抽出ステップと、前記必須格抽出ステップにより抽出された必須格のうち、省略するものを選択する選択ステップと、前記選択ステップにより選択された必須格に対応する代名詞あるいは代名詞句を省略した翻訳文を出力する出力ステップとを有するプログラムを提供する。
本発明に係る自動翻訳装置によれば、自然な翻訳文を容易に得ることができる。
以下、図面を参照して本発明の実施形態について説明する。以下の実施形態においては、翻訳対象となる文章(以下、「原文」という)を記述する言語として英語を、翻訳後の文章(以下、「翻訳文」という)を記述する言語として日本語を用いる態様について説明する。また、第1実施形態においては、省略する必須格を使用者が選択する態様について、第2実施形態においては、省略する必須格を自動翻訳装置1が自動的に選択する態様について説明する。
<第1実施形態>
図1は、本発明の一実施形態に係る自動翻訳装置1の機能構成を示す図である。自動翻訳装置1の使用者は、入力部11から原文である英語文書をデータとして入力する。入力された原文は、必須格抽出部12において意味解析処理を施され、必須格が抽出される。必須格抽出部12において意味解析処理を施された原文は、翻訳部13において辞書15を参照しつつ日本語に翻訳される。翻訳部13において生成された翻訳文である日本語文書は、表示部16により表示される。使用者は、指示入力部14から操作入力を行うことにより、削除する必須格を選択する。必須格が削除された翻訳文は、表示部16に表示される。使用者は、指示入力部14から操作入力を行うことにより、翻訳文を確定する。確定された翻訳文は、出力部17より出力される。
図1は、本発明の一実施形態に係る自動翻訳装置1の機能構成を示す図である。自動翻訳装置1の使用者は、入力部11から原文である英語文書をデータとして入力する。入力された原文は、必須格抽出部12において意味解析処理を施され、必須格が抽出される。必須格抽出部12において意味解析処理を施された原文は、翻訳部13において辞書15を参照しつつ日本語に翻訳される。翻訳部13において生成された翻訳文である日本語文書は、表示部16により表示される。使用者は、指示入力部14から操作入力を行うことにより、削除する必須格を選択する。必須格が削除された翻訳文は、表示部16に表示される。使用者は、指示入力部14から操作入力を行うことにより、翻訳文を確定する。確定された翻訳文は、出力部17より出力される。
図2は、自動翻訳装置1のハードウェア構成を示す図である。CPU(Central processing Unit)21は、メモリ26を作業領域として、HDD(Hard Disk Drive)22に記憶されたプログラムを実行することにより、上述の必須格抽出部12、翻訳部13に対応する機能を実現する。HDD22は、意味解析処理および翻訳処理を行うプログラムの他、翻訳処理の際に使用する辞書15の辞書データ等の各種データを記憶する。使用者は、入力部11および指示入力部14に対応するキーボード23、マウス24等の入力装置を介して、あるいは、他の機器からI/F25を介して、自動翻訳装置1に文書や指示を入力あるいはデータとして出力する。入力された文書(原文)および翻訳後の文書(翻訳文)は、表示部16に対応するディスプレイ27に表示される。各構成要素はバス28で接続されており、相互にデータあるいは信号の入出力を行うことができる。本実施形態においては、HDD22に翻訳プログラムが記憶されており、使用者の指示によりCPU21は翻訳プログラムを実行する。これにより、翻訳装置としての機能が実現される。
本実施形態において、必須格抽出部12における意味解析処理には、LFG(Lexical Functional Grammar)文法理論に基づく手法が用いられる。LFGの詳細については、例えば、R. M. Kaplan,J. Bresnan著,「Lexical-Functional Grammar: A Formal System for Grammatical Representation(The MIT Press,(1982),Reprinted in Formal Issues in Lexical-Functional Grammar,pp. 29-130. CSLI publications,Stanford University(1995))およびこの論文中の引用文献に記載されている。また、日本語におけるLFGによる意味解析処理の詳細については、例えば、増市博・大熊智子著,「Lexical Functional Grammarに基づく実用的な日本語解析システムの構築」、(自然言語処理,Vol.10,No.2,pp. 79-109,言語処理学会,2003)に記載されている。
LFGに基づく意味解析においては、解析対象の文章に対して、その係り受け関係を示す構文構造だけでなく、格構造(主格、目的格等)、時制、様相、態(能動態、受動態)、話法などの多様な情報を抽出することができる。これらの情報は、functional structure(以下、「f−structure」という)と呼ばれる、属性と属性値からなるマトリックス構造として出力される。図3(A)および図3(B)は、LFGに基づく意味解析結果(f−structure)を例示する図である。図3(A)は、「ジョンはその本をテーブルに置いた。」という日本語文に対する意味解析結果(f−structure)を示す図である。図3(B)は、この文と同一の意味を有する英語文「John put a book on the table.」に対する意味解析結果(f−structure)を示す図である。詳細は前述の文献に記載されているが、f−structureにおいては、[]で囲まれた要素のうち最も左側に記載されているのが属性であり、その右側に記載されているのいるのがその属性の属性値である。図3(A)および図3(B)に示されるように、LFGは、言語が異なっていても、同じ意味を有する文に対しては基本的に同じ構造の意味解析結果(f−structure)を得ることができるという特徴を有している。
図4は、本実施形態に係る自動翻訳装置1の動作、すなわち、翻訳プログラムの動作を示すフローチャートである。また、図5は、表示部16に表示される翻訳プログラムの実行画面30を例示する図である。まず、使用者は、自動翻訳装置1の図示しないスタートボタンを押す等の方法により、翻訳プログラムの実行指示を入力する。翻訳プログラムの実行指示が入力されると、CPU21は、HDD22から翻訳プログラムを読み出して実行する。翻訳プログラムにより自動翻訳装置1の内部には、前述の各機能構成部が仮想的に形成される。ディスプレイ27には、翻訳プログラムの実行画面30が表示される。また、HDD22には、LFGに従った意味解析処理に基づいて必須格を抽出するルールである必須格抽出ルールが記憶されている。
図5に示されるように、実行画面30は、原文を表示する原文ウインドウ31と、その翻訳文を表示する翻訳文ウインドウ32と、使用者が指示入力を行うためのツールバー33とを有する。ツールバー33は、ファイルの入出力を指示するファイルボタン34と、翻訳処理の実行を指示する翻訳ボタン35と、翻訳文の表示書式、出力形式等を変更する書式ボタン36と、翻訳を確定して出力処理の一態様である印刷の実行を指示する印刷ボタン37とを有する。使用者はマウス24、キーボード23等を操作することにより画面中のカーソル39を移動させ、マウスボタンを押してツールバー33上のボタンを押すことにより、翻訳プログラム(自動翻訳装置1)に対し指示を入力する。使用者が書式ボタン36を押すと、書式変更処理が開始され、図6に示されるようなサブウインドウ38が表示される。サブウインドウ38には、フォント(書体)、フォントサイズ、用紙サイズ、文字数等を指定するためのフィールドが設けられており、使用者が各フィールドをクリックし、プルダウンメニューから所望の属性値を選択する、あるいはキーボード23等から属性値を入力する等の方法により、これらの属性で指定される表示形式、出力形式を変更することができる。使用者が「OK」ボタンを押すと、これらの書式の属性および属性値が書式指定データとしてHDD22に記憶される。
以下、図4、図5を参照して自動翻訳装置1の動作について説明する。使用者は、ファイルボタン34をクリックし、原文ファイルの読み込みを指示する。CPU21は、ファイル名等で指定される原文の文書ファイルをHDD22から読み出し、メモリ26に記憶する(ステップS101)。CPU21は実行画面30中の原文ウインドウ31に原文を表示させる。
続いて、使用者は、翻訳ボタン35をクリックし、翻訳処理を指示する。翻訳処理が指示されると、CPU21は、原文から必須格を抽出する。この処理は、機能構成上の必須格抽出部12の機能に対応する。具体的には、CPU21は、HDD22から必須格抽出ルールを読み出し、原文に対しLFGに基づく意味解析処理を施す。LFGに基づく意味解析処理により、図3(B)に示されるように、原文を構成する語(句)に対し、各種の属性および属性値が抽出される。抽出される属性および属性値には、その語(句)が代名詞(句)であることを示す情報が含まれる。CPU21は、代名詞の属性を有する語(句)を必須格と判断する。CPU21は、原文を構成する語(句)のデータうち、必須格に相当するものを抽出し(ステップS102)、その語(句)が必須格に相当する旨を示す識別子を付加する。続いてCPU21は、このようにして意味解析が施され、必須格に識別子が付加された原文のデータに対し翻訳処理を実行する(ステップS103)。この処理は、機能構成上の翻訳部13に対応する。すなわち、CPU21は、周知の翻訳アルゴリズムに従って、HDD22に記憶された辞書15を参照しつつ原文を日本語へと翻訳する。この際、CPU21は、必須格であることを示す識別子が付された語(句)の訳語のデータに、必須格であることを示す識別子、およびその必須格の要/不要を示すフラグを付加する。このフラグは、初期値は「要」に設定されている。CPU21は、原文のすべての翻訳を終えると、翻訳処理により生成された翻訳文のデータを実行画面30中の翻訳文ウインドウ32に表示させる。この際、CPU21は、書式指定データで指定される書式に従って翻訳文の表示を行う。また、CPU21は、必須格に対応する語(句)には、アンダーラインを付す、書体(フォント)を変更する、文字色を変更する、あるいは背景色を変更する等の手法により、使用者が必須格とそれ以外の部分とを区別できる態様で翻訳文を表示する(ステップS104)。なお、翻訳文を表示した後に書式の変更を行うことも可能である。
図5に示される例においては、翻訳文において必須格に対応する語(句)にはアンダーラインが付されている。使用者は、指示入力部14に相当するマウス24、キーボード23等を操作することにより、必須格の要/不要を変更することができる(ステップS105)。初期状態では、すべての必須格のフラグは「要」となっているが、使用者が例えばマウス24で必須格に対応する語(句)の部分にカーソルを合わせ、ボタンをクリックする等の手法によりフラグを変更する旨の指示入力を行うと、その旨を示す信号がマウス24からCPU21に出力される。CPU21は、その指示入力に応答してフラグを「不要」に書き換える。フラグが更新されると、CPU21は、更新した翻訳文のデータに基づいて、ディスプレイ27上に表示される実行画面30を更新する。CPU21は、フラグに基づいて語(句)の表示/非表示を切り替える機能を有している。すなわち、フラグが「不要」である語(句)は、実行画面30に表示されない。その代わりに、CPU21は、文中のその位置に省略された必須格(すなわちゼロ代名詞)が存在することを示す記号やマーク等を表示させる。使用者がこの記号等をクリックすると、語(句)のフラグが「要」に変更され、この場合はそれまで省略されていた必須格が再び表示される。
以上のようにして不必要な必須格を削除した後で、使用者はツールバー33上の印刷ボタン37をクリックする等の手法により、自動翻訳装置1に対して翻訳文を確定する旨の指示入力を行う。指示入力が行われると、その旨を示す信号がCPU21に出力される。CPU21は、指示入力された時点におけるフラグに基づいて翻訳文を確定する(ステップS106:YES)。すなわち、フラグが「不要」である語(句)のデータを削除して、翻訳文のデータを出力する(ステップS107)。具体的には、プリンタ等の出力装置を介して紙に翻訳文を印刷する。あるいは、使用者がファイルボタン34をクリックして翻訳文を確定する旨の指示入力を行った場合には、HDD等の記憶装置や、CD−ROM等の記録媒体にデータを記録することにより確定した翻訳文の出力処理を行う。翻訳文が確定されない場合(ステップS106:NO)は、ステップS105〜ステップS106の処理をくり返す。
本実施形態によれば、翻訳文において省略可能な必須格が提示されるため、使用者は必須格のうち不要と考えるものを削除することができる。これにより、使用者は、より自然な翻訳文を得ることができる。また、使用者はディスプレイ27等の表示部16に表示された翻訳文を見ながら必須格の省略/非省略を選択することができるので、所望のレイアウトに収まる翻訳文を簡単に得ることができる。
<第2実施形態>
第2実施形態においては、自動翻訳装置1は、省略する必須格を自動的に選択する機能を有する。すなわち、本実施形態において、HDD22は、複数の必須格に省略可能な優先度を付すルールを記述したルールベースを記憶している。具体的には、ルールベースには、例えば、「同一文中では登場する順番に優先度を付す。」、「同一段落中、第1番目の主格代名詞は省略しない。」というようなルールが記述されている。
第2実施形態においては、自動翻訳装置1は、省略する必須格を自動的に選択する機能を有する。すなわち、本実施形態において、HDD22は、複数の必須格に省略可能な優先度を付すルールを記述したルールベースを記憶している。具体的には、ルールベースには、例えば、「同一文中では登場する順番に優先度を付す。」、「同一段落中、第1番目の主格代名詞は省略しない。」というようなルールが記述されている。
図7は本実施形態に係る自動翻訳装置1の動作を示すフローチャートである。原文のデータを入力し(ステップS201)、ディスプレイ27に表示するまでの動作は第1実施形態と同一であるので説明を省略する。使用者が翻訳ボタン35を押し、翻訳処理の実行を指示すると、第1実施形態と同様に、必須格抽出処理が行われる(ステップS202)。すなわち、CPU21は、原文を構成する語(句)のデータうち、必須格に相当するものを抽出し、その語(句)が必須格である旨を示す識別子を付加する。本実施形態においては、さらに、必須格のデータに、省略優先度を示す情報が付加される。すなわち、CPU21は、ルールベースに記述されたルールに基づいて、必須格に省略優先度を付加する(ステップS203)。
図8は、本実施形態に係る優先度付加処理を説明する図である。図8に示す例では、原文として、「She went shopping with her mother. She put her arm through her mother's」という文が入力されている(図8(A))。図9は、この原文の第2文に対しLFGに基づく意味解析処理を施した結果(f−structure)を示す図である。必須格抽出処理により、原文から、「(a)She went shopping with (b)her mother. (c)She put (d)her arm through (e)her mother's」というように、(a)〜(e)の5つの必須格が抽出される(図8(B))。CPU21は、これらの必須格に対し、ルールベースに基づいて削除優先度を付す。まず、「同一段落中、第1番目の主格代名詞は省略しない。」というルールに基づき、CPU21は、この例における第1番目の主格代名詞「(a)She」の優先度を「0」に設定する。ここで、「優先度0」は「削除不可」を意味する。さらに、CPU21は、「同一文中では登場する順番に優先度を付す。」というルールに基づき、「(0)She went shopping with (1)her mother. (1)She put (2)her arm through (3)her mother's」というように各必須格に対して優先度を付加する(図8(C))。優先度は、データとして各語のデータに付加される。
優先度の付加が完了すると、CPU21は、第1実施形態と同様に翻訳処理を行う(ステップS204)。すなわち、翻訳と同時に、各必須格に対してフラグの設定が行われる。フラグは、初期値は「要」に設定される。CPU21は、まず、書式指定データにより翻訳文の文字数が指定あるいは制限されているか判断する。文字数が指定あるいは制限されていると判断された場合は、CPU21は、翻訳文の文字数が書式指定データにより指定される文字数に適合するように、必須格の削除を行う(ステップS205)。具体的には、CPU21は、翻訳文の文字数と、書式指定データで指定される制限文字数とを比較する。翻訳文の文字数が制限文字数を超える場合は、CPU21は、まだ省略されていない必須格のうち最も高い優先度を有するものを省略する。すなわち、優先度1の必須格のフラグを「不要」に変更する。フラグを変更した後、CPU21は、再び書式指定データにより指定される制限文字数と、翻訳文の文字数とを比較する(ステップS206)。CPU21は、翻訳文の文字数をカウントする際には、省略する必須格に対応する語(句)の文字数はカウントしない。翻訳文の文字数が制限文字数を超える場合(ステップS206:NO)は、CPU21は、まだ省略されていない必須格のうち最も高い優先度を有するものを省略する(ステップS205)。すなわち、優先度1の必須格のフラグを「不要」に変更する。以下、同様の処理を、翻訳文の文字数が書式指定データにより指定される文字数に適合(ステップS206:YES)するまで繰り返す。CPU21は、以上のように書式指定データにより指定される文字数に適合した翻訳文を、ディスプレイ27に表示する(ステップS207)。
書式指定データにより翻訳文の文字数が指定あるいは制限されていないと判断された場合は、CPU21は翻訳文をデフォルトで指定される書式に適合させる。HDD22は、デフォルトの書式を指定するデフォルト書式指定データを記憶しており、CPU21はデフォルト書式指定データをHDD22から読み出し、上述と同様に翻訳文をデフォルトの書式に適合させるように、省略する必須格の選択を行う。CPU21は、以上のようにデフォルト書式指定データにより指定される文字数に適合した翻訳文を、実行画面30に表示する。
なお、デフォルト書式データは、文字数等を指定するものに限られず、「すべての必須格を省略する」、「優先度2以上の必須格を省略する」等、省略する必須格を指定するものであってもよい。
なお、デフォルト書式データは、文字数等を指定するものに限られず、「すべての必須格を省略する」、「優先度2以上の必須格を省略する」等、省略する必須格を指定するものであってもよい。
使用者は、実行画面30に表示された翻訳文を見て、それでよいと思うときは、ファイルボタン34をクリックして翻訳文のデータをHDD22に保存する。あるいは、印刷ボタン37をクリックして翻訳文を印刷する。
実行画面30に表示される翻訳文は、第1実施形態と同様に、省略された必須格すなわちゼロ代名詞の位置には、必須格が省略されていることを示すマークが表示されている。使用者は、必須格を補った方がよいと考える場合は、該当箇所のマークをクリックすることにより、第1実施形態と同様に必須格の省略/非省略を切り替えることができる。
実行画面30に表示される翻訳文は、第1実施形態と同様に、省略された必須格すなわちゼロ代名詞の位置には、必須格が省略されていることを示すマークが表示されている。使用者は、必須格を補った方がよいと考える場合は、該当箇所のマークをクリックすることにより、第1実施形態と同様に必須格の省略/非省略を切り替えることができる。
なお、原文および翻訳文に用いる言語は上述の実施形態で説明したものに限られず、LFGを適用可能なあらゆる言語を用いることができる。
また、上述の第1および第2実施形態においては、原文に対して必須格抽出処理を行う態様について説明したが、翻訳文に対して必須格抽出処理を行う構成としてもよい。
また、上述の第1および第2実施形態においては、原文に対して必須格抽出処理を行う態様について説明したが、翻訳文に対して必須格抽出処理を行う構成としてもよい。
1…自動翻訳装置、11…入力部、12…必須格抽出部、13…翻訳部、14…指示入力部、15…辞書、16…表示部、17…出力部、21…CPU、22…HDD、23…キーボード、24…マウス、25…I/F、26…メモリ、27…ディスプレイ、28…バス、30…実行画面、31…原文ウインドウ、32…翻訳文ウインドウ、33…ツールバー、34…ファイルボタン、35…翻訳ボタン、36…書式ボタン、37…印刷ボタン、38…サブウインドウ
Claims (6)
- 第1の言語で記述された原文から、この原文中に存在する代名詞あるいは代名詞句であって、第2の言語で記述された翻訳文においては省略可能な代名詞あるいは代名詞句である必須格を抽出するルールを記憶する必須格抽出ルール記憶手段と、
前記第1の言語で記述された原文を記憶する原文記憶手段と、
前記必須格抽出ルールに記憶されたルールに基づいて、前記原文記憶手段に記憶された原文から必須格を抽出する必須格抽出手段と、
前記必須格抽出手段により抽出された必須格のうち、省略するものを選択する選択手段と、
前記原文記憶手段に記憶された原文に基づき、前記選択手段により選択された必須格に対応する代名詞あるいは代名詞句を省略した前記第2の言語による翻訳文を生成する生成手段と、
前記生成手段により確定された翻訳文を出力する出力手段と
を有する自動翻訳装置。 - 必須格抽出ルール記憶手段に記憶されたルールは、LFG(Lexical Functional Grammar)に従った意味解析処理に基づいて必須格を抽出するルールであることを特徴とする請求項1に記載の自動翻訳装置。
- 前記必須格抽出手段により抽出された必須格を提示する必須格提示手段と、
当該自動翻訳装置に対し指示入力を行う指示入力手段と
をさらに有し、
前記選択手段が、使用者の指示入力に基づいて省略する必須格を選択する
ことを特徴とする請求項2に記載の自動翻訳装置。 - 文章中に含まれる複数の必須格に、省略可能な優先度を付すルールを記述したルールベースを記憶するルールベース記憶手段と、
前記ルールベースに基づいて、前記複数の必須格の各々に優先度を付加する優先度付加手段と
をさらに有し、
前記選択手段が、前記優先度付加手段により付加された優先度に基づいて、省略する必須格を自動選択する
ことを特徴とする請求項2に記載の自動翻訳装置。 - 前記翻訳文の出力形式あるいは表示形式を指定する形式指定情報を記憶する形式情報記憶手段と、
前記生成手段により生成された翻訳文が前記形式指定情報で指定される出力形式あるいは表示形式に適合しているか判断する判断手段と、
をさらに有し、
前記選択手段が、まず優先度の最も高い必須格を選択し、前記判断手段による判断結果が否定的な場合に、選択されていない必須格のうち最も優先度の高い必須格をさらに選択する
ことを特徴とする請求項4に記載の自動翻訳装置。 - コンピュータ装置に、第1の言語で記述された原文を、第2の言語で記述された翻訳文へと翻訳する処理を実行させるプログラムであって、
前記原文から、前記原文中に存在する代名詞あるいは代名詞句であって、前記第2の言語においては省略可能な代名詞あるいは代名詞句である必須格を抽出する必須格抽出ステップと、
前記必須格抽出ステップにより抽出された必須格のうち、省略するものを選択する選択ステップと、
前記選択ステップにより選択された必須格に対応する代名詞あるいは代名詞句を省略した翻訳文を出力する出力ステップと
を有するプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004126821A JP2005309832A (ja) | 2004-04-22 | 2004-04-22 | 自動翻訳装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004126821A JP2005309832A (ja) | 2004-04-22 | 2004-04-22 | 自動翻訳装置およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005309832A true JP2005309832A (ja) | 2005-11-04 |
Family
ID=35438534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004126821A Pending JP2005309832A (ja) | 2004-04-22 | 2004-04-22 | 自動翻訳装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005309832A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200044353A (ko) * | 2018-10-19 | 2020-04-29 | 브로콜릭 주식회사 | 사용자 맞춤형 언어 컨텐츠 제공 방법, 서버 및 프로그램 |
-
2004
- 2004-04-22 JP JP2004126821A patent/JP2005309832A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200044353A (ko) * | 2018-10-19 | 2020-04-29 | 브로콜릭 주식회사 | 사용자 맞춤형 언어 컨텐츠 제공 방법, 서버 및 프로그램 |
KR102227569B1 (ko) * | 2018-10-19 | 2021-03-12 | 브로콜릭 주식회사 | 사용자 맞춤형 언어 컨텐츠 제공 방법, 서버 및 프로그램 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Anthony | AntConc (Windows, Macintosh OS X, and Linux) | |
JP2003223437A (ja) | 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム | |
US7793224B1 (en) | Methods and apparatus for formatting identified content | |
US6976214B1 (en) | Method, system, and program for enhancing text composition in a text editor program | |
CN109445900B (zh) | 用于图片显示的翻译方法和装置 | |
JP2005309832A (ja) | 自動翻訳装置およびプログラム | |
JP5016333B2 (ja) | 文書作成支援装置及び文書作成支援プログラム | |
JP2003178087A (ja) | 外国語電子辞書検索装置および方法 | |
JP2020057213A (ja) | 電子辞書装置、電子辞書の検索方法及び制御プログラム | |
JP5073423B2 (ja) | 訳語検索支援装置、訳語検索支援方法および訳語検索支援プログラム | |
JP2011044031A (ja) | 電子辞書、辞書検索方法、辞書検索プログラム | |
JP2007094722A (ja) | 機械翻訳装置 | |
JP2006012188A (ja) | 文書処理方法及び装置 | |
JP3952009B2 (ja) | 翻訳メモリシステム、翻訳方法、および翻訳メモリシステム用プログラム | |
JP3692711B2 (ja) | 機械翻訳装置 | |
JP2723886B2 (ja) | 機械翻訳装置及びその翻訳規則作成方法 | |
JP2008090247A (ja) | 和訳ローマ字略語を付加したゲルマン語群言語の辞書。 | |
JP3206600B2 (ja) | 文書生成装置 | |
JP2006107261A (ja) | 翻訳支援システム | |
JP2002041516A (ja) | 機械翻訳装置、機械翻訳方法及び機械翻訳プログラムを記憶したコンピュータ読み取り可能な記憶媒体 | |
JP2005165690A (ja) | 文書作成装置、文書作成方法、および文書作成プログラム | |
JPH0778166A (ja) | 翻訳方法及び機械翻訳装置 | |
JPS61229161A (ja) | 文書作成編集装置 | |
JPH09274615A (ja) | 文体変換装置 | |
JPH07191995A (ja) | 機械翻訳装置 |