JP2003330926A - 翻訳方法、翻訳装置及び翻訳プログラム - Google Patents

翻訳方法、翻訳装置及び翻訳プログラム

Info

Publication number
JP2003330926A
JP2003330926A JP2002138930A JP2002138930A JP2003330926A JP 2003330926 A JP2003330926 A JP 2003330926A JP 2002138930 A JP2002138930 A JP 2002138930A JP 2002138930 A JP2002138930 A JP 2002138930A JP 2003330926 A JP2003330926 A JP 2003330926A
Authority
JP
Japan
Prior art keywords
language
translation
rule
word
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002138930A
Other languages
English (en)
Inventor
Hajime Uchino
一 内野
Naruhiro Ikeda
成宏 池田
Kura Furuse
蔵 古瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002138930A priority Critical patent/JP2003330926A/ja
Publication of JP2003330926A publication Critical patent/JP2003330926A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】本発明の課題は、特に外部の文生成処理を必要
とせずに原言語文を正しく翻訳できるようにテンプレー
トを記述でき、テンプレート記述者が意図した翻訳結果
を得ることができる翻訳方法を提供することにある。 【解決手段】本発明は、原言語で記載されたテキスト文
の単語分割を行い、その単語並びとあらかじめ用意され
た複数の翻訳テンプレートパターンとの照合を行い、そ
の結果に基づいて上記テキストの翻訳を行なう、テンプ
レートに基づく翻訳方法であって、上記翻訳テンプレー
トパターンは、原言語パターンと、翻訳文の目的言語パ
ターンと、目的言語制約条件と、要素翻訳方法とによっ
て構成され、原言語と目的言語の対訳辞書11、目的言
語の単語の文法属性を記述した単言語辞書10を備え、
目的言語制約条件と、要素翻訳方法と対訳辞書11と単
言語辞書10の情報から文生成を行なうことを特徴とす
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は機械翻訳システムに
関し、特にテンプレートを用いて翻訳を行う翻訳方法、
翻訳装置及び翻訳プログラムに関する。
【0002】
【従来の技術】従来の一般機械翻訳方式では、入力文を
全て、解析処理、変換処理および文生成処理という各過
程を経て翻訳していた。この翻訳方式においてあらゆる
文を処理した場合、特に挨拶や定型文などについては翻
訳しにくく、不自然な訳文を生成し、全体としての翻訳
品質を落す原因となっている。また、ユーザが意図した
特定の訳を得ることは困難である。
【0003】これを解決するために、文を定型的パター
ンとしてとらえて、変更可能である要素を定め、要素部
分のみを翻訳して入れ換えることによって翻訳を行うテ
ンプレート翻訳方式が用いられる。
【0004】
【発明が解決しようとする課題】しかし、従来のテンプ
レート翻訳では、事前に対象となる原言語および目的言
語を定め、テンプレートの要素置き換えに記述できない
文法要素をその言語に関する文生成処理や翻訳処理を利
用して翻訳しており、新しい言語にテンプレート翻訳方
式を適用する際には、生成処理や翻訳処理を新たに作成
しなければならない。たとえば、日本語から英語に翻訳
するシステムを作成する場合には、英語の文生成処理や
日英の翻訳処理を作成する必要がある。
【0005】また、特開平5−290082号公報のよ
うに原言語、目的言語をできる限りパターンとして捉
え、自然言語以外の翻訳にも適用できるようにした方式
もある。この方式の場合、機械翻訳を併用するか、また
は要素の数を区別したパターンを準備すれば、動詞の変
化に対応できるとしている。
【0006】しかしながら、ユーザの目的とした訳を得
るという観点からみた場合、要素数の区別だけでは不十
分である。
【0007】例えば、ユーザが冠詞aまたはanをつけ
た名詞の訳を得たいとする時は、要素数だけでパターン
を変えることは不可能である。
【0008】また、特開平11−85753号公報のよ
うに、中間言語を用いることで新しい言語が加えられた
場合に作成する処理を少なくする方法もあるが、この場
合でも中間言語と新言語の間に、文法的な生成処理が必
要となる。
【0009】また、「フランスは5得点で勝利」“Fr
ance wins easilywith 5 go
als”といった翻訳例からルールを作成する場合、上
記いずれのテンプレート翻訳方式を用いたとしても、
「フランスは5得点で勝利」「フランスは1得点で勝
利」といった文章を“France wins eas
ily with 5 goals”“France
wins with 1goal”のように2通りに訳
し分けるルールを記述することは不可能である。
【0010】本発明は、以上の点を考慮してなされたも
のであり、特に外部の文生成処理を必要とせずに原言語
文を正しく翻訳できるようにテンプレートを記述でき、
テンプレート記述者が意図した翻訳結果を得ることがで
きる翻訳方法、翻訳装置及び翻訳プログラムを提供する
ことを目的とする。
【0011】
【課題を解決するための手段】上記目的を達成するため
に本発明は、原言語で記載されたテキスト文の単語分割
を行い、その単語並びとあらかじめ用意された複数の翻
訳テンプレートパターンとの照合を行い、その結果に基
づいて上記テキストの翻訳を行なう、テンプレートに基
づく翻訳方法であって、上記翻訳テンプレートパターン
は、原言語パターンと、該原言語パターンに対する翻訳
文の目的言語パターンと、原言語内で置換可能な部分を
変数とした場合の各変数の関連や属性情報を記述する目
的言語制約条件と、原言語の各変数部分を翻訳し目的言
語パターンの変数と結びつけるかを記述した要素翻訳方
法とによって構成され、原言語と目的言語の対訳辞書、
目的言語の単語の文法属性を記述した単言語辞書を備
え、目的言語制約条件と、要素翻訳方法と対訳辞書と単
言語辞書の情報から文生成を行なうことを特徴とする。
【0012】また本発明は、原言語で記載されたテキス
ト文の単語分割を行い、その単語並びとあらかじめ用意
された複数の翻訳テンプレートパターンとの照合を行
い、その結果に基づいて上記テキストの翻訳を行なう、
テンプレートに基づく翻訳方法であって、上記翻訳テン
プレートパターンは、原言語パターンと、該原言語パタ
ーンに対する翻訳文の目的言語パターンと、原言語内で
置換可能な部分を変数とした場合の各変数の関連や属性
情報を記述する目的言語制約条件と、原言語の各変数部
分を翻訳し目的言語パターンの変数と結びつけるかを記
述した要素翻訳方法と、原言語パターンの変数部に対す
る数値条件及び大小関係を記述する原言語制約条件とに
よって構成され、原言語と目的言語の対訳辞書、目的言
語の単語の文法属性を記述した単言語辞書を備え、原言
語パターン照合に加えて原言語パターンの変数部分の数
値条件の確認を行なった結果に基づいて、翻訳テンプレ
ートパターンを決定し、目的言語制約条件と要素翻訳方
法と対訳辞書と単言語辞書の情報から文生成を行なうこ
とを特徴とする。
【0013】また本発明は、前記翻訳方法において、単
語並びと複数のテンプレートパターンとの照合に、入力
文の形態素解析による単語列を入力文とし、原言語パタ
ーンを構成する単語列を用例文とし、各文間における単
語間組み合わせから文マッチングスコアとして属性が一
致するほど高いスコアを与え、スコアを重み付け加算す
ることにより求めた類似度を用いて対応部分を決定する
ことを特徴とする。
【0014】また本発明の翻訳装置は、翻訳すべき原言
語および目的言語の指定を行なう翻訳言語対入力部と、
翻訳すべきテキストを入力する原文入力部と、前記原文
入力部から入力されたテキストを、記憶手段に記憶され
ている原言語に対する言語別単言語辞書を用いて単語に
分割する各言語用単語分割部と、原単語表記とその属性
の組による列である原言語パターン、前記原言語パター
ンに対する翻訳文の単語表記とその属性の組による列で
ある目的言語パターン、原言語表現における単語間表記
の制約条件を示す原言語制約条件、目的原語における表
記と属性の組の制約条件を示す目的言語制約条件、原言
語単語から目的言語単語への規則を示す要素翻訳方法よ
り構成されるテンプレートを言語毎に格納して記憶手段
に記憶される言語別ルール蓄積部と、前記各言語用単語
分割部から入力された単語を、前記言語別ルール蓄積部
を用いて、単語列とテンプレートルールの照合を行なう
ルール検索部と、前記ルール検索部により検索されたテ
ンプレートルールを基に適用ルールを選択するルール適
用部と、前記ルール適用部からの各言語の数値と一般的
数値表現を変換する数値変換部と、前記ルール適用部か
らの適用ルールに従い、前記数値変換部、記憶手段に記
憶され目的言語に対する言語別単語辞書、記憶手段に記
憶され原言語と目的言語の対が記録された対訳辞書を用
い、ルール内の要素翻訳方法、目的言語制約条件を基
に、目的言語パターン内の変数部の内容を決定し、翻訳
文を生成する訳文生成部と、前記訳文生成部で生成され
た翻訳結果を出力する訳文出力部とを具備することを特
徴とするものである。
【0015】また本発明の翻訳プログラムは、原文入力
部から入力された翻訳すべきテキストを、原言語に対す
る言語別単言語辞書を用いて単語に分割する各言語用単
語分割手順、原単語表記とその属性の組による列である
原言語パターン、前記原言語パターンに対する翻訳文の
単語表記とその属性の組による列である目的言語パター
ン、原言語表現における単語間表記の制約条件を示す原
言語制約条件、目的原語における表記と属性の組の制約
条件を示す目的言語制約条件、原言語単語から目的言語
単語への規則を示す要素翻訳方法より構成されるテンプ
レートが言語毎に格納された言語別ルール蓄積部を用
い、前記各言語用単語分割手順で分割された単語の単語
列とテンプレートルールの照合を行なうルール検索手順
と、前記ルール検索手順により検索されたテンプレート
ルールを基に適用ルールを選択するルール適用手順、前
記ルール適用手順からの各言語の数値と一般的数値表現
を変換する数値変換手順、前記ルール適用手順からの適
用ルールに従い、前記数値変換手順、目的言語に対する
言語別単語辞書、原言語と目的言語の対が記録された対
訳辞書を用い、ルール内の要素翻訳方法、目的言語制約
条件を基に、目的言語パターン内の変数部の内容を決定
し、翻訳文を生成する訳文生成手順、前記訳文生成手順
で生成された翻訳結果を出力する訳文出力手順をコンピ
ュータに実行させるためのものである。
【0016】本発明は、言語に依存する処理と言語に依
存しない処理をできる限り切り離し、処理全体を構成す
ることを特徴とする。
【0017】また、上記特徴に加え、テンプレートルー
ルにおいて変数部分となる数値部分に対して、数値間の
大小関係や、数値出力状態を記述しておき、数値間の関
連を判断してルールを適用することを特徴とする。
【0018】数値間の大小関係を記述することにより、
数値が特定の値より大きい場合に翻訳結果を変えるとい
ったことが可能となる。
【0019】
【発明の実施の形態】以下図面を参照して本発明の実施
形態例を詳細に説明する。
【0020】図1は本発明による多言語翻訳装置の第1
の実施形態例を示す構成説明図である。図1において、
1は翻訳すべき原言語および目的言語の指定を行なう翻
訳言語対入力部、2は翻訳すべきテキストを入力する原
文入力部、3は入力されたテキストを単語に分割する各
言語用単語分割部、4は単語列とテンプレートルールの
照合を行なうルール検索部、5は記憶手段に記憶される
原言語に対する言語別単言語辞書であり、例えば表記、
品詞、原形、性別、数、主語の人称などの情報が格納さ
れる。6は記憶手段に記憶されるテンプレートルールを
言語対毎に格納する言語別ルール蓄積部、7は各言語の
数値と一般的数値表現を変換する数値変換部、8はルー
ルを適用するルール適用部、9は適用されたルールに従
って訳文を生成する訳文生成部、10は記憶手段に記憶
される目的言語に対する言語別単言語辞書であり、例え
ば表記、品詞、原形、性別、数、主語の人称などの情報
が格納される。11は記憶手段に記憶される原言語と目
的言語の対が記録された対訳辞書、12は翻訳結果を出
力する訳文出力部、13はルールに当てはまらなかった
文を翻訳する一般翻訳部である。
【0021】以下、「日本はフランスと二対二の引き分
け」という文が原文として入力された例で、日本語から
フランス語に翻訳する場合のシステムの動作を説明す
る。
【0022】まず翻訳言語対入力部1に対し、翻訳を行
なう原言語、目的言語をペアで指定する。日本語からフ
ランス語に翻訳する場合は原言語を日本語、目的言語を
フランス語と指定する。翻訳言語対入力部1は指定され
た原言語、目的言語の情報により、各言語用単語分割部
3として日本語の単語分割手段を選択し、言語別単言語
辞書5に日本語単言語辞書を選択する。また言語別ルー
ル蓄積部6、対訳辞書11には日英のテンプレートルー
ル集、対訳辞書を選択し、言語別単言語辞書10には、
英語単言語辞書を選択する。数値変換部7、一般翻訳部
13には、原言語が日本語、目的言語がフランス語であ
ることを通知する。
【0023】別の原言語、目的言語の場合でも同様に翻
訳言語対入力部1に指定すれば、上記の言語依存部分に
対する設定および通知が行なわれる。
【0024】次に原文入力部2により翻訳対象文として
「日本はフランスと二対二の引き分け」という文が入力
され、各言語用単語分割部3に送られる。
【0025】各言語用単語分割部3では日本語の単語を
分割する手段として形態素解析処理が使われているもの
とするが、特に形態素解析処理である必要はなく、後に
変数部分として扱う単語が認識されていれば、単に数値
部分や、固有名詞を認識する手段でもかまわない。単語
分割処理には、言語別単言語辞書5を使用する。ここで
言語別単言語辞書5には翻訳言語対入力部1への入力に
よって日本語辞書が指定されている。
【0026】日本語形態素解析の結果、図2のような単
語分割および属性付与の処理が行なわれたものとする。
形態素解析処理の結果はルール検索部4に送られる。
【0027】ルール検索部4では言語別ルール蓄積部6
から翻訳に使用するテンプレートルールを検索する。
【0028】言語別ルール蓄積部6に蓄積されているテ
ンプレートルールは図3のように(ルールID、原言語
パターン、目的言語パターン、原言語制約条件、目的言
語制約条件、要素翻訳方法)のセットで構成される。原
言語制約条件をテンプレートルールの構成から除いて、
後述の制約の確認を行なわないことも可能であるが、そ
の場合、原言語の変数に対する数値条件や大小関係の確
認による訳し分けは出来なくなる。
【0029】ルールIDは一意となる任意の文字列であ
り、適合するルールが複数あった際などに辞書式順序を
優先度として決まるルールの選択に使用される。
【0030】原言語パターンには、単語表記の並びを可
変長の属性を付与して記述し、入れ替わる要素表記部分
を変数として変数番号をつけて記述することができる。
図3中の2においては$J1が変数となる。変数にあた
る$J1として原言語単語表記が代入される。属性には
品詞や、意味、性別など何を使用してもよいし、何も使
用しなくてもかまわない。
【0031】目的言語パターンには出力すべき文を記述
し、原言語の変数部を翻訳する語や、その属性によって
変形が必要な語を変数として変数番号を付けて記述す
る。図3の3では$F1が変数を示す。目的言語パター
ンの変数$F1として原言語表記$J1に対応する目的
単語表記を代入する。
【0032】原言語制約条件には原言語パターンで変数
となる要素の数値条件や、要素間の関係を記述する。要
素間の関係は、単語表記を要素とする要素間の制約条件
を定めるものである。例えば、英語では、主語が3人称
単数で動詞が現在形の場合には動詞にsを付加する。主
語が複数の場合にはsを付加する、ということである。
つまり、主語の人称・数が動詞の活用に対する制約条件
といえる。
【0033】図4は目的言語制約条件の一例である。
【0034】例えば、4−4−1は(表記:$f1s
品詞:定冠詞 性:$f2g 数:$f2n 原形:”
le”)となっているが、これは、「表記が$f1s、
品詞が定冠詞、 性が$f2g、 数が$f2n、
原形が”le”である単語」という制約条件である。
【0035】つまり4−4−1の$f1sは、2つの変
数$f2g(性)、$f2n(数)に依存していると見
ることができる。$f2g(性)、$f2n(数)は、
$j1s(日本)の訳語$f2sに関する属性で(4−
4−1,4−5−1参照)、対訳辞書を用いて$j1s
(日本)の訳語$f2s(Japon)がきまると仏語
単言語辞書(図7)から$f2g(男性)、$f2n
(単数)を決定する。4−4−1の$f2n,$f2g
の値が決まっているので、再び仏語単言語辞書(図7)
で「品詞:定冠詞 原形:le 性別:男性 数:単
数」を満たす語を検索すると表記が“le”の単語が検
索される。そして、$f2sが“le”となる。
【0036】目的言語制約条件には、目的言語パターン
で変数として記述されている要素の生成のための情報を
記述する。
【0037】要素翻訳方法には、原言語における変数部
をどのような手段で翻訳し、目的言語のどの変数に対応
付けるかを記述する。図3の5は、変数$J1を$F1
に辞書を用いて変換することを示している。ここでは日
仏単語辞書を用いて日本語単語$J1に対応する仏語単
語を$F1に代入する。翻訳方法においては、一般翻訳
部13が使用可能であれば、他の翻訳手段としてそれを
指定することも可能である。
【0038】ルール検索部4は、形態素解析結果と同様
の日本語パターンを持つテンプレートルールを各単語要
素を順に比較することによって、ルールの検索を行な
う。単語分割部3において形態素解析を行ない形態素解
析結果である原言語文の単語と品詞(属性)を分析し、
これをキーにして対応する原言語パターンと照合し、そ
のパターンを含むルールを決定する(図2)。決定した
ルールを翻訳処理の対象とする。ここで、形態素解析結
果と原言語パターンが照合するというのは、形態素解析
結果の各単語の全属性値が、ルールの原言語パターン
(図4,4−1)の各単語の属性値と一致する場合を言
う。ただし、属性値が変数になっている場合には、形態
素解析結果の属性値がどのような属性値でも照合させ
る。また、形態素解析結果の単語の属性が、対応する原
言語パターンの単語に付記されていない場合にもそれら
の単語は照合させる。
【0039】上記のルール検索の一例として以下のよう
に日本語の場合には助詞を手がかりにする方法もある。
例えば、 ルール1 (〜)(は)(〜)(と)…、ルール2
(〜)(が)(〜)(を)… ルール3 (〜)(は)(〜)(は)…、ルール4
(〜)(の)(〜)(に)… といったルールを用いて「私は彼に…」という文が入力
されたときに、「(〜)(は)(〜)(に)」という部
分をもって照合する。
【0040】場合によっては、変数となることのない助
詞などの単語の表記をキーとして、ハッシュ値によって
ルールをインデックス付けしておくなどの手法を用いる
ことで検索時間を短縮することが可能である。ここで
は、検索の各キーとなる助詞の組にハッシュ値を与え、
これを手がかりに検索を行う。例えば「の」「に」等の
助詞の組を一定の計算方法で数値化し、予めハッシュ値
Aを割り当てておき、ルール4につけて置く。
【0041】ルール1、2、3にもそれぞれ含まれる助
詞を数値化し、予めハッシュ値をつける。これを用い、
入力された文に含まれる助詞を同様に数値化した場合、
各要素を比較しなくても同じハッシュ値を持つルールの
みを検索する。
【0042】また、原言語パターンの類似性を求め、要
素を対応付ける手法でもある特願2000−56235
の手法を用いることにより、部分的に順序が異なるなど
各要素が完全には一致していない場合でも、変数となる
部分を対応付けることが可能であり、一定の類似度以上
の値を持つ原言語パターンを持つテンプレートルールを
検索することも可能であり、テンプレートパターンの適
用領域を拡大することができる。例えば「日本はフラン
スと二−二の引き分け」といった一文字だけが異なるよ
うな文であれば、「日本はフランスと二対二の引き分
け」を翻訳するためのテンプレートで翻訳することが可
能となる。なお、2文間の類似度計算方法として、ま
ず、入力文の形態素解析による単語列を図8の入力文と
し、原言語パターンを構成する単語列を用例文とし、各
文間における単語間組み合わせから文マッチングスコア
を図9に倣って属性が一致するほど高いスコアが与えら
れる。そして、スコアを重み付け加算することにより類
似度Wを求める。図8にある組み合わせにおいて左上の
ものから右下へ順に並んでいるものは、その部分におい
て両文間で語順が一致しているので、その部分全体のス
コアが重みづけされて類似度が計算される。この類似度
が高い原言語パターンをもつルールを選択することにな
る。
【0043】ルール検索部4によって文「日本はフラン
スと二対二の引き分け」の形態素解析結果を基に図4の
テンプレートルールが検索されたとする。この検索結果
を基にルール適用部8においてルールの適用が行なわれ
る。
【0044】ルール適用部8ではルール検索部4から送
られたすべてのルールに対し、以下のようにルールを確
認し、生成のための最終ルールを決定する。
【0045】ステップ8−1:原言語パターンの各変数
部にそれぞれ適合した語の表記を入れる。
【0046】ステップ8−2:変数の属性が数詞である
場合、その表記を数値変換部7に原言語からの変換であ
るという情報と、表記を送り、一般表現での数値を得て
(変数$J1に代入された数詞を、図5を用いて、アラ
ビア数字の「10000」を得る)、変数に代入する。
数値変換部7は翻訳言語対入力部1からの情報により、
すでに原言語の情報を得ているため、方向のみの情報
(原言語、目的言語が何語)を送ればよい。数値変換部
7での各言語間での数値の変換列を図5に示す。
【0047】ステップ8−3:原言語制約条件を確認
し、各変数が条件を満たしているかどうかを確認する。
【0048】ステップ8−3A:条件を満たしていない
場合、ルールは適用できないと判断し次のルールの確認
を行なう。
【0049】ステップ8−3B:条件を満たしている場
合、ルールの適用が可能と判断し最終候補リストに該当
ルールを加え、次のルールの確認を行なう。
【0050】上記ステップを全てのルールに行なった
後、最終候補リストに残ったルールのうち、ルールID
が辞書式順序でもっとも前にくるルールを適用ルールと
して選択し、変数への代入状況とともに訳文生成部9に
送る。
【0051】「日本はフランスと二対二の引き分け」の
例の場合、原言語パターン4−1との照合により$J1
Sには日本、$J2Sにフランス、$J3Sは2、$J
4Sは2と代入され、原言語制約条件4−3の$J3S
=$J4Sを満たしているため、ルールと上記代入結果
が訳文生成部9に送られる。
【0052】訳文生成部9では以下のステップを用い、
ルール内の要素翻訳方法、目的言語制約条件を基に、目
的言語パターン内の変数部の内容を決定し、訳文を生成
する。
【0053】ステップ9−1:要素翻訳方法の記述に基
づき、原言語パターン内の変数を翻訳する。翻訳方法に
辞書が指定されていれば、対訳辞書11を用いて翻訳
し、目的言語の変数に代入する。翻訳方法として数や序
数が指定されていれば、数値変換部7に目的言語への変
換であるという情報と、変数に代入されている一般表現
での数、数値か序数かの情報を送り、目的言語での数値
表現を得て、目的言語の変数に代入する。
【0054】ステップ9−2:目的言語制約条件に基づ
き要素の変形、生成を行なう。
【0055】ステップ9−2−1:これまでのステップ
により、すでに表記が定まっている要素がある場合、属
性の値として変数が使用されている場合、その単語を言
語別単言語辞書10によって辞書引きし、単語の属性を
得て、属性値の変数に代入する。
【0056】ステップ9−2−2:原形の情報が指定さ
れ、表記以外の属性値が全て決定した要素がある場合、
その属性値、及び原形を基に言語別単言語辞書10を辞
書引きし、表記の情報を得る。すなわち、人称、単数・
複数の区別や時制による適切な活用形(条件に見合った
語)を得る。
【0057】ステップ9−2−3:全ての要素の表記が
決定するか、変数への代入が発生しなくなるまで上記ス
テップを繰り返す。
【0058】ステップ9−3:ステップ9−1、および
ステップ9−2により、目的言語パターンに含まれる全
ての変数の表記が決定した場合、その表記を目的言語パ
ターンの変数の表記とし、訳文を生成する。生成の際に
図4、4−2に示すように文の先頭を大文字化する記号
CAPがついていれば先頭語の大文字化を行なう。
【0059】上記のステップによって要素の表記が決定
しない場合、基本的には訳文の生成に失敗したものとす
るが、翻訳の使用目的によっては、その時点で得られて
いる情報のみを、目的言語パターンの変数部に代入し、
途中段階での翻訳結果を出力することも可能である。例
えば、対訳辞書の準備がすんでいない場合などは、対訳
辞書による語の変換に失敗するが、その場合原言語の表
記をそのまま、目的言語の表記として採用し、処理を行
なうこともできる。また、原形の情報が言語別単言語辞
書10に欠けていたり、原言語の情報をそのまま採用し
たりした場合には、原形から当該語の情報を基に辞書引
きし表記を決定する処理が行なえないため、原形指定の
語は原形のまま出力することとなる。
【0060】上記ステップを「日本はフランスと二対二
の引き分け」の例に適用すると以下のようになる。
【0061】ステップ9−1により、$J1Sの「日
本」、$J2Sの「フランス」を対訳辞書11によって
辞書引きし、“Japon”、“France”の表記
を得て、$f2S、$f4Sに代入される。
【0062】対訳辞書11の最小限の構成例は日仏の例
を図6に示すように、原言語と目的言語の単語のペアで
あり、原言語の単語の品詞や意味によって訳し分けを行
ないたい場合には、そのための情報を付け加えておき、
対訳辞書引きの際に利用してもよい。
【0063】同様にステップ9−1により、$f5S、
$f6Sにはともに“2”が代入される。
【0064】ステップ9−2−1の適用前の目的言語制
約条件の状態は (表記:$f1s 品詞:定冠詞 性:$f2g 数:$f2n 原
形:“le”) (表記:Japon 品詞:固有名詞 性:$f2g 数:$f2
n) (表記:$f3s 品詞:定冠詞 性:$f4g 数:$f4n 原
形:“le”) (表記:France 品詞:固有名詞 性:$f4g 数:$f4
n) (表記:$f7s 品詞:動詞 TYPE:直説法 人称:3
数:$f2n 原形:“avoir”) となっており、表記の決定しているJaponを言語別
単言語辞書10によって引くことにより、属性 性:の
変数$f2gには「男性」が、数:$f2nには「単
数」、同様にFranceの辞書引き結果から$f4g
には「女性」、$f4nには「単数」が代入される。
【0065】言語別単言語辞書10は、その言語の単語
表記とその言語ごとの属性として、原形や品詞、性、
数、時制、主語の人称などが記述されているものとす
る。フランス語の単言語辞書の例を図7に示す。
【0066】ステップ9−2−1により、目的言語制約
条件の状態は (表記:$f1s 品詞:定冠詞 性:男性 数:単数 原
形:“le”) (表記:Japon 品詞:固有名詞 性:男性 数:単
数) (表記:$f3s 品詞:定冠詞 性:女性 数:複数 原
形:“le”) (表記:France 品詞:固有名詞 性:女性 数:複
数) (表記:$f7s 品詞:動詞 TYPE:直接法 人称:3
数:単数:BASE“avoir”) となり、ステップ9−2−2による原形からの単言語辞
書引きにより、$f1Sの表記は“le”、$f3Sの表
記は“la”、$f7Sの表記は“a”と決定される。
【0067】全ての表記が決定されたため、各変数を目
的言語パターンに埋め込み、先頭大文字化記号CAPに
したがって大文字化を行なって訳文出力部12に、「日
本はフランスと二対二の引き分け」の翻訳結果として、
“Le Japon a fait match nu
l 2−2 contre la Frnce”を出力
する。
【0068】同様に「アメリカはフランスと二対二の引
き分け」を翻訳した場合、冠詞及び動詞が変形され、
【数1】
【0069】といった訳出が行なわれる。
【0070】以上のように、入力された各言語のテキス
トを単語列に分割する単語分割部、各言語における数値
表現と一般的な数値表現の変換を行なう数値変換処理
部、変形情報などが記述される各言語の単言語辞書、原
言語と目的言語の単語の対訳が記述される対訳辞書を、
翻訳のために必須である言語に依存する要素として別構
成し、言語分割手段によって分割された単語列を、部分
的に変数化された原言語パターン及び目的言語パターン
を関連付けその変数部分に対する各種属性条件および変
数間の依存条件を記述するテンプレートルールと照合
し、変数間の関連により得られる単語生成時の属性情報
に基づいて単言語辞書、対訳辞書から情報を得ることに
よって訳文の生成を行なう。
【0071】各種属性の個数を、可変で、自由に定義で
きるようにすることで、単語分割手段には、一般に用い
られる形態素解析手段のみでなく、単純に数値部分や固
有名詞部分を認識するだけの手段を用いることもでき、
単言語辞書、対訳辞書から変形情報を得るため、特別な
文生成処理を用いることなく多言語の翻訳に適用でき
る。
【0072】例では日本語からフランス語への翻訳とし
て説明したが、別の言語に対しても、同様に変形情報や
制約条件などを記述し、文生成処理を作成せずに翻訳を
行なうことができる。
【0073】また、原言語制約条件に変数の数値条件や
関係を書くことを可能にしているため、「フランスは5
得点で勝利」「フランスは1得点で勝利」といった文章
を“France wins easily with
5 goals”“France wins wit
h 1 goal”と訳し分けたい場合変数部分が例え
ば1の場合、2〜3の場合、4以上の場合といった条件
をつけたルールを記述することにより、訳し分けを実現
することができる。
【0074】尚、図10、図11、図12に示すよう
に、各々目的言語パターンとして仏語(図10)のみな
らず、中国語(図11)、英語(図12)を用いること
ができ、いずれもテンプレート(データ種別、構成)が
言語によらず共通であり、記述内容が異なる多言語環境
に利用される。
【0075】また、前記各実施形態例における翻訳方法
は、具体的にはパソコン等のコンピュータのCPU等の
演算手段に予め所定の翻訳プログラムを通信回線もしく
はCD等の記録媒体からインストールし実行する。前記
翻訳プログラムはCD等の所定のコンピュータ読み取り
可能な記録媒体に記録することができる。
【0076】すなわち、本発明の実施形態例に係る翻訳
プログラムは、原文入力部から入力された翻訳すべきテ
キストを、原言語に対する言語別単言語辞書を用いて単
語に分割する各言語用単語分割手順、原単語表記とその
属性の組による列である原言語パターン、前記原言語パ
ターンに対する翻訳文の単語表記とその属性の組による
列である目的言語パターン、原言語表現における単語間
表記の制約条件を示す原言語制約条件、目的原語におけ
る表記と属性の組の制約条件を示す目的言語制約条件、
原言語単語から目的言語単語への規則を示す要素翻訳方
法より構成されるテンプレートが言語毎に格納された言
語別ルール蓄積部を用い、前記各言語用単語分割手順で
分割された単語の単語列とテンプレートルールの照合を
行なうルール検索手順と、前記ルール検索手順により検
索されたテンプレートルールを基に適用ルールを選択す
るルール適用手順、前記ルール適用手順からの各言語の
数値と一般的数値表現を変換する数値変換手順、前記ル
ール適用手順からの適用ルールに従い、前記数値変換手
順、目的言語に対する言語別単語辞書、原言語と目的言
語の対が記録された対訳辞書を用い、ルール内の要素翻
訳方法、目的言語制約条件を基に、目的言語パターン内
の変数部の内容を決定し、翻訳文を生成する訳文生成手
順、前記訳文生成手順で生成された翻訳結果を出力する
訳文出力手順をコンピュータに実行させるためのもので
ある。
【0077】
【発明の効果】以上述べたようにこの発明によれば、言
語依存部分と言語独立な部分を分割して構成し、テンプ
レートルール内に変数間の依存関係を記述することによ
り、特別な文生成処理を作成することなく、翻訳を行な
うことが可能であり、新たな言語間の翻訳システムを迅
速に作成することができる。また、原言語の制約条件に
おいて、変数の数値条件や、大小関係を書くことにより
細かな訳し分けが可能となる。
【図面の簡単な説明】
【図1】本発明の実施形態例による翻訳装置を示す構成
説明図である。
【図2】本発明の実施形態例による単語分割の例を示す
説明図である。
【図3】本発明の実施形態例によるルール形式を示す説
明図である。
【図4】本発明の実施形態例でのルール例を示す説明図
である。
【図5】本発明の実施形態例での各言語の数値変換の例
を示す説明図である。
【図6】本発明の実施形態例での日仏対訳辞書の例を示
す説明図である。
【図7】本発明の実施形態例でのフランス語単言語辞書
の例を示す説明図である。
【図8】本発明の実施形態例での文マッチングスコアの
計算例を示す説明図である。
【図9】本発明の実施形態例での単語マッチングスコア
の例を示す説明図である。
【図10】本発明の実施形態例に係る仏語の目的言語パ
ターンの例を示す説明図である。
【図11】本発明の実施形態例に係る中国語の目的言語
パターンの例を示す説明図である。
【図12】本発明の実施形態例に係る英語の目的言語パ
ターンの例を示す説明図である。
【符号の説明】
1 翻訳言語対入力部 2 原文入力部 3 各言語用単語分割部 4 ルール検索部 5 言語別単言語辞書 6 言語別ルール蓄積部 7 数値変換部 8 ルール適用部 9 訳文生成部 10 言語別単言語辞書 11 対訳辞書 12 訳文出力部 13 一般翻訳部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 古瀬 蔵 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B091 AA07 AB13 BA05 CA02 CA22 EA25

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 原言語で記載されたテキスト文の単語分
    割を行い、その単語並びとあらかじめ用意された複数の
    翻訳テンプレートパターンとの照合を行い、その結果に
    基づいて上記テキストの翻訳を行なう、テンプレートに
    基づく翻訳方法であって、上記翻訳テンプレートパター
    ンは、原言語パターンと、該原言語パターンに対する翻
    訳文の目的言語パターンと、原言語内で置換可能な部分
    を変数とした場合の各変数の関連や属性情報を記述する
    目的言語制約条件と、原言語の各変数部分を翻訳し目的
    言語パターンの変数と結びつけるかを記述した要素翻訳
    方法とによって構成され、原言語と目的言語の対訳辞
    書、目的言語の単語の文法属性を記述した単言語辞書を
    備え、目的言語制約条件と、要素翻訳方法と対訳辞書と
    単言語辞書の情報から文生成を行なうことを特徴とする
    翻訳方法。
  2. 【請求項2】 原言語で記載されたテキスト文の単語分
    割を行い、その単語並びとあらかじめ用意された複数の
    翻訳テンプレートパターンとの照合を行い、その結果に
    基づいて上記テキストの翻訳を行なう、テンプレートに
    基づく翻訳方法であって、上記翻訳テンプレートパター
    ンは、原言語パターンと、該原言語パターンに対する翻
    訳文の目的言語パターンと、原言語内で置換可能な部分
    を変数とした場合の各変数の関連や属性情報を記述する
    目的言語制約条件と、原言語の各変数部分を翻訳し目的
    言語パターンの変数と結びつけるかを記述した要素翻訳
    方法と、原言語パターンの変数部に対する数値条件及び
    大小関係を記述する原言語制約条件とによって構成さ
    れ、原言語と目的言語の対訳辞書、目的言語の単語の文
    法属性を記述した単言語辞書を備え、原言語パターン照
    合に加えて原言語パターンの変数部分の数値条件の確認
    を行なった結果に基づいて、翻訳テンプレートパターン
    を決定し、目的言語制約条件と要素翻訳方法と対訳辞書
    と単言語辞書の情報から文生成を行なうことを特徴とす
    る翻訳方法。
  3. 【請求項3】 請求項1又は2記載の翻訳方法におい
    て、単語並びと複数のテンプレートパターンとの照合
    に、入力文の形態素解析による単語列を入力文とし、原
    言語パターンを構成する単語列を用例文とし、各文間に
    おける単語間組み合わせから文マッチングスコアとして
    属性が一致するほど高いスコアを与え、スコアを重み付
    け加算することにより求めた類似度を用いて対応部分を
    決定することを特徴とする翻訳方法。
  4. 【請求項4】 翻訳すべき原言語および目的言語の指定
    を行なう翻訳言語対入力部と、 翻訳すべきテキストを入力する原文入力部と、 前記原文入力部から入力されたテキストを、記憶手段に
    記憶されている原言語に対する言語別単言語辞書を用い
    て単語に分割する各言語用単語分割部と、 原単語表記とその属性の組による列である原言語パター
    ン、前記原言語パターンに対する翻訳文の単語表記とそ
    の属性の組による列である目的言語パターン、原言語表
    現における単語間表記の制約条件を示す原言語制約条
    件、目的原語における表記と属性の組の制約条件を示す
    目的言語制約条件、原言語単語から目的言語単語への規
    則を示す要素翻訳方法より構成されるテンプレートを言
    語毎に格納して記憶手段に記憶される言語別ルール蓄積
    部と、 前記各言語用単語分割部から入力された単語を、前記言
    語別ルール蓄積部を用いて、単語列とテンプレートルー
    ルの照合を行なうルール検索部と、 前記ルール検索部により検索されたテンプレートルール
    を基に適用ルールを選択するルール適用部と、 前記ルール適用部からの各言語の数値と一般的数値表現
    を変換する数値変換部と、 前記ルール適用部からの適用ルールに従い、前記数値変
    換部、記憶手段に記憶され目的言語に対する言語別単語
    辞書、記憶手段に記憶され原言語と目的言語の対が記録
    された対訳辞書を用い、ルール内の要素翻訳方法、目的
    言語制約条件を基に、目的言語パターン内の変数部の内
    容を決定し、翻訳文を生成する訳文生成部と、 前記訳文生成部で生成された翻訳結果を出力する訳文出
    力部とを具備することを特徴とする翻訳装置。
  5. 【請求項5】 原文入力部から入力された翻訳すべきテ
    キストを、原言語に対する言語別単言語辞書を用いて単
    語に分割する各言語用単語分割手順、 原単語表記とその属性の組による列である原言語パター
    ン、前記原言語パターンに対する翻訳文の単語表記とそ
    の属性の組による列である目的言語パターン、原言語表
    現における単語間表記の制約条件を示す原言語制約条
    件、目的原語における表記と属性の組の制約条件を示す
    目的言語制約条件、原言語単語から目的言語単語への規
    則を示す要素翻訳方法より構成されるテンプレートが言
    語毎に格納された言語別ルール蓄積部を用い、前記各言
    語用単語分割手順で分割された単語の単語列とテンプレ
    ートルールの照合を行なうルール検索手順と、 前記ルール検索手順により検索されたテンプレートルー
    ルを基に適用ルールを選択するルール適用手順、 前記ルール適用手順からの各言語の数値と一般的数値表
    現を変換する数値変換手順、 前記ルール適用手順からの適用ルールに従い、前記数値
    変換手順、目的言語に対する言語別単語辞書、原言語と
    目的言語の対が記録された対訳辞書を用い、ルール内の
    要素翻訳方法、目的言語制約条件を基に、目的言語パタ
    ーン内の変数部の内容を決定し、翻訳文を生成する訳文
    生成手順、 前記訳文生成手順で生成された翻訳結果を出力する訳文
    出力手順をコンピュータに実行させるための翻訳プログ
    ラム。
JP2002138930A 2002-05-14 2002-05-14 翻訳方法、翻訳装置及び翻訳プログラム Pending JP2003330926A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002138930A JP2003330926A (ja) 2002-05-14 2002-05-14 翻訳方法、翻訳装置及び翻訳プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002138930A JP2003330926A (ja) 2002-05-14 2002-05-14 翻訳方法、翻訳装置及び翻訳プログラム

Publications (1)

Publication Number Publication Date
JP2003330926A true JP2003330926A (ja) 2003-11-21

Family

ID=29700246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002138930A Pending JP2003330926A (ja) 2002-05-14 2002-05-14 翻訳方法、翻訳装置及び翻訳プログラム

Country Status (1)

Country Link
JP (1) JP2003330926A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008520041A (ja) * 2004-11-09 2008-06-12 ソニー オンライン エンタテインメント インク 文法的に正しいテキスト文字列を生成するシステムおよび方法
JP2008520043A (ja) * 2004-11-09 2008-06-12 ソニー オンライン エンタテインメント インク 文法的に正しいテキスト文字列を生成するシステムおよび方法
JP2013254473A (ja) * 2012-05-10 2013-12-19 Takashi Kinoshita 中国文を日本文に自動翻訳する方法
JP2014229087A (ja) * 2013-05-23 2014-12-08 木下 崇 日本文を中国文に自動翻訳する方法
KR20180090641A (ko) * 2017-02-03 2018-08-13 네이버 주식회사 회화 관련 컨텐츠를 제공하는 방법 및 시스템
CN113221582A (zh) * 2021-04-29 2021-08-06 北京搜狗科技发展有限公司 一种翻译处理方法、装置和用于翻译处理的装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008520041A (ja) * 2004-11-09 2008-06-12 ソニー オンライン エンタテインメント インク 文法的に正しいテキスト文字列を生成するシステムおよび方法
JP2008520043A (ja) * 2004-11-09 2008-06-12 ソニー オンライン エンタテインメント インク 文法的に正しいテキスト文字列を生成するシステムおよび方法
JP2013254473A (ja) * 2012-05-10 2013-12-19 Takashi Kinoshita 中国文を日本文に自動翻訳する方法
JP2014229087A (ja) * 2013-05-23 2014-12-08 木下 崇 日本文を中国文に自動翻訳する方法
KR20180090641A (ko) * 2017-02-03 2018-08-13 네이버 주식회사 회화 관련 컨텐츠를 제공하는 방법 및 시스템
KR101950213B1 (ko) * 2017-02-03 2019-02-22 네이버 주식회사 회화 관련 컨텐츠를 제공하는 방법 및 시스템
CN113221582A (zh) * 2021-04-29 2021-08-06 北京搜狗科技发展有限公司 一种翻译处理方法、装置和用于翻译处理的装置

Similar Documents

Publication Publication Date Title
Laboreiro et al. Tokenizing micro-blogging messages using a text classification approach
WO2005059771A1 (ja) 対訳判断装置、方法及びプログラム
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
Nguyen-Son et al. Identifying computer-generated text using statistical analysis
Uthayamoorthy et al. Ddspell-a data driven spell checker and suggestion generator for the tamil language
Alqrainy A morphological-syntactical analysis approach for Arabic textual tagging
JP2003330926A (ja) 翻訳方法、翻訳装置及び翻訳プログラム
Athukorala et al. Swa Bhasha: Message-Based Singlish to Sinhala Transliteration
JP5298834B2 (ja) 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
JP4478042B2 (ja) 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置
Bak et al. Kakao enterprise’s WMT21 machine translation using terminologies task submission
Rana et al. Example based machine translation using fuzzy logic from English to Hindi
JP5528376B2 (ja) 文書平易化装置およびプログラム
Nguyen-Son et al. Detecting machine-translated text using back translation
Baig et al. Universal Dependencies for Urdu Noisy Text
Walentynowicz et al. Tagger for polish computer mediated communication texts
Seresangtakul et al. Thai-Isarn dialect parallel corpus construction for machine translation
El-Taher et al. An Arabic CCG approach for determining constituent types from Arabic Treebank
JP2007264858A (ja) 人名性別判定プログラム、機械翻訳プログラム、人名性別判定装置、機械翻訳装置、人名性別判定処理方法および機械翻訳処理方法
JP3752535B2 (ja) 訳語選択装置、及び翻訳装置
Giwa Language identification for proper name pronunciation
Gdaniec et al. Derivational morphology to the rescue: how it can help resolve unfound words in MT
JP4812811B2 (ja) 機械翻訳装置及び機械翻訳プログラム
Rodrigues et al. Arabic data science toolkit: An api for arabic language feature extraction
Lembersky et al. Morphological disambiguation of Hebrew: a case study in classifier combination

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060801

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061128