JP3189186B2 - パターンに基づく翻訳装置 - Google Patents

パターンに基づく翻訳装置

Info

Publication number
JP3189186B2
JP3189186B2 JP06455292A JP6455292A JP3189186B2 JP 3189186 B2 JP3189186 B2 JP 3189186B2 JP 06455292 A JP06455292 A JP 06455292A JP 6455292 A JP6455292 A JP 6455292A JP 3189186 B2 JP3189186 B2 JP 3189186B2
Authority
JP
Japan
Prior art keywords
pattern
translation
source language
language pattern
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06455292A
Other languages
English (en)
Other versions
JPH05290082A (ja
Inventor
宏 丸山
浩一 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP06455292A priority Critical patent/JP3189186B2/ja
Priority to EP93302192A priority patent/EP0562818A2/en
Publication of JPH05290082A publication Critical patent/JPH05290082A/ja
Priority to US08/326,050 priority patent/US5640575A/en
Application granted granted Critical
Publication of JP3189186B2 publication Critical patent/JP3189186B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はパターンに基づく翻訳シ
ステムに係わり、特にカスタマイズの難しい一般の機械
翻訳システムの前処理として、個々のユーザが用いるの
に適した、パターンに基づく翻訳システムに関するもの
である。
【0002】
【従来の技術】機械翻訳の実用化においては、翻訳シス
テムそれ自体の精度が重要なのはもちろんであるが、適
用分野に応じた言い回しに容易に対応するための、カス
タマイゼーションの機能もそれに劣らず重要である。現
在の機械翻訳の技術では、カスタマイゼーションは主
に、「 辞書への用語の追加、変更」及び、「文法ルー
ルのチューニング」によって行なわれるが、システム全
体の整合性を保ちながら辞書や文法ルールを修正するの
は高度な言語学的およびシステム的知識を要求される。
また、顧客に特有な表現が、システムの言語モデルにそ
ぐわない場合は、その表現を追加するのが極度に困難で
ある場合もあり得る。このように、機械翻訳システムの
実用化にとって、カスタマイゼーションの容易さはキー
になる事柄である。このような問題を解決するために、
ユーザーが予め固有の翻訳文パターンを用意し、翻訳の
前処理としてこのパターンを照合し翻訳文を生成する方
法が、例えば、特開平2−32467号公報や特開平3
−116272号公報に開示されている。これらの翻訳
文パターンは、原文中の「数値」や特定の用語を変数と
して入れ替え可能となっている。ただし、この方法は、
基本的には、翻訳文のパターンは原文と訳文とが一対一
で対応するものである。広範囲の表現をカバーするため
には数多くのパターンを用意しなければならなず、翻訳
文のパターンの作成や検索に多大の時間を要してしま
い、効率的ではない。
【0003】
【発明が解決しようとする課題】この発明の目的は、ユ
ーザーが簡単に作成でき、しかも効率良く検索できる翻
訳パターンを提供することにある。
【0004】
【課題を解決するための手段】この発明によれば、独自
の翻訳パターンが提供される。この翻訳パターンは、原
言語パターンと、該原言語パターンを一文字で置き換え
た変数及び上記原言語パターンに対応する翻訳文として
の目的言語パターンとによって構成される。さらに、こ
の原言語パターンは、他の原言語パターンを変数として
組み込める入れ子(NEST)を含んでいる。これによっ
て、ユーザは簡単に翻訳パターンを作成できる。入れ子
構造を採用しているので、パターン数の増加も抑えるこ
とができる。この原言語パターンに関しては更に、木構
造のインデックスを作ることにより、迅速なパターン照
合が可能となる。
【0005】
【実施例】図1は本発明の一実施例になる機械翻訳シス
テムの全体構成を示す図である。ここでは、和文英訳の
例について説明する。1は入力手段であり、キーボード
2や和文テキスト入力ファイル3によってテキストデー
タや各種の操作コマンドなどがプロセッサ4に入力され
る。プロセッサ4は演算装置やメモリ及び制御部等の一
般的な構成を備えており、後述する処理手順に従って翻
訳処理を実行するものであるが、機能的にとらえると、
次のような構成を有する。まず、5が翻訳パターン登録
処理部であり、ユーザーが翻訳パターンのテーブルを生
成し、登録するのに用いられる。6は入力処理部で、入
力された和文テキストを比較処理部7に送り、翻訳パタ
ーンファイル13の翻訳パターンと一致するか比較す
る。比較の結果、一致する場合には、訳文生成処理部8
で翻訳パターンを用いて英訳文を生成し、バッファメモ
リ10を介して出力処理部11に送る。比較の結果が一
致しない場合には、機械翻訳処理部9において文法解析
による翻訳処理がなされる。必要に応じて、和文テキス
トを全て翻訳パターンによる翻訳と機械翻訳処理の双方
により翻訳し、結果を比較し、取捨選択するようにして
もよい。
【0006】12は、外部記憶装置であり、前記した翻
訳パターンのテーブルを記録する翻訳パターンファイル
13のほか、機械翻訳処理用の日英対訳及び英文生成規
則ファイル14, 日本語解析辞書及び文法ファイル1
5を備えている。また、16は、訳文生成処理部8や機
械翻訳処理部9で翻訳された英文を記録するファイルで
ある。翻訳処理の経過及び結果は、逐一表示手段17に
表示される。
【0007】図2は翻訳パターンのテーブルの例を示す
ものである。翻訳パターン18は、 <原言語パターン
18A,変数18B,目的言語パターン18C > と
いう3つ組を単位としている。このような組の集合によ
り、翻訳パターン群が形成される。例えば、<特許,
〜, patent> という翻訳パターンにおいて、「特許」
という文字列は、「patent」という文字列に翻訳される
ことを示している。また、「特許」がより長い文字列の
一部として現れたなら、この「特許」は「〜」という一
字の変数で置き換えられることを示している。変数は、
他の文字と区別がつきさえすれば、物理的なサイズとは
無関係に1文字として扱うことができる。原言語パター
ン18A中には、「〜」や「#」のような幾つかの変数
18Bを含むことができる。原言語パターン18Aに出
てくる1番めの変数 〜、2番めの変数 〜、...は、夫
々対応する目的言語パターン18Cの変数 $1、$
2、...に置き換えられる。
【0008】原言語パターン18Aは、文(Sentenc
e)、節(Clause)、句(Phrase)あるいは品詞(Part
of Speech)いずれの形で表現してもよい。後述する
ように、原言語パターンには、「〜は〜である」のよう
に、変数18Bを入れ子(NEST)構造19とする文、節
あるいは句が含まれているのが特徴である。このよう
な、変数18Bを用いた入れ子構造19は、非常に単純
で柔軟性に富んでおり、言語学的、システム的知識のな
いユーザでも容易に使いこなすことができる。ユーザは
新たな翻訳パターンを、翻訳システムとの整合性を損な
うことなく簡単に、翻訳パターンファイル13に登録、
追加することができる。
【0009】なお、日本語に比べて英語表現が持つ大き
な特徴の一つは名詞や動詞が数(Number)の影響を受け
ることである。この点は、正確な文法に基づく機械翻訳
と併用しながら翻訳することによってカバーすることが
できる。しかし、ユーザにとって使用頻度の高い特定の
表現については、予め数を区別した翻訳パターンを準備
しておくのもよい。例えば、図2の例にあるように、特
許請求の範囲の項数に応じて変数「〜」と「%」を使い
分けるにより、目的言語パターンの名詞や動詞を数に対
応させて次のように変化させることができる。 Claim 1 is invalid. Claims 2 and 3 are valid.
【0010】翻訳パターンの数が非常に大きくなること
を考慮すると、原言語パターンの検索が高速に行なえる
ことが重要である。そのため、原言語パターンについて
は、木構造20のインデックスを作成し、原言語パター
ンのテーブルの一部として翻訳パターンファイル13に
登録する。
【0011】インデックスは、図3に示すように、図2
の原言語パターン18Aの共通の前部分列(prefix)、
例えば「〜」や「特許」、を括り出すような形で作られ
る。木構造20の各ノード21(211A,212A,
……)には、一つの文字あるいは変数が一つづつ対応し
ている。従って、木の根210からそのノード211
A,212A,……をたどった部分が原言語パターンに
おける部分パターンの照合に対応していると考えること
ができる。たとえば、ノード212Nは、「特許」とい
う部分パターンが照合された結果に対応する。ノード2
12Nの肩についているアスタリスク(*)は、このノ
ードがあるパターンの終りに対応していることを示して
いる。この場合「特許」という原言語パターンが存在し
ている。
【0012】前にも述べたように、原言語パターンに
は、「〜は〜である」や「〜を〜する」のように、変数
18Bを入れ子(NEST)構造とした文パターン23が含
まれているのが特徴である。さらに、「特許」のような
名詞あるいは名詞相当句で構成され文の一部をなす部分
パターン24がある。部分パターンには、「出願する」
のような動詞あるいは動詞相当句を構成するパターン2
5等、種々の品詞あるいは品詞句からなるパターンがあ
る。同様に、節からなるパターンを作成してもよい。部
分パターンにはまた、「#」のような変数あるいは記号
を含む入れ子(NEST)構造のパターン26もある。前記
文パターン23が関係代名詞でさらに他の文パターンや
部分パターンの一部として取り込まれることもありう
る。このように、原言語パターンには多種多様なものが
あり、各パターンを構成する文字や変数の配列あるいは
各パターンの長さに制限はない。必要に応じて種々の文
字や変数を用い、文法に沿って各パターンを自由に組み
合わせることにより、ユーザーにとって最適の翻訳パタ
ーンを作成することができる。
【0013】図4は翻訳パターンファイル13の一例の
要部を示す図であり、(a)の原言語パターンテーブル
と、(b)の目的言語パターンテーブルからなってい
る。原言語パターンテーブルには、原言語パターン18
Aの各文字や変数毎に、アドレスとしてのインデック
ス、属性、継続性、分岐数、分岐アドレスなどが記録さ
れる。属性としては、原言語が通常の文字か変数かの区
別等がある。ただし、この区別は必ずしも必要ではな
い。継続性は、原言語パターンの区切りの有無を表す。
「許」のように、そのノードで終了する原言語パターン
があるときは、置換すべき変数18B、例えば「〜」
と、対応する目的言語パターンテーブルの翻訳文18
C、例えば" Patent" へのポインター(222L)とを記
述する。なお、置換すべき変数や翻訳文 は複数あって
も差し支えない。分岐数の欄には次に続く文字や変数の
数を記述する。分岐アドレスの欄には、各文字や変数に
対応したインデックスへのポインタが記述される。分岐
アドレスは、ハッシュ表、二分探索表など任意の探索法
で実現すればよい。
【0014】図5は本発明における翻訳処理のアルゴリ
ズムの一例を示す図である。最初に和文のテキストを入
力する(ステップ51)。このテキスト文は次に翻訳パ
ターン中の原言語パターンと比較照合される(ステップ
52)。入力の一部にマッチする原言語パターンが存在
すれば、この原言語パターンを翻訳パターンの対応する
変数に変換する(ステップ53〜54)。この処理を、
テキスト文の終りにおいて、テキスト文の終りまでを覆
う翻訳パターンが抽出されるまで繰り返す(ステップ5
5)。すなわち、テキスト文の長さと同じステップ数
で、パターンの終わりに到達できる翻訳パターンがある
かどうかを調べる。抽出された翻訳パターンが複数ある
場合には、パターンの数すなわち入れ子の数が最小の組
み合わせになるパターンを選択する。あるいは、選択の
ために予め、ユーザが各パターンに優先度を付けておい
てもよい。
【0015】最後に、抽出された原言語パターンを翻訳
パターンに従って目的言語パターンに変換することによ
り、英文を組み立てる(ステップ58)。もし、ステッ
プ53において、入力テキスト文の一部にマッチする原
言語パターンが存在しなければ、通常の文法解析に基づ
く機械翻訳によって処理を行う(ステップ59)。
【0016】ステップ52における、テキスト文と翻訳
パターンとの照合は、入力文を左から一文字ずつ調べて
いくことによって行われる。以下この処理のアルゴリズ
ムを、テキスト文として「接点を改良する」を例文にと
りながら、図6〜図8によって詳細に説明する。まず、
図6に翻訳パターンの中でこのテキスト文に関連する翻
訳パターンが示されている。また、図7には、翻訳パタ
ーンのインデックス木の関連する部分が木構造20とし
て示されており、各文字や変数を読んだ直後の状態がそ
の直ぐ右側の各ノード(0〜16)に対応している。
【0017】図8において、まず最初に、入力文の長さ
をnとする(ステップ81)。例文の場合、n=7であ
る。各文字位置 i に対して、状態集合s[i] を対
応させる。文の解析が始まる初期状態では、どのパター
ンの照合も始まっていないので、s[0] ={<0,0>}であ
る。解析は、各文字位置 i=0,1,...,n に対して、 scan
(i) と complete(i) という二つのオペレーション
を実行していくことによって行なわれる(ステップ83
〜85)。状態集合の要素は、あるパターンが途中まで
の照合した状態を表す、<p,f>という2つ組であ
る。pは、インデックス木のノードを示し、fはそのパ
ターンの照合が文中のどの位置から始まったかを示す。
【0018】入力文字xに対して、あるノードpからイン
デックス木をたどったノードp∧ をp∧=shift(p,x)
と定義する。例えば、図7で、shift(7,す) =15 で
ある。インデックス木の各ノードからでるアークを、入
力アルファベットのサイズの配列を使ってインデクシン
グするか、ハッシュすれば、インデックス木をたどるオ
ペレーション shift(p,x) は、高速に実行すること
ができる。
【0019】図9にscan(i)処理の詳細を示す。すな
わち、 scan(i) は、 s[i] の個々の状態 <p,f>に
対し、入力文の i+1 文字目 xi+1 がパターンに照合す
るかを shift(p,xi+1)によって調べる(ステップ91
〜92)。照合するならば、 <shift(p,xi+1),f>
を文字位置 i+1 の状態集合 s[i+1] に加える(ステッ
プ93〜94)。
【0020】complete(i)処理の詳細を図10に示
す。 complete(i) は、s[i] の個々の状態<p,f> に
対し、 p がパターンの終りに対応するならば、そのパ
ターンの置き換え変数を y とし(ステッフ゜101〜
102)、そのパターンの開始位置 f にもどって、 y
でパターン照合を試す。すなわち、s[f] の各要素 <p
∧,f∧> に対して、 shift(p∧,y) を試し、もしそ
の照合が成功すれば、 <shift(p∧,y),f∧> を s
[i] に加える(ステッフ゜104〜105)。
【0021】「接点を改良する」というテキスト文に対
するアルゴリズムの実行結果を図11に示す。図では各
文字位置 i に対する s[i]の内容が示されてい
る。文字位置 i=1において、scan(i)処理の結果、
ノード0から始まりノード12で終わる部分パターン<
12,0>、すなわち「接」が抽出されている。文字位
置i=2では、ノード0から始まりノード13で終わる
部分パターン<13,0>、すなわち「接点」が抽出さ
れている。ノード13はパターンの終りに対応する
(*)を持つので、次の文字位置 i=3では、「接
点」が変数「〜」に置き換えられた部分パターン<1,
0>がs[2]に追加されたので、ノード0から始まりノー
ド2で終わる部分パターン<2,0>、すなわち「接点
を」が抽出されている。以下、同様にして最終文字位置
までパターン照合が繰り返されている。
【0022】パターンの照合が成功したかどうかは、最
終文字位置 n (この場合 n=7)において、文頭から
始まり、この位置で終るパターンがあったかどうかで決
まる。この例では、 <11*, 0> と <5*, 0>
がそれに当たる。また、図の中には各状態が、どの状態
からの shift() オペレーションで生成されたか
が、矢印で示されている。例えば、<11*, 0>のパタ
ーンは、ノード0−12−13−0−1−2−8−9−
10−11の経路を辿り、<5*, 0>のパターンは、ノ
ード0−12−13−0−1−2−3−4−5の経路を
辿ったことが分る。アルゴリズムの中でこの情報を保持
しておけば、解析終了後に、矢印をたどってどのパター
ンが文中のどの部分に照合したかを調べることができ
る。この例の場合、 (接点)を改良する (接点)を(改良)する という2つの照合が可能だったことがわかる。ただし、
()内は、そこが部分パターンにマッチしたことを示
す。
【0023】一般に照合結果は複数ありうる。これらの
中からどれをとるかという方策については様々なものが
考えられるがもっとも簡単には、より一致度の大きいパ
ターンをとるという観点から、使われたパターン数が少
ないものを優先すればよい。上記例では、図6から明ら
かなように、「(接点)を(改良)する」が3個のパタ
ーン(181,183,185)を使っているのに対し
て、「(接点)を改良する」は2個のパターン(18
2,185)を使っている。従って、後者の「(接点)
を改良する」の方を優先して選択するものとする。
【0024】照合結果から対応する翻訳文を生成するこ
とは容易である。図6における個々の原言語パターンの
各部分を翻訳パターン(182,185)に沿って目的
言語パターンで置き換えればよい。このようにして、
「Improve point of contact inproductivity.」という
翻訳文が得られる。本発明のパターン照合アルゴリズム
は、大量のパターンに対しても効率的に動くので、シス
テム全体の応答性を損なうこともない。
【0025】図3の木構造でも示したように、、原言語
パターンの変数は任意の一文字でよい。変数を置き換え
るパターンの内容(日付、部品番号など)によって変え
れば、より精密なパターンの照合が可能になる。例え
ば、ある製品の部品番号として、5576-003のような7桁
の数を使っているとき、このような部品番号にマッチす
るパターンは、図12のように記述することができる。
ここで、@は部品番号にマッチする変数、 #は数字1文
字にマッチする変数である。
【0026】この翻訳パターンを使えば、 <原言語パターン,変数,目的言語パターン > @在庫切れ , 〜 , No stock of $1 のような翻訳パターンが「5576-003在庫切れ」のような
部品番号を持った形だけにマッチして、「No stock of
P/N5576-003.」という翻訳を生成するようにすることが
できる。変数は、他の文字と区別がつきさえすれば、物
理的なサイズとは無関係に1文字として扱うことができ
る。この部品番号パターンを図2に示した文や節などを
含む入れ子構造のパターンと組み合わせることによっ
て、より実用性の高い様々の文章を作成することができ
る。
【0027】この発明で述べたパターンに基づく翻訳
は、既存の翻訳システムの前処理とし、パターン照合に
成功した場合はそのパターンに基づく翻訳を採用し、パ
ターン照合が失敗した時に翻訳システムを起動するよう
にしておくと有効である。すなわち、本発明の翻訳パタ
ーンを、一般の機械翻訳システムにおいてカスタマイズ
の難しい分野について用意し、機械翻訳の前処理として
用いるものである。これによって、翻訳システムで対応
しきれない特殊な表現に迅速に対応することができる。
【0028】この発明で述べたパターンに基づく翻訳
は、英語やドイツ語を日本語に翻訳する翻訳システムに
も使えることは、言うまでもない。また、自然言語間の
翻訳以外にも利用できる。その一例として、図13は、
自然言語風の入力からコンピュータのコマンドを作成す
るために用いる変換テーブルの例を示すものである。@
は、ファイルの名前の前に相当する8桁までの英文字名
である。図12の例と同じようにして、例えば"WEIGHT.
TXT"のようにファイル名を記述することができる。さら
に、入れ子構造のパターンと組み合わせることにより、
自然言語風の入力から"COPYFILE WEIGHT.TXT TO HEALT
H.TXT"のようなコマンドを作成することもできる。
【0029】
【発明の効果】この発明では、ユーザーが用意した翻訳
パターンを効率良く検索し、そのパターンに基づいて翻
訳文を生成することができる。翻訳パターンは、非常に
単純で柔軟性に富んだ形をしているので、言語学的、シ
ステム的知識のないユーザーでも、本体の翻訳システム
の整合性を損なうことなく新たなパターンを追加するこ
とができる。また、木構造のインデックスを用いたパタ
ーン照合アルゴリズムは大量のパターンに対しても効率
的に動くので、システム全体の応答性を損なうこともな
い。
【図面の簡単な説明】
【図1】本発明の一実施例になる機械翻訳システムの全
体構成を示す図である。
【図2】本発明の翻訳パターンの一例を示す図である。
【図3】図2の翻訳パターンの中の原言語パターンに対
する木構造のインデックスを示す図である。
【図4】翻訳パターンファイルの一例を示す図である。
【図5】本発明における翻訳処理のアルゴリズムの一例
を示す図である。
【図6】翻訳パターンの中のテキスト文に関連する部分
を示す図である。
【図7】図6の翻訳パターンに対応する木構造を示す図
である。
【図8】テキスト文と翻訳パターンとの照合のアルゴリ
ズムを示す図である。
【図9】図8のscan(i)処理の詳細を示す図である。
【図10】図8のcomplete(i)処理の詳細を示す図で
ある。
【図11】図6の翻訳パターンに対するアルゴリズムの
実行結果を示す図である。
【図12】本発明の他の実施例になる、部品番号にマッ
チするパターンの例を示す図である。
【図13】本発明の他の実施例になる、自然言語風の入
力からコンピュータのコマンドを作成するために用いる
変換テーブルの例を示す図である。
【符号の説明】 1 入力手段 4 プロセッサ 5 翻訳パターン登録処理部 6 入力処理部 7 比較処理部 8 訳文生成処理部 9 機械翻訳処理部 12 外部記憶装置 13 翻訳パターンファイル 17 表示示手段
フロントページの続き (72)発明者 丸山 宏 東京都千代田区三番町5−19 日本ア イ・ビー・エム株式会社 東京基礎研究 所内 (72)発明者 武田 浩一 東京都千代田区三番町5−19 日本ア イ・ビー・エム株式会社 東京基礎研究 所内 (56)参考文献 特開 昭62−274366(JP,A) 特開 平2−32467(JP,A) 電子通信学会誌,Vol.49 No. 2「機械による英文和訳」P.236−243 情報処理学会自然言語処理研究会報告 80−8「変換主導型機械翻訳の実現手 法」P1−8

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】原言語で記載されたテキスト文について予
    め用意された複数の翻訳パターンとの照合を行いその結
    果に基づいて上記テキスト文の翻訳を行う、パターンに
    基づく翻訳装置であって、 上記各翻訳パターンは、原言語パターンと、該原言語パ
    ターンを一文字で置き換えた変数及び上記原言語パター
    ンに対応する翻訳文としての目的言語パターンとによっ
    て構成され、上記翻訳パターンの少なくとも一つは、他
    の翻訳パターンの原言語パターンを置換した変数を組み
    込んだ入れ子構造の原言語パターンと当該変数に対応す
    る変数を組み込んだ目的言語パターンを有する翻訳パタ
    ーンを記録したパターンテーブルと、 テキスト文を文頭から一文字ずつ翻訳パターン中の原言
    語パターンと照合し、テキスト文の一部と一致する原言
    語パターンが存在した場合、テキスト文中の当該原言語
    パターンと一致する部分を翻訳パターン中の当該原言語
    パターンに対応する変数に置換してさらに翻訳パターン
    中の原言語パターンとの照合をテキスト文の終わりまで
    を覆う原言語パターンが存在するまで繰り返す比較照合
    手段と、テキスト文の終わりまでを覆う原言語パターン
    に対応する目的言語パターンが変数を含んでいる場合、
    当該変数を、当該目的言語パターンに対応する原言語パ
    ターンに含まれる、当該目的言語パターン中の変数に対
    応する変数に置き換えられた原言語パターンに対応する
    目的言語パターンに置換することを繰り返して翻訳文を
    生成する生成手段を有することを特徴とするパターンに
    基づく翻訳装置。
  2. 【請求項2】一致する原言語パターンを有する翻訳パタ
    ーンが複数ある場合には、用いたパターン数が最小とな
    る翻訳パターンを選択する手段を有する、請求項1記載
    の翻訳装置。
  3. 【請求項3】原言語で記載されたテキスト文について予
    め用意された複数の翻訳パターンとの照合を行いその結
    果に基づいて上記テキスト文の翻訳を行う、パターンに
    基づく翻訳方法であって、上記各翻訳パターンは、原言
    語パターンと、該原言語パターンを一文字で置き換えた
    変数及び上記原言語パターンに対応する翻訳文としての
    目的言語パターンとによって構成され、上記翻訳パター
    ンの少なくとも一つは、他の翻訳パターンの原言語パタ
    ーンを置換した変数を組み込んだ入れ子構造の原言語パ
    ターンと当該変数に対応する変数を組み込んだ目的言語
    パターンを有しており、 テキスト文を文頭から一文字ずつ翻訳パターン中の原言
    語パターンと照合し、テキスト文の一部と一致する原言
    語パターンが存在した場合、テキスト文中の当該原言語
    パターンと一致する部分を翻訳パターン中の当該原言語
    パターンに対応する変数に置換してさらに翻訳パターン
    中の原言語パターンとの照合をテキスト文の終わりまで
    を覆う原言語パターンが存在するまで繰り返す比較照合
    段階と、 テキスト文の終わりまでを覆う原言語パターンに対応す
    る目的言語パターンが変数を含んでいる場合、当該変数
    を、当該目的言語パターンに対応する原言語パターンに
    含まれる、当該目的言語パターン中の変数に対応する変
    数に置き換えられた原言語パターンに対応する目的言語
    パターンに置換することを繰り返して翻訳文を生成する
    生成段階を有することを特徴とするパターンに基づく翻
    訳方法。
  4. 【請求項4】一致する原言語パターンを有する翻訳パタ
    ーンが複数ある場合には、用いたパターン数が最小とな
    る翻訳パターンを選択する段階を有する、請求項3記載
    の翻訳方法。
JP06455292A 1992-03-23 1992-03-23 パターンに基づく翻訳装置 Expired - Fee Related JP3189186B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP06455292A JP3189186B2 (ja) 1992-03-23 1992-03-23 パターンに基づく翻訳装置
EP93302192A EP0562818A2 (en) 1992-03-23 1993-03-23 System for pattern based text translation
US08/326,050 US5640575A (en) 1992-03-23 1994-10-19 Method and apparatus of translation based on patterns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06455292A JP3189186B2 (ja) 1992-03-23 1992-03-23 パターンに基づく翻訳装置

Publications (2)

Publication Number Publication Date
JPH05290082A JPH05290082A (ja) 1993-11-05
JP3189186B2 true JP3189186B2 (ja) 2001-07-16

Family

ID=13261506

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06455292A Expired - Fee Related JP3189186B2 (ja) 1992-03-23 1992-03-23 パターンに基づく翻訳装置

Country Status (3)

Country Link
US (1) US5640575A (ja)
EP (1) EP0562818A2 (ja)
JP (1) JP3189186B2 (ja)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0672989A3 (en) * 1994-03-15 1998-10-28 Toppan Printing Co., Ltd. Machine translation system
GB2300495A (en) * 1995-04-13 1996-11-06 Canon Kk Language processing
JPH09231224A (ja) * 1996-02-26 1997-09-05 Fuji Xerox Co Ltd 言語情報処理装置
US6098034A (en) * 1996-03-18 2000-08-01 Expert Ease Development, Ltd. Method for standardizing phrasing in a document
JPH09251462A (ja) * 1996-03-18 1997-09-22 Sharp Corp 機械翻訳装置
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
US6002997A (en) * 1996-06-21 1999-12-14 Tou; Julius T. Method for translating cultural subtleties in machine translation
JPH1011447A (ja) * 1996-06-21 1998-01-16 Ibm Japan Ltd パターンに基づく翻訳方法及び翻訳システム
US6466900B1 (en) * 1998-05-29 2002-10-15 Citicorp Development Center, Inc. Multi-language phrase editor and method thereof
US7165020B2 (en) * 1998-05-29 2007-01-16 Citicorp Development Center, Inc. Multi-language phrase editor and method thereof
US5960382A (en) * 1997-07-07 1999-09-28 Lucent Technologies Inc. Translation of an initially-unknown message
US6173250B1 (en) 1998-06-03 2001-01-09 At&T Corporation Apparatus and method for speech-text-transmit communication over data networks
US6385586B1 (en) * 1999-01-28 2002-05-07 International Business Machines Corporation Speech recognition text-based language conversion and text-to-speech in a client-server configuration to enable language translation devices
JP4718687B2 (ja) 1999-03-19 2011-07-06 トラドス ゲゼルシャフト ミット ベシュレンクテル ハフツング ワークフロー管理システム
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
CA2362416C (en) * 2000-01-05 2009-08-04 Mitsubishi Denki Kabushiki Kaisha Keyword extracting device
US7904595B2 (en) 2001-01-18 2011-03-08 Sdl International America Incorporated Globalization management system and method therefor
US7043716B2 (en) * 2001-06-13 2006-05-09 Arius Software Corporation System and method for multiple level architecture by use of abstract application notation
US7353165B2 (en) * 2002-06-28 2008-04-01 Microsoft Corporation Example based machine translation system
US7113960B2 (en) 2002-08-22 2006-09-26 International Business Machines Corporation Search on and search for functions in applications with varying data types
KR100542755B1 (ko) * 2003-09-15 2006-01-20 한국전자통신연구원 규칙 기반 방식과 번역 패턴 방식을 혼합한 하이브리드자동 번역 장치 및 방법과 그 프로그램을 기록한 컴퓨터로읽을 수 있는 기록매체
US7941311B2 (en) * 2003-10-22 2011-05-10 Microsoft Corporation System and method for linguistic collation
CN100437557C (zh) * 2004-02-04 2008-11-26 北京赛迪翻译技术有限公司 基于语言知识库的机器翻译方法与装置
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US20100262621A1 (en) * 2004-03-05 2010-10-14 Russ Ross In-context exact (ice) matching
US20050288919A1 (en) * 2004-06-28 2005-12-29 Wang Jian C Method and system for model-parameter machine translation
JP4473702B2 (ja) * 2004-11-02 2010-06-02 株式会社東芝 機械翻訳システム、機械翻訳方法及びプログラム
JP4404211B2 (ja) 2005-03-14 2010-01-27 富士ゼロックス株式会社 マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム
US7849049B2 (en) * 2005-07-05 2010-12-07 Clarabridge, Inc. Schema and ETL tools for structured and unstructured data
US7849048B2 (en) * 2005-07-05 2010-12-07 Clarabridge, Inc. System and method of making unstructured data available to structured data analysis tools
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US20080004858A1 (en) * 2006-06-29 2008-01-03 International Business Machines Corporation Apparatus and method for integrated phrase-based and free-form speech-to-speech translation
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
JP4256891B2 (ja) * 2006-10-27 2009-04-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳の精度を向上させる技術
US8706477B1 (en) 2008-04-25 2014-04-22 Softwin Srl Romania Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code
KR100959244B1 (ko) * 2008-08-01 2010-05-24 재단법인서울대학교산학협력재단 계층화된 시프트 테이블을 이용한 고속의 문자열 패턴 탐지방법
GB2468278A (en) * 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US8762130B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking
US8762131B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates
WO2011108330A1 (ja) * 2010-03-02 2011-09-09 有限会社サイバープロ 自然言語文変換装置,方法,およびプログラム
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US10657540B2 (en) 2011-01-29 2020-05-19 Sdl Netherlands B.V. Systems, methods, and media for web content management
US9547626B2 (en) 2011-01-29 2017-01-17 Sdl Plc Systems, methods, and media for managing ambient adaptability of web applications and web services
US10580015B2 (en) 2011-02-25 2020-03-03 Sdl Netherlands B.V. Systems, methods, and media for executing and optimizing online marketing initiatives
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
US10372741B2 (en) 2012-03-02 2019-08-06 Clarabridge, Inc. Apparatus for automatic theme detection from unstructured data
US9773270B2 (en) 2012-05-11 2017-09-26 Fredhopper B.V. Method and system for recommending products based on a ranking cocktail
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US10452740B2 (en) 2012-09-14 2019-10-22 Sdl Netherlands B.V. External content libraries
US11308528B2 (en) 2012-09-14 2022-04-19 Sdl Netherlands B.V. Blueprinting of multimedia assets
US11386186B2 (en) 2012-09-14 2022-07-12 Sdl Netherlands B.V. External content library connector systems and methods
US9916306B2 (en) 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content
US9436681B1 (en) * 2013-07-16 2016-09-06 Amazon Technologies, Inc. Natural language translation techniques
US10614167B2 (en) 2015-10-30 2020-04-07 Sdl Plc Translation review workflow systems and methods
EP3582120A4 (en) * 2017-02-07 2020-01-08 Panasonic Intellectual Property Management Co., Ltd. TRANSLATION DEVICE AND TRANSLATION METHOD
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4706212A (en) * 1971-08-31 1987-11-10 Toma Peter P Method using a programmed digital computer system for translation between natural languages
JPS5775375A (en) * 1980-10-28 1982-05-11 Sharp Corp Electronic interpreter
JPS5783961A (en) * 1980-11-14 1982-05-26 Hitachi Ltd Voice-data simultaneous transmission system
JPS5797172A (en) * 1980-12-09 1982-06-16 Sharp Corp Electronic interpreter
JPS57201958A (en) * 1981-06-05 1982-12-10 Hitachi Ltd Device and method for interpretation between natural languages
JPS5848172A (ja) * 1981-09-18 1983-03-22 Fujitsu Ltd 多言語間翻訳装置
JPS58201175A (ja) * 1982-05-20 1983-11-22 Kokusai Denshin Denwa Co Ltd <Kdd> 機械翻訳方式
JPS6017564A (ja) * 1983-07-08 1985-01-29 Brother Ind Ltd 電子辞書
JPS60159970A (ja) * 1984-01-30 1985-08-21 Hitachi Ltd 情報蓄積検索方式
JPS619753A (ja) * 1984-06-26 1986-01-17 Hitachi Ltd 文書処理装置における頻発熟語の自動登録方法
JPS62274366A (ja) * 1986-05-21 1987-11-28 Nec Corp 辞書検索装置
JPH0682370B2 (ja) * 1987-05-26 1994-10-19 シャープ株式会社 文字処理装置
JPH0232467A (ja) * 1988-07-21 1990-02-02 Hitachi Ltd 機械翻訳方式
DE68928231T2 (de) * 1988-10-28 1998-01-08 Toshiba Kawasaki Kk Verfahren und Vorrichtung zur Maschinenübersetzung
NL8900600A (nl) * 1989-03-13 1990-10-01 Bso Buro Voor Systeemontwikkel Tweetalige kennisbank.
US5101424A (en) * 1990-09-28 1992-03-31 Northern Telecom Limited Method for generating a monitor program for monitoring text streams and executing actions when pre-defined patterns, are matched using an English to AWK language translator
CA2051135C (en) * 1991-09-11 1996-05-07 Kim D. Letkeman Compressed language dictionary
DE4135261C1 (ja) * 1991-10-25 1993-03-18 International Business Machines Corp., Armonk, N.Y., Us

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
情報処理学会自然言語処理研究会報告80−8「変換主導型機械翻訳の実現手法」P1−8
電子通信学会誌,Vol.49 No.2「機械による英文和訳」P.236−243

Also Published As

Publication number Publication date
US5640575A (en) 1997-06-17
EP0562818A2 (en) 1993-09-29
JPH05290082A (ja) 1993-11-05
EP0562818A3 (ja) 1994-02-09

Similar Documents

Publication Publication Date Title
JP3189186B2 (ja) パターンに基づく翻訳装置
US5895446A (en) Pattern-based translation method and system
US4502128A (en) Translation between natural languages
JP3196868B2 (ja) テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ
US6760695B1 (en) Automated natural language processing
US7707026B2 (en) Multilingual translation memory, translation method, and translation program
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JPS62163173A (ja) 機械翻訳方法
WO2001029699A1 (en) Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures
JPH07200591A (ja) 構文解析装置
JPS61255469A (ja) 言語生成装置
JPH08292955A (ja) 言語処理方法及びそれを適用するデータ処理装置
JP2815714B2 (ja) 翻訳装置
WO1997040453A1 (en) Automated natural language processing
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JP2632806B2 (ja) 言語解析装置
JP3176750B2 (ja) 自然言語の翻訳装置
JP3892227B2 (ja) 機械翻訳システム
Papakitsos et al. Lazy tagging with functional decomposition and matrix lexica: an implementation in Modern Greek
JP3253311B2 (ja) 言語処理装置および言語処理方法
JP2574741B2 (ja) 言語処理方法
Powell et al. Natural language and voice output for relational data base systems
JP2004086919A (ja) 機械翻訳システム
JPH0816910B2 (ja) 言語解析装置
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080518

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees