JPH05151260A - 翻訳テンプレート学習方法および翻訳テンプレート学習システム - Google Patents

翻訳テンプレート学習方法および翻訳テンプレート学習システム

Info

Publication number
JPH05151260A
JPH05151260A JP3315981A JP31598191A JPH05151260A JP H05151260 A JPH05151260 A JP H05151260A JP 3315981 A JP3315981 A JP 3315981A JP 31598191 A JP31598191 A JP 31598191A JP H05151260 A JPH05151260 A JP H05151260A
Authority
JP
Japan
Prior art keywords
sentence
language
phrase
translation
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3315981A
Other languages
English (en)
Inventor
Hiroyuki Kaji
博行 梶
Hiroko Kida
裕子 木田
Yasutsugu Morimoto
康嗣 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP3315981A priority Critical patent/JPH05151260A/ja
Priority to US07/983,147 priority patent/US5442546A/en
Publication of JPH05151260A publication Critical patent/JPH05151260A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment

Abstract

(57)【要約】 【目的】機械翻訳システムにおいて、様々な語句に置き
換え可能な変数を含む翻訳テンプレートを、対訳文を入
力することにより自動的に生成することを目的とする。 【構成】対訳関係にある第1言語文と第2言語文を入力
し、これらを形態素解析および句解析したあと、対訳辞
書を参照することによって第1言語文と第2言語文の間
の語の対応関係を同定する(16)。次に、第1言語文
と第2言語文の対応する語を相互に対応づけられた変数
にすることにより、翻訳テンプレートを生成する(1
7)。さらに、第1言語文と第2言語文の間の句の対応
関係を抽出し、対応する句の範囲を変数化したテンプレ
ートを生成し(18)、対応する句の範囲のみを切り出
したテンプレートを生成する(19)。 【効果】任意の対訳文から翻訳テンプレートが学習(自
動生成)でき、翻訳テンプレートの作成および入力に手
間がかからない。また、高品質の翻訳が可能になる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、さまざまな語句に置き
換え可能な変数を含む対訳文形式の翻訳テンプレートを
利用する機械翻訳システムに係わり、特に対訳文を入力
して翻訳テンプレートを自動的に生成する翻訳テンプレ
ート学習方法および翻訳テンプレート学習システムに関
する。
【0002】
【従来の技術】自然言語文の機械翻訳は、例えば特開昭
58−40684号に開示されているように、原文の解
析と訳文の生成という過程で実現される。原文解析の結
果得られる中間表現の構成要素は原文を構成する語ある
いはそれが表す概念である。中間表現の各要素に、それ
ぞれ対応する出力言語の語を割当てたうえで、訳文が生
成される。このような方式は、いわば逐語訳であり、原
文の表現や構造にとらわれない訳文を得ることが原理的
に困難であるという欠点があった。
【0003】その欠点を補う方法として、一部の語句を
置き換え可能な変数にした対訳文をテンプレートとして
利用する方法が考えられる。変数部分の翻訳は従来の機
械翻訳方法によるが、それ以外の部分はテンプレートを
デッドコピーして訳文を生成する。従って、変数に対応
する部分以外は原文と語のレベルで対応がとれないよう
な訳文を得ることも可能である。テンプレートを利用し
て翻訳する方法は、例えば特公平1−58545や特開
平3−116273に開示されている。
【0004】
【発明が解決しようとする課題】ところで、このような
翻訳テンプレートは、人手で1文1文入力してやる必要
があり、類似の文例であっても別々に入力しなければな
らなかった。また、多くの翻訳テンプレートを入力する
のが面倒で困難であるという問題点があった。
【0005】本発明の目的は、上記従来技術の問題点を
解決することにある。すなわち、本発明は、類似の文例
を複数用意する必要をなくし、一つの対訳文があれば、
それから幾つかの翻訳テンプレートを自動的に生成する
ことを可能にすることを目的とする。また、翻訳テンプ
レートの元になる対訳文例は機械翻訳で得られたものに
限定せず、人間が作った対訳文からも自動生成できるよ
うにすることを目的とする。さらに、対訳文の中で変数
化する要素を語に限定せず、任意のレベルの句を自動的
に変数化の対象にすることによって、一つの対訳文から
一般化の程度が異なる複数の翻訳テンプレートを自動生
成できるようにする。また、対訳文の全体ではなく、対
訳文から切り出した句に対応する翻訳テンプレートを自
動生成できるようにする。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、本発明に係る翻訳テンプレート学習方法は、互いに
対訳関係にある第1言語の文と第2言語の文とを読み込
む対訳文読み込みステップと、第1言語と第2言語の間
の対訳辞書を参照することによって、対訳文読み込みス
テップで読み込んだ第1言語の文と第2言語の文の間の
語の対応関係を同定する対訳文対応づけステップと、対
訳文対応づけステップで同定された対応関係の集合から
部分集合を任意に選び、該部分集合に属する対応関係の
各々について対応関係を成している第1言語の文中の語
と第2言語の文中の語を相互に対応づけられた変数にす
ることによって翻訳テンプレートを生成する翻訳テンプ
レート生成ステップとを設けたことを特徴とする。
【0007】また、翻訳テンプレートの構成要素である
第1言語の文から句の候補を抽出する第1言語句解析ス
テップと、翻訳テンプレートの構成要素である第2言語
の文から句の候補を抽出する第2言語句解析ステップ
と、第1言語句解析ステップで抽出した句候補と第2言
語句解析ステップで抽出した句候補の組で包含する変数
の集合が同一のものがあれば、第1言語の文中の該句候
補と第2言語の文中の該句候補を相互に対応づけられた
変数にすることによって新しい翻訳テンプレートを生成
する翻訳テンプレート一般化ステップとを設けたことを
特徴とする。
【0008】さらに、第1言語句解析ステップで抽出し
た句候補と第2言語句解析ステップで抽出した句候補の
組で包含する変数の集合が同一のものがあれば、第1言
語の文中の該句候補の部分と第2言語の文中の該句候補
の部分を切り出すことによって部分翻訳テンプレートを
生成する部分翻訳テンプレート生成ステップを設けたこ
とを特徴とする。
【0009】また、変数化したい部分を第1言語の文中
で、あるいは第1言語の文中と第2言語の文中の両方で
ユーザに指定させる変数部指定ステップを設けるように
してもよい。さらに、対訳文対応づけステップの結果を
表示する対訳文対応表示ステップを設け、また生成した
翻訳テンプレートの元になった第1言語の文と第2言語
の文を、変数化された部分とそれ以外の部分を区別した
様式で表示する原対訳文表示ステップを設けるようにし
てもよい。
【0010】さらに、本発明の翻訳テンプレート学習シ
ステムは、さまざまな語句に置き換え可能な変数を含
み、互いに対訳関係にある第1言語の文と第2言語の文
とで構成される翻訳テンプレートを自動生成する翻訳テ
ンプレート学習システムであって、互いに対訳関係にあ
る第1言語の文と第2言語の文とを読み込む対訳文読み
込み手段と、第1言語の語と第2言語の語との間の対応
関係を記憶した対訳辞書と、該対訳辞書を参照すること
によって、上記対訳文読み込み手段で読み込んだ第1言
語の文と第2言語の文との間の語の対応関係を同定する
対訳文対応づけ手段とを含むことを特徴とする。
【0011】
【作用】対訳文読み込みステップは、互いに対訳関係に
ある第1言語の文と第2言語の文とを読み込む。これか
ら以下のステップによって翻訳テンプレートが自動生成
される。対訳文対応づけステップは、対訳文読み込みス
テップで読み込んだ第1言語の文と第2言語の文をそれ
ぞれ例えば形態素解析して、それぞれの文を構成する語
を同定する。そのあと、第1言語の文の構成語と第2言
語の文の構成語の任意の組について、それが対訳辞書に
含まれていれば、第1言語の文中の該語と第2言語の文
中の該語とが対応していると判断する。翻訳テンプレー
ト生成ステップは、対訳文対応づけステップで同定され
た語の対応関係の集合から部分集合を任意に選び、該部
分集合に属する対応関係の各々について対応関係を成し
ている第1言語の文中の語と第2言語の文中の語を相互
に対応づけられた変数にすることによって翻訳テンプレ
ートを生成する。翻訳テンプレートは、語の対応関係の
集合の部分集合の各々に対応して生成される。
【0012】第1言語句解析ステップは、第1言語の文
法に従って、翻訳テンプレートの構成要素である第1言
語の文に含まれる句の候補を抽出する。第2言語句解析
ステップは、第2言語の文法に従って、翻訳テンプレー
トの構成要素である第2言語の文に含まれる句の候補を
抽出する。翻訳テンプレート一般化ステップは、第1言
語句解析ステップで抽出した句候補と第2言語句解析ス
テップで抽出した句候補の組で、包含する変数の集合が
同一のものを探す。包含する変数の集合が同一の句候補
は互いに対応していると判断し、第1言語の文中の該句
候補と第2言語の文中の該句候補を相互に対応づけられ
た変数にすることによって新しい翻訳テンプレートを生
成する。また、部分翻訳テンプレート生成ステップは、
第1言語句解析ステップで抽出した句候補と第2言語句
解析ステップで抽出した句候補の組で、包含する変数の
集合が同一のものを探す。包含する変数の集合が同一の
句候補は互いに対応していると判断し、第1言語の文中
の該句候補の部分と第2言語の文中の該句候補の部分を
切り出すことによって部分翻訳テンプレートを生成す
る。
【0013】変数部指定ステップは、対訳文中の変数化
する部分をユーザが指定することを可能にする。変数化
する部分を第1言語の文のみに対して指定した場合は、
第2言語の文中の対応する部分が自動的に同定され、第
1言語の文中で指定された部分と第2言語の文中の対応
が同定された部分とを相互に対応づけられた変数にする
ことによって翻訳テンプレートが生成される。変数化す
る部分を第1言語の文と第2言語の文の両方に対して指
定した場合は、指定された部分が互いに対応する句であ
ることを確認した上で翻訳テンプレートが生成される。
対訳文対応表示ステップは、対訳文対応づけステップの
結果を表示するもので、これによって変数化する部分を
決定するユーザの作業効率が向上する。原対訳文表示ス
テップは、生成した翻訳テンプレートの元になった第1
言語の文と第2言語の文を、変数化された部分とそれ以
外の部分を区別した様式で表示するもので、これによっ
てユーザは作成された翻訳テンプレートが妥当であるか
どうかの判断を容易に行なうことができる。
【0014】
【実施例】次に、本発明の第1の実施例として、日英翻
訳テンプレート学習(自動生成)システムについて説明
する。
【0015】図1は、本実施例の日英翻訳テンプレート
学習システムのハードウエア構成を示す。同図に示すよ
うに、本実施例の日英翻訳テンプレート学習システム
は、中央処理装置1、記憶装置2、二次記憶装置3、入
力装置4、および表示装置5から構成される。
【0016】二次記憶装置3には、日英対訳辞書ファイ
ル31、日本語辞書ファイル32、英語辞書ファイル3
3、および翻訳テンプレートファイル34が記憶されて
いる。このうち、日英対訳辞書ファイル31、日本語辞
書ファイル32、および英語辞書ファイル33は、予め
作成され記憶されたものである。また、翻訳テンプレー
トファイル34は、後述するような手順で翻訳テンプレ
ート学習処理プログラムが生成した翻訳テンプレートを
出力するファイルである。
【0017】図2は、日英対訳辞書ファイル31のデー
タ例を示す。同図に示すように、日英対訳辞書ファイル
31は、日本語の語311とそれに対する英語の対訳語
312を一つ以上含むレコードから構成され、日本語の
語311をキーとして検索することができる。
【0018】図3は、日本語辞書ファイル32のデータ
例を示す。同図に示すように、日本語辞書ファイル32
は、見出し語321、標準形322、品詞323、およ
び変化形情報324を含むレコードから構成され、見出
し語321をキーとして検索することができる。活用す
る語の場合、見出し語321は語幹である。標準形32
2は、対応する見出し語321の標準的な表記であり、
活用する語の場合は終止形で記載されている。品詞32
3は、対応する見出し語321の品詞である。「N」
「V」などの記号の意味は後述する。
【0019】図4は、英語辞書ファイル33のデータ例
を示す。同図に示すように、英語辞書ファイル33は、
見出し語331、標準形332、品詞333、および変
化形情報334を含むレコードから構成され、見出し語
331をキーとして検索することができる。多品詞語の
場合、品詞333には各品詞が並記されている。
【0020】図5に、翻訳テンプレートファイル34の
レコードを例示する。この実施例のシステムでは、日本
語と英語の対訳文を入力することにより、ここに示した
ような翻訳テンプレートを自動生成する。同図(a)
(b)(c)の三つのレコードとも、対訳文「空白をタ
イプするときに使う。/Use to type a space.」をシス
テムに読み込ませて自動生成させた結果の翻訳テンプレ
ートである。
【0021】図5(a)の翻訳テンプレートは、日本語
文テンプレート341と英語文テンプレート342の対
である。日本語文テンプレート341は変数X1を含む
日本語文、英語文テンプレート342は変数X1を含む
英語文である。変数には句カテゴリーが一つないし複数
指定されていて、その句カテゴリーの表現への置き換え
が許されるということを表している。句とは名詞句、動
詞句などの単語の並び(名詞、動詞などの単語も含むも
のとする)、句カテゴリーとは句の種類(品詞記号)を
いう。変数X1の後に記載された[N,NP]は変数X
1の句カテゴリーを示している。
【0022】ここで句カテゴリー(品詞記号)の記号の
意味は次のようなものである。まず、日本語の句カテゴ
リーのうち、「NP」は名詞句、「N」は名詞、「VP
/SH」は終止形動詞句、「V/SH」は終止形動詞、
「VP/RT」は連体形動詞句、「V/RT」は連体形
動詞、「VP/RY」は連用形動詞句、「V/RY」は
連用形動詞、「PP」は前置詞句、「P」は前置詞、そ
して「S」は文を表すものとする。英語の句カテゴリー
のうち、「NP」は名詞句、「N」は名詞、「VP」は
動詞句、「V」は動詞、「ADJ」は形容詞、「AR
T」は冠詞、「PP」は前置詞句、「P」は前置詞、
「S/TO」はTO不定詞、そして「S」は文を表すも
のとする。
【0023】図5(a)から分かるように、日本語文テ
ンプレート341と英語文テンプレート342には同一
の変数が含まれていて、同一の変数は互いに対訳関係に
ある表現への置き換えが許されるということを表してい
る。
【0024】翻訳テンプレートファイル34に格納され
る各レコードには、日本語文テンプレート341と英語
文テンプレート342のほかに、日本語文テンプレート
開始位置(is)3411、日本語文テンプレート終了
位置(ie)3412、日本語文テンプレート句カテゴ
リー(c)3413、日本語文変数部選択ビット列
(v)3414、英語文テンプレート開始位置(js)
3421、英語文テンプレート終了位置(je)342
2、英語文テンプレート句カテゴリー(d)3423、
英語文変数部選択ビット列(w)3424が含まれる。
【0025】日本語文テンプレート開始位置isと日本
語文テンプレート終了位置ieは、日本語文テンプレー
ト341がその元になった日本語文(図5の例では「空
白をタイプするときに使う。」)のどの範囲に対応して
いるかを示す。すなわち、開始位置isは日本語文中の
対応する範囲の先頭の語の語番号、終了位置ieは日本
語文中の対応する範囲の末尾の語の語番号である。ここ
で、語番号とは、日本語文を後述する形態素解析により
単語に区切り、その区切られた日本語文中で文頭から順
に語に付けた番号である。
【0026】日本語文テンプレート句カテゴリーcは、
日本語文テンプレート341の句としてのカテゴリーで
ある。日本語文変数部選択ビット列vは、日本語文テン
プレート341がその元になった日本語文のどの部分を
変数化して作成されたものであるかを示している。すな
わち、このビット列vの第(2i)ビットが日本語文中
の第i語に対応しており、第(2i)ビットが1であれ
ば第i語は変数化された部分であり、第(2i)ビット
が0であれば第i語は変数化されなかった部分であるこ
とを示す。また、ビット列vの第(2i+1)ビットは
日本語文中の第i語と第(i+1)語の部分が一つの変
数にまとめられているかそうでないかを示す。日本語文
中の第i語と第(i+1)語の部分が一つの変数にまと
められているとき、vの第(2i+1)ビットは1であ
る。
【0027】英語文テンプレート開始位置jsと英語文
テンプレート終了位置jeは、英語文テンプレート34
2がその元になった英語文(図5の例では「Use to typ
e aspace.」)のどの範囲に対応しているかを示す。す
なわち、開始位置jsは英語文中の対応する範囲の先頭
の語の語番号、終了位置jeは英語文中の対応する範囲
の末尾の語の語番号である。ここで、語番号とは、英語
文中で文頭から順に語(word)に付けた番号である。英
語文テンプレート句カテゴリーdは、英語文テンプレー
ト342の句としてのカテゴリーである。
【0028】英語文変数部選択ビット列wは、英語文テ
ンプレート342がその元になった英語文のどの部分を
変数化して作成されたものであるかを示している。すな
わち、このビット列wの第(2j)ビットが英語文中の
第j語に対応しており、第(2j)ビットが1であれば
第j語は変数化された部分であり、第(2j)ビットが
0であれば第j語は変数化されなかった部分であること
を示す。また、ビット列wの第(2j+1)ビットは英
語文中の第j語と第(j+1)語の部分が一つの変数に
まとめられているかそうでないかを示す。英語文中の第
j語と第(j+1)語の部分が一つの変数にまとめられ
ているとき、ビット列wの第(2j+1)ビットは1で
ある。
【0029】図1のハードウエア構成において、記憶装
置2は、翻訳テンプレート学習処理プログラムとそれに
よる文の解析データなどの記憶領域として利用される。
文の解析データ(すなわち入力した対訳文を解析した結
果を示すデータ)として、日本語形態素解析表21、英
語形態素解析表22、日本語句解析表23、英語句解析
表24がある。これら日本語形態素解析表21、英語形
態素解析表22、日本語句解析表23、および英語句解
析表24を、図6、図7、図8、および図9にそれぞれ
例示するが、これらは対訳関係にある日本語文「空白を
タイプするときに使う。」と英語文「Use to type a sp
ace.」に対するものである。
【0030】日本語形態素解析表21は、図6に示すよ
うに日本語文を構成する語(形態素)を文頭から文末へ
の出現順に並べたものである。各語のデータ(図の1行
のデータ)は、出現形211、標準形212、品詞21
3及び対応語番号214からなる。日本語文中の第i番
目の語の出現形211、標準形212、品詞213、対
応語番号214をそれぞれJW(i)、JS(i)、J
P(i)、JT(i)と記す。
【0031】出現形JW(i)は日本語文に出現したま
まのつづりである。標準形JS(i)は品詞JP(i)
には複数の品詞記号を並記できる。これは、品詞のあい
まい性が解消できない場合があるからである。対応語番
号JT(i)には対訳関係にある英語文中の対応する語
の語番号(英語文中で文頭から順に語に付けた番号)の
集合が書き込まれる。語番号の集合にするのは、語の対
応関係にあいまい性があり一意に決められない場合があ
るからである。また、英語文中に対応する語がない場合
や対応する語が同定できなかった場合、対応語番号JT
(i)は空集合になる。
【0032】英語形態素解析表22も同様である。図7
に示すように英語文を構成する語を文頭から文末への出
現順に並べたもので、各語のデータは出現形221、標
準形222、品詞223及び対応語番号224からな
る。英語文中の第j番目の語の出現形221、標準形2
22、品詞223、対応語番号224をそれぞれEW
(j)、ES(j)、EP(j)、ET(j)と記す。
出現形EW(j)は英語文に出現したままのつづりであ
る。品詞EP(j)には複数の品詞記号を並記できる。
これは、品詞のあいまい性が解消できない場合があるか
らである。対応語番号ET(j)には、対訳関係にある
日本語文中の対応する語の語番号(日本語文中で文頭か
ら順に語に付けた番号)の集合が書かれる。語番号の集
合にするのは、語の対応関係にあいまい性があり一意に
決められない場合があるからである。また、日本語文中
に対応する語がない場合や対応する語が同定できなかっ
た場合、対応語番号ET(j)は空集合になる。
【0033】日本語句解析表23は、入力した対訳文の
日本語文を句解析した結果を示す表である。日本語句解
析表23は、図8に示すように日本語文に含まれる句の
候補を三角行列の形で示すものである。三角行列の行は
下から上に第1行、第2行、…と番号をつけ、列は左か
ら右に第1列、第2列、…と番号をつけるものとする。
また、日本語句解析表23の第i行、第j列の要素をA
(i,j)と記すものとする。要素A(i,j)には句
カテゴリー記号の集合が書き込まれる。要素A(i,
j)に、ある句カテゴリー記号Xが含まれているという
ことは、日本語文の第j番目の語を先頭とするi個の語
の並びをXなるカテゴリーの句にまとめることができる
ことを意味する。
【0034】英語句解析表24は、入力した対訳文の英
語文を句解析した結果を示す表である。英語句解析表2
4も、上記の日本語句解析表23と同様の表である。英
語句解析表24は、図9に示すように英語文に含まれる
句の候補を三角行列の形で示すものである。三角行列の
行は下から上に第1行、第2行、…と番号をつけ、列は
左から右に第1列、第2列、…と番号をつけるものとす
る。また、英語句解析表24の第i行、第j列の要素を
B(i,j)と記すものとする。要素B(i,j)には
句カテゴリー記号の集合が書き込まれる。要素B(i,
j)に、ある句カテゴリー記号Xが含まれているという
ことは、英語文の第j番目の語を先頭とするi個の語の
並びをXなるカテゴリーの句にまとめることができるこ
とを意味する。
【0035】次に、翻訳テンプレート学習処理すなわち
翻訳テンプレートを自動生成する処理の処理手順を説明
する。図10は、中央処理装置1が実行する翻訳テンプ
レート学習処理のフローチャートを示す。
【0036】まず、対訳文読み込みステップ11におい
て、対訳関係にある日本語文と英語文を入力装置4から
読み込む。
【0037】次に、日本語形態素解析ステップ12にお
いて、日本語辞書ファイル32を参照しながら、入力さ
れた日本語文がどんな語から構成されているかを明らか
にする。日本語形態素解析は、例えば特開昭61−40
671に開示されている方法で行なえばよい。日本語形
態素解析の結果、図6に示すような日本語形態素解析表
21が得られる。日本語形態素解析表21のデータフィ
ールドのうち、出現形211、標準形212、品詞21
3については、この日本語形態素解析ステップ12によ
って値がセットされる。
【0038】次に、英語形態素解析ステップ13におい
て、英語辞書ファイル33を参照しながら、入力された
英語文がどんな語から構成されているかを明らかにす
る。英語形態素解析の方法は、例えば特開昭58−40
684号の中に開示されている方法を用いればよい。英
語形態素解析の結果、図7に示すような英語形態素解析
表22が得られる。英語形態素解析表22のデータフィ
ールドのうち、出現形221、標準形222、品詞22
3については、この英語形態素解析ステップ13によっ
て値がセットされる。
【0039】次に、日本語句解析ステップ14におい
て、入力された日本語文に含まれる句の候補を抽出す
る。これには従来より知られているCYK(Cocke
−Younger−Kasami)法を用いる。日本語
句解析の結果、図8に示すような日本語句解析表23が
得られる。日本語句解析ステップ14の詳細はあとで説
明する。
【0040】次に、英語句解析ステップ15において、
入力された英語文に含まれる句の候補を抽出する。この
英語句解析の方法は日本語句解析のそれと同じである。
英語句解析の結果、図9に示すような英語句解析表24
が得られる。
【0041】次に、対訳文対応づけステップ16におい
て、日英対訳辞書ファイル31を参照しながら日本語文
と英語文の間の語の対応関係を同定する。対訳文対応づ
けの結果、日本語形態素解析表21中の対応語番号21
4と英語形態素解析表22中の対応語番号224に値が
セットされる。対訳文対応づけステップ16の詳細はあ
とで説明する。
【0042】そのあと翻訳テンプレート生成ステップ1
7において、対訳文対応づけステップ16で得た日本語
文と英語文の間の語の対応関係の集合から部分集合を次
々と選び、該部分集合に属する対応関係を成す語を変数
化することによって翻訳テンプレートを生成する。生成
した翻訳テンプレートは翻訳テンプレートファイル34
に登録する。翻訳テンプレート生成ステップ17の詳細
はあとで説明する。
【0043】さらに、翻訳テンプレート一般化ステップ
18において、日本語句解析表23および英語句解析表
24、並びに日本語形態素解析表21中の対応語番号2
14および英語形態素解析表22中の対応語番号224
を参照して、日本語文と英語文の間の句の対応関係を抽
出したあと、抽出した対応関係を成す句の部分を変数化
することによって一般化された翻訳テンプレートを生成
する。翻訳テンプレート一般化ステップ18の詳細はあ
とで説明する。
【0044】最後に部分翻訳テンプレート生成ステップ
19において、日本語句解析表23および英語句解析表
24、並びに日本語形態素解析表21中の対応語番号2
14および英語形態素解析表22中の対応語番号224
を参照して、日本語文と英語文の間の句の対応関係を抽
出したあと、抽出した対応関係を形成する句の部分のみ
を翻訳テンプレートから切り出すことによって部分翻訳
テンプレートを生成する。部分翻訳テンプレート生成ス
テップ19の詳細はあとで説明する。
【0045】次に、日本語句解析ステップ14、対訳文
対応づけステップ16、翻訳テンプレート生成ステップ
17、翻訳テンプレート一般化ステップ18、および部
分翻訳テンプレート生成ステップ19について、この順
にこれらのステップの処理手順の詳細を説明する。ここ
で、日本語文と英語文の語数はそれぞれM、Nであると
して説明する。語数M、Nの値は日本語形態素解析ステ
ップ12と英語形態素解析ステップ13によって決まっ
ている。
【0046】日本語句解析ステップ14は、日本語文中
の句候補を抽出するサブステップ、および抽出した句候
補から一部を棄却するサブステップから成る。日本語句
解析ステップ14においては日本語句構造文法を用い
る。
【0047】日本語句構造文法は、図11に例示するよ
うな書換え規則の集合である。書換え規則は「Z→X
Y」なる形のものと「Z→X」なる形のものがある。書
換え規則「Z→X Y」は、「→」の右側の句カテゴリ
ーXおよびYの並びが左側の句カテゴリーZで置換え可
能であることを示している。書換え規則「Z→X」は、
「→」の右側の句カテゴリーXが左側の句カテゴリーZ
で置換え可能であることを示している。例えば、図11
の規則「NP→N」は、名詞Nは名詞句NPに置換えら
れることを示している。以下において、X、Y、Zを句
カテゴリーを表す変数として用いる。
【0048】図12のフローチャートに沿って、日本語
文中の句候補を抽出する処理を説明する。まず、日本語
句解析表23の全要素を初期化して空にする(ステップ
1401)。次に、要素A(1,j)に日本語形態素解
析表21中の第j語の品詞JP(j)をコピーする(j
=1,…,M)(ステップ1402)。次に、要素A
(1,j)に句カテゴリーXが含まれ、「Z→X」なる
書換え規則が日本語句構造文法に含まれているなら、句
カテゴリーZを要素A(1,j)に追加する処理を、可
能な限り繰り返す(j=1,…,M)(ステップ140
3)。
【0049】次に、日本語句解析表23の行を指すイン
デクスiに初期値2をセットする(ステップ140
4)。また、日本語句解析表23の列を指すインデクス
jに初期値1をセットする(ステップ1405)。さら
に、変数kに初期値1をセットする(ステップ140
6)。
【0050】そして、要素A(k,j)に句カテゴリー
Xが含まれ、要素A(i−k,j+k)に句カテゴリー
Yが含まれ、かつ「Z→X Y」なる書換え規則が日本
語句構造文法に含まれているなら、句カテゴリーZを要
素A(i,j)に追加する処理を可能な限り行なう(ス
テップ1407)。次に、変数kに1を加えながら(ス
テップ1408)、変数kがインデクスiより小さい間
(ステップ1409)、ステップ1407の処理を繰り
返す。
【0051】次に、要素A(i,j)に句カテゴリーX
が含まれ、「Z→X」なる書換え規則が日本語句構造文
法に含まれているなら、句カテゴリーZを要素A(i,
j)に追加する処理を、可能な限り繰り返す(ステップ
1410)。そのあと、インデクスjに1を加える(ス
テップ1411)。そして、j+i−1が日本語文語数
M以下であれば(ステップ1412)、更新されたイン
デクスjについて、要素A(i,j)の句カテゴリーを
追加する処理(ステップ1406−1410)を実行す
る。j+i−1が日本語文語数Mを越えれば(ステップ
1412)、インデクスiに1を加える(ステップ14
13)。インデクスiが日本語文語数M以下であれば
(ステップ1414)、更新されたインデクスiについ
て、要素A(i,1),…,A(i,M−i+1)に句
カテゴリーを追加する処理(ステップ1405−141
2)を実行する。インデクスiが日本語文語数Mより大
きくなれば(ステップ1414)、句候補を抽出する処
理を終了する。
【0052】図13に、日本語文「空白をタイプすると
きに使う。」に対して図12の句候補抽出処理を実行し
た時点の日本語句解析表を示す。なお、図8の日本語句
解析表は次の句候補棄却処理も施した段階のものであ
る。
【0053】次に図14のフローチャートに沿って、抽
出された句候補から一部を棄却する処理を説明する。ま
ず、要素A(M,1)に「文」を表す句カテゴリー記号
Sが含まれるかどうかチェックする(ステップ142
1)。要素A(M,1)に句カテゴリーSが含まれてい
なければ(ステップ1421)、日本語句解析表23の
第1行以外の要素を全て空にして(ステップ143
6)、終了する。
【0054】要素A(M,1)に句カテゴリーSが含ま
れていれば(ステップ1421)、そのSに有効フラグ
を付与する(ステップ1422)。次に、日本語句解析
表23の行を指すインデクスiに初期値として日本語文
語数Mをセットする(ステップ1423)。また、日本
語句解析表23の列を指すインデクスjに初期値1をセ
ットする(ステップ1424)。
【0055】次に、要素A(i,j)に有効フラグの付
いた句カテゴリーZが含まれ、A(i,j)に有効フラ
グが付いていない句カテゴリーXが含まれ、かつ「Z→
X」なる書換え規則が日本語句構造文法に含まれるな
ら、要素A(i,j)中の句カテゴリーXに有効フラグ
を付与する処理を可能な限り行なう(ステップ142
5)。そのあと、要素A(i,j)に有効フラグの付い
ていない句カテゴリーがあれば、それらを要素A(i,
j)から削除する(ステップ1426)。そして、変数
kに初期値1をセットする(ステップ1427)。
【0056】次に、要素A(i,j)に有効フラグの付
いた句カテゴリーZが含まれ、要素A(k,j)に句カ
テゴリーXが含まれ、要素A(i−k,j+k)に句カ
テゴリーYが含まれ、かつ「Z→X Y」なる書換え規
則が日本語句構造文法に含まれるなら、要素A(k,
j)中の句カテゴリーXと要素A(i−k,j+k)中
の句カテゴリーYに有効フラグを付与する処理を可能な
限り行なう(ステップ1428)。そして、変数kに1
を加えながら(ステップ1429)、変数kがインデク
スiより小さい間(ステップ1430)、ステップ14
28の処理を繰り返す。変数kがインデクスiに等しく
なれば(ステップ1430)、i+jが日本語文語数M
より小さいかどうかチェックする(ステップ143
1)。i+jが日本語文語数Mより小さければ(ステッ
プ1431)、インデクスjに1を加えて(ステップ1
432)、要素A(i,j)中の有効フラグの付いた句
カテゴリーから有効フラグを伝搬させる処理(ステップ
1425−1430)を実行する。
【0057】i+jが日本語文語数M以上であれば(ス
テップ1431)、インデクスiから1を減じる(ステ
ップ1433)。インデクスiが1より大きければ(ス
テップ1434)、要素A(i,1),…,A(i,M
−i+1)中の有効フラグの付いた句カテゴリーから有
効フラグを伝搬させる処理(ステップ1424−143
2)を実行する。インデクスiが1になれば(ステップ
1434)、有効フラグが付いていない句カテゴリー
(品詞記号)を要素A(1,j)から削除し(j=1,
…,M)、終了する。
【0058】英語句解析ステップ15は日本語句解析ス
テップ14と全く同様であるので、詳細な説明は省略す
るが、英語句解析ステップ15において用いる英語句構
造文法を図15に例示する。また図16に、句候補抽出
処理と句候補棄却処理との間の段階における、英語文
「Use to type a space.」に対する英語句解析表を示
す。なお、図9の英語句解析表は同じ英語文に対して句
候補棄却処理も施した段階のものである。
【0059】図10の対訳文対応づけステップ16は、
日本語文と英語文の間の語の対応関係の候補を抽出する
サブステップと、抽出された語の対応関係の候補のうち
削除不可のものを選出するサブステップと、語の対応関
係のあいまい性を解消するサブステップとから成る。こ
れらのサブステップの詳細を説明する。
【0060】まず図17のフローチャートに沿って、日
英対訳辞書ファイル31を参照して日本語文と英語文の
間の語の対応関係の候補を抽出する処理を説明する。ま
ず、日本語形態素解析表21の対応語番号JT(i)を
全て初期化して空にする(ステップ1601)。英語形
態素解析表22についても同様に対応語番号ET(j)
を全て初期化して空にする(ステップ1602)。
【0061】次に、日本語文の語の語番号を示すインデ
クスiに初期値1をセットする(ステップ1603)。
日本語文の第i語の標準形JS(i)をキーとして日英
対訳辞書ファイル31を検索する(ステップ160
4)。レコードが検索できなかった場合(ステップ16
05)、日本語文の第i語は、英語の語との単純な対応
関係を考えることができない語であるので、ステップ1
606−1612の処理をスキップし、インデクスiが
日本語文語数Mと等しいかどうかチェックする処理(ス
テップ1613)に分岐する。レコードが検索された場
合(ステップ1605)、そのレコードに書かれている
英語の対訳語312を対訳語バッファにセットする(ス
テップ1606)。
【0062】次に、英語文の語の語番号を示すインデク
スjに初期値1をセットする(ステップ1607)。そ
のあと、英語文の第j語が対訳語バッファに含まれるか
どうかチェックする(ステップ1608)。対訳語バッ
ファに含まれていれば、英語文の第j語が日本語文の第
i語に対応する語であると判断されるので、日本語形態
素解析表21中の第i語の対応語番号JT(i)にイン
デクスjの値を追加し(ステップ1609)、英語形態
素解析表22中の第j語の対応語番号ET(j)にイン
デクスiの値を追加する(ステップ1610)。
【0063】次に、インデクスjが英語文語数Nと等し
くなければ(ステップ1611)、インデクスjに1を
加え(ステップ1612)、英語文の第j語が対訳語バ
ッファに含まれるかどうかチェックする処理(ステップ
1608)に戻る。インデクスjが英語文語数Nと等し
ければ(ステップ1611)、インデクスiが日本語文
語数Mと等しいかどうかチェックする(ステップ161
3)。インデクスiが日本語文語数Mと等しければ処理
を終了するが、インデクスiが日本語文語数Mに等しく
なければ、インデクスiに1を加え(ステップ161
6)、日本語文の第i語に対応する英語文中の語を同定
する処理(ステップ1604−1612)を繰り返す。
【0064】次に図18のフローチャートに沿って、抽
出された語の対応関係の候補のうち、一方の語からみて
唯一の対応関係であるものを削除不可の対応関係候補と
して選出する処理を説明する。まず、日本語文の語の語
番号を示すインデクスiに初期値1をセットする(ステ
ップ1621)。日本語形態素解析表21の第i語の対
応語番号JT(i)に書かれた語番号が一つであれば
(ステップ1622)、その値をインデクスjにセット
し(ステップ1623)、英語形態素解析表22の第j
語の対応語番号ET(j)中の語番号「i」に、削除不
可フラグを付与する(ステップ1624)。インデクス
iが日本語文語数Mより小さければ(ステップ162
5)、インデクスiに1を加えて(ステップ162
6)、ステップ1622−1624の処理を繰り返す。
【0065】インデクスiが日本語文語数Mと等しくな
れば(ステップ1625)、英語文の語の語番号を示す
インデクスjに初期値1をセットする(ステップ162
7)。次に、英語形態素解析表22の第j語の対応語番
号ET(j)に書かれた語番号が一つであれば(ステッ
プ1628)、その値をインデクスiにセットし(ステ
ップ1629)、日本語形態素解析表21の第i語の対
応語番号JT(i)中の語番号「j」に、削除不可フラ
グを付与する(ステップ1630)。そして、インデク
スjが英語文語数Nより小さければ(ステップ163
1)、インデクスjに1を加えて(ステップ163
2)、ステップ1628−1630の処理を繰り返す。
インデクスjが英語文語数Nと等しくなれば(ステップ
1631)、処理を終了する。
【0066】次に図19のフローチャートに沿って、日
本語文と英語文の間の語の対応関係のあいまい性を解消
する処理を説明する。まず、日本語句解析表23の行を
指すインデクスiに初期値2をセットする(ステップ1
641)。日本語句解析表23の列を指すインデクスj
に初期値1をセットする(ステップ1642)。次に、
要素A(i,j)が空であるかどうかチェックする(ス
テップ1643)。要素A(i,j)が空であればステ
ップ1652に分岐するが、要素A(i,j)が空でな
ければ、日本語文中の第j語から第(i+j−1)語が
成す句に関して語の対応関係のあいまい性を解消する処
理(ステップ1644−1651)を実行する。
【0067】すなわち、日本語形態素解析表21中の第
j語から第(i+j−1)語の対応語番号JT(j),
…,JT(i+j−1)で空でないものから一つずつ語
番号を選び、それらをp1,p2,…,pxとし、さら
に{p1,p2,…,px}の最小値および最大値をそ
れぞれ変数s,tにセットする(ステップ1644)。
次に、要素B(t−s+1,s)が空であるかどうかチ
ェックする(ステップ1645)。
【0068】要素B(t−s+1,s)が空であればス
テップ1651に分岐するが、要素B(t−s+1,
s)が空でなければ、英語形態素解析表22の対応語番
号ET(s),…,ET(t)をチェックする。すなわ
ち、対応語番号ET(s)が空であるかどうかチェック
する(ステップ1646)。対応語番号ET(s)が空
でなければ(ステップ1646)、さらに対応語番号E
T(s)がインデクスj以上かつ(i+j−1)以下の
語番号を含むかどうかチェックする(ステップ164
7)。対応語番号ET(s)が空であるか(ステップ1
646)、あるいはインデクスj以上かつ(i+j−
1)以下の語番号を含むなら(ステップ1647)、変
数sが変数tより小さいかどうかチェックする(ステッ
プ1648)。変数sが変数tより小さければ(ステッ
プ1648)、変数sに1を加え(ステップ164
9)、英語形態素解析表22の第s語の対応語番号ET
(s)をチェックする処理(ステップ1646,164
7)に戻る。
【0069】変数sが変数tと等しければ(ステップ1
648)、日本語形態素解析表21中の第j語から第
(i+j−1)語の対応語番号JT(j),…,JT
(i+j−1)で空でないものから、p1,p2,…,
px以外の語番号を削除する(ただし、p1,p2,
…,px以外であっても削除不可フラグの付いている語
番号は削除しない)(ステップ1650)。そのあと、
インデクスjに1を加え(ステップ1652)、i+j
−1が日本語文語数M以下であれば(ステップ165
3)、更新されたインデクスjについてステップ164
3以降の処理を実行する。
【0070】英語形態素解析表22の第s語の対応語番
号ET(s)で空でなく(ステップ1646)、しかも
インデクスj以上かつ(i+j−1)以下の語番号を含
まないものがあれば(ステップ1647)、p1,p
2,…,pxとして他の組合せを選び(ステップ165
1)、日本語文中の第j語から第(i+j−1)語が成
す句に関して語の対応関係のあいまい性を解消する処理
(ステップ1644−1650)を試みる。p1,p
2,…,pxの新しい組合せがなければ(ステップ16
51)、インデクスjに1を加え(ステップ165
2)、i+j−1が日本語文語数M以下であれば(ステ
ップ1653)、更新されたインデクスjについてステ
ップ1643−1651の処理を実行する。
【0071】i+j−1が日本語文語数Mより大きくな
れば(ステップ1653)、インデクスiに1を加える
(ステップ1654)。インデクスiが日本語文語数M
以下であれば(ステップ1655)、更新されたインデ
クスiについてステップ1642−1653の処理を実
行する。インデクスiが日本語文語数Mを越えれば(ス
テップ1655)、処理を終了する。
【0072】次に図20のフローチャートに沿って翻訳
テンプレート生成ステップ17の処理を説明する。この
ステップではワークデータとして変数化可否ビット列u
を用いる。変数化可否ビット列uは長さ2Mのビット列
で、第(2i)ビットu(2i)が1であれば日本語文
の第i語が変数化可能であることを意味し、第(2i)
ビットu(2i)が0であれば日本語文の第i語が変数
化不可であることを意味する。また、奇数番目のビット
u(2i−1)は0とする。
【0073】翻訳テンプレート生成ステップ17では、
まず、変数化可否ビット列uを次のようにして作成す
る。日本語形態素解析表21の第i語の対応語番号JT
(i)が空であればビットu(2i)の値を0にし、日
本語形態素解析表21の第i語の対応語番号JT(i)
が空でなければビットu(2i)の値を1にし、またビ
ットu(2i−1)の値を0にする(i=1,…,M)
(ステップ1701)。次に、日本語文変数部選択ビッ
ト列vの初期値として全ビットを0にする(ステップ1
702)。
【0074】次に、v・u=vであるかどうかチェック
する(ステップ1703)。ここでビット列vとuとの
積演算は各ビットごとにANDをとるものとする。v・
u=vである場合のみ、ステップ1704−1708を
実行する。すなわち、ビット列v中の値が1のビットに
対応した語を変数化した日本語文テンプレート(表示用
日本語文を含む)を作成し(ステップ1704)、それ
に対応した英語文テンプレート(表示用英語文と英語文
変数部選択ビット列wを含む)を作成する(ステップ1
705)。なお、ステップ1704と1705について
は後に詳細に説明する。
【0075】次に、日本語文テンプレート開始位置is
に1を、日本語文テンプレート終了位置ieに日本語文
語数Mを、日本語文テンプレート句カテゴリーcに要素
A(M,1)を、英語文テンプレート開始位置jsに1
を、英語文テンプレート終了位置jeに英語文語数N
を、英語文テンプレート句カテゴリーdに要素B(N,
1)をそれぞれセットする(ステップ1706)。そし
て、日本語文テンプレートと英語文テンプレートを対に
して、日本語文テンプレート開始位置is、日本語文テ
ンプレート終了位置ie、日本語文テンプレート句カテ
ゴリーc、日本語変数部選択ビット列v、英語文テンプ
レート開始位置js、英語文テンプレート終了位置j
e、英語文テンプレート句カテゴリーd、および英語変
数部選択ビット列wとともに、翻訳テンプレートファイ
ル34に出力する(ステップ1707)。また、表示用
日本語文と表示用英語文を対にして表示装置5に出力す
る(ステップ1708)。
【0076】次に、ビット列vの全ビットが1であるか
どうかチェックする(ステップ1709)。ビット列v
の全ビットが1であれば処理を終了するが、そうでなけ
れば、2進数演算でビット列vに1を加えた(ステップ
1710)上で、v・u=vかどうかチェックする処理
(ステップ1703)に戻る。
【0077】翻訳テンプレート生成ステップ17の上記
説明中のステップ1708で表示装置5に出力される表
示用日本語文と表示用英語文の例を図21(a)に示
す。これに対応する翻訳テンプレートは図5(a)に示
したものである。
【0078】次に、図22のフローチャートに沿って、
日本語文テンプレートの作成(ステップ1704)の詳
細を説明する。まず、日本語文テンプレートバッファを
クリアし、バッファ中のデータ出力位置を示すバッファ
ポインタがバッファの先頭を指すようにする(ステップ
1721)。次に、表示用日本語文バッファをクリア
し、バッファ内データ出力位置を示すバッファポインタ
がバッファの先頭を指すようにする(ステップ172
2)。次に、日本語文の語の語番号を示すインデクスi
に初期値1をセットする(ステップ1723)。
【0079】さらに、日本語文変数部選択ビット列vの
第(2i)ビットv(2i)が1か0かチェックする
(ステップ1724)。ビットv(2i)が1であれば
(ステップ1724)、変数Xiと、その句カテゴリー
として、日本語句解析表23の第1行、第i列要素A
(1,i)を日本語文テンプレートバッファに出力し、
バッファポインタを次の位置に進める(ステップ172
5)。また、日本語形態素解析表21の第i語の出現形
JW(i)に第i種のアンダラインを付けて表示用日本
語文バッファに出力し、バッファポインタを次の位置に
進める(ステップ1726)。
【0080】なお、第i種のアンダラインとは、日本語
文の変数にする部分を示す表示である。第i種というの
はアンダラインの色や形を変えてもよいし、アンダライ
ンでなくリバースその他の表示を用いてもよい。後述す
るように、英語文の対応する変数とする部分にも同じ第
i種のアンダラインが付され、これにより変数とする語
の対応関係が分かるようにされている。
【0081】ビットv(2i)が0であれば(ステップ
1724)、日本語形態素解析表21の第i語の出現形
JW(i)を日本語文テンプレートバッファに出力し、
バッファポインタを次の位置に進める(ステップ172
7)。また、日本語形態素解析表21の第i語の出現形
JW(i)を表示用日本語文バッファに出力し、バッフ
ァポインタを次の位置に進める(ステップ1728)。
【0082】ステップ1726あるいは1728のあ
と、インデクスiが日本語文語数Mに一致していなけれ
ば(ステップ1729)、インデクスiに1を加えて
(ステップ1730)、ビットv(2i)が1か0かチ
ェックする処理(ステップ1724)に戻る。インデク
スiが日本語文語数Mに一致していれば(ステップ17
29)、日本語文テンプレートの作成処理を終わる。
【0083】次に、図23のフローチャートに沿って、
英語文テンプレートの作成(ステップ1705)の詳細
を説明する。まず、英語文テンプレートバッファをクリ
アし、バッファ内データ出力位置を示すバッファポイン
タがバッファの先頭を指すようにする(ステップ174
1)。また、表示用英語文バッファをクリアし、バッフ
ァ内データ出力位置を示すバッファポインタがバッファ
の先頭を指すようにする(ステップ1742)。
【0084】次に、英語文の語の語番号を示すインデク
スjに初期値1をセットする(ステップ1743)。そ
して、英語文形態素解析表22の第j語の対応語番号E
T(j)が空であるかどうかチェックする(ステップ1
744)。対応語番号ET(j)が空であれば、英語形
態素解析表22の第j語の出現形EW(j)を英語文テ
ンプレートバッファに出力し、バッファポインタを次の
位置に進める(ステップ1750)。また、英語形態素
解析表22の第j語の出現形EW(j)を表示用英語文
バッファに出力し、バッファポインタを次の位置に進め
る(ステップ1751)。さらに、英語文変数部選択ビ
ット列wの第(2j)ビットw(2j)に0を、また第
(2j−1)ビットにも0をセットする(ステップ17
52)。英語文形態素解析表22の第j語の対応語番号
ET(j)が空でなければ(ステップ1744)、対応
語番号ET(j)中の語番号(複数書かれているときは
任意に一つ選択)をインデクスiにセットし(ステップ
1745)、日本語文変数部選択ビット列vの第(2
i)ビットv(2i)が1か0かチェックする(ステッ
プ1746)。
【0085】ビットv(2i)が1であれば(ステップ
1746)、変数Xiと、その句カテゴリーとして、英
語句解析表24の第1行、第j列要素B(1,j)を英
語文テンプレートバッファに出力し、バッファポインタ
を次の位置に進める(ステップ1747)。また、英語
形態素解析表22の第j語の出現形EW(j)に第i種
のアンダラインを付けて表示用英語文バッファに出力
し、バッファポインタを次の位置に進める(ステップ1
748)。さらに、英語文変数部選択ビット列wの第
(2j)ビットw(2j)に1を、また第(2j−1)
ビットw(2j−1)には0をセットする(ステップ1
749)。
【0086】ビットv(2i)が0であれば(ステップ
1746)、英語形態素解析表22の第j語の出現形E
W(j)を英語文テンプレートバッファに出力し、バッ
ファポインタを次の位置に進める(ステップ175
0)。また、英語形態素解析表22の第j語の出現形E
W(j)を表示用英語文バッファに出力し、バッファポ
インタを次の位置に進める(ステップ1751)。さら
に、英語文変数部選択ビット列wの第(2j)ビットw
(2j)に0を、また第(2j−1)ビットw(2j−
1)にも0をセットする(ステップ1752)。
【0087】ステップ1749あるいは1752のあ
と、インデクスjが英語文語数Nに一致していなければ
(ステップ1753)、インデクスjに1を加えて(ス
テップ1754)、英語文形態素解析表22の第j語の
対応語番号ET(j)が空かどうかチェックする処理
(ステップ1744)に戻る。インデクスjが英語文語
数Nに一致していれば(ステップ1753)、英語文テ
ンプレートの作成処理を終わる。
【0088】次に、図24のフローチャートに沿って、
翻訳テンプレート一般化ステップ18の処理を説明す
る。翻訳テンプレート一般化ステップ18では、翻訳テ
ンプレートファイル34中に翻訳テンプレート一般化処
理を未適用の翻訳テンプレートがなくなるまで(ステッ
プ1801)、以下の処理を繰り返す。
【0089】まず、翻訳テンプレートファイル34から
未処理の翻訳テンプレートを読み込む(ステップ180
2)。読み込んだ翻訳テンプレートの日本語文テンプレ
ート開始位置をisに、日本語文翻訳テンプレート終了
位置をieに、日本語文変数部選択ビット列をvに、英
語文テンプレート開始位置をjsに、英語文翻訳テンプ
レート終了位置をjeに、英語文変数部選択ビット列を
wにそれぞれセットする(ステップ1803)。ビット
列vから第(2・is)ビット以降で最も前方にある
(1ビット以上の)「1」の連続を処理開始部分として
選ぶ(ステップ1804)。
【0090】次に、(処理開始部分の先頭ビットのビッ
ト番号)/2をpにセットする(ステップ1805)。
ビット列vの処理開始部分の後方で第(2・ie)ビッ
トまでに「1」の連続があるかどうかチェックする(ス
テップ1806)。ビット列vの処理開始部分の後方で
第(2・ie)ビットまでに「1」の連続がなければ1
801に戻る。
【0091】ビット列vの処理開始部分の後方で第(2
・ie)ビットまでに「1」の連続があれば、その最初
のものを処理終了部分として選び、(処理終了部分の最
終ビットのビット番号)/2をqにセットする(ステッ
プ1807)。そのあと、要素A(q−p+1,p)が
空かどうかチェックする(ステップ1808)。要素A
(q−p+1,p)が空であれば(ステップ180
8)、qが終了位置ieより小さく、かつ対応語番号J
T(q+1)が空であるかチェックする(ステップ18
09)。qが終了位置ieより小さく、かつ対応語番号
JT(q+1)が空であるなら、qに1を加えて(ステ
ップ1810)、要素A(q−p+1,p)のチェック
(ステップ1808)に戻るが、そうでなければ、処理
終了部分を処理開始部分にして(ステップ1817)、
ステップ1805に戻る。
【0092】要素A(q−p+1,p)が空でなければ
(ステップ1808)、日本語形態素解析表21の第p
語から第q語の対応語番号JT(p),…,JT(q)
に含まれる語番号の最小値、最大値をそれぞれs,tに
セットし(ステップ1811)、要素B(t−s+1,
s)が空かどうかチェックする(ステップ1812)。
要素B(t−s+1,s)が空であれば(ステップ18
12)、sが開始位置jsより大きく、かつ対応語番号
ET(s−1)が空であるかチェックする(ステップ1
813)。sが開始位置jsより大きく、かつ対応語番
号ET(s−1)が空であるなら、sを1だけ減じて
(ステップ1814)、要素B(t−s+1,s)のチ
ェック(ステップ1812)に戻るが、そうでなけれ
ば、処理終了部分を処理開始部分にして(ステップ18
17)、ステップ1805に戻る。
【0093】要素B(t−s+1,s)が空でなければ
(ステップ1812)、日本語形態素解析表21の第i
s語から第(p−1)語及び第(q+1)語から第ie
語の対応語番号JT(is),…,JT(p−1),J
T(q+1),…,JT(ie)のいずれかにs以上か
つt以下の語番号が含まれるかどうかチェックする(ス
テップ1815)。そのような語番号が含まれていれ
ば、処理終了部分を処理開始部分にして(ステップ18
17)、ステップ1805に戻る。そのような語番号が
含まれていなければ、日本語文の第p語から第q語の部
分、英語文の第s語から第t語の部分を一つの変数にし
た一般化翻訳テンプレートを作成する(ステップ181
6)。そのあと、処理終了部分を処理開始部分にして
(ステップ1817)、ステップ1805に戻る。
【0094】次に、図25のフローチャートに沿って、
日本語文の第p語から第q語の部分、英語文の第s語か
ら第t語の部分を一つの変数にした一般化翻訳テンプレ
ートを作成する処理(ステップ1816)の詳細を説明
する。まず、ビット列vにおいて第(2p)ビットから
第(2q)ビットのうちの「0」を全て「1」に変更し
たものを作成し、日本語文変数部選択ビット列v2にセ
ットし、ビット列wにおいて第(2s)ビットから第
(2t)ビットのうちの「0」を全て「1」に変更した
ものを作成し、英語文変数部選択ビット列w2にセット
する(ステップ1821)。次に、日本語文テンプレー
ト開始位置is2にisを、日本語文翻訳テンプレート
終了位置ie2にieを、日本語文テンプレート句カテ
ゴリーc2に要素A(ie−is+1,is)を、英語
文テンプレート開始位置js2にjsを、英語文翻訳テ
ンプレート終了位置je2にjeを、英語文テンプレー
ト句カテゴリーd2に要素B(je−js+1,js)
を、それぞれセットする(ステップ1822)。
【0095】また、日本語文テンプレート(表示用日本
語文を含む)を作成し(ステップ1823)、英語文テ
ンプレート(表示用英語文を含む)を作成する(ステッ
プ1824)。ステップ1823と1824について
は、後に詳細に説明する。次に、日本語文テンプレート
と英語文テンプレートを対にして、日本語文テンプレー
ト開始位置is2、日本語文翻訳テンプレート終了位置
ie2、日本語文テンプレート句カテゴリーc2、日本
語文変数部選択ビット列v2、英語文テンプレート開始
位置js2、英語文翻訳テンプレート終了位置je2、
英語文テンプレート句カテゴリーd2、および英語文変
数部選択ビット列w2とともに、翻訳テンプレートファ
イル34に出力する(ステップ1825)。最後に、表
示用日本語文、表示用英語文を対にして表示装置5に表
示する(ステップ1826)。
【0096】ステップ1826で表示装置5に表示され
る表示用日本語文と表示用英語文の例を図21(b)に
示す。これに対応する翻訳テンプレートは図5(b)に
示したものである。
【0097】次に、図26のフローチャートに沿って、
日本語文テンプレートを作成する処理(ステップ182
3)の詳細を説明する。まず、日本語文テンプレートバ
ッファをクリアし、バッファ内データ出力位置を示すバ
ッファポインタがバッファ先頭を指すようにする(ステ
ップ1841)。また、表示用日本語文バッファをクリ
アし、バッファ内データ出力位置を示すバッファポイン
タがバッファ先頭を指すようにする(ステップ184
2)。そして、日本語文の語の語番号を示すインデクス
iに初期値としてis2をセットする(ステップ184
3)。
【0098】次に、日本語文変数部選択ビット列v2の
第(2i)ビットv2(2i)が1であれば(ステップ
1844)、{(v2の中の第(2i)ビットから始ま
る「1」の連続の長さ)+1}/2をhにセットし(ス
テップ1845)、変数Xiと、その句カテゴリーとし
て日本語句解析表23の第h行、第i列の要素A(h,
i)を日本語文テンプレートバッファに出力し、バッフ
ァポインタを進める(ステップ1846)。また、日本
語形態素解析表21の第i語から第(i+h−1)の出
現形JW(i),…,JW(i+h−1)に、第i種の
アンダラインを付けて表示用日本語文バッファに出力
し、バッファポインタを進める(ステップ1847)。
さらに、インデクスiにh−1を加える(ステップ18
48)。
【0099】日本語文変数部選択ビット列v2の第(2
i)ビットv2(2i)が0であれば(ステップ184
4)、日本語形態素解析表21の第i語の出現形JW
(i)を日本語文テンプレートバッファに出力し、バッ
ファポインタを進める(ステップ1849)。また、日
本語形態素解析表21の第i語の出現形JW(i)を表
示用日本語文バッファに出力し、バッファポインタを進
める(ステップ1850)。
【0100】ステップ1848または1850のあと、
インデクスiがie2より小さければ(ステップ185
1)、インデクスiに1を加えて(ステップ185
2)、ステップ1844に戻る。インデクスiがie2
と等しければ(ステップ1851)、処理を終了する。
【0101】次に、図27のフローチャートに沿って、
英語文テンプレートを作成する処理(ステップ182
4)の詳細を説明する。まず、英語文テンプレートバッ
ファをクリアし、バッファ内データ出力位置を示すバッ
ファポインタがバッファ先頭を指すようにする(ステッ
プ1861)。また、表示用英語文バッファをクリア
し、バッファ内データ出力位置を示すバッファポインタ
がバッファ先頭を指すようにする(ステップ186
2)。さらに、英語文の語の語番号を示すインデクスj
に初期値としてjs2をセットする(ステップ186
3)。
【0102】次に、英語文変数部選択ビット列w2の第
(2j)ビットw2(2j)が1であれば(ステップ1
864)、{(w2の中の第(2j)ビットから始まる
「1」の連続の長さ)+1}/2をhにセットし(ステ
ップ1865)、英語形態素解析表22の第j語から第
(j+h−1)語の対応語番号ET(j),…,ET
(j+h−1)に含まれる語番号の最小値をインデクス
iにセットする(ステップ1866)。そして、変数X
iと、その句カテゴリーとして英語句解析表24の第h
行、第j列の要素B(h,j)を英語文テンプレートバ
ッファに出力し、バッファポインタを進める(ステップ
1867)。また、英語形態素解析表22の第j語から
第(j+h−1)の出現形EW(j),…,EW(j+
h−1)に、第i種のアンダラインを付けて表示用英語
文バッファに出力し、バッファポインタを進める(ステ
ップ1868)。さらに、インデクスjにh−1を加え
る(ステップ1869)。
【0103】英語文変数部選択ビット列w2の第(2
j)ビットw2(2j)が0であれば(ステップ186
4)、英語形態素解析表22の第j語の出現形EW
(j)を英語文テンプレートバッファに出力し、バッフ
ァポインタを進める(ステップ1870)。また、英語
形態素解析表22の第j語の出現形EW(j)を表示用
英語文バッファに出力し、バッファポインタを進める
(ステップ1871)。
【0104】ステップ1869または1871のあと、
インデクスjがje2より小さければ(ステップ187
2)、インデクスjに1を加えて(ステップ187
3)、ステップ1864に戻る。インデクスjがje2
と等しければ(ステップ1872)、処理を終了する。
【0105】次に、図28のフローチャートに沿って、
部分翻訳テンプレート生成ステップ19の処理を説明す
る。部分翻訳テンプレート生成ステップ19において
は、翻訳テンプレートファイル34中に部分翻訳テンプ
レート生成処理を未適用の翻訳テンプレートがなくなる
まで(ステップ1901)、以下の処理を繰り返す。
【0106】まず、翻訳テンプレートファイル34から
未処理の翻訳テンプレートを読み込む(ステップ190
2)。読み込んだ翻訳テンプレートの日本語文テンプレ
ート開始位置をisに、日本語文翻訳テンプレート終了
位置をieに、日本語文変数部選択ビット列をvに、英
語文テンプレート開始位置をjsに、英語文翻訳テンプ
レート終了位置をjeに、英語文変数部選択ビット列を
wに、それぞれセットする(ステップ1903)。ま
た、開始位置isをpにセットする(ステップ190
4)。
【0107】次に、ビット列vにおいて第(2p)ビッ
トが「1」の連続の開始位置であるかどうかチェックす
る(ステップ1905)。第(2p)ビットが「1」の
連続の開始位置でなければ(ステップ1905)、pの
更新(ステップ1919)に進む。第(2p)ビットが
「1」の連続の開始位置であれば(ステップ190
5)、p+1をqにセットし(ステップ1906)、ビ
ット列vにおいて第(2q)ビットが「1」の連続の終
了位置であるかどうかチェックする(ステップ190
7)。第(2q)ビットが「1」の連続の終了位置でな
ければ(ステップ1907)、qがieより小さいかど
うかのチェック(ステップ1917)に進む。第(2
q)ビットが「1」の連続の終了位置であれば(ステッ
プ1907)、要素A(q−p+1,p)が空かどうか
チェックする(ステップ1908)。要素A(q−p+
1,p)が空であれば(ステップ1908)、qがie
より小さく、かつ対応語番号JT(q+1)が空である
かチェックする(ステップ1909)。qがieより小
さく、かつ対応語番号JT(q+1)が空であるなら、
qに1を加えて(ステップ1910)、要素A(q−p
+1,p)のチェック(ステップ1908)に戻るが、
そうでなければ、qがieより小さいかどうかのチェッ
ク(ステップ1917)に進む。
【0108】要素A(q−p+1,p)が空でなければ
(ステップ1908)、日本語形態素解析表21の第p
語から第q語の対応語番号JT(p),…,JT(q)
に含まれる語番号の最小値、最大値をそれぞれs,tに
セットし(ステップ1911)、要素B(t−s+1,
s)が空かどうかチェックする(ステップ1912)。
要素B(t−s+1,s)が空であれば(ステップ19
12)、sがjsより大きく、かつ対応語番号ET(s
−1)が空であるかチェックする(ステップ191
3)。sがjsより大きく、かつ対応語番号ET(s−
1)が空であるなら、sを1だけ減じて(ステップ19
14)、要素B(t−s+1,s)のチェック(ステッ
プ1912)に戻るが、そうでなければ、qがieより
小さいかどうかのチェック(ステップ1917)に進
む。
【0109】要素B(t−s+1,s)が空でなければ
(ステップ1912)、日本語形態素解析表21の第i
s語から第(p−1)語及び第(q+1)語から第ie
語の対応語番号JT(is),…,JT(p−1),J
T(q+1),…,JT(ie)のいずれかにs以上か
つt以下の語番号が含まれるかどうかチェックする(ス
テップ1915)。そのような語番号が含まれていれ
ば、qがieより小さいかどうかのチェック(ステップ
1917)に進む。そのような語番号が含まれていなけ
れば、日本語文の第p語から第q語の部分、英語文の第
s語から第t語の部分を切り出した部分翻訳テンプレー
トを作成する(ステップ1916)。なお、ステップ1
916については後に詳述する。
【0110】そのあと、qがieより小さいかどうかチ
ェックする(ステップ1917)。qがieより小さけ
れば、qに1を加えて(ステップ1918)、ビット列
vにおいて第(2q)ビットが「1」の連続の終了位置
であるかチェックする処理(ステップ1907)に戻
る。qがieと等しくなれば、pに1を加える(ステッ
プ1919)。pがieより小さければ(ステップ19
20)、ビット列vにおいて第(2p)ビットが「1」
の連続の開始位置であるかチェックする処理(ステップ
1905)に戻り、pがieに等しくなれば(ステップ
1920)、翻訳テンプレートファイル34中に部分翻
訳テンプレート生成処理を未適用の翻訳テンプレートが
あるかチェックする処理(ステップ1901)に戻る。
【0111】次に、図29のフローチャートに沿って、
日本語文の第p語から第q語の部分、英語文の第s語か
ら第t語の部分を切り出した部分翻訳テンプレートを作
成する処理(ステップ1916)の詳細を説明する。ま
ず、日本語文変数化選択ビット列v2にvをセットし、
日本語文変数化選択ビット列w2にwをセットする(ス
テップ1931)。次に、日本語文テンプレート開始位
置is2にpを、日本語文テンプレート終了位置ie2
にqを、日本語文テンプレート句カテゴリーc2に要素
A(q−p+1,p)を、英語文テンプレート開始位置
js2にsを、英語文テンプレート終了位置je2にt
を、英語文テンプレート句カテゴリーd2に要素B(t
−s+1,s)を、それぞれセットする(ステップ19
32)。次に、日本語文テンプレート(表示用日本語文
を含む)を作成する(ステップ1933)。この処理
は、翻訳テンプレート一般化ステップ中の日本語文テン
プレートの作成処理1823(詳細は図26に示した)
と全く同じである。次に、英語文テンプレート(表示用
英語文を含む)を作成する(ステップ1934)。この
処理は、翻訳テンプレート一般化ステップ中の英語文テ
ンプレートの作成処理1824(詳細は図27に示し
た)と全く同じである。
【0112】さらに、日本語文テンプレートと英語文テ
ンプレートを対にして、日本語文テンプレート開始位置
is2、日本語文テンプレート終了位置ie2、日本語
文テンプレート句カテゴリーc2、日本語文変数部選択
ビット列v2、英語文テンプレート開始位置js2、英
語文翻訳テンプレート終了位置je2、英語文テンプレ
ート句カテゴリーd2、および英語文変数部選択ビット
列w2とともに、翻訳テンプレートファイル34に出力
する(ステップ1935)。最後に、表示用日本語文、
表示用英語文を対にして表示装置5に表示する(ステッ
プ1936)。ステップ1936で表示装置5に表示さ
れる表示用日本語文と表示用英語文の例を図21(c)
に示す。これに対応する翻訳テンプレートは図5(c)
に示したものである。
【0113】次に、本発明の第2の実施例の日英翻訳テ
ンプレート学習システムについて説明する。この第2の
実施例は、対訳文中の変数にする部分を人間が指定する
ようにした点が、上述の第1の実施例と異なる。変数部
の指定は日本語文に対して行なうものとする。変数にす
るためにはその部分を句にまとめることができなければ
ならないが、そのチェックはシステムが行なう。英語文
中の変数部の決定もシステムが行なう。すなわち、日本
語文中の変数部として指定された部分の句に対応する英
語文中の句を抽出して変数部とする。
【0114】本実施例のハードウエア構成は第1の実施
例と同様で図1のとおりである。記憶装置2中の日本語
形態素解析表21、英語形態素解析表22、日本語句解
析表23、英語句解析表24、二次記憶装置3中の日英
対訳辞書ファイル31、日本語辞書ファイル32、英語
辞書ファイル33、翻訳テンプレートファイル34も第
1の実施例と同様である。
【0115】本実施例における翻訳テンプレート学習処
理は図30のフローチャートに示すとおりである。
【0116】まず、対訳文読み込みステップA11にお
いて、対訳関係にある日本語文と英語文を入力装置4か
ら読み込む。次に、日本語形態素解析ステップA12に
おいて、日本語辞書ファイル32を参照しながら日本語
文がどんな語から構成されているかを明らかにする。日
本語形態素解析ステップA12によって、日本語形態素
解析表21の出現形211、標準形212、品詞213
に値がセットされる。次に、英語形態素解析ステップA
13において、英語辞書ファイル33を参照しながら英
語文がどんな語から構成されているかを明らかにする。
英語形態素解析ステップA13によって、英語形態素解
析表22の出現形221、標準形222、品詞223に
値がセットされる。
【0117】さらに、日本語句解析ステップA14にお
いて、日本語文に含まれる句の候補を抽出し、日本語句
解析表23を得る。また、英語句解析ステップA15に
おいて、英語文に含まれる句の候補を抽出し、英語句解
析表24を得る。次に、対訳文対応づけステップA16
において、日英対訳辞書ファイル31を参照しながら日
本語文と英語文の間の語の対応関係を同定する。対訳文
対応づけステップA16によって、日本語形態素解析表
21中の対応語番号214と英語形態素解析表22中の
対応語番号224に値がセットされる。
【0118】そのあと、日本語文変数部指定ステップA
17において、日本語文の中で変数化する部分をユーザ
に指定させる。ここでは日本語文と英語文が表示装置5
に表示される。また、対訳文対応づけステップA16で
同定された語の対応関係を見ることもできる。すなわ
ち、日本語文中のカーソルがおかれた語とそれに対応す
る英語文中の語が同時にリバース表示され、カーソルを
移動するとリバース表示される語が変わる。ユーザは日
本語文と英語文の間の語の対応関係を調べた上で、変数
にしたい部分を日本語文上で指定する。
【0119】次に、日本語文変数部検定ステップA18
において、日本語文中のユーザが指定した部分を句にま
とめることができるかどうかを、日本語句解析表23を
参照することによって判定する。指定された部分が句に
まとめられる場合、英語文変数部決定ステップA19に
おいて、日本語形態素解析表21の対応語番号214、
英語形態素解析表22の対応語番号224と英語句解析
表24を参照することによって、日本語文中の指定され
た部分の句と対応する英語文中の句を抽出する。対応す
る句とは、日本語文中の指定された部分の句に含まれる
語と対応づけられた語を全て含み、日本語文中の指定さ
れた部分の句に含まれない語と対応づけられた語を含ま
ない句である。
【0120】英語文中の対応する句が抽出できた場合、
翻訳テンプレート生成ステップA20において、日本語
文中の指定された部分の句と英語文中の対応する句とを
相互に対応づけられた変数にすることによって翻訳テン
プレートを生成する。生成した翻訳テンプレートは、翻
訳テンプレートファイル34に出力する。
【0121】なお、日本語文変数部検定ステップA18
において、日本語文中のユーザが指定した部分が句にま
とめられなかった場合、あるいは英語文変数部決定ステ
ップA19において、日本語文中の指定された部分の句
と対応する英語文中の句を抽出できなかった場合は、エ
ラーメッセージ出力ステップA21に飛び、変数部指定
が不適切であった旨、表示装置5にメッセージ出力す
る。
【0122】次に、本発明の第3の実施例の日英翻訳テ
ンプレート学習システムについて説明する。第2の実施
例では変数化する部分の指定を日本語文に対して行な
い、英語文の対応する部分の抽出を自動的に行なったの
に対し、この第3の実施例では、日本語文および英語文
の両方に対して変数化する部分を人間が指定するように
している。翻訳テンプレートを作るためには、日本語文
中の指定された部分および英語文中の指定された部分が
ともに句にまとめられ、かつ相互に対応した部分である
ことが前提になるが、そのチェックはシステムが行な
う。
【0123】本実施例のハードウエア構成は第1の実施
例と同様で図1のとおりである。記憶装置2中の日本語
形態素解析表21、英語形態素解析表22、日本語句解
析表23、英語句解析表24、二次記憶装置3中の日英
対訳辞書ファイル31、日本語辞書ファイル32、英語
辞書ファイル33、翻訳テンプレートファイル34も第
1の実施例と同様である。
【0124】本実施例における翻訳テンプレート学習処
理は図31のフローチャートに示すとおりである。
【0125】ここで、対訳文読み込みステップB11、
日本語形態素解析ステップB12、英語形態素解析ステ
ップB13、日本語句解析ステップB14、英語句解析
ステップB15、対訳文対応づけステップB16は第2
の実施例のステップA11−A16と全く同じである。
【0126】そのあと、日本語文・英語文変数部指定ス
テップB17において、日本語文の中で変数化する部分
と英語文の中で変数化する部分をユーザに指定させる。
次に、日本語文変数部検定ステップB18において、日
本語文中のユーザが指定した部分を句にまとめることが
できるかどうかを、日本語句解析表23を参照すること
によって判定する。
【0127】指定された部分が句にまとめられる場合、
英語文変数部検定ステップB19において、英語文中の
ユーザが指定した部分を句にまとめることができるかど
うかを、英語句解析表24を参照することによって判定
する。指定された部分が句にまとめられる場合、日本語
文・英語文変数部対応検定ステップB20において、日
本語形態素解析表21の対応語番号214と英語形態素
解析表22の対応語番号224を参照することによっ
て、日本語文中の指定された部分の句と英語文中の指定
された部分の句が相互に対応しているかどうかチェック
する。日本語文中の指定された部分の句と英語文中の指
定された部分の句が相互に対応している場合、翻訳テン
プレート生成ステップB21において、日本語文中の指
定された部分の句と英語文中の指定された部分の句とを
相互に対応づけられた変数にすることによって翻訳テン
プレートを生成し、翻訳テンプレートファイル34に出
力する。
【0128】なお、日本語文変数部検定ステップB18
において、日本語文中の指定された部分を句にまとめる
ことができなかった場合、英語文変数部検定ステップB
19において、英語文中の指定された部分を句にまとめ
ることができなかった場合、あるいは日本語文・英語文
変数部対応検定ステップB20において、日本語文中の
指定された部分の句と英語文中の指定された部分の句が
対応していないと判定された場合は、エラーメッセージ
出力ステップB22に飛び、変数部指定が不適切であっ
た旨、表示装置5にメッセージ出力する。
【0129】なお、自動的に生成された翻訳テンプレー
トのうちから不適当なものを自動的に排除するようにし
てもよい。また、生成された翻訳テンプレートを表示し
て操作者が不適当なものを排除するようにしてもよい。
【0130】
【発明の効果】本発明によれば、対訳文から翻訳テンプ
レートを自動的に学習(生成)することができる。その
ため、類似の対訳文を複数用意する必要がない。また、
語句の対応が明確でない部分を含む対訳文からも学習可
能な方式であり、人間並みの質のよい翻訳を可能にする
翻訳テンプレートを得ることができる。さらに、種々の
レベルの句をまとめて変数化した翻訳テンプレートや対
訳文の一部分のみに対応した翻訳テンプレートを学習す
ることもできるので、一つの対訳文の利用範囲が広がる
という効果もある。
【図面の簡単な説明】
【図1】日英翻訳テンプレート学習システムのハードウ
エア構成図である。
【図2】日英対訳辞書ファイルのレコードの例である。
【図3】日本語辞書ファイルのレコードの例である。
【図4】英語辞書ファイルのレコードの例である。
【図5】翻訳テンプレートファイルのレコードの例であ
る。
【図6】日本語形態素解析表の例である。
【図7】英語形態素解析表の例である。
【図8】日本語句解析表の例である。
【図9】英語句解析表の例である。
【図10】翻訳テンプレート学習処理のフローチャート
である。
【図11】日本語句解析ステップで用いられる日本語句
構造文法の例である。
【図12】日本語句解析ステップにおける句候補抽出処
理のフローチャートである。
【図13】句候補棄却処理を施す前の日本語句解析表の
例である。
【図14】日本語句解析ステップにおける句候補棄却処
理のフローチャートである。
【図15】英語句解析ステップで用いられる英語句構造
文法の例である。
【図16】句候補棄却処理を施す前の英語句解析表の例
である。
【図17】対訳文対応づけステップにおける語の対応関
係候補抽出処理のフローチャートである。
【図18】対訳文対応づけステップにおける削除不可の
語の対応関係候補選出処理のフローチャートである。
【図19】対訳文対応づけステップにおける語の対応関
係のあいまい性解消処理のフローチャートである。
【図20】翻訳テンプレート生成ステップの処理フロー
チャートである。
【図21】表示用日本語文と表示用英語文の例である。
【図22】翻訳テンプレート生成ステップにおける日本
語文テンプレートの作成処理のフローチャートである。
【図23】翻訳テンプレート生成ステップにおける英語
文テンプレートの作成処理のフローチャートである。
【図24】翻訳テンプレート一般化ステップの処理フロ
ーチャートである。
【図25】翻訳テンプレート一般化ステップにおける一
般化翻訳テンプレートの作成処理のフローチャートであ
る。
【図26】翻訳テンプレート一般化ステップ及び部分翻
訳テンプレート生成ステップにおける日本語文テンプレ
ートの作成処理のフローチャートである。
【図27】翻訳テンプレート一般化ステップ及び部分翻
訳テンプレート生成ステップにおける英語文テンプレー
トの作成処理のフローチャートである。
【図28】部分翻訳テンプレート生成ステップの処理フ
ローチャートである。
【図29】部分翻訳テンプレート生成ステップにおける
部分翻訳テンプレートの作成処理のフローチャートであ
る。
【図30】第2の実施例における翻訳テンプレート学習
処理のフローチャートである。
【図31】第3の実施例における翻訳テンプレート学習
処理のフローチャートである。
【符号の説明】
1 中央処理装置 2 記憶装置 3 二次記憶装置 4 入力装置 5 表示装置 11 対訳文読み込みステップ 12 日本語形態素解析ステップ 13 英語形態素解析ステップ 14 日本語句解析ステップ 15 英語句解析ステップ 16 対訳文対応づけステップ 17 翻訳テンプレート生成ステップ 18 翻訳テンプレート一般化ステップ 19 部分翻訳テンプレート生成ステップ 21 日本語形態素解析表 22 英語形態素解析表 23 日本語句解析表 24 英語句解析表 31 日英対訳辞書ファイル 32 日本語辞書ファイル 33 英語辞書ファイル 34 翻訳テンプレートファイル A11 対訳文読み込みステップ A12 日本語形態素解析ステップ A13 英語形態素解析ステップ A14 日本語句解析ステップ A15 英語句解析ステップ A16 対訳文対応づけステップ A17 日本語文変数部指定ステップ A18 日本語文変数部検定ステップ A19 英語文変数部決定ステップ A20 翻訳テンプレート生成ステップ A21 エラーメッセージ出力ステップ B11 対訳文読み込みステップ B12 日本語形態素解析ステップ B13 英語形態素解析ステップ B14 日本語句解析ステップ B15 英語句解析ステップ B16 対訳文対応づけステップ B17 日本語文・英語文変数部指定ステップ B18 日本語文変数部検定ステップ B19 英語文変数部検定ステップ B20 日本語文・英語文変数部対応検定ステップ B21 翻訳テンプレート生成ステップ B22 エラーメッセージ出力ステップ

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】さまざまな語句に置き換え可能な変数を含
    み、互いに対訳関係にある第1言語の文と第2言語の文
    とで構成される翻訳テンプレートを自動生成する翻訳テ
    ンプレート学習方法であって、 互いに対訳関係にある第1言語の文と第2言語の文とを
    読み込む対訳文読み込みステップと、 第1言語と第2言語の間の対訳辞書を参照することによ
    って、上記対訳文読み込みステップで読み込んだ第1言
    語の文と第2言語の文との間の語の対応関係を同定する
    対訳文対応づけステップと、 上記対訳文対応づけステップで同定された対応関係の集
    合から部分集合を任意に選び、該部分集合に属する対応
    関係の各々について対応関係を成している第1言語の文
    中の語と第2言語の文中の語とを相互に対応づけられた
    変数にすることによって翻訳テンプレートを生成する翻
    訳テンプレート生成ステップとを含むことを特徴とする
    翻訳テンプレート学習方法。
  2. 【請求項2】さまざまな語句に置き換え可能な変数を含
    み、互いに対訳関係にある第1言語の文と第2言語の文
    とで構成される翻訳テンプレートを自動生成する翻訳テ
    ンプレート学習方法であって、 翻訳テンプレートの構成要素である第1言語の文から句
    の候補を抽出する第1言語句解析ステップと、 翻訳テンプレートの構成要素である第2言語の文から句
    の候補を抽出する第2言語句解析ステップと、 上記第1言語句解析ステップで抽出した句候補と上記第
    2言語句解析ステップで抽出した句候補との組であって
    包含する変数の集合が同一となるような組があれば、第
    1言語の文中の該句候補と第2言語の文中の該句候補を
    相互に対応づけられた変数にすることによって新しい翻
    訳テンプレートを生成する翻訳テンプレート一般化ステ
    ップとを含むことを特徴とする翻訳テンプレート学習方
    法。
  3. 【請求項3】さまざまな語句に置き換え可能な変数を含
    み、互いに対訳関係にある第1言語の文と第2言語の文
    とで構成される翻訳テンプレートを自動生成する翻訳テ
    ンプレート学習方法であって、 翻訳テンプレートの構成要素である第1言語の文から句
    の候補を抽出する第1言語句解析ステップと、 翻訳テンプレートの構成要素である第2言語の文から句
    の候補を抽出する第2言語句解析ステップと、 上記第1言語句解析ステップで抽出した句候補と上記第
    2言語句解析ステップで抽出した句候補との組であって
    包含する変数の集合が同一となるような組があれば、第
    1言語の文中の該句候補の部分と第2言語の文中の該句
    候補の部分を切り出して、その切り出した部分から新し
    い翻訳テンプレートを生成する部分翻訳テンプレート生
    成ステップとを含むことを特徴とする翻訳テンプレート
    学習方法。
  4. 【請求項4】さまざまな語句に置き換え可能な変数を含
    み、互いに対訳関係にある第1言語の文と第2言語の文
    とで構成される翻訳テンプレートを自動生成する翻訳テ
    ンプレート学習方法であって、 互いに対訳関係にある第1言語の文と第2言語の文とを
    読み込む対訳文読み込みステップと、 上記対訳文読み込みステップで読み込んだ第1言語の文
    と第2言語の文との間の語の対応関係を同定する対訳文
    対応づけステップと、 第1言語の文の中で変数化する部分を指定させる第1言
    語文変数部指定ステップと、 第1言語の文中の該指定された部分の句と対応する第2
    言語の文中の句を抽出する第2言語文変数部決定ステッ
    プと、 第1言語の文中の該指定された部分の句と第2言語の文
    中の対応する句とを相互に対応づけられた変数にするこ
    とによって翻訳テンプレートを生成する翻訳テンプレー
    ト生成ステップとを含むことを特徴とする翻訳テンプレ
    ート学習方法。
  5. 【請求項5】前記第1言語文変数部指定ステップで指定
    された部分を句にまとめることができるかどうかを判定
    する第1言語文変数部検定ステップを、さらに備えた請
    求項4の翻訳テンプレート学習方法。
  6. 【請求項6】さまざまな語句に置き換え可能な変数を含
    み、互いに対訳関係にある第1言語の文と第2言語の文
    とで構成される翻訳テンプレートを自動生成する翻訳テ
    ンプレート学習方法であって、 互いに対訳関係にある第1言語の文と第2言語の文とを
    読み込む対訳文読み込みステップと、 上記対訳文読み込みステップで読み込んだ第1言語の文
    と第2言語の文との間の語の対応関係を同定する対訳文
    対応づけステップと、 第1言語の文と第2言語の文の中でそれぞれ変数化する
    部分を指定させる第1言語文・第2言語文変数部指定ス
    テップと、 第1言語の文中の指定された部分と第2言語の文中の指
    定された部分とを相互に対応づけられた変数にすること
    によって翻訳テンプレートを生成する翻訳テンプレート
    生成ステップとを含むことを特徴とする翻訳テンプレー
    ト学習方法。
  7. 【請求項7】さらに、前記第1言語文・第2言語文変数
    部指定ステップで指定された第1言語の文中の指定され
    た部分を句にまとめることができるかどうかを判定する
    第1言語文変数部検定ステップと、 前記第1言語文・第2言語文変数部指定ステップで指定
    された第2言語の文中の指定された部分を句にまとめる
    ことができるかどうかを判定する第2言語文変数部検定
    ステップと、 第1言語の文中の指定された部分と第2言語の文中の指
    定された部分の両方が句にまとめられる場合、それらの
    句が相互に対応する句であるかどうか判定する第1言語
    文・第2言語文変数部対応検定ステップとをさらに備え
    た請求項6の翻訳テンプレート学習方法。
  8. 【請求項8】前記第1言語文変数部指定ステップまたは
    前記第1言語文・第2言語文変数部指定ステップに先だ
    って、対訳文対応づけステップの結果を表示する対訳文
    対応表示ステップをさらに備えた請求項4ないし7の翻
    訳テンプレート学習方法。
  9. 【請求項9】生成した翻訳テンプレートの元になった第
    1言語の文と第2言語の文を、変数化された部分とそれ
    以外の部分を区別した表示様式で表示する原対訳文表示
    ステップをさらに備えた請求項1ないし8の翻訳テンプ
    レート学習方法。
  10. 【請求項10】さまざまな語句に置き換え可能な変数を
    含み、互いに対訳関係にある第1言語の文と第2言語の
    文とで構成される翻訳テンプレートを自動生成する翻訳
    テンプレート学習システムであって、 互いに対訳関係にある第1言語の文と第2言語の文とを
    読み込む対訳文読み込み手段と、 第1言語の語と第2言語の語との間の対応関係を記憶し
    た対訳辞書と、 該対訳辞書を参照することによって、上記対訳文読み込
    み手段で読み込んだ第1言語の文と第2言語の文との間
    の語の対応関係を同定する対訳文対応づけ手段とを含む
    ことを特徴とする翻訳テンプレート学習システム。
  11. 【請求項11】さらに、第1言語の文の中で変数化する
    部分を指定させる第1言語文変数部指定手段を備えた請
    求項10の翻訳テンプレート学習システム。
  12. 【請求項12】さらに、第1言語の文と第2言語の文の
    中でそれぞれ変数化する部分を指定させる第1言語文・
    第2言語文変数部指定手段を備えた請求項10の翻訳テ
    ンプレート学習システム。
  13. 【請求項13】さらに、対訳文対応づけの結果を表示す
    る対訳文対応表示手段を備えた請求項10ないし12の
    翻訳テンプレート学習システム。
  14. 【請求項14】前記対訳文対応表示手段は、生成した翻
    訳テンプレートの元になった第1言語の文と第2言語の
    文を、変数化された部分とそれ以外の部分を区別した表
    示様式で表示する請求項13の翻訳テンプレート学習シ
    ステム。
JP3315981A 1991-11-29 1991-11-29 翻訳テンプレート学習方法および翻訳テンプレート学習システム Pending JPH05151260A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP3315981A JPH05151260A (ja) 1991-11-29 1991-11-29 翻訳テンプレート学習方法および翻訳テンプレート学習システム
US07/983,147 US5442546A (en) 1991-11-29 1992-11-30 System and method for automatically generating translation templates from a pair of bilingual sentences

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3315981A JPH05151260A (ja) 1991-11-29 1991-11-29 翻訳テンプレート学習方法および翻訳テンプレート学習システム

Publications (1)

Publication Number Publication Date
JPH05151260A true JPH05151260A (ja) 1993-06-18

Family

ID=18071906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3315981A Pending JPH05151260A (ja) 1991-11-29 1991-11-29 翻訳テンプレート学習方法および翻訳テンプレート学習システム

Country Status (2)

Country Link
US (1) US5442546A (ja)
JP (1) JPH05151260A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5687383A (en) * 1994-09-30 1997-11-11 Kabushiki Kaisha Toshiba Translation rule learning scheme for machine translation
US7124209B2 (en) 2002-07-05 2006-10-17 Kabushiki Kaisha Toshiba Peripheral equipment of computer
JP2010282453A (ja) * 2009-06-05 2010-12-16 Hitachi Ltd 機械翻訳方法、及びシステム

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2272091B (en) * 1992-10-30 1996-10-23 Canon Europa Nv Apparatus for use in aligning bilingual corpora
JP2965455B2 (ja) * 1994-02-15 1999-10-18 富士ゼロックス株式会社 言語情報提供装置
EP0672989A3 (en) * 1994-03-15 1998-10-28 Toppan Printing Co., Ltd. Machine translation system
US5812818A (en) * 1994-11-17 1998-09-22 Transfax Inc. Apparatus and method for translating facsimile text transmission
US5960382A (en) * 1997-07-07 1999-09-28 Lucent Technologies Inc. Translation of an initially-unknown message
US6363337B1 (en) * 1999-01-19 2002-03-26 Universal Ad Ltd. Translation of data according to a template
US6598015B1 (en) * 1999-09-10 2003-07-22 Rws Group, Llc Context based computer-assisted language translation
US7660740B2 (en) 2000-10-16 2010-02-09 Ebay Inc. Method and system for listing items globally and regionally, and customized listing according to currency or shipping area
US6641401B2 (en) * 2001-06-20 2003-11-04 Leapfrog Enterprises, Inc. Interactive apparatus with templates
AU2002316581A1 (en) 2001-07-03 2003-01-21 University Of Southern California A syntax-based statistical translation model
US7752266B2 (en) 2001-10-11 2010-07-06 Ebay Inc. System and method to facilitate translation of communications between entities over a network
US20030144912A1 (en) * 2002-01-29 2003-07-31 Mcgee Todd Multilingual messaging system and method for e-commerce
WO2004001623A2 (en) 2002-03-26 2003-12-31 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
US8719041B2 (en) 2002-06-10 2014-05-06 Ebay Inc. Method and system for customizing a network-based transaction facility seller application
US8078505B2 (en) 2002-06-10 2011-12-13 Ebay Inc. Method and system for automatically updating a seller application utilized in a network-based transaction facility
US7941348B2 (en) 2002-06-10 2011-05-10 Ebay Inc. Method and system for scheduling transaction listings at a network-based transaction facility
US7734627B1 (en) * 2003-06-17 2010-06-08 Google Inc. Document similarity detection
US7742985B1 (en) 2003-06-26 2010-06-22 Paypal Inc. Multicurrency exchanges between participants of a network-based transaction facility
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US9189568B2 (en) 2004-04-23 2015-11-17 Ebay Inc. Method and system to display and search in a language independent manner
US7853473B2 (en) * 2004-08-31 2010-12-14 Revionics, Inc. Market-based price optimization system
DE112005002534T5 (de) 2004-10-12 2007-11-08 University Of Southern California, Los Angeles Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US10319252B2 (en) * 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US7536295B2 (en) * 2005-12-22 2009-05-19 Xerox Corporation Machine translation using non-contiguous fragments of text
US8943080B2 (en) * 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8549492B2 (en) * 2006-04-21 2013-10-01 Microsoft Corporation Machine declarative language for formatted data processing
US8171462B2 (en) * 2006-04-21 2012-05-01 Microsoft Corporation User declarative language for formatted data processing
US20080046231A1 (en) * 2006-05-26 2008-02-21 Srk Ventures, Llc System and Method of Language Translation
US7725306B2 (en) * 2006-06-28 2010-05-25 Microsoft Corporation Efficient phrase pair extraction from bilingual word alignments
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US8639782B2 (en) 2006-08-23 2014-01-28 Ebay, Inc. Method and system for sharing metadata between interfaces
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8831928B2 (en) * 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US20090013268A1 (en) * 2007-07-02 2009-01-08 Universal Ad Ltd. Creation Of Visual Composition Of Product Images
JP5105513B2 (ja) * 2007-07-20 2012-12-26 インターナショナル・ビジネス・マシーンズ・コーポレーション 処理対象として適切なテキストを選択する技術
US8407040B2 (en) * 2008-02-29 2013-03-26 Sharp Kabushiki Kaisha Information processing device, method and program
US8706477B1 (en) 2008-04-25 2014-04-22 Softwin Srl Romania Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code
US8762131B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates
US8762130B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
JP2011044023A (ja) * 2009-08-21 2011-03-03 Sharp Corp 情報処理装置、表示制御方法、およびプログラム
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US8712761B2 (en) * 2011-11-22 2014-04-29 Google Inc. Techniques for performing translation of messages
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US9805028B1 (en) * 2014-09-17 2017-10-31 Google Inc. Translating terms using numeric representations
US10915707B2 (en) * 2017-10-20 2021-02-09 MachineVantage, Inc. Word replaceability through word vectors
CN108121697B (zh) * 2017-11-16 2022-02-25 北京百度网讯科技有限公司 一种文本改写的方法、装置、设备和计算机存储介质
CN113408307B (zh) * 2021-07-14 2022-06-14 北京理工大学 一种基于翻译模板的神经机器翻译方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JPS58101365A (ja) * 1981-12-14 1983-06-16 Hitachi Ltd 機械翻訳システム
JPH0782498B2 (ja) * 1985-01-14 1995-09-06 株式会社日立製作所 機械翻訳システム
US4916614A (en) * 1986-11-25 1990-04-10 Hitachi, Ltd. Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words
JPH01314373A (ja) * 1988-06-15 1989-12-19 Hitachi Ltd 機械翻訳システムにおける訳語選択方式
JPH0242572A (ja) * 1988-08-03 1990-02-13 Hitachi Ltd 共起関係辞書生成保守方法
JPH02159674A (ja) * 1988-12-13 1990-06-19 Matsushita Electric Ind Co Ltd 意味解析装置と構文解析装置
JPH02240769A (ja) * 1989-03-14 1990-09-25 Canon Inc 自然言語文生成装置
US5170349A (en) * 1989-03-14 1992-12-08 Canon Kabushiki Kaisha Text processing apparatus using modification relation analysis
JPH02301869A (ja) * 1989-05-17 1990-12-13 Hitachi Ltd 自然言語処理システム保守支援方式
JP3114181B2 (ja) * 1990-03-27 2000-12-04 株式会社日立製作所 異言語交信用翻訳方法およびシステム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5687383A (en) * 1994-09-30 1997-11-11 Kabushiki Kaisha Toshiba Translation rule learning scheme for machine translation
US7124209B2 (en) 2002-07-05 2006-10-17 Kabushiki Kaisha Toshiba Peripheral equipment of computer
JP2010282453A (ja) * 2009-06-05 2010-12-16 Hitachi Ltd 機械翻訳方法、及びシステム

Also Published As

Publication number Publication date
US5442546A (en) 1995-08-15

Similar Documents

Publication Publication Date Title
JPH05151260A (ja) 翻訳テンプレート学習方法および翻訳テンプレート学習システム
US4502128A (en) Translation between natural languages
CN107209759B (zh) 注解辅助装置及记录介质
US5311429A (en) Maintenance support method and apparatus for natural language processing system
US4774666A (en) Translating apparatus
US6275789B1 (en) Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
JP3189186B2 (ja) パターンに基づく翻訳装置
KR20040111715A (ko) 검색 시스템에 사용하기 위해 텍스트 문서로부터 정보를검색하기 위한 자기 학습 시스템의 합성 방법
JPH1011447A (ja) パターンに基づく翻訳方法及び翻訳システム
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
ITUD20000228A1 (it) Sistema e metodo di traduzione automatica o semiautomatica con posteditazione per la correzione degli errori
JPS6140673A (ja) 外国語作文用翻訳方法、および翻訳機
JPS62163173A (ja) 機械翻訳方法
Sawalha Open-source resources and standards for Arabic word structure analysis: Fine grained morphological analysis of Arabic text corpora
US4833611A (en) Machine translation system
JP2004513458A (ja) ユーザが変更可能な翻訳のウエイト
US5608623A (en) Special cooccurrence processing method and apparatus
JP2020190970A (ja) 文書処理装置およびその方法、プログラム
Waxman A graph database of scholastic relationships in the Babylonian Talmud
Abdulrahman et al. A language model for spell checking of educational texts in kurdish (sorani)
Gamal et al. Survey of arabic machine translation, methodologies, progress, and challenges
JPS61278970A (ja) 自然言語処理装置における構文解析結果の表示及び校正のための制御方法
JPH07244665A (ja) 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置
JP3013388B2 (ja) 言語情報検索装置
JP3353647B2 (ja) 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体