JP3778785B2

JP3778785B2 - 最適翻訳文選定方法，選定装置および記録媒体

Info

Publication number: JP3778785B2
Application number: JP2000232576A
Authority: JP
Inventors: 尚之徳田; 亮陳; 紘幸笹井
Original assignee: SunFlare Co Ltd
Current assignee: SunFlare Co Ltd
Priority date: 2000-08-01
Filing date: 2000-08-01
Publication date: 2006-05-24
Anticipated expiration: 2020-08-01
Also published as: JP2002049617A

Description

【０００１】
【発明の属する技術分野】
本発明は、最適翻訳文選定方法，選定装置および記録媒体に係り、特に既存のコンピュータ・プログラム用マニュアルの内容を一部改訂して改訂版を作る等の際に用いるのに好適な最適翻訳文選定方法、選定装置および記録媒体に関する。
【０００２】
【従来の技術】
一般に、コンピュータ・プログラムは全世界で販売されることが多いため、そのマニュアルは、英語を初めとして、日本語，フランス語，ドイツ語，中国語等，多数の言語を用いて作成する必要がある。
【０００３】
従来、このような場合には、まず基体となる言語，例えば英語でマニュアルを作成し、この英語に基づき、各言語の専門家が日本語等の各言語に翻訳する方法が採られている。そしてこの場合、例えば日本語マニュアルの各文章は、英語マニュアルの各文章と意味的に完全に等価なものとなっている。
【０００４】
【発明が解決しようとする課題】
ところで、コンピュータ・プログラムは、その内容を部分的に改訂して新たな機能を付加することがしばしば行なわれるが、部分的に改訂した部分ついては、マニュアルの内容も訂正，変更あるいは追加することが必要となる。
【０００５】
従来、このような部分的な改訂も人力で行なっているが、例えば英語マニュアルの改訂部分が日本語マニュアルのどの部分に該当し、その内容がどのように変更されたのかを理解するためには、日本語の知識のみならず、英語の知識も必要となり、そのような翻訳専門家を確保することは容易でないという問題がある。
【０００６】
そこで、改訂部分については、コンピュータを用いて機械翻訳することが考えられるが、従来の機械翻訳では、単語単位で意味を当て嵌め、これを当該言語の文法規則に基づき並べ替えする等の単純な方法でしか翻訳を行なっていないため、実際に使用できるような翻訳文が得られないという問題がある。
【０００７】
ところで、前記コンピュータ・プログラム用マニュアルのような場合、改訂部分以外の既存部分については、各言語間において、各文章が完全に一対一で対応している。したがって、改訂部分について、各文章が既存部分ではどのように翻訳されているかを検討し、既存部分における同一文章あるいは類似文章の翻訳文を、改訂部分の文章の翻訳文として当て嵌めることにより、極めて短時間で、しかも極めて精度の高い翻訳文が得られるものと予想される。
【０００８】
本発明は、かかる知見に基づきなされたもので、機械翻訳であっても、極めて短時間で精度の高い翻訳文を得ることができる最適翻訳文選定方法，選定装置および記録媒体を提供することを目的とする。
【０００９】
【課題を解決するための手段】
前記目的を達成するため本発明は、ＡＴＮ機能を有する任意数の文章要素を同列で包含する複数のテンプレートブロックで構成される原文用のテンプレート群およびこのテンプレート群と意味的に等価な訳文用テンプレート群が、相互に関連付けて記憶されている翻訳用データベースを用い、前記テンプレート群から作成可能なすべてのテンプレートパターン候補の中から、入力文に最も適したテンプレートパターン候補を検索するとともに、このテンプレートパターン候補に対応する訳文用テンプレートパターン候補を、前記訳文用テンプレート群から作成し、この訳文用テンプレートパターン候補を、最適翻訳文として選定する最適翻訳文選定方法であって、前記テンプレート群中のすべての単語に、その重要度に応じたポイント数のポイントを付与した後、前記すべてのテンプレートパターン候補および入力文について、各テンプレートパターン候補および入力文で用いられているすべての単語のテンプレート群中における出現頻度とその単語のポイント数とに基づき、各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを求めるとともに、ＳＶＤアルゴリズムを用いて設定される圧縮文書ＬＳＩベクトル空間に射影し、入力文に対し圧縮文書ＬＳＩベクトル空間における類似度が高い順に複数のテンプレートパターン候補を選んで優良テンプレートパターン候補とし、次いで各優良テンプレートパターン候補で用いられているすべての単語の合計ポイント数を分母，入力文と各優良テンプレートパターン候補との間での一致単語の合計ポイント数を分子とする最適度比較値を求め、分子が最大となる最適度比較値のうちで、最適度比較値が最も大きくなる優良テンプレートパターン候補を選ぶとともに、これに対応する訳文用テンプレートパターン候補を、最適翻訳文として選定するようにしたことを特徴とする。
【００１０】
すなわち、本発明においては、例えば英語マニュアルの一部が改訂され、この改訂された部分を、日本語に翻訳するような場合、まず英語マニュアルの既存部分と日本語マニュアルの既存部分とが、相互に関係付けられたテンプレート群の形式で翻訳用データベースに記憶される。したがって、翻訳用データベース内においては、英語のテンプレート群（原文用のテンプレート群）から得られる文章と、日本語のテンプレート群（訳文用テンプレート群）から得られる文章とが、一対一で対応していることになる。
【００１１】
この状態で、英語の入力文（改訂部分の英語の文章）が入力されると、この入力文と同一あるいは最も類似する文章が、英語のテンプレートパターンの形式で翻訳用データベースから選ばれ、これに対応する日本語のテンプレートパターンが、最適翻訳文として選定されることになる。
【００１２】
ここで、翻訳用データベースに記憶されているデータ量が多ければ多い程、最適翻訳文の選定精度が向上することは明らかであるが、反面データ量が多くなれば、最適翻訳文の選定処理に多くの時間を要し実用に供し得ない。
【００１３】
ところが本発明においては、正規化ＬＳＩベクトルを圧縮文書ＬＳＩベクトル空間に射影する方法を用い、粗い選定を行なって対象となるテンプレートパターンの数を絞り、その後絞られた少数のテンプレートパターンに対し、最適度比較値を用いた詳細選定を行なうようにしている。このため、精度の高い最適翻訳文を短時間で得ることが可能となる。
【００１４】
本発明はまた、ＡＴＮ機能を有する任意数の文章要素を同列で包含する複数のテンプレートブロックで構成される原文用のテンプレート群およびこのテンプレート群と意味的に等価な訳文用テンプレート群とを、相互に関連付けて記憶する翻訳用データベースと；入力文を記憶する入力文記憶手段と；前記テンプレート群の各テンプレートブロックと入力文とを比較し、テンプレート群から作成可能なすべてのテンプレートパターン候補を検索するテンプレートパターン候補検索手段；検索されたテンプレートパターン候補を記憶するテンプレートパターン候補記憶手段と；テンプレート群中のすべての単語にその重要度に応じたポイント数で付与されるポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と；各テンプレートパターン候補および入力文で用いられるすべての単語のテンプレート群中における出現頻度を、各テンプレートパターン候補および入力文毎に単語と関連付けて記憶する単語出現頻度記憶手段と；単語の出現頻度とポイント数とに基づき、各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを演算する正規化ＬＳＩベクトル演算手段と；演算された各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを記憶する正規化ＬＳＩベクトル記憶手段と；ＳＶＤアルゴリズムを用いて設定される圧縮文書ＬＳＩベクトル空間において、各テンプレートパターン候補の正規化ＬＳＩベクトルと入力文の正規化ＬＳＩベクトルとを比較し、その類似度を演算する類似度演算手段と；類似度が高い方から順に選ばれた複数のテンプレートパターン候補を、優良テンプレートパターン候補として記憶する優良テンプレートパターン候補記憶手段と；各優良テンプレートパターン候補において入力文と一致する単語を検索する一致単語検索手段と；各優良テンプレートパターン候補で用いられているすべての単語の合計ポイント数を演算する合計ポイント数演算手段と；入力文と各優良テンプレートパターン候補との間での一致単語の合計ポイント数を演算する一致単語ポイント数演算手段と；各優良テンプレートパターン候補における全単語の合計ポイント数を分母，各優良テンプレートパターン候補における入力文との一致単語の合計ポイント数を分子とする最適比較値を演算する最適度比較値演算手段と；各優良テンプレートパターン候補の最適度比較値を比較し、分子が最大となる最適度比較値のうちで、最も大きな最適度比較値を有する優良テンプレートパターン候補を、最適テンプレートパターン候補として決定する最適テンプレートパターン候補決定手段と；最適テンプレートパターン候補に対応する訳文用テンプレートパターン候補を、最適翻訳文として選定する最適翻訳文選定手段と；を設けるようにしとたことを特徴とする。そして、類似度演算手段等を用い、対象となるテンプレートパターンの数を優良テンプレートパターン候補として絞った後、最適テンプレートパターン候補決定手段等を用い最適なテンプレートパターン候補を決定するようにしているので、短時間で精度の高い最適翻訳文を選定することが可能となる。
【００１５】
本発明はさらに、ＡＴＮ機能を有する任意数の文章要素を同列で包含する複数のテンプレートブロックで構成される原文用のテンプレート群およびこのテンプレート群と意味的に等価な訳文用テンプレート群を、相互に関連付けてメモリ領域に記憶させる処理；入力文をメモリ領域に記憶させる処理；前記テンプレート群中のすべての単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けてメモリ領域に記憶させる処理；前記テンプレート群から作成可能なすべてのテンプレートパターン候補および入力文について、各テンプレートパターン候補および入力文で用いられているすべての単語のテンプレート群中における出現頻度とその単語のポイント数とに基づき、各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを求める処理；ＳＶＤアルゴリズムを用いて設定される圧縮文書ＬＳＩベクトル空間において、各テンプレートパターン候補の正規化ＬＳＩベクトルと入力文の正規化ＬＳＩベクトルとを比較し、その類似度を求める処理；類似度の高い方から順に選んだ複数のテンプレートパターン候補を、優良テンプレートパターン候補としてメモリ領域に記憶させる処理；各優良テンプレートパターン候補で用いられるすべての単語の合計ポイント数を分母，入力文と各優良テンプレートパターン候補との間での一致単語の合計ポイント数を分子とする最適度比較値を用い、分子が最大となる最適度比較値のうちで、最適度比較値が最も大きくなる優良テンプレートパターン候補を、最適テンプレートパターン候補として決定する処理；最適テンプレートパターン候補に対応する訳文用テンプレートパターン候補を、最適翻訳文として選定する処理；をコンピュータに実行させるようにしたことを特徴とする。そして前記各処理により、精度の高い最適翻訳文を短時間で得ることが可能となる。
【００１６】
【発明の実施の形態】
以下、本発明を図面を参照して説明する。
図１は、本発明の実施の一形態に係る最適翻訳文選定装置を示すもので、この装置は、例えば英語を原文とする場合の原文用のテンプレート群およびこのテンプレート群と意味的に等価な例えば日本語の訳文用テンプレート群が相互に関連付けて記憶されている翻訳文データベース１、例えば英語の入力文を記憶する入力文記憶手段２、およびテンプレートパターン候補検索手段３を備えており、テンプレートパターン候補検索手段３は、後に詳述する原文用のテンプレート群の各テンプレートブロックと入力文とを比較し、原文用のテンプレート群から作成可能なすべてのテンプレートパターン候補を探索するようになっている。そして、探索された各テンプレートパターン候補は、テンプレートパターン候補記憶手段４に記憶されるようになっている。
【００１７】
前記原文用のテンプレート群は、図２に示すように、単語・句からなる文章要素を任意数同列で包含する複数のテンプレートブロックを備えており、これら各テンプレートブロックは、文法規則に基づき上位のものから順次配列されている。そして、このテンプレート群からは、上位のテンプレートブロック内の任意の文章要素と、その下位のテンプレートブロック内の任意の文章要素とを順次連結していくことにより、入力文に対応する多数のテンプレートパターン候補を作成することができるようになっている。
【００１８】
例えば、図２に示すテンプレート群の場合には、
『Ｊａｐａｎｈａｓｂｅａｕｔｉｆｕｌｐａｒｋｓ
ｎａｔｉｏｎｗｉｄｅ．』
『Ｊａｐａｎｉｓｄｏｔｔｅｄｗｉｔｈｌｏｖｅｌｙ
ｐｕｂｌｉｃｇａｒｄｅｎｓａｌｌｏｖｅｒｔｈｅ
ｃｏｕｎｔｒｙ．』
等のテンプレートパターン候補を作成することができるようになっている。
【００１９】
このテンプレート群は、過去のマニュアル作成の際の添削例等を参考にして、添削作業等で翻訳文の核になる要素が何であるかを、専門家の知識を用いて吟味し、既存のマニュアルの文章を単語・句からなる文章要素に分解するとともに、文法規則上同順位の文章要素を任意数同列でまとめてテンプレートブロックを作り、各テンプレートブロックを、文法規則に基づき上位のものから順次配列することにより構成されている。
【００２０】
前記各テンプレートブロックは、正しく使われた単語・句だけでなく、統語的または意味上誤用された単語・句も含めて作成されており、これにより、通常考えられないような入力文に対しても、これに対応するテンプレートパターン候補を作成することができるようになっている。
【００２１】
また、前記テンプレート群中のすべての単語には、図２に示すように、その重要度に応じたポイント数のポイントが付与されており、このポイントは、図１に示す単語ポイント数記憶手段５に、単語と関連付けて記憶されるようになっている。
【００２２】
例えば、図２に示すテンプレート群の場合には、ほとんどの単語には、ポイント数「１」のポイントが付与されているが、『ｄｏｔｔｅｄ』および『ｔｈｅｒｅ』には、他の単語の２倍のポイント数「２」のポイントが付与されているとともに、『ｎａｔｉｏｎｗｉｄｅ』には、他の単語の３倍のポイント数「３」のポイントが付与されている。すなわち、『ｄｏｔｔｅｄ』，『ｔｈｅｒｅ』および『ｎａｔｉｏｎｗｉｄｅ』は、他の単語の２倍のあるいは３倍の重要度を有する重要単語として設定されている。
【００２３】
この重要単語は、例えばマニュアルを作成するような場合に、特定の動作には特定の用語を用いるのが通例であり、したがって、マニュアルの改訂部分についても、既存部分と同一の用語を用いることが要求される。
【００２４】
そこで、本発明においては、このような単語に対して、他の単語よりも高いポイント数を付与して重要単語とし、この重要単語が翻訳文に反映されるようにしている。
【００２５】
なお、図２に示すテンプレート群では、『ｄｏｔｔｅｄ』，『ｔｈｅｒｅ』および『ｎａｔｉｏｎｗｉｄｅ』が、重要単語として設定されているが、すべての単語のポイント数を「１」にしてもよい。
【００２６】
ところで、前記翻訳用データベース１には、原文用のテンプレート群とともに、例えば日本語の訳文用テンプレート群も記憶されており、これらは相互に関連付けられている。したがって、図２に示すテンプレート群から得られるテンプレートパターン候補（文章）と、図示しない日本語の訳文用テンプレート群から得られるテンプレートパターン候補（文章）とは、一対一で対応しており、英語のテンプレートパターン候補が特定されれば、これに対応する日本語のテンプレートパターン候補を、日本語の翻訳文として得ることができるようになっている。これは、ＡＴＮ（拡張遷移ネットワーク）を使用してコンピュータに組込み格納することにより可能である。
【００２７】
前記入力文記憶手段２に記憶されている入力文で用いられているすべての単語、およびテンプレートパターン候補記憶手段４に記憶されている各テンプレートパターン候補で用いられているすべての単語は、図１に示す単語出現頻度記憶手段６において、テンプレート群中における出現頻度が、各テンプレートパターン候補および入力文毎に単語と関連付けて記憶されるようになっており、各テンプレートパターン候補および入力文は、単語の出現頻度とその単語のポイント数とに基づき、正規化ＬＳＩベクトル演算手段７において、正規化ＬＳＩ（ＬａｔｅｎｔＳｅｍａｎｔｉｃＩｎｄｅｘｉｎｇ）ベクトルが演算されるようになっている。そして、演算された各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルは、正規化ＬＳＩベクトル記憶手段８に記憶されるようになっている。
【００２８】
この正規化ＬＳＩベクトル記憶手段８に記憶されている各正規化ＬＳＩベクトルは、ＳＶＤ（特異値ベクトル分解法）アルゴリズムを用いて設定される圧縮文書ＬＳＩベクトル空間において相互に比較され、類似度演算手段９において、入力文に対する各テンプレートパターン候補の類似度が演算されるようになっている。そして、類似度が高い方から順に選ばれた複数のテンプレートパターン候補は、優良テンプレートパターン候補として優良テンプレートパターン候補記憶手段１０に記憶されるようになっている。
【００２９】
このようにして得られた各優良テンプレートパターン候補は、図１に示すように、一致単語検索手段１１において、入力文と一致する単語が検索されるようになっており、また合計ポイント数演算手段１２においては、各優良テンプレートパターン候補で用いられているすべての単語の合計ポイント数が演算されるとともに、一致単語ポイント数演算手段１３においては、入力文と各優良テンプレートパターン候補との間での一致単語の合計ポイント数が演算されるようになっている。そして、これら両合計ポイント数は、最適度比較値演算手段１４において比較され、各優良テンプレートパターン候補の最適度比較値が演算されるようになっている。
【００３０】
すなわち、最適度比較値演算手段１４においては、各優良テンプレートパターン候補における全単語の合計ポイント数を分母とするとともに、各優良テンプレートパターン候補における入力文との一致単語の合計ポイント数を分子とすることにより、最適度比較値が演算されるようになっており、各優良テンプレートパターン候補の最適度比較値は、図１に示すように、最適テンプレートパターン候補決定手段１５において相互に比較され、最も大きな最適度比較値を有する優良テンプレートパターン候補が、最適テンプレートパターン候補として決定されるようになっている。そして、一致単語の合計ポイント数のみならず、各優良テンプレートパターン候補における全単語の合計ポイント数をも考慮されるので、入力文により類似した優良テンプレートパターン候補が最適テンプレートパターン候補として決定されるようになっている。
【００３１】
このようにして、決定された最適テンプレートパターン候補は、これに対応する日本語の訳文用テンプレートパターンが、前記翻訳用データベース１の訳文用テンプレート群の中に存在するので、最適翻訳文選定手段１６において、この訳文用テンプレートパターン候補が最適翻訳文として選定されるようになっている。
【００３２】
図３は、前記最適翻訳文選定装置における最適翻訳文選定方法を示す流れ図であり、以下これについて説明する。
【００３３】
まず、入力文と同一言語，例えば英語の原文用のテンプレート群およびこのテンプレート群と意味的に等価な例えば日本語の訳文用テンプレート群が予め用意され、これら両テンプレート群は、相互に関連付けられた状態となっている。そして、ステップＳ１においてこれら両テンプレート群を読込む。これら両テンプレート群は通常、ＡＴＮ（拡張遷移ネットワーク）を使用してコンピュータに組込み格納される。
【００３４】
次いで、ステップＳ２において、原文用のテンプレート群中のすべての単語に、その重要度に応じたポイント数で付与されているポイントを読込む。
【００３５】
次いで、ステップＳ３において、入力文の読込みを行なうとともに、ステップＳ４において、入力文の解析を行なう。
【００３６】
なお、この入力文の解析としては、例えば特開平９−３２５６７３号公報に示されているように、基本的用法が正しく履行されているか否かを調べるためのキーパターンによるキーパターンチェック、入力文のすべての単語に対し内蔵する辞書を用いて行なわれる品詞分類，および構文解析プログラムによる構文解析が順次行なわれることになる。そしてその後、ステップＳ５において、テンプレート群の各テンプレートブロックと入力文とを比較し、作成可能なすべてのテンプレートパターン候補を検索する。
【００３７】
このようにして得られたテンプレートパターン候補の数は、翻訳用データベース１内のデータ量にもよるが、常に精度の高い最適翻訳文が得られる程度に翻訳用データベース１内のデータ量を多くした場合には、しばしばかなりの数となる。
【００３８】
そこで本発明においては、ステップＳ６において、テンプレートパターン候補の粗い絞り込みを行なって対象となるテンプレートパターン候補の数を少なくした後、この少ない数のテンプレートパターン候補のみを対象として、ステップＳ７において、テンプレートパターン候補の精細な絞り込みを行なうようにしている。
【００３９】
この精細な絞り込みにより、最適テンプレートパターン候補が決定されるので、ステップＳ８において、この最適テンプレートパターン候補に対応する日本語のテンプレートパターン候補を翻訳用データベース１から選んで、これを最適翻訳文として決定する。
【００４０】
図４は、図３のステップＳ６での処理を詳細に示すもので、以下これについて説明する。
まず、ステップＳ１１において、各テンプレートパターン候補および入力文で用いられているすべての単語のテンプレート群中における出現頻度とその単語のポイント数とに基づき、各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを演算し、次いでステップＳ１２において、ＳＶＤアルゴリズムを用いて設定される圧縮文書ＬＳＩベクトル空間に、前記各正規化ＬＳＩベクトルを射影することにより、入力文に対する各テンプレートパターン候補の類似度を演算する。そしてその後、ステップＳ１３において、類似度が高い方から複数のテンプレートパターン候補を選び、これを優良テンプレートパターン候補として決定する。
【００４１】
なおここで、優良テンプレートパターン候補は、類似度が最も高いものを１つだけ選ぶことも理論的には可能であるが、後に詳述するように、類似度の高さと文書の近似度とは、必ずしも一致しないので、文書の近似度が高いものが必ず優良テンプレートパターン候補として選ばれるようにするためには、複数のテンプレートパターン候補を優良テンプレートパターン候補として決定しておくことが好ましい。
【００４２】
次に、どのようにして優良テンプレートパターン候補が決定されるのかにつき、例えば米国特許第４８３９８５３号に示されている例を用いて具体的に説明する。
【００４３】
いま、テンプレートパターン候補として、

の９個のテンプレートパターン候補が検索されたものとすると、文書別用語行列Ｄは表１のようになる。
【００４４】
【表１】

【００４５】
なお、表１において、各用語のポイント数はすべて「１」であり、また表１中の数字は、テンプレート群中における出現頻度としての出現回数である。この出現頻度は、生の出現回数を用いずに、出現回数のブールまたは対数をとってもよい。
【００４６】
次に、特異値ベクトル分解Ｄ＝ＵＳＶ^Ｔによって、用語行列Ｕ，対角行列Ｓ，文書行列Ｖを求めると、これら各行列Ｕ，Ｓ，Ｖは、表２，表３および表４のようになる。
【００４７】
【表２】

【００４８】
【表３】

【００４９】
【表４】

【００５０】
ところで、文書別用語行列Ｄの主要関連構造を捉えるには、通常は二次元で充分である。したがって、用語行列Ｕおよび文書行列Ｖの最初の２列のみについて検討して残りの列は無視し、対角行列Ｓ内の２つの特異値のみにつき検討して残りの列を無視するものとする。すると、図５に示すような二次元の圧縮文書ＬＳＩベクトル空間が得られるので、この圧縮文書ＬＳＩベクトル空間に、各テンプレートパターン候補Ｃ１，Ｃ２，Ｃ３，Ｃ４，Ｃ５，Ｍ１，Ｍ２，Ｍ３，Ｍ４を射影する。
【００５１】
ここで、入力文が
『ｈｕｍａｎｃｏｍｐｕｔｅｒｉｎｔｅｒａｃｔｉｏｎ』
であるとすると、この入力文のベクトルＱは、次式で表すことができる。
【００５２】
【数１】

【００５３】
このベクトルＱを図５に示す圧縮ＬＳＩベクトル空間に射影すると、ベクトルＱに対応する圧縮文書ベクトルＶ_Ｑは、次式のようになる。
【００５４】
【数２】

【００５５】
この圧縮文書ベクトルＶ_Ｑは、図５においては符号Ｑで示すようになるが、大雑把にいえば、入力文は、圧縮文書ＬＳＩベクトル空間において、その角度から見てテンプレートパターン候補Ｃ１，Ｃ２，Ｃ３，Ｃ４，Ｃ５に極めて近い（類似度が高い）ことが判る。
【００５６】
なお、厳密にいえば、入力文と各テンプレートパターン候補との比較は、次式で得られる角度による。
【００５７】
【数３】

【００５８】
ところで、類似度が高い各テンプレートパターン候補Ｃ１，Ｃ２，Ｃ３，Ｃ４，Ｃ５の中には、入力文と用語を全く共有しないテンプレートパターン候補Ｃ３，Ｃ５も含まれている。したがって、例えばテンプレートパターン候補Ｃ３の類似度が最も高くなった場合に、このテンプレートパターン候補Ｃ３のみを優良テンプレートパターン候補として決定した場合には、正しい翻訳文が得られないことになる。
【００５９】
そこで本発明においては、類似度が高い各テンプレートパターン候補Ｃ１，Ｃ２，Ｃ３，Ｃ４，Ｃ５のすべてを、優良テンプレートパターン候補として決定するようにしている。
【００６０】
図６は、図３のステップＳ７での処理を詳細に示すもので、以下これについて説明する。
まず、ステップＳ２１において、入力文中の各単語が、各優良テンプレートパターン候補のどの単語と一致するかを検索するとともに、ステップＳ２２において、一致した単語の合計ポイント数を各優良テンプレートパターン候補毎に演算する。
【００６１】
次いで、ステップＳ３３において、各優良テンプレートパターン候補で用いられているすべての単語の合計ポイント数を各優良テンプレートパターン候補毎に演算するとともに、ステップＳ２４において、各優良テンプレートパターン候補の最適度比較値をそれぞれ演算する。
【００６２】
この最適度比較値は、具体的には、ステップＳ２３で求められた合計ポイント数を分母，ステップＳ２２で求められた一致単語ポイント数を分子とすることにより求められる。すなわち、一致単語ポイント数を合計ポイント数で除すことにより求められる。
【００６３】
次いで、ステップＳ２５において、各優良テンプレートパターン候補の最適度比較値を比較し、ステップＳ２２で求められた一致単語ポイント数が最大となる最適比較値のうちで、最適度比較値が最も大きくなる優良テンプレートパターン候補を、最適テンプレートパターン候補として決定する。
【００６４】
例えば入力文が、
『ＩｎＪａｐａｎ，ａｒｅｄｏｔｔｅｄｗｉｔｈｌｏｖｅｌｙ
ｐｕｂｌｉｃｇａｒｄｅｎｓｎａｔｉｏｎｗｉｄｅ．』
でありこの入力文に対する最適テンプレートパターン候補を、図２に示すテンプレート群を用いて決定すると、
『Ｊａｐａｎｉｓｄｏｔｔｅｄｗｉｔｈｌｏｖｅｌｙ
ｐｕｂｌｉｃｇａｒｄｅｎｓｎａｔｉｏｎｗｉｄｅ．』
が最適テンプレートパターン候補として決定されることになる。
【００６５】
次に、前記入力文中の
『ＩｎＪａｐａｎ，ａｒｅｄｏｔｔｅｄｗｉｔｈ』
の部分に対して、図２に示すテンプレート群から選択された優良テンプレートパターン候補の中から、どのようにして最適テンプレートパターン候補が決定されるのかにつき具体的に説明する。
【００６６】
いま、
『ＩｎＪａｐａｎ，ａｒｅｄｏｔｔｅｄｗｉｔｈ』
という入力文に対して、図２に示すテンプレート群から、
『Ｊａｐａｎｉｓｄｏｔｔｅｄｗｉｔｈ』
と、
『ＩｎＪａｐａｎ，ｔｈｅｒｅａｒｅ』
とが優良テンプレートパターン候補として選択されたものとすると、図７に示すような有向グラフが得られる。
【００６７】
この有向グラフのノード（状態）が、Ｎ１，Ｎ２，Ｎ３，Ｎ４，Ｎ６，Ｎ７，Ｎ８，Ｎ９，Ｎ５とソート済みであることを前提とした上で、各ノードと入力文とのマッチングを行なう。
【００６８】
図８は初期状態を示し、この状態から、アーク（Ｎ１，Ｎ２）すなわち『Ｊａｐａｎ』、アーク（Ｎ１，Ｎ６）すなわち『Ｉｎ』、アーク（Ｎ２，Ｎ３）すなわち『ｉｓ』、アーク（Ｎ３，Ｎ４）すなわち『ｄｏｔｔｅｄ』、アーク（Ｎ４，Ｎ５）すなわち『ｗｉｔｈ』、アーク（Ｎ６，Ｎ７）すなわち『Ｊａｐａｎ』、アーク（Ｎ７，Ｎ８）すなわち『，』、アーク（Ｎ８，Ｎ９）すなわち『ｔｈｅｒｅ』、およびアーク（Ｎ９，Ｎ５）すなわち『ａｒｅ』と、入力文中の各単語とのマッチングが順次行なわれる。
【００６９】
まず、アーク（Ｎ１，Ｎ２）と入力文とのマッチングについて、図９を参照して説明する。
（１）アーク（Ｎ１，Ｎ２）と入力文の『Ｉｎ』とを照合すると、両者は等しくないので、セル（Ｎ２，“Ｉｎ”）の値およびセル（Ｎ１，“Ｉｎ”）の値をチェックし、両者は共に０であることから、セル（Ｎ２，“Ｉｎ”）はそのままとし、バックリンクも同様にそのままとする（セル（Ｎ１，“Ｉｎ”）のバックリンクは当初設定されていないので、この時点で（Ｎ１，“Ｉｎ”）に設定する）。図９の表中における矢印がバックリンクである。
【００７０】
ここで、バックリンクとは、以下のような理由で設定されるものである。すなわち、このマッチング方法では、図７に示す始端ノードＮ１から終端ノードＮ５までのすべてのマッチング作業を完了しなければ、最適テンプレートパターンがどの経路の文字列なのか判明しない。具体的には、図７の終端ノードＮ５まで作業を完了した時点で、アーク（Ｎ４，Ｎ５）側が最適テンプレートパターンであると判明した場合、ノードＮ４は、Ｎ４→Ｎ３→Ｎ２→Ｎ１の経路を辿って始端ノードＮ１に至る文字列であることが判る必要がある。この経路を示すものがバックリンクである。
【００７１】
（２）アーク（Ｎ１，Ｎ２）と入力文の『Ｊａｐａｎ』とを照合する。すると、両者は等しいので、セル（Ｎ２，“Ｊａｐａｎ”）の値（＝０）、セル（Ｎ２，“Ｉｎ”）の値（＝０）、セル（Ｎ１，“Ｊａｐａｎ”）の値（＝０）、およびセル（Ｎ１，“Ｉｎ”）＋１の値（＝１、ここで＋１は図７の“Ｊａｐａｎ”のポイント数を加えることを意味する。）をチェックし、そのうちの最大値を選択してセル（Ｎ２，“Ｊａｐａｎ”）の値とする。この数字は、前記最適度比較値を求める際の分子の数字として用いられるもので、これにより、セル（Ｎ２，“Ｊａｐａｎ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ１，“Ｉｎ”）にリンクされる（ここで、Ｎ１はアーク（Ｎ１，Ｎ２）の始端ノードである）。
なお、図９に示す表において、Ｎ２の行の各升目の右下に記している数字「１」は、図７の始端ノードＮ１からノードＮ２までに含まれる単語の合計のポイント数を表わし、この数字は、前記最適度比較値を求める際の分母の数字として用いられる。
【００７２】
（３）次に、アーク（Ｎ１，Ｎ２）と入力文の『，』とを照合する。すると、両者は等しくないので、セル（Ｎ２，“，”）の値（＝０）、セル（Ｎ２，“Ｊａｐａｎ”）の値（＝１）、およびセル（Ｎ１，“，”）の値（＝０）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ２，“，”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ２，“Ｊａｐａｎ”）にリンクされる。
【００７３】
（４）次に、アーク（Ｎ１，Ｎ２）と入力文の『ａｒｅ』とを照合する。すると、両者は等しくないので、セル（Ｎ２，“ａｒｅ”）の値（＝０）、セル（Ｎ２，“，”）の値（＝１）、およびセル（Ｎ１，“ａｒｅ”）の値（＝０）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ２，“ａｒｅ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ２，“，”）にリンクされる。
【００７４】
（５）次に、アーク（Ｎ１，Ｎ２）と入力文の『ｄｏｔｔｅｄ』とを照合する。すると、両者は等しくないので、セル（Ｎ２，“ｄｏｔｔｅｄ”）の値（＝０）、セル（Ｎ２，“ａｒｅ”）の値（＝１）、およびセル（Ｎ１，“ｄｏｔｔｅｄ”）の値（＝０）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ２，“ｄｏｔｔｅｄ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ２，“ａｒｅ”）にリンクされる。
【００７５】
（６）次に、アーク（Ｎ１，Ｎ２）と入力文の『ｗｉｔｈ』とを照合する。すると、両者は等しくないので、セル（Ｎ２，“ｗｉｔｈ”）の値（＝０）、セル（Ｎ２，“ｄｏｔｔｅｄ”）の値（＝１）、およびセル（Ｎ１，“ｗｉｔｈ”）の値（＝０）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ２，“ｗｉｔｈ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ２，“ｄｏｔｔｅｄ”）にリンクされる。
【００７６】
次に、アーク（Ｎ１，Ｎ６）と入力文とのマッチングについて、図１０を参照して説明する。
（１）まず、アーク（Ｎ１，Ｎ６）と入力文の『Ｉｎ』とを照合すると、両者は等しいので、セル（Ｎ６，“Ｉｎ”）の値（＝０）、およびセル（Ｎ１，“Ｉｎ”）＋１の値（＝１、ここで＋１は図７の“Ｉｎ”のポイント数を加えることを意味する。）をチェックし、そのうちの最大値を選択してセル（Ｎ６，“Ｉｎ”）の値とする。これにより、セル（Ｎ６，“Ｉｎ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ１，“Ｉｎ”）にリンクされる。
なお、図１０に示す表において、Ｎ６の行の各升目の右下に記している数字「１」は、図７の始端ノードＮ１からノードＮ６までに含まれる単語の合計のポイント数，すなわち『Ｉｎ』のポイント数である。
【００７７】
（２）次に、アーク（Ｎ１，Ｎ６）と入力文の『Ｊａｐａｎ』とを照合する。すると、両者は等しくないので、セル（Ｎ６，“Ｊａｐａｎ”）の値（＝０）、セル（Ｎ６，“Ｉｎ”）の値（＝１）、およびセル（Ｎ１，“Ｊａｐａｎ”）の値（＝０）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ６，“Ｊａｐａｎ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ６，“Ｉｎ”）にリンクされる。
【００７８】
（３）次に、アーク（Ｎ１，Ｎ６）と入力文の『，』とを照合する。すると、両者は等しくないので、セル（Ｎ６，“，”）の値（＝０）、セル（Ｎ６，“Ｊａｐａｎ”）の値（＝１）、およびセル（Ｎ１，“，”）の値（＝０）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ６，“，”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ６，“Ｊａｐａｎ”）にリンクされる。
【００７９】
（４）次に、アーク（Ｎ１，Ｎ６）と入力文の『ａｒｅ』とを照合する。すると、両者は等しくないので、セル（Ｎ６，“ａｒｅ”）の値（＝０）、セル（Ｎ６，“，”）の値（＝１）、およびセル（Ｎ１，“ａｒｅ”）の値（＝０）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ６，“ａｒｅ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ６，“，”）にリンクされる。
【００８０】
（５）次に、アーク（Ｎ１，Ｎ６）と入力文の『ｄｏｔｔｅｄ』とを照合する。すると、両者は等しくないので、セル（Ｎ６，“ｄｏｔｔｅｄ”）の値（＝０）、セル（Ｎ６，“ａｒｅ”）の値（＝１）、およびセル（Ｎ１，“ｄｏｔｔｅｄ”）の値（＝０）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ６，“ｄｏｔｔｅｄ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ６，“ａｒｅ”）にリンクされる。
【００８１】
（６）次に、アーク（Ｎ１，Ｎ６）と入力文の『ｗｉｔｈ』とを照合する。すると、両者は等しくないので、セル（Ｎ６，“ｗｉｔｈ”）の値（＝０）、セル（Ｎ６，“ｄｏｔｔｅｄ”）の値（＝１）、およびセル（Ｎ１，“ｗｉｔｈ”）の値（＝０）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ６，“ｗｉｔｈ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ６，“ｄｏｔｔｅｄ”）にリンクされる。
【００８２】
次に、アーク（Ｎ２，Ｎ３）と入力文とのマッチングについて、図１１を参照して説明する。
（１）まず、アーク（Ｎ２，Ｎ３）と入力文の『Ｉｎ』とを照合すると、両者は等しくないので、セル（Ｎ３，“Ｉｎ”）の値およびセル（Ｎ２，“Ｉｎ”）をチェックし、両者は共に０であるので、セル（Ｎ３，“Ｉｎ”）はそのままとし、バックリンクもそのままとする。
なお、図１１に示す表において、Ｎ３の行の各升目の右下に記している数字「２」は、図７の始端ノードＮ１からノードＮ３までに含まれる単語の合計のポイント数，すなわち『Ｊａｐａｎ』および『ｉｓ』の合計のポイント数である。
【００８３】
（２）次に、アーク（Ｎ２，Ｎ３）と入力文の『Ｊａｐａｎ』とを照合する。すると、両者は等しくないので、セル（Ｎ３，“Ｊａｐａｎ”）の値（＝０）、セル（Ｎ３，“Ｉｎ”）の値（＝０）、およびセル（Ｎ２，“Ｊａｐａｎ”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ３，“Ｊａｐａｎ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ２，“Ｊａｐａｎ”）にリンクされる。
【００８４】
（３）次に、アーク（Ｎ２，Ｎ３）と入力文の『，』とを照合する。すると、両者は等しくないので、セル（Ｎ３，“，”）の値（＝０）、セル（Ｎ３，“Ｊａｐａｎ”）の値（＝１）、およびセル（Ｎ２，“，”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ３，“，”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ３，“Ｊａｐａｎ”）にリンクされる。
【００８５】
（４）次に、アーク（Ｎ２，Ｎ３）と入力文の『ａｒｅ』とを照合する。すると、両者は等しくないので、セル（Ｎ３，“ａｒｅ”）の値（＝０）、セル（Ｎ３，“，”）の値（＝１）、およびセル（Ｎ２，“ａｒｅ”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ３，“ａｒｅ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ３，“，”）にリンクされる。
【００８６】
（５）次に、アーク（Ｎ２，Ｎ３）と入力文の『ｄｏｔｔｅｄ』とを照合する。すると、両者は等しくないので、セル（Ｎ３，“ｄｏｔｔｅｄ”）の値（＝０）、セル（Ｎ３，“ａｒｅ”）の値（＝１）、およびセル（Ｎ２，“ｄｏｔｔｅｄ”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ３，“ｄｏｔｔｅｄ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ３，“ａｒｅ”）にリンクされる。
【００８７】
（６）次に、アーク（Ｎ２，Ｎ３）と入力文の『ｗｉｔｈ』とを照合する。すると、両者は等しくないので、セル（Ｎ３，“ｗｉｔｈ”）の値（＝０）、セル（Ｎ３，“ｄｏｔｔｅｄ”）の値（＝１）、およびセル（Ｎ２，“ｗｉｔｈ”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ３，“ｗｉｔｈ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ３，“ｄｏｔｔｅｄ”）にリンクされる。
【００８８】
次に、アーク（Ｎ３，Ｎ４）と入力文とのマッチングについて、図１２を参照して説明する。
（１）まず、アーク（Ｎ３，Ｎ４）と入力文の『Ｉｎ』とを照合すると、両者は等しくないので、セル（Ｎ４，“Ｉｎ”）の値およびセル（Ｎ３，“Ｉｎ”）の値をチェックし、両者は共に０であるので、セル（Ｎ４，“Ｉｎ”）はそのままとし、バックリンクもそのままとする。
なお、図１２に示す表において、Ｎ４の行の各升目の右下に記している数字「４」は、図７の始端ノードＮ１からノードＮ４までに含まれる単語，すなわち『Ｊａｐａｎ』，『ｉｓ』および『ｄｏｔｔｅｄ』の合計のポイント数である。
【００８９】
（２）次に、アーク（Ｎ３，Ｎ４）と入力文の『Ｊａｐａｎ』とを照合する。すると、両者は等しくないので、セル（Ｎ４，“Ｊａｐａｎ”）の値（＝０）、セル（Ｎ４，“Ｉｎ”）の値（＝０）、およびセル（Ｎ３，“Ｊａｐａｎ”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ４，“Ｊａｐａｎ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ３，“Ｊａｐａｎ”）にリンクされる。
【００９０】
（３）次に、アーク（Ｎ３，Ｎ４）と入力文の『，』とを照合する。すると、両者は等しくないので、セル（Ｎ４，“，”）の値（＝０）、セル（Ｎ４，“Ｊａｐａｎ”）の値（＝１）、およびセル（Ｎ３，“，”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ４，“，”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ４，“Ｊａｐａｎ”）にリンクされる。
【００９１】
（４）次に、アーク（Ｎ３，Ｎ４）と入力文の『ａｒｅ』とを照合する。すると、両者は等しくないので、セル（Ｎ４，“ａｒｅ”）の値（＝０）、セル（Ｎ４，“，”）の値（＝１）、およびセル（Ｎ３，“ａｒｅ”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ４，“ａｒｅ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ４，“，”）にリンクされる。
【００９２】
（５）次に、アーク（Ｎ３，Ｎ４）と入力文の『ｄｏｔｔｅｄ』とを照合する。すると、両者は等しいので、セル（Ｎ４，“ｄｏｔｔｅｄ”）の値（＝０）、セル（Ｎ４，“ａｒｅ”）の値（＝１）、セル（Ｎ３，“ｄｏｔｔｅｄ”）の値（＝１）、およびセル（Ｎ３，“ａｒｅ”）＋２の値（＝３、ここで＋２は図７の“ｄｏｔｔｅｄ”のポイント数を加えることを意味する。）をチェックし、その最大値を選択する。したがって、セル（Ｎ４，“ｄｏｔｔｅｄ”）＝３となり、バックリンクは、最大値として選択したセル（Ｎ３，“ａｒｅ”）にリンクされる。
【００９３】
（６）次に、アーク（Ｎ３，Ｎ４）と入力文の『ｗｉｔｈ』とを照合する。すると、両者は等しくないので、セル（Ｎ４，“ｗｉｔｈ”）の値（＝０）、セル（Ｎ４，“ｄｏｔｔｅｄ”）の値（＝３）、およびセル（Ｎ３，“ｗｉｔｈ”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ４，“ｗｉｔｈ”）＝３となり、バックリンクは、最大値として選択したセル（Ｎ４，“ｄｏｔｔｅｄ”）にリンクされる。
【００９４】
次に、アーク（Ｎ４，Ｎ５）と入力文とのマッチングについて、図１３を参照して説明する。
（１）まず、アーク（Ｎ４，Ｎ５）と入力文の『Ｉｎ』とを照合すると、両者は等しくないので、セル（Ｎ５，“Ｉｎ”）の値およびセル（Ｎ４，“Ｉｎ”）の値をチェックし、両者は共に０であるので、セル（Ｎ５，“Ｉｎ”）はそのままとし、バックリンクもそのままとする。
なお、図１３に示す表において、Ｎ５の行の各升目の右下に記している数字「５」は、図７の始端ノードＮ１からノードＮ５までの上側の文字列に含まれる単語，すなわち『Ｊａｐａｎ』，『ｉｓ』，『ｄｏｔｔｅｄ』および『ｗｉｔｈ』の合計のポイント数である。
【００９５】
（２）次に、アーク（Ｎ４，Ｎ５）と入力文の『Ｊａｐａｎ』とを照合する。すると、両者は等しくないので、セル（Ｎ５，“Ｊａｐａｎ”）の値（＝０）、セル（Ｎ５，“Ｉｎ”）の値（＝０）、およびセル（Ｎ４，“Ｊａｐａｎ”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ５，“Ｊａｐａｎ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ４，“Ｊａｐａｎ”）にリンクされる。
【００９６】
（３）次に、アーク（Ｎ４，Ｎ５）と入力文の『，』とを照合する。すると、両者は等しくないので、セル（Ｎ５，“，”）の値（＝０）、セル（Ｎ５，“Ｊａｐａｎ”）の値（＝１）、およびセル（Ｎ４，“，”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ５，“，”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ５，“Ｊａｐａｎ”）にリンクされる。
【００９７】
（４）次に、アーク（Ｎ４，Ｎ５）と入力文の『ａｒｅ』とを照合する。すると、両者は等しくないので、セル（Ｎ５，“ａｒｅ”）の値（＝０）、セル（Ｎ５，“，”）の値（＝１）、およびセル（Ｎ４，“ａｒｅ”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ５，“ａｒｅ”）＝１となり、バックリンクは、最大値として選択したセル（Ｎ５，“，”）にリンクされる。
【００９８】
（５）次に、アーク（Ｎ４，Ｎ５）と入力文の『ｄｏｔｔｅｄ』とを照合する。すると、両者は等しくないので、セル（Ｎ５，“ｄｏｔｔｅｄ”）の値（＝０）、セル（Ｎ５，“ａｒｅ”）の値（＝１）、およびセル（Ｎ４，“ｄｏｔｔｅｄ”）の値（＝３）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ５，“ｄｏｔｔｅｄ”）＝３となり、バックリンクは、最大値として選択したセル（Ｎ４，“ｄｏｔｔｅｄ”）にリンクされる。
【００９９】
（６）次に、アーク（Ｎ４，Ｎ５）と入力文の『ｗｉｔｈ』とを照合する。すると、両者は等しいので、セル（Ｎ５，“ｗｉｔｈ”）の値（＝０）、セル（Ｎ５，“ｄｏｔｔｅｄ”）の値（＝３）、セル（Ｎ４，“ｗｉｔｈ”）の値（＝３）、およびセル（Ｎ４，“ｄｏｔｔｅｄ”）＋１の値（＝４、ここで＋１は図７の“ｗｉｔｈ”のポイント数を加えることを意味する。）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ５，“ｗｉｔｈ”）＝４となり、バックリンクは、最大値として選択したセル（Ｎ４，“ｄｏｔｔｅｄ”）にリンクされる。
【０１００】
次に、アーク（Ｎ６，Ｎ７）と入力文とのマッチングについて、図１４を参照して説明する。
（１）まず、アーク（Ｎ６，Ｎ７）と入力文の『Ｉｎ』とを照合すると、両者は等しくないので、セル（Ｎ７，“Ｉｎ”）の値（＝０）とセル（Ｎ６，“Ｉｎ”）の値（＝１）とをチェックし、そのうちの大きい方の値を選択する。したがって、セル（Ｎ７，“Ｉｎ”）＝１となり、バックリンクは、選択したセル（Ｎ６，“Ｉｎ”）にリンクされる。
なお、図１４に示す表において、Ｎ７の行の各升目の右下に記している数字「２」は、図７の始端ノードＮ１からノードＮ７までに含まれる単語，すなわち『Ｉｎ』および『Ｊａｐａｎ』の合計のポイント数である。
【０１０１】
（２）次に、アーク（Ｎ６，Ｎ７）と入力文の『Ｊａｐａｎ』とを照合する。すると、両者は等しいので、セル（Ｎ７，“Ｊａｐａｎ”）の値（＝０）、セル（Ｎ７，“Ｉｎ”）の値（＝０）、セル（Ｎ６，“Ｊａｐａｎ”）の値（＝１）、およびセル（Ｎ６，“Ｉｎ”）＋１の値（＝２、ここで＋１は図７の“Ｊａｐａｎ”のポイント数を加えることを意味する。）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ７，“Ｊａｐａｎ”）＝２となり、バックリンクは、最大値として選択したセル（Ｎ６，“Ｉｎ”）にリンクされる。
【０１０２】
（３）次に、アーク（Ｎ６，Ｎ７）と入力文の『，』とを照合する。すると、両者は等しくないので、セル（Ｎ７，“，”）の値（＝０）、セル（Ｎ７，“Ｊａｐａｎ”）の値（＝２）、およびセル（Ｎ６，“，”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ７，“，”）＝２となり、バックリンクは、最大値として選択したセル（Ｎ７，“Ｊａｐａｎ”）にリンクされる。
【０１０３】
（４）次に、アーク（Ｎ６，Ｎ７）と入力文の『ａｒｅ』とを照合する。すると、両者は等しくないので、セル（Ｎ７，“ａｒｅ”）の値（＝０）、セル（Ｎ７，“，”）の値（＝２）、およびセル（Ｎ６，“ａｒｅ”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ７，“ａｒｅ”）＝２となり、バックリンクは、最大値として選択したセル（Ｎ７，“，”）にリンクされる。
【０１０４】
（５）次に、アーク（Ｎ６，Ｎ７）と入力文の『ｄｏｔｔｅｄ』とを照合する。すると、両者は等しくないので、セル（Ｎ７，“ｄｏｔｔｅｄ”）の値（＝０）、セル（Ｎ７，“ａｒｅ”）の値（＝２）、およびセル（Ｎ６，“ｄｏｔｔｅｄ”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ７，“ｄｏｔｔｅｄ”）＝２となり、バックリンクは、最大値として選択したセル（Ｎ７，“ａｒｅ”）にリンクされる。
【０１０５】
（６）次に、アーク（Ｎ６，Ｎ７）と入力文の『ｗｉｔｈ』とを照合する。すると、両者は等しくないので、セル（Ｎ７，“ｗｉｔｈ”）の値（＝０）、セル（Ｎ７，“ｄｏｔｔｅｄ”）の値（＝２）、およびセル（Ｎ６，“ｗｉｔｈ”）の値（＝１）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ７，“ｗｉｔｈ”）＝２となり、バックリンクは、最大値として選択したセル（Ｎ７，“ｄｏｔｔｅｄ”）にリンクされる。
【０１０６】
次に、アーク（Ｎ７，Ｎ８）と入力文とのマッチングについて、図１５を参照して説明する。
（１）まず、アーク（Ｎ７，Ｎ８）と入力文の『Ｉｎ』とを照合すると、両者は等しくないので、セル（Ｎ８，“Ｉｎ”）の値（＝０）とセル（Ｎ７，“Ｉｎ”）の値（＝１）とをチェックし、そのうちの大きい方の値を選択する。したがって、セル（Ｎ８，“Ｉｎ”）＝１となり、バックリンクは、選択したセル（Ｎ７“Ｉｎ”）にリンクされる。
なお、図１５に示す表において、Ｎ８の行の各升目の右下に記している数字「３」は、図７の始端ノードＮ１からノードＮ８までに含まれる単語，すなわち『Ｉｎ』，『Ｊａｐａｎ』および『，』の合計のポイント数である。
【０１０７】
（２）次に、アーク（Ｎ７，Ｎ８）と入力文の『Ｊａｐａｎ』とを照合する。すると、両者は等しくないので、セル（Ｎ８，“Ｊａｐａｎ”）の値（＝０）、セル（Ｎ８，“Ｉｎ”）の値（＝１）、およびセル（Ｎ７，“Ｊａｐａｎ”）の値（＝２）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ８，“Ｊａｐａｎ”）＝２となり、バックリンクは、最大値として選択したセル（Ｎ７，“Ｊａｐａｎ”）にリンクされる。
【０１０８】
（３）次に、アーク（Ｎ７，Ｎ８）と入力文の『，』とを照合する。すると、両者は等しいので、セル（Ｎ８，“，”）の値（＝０）、セル（Ｎ８，“Ｊａｐａｎ”）の値（＝２）、セル（Ｎ７，“，”）の値（＝２）、およびセル（Ｎ７，“Ｊａｐａｎ”）＋１の値（＝３、ここで＋１は図７の“，”のポイント数を加えることを意味する。）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ８，“，”）＝３となり、バックリンクは、最大値として選択したセル（Ｎ７，“Ｊａｐａｎ”）にリンクされる。
【０１０９】
（４）次に、アーク（Ｎ７，Ｎ８）と入力文の『ａｒｅ』とを照合する。すると、両者は等しくないので、セル（Ｎ８，“ａｒｅ”）の値（＝０）、セル（Ｎ８，“，”）の値（＝３）、およびセル（Ｎ７，“ａｒｅ”）の値（＝２）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ８，“ａｒｅ”）＝３となり、バックリンクは、最大値として選択したセル（Ｎ８，“，”）にリンクされる。
【０１１０】
（５）次に、アーク（Ｎ７，Ｎ８）と入力文の『ｄｏｔｔｅｄ』とを照合する。すると、両者は等しくないので、セル（Ｎ８，“ｄｏｔｔｅｄ”）の値（＝０）、セル（Ｎ８，“ａｒｅ”）の値（＝３）、およびセル（Ｎ７，“ｄｏｔｔｅｄ”）の値（＝２）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ８，“ｄｏｔｔｅｄ”）＝３となり、バックリンクは、最大値として選択したセル（Ｎ８，“ａｒｅ”）にリンクされる。
【０１１１】
（６）次に、アーク（Ｎ７，Ｎ８）と入力文の『ｗｉｔｈ』とを照合する。すると、両者は等しくないので、セル（Ｎ８，“ｗｉｔｈ”）の値（＝０）、セル（Ｎ８，“ｄｏｔｔｅｄ”）の値（＝３）、およびセル（Ｎ７，“ｗｉｔｈ”）の値（＝２）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ８，“ｗｉｔｈ”）＝３となり、バックリンクは、最大値として選択したセル（Ｎ８，“ｄｏｔｔｅｄ”）にリンクされる。
【０１１２】
次に、アーク（Ｎ８，Ｎ９）と入力文とのマッチングについて、図１６を参照して説明する。
（１）まず、アーク（Ｎ８，Ｎ９）と入力文の『Ｉｎ』とを照合すると、両者は等しくないので、セル（Ｎ９，“Ｉｎ”）の値（＝０）とセル（Ｎ８，“Ｉｎ”）の値（＝１）とをチェックし、そのうちの大きい方の値を選択する。したがって、セル（Ｎ９，“Ｉｎ”）＝１となり、バックリンクは、選択したセル（Ｎ８“Ｉｎ”）にリンクされる。
なお、図１６に示す表において、Ｎ９の行の各升目の右下に記している数字「５」は、図７の始端ノードＮ１からノードＮ９までに含まれる単語，すなわち『Ｉｎ』，『Ｊａｐａｎ』『，』および『ｔｈｅｒｅ』の合計ポイント数である。
【０１１３】
（２）次に、アーク（Ｎ８，Ｎ９）と入力文の『Ｊａｐａｎ』とを照合する。すると、両者は等しくないので、セル（Ｎ９，“Ｊａｐａｎ”）の値（＝０）、セル（Ｎ９，“Ｉｎ”）の値（＝１）、およびセル（Ｎ８，“Ｊａｐａｎ”）の値（＝２）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ９，“Ｊａｐａｎ”）＝２となり、バックリンクは、最大値として選択したセル（Ｎ８，“Ｊａｐａｎ”）にリンクされる。
【０１１４】
（３）次に、アーク（Ｎ８，Ｎ９）と入力文の『，』とを照合する。すると、両者は等しくないので、セル（Ｎ９，“，”）の値（＝０）、セル（Ｎ９，“Ｊａｐａｎ”）の値（＝２）、およびセル（Ｎ８，“，”）の値（＝３）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ９，“，”）＝３となり、バックリンクは、最大値として選択したセル（Ｎ８，“，”）にリンクされる。
【０１１５】
（４）次に、アーク（Ｎ８，Ｎ９）と入力文の『ａｒｅ』とを照合する。すると、両者は等しくないので、セル（Ｎ９，“ａｒｅ”）の値（＝０）、セル（Ｎ９，“，”）の値（＝３）、およびセル（Ｎ８，“ａｒｅ”）の値（＝３）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ９，“ａｒｅ”）＝３となり、バックリンクは、最大値として選択したセル（Ｎ９，“，”）にリンクされる。
【０１１６】
（５）次に、アーク（Ｎ８，Ｎ９）と入力文の『ｄｏｔｔｅｄ』とを照合する。すると、両者は等しくないので、セル（Ｎ９，“ｄｏｔｔｅｄ”）の値（＝０）、セル（Ｎ９，“ａｒｅ”）の値（＝３）、およびセル（Ｎ８，“ｄｏｔｔｅｄ”）の値（＝３）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ９，“ｄｏｔｔｅｄ”）＝３となり、バックリンクは、最大値として選択したセル（Ｎ９，“ａｒｅ”）にリンクされる。
【０１１７】
（６）次に、アーク（Ｎ８，Ｎ９）と入力文の『ｗｉｔｈ』とを照合する。すると、両者は等しくないので、セル（Ｎ９，“ｗｉｔｈ”）の値（＝０）、セル（Ｎ９，“ｄｏｔｔｅｄ”）の値（＝３）、およびセル（Ｎ８，“ｗｉｔｈ”）の値（＝３）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ９，“ｗｉｔｈ”）＝３となり、バックリンクは、最大値として選択したセル（Ｎ９，“ｄｏｔｔｅｄ”）にリンクされる。
【０１１８】
次に、アーク（Ｎ９，Ｎ５）と入力文とのマッチングについて、図１７を参照して説明する。
（１）まず、アーク（Ｎ９，Ｎ５）と入力文の『Ｉｎ』とを照合すると、両者は等しくないので、セル（Ｎ９，“Ｉｎ”）の値（＝０）とセル（Ｎ９，“Ｉｎ”）の値（＝１）とをチェックし、そのうちの大きい方の値を選択する。したがって、セル（Ｎ５，“Ｉｎ”）＝１となり、バックリンクは、選択したセル（Ｎ９“Ｉｎ”）にリンクされ、バックリンクが変更される。
なお、図１７に示す表において、Ｎ５の行の第１列目から第５列目の各升目の右下に記している数字「６」は、図７の始端ノードＮ１からノードＮ５までの下側の文字列に含まれる単語，すなわち『Ｉｎ』，『Ｊａｐａｎ』『，』『ｔｈｅｒｅ』および『ａｒｅ』の合計ポイント数である。
ここで、Ｎ５の行の第６列目の升目の右下に記している数字は、「６」ではなく「５」のままであるが、その理由については後に詳述する。
【０１１９】
（２）次に、アーク（Ｎ９，Ｎ５）と入力文の『Ｊａｐａｎ』とを照合する。すると、両者は等しくないので、セル（Ｎ５，“Ｊａｐａｎ”）の値（＝１）、セル（Ｎ５，“Ｉｎ”）の値（＝１）、およびセル（Ｎ９，“Ｊａｐａｎ”）の値（＝２）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ５，“Ｊａｐａｎ”）＝２となり、バックリンクは、最大値として選択したセル（Ｎ９，“Ｊａｐａｎ”）にリンクされ、バックリンクが変更される。
【０１２０】
（３）次に、アーク（Ｎ９，Ｎ５）と入力文の『，』とを照合する。すると、両者は等しくないので、セル（Ｎ５，“Ｉｎ”）の値（＝１）、セル（Ｎ５，“Ｊａｐａｎ”）の値（＝２）、およびセル（Ｎ９，“，”）の値（＝３）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ５，“，”）＝３となり、バックリンクは、最大値として選択したセル（Ｎ９，“，”）にリンクされ，バックリンクが変更される。
【０１２１】
（４）次に、アーク（Ｎ９，Ｎ５）と入力文の『ａｒｅ』とを照合する。すると、両者は等しいので、セル（Ｎ５，“ａｒｅ”）の値（＝１）、セル（Ｎ５，“，”）の値（＝３）、セル（Ｎ９，“ａｒｅ”）の値（＝３）、およびセル（Ｎ９，“，”）＋１の値（＝４、ここで＋１は図７の“ａｒｅ”のポイント数を加えることを意味する。）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ５，“ａｒｅ”）＝４となり、バックリンクは、最大値として選択したセル（Ｎ９，“，”）にリンクされ、バックリンクが変更される。
【０１２２】
（５）次に、アーク（Ｎ９，Ｎ５）と入力文の『ｄｏｔｔｅｄ』とを照合する。すると、両者は等しくないので、セル（Ｎ５，“ｄｏｔｔｅｄ”）の値（＝３）、セル（Ｎ５，“ａｒｅ”）の値（＝４）、およびセル（Ｎ９，“ｄｏｔｔｅｄ”）の値（＝３）をチェックし、そのうちの最大値を選択する。したがって、セル（Ｎ５，“ｄｏｔｔｅｄ”）＝４となり、バックリンクは、最大値として選択したセル（Ｎ５，“ａｒｅ”）にリンクされ、バックリンクが変更される。
【０１２３】
（６）次に、アーク（Ｎ９，Ｎ５）と入力文の『ｗｉｔｈ』とを照合する。すると、両者は等しくないので、セル（Ｎ５，“ｗｉｔｈ”）の値（＝４）、セル（Ｎ５，“ｄｏｔｔｅｄ”）の値（＝４）、およびセル（Ｎ９，“ｗｉｔｈ”）の値（＝３）をチェックする。
【０１２４】
ここで、セル（Ｎ５，“ｄｏｔｔｅｄ”）の値（＝４）が最大値である場合には、Ｎ５の行の第１列から第５列までの場合と同様、バックリンクが変更され、各升目の右下に記している数字も、変更された文字列の合計ポイント数である「６」に変更されることになる。
【０１２５】
ところが、セル（Ｎ５，“ｄｏｔｔｅｄ”）の値（＝４）と、元のセル（Ｎ５，“ｗｉｔｈ”）の値（＝４）とは同一値である。そしてこの場合には、バックリンクを変更することにより、Ｎ５の行の升目の右下に記している数字が小さくなる場合を除き、バックリンクの変更は行なわない。したがって、セル（Ｎ５，“ｗｉｔｈ”）＝４となり、バックリンクは、セル（Ｎ４，“ｄｏｔｔｅｄ”）にリンクされたままの状態が保持され、升目の右下に記している数字も、図７の上側の文字列の合計ポイント数である「５」のままの状態が保持される。
【０１２６】
以上説明したマッチング作業により、図７に示す上側の文字列の最適度比較値が４／５で、下側の文字列の最適度比較値が４／６となり、上側の文字列が入力文に対する最適テンプレートパターン候補として決定されることになる。
【０１２７】
このようにして、入力文
『ＩｎＪａｐａｎ，ａｒｅｄｏｔｔｅｄｗｉｔｈｌｏｖｅｌｙ
ｐｕｂｌｉｃｇａｒｄｅｎｓｎａｔｉｏｎｗｉｄｅ．』
に対し、
『Ｊａｐａｎｉｓｄｏｔｔｅｄｗｉｔｈｌｏｖｅｌｙ
ｐｕｂｌｉｃｇａｒｄｅｎｓｎａｔｉｏｎｗｉｄｅ．』
が最適テンプレートパターン候補として決定されたならば、図３のステップＳ８において、最適テンプレートパターン候補に対応する日本語の訳文用テンプレートパターン候補
『日本には、全国的に美しい庭が多い。』
が、図１の翻訳用データベース１から選択され、これが最適翻訳文として決定される。
【０１２８】
しかして、正規化ＬＳＩベクトルを圧縮文書ＬＳＩベクトル空間に射影する方法を用い、多数のテンプレートパターン候補に対し粗い選定を行なってテンプレートパターン候補の対象数を絞り、次いで絞られた少数のテンプレートパターン候補に対し、最適度比較値を用いた精細選定を行なうようにしているので、精度の高い最適翻訳文を短時間で得ることができる。
【０１２９】
なお、翻訳用データベース１に、充分な量のデータが記憶されている場合には、常に精度の高い最適翻訳文を得ることができるが、翻訳用データベース１内のデータ量が充分でなかったり、記憶されているデータが適切でない場合には、精度の高い最適翻訳文が得られないこともある。
【０１３０】
そこで、このような場合には、言語専門家の力およびＶＴＡＴ（ビジュアル・テンプレート・オーサリング・ツール）と呼ばれているテンプレート・エディタを使用し、翻訳用データベース１の修正とメンテナンスとを行なう。僅かな相違は、翻訳メモリのローカリゼーション技法の場合のように、置換操作によって処理することができる。
【０１３１】
【発明の効果】
以上説明したように本発明は、ＡＴＮ機能を有する任意数の文章要素を同列で包含する複数のテンプレートブロックで構成される原文用のテンプレート群およびこのテンプレート群と意味的に等価な訳文用テンプレート群が、相互に関連付けて記憶されている翻訳用データベースを用い、前記テンプレート群から作成可能なすべてのテンプレートパターン候補の中から、入力文に最も適したテンプレートパターン候補を検索するとともに、このテンプレートパターン候補に対応する訳文用テンプレートパターン候補を、前記訳文用テンプレート群から作成し、この訳文用テンプレートパターン候補を、最適翻訳文として選定する最適翻訳文選定方法であって、前記テンプレート群中のすべての単語に、その重要度に応じたポイント数のポイントを付与した後、前記すべてのテンプレートパターン候補および入力文について、各テンプレートパターン候補および入力文で用いられているすべての単語のテンプレート群中における出現頻度とその単語のポイント数とに基づき、各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを求めるとともに、ＳＶＤアルゴリズムを用いて設定される圧縮文書ＬＳＩベクトル空間に射影し、入力文に対し圧縮文書ＬＳＩベクトル空間における類似度が高い順に複数のテンプレートパターン候補を選んで優良テンプレートパターン候補とし、次いで各優良テンプレートパターン候補で用いられているすべての単語の合計ポイント数を分母，入力文と各優良テンプレートパターン候補との間での一致単語の合計ポイント数を分子とする最適度比較値を求め、分子が最大となる最適度比較値のうちで、最適度比較値が最も大きくなる優良テンプレートパターン候補を選ぶとともに、これに対応する訳文用テンプレートパターン候補を、最適翻訳文として選定するようにしたことを特徴とする。そして本発明においては、正規化ＬＳＩベクトルを圧縮文書ＬＳＩベクトル空間に射影する方法を用い、粗い選定を行なって対象となるテンプレートパターンの数を絞り、その後絞られた少数のテンプレートパターンに対し、最適度比較値を用いた詳細選定を行なうようにしているので、精度の高い最適翻訳文を短時間で得ることができる。
【０１３２】
本発明はまた、ＡＴＮ機能を有する任意数の文章要素を同列で包含する複数のテンプレートブロックで構成される原文用のテンプレート群およびこのテンプレート群と意味的に等価な訳文用テンプレート群とを、相互に関連付けて記憶する翻訳用データベースと；入力文を記憶する入力文記憶手段と；前記テンプレート群の各テンプレートブロックと入力文とを比較し、テンプレート群から作成可能なすべてのテンプレートパターン候補を検索するテンプレートパターン候補検索手段；検索されたテンプレートパターン候補を記憶するテンプレートパターン候補記憶手段と；テンプレート群中のすべての単語にその重要度に応じたポイント数で付与されるポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と；各テンプレートパターン候補および入力文で用いられるすべての単語のテンプレート群中における出現頻度を、各テンプレートパターン候補および入力文毎に単語と関連付けて記憶する単語出現頻度記憶手段と；単語の出現頻度とポイント数とに基づき、各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを演算する正規化ＬＳＩベクトル演算手段と；演算された各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを記憶する正規化ＬＳＩベクトル記憶手段と；ＳＶＤアルゴリズムを用いて設定される圧縮文書ＬＳＩベクトル空間において、各テンプレートパターン候補の正規化ＬＳＩベクトルと入力文の正規化ＬＳＩベクトルとを比較し、その類似度を演算する類似度演算手段と；類似度が高い方から順に選ばれた複数のテンプレートパターン候補を、優良テンプレートパターン候補として記憶する優良テンプレートパターン候補記憶手段と；各優良テンプレートパターン候補において入力文と一致する単語を検索する一致単語検索手段と；各優良テンプレートパターン候補で用いられているすべての単語の合計ポイント数を演算する合計ポイント数演算手段と；入力文と各優良テンプレートパターン候補との間での一致単語の合計ポイント数を演算する一致単語ポイント数演算手段と；各優良テンプレートパターン候補における全単語の合計ポイント数を分母，各優良テンプレートパターン候補における入力文との一致単語の合計ポイント数を分子とする最適比較値を演算する最適度比較値演算手段と；各優良テンプレートパターン候補の最適度比較値を比較し、分子が最大となる最適度比較値のうちで、最も大きな最適度比較値を有する優良テンプレートパターン候補を、最適テンプレートパターン候補として決定する最適テンプレートパターン候補決定手段と；最適テンプレートパターン候補に対応する訳文用テンプレートパターン候補を、最適翻訳文として選定する最適翻訳文選定手段と；を設け、類似度演算手段等を用い、対象となるテンプレートパターンの数を優良テンプレートパターン候補として絞った後、最適テンプレートパターン候補決定手段等を用い、最適なテンプレートパターン候補を決定するようにしているので、短時間で精度の高い最適翻訳文を選定することができる。
【０１３３】
本発明はさらに、ＡＴＮ機能を有する任意数の文章要素を同列で包含する複数のテンプレートブロックで構成される原文用のテンプレート群およびこのテンプレート群と意味的に等価な訳文用テンプレート群を、相互に関連付けてメモリ領域に記憶させる処理；入力文をメモリ領域に記憶させる処理；前記テンプレート群中のすべての単語に対し、その重要度に応じたポイント数で付与されたポイントを、単語と関連付けてメモリ領域に記憶させる処理；前記テンプレート群から作成可能なすべてのテンプレートパターン候補および入力文について、各テンプレートパターン候補および入力文で用いられているすべての単語のテンプレート群中における出現頻度とその単語のポイント数とに基づき、各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを求める処理；ＳＶＤアルゴリズムを用いて設定される圧縮文書ＬＳＩベクトル空間において、各テンプレートパターン候補の正規化ＬＳＩベクトルと入力文の正規化ＬＳＩベクトルとを比較し、その類似度を求める処理；類似度の高い方から順に選んだ複数のテンプレートパターン候補を、優良テンプレートパターン候補としてメモリ領域に記憶させる処理；各優良テンプレートパターン候補で用いられるすべての単語の合計ポイント数を分母，入力文と各優良テンプレートパターン候補との間での一致単語の合計ポイント数を分子とする最適度比較値を用い、分子が最大となる最適度比較値のうちで、最適度比較値が最も大きくなる優良テンプレートパターン候補を、最適テンプレートパターン候補として決定する処理；最適テンプレートパターン候補に対応する訳文用テンプレートパターン候補を、最適翻訳文として選定する処理；をコンピュータに実行させるようにしているので、前記各処理により、精度の高い最適翻訳文を短時間で得ることができる。
【図面の簡単な説明】
【図１】本発明の実施の一形態に係る最適翻訳文選定装置を示す全体構成図である。
【図２】図１の装置で用いられるテンプレート群の一例を示す説明図である。
【図３】図１の装置による最適翻訳文選定方法を示す流れ図である。
【図４】図３のステップＳ６の詳細を示す流れ図である。
【図５】圧縮文書ＬＳＩベクトル空間に射影されたテンプレートパターン候補および入力文の状態を示す説明図である。
【図６】図３のステップＳ７の詳細を示す流れ図である。
【図７】有向グラフの一例を示す説明図である。
【図８】図４の各ノードと入力文とのマッチングを行なう際の初期状態を示す表である。
【図９】アーク（Ｎ１，Ｎ２）と入力文とのマッチングを示す表である。
【図１０】アーク（Ｎ１，Ｎ６）と入力文とのマッチングを示す表である。
【図１１】アーク（Ｎ２，Ｎ３）と入力文とのマッチングを示す表である。
【図１２】アーク（Ｎ３，Ｎ４）と入力文とのマッチングを示す表である。
【図１３】アーク（Ｎ４，Ｎ５）と入力文とのマッチングを示す表である。
【図１４】アーク（Ｎ６，Ｎ７）と入力文とのマッチングを示す表である。
【図１５】アーク（Ｎ７，Ｎ８）と入力文とのマッチングを示す表である。
【図１６】アーク（Ｎ８，Ｎ９）と入力文とのマッチングを示す表である。
【図１７】アーク（Ｎ９，Ｎ５）と入力文とのマッチングを示す表である。
【符号の説明】
１翻訳用データベース
２入力文記憶手段
３テンプレートパターン候補検索手段
４テンプレートパターン候補記憶手段
５単語ポイント数記憶手段
６単語出現頻度記憶手段
７正規化ＬＳＩベクトル演算手段
８正規化ＬＳＩベクトル記憶手段
９類似度演算手段
１０優良テンプレートパターン候補記憶手段
１１一致単語検索手段
１２合計ポイント数演算手段
１３一致単語ポイント数演算手段
１４最適度比較値演算手段
１５最適テンプレートパターン候補決定手段
１６最適翻訳文選定手段

Claims

各種データを処理する処理手段と；ＡＴＮ（拡張遷移ネットワーク）機能を有する任意数の文章要素を同列で包含する複数のテンプレートブロックで構成される原文用のテンプレート群およびこのテンプレート群と意味的に等価な訳文用テンプレート群を、相互に関連付けて記憶する翻訳用データベースと；入力文を記憶する入力文記憶手段と；テンプレートパターン候補検索手段と；テンプレートパターン候補検索手段で検索されたテンプレートパターン候補を記憶するテンプレートパターン候補記憶手段と；テンプレート群中のすべての単語にその重要度に応じたポイント数で付与されたポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と；各テンプレートパターン候補および入力文で用いられるすべての単語のテンプレート群中における出現頻度を、各テンプレートパターン候補および入力文毎に単語と関連付けて記憶する単語出現頻度記憶手段と；正規化ＬＳＩ（ＬａｔｅｎｔＳｅｍａｎｔｉｃＩｎｄｅｘｉｎｇ）ベクトル演算手段と；正規化ＬＳＩベクトル演算手段で演算された各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを記憶する正規化ＬＳＩベクトル記憶手段と；類似度演算手段と；類似度が高い方から順に選ばれた複数のテンプレートパターン候補を、優良テンプレートパターン候補として記憶する優良テンプレートパターン候補記憶手段と；一致単語検索手段と；合計ポイント数演算手段と；一致単語ポイント数演算手段と；最適度比較値演算手段と；最適テンプレートパターン候補決定手段と；最適翻訳文選定手段と；を備え、前記テンプレート群から作成可能なすべてのテンプレートパターン候補の中から、入力文に最も適したテンプレートパターン候補を検索するとともに、このテンプレートパターン候補に対応する訳文用テンプレートパターン候補を、前記訳文用テンプレート群から作成し、この訳文用テンプレートパターン候補を、最適翻訳文として選定する最適翻訳文選定方法であって、
前記テンプレートパターン候補検索手段が、テンプレート群の各テンプレートブロックと入力文とを比較し、テンプレート群から作成可能なすべてのテンプレートパターン候補を検索するとともに、前記処理手段が、検索されたテンプレートパターン候補を、前記テンプレートパターン候補記憶手段に記憶させるステップと、
前記正規化ＬＳＩベクトル演算手段が、単語の出現頻度とポイント数とに基づき、各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを演算するとともに、前記処理手段が、演算された各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを、前記正規化ＬＳＩベクトルに記憶させるステップと、
前記類似度演算手段が、ＳＶＤ（特異値ベクトル分解法）アルゴリズムを用いて設定される圧縮文書ＬＳＩベクトル空間において、各テンプレートパターン候補の正規化ＬＳＩベクトルと入力文の正規化ベクトルとを比較し、その類似度を演算するとともに、前記処理手段が、類似度が高い方から選んだ複数のテンプレートパターン候補を、前記優良テンプレートパターン候補記憶手段に優良テンプレートパターン候補として記憶させるステップと、
前記一致単語検索手段が、各優良テンプレートパターン候補において入力文と一致する単語を検索するステップと、
前記合計ポイント数演算手段が、各優良テンプレートパターン候補で用いられているすべての単語の合計ポイント数を演算するステップと、
前記一致単語ポイント数演算手段が、入力文と各優良テンプレートパターン候補との間での一致単語の合計ポイント数を演算するステップと、
前記最適度比較値演算手段が、各優良テンプレートパターン候補における全単語の合計ポイント数を分母，各優良テンプレートパターン候補における入力文との一致単語の合計ポイント数を分子とする最適度比較値を演算するステップと、
前記最適テンプレートパターン候補決定手段が、各優良テンプレートパターン候補の最適度比較値を比較し、分子が最大となる最適度比較値のうちで、最も大きな最適度比較値を有する優良テンプレートパターン候補を、最適テンプレートパターン候補として決定するステップと、
前記最適翻訳文選定手段が、最適テンプレートパターン候補に対応する訳文用テンプレートパターン候補を、最適翻訳文として選定するステップと、
を具備することを特徴とする最適翻訳文選定方法。
ＡＴＮ（拡張遷移ネットワーク）機能を有する任意数の文章要素を同列で包含する複数のテンプレートブロックで構成される原文用のテンプレート群およびこのテンプレート群と意味的に等価な訳文用テンプレート群を、相互に関連付けて記憶する翻訳用データベースと；入力文を記憶する入力文記憶手段と；前記テンプレート群の各テンプレートブロックと入力文とを比較し、テンプレート群から作成可能なすべてのテンプレートパターン候補を検索するテンプレートパターン候補検索手段；検索されたテンプレートパターン候補を記憶するテンプレートパターン候補記憶手段と；テンプレート群中のすべての単語にその重要度に応じたポイント数で付与されるポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と；各テンプレートパターン候補および入力文で用いられるすべての単語のテンプレート群中における出現頻度を、各テンプレートパターン候補および入力文毎に単語と関連付けて記憶する単語出現頻度記憶手段と；単語の出現頻度とポイント数とに基づき、各テンプレートパターン候補および入力文の正規化ＬＳＩ（ＬａｔｅｎｔＳｅｍａｎｔｉｃＩｎｄｅｘｉｎｇ）ベクトルを演算する正規化ＬＳＩベクトル演算手段と；演算された各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを記憶する正規化ＬＳＩベクトル記憶手段と；ＳＶＤ（特異値ベクトル分解法）アルゴリズムを用いて設定される圧縮文書ＬＳＩベクトル空間において、各テンプレートパターン候補の正規化ＬＳＩベクトルと入力文の正規化ＬＳＩベクトルとを比較し、その類似度を演算する類似度演算手段と；類似度が高い方から順に選ばれた複数のテンプレートパターン候補を、優良テンプレートパターン候補として記憶する優良テンプレートパターン候補記憶手段と；各優良テンプレートパターン候補において入力文と一致する単語を検索する一致単語検索手段と；各優良テンプレートパターン候補で用いられているすべての単語の合計ポイント数を演算する合計ポイント数演算手段と；入力文と各優良テンプレートパターン候補との間での一致単語の合計ポイント数を演算する一致単語ポイント数演算手段と；各優良テンプレートパターン候補における全単語の合計ポイント数を分母，各優良テンプレートパターン候補における入力文との一致単語の合計ポイント数を分子とする最適度比較値を演算する最適度比較値演算手段と；各優良テンプレートパターン候補の最適度比較値を比較し、分子が最大となる最適度比較値のうちで、最も大きな最適度比較値を有する優良テンプレートパターン候補を、最適テンプレートパターン候補として決定する最適テンプレートパターン候補決定手段と；最適テンプレートパターン候補に対応する訳文用テンプレートパターン候補を、最適翻訳文として選定する最適翻訳文選定手段と；を具備することを特徴とする最適翻訳文選定装置。
各種データを処理する処理手段と；ＡＴＮ（拡張遷移ネットワーク）機能を有する任意数の文章要素を同列で包含する複数のテンプレートブロックで構成される原文用のテンプレート群およびこのテンプレート群と意味的に等価な訳文用テンプレート群を、相互に関連付けて記憶する翻訳用データベースと；入力文を記憶する入力文記憶手段と；テンプレートパターン候補検索手段と；テンプレートパターン候補検索手段で検索されたテンプレートパターン候補を記憶するテンプレートパターン候補記憶手段と；テンプレート群中のすべての単語にその重要度に応じたポイント数で付与されたポイントを、単語と関連付けて記憶する単語ポイント数記憶手段と；各テンプレートパターン候補および入力文で用いられるすべての単語のテンプレート群中における出現頻度を、各テンプレートパターン候補および入力文毎に単語と関連付けて記憶する単語出現頻度記憶手段と；正規化ＬＳＩ（ＬａｔｅｎｔＳｅｍａｎｔｉｃＩｎｄｅｘｉｎｇ）ベクトル演算手段と；正規化ＬＳＩベクトル演算手段で演算された各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを記憶する正規化ＬＳＩベクトル記憶手段と；類似度演算手段と；類似度が高い方から順に選ばれた複数のテンプレートパターン候補を、優良テンプレートパターン候補として記憶する優良テンプレートパターン候補記憶手段と；一致単語検索手段と；合計ポイント数演算手段と；一致単語ポイント数演算手段と；最適度比較値演算手段と；最適テンプレートパターン候補決定手段と；最適翻訳文選定手段と；を備え、前記テンプレート群から作成可能なすべてのテンプレートパターン候補の中から、入力文に最も適したテンプレートパターン候補を検索するとともに、このテンプレートパターン候補に対応する訳文用テンプレートパターン候補を、前記訳文用テンプレート群から作成し、この訳文用テンプレートパターン候補を、最適翻訳文として選定する処理をコンピュータに実行させるためのプログラムを記録したコンピュータ読取り可能な記録媒体であって、
前記テンプレートパターン候補検索手段が、テンプレート群の各テンプレートブロックと入力文とを比較し、テンプレート群から作成可能なすべてのテンプレートパターン候補を検索するとともに、前記処理手段が、検索されたテンプレートパターン候補を、前記テンプレートパターン候補記憶手段に記憶させる処理と、
前記正規化ＬＳＩベクトル演算手段が、単語の出現頻度とポイント数とに基づき、各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを演算するとともに、前記処理手段が、演算された各テンプレートパターン候補および入力文の正規化ＬＳＩベクトルを、前記正規化ＬＳＩベクトルに記憶させる処理と、
前記類似度演算手段が、ＳＶＤ（特異値ベクトル分解法）アルゴリズムを用いて設定される圧縮文書ＬＳＩベクトル空間において、各テンプレートパターン候補の正規化ＬＳＩベクトルと入力文の正規化ベクトルとを比較し、その類似度を演算するとともに、前記処理手段が、類似度が高い方から選んだ複数のテンプレートパターン候補を、前記優良テンプレートパターン候補記憶手段に優良テンプレートパターン候補として記憶させる処理と、
前記一致単語検索手段が、各優良テンプレートパターン候補において入力文と一致する単語を検索する処理と、
前記合計ポイント数演算手段が、各優良テンプレートパターン候補で用いられているすべての単語の合計ポイント数を演算する処理と、
前記一致単語ポイント数演算手段が、入力文と各優良テンプレートパターン候補との間での一致単語の合計ポイント数を演算する処理と、
前記最適度比較値演算手段が、各優良テンプレートパターン候補における全単語の合計ポイント数を分母，各優良テンプレートパターン候補における入力文との一致単語の合計ポイント数を分子とする最適度比較値を演算する処理と、
前記最適テンプレートパターン候補決定手段が、各優良テンプレートパターン候補の最適度比較値を比較し、分子が最大となる最適度比較値のうちで、最も大きな最適度比較値を有する優良テンプレートパターン候補を、最適テンプレートパターン候補として決定する処理と、
前記最適翻訳文選定手段が、最適テンプレートパターン候補に対応する訳文用テンプレートパターン候補を、最適翻訳文として選定する処理と、
をコンピュータに実行させるためのプログラムを記録したコンピュータ読取り可能な記録媒体。