JP3999773B2

JP3999773B2 - 機械翻訳プログラム、機械翻訳システム、機械翻訳方法

Info

Publication number: JP3999773B2
Application number: JP2004208315A
Authority: JP
Inventors: 裕美子吉村
Original assignee: Toshiba Corp; Toshiba Solutions Corp
Current assignee: Toshiba Corp; Toshiba Digital Solutions Corp
Priority date: 2004-07-15
Filing date: 2004-07-15
Publication date: 2007-10-31
Anticipated expiration: 2024-07-15
Also published as: JP2006031334A

Description

本発明は、例えば自然言語データベースを用いて原言語の文章を目的言語の文章に自動的に翻訳する機械翻訳プログラム、機械翻訳システム、機械翻訳方法に関する。

近年、コンピュータを利用して、第１言語（原言語）の文章を第２言語（目的言語）の文章に自動的に翻訳する機械翻訳システムが注目されている。
機械翻訳システムにおける翻訳処理は、まず、入力原文を形態素解析して処理単位に分割し、次に構文解析・意味解析等によって、原言語の構文構造を分析して意味構造を構築し、続いて、翻訳辞書中に含まれる翻訳規則の中から当該入力文に適する翻訳規則を検索して適用し、対応する目的言語の構文、訳語を決定する。
最後に、決定した構文、訳語を所定の訳文生成規則に従って１次元的な第２言語の文字列に変換し、入力原文に対する訳文を得るようになっている。

このような機械翻訳において高精度な翻訳を実現するためには、翻訳辞書にどれだけ多様な翻訳知識を蓄積できるかが重要であるが、あらゆる入力文に万能な翻訳知識を構築するのには限界がある。また、原文書の解析を行いながら、文書の内容（分野）を自動判定し、判定結果に応じた訳し方等を自動選択できるような翻訳方式も実用化されている。
但し、この自動判定のためにも知識が必要であり、現実にはあらゆるユーザが翻訳しようとするあらゆる種類の原文書に対応して、常に望ましい訳出方法を翻訳システムが自動的に選択していくというのは非常に困難である。
このため、ユーザは、原言語の語句に対する複数の訳語候補の中から、入力文書の種類やユーザの好みに応じて、適した訳語を個々に選択・学習する作業を行う必要がある。

従来の機械翻訳システムでは、このような学習作業をユーザ自身が行うことによって訳語の学習を実現していた。この方法では、適切でない訳語が多ければ多いほど、ユーザの学習作業が増えることになる。

そこで、ユーザの学習作業の負担を大幅に軽減するための訳語学習方式として、目的言語文書での統計的情報を元に訳語を自動的に決定する方式が提案されている（例えば非特許文献１、特許文献２参照）。
このような自動訳語学習方式では、目的言語文書をユーザが用意することによって、そのユーザが翻訳させたい文書に適した自動的な訳語学習が可能になる。

また、訳語学習の対象外とする語句の指定を可能にすることにより、自動学習の副作用を軽減したり、学習対象外語句の指定状況から、原文書に応じた翻訳時に用いる目的言語文書データベースの優先度を自動選択する技術も公開されている（例えば特許文献３２参照）。
「目的言語の単言語コーパスを利用した訳語学習方式」（言語処理学会第８回年次大会論文週、２００２Ｖｏｌ１．１、ｐｐ２７６−２８０）特開２０００−２５０９１４号公報特願２００２−２４２３６８号公報

従来技術で用いてきた目的言語文書データベースに含まれる情報は、個々の語句や語句の共起情報とその頻度などの統計情報が中心であり、一般的なユーザ辞書のようにユーザが中身を完全管理することはできず、編集も自由にできないという問題があった。

また、文書を順次追加登録するうちに誤った文書を登録した場合、意図しないデータベースに文書を登録してしまった場合に登録前の状態に戻すことは容易ではなく、全文書の登録前に戻って登録をやり直すしかなかった。
特に、誤って登録したことに後になって気付いた場合や、翻訳に用いてみて登録した文書が適切でなかったことに気付いた場合など、どの文書を登録しなおせばよいかという情報すら明確でないことが多く、困難をきたしていた。

また、登録する目的言語文書によっては、目的言語文書データベースに特定分野に特徴的でない統計情報が優位値と共に格納されてしまうことがある。そうした場合、ある文書の翻訳では、所望でない訳語の自動選択が行われることにも繋がる。このようなときは、データベースに格納されている特定の統計情報をユーザの意思で削除可能なようにすることが望まれるが、従来では、データベースとして一度構築された統計情報は、一般ユーザが容易に編集できる内容でないため、実現が困難であった。

本発明はこのような課題を解決するためになされたもので、編集し難い目的言語文書を登録したデータベースに対して、一旦登録した文書を簡単な操作で選び出して登録前の状態に復元することができる機械翻訳プログラム、機械翻訳システム、機械翻訳方法を提供することを目的とする。

本発明の機械翻訳プログラムは、コンピュータを、原言語から目的言語へ翻訳するために前記目的言語による少なくとも１つの目的言語文書に基づいて分野毎に構築され、分野を示すデータベースの名称、前記目的言語文書固有の識別情報、文書を検索するためのキーワードおよび/または自然言語文、前記文書の中に生起した単語同士の共起関係を、その発生頻度の値に対応付けた共起情報を含む項目で目的言語文書情報が記憶された複数のデータベースと、前記複数のデータベースの情報を追加または削減するための動作モードの設定と、削減の対象となる目的言語文書あるいは目的言語データを指定するための自然言語文またはキーワードを入力する入力手段と、削減モードにおいて、前記入力手段により入力されたキーワードおよび/または自然言語文を検索キーとして前記複数のデータベースの少なくとも一つのデータベースに記憶されている削減対象の目的言語文書および/または作成済み目的言語データを指定する指定手段と、作成済みの目的言語データが格納されたデータベースの名称と、前記データベースを作成する際に使用した文書名とその格納場所、前記発生頻度の値を固定、減算または加算する指標となる強度情報を記憶する文書管理テーブルと、前記指定手段により指定された前記削減対象の目的言語文書および/または作成済み目的言語データを検索キーにして前記文書管理テーブルを参照し、前記削減対象の目的言語文書および/または作成済み目的言語データが記憶されているデータベースを特定する特定手段と、前記文書管理テーブルの強度情報に基づいて、特定された前記データベースの該当目的言語文書の共起情報の発生頻度の値を固定、減算または加算して前記データベースを更新する更新手段として機能させるための機械翻訳プログラムである。

また、本発明の機械翻訳システムは、原言語から目的言語へ翻訳するために前記目的言語による少なくとも１つの目的言語文書に基づいて分野毎に構築され、分野を示すデータベースの名称、前記目的言語文書固有の識別情報、文書を検索するためのキーワードおよび/または自然言語文を、登録した文書の中に生起した単語同士の共起関係を、その発生頻度の値に対応付けた共起情報を含む項目で目的言語文書情報が記憶された複数のデータベースと、前記複数のデータベースの情報を追加または削減するための動作モードの設定と、削減の対象となる目的言語文書あるいは目的言語データを指定するためのキーワードおよび/または自然言語文を入力する入力手段と、削減モードにおいて、前記入力手段により入力された自然言語文またはキーワードを検索キーとして前記複数のデータベースの少なくとも一つのデータベースに記憶されている削減対象の目的言語文書および/または作成済み目的言語データを指定する指定手段と、作成済みの目的言語データが格納されたデータベースの名称と、前記データベースを作成する際に使用した文書名とその格納場所、前記発生頻度の値を固定、減算または加算する指標となる強度情報を記憶する文書管理テーブルと、前記指定手段により指定された前記削減対象の目的言語文書および/または作成済み目的言語データを検索キーにして前記文書管理テーブルを参照し、前記削減対象の目的言語文書および/または作成済み目的言語データが記憶されているデータベースを特定する手段と、前記文書管理テーブルの強度情報に基づいて、特定された前記データベースの該当目的言語文書の共起情報の発生頻度の値を固定、減算または加算して前記データベースを更新する更新手段とを具備したことを特徴とする。

さらに、本発明の機械翻訳方法は、原言語から目的言語へ翻訳するために前記目的言語による少なくとも１つの目的言語文書に基づいて分野毎に構築され、分野を示すデータベースの名称、前記目的言語文書固有の識別情報、文書を検索するためのキーワードおよび/または自然言語文を、登録した文書の中に生起した単語同士の共起関係を、その発生頻度の値に対応付けた共起情報を含む項目で目的言語文書情報が記憶された複数のデータベースの情報を削減するにあたり、削減の対象となる目的言語文書あるいは目的言語データを指定するキーワードおよび/または自然言語文が入力手段から入力された場合、前記指定手段が、入力された前記キーワードおよび/または自然言語文を検索キーとして前記複数のデータベースの少なくとも一つに記憶されている削減対象の目的言語文書および/または作成済み目的言語データを指定するステップと、特定手段が、指定された前記削減対象の目的言語文書および/または作成済み目的言語データを検索キーにして、作成済みの目的言語データが格納されたデータベースの名称と、前記データベースを作成する際に使用した文書名とその格納場所、前記発生頻度の値を固定、減算または加算する指標となる強度情報を記憶する文書管理テーブルを参照し、前記削減対象の目的言語文書および/または作成済み目的言語データが記憶されている該当データベースを特定するステップと、更新手段が、前記文書管理テーブルの強度情報に基づいて、特定された前記データベースの該当目的言語文書の共起情報の発生頻度の値を固定、減算または加算して前記データベースを更新するステップとを有することを特徴とする。

本発明では、データベースの情報を削減するための削減モードを備えており、この削減モードにおいて、削減の対象となる目的言語文書あるいは目的言語データを指定するキーワードおよび/または自然言語文が入力された場合、指定手段は、入力されたキーワードおよび/または自然言語文に基づいてデータベースに記憶されている削減対象の目的言語文書および/または作成済み目的言語データを指定し、特定手段が文書管理テーブルを参照して、指定された削減対象の目的言語文書および/または作成済み目的言語データが記憶されている該当データベースを特定し、更新手段が、文書管理テーブルの強度情報に基づいて、特定された前記データベースの該当目的言語文書の共起情報の発生頻度の値を固定、減算または加算してそのデータベースを更新するので、ユーザは、目的言語文をデータベースに追加登録した後で、登録した内容を覚えていなくても該当する目的言語の文章を簡単な操作で探し当てて削減することができる。

以上説明したように本発明によれば、編集し難い目的言語文書を登録したデータベースに対して、一旦登録した文書を簡単な操作で選び出して登録前の状態に復元することができる。

以下、本発明の実施の形態を図面を参照して詳細に説明する。図１は本発明に係る一実施形態の機械翻訳システムを示すブロック図、図２は目的言語文書データベースに格納されているデータベースの内容の一例を示す図、図３はデータベース管理部により参照される文書管理テーブルの内容を示す図である。

図１に示すように、この第１実施形態の機械翻訳システムは、入力部１、制御部２、翻訳部３、辞書部４、出力部５、データベース管理部６、目的言語文書データベース生成部７、目的言語文書データベース８、文書管理テーブル９等から構成されている。なお、以下ではデータベースをＤＢと称す。この機械翻訳システムのハードウェア構成としては、ＣＰＵ、メモリ、ハードディスク装置等を備えたコンピュータと、このコンピュータに接続された表示装置および印刷装置等である。ハードディスク装置にはコンピュータシステム全体を動作させるオペレーティングシステム（以下ＯＳと称す）と、機械翻訳を実行する制御プログラム（以下機械翻訳プログラムと称す）がインストールされており、これら機械翻訳プログラム、ＯＳ、ＣＰＵ、メモリ等が協働して、制御部２、翻訳部３、ＤＢ管理部６等の処理動作を実現する。

入力部１は、翻訳対象となる元の文書（原文）の電子データ（以下文書と称す）を取り込んで制御部２へ出力する。また入力部１は、制御部２に対して、翻訳対象となる文字列（文）の入力および各種コマンドの入力等を行うものである。入力部１は、ＤＢの情報を追加または削減するための制御部２の動作モードの切り替え操作を行うものである。通常、入力部１としては、キーボード、マウス等の他、画面に表示されたリスト一覧からの選択ボタン、プルダウンメニュー等のグラフィックユーザインターフェース（ＧＵＩ）が用いられる。この他、入力部１としては、スキャナ、ディクテーション装置、インターネット上のサーバ、記憶媒体などでも良い。つまり、翻訳対象文の入力の仕方としては、ＯＣＲ、フレキシブルディスク、磁気テープ、磁気ディスク、インターネットのサーバからのテキスト（文字列）の読み込み、あるいはマイクで入力者が発話した音声を取り込んでディクテーション装置等によって自然言語の文字列に変換したものを読み込む、等の入力手法がある。

制御部２は、このシステム全体の動作を統括制御する。制御部２は、ＤＢ指定部２ａを有している。ＤＢ指定部２ａは、ユーザの操作に応じて目的言語文書ＤＢ８の中から特定のＤＢを指定する。

翻訳部３は、原言語を目的言語に翻訳して１つ以上の訳語候補を生成し、生成した１つ以上の訳語候補からＤＢ指定部２ａにより指定された目的言語文書ＤＢ８の該当ＤＢを用いて１つの訳語を選定する訳語選択部３ａを有している。

辞書部４には、語彙部４ａ、形態素解析規則４ｂ、構文・意味解析規則４ｃ、変換規則４ｄ、構文生成規則４ｅ、形態素生成規則４ｆ等の、文章翻訳のための各種知識、文法ルール、解析情報等の参照情報が蓄積されている。語彙部４ａは、単語、熟語辞書を格納した語彙データベースである。

出力部５は、翻訳部３の出力である翻訳結果を出力したり、制御部２への各種命令に対する制御部２からの応答を表示するものである。出力部５としては、各種ディスプレイなどの表示手段の他、翻訳結果の出力用として印刷機などの印刷手段、あるいは直接フレキシブルディスク、磁気テープ、磁気ディスク等の記憶媒体へ出力するドライブ装置や、ドライブ装置へネットワークを通じて送信する送信手段であってもよい。

ＤＢ管理部６は、目的言語文書ＤＢ８の記憶内容を文書管理テーブル９で管理する。ＤＢ管理部６は、制御部２のＤＢ指定部２ａにより、あるＤＢ８ａに保持されている削減対象の目的言語文書および/または作成済み目的言語データが指定されると、指定された目的言語文書の言語情報、統計情報分を削除対象として、該当ＤＢ８ａから差し引いて目的言語文書ＤＢ８を更新する減算処理を行う。また、ＤＢ管理部６は、削除対象の文書リスト一覧を表示し、そのリストの中から選択された目的言語文書、あるいは目的言語文書とＤＢとの組を、削減処理の情報として文書管理テーブル９で管理する。

ＤＢ管理部６は、追加あるいは削減の対象となるＤＢの名称、言語文書の名称あるいはファイルの名称（データ名）、その格納場所等をユーザが直接入力できない場合のために、検索部６ａを有している。検索部６ａは、入力された自然言語文、キーワード等のキー情報に基づいて目的言語文書ＤＢ８にアクセスし、複数のＤＢの中から該当ＤＢを検索する。具体的には、検索部６ａは、キーワードや自然言語文を与えると、関連する目的言語文書ＤＢ８および目的言語文書を検索しそのリストを作成し、表示装置の画面に表示し、ユーザに選択を促す提示を行う。

目的言語文書ＤＢ生成部７は、ユーザ操作に基づいて原言語（例えば英語等）から目的言語（日本語等）へ翻訳するために目的言語（日本語等）による少なくとも１つ以上の目的言語文書（日本語文書等）に基づいて分野（スポーツ、政治、ニュース、情報技術等）毎のＤＢを目的言語文書ＤＢ８内に構築する。各ＤＢには、目的言語文書の言語情報、統計情報（図２参照）が保持されている。

なお、制御部２の指示でＤＢ管理部６が行う処理を目的言語文書ＤＢ生成部７が行っても良い。つまり目的言語文書ＤＢ生成部７は、例えばユーザが入力した任意の目的言語文書および任意の作成済み目的言語データが指定されると、入力部１からの入力操作で指定された目的言語文書の言語情報、統計情報分を、目的言語文書ＤＢ８の作成済み目的言語データから差し引き、目的言語文書ＤＢ８を更新する減算処理を行う。

目的言語文書ＤＢ８は、原言語から目的言語への翻訳のために目的言語による少なくとも１つ以上の文書に基いて構築されたデータベースである。目的言語文書ＤＢス８には、分野毎の複数のＤＢが格納されている。各ＤＢは、翻訳対象の分野、カテゴリ毎に分けられており、作成済み目的言語データが蓄積されている。その中の一つとしてＤＢ８ａがある。

図２に示すように、例えばＤＢ８ａには、「対応文書ID」、「内容」、「共起情報」、「単語頻度」、等の項目で目的言語文書情報が記憶されている。
「対応文書ID」とは、当該ＤＢを作成した際に登録した目的言語文書固有の識別情報、つまり文書ＩＤである。
このＤＢ８ａの目的言語文書には「内容」として、キーワードや自然言語文を合わせて記憶させることができる。この「内容」は、ＤＢや目的言語文書を検索するのに使われる。「共起情報」は、登録した文書の中に生起した共起関係を、頻度と相互情報量と対応付けた情報である。頻度と相互情報量を統計情報という。頻度と相互情報量には強度（強度情報）が設定可能である。

強度は（１）乃至（３）の選択肢があり、これらの中からユーザが選択し指定するものとする。
減算に先立ってユーザにより（３）の選択肢が選択された場合、強度の欄に例えば加算不要フラグの「１」が設定され、以降の更新処理では統計に関する新たな情報が加算されないように頻度を０に固定する。
また、減算の際に、表示画面から下記（１）、（２）のいずれか一方の選択肢がユーザにより選択された場合、ＤＢ管理部６は、選択された選択肢の強度に応じた削減処理を行う。（１）、（２）では強度自体が異なり、例えば（１）は頻度を単純減算とする、（２）は頻度を０に初期化するという選択肢であり、これらの中から一つを選択して設定可能である。詳細については図７の説明で詳述する。

ＤＢ８ａにおいて、例えば第１のカラムである「Ｎ−ｗｏ−Ｖ」は、共起関係の種類を示し、続く語句は、当該関係で共起した語を示す。なお、Ｎは名詞を示し、Ｖは動詞を示す。後ろに続く数字は、順に頻度、相互情報量、強度を示す。「単語頻度」は登録した文書に生起した単語の種類と頻度を格納している。ここに格納する語句には、１文書での頻度やＤＢ内での頻度の閾値を設けたりあるいは機能語は対象とせずに内容語だけにする、などといった限定をかけることができる。

図３に示すように、文書管理テーブル９には、「文書ID」、「ファイル名」、「格納場所」、「データベース名」、「内容」などの項目からなる、作成済みのＤＢおよびその目的言語文書、目的言語文書データを管理するための文書管理情報が記憶されている。

この文書管理テーブル９の中の「文書ID」と目的言語文書ＤＢ８の例えばＤＢ８ａの「対応文書ID」とは一致している。ＤＢ管理部６の検索部６ａは、この「文書ID」をキーとして、文書管理テーブル９の文書管理情報をたどっていくことで、対応するＤＢ８ａの目的言語文書の情報を得る。

文書管理テーブル９に設定されている「格納場所」は、目的言語文書ＤＢ８の複数のＤＢに登録した文書が実際にどこに存在するかを示している。従って、「格納場所」としては、ローカルマシンのハードディスク装置があげられる。この場合、検索部６ａは、削減モード時に、入力部１によりキー情報として入力された自然言語文あるいはキーワードに基づいてローカルマシンのハードディスク装置内のＤＢから関連する目的言語文書を検索し、ヒットした削減対象となる目的言語文書のリストを作成し表示画面に表示する。
また、ローカルマシン以外の任意の場所における目的言語文書の「格納場所」としては、例えばネットワーク上のサーバがあげられる。この場合、検索部６ａは、削減モード時に、入力部１によりキー情報として入力された自然言語文あるいはキーワードに基づいてインターネット上の所定のサーバから関連する目的言語文書を検索し、ヒットした削減対象となる目的言語文書のリストを新たに作成し表示画面に表示する。

つまり、ＤＢ管理部６の検索部６ａは、ローカルマシン以外の任意の場所から関連する目的言語文書を検索し、削減対象となる目的言語文書のリストを表示し、そのリストの中から選択を促す。これにより、ユーザは、候補リストにない文書も減算対象として指定することができる。
文書管理テーブル９の「文書ID」の例えば“３”の内容で、「格納場所」として、“管理フォルダ”と登録されているのは、ＤＢ管理部６が管理するファイルの保存場所である。ネットワーク上の文書を検索して、それを目的言語文書ＤＢ８に登録したが、ユーザ自身では、登録内容を管理したくなく、かつ検索した文書の保存だけはしておきたい、というものを管理する場所として“管理フォルダ”を用いる。この“管理フォルダ”は、インターネット上の一時的なページを目的言語文書ＤＢ８に登録した場合等にも使われる。

すなわち、この機械翻訳システムにおける翻訳プログラムは、コンピュータに翻訳処理を実行させる翻訳プログラムであって、コンピュータを、原言語から目的言語へ翻訳するために目的言語による少なくとも１つの目的言語文書に基づいて分野毎に構築され、目的言語文書の言語情報、統計情報を保持する目的言語文書ＤＢ８と、この目的言語文書ＤＢ８の情報を追加または削減するための動作モードの設定と、削減の対象となる目的言語文書あるいは目的言語データを指定するキー情報を入力する入力手段としての入力部１と、削減モードにおいて、入力部１により入力されたキー情報に基づいて目的言語文書データベースに記憶されている削減対象の目的言語文書および/または作成済み目的言語データを指定する指定手段としてのＤＢ指定部２ａと、作成済みの目的言語データが格納されたデータベース名と、前記データベースを作成する際に使用した文書名とその格納場所を記憶する文書管理テーブル９と、ＤＢ指定部２ａにより指定された削減対象の目的言語文書および/または作成済み目的言語データが記憶されている該当ＤＢ８ａの文書名を文書管理テーブル９を参照して特定し、削減対象の目的言語文書の言語情報、統計情報分を該当ＤＢ８ａから差し引いてＤＢ８ａを更新する手段として機能させる。

図４は制御部２におけるユーザとの対話による処理を示すフローチャートである。入力部１より原文の入力があると（図４のステップＳ２０１）、制御部２は、出力部５に対して原文の表示を指示する翻訳指示命令を送出する（ステップＳ２０２）。

その後、翻訳指示命令が制御部２に受信されると（ステップＳ２０３のＹｅｓ）、制御部２は原文のデータを翻訳部３へ送り、翻訳処理開始の指示命令をする。翻訳部３は、辞書部４の知識・規則を用いて、入力原文に対して、第２言語の文への翻訳処理を行う（ステップＳ２０４）。翻訳部３の処理の流れについては、後に別図を用いて説明を行う。翻訳処理が終了すると、翻訳結果は制御部２を通じて出力部５へ送られ、ユーザに提示される。

入力部１より制御部２へ翻訳処理に用いる目的言語文書ＤＢ８の指定の命令が入力されると（ステップＳ２０５）、制御部２は、出力部５に対してユーザがＤＢ指定をするための画面表示を指示する。出力部５の表示に従って、ユーザは、データベース名を直接指定したりあるいはＤＢ管理部６が有する検索部６ａを使うなどして、複数のＤＢの中から翻訳文書に望ましいＤＢを選択する（ステップＳ２０６）。この処理の詳細については後述する。

入力部１より制御部２へ目的言語文書ＤＢ８の更新命令が入力されると（ステップＳ２０７のＹｅｓ）、制御部２は、更新処理起動の命令をＤＢ管理部６へ送る。この命令を受けたＤＢ管理部６は、ユーザの命令の詳細に応じて目的言語文書ＤＢ生成部７と協調して目的言語文書ＤＢ８の内容を更新する（ステップＳ２０８）。この処理の詳細についても後に別図を用いて説明する。

また、入力部１より全体の処理終了の指示が入力された場合には（ステップＳ２０９のＹｅｓ）、すべての処理を終了する。

それ以外の操作入力があった場合は（ステップＳ２１０のＹｅｓ）、その入力に応じた処理を行う（ステップＳ２１１）。

ＤＢ管理部６は、指定された目的言語文書を目的言語文書ＤＢ生成部７により解析し、構成語句や共起情報を頻度情報、相互情報量と共に、目的言語文書ＤＢ８に格納し、管理する。共起情報とは、名詞句中の連接共起や、動詞と名詞の共起関係（例：動詞とその目的語）や、１文中の共起情報（関係を限定しない）、１段落中の共起情報など、多様なパターンが考えられるが、本発明ではその具体的種類を限定するものではない。

目的言語文書ＤＢ生成部７は、上記の他に、ＤＢの作成に用いた目的言語文書についての情報も保持する。目的言語文書についての情報は、文書そのものを特定の管理フォルダに格納することで保持する。また、この他、ユーザ管理下の文書であれば、文書の格納場所の情報だけを保持するようにもできる。このような文書情報を、作成したＤＢと対応づけて記憶する。要するに、目的言語文書か目的言語文書ＤＢ８のいずれかを指定すれば、それに対応する情報がとりだせるように文書管理テーブル９が設けられている。

続いて、図５のフローチャートを参照して翻訳部３に翻訳対象の原文が入力されてから目的言語の訳文を生成するまでの処理について説明する。

まず、翻訳部３に入力文が送られてくると、翻訳部３は、入力文に対して辞書部４中の語彙部４ａと形態素解析規則４ｂとを用いて、形態素解析・辞書引き処理を行い、その品詞・活用の種類、訳語の他、翻訳処理に必要な各種情報を求める（図５のステップＳ５０１）。この結果、入力文を構成する単語の品詞、活用の候補が出力される。

続いて、翻訳部３は、構文・意味解析を行う。この構文・意味解析の課程では（ステップＳ５０２）、上記単語、品詞、活用の並びを入力とし、構文・意味解析規則４ｃを用いて、入力文の構造を解析し、原言語の意味構造を構築する。

原言語の意味構造を構築すると、翻訳部３は、それを入力として変換規則４ｄを用いて目的言語構造への変換処理を行う（ステップＳ５０３）。この段階で、目的言語の文としてどのような構文で訳出するか、どのような訳語を出力するか、が判定される。一つの見出し語に対して、訳語が一意に決められない場合は、訳語の候補として複数の語を出力する。訳語間のデフォルト優先順は、語彙部４ａでの訳語定義順とする。
変換処理が終了すると、翻訳部３は、訳語選択処理（ステップＳ５０４）を開始する。
訳語選択処理は、目的言語構造中の各要素について、訳語が一意に決められているかどうかをチェックし、一意に決まっておらず、複数の訳語が出力された見出し語について、目的言語文書ＤＢ８中の統計情報と照合し、訳語間の優先順の調整を行う。
具体的には、複数の訳語があてられた個々の見出し語ごとに以下のような判定と処理を行う。
（１）目的言語文書ＤＢ８中の共起関係情報中から当該見出し語にあてはまる関係を選び出す。（訳語候補のどれかが共起関係情報に挙がっているかどうかをチェックする。）
↓
共起関係の種類と入力文の解析構造を照合し、当てはまるものを見つける。
↓
予め定めた頻度閾値ないしは相互情報量閾値以上であれば、共起関係情報に挙がっている訳語を訳語候補の再優先訳語とする。
（２）目的言語文書ＤＢ８中の単語頻度情報中から当該見出し語にあてはまるものを選び出す。（訳語候補のどれかが単語頻度情報にリストされているかどうかをチェックする。）
↓
予め定めた頻度閾値以上であれば、単語頻度情報にリストされている訳語を訳語候補の再優先訳語とする。

このように、目的言語文書ＤＢ８を参照した訳語候補間の優先度調整が終了すると、翻訳部３は、ステップＳ５０５の処理に進み、構文生成規則４ｅ、形態素生成規則４ｆを用いて、最終的な目的言語の文を生成し、一入力文に対する翻訳処理を終了する。

次に、図６のフローチャートを参照して、入力部１より、翻訳に用いる目的言語文書ＤＢ８の中から特定のＤＢを選択する指示命令が制御部２に送られてきた際のＤＢ指定処理について説明する。

制御部２に目的言語文書データベースを選択する指示命令が送られてくると、制御部２は、ユーザが選択をするのを支援する画面表示を出力部５にて行う（図６のステップＳ６０１）。この画面では、目的言語文書ＤＢ８中の作成済みのＤＢ一覧を表示してユーザに提示する。

この画面には、表示されたＤＢ一覧の中からユーザが特定のＤＢ名を直接指定する欄が設けられている他、既存のＤＢの中から所望のＤＢをキーワードや自然言語文で検索することで選択ができるようなガイドの欄が設けられている。

この画面にＤＢ一覧を表示した後、ユーザにより入力部１より入力操作が行われると、制御部２は、その入力操作内容に従った処理を行う。

ユーザの指示操作がデータベース名の指定であった場合（ステップＳ６０２のＹｅｓ）、制御部２は、指定されたＤＢの実体を同定し、翻訳処理の準備としてデータベースファイルのオープンを行って（ステップＳ６０６）、処理を終了する。

また、ユーザの指示操作が検索指示であった場合（ステップＳ６０３のＹｅｓ）、すなわち、検索キーあるいは検索質問文が入力され、検索開始命令が送られてきた場合、制御部２は、入力された検索キー、検索質問文から検索コマンド文字列を構成し、ＤＢ管理部６へ送り、検索を指示する。ＤＢ管理部６では、制御部２からの検索指示により検索部６ａが、目的言語文書ＤＢ８中から、文書管理情報や各ＤＢ中の「内容」や、ＤＢ中の単語情報を用いて、該当文書の検索を行い、検索結果リストを作成し、出力部５へ送り、出力部５は表示画面に検索結果リストを表示し（ステップＳ６０４）、そのリストの中から選択を促す提示をユーザへ行う。
表示画面に表示された検索結果リストを確認したユーザが、特定のＤＢを選択する操作を行った場合（ステップＳ６０５のＹｅｓ）、制御部２は、指定されたＤＢの実体を同定し、翻訳処理の準備としてデータベースファイルをオープンし（ステップＳ６０６）、処理を終了する。それ以外の操作であった場合（ステップＳ６０５のＮｏ）、制御部２は、ステップＳ６０２の処理に戻り、指示された命令に沿った処理を行う。
また、ユーザの指示操作が、データベース指定処理の終了であった場合（ステップＳ６０７のＹｅｓ）、制御部２は、画面を閉じて処理を終了する。

一方、ユーザの指示操作（入力）が上記以外の操作であった場合（ステップＳ６０８のＹｅｓ）、制御部２は、誤入力として無視し、他の正しい指示操作の入力を待つ。
このようにこの動作例では、ユーザは、目的言語文書ＤＢの名前を直接指定しなくとも、自然言語検索で所望のＤＢを選び、翻訳に用いることができる。

次に、図７のフローチャートを参照して制御部２に目的言語文書ＤＢ更新指示命令が送られた後の、目的言語ＤＢ管理部６における目的言語文書ＤＢ８の更新処理について説明する。

目的言語文書ＤＢ８の更新処理は、ユーザから入力部１に入力された指示命令が以下のいずれかによって動作モード（以下処理モードという）を切り替え、処理手順を変更する。

（１）ＤＢを新規作成して目的言語文書を登録する。
（２）既存のＤＢに新たに目的言語文書を登録する。
（＝特定の目的言語文書内の統計情報を既存ＤＢに加算する）
（３）既存のＤＢに対して、特定の目的言語文書の内容分の内容キャンセルを行う
（＝特定の目的言語文書内の統計情報を既存ＤＢから減算する）

入力部１に対して上記（１）の操作が行われた場合、制御部２は、処理モードを登録モードに切り替える。入力部１に対して上記（２）の操作が行われた場合、制御部２は、処理モードを追加モードに切り替える。入力部１に対して上記（３）の操作が行われた場合、制御部２は、処理モードを削減モードに切り替える。
ユーザからの指示命令が上記（１）である場合（ステップＳ７０１のＹｅｓ）、制御部２は、処理モードを「追加」（「ｍｏｄｅ」＝「ａｄｄ」）に設定した上で、表示画面にデータベース名の指定欄を表示して、新規作成するデータベース名をユーザに指定（入力）させ、指定（入力）されたデータベースファイルをオープンする（ステップＳ７０２）。その後、ステップＳ７０７の目的言語文書の指定処理に進む。

また、ユーザからの指示命令が上記（２）である場合（ステップＳ７０３のＹｅｓ）制御部２は、処理モードを「追加」（「ｍｏｄｅ」＝「ａｄｄ」）に設定した上で、表示画面に、更新対象のＤＢを指定する欄を表示し、ＤＢ指定処理を行う（ステップＳ７０５）。
この実施形態では、ＤＢ指定処理は、図６を用いて説明した「翻訳に用いるＤＢの指定処理」と同じ処理を行うので、ここでの再度の説明は省略する。

ユーザからの指示命令が上記（３）である場合（ステップＳ７０４のＹｅｓ）制御部２は、処理モードを「削減」（「ｍｏｄｅ」＝「ｄｅｌｅｔｅ」）に設定した上で、更新対象のデータベースの指定処理を行う（ステップＳ７０５）。なお、ＤＢから情報を差し引く削減モードであっても、更新対象のＤＢの指定処理は、追加モードと変わりはない。

ユーザの指示命令が、データベース更新処理の終了であった場合（ステップＳ７０６のＹｅｓ）、制御部２は、処理開始後に表示した画面を閉じて終了する。

また、ユーザの入力操作が上記以外のものであった場合（Ｓ７０８のＹｅｓ）、制御部２は、誤入力として無視し、他の正規の指示操作の入力を待つ。
データベース指定処理の後、制御部２は、目的言語文書を指定する処理を行う。
この目的言語文書指定処理において、処理モードが「追加」（「ｍｏｄｅ＝ａｄｄ」）のとき、制御部２は、新規に登録する文書を指定する欄を表示して、ユーザに文書の指定を行わせる。

また、処理モードが「削減」「ｍｏｄｅ＝ｄｅｌｅｔｅ」のときは、制御部２は、既存ＤＢから減算する材料となる文書を指定する欄を表示して、ユーザに文書名の指定を行わせる。
文書の指定処理の流れの大枠は、図６を用いて説明したＤＢの指定処理と共通であるので、ここでは新たに図を設けず、図中の判断・処理内容を適宜読み変え、違いに焦点をあてて説明する。

共通点としては、文書名を直接指定する場合と、検索部６ａにより自然文字列あるいはキーワードの入力で所望の文書を探し当てる場合の２つの入力操作が行える点である。図６中のステップの処理内容は下記のように読み変えることができる。
ステップＳ６０２：目的言語文書名の指定
例えばWindowsなどのＯＳに標準で備わっている「参照」機能を用いてファイルの指定ができる。なおWindowsは登録商標である。
ステップＳ６０４：検索実行、結果リスト表示
「ｍｏｄｅ＝ｄｅｌｅｔｅ」の場合は、減算対象とする文書は、文書管理テーブル９の文書管理情報として登録されているものを優先して検索を実行する。一般に検索対象は、ユーザの指示によりローカルマシン内とされるが、この実施形態の検索部６ａは、ローカルマシンの外、つまりネットワーク上のサーバコンピュータや外部記憶装置へアクセスし、例えばインターネット上のサーバコンピュータに保持されている目的言語文書の検索も可能である。つまりインターネットを利用し広い範囲の文書の指定が可能である。
ステップＳ６０６：指定文書ファイルの同定、ファイルの取得/オープン
検索結果リストから指定された文書ファイルの実体を取得しファイルのオープンを行う。

再び図７のフローチャートを参照しデータベース更新処理の説明に戻る。
ステップＳ７０２、Ｓ７０５、Ｓ７０７で更新先のＤＢと更新の材料となる目的言語文書ファイル（目的言語文書データ）が特定されると、設定された「ｍｏｄｅ」に応じて、それぞれＤＢ中の統計情報の加算処理、減算処理が行われる。

具体的には、ＤＢ管理部６は、指定された目的言語文書を解析して、各種共起情報、単語頻度情報などの統計情報を抽出し、制御部２に通知し、処理モードが追加（「ｍｏｄｅ＝ａｄｄ」）の場合（Ｓ７０９のＹｅｓ）、制御部２は、加算処理をＤＢ管理部６に行わせる（Ｓ７１０）、つまり制御部２およびＤＢ管理部６は、更新前のＤＢ内の統計情報とのマージ、頻度情報の加算、相互情報量の再計算を行う。

また、「ｍｏｄｅ＝ｄｅｌｅｔｅ」の場合（Ｓ７０９のＮｏ）、制御部２は、減算処理をＤＢ管理部６に行わせる（Ｓ７１１）、つまり制御部２およびＤＢ管理部６は、更新前のＤＢ内の統計情報から、当該目的言語文書の統計情報を差し引いて、相互情報量の再計算を行う。データベース更新後は、他の指示命令の待機状態に入る。

このようにこの第１実施形態の機械翻訳システムによれば、原言語から目的言語への機械翻訳を行う上でユーザが自由に目的言語文書ＤＢを構築することで、訳語学習の精度を向上させるものである。ユーザは、目的言語文書データベースを構築する際に、目的言語文書や目的言語文書ＤＢにキーワードや自然言語文を自由に付与して記憶させることができる。
この機械翻訳システムでは、翻訳時に用いる目的言語文書ＤＢ８を指定するために検索部６ａを設けており、この検索部６ａを介してキーワードや自然言語文を使って、数あるＤＢの中から翻訳対象文書に適したＤＢを選択できる。
また、この機械翻訳システムでは、一旦、目的言語データや目的言語文書を登録して作成した目的言語文書ＤＢ８から、特定の目的言語文書を指定して、その内容分の統計情報を少なくとも含む情報をＤＢから減算するので、目的言語文書ＤＢ８を容易に減算更新することができる。減算する文書、データを指定するために、キーワードや自然言語文による検索部６ａを設けたので、ユーザは、前に自然言語で登録した文を忘れていても、簡単な操作で、減算する目的言語文書、目的言語データを指定することができる。
また、一旦登録した内容を削除する際に、今後の登録への影響度を「強度」の形で指定できるようにすることで、一時的な削除だけでなく、今後の登録へ削除処理を波及させることができる。
さらに、実際の翻訳で訳語選択の副作用を見付けたときに、選択のキーとなった統計情報をクリアしてＤＢ格納情報を最適化できる。

続いて、本発明に係る第２の実施形態について説明する。
この第２の実施形態では、上記図７のステップＳ７１１の減算処理において、「強度」を指定する処理を追加する。ユーザが目的の文書の統計情報を削除する際に、下記（３）を指定した場合、ＤＢ管理部６は、該当する情報の「強度」の欄に強度情報として、以降、統計への加算を不可とするフラグ「１」を書き込む。
また、目的の文書の統計情報を削除する際に、（１），（２）を指定した場合、該当する下記（１），（２）の強さで頻度の情報を更新する。
なお、この強度の指定内容は、一例に過ぎず、この他、さまざまな選択肢の与え方を行ってもよい。例えば文書管理テーブル９に強度情報と選択肢を設定してもよい。

（１）頻度は単純減算とする。
（２）頻度は０に初期化する。
（３）今後の更新処理で加算されないように頻度を０に固定する。
（１）の選択肢は、当該目的言語文書の統計情報を単純にマイナスする処理とする。
（２）の選択肢は、当該目的言語文書の分析で抽出された共起情報、単語に関する情報を全てクリアする処理とする。
（３）の選択肢は、今後の更新処理で再び加算されないように、共起情報、単語情報の強度の欄に加算不要フラグの「１」を設定し、加算不要フラグがセットされている共起情報、単語情報は、以降の「加算処理」では変更は行わないように制御部２によって制御される。

また、強度を用いない方法としては、（３）の選択肢が選択され場合、単語情報の頻度を予約語（例えばＮＵＬＬ等）に置き換え固定するという方法もある。予約語は、予めプログラム上に記述あるいはメモリ上に記憶されているパラメータの一つである。

つまり、この例の場合、制御部２およびＤＢ管理部６等の減算手段は、目的の文書の統計情報を削除するにあたり、（１）あるいは（２）の強度条件が指定された場合、指定された強度条件に基づいて頻度情報を更新する。

この第２実施形態の機械翻訳システムによれば、一旦文書を登録して作成した目的言語ＤＢ８に対して、保持されている統計情報を減算する操作が簡単にできる。
また、過去に登録した文書の名前と内容をＤＢ毎にすべてユーザが記録しておかなくとも、システム側が自動的に管理し、検索機能を使って、所望の文書やＤＢを選び出すことができる。
さらに、減算の強度を指定することで、一時的な減算だけでなく、将来的な情報の固定も指定でき、特定分野の翻訳に望まない特定の統計情報が後の更新処理で再度登録されることを排除することができる。
目的言語文書ＤＢを用いた翻訳結果から、訳語選択のキーとなったＤＢは同定できる。

そこで、目的言語文書ＤＢ８による訳語選択によって優先度判定がなされた訳語をユーザに明示することで、その訳語がユーザの望むものではなかった場合には、そこからＤＢ中の訳語選択に起因した統計情報を同定し、その統計情報に大きく影響した登録済み目的言語文書を提示して、減算処理の起動を指示できるような構成も可能である。

続いて、本発明に係る第３の実施形態について説明する。
この第３の実施形態では、図１に示したような構成に、ユーザが特定の訳語を指定する訳語指定手段と、翻訳時にどの訳語がどの統計情報により選択されたかの情報を保持する統計情報同定手段とを追加する。

この場合、訳語指定手段により指定された訳語が目的言語文書ＤＢ８中の統計情報をキーにして決定した訳語である場合に、統計情報同定手段は、統計情報中のどの情報がキーとなったかを同定する。

統計情報が同定された状態で、ユーザが統計情報のクリアの指示操作を行い、この指示を制御部２が受け取ると、制御部２は、その指示内容をＤＢ管理部６へ送る。ＤＢ管理部６は、目的文書ＤＢ生成部７を通じて当該目的言語文書ＤＢ８中の当該統計情報をクリアする。この際に、上記第２の実施形態の説明で述べたように「クリアの強度」を指定させるようにもできる。以下に強度の例を示す。
（１）当該統計情報を単純にクリアする。
（２）当該統計情報が後にも加算されないように頻度を０に固定する。

この第３実施形態の機械翻訳システムによれば、翻訳結果に目的言語文書ＤＢ８中の統計情報の副作用による訳語選択が見られた場合に、当該統計情報を容易にクリアすることができ、目的言語文書ＤＢ８を最適化し易くなる。

以上の実施形態は、機械翻訳システムとしての実施形態であるが、機械翻訳方法、機械翻訳プログラムとして実施するときにも必要構成要素とその機能は同様である。

本発明に係る一つの実施の形態の機械翻訳システムの構成を示すブロック図。目的言語文書データベースの記憶内容の一例を示す図。文書管理テーブルの記憶内容の一例を示す図。制御部による処理を示すフローチャート。翻訳部による処理を示すフローチャート。制御部によるデータベース指定処理を示すフローチャート。目的言語データベース管理部のデータベース指定処理を示すフローチャート。

符号の説明

１…入力部、２ａ…ＤＢ指定部、２…制御部、３…翻訳部、４…辞書部、４ａ…語彙部、４ｂ…形態素解析規則、４ｃ…構文・意味解析規則、４ｄ…変換規則、４ｅ…構文生成規則、４ｆ…形態素生成規則、５…出力部、６…ＤＢ管理部、６ａ…検索部、７…目的言語文書ＤＢ生成部、８…目的言語文書ＤＢ、９…文書管理テーブル。

Claims

コンピュータを、
原言語から目的言語へ翻訳するために前記目的言語による少なくとも１つの目的言語文書に基づいて分野毎に構築され、分野を示すデータベースの名称、前記目的言語文書固有の識別情報、文書を検索するためのキーワードおよび/または自然言語文、前記文書の中に生起した単語同士の共起関係を、その発生頻度の値に対応付けた共起情報を含む項目で目的言語文書情報が記憶された複数のデータベースと、
前記複数のデータベースの情報を追加または削減するための動作モードの設定と、削減の対象となる目的言語文書あるいは目的言語データを指定するための自然言語文またはキーワードを入力する入力手段と、
削減モードにおいて、前記入力手段により入力されたキーワードおよび/または自然言語文を検索キーとして前記複数のデータベースの少なくとも一つのデータベースに記憶されている削減対象の目的言語文書および/または作成済み目的言語データを指定する指定手段と、
作成済みの目的言語データが格納されたデータベースの名称と、前記データベースを作成する際に使用した文書名とその格納場所、前記発生頻度の値を固定、減算または加算する指標となる強度情報を記憶する文書管理テーブルと、
前記指定手段により指定された前記削減対象の目的言語文書固有の識別情報および/または作成済み目的言語データを検索キーにして前記文書管理テーブルを参照し、前記削減対象の目的言語文書および/または作成済み目的言語データが記憶されているデータベースを特定する特定手段と、
前記文書管理テーブルの強度情報に基づいて、特定された前記データベースの該当目的言語文書の共起情報の発生頻度の値を固定、減算または加算して前記データベースを更新する更新手段
として機能させるための機械翻訳プログラム。
前記文書管理テーブルに管理されている、前記データベースと目的言語文書との対応関係を画面に表示する手段として前記コンピュータを機能させることを特徴とする請求項１記載の機械翻訳プログラム。
前記指定手段は、
前記入力された自然言語文あるいはキーワードに基づいて前記データベースを検索し、削減対象となる目的言語文書のリストを画面に表示し、そのリストの中から選択を促す手段を有することを特徴とする請求項１記載の機械翻訳プログラム。
前記入力された自然言語文あるいはキーワードに基づいてローカルマシンあるいはそれ以外の任意の場所から関連する目的言語文書を検索し、削減対象となる目的言語文書のリストを画面に表示し、そのリストの中から選択を促す手段を有することを特徴とする請求項１に記載の機械翻訳プログラム。
前記画面に表示されたリストの中から選択された目的言語文書、あるいは目的言語文書とデータベースとの組を削減対象の情報とすることを特徴とする請求項３または４いずれか記載の機械翻訳プログラム。
前記強度情報は、
前記データベースの共起情報の各単語に付されている発生頻度の値を減算する第１の選択肢、前記発生頻度の値をゼロに初期化する第２の選択肢、今後の更新処理で加算されないように前記発生頻度の値をゼロに固定する第３の選択肢のすくなくとも一つの選択肢を有することを特徴とする請求項１記載の機械翻訳プログラム。
指定された特定の訳語と、訳語選択のキーとなった前記データベース中の統計情報とを同定する統計情報同定手段と、
同定された統計情報を削除する手段
として前記コンピュータを機能させることを特徴とする請求項１記載の機械翻訳プログラム。
原言語から目的言語へ翻訳するために前記目的言語による少なくとも１つの目的言語文書に基づいて分野毎に構築され、分野を示すデータベースの名称、前記目的言語文書固有の識別情報、文書を検索するためのキーワードおよび/または自然言語文を、登録した文書の中に生起した単語同士の共起関係を、その発生頻度の値に対応付けた共起情報を含む項目で目的言語文書情報が記憶された複数のデータベースと、
前記複数のデータベースの情報を追加または削減するための動作モードの設定と、削減の対象となる目的言語文書あるいは目的言語データを指定するためのキーワードおよび/または自然言語文を入力する入力手段と、
削減モードにおいて、前記入力手段により入力された自然言語文またはキーワードを検索キーとして前記複数のデータベースの少なくとも一つのデータベースに記憶されている削減対象の目的言語文書および/または作成済み目的言語データを指定する指定手段と、
作成済みの目的言語データが格納されたデータベースの名称と、前記データベースを作成する際に使用した文書名とその格納場所、前記発生頻度の値を固定、減算または加算する指標となる強度情報を記憶する文書管理テーブルと、
前記指定手段により指定された前記削減対象の目的言語文書固有の識別情報および/または作成済み目的言語データを検索キーにして前記文書管理テーブルを参照し、前記削減対象の目的言語文書および/または作成済み目的言語データが記憶されているデータベースを特定する手段と、
前記文書管理テーブルの強度情報に基づいて、特定された前記データベースの該当目的言語文書の共起情報の発生頻度の値を固定、減算または加算して前記データベースを更新する更新手段と
を具備したことを特徴とする機械翻訳システム。
原言語から目的言語へ翻訳するために前記目的言語による少なくとも１つの目的言語文書に基づいて分野毎に構築され、分野を示すデータベースの名称、前記目的言語文書固有の識別情報、文書を検索するためのキーワードおよび/または自然言語文を、登録した文書の中に生起した単語同士の共起関係を、その発生頻度の値に対応付けた共起情報を含む項目で目的言語文書情報が記憶された複数のデータベースの情報を削減するにあたり、削減の対象となる目的言語文書あるいは目的言語データを指定するキーワードおよび/または自然言語文が入力手段から入力された場合、前記指定手段が、入力された前記キーワードおよび/または自然言語文を検索キーとして前記複数のデータベースの少なくとも一つのデータベースに記憶されている削減対象の目的言語文書および/または作成済み目的言語データを指定するステップと、
特定手段が、指定された前記削減対象の目的言語文書固有の識別情報および/または作成済み目的言語データを検索キーにして、作成済みの目的言語データが格納されたデータベースの名称と、前記データベースを作成する際に使用した文書名とその格納場所、前記発生頻度の値を固定、減算または加算する指標となる強度情報を記憶する文書管理テーブルを参照し、前記削減対象の目的言語文書および/または作成済み目的言語データが記憶されている該当データベースを特定するステップと、
更新手段が、前記文書管理テーブルの強度情報に基づいて、特定された前記データベースの該当目的言語文書の共起情報の発生頻度の値を固定、減算または加算して前記データベースを更新するステップと
を有することを特徴とする機械翻訳方法。