JP4078376B2 - 機械翻訳システム及びプログラム - Google Patents

機械翻訳システム及びプログラム Download PDF

Info

Publication number
JP4078376B2
JP4078376B2 JP2006195811A JP2006195811A JP4078376B2 JP 4078376 B2 JP4078376 B2 JP 4078376B2 JP 2006195811 A JP2006195811 A JP 2006195811A JP 2006195811 A JP2006195811 A JP 2006195811A JP 4078376 B2 JP4078376 B2 JP 4078376B2
Authority
JP
Japan
Prior art keywords
translation
environment
language
result
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006195811A
Other languages
English (en)
Other versions
JP2008026971A (ja
Inventor
正樹 新藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2006195811A priority Critical patent/JP4078376B2/ja
Publication of JP2008026971A publication Critical patent/JP2008026971A/ja
Application granted granted Critical
Publication of JP4078376B2 publication Critical patent/JP4078376B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、第一言語を第二言語に翻訳する機械翻訳システム及びプログラムに関する。
ネットワークにコンピュータを接続し、全世界的な規模で必要な情報を授受するインターネットなどのネットワークシステムでは、各種言語で記述されたホームページが提供されている。第一言語で記述されたホームページを第二言語に翻訳するにあたり、例えば、ユーザから翻訳依頼を受けてネットワーク上の翻訳サーバが翻訳原文を翻訳してユーザに返送する機械翻訳システムがある(例えば、特許文献1参照)。
このような機械翻訳システムにおいては、第一言語で記述された文書を第二言語に翻訳してその結果を記憶し、ユーザから同一文書の翻訳要求があった場合には、記憶している翻訳結果を出力してユーザへの応答時間の短縮を図るようにしている。
この場合、既に翻訳結果を記憶している文書の翻訳であっても、翻訳要求時に使用する辞書、訳文生成方法や原文解析方法などの翻訳環境が異なる場合、第一言語の文書の内容が変更されていた場合は、記憶している翻訳結果とは翻訳結果が異なってしまう可能性がある。そのような場合には、再び翻訳しなければならずユーザへの応答時間の短縮を行うことができない。
そこで、すべての翻訳環境において文書を翻訳しておき、予め翻訳環境毎の翻訳結果を記憶しておくということが考えられる。また、第一言語の文書が更新されるタイミングに合わせて翻訳を行い、予め翻訳結果を記憶しておくことが考えられる。
特開平10−283357号公報
しかし、すべての翻訳環境において予め翻訳しておくことは、翻訳に利用できる辞書の種類が多い場合には翻訳環境の組合せが多くなり、翻訳するための時間が膨大にかかる。また、翻訳結果を記憶するために非常に多くの記憶領域を必要とする。
一方、文書の更新するタイミングに合わせて予め翻訳する場合では、多数の文書が同じタイミングで更新されると、すべての文書の再翻訳が完了するまでに多大な時間を要してしまう。このため、翻訳を行う順番によっては、翻訳要求時に更新された文書の翻訳結果が記憶されていない状況が考えられる。その場合には、文書の翻訳要求時に再翻訳をしなければならないことになり、ユーザへの応答時間の短縮が図れないことになる。
本発明の目的は、翻訳にかかる時間の短縮や翻訳結果を記憶する記憶領域を最小限にとどめ、ユーザへの応答時間を短縮できる機械翻訳システム及びプログラムを提供することである。
本発明の機械翻訳システムは、少なくとも第一言語の見出し語と第二言語の訳語とを含む言語情報を記憶している辞書部と、定期的または不定期に内容が更新される第一言語の文書を一または複数の翻訳環境において第二言語に翻訳する翻訳部と、翻訳部で翻訳された一または複数の翻訳環境での翻訳結果を蓄積しユーザから翻訳環境を指定して第一言語の文書の翻訳要求があったときは指定された翻訳環境での翻訳結果を読み出し出力する翻訳結果蓄積部と、翻訳結果蓄積部の翻訳結果の読み出し回数を翻訳環境ごとに翻訳回数として記憶する統計データベースと、翻訳部が更新された第一言語の文書を翻訳する際には統計データベースに記憶された翻訳回数が多い順に翻訳環境の翻訳を優先して行うように指示する制御部とを備えたことを特徴とする。
本発明によれば、存在する全ての翻訳環境に対して翻訳を行わなくてよく、翻訳時間の短縮を行うことが可能である。また、すべての翻訳環境分の翻訳結果を格納しなくてよくなり、記憶領域の縮小も可能である。さらに、翻訳に利用される回数が多い文書や翻訳環境から翻訳を行うことで、翻訳の優先度付けを行い、より効率的に翻訳結果を蓄積することが可能であり、応答時間の短縮を図ることができる。
以下、図面を参照して本発明の実施の形態について詳細に説明する。図1は本発明の実施の形態に係わる機械翻訳システムの概略的な構成を示すブロック図である。機械翻訳システム11は、例えばネットワークを介してユーザのパーソナルコンピュータ(パソコン)12に接続される。パソコン12の入力部13からは翻訳要求のための情報を機械翻訳システム11に入力し、パソコン12の出力部14には機械翻訳システム11から翻訳結果等の情報が出力される。
パソコン12の入力部13は、機械翻訳システム11に対し、翻訳対象となる原文の入力や各種コマンドを入力したりするためのもので、通常、キーボード等が使用される。パソコン12の出力部14は、翻訳結果を出力したり機械翻訳システム11への各種命令に対する機械翻訳システム11からの応答を表示したりするためのもので、例えばCRTディスプレイやプラズマ・ディスプレイ、液晶ディスプレイ等が使用できる。
機械翻訳システム11は、パソコン12から翻訳要求を制御部15で受信して翻訳のための制御を行う。制御部15は、ユーザとの対話的な処理を含め、全体の動きを制御するものである。辞書部16には少なくとも第一言語の見出し語と第二言語の訳語とを含む言語情報が記憶されている。すなわち、翻訳処理に必要な知識情報として、第一言語の単語・熟語と第二言語の訳語とを対応づけて記録した語彙辞書などの情報を記録する。さらに、見出し語、品詞、活用形、概念、文法機能などを第一言語と第二言語との両方で記述したものも情報として記録する。
翻訳部17は、辞書部16を用いて第一言語の文書を第二言語に翻訳するものであり、制御部15からの指示に基づき、例えば、定期的または不定期に内容が更新される第一言語の文書を一または複数の翻訳環境において第二言語に翻訳する。ここで、翻訳環境とは、翻訳に使用した辞書、訳文生成方法、原文解析方法などである。訳文生成方法とは、例えば、語尾が「ですます調」か「である調」か、送りがなを付けるか付けないか、主語を省略するかどうか、命令文の訳し方として「××して下さい」か「××しなさい」かの方法であり、原文解析方法とは、例えば、すべて大文字のみから成る文書かどうか、単語「I」に品詞の指定、過去形・過去分詞同型同士の取り扱いにおいてどちらを優先するか、カタカナ語のゆれ(ヂかジかなど)の方法である。
翻訳結果蓄積部18は、翻訳部16で翻訳された翻訳結果を蓄積する。同時に原文や翻訳環境も併せて記憶しておくものである。例えば、翻訳部16で翻訳された翻訳環境が複数である場合には、複数の翻訳環境ごとに翻訳結果を蓄積する。そして、ユーザから翻訳環境を指定して第一言語の文書の翻訳要求があったときは、制御部15からの指示に基づき指定された翻訳環境での翻訳結果を読み出し出力する。
統計データベース19は、翻訳要求時の原文、その原文の翻訳に使用した環境、翻訳結果蓄積部18の翻訳結果の読み出し回数を翻訳環境ごとに翻訳回数として記憶する。そして、制御部15は翻訳部17が更新された第一言語の文書を翻訳する際には、統計データベースの翻訳回数が多い翻訳環境の翻訳を優先して行うように指示する。
図2は、本発明の実施の形態に係わる機械翻訳システム11が適用されるネットワークの一例を示す構成図である。機械翻訳システム11はイントラネットの翻訳サーバ20に組み込まれている場合を示している。イントラネットにはイントラネットのサーバ21や共有サーバ22が接続され、共有サーバ22は共有ファイル23を有している。イントラネットのサーバ21や共有ファイル23には翻訳対象の原文24が格納されており、イントラネットに接続された複数台のパソコン12a〜12nのいずれかからアクセスが可能となっている。
さらに、イントラネットはインターネットに接続され、インターネットには複数のポータルサイトのサーバ25a〜25mが接続されている。これらのポータルサイトのサーバ25a〜25mにも翻訳対象の原文24が格納されており、イントラネットに接続された複数台のパソコン12a〜12nのいずれかからアクセスが可能となっている。
例えば、パソコン12aからイントラネットのサーバ21やインターネットのポータルサイトのサーバ25a〜25mが提供する原文24にアクセスし、翻訳サーバ20に翻訳要求をすることにより、翻訳サーバ20の機械翻訳システム11はその原文を翻訳処理することになる。
図3は、本発明の実施の形態に係わる機械翻訳システム11が適用されるネットワークの他の一例を示す構成図である。図2では機械翻訳システム11がイントラネットの翻訳サーバ20に組み込まれている場合を示したが、図3ではパソコン12aに機械翻訳システム11を組み込んだ場合を示している。この場合において、他のパソコン12b〜12nからイントラネットのサーバ21やインターネットのポータルサイトのサーバ25a〜25mが提供する原文24にアクセスし、パソコン12aに翻訳要求をする。これにより、パソコン12aの機械翻訳システム11はその原文を翻訳処理することになる。このように、翻訳システム11は必ずしも翻訳サーバ20に設ける必要はなく、複数個のパソコン12a〜12nのうちのいずれかに組み込むようにしてもよい。
図4は、本発明の実施の形態における翻訳結果蓄積部18の記憶内容の一例を示す説明図である。翻訳結果蓄積部18には、原文に対するインデックス、原文、各々の原文に対する訳文インデックス、訳文、翻訳環境等が格納される。例えば、原文である第一言語の文書は英語のWEBサイトである「http://www.english_sample.com/index.html」から提供され、第二言語を日本語とし、すでに、翻訳結果蓄積部18にデータが格納されているとする。
インデックス1の原文は「http://www.english_sample.com/index.html」から提供される英語文書である。訳文インデックスは同一の原文に対し各種の翻訳環境に対応して翻訳された訳文ごとに付されるインデックスである。例えば、「辞書利用なし、ですます調」の翻訳環境で翻訳した訳文はインデックス1、「軍事辞書、ですます調」の翻訳環境で翻訳した訳文はインデックス2、「化学辞書、ですます調」の翻訳環境で翻訳した訳文はインデックス3である。
訳文は各々の翻訳環境で翻訳した日本語の翻訳結果の格納場所を指示している。例えば、インデックス1の訳文は「www.english_sample.com/index1.html」に格納され、インデックス2の訳文は「www.english_sample.com/index2.html」に格納され、インデックス3の訳文は「www.english_sample.com/index3.html」に格納される。各々の翻訳環境で翻訳した翻訳結果は、使用頻度の多い順にインデックスが付与される。つまり、インデックス1の訳文がインデックス2の訳文より使用頻度が多く、インデックス2の訳文がインデックス3の訳文より使用頻度が多い。
翻訳環境は、前述したように、翻訳に使用した辞書、訳文生成方法、原文解析方法などである。語尾が「ですます調」か「である調」か、送りがなを付けるか付けないか、主語を省略するかどうか、命令文の訳し方として「××して下さい」か「××しなさい」かの訳文生成方法と、すべて大文字のみから成る文書かどうか、単語「I」に品詞の指定、過去形・過去分詞同型同士の取り扱いにおいてどちらを優先するか、カタカナ語のゆれ(ヂかジかなど)の原文解析方法を定めたものである。
図5は本発明の実施の形態における翻訳結果蓄積部18に格納された原文および訳文の説明図である。図5では原文中に存在する1文に対する一部の翻訳環境を使用した翻訳結果を示している。翻訳結果蓄積部18には、翻訳環境と翻訳結果とが一対となって格納されている。
例えば、英語のWEBサイト「http://www.english_sample.com/index.html」の「The nebula's cone shape is analogous to the bow wave of a ship plowing through water.」は、3つの翻訳環境、すなわち、「辞書利用なし、ですます調」の翻訳環境、「軍事辞書、ですます調」の翻訳環境、「化学辞書、ですます調」の翻訳環境で翻訳され、それぞれ、訳文として、「星雲の円錐形は、水をかき分けて進む舟の船首波と類似しています。」、「星雲の円錐形は、水をかき分けて進む舟の弾道波と類似しています。」、「星雲の円錐形は、水をかき分けて進む舟の船首波と類似しています。」と保存されている。
図6は、本発明の実施の形態における統計データベース19の記憶内容の一例を示す説明図である。統計データベース19には、統計データベースインデックスn、文書名Sn、更新時刻、翻訳環境インデックスm、翻訳環境Hm、翻訳回数、翻訳時刻などを格納している。
ここで、以下の説明で使用する各変数の意味は次の通りである。Snは統計データベース内の文書名である。nは文書名用のインデックス変数であり、nを加算することによって文書名を変更する。Gnは文書名Snの原文データである。Hmは文書名Snの原文データを翻訳した翻訳環境である。mは翻訳環境用のインデックス変数であり、mを加算することによって文書名Snを翻訳した翻訳環境を変更する。DHmは翻訳環境Hmを使用して翻訳した結果である。Fは翻訳結果蓄積部18にある原文データである。Kjは文書名がSnであり、翻訳結果がHmである、翻訳結果蓄積部18にある翻訳結果を示す。
次に、更新時刻は第一言語の文書名Snごとに翻訳を更新する時刻であり、その文書名Snの文書が更新されると予想される時刻より少し後の時刻が予め設定される。図6では、文書名S1の更新時刻は12時であり、文書名S2の更新時刻は1時である場合を示している。
翻訳回数はユーザが翻訳要求した回数であり、図6では、翻訳環境H1で翻訳した回数は123回、翻訳環境H2で翻訳した回数は40回、翻訳環境H2で翻訳した回数は2回である場合を示している。また、図6では統計データベース19内のデータは翻訳回数において降順になっている。このように、統計データベース19に翻訳回数を新たに付加したので、翻訳する文書の優先度付けを行うことが可能である。これにより、翻訳される文書の順番が明確になり、翻訳結果蓄積部18の翻訳結果を更新する順番を適切にすることができ、効率よく翻訳結果蓄積部18にある文書の翻訳結果を更新することができる。
翻訳時刻は第一言語の文書ごとにユーザが翻訳要求した時刻であり、複数回の翻訳時刻を保持しており、制御部15は、この統計データベース19のユーザが翻訳要求した時刻に基づいて、翻訳を更新する更新時刻を定めることになる。これにより、ユーザが翻訳要求したときには最新の翻訳結果が翻訳結果蓄積部18には保存されていることになる。
次に、図7は本発明の実施の形態における翻訳結果蓄積部18の記憶内容の他の一例を示す説明図である。図4に示した一例に対し、異なる翻訳環境での翻訳結果が同一である場合に、翻訳環境を最も使用頻度の高い翻訳環境に統合し、翻訳環境と翻訳結果とを1対多で蓄積した場合を示している。
図5に示したように、「辞書なし、ですます調」の翻訳環境で翻訳した翻訳結果と、「化学辞書、ですます調」の翻訳環境で翻訳した翻訳結果とは、同じ翻訳結果「星雲の円錐形は、水をかき分けて進む舟の船首波と類似しています。」であるので、「辞書なし、ですます調」の翻訳環境で翻訳した翻訳結果と、「化学辞書、ですます調」の翻訳環境で翻訳した翻訳結果とを統合する。この場合、「辞書なし、ですます調」の翻訳環境で翻訳した翻訳結果が最も使用頻度の高い翻訳環境であるので、「化学辞書、ですます調」の翻訳環境で翻訳した翻訳結果を「辞書なし、ですます調」の翻訳環境で翻訳した翻訳結果に統合する。このように、翻訳結果と翻訳環境とを1対多で格納することで、翻訳結果蓄積部に使用する記憶領域を小さくすることができる。
次に、図8は翻訳環境Hmによって異なる翻訳結果が得られた場合の説明図である。例えば、最も使用頻度の高い翻訳環境H1での翻訳結果が図8(a)、その次に使用頻度の高い翻訳環境H2での翻訳結果が図8(b)、最も使用頻度が低い翻訳環境H3での翻訳結果が図8(c)に示すものであったとする。また、この場合、翻訳環境H1での翻訳結果と翻訳環境H2での翻訳結果との異なる部分がA1、A2、A3、翻訳環境H1での翻訳結果と翻訳環境H3での翻訳結果との異なる部分がB1、B2であったとする。そうすると、翻訳環境H1での翻訳結果と翻訳環境H2での翻訳結果とについては、図9に示すように、最も使用頻度の高い翻訳環境H1によって得られた翻訳結果と異なる部分A1、A2、A3、B1、B2のみを翻訳結果蓄積部18に蓄積する。
つまり、図9(a)に示すように最も使用頻度の高い翻訳環境H1での翻訳結果、図9(b)に示すように次に使用頻度の高い翻訳環境H2での翻訳結果の異なる部分A1、A2、A3、図9(c)に示すように最も使用頻度が低い翻訳環境H3での翻訳結果の異なる部分がB1、B2を翻訳結果蓄積部18に蓄積する。
そして、異なる翻訳環境H2、H3による翻訳結果を出力する際には、最も使用頻度の高い翻訳環境H1によって得られた翻訳結果と、翻訳環境ごとに異なる部分A1、A2、A3、B1、B2とをマージして図8(b)、図8(c)のように出力する。
図10は、本発明の実施の形態に係わる機械翻訳システムの処理動作を示すフローチャートである。図10では、異なる翻訳環境での翻訳結果が同一である場合に、翻訳結果蓄積部18に翻訳環境を最も使用頻度の高い翻訳環境に統合して翻訳環境と翻訳結果とを1対多で蓄積する処理を行う場合を示している。
まず、翻訳結果蓄積部18の情報を検索するための統計データベースインデックス変数nを1に初期化し(S1)、翻訳環境インデックスmを1に初期化する(S2)。その後、翻訳結果蓄積部18の情報を更新するための条件に一致しているかどうかを判定する(S3)。この情報を更新するための条件とは、例えば、機械翻訳システムの演算処理装置が低負荷であるかどうかやユーザが指定した時刻であるかどうかなどである。
翻訳結果蓄積部18の情報を更新することが可能な場合には、統計データベース19より文書名Sn(http://www.english_sample.com/index.html)を取得する(S4)。また、文書Snの原文データGn「The nebula's cone shape is analogous to the bow wave of a ship plowing through water.」を取得する(S5)。その後、翻訳結果蓄積部18から文書名Snと同一名の文書名を検索し、翻訳結果蓄積部18にある原文データFを取得する(S6)。そして、原文データGnと翻訳結果蓄積部18にある原文データFとを比較し、一致するかどうかを判定する(S7)。
原文データGnと原文データFとを比較した結果、一致している場合は、文書名Snの文書が更新されていないと判断し、翻訳環境インデックスmを0とし(S8)、統計データベース19を検索するためのインデックス変数nを加算し(S9)、統計データベースの最後まで処理を行う(S10)。
ステップS7の判定で原文データGnと翻訳原文Fとを比較した結果、一致しない場合は、文書名Snの文書が更新されていると判断し、文書名Snの翻訳環境「辞書利用なし、ですます調」(Hm)を統計データベースから取得する(S11)。ここで、統計データベース19の文書名Snは使用回数が多い順に並んでいるので、ユーザによって頻繁に翻訳に使用されている翻訳環境H1が適用されることになる。取得した翻訳環境Hm(=H1)で翻訳を行い(S12)、翻訳結果DHm(=DH1)「星雲の円錐形は、水をかき分けて進む船の船首波と類似しています。」を取得する。
また、翻訳結果蓄積部18から文書名Snと翻訳環境Hmとをキーワードに、文書名Snに対する翻訳結果Kjを取得する(S13)。翻訳結果蓄積部18の翻訳結果Kjを今回翻訳した翻訳結果DHmに更新する(S14)。また、翻訳結果蓄積部18の原文データFを原文データGnに更新し(S15)、翻訳環境インデックス変数mを加算し(S16)、次に使用回数の多い翻訳環境Hmを取得する。
そして、翻訳環境インデックス変数mを加算して取得した翻訳環境Hmが存在するかを判断する(S17)。もし、Hmが存在しない場合は、mを0に初期化し(S8)、nを加算することになる(S9)。その後、次のSnに対しても同様の処理を行う。
一方、翻訳環境Hmが存在する場合には、その翻訳環境Hm(例えば、翻訳環境H2「軍事辞書、ですます調」を使って翻訳し(S18)、翻訳結果DHm(=H2)「星雲の円錐形状は、水をかき分けて進む船の弾道波と類似しています。」を取得する。また、翻訳結果蓄積部18から、翻訳原文がSnである翻訳結果を取得し、DHmと比較を行う(S19)。
比較の結果、翻訳結果蓄積部18にある翻訳結果と今回翻訳した翻訳結果DHmとが一致しない場合は、翻訳結果蓄積部18にある翻訳環境Hmと同じ翻訳環境の翻訳結果をDHmに更新する(S20)。また翻訳結果蓄積部18にある原文も共にGnに更新する(S21)。一方、翻訳結果蓄積部18にある翻訳結果と今回翻訳した翻訳結果DHmとが一致する場合は、翻訳結果蓄積部18から翻訳環境Hmと同一の翻訳環境、および、その翻訳結果を削除し(S22)、翻訳結果蓄積部18のDHmと一致した翻訳環境に翻訳環境Hmを追加する(S23)。削除した後の翻訳結果蓄積部18の内容は図7に示すようになる。そして、ステップS16に戻る。
このように、翻訳環境Hmの使用頻度を保持している統計データベース19を新たに設け、使用頻度の高い翻訳環境Hmのみの翻訳結果を優先して蓄積することができるため、翻訳時間の短縮や記憶領域の縮小が可能であり、応答時間の短縮を図ることができる。
本発明の実施の形態によれば、統計データベース19に翻訳回数を新たに付加し、翻訳する文書の優先度付けを行うので、同時間帯に更新された文書でも優先的に翻訳結果を翻訳結果蓄積部18に蓄積することができる。また、異なる翻訳環境での翻訳結果が同一である場合に、翻訳環境を最も使用頻度の高い翻訳環境に統合するので、翻訳結果と翻訳環境とを1対多で格納することができ、翻訳結果蓄積部18に使用する記憶領域を小さくするようにできる。
文書毎に更新時刻を保持することで、更新時刻になったときに翻訳結果蓄積部18の翻訳結果を更新することができ、より正確に翻訳結果蓄積部18の翻訳結果を出力することができる。また、統計データベース19に、ユーザが翻訳要求した時刻の統計データを持つことで、翻訳される文書の更新時刻を適切に選定することができ、効率よく翻訳結果蓄積部にある文書の翻訳結果を更新することができる。
従って、存在する全ての翻訳環境Hmに対して翻訳を行わなくてよく、翻訳時間の短縮を行うことが可能となる。また、すべての翻訳環境分の翻訳結果を格納しなくてよくなり、記憶領域の縮小も可能である。さらに、翻訳に利用される回数が多い文書や翻訳環境から翻訳を行うことで、翻訳の優先度付けを行い、より効率的に翻訳結果を蓄積することが可能であり、応答時間の短縮を図ることができる。
上述した実施の形態において記載した手法は、コンピュータに実行させることのできるプログラムとして、記憶媒体に記憶し各装置に応用したり、通信媒体により伝送して各種装置に適用することも可能である。
本発明における記憶媒体としては、磁気ディスク、フレキシブルディスク、光ディスク(CD−ROM、CD−R、DVDなど)、光磁気ディスク(MOなど)、半導体メモリなど、プログラムを記憶でき、かつコンピュータが読み取り可能な記憶媒体であれば、その記憶形式はいずれの形態であっても良い。また、ここで記憶媒体とは、コンピュータと独立した媒体に限らず、LANやインターネットなどにより伝送されたプログラムをダウンロードして記憶または一時記憶した記憶媒体も含まれる。
本発明の実施の形態に係わる機械翻訳システムの概略的な構成を示すブロック図。 本発明の実施の形態に係わる機械翻訳システム11が適用されるネットワークの一例を示す構成図。 本発明の実施の形態に係わる機械翻訳システム11が適用されるネットワークの他の一例を示す構成図。 本発明の実施の形態における翻訳結果蓄積部18の記憶内容の一例を示す説明図。 本発明の実施の形態における翻訳結果蓄積部18に格納された原文および訳文の説明図。 本発明の実施の形態における統計データベース19の記憶内容の一例を示す説明図。 本発明の実施の形態における翻訳結果蓄積部18の記憶内容の他の一例を示す説明図。 本発明の実施の形態における翻訳環境によって異なる翻訳結果が得られた場合の説明図。 本発明の実施の形態における翻訳環境によって異なる翻訳結果が得られた場合の翻訳結果蓄積部に蓄積するデータの説明図。 本発明の実施の形態に係わる機械翻訳システムの処理動作を示すフローチャート。
符号の説明
11…機械翻訳システム、12…パソコン、13…入力部、14…出力部、15…制御部、16…辞書部、17…翻訳部、18…翻訳結果蓄積部、19…統計データベース、20…翻訳サーバ、21…イントラネットのサーバ、22…共有サーバ、23…共有ファイル、24…原文、25…ポータルサイトのサーバ

Claims (7)

  1. 少なくとも第一言語の見出し語と第二言語の訳語とを含む言語情報を記憶している辞書部と、
    定期的または不定期に内容が更新される第一言語の文書を一または複数の翻訳環境において第二言語に翻訳する翻訳部と、
    前記翻訳部で翻訳された一または複数の翻訳環境での翻訳結果を蓄積しユーザから翻訳環境を指定して前記第一言語の文書の翻訳要求があったときは指定された翻訳環境での翻訳結果を読み出し出力する翻訳結果蓄積部と、
    前記翻訳結果蓄積部の翻訳結果の読み出し回数を翻訳環境ごとに翻訳回数として記憶する統計データベースと、
    前記翻訳部が更新された第一言語の文書を翻訳する際には前記統計データベースに記憶された翻訳回数が多い順に翻訳環境の翻訳を優先して行うように指示する制御部とを備えたことを特徴とする機械翻訳システム。
  2. 前記翻訳結果蓄積部は、異なる翻訳環境での翻訳結果が同一である場合に、翻訳環境を最も使用頻度の高い翻訳環境に統合し、翻訳環境と翻訳結果とを1対多で蓄積することを特徴とする請求項1に記載の機械翻訳システム。
  3. 前記翻訳結果蓄積部は、翻訳環境によって異なる翻訳結果が得られた場合には、最も使用頻度の高い翻訳環境によって得られた翻訳結果と異なる部分のみを蓄積し、異なる翻訳環境による翻訳結果を出力する際には、最も使用頻度の高い翻訳環境によって得られた翻訳結果と、翻訳環境ごとに異なる部分とをマージして出力することを特徴とする請求項1に記載の機械翻訳システム。
  4. 統計データベースは、第一言語の文書ごとに翻訳を更新する時刻を予め保持することを特徴とする請求項1に記載の機械翻訳システム。
  5. 統計データベースは、第一言語の文書ごとにユーザが翻訳要求した時刻を保持することを特徴とする請求項1に記載の機械翻訳システム。
  6. 前記制御部は、前記統計データベースのユーザが翻訳要求した時刻に基づいて前記翻訳を更新する時刻を定めることを特徴とする請求項5記載の機械翻訳システム。
  7. 入力された第一言語を第二言語に翻訳し、得られた翻訳結果を出力するための機械翻訳システムに用いられる機械翻訳プログラムにおいて、少なくとも第一言語の見出し語と第二言語の訳語とを含む言語情報を記憶している辞書部と、翻訳された一または複数の翻訳環境での翻訳結果を蓄積する翻訳結果蓄積部と、前記翻訳結果蓄積部の翻訳結果の読み出し回数を翻訳環境ごとに翻訳回数として記憶する統計データベースとを備えたコンピュータに用いられ、
    前記コンピュータに、前記辞書部を参照して、少なくとも第一言語の見出し語と第二言語の訳語とを含む言語情報を用いて 定期的または不定期に内容が更新される第一言語の文書を一または複数の翻訳環境において第二言語に翻訳する手順と、
    翻訳された一または複数の翻訳環境での翻訳結果を前記翻訳結果蓄積部に蓄積しユーザから翻訳環境を指定して前記第一言語の文書の翻訳要求があったときは指定された翻訳環境での翻訳結果を読み出し出力する手順と、
    前記翻訳結果の読み出し回数を翻訳環境ごとに翻訳回数として前記統計データベースに記憶する手順と、
    更新された第一言語の文書を翻訳する際には前記統計データベースに記憶された前記翻訳回数が多い順に翻訳環境の翻訳を優先して行うように指示する手順とを実行させるための機械翻訳プログラム。
JP2006195811A 2006-07-18 2006-07-18 機械翻訳システム及びプログラム Expired - Fee Related JP4078376B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006195811A JP4078376B2 (ja) 2006-07-18 2006-07-18 機械翻訳システム及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006195811A JP4078376B2 (ja) 2006-07-18 2006-07-18 機械翻訳システム及びプログラム

Publications (2)

Publication Number Publication Date
JP2008026971A JP2008026971A (ja) 2008-02-07
JP4078376B2 true JP4078376B2 (ja) 2008-04-23

Family

ID=39117570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006195811A Expired - Fee Related JP4078376B2 (ja) 2006-07-18 2006-07-18 機械翻訳システム及びプログラム

Country Status (1)

Country Link
JP (1) JP4078376B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120221319A1 (en) * 2011-02-28 2012-08-30 Andrew Trese Systems, Methods and Media for Translating Informational Content
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
US9916306B2 (en) 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content
JP6989975B2 (ja) * 2020-02-25 2022-01-12 Kotozna株式会社 翻訳システム

Also Published As

Publication number Publication date
JP2008026971A (ja) 2008-02-07

Similar Documents

Publication Publication Date Title
Zhang Chengqing Zong: Statistical natural language processing Tsinghua University Press, 2013, xxxv+ 570pp
US7904291B2 (en) Communication support apparatus and computer program product for supporting communication by performing translation between languages
AU2004200638B2 (en) Methods and systems for language translation
JP5243167B2 (ja) 情報検索システム
JPH0869470A (ja) 自然言語処理装置及びその方法
JP3038079B2 (ja) 自動翻訳装置
KR20100068382A (ko) 부분 입력된 서치 쿼리에 대한 자동완성 및 입력 방법 자동 변환
JP4078376B2 (ja) 機械翻訳システム及びプログラム
US7136803B2 (en) Japanese virtual dictionary
JP2008084070A (ja) 構造化文書検索装置およびプログラム
JP4493397B2 (ja) テキスト圧縮装置
JP5025603B2 (ja) 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法
KR100327114B1 (ko) 문장골격을 기반으로 한 자동번역 시스템 및 그 방법
JPH07325826A (ja) 日本語処理システム
JP3768157B2 (ja) 他言語オントロジー辞書利用装置及び方法並びにプログラム
JP2010061532A (ja) 電子辞書、電子辞書の検索方法及び電子辞書の検索プログラム
Ouersighni Robust rule-based approach in Arabic processing
Morris et al. Welsh automatic text summarisation
KR100371135B1 (ko) 용언 굴절사전을 이용한 용언 형태소 분석장치 및 방법
JPH01126767A (ja) 辞書参照装置
JPH0561902A (ja) 機械翻訳システム
JP2009223704A (ja) 翻訳装置及び翻訳プログラム
WO2020079749A1 (ja) 事例検索方法
JP2012048418A (ja) 対訳情報検索装置及びプログラム
JPH09330318A (ja) 機械翻訳システムおよび方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080204

R150 Certificate of patent or registration of utility model

Ref document number: 4078376

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140208

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees