JP2001209643A - 機械翻訳システムとその翻訳サーバ及びそのクライアント - Google Patents

機械翻訳システムとその翻訳サーバ及びそのクライアント

Info

Publication number
JP2001209643A
JP2001209643A JP2000015340A JP2000015340A JP2001209643A JP 2001209643 A JP2001209643 A JP 2001209643A JP 2000015340 A JP2000015340 A JP 2000015340A JP 2000015340 A JP2000015340 A JP 2000015340A JP 2001209643 A JP2001209643 A JP 2001209643A
Authority
JP
Japan
Prior art keywords
translation
sentence
word
language
analysis data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000015340A
Other languages
English (en)
Inventor
Hiroyasu Kikuchi
廣恭 菊地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JOYPORT KK
Original Assignee
JOYPORT KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JOYPORT KK filed Critical JOYPORT KK
Priority to JP2000015340A priority Critical patent/JP2001209643A/ja
Priority to PCT/JP2001/000343 priority patent/WO2001055901A1/ja
Priority to AU27073/01A priority patent/AU2707301A/en
Priority to TW090101727A priority patent/TW501030B/zh
Publication of JP2001209643A publication Critical patent/JP2001209643A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Abstract

(57)【要約】 【課題】 機械翻訳の一方法であるトランスファー方式
について、処理分散のための媒体にインターネットを利
用し、解析部をクライアント側に、変換部、生成部をサ
ーバ側にと分散することを課題とする。 【解決手段】 インターネットを利用して原文を他国語
に翻訳する機械翻訳システムに使用する翻訳サーバにお
いて、前記原文を単語単位に解析した原文解析データを
受信して当該原文解析データから適訳辞書及び/又は原
文同言語単語辞書、訳語辞書に基づいて各単語の前記他
国語の多国語解析データに変換する変換部と、該変換部
で変換された前記他国語解析データから翻訳規則及び訳
語辞書に基づいて他国語の文章である翻訳文を生成する
生成部とを有し、前記生成部では前記原文と前記翻訳文
とを対として表示できる合成文を生成して出力すること
を特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、インターネット等
のネットワークを利用して分散した翻訳プログラムに従
って、原文を他国語に翻訳する機械翻訳システムとその
翻訳サーバ、クライアント、及びそのプログラムを格納
した記録媒体に関する。
【0002】
【従来の技術】翻訳は、ある言語で表現された内容をほ
かの言語で表現し直すことであり、表現の内容を理解す
る過程と、理解した内容を改めて目的言語で表現する過
程から成り立っている。いわゆるコンピュータでこの過
程を厳密に実現することは困難で、機械翻訳では、言語
間の文法や意味の対応関係を用いて原言語の表現を目的
言語の表現に置き換える方法を採用している。
【0003】機械翻訳の方式は、2言語間でこの置き換
えを行うトランスファ方式と、第三の言語としてユニバ
ーサルな言語を仲介して目的言語に変換する中間言語方
式とに大別される。実用的には、中間言語方式では手間
がかかるので、ほとんどの場合はトランスファ方式が主
流である。
【0004】トランスファ方式には、単語レベルで置換
するダイレクト翻訳方式、言語の意味を解析して組み立
てる意味解析翻訳方式、対訳コーパス(集約語)を用い
た用例ベース翻訳方式、常識まで使用する知識ベース形
翻訳方式、それらを混合したハイブリッド形翻訳方式な
どが考えられて翻訳実行されている。
【0005】機械翻訳は、コンピュータ処理中、自然言
語処理を代表する応用技術であり、トランスファ方式で
は、第一に形態素解析、構文解析、意味解析などの言語
解析、第二に構文変換、語彙変換などの変換、第三に訳
語選択、形態素調整などの生成の三つの過程から構成さ
れる。
【0006】言語解析技術では、解析精度の大幅な向上
が見られるが、長文となると、大量の格フレームなどを
収録した意味辞書の整備により、意味解析技術の展望が
開けつつある。
【0007】変換技術では、複数の用言にまたがる表現
でも一括して変換する広域変換技術などが試みられつつ
ある。また、生成技術では、決定詞(冠詞、数)の生成
などが問題であるが、他の技術としては、文脈処理を応
用した省略補完技術、システム内で原文を翻訳しやすい
文に自動的に置き換える原文自動書き換え技術、大量の
コーパスから文法や語彙に関する知識自動獲得技術など
がある。
【0008】翻訳知識としては、言語知識、状況知識、
専門知識など、多種多様な知識が必要であり、これらを
ルールと機械辞書の形式に変換する必要もある。最近で
は、翻訳の即時性を重視する応用として、電子メール翻
訳のサービスが期待されている。
【0009】ここで、従来技術として、特開平10−3
12382号公報として、類似用例翻訳システムが開示
されている。
【0010】同公報によれば、(1)翻訳すべき原文章
を入力する入力装置と、(2)入力された原文章を文単
位に切り出し原文を出力する一文切出手段と、(3)辞
書データベース及び例文とその対訳文を対として記憶し
た用例データベースからなるデータベース部と、(4)
用例データベースを検索して原文と完全に一致した例文
の対訳文を出力する完全一致文翻訳手段と、(5)用例
データベースを検索して原文と一部不一致となる例文を
抽出し、その対訳文を原文に従って変更することにより
翻訳を行う類似用例翻訳手段と、(6)用例データベー
スを検索して原文と所定率以上一致する例文を発見でき
なかった場合に、原文を所定の規則に従って分割する文
分割手段と、(7)用例データベースを検索して分割原
文と完全に一致した例文の対訳文を出力する分割文完全
一致文翻訳手段と、(8)用例データベースを検索して
分割原文と一部不一致となる例文を抽出し、その対訳文
を分割原文に従って変更することにより翻訳を行う分割
文類似用例翻訳手段と、(9)用例データベースを検索
して分割原文と所定率以上一致する例文を発見できなか
った場合に、辞書データベースを検索して翻訳する新規
文翻訳手段と、(10)分割原文のそれぞれの翻訳文を
組み立てて、原文の翻訳文を出力する分割翻訳文組立手
段と、を備えたことが記載されている。
【0011】さらに、同公報には、類似用例翻訳システ
ムをインターネットを介して利用するため、機械翻訳サ
ーバを一カ所に設置しておき、インターネットを通じて
端末機からアクセスして翻訳できるようにすることが記
載され、端末機は、インターネットにアクセスする機能
さえあれば、どのような端末からでも、どのようなとこ
ろからでも、機械翻訳を利用できるとしている。
【0012】このように、同公報によれば、用例データ
ベースを検索して、完全一致する例文から対訳を求めた
り、類似の例文を利用して翻訳するので、簡単な構成で
高速に翻訳することができ、以前に翻訳した文を用いる
ので、重複した翻訳作業を省くことができ、翻訳文の統
一がとれ、後編集の場合にも用例データベースを参照し
て翻訳文を修正するので、簡単に編集作業ができ、イン
ターネットを介して翻訳処理ができるので、利用者は小
型の端末機だけで、どこからでも機械翻訳を利用するこ
とができるとしている。
【0013】
【発明が解決しようとする課題】しかしながら、従来の
機械翻訳におけるネットワークの役割は、特開平10−
312382号公報にも記載されているように、入出力
装置部と、翻訳処理部とを結ぶユーザーインターフェー
スに対する経路資源の活用以外にはなく、機械翻訳書理
自体の分散処理という発想はなかった。従って、ネット
ワークに接続された無限に等しい資源を有するサーバの
有効活用が望まれている。特に、機械翻訳システムをイ
ンターネット等のネットワークにて分散処理システムと
して構成し、莫大なデータベースを分散配置して活用す
ることで、一極集中的な翻訳業務を分散することは従来
から望まれていた。
【0014】また、例えば、電子メールが各国間を跨い
で伝送する場合には、ネットワークを通して配送して、
原文で宛先のクライアントに表示するよりも、現地語に
翻訳して表示すれば、電子メールの処理業務を簡潔に且
つ迅速に行う上でも、望まれていた。
【0015】本発明は、機械翻訳の一方法であるトラン
スファー方式について、処理分散のための媒体にネット
ワークを利用し、解析部をクライアント側に、変換部、
生成部をサーバ側にと分散することにより、処理の集中
するサーバでの処理を軽減し、クライアントからの大量
の翻訳処理を高速で行うことができるようにすることを
課題とする。
【0016】また、所定の言語から、別の複数の言語に
対する変換も、クライアントに依存することなく、サー
バ側の変換部と生成部に、他言語への変換/生成のため
のリソースを追加していくことで、他言語に対応した機
械翻訳サーバを構築して行くことが可能となることを課
題とする。
【0017】
【課題を解決するための手段】本発明は、上記課題を解
決するために、ネットワークを利用して原文を他国語に
翻訳する機械翻訳システムに使用する翻訳サーバにおい
て、前記原文を単語単位に解析した原文解析データを受
信して当該原文解析データから適訳辞書及び/又は原文
同言語単語辞書、訳語辞書に基づいて各単語の前記他国
語の多国語解析データに変換する変換部と、該変換部で
変換された前記他国語解析データから翻訳規則及び訳語
辞書に基づいて他国語の文章である翻訳文を生成する生
成部とを有し、前記生成部では前記原文と前記翻訳文と
を対として表示できる合成文を生成して出力することを
特徴とする。
【0018】また、本発明は、ネットワークを利用して
原文を解析し、解析結果をエージェントに解析ファイル
として委ね、翻訳サーバで該解析ファイルから辞書デー
タベースに基づいて他国語解析データに変換して、単語
毎の他国語解析データから翻訳文を生成して宛先アドレ
スのクライアントに送出する機械翻訳システムに使用す
るクライアントにおいて、ネットワークに通信可能な通
信処理部と、前記原文を入力する入力部と、該原文を単
語単位に分離して解析する解析部と、前記解析部で解析
された解析データを電子メールとして前記通信処理部に
出力する出力部とを備え、前記解析部では各国語に応じ
てスペース間毎に前記単語を解析し、或いは記号に応じ
て単語を抽出することを特徴とする。
【0019】また、本発明は、ネットワークを利用して
原文を他国語に翻訳する機械翻訳システムにおいて、ク
ライアントと翻訳サーバと宛先クライアントと、それら
を仲介するエージェントとからなり、前記クライアント
は、前記ネットワークに通信可能な通信処理部と、前記
原文を入力する入力部と、該原文を単語単位に分離して
解析する解析部と、前記解析部で解析された解析データ
を電子メールとして前記通信処理部に出力する出力部と
を備え、前記翻訳サーバは、前記原文を単語単位に解析
した原文解析データを受信して当該原文解析データから
適訳辞書及び/又は原文同言語単語辞書、訳語辞書に基
づいて各単語の前記他国語の多国語解析データに変換す
る変換部と、該変換部で変換された前記他国語解析デー
タから翻訳規則及び訳語辞書に基づいて他国語の文章で
ある翻訳文を生成する生成部とを有し、前記生成部では
前記原文と前記翻訳文とを対として表示できる合成文を
生成して出力することを特徴とする。
【0020】また、本発明は、ネットワークを利用して
原文を他国語に翻訳する機械翻訳システムに使用する翻
訳サーバによってインストールされる翻訳プログラムを
格納したコンピュータが読み取り可能な記録媒体におい
て、前記翻訳サーバは、クライアントによって原文を最
小単位の単語毎に解析された第1の解析データを再度イ
ンストールされた言語同言語の単語辞書に基づいて解析
し、当該解析された第2の解析データに対してインスト
ールされた訳語辞書に基づいて訳語データに変換し、当
該変換された訳語データをインストールされた翻訳規則
及び適訳規則に基づいて翻訳文を生成し、生成した前記
翻訳文を宛先のクライアントに送出することを特徴とす
るコンピュータが読み取り可能な記録媒体を提供する。
【0021】
【発明の実施の形態】本発明の実施形態について、図面
を参照しつつ詳細に説明する。
【0022】[第1の実施形態] (1)構成の説明 図1に本発明の機械翻訳システムの概略構成図を示す。
図1において、英語国のクライアント100から、日本
語国のクライアントに電子メールを発想した場合、クラ
イアント100は、メール本文として「This is an app
le」を作成し、その本文を解析辞書によって解析した解
析済みの中間ファイルを追加した解析ファイルとして翻
訳サーバ200に向けてネットワーク網を介して送出す
る。機械翻訳サーバ200は、通常日本語国に配置さ
れ、解析済みの中間ファイルより訳語辞書に基づいて対
象言語に変換し、翻訳規則と適訳辞書に基づいて翻訳文
を生成する。その際、翻訳文に広告情報を含ませてもよ
い。日本語国のクライアント300は、翻訳サーバ20
0に電子メールが来ているかどうかを確認すると共に英
語国のクライアント100からの電子メールを受領す
る。その電子メールには、メール本文「This is an app
le」と、完成された翻訳文「ここにリンゴがあるよ。」
と、例えば企業から委託された企業広告とを併存して表
示する。
【0023】ここで、ネットワーク網とは、公衆網や、
ワールドワイド的なインターネット網や、LAN,WA
N,WLL(Wireless Local Loop)等を含み、それら
がシリーズに或いは並列的に接続されたネットワーク網
をも含むものであり、クライアントに翻訳サーバ用の翻
訳プログラムをインストールすれば、そのクライアント
が発信元のクライアントによる原文の解析を実行した後
に当該解析データを変換し且つ生成することとしてもよ
い。
【0024】図2に、本発明の機械翻訳システムの流れ
を示す構成図を示す。図1によって概略の機械翻訳シス
テムの構成、及び動作を説明したが、図2を参照して、
更に詳細に説明する。
【0025】図2において、まず、インターネット上の
サーバ、及びクライアントに所定の翻訳プログラムを分
散して、インストールしておき、各サーバ及びクライア
ントの特異性、特有の翻訳、特徴を利用する。まず、所
定のリソースを有するクライアント100から本文作成
部11で本文を作成すると共に、送出される本文を解析
部12で解析し、解析結果をエージェンシー400でそ
の解析結果から解析ファイル部22で解析ファイルを作
成し、その結果を翻訳プログラムを発行した所定のリソ
ースを有するURL(Uniform resource Locator)に向
けてインターネット上のリソース利用形態で送出し、そ
の所定のリソースを有するサーバ200で解析ファイル
を変換部23に出力し、そこで所定の言語に変換し、生
成部24でその所定の言語を別の所定の言語に翻訳して
完成し、出力側のクライアント300の翻訳文作成部3
2で表示可能な翻訳文表示データを生成して当該クライ
アント300のディスプレイに翻訳文を表示出力する。
【0026】ここで、本文を単なる単語の羅列と見るの
ではなく、何らかの構造を持った集合(コーパス)と見
なして、その構造を抽出し、それを図形や数式的な記号
で中間表現し、これを主要な補助手段として活用しなが
ら翻訳文を生成するもので、解析部12では、本文を形
態素解析、構文解析、意味解析等の解析手法があり、そ
のいずれの解析であっても最小単位の単語を元に解析す
る。また、変換部23では、構文変換、語彙変換等の手
法があり、最小単位の単語毎に訳語辞書等を用いて他国
語に変換する。また、生成部24では、訳語選択、形態
素調整等の手法があり、単語の配列などの翻訳規則に従
って翻訳文を生成する。
【0027】また、学習機能生成部25は、クライアン
ト100、サーバ300で用いる各種の辞書を最新の辞
書として更新するもので、本文を作成したクライアント
から、例えば原文のまま出力した方が翻訳として適切で
ある場合などにその旨学習データ251として、またサ
ーバ200やクライアント300から完成した翻訳文と
本文との比較結果を学習データ252としてフィードバ
ックをかけて、各種の辞書を最新の辞書に更新する機能
を有している。この学習機能により、特に多数の他国語
に翻訳する場合には、適切である。
【0028】また、サーバ200の生成部24では、合
成文26として出力するため、本文14と生成部24で
作成した翻訳文を並列的にクライアント300側のディ
スプレイに表示できるように、ページスクリプト等の画
像形成言語のHTML等の符号で生成する。この結果、
出力側のクライアント側では、本文と翻訳文との比較を
容易としており、ある程度の両国語を知識として有する
クライアントのユーザーにとって、本文と翻訳文との相
違点を確認する意味でも、有効である。
【0029】また、上記分散する翻訳プログラムは、全
体のプログラムを1パッケージソフトとして、解析・変
換・生成の各プログラムを記憶媒体に格納したものでも
よく、又はクライアント用に解析プログラムとして、翻
訳サーバ用に変換・生成プログラムとして、個別にパッ
ケージソフトとしてもよい。そのいずれの場合でも、各
種辞書をも含めておき、解析プログラムには原語同言語
単語辞書を、変換・生成プログラムには原語同言語単語
辞書と訳語辞書と翻訳規則及び適訳辞書とを添えておれ
ばよい。ただし、それらの辞書は学習機能を反映するた
めに、随時更新するプログラムも搭載しておく。また、
翻訳プログラムを格納した記録媒体としては、ハードデ
ィスクやフロッピーディスク、CD−ROM、DVD、
MO等が用いられる。また、翻訳プログラムの配送に
は、インターネット等のネットワークを伝送媒体として
利用することが、パッケージソフトに格納する手間を省
けて好ましい。
【0030】図3には、図2と同符号には同一機能を有
するものとし、クライアント100の解析部12に変換
機能を付加する変換部13を備えた例を示している。こ
の変換部13では、例えば本文そのものを翻訳文に記載
した方がよい場合には、解析部で最小単位の単語に分析
した場合に、ある単語に関しては翻訳不要とする場合
に、変換処理を行って、翻訳サーバの負担を軽減するこ
とができる。
【0031】図4には、機械翻訳の分散処理についての
説明図を示す。図4(A)には従来のスタンドアローン
型の翻訳システムの場合で、トランスファー方式の翻訳
の場合、解析部51で本文を解析し、解析された解析デ
ータを変換部52で最小単位の各単語を他国語に変換
し、変換された他国語のデータを生成部53で文章の翻
訳文として生成して、出力する。
【0032】一方、図4(B)には、上述したように、
クライアント100で本文を解析し、サーバ200の変
換部23で解析結果を変換し、生成部で翻訳文を生成
し、インターネットを介して送信先のクライアント30
1,302に出力する。この場合、宛先クライアントは
単数でも、マルチキャスト形式の複数でも、ブロードキ
ャスト形式の大多数であってもよく、宛先クライアント
が複数である場合に各宛先クライアントは1カ国語であ
ってもそれぞれが異なる言語圏であってもよく、制限さ
れない。この分散処理によって、サーバの負荷を著しく
軽減し、多くのクライアントからの翻訳依頼を高速に処
理できる。
【0033】図5に本実施形態の機械翻訳システムの全
体のブロック図を示す。図2に対して、データベースの
各種辞書を明示している点が追加されている。
【0034】図5において、送信側クライアント100
には、入力デバイスからの原文である本文を入力する本
文作成部11と、本文を入力し、本文と同一言語による
単語辞書のクライアント原文同言語単語辞書14に基づ
いて、最小単位の単語単位に解析する解析部12と、解
析部12で解析された本文解析データと本文とをインタ
ーネットに出力するファイル送受信エージェンシ15と
から構成される。
【0035】また、翻訳サーバ200は、ファイル送受
信エージェンシ15からインターネットを介して受信す
るファイル送受信エージェンシ16と、ファイル送受信
エージェンシ16からの本文解析データと本文とを入力
し、本文解析データを単語単位に受信側クライアントの
他国語言語に変換する変換部23と、他国語言語を翻訳
規則や適訳辞書に則って翻訳文を生成する生成部24
と、その翻訳文と本文とを入力してインターネットに出
力するファイル送受信エージェンシ17と、変換部23
で変換用に用いるサーバ原文同言語単語辞書29と、変
換部23での変換の際及び生成部24の翻訳文の生成の
際に用いる訳語辞書27と、生成部24の翻訳文の生成
の際に用いる翻訳規則及び適訳辞書28と、インターネ
ットに接続されたクライアントや翻訳サーバ等からの各
種翻訳用データに従って各種辞書27〜29を最新辞書
に更新する学習機能手段25とから構成される。
【0036】ここで、適訳辞書は、通称、適訳規則とい
う表現もあり、例えば1単語につき複数の訳語がある場
合に、どれを選択するかを判別する規則が記録媒体に格
納されており、この適訳規則をデータベースとして、辞
書と同様に格納したものであり、適訳辞書と適訳規則と
を同等に表現している。
【0037】また、受信側クライアント300は、ファ
イル送受信エージェンシ17に対応する不図示のファイ
ル送受信エージェンシと、不図示のファイル送受信エー
ジェンシからの本文と翻訳文とを受信してそれをディス
プレイ等の出力手段の表示部33とから構成される。な
お、クライアント100、300は相互に送受信関係を
反対にも動作することは、勿論である。
【0038】(2)動作の説明 次に、図6に本機械翻訳システムの全体の概約フローチ
ャートを示す。まず、送信側クライアント100で本文
作成部11で本文を作成し、他国に向けて電子メールの
本文として翻訳を依頼する処理を開始する(S11)。
まず、電子メールを元ファイルとしてファイルに格納し
ておき、ファイルから当該本文の原文を抜き出す(S1
2)。次に、クライアント原文同言語単語辞書14を参
照しつつ原文を解析する。例えば英文の場合にはスペー
スを基準にして、日本語の場合には2語を基準に単語辞
書にあるか否かを参照して、最小単位の単位毎に分解・
解析する(S13)。原文の解析で未登録単語の有無を
判断し(S14)、未登録単語が有ればその原文の全体
に未処理フラグを付与し原文のまま採用し(S15)、
送信側クライアント100又はファイル送受信エージェ
ンシ15で記憶手段としての解析ファイルを生成する
(S16)。ファイル送受信エージェンシ15は翻訳サ
ーバ200へ元ファイルと解析ファイルをインターネッ
トを介して翻訳サーバ200のアドレスを宛先アドレス
として送信する(S17)。
【0039】翻訳サーバ200では、ファイル送受信エ
ージェンシ16で元ファイルと解析ファイルを受信し、
変換部23で、解析ファイルの未処理フラグの有無を判
断し(S18)、未処理フラグが有れば未処理部分の再
解析をサーバが具備する原文同言語の単語辞書29を参
照しつつ実行する(S19)。次に、解析ファイルに未
登録単語の有無を判断し(S20)、未登録単語があれ
ば解析ファイルの原文のまま採用する(S21)。
【0040】つぎに、解析ファイルから最小単位の単語
毎に訳語辞書に従って訳語に変換する(S22)。訳語
に変換された変換ファイルは、生成部24で、翻訳規則
及び適訳規則の適訳辞書に従って、単語の並び替えや組
み合わせを行い、適当な箇所に「。」や「,」「、」等
を挿入し、文章的又は句節的な事例を相当数格納した用
例辞書に従って慣用句や格言などを翻訳生成して、翻訳
文章を生成する(S23)。
【0041】次に、文章作成が終了すれば、ファイル送
受信エージェンシ17は、この原文と訳文の翻訳文とを
指定URL(Uniform Resource Locator)に送信する。
指定URLではその原文と翻訳文とに広告収入のための
企業広告を付加して、宛先のクライアントアドレスに向
けてインターネットを介して出力する。宛先のクライア
ントは、その原文と翻訳文と企業広告を電子メールとし
て受信してディスプレイ等の出力手段に表出する。ディ
スプレイに表示する場合には、原文と翻訳文とを並列表
示すると共に、企業広告情報を表示して、当該翻訳プロ
グラムをクライアントやサーバに配信したシステム運用
者は広告収入を得ると共に、公衆に向けての社会的需要
に応えることができる。
【0042】つぎに、図7のフローチャートを参照しつ
つ、送信側クライアント100の解析部12の動作を説
明する。まず、原文を格納したファイルから原文を抜き
出し(S31)、原文を分解・解析するために記号やス
ペースの処理で単語単位に解析する。例えば、英語の場
合には、単語の前後に配置するスペースや記号であ
る「.」「,」「−」「”」等で分解し、日本語の場合
には記号の「、」「。」「・」等で単語を抽出する(S
32)。次に、文の先頭からクライアント原文同言語単
語辞書を参照しつつ単語検索を開始し(S33)、次に
未登録単語の有無を判断し(S34)、未登録単語があ
れば検索の文字数を変えてクライアント原文同言語単語
辞書を参照しつつ再検索する(S35)。次に、未登録
単語がない場合と共に、更に未登録単語の有無を判断し
(S36)、未登録単語があれば当該電子メール全体に
未登録フラグを付与して原文のまま採用する解析データ
として記憶手段に格納し、又は直接次のステップに移行
する(S37)。つぎに、解析データは原文と共に解析
ファイルとして生成され(S38)、ファイル送受信エ
ージェンシ15で所定のURLへ送信する(S39)。
所定のURLは、当該翻訳システムの運用者であり、こ
の解析データがどのくらい転送されているのかをカウン
トすると共に、この段階で国際的な企業広告を希望する
広告供給者の要求に従って解析データに企業広告を付加
してもよい。
【0043】つぎに、図8のフローチャートを参照しつ
つ、翻訳サーバ200の変換部23の動作を説明する。
まず、ファイル送受信エージェンシ16で受信した原文
と解析データから、解析データ内に未処理フラグがある
か否かを判断し(S41)、未処理フラグがあれば、未
処理の未登録単語を翻訳サーバ200が所有する原文と
同一言語の単語辞書29を参照しつつ検索する(S4
2)。次に、未処理フラグがない場合と共に、未登録単
語の有無を判断し(S43)、未登録単語の有れば原文
同言語単語辞書29を参照しつつ検索の文字数を変えて
再検索する(S44)。次に、未登録単語の有無を判断
し(S45)、未登録単語の有れば不正確通知をフラグ
のように付与し原文のまま次のステップに出力する。こ
の場合、フィードバック的に学習機能部25に原文の未
登録単語を送出し、原文単語のまま解析するようにクラ
イアント原文同言語単語辞書14に反映する。
【0044】つぎに、未登録単語がない電子メールの解
析データと共に不正確通知の付与された解析データとか
ら訳語辞書27を検索しつつ最小単位の単語毎に訳語変
換する(S47)。次に、訳語データ中に訳語辞書に存
在しない未登録単語の有無を判断し(S48)、未登録
単語が有ればその原文の単語のままを採用し(S4
9)、終了して生成部24に出力する一方、その結果を
他言語訳語辞書の学習・メンテナンス処理に出力する。
【0045】また、図9のフローチャートを参照しつ
つ、翻訳サーバ200の生成部24の動作を説明する。
まず、変換部23での訳語データを受領して、文法操作
のための対象テーブルを作成し、例えば主語、述語、目
的語、補語、接続詞等の配置を明確とするため、原文の
主語、述語、目的語、補語、接続詞等と、訳語の主語、
述語、目的語、補語、接続詞等とを対象テーブル的に作
成する(S51)。次に、翻訳規則及び適訳辞書28を
参照して(S52)、訳語データに翻訳規則を適用し
(S53)、次に、未登録規則の有無を判断し(S5
4)、未登録規則があれば用例辞書を参照してその解析
データから作成した対象テーブルで習慣語やことわざな
どの用例辞書から訳語を検索する(S55)。この場
合、通常の用例辞書と同様に、単語毎ばかりでなく文章
的にも用例辞書にあるか否かを照会しても良い。つぎ
に、未登録用例の有無を判断し(S56)、未登録用例
の有れば、つぎに近似用例を不図示の近似用例辞書から
抽出し(S57)、未登録用例のない場合と共に、翻訳
規則及び適訳辞書を参照しつつ訳語を結合して電子メー
ルの翻訳文とする(S58)。一方、ステップS57で
近似用例を使用した場合には、用例辞書の学習機能の一
つとして、その近似用例を用例辞書に格納して、次に用
例辞書に照会する場合に使用して役立てることができ
る。
【0046】この訳語の結合により、翻訳文を作成し、
原文と共に所定のURLに送出して、企業広告等を付与
して、宛先のクライアントに向けてインターネットを介
して出力する。
【0047】また、本機械翻訳システムの運用者が配送
する翻訳プログラムは、解析部用と変換・生成部とに分
けて、図7にて説明したフローチャートの解析用プログ
ラムと、図8、図9似て説明したフローチャートの変換
・生成用プログラムとをそれぞれ送信側クライアント
に、各国の翻訳サーバに、それぞれインストールするこ
とにより、クライアント・サーバシステムのように分散
処理することができる。
【0048】また、電子メールなどに原文と翻訳文と共
に、企業広告を並列表示することにより、機械翻訳シス
テムの運用者は広告収入をも得ることができる。
【0049】また、上記実施形態では、受信側クライア
ントの表示に、本文と翻訳文とを並列表記する例を示し
たが、本文がなくても、翻訳文だけでも受信側クライア
ントにとって支障がない場合には、翻訳文だけを表示し
ても良い。その場合には、翻訳サーバにとっても、本文
を無視して解析データから変換して翻訳文を生成すれば
よいので、翻訳処理としては簡単・高速になるという効
果を奏し得る。
【0050】(3)機械翻訳の例示 図10に本機械翻訳システムによって扱った場合の例示
を、韓国語から英文、日本語から英文にした場合を示
す。
【0051】図10(A)は韓国語から英語への翻訳の
場合、(a)解析部処理において原文を[●]で区切っ
た単語に分割・解析し、(b)変換部処理において更に
翻訳サーバ内の原文同言語単語辞書で解析して、原文を
[●]で区切り、その後対応訳語を抽出した結果を示し
ている。その後、(c)生成部処理で翻訳文を生成した
結果を示している。
【0052】同様に、図10(B)は日本語から英語へ
の翻訳の場合、(a)解析部処理において、原文の2文
字から解析を開始し、3文字、或いは4文字として、原
文同言語単語辞書との照合の結果、原文を[●]で区切
った単語に分割・解析する。つぎに、(b)変換部処理
において、更に翻訳サーバ内の原文同言語単語辞書で解
析して、原文を最小単位の単語毎に、[●]で区切り、
その後、訳語辞書から対応訳語を抽出する。その後、
(c)生成部処理で、英文の翻訳規則及び適訳辞書に従
って、例えば最初の文字は大文字に、単語毎の間にはス
ペースを設け、疑問文には[?]を負荷するなどの規則
に従って、翻訳文を生成した結果を示している。
【0053】なお、韓国語と日本語とは、主語、目的
語、動詞等の語順が一致しているので、相互の翻訳に
は、変換部から生成部に至る場合に翻訳テーブルを使用
しなくても、直接対応訳語を組み合わせることができ
る。
【0054】なお、上記実施形態では、トランスファ方
式の分散方式について説明したが、ピボット方式であっ
ても、クライアント側に一文解析部のプログラムで一文
毎に区切りをつけ、サーバ側で用例辞書等で変換するこ
とにより、用例に応じた翻訳ができるので、解析部をク
ライアントに負担し、翻訳サーバに変換部を備えておけ
ば、トランスファ方式と同様に翻訳文を出力できる。
【0055】また、上記実施形態では、主に他国語を使
用する外国への電子メールの例について説明したが、他
国語への翻訳という場合は、リアルタイムに翻訳処理す
る必要のある電子メールに限らず、添付文書を添えた電
子メールであっても、その添付文書を翻訳することにし
てもよいし、一般の書類の翻訳にも、本発明を利用して
もよいことは勿論である。また、各国語間だけではな
く、国内の例えば標準語と大阪弁と薩摩言葉等を本機械
翻訳システムに適用してもよい。
【0056】また、インターネットテレホンといわれる
インターネットを利用した電話において、原語の音声を
テキストとして解読して、本発明の機械翻訳システムを
利用して、そのテキストを解析し、プロバイダ或いはブ
リッジ/ルータ等の中間処理サーバ等で変換/生成処理
を行い、所定の音声に変換することにより、リアルタイ
ムのインターネットテレホンシステムを運用するように
してもよい。
【0057】
【発明の効果】上述した本発明によれば、インターネッ
トを介して送信側クライアントと翻訳サーバとで原文か
ら翻訳文を作成する場合に、一括的にサーバ内で翻訳す
る場合に代えて、トランスファ方式の解析部分をクライ
アントで実行し、翻訳サーバで変換・生成部分を分散処
理するので、翻訳サーバの負荷を軽減し、特に、各国語
に応じた翻訳サーバを使用するので、翻訳サーバの存在
する自国語の辞書を使用できるので、翻訳文を日常使用
する言葉で表現することができ、文語体的にかたぐるし
い表現に比較して、インターネットならではの表現で表
示できるという効果も奏し得る。
【図面の簡単な説明】
【図1】本発明の概念的な翻訳の物理的構成図である。
【図2】本発明の機械翻訳システムの構成図である。
【図3】本発明の機械翻訳システムの構成図である。
【図4】本発明と従来例の概念的な翻訳の物理的構成図
である。
【図5】本発明の機械翻訳システムのブロック図であ
る。
【図6】本発明の機械翻訳システムの全体の概約フロー
チャートである。
【図7】本発明の機械翻訳システムの解析部のフローチ
ャートである。
【図8】本発明の機械翻訳システムの変換部のフローチ
ャートである。
【図9】本発明の機械翻訳システムの生成部のフローチ
ャートである。
【図10】本発明の機械翻訳システムの実際の翻訳例の
説明図である。
【符号の説明】
10 メール本文と解析済みの中間ファイル 11 本文作成部 12、51 解析部 13 変換部 14 クライアント原文同言語単語辞書 15、16、17 ファイル送受信エージェンシ 18 更新データ 20 解析済みの中間ファイルから対象言語に変換・生
成した翻訳文 21 企業広告 22 解析ファイル部 23、52 変換部 24、53 生成部 25 学習機能生成部 27 訳語辞書 28 翻訳規則及び適訳辞書 29 原文同言語単語辞書 30 メール本文と翻訳文 31 企業広告 32 翻訳文作成部 100 送信側クライアント 200 翻訳サーバ 300 受信側クライアント 400 エージェンシ

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 ネットワークを利用して原文を他国語に
    翻訳する機械翻訳システムに使用する翻訳サーバにおい
    て、前記原文を単語単位に解析した原文解析データを受
    信して当該原文解析データから適訳辞書及び/又は原文
    同言語単語辞書、訳語辞書に基づいて各単語の前記他国
    語の多国語解析データに変換する変換部と、該変換部で
    変換された前記他国語解析データから翻訳規則及び訳語
    辞書に基づいて他国語の文章である翻訳文を生成する生
    成部とを有し、前記生成部では前記原文と前記翻訳文と
    を対として表示できる合成文を生成して出力することを
    特徴とする翻訳サーバ。
  2. 【請求項2】 請求項1に記載の翻訳サーバにおいて、
    前記原文解析データに含まれた解析未処理の単語に対し
    て前記原文同言語単語辞書に基づいて、原文をそのまま
    出力する場合があることを特徴とする翻訳サーバ。
  3. 【請求項3】 ネットワークを利用して原文を解析し、
    解析結果をエージェントに解析ファイルとして委ね、翻
    訳サーバで該解析ファイルから辞書データベースに基づ
    いて他国語解析データに変換して、単語毎の他国語解析
    データから翻訳文を生成して宛先アドレスのクライアン
    トに送出する機械翻訳システムに使用する送信側のクラ
    イアントにおいて、 前記ネットワークに通信可能な通信処理部と、前記原文
    を入力する入力部と、該原文を単語単位に分離して解析
    する解析部と、前記解析部で解析された解析データを電
    子メールとして前記通信処理部に出力する出力部とを備
    え、前記解析部では各国語に応じてスペース間毎に前記
    単語を分離・解析し、或いは記号に応じて前記単語を抽
    出することを特徴とするクライアント。
  4. 【請求項4】 ネットワークを利用して原文を他国語に
    翻訳する機械翻訳システムにおいて、 クライアントと翻訳サーバと宛先クライアントと、それ
    らを仲介するエージェントとからなり、 前記クライアントは、前記ネットワークに通信可能な通
    信処理部と、前記原文を入力する入力部と、該原文を単
    語単位に分離して解析する解析部と、前記解析部で解析
    された解析データを電子メールとして前記通信処理部に
    出力する出力部とを備え、 前記翻訳サーバは、前記原文を単語単位に解析した原文
    解析データを受信して当該原文解析データから適訳辞書
    及び/又は原文同言語単語辞書、訳語辞書に基づいて各
    単語の前記他国語の多国語解析データに変換する変換部
    と、該変換部で変換された前記他国語解析データから翻
    訳規則及び訳語辞書に基づいて他国語の文章である翻訳
    文を生成する生成部とを有し、前記生成部では前記原文
    と前記翻訳文とを対として表示できる合成文を生成して
    出力することを特徴とする機械翻訳システム。
  5. 【請求項5】 請求項4に記載の機械翻訳システムにお
    いて、前記宛先クライアントへの翻訳文の表示に併存し
    て広告を掲載することを特徴とする機械翻訳システム。
  6. 【請求項6】 ネットワークを利用して原文を他国語に
    翻訳する機械翻訳システムに使用する翻訳サーバによっ
    てインストールされる翻訳プログラムを格納したコンピ
    ュータが読み取り可能な記録媒体において、 前記翻訳サーバは、送信側クライアントによって前記原
    文を最小単位の単語毎に解析された第1の解析データを
    再度インストールされた言語同言語の単語辞書に基づい
    て解析し、当該解析された第2の解析データに対してイ
    ンストールされた訳語辞書に基づいて訳語データに変換
    し、当該変換された訳語データをインストールされた翻
    訳規則及び適訳規則に基づいて翻訳文を生成し、生成し
    た前記翻訳文を宛先のクライアントに送出することを特
    徴とするプログラムを格納したコンピュータが読み取り
    可能な記録媒体。
JP2000015340A 2000-01-25 2000-01-25 機械翻訳システムとその翻訳サーバ及びそのクライアント Pending JP2001209643A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2000015340A JP2001209643A (ja) 2000-01-25 2000-01-25 機械翻訳システムとその翻訳サーバ及びそのクライアント
PCT/JP2001/000343 WO2001055901A1 (fr) 2000-01-25 2001-01-19 Systeme de traduction automatique, serveur et client de ce systeme
AU27073/01A AU2707301A (en) 2000-01-25 2001-01-19 Machine translation system, translation server thereof, and client thereof
TW090101727A TW501030B (en) 2000-01-25 2001-01-29 Machine translation system and translation server and client thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000015340A JP2001209643A (ja) 2000-01-25 2000-01-25 機械翻訳システムとその翻訳サーバ及びそのクライアント

Publications (1)

Publication Number Publication Date
JP2001209643A true JP2001209643A (ja) 2001-08-03

Family

ID=18542660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000015340A Pending JP2001209643A (ja) 2000-01-25 2000-01-25 機械翻訳システムとその翻訳サーバ及びそのクライアント

Country Status (4)

Country Link
JP (1) JP2001209643A (ja)
AU (1) AU2707301A (ja)
TW (1) TW501030B (ja)
WO (1) WO2001055901A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101498456B1 (ko) * 2010-07-06 2015-03-06 에스케이플래닛 주식회사 백과사전을 이용한 번역 서비스 장치 및 그 방법
CN105740239A (zh) * 2016-02-01 2016-07-06 中译语通科技(北京)有限公司 一种网页上文字的翻译方法及系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100530154B1 (ko) 2002-06-07 2005-11-21 인터내셔널 비지네스 머신즈 코포레이션 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
TWI385538B (zh) * 2008-07-18 2013-02-11 Inventec Corp 單詞擷取翻譯系統及其方法
TWI634435B (zh) * 2017-07-31 2018-09-01 全家便利商店股份有限公司 雲端翻譯及列印系統及方法
CN110598222B (zh) * 2019-09-12 2023-05-30 北京金山数字娱乐科技有限公司 语言处理方法及装置、语言处理系统的训练方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6347877A (ja) * 1986-08-18 1988-02-29 Canon Inc 翻訳装置
JPH02202143A (ja) * 1989-01-31 1990-08-10 Toshiba Corp 電子メールシステム
JPH1185753A (ja) * 1997-09-11 1999-03-30 Technical Aatsu:Kk 誤訳のない多言語翻訳方法
JP4142193B2 (ja) * 1998-02-05 2008-08-27 日本コンピュータ・エイディッド・テクノロジ株式会社 ネットワーク通信方式
JPH11250066A (ja) * 1998-03-04 1999-09-17 Casio Comput Co Ltd 電子メール装置及び電子メール処理プログラムを記録した記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101498456B1 (ko) * 2010-07-06 2015-03-06 에스케이플래닛 주식회사 백과사전을 이용한 번역 서비스 장치 및 그 방법
CN105740239A (zh) * 2016-02-01 2016-07-06 中译语通科技(北京)有限公司 一种网页上文字的翻译方法及系统

Also Published As

Publication number Publication date
AU2707301A (en) 2001-08-07
TW501030B (en) 2002-09-01
WO2001055901A1 (fr) 2001-08-02

Similar Documents

Publication Publication Date Title
RU2382399C2 (ru) Адаптивный машинный перевод
US6623529B1 (en) Multilingual electronic document translation, management, and delivery system
US6526426B1 (en) Translation management system
US8489980B2 (en) Translation management system
US8612206B2 (en) Transliterating semitic languages including diacritics
US7383542B2 (en) Adaptive machine translation service
US20150254237A1 (en) Data Security System for Natural Language Translation
US20130124598A1 (en) Translation management system
JP2008135011A (ja) 翻訳システム及び翻訳サービス提供方法
JP2004334791A (ja) 機械翻訳装置、データ処理方法及びプログラム
WO2010062540A1 (en) Method for customizing translation of a communication between languages, and associated system and computer program product
WO2012121063A1 (ja) 翻字処理装置、プログラム、記録媒体、及び方法
JP2001209643A (ja) 機械翻訳システムとその翻訳サーバ及びそのクライアント
EP2261818A1 (en) A method for inter-lingual electronic communication
WO2004114146A1 (ja) 外字登録情報提供システム及び外字同定支援システム
JP3311957B2 (ja) ユーザ辞書構築方法およびユーザ辞書構築装置および翻訳方法および翻訳装置
JP4035975B2 (ja) 機械翻訳端末装置、機械翻訳システム、機械翻訳端末装置の制御方法、機械翻訳システムの制御方法、機械翻訳端末装置の制御プログラム及び記録媒体
JP4033622B2 (ja) 機械翻訳システム
JPH1153363A (ja) 翻訳機および記録媒体
JP6062731B2 (ja) 言語置き換え装置、端末装置、言語置き換え方法、言語置き換えシステム、言語置き換えプログラム
JP3389313B2 (ja) 機械翻訳装置
JP2003114890A (ja) 翻訳装置、翻訳方法、翻訳サーバおよびプログラム
CN114692651A (zh) 文本翻译方法、装置及计算机可读介质
JPH10187732A (ja) 多言語対応通信システム
JP2008210216A (ja) 利用者を検索する装置、方法およびプログラム