JP3982984B2 - Distributed natural language processing system - Google Patents

Distributed natural language processing system Download PDF

Info

Publication number
JP3982984B2
JP3982984B2 JP2000281256A JP2000281256A JP3982984B2 JP 3982984 B2 JP3982984 B2 JP 3982984B2 JP 2000281256 A JP2000281256 A JP 2000281256A JP 2000281256 A JP2000281256 A JP 2000281256A JP 3982984 B2 JP3982984 B2 JP 3982984B2
Authority
JP
Japan
Prior art keywords
translation
natural language
dictionary
language processing
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000281256A
Other languages
Japanese (ja)
Other versions
JP2002091964A (en
Inventor
真 鳥越
達哉 介弘
泰広 川北
聰 中川
聡彦 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000281256A priority Critical patent/JP3982984B2/en
Priority to US09/948,935 priority patent/US20040205671A1/en
Publication of JP2002091964A publication Critical patent/JP2002091964A/en
Application granted granted Critical
Publication of JP3982984B2 publication Critical patent/JP3982984B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は分散型自然言語処理システムに関し、例えば、ネットワーク上の複数の翻訳サーバが辞書サーバ内の辞書を共有する辞書共有型機械翻訳システムに適用し得るものである。
【0002】
【従来の技術】
機械翻訳においては、翻訳に利用する辞書の内容が訳質に大きな影響を与えるため、自然言語の時代変化などに合わせて頻繁に更新することが好ましい。また、近年の翻訳技術の向上と、翻訳分野の拡大や専門性の向上に伴い、使用する辞書も肥大化の一途をたどっている。
【0003】
そのため、図2に示すように、複数の機械翻訳サーバ(以下、単に翻訳サーバと呼ぶ)1がネットワーク(例えばインターネット)3上の辞書サーバ2を共有することも研究、開発されている。
【0004】
翻訳サーバ1は、辞書サーバ2の辞書2aの情報をダウンロードして自己サーバ1内の辞書1bに格納し、翻訳部1aが辞書1b内のダウンロードした辞書情報を利用して翻訳処理する。又は、翻訳サーバ1内の翻訳部1aが、辞書サーバ2内の辞書2aを直接アクセスして翻訳処理を実行する。
【0005】
後者は、ごく少ない数の文章を翻訳する場合には有効であるが、例えば、インターネットを流れるWebページのような文書を翻訳対象とする場合には、前者が好ましい。
【0006】
【発明が解決しようとしている課題】
しかしながら、上述したような肥大化した辞書2aを、複数の翻訳サーバ1がネットワーク3上で共有する場合、辞書ダウンロード時又は辞書検索時には、莫大なトラフィックが発生するという課題がある。仮に、辞書2aが専門分野やジャンル毎のカテゴリーに別れ、一部のカテゴリーについての辞書内容だけを翻訳サーバ1が利用するとした場合でも、トラフィックは多大である。
【0007】
また、インターネットの発達により外国語で記述された文書が多数入手できるようになったため、辞書サーバ2を共有する翻訳サーバ1の数も今後増大の一途を辿り、この点からもトラフィックの増大化の課題は大きい。
【0008】
そのため、複数の自然言語処理サーバが辞書サーバを共有する場合において、トラフィック(通信量)を抑制することができる分散型自然言語処理システムが望まれている。
【0009】
【課題を解決するための手段】
かかる課題を解決するため、第1の本発明は、自然言語処理を行うプログラムファイルを搭載している、1又は複数の第1の情報処理装置と、自然言語処理で利用される辞書を搭載している第2の情報処理装置とを有する分散型自然言語処理システムにおいて、(1)上記第1の情報処理装置が、(1−1)上記プログラムファイルを上記第2の情報処理装置に送信する処理実行部送信手段と、(1−2)上記自然言語処理の対象となる自然言語処理対象を上記第2の情報処理装置に送信する処理対象送信手段とを備え、(2)上記第2の情報処理装置が、(2−1)上記プログラムファイルが登録されて、上記第1の情報処理装置から与えられた自然言語処理対象に対し、上記辞書及び登録された上記プログラムファイルを利用した自然言語処理を行う登録自然言語処理手段と、(2−2)上記第1の情報処理装置から与えられた上記プログラムファイルを上記登録自然言語処理手段に登録させる処理実行部登録手段とを備えることを特徴とする。
【0010】
また、第2の本発明は、自然言語処理を行うプログラムファイルを搭載している、1又は複数の第1の情報処理装置と、自然言語処理で利用される辞書を搭載している第2の情報処理装置とを有する分散型自然言語処理システムにおいて、(1)上記第1の情報処理装置が、(1−1)上記プログラムファイルを上記第2の情報処理装置に送信する処理実行部送信手段と、(1−2)上記自然言語処理の対象となる自然言語処理対象を上記第2の情報処理装置に送信する処理対象送信手段と、(1−3)上記第2の情報処理装置から与えられた自然言語処理結果を出力する結果出力手段とを備え、(2)上記第2の情報処理装置が、(2−1)上記プログラムファイルが登録されて、上記第1の情報処理装置から与えられた自然言語処理対象に対し、上記辞書及び登録された上記プログラムファイルを利用した自然言語処理を行う登録自然言語処理手段と、(2−2)上記第1の情報処理装置から与えられた上記プログラムファイルを上記登録自然言語処理手段に登録させる処理実行部登録手段と、(2−3)上記登録自然言語処理手段による自然言語処理結果を上記第1の情報処理装置に返信する処理結果返信手段とを備えることを特徴とする。
【0011】
【発明の実施の形態】
(A)実施形態
以下、本発明による分散型自然言語処理システムを辞書共有型機械翻訳システムに適用した実施形態を図面を参照しながら説明する。図1は、この実施形態の辞書共有型機械翻訳システム4の概念の説明図である。
【0012】
この実施形態の辞書共有型機械翻訳システム4も、複数の翻訳サーバ5がネットワーク(以下、インターネットとする)7上の辞書サーバ6を共有するものである。そして、この実施形態では、翻訳サーバ5内の翻訳部5aを、辞書サーバ6にアップロードし、アップロードされた辞書サーバ6内の翻訳部6bが共有辞書6aを利用して翻訳を行い、翻訳依頼者が辞書サーバ6内で得られた翻訳結果を翻訳サーバ5を介して入手するものである。
【0013】
実際上、翻訳処理を実行する翻訳部(5a)は、機械翻訳用の処理プログラムやデータ(辞書データを除く)などでなるソフトウェア部分と、主メモリにロードされているその機械翻訳用処理プログラムを実行するCPUなどのハードウェア部分とでなり、上述した翻訳部5aのアップロードは、ソフトウェア部分のアップロードを意味する。この点は、後述する説明でも同様である。
【0014】
(A−1)実施形態の構成
次に、実施形態の辞書共有型機械翻訳システム4の具体的な構成を、図3を参照しながら説明する。
【0015】
翻訳サーバ5及び辞書サーバ6はそれぞれ、例えば、1又は複数の情報処理装置で構築されているが、機能的には、図3で示すことができる。
【0016】
図3において、翻訳サーバ5は、翻訳部送信部11、翻訳実行指示部12及び翻訳結果受信出力部13を有する。一方、辞書サーバ6は、翻訳部登録部21、翻訳部管理部22、登録翻訳部23(23A〜23N)、辞書24及び辞書管理部25を有する。
【0017】
翻訳サーバ5の翻訳部送信部11は、自己の翻訳部を辞書サーバ6にアップローディングさせるための送信を行うものである。ここで、送信される翻訳部とは、上述したように、機械翻訳用の処理プログラムやデータ(辞書データを除く)などでなるソフトウェア部分であり、翻訳エンジンなどと呼ばれているものである。翻訳部は、翻訳対象文書の入力機能や翻訳結果の出力機能などは転送機能程度のものである。なお、翻訳部送信部11による翻訳部の送信は、複写送信であり、送信後においても、翻訳サーバ5内に翻訳部は存在する。
【0018】
翻訳部送信部11は、文書の翻訳を依頼されたタイミングで翻訳部を送信するようにしても良く、図示しない入力部を介して、当該翻訳サーバ5が翻訳モードに立ち上げられたときに、翻訳部を送信するようにしても良い。例えば、翻訳サーバ5がインターネットの検索サーバを兼ねており、所望する文書の翻訳結果付き検索が指示されたときに、検索動作を起動するタイミングで翻訳部を辞書サーバ6にアップローディングさせるようにしても良い。
【0019】
翻訳実行指示部12は、翻訳対象文書のデータを含む翻訳実行の指示(辞書24がカテゴリー毎に用意されている場合には辞書の特定データを含んでいても良い)を辞書サーバ6に与えて翻訳処理を起動させるものである。当然に、翻訳実行指示部12は、当該翻訳サーバ5の翻訳部が辞書サーバ6にアップローディングされていることを確認して翻訳実行の指示を送出するものである。なお、翻訳部送信部11が、翻訳部を送信する際に、翻訳対象文書のデータをも含めて送信する場合には、翻訳実行指示部12は省略される。
【0020】
翻訳結果受信出力部13は、辞書サーバ6から与えられた翻訳結果文書を受信して、翻訳依頼者に対して出力するものである。出力方法は、表示出力や印刷出力であっても良く、また、翻訳依頼者の情報処理端末へ宛てた送信出力であっても良い。
【0021】
辞書サーバ6の翻訳部登録部21は、翻訳サーバ5から与えられた翻訳部を翻訳部管理部22との協働により、辞書サーバ6に登録させるものである。
【0022】
図3においては、翻訳部が登録され、翻訳処理を実行し得るようになっている部分を登録翻訳部23(23A〜23N)と呼んでいる。登録翻訳部23(23A〜23N)は、翻訳部(ソフトウェア)を記憶する記憶領域と、記憶領域に記憶された翻訳部に従ったプログラム処理を実行するCPUなどのハードウェア部分とでなる。登録翻訳部23となり得る記憶領域とハードウェア部分との組を複数用意して、複数の翻訳サーバ5からの翻訳要求に対応できるようにしておくとが好ましい。なお、翻訳部(ソフトウェア)を記憶する記憶領域だけを複数用意しておき、ハードウェア部分は、複数の登録翻訳部23A〜23Nで共通化しておき、時分割などで各登録翻訳部23A〜23Nとして機能するようにしても良い。
【0023】
上述した翻訳部登録部21は、登録翻訳部となり得る部分が全て登録翻訳部23A〜23Nとして機能しているときには、翻訳サーバ5に翻訳部を登録できない旨を返信するものである。
【0024】
翻訳部管理部22は、登録翻訳部となり得る部分や、登録翻訳部23A〜23Nとして機能している部分を管理するものである。翻訳部管理部22は、例えば、翻訳サーバ5からの翻訳部を登録できる空き状態の記憶領域や、既に翻訳部を記憶している記憶領域をその翻訳部の送信元の翻訳サーバ5の識別情報に対応付けて管理したり、登録翻訳部23A〜23Nが翻訳の実行中か否かや使用辞書を管理したりするものである。
【0025】
また、翻訳部管理部22は、翻訳サーバ5から翻訳対象文書が与えられたときに、その翻訳サーバ5に係る登録翻訳部23X(XはA〜N)にその翻訳対象文書を引き渡すものである。
【0026】
さらに、翻訳部管理部22は、登録翻訳部23Xが翻訳結果文書を得たときに、その登録翻訳部23Xに係る翻訳サーバ5に翻訳結果文書を送信するものである。ここで、翻訳部管理部22は、翻訳結果文書を翻訳サーバ5に送信したときに、登録翻訳部23Xを新たな翻訳部を登録し得る状態に復帰させるようにしても良い。この復帰は、自己内の管理データを空き設定することで行っても良く、また、登録翻訳部23Xの記憶領域を全消去することで行っても良い。なお、登録翻訳部23Xを新たな翻訳部を登録し得る状態への復帰は、該当する翻訳サーバ5からの翻訳部消去要求を待って行うようにしても良い。
【0027】
さらにまた、翻訳部管理部22は、翻訳部を登録した際には、その登録翻訳部23Xが共有辞書24をアクセスし得るように、辞書管理部25を制御するものである。なお、翻訳依頼文書に、使用辞書の特定情報が含まれていた場合にも、登録翻訳部23Xがその種別の辞書だけをアクセスし得るように、辞書管理部25を制御するものである。
【0028】
辞書24は、複数の登録翻訳部23A〜23Nが共有する、言い換えると、複数の翻訳サーバ5が共有する辞書である。すなわち、登録翻訳部23A〜23Nが翻訳処理の際に利用する辞書である。
【0029】
辞書管理部25は、登録翻訳部23A〜23Nが辞書24中のどの種別の辞書を使用できるかなどを管理するものであり、各登録翻訳部23A、…、23Nは、この辞書管理部25を介して辞書24をアクセスするものである。また、辞書管理部25は、どの登録翻訳部23Xからのアクセスからかを管理し、辞書24から読み出した単語情報などを該当する登録翻訳部23Xに与えるものである。例えば、登録翻訳部23A、…、23Nから辞書24へのアクセスを時分割で割り振っている場合には、タイムスロットと登録翻訳部23A、…、23Nとの関係を管理する。また、適宜辞書アクセスの競合を調停するものである。
【0030】
なお、このような辞書管理方法は、1台の辞書サーバに対し、複数台の翻訳サーバが直接に辞書をアクセスしようとする際の従来の管理方法と同様である。
【0031】
(A−2)実施形態の動作
次に、第1の実施形態に係る辞書共有型機械翻訳システム4の動作を図4のシーケンス図を参照しながら説明する。
【0032】
翻訳サーバ5は、自己サーバ5内の翻訳部を辞書サーバ6の翻訳部登録部21へ送信する(ステップS1)。登録用の送信動作は、例えば、実行ファイルのアップロードである。
【0033】
翻訳部登録部21は、受け取った翻訳部を翻訳部管理部22に与えてバッファリングした後(ステップS2)、翻訳部管理部22は、登録翻訳部となり得る部分(記憶領域など)の空き状況に基づき、空き状態の記憶領域に受信した翻訳部を記憶させて登録翻訳部(ここでは符号23Aとする)として機能できるようにする(ステップS3)。また、翻訳部管理部22は、辞書管理部25から辞書アクセスのインタフェイス(例えば時分割アクセスでのタイムスロット、呼び出し関数や、関数群のエントリーポイント)を取得し(ステップS4)、登録翻訳部23Aへ設定する(ステップS5)。
【0034】
利用者が、翻訳サーバ5に翻訳対象文書を入力すれば(ステップS6)、翻訳サーバ5は、直ちに辞書サーバ6に翻訳を依頼し、辞書サーバ6の翻訳部管理部22はその翻訳サーバ5に係る登録翻訳部23Aに翻訳対象文書を引き渡す(ステップS7)。
【0035】
登録翻訳部23Aは、ステップS5で設定されたインタフェイスを用いて辞書24を走査しながら翻訳処理を実行し(ステップS8)、得られた翻訳結果を、翻訳部管理部22を介して翻訳サーバ5に返信し、翻訳サーバ5は利用者に対して出力する(ステップS9)。
【0036】
なお、複数の登録翻訳部23A〜23Nが存在する場合、それぞれの登録翻訳部23A〜23Nからの同時辞書走査を行うことになるが、辞書24の更新時以外は読み出しのみであるため、同時使用による障害は起こらない。また、辞書24の更新時は、辞書管理部25での制御、例えばファイルロックやプロセス間の排他制御を行うことにより、コンフリクトを起こすことを防ぐことができる。
【0037】
(A−3)実施形態の効果
以上のように、上記実施形態によれば、辞書サーバ6から翻訳サーバ5への辞書情報の転送ではなく、翻訳サーバ5から辞書サーバ6へ翻訳部(いわゆる翻訳エンジン)そのものを転送させて辞書サーバ6ヘ登録させ、辞書サーバ6内で翻訳部を動作させるようにしたので、ネットワーク(インターネット)上のトラフィックを従来より抑えることができる。
【0038】
因みに、翻訳部(いわゆる翻訳エンジン)のデータ量は、辞書のデータ量に比べて格段に少ない。
【0039】
(B)他の実施形態
上記実施形態の変形実施形態として、以下に例示するようなものを挙げることができる。
【0040】
上記では、辞書サーバ6内に翻訳部を登録した翻訳サーバ5は自己が登録した翻訳部を使用するものを示したが、自己が登録した以外の翻訳部を選択指定して利用することができるようにしても良い。このようにした場合には、異なる訳質の翻訳結果を得ることが可能であり、辞書貸しビジネスだけでなく、翻訳部貸しビジネスも可能となる。
【0041】
また、上記では、辞書サーバ6に複数の翻訳部を同時に登録しておくことができるものを示したが、登録できる翻訳部の数が1個であっても良い。例えば、本発明のシステムを、小規模のLANに適用した場合には、登録数が1個であっても構わない。また、辞書サーバ6に翻訳部を登録し得る翻訳サーバは1個であっても良い。
【0042】
さらに、上記では、辞書サーバ6に翻訳部を登録できる翻訳サーバ5に制約がないものを示したが、翻訳部を登録できる翻訳サーバ5を制約するようにしても良い。
【0043】
さらにまた、上記では、翻訳サーバ5が辞書サーバ6に翻訳部だけを登録できるものを示したが、これに加えて、他の情報をも登録できるようにしても良い。例えば、翻訳サーバ5がユーザ辞書を管理している場合に、翻訳部及びユーザ辞書を辞書サーバ6に登録させるようにしても良い。
【0044】
また、上記では、翻訳部管理部22が翻訳部指示部12より指示を受ける例を示したが、この指示を登録翻訳部23A〜23Nが直接受けるようにしても構わない。
【0045】
さらに、上記では、翻訳部管理部22が、翻訳サーバ5内の翻訳結果受信出力部13に対して翻訳結果を送信するものを示したが、この翻訳結果は利用者たるクライアントへ直接送信するようにしても良く、また、登録翻訳部23A〜23Nが、直接、利用者のクライアントへ送信するようにしても良い。
【0046】
さらにまた、翻訳部管理部22あるいは登録翻訳部23A〜23Nからの翻訳結果が、他の登録翻訳部23A〜23Nを呼び出して、他の翻訳を起動させるようにしても良い。ここでの他の翻訳は、入力文書に対する翻訳であっても良く、また、翻訳結果文書に対するさらに異なる言語種別への翻訳であっても良い。また、翻訳部管理部22あるいは登録翻訳部23A〜23Nからの翻訳結果が、分散システムとして構築された他のサーバ内に存在する翻訳管理部22を呼び出しても良い。
【0047】
また、上記では、機械翻訳システムに本発明を適用したものを示したが、他の自然言語処理システムに対しても本発明を適用することができる。他の自然言語処理システム(例えば文脈認識システム)も、辞書を利用して自然言語処理を行うので、本発明を適用することができる。
【0048】
【発明の効果】
以上のように、本発明の分散型自然言語処理システムによれば、自然言語処理を行うプログラムファイルを搭載している第1の情報処理装置から、自然言語処理で利用される辞書を搭載している第2の情報処理装置へ上記プログラムファイルを送信して、第2の情報処理装置上で自然言語処理を実行させるようにしたので、従来に比べ、両情報処理装置間での通信量を少なくすることができる。
【図面の簡単な説明】
【図1】実施形態に係る辞書共有型機械翻訳システムの概念説明図である。
【図2】従来方法の概念的説明図である。
【図3】実施形態に係る辞書共有型機械翻訳システムの機能的構成を示すブロック図である。
【図4】実施形態に係る辞書共有型機械翻訳システムの動作を示すシーケンス図である。
【符号の説明】
5…翻訳サーバ、5a、6b…翻訳部、6…辞書サーバ、6a、24…辞書、7…ネットワーク(インターネット)、11…翻訳部送信部、12…翻訳実行指示部、13…翻訳結果受信出力部、21…翻訳部登録部、22…翻訳部管理部、23…登録翻訳部、25…辞書管理部。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a distributed natural language processing system, and can be applied to, for example, a dictionary sharing machine translation system in which a plurality of translation servers on a network share a dictionary in a dictionary server.
[0002]
[Prior art]
In machine translation, the contents of a dictionary used for translation greatly affect the quality of translation. Therefore, it is preferable to update frequently in accordance with changes in the natural language. In addition, with the recent improvement of translation technology, the expansion of the translation field and the improvement of expertise, the dictionaries used are steadily growing.
[0003]
Therefore, as shown in FIG. 2, it has been studied and developed that a plurality of machine translation servers (hereinafter simply referred to as translation servers) 1 share a dictionary server 2 on a network (for example, the Internet) 3.
[0004]
The translation server 1 downloads the information of the dictionary 2a of the dictionary server 2 and stores it in the dictionary 1b in the self server 1, and the translation unit 1a performs a translation process using the downloaded dictionary information in the dictionary 1b. Alternatively, the translation unit 1a in the translation server 1 directly accesses the dictionary 2a in the dictionary server 2 and executes the translation process.
[0005]
The latter is effective when a very small number of sentences are translated, but the former is preferable when a document such as a Web page flowing on the Internet is to be translated.
[0006]
[Problems to be solved by the invention]
However, when a plurality of translation servers 1 share the enlarged dictionary 2a as described above on the network 3, there is a problem that enormous traffic is generated when the dictionary is downloaded or searched. Even if the dictionary 2a is divided into categories for each specialized field or genre and the translation server 1 uses only the contents of the dictionary for some categories, the traffic is large.
[0007]
In addition, since the development of the Internet has made it possible to obtain a large number of documents written in foreign languages, the number of translation servers 1 that share the dictionary server 2 will continue to increase. From this point of view, traffic will increase. The challenge is big.
[0008]
Therefore, in the case where a plurality of natural language processing servers share a dictionary server, a distributed natural language processing system that can suppress traffic (communication amount) is desired.
[0009]
[Means for Solving the Problems]
In order to solve this problem, the first aspect of the present invention includes one or a plurality of first information processing apparatuses equipped with a program file for performing natural language processing and a dictionary used in natural language processing. In the distributed natural language processing system having the second information processing apparatus, (1) the first information processing apparatus (1-1) transmits the program file to the second information processing apparatus. A processing execution unit transmitting means; and (1-2) a processing target transmitting means for transmitting a natural language processing target to be processed by the natural language processing to the second information processing apparatus. the information processing apparatus, (2-1) the program files are registered, the relative first natural language processing target supplied from the information processing apparatus, a natural word using the dictionary and registered the program files A registered natural language processing means for performing processing; and (2-2) a process execution unit registration means for registering the program file given from the first information processing apparatus in the registered natural language processing means. And
[0010]
Further, the second aspect of the present invention is a second embodiment in which one or a plurality of first information processing apparatuses having a program file for performing natural language processing and a dictionary used in natural language processing are mounted. In a distributed natural language processing system having an information processing device, (1) the first information processing device (1-1) a process execution unit transmitting means for transmitting the program file to the second information processing device (1-2) processing target transmission means for transmitting the natural language processing target to be processed by the natural language processing to the second information processing apparatus; and (1-3) given from the second information processing apparatus. And (2) the second information processing apparatus, (2-1) the program file is registered and given from the first information processing apparatus. Natural language processing target Against, the dictionary and the registration natural language processing means for performing natural language processing using the registered the program file, (2-2) the first above the program file given from the information processing apparatus registered natural language A processing execution unit registration unit that causes the processing unit to register; and (2-3) a processing result reply unit that returns a natural language processing result by the registered natural language processing unit to the first information processing apparatus. To do.
[0011]
DETAILED DESCRIPTION OF THE INVENTION
(A) Embodiment Hereinafter, an embodiment in which a distributed natural language processing system according to the present invention is applied to a dictionary sharing machine translation system will be described with reference to the drawings. FIG. 1 is an explanatory diagram of the concept of the dictionary sharing machine translation system 4 of this embodiment.
[0012]
Also in the dictionary sharing machine translation system 4 of this embodiment, a plurality of translation servers 5 share a dictionary server 6 on a network (hereinafter referred to as the Internet) 7. In this embodiment, the translation unit 5a in the translation server 5 is uploaded to the dictionary server 6, and the uploaded translation unit 6b in the dictionary server 6 performs translation using the shared dictionary 6a. The translation result obtained in the dictionary server 6 is obtained via the translation server 5.
[0013]
Actually, the translation unit (5a) that executes the translation process includes a software part including a machine translation processing program and data (excluding dictionary data), and the machine translation processing program loaded in the main memory. It consists of a hardware part such as a CPU to be executed, and the uploading of the translation unit 5a described above means uploading of the software part. This is the same in the description to be described later.
[0014]
(A-1) Configuration of Embodiment Next, a specific configuration of the dictionary sharing machine translation system 4 of the embodiment will be described with reference to FIG.
[0015]
Each of the translation server 5 and the dictionary server 6 is constructed by, for example, one or a plurality of information processing apparatuses, but can be functionally illustrated in FIG.
[0016]
In FIG. 3, the translation server 5 includes a translation unit transmission unit 11, a translation execution instruction unit 12, and a translation result reception output unit 13. On the other hand, the dictionary server 6 includes a translation unit registration unit 21, a translation unit management unit 22, a registered translation unit 23 (23A to 23N), a dictionary 24, and a dictionary management unit 25.
[0017]
The translation unit transmission unit 11 of the translation server 5 performs transmission for uploading the translation unit of the translation server 5 to the dictionary server 6. Here, as described above, the transmitted translation unit is a software part made up of a machine translation processing program and data (excluding dictionary data), and is called a translation engine. The translation unit has a function of inputting a translation target document, a function of outputting a translation result, and the like of a transfer function. The transmission of the translation unit by the translation unit transmission unit 11 is copy transmission, and the translation unit exists in the translation server 5 even after transmission.
[0018]
The translation unit transmission unit 11 may transmit the translation unit at a timing when the translation of the document is requested, and when the translation server 5 is started in the translation mode via an input unit (not shown), The translation unit may be transmitted. For example, the translation server 5 also serves as an Internet search server, and when a search with a translation result of a desired document is instructed, the translation unit is uploaded to the dictionary server 6 at the timing of starting the search operation. Also good.
[0019]
The translation execution instructing unit 12 gives the dictionary server 6 a translation execution instruction including the data of the document to be translated (in the case where the dictionary 24 is prepared for each category, the dictionary specific data may be included). Starts the translation process. Naturally, the translation execution instructing unit 12 confirms that the translation unit of the translation server 5 is uploaded to the dictionary server 6 and sends out a translation execution instruction. When the translation unit transmission unit 11 transmits the translation unit including the data of the translation target document, the translation execution instruction unit 12 is omitted.
[0020]
The translation result reception output unit 13 receives the translation result document given from the dictionary server 6 and outputs it to the translation requester. The output method may be display output or print output, or may be transmission output addressed to the information processing terminal of the translation requester.
[0021]
The translation unit registration unit 21 of the dictionary server 6 registers the translation unit given from the translation server 5 in the dictionary server 6 in cooperation with the translation unit management unit 22.
[0022]
In FIG. 3, the part in which the translation unit is registered and the translation process can be executed is called a registered translation unit 23 (23A to 23N). The registered translation unit 23 (23A to 23N) includes a storage area that stores the translation unit (software) and a hardware part such as a CPU that executes program processing according to the translation unit stored in the storage area. It is preferable to prepare a plurality of pairs of storage areas and hardware parts that can be registered translation units 23 so as to be able to respond to translation requests from a plurality of translation servers 5. In addition, only a plurality of storage areas for storing the translation unit (software) are prepared, the hardware part is shared by the plurality of registered translation units 23A to 23N, and each registered translation unit 23A to 23N is divided by time division or the like. It may be made to function as.
[0023]
The translation unit registration unit 21 described above replies that the translation unit 5 cannot be registered in the translation server 5 when all the parts that can be registered translation units function as the registered translation units 23A to 23N.
[0024]
The translation unit management unit 22 manages a part that can be a registered translation unit and a part that functions as the registered translation units 23A to 23N. The translation part management part 22 is, for example, an empty storage area in which a translation part from the translation server 5 can be registered, or a storage area in which the translation part has already been stored. Or the registered translation units 23A to 23N manage whether or not the translation is being executed and the use dictionary.
[0025]
Moreover, the translation part management part 22 delivers the translation object document to the registration translation part 23X (X is A-N) which concerns on the translation server 5, when the translation object document is given from the translation server 5. .
[0026]
Further, when the registered translation unit 23X obtains a translation result document, the translation unit management unit 22 transmits the translation result document to the translation server 5 related to the registered translation unit 23X. Here, the translation unit management unit 22 may return the registered translation unit 23X to a state in which a new translation unit can be registered when the translation result document is transmitted to the translation server 5. This restoration may be performed by setting empty management data in itself or by erasing the entire storage area of the registered translation unit 23X. The registered translation unit 23X may be returned to a state in which a new translation unit can be registered after waiting for a translation unit deletion request from the corresponding translation server 5.
[0027]
Furthermore, the translation unit management unit 22 controls the dictionary management unit 25 so that the registered translation unit 23X can access the shared dictionary 24 when the translation unit is registered. Note that the dictionary management unit 25 is controlled so that the registered translation unit 23X can access only the type of dictionary even when the translation request document includes the specific information of the used dictionary.
[0028]
The dictionary 24 is a dictionary shared by a plurality of registered translation units 23A to 23N, in other words, a dictionary shared by a plurality of translation servers 5. In other words, the dictionary is used by the registered translation units 23A to 23N during translation processing.
[0029]
The dictionary management unit 25 manages which type of dictionary in the dictionary 24 the registered translation units 23A to 23N can use. The registered translation units 23A,. The dictionary 24 is accessed through the network. Further, the dictionary management unit 25 manages from which registered translation unit 23X access is made, and gives word information read from the dictionary 24 to the corresponding registered translation unit 23X. For example, when access to the dictionary 24 from the registered translation units 23A,..., 23N is allocated in a time division manner, the relationship between the time slots and the registered translation units 23A,. In addition, it arbitrates the conflict of dictionary access as appropriate.
[0030]
Note that such a dictionary management method is the same as the conventional management method when a plurality of translation servers try to directly access a dictionary with respect to one dictionary server.
[0031]
(A-2) Operation of Embodiment Next, the operation of the dictionary sharing machine translation system 4 according to the first embodiment will be described with reference to the sequence diagram of FIG.
[0032]
The translation server 5 transmits the translation unit in the self server 5 to the translation unit registration unit 21 of the dictionary server 6 (step S1). The registration transmission operation is, for example, uploading an executable file.
[0033]
The translation unit registration unit 21 provides the received translation unit to the translation unit management unit 22 for buffering (step S2), and then the translation unit management unit 22 vacates a portion (such as a storage area) that can be a registered translation unit. Based on the above, the received translation unit is stored in a free storage area so that it can function as a registered translation unit (reference numeral 23A here) (step S3). Further, the translation unit management unit 22 obtains a dictionary access interface (eg, time slot, call function, and function group entry point in time division access) from the dictionary management unit 25 (step S4), and the registered translation unit. Set to 23A (step S5).
[0034]
If the user inputs a translation target document to the translation server 5 (step S6), the translation server 5 immediately requests the dictionary server 6 to translate, and the translation unit management unit 22 of the dictionary server 6 asks the translation server 5 for translation. The translation target document is delivered to the registered translation unit 23A (step S7).
[0035]
The registered translation unit 23A executes a translation process while scanning the dictionary 24 using the interface set in step S5 (step S8), and the obtained translation result is sent to the translation server via the translation unit management unit 22. 5 is returned to the translation server 5 (step S9).
[0036]
When there are a plurality of registered translation units 23A to 23N, simultaneous dictionary scanning from each registered translation unit 23A to 23N is performed. However, since only reading is performed except when the dictionary 24 is updated, simultaneous use is performed. Will not cause damage. In addition, when the dictionary 24 is updated, conflicts can be prevented by performing control in the dictionary management unit 25, for example, file lock and exclusive control between processes.
[0037]
(A-3) Effects of the Embodiment As described above, according to the above embodiment, the translation unit (so-called translation) is not transferred from the dictionary server 6 to the translation server 5 but from the translation server 5 to the dictionary server 6. The engine) itself is transferred and registered in the dictionary server 6, and the translation unit is operated in the dictionary server 6. Therefore, traffic on the network (Internet) can be suppressed as compared with the conventional technology.
[0038]
Incidentally, the data volume of the translation unit (so-called translation engine) is much smaller than the data volume of the dictionary.
[0039]
(B) Other Embodiments As a modified embodiment of the above embodiment, the following examples can be given.
[0040]
In the above, the translation server 5 in which the translation unit is registered in the dictionary server 6 has been shown to use the translation unit registered by itself. However, a translation unit other than the one registered by itself can be selected and used. You may do it. In this case, it is possible to obtain translation results with different translation qualities, and not only a dictionary lending business but also a translation section lending business is possible.
[0041]
In the above description, a plurality of translation units can be registered in the dictionary server 6 at the same time. However, the number of translation units that can be registered may be one. For example, when the system of the present invention is applied to a small-scale LAN, the number of registrations may be one. Further, the number of translation servers that can register the translation unit in the dictionary server 6 may be one.
[0042]
Further, in the above description, the translation server 5 that can register the translation unit in the dictionary server 6 is not limited, but the translation server 5 that can register the translation unit may be limited.
[0043]
In the above description, the translation server 5 can register only the translation unit in the dictionary server 6. However, in addition to this, other information may be registered. For example, when the translation server 5 manages the user dictionary, the translation unit and the user dictionary may be registered in the dictionary server 6.
[0044]
Moreover, although the translation part management part 22 showed the example which receives the instruction | indication from the translation part instruction | indication part 12 above, you may make it register this translation part 23A-23N receive this instruction | indication directly.
[0045]
Further, in the above description, the translation unit management unit 22 transmits the translation result to the translation result reception output unit 13 in the translation server 5. However, the translation result is transmitted directly to the client as a user. Alternatively, the registered translation units 23A to 23N may directly transmit to the user's client.
[0046]
Furthermore, the translation result from the translation unit management unit 22 or the registered translation units 23A to 23N may call the other registered translation units 23A to 23N to activate other translations. The other translations here may be translations for the input document, or translations of the translation result document into different language types. Moreover, the translation result from the translation part management part 22 or registration translation part 23A-23N may call the translation management part 22 which exists in the other server constructed | assembled as a distributed system.
[0047]
Moreover, although what applied this invention to the machine translation system was shown above, this invention is applicable also to another natural language processing system. Since other natural language processing systems (for example, context recognition systems) perform natural language processing using a dictionary, the present invention can be applied.
[0048]
【The invention's effect】
As described above, according to the distributed natural language processing system of the present invention, a dictionary used in natural language processing is mounted from the first information processing apparatus including a program file for performing natural language processing. Since the program file is transmitted to the second information processing apparatus, and natural language processing is executed on the second information processing apparatus, the amount of communication between the two information processing apparatuses is less than that of the conventional information processing apparatus. can do.
[Brief description of the drawings]
FIG. 1 is a conceptual explanatory diagram of a dictionary sharing machine translation system according to an embodiment.
FIG. 2 is a conceptual explanatory diagram of a conventional method.
FIG. 3 is a block diagram showing a functional configuration of the dictionary sharing machine translation system according to the embodiment.
FIG. 4 is a sequence diagram showing an operation of the dictionary-shared machine translation system according to the embodiment.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 5 ... Translation server, 5a, 6b ... Translation part, 6 ... Dictionary server, 6a, 24 ... Dictionary, 7 ... Network (Internet), 11 ... Translation part transmission part, 12 ... Translation execution instruction part, 13 ... Translation result reception output Section 21: Translation section registration section 22: Translation section management section 23: Registration translation section 25: Dictionary management section

Claims (4)

自然言語処理を行うプログラムファイルを搭載している、1又は複数の第1の情報処理装置と、自然言語処理で利用される辞書を搭載している第2の情報処理装置とを有する分散型自然言語処理システムにおいて、
上記第1の情報処理装置が、
上記プログラムファイルを上記第2の情報処理装置に送信する処理実行部送信手段と、
上記自然言語処理の対象となる自然言語処理対象を上記第2の情報処理装置に送信する処理対象送信手段とを備え、
上記第2の情報処理装置が、
上記プログラムファイルが登録されて、上記第1の情報処理装置から与えられた自然言語処理対象に対し、上記辞書及び登録された上記プログラムファイルを利用した自然言語処理を行う登録自然言語処理手段と、
上記第1の情報処理装置から与えられた上記プログラムファイルを上記登録自然言語処理手段に登録させる処理実行部登録手段とを備える
ことを特徴とする分散型自然言語処理システム。
Distributed nature having one or a plurality of first information processing devices having a program file for performing natural language processing and a second information processing device having a dictionary used for natural language processing In the language processing system,
The first information processing apparatus is
Processing execution unit transmitting means for transmitting the program file to the second information processing apparatus;
Processing target transmission means for transmitting the natural language processing target to be processed by the natural language processing to the second information processing apparatus;
The second information processing apparatus is
Registered natural language processing means for registering the program file and performing natural language processing using the dictionary and the registered program file on the natural language processing target given from the first information processing apparatus;
A distributed natural language processing system, comprising: a process execution unit registration unit that registers the program file provided from the first information processing apparatus in the registered natural language processing unit.
自然言語処理を行うプログラムファイルを搭載している、1又は複数の第1の情報処理装置と、自然言語処理で利用される辞書を搭載している第2の情報処理装置とを有する分散型自然言語処理システムにおいて、
上記第1の情報処理装置が、
上記プログラムファイルを上記第2の情報処理装置に送信する処理実行部送信手段と、
上記自然言語処理の対象となる自然言語処理対象を上記第2の情報処理装置に送信する処理対象送信手段と、
上記第2の情報処理装置から与えられた自然言語処理結果を出力する結果出力手段とを備え、
上記第2の情報処理装置が、
上記プログラムファイルが登録されて、上記第1の情報処理装置から与えられた自然言語処理対象に対し、上記辞書及び登録された上記プログラムファイルを利用した自然言語処理を行う登録自然言語処理手段と、
上記第1の情報処理装置から与えられた上記プログラムファイルを上記登録自然言語処理手段に登録させる処理実行部登録手段と、
上記登録自然言語処理手段による自然言語処理結果を上記第1の情報処理装置に返信する処理結果返信手段とを備える
ことを特徴とする分散型自然言語処理システム。
Distributed nature having one or a plurality of first information processing devices having a program file for performing natural language processing and a second information processing device having a dictionary used for natural language processing In the language processing system,
The first information processing apparatus is
Processing execution unit transmitting means for transmitting the program file to the second information processing apparatus;
Processing target transmission means for transmitting the natural language processing target to be processed by the natural language processing to the second information processing apparatus;
A result output means for outputting a natural language processing result given from the second information processing apparatus;
The second information processing apparatus is
Registered natural language processing means for registering the program file and performing natural language processing using the dictionary and the registered program file on the natural language processing target given from the first information processing apparatus;
Processing execution unit registration means for registering the program file given from the first information processing apparatus in the registered natural language processing means;
A distributed natural language processing system comprising: processing result return means for returning a natural language processing result by the registered natural language processing means to the first information processing apparatus.
上記登録自然言語処理手段として複数を設定可能なことを特徴とした請求項1又は2に記載の分散型自然言語処理システム。  The distributed natural language processing system according to claim 1, wherein a plurality of registered natural language processing means can be set. 上記自然言語処理が機械翻訳であることを特徴とする請求項1〜3のいずれかに記載の分散型自然言語処理システム。  The distributed natural language processing system according to claim 1, wherein the natural language processing is machine translation.
JP2000281256A 2000-09-13 2000-09-18 Distributed natural language processing system Expired - Lifetime JP3982984B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000281256A JP3982984B2 (en) 2000-09-18 2000-09-18 Distributed natural language processing system
US09/948,935 US20040205671A1 (en) 2000-09-13 2001-09-10 Natural-language processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000281256A JP3982984B2 (en) 2000-09-18 2000-09-18 Distributed natural language processing system

Publications (2)

Publication Number Publication Date
JP2002091964A JP2002091964A (en) 2002-03-29
JP3982984B2 true JP3982984B2 (en) 2007-09-26

Family

ID=18765942

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000281256A Expired - Lifetime JP3982984B2 (en) 2000-09-13 2000-09-18 Distributed natural language processing system

Country Status (1)

Country Link
JP (1) JP3982984B2 (en)

Also Published As

Publication number Publication date
JP2002091964A (en) 2002-03-29

Similar Documents

Publication Publication Date Title
US6370687B1 (en) Network computer system and substitute compile server
US7496497B2 (en) Method and system for selecting web site home page by extracting site language cookie stored in an access device to identify directional information item
RU2349953C2 (en) Translation of documents for network printing on client
CN111901294A (en) Method for constructing online machine learning project and machine learning system
RU2358306C2 (en) Substitution after caching
JP2001228987A (en) Information processing method, computer readable memory and printer
JP3737779B2 (en) Translation server, translation method and program
JPH10307818A (en) Document translation system, its method and recording medium recording document translating program
US20040268256A1 (en) Program, character inputting and editing method, apparatus and storage medium
USRE45021E1 (en) Method and software for processing server pages
JP2000207150A (en) Printing system
US20020062354A1 (en) Method and apparatus for dynamic shared-memory caching of scripting engine product
JP3982984B2 (en) Distributed natural language processing system
US7162490B2 (en) Method for processing dynamic database in distributed processing system based on corba platform
JP2002358229A (en) Cache device and computer program
JP3102453B2 (en) Page description language parallel processing printing system
JP2000284926A (en) Print processing system and its method
JP2008059460A (en) Information processor, information designation device, information designation processing system, information designation processing management system, information processing program, and information designation program
JP2001202316A (en) Device, system and method for processing information and storage medium
CN117194827B (en) CDN directory refreshing method and electronic equipment
US10929499B2 (en) System for loading software modules
CN113110913B (en) Mirror image management system, method and computing device
JP2000194613A (en) Data transfer optimization system and method for client- server system
US11755534B2 (en) Data caching method and node based on hyper-converged infrastructure
JPH1021158A (en) Data processor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070424

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070703

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100713

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150