JPH10187731A - 多言語対応通信システム - Google Patents

多言語対応通信システム

Info

Publication number
JPH10187731A
JPH10187731A JP8339597A JP33959796A JPH10187731A JP H10187731 A JPH10187731 A JP H10187731A JP 8339597 A JP8339597 A JP 8339597A JP 33959796 A JP33959796 A JP 33959796A JP H10187731 A JPH10187731 A JP H10187731A
Authority
JP
Japan
Prior art keywords
language
document
document data
client device
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8339597A
Other languages
English (en)
Inventor
Atsushi Kawai
淳 河合
Atsuhiko Kurachi
敦彦 倉知
Norihisa Fujii
則久 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP8339597A priority Critical patent/JPH10187731A/ja
Publication of JPH10187731A publication Critical patent/JPH10187731A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 クライアント装置に特別な言語翻訳プログラ
ムを必要とせず、かつ多数の言語で記述される文書デー
タをより簡易に提供可能な多言語対応通信システムを提
供することである。 【解決手段】 自然言語により記述された原文書データ
がサーバー装置102に入力されると、サーバー装置102
は、その原文書データを特定の自然言語である共通言語
に翻訳し、共通言語文書データとして記憶する。そし
て、クライアント装置103から文書データの要求がある
と、その文書データに対応した共通言語文書データを記
憶装置から読み出し、読み出した共通言語文書データか
らクライアント装置103が要求する自然言語で記述され
た文書データを生成し、生成された文書データをクライ
アント装置103に送信する。

Description

【発明の詳細な説明】
【発明の属する技術分野】本発明は、翻訳機能を持つこ
とで所望される言語による文書データを提供する事が可
能な多言語対応通信システムに関する。
【従来の技術】従来、インターネットに代表されるよう
に、通信ネットワークを介して、文書データを検索、閲
覧するシステムが普及している。この様なシステムは、
各種の文書データを記憶する1つ以上のサーバー装置
と、文書データの表示が可能な1つ以上のクライアント
装置と、それらを接続する通信ネットワークとで構成さ
れる。通信ネットワークは、公衆回線網や、専用回線網
あるいはその組み合わせから構成される。サーバー装置
は、各種の文書データが記憶できる記憶装置と、通信ネ
ットワークへの接続装置とを備え、クライアント装置は
文書データを表示可能な表示装置と、閲覧したい文書の
指示情報を入力できる入力装置と、通信ネットワークへ
の接続装置とを備える。例えば、インターネットでは、
サーバー装置、クライアント装置共に非常に多くの装置
が接続されており、その所在地も全世界に広がってい
る。そしてそれらを接続する通信ネットワークを介して
世界各地の様々な情報を、検索、閲覧することが可能な
システムとなっている。このようなインターネットで
は、図14に示すように、各サーバー装置1202には、英
語とか、日本語、中国語等の様々な言語で記述された文
書データが記憶されている。通信ネットワーク1201を介
してサーバー装置に接続されているクライアント装置12
03では、これらの様々な言語で記述された文書データを
それぞれの言語で表示することが可能である。また、言
語翻訳プログラムを内蔵するクライアント装置もあり、
必要に応じて所望の言語に翻訳して文書データを表示す
ることも可能である。
【発明が解決しようとする課題】上述したシステム、特
にインターネットのように全世界に広がったネットワー
クを介して様々な文書データを閲覧する場合、文書デー
タの提供者と、その文書データの閲覧者とは異なる言語
を母国語としていることが多い。しかし、母国語以外の
言語での記述や、その理解には困難を伴うことが多い。
これを解決するため、次の2つの方法が知られている。
1つは、同一内容の文書を複数の言語で記述された複数
の文書データとしてサーバー装置に記憶させ、所望の言
語の文書データをクライアント装置から選択すること
で、所望の言語で記述された文書データを閲覧可能とす
る方法である。他の方法は、言語翻訳プログラムをクラ
イアント装置に搭載し、その言語翻訳プログラムを用い
てサーバーから送信されてきた文書データを所望する言
語の文書データに翻訳する方法である。これらの方法に
より、母国語以外の言語で記述された文書データも母国
語で閲覧可能となる。しかし、その場合でも以下のよう
な問題が残されている。まず、同一内容の文書を複数の
言語で記述された複数の文書データとしてサーバー装置
に記憶させる方法では、1つの内容の文書でも、その内
容を様々な言語で記述された複数の文書データとして作
成する必要があり、多くの費用と労力を必要とする問題
がある。また、言語翻訳プログラムをクライアント装置
に搭載する方法では、各サーバーにより提供される様々
な言語の文章をすべて翻訳して表示するためには、クラ
イアント装置にそれぞれの言語から所望の言語へ翻訳可
能な多数の言語翻訳プログラムを搭載する必要がある。
これはクライアント装置のコストを上昇させる。また、
現在実用化されている言語翻訳プログラムでは、翻訳す
る原文書に元来含まれている曖昧さにより、望ましい翻
訳結果が得られないと言う問題もある。本発明は、上述
した問題点を解決するためになされたものであり、クラ
イアント装置に特別な言語翻訳プログラムを必要とせ
ず、かつ多数の言語で記述される文書データをより簡易
に提供可能な多言語対応通信システムを提供することを
目的とする。
【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1記載の多言語対応通信システム
は、所望とする文書データを受信可能なクライアント装
置と、そのクライアント装置からの要求に応じた前記文
書データを前記クライアント装置に送信するサーバー装
置とから構成される。前記クライアント装置では、要求
情報送信手段が所望の文書データを特定可能な文書識別
情報と、その文書データの記述言語を指定する要求言語
情報とを前記サーバー装置に送信し、受信出力手段が前
記サーバー装置から文書データを受信し表示出力、印字
出力、音声出力等の出力処理を行う。前記サーバー装置
では、原文書入力手段で所定の自然言語で記述された原
文書データを入力し、原文書翻訳手段が、原文書入力手
段で入力した原文書データを特定の自然言語である共通
言語に翻訳することで共通言語文書データが生成され、
共通言語文書記憶手段が共通言語文書データを記憶す
る。さらに、前記サーバ装置では、要求情報受信手段が
前記クライアント装置から文書識別情報と、要求言語情
報とを受信し、文書読み出し手段が文書識別情報に対応
した共通言語文書データを前記共通言語記憶手段から読
み出し、目標言語文書生成手段が前記文書読み出し手段
で読み出した共通言語文書データから、要求言語情報に
対応した言語で記述した目標言語文書データを生成し、
文書送信手段が前記目標言語文書生成手段で生成された
目標言語文書データを前記クライアント装置に送信す
る。このように、クライアントから所望の記述言語を指
定でき、それに従って特定の自然言語である共通言語で
記憶された共通言語文書データから指定された自然言語
で記述された目標文書データを生成し、クライアント装
置で出力できるので、サーバー装置に多数の言語で記述
した文書データを保存したり、クライアント装置に言語
翻訳プログラムを搭載することなく、所望の言語で表記
された文書データの閲覧が可能となる。さらに、サーバ
ー装置で所定の言語で記述された文書データを共通言語
文書に翻訳してから記憶するため、翻訳時に原文書に含
まれる曖昧さが排除されるので、クライアント装置に出
力するために生成される自然言語文書への翻訳精度が上
がり、望ましい翻訳が為された自然言語文書が得られる
ようになる。
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。図1に本発明の多言語対応
通信システムの概念図を示す。サーバー装置102は共通
言語として英語を用いており、英語で記述された文書を
共通言語文書データとして記憶している。また、共通言
語文書データから、目標となる自然言語(以下、目標言
語と呼ぶ)で記述された文書データを生成するための目
標言語文書生成プログラムも記憶している。クライアン
ト装置103は、通信ネットワーク101を介して、文書デー
タの指示情報と、その文書データの記述言語の指示情報
とからなる要求情報を所望のサーバー装置102に送信す
る。サーバー装置102は、クライアント装置103から送信
された要求情報に基づいて、指定された共通言語文書デ
ータから指定された自然言語による文書データを生成
し、生成した文書データを通信ネットワーク101を介し
てクライアント装置103に送信する。そしてクライアン
ト装置はその文書データを受信し、表示出力、印字出
力、音声出力等の出力を行う。なお、本実施の形態では
共通言語として英語を用いるものとするが、日本語、独
語等、どのような自然言語であっても構わない。図2に
本発明を好適に適用したサーバー装置のブロック図を示
す。サーバー装置102は、ROM202、RAM203、CPU204、表
示制御部205、入力部206、通信制御部207及びそれらを
接続するバス209より構成される。CPU204は、記憶され
ている各種のプログラムに基づいて様々な制御を実行
し、本サーバー装置102の動作の主体をなしている。表
示制御部205は、表示データの蓄積とディスプレイモニ
ターの制御を行い、モニター208に表示出力を行う。モ
ニター208は、CRTディスプレイや、LCDディスプレイな
ど様々な表示装置を利用できる。入力部206は、記憶さ
れる文書データの入力や、サーバー装置102への指示を
入力するためのものであり、キーボード装置である。通
信制御部207は、通信網210と接続される。通信網210
は、公衆回線や、専用回線の回線網であり、通信ネット
ワーク101の構成要素である。通信制御部207は、通信網
210とサーバー装置102とのデータ通信を制御し、データ
の送受信を行う。通信制御部207は、公衆回線や専用回
線と接続するためのモデム装置である。なお、入力部20
6は、上記の構成以外に、マウス装置などの指示装置
や、音声入力装置、タッチパネル装置などの様々な入力
装置や、それらの組み合わせで構成してもよい。また、
通信制御部207は、無線の公衆回線や専用回線と接続す
るための送受信装置とか、LAN(Local Area Network)に
接続するためのイーサーネット接続装置、トークンリン
グ接続装置とか、ATM(Asynchronous Transfer Mode)回
線網への接続装置等、様々な接続装置でもよい。ROM202
は各種プログラムや、翻訳辞書のデータ等を記憶してい
る。ROM202内にはさらに各種の記憶部が形成されてい
る。通信制御プログラム記憶部202aは、通信制御部207
を介した各種通信の制御や、クライアント装置からの文
書データ要求の受信や、生成された文書データのクライ
アント装置への送信処理等を行う通信制御プログラムを
記憶している。通信制御プログラムと、通信制御部207
とが本発明の要求情報受信手段と、文書送信手段との主
体をなす。目標言語文書生成プログラム記憶部202bは、
共通言語文書データから各種の目標言語文書データを生
成するための、目標言語文書生成プログラムを記憶す
る。なお、目標言語文書生成プログラムが本発明の目標
言語文書生成手段の主体をなす。本実施の形態では、生
成する文書の目標言語の種類に応じて目標言語文書生成
プログラムが別になっているものとし、目標言語文書生
成プログラム記憶部202bは、生成する文書の目標言語に
応じた少なくとも1つの目標言語文書生成プログラムを
記憶する。なお、上記以外に、各目標言語に対応した別
々の目標言語文書生成プログラムを用いるのではなく、
すべての目標言語に対応できる単一の目標言語文書生成
プログラムを用い、目標言語文書生成プログラム記憶部
202bはその単一の目標言語文書生成プログラムを記憶し
てもよい。あるいは、言語構造として類似した複数の目
標言語に対応可能な目標言語文書生成プログラムを用
い、それを記憶してもよい。共通言語翻訳プログラム記
憶部202cは、所定の自然言語で記述された文書データ
を、共通言語に翻訳する共通言語翻訳プログラムを記憶
する。なお、共通言語翻訳プログラムが本発明の原文書
翻訳手段の主体をなす。文書管理プログラム記憶部202d
は、共通言語文書データ記憶部203dに対して共通言語文
書データを保存、読み出し、あるいは、検索を行うとき
の主体となる文書管理プログラムを記憶する。文書管理
プログラムが、本発明の文書読み出し手段の主体をな
す。翻訳辞書記憶部202eは、目標言語文書生成プログラ
ムが処理を行う場合に必要とされる、目標言語に対応し
た形態素解析辞書、構文規則データ、構文解析辞書、依
存規則データ、生成規則データなどの各種データを記憶
している。さらに翻訳辞書記憶部202eは、共通言語文書
データ作成プログラムが処理を行う場合に必要とされる
形態素解析辞書、構文規則データ、構文解析辞書、依存
規則データなどの各種データも記憶している。なお、RO
M202は、ROMに限らず、磁気ディスク装置や、光磁気デ
ィスク装置、あるいはCD-ROM記憶装置等の記憶装置であ
ってもよい。RAM203は、共通言語文書データ等のデータ
の保存や、様々な一時データを記憶するために使用さ
れ、次のような各記憶部が内部に形成されている。ワー
クメモリ203aは各プログラムが動作時に必要とする一時
的な記憶領域を提供する。生成文書メモリ203bは、共通
言語文書データ記憶部203dに記憶された共通言語文書デ
ータに基づいて、目標言語文書生成プログラム記憶部20
2bに記憶された目標言語文書生成プログラムが生成した
目標言語文書データを一時的に記憶する。原文書メモリ
203cは、共通言語文書作成プログラムの入力データとな
る、所定の自然言語で記述された文書データ(以下、原
文書データと呼ぶ)を記憶する。原文書データは入力部2
06や、通信制御部207を介して入力される。共通言語文
書データ記憶部203dは、共通言語翻訳プログラムが翻訳
する共通言語文書データを記憶する。入力部206、通信
制御部207が、本発明の原文書入力手段の主体を、共通
言語文書データ記憶部203dが、共通言語文書記憶手段の
主体をそれぞれなすものである。なお、RAM203は、RAM
に限らず、磁気ディスク装置や、光磁気ディスク装置等
の記憶装置であってもよい。次に、図3に、本発明を好
適に適用したクライアント装置のブロック図を示す。ク
ライアント装置103は、ROM302と、RAM303、CPU304、表
示制御部305、入力部306、通信制御部307及びそれらを
接続するバス309より構成される。CPU304は、記憶され
ている各種のプログラムに基づいて様々な制御を実行
し、本クライアント装置103の動作の主体をなしてい
る。表示制御部305は、表示データの蓄積とディスプレ
イモニターの制御を行い、モニター308に表示出力を行
う。モニター308は、CRTディスプレイや、LCDディスプ
レイなど様々な表示装置を利用できる。入力部306は、
文書データの文書識別情報や、要求言語情報などを入力
したり、クライアント装置103への各種指示を入力する
ためのものであり、キーボード装置である。通信制御部
307は、通信網210と接続され、通信網210とクライアン
ト装置103とのデータ通信を制御し、データの送受信を
行う。通信制御部307は公衆回線や、専用回線と接続す
るためのモデム装置である。なお、入力部306は、上記
の構成以外に、マウス装置などの指示装置や、音声入力
装置、タッチパネル装置などの様々な入力装置や、その
組み合わせで構成してもよい。また、通信制御部307
は、無線の公衆回線や専用回線と接続するための送受信
装置とか、LANに接続するためのイーサーネット接続装
置、トークンリング接続装置とか、ATM回線網への接続
装置等、様々な接続装置でもよい。ROM302は各種プログ
ラムを記憶している。ROM302内にはさらに各種の記憶部
が形成されている。通信制御プログラム記憶部302aは、
通信制御部307を介した各種通信の制御や、サーバー装
置へのデータ送受信処理等を行う通信制御プログラムを
記憶している。この通信制御プログラムと、通信制御部
307とが本発明の要求情報送信手段の主体をなす。表示
プログラム記憶部302bは、サーバーから受信した文書デ
ータを表示制御部305を用いて表示するための表示プロ
グラムを記憶している。表示プログラムと、表示制御部
305と、通信制御プログラムと、通信制御部307とが本発
明の受信出力手段の主体をなす。要求情報入力プログラ
ム記憶部302cは、ユーザーが入力部306を用いて、所望
する文書データの文書識別情報と、要求言語情報とを入
力する処理を制御するための、要求情報入力プログラム
を記憶する。なお、ROM302は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。RAM303は、様々な一
時データを保存するために使用され、次のような各記憶
部が内部に形成されている。ワークメモリ303aは各プロ
グラムが動作時に必要とする一時的な記憶領域を提供す
る。受信文書メモリ303bは、サーバー装置から受信した
文書データを一時保存する。なお、RAM303は、RAMに限
らず、磁気ディスク装置や、光磁気ディスク装置等の記
憶装置であってもよい。次に、サーバー装置102と、ク
ライアント装置103との基本的な処理の流れを図4を用
いて説明する。まず、クライアント装置103では、所望
する文書データの指示情報の入力処理を行う(S401、Sは
ステップを示す。以下同様)。次に、入力した指示情報
からその文書データが所在するサーバー装置を通信ネッ
トワーク上で一意に決定する情報である、サーバー装置
のアドレスを取得する(S402)。本実施の形態では、サー
バー装置のアドレスとしてTCP/IP(Transmission Contro
l Protocol/Internet Protocol)で規定されるホスト名
あるいはIPアドレスを用いるものとするが、他に通信ネ
ットワーク上のアドレスを決定できる情報であれば何で
もよい。次に、所望する文書データ指示情報から、その
文書データのサーバー装置内での指示情報である文書識
別情報を決定する(S403)。次に、所望する文書データが
どの自然言語によって記述されるかを指定する要求言語
の情報を決定する(S404)。次に、決定された文書識別情
報と、要求言語情報とをS402で決定されたアドレスのサ
ーバー装置に送信する(S405)。本実施の形態では、サー
バー装置への送信方法として、TCP/IP上のHTTP(Hyper T
ext Transfer Protocol)を用いるとする。具体的にはク
ライアント装置は、図5(a)に示す形式のデータをサー
バー装置に送信する。"GET"はデータ要求を意味し、<文
書識別情報>にはS403で決定された文書識別情報を指定
する。<バージョン情報>はHTTPのバージョン情報を指定
し、<CRLF>は復帰改行文字を示す。<各種ヘッダー情報>
にはHTTPで規定されたヘッダー情報を必要に応じて指定
する。“Accept-Language:"は次に要求言語情報が続く
ことを示す文字列であり、<要求言語>には要求言語を識
別するあらかじめ定められた文字列を指定する。図5
(b)は文書識別情報として"/pub/sample.html"、HTTPバ
ージョンが1.0、日本語を要求言語とした場合の例であ
る。なお、上述したTCP/IPおよびHTTPは、すでに広く実
用化された公知の技術であるため、説明を省略する。サ
ーバー装置では、S405でクライアント装置から送信され
た要求文書の文書識別情報と、要求言語情報を受信し(S
408)、受信した情報に基づいて所望の自然言語による所
望の文書データを生成するために、文書データ生成処理
を実行する(S409)。S409の詳細は後述する。S409にて所
望の自然言語による所望の文書データを生成できない場
合は、それをエラーと判定する(S410)。本実施の形態で
は、このエラーの判定は後述するエラーフラグを参照す
ることで判定する。エラーでなければ生成した文書デー
タをクライアントに送信し(S411)、エラーならばエラー
情報を送信する(S412)。クライアントではサーバーから
文書データもしくはエラー情報を受信し(S406)、表示装
置に表示する(S407)。次に、文書データ生成処理(S409)
の詳細について、図6を用いて説明する。まず、エラー
状態を記憶するために、ワークメモリ203a内に形成され
たエラーフラグ(図示せず)をクリアして、エラーなしの
状態とする(S601)。次に、文書識別情報で指定された文
書データの有無を判定し(S602)、もし、該当する文書デ
ータがサーバー装置内に存在しない場合は(S602:No)、
エラーとするためにS607に処理を進め、存在した場合は
(S602:Yes)、S603に処理を進める。S603では、文書管理
プログラムが、クライアントから送信された文書識別情
報で指示された共通言語文書データを、共通言語文書デ
ータ記憶部203dから検索して、ワークメモリ203aに読み
込む。本実施の形態においては、共通言語文書データ記
憶部203dで記憶される共通言語文書データは、それぞれ
の共通言語文書データが1つのファイルに対応するもの
とし、文書データを指定する文書識別情報としては、共
通言語文書データを収納しているファイル名を用いるも
のとする。この場合は、文書識別情報で示されたファイ
ル名のファイルが存在するか否かでS602の判定を行い、
S603では文書管理プログラムがそのファイルのデータを
ワークメモリ203aに読み込むこととなる。なお、文書識
別情報としてファイル名を用いる方法以外に、文書管理
プログラムとしてデータベース管理プログラムを用い、
共通言語文書データ記憶部203dとしてデータベースの記
憶領域を対応させ、文書識別情報としてデータベース内
の文書データを特定可能な指示情報を用いてもよい。次
に、読み出した共通言語文書データをS408にて受信した
要求言語情報に基づいた目標言語に翻訳可能か否かを判
定する(S604)。本実施の形態では、前述したように各目
標言語毎に個別の目標言語文書生成プログラムを持つの
で、S408にて受信した要求言語情報に対応した目標言語
文書生成プログラムが目標言語文書生成プログラム記憶
部202bに記憶されているか否かで、S604の判定を行う。
S605では、読み込んだ共通言語文書データから目標言語
文書データを生成する、目標言語文書生成処理を実行す
る。S605の詳細は後述する。S606では、S605にて生成さ
れた目標言語文書データを、送信のために一旦生成文書
メモリ0203bに記憶する。S607では、S602とS604での判
定を受けて、エラー処理をするためにエラーフラグをセ
ットしてエラー状態を記憶する。次に、本発明の原文書
翻訳手段の主体をなす共通言語翻訳プログラムの処理の
詳細を、図7、図8、図9を用いて説明する。まず、入
力部206より、所定の自然言語で記述された文書データ
を入力する(S701)。入力された文書データは、一旦原文
書メモリ203cに保存される(S702)。この文書データが原
文書データとして処理される。原文書データは、まず形
態素解析処理を受ける(S703)。S703では、翻訳辞書記憶
部202eに記憶された形態素解析辞書を参照し、原文書を
形態素に分割し、形態素列に変換し、各形態素の品詞の
判定を行う。日本語文書から共通言語文書データとして
英語文書を生成する一例を挙げれば、図8(a)に示す原
文書であれば、形態素解析処理により図8(b)のような
形態素列からなる形態素解析結果が得られる。次に、構
文解析処理を行う(S704)。S704では、S703で解析された
品詞情報を含む形態素列に、翻訳辞書記憶部202eに記憶
された構文規則データと、構文解析辞書の情報を適用
し、各形態素間の修飾関係を解析すると共に、格の意味
的な役割を決定し、構文解析木を形成する。たとえば、
図8(b)のような形態素解析結果は、図8(c)で示される
構文解析木からなる構文解析結果を得る。なお、「S」
は文を、「NP」は名詞句を、「ADV」は副詞を、「VP」
は動詞句をそれぞれ表す。ここで、S701で入力される原
文書に曖昧な表現が含まれており、原文書の構文解析結
果が一つに決められない場合があるが、その場合S704で
は可能性のある複数の構文解析木を形成する。例えば、
図13(a)のような原文が入力されたとすると、「大き
い耳の可愛いウサギ」は、図13(b)の「耳が可愛い」
「ウサギが大きい」場合と、図13(c)の「耳が大き
い」「ウサギが可愛い」場合の2通りの解釈ができ、ど
ちらであるかは原文からは判断できない。そこで、S704
では図13(b)と図13(c)の2つの解析結果を形成す
る。そして、S705で原文に曖昧さが含まれているか否か
の判定を、S704の構文解析結果が複数あるかによって行
う。そして、複数ある場合は(S705:Yes)構文解析候補の
選択処理を行うためにS710に処理を進め、1つしか無い
場合には(S705:No)、そのまま依存構造解析処理を行う
ためS706に処理を進める。S710では、構文解析候補に番
号を付けて、表示制御部205を使ってモニター208に表示
させる。そして入力部206から番号が入力されると、そ
の番号のついた構文解析結果を採用して依存構造解析処
理(S706)に移る。図13の例の場合、図13(b)と図1
3(c)をそれぞれNo.1、No.2として表示し、サーバ装置1
02の操作者に選択を促す。そして、入力部206によって
操作者の番号選択が行われた結果、構文解析処理の結果
が1つに決定されるため、以降の処理で原文書の曖昧さ
から文書の作成者が意図していない内容の翻訳が為され
ることは無い。次に、依存構造解析処理を行う(S706)。
S706では、S704の解析結果である構文解析木に基づき依
存構造を形成する。図8(c)の構文解析結果に対して依
存構造解析処理を行うと、図9(a)のような依存構造が
得られる。ここで、「PRED」は述部を、「NOM」は依存
構造名詞句を、「ADV」は副詞をそれぞれ表す。次に、
構文生成処理を行う(S707)。S707では、S706で形成され
た依存構造に基づいて、生成規則データを参照しつつ目
標言語の構文木を生成し、語順を決定する。次に、形態
素生成処理を行い(S708)、単語の語尾等を必要に応じて
変化させ、共通言語文書データの生成を完了し、その共
通言語文書データを言語文書データ記憶部203dに保存す
る(S709)。共通言語が英語である本実施の形態では、図
9(a)で示される依存構造の文に対し、構文生成処理
と、形態素生成処理の処理を行うと、図9(b)に示され
るような共通言語翻訳結果が得られることとなる。ここ
で、「PRON」は代名詞、「V」は動詞、「ART」は冠詞、
「N」は名詞をそれぞれ表す。そして、S708で得られた
図9(b)の翻訳結果の末端に並ぶ単語列からなる、図9
(c)に示される文を共通言語文書データとして共通言語
文書データ記憶部203dに保存する(S709)。こうしてS708
で生成された共通言語の文書は、S705、S710で曖昧さを
排除された、単一の解釈が得られる原文書の作成者の意
図を正しく伝える文書となる。そして、後述の目標言語
文書生成処理においては、この共通言語文書を元に目標
言語文書の生成を行うため、生成される目標言語文書も
原文書の作成者の意図を正確に伝えられるものとなる。
次に、S605の目標言語文書生成処理の詳細を、図10、
図11、及び図12を用いて説明する。目標言語文書生
成処理は、本発明の目標言語文書生成手段の主体をなす
目標言語文書生成プログラムが行う処理である。まず、
S603にてワークメモリ203aに読み込まれた共通言語文書
データに対し、まず形態素解析処理を行う(S1001)。S10
01では、翻訳辞書記憶部202eに記憶された形態素解析辞
書を参照し、原文書を形態素に分割し、形態素列に変換
し、各形態素の品詞の判定を行う。共通言語文書データ
である英語文書から日本語文書を生成する一例を挙げれ
ば、図11(a)に示す共通言語文であれば、形態素解析
処理により図11(b)のような形態素列からなる形態素
解析結果が得られる。次に、構文解析処理を行う(S100
2)。S1002では、S1001で解析された品詞情報を含む形態
素列に、翻訳辞書記憶部202eに記憶された構文規則デー
タと、構文解析辞書の情報を適用し、各形態素間の修飾
関係を解析すると共に、格の意味的な役割を決定し、構
文解析木を形成する。たとえば、図11(b)のような形
態素解析結果は、図11(c)で示される構文解析木から
なる構文解析結果を得る。ここで、「S」は文を、「N
P」は名詞句、「VP」は動詞句、「PP」は前置詞句
を、「PRON」は代名詞、「AUX」は助動詞、
「V」は動詞、「PREP」は前置詞、「ART」は冠
詞、「N」は名詞をそれぞれ表す。次に、依存構造解析
処理を行う(S1003)。S1003では、S1002の解析結果であ
る構文解析木に基づき依存構造を形成する。図11(c)
の構文解析結果に対して依存構造解析処理を行うと、図
12(a)のような依存構造が得られる。ここで、「PRE
D」は述部を、「NOM」は依存構造名詞句をそれぞれ表
す。次に、構文生成処理を行う(S1004)。S1004では、S1
003で形成された依存構造に基づいて、生成規則データ
を参照しつつ目標言語の構文木を生成し、語順を決定す
る。次に、形態素生成処理を行い(S1005)、単語の語尾
等を必要に応じて変化させ、目標言語文書データの生成
を完了する。図12(a)で示される依存構造の文に対
し、構文生成処理と、形態素生成処理の処理を行うと、
図12(b)に示されるような目標言語文生成結果が得ら
れることとなる。S1005で得られた図12(b)の翻訳結果
の末端に並ぶ単語列からなる、図12(c)に示される文
が生成された目標言語文書データである。なお、本実施
の形態に関わる前記の形態素解析処理、構文解析処理、
依存構造解析処理、構文生成処理、及び形態素生成処理
のそれぞれは、電子技術総合研究所と京都大学による
「日英科学技術文献の速報システムに関する研究−言語
処理システムの開発に関する報告書」や、特開昭62-203
273号公報に開示されている公知の技術である。
【発明の効果】以上説明したことから明らかなように、
本発明の請求項1記載の多言語対応通信システムは、ク
ライアントから所望の記述言語を指定でき、それに従っ
て共通言語文書データの形式で記憶された文書データか
ら自然言語で記述された文書データを生成し、クライア
ント装置で出力できるので、サーバー装置に多数の言語
で記述した文書データを保存したり、クライアント装置
に言語翻訳プログラムを搭載することなく、所望の言語
で表記された文書データの閲覧が可能となる。さらに、
サーバー装置では、自然言語で記述された原文書データ
を共通言語に翻訳して得られる共通言語文書データを記
憶するため、原文書データに含まれる意味的な曖昧さが
共通言語文書データにおいて排除されるので、クライア
ント装置に出力するために生成される自然言語文書への
翻訳精度が向上し、より望ましい翻訳が為された自然言
語文書を得ることができる。
【図面の簡単な説明】
【図1】本実施の形態の多言語対応通信システムの概要
を示す説明図である。
【図2】本実施の形態のサーバー装置のブロック図であ
る。
【図3】本実施の形態のクライアント装置のブロック図
である。
【図4】本実施の形態のサーバー装置とクライアント装
置の処理の流れを示すフローチャートである。
【図5】本実施の形態の文書識別情報と要求言語情報と
の説明図である。
【図6】本実施の形態の文書データ生成処理のフローチ
ャートである。
【図7】本実施の形態の共通言語翻訳プログラムの処理
のフローチャートである。
【図8】本実施の形態の共通言語翻訳の処理の説明に供
する説明図である。
【図9】本実施の形態の共通言語翻訳の処理の説明に供
する説明図である。
【図10】本実施の形態の目標言語文書生成処理の説明
に供する説明図である。
【図11】本実施の形態の目標言語文書生成処理の説明
に供する説明図である。
【図12】本実施の形態の目標言語文書生成処理の説明
に供する説明図である。
【図13】本実施の形態の目標言語文書生成処理の説明
に供する説明図である。
【図14】従来の通信システムの概要を示す説明図であ
る。
【符号の説明】
101 通信ネットワーク 102 サーバー装置 103 クライアント装置 202 ROM 203 RAM 203d 共通言語文書データ記憶部 204 CPU 206 入力部 207 通信制御部 305 表示制御部 307 通信制御部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 所望とする文書データを受信可能なクラ
    イアント装置と、そのクライアント装置からの要求に応
    じた文書データを前記クライアント装置に送信するサー
    バー装置とから構成される通信システムであって、 前記クライアント装置は、 前記文書データを特定可能な文書識別情報と、前記文書
    データの記述言語を指定する要求言語情報とを前記サー
    バー装置に送信する要求情報送信手段と、 前記サーバー装置より前記文書データを受信し、出力す
    る受信出力手段とを備え、 前記サーバー装置は、 所定の自然言語で記述された原文書データを入力する原
    文書入力手段と、 前記原文書入力手段で入力した原文書データを特定の自
    然言語である共通言語に翻訳し共通言語文書データを生
    成する原文書翻訳手段と、 前記原文書翻訳手段で生成された共通言語文書データを
    記憶する共通言語文書記憶手段と、 前記クライアント装置から前記文書識別情報と、前記要
    求言語情報とを受信する要求情報受信手段と、 前記文書識別情報に対応した共通言語文書データを、前
    記共通言語文書記憶手段から読み出す文書読み出し手段
    と、 前記文書読み出し手段で読み出した共通言語文書データ
    から、前記要求言語情報に対応した言語で記述した目標
    言語文書データを生成する目標言語文書生成手段と、 前記目標言語文書生成手段で生成された目標言語文書デ
    ータを、前記クライアント装置に送信する文書送信手段
    とを備えたことを特徴とする多言語対応通信システム。
JP8339597A 1996-12-19 1996-12-19 多言語対応通信システム Pending JPH10187731A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8339597A JPH10187731A (ja) 1996-12-19 1996-12-19 多言語対応通信システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8339597A JPH10187731A (ja) 1996-12-19 1996-12-19 多言語対応通信システム

Publications (1)

Publication Number Publication Date
JPH10187731A true JPH10187731A (ja) 1998-07-21

Family

ID=18328993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8339597A Pending JPH10187731A (ja) 1996-12-19 1996-12-19 多言語対応通信システム

Country Status (1)

Country Link
JP (1) JPH10187731A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220032253A (ko) * 2020-09-07 2022-03-15 주식회사 한글과컴퓨터 다국어 번역 기능을 지원하는 문서 파일 제공 서버 및 그 동작 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220032253A (ko) * 2020-09-07 2022-03-15 주식회사 한글과컴퓨터 다국어 번역 기능을 지원하는 문서 파일 제공 서버 및 그 동작 방법

Similar Documents

Publication Publication Date Title
US6092035A (en) Server device for multilingual transmission system
US7877251B2 (en) Document translation system
US8489980B2 (en) Translation management system
US5497319A (en) Machine translation and telecommunications system
EP0519049B1 (en) Machine translation and telecommunications system
US20020002452A1 (en) Network-based text composition, translation, and document searching
US20080040097A1 (en) System, method and program product for bidirectional text translation
JP3467160B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JPH0261763A (ja) 機械翻訳装置
JP3467159B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JPH10187731A (ja) 多言語対応通信システム
JP3434161B2 (ja) 多言語対応通信システム
JPH10222516A (ja) 多言語対応通信システム
KR100836159B1 (ko) 반자동 번역 서비스 제공 시스템 및 방법
JPH10187732A (ja) 多言語対応通信システム
JPH10222513A (ja) 多言語対応通信システム
JPH10214266A (ja) 多言語対応通信システム
JP3467161B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JPH10207892A (ja) 多言語対応通信システム
JP3174664B2 (ja) 機械翻訳装置
JP3353873B2 (ja) 機械翻訳装置
JP3267168B2 (ja) 自然言語変換システム
JP2715875B2 (ja) 多言語要約生成装置
JP2003114890A (ja) 翻訳装置、翻訳方法、翻訳サーバおよびプログラム
JP2002197086A (ja) 自然言語変換システム