JPH10162007A - 多言語対応通信システム及びサーバー装置 - Google Patents

多言語対応通信システム及びサーバー装置

Info

Publication number
JPH10162007A
JPH10162007A JP32284296A JP32284296A JPH10162007A JP H10162007 A JPH10162007 A JP H10162007A JP 32284296 A JP32284296 A JP 32284296A JP 32284296 A JP32284296 A JP 32284296A JP H10162007 A JPH10162007 A JP H10162007A
Authority
JP
Japan
Prior art keywords
document data
document
language
intermediate format
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP32284296A
Other languages
English (en)
Other versions
JP3467159B2 (ja
Inventor
Atsuhiko Kurachi
敦彦 倉知
Norihisa Fujii
則久 藤井
Atsushi Kawai
淳 河合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP32284296A priority Critical patent/JP3467159B2/ja
Priority to US08/984,293 priority patent/US6092035A/en
Publication of JPH10162007A publication Critical patent/JPH10162007A/ja
Application granted granted Critical
Publication of JP3467159B2 publication Critical patent/JP3467159B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Computer And Data Communications (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 クライアント装置に特別な言語翻訳プログラ
ムを必要とせず、且つ多数の言語で記述される文書デー
タをより簡易に提供することができる多言語対応通信シ
ステム及びサーバー装置を提供することである。 【解決手段】 サーバー装置102に記憶される文書デー
タを、自然言語で記述された文書データではなく、自然
言語で記述された文書データを文法的、意味的に解析し
た結果として得られる中間形式文書データ104として記
憶する。そして、クライアント装置103から文書データ
の要求があると、その文書データに対応した中間形式文
書データ104を記憶装置から読出し、読出した中間形式
文書データ104からクライアント装置103が要求する自然
言語で記述された目標言語文書データを生成し、生成さ
れた目標言語文書データをクライアント装置103に送信
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、翻訳機能を持つこ
とで所望とされる言語による文書データを提供する事が
可能な多言語対応通信システム及びサーバー装置に関す
る。
【0002】
【従来の技術】従来、インターネットに代表されるよう
に、通信ネットワークを介して、文書データを検索、閲
覧するシステムが普及している。この様なシステムは、
各種の文書データを記憶する1つ以上のサーバー装置
と、文書データの表示が可能な1つ以上のクライアント
装置と、それらを接続する通信ネットワークとで構成さ
れる。通信ネットワークは、公衆回線網や、専用回線網
あるいはその組み合わせから構成される。サーバー装置
は、各種の文書データが記憶できる記憶装置と、通信ネ
ットワークへの接続装置とを備え、クライアント装置は
文書データを表示可能な表示装置と、閲覧したい文書の
指示情報を入力できる入力装置と、通信ネットワークへ
の接続装置とを備える。
【0003】例えば、インターネットでは、サーバー装
置、クライアント装置共に非常に多くの装置が接続され
ており、その所在地も全世界に広がっている。そして、
それらを接続する通信ネットワークを介して世界各地の
様々な情報を、検索、閲覧することが可能なシステムと
なっている。
【0004】このようなインターネットでは、図12に
示すように、各サーバー装置1202には、英語とか、日本
語、中国語等の様々な言語で記述された文書データが記
憶されている。通信ネットワーク1201を介してサーバー
装置に接続されているクライアント装置1203では、これ
らの様々な言語で記述された文書データをそれぞれの言
語で表示することが可能である。また、言語翻訳プログ
ラムを内蔵するクライアント装置もあり、必要に応じて
所望の言語に翻訳して文書データを表示することも可能
である。
【0005】
【発明が解決しようとする課題】上述したシステム、特
にインターネットのように全世界に広がったネットワー
クを介して様々な文書データを閲覧する場合、文書デー
タの提供者と、その文書データの閲覧者とは異なる言語
を母国語としていることが多い。しかし、母国語以外の
言語での記述や、その理解には困難を伴うことが多い。
これを解決するため、次の2つの方法が知られている。1
つは、同一内容の文書を複数の言語で記述された複数の
文書データとしてサーバー装置に記憶させ、所望の言語
の文書データをクライアント装置から選択することで、
所望の言語で記述された文書データを閲覧可能とする方
法である。他の方法は、言語翻訳プログラムをクライア
ント装置に搭載し、その言語翻訳プログラムを用いてサ
ーバーから送信されてきた文書データを所望する言語の
文書データに翻訳する方法である。これらの方法によ
り、母国語以外の言語で記述された文書データも母国語
で閲覧可能となる。しかし、その場合でも以下のような
問題が残されている。
【0006】まず、同一内容の文書を複数の言語で記述
された複数の文書データとしてサーバー装置に記憶させ
る方法では、1つの内容の文書でも、その内容を様々な
言語で記述された複数の文書データとして作成する必要
があり、多くの費用と労力を必要とする問題がある。
【0007】また、言語翻訳プログラムをクライアント
装置に搭載する方法では、各サーバーにより提供される
様々な言語の文章をすべて翻訳して表示するためには、
クライアント装置にそれぞれの言語から所望の言語へ翻
訳可能な多数の言語翻訳プログラムを搭載する必要があ
る。これはクライアント装置のコストを上昇させる。ま
た、現在実用化されている言語翻訳プログラムでは、翻
訳する原文書に元来含まれている曖昧さにより、望まし
い翻訳結果が得られないと言う問題もある。
【0008】本発明は、上述した問題点を解決するため
になされたものであり、クライアント装置に特別な言語
翻訳プログラムを必要とせず、且つ多数の言語で記述さ
れる文書データをより簡易に提供可能な多言語対応通信
システムを提供することを目的とする。
【0009】
【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1記載の多言語対応通信システム
は、所望とする文書データを受信可能なクライアント装
置と、そのクライアント装置からの要求に応じた前記文
書データを前記クライアント装置に送信するサーバー装
置とから構成される。前記クライアント装置では、要求
情報送信手段が、所望の文書データを特定可能な文書識
別情報と、その文書データの記述言語を指定する要求言
語情報とを前記サーバー装置に送信し、前記受信出力手
段が、前記サーバー装置から文書データを受信し、表示
出力、印字出力、音声出力等の出力処理を行う。前記サ
ーバー装置では、要求情報受信手段が前記クライアント
装置から前記文書識別情報と、前記要求言語情報とを受
信し、中間形式文書記憶手段が、自然言語で記述された
文書を文法的、意味的に解析した結果として得られる中
間形式表現で記述した中間形式文書データを少なくとも
1つ記憶し、文書読出し手段が、前記文書識別情報に対
応した中間形式文書データを、前記中間形式記憶手段か
ら読出し、目標言語文書生成手段が、前記文書読出し手
段で読出した中間形式文書データから、前記要求言語情
報に対応した言語で記述した目標言語文書データを生成
し、文書送信手段が、前記目標言語文書生成手段で生成
された目標言語文書データを、前記クライアント装置に
送信する。
【0010】このように、クライアント装置から所望の
記述言語を指定でき、それに従って中間形式文書データ
の形式で記憶された文書データから自然言語で記述され
た目標言語文書データを生成し、クライアント装置で出
力できるので、サーバー装置に多数の言語で記述した文
書データを保存したり、クライアント装置に言語翻訳プ
ログラムを搭載することなく、所望の言語で表記された
文書データの閲覧が可能となる。
【0011】また、請求項2記載の多言語対応通信シス
テムでは、前記サーバー装置において、原文書入力手段
が、所定の言語で記述された原文書データを入力し、前
記原文書解析手段が、前記原文書入力手段で入力した原
文書データを解析して、その解析結果から中間形式文書
データを生成し、前記中間形式記憶手段が、生成された
中間形式文書データを記憶する。
【0012】このように、自然言語で記述された原文書
データから中間形式文書データを生成するため、中間形
式がどのような形式であったとしても、原文書データ作
成者は特に学習を必要とせず文書データを自然言語で記
述さえすれば、中間形式文書データを作成できる。
【0013】また、請求項3記載の多言語対応通信シス
テムでは、前記サーバー装置において、前記中間形式記
憶手段は、人工的に定義された可読性のある言語である
共通言語で記述された文書データを中間形式文書データ
として記憶し、前記目標言語文書生成手段は、前記文書
読出し手段により読出され、前記共通言語で記述された
文書データから前記要求言語情報に対応した言語で記述
される目標言語文書データを生成する。
【0014】このように、中間形式表現として人工的に
定義された可読性のある言語を用いることで、中間形式
文書データの変更や管理を容易に行うことができる。
【0015】また、請求項4記載のサーバー装置は、情
報受信手段がクライアント装置から文書データを特定可
能な文書識別情報と、前記文書データの記述言語を指定
する要求言語情報とを受信し、中間形式文書記憶手段
が、自然言語で記述された文書を文法的、意味的に解析
した結果として得られる中間形式表現で記述した中間形
式文書データを少なくとも1つ記憶し、文書読出し手段
が、前記文書識別情報に対応した中間形式文書データ
を、前記中間形式記憶手段から読出し、目標言語文書生
成手段が、前記文書読出し手段で読出した中間形式文書
データから、前記要求言語情報に対応した言語で記述し
た目標言語文書データを生成し、文書送信手段が、前記
目標言語文書生成手段で生成された目標言語文書データ
を、前記クライアント装置に送信する。
【0016】このように、クライアント装置から指定さ
れた所望の記述言語に従って中間形式文書データの形式
で記憶された文書データから自然言語で記述された目標
言語文書データを生成し、クライアント装置へ送信でき
るので、サーバー装置に多数の言語で記述した文書デー
タを保存せず、クライアント装置に所望の言語で表記さ
れた文書データを送信可能となる。
【0017】また、請求項5記載のサーバー装置では、
原文書入力手段が、所定の言語で記述された原文書デー
タを入力し、前記原文書解析手段が、入力した原文書デ
ータを解析して、その原文書データの解析結果から中間
形式文書データを生成し、前記中間形式記憶手段が、生
成された中間形式文書データを記憶する。
【0018】このように、自然言語で記述された原文書
データから中間形式文書データを生成するため、中間形
式がどのような形式であったとしても、原文書データ作
成者は特に学習を必要とせず文書データを自然言語で記
述さえすれば、中間形式文書データを作成できる。
【0019】また、請求項6記載のサーバー装置では、
前記中間形式記憶手段は、人工的に定義された可読性の
ある言語である前記共通言語で記述された文書データを
中間形式文書データとして記憶し、前記目標言語文書生
成手段は、前記読出し手段により読出され、前記共通言
語で記述された文書データから前記要求言語情報に対応
した言語で記述される目標言語文書データを生成する。
【0020】このように、中間形式表現として人工的に
定義された可読性のある言語を用いることで、中間形式
文書データの変更や管理を容易に行うことができる。
【0021】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。
【0022】図1に本実施の形態の多言語対応通信シス
テムの概念図を示す。サーバー装置102は、文書データ
を、特定の自然言語によらない中間形式文書データ(詳
細は後述)として記憶している。また、中間形式文書デ
ータから、目標となる自然言語(以下、目標言語と呼
ぶ)で記述された文書データを生成するための目標言語
文書生成プログラムも記憶している。クライアント装置
103は、通信ネットワーク101を介して、文書データの指
示情報と、その文書データの記述言語の指示情報とから
なる要求情報を所望のサーバー装置102に送信する。サ
ーバー装置102は、クライアント装置103から送信された
要求情報に基づいて、指定された中間形式文書データか
ら指定された自然言語による文書データを生成し、生成
した文書データを通信ネットワーク101を介してクライ
アント装置103に送信する。そして、クライアント装置
はその文書データを受信し、表示出力、印字出力、音声
出力等の出力を行う。
【0023】図2に本発明を好適に適用したサーバー装
置のブロック図を示す。
【0024】サーバー装置102は、ROM202、RAM203、CPU
204、表示制御部205、入力部206、通信制御部207及びそ
れらを接続するバス209より構成される。CPU204は、記
憶されている各種のプログラムに基づいて様々な制御を
実行し、本サーバー装置102の動作の主体をなしてい
る。表示制御部205は、表示データの蓄積とディスプレ
イモニターの制御を行い、モニター208に表示出力を行
う。モニター208は、CRTディスプレイや、LCDディスプ
レイなど様々な表示装置を利用できる。入力部206は、
記憶される文書データの入力や、サーバー装置102への
指示を入力するためのものであり、キーボード装置であ
る。通信制御部207は、通信網210と接続される。通信網
210は、公衆回線や、専用回線の回線網であり、通信ネ
ットワーク101の構成要素である。通信制御部207は、通
信網210とサーバー装置102とのデータ通信を制御し、デ
ータの送受信を行う。通信制御部207は、公衆回線や専
用回線と接続するためのモデム装置である。
【0025】なお、入力部206は、上記の構成以外に、
マウス装置などの指示装置や、音声入力装置、タッチパ
ネル装置などの様々な入力装置や、それらの組み合わせ
で構成してもよい。また、通信制御部207は、無線の公
衆回線や専用回線と接続するための送受信装置とか、LA
N(Local Area Network)に接続するためのイーサーネッ
ト接続装置、トークンリング接続装置とか、ATM(Asynch
ronous Transfer Mode)回線網への接続装置等、様々な
接続装置でもよい。
【0026】ROM202は各種プログラムや、翻訳辞書のデ
ータ等を記憶している。
【0027】ROM202内にはさらに各種の記憶部が形成さ
れている。通信制御プログラム記憶部202aは、通信制御
部207を介した各種通信の制御や、クライアント装置か
らの文書データ要求の受信や、生成された文書データの
クライアント装置への送信処理等を行う通信制御プログ
ラムを記憶している。通信制御プログラムと、通信制御
部207とが本発明の要求情報受信手段と、文書送信手段
との主体をなす。
【0028】目標言語文書生成プログラム記憶部202b
は、中間形式文書データから、各種の目標言語文書デー
タを生成するための、目標言語文書生成プログラムを記
憶する。なお、目標言語文書生成プログラムが本発明の
目標言語文書生成手段の主体をなす。本実施の形態で
は、生成する文書の目標言語の種類に応じて目標言語文
書生成プログラムが別になっているものとし、目標言語
文書生成プログラム記憶部202bは、生成する文書の目標
言語に応じた少なくとも1つの目標言語文書生成プログ
ラムを記憶する。なお、上記以外に、各目標言語に対応
した別々の目標言語文書生成プログラムを用いるのでは
なく、すべての目標言語に対応できる単一の目標言語文
書生成プログラムを用い、目標言語文書生成プログラム
記憶部202bはその単一の目標言語文書生成プログラムを
記憶してもよい。あるいは、言語構造として類似した複
数の目標言語に対応可能な目標言語文書生成プログラム
を用い、それを記憶してもよい。
【0029】中間形式文書データ作成プログラム記憶部
202cは、所定の自然言語で記述された文書データに基づ
いて、中間形式文書データを作成する中間形式文書デー
タ作成プログラムを記憶する。なお、中間形式文書デー
タ作成プログラムが本発明の原文書解析手段の主体をな
す。
【0030】文書管理プログラム記憶部202dは、中間形
式文書データ記憶部203dに対して中間形式文書データを
保存、読出し、あるいは、検索を行うときの主体となる
文書管理プログラムを記憶する。文書管理プログラム
が、本発明の文書読出し手段の主体をなす。
【0031】翻訳辞書記憶部202eは、目標言語文書生成
プログラムが処理を行う場合に必要とされる、目標言語
に対応した生成規則データ、形態素生成辞書などの各種
データを記憶している。さらに翻訳辞書記憶部202eは、
中間形式文書データ作成プログラムが処理を行う場合に
必要とされる形態素解析辞書、構文規則データ、構文解
析辞書、依存規則データなどの各種データも記憶してい
る。
【0032】なお、ROM202は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
【0033】RAM203は、中間形式文書データ等のデータ
の保存や、様々な一時データを記憶するために使用さ
れ、次のような各記憶部が内部に形成されている。
【0034】ワークメモリ203aは、各プログラムが動作
時に必要とする一時的な記憶領域を提供する。生成文書
メモリ203bは、中間形式文書データ記憶部203dに記憶さ
れた中間形式文書データに基づいて、目標言語文書生成
プログラム記憶部202bに記憶された目標言語文書生成プ
ログラムが生成した目標言語文書データを一時的に記憶
する。原文書メモリ203cは、中間言語作成プログラムの
入力データとなる、所定の自然言語で記述された文書デ
ータ(以下、原文書データと呼ぶ)を記憶する。原文書デ
ータは入力部206や、通信制御部207を介して入力され
る。なお、入力部206及び通信制御部207は、本発明の原
文書入力手段の主体をなすものである。
【0035】中間形式文書データ記憶部203dは、中間形
式文書データを少なくとも1つ記憶している。中間形式
文書データ記憶部203dが、本発明の中間形式文書記憶手
段の主体をなす。
【0036】なお、RAM203は、RAMに限らず、磁気ディ
スク装置や、光磁気ディスク装置等の記憶装置であって
もよい。さらに、中間形式文書データの作成を行わない
場合においては、中間形式文書データ記憶部203dはROM2
02上に形成してもよい。
【0037】なお、本実施の形態では、中間形式文書デ
ータ作成プログラムをサーバー装置102内に記憶し、本
サーバー装置102内で、原文書から中間形式文書データ
を作成する構成としたが、本サーバー装置102内には中
間形式文書データ作成プログラムを記憶せず、別の装置
で作成された中間形式文書データをサーバー装置への入
力とし、記憶する構成としてもよい。
【0038】次に、図3に、本発明を好適に適用したク
ライアント装置のブロック図を示す。
【0039】クライアント装置103は、ROM302、RAM30
3、CPU304、表示制御部305、入力部306、通信制御部307
及びそれらを接続するバス309より構成される。CPU304
は、記憶されている各種のプログラムに基づいて様々な
制御を実行し、本クライアント装置103の動作の主体を
なしている。表示制御部305は、表示データの蓄積とデ
ィスプレイモニターの制御を行い、モニター308に表示
出力を行う。モニター308はCRTディスプレイや、LCDデ
ィスプレイなど様々な表示装置を利用できる。入力部30
6は、文書データの文書識別情報や、要求言語情報など
を入力したり、クライアント装置103への各種指示を入
力するためのものであり、キーボード装置である。通信
制御部307は、通信網210と接続され、通信網210とクラ
イアント装置103とのデータ通信を制御し、データの
送受信を行う。通信制御部307は、公衆回線や、専用
回線と接続するためのモデム装置である。
【0040】なお、入力部306は、上記の構成以外に、
マウス装置などの指示装置や、音声入力装置、タッチパ
ネル装置などの様々な入力装置や、その組み合わせで構
成してもよい。また、通信制御部307は、無線の公衆回
線や専用回線と接続するための送受信装置とか、LANに
接続するためのイーサーネット接続装置、トークンリン
グ接続装置とか、ATM回線網への接続装置等、様々な接
続装置でもよい。また、表示制御部305とモニター308と
を用いる以外に、印字出力装置や、音声出力装置を用い
る構成とし、文書データを印字出力や音声出力する構成
としてもよい。
【0041】ROM302は各種プログラムを記憶している。
【0042】ROM302内にはさらに各種の記憶部が形成さ
れている。通信制御プログラム記憶部302aは、通信制御
部307を介した各種通信の制御や、サーバー装置へのデ
ータ送受信処理等を行う通信制御プログラムを記憶して
いる。この通信制御プログラムと、通信制御部307とが
本発明の要求情報送信手段の主体をなす。表示プログラ
ム記憶部302bは、サーバーから受信した文書データを表
示制御部305を用いて表示するための表示プログラムを
記憶している。表示プログラムと、表示制御部305と、
通信制御プログラムと、通信制御部307とが本発明の受
信出力手段の主体をなす。要求情報入力プログラム記憶
部302cは、ユーザーが入力部306を用いて、所望する文
書データの文書識別情報と、要求言語情報とを入力する
処理を制御するための、要求情報入力プログラムを記憶
する。
【0043】なお、ROM302は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
【0044】RAM303は、様々な一時データを保存するた
めに使用され、次のような各記憶部が内部に形成されて
いる。ワークメモリ303aは各プログラムが動作時に必要
とする一時的な記憶領域を提供する。受信文書メモリ30
3bは、サーバー装置から受信した文書データを一時保存
する。なお、RAM303は、RAMに限らず、磁気ディスク装
置や、光磁気ディスク装置等の記憶装置であってもよ
い。
【0045】次に、サーバー装置102と、クライアント
装置103との基本的な処理の流れを図4を用いて説明す
る。まず、クライアント装置103では、所望する文書デ
ータの指示情報の入力処理を行う(S401、Sはステップを
示す。以下同様)。次に、入力した指示情報からその文
書データが所在するサーバー装置を通信ネットワーク上
で一意に決定する情報である、サーバー装置のアドレス
を取得する(S402)。本実施の形態では、サーバー装置の
アドレスとしてTCP/IP(Transmission Control Protocol
/Internet Protocol)で規定されるホスト名あるいはIP
アドレスを用いるものとするが、他に通信ネットワーク
上のアドレスを決定できる情報であれば何でもよい。次
に、所望する文書データ指示情報から、その文書データ
のサーバー装置内での指示情報である文書識別情報を決
定する(S403)。次に、所望する文書データがどの自然言
語によって記述されるかを指定する要求言語の情報を決
定する(S404)。
【0046】次に、決定された文書識別情報と、要求言
語情報とをS402で決定されたアドレスのサーバー装置に
送信する(S405)。本実施の形態では、サーバー装置への
送信方法として、TCP/IP上のHTTP(Hyper Text Transfer
Protocol)を用いるとする。具体的には、クライアント
装置は、図5(a)に示す形式のデータをサーバー装置に
送信する。"GET"はデータ要求を意味し、<文書識別情報
>にはS402で決定された文書識別情報を指定する。<バー
ジョン情報>はHTTPのバージョン情報を指定し、<CRLF>
は復帰改行文字を示す。<各種ヘッダー情報>にはHTTPで
規定されたヘッダー情報を必要に応じて指定する。"Acc
ept-Language:"は次に要求言語情報が続くことを示す文
字列であり、<要求言語>には要求言語を識別するあらか
じめ定められた文字列を指定する。図5(b)は文書識別
情報として"/pub/sample.html"、HTTPバージョンが1.
0、日本語を要求言語とした場合の例である。なお、上
述したTCP/IPおよびHTTPは、すでに広く実用化された公
知の技術であるため、説明を省略する。
【0047】サーバー装置では、S405でクライアント装
置から送信された要求文書の文書識別情報と、要求言語
情報を受信し(S408)、受信した情報に基づいて所望の自
然言語による所望の文書データを生成するために、文書
データ生成処理を実行する(S409)。S409の詳細は後述す
る。S409にて所望の自然言語による所望の文書データを
生成できない場合は、それをエラーと判定する(S410)。
本実施の形態では、このエラーの判定は後述するエラー
フラグを参照することで判定する。エラーでなければ生
成した文書データをクライアントに送信し(S411)、エラ
ーならばエラー情報を送信する(S412)。クライアントで
はサーバーから文書データもしくはエラー情報を受信し
(S406)、表示装置に表示する(S407)。
【0048】次に、文書データ生成処理(S409)の詳細に
ついて、図6を用いて説明する。まず、エラー状態を記
憶するために、ワークメモリ203a内に形成されたエラー
フラグ(図示せず)をクリアーして、エラーなしの状態と
する(S601)。次に、文書識別情報で指定された文書デー
タの有無を判定し(S602)、もし、該当する文書データが
サーバー装置内に存在しない場合は(S602:No)、エラー
とするためにS607に処理を進め、存在した場合は(S602:
Yes)、S603に処理を進める。S603では、文書管理プログ
ラムが、クライアントから送信された文書識別情報で指
示された中間形式文書データを、中間形式文書データ記
憶部203dから検索して、ワークメモリ203aに読み込む。
本実施の形態においては、中間形式文書データ記憶部20
3dで記憶される中間形式文書データは、それぞれの中間
形式文書データが1つのファイルに対応するものとし、
文書データを指定する文書識別情報としては、中間形式
文書データを収納しているファイル名を用いるものとす
る。この場合は、文書識別情報で示されたファイル名の
ファイルが存在するか否かでS602の判定を行い、S603で
は文書管理プログラムがそのファイルのデータをワーク
メモリ203aに読み込むこととなる。
【0049】なお、文書識別情報としてファイル名を用
いる方法以外に、文書管理プログラムとしてデータベー
ス管理プログラムを用い、中間形式文書データ記憶部20
3dとしてデータベースの記憶領域を対応させ、文書識別
情報としてデータベース内の文書データを特定可能な指
示情報を用いてもよい。
【0050】次に、読出した中間言語形式文書データを
S408にて受信した要求言語情報に基づいた目標言語に翻
訳可能か否かを判定する(S604)。本実施の形態では、前
述したように各目標言語毎に個別の目標言語文書生成プ
ログラムを持つので、S408にて受信した要求言語情報に
対応した目標言語文書生成プログラムが目標言語文書生
成プログラム記憶部202bに記憶されているか否かで、S6
04の判定を行う。
【0051】S605では、読み込んだ中間形式文書データ
から目標言語文書データを生成する、目標言語文書生成
処理を実行する。S605の詳細は後述する。S606では、S6
05にて生成された目標言語文書データを、送信のために
一旦生成文書メモリ0203bに記憶する。S607では、S602
とS604での判定を受けて、エラー処理をするためにエラ
ーフラグをセットしてエラー状態を記憶する。
【0052】次に、本発明の原文書解析手段の主体をな
す中間形式文書データ作成プログラムの処理の詳細を、
図7、図8、図9を用いて説明する。
【0053】まず、入力部206より、所定の自然言語で
記述された文書データを入力する(S701)。
【0054】入力された文書データは、一旦原文書メモ
リ203cに保存される(S702)。この文書データが原文書デ
ータとして処理される。
【0055】原文書データは、まず形態素解析処理を受
ける(S703)。S703では、翻訳辞書記憶部202eに記憶され
た形態素解析辞書を参照し、原文書を形態素に分割し、
形態素列に変換し、各形態素の品詞の判定を行う。日本
語から中間形式文書データを生成する一例として、図8
(a)に示す原文書であれば、形態素解析処理により図8
(b)のような形態素列からなる形態素解析結果が得られ
る。
【0056】次に、構文解析処理を行う(S704)。S704で
は、S703で解析された品詞情報を含む形態素列に、翻訳
辞書記憶部202eに記憶された構文規則データと、構文解
析辞書の情報を適用し、各形態素間の修飾関係を解析す
ると共に、格の意味的な役割を決定し、構文解析木を形
成する。たとえば、図8(b)のような形態素解析結果
は、図8(c)で示される構文解析木からなる構文解析結
果を得る。ここで、「S」は文を、「NP」は名詞句を、
「ADV」は副詞を、「VP」は動詞句をそれぞれ表すもの
である。
【0057】次に、依存構造解析処理を行う(S705)。S7
05では、S704の解析結果である構文解析木に基づき依存
構造を形成する。図8(c)の構文解析結果に対して依存
構造解析処理を行うと、図9(a)のような依存構造が得
られる。ここで、「PRED」は述部を、「NOM」は依存構
造名詞句を、「ADV」は副詞をそれぞれ表す。
【0058】次に、S705で得られた依存構造のデータを
中間形式文書データ記憶部203dに保存する(S706)。
【0059】本実施の形態では、中間形式表現として文
の依存構造の表現を用い、上記のように文章を解析した
結果得られる、依存構造で表現された文章の意味内容を
表すデータを、中間形式文書データとして用いることと
する。具体的には、図10(a)に記載するような構造要
素1005の集合として記憶する。各構造要素1005は、構造
種別1001と、格情報1002と、辞書ポインター1003と、従
属構造数1004との4つの項目を持つ。構造種別1001は、
述部とか、名詞句とかの種別をフラグとして記憶する。
格情報1002は、主格とか目的格、あるいは様態などの格
の種別情報を必要に応じてフラグとして記憶する。辞書
ポインター1003は、その構造要素に対応した単語の情報
を収納している辞書データへのポインターを記憶する。
従属構造数1004は、その構造要素に直接従属する構造要
素がいくつあるかを記憶する。なお、従属構造数1004
は、その構造要素に従属する構造要素にさらに従属す
る、つまり入れ子として間接的に従属する要素の個数は
含まない。
【0060】例えば、図9(a)に示された依存構造を記
憶した場合は、図10(b)のようなデータとなる。ここ
で、「K1」は主格を、「K2」は目的格を、「K3」は様態
の格を表す。また、辞書ポインターは、図10(c)に例
示された辞書データの番号1006を表している。辞書デー
タには、原文書で用いられた言語の単語1007と、その品
詞1008、及び他の言語の対応する単語1009や、さらに各
種の文法情報などが記憶される。図10(c)では、他の
言語が英語である場合の例示である。なお、中間形式文
書データとしては上記の方法以外に、人工的に定義され
た可読性のある言語(以下、共通言語という)を、中間形
式表現として用い、その言語で記述された文書データを
中間形式文書データとして用いてもよい。例えば、特開
平6-325080公報に開示されているような、人工的に設計
した言語で記述した文章を中間形式文書データとしても
よい。
【0061】次に、S605の目標言語文書生成処理の詳細
を、図11と図9とを用いて説明する。目標言語文書生
成処理は、本発明の目標言語文書生成手段の主体をなす
目標言語文書生成プログラムが行う処理である。
【0062】まず、S603にてワークメモリ203aに読み込
まれた中間形式文書データに対し、構文生成処理を行う
(S1101)。構文生成処理では、中間形式文書データに記
述された依存構造に基づいて、生成規則データを参照し
つつ目標言語の構文木を生成し、語順を決定する。
【0063】次に、形態素生成処理を行い(S1102)、単
語の語尾等を必要に応じて変化させ、生成文書データの
生成を完了する。目標言語が英語である一例を挙げれ
ば、図9(a)で示される依存構造の文に対し、構文生成
処理と、形態素生成処理の処理を行うと、図9(b)に示
されるような目標言語文書生成結果が得られることとな
る。ここで、「PRON」は代名詞、「V」は動詞、「ART」
は冠詞、「N」は名詞をそれぞれ表す。
【0064】なお、本実施の形態においては、中間形式
文書データとして記憶されている依存構造データをその
まま構文生成処理への入力としたが、構文生成処理への
入力の前に依存構造変換処理を行ってもよい。これは具
体的には、中間形式文書データに記憶されている文章の
依存構造をそのまま用いるのではなく、中間形式変換手
段に対応する依存構造変換処理を行い、目標言語に対応
した依存構造に変換してから、構文生成処理への入力と
する。
【0065】なお、本実施の形態に関わる前記の形態素
解析処理、構文解析処理、依存構造解析処理、構文生成
処理、及び形態素生成処理のそれぞれは、電子技術総合
研究所と京都大学による「日英科学技術文献の速報シス
テムに関する研究−言語処理システムの開発に関する報
告書」や、特開昭62-203273号公報に開示されている公
知の技術である。
【0066】
【発明の効果】以上説明したことから明らかなように、
本発明の請求項1記載の多言語対応通信システムは、ク
ライアントから所望の記述言語を指定でき、それに従っ
て中間形式文書データの形式で記憶された文書データか
ら自然言語で記述された文書データを生成し、クライア
ント装置で出力できるので、サーバー装置に多数の言語
で記述した文書データを保存したり、クライアント装置
に言語翻訳プログラムを搭載することなく、所望の言語
で表記された文書データの閲覧をすることができる。
【0067】また、請求項2記載の多言語対応通信シス
テムは、自然言語で記述された原文書データから中間形
式文書データを生成するため、中間形式文書データを容
易に作成できる。
【0068】また、請求項3記載の多言語対応通信シス
テムは、中間形式表現として人工的に定義された可読性
のある言語を用いることで、中間形式文書データの変更
や管理を容易に行うことができる。
【0069】また、請求項4記載のサーバー装置は、ク
ライアントから指定された所望の記述言語に従って中間
形式文書データの形式で記憶された文書データから自然
言語で記述された文書データを生成し、クライアント装
置で出力できるので、サーバー装置に多数の言語で記述
した文書データを保存したり、クライアント装置に言語
翻訳プログラムを搭載することなく、所望の言語で表記
された文書データの閲覧をすることができる。
【0070】また、請求項5記載のサーバー装置は、自
然言語で記述された原文書データから中間形式文書デー
タを生成するため、中間形式文書データを容易に作成す
ることができる。
【0071】また、請求項6記載のサーバー装置は、中
間形式表現として人工的に定義された可読性のある言語
を用いることで、中間形式文書データの変更や管理を容
易に行うことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態の多言語対応通信システム
の概要を示す説明図である。
【図2】本実施の形態のサーバー装置のブロック図であ
る。
【図3】本実施の形態のクライアント装置のブロック図
である。
【図4】本実施の形態のサーバー装置とクライアント装
置との処理の流れを示すフローチャートである。
【図5】本実施の形態の文書識別情報と要求言語情報と
の説明図である。
【図6】本実施の形態の文書データ生成処理のフローチ
ャートである。
【図7】本実施の形態の中間形式文書データ作成プログ
ラムの処理のフローチャートである。
【図8】本実施の形態の中間形式文書データ作成の処理
の説明に供する説明図である。
【図9】本実施の形態の中間形式文書データ作成の処理
と、目標言語文書生成処理の説明に供する説明図であ
る。
【図10】本実施の形態の中間形式文書データの説明に
供する説明図である。
【図11】本実施の形態の目標言語文書生成処理のフロ
ーチャートである。
【図12】従来の通信システムの概要を示す説明図であ
る。
【符号の説明】
101 通信ネットワーク 102 サーバー装置 103 クライアント装置 202 ROM 203 RAM 203d 中間形式文書データ記憶部 204 CPU 206 入力部 207 通信制御部 305 表示制御部 307 通信制御部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 所望とする文書データを受信可能なクラ
    イアント装置と、そのクライアント装置からの要求に応
    じた文書データをクライアント装置に送信するサーバー
    装置とから構成される通信システムであって、 前記クライアント装置は、 前記文書データを特定可能な文書識別情報と、前記文書
    データの記述言語を指定する要求言語情報とを前記サー
    バー装置に送信する要求情報送信手段と、 前記サーバー装置より前記文書データを受信し、出力す
    る受信出力手段とを備え、 前記サーバー装置は、 前記クライアント装置から前記文書識別情報と、前記要
    求言語情報とを受信する要求情報受信手段と、 少なくとも一つの文書データを、自然言語で記述された
    文書を文法的、意味的に解析した結果として得られる中
    間形式表現で記述した中間形式文書データとして記憶す
    る中間形式文書記憶手段と、 前記文書識別情報に対応した中間形式文書データを、前
    記中間形式記憶手段から読出す文書読出し手段と、 前記文書読出し手段で読出した中間形式文書データか
    ら、前記要求言語情報に対応した言語で記述した目標言
    語文書データを生成する目標言語文書生成手段と、 前記目標言語文書生成手段で生成された目標言語文書デ
    ータを、前記クライアント装置に送信する文書送信手段
    とを備えたことを特徴とする多言語対応通信システム。
  2. 【請求項2】 前記サーバー装置は、 所定の言語で記述された原文書データを入力する原文書
    入力手段と、 前記原文書入力手段で入力した原文書データを解析し、
    その原文書データの解析結果から中間形式文書データを
    生成する原文書解析手段とをさらに備えたことを特徴と
    する請求項1記載の多言語対応通信システム。
  3. 【請求項3】 前記中間形式文書記憶手段は、人工的に
    定義された可読性のある言語である共通言語で記述され
    た文書データを中間形式文書データとして記憶するよう
    に構成されたことを特徴とする請求項1または2記載の
    多言語対応通信システム。
  4. 【請求項4】 クライアント装置からの要求に応じた文
    書データを前記クライアント装置に送信するサーバー装
    置であって、 前記クライアント装置から前記文書データを特定可能な
    文書識別情報と、前記文書データの記述言語を指定する
    要求言語情報とを受信する要求情報受信手段と、 少なくとも一つの文書データを、自然言語で記述された
    文書を文法的、意味的に解析した結果として得られる中
    間形式表現で記述した中間形式文書データとして記憶す
    る中間形式文書記憶手段と、 前記文書識別情報に対応した中間形式文書データを、前
    記中間形式記憶手段から読出す文書読出し手段と、 前記読出し手段で読出した中間形式文書データから、前
    記要求言語情報に対応した言語で記述した目標言語文書
    データを生成する目標言語文書生成手段と、 前記目標言語文書生成手段で生成された目標言語文書デ
    ータを、前記クライアント装置に送信する文書送信手段
    とを備えたことを特徴とするサーバー装置。
  5. 【請求項5】 所定の言語で記述された原文書データを
    入力する原文書入力手段と、 前記原文書入力手段で入力した原文書データを解析し、
    その原文書データの解析結果から中間形式文書データを
    生成する原文書解析手段とをさらに備えたことを特徴と
    する請求項4記載のサーバー装置。
  6. 【請求項6】 前記中間形式記憶手段は、人工的に定義
    された可読性のある言語である共通言語で記述された文
    書データを中間形式文書データとして記憶するように構
    成されたことを特徴とする請求項4または5記載のサー
    バー装置。
JP32284296A 1996-12-03 1996-12-03 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 Expired - Fee Related JP3467159B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP32284296A JP3467159B2 (ja) 1996-12-03 1996-12-03 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
US08/984,293 US6092035A (en) 1996-12-03 1997-12-03 Server device for multilingual transmission system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32284296A JP3467159B2 (ja) 1996-12-03 1996-12-03 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法

Publications (2)

Publication Number Publication Date
JPH10162007A true JPH10162007A (ja) 1998-06-19
JP3467159B2 JP3467159B2 (ja) 2003-11-17

Family

ID=18148222

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32284296A Expired - Fee Related JP3467159B2 (ja) 1996-12-03 1996-12-03 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法

Country Status (1)

Country Link
JP (1) JP3467159B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001039035A1 (fr) * 1999-11-17 2001-05-31 United Nations Systeme de traduction
WO2001039034A1 (fr) * 1999-11-17 2001-05-31 United Nations Systeme destine a creer une expression dans une langue universelle et support d'enregistrement sur lequel des regles de traduction destinees a ce systeme sont enregistrees
JP2009080806A (ja) * 2007-09-04 2009-04-16 Yahoo Japan Corp Webページにリンクを挿入する方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001039035A1 (fr) * 1999-11-17 2001-05-31 United Nations Systeme de traduction
WO2001039034A1 (fr) * 1999-11-17 2001-05-31 United Nations Systeme destine a creer une expression dans une langue universelle et support d'enregistrement sur lequel des regles de traduction destinees a ce systeme sont enregistrees
US6704700B1 (en) 1999-11-17 2004-03-09 United Nations System for creating expression in universal language, and recorded medium on which translation rules used for the system are recorded
US7107206B1 (en) 1999-11-17 2006-09-12 United Nations Language conversion system
JP2009238255A (ja) * 1999-11-17 2009-10-15 United Nations 普遍言語による表現を生成するシステムおよびこれに用いられる変換規則を記録した記録媒体
JP2009080806A (ja) * 2007-09-04 2009-04-16 Yahoo Japan Corp Webページにリンクを挿入する方法

Also Published As

Publication number Publication date
JP3467159B2 (ja) 2003-11-17

Similar Documents

Publication Publication Date Title
US6092035A (en) Server device for multilingual transmission system
JP3066274B2 (ja) 機械翻訳装置
KR100815215B1 (ko) 웹사이트 통합 검색 장치 및 방법
EP0940762A2 (en) Multilingual patent information search system
US20020122053A1 (en) Method and apparatus for presenting non-displayed text in Web pages
US20020002452A1 (en) Network-based text composition, translation, and document searching
JPH0869470A (ja) 自然言語処理装置及びその方法
US7200808B1 (en) Electronic document processor
US20020059348A1 (en) Automatic documentation generation tool and associated method
US7155664B1 (en) Extracting comment keywords from distinct design files to produce documentation
US7401016B2 (en) Communication support system, communication support method, and computer program
JPH0310979B2 (ja)
JP3467160B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
US20020143817A1 (en) Presentation of salient features in a page to a visually impaired user
KR101802051B1 (ko) 자연 언어 처리 스키마 및 그 지식 데이터베이스 구축 방법 및 시스템
JP3467159B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JP3434161B2 (ja) 多言語対応通信システム
JPH10222516A (ja) 多言語対応通信システム
JPH10187732A (ja) 多言語対応通信システム
JP2003296327A (ja) 翻訳サーバ、ジャンル別オンライン機械翻訳方法、およびそのプログラム
JP3467161B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JPH10222513A (ja) 多言語対応通信システム
KR100836159B1 (ko) 반자동 번역 서비스 제공 시스템 및 방법
JPH10187731A (ja) 多言語対応通信システム
JPH10214266A (ja) 多言語対応通信システム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030812

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080829

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090829

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100829

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110829

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120829

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130829

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees