JPH10162007A - 多言語対応通信システム及びサーバー装置 - Google Patents
多言語対応通信システム及びサーバー装置Info
- Publication number
- JPH10162007A JPH10162007A JP32284296A JP32284296A JPH10162007A JP H10162007 A JPH10162007 A JP H10162007A JP 32284296 A JP32284296 A JP 32284296A JP 32284296 A JP32284296 A JP 32284296A JP H10162007 A JPH10162007 A JP H10162007A
- Authority
- JP
- Japan
- Prior art keywords
- document data
- document
- language
- intermediate format
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 64
- 238000004458 analytical method Methods 0.000 claims description 26
- 230000005540 biological transmission Effects 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 28
- 238000000034 method Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 238000013500 data storage Methods 0.000 description 10
- 238000013519 translation Methods 0.000 description 9
- 230000000877 morphologic effect Effects 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Computer And Data Communications (AREA)
- Machine Translation (AREA)
- Information Transfer Between Computers (AREA)
- Document Processing Apparatus (AREA)
Abstract
ムを必要とせず、且つ多数の言語で記述される文書デー
タをより簡易に提供することができる多言語対応通信シ
ステム及びサーバー装置を提供することである。 【解決手段】 サーバー装置102に記憶される文書デー
タを、自然言語で記述された文書データではなく、自然
言語で記述された文書データを文法的、意味的に解析し
た結果として得られる中間形式文書データ104として記
憶する。そして、クライアント装置103から文書データ
の要求があると、その文書データに対応した中間形式文
書データ104を記憶装置から読出し、読出した中間形式
文書データ104からクライアント装置103が要求する自然
言語で記述された目標言語文書データを生成し、生成さ
れた目標言語文書データをクライアント装置103に送信
する。
Description
とで所望とされる言語による文書データを提供する事が
可能な多言語対応通信システム及びサーバー装置に関す
る。
に、通信ネットワークを介して、文書データを検索、閲
覧するシステムが普及している。この様なシステムは、
各種の文書データを記憶する1つ以上のサーバー装置
と、文書データの表示が可能な1つ以上のクライアント
装置と、それらを接続する通信ネットワークとで構成さ
れる。通信ネットワークは、公衆回線網や、専用回線網
あるいはその組み合わせから構成される。サーバー装置
は、各種の文書データが記憶できる記憶装置と、通信ネ
ットワークへの接続装置とを備え、クライアント装置は
文書データを表示可能な表示装置と、閲覧したい文書の
指示情報を入力できる入力装置と、通信ネットワークへ
の接続装置とを備える。
置、クライアント装置共に非常に多くの装置が接続され
ており、その所在地も全世界に広がっている。そして、
それらを接続する通信ネットワークを介して世界各地の
様々な情報を、検索、閲覧することが可能なシステムと
なっている。
示すように、各サーバー装置1202には、英語とか、日本
語、中国語等の様々な言語で記述された文書データが記
憶されている。通信ネットワーク1201を介してサーバー
装置に接続されているクライアント装置1203では、これ
らの様々な言語で記述された文書データをそれぞれの言
語で表示することが可能である。また、言語翻訳プログ
ラムを内蔵するクライアント装置もあり、必要に応じて
所望の言語に翻訳して文書データを表示することも可能
である。
にインターネットのように全世界に広がったネットワー
クを介して様々な文書データを閲覧する場合、文書デー
タの提供者と、その文書データの閲覧者とは異なる言語
を母国語としていることが多い。しかし、母国語以外の
言語での記述や、その理解には困難を伴うことが多い。
これを解決するため、次の2つの方法が知られている。1
つは、同一内容の文書を複数の言語で記述された複数の
文書データとしてサーバー装置に記憶させ、所望の言語
の文書データをクライアント装置から選択することで、
所望の言語で記述された文書データを閲覧可能とする方
法である。他の方法は、言語翻訳プログラムをクライア
ント装置に搭載し、その言語翻訳プログラムを用いてサ
ーバーから送信されてきた文書データを所望する言語の
文書データに翻訳する方法である。これらの方法によ
り、母国語以外の言語で記述された文書データも母国語
で閲覧可能となる。しかし、その場合でも以下のような
問題が残されている。
された複数の文書データとしてサーバー装置に記憶させ
る方法では、1つの内容の文書でも、その内容を様々な
言語で記述された複数の文書データとして作成する必要
があり、多くの費用と労力を必要とする問題がある。
装置に搭載する方法では、各サーバーにより提供される
様々な言語の文章をすべて翻訳して表示するためには、
クライアント装置にそれぞれの言語から所望の言語へ翻
訳可能な多数の言語翻訳プログラムを搭載する必要があ
る。これはクライアント装置のコストを上昇させる。ま
た、現在実用化されている言語翻訳プログラムでは、翻
訳する原文書に元来含まれている曖昧さにより、望まし
い翻訳結果が得られないと言う問題もある。
になされたものであり、クライアント装置に特別な言語
翻訳プログラムを必要とせず、且つ多数の言語で記述さ
れる文書データをより簡易に提供可能な多言語対応通信
システムを提供することを目的とする。
に、本発明の請求項1記載の多言語対応通信システム
は、所望とする文書データを受信可能なクライアント装
置と、そのクライアント装置からの要求に応じた前記文
書データを前記クライアント装置に送信するサーバー装
置とから構成される。前記クライアント装置では、要求
情報送信手段が、所望の文書データを特定可能な文書識
別情報と、その文書データの記述言語を指定する要求言
語情報とを前記サーバー装置に送信し、前記受信出力手
段が、前記サーバー装置から文書データを受信し、表示
出力、印字出力、音声出力等の出力処理を行う。前記サ
ーバー装置では、要求情報受信手段が前記クライアント
装置から前記文書識別情報と、前記要求言語情報とを受
信し、中間形式文書記憶手段が、自然言語で記述された
文書を文法的、意味的に解析した結果として得られる中
間形式表現で記述した中間形式文書データを少なくとも
1つ記憶し、文書読出し手段が、前記文書識別情報に対
応した中間形式文書データを、前記中間形式記憶手段か
ら読出し、目標言語文書生成手段が、前記文書読出し手
段で読出した中間形式文書データから、前記要求言語情
報に対応した言語で記述した目標言語文書データを生成
し、文書送信手段が、前記目標言語文書生成手段で生成
された目標言語文書データを、前記クライアント装置に
送信する。
記述言語を指定でき、それに従って中間形式文書データ
の形式で記憶された文書データから自然言語で記述され
た目標言語文書データを生成し、クライアント装置で出
力できるので、サーバー装置に多数の言語で記述した文
書データを保存したり、クライアント装置に言語翻訳プ
ログラムを搭載することなく、所望の言語で表記された
文書データの閲覧が可能となる。
テムでは、前記サーバー装置において、原文書入力手段
が、所定の言語で記述された原文書データを入力し、前
記原文書解析手段が、前記原文書入力手段で入力した原
文書データを解析して、その解析結果から中間形式文書
データを生成し、前記中間形式記憶手段が、生成された
中間形式文書データを記憶する。
データから中間形式文書データを生成するため、中間形
式がどのような形式であったとしても、原文書データ作
成者は特に学習を必要とせず文書データを自然言語で記
述さえすれば、中間形式文書データを作成できる。
テムでは、前記サーバー装置において、前記中間形式記
憶手段は、人工的に定義された可読性のある言語である
共通言語で記述された文書データを中間形式文書データ
として記憶し、前記目標言語文書生成手段は、前記文書
読出し手段により読出され、前記共通言語で記述された
文書データから前記要求言語情報に対応した言語で記述
される目標言語文書データを生成する。
定義された可読性のある言語を用いることで、中間形式
文書データの変更や管理を容易に行うことができる。
報受信手段がクライアント装置から文書データを特定可
能な文書識別情報と、前記文書データの記述言語を指定
する要求言語情報とを受信し、中間形式文書記憶手段
が、自然言語で記述された文書を文法的、意味的に解析
した結果として得られる中間形式表現で記述した中間形
式文書データを少なくとも1つ記憶し、文書読出し手段
が、前記文書識別情報に対応した中間形式文書データ
を、前記中間形式記憶手段から読出し、目標言語文書生
成手段が、前記文書読出し手段で読出した中間形式文書
データから、前記要求言語情報に対応した言語で記述し
た目標言語文書データを生成し、文書送信手段が、前記
目標言語文書生成手段で生成された目標言語文書データ
を、前記クライアント装置に送信する。
れた所望の記述言語に従って中間形式文書データの形式
で記憶された文書データから自然言語で記述された目標
言語文書データを生成し、クライアント装置へ送信でき
るので、サーバー装置に多数の言語で記述した文書デー
タを保存せず、クライアント装置に所望の言語で表記さ
れた文書データを送信可能となる。
原文書入力手段が、所定の言語で記述された原文書デー
タを入力し、前記原文書解析手段が、入力した原文書デ
ータを解析して、その原文書データの解析結果から中間
形式文書データを生成し、前記中間形式記憶手段が、生
成された中間形式文書データを記憶する。
データから中間形式文書データを生成するため、中間形
式がどのような形式であったとしても、原文書データ作
成者は特に学習を必要とせず文書データを自然言語で記
述さえすれば、中間形式文書データを作成できる。
前記中間形式記憶手段は、人工的に定義された可読性の
ある言語である前記共通言語で記述された文書データを
中間形式文書データとして記憶し、前記目標言語文書生
成手段は、前記読出し手段により読出され、前記共通言
語で記述された文書データから前記要求言語情報に対応
した言語で記述される目標言語文書データを生成する。
定義された可読性のある言語を用いることで、中間形式
文書データの変更や管理を容易に行うことができる。
て図面を参照して説明する。
テムの概念図を示す。サーバー装置102は、文書データ
を、特定の自然言語によらない中間形式文書データ(詳
細は後述)として記憶している。また、中間形式文書デ
ータから、目標となる自然言語(以下、目標言語と呼
ぶ)で記述された文書データを生成するための目標言語
文書生成プログラムも記憶している。クライアント装置
103は、通信ネットワーク101を介して、文書データの指
示情報と、その文書データの記述言語の指示情報とから
なる要求情報を所望のサーバー装置102に送信する。サ
ーバー装置102は、クライアント装置103から送信された
要求情報に基づいて、指定された中間形式文書データか
ら指定された自然言語による文書データを生成し、生成
した文書データを通信ネットワーク101を介してクライ
アント装置103に送信する。そして、クライアント装置
はその文書データを受信し、表示出力、印字出力、音声
出力等の出力を行う。
置のブロック図を示す。
204、表示制御部205、入力部206、通信制御部207及びそ
れらを接続するバス209より構成される。CPU204は、記
憶されている各種のプログラムに基づいて様々な制御を
実行し、本サーバー装置102の動作の主体をなしてい
る。表示制御部205は、表示データの蓄積とディスプレ
イモニターの制御を行い、モニター208に表示出力を行
う。モニター208は、CRTディスプレイや、LCDディスプ
レイなど様々な表示装置を利用できる。入力部206は、
記憶される文書データの入力や、サーバー装置102への
指示を入力するためのものであり、キーボード装置であ
る。通信制御部207は、通信網210と接続される。通信網
210は、公衆回線や、専用回線の回線網であり、通信ネ
ットワーク101の構成要素である。通信制御部207は、通
信網210とサーバー装置102とのデータ通信を制御し、デ
ータの送受信を行う。通信制御部207は、公衆回線や専
用回線と接続するためのモデム装置である。
マウス装置などの指示装置や、音声入力装置、タッチパ
ネル装置などの様々な入力装置や、それらの組み合わせ
で構成してもよい。また、通信制御部207は、無線の公
衆回線や専用回線と接続するための送受信装置とか、LA
N(Local Area Network)に接続するためのイーサーネッ
ト接続装置、トークンリング接続装置とか、ATM(Asynch
ronous Transfer Mode)回線網への接続装置等、様々な
接続装置でもよい。
ータ等を記憶している。
れている。通信制御プログラム記憶部202aは、通信制御
部207を介した各種通信の制御や、クライアント装置か
らの文書データ要求の受信や、生成された文書データの
クライアント装置への送信処理等を行う通信制御プログ
ラムを記憶している。通信制御プログラムと、通信制御
部207とが本発明の要求情報受信手段と、文書送信手段
との主体をなす。
は、中間形式文書データから、各種の目標言語文書デー
タを生成するための、目標言語文書生成プログラムを記
憶する。なお、目標言語文書生成プログラムが本発明の
目標言語文書生成手段の主体をなす。本実施の形態で
は、生成する文書の目標言語の種類に応じて目標言語文
書生成プログラムが別になっているものとし、目標言語
文書生成プログラム記憶部202bは、生成する文書の目標
言語に応じた少なくとも1つの目標言語文書生成プログ
ラムを記憶する。なお、上記以外に、各目標言語に対応
した別々の目標言語文書生成プログラムを用いるのでは
なく、すべての目標言語に対応できる単一の目標言語文
書生成プログラムを用い、目標言語文書生成プログラム
記憶部202bはその単一の目標言語文書生成プログラムを
記憶してもよい。あるいは、言語構造として類似した複
数の目標言語に対応可能な目標言語文書生成プログラム
を用い、それを記憶してもよい。
202cは、所定の自然言語で記述された文書データに基づ
いて、中間形式文書データを作成する中間形式文書デー
タ作成プログラムを記憶する。なお、中間形式文書デー
タ作成プログラムが本発明の原文書解析手段の主体をな
す。
式文書データ記憶部203dに対して中間形式文書データを
保存、読出し、あるいは、検索を行うときの主体となる
文書管理プログラムを記憶する。文書管理プログラム
が、本発明の文書読出し手段の主体をなす。
プログラムが処理を行う場合に必要とされる、目標言語
に対応した生成規則データ、形態素生成辞書などの各種
データを記憶している。さらに翻訳辞書記憶部202eは、
中間形式文書データ作成プログラムが処理を行う場合に
必要とされる形態素解析辞書、構文規則データ、構文解
析辞書、依存規則データなどの各種データも記憶してい
る。
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
の保存や、様々な一時データを記憶するために使用さ
れ、次のような各記憶部が内部に形成されている。
時に必要とする一時的な記憶領域を提供する。生成文書
メモリ203bは、中間形式文書データ記憶部203dに記憶さ
れた中間形式文書データに基づいて、目標言語文書生成
プログラム記憶部202bに記憶された目標言語文書生成プ
ログラムが生成した目標言語文書データを一時的に記憶
する。原文書メモリ203cは、中間言語作成プログラムの
入力データとなる、所定の自然言語で記述された文書デ
ータ(以下、原文書データと呼ぶ)を記憶する。原文書デ
ータは入力部206や、通信制御部207を介して入力され
る。なお、入力部206及び通信制御部207は、本発明の原
文書入力手段の主体をなすものである。
式文書データを少なくとも1つ記憶している。中間形式
文書データ記憶部203dが、本発明の中間形式文書記憶手
段の主体をなす。
スク装置や、光磁気ディスク装置等の記憶装置であって
もよい。さらに、中間形式文書データの作成を行わない
場合においては、中間形式文書データ記憶部203dはROM2
02上に形成してもよい。
ータ作成プログラムをサーバー装置102内に記憶し、本
サーバー装置102内で、原文書から中間形式文書データ
を作成する構成としたが、本サーバー装置102内には中
間形式文書データ作成プログラムを記憶せず、別の装置
で作成された中間形式文書データをサーバー装置への入
力とし、記憶する構成としてもよい。
ライアント装置のブロック図を示す。
3、CPU304、表示制御部305、入力部306、通信制御部307
及びそれらを接続するバス309より構成される。CPU304
は、記憶されている各種のプログラムに基づいて様々な
制御を実行し、本クライアント装置103の動作の主体を
なしている。表示制御部305は、表示データの蓄積とデ
ィスプレイモニターの制御を行い、モニター308に表示
出力を行う。モニター308はCRTディスプレイや、LCDデ
ィスプレイなど様々な表示装置を利用できる。入力部30
6は、文書データの文書識別情報や、要求言語情報など
を入力したり、クライアント装置103への各種指示を入
力するためのものであり、キーボード装置である。通信
制御部307は、通信網210と接続され、通信網210とクラ
イアント装置103とのデータ通信を制御し、データの
送受信を行う。通信制御部307は、公衆回線や、専用
回線と接続するためのモデム装置である。
マウス装置などの指示装置や、音声入力装置、タッチパ
ネル装置などの様々な入力装置や、その組み合わせで構
成してもよい。また、通信制御部307は、無線の公衆回
線や専用回線と接続するための送受信装置とか、LANに
接続するためのイーサーネット接続装置、トークンリン
グ接続装置とか、ATM回線網への接続装置等、様々な接
続装置でもよい。また、表示制御部305とモニター308と
を用いる以外に、印字出力装置や、音声出力装置を用い
る構成とし、文書データを印字出力や音声出力する構成
としてもよい。
れている。通信制御プログラム記憶部302aは、通信制御
部307を介した各種通信の制御や、サーバー装置へのデ
ータ送受信処理等を行う通信制御プログラムを記憶して
いる。この通信制御プログラムと、通信制御部307とが
本発明の要求情報送信手段の主体をなす。表示プログラ
ム記憶部302bは、サーバーから受信した文書データを表
示制御部305を用いて表示するための表示プログラムを
記憶している。表示プログラムと、表示制御部305と、
通信制御プログラムと、通信制御部307とが本発明の受
信出力手段の主体をなす。要求情報入力プログラム記憶
部302cは、ユーザーが入力部306を用いて、所望する文
書データの文書識別情報と、要求言語情報とを入力する
処理を制御するための、要求情報入力プログラムを記憶
する。
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
めに使用され、次のような各記憶部が内部に形成されて
いる。ワークメモリ303aは各プログラムが動作時に必要
とする一時的な記憶領域を提供する。受信文書メモリ30
3bは、サーバー装置から受信した文書データを一時保存
する。なお、RAM303は、RAMに限らず、磁気ディスク装
置や、光磁気ディスク装置等の記憶装置であってもよ
い。
装置103との基本的な処理の流れを図4を用いて説明す
る。まず、クライアント装置103では、所望する文書デ
ータの指示情報の入力処理を行う(S401、Sはステップを
示す。以下同様)。次に、入力した指示情報からその文
書データが所在するサーバー装置を通信ネットワーク上
で一意に決定する情報である、サーバー装置のアドレス
を取得する(S402)。本実施の形態では、サーバー装置の
アドレスとしてTCP/IP(Transmission Control Protocol
/Internet Protocol)で規定されるホスト名あるいはIP
アドレスを用いるものとするが、他に通信ネットワーク
上のアドレスを決定できる情報であれば何でもよい。次
に、所望する文書データ指示情報から、その文書データ
のサーバー装置内での指示情報である文書識別情報を決
定する(S403)。次に、所望する文書データがどの自然言
語によって記述されるかを指定する要求言語の情報を決
定する(S404)。
語情報とをS402で決定されたアドレスのサーバー装置に
送信する(S405)。本実施の形態では、サーバー装置への
送信方法として、TCP/IP上のHTTP(Hyper Text Transfer
Protocol)を用いるとする。具体的には、クライアント
装置は、図5(a)に示す形式のデータをサーバー装置に
送信する。"GET"はデータ要求を意味し、<文書識別情報
>にはS402で決定された文書識別情報を指定する。<バー
ジョン情報>はHTTPのバージョン情報を指定し、<CRLF>
は復帰改行文字を示す。<各種ヘッダー情報>にはHTTPで
規定されたヘッダー情報を必要に応じて指定する。"Acc
ept-Language:"は次に要求言語情報が続くことを示す文
字列であり、<要求言語>には要求言語を識別するあらか
じめ定められた文字列を指定する。図5(b)は文書識別
情報として"/pub/sample.html"、HTTPバージョンが1.
0、日本語を要求言語とした場合の例である。なお、上
述したTCP/IPおよびHTTPは、すでに広く実用化された公
知の技術であるため、説明を省略する。
置から送信された要求文書の文書識別情報と、要求言語
情報を受信し(S408)、受信した情報に基づいて所望の自
然言語による所望の文書データを生成するために、文書
データ生成処理を実行する(S409)。S409の詳細は後述す
る。S409にて所望の自然言語による所望の文書データを
生成できない場合は、それをエラーと判定する(S410)。
本実施の形態では、このエラーの判定は後述するエラー
フラグを参照することで判定する。エラーでなければ生
成した文書データをクライアントに送信し(S411)、エラ
ーならばエラー情報を送信する(S412)。クライアントで
はサーバーから文書データもしくはエラー情報を受信し
(S406)、表示装置に表示する(S407)。
ついて、図6を用いて説明する。まず、エラー状態を記
憶するために、ワークメモリ203a内に形成されたエラー
フラグ(図示せず)をクリアーして、エラーなしの状態と
する(S601)。次に、文書識別情報で指定された文書デー
タの有無を判定し(S602)、もし、該当する文書データが
サーバー装置内に存在しない場合は(S602:No)、エラー
とするためにS607に処理を進め、存在した場合は(S602:
Yes)、S603に処理を進める。S603では、文書管理プログ
ラムが、クライアントから送信された文書識別情報で指
示された中間形式文書データを、中間形式文書データ記
憶部203dから検索して、ワークメモリ203aに読み込む。
本実施の形態においては、中間形式文書データ記憶部20
3dで記憶される中間形式文書データは、それぞれの中間
形式文書データが1つのファイルに対応するものとし、
文書データを指定する文書識別情報としては、中間形式
文書データを収納しているファイル名を用いるものとす
る。この場合は、文書識別情報で示されたファイル名の
ファイルが存在するか否かでS602の判定を行い、S603で
は文書管理プログラムがそのファイルのデータをワーク
メモリ203aに読み込むこととなる。
いる方法以外に、文書管理プログラムとしてデータベー
ス管理プログラムを用い、中間形式文書データ記憶部20
3dとしてデータベースの記憶領域を対応させ、文書識別
情報としてデータベース内の文書データを特定可能な指
示情報を用いてもよい。
S408にて受信した要求言語情報に基づいた目標言語に翻
訳可能か否かを判定する(S604)。本実施の形態では、前
述したように各目標言語毎に個別の目標言語文書生成プ
ログラムを持つので、S408にて受信した要求言語情報に
対応した目標言語文書生成プログラムが目標言語文書生
成プログラム記憶部202bに記憶されているか否かで、S6
04の判定を行う。
から目標言語文書データを生成する、目標言語文書生成
処理を実行する。S605の詳細は後述する。S606では、S6
05にて生成された目標言語文書データを、送信のために
一旦生成文書メモリ0203bに記憶する。S607では、S602
とS604での判定を受けて、エラー処理をするためにエラ
ーフラグをセットしてエラー状態を記憶する。
す中間形式文書データ作成プログラムの処理の詳細を、
図7、図8、図9を用いて説明する。
記述された文書データを入力する(S701)。
リ203cに保存される(S702)。この文書データが原文書デ
ータとして処理される。
ける(S703)。S703では、翻訳辞書記憶部202eに記憶され
た形態素解析辞書を参照し、原文書を形態素に分割し、
形態素列に変換し、各形態素の品詞の判定を行う。日本
語から中間形式文書データを生成する一例として、図8
(a)に示す原文書であれば、形態素解析処理により図8
(b)のような形態素列からなる形態素解析結果が得られ
る。
は、S703で解析された品詞情報を含む形態素列に、翻訳
辞書記憶部202eに記憶された構文規則データと、構文解
析辞書の情報を適用し、各形態素間の修飾関係を解析す
ると共に、格の意味的な役割を決定し、構文解析木を形
成する。たとえば、図8(b)のような形態素解析結果
は、図8(c)で示される構文解析木からなる構文解析結
果を得る。ここで、「S」は文を、「NP」は名詞句を、
「ADV」は副詞を、「VP」は動詞句をそれぞれ表すもの
である。
05では、S704の解析結果である構文解析木に基づき依存
構造を形成する。図8(c)の構文解析結果に対して依存
構造解析処理を行うと、図9(a)のような依存構造が得
られる。ここで、「PRED」は述部を、「NOM」は依存構
造名詞句を、「ADV」は副詞をそれぞれ表す。
中間形式文書データ記憶部203dに保存する(S706)。
の依存構造の表現を用い、上記のように文章を解析した
結果得られる、依存構造で表現された文章の意味内容を
表すデータを、中間形式文書データとして用いることと
する。具体的には、図10(a)に記載するような構造要
素1005の集合として記憶する。各構造要素1005は、構造
種別1001と、格情報1002と、辞書ポインター1003と、従
属構造数1004との4つの項目を持つ。構造種別1001は、
述部とか、名詞句とかの種別をフラグとして記憶する。
格情報1002は、主格とか目的格、あるいは様態などの格
の種別情報を必要に応じてフラグとして記憶する。辞書
ポインター1003は、その構造要素に対応した単語の情報
を収納している辞書データへのポインターを記憶する。
従属構造数1004は、その構造要素に直接従属する構造要
素がいくつあるかを記憶する。なお、従属構造数1004
は、その構造要素に従属する構造要素にさらに従属す
る、つまり入れ子として間接的に従属する要素の個数は
含まない。
憶した場合は、図10(b)のようなデータとなる。ここ
で、「K1」は主格を、「K2」は目的格を、「K3」は様態
の格を表す。また、辞書ポインターは、図10(c)に例
示された辞書データの番号1006を表している。辞書デー
タには、原文書で用いられた言語の単語1007と、その品
詞1008、及び他の言語の対応する単語1009や、さらに各
種の文法情報などが記憶される。図10(c)では、他の
言語が英語である場合の例示である。なお、中間形式文
書データとしては上記の方法以外に、人工的に定義され
た可読性のある言語(以下、共通言語という)を、中間形
式表現として用い、その言語で記述された文書データを
中間形式文書データとして用いてもよい。例えば、特開
平6-325080公報に開示されているような、人工的に設計
した言語で記述した文章を中間形式文書データとしても
よい。
を、図11と図9とを用いて説明する。目標言語文書生
成処理は、本発明の目標言語文書生成手段の主体をなす
目標言語文書生成プログラムが行う処理である。
まれた中間形式文書データに対し、構文生成処理を行う
(S1101)。構文生成処理では、中間形式文書データに記
述された依存構造に基づいて、生成規則データを参照し
つつ目標言語の構文木を生成し、語順を決定する。
語の語尾等を必要に応じて変化させ、生成文書データの
生成を完了する。目標言語が英語である一例を挙げれ
ば、図9(a)で示される依存構造の文に対し、構文生成
処理と、形態素生成処理の処理を行うと、図9(b)に示
されるような目標言語文書生成結果が得られることとな
る。ここで、「PRON」は代名詞、「V」は動詞、「ART」
は冠詞、「N」は名詞をそれぞれ表す。
文書データとして記憶されている依存構造データをその
まま構文生成処理への入力としたが、構文生成処理への
入力の前に依存構造変換処理を行ってもよい。これは具
体的には、中間形式文書データに記憶されている文章の
依存構造をそのまま用いるのではなく、中間形式変換手
段に対応する依存構造変換処理を行い、目標言語に対応
した依存構造に変換してから、構文生成処理への入力と
する。
解析処理、構文解析処理、依存構造解析処理、構文生成
処理、及び形態素生成処理のそれぞれは、電子技術総合
研究所と京都大学による「日英科学技術文献の速報シス
テムに関する研究−言語処理システムの開発に関する報
告書」や、特開昭62-203273号公報に開示されている公
知の技術である。
本発明の請求項1記載の多言語対応通信システムは、ク
ライアントから所望の記述言語を指定でき、それに従っ
て中間形式文書データの形式で記憶された文書データか
ら自然言語で記述された文書データを生成し、クライア
ント装置で出力できるので、サーバー装置に多数の言語
で記述した文書データを保存したり、クライアント装置
に言語翻訳プログラムを搭載することなく、所望の言語
で表記された文書データの閲覧をすることができる。
テムは、自然言語で記述された原文書データから中間形
式文書データを生成するため、中間形式文書データを容
易に作成できる。
テムは、中間形式表現として人工的に定義された可読性
のある言語を用いることで、中間形式文書データの変更
や管理を容易に行うことができる。
ライアントから指定された所望の記述言語に従って中間
形式文書データの形式で記憶された文書データから自然
言語で記述された文書データを生成し、クライアント装
置で出力できるので、サーバー装置に多数の言語で記述
した文書データを保存したり、クライアント装置に言語
翻訳プログラムを搭載することなく、所望の言語で表記
された文書データの閲覧をすることができる。
然言語で記述された原文書データから中間形式文書デー
タを生成するため、中間形式文書データを容易に作成す
ることができる。
間形式表現として人工的に定義された可読性のある言語
を用いることで、中間形式文書データの変更や管理を容
易に行うことができる。
の概要を示す説明図である。
る。
である。
置との処理の流れを示すフローチャートである。
の説明図である。
ャートである。
ラムの処理のフローチャートである。
の説明に供する説明図である。
と、目標言語文書生成処理の説明に供する説明図であ
る。
供する説明図である。
ーチャートである。
る。
Claims (6)
- 【請求項1】 所望とする文書データを受信可能なクラ
イアント装置と、そのクライアント装置からの要求に応
じた文書データをクライアント装置に送信するサーバー
装置とから構成される通信システムであって、 前記クライアント装置は、 前記文書データを特定可能な文書識別情報と、前記文書
データの記述言語を指定する要求言語情報とを前記サー
バー装置に送信する要求情報送信手段と、 前記サーバー装置より前記文書データを受信し、出力す
る受信出力手段とを備え、 前記サーバー装置は、 前記クライアント装置から前記文書識別情報と、前記要
求言語情報とを受信する要求情報受信手段と、 少なくとも一つの文書データを、自然言語で記述された
文書を文法的、意味的に解析した結果として得られる中
間形式表現で記述した中間形式文書データとして記憶す
る中間形式文書記憶手段と、 前記文書識別情報に対応した中間形式文書データを、前
記中間形式記憶手段から読出す文書読出し手段と、 前記文書読出し手段で読出した中間形式文書データか
ら、前記要求言語情報に対応した言語で記述した目標言
語文書データを生成する目標言語文書生成手段と、 前記目標言語文書生成手段で生成された目標言語文書デ
ータを、前記クライアント装置に送信する文書送信手段
とを備えたことを特徴とする多言語対応通信システム。 - 【請求項2】 前記サーバー装置は、 所定の言語で記述された原文書データを入力する原文書
入力手段と、 前記原文書入力手段で入力した原文書データを解析し、
その原文書データの解析結果から中間形式文書データを
生成する原文書解析手段とをさらに備えたことを特徴と
する請求項1記載の多言語対応通信システム。 - 【請求項3】 前記中間形式文書記憶手段は、人工的に
定義された可読性のある言語である共通言語で記述され
た文書データを中間形式文書データとして記憶するよう
に構成されたことを特徴とする請求項1または2記載の
多言語対応通信システム。 - 【請求項4】 クライアント装置からの要求に応じた文
書データを前記クライアント装置に送信するサーバー装
置であって、 前記クライアント装置から前記文書データを特定可能な
文書識別情報と、前記文書データの記述言語を指定する
要求言語情報とを受信する要求情報受信手段と、 少なくとも一つの文書データを、自然言語で記述された
文書を文法的、意味的に解析した結果として得られる中
間形式表現で記述した中間形式文書データとして記憶す
る中間形式文書記憶手段と、 前記文書識別情報に対応した中間形式文書データを、前
記中間形式記憶手段から読出す文書読出し手段と、 前記読出し手段で読出した中間形式文書データから、前
記要求言語情報に対応した言語で記述した目標言語文書
データを生成する目標言語文書生成手段と、 前記目標言語文書生成手段で生成された目標言語文書デ
ータを、前記クライアント装置に送信する文書送信手段
とを備えたことを特徴とするサーバー装置。 - 【請求項5】 所定の言語で記述された原文書データを
入力する原文書入力手段と、 前記原文書入力手段で入力した原文書データを解析し、
その原文書データの解析結果から中間形式文書データを
生成する原文書解析手段とをさらに備えたことを特徴と
する請求項4記載のサーバー装置。 - 【請求項6】 前記中間形式記憶手段は、人工的に定義
された可読性のある言語である共通言語で記述された文
書データを中間形式文書データとして記憶するように構
成されたことを特徴とする請求項4または5記載のサー
バー装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32284296A JP3467159B2 (ja) | 1996-12-03 | 1996-12-03 | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 |
US08/984,293 US6092035A (en) | 1996-12-03 | 1997-12-03 | Server device for multilingual transmission system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32284296A JP3467159B2 (ja) | 1996-12-03 | 1996-12-03 | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10162007A true JPH10162007A (ja) | 1998-06-19 |
JP3467159B2 JP3467159B2 (ja) | 2003-11-17 |
Family
ID=18148222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP32284296A Expired - Fee Related JP3467159B2 (ja) | 1996-12-03 | 1996-12-03 | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3467159B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001039035A1 (fr) * | 1999-11-17 | 2001-05-31 | United Nations | Systeme de traduction |
WO2001039034A1 (fr) * | 1999-11-17 | 2001-05-31 | United Nations | Systeme destine a creer une expression dans une langue universelle et support d'enregistrement sur lequel des regles de traduction destinees a ce systeme sont enregistrees |
JP2009080806A (ja) * | 2007-09-04 | 2009-04-16 | Yahoo Japan Corp | Webページにリンクを挿入する方法 |
-
1996
- 1996-12-03 JP JP32284296A patent/JP3467159B2/ja not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001039035A1 (fr) * | 1999-11-17 | 2001-05-31 | United Nations | Systeme de traduction |
WO2001039034A1 (fr) * | 1999-11-17 | 2001-05-31 | United Nations | Systeme destine a creer une expression dans une langue universelle et support d'enregistrement sur lequel des regles de traduction destinees a ce systeme sont enregistrees |
US6704700B1 (en) | 1999-11-17 | 2004-03-09 | United Nations | System for creating expression in universal language, and recorded medium on which translation rules used for the system are recorded |
US7107206B1 (en) | 1999-11-17 | 2006-09-12 | United Nations | Language conversion system |
JP2009238255A (ja) * | 1999-11-17 | 2009-10-15 | United Nations | 普遍言語による表現を生成するシステムおよびこれに用いられる変換規則を記録した記録媒体 |
JP2009080806A (ja) * | 2007-09-04 | 2009-04-16 | Yahoo Japan Corp | Webページにリンクを挿入する方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3467159B2 (ja) | 2003-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6092035A (en) | Server device for multilingual transmission system | |
JP3066274B2 (ja) | 機械翻訳装置 | |
KR100815215B1 (ko) | 웹사이트 통합 검색 장치 및 방법 | |
EP0940762A2 (en) | Multilingual patent information search system | |
US20020122053A1 (en) | Method and apparatus for presenting non-displayed text in Web pages | |
US20020002452A1 (en) | Network-based text composition, translation, and document searching | |
JPH0869470A (ja) | 自然言語処理装置及びその方法 | |
US7200808B1 (en) | Electronic document processor | |
US20020059348A1 (en) | Automatic documentation generation tool and associated method | |
US7155664B1 (en) | Extracting comment keywords from distinct design files to produce documentation | |
US7401016B2 (en) | Communication support system, communication support method, and computer program | |
JPH0310979B2 (ja) | ||
JP3467160B2 (ja) | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 | |
US20020143817A1 (en) | Presentation of salient features in a page to a visually impaired user | |
KR101802051B1 (ko) | 자연 언어 처리 스키마 및 그 지식 데이터베이스 구축 방법 및 시스템 | |
JP3467159B2 (ja) | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 | |
JP3434161B2 (ja) | 多言語対応通信システム | |
JPH10222516A (ja) | 多言語対応通信システム | |
JPH10187732A (ja) | 多言語対応通信システム | |
JP2003296327A (ja) | 翻訳サーバ、ジャンル別オンライン機械翻訳方法、およびそのプログラム | |
JP3467161B2 (ja) | 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法 | |
JPH10222513A (ja) | 多言語対応通信システム | |
KR100836159B1 (ko) | 반자동 번역 서비스 제공 시스템 및 방법 | |
JPH10187731A (ja) | 多言語対応通信システム | |
JPH10214266A (ja) | 多言語対応通信システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030812 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080829 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090829 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100829 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110829 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130829 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |