JPH10207892A - Multilingual communication system - Google Patents

Multilingual communication system

Info

Publication number
JPH10207892A
JPH10207892A JP9006161A JP616197A JPH10207892A JP H10207892 A JPH10207892 A JP H10207892A JP 9006161 A JP9006161 A JP 9006161A JP 616197 A JP616197 A JP 616197A JP H10207892 A JPH10207892 A JP H10207892A
Authority
JP
Japan
Prior art keywords
document
document data
target language
language
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9006161A
Other languages
Japanese (ja)
Inventor
Atsushi Kawai
淳 河合
Norihisa Fujii
則久 藤井
Atsuhiko Kurachi
敦彦 倉知
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP9006161A priority Critical patent/JPH10207892A/en
Publication of JPH10207892A publication Critical patent/JPH10207892A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a multilingual communication system which does not require a special language translation program on a client device and can provide document data described in many languages more speedily. SOLUTION: Natural language document data generated at a request from the client device 103 are sent to the client device 103 and also stored in a document data storage part of a server device 102. Then when the client device 103 requests the document data in the same language, the document data stored in the document data storage part of the server device 102 are read out and transmitted to omit a generating process for the natural language document data, and it becomes possible to send the document data in a short time after a request from the client device 103.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、翻訳機能を有する
ことにより所望の言語による文書データを提供すること
が可能な多言語対応通信システムに関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multilingual communication system having a translation function and capable of providing document data in a desired language.

【0002】[0002]

【従来の技術】従来、インターネットに代表されるよう
に、通信ネットワークを介して、文書データを検索、閲
覧するシステムが普及している。この様なシステムは、
各種の文書データを記憶する1つ以上のサーバー装置
と、文書データの表示が可能な1つ以上のクライアント
装置と、それらを接続する通信ネットワークとで構成さ
れる。通信ネットワークは、公衆回線網や、専用回線網
あるいはその組み合わせから構成される。サーバー装置
は、各種の文書データが記憶できる記憶装置と、通信ネ
ットワークへの接続装置とを備え、クライアント装置は
文書データを表示可能な表示装置と、閲覧したい文書の
指示情報を入力できる入力装置と、通信ネットワークへ
の接続装置とを備える。
2. Description of the Related Art Conventionally, a system for searching and browsing document data via a communication network, such as the Internet, has become widespread. Such a system,
It comprises one or more server devices for storing various types of document data, one or more client devices capable of displaying document data, and a communication network connecting them. The communication network includes a public line network, a dedicated line network, or a combination thereof. The server device includes a storage device capable of storing various types of document data, and a connection device to a communication network.The client device includes a display device capable of displaying document data, and an input device capable of inputting instruction information of a document to be viewed. And a connection device to a communication network.

【0003】例えば、インターネットでは、サーバー装
置、クライアント装置共に非常に多くの装置が接続され
ており、その所在地も全世界に広がっている。そして、
それらを接続する通信ネットワークを介して世界各地の
様々な情報を、検索、閲覧することが可能なシステムと
なっている。
[0003] For example, on the Internet, a great number of devices are connected to both server devices and client devices, and their locations are spread all over the world. And
The system is capable of searching and browsing various information in various parts of the world via a communication network connecting them.

【0004】このようなインターネットでは、図13に
示すように、各サーバー装置1302には、英語とか、
日本語、中国語等の様々な言語で記述された文書データ
が記憶されている。通信ネットワーク1301を介して
サーバー装置に接続されているクライアント装置130
3では、これらの様々な言語で記述された文書データを
それぞれの言語で表示することが可能である。また、言
語翻訳プログラムを内蔵するクライアント装置もあり、
必要に応じて所望の言語に翻訳して文書データを表示す
ることも可能である。
In such an Internet, as shown in FIG. 13, each server device 1302 has English,
Document data described in various languages such as Japanese and Chinese is stored. Client device 130 connected to server device via communication network 1301
In No. 3, document data described in these various languages can be displayed in each language. There is also a client device with a built-in language translation program.
If necessary, the document data can be displayed after being translated into a desired language.

【0005】[0005]

【発明が解決しようとする課題】上述したシステム、特
にインターネットのように全世界に広がったネットワー
クを介して様々な文書データを閲覧する場合、文書デー
タの提供者と、その文書データの閲覧者とは異なる言語
を母国語としていることが多い。しかし、母国語以外の
言語での記述や、その理解には困難を伴うことが多い。
これを解決するため、次の2つの方法が知られている。
1つは、同一内容の文書を複数の言語で記述された複数
の文書データとしてサーバー装置に記憶させ、所望の言
語の文書データをクライアント装置から選択すること
で、所望の言語で記述された文書データを閲覧可能とす
る方法である。他の方法は、言語翻訳プログラムをクラ
イアント装置に搭載し、その言語翻訳プログラムを用い
てサーバーから送信されてきた文書データを所望する言
語の文書データに翻訳する方法である。これらの方法に
より、母国語以外の言語で記述された文書データも母国
語で閲覧可能となる。しかし、その場合でも以下のよう
な問題が残されている。
SUMMARY OF THE INVENTION When browsing various document data via the above-mentioned system, particularly a network spread all over the world such as the Internet, a document data provider and a viewer of the document data need to communicate with each other. Often use a different language as their native language. However, writing and understanding in languages other than the native language is often difficult.
To solve this, the following two methods are known.
One is to store a document having the same content as a plurality of document data described in a plurality of languages in a server device, and select document data in a desired language from a client device to thereby obtain a document described in a desired language. This is a method that allows data to be browsed. Another method is to mount a language translation program on a client device and use the language translation program to translate document data transmitted from a server into document data in a desired language. With these methods, document data described in a language other than the native language can also be browsed in the native language. However, even in that case, the following problems remain.

【0006】先ず、同一内容の文書を複数の言語で記述
された複数の文書データとしてサーバー装置に記憶させ
る方法では、1つの内容の文書でも、その内容を様々な
言語で記述された複数の文書データとして作成する必要
があり、多くの費用と労力を必要とする問題がある。
First, in a method of storing a document having the same content as a plurality of document data described in a plurality of languages in a server device, even if a document has a single content, a plurality of documents having the same content described in various languages are stored. There is a problem that it needs to be created as data and requires a lot of cost and labor.

【0007】また、言語翻訳プログラムをクライアント
装置に搭載する方法では、各サーバーにより提供される
様々な言語の文章を全て翻訳して表示するためには、ク
ライアント装置にそれぞれの言語から所望の言語へ翻訳
可能な多数の言語翻訳プログラムを搭載する必要があ
る。これはクライアント装置のコストを上昇させる。ま
た、現在実用化されている言語翻訳プログラムでは、翻
訳する原文書に元来含まれている曖昧さにより、望まし
い翻訳結果が得られないと言う問題もある。
In the method in which a language translation program is mounted on a client device, in order to translate and display all sentences in various languages provided by each server, the client device converts the language from a desired language into a desired language. It is necessary to have a large number of language translation programs that can be translated. This increases the cost of the client device. Further, in a language translation program currently in practical use, there is a problem that a desired translation result cannot be obtained due to the ambiguity originally included in the original document to be translated.

【0008】これを解決するために、サーバー装置に記
憶される文書データを、自然言語で記述された文書デー
タではなく、自然言語で記述された文書データを文法
的、意味的に解析した結果として得られる中間形式文書
データとして記憶する。そして、クライアント装置から
文書データの要求があると、その文書データに対応した
中間形式文書データを記憶装置から読み出し、読み出し
た中間形式文書データからクライアント装置が要求する
自然言語で記述された文書データを生成し、生成された
文書データをクライアント装置に送信する。このよう
に、クライアント装置に特別な言語翻訳プログラムを必
要とせず、かつ多数の言語で記述される文書データをよ
り簡易に提供可能な多言語対応通信システムが考えられ
る。
In order to solve this problem, the document data stored in the server device is not a document data described in a natural language but a grammatically and semantically analyzed document data described in a natural language. The obtained intermediate format document data is stored. When there is a request for document data from the client device, the intermediate format document data corresponding to the document data is read from the storage device, and from the read intermediate format document data, the document data described in the natural language requested by the client device is converted. The generated document data is transmitted to the client device. As described above, a multilingual communication system that does not require a special language translation program in the client device and that can easily provide document data described in many languages can be considered.

【0009】しかし、このような通信システムでは、中
間形式文書データから、所望の自然言語(以下、目標言
語と呼ぶ)で記述された文書データを生成するプログラ
ム(以下、目標言語文書生成プログラムと呼ぶ)は複雑
な処理を行っており、クライアント装置からの要求を受
けて目標言語文書を生成し、その文書をクライアント装
置へ送信するまでに長い時間を必要とする点が問題とな
っていた。
However, in such a communication system, a program for generating document data described in a desired natural language (hereinafter referred to as a target language) from intermediate format document data (hereinafter referred to as a target language document generation program). ) Performs a complicated process, and it takes a long time to generate a target language document in response to a request from a client device and to transmit the document to the client device.

【0010】本発明は、上述した問題点を解決するため
になされたものであり、クライアント装置からの要求を
受けてから短時間で文書を送信できる多言語対応通信シ
ステムを提供することを目的としている。
SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and has as its object to provide a multilingual communication system capable of transmitting a document in a short time after receiving a request from a client device. I have.

【0011】[0011]

【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に記載の多言語対応通信システム
は、クライアント装置と、前記クライアント装置からの
要求に応じた文書データを前記クライアント装置に送信
するサーバー装置とから構成される。前記クライアント
装置では、要求情報送信手段が、所望の文書データを特
定可能な文書識別情報と、その文書データの記述言語を
指定する要求言語情報とを前記サーバー装置に送信し、
前記受信出力手段が、前記サーバー装置から文書データ
を受信し、表示出力、印字出力、音声出力等の出力処理
を行う。
In order to achieve the above object, a multilingual communication system according to a first aspect of the present invention provides a multilingual communication system which converts a client device and document data in response to a request from the client device. And a server device for transmitting to the client device. In the client device, the request information transmitting unit transmits, to the server device, document identification information that can specify desired document data and request language information that specifies a description language of the document data,
The reception output unit receives the document data from the server device and performs output processing such as display output, print output, and voice output.

【0012】そして、前記サーバー装置では、要求情報
受信手段が前記クライアント装置から前記文書識別情報
と、前記要求言語情報とを受信し、中間形式文書記憶手
段が、自然言語で記述された文書を文法的、意味的に解
析した結果として得られる中間形式表現で記述した中間
形式文書データを少なくとも1つ記憶し、中間形式文書
読み出し手段が、前記文書識別情報に対応した文書デー
タを、前記中間形式文書記憶手段から読み出し、目標言
語文書生成手段が、前記中間形式文書読み出し手段で読
み出した文書データから、前記要求言語情報に対応した
言語で記述された目標言語文書データを生成し、さら
に、目標言語文書書き込み手段が、前記目標言語文書生
成手段で生成された目標言語文書データに、生成される
際に元となった中間形式文書データと記述言語とを特定
する文書対応情報を付加して、目標言語文書記憶手段に
書き込む。目標言語文書判定手段は、前記中間形式文書
読み出し手段の実行に先立って実行され、前記文書識別
情報と前記要求言語情報に対応する文書対応情報を持つ
目標言語文書データが前記目標言語文書記憶手段に記憶
されているか否か判定する。
In the server device, the request information receiving unit receives the document identification information and the request language information from the client device, and the intermediate format document storage unit converts a document described in a natural language into a grammar. And storing at least one intermediate format document data described in an intermediate format expression obtained as a result of analyzing the target document, the intermediate format document reading means stores the document data corresponding to the document identification information in the intermediate format document. The target language document generating means for generating target language document data described in a language corresponding to the requested language information from the document data read by the intermediate format document reading means; A writing unit configured to add, to the target language document data generated by the target language document generation unit, an intermediate code generated when the target language document data is generated; By adding the document corresponding information identifying the formula document data and description language, writes into target language document memory means. The target language document determination means is executed prior to the execution of the intermediate format document reading means, and stores target language document data having document correspondence information corresponding to the document identification information and the requested language information in the target language document storage means. It is determined whether or not it is stored.

【0013】そして、前記目標言語文書判定手段で記憶
されていると判定された場合、目標言語文書読み出し手
段が前記文書識別情報と前記要求言語情報に対応する文
書対応情報を持つ目標言語文書データを前記目標言語文
書記憶手段から読み出す。そして、文書送信手段が、前
記目標言語文書読み出し手段で読み出された目標言語文
書データを前記クライアント装置に送信する。
If it is determined by the target language document determining means that the target language document is stored, the target language document reading means reads the target language document data having the document identification information and the document correspondence information corresponding to the requested language information. Read from the target language document storage means. Then, the document transmitting means transmits the target language document data read by the target language document reading means to the client device.

【0014】[0014]

【発明の実施の形態】以下に、本発明の多言語対応通信
システムを具体化した実施の形態について図面を参照し
て説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of a multilingual communication system according to the present invention will be described below with reference to the drawings.

【0015】図1に本発明の多言語対応通信システムの
概念図を示す。サーバー装置102は、文書データを、
特定の自然言語によらない中間形式文書データ(詳細は
後述)として記憶している。また、中間形式文書データ
から、目標となる自然言語(以下、目標言語と呼ぶ)で
記述された文書データを生成するための目標言語文書生
成プログラムも記憶している。クライアント装置103
は通信ネットワーク101を介して、文書データの指示
情報と、その文書データの記述言語の指示情報とからな
る要求情報を所望のサーバー装置102に送信する。サ
ーバー装置102は、クライアント装置103から送信
された要求情報に基づいて、指定された中間形式文書デ
ータから指定された自然言語による文書データを生成
し、生成した文書データを通信ネットワーク101を介
してクライアント装置103に送信する。そして、クラ
イアント装置はその文書データを受信し、表示出力、印
字出力、音声出力等の出力を行う。
FIG. 1 shows a conceptual diagram of a multilingual communication system according to the present invention. The server device 102 converts the document data into
It is stored as intermediate format document data not described in a specific natural language (details will be described later). Also, a target language document generation program for generating document data described in a target natural language (hereinafter, referred to as a target language) from the intermediate format document data is stored. Client device 103
Transmits, via a communication network 101, request information including instruction information of document data and instruction information of a description language of the document data to a desired server apparatus 102. The server device 102 generates document data in the specified natural language from the specified intermediate format document data based on the request information transmitted from the client device 103, and transmits the generated document data to the client via the communication network 101. Transmit to the device 103. Then, the client device receives the document data and performs output such as display output, print output, and audio output.

【0016】図2に本発明を好適に適用したサーバー装
置のブロック図を示す。
FIG. 2 shows a block diagram of a server device to which the present invention is suitably applied.

【0017】サーバー装置102は、ROM202と、
RAM203、CPU204、表示制御部205、入力
部206、通信制御部207及びそれらを接続するバス
209により構成される。CPU204は記憶されてい
る各種のプログラムに基づいて様々な制御を実行し、本
サーバー装置102の動作の主体をなしている。表示制
御部205は表示データの蓄積とディスプレイモニター
の制御を行い、モニター208に表示出力を行う。モニ
ター208はCRTディスプレイや、LCDディスプレ
イなど様々な表示装置を利用できる。入力部206は、
記憶される文書データの入力や、サーバー装置102へ
の指示を入力するためのものであり、キーボード装置で
ある。通信制御部207は、通信網210と接続され
る。通信網210は、公衆回線や、専用回線の回線網で
あり、通信ネットワーク101の構成要素である。通信
制御部207は、通信網210とサーバー装置102と
のデータ通信を制御し、データの送受信を行う。通信制
御部207は、公衆回線や専用回線と接続するためのモ
デム装置である。
The server device 102 includes a ROM 202,
It comprises a RAM 203, a CPU 204, a display control unit 205, an input unit 206, a communication control unit 207, and a bus 209 connecting them. The CPU 204 executes various controls based on various stored programs, and forms the main body of the operation of the server device 102. The display control unit 205 stores display data and controls a display monitor, and outputs a display to the monitor 208. The monitor 208 can use various display devices such as a CRT display and an LCD display. The input unit 206
It is a keyboard device for inputting stored document data and inputting an instruction to the server device 102. The communication control unit 207 is connected to the communication network 210. The communication network 210 is a public network or a dedicated network, and is a component of the communication network 101. The communication control unit 207 controls data communication between the communication network 210 and the server device 102, and transmits and receives data. The communication control unit 207 is a modem device for connecting to a public line or a dedicated line.

【0018】なお、入力部206は、上記の構成以外
に、マウス装置等の指示装置や、音声入力装置、タッチ
パネル装置等の様々な入力装置や、その組み合わせで構
成してもよい。また、通信制御部207は、無線の公衆
回線や専用回線と接続するための送受信装置とか、LA
N(Local Area Network)に接続するためのイーサーネッ
ト接続装置、トークンリング接続装置とか、ATM(Asy
nchronous Transfer Mode)回線網への接続装置等、様々
な接続装置でもよい。
The input unit 206 may be constituted by a pointing device such as a mouse device, a voice input device, various input devices such as a touch panel device, or a combination thereof, in addition to the above configuration. The communication control unit 207 includes a transmitting / receiving device for connecting to a wireless public line or a dedicated line,
N (Local Area Network), an Ethernet connection device, a token ring connection device, or an ATM (Asy
Various connection devices may be used, such as a connection device to an nchronous transfer mode network.

【0019】ROM202は各種プログラムや、翻訳辞
書のデータ等を記憶している。
The ROM 202 stores various programs, translation dictionary data, and the like.

【0020】ROM202内にはさらに各種の記憶部が
形成されている。通信制御プログラム記憶部202a
は、通信制御部207を介した各種通信の制御や、クラ
イアント装置からの文書データ要求の受信や、生成され
た文書データのクライアント装置への送信処理等を行う
通信制御プログラムを記憶している。通信制御プログラ
ムと、通信制御部207とが本発明の要求情報受信手段
と、文書送信手段との主体をなす。
Various storage units are further formed in the ROM 202. Communication control program storage unit 202a
Stores a communication control program for controlling various kinds of communication via the communication control unit 207, receiving a document data request from the client device, transmitting the generated document data to the client device, and the like. The communication control program and the communication control unit 207 form the subject of the request information receiving unit and the document transmitting unit of the present invention.

【0021】目標言語文書生成プログラム記憶部202
bは、中間形式文書データから、各種の目標言語文書デ
ータを生成するための、目標言語文書生成プログラムを
記憶する。なお、目標言語文書生成プログラムが本発明
の目標言語文書生成手段の主体をなす。また、目標言語
文書生成プログラムは、少なくとも1つの所定の言語で
記述された文書データから、目標言語文書を生成するも
のであってもよい。本実施の形態では、生成する文書の
目標言語の種類に応じて目標言語文書生成プログラムが
別になっているものとし、目標言語文書生成プログラム
記憶部202bは、生成する文書の目標言語に応じた少
なくとも1つの目標言語文書生成プログラムを記憶す
る。なお、上記以外に、各目標言語に対応した別々の目
標言語文書生成プログラムを用いるのではなく、すべて
の目標言語に対応できる単一の目標言語文書生成プログ
ラムを用い、目標言語文書生成プログラム記憶部202
bはその単一の目標言語文書生成プログラムを記憶して
もよい。あるいは、言語構造として類似した複数の目標
言語に対応可能な目標言語文書生成プログラムを用い、
それを記憶してもよい。
Target language document generation program storage unit 202
“b” stores a target language document generation program for generating various target language document data from the intermediate format document data. Note that the target language document generation program forms the subject of the target language document generation means of the present invention. Further, the target language document generation program may generate a target language document from document data described in at least one predetermined language. In the present embodiment, the target language document generation program is assumed to be different according to the type of the target language of the document to be generated, and the target language document generation program storage unit 202b stores at least the target language according to the target language of the document to be generated. One target language document generation program is stored. In addition to the above, instead of using a separate target language document generation program corresponding to each target language, a single target language document generation program capable of supporting all target languages is used, and a target language document generation program storage unit is used. 202
b may store that single target language document generator. Alternatively, using a target language document generation program capable of supporting a plurality of target languages having similar language structures,
It may be stored.

【0022】中間形式文書データ作成プログラム記憶部
202cは、所定の自然言語で記述された文書データに
基づいて、中間形式文書データを作成する中間形式文書
データ作成プログラムを記憶する。
The intermediate format document data creation program storage section 202c stores an intermediate format document data creation program for creating intermediate format document data based on document data described in a predetermined natural language.

【0023】文書管理プログラム記憶部202dは、中
間形式文書データ記憶部203dに対して中間形式文書
データを保存、読み出し、あるいは、検索を行うときの
主体となる文書管理プログラムを記憶する。文書管理プ
ログラムが、本発明の中間形式文書読み出し手段の主体
をなす。
The document management program storage unit 202d stores a document management program that is the main entity when storing, reading, or searching for intermediate format document data in the intermediate format document data storage unit 203d. The document management program forms the subject of the intermediate format document reading means of the present invention.

【0024】翻訳辞書記憶部202eは、目標言語文書
生成プログラムが処理を行う場合に必要とされる、目標
言語に対応した生成規則データ、形態素生成辞書等の各
種データを記憶している。さらに、翻訳辞書記憶部20
2eは、中間形式文書データ作成プログラムが処理を行
う場合に必要とされる形態素解析辞書、構文規則デー
タ、構文解析辞書、依存規則データ等の各種データも記
憶している。
The translation dictionary storage unit 202e stores various data required when the target language document generation program performs processing, such as generation rule data corresponding to the target language and a morpheme generation dictionary. Further, the translation dictionary storage unit 20
2e also stores various data such as a morphological analysis dictionary, syntax rule data, a syntax analysis dictionary, and dependency rule data required when the intermediate format document data creation program performs processing.

【0025】目標言語文書データ書き込みプログラム記
憶部202fは、目標言語文書データに、目標言語文書
データの元となった中間形式文書データと記述言語とを
特定する文書対応情報とを加え、そのデータを目標言語
文書データ記憶部203eに対して書き込みを行うとき
の主体となる目標言語文書データ書き込みプログラムを
記憶する。目標言語文書データ書き込みプログラムが、
本発明の目標言語文書書き込み手段の主体をなす。
The target language document data writing program storage unit 202f adds, to the target language document data, the intermediate format document data from which the target language document data is based and the document correspondence information for specifying the description language, and stores the data. The target language document data writing program, which is the main body when writing to the target language document data storage unit 203e, is stored. The target language document data writing program is
The object of the target language document writing means of the present invention.

【0026】目標言語文書データ読み出しプログラム記
憶部202gは、目標言語文書データ記憶部203eに
対して、目標言語文書データの元となった中間形式文書
データと記述言語とを特定する文書対応情報で検索を行
い、該当する目標言語文書データの読み出しを行うとき
の主体となる目標言語文書データ読み出しプログラムを
記憶する。目標言語文書データ読み出しプログラムが、
本発明の目標言語文書読み出し手段の主体をなす。
The target language document data readout program storage unit 202g searches the target language document data storage unit 203e with document correspondence information for specifying the intermediate format document data from which the target language document data is based and the description language. Is performed, and a target language document data reading program which is a main body when reading out the target language document data is stored. The target language document data reading program is
The target language document reading means of the present invention is the subject.

【0027】目標言語文書データ判定プログラム記憶部
202hは、目標言語文書データ記憶部203eに対し
て、目標言語文書データの元となった文書データと記述
言語とを特定する文書対応情報で検索を行い、対応する
目標言語文書データが記憶されているか判定する。目標
言語文書データ判定プログラムが、本発明の目標言語文
書判定手段の主体をなす。
The target language document data determination program storage unit 202h searches the target language document data storage unit 203e for document correspondence information that specifies the document data from which the target language document data is based and the description language. It is determined whether corresponding target language document data is stored. The target language document data judgment program forms the subject of the target language document judgment means of the present invention.

【0028】なお、ROM202は、ROMに限らず、
磁気ディスク装置や、光磁気ディスク装置、あるいはC
D−ROM記憶装置等の記憶装置であってもよい。
The ROM 202 is not limited to a ROM,
Magnetic disk drive, magneto-optical disk drive, or C
It may be a storage device such as a D-ROM storage device.

【0029】RAM203は、中間形式文書データ等の
データの保存や、様々な一時データを記憶するために使
用され、次のような各記憶部が内部に形成されている。
The RAM 203 is used for storing data such as intermediate format document data and for storing various temporary data, and has the following storage units formed therein.

【0030】ワークメモリ203aは各プログラムが動
作時に必要とする一時的な記憶領域を提供する。生成文
書メモリ203bは、中間形式文書データ記憶部203
dに記憶された文書データに基づいて、目標言語文書生
成プログラム記憶部202bに記憶された目標言語文書
生成プログラムが生成した目標言語文書データを一時的
に記憶する。原文書メモリ203cは、中間言語作成プ
ログラムの入力データとなる、所定の自然言語で記述さ
れた文書データ(以下、原文書データと呼ぶ)を記憶す
る。原文書データは入力部206や、通信制御部207
を介して入力される。
The work memory 203a provides a temporary storage area required by each program during operation. The generated document memory 203b includes an intermediate format document data storage unit 203.
Based on the document data stored in d, the target language document data generated by the target language document generation program stored in the target language document generation program storage unit 202b is temporarily stored. The original document memory 203c stores document data (hereinafter, referred to as original document data) described in a predetermined natural language, which is input data for the intermediate language creation program. The original document data is input to the input unit 206 and the communication control unit 207.
Is entered via

【0031】中間形式文書データ記憶部203dは、中
間形式文書データを少なくとも1つ記憶している。中間
形式文書データ記憶部203dが、本発明の中間形式文
書記憶手段の主体をなす。
The intermediate format document data storage section 203d stores at least one intermediate format document data. The intermediate format document data storage unit 203d forms the main body of the intermediate format document storage unit of the present invention.

【0032】目標言語文書データ記憶部203eは、目
標言語文書データを記憶する。目標言語文書データ記憶
部が、本発明の目標言語文書記憶手段の主体をなす。
The target language document data storage section 203e stores the target language document data. The target language document data storage unit forms the subject of the target language document storage means of the present invention.

【0033】なお、RAM203は、RAMに限らず、
磁気ディスク装置や、光磁気ディスク装置等の記憶装置
であってもよい。さらに、中間形式文書データの作成を
行わない場合においては、中間形式文書データ記憶部2
03dはROM202上に形成してもよい。
The RAM 203 is not limited to the RAM,
A storage device such as a magnetic disk device or a magneto-optical disk device may be used. Further, when the intermediate format document data is not created, the intermediate format document data storage unit 2
03d may be formed on the ROM 202.

【0034】なお、本実施の形態では、中間形式文書デ
ータ作成プログラムをサーバー装置102内に記憶し、
本サーバー装置102内で、原文書から中間形式文書デ
ータを作成するとしたが、本サーバー装置102内には
中間形式文書データ作成プログラムを記憶せず、別の装
置で作成された中間形式文書データをサーバー装置への
入力とし、記憶する構成としてもよい。
In this embodiment, the intermediate format document data creation program is stored in the server device 102,
Although the server apparatus 102 creates the intermediate format document data from the original document, the server apparatus 102 does not store the intermediate format document data creation program and stores the intermediate format document data created by another apparatus. It may be configured to be input to the server device and stored.

【0035】次に、図3に本発明を好適に適用したクラ
イアント装置のためのブロック図を示す。
Next, FIG. 3 shows a block diagram for a client device to which the present invention is suitably applied.

【0036】クライアント装置103は、ROM302
と、RAM303、CPU304、表示制御部305、
入力部306、通信制御部307及びそれらを接続する
バス309により構成される。CPU304は記憶され
ている各種のプログラムに基づいて様々な制御を実行
し、本クライアント装置103の動作の主体をなしてい
る。表示制御部305は表示データの蓄積とディスプレ
イモニターの制御を行い、モニター308に表示出力を
行う。モニター308はCRT5ディスプレイや、LC
Dディスプレイ等様々な表示装置を利用できる。入力部
306は、文書データの文書識別情報や、要求言語情報
等を入力したり、クライアント装置103への各種指示
を入力するためのものであり、キーボード装置である。
通信制御部307は、通信網210と接続され、通信網
210とクライアント装置103とのデータ通信を制御
し、データの送受信を行う。通信制御部307は公衆回
線や、専用回線と接続するためのモデム装置である。
The client device 103 has a ROM 302
RAM 303, CPU 304, display control unit 305,
It comprises an input unit 306, a communication control unit 307, and a bus 309 connecting them. The CPU 304 performs various controls based on various stored programs, and forms the main part of the operation of the client device 103. The display control unit 305 accumulates display data and controls a display monitor, and outputs a display to the monitor 308. The monitor 308 has a CRT5 display or LC
Various display devices such as a D display can be used. The input unit 306 is for inputting document identification information of document data, required language information, and the like, and for inputting various instructions to the client device 103, and is a keyboard device.
The communication control unit 307 is connected to the communication network 210, controls data communication between the communication network 210 and the client device 103, and transmits and receives data. The communication control unit 307 is a modem device for connecting to a public line or a dedicated line.

【0037】なお、入力部306は、上記の構成以外
に、マウス装置等の指示装置や、音声入力装置、タッチ
パネル装置等の様々な入力装置や、その組み合わせで構
成してもよい。また、通信制御部307は、無線の公衆
回線や専用回線と接続するための送受信装置とか、LA
Nに接続するためのイーサーネット接続装置、トークン
リング接続装置とか、ATM回線網への接続装置等、様
々な接続装置でもよい。また、表示制御部305とモニ
ター308とを用いる以外に、印字出力装置や、音声出
力装置を用いる構成とし、文書データを印字出力や音声
出力する構成としてもよい。
The input unit 306 may be constituted by various input devices such as a pointing device such as a mouse device, a voice input device, and a touch panel device, or a combination thereof, in addition to the above configuration. The communication control unit 307 includes a transmitting / receiving device for connecting to a wireless public line or a dedicated line,
Various connection devices such as an Ethernet connection device for connecting to N, a token ring connection device, and a connection device to an ATM network may be used. Further, in addition to using the display control unit 305 and the monitor 308, a configuration may be adopted in which a print output device or an audio output device is used, and the document data is output in a print or audio output.

【0038】ROM302は各種プログラムを記憶して
いる。
The ROM 302 stores various programs.

【0039】ROM302内にはさらに各種の記憶部が
形成されている。通信制御プログラム記憶部302a
は、通信制御部307を介した各種通信の制御や、サー
バー装置へのデータ送受信処理等を行う通信制御プログ
ラムを記憶している。この通信制御プログラムと、通信
制御部307とが本発明の要求情報送信手段の主体をな
す。表示プログラム記憶部302bは、サーバーから受
信した文書データを表示制御部305を用いて表示する
ための表示プログラムを記憶している。表示プログラム
と、表示制御部305と、通信制御プログラムと、通信
制御部307とが本発明の受信出力手段の主体をなす。
要求情報入力プログラム記憶部302cは、ユーザーが
入力部306を用いて、所望する文書データの文書識別
情報と、要求言語情報とを入力する処理を制御するため
の、要求情報入力プログラムを記憶する。
Various storage units are further formed in the ROM 302. Communication control program storage unit 302a
Stores a communication control program for controlling various kinds of communication via the communication control unit 307 and processing for transmitting / receiving data to / from the server device. The communication control program and the communication control unit 307 form the subject of the request information transmitting unit of the present invention. The display program storage unit 302b stores a display program for displaying the document data received from the server using the display control unit 305. The display program, the display control unit 305, the communication control program, and the communication control unit 307 are the main components of the reception output unit of the present invention.
The request information input program storage unit 302c stores a request information input program for controlling a process in which the user uses the input unit 306 to input document identification information of desired document data and request language information.

【0040】なお、ROM302は、ROMに限らず、
磁気ディスク装置や、光磁気ディスク装置、あるいはC
D−ROM記憶装置等の記憶装置であってもよい。
The ROM 302 is not limited to the ROM,
Magnetic disk drive, magneto-optical disk drive, or C
It may be a storage device such as a D-ROM storage device.

【0041】RAM303は、様々な一時データを保存
するために使用され、次のような各記憶部が内部に形成
されている。ワークメモリ303aは各プログラムが動
作時に必要とする一時的な記憶領域を提供する。受信文
書メモリ303bは、サーバー装置から受信した文書デ
ータを一時保存する。なお、RAM303は、RAMに
限らず、磁気ディスク装置や、光磁気ディスク装置等の
記憶装置であってもよい。
The RAM 303 is used to store various temporary data, and has the following storage units formed therein. The work memory 303a provides a temporary storage area required by each program during operation. The reception document memory 303b temporarily stores the document data received from the server device. The RAM 303 is not limited to the RAM, but may be a storage device such as a magnetic disk device or a magneto-optical disk device.

【0042】次に、サーバー装置102と、クライアン
ト装置103との基本的な処理の流れを図4を用いて説
明する。
Next, a basic processing flow between the server apparatus 102 and the client apparatus 103 will be described with reference to FIG.

【0043】先ず、クライアント装置103では、所望
する文書データの指示情報の入力処理を行う(S40
1、Sはステップを示す。以下同様)。次に、入力した
指示情報からその文書データが所在するサーバー装置を
通信ネットワーク上で一意に決定する情報である、サー
バー装置のアドレスを取得する(S402)。本実施の
形態では、サーバー装置のアドレスとしてTCP/IP
(Transmission ControlProtocol/Internet Protocol)
で規定されるホスト名あるいはIPアドレスを用いるもの
とするが、他に通信ネットワーク上のアドレスを決定で
きる情報であれば何でもよい。次に、所望する文書デー
タ指示情報から、その文書データのサーバー装置内での
指示情報である文書識別情報を決定する(S403)。
次に、所望する文書データがどの自然言語によって記述
されるかを指定する要求言語の情報を決定する(S40
4)。
First, the client device 103 performs input processing of instruction information of desired document data (S40).
1, S indicates a step. Hereinafter the same). Next, the address of the server device, which is information for uniquely determining the server device where the document data is located on the communication network, is obtained from the input instruction information (S402). In the present embodiment, TCP / IP is used as the address of the server device.
(Transmission Control Protocol / Internet Protocol)
The host name or the IP address specified in the above is used, but any other information that can determine an address on the communication network may be used. Next, from the desired document data instruction information, document identification information which is instruction information of the document data in the server device is determined (S403).
Next, information on a request language that specifies which natural language the desired document data is described in is determined (S40).
4).

【0044】次に、決定された文書識別情報と、要求言
語情報とをS402で決定されたアドレスのサーバー装
置に送信する(S405)。本実施の形態では、サーバ
ー装置への送信方法として、TCP/IP上のHTTP
(Hyper Text Transfer Protocol)を用いるとする。具
体的にはクライアント装置は、図5(a)に示す形式のデ
ータをサーバー装置に送信する。”GET”はデータ要
求を意味し、<文書識別情報>にはS402で決定され
た文書識別情報を指定する。<バージョン情報>はHT
TPのバージョン情報を指定し、<CRLF>は復帰改
行文字を示す。<各種ヘッダー情報>にはHTTPで規
定されたヘッダー情報を必要に応じて指定する。”Acce
pt-Language:”は次に要求言語情報が続くことを示す文
字列であり、<要求言語>には要求言語を識別するあらか
じめ定められた文字列を指定する。図5(b)は文書識
別情報として”/pub/sample.html”、HTTPバージョ
ンが1.0、日本語を要求言語とした場合の例である。
なお、上述したTCP/IP及びHTTPは、既に広く
実用化された公知の技術であるため、説明を省略する。
Next, the determined document identification information and the requested language information are transmitted to the server at the address determined in S402 (S405). In the present embodiment, as a transmission method to the server device, HTTP over TCP / IP is used.
(Hyper Text Transfer Protocol) is used. Specifically, the client device transmits data in the format shown in FIG. 5A to the server device. "GET" means a data request, and <document identification information> specifies the document identification information determined in S402. <Version information> is HT
TP version information is specified, and <CRLF> indicates a carriage return / line feed character. In <various header information>, header information specified by HTTP is specified as necessary. "Acce
“pt-Language:” is a character string indicating that the requested language information follows, and <required language> specifies a predetermined character string for identifying the requested language. FIG. This is an example of a case where the information is “/pub/sample.html”, the HTTP version is 1.0, and Japanese is the requested language.
Note that the above-described TCP / IP and HTTP are well-known technologies that have already been widely put into practical use, and thus description thereof will be omitted.

【0045】サーバー装置では、S405でクライアン
ト装置から送信された要求文書の文書識別情報と、要求
言語情報を受信し(S408)、受信した情報に基づい
て所望の自然言語による所望の文書データを生成するた
めに、文書データ生成処理を実行する(S409)。S
409の詳細は後述する。S409にて所望の自然言語
による所望の文書データを生成できない場合は、それを
エラーと判定する(S410)。本実施の形態では、こ
のエラーの判定は後述するエラーフラグを参照すること
で判定する。エラーでなければ生成した文書データをク
ライアントに送信し(S411)、エラーならばエラー
情報を送信する(S412)。クライアントではサーバ
ーから文書データもしくはエラー情報を受信し(S40
6)、表示装置に表示する(S407)。
The server receives the document identification information of the requested document and the requested language information transmitted from the client in S405 (S408), and generates desired document data in a desired natural language based on the received information. In order to do so, a document data generation process is executed (S409). S
Details of 409 will be described later. If the desired document data in the desired natural language cannot be generated in S409, it is determined as an error (S410). In the present embodiment, this error is determined by referring to an error flag described later. If there is no error, the generated document data is transmitted to the client (S411), and if there is an error, error information is transmitted (S412). The client receives the document data or the error information from the server (S40).
6) Display on the display device (S407).

【0046】次に、文書データ生成処理(S409)の
詳細について、図6のフローチャートを用いて説明す
る。
Next, the details of the document data generation processing (S409) will be described with reference to the flowchart of FIG.

【0047】先ず、エラー状態を記憶するため、ワーク
メモリ203a内に形成されたエラーフラグ(図示せず)
をクリアーして、エラーなしの状態とする(S60
1)。そしてS602では目標言語文書データ判定プロ
グラムが、文書識別情報で指定され、かつ要求言語で記
述された文書データの、目標言語文書データ記憶部20
3e上での有無を判定し(S602)、もし、該当する
文書データがサーバー装置内に存在する場合は(S60
2:Yes)、文書データを読み出すためにS609に
処理を進め、存在しない場合は(S602:No)、S
603に処理を進める。本実施の形態においては、目標
言語文書データ記憶部203eで記憶される目標言語文
書データは、目標言語文書生成にあたって元となる1つ
の中間形式文書データに対して記述言語別にそれぞれ1
つのファイルとして存在するものとする。そして、目標
言語文書データ記憶部203eで記憶されている目標言
語文書データには、目標言語文書データの生成に際して
元となった中間形式文書データのファイル名である文書
識別情報と、目標言語文書データの記述言語の言語名と
を合わせた文書対応情報が付随して記憶されている。
First, an error flag (not shown) formed in the work memory 203a to store an error state.
Is cleared so that no error occurs (S60).
1). In step S602, the target language document data determination program stores the target language document data storage unit 20 of the document data specified by the document identification information and described in the request language.
3e (S602), and if the corresponding document data exists in the server device (S60).
2: Yes), the process proceeds to S609 to read out the document data, and if there is no document data (S602: No), the process proceeds to S609.
The process proceeds to 603. In the present embodiment, the target language document data stored in the target language document data storage unit 203e is one for each descriptive language with respect to one intermediate format document data that is the basis for generating the target language document.
File. The target language document data stored in the target language document data storage unit 203e includes document identification information, which is the file name of the intermediate format document data from which the target language document data was generated, and target language document data. And document correspondence information including the language name of the description language.

【0048】図7(a)は目標言語文書データ記憶部2
03eに記憶されるデータのデータ構造を表わしてお
り、図5(b)で要求される文書データについては、目
標言語文書データ記憶部203eでは図7(b)のよう
に記憶される。文書識別情報として中間言語文書データ
のファイル名である”/pub/sample.html”が、目標言語
文書データの記述言語の言語名として日本語を表わす”
jp”が文書対応情報のフィールドにあり、文書データの
フィールドには中間言語ファイル”/pub/sample.html”
から生成された日本語で記述された目標言語文書データ
がある。そして目標言語文書データ判定プログラムが、
文書識別情報で指定されたファイル名と、要求された記
述言語名とを文書対応情報に持つデータが目標言語文書
データ記憶部203eに存在するか否かの判定をS60
2で行い、存在すると判定された場合S609で目標言
語文書読み出しプログラムが文書データの部分を生成文
書メモリ203bに読み込むこととなる。
FIG. 7A shows the target language document data storage unit 2.
FIG. 7B shows the data structure of the data stored in the target language document data storage unit 203e as shown in FIG. 7B. “/Pub/sample.html” which is the file name of the intermediate language document data as the document identification information indicates Japanese as the language name of the description language of the target language document data.
jp ”is in the document correspondence information field, and the document data field is the intermediate language file“ /pub/sample.html ”
There is target language document data written in Japanese and generated from. Then, the target language document data determination program
In step S60, it is determined whether data having the file name specified by the document identification information and the requested description language name in the document correspondence information exists in the target language document data storage unit 203e.
In step S609, the target language document reading program reads the document data portion into the generated document memory 203b.

【0049】S603では文書識別情報で指定された文
書データの、中間形式文書データ記憶部203d上での
有無を判定し、もし該当する文書データがサーバー装置
内に存在しない場合は(603:No)、エラーとする
ためにS610に処理を進め、存在した場合は(S60
3:Yes)、S604に処理を進める。S604では
文書管理プログラムが、クライアントから送信された文
書識別情報で指示された中間形式文書データを、中間形
式文書データ記憶部203dから検索して、ワークメモ
リ203aに読み込む。本実施の形態においては、中間
形式文書データ記憶部203dで記憶される中間形式文
書データは、それぞれの中間形式文書データが1つのフ
ァイルに対応するものとし、中間形式文書データを指定
する文書識別情報としては、中間形式文書データを収納
しているファイル名を用いるものとする。この場合は、
文書識別情報で示されたファイル名のファイルが存在す
るか否かでS603の判定を行い、S604では文書管
理プログラムがそのファイルのデータをワークメモリ2
03aに読み込むこととなる。
In step S603, it is determined whether or not the document data specified by the document identification information exists in the intermediate format document data storage unit 203d. If the corresponding document data does not exist in the server device (603: No) The process proceeds to S610 to make an error, and if an error exists (S60).
3: Yes), the process proceeds to S604. In step S604, the document management program searches the intermediate format document data storage unit 203d for the intermediate format document data specified by the document identification information transmitted from the client, and reads the intermediate format document data into the work memory 203a. In the present embodiment, the intermediate format document data stored in the intermediate format document data storage unit 203d is such that each intermediate format document data corresponds to one file, and the document identification information for specifying the intermediate format document data. Is used as the file name containing the intermediate format document data. in this case,
The determination in S603 is performed based on whether or not a file having the file name indicated by the document identification information exists. In S604, the document management program stores the data of the file in the work memory 2.
03a.

【0050】なお、文書識別情報としてファイル名を用
いる方法以外に、文書管理プログラムとしてデータベー
ス管理プログラムを用い、中間形式文書データ記憶部2
03dとしてデータベースの記憶領域を対応させ、文書
識別情報としてデータベース内の文書データを特定可能
な指示情報を用いてもよい。
In addition to the method using the file name as the document identification information, a database management program is used as the document management program, and the intermediate format document data storage unit 2 is used.
03d may correspond to a storage area of a database, and instruction information that can specify document data in the database may be used as document identification information.

【0051】次に、読み出した中間言語形式文書データ
をS408にて受信した要求言語情報に基づいた目標言
語に翻訳可能か否かを判定する(S605)。本実施の
形態では、前述したように各目標言語毎に個別の目標言
語文書生成プログラムを持つので、S408にて受信し
た要求言語情報に対応した目標言語文書生成プログラム
が目標言語文書生成プログラム記憶部202bに記憶さ
れているか否かで、S605の判定を行う。
Next, it is determined whether the read intermediate language format document data can be translated into a target language based on the requested language information received in S408 (S605). In the present embodiment, as described above, since there is an individual target language document generation program for each target language, the target language document generation program corresponding to the requested language information received in S408 is stored in the target language document generation program storage unit. The determination of S605 is performed based on whether or not the information is stored in 202b.

【0052】S606では、読み込んだ中間形式文書デ
ータから目標言語文書データを生成する目標言語文書生
成処理を実行する。S606の詳細は後述する。S60
7では、S606にて生成された目標言語文書データ
を、送信のために一旦生成文書メモリ203bに記憶す
る。S608では目標言語文書データ書き込みプログラ
ムによって、 S606にて生成された目標言語文書デ
ータに、文書識別情報と記述言語の言語名を文書対応情
報として付随させ、目標言語文書データ記憶部203e
に記憶する。S610では、S603とS605での判
定を受けて、エラー処理をするためにエラーフラグをセ
ットしてエラー状態を記憶する。
In step S606, target language document generation processing for generating target language document data from the read intermediate format document data is executed. Details of S606 will be described later. S60
At 7, the target language document data generated in S606 is temporarily stored in the generated document memory 203b for transmission. In step S608, the target language document data writing program attaches the document identification information and the language name of the description language to the target language document data generated in step S606 as document correspondence information.
To memorize. In step S610, in response to the determinations in steps S603 and S605, an error flag is set to perform error processing, and the error state is stored.

【0053】S609では、目標言語文書読み出しプロ
グラムが、文書識別情報であるファイル名と要求言語の
言語名とを文書対応情報に持つデータを、目標言語文書
データ記憶部203eから探し、そのデータから、文書
データの部分を生成文書メモリ203bに読み込む。S
609へ処理が進む場合、処理に時間のかかるS606
の目標言語文書生成処理を行う必要が無いため、S40
9の文書データ生成処理を短時間で実行することがで
き、サーバー装置102は、S408でクライアント装
置103からの要求を受信してからS411で生成文書
のデータを送信するまでの時間を短縮できる。
In step S609, the target language document reading program searches the target language document data storage unit 203e for data having the file name as the document identification information and the language name of the requested language in the document correspondence information. The document data portion is read into the generated document memory 203b. S
If the processing proceeds to step S609, the processing takes a long time S606
Since there is no need to perform the target language document generation processing of
9 can be executed in a short time, and the server device 102 can reduce the time from receiving the request from the client device 103 in S408 to transmitting the data of the generated document in S411.

【0054】次に、中間形式文書データ作成プログラム
の処理の詳細を、図8、図9、図10を用いて説明す
る。先ず、入力部206より、所定の自然言語で記述さ
れた文書データを入力する(S801)。入力された文
書データは、一旦原文書メモリ203cに保存される
(S802)。この文書データが原文書データとして処
理される。原文書データは、先ず、形態素解析処理を受
ける(S803)。S803では、翻訳辞書記憶部20
2eに記憶された形態素解析辞書を参照し、原文書を形
態素に分割し、形態素列に変換し、各形態素の品詞の判
定を行う。日本語から中間形式文書データを生成する一
例として、図9(a)に示す原文書であれば、形態素解
析処理により図9(b)のような形態素列からなる形態
素解析結果が得られる。
Next, details of the processing of the intermediate format document data creation program will be described with reference to FIGS. 8, 9 and 10. First, document data described in a predetermined natural language is input from the input unit 206 (S801). The input document data is temporarily stored in the original document memory 203c (S802). This document data is processed as original document data. The original document data is first subjected to morphological analysis processing (S803). In S803, the translation dictionary storage unit 20
Referring to the morphological analysis dictionary stored in 2e, the original document is divided into morphemes, converted into a morpheme sequence, and the part of speech of each morpheme is determined. As an example of generating intermediate format document data from Japanese, if the original document is as shown in FIG. 9A, a morphological analysis result including a morphological sequence as shown in FIG. 9B is obtained by the morphological analysis processing.

【0055】次に、構文解析処理を行う(S804)。
S804では、S803で解析された品詞情報を含む形
態素列に、翻訳辞書記憶部202eに記憶された構文規
則データと、構文解析辞書の情報を適用し、各形態素間
の修飾関係を解析すると共に、格の意味的な役割を決定
し、構文解析木を形成する。たとえば、図9(b)に示
されるような形態素解析結果は、図9(c)で示される
構文解析木からなる構文解析結果を得る。ここで、
「S」は文を、「NP」は名詞句を、「ADV」は副詞
を、「VP」は動詞句をそれぞれ表す。次に、依存構造
解析処理を行う(S805)。S805では、S804
の解析結果である構文解析木に基づき依存構造を形成す
る。図9(c)の構文解析結果に対して依存構造解析処
理を行うと、図10(a)のような依存構造が得られ
る。ここで、「PRED」は述部を、「NOM」は依存
構造名詞句を、「ADV」は副詞をそれぞれ表す。次
に、S805で得られた依存構造のデータを中間形式文
書データ記憶部203dに保存する(S806)。
Next, a syntax analysis process is performed (S804).
In S804, the syntax rule data stored in the translation dictionary storage unit 202e and the information of the syntax analysis dictionary are applied to the morpheme sequence including the part of speech information analyzed in S803, and the modification relationship between each morpheme is analyzed. Determine the semantic role of the case and form a parse tree. For example, a morphological analysis result as shown in FIG. 9B obtains a parsing result composed of the parse tree shown in FIG. 9C. here,
“S” represents a sentence, “NP” represents a noun phrase, “ADV” represents an adverb, and “VP” represents a verb phrase. Next, a dependent structure analysis process is performed (S805). In S805, S804
A dependency structure is formed based on the parse tree that is the analysis result of. When a dependency structure analysis process is performed on the syntax analysis result of FIG. 9C, a dependency structure as shown in FIG. 10A is obtained. Here, “PRED” represents a predicate, “NOM” represents a dependent structure noun phrase, and “ADV” represents an adverb. Next, the data of the dependency structure obtained in S805 is stored in the intermediate format document data storage unit 203d (S806).

【0056】本実施の形態では、中間形式表現として文
の依存構造の表現を用い、前記のように文章を解析した
結果得られる、依存構造で表現された文章の意味内容を
表すデータを、中間形式文書データとして用いることと
する。具体的には、図11(a)に記載するような構造
要素1105の集合として記憶する。各構造要素110
5は構造種別1101と、格情報1102と、辞書ポイ
ンター1103と、従属構造数1104の4つの項目を
持つ。構造種別1101は述部とか、名詞句とかの種別
をフラグとして記憶する。格情報1102は主格とか目
的格、あるいは様態等の格の種別情報を必要に応じてフ
ラグとして記憶する。辞書ポインター1103は、その
構造要素に対応した単語の情報を収納している辞書デー
タへのポインターを記憶する。従属構造数1104は、
その構造要素に直接従属する構造要素がいくつあるかを
記憶する。なお、従属構造数1104は、その構造要素
に従属する構造要素にさらに従属する、つまり、入れ子
として間接的に従属する要素の個数は含まない。
In the present embodiment, the expression of the dependency structure of the sentence is used as the intermediate form expression, and the data representing the semantic content of the sentence expressed by the dependency structure, which is obtained as a result of analyzing the sentence as described above, is converted to the intermediate form. It is used as formal document data. Specifically, it is stored as a set of structural elements 1105 as shown in FIG. Each structural element 110
5 has four items of structure type 1101, case information 1102, dictionary pointer 1103, and number of dependent structures 1104. The structure type 1101 stores a type such as a predicate or a noun phrase as a flag. The case information 1102 stores case type information such as a nominative case, a purpose case, or a form as a flag as necessary. The dictionary pointer 1103 stores a pointer to dictionary data containing information on a word corresponding to the structural element. The number of dependent structures 1104 is
The number of structural elements directly dependent on the structural element is stored. Note that the number of dependent structures 1104 further depends on the structural element that depends on the structural element, that is, does not include the number of indirectly dependent elements as nests.

【0057】例えば、図10(a)に示された依存構造
を記憶した場合は、図11(b)のようなデータとな
る。ここで、「K1」は主格を、「K2」は目的格を、
「K3」は様態の格を表す。また、辞書ポインターは、
図11(c)に例示された辞書データの番号1106を
表している。辞書データには、原文書で用いられた言語
の単語1107と、その品詞1108、及び他の言語の
対応する単語1109や、さらに各種の文法情報等が記
憶される。図11(c)では、他の言語が英語である場
合の例示である。なお、中間形式文書データとしては、
特開平6−325080号公報に開示されているよう
な、人工的に設計した言語で記述した文章を中間形式文
書データとしてもよい。
For example, when the dependency structure shown in FIG. 10A is stored, the data becomes as shown in FIG. 11B. Here, “K1” is the nominative case, “K2” is the objective case,
“K3” indicates the status of the mode. The dictionary pointer is
FIG. 11C shows the dictionary data number 1106 exemplified in FIG. The dictionary data stores a word 1107 in the language used in the original document, its part of speech 1108, a corresponding word 1109 in another language, and various grammatical information. FIG. 11C illustrates an example in which the other language is English. In addition, as the intermediate format document data,
A sentence described in an artificially designed language as disclosed in Japanese Patent Laid-Open No. Hei 6-325080 may be used as the intermediate format document data.

【0058】次に、S605の目標言語文書生成処理の
詳細を、図12と図10とを用いて説明する。目標言語
文書生成処理は、本発明の目標言語文書生成手段の主体
をなす目標言語文書生成プログラムが行う処理である。
先ず、S603にてワークメモリ203aに読み込まれ
た中間形式文書データに対し、構文生成処理を行う(S
1201)。構文生成処理では、中間形式文書データに
記述された依存構造に基づいて、生成規則データを参照
しつつ目標言語の構文木を生成し、語順を決定する。次
に、形態素生成処理を行い(S1202)、単語の語尾
等を必要に応じて変化させ、生成文書データの生成を完
了する。目標言語が英語である一例を挙げれば、図10
(a)で示される依存構造の文に対し、構文生成処理
と、形態素生成処理の処理を行うと、図10(b)に示
されるような目標言語文書生成結果が得られることとな
る。ここで、「PR0N」は代名詞、「V」は動詞、
「ART」は冠詞、「N」は名詞をそれぞれ表す。
Next, the details of the target language document generation processing in S605 will be described with reference to FIGS. The target language document generation process is a process performed by a target language document generation program which is a subject of a target language document generation unit of the present invention.
First, syntax generation processing is performed on the intermediate format document data read into the work memory 203a in S603 (S
1201). In the syntax generation processing, a syntax tree of the target language is generated based on the dependency structure described in the intermediate format document data while referring to the generation rule data, and the word order is determined. Next, morpheme generation processing is performed (S1202), and the ending of the word is changed as necessary, thereby completing the generation of the generated document data. As an example where the target language is English, FIG.
When the syntax generation process and the morpheme generation process are performed on the sentence having the dependency structure shown in FIG. 10A, a target language document generation result as shown in FIG. 10B is obtained. Here, “PR0N” is a pronoun, “V” is a verb,
“ART” indicates an article, and “N” indicates a noun.

【0059】なお、本実施の形態においては、中間形式
文書データとして記憶されている依存構造データをその
まま構文生成処理への入力としたが、構文生成処理への
入力の前に依存構造変換処理を行ってもよい。これは具
体的には、中間形式文書データに記憶されている文章の
依存構造をそのまま用いるのではなく、中間形式変換手
段に対応する依存構造変換処理を行い、目標言語に対応
した依存構造に変換してから、構文生成処理への入力と
する。
In this embodiment, the dependency structure data stored as the intermediate format document data is directly input to the syntax generation processing. However, the dependency structure conversion processing is performed before the input to the syntax generation processing. May go. Specifically, instead of using the dependency structure of the sentence stored in the intermediate format document data as it is, a dependency structure conversion process corresponding to the intermediate format conversion means is performed and converted into a dependency structure corresponding to the target language. Then, it is input to the syntax generation processing.

【0060】なお、本実施の形態に関わる前記の形態素
解析処理、構文解析処理、依存構造解析処理、構文生成
処理、及び形態素生成処理のそれぞれは、電子技術総合
研究所と京都大学による「日英科学技術文献の速報シス
テムに関する研究−言語処理システムの開発に関する報
告書」や、特開昭62−203273号公報に開示され
ている公知の技術である。
The morphological analysis processing, syntactic analysis processing, dependency structure analysis processing, syntax generation processing, and morphological generation processing according to the present embodiment are respectively performed by “Eng-Eng Research Institute” and “Kyoto University”. This is a well-known technique disclosed in "Research on a Bulletin System for Science and Technology Literature-Report on Development of Language Processing System" and JP-A-62-203273.

【0061】[0061]

【発明の効果】以上説明したことから明らかなように、
本発明の請求項1に記載の多言語対応通信システムは、
クライアント装置からの要求によって生成した目標言語
文書データをクライアント装置に送信すると共に、目標
言語文書データ記憶部に記憶する。そして、次に、クラ
イアント装置からこの文書が同じ自然言語で要求された
場合、目標言語文書データ記憶部に記憶しておいた文書
を読み出して送信することで目標言語文書データの生成
処理を省き、クライアント装置からの要求を受けてから
短時間で文書データの送信が可能となる。
As is apparent from the above description,
The multi-language communication system according to claim 1 of the present invention,
The target language document data generated by the request from the client device is transmitted to the client device and stored in the target language document data storage unit. Then, when this document is requested from the client device in the same natural language, the document stored in the target language document data storage unit is read and transmitted, thereby eliminating the target language document data generation processing. Document data can be transmitted in a short time after receiving a request from the client device.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態の多言語対応通信システム
の概要を示す説明図である。
FIG. 1 is an explanatory diagram showing an outline of a multilingual communication system according to an embodiment of the present invention.

【図2】本実施の形態のサーバー装置のブロック図であ
る。
FIG. 2 is a block diagram of a server device according to the present embodiment.

【図3】本実施の形態のクライアント装置のブロック図
である。
FIG. 3 is a block diagram of a client device according to the present embodiment.

【図4】本実施の形態のサーバー装置とクライアント装
置の処理の流れを示すフローチャートである。
FIG. 4 is a flowchart illustrating a processing flow of a server device and a client device according to the present embodiment.

【図5】本実施の形態の文書識別情報と要求言語情報と
の説明図である。
FIG. 5 is an explanatory diagram of document identification information and request language information according to the present embodiment.

【図6】本実施の形態の文書データ生成処理のフローチ
ャートである。
FIG. 6 is a flowchart of a document data generation process according to the embodiment.

【図7】本実施の形態の文書対応情報の説明図である。FIG. 7 is an explanatory diagram of document correspondence information according to the embodiment.

【図8】本実施の形態の中間形式文書データ作成プログ
ラムの処理のフローチャートである。
FIG. 8 is a flowchart of processing of an intermediate format document data creation program according to the present embodiment.

【図9】本実施の形態の中間形式文書データ作成の処理
の説明に供する説明図である。
FIG. 9 is an explanatory diagram for explaining a process of creating intermediate format document data according to the embodiment;

【図10】本実施の形態の中間形式文書データ作成の処
理と、目標言語文書生成処理の説明に供する説明図であ
る。
FIG. 10 is an explanatory diagram for explaining an intermediate format document data generation process and a target language document generation process according to the embodiment;

【図11】本実施の形態の中間形式文書データの説明に
供する説明図である。
FIG. 11 is an explanatory diagram for explaining intermediate format document data according to the embodiment;

【図12】本実施の形態の目標言語文書生成処理のフロ
ーチャートである。
FIG. 12 is a flowchart of target language document generation processing according to the present embodiment.

【図13】従来の通信システムの概要を示す説明図であ
る。
FIG. 13 is an explanatory diagram showing an outline of a conventional communication system.

【符号の説明】[Explanation of symbols]

101 通信ネットワーク 102 サーバー装置 103 クライアント装置 202 ROM 203 RAM 204 CPU 202f 目標言語文書データ書き込みプログラム記憶
部 202g 目標言語文書データ読み出しプログラム記憶
部 202h 目標言語文書データ判定プログラム記憶部 203d 中間形式文書データ記憶部 203e 目標言語文書データ記憶部
101 Communication Network 102 Server Device 103 Client Device 202 ROM 203 RAM 204 CPU 202f Target Language Document Data Writing Program Storage Unit 202g Target Language Document Data Reading Program Storage Unit 202h Target Language Document Data Determination Program Storage Unit 203d Intermediate Format Document Data Storage Unit 203e Target language document data storage

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 クライアント装置と、前記クライアント
装置からの要求に応じた文書データを前記クライアント
装置に送信するサーバー装置とから構成される通信シス
テムであって、 前記クライアント装置は、 前記文書データを特定可能な文書識別情報と、前記文書
データの記述言語を指定する要求言語情報とを前記サー
バー装置に送信する要求情報送信手段と、 前記サーバー装置より前記文書データを受信し、出力す
る受信出力手段とを備え、 前記サーバー装置は、 前記クライアント装置から前記文書識別情報と、前記要
求言語情報とを受信する要求情報受信手段と、 少なくとも一つの文書データを、自然言語で記述された
文書を文法的、意味的に解析した結果として得られる中
間形式表現で記述した中間形式文書データとして記憶す
る中間形式文書記憶手段と、 前記中間形式文書記憶手段から前記文書識別情報に対応
する中間形式文書データを読み出す中間形式文書読み出
し手段と、 前記中間形式文書読み出し手段で読み出した中間形式文
書データから、前記要求言語情報に対応した言語で記述
した目標言語文書データを生成する目標言語文書生成手
段と、 前記目標言語文書生成手段で生成された目標言語文書デ
ータを記憶する目標言語文書記憶手段と、 前記目標言語文書生成手段で生成された目標言語文書デ
ータに、生成される際に元となった中間形式文書データ
と記述言語とを特定する文書対応情報を付加して、前記
目標言語文書記憶手段に書き込む目標言語文書書き込み
手段と、 前記目標言語書き込み手段によって前記目標言語文書記
憶手段に記憶された文書対応情報と、前記文書識別情報
及び前記要求言語情報とに基いて、前記文書識別情報と
前記要求言語情報とに対応する目標言語文書データが記
憶されているか否かを判定する目標言語文書判定手段
と、 前記目標言語文書記憶手段から前記文書対応情報に対応
する目標言語文書データを読み出す目標言語文書読み出
し手段と、 前記目標言語文書判定手段により記憶されていると判定
された場合は、前記目標言語文書読み出し手段で読み出
される目標言語文書データを前記クライアント装置に送
信し、記憶されていないと判定された場合は、前記目標
言語文書生成手段により生成される目標言語文書データ
を前記クライアント装置に送信する文書送信手段とを備
えたことを特徴とする多言語対応通信システム。
1. A communication system comprising: a client device; and a server device that transmits document data according to a request from the client device to the client device, wherein the client device specifies the document data. Request information transmitting means for transmitting, to the server device, possible document identification information and request language information for specifying a description language of the document data; and reception output means for receiving and outputting the document data from the server device. The server device, request information receiving means for receiving the document identification information and the request language information from the client device, at least one document data, a grammar of a document described in a natural language, Store as intermediate format document data described in the intermediate format expression obtained as a result of semantic analysis An intermediate format document storage unit, an intermediate format document reading unit that reads intermediate format document data corresponding to the document identification information from the intermediate format document storage unit, and an intermediate format document data read by the intermediate format document reading unit. Target language document generation means for generating target language document data described in a language corresponding to the required language information; target language document storage means for storing target language document data generated by the target language document generation means; The target language document data generated by the language document generation means is added with document correspondence information for specifying the intermediate format document data and the description language from which the target language document data is generated, and is written into the target language document storage means. A target language document writing unit, and a document correspondence stored in the target language document storage unit by the target language writing unit. Target language document determining means for determining whether or not target language document data corresponding to the document identification information and the requested language information is stored based on the information and the document identification information and the requested language information. A target language document reading unit that reads target language document data corresponding to the document correspondence information from the target language document storage unit; and if the target language document determination unit determines that the target language document data is stored, the target language document The target language document data read by the reading means is transmitted to the client device, and if it is determined that the target language document data is not stored, the target language document data generated by the target language document generation means is transmitted to the client device. A multilingual communication system, comprising: a transmission unit.
JP9006161A 1997-01-17 1997-01-17 Multilingual communication system Pending JPH10207892A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9006161A JPH10207892A (en) 1997-01-17 1997-01-17 Multilingual communication system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9006161A JPH10207892A (en) 1997-01-17 1997-01-17 Multilingual communication system

Publications (1)

Publication Number Publication Date
JPH10207892A true JPH10207892A (en) 1998-08-07

Family

ID=11630814

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9006161A Pending JPH10207892A (en) 1997-01-17 1997-01-17 Multilingual communication system

Country Status (1)

Country Link
JP (1) JPH10207892A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002033607A1 (en) * 2000-10-16 2002-04-25 Iis Inc. Method for offering multilingual information translated in many languages through a communication network

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002033607A1 (en) * 2000-10-16 2002-04-25 Iis Inc. Method for offering multilingual information translated in many languages through a communication network
US7130792B2 (en) 2000-10-16 2006-10-31 Iis Inc. Method for offering multilingual information translated in many languages through a communication network

Similar Documents

Publication Publication Date Title
US6571241B1 (en) Multilingual patent information search system
JP3066274B2 (en) Machine translation equipment
JPS6231467A (en) Sentence preparation device
JPH0869470A (en) Natural language processing device and method
KR19990078925A (en) Internet Browsing System For Searching with Usual Words
JP3467160B2 (en) Multilingual communication system, server device, and document transmission method for server device
JPH02281372A (en) Inserted adverbe phrase processing method in machine translation equipment
JP3467159B2 (en) Multilingual communication system, server device, and document transmission method for server device
JPH10207892A (en) Multilingual communication system
JP2003296327A (en) Translation server, genre-classified online machine translation method, and program therefor
JP3434161B2 (en) Multilingual communication system
JPH10222516A (en) Multilingual correspondence communication system
JPH10222513A (en) Multilingual correspondence communication system
JPH10214266A (en) Communication system dealing with multiple languages
JPH10187732A (en) Multilingual communication system
KR100836159B1 (en) System and method for semi-automatic translating service
JP3896084B2 (en) Machine translation apparatus, method, program, and server apparatus storing program
JPH08305728A (en) Inter multilingual retrieving system
JPH10187731A (en) Multilingual communication system
JP3174664B2 (en) Machine translation equipment
JP3467161B2 (en) Multilingual communication system, server device, and document transmission method for server device
JPH10260992A (en) Database processor and storage medium
JP3353873B2 (en) Machine translation equipment
WO2010001455A1 (en) Retrieving device and method
JP2752025B2 (en) Machine translation equipment