JPH10214266A - Communication system dealing with multiple languages - Google Patents

Communication system dealing with multiple languages

Info

Publication number
JPH10214266A
JPH10214266A JP9016260A JP1626097A JPH10214266A JP H10214266 A JPH10214266 A JP H10214266A JP 9016260 A JP9016260 A JP 9016260A JP 1626097 A JP1626097 A JP 1626097A JP H10214266 A JPH10214266 A JP H10214266A
Authority
JP
Japan
Prior art keywords
document
document data
language
original document
intermediate format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9016260A
Other languages
Japanese (ja)
Inventor
Atsushi Kawai
淳 河合
Norihisa Fujii
則久 藤井
Atsuhiko Kurachi
敦彦 倉知
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP9016260A priority Critical patent/JPH10214266A/en
Publication of JPH10214266A publication Critical patent/JPH10214266A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a communication system dealing with in multiple languages which document data described in plural languages can be further quickly provided without needing any special language translation program in a client device. SOLUTION: Document data are inputted to a server device 102, and when the document data are converted into intermediate format document data, the inputted document data are stored in a document data storage part. Then, when a document is requested in the same natural language as the description language of the document data from a client device 103, the document stored in the document data storage part is read and transmitted. Thus, the generation processing of the natural language document data can be saved, and the transmission of the document data can be attained in a short time since the request from the client device 103 is received.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、翻訳機能を有する
ことにより所望の言語による文書データを提供すること
が可能な多言語対応通信システムに関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multilingual communication system having a translation function and capable of providing document data in a desired language.

【0002】[0002]

【従来の技術】従来、インターネットに代表されるよう
に、通信ネットワークを介して、文書データを検索、閲
覧するシステムが普及している。この様なシステムは、
各種の文書データを記憶する少なくとも1つのサーバー
装置と、文書データの表示が可能な少なくとも1つのク
ライアント装置と、それ等を接続する通信ネットワーク
とで構成される。通信ネットワークは、公衆回線網や、
専用回線網あるいはその組み合わせから構成される。サ
ーバー装置は、各種の文書データが記憶できる記憶装置
と、通信ネットワークへの接続装置とを備え、クライア
ント装置は文書データを表示可能な表示装置と、閲覧し
たい文書の指示情報を入力できる入力装置と、通信ネッ
トワークへの接続装置とを備える。
2. Description of the Related Art Conventionally, a system for searching and browsing document data via a communication network, such as the Internet, has become widespread. Such a system,
It comprises at least one server device for storing various types of document data, at least one client device capable of displaying document data, and a communication network connecting them. Communication networks include public networks,
It is composed of a dedicated line network or a combination thereof. The server device includes a storage device capable of storing various types of document data, and a connection device to a communication network.The client device includes a display device capable of displaying document data, and an input device capable of inputting instruction information of a document to be viewed. And a connection device to a communication network.

【0003】例えば、インターネットでは、サーバー装
置、クライアント装置共に非常に多くの装置が接続され
ており、その所在地も全世界に広がっている。そして、
それらを接続する通信ネットワークを介して世界各地の
様々な情報を、検索、閲覧することが可能なシステムと
なっている。
[0003] For example, on the Internet, a great number of devices are connected to both server devices and client devices, and their locations are spread all over the world. And
The system is capable of searching and browsing various information in various parts of the world via a communication network connecting them.

【0004】このようなインターネットでは、図13に
示すように、各サーバー装置1302には、英語とか、日本
語、中国語等の様々な言語で記述された文書データが記
憶されている。通信ネットワーク1301を介してサーバー
装置に接続されているクライアント装置1303では、これ
らの様々な言語で記述された文書データをそれぞれの言
語で表示することが可能である。また、言語翻訳プログ
ラムを内蔵するクライアント装置もあり、必要に応じて
所望の言語に翻訳して文書データを表示することも可能
である。
In such an Internet, as shown in FIG. 13, each server device 1302 stores document data described in various languages such as English, Japanese, and Chinese. The client device 1303 connected to the server device via the communication network 1301 can display the document data described in these various languages in the respective languages. There is also a client device having a built-in language translation program, and it is possible to display the document data by translating it into a desired language as needed.

【0005】[0005]

【発明が解決しようとする課題】上述したシステム、特
に、インターネットのように全世界に広がったネットワ
ークを介して様々な文書データを閲覧する場合、文書デ
ータの提供者と、その文書データの閲覧者とは異なる言
語を母国語としていることが多い。しかし、母国語以外
の言語での記述や、その理解には困難を伴うことが多
い。これを解決するため、次の2つの方法が知られてい
る。1つは、同一内容の文書を複数の言語で記述された
複数の文書データとしてサーバー装置に記憶させ、所望
の言語の文書データをクライアント装置から選択するこ
とで、所望の言語で記述された文書データを閲覧可能と
する方法である。他の方法は、言語翻訳プログラムをク
ライアント装置に搭載し、その言語翻訳プログラムを用
いてサーバーから送信されてきた文書データを所望する
言語の文書データに翻訳する方法である。これらの方法
により、母国語以外の言語で記述された文書データも母
国語で閲覧可能となる。しかし、その場合でも以下のよ
うな問題が残されている。
SUMMARY OF THE INVENTION When browsing various document data via the above-mentioned system, particularly, a network spread all over the world such as the Internet, a provider of the document data and a viewer of the document data Often the native language is different from the native language. However, writing and understanding in languages other than the native language is often difficult. To solve this, the following two methods are known. One is to store a document having the same content as a plurality of document data described in a plurality of languages in a server device, and select document data in a desired language from a client device to thereby obtain a document described in a desired language. This is a method that allows data to be browsed. Another method is to mount a language translation program on a client device and use the language translation program to translate document data transmitted from a server into document data in a desired language. With these methods, document data described in a language other than the native language can also be browsed in the native language. However, even in that case, the following problems remain.

【0006】先ず、同一内容の文書を複数の言語で記述
された複数の文書データとしてサーバー装置に記憶させ
る方法では、1つの内容の文書でも、その内容を様々な
言語で記述された複数の文書データとして作成する必要
があり、多くの費用と労力を必要とする問題がある。
First, in a method of storing a document having the same content as a plurality of document data described in a plurality of languages in a server device, even if a document has a single content, a plurality of documents having the same content described in various languages are stored. There is a problem that it needs to be created as data and requires a lot of cost and labor.

【0007】また、言語翻訳プログラムをクライアント
装置に搭載する方法では、各サーバーにより提供される
様々な言語の文章をすべて翻訳して表示するためには、
クライアント装置にそれぞれの言語から所望の言語へ翻
訳可能な多数の言語翻訳プログラムを搭載する必要があ
る。これはクライアント装置のコストを上昇させる。ま
た、現在実用化されている言語翻訳プログラムでは、翻
訳する原文書に元来含まれている曖昧さにより、望まし
い翻訳結果が得られないと言う問題もある。
In the method in which a language translation program is installed in a client device, in order to translate and display all sentences in various languages provided by each server,
It is necessary to mount a large number of language translation programs capable of translating each language into a desired language on the client device. This increases the cost of the client device. Further, in a language translation program currently in practical use, there is a problem that a desired translation result cannot be obtained due to the ambiguity originally included in the original document to be translated.

【0008】これを解決するために、本出願人が既に出
願した特願平8−322842号において提案したよう
に、サーバー装置に記憶される文書データを、自然言語
で記述された文書データではなく、自然言語で記述され
た文書データを文法的、意味的に解析した結果として得
られる中間形式文書データとして記憶する。そして、ク
ライアント装置から文書データの要求があると、その文
書データに対応した中間形式文書データを記憶装置から
読み出し、読み出した中間形式文書データからクライア
ント装置が要求する自然言語で記述された文書データを
生成し、生成された文書データをクライアント装置に送
信する。このように、クライアント装置に特別な言語翻
訳プログラムを必要とせず、かつ多数の言語で記述され
る文書データをより簡易に提供可能な多言語対応通信シ
ステムを提案している。
In order to solve this problem, as proposed in Japanese Patent Application No. 8-322842 filed by the present applicant, document data stored in a server device is not a document data described in a natural language. The document data described in natural language is grammatically and semantically analyzed and stored as intermediate format document data. When there is a request for document data from the client device, the intermediate format document data corresponding to the document data is read from the storage device, and from the read intermediate format document data, the document data described in the natural language requested by the client device is converted. The generated document data is transmitted to the client device. As described above, a multilingual communication system that does not require a special language translation program in a client device and that can easily provide document data described in many languages has been proposed.

【0009】しかし、前記既提案の多言語対応通信シス
テムでは、中間形式文書データから、所望の自然言語
(以下、目標言語と呼ぶ)で記述された文書データを生
成するプログラム(以下、目標言語文書生成プログラム
と呼ぶ)は複雑な処理を必要とし、クライアント装置か
らの要求を受けて目標言語文書を生成し、その文書をク
ライアント装置へ送信するまでに長い時間を必要とする
点が問題となっていた。
However, in the multilingual communication system proposed above, a program for generating document data described in a desired natural language (hereinafter referred to as a target language) from intermediate format document data (hereinafter referred to as a target language document). The problem is that it takes a long time to generate a target language document in response to a request from a client device and send the document to the client device. Was.

【0010】本発明は、上述した問題点を解決するため
になされたものであり、クライアント装置からの要求を
受けてから短時間で文書を送信できる多言語対応通信シ
ステムを提供することを目的とする。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problems, and has as its object to provide a multilingual communication system capable of transmitting a document in a short time after receiving a request from a client device. I do.

【0011】[0011]

【課題を解決するための手段】この目的を達成するため
に、本発明の多言語対応通信システムは、クライアント
装置と、前記クライアント装置からの要求に応じた文書
データを前記クライアント装置に送信するサーバー装置
とから構成される。そして、前記クライアント装置で
は、要求情報送信手段が、所望の文書データを特定可能
な文書識別情報と、その文書データの記述言語を指定す
る要求言語情報とを前記サーバー装置に送信し、前記受
信出力手段が、前記サーバー装置から文書データを受信
し、表示出力、印字出力、音声出力等の出力処理を行
う。前記サーバー装置では、原文書入力手段で所定の自
然言語で記述された原文書データを入力し、原文書解析
手段が入力した原文書データの文法的、意味的な解析結
果である中間形式表現で記述した中間形式文書データを
生成し、中間形式文書記憶手段が中間形式文書データを
記憶する。
In order to achieve this object, a multilingual communication system according to the present invention comprises a client device and a server for transmitting document data according to a request from the client device to the client device. And a device. In the client device, the request information transmitting unit transmits to the server device document identification information capable of specifying desired document data and request language information for specifying a description language of the document data, and The means receives the document data from the server device and performs output processing such as display output, print output, and voice output. In the server device, original document data described in a predetermined natural language is inputted by the original document input means, and the original document data inputted by the original document analyzing means is expressed in an intermediate form expression which is a grammatical and semantic analysis result. The described intermediate format document data is generated, and the intermediate format document storage unit stores the intermediate format document data.

【0012】そして、原文書書き込み手段が、前記原文
書入力手段で入力された原文書データを原文書記憶手段
に記憶させ、前記原文書データと前記原文書解析手段で
生成された中間形式文書データとの対応関係と、前記原
文書データの記述言語名とを特定する文書対応情報を前
記文書対応情報記憶手段に記憶させる。また、前記サー
バー装置では、要求情報受信手段が前記クライアント装
置から前記文書識別情報と、前記要求言語情報とを受信
し、中間形式文書読み出し手段が、前記文書識別情報に
対応した中間形式文書データを、前記中間形式記憶手段
から読み出し、目標言語文書生成手段が、前記中間形式
文書読み出し手段で読み出した中間形式文書データか
ら、前記要求言語情報に対応した言語で記述した文書デ
ータを生成する。
The original document writing means stores the original document data input by the original document input means in the original document storage means, and stores the original document data and the intermediate format document data generated by the original document analysis means. Is stored in the document correspondence information storage means. The document correspondence information for specifying the correspondence between the document correspondence information and the description language name of the original document data. In the server device, the request information receiving unit receives the document identification information and the request language information from the client device, and the intermediate format document reading unit reads the intermediate format document data corresponding to the document identification information. The target language document generation unit reads document data from the intermediate format storage unit and generates document data described in a language corresponding to the requested language information from the intermediate format document data read by the intermediate format document reading unit.

【0013】さらに、原文書判定手段は、前記中間形式
文書読み出し手段の実行に先立って実行され、前記文書
識別情報と前記要求言語情報に対応する文書対応情報を
持つ原文書データが前記文書対応情報記憶手段に記憶さ
れているか判定する。前記原文書判定手段で記憶されて
いると判定された場合、原文書読み出し手段が前記文書
識別情報と前記要求言語情報に対応する文書対応情報を
持つ原文書データを前記原文書記憶手段から読み出す。
そして、文書送信手段が、前記原文書読み出し手段で読
み出された目標言語文書データを前記クライアント装置
に送信する。記憶されていないと判定された場合は、文
書送信手段は前記目標言語生成手段で生成された目標言
語文書をクライアント装置に送信する。
Further, the original document determining means is executed prior to the execution of the intermediate format document reading means, and the original document data having the document identification information and the document correspondence information corresponding to the requested language information is stored in the document correspondence information. It is determined whether it is stored in the storage means. When it is determined that the original document is stored by the original document determining unit, the original document reading unit reads the original document data having the document identification information and the document correspondence information corresponding to the requested language information from the original document storing unit.
Then, the document transmitting means transmits the target language document data read by the original document reading means to the client device. When it is determined that the target language document is not stored, the document transmitting unit transmits the target language document generated by the target language generating unit to the client device.

【0014】[0014]

【発明の実施の形態】以下に、本発明の多言語対応通信
システムを具体化した実施の形態について図面を参照し
て説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of a multilingual communication system according to the present invention will be described below with reference to the drawings.

【0015】図1に本実施の形態の多言語対応通信シス
テムの概念図を示す。サーバー装置102は、文書データ
を、特定の自然言語によらない中間形式文書データ(詳
細は後述)として記憶している。また、中間形式文書デ
ータから、目標となる自然言語(以下、目標言語と呼
ぶ)で記述された文書データを生成するための目標言語
文書生成プログラムも記憶している。さらに中間形式文
書データを生成する際に、元となった文書である原文書
データも記憶している。クライアント装置103は通信ネ
ットワーク101を介して、文書データの指示情報と、そ
の文書データの記述言語の指示情報とからなる要求情報
を所望のサーバー装置102に送信する。サーバー装置102
は、クライアント装置103から送信された要求情報に基
づいて、指定された中間形式文書データから指定された
自然言語による文書データを生成し、生成した文書デー
タを通信ネットワーク101を介してクライアント装置103
に送信する。そして、クライアント装置はその文書デー
タを受信し、表示出力、印字出力、音声出力等の出力を
行う。
FIG. 1 shows a conceptual diagram of a multilingual communication system according to the present embodiment. The server device 102 stores the document data as intermediate format document data not described in a specific natural language (details will be described later). Also, a target language document generation program for generating document data described in a target natural language (hereinafter, referred to as a target language) from the intermediate format document data is stored. Further, when generating the intermediate format document data, the original document data which is the original document is also stored. The client apparatus 103 transmits request information including instruction information of document data and instruction information of a description language of the document data to a desired server apparatus 102 via the communication network 101. Server device 102
Generates document data in the designated natural language from the designated intermediate format document data based on the request information transmitted from the client device 103, and transmits the generated document data to the client device 103 via the communication network 101.
Send to Then, the client device receives the document data and performs output such as display output, print output, and audio output.

【0016】図2に本発明を好適に適用したサーバー装
置のブロック図を示す。
FIG. 2 shows a block diagram of a server device to which the present invention is suitably applied.

【0017】サーバー装置102は、ROM202と、RAM203、C
PU204、表示制御部205、入力部206、通信制御部207及び
それらを接続するバス209により構成される。CPU204
は、記憶されている各種のプログラムに基づいて様々な
制御を実行し、本サーバー装置102の動作の主体をなし
ている。表示制御部205は、表示データの蓄積とディス
プレイモニターの制御を行い、モニター208に表示出力
を行う。モニター208はCRTディスプレイや、LCDディス
プレイなど様々な表示装置を利用できる。入力部206
は、記憶される文書データの入力や、サーバー装置102
への指示を入力するためのものであり、キーボード装置
である。通信制御部207は、通信網210と接続される。通
信網210は、公衆回線や、専用回線の回線網であり、通
信ネットワーク101の構成要素である。通信制御部207
は、通信網210とサーバー装置102とのデータ通信を制御
し、データの送受信を行う。通信制御部207は、公衆回
線や専用回線と接続するためのモデム装置である。
The server device 102 includes a ROM 202, a RAM 203, and a C
It comprises a PU 204, a display control unit 205, an input unit 206, a communication control unit 207, and a bus 209 connecting them. CPU204
Performs various controls based on various stored programs, and forms the main body of the operation of the server device 102. The display control unit 205 accumulates display data and controls a display monitor, and outputs a display to the monitor 208. The monitor 208 can use various display devices such as a CRT display and an LCD display. Input unit 206
Input of stored document data,
And a keyboard device. The communication control unit 207 is connected to the communication network 210. The communication network 210 is a public network or a dedicated network, and is a component of the communication network 101. Communication control unit 207
Controls data communication between the communication network 210 and the server device 102 to transmit and receive data. The communication control unit 207 is a modem device for connecting to a public line or a dedicated line.

【0018】なお、入力部206は、前記の構成以外に、
マウス装置等の指示装置や、音声入力装置、タッチパネ
ル装置等の様々な入力装置や、その組み合わせで構成し
てもよい。また、通信制御部207は、無線の公衆回線や
専用回線と接続するための送受信装置とか、LAN(Local
Area Network)に接続するためのイーサーネット接続装
置、トークンリング接続装置とか、ATM(Asynchronous T
ransfer Mode)回線網への接続装置等、様々な接続装置
でもよい。
The input unit 206 has a structure other than the above-described structure.
A pointing device such as a mouse device, various input devices such as a voice input device and a touch panel device, and a combination thereof may be used. Further, the communication control unit 207 includes a transmitting / receiving device for connecting to a wireless public line or a dedicated line, or a LAN (Local
An Ethernet connection device, a token ring connection device, or an ATM (Asynchronous T
(ransfer Mode) Various connection devices such as a connection device to a network may be used.

【0019】ROM202は各種プログラムや、翻訳辞書のデ
ータ等を記憶している。
The ROM 202 stores various programs, translation dictionary data, and the like.

【0020】ROM202内にはさらに各種の記憶部が形成さ
れている。通信制御プログラム記憶部202aは、通信制御
部207を介した各種通信の制御や、クライアント装置か
らの文書データ要求の受信や、生成された文書データの
クライアント装置への送信処理等を行う通信制御プログ
ラムを記憶している。通信制御プログラムと、通信制御
部207とが請求項記載の要求情報受信手段と、文書送信
手段との主体をなす。
In the ROM 202, various storage units are further formed. The communication control program storage unit 202a is a communication control program that controls various types of communication via the communication control unit 207, receives a document data request from a client device, and transmits generated document data to the client device. I remember. The communication control program and the communication control unit 207 form the subject of request information receiving means and document transmitting means described in the claims.

【0021】目標言語文書生成プログラム記憶部202b
は、中間形式文書データから、各種の目標言語文書デー
タを生成するための、目標言語文書生成プログラムを記
憶する。なお、目標言語文書生成プログラムが請求項記
載の目標言語文書生成手段の主体をなす。本実施の形態
では、生成する文書の目標言語の種類に応じて目標言語
文書生成プログラムが別になっているものとし、目標言
語文書生成プログラム記憶部202bは、生成する文書の目
標言語に応じた少なくとも1つの目標言語文書生成プロ
グラムを記憶する。なお、前記以外に、各目標言語に対
応した別々の目標言語文書生成プログラムを用いるので
はなく、全ての目標言語に対応できる単一の目標言語文
書生成プログラムを用い、目標言語文書生成プログラム
記憶部202bはその単一の目標言語文書生成プログラムを
記憶してもよい。あるいは、言語構造として類似した複
数の目標言語に対応可能な目標言語文書生成プログラム
を用い、それを記憶してもよい。
The target language document generation program storage unit 202b
Stores a target language document generation program for generating various target language document data from the intermediate format document data. It should be noted that the target language document generation program forms the subject of the target language document generation means described in the claims. In the present embodiment, it is assumed that the target language document generation program is different depending on the type of the target language of the document to be generated, and the target language document generation program storage unit 202b stores at least the target language according to the target language of the document to be generated. Store one target language document generator. In addition to the above, instead of using a separate target language document generation program corresponding to each target language, a single target language document generation program capable of supporting all target languages is used, and a target language document generation program storage unit is used. 202b may store the single target language document generator. Alternatively, a target language document generation program that can support a plurality of target languages having similar language structures may be used and stored.

【0022】中間形式文書データ作成プログラム記憶部
202cは、所定の自然言語で記述された文書データに基づ
いて、中間形式文書データを作成する中間形式文書デー
タ作成プログラムを記憶する。なお、中間形式文書デー
タ作成プログラムが本発明の原文書解析手段の主体をな
す。
Intermediate format document data creation program storage unit
Reference numeral 202c stores an intermediate format document data creation program that creates intermediate format document data based on document data described in a predetermined natural language. It should be noted that the intermediate format document data creation program forms the main part of the original document analysis means of the present invention.

【0023】文書管理プログラム記憶部202dは、中間形
式文書データ記憶部203dに対して中間形式文書データを
保存、読み出し、あるいは、検索を行うときの主体とな
る文書管理プログラムを記憶する。文書管理プログラム
が、本発明の中間形式文書読み出し手段の主体をなす。
The document management program storage unit 202d stores a document management program which is a main body when storing, reading, or searching for intermediate format document data in the intermediate format document data storage unit 203d. The document management program forms the subject of the intermediate format document reading means of the present invention.

【0024】翻訳辞書記憶部202eは、目標言語文書生成
プログラムが処理を行う場合に必要とされる、目標言語
に対応した生成規則データ、形態素生成辞書等の各種デ
ータを記憶している。さらに、翻訳辞書記憶部202eは、
中間形式文書データ作成プログラムが処理を行う場合に
必要とされる形態素解析辞書、構文規則データ、構文解
析辞書、依存規則データ等の各種データも記憶してい
る。
The translation dictionary storage unit 202e stores various data required when the target language document generation program performs processing, such as generation rule data corresponding to the target language and a morpheme generation dictionary. Further, the translation dictionary storage unit 202e
Various data such as a morphological analysis dictionary, syntax rule data, a syntax analysis dictionary, and dependency rule data required when the intermediate format document data creation program performs processing are also stored.

【0025】原文書データ書き込みプログラム記憶部20
2fは、原文書データ記憶部203eに対して原文書データを
書き込み、さらに、原文書データと原文書データから生
成された中間形式文書データとの対応関係と、原文書デ
ータの記述言語名とを特定する文書対応情報を書き込み
を行うときの主体となる原文書データ書き込みプログラ
ムを記憶する。原文書データ書き込みプログラムが、本
発明の原文書書き込み手段の主体をなす。
Original document data writing program storage unit 20
2f writes the original document data into the original document data storage unit 203e, and further stores the correspondence between the original document data and the intermediate format document data generated from the original document data, and the description language name of the original document data. An original document data writing program which is a main body when writing the specified document correspondence information is stored. An original document data writing program forms the subject of the original document writing means of the present invention.

【0026】原文書データ読み出しプログラム記憶部20
2gは、原文書データ記憶部203eに対して原文書データの
記述言語と原文書データから生成された中間形式文書デ
ータとを特定する文書対応情報で検索を行い、該当する
原文書データの読み出しを行うときの主体となる原文書
データ読み出しプログラムを記憶する。原文書データ読
み出しプログラムが、本発明の原文書読み出し手段の主
体をなす。
Original document data reading program storage unit 20
2g searches the original document data storage unit 203e with document correspondence information for specifying the description language of the original document data and the intermediate format document data generated from the original document data, and reads out the corresponding original document data. An original document data reading program which is a main body when performing the operation is stored. The original document data reading program forms the subject of the original document reading means of the present invention.

【0027】原文書データ判定プログラム記憶部202h
は、原文書データ記憶部203eに対して原文書データの記
述言語と原文書データから生成された中間形式文書デー
タとを特定する文書対応情報で検索を行い、同一の文書
対応情報を持つデータが記憶されているか否かを判定す
る。原文書データ判定プログラムが、本発明の原文書判
定手段の主体をなす。
Original document data determination program storage unit 202h
Performs a search on the original document data storage unit 203e with the document correspondence information specifying the description language of the original document data and the intermediate format document data generated from the original document data, and data having the same document correspondence information is retrieved. It is determined whether or not it is stored. The original document data determination program forms the subject of the original document determination means of the present invention.

【0028】なお、ROM202は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
The ROM 202 is not limited to the ROM, and may be a storage device such as a magnetic disk device, a magneto-optical disk device, or a CD-ROM storage device.

【0029】RAM203は、中間形式文書データ等のデータ
の保存や、様々な一時データを記憶するために使用さ
れ、次のような各記憶部が内部に形成されている。
The RAM 203 is used to store data such as intermediate format document data and various temporary data, and has the following storage units formed therein.

【0030】ワークメモリ203aは、各プログラムが動作
時に必要とする一時的な記憶領域を提供する。また、生
成文書メモリ203bは、中間形式文書データ記憶部203dに
記憶された中間形式文書データに基づいて、目標言語文
書生成プログラム記憶部202bに記憶された目標言語文書
生成プログラムが生成した目標言語文書データを一時的
に記憶する。さらに、原文書メモリ203cは、中間言語作
成プログラムの入力データとなる、所定の自然言語で記
述された文書データ(以下、原文書データと呼ぶ)を記
憶する。原文書データは、入力部206や、通信制御部207
を介して入力される。入力部206と通信制御プログラム
と通信制御部207が、本発明の原文書入力手段の主体を
なす。
The work memory 203a provides a temporary storage area required by each program during operation. Further, based on the intermediate format document data stored in the intermediate format document data storage unit 203d, the generated document memory 203b stores a target language document generated by the target language document generation program stored in the target language document generation program storage unit 202b. Store the data temporarily. Further, the original document memory 203c stores document data described in a predetermined natural language (hereinafter, referred to as original document data), which is input data of the intermediate language creation program. The original document data is input to the input unit 206 and the communication control unit 207.
Is entered via The input unit 206, the communication control program, and the communication control unit 207 form an original document input unit of the present invention.

【0031】中間形式文書データ記憶部203dは、中間形
式文書データを少なくとも1つ記憶している。中間形式
文書データ記憶部が、本発明の中間形式文書記憶手段の
主体をなす。
The intermediate format document data storage section 203d stores at least one intermediate format document data. The intermediate format document data storage unit forms the main body of the intermediate format document storage means of the present invention.

【0032】原文書データ記憶部203eは、原文書データ
を記憶すると共に、文書識別情報と原文書データの記述
言語名とを文書対応情報として合わせて記憶する。原文
書データ記憶部が、請求項記載の原文書記憶手段と文書
対応情報記憶手段の主体をなす。本実施の形態において
は、原文書データと文書対応情報とは同一の記憶装置に
記憶されているが、これは別々の記憶装置に記憶するよ
うに構成しても構わない。
The original document data storage unit 203e stores the original document data, and also stores the document identification information and the description language name of the original document data as document correspondence information. The original document data storage unit is the main body of the original document storage unit and the document correspondence information storage unit described in the claims. In the present embodiment, the original document data and the document correspondence information are stored in the same storage device, but they may be stored in separate storage devices.

【0033】なお、RAM203は、RAMに限らず、磁気ディ
スク装置や、光磁気ディスク装置等の記憶装置であって
もよい。
The RAM 203 is not limited to the RAM, but may be a storage device such as a magnetic disk device or a magneto-optical disk device.

【0034】次に、図3に本発明を好適に適用した実施
の形態のクライアント装置のブロック図を示す。
Next, FIG. 3 shows a block diagram of a client device according to an embodiment to which the present invention is suitably applied.

【0035】クライアント装置103は、ROM302と、RAM30
3、CPU304、表示制御部305、入力部306、通信制御部307
及びそれらを接続するバス309により構成される。CPU30
4は記憶されている各種のプログラムに基づいて様々な
制御を実行し、本クライアント装置103の動作の主体を
なしている。表示制御部305は表示データの蓄積とディ
スプレイモニターの制御を行い、モニター308に表示出
力を行う。モニター308はCRTディスプレイや、LCDディ
スプレイ等様々な表示装置を利用できる。入力部306
は、文書データの文書識別情報や、要求言語情報等を入
力したり、クライアント装置103への各種指示を入力す
るためのものであり、キーボード装置である。通信制御
部307は、通信網210と接続され、通信網210とクライア
ント装置103とのデータ通信を制御し、データの送受信
を行う。通信制御部307は公衆回線や、専用回線と接続
するためのモデム装置である。
The client device 103 includes a ROM 302 and a RAM 30
3, CPU 304, display control unit 305, input unit 306, communication control unit 307
And a bus 309 connecting them. CPU30
Reference numeral 4 executes various controls based on various stored programs, and forms the subject of the operation of the client device 103. The display control unit 305 accumulates display data and controls a display monitor, and outputs a display to the monitor 308. The monitor 308 can use various display devices such as a CRT display and an LCD display. Input unit 306
Is a keyboard device for inputting document identification information of document data, required language information and the like, and inputting various instructions to the client device 103. The communication control unit 307 is connected to the communication network 210, controls data communication between the communication network 210 and the client device 103, and transmits and receives data. The communication control unit 307 is a modem device for connecting to a public line or a dedicated line.

【0036】なお、入力部306は、前記の構成以外に、
マウス装置等の指示装置や、音声入力装置、タッチパネ
ル装置等の様々な入力装置や、その組み合わせで構成し
てもよい。また、通信制御部307は、無線の公衆回線や
専用回線と接続するための送受信装置とか、LAN(Local
Area Network)に接続するためのイーサーネット接続装
置、トークンリング接続装置とか、ATM(Asynchronous T
ransfer Mode)回線網への接続装置等、様々な接続装置
でもよい。また、表示制御部305とモニター308とを用い
る以外に、印字出力装置や、音声出力装置を用いる構成
とし、文書データを印字出力や音声出力する構成として
もよい。
It should be noted that the input unit 306 has, in addition to the above-described configuration,
A pointing device such as a mouse device, various input devices such as a voice input device and a touch panel device, and a combination thereof may be used. The communication control unit 307 includes a transmitting / receiving device for connecting to a wireless public line or a dedicated line, or a LAN (Local
An Ethernet connection device, a token ring connection device, or an ATM (Asynchronous T
(ransfer Mode) Various connection devices such as a connection device to a network may be used. Further, in addition to using the display control unit 305 and the monitor 308, a configuration may be adopted in which a print output device or an audio output device is used, and the document data is output in a print or audio output.

【0037】ROM302は各種プログラムを記憶している。
そのROM302内にはさらに各種の記憶部が形成されてい
る。通信制御プログラム記憶部302aは、通信制御部307
を介した各種通信の制御や、サーバー装置へのデータ送
受信処理等を行う通信制御プログラムを記憶している。
この通信制御プログラムと、通信制御部307とが本発明
の要求情報送信手段の主体をなす。表示プログラム記憶
部302bは、サーバーから受信した文書データを表示制御
部305を用いて表示するための表示プログラムを記憶し
ている。表示プログラムと、表示制御部305と、通信制
御プログラムと、通信制御部307とが本発明の受信出力
手段の主体をなす。要求情報入力プログラム記憶部302c
は、ユーザーが入力部306を用いて、所望する文書デー
タの文書識別情報と、要求言語情報とを入力する処理を
制御するための、要求情報入力プログラムを記憶する。
The ROM 302 stores various programs.
Various storage units are further formed in the ROM 302. The communication control program storage unit 302a includes a communication control unit 307
It stores a communication control program for controlling various kinds of communication via the server and performing processing for transmitting and receiving data to and from a server device.
The communication control program and the communication control unit 307 form the subject of the request information transmitting unit of the present invention. The display program storage unit 302b stores a display program for displaying the document data received from the server using the display control unit 305. The display program, the display control unit 305, the communication control program, and the communication control unit 307 form the subject of the reception output unit of the present invention. Request information input program storage unit 302c
Stores a request information input program for controlling a process in which a user uses the input unit 306 to input document identification information of desired document data and request language information.

【0038】なお、ROM302は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
The ROM 302 is not limited to a ROM, and may be a storage device such as a magnetic disk device, a magneto-optical disk device, or a CD-ROM storage device.

【0039】RAM303は、様々な一時データを保存するた
めに使用され、次のような各記憶部が内部に形成されて
いる。ワークメモリ303aは各プログラムが動作時に必要
とする一時的な記憶領域を提供する。受信文書メモリ30
3bは、サーバー装置から受信した文書データを一時保存
する。なお、RAM303は、RAMに限らず、磁気ディスク装
置や、光磁気ディスク装置等の記憶装置であってもよ
い。
The RAM 303 is used to store various temporary data, and has the following storage units formed therein. The work memory 303a provides a temporary storage area required by each program during operation. Received document memory 30
3b temporarily stores the document data received from the server device. The RAM 303 is not limited to the RAM, but may be a storage device such as a magnetic disk device or a magneto-optical disk device.

【0040】次に、サーバー装置102と、クライアント
装置103との基本的な処理の流れを図4を用いて説明す
る。先ず、クライアント装置103では、所望する文書デ
ータの要求情報の入力処理を行う(S401)。次に、入力し
た指示情報からその文書データが所在するサーバー装置
を通信ネットワーク上で一意に決定する情報である、サ
ーバー装置のアドレスを取得する(S402)。本実施の形態
では、サーバー装置のアドレスとしてTCP/IP(Transmiss
ion Control Protocol/Internet Protocol)で規定され
るホスト名あるいはIPアドレスを用いるものとするが、
他に通信ネットワーク上のアドレスを決定できる情報で
あれば何でもよい。次に、所望する文書データ指示情報
から、その文書データのサーバー装置内での指示情報で
ある文書識別情報を決定する(S403)。次に、所望する文
書データがどの自然言語によって記述されるかを指定す
る要求言語の情報を決定する(S404)。
Next, a basic processing flow between the server device 102 and the client device 103 will be described with reference to FIG. First, the client device 103 performs input processing of request information of desired document data (S401). Next, the address of the server device, which is information for uniquely determining the server device where the document data is located on the communication network, is acquired from the input instruction information (S402). In this embodiment, TCP / IP (Transmiss
ion Control Protocol / Internet Protocol).
Any other information that can determine an address on the communication network may be used. Next, the document identification information, which is the instruction information of the document data in the server device, is determined from the desired document data instruction information (S403). Next, information on a request language that specifies which natural language is used to describe the desired document data is determined (S404).

【0041】次に、決定された文書識別情報と、要求言
語情報とをS402で決定されたアドレスのサーバー装置に
送信する(S405)。本実施の形態では、サーバー装置への
送信方法として、TCP/IP上のHTTP(Hyper Text Transfer
Protocol)を用いるとする。具体的にはクライアント装
置は、図5(a)に示す形式のデータをサーバー装置に送
信する。"GET"はデータ要求を意味し、<文書識別情報>
にはS402で決定された文書識別情報を指定する。<バー
ジョン情報>はHTTPのバージョン情報を指定し、<CRLF>
は復帰改行文字を示す。<各種ヘッダー情報>にはHTTPで
規定されたヘッダー情報を必要に応じて指定する。"Acc
ept-Language:"は次に要求言語情報が続くことを示す文
字列であり、<要求言語>には要求言語を識別する予め定
められた文字列を指定する。図5(b)は文書識別情報と
して"/pub/sample.html"、HTTPバージョンが1.0、日本
語を要求言語とした場合の例である。なお、上述したTC
P/IP及びHTTPは、既に広く実用化された公知の技術であ
るため、説明を省略する。
Next, the determined document identification information and the requested language information are transmitted to the server at the address determined in S402 (S405). In the present embodiment, as a transmission method to the server device, HTTP (Hyper Text Transfer) over TCP / IP is used.
Protocol). Specifically, the client device transmits data in the format shown in FIG. 5A to the server device. "GET" means data request, <document identification information>
Specifies the document identification information determined in S402. <Version information> specifies HTTP version information, and <CRLF>
Indicates a newline character. For <various header information>, specify the header information specified by HTTP as necessary. "Acc
ept-Language: "is a character string indicating that the requested language information follows, and <required language> specifies a predetermined character string for identifying the requested language. FIG. 5B shows document identification. This is an example where the information is "/pub/sample.html", the HTTP version is 1.0, and the requested language is Japanese.
P / IP and HTTP are well-known technologies that have already been widely put into practical use, and a description thereof will be omitted.

【0042】サーバー装置では、S405でクライアント装
置から送信された要求文書の文書識別情報と、要求言語
情報を受信し(S408)、受信した情報に基づいて所望の自
然言語による所望の文書データを生成するために、文書
データ生成処理を実行する(S409)。S409の詳細は後述す
る。S409にて所望の自然言語による所望の文書データを
生成できない場合は、それをエラーと判定する(S410)。
本実施の形態では、このエラーの判定は後述するエラー
フラグを参照することで判定する。エラーでなければ生
成した文書データをクライアントに送信し(S411)、エラ
ーならばエラー情報を送信する(S412)。クライアントで
はサーバーから文書データもしくはエラー情報を受信し
(S406)、表示装置に表示する(S407)。
The server device receives the document identification information of the requested document and the requested language information transmitted from the client device in S405 (S408), and generates desired document data in a desired natural language based on the received information. In order to do so, a document data generation process is executed (S409). Details of S409 will be described later. If the desired document data in the desired natural language cannot be generated in S409, it is determined as an error (S410).
In the present embodiment, this error is determined by referring to an error flag described later. If there is no error, the generated document data is transmitted to the client (S411), and if there is an error, error information is transmitted (S412). The client receives document data or error information from the server
(S406), it is displayed on the display device (S407).

【0043】次に、文書データ生成処理(S409)の詳細に
ついて、図6を用いて説明する。先ず、エラー状態を記
憶するために、ワークメモリ203a内に形成されたエラー
フラグ(図示せず)をクリアーして、エラーなしの状態と
する(S601)。そして、S602では原文書データ判定プログ
ラムが、文書識別情報で指定され、かつ要求言語で記述
された文書データの、原文書データ記憶部203e上での有
無を判定し(S602)、もし、該当する文書データがサーバ
ー装置内に存在する場合は(S602:Yes)、文書データを読
み出すためにS608に処理を進め、存在しない場合は(S60
2:No)、S603に処理を進める。
Next, the details of the document data generation processing (S409) will be described with reference to FIG. First, in order to store an error state, an error flag (not shown) formed in the work memory 203a is cleared to set an error-free state (S601). Then, in S602, the original document data determination program determines whether the document data specified by the document identification information and described in the request language exists in the original document data storage unit 203e (S602). If the document data exists in the server device (S602: Yes), the process proceeds to S608 to read out the document data.
2: No), the process proceeds to S603.

【0044】本実施の形態においては、原文書データ記
憶部203eで記憶される原文書データは、中間形式文書生
成にあたって元となった文書データのファイルであり、
その原文書データを特定する文書対応情報として、原文
書データから生成された中間形式文書データを収納して
いるファイル名である文書識別情報と、原文書データの
記述言語名とが付随して記憶されている。図7(a)は原
文書データ記憶部203eに記憶されるデータのデータ構造
を表わしており、図5(b)で要求される文書データにつ
いては、原文書データ記憶部203eへは図7(b)のように
記憶される。文書識別情報として中間言語ファイルのフ
ァイル名である"/pub/sample.html"が、原文書データの
記述言語名として日本語を表わす"jp"が文書対応情報の
フィールドにあり、文書データのフィールドには中間言
語ファイル"/pub/sample.html"が生成される際に元とな
った、日本語で記述された原文書データがある。
In the present embodiment, the original document data stored in the original document data storage unit 203e is a file of the original document data upon generating the intermediate format document.
As document correspondence information for identifying the original document data, document identification information, which is a file name containing the intermediate format document data generated from the original document data, and a description language name of the original document data are additionally stored. Have been. FIG. 7A shows a data structure of data stored in the original document data storage unit 203e. For the document data requested in FIG. It is stored as in b). "/Pub/sample.html" which is the file name of the intermediate language file is used as the document identification information, and "jp" representing Japanese is used as the description language name of the original document data in the field of the document correspondence information. Contains original document data described in Japanese, which was used when the intermediate language file "/pub/sample.html" was generated.

【0045】そして、原文書データ判定プログラムが、
文書識別情報で指定されたファイル名と、要求された記
述言語名とを文書対応情報に持つデータが原文書データ
記憶部203eに存在するか否かの判定をS602で行い、存在
すると判定された場合S608で原文書読み出しプログラム
が文書データの部分を生成文書メモリ203bに読み込むこ
とになる。
Then, the original document data judgment program
It is determined in S602 whether or not data having the file name specified in the document identification information and the requested description language name in the document correspondence information exists in the original document data storage unit 203e, and it is determined that the data exists. In this case, in S608, the original document reading program reads the document data portion into the generated document memory 203b.

【0046】S603では文書識別情報で指定された文書デ
ータの、中間形式文書データ記憶部203d上での有無を判
定し、もし、該当する文書データがサーバー装置内に存
在しない場合は(S603:No)、エラーとするためにS609に
処理を進め、存在した場合は(S603:Yes)、S604に処理を
進める。S604では文書管理プログラムが、クライアント
から送信された文書識別情報で指示された中間形式文書
データを、中間形式文書データ記憶部203dから検索し
て、ワークメモリ203aに読み込む。本実施の形態におい
ては、中間形式文書データ記憶部203dで記憶される中間
形式文書データは、それぞれの中間形式文書データが1
つのファイルに対応するものとし、中間形式文書データ
を指定する文書識別情報としては、中間形式文書データ
を収納しているファイル名を用いるものとする。この場
合は、文書識別情報で示されたファイル名のファイルが
存在するか否かでS603の判定を行い、S604では文書管理
プログラムがそのファイルのデータをワークメモリ203a
に読み込むこととなる。
In S603, it is determined whether or not the document data specified by the document identification information exists in the intermediate format document data storage unit 203d. If the corresponding document data does not exist in the server device (S603: No ), The process proceeds to S609 to generate an error, and if there is an error (S603: Yes), the process proceeds to S604. In S604, the document management program searches the intermediate format document data storage unit 203d for the intermediate format document data designated by the document identification information transmitted from the client, and reads it into the work memory 203a. In the present embodiment, the intermediate format document data stored in the intermediate format document data storage
It is assumed that one file corresponds to one file, and that the file name storing the intermediate format document data is used as the document identification information for specifying the intermediate format document data. In this case, it is determined in step S603 whether or not a file having the file name indicated by the document identification information exists. In step S604, the document management program stores the data of the file in the work memory 203a.
Will be read.

【0047】なお、文書識別情報としてファイル名を用
いる方法以外に、文書管理プログラムとしてデータベー
ス管理プログラムを用い、中間形式文書データ記憶部20
3dとしてデータベースの記憶領域を対応させ、文書識別
情報としてデータベース内の文書データを特定可能な指
示情報を用いてもよい。
In addition to the method using the file name as the document identification information, a database management program is used as the document management program, and the intermediate format document data storage unit 20 is used.
The storage area of the database may be associated with 3d, and instruction information capable of specifying document data in the database may be used as document identification information.

【0048】次に、読み出した中間言語形式文書データ
をS408にて受信した要求言語情報に基づいた目標言語に
翻訳可能か否かを判定する(S605)。本実施の形態におい
ては、前記したように、各目標言語毎に個別の目標言語
文書生成プログラムを持っているので、S408にて受信し
た要求言語情報に対応した目標言語文書生成プログラム
が目標言語文書生成プログラム記憶部202bに記憶されて
いるか否かで、S605の判定を行う。
Next, it is determined whether the read intermediate language format document data can be translated into a target language based on the requested language information received in S408 (S605). In the present embodiment, as described above, since each target language has a separate target language document generation program, the target language document generation program corresponding to the requested language information received in S408 is The determination in S605 is made based on whether or not the generated program is stored in the generated program storage unit 202b.

【0049】S606では、読み込んだ中間形式文書データ
から目標言語文書データを生成する目標言語文書生成処
理を実行する。S606の詳細は後述する。S607では、S606
にて生成された目標言語文書データを、送信のために一
旦生成文書メモリ203bに記憶する。S609では、S603とS6
05での判定を受けて、エラー処理をするためにエラーフ
ラグをセットしてエラー状態を記憶する。
In S606, target language document generation processing for generating target language document data from the read intermediate format document data is executed. Details of S606 will be described later. In S607, S606
Is temporarily stored in the generated document memory 203b for transmission. In S609, S603 and S6
In response to the determination at 05, an error flag is set for error processing and the error state is stored.

【0050】S608では、原文書読み出しプログラムが、
文書識別情報であるファイル名と要求言語の言語名とを
文書対応情報に持つデータを、原文書データ記憶部203e
から探し、そのデータから、文書データの部分を生成文
書メモリ203bに読み込む。S608へ処理が進む場合、処理
に時間のかかるS606の目標言語文書生成処理を行う必要
が無いため、S409の文書データ生成処理を短時間で実行
することができ、サーバー装置102は、S408でクライア
ント装置103からの要求を受信してからS411で生成文書
のデータを送信するまでの時間を短縮できる。
In S608, the original document reading program executes
The data having the file name as the document identification information and the language name of the request language in the document correspondence information is stored in the original document data storage unit 203e.
And reads the document data portion from the data into the generated document memory 203b. When the process proceeds to S608, there is no need to perform the target language document generation process of S606, which takes a long time, so that the document data generation process of S409 can be executed in a short time. The time from when the request from the device 103 is received until when the data of the generated document is transmitted in S411 can be reduced.

【0051】次に、本発明の原文書解析手段の主体をな
す中間形式文書データ作成プログラムの処理の詳細を、
図8、図9及び図10を用いて説明する。先ず、入力部
206より、所定の自然言語で記述された文書データを入
力する(S801)。入力された文書データは、一旦原文書メ
モリ203cに保存される(S802)。この文書データが原文書
データとして処理される。原文書データは、先ず、形態
素解析処理を受ける(S803)。S803では、翻訳辞書記憶部
202eに記憶された形態素解析辞書を参照し、原文書を形
態素に分割し、形態素列に変換し、各形態素の品詞の判
定を行う。日本語から中間形式文書データを生成する一
例として、図9(a)に示す原文書であれば、形態素解析
処理により図9(b)のような形態素列からなる形態素解
析結果が得られる。
Next, details of the processing of the intermediate format document data creation program which is the main body of the original document analysis means of the present invention will be described.
This will be described with reference to FIGS. 8, 9 and 10. First, the input section
From 206, document data described in a predetermined natural language is input (S801). The input document data is temporarily stored in the original document memory 203c (S802). This document data is processed as original document data. The original document data is first subjected to a morphological analysis process (S803). In S803, the translation dictionary storage unit
Referring to the morphological analysis dictionary stored in 202e, the original document is divided into morphemes, converted into a morpheme string, and the part of speech of each morpheme is determined. As an example of generating intermediate format document data from Japanese, if it is the original document shown in FIG. 9A, a morphological analysis result composed of a morphological sequence as shown in FIG.

【0052】次に、構文解析処理を行う(S804)。S804で
は、S803で解析された品詞情報を含む形態素列に、翻訳
辞書記憶部202eに記憶された構文規則データと、構文解
析辞書の情報を適用して、各形態素間の修飾関係を解析
すると共に、格の意味的な役割を決定し、構文解析木を
形成する。例えば、図9(b)に示されるような形態素解
析結果は、図9(c)で示される構文解析木からなる構文
解析結果を得る。ここで、「S」は文を、「NP」は名詞
句を、「ADV」は副詞を、「VP」は動詞句をそれぞれ表
す。次に、依存構造解析処理を行う(S805)。S805では、
S804の解析結果である構文解析木に基づき依存構造を形
成する。図9(c)の構文解析結果に対して依存構造解析
処理を行うと、図10(a)のような依存構造が得られ
る。ここで、「PRED」は述部を、「NOM」は依存構造名詞
句を、「ADV」は副詞をそれぞれ表す。
Next, a syntax analysis process is performed (S804). In S804, the morpheme sequence including the part-of-speech information analyzed in S803 is applied with the syntax rule data stored in the translation dictionary storage unit 202e and the information of the syntax analysis dictionary to analyze the modification relationship between the morphemes and , Determine the semantic role of the case, and form a parse tree. For example, a morphological analysis result as shown in FIG. 9B obtains a parsing result composed of the parse tree shown in FIG. 9C. Here, “S” represents a sentence, “NP” represents a noun phrase, “ADV” represents an adverb, and “VP” represents a verb phrase. Next, a dependency structure analysis process is performed (S805). In S805,
A dependency structure is formed based on the parse tree that is the analysis result of S804. When a dependency structure analysis process is performed on the syntax analysis result of FIG. 9C, a dependency structure as shown in FIG. 10A is obtained. Here, “PRED” represents a predicate, “NOM” represents a dependent structure noun phrase, and “ADV” represents an adverb.

【0053】次に、S805で得られた依存構造のデータを
中間形式文書データ記憶部203dに保存する(S806)。S807
では原文書データ書き込みプログラムによって、S805で
中間形式文書データ記憶部203dに記憶された中間形式文
書データのファイル名である文書識別情報と、原文書の
記述言語名とを文書対応情報として、原文書メモリ203c
に記憶された原文書データに加えて原文書データ記憶部
203eに記憶する。
Next, the data of the dependency structure obtained in S805 is stored in the intermediate format document data storage unit 203d (S806). S807
In the original document data writing program, the document identification information, which is the file name of the intermediate format document data stored in the intermediate format document data storage unit 203d in S805, and the description language name of the original document as document correspondence information, Memory 203c
In addition to the original document data stored in the
Store it in 203e.

【0054】本実施の形態では、中間形式表現として文
の依存構造の表現を用い、前記のように文章を解析した
結果得られる、依存構造で表現された文章の意味内容を
表すデータを、中間形式文書データとして用いることと
する。具体的には、図11(a)に記載するような構造要
素1105の集合として記憶する。各構造要素1105は構造種
別1101と、格情報1102と、辞書ポインター1103と、従属
構造数1104の4つの項目を持つ。構造種別1101は述部と
か、名詞句とかの種別をフラグとして記憶する。格情報
1102は主格とか目的格、あるいは様態等の格の種別情報
を必要に応じてフラグとして記憶する。辞書ポインター
1103は、その構造要素に対応した単語の情報を収納して
いる辞書データへのポインターを記憶する。従属構造数
1104は、その構造要素に直接従属する構造要素がいくつ
あるかを記憶する。なお、従属構造数1104は、その構造
要素に従属する構造要素にさらに従属する、つまり、入
れ子として間接的に従属する要素の個数は含まない。
In the present embodiment, an expression of the dependency structure of a sentence is used as an intermediate form expression, and data representing the semantic content of the sentence expressed by the dependency structure, which is obtained as a result of analyzing the sentence as described above, is converted into an intermediate form. It is used as formal document data. Specifically, it is stored as a set of structural elements 1105 as shown in FIG. Each structural element 1105 has four items of a structure type 1101, case information 1102, a dictionary pointer 1103, and the number of dependent structures 1104. The structure type 1101 stores a type such as a predicate or a noun phrase as a flag. Case information
Reference numeral 1102 stores case type information such as a nominative case, a purpose case, or a form as a flag as necessary. Dictionary pointer
Reference numeral 1103 stores a pointer to dictionary data containing information on a word corresponding to the structural element. Dependent structures
1104 stores how many structural elements directly depend on the structural element. It should be noted that the number of dependent structures 1104 further depends on the structural elements that are dependent on the structural element, that is, does not include the number of elements that are indirectly dependent as nests.

【0055】例えば、図10(a)に示された依存構造を
記憶した場合は、図11(b)のようなデータとなる。こ
こで、「K1」は主格を、「K2」は目的格を、「K3」は様
態の格を表す。また、辞書ポインターは、図11(c)に
例示された辞書データの番号1106を表している。辞書デ
ータには、原文書で用いられた言語の単語1107と、その
品詞1108、及び他の言語の対応する単語1109や、さら
に、各種の文法情報等が記憶される。図11(c)では、
他の言語が英語である場合の例示である。なお、中間形
式文書データとしては、特開平6-325080号公報に開示さ
れているような、人工的に設計した言語で記述した文章
を中間形式文書データとしてもよい。
For example, when the dependency structure shown in FIG. 10A is stored, the data becomes as shown in FIG. 11B. Here, “K1” represents the nominative case, “K2” represents the purpose case, and “K3” represents the form case. The dictionary pointer indicates the dictionary data number 1106 illustrated in FIG. 11C. The dictionary data stores a word 1107 in the language used in the original document, its part of speech 1108, a corresponding word 1109 in another language, and various grammatical information. In FIG. 11 (c),
This is an example when another language is English. The intermediate format document data may be a text described in an artificially designed language as disclosed in Japanese Patent Laid-Open No. 6-325080.

【0056】次に、S605の目標言語文書生成処理の詳細
を、図12と図10とを用いて説明する。目標言語文書
生成処理は、本発明の目標言語文書生成手段の主体をな
す目標言語文書生成プログラムが行う処理である。先
ず、S603にてワークメモリ203aに読み込まれた中間形式
文書データに対し、構文生成処理を行う(S1201)。構文
生成処理では、中間形式文書データに記述された依存構
造に基づいて、生成規則データを参照しつつ目標言語の
構文木を生成し、語順を決定する。次に、形態素生成処
理を行い(S1202)、単語の語尾等を必要に応じて変化さ
せ、生成文書データの生成を完了する。目標言語が英語
である一例を挙げれば、図10(a)で示される依存構造
の文に対し、構文生成処理と、形態素生成処理の処理を
行うと、図10(b)に示されるような目標言語文書生成
結果が得られることとなる。ここで、「PRON」は代名
詞、「V」は動詞、「ART」は冠詞、「N」は名詞をそれ
ぞれ表す。
Next, the details of the target language document generation processing in S605 will be described with reference to FIGS. The target language document generation process is a process performed by a target language document generation program which is a subject of a target language document generation unit of the present invention. First, syntax generation processing is performed on the intermediate format document data read into the work memory 203a in S603 (S1201). In the syntax generation processing, a syntax tree of the target language is generated based on the dependency structure described in the intermediate format document data while referring to the generation rule data, and the word order is determined. Next, a morpheme generation process is performed (S1202), and the ending of a word or the like is changed as necessary, thereby completing the generation of the generated document data. As an example in which the target language is English, if the syntax generation process and the morpheme generation process are performed on the sentence having the dependency structure shown in FIG. The target language document generation result is obtained. Here, “PRON” represents a pronoun, “V” represents a verb, “ART” represents an article, and “N” represents a noun.

【0057】なお、本実施の形態においては、中間形式
文書データとして記憶されている依存構造データをその
まま構文生成処理への入力としたが、構文生成処理への
入力の前に依存構造変換処理を行ってもよい。これは具
体的には、中間形式文書データに記憶されている文章の
依存構造をそのまま用いるのではなく、中間形式変換手
段に対応する依存構造変換処理を行い、目標言語に対応
した依存構造に変換してから、構文生成処理への入力と
する。
In this embodiment, the dependency structure data stored as the intermediate format document data is directly input to the syntax generation processing. However, the dependency structure conversion processing is performed before the input to the syntax generation processing. May go. Specifically, instead of using the dependency structure of the sentence stored in the intermediate format document data as it is, a dependency structure conversion process corresponding to the intermediate format conversion means is performed and converted into a dependency structure corresponding to the target language. Then, it is input to the syntax generation processing.

【0058】なお、本実施の形態に係わる前記の形態素
解析処理、構文解析処理、依存構造解析処理、構文生成
処理、及び形態素生成処理のそれぞれは、電子技術総合
研究所と京都大学による「日英科学技術文献の速報シス
テムに関する研究−言語処理システムの開発に関する報
告書」や、特開昭62-203273号公報に開示されている公
知の技術である。
Each of the morphological analysis processing, syntactic analysis processing, dependency structure analysis processing, syntax generation processing, and morphological generation processing according to the present embodiment is described in Japanese and English by the Electronic Technology Research Institute and Kyoto University. This is a well-known technique disclosed in "Research on a Bulletin System for Science and Technology Literature-Report on Development of Language Processing System" and JP-A-62-203273.

【0059】[0059]

【発明の効果】以上説明したことから明らかなように、
本発明の多言語対応通信システムは、サーバー装置に文
書データが入力され、中間形式文書データに変換する際
に、入力された文書データを原文書データ記憶部に記憶
する。そして、クライアント装置から、この原文書デー
タの記述言語と同じ自然言語で文書が要求された場合、
原文書データ記憶部に記憶しておいた文書を読み出して
送信することで目標言語文書生成処理を省き、クライア
ント装置からの要求を受けてから短時間で文書を送信が
可能となる。
As is apparent from the above description,
In the multilingual communication system of the present invention, when document data is input to the server device and converted into intermediate format document data, the input document data is stored in the original document data storage unit. Then, when a document is requested from the client device in the same natural language as the description language of the original document data,
By reading and transmitting the document stored in the original document data storage unit, the target language document generation processing can be omitted, and the document can be transmitted in a short time after receiving a request from the client device.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の多言語対応通信システムの概要を示す
説明図である。
FIG. 1 is an explanatory diagram showing an outline of a multilingual communication system of the present invention.

【図2】本実施の形態のサーバー装置のブロック図であ
る。
FIG. 2 is a block diagram of a server device according to the present embodiment.

【図3】本実施の形態のクライアント装置のブロック図
である。
FIG. 3 is a block diagram of a client device according to the present embodiment.

【図4】本実施の形態のサーバー装置とクライアント装
置の処理の流れを示すフローチャートである。
FIG. 4 is a flowchart illustrating a processing flow of a server device and a client device according to the present embodiment.

【図5】本実施の形態の文書識別情報と要求言語情報と
の説明図である。
FIG. 5 is an explanatory diagram of document identification information and request language information according to the present embodiment.

【図6】本実施の形態の文書データ生成処理のフローチ
ャートである。
FIG. 6 is a flowchart of a document data generation process according to the embodiment.

【図7】本実施の形態の文書対応情報の説明図である。FIG. 7 is an explanatory diagram of document correspondence information according to the embodiment.

【図8】本実施の形態の中間形式文書データ作成プログ
ラムの処理のフローチャートである。
FIG. 8 is a flowchart of processing of an intermediate format document data creation program according to the present embodiment.

【図9】本実施の形態の中間形式文書データ作成の処理
の説明に供する説明図である。
FIG. 9 is an explanatory diagram for explaining a process of creating intermediate format document data according to the embodiment;

【図10】本実施の形態の中間形式文書データ作成の処
理と、目標言語文書生成処理の説明に供する説明図であ
る。
FIG. 10 is an explanatory diagram for explaining an intermediate format document data generation process and a target language document generation process according to the embodiment;

【図11】本実施の形態の中間形式文書データの説明に
供する説明図である。
FIG. 11 is an explanatory diagram for explaining intermediate format document data according to the embodiment;

【図12】本実施の形態の目標言語文書生成処理のフロ
ーチャートである。
FIG. 12 is a flowchart of target language document generation processing according to the present embodiment.

【図13】従来の通信システムの概要を示す説明図であ
る。
FIG. 13 is an explanatory diagram showing an outline of a conventional communication system.

【符号の説明】[Explanation of symbols]

101 通信ネットワーク 102 サーバー装置 103 クライアント装置 202 ROM 203 RAM 204 CPU 202f 原文書データ書き込みプログラム記憶部 202g 原文書データ読み出しプログラム記憶部 202h 原文書データ判定プログラム記憶部 203d 中間形式文書データ記憶部 203e 原文書データ記憶部 101 Communication Network 102 Server Device 103 Client Device 202 ROM 203 RAM 204 CPU 202f Original Document Data Writing Program Storage Unit 202g Original Document Data Reading Program Storage Unit 202h Original Document Data Determination Program Storage Unit 203d Intermediate Format Document Data Storage Unit 203e Original Document Data Memory

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 クライアント装置と、前記クライアント
装置からの要求に応じた文書データを前記クライアント
装置に送信するサーバー装置とから構成される通信シス
テムであって、 前記クライアント装置は、 前記文書データを特定可能な文書識別情報と、前記文書
データの記述言語を指定する要求言語情報とを前記サー
バー装置に送信する要求情報送信手段と、 前記サーバー装置より前記文書データを受信し、出力す
る受信出力手段とを備え、 前記サーバー装置は、 前記クライアント装置から前記文書識別情報と、前記要
求言語情報とを受信する要求情報受信手段と、 少なくとも一つの文書データを、自然言語で記述された
文書を文法的、意味的に解析した結果として得られる中
間形式表現で記述した中間形式文書データとして記憶す
る中間形式文書記憶手段と、 前記中間形式文書記憶手段から前記文書識別情報に対応
する中間形式文書データを読み出す中間形式文書読み出
し手段と、 前記中間形式文書読み出し手段で読み出した中間形式文
書データから、前記要求言語情報に対応した言語で記述
した目標言語文書データを生成する目標言語文書生成手
段と、 所定の自然言語で記述された原文書データを入力する原
文書入力手段と、 前記原文書入力手段で入力した原文書データを文法的、
意味的に解析した結果として得られる中間形式表現で記
述した中間形式文書データを生成する原文書解析手段
と、 前記原文書入力手段で入力した原文書データを記憶する
原文書記憶手段と、 前記原文書入力手段で入力した原文書データと前記原文
書解析手段で生成された中間形式文書データとの対応関
係と、原文書データの記述言語名とを特定する文書対応
情報を記憶する文書対応情報記憶手段と、 前記原文書入力手段で入力した原文書データを前記原文
書記憶手段に書き込み、前記原文書データと前記原文書
解析手段で生成された中間形式文書データとの対応関係
と、前記原文書データの記述言語名とを特定する文書対
応情報を前記文書対応情報記憶手段に書き込む原文書書
き込み手段と、 前記原文書書き込み手段によって前記文書対応情報記憶
手段に記憶された文書対応情報と、前記文書識別情報及
び前記要求言語情報とに基いて、前記文書識別情報と前
記要求言語情報とに対応する原文書データが記憶されて
いるか否かを判定する原文書判定手段と、 前記原文書記憶手段から前記文書対応情報に対応する原
文書データを読み出す原文書読み出し手段と、 前記原文書判定手段により記憶されていると判定された
場合は、前記原文書読み出し手段で読み出される原文書
データを前記クライアント装置に送信し、記憶されてい
ないと判定された場合は、前記目標言語文書生成手段に
より生成される目標言語文書データを前記クライアント
装置に送信する文書送信手段とを備えたことを特徴とす
る多言語対応通信システム。
1. A communication system comprising: a client device; and a server device that transmits document data according to a request from the client device to the client device, wherein the client device specifies the document data. Request information transmitting means for transmitting, to the server device, possible document identification information and request language information for specifying a description language of the document data; and reception output means for receiving and outputting the document data from the server device. The server device, request information receiving means for receiving the document identification information and the request language information from the client device, at least one document data, a grammar of a document described in a natural language, Store as intermediate format document data described in the intermediate format expression obtained as a result of semantic analysis An intermediate format document storage unit, an intermediate format document reading unit that reads intermediate format document data corresponding to the document identification information from the intermediate format document storage unit, and an intermediate format document data read by the intermediate format document reading unit. Target language document generating means for generating target language document data described in a language corresponding to the requested language information; source document input means for inputting original document data described in a predetermined natural language; Grammatical,
An original document analysis unit for generating intermediate format document data described in an intermediate format expression obtained as a result of semantic analysis; an original document storage unit for storing original document data input by the original document input unit; Document correspondence information storage for storing correspondence between original document data input by document input means and intermediate format document data generated by the original document analysis means, and document correspondence information for specifying a description language name of the original document data Means for writing the original document data input by the original document input means into the original document storage means, and a correspondence relationship between the original document data and the intermediate format document data generated by the original document analysis means; An original document writing unit for writing document correspondence information for specifying a description language name of data in the document correspondence information storage unit; Based on the document correspondence information stored in the information storage means and the document identification information and the requested language information, it is determined whether or not original document data corresponding to the document identification information and the requested language information is stored. An original document judging means for judging, an original document reading means for reading original document data corresponding to the document correspondence information from the original document storage means, and an original document judging means, The original document data read by the original document reading means is transmitted to the client device. If it is determined that the original document data is not stored, the target language document data generated by the target language document generating means is transmitted to the client device. A multilingual communication system, comprising: a document transmission unit.
JP9016260A 1997-01-30 1997-01-30 Communication system dealing with multiple languages Pending JPH10214266A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9016260A JPH10214266A (en) 1997-01-30 1997-01-30 Communication system dealing with multiple languages

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9016260A JPH10214266A (en) 1997-01-30 1997-01-30 Communication system dealing with multiple languages

Publications (1)

Publication Number Publication Date
JPH10214266A true JPH10214266A (en) 1998-08-11

Family

ID=11911599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9016260A Pending JPH10214266A (en) 1997-01-30 1997-01-30 Communication system dealing with multiple languages

Country Status (1)

Country Link
JP (1) JPH10214266A (en)

Similar Documents

Publication Publication Date Title
US6092035A (en) Server device for multilingual transmission system
JP3066274B2 (en) Machine translation equipment
KR100815215B1 (en) Apparatus and method for integration search of web site
EP0424032B1 (en) Naturel language processing apparatus
US20020002452A1 (en) Network-based text composition, translation, and document searching
JPS6231467A (en) Sentence preparation device
EP1835417A1 (en) Web service with associated lexical tree
KR19990078925A (en) Internet Browsing System For Searching with Usual Words
JP3467160B2 (en) Multilingual communication system, server device, and document transmission method for server device
US20040078193A1 (en) Communication support system, communication support method, and computer program
JPH0261763A (en) Mechanical translation equipment
JP3467159B2 (en) Multilingual communication system, server device, and document transmission method for server device
JP3434161B2 (en) Multilingual communication system
JP2003296327A (en) Translation server, genre-classified online machine translation method, and program therefor
JPH10214266A (en) Communication system dealing with multiple languages
JPH10222516A (en) Multilingual correspondence communication system
JPH10187732A (en) Multilingual communication system
JPH10222513A (en) Multilingual correspondence communication system
JPH10207892A (en) Multilingual communication system
KR100836159B1 (en) System and method for semi-automatic translating service
JPH10187731A (en) Multilingual communication system
JP3467161B2 (en) Multilingual communication system, server device, and document transmission method for server device
JPH08305728A (en) Inter multilingual retrieving system
JP2001101186A (en) Machine translating device
JP3174664B2 (en) Machine translation equipment