JPH10222516A - Multilingual correspondence communication system - Google Patents

Multilingual correspondence communication system

Info

Publication number
JPH10222516A
JPH10222516A JP9026343A JP2634397A JPH10222516A JP H10222516 A JPH10222516 A JP H10222516A JP 9026343 A JP9026343 A JP 9026343A JP 2634397 A JP2634397 A JP 2634397A JP H10222516 A JPH10222516 A JP H10222516A
Authority
JP
Japan
Prior art keywords
document data
document
language
intermediate format
analysis result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9026343A
Other languages
Japanese (ja)
Inventor
Norihisa Fujii
則久 藤井
Atsuhiko Kurachi
敦彦 倉知
Atsushi Kawai
淳 河合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP9026343A priority Critical patent/JPH10222516A/en
Priority to US08/984,293 priority patent/US6092035A/en
Publication of JPH10222516A publication Critical patent/JPH10222516A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a multilingual correspondence communication system which does not need a special translation program for a client device and also more easily offers document data that is described in many languages. SOLUTION: A server device 102 semantically and grammatically analyzes document data that is described in a natural language, creates intermediate format document data 104 and stores it in a storage device. It also shows and selects plural analysis results and creates a desired intermediate format document data 104 even when there is ambiguity in document data. When a client device 103 makes a request for document data, the data 104 that corresponds to the document data is read from the storage device, document data that is described in a natural language which is requested by the device 103 is created from the read intermediate format document data 104 and the created document data is sent to the device 103.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、翻訳機能を持つこ
とによって所望の言語に翻訳した文書データを提供可能
なサーバー装置と、文書データの表示が可能なクライア
ント装置とを通信ネットワークを介して接続した多言語
対応通信システムに関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention connects, via a communication network, a server device having a translation function and capable of providing document data translated into a desired language, and a client device capable of displaying document data. And a multi-language communication system.

【0002】[0002]

【従来の技術】従来、インターネットに代表されるよう
に、通信ネットワークを介して、文書データを検索、閲
覧するシステムが普及している。この様なシステムは、
各種の文書データを記憶する少なくとも1つのサーバー
装置と、文書データの表示が可能な少なくとも1つのク
ライアント装置と、それらを接続する通信ネットワーク
とで構成される。通信ネットワークは、公衆回線網や、
専用回線網あるいはその組み合わせから構成される。サ
ーバー装置は、各種の文書データが記憶できる記憶装置
と、通信ネットワークへの接続装置とを備え、クライア
ント装置は文書データを表示可能な表示装置と、閲覧し
たい文書の指示情報を入力できる入力装置と、通信ネッ
トワークへの接続装置とを備える。
2. Description of the Related Art Conventionally, a system for searching and browsing document data via a communication network, such as the Internet, has become widespread. Such a system,
It comprises at least one server device for storing various types of document data, at least one client device capable of displaying document data, and a communication network connecting them. Communication networks include public networks,
It is composed of a dedicated line network or a combination thereof. The server device includes a storage device capable of storing various types of document data, and a connection device to a communication network.The client device includes a display device capable of displaying document data, and an input device capable of inputting instruction information of a document to be viewed. And a connection device to a communication network.

【0003】例えば、インターネットでは、サーバー装
置、クライアント装置共に非常に多くの装置が接続され
ており、その所在地も全世界に広がっている。そして、
それらを接続する通信ネットワークを介して世界各地の
様々な情報を、検索、閲覧することが可能なシステムと
なっている。
[0003] For example, on the Internet, a great number of devices are connected to both server devices and client devices, and their locations are spread all over the world. And
The system is capable of searching and browsing various information in various parts of the world via a communication network connecting them.

【0004】このようなインターネットでは、図15に
示すように、各サーバー装置1502には、英語とか、日本
語、中国語等の様々な言語で記述された文書データが記
憶されている。通信ネットワーク1501を介してサーバー
装置に接続されているクライアント装置1503では、これ
らの様々な言語で記述された文書データをそれぞれの言
語で表示することが可能である。また、言語翻訳プログ
ラムを内蔵するクライアント装置もあり、必要に応じて
所望の言語に翻訳して文書データを表示することも可能
である。
In the Internet, as shown in FIG. 15, each server device 1502 stores document data described in various languages such as English, Japanese, and Chinese. The client device 1503 connected to the server device via the communication network 1501 can display the document data described in these various languages in the respective languages. There is also a client device having a built-in language translation program, and it is possible to display the document data by translating it into a desired language as needed.

【0005】[0005]

【発明が解決しようとする課題】上述したシステム、特
にインターネットのように全世界に広がったネットワー
クを介して様々な文書データを閲覧する場合、文書デー
タの提供者と、その文書データの閲覧者とは異なる言語
を母国語としていることが多い。しかし、母国語以外の
言語での記述や、その理解には困難を伴うことが多い。
これを解決するため、次の2つの方法が知られている。
1つは、同一内容の文書を複数の言語で記述された複数
の文書データとしてサーバー装置に記憶させ、所望の言
語の文書データをクライアント装置から選択すること
で、所望の言語で記述された文書データを閲覧可能とす
る方法である。他の方法は、言語翻訳プログラムをクラ
イアント装置に搭載し、その言語翻訳プログラムを用い
てサーバーから送信されてきた文書データを所望する言
語の文書データに翻訳する方法である。これらの方法に
より、母国語以外の言語で記述された文書データも母国
語で閲覧可能となる。しかし、その場合でも以下のよう
な問題が残されている。
SUMMARY OF THE INVENTION When browsing various document data via the above-mentioned system, particularly a network spread all over the world such as the Internet, a document data provider and a viewer of the document data need to communicate with each other. Often use a different language as their native language. However, writing and understanding in languages other than the native language is often difficult.
To solve this, the following two methods are known.
One is to store a document having the same content as a plurality of document data described in a plurality of languages in a server device, and select document data in a desired language from a client device to thereby obtain a document described in a desired language. This is a method that allows data to be browsed. Another method is to mount a language translation program on a client device and use the language translation program to translate document data transmitted from a server into document data in a desired language. With these methods, document data described in a language other than the native language can also be browsed in the native language. However, even in that case, the following problems remain.

【0006】先ず、同一内容の文書を複数の言語で記述
された複数の文書データとしてサーバー装置に記憶させ
る方法では、1つの内容の文書でも、その内容を様々な
言語で記述された複数の文書データとして作成する必要
があり、多くの費用と労力を必要とする問題がある。
First, in a method of storing a document having the same content as a plurality of document data described in a plurality of languages in a server device, even if a document has a single content, a plurality of documents having the same content described in various languages are stored. There is a problem that it needs to be created as data and requires a lot of cost and labor.

【0007】また、言語翻訳プログラムをクライアント
装置に搭載する方法では、各サーバーにより提供される
様々な言語の文章を全て翻訳して表示するためには、ク
ライアント装置にそれぞれの言語から所望の言語へ翻訳
可能な多数の言語翻訳プログラムを搭載する必要があ
る。これはクライアント装置のコストを上昇させる。ま
た、現在実用化されている言語翻訳プログラムでは、翻
訳する原文書に元来含まれている曖昧さにより、望まし
い翻訳結果が得られないと言う問題もある。
In the method in which a language translation program is mounted on a client device, in order to translate and display all sentences in various languages provided by each server, the client device converts the language from a desired language into a desired language. It is necessary to have a large number of language translation programs that can be translated. This increases the cost of the client device. Further, in a language translation program currently in practical use, there is a problem that a desired translation result cannot be obtained due to the ambiguity originally included in the original document to be translated.

【0008】これを解決するために、本出願人が既に出
願した特願平8−322842号には、サーバー装置に
記憶される文書データを、自然言語で記述された文書デ
ータではなく、自然言語で記述された文書データを文法
的、意味的に解析した結果として得られる中間形式文書
データとして記憶する。そして、クライアント装置から
文書データの要求があると、その文書データに対応した
中間形式文書データを記憶装置から読み出し、読み出し
た中間形式文書データからクライアント装置が要求する
自然言語で記述された文書データを生成し、生成された
文書データをクライアント装置に送信する。このよう
に、クライアント装置に特別な言語翻訳プログラムを必
要とせず、かつ多数の言語で記述される文書データをよ
り簡易に提供可能な多言語対応通信システムが記述され
ている。
In order to solve this problem, Japanese Patent Application No. 8-322842 filed by the present applicant describes that document data stored in a server device is not natural language described document data but natural language. Is stored as intermediate format document data obtained as a result of grammatically and semantically analyzing the document data described in. When there is a request for document data from the client device, the intermediate format document data corresponding to the document data is read from the storage device, and from the read intermediate format document data, the document data described in the natural language requested by the client device is converted. The generated document data is transmitted to the client device. As described above, a multilingual communication system that does not require a special language translation program in a client device and that can easily provide document data described in many languages is described.

【0009】しかし、このような既提案の多言語対応通
信システムにおいても、次のような問題点が残されてい
る。
[0009] However, even in such a proposed multilingual communication system, the following problems remain.

【0010】中間形式文書データを作成するのに元とし
た自然言語で記述された文書データは、曖昧さを多く含
み、それを文法的、意味的に解析したとしても、望まし
い中間形式文書データが生成されないことがある。その
結果、サーバー装置が生成する自然言語で記述された文
書データの意味するところが中間形式文書データを作成
するのに元とした自然言語で記述された文書データと異
なる。さらに、望ましい中間形式文書データを生成する
ためには、中間形式文書データを作成するのに元とする
自然言語で記述された文書データの曖昧さを取り除くた
めに、その文書データを修正しなくてはならないという
問題があった。
[0010] Document data described in a natural language from which the intermediate format document data is created contains a lot of ambiguity, and even if it is grammatically and semantically analyzed, a desirable intermediate format document data is not obtained. May not be generated. As a result, the meaning of the document data described in the natural language generated by the server device is different from the document data described in the natural language based on which the intermediate format document data is created. Furthermore, in order to generate the desired intermediate format document data, it is necessary to modify the document data in order to remove the ambiguity of the document data described in the natural language from which the intermediate format document data is created. There was a problem that should not be.

【0011】本発明は、上述した問題点を解決するため
になされたものであり、望ましい中間形式文書データを
容易に生成可能な多言語対応通信システムを提供するこ
とを目的とする。
SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and has as its object to provide a multilingual communication system capable of easily generating desirable intermediate format document data.

【0012】[0012]

【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に記載の多言語対応通信システム
は、前記クライアント装置と、前記クライアント装置か
らの要求に応じた前記文書データを前記クライアント装
置に送信するためのサーバー装置とから構成される。前
記クライアント装置では、要求情報送信手段が、所望の
文書データを特定可能な文書識別情報と、その文書デー
タの記述言語を指定する要求言語情報とを前記サーバー
装置に送信し、前記受信出力手段が、前記サーバー装置
から文書データを受信し、表示出力、印字出力、音声出
力等の出力処理を行う。
In order to achieve the above object, according to the present invention, there is provided a multi-language communication system, wherein the client device and the document data in response to a request from the client device. And a server device for transmitting to the client device. In the client device, request information transmitting means transmits document identification information capable of specifying desired document data and request language information for specifying a description language of the document data to the server device, and the reception output means Receiving document data from the server device and performing output processing such as display output, print output, and voice output.

【0013】前記サーバー装置では、要求情報受信手段
が前記クライアント装置から前記文書識別情報と、前記
要求言語情報とを受信し、中間形式文書記憶手段が、自
然言語で記述された文書を文法的、意味的に解析した結
果として得られる中間形式表現で記述した中間形式文書
データを少なくとも1つ記憶し、文書読み出し手段が、
前記文書識別情報に対応した中間形式文書データを、前
記中間形式記憶手段から読み出し、目標言語文書生成手
段が、前記読み出し手段で読み出した中間形式文書デー
タから、前記要求言語情報に対応した言語で記述した文
書データを生成し、文書送信手段が、前記目標言語文書
生成手段で生成された文書データを、前記クライアント
装置に送信する。
[0013] In the server device, request information receiving means receives the document identification information and the request language information from the client device, and the intermediate format document storage means grammatically converts a document described in a natural language into a document. At least one intermediate format document data described in an intermediate format expression obtained as a result of the semantic analysis is stored, and the document reading unit stores
Intermediate format document data corresponding to the document identification information is read from the intermediate format storage means, and the target language document generation means is described in the language corresponding to the requested language information from the intermediate format document data read by the reading means. The generated document data is generated, and the document transmission unit transmits the document data generated by the target language document generation unit to the client device.

【0014】また、前記サーバー装置において、原文書
入力手段により所定の言語で記述された文書データを入
力し、前記原文書解析手段により入力した文書データを
解析して、その文書データの解析結果から中間形式文書
データを生成し、前記中間形式記憶手段により、生成さ
れた中間形式文書データを記憶する。さらに、前記原文
書解析手段の解析において、解析する文書データの曖昧
さにより、解析結果が複数生じた場合は、それを解析結
果表示手段が表示する。
In the server device, the original document input means inputs document data described in a predetermined language, the original document analysis means analyzes the input document data, and analyzes the result of the analysis of the document data. Intermediate format document data is generated, and the generated intermediate format document data is stored by the intermediate format storage unit. Further, in the analysis of the original document analysis means, when a plurality of analysis results are generated due to the ambiguity of the document data to be analyzed, the analysis result display means displays them.

【0015】このように、クライアントから所望の記述
言語を指定でき、それに従って中間形式文書データの形
式で記憶された文書データから自然言語で記述された文
書データを生成し、クライアント装置で出力できるの
で、サーバー装置に多数の言語で記述した文書データを
保存したり、クライアント装置に言語翻訳プログラムを
搭載することなく、所望の言語で表記された文書データ
の閲覧が可能である。また、自然言語で記述された文書
データから中間形式文書データを生成するため、中間形
式文書データを容易に作成できる。さらに、自然言語で
記述された文書データが曖昧である場合は、その解析結
果が表示されるため、中間形式文書データが望ましいか
そうでないかが判断できる。
As described above, a desired description language can be specified from the client, and the document data described in the natural language can be generated from the document data stored in the form of the intermediate format document data in accordance with the desired description language, and can be output by the client device. It is possible to browse document data written in a desired language without storing document data described in a number of languages on a server device or installing a language translation program on a client device. Further, since the intermediate format document data is generated from the document data described in the natural language, the intermediate format document data can be easily created. Furthermore, when the document data described in the natural language is ambiguous, the analysis result is displayed, so that it is possible to determine whether the intermediate format document data is desirable or not.

【0016】また、請求項2に記載の多言語対応通信シ
ステムでは、前記サーバー装置において、前期解析結果
表示手段が表示した複数の解析結果から解析結果確定手
段が特定の解析結果を選択し、解析結果として確定させ
る。
Further, in the multilingual communication system according to claim 2, in the server device, the analysis result determination means selects a specific analysis result from the plurality of analysis results displayed by the analysis result display means, and performs the analysis. Confirm as a result.

【0017】このように、自然言語で記述された文書デ
ータが曖昧である場合は、その解析結果を選択できるた
め、望ましい中間形式文書データが作成できる。
As described above, when the document data described in the natural language is ambiguous, the analysis result can be selected, so that desirable intermediate format document data can be created.

【0018】また、請求項3に記載の多言語対応通信シ
ステムでは、前記解析結果表示手段は、構文解析木表示
手段であり、前記原文書入力手段で入力した文書データ
を解析結果として構文解析木を表示する。
Further, in the multilingual communication system according to the third aspect, the analysis result display means is a parse tree display means, and the document data input by the original document input means is used as a parse tree as an analysis result. Is displayed.

【0019】このように、自然言語で記述された文書デ
ータが曖昧である場合には、その解析結果が構文解析木
で表示されるため、この表示を目視することによって容
易に解析結果を認識することができる。
As described above, when the document data described in the natural language is ambiguous, the analysis result is displayed by the syntax analysis tree. Therefore, the user can easily recognize the analysis result by looking at the display. be able to.

【0020】[0020]

【発明の実施の形態】以下に、本発明多言語対応通信シ
ステムを具体化した実施の形態について図面を参照して
説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment embodying a multilingual communication system of the present invention will be described below with reference to the drawings.

【0021】図1に本実施の形態の多言語対応通信シス
テムの概念図を示す。サーバー装置102は、文書データ
を、特定の自然言語によらない中間形式文書データ(詳
細は後述)として記憶している。また、中間形式文書デ
ータから、目標となる自然言語(以下、目標言語と呼
ぶ)で記述された文書データを生成するための目標言語
文書生成プログラムも記憶している。クライアント装置
103は通信ネットワーク101を介して、文書データの指示
情報と、その文書データの記述言語の指示情報とからな
る要求情報を所望のサーバー装置102に送信する。サー
バー装置102は、クライアント装置103から送信された要
求情報に基づいて、指定された中間形式文書データから
指定された自然言語による文書データを生成し、生成し
た文書データを通信ネットワーク101を介してクライア
ント装置103に送信する。そして、クライアント装置
は、その文書データを受信し、表示出力、印字出力、音
声出力等の出力を行う。
FIG. 1 is a conceptual diagram of a multilingual communication system according to the present embodiment. The server device 102 stores the document data as intermediate format document data not described in a specific natural language (details will be described later). Also, a target language document generation program for generating document data described in a target natural language (hereinafter, referred to as a target language) from the intermediate format document data is stored. Client device
103 transmits, via a communication network 101, request information including instruction information of document data and instruction information of a description language of the document data to a desired server device 102. The server device 102 generates document data in the specified natural language from the specified intermediate format document data based on the request information transmitted from the client device 103, and transmits the generated document data to the client via the communication network 101. Transmit to the device 103. Then, the client device receives the document data and performs output such as display output, print output, and audio output.

【0022】図2には本発明を好適に適用した実施の形
態のサーバー装置のブロック図を示す。
FIG. 2 is a block diagram of a server device according to an embodiment to which the present invention is suitably applied.

【0023】サーバー装置102は、ROM202と、RAM203、C
PU204、表示制御部205、入力部206、通信制御部207及び
それらを接続するバス209より構成される。CPU204は記
憶されている各種のプログラムに基づいて様々な制御を
実行し、本サーバー装置102の動作の主体をなしてい
る。表示制御部205は、表示データの蓄積とディスプレ
イモニターの制御とを行い、モニター208に表示出力を
行う。モニター208は、CRTディスプレイや、LCDディス
プレイ等様々な表示装置を利用できる。入力部206は、
記憶される文書データの入力や、サーバー装置102への
指示を入力するためのものであり、キーボード装置であ
る。通信制御部207は、通信網210と接続される。通信網
210は、公衆回線や、専用回線の回線網であって、通信
ネットワーク101の構成要素である。通信制御部207は、
通信網210とサーバー装置102とのデータ通信を制御し、
データの送受信を行う。通信制御部207は、公衆回線や
専用回線と接続するためのモデム装置である。
The server device 102 includes a ROM 202, a RAM 203, and a C
It comprises a PU 204, a display control unit 205, an input unit 206, a communication control unit 207, and a bus 209 connecting them. The CPU 204 executes various controls based on various stored programs, and forms the main part of the operation of the server device 102. The display control unit 205 accumulates display data and controls a display monitor, and outputs a display to the monitor 208. As the monitor 208, various display devices such as a CRT display and an LCD display can be used. The input unit 206
It is a keyboard device for inputting stored document data and inputting instructions to the server device 102. The communication control unit 207 is connected to the communication network 210. Communication network
Reference numeral 210 denotes a line network of a public line or a dedicated line, which is a component of the communication network 101. The communication control unit 207 includes:
Control data communication between the communication network 210 and the server device 102,
Send and receive data. The communication control unit 207 is a modem device for connecting to a public line or a dedicated line.

【0024】なお、入力部206は、前記の構成以外に、
マウス装置等の指示装置や、音声入力装置、タッチパネ
ル装置等の様々な入力装置や、その組み合わせで構成し
てもよい。また、通信制御部207は、無線の公衆回線や
専用回線と接続するための送受信装置とか、LAN(Local
Area Network)に接続するためのイーサーネット接続装
置、トークンリング接続装置とか、ATM(Asynchronous T
ransfer Mode)回線網への接続装置等、様々な接続装置
でもよい。
The input unit 206 has a structure other than the above-described structure.
A pointing device such as a mouse device, various input devices such as a voice input device and a touch panel device, and a combination thereof may be used. Further, the communication control unit 207 includes a transmitting / receiving device for connecting to a wireless public line or a dedicated line, or a LAN (Local
An Ethernet connection device, a token ring connection device, or an ATM (Asynchronous T
(ransfer Mode) Various connection devices such as a connection device to a network may be used.

【0025】ROM202は各種プログラムや、翻訳辞書のデ
ータ等を記憶している。
The ROM 202 stores various programs, translation dictionary data, and the like.

【0026】ROM202内にはさらに各種の記憶部が形成さ
れている。通信制御プログラム記憶部202aは、通信制御
部207を介した各種通信の制御や、クライアント装置か
らの文書データ要求の受信や、生成された文書データの
クライアント装置への送信処理等を行う通信制御プログ
ラムを記憶している。通信制御プログラムと、通信制御
部207とが本発明の要求情報受信手段と、文書送信手段
との主体をなす。
Various storage units are further formed in the ROM 202. The communication control program storage unit 202a is a communication control program that controls various types of communication via the communication control unit 207, receives a document data request from a client device, and transmits generated document data to the client device. I remember. The communication control program and the communication control unit 207 form the subject of the request information receiving unit and the document transmitting unit of the present invention.

【0027】目標言語文書生成プログラム記憶部202b
は、中間形式文書データに基づいて、各種の目標言語文
書データを生成するための目標言語文書生成プログラム
を記憶する。なお、目標言語文書生成プログラムが本発
明の目標言語文書生成手段の主体をなす。本実施の形態
では、生成する文書の目標言語の種類に応じて目標言語
文書生成プログラムが別になっているものとし、目標言
語文書生成プログラム記憶部202bは、生成する文書の目
標言語に応じた少なくとも1つの目標言語文書生成プロ
グラムを記憶する。なお、前記以外に、各目標言語に対
応した別々の目標言語文書生成プログラムを用いるので
はなく、全ての目標言語に対応できる単一の目標言語文
書生成プログラムを用い、目標言語文書生成プログラム
記憶部202bはその単一の目標言語文書生成プログラムを
記憶してもよい。あるいは、言語構造として類似した複
数の目標言語に対応可能な目標言語文書生成プログラム
を用い、それを記憶してもよい。
Target language document generation program storage section 202b
Stores a target language document generation program for generating various target language document data based on the intermediate format document data. Note that the target language document generation program forms the subject of the target language document generation means of the present invention. In the present embodiment, it is assumed that the target language document generation program is different depending on the type of the target language of the document to be generated, and the target language document generation program storage unit 202b stores at least the target language according to the target language of the document to be generated. Store one target language document generator. In addition to the above, instead of using a separate target language document generation program corresponding to each target language, a single target language document generation program capable of supporting all target languages is used, and a target language document generation program storage unit is used. 202b may store the single target language document generator. Alternatively, a target language document generation program that can support a plurality of target languages having similar language structures may be used and stored.

【0028】中間形式文書データ作成プログラム記憶部
202cは、所定の自然言語で記述された文書データに基づ
いて、中間形式文書データを作成する中間形式文書デー
タ作成プログラムを記憶する。なお、中間形式文書デー
タ作成プログラムが本発明の原文書解析手段と、解析結
果表示手段と、解析結果確定手段の主体をなす。
Intermediate format document data creation program storage unit
Reference numeral 202c stores an intermediate format document data creation program that creates intermediate format document data based on document data described in a predetermined natural language. Note that the intermediate format document data creation program is the main component of the original document analysis means, the analysis result display means, and the analysis result determination means of the present invention.

【0029】文書管理プログラム記憶部202dは、中間形
式文書データ記憶部203dに対して中間形式文書データを
保存、読み出し、あるいは、検索を行うときの主体とな
る文書管理プログラムを記憶する。
The document management program storage unit 202d stores a document management program that is the main entity when storing, reading, or searching for intermediate format document data in the intermediate format document data storage unit 203d.

【0030】翻訳辞書記憶部202eは、目標言語文書生成
プログラムが処理を行う場合に必要とされる、目標言語
に対応した生成規則データ、形態素生成辞書等の各種デ
ータを記憶している。さらに、翻訳辞書記憶部202eは、
中間形式文書データ作成プログラムが処理を行う場合に
必要とされる形態素解析辞書、構文規則データ、構文解
析辞書、依存規則データ等の各種データも記憶してい
る。
The translation dictionary storage unit 202e stores various data required when the target language document generation program performs processing, such as generation rule data corresponding to the target language and a morpheme generation dictionary. Further, the translation dictionary storage unit 202e
Various data such as a morphological analysis dictionary, syntax rule data, a syntax analysis dictionary, and dependency rule data required when the intermediate format document data creation program performs processing are also stored.

【0031】なお、ROM202は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
The ROM 202 is not limited to the ROM, and may be a storage device such as a magnetic disk device, a magneto-optical disk device, or a CD-ROM storage device.

【0032】RAM203は、中間形式文書データ等のデータ
の保存や、様々な一時データを記憶するために使用さ
れ、次のような各記憶部が内部に形成されている。
The RAM 203 is used for storing data such as intermediate format document data and for storing various temporary data, and has the following storage units formed therein.

【0033】ワークメモリ203aは各プログラムが動作時
に必要とする一時的な記憶領域を提供する。生成文書メ
モリ203bは、中間形式文書データ記憶部203dに記憶され
た中間形式文書データに基づいて、目標言語文書生成プ
ログラム記憶部202bに記憶された目標言語文書生成プロ
グラムが生成した目標言語文書データを一時的に記憶す
る。原文書メモリ203cは、中間言語作成プログラムの入
力データとなる、所定の自然言語で記述された文書デー
タ(以下、原文書データと呼ぶ)を記憶する。原文書デー
タは入力部206や、通信制御部207を介して入力される。
The work memory 203a provides a temporary storage area required by each program during operation. The generated document memory 203b stores the target language document data generated by the target language document generation program stored in the target language document generation program storage unit 202b based on the intermediate format document data stored in the intermediate format document data storage unit 203d. Remember temporarily. The original document memory 203c stores document data described in a predetermined natural language (hereinafter, referred to as original document data), which is input data of the intermediate language creation program. Original document data is input via the input unit 206 and the communication control unit 207.

【0034】中間形式文書データ記憶部203dは、中間形
式文書データを少なくとも1つ記憶している。中間形式
文書データ記憶部が、本発明の中間形式文書記憶手段の
主体をなす。
The intermediate format document data storage section 203d stores at least one intermediate format document data. The intermediate format document data storage unit forms the main body of the intermediate format document storage means of the present invention.

【0035】なお、RAM203は、RAMに限らず、磁気ディ
スク装置や、光磁気ディスク装置等の記憶装置であって
もよい。さらに、中間形式文書データの作成を行わない
場合においては、中間形式文書データ記憶部203dはROM2
02上に形成してもよい。
The RAM 203 is not limited to the RAM, but may be a storage device such as a magnetic disk device or a magneto-optical disk device. Further, when the intermediate format document data is not created, the intermediate format document data storage
02 may be formed.

【0036】次に、図3に本発明を好適に適用した実施
の形態のクライアント装置のブロック図を示す。
Next, FIG. 3 shows a block diagram of a client apparatus according to an embodiment to which the present invention is suitably applied.

【0037】クライアント装置103は、ROM302と、RAM30
3、CPU304、表示制御部305、入力部306、通信制御部307
及びそれらを接続するバス309により構成される。CPU30
4は、記憶されている各種のプログラムに基づいて様々
な制御を実行し、本クライアント装置103の動作の主体
をなしている。表示制御部305は表示データの蓄積とデ
ィスプレイモニターの制御を行い、モニター308に表示
出力を行う。モニター308はCRTディスプレイや、LCDデ
ィスプレイ等様々な表示装置を利用できる。入力部306
は、文書データの文書識別情報や、要求言語情報等を入
力したり、クライアント装置103への各種指示を入力す
るためのものであり、キーボード装置である。通信制御
部307は、通信網210と接続され、通信網210とクライア
ント装置103とのデータ通信を制御し、データの送受信
を行う。通信制御部307は公衆回線や、専用回線と接続
するためのモデム装置である。
The client device 103 includes a ROM 302 and a RAM 30
3, CPU 304, display control unit 305, input unit 306, communication control unit 307
And a bus 309 connecting them. CPU30
Reference numeral 4 executes various controls based on the stored various programs, and forms the subject of the operation of the client device 103. The display control unit 305 accumulates display data and controls a display monitor, and outputs a display to the monitor 308. The monitor 308 can use various display devices such as a CRT display and an LCD display. Input unit 306
Is a keyboard device for inputting document identification information of document data, required language information and the like, and inputting various instructions to the client device 103. The communication control unit 307 is connected to the communication network 210, controls data communication between the communication network 210 and the client device 103, and transmits and receives data. The communication control unit 307 is a modem device for connecting to a public line or a dedicated line.

【0038】なお、入力部306は、上記の構成以外に、
マウス装置等の指示装置や、音声入力装置、タッチパネ
ル装置等の様々な入力装置や、その組み合わせで構成し
てもよい。また、通信制御部307は、無線の公衆回線や
専用回線と接続するための送受信装置とか、LAN(Local
Area Network)に接続するためのイーサーネット接続装
置、トークンリング接続装置とか、ATM(Asynchronous T
ransfer Mode)回線網への接続装置等、様々な接続装置
でもよい。また、表示制御部305とモニター308とを用い
る以外に、印字出力装置や、音声出力装置を用いる構成
とし、文書データを印字出力や音声出力する構成として
もよい。
The input unit 306 has a structure other than the above-described structure.
A pointing device such as a mouse device, various input devices such as a voice input device and a touch panel device, and a combination thereof may be used. The communication control unit 307 includes a transmitting / receiving device for connecting to a wireless public line or a dedicated line, or a LAN (Local
An Ethernet connection device, a token ring connection device, or an ATM (Asynchronous T
(ransfer Mode) Various connection devices such as a connection device to a network may be used. Further, in addition to using the display control unit 305 and the monitor 308, a configuration may be adopted in which a print output device or an audio output device is used, and the document data is output in a print or audio output.

【0039】ROM302は各種プログラムを記憶している。The ROM 302 stores various programs.

【0040】ROM302内にはさらに各種の記憶部が形成さ
れている。通信制御プログラム記憶部302aは、通信制御
部307を介した各種通信の制御や、サーバー装置へのデ
ータ送受信処理等を行う通信制御プログラムを記憶して
いる。この通信制御プログラムと、通信制御部307とが
本発明の要求情報送信手段の主体をなす。表示プログラ
ム記憶部302bは、サーバーから受信した文書データを表
示制御部305を用いて表示するための表示プログラムを
記憶している。その表示プログラムと、表示制御部305
と、通信制御プログラムと、通信制御部307とが本発明
の受信表示手段の主体をなす。要求情報入力プログラム
記憶部302cは、ユーザーが入力部306を用いて、所望す
る文書データの文書識別情報と、要求言語情報とを入力
する処理を制御するための要求情報入力プログラムを記
憶する。
Various storage units are further formed in the ROM 302. The communication control program storage unit 302a stores a communication control program for controlling various types of communication via the communication control unit 307 and performing processing for transmitting and receiving data to and from the server device. The communication control program and the communication control unit 307 form the subject of the request information transmitting unit of the present invention. The display program storage unit 302b stores a display program for displaying the document data received from the server using the display control unit 305. The display program and the display control unit 305
, The communication control program, and the communication control unit 307 form the subject of the reception display means of the present invention. The request information input program storage unit 302c stores a request information input program for controlling a process in which the user uses the input unit 306 to input document identification information of desired document data and request language information.

【0041】なお、ROM302は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
The ROM 302 is not limited to a ROM, and may be a storage device such as a magnetic disk device, a magneto-optical disk device, or a CD-ROM storage device.

【0042】RAM303は、様々な一時データを保存するた
めに使用され、次のような各記憶部が内部に形成されて
いる。ワークメモリ303aは各プログラムが動作時に必要
とする一時的な記憶領域を提供する。受信文書メモリ30
3bは、サーバー装置から受信した文書データを一時保存
する。なお、RAM303は、RAMに限らず、磁気ディスク装
置や、光磁気ディスク装置等の記憶装置であってもよ
い。
The RAM 303 is used to store various temporary data, and has the following storage units formed therein. The work memory 303a provides a temporary storage area required by each program during operation. Received document memory 30
3b temporarily stores the document data received from the server device. The RAM 303 is not limited to the RAM, but may be a storage device such as a magnetic disk device or a magneto-optical disk device.

【0043】次に、サーバー装置102と、クライアント
装置103との基本的な処理の流れを図4を用いて説明す
る。先ず、クライアント装置103では、所望する文書デ
ータの指示情報の入力処理を行う(S401、Sはステップ
を示す。以下同様)。次に、入力した指示情報からその
文書データが所在するサーバー装置を通信ネットワーク
上で一意に決定する情報である、サーバー装置のアドレ
スを取得する(S402)。本実施の形態では、サーバー装置
のアドレスとしてTCP/IP(Transmission Control Protoc
ol/Internet Protocol)で規定されるホスト名あるいはI
Pアドレスを用いるものとするが、他に通信ネットワー
ク上のアドレスを決定できる情報であれば何でもよい。
次に、所望する文書データ指示情報から、その文書デー
タのサーバー装置内での指示情報である文書識別情報を
決定する(S403)。次に、所望する文書データがどの自然
言語によって記述されるかを指定する要求言語の情報を
決定する(S404)。
Next, a basic processing flow between the server apparatus 102 and the client apparatus 103 will be described with reference to FIG. First, the client device 103 performs a process of inputting instruction information of desired document data (S401 and S indicate steps, and the same applies hereinafter). Next, the address of the server device, which is information for uniquely determining the server device where the document data is located on the communication network, is acquired from the input instruction information (S402). In the present embodiment, TCP / IP (Transmission Control Protocol) is used as the address of the server device.
ol / Internet Protocol) or I
Although the P address is used, any other information that can determine an address on the communication network may be used.
Next, the document identification information, which is the instruction information of the document data in the server device, is determined from the desired document data instruction information (S403). Next, information on a request language that specifies which natural language is used to describe the desired document data is determined (S404).

【0044】次に、決定された文書識別情報と、要求言
語情報とをS402で決定されたアドレスのサーバー装置に
送信する(S405)。本実施の形態では、サーバー装置への
送信方法として、TCP/IP上のHTTP(Hyper Text Transfer
Protocol)を用いることとする。具体的にはクライアン
ト装置は、図5(a)に示す形式のデータをサーバー装置
に送信する。"GET"はデータ要求を意味し、<文書識別情
報>にはS402で決定された文書識別情報を指定する。<バ
ージョン情報>はHTTPのバージョン情報を指定し、<CRLF
>は復帰改行文字を示す。<各種ヘッダー情報>にはHTTP
で規定されたヘッダー情報を必要に応じて指定する。"A
ccept-Language:"は次に要求言語情報が続くことを示す
文字列であり、<要求言語>には要求言語を識別する予め
定められた文字列を指定する。図5(b)は文書識別情報
として"/pub/sample.html"、HTTPバージョンが1.0、日
本語を要求言語とした場合の例である。なお、上述した
TCP/IP及びHTTPは、既に広く実用化された公知の技術で
あるため、その説明を省略する。
Next, the determined document identification information and the requested language information are transmitted to the server at the address determined in S402 (S405). In the present embodiment, as a transmission method to the server device, HTTP (Hyper Text Transfer) over TCP / IP is used.
Protocol). Specifically, the client device transmits data in the format shown in FIG. 5A to the server device. "GET" means a data request, and <document identification information> specifies the document identification information determined in S402. <Version information> specifies HTTP version information, and <CRLF
> Indicates a new line character. <Various header information> is HTTP
Specify the header information specified in as required. "A
ccept-Language: "is a character string indicating that the requested language information follows, and <required language> specifies a predetermined character string for identifying the requested language. FIG. This is an example when the information is "/pub/sample.html", the HTTP version is 1.0, and the requested language is Japanese.
Since TCP / IP and HTTP are well-known technologies that have already been widely put into practical use, descriptions thereof will be omitted.

【0045】サーバー装置では、S405でクライアント装
置から送信された要求文書の文書識別情報と、要求言語
情報を受信し(S408)、受信した情報に基づいて所望の自
然言語による所望の文書データを生成するために、文書
データ生成処理を実行する(S409)。S409の詳細は後述す
る。S409にて所望の自然言語による所望の文書データを
生成できない場合は、それをエラーと判定する(S410)。
本実施の形態では、このエラーの判定は後述するエラー
フラグを参照することで判定する。エラーでなければ生
成した文書データをクライアントに送信し(S411)、エラ
ーならばエラー情報を送信する(S412)。クライアントで
はサーバーから文書データもしくはエラー情報を受信し
(S406)、表示装置に表示する(S407)。
The server device receives the document identification information of the requested document and the requested language information transmitted from the client device in S405 (S408), and generates desired document data in a desired natural language based on the received information. In order to do so, a document data generation process is executed (S409). Details of S409 will be described later. If the desired document data in the desired natural language cannot be generated in S409, it is determined as an error (S410).
In the present embodiment, this error is determined by referring to an error flag described later. If there is no error, the generated document data is transmitted to the client (S411), and if there is an error, error information is transmitted (S412). The client receives document data or error information from the server
(S406), it is displayed on the display device (S407).

【0046】次に、文書データ生成処理(S409)の詳細に
ついて、図6を用いて説明する。先ず、エラー状態を記
憶するために、ワークメモリ203a内に形成されたエラー
フラグ(図示せず)をクリアーして、エラーなしの状態と
する(S601)。次に、文書識別情報で指定された文書デー
タの有無を判定し(S602)、もし、該当する文書データが
サーバー装置内に存在しない場合は(S602:No)、エラー
とするためにS607に処理を進め、存在した場合は(S602:
Yes)、S603に処理を進める。S603では、文書管理プログ
ラムが、クライアントから送信された文書識別情報で指
示された中間形式文書データを、中間形式文書データ記
憶部203dから検索して、ワークメモリ203aに読み込む。
Next, details of the document data generation processing (S409) will be described with reference to FIG. First, in order to store an error state, an error flag (not shown) formed in the work memory 203a is cleared to set an error-free state (S601). Next, the presence or absence of the document data specified by the document identification information is determined (S602). If the corresponding document data does not exist in the server device (S602: No), the process proceeds to S607 to generate an error. If there is (S602:
Yes), the process proceeds to S603. In S603, the document management program searches the intermediate format document data storage unit 203d for the intermediate format document data specified by the document identification information transmitted from the client, and reads it into the work memory 203a.

【0047】本実施の形態においては、中間形式文書デ
ータ記憶部203dで記憶される中間形式文書データは、そ
れぞれの中間形式文書データが1つのファイルに対応す
るものとし、文書データを指定する文書識別情報として
は、中間形式文書データを収納しているファイル名を用
いるものとする。この場合は、文書識別情報で示された
ファイル名のファイルが存在するか否かでS602の判定を
行い、S603では文書管理プログラムがそのファイルのデ
ータをワークメモリ203aに読み込むこととなる。なお、
文書識別情報としてファイル名を用いる方法以外に、文
書管理プログラムとしてデータベース管理プログラムを
用い、中間形式文書データ記憶部203dとしてデータベー
スの記憶領域を対応させ、文書識別情報としてデータベ
ース内の文書データを特定可能な指示情報を用いてもよ
い。
In the present embodiment, the intermediate format document data stored in the intermediate format document data storage unit 203d is such that each intermediate format document data corresponds to one file, and a document identification designating the document data. As the information, a file name containing the intermediate format document data is used. In this case, the determination in S602 is made based on whether a file having the file name indicated by the document identification information exists, and in S603, the document management program reads the data of the file into the work memory 203a. In addition,
In addition to using the file name as the document identification information, a database management program can be used as the document management program, the storage area of the database can be associated as the intermediate format document data storage unit 203d, and the document data in the database can be specified as the document identification information Instruction information may be used.

【0048】次に、読み出した中間言語形式文書データ
をS408にて受信した要求言語情報に基づいた目標言語に
翻訳可能か否かを判定する(S604)。本実施の形態では、
前述したように各目標言語毎に個別の目標言語文書生成
プログラムを持つので、S408にて受信した要求言語情報
に対応した目標言語文書生成プログラムが目標言語文書
生成プログラム記憶部202bに記憶されているか否かで、
S604の判定を行う。
Next, it is determined whether or not the read intermediate language format document data can be translated into a target language based on the requested language information received in S408 (S604). In the present embodiment,
As described above, since there is an individual target language document generation program for each target language, is the target language document generation program corresponding to the requested language information received in S408 stored in the target language document generation program storage unit 202b? Whether or not
The determination of S604 is performed.

【0049】S605では、読み込んだ中間形式文書データ
から目標言語文書データを生成する、目標言語文書生成
処理を実行する。S605の詳細は後述する。S606では、S6
05にて生成された目標言語文書データを、送信のために
一旦生成文書メモリ0203bに記憶する。S607では、S602
とS604での判定を受けて、エラー処理をするためにエラ
ーフラグをセットしてエラー状態を記憶する。
In step S605, target language document generation processing for generating target language document data from the read intermediate format document data is executed. Details of S605 will be described later. In S606, S6
The target language document data generated in 05 is temporarily stored in the generated document memory 0203b for transmission. In S607, S602
And the determination in S604, an error flag is set for error processing, and the error state is stored.

【0050】次に、本発明の文書解析手段の主体をなす
中間形式文書データ作成プログラムの処理の詳細を、図
7、図8、図9を用いて説明する。先ず、入力部206よ
り、所定の自然言語で記述された文書データを入力する
(S701)。入力された文書データは、一旦原文書メモリ20
3cに保存される(S702)。この文書データが原文書データ
として処理される。原文書データは、先ず、形態素解析
処理を受ける(S703)。S703では、翻訳辞書記憶部202eに
記憶された形態素解析辞書を参照し、原文書データを形
態素に分割し、形態素列に変換し、各形態素の品詞の判
定を行う。日本語から中間形式文書データを生成する一
例として、図8(a)に示す原文書データであれば、形態
素解析処理により図8(b)のような形態素列からなる形
態素解析結果が得られる。
Next, the details of the processing of the intermediate format document data creation program which is the main body of the document analysis means of the present invention will be described with reference to FIGS. 7, 8 and 9. First, the input unit 206 inputs document data described in a predetermined natural language.
(S701). The input document data is temporarily stored in the original document memory 20.
It is stored in 3c (S702). This document data is processed as original document data. The original document data is first subjected to morphological analysis processing (S703). In S703, the original document data is divided into morphemes, converted into a morpheme string, and the part of speech of each morpheme is determined with reference to the morphological analysis dictionary stored in the translation dictionary storage unit 202e. As an example of generating intermediate format document data from Japanese, if the original document data is as shown in FIG. 8A, a morphological analysis result including a morphological sequence as shown in FIG.

【0051】次に、構文解析処理を行う(S704)。S704で
は、S703で解析された品詞情報を含む形態素列に、翻訳
辞書記憶部202eに記憶された構文規則データと、構文解
析辞書の情報を適用し、各形態素間の修飾関係を解析す
ると共に、格の意味的な役割を決定し、構文解析木を形
成する。例えば、図8(b)のような形態素解析結果は、
図8(c)で示される構文解析木からなる構文解析結果を
得る。ここで、「S」は文を、「NP」は名詞句を、「AD
V」は副詞を、「VP」は動詞句をそれぞれ表す。
Next, a syntax analysis process is performed (S704). In S704, to the morpheme string including the part of speech information analyzed in S703, the syntax rule data stored in the translation dictionary storage unit 202e, and apply the information of the syntax analysis dictionary, and analyze the modification relationship between each morpheme, Determine the semantic role of the case and form a parse tree. For example, a morphological analysis result as shown in FIG.
A parsing result consisting of the parsing tree shown in FIG. 8C is obtained. Where "S" is a sentence, "NP" is a noun phrase, and "AD
“V” represents an adverb, and “VP” represents a verb phrase.

【0052】次に、原文書データに曖昧さがあるかどう
かの判定を行う(S705)。具体的には、構文解析処理(S70
4)において複数の構文解析木が形成された場合は、原文
所データに曖昧さがあると判断し、そうでない場合、即
ち、1種類の構文解析木のみ形成した場合は、曖昧さが
無いと判断する。例えば、図8(a)に示す原文書データ
から形成される構文解析木は、図8(c)に示した1種類
であるのでS705では、原文に曖昧さが無いと判断する。
そして、依存構造解析処理(S706)に処理を進める。
Next, it is determined whether or not the original document data has ambiguity (S705). Specifically, the parsing process (S70
If a plurality of parse trees are formed in 4), it is determined that there is ambiguity in the original sentence data, and if not, that is, if only one type of parse tree is formed, there is no ambiguity. to decide. For example, since the parse tree formed from the original document data shown in FIG. 8A is of one type shown in FIG. 8C, in S705, it is determined that the original sentence has no ambiguity.
Then, the process proceeds to a dependent structure analysis process (S706).

【0053】一方、図10に示す例文は、「美しい」が
「少女」を修飾しているか、「少女の母親」を修飾して
いるか曖昧である。このような曖昧な原文書データを入
力した場合、構文解析処理(S704)において、図11の
(a)、(b)に示す2通りの構文解析木が形成される。(な
お、図11に示す構文解析木は、構文解析結果の差異が
明らかであれば良いので、文や句や品詞を示す表示を省
いてある。)この様に複数の解析木を形成した場合、S7
05では、原文に曖昧さがあると判断し、解析候補表示(S
708)を行う。解析候補表示は、本発明の解析結果表示手
段の主体をなす中間形式作成プログラムが行う処理であ
る。具体的には、モニター208に図11に示す構文解析
木をそれぞれ結果a、結果bとして表示する。次に、解
析結果確定処理(S709)を行う。解析候補表示は、本発明
の解析結果確定手段の主体をなす中間形式作成プログラ
ムが行う処理である。
On the other hand, the example sentence shown in FIG. 10 is ambiguous whether “beautiful” modifies “girl” or “girl's mother”. When such ambiguous original document data is input, in the syntax analysis processing (S704), FIG.
Two types of parse trees shown in (a) and (b) are formed. (Note that the parsing tree shown in FIG. 11 does not need to indicate sentences, phrases, and parts of speech because the difference between the parsing results should be clear.) In the case where a plurality of parsing trees are formed as described above. , S7
In 05, it is determined that the original text has ambiguity, and analysis candidate display (S
708). The analysis candidate display is a process performed by the intermediate format creation program which is the main component of the analysis result display means of the present invention. Specifically, the parse tree shown in FIG. 11 is displayed on the monitor 208 as a result a and a result b, respectively. Next, analysis result confirmation processing (S709) is performed. The analysis candidate display is a process performed by the intermediate format creation program which is the main body of the analysis result determination means of the present invention.

【0054】具体的には、サーバー装置の操作者が入力
部206へ入力した指示より、結果a、結果b何れの結果
が選択されたかを判断し、解析結果を確定する。そし
て、依存構造解析処理(S706)へ処理を進める。
Specifically, based on an instruction input by the operator of the server device to the input unit 206, it is determined which of the result a and the result b has been selected, and the analysis result is determined. Then, the process proceeds to a dependent structure analysis process (S706).

【0055】本実施の形態では、構文解析木で解析候補
表示を行ったが、図12に示すように原文書データに括
弧を追加して、解析候補表示を行ってもよい。
In this embodiment, analysis candidates are displayed using a syntax parse tree. However, as shown in FIG. 12, parentheses may be added to original document data to display analysis candidates.

【0056】次に、依存構造解析処理を行う(S706)。S7
06では、S704の解析結果である構文解析木に基づき、依
存構造を形成する。図8(c)の構文解析結果に対して依
存構造解析処理を行うと、図9(a)に示されるような依
存構造が得られる。ここで、「PRED」は述部を、「NO
M」は依存構造名詞句を、「ADV」は副詞をそれぞれ表
す。次に、S706で得られた依存構造のデータを中間形式
文書データ記憶部203dに保存する(S707)。
Next, a dependent structure analysis process is performed (S706). S7
In 06, a dependency structure is formed based on the parse tree that is the analysis result of S704. When the dependency structure analysis process is performed on the syntax analysis result of FIG. 8C, a dependency structure as shown in FIG. 9A is obtained. Here, "PRED" replaces the predicate with "NO
"M" indicates a dependent structure noun phrase, and "ADV" indicates an adverb. Next, the data of the dependency structure obtained in S706 is stored in the intermediate format document data storage unit 203d (S707).

【0057】本実施の形態では、中間形式表現として文
の依存構造の表現を用い、前記のように文章を解析した
結果得られる、依存構造で表現された文章の意味内容を
表すデータを、中間形式文書データとして用いることと
する。具体的には、図13(a)に記載するような構造要
素1305の集合として記憶する。各構造要素1305は構造種
別1301と、格情報1302と、辞書ポインター1303と、従属
構造数1304の4つの項目を持つ。構造種別1301は述部と
か、名詞句とかの種別をフラグとして記憶する。格情報
1302は主格とか目的格、あるいは様態等の格の種別情報
を必要に応じてフラグとして記憶する。辞書ポインター
1303は、その構造要素に対応した単語の情報を収納して
いる辞書データへのポインターを記憶する。従属構造数
1304は、その構造要素に直接従属する構造要素がいくつ
あるかを記憶する。なお、従属構造数1304は、その構造
要素に従属する構造要素にさらに従属する、つまり、入
れ子として間接的に従属する要素の個数は含まない。
In the present embodiment, the expression of the dependency structure of a sentence is used as an intermediate form expression, and data representing the semantic content of the sentence expressed by the dependency structure, which is obtained as a result of analyzing the sentence as described above, It is used as formal document data. Specifically, it is stored as a set of structural elements 1305 as described in FIG. Each structural element 1305 has four items of a structure type 1301, case information 1302, a dictionary pointer 1303, and the number of dependent structures 1304. The structure type 1301 stores a type such as a predicate or a noun phrase as a flag. Case information
Reference numeral 1302 stores case type information such as a nominative case, a purpose case, or a form as a flag as necessary. Dictionary pointer
Reference numeral 1303 stores a pointer to dictionary data containing word information corresponding to the structural element. Dependent structures
1304 stores how many structuring elements directly depend on the structuring element. It should be noted that the number of dependent structures 1304 further depends on the structural elements that are dependent on the structural element, that is, does not include the number of indirectly dependent elements as nests.

【0058】例えば、図9(a)に示された依存構造を記
憶した場合は、図13(b)のようなデータとなる。ここ
で、「K1」は主格を、「K2」は目的格を、「K3」は様態
の格を表す。また、辞書ポインターは、図13(c)に例
示された辞書データの番号1306を表している。辞書デー
タには、原文書で用いられた言語の単語1307と、その品
詞1308、及び他の言語の対応する単語1309や、さらに、
各種の文法情報等が記憶される。図13(c)では、他の
言語が英語である場合の例示である。なお、中間形式文
書データとしては前記の方法以外に、人工的に定義され
た可読性のある言語(以下、共通言語という)を、中間形
式表現として用い、その言語で記述された文書データを
中間形式文書データとして用いてもよい。例えば、特開
平6-325080号公報に開示されているような、人工的に設
計した言語で記述した文章を中間形式文書データとして
もよい。
For example, when the dependency structure shown in FIG. 9A is stored, the data becomes as shown in FIG. 13B. Here, “K1” represents the nominative case, “K2” represents the purpose case, and “K3” represents the form case. The dictionary pointer indicates the number 1306 of the dictionary data illustrated in FIG. The dictionary data includes words 1307 in the language used in the original document, their parts of speech 1308, and corresponding words 1309 in other languages,
Various grammatical information and the like are stored. FIG. 13C shows an example in which the other language is English. In addition, as the intermediate format document data, in addition to the above-described method, an artificially defined readable language (hereinafter, referred to as a common language) is used as the intermediate format expression, and the document data described in the language is converted into the intermediate format. It may be used as document data. For example, a sentence described in an artificially designed language as disclosed in Japanese Patent Application Laid-Open No. 6-325080 may be used as the intermediate format document data.

【0059】次に、S605の目標言語文書生成処理の詳細
を、図14と図9とを用いて説明する。目標言語文書生
成処理は、本発明の目標言語文書生成手段の主体をなす
目標言語文書生成プログラムが行う処理である。先ず、
S603にてワークメモリ203aに読み込まれた中間形式文書
データに対し、構文生成処理を行う(S1401)。構文生成
処理では、中間形式文書データに記述された依存構造に
基づいて、生成規則データを参照しつつ目標言語の構文
木を生成し、語順を決定する。次に、形態素生成処理を
行い(S1402)、単語の語尾等を必要に応じて変化させ、
生成文書データの生成を完了する。目標言語が英語であ
る一例を挙げれば、図9(a)で示される依存構造の文に
対し、構文生成処理と、形態素生成処理の処理を行う
と、図9(b)に示されるような目標言語文書生成結果が
得られることとなる。ここで、「PRON」は代名詞、
「V」は動詞、「ART」は冠詞、「N」は名詞をそれぞれ
表す。
Next, the details of the target language document generation processing in S605 will be described using FIG. 14 and FIG. The target language document generation process is a process performed by a target language document generation program which is a subject of a target language document generation unit of the present invention. First,
A syntax generation process is performed on the intermediate format document data read into the work memory 203a in S603 (S1401). In the syntax generation processing, a syntax tree of the target language is generated based on the dependency structure described in the intermediate format document data while referring to the generation rule data, and the word order is determined. Next, morpheme generation processing is performed (S1402), and the ending of the word is changed as necessary,
The generation of the generated document data is completed. To give an example in which the target language is English, when a sentence having a dependency structure shown in FIG. 9A is subjected to a syntax generation process and a morpheme generation process, a sentence as shown in FIG. 9B is obtained. The target language document generation result is obtained. Where "PRON" is a pronoun,
"V" indicates a verb, "ART" indicates an article, and "N" indicates a noun.

【0060】なお、本実施の形態においては、中間形式
文書データとして記憶されている依存構造データをその
まま構文生成処理への入力としたが、構文生成処理への
入力の前に依存構造変換処理を行ってもよい。これは具
体的には、中間形式文書データに記憶されている文章の
依存構造をそのまま用いるのではなく、中間形式変換手
段に対応する依存構造変換処理を行い、目標言語に対応
した依存構造に変換してから、構文生成処理への入力と
する。
In the present embodiment, the dependency structure data stored as the intermediate format document data is directly input to the syntax generation processing. However, the dependency structure conversion processing is performed before the input to the syntax generation processing. May go. Specifically, instead of using the dependency structure of the sentence stored in the intermediate format document data as it is, a dependency structure conversion process corresponding to the intermediate format conversion means is performed and converted into a dependency structure corresponding to the target language. Then, it is input to the syntax generation processing.

【0061】なお、本実施の形態に係わる前記の形態素
解析処理、構文解析処理、依存構造解析処理、構文生成
処理、及び形態素生成処理のそれぞれは、電子技術総合
研究所と京都大学による「日英科学技術文献の速報シス
テムに関する研究−言語処理システムの開発に関する報
告書」や、特開昭62-203273号公報に開示されている公
知の技術である。
Each of the morphological analysis processing, syntactic analysis processing, dependency structure analysis processing, syntax generation processing, and morphological generation processing according to the present embodiment is described in Japanese and English by the Electronic Technology Research Institute and Kyoto University. This is a well-known technique disclosed in "Research on a Bulletin System for Science and Technology Literature-Report on Development of Language Processing System" and JP-A-62-203273.

【0062】[0062]

【発明の効果】以上説明したことから明らかなように、
本発明の請求項1に記載の多言語対応通信システムは、
クライアントから所望の記述言語を指定でき、それに従
って中間形式文書データの形式で記憶された文書データ
から自然言語で記述された文書データを生成し、クライ
アント装置で出力できるので、サーバー装置に多数の言
語で記述した文書データを保存したり、クライアント装
置に言語翻訳プログラムを搭載することなく、所望の言
語で表記された文書データの閲覧をすることができる。
また、自然言語で記述された文書データから中間形式文
書データを生成するため、中間形式文書データを容易に
作成できる。さらに、自然言語で記述された文書データ
が曖昧である場合は、その解析結果が表示されるため、
中間形式文書データが望ましいか否かが判断できる。
As is apparent from the above description,
The multi-language communication system according to claim 1 of the present invention,
A client can specify a desired description language, and can generate document data described in a natural language from document data stored in the form of intermediate format document data in accordance with the desired description language and output the document data in a client device. It is possible to browse the document data described in a desired language without saving the document data described in the above and without installing a language translation program in the client device.
Further, since the intermediate format document data is generated from the document data described in the natural language, the intermediate format document data can be easily created. Furthermore, if the document data described in natural language is ambiguous, the analysis result is displayed,
It can be determined whether the intermediate format document data is desirable.

【0063】また、請求項2に記載の多言語対応通信シ
ステムは、自然言語で記述された文書データが曖昧であ
る場合は、その解析結果を選択できるため、望ましい中
間形式文書データが作成できる。
Further, in the multilingual communication system according to the second aspect, when the document data described in the natural language is ambiguous, the analysis result can be selected, so that desirable intermediate format document data can be created.

【0064】また、請求項3に記載の多言語対応通信シ
ステムは、自然言語で記述された文書データが曖昧であ
る場合は、その解析結果が構文解析木で表示されるた
め、容易に解析結果を認識することができる。
Further, in the multilingual communication system according to the third aspect, when the document data described in the natural language is ambiguous, the analysis result is displayed in a syntax analysis tree, so that the analysis result can be easily obtained. Can be recognized.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の多言語対応通信システムの概要を示す
説明図である。
FIG. 1 is an explanatory diagram showing an outline of a multilingual communication system of the present invention.

【図2】本実施の形態のサーバー装置のブロック図であ
る。
FIG. 2 is a block diagram of a server device according to the present embodiment.

【図3】本実施の形態のクライアント装置のブロック図
である。
FIG. 3 is a block diagram of a client device according to the present embodiment.

【図4】本実施の形態のサーバー装置とクライアント装
置の処理の流れを示すフローチャートである。
FIG. 4 is a flowchart illustrating a processing flow of a server device and a client device according to the present embodiment.

【図5】本実施の形態の文書識別情報と要求言語情報と
の説明図である。
FIG. 5 is an explanatory diagram of document identification information and request language information according to the present embodiment.

【図6】本実施の形態の文書データ生成処理のフローチ
ャートである。
FIG. 6 is a flowchart of a document data generation process according to the embodiment.

【図7】本実施の形態の中間形式文書データ作成プログ
ラムの処理のフローチャートである。
FIG. 7 is a flowchart of processing of an intermediate format document data creation program according to the present embodiment.

【図8】本実施の形態の中間形式文書データ作成の処理
の説明に供する説明図である。
FIG. 8 is an explanatory diagram for explaining a process of creating intermediate format document data according to the embodiment;

【図9】本実施の形態の中間形式文書データ作成の処理
と、目標言語文書生成処理の説明に供する説明図であ
る。
FIG. 9 is an explanatory diagram for explaining a process of creating intermediate format document data and a process of generating a target language document according to the embodiment;

【図10】本実施の形態の中間形式文書データ作成の処
理の説明に供する説明図である。
FIG. 10 is an explanatory diagram for explaining a process of creating intermediate format document data according to the embodiment;

【図11】本実施の形態の中間形式文書データ作成の処
理の説明に供する説明図である。
FIG. 11 is an explanatory diagram for explaining a process of creating intermediate format document data according to the embodiment;

【図12】本実施の形態の中間形式文書データ作成の処
理の説明に供する説明図である。
FIG. 12 is an explanatory diagram for explaining a process of creating intermediate format document data according to the embodiment;

【図13】本実施の形態の中間形式文書データの説明に
供する説明図である。
FIG. 13 is an explanatory diagram for explaining intermediate format document data according to the embodiment;

【図14】本実施の形態の目標言語文書生成処理のフロ
ーチャートである。
FIG. 14 is a flowchart of target language document generation processing according to the present embodiment.

【図15】従来の通信システムの概要を示す説明図であ
る。
FIG. 15 is an explanatory diagram showing an outline of a conventional communication system.

【符号の説明】[Explanation of symbols]

101 通信ネットワーク 102 サーバー装置 103 クライアント装置 202 ROM 203 RAM 204 CPU 203d 中間形式文書データ記憶部 101 Communication Network 102 Server Device 103 Client Device 202 ROM 203 RAM 204 CPU 203d Intermediate Format Document Data Storage

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 クライアント装置と、前記クライアント
装置からの要求に応じた文書データを前記クライアント
装置に送信するサーバー装置とから構成される通信シス
テムであって、 前記クライアント装置は、 前記文書データを特定可能な文書識別情報と、前記文書
データの記述言語を指定する要求言語情報とを前記サー
バー装置に送信する要求情報送信手段と、 前記サーバー装置より前記文書データを受信し、出力す
る受信出力手段とを備え、 前記サーバー装置は、 所定の言語で記述された文書データを入力する原文書入
力手段と、 前記原文書入力手段で入力した文書データを文法的、意
味的に解析した結果として得られる中間形式表現で記述
した中間形式文書データを生成する原文書解析手段と、 前記原文書解析手段で解析した結果が、その文書データ
の曖昧さにより複数生じる場合に、それら解析結果を表
示する解析結果表示手段と、 前記中間形式文書データを少なくとも一つ記憶する中間
形式文書記憶手段と、 前記クライアント装置から前記文書識別情報と、前記要
求言語情報とを受信する要求情報受信手段と、 前記中間形式文書記憶手段に記憶された、前記文書識別
情報に対応する中間形式文書データから、前記要求言語
情報に対応した言語で記述した目標言語文書データを生
成する目標言語文書生成手段と、 前記目標言語文書生成手段により生成される目標言語文
書データを前記クライアント装置に送信する文書送信手
段と、 を備えたことを特徴とする多言語対応通信システム。
1. A communication system comprising: a client device; and a server device that transmits document data according to a request from the client device to the client device, wherein the client device specifies the document data. Request information transmitting means for transmitting, to the server device, possible document identification information and request language information for specifying a description language of the document data; and reception output means for receiving and outputting the document data from the server device. The server device comprises: an original document input unit for inputting document data described in a predetermined language; and an intermediate obtained as a result of grammatically and semantically analyzing the document data input by the original document input unit. Original document analysis means for generating intermediate format document data described in a formal expression, and a result of analysis by the original document analysis means Analysis result display means for displaying an analysis result when a plurality of ambiguities occur in the document data; intermediate format document storage means for storing at least one of the intermediate format document data; Information, request information receiving means for receiving the request language information, and from the intermediate format document data corresponding to the document identification information stored in the intermediate format document storage means, in a language corresponding to the request language information. Target language document generating means for generating the described target language document data; and document transmitting means for transmitting the target language document data generated by the target language document generating means to the client device. Multilingual communication system.
【請求項2】 前記サーバー装置は、前記解析結果表示
手段が表示した複数の解析結果から特定の解析結果を選
択し、解析結果として確定させる解析結果確定手段を備
えたことを特徴とする請求項1に記載の多言語対応通信
システム。
2. The server device according to claim 1, further comprising: an analysis result determination unit that selects a specific analysis result from the plurality of analysis results displayed by the analysis result display unit and determines the selected analysis result as the analysis result. 2. The multilingual communication system according to 1.
【請求項3】 前記解析結果表示手段は、前記原文書入
力手段で入力した文書データの解析結果として構文解析
木を表示することを特徴とする請求項1もしくは2に記
載の多言語対応通信システム。
3. The multilingual communication system according to claim 1, wherein said analysis result display means displays a parse tree as an analysis result of the document data input by said original document input means. .
JP9026343A 1996-12-03 1997-02-10 Multilingual correspondence communication system Pending JPH10222516A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP9026343A JPH10222516A (en) 1997-02-10 1997-02-10 Multilingual correspondence communication system
US08/984,293 US6092035A (en) 1996-12-03 1997-12-03 Server device for multilingual transmission system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9026343A JPH10222516A (en) 1997-02-10 1997-02-10 Multilingual correspondence communication system

Publications (1)

Publication Number Publication Date
JPH10222516A true JPH10222516A (en) 1998-08-21

Family

ID=12190808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9026343A Pending JPH10222516A (en) 1996-12-03 1997-02-10 Multilingual correspondence communication system

Country Status (1)

Country Link
JP (1) JPH10222516A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7493557B2 (en) 2001-09-12 2009-02-17 Seiko Epson Corporation Source file generation apparatus
US9164989B2 (en) 2012-10-05 2015-10-20 Fuji Xerox Co., Ltd. Translation processing device, non-transitory computer readable medium, and translation processing method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7493557B2 (en) 2001-09-12 2009-02-17 Seiko Epson Corporation Source file generation apparatus
US9164989B2 (en) 2012-10-05 2015-10-20 Fuji Xerox Co., Ltd. Translation processing device, non-transitory computer readable medium, and translation processing method

Similar Documents

Publication Publication Date Title
US6092035A (en) Server device for multilingual transmission system
JP3066274B2 (en) Machine translation equipment
JPS6231467A (en) Sentence preparation device
WO2008137341A1 (en) Document translation system
JPH0869470A (en) Natural language processing device and method
JPH03278174A (en) Translation method and system for communication between different language
US7401016B2 (en) Communication support system, communication support method, and computer program
JP3467160B2 (en) Multilingual communication system, server device, and document transmission method for server device
JPH0261763A (en) Mechanical translation equipment
JP3467159B2 (en) Multilingual communication system, server device, and document transmission method for server device
JPH10222516A (en) Multilingual correspondence communication system
JP2003296327A (en) Translation server, genre-classified online machine translation method, and program therefor
JP3434161B2 (en) Multilingual communication system
JP6114090B2 (en) Machine translation apparatus, machine translation method and program
JPH10222513A (en) Multilingual correspondence communication system
JPH10187732A (en) Multilingual communication system
KR100836159B1 (en) System and method for semi-automatic translating service
JPH10187731A (en) Multilingual communication system
JP3467161B2 (en) Multilingual communication system, server device, and document transmission method for server device
JPH10214266A (en) Communication system dealing with multiple languages
JPH10207892A (en) Multilingual communication system
Sornlertlamvanich et al. Language Resource Management System for Asian WordNet Collaboration and Its Web Service Application.
JP3174664B2 (en) Machine translation equipment
JP3353873B2 (en) Machine translation equipment
JP3761364B2 (en) Machine translation system