JPH10232869A - Communication system coping with many languages - Google Patents

Communication system coping with many languages

Info

Publication number
JPH10232869A
JPH10232869A JP9033708A JP3370897A JPH10232869A JP H10232869 A JPH10232869 A JP H10232869A JP 9033708 A JP9033708 A JP 9033708A JP 3370897 A JP3370897 A JP 3370897A JP H10232869 A JPH10232869 A JP H10232869A
Authority
JP
Japan
Prior art keywords
search
document data
language
intermediate format
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9033708A
Other languages
Japanese (ja)
Other versions
JP3434161B2 (en
Inventor
Norihisa Fujii
則久 藤井
Atsuhiko Kurachi
敦彦 倉知
Atsushi Kawai
淳 河合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP03370897A priority Critical patent/JP3434161B2/en
Priority to US08/984,293 priority patent/US6092035A/en
Publication of JPH10232869A publication Critical patent/JPH10232869A/en
Application granted granted Critical
Publication of JP3434161B2 publication Critical patent/JP3434161B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a communication system coping with many languages capable of easily retrieving desired document data from intermediate form document data stored in a server device. SOLUTION: Document data stored in the server device 102 are stored not as the document data described in a natural language but as the intermediate form document data 104 obtained as the result of grammatically and semantically analyzing the document data described in the natural language. Then, when the retrieval of the document data is requested from a client device 103, the intermediate form document data 104 provided with a specified character string are retrieved from a storage device, the document data described in the natural language requested by the client device 103 are generated from the retrieved intermediate form document data 104 and the generated document data are transmitted to the client device 103.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、翻訳機能を有する
ことにより所望の言語による文書データを提供すること
が可能なサーバー装置と、前記文書データの表示が可能
なクライアント装置とを通信ネットワークを介して接続
した多言語対応通信システムに関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a server device capable of providing document data in a desired language by having a translation function and a client device capable of displaying the document data via a communication network. The present invention relates to a multi-language compatible communication system which is connected by a connection.

【0002】[0002]

【従来の技術】従来、インターネットに代表されるよう
に、通信ネットワークを介して、文書データを検索、閲
覧するシステムが普及している。この様なシステムは、
各種の文書データを記憶する少なくとも1つのサーバー
装置と、文書データの表示が可能な少なくとも1つのク
ライアント装置と、それらを接続する通信ネットワーク
とで構成される。通信ネットワークは、公衆回線網や、
専用回線網あるいはその組み合わせから構成される。サ
ーバー装置は、各種の文書データが記憶できる記憶装置
と、通信ネットワークへの接続装置とを備え、クライア
ント装置は文書データを表示可能な表示装置と、閲覧し
たい文書の指示情報を入力できる入力装置と、通信ネッ
トワークへの接続装置とを備える。
2. Description of the Related Art Conventionally, a system for searching and browsing document data via a communication network, such as the Internet, has become widespread. Such a system,
It comprises at least one server device for storing various types of document data, at least one client device capable of displaying document data, and a communication network connecting them. Communication networks include public networks,
It is composed of a dedicated line network or a combination thereof. The server device includes a storage device capable of storing various types of document data, and a connection device to a communication network.The client device includes a display device capable of displaying document data, and an input device capable of inputting instruction information of a document to be viewed. And a connection device to a communication network.

【0003】例えば、インターネットでは、サーバー装
置、クライアント装置共に非常に多くの装置が接続され
ており、その所在地も全世界に広がっている。そして、
それらを接続する通信ネットワークを介して世界各地の
様々な情報を、検索、閲覧することが可能なシステムと
なっている。
[0003] For example, on the Internet, a great number of devices are connected to both server devices and client devices, and their locations are spread all over the world. And
The system is capable of searching and browsing various information in various parts of the world via a communication network connecting them.

【0004】このようなインターネットでは、図11に
示すように、各サーバー装置1102には、英語とか、日本
語、中国語等の様々な言語で記述された文書データが記
憶されている。通信ネットワーク1101を介してサーバー
装置に接続されているクライアント装置1103では、これ
らの様々な言語で記述された文書データをそれぞれの言
語で表示することが可能である。また、言語翻訳プログ
ラムを内蔵するクライアント装置もあり、必要に応じて
所望の言語に翻訳して文書データを表示することも可能
である。
In the Internet, as shown in FIG. 11, document data described in various languages such as English, Japanese, and Chinese is stored in each server device 1102. The client device 1103 connected to the server device via the communication network 1101 can display document data described in these various languages in the respective languages. There is also a client device having a built-in language translation program, and it is possible to display the document data by translating it into a desired language as needed.

【0005】[0005]

【発明が解決しようとする課題】上述したシステム、特
に、インターネットのように全世界に広がったネットワ
ークを介して様々な文書データを閲覧する場合、文書デ
ータの提供者と、その文書データの閲覧者とは異なる言
語を母国語としていることが多い。しかし、母国語以外
の言語での記述や、その理解には困難を伴うことが多
い。これを解決するため、次の2つの方法が知られてい
る。1つは、同一内容の文書を複数の言語で記述された
複数の文書データとしてサーバー装置に記憶させ、所望
の言語の文書データをクライアント装置から選択するこ
とで、所望の言語で記述された文書データを閲覧可能と
する方法である。他の方法は、言語翻訳プログラムをク
ライアント装置に搭載し、その言語翻訳プログラムを用
いてサーバーから送信されてきた文書データを所望する
言語の文書データに翻訳する方法である。これらの方法
により、母国語以外の言語で記述された文書データも母
国語で閲覧可能となる。しかし、その場合でも以下のよ
うな問題が残されている。
SUMMARY OF THE INVENTION When browsing various document data via the above-mentioned system, particularly, a network spread all over the world such as the Internet, a provider of the document data and a viewer of the document data Often the native language is different from the native language. However, writing and understanding in languages other than the native language is often difficult. To solve this, the following two methods are known. One is to store a document having the same content as a plurality of document data described in a plurality of languages in a server device, and select document data in a desired language from a client device to thereby obtain a document described in a desired language. This is a method that allows data to be browsed. Another method is to mount a language translation program on a client device and use the language translation program to translate document data transmitted from a server into document data in a desired language. With these methods, document data described in a language other than the native language can also be browsed in the native language. However, even in that case, the following problems remain.

【0006】先ず、同一内容の文書を複数の言語で記述
された複数の文書データとしてサーバー装置に記憶させ
る方法では、1つの内容の文書でも、その内容を様々な
言語で記述された複数の文書データとして作成する必要
があり、多くの費用と労力を必要とする問題がある。
First, in a method of storing a document having the same content as a plurality of document data described in a plurality of languages in a server device, even if a document has a single content, a plurality of documents having the same content described in various languages are stored. There is a problem that it needs to be created as data and requires a lot of cost and labor.

【0007】また、言語翻訳プログラムをクライアント
装置に搭載する方法では、各サーバーにより提供される
様々な言語の文章をすべて翻訳して表示するためには、
クライアント装置にそれぞれの言語から所望の言語へ翻
訳可能な多数の言語翻訳プログラムを搭載する必要があ
る。これはクライアント装置のコストを上昇させること
になる。また、現在実用化されている言語翻訳プログラ
ムでは、翻訳する原文書に元来含まれている曖昧さによ
り、望ましい翻訳結果が得られないと言う問題もある。
In the method in which a language translation program is installed in a client device, in order to translate and display all sentences in various languages provided by each server,
It is necessary to mount a large number of language translation programs capable of translating each language into a desired language on the client device. This will increase the cost of the client device. Further, in a language translation program currently in practical use, there is a problem that a desired translation result cannot be obtained due to the ambiguity originally included in the original document to be translated.

【0008】これを解決するために、本出願人が既に出
願した特願平8−322842号には、サーバー装置に
記憶される文書データを、自然言語で記述された文書デ
ータではなく、自然言語で記述された文書データを文法
的、意味的に解析した結果として得られる中間形式文書
データとして記憶する。そして、クライアント装置から
文書データの要求があると、その文書データに対応した
中間形式文書データを記憶装置から読み出し、読み出し
た中間形式文書データからクライアント装置が要求する
自然言語で記述された文書データを生成し、生成された
文書データをクライアント装置に送信する。このよう
に、クライアント装置に特別な言語翻訳プログラムを必
要とせず、かつ多数の言語で記述される文書データをよ
り簡易に提供可能な多言語対応通信システムが記述され
ている。
In order to solve this problem, Japanese Patent Application No. 8-322842 filed by the present applicant describes that document data stored in a server device is not natural language described document data but natural language. Is stored as intermediate format document data obtained as a result of grammatically and semantically analyzing the document data described in. When there is a request for document data from the client device, the intermediate format document data corresponding to the document data is read from the storage device, and from the read intermediate format document data, the document data described in the natural language requested by the client device is converted. The generated document data is transmitted to the client device. As described above, a multilingual communication system that does not require a special language translation program in a client device and that can easily provide document data described in many languages is described.

【0009】しかし、この既提案の多言語対応通信シス
テムにおいても、次のような問題点が残されている。
However, the following problems still remain in the multilingual communication system proposed above.

【0010】多言語対応通信システムの利用者が、サー
バー装置に記憶された複数の中間形式文書データの中か
ら、所望する文書データを探し出すためには、サーバ装
置は、全ての中間形式文書データから自然言語で記述さ
れた文書データを生成する必要があった。さらに、利用
者は、その生成された全ての文書データの内容を逐次参
照し、要否を判断する必要があった。
In order for a user of a multi-language communication system to search for desired document data from a plurality of intermediate format document data stored in the server device, the server device must use all of the intermediate format document data. It was necessary to generate document data described in a natural language. Further, the user needs to sequentially refer to the contents of all the generated document data to determine whether or not it is necessary.

【0011】本発明は、上述した問題点を解決するため
になされたものであり、サーバー装置に記憶された中間
形式文書データから、所望する文書データを容易に検索
可能な多言語対応通信システムを提供することを目的と
していいる。
SUMMARY OF THE INVENTION The present invention has been made in order to solve the above-mentioned problems, and a multilingual communication system capable of easily searching for desired document data from intermediate format document data stored in a server device. It is intended to provide.

【0012】[0012]

【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に記載の多言語対応通信システム
は、前記クライアント装置と、前記クライアント装置か
らの検索要求に応じた検索結果を前記クライアント装置
に送信するサーバー装置とから構成される。前記クライ
アント装置では、検索要求送信手段が検索文字列と、前
記検索文字列の記述言語を指示する検索言語情報とから
なる検索要求を前記サーバー装置に送信し、前記検索結
果受信手段が前記サーバー装置より前記検索結果を受信
し、検索結果出力手段が、前記検索結果受信手段により
受信した検索結果としての表示出力、印字出力、音声出
力等の出力処理を行う。
In order to achieve the above object, according to the present invention, there is provided a multilingual communication system, comprising: a client device; and a search result in response to a search request from the client device. To the client device. In the client device, the search request transmitting unit transmits a search request including a search character string and search language information indicating a description language of the search character string to the server device, and the search result receiving unit transmits the search result to the server device. The search result is received, and the search result output means performs output processing such as display output, print output, and voice output as the search result received by the search result receiving means.

【0013】一方、前記サーバー手段では、検索要求受
信手段がクライアント装置から検索要求を受信し、中間
形式文書記憶手段が、少なくとも一つの文書データを、
自然言語で記述された文書を文法的、意味的に解析した
結果として得られる中間形式表現で記述した中間形式文
書データとして記憶し、検索文字列変換手段が、前記検
索要求に含まれる前記検索言語情報に従い、前記検索文
字列を前記中間形式表現で記述した中間形式検索文字列
に変換し、中間形式検索手段が、前記中間形式文書記憶
手段に記憶された中間形式文書データより、前記中間形
式検索文字列を含む中間形式文書データを検索し、その
検索結果を文書送信手段が前記クライアント装置に送信
する。
On the other hand, in the server means, the search request receiving means receives the search request from the client device, and the intermediate format document storage means stores at least one document data,
A document described in a natural language is stored as intermediate format document data described in an intermediate format expression obtained as a result of grammatically and semantically analyzed, and a search character string conversion unit stores the search language included in the search request. According to the information, the search character string is converted into an intermediate format search character string described in the intermediate format expression, and the intermediate format search unit performs the intermediate format search from the intermediate format document data stored in the intermediate format document storage unit. An intermediate format document data including a character string is searched, and the search result is sent to the client device by the document sending unit.

【0014】このように、クライアントから所望の言語
で記述した検索文字列を指定でき、それにより中間形式
文書データの形式で記憶された文書データから所望の文
書データを検索し、その検索結果をクライアント装置で
出力できるので、サーバー装置に多数の言語で記述した
文書データを保存したり、クライアント装置に言語翻訳
プログラムを搭載することなく、所望の言語での文書デ
ータの検索を容易に行うことができる。
As described above, a client can specify a search character string described in a desired language, thereby searching for desired document data from document data stored in an intermediate format document data format, and transmitting the search result to the client. Since the data can be output by the device, it is possible to easily search for the document data in a desired language without storing the document data described in many languages in the server device and without installing a language translation program in the client device. .

【0015】また、請求項2に記載の多言語対応通信シ
ステムでは、前記サーバー装置において、目標言語文書
生成手段が、前記中間形式検索手段により検索された中
間形式文書データから、前記検索言語情報に対応した言
語で記述した文書データを生成し、前記検索結果送信手
段は、前記目標言語文書生成手段が生成した文書データ
を検索結果として前記クライアント装置に送信する。
In the multilingual communication system according to the second aspect, in the server device, the target language document generating means may convert the intermediate format document data searched by the intermediate format searching means into the search language information. The document data described in a corresponding language is generated, and the search result transmitting unit transmits the document data generated by the target language document generating unit to the client device as a search result.

【0016】このように、検索結果として検索文字列を
記述した自然言語により記述された文書データが得られ
るので、直ちに検索結果の文書データを参照することが
出来る。
As described above, since the document data described in the natural language in which the search character string is described is obtained as the search result, the document data of the search result can be referred to immediately.

【0017】さらに、請求項3に記載の多言語対応通信
システムでは、前記クライアント装置において、検索要
求送信手段が、前記検索文字列及び検索言語情報に加え
て、目標言語情報を含む検索要求を送信し、前記サーバ
ー装置では、検索要求受信手段が、前記検索要求を受信
すると共に、目標言語文書生成手段が、前記中間形式検
索手段により検索された中間形式文書データから、前記
目標言語情報に対応した言語で記述した文書データを生
成する。
Further, in the multilingual communication system according to the third aspect, in the client device, the search request transmitting means transmits a search request including target language information in addition to the search character string and the search language information. In the server device, the search request receiving unit receives the search request, and the target language document generation unit corresponds to the target language information from the intermediate format document data searched by the intermediate format search unit. Generate document data described in the language.

【0018】このように、検索結果として目標言語情報
で指示した自然言語により記述された文書データが得ら
れるので、所望した自然言語で検索結果を参照すること
が出来る。
As described above, since the document data described in the natural language indicated by the target language information is obtained as the search result, the search result can be referred to in the desired natural language.

【0019】[0019]

【発明の実施の形態】以下に、本発明の多言語対応通信
システムを具体化した実施の形態について図面を参照し
て説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of a multilingual communication system according to the present invention will be described below with reference to the drawings.

【0020】図1に本実施の形態の多言語対応通信シス
テムの概念図を示す。サーバー装置102は、文書データ
を、特定の自然言語によらない中間形式文書データ(詳
細は後述)として記憶している。また、クライアント装
置より送信された検索文字列を中間形式に変換する検索
文字列変換プログラムと、中間形式に変換された検索文
字列を含む文書データを中間形式文書データより検索す
る中間形式文書検索プログラムも記憶している。クライ
アント装置103は通信ネットワーク101を介して、文書デ
ータを検索する為の検索文字列と、その検索文字列の記
述言語の指示情報とからなる検索要求を所望のサーバー
装置102に送信する。サーバー装置102は、クライアント
装置103から送信された検索要求に基づいて、指定され
た中間形式文書データから検索文字列を含む文書データ
を検索し、検索結果を通信ネットワーク101を介してク
ライアント装置103に送信する。そして、クライアント
装置は、その検索結果を受信し、表示出力、印字出力、
音声出力等の出力を行う。
FIG. 1 shows a conceptual diagram of a multilingual communication system according to the present embodiment. The server device 102 stores the document data as intermediate format document data not described in a specific natural language (details will be described later). Also, a search character string conversion program for converting a search character string transmitted from a client device into an intermediate format, and an intermediate format document search program for searching the intermediate format document data for document data including the search character string converted to the intermediate format I also remember. The client device 103 transmits a search request including a search character string for searching document data and instruction information of a description language of the search character string to the desired server device 102 via the communication network 101. The server device 102 searches for document data including a search character string from the designated intermediate format document data based on the search request transmitted from the client device 103, and sends the search result to the client device 103 via the communication network 101. Send. Then, the client device receives the search result, and displays, prints,
Output such as audio output.

【0021】図2には本発明を好適に適用した実施の形
態のサーバー装置のブロック図を示す。
FIG. 2 is a block diagram of a server device according to an embodiment to which the present invention is suitably applied.

【0022】サーバー装置102は、ROM202と、RAM203、C
PU204、表示制御部205、入力部206、通信制御部207及び
それらを接続するバス209により構成される。CPU204
は、記憶されている各種のプログラムに基づいて様々な
制御を実行し、本サーバー装置102の動作の主体をなし
ている。表示制御部205は、表示データの蓄積とディス
プレイモニターの制御を行い、モニター208に表示出力
を行う。モニター208は、CRTディスプレイや、LCDディ
スプレイなど様々な表示装置を利用できる。入力部206
は、記憶される文書データの入力や、サーバー装置102
への指示を入力するためのものであり、キーボード装置
である。通信制御部207は、通信網210と接続される。通
信網210は、公衆回線や、専用回線の回線網であり、通
信ネットワーク101の構成要素である。通信制御部207
は、通信網210とサーバー装置102とのデータ通信を制御
し、データの送受信を行う。通信制御部207は、公衆回
線や専用回線と接続するためのモデム装置である。
The server device 102 includes a ROM 202, a RAM 203, and a C
It comprises a PU 204, a display control unit 205, an input unit 206, a communication control unit 207, and a bus 209 connecting them. CPU204
Performs various controls based on various stored programs, and forms the main body of the operation of the server device 102. The display control unit 205 accumulates display data and controls a display monitor, and outputs a display to the monitor 208. As the monitor 208, various display devices such as a CRT display and an LCD display can be used. Input unit 206
Input of stored document data,
And a keyboard device. The communication control unit 207 is connected to the communication network 210. The communication network 210 is a public network or a dedicated network, and is a component of the communication network 101. Communication control unit 207
Controls data communication between the communication network 210 and the server device 102 to transmit and receive data. The communication control unit 207 is a modem device for connecting to a public line or a dedicated line.

【0023】なお、入力部206は、前記構成以外に、マ
ウス装置などの指示装置や、音声入力装置、タッチパネ
ル装置などの様々な入力装置や、その組み合わせで構成
してもよい。また、通信制御部207は、無線の公衆回線
や専用回線と接続するための送受信装置とか、LAN(Loca
l Area Network)に接続するためのイーサーネット接続
装置、トークンリング接続装置とか、ATM(Asynchronous
Transfer Mode)回線網への接続装置等、様々な接続装
置でもよい。
In addition, the input unit 206 may be constituted by various input devices such as a pointing device such as a mouse device, a voice input device, a touch panel device, and the like, in addition to the above configuration. Further, the communication control unit 207 includes a transmitting / receiving device for connecting to a wireless public line or a dedicated line, or a LAN (Loca
l An Ethernet connection device, a token ring connection device, or an ATM (Asynchronous
(Transfer Mode) Various connection devices such as a connection device to a network may be used.

【0024】ROM202は各種プログラムや、翻訳辞書のデ
ータ等を記憶している。
The ROM 202 stores various programs, translation dictionary data, and the like.

【0025】ROM202内にはさらに各種の記憶部が形成さ
れている。通信制御プログラム記憶部202aは、通信制御
部207を介した各種通信の制御や、クライアント装置か
らの検索要求の受信や、検索結果のクライアント装置へ
の送信処理等を行う通信制御プログラムを記憶してい
る。通信制御プログラムと、通信制御部207とが本発明
の検索要求受信手段と、検索結果送信手段との主体をな
す。
Various storage sections are further formed in the ROM 202. The communication control program storage unit 202a stores a communication control program that controls various kinds of communication via the communication control unit 207, receives a search request from the client device, and transmits a search result to the client device. I have. The communication control program and the communication control unit 207 form the subject of the search request receiving means and the search result transmitting means of the present invention.

【0026】検索文字列変換プログラム記憶部は202b
は、クライアント装置から受信した検索要求に含まれる
検索文字列を、中間形式(詳細は後述)に変換する検索文
字列変換プログラムを記憶する。この検索文字列変換プ
ログラムが本発明の検索文字列変換手段の主体をなす。
本実施の形態では、変換する検索文字列を記述した自然
言語の種類に応じて検索文字列変換プログラムが別にな
っているものとし、検索文字列変換プログラム記憶部20
2bは、検索文字列を記述した自然言語に応じた少なくと
も1つの検索文字列変換プログラムを記憶する。なお、
前記以外に、検索文字列を記述した各自然言語に対応し
た別々の検索文字列変換プログラムを用いるのではな
く、全ての自然言語に対応できる単一の検索文字列変換
プログラムを用い、検索文字列変換プログラム記憶部20
2bはその単一の検索文字列変換プログラムを記憶しても
よい。あるいは、言語構造として類似した複数の自然言
語に対応可能な検索文字列変換プログラムを用い、それ
を記憶してもよい。
The search character string conversion program storage unit 202b
Stores a search character string conversion program for converting a search character string included in a search request received from a client device into an intermediate format (details will be described later). This search character string conversion program forms the main part of the search character string conversion means of the present invention.
In the present embodiment, it is assumed that a search character string conversion program is different according to the type of a natural language that describes a search character string to be converted.
2b stores at least one search character string conversion program corresponding to a natural language describing the search character string. In addition,
In addition to the above, instead of using a separate search string conversion program corresponding to each natural language that describes a search string, a single search string conversion program that can support all natural languages is used, and a search string is used. Conversion program storage unit 20
2b may store the single search string conversion program. Alternatively, a search character string conversion program capable of handling a plurality of natural languages having similar language structures may be used and stored.

【0027】中間形式文書検索プログラム記憶部は202c
は、中間形式に変換された検索文字列を含む中間形式文
書データを検索するための中間形式文書検索プログラム
を記憶する。この中間形式文書検索プログラムが本発明
の中間形式検索手段の主体をなす。
The intermediate format document search program storage unit 202c
Stores an intermediate format document search program for searching for intermediate format document data including a search character string converted into an intermediate format. This intermediate format document search program forms the main body of the intermediate format search means of the present invention.

【0028】また、目標言語文書生成プログラム記憶部
202dは、中間形式文書データから、各種の目標言語文書
データを生成するための目標言語文書生成プログラムを
記憶する。なお、目標言語文書生成プログラムが本発明
の目標言語文書生成手段の主体をなす。本実施の形態で
は、生成する文書の目標言語の種類に応じて目標言語文
書生成プログラムが別になっているものとし、目標言語
文書生成プログラム記憶部202dは、生成する文書の目標
言語に応じた少なくとも1つの目標言語文書生成プログ
ラムを記憶する。なお、前記以外に、各目標言語に対応
した別々の目標言語文書生成プログラムを用いるのでは
なく、全ての目標言語に対応できる単一の目標言語文書
生成プログラムを用い、目標言語文書生成プログラム記
憶部202dはその単一の目標言語文書生成プログラムを記
憶してもよい。あるいは、言語構造として類似した複数
の目標言語に対応可能な目標言語文書生成プログラムを
用い、それを記憶してもよい。
Also, a target language document generation program storage unit
Reference numeral 202d stores a target language document generation program for generating various target language document data from the intermediate format document data. Note that the target language document generation program forms the subject of the target language document generation means of the present invention. In the present embodiment, the target language document generation program is assumed to be different according to the type of the target language of the document to be generated, and the target language document generation program storage unit 202d stores at least the target language according to the target language of the document to be generated. Store one target language document generator. In addition to the above, instead of using a separate target language document generation program corresponding to each target language, a single target language document generation program capable of supporting all target languages is used, and a target language document generation program storage unit is used. 202d may store the single target language document generator. Alternatively, a target language document generation program that can support a plurality of target languages having similar language structures may be used and stored.

【0029】翻訳辞書記憶部202eは、目標言語文書生成
プログラムが処理を行う場合に必要とされる、目標言語
に対応した生成規則データ、形態素生成辞書などの各種
データを記憶している。さらに、翻訳辞書記憶部202e
は、検索文字列変換プログラムが処理を行う場合に必要
とされる辞書などの各種データも記憶している。
The translation dictionary storage unit 202e stores various data required when the target language document generation program performs processing, such as generation rule data corresponding to the target language and a morpheme generation dictionary. Further, the translation dictionary storage unit 202e
Also stores various data such as a dictionary required when the search character string conversion program performs processing.

【0030】なお、ROM202は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
The ROM 202 is not limited to the ROM, and may be a storage device such as a magnetic disk device, a magneto-optical disk device, or a CD-ROM storage device.

【0031】RAM203は、中間形式文書データ等のデータ
の保存や、様々な一時データを記憶するために使用さ
れ、次のような各記憶部が内部に形成されている。
The RAM 203 is used for storing data such as intermediate format document data and for storing various temporary data, and has the following storage units formed therein.

【0032】ワークメモリ203aは各プログラムが動作時
に必要とする一時的な記憶領域を提供する。生成文書メ
モリ203bは、中間形式文書データ記憶部203cに記憶され
た中間形式文書データに基づいて、目標言語文書生成プ
ログラム記憶部202dに記憶された目標言語文書生成プロ
グラムが生成した目標言語文書データを一時的に記憶す
る。
The work memory 203a provides a temporary storage area required by each program during operation. The generated document memory 203b stores the target language document data generated by the target language document generation program stored in the target language document generation program storage unit 202d based on the intermediate format document data stored in the intermediate format document data storage unit 203c. Remember temporarily.

【0033】中間形式文書データ記憶部203cは、中間形
式文書データを少なくとも1つ記憶している。中間形式
文書データ記憶部が、本発明の中間形式文書記憶手段の
主体をなす。
The intermediate format document data storage section 203c stores at least one intermediate format document data. The intermediate format document data storage unit forms the main body of the intermediate format document storage means of the present invention.

【0034】なお、RAM203は、RAMに限らず、磁気ディ
スク装置や、光磁気ディスク装置等の記憶装置であって
もよい。さらに、中間形式文書データの作成を行わない
場合においては、中間形式文書データ記憶部203cはROM2
02上に形成してもよい。
The RAM 203 is not limited to the RAM, but may be a storage device such as a magnetic disk device or a magneto-optical disk device. Further, when the intermediate format document data is not created, the intermediate format document data storage unit 203c stores
02 may be formed.

【0035】次に、図3には本発明を好適に適用した実
施の形態のクライアント装置のブロック図を示す。
FIG. 3 is a block diagram showing a client apparatus according to an embodiment to which the present invention is suitably applied.

【0036】クライアント装置103は、ROM302と、RAM30
3、CPU304、表示制御部305、入力部306、通信制御部307
及びそれらを接続するバス309により構成される。CPU30
4は、記憶されている各種のプログラムに基づいて様々
な制御を実行し、本クライアント装置103の動作の主体
をなしている。表示制御部305は、表示データの蓄積と
ディスプレイモニターの制御を行い、モニター308に表
示出力を行う。モニター308はCRTディスプレイや、LCD
ディスプレイなど様々な表示装置を利用できる。入力部
306は、検索文字列を入力したり、クライアント装置103
への各種指示を入力するためのものであり、キーボード
装置である。通信制御部307は、通信網210と接続され、
通信網210とクライアント装置103とのデータ通信を制御
し、データの送受信を行う。通信制御部307は、公衆回
線や、専用回線と接続するためのモデム装置である。
The client device 103 includes a ROM 302 and a RAM 30
3, CPU 304, display control unit 305, input unit 306, communication control unit 307
And a bus 309 connecting them. CPU30
Reference numeral 4 executes various controls based on the stored various programs, and forms the subject of the operation of the client device 103. The display control unit 305 accumulates display data and controls a display monitor, and outputs a display to the monitor 308. The monitor 308 is a CRT display or LCD
Various display devices such as a display can be used. Input section
306 is for inputting a search character string,
And a keyboard device. The communication control unit 307 is connected to the communication network 210,
It controls data communication between the communication network 210 and the client device 103 to transmit and receive data. The communication control unit 307 is a modem device for connecting to a public line or a dedicated line.

【0037】なお、入力部306は、前記構成以外に、マ
ウス装置などの指示装置や、音声入力装置、タッチパネ
ル装置などの様々な入力装置や、その組み合わせで構成
してもよい。また、通信制御部307は、無線の公衆回線
や専用回線と接続するための送受信装置とか、LAN(Loca
l Area Network)に接続するためのイーサーネット接続
装置、トークンリング接続装置とか、ATM(Asynchronous
Transfer Mode)回線網への接続装置等、様々な接続装
置でもよい。また、表示制御部305とモニター308とを用
いる以外に、印字出力装置や、音声出力装置を用いる構
成とし、文書データを印字出力や音声出力する構成とし
てもよい。
The input unit 306 may be constituted by various input devices such as a pointing device such as a mouse device, a voice input device, a touch panel device, and the like, in addition to the above-described configuration. Further, the communication control unit 307 includes a transmitting / receiving device for connecting to a wireless public line or a dedicated line, or a LAN (Loca
l An Ethernet connection device, a token ring connection device, or an ATM (Asynchronous
(Transfer Mode) Various connection devices such as a connection device to a network may be used. Further, in addition to using the display control unit 305 and the monitor 308, a configuration may be adopted in which a print output device or an audio output device is used, and the document data is output in a print or audio output.

【0038】ROM302は各種プログラムを記憶している。The ROM 302 stores various programs.

【0039】ROM302内には、さらに、各種の記憶部が形
成されている。通信制御プログラム記憶部302aは、通信
制御部307を介した各種通信の制御や、サーバー装置へ
のデータ送受信処理等を行う通信制御プログラムを記憶
している。この通信制御プログラムと、通信制御部307
とが本発明の検索要求送信手段と検索結果受信手段の主
体をなす。表示プログラム記憶部302bは、サーバーから
受信した検索結果を表示制御部305を用いて表示するた
めの表示プログラムを記憶している。表示プログラム
と、表示制御部305とが本発明の検索結果出力手段の主
体をなす。
Various storage units are further formed in the ROM 302. The communication control program storage unit 302a stores a communication control program for controlling various types of communication via the communication control unit 307 and performing processing for transmitting and receiving data to and from the server device. The communication control program and the communication control unit 307
These form the subject of the search request transmitting means and the search result receiving means of the present invention. The display program storage unit 302b stores a display program for displaying the search result received from the server using the display control unit 305. The display program and the display control unit 305 form the main part of the search result output means of the present invention.

【0040】検索要求入力プログラム記憶部302cは、ユ
ーザーが入力部306を用いて、所望する文書データが含
んでいると思われる検索文字列とその検索文字列の記述
言語と検索結果の文書データの記述言語を入力する処理
を制御するための、検索要求入力プログラムを記憶す
る。
The search request input program storage unit 302c stores, by using the input unit 306, a search character string considered to be contained in desired document data, a description language of the search character string, and a search result document data. A search request input program for controlling a process of inputting a description language is stored.

【0041】なお、ROM302は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
The ROM 302 is not limited to a ROM, and may be a storage device such as a magnetic disk device, a magneto-optical disk device, or a CD-ROM storage device.

【0042】RAM303は、様々な一時データを保存するた
めに使用され、次のような各記憶部が内部に形成されて
いる。ワークメモリ303aは各プログラムが動作時に必要
とする一時的な記憶領域を提供する。受信文書メモリ30
3bは、サーバー装置から受信した文書データを一時保存
する。なお、RAM303は、RAMに限らず、磁気ディスク装
置や、光磁気ディスク装置等の記憶装置であってもよ
い。
The RAM 303 is used to store various temporary data, and has the following storage units formed therein. The work memory 303a provides a temporary storage area required by each program during operation. Received document memory 30
3b temporarily stores the document data received from the server device. The RAM 303 is not limited to the RAM, but may be a storage device such as a magnetic disk device or a magneto-optical disk device.

【0043】次に、サーバー装置102と、クライアント
装置103との基本的な処理の流れを図4を用いて説明す
る。先ず、クライアント装置103では、検索を行うサー
バー装置を通信ネットワーク上で一意に決定する情報で
あるサーバー装置のアドレスを入力する(S401)。本実施
の形態では、サーバー装置のアドレスとしてTCP/IP(Tra
nsmission Control Protocol/Internet Protocol)で規
定されるホスト名あるいはIPアドレスを用いるものとす
るが、他に通信ネットワーク上のアドレスを決定できる
情報であれば何でもよい。次に、所望する文書データが
含んでいると思われる検索文字列とその検索文字列を記
述する自然言語を指定する検索言語情報と検索結果の文
書データがどの自然言語によって記述されるかを指定す
る目標言語情報を入力する(S402)。
Next, a basic processing flow between the server apparatus 102 and the client apparatus 103 will be described with reference to FIG. First, the client device 103 inputs an address of the server device, which is information for uniquely determining a server device to be searched on the communication network (S401). In this embodiment, TCP / IP (Tra
Although a host name or an IP address specified by an nsmission control protocol / Internet Protocol is used, any other information that can determine an address on a communication network may be used. Next, a search character string that is considered to be included in the desired document data and a natural language that describes the search character string are specified. The search language information and the natural language in which the search result document data is described are specified. The target language information to be input is input (S402).

【0044】次に、入力された検索文字列と検索言語情
報と目標言語情報からなる検索要求をS401で入力された
アドレスのサーバー装置に送信する(S403)。本実施の形
態では、サーバー装置への送信方法として、TCP/IP上の
HTTP(Hyper Text Transfer Protocol)を拡張し用いると
する。具体的には、クライアント装置は、図5(a)に示
す形式のデータをサーバー装置に送信する。"SEARCH"は
検索要求を意味し、<CRLF>は、復帰改行文字を示す。"K
ey-Word:"は、次に検索文字列が続くことを示す文字列
であり、<検索文字列>には、S402で入力された検索文字
列を指定する。"Key-Language:"は、次に検索言語情報
が続くことを示す文字列であり、<検索言語>には、検
索文字列を記述する自然言語を識別する予め定められた
文字列を指定する。さらに、"Accept-Language:"は、次
に目標言語情報が続くことを示す文字列であり、<目標
言語>には、目標言語を識別する予め定められた文字列
を指定する。
Next, a search request including the input search character string, search language information, and target language information is transmitted to the server device at the address input in S401 (S403). In the present embodiment, the transmission method to the server
It is assumed that HTTP (Hyper Text Transfer Protocol) is extended and used. Specifically, the client device transmits data in the format shown in FIG. 5A to the server device. "SEARCH" means a search request, and <CRLF> indicates a carriage return / line feed character. "K
ey-Word: "is a character string indicating that a search character string follows, and <search character string> specifies the search character string input in S402." Key-Language: " Next, it is a character string indicating that the search language information follows, and <search language> specifies a predetermined character string that identifies a natural language that describes the search character string, and “Accept-Language: "Is a character string indicating that the target language information follows, and <target language> specifies a predetermined character string for identifying the target language.

【0045】図5(b)は、検索文字列としての"林檎"の
日本語を検索言語とし、英語を目標言語とした場合の例
である。なお、上述したTCP/IP及びHTTPは、既に広く実
用化された公知の技術であるため、説明を省略する。
FIG. 5B shows an example in which Japanese of "apple" as a search character string is set as a search language and English is set as a target language. Note that the above-described TCP / IP and HTTP are well-known technologies that have already been widely put into practical use, and thus description thereof will be omitted.

【0046】サーバー装置では、S406でクライアント装
置から送信された検索要求の検索文字列、検索言語情
報、目標言語情報を受信し、受信した情報に基づいた検
索を行う為に中間表現検索処理を実行する(S407)。S407
の詳細は後述する。S407にて所望の検索結果が得られな
い場合は、それをエラーとして判定する(S408)。本実施
の形態では、このエラーの判定は後述するエラーフラグ
を参照することで判定する。エラーでなければ、検索結
果をクライアントに送信し(S409)、エラーならば、エラ
ー情報を送信する(S410)。クライアントでは、サーバー
から検索結果もしくはエラー情報を受信し(S404)、表示
装置に表示する(S405)。
The server receives the search character string, search language information, and target language information of the search request transmitted from the client in step S406, and executes an intermediate expression search process to perform a search based on the received information. Yes (S407). S407
Will be described later. If the desired search result is not obtained in S407, it is determined as an error (S408). In the present embodiment, this error is determined by referring to an error flag described later. If there is no error, the search result is transmitted to the client (S409). If there is an error, error information is transmitted (S410). The client receives the search result or error information from the server (S404) and displays it on the display device (S405).

【0047】次に、中間表現検索処理(S409)の詳細につ
いて、図6を用いて説明する。先ず、エラー状態を記憶
するために、ワークメモリ203a内に形成されたエラーフ
ラグ(図示せず)をクリアーして、エラーなしの状態とす
る(S601)。
Next, details of the intermediate expression search processing (S409) will be described with reference to FIG. First, in order to store an error state, an error flag (not shown) formed in the work memory 203a is cleared to set an error-free state (S601).

【0048】次に、検索結果の中間言語形式文書データ
をS406にて受信した目標言語情報に基づいた目標言語の
生成が可能か否かを判定する(S602)。本実施の形態にお
いては、前述したように各目標言語毎に個別の目標言語
文書生成プログラムを持つので、S406にて受信した目標
言語情報に対応した目標言語文書生成プログラムが目標
言語文書生成プログラム記憶部202dに記憶されているか
否かで、S602の判定を行う。生成が不可能と判定された
場合(S602:No)、エラーとするためにS610に処理を進
め、可能と判断された場合は(S602:Yes)、S603に処理を
進める。
Next, it is determined whether or not it is possible to generate a target language based on the target language information received in S406 from the intermediate language format document data as a search result (S602). In the present embodiment, as described above, since each target language has a separate target language document generation program, the target language document generation program corresponding to the target language information received in S406 is stored in the target language document generation program storage. The determination in S602 is performed based on whether or not the information is stored in the unit 202d. If it is determined that generation is not possible (S602: No), the process proceeds to S610 to make an error, and if it is determined that generation is possible (S602: Yes), the process proceeds to S603.

【0049】このS603では、検索文字列をS406にて受信
した検索言語情報に基づいて中間表現に変換可能か否か
を判定する(S603)。本実施の形態では、前述したように
各検索言語毎に個別の検索文字列変換プログラムを持つ
ので、S406にて受信した検索言語情報に対応した検索文
字列変換プログラムが検索文字列変換プログラム記憶部
202bに記憶されているか否かで、S603の判定を行う。変
換が不可能と判定された場合(S603:No)、エラーとする
ためにS610に処理を進め、可能と判断された場合は(S60
3:Yes)、S604に処理を進める。S604では、検索文字列を
S406で受信した検索言語情報に基づき中間形式に変換す
る。この中間形式への変換処理は、本発明の検索文字列
変換手段の主体をなす検索文字列変換プログラムが行う
処理であり、その詳細は後述する。このS604による変換
が失敗した場合(S605:No)、エラーとするためにS610に
処理を進め、成功した場合、S606に処理を進める。
In S603, it is determined whether or not the search character string can be converted into an intermediate expression based on the search language information received in S406 (S603). In the present embodiment, as described above, since there is an individual search character string conversion program for each search language, the search character string conversion program corresponding to the search language information received in S406 is stored in the search character string conversion program storage unit.
The determination in S603 is performed based on whether or not it is stored in 202b. If it is determined that the conversion is not possible (S603: No), the process proceeds to S610 to make an error, and if it is determined that the conversion is possible (S60
3: Yes), the process proceeds to S604. In S604, the search string
It is converted to an intermediate format based on the search language information received in S406. The conversion process to the intermediate format is a process performed by a search character string conversion program which is a main component of the search character string conversion means of the present invention, and details thereof will be described later. If the conversion in S604 fails (S605: No), the process proceeds to S610 to make an error, and if successful, the process proceeds to S606.

【0050】次に、S606では、中間形式文書データ記憶
部に記憶された中間形式文書データに基づいてS604で中
間形式に変換された検索文字列を含む中間文書データを
検索する。この中間形式文書の検索処理は、本発明の中
間形式検索手段の主体をなす中間形式文書検索プログラ
ムが行う処理であり、その詳細は後述する。この検索の
結果、検索文字列を含む中間文書データが見つかった場
合は、S608に処理を進め、見つからなかった場合は、エ
ラーとするためにS610に処理を進める。
Next, in S606, based on the intermediate format document data stored in the intermediate format document data storage unit, intermediate document data including the search character string converted into the intermediate format in S604 is searched. The search processing of the intermediate format document is a process performed by an intermediate format document search program which is a main body of the intermediate format search means of the present invention, and details thereof will be described later. As a result of this search, if intermediate document data including the search character string is found, the process proceeds to S608, and if not found, the process proceeds to S610 to generate an error.

【0051】次に、S608では、S606の検索結果の中間言
語形式文書データから、S406で受信した目標言語情報に
従い目標言語文書データを生成する、目標言語文書生成
処理を実行する。S608の詳細は後述する。S609では、S6
08にて生成された目標言語文書データを、送信のために
一旦生成文書メモリ203bに記憶する。S610では、S602、
S603、S605とS607での判定を受けて、エラー処理をする
ためにエラーフラグをセットしてエラー状態を記憶す
る。
Next, in S608, target language document generation processing for generating target language document data according to the target language information received in S406 from the intermediate language format document data obtained as a result of the search in S606 is executed. Details of S608 will be described later. In S609, S6
The target language document data generated in 08 is temporarily stored in the generated document memory 203b for transmission. In S610, S602,
Upon receiving the determinations in S603, S605, and S607, an error flag is set to perform error processing, and the error state is stored.

【0052】次に、中間形式文書データの詳細につい
て、図8、図9、図10を参照しながら説明する。中間
言語文書データは、自然言語で記述された文書データ
(以下、原文書データという)を形態素解析、構文解
析、構造解析した結果として得られる。原文書データ
は、先ず、形態素解析をされる。形態素解析は、形態素
解析辞書を参照し、原文書を形態素に分割し、形態素列
に変換し、各形態素の品詞の判定を行う。日本語から中
間形式文書データを生成する一例として、図8(a)に示
す原文書であれば、形態素解析により図8(b)のような
形態素列からなる形態素解析結果が得られる。
Next, details of the intermediate format document data will be described with reference to FIGS. 8, 9 and 10. The intermediate language document data is obtained as a result of morphological analysis, syntax analysis, and structural analysis of document data described in a natural language (hereinafter, referred to as original document data). The original document data is first subjected to morphological analysis. The morphological analysis refers to a morphological analysis dictionary, divides an original document into morphemes, converts them into a morpheme sequence, and determines the part of speech of each morpheme. As an example of generating the intermediate format document data from Japanese, if the original document is as shown in FIG. 8A, a morphological analysis result including a morphological sequence as shown in FIG. 8B is obtained by morphological analysis.

【0053】次に、構文解析を行う。構文解析では、形
態素解析された品詞情報を含む形態素列に、構文規則、
構文解析辞書を適用し、各形態素間の修飾関係を解析す
ると共に、格の意味的な役割を決定し、構文解析木を形
成する。例えば、図8(b)のような形態素解析結果は、
図8(c)で示される構文解析木からなる構文解析結果を
得る。ここで、「S」は文を、「NP」は名詞句を、「AD
V」は副詞を、「VP」は動詞句をそれぞれ表す。次に、
依存構造解析を行う。構造解析では、構文解析の解析結
果である構文解析木に基づき依存構造を形成する。図8
(c)の構文解析結果に対して依存構造解析を行うと、図
9(a)に示されるような依存構造が得られる。ここで、
「PRED」は述部を、「NOM」は依存構造名詞句を、「AD
V」は副詞をそれぞれ表す。
Next, syntax analysis is performed. In the parsing, the morphological sequence including the part-of-speech information obtained by the morphological analysis includes
The parsing dictionary is applied to analyze the modification relation between each morpheme, determine the semantic role of the case, and form a parsing tree. For example, a morphological analysis result as shown in FIG.
A parsing result consisting of the parsing tree shown in FIG. 8C is obtained. Where "S" is a sentence, "NP" is a noun phrase, and "AD
“V” represents an adverb, and “VP” represents a verb phrase. next,
Perform dependency structure analysis. In the structural analysis, a dependency structure is formed based on a parse tree that is a result of parsing. FIG.
When the dependency structure analysis is performed on the syntax analysis result of (c), a dependency structure as shown in FIG. 9A is obtained. here,
"PRED" is a predicate, "NOM" is a dependent structure noun phrase, and "AD
"V" represents an adverb.

【0054】本実施の形態では、中間形式表現として文
の依存構造の表現を用い、前記のように文章を解析した
結果得られる、依存構造で表現された文章の意味内容を
表すデータを、中間形式文書データとして用いることに
する。具体的には、図10(a)に記載するような構造要
素1005の集合として記憶する。各構造要素1005は構造種
別1001と、格情報1002と、辞書ポインター1003と、従属
構造数1004の4つの項目を持つ。構造種別1001は述部と
か、名詞句とかの種別をフラグとして記憶する。格情報
1002は主格とか目的格、あるいは様態などの格の種別情
報を必要に応じてフラグとして記憶する。辞書ポインタ
ー1003は、その構造要素に対応した単語の情報を収納し
ている辞書データへのポインターを記憶する。従属構造
数1004は、その構造要素に直接従属する構造要素がいく
つあるかを記憶する。なお、従属構造数1004は、その構
造要素に従属する構造要素にさらに従属する、つまり、
入れ子として間接的に従属する要素の個数は含まない。
In the present embodiment, an expression of the dependency structure of a sentence is used as an intermediate form expression, and data representing the semantic content of the sentence expressed by the dependency structure, which is obtained as a result of analyzing the sentence as described above, is converted into an intermediate form. It will be used as formal document data. Specifically, it is stored as a set of structural elements 1005 as shown in FIG. Each structural element 1005 has four items of a structure type 1001, case information 1002, a dictionary pointer 1003, and a dependent structure number 1004. The structure type 1001 stores a type such as a predicate or a noun phrase as a flag. Case information
Reference numeral 1002 stores case type information such as a nominative case, a purpose case, or a form as a flag as necessary. The dictionary pointer 1003 stores a pointer to dictionary data containing information on a word corresponding to the structural element. The dependent structure number 1004 stores how many structural elements directly depend on the structural element. Note that the number of dependent structures 1004 further depends on the structural element that depends on the structural element, that is,
It does not include the number of indirectly dependent elements as nests.

【0055】例えば、図9(a)に示された依存構造を記
憶した場合は、図10(b)のようなデータとなる。ここ
で、「K1」は主格を、「K2」は目的格を、「K3」は様態
の格を表す。また、辞書ポインターは、図10(c)に例
示された辞書データの番号1006を表している。辞書デー
タには、原文書で用いられた言語の単語1007と、その品
詞1008、及び他の言語の対応する単語1009や、さらに、
各種の文法情報などが記憶される。図10(c)では、他
の言語が英語である場合の例示である。なお、中間形式
文書データとしては前記の方法以外に、人工的に定義さ
れた可読性のある言語(以下、共通言語という)を、中間
形式表現として用い、その言語で記述された文書データ
を中間形式文書データとして用いてもよい。例えば、特
開平6-325080号公報に開示されているような、人工的に
設計した言語で記述した文章を中間形式文書データとし
てもよい。
For example, when the dependency structure shown in FIG. 9A is stored, the data becomes as shown in FIG. 10B. Here, “K1” represents the nominative case, “K2” represents the purpose case, and “K3” represents the form case. The dictionary pointer indicates the number 1006 of the dictionary data illustrated in FIG. The dictionary data includes words 1007 in the language used in the original document, their parts of speech 1008, and corresponding words 1009 in other languages,
Various grammatical information and the like are stored. FIG. 10C illustrates an example in which the other language is English. In addition, as the intermediate format document data, in addition to the above-described method, an artificially defined readable language (hereinafter, referred to as a common language) is used as the intermediate format expression, and the document data described in the language is converted into the intermediate format. It may be used as document data. For example, a sentence described in an artificially designed language as disclosed in Japanese Patent Application Laid-Open No. 6-325080 may be used as the intermediate format document data.

【0056】次に、S604の検索文字列の中間形式に変換
する処理を図10を使用して説明する。本実施の形態で
は、中間形式文書データとして、上述した文の依存構造
の表現を用いている。従って、検索文字列を単語の情報
を収納している辞書(図10(c))上で検索し、一致
した辞書データへのポインタが検索文字列の中間表現で
ある。例えば、検索文字列を「林檎」とした場合、「林
檎」が登録された辞書データへのポインタ"003"がその
中間表現となる。
Next, the process of converting the search character string into the intermediate format in S604 will be described with reference to FIG. In the present embodiment, the expression of the dependency structure of the sentence described above is used as the intermediate format document data. Therefore, a search character string is searched in a dictionary (FIG. 10C) containing word information, and a pointer to the matched dictionary data is an intermediate expression of the search character string. For example, when the search character string is “apple”, a pointer “003” to dictionary data in which “apple” is registered is an intermediate expression.

【0057】次に、S606の中間形式文書の検索処理を図
10を使用して説明する。中間形式文書の検索処理は、
中間形式文書データ記憶部203Cに記憶された中間形式文
書データから、検索文字列を含む中間形式文書データを
選出する処理である。そして、検索文字列を中間表現化
した結果である辞書データへのポインタが中間形式文書
データに対応する構造要素1005の集合の辞書ポインタ10
03の何れかと一致すれば、その中間形式文書データは、
検索文字列を含んでいると判断できる。例えば、検索文
字列「林檎」を検索するとした場合、図10(b)に
は、辞書ポインタとして検索文字列「林檎」をS604で中
間表現に変換した辞書データへのポインタ"003"を含ん
でいる。従って、図10(b)に示した中間言語文書デ
ータは、検索文字列「林檎」を含んでいると判断でき
る。
Next, the search processing of the intermediate format document in S606 will be described with reference to FIG. The search process for intermediate format documents
This is a process of selecting intermediate format document data including a search character string from the intermediate format document data stored in the intermediate format document data storage unit 203C. Then, the pointer to the dictionary data as a result of the intermediate representation of the search character string is the dictionary pointer 10 of the set of the structural elements 1005 corresponding to the intermediate format document data.
If any of 03 matches, the intermediate format document data is
It can be determined that the search string is included. For example, when the search character string “apple” is searched, FIG. 10B includes a pointer “003” to the dictionary data obtained by converting the search character string “apple” into an intermediate expression in S604 as a dictionary pointer. I have. Therefore, it can be determined that the intermediate language document data shown in FIG. 10B includes the search character string “apple”.

【0058】次に、S605の目標言語文書生成処理の詳細
を、図7及び図9とを用いて説明する。目標言語文書生
成処理は、本発明の目標言語文書生成手段の主体をなす
目標言語文書生成プログラムが行う処理である。先ず、
S606にて検索された中間形式文書データに対し、構文生
成処理を行う(S701)。構文生成処理では、中間形式文書
データに記述された依存構造に基づいて、生成規則デー
タを参照しつつ目標言語の構文木を生成し、語順を決定
する。次に、形態素生成処理を行い(S702)、単語の語尾
等を必要に応じて変化させ、生成文書データの生成を完
了する。目標言語が英語である一例を挙げれば、図9
(a)で示される依存構造の文に対して、構文生成処理
と、形態素生成処理の処理を行うと、図9(b)に示され
るような目標言語文書生成結果が得られることとなる。
ここで、「PRON」は代名詞、「V」は動詞、「ART」は冠
詞、「N」は名詞をそれぞれ表す。
Next, the details of the target language document generation processing in S605 will be described with reference to FIGS. The target language document generation process is a process performed by a target language document generation program which is a subject of a target language document generation unit of the present invention. First,
A syntax generation process is performed on the intermediate format document data searched in S606 (S701). In the syntax generation processing, a syntax tree of the target language is generated based on the dependency structure described in the intermediate format document data while referring to the generation rule data, and the word order is determined. Next, morpheme generation processing is performed (S702), and the ending of the word is changed as necessary, thereby completing the generation of the generated document data. As an example where the target language is English, FIG.
When the syntax generation processing and the morpheme generation processing are performed on the sentence having the dependency structure shown in (a), a target language document generation result as shown in FIG. 9B is obtained.
Here, “PRON” represents a pronoun, “V” represents a verb, “ART” represents an article, and “N” represents a noun.

【0059】なお、本実施の形態においては、中間形式
文書データとして記憶されている依存構造データをその
まま構文生成処理への入力としたが、構文生成処理への
入力の前に依存構造変換処理を行ってもよい。これは具
体的には、中間形式文書データに記憶されている文章の
依存構造をそのまま用いるのではなく、中間形式変換手
段に対応する依存構造変換処理を行い、目標言語に対応
した依存構造に変換してから、構文生成処理への入力と
する。
In this embodiment, the dependency structure data stored as the intermediate format document data is directly input to the syntax generation processing. However, the dependency structure conversion processing is performed before the input to the syntax generation processing. May go. Specifically, instead of using the dependency structure of the sentence stored in the intermediate format document data as it is, a dependency structure conversion process corresponding to the intermediate format conversion means is performed and converted into a dependency structure corresponding to the target language. Then, it is input to the syntax generation processing.

【0060】なお、本実施の形態に係る前記の形態素解
析処理、構文解析処理、依存構造解析処理、構文生成処
理、及び形態素生成処理のそれぞれは、電子技術総合研
究所と京都大学による「日英科学技術文献の速報システ
ムに関する研究−言語処理システムの開発に関する報告
書」や、特開昭62-203273号公報に開示されている公知
の技術である。
Each of the morphological analysis processing, syntactic analysis processing, dependency structure analysis processing, syntax generation processing, and morphological generation processing according to the present embodiment is described in Japanese and English by the Electronic Technology Research Institute and Kyoto University. This is a well-known technique disclosed in "Research on a Bulletin System for Science and Technology Literature-Report on Development of Language Processing System" and JP-A-62-203273.

【0061】[0061]

【発明の効果】以上説明したことから明らかなように、
本発明宇の請求項1に記載の多言語対応通信システム
は、クライアント装置から自然言語で記述した検索文字
列を指定でき、それに従って中間形式文書データの形式
で記憶された文書データから、その検索文字列を含む文
書データを検索でき、多くの文書データを参照すること
なく、所望の文書データの閲覧を容易に行うことができ
る。
As is apparent from the above description,
The multilingual communication system according to claim 1 of the present invention can specify a search character string described in a natural language from a client device, and search the document data stored in an intermediate format document data in accordance therewith. Document data including a character string can be searched, and desired document data can be easily browsed without referring to a large amount of document data.

【0062】また、請求項2に記載の多言語対応通信シ
ステムは、サーバ装置が検索結果として、検索文字列を
記述した自然言語と同じ言語で記述した文書データを生
成し、この文書データをクライアント装置で出力できる
ので、サーバー装置に多数の言語で記述した文書データ
を保存したり、クライアント装置に言語翻訳プログラム
を搭載することなく、所望の言語で表記された所望の文
書データの閲覧を容易に行うことができる。
Further, in the multilingual communication system according to the second aspect, the server device generates, as a search result, document data described in the same language as the natural language in which the search character string is described, and transmits the document data to the client. Because it can be output by the device, it is easy to browse the desired document data written in the desired language without storing the document data described in many languages on the server device or installing a language translation program on the client device. It can be carried out.

【0063】また、請求項3に記載の多言語対応通信シ
ステムは、クライアント装置から検索結果を表記する言
語を指示出来でき、サーバ装置が検索結果として、その
指示された言語で記述した文書データを生成し、クライ
アント装置で出力できるので、サーバー装置に多数の言
語で記述した文書データを保存したり、クライアント装
置に言語翻訳プログラムを搭載することなく、検索文字
列に使用した言語と異なる所望の言語で表記された所望
の文書データの閲覧を容易に行うことがでる。
Further, in the multilingual communication system according to the third aspect, the language in which the search result is described can be specified from the client device, and the server device can output the document data described in the specified language as the search result. Because it can be generated and output by the client device, the desired language different from the language used for the search string can be stored without storing document data described in many languages on the server device or installing a language translation program on the client device. It is possible to easily browse the desired document data indicated by.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態の多言語対応通信システム
の概要を示す説明図である。
FIG. 1 is an explanatory diagram showing an outline of a multilingual communication system according to an embodiment of the present invention.

【図2】本実施の形態のサーバー装置のブロック図であ
る。
FIG. 2 is a block diagram of a server device according to the present embodiment.

【図3】本実施の形態のクライアント装置のブロック図
である。
FIG. 3 is a block diagram of a client device according to the present embodiment.

【図4】本実施の形態のサーバー装置とクライアント装
置の処理の流れを示すフローチャートである。
FIG. 4 is a flowchart illustrating a processing flow of a server device and a client device according to the present embodiment.

【図5】本実施の形態の検索文要求の説明図である。FIG. 5 is an explanatory diagram of a search sentence request according to the present embodiment.

【図6】本実施の形態の中間表現検索処理のフローチャ
ートである。
FIG. 6 is a flowchart of an intermediate expression search process according to the embodiment.

【図7】本実施の形態の目標言語文書生成処理のフロー
チャートである。
FIG. 7 is a flowchart of target language document generation processing according to the present embodiment.

【図8】本実施の形態の中間形式文書データの説明に供
する説明図である。
FIG. 8 is an explanatory diagram for explaining intermediate format document data according to the embodiment;

【図9】本実施の形態の中間形式文書データと、目標言
語文書生成処理の説明に供する説明図である。
FIG. 9 is an explanatory diagram for explaining intermediate format document data and target language document generation processing according to the embodiment;

【図10】本実施の形態の中間形式文書データの説明に
供する説明図である。
FIG. 10 is an explanatory diagram for explaining intermediate format document data according to the embodiment;

【図11】従来の多言語対応通信システムの概要を示す
説明図である。
FIG. 11 is an explanatory diagram showing an outline of a conventional multilingual communication system.

【符号の説明】[Explanation of symbols]

101 通信ネットワーク 102 サーバー装置 103 クライアント装置 202 ROM 203 RAM 204 CPU 203d 中間形式文書データ記憶部 101 Communication Network 102 Server Device 103 Client Device 202 ROM 203 RAM 204 CPU 203d Intermediate Format Document Data Storage

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 クライアント装置と、前記クライアント
装置からの検索要求に応じた検索結果を前記クライアン
ト装置に送信するサーバー装置とから構成される多言語
対応通信システムであって、 前記クライアント装置は、 検索文字列と、前記検索文字列の記述言語を指示する検
索言語情報とからなる検索要求を前記サーバー装置に送
信する検索要求送信手段と、 前記サーバー装置より前記検索結果を受信する検索結果
受信手段と、 前記検索結果受信手段が受信した検索結果を出力する検
索結果出力手段とを備え、 前記サーバー装置は、 前記クライアント装置から検索要求を受信する検索要求
受信手段と、 少なくとも一つの文書データを、自然言語で記述された
文書を文法的、意味的に解析した結果として得られる中
間形式表現で記述した中間形式文書データとして記憶す
る中間形式文書記憶手段と、 前記検索要求に含まれる前記検索言語情報に従い、前記
検索文字列を前記中間形式表現で記述した中間形式検索
文字列に変換する検索文字列変換手段と、 前記中間形式文書記憶手段に記憶された中間形式文書デ
ータより、前記中間形式検索文字列を含む中間形式文書
データを検索する中間形式検索手段と、 前記中間形式検索手段の検索結果を、前記クライアント
装置に送信する検索結果送信手段と、 を備えたことを特徴とする多言語対応通信システム。
1. A multilingual communication system comprising: a client device; and a server device for transmitting a search result in response to a search request from the client device to the client device, wherein the client device comprises: A search request transmitting unit that transmits a search request including a character string and search language information indicating a description language of the search character string to the server device; and a search result receiving unit that receives the search result from the server device. A search result receiving unit that outputs a search result received by the search result receiving unit, the server device includes: a search request receiving unit that receives a search request from the client device; and at least one document data, It is described in an intermediate form expression obtained as a result of grammatically and semantically analyzing a document described in a language. Intermediate format document storage means for storing as intermediate format document data; search character string conversion for converting the search character string into an intermediate format search character string described in the intermediate format expression in accordance with the search language information included in the search request Means, from the intermediate format document data stored in the intermediate format document storage device, an intermediate format search device for searching for intermediate format document data including the intermediate format search character string, and a search result of the intermediate format search device. A multi-language communication system, comprising: a search result transmission unit that transmits the search result to the client device.
【請求項2】 前記サーバー装置は、 前記中間形式検索手段により検索された中間形式文書デ
ータから、前記検索言語情報に対応した言語で記述した
文書データを生成する目標言語文書生成手段を備え、 前記検索結果送信手段は、前記目標言語文書生成手段が
生成した文書データを検索結果として、前記クライアン
ト装置に送信することを特徴とする請求項1に記載の多
言語対応通信システム。
2. The server device further comprises: target language document generation means for generating document data described in a language corresponding to the search language information from the intermediate format document data retrieved by the intermediate format retrieval means; The multilingual communication system according to claim 1, wherein the search result transmitting unit transmits the document data generated by the target language document generating unit to the client device as a search result.
【請求項3】 前記クライアント装置の検索要求送信手
段は、前記検索文字列及び検索言語情報に加えて、目標
言語情報を含む検索要求を送信するように構成されると
共に、前記サーバー装置の検索要求受信手段は、前記検
索要求を受信するように構成され、 前記サーバー装置は、 前記中間形式検索手段により検索された中間形式文書デ
ータから、前記目標言語情報に対応した言語で記述した
文書データを生成する目標言語文書生成手段を備え、 前記検索結果送信手段は、前記目標言語文書生成手段が
生成した文書データを検索結果として、前記クライアン
ト装置に送信することを特徴とする請求項1に記載の多
言語対応通信システム。
3. The search request transmitting unit of the client device is configured to transmit a search request including target language information in addition to the search character string and the search language information, and the search request of the server device. The receiving means is configured to receive the search request, and the server device generates document data described in a language corresponding to the target language information from the intermediate format document data searched by the intermediate format searching means. 2. The method according to claim 1, further comprising: a target language document generation unit that transmits the document data generated by the target language document generation unit to the client device as a search result. Language compatible communication system.
JP03370897A 1996-12-03 1997-02-18 Multilingual communication system Expired - Fee Related JP3434161B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP03370897A JP3434161B2 (en) 1997-02-18 1997-02-18 Multilingual communication system
US08/984,293 US6092035A (en) 1996-12-03 1997-12-03 Server device for multilingual transmission system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03370897A JP3434161B2 (en) 1997-02-18 1997-02-18 Multilingual communication system

Publications (2)

Publication Number Publication Date
JPH10232869A true JPH10232869A (en) 1998-09-02
JP3434161B2 JP3434161B2 (en) 2003-08-04

Family

ID=12393924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03370897A Expired - Fee Related JP3434161B2 (en) 1996-12-03 1997-02-18 Multilingual communication system

Country Status (1)

Country Link
JP (1) JP3434161B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG100613A1 (en) * 2000-02-23 2003-12-26 Hitachi Ltd Data processing method and system, program for realizing the method, and computer readable storage medium storing the program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG100613A1 (en) * 2000-02-23 2003-12-26 Hitachi Ltd Data processing method and system, program for realizing the method, and computer readable storage medium storing the program

Also Published As

Publication number Publication date
JP3434161B2 (en) 2003-08-04

Similar Documents

Publication Publication Date Title
US6092035A (en) Server device for multilingual transmission system
JP3066274B2 (en) Machine translation equipment
EP0519049B1 (en) Machine translation and telecommunications system
US6301554B1 (en) Language translation using a constrained grammar in the form of structured sentences formed according to pre-defined grammar templates
US20020002452A1 (en) Network-based text composition, translation, and document searching
EP0940762A2 (en) Multilingual patent information search system
US20080040097A1 (en) System, method and program product for bidirectional text translation
JP2000200291A (en) Method for automatically detecting selected character string in text
JPS6231467A (en) Sentence preparation device
US20020152258A1 (en) Method and system of intelligent information processing in a network
JP3467160B2 (en) Multilingual communication system, server device, and document transmission method for server device
JPH0261763A (en) Mechanical translation equipment
JP3467159B2 (en) Multilingual communication system, server device, and document transmission method for server device
JP3434161B2 (en) Multilingual communication system
JPH10222516A (en) Multilingual correspondence communication system
JPH10187732A (en) Multilingual communication system
JP2003296327A (en) Translation server, genre-classified online machine translation method, and program therefor
KR100836159B1 (en) System and method for semi-automatic translating service
JPH10222513A (en) Multilingual correspondence communication system
JP3467161B2 (en) Multilingual communication system, server device, and document transmission method for server device
JPH10207892A (en) Multilingual communication system
JPH10214266A (en) Communication system dealing with multiple languages
JPH10187731A (en) Multilingual communication system
JPH08305728A (en) Inter multilingual retrieving system
JP3174664B2 (en) Machine translation equipment

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030513

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080530

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees