JP3434161B2 - 多言語対応通信システム - Google Patents

多言語対応通信システム

Info

Publication number
JP3434161B2
JP3434161B2 JP03370897A JP3370897A JP3434161B2 JP 3434161 B2 JP3434161 B2 JP 3434161B2 JP 03370897 A JP03370897 A JP 03370897A JP 3370897 A JP3370897 A JP 3370897A JP 3434161 B2 JP3434161 B2 JP 3434161B2
Authority
JP
Japan
Prior art keywords
search
document data
intermediate format
language
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03370897A
Other languages
English (en)
Other versions
JPH10232869A (ja
Inventor
則久 藤井
敦彦 倉知
淳 河合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP03370897A priority Critical patent/JP3434161B2/ja
Priority to US08/984,293 priority patent/US6092035A/en
Publication of JPH10232869A publication Critical patent/JPH10232869A/ja
Application granted granted Critical
Publication of JP3434161B2 publication Critical patent/JP3434161B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、翻訳機能を有する
ことにより所望の言語による文書データを提供すること
が可能なサーバー装置と、前記文書データの表示が可能
なクライアント装置とを通信ネットワークを介して接続
した多言語対応通信システムに関するものである。
【0002】
【従来の技術】従来、インターネットに代表されるよう
に、通信ネットワークを介して、文書データを検索、閲
覧するシステムが普及している。この様なシステムは、
各種の文書データを記憶する少なくとも1つのサーバー
装置と、文書データの表示が可能な少なくとも1つのク
ライアント装置と、それらを接続する通信ネットワーク
とで構成される。通信ネットワークは、公衆回線網や、
専用回線網あるいはその組み合わせから構成される。サ
ーバー装置は、各種の文書データが記憶できる記憶装置
と、通信ネットワークへの接続装置とを備え、クライア
ント装置は文書データを表示可能な表示装置と、閲覧し
たい文書の指示情報を入力できる入力装置と、通信ネッ
トワークへの接続装置とを備える。
【0003】例えば、インターネットでは、サーバー装
置、クライアント装置共に非常に多くの装置が接続され
ており、その所在地も全世界に広がっている。そして、
それらを接続する通信ネットワークを介して世界各地の
様々な情報を、検索、閲覧することが可能なシステムと
なっている。
【0004】このようなインターネットでは、図11に
示すように、各サーバー装置1102には、英語とか、日本
語、中国語等の様々な言語で記述された文書データが記
憶されている。通信ネットワーク1101を介してサーバー
装置に接続されているクライアント装置1103では、これ
らの様々な言語で記述された文書データをそれぞれの言
語で表示することが可能である。また、言語翻訳プログ
ラムを内蔵するクライアント装置もあり、必要に応じて
所望の言語に翻訳して文書データを表示することも可能
である。
【0005】
【発明が解決しようとする課題】上述したシステム、特
に、インターネットのように全世界に広がったネットワ
ークを介して様々な文書データを閲覧する場合、文書デ
ータの提供者と、その文書データの閲覧者とは異なる言
語を母国語としていることが多い。しかし、母国語以外
の言語での記述や、その理解には困難を伴うことが多
い。これを解決するため、次の2つの方法が知られてい
る。1つは、同一内容の文書を複数の言語で記述された
複数の文書データとしてサーバー装置に記憶させ、所望
の言語の文書データをクライアント装置から選択するこ
とで、所望の言語で記述された文書データを閲覧可能と
する方法である。他の方法は、言語翻訳プログラムをク
ライアント装置に搭載し、その言語翻訳プログラムを用
いてサーバーから送信されてきた文書データを所望する
言語の文書データに翻訳する方法である。これらの方法
により、母国語以外の言語で記述された文書データも母
国語で閲覧可能となる。しかし、その場合でも以下のよ
うな問題が残されている。
【0006】先ず、同一内容の文書を複数の言語で記述
された複数の文書データとしてサーバー装置に記憶させ
る方法では、1つの内容の文書でも、その内容を様々な
言語で記述された複数の文書データとして作成する必要
があり、多くの費用と労力を必要とする問題がある。
【0007】また、言語翻訳プログラムをクライアント
装置に搭載する方法では、各サーバーにより提供される
様々な言語の文章をすべて翻訳して表示するためには、
クライアント装置にそれぞれの言語から所望の言語へ翻
訳可能な多数の言語翻訳プログラムを搭載する必要があ
る。これはクライアント装置のコストを上昇させること
になる。また、現在実用化されている言語翻訳プログラ
ムでは、翻訳する原文書に元来含まれている曖昧さによ
り、望ましい翻訳結果が得られないと言う問題もある。
【0008】これを解決するために、本出願人が既に出
願した特願平8−322842号には、サーバー装置に
記憶される文書データを、自然言語で記述された文書デ
ータではなく、自然言語で記述された文書データを文法
的、意味的に解析した結果として得られる中間形式文書
データとして記憶する。そして、クライアント装置から
文書データの要求があると、その文書データに対応した
中間形式文書データを記憶装置から読み出し、読み出し
た中間形式文書データからクライアント装置が要求する
自然言語で記述された文書データを生成し、生成された
文書データをクライアント装置に送信する。このよう
に、クライアント装置に特別な言語翻訳プログラムを必
要とせず、かつ多数の言語で記述される文書データをよ
り簡易に提供可能な多言語対応通信システムが記述され
ている。
【0009】しかし、この既提案の多言語対応通信シス
テムにおいても、次のような問題点が残されている。
【0010】多言語対応通信システムの利用者が、サー
バー装置に記憶された複数の中間形式文書データの中か
ら、所望する文書データを探し出すためには、サーバ装
置は、全ての中間形式文書データから自然言語で記述さ
れた文書データを生成する必要があった。さらに、利用
者は、その生成された全ての文書データの内容を逐次参
照し、要否を判断する必要があった。
【0011】本発明は、上述した問題点を解決するため
になされたものであり、サーバー装置に記憶された中間
形式文書データから、所望する文書データを容易に検索
可能な多言語対応通信システムを提供することを目的と
していいる。
【0012】
【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に記載の多言語対応通信システム
は、前記クライアント装置と、前記クライアント装置か
らの検索要求に応じた検索結果を前記クライアント装置
に送信するサーバー装置とから構成される。前記クライ
アント装置では、検索要求送信手段が検索文字列と、前
記検索文字列の記述言語を指示する検索言語情報とから
なる検索要求を前記サーバー装置に送信し、前記検索結
果受信手段が前記サーバー装置より前記検索結果を受信
し、検索結果出力手段が、前記検索結果受信手段により
受信した検索結果としての表示出力、印字出力、音声出
力等の出力処理を行う。
【0013】一方、前記サーバー手段では、検索要求受
信手段がクライアント装置から検索要求を受信し、中間
形式文書記憶手段が、少なくとも一つの文書データを、
自然言語で記述された文書を文法的、意味的に解析した
結果として得られる中間形式表現で記述した中間形式文
書データとして記憶し、検索文字列変換手段が、前記検
索要求に含まれる前記検索言語情報に従い、前記検索文
字列を前記中間形式表現で記述した中間形式検索文字列
に変換し、中間形式検索手段が、前記中間形式文書記憶
手段に記憶された中間形式文書データより、前記中間形
式検索文字列を含む中間形式文書データを検索し、その
検索結果を文書送信手段が前記クライアント装置に送信
する。
【0014】このように、クライアントから所望の言語
で記述した検索文字列を指定でき、それにより中間形式
文書データの形式で記憶された文書データから所望の文
書データを検索し、その検索結果をクライアント装置で
出力できるので、サーバー装置に多数の言語で記述した
文書データを保存したり、クライアント装置に言語翻訳
プログラムを搭載することなく、所望の言語での文書デ
ータの検索を容易に行うことができる。
【0015】また、請求項2に記載の多言語対応通信シ
ステムでは、前記サーバー装置において、目標言語文書
生成手段が、前記中間形式検索手段により検索された中
間形式文書データから、前記検索言語情報に対応した言
語で記述した文書データを生成し、前記検索結果送信手
段は、前記目標言語文書生成手段が生成した文書データ
を検索結果として前記クライアント装置に送信する。
【0016】このように、検索結果として検索文字列を
記述した自然言語により記述された文書データが得られ
るので、直ちに検索結果の文書データを参照することが
出来る。
【0017】さらに、請求項3に記載の多言語対応通信
システムでは、前記クライアント装置において、検索要
求送信手段が、前記検索文字列及び検索言語情報に加え
て、目標言語情報を含む検索要求を送信し、前記サーバ
ー装置では、検索要求受信手段が、前記検索要求を受信
すると共に、目標言語文書生成手段が、前記中間形式検
索手段により検索された中間形式文書データから、前記
目標言語情報に対応した言語で記述した文書データを生
成する。
【0018】このように、検索結果として目標言語情報
で指示した自然言語により記述された文書データが得ら
れるので、所望した自然言語で検索結果を参照すること
が出来る。
【0019】
【発明の実施の形態】以下に、本発明の多言語対応通信
システムを具体化した実施の形態について図面を参照し
て説明する。
【0020】図1に本実施の形態の多言語対応通信シス
テムの概念図を示す。サーバー装置102は、文書データ
を、特定の自然言語によらない中間形式文書データ(詳
細は後述)として記憶している。また、クライアント装
置より送信された検索文字列を中間形式に変換する検索
文字列変換プログラムと、中間形式に変換された検索文
字列を含む文書データを中間形式文書データより検索す
る中間形式文書検索プログラムも記憶している。クライ
アント装置103は通信ネットワーク101を介して、文書デ
ータを検索する為の検索文字列と、その検索文字列の記
述言語の指示情報とからなる検索要求を所望のサーバー
装置102に送信する。サーバー装置102は、クライアント
装置103から送信された検索要求に基づいて、指定され
た中間形式文書データから検索文字列を含む文書データ
を検索し、検索結果を通信ネットワーク101を介してク
ライアント装置103に送信する。そして、クライアント
装置は、その検索結果を受信し、表示出力、印字出力、
音声出力等の出力を行う。
【0021】図2には本発明を好適に適用した実施の形
態のサーバー装置のブロック図を示す。
【0022】サーバー装置102は、ROM202と、RAM203、C
PU204、表示制御部205、入力部206、通信制御部207及び
それらを接続するバス209により構成される。CPU204
は、記憶されている各種のプログラムに基づいて様々な
制御を実行し、本サーバー装置102の動作の主体をなし
ている。表示制御部205は、表示データの蓄積とディス
プレイモニターの制御を行い、モニター208に表示出力
を行う。モニター208は、CRTディスプレイや、LCDディ
スプレイなど様々な表示装置を利用できる。入力部206
は、記憶される文書データの入力や、サーバー装置102
への指示を入力するためのものであり、キーボード装置
である。通信制御部207は、通信網210と接続される。通
信網210は、公衆回線や、専用回線の回線網であり、通
信ネットワーク101の構成要素である。通信制御部207
は、通信網210とサーバー装置102とのデータ通信を制御
し、データの送受信を行う。通信制御部207は、公衆回
線や専用回線と接続するためのモデム装置である。
【0023】なお、入力部206は、前記構成以外に、マ
ウス装置などの指示装置や、音声入力装置、タッチパネ
ル装置などの様々な入力装置や、その組み合わせで構成
してもよい。また、通信制御部207は、無線の公衆回線
や専用回線と接続するための送受信装置とか、LAN(Loca
l Area Network)に接続するためのイーサーネット接続
装置、トークンリング接続装置とか、ATM(Asynchronous
Transfer Mode)回線網への接続装置等、様々な接続装
置でもよい。
【0024】ROM202は各種プログラムや、翻訳辞書のデ
ータ等を記憶している。
【0025】ROM202内にはさらに各種の記憶部が形成さ
れている。通信制御プログラム記憶部202aは、通信制御
部207を介した各種通信の制御や、クライアント装置か
らの検索要求の受信や、検索結果のクライアント装置へ
の送信処理等を行う通信制御プログラムを記憶してい
る。通信制御プログラムと、通信制御部207とが本発明
の検索要求受信手段と、検索結果送信手段との主体をな
す。
【0026】検索文字列変換プログラム記憶部は202b
は、クライアント装置から受信した検索要求に含まれる
検索文字列を、中間形式(詳細は後述)に変換する検索文
字列変換プログラムを記憶する。この検索文字列変換プ
ログラムが本発明の検索文字列変換手段の主体をなす。
本実施の形態では、変換する検索文字列を記述した自然
言語の種類に応じて検索文字列変換プログラムが別にな
っているものとし、検索文字列変換プログラム記憶部20
2bは、検索文字列を記述した自然言語に応じた少なくと
も1つの検索文字列変換プログラムを記憶する。なお、
前記以外に、検索文字列を記述した各自然言語に対応し
た別々の検索文字列変換プログラムを用いるのではな
く、全ての自然言語に対応できる単一の検索文字列変換
プログラムを用い、検索文字列変換プログラム記憶部20
2bはその単一の検索文字列変換プログラムを記憶しても
よい。あるいは、言語構造として類似した複数の自然言
語に対応可能な検索文字列変換プログラムを用い、それ
を記憶してもよい。
【0027】中間形式文書検索プログラム記憶部は202c
は、中間形式に変換された検索文字列を含む中間形式文
書データを検索するための中間形式文書検索プログラム
を記憶する。この中間形式文書検索プログラムが本発明
の中間形式検索手段の主体をなす。
【0028】また、目標言語文書生成プログラム記憶部
202dは、中間形式文書データから、各種の目標言語文書
データを生成するための目標言語文書生成プログラムを
記憶する。なお、目標言語文書生成プログラムが本発明
の目標言語文書生成手段の主体をなす。本実施の形態で
は、生成する文書の目標言語の種類に応じて目標言語文
書生成プログラムが別になっているものとし、目標言語
文書生成プログラム記憶部202dは、生成する文書の目標
言語に応じた少なくとも1つの目標言語文書生成プログ
ラムを記憶する。なお、前記以外に、各目標言語に対応
した別々の目標言語文書生成プログラムを用いるのでは
なく、全ての目標言語に対応できる単一の目標言語文書
生成プログラムを用い、目標言語文書生成プログラム記
憶部202dはその単一の目標言語文書生成プログラムを記
憶してもよい。あるいは、言語構造として類似した複数
の目標言語に対応可能な目標言語文書生成プログラムを
用い、それを記憶してもよい。
【0029】翻訳辞書記憶部202eは、目標言語文書生成
プログラムが処理を行う場合に必要とされる、目標言語
に対応した生成規則データ、形態素生成辞書などの各種
データを記憶している。さらに、翻訳辞書記憶部202e
は、検索文字列変換プログラムが処理を行う場合に必要
とされる辞書などの各種データも記憶している。
【0030】なお、ROM202は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
【0031】RAM203は、中間形式文書データ等のデータ
の保存や、様々な一時データを記憶するために使用さ
れ、次のような各記憶部が内部に形成されている。
【0032】ワークメモリ203aは各プログラムが動作時
に必要とする一時的な記憶領域を提供する。生成文書メ
モリ203bは、中間形式文書データ記憶部203cに記憶され
た中間形式文書データに基づいて、目標言語文書生成プ
ログラム記憶部202dに記憶された目標言語文書生成プロ
グラムが生成した目標言語文書データを一時的に記憶す
る。
【0033】中間形式文書データ記憶部203cは、中間形
式文書データを少なくとも1つ記憶している。中間形式
文書データ記憶部が、本発明の中間形式文書記憶手段の
主体をなす。
【0034】なお、RAM203は、RAMに限らず、磁気ディ
スク装置や、光磁気ディスク装置等の記憶装置であって
もよい。さらに、中間形式文書データの作成を行わない
場合においては、中間形式文書データ記憶部203cはROM2
02上に形成してもよい。
【0035】次に、図3には本発明を好適に適用した実
施の形態のクライアント装置のブロック図を示す。
【0036】クライアント装置103は、ROM302と、RAM30
3、CPU304、表示制御部305、入力部306、通信制御部307
及びそれらを接続するバス309により構成される。CPU30
4は、記憶されている各種のプログラムに基づいて様々
な制御を実行し、本クライアント装置103の動作の主体
をなしている。表示制御部305は、表示データの蓄積と
ディスプレイモニターの制御を行い、モニター308に表
示出力を行う。モニター308はCRTディスプレイや、LCD
ディスプレイなど様々な表示装置を利用できる。入力部
306は、検索文字列を入力したり、クライアント装置103
への各種指示を入力するためのものであり、キーボード
装置である。通信制御部307は、通信網210と接続され、
通信網210とクライアント装置103とのデータ通信を制御
し、データの送受信を行う。通信制御部307は、公衆回
線や、専用回線と接続するためのモデム装置である。
【0037】なお、入力部306は、前記構成以外に、マ
ウス装置などの指示装置や、音声入力装置、タッチパネ
ル装置などの様々な入力装置や、その組み合わせで構成
してもよい。また、通信制御部307は、無線の公衆回線
や専用回線と接続するための送受信装置とか、LAN(Loca
l Area Network)に接続するためのイーサーネット接続
装置、トークンリング接続装置とか、ATM(Asynchronous
Transfer Mode)回線網への接続装置等、様々な接続装
置でもよい。また、表示制御部305とモニター308とを用
いる以外に、印字出力装置や、音声出力装置を用いる構
成とし、文書データを印字出力や音声出力する構成とし
てもよい。
【0038】ROM302は各種プログラムを記憶している。
【0039】ROM302内には、さらに、各種の記憶部が形
成されている。通信制御プログラム記憶部302aは、通信
制御部307を介した各種通信の制御や、サーバー装置へ
のデータ送受信処理等を行う通信制御プログラムを記憶
している。この通信制御プログラムと、通信制御部307
とが本発明の検索要求送信手段と検索結果受信手段の主
体をなす。表示プログラム記憶部302bは、サーバーから
受信した検索結果を表示制御部305を用いて表示するた
めの表示プログラムを記憶している。表示プログラム
と、表示制御部305とが本発明の検索結果出力手段の主
体をなす。
【0040】検索要求入力プログラム記憶部302cは、ユ
ーザーが入力部306を用いて、所望する文書データが含
んでいると思われる検索文字列とその検索文字列の記述
言語と検索結果の文書データの記述言語を入力する処理
を制御するための、検索要求入力プログラムを記憶す
る。
【0041】なお、ROM302は、ROMに限らず、磁気ディ
スク装置や、光磁気ディスク装置、あるいはCD-ROM記憶
装置等の記憶装置であってもよい。
【0042】RAM303は、様々な一時データを保存するた
めに使用され、次のような各記憶部が内部に形成されて
いる。ワークメモリ303aは各プログラムが動作時に必要
とする一時的な記憶領域を提供する。受信文書メモリ30
3bは、サーバー装置から受信した文書データを一時保存
する。なお、RAM303は、RAMに限らず、磁気ディスク装
置や、光磁気ディスク装置等の記憶装置であってもよ
い。
【0043】次に、サーバー装置102と、クライアント
装置103との基本的な処理の流れを図4を用いて説明す
る。先ず、クライアント装置103では、検索を行うサー
バー装置を通信ネットワーク上で一意に決定する情報で
あるサーバー装置のアドレスを入力する(S401)。本実施
の形態では、サーバー装置のアドレスとしてTCP/IP(Tra
nsmission Control Protocol/Internet Protocol)で規
定されるホスト名あるいはIPアドレスを用いるものとす
るが、他に通信ネットワーク上のアドレスを決定できる
情報であれば何でもよい。次に、所望する文書データが
含んでいると思われる検索文字列とその検索文字列を記
述する自然言語を指定する検索言語情報と検索結果の文
書データがどの自然言語によって記述されるかを指定す
る目標言語情報を入力する(S402)。
【0044】次に、入力された検索文字列と検索言語情
報と目標言語情報からなる検索要求をS401で入力された
アドレスのサーバー装置に送信する(S403)。本実施の形
態では、サーバー装置への送信方法として、TCP/IP上の
HTTP(Hyper Text Transfer Protocol)を拡張し用いると
する。具体的には、クライアント装置は、図5(a)に示
す形式のデータをサーバー装置に送信する。"SEARCH"は
検索要求を意味し、<CRLF>は、復帰改行文字を示す。"K
ey-Word:"は、次に検索文字列が続くことを示す文字列
であり、<検索文字列>には、S402で入力された検索文字
列を指定する。"Key-Language:"は、次に検索言語情報
が続くことを示す文字列であり、<検索言語>には、検
索文字列を記述する自然言語を識別する予め定められた
文字列を指定する。さらに、"Accept-Language:"は、次
に目標言語情報が続くことを示す文字列であり、<目標
言語>には、目標言語を識別する予め定められた文字列
を指定する。
【0045】図5(b)は、検索文字列としての"林檎"の
日本語を検索言語とし、英語を目標言語とした場合の例
である。なお、上述したTCP/IP及びHTTPは、既に広く実
用化された公知の技術であるため、説明を省略する。
【0046】サーバー装置では、S406でクライアント装
置から送信された検索要求の検索文字列、検索言語情
報、目標言語情報を受信し、受信した情報に基づいた検
索を行う為に中間表現検索処理を実行する(S407)。S407
の詳細は後述する。S407にて所望の検索結果が得られな
い場合は、それをエラーとして判定する(S408)。本実施
の形態では、このエラーの判定は後述するエラーフラグ
を参照することで判定する。エラーでなければ、検索結
果をクライアントに送信し(S409)、エラーならば、エラ
ー情報を送信する(S410)。クライアントでは、サーバー
から検索結果もしくはエラー情報を受信し(S404)、表示
装置に表示する(S405)。
【0047】次に、中間表現検索処理(S409)の詳細につ
いて、図6を用いて説明する。先ず、エラー状態を記憶
するために、ワークメモリ203a内に形成されたエラーフ
ラグ(図示せず)をクリアーして、エラーなしの状態とす
る(S601)。
【0048】次に、検索結果の中間言語形式文書データ
をS406にて受信した目標言語情報に基づいた目標言語の
生成が可能か否かを判定する(S602)。本実施の形態にお
いては、前述したように各目標言語毎に個別の目標言語
文書生成プログラムを持つので、S406にて受信した目標
言語情報に対応した目標言語文書生成プログラムが目標
言語文書生成プログラム記憶部202dに記憶されているか
否かで、S602の判定を行う。生成が不可能と判定された
場合(S602:No)、エラーとするためにS610に処理を進
め、可能と判断された場合は(S602:Yes)、S603に処理を
進める。
【0049】このS603では、検索文字列をS406にて受信
した検索言語情報に基づいて中間表現に変換可能か否か
を判定する(S603)。本実施の形態では、前述したように
各検索言語毎に個別の検索文字列変換プログラムを持つ
ので、S406にて受信した検索言語情報に対応した検索文
字列変換プログラムが検索文字列変換プログラム記憶部
202bに記憶されているか否かで、S603の判定を行う。変
換が不可能と判定された場合(S603:No)、エラーとする
ためにS610に処理を進め、可能と判断された場合は(S60
3:Yes)、S604に処理を進める。S604では、検索文字列を
S406で受信した検索言語情報に基づき中間形式に変換す
る。この中間形式への変換処理は、本発明の検索文字列
変換手段の主体をなす検索文字列変換プログラムが行う
処理であり、その詳細は後述する。このS604による変換
が失敗した場合(S605:No)、エラーとするためにS610に
処理を進め、成功した場合、S606に処理を進める。
【0050】次に、S606では、中間形式文書データ記憶
部に記憶された中間形式文書データに基づいてS604で中
間形式に変換された検索文字列を含む中間文書データを
検索する。この中間形式文書の検索処理は、本発明の中
間形式検索手段の主体をなす中間形式文書検索プログラ
ムが行う処理であり、その詳細は後述する。この検索の
結果、検索文字列を含む中間文書データが見つかった場
合は、S608に処理を進め、見つからなかった場合は、エ
ラーとするためにS610に処理を進める。
【0051】次に、S608では、S606の検索結果の中間言
語形式文書データから、S406で受信した目標言語情報に
従い目標言語文書データを生成する、目標言語文書生成
処理を実行する。S608の詳細は後述する。S609では、S6
08にて生成された目標言語文書データを、送信のために
一旦生成文書メモリ203bに記憶する。S610では、S602、
S603、S605とS607での判定を受けて、エラー処理をする
ためにエラーフラグをセットしてエラー状態を記憶す
る。
【0052】次に、中間形式文書データの詳細につい
て、図8、図9、図10を参照しながら説明する。中間
言語文書データは、自然言語で記述された文書データ
(以下、原文書データという)を形態素解析、構文解
析、構造解析した結果として得られる。原文書データ
は、先ず、形態素解析をされる。形態素解析は、形態素
解析辞書を参照し、原文書を形態素に分割し、形態素列
に変換し、各形態素の品詞の判定を行う。日本語から中
間形式文書データを生成する一例として、図8(a)に示
す原文書であれば、形態素解析により図8(b)のような
形態素列からなる形態素解析結果が得られる。
【0053】次に、構文解析を行う。構文解析では、形
態素解析された品詞情報を含む形態素列に、構文規則、
構文解析辞書を適用し、各形態素間の修飾関係を解析す
ると共に、格の意味的な役割を決定し、構文解析木を形
成する。例えば、図8(b)のような形態素解析結果は、
図8(c)で示される構文解析木からなる構文解析結果を
得る。ここで、「S」は文を、「NP」は名詞句を、「AD
V」は副詞を、「VP」は動詞句をそれぞれ表す。次に、
依存構造解析を行う。構造解析では、構文解析の解析結
果である構文解析木に基づき依存構造を形成する。図8
(c)の構文解析結果に対して依存構造解析を行うと、図
9(a)に示されるような依存構造が得られる。ここで、
「PRED」は述部を、「NOM」は依存構造名詞句を、「AD
V」は副詞をそれぞれ表す。
【0054】本実施の形態では、中間形式表現として文
の依存構造の表現を用い、前記のように文章を解析した
結果得られる、依存構造で表現された文章の意味内容を
表すデータを、中間形式文書データとして用いることに
する。具体的には、図10(a)に記載するような構造要
素1005の集合として記憶する。各構造要素1005は構造種
別1001と、格情報1002と、辞書ポインター1003と、従属
構造数1004の4つの項目を持つ。構造種別1001は述部と
か、名詞句とかの種別をフラグとして記憶する。格情報
1002は主格とか目的格、あるいは様態などの格の種別情
報を必要に応じてフラグとして記憶する。辞書ポインタ
ー1003は、その構造要素に対応した単語の情報を収納し
ている辞書データへのポインターを記憶する。従属構造
数1004は、その構造要素に直接従属する構造要素がいく
つあるかを記憶する。なお、従属構造数1004は、その構
造要素に従属する構造要素にさらに従属する、つまり、
入れ子として間接的に従属する要素の個数は含まない。
【0055】例えば、図9(a)に示された依存構造を記
憶した場合は、図10(b)のようなデータとなる。ここ
で、「K1」は主格を、「K2」は目的格を、「K3」は様態
の格を表す。また、辞書ポインターは、図10(c)に例
示された辞書データの番号1006を表している。辞書デー
タには、原文書で用いられた言語の単語1007と、その品
詞1008、及び他の言語の対応する単語1009や、さらに、
各種の文法情報などが記憶される。図10(c)では、他
の言語が英語である場合の例示である。なお、中間形式
文書データとしては前記の方法以外に、人工的に定義さ
れた可読性のある言語(以下、共通言語という)を、中間
形式表現として用い、その言語で記述された文書データ
を中間形式文書データとして用いてもよい。例えば、特
開平6-325080号公報に開示されているような、人工的に
設計した言語で記述した文章を中間形式文書データとし
てもよい。
【0056】次に、S604の検索文字列の中間形式に変換
する処理を図10を使用して説明する。本実施の形態で
は、中間形式文書データとして、上述した文の依存構造
の表現を用いている。従って、検索文字列を単語の情報
を収納している辞書(図10(c))上で検索し、一致
した辞書データへのポインタが検索文字列の中間表現で
ある。例えば、検索文字列を「林檎」とした場合、「林
檎」が登録された辞書データへのポインタ"003"がその
中間表現となる。
【0057】次に、S606の中間形式文書の検索処理を図
10を使用して説明する。中間形式文書の検索処理は、
中間形式文書データ記憶部203Cに記憶された中間形式文
書データから、検索文字列を含む中間形式文書データを
選出する処理である。そして、検索文字列を中間表現化
した結果である辞書データへのポインタが中間形式文書
データに対応する構造要素1005の集合の辞書ポインタ10
03の何れかと一致すれば、その中間形式文書データは、
検索文字列を含んでいると判断できる。例えば、検索文
字列「林檎」を検索するとした場合、図10(b)に
は、辞書ポインタとして検索文字列「林檎」をS604で中
間表現に変換した辞書データへのポインタ"003"を含ん
でいる。従って、図10(b)に示した中間言語文書デ
ータは、検索文字列「林檎」を含んでいると判断でき
る。
【0058】次に、S605の目標言語文書生成処理の詳細
を、図7及び図9とを用いて説明する。目標言語文書生
成処理は、本発明の目標言語文書生成手段の主体をなす
目標言語文書生成プログラムが行う処理である。先ず、
S606にて検索された中間形式文書データに対し、構文生
成処理を行う(S701)。構文生成処理では、中間形式文書
データに記述された依存構造に基づいて、生成規則デー
タを参照しつつ目標言語の構文木を生成し、語順を決定
する。次に、形態素生成処理を行い(S702)、単語の語尾
等を必要に応じて変化させ、生成文書データの生成を完
了する。目標言語が英語である一例を挙げれば、図9
(a)で示される依存構造の文に対して、構文生成処理
と、形態素生成処理の処理を行うと、図9(b)に示され
るような目標言語文書生成結果が得られることとなる。
ここで、「PRON」は代名詞、「V」は動詞、「ART」は冠
詞、「N」は名詞をそれぞれ表す。
【0059】なお、本実施の形態においては、中間形式
文書データとして記憶されている依存構造データをその
まま構文生成処理への入力としたが、構文生成処理への
入力の前に依存構造変換処理を行ってもよい。これは具
体的には、中間形式文書データに記憶されている文章の
依存構造をそのまま用いるのではなく、中間形式変換手
段に対応する依存構造変換処理を行い、目標言語に対応
した依存構造に変換してから、構文生成処理への入力と
する。
【0060】なお、本実施の形態に係る前記の形態素解
析処理、構文解析処理、依存構造解析処理、構文生成処
理、及び形態素生成処理のそれぞれは、電子技術総合研
究所と京都大学による「日英科学技術文献の速報システ
ムに関する研究−言語処理システムの開発に関する報告
書」や、特開昭62-203273号公報に開示されている公知
の技術である。
【0061】
【発明の効果】以上説明したことから明らかなように、
本発明宇の請求項1に記載の多言語対応通信システム
は、クライアント装置から自然言語で記述した検索文字
列を指定でき、それに従って中間形式文書データの形式
で記憶された文書データから、その検索文字列を含む文
書データを検索でき、多くの文書データを参照すること
なく、所望の文書データの閲覧を容易に行うことができ
る。
【0062】また、請求項2に記載の多言語対応通信シ
ステムは、サーバ装置が検索結果として、検索文字列を
記述した自然言語と同じ言語で記述した文書データを生
成し、この文書データをクライアント装置で出力できる
ので、サーバー装置に多数の言語で記述した文書データ
を保存したり、クライアント装置に言語翻訳プログラム
を搭載することなく、所望の言語で表記された所望の文
書データの閲覧を容易に行うことができる。
【0063】また、請求項3に記載の多言語対応通信シ
ステムは、クライアント装置から検索結果を表記する言
語を指示出来でき、サーバ装置が検索結果として、その
指示された言語で記述した文書データを生成し、クライ
アント装置で出力できるので、サーバー装置に多数の言
語で記述した文書データを保存したり、クライアント装
置に言語翻訳プログラムを搭載することなく、検索文字
列に使用した言語と異なる所望の言語で表記された所望
の文書データの閲覧を容易に行うことがでる。
【図面の簡単な説明】
【図1】本発明の実施の形態の多言語対応通信システム
の概要を示す説明図である。
【図2】本実施の形態のサーバー装置のブロック図であ
る。
【図3】本実施の形態のクライアント装置のブロック図
である。
【図4】本実施の形態のサーバー装置とクライアント装
置の処理の流れを示すフローチャートである。
【図5】本実施の形態の検索文要求の説明図である。
【図6】本実施の形態の中間表現検索処理のフローチャ
ートである。
【図7】本実施の形態の目標言語文書生成処理のフロー
チャートである。
【図8】本実施の形態の中間形式文書データの説明に供
する説明図である。
【図9】本実施の形態の中間形式文書データと、目標言
語文書生成処理の説明に供する説明図である。
【図10】本実施の形態の中間形式文書データの説明に
供する説明図である。
【図11】従来の多言語対応通信システムの概要を示す
説明図である。
【符号の説明】
101 通信ネットワーク 102 サーバー装置 103 クライアント装置 202 ROM 203 RAM 204 CPU 203d 中間形式文書データ記憶部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/30 G06F 13/00

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 クライアント装置と、前記クライアント
    装置からの検索要求に応じた検索結果を前記クライアン
    ト装置に送信するサーバー装置とから構成される多言語
    対応通信システムであって、 前記クライアント装置は、 検索文字列と、前記検索文字列の記述言語を指示する検
    索言語情報とからなる検索要求を前記サーバー装置に送
    信する検索要求送信手段と、 前記サーバー装置より前記検索結果を受信する検索結果
    受信手段と、 前記検索結果受信手段が受信した検索結果を出力する検
    索結果出力手段とを備え、 前記サーバー装置は、 前記クライアント装置から検索要求を受信する検索要求
    受信手段と、 少なくとも一つの文書データを、自然言語で記述された
    文書を文法的、意味的に解析した結果として得られる中
    間形式表現で記述した中間形式文書データとして記憶す
    る中間形式文書記憶手段と、 前記検索要求に含まれる前記検索言語情報に従い、前記
    検索文字列を前記中間形式表現で記述した中間形式検索
    文字列に変換する検索文字列変換手段と、 前記中間形式文書記憶手段に記憶された中間形式文書デ
    ータより、前記中間形式検索文字列を含む中間形式文書
    データを検索する中間形式検索手段と、 前記中間形式検索手段の検索結果を、前記クライアント
    装置に送信する検索結果送信手段と、 を備えたことを特徴とする多言語対応通信システム。
  2. 【請求項2】 前記サーバー装置は、 前記中間形式検索手段により検索された中間形式文書デ
    ータから、前記検索言語情報に対応した言語で記述した
    文書データを生成する目標言語文書生成手段を備え、 前記検索結果送信手段は、前記目標言語文書生成手段が
    生成した文書データを検索結果として、前記クライアン
    ト装置に送信することを特徴とする請求項1に記載の多
    言語対応通信システム。
  3. 【請求項3】 前記クライアント装置の検索要求送信手
    段は、前記検索文字列及び検索言語情報に加えて、目標
    言語情報を含む検索要求を送信するように構成されると
    共に、前記サーバー装置の検索要求受信手段は、前記検
    索要求を受信するように構成され、 前記サーバー装置は、 前記中間形式検索手段により検索された中間形式文書デ
    ータから、前記目標言語情報に対応した言語で記述した
    文書データを生成する目標言語文書生成手段を備え、 前記検索結果送信手段は、前記目標言語文書生成手段が
    生成した文書データを検索結果として、前記クライアン
    ト装置に送信することを特徴とする請求項1に記載の多
    言語対応通信システム。
JP03370897A 1996-12-03 1997-02-18 多言語対応通信システム Expired - Fee Related JP3434161B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP03370897A JP3434161B2 (ja) 1997-02-18 1997-02-18 多言語対応通信システム
US08/984,293 US6092035A (en) 1996-12-03 1997-12-03 Server device for multilingual transmission system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03370897A JP3434161B2 (ja) 1997-02-18 1997-02-18 多言語対応通信システム

Publications (2)

Publication Number Publication Date
JPH10232869A JPH10232869A (ja) 1998-09-02
JP3434161B2 true JP3434161B2 (ja) 2003-08-04

Family

ID=12393924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03370897A Expired - Fee Related JP3434161B2 (ja) 1996-12-03 1997-02-18 多言語対応通信システム

Country Status (1)

Country Link
JP (1) JP3434161B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100372582B1 (ko) * 2000-02-23 2003-02-17 가부시키가이샤 히타치세이사쿠쇼 데이터처리방법 및 시스템 및 그 처리프로그램을 기록한계산기판독이 가능한 기록매체

Also Published As

Publication number Publication date
JPH10232869A (ja) 1998-09-02

Similar Documents

Publication Publication Date Title
US6092035A (en) Server device for multilingual transmission system
JP3066274B2 (ja) 機械翻訳装置
US6571241B1 (en) Multilingual patent information search system
US20020002452A1 (en) Network-based text composition, translation, and document searching
US20010014902A1 (en) Method, system and program product for resolving word ambiguity in text language translation
US20080040097A1 (en) System, method and program product for bidirectional text translation
JP2001092854A (ja) ネイティブ言語照会サービスを提供する方法およびシステム
US7783643B2 (en) Direct navigation for information retrieval
US20020152258A1 (en) Method and system of intelligent information processing in a network
JPH0310979B2 (ja)
KR19990078925A (ko) 자연어 검색이 가능한 인터넷 브라우징 시스템
JP3467160B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JP3871644B2 (ja) ネットワークにおけるインテリジェントな情報処理方法およびシステム
JP3467159B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JP3434161B2 (ja) 多言語対応通信システム
JPH10222516A (ja) 多言語対応通信システム
JPH10187732A (ja) 多言語対応通信システム
JP2003296327A (ja) 翻訳サーバ、ジャンル別オンライン機械翻訳方法、およびそのプログラム
JP3467161B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
JPH10222513A (ja) 多言語対応通信システム
KR100836159B1 (ko) 반자동 번역 서비스 제공 시스템 및 방법
JPH10214266A (ja) 多言語対応通信システム
JPH10187731A (ja) 多言語対応通信システム
JPWO2006016477A1 (ja) 翻訳システム、翻訳サーバ、翻訳サーバの処理方法、プログラム、情報記憶媒体および翻訳装置
JPH10207892A (ja) 多言語対応通信システム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030513

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080530

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090530

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100530

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees