JPH1027177A - 自然言語処理システム - Google Patents

自然言語処理システム

Info

Publication number
JPH1027177A
JPH1027177A JP8183758A JP18375896A JPH1027177A JP H1027177 A JPH1027177 A JP H1027177A JP 8183758 A JP8183758 A JP 8183758A JP 18375896 A JP18375896 A JP 18375896A JP H1027177 A JPH1027177 A JP H1027177A
Authority
JP
Japan
Prior art keywords
translation
natural language
document
language processing
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8183758A
Other languages
English (en)
Inventor
Seiji Aso
誠司 麻生
Hidemi Nakajima
秀美 中島
Yutaka Nakamura
裕 中村
Hideki Yamamoto
秀樹 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Oki Software Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Oki Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd, Oki Software Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8183758A priority Critical patent/JPH1027177A/ja
Publication of JPH1027177A publication Critical patent/JPH1027177A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 表示出力又は印刷出力面での利用者の使い勝
手が一段と良好な自然言語処理システムを提供する。 【解決手段】 本発明の自然言語処理システムは、入力
文書を格納している入力文書格納手段と、この入力文書
格納手段に格納されている入力文書に対し、その部分毎
に所定の自然言語処理を施す自然言語処理実行手段と、
この自然言語処理実行手段が実行した結果の文書部分を
格納する処理後文書格納手段とを有する。また、入力文
書格納手段に格納されている、自然言語処理実行手段が
処理を施していない入力文書部分と、処理後文書格納手
段に格納されている処理後文書部分とを、自然言語処理
が施されているか否かを除けば完結した表示画像又は印
刷画像となるように混在させた自然言語処理結果を形成
し、表示装置又は印刷装置に出力する自然言語処理結果
出力手段を有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、計算機システムを
利用して自然言語文に対して所定の処理を施す機械翻訳
システムや要約作成システムや翻訳機能付き文書検索表
示システム等の自然言語処理システムに関し、特には、
所定処理の途中段階での表示出力の改善を意図している
ものである。
【0002】
【従来の技術】最近、インターネット関連のハードウェ
アやソフトウェアの充実により、インターネットを利用
する利用者が多くなってきている。日本国内だけでなく
他の国の局部的なネットワークに対しても、インターネ
ットを介してアクセスでき、そのため、日本語による複
数の文データからなる文書データ(以下、単に文書と呼
ぶ:WWW(World Wide Web)データ)だけでなく、外
国語による文書も、日本国内でインターネットを介して
入手できる。そのため、インターネットアクセス用の情
報処理システムとして、文書の翻訳機能を有するものが
ある。
【0003】ここで、インターネットを介して授受され
る文書の多くは、文書が印刷、表示出力されたときの形
式を指定するようなタグを含んだ文書であり、このよう
なタグ付き文書を計算機システムで翻訳する方式とし
て、例えば、下記文献に記載されているものが提案され
ている。この文献記載の方式は、タグの部分を翻訳せず
に、訳文にもそのタグを残すという方式である。このよ
うな翻訳方式等の存在によって、インターネットアクセ
ス用の情報処理システムが、文書の翻訳機能を実現でき
る。
【0004】文献:『石川、檜山共著、「タグ付文書の
英日機械翻訳支援システム」、CALS Japan
794、S2−1』。
【0005】ところで、インターネットをアクセスする
主たる目的は文書の検索表示である。すなわち、利用者
によって指示された文書を検索して利用者が認識し得る
ように表示できれば良く、翻訳機能は、利用者が認識し
得るように表示するための補助機能である。また、文書
にはページ概念があり、ページ単位で表示が実行され
る。そのため、翻訳機能に対応しているインターネット
アクセス用の情報処理システムであっても、文書の表示
は、原言語での表示(原文表示)又は目的言語での表示
(訳文表示)の一方であり、原文表示と訳文表示とが同
時になされることはない。
【0006】ここで、訳文を表示させる指令を、検索指
令時に同時に入力させる方法もあれば、原文表示画面上
に翻訳指令ボタンを表示させて入力させる方法もある。
いずれにせよ、翻訳の途中においては、翻訳が終了した
所までの訳文を表示させるか、訳文を一切表示させない
かのどちらかである。後者の場合には、翻訳が完了した
段階で訳文が一気に表示される。
【0007】
【発明が解決しようとする課題】上述のように、従来の
訳文表示方法においては、翻訳の途中段階では、訳文が
一部だけ表示されるか、又は、一切表示されない。その
ため、この時間に、利用者が検索文書についての多くの
情報を知得することができず、言い換えると、翻訳の途
中の時間ではシステムが既に入手しているにも拘らず利
用者が確認できない情報(翻訳が済んでいない原文が有
する情報)が多くあり、使い勝手上未だ不十分というこ
とができる。これを避けようとすると、翻訳の途中にお
いて原文文書を表示させておき、翻訳が完了した段階で
訳文文書を一気に表示させることが考えられる。しか
し、情報提示を実行はしているが、原文表示を嫌がって
訳文表示を利用者が望んでいるにも拘らず、全てを原文
表示させており、翻訳機能を搭載させた意図を半減させ
ている。
【0008】また、翻訳の途中段階において、訳文が一
部だけ表示された状況、又は、一切表示されない状況に
おいては、翻訳にあとどのくらいの時間がかかるかを利
用者が推測することができず、この点からも、従来のシ
ステムは、使い勝手上未だ不十分ということができる。
【0009】なお、機械翻訳の専用システムの多くは、
例えば、画面左半分に原文を表示させ右半分に訳文を表
示させるように、翻訳途中においても、原文を表示させ
る機能を備えている。しかし、原文又は訳文を択一的に
表示させる機械翻訳の専用システムの場合にも、上述し
たインターネットを介して検索した文書の翻訳途中での
表示に係る課題が同様に生じている。
【0010】機械翻訳以外の自然言語処理についても同
様な課題が生じることがある。例えば、要約作成システ
ムにおいても、要約の作成途中においては、作成が終了
した途中までの要約内容が表示されるか、作成が完了す
るまで要約された内容が表示されないかのどちらかであ
り、要約途中において、要約対象の後半部分の情報を確
認できず、また、要約完了までの時間を利用者が推測す
ることができない。
【0011】そのため、表示機能や印刷機能等の出力機
能がより充実した、利用者の使い勝手を一段と高くした
自然言語処理システムが望まれている。
【0012】
【課題を解決するための手段】かかる課題を解決するた
め、本発明の自然言語処理システムは、以下の各手段を
有すしている。
【0013】すなわち、(1) 入力文書を格納している入
力文書格納手段と、(2) この入力文書格納手段に格納さ
れている入力文書に対し、その部分毎に所定の自然言語
処理を施す自然言語処理実行手段と、(3) この自然言語
処理実行手段が実行した結果の文書部分を格納する処理
後文書格納手段と、(4) 上記入力文書格納手段に格納さ
れている、上記自然言語処理実行手段が処理を施してい
ない入力文書部分と、上記処理後文書格納手段に格納さ
れている処理後文書部分とを、自然言語処理が施されて
いるか否かを除けば完結した表示画像又は印刷画像とな
るように混在させた自然言語処理結果を形成し、表示装
置又は印刷装置に出力する自然言語処理結果出力手段と
を有している。
【0014】以上のような構成を有することにより、利
用者は、自然言語処理が施されているか否かを問わなけ
れば入力文書全体が有していた情報のほぼ全てを把握す
ることができ、しかも、処理後の内容が表示又は印刷さ
れている部分については、自己が意図した内容の表示又
は印刷を得ることができる。すなわち、利用者の使い勝
手が一段と高くなっている。
【0015】
【発明の実施の形態】
(A)第1の実施形態 以下、本発明による自然言語処理システムを、インター
ネットを介して得られるようなタグ付き文書(例えばW
WWデータ)の機械翻訳機能を有する翻訳機能付き文書
検索表示システムに適用した第1の実施形態を図面を参
照しながら説明する。
【0016】なお、第1の実施形態の翻訳機能付き文書
検索表示システムが前提とする翻訳機能付き文書検索表
示システムとしては、本件出願人が出願した特願平7−
13831号、特願平7−13832号、特願平7−1
3990号の明細書及び図面に記載されているものを挙
げることができる。
【0017】図2は、第1の実施形態の翻訳機能付き文
書検索表示システムの機能的な全体構成を示すブロック
図である。
【0018】図2において、この実施形態の文書検索表
示システムは、タグ付文書(タグの中にはリンク先を規
定しているものもある)をファイルとして格納している
対応するタグ付文書格納手段4をアクセスし得るタグ付
文書検索手段3を備え、複数のタグ付文書検索手段3
が、バス型、メッシュ型、リング型等の任意の形式の通
信ネットワークによって接続されている。また、この通
信ネットワークには、後述するタグ付文書翻訳装置5を
介して、1又は2以上の表示入力手段1が接続されてい
る。
【0019】表示入力手段1は、基本的には、利用者が
入力したファイル情報を取込んで、通信ネットワークを
介していずれかのタグ付文書検索手段3に渡し、そのタ
グ付文書検索手段3から与えられたファイル内容を受信
して表示するものである。各タグ付文書検索手段3は、
表示入力手段1側からファイル情報が与えられると、自
己が接続しているタグ付文書格納手段4からファイル
(タグ付文書)を取出し、そのファイルを表示入力手段
1に転送するものである。
【0020】実際上は、タグ付文書検索手段3及びタグ
付文書格納手段4でなる文書検索装置2は大容量記憶装
置を備えた通信機能を有する同一のワークステーション
等の情報処理装置で構成され、表示入力手段1はパーソ
ナルコンピュータ等の情報処理装置で構成され、例え
ば、オフィス単位等のある程度大きな単位で文書検索装
置2を構成するワークステーションが設置され、個人単
位等で表示入力手段1が設置されてシステムが構成され
ていることが多い。
【0021】例えば、この実施形態におけるタグ付文書
検索手段3を構成する情報処理装置に搭載された情報取
出し用ソフトウェアはインターネットにおけるWWWサ
ーバに該当し、表示入力手段1を構成する情報処理装置
に搭載された表示用ソフトウェアはインターネットにお
けるWWWブラウザに該当する。
【0022】以上のようなタグ付文書検索表示システム
として基本的な文書検索表示機能を担う構成要素に加え
て、この第1実施形態の場合、タグ付文書翻訳装置5が
設けられている。
【0023】タグ付文書翻訳装置5は、図2に示すよう
に、通信ネットワークがバス型、リンク型、メッシュ型
のいずれであろうと、表示入力手段1及びタグ付文書検
索装置3間の通信ネットワーク上の位置に設けられてい
る。より正確に言えば、表示入力手段1及びタグ付文書
検索装置3間の通信ネットワーク上の位置には、タグ付
文書翻訳装置5の後述するタグ付文書翻訳制御手段6が
介挿されている。なお、タグ付文書翻訳装置5は、表示
入力手段1に1対1で接続されたものであっても良く、
複数の表示入力手段を接続しているものであっても良
い。
【0024】また、タグ付文書翻訳装置5は、表示入力
手段1から見た場合、タグ付文書検索手段3と同様な装
置に見え、タグ付文書翻訳装置5を意識することなくア
クセスできるものである。さらに、タグ付文書翻訳装置
5は、タグ付文書検索手段3から見た場合、表示入力手
段1と同様な装置に見え、タグ付文書翻訳装置5を意識
することなくアクセスできるものである。
【0025】タグ付文書翻訳装置5は、表示入力手段1
又はタグ付文書検索手段3との通信制御及び当該翻訳装
置5の全体の制御を司るタグ付文書翻訳制御手段6と、
原文文書(原文ファイル)を格納する原文格納手段7
と、訳文文書(訳文ファイル)を格納する訳文格納手段
8と、翻訳を実行する翻訳手段9とから構成されてい
る。ここで、タグ付文書翻訳制御手段6は、翻訳結果を
表示入力手段1に出力するという観点からは、翻訳結果
出力手段を構成しているということができる。
【0026】この実施形態の文書検索表示システムは、
タグ付文書翻訳装置5が、原文文書の翻訳途中で表示入
力手段1へ与える表示用データに特徴を有するものであ
る。すなわち、図3のイメージ図に示すように、原文文
書中の翻訳が終了している部分については、その原文部
分に対応した訳文格納手段8に格納された訳文データを
表示入力手段1へ与えると共に、原文文書中の翻訳が終
了していない部分については、その原文部分自体のデー
タを表示入力手段1へ与え、表示入力手段1によって、
訳文と原文とが混在した文書を表示させるようにする。
【0027】以上のように、この実施形態の文書検索表
示システムでは、タグ付文書翻訳装置5の処理に特徴を
有するので、以下では、タグ付文書翻訳装置5の動作、
すなわち翻訳処理の流れを図1を参照しながら詳述す
る。
【0028】なお、タグ付文書翻訳装置5が翻訳を実行
するタイミングは任意である。例えば、検索により原文
格納手段7に原文文書を格納するのに並行して翻訳を実
行するものであっても良く、検索時には、原文文書を原
文格納手段7に格納し、その後に表示入力手段1を介し
て利用者から翻訳が指示されたときに翻訳を実行するも
のであっても良い。
【0029】翻訳処理を開始すると、原文格納手段7か
ら未翻訳状態の原文を1文だけ読み込む(ステップ10
1)。そして、かかる読込み処理の後、原文格納手段7
の最後の原文を既に読んでいるか否か(未翻訳状態の原
文が残っているか否か)を判断する(ステップ10
2)。最後の原文を既に読んでいる場合には(この場合
は翻訳が完了していることを意味する)、後述するステ
ップ106に直ちに移行する。最後の原文の読込みが完
了していない場合には、読込んだ原文を翻訳する(ステ
ップ103)。そして、訳文格納手段8の最後尾にその
翻訳結果(訳文)を付加する(ステップ104)。な
お、この実施形態の場合、原文がタグ付文章であるの
で、翻訳は、例えば、上記文献に記載のように、原文を
タグ部分とテキスト部分とに分離し、テキスト部分を翻
訳し、翻訳されたテキスト部分に分離したタグ部分を復
元するという手順で実行される。
【0030】以上のようにして、ある1文に対する翻訳
が終了すると、表示入力手段1側から終了要求が到来し
ているか否かを判別する(ステップ105)。終了要求
が到来している場合には、一連の翻訳処理を終了する。
なお、全ての原文に対する翻訳処理が終了したときに、
自動的に一連の翻訳処理を終了させるようにしても良
い。
【0031】終了要求が与えられていなければ、表示入
力手段1から翻訳結果の出力要求が到来しているか否か
を判別する(ステップ106)。表示入力手段1におい
ては、例えば内蔵するタイマ出力等に応じて所定周期で
表示更新を行なうようになされており、この表示更新周
期に対応した周期でタグ付文書翻訳装置5に出力要求を
送出するようになされている。また、複数の表示入力手
段1が、同一のタグ付文書翻訳装置5に対して独立に同
一の文書についての出力要求を送出することもあり得
る。
【0032】タグ付文書翻訳装置5において、出力要求
が到来していなければ上述したステップ101に戻っ
て、次の原文の読込みを行なう。一方、出力要求が到来
していると、その時点までに翻訳が終了して訳文格納手
段8に格納されている訳文の数を数える(ステップ10
7)。また、訳文格納手段8に格納されている全ての訳
文を出力し(ステップ108)、続けて、原文格納手段
7から、上述したステップ107で数えた訳文の数だけ
原文を読み飛ばし、読み飛ばした直後から最後までの原
文を出力する(ステップ109)。その後、上述したス
テップ101に戻って、次の原文の読込みを行なう。
【0033】このような一連の翻訳処理によるデータが
与えられる表示入力手段1においては、翻訳の途中の段
階では、図3に示したイメージ図のように、前半部分に
訳文が配置され、それ以降の後半部分に原文が配置され
た訳文及び原文が混在している、しかも、言語を問わな
ければその時点でタグ付文書検索手段3から与えられて
いる全ての情報を含む文書として完成している画像が表
示される。
【0034】次に、タグ付文書翻訳装置5が実行する上
述した一連の翻訳処理を、図4〜図6を用いて具体的に
説明する。ここでは、日英翻訳の例で説明する。
【0035】翻訳結果の出力要求が、原文格納手段7に
格納されている図4に示す3個の原文241〜243中
の2個の原文241、242の翻訳が終了した時点であ
った場合を説明する。すなわち、ステップ101〜10
6でなる処理ループが2度繰り返されて、訳文格納手段
8に、原文241、242に対応した訳文251、25
2が格納され、この格納状態においてステップ106
(2度目のステップ106)からステップ107に移行
した時点以降を説明する。
【0036】ステップ107で訳文格納手段8内の訳文
の数を数えると、この時点の訳文格納手段8には2個の
訳文251、252が格納されているので、「2」とい
う計数値が得られる。その後、ステップ108におい
て、訳文格納手段8から格納されている全ての訳文25
1、252を読出して出力させ、続いて、ステップ10
9において、原文格納手段7から、上記計数値「2」の
数の原文241、242を読み飛ばし、読み飛ばした以
降の原文243を読出して出力させる。
【0037】従って、翻訳結果の出力要求に応じて、タ
グ付文書翻訳装置5から表示入力手段1へ転送される翻
訳結果は、図6に示すように、翻訳を完了して得られた
全ての訳文251、252と、翻訳が実行されていない
全ての原文243とをこの順に含むものとなる。
【0038】以上のように、第1の実施形態によれば、
翻訳の途中においては、タグ付文書翻訳装置5から表示
入力手段1へ、翻訳を完了して得られた全ての訳文と、
翻訳が実行されていない全ての原文とをこの順に含む翻
訳結果を転送して、表示出力させるようにしたので、利
用者は、原文全部の翻訳が終了していない時点でも、言
語を問わなければ全文の内容を把握することができ、し
かも、訳文表示されている部分については、内容を容易
に把握することができる。また、翻訳を完了して得られ
た全ての訳文と翻訳が実行されていない全ての原文とが
表示されるので、翻訳が完了するまでの待ち時間を利用
者がほぼ正確に推測することができる。
【0039】すなわち、利用者の使い勝手を高めた翻訳
機能付き文書検索表示システムを実現することができ
る。
【0040】なお、1個のタグ付文書翻訳装置5を複数
の表示入力手段1が利用する場合においても、出力要求
毎にステップ127〜129の処理を実行するので、か
かる訳文及び原文の混在表示を、出力要求を発行した複
数の表示入力手段1で実行させることができる。
【0041】(B)第2の実施形態 次に、本発明による自然言語処理システムを、翻訳機能
付き文書検索表示システムに適用した第2の実施形態を
図面を参照しながら説明する。
【0042】第2の実施形態の翻訳機能付き文書検索表
示システムは、第1の実施形態の翻訳機能付き文書検索
表示システムに比較して、タグ付文書翻訳装置(第2の
実施形態については符号5Aで表す)の内部の機能構成
及び動作が異なっており、従って、以下では、タグ付文
書翻訳装置5Aについて説明する。
【0043】ここで、図7が、第2の実施形態のタグ付
文書翻訳装置5Aの内部の機能構成を示すブロック図で
あり、上述した図2との同一、対応部分には、同一、対
応符号を付して示している。
【0044】図7において、第2の実施形態のタグ付文
書翻訳装置5Aも、表示入力手段1又はタグ付文書検索
手段3との通信制御及び当該翻訳装置5Aの全体の制御
を司るタグ付文書翻訳制御手段6Aと、原文文書(原文
ファイル)を格納する原文格納手段7と、訳文文書(訳
文ファイル)を格納する訳文格納手段8と、翻訳を実行
する翻訳手段9とを備えている。
【0045】第2の実施形態のタグ付文書翻訳装置5A
は、以上の構成要素に加えて、翻訳の進行状態を格納す
る進行状態格納手段10を備えている。進行状態格納手
段10は、その時点までに翻訳が完了している文数(原
文数)を格納しているものであっても良く、また、その
時点までに翻訳が完了している原文格納手段7の先頭か
らの位置(アドレス)を格納しているものであっても良
い。
【0046】タグ付文書翻訳装置5A(より正確にはタ
グ付文書翻訳制御手段6A)による翻訳処理や翻訳結果
の出力処理は、進行状態格納手段10を設けたことによ
って、第1の実施形態のものとは異なっている。なお、
この第2の実施形態においては、翻訳処理と翻訳結果の
出力処理とは別個の切り分けられた処理(並行処理が可
能なサブルーチン)となされている。
【0047】最初に、第2の実施形態のタグ付文書翻訳
装置5Aによる翻訳処理を、図8に示すフローチャート
を参照しながら説明する。
【0048】まず、進行状態格納手段10の値を初期
値、すなわち0にセットする(ステップ200)。そし
て、原文格納手段7から未翻訳状態の原文を1文だけ読
み込む(ステップ201)。かかる読込み処理の後、原
文格納手段7の最後の原文を既に読んでいるか否か(未
翻訳状態の原文が残っているか否か)を判断する(ステ
ップ202)。最後の原文を既に読んでいる場合には
(この場合は翻訳が完了していることを意味する)、一
連の翻訳処理を終了する。これに対して、最後の原文の
読込みが完了していない場合には、読込んだ原文を翻訳
する(ステップ203)。そして、訳文格納手段8の最
後尾にその翻訳結果(訳文)を付加する(ステップ20
4)。続いて、進行状態格納手段10の値を1だけ増や
し(ステップ205)、上述したステップ201に戻っ
て、次の翻訳されていない原文の読込みに移行する。
【0049】このような一連の翻訳処理により、原文が
順次翻訳されて訳文が生成されると共に、翻訳が終了し
た原文の位置(翻訳進行状態)が管理される。
【0050】次に、第2の実施形態のタグ付文書翻訳装
置5Aによる翻訳結果の出力処理を、図9に示すフロー
チャートを参照しながら説明する。
【0051】翻訳結果の出力要求が発行されると、ま
ず、進行状態格納手段10の値を読み取る(ステップ2
11)。その後、訳文格納手段8から、進行状態格納手
段10の値に等しい数の訳文を出力する(ステップ21
2)。そして最後に、原文格納手段7から、進行状態格
納手段10の値の数だけ原文を読み飛ばし、進行状態格
納手段10の値の数に1を加えたところから最後までの
原文を出力する(ステップ213)。
【0052】このような一連の翻訳結果の出力処理によ
るデータが与えられる表示入力手段1においては、翻訳
の途中の段階では、図3に示したイメージ図のように、
前半部分に訳文が配置され、それ以降の後半部分に原文
が配置された訳文及び原文が混在している、しかも、言
語を問わなければその時点でタグ付文書検索手段3から
与えられている全ての情報を含む画像が表示される。
【0053】次に、第2の実施形態のタグ付文書翻訳装
置5Aが実行する、翻訳処理及び翻訳結果の出力処理
を、上述した図4〜図6に加えて、図10をも用いて具
体的に説明する。ここで、原文格納手段7に図4に示す
ような3個の原文241〜243が格納されている状況
において、翻訳処理が開始されたとする。
【0054】翻訳処理を開始すると、進行状態格納手段
10の値を0にセットする(ステップ200)。その
後、ステップ201〜205の処理ループを1回実行す
ることにより、原文格納手段7から原文241が取出さ
れて翻訳され、対応する訳文251が訳文格納手段8に
格納され、進行状態格納手段10の値が1に更新され
る。さらに、ステップ201〜205の処理ループをも
う1回実行することにより、原文格納手段7から原文2
42が取出されて翻訳され、対応する訳文252が訳文
格納手段8に格納され、進行状態格納手段10の値が2
に更新される。
【0055】以上のように、ステップ201〜205の
処理ループを計2回実行した段階においては、訳文格納
手段8には、図5に示すように、原文241、242に
対応した訳文251、252が格納され、進行状態格納
手段10には、図10に示すように、2個の原文(24
1、242)の翻訳が終了していることを表す「2」が
格納される。
【0056】原文格納手段7に図4に示す内容が格納さ
れ、訳文格納手段8に図5に示す内容が格納され、進行
状態格納手段10に図10に示す内容が格納されている
状況において、表示入力手段1から、翻訳結果の出力要
求がタグ付文書翻訳装置5Aに与えられたとする。
【0057】このとき、タグ付文書翻訳装置5Aにおい
てはまず、進行状態格納手段10に格納されている値
「2」を取込む(ステップ211)。そして、訳文格納
手段8から、進行状態格納手段10に格納されていた値
「2」に等しい文数(2文)の訳文251、252を出
力し(ステップ212)、その後、原文格納手段7か
ら、進行状態格納手段10に格納されていた値「2」に
等しい文数(2文)の原文241、242を読み飛ばし
て、読み飛ばした以降の原文243を出力する(ステッ
プ213)。
【0058】従って、この場合も、翻訳結果の出力要求
に応じて、タグ付文書翻訳装置5Aから表示入力手段1
へ転送される翻訳結果は、図6に示すように、翻訳を完
了して得られた全ての訳文251、252と、翻訳が実
行されていない全ての原文243とをこの順に含むもの
となる。
【0059】以上のように、第2の実施形態によって
も、翻訳の途中においては、タグ付文書翻訳装置5Aか
ら表示入力手段1へ、翻訳を完了して得られた全ての訳
文と、翻訳が実行されていない全ての原文とをこの順に
混在させた翻訳結果を転送して表示出力させるようにし
たので、利用者は、原文全部の翻訳が終了していない時
点でも、言語を問わなければ全文の内容を把握すること
ができ、しかも、訳文表示されている部分については、
内容を容易に把握することができる。また、翻訳を完了
して得られた全ての訳文と翻訳が実行されていない全て
の原文とが表示されるので、翻訳が完了するまでの待ち
時間を利用者がかなり正確に推測することができる。
【0060】すなわち、第2の実施形態においても、利
用者の使い勝手を高めた翻訳機能付き文書検索表示シス
テムを実現することができる。
【0061】なお、1個のタグ付文書翻訳装置5Aを複
数の表示入力手段1が利用する場合においても、出力要
求毎に図9に示す処理を実行するので、かかる訳文及び
原文の混在表示を、出力要求を発行した複数の表示入力
手段1で実行させることができる。
【0062】また、第2の実施形態によれば、進行状態
格納手段10を備えるので、翻訳結果の出力要求のたび
に訳文の数を数える必要はなく、原文の数が多い場合等
に、高速に翻訳結果を出力することが可能になる。
【0063】(C)他の実施形態 上記各実施形態においては、本発明による自然言語処理
システムを、タグ付き文書の機械翻訳機能を有する翻訳
機能付き文書検索表示システムに適用したものを示した
が、検索機能を有しない機械翻訳専用システムに適用す
ることもでき、また、文書の種類もタグ付文書に限定さ
れるものではなく、さらに、翻訳方向も日英だけでなく
英日でも良く、他の2種類の言語(日本語における現代
語と古語や2種類の方言のような場合を含む)間の翻訳
であっても良い。翻訳機能付き文書検索表示システムに
適用する場合も、表示入力手段とタグ付文書翻訳装置と
が融合したようなシステムに適用することができる。
【0064】また、上記各実施形態においては、言語の
種類の相違を除けば完結した文書画像となるように、翻
訳の途中段階において、訳文と原文とを混在表示できる
ように処理するものを示したが、これ以外の段階でも、
言語の種類の相違を除けば完結した画像となるように訳
文と原文とを混在表示できるように処理するものであっ
ても良い。例えば、タグ付原文文書中の一部分だけを翻
訳させて表示する場合において、その部分の翻訳完了時
に、その部分は訳文を他の部分は原文表示させるように
しても良い。このような場合であっても、利用者は、言
語を問わなければ全文の内容を把握することができ、し
かも、訳文表示されている部分については、内容を容易
に把握することができるという効果を得ることができ
る。この例の場合では、出力形式も表示出力に限定され
ず、印刷出力であっても良い。
【0065】さらに、上記各実施形態においては、自然
言語処理が機械翻訳処理であるシステムを示したが、他
の自然言語処理を行なうシステムに本発明を適用するこ
とができる。例えば、タグに基づいてタイトル部分等を
認識しながら、タグ付文書を要約するタグ付文書要約作
成装置に、本発明の技術的思想を適用することができ
る。すなわち、要約処理途中において、要約処理が終了
した部分と、要約処理が終了していない部分とを、要約
処理が施されているか否かを除けば完結した画像となる
ように混在表示させるものであっても良い。図11は、
このようなタグ付文書要約作成装置15Aの内部構成の
一例を示したものであり、上述した図7に対応して構成
を示している。各手段16A、17、18、19、20
の機能については、その手段名から類推できるので、詳
細な説明は省略する。
【0066】
【発明の効果】以上のように、本発明の自然言語処理シ
ステムによれば、(1) 入力文書格納手段と、(2) 自然言
語処理実行手段と、(3) 処理後文書格納手段と、(4) 入
力文書格納手段に格納されている、自然言語処理実行手
段が処理を施していない入力文書部分と、処理後文書格
納手段に格納されている処理後文書部分とを、自然言語
処理が施されているか否かを除けば完結した表示画像又
は印刷画像となるように混在させた自然言語処理結果を
形成し、表示装置又は印刷装置に出力する自然言語処理
結果出力手段とを有するので、利用者は、自然言語処理
が施されているか否かを問わなければ入力文書全体が有
していた情報のほぼ全てを把握することができ、しか
も、処理後の内容が表示又は印刷されている部分につい
ては、自己が意図した内容の表示又は印刷を得ることが
でき、利用者の使い勝手が一段と高くなっているシステ
ムを実現できる。
【図面の簡単な説明】
【図1】第1の実施形態の翻訳処理を示すフローチャー
トである。
【図2】第1の実施形態のシステムの全体構成を示すブ
ロック図である。
【図3】第1の実施形態の表示出力する翻訳結果の作成
イメージ図である。
【図4】原文格納手段に格納された原文の例を示す説明
図である。
【図5】訳文格納手段に格納された原文の例を示す説明
図である。
【図6】翻訳結果の出力例を示す説明図である。
【図7】第2の実施形態のタグ付文書翻訳装置の構成を
示すブロック図である。
【図8】第2の実施形態の翻訳処理を示すフローチャー
トである。
【図9】第2の実施形態の翻訳結果の出力処理を示すフ
ローチャートである。
【図10】第2の実施形態の進行状態格納手段の格納値
の例を示す説明図である。
【図11】他の実施形態のタグ付文書要約作成装置の構
成を示すブロック図である。
【符号の説明】
1…表示入力手段、5、5A…タグ付文書翻訳装置、
6、6A…タグ付文書翻訳制御手段、7…原文格納手
段、8…訳文格納手段、9…翻訳手段、10、20…進
行状態格納手段、15A…タグ付文書要約作成装置、1
6A…タグ付文書要約作成制御手段、17…入力文格納
手段、18…要約文格納手段、19…要約手段。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 中村 裕 東京都板橋区舟渡1丁目12番11号 沖ソフ トウェア株式会社内 (72)発明者 山本 秀樹 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 入力文書を格納している入力文書格納手
    段と、 この入力文書格納手段に格納されている入力文書に対
    し、その部分毎に所定の自然言語処理を施す自然言語処
    理実行手段と、 この自然言語処理実行手段が実行した結果の文書部分を
    格納する処理後文書格納手段と、 上記入力文書格納手段に格納されている、上記自然言語
    処理実行手段が処理を施していない入力文書部分と、上
    記処理後文書格納手段に格納されている処理後文書部分
    とを、自然言語処理が施されているか否かを除けば完結
    した表示画像又は印刷画像となるように混在させた自然
    言語処理結果を形成し、表示装置又は印刷装置に出力す
    る自然言語処理結果出力手段とを有することを特徴とす
    る自然言語処理システム。
  2. 【請求項2】 上記自然言語処理結果出力手段は、上記
    入力文書格納手段に格納されている入力文書の全体に対
    する、上記自然言語処理実行手段による自然言語処理が
    終了していない自然言語処理の途中段階において、上記
    自然言語処理実行手段が処理を施していない入力文書部
    分と、上記処理後文書格納手段に格納されている処理後
    文書部分とを混在させた自然言語処理結果を形成するこ
    とを特徴とする請求項1に記載の自然言語処理システ
    ム。
  3. 【請求項3】 上記自然言語処理結果出力手段は、上記
    処理後文書格納手段に格納されている処理後文書部分に
    基づいて、自然言語処理結果に混在させる、未処理の入
    力文書部分と、処理後文書部分とを認識することを特徴
    とする請求項1又は2に記載の自然言語処理システム。
  4. 【請求項4】 上記入力文書格納手段に格納されている
    入力文書中における上記自然言語処理実行手段によって
    処理された先頭側からの処理済量情報を格納する処理済
    量格納手段をさらに備え、 上記自然言語処理結果出力手段は、上記処理済量格納手
    段に格納されている処理量情報に基づいて、自然言語処
    理結果に混在させる、未処理の入力文書部分と、処理後
    文書部分とを認識することを特徴とする請求項1又は2
    に記載の自然言語処理システム。
  5. 【請求項5】 上記自然言語処理実行手段が実行する自
    然言語処理が機械翻訳であることを特徴とする請求項1
    〜4のいずれかに記載の自然言語処理システム。
JP8183758A 1996-07-12 1996-07-12 自然言語処理システム Pending JPH1027177A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8183758A JPH1027177A (ja) 1996-07-12 1996-07-12 自然言語処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8183758A JPH1027177A (ja) 1996-07-12 1996-07-12 自然言語処理システム

Publications (1)

Publication Number Publication Date
JPH1027177A true JPH1027177A (ja) 1998-01-27

Family

ID=16141470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8183758A Pending JPH1027177A (ja) 1996-07-12 1996-07-12 自然言語処理システム

Country Status (1)

Country Link
JP (1) JPH1027177A (ja)

Similar Documents

Publication Publication Date Title
KR100324782B1 (ko) 번역기능부 문서검색표시방법
JPH10134052A (ja) 機械翻訳方法及び装置
JPH09223062A (ja) サービス提供形態のカスタマイズ方法およびその方法の実施に使用可能なサーバ装置
JP2003256422A (ja) コンピュータ装置、サーバ、翻訳処理方法およびプログラム
JPH08147118A (ja) 情報処理装置および情報処理装置のプリント制御方法
US7483160B2 (en) Communication system, communication terminal, system control program product and terminal control program product
JP2001067342A (ja) 文書処理装置及び記憶媒体
JPH1125092A (ja) 文書管理支援装置およびその装置としてコンピュータを機能させるためのコンピュータ読み取り可能な記録媒体
WO2022014629A1 (ja) ウェブページ処理装置、ウェブページ処理方法、および記録媒体
JP4008628B2 (ja) ページ編集装置、ページ編集方法、ページ編集プログラム、及び画像形成装置
JPH1027177A (ja) 自然言語処理システム
JPH10326277A (ja) 翻訳サービス提供方法及び翻訳サービスシステム
JP3714723B2 (ja) 文書表示システム
JP2780735B2 (ja) 翻訳機能付文書検索表示システム
JP3887880B2 (ja) データ変換装置、データ伝送方法及びデータ変換機能を格納した情報記憶媒体
JPH10143498A (ja) リンク付与機能を持つページ分割通信中継装置
JPH1016343A (ja) 印刷制御装置及び方法
JP3004187B2 (ja) 翻訳機能付文書検索表示システム
JP2001101186A (ja) 機械翻訳装置
JPH09265431A (ja) ドキュメント編集方法及び装置と、ドキュメント編集装置を含むクライアント装置
JP3804564B2 (ja) 印刷装置および印刷方法
JPH1125091A (ja) 文書要約支援装置およびその装置としてコンピュータを機能させるためのコンピュータ読み取り可能な記録媒体
JPH10171702A (ja) 表示装置
JP3379574B2 (ja) 翻訳機能付文書検索表示システム
JP3537260B2 (ja) リンク付文書検索表示システム