JPH0589164A - 文書変換装置 - Google Patents

文書変換装置

Info

Publication number
JPH0589164A
JPH0589164A JP3251937A JP25193791A JPH0589164A JP H0589164 A JPH0589164 A JP H0589164A JP 3251937 A JP3251937 A JP 3251937A JP 25193791 A JP25193791 A JP 25193791A JP H0589164 A JPH0589164 A JP H0589164A
Authority
JP
Japan
Prior art keywords
character
sentence
translation
space
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3251937A
Other languages
English (en)
Inventor
Naoko Utsunomiya
直子 宇都宮
Hisafumi Yamamoto
尚史 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP3251937A priority Critical patent/JPH0589164A/ja
Publication of JPH0589164A publication Critical patent/JPH0589164A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 入力された文章を翻訳機に入力するにあたっ
て、翻訳に適した文章に変換することができる文書変換
装置を提供することを目的とする。 【構成】 この発明に係る文書変換装置は、翻訳すべき
文章であって、翻訳に不要なスペースと文字とが混在し
た文章を入力するスキャナと、入力された文章に含まれ
ているスペースを検出する検出装置と、検出装置の検出
出力に応答して、入力された文章をスペースを含まない
文章に変換する変換装置とを備えたものである。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は文書変換装置に関し、
特に入力された文章を翻訳機に入力するにあたって翻訳
に適した文章に変換する文書変換装置に関するものであ
る。
【0002】
【従来の技術】図5は従来の翻訳機廻りのシステムブロ
ック図である。
【0003】図を参照して、従来の翻訳機廻りの構成
は、翻訳されるべき文章が入力される入力部と、入力さ
れた文章を一旦格納する格納部と、翻訳処理を行なう翻
訳部とからなる。入力部は具体的に翻訳すべき文章を読
取るスキャナ1とスキャナ1によって読取られた文章を
文字として認識するための文字認識装置とからなる。格
納部は、入力部の文字認識装置2によって認識された文
章データを格納する文章データファイル10からなる。
翻訳部は、文章データファイル9に格納されたデータに
対して翻訳処理を行なう翻訳処理装置5を中心に、翻訳
にあたっての文法ルール辞書7と、翻訳内容とを随時表
示する表示部6と、翻訳された訳文データを格納するた
めの訳文データファイル9と、翻訳結果を出力するプリ
ンタ8とから構成されている。
【0004】従来の翻訳装置は以上のように構成されて
おり、翻訳すべき文章をスキャナ1で読取る作業を始め
として、最終的には、プリンタ8によってその訳文が出
力されていた。
【0005】
【発明が解決しようとする課題】上記のような従来の翻
訳機への文章の入力方式では、スペースが文章に含まれ
ているため、翻訳処理装置での辞書引き処理に支障をき
たして結局適切な翻訳ができなかった。したがって、翻
訳処理装置に入力するにあたって翻訳作業者に翻訳すべ
き文章から不要なスペースを削除する作業を余儀なくし
ていた。結果として、このような作業が必要であるた
め、翻訳処理全体としての所要時間が長くなり、翻訳機
の導入のメリットが減少していた。
【0006】この発明は、上記のような課題を解決する
ためになされたもので、入力された文章を翻訳機に入力
するにあたって翻訳に適した文章に迅速に変換すること
ができる文書変換装置を提供することを目的とする。
【0007】
【課題を解決するための手段】この発明に係る文書変換
装置は、翻訳すべき文章であって、翻訳に不要なスペー
スと文字とが混在した文章を入力する入力手段と、入力
された文章に含まれているスペースを検出する検出手段
と、検出手段の検出出力に応答して、入力された文章を
スペースを含まない文章に変換する変換手段とを備えた
ものである。
【0008】
【作用】この発明においては、変換手段が入力された文
章をスペースを含まない文章に変換する。
【0009】
【実施例】図1はこの発明の一実施例による文書変換装
置を含んだ翻訳機廻りのシステムブロック図である。
【0010】この翻訳機廻りのシステム構成は、翻訳す
べき文章が入力される入力部と、入力された文章が翻訳
用に適した文章に変換される変換部と、変換された文章
データを基に、翻訳処理を行なう翻訳部とからなる。
【0011】具体的には、入力部は、翻訳されるべき文
章を読取るスキャナ1と、スキャナ1で読取られた文章
データの内容を文字として認識する文字認識装置2とか
ら構成される。
【0012】変換部は、文字認識装置2によって認識さ
れた文章データを翻訳処理に適した文章データに変換す
るための文書変換装置3と、文書変換装置3によって変
換された翻訳用文章データを格納するための翻訳用デー
タファイル4とから構成される。
【0013】翻訳部は、翻訳用データファイル4に格納
された文章データに基づいて翻訳処理を行なう翻訳処理
装置5と、翻訳処理にあたって用いられる文法ルール辞
書7と、翻訳処理時に随時その内容が表示される表示部
6と、翻訳処理によって生成された訳文データを格納す
るための訳文データファイル9と、翻訳処理による訳文
を出力するためのプリンタ8とから構成されている。
【0014】図2は図1の文書変換装置3の具体的な変
換処理内容を示すフローチャートであり、図3はこの文
書変換装置の動作を説明するための具体的な例であっ
て、文書変換装置に入力された文章の一例を示した図で
あり、図4は図3で示された文章に対して文書変換装置
によって処理が施された後の出力文章を示した図であ
る。
【0015】以下、図3および図4の具体例を参照しな
がら、図2のフローチャートについて説明する。
【0016】まず、図3の文章の中の最上段の文章に対
しての文書変換装置の処理について説明する。最上段の
文章は“△△△30.主役は子ども△△”となってい
る。
【0017】ステップS1において、文書変換装置は文
字認識装置によって認識された文字の最初の1文字を読
取る。認識の前提となるスキャナ1は具体的には、光学
式文字読取装置(OCR)によって翻訳すべき文章を読
取るものである。このOCRでは、基本的に、翻訳すべ
き文章中に含まれているスペースも文字として認識して
いる。したがって、スキャナ1で読取られたイメージデ
ータは文字認識装置2で文字データに変換されるが、こ
の文字データに変換した時点では、文章中に含まれてい
るスペース(△)は、スペースコードとしてデータ化さ
れている。
【0018】したがってステップS1においては、スペ
ースコードすなわち△が文字としてまず読取られること
になる。次に、ステップS2で読取られた文字が先頭文
字か否かが判別される。この場合、読取られたスペース
コードは、先頭文字であるので、フローはステップS3
に進み、読取られた文字がスペースコードであるか否か
が判別される。読取られた文字はスペースコードである
ので、フローはステップS4に進み、さらに次の文字を
1文字読取る。そしてステップS5でその読取られた文
字が、スペースコードであるか否かが判別される。図3
の例では、2番目に読取られた文字コードもスペースコ
ードであるので、フローはステップS4に戻り、さらに
次の文字を1文字読取る。3番目の文字もスペースであ
るので、フローはさらにステップS4に戻り、図3にお
いては、第1行の4番目の文字、すなわち“3”が読取
られる。この文字は、スペースではないので、フローは
ステップS5からステップS6に進む。ステップS6で
は、読取られた文字が翻訳用データバッファすなわち翻
訳用データファイル4に入力される。具体的には図4に
おいて一番上の行の左端すなわちファイルの先頭位置に
“3”の文字が格納される。このようにして、フローは
ステップS2に戻る。
【0019】次に図3において第1行の第5番目の文字
すなわち“0”の文字が読取られる。この読取られた文
字は先頭文字ではないので、フローはステップS2から
ステップS7に進む。
【0020】ステップS7において、読取られた文字デ
ータが文章の最終の文字を示すものであるか否かが判別
される。文章の最終文字であれば、文書変換装置におけ
る処理は終了するが、この場合文章の途中であるので、
フローはステップS7からステップS8に進む。ステッ
プS8において、その読取られた文字がスペースコード
であるか否かが判別される。この場合、スペースコード
でないので、フローはステップS14に進み、読まれた
文字すなわち“0”が、翻訳用データファイル4に格納
される。具体的には、図4において、第1行の文字
“3”の後に続けて“0”の文字が格納されることにな
る。
【0021】次にフローはステップS1に戻り、同じよ
うな要領で、“.”、“主”、“役”、“は”、
“子”、“ど”、および“も”の各文字について読取処
理が行なわれ、図4の第1行のごとく、読取られた文字
データは翻訳用データファイルに格納される。“も”の
後の記号は、“△”すなわちスペースコードであるの
で、フローはステップS8からステップS9に進む。そ
して、さらに次の文字が1文字読取られ、ステップS1
0においてその読取られた文字コードがスペースコード
であるか否かが判別される。この場合、次の文字コード
もスペースコードであるので、フローはステップS10
からステップS11に進み、さらに次の文字が1文字読
取られる。そしてステップS12でその読取られた文字
がスペースコードであるか否かが判別されるが、この例
では、そのさらに読取られた文字コードもスペースコー
ドであるので、フローはステップS11に戻る。そし
て、さらに次の文字が1文字読取られる。その読取られ
た文字は図3の第2行目の第2番目の文字、すなわち
“来”であるので、次のステップS12の判断では、そ
の文字はスペースコードではないものとして、フローは
ステップS13に進む。
【0022】ステップS13において、改行コードすな
わち“↓”と、読まれた文字すなわち“来”の文字デー
タとが、翻訳用データファイル4に格納される。具体的
には、図4において、第1行の“30.主役は子ども”
の後に改行を示す記号すなわち“↓”が格納され、第2
行目の第1番目の位置に、“来”の文字が格納されるこ
とになる。
【0023】フローは再度ステップS1に戻り、以下同
じような要領で、図3に示されている文章データが読取
られ、翻訳用のデータファイル4に図4に示された翻訳
用データが格納されることになる。このように、翻訳用
データには、図3に示されている文章データに含まれて
いたスペースはすべて除去されており、翻訳処理に適し
た文章となっている。
【0024】なお、図3および図4の例では、図3に含
まれているスペースがすべて削除されているが、文章の
内容によっては、スペースも含めた形の複合語として考
えられるような文章が存在する。すなわち必要なスペー
スを有する語、たとえば“DUET△E/J”等のよう
な文字である。このような複合語にあっては、スペース
は削除せずに、このようなスペースを含んだ文字の状態
で翻訳用のデータを作成すべきである。
【0025】このような複合語に対して図2のフローに
よって、文書変換装置3がどのような処理を行なうかに
ついて説明する。この場合、“T”と、“E”との間に
含まれるスペースコード△が読取られると、フローはス
テップS8からステップS9に進む。そして、次の文字
が1文字読取られるが、この例では次の文字は“E”で
あるので、フローはステップS10からステップS14
に進む。そして、読取られた文字すなわちこの例ではス
ペースコード“△”と“E”の文字が、翻訳用のデータ
ファイルに格納されることになる。結果として、“DU
ET△E/J”の文字はそのスペースを含んだそのまま
の状態で翻訳用のデータとして格納されることになる。
このように、この発明の一実施例によれば、翻訳に必要
なスペースまで消去することはなく、そのようなスペー
スの必要性まで判断して翻訳に適した翻訳用データを生
成することができる。
【0026】また、上記実施例では、文字の後にスペー
スコードが2以上含まれている場合に限り、改行記号
“↓”の内容を翻訳用データファイル4に格納している
が、“。”等の文章の終端記号の後にも改行記号を入れ
て処理することも可能である。
【0027】
【発明の効果】この発明は以上説明したとおり、変換手
段が入力された文章をスペースを含まない文章に変換す
るので、翻訳機による翻訳が効率的に行なわれ、翻訳コ
ストが低減する。
【図面の簡単な説明】
【図1】この発明の一実施例による文書変換装置を含ん
だ翻訳機廻りのシステムブロック図である。
【図2】図1に示されている文書変換装置の処理内容を
示したフローチャートである。
【図3】この発明の一実施例による文書変換装置の動作
を説明するための具体的な例であって、文書変換装置に
入力された文章を示した図である。
【図4】この発明の一実施例による文書変換装置の動作
を説明するための具体的な例であって、図3に示された
文章に対して変換処理を行なった文書変換装置から出力
された文章を示した図である。
【図5】従来の翻訳機廻りのシステムブロック図であ
る。
【符号の説明】
1 スキャナ 2 文字認識装置 3 文字変換装置 4 翻訳用データファイル 5 翻訳処理装置

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 翻訳すべき文章であって、翻訳に不要な
    スペースと文字とが混在した文章を入力する入力手段
    と、 前記入力された文章に含まれているスペースを検出する
    検出手段と、 前記検出手段の検出出力に応答して、前記入力された文
    章をスペースを含まない文章に変換する変換手段とを備
    えた、文書変換装置。
JP3251937A 1991-09-30 1991-09-30 文書変換装置 Pending JPH0589164A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3251937A JPH0589164A (ja) 1991-09-30 1991-09-30 文書変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3251937A JPH0589164A (ja) 1991-09-30 1991-09-30 文書変換装置

Publications (1)

Publication Number Publication Date
JPH0589164A true JPH0589164A (ja) 1993-04-09

Family

ID=17230196

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3251937A Pending JPH0589164A (ja) 1991-09-30 1991-09-30 文書変換装置

Country Status (1)

Country Link
JP (1) JPH0589164A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332944A (ja) * 1993-05-19 1994-12-02 Brother Ind Ltd 翻訳機能を備えた文書処理装置
JPH11191105A (ja) * 1997-09-18 1999-07-13 Just Syst Corp 文書データ処理方法及び処理装置とその処理プログラムを記録した記録媒体

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01302483A (ja) * 1988-05-31 1989-12-06 Fuji Electric Co Ltd 文書読取装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01302483A (ja) * 1988-05-31 1989-12-06 Fuji Electric Co Ltd 文書読取装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06332944A (ja) * 1993-05-19 1994-12-02 Brother Ind Ltd 翻訳機能を備えた文書処理装置
JPH11191105A (ja) * 1997-09-18 1999-07-13 Just Syst Corp 文書データ処理方法及び処理装置とその処理プログラムを記録した記録媒体

Similar Documents

Publication Publication Date Title
US5587902A (en) Translating system for processing text with markup signs
JP3294919B2 (ja) 機械翻訳装置
JPH0589164A (ja) 文書変換装置
JPH0728829A (ja) 翻訳支援装置
JPH06301713A (ja) 対訳表示方法及び文書表示装置並びにディジタル複写装置
JPH07182344A (ja) 機械翻訳装置
JP2894064B2 (ja) 機械翻訳装置
JP3194529B2 (ja) 機械翻訳装置
JPH07319879A (ja) 翻訳処理装置
JPH0756924A (ja) 対訳装置
JPH01197876A (ja) 電子辞書
JPH06176061A (ja) 機械翻訳装置
JPH0666065B2 (ja) 振仮名付加機能付き文書処理装置
JPH0685169B2 (ja) 文書処理方式
JPH08339365A (ja) 文書作成装置及び文書作成方法
JPS60157661A (ja) カナ漢字変換処理方式
JPH01112368A (ja) 機械翻訳装置
JPH0695330B2 (ja) 文書作成装置
JPH02122367A (ja) かな漢字変換装置
JPH03235162A (ja) かな漢字変換装置
JPS60225248A (ja) 文字列表示方式
JPH0546344A (ja) 日本語入力装置
JPS63244257A (ja) 文書作成システム
JPH07152763A (ja) 機械翻訳装置と該装置における翻訳方法
JPH06176011A (ja) 漢字変換方式

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19980526