JP2758596B2 - 自動翻訳装置 - Google Patents

自動翻訳装置

Info

Publication number
JP2758596B2
JP2758596B2 JP61060316A JP6031686A JP2758596B2 JP 2758596 B2 JP2758596 B2 JP 2758596B2 JP 61060316 A JP61060316 A JP 61060316A JP 6031686 A JP6031686 A JP 6031686A JP 2758596 B2 JP2758596 B2 JP 2758596B2
Authority
JP
Japan
Prior art keywords
attribute
translation
unit
information
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61060316A
Other languages
English (en)
Other versions
JPS62217365A (ja
Inventor
廣洲 石黒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP61060316A priority Critical patent/JP2758596B2/ja
Publication of JPS62217365A publication Critical patent/JPS62217365A/ja
Application granted granted Critical
Publication of JP2758596B2 publication Critical patent/JP2758596B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は自動翻訳装置に関し、特に翻訳対象となる文
書の入力を半自動化する自動翻訳装置に関する。 〔従来の技術〕 従来、この種の自動翻訳装置においては、翻訳対象と
なる入力文書は、キーボードより入力するのが一般的で
あった。 〔発明が解決しようとする問題点〕 上述した従来の自動翻訳装置では、入力をキーボード
で行うため、入力速度が遅く、これが翻訳時間を制御す
る要素となっている。すなわち、自動翻訳の高速化に
は、文書の入力速度の向上が不可欠といえる。 本発明の目的は自動翻訳の高速化を実現ならしめた自
動翻訳装置を提供することにある。 〔問題点を解決するための手段〕 本発明の会話型自動翻訳装置は、翻訳対象を光学的に
走査して得られる目視可能なパターン情報と最初は属性
欄が空欄となった属性表示画面とをあわせて表示する表
示部と、前記属性表示画面の空欄に、行の内容、分野の
うち少なくとも一つの情報を含む認識用辞書を規定する
ための属性情報を、外部からオペレータが入力する属性
情報指示部と、前記属性情報指示部により指示された属
性情報にしたがって、前記翻訳対象を認識する文字認識
部と、前記文字認識部により認識された前記翻訳対象を
翻訳する翻訳部とを備えることを特徴とする。 〔作用〕 文書入力に光学文字読取装置(OCR)を利用する場
合、単に文書を認識させ、その結果を用いて翻訳を行う
ことができる。しかしこの場合、一般文書をOCRに入力
することになり、様式や文字、サイズの変化または文字
フォントの変化等文字認識そのものを困難にする要素が
多く、OCRが高価になってしまう。この不具合を緩和す
るため、翻訳文書入力のオペレータが文書の内容を確認
しつつ、文書の各項の属性を確認し、この属性をOCRに
指示してやることによって文字認識の参照情報とし、文
字認識の容易化を図る。 〔実施例〕 以下、本発明の一実施例を図により説明する。 第1図において、本発明による自動翻訳装置は翻訳用
文書を光学的に読み取る走査装置1と、翻訳用文書7を
走査して得られた情報を一時記憶用バッファメモリ2
と、走査情報を表示する表示装置3と、表示内容の属性
指示を行うキーボード等の属性指示部6と、属性指示を
参照してバッファメモリの内容を認識する認識装置4
と、この認識結果を用いて翻訳の制御を行う翻訳部5と
を具備している。 実施例において、走査装置1は翻訳対象の文書7を走
査し、パターン情報を光学的に読み取り、その情報をバ
ッファメモリ2に一旦記憶させる。パターン情報は表示
装置3に表示され、オペレータが内容を目視により確認
できるよう構成されている。オペレータは文書7の各行
の属性を表示装置3上の画面で確認したあと、属性指示
部6より属性指示情報61を認識装置4に入力する。認識
装置4はバッファメモリ2内に一旦記憶されたパターン
情報を受け取り、属性指示情報61を参照しつつ、各文字
を認識するよう構成されている。認識結果41は翻訳部5
の入力となり、ここで文書7の内容が翻訳される。翻訳
言語については、通常の翻訳装置への指示と同じであ
る。 第2図(a),(b)は第1図における翻訳対象の文
書7の一例を図示したもので、第2図(a)は文書の
例、同図(b)は、各行の属性情報の代表例を示したも
のがある。 第1図の表示装置3には第2図(a)が表示されると
共に、属性指示画面として第2図(b)も合わせて表示
される。但しこの場合、各属性の内容は最初ブランクに
なっており、オペレータが第2図(a)を見て第2図
(b)の各項に図示した情報を入力することで属性指示
情報となる。属性指示情報は各行において、例えば図示
したように内容、分野、字種、字体、文字サイズからな
る。これらの指示情報の「内容、分野」は文字認識時の
単語辞書を規定することに用いられる他、行目のよう
に説明図としてイメージ入力し、認識対象としないよう
な指示も含まれる。「字種」については文書の各行がど
のような言語で記述されているかを示す。「字体や文字
サイズ」は、認識対象を1文字づつ切り出す時の情報あ
るいは、認識辞書の選択等に使用される。 属性指示情報の細目については、翻訳対象となる文書
の範囲やOCRの性能によって変化するものであるが、こ
の変化を吸収するように装置を構成することは当業者に
とっては容易なことである。 なお、第1図に示した実施例に加え、例えば認識結果
41を再度オペレータに示してチェック、修正させるよう
構成したり、属性情報そのものを変更してリトライさせ
ることも可能である。さらに、翻訳結果をフィードバッ
クして指示情報を変更するよう構成することもできる。
このようにして、入力と翻訳を有機的に連結し、オペレ
ータ介在の会話型翻訳装置を構成することができる。ま
た、入力文書の言語の種類はOCRの認識辞書の変更で対
処することができる。 〔発明の効果〕 以上説明したように本発明によれば、指示する属性に
少なくとも内容,分野の情報を含めて単語辞書に作用
し、単語認識の性能を高めた上で認識辞書による文字認
識を行なうため、文字認識の精度を向上でき、ひいては
翻訳速度や精度の向上を図ることができる。さらに表示
装置の画面表示に基づいて会話方式により属性の指示を
行なうため、光学文字読取装置に読み取られたパターン
情報が定型或いは非定型のものであっても、パターン情
報に必要な属性を確実に指示することができ、定型及び
非定型のものを問わずいずれのパターン情報も翻訳する
ことができる。また、装置を会話型にすることにより、
各部の処理結果をフィードバックし、オペレータが再度
判断しなおして翻訳の信頼性を高めることもできる。入
力文書についていえば、特に英文のようにタイプされた
ものはOCRでの認識が容易であるが、近年日本におい
て、ワードプロセッサが普及しているため、日本語入力
において、手書きではなく一般化したワードプロセッサ
で出力した原稿をOCRの入力とすることにより、認識率
を向上でき、本発明装置をより有効に活用できる効果を
有するものである。
【図面の簡単な説明】 第1図は本発明の一実施例のブロック図、第2図
(a),(b)は第1図で示した装置の入力となる文書
の例と属性情報の関係を示した図である。 1……走査装置、2……バッファメモリ、3……表示装
置、4……認識装置、5……翻訳部、6……属性指示
部、7……入力文書

Claims (1)

  1. (57)【特許請求の範囲】 1.翻訳対象を光学的に走査して得られる目視可能なパ
    ターン情報と最初は属性欄が空欄となった属性表示画面
    とをあわせて表示する表示部と、 前記属性表示画面の空欄に、行の内容、分野のうち少な
    くとも一つの情報を含む認識用辞書を規定するための属
    性情報を、外部からオペレータが入力する属性情報指示
    部と、 前記属性情報指示部により指示された属性情報にしたが
    って、前記翻訳対象を認識する文字認識部と、 前記文字認識部により認識された前記翻訳対象を翻訳す
    る翻訳部と を備えることを特徴とする会話型の自動翻訳装置。
JP61060316A 1986-03-18 1986-03-18 自動翻訳装置 Expired - Lifetime JP2758596B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61060316A JP2758596B2 (ja) 1986-03-18 1986-03-18 自動翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61060316A JP2758596B2 (ja) 1986-03-18 1986-03-18 自動翻訳装置

Publications (2)

Publication Number Publication Date
JPS62217365A JPS62217365A (ja) 1987-09-24
JP2758596B2 true JP2758596B2 (ja) 1998-05-28

Family

ID=13138647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61060316A Expired - Lifetime JP2758596B2 (ja) 1986-03-18 1986-03-18 自動翻訳装置

Country Status (1)

Country Link
JP (1) JP2758596B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59206985A (ja) * 1983-05-11 1984-11-22 Hitachi Ltd 機械翻訳方式
JPS6074094A (ja) * 1983-09-30 1985-04-26 Fujitsu Ltd 文字認識装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子通信学会技術報告 PRL82−77

Also Published As

Publication number Publication date
JPS62217365A (ja) 1987-09-24

Similar Documents

Publication Publication Date Title
US5875428A (en) Reading system displaying scanned images with dual highlights
US5717794A (en) Document recognition method and system
US5581752A (en) Electronic document retrieval and display system and method of retrieving electronically stored documents
US6052663A (en) Reading system which reads aloud from an image representation of a document
JP2758952B2 (ja) 日本語文書読取翻訳システムの修正時における表示方式
US6137906A (en) Closest word algorithm
JP2979109B2 (ja) 認識文字の情報作成方法及び装置
US4941195A (en) Optical character reader
US5596753A (en) Scanner interactive application program
EP0457546B1 (en) Image processing method and apparatus
JP2758596B2 (ja) 自動翻訳装置
JPH096901A (ja) 文書読取装置
US5481663A (en) Word processors for performing an automatic layout process
JP2904849B2 (ja) 文字認識装置
JP7003457B2 (ja) 文書再構成装置
JPH06149888A (ja) 電子ファイリングシステム
JP3424942B2 (ja) 対訳画像形成装置
WO1999024969A1 (en) Reading system that displays an enhanced image representation
JPH03248260A (ja) 文書処理装置
JPS61131082A (ja) Ocrのリジエクト文字表示方式
JP2682873B2 (ja) 表形式文書の認識装置
JP2739744B2 (ja) 文字出力装置
JPH04293185A (ja) ファイリング装置
JPS63265374A (ja) 文字読み取り装置
JPH0916717A (ja) 文書読取装置