JPS61198375A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS61198375A
JPS61198375A JP60039277A JP3927785A JPS61198375A JP S61198375 A JPS61198375 A JP S61198375A JP 60039277 A JP60039277 A JP 60039277A JP 3927785 A JP3927785 A JP 3927785A JP S61198375 A JPS61198375 A JP S61198375A
Authority
JP
Japan
Prior art keywords
characters
character
operator
detection
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60039277A
Other languages
English (en)
Other versions
JPH0459669B2 (ja
Inventor
Hiromi Nanba
難波 広海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60039277A priority Critical patent/JPS61198375A/ja
Publication of JPS61198375A publication Critical patent/JPS61198375A/ja
Publication of JPH0459669B2 publication Critical patent/JPH0459669B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、文書上に記録された文字及び図形の読取処理
を行なう光学的文字読取装置に関する。
〔発明の技術的背景とその問題点] 近年、文字及び図形が混在したl!籍、新聞及び図面等
の文書を読取ることが可能な光学的文字読取装置の開発
が行われている。このような装置では、文字及び図形を
識別して、文字に対しては認識処理後に文字コードを出
力し、また図形をイメージデータとして読取る機能が必
要となる。しかしながら、従来の装置では、前記のよう
な機能を完全に実現することは困難であり、一部の処理
についてオペレータの支援作業が必要な方式が採用され
ている。
具体的には、例えば文字検出切出処理等に必要なフォー
マットコントロール情報を読取開始前にタブレットやマ
ークで指定する方式がある。この方式では、読取対象で
ある各シート毎にフォーマットコントロール情報の指定
作業が必要となり、オペレータの作業負担が大きくなる
。また、文字認識処理後の認識結果をCRTディスプレ
イ装置の画面上に表示し、オペレータが表示結果と原文
書とを照合して、異なる場合には修正処理を行なう方式
がある。さらに、読取対象のシート上を走査(光電変換
を含む)して得られる走査画像と認識結果を同時に表示
し、オペレータが前記両者を照合して修正する方式等が
ある。このような各方式では、いずれもWg識処理後の
最終結果を修正することになる。このため、文字の検出
切出処理や文字9図形の識別処理が誤動作している場合
、誤読または読取不能が大幅に増大し、オペレータの修
正作業に要する時間が多大となることがある。
また、読取対象の原シートと表示される読取結果のフォ
ーマットは通常では異なるため、オペレータの照合作業
は困難となり、誤りを発生しやすい。
このため、従来の光学的文字読取装置では、オペレータ
の支援作業の負担が大きく、読取処理の効率が低下する
問題がある。
[発明の目的] 本発明の目的は、文字及び図形の混在する文書の読取装
置において、オペレータの支援作業を軽減化し、高効率
で確実な読取処理を実現することができる光学的文字読
取装置を提供することにある。
[発明の概要] 本発明では、画像メモリ内の画像データから文字及び図
形の検出切出処理を実行し、各検出切出位置の検切情報
を作成する検出切出手段が設けられる。この検出切出手
段により作成された検切情報及び画像メモリから出力さ
れる画像データに対応する文字1図形は、表示手段によ
り表示されるように構成されている。さらに、オペレー
タが表示手段に表示された検切情報に基づいて確認、l
E正千手段操作することにより、画像メモリ内の文字及
び図形の各検出切出位置を確認又は修正する。
文字認識手段は、確認、修正手段により決定された検出
切出位置で、検出切出手段により検出切出された文字を
認識することになる。
このような構成により、オペレータは確認、修正手段を
操作するだけで、文字及び図形の混在した文書に対する
読取処理を効率的に行なうことが可能となる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は本発明の一実施例に係わる光学的文字読取装置の構
成を示すブロック図である。第1図において、光電変換
部10は、読取対象の文書上を走査0、文書上に記録さ
れた文学及び図形を画像信号に変換する。イメージバッ
ファメモリ(以下イメージバッファと称す)11は、光
電変換部10から出力される画像信号からなる画像デー
タを格納する。検出切出部12は、イメージバッファ1
1内の画像データから文字及び図形を識別し、文字及び
図形の検出切出(検切)処理を行なう。文字認識部13
は、検出切出部12で検切された文字のWglE処理を
実行して、i!!識結果である文字コードを編集部14
へ出力する。画像圧縮部16は、検出切出部12により
検切された図形の画像データを圧縮して編集部14へ出
力する。編集部14は、文字1識部13からの認識結果
及び画像圧縮部16からの図形を、予め設定されたフォ
ーマットに編集する。出力装置15は、編集部14で編
集された文字及び図形を印字するプリンタまたは記憶す
る磁気ディスク装置等である。
一方、第1のデータバッファメモリ(以下データバッフ
ァと称す)17は、検出切出部12で作成された文字及
び図形の検切位置を示す検切情報を格納するメモリであ
る。第2のデータバッファ18は、文字認識部13から
出力される認識結果を格納する。
表示制御部19は、データバッフ?17.18及びイメ
ージバッファ11の各記憶内容を合成または選択してC
RTディスプレイ装@(以下CRTと称す)20の画面
上に表示させる。座標入力装置(マウス)21は、CR
T20の画面上の位置座標を指定し入力する装置である
。キーボード22は、各種データを入力する入力装置で
ある。さらに、制■部23は、装置全体の動作制御を行
なう回路である。
このような構成の光学的文字読取装置において、同実施
例の動作を第2図のフローチャートを参照して説明する
。先ず、第2図のステップS1に示すように、読取対象
の文書が光電変換部10により走査されると、例えば1
頁分の文字及び図形が画像信号に変換される。画像信号
からなる画像データは、イメージバッファ11に格納さ
れる。次に、ステップS2では検出切出部12による検
切処理が開始される。検出切出部12では、イメージバ
ッファ11内の画像データから文字及び図形の識別がな
される。この識別処理は、通常では例えば画像データの
周辺分布ヒストグラムを利用する方式またはランレング
スによる図形の抽出法を利用した方式等により実行され
る。さらに、検出切出部12では、識別された文字画像
に対して文字行9文字サイズ、文字ピッチ等が検知さ、
れて、1文字毎に区分される。このとき、ステップS3
に示すように、1文字毎に区分される際に作成される検
切位置情報(以下切出し枠情報と称す)が検出切出部1
2がらデータバッファ17へ格納される。同様に、図形
を検切する際に作成される切出し枠情報もデータバッフ
ァ17へ格納される。
検出切出部12の動作が終了すると、表示制御部19に
よりステップS4の動作がなされる。即ち、表示制御部
19は、イメージバッファ11から画像データを読出し
て、第3図(a>に示すような文書を走査して得た文字
30及び図形31から成る画像データを読出す。ざらに
、表示制御部19は、データバッファ17から切出し枠
情報を読出して、第3図(b)に示すように文字30及
び図形31とそれに対応する各切出し枠32.33とを
重ね合せてCRT20の画面上に表示させる。このとき
、表示制御部19は、例えば文字と図形に対応する各切
出し枠32゜33を別の色でカラー表示したり、また文
字3oの向きが縦または横の場合に別けて各文字を別の
色でカラー表示する。
次のステップ$5では、オペレータはCRT20の画面
の表示を見て、切出し枠により検出切出部12の検切結
果を確認する。即ち、オペレータは、切出し枠の位置に
より文字及び図形の検切位Iを判定し、適正であればキ
ーボード22から確認指示信号を制御部23へ入力する
。判定結果により検切位置が誤っている場合、オペレー
タはマウス21を操作してCRT20の画面上で検切位
置の修正を行なう。この修正処理では、例えばCRT2
0の画面の端に櫟能選択画像が表示されて、オペレータ
により文字検切位置移動、削除、追加0文字の方向変更
、読取対象から除外等の機能から選択される。
この後、オペレータの操作によるマウス21で、検切位
置の変更位置が指定される。検切位置の変更指示は、表
示制御部19から制御部23へ転送されて、さらに制御
部23から検出切出部12へ転送される。
これにより、検出切出部12は、データバッファ17内
の格納された切出し枠情報を修正する。
オペレータによるf1認、vi正作業が終了すると、検
出切出部12はデータバッファ17内の析たに決定され
た検切情報に基づいて、イメージバッファ11から文字
及び図形に対する検切処理を行なう。検出切出部12で
検切された1文字毎の画像データは、文字vll郡部3
へ出力されて認識処理されることになる(ステップ86
)。また、検出切出部12から検切された図形に対応す
る画像データは、画像圧縮部16で圧縮処理後に編集部
14へ転送される。文字認M部13は、認識結果である
文字コードを編集部14へ出力する。ここで、文字認識
部13は、認識結果をデータバッフ?18へ格納する。
表示制御部19は、データバッファ18から認識結果を
読出して、CRT20の画面上に表示させる。オペレー
タは、表示された認識結果(例えば複数の候補文字から
なる)を確認し、例えばリジェクトの場合にはマウス2
1により複数の候補文字から選択する。また、誤読の場
合にはオペレータは表示された認識結果に対して、修正
文字をキーボードから入力したり、文字の削除等の修正
作業を行なう。これにより、ステップS7に示す認識結
果に対する確認、修正処理がなされる。編集部14は、
文字認識部13がら出力される認識結果(ステップS7
による修正処理後の認識結果)及び画像圧縮部16から
の図形を、予め設定されたフォーマットに編集した後に
出力装置15へ転送する。
ここで、表示制御部19によりCRT20の画面上に表
示される画像は、例えば第4図(a)に示すような縦向
き文書または同図(b)に示す横向き文書の場合がある
。また、第4図(C)は、文字画像と切出し枠を重ねた
場合の表示例であり、同図(d)は文字がイタリック体
の場合の外接枠の表示例である。尚、前記のように文字
と図形の外接枠に応じて色を区別してカラー表示を行な
う以外に、画面表示を時間的に変化させて表示区別を行
なうようにしてもよい。さらに、前記のステップS5に
おいて、検切位置の修正作業が終了したら、次に文字の
認識結果及び図形の外部への出力順序をマウス21又は
キーボード22から指定するような機能を設けてもよい
。例えば、前記のステップS5において第5図に示すよ
うに、CRT20上に文字1図形とその切出し枠が表示
されている画面上にて、マウス21で出力順序指定枠5
0〜52を指定しその表示をすると共に、この出力順序
指定枠間における出力順序を指定する。具体的には、出
力順序を50〜53の順で指定した場合には、この順序
でそれぞれ出力順序指定枠で囲まれるでいる文字又は図
形を外部へ出力する。
前記のようにして、検出切出部12での検切処理結果(
検切情報)を表示して、確認、修正処理後に文字認識処
理を行なうため、認識不能及び誤読を大幅に防止するこ
とができる。したがって、認識結果に対するオペレータ
の修正作業を軽減できることになる。さらに、オペレー
タはCRT20の画面上に表示された画像及び切出し枠
を見ながら、検切結果の確認、修正を行なうため、オペ
レータによる確認、修正作業は極めて簡単に行なうこと
ができる。
[発明の効果] 以上詳述したように本発明によれば、文字及び図形が混
在した文書を読取る光学的文字読取装置において、検切
情報に基づくオペレータの簡単な確認、修正作業により
読取率を向上することができる。したがって、結果的に
最終的認識結果に対するオペレータの支援作業を軽減化
し、高効率で確実な読取処理を実現することができるも
のである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第28得は同実施例の動作を
説明するためのフローチャート、第3図乃至第5図はそ
れぞれ同実施例の動作を説明するための画像の表示例を
示す図である。 10・・・光電変換部、11・・・イメージバッファ、
12・・・検出切出部、13・・・文字認識部、17.
18・・・データバッファメモリ、19・・・表示制御
部、20・・・CRTディスプレイ装置、21・・・マ
ウス。 出願人代理人 弁理士 鈴 江 武 彦第2図 第3図 (a)       (b) 第4図 (a)       (b) 第4図 (c)       (d) 第5図

Claims (1)

    【特許請求の範囲】
  1. 記録媒体上に記録された文字及び図形を走査して画像信
    号に変換する走査手段と、この走査手段により得られる
    文字及び図形の各画像データを格納する画像メモリと、
    この画像メモリ内の画像データから文字及び図形の検出
    切出処理を実行し各検出切出位置を示す検切情報を作成
    する検出切出手段と、この検出切出手段により作成され
    た前記検切情報及び前記画像メモリから出力される画像
    データに対応する文字、図形を重ねて表示する表示手段
    と、この表示手段の表示情報に基づいて前記画像メモリ
    内の文字及び図形の各検出切出位置を確認又は修正する
    確認、修正手段と、この確認、修正手段により決定され
    た検出切出位置で検出切出された文字を認識する文字認
    識手段とを具備したことを特徴とする光学的文字読取装
    置。
JP60039277A 1985-02-28 1985-02-28 光学的文字読取装置 Granted JPS61198375A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60039277A JPS61198375A (ja) 1985-02-28 1985-02-28 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60039277A JPS61198375A (ja) 1985-02-28 1985-02-28 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPS61198375A true JPS61198375A (ja) 1986-09-02
JPH0459669B2 JPH0459669B2 (ja) 1992-09-22

Family

ID=12548670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60039277A Granted JPS61198375A (ja) 1985-02-28 1985-02-28 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS61198375A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61208584A (ja) * 1985-03-13 1986-09-16 Mitsubishi Electric Corp 文字読取装置
JPH02187883A (ja) * 1989-01-13 1990-07-24 Mitsubishi Electric Corp 文書読取装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61208584A (ja) * 1985-03-13 1986-09-16 Mitsubishi Electric Corp 文字読取装置
JPH02187883A (ja) * 1989-01-13 1990-07-24 Mitsubishi Electric Corp 文書読取装置

Also Published As

Publication number Publication date
JPH0459669B2 (ja) 1992-09-22

Similar Documents

Publication Publication Date Title
JP2835178B2 (ja) 文書読取装置
JPH08329187A (ja) 文書読取装置
JPS61198375A (ja) 光学的文字読取装置
JPH0473192B2 (ja)
JPH0373914B2 (ja)
JPS61198378A (ja) 光学的文字読取装置
JPH0473193B2 (ja)
JPH05292294A (ja) デジタル複写機
JPS63158676A (ja) 領域抽出装置
JPH117493A (ja) 文字認識処理装置
JP3269889B2 (ja) 光学式文字読取システム
JPH08137987A (ja) 光学式文字読取装置
JPH04156694A (ja) 文字認識方式
JPH08321942A (ja) 画像処理装置及び分割図面の画像接合方法
JPH0916712A (ja) 文書読取装置
JPS61160179A (ja) 文字認識方式
JPH11250179A (ja) 文字認識装置および文字認識方法
JP3077580B2 (ja) 文字読取装置
JPH08202824A (ja) 文書画像認識装置
JP2003085477A (ja) 文字認識装置および文字認識結果の訂正方法
JPS6039276A (ja) 光学文字読み取り装置
JPH01245376A (ja) 文字読取装置の文字切出し装置
JPH08329188A (ja) 文書読取装置
JPH11224307A (ja) 文書認識装置及びその方法
JPH03108085A (ja) 文書読取装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term