JPH0473192B2 - - Google Patents

Info

Publication number
JPH0473192B2
JPH0473192B2 JP60039278A JP3927885A JPH0473192B2 JP H0473192 B2 JPH0473192 B2 JP H0473192B2 JP 60039278 A JP60039278 A JP 60039278A JP 3927885 A JP3927885 A JP 3927885A JP H0473192 B2 JPH0473192 B2 JP H0473192B2
Authority
JP
Japan
Prior art keywords
character
detection
characters
cutting
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP60039278A
Other languages
English (en)
Other versions
JPS61198376A (ja
Inventor
Hiromi Nanba
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP60039278A priority Critical patent/JPS61198376A/ja
Publication of JPS61198376A publication Critical patent/JPS61198376A/ja
Publication of JPH0473192B2 publication Critical patent/JPH0473192B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、文書上に記録された文字及び図形の
読取処理を行なう光学的文字読取装置に関する。
[発明の技術的背景とその問題点] 近年、文字及び図形が混在した書籍、新聞及び
図面等の文書を読取ることが可能な光学的文字読
取装置の開発が行われている。このような装置で
は、文字及び図形を識別して、文字に対しては認
識処理後に文字コードを出力し、また図形をイメ
ージデータとして読取る機能が必要となる。しか
しながら、従来の装置では、前記のような機能を
完全に実現することは困難であり、一部の処理に
ついてオペレータの支援作業が必要な方式が採用
されている。
具体的には、例えば文字検出切出処理等に必要
なフオーマツトコントロール情報を読取開始前に
タブレツトやマークで指定する方式がある。この
方式では、読取対象である各シート毎にフオーマ
ツトコントロール情報の指定作業が必要となり、
オペレータの作業負担が大きくなる。また、文字
認識処理後の認識結果をCRTデイスプレイ装置
の画面上に表示し、オペレータが表示結果と原文
書とを照合して、異なる場合には修正処理を行な
う方式がある。さらに、読取対象のシート上を走
査(光電変換を含む)して得られる走査画像と認
識結果を同時に表示し、オペレータが前記両者を
照合して修正する方式等がある。このような各方
式では、いずれも認識処理後の最終結果を修正す
ることになる。このため、文字の検出切出処理や
文字、図形の識別処理が誤動作している場合、誤
読または読取不能が大幅に増大し、オペレータの
修正作業に要する時間が多大となることがある。
また、読取対象の原シートと表示される読取結果
のフオーマツトは通常では異なるため、オペレー
タの照合作業は困難となり、誤りを発生しやす
い。
このため、従来の光学的文字読取装置では、オ
ペレータの支援作業の負担が大きく、読取処理の
効率が低下する問題がある。
[発明の目的] 本発明の目的は、文字及び図形の混在する文書
の読取装置において、オペレータの支援作業を軽
減化し、高効率で確実な読取処理を実現すること
ができる光学的文字読取装置を提供することにあ
る。
[発明の概要] 本発明では、画像メモリ内の画像データから文
字及び図形の検出切出処理を実行し、各検出切出
位置の検切情報を作成する検出切出手段が設けら
れる。この検出切出手段により検切された文字
は、文字認識手段により認識処理される。この認
識結果及び検出切出手段により作成された検切情
報は、表示手段により表示されるように構成され
ている。さらに、オペレータが表示手段に表示さ
れた検切情報に基づいて確認、修正手段を操作す
ることにより、画像メモリ内の文字及び図形の各
検出切出位置を確認又は修正する。文字認識手段
は、確認、修正手段により決定された検出切出位
置で、検出切出手段により検出切出された文字を
再認識するように制御される。
このような構成により、オペレータは確認、修
正手段を操作するだけで、文字及び図形の混在し
た文書に対する読取処理を効率的に行なうことが
可能となる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明す
る。第1図は本発明の一実施例に係わる光学的文
字読取装置の構成を示すブロツク図である。第1
図において、光電変換部10は、読取対象の文書
上を走査し、文書上に記録された文字及び図形を
画像信号に変換する。イメージバツフアメモリ
(以下イメージバツフアと称す)11は、光電変
換部10から出力される画像信号からなる画像デ
ータを格納する。検出切出部12は、イメージバ
ツフア11内の画像データから文字及び図形を識
別し、文字及び図形の検出切出(検切)処理を行
なう。文字認識部13は、検出切出部12で検切
された文字の認識処理を実行して、認識結果であ
る文字コードを編集部14へ出力する。画像圧縮
部16は、検出切出部12より検切された図形の
画像データを圧縮して編集部14へ出力する。編
集部14は、文字認識部13からの認識結果及び
画像圧縮部16からの図形を、予め設定されたフ
オーマツトに編集する。出力装置15は、編集部
14で編集された文字及び図形を印字するプリン
タまたは記憶する磁気デイスク装置等である。
一方、第1のデータバツフアメモリ(以下デー
タバツフアと称す)17は、検出切出部12で作
成された文字及び図形の検切位置を示す検切情報
を格納するメモリである。第2のデータバツフア
18は、文字認識部13から出力される認識結果
を格納する。表示制御部19は、データバツフア
17,18及びイメージバツフア11の各記憶内
容を合成または選択してCRTデイスプレイ装置
(以下CRTと称す)20の画面上に表示させる。
座標入力装置(マウス)21は、CRT20の画
面上の位置座標を指定し入力する装置である。キ
ーボード22は、各種データを入力する入力装置
である。さらに、制御部23は、装置全体の動作
制御を行なう回路である。
このような構成の光学的文字読取装置におい
て、同実施例の動作を第2図のフローチヤートを
参照して説明する。先ず、第2図のステツプS1
に示すように、読取対象の文書が光電変換部10
により走査されると、例えば1頁分の文字及び図
形が画像信号に変換される。画像信号からなる画
像データは、イメージバツフア11に格納され
る。次に、ステツプS2では検出切出部12によ
る検切処理が開始される。検出切出部12では、
イメージバツフア11内の画像データから文字及
び図形の識別がなされる。この識別処理は、通常
では例えば画像データの周辺分布ヒストグラムを
利用する方式またはランレングスによる図形と抽
出法を利用した方式等により実行される。さら
に、検出切出部12では、識別された文字画像に
対して文字行、文字サイズ、文字ピツチ等が検知
されて、1文字毎に区分される。このとき、ステ
ツプS3に示すように、1文字毎に区分される際
に作成される検切位置情報(以下切出し枠情報と
称す)が検出切出部12からデータバツフア17
へ格納される。同様に、図形を検切する際に作成
される切出し枠情報もデータバツフア17へ格納
される。
検出切出部12の動作が終了すると、検出切出
部12で検切された1文字毎の画像データは、文
字認識部13へ出力されて認識処理されることに
なる(ステツプS4)。また、検出切出部12から
検切された図形に対応する画像データは、画像圧
縮部16で圧縮処理後に編集部14へ転送され
る。文字認識部13は、認識結果である文字コー
ドを編集部14へ出力する。ここで、文字認識部
13は、認識結果をデータバツフア18へ格納す
る。これにより、表示制御部19は、データバツ
フア18から認識結果を読出して、CRT20の
画面に表示する。次に、表示制御部19によりス
テツプS5の動作がなされる。即ち、表示制御部
19は、イメージバツフア11から第3図aに示
すような文書を走査して得た文字30及び図形3
1から成る画像データを読出す。さらに、表示制
御部19は、データバツフア17から切出し枠情
報を読出して、第3図bに示すように文字30及
び図形31とそれに対応する各切出し枠32,3
3とを重ね合せてCRT20の画面上に表示させ
る。このとき、表示制御部19は、例えば文字と
図形に対応する各切出し枠32,33を別の色で
カラー表示したり、また文字30の向きが縦また
は横の場合に別けて各文字を別の色でカラー表示
する。
次のステツプS6では、オペレータはCRT20
の画面に表示された内容により、切出し枠として
表示された検出切出部12の検切結果、認識結果
および画像データを確認する。そして、この切出
し枠、認識結果および画像データに基づいて、文
字及び図形の検切位置が適正であるか否かを判定
する。この判定結果により検切位置が適正であれ
ば、キーボード22から確認指示信号を制御部2
3に入力する。
判定結果により検切位置が誤つている場合、オ
ペレータはマウス21を操作してCRT20の画
面上で検切位置の修正を行なう。この修正処理で
は、例えばCRT20の画面の端に機能選択画像
が表示されて、オペレータにより文字検切位置移
動、削除、追加、文字の方向変更、読取対象から
除外等の機能から選択される。この後、オペレー
タの操作によるマウス21で、検切位置の変更位
置が指定される。検切位置の変更指示は、表示制
御部19から制御部23へ転送されて、さらに制
御部23から検出切出部12へ転送される。これ
により、検出切出部12は、データバツフア17
内の格納された切出し枠情報を修正する。
オペレータによる確認、修正作業が終了する
と、制御部23によるステツプS7の再認識処理
が実行される。即ち、検出切出部12はデータバ
ツフア17内の新たに決定された検切情報に基づ
いて、制御部23により指定される文字及び図形
に対してイメージバツフア11から検切処理を行
なう。検出切出部12で検切された1文字毎の画
像データは、文字認識部13へ出力されて再認識
処理されることになる。再認識処理された認識結
果は、編集部14及びデータバツフア18内の各
修正前の認識結果と書換えられる。また、検出切
出部12から検切された図形に対応する画像デー
タは、画像圧縮部16で圧縮処理後に編集部14
へ転送される。表示制御部19は、データバツフ
ア18から認識結果を読出して、CRT20の画
面上に表示させる。オペレータは、表示された認
識結果(例えば複数の候補文字からなる)を確認
し、例えばリジエクトの場合にはマウス21によ
り複数の候補文字から選択する。また、誤読の場
合にはオペレータは表示された認識結果に対し
て、修正文字をキーボードから入力したり、文字
と削除等の修正作業を行なう。これにより、ステ
ツプS8に示す認識結果に対する確認、修正処理
がなされる。編集部14は、文字認識部13から
出力される認識結果(ステツプS8による修正処
理後の認識結果)及び画像圧縮部16からの図形
を、予め設定されたフオーマツトに編集した後に
出力装置15へ転送する。
ここで、表示制御部19によりCRT20の画
面上に表示される画像は、例えば第4図aに示す
ような縦向き文書または同図bに示す横向き文書
の場合がある。また、第4図cは、文字画像と切
出し枠を重ねた場合の表示例であり、同図dは文
字がイタリツク体の場合の切出し枠の表示例であ
る。尚、前記のように文字の図形の切出し枠に応
じて色を区別してカラー表示を行なう以外に、画
面表示を時間的に変化させて表示区別を行なうよ
うにしてもよい。さらに、前記のステツプS5に
おいて、検切位置の修正作業が終了したら、次に
文字の認識結果及び図形の外部への出力順序をマ
ウス21又はキーボード22から指定するような
機能を設けてもよい。例えば、前記のステツプ
S5において第5図に示すように、CRT20上に
文字、図形とその切出し枠が表示されている画面
上にてマウス21で出力順序指定枠50〜52を
指定しその表示をする共に、この出力順序指定枠
間における出力順序を指定する。具体的には、出
力順序を50〜53の順で指定した場合には、こ
の順序でそれぞれの出力順序指定枠で囲まれてい
る文字又は図形を外部へ出力する。
前記のようにして、検出切出部12での検切処
理結果(検切情報)及び文字認識部13の認識結
果を表示して、確認、修正処理後に文字認識処理
を再度行なうため、認識不能及び誤読を大幅に防
止することができる。したがつて、認識結果に対
するオペレータの修正作業を軽減できることにな
る。さらに、オペレータはCRT20の画面上に
表示された画像及び切出し枠を見ながら、検切結
果及び認識結果の確認、修正を行なうため、オペ
レータにより確認、修正作業は極めて簡単に行な
うことができる。
[発明の効果] 以上詳述したように本発明によれば、文字及び
図形が混在した文書を読取る光学的文字読取装置
において、検切情報に基づくオペレータの簡単な
確認、修正作業により読取率を向上することがで
きる。したがつて、結果的に最終的認識結果に対
するオペレータの支援作業を軽減化し、高効率で
確実な読取処理を実現することができるものであ
る。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字
読取装置の構成を示すブロツク図、第2図は同実
施例の動作を説明するためのフローチヤート、第
3図乃至第5図はそれぞれ同実施例の動作を説明
するための画像の表示例を示す図である。 10……光電変換部、11……イメージバツフ
ア、12……検出切出部、13……文字認識部、
17,18……データバツフアメモリ、19……
表示制御部、20……CRTデイスプレイ装置、
21……マウス。

Claims (1)

  1. 【特許請求の範囲】 1 記録媒体上に記録された文字及び図形を走査
    して画像信号に変換する走査手段と、 この走査手段により得られる文字及び図形の各
    画像データを格納する画像メモリと、 この画像メモリ内の画像データが文字及び図形
    の検出切出処理を実行し各検出切出位置を示す検
    切情報を作成する検出切出手段と、 この検出切出手段により検出切出された文字を
    認識する文字認識手段と、 前記検出切出手段により作成された前記検切情
    報、前記文字認識手段から出力される認識結果及
    び前記画像メモリから前記文字及び図形の各画像
    データを表示する表示手段と、 この表示手段に表示された前記検切情報、認識
    結果および画像データに基づいて前記画像メモリ
    内の文字及び図形の各検出切出位置を確認又は修
    正する確認、修正手段と、 この確認、修正手段により決定された検出切出
    位置で前記検出切出手段により検出切出された文
    字を前記文字認識手段に再認識させる制御手段と
    を具備したことを特徴とする光学的文字読取装
    置。
JP60039278A 1985-02-28 1985-02-28 光学的文字読取装置 Granted JPS61198376A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60039278A JPS61198376A (ja) 1985-02-28 1985-02-28 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60039278A JPS61198376A (ja) 1985-02-28 1985-02-28 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPS61198376A JPS61198376A (ja) 1986-09-02
JPH0473192B2 true JPH0473192B2 (ja) 1992-11-20

Family

ID=12548697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60039278A Granted JPS61198376A (ja) 1985-02-28 1985-02-28 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS61198376A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01258089A (ja) * 1988-04-07 1989-10-16 Toshiba Corp 文書処理装置
JPH0296885A (ja) * 1988-10-03 1990-04-09 Ricoh Co Ltd 画像処理装置
JPH0388087A (ja) * 1989-08-31 1991-04-12 Toshiba Corp 文書読取装置

Also Published As

Publication number Publication date
JPS61198376A (ja) 1986-09-02

Similar Documents

Publication Publication Date Title
US4823395A (en) Image information recognition apparatus
JP2835178B2 (ja) 文書読取装置
JPH0473192B2 (ja)
JPH0373914B2 (ja)
JPH0459668B2 (ja)
JPH0459669B2 (ja)
JPH0473193B2 (ja)
JPH08329187A (ja) 文書読取装置
JPH05292294A (ja) デジタル複写機
JP3604909B2 (ja) 画像間位置合わせ方法
JPH0991371A (ja) 文字表示装置
JPS63158676A (ja) 領域抽出装置
JPS594358Y2 (ja) 文字修正における文字制御装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JPH08321942A (ja) 画像処理装置及び分割図面の画像接合方法
JPH04251395A (ja) 光学的文字図形読取装置
JPH08202824A (ja) 文書画像認識装置
JPH08329188A (ja) 文書読取装置
JPS63293690A (ja) 文字認識システム
JPS61160179A (ja) 文字認識方式
JPH01245376A (ja) 文字読取装置の文字切出し装置
JPH04255088A (ja) 光学式文字読取装置
JP2000050055A (ja) ファクシミリ装置及び送信方法
JPS6236274B2 (ja)
JPH05135150A (ja) 画像処理装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term