JPS61198378A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPS61198378A
JPS61198378A JP60039280A JP3928085A JPS61198378A JP S61198378 A JPS61198378 A JP S61198378A JP 60039280 A JP60039280 A JP 60039280A JP 3928085 A JP3928085 A JP 3928085A JP S61198378 A JPS61198378 A JP S61198378A
Authority
JP
Japan
Prior art keywords
characters
character
segmenting
section
operator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60039280A
Other languages
English (en)
Other versions
JPH0459668B2 (ja
Inventor
Hiromi Nanba
難波 広海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60039280A priority Critical patent/JPS61198378A/ja
Publication of JPS61198378A publication Critical patent/JPS61198378A/ja
Publication of JPH0459668B2 publication Critical patent/JPH0459668B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、文書上に記録された文字及び図形の読取処理
を行なう光学的文字読取装置に関する。
[発明の技術的背景とその問題点] 近年、文字及び図形が混在した古籍、新聞及び図面等の
文書を読取ることが可能な光学的文字読取装置の開発が
行われている。このような装置では、文字及び図形を識
別して、文字に対しては認識処理後に文字コードを出力
し、また図形をイメージデータとして読取る灘能が必要
となる。しかしながら、従来の装置では、前記のような
機能を完全に実現することは困難であり、一部の処理に
ついてオペレータの支援作業が必要な方式が採用されて
いる。
具体的には、例えば文字検出切出処理等に必要なフォー
マットコントロール情報を読取開始前にタブレットやマ
ークで指定する方式がある。この方式では、読取対象で
ある各シート毎にフォーマットコントロール情報の指定
作業が必要となり、オペレータの作業負担が大きくなる
。また、文字認識処理後の認識結果をCRTディスプレ
イ装置の画面上に表示し、オペレータが表示結果と原文
書とを照合して、異なる場合には修正処理を行なう方式
がある。さらに、読取対象のシート上を走査(光電変換
を含む)して得られる走査画像と認識結果を同時に表示
し、オペレータが前記両者を照合して修正する方式等が
ある。このような各方式では、いずれもWg識処理後の
最終結果を広正することになる。このため、文字の検出
切出処理や文字2図形の識別処理が誤動作している場合
、誤読または読取不能が大幅に増大し、オペレータの修
正作業に要する時間が多大となることがある。
また、読取対象の原シートと表示される読取結果のフォ
ーマットは通常では異なるため、オペレータの照合作業
は困難となり、誤りを発生しやすい。
さらに、文字2図形を編集して出力する際、編集内容を
任意に指定または変更する作業も困難である。
このため、従来の光学的文字読取装置では、オペレータ
の支援作業の負担が大きく、読取処理の効率が低下する
問題がある。
[発明の目的] 本発明の目的は、文字及び図形の混在する文−の読取装
置において、オペレータの支援作業を軽減化し、しかも
高度な編集処理能力を有する高効率で確実な読取処理を
実現することができる光学的文字読取装置を提供するこ
とにある。
[発明の概要] 本発明では、画像メモリ内の画像データから文字及び図
形の検出切出処理を実行し、各検出切出位置の検切情報
を作成する検出切出手段が設けられる。この検出切出手
段により作成された検切情報及び画像メモリから出力さ
れる画像データに対応する文字1図形は、表示手段によ
り表示されるように構成されている。指定手段は、表示
手段の表示内容に基づいて文字1図形の出力編集内容の
指定を行なう。文字認識手段は、検出切出手段により作
成された検切情報に基づいて画像メモリ内の文字の認識
処理を行なう。文字認識手段からの認識結果及び指定手
段による出力編集内容は、確認、修正手段により確認又
は修正されることになる。確E’!、!!正手段により
決定された文字認識結果及び出力編集内容に基づいて、
編集手段は文字。
図形の読取結果を編集して出力する。
このような構成により、オペレータは簡単な操作を行な
うだけで、文字及び図形の混在した文書に対する高度な
編集作業等の読取処理を効率的に行なうことが可能とな
る。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は本発明の一実施例に係わる光学的文字読取装置の構
成を示すブロック図である。第1図において、光電変換
部10は、読取対象の文書上を走査し、文書上に記録さ
れた文字及び図形を画像信号に変換する。イメージバッ
ファメモリ(以下イメージバッファと称す)11は、光
電変換部10から出力される画像信号からなる画像デー
タを格納する。検出切出部12は、イメージバッファ1
1内の画像データから文字及び図形を識別し、文字及び
図形の検出切出(検切)処理を行なう。文字認識部13
は、検出切出部12で検切された文字の認識処理を実行
して、認識結果である文字コードを編集部14へ出力す
る。画像圧縮部16は、検出切出部12により検切され
た図形の画像データを圧縮して編集部14へ出力する。
編集部14は、文字認識部13からの認識結果及び画像
圧縮部16からの図形を、制御部23により指定された
フォーマットに基づいて編集する。出力装M15は、編
集部14で編集された文字及び図形を印字するプリンタ
または記憶する磁気ディスク装置等である。
一方、第1のデータバッファメモリ(以下データバッフ
ァと称す)17は、検出切出部12で作成された文字及
び図形の検切位置を示す検切情報を格納するメモリであ
る。第2のデータバッファ18は、文字認識部13から
出力される認識結果を格納する。
表示制御部19は、データバッファ17.18及びイメ
ージバッファ11の各記憶内容を合成または選択してC
RTディスプレイ装M(以下CRTと称す)20の画面
上に表示させる。座標入力装置(マウス)21は、CR
T20の画面上の位置座標を指定し入力する装置である
。キーボード22は、各種データを入力する入力装置で
ある。さらに、制御部23は、81全体の動作制御を行
なう回路である。
このような構成の光学的文字読取装置において、同実施
例の動作を第2図のフローチャートを参照して説明する
。先ず、第2図のステップS1に示すように、読取対象
の文書が光電変換部10により走査されると、例えば1
頁分の文字及び図形が画像信号に変換される。画像信号
からなる画像データは、イメージバッファ11に格納さ
れる。次に、ステップS2では検出切出部12による検
切処理が開始される。検出切出部12では、イメージバ
ッファ11内の画像データから文字及び図形の識別がな
される。この識別処理は、通常では例えば画像データの
周辺分布ヒストグラムを利用する方式またはランレング
スによる図形の抽出法を利用した方式等により実行され
る。ざらに、検出切出部12では、識別された文字画像
に対して文字行1文字サイズ、文字ピッチ等が検知され
て、1文字毎に区分される。このとき、ステップS3に
示すように、1文字毎に区分される際に作成される検切
位置情報(以下切出し枠情報と称す)が検出切出部12
がらデータバッファ17へ格納される。同様に、図形を
検切する際に作成される切出し枠情報もデータバッファ
17へ格納される。
検出切出部12の動作が終了すると、表示制御部19に
よりステップ$4の動作がなされる。即ち、表示制御部
19は、イメージバッファ11から画像データを読出し
て、第3図(a)に示すように、文字30及び図形31
の走査画像をそのままCRT20の画面上に表示させる
。さらに、表示制御部19は、データバッファ17から
切出し枠情報を読出して、第3図(b)に示すように文
字及び図形に対応する各切出し枠32.33をCRT2
0の画面上に重ねて表示させる。このとき、表示制御部
19は、例えば文字と図形に対応する各切出し枠32.
33を別の色でカラー表示したり、また文字30の向き
が縦または横の場合に別けて各文字を別の色でカラー表
示する。
次のステップS5では、オペレータはCRT20の画面
の表示を見て、切出し枠により検出切出部12の検切結
果を確認する。オペレータは、切出し枠が表示された際
、切出し枠単位で画像の出力順序をキーボード22等か
ら指定し、出力編集内容の指定作業を行なう。例えば、
第5図に示すように表示された場合、切出し枠50.5
1.52.53の順序で出力するような指定を行なう。
この指定情報は、制御部23へ出力される。このとき、
オペレータは切出し枠の位置により文字及び図形の検切
位置を判定し、適正であればキーボード22から確認指
示信号を制御部23へ入力する。判定結果により検切位
置が誤っている場合、オペレータはマウス21を操作し
てCRT20の画面上で検切位置の修正を行なう。この
修正処理では、例えばCRT20の画面の端に機能選択
画像が表示されて、オペレータにより文字検切位置移動
、削除、追加1文字の方向変更、読取対象から除外等の
機能から選択される。
この後、オペレータの操作によるマウス21で、検切位
置の変更位置が指定される。検切位置の変更指示は、表
示制御部19から制御部23へ転送されて、さらに制御
部23から検出切出部12へ転送される。
これにより、検出切出部12は、データバッファ17内
の指定された切出し枠情報を修正する。
オペレータによる出力編集内容の指定作業(検切位置の
確認、修正作業)が終了すると、検出切出部12はデー
タバッファ17内の新たに決定された検切情報に基づい
て、イメージバッファ11から文字及び図形に対する検
切処理を行なう。検出切出部12で検切された1文字毎
の画像データは、文字認識部13へ出力されて認識処理
されることになる(ステップ86)。また、検出切出部
12から検切された図形に対応する画像データは、画像
圧縮部16で圧縮処理後に編集部14へ転送される。文
字認識部13は、認識結果である文字コードを編集部1
4へ出力する。ここで、文字認識部13は、認!結果を
データバッファ18へ格納する。表示制御部19は、デ
ータバッファー17から新たな切出し枠情報を前記のス
テップS5で指定された順次で読出す。また、データバ
ッファ18から認識結果を読出して、CRT20の画面
上の該当する切出し枠内に表示させる(ステップS7)
。オペレータは、表示された認識結果(例えば複数の候
補文字からなる)を確認し、リジェクトの場合にはマウ
ス21により複数の候補文字から選択する。また、誤読
の場合にはオペレータは表示された認識結果に対して、
修正文字をキーボードから入力したり、文字の削除等の
修正作業を行なう。これにより、ステップS8に示す認
識結果及び編集内容に対する確認、修正処理がなされる
。編集部14は、文字認識部13から出力される認識結
果(ステップS8による修正処理後の認識結果)及び画
像圧縮部16からの図形を、!1lJIII部23から
指定される編集内容で編集した後に出力装置15へ転送
する(ステップ89)。このときの編集内容は、前記ス
テップS5で指定された内容である。
ここで、表示制御部19によりCRT20の画面上に表
示される画像は、例えば第4図(a)に示すような縦向
き文書または同図(b)に示す横向き文書の場合がある
。また、第4図(C)は、文字画像と切出し枠を合成し
た場合の表示例であり、同図(d)は文字がイタリック
体の場合の切出し枠の表示例である。尚、前記のように
文字と図形の切出し枠に応じて色を区別してカラー表示
を行なう以外に、画面表示を時間的に変化させて表示区
別を行なうようにしてもよい。
前記のようにして、検出切出部12での検切処理結果(
検切情報)を表示して、確認、修正処理後に文字認識処
理を行なうため、認識不能及び誤読を大幅に防止するこ
とができる。さらに、表示された検切情報に基づいて、
出力編集の指定作業を行なうことができる。したがって
、g 1結果に対するオペレータの修正作業を軽減でき
ることになる。さらに、オペレータはCRT20の画面
上に表示された画像及び切出し枠を見ながら、出力編集
の指定作業を行なうため、オペレータによる編集作業は
極めて簡単に行なうことができる。このため、文字0図
形を編集して出力する際、編集内容を任意に指定または
変更する作業も容易である。
[発明の効果] 以上詳述したように本発明によれば、文字及び図形が混
在した文書を読取る光学的文字読取装置において、検切
情報に基づくオペレータの簡単な確n、I正作業により
読取率を向上することができる。さらに、出力編集内容
の指定を簡単に行なうことが可能である。したがって、
結果的に最終的認識結果に対するオペレータの支援作業
を軽減化し、8度な編集処理能力を有する高効率で確実
な読取処理を実現することができるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図tは同実施例の動作を
説明するためのフローチャート、第3図乃至第5図はそ
れぞれ同実施例の動作を説明するための画像の表示例を
示す図である。 10・・・光電変換部、11・・・イメージバッファ、
12・・・検出切出部、13・・・文字認識部、17.
18・・・データバッファメモリ、19・・・表示制御
部、20・・・CRTディスプレイ装置、21・・・マ
ウス。 出願人代理人 弁理士 鈴 江 武 彦第1図 21  20   ZZ 第2図 第3図 (a)            (b)第4図 (a)             (b)第4図 (c)       (d) 1g日■田■田日 四旧日8回国日国回日印1目口 第5図

Claims (1)

    【特許請求の範囲】
  1. 記録媒体上に記録された文字及び図形を走査して画像信
    号に変換する走査手段と、この走査手段により得られる
    文字及び図形の各画像データを格納する画像メモリと、
    この画像メモリ内の画像データから文字及び図形の検出
    切出処理を実行し各検出切出位置を示す検切情報を作成
    する検出切出手段と、この検出切出手段により作成され
    た前記検切情報及び前記画像メモリから出力される画像
    データに対応する文字、図形を表示する表示手段と、こ
    の表示手段の表示内容に基づいて文字、図形の出力編集
    内容の指定を行なう指定手段と、前記検出切出手段によ
    り作成された検切情報に基づいて前記画像メモリ内の文
    字の認識処理を行なう文字認識手段と、この文字認識手
    段からの認識結果及び前記指定手段による出力編集内容
    を確認又は修正する確認、修正手段と、この確認、修正
    手段により決定された文字認識結果及び出力編集内容に
    基づいて文字、図形の読取結果を編集して出力する編集
    手段とを具備したことを特徴とする光学的文字読取装置
JP60039280A 1985-02-28 1985-02-28 光学的文字読取装置 Granted JPS61198378A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60039280A JPS61198378A (ja) 1985-02-28 1985-02-28 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60039280A JPS61198378A (ja) 1985-02-28 1985-02-28 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPS61198378A true JPS61198378A (ja) 1986-09-02
JPH0459668B2 JPH0459668B2 (ja) 1992-09-22

Family

ID=12548752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60039280A Granted JPS61198378A (ja) 1985-02-28 1985-02-28 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS61198378A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01241685A (ja) * 1988-03-24 1989-09-26 Toshiba Corp 文書読取り装置
JPH0444185A (ja) * 1990-06-12 1992-02-13 Nec Corp 文書読取装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01241685A (ja) * 1988-03-24 1989-09-26 Toshiba Corp 文書読取り装置
JPH0444185A (ja) * 1990-06-12 1992-02-13 Nec Corp 文書読取装置

Also Published As

Publication number Publication date
JPH0459668B2 (ja) 1992-09-22

Similar Documents

Publication Publication Date Title
US6466694B2 (en) Document image processing device and method thereof
US5734761A (en) Editing scanned document images using simple interpretations
JP2835178B2 (ja) 文書読取装置
JPS61198378A (ja) 光学的文字読取装置
JPS61198376A (ja) 光学的文字読取装置
JPH08329187A (ja) 文書読取装置
JPS58169682A (ja) 文字画像処理装置
JPS61198375A (ja) 光学的文字読取装置
JPS61198377A (ja) 光学的文字読取装置
JPH0991371A (ja) 文字表示装置
JPS63158676A (ja) 領域抽出装置
JP2682873B2 (ja) 表形式文書の認識装置
JPH103516A (ja) 情報処理方法及び装置
JPS594358Y2 (ja) 文字修正における文字制御装置
JPH08321942A (ja) 画像処理装置及び分割図面の画像接合方法
JPH08137987A (ja) 光学式文字読取装置
JPH08329188A (ja) 文書読取装置
JPH04251395A (ja) 光学的文字図形読取装置
JPS6326789A (ja) 文字認識装置
JP2003085477A (ja) 文字認識装置および文字認識結果の訂正方法
JP2000050055A (ja) ファクシミリ装置及び送信方法
JPS61160179A (ja) 文字認識方式
JPH0981672A (ja) 文書読取装置
JPH05135150A (ja) 画像処理装置
JPH03108085A (ja) 文書読取装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term