JPH0473193B2 - - Google Patents

Info

Publication number
JPH0473193B2
JPH0473193B2 JP60039279A JP3927985A JPH0473193B2 JP H0473193 B2 JPH0473193 B2 JP H0473193B2 JP 60039279 A JP60039279 A JP 60039279A JP 3927985 A JP3927985 A JP 3927985A JP H0473193 B2 JPH0473193 B2 JP H0473193B2
Authority
JP
Japan
Prior art keywords
characters
character
cutting
detection
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP60039279A
Other languages
English (en)
Other versions
JPS61198377A (ja
Inventor
Hiromi Nanba
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP60039279A priority Critical patent/JPS61198377A/ja
Publication of JPS61198377A publication Critical patent/JPS61198377A/ja
Publication of JPH0473193B2 publication Critical patent/JPH0473193B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、文書上に記録された文字及び図形の
読取処理を行なう光学的文字読取装置に関する。
[発明の技術的背景とその問題点] 近年、文字及び図形が混在した書籍、新聞及び
図面等の文書を読取ることが可能な光学的文字読
取装置の開発が行われている。このような装置で
は、文字及び図形を識別して、文字に対しては認
識処理後に文字コードを出力し、また図形をイメ
ージデータとして読取る機能が必要となる。しか
しながら、従来の装置では、前記のような機能を
完全に実現することは困難であり、一部の処理に
ついてオペレータの支援作業が必要な方式が採用
されている。
具体的には、例えば文字検出切出処理等に必要
なフオーマツトコントロール情報を読取開始前に
タブレツトやマークで指定する方式がある。この
方式では、読取対象である各シート毎にフオーマ
ツトコントロール情報の指定作業が必要となり、
オペレータの作業負担が大きくなる。また、文字
認識処理後の認識結果をCRTデイスプレイ装置
の画面上に表示し、オペレータが表示結果と原文
書とを照合して、異なる場合には修正処理を行な
う方式がある。さらに、読取対象のシート上を走
査(光電変換を含む)して得られる走査画像と認
識結果を同時に表示し、オペレータが前記両者を
照合して修正する方式等がある。このような各方
式では、いずれも認識処理後の最後結果を修正す
ることになる。このため、文字の検出切出処理や
文字、図形の識別処理が誤動作している場合、誤
読または読取不能が大幅に増大し、オペレータの
修正作業に要する時間が多大となることがある。
また、読取対象の原シートと表示される読取結果
のフオーマツトは通常では異なるため、オペレー
タの照合作業は困難となり、誤りを発生しやす
い。
このため、従来の光学的文字読取装置では、オ
ペレータの支援作業の負担が大きく、読取処理の
効率が低下する問題がある。
[発明の目的] 本発明の目的は、文字及び図形の混在する文書
の読取装置において、オペレータの支援作業を軽
減化し、高効率で確実な読取処理を実現すること
ができる光学的文字読取装置を提供することにあ
る。
[発明の概要] 本発明では、画像メモリ内の画像データから文
字及び図形の検出切出処理を実行し、各検出切出
位置の検切情報を作成する検出切出手段が設けら
れる。この検出切出手段により作成された検切情
報は、文字及び文字行の方向を区別して表示手段
により表示されるように構成されている。確認、
修正手段は、表示手段の表示内容に基づいて検出
切出手段により作成された検切情報を確認又は修
正する。文字認識手段は、確認手段により決定さ
れた検出切出位置で再度検出切出された文字を確
認する。
このような構成により、オペレータは確認、修
正手段を操作するだけ、文字及び図形の混在した
文書に対する読取処理を効率的に行なうことが可
能となる。
[発明の実施例] 以下図面を参照して本発明の一実施例を説明す
る。第1図は本発明の一実施例に係わる光学的文
字読取装置の構成を示すブロツク図である。第1
図において、光電変換部10は、読取対象の文書
上を走査し、文書上に記録された文字及び図形を
画像信号に変換する。イメージバツフアメモリ
(以下イメージバツフアと称す)11は、光電変
換部10から出力される画像信号からなる画像デ
ータを格納する。検出切出部12は、イメージバ
ツフア11内の画像データから文字及び図形を識
別し、文字及び図形の検出切出(検切)処理を行
なう。文字認識部13は、検出切出部12で検切
された文字の認識処理を実行して、認識結果であ
る文字コードを編集部14へ出力する。画像圧縮
部16は、検出切出部12により検切された図形
の画像データを圧縮して編集部14へ出力する。
編集部14は、文字認識部13からの認識結果及
び画像圧縮部16からの図形を、予め設定された
フオーマツトに編集する。出力装置15は、編集
部14で編集された文字及び図形を印字するプリ
ンタまたは記憶する磁気デイスク装置等である。
一方、第1のデータバツフアメモリ(以下デー
タバツフアと称す)17は、検出切出部12で作
成された文字及び図形の検切位置を示す検切情報
を格納するメモリである。第2のデータバツフア
18は、文字認識部13から出力される認識結果
を格納する。表示制御部19は、データバツフア
17,18及びイメージバツフア11の各記憶内
容を合成または選択してCRTデイスプレイ装置
(以下CRTと称す)20の画面上に表示させる。
座標入力装置(マウス)21は、CRT20の画
面上の位置座標を指定し入力する装置である。キ
ーボード22は、各種データを入力する入力装置
である。さらに、制御部23は、装置全体の動作
制御を行なう回路である。
このような構成の光学的文字読取装置におい
て、同実施例の動作を第2図のフローチヤートを
参照して説明する。先ず、第2図のステツプS1
に示すように、読取対象の文書が光電変換部10
により走査されると、例えば1頁分の文字及び図
形が画像信号に変換される。画像信号からなる画
像データは、イメージバツフア11に格納され
る。次に、ステツプS2では検出切出部12によ
る検切処理が開始される。研修切出部12では、
イメージバツフア11内の画像データから文字及
び図形の識別がなされる。この識別処理は、通常
では例えば画像データの周辺分布ヒストグラムを
利用する方式またはランレングスによる図形の抽
出法を利用した方式等により実行される。さら
に、検出切出部12では、識別された文字画像に
対して文字行、文字サイズ、文字ピツチ及び文
字、文字行の方向が検知されて、1文字毎に区分
される。このとき、ステツプS3に示すように、
1文字毎に区分される際に作成される検切位置情
報(以下切出し枠情報と称す)が検出切出部12
からデータバツフア17へ格納される。同様に、
図形を検切する際に作成される切出し枠情報もデ
ータバツフア17へ格納される。
検出切出部12の動作が終了すると、表示制御
部19によりステツプS4の動作がなされる。即
ち、表示制御部19は、イメージバツフア11か
ら画像データを読出して、第3図aに示すよう
に、文字30及び図形31の走査画像をそのまま
CRT20の画面上に表示させる。さらに、表示制
御部19は、データバツフア17から切出し枠情
報を読出して、第3図bに示すように文字及び図
形に対応する各切出し枠32,33をCRT20
の画面上に重ねて表示させる。このとき、表示制
御部19は、例えば文字と図形に対応する各切出
し枠32,33を別の色でカラー表示したり、ま
た文字30の向きが縦または横の場合に区別して
文字を別の色でカラー表示する。即ち、表示制御
部19は、第4図aに示すような縦向き文書また
は同図bに示す横向き文書を区別して、CRT2
0の画面上に表示する。ここで、第4図cは、文
字画像と切出し枠を合成した場合の表示例であ
り、同図dは文字がイタリツク体の場合の切出し
枠の表示例である。
次のステツプS5では、オペレータはCRT20
の画面の表示を見て、切出し枠により検出切出部
12の検切結果を確認する。即ち、オペレータ
は、切出し枠の位置により文字及び図形の検切位
置を判定し、適正であればキーボード22から確
認指示信号を制御部23へ入力する。判定結果に
より検切位置が誤つている場合、オペレータはマ
ウス21を操作してCRT20の画面上で検切位
置の修正を行なう。この修正処理では、例えば
CRT20の画面の端に機能選択画像が表示され
て、オペレータにより文字検切位置移動、削除、
追加、文字の方向変更、読取対象から除外等の機
能から選択される。この後、オペレータの操作に
よるマウス21で、検切位置の変更位置が指定さ
れる。検切位置の変更指示は、表示制御部19か
ら制御部23へ転送されて、さらに制御部23か
ら検出切出部12へ転送される。これにより、検
出切出部12は、データバツフア17内の指定さ
れた切出し枠情報を修正する。
オペレータによる確認、修正作業が終了する
と、検出切出部12はデータバツフア17内の新
たに決定された検切情報に基づいて、イメージバ
ツフア11から文字及び図形に対する検切処理を
行なう(ステツプS6)。検出切出部12で検出
された1文字毎の画像データは、文字確認部13
へ出力されて認識処理されることになる(ステツ
プS7)。また、検出切出部12から検切された図
形に対応する画像データは、画像圧縮部16で圧
縮処理後に編集部14へ転送される。
文字認識部13は、認識結果である文字コード
を編集部14へ出力する。ここで、文字確認部1
3は、認識結果をデータバツフア18へ格納す
る。表示制御部19は、データバツフア18から
認識結果を読出して、CRT20の画面上に表示
させる。オペレータは、表示された認識結果(例
えば複数の候補文字からなる)を認識し、リジエ
クトの場合にはマウス21により複数の候補文字
から選択する。また、誤読の場合にはオペレータ
は表示された認識結果に対して、修正文字をキー
ボードから入力したり、文字の削除等の修正作業
を行なう。これにより、ステツプS8に示す認識
結果に対する確認、修正処理がなされる。編集部
14は、文字認識部13から出力される認識結果
(ステツプS8による修正処理後の認識結果)及び
画像圧縮部16からの図形を、予め設定されたフ
オーマツトに編集した後に出力装置15へ転送す
る。
ここで、表示制御部19によりCRT20の画
面上に表示される画像は、前記のように文字と図
形の切出し枠に応じて色を区別してカラー表示を
行なう以外に、画面表示を時間的に変化させて表
示区別を行なうようにしてもよい。さらに、前記
のように切出し枠が表示された際、切出し枠単位
で画像の出力順序をキーボード22等から指定す
るような機能を制御部23に設けてもよい。例え
ば、第5図に示すように表示された場合、切出し
枠50,51,52,53の順序で出力するよう
な指定を行なう。これにより、ステツプS8の認
識結果に対する確認、修正処理の際、認識結果と
原文書との比較が容易となり、また編集部14の
回路を省略できる利点がある。
前記のようにして、検出切出部12での検切処
理結果(検切情報)を表示して、確認、修正処理
後に文字認識処理を行なうため、認識不能及び誤
読を大幅に防止することができる。したがつて、
認識結果に対するオペレータの修正作業を軽減で
きることになる。さらに、オペレータはCRT2
0の画面上に表示された画像及び切出し枠を見な
がら、文字及び文字行の方向を判定する、検切結
果の確認、修正を行なう。これにより、オペレー
タは原シートとの比較確認が容易に行なうことが
できるため、結果的に確認、修正作業は極めて簡
単に行なうことができる。
[発明の効果] 以上詳述したように本発明によれば、文字及び
図形が混在した文書を読取る光学的文字読取装置
において、文字及び文字行の方向の指示も含む検
切情報に基づいて、オペレータの確認、修正作業
を簡単化することができる。したがつて、結果的
に最終的認識結果に対するオペレータの支援作業
を軽減化し、高効率で確実な読取処理を実現する
ことができるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字
読取装置の構成を示すブロツク図、第2図は同実
施例の動作を説明するためのフローチヤート、第
3図乃至第5図はそれぞれ同実施例の動作を説明
するための画像の表示例を示す図である。 10……光電変換部、11……イメージバツフ
ア、12……検出切出部、13……文字認識部、
17,18……データバツフアメモリ、19……
表示制御部、20……CRTデイスプレイ装置、
21……マウス。

Claims (1)

  1. 【特許請求の範囲】 1 記録媒体上に記録された文字及び図形を走査
    して画像信号に変換する走査手段と、 この走査手段により得られる文字及び図形の各
    画像データを格納する画像メモリと、 この画像メモリ内の画像データが文字及び図形
    の検出切出処理を実行し各検出切出位置を示す検
    切情報を作成する検出切出手段と、 この検出切出手段により作成された検切情報及
    び前記画像メモリから前記文字及び図形の各画像
    データを表示し、かつ前記文字または文字行が縦
    方向または横方向であるかを区別して前記文字の
    画像データを表示する表示手段と、 この表示手段の表示内容に基づいて前記検出切
    出手段により作成された検切情報を確認又は修正
    する確認、修正手段と、 この確認、修正手段により決定された検出切出
    位置で前記検出切出手段により再度検出切出され
    た文字を認識する文字認識手段とを具備したこと
    を特徴とする光学的文字読取装置。
JP60039279A 1985-02-28 1985-02-28 光学的文字読取装置 Granted JPS61198377A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60039279A JPS61198377A (ja) 1985-02-28 1985-02-28 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60039279A JPS61198377A (ja) 1985-02-28 1985-02-28 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPS61198377A JPS61198377A (ja) 1986-09-02
JPH0473193B2 true JPH0473193B2 (ja) 1992-11-20

Family

ID=12548726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60039279A Granted JPS61198377A (ja) 1985-02-28 1985-02-28 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPS61198377A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63129484A (ja) * 1986-11-19 1988-06-01 Matsushita Electric Ind Co Ltd 文字認識装置

Also Published As

Publication number Publication date
JPS61198377A (ja) 1986-09-02

Similar Documents

Publication Publication Date Title
US4823395A (en) Image information recognition apparatus
JP2835178B2 (ja) 文書読取装置
JPH08212298A (ja) 文書方向自動判別装置、及び文書方向自動補正装置
JPS58169682A (ja) 文字画像処理装置
JPH0473192B2 (ja)
JPH0459669B2 (ja)
JPH0473193B2 (ja)
JPH08329187A (ja) 文書読取装置
JPH0459668B2 (ja)
JPH05292294A (ja) デジタル複写機
JP3269889B2 (ja) 光学式文字読取システム
JPS594358Y2 (ja) 文字修正における文字制御装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JPH04251395A (ja) 光学的文字図形読取装置
JPH04156694A (ja) 文字認識方式
JPS6292080A (ja) 文字パターン認識修正装置
JPS6039276A (ja) 光学文字読み取り装置
JPH0581318A (ja) デジタル翻訳装置
JPH10340314A (ja) 帳票処理システム、その文字認識方法およびその記録媒体
JPS61160179A (ja) 文字認識方式
JPH01245376A (ja) 文字読取装置の文字切出し装置
JPH08329188A (ja) 文書読取装置
JPH11224307A (ja) 文書認識装置及びその方法
JPH0981672A (ja) 文書読取装置
JPH11224308A (ja) 文字認識装置及びその方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term