JPS5932078A - 文字検出切出装置 - Google Patents

文字検出切出装置

Info

Publication number
JPS5932078A
JPS5932078A JP57142444A JP14244482A JPS5932078A JP S5932078 A JPS5932078 A JP S5932078A JP 57142444 A JP57142444 A JP 57142444A JP 14244482 A JP14244482 A JP 14244482A JP S5932078 A JPS5932078 A JP S5932078A
Authority
JP
Japan
Prior art keywords
characters
scanning
character
projection
scanning lines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57142444A
Other languages
English (en)
Inventor
Hiromi Nanba
難波 広海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP57142444A priority Critical patent/JPS5932078A/ja
Publication of JPS5932078A publication Critical patent/JPS5932078A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 この発明は、光学的文字読取装置の文字検出切出装置に
関する。
〔発明の技術的背景とその問題点〕
一般に、光学的文字読取装置(以下OCRと称する)で
は、例えば帳票を走査機構部で読取り、その読取り結果
を認識論理部に送られて文字認識が行なわれる。走査機
構部は、通常光電変換部を有して帳票に光を当てて文字
を走査し、その結果得られた光信号を電気信号に変換し
て文字の検出切出を行なう。
このような走査機構部により、文字を走査して文字の検
出切出を行なう方法は、例えば第1図に示すように行な
う。すなわち、文字ffAJ)に対して縦方向(Y方向
)走査を行なって、その走査・そターンをメモリ1に格
納する。この場合、文字の左端がXアドレスのO番地に
なる様に、すなわち左詰めにメモリ1に格納する。また
、このような走査ノ9ターンのメモリ1への格納と並行
して、文字の水平方向(X方向)の射影2を射影レジス
タ3に格納する。さらに、文字の右端を検知すると、走
査パターンのメモリ1への格納を停止すると共に、メモ
リ1内の文字の右端位置座標XRを記憶する。このよう
な走査パターンを記憶するメモリを2文字分用意して、
その中の1方は、文字パターンの書込み用として使用し
、他方は文字ノやターンの読出しく認識用)用として交
互に使用する。
このような文字の検出切出は、具体的には第2図に示す
ような文字検出切出装置により行なわれる。すなわち、
第1図に示したように文字を走査して得られるビデオ信
号vdけ、メモリZa、1bおよびAカウンタ4に入力
する。このAカウンタ4は、面積カウンタで検出切出開
始から文字、すなわち紙の白に対する黒点(以下単に黒
と称する)の累積ビット数を計数する。
ζらに、ビデオ信号Vdはオア回路5を介してフリップ
フロップ6に入力する。このフリツプフロツプ6の出力
信号はBカウンタ7に入力し、このBカウンタ7で上記
点の走査本数が計数される。また、フリツプフロツプ6
の出力信号はインバータ8を介してWカウンタ9に入力
し、このWカウンタ9では白の走査本数全計数される。
そして、上記点および白の総走査本数はTカウンタ10
で計数される。上記Aカウンタ4、Bカウンタ7、Wカ
ウンタ9およびTカウンタ10の各出力信号は、判定書
込み制御部1ノに入力する。この判定書込み制御部1ノ
は、各カウンタ4,7,9.10からのデータに基づい
て、文字の検出切出の判定およびビデオ信号Vdをメモ
IJ J a 、 Z bへ書込む場合の制御を行なう
。この場合、文字の検出切出の判定は、例えば下記のよ
うな条件式(1)〜(3)を基に行なう。
(A≧C,)△(B≧02)△(w=c、)△(TaO
2)・・・(1) B−05・・・(2) 7=06               ・・・(3)
ここで、A、B、W、Tはそれぞれ上記のAカウンタ4
、Bカウンタ7、Wカウンタ9およびTカウンタ10の
各計数値である。また、C4〜C6は定数である。いま
、上記式(1)のような判定論理の場合には、文字が全
て検出されたとじて判定し、走査パターンのメモリIa
、Ihへの店込みを停止する。また、上記式(2)のよ
うな場合には、検出切出開始と判定し、リジェクト(読
取不能)または強制的に切出しを行なう。
この場合、C5は標準文字幅よシも大きな定数である。
さらに、上記式(3)のような場合には、スペースと判
定し、スペースコードを出力する。
この場合、C6は文字ピッチだ近い定数である。
このようにして、判定書込み制御部11は判定した結果
に基づいて、メモリIallbの書込み用のライトカウ
ンタ12a、12bf制御してビデオ信号vdをメモリ
Ia、lbに書込む。
ライトカウンタ12a、12bは、それぞれ第1図に示
すよりなX、Y方向に対応するメモリIa、lbのXア
ドレス、Xアドレスをマルチブレフサ13a、13bを
介して指定する。そして、認識読出し制御部14は、メ
モ’)la。
1bに書込まれた文字ツヤターン全マルチブレフサ15
を介して読取シ認識する。この場合、認識読出し制御部
14は、読取り用のリードカウンタ16h、I6bを制
御して、メモリ1atたは1bの各Xアドレス、Xアド
レスに格納された文字パターン全選択して読取る。すな
わち、メモリ1a、Jbは一方は書込み用、他方は読出
し認識用として交互に使用される。
このようにして、文字の検出切出を行なうことができる
。しかしながら、上記のような従来の方式では、例えば
第3図(Nに示すように印字汚れ等のノイズ17によシ
、文字18の走査パターンの射影2の幅が少しでも上記
C5より大きい場合(すなわち、B≧05)、上記条件
式(2)の判定論理によシリジェクトすることになる。
また、第3図(B)に示すようにノイズ17″!たは図
(C)に示すように印字(記入)ずれにより、文字18
間のスペースの幅Wが狭くなった場合(W<06)、ス
ペースとして検知されなかったシ、スペースの個数が減
少してしまう欠点がある。
このような問題点を解決する方法として、1行分の走査
パターンをメモリに格納した後、各文字の前後の状態を
調べて検出切出することか考えられるが、高速ドキュメ
ントリーダ等においては処理効率の面などで採用できな
い場合が多い。したがって、従来の検出切出装置にでは
、ノイズおよび印字ずれ宿が存在する場合、文字の検出
切出の精度が著しく低下するものである。
〔発明の目的〕
この発明は、上記の事情を鑑みてなされたもので、OC
Rにおいて、帳票等の文字を走査して検出切出しを行な
う場合、ノイズ寸たはE11字ずれ等が存在しても、高
い精度で文字の検出切出しを行なうことができる文字検
出切出装置を提供することを目的とする。
〔発明の概要〕
すなわち、この発明においては、文字を走査機構部で走
査して得られた走査パターンを一定の走査本数分遅延し
て出力するビデオシフトレジスタが設けられる。さらに
、走査ノ+ターンの主走査方向(上下方向)の射影を格
納する射影レジスタが設けられる。このビデオシフトレ
ジスタおよび射影レノスタの両者の出力に基づいて、後
続走査パターンの状態に応じた文字の検出切出位置を判
定手段で判定するものである。
〔発明の実施例〕
以下図面を参照してこの発明の一実施例について説明す
る。第4図はこの発明に係る文字検出切出装置の構成を
示すもので、20はビデオシフトレジスタで、ビデオ信
号Vdを走査n本(nは整数)分遅延して出力する。こ
のビデオシフトレジスタ20の出力信号(遅延されたビ
デオ信号Vd)は、Aカウンタ4およびメモリlh、l
bに入力する。また、ビデオ信号■dはオア回路5を介
してフリツプフロツプ6に入力する。このフリップ70
ツブ6の出力端子からは、走査でれる文字に対する走査
1本分の射影が作成されて出力する。この射影は、走査
1本毎に射影シフトレジスタ21にシフトされて入力す
る。この射影シフトレジスタ21は、走査n本分の射影
を格納し、この射影をコード化回路22に出力する。コ
ード化回路22は、射影シフトレジスタ21内の状態(
例えば全て黒、全て白、または一定幅以上の黒が有る場
合など)に応じたコード信号を判定書込み制御部11に
出力する。なお、他の構成は前記第2図に示すものと同
様であるため、同一符号を付して説明は省略する〇 このような構成において、その動作を説明する。まず、
帳票等に印字(記入)された文字(例えばr8J、r9
J)は、第5図(A)に示すように走査機構部(図示せ
ず)で、上下方向(Y方向)の走査(主走査と称する)
および行方向(X方向)の走査(副走査と称する)が行
なわれる。このように走査された文字の走査ノ4ターン
であるビデオ信号(すなわち走査機構部の光重、変換部
で変換された電気信号)vdは、第5図(B)に示すよ
うにビデオシフトレジスタ20に入力する。そして、ビ
デオシフトレジスタ20を通過したビデオ信号Vdは、
ノぐターンメモリ23でちる第4図のメモリ1aまたは
1bに走査パターンが左詰めになる様に書込まれる。
このようにして、走査パターンがメモリ1aまたは1b
に書込まれて、第5図(C)に示すように文字1?ター
ン(r 8 J)の検出切出が終了することになる。な
お、この場合において、Aカウンタ4、Bカウンタ7、
Wカウンタ9、Tカウンタ10および判定書込み制御部
11等の動作説明は前記第2図の場合と同様であるため
省略する。
ところで、第6図(Nに示すようにノイズ(印字汚れ等
)17が文字18の近傍に存在する場合、ノイズ17を
含む走査パターンの射影が射影シフトレジスタ21に入
力する。この射影シフトレジスタ2ノの内容は、コード
化回路22でコード信号に変換されて判定書込み制御部
11に入力する。判定書込み制御部11は、上記コード
信号によシ後続のパターンの状態を予測することができ
る。すなわち、この場合では文字ブロックの垂直方向の
射影(第6図(5)のa)は標準文字幅より大きくなる
ため、後続のブロックの幅が標準よシも狭くなることを
予測できる。そのため、判定書込みI制御部11は、第
6[><+(5)に示すようなノイズ17も含めた範囲
aのブロックを1文字分として切出してメモリ1aまた
は1bに格納する・この場合、ビデオ信号Vdはビデオ
シフトレジスタ2oで、走を本数(n本)分遅延されて
Aカウンタ4およびメモリlhiたは1bに入力される
ことになるため、判定書込み制御部11は上記のような
後続のパターンの状態を確実に予測して切出しの判定を
行なうことができる。そして、認識読出し制御部14i
d、メモリ1aまたは1bから第6図(A)に示すよう
な走査パターンを読出した場合、ノイズ17のブロック
を除いた文字ブロックに対してのみ認識処理を行なう。
なお、この場合のライトカウンタ12&N12b、  
リードカウンタ16a r 16bおよびマルチプレク
サ13a。
13b 、15等の動作は、前記第2図と同様であるた
め説明は省略する。したがって、従来の方式(前記第2
図)では、ノイズ17の存在する文字18に対して検出
切出しをリジェクトしていたが、この発明の方式で′は
止血のように確実に検出切出しを行なうことができる。
さら托、第6図(B)に示すように文字18a。
18b間が印字ずれ等によシ接近し、垂直方向の射影が
接続した場合がある。この場合では、上記と同様に射影
シフトレジスタ2ノおよびコード化回路22によシ、判
定書込み制御部11は標準文字幅(第6図の)のa+)
のブロックを検知した時点で、後続のブロック幅が標準
よりも大きいことが予測できる。そのため、判定書込み
制御部11は、標準文字幅の位置(alとa2)で強制
的に切出してメモリ1aまたば1bに格納することがで
きる。これによシ、従来の方式では、第6図(B)に示
すようなり1とb2の様に切出して、片方の文字09J
)が一部切れてリジェクトされてしまう場合があったが
、上記のように強制的に検出切出しすることができるた
め、両方の文字とも大きな切出しの損傷を受けないで確
実にメモリ1aまたは1bに格納できる。したがって、
認識読出し制御部14においても、両方の文字とも正し
く認識できることになる。
また、第6図(0に示すようにノイズ17等により、文
字18a、18bの各ブロック間の射影幅、すなわちス
ペースの幅Wが狭くなった場合、判定書込み制御部11
は、上記と同様に射影シフトレジスタ2)およびコード
化回路22によシ、白ブロックのスペース(図C)のS
)から黒ブロックa2に変化した時点で、後続の黒ブロ
ックa2の幅が標準より太きいと判定できる。
そのため、スペースSの幅Wが所定値以上ならば(文字
ピッチ以下でもよい)、スペースト判断し、第6図(C
)に示すように、a  + S + a 2の様に検出
切出しを行なうことができる。したがって、この場合、
従来の方式では文字18af検出切出しを行なった後、
スペースSを走査するがその幅Wが狭いためスペースS
を検出できないことがあったが、上記のように文字18
a。
18bと共にスペースSを確実に検出切出しを行なうこ
とができる。
さらに、上記のように文字検出切出しにおいて、後続の
ノリーンを予測することができるため、文字がカタカナ
の様に複数ブロックからなる場合でも、文字検出切出し
の精度を向上できる利点もある。
なお、上記実施例において、副走査を第5図(5)に示
すようにX方向、すなわち左から右方向としたが、その
逆である右から左方向としてもよい。
〔発明の効果〕
以上詳述したようにこの発明によれば、OCRにおいて
、帳票等の文字を走査して検出切出しを行なう場合、ノ
イズまたは印字ずれ等が存在しても、高い精度で文字の
検出切出しを行なうことができる。したがって、文字の
読取シおよび認識を確実に行なうことができるものであ
る。
【図面の簡単な説明】
第1図は従来のOCRにおける文字の走査方式を説明す
るだめの図、第2図は従来の文字検出切出し装置の構成
を示すブロック図、第3図はその動作を説明するための
図、第4図はこの発明の一実施例に係る文字検出切出し
装置の構成を示すブロック図、第5図(〜乃至(C)お
よび第6図(4)乃至(C)はその動作を説明するだめ
の図である。 5・・・オア回路、6・・・フリップフロップ、8°°
。 インバータ 20・・・ビデオシフトレジヌタ、2ノ・
・・射影シフトレジスタ、22・・・コード化回路。

Claims (1)

    【特許請求の範囲】
  1. 文字の上下方向に主走査、この主走査方向に対して直角
    方向に副走査を行なうことにより文字を読取る光学的文
    字読取装置において、上記文字を走査して得られた走査
    パターンを一定の走査本数分遅延して出力するビデオシ
    フトレジスタと、上記走査パターンの主走査方向の射影
    を作成する手段と、上記一定の走査本数分に相当する上
    記射影を格納する射影レジスタと、上記ビデオシフトレ
    ジスタおよび射影レジスタの両者の出力に基づいて後続
    走査パターンの状態に応じた文字の検出切出位置を判定
    する判定手段とを具備したことをp徴とする文字検出切
    出装置。
JP57142444A 1982-08-17 1982-08-17 文字検出切出装置 Pending JPS5932078A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57142444A JPS5932078A (ja) 1982-08-17 1982-08-17 文字検出切出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57142444A JPS5932078A (ja) 1982-08-17 1982-08-17 文字検出切出装置

Publications (1)

Publication Number Publication Date
JPS5932078A true JPS5932078A (ja) 1984-02-21

Family

ID=15315449

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57142444A Pending JPS5932078A (ja) 1982-08-17 1982-08-17 文字検出切出装置

Country Status (1)

Country Link
JP (1) JPS5932078A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62252199A (ja) * 1986-04-24 1987-11-02 ティーディーケイ株式会社 電子部品の製造方法
JPH01288557A (ja) * 1988-05-16 1989-11-20 Rohm Co Ltd 長尺状リードフレームの間欠移送装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62252199A (ja) * 1986-04-24 1987-11-02 ティーディーケイ株式会社 電子部品の製造方法
JPH01288557A (ja) * 1988-05-16 1989-11-20 Rohm Co Ltd 長尺状リードフレームの間欠移送装置

Similar Documents

Publication Publication Date Title
US4513442A (en) Method for locating and circumscribing text areas on a master which may contain text, graphics and/or image areas
US5929421A (en) Method and apparatus for recognizing and assembling optical code information from partially scanned segments
US4034343A (en) Optical character recognition system
JPH07256214A (ja) 郵便物の宛名読取装置および郵便物の宛名領域判別装置および郵便物の宛名印刷装置
EP0464713A2 (en) Bar-code reading apparatus
JPS58223876A (ja) バ−コ−ド認識装置
JPS5932078A (ja) 文字検出切出装置
JPS62128380A (ja) 文字・バ−コ−ド読取装置
JPS61217882A (ja) 光学的文字認識装置
JPS61196382A (ja) 文字切出し方式
JPH0332723B2 (ja)
JPH0738211B2 (ja) 文字認識方法
JPH11226516A (ja) カスタマバーコード印字郵便物上の宛名読み取り装置
JP2615834B2 (ja) 単語読取装置
JPS59206987A (ja) 文字認識装置
JPS61279991A (ja) 光学文字読取装置等における文字切出方法
JPS62200490A (ja) 光学的文字読取装置
JPS62127985A (ja) 文字切出し方式
JPH1040338A (ja) 光学式文字読取装置
JPS6149554A (ja) 画像切り出し回路
JPS5914078A (ja) 帳票読取装置
JPH07271902A (ja) 光学式文字読取装置
JPH0223488A (ja) 画信号処理装置
JPH0366702B2 (ja)
JPH0261065B2 (ja)