JPH01234985A - 文字読取装置の文字切出し装置 - Google Patents

文字読取装置の文字切出し装置

Info

Publication number
JPH01234985A
JPH01234985A JP63060263A JP6026388A JPH01234985A JP H01234985 A JPH01234985 A JP H01234985A JP 63060263 A JP63060263 A JP 63060263A JP 6026388 A JP6026388 A JP 6026388A JP H01234985 A JPH01234985 A JP H01234985A
Authority
JP
Japan
Prior art keywords
character
pitch
pattern data
block
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63060263A
Other languages
English (en)
Inventor
Noboru Okada
昇 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP63060263A priority Critical patent/JPH01234985A/ja
Publication of JPH01234985A publication Critical patent/JPH01234985A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、1文字毎の文字認識処理に必要な文字読取装
置の文字切出し装置に関する。
(従来の技術) 従来、光学的文字読取装置では、帳票上に記録された文
字が光学的に走査され、光電変換して得られる1行分(
又は1シ一ト分)の文字パターンデータがバッファメモ
リに格納される。そして、そのバッファメモリから1文
字毎の文字パターンデータが切出されて、1文字毎の文
字認識処理が実行されることになる。この文字切出し処
理は装置の文字切出し部において実行される。
文字切出し部は、第5図に示すように、バッファメモリ
に格納された文字パターンデータD1〜D4に対して、
予め決定されるマスクスタート位置M S及び文字ピッ
チ幅PWに基づいて、1文字毎の文字切出し処理を行な
う。ここで、マスクスタート位置MSは文字ピッチ位置
Pを求めるためのスタート位置であり、文字ピッチ幅P
Wと共に予めフォーマットコントロール情報(文字読取
処理に必要な各種制御情報)の中で設定された値である
。このフォーマットコントロール情報は外部からホスト
コンピュータに入力されると、ホストコンピュータから
文字読取装置の制御回路にセットされる。文字切出し部
は、文字パターンデータD1〜D4に対する文字幅方向
の射影データからなるヒストグラムH1〜H5を走査し
、前記のように算出した文字ピッチ位置P1〜P4の近
傍で検出した白データの位置を切出し位置として文字切
出し処理を行なう。
このような文字切出し方式では、文字ピッチ幅PWは予
め正確に設定されている必要がある。言替えれば、帳票
には、各文字を正確かつ一定のピッチで記録する必要が
ある。このため、複数の帳票を読取対象とする場合に、
各帳票間で文字ピッチの変動があると、正確な文字切出
し処理が困難となる。
(発明が解決しようとする課題) 従来の文字切出し方式では、予め文字ピッチ幅PWが正
確に設定されている必要がある。したがって、複数の帳
票を読取対象とする場合に、各帳票間で文字ピッチの変
動があると、正確な文字切出し処理が困難となる。この
ため、読取対象の帳票が制限されることになり、文字読
取装置の性能低下の原因となる欠点がある。
本発明の目的は、複数の帳票を読取対象とする場合に、
各帳票間で多少の文字ピッチの変動がある場合でも、1
文字毎の文字切出し処理を確実に実行し、結果的に確実
な文字認識処理を実現することができる文字読取装置の
文字切出し装置を提供することにある。
[発明の構成コ (課題を解決するための手段と作用) 本発明は、行単位の文字パターンデータから1文字毎の
文字パターンデータを切出す文字読取装置の文字切出し
装置において、バッファ手段に格納された文字パターン
データから各文字ブロックに対する幅方向の射影データ
からなるヒストグラムを作成するヒストグラム作成手段
、ヒストグラムに基づいて各文字ブロックの幅を検出す
る文字ブロック幅検出手段、各文字ブロックの幅及び予
め決定された1文字に対する有効基準幅とを比較して文
字として有効な文字ブロックを選出する文字ブロック選
出手段、各文字ブロックの幅方向に対する中心位置を検
出する中心位置検出手段及び中心位置検出手段により検
出された中心位置により有効な各文字ブロックの隣接す
るブロック間の距離を求め、この距離に基づいて平均文
字ピッチを算出する文字ピッチ算出手段を備えている装
置である。
この平均文字ピッチに基づいてバッファ手段に格納され
た文字パターンデータから1文字毎の文字パターンデー
タを切出す処理が実行される。これにより、各帳票間に
おいて、多少の文字ピッチのばらつきがある場合でも、
常に正確な文字切出し処理を行なうことができる。
(実施例) 以下図面を参照して本発明の詳細な説明する。第1図は
同実施例の文字読取装置の構成を示すブロック図である
。第1図において、光電変換部10は、帳票上を走査し
て得られる光学的イメージを電気信号に変換し、2値化
化号である文字パターンデータを出力する2値化処理機
能も含む回路である。ラインバッファ11は、光電変換
部1oがら出力される1行分の文字パターンデータを格
納するバッファメモリである。文字切出し部12は、本
発明における切出し処理用各種情報に基づいて、ライン
バッファ11から1文字毎の文字パターンデータを切出
し処理する回路である。文字認識部13は、文字切出し
部12により切出された1文字毎の文字認識処理を行な
う回路である。
一方、本発明では、切出し処理用各種情報を作成する回
路として、ヒストグラムバッファ14、文字幅検出部1
5、候補文字選出部16、文字中心検出部■7、隣接文
字間距離検出部I8、候補文字組選出部19及び平均ピ
ッチ計算部20が設けられている。
ヒストグラムバッファ14は、ラインバッファ11に格
納された1行分の文字パターンデータにおいて、文字幅
方向の射影データからなるヒストグラムを格納するメモ
リである。文字幅検出部15は、1行分の文字パターン
データの各文字ブロックに対応するヒストグラムを走査
し、各文字ブロック毎の文字幅を検出する回路である。
候補文字選出部16は、文字幅検出部15で検出された
文字幅及び予め決定された1文字に対する有効基準幅と
を比較し、文字として有効な文字ブロックを選出する回
路である。文字中心検出部17は、候補文字選出部1G
で選出された文字ブロックにおいて、各ブロックに対応
するヒストグラムの中心位置を検出する回路である。隣
接文字間距離検出部18は、文字中心検出部17により
検出された中心位置に基づいて、隣接する各文字ブロッ
クの中心間距離を検出する回路である。候補文字組選出
部19は、隣接する各文字ブロックの中心間距離が予め
決定される基準範囲内である文字ブロックの組を検出す
る回路である。平均ピッチ計算部20は、検出された隣
接する文字ブロックの組の中心間距離に基づいて、1行
分の文字パターンデータにおける平均的な文字ピッチを
算出する回路である。
次に、同実施例の動作を説明する。先ず、読取対象であ
る帳票上が走査されて、光電変換部10により2値化信
号である文字パターンデータに変換される。文字パター
ンデータはラインバッファ11に格納される。ラインバ
ッファ11には、第2図に示すように、1行分の文字パ
ターンデータ(例えば数字の21,300)が格納され
る。このラインバッファ11に格納された文字パターン
データに対して、縦方向である文字幅方向の射影データ
からなるヒストグラムH1〜H6が作成されてヒストグ
ラムバッファ14に格納される(第4図のステップSl
)。ヒストグラムH1〜H6は図示しない文字読取装置
の制御回路により作成される。
次に、文字幅検出部15はヒストグラムバッファ14の
各ヒストグラムH1〜H6を走査し、各文字パターンの
文字ブロック幅W1〜W6を検世する(ステップS2)
。候補文字選出部1Bは、予めフォーマットコントロー
ル情報の中で設定される1文字の有効基準幅WDと各文
字ブロック幅W1〜W6とを比較し、1文字として有効
な文字ブロック幅Wl、W2.W4〜W6に対応するヒ
ストグラムH1,H2,H4〜H6を選出する。ここで
は、文字ブロック幅W3のヒストグラムH3が、文字で
ないと判定されて除外される。
さらに、文字中心検出部17は、第3図に示すように、
候補として選出された各文字ブロックに対応するヒスト
グラムH1,H2,H4〜H6から文字幅方向の中心位
置C1,C2,C4〜C6を検出する(ステップS’3
)。これは、単に各ヒストグラムH1,H2,H4〜H
6を走査して、それぞれの中心位置を算出する。隣接文
字間距離検出部18は、隣接する文字ブロックのヒスト
グラムの両者が文字として有効な場合に、その各文字ブ
ロックの中心間の距離R1〜R3を算出する(ステップ
S4)。ここでは、ヒストグラムH3が有効でないため
、ヒストグラムH2,H3,H4の各中心間の距離は無
視される。
候補文字組選出部19は、検出された各文字ブロックの
中心間距離R1〜R3のそれぞれ及び予め決定された基
準値PS(±Eの許容範囲を含む)とを比較し、rPL
≦Ri≦PHJの条件を満足するRi(i−1〜3)を
選出する(ステップS5)。即ち、第3図に示すように
、基準値PS(ここではR1と同値)に対して、rPL
−PS−EJとrPH−PS+EJとの範囲内にある距
離R1〜R3を選出する。基準値PS及びEは予めフォ
ーマットコントロール情報により設定されている。
そして、平均ピッチ計算部20は、候補として選出され
た各文字ブロックの隣接する中心間距離R1〜R3を加
算し、この加算結果を候補組数(ここでは3組)で割算
した値を推定文字ピッチPとして算出する(ステップS
6)。即ち、推定文字ピッチPは下記式(1)により求
められる。
p−(R1+R2+R3)/3・・・(1)このように
して、1行分の文字パターンデータから各文字ブロック
毎のヒストグラムH1〜H6を作成し、このヒストグラ
ムH1〜H6に基づいて文字以外と推定される文字ブロ
ック(例えばカンマ)を除去する。さらに、選出された
各文字ブロックにおいて隣接するヒストグラムの各中心
間距離に基づいて、推定文字ピッチPを算出する。
文字切出し部12は、算出された推定文字ピッチP及び
ヒストグラムバッファ14の各ヒストグラムH1〜H6
に基づいて、ラインバッファ11から1文字毎の文字切
出し処理を行なう。即ち、マスクスタート位置(第5図
を参照)から推定文字ピッチPの距離及びヒストグラム
の白データの位置を最初の切出し位置とした文字切出し
処理を行なう。
文字認識部13は、文字切出し部1zにより切出された
1文字毎の文字認識処理を行なう。
[発明の効果コ 以上詳述したように本発明によれば、1文字として有効
なヒストグラムを利用して、隣接する文字ブロックの中
心間距離に基づいて推定文字ピッチを求める。この推定
文字ピッチ及びヒストグラムに基づいて、文字切出し処
理を行な・う。したがって、読取対象の帳票毎に文字列
の推定文字ピッチを算出するため、複数の帳票間で多少
の文字ピッチの変動がある場合でも、常に文字切出し処
理を確実に行なうことができる。これにより、結果的に
、1文字毎の文字認識処理を確実に行なうことが可能と
なるものである。
【図面の簡単な説明】
第1図は本発明の実施例に係わる文字読取装置の構成を
示すブロック図、第2図及び第3図はそれぞれ同実施例
の動作を説明するための概念図、第4図は同実施例の動
作を説明するためのフローチャート、第5図は従来の文
字切出し方式を説明するための概念図である。 11・・・ラインバッファ、12・・・文字切出し部、
14・・・ヒストグラムバッファ、15・・・文字幅検
出部、16・・・候補文字選出部、17・・・文字中心
検出部、18・・・隣接文字間距離検出部、19・・・
候補文字選出部、20・・・平均ピッチ計算部。 出願人代理人 弁理士 鈴江武彦 第1図 第2図 W2B図 第4図

Claims (1)

  1. 【特許請求の範囲】  行単位の文字パターンデータから1文字毎の文字パタ
    ーンデータを切出して文字認識処理を行なう文字読取装
    置において、 前記行単位の文字パターンデータを格納するバッファ手
    段と、 このバッファ手段に格納された文字パターンデータから
    各文字ブロックに対する幅方向の射影データからなるヒ
    ストグラムを作成するヒストグラム作成手段と、 このヒストグラム作成手段により作成されたヒストグラ
    ムに基づいて、各文字ブロックの幅を検出する文字ブロ
    ック幅検出手段と、 この文字ブロック幅検出手段により検出された各文字ブ
    ロックの幅及び予め決定された1文字に対する有効基準
    幅とを比較して文字として有効な文字ブロックを選出す
    る文字ブロック選出手段と、この文字ブロック選出手段
    により選出された各文字ブロックの幅方向に対する中心
    位置を検出する中心位置検出手段と、 この中心位置検出手段により検出された中心位置により
    前記有効な各文字ブロックの隣接するブロック間の距離
    を求め、この距離に基づいて平均文字ピッチを算出して
    推定文字ピッチとして出力する文字ピッチ算出手段と、 この文字ピッチ算出手段により出力された前記推定文字
    ピッチ及び前記ヒストグラムに基づいて前記バッファ手
    段に格納された文字パターンデータから1文字毎の文字
    パターンデータを切出す処理を行なう文字切出し手段と
    を具備したことを特徴とする文字読取装置の文字切出し
    装置。
JP63060263A 1988-03-16 1988-03-16 文字読取装置の文字切出し装置 Pending JPH01234985A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63060263A JPH01234985A (ja) 1988-03-16 1988-03-16 文字読取装置の文字切出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63060263A JPH01234985A (ja) 1988-03-16 1988-03-16 文字読取装置の文字切出し装置

Publications (1)

Publication Number Publication Date
JPH01234985A true JPH01234985A (ja) 1989-09-20

Family

ID=13137091

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63060263A Pending JPH01234985A (ja) 1988-03-16 1988-03-16 文字読取装置の文字切出し装置

Country Status (1)

Country Link
JP (1) JPH01234985A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111598104A (zh) * 2020-06-30 2020-08-28 成都鹏业软件股份有限公司 一种车牌字符识别方法及其系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111598104A (zh) * 2020-06-30 2020-08-28 成都鹏业软件股份有限公司 一种车牌字符识别方法及其系统
CN111598104B (zh) * 2020-06-30 2023-05-12 成都鹏业软件股份有限公司 一种车牌字符识别方法及其系统

Similar Documents

Publication Publication Date Title
EP0308673A2 (en) Image inclination detecting method and apparatus
US20070230784A1 (en) Character string recognition method and device
JP3092576B2 (ja) 文字認識装置
JPH02293989A (ja) 文字認識装置
JPH01234985A (ja) 文字読取装置の文字切出し装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP2630261B2 (ja) 文字認識装置
JP2925270B2 (ja) 文字読取装置
JP3193573B2 (ja) かぎかっこ付文字認識装置
JP2959054B2 (ja) パターン認識装置における線種判別方式
JPH10171924A (ja) 文字認識装置
JP2832035B2 (ja) 文字認識装置
JP2578767B2 (ja) 画像処理方法
JPH03225576A (ja) 単語切り出し装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP3162575B2 (ja) 文字認識装置
JP3047857B2 (ja) 光学式文字読み取り装置
JP2578768B2 (ja) 画像処理方法
JP3027232B2 (ja) 文字認識装置
JPS6394386A (ja) 印字文字ピツチ検出装置
JPS62262194A (ja) 光学式文字読取装置
JPS6394385A (ja) 印字文字ピツチ検出装置
JPH0581477A (ja) 文字切出し方法
JPH10240863A (ja) タイミングマーク検出方法および記憶媒体
JPH1069522A (ja) 文字認識装置及び文字認識方法並びに文字認識方法を記録した記録媒体