JPS58182788A - 印字ピツチ識別方法 - Google Patents

印字ピツチ識別方法

Info

Publication number
JPS58182788A
JPS58182788A JP57066063A JP6606382A JPS58182788A JP S58182788 A JPS58182788 A JP S58182788A JP 57066063 A JP57066063 A JP 57066063A JP 6606382 A JP6606382 A JP 6606382A JP S58182788 A JPS58182788 A JP S58182788A
Authority
JP
Japan
Prior art keywords
projection
width
character
picture data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57066063A
Other languages
English (en)
Inventor
Mamoru Maeda
護 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP57066063A priority Critical patent/JPS58182788A/ja
Publication of JPS58182788A publication Critical patent/JPS58182788A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 稿の印字ピッチを識別する方法に関する。
光学的文字読取装置においては、原稿から読み取った画
像データから個々の文字のiRターンを切り出し、文字
認識を行なう。仁の文字の切出しを行なうには、原稿上
の印字ピッチを知る必要がある。
この印字ピッチを知る方法としては、特開昭5 5 −
 10645号公開特許公報に開示されているものがあ
る。これは文字行の最初の文字位置を基準位置として予
備的な文字の切出しを行ない、切り出すごとに切出し位
置を修正していく方法である。しかし、文字の切出しと
印字ピッチの算出とを同時に行なっており、全文字・9
ターンについて調べるため、処理時間が長く々るという
欠点がある。さらに、帳票上の全文字を代表するような
印字ピッチを算出するものではないので、算出される印
字ピッチは認識用パラメータとして利用できないという
欠点もある。
本発明の目的は、原稿上の全文字を代表する印字ピッチ
(文字切出し、認識用の・ぐラメータとして利用できる
)を短時間に識別する方法を提供することにある。
しかして本発明にあっては、原稿から読み取られた個々
の文字行の画像データについて文字行方向と直交する方
向の射影を抽出し、抽出した個々の射影の幅(文字行方
向のサイズ)および隣り合う射影の中心間の間隔(射影
中心間隔)を求める。
射影の幅および射影中心間隔を求める処理は、射影抽出
処理の完了を待って実行してもよいし、それと並行して
実行してもよい。
このようにして求められた射影中心間隔から、識別対象
のいずれの印字ピッチにお゛いても個々の文字の射影と
して不適当な幅の射影に関する射影中心間隔、およびス
ペース(空白)に対応の射影中心間隔を排除する。この
処理は、その前の処理の完了を待って実行することも、
またはそれと並行して実行することも可能である。そし
て、かかる処理で排除されずに残った射影中心間隔の分
布を調べることにより、当該原稿が識別対象のいずれの
印字ピッチで印字されているが判定する。
第1図は、本発明によって原稿の印字ピッチを識別する
だめの装置の一例を示す概略ブロック図である。以下、
この装置の各ブロックの機能を順次説明しながら、本発
明による印字ピッチ識別処理の具体的な手順の一例を説
明する。
第1図において、1は原稿(図示せず)をラスク走査し
て読み取る読取部であり、各走査線上の画素濃度情報を
アナログ画像信号として出力する。
2値化部2はこのアナログ画像信号を設定された閾値で
2値化し、白/黒2値のディジタル画像データに変換す
る。なお、読取部1はCCDスキャナなどの公知の手段
で構成されるが、ここでは8本/■の走査線密度でラス
ク走査するものとする。
ディジタル画像データは孤立点除去部3に送られる。こ
の孤立点除去部3では、入力されるディジタル画像デー
タ中から、周囲を白1画素で囲まれた孤立した黒画素が
ノイズとして除去される。すなわち第2図において、注
目する画素Xが黒画素のとき、その周囲の画素A−Hの
すべてが白画素の場合、注目画素Xを白画素に変換させ
る。孤立点除去を受けたディジタル画像データ(以下、
単に画像データと称す)は、行抽出部4に送られる。
行抽出部4は1文字行の画像データを抽出し、それを画
像記憶部5に格納するものである。このような行抽出は
種々の方法が公知であり、いずれの方法でもよいが、こ
こでは、例えば、各走査ライン毎に黒画素の有無を検出
して文字行方向(主走食方向)の射影を求め、その射影
の幅が1文字行の筒さとして適当ならば、同射影の範囲
内の各走査ラインの画像データを1文字行の画像データ
として抽出する方法で行なわれる。
1文字行の画像データの抽出、記憶が終了すると、行抽
出部4より行抽出信号が射影検出部6に出され、射影抽
出部6は画像記憶部5内の1文字行画像データの縦方向
(副走査方向)の射影の抽出を開始する。この射影抽出
も種々の方法が公知であるが、ここでは例えば、画像r
−タを文字行(5) の左端から右端に向けて縦方向を主走査方向としてラス
ク走査し、各走査線上の黒画素の有無を調べることによ
って行なう。
例えば、第3図の符号20で示すような1文字行の画像
データが抽出された場合、符号216(i=1,2.・
・・)のような射影が抽出され、このような射影パター
ンが射影パラメータ算出部7へ順次送られる。
射影・やラメータ算出部7は、入力される射影ノ9ター
ンから第3図に示すように、個々の射影21iの幅(横
方向サイズ)Wiと、隣り合う射影の中心と中心の間隔
CGj(j=1.2.・・・)を画素数に。
換算した値として算出し、選別部8へ順次送る。
なお、このような射影幅および射影中心間隔の算出は、
射影の抽出処理が1文字行の全ての文字ノソターンにつ
いて完了してから行なうことも、あるいは射影抽出と並
行して行なってもよい。
選別部8は、射影・母うメータ算出部7で求められる射
影中心間隔のうちから、印字ピッチの識別のために適当
なものだけを選別するものである。
(6) すなわち、連結した文字・ぐターンに関する射影中心間
隔や、ス被−ス(語と語の間の空白2文字行の前後など
にあるス波−スなと)に対応する射影中心間隔を不適当
な・ぐラメータとして排除する。
本実施例では、識別対象とする印字ピッチの種類として
、「インチ] OJ 、 rインチ12」。
「プロポーショナル」の3種類を考える。「インチ1o
(42,)」1とは、1インチ幅に10(12)文字の
ピッチで印字されるもので、「プロポーショナル」は個
々の文字によって印字ピッチをある範囲内で変化させる
ものである。これら各印字ピンチのプリンタで印字した
正常な文字列をn/ trmの走置線密度で読み取り、
射影中心間隔(画素数換算値)を調べた結果、射影中心
間隔の正常な範囲は第1表の如くになる。
第  1  表 また、これら各印字ピッチによる個々の文字の幅は21
画素幅を越えないこともわかる。
しかして前記の選別部8は、21画素幅以上の射影に関
係する射影中心間隔、および28画素数以上の射影中心
間隔を、それぞれ連結ノeターンとス被−スに相当する
不要な・やラメータとして棄却する。例えば第3図にお
いて、射影213 (文字mが2つ連結したパターンの
射影)の幅W3は21画素を越えるので、それに関係す
る射影中心間隔CG21 CG3は棄却される。
選別部8で棄却されずに残った射影中心間隔のデータは
分類部9に送られ、I、TI、IIIの3組に分類され
る。すなわち、25画素以上か14画素以下の射影中心
間隔のデータは1組へ、20画素から24画素の範囲の
射影中心間隔のデータは1組へ、15画素から19画素
の範囲の射影中心間隔のデータはIII組へそれぞれ分
類し、各組毎に分類した射影中心間隔のデータ数、およ
び全組のデータ合計数を計数する。このデータ合計数が
所定数Nに達すると、分類部9は分類を停止し、判定部
10を起動する。
判定部10は、分類部9で求められた1〜■組のデータ
数を参照し、1組に分類されたデータ数N2がデータ合
計数Nの75多以上ならば、当該原稿の印字ピッチは「
インチ10」と判定する。−1だ、■組のデータ数N3
がデータ合計数Nの75チ以上ならば、[インチ12J
と判定する。寸だ、1組のデータ数N、III組のデー
タ数N2.III組のデータ数N3のいずれもがデータ
合剖数Nの25%を越えるならば、「プロポーショナル
」と判定する。すなわち、印字ピッチの識別のために不
適当な特異な値の射影中心間隔を除外し、適当な範囲内
の値の射影中心間隔の分布を調べて、原稿の印字ピッチ
を判別するわけである。
上記のデータ合計数Nは分布による判定に十分な値であ
れば任意に決定できるが、1文字行の画像データから印
字ピッチを判別することを考慮して例えばN=20程度
に選ぶことができる。なお、1文字行だけではデータ数
がNに満たない場合も起り得る。この場合は、データ数
がNに達するま(9) で、後続の文字行を読み取り、同様の処理が行なわれる
なお、第1図の各機能ブロックにおける個々の処理は、
前述の如く格別に新しいものではない。
したがって各機能ブロックは公知の技術で実現容易であ
るから、その具体的構成の説明は割愛する。
本発明は以上に述べた如くであるから、局所定な印字ピ
ッチの変動に影響されずに、帳票の全文字を代表する印
字ピッチを短時間で識別することができ、その効果は顕
著である。
【図面の簡単な説明】
第1図は本発明による印字ピッチ識別処理を実行する装
置の一例を示す概略ブロック図、第2図は孤立点除去の
説明図、第3図は射影抽出と射影パラメータを説明する
だめの図である。 ■・・・読取部、2・・・2値化部、3・・・行抽出部
、4・・・行抽出部、5・・・画像記憶部、6・・・射
影抽出部、7・・・射影・ぐラメータ算出部、8・・・
選別部、9・・・分類部、IO・・・判定部。 (10)

Claims (1)

    【特許請求の範囲】
  1. 原稿から読み取られた個々の文字行の画像データについ
    て文字行方向と直交する方向の射影を抽出する第1処理
    段階と、該第1処理段階の処理の完了後またはその処理
    と並行して、該第1処理段階で抽出された個々の射影の
    幅および隣り合う射影の中心間の間隔を求める第2処理
    段階と、該第2処理段階の処理の完了後またはその処理
    と並行して、該第2処理段階で求められた射影中心間隔
    から、識別対象のいずれの印字ピッチにおいても個々の
    文字の射影として不適当な幅の射影に関する射影中心間
    隔、およびスペースに対応の射影中心間隔を排除する第
    3処理段階と、該第3処理段階で排除されずに残った射
    影中心間隔の分布を調べることにより、当該原稿が識別
    対象のいずれの印字ピッチで印字されているか判定する
    第4処理段階とから成ることを特徴とする印字ピッチ識
    別方法。
JP57066063A 1982-04-20 1982-04-20 印字ピツチ識別方法 Pending JPS58182788A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57066063A JPS58182788A (ja) 1982-04-20 1982-04-20 印字ピツチ識別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57066063A JPS58182788A (ja) 1982-04-20 1982-04-20 印字ピツチ識別方法

Publications (1)

Publication Number Publication Date
JPS58182788A true JPS58182788A (ja) 1983-10-25

Family

ID=13305018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57066063A Pending JPS58182788A (ja) 1982-04-20 1982-04-20 印字ピツチ識別方法

Country Status (1)

Country Link
JP (1) JPS58182788A (ja)

Similar Documents

Publication Publication Date Title
US5280544A (en) Optical character reading apparatus and method
US8306325B2 (en) Text character identification system and method thereof
JPS60262284A (ja) イメ−ジ処理方法
JPS6077279A (ja) 文字イメ−ジ切出し方法
EP0717365B1 (en) Linear line detection apparatus using projection image of character string including linear line
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPS58182788A (ja) 印字ピツチ識別方法
JPH0291789A (ja) 文字認識方法
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JP3526370B2 (ja) バーコード読取方法およびバーコード読取装置
JP4254008B2 (ja) パターン検出装置及び方法
JPH05128308A (ja) 文字認識装置
JP4218179B2 (ja) パターン検出装置及び方法
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JPS59180783A (ja) 光学的文字読取装置
JPH10171924A (ja) 文字認識装置
JPH05135204A (ja) 文字認識装置
JPS58222381A (ja) 文字切出し方式
JPH0535921A (ja) 文字照合装置及びそのための方法
JP2578768B2 (ja) 画像処理方法
JP2005208979A (ja) 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置
JPH0632074B2 (ja) 正規化方法
JP2875330B2 (ja) 文字認識方法
JPS58222384A (ja) フオント識別方式
JPS63136181A (ja) 文字読取装置