JPS6394385A - 印字文字ピツチ検出装置 - Google Patents

印字文字ピツチ検出装置

Info

Publication number
JPS6394385A
JPS6394385A JP61240118A JP24011886A JPS6394385A JP S6394385 A JPS6394385 A JP S6394385A JP 61240118 A JP61240118 A JP 61240118A JP 24011886 A JP24011886 A JP 24011886A JP S6394385 A JPS6394385 A JP S6394385A
Authority
JP
Japan
Prior art keywords
character
space
correlation value
pitch
bit pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61240118A
Other languages
English (en)
Inventor
Koji Ito
伊藤 公嗣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo Keiki Inc
Original Assignee
Tokyo Keiki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Keiki Co Ltd filed Critical Tokyo Keiki Co Ltd
Priority to JP61240118A priority Critical patent/JPS6394385A/ja
Publication of JPS6394385A publication Critical patent/JPS6394385A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、光学式文字読取装置の印字文字切出しに用い
られる印字文字ピッチ検出装四に関する。
(従来技術) 従来、光学式文字読取装置(OCR>による活字文字の
読取りにあっては、紙面に印字された活字文字が一般的
に予め定めた固定ピッチで印字されていることから、ま
ず読取ヘッドの紙面走査による光電変換で得られた読取
信号を2値化して2次元ビットパターンに変換する。
続いて2次元ビットパターンの中から文字行を検出し、
更に検出した文字行から1文字1文字を順次切出し、こ
の切出し文字を認識部に送って文字認識を行なわせるよ
うにしている。
このような文字認識を行なう処理過程で文字行データよ
り1文字づつ切出す処理を行なう際に印字文字ピッチが
重要な情報となる。
即ち、印字文字ピッチが分っていれば、文字の間の区切
り部分(文字間スペース)を検出する場合に予め区切り
部分の存在範囲が予測でき、その範囲内での検索で区切
り部分が検出できるからである。
そこで従来装置にあっては、一般的に使用される印字文
字ピッチが10文字/インチ及び12文字/インチの2
種類であることから、入力される印字データはその2種
類のみ文字ピッチであるとして文字切出しを行なうよう
にしている。
(発明が解決しようとする問題点) しかしながら、2種類の文字ピッチのみを対象とした文
字切出しにあっては、2種類の文字ピッチを対象にする
ことから文字間の区切り部分を検出する予測範囲を、両
方に適応できるよう単一ピッチの場合より広い領域に設
定するため、例えば12文字/インチに対しては適切値
より大きい範囲まで検索し、又、10文字/インチの場
合は適切値より小さい範囲まで検索するため、切出しミ
スを生じ易いという問題があった。
また、近年においては読取対象となる印字文字ピッチは
、従来の10文字/インチ、12文字/インチに加えて
15文字/インチや更には文字ピッチが一定しないプロ
ポーショナルスペースのものも見られ、10又は12文
字/インチによる固定的な文字ピッチの設定では文字切
出しが正確にできないという問題があった。
(問題点を解決するための手段) 本発明は、このような従来の問題点に鑑みてなされたも
ので、印字文字の読取データに基づく文字ピッチの検出
により正確な文字切出しができるようにした印字文字ピ
ッチ検出装置を提供することを目的とする。
この目的を達成するため本発明にあっては、紙面に印字
された文字群を読取って認識する文字読取装置の印字文
字ピッチ検出装置として、読取ヘッドの紙面走査で得ら
れた2値化された2次元ビットパターンの中から1行分
のビットパターンを抽出してそのX軸への投影ビットパ
ターンを求め、X軸投影ビットパターンにおける所定数
以内、例えば20ドツト以内の非文字ビット(白ビット
)が連続する部分を文字間スペースとして検出し、この
文字間スペースの中央部に例えば3ビツトの文字ビット
(黒ビット)を設定してスペース情報列F (Xn )
に変換し、このスペース情報列F(Xn )の相関値R
@読取対象となる複数種類の文字ピッチに基づく係数α
毎に として演算し、複数の相関値Rの中から最大値を与える
相関値を選択し、この最大相関値と2番目に大きい相関
値との偏差ΔRが所定値以上であったならば、この最大
相関値の算出に用いた係数αを与える文字ピッチと判定
し、一方、偏差ΔRが所定値より小さいときには、プロ
ポーショナルスペースと判定するようにしたものである
(作用) このような本発明の構成によれば、読取対象となる文字
ピッチの種類に応じて相関値Rの計算に用いる係数αを
設定しておくだけで、実際に読取られたデータに基づい
て印字文字ピッチを正確に検出することができ、文字切
出しの際の文字間の区切り部分を正確に予測できること
から文字ピッチのいかんに係わらず正確な文字切出しを
行なって認識率を向上させることができる。
(実施例) 第1図は本発明の一実施例を示したブロック図である。
まず構成を説明すると、1は1インチ当り10文字ピッ
チ、12文字ピッチ、15文字ピッチ、若しくはプロポ
ーショナルスペースをもって活字が印刷された印字用紙
であり、印字用紙1の印字文字は読取ヘッド2による紙
面走査で光学的に読取られ、アナログイメージ信号(読
取信号)として出力される。読取ヘッド2からのアナロ
グ読取信号はA/D変換器3で所定ビット数のデジタル
ビットデータに変換され、2次元ビットパターンメモリ
4に2次元ビットパターンの形で書込記憶される。
5は2次元ビットパターンメモリ4に記憶された2次元
ビットパターンの中から文字ピッチ検出のため、1行分
のビットパターンを抽出する1行データ抽出部であり、
1行データ抽出部5で抽出された1行分のビットパター
ンはX軸投影データ変換部6に与えられて読取ヘッド2
におけるX軸への投影ビットパターンに変換される。
このX軸投影データ変換部6によるX軸への投影ビット
パターンの変換を第2図を参照して説明すると次のよう
になる。
第2図において、rABCDFF  ・・・」は印字用
紙1に印字された印字文字であり、読取ヘッド2で読取
られた読取信号は2次元ビットパターンメモリ4におい
て文字部分を黒ビット、文字以外の部分を白ビットとし
た2次元パターンとして記憶されている。そして、1行
データ抽出部5は2次元ビットパターンメモリ4の中か
ら、例えば第2図に示す文字パターンrABCDEF・
・・」を抽出してX軸投影データ変換部6に与え、X軸
投影データ変換部6は各文字パターンにおけるY方向で
のビットデータの論理和を取出すことで、同図斜線部に
示すX軸投影ビットパターンに変換する。
再び第1図を参照するに、X軸投影データ変換部6で得
られたX軸投影ビットパターンは、F(X)データ変換
部7に与えられて文字間スペースを表わすスペース情報
列F (X)に変換される。
このF (X>データ変換部7における文字間スペース
情報列F (X)への変換は次のようにして行なわれる
まずX軸投影データ変換部6で得られた第2図に示すX
軸投影ビットパターンについて、非文字ビット(白ビッ
ト)の連続が所定ビット以内、例えば20ビット以内(
分解能を10ドツト/mmとすると2mm以内)のスペ
ース31.S2.S3゜34、  ・・・を検出し、こ
の20ビット以内となる非文字ビットが連続するスペー
スS1.S2゜S3,34.  ・・・の中央に例えば
3ビツトの文字ビット(黒ビット)を設定し、これをス
ペース情報列F (Xi >、 F (X2 >、 F
 (X3 >、 F(X4)、  ・・・とするデータ
変換を行なう。
再び第1図を参照するに、F (X)データ変換部7で
変換された文字間スペース情報列F (Xn >は、相
関値演算部8に与えられる。この相関値演算部8はF 
(X)データ変換部7より得られたn個の文字間スペー
ス情報列F(Xn)に基づいて次の演算により相関値R
を演算する。
R=、/”(F (X)nF (X+l ) dX−(
1)■ この相関値Rの演算において、係数αは読取対象となる
文字ピッチに基づいて定められたもので、例えば次のよ
うになる。
α=25・・・・10文字/インチ α=21・・・・12文字/インチ α=17・・・・15文字/インチ 即ち、相関値Rの演算に用いられる係数αは、例えば1
0文字/インチを例にとると、α= (1インチのmm換算値)×(文字数)×(分解能)=
25.4mmx (1/ 10) xi 0dot /
mm→25 として求められる。この係数αは設定部9により相関値
演算部8に設定される。
従って、相関値演算部8は設定された係数αのそれぞれ
を用いて相関値Rを演算するものであり、この実施例に
あっては3種類のαが設定されていることから、α=2
5.21.17のそれぞれを用いて相関値R1,R2,
R3を演算するようになる。
更に、前記第(1)式で与えられる相関値Rの演算式を
説明すると、まず積分第1項F (X)は、例えば第2
図における文字間スペース情報F(Xl)であり、積分
第2項F(X十α)はF (XI )から係数αだけ離
れた位置に存在する適宜の文字間スペース情報であり、
もし文字ピッチに基づいて設定した係数αと実際に読取
った文字ピッチとの間に対応関係があった時には、F(
X+α)=F(X2)となり、F (XI >とF(X
2)との論理積をとっていることから、この時の論理積
は「1」となる。次に、F (X> =F (X2 )
として同じく係数αだけ離れた位置のスペース情報を見
ると、この時は(1,O)となることから論理積は「0
」となる。以下同様に、残りの文字スペース情報F (
X3 )、 F (X4 >、  −−−tcツイて同
様な論理積の演算を行ない、その論理積の演算結果の総
和として相関値Rを求めることになる。
再び第1図を参照するに、相関値演算部8で演算された
複数種類の文字ピッチに基づく係数α毎の相関値R1こ
の実施例にあっては3つの相関値R1,R2,R3は文
字ピッチ判別部10に与えられ、相関値R1,R2,R
3の中から最大値となる相関値を選択し、最大値となる
相関値と2番目に大きい相関値との偏差ΔRが所定値以
上であったならば、最大値を与える相関値に対応する文
字ピッチと判定して判定出力を文字切出部11に与える
一方、最大値を与える相関値と2番目に大きい相関値と
の偏差ΔRが所定値より小さい時には、文字ピッチが一
定しないプロポーショナルスペースと判定し、同様に判
定結果を文字切出部11に出力する。
文字切出部11は文字ピッチ判定部10からの判定結果
に基づいて2次元ビットパターンメモリ4から例えば1
行分のビットパターンを読出し、検出された文字ピッチ
に基づいて文字間の区切部分が存在する範囲を予測して
、その範囲内でのデータ検索をもって区切り部を検出す
ることで1文字づつ順次切出し、切出した文字データを
文字認識部12に与えて文字認識を行なうようになる。
次に、第3図のフローチャートを参照して第1図の実施
例による文字ピッチの検出処理を説明する。
まずブロック30で印字用紙1の印字文字を読取ヘッド
2の走査で読取り、ブロック32に示すようにA/D変
換器3で2値化した後に2次元ビットパターンとして2
次元ビットパターンメモリ4に記憶する。続いて、ブロ
ック34で2次元ビットパターンの中から1行分のデー
タを抽出し、ブロック36でX軸への投影データに変換
し、更にブロック38で文字間スペース情報列F (X
)データに変換する。続いて、ブロック40で前記第(
1)式により、文字ピッチに基づいて設定された係数α
1〜α3のそれぞれを用いて相関値R1、R2,R3を
計算し、次のブロック42で最大値を与える相関値を判
別し、判別後に判別ブロック44で最大相関値と2番目
に大きい相関値との偏差ΔRが所定値に以上であれば、
ブロック46に進んで最大相関値を与える係数αに対応
した文字ピッチであると判定し、一方、最大相関値と2
番目に大きい相関値との偏差ΔRが所定値により小ざい
時には、ブロック48に進んでプロポーショナルスペー
スと判定する。
この第3図のフローチャートに示した一連の文字ピッチ
検出処理が終了すると、検出結果が文字切出部11に与
えられ、検出された文字ピッチに基づく文字切出で得ら
れた文字データを文字認識部12に与えて1文字毎の認
識処理を行なうようになる。
尚、第1図の実施例は第3図のフローチャートに示すよ
うにマイクロコンピュータによるプログラム処理で実現
できることは勿論である。
また、上記の実施例は3種類の文字ピッチを例にとるも
のであったが、本発明はこれに限定されず、適宜の種類
の文字ピッチにつき、そのまま適用することができる。
更に上記の実施例では、20ドツト以内の非文字ドツト
(白ドツト)部分を文字間スペースとして検出し、その
中央に3ビツトの文字ビット(黒ビット)を設定して、
文字間スペース情報列F(X)への変換を行なっている
が、これらの値についても印字文字のピッチ、文字の大
きさ、文字フォント等に基づいて適宜の値を設定するこ
とになる。
(発明の効果) 以上説明してきたように本発明によれば、実際に読取ら
れた1行分の文字データに基づいて文字ピッチを検出し
、検出された文字ピッチに基づいて文字切出しを行なう
ことから、文字データの破壊を招く文字切出ミスを生ず
ることなく、正確な文字切出が可能となり、この結果、
認識率をより一層向上させることができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示したブロック図、第2図
はX軸投影データ及び文字間スペース情報列F(X>へ
の変換を示した説明図、第3図は第1図の実施例による
文字ピッチ検出処理を示したフローチャートである。 1:印字用紙 2:読取ヘッド 3:A/D変換器 4:2次元ビットパターンメモリ 5:1行データ抽出部 6:X軸投影データ変換部(第1のデータ変換部)7 
: F (X)データ変換部(第2のデータ変換部)8
:相関値演算部 9:設定部 10:文字ピッチ判定部 1に文字切出部 12:文字認識部

Claims (1)

  1. 【特許請求の範囲】 紙面に印字された文字群を読取つて認識する文字読取装
    置の印字文字ピッチ検出装置に於いて、読取ヘッドの紙
    面走査による読取信号を2値化して2次元ビットパター
    ンとして記憶する記憶手段と、 該記憶手段の2次元ビットパターンの中から1行分のビ
    ットパターンを抽出するデータ抽出手段と、 該データ抽出手段で抽出された1行ビットパターンをX
    軸への投影ビットパターンに変換する第1のデータ変換
    手段と、 該第1のデータ変換手段で得られたX軸投影ビットパタ
    ーンにおける所定数以内の非文字ビットが連続する文字
    スペースの部分を検出し、該文字スペース部分の中央に
    前記所定数より充分に少ない数の文字ビットを設定して
    スペース情報列F(Xn)に変換する第2のデータ変換
    手段と、該第2のデータ変換手段で得られたスペース情
    報列F(Xn)の相関値Rを予め定めた複数種類の文字
    ピッチに基づく係数α毎に R=∫^n_1{F(X)∩F(X+α)}dXとして
    演算する相関値演算手段と、 該相関値演算手段で得られた複数の相関値Rの中から最
    大のものを選択し、該最大相関値と2番目に大きい相関
    値との偏差が所定値以上のとき最大相関値を与える前記
    係数αに対応する文字ピッチと判定し、前記偏差が前記
    所定値より小さいときにはプロポーショナルスペースと
    判定する文字ピッチ判定手段とを備えたことを特徴とす
    る文字ピッチ検出装置。
JP61240118A 1986-10-08 1986-10-08 印字文字ピツチ検出装置 Pending JPS6394385A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61240118A JPS6394385A (ja) 1986-10-08 1986-10-08 印字文字ピツチ検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61240118A JPS6394385A (ja) 1986-10-08 1986-10-08 印字文字ピツチ検出装置

Publications (1)

Publication Number Publication Date
JPS6394385A true JPS6394385A (ja) 1988-04-25

Family

ID=17054756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61240118A Pending JPS6394385A (ja) 1986-10-08 1986-10-08 印字文字ピツチ検出装置

Country Status (1)

Country Link
JP (1) JPS6394385A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008204203A (ja) * 2007-02-20 2008-09-04 Kobe Steel Ltd 文字列画像の画像処理方法,そのプログラム及びその装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008204203A (ja) * 2007-02-20 2008-09-04 Kobe Steel Ltd 文字列画像の画像処理方法,そのプログラム及びその装置

Similar Documents

Publication Publication Date Title
EP0448945A2 (en) A method and apparatus for barcode recognition in a digital image
US4897880A (en) Data acquisition control method and system for a hand held reader
US4556985A (en) Pattern recognition apparatus
JPS63158678A (ja) 単語間スペ−ス検出方法
EP0127441A2 (en) Character recognition apparatus
US5428692A (en) Character recognition system
CA1306296C (en) Image processing apparatus
EP0524797B1 (en) Image processing method and apparatus
JPS62254282A (ja) 重畳するパタ−ンを分離する方法及び装置
JP2644041B2 (ja) 文字認識装置
JPS6394385A (ja) 印字文字ピツチ検出装置
AU613013B2 (en) Data acquisition control method and system for a hand held reader
JPS6394386A (ja) 印字文字ピツチ検出装置
JPS62121589A (ja) 文字切出し方法
JP2716291B2 (ja) 用紙情報入力装置
JPH0557632B2 (ja)
CA1199407A (en) Transition measurement system for hand print recognition
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP2578767B2 (ja) 画像処理方法
JPH01234985A (ja) 文字読取装置の文字切出し装置
JP2576370B2 (ja) Idマーク読み取り装置
JPH0436432B2 (ja)
JPS61196382A (ja) 文字切出し方式
JPS62281094A (ja) パタ−ン情報認識方法
JPH0259504B2 (ja)