JPS62269286A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPS62269286A
JPS62269286A JP61114042A JP11404286A JPS62269286A JP S62269286 A JPS62269286 A JP S62269286A JP 61114042 A JP61114042 A JP 61114042A JP 11404286 A JP11404286 A JP 11404286A JP S62269286 A JPS62269286 A JP S62269286A
Authority
JP
Japan
Prior art keywords
character
direction code
image
code
thickening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61114042A
Other languages
English (en)
Inventor
Hajime Sato
元 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61114042A priority Critical patent/JPS62269286A/ja
Priority to GB8711738A priority patent/GB2190778B/en
Priority to DE19873716787 priority patent/DE3716787A1/de
Publication of JPS62269286A publication Critical patent/JPS62269286A/ja
Priority to US07/241,825 priority patent/US4903312A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は、ドツトマトリックス文字のL2識に好適な文
字認識方式に関する。
〔従来技術〕
文字認識においては、スキャナによって読み取られた文
字の2値画像を領域分割し、分割領域毎に特徴を抽出す
ることが多い。
従来、そのような文字認識方式においては1分割点を固
定して領域分割するか、または文字画像の周辺分布の重
心点を利用して分割点を決定して領域分割を行う方法が
採用されている。
しかし、前者の領域分割方法では、文字の変形により領
域分割が不適当となって、文字の特徴を正しく抽出でき
なくなりやすいため、文字変形に弱いという問題がある
他方、後者の領域分割方法では文字の変形による影響は
軽減されるが1周辺分布の重心点を利用する関係から領
域分割のための演算斌が多く、認識時間が長いという問
題がある。
このような問題を解決するために、本願出願人は特願昭
59−21017760号によって改良された文字認識
方式を提案している。
この文字認識方式によれば、前記従来方式の問照点を解
決することができる。しかし、その後の研究によると、
5×7ドツトマトリックス文字のように低品質のドツト
マトリックス文字の認識に適用した場合、ドツト位置の
ずれおよびドツト間の隙間のばらつきの影響によって、
認識率が不十分になることがあることが判明した。
〔目 的〕
したがって、本発明の目的は、そのような問題点を改良
し、低品質のドツトマトリックス文字に対しても高い認
識率を達成できる文字認識方式を提供することにある。
〔構 成〕
この目的を達成するために、本発明にあっては、スキャ
ナによって読み取られた文字の2値画像に太め処理を施
してドツトマトリックス文字のドツト間の隙間を埋める
ことにより、ドツト位置の変動およびドツト間の隙間の
ばらつきの影響を受けにくくする。そして、太め処理後
の2値画像の文字線輪郭部に方向コードを付ける処理を
施し、その処理画像をスキャンしながら方向コードを計
数し、その計数値に基づいて分割位置を決定して前記処
理画像を複数の領域に分割した後、前記各領域毎に方向
コード別のヒストグラムなどの特徴を抽出し、その特徴
と辞書に登録されている同様の特徴との距離演算を行う
ことにより前記文字を認識する。
〔実施例〕
このような本発明の文字認識方式の一実施例について1
図面を参照し以下詳細に説明する。
第1図は本発明の一実施例における文字認識処理の流れ
を簡略化して示す概略フローチャートであり、また第2
図はその文字認識処理を実行する光学的文字認識装置(
OCR)の概略ブロック図である。
JjX稿の文字はスキャナ101により読み込まれ、2
値画像として文字切り出し部102に入力され。
そこで個々の文字毎に切り出される。ここまでは、従来
と同様である。
切り出された文字の2値画像は太め処理部103に入力
され、そこで太め処理を施される(ステップ201)。
この太め処理は、文字の2値画像の黒画素の左右の白画
素を黒画素に変換するという操作によってなされる。
第3図に、12本/ m mの密度で読み取られたこの
2値画像に前記太め処理を施した後の2値画像を第4図
に示す。この図に示すように、太め処理によってドツト
間の隙間が埋まるため、ドツト位置のずれおよびドツト
間隙間のばらつきの影響を受けにくくなり、後述の分割
領域と特徴抽出を安定化することができる。
なお、スキャナ101の読み取り密度がさらに高い場合
(例えば16本/mm)、文字の2値画像のドツト間の
隙間が増大するため、前記太め処理の方法では効果が不
足することもある。その場合1例えば黒画素の左右の白
画素だけでなく、上下の秦画素も黒画素に変換する操作
によって太め処理を施すとよい。
このような太め処理を施された文字の2値画像は方向コ
ード付は部104に送られ1文字線輪郭部の白画素に第
6図に示す方向コードを付与される(ステップ202)
。この図において、中央の格子が注目画素であり、白抜
き格子は白画素、斜線を施された格子は黒画素である。
具体的には、太め処理後の文字の2値画像をスキャンし
、注目画素とその上下左右の画素のパターンが第6図の
いずれかのパターンと一致した場合、そのパターンの下
に示されている方向コードを注目画素に付ける。このよ
うな処理によって、第4図の太め処理画像には第5図に
示すような方向コードが付られる。
なお、文字線輪郭部の黒画素に方向コードを付けること
もできる。
このような方向コード付は処理後の画像は特徴抽出部1
05へ送られる。その特徴抽出部105において、方向
コード付は処理画像はスキャンされて方向コードの計数
が行われ、その計数値に基づいて分割点が決定されて4
X4の領域に分割される(ステップ203)。このよう
な方向コードの計数による変動領域分割の詳細について
は、後述する。
つぎに、方向コード付は処理画像が再びスキャンされ1
分割された各領域毎に各方向コードが計数され、方向コ
ード別のヒストグラムが抽出される(ステップ2o4)
。このヒストグラム情報は入力文字の特徴として認識部
106へ送られる。
辞書107には、既知の各種文字について同様の領域毎
の方向別ヒストグラムが登録されている。
認識部106において、特徴抽出部105から入力され
た方向コード別ヒストグラムと辞書107に登録されて
いる方向別ヒストグラムとの距離演算が行われる(ステ
ップ205)。
この距離として1例えば単純なユークリッド距離が求め
られる。入力文字の領域(ITJ)の方向コードにのヒ
ストグラムをHkij、ある辞書登録文字の領域C1t
 j)の方向コードにのヒストグラムをDkijとする
と、両ヒストグラムの距離dは式 によって計算される。
このようにして計算された距離の最小の文字が決定され
、そのコードが文字認識結果として出力される(ステッ
プ206)。
つぎに、ステップ203における領域分割処理について
、第7図に示すフローチャートに従って詳細に説明する
。このフローチャートはX方向の分割位置の決定のため
の処理を示しており、Y方向の分割位置も同様の処理に
より決定される。
なお、ここで説明するような領域分割処理は特徴抽出部
105で実行される。そのような特徴抽出部105の機
能は1例えば一般的なマイクロプロセッサとメモリなど
のハードウェアと、処理プログラムの組合せにより実現
されるが、以下の説明に基づき当業者ならば容易に具体
化できるであろうから、具体的構成の図示ならびに説明
は割愛する。
なお、以下の説明中のカウンタやレジスタはマイクロプ
ロセッサの内部レジスタまたはメモリ上のレジスタであ
り、判定などはマイクロプロセッサにより実行される。
まず、X方向の分割について説明する。メモリに記憶さ
れた方向コード付は処理画像がスキャンされ、その方向
コード(文字線軸郭画素数)の総数PEが計数される(
ステップ301)。
つぎに、カウンタnに初期値1が設定され、カウンタN
にX方向分割数(ここでは4)が設定され、レジスタT
に領域の重なり量が設定され、方向コードカウンタPx
およびXアドレスカウンタがクリアされる(ステップ3
o2)。
このような準備の後、方向コード付は処理画像を、Y方
向を主走査方向、X方向を副走査方向としてスキャンし
ながら、方向コードを計数してX方向の分割位置を順次
決定する。
すなわち、スキャンラインを指定するXアドレスカウン
タを1だけインクリメントしくステップ304)、Xカ
ウンタの値で指定されるラインをY方向にスキャンしな
がら、方向コードが検出される度に方向コードカウンタ
Pxをカウントアツプされる(ステップ305)。
一つのラインのスキャンが終わると、方向コードカウン
タPxの値(最初のライン、つまりX=1のラインから
Xアドレスカウンタで指定されているラインまでの方向
コード数)が、PE/NXn以上であるか比較判定され
る(ステップ306)。
この判定が不成立ならば、ステップ304に戻り、次の
ラインについてスキャンが行われ、方向コードが計数さ
れる。
ステップ306の判定が成立すると、その時のXアドレ
スカウンタで示されるラインが、X方向のn番目の分割
領域の終点位置(右側の分割点)として決定され、また
Xアドレスカウンタの値からレジスタTの値を引いた値
で示されるラインが次の分割領域の始点(左側の分割点
)として失点される(ステップ307)。
つぎに、カウンタnが1だけインクリメントされ(ステ
ップ308)、ステップ303に戻り、同様の処理が行
われる。
このようにして、方向コード数PxがP E/4に達し
たライン位置(Xアドレス)が1番目の領域の終点、そ
のT本だけ前のラインが2番目の領域の始点、方向コー
ド数PxがPE/2に達したライン位置が2番目の領域
の終点、そのT本手前のラインの位置が3番目の始点、
方向コード数PXがPEX3/4に達したライン位置が
3番目の領域の終点、そのT本前ライン位置が4番目の
領域の始点として決定される。
なお、1番目の領域の始点は文字枠の左辺であり、4番
目の領域の終点は文字枠の右辺である。
3番目の領域の終点および4番目の領域の始点が決定さ
れると、ステップ303の判定が不成立になるため、X
方向の分割位置決定のための処理は終了する。
次にY方向の分割位置決定が同様に行われる。
ただし、方向コード総数PEは既に求められているので
、その計数は改めて行われない。また、分割点決定のた
めのスキャンは、X方向を主走査方向、Y方向を副走査
方向として行われる。1番目の領域の始点は文字枠の上
辺、4番目の領域の終点は文字枠の下辺とされる。
このようにして、X、Y各方向について決定された分割
点(終点および始点)にて、方向コードつけ処理画像は
4X4の領域に分割される。第5図の方向コード付は処
理画像の場合、同図に細線で示すように領域分割される
。ただし、領域型なり量Tは0とされている。
このように方向コードの分布に応じて分割位置を変動さ
せて領域分割を行う方式は、文字の変形に適応した位置
での領域分割が可能であり、固定した位置で分割する方
式における問題を解消でき、複雑な演算を必要とせず高
速処理が可能であるという本質的な長所を有する。
しかし、前述のように低品質のドットマ1へリックス文
字の2値画像を太め処理をほどこすことなく、そのまま
方向コード付けをおこない、その処理画像の領域分割を
行うと、ドツト位置のずれおよびドツト間隙間のばらつ
きによる影響を受け、文字変形に強いという長所を十分
発揮させることができないことがある。
そこで、本発明にあっては、文字の2値画像に太め処理
を施すことにより、ドツト位置ずれおよびドツト間隙間
の変動の影響を除去し、上記領域分割方式の文字変形に
強いという長所を最大限に発揮させるようにしている。
その結果、5×7ドツ1−マトリックス文字のように品
質の悪いドツトマトリックス文字に対しても、十分高い
認識率を達成することができる。
また、太め処理は前述のような簡単な操作で行うことが
でき、その処理を短時間に行うことができるため1文字
認識時間の増大を招くことはない。
以上、一実施例について詳細に説明したが、本発明はそ
れだけに限定されるものでなく、その要旨を逸脱しない
範囲内で種々変形して実施し得るものである。
例えば、太め処理は、前述のような目的を達成だきる限
り他のアルゴリズムに従って行ってもよい。
領域分割処理についても、そのアルゴリズムを適宜変更
してよい。例えば特願昭59−21017760号の明
細書および図面に開示されているような他のアルゴリズ
ムに従って、領域分割を行うことができる。
〔効 果〕
以上の説明から明らかなように、本発明によれば、認識
時間の増大を招くことなく、低品質のドツトマトリック
ス文字などに対しても高い認識率を達成できる文字認識
方式を実現できる。
【図面の簡単な説明】
第1図は本発明の一実施例における文字認識処理を説明
するための概略フローチャート、第2図は同実施例に係
る光学的文字認識装置の概略ブロック図、第3図はスキ
ャンによって読み取られたドツトマトリックス文字の2
値画像の一例を示す図、第4図は第3図のドツトマトリ
ックス文字の2値画像に太め処理を施した結果の一例を
示す図、第5図は第4図の画像に対する方向コード付は
処理結果および領域分割結果を示す図、第6図は文字線
輪郭部の白画素に付ける方向コードのパター−トである
。 101・・・スキャナ、 102・・・文字切り出し部
、103・・・太め処理、 104・・・方向コード付
部、105・・・特徴抽出部、  106・・・認識部
、107・・・辞書。 第1図 第  2  図 くギクード似p +234511;78901234567890123
45678901234第  4  図 12345678901234567890j2345
678901234第  5  図 コード゛’O+253o6゜ コード  4  8  0  0  7   o□  
 。 第  7  図

Claims (2)

    【特許請求の範囲】
  1. (1)スキャナによって読み取られた文字の2値画像に
    太め処理を施し、この太め処理後の2値画像の文字線輪
    郭部に方向コードを付ける処理を施し、その処理画像を
    スキャンしながら方向コードを計数し、その計数値に基
    づいて分割位置を決定して前記処理画像を複数の領域に
    分割した後、前記各領域毎に特徴を抽出し、その特徴と
    辞書に登録されている特徴との距離演算を行うことによ
    り前記文字を認識することを特徴とする文字認識方式。
  2. (2)前記特徴は方向コード別ヒストグラムであること
    を特徴とする特許請求の範囲第1項に記載の文字認識方
    式。
JP61114042A 1986-05-19 1986-05-19 文字認識方式 Pending JPS62269286A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP61114042A JPS62269286A (ja) 1986-05-19 1986-05-19 文字認識方式
GB8711738A GB2190778B (en) 1986-05-19 1987-05-19 Character recognition with variable subdivisions of a character region
DE19873716787 DE3716787A1 (de) 1986-05-19 1987-05-19 Zeichenerkennungsverfahren
US07/241,825 US4903312A (en) 1986-05-19 1988-09-06 Character recognition with variable subdivisions of a character region

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61114042A JPS62269286A (ja) 1986-05-19 1986-05-19 文字認識方式

Publications (1)

Publication Number Publication Date
JPS62269286A true JPS62269286A (ja) 1987-11-21

Family

ID=14627573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61114042A Pending JPS62269286A (ja) 1986-05-19 1986-05-19 文字認識方式

Country Status (1)

Country Link
JP (1) JPS62269286A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0283689A (ja) * 1988-09-20 1990-03-23 Nec Corp 文字認識方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0283689A (ja) * 1988-09-20 1990-03-23 Nec Corp 文字認識方式

Similar Documents

Publication Publication Date Title
US4903312A (en) Character recognition with variable subdivisions of a character region
US6351546B1 (en) Image processing method and image processing device
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US8548246B2 (en) Method and system for preprocessing an image for optical character recognition
US4556985A (en) Pattern recognition apparatus
EP0482187A1 (en) Row-by-row segmentation and thresholding for optical character recognition (system and method)
US4776024A (en) System for segmenting character components
EP0062665A1 (en) Segmentation system and method for optical character scanning
JPS62269286A (ja) 文字認識方式
JP3607065B2 (ja) 楽譜認識方法及び楽譜認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2832928B2 (ja) 文字認識方法
JP2501646B2 (ja) 文字背景処理装置
JPS62121589A (ja) 文字切出し方法
JPH0540848A (ja) 文書画像の領域抽出方法
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP2003271897A (ja) 文字認識装置、画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JPH02278104A (ja) 文書画像の傾き角検出方法
JPS6343788B2 (ja)
JP2954218B2 (ja) 画像処理方法及び装置
JPH07120392B2 (ja) 文字パターン切り出し装置
JPH0660220A (ja) 文書画像の領域抽出方法
JPH04343193A (ja) 2値化閾値設定方法
JPH10177620A (ja) 文字領域切出し方法及び装置,記録媒体
JPS59142678A (ja) 枠認識方式
JPH0728943A (ja) 文字画像補正装置