JPS6116380A - 領域分割方式 - Google Patents

領域分割方式

Info

Publication number
JPS6116380A
JPS6116380A JP59137532A JP13753284A JPS6116380A JP S6116380 A JPS6116380 A JP S6116380A JP 59137532 A JP59137532 A JP 59137532A JP 13753284 A JP13753284 A JP 13753284A JP S6116380 A JPS6116380 A JP S6116380A
Authority
JP
Japan
Prior art keywords
area
character
run
division
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59137532A
Other languages
English (en)
Inventor
Masahiro Nakamura
昌弘 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59137532A priority Critical patent/JPS6116380A/ja
Publication of JPS6116380A publication Critical patent/JPS6116380A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は1文字認識装置や音声認識装置などにおけるパ
ターンの領域分割方式に関する。
〔先行技術〕
文字認識装置において1文字パターンの背景部の画素に
開方向によるコードを付け、各開方向コードの連続し、
た領域を文字の特徴として抽出する場合がある。このよ
うな領域抽出においては1文字パターンの変形による影
響で、木来別々の領域が二つ以上、一つの領域として抽
出されることがあり、抽出領域の分割処理がしばしば必
要となる。
その領域分割の方式としては、領域の周辺分布に基づき
領域を分割する方式が考案されている。
し、かし・、文字に幅の広い突起部がある場合など、領
域の形状によって正常に分割し得ないことがあり、また
処理のハード化が容易でないなどの問題があり、改善が
望まれている。
〔目 的〕
本発明の目的は、領域の形状に殆ど影響されることなく
正常な領域分割が可能であり、かつ処理のハード化が容
易な領域分割方式を提供することにある。
〔構 成〕
本発明によれは1分割したい画像などの領域を含む限定
メモリ空間を分割方向と垂直な方向にラスタスキャンし
、領域内の点の連続であるランを検出し5、最初にラン
数がN(ただし1N≧2)以上となるライン上のライン
先頭側のN個のランの位置、および、最後にラン数がN
以上となるライン上のランの位置をそれぞれ検出し、前
者の2つのランの間にあり、それとのラスタスキャン方
向と垂直な方向の距離が所定値以上の後者のランの位置
において領域を(、N−])個以下の部分に分割する処
理が行われる。この処理により、従来方式よりも適切な
領域分割を期待できるが、ノイズが存在し、その部分で
ラン数がNに達した場合、必要な領域分割か為されない
恐れがある。それに対処するため1本発明では、ラスタ
スキャン範囲を狭めて同様の分割処理が再度行われる。
つきに、図面を用いて本発明の一実施例を詳細に説明す
る。
第2図は本発明に係る文字認識装置の概略ブロック図で
ある。この図において、10は原稿を光学的に走査し、
原稿画像をアナログ画信号に光電変換する読取部である
。この読取部10から出力されるアナログ画信号は、2
値化・ノイズ除去部11により2値化され、また孤立点
(ノイズ)を除去される。
2値化された画像データは切出部12に入力され1周知
の射影法などによって、個々の文字パターン毎に切り出
される。
特徴抽出部13は、切出部12により切り出された文字
パターンから、文字認識の特徴を抽出する。
一方、切り出された文字パターンのデータは開方向コー
ド化部1/Iへも入力される。この開方向コート化部1
4により1文字パターンの背景部の白画素に、その開方
向(上下左右のうちの黒画素のない方向)による開方向
コートが付けられる。
第3図に、白画素と」−下左右の画素のパターンと開方
向コードとの対応図を示す。
開方向コート化の後、域領抽出部I5により。
同一開方向コードが4連結(上下左右で互いに連続して
いる)の領域が抽出される。ただし1幅が2以上の連結
領域のみ抽出される。
ここまでの各部の処理は従来と同様でよいので1、ニド
以上の詳細は説明し、ない。
このようにして抽出された各開方向コートの連結領域に
は1本来2以上の領域に分割すべきものもあり得る。そ
のような領域の分割は領域分割部16で行われる。ただ
し、領域分割の対象となるのは、開方向コートB、C,
D、E(16進表現)の領域だけである。
なお1本実施例においては、文字パターンは33×33
画素であり、領域分割の対象となる個々の領域は、それ
ぞれ領域内部の画素を’M”、外部の画素を′″0″と
した33X33画素のデータとして、領域分割部16内
のメモリ上の33X33画素エリアに記憶される。その
領域のエリア内の相対位置は1元の文字パターンにおけ
るそれと同じ。
である。
次に領域分割処理を説明するが、本実施例の領域分割部
16は、cpu、データやプログラムを記憶するための
メモリ、入出力ポートなどがら成る一般的なマイクロプ
ロセッサにより構成されているとする。第4図および第
5図のフローチャートを参照して処理の各段階を順に説
明する。以下の説明中の()中の数字は、フローチャー
ト中のステップ番号を示す。なお、本実施例ではN=2
である。
本実施例においては、開方向コードに関係なく、領域デ
ータが記憶されている33X33画素メモリエリアのラ
スタスキャンを水平方向に行う関係上、各開方向コード
の領域について、その領域の凹凸(山と谷)が上下方向
にできるようにするための座標変換が最初に行われる(
] Ol)。即ち。
領域データの記憶されているメモリエリア上の垂直方向
座標iと水平方向座標Jを、つどのように変換する。
(イ)開方向コートBの領域についてはi−’+i+j
−+j (ロ) 開方向コードCの領域についてはニー+j、j
→i (ハ) 開方向コードDの領域については】→33 1
+1−+J (ニ)開方向コードEの領域についてはi→33−、j
−+i ここで、33はi、jの最大値である。
このような座標変換が終了すると、フラグFLAGとP
E、走査点の垂直方向座標i (走査ライン番号)を保
持するためのカウンタ■、走査点の水平方向座標を保持
するためのカウンタJがリセットされる(102)。こ
こから、33X33のメモリ空間に対するラスタスキャ
ンが始まる。
カウンタJ (初期値=0)が1だけインクリメントさ
れ、1ライン上のラン数を保持するためのカウンタRU
Nがクリアされる(103)、、カウンタJがまたけイ
ンクリメントされる(104)。
メモリ上のカウンタ、Jで指定される画素の値W(J、
I)が読み出され、その値のゼロ判定が行われる(10
5)。W (J、I)=O1っます走査点が袖域外の画
素ならば、PEがリセットされ(106)、、J値が最
大値JMAX(ここではJMAX=33)L−達したカ
調へられル(107)。判定結果がNOの場合、つまり
あるラインの途中を走査中の場合、ステップ104に戻
り、走査点を水平方向l\1画素進める。判定結果がY
ESならば、■値が最大値IMAX(ここではIMAX
=33)に達したか判定しく103)、判定結果がNO
つまり未走査のラインが残っている場合、ステップ10
3へ戻り、次のラインを処理する。
ステップ105においてW (J、I)=、つまり走査
点か領域内の画素ならば、PEのゼロ判定が行われる(
1、0)。PE= 1の場合、その走査点は、その時の
ライン上の直前画素と同しランに含まれる画素であり、
改めてランを検出したわけでないから、ステップ107
八進む。
PE=Oならば、その走査点は新し7いランの先頭画素
であるから、PEに1がセットされ、またRUNは1だ
けインクリメントさ九る(111)。
そのランが、そのラインの最初に検出されたランならば
、ここでRUNの値は1となる。つぎにFLAGのゼロ
判定が行われる(112)。最初のラン数2以上のライ
ンが検出されるまでは、FLAGはOlつまりリセット
状態である。
FLAG=Oならば、RUN値が2 (=N)であるか
判定され(113)、YESならばメモリロケーション
P (1,1)、P (1,2)へJ。
■の値がそれぞれ格納さ1t(115)、ステップ10
7へ戻る。ステップ113の判定結果がYESの場合、
メモリロケーションP(2,1)、P(3,1)にJ値
が、ロケーションp (2+ 2) IP (3,2)
に1値が格納さ九、またFLAGがセットされ(114
)、ステップ108へ戻るtここまでの処理の内容につ
いて、具体例により説明する。例えば、第1図(A)の
領域50の分割処理を行っているのであれば、最初にラ
ン数が2以上となるライン上の一つ目のランの先頭画素
P1を走査し、た時に、ステップ115まで進み、PL
の座標がメモリロケーションP(1,1’)、P (1
,2)に格納さ九る。同ライン上の二つ目のランの先頭
画素’P 2を走査し7た時に、RUN=2であるから
ステップ11/Iへ進み、P2の座標がメモリロケーシ
ョンP (2,1)、P (2,2)へ(P (3,1
)、P (3,2)にも)格納される。
再び第4図を参照する。ステップ112の判定結果がN
Oの場合、RUN=1の判定が行われる(116)。判
定結果がNOならばステップ107へ進む。判定結果が
YESならば、その時の走査点が、水平方向に関し、て
P2と同位置または左側で、かつPlより右側であるか
の判定が行われる(117)。判定結果がN Oならば
RUNのデクリメント(119)の後、ステップ107
へ進む。判定結果かYESならば、J、Iの値かメモリ
ロケーションP (3,1)、P (3,2)に格納さ
れ(118)、その後ステップ108以降の処理が行わ
れる。
ここで第1図(A)の領域50の分割処理の場合を考え
ると、ラン数が2以上の最初のラン以降の、ラン数が2
以上の各ラインを走査する度に。
その二つ目のランの先頭画素の座標がメモリロケーショ
ンP (3,1)、P (3,2)に繰り返し格納され
る。し、かじ、ラン数が1以下のラインの走査中はステ
ップ118へ進まないので、最終的に、ラン数が2以上
の最後のライン上の二つ目のランの先頭画素P3の座標
がメモリロケーションP (3,1)、P (3,2)
に得られる。
第4図に戻って、最終ラインの走査か終了すると、FL
AGのゼロ判定が行われる(109)。
FLAG=Oの場合、対象領域にラン数が2以上のライ
ンは存在せず分割の余地はないから1分割処理は終了す
る。
FLAG≠0の場合、PL  (P2)とP3の垂直方
向距離が閾値Th以上であるかの判定が行われる(12
0)。判定結果がYESならば、P3の位置で領域が左
右に2分割される(121)。
例えば第1図(A)の領域50において、垂直方向距離
HがTh以上ならば2分割される。その後、ステップ1
01の座標変換と逆の座標変換が行われる(122)、
分割処理は終了する。
ステップ120の判定結果がNoの場合、第5図に示す
処理に移る。第5図の処理について筒中に説明すると、
ステップ212はラスタスキャン範囲を狭めて第4図と
同様の分割処理を行う処理ブロックであり、そのラスタ
スキャン範囲を決定するためのステップがステップ20
1〜2]1である。
第5図において、ますJに最大値JMAX(=33)が
セットされ、■に1がセットされ、PEがリセットされ
る(20、)。以後、第4図の分割処理におけるラスタ
スキャン方向と逆方向、すなわち右から左へのラスタス
キャンが行われる。
走査点(J、I)の画素データW(J、J)のゼロ判定
か行われ(202)、判定結果がYESならば、つまり
走査点が領域の内部ならば、PEが1であるか判定さ肛
る(203)。その判定結果がYESならば、その時の
走査点が先の分割処理で検出されたP2より左側である
かの判定が行われる(205)。それがYESならば、
P2の座標が改めてPiの座標としてメモリロケーショ
ンP (1,1)、P (1,2)に書き込まれ、また
P2の座標があらためてJMAX、IMAXとして設定
される(206)。
ステップ206または205の判定結果かNOの場合は
PEに1がセットされ(204)、JとJMAX(=3
3)の一致判定が行われる(207)。その判定結果が
NOの場合、Jのデクリメント(209)の後、ステッ
プ202に戻る。
ステップ207の判定結果がYESの場合、P2のi座
標と1の一致判定が行わ戯る(208)。
その判定結果がNoならば、■のデクリメント(210
)の後、ステップ202に戻るか、判定結果かYESの
場合、j2のj座標に11加えた値がIMTNとして設
定される。
ステップ206または211の後には、(JMIN、I
MIN)から(JMAX、IMAX)の範囲をラスタス
キャン範囲として、第4図に示したと同様な分割処理(
21”2)が再び実行される。
第1図(B)に示す領域51の場合について説明する。
第4図の分割処理において、検出されたPI(またはp
2)とP3の垂直方向距離H1が閾値Th未満であった
とする。その場合、第5図の処理が実行され、第1図(
B)に示すように右から左ヘラスタスキャンされる1、
そして、最初のランの最終画素N I〕の走査時にステ
ップ205の条件が成立し、ステップ206の後に領1
!!151の斜線領域について、第4図と同様な処理(
212)が行われる。即ち、斜線領域のラスタスキャン
により、Pi、P2.P3に対応するPL’、P2′。
P3′が検出さ、1シる(但し、P2かP1′として用
いられる)。そして、P]’(またはP2′)とP3′
の垂直距離H2が閾値Th以」二であれば、P3′で領
域51け左右に2分割される。
第1図(C)の領域52の場合について説明する。第4
図の分割処理において、検出されたPl(またはP2)
とP3の垂直方向距離1」3が閾値Th未満で第5図の
処理へ進む。この場合、逆方向ラスタスキャンの各ライ
ンで最初に検出されるランの最終画素N 13の水平座
標が、P2のラインまでP2の木平座標以下同−であり
、ステップ208の条件が成立し、ステップ211の後
、2回目の分割処理(212)が行われる。この場合。
P2の存在するラインの次のライン以降をラスタスキャ
ン範囲として第4図と同様な処理が行われる。この領域
52の場合、2回目の分割処理でも分割できないが、3
回目の分割処理を行えば分割できる。つまり、第5図り
示した処理は、必要に応じて複数回実行するようにして
もよい。
再び第2図において、領域抽出部15では、抽出された
開方向コード1〜A、Fの各領域の中心または重心と、
開方向コード別の領域の個数が求められ、それらは領域
分割部16を介して文字分名部17へ送られる。
開方向コードB−Eについては、領域分割部16におい
て、領域分割処理後の領域の中心または重心と、各開方
向コード別の領域数が求められ。
文字分類部17へ送られる。
文字分類部17において、開方向コード別の領域数およ
び領域の中心部または重心と、文字分類用辞書18に予
め文字分順別に登録されている同様の特徴とが比較され
、一致するか、あるいは差が最小の候補文字分類か捜さ
れる6 文字認識部19では、文字分類部17で検出された候補
文字分類に属する文字に関し、特徴抽出部13により文
字パターンから抽出された特徴と。
文字認識用辞書に予め登録されている特徴との比較が行
われ、文字が認識される。
〔効 果〕
本発明の領域分割方式は、以上詳述したごとくであり、
従来よりも領域の形状やノイズ等に影響されない適切な
領域分割を行うことができ、ま、た。
処理内容も単純でありハード化も容易である。
【図面の簡単な説明】
第1図は本発明の一実施例における別異の領域に対する
分割処理の説明図、第2図は同実施例に係る文字認識装
置の概略ブロック図、第3図は開方向コードとパターン
の対応図、第4図および第5図は同実施例における領域
分割処理の概略フローチャートである。 10・・・読取部、  11・・・2値化・ノイズ除去
部。 12・・・切出部、 13・・・特徴抽出部、  ・1
4・・開方向コード化部、  15・・・領域抽出部、
16・・・領域分割部、  17・・・文字分類部、1
8 ・文字分類用辞書、  19・・・文字認識部、2
0・・・文字認識用辞書 第  1   図

Claims (1)

    【特許請求の範囲】
  1. (1)メモリ上に格納された画像などの領域を分割する
    領域分割方式であって、分割したい領域を含む限定メモ
    リ空間を分割方向と垂直な方向にラスタスキャンし、領
    域内の点の連続であるランを検出し、最初にラン数がN
    (ただしN≧2)以上となるライン上のライン先頭側の
    N個のランの位置、および、最後にラン数がN以上とな
    るライン上のランの位置をそれぞれ検出し、前者の2つ
    のランの間にあり、それとのラスタスキャン方向と垂直
    な方向の距離が所定値以上の後者のランの位置において
    領域を(N−1)個以下の部分に分割する処理を行った
    後、ラスタスキャン範囲を狭めて同様の処理を再度行う
    ことを特徴とする領域分割方式。
JP59137532A 1984-07-03 1984-07-03 領域分割方式 Pending JPS6116380A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59137532A JPS6116380A (ja) 1984-07-03 1984-07-03 領域分割方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59137532A JPS6116380A (ja) 1984-07-03 1984-07-03 領域分割方式

Publications (1)

Publication Number Publication Date
JPS6116380A true JPS6116380A (ja) 1986-01-24

Family

ID=15200877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59137532A Pending JPS6116380A (ja) 1984-07-03 1984-07-03 領域分割方式

Country Status (1)

Country Link
JP (1) JPS6116380A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63208181A (ja) * 1987-02-25 1988-08-29 Canon Inc パターン認識方法及び情報処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63208181A (ja) * 1987-02-25 1988-08-29 Canon Inc パターン認識方法及び情報処理装置

Similar Documents

Publication Publication Date Title
US4757551A (en) Character recognition method and system capable of recognizing slant characters
Cowell Syntactic pattern recognizer for vehicle identification numbers
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JP2000181992A (ja) カラー文書画像認識装置
San et al. Extracting contour lines from scanned topographic maps
JPS6116380A (ja) 領域分割方式
KR0186025B1 (ko) 후보 문자 분류 방법
Vaxivière et al. Subsampling: A structural approach to technical document vectorization
JPH09138837A (ja) 帳票認識装置
JP2789622B2 (ja) 文字/図形領域判定装置
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JPS61175880A (ja) 破線抽出装置
JPH02166583A (ja) 文字認識装置
JPS60231280A (ja) 領域分割方式
JP3001967B2 (ja) 文字認識方法
JP2974396B2 (ja) 画像処理方法及び装置
JPH11120291A (ja) パタン認識システム
JP2507949B2 (ja) 文字/図形領域判定装置
JPS63208181A (ja) パターン認識方法及び情報処理装置
JPS63157287A (ja) 文字パタ−ン抽出方法
JPH04260980A (ja) 図形認識装置
JPS63269267A (ja) 文字認識方法
JPH05258102A (ja) 文字/図形分離装置
JPH06131496A (ja) パターン正規化処理方法
JPH0142029B2 (ja)