JP3191870B2 - 括弧検出方法及び郵便番号検出方法 - Google Patents

括弧検出方法及び郵便番号検出方法

Info

Publication number
JP3191870B2
JP3191870B2 JP03325499A JP3325499A JP3191870B2 JP 3191870 B2 JP3191870 B2 JP 3191870B2 JP 03325499 A JP03325499 A JP 03325499A JP 3325499 A JP3325499 A JP 3325499A JP 3191870 B2 JP3191870 B2 JP 3191870B2
Authority
JP
Japan
Prior art keywords
parentheses
detecting
parenthesis
postal code
detection method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03325499A
Other languages
English (en)
Other versions
JP2000231604A (ja
Inventor
武志 場生松
和司 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP03325499A priority Critical patent/JP3191870B2/ja
Publication of JP2000231604A publication Critical patent/JP2000231604A/ja
Application granted granted Critical
Publication of JP3191870B2 publication Critical patent/JP3191870B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、OCR(optical c
haracter recognition)装置で用いられる文字検出方法
に関し、特に括弧及び括弧で囲まれた郵便番号を検出す
る方法に関する。
【0002】
【従来の技術】海外向け郵便番号自動読取区分機におい
ては、OCRソフトウェアによる手書郵便番号切出し処
理方法(以下、「NSG」という。)により郵便番号を
検出している。この方法によれば、図12に示すよう
に、入力した画像よりブロック情報とライン情報を得た
後で、所定の桁数に対応した数のブロック内の文字によ
り構成される郵便番号を検出する。
【0003】なお、関連した従来技術として、特開平8
−101887号公報に記載の「かぎかっこ付文字認識
装置」は、外接矩形の縦横比が1/2以下であるとき
に、黒画素の分布を調べることにより『「』や『」』を
検出するものである。
【0004】
【発明が解決しようとする課題】しかしながら、郵便番
号が読み取れないか、もしくは括弧が数字の「1」等と
形状が類似しているために、誤った読取結果が得られて
しまっていた。例えば図6の場合は「18111」等の
誤った読取結果が得られてしまっていた。
【0005】そこで括弧を検出する必要があった。しか
し従来、このような検出処理で主に用いられていた、ブ
ロック情報のサイズ、形状、相互の位置関係等のチェッ
クによる手法では、ブロックのサイズあるいは形状が、
括弧とその他の文字とで類似していて、識別が困難であ
ったため、イメージデータの黒画素および白画素の分布
を直接チェックするような、括弧検出方式が求められ
た。
【0006】本発明は、指定されたブロック領域内の所
定の方向の括弧を精度良く検出する括弧検出方法及びそ
れを用いた郵便番号検出方法を提供することを目的とす
る。
【0007】
【課題を解決するための手段】指定されたブロック領域
内の所定の方向の括弧を検出する括弧検出方法におい
て、前記ブロック領域内の行毎に、所定の色の連続する
範囲を求める第1のステップと、前記範囲が1つの行に
対して単数あるか複数あるかを判定する第2のステップ
と、前記範囲の中心点を求める第3のステップと、前記
中心点を結んだ中心線が山形であるか否かを判定する第
4のステップと、を有し、前記範囲が1つの行に対して
単数であり、且つ、前記中心点を結んだ中心線が前記山
形であれば、前記指定されたブロック領域内に括弧があ
ると検出することを特徴とする。
【0008】また、本発明による括弧検出方法は、上記
の括弧検出方法において、前記第2のステップにおい
て、ブロック内の端の1又は複数の行を判定の対象から
除外することを特徴とする。
【0009】更に、本発明による括弧検出方法は、上記
の括弧検出方法において、前記第4のステップにおい
て、前記中心線が端の行からピーク領域又はピーク点ま
で前記所定の方向に対応した方向に変化するときに前記
中心線が山形であると判定することを特徴とする。
【0010】更に、本発明による括弧検出方法は、上記
の括弧検出方法において、前記第4のステップにおい
て、前記中心線がピーク領域又はピーク点に向かう方向
と反対の方向に急激に変化する部分を有しているときに
は前記中心線が前記山形でないと判定することを特徴と
する。
【0011】更に、本発明による括弧検出方法は、上記
の括弧検出方法を用いた郵便番号検出方法において、第
1の指定されたブロック領域に対し前記所定の方向を左
括弧に対応した方向として括弧を検出し、前記第1の指
定されたブロック領域に所定数のブロック領域を隔てた
第2の指定されたブロック領域に対し前記所定の方向を
右括弧に対応した方向として括弧を検出し、前記第1及
び第2の指定されたブロック領域に対し括弧が検出され
たときに、前記第1及び第2の指定されたブロック領域
の間のブロック領域を郵便番号として検出することを特
徴とする。
【0012】更に、本発明による括弧検出方法は、上記
の郵便番号検出方法において、複数の前記ブロック領域
を検出するステップと、前記複数のブロック領域をライ
ン化するステップと、下方のラインを郵便番号を含むラ
インとするステップと、を前処理として更に有すること
を特徴とする。
【0013】
【発明の実施の形態】NSGは図1や図2に示す郵便番
号文字を、1桁ずつ郵便番号文字に外接する矩形ブロッ
クで囲み、ブロック情報(座標)を出力する処理であ
る。
【0014】NSGの概要は図3のような処理構成にな
っている。図3を参照すると、まず、処理エリア全体を
スキャンし、図4に示すようにブロック情報を得る(ス
テップS101)。次に、ステップS101で得たブロ
ック情報を図5に示すように行(ライン)毎に分類する
(ステップS102)。次に、下方のラインから郵便番
号と思われるブロック情報を選別し、郵便番号の5ブロ
ックを決定する(ステップS103)。このとき、括弧
検出を行い括弧が検出されれば括弧で囲まれている5ブ
ロックに決定する。次に、ステップS103で決定した
ブロック情報を上位の処理へ出力して(ステップS10
4)、処理を終了する。
【0015】本発明の特徴部は、ブロック情報決定処理
(ステップS103)である。
【0016】ブロック情報決定処理では、手書郵便番号
が書かれている事を前提に、郵便番号文字ブロックの決
定を行う。
【0017】本処理を採用した国の名称は郵便番号行の
左端に記載されているので、NSGは、左端から5ブロ
ックを郵便番号文字ブロックとして検出するようになっ
ている。
【0018】しかし単純に5ブロックを郵便番号文字ブ
ロックとして検出するのでは、郵便番号文字ではない、
住所文字ブロックを検出してしまう場合や、ノイズブロ
ックを検出してしまう可能性もあるため、NSGは、ブ
ロックの大きさや、隣あうブロックどうしの間隔等をチ
ェックして、それらしくないブロックを除去するように
なっている。
【0019】しかしそれだけでは、郵便番号文字ブロッ
ク情報と区別が難しい大きさの、括弧が郵便番号文字の
左右に記載されている場合、図6のように、左側の括弧
と郵便番号4桁を郵便番号文字ブロックとして決定して
しまう。
【0020】そこで、一旦、郵便番号文字ブロックが決
定したら、その左端のブロックについて、括弧検知を行
う。
【0021】括弧検知で括弧と判定されなければ、その
ブロックを含め、左端から5個のブロックを郵便番号文
字ブロックとして決定する。
【0022】もし括弧と判定されたら、さらに郵便番号
文字列の右側、すなわち左端から7ブロック目のブロッ
クについても括弧であるか確認を行う。
【0023】そして両方が括弧と判定されたら、それら
に挟まれる5ブロックが郵便番号文字ブロックである、
と決定される。
【0024】次に、図7を参照して、括弧検知の方法に
ついて説明する。
【0025】まず括弧検知処理は指定されたブロックの
イメージデータを読み込みメモリに展開する(ステップ
S201)。
【0026】次に、右括弧検出が要求されているか左括
弧検出が要求されているかを判断する(ステップS20
2)。
【0027】以降は左括弧を検知する場合と右括弧を検
知する場合では処理における左右の方向が逆転するが条
件は変わらないので、左括弧検知の場合を例に順に処理
を説明する。
【0028】まず、中心線算出処理ではイメージの各行
毎に黒画素の分布中心線を算出する(ステップS20
3)。算出方法は、イメージの各行毎に両端から黒画素
が現れるまで白画素をカウントし、黒画素の座標を求
め、その座標から中心を求めるものである(図8、9参
照)。図8のイメージで中心線の算出を行った結果を図
で表したのが図9である。また、中心線データを算出す
ると同時にデータの最大値の座標もチェックする。
【0029】次に、中央部縦線重複チェックを行う(ス
テップS204)。この処理はイメージ高さの上下それ
ぞれ4分の1以外の範囲で行い、図10に示すように各
行で連続する黒画素領域が2個以上現れる場合は重複が
あるとして、括弧ではないとするものである。上下4分
の1をチェックしないのは、括弧を書くときに書き始め
や書き終わりで跳ねる場合があり、その跳ねの部分で縦
線重複が起きる場合があるためである。ステップS20
5で重複があると判定した場合には、括弧ではないと判
定し、重複がないと判定した場合にはステップS206
に進む。
【0030】最後に、中心線形状チェック処理では、図
9に示した中心線データから括弧らしい山型をチェック
する(ステップS207)。まず、中心線データの下方
から上方に行くにつれデータが大きくなっていく事を確
認していく。この時は中心線データ値が急に大きくなる
ことはあっても、急に小さくなることは無いので、その
ようなデータ変化が無いことをチェックする。そして中
心線データを算出するときに求めた最大値の座標に達し
たら、次はデータが少なくなっていく事を確認してい
く。この時は中心線データ値が急に小さくなることはあ
っても、急に大きくなることは無いので、そのようなデ
ータ変化が無いことをチェックする。
【0031】この処理で中心線データが山型になってい
ることが確認出来れば、このブロックは「括弧である」
と判定し、途中データの乱れがあれば「括弧では無い」
と判定する(ステップS207)。
【0032】以上の処理により、図2或いはこの拡大図
である図11に示すように、括弧内の郵便番号が検出で
きる。
【0033】本発明の実施形態では郵便番号の桁数が5
桁の場合について説明しているが、本発明は桁数が4
桁、あるいは8桁等、それとは異なっている場合におい
ても適用可能である。
【0034】
【発明の効果】以上説明したように、本発明により、括
弧で囲まれた郵便番号の読取りが可能となった。
【0035】また、括弧はその形状により、「1」など
の文字に誤認識されやすいが、本発明により文字認識処
理よりも前段で括弧を除去することが出来るので、郵便
番号の読取りエラーが減少する、という効果もある。
【図面の簡単な説明】
【図1】括弧で囲まれていない郵便番号を含む郵便の宛
先を示す図である。
【図2】括弧で囲まれている郵便番号を含む郵便の宛先
を示す図である。
【図3】本発明の実施形態による郵便番号の検出方法の
処理の流れを示すフローチャートである。
【図4】図3のステップS101の結果を示す図であ
る。
【図5】図3のステップS102の結果を示す図であ
る。
【図6】本発明が適用されず、郵便番号を誤認識した場
合の例を示す図である。
【図7】本発明の実施形態による括弧検出方法の処理の
流れを示すフローチャートである。
【図8】図7のステップS203を説明するための第1
の図である。
【図9】図7のステップS203を説明するための第2
の図である。
【図10】図7のステップS204を説明するための図
である。
【図11】本発明が適用され、郵便番号を正しく認識し
た場合の例を示す図である。
【図12】図5の郵便番号を含む行の拡大図である。
【符号の説明】
S101 処理エリアスキャンのステップ S102 ライン化処理のステップ S103 ブロック情報決定処理のステップ S104 ブロック情報出力のステップ S201 イメージデータ展開のステップ S202 右括弧又は左括弧のどちらが要求されている
かを判定するステップ S203 中心線算出処理のステップ S204 中央部縦線重複チェックのステップ S205 重複があったか否かを判定するステップ S206 中心線の形状チェックのステップ S207 山型か否かを判定するステップ
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/62 B07C 3/14 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 指定されたブロック領域内の所定の方向
    の括弧を検出する括弧検出方法において、 前記ブロック領域内の行毎に、所定の色の連続する範囲
    を求める第1のステップと、 前記範囲が1つの行に対して単数あるか複数あるかを判
    定する第2のステップと、 前記範囲の中心点を求める第3のステップと、 前記中心点を結んだ中心線が山形であるか否かを判定す
    る第4のステップと、 を有し、前記範囲が1つの行に対して単数であり、且
    つ、前記中心点を結んだ中心線が前記山形であれば、前
    記指定されたブロック領域内に括弧があると検出するこ
    とを特徴とする括弧検出方法。
  2. 【請求項2】 請求項1に記載の括弧検出方法におい
    て、前記第2のステップにおいて、ブロック内の端の1
    又は複数の行を判定の対象から除外することを特徴とす
    る括弧検出方法。
  3. 【請求項3】 請求項1又は2に記載の括弧検出方法に
    おいて、前記第4のステップにおいて、前記中心線が端
    の行からピーク領域又はピーク点まで前記所定の方向に
    対応した方向に変化するときに前記中心線が山形である
    と判定することを特徴とする括弧検出方法。
  4. 【請求項4】 請求項1乃至3のいずれか1項に記載の
    括弧検出方法において、前記第4のステップにおいて、
    前記中心線がピーク領域又はピーク点に向かう方向と反
    対の方向に急激に変化する部分を有しているときには前
    記中心線が前記山形でないと判定することを特徴とする
    括弧検出方法。
  5. 【請求項5】 請求項1乃至4に記載の括弧検出方法を
    用いた郵便番号検出方法において、第1の指定されたブ
    ロック領域に対し前記所定の方向を左括弧に対応した方
    向として括弧を検出し、前記第1の指定されたブロック
    領域に所定数のブロック領域を隔てた第2の指定された
    ブロック領域に対し前記所定の方向を右括弧に対応した
    方向として括弧を検出し、前記第1及び第2の指定され
    たブロック領域に対し括弧が検出されたときに、前記第
    1及び第2の指定されたブロック領域の間のブロック領
    域を郵便番号として検出することを特徴とする郵便番号
    検出方法。
  6. 【請求項6】 請求項5に記載の郵便番号検出方法にお
    いて、複数の前記ブロック領域を検出するステップと、
    前記複数のブロック領域をライン化するステップと、下
    方のラインを郵便番号を含むラインとするステップと、
    を前処理として更に有することを特徴とする郵便番号検
    出方法。
JP03325499A 1999-02-10 1999-02-10 括弧検出方法及び郵便番号検出方法 Expired - Fee Related JP3191870B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03325499A JP3191870B2 (ja) 1999-02-10 1999-02-10 括弧検出方法及び郵便番号検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03325499A JP3191870B2 (ja) 1999-02-10 1999-02-10 括弧検出方法及び郵便番号検出方法

Publications (2)

Publication Number Publication Date
JP2000231604A JP2000231604A (ja) 2000-08-22
JP3191870B2 true JP3191870B2 (ja) 2001-07-23

Family

ID=12381378

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03325499A Expired - Fee Related JP3191870B2 (ja) 1999-02-10 1999-02-10 括弧検出方法及び郵便番号検出方法

Country Status (1)

Country Link
JP (1) JP3191870B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7476341B2 (ja) 2021-11-08 2024-04-30 深▲せん▼市徳蘭明海科技有限公司 漏れ電流検出回路、方法及び漏れ電流検出器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7476341B2 (ja) 2021-11-08 2024-04-30 深▲せん▼市徳蘭明海科技有限公司 漏れ電流検出回路、方法及び漏れ電流検出器

Also Published As

Publication number Publication date
JP2000231604A (ja) 2000-08-22

Similar Documents

Publication Publication Date Title
CN110046529B (zh) 二维码识别方法、装置及设备
US6929183B2 (en) Reconstruction of virtual raster
EP1909215B1 (en) Image region detection method, recording medium, and device therefor
JP3278471B2 (ja) 領域分割方法
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
JPH07234915A (ja) 画像認識装置
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
US6141444A (en) Method for deleting ruled lines and a recording medium storing programs for performing the method
JPH0721310A (ja) 文書認識装置
JP4392907B2 (ja) 文字切出し方法
JP3006466B2 (ja) 文字入力装置
US7319776B2 (en) Image processing method and image processing program
JP3936436B2 (ja) 表認識方法
JP3191870B2 (ja) 括弧検出方法及び郵便番号検出方法
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
KR100295360B1 (ko) 쉐이딩알고리즘을이용한영상처리방법
JP3698867B2 (ja) 円形パターン判定方法、装置および記録媒体
US5408540A (en) Character slant recognition in a word image
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP4064677B2 (ja) 画像処理装置、画像処理方法、およびその方法をコンピュータに実行させるプログラム
JP3019897B2 (ja) 行切出し方法
JPH07160810A (ja) 文字認識装置
JPH0793476A (ja) 文字列検出装置
JP3932201B2 (ja) 帳票種識別装置および記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090525

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100525

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110525

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110525

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees