JPH05309341A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH05309341A
JPH05309341A JP4114338A JP11433892A JPH05309341A JP H05309341 A JPH05309341 A JP H05309341A JP 4114338 A JP4114338 A JP 4114338A JP 11433892 A JP11433892 A JP 11433892A JP H05309341 A JPH05309341 A JP H05309341A
Authority
JP
Japan
Prior art keywords
block
character
input
registration
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4114338A
Other languages
English (en)
Inventor
Hiroshi Kuroda
博史 黒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4114338A priority Critical patent/JPH05309341A/ja
Publication of JPH05309341A publication Critical patent/JPH05309341A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Sorting Of Articles (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】郵便番号の読取りを行なう文字認識装置におい
て、郵便物上の情報を走査した結果の傾向を認識し、こ
れを登録しておいて同種郵便物の郵便番号記載位置検知
の精度向上を実現する。 【構成】特徴抽出部1は、郵便物上の文字,図形等の特
徴を抽出する。入力比較部2は、現在処理している郵便
物のブロックを、テーブルにあらかじめ記憶しておいた
以前の処理郵便物のブロックと比較する。ブロック登録
部3は、入力比較により、現在処理している郵便物のブ
ロックが未登録と判定された場合新規登録する。比較判
定出力部5は、登録ずみと判定した入力に対し、テーブ
ルを用いて認識対象としている文字の記載位置を判定し
出力する。文字認識部6で、記憶位置の判明した認識対
象文字を認識した後に、結果を認識結果登録部7でテー
ブルに追加登録する。登録修正部8は、テーブルに登録
中のものに対する修正,削除を施す。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置に関し、特
に郵便物上に記載されている郵便番号を読み取り、郵便
物を区分する郵便番号自動読取区分機に用いる文字認識
装置に関わる。
【0002】
【従来の技術】従来、郵便物に記載された情報を認識し
て区分する装置において、郵便番号を認識するものはす
でに実用化されており、その精度も確実に向上しつつあ
る。
【0003】このような文字認識装置を用いて郵便番号
を決定する場合、郵便番号の記載されている領域を確実
かつ高速に得るために、郵便物上に記載されている文字
や図形を切り出したブロックの集合であるブロック出現
パターンを経験や常識で限定することにより、正確かつ
高速な郵便物の区分を可能とするような認識技術が必要
不可欠となっている。
【0004】
【発明が解決しようとする課題】上述した従来の文字認
識技術を用いて郵便物を区分する場合には、読み取ろう
とする文字の記載位置をブロック情報として特定するな
ど、画像の特徴を用いた処理で実際読み取る前の段階で
判定している。
【0005】しかしながら、このような出力に含まれる
問題点として、ブロックの選択ミスがある。ブロック判
定処理で対象ブロックを唯一のものとして導き出したつ
もりでいても、そこに郵便番号が記載されてにない可能
性は十分あり、ブロック出力のみによる選択には限界が
あるという問題点があった。
【0006】本発明の目的は、上述した従来の問題点を
解決すべく、先に処理した同種郵便物の読み取り結果と
の比較にもとづいて郵便番号検知の精度向上が確保でき
るようにした文字認識装置を提供する事にある。
【0007】
【課題を解決するための手段】本発明の装置は、帳票上
に記載された情報を光学的に走査し、認識対象とする情
報の存在する領域を限定して記載文字を認識する文字認
識装置において、帳票上に記載された文字列や図形など
の位置および大きさに関する情報をブロック出現パタン
として検出し、前記ブロック出現パタンを過去のブロッ
ク出現パタンと比較して同種類の帳票の認識対象文字の
位載位置の検知精度を向上させる手段を備えて文字認識
を行なう構成を有する。
【0008】
【実施例】次に、図面を参照して説明する。図1は本発
明の一実施例の構成を示すブロック図である。
【0009】図1に示す実施例の構成は、帳票として郵
便物を対象とする場合を例とし、郵便物上に記載された
情報を調査し、文字や図形等の、位置と大きさをブロッ
クとして抽出する。特徴抽出部1と、現在処理している
郵便物のブロックを、あらかじめテーブルに記憶されて
いる以前に処理した郵便物のブロックと比較する入力比
較部2と、入力比較部2の比較により現在処理している
ブロックが未登録と判定された場合新規登録するブロッ
ク登録部3と、ブロック登録部3で登録したブロックの
中からただ一つ認識対象とするブロックを判定するブロ
ック判定部4と、前述したテーブルを利用して認識対象
文字の記載位置を判定する比較判定出力部5と、ブロッ
ク判定部4もしくは比較判定出力部5で判定されたブロ
ックの含む認識対象文字を判定する文字認識部6と、認
識対象文字を判定した後にその結果を前述したテーブル
に追加登録する認識結果登録部7と、前述したテーブル
に登録中のものに対する修正,削除を施す登録修正部8
とを備えて成る。
【0010】次に、本実施例における郵便番号記載位置
の判定処理の概念を図5を参照して説明する。
【0011】この図5は各種郵便物を光学的に走査し、
これによって得られる郵便物の形状や切出しブロックを
類型化し、さらに類型化されたある特定の同種の郵便物
に対して郵便番号記載位置の傾向を学習する内容を示し
たものである。
【0012】同種の郵便物からは、ほぼ同一の形状とブ
ロックの集合によるブロック切出パタンが得られ、郵便
番号記載位置を正規の処理で判定する場合、同一傾向の
出力をする。これを判定段階Aとして示す。この判定段
階Aは、n個の同種の郵便物が存在した場合、郵便物ブ
ロック出現パタン13−a〜13−nを形状・切出ブロ
ックで類型化し、郵便番号記載位置131−a〜131
−nの傾向を学習することを示している。
【0013】次に、判定段階Bは、同一傾向の形状や切
出ブロックと郵便番号記載位置とを結び付けてテーブル
に登録記憶し、その後の判定段階Cでは、同一種の郵便
物に対してはブロック情報を一切用いずに郵便番号記載
位置を判定することを示している。結果として、判定段
階Dに示す如く、同種の郵便物が再び処理されたとして
も、郵便番号が精度良く検出されることを示している。
【0014】従来処理は、郵便物1通ごとに独立的に郵
便番号記載位置の判定が行なっていたので、判定ミス,
不確定要素を多く含むことが避けられなかった。
【0015】図3は、図5で示した郵便番号記載位置の
判定処理に用いる入力と2種のテーブルについて示した
ものである。
【0016】入力9は、郵便物1通分を走査した際の種
種の情報を示している。
【0017】仮登録テーブル10は、本登録テーブル1
1に登録できない入力9を、グループという単位を用い
て類型化している。各グループは通常複数の要素を持っ
ており、それぞれの要素は、各入力に後処理で得られる
郵便番号座標と出力状態(出力結果の郵便番号の確度)
とを加えたものである。
【0018】本登録テーブル11は、仮登録テーブル1
0内のあるグループを基に、判定処理の情報源となり得
るパタンという単位を用いて登録する。
【0019】図4は図3で示す入力による2種のテーブ
ルへの登録内容を詳細に示す説明図である。
【0020】図4は、仮登録と本登録の2つのテーブル
に対する登録ルーチンa,bおよびcと、これら2つの
テーブルからの削除ルーチンdおよびeを示している。
【0021】登録ルーチンaは、入力9と仮登録テーブ
ル11間の登録ルーチンで、入力9と仮登録テーブル1
1上のあるグループの内容との共通点が多い場合の(追
加登録)と、(2)に示す本登録テーブル10および仮
登録テーブル11に、入力と共通点を持つものが無い場
合の(新規登録)とで、入力が仮登録テーブル11にグ
ループ登録されることを示している。
【0022】また、登録ルーチンbは、入力9と本登録
テーブル10上のあるパタンの内容との共通点が多い場
合に、その入力が本登録テーブルの該当数に追加される
ことを示している。
【0023】また、登録ルーチンcは、仮登録テーブル
11における該当数および頻度がある程度大きくなった
場合に、仮登録テーブル11のあるグループを本登録テ
ーブル10の新規パタンとして登録するルーチンを示
す。
【0024】一方、削除ルーチンのうちの削除ルーチン
dは、(1)に示す如く、正解率が極端に低下したパタ
ンがある場合と、(2)に示す如く頻度が極端に低下し
たパタンがある場合に、これらを本登録テーブル10か
ら削除2とする削除ルーチンを示す。
【0025】さらに、もう1つの削除ルーチンeは、頻
度が極端に低下したグループがある場合に、そのグルー
プを仮登録テーブル11から削除12とする削除ルーチ
ンを示す。
【0026】次に、図2を参照して本実施例の処理フロ
ーについてさらに説明を加える。
【0027】ここでは、既に郵便物の紙面上に記載され
た情報を走査して画像を入力した後、個個のイメージを
ブロックとして切り出した郵便物やブロックの座標など
が、入力として存在するものと仮定している。
【0028】ステップ101では、仮登録テーブル11
の全グループと本登録テーブル10の全パタンの供給数
とをインクリメントする。供給数は、該当グループまた
はパタンの出現頻度を把握するのに必要なパラメータで
ある。
【0029】ステップ102では、入力9が本登録テー
ブル10内のいずれのパタンとの類似度が両者同一であ
ると判定し得るほど高いかを検索し、相当するものがあ
ればステップ103へ処理を移行し、相当するものがな
ければステップ104へ処理を移行する。
【0030】ステップ103では、本登録テーブル10
内の該当パタンの該当数をインクリメントする。
【0031】ステップ104の仮登録?の判定では、入
力9が仮登録テーブル11内のどのグループと多くの共
通点をもつかを検索し、相互するものがあればステップ
105に移行し、相当するものがなければステップ10
6に移行する。
【0032】ステップ105では、仮登録テーブル11
内の該当グループの該当数をインクリメントする。
【0033】ステップ106では、入力9にもとづいて
経験的なブロック判定処理を行い、郵便番号を含むと思
われるブロックをただ一つ決定する。
【0034】また、ステップ107では、入力9の郵便
番号記載位置を、該当パタン内に記憶している郵便番号
座標より判定する。この処理により、ステップ6を行わ
なくてもステップ108に処理移行ができる。
【0035】ステップ108では、ステップ106によ
って与えられたブロック、あるいはステップ107によ
って与えられた郵便番号記載位置から、郵便番号と思わ
れる数字列を出力する。また、郵便番号の記載されてい
る座標と出力状態(何桁目が出力されたか等)を同時出
力する。
【0036】ステップ109では、入力9にステップ8
で与えた郵便番号座標と出力状態とを付加し、新規のグ
ループとして仮登録テーブル11に登録する。この際の
該当数、供給数は全て1である。
【0037】ステップ10では、入力にステップ8で与
えた郵便番号座標と出力状態を付加し、該当グループに
追加登録する。
【0038】ステップ111では、ステップ8の出力が
郵便番号らしい確度が高い(出力良好)場合、該当パタ
ンの良好出力数をインクリメントする。
【0039】ステップ102では、該当グループの該当
数をインクリメントする。
【0040】ステップ113では、正解率と頻度から該
当グループが本登録できると判断されたならば、該当グ
ループを削除すると同時に、本登録テーブル10に該当
グループを基にして生成した新規パタンを登録する。
【0041】ステップ114では、仮登録テーブル11
の全グループと本登録テーブル10の全パタンの中で、
良好出力数または頻度から判断して、登録解除すべきも
のを抽出し、登録削除する。
【0042】以上により、従来の処理ではブロック出力
を1通単位でしか限定することができなかった信頼性の
低い郵便番号記載位置判定を、同種郵便物の郵便番号記
載位置の判定を著しく精度の高いものにすることができ
る。
【0043】
【発明の効果】以上説明したように本発明は、郵便番号
記載位置の微妙に異なる同一種の郵便物が大量に存在す
る場合でも、処理速度を低下させることなく、信頼性の
著しく高い郵便番号の出力が可能となるという効果があ
る。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】図1の実施例の処理内容を示すフローチャート
である。
【図3】図1の実施例における入力と、入力との比較グ
ループおよび比較パタンを登録する2種類の登録テーブ
ルとの例を表記して示す説明図である。
【図4】図3に示す入力による2種類の登録テーブルへ
の登録内容を示す説明図である。
【図5】本発明による郵便物の郵便番号記載位置判定処
理の概念図である。
【符号の説明】
1 特徴抽出部 2 入力比較部 3 ブロック登録部 4 ブロック判定部 5 比較判定出力部 6 文字認識部 7 認識結果登録部 8 登録修正部 9 入力 10 仮登録テーブル 11 本登録テーブル

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 帳票上に記載された情報を光学的に走査
    し、認識対象とする情報の存在する領域を限定して記載
    文字を認識する文字認識装置において、帳票上に記載さ
    れた文字列や図形などの位置および大きさに関する情報
    をブロック出現パタンとして検出し、前記ブロック出現
    パタンを過去のブロック出現パタンと比較して同種類の
    帳票の認識対象文字の位載位置の検知精度を向上させる
    手段を備えて文字認識を行なうことを特徴とする文字認
    識装置。
JP4114338A 1992-05-07 1992-05-07 文字認識装置 Withdrawn JPH05309341A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4114338A JPH05309341A (ja) 1992-05-07 1992-05-07 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4114338A JPH05309341A (ja) 1992-05-07 1992-05-07 文字認識装置

Publications (1)

Publication Number Publication Date
JPH05309341A true JPH05309341A (ja) 1993-11-22

Family

ID=14635286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4114338A Withdrawn JPH05309341A (ja) 1992-05-07 1992-05-07 文字認識装置

Country Status (1)

Country Link
JP (1) JPH05309341A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007193678A (ja) * 2006-01-20 2007-08-02 Fujitsu Ltd 媒体判別情報データベース作成装置及び媒体判別情報データベース管理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007193678A (ja) * 2006-01-20 2007-08-02 Fujitsu Ltd 媒体判別情報データベース作成装置及び媒体判別情報データベース管理装置

Similar Documents

Publication Publication Date Title
KR100324847B1 (ko) 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법
EP0938057B1 (en) Mail address reading apparatus and mail sorting apparatus
EP0332471A2 (en) Character recognition apparatus
GB2222475A (en) Optical character recognition
KR100323351B1 (ko) 주소인식방법 및 메일처리장치
Mitchell et al. Newspaper document analysis featuring connected line segmentation
EP1202213B1 (en) Document format identification apparatus and method
US9811726B2 (en) Chinese, Japanese, or Korean language detection
JPH05309341A (ja) 文字認識装置
US6934404B2 (en) Stamp detecting device, stamp detecting method, letter processing apparatus and letter processing method
JP3689485B2 (ja) 帳票認識方法
JPH07271899A (ja) 文字認識装置
JP3105918B2 (ja) 文字認識装置、および文字認識方法
JP3186712B2 (ja) 文書読取装置
JP2000207491A (ja) 文字列読取方法及び装置
JP2690483B2 (ja) 文字行切出し方法
JPS6379193A (ja) 文字読取装置
JPH11312219A (ja) 宛名読取り装置および郵便物等区分機および文字列認識方法
JPS63136181A (ja) 文字読取装置
JPH05242288A (ja) 郵便物記載住所認識装置
JP2578768B2 (ja) 画像処理方法
JPH04139593A (ja) 郵便番号認識装置
JPH06111068A (ja) 書籍コード認識装置
JPH08272909A (ja) 文字認識方法および文字認識装置
JPS58182791A (ja) 文字パタ−ンの特徴抽出法および分類法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990803