JP2008033851A - 郵便自動区分機及び郵便自動区分方法 - Google Patents
郵便自動区分機及び郵便自動区分方法 Download PDFInfo
- Publication number
- JP2008033851A JP2008033851A JP2006209364A JP2006209364A JP2008033851A JP 2008033851 A JP2008033851 A JP 2008033851A JP 2006209364 A JP2006209364 A JP 2006209364A JP 2006209364 A JP2006209364 A JP 2006209364A JP 2008033851 A JP2008033851 A JP 2008033851A
- Authority
- JP
- Japan
- Prior art keywords
- address information
- information reading
- correct
- address
- reading unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】認識アルゴリズムが異なる複数の宛名情報読み取り部2a、2bを用いて、一つの郵便物画像から並列的に宛名を読み取る並列読み取り部2と、判別テーブルを参照しつつ、各宛名情報読み取り部2a、2bからの認識結果及び特徴量を比較して、正解と思われる区分特定情報を導出する認識結果統合部3と、正解と思われる区分特定情報の導出に失敗したとき、正解宛名情報読み取り部又は正解区分特定情報の入力をオペレータに要求するオペレータ入力部5と、オペレータによる入力情報及び各宛名情報読み取り部からの特徴量を蓄積するデータベース6と、データベース6の蓄積情報にもとづいて、判別テーブルを更新する学習部7とを備える。
【選択図】図1
Description
第一の問題点は、認識結果に不具合や偏りがあっても、それを容易に改善できないことである。その理由は、認識結果を選択するための判別テーブル(マトリクステーブル)が固定データであり、2つの認識結果のいずれか一方が一義的に選択されてしまうからである。このような認識結果の不具合や偏りは、判別テーブルの更新により改善することが可能であるが、特許文献1に記載される文字認識装置では、ユーザによる判別テーブルの更新を考慮していない。
このようにすると、判別テーブルの容量を小さくできるだけでなく、判別テーブルの参照時間を短縮することができる。その理由は、判別テーブルに書き込まれるデータが、文字候補ごとの選択指標を定めたマトリックスデータではなく、各宛名情報読み取り部を特徴空間のクラスとする特徴量のプロトタイプデータだからである。
このようにすると、各宛名情報読み取り部(認識アルゴリズム)の特徴を捉え、認識文字に最も適合した宛名情報読み取り部の認識結果を選択することができる。また、宛名情報読み取り部の数の増減にも容易に対応することができる。
このようにすると、誤った区分特定情報の導出を回避し、オペレータに正解宛名情報読み取り部又は正解値の入力を要求することができる。
このようにすると、判別テーブルの参照処理や、ユークリッド距離の演算処理を省き、区分特定情報の導出処理を高速化することができる。
このようにすると、認識アルゴリズムが異なる複数の宛名情報読み取り部を用いて、一つの郵便物画像から並列的に宛名を読み取るにあたり、オペレータの入力情報や各宛名情報読み取り部の特徴量をデータベースに蓄積し、データベースの蓄積情報にもとづいて判別テーブルを更新することにより、認識結果の不具合や偏りを自主的に改善し、郵便物の区分完了率を向上させることができる。
このようにすると、文字候補ごとの選択指標を定めたマトリックスデータを用いる場合に比べ、判別テーブルの容量を小さくできるだけでなく、判別テーブルの参照時間を短縮することができる。
このようにすると、各宛名情報読み取り部(認識アルゴリズム)の特徴を捉え、認識文字に最も適合した宛名情報読み取り部の認識結果を選択することができる。また、宛名情報読み取り部の数の増減にも容易に対応することができる。
このようにすると、誤った区分特定情報の導出を回避し、オペレータに正解宛名情報読み取り部又は正解値の入力を要求することができる。
このようにすると、判別テーブルの参照処理や、ユークリッド距離の演算処理を省き、区分特定情報の導出処理を高速化することができる。
図1は、本発明の実施形態に係る郵便自動区分機の構成を示すブロック図である。
この図に示される本発明の実施形態に係る郵便自動区分機は、区分すべき郵便物の画像を収集し、収集した郵便物画像から宛名を読み取り、読み取った宛名から導出される区分特定情報にもとづいて、郵便物を自動的に区分する郵便自動区分機であって、郵便区分機本体部1と、並列読み取り部2と、認識結果統合部3と、認識結果出力部4と、オペレータ入力部5と、データベース6と、学習部7とを備えて構成されている。
なお、本実施形態では、二つの宛名情報読み取り部2a、2bで宛名の読み取りを行うが、3以上の宛名情報読み取り部で宛名の読み取りを行うようにしてもよい。
認識結果出力部4は、認識結果統合部3が正解と思われる区分コードの導出に成功したとき、郵便区分機本体部1に区分コードを返し、また、認識結果統合部3が正解と思われる区分コードの導出に失敗したとき(以下、適宜リジェクト)、各宛名情報読み取り部2a、2bの認識結果、特徴量及び処理画像をオペレータ入力部5に送る。
しかも、判別テーブルに書き込まれるデータは、文字候補ごとの選択指標を定めたマトリックスデータではなく、各宛名情報読み取り部2a、2bを特徴空間のクラスとする特徴量のプロトタイプデータであるため、判別テーブルの容量を小さくできるだけでなく、判別テーブルの参照時間を短縮することができる。
図2は、本発明の実施形態に係る郵便自動区分機の区分処理手順を示すフローチャートである。
この図に示すように、郵便区分処理がスタートすると、郵便区分機本体部1では、供給された郵便物の画像をスキャナ等で収集し、その画像を並列読み取り部2に送る(S11)。
並列読み取り部2では、郵便区分機本体部1から送られてきた郵便物画像中の宛名を複数の宛名情報読み取り部2a、2bで並列に読み取り、区分コードを導き出す(S12)。
認識結果出力部4では、認識結果統合部3が区分コードの導出に成功したか否かを判断し(S14)、該判断結果がYESのときは、郵便区分機本体部1に区分コードを送り(S15)、NOのときは、オペレータ入力部5に認識結果、特徴量及び処理画像を送る。
オペレータによる入力が完了したら(S17)、区分コードを郵便区分機本体部1に送るとともに(S18)、データベース6にオペレータが入力したOCR番号及び各宛名情報読み取り部2a、2bの特徴量であるABFエリア情報及び尤度を蓄積する(S19)。
そして、一万件のデータがデータベース6に蓄積されたところで(S20)、これらのデータを学習関数にかけて前述したプロトタイプを算出し(S21)、このプロトタイプをコピーすることにより判別テーブルの更新を行う(S22)。
図3は、本発明の実施例1に係る郵便自動区分機のオペレータ入力部が表示する画面の例を示す説明図、図4は、本発明の実施例1に係る郵便自動区分機のデータベースに蓄積されるデータの例を示す説明図、図5は、本発明の実施例1に係る郵便自動区分機の判別テーブルに設定されるプロトタイプの例を示す説明図、図6は、本発明の実施例1に係る郵便自動区分機の各宛名情報読み取り部から送られる特徴情報の例を示す説明図である。
並列読み取り部2の各宛名情報読み取り部2a、2bからは、区分コード、ABF座標情報(x座標,y座標)、尤度及び処理画像を認識結果統合部3に出力する。
そして、オペレータは、正解OCR番号又は正解値を打鍵する。打鍵された正解区分コードは、郵便区分機本体部1に送られ、正解値を打鍵した郵便物は、打鍵された正解値を基に区分され区分完了となる。
データベース6に蓄えられたデータは、1万通蓄積したところで、学習部7の学習関数にかけられる。
更新後は、更新した判別テーブルを参照しつつ、各宛名情報読み取り部2a、2bの出力値を比較して、区分コードを導き出す。判別テーブルの参照は、各宛名情報読み取り部2a、2bからの4次元の特徴量を標準化し、標準化した値を入力ベクトルとして、判別テーブルに設定された各宛名情報読み取り部2a、2bのプロトタイプとのユークリッド距離を求めることにより行うことができる。例えば、図6のような入力ベクトルの場合、宛名情報読み取り部2aのプロトタイプとのユークリッド距離は2.24、宛名情報読み取り部2bのプロトタイプとのユークリッド距離は2.48であり、宛名情報読み取り部2aのユークリッド距離が最も値が小さいので、出力する認識結果は、宛名情報読み取り部2aのものとなる。また、ユークリッド距離のリジェクト閾値を決定し、その値より全てのユークリッド距離が大きい場合は、リジェクトとする。また、各宛名情報読み取り部2a、2bのユークリッド距離が等しい場合も、リジェクトとすることが好ましい。
2 並列読み取り部
2a 宛名情報読み取り部
2b 宛名情報読み取り部
3 認識結果統合部
4 認識結果出力部
5 オペレータ入力部
6 データベース
7 学習部
Claims (10)
- 区分すべき郵便物の画像を収集し、収集した郵便物画像から宛名を読み取り、読み取った宛名から導出される区分特定情報にもとづいて、郵便物を自動的に区分する郵便自動区分機であって、
認識アルゴリズムが異なる複数の宛名情報読み取り部を用いて、一つの郵便物画像から並列的に宛名を読み取る並列読み取り部と、
判別テーブルを参照しつつ、各宛名情報読み取り部からの認識結果及び特徴量を比較して、正解と思われる区分特定情報を導出する認識結果統合部と、
正解と思われる区分特定情報の導出に失敗したとき、正解宛名情報読み取り部又は正解値の入力をオペレータに要求するオペレータ入力部と、
オペレータによる入力情報及び各宛名情報読み取り部からの特徴量を蓄積するデータベースと、
データベースの蓄積情報にもとづいて、判別テーブルを更新する学習部と、
を備えることを特徴とする郵便自動区分機。 - 前記データベースが、オペレータによる入力情報である正解宛名情報読み取り部情報と、各宛名情報読み取り部からの特徴量である住所領域検知情報及び尤度を蓄積し、
前記学習部が、データベースの蓄積データをもとに、正解宛名情報読み取り部を特徴空間のクラス、住所領域検知情報及び尤度を特徴空間の特徴ベクトルとして、各クラスのプロトタイプを学習し、このプロトタイプを判別テーブルにコピーする請求項1記載の郵便自動区分機。 - 前記認識結果統合部が、各宛名情報読み取り部からの特徴量を入力ベクトルとして、判別テーブルが定めるプロトタイプとのユークリッド距離を求め、このユークリッド距離が最も小さい宛名情報読み取り部の認識結果を正解とする請求項1又は2記載の郵便自動区分機。
- 前記認識結果統合部が、各宛名情報読み取り部のユークリッド距離をリジェクト閾値と比較し、全てのユークリッド距離がリジェクト閾値よりも大きい場合は、全ての宛名情報読み取り部の認識結果を不正解とする請求項3記載の郵便自動区分機。
- 前記認識結果統合部が、各宛名情報読み取り部からの認識結果を比較し、全ての認識結果が同一の場合は、全ての宛名情報読み取り部の認識結果を正解とする請求項1〜4のいずれかに記載の郵便自動区分機。
- 区分すべき郵便物の画像を収集し、収集した郵便物画像から宛名を読み取り、読み取った宛名から導出される区分特定情報にもとづいて、郵便物を自動的に区分する郵便自動区分方法であって、
認識アルゴリズムが異なる複数の宛名情報読み取り部を用いて、一つの郵便物画像から並列的に宛名を読み取り、
判別テーブルを参照しつつ、各宛名情報読み取り部からの認識結果及び特徴量を比較して、正解と思われる区分特定情報を導出し、
正解と思われる区分特定情報の導出に失敗したときは、正解宛名情報読み取り部又は正解値の入力をオペレータに要求し、
オペレータによる入力情報及び各宛名情報読み取り部からの特徴量をデータベースに蓄積し、
データベースの蓄積情報にもとづいて、判別テーブルを更新する
ことを特徴とする郵便自動区分方法。 - 前記データベースに、オペレータによる入力情報である正解宛名情報読み取り部情報と、各宛名情報読み取り部からの特徴量である住所領域検知情報及び尤度を蓄積し、
データベースの蓄積データをもとに、正解宛名情報読み取り部を特徴空間のクラス、住所領域検知情報及び尤度を特徴空間の特徴ベクトルとして、各クラスのプロトタイプを学習し、このプロトタイプを判別テーブルにコピーする
請求項6記載の郵便自動区分方法。 - 各宛名情報読み取り部からの特徴量を入力ベクトルとして、判別テーブルが定めるプロトタイプとのユークリッド距離を求め、このユークリッド距離が最も小さい宛名情報読み取り部の認識結果を正解とする請求項6又は7記載の郵便自動区分方法。
- 各宛名情報読み取り部のユークリッド距離をリジェクト閾値と比較し、全てのユークリッド距離がリジェクト閾値よりも大きい場合は、全ての宛名情報読み取り部の認識結果を不正解とする請求項8記載の郵便自動区分方法。
- 各宛名情報読み取り部からの認識結果を比較し、全ての認識結果が同一の場合は、全ての宛名情報読み取り部の認識結果を正解とする請求項6〜9のいずれかに記載の郵便自動区分方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006209364A JP5003051B2 (ja) | 2006-08-01 | 2006-08-01 | 郵便自動区分機及び郵便自動区分方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006209364A JP5003051B2 (ja) | 2006-08-01 | 2006-08-01 | 郵便自動区分機及び郵便自動区分方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008033851A true JP2008033851A (ja) | 2008-02-14 |
JP5003051B2 JP5003051B2 (ja) | 2012-08-15 |
Family
ID=39123157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006209364A Expired - Fee Related JP5003051B2 (ja) | 2006-08-01 | 2006-08-01 | 郵便自動区分機及び郵便自動区分方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5003051B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2456216A (en) * | 2008-01-11 | 2009-07-15 | Lockheed Martin Uk Ltd | Block analyser in mail sorting system |
JP2015167905A (ja) * | 2014-03-06 | 2015-09-28 | 株式会社東芝 | 配達物区分処理システム、および配達物区分処理方法 |
JP2018041325A (ja) * | 2016-09-08 | 2018-03-15 | 株式会社東芝 | 配達物処理システム、配達物処理装置、および配達物処理プログラム |
EP3349144A1 (en) * | 2017-01-13 | 2018-07-18 | Kabushiki Kaisha Toshiba | Sorting system, recognition support apparatus, recognition support method, and recognition support program |
JP2019109729A (ja) * | 2017-12-19 | 2019-07-04 | 株式会社東芝 | 区分装置および区分システム |
CN111275011A (zh) * | 2020-02-25 | 2020-06-12 | 北京百度网讯科技有限公司 | 移动红绿灯检测方法、装置、电子设备和存储介质 |
WO2023047858A1 (ja) * | 2021-09-22 | 2023-03-30 | ローレルバンクマシン株式会社 | 情報処理装置及びプログラム |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05307639A (ja) * | 1992-04-30 | 1993-11-19 | Toshiba Corp | 郵便物の宛名領域検出装置 |
JPH06131498A (ja) * | 1992-10-15 | 1994-05-13 | Nec Corp | 光学式活字文字認識装置における認識結果の総合判定方式 |
JPH07271899A (ja) * | 1994-03-31 | 1995-10-20 | Toshiba Corp | 文字認識装置 |
JPH08305794A (ja) * | 1995-04-28 | 1996-11-22 | Nec Corp | 宛名行抽出装置 |
JPH11282964A (ja) * | 1998-03-26 | 1999-10-15 | Nec Corp | 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体 |
JP2000293626A (ja) * | 1999-04-09 | 2000-10-20 | Nec Corp | 文字認識方法及び装置ならびに記憶媒体 |
JP2001314820A (ja) * | 2001-03-23 | 2001-11-13 | Nec Corp | 宛名領域検出装置 |
JP2002086072A (ja) * | 2000-09-20 | 2002-03-26 | Toshiba Corp | 宛先読取装置、区分機システム、宛先読取方法及び区分方法 |
-
2006
- 2006-08-01 JP JP2006209364A patent/JP5003051B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05307639A (ja) * | 1992-04-30 | 1993-11-19 | Toshiba Corp | 郵便物の宛名領域検出装置 |
JPH06131498A (ja) * | 1992-10-15 | 1994-05-13 | Nec Corp | 光学式活字文字認識装置における認識結果の総合判定方式 |
JPH07271899A (ja) * | 1994-03-31 | 1995-10-20 | Toshiba Corp | 文字認識装置 |
JPH08305794A (ja) * | 1995-04-28 | 1996-11-22 | Nec Corp | 宛名行抽出装置 |
JPH11282964A (ja) * | 1998-03-26 | 1999-10-15 | Nec Corp | 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体 |
JP2000293626A (ja) * | 1999-04-09 | 2000-10-20 | Nec Corp | 文字認識方法及び装置ならびに記憶媒体 |
JP2002086072A (ja) * | 2000-09-20 | 2002-03-26 | Toshiba Corp | 宛先読取装置、区分機システム、宛先読取方法及び区分方法 |
JP2001314820A (ja) * | 2001-03-23 | 2001-11-13 | Nec Corp | 宛名領域検出装置 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2456216A (en) * | 2008-01-11 | 2009-07-15 | Lockheed Martin Uk Ltd | Block analyser in mail sorting system |
JP2015167905A (ja) * | 2014-03-06 | 2015-09-28 | 株式会社東芝 | 配達物区分処理システム、および配達物区分処理方法 |
JP2018041325A (ja) * | 2016-09-08 | 2018-03-15 | 株式会社東芝 | 配達物処理システム、配達物処理装置、および配達物処理プログラム |
US11097316B2 (en) | 2017-01-13 | 2021-08-24 | Kabushiki Kaisha Toshiba | Sorting system, recognition support apparatus, recognition support method, and recognition support program |
EP3349144A1 (en) * | 2017-01-13 | 2018-07-18 | Kabushiki Kaisha Toshiba | Sorting system, recognition support apparatus, recognition support method, and recognition support program |
US20180200760A1 (en) * | 2017-01-13 | 2018-07-19 | Kabushiki Kaisha Toshiba | Sorting system, recognition support apparatus, recognition support method, and recognition support program |
JP2019109729A (ja) * | 2017-12-19 | 2019-07-04 | 株式会社東芝 | 区分装置および区分システム |
CN111275011A (zh) * | 2020-02-25 | 2020-06-12 | 北京百度网讯科技有限公司 | 移动红绿灯检测方法、装置、电子设备和存储介质 |
KR20210108324A (ko) * | 2020-02-25 | 2021-09-02 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 이동식 신호등을 검출하는 방법, 장치, 전자 기기 및 저장 매체 |
JP2021136032A (ja) * | 2020-02-25 | 2021-09-13 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 移動式信号機の検出方法、装置、電子機器及び記憶媒体 |
JP7164644B2 (ja) | 2020-02-25 | 2022-11-01 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 移動式信号機の検出方法、装置、電子機器及び記憶媒体 |
US11508162B2 (en) | 2020-02-25 | 2022-11-22 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for detecting mobile traffic light |
CN111275011B (zh) * | 2020-02-25 | 2023-12-19 | 阿波罗智能技术(北京)有限公司 | 移动红绿灯检测方法、装置、电子设备和存储介质 |
KR102616470B1 (ko) * | 2020-02-25 | 2023-12-21 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 이동식 신호등을 검출하는 방법, 장치, 전자 기기 및 저장 매체 |
WO2023047858A1 (ja) * | 2021-09-22 | 2023-03-30 | ローレルバンクマシン株式会社 | 情報処理装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5003051B2 (ja) | 2012-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7120318B2 (en) | Automatic document reading system for technical drawings | |
US5787194A (en) | System and method for image processing using segmentation of images and classification and merging of image segments using a cost function | |
KR100248917B1 (ko) | 패턴인식장치및방법 | |
US5943443A (en) | Method and apparatus for image based document processing | |
JP5003051B2 (ja) | 郵便自動区分機及び郵便自動区分方法 | |
US5159667A (en) | Document identification by characteristics matching | |
CN109409398B (zh) | 图像处理装置、图像处理方法以及存储介质 | |
JP5217127B2 (ja) | 一括地名認識プログラム、一括地名認識装置および一括地名認識方法 | |
US20090041361A1 (en) | Character recognition apparatus, character recognition method, and computer product | |
CN108334805B (zh) | 检测文档阅读顺序的方法和装置 | |
JP3485020B2 (ja) | 文字認識方法及び装置ならびに記憶媒体 | |
US11023720B1 (en) | Document parsing using multistage machine learning | |
US20040146200A1 (en) | Segmenting touching characters in an optical character recognition system to provide multiple segmentations | |
JP2015069256A (ja) | 文字識別システム | |
JP4802176B2 (ja) | パターン認識装置、パターン認識プログラム及びパターン認識方法 | |
JP2011197823A (ja) | 住所データベース構築装置および住所データベース構築方法 | |
JPH10240958A (ja) | 画像から管理情報を抽出する管理情報抽出装置および方法 | |
JP3095069B2 (ja) | 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体 | |
JP2004171316A (ja) | Ocr装置及び文書検索システム及び文書検索プログラム | |
JPH1173472A (ja) | フォーマット情報登録方法及びocrシステム | |
JP4176175B2 (ja) | パターン認識装置 | |
EP0684576A2 (en) | Improvements in image processing | |
JP2007052808A (ja) | フォーム識別方法 | |
CN114495135A (zh) | 票据识别方法及装置 | |
JP2005056432A (ja) | フォーム識別装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090717 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120104 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120424 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120507 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150601 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5003051 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |