JP4733859B2 - Location information recognition device and sorting device - Google Patents

Location information recognition device and sorting device Download PDF

Info

Publication number
JP4733859B2
JP4733859B2 JP2001172796A JP2001172796A JP4733859B2 JP 4733859 B2 JP4733859 B2 JP 4733859B2 JP 2001172796 A JP2001172796 A JP 2001172796A JP 2001172796 A JP2001172796 A JP 2001172796A JP 4733859 B2 JP4733859 B2 JP 4733859B2
Authority
JP
Japan
Prior art keywords
character
output
reading
characters
appearance rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001172796A
Other languages
Japanese (ja)
Other versions
JP2002366898A (en
Inventor
美知子 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001172796A priority Critical patent/JP4733859B2/en
Publication of JP2002366898A publication Critical patent/JP2002366898A/en
Application granted granted Critical
Publication of JP4733859B2 publication Critical patent/JP4733859B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
この発明は、紙葉類上の数字列からなる所在情報を読取り、この読取った数字列の1文字ずつを認識する所在情報認識装置、および、この所在情報認識装置の認識結果を用いて区分処理を実行する区分装置に関する。
【0002】
【従来の技術】
紙葉類としての郵便物上の宛名情報を光学的に読み取って郵便物を区分する郵便物宛名自動読取区分機においては、2種類の文字認識手法(複合類似度法、構造特徴マッチング法)が使用されている。
【0003】
2種類の認識手法によって得られた認識結果から、郵便番号(数字列からなる所在情報)の出現率によって予め設定されたパラメータを用いて評価値を求め、認識結果の総合評価を行っている。例えば、各桁において、出現率の高い数字の評価値は高く設定し、出現率の低い数字はその値を低く設定する、等といったことをパラメータで設定している。
【0004】
このような処理を行うことによって、出現率の多い数字は認識しやすく、出現率の低い数字は認識し難くすることができ、各地域での区分機の処理効率を向上させることができる。
【0005】
例えば、川崎付近の郵便局においては、「21*」などという郵便物の割合が多い。従って、1桁目の数字「2」や2桁目の数字「1」をその他の数字と比べて認識しやすく設定しておくことによって、区分率の向上、誤区分率の低減を行っている。
【0006】
従来、このパラメータは、現地保守員などが経験的に捉えた、各地域での郵便番号の出現率を基に調整されていた。
上記したとおり、パラメータの調整は地域ごとに人手で行っていたため、調整する手間が非常にかかる上、人の経験や勘に頼るところが多いのでかえって性能が悪化する(調整不良)場合もあり、問題となっていた。
【0007】
【発明が解決しようとする課題】
この発明は、区分装置で収集される数字列からなる所在情報の統計情報を利用してパラメータ調整を自動化することによって、大幅な省力化が図れる所在情報認識装置および区分装置を提供することを目的としている。
【0008】
【課題を解決するための手段】
この発明の所在情報認識装置は、紙葉類上の数字列からなる所在情報を読取る読取手段と、この読取手段により読取った数字列の1文字ずつを参照用の各文字ごとに複数の文字パターンとの複合類似度法により認識候補文字と前記参照用の文字パターンの種別と信頼度とを出力する第1の出力手段と、前記読取手段により読取った数字列の1文字ずつを参照用の各文字ごとに複数の構造特徴との構造特徴マッチング法により認識候補文字と前記参照用の構造特徴の種別とを出力する第2の出力手段と、前記数字列の各桁ごとの文字の出現率を記憶するもので、前記出現率は前記数字列の手前の桁の数字に関連づけられている第1の記憶手段と、前記第1の出力手段の出力結果と前記第2の出力手段の出力結果とに基づく、誤読される可能性高い文字と、この誤読文字の出現率と、認識文字の出現率とに対する、調整用のパラメータ番号を記憶する第2の記憶手段と、前記第2の出力手段の出力結果に基づく、認識候補文字の出現率に対する、複数段階の頻度レベルを決定する種々の基準値を記憶する第3の記憶手段と、前記調整用のパラメータ番号に対する各頻度レベルごとかつ信頼度ごとの評価値を記憶する第4の記憶手段と、前記第1、第2の出力手段による各認識候補文字に対する出現率を前記第1の記憶手段から読出す第1の読出手段と、前記第1の出力手段による認識候補文字と前記参照用の文字パターンの種別と前記第2の出力手段による認識候補文字と前記参照用の構造特徴の種別と、前記第1の読出手段により読出された各認識候補文字に対する出現率とに基づく、調整用のパラメータ番号を前記第2の記憶手段から読出す第2の読出手段と、前記第2の出力手段による認識候補文字に対する前記出現率と、前記第2の出力手段による認識候補文字と参照用の構造特徴の種別とに対して前記第3の記憶手段に記憶されている各基準値とを比較することにより、頻度レベルを判断する第1の判断手段と、前記第2の読出手段による調整用のパラメータ番号と前記第1の判断手段により判断された頻度レベルとにより、前記第4の記憶手段に記憶されている評価値を読出す第3の読出手段と、前記第1、第2の出力手段による各認識候補文字に対する前記第3の読出手段により読出される評価値により、前記数字列の文字を判断する第2の判断手段と、この第2の判断手段により判断した前記数字列の文字を収集する収集手段と、この収集手段により収集した前記数字列の文字の収集内容に基づいて、前記第1の記憶手段に記憶されている前記数字列の各桁ごとの文字の出現率を変更する変更手段とを具備している。
【0009】
【発明の実施の形態】
この発明の実施の形態を図面に基いて詳細に説明する。
図1は、この発明に係わる区分機1を示す外観図であり、図2は区分機1の概略構成を示す図である。この区分機1は、大型の箱型状の区分機本体1aを有している。この区分機1は、郵便物P上の宛名、郵便番号を読取り、その読取内容から宛名、郵便番号を認識し、この認識した宛名、郵便番号に対応する区分先に郵便物Pを区分するものである。
上記区分機本体1aには、供給部2と、スキャナ部3と、搬送部4と、区分部5と、収納部6とが設けられている。この供給部2からの郵便物Pが搬送路Rによって搬送されることにより、搬送部4、区分部5を順次介して収納部6に導かれる。
【0010】
上記供給部2は、郵便物Pを載置する載置台7と、この載置台7から郵便物Pを一通ずつ取り出して搬送路Rに送る取出し部8とを有している。上記スキャナ部3は、搬送路Rによって搬送される1通ずつの郵便物P上の全体の画像を光学的に読取って画像情報を生成する。上記搬送部4は、スキャナ部3を通過してきた郵便物Pを区分部5へ搬送する。上記収納部6は、郵便物Pを区分収納する多数の収納ポケット6aを有している。上記区分部5は、搬送部4から送られてくる郵便物Pをスキャナ部3からの画像情報に対する後述する認識結果に基いて収納ポケット6a、…のいずれかに振り分ける。
【0011】
上記スキャナ部3は、郵便物P上を光学的に走査して光電変換することによりパターン信号を得るものであり、たとえば郵便物P上に光を照射する光源、およびその反射光を受けて電気信号に変換する自己走査形のCCDイメージセンサ等によって構成される。上記スキャナ部3の出力は認識部10に供給される。この認識部10は、スキャナ部3の出力に応じて文字パターンの認識を行うことにより郵便番号、住所等からなるあて名を認識するものである。
【0012】
上記区分機1において、上記供給部2、スキャナ部3、搬送部4、区分部5、認識部10は、制御部11に接続されている。この制御部11は、区分機1の全体の動作を制御する。たとえば、制御部11は図示しないメモリに記憶されている区分指定テーブルを用いて、上記認識部10の認識結果に対応する区分指定データを読出し、この読出した区分指定データ(収納ポケット6a、…のアドレス)に対応する収納ポケット6a、…に上記郵便物Pを搬送せしめるものである。
【0013】
さらに、上記制御部11はドライバ(図示しない)により上記搬送路R等の搬送機構部(図示しない)を駆動することにより、搬送系全体の制御を行うようになっている。
上記認識部10は、図3に示すように、領域検出部12と、文字行検出部13と、文字検出部14と、郵便番号認識部15と、文字認識部16と、街区文字認識部17と、宛名認識部18と、文字辞書部19と、住所辞書部20とで構成されている。
【0014】
上記領域検出部12は、スキャナ部3から供給される画像から、領域の形、位置等で、宛名、郵便番号が記載されている領域を検出する。
上記文字行検出部13は、領域検出部12により検出された領域内の宛名、郵便番号が記載されている文字行を検出する。領域検出部12により検出された領域内の画像データからあて名行を検出するものである。
【0015】
この文字行検出部13は、領域検出部12により検出された領域内の画像より、スタンプ、郵便番号枠、広告文などを検出し、それらを除去した後、文字の配置などから行を検出し、その行の大きさ、配置などから住所もしくは郵便番号行らしい行に優先度をつけ、その優先度の高い候補から順々に検出結果として出力するものである。
【0016】
上記文字検出部14は、文字行検出部13により検出された文字行の文字を1文字ずつ検出切出しする、つまり住所(郵便番号)に対応する文字情報を検出切出しする。
上記郵便番号認識部15は、文字検出部14から供給されるつまり検出切出された文字(郵便番号)を文字辞書部19に記憶されている文字データ(数字データ:数字に対応する標準パターン)と照合して郵便番号を認識する。上記郵便番号認識部15における郵便番号の認識方法および認識手段は、後で詳細に説明する。
【0017】
上記文字認識部16は、文字検出部14から供給されるつまり検出切出された文字を文字辞書部19に記憶されている文字データと照合して文字を認識する。同様に、街区文字認識部17も、文字検出部14から供給されるつまり検出切出された文字を文字辞書部19に記憶されている文字データと照合して街区の文字を認識する。宛名認識部18は、文字検出部14から供給されるつまり検出切出された文字を住所辞書部20に記憶されている住所データと照合して宛名を認識する。
【0018】
上記郵便番号認識部15からの郵便番号の認識結果、文字認識部16からの文字の認識結果、街区文字認識部17からの街区文字の認識結果、宛名認識部18からの宛名の認識結果は、制御部11に供給されている。この制御部11は、供給されている各認識結果により宛名を判別し、この判別した宛名に対する区分指定データつまり区分部5における収納ポケット6a、…を示すデータを出力するものである。
【0019】
図4は、上記郵便番号認識部15の構成を詳細に示すものである。すなわち、文字検出部14から供給される文字検出切り出し候補の文字パターンは、複合類似度認識部31および構造特徴マッチング認識部32にそれぞれ送られる。複合類似度認識部31は、供給される文字パターンと複合類似度辞書31aの標準パターンとの比較演算により複合類似度演算を行うことにより認識処理を行い、その認識結果は上位候補の複合類似度のみを残し、複合類似度評価部33に送られる。複合類似度辞書31aは1つの文字種に対し複数のエントリ文字が存在するので、エントリ文字毎に異なった類似度を持つ。複合類似度評価部33では、類似度の分布により、予め統計的に予測されたしきい値によって、類似度信頼度と呼ばれる評価値を算出し、この算出した評価値の上位3候補までを認識結果として決定する。
【0020】
構造特徴マッチング認識部32は、供給される文字パターンの輪郭構造を演算し、その輪郭構造特徴をセグメントと呼ばれる文字構成要素に分解する。構造特徴マッチング認識部32は、セグメントは方向コードや長さの情報からなり、そのセグメントの接続条件から、構造の認識を行う。構造特徴マッチング認識部32は、構造特徴マッチング辞書32aの遷移を行い、構造特徴がマッチしたものが構造特徴マッチング評価部34に送られる。構造特徴マッチング辞書32aは1つの文字種に対し複数のエントリ文字が存在し、そのそれぞれが文字の形状を反映している。どのエントリ文字に対して構造特徴がマッチしたかという情報も同時に構造特徴マッチング評価部34に送られる。構造特徴マッチング評価部34は、文字の詳細な特徴を再評価し、認識結果を3候補まで決定する。
【0021】
複合類似度評価部33および構造特徴マッチング評価部34の各認識結果は、それぞれ総合評価部35に送られ、この総合評価部35で供給される文字パターンに対する答えと総合評価値を決定する。総合評価部35では、図5に示す、出現率評価テーブル(第1の記憶手段)41を用いて、各桁ごとの出現率を求め、図6に示す、結合テーブル(第2の記憶手段)42を用いて、調整パターン番号を選択し、図7に示す、レベル選択テーブル(第3の記憶手段)43を用いて、頻度レベルを選択し、図8に示す、レベルテーブル(第4の記憶手段)44を用いて、評価値の算出をする。(統計情報を利用したこのような評価値出力の方法を、以下、自動調整処理と記述する。)
総合評価部35の評価結果は、郵便番号編集部36に送られ、ここで7桁の最終的な郵便番号候補が出力される。
【0022】
出現率評価テーブル41は、図5に示すように、各桁ごとの各文字の出現率からなり、たとえば、1桁目の出現率として、1の出現率が89%、2の出現率が11%、他の数字の出現率が0%となっている。また、1桁目が1の際の2桁目の出現率として、0の出現率が67%、1の出現率が18%、2の出現率が15%、他の数字の出現率が0%となっている。また、1桁目が2の際の2桁目の出現率として、0の出現率が100%、他の数字の出現率が0%となっている。
【0023】
出現率評価テーブル41は、後述するように、あらかじめ収集された郵便番号データの統計情報により作成される。
結合テーブル42は、図6に示すように、構造特徴マッチングの文字(認識結果)とエントリ(マッチング用の比較する文字の形状の違いにより区別されている)と複合類似度の文字(認識結果)とエントリ(複合類似度用の比較する文字パターンの違いにより区別されている)との組合わせと、誤読される可能性の高い文字(相手文字)、相手の文字の条件(相手文字の出現率)、自分の条件(認識文字の出現率−相手文字の出現率=出現率差)に対する調整パターン番号が登録されている。
【0024】
たとえば、構造特徴マッチングの文字が「0」でエントリが「1」、複合類似度の文字が「0」でエントリが「1」、相手文字が「6」の場合、相手の条件として出現率が「5」よりも大きく、自分の条件として出現率差が「6」よりも大きい際に、調整パターン番号「5」が選択されるようになっている。
【0025】
また、構造特徴マッチングの文字が「0」でエントリが「1」、複合類似度の文字が「0」でエントリが「1」、相手文字が「8」の場合、相手の条件として出現率が「5」よりも大きい際に、調整パターン番号「2」が選択されるようになっている。
【0026】
また、構造特徴マッチングの文字が「0」でエントリが「1」、複合類似度の文字が「0」でエントリが「1」、相手文字が「8」の場合、相手の条件として出現率が「6」よりも小さく、自分の条件として出現率差が「20」よりも大きい際に、調整パターン番号「3」が選択されるようになっている。
【0027】
また、構造特徴マッチングの文字が「0」でエントリが「1」、複合類似度の文字が「0」でエントリが「1」で、相手文字、相手の条件、自分の条件が上記以外の際に、調整パターン番号「10」が選択されるようになっている。
また、構造特徴マッチングの文字が「0」でエントリが「2」、複合類似度の文字が「0」でエントリが「*:1以外」、相手文字が「6」の場合、相手の条件として出現率が「6」よりも小さく、自分の条件として出現率差が「10」よりも小さい際に、調整パターン番号「1」が選択されるようになっている。
【0028】
レベル選択テーブル43は、図7に示すように、構造特徴マッチングの認識結果の出現率によって、強強化、強化、標準、弱化、弱弱化の5段階の頻度レベルを定めている。このレベル選択テーブル43では、構造特徴マッチングの文字(認識結果)のエントリ(マッチング用の比較する文字の形状の違いにより区別されている)ごとに、各レベルの間の閾値を設定している。
【0029】
たとえば、構造特徴マッチングの文字が「0」でエントリが「0」の場合、強強化と強化を区別する閾値が「20」で、強化と標準を区別する閾値が「10」で、標準と弱化を区別する閾値が「5」で、弱化と弱弱化を区別する閾値が「2」である。
【0030】
また、構造特徴マッチングの文字が「0」でエントリが「1」の場合、強強化と強化を区別する閾値が「25」で、強化と標準を区別する閾値が「15」で、標準と弱化を区別する閾値が「10」で、弱化と弱弱化を区別する閾値が「5」である。
レベルテーブル44は、図8に示すように、調整パターン番号と頻度レベルと複合類似度の信頼度とに基づいて、評価値が登録されている。
【0031】
たとえば、調整パターン番号「1」の、頻度レベルが強強化で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「2」、「4」、「4」、「5」が対応して記憶され、調整パターン番号「1」の、頻度レベルが強化で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「2」、「3」、「4」、「5」が対応して記憶され、調整パターン番号「1」の、頻度レベルが標準で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「1」、「3」、「4」、「5」が対応して記憶され、調整パターン番号「1」の、頻度レベルが弱化で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「1」、「3」、「4」、「4」が対応して記憶され、調整パターン番号「1」の、頻度レベルが弱弱化で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「1」、「2」、「3」、「4」が対応して記憶される。
【0032】
また、調整パターン番号「2」の、頻度レベルが強強化で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「2」、「4」、「4」、「5」が対応して記憶され、調整パターン番号「2」の、頻度レベルが強化で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「2」、「3」、「5」、「5」が対応して記憶され、調整パターン番号「2」の、頻度レベルが標準で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「2」、「3」、「4」、「5」が対応して記憶され、調整パターン番号「2」の、頻度レベルが弱化で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「1」、「3」、「4」、「5」が対応して記憶され、調整パターン番号「2」の、頻度レベルが弱弱化で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「1」、「3」、「4」、「4」が対応して記憶される。
【0033】
また、調整パターン番号「3」の、頻度レベルが強強化で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「3」、「5」、「6」、「6」が対応して記憶され、調整パターン番号「3」の、頻度レベルが強化で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「3」、「4」、「6」、「6」が対応して記憶され、調整パターン番号「3」の、頻度レベルが標準で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「3」、「4」、「5」、「6」が対応して記憶され、調整パターン番号「3」の、頻度レベルが弱化で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「2」、「4」、「5」、「6」が対応して記憶され、調整パターン番号「3」の、頻度レベルが弱弱化で複合類似度の信頼度が「0」、「1」、「2」、「3」に対して、それぞれ評価値「2」、「4」、「5」、「5」が対応して記憶される。
【0034】
次に、上記構成において、図9に示すフローチャートを参照しつつ、自動調整処理を説明する。
たとえば、具体例として、郵便番号「100−0001」の2桁目「0」の評価値を自動調整処理により求める手順を示す。入力データとして、以下のデータが与えられたとする。簡単のため、以下では、複合類似度の認識結果、構造特徴マッチングの認識結果が共に、例えば文字が「0」でエントリ1の場合、“0−1”と記述する。
【0035】

Figure 0004733859
総合評価では、複合類似度の認識結果と構造特徴マッチングの認識結果の全組み合わせについてそれぞれ評価値を算出し、その上位2候補を、それまでの前文字列に対する答えとする。具体的には、(例1)の場合、前文字列が「1」「2」の場合についてそれぞれ
(複合類似度の認識結果、構造特徴マッチングの認識結果)
=(0−1,0−1)、(0−1,8−1)、(6−2,0−1)、
(6−2,8−1)、(0−1,×)、(6−1,×)、(×,0−1)、
(×,8−1)
の全組み合わせ(×は、候補がない状態)について、以下で示す第22〜第25のステップの操作を行ってそれぞれの総合評価値を算出し、評価値の高い方から1候補または2候補(候補数の選択の詳細は、第26のステップを参照)を、その前文字列候補に対する答えとして採用する。
【0036】
尚、第22〜第25のステップでは、前文字列が「1」で、(複合類似度の認識結果、構造特徴マッチングの認識結果)=(0−1,0−1)の場合を例に挙げて説明する。
【0037】
第22のステップでは、文字の出現率を求める。図5を用いて説明する。出現率評価テーブル41には、各桁での文字の出現率が、前文字列候補に依存する形で設定されている。図5は、1桁目と2桁目の出現率評価テーブル41の例である。この場合、2桁目に「0」が出る確率は、1桁目の文字が「1」のときは67%であるが、1桁目の文字が「2」の時は100%となることを示す。同様に、1桁目の文字が「1」のとき、2桁目で「1」が出る確率は18%、「2」が出る確率は15%、その他は0%であることが求められる。自動調整処理では、ある桁の出現率を求める場合、前文字列と現在評価する桁の構造特徴マッチングの認識結果とを用いて出現率評価表としての出現率評価テーブル41を探索する。
【0038】
(例1)の場合、1桁目候補が「1」で、2桁目の構造特徴マッチング候補は「0」「8」である。よって、「0」の出現率67%が得られる。
次に、処理する桁をN桁目(1≦N≦7)、構造特徴マッチングの認識結果をCN、前文字列C1、C2…CN−1=Cnとした場合の出現率の求め方について、図10に示すフローチャートを参照しつつ説明する。
【0039】
すなわち、N桁目の出現率を求める場合、nを1に設定し(ST31)、nがNと一致するかチェックし(ST32)、一致する場合、1桁目の出現率評価テーブル41から構造特徴マッチングの認識結果CNの出現率(A1)を得る(ST35)。
【0040】
上記ステップ32のチェックの結果、一致しない場合、1桁目の出現率評価値により次桁へのポインタを求め(ST33)、nに1を加算し(n++)(ST34)、ステップ32に戻る。
このステップ32のチェックの結果、一致する場合、上記ステップ35に進み、N桁目の出現率評価テーブル41から構造特徴マッチングの認識結果CNの出現率(A1)を得、一致しない場合、上記ステップ33に進む。
【0041】
第23のステップでは、図11のフローチャートに示すように、調整パターン番号を求める。
結合テーブル42から、構造特徴マッチングの認識結果、複合類似度の認識結果が一致する行を探し(ST41、42、50)、更に、「相手の条件」および「自分の条件」を満たす(ST43〜47)最初の行(I)のパターン番号を調整パターン番号(A2)として出力する(ST48)。
【0042】
最終行まで達した際、最終行のパターン番号を調整パターン番号(A2)として出力する(ST49)。
「相手文字」とは、誤読しやすいと想定される相手の数字のことであり、これはシミュレーションや過去の調整経験から得られる既知の情報から設定されている。たとえば、構造特徴マッチングの認識結果で0−1の結果が得られたパターンは「6」に誤読することが多い、等といった情報が、結合テーブル42に盛り込まれている。
【0043】
例の場合、構造特徴マッチングの認識結果が0−1、複合類似度の認識結果が0−1であり、この時点では、図6の1行目から4行目が該当し、1行目から順に条件が一致するかを検索する。
1行目:
出現率評価表としての出現率評価テーブル41より、現在の桁では「6」の出現率が0%であり、これは「相手の条件」に一致しない。
【0044】
2行目:
同様に、「8」の出現率は0%で、「相手の条件」が一致しない。
3行目:
相手の条件が(0<6)で一致し、自分の条件が((67−0)>20)で一致し、この行が選ばれる。以上の結果、この例の場合、調整パターン番号3が選ばれる。
【0045】
第24のステップでは、頻度レベルを選択する。
構造特徴マッチングの認識結果の出現率によって、強強化、強化、標準、弱化、弱弱化の5段階の頻度レベルを定める。レベル選択テーブル43では、構造特徴マッチングの認識結果のエントリ毎に、各レベルの間の閾値を設定している。構造特徴マッチング法のエントリが文字の特性を反映しているので、エントリの信頼性の高低によって頻度レベルの出方をかえることが可能となる。
【0046】
今、図7に示すレベル選択テーブル43が与えられたとき、(例1)の場合では、第23のステップで構造特徴マッチングの認識結果が0−1、出現率が67%(>25%)が得られており、この頻度レベルは強強化となる。
【0047】
次に、頻度レベルの選択について、図12に示すフローチャートを参照しつつ説明する。
すなわち、構造特徴マッチングの認識結果としての文字とエントリと一致するものをレベル選択テーブル43の1行目から順次チェックし(ST51、52、54、55)、一致した場合に、出現率が強強化と強化の頻度レベルを区別する閾値よりも大きい場合に(ST56)頻度レベル(A3)を強強化と判別し(ST57)、出現率が強化と標準の頻度レベルを区別する閾値よりも大きい場合に(ST58)頻度レベル(A3)を強化と判別し(ST59)、出現率が標準と弱化を区別する閾値よりも大きい場合に(ST60)頻度レベル(A3)を標準と判別し(ST61)、出現率が弱化と弱弱化を区別する閾値よりも大きい場合に(ST62)頻度レベル(A3)を弱化と判別し(ST63)、出現率が弱化と弱弱化を区別する閾値よりも小さい場合に(ST62)頻度レベル(A3)を弱弱化と判別する(ST64)。
【0048】
また、ステップ52により最後の行までチェックしても不一致の際、例外処理として頻度レベル(A3)を標準とする(ST53)
第25のステップでは、総合評価値を算出する。
【0049】
第23、第24のステップで求められた調整パターン番号と頻度レベル、および、複合類似度の信頼度を用いて、レベルテーブル44から評価値を選択する。
図8に示すレベルテーブル44を用いた場合、(例1)の場合では、複合類似度の認識結果が0−1(3)、パターン番号3、頻度レベルが強強化であるから、総合評価値は「6」となる。
【0050】
次に、総合評価値の算出について、図13に示すフローチャートを参照しつつ説明する。
すなわち、第23のステップで求められた調整パターン番号(A2)と一致するものをレベルテーブル44の1行目から順次チェックし(ST71、72、73、76)、一致した場合に、第24のステップで求められた頻度レベル(A3)と複合類似度の信頼度から総合評価値(A4)を選択し、出力する(ST74)。
【0051】
また、ステップ72により最後の行(I)までチェックしても不一致の際、例外処理として総合評価値「0」(A4=0)を出力する(ST75)。
【0052】
第26のステップでは全ての前文字列に対して総合評価処理を行う。同じ複合類似度の認識結果と構造特徴マッチングの認識結果が入力されても、前文字列候補によって総合評価値は変化する可能性がある。
(例1)の場合、前文字列「1」について全ての複合類似度の認識結果、構造特徴マッチングの認識結果の組み合わせで評価を行った後、前文字列「2」の場合について、同様に総合評価を行う(ST27からST29、ST22からST26)。
【0053】
結果的に、7桁目まで上記総合評価を行うと(ST27)、複数の郵便番号候補が得られる。各桁で求められた総合評価値を候補ごとにそれぞれ加算し、それを郵便番号候補の総合評価点とする(ST13)。この総合評価点の高いものを上位2候補選択し、最終結果とする(ST14)。
【0054】
以上のような総合評価算出操作を単純に行い、存在する前文字列に対して各桁で総合評価点の高いほうから第2位までを選んで処理すると、例えば3桁目までで、図14に示すような2分木の形となる(括弧内の数字は総合評価点)。この結果、4桁目の総合評価では、8種の前文字列候補が存在する。
【0055】
以上の操作を7桁まで行った場合、得られる候補は128通りであり、各桁ごとでの総合評価を行う回数の総和は127回、しかも、その127回のそれぞれで複合類似度の認識結果と構造特徴マッチングの認識結果の全ての組み合わせを評価することになり、計算量が膨大なものとなる。そこで、以下のようなルールで計算量を削減することもできる。
【0056】
1.1桁目は2候補までを選択。
2.2桁目以降では、図14に示した2分木のうち、総合評価点の高い方のノードに接続するものだけ2候補選択し、他ノードでは1候補のみ選択する。
この操作で第3桁目まで総合評価を行った場合、図15のようになり、4桁目では、前文字列候補4個に対して総合評価を行う。この方法で7桁目まで処理した場合、最終的な候補は8候補まで絞られる。この8候補の中で、各桁毎の評価点の総和が最も高いものを順に2位まで選択し、最終的な郵便番号候補とする。
【0057】
なお、上記実施例では、文字認識の手法について複合類似度法と構造特徴マッチング法の2つの認識手法に適用した場合について説明したが、本発明はこれに限定されるものでなく、たとえば、一方もしくは両方の認識手法を別の手法に置き換えた場合にも同様に適用できる。また、認識手法が1種類である場合にも同様に適用できる。
【0058】
さらに、使用するテーブル類もこれに限定されるものでない。上記実施例では、経験やシミュレーションなどによって得られた既知の誤読情報を、テーブルに反映させるための方法について説明したが、より単純に頻度を反映させるためには、たとえば、認識結果から得られた類似度に出現率をかけたものを総合評価値とする、などといった方法も考えられる。
【0059】
次に、出現率の求め方について説明する。
出現率評価表としての出現率評価テーブル41は、各桁での0〜9の出現頻度が、前文序列に依存した形で設定されたファイルであり、図16に示すような、稼働情報ファイル11aから作成する。この上記制御部11内に存在し、実際に区分機1で処理した(認識した)郵便番号とその通数を集計して保存したものである。
【0060】
上記稼働情報ファイル11aは郵便局毎の複数台の区分機を管理する機器に存在し、実際に各区分機で処理した(認識した)郵便番号とその通数を集計して保存したものであっても良い。
従来は作業者が経験的に捉えていた文字の出現率が、実際の機械から得られた統計的な情報に置き換えられ、より正確に文字認識処理に反映することができる。
【0061】
以下、作成手順を示す。
(1)1桁目の文字毎の数と総数を求める。(総数が少ない場合は、*で代用する。)
(2)文字種毎の数を総数で割り、割合を求める。(1桁目の場合、「1」が89%、「2」が11%)
(3)1桁目が同じ文字のグループに関して、2桁目の文字毎の数と総数を求め、割合を求める。(1桁目「1」の場合、図16の1〜5行目を集計し割合「0」67%、「1」18%、「2」15%を得る)
(4)(3)の処理を2〜7桁まで繰り返す。(n桁目の処理をするときには、n−1桁目までの前文字列が等しいグループ毎に集計を行う。)
この結果、図17に示すような、1〜7桁目までの出現率を得ることができる。
【0062】
これにより、たとえば1、2桁目に対する、図5に示すような、出現率評価テーブル41が総合評価部35に登録される。
尚、出現率評価テーブル41は、区分機1が安定稼働し稼働情報データが十分に畜積(通常1ヶ月程度)できた段階で作成する。
【0063】
上記したように、区分機設置局で収集された郵便番号データの統計情報を利用して、文字の頻度(出現率)を反映した文字評価値を決定する。今まで人手で行っていた文字評価値決定のパラメータ調整を統計情報によって自動的に行う。
【0064】
すなわち、複合類似度認識および構造特徴マッチング認識の各結果は、それぞれ総合評価部に送られ、ここで入力文字に対する答えと総合評価値を決定する。総合評価部では、郵便局にて収集された郵便番号データの統計情報により自動的に作成された出現率評価テーブル(出現率評価表)を用いて評価値の算出をする。すなわち、出現頻度の高い数字は評価値を高く、出現頻度の低い数字は評価値を低く出力するように、パラメータが設定されている。総合評価部の認識結果は、郵便番号編集部に送られ、ここで7桁の最終的な郵便番号候補が出力される。
【0065】
これにより、複合類似度認識法と構造特徴マッチング法の2種類の文字認識結果から最終的な文字評価値を算出するときに使用するパラメータを人手によらず自動的に調整することができる。
【0066】
また、区分機設置局で収集された郵便番号データの統計情報を利用してパラメータ調整を自動化することによって、大幅な省力化が図れる。
さらに、シミュレーションや過去の調整経験から得られる既知の情報をテーブルに反映させることによって、文字や辞書の特性を利用した細かい調整も可能となる。
【0067】
複数の郵便番号候補を編集する処理において、全ての前文字列に対して総合評価処理(ステップ26の処理)を行うことによって、全桁認識処理の計算量を削減することができる。
【0068】
【発明の効果】
以上詳述したように、この発明によれば、区分装置で収集される数字列からなる所在情報の統計情報を利用してパラメータ調整を自動化することによって、大幅な省力化が図れる所在情報認識装置および区分装置を提供できる。
【図面の簡単な説明】
【図1】この発明の実施形態を説明するための区分機の概略構成を示す外観図。
【図2】区分機の概略構成を示す図。
【図3】区分機の概略構成を示すブロック図。
【図4】郵便番号認識部の概略構成を示すブロック図。
【図5】出現率評価テーブルの構成例を示す図。
【図6】結合テーブルの構成例を示す図。
【図7】レベル選択テーブルの構成例を示す図。
【図8】レベルテーブルの構成例を示す図。
【図9】自動調整処理を説明するためのフローチャート。
【図10】出現率を求める際の処理を説明するためのフローチャート。
【図11】調整パターン番号を求める際の処理を説明するためのフローチャート。
【図12】頻度レベルを選択する際の処理を説明するためのフローチャート。
【図13】総合評価値を算出する際の処理を説明するためのフローチャート。
【図14】3桁目までの各桁ごとの総合評価点を説明するための図。
【図15】3桁目までの各桁ごとの総合評価点(候補削減)を説明するための図。
【図16】稼働情報ファイルの保存内容を説明するための図。
【図17】1〜7桁目までの出現率を説明するための図。
【符号の説明】
1…区分機、P…郵便物、15…郵便番号認識部、31…複合類似度認識部、31a…複合類似度辞書、32…構造特徴マッチング認識部、32a…構造特徴マッチング辞書、33…複合類似度評価部、34…構造特徴マッチング評価部、35…総合評価部、41…出現率評価テーブル、42…結合テーブル、43…レベル選択テーブル、44…レベルテーブル。[0001]
BACKGROUND OF THE INVENTION
  The present invention provides a location information recognition device that reads location information consisting of a numeric string on a paper sheet and recognizes each character of the read numeric string.and,The present invention relates to a sorting apparatus that executes sorting processing using the recognition result of the location information recognition apparatus.
[0002]
[Prior art]
There are two types of character recognition methods (composite similarity method and structural feature matching method) in a mail address automatic reading and sorting machine that optically reads address information on mail as paper sheets and sorts the mail. in use.
[0003]
From the recognition results obtained by the two types of recognition methods, an evaluation value is obtained by using a parameter set in advance according to the appearance rate of the zip code (location information consisting of a numeric string), and the recognition result is comprehensively evaluated. For example, in each digit, the evaluation value of a number having a high appearance rate is set to be high, the value having a low appearance rate is set to a low value, and the like is set as a parameter.
[0004]
By performing such processing, numbers with a high appearance rate can be easily recognized, numbers with a low appearance rate can be made difficult to recognize, and the processing efficiency of the sorting machine in each region can be improved.
[0005]
For example, in post offices near Kawasaki, there are many mail items such as “21 *”. Therefore, by setting the first digit “2” and the second digit “1” to be easier to recognize than other numbers, the classification rate is improved and the misclassification rate is reduced. .
[0006]
Conventionally, this parameter has been adjusted based on the appearance rate of postal codes in each region, as experienced by local maintenance personnel.
As described above, parameter adjustment was done manually in each region, so it took a lot of time and effort, and there were many places that depended on the experience and intuition of people. It was.
[0007]
[Problems to be solved by the invention]
  The present invention relates to a location information recognition device that can achieve significant labor savings by automating parameter adjustment using statistical information of location information consisting of numeric strings collected by a sorting device.andThe object is to provide a sorting device.
[0008]
[Means for Solving the Problems]
  Of this inventionThe location information recognition device is a combination of reading means for reading location information composed of a numeric string on a paper sheet, and a plurality of character patterns for each character for reference for each character of the numeric string read by the reading means. A first output means for outputting a recognition candidate character, a type and reliability of the reference character pattern by a similarity method, and a character string read by the reading means for each character for reference Second output means for outputting a recognition candidate character and the type of the structural feature for reference by a structural feature matching method with a plurality of structural features, and storing the appearance rate of the character for each digit of the digit string The appearance rate is based on the first storage means associated with the digit before the number string, the output result of the first output means, and the output result of the second output means, Characters that are likely to be misread, The second storage means for storing the parameter number for adjustment with respect to the appearance rate of the misread character and the appearance rate of the recognized character, and the appearance rate of the recognition candidate character based on the output result of the second output means A third storage means for storing various reference values for determining a plurality of stages of frequency levels; a fourth storage means for storing an evaluation value for each frequency level and reliability for the parameter number for adjustment; The first reading means for reading out the appearance rate for each recognition candidate character by the first and second output means from the first storage means, the recognition candidate character by the first output means, and the reference Based on the type of character pattern, the candidate character recognized by the second output means, the type of structural feature for reference, and the appearance rate for each recognition candidate character read by the first read means Second reading means for reading the parameter number from the second storage means, the appearance rate for the recognition candidate characters by the second output means, the recognition candidate characters by the second output means, and the reference structure By comparing each reference value stored in the third storage unit against the feature type, a first determination unit that determines a frequency level and an adjustment for adjustment by the second reading unit Third reading means for reading the evaluation value stored in the fourth storage means based on the parameter number and the frequency level determined by the first determining means, and the first and second output means The second judgment means for judging the character of the number string based on the evaluation value read by the third reading means for each recognition candidate character according to the above, and the character of the number string judged by the second judgment means Collect to collect And means for changing the appearance rate of characters for each digit of the number string stored in the first storage means based on the collected contents of the characters of the number string collected by the collecting means; It has.
[0009]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is an external view showing a sorting machine 1 according to the present invention, and FIG. 2 is a diagram showing a schematic configuration of the sorting machine 1. This sorter 1 has a large box-shaped sorter body 1a. This sorter 1 reads the address and postal code on the postal matter P, recognizes the address and postal code from the read contents, and sorts the postal matter P into the sorting destination corresponding to the recognized address and postal code. It is.
The sorting machine main body 1 a is provided with a supply unit 2, a scanner unit 3, a transport unit 4, a sorting unit 5, and a storage unit 6. When the postal matter P from the supply unit 2 is conveyed by the conveyance path R, it is guided to the storage unit 6 through the conveyance unit 4 and the sorting unit 5 in order.
[0010]
The supply unit 2 includes a placing table 7 on which the postal matter P is placed, and a taking-out unit 8 that takes out the postal matter P from the placing stand 7 one by one and sends it to the transport path R. The scanner unit 3 optically reads the entire image on each mail piece P conveyed by the conveyance path R and generates image information. The transport unit 4 transports the postal matter P that has passed through the scanner unit 3 to the sorting unit 5. The storage unit 6 has a large number of storage pockets 6a for sorting and storing the postal matter P. The sorting unit 5 sorts the postal matter P sent from the transport unit 4 into one of the storage pockets 6a,... Based on a recognition result described later with respect to image information from the scanner unit 3.
[0011]
The scanner unit 3 optically scans the postal matter P and photoelectrically converts it to obtain a pattern signal. For example, the scanner unit 3 receives a light source that irradiates light on the postal matter P, and the reflected light. It is composed of a self-scanning CCD image sensor or the like that converts signals. The output of the scanner unit 3 is supplied to the recognition unit 10. The recognizing unit 10 recognizes an address composed of a zip code, an address, and the like by recognizing a character pattern according to the output of the scanner unit 3.
[0012]
In the sorting machine 1, the supply unit 2, the scanner unit 3, the transport unit 4, the sorting unit 5, and the recognition unit 10 are connected to a control unit 11. The control unit 11 controls the overall operation of the sorting machine 1. For example, the control unit 11 reads out the segment designation data corresponding to the recognition result of the recognition unit 10 using the segment designation table stored in a memory (not shown), and reads the segment designation data (the storage pockets 6a,. The postal matter P is transported to the storage pockets 6a,.
[0013]
Further, the control section 11 controls the entire transport system by driving a transport mechanism section (not shown) such as the transport path R by a driver (not shown).
As shown in FIG. 3, the recognition unit 10 includes an area detection unit 12, a character line detection unit 13, a character detection unit 14, a zip code recognition unit 15, a character recognition unit 16, and a block character recognition unit 17. And an address recognition unit 18, a character dictionary unit 19, and an address dictionary unit 20.
[0014]
The area detection unit 12 detects an area in which an address and a zip code are described based on the shape and position of the area from the image supplied from the scanner unit 3.
The character line detection unit 13 detects a character line in which an address and a zip code in the area detected by the area detection unit 12 are described. The address line is detected from the image data in the area detected by the area detecting unit 12.
[0015]
The character line detection unit 13 detects a stamp, a postal code frame, an advertisement text, etc. from the image in the region detected by the region detection unit 12, removes them, and then detects a line from the arrangement of characters. A priority is given to a line that seems to be an address or a zip code line based on the size and arrangement of the line, and the detection result is output in order from the candidate with the highest priority.
[0016]
The character detection unit 14 detects and cuts out characters of the character line detected by the character line detection unit 13 one character at a time, that is, detects and cuts out character information corresponding to an address (postal code).
The zip code recognizing unit 15 stores character data (numerical data: standard pattern corresponding to numbers) stored in the character dictionary unit 19 with the characters (postal codes) supplied from the character detecting unit 14, that is, detected and cut out. And the postal code is recognized. The zip code recognition method and the recognition means in the zip code recognition unit 15 will be described in detail later.
[0017]
The character recognizing unit 16 recognizes a character by collating the character supplied from the character detecting unit 14, that is, the detected cut-out character with the character data stored in the character dictionary unit 19. Similarly, the block character recognizing unit 17 recognizes the characters of the block by comparing the character supplied from the character detecting unit 14, that is, the detected cut-out character with the character data stored in the character dictionary unit 19. The address recognizing unit 18 recognizes the address by comparing the character supplied from the character detecting unit 14, that is, the detected cut-out character with the address data stored in the address dictionary unit 20.
[0018]
The zip code recognition result from the zip code recognition unit 15, the character recognition result from the character recognition unit 16, the block character recognition result from the block character recognition unit 17, and the address recognition result from the address recognition unit 18 are: It is supplied to the control unit 11. The control unit 11 discriminates an address according to each recognition result supplied, and outputs classification designation data for the determined address, that is, data indicating the storage pockets 6a in the sorting unit 5.
[0019]
FIG. 4 shows the configuration of the zip code recognition unit 15 in detail. That is, the character patterns of the character detection cutout candidates supplied from the character detection unit 14 are sent to the composite similarity recognition unit 31 and the structural feature matching recognition unit 32, respectively. The composite similarity recognition unit 31 performs a recognition process by performing a composite similarity calculation by a comparison operation between the supplied character pattern and the standard pattern of the composite similarity dictionary 31a, and the recognition result is the composite similarity of the upper candidate. Are left alone and sent to the composite similarity evaluation unit 33. Since the composite similarity dictionary 31a has a plurality of entry characters for one character type, the entry similarity has different similarities. The composite similarity evaluation unit 33 calculates an evaluation value called similarity reliability based on a threshold value statistically predicted in advance from the similarity distribution, and recognizes up to the top three candidates of the calculated evaluation value. Determine as a result.
[0020]
The structural feature matching recognition unit 32 calculates the contour structure of the supplied character pattern, and decomposes the contour structure feature into character components called segments. The structural feature matching recognizing unit 32 recognizes the structure from the connection condition of the segment, and the segment is composed of direction code and length information. The structural feature matching recognizing unit 32 performs a transition of the structural feature matching dictionary 32a, and the structural feature matching is sent to the structural feature matching evaluation unit 34. The structure feature matching dictionary 32a has a plurality of entry characters for one character type, each of which reflects the shape of the character. Information about which entry character matches the structural feature is also sent to the structural feature matching evaluation unit 34 at the same time. The structural feature matching evaluation unit 34 re-evaluates the detailed characteristics of the characters and determines up to three recognition results.
[0021]
Each recognition result of the composite similarity evaluation unit 33 and the structural feature matching evaluation unit 34 is sent to the comprehensive evaluation unit 35, and an answer and a comprehensive evaluation value for the character pattern supplied by the comprehensive evaluation unit 35 are determined. The comprehensive evaluation unit 35 obtains the appearance rate for each digit by using the appearance rate evaluation table (first storage unit) 41 shown in FIG. 5, and combines the table (second storage unit) shown in FIG. 42, the adjustment pattern number is selected, the frequency selection level is selected using the level selection table (third storage means) 43 shown in FIG. 7, and the level table (fourth storage) shown in FIG. Means) 44 is used to calculate the evaluation value. (Such evaluation value output method using statistical information is hereinafter referred to as automatic adjustment processing.)
The evaluation result of the comprehensive evaluation unit 35 is sent to the postal code editing unit 36, where a final 7-digit postal code candidate is output.
[0022]
As shown in FIG. 5, the appearance rate evaluation table 41 includes the appearance rate of each character for each digit. For example, the appearance rate of 1 is 89% and the appearance rate of 2 is 11 as the appearance rate of the first digit. %, The appearance rate of other numbers is 0%. As the appearance rate of the second digit when the first digit is 1, the appearance rate of 0 is 67%, the appearance rate of 1 is 18%, the appearance rate of 2 is 15%, and the appearance rate of other numbers is 0 %. As the appearance rate of the second digit when the first digit is 2, the appearance rate of 0 is 100%, and the appearance rate of other numbers is 0%.
[0023]
The appearance rate evaluation table 41 is created from statistical information of postal code data collected in advance, as will be described later.
As shown in FIG. 6, the connection table 42 includes characters (recognition results) for structural feature matching, entries (distinguished by differences in the shapes of characters to be compared for matching), and characters with complex similarity (recognition results). And entries (distinguished by differences in character patterns to be compared for composite similarity), characters that are likely to be misread (other characters), and other characters' conditions (the appearance rate of the other characters) ), An adjustment pattern number for the condition (appearance rate of recognized character−appearance rate of partner character = appearance rate difference) is registered.
[0024]
For example, when the structural feature matching character is “0”, the entry is “1”, the composite similarity character is “0”, the entry is “1”, and the partner character is “6”, the appearance rate is the partner condition. When the appearance rate difference is larger than “6” and the appearance rate difference is larger than “6”, the adjustment pattern number “5” is selected.
[0025]
In addition, when the structural feature matching character is “0”, the entry is “1”, the composite similarity character is “0”, the entry is “1”, and the partner character is “8”, the appearance rate is the partner condition. When it is larger than “5”, the adjustment pattern number “2” is selected.
[0026]
In addition, when the structural feature matching character is “0”, the entry is “1”, the composite similarity character is “0”, the entry is “1”, and the partner character is “8”, the appearance rate is the partner condition. When the appearance rate difference is smaller than “6” and the appearance rate difference is larger than “20”, the adjustment pattern number “3” is selected.
[0027]
Also, when the structural feature matching character is “0”, the entry is “1”, the composite similarity character is “0”, the entry is “1”, and the partner character, the partner's condition, and your condition are other than the above In addition, the adjustment pattern number “10” is selected.
Further, when the structural feature matching character is “0”, the entry is “2”, the composite similarity character is “0”, the entry is “other than *: 1”, and the partner character is “6”, the partner condition is The adjustment pattern number “1” is selected when the appearance rate is smaller than “6” and the difference in appearance rate is smaller than “10” as a condition of the user.
[0028]
As shown in FIG. 7, the level selection table 43 defines five levels of frequency levels of strong strengthening, strengthening, standard, weakening, and weakening depending on the appearance rate of the recognition result of the structural feature matching. In this level selection table 43, a threshold value between levels is set for each entry of structural feature matching characters (recognition result) (identified by the difference in the shape of characters to be compared for matching).
[0029]
For example, when the character of the structural feature matching is “0” and the entry is “0”, the threshold value for distinguishing between strengthening and strengthening is “20”, the threshold value for distinguishing between strengthening and standard is “10”, and standard and weakening The threshold for distinguishing between “5” and “2” for distinguishing between weakening and weakening is “2”.
[0030]
In addition, when the structural feature matching character is “0” and the entry is “1”, the threshold value for distinguishing between strengthening and strengthening is “25”, the threshold value for distinguishing between strengthening and standard is “15”, and standard and weakening. The threshold for distinguishing between “10” and “5” for distinguishing between weakening and weakening is “10”.
In the level table 44, as shown in FIG. 8, evaluation values are registered based on the adjustment pattern number, the frequency level, and the reliability of the composite similarity.
[0031]
For example, for the adjustment pattern number “1”, the frequency level is strongly enhanced and the reliability of the composite similarity is “0”, “1”, “2”, “3”, respectively, and the evaluation values “2”, “ 4 ”,“ 4 ”,“ 5 ”are stored correspondingly, the frequency level of the adjustment pattern number“ 1 ”is strengthened, and the reliability of the composite similarity is“ 0 ”,“ 1 ”,“ 2 ”,“ 3 ”, evaluation values“ 2 ”,“ 3 ”,“ 4 ”,“ 5 ”are stored in correspondence with each other, and the frequency level of the adjustment pattern number“ 1 ”is standard and the reliability of the composite similarity is standard. Are stored in correspondence with the evaluation values “1”, “3”, “4” and “5” for “0”, “1”, “2” and “3”, respectively. ”For the evaluation values“ 1 ”,“ 3 ”,“ 4 ”,“ 4 ”, respectively, with the frequency level weakened and the reliability of the composite similarity is“ 0 ”,“ 1 ”,“ 2 ”,“ 3 ”. 4 " And the evaluation value “0”, “1”, “2”, “3” for the adjustment pattern number “1”, the frequency level is weakened, and the reliability of the composite similarity is “0”. “1”, “2”, “3”, “4” are stored correspondingly.
[0032]
Also, for the adjustment pattern number “2”, the frequency level is strongly enhanced and the reliability of the composite similarity is “0”, “1”, “2”, “3”, respectively, with evaluation values “2”, “ “4”, “4”, “5” are stored correspondingly, the frequency level of the adjustment pattern number “2” is strengthened, and the reliability of the composite similarity is “0”, “1”, “2”, “ 3 ”, evaluation values“ 2 ”,“ 3 ”,“ 5 ”,“ 5 ”are stored in correspondence with each other, and the frequency of the adjustment pattern number“ 2 ”is standard and the reliability of the composite similarity is standard. Are stored in correspondence with the evaluation values “2”, “3”, “4” and “5” for “0”, “1”, “2” and “3”, respectively. ”For the evaluation values“ 1 ”,“ 3 ”,“ 4 ”,“ 4 ”, respectively, with the frequency level weakened and the reliability of the composite similarity is“ 0 ”,“ 1 ”,“ 2 ”,“ 3 ”. 5 ”corresponds And the evaluation value “1” for the adjustment pattern number “2” with the frequency level weakening and the reliability of the composite similarity being “0”, “1”, “2”, “3”, respectively. , “3”, “4”, “4” are stored correspondingly.
[0033]
For the adjustment pattern number “3”, the frequency level is strongly enhanced and the reliability of the composite similarity is “0”, “1”, “2”, “3”, respectively, and the evaluation values “3”, “3”, respectively. “5”, “6”, “6” are stored correspondingly, the frequency level of the adjustment pattern number “3” is strengthened, and the reliability of the composite similarity is “0”, “1”, “2”, “ 3 ”, evaluation values“ 3 ”,“ 4 ”,“ 6 ”,“ 6 ”are stored in correspondence with each other, and the frequency of the adjustment pattern number“ 3 ”is standard and the reliability of the composite similarity is standard. Are stored in correspondence with the evaluation values “3”, “4”, “5”, “6” for “0”, “1”, “2”, “3”, respectively. ”, And the reliability of the composite similarity is“ 0 ”,“ 1 ”,“ 2 ”,“ 3 ”, the evaluation values“ 2 ”,“ 4 ”,“ 5 ”,“ 6 ”corresponds And the evaluation value “2” for the adjustment pattern number “3” with the frequency level weakening and the reliability of the composite similarity being “0”, “1”, “2”, “3”, respectively. , “4”, “5”, “5” are stored correspondingly.
[0034]
Next, automatic adjustment processing in the above configuration will be described with reference to the flowchart shown in FIG.
For example, as a specific example, a procedure for obtaining the evaluation value of the second digit “0” of the postal code “100-0001” by automatic adjustment processing is shown. Assume that the following data is given as input data. For simplicity, in the following, both the recognition result of the composite similarity and the recognition result of the structural feature matching are described as “0-1” when the character is “0” and the entry is 1, for example.
[0035]
Figure 0004733859
In the comprehensive evaluation, evaluation values are calculated for all combinations of the recognition result of the composite similarity and the recognition result of the structural feature matching, and the top two candidates are used as answers to the previous character string. Specifically, in the case of (Example 1), the previous character string is “1” and “2” respectively.
(Composite similarity recognition result, structural feature matching recognition result)
= (0-1, 0-1), (0-1, 8-1), (6-2, 0-1),
(6-2, 8-1), (0-1, x), (6-1, x), (x, 0-1),
(×, 8-1)
For all combinations (× is a state in which there are no candidates), the overall evaluation values are calculated by performing the operations in the following 22nd to 25th steps, and one candidate or two candidates ( For the details of selecting the number of candidates, refer to the 26th step) as the answer to the previous character string candidate.
[0036]
In the twenty-second to twenty-fifth steps, the previous character string is “1” and (recognition result of composite similarity, recognition result of structural feature matching) = (0-1, 0-1) as an example. I will give you a description.
[0037]
In a twenty-second step, the character appearance rate is obtained. This will be described with reference to FIG. In the appearance rate evaluation table 41, the appearance rate of characters at each digit is set in a manner depending on the previous character string candidate. FIG. 5 is an example of the appearance rate evaluation table 41 for the first and second digits. In this case, the probability of “0” appearing in the second digit is 67% when the first digit is “1”, but is 100% when the first digit is “2”. Indicates. Similarly, when the first digit is “1”, the probability that “1” appears in the second digit is 18%, the probability that “2” appears is 15%, and the others are 0%. In the automatic adjustment process, when the appearance rate of a certain digit is obtained, the appearance rate evaluation table 41 as an appearance rate evaluation table is searched using the previous character string and the recognition result of the structural feature matching of the currently evaluated digit.
[0038]
In the case of (Example 1), the first digit candidate is “1”, and the second digit structural feature matching candidates are “0” and “8”. Therefore, an appearance rate of 67% of “0” is obtained.
Next, how to obtain the appearance rate when the digit to be processed is the N-th digit (1 ≦ N ≦ 7), the recognition result of the structural feature matching is CN, the previous character string C1, C2... CN-1 = Cn, This will be described with reference to the flowchart shown in FIG.
[0039]
That is, when the N-digit appearance rate is obtained, n is set to 1 (ST31), and whether n matches N (ST32) is checked. The appearance rate (A1) of the feature matching recognition result CN is obtained (ST35).
[0040]
If they do not match as a result of the check in step 32, a pointer to the next digit is obtained from the appearance rate evaluation value of the first digit (ST33), 1 is added to n (n ++) (ST34), and the process returns to step 32.
As a result of the check in step 32, if they match, the process proceeds to step 35, where the appearance rate (A1) of the recognition result CN of the structural feature matching is obtained from the N-th digit appearance rate evaluation table 41. Proceed to 33.
[0041]
In the 23rd step, an adjustment pattern number is obtained as shown in the flowchart of FIG.
From the connection table 42, a line in which the recognition result of the structural feature matching and the recognition result of the composite similarity match is searched (ST41, 42, 50), and the “partner condition” and the “own condition” are satisfied (ST43˜). 47) The pattern number of the first line (I) is output as the adjustment pattern number (A2) (ST48).
[0042]
When the last line is reached, the pattern number of the last line is output as the adjustment pattern number (A2) (ST49).
The “partner character” is a number of the partner that is assumed to be easily misread, and is set from known information obtained from simulations and past adjustment experiences. For example, information such as a pattern in which a result of 0-1 in the structural feature matching recognition result is often misread as “6” is included in the combination table 42.
[0043]
In the case of the example, the recognition result of the structural feature matching is 0-1, and the recognition result of the composite similarity is 0-1, and at this time, the first to fourth lines in FIG. Search whether the conditions match in order.
First line:
From the appearance rate evaluation table 41 as the appearance rate evaluation table, the appearance rate of “6” is 0% in the current digit, which does not match the “partner's condition”.
[0044]
Second line:
Similarly, the appearance rate of “8” is 0%, and “the other party's condition” does not match.
3rd line:
The other party's condition matches with (0 <6), and his condition matches with ((67-0)> 20), and this line is selected. As a result, in this example, adjustment pattern number 3 is selected.
[0045]
In the twenty-fourth step, a frequency level is selected.
Depending on the appearance rate of the recognition result of the structural feature matching, five levels of frequency levels of strong strengthening, strengthening, standard, weakening and weakening are determined. In the level selection table 43, a threshold value between levels is set for each entry of the recognition result of the structural feature matching. Since the structure feature matching entry reflects the character characteristics, the frequency level can be changed depending on the reliability of the entry.
[0046]
Now, when the level selection table 43 shown in FIG. 7 is given, in the case of (Example 1), the recognition result of structural feature matching is 0-1 and the appearance rate is 67% (> 25%) in the 23rd step. This frequency level is a strong enhancement.
[0047]
Next, frequency level selection will be described with reference to the flowchart shown in FIG.
That is, the characters and entries that match the recognition result of the structural feature matching are sequentially checked from the first line of the level selection table 43 (ST51, 52, 54, and 55). If the frequency level is higher than the threshold for distinguishing the frequency level of reinforcement (ST56), the frequency level (A3) is determined as strong reinforcement (ST57), and the appearance rate is greater than the threshold for distinguishing between the frequency level of reinforcement and the standard. (ST58) The frequency level (A3) is determined to be strengthened (ST59), and if the appearance rate is greater than the threshold for distinguishing between standard and weakening (ST60), the frequency level (A3) is determined to be standard (ST61) When the rate is larger than the threshold value for discriminating between weakening and weakening (ST62), the frequency level (A3) is determined as weakening (ST63), and the appearance rate is a threshold for discriminating between weakening and weakening It determines that the weak attenuating (ST62) frequency level (A3) is smaller than (ST64).
[0048]
In addition, if there is a mismatch even if the last line is checked in step 52, the frequency level (A3) is standardized as an exception process (ST53).
In the twenty-fifth step, a comprehensive evaluation value is calculated.
[0049]
An evaluation value is selected from the level table 44 using the adjustment pattern number and frequency level obtained in the 23rd and 24th steps, and the reliability of the composite similarity.
When the level table 44 shown in FIG. 8 is used, in the case of (Example 1), the recognition result of the composite similarity is 0-1 (3), the pattern number 3, and the frequency level is strongly enhanced. Becomes “6”.
[0050]
Next, calculation of the comprehensive evaluation value will be described with reference to the flowchart shown in FIG.
In other words, those that match the adjustment pattern number (A2) obtained in the 23rd step are sequentially checked from the first row of the level table 44 (ST71, 72, 73, 76). A comprehensive evaluation value (A4) is selected and output from the frequency level (A3) obtained in the step and the reliability of the composite similarity (ST74).
[0051]
In addition, if there is no match even if the last line (I) is checked in step 72, the comprehensive evaluation value “0” (A4 = 0) is output as an exception process (ST75).
[0052]
In a twenty-sixth step, comprehensive evaluation processing is performed for all previous character strings. Even if the recognition result of the same composite similarity and the recognition result of structural feature matching are input, the overall evaluation value may change depending on the previous character string candidate.
In the case of (Example 1), after evaluating the combination of the recognition results of all the composite similarities and the recognition results of structural feature matching for the previous character string “1”, the same applies to the case of the previous character string “2”. Comprehensive evaluation is performed (ST27 to ST29, ST22 to ST26).
[0053]
As a result, when the comprehensive evaluation is performed up to the seventh digit (ST27), a plurality of postal code candidates are obtained. The comprehensive evaluation value obtained for each digit is added for each candidate, and this is used as the comprehensive evaluation point of the postal code candidate (ST13). The top two candidates with a high overall evaluation score are selected as final results (ST14).
[0054]
If the overall evaluation calculation operation as described above is simply performed and processing is performed by selecting from the highest overall evaluation score to the second highest in each digit for the existing character string, for example, up to the third digit, FIG. (The number in parentheses is the overall evaluation score). As a result, in the comprehensive evaluation of the fourth digit, there are eight types of previous character string candidates.
[0055]
When the above operations are performed up to 7 digits, 128 candidates are obtained, and the total number of times of comprehensive evaluation for each digit is 127 times, and the combined similarity recognition result is 127 times respectively. All the combinations of the recognition results of the structural feature matching are evaluated, and the amount of calculation becomes enormous. Therefore, the amount of calculation can be reduced by the following rules.
[0056]
Select up to 2 candidates for the first digit.
In the second and subsequent digits, two candidates are selected only from the binary tree shown in FIG. 14 that are connected to the node with the higher overall evaluation score, and only one candidate is selected at the other nodes.
When the comprehensive evaluation up to the third digit is performed by this operation, the result is as shown in FIG. 15, and the comprehensive evaluation is performed on the four previous character string candidates at the fourth digit. When processing up to the seventh digit by this method, final candidates are narrowed down to eight candidates. Among the eight candidates, the one with the highest total sum of evaluation points for each digit is selected up to the second place in order, and is set as the final zip code candidate.
[0057]
In the above embodiment, the case where the character recognition method is applied to two recognition methods of the composite similarity method and the structural feature matching method has been described. However, the present invention is not limited to this. Alternatively, the present invention can be similarly applied when both recognition methods are replaced with another method. Further, the present invention can be similarly applied when there is one kind of recognition method.
[0058]
Furthermore, the tables to be used are not limited to this. In the above embodiment, the method for reflecting the known misread information obtained by experience or simulation in the table has been described, but in order to reflect the frequency more simply, for example, obtained from the recognition result. A method is also conceivable in which the similarity is multiplied by the appearance rate to obtain a comprehensive evaluation value.
[0059]
Next, how to determine the appearance rate will be described.
The appearance rate evaluation table 41 as an appearance rate evaluation table is a file in which the appearance frequency of 0 to 9 in each digit is set in a form depending on the previous sentence order, and the operation information file 11a as shown in FIG. Create from. The postal codes that exist in the control unit 11 and are actually processed (recognized) by the sorting machine 1 and the number of mails are tabulated and stored.
[0060]
The operation information file 11a is present in a device that manages a plurality of sorting machines for each post office, and is obtained by collecting and storing the postal codes actually processed (recognized) by each sorting machine and the number of mails. Also good.
Conventionally, the appearance rate of characters that the operator has empirically captured is replaced with statistical information obtained from an actual machine, and can be more accurately reflected in the character recognition process.
[0061]
The creation procedure is shown below.
(1) Find the number and total number of characters in the first digit. (If the total number is small, substitute with *.)
(2) Divide the number for each character type by the total number to obtain the ratio. (In the first digit, "1" is 89%, "2" is 11%)
(3) With respect to a group of characters having the same first digit, the number and total number of characters in the second digit are obtained, and the ratio is obtained. (In the case of “1” in the first digit, the 1st to 5th lines in FIG. 16 are totaled to obtain ratios “0” 67%, “1” 18%, “2” 15%)
(4) The process of (3) is repeated up to 2 to 7 digits. (When the n-th digit is processed, the calculation is performed for each group in which the previous character strings up to the (n-1) -th digit are equal.)
As a result, the appearance rate up to the first to seventh digits as shown in FIG. 17 can be obtained.
[0062]
Thereby, for example, the appearance rate evaluation table 41 as shown in FIG. 5 for the first and second digits is registered in the comprehensive evaluation unit 35.
The appearance rate evaluation table 41 is created when the sorting machine 1 is stably operated and the operation information data is sufficiently stocked (usually about one month).
[0063]
As described above, the character evaluation value reflecting the character frequency (appearance rate) is determined using the statistical information of the zip code data collected by the sorting machine installation station. The parameter adjustment for character evaluation value determination, which has been performed manually until now, is automatically performed by statistical information.
[0064]
That is, each result of the composite similarity recognition and the structural feature matching recognition is sent to a comprehensive evaluation unit, where an answer to the input character and a comprehensive evaluation value are determined. The comprehensive evaluation unit calculates an evaluation value using an appearance rate evaluation table (appearance rate evaluation table) automatically created based on statistical information of postal code data collected at a post office. In other words, the parameters are set so that numbers with high appearance frequency output high evaluation values and numbers with low appearance frequency output low evaluation values. The recognition result of the comprehensive evaluation unit is sent to the postal code editing unit, where a final 7-digit postal code candidate is output.
[0065]
Thereby, it is possible to automatically adjust the parameters used when calculating the final character evaluation value from the two types of character recognition results of the composite similarity recognition method and the structural feature matching method, regardless of the human hand.
[0066]
In addition, automating parameter adjustment using statistical information of postal code data collected by the sorting machine installation station can save a lot of labor.
Further, by reflecting known information obtained from simulations and past adjustment experiences in the table, fine adjustments using the characteristics of characters and dictionaries are possible.
[0067]
In the process of editing a plurality of postal code candidates, the total evaluation process (the process of step 26) is performed on all the previous character strings, thereby reducing the calculation amount of the all-digit recognition process.
[0068]
【The invention's effect】
  As described above in detail, according to the present invention, a location information recognition device that can achieve significant labor savings by automating parameter adjustment using statistical information of location information consisting of numeric strings collected by a sorting device.andA sorting device can be provided.
[Brief description of the drawings]
FIG. 1 is an external view showing a schematic configuration of a sorting machine for explaining an embodiment of the present invention.
FIG. 2 is a diagram showing a schematic configuration of a sorting machine.
FIG. 3 is a block diagram showing a schematic configuration of a sorting machine.
FIG. 4 is a block diagram showing a schematic configuration of a postal code recognition unit.
FIG. 5 is a diagram showing a configuration example of an appearance rate evaluation table.
FIG. 6 is a diagram showing a configuration example of a join table.
FIG. 7 is a diagram showing a configuration example of a level selection table.
FIG. 8 is a diagram showing a configuration example of a level table.
FIG. 9 is a flowchart for explaining automatic adjustment processing;
FIG. 10 is a flowchart for explaining processing when obtaining an appearance rate;
FIG. 11 is a flowchart for explaining processing when obtaining an adjustment pattern number;
FIG. 12 is a flowchart for explaining processing when a frequency level is selected.
FIG. 13 is a flowchart for explaining processing when calculating a comprehensive evaluation value;
FIG. 14 is a diagram for explaining a comprehensive evaluation score for each digit up to the third digit.
FIG. 15 is a diagram for explaining a comprehensive evaluation score (candidate reduction) for each digit up to the third digit;
FIG. 16 is a diagram for explaining the saved contents of an operation information file.
FIG. 17 is a diagram for explaining the appearance rate up to the first to seventh digits.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ... Sorting machine, P ... Mail, 15 ... Postal code recognition part, 31 ... Composite similarity recognition part, 31a ... Composite similarity dictionary, 32 ... Structural feature matching recognition part, 32a ... Structural feature matching dictionary, 33 ... Composite Similarity evaluation unit, 34 ... structural feature matching evaluation unit, 35 ... comprehensive evaluation unit, 41 ... appearance rate evaluation table, 42 ... combination table, 43 ... level selection table, 44 ... level table.

Claims (3)

紙葉類上の数字列からなる所在情報を読取る読取手段と、
この読取手段により読取った数字列の1文字ずつを参照用の各文字ごとに複数の文字パターンとの複合類似度法により認識候補文字と前記参照用の文字パターンの種別と信頼度とを出力する第1の出力手段と、
前記読取手段により読取った数字列の1文字ずつを参照用の各文字ごとに複数の構造特徴との構造特徴マッチング法により認識候補文字と前記参照用の構造特徴の種別とを出力する第2の出力手段と、
前記数字列の各桁ごとの文字の出現率を記憶するもので、前記出現率は前記数字列の手前の桁の数字に関連づけられている第1の記憶手段と、
前記第1の出力手段の出力結果と前記第2の出力手段の出力結果とに基づく、誤読される可能性高い文字と、この誤読文字の出現率と、認識文字の出現率とに対する、調整用のパラメータ番号を記憶する第2の記憶手段と、
前記第2の出力手段の出力結果に基づく、認識候補文字の出現率に対する、複数段階の頻度レベルを決定する種々の基準値を記憶する第3の記憶手段と、
前記調整用のパラメータ番号に対する各頻度レベルごとかつ信頼度ごとの評価値を記憶する第4の記憶手段と、
前記第1、第2の出力手段による各認識候補文字に対する出現率を前記第1の記憶手段から読出す第1の読出手段と、
前記第1の出力手段による認識候補文字と前記参照用の文字パターンの種別と前記第2の出力手段による認識候補文字と前記参照用の構造特徴の種別と、前記第1の読出手段により読出された各認識候補文字に対する出現率とに基づく、調整用のパラメータ番号を前記第2の記憶手段から読出す第2の読出手段と、
前記第2の出力手段による認識候補文字に対する前記出現率と、前記第2の出力手段による認識候補文字と参照用の構造特徴の種別とに対して前記第3の記憶手段に記憶されている各基準値とを比較することにより、頻度レベルを判断する第1の判断手段と、
前記第2の読出手段による調整用のパラメータ番号と前記第1の判断手段により判断された頻度レベルとにより、前記第4の記憶手段に記憶されている評価値を読出す第3の読出手段と、
前記第1、第2の出力手段による各認識候補文字に対する前記第3の読出手段により読出される評価値により、前記数字列の文字を判断する第2の判断手段と、
この第2の判断手段により判断した前記数字列の文字を収集する収集手段と、
この収集手段により収集した前記数字列の文字の収集内容に基づいて、前記第1の記憶手段に記憶されている前記数字列の各桁ごとの文字の出現率を変更する変更手段と、
を具備したことを特徴とする所在情報認識装置。
Reading means for reading location information consisting of a string of numbers on a paper sheet;
The recognition candidate character, the type of the reference character pattern, and the reliability are output by a composite similarity method with a plurality of character patterns for each character of each character string read by the reading means. First output means;
A second recognition character and a type of structural feature for reference are output by a structural feature matching method with a plurality of structural features for each character of each digit string read by the reading means. Output means;
Storing an appearance rate of characters for each digit of the digit string , wherein the appearance rate is associated with a digit of a digit before the digit sequence ;
Based on the output result of the first output means and the output result of the second output means, adjustment for the characters that are likely to be misread, the appearance rate of the misread characters, and the appearance rate of the recognized characters Second storage means for storing the parameter number of
Third storage means for storing various reference values for determining a plurality of frequency levels for the appearance rate of recognition candidate characters based on the output result of the second output means;
Fourth storage means for storing an evaluation value for each frequency level and reliability for the parameter number for adjustment;
First reading means for reading an appearance rate for each recognition candidate character by the first and second output means from the first storage means;
The recognition candidate character by the first output unit and the type of the reference character pattern, the recognition candidate character by the second output unit and the type of the structural feature for reference are read by the first reading unit. Second reading means for reading the parameter number for adjustment from the second storage means based on the appearance rate for each recognition candidate character;
Each of the appearance rates for the recognition candidate characters by the second output means and the recognition candidate characters by the second output means and the types of structural features for reference are stored in the third storage means. A first determination means for determining a frequency level by comparing with a reference value;
Third reading means for reading the evaluation value stored in the fourth storage means based on the parameter number for adjustment by the second reading means and the frequency level determined by the first determination means; ,
Second judging means for judging a character of the number string based on an evaluation value read by the third reading means for each recognition candidate character by the first and second output means;
A collecting means for collecting the characters of the numeric string determined by the second determining means;
Based on the collected contents of the characters of the numeric string collected by the collecting means, changing means for changing the appearance rate of the characters for each digit of the numeric string stored in the first storage means;
A location information recognition apparatus characterized by comprising:
紙葉類上の数字列からなる所在情報を読取る読取手段と、
この読取手段により読取った数字列の1文字ずつを参照用の各文字ごとに複数の文字パターンとの複合類似度法により認識候補文字と前記参照用の文字パターンの種別と信頼度とを出力する第1の出力手段と、
前記読取手段により読取った数字列の1文字ずつを参照用の各文字ごとに複数の構造特徴との構造特徴マッチング法により認識候補文字と前記参照用の構造特徴の種別とを出力する第2の出力手段と、
前記第1の出力手段の出力結果と前記第2の出力手段の出力結果とに基づいて、前記数字列の文字を判断する第1の判断手段と、
この第1の判断手段により判断した前記数字列の文字を収集する収集手段と、
この収集手段により収集した前記数字列の文字の収集内容に基づいて、前記数字列の各桁ごとの文字の出現率を記憶する第1の記憶手段と、
前記第1の出力手段の出力結果と前記第2の出力手段の出力結果とに基づく、誤読される可能性高い文字と、この誤読文字の出現率と、認識文字の出現率とに対する、調整用のパラメータ番号を記憶する第2の記憶手段と、
前記第2の出力手段の出力結果に基づく、認識候補文字の出現率に対する、複数段階の頻度レベルを決定する種々の基準値を記憶する第3の記憶手段と、
前記調整用のパラメータ番号に対する各頻度レベルごとの評価値を記憶する第4の記憶手段と、
前記第1、第2の出力手段による各認識候補文字に対する出現率を前記第1の記憶手段から読出す第1の読出手段と、
前記第1の出力手段による認識候補文字と前記参照用の文字パターンの種別と前記第2の出力手段による認識候補文字と前記参照用の構造特徴の種別と、前記第1の読出手段により読出された各認識候補文字に対する出現率とに基づく、調整用のパラメータ番号を前記第2の記憶手段から読出す第2の読出手段と、
前記第2の出力手段による認識候補文字に対する前記出現率と、前記第2の出力手段による認識候補文字と参照用の構造特徴の種別とに対して前記第3の記憶手段に記憶されている各基準値とを比較することにより、頻度レベルを判断する第2の判断手段と、
前記第2の読出手段による調整用のパラメータ番号と前記第2の判断手段により判断された頻度レベルとにより、前記第4の記憶手段に記憶されている評価値を読出す第3の読出手段と、
前記第1、第2の出力手段による各認識候補文字に対する前記第3の読出手段により読出される評価値により、前記数字列の文字を判断する第3の判断手段と、
を具備したことを特徴とする所在情報認識装置。
Reading means for reading location information consisting of a string of numbers on a paper sheet;
The recognition candidate character, the type of the reference character pattern, and the reliability are output by a composite similarity method with a plurality of character patterns for each character of each character string read by the reading means. First output means;
A second recognition character and a type of structural feature for reference are output by a structural feature matching method with a plurality of structural features for each character of each digit string read by the reading means. Output means;
First determination means for determining characters of the numeric string based on the output result of the first output means and the output result of the second output means;
A collecting means for collecting the characters of the numeric string determined by the first determining means;
First storage means for storing an appearance rate of characters for each digit of the numeric string based on the collected contents of the characters of the numeric string collected by the collecting means;
Based on the output result of the first output means and the output result of the second output means, adjustment for the characters that are likely to be misread, the appearance rate of the misread characters, and the appearance rate of the recognized characters Second storage means for storing the parameter number of
Third storage means for storing various reference values for determining a plurality of frequency levels for the appearance rate of recognition candidate characters based on the output result of the second output means;
Fourth storage means for storing an evaluation value for each frequency level with respect to the parameter number for adjustment;
First reading means for reading an appearance rate for each recognition candidate character by the first and second output means from the first storage means;
The recognition candidate character by the first output unit and the type of the reference character pattern, the recognition candidate character by the second output unit and the type of the structural feature for reference are read by the first reading unit. Second reading means for reading the parameter number for adjustment from the second storage means based on the appearance rate for each recognition candidate character;
Each of the appearance rates for the recognition candidate characters by the second output means and the recognition candidate characters by the second output means and the types of structural features for reference are stored in the third storage means. A second determination means for determining a frequency level by comparing with a reference value;
Third reading means for reading the evaluation value stored in the fourth storage means based on the parameter number for adjustment by the second reading means and the frequency level determined by the second determination means; ,
Third judging means for judging the character of the numeric string based on the evaluation value read by the third reading means for each recognition candidate character by the first and second output means;
A location information recognition apparatus characterized by comprising:
請求項1または請求項2に記載された所在情報認識装置を用いて紙葉類上の数字列からなる所在情報を認識し、その認識結果に基づき前記紙葉類を区分処理することを特徴とする区分装置。 Recognizing location information consisting of a number string on a paper sheet using the location information recognition apparatus according to claim 1 or 2, and sorting the paper sheet based on the recognition result. Sorting equipment to do.
JP2001172796A 2001-06-07 2001-06-07 Location information recognition device and sorting device Expired - Fee Related JP4733859B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001172796A JP4733859B2 (en) 2001-06-07 2001-06-07 Location information recognition device and sorting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001172796A JP4733859B2 (en) 2001-06-07 2001-06-07 Location information recognition device and sorting device

Publications (2)

Publication Number Publication Date
JP2002366898A JP2002366898A (en) 2002-12-20
JP4733859B2 true JP4733859B2 (en) 2011-07-27

Family

ID=19014360

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001172796A Expired - Fee Related JP4733859B2 (en) 2001-06-07 2001-06-07 Location information recognition device and sorting device

Country Status (1)

Country Link
JP (1) JP4733859B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5390440B2 (en) * 2010-03-17 2014-01-15 株式会社東芝 Centralized information processing apparatus and centralized information processing system
JP6335012B2 (en) * 2014-04-30 2018-05-30 グローリー株式会社 Character presence determination system and character presence determination method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05298489A (en) * 1992-04-20 1993-11-12 N T T Data Tsushin Kk System for recognizing character
JPH0644401A (en) * 1992-07-24 1994-02-18 Toshiba Corp Postal matter processor
JPH07271899A (en) * 1994-03-31 1995-10-20 Toshiba Corp Character recognition device
JPH07271920A (en) * 1994-03-31 1995-10-20 Toshiba Corp Character recognizing device
JPH0935006A (en) * 1995-07-18 1997-02-07 Fujitsu Ltd Character recognition device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05298489A (en) * 1992-04-20 1993-11-12 N T T Data Tsushin Kk System for recognizing character
JPH0644401A (en) * 1992-07-24 1994-02-18 Toshiba Corp Postal matter processor
JPH07271899A (en) * 1994-03-31 1995-10-20 Toshiba Corp Character recognition device
JPH07271920A (en) * 1994-03-31 1995-10-20 Toshiba Corp Character recognizing device
JPH0935006A (en) * 1995-07-18 1997-02-07 Fujitsu Ltd Character recognition device

Also Published As

Publication number Publication date
JP2002366898A (en) 2002-12-20

Similar Documents

Publication Publication Date Title
US20060291692A1 (en) Information processing apparatus having learning function for character dictionary
JPS62221088A (en) Optical type character reader
JP4733859B2 (en) Location information recognition device and sorting device
JPH0739820A (en) Street zone recognizing device and address reading and classifying machine
JP3710866B2 (en) Mail sorting apparatus, mail processing system, and mail processing method
JP3243000B2 (en) Mail processing apparatus and mail processing method
JPH07271899A (en) Character recognition device
JPH0957199A (en) Address reading apparatus and mail-sorting apparatus
JP3788703B2 (en) Voting paper counting and sorting device, preset device and method for voting paper counting and sorting device, and medium on which preset program for voting paper counting and sorting device is recorded
JP2001025713A (en) Posta sorting mail system
JP3160347B2 (en) Mail address reading device
JP3450608B2 (en) Address recognition device, address recognition method, sorting device, sorting method
JPH0484289A (en) Pattern recognizing device
JP3088038B2 (en) Mail sorting device and mail sorting method
JPH11253891A (en) Mail sorting method and device
JP2988784B2 (en) Mail handling equipment
JP2003141443A (en) Recognizing device, sorter, recognizing method and sorting method
JPH0739816A (en) Address reading device
JP2002254037A (en) Method and device for avoiding misdelivery of mail
JPH0757058A (en) Character recognition device and method
JPH1190339A (en) Sorting machine and sorting system
JPH1034089A (en) Video coding device
JPH1190338A (en) Address reader and address reading
JPH05324899A (en) Recognizing device for address written on mail
JPH07182451A (en) Character recognition device, word recognizer and mail address reading/sorting device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110425

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140428

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140428

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees