JP2004188299A - 紙葉類処理装置及び紙葉類処理方法 - Google Patents
紙葉類処理装置及び紙葉類処理方法 Download PDFInfo
- Publication number
- JP2004188299A JP2004188299A JP2002358338A JP2002358338A JP2004188299A JP 2004188299 A JP2004188299 A JP 2004188299A JP 2002358338 A JP2002358338 A JP 2002358338A JP 2002358338 A JP2002358338 A JP 2002358338A JP 2004188299 A JP2004188299 A JP 2004188299A
- Authority
- JP
- Japan
- Prior art keywords
- destination area
- destination
- sheet
- algorithm
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】この発明は、バルク紙葉類における宛先領域を、確実、かつ、高精度に検出し、処理対象となるバルク紙葉類における宛先領域を人手による手間をかけることなく設定できる。
【解決手段】この発明は、複数のバルク紙葉類に対して種々のアルゴリズムによる宛先領域の検出処理を行って、当該バルク紙葉類における宛先領域を検出し、検出した宛先領域を処理対象とするバルク紙葉類の宛先領域として設定するようにしたものである。
【選択図】 図1
【解決手段】この発明は、複数のバルク紙葉類に対して種々のアルゴリズムによる宛先領域の検出処理を行って、当該バルク紙葉類における宛先領域を検出し、検出した宛先領域を処理対象とするバルク紙葉類の宛先領域として設定するようにしたものである。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
この発明は、例えば、郵便物などの紙葉類から宛先情報等の文字列が記載されている面を読取り、読取った画像に対する文字認識を行って区分処理を行う紙葉類処理装置及び紙葉類処理方法に関する。
【0002】
【従来の技術】
従来、紙葉類処理装置では、紙葉類に記載されている宛先情報を認識してその認識結果に基づき紙葉類を区分処理する。上記のような紙葉類処理装置では、ダイレクトメールなどのような一時期に大量に発生するバルクと呼ばれる紙葉類(バルク紙葉類)を処理することがある。このようなバルク紙葉類は、通常、同一種類のバルク紙葉類において、宛先情報が記載されている領域が一定であるという特徴がある。このような特徴を利用して、従来の紙葉類処理装置では、バルク紙葉類に対する宛先領域の認識率を向上させ、かつ、認識処理を効率化するために、バルク紙葉類における宛先情報が記載されている宛先領域を予め設定し、その宛先領域に対して宛先情報の認識処理を行うようになっている。このようなバルク紙葉類に対する処理を行う場合には、バルク紙葉類における宛先領域を正確に設定する必要がある。従来の紙葉類処理装置では、オペレータの操作により宛先領域を指定するものがあるが、宛先領域を人手により指定する操作が煩雑であるという問題点がある。
【0003】
また、上記のようなバルク紙葉類の宛先領域を人手によらずに設定するには、紙葉類処理装置が宛先領域を確実に検出する必要がある。例えば、宛先領域を検出する手法としては、特開2000−210624号公報では、文字列末尾の敬称の有無、文字列の印刷の色、濃度、またはサイズの相違などの文字列の特質に基づいて宛名領域の検出を行うものが提案されている。
【0004】
しかしながら、上記特開2000−210624号公報では、宛先情報としての文字列が持つであろう特質が検出できない場合には、宛先領域の特定が困難になるという問題点がある。また、上記特開2000−210624号公報では、宛先領域の候補となる領域候補を検出し、各領域候補に対して文字認識を行って、文字列が持つであろう特質を検出するようにしているため、宛先領域が領域候補として検出されなかった場合には宛先領域を検出することができないという問題点もある。
【0005】
【特許文献1】
特開2000−210624号公報
【発明が解決しようとする課題】
この発明は、処理対象とする紙葉類における宛先領域を設定するには紙葉類に対する宛先領域を確実に検出しなければならいないという問題点を解決するもので、処理対象とする紙葉類における宛先領域を確実に検出することができる紙葉類処理装置及び紙葉類処理方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
この発明の紙葉類処理装置は、紙葉類を1通づつ供給する供給手段と、この供給手段により供給された紙葉類の画像を読取る読取手段と、前記供給手段により複数枚の紙葉類を1通づつ供給し、前記読取手段により読み取った複数枚の紙葉類の画像を蓄積する蓄積手段と、この蓄積手段により蓄積した紙葉類の画像における宛先領域を第1のアルゴリズムにより検出する第1の宛先領域検出手段と、前記蓄積手段により蓄積した紙葉類の画像における宛先領域を前記第1のアルゴリズムとは異なる第2のアルゴリズムにより検出する第2の宛先領域検出手段と、前記第1の宛先領域検出手段あるいは第2の宛先領域検出手段により検出された宛先領域を設定する設定手段と、前記供給手段により紙葉類を1通づつ供給し、前記読取手段により読み取った紙葉類の画像に対して前記設定手段により設定された宛先領域から宛先情報を認識する認識手段と、この認識手段により認識された宛先情報に基づいて紙葉類を区分する区分手段とを有する。
【0007】
この発明の紙葉類処理装置は、紙葉類を1通づつ供給する供給手段と、この供給手段により供給された紙葉類の画像を読取る読取手段と、この読取手段により読み取った紙葉類の画像から宛先情報を所定時間内に認識するオンライン認識手段と、このオンライン認識手段により認識された宛先情報に基づいて紙葉類を区分する区分手段と、前記オンライン認識手段により宛先情報が認識できなかった紙葉類の画像の宛先情報を前記オンライン認識手段とは異なる認識方法にて認識するオフライン認識手段とを有するものであって、前記供給手段により複数枚の紙葉類を1通づつ供給し、前記読取手段により読み取った複数枚の紙葉類の画像を蓄積する蓄積手段と、この蓄積手段により蓄積した紙葉類の画像に対する宛先領域を前記オフライン認識手段に第1のアルゴリズムを適用して検出する第1の宛先領域検出手段と、前記蓄積手段により蓄積した紙葉類の画像に対する宛先領域を前記オフライン認識手段に前記第1のアルゴリズムとは異なる第2のアルゴリズムを適用して検出する第2の宛先領域検出手段と、前記第1の宛先領域検出手段あるいは第2の宛先領域検出手段により検出された宛先領域を前記オンライン認識手段による宛先情報の認識処理を行う領域として設定する設定手段とを有する。
【0008】
この発明の紙葉類処理方法は、紙葉類を1通づつ供給する供給手段と、この供給工程により供給された紙葉類の画像を読取る読取手段とを有する紙葉類処理装置に用いられる方法であって、前記供給手段により複数枚の紙葉類を1通づつ供給し、前記読取手段により読み取った複数枚の紙葉類の画像を蓄積手段に蓄積する蓄積工程と、前記蓄積手段に蓄積した紙葉類の画像における宛先領域を第1のアルゴリズムにより検出する第1の宛先領域検出工程と、前記蓄積手段に蓄積した紙葉類の画像における宛先領域を前記第1のアルゴリズムとは異なる第2のアルゴリズムにより検出する第2の宛先領域検出工程と、前記第1の宛先領域検出工程あるいは前記第2の宛先領域検出工程により検出された宛先領域を設定する設定工程と、前記供給手段により紙葉類を1通づつ供給し、前記読取手段により読み取った紙葉類の画像に対して前記設定工程により設定された宛先領域から宛先情報を認識する認識工程と、この認識工程により認識された宛先情報に基づいて紙葉類を区分する区分工程とを有する。
【0009】
この発明の紙葉類処理方法は、紙葉類を1通づつ供給する供給手段と、この供給手段により供給された紙葉類の画像を読取る読取手段と、この読取手段により読み取った紙葉類の画像から宛先情報を所定時間内に認識するオンライン認識手段と、このオンライン認識手段により認識された宛先情報に基づいて紙葉類を区分する区分手段と、前記オンライン認識手段により宛先情報が認識できなかった紙葉類の画像の宛先情報を前記オンライン認識手段とは異なる認識方法にて認識するオフライン認識手段とを有する紙葉類処理装置に用いられる方法であって、前記供給手段により複数枚の紙葉類を1通づつ供給し、前記読取手段により読み取った複数枚の紙葉類の画像を蓄積手段に蓄積する蓄積工程と、前記蓄積手段に蓄積した紙葉類の画像に対する宛先領域を前記オフライン認識手段に第1のアルゴリズムを適用して検出する第1の宛先領域検出手段と、前記蓄積手段に蓄積した紙葉類の画像に対する宛先領域を前記オフライン認識手段に前記第1のアルゴリズムとは異なる第2のアルゴリズムを適用して検出する第2の宛先領域検出手段と、前記第1の宛先領域検出手段あるいは第2の宛先領域検出手段により検出された宛先領域を前記オンライン認識手段による宛先情報の認識処理を行う領域として設定する設定工程とを有する。
【0010】
【発明の実施の形態】
以下、この発明の実施の形態について図面を参照して説明する。
図1は、この発明に係わる紙葉類処理装置としての区分システムの概略構成を示す図である。
この区分システムは、図1に示すように、読取区分機本体(区分機)1とVCS(ビデオコーディングシステム)2とから構成されている。上記読取区分機本体1は、紙葉類の区分先を示す情報(区分情報、宛先情報)を認識して区分するものである。また、上記VCS2は、上記区分機1にて区分情報が認識できなかった紙葉類の区分情報を上記区分機1とは異なる認識処理により認識したり、オペレータのコーディング作業により入力したりするものである。
【0011】
まず、上記読取区分機本体1について説明する。
図1に示すように、読取区分機本体1は、前面にオペレーションパネル3が設けられている搬送区分部本体1aを有している。上記オペレーションパネル3は、タッチパネル内蔵の表示装置などにより構成される。上記オペレーションパネル3は、オペレータ(操作員)が処理モードや処理開始を指定したり、区分機の動作状態などを表示したりするものである。
【0012】
上記搬送区分部本体1aには、第1面に区分先を示す情報としての数字や文字などが書き込まれ、あるいは印刷された複数通(複数枚)の紙葉類を、この第1面が同一方向を向くように揃えて立位で収容するとともに、これらの紙葉類を所定の取出位置へ順次供給する供給部(供給手段)11を備えている。この供給部11は、紙葉類を主搬送路12に沿って所定の間隔で一通づつ取出す取出部(図示しない)が配設されている。
【0013】
上記供給部11に供給される紙葉類には、その第1面に区分先を示す情報に対応した文字情報が記載されたもの以外に、機械コードとして大口の区分先に予め決められているカスタマコードや紙葉類の区分先に対応して区分機内で決められる局内バーコード、または後述するオンラインOCR18にて区分情報の認識が不能となった紙葉類に付与されるIDコードなどが記載されたものがある。尚、これらの各コードは、バーコード化した情報として紙葉類の第1面に付与されるものである。
【0014】
上記供給部11に供給されている紙葉類は、一定間隔で取出されて、一定速度で搬送する主搬送路12により一定の搬送間隔(ピッチ)で搬送される。主搬送路12上を搬送される紙葉類は、機械処理が不可能な異物の場合には排除され、機械処理が可能な紙葉類のみが搬送される。
【0015】
主搬送路12上には、スキャナ部(読取手段)13、バーコード読取部(B/R)14、バーコードプリンタ部(B/W)15、および区分部(区分手段)16が設けられている。上記スキャナ部13は、主搬送路12上の紙葉類の区分先を示す情報が記載されている面を読取り、その読取画像をオンラインOCR(認識手段、オンライン認識手段)18及びVCS2へ送信するものである。上記バーコード読取部14は、主搬送路12上を搬送される紙葉類の第1面にIDコードあるいは機械コードなどのバーコードが付与されている場合に、そのバーコードを読取るものである。
【0016】
上記バーコードプリンタ部15は、必要に応じて紙葉類の第1面にIDコード、あるいは機械コードを印刷するものである。これは、オンラインCOR18により区分情報が認識できた場合に、その区分情報をバーコード化して紙葉類上に機械コードを印刷し、オンラインOCR18により区分情報が認識できなかった場合に、IDコードを印刷するものである。
【0017】
このバーコードプリンタ部15の紙葉類の搬送方向の下流側には、主搬送路12上を搬送されてきた紙葉類が区分先に応じて区分される区分部16が設けられている。この区分部16は、複数の段、複数の列に区画された複数の区分ポケット(図示しない)から構成されている。各ポケットは、区分先ごとに対応して設定されており、区分情報あるいは機械コードに基づいて、紙葉類が区分情報に対応したポケットに順次集積される。また、区分部16には、区分先が認識できなかった紙葉類が集積されるVCS排除ポケット(図示しない)が設けられている。このVCS排除ポケットに集積された紙葉類は、区分情報がVCS2にて入力された後に、上記供給部11に再供給され、当該紙葉類のIDコードと上記VCS2にて入力された区分情報とに基づいて再区分されるようになっている。
【0018】
また、図1に示すように、上記読取区分機本体1の各部は、制御部(設定手段)17により制御される。この制御部17には、オペレーションパネル3、供給部11、スキャナ部13、バーコード読取部14、バーコードプリンタ部15、区分部16、オンラインOCR18、及びVCS制御部19等が接続されている。
【0019】
上記オンラインOCR18には、スキャナ部13から紙葉類の区分情報が記載されている第1面を光学的に読み取った画像が供給される。上記オンラインOCR18は、供給された紙葉類の画像から紙葉類の区分情報を認識するものである。このオンラインOCR18は、読み取られた画像から宛先領域を検出し、その宛先領域から区分情報となる文字を切り出して文字認識を行い、図示しない文字辞書および住所辞書と比較してマッチング法などによって区分情報の認識を行う。また、上記オンラインOCR18は、処理対象の紙葉類に対する宛先領域が予め設定されている場合、その設定された宛先領域に基づいて紙葉類の画像における区分情報を認識する。
【0020】
また、上記オンラインOCR18では、区分機本体1a内を搬送される紙葉類が区分可能な所定時間内に認識処理を行うようになっている。このため、上記オンラインOCR18での認識処理では、処理時間の制約が厳しいため、所定時間内で認識結果が得られる認識アルゴリズムによる認識方法が採用されている。このオンラインOCR18による認識の可否は、制御部17へ返信されるようになっている。
【0021】
また、上記オンラインOCR18は、紙葉類の画像から区分情報が認識できなかった場合、紙葉類の画像に対する付帯情報として紙葉類の大きさ、文字の大きさ、文字の向き、区分先を示す情報の表記方向、文字種、認識深度、VCS2による処理が必要な箇所を示す情報等のOCR情報(宛先種別データ)を生成し、上記VCS2へ転送するようにしても良い。この場合、上記VCS2では、上記オンラインOCR(オンライン認識手段)18からの付帯情報を活用してコーディング作業あるいはオフラインOCR(オフライン認識手段)31による認識処理が行われる。
【0022】
また、上記区分システムは、種々の動作モードを有している。これらの区分システムの動作モードは、上記オペレーションパネル3によりオペレータが選択指示するものである。例えば、一時期に大量に発生する同一フォーマットのダイレクトメールなどのバルクと呼ばれる紙葉類(以下、バルク紙葉類と称する)を区分処理する動作モードは、バルクモードと呼ばれる。上記バルクモードでは、当該バルク紙葉類に対する宛先領域が予め設定され、その設定された宛先領域に対して上記オンラインOCR18が宛先情報の認識処理を行うことによりバルク紙葉類を区分処理するようになっている。
【0023】
次に、VCS2について説明する。
上記VCS2は、図1に示すように、VCS制御部19、複数のビデオコーディング端末(以下、VCDと称する)30、及びオフラインOCR(オフライン認識手段)31などから構成されている。
上記VCS制御部19は、上記読取区分機本体1で認識できなかった紙葉類の画像などをVCD30あるいはオフラインOCR31へ供給し、上記VCD30あるいは上記オフラインOCR31による処理結果を上記読取区分機本体1へ返す制御を行うものである。また、上記VCS2は、例えば、上記VCD30により紙葉類の区分情報のコーディング処理を行う画像送信機能(VCDモード)と上記オフラインOCR31により紙葉類の区分情報を認識するオフラインOCR処理機能(オフラインOCRモード)とを有しているものとする。上記VCS制御部19は、上記VCDモードの場合には上記VCD30に紙葉類の画像等を送信し、上記オフラインOCRモードの場合には上記オフラインOCR31へ紙葉類の画像等を送信するようになっている。
【0024】
上記VCS制御部19には、上記区分機本体1のスキャナ部13及びオンラインOCR18などが接続されている。上記VCS制御部19は、例えばパーソナルコンピュータ(PC)と同様な構成を有し、画像制御部20及び記憶部21を有している。上記画像制御部20は、上記オンラインOCR18にて認識できなかった紙葉類の画像を上記記憶部21に蓄積したり、上記記憶部21に蓄積された紙葉類の画像をVCD30やオフラインOCR31へ送信したりする制御を行うようになっている。
【0025】
上記VCD30は、ディスプレイやキーボードなどを有し、例えばPCと同様な構成を有している。上記VCD30では、上記VCS制御部19から分配される紙葉類の画像をディスプレイなどに表示し、この表示された画像に基づいてオペレータがキーボードにより区分先を示す情報を入力するものである。
【0026】
上記オフラインOCR31は、上記VCS制御部19から供給された紙葉類の画像に対して宛先情報の認識処理あるいは宛先領域の検出処理などを行うものである。上記オフラインOCR31では、上記オンラインOCR18とは異なるアルゴリズムにてOCR処理を行うようになっている。上記オフラインOCR31での認識処理では、上記オンラインOCR18での認識処理に比べて処理時間の制約が緩和される。つまり、上記オフラインOCR31での認識処理は、上記オンラインOCR18での認識処理よりも多くの処理時間をかけることが可能であるため、種々のアルゴリズムで上記オンラインOCR18よりも高精度な認識処理を行うことができる。
【0027】
上記オフラインOCR31は、図1に示すように、制御ユニット32及び複数の認識ユニット33(33a、33b、…)(第1の宛先領域検出手段、第2の宛先領域検出手段)からなる構成を有している。上記制御ユニット32は、上記VCS制御部19からの紙葉類の画像などのデータを各認識ユニット33へ送信し、各認識ユニット33による認識結果を制御部17へ送信する制御を行うものである。上記制御ユニット32は、VCS制御部19からの紙葉類の画像などのデータを蓄積する記憶部(蓄積手段)32aを有している。上記記憶部32aには、複数通分の紙葉類の画像などのデータが記憶可能である。また、各認識ユニット(第1、第2の宛先領域検出手段)33は、上記制御ユニット32から供給される紙葉類の画像に対して宛先情報の認識処理あるいは宛先領域の検出処理を実行するものである。各認識ユニット33では、上記制御ユニット32による制御に基づいて種々のアルゴリズムにて紙葉類の画像における宛先領域を検出する処理を行うようになっている。
【0028】
すなわち、上記オフラインOCR31では、複数の認識ユニット33にてそれぞれ異なったアルゴリズムで宛先情報の認識処理や宛先領域の検出処理を行うことが可能である。上記制御ユニット32は、各認識ユニット33に対して処理を行うアルゴリズムを指定し、上記記憶部32aに蓄積した紙葉類の画像を各認識ユニット33へ分配することができる。従って、各認識ユニット33では、複数通分の紙葉類の画像を用いて種々のアルゴリズムにより宛先領域の検出処理を行うことが可能である。
【0029】
図2、図3及び図4は、当該区分システムにて処理対象とする紙葉類の例を示す図である。
図2、図3及び図4に示す紙葉類には、宛先情報、差出人情報、及び広告情報などが記載されている。上記宛先情報は、宛先の郵便番号、住所及び氏名などの情報からなる。上記宛先情報は、紙葉類上の宛先領域A内に記載されている情報である。上記差出人情報は、差出人の郵便番号、住所及び氏名などの情報からなる。上記差出人情報は、紙葉類上の差出人住所領域B内に記載されている情報である。上記広告情報は、上記宛先情報とは無関係の図柄や広告文字などからなる。上記広告情報は、紙葉類上の広告領域Cに記載されている情報である。
【0030】
上記宛先情報、差出人情報、及び広告情報は、紙葉類上の任意の位置に記載される可能性がある。このため、上記宛先領域A、差出人住所領域B、及び広告領域Cは、通常、異なった種類の紙葉類に対してはどのような位置であるかを予め決めておくことができない。
【0031】
一般的な紙葉類に対する認識処理では、宛先領域の候補となる候補領域を検出し、それらの候補領域から最も宛先情報らしい情報が記載されている候補領域を宛先領域として判定するようになっている。例えば、候補領域の大きさ、及び候補領域の位置に基づいて宛先領域らしい領域を判定する。また、紙葉類上の一部に半透明な窓部分が設けられている場合には、窓部分の領域を宛先領域と判定することもある。
【0032】
また、一時的に大量に発生する同一フォーマットのバルク紙葉類では、通常、同種のバルク紙葉類であれば、宛先情報、差出人情報、及び広告情報が同じ位置に記載され、さらに、宛先情報以外の差出人情報及び広告情報が同じ情報である。つまり、同種のバルク紙葉類では、宛先領域、差出人住所領域及び広告領域が一定の位置に存在し、かつ、宛先情報のみが変化するという特徴がある。このようなバルク紙葉類を処理する場合、当該区分システムでは、動作モードをバルクモードとし、上記オンラインOCR18に対して処理するバルク紙葉類における宛先領域の位置を予め設定し、その設定した領域に対して認識処理を行うようになっている。
【0033】
上記のようなバルク紙葉類上の宛先領域は、従来の区分システムでは、オペレータの操作(手作業)によって指定するようになっている。しかしながら、宛先領域を指定する操作が面倒であるため、オペレータによる宛先領域の指定なしで区分処理が開始されてしまうこともある。このような場合、オンラインOCR18による宛先情報の認識率が低下し、区分処理の処理効率が悪くなることがある。このため、本実施の形態では、オフラインOCR31にてバルク紙葉類における宛先領域を判定し、その判定結果を宛先領域として設定するものである。
【0034】
次に、上記のようなバルク紙葉類に対する宛先領域の検出処理に用いられるアルゴリズムの例について説明する。
まず、上記バルク紙葉類に対する宛先領域の検出処理の一例としての第1のアルゴリズムについて説明する。
ここで、図2に示す紙葉類と図3に示す紙葉類とが同一種類のバルク紙葉類であるとする。この場合、図2及び図3に示すバルク紙葉類では、宛先領域、差出人住所領域、及び広告領域の位置が同じであり、かつ、宛先領域内に記載される宛先情報のみが異なる。例えば、図2に示すバルク紙葉類と図3に示すバルク紙葉類との2通のバルク紙葉類から読み取った画像データをそれぞれ2値化し、それらの画像データの差分をとった差分データ(差分画像)を算出する。2通のバルク紙葉類の画像では、宛先情報のみが異なっているため、上記差分画像には、図5に示すように、宛先情報の一部のみが画素として残る。つまり、図5に示す差分画像では、宛先情報の一部の画素のみが現れている。
【0035】
すなわち、第1のアルゴリズムは、複数通分のバルク紙葉類の画像から差分画像を算出し、その差分画像から宛先情報らしい画素の領域を宛先領域として判定するものである。この第1のアルゴリズムを用いた宛先領域の検出処理では、各バルク紙葉類に対する読取り位置全く同一であれば(紙葉類の端点などの読取り画像における紙葉類上の基準位置が一致していれば)、宛先情報の一部のみを正確に検出できる。
【0036】
しかしながら、第1のアルゴリズムによる宛名領域の検出処理では、各バルク紙葉類に対する読取位置が微妙にずれた場合、上記差分画像には、宛先情報以外の差出人情報や広告情報などの一部が現れることになり、宛先領域を正確に検出できないことがある。また、各バルク紙葉類上の広告情報や差出情報などの印刷位置にばらつきがある場合にも、上記差分画像には、宛先情報以外の差出人情報や広告情報などの一部が差分画像に現れることになり、宛先領域を正確に検出できないことがある。
【0037】
次に、上記バルク紙葉類に対する宛先情報の認識処理の一例としての第2のアルゴリズムについて説明する。
ここで、図4に示す紙葉類がバルク紙葉類であるとする。図4に示すバルク紙葉類は、宛先情報と差出人情報とが同じような大きさの領域に記載されている。この場合、図4に示すようなバルク紙葉類では、宛先領域、及び差出人住所領域の位置が同じであり、かつ、宛先領域内に記載される宛先情報のみが異なる。例えば、2通のバルク紙葉類から読み取った画像に対して、それぞれ宛先候補領域を検出し、それらの宛先候補領域について認識処理を行う。すると、バルク紙葉類の画像からは、それぞれ、宛先情報と差出人情報とが認識される。
【0038】
つまり、1通目の紙葉類の画像から検出された2つの情報(宛先情報と差出人情報)と2通目の紙葉類の画像から認識された2つの情報(宛先情報と差出人情報)とを比較すると、差出人情報が同一であり、かつ、宛先情報が異なることから、宛先情報が判定できる。さらに、2通の紙葉類の画像における認識結果から宛先情報が確定すると、その宛先情報を得た領域を宛先領域とすることにより、バルク紙葉類に対する宛先領域を確定できる。
【0039】
すなわち、第2のアルゴリズムでは、複数枚のバルク紙葉類の画像から検出される全ての宛先領域候補に対して認識処理を行って、各バルク紙葉類の画像から得られた認識結果のうち、異なる認識結果が得られた領域を宛先領域と判断するものである。この第2のアルゴリズムによれば、文字などの広告が記載されているバルク紙葉類であっても、広告領域からの認識結果が同じになるため、広告情報を宛先領域として誤検出することがない。
しかしながら、第2のアルゴリズムによる宛名領域の検出処理では、複数のバルク紙葉類の画像から検出される全ての宛先候補領域に対して認識処理を行うため、処理に要する時間が長くなり、処理効率が悪いということもある。
【0040】
上記のような第1のアルゴリズム及び第2のアルゴリズムによる宛先領域の検出処理によれば、同一フォーマットを有する複数のバルク紙葉類の画像を用いて宛先領域を検出することにより、バルク紙葉類上のフォーマットが持つ宛先情報のみが変化するという特徴に基づいてバルク紙葉類上の宛名領域の検出精度をあげることが可能である。
【0041】
また、上記バルク紙葉類に対する宛先領域の検出処理に用いられるその他のアルゴリズムについて説明する。
例えば、バルク紙葉類では、透明な窓部分に宛先情報が記載されているものが多い。このため、窓部分の境界となる部分に対して微分処理を行うことにより窓領域を検出し、宛先領域を判定するアルゴリズムもある。また、このようなアルゴリズムでは、窓部分の境界を検出するための微分値を取って行うため、その微分処理の方法を変更することにより種々の変形が可能である。しかしながら、このような窓部分の境界に基づいて宛名領域を検出する認識アルゴリズムは、バルク紙葉類に窓部分が存在する場合にのみ、適用可能である。また、このアルゴリズムでは、窓部分の境界が読取画像上にはっきりと現れないバルク紙葉類に対しては宛先領域を誤検出してしまう可能性が高くなる。
【0042】
さらに、上記以外のバルク紙葉類における宛先領域を検出する処理のアルゴリズムの例としては、通常の認識処理において宛先領域を検出する処理に適用されるアルゴリズムのパラメータを種々の値に変更することにより種々のアルゴリズムを実現することも可能である。
【0043】
上記したように、種々のアルゴリズムでは、上記のような長所と短所とがあるため、種々のバルク紙葉類に対してどの認識アルゴリズムが宛先領域を検出するのに最適であるかを予め特定することができない。従って、本実施の形態では、複数種類のアルゴリズムを実行してバルク紙葉類に対する宛先領域を確実に検出するようにしたものである。
【0044】
次に、バルク紙葉類に対する宛先領域を検出する第1の動作例について説明する。
図6は、上記オフラインOCR31にてバルク紙葉類における宛先領域の検出して設定する処理を説明するためのフローチャートである。
まず、複数のバルク紙葉類を供給部11にセットしてバルクモードによる動作開始を指示すると、上記供給部11から複数のバルク紙葉類が一通ずつ取出され、搬送部12により搬送される。この搬送部12により搬送される複数のバルク紙葉類の画像は、上記スキャナ部13にて順次読み取られる。このスキャナ部13にて読み取られたバルク紙葉類の画像は、順次、上記VCS制御部19へ転送される。これにより、上記VCS制御部19の記憶部21には、紙葉類の画像が蓄積される。
【0045】
上記スキャナ部13からバルク紙葉類の画像が供給されると、上記VCS制御部19は、当該VCS2の動作モードをオフラインOCRモードとし、上記画像制御部20により上記記憶部21に記憶された紙葉類の画像を順次オフラインOCR31へ転送する。
上記VCS制御部19からバルク紙葉類の画像を受信した上記オフラインOCR31の制御ユニット32は、まず、上記第1のアルゴリズムによる宛先領域の検出処理の実行を判断する(ステップS11)。ここで、第1のアルゴリズムとしては、上述した2通分の紙葉類の画像に対する差分画像に基づいて宛先領域の検出処理を行うものとする。
【0046】
上記第1のアルゴリズムによる宛先領域の検出処理を実行する場合、上記制御ユニット32は、バルク紙葉類に対する宛先領域の検出処理のアルゴリズムとして上記第1のアルゴリズムを指定して2通分のバルク紙葉類の画像を認識ユニット33に送信する。2通分のバルク紙葉類の画像を受信した認識ユニット33は、図示しない記憶部に2通分のバルク紙葉類の画像を記憶し、上記第1のアルゴリズムによる宛先領域の検出処理を行う。
【0047】
すなわち、上記認識ユニット33は、上記第1のアルゴリズムによる宛先領域の検出処理として、2通分のバルク紙葉類の画像の差分データを算出し(ステップS12)、差分データから宛先領域らしい領域を検出する(ステップS13)。この検出結果は、当該認識ユニット33から上記制御ユニット32へ送信される。上記第1のアルゴリズムによる宛先領域の検出処理により宛先領域が検出できた場合(ステップS14、YES)、上記制御ユニット32は、上記認識ユニット33からの宛先領域の検出結果を上記制御部17へ送信する。これにより、上記制御部17は、上記オンラインOCR18に対して処理するバルク紙葉類に対する宛先領域を設定する(ステップS23)。
【0048】
また、上記第1のアルゴリズムによる宛先領域の検出処理にて宛先領域が検出できなかった場合(ステップS14、NO)、上記制御ユニット32は、上記第2のアルゴリズムによる宛先領域の検出処理の実行を判断する(ステップS15)。ここで、第2のアルゴリズムとしては、上述したように、複数の紙葉類に画像における全ての宛先領域候補に対する認識結果に基づいて宛先領域の検出処理を行うものとする。
【0049】
上記第2のアルゴリズムによる宛先領域の検出処理を実行する場合、上記制御ユニット32は、バルク紙葉類に対する宛先領域の検出処理のアルゴリズムとして上記第2のアルゴリズムを指定して2通分のバルク紙葉類の画像を認識ユニット33に送信する。2通分のバルク紙葉類の画像を受信した認識ユニット33は、図示しない記憶部に2通分のバルク紙葉類の画像を記憶し、上記第2のアルゴリズムによる宛先領域の検出処理を行う。
【0050】
すなわち、上記認識ユニット33は、各バルク紙葉類の画像に対して宛先領域候補を全て検出する(ステップS16)。これにより各バルク紙葉類の画像に対する宛先領域候補を検出すると、上記認識ユニット33は、各バルク紙葉類の画像において複数の宛先領域候補が検出されたか否かを判断する(ステップS17)。この判断により各バルク紙葉類の画像から複数の宛先領域候補が検出できた場合、上記認識ユニット33は、各バルク紙葉類における全ての宛先領域候補に対する文字認識処理を行う(ステップS18〜S20)。
【0051】
全てのバルク紙葉類に対する認識処理が完了すると、上記認識ユニット33は、各紙葉類ごとに対応する位置の宛先領域候補における認識結果を比較する。これにより、上記認識ユニット33は、認識結果が同一となった宛先領域候補を削除し、認識結果が異なる宛先領域候補を宛先領域として判定する(ステップS21)。
【0052】
上記第2のアルゴリズムによる宛先領域の検出処理により宛先領域が検出されると、上記制御ユニット32は、上記認識ユニット33からの宛先領域の検出結果を上記制御部17へ送信する。これにより、上記制御部17は、上記オンラインOCR18に対して処理するバルク紙葉類に対する宛先領域を設定する(ステップS23)。
【0053】
また、上記ステップS17において複数の宛先領域候補が存在しないと判断した場合(ステップS17、NO)、上記認識ユニット33は、上記第2のアルゴリズムによる宛先領域の検出処理が不可能であると上記制御ユニット32へ通知する。これにより、上記制御ユニット32は、他のアルゴリズムによる宛先領域の検出処理の実行を判断する(ステップS22)。この場合、上記制御ユニット32は、上記第1、第2のアルゴリズムによる宛先領域の検出処理を同様に、他のアルゴリズムによる宛先領域の検出処理を認識ユニット33にて実行させる。
【0054】
上記のように、上記第1のアルゴリズム、上記第2のアルゴリズム、あるいはその他のアルゴリズムにより宛先領域が検出された場合、上記制御ユニット32は、宛先領域の検出結果としての宛先領域を示す情報を上記制御部17へ送信する。これにより、上記制御部17は、宛先領域を上記オンラインOCR18に対して設定する(ステップS23)。
【0055】
上記のような動作により処理対象とするバルク紙葉類に対する宛先領域が設定されると、上記制御部17は、上記供給部11にセットされているバルク紙葉類を1通づつ供給し、上記スキャナ部13にて読み取ったバルク紙葉類の画像における設定された宛先領域に基づいて上記オンラインOCR18により宛先情報の認識処理を行うことにより、上記読取区分機本体1によるバルク紙葉類に対する区分処理を実行する。
【0056】
上記のように、第1の動作例では、バルク紙葉類の画像から宛先領域を検出するための種々のアルゴリズムを直列的に実行して処理対象とするバルク紙葉類における宛先領域を検出するようにしたものである。これにより、バルク紙葉類における宛先領域を確実かつ高精度に検出することができ、人手を介すことなく処理対象とするバルク紙葉類における宛先領域を設定することができる。
【0057】
また、上記第1の動作例では、種々のアルゴリズムを直列的に実行するようにしたが、直列的に実行されるアルゴリズムの実行順序は、予め設定可能である。従って、直列的に実行する種々のアルゴリズムを最も効率よく宛先領域が検出できるような順序に設定することが可能である。
【0058】
例えば、上述した第1の動作例では、複数の紙葉類の画像から算出される差分画像に基づいて宛先領域を検出する第1のアルゴリズムによる宛先領域の検出処理を先に行うようにしている。上記第1のアルゴリズムでは、上述のように、紙葉類に対する読取位置にずれがなければ、差出人情報や広告情報などは完全に消えてしまうため、確実に宛先領域を検出できる。これに対して、上記第2のアルゴリズムでは、紙葉類に対する読取位置にずれがあっても確実に宛先領域が検出できるが、全ての宛先領域候補に対して文字認識を行うため、上記第1のアルゴリズムよりも処理時間が多くかかる可能性が高い。
【0059】
従って、上記スキャナ部13などの区分機1の基本的な性能として紙葉類に対する読取位置のずれが少ないことが予め分かっていれば、上記第1のアルゴリズムを先に実行することにより、上記のようなオフラインOCR31による処理全体の効率を良くすることが可能である。
すなわち、複数種類のアルゴリズムを直列的に行うように設定する場合、効率的に宛先領域を検出できる可能性が高いアルゴリズムから順に行うようにすることにより、処理全体の効率を良くすることができる。
【0060】
次に、バルク紙葉類に対する宛先領域を検出する第2の動作例について説明する。
上記第1の動作例では、オフラインOCR31において、種々のアルゴリズムによる宛先領域の検出処理を直列的に行うことにより、バルク紙葉類に対する宛先領域を判定している。これに対して、この第2の動作例では、種々のアルゴリズムによる宛先領域の検出処理を並列的に行うことにより、バルク紙葉類に対する宛先領域を判定するものである。
【0061】
例えば、図1に示す構成例では、上記オフラインOCR31が複数の認識ユニット33(33a、33b、…)を有している。このように、上記オフラインOCR31に複数の認識ユニット33(33a、33b、…)を有している場合、それぞれの認識ユニット33(33a、33b、…)で種々のアルゴリズムによる宛先領域の検出処理を並行して行うことが可能である。
【0062】
図7は、複数の認識ユニット33で並行して種々のアルゴリズムによる宛先領域の検出処理を行う場合の動作を説明するためのフローチャートである。
複数のバルク紙葉類を供給部11にセットしてバルクモードによる動作開始を指示すると、複数のバルク紙葉類が一通づつ上記スキャナ部13にて順次読み取られる。このスキャナ部13にて読み取られたバルク紙葉類の画像は、順次、上記VCS制御部19へ転送される。上記VCS制御部19は、上記スキャナ部13からのバルク紙葉類の画像を順次オフラインOCR31へ転送する。
【0063】
上記VCS制御部19からバルク紙葉類の画像を受信した上記オフラインOCR31の制御ユニット32は、各認識ユニット33にて実行する種々のアルゴリズムを判断する。各認識ユニット33にて実行するアルゴリズムを判断すると、上記制御ユニット32は、バルク紙葉類に対する宛先領域の検出処理のアルゴリズムとして上記各アルゴリズムを指定してバルク紙葉類の画像を各認識ユニット33(33a、33b、…)に送信する(ステップS31)。
すると、各認識ユニット33(33a、33b、…)では、上記制御ユニット32からのバルク紙葉類の画像を受信して図示しない記憶部に記憶するとともに、上記制御ユニット32により指定されたアルゴリズムによる宛先領域の検出処理を行う(ステップS32、S33、S34)。
【0064】
これにより、複数の認識ユニット33(33a、33b、…)では、同時に、種々のアルゴリズムによる宛先領域の検出処理が並行して行うことが可能となる。例えば、第1の認識ユニット33aでは第1のアルゴリズムにより宛先領域の検出処理を行い(ステップS32)、第2の認識ユニット33bでは第2のアルゴリズムによる宛先領域の検出処理を行い(ステップS33)、第3の認識ユニット33cではその他のアルゴリズムによる宛先領域の検出処理を行う(ステップS34)。
【0065】
各認識ユニット33(33a、33b、…)は、宛先領域を検出処理が完了すると、それぞれ宛先領域の検出結果を制御ユニット32へ送信するようになっている。上記制御ユニット32では、各認識ユニット33(33a、33b、…)による処理結果から宛先領域を判定する(ステップS35)。
【0066】
この宛先領域の判定では、最も速く得られた処理結果としての宛先領域を採用するようにしても良いし、各認識ユニット33(33a、33b、…)での処理結果を受けた後に宛先領域を決定するようにしても良い。
また、最も速く得られた処理結果を宛先領域として採用する場合、制御ユニット32は、他の認識ユニットが処理中である可能性があるため、処理中の他の認識ユニット33に対して処理の中断を指示する。このような宛先領域の判定によれば、短い処理時間で宛先領域を検出できる。
【0067】
また、各認識ユニット33(33a、33b、…)での処理結果を受けた後に宛先領域を決定する場合、各認識ユニット33(33a、33b、…)から処理結果として得られた宛先領域が一致していれば問題ないが、各認識ユニット33による処理結果として得られた宛先領域が異なっていた場合には、制御ユニット32は、処理結果として得られた宛先領域のちで最も確からしい宛先領域を判定結果とする。このような宛先領域の判定によれば、高精度で確実に宛先領域を検出できる。
【0068】
上記ステップS35により宛先領域を決定すると、上記制御ユニット32は、宛先領域の検出結果としての宛先領域を示す情報を上記制御部17へ送信する。これにより、上記制御部17は、宛先領域を上記オンラインOCR18に対して設定する(ステップS36)。これにより処理対象とするバルク紙葉類に対する宛先領域が上記オンラインOCR18に対して設定すると、上記制御部17は、上記供給部11にセットされているバルク紙葉類を1通づつ供給し、上記スキャナ部13にて読み取ったバルク紙葉類の画像における設定された宛先領域に基づいて上記オンラインOCR18により宛先情報の認識処理を行うことにより、上記読取区分機本体1によるバルク紙葉類に対する区分処理を実行する。
【0069】
上記のように、上記第2の動作例では、オフラインOCR内に認識処理を行う認識ユニットが複数存在する場合、各認識ユニットにて複数種類のアルゴリズムによる宛先領域の検出処理を並行して実行し、各認識ユニットでの宛先領域の検出結果から宛先領域を決定するようにしたものである。これにより、オフラインOCR全体としては、効率良く、確実かつ高精度に宛先領域を出することができ、人手を介すことなく処理対象とするバルク紙葉類における宛先領域を設定することができる。
【0070】
また、各認識ユニットでの宛先領域の検出結果と処理に要する時間との組み合わせから宛先領域を検出するのに最適なアルゴリズムを選択し、選択されたアルゴリズムにて検出された宛先領域をバルク紙葉類に対する宛先領域として設定することが可能である。
【0071】
上記のように、本実施の形態では、バルク紙葉類の画像に対して、複数のアルゴリズムを直列的あるいは並列的に試行して宛先領域を検出するようにしたため、バルク紙葉類に対する宛先領域を精度良く検出することが可能であり、人手を介すことなく処理対象とするバルク紙葉類における宛先領域を確実に設定することができる。
【0072】
さらに、バルク紙葉類に対する宛先領域の検出処理を行うアルゴリズムとして、同一フォーマットを有する複数のバルク紙葉類の画像を用いて宛先領域を検出することにより、バルク紙葉類上のフォーマットが持つ特質により宛名領域の検出精度をあげることが可能である。
【0073】
【発明の効果】
以上詳述したように、この発明によれば、処理対象の紙葉類に対するあて名領域を設定するためのオペレータによる操作を簡単にし、利便性が高く、効率的にあて名領域を設定できる紙葉類処理装置及び紙葉類処理方法を提供することができる。
【図面の簡単な説明】
【図1】この発明の実施の形態に係る区分システムの概略構成を示す図。
【図2】バルク紙葉類の例を示す図。
【図3】バルク紙葉類の例を示す図。
【図4】バルク紙葉類の例を示す図。
【図5】図3と図4との差分画像の例を示す図。
【図6】第1の動作例を説明するためのフローチャート。
【図7】第2の動作例を説明するためのフローチャート。
【符号の説明】
1…区分機本体、2…VCS、11…供給部、12…搬送路、13…スキャナ部、16…区分部、3…オペレーションパネル、17…制御部、18…オンラインOCR、19…VCS制御部、20…画像制御部、21…記憶部、31…オフラインOCR、32…制御ユニット、32a…記憶部、33…認識ユニット、
【発明の属する技術分野】
この発明は、例えば、郵便物などの紙葉類から宛先情報等の文字列が記載されている面を読取り、読取った画像に対する文字認識を行って区分処理を行う紙葉類処理装置及び紙葉類処理方法に関する。
【0002】
【従来の技術】
従来、紙葉類処理装置では、紙葉類に記載されている宛先情報を認識してその認識結果に基づき紙葉類を区分処理する。上記のような紙葉類処理装置では、ダイレクトメールなどのような一時期に大量に発生するバルクと呼ばれる紙葉類(バルク紙葉類)を処理することがある。このようなバルク紙葉類は、通常、同一種類のバルク紙葉類において、宛先情報が記載されている領域が一定であるという特徴がある。このような特徴を利用して、従来の紙葉類処理装置では、バルク紙葉類に対する宛先領域の認識率を向上させ、かつ、認識処理を効率化するために、バルク紙葉類における宛先情報が記載されている宛先領域を予め設定し、その宛先領域に対して宛先情報の認識処理を行うようになっている。このようなバルク紙葉類に対する処理を行う場合には、バルク紙葉類における宛先領域を正確に設定する必要がある。従来の紙葉類処理装置では、オペレータの操作により宛先領域を指定するものがあるが、宛先領域を人手により指定する操作が煩雑であるという問題点がある。
【0003】
また、上記のようなバルク紙葉類の宛先領域を人手によらずに設定するには、紙葉類処理装置が宛先領域を確実に検出する必要がある。例えば、宛先領域を検出する手法としては、特開2000−210624号公報では、文字列末尾の敬称の有無、文字列の印刷の色、濃度、またはサイズの相違などの文字列の特質に基づいて宛名領域の検出を行うものが提案されている。
【0004】
しかしながら、上記特開2000−210624号公報では、宛先情報としての文字列が持つであろう特質が検出できない場合には、宛先領域の特定が困難になるという問題点がある。また、上記特開2000−210624号公報では、宛先領域の候補となる領域候補を検出し、各領域候補に対して文字認識を行って、文字列が持つであろう特質を検出するようにしているため、宛先領域が領域候補として検出されなかった場合には宛先領域を検出することができないという問題点もある。
【0005】
【特許文献1】
特開2000−210624号公報
【発明が解決しようとする課題】
この発明は、処理対象とする紙葉類における宛先領域を設定するには紙葉類に対する宛先領域を確実に検出しなければならいないという問題点を解決するもので、処理対象とする紙葉類における宛先領域を確実に検出することができる紙葉類処理装置及び紙葉類処理方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
この発明の紙葉類処理装置は、紙葉類を1通づつ供給する供給手段と、この供給手段により供給された紙葉類の画像を読取る読取手段と、前記供給手段により複数枚の紙葉類を1通づつ供給し、前記読取手段により読み取った複数枚の紙葉類の画像を蓄積する蓄積手段と、この蓄積手段により蓄積した紙葉類の画像における宛先領域を第1のアルゴリズムにより検出する第1の宛先領域検出手段と、前記蓄積手段により蓄積した紙葉類の画像における宛先領域を前記第1のアルゴリズムとは異なる第2のアルゴリズムにより検出する第2の宛先領域検出手段と、前記第1の宛先領域検出手段あるいは第2の宛先領域検出手段により検出された宛先領域を設定する設定手段と、前記供給手段により紙葉類を1通づつ供給し、前記読取手段により読み取った紙葉類の画像に対して前記設定手段により設定された宛先領域から宛先情報を認識する認識手段と、この認識手段により認識された宛先情報に基づいて紙葉類を区分する区分手段とを有する。
【0007】
この発明の紙葉類処理装置は、紙葉類を1通づつ供給する供給手段と、この供給手段により供給された紙葉類の画像を読取る読取手段と、この読取手段により読み取った紙葉類の画像から宛先情報を所定時間内に認識するオンライン認識手段と、このオンライン認識手段により認識された宛先情報に基づいて紙葉類を区分する区分手段と、前記オンライン認識手段により宛先情報が認識できなかった紙葉類の画像の宛先情報を前記オンライン認識手段とは異なる認識方法にて認識するオフライン認識手段とを有するものであって、前記供給手段により複数枚の紙葉類を1通づつ供給し、前記読取手段により読み取った複数枚の紙葉類の画像を蓄積する蓄積手段と、この蓄積手段により蓄積した紙葉類の画像に対する宛先領域を前記オフライン認識手段に第1のアルゴリズムを適用して検出する第1の宛先領域検出手段と、前記蓄積手段により蓄積した紙葉類の画像に対する宛先領域を前記オフライン認識手段に前記第1のアルゴリズムとは異なる第2のアルゴリズムを適用して検出する第2の宛先領域検出手段と、前記第1の宛先領域検出手段あるいは第2の宛先領域検出手段により検出された宛先領域を前記オンライン認識手段による宛先情報の認識処理を行う領域として設定する設定手段とを有する。
【0008】
この発明の紙葉類処理方法は、紙葉類を1通づつ供給する供給手段と、この供給工程により供給された紙葉類の画像を読取る読取手段とを有する紙葉類処理装置に用いられる方法であって、前記供給手段により複数枚の紙葉類を1通づつ供給し、前記読取手段により読み取った複数枚の紙葉類の画像を蓄積手段に蓄積する蓄積工程と、前記蓄積手段に蓄積した紙葉類の画像における宛先領域を第1のアルゴリズムにより検出する第1の宛先領域検出工程と、前記蓄積手段に蓄積した紙葉類の画像における宛先領域を前記第1のアルゴリズムとは異なる第2のアルゴリズムにより検出する第2の宛先領域検出工程と、前記第1の宛先領域検出工程あるいは前記第2の宛先領域検出工程により検出された宛先領域を設定する設定工程と、前記供給手段により紙葉類を1通づつ供給し、前記読取手段により読み取った紙葉類の画像に対して前記設定工程により設定された宛先領域から宛先情報を認識する認識工程と、この認識工程により認識された宛先情報に基づいて紙葉類を区分する区分工程とを有する。
【0009】
この発明の紙葉類処理方法は、紙葉類を1通づつ供給する供給手段と、この供給手段により供給された紙葉類の画像を読取る読取手段と、この読取手段により読み取った紙葉類の画像から宛先情報を所定時間内に認識するオンライン認識手段と、このオンライン認識手段により認識された宛先情報に基づいて紙葉類を区分する区分手段と、前記オンライン認識手段により宛先情報が認識できなかった紙葉類の画像の宛先情報を前記オンライン認識手段とは異なる認識方法にて認識するオフライン認識手段とを有する紙葉類処理装置に用いられる方法であって、前記供給手段により複数枚の紙葉類を1通づつ供給し、前記読取手段により読み取った複数枚の紙葉類の画像を蓄積手段に蓄積する蓄積工程と、前記蓄積手段に蓄積した紙葉類の画像に対する宛先領域を前記オフライン認識手段に第1のアルゴリズムを適用して検出する第1の宛先領域検出手段と、前記蓄積手段に蓄積した紙葉類の画像に対する宛先領域を前記オフライン認識手段に前記第1のアルゴリズムとは異なる第2のアルゴリズムを適用して検出する第2の宛先領域検出手段と、前記第1の宛先領域検出手段あるいは第2の宛先領域検出手段により検出された宛先領域を前記オンライン認識手段による宛先情報の認識処理を行う領域として設定する設定工程とを有する。
【0010】
【発明の実施の形態】
以下、この発明の実施の形態について図面を参照して説明する。
図1は、この発明に係わる紙葉類処理装置としての区分システムの概略構成を示す図である。
この区分システムは、図1に示すように、読取区分機本体(区分機)1とVCS(ビデオコーディングシステム)2とから構成されている。上記読取区分機本体1は、紙葉類の区分先を示す情報(区分情報、宛先情報)を認識して区分するものである。また、上記VCS2は、上記区分機1にて区分情報が認識できなかった紙葉類の区分情報を上記区分機1とは異なる認識処理により認識したり、オペレータのコーディング作業により入力したりするものである。
【0011】
まず、上記読取区分機本体1について説明する。
図1に示すように、読取区分機本体1は、前面にオペレーションパネル3が設けられている搬送区分部本体1aを有している。上記オペレーションパネル3は、タッチパネル内蔵の表示装置などにより構成される。上記オペレーションパネル3は、オペレータ(操作員)が処理モードや処理開始を指定したり、区分機の動作状態などを表示したりするものである。
【0012】
上記搬送区分部本体1aには、第1面に区分先を示す情報としての数字や文字などが書き込まれ、あるいは印刷された複数通(複数枚)の紙葉類を、この第1面が同一方向を向くように揃えて立位で収容するとともに、これらの紙葉類を所定の取出位置へ順次供給する供給部(供給手段)11を備えている。この供給部11は、紙葉類を主搬送路12に沿って所定の間隔で一通づつ取出す取出部(図示しない)が配設されている。
【0013】
上記供給部11に供給される紙葉類には、その第1面に区分先を示す情報に対応した文字情報が記載されたもの以外に、機械コードとして大口の区分先に予め決められているカスタマコードや紙葉類の区分先に対応して区分機内で決められる局内バーコード、または後述するオンラインOCR18にて区分情報の認識が不能となった紙葉類に付与されるIDコードなどが記載されたものがある。尚、これらの各コードは、バーコード化した情報として紙葉類の第1面に付与されるものである。
【0014】
上記供給部11に供給されている紙葉類は、一定間隔で取出されて、一定速度で搬送する主搬送路12により一定の搬送間隔(ピッチ)で搬送される。主搬送路12上を搬送される紙葉類は、機械処理が不可能な異物の場合には排除され、機械処理が可能な紙葉類のみが搬送される。
【0015】
主搬送路12上には、スキャナ部(読取手段)13、バーコード読取部(B/R)14、バーコードプリンタ部(B/W)15、および区分部(区分手段)16が設けられている。上記スキャナ部13は、主搬送路12上の紙葉類の区分先を示す情報が記載されている面を読取り、その読取画像をオンラインOCR(認識手段、オンライン認識手段)18及びVCS2へ送信するものである。上記バーコード読取部14は、主搬送路12上を搬送される紙葉類の第1面にIDコードあるいは機械コードなどのバーコードが付与されている場合に、そのバーコードを読取るものである。
【0016】
上記バーコードプリンタ部15は、必要に応じて紙葉類の第1面にIDコード、あるいは機械コードを印刷するものである。これは、オンラインCOR18により区分情報が認識できた場合に、その区分情報をバーコード化して紙葉類上に機械コードを印刷し、オンラインOCR18により区分情報が認識できなかった場合に、IDコードを印刷するものである。
【0017】
このバーコードプリンタ部15の紙葉類の搬送方向の下流側には、主搬送路12上を搬送されてきた紙葉類が区分先に応じて区分される区分部16が設けられている。この区分部16は、複数の段、複数の列に区画された複数の区分ポケット(図示しない)から構成されている。各ポケットは、区分先ごとに対応して設定されており、区分情報あるいは機械コードに基づいて、紙葉類が区分情報に対応したポケットに順次集積される。また、区分部16には、区分先が認識できなかった紙葉類が集積されるVCS排除ポケット(図示しない)が設けられている。このVCS排除ポケットに集積された紙葉類は、区分情報がVCS2にて入力された後に、上記供給部11に再供給され、当該紙葉類のIDコードと上記VCS2にて入力された区分情報とに基づいて再区分されるようになっている。
【0018】
また、図1に示すように、上記読取区分機本体1の各部は、制御部(設定手段)17により制御される。この制御部17には、オペレーションパネル3、供給部11、スキャナ部13、バーコード読取部14、バーコードプリンタ部15、区分部16、オンラインOCR18、及びVCS制御部19等が接続されている。
【0019】
上記オンラインOCR18には、スキャナ部13から紙葉類の区分情報が記載されている第1面を光学的に読み取った画像が供給される。上記オンラインOCR18は、供給された紙葉類の画像から紙葉類の区分情報を認識するものである。このオンラインOCR18は、読み取られた画像から宛先領域を検出し、その宛先領域から区分情報となる文字を切り出して文字認識を行い、図示しない文字辞書および住所辞書と比較してマッチング法などによって区分情報の認識を行う。また、上記オンラインOCR18は、処理対象の紙葉類に対する宛先領域が予め設定されている場合、その設定された宛先領域に基づいて紙葉類の画像における区分情報を認識する。
【0020】
また、上記オンラインOCR18では、区分機本体1a内を搬送される紙葉類が区分可能な所定時間内に認識処理を行うようになっている。このため、上記オンラインOCR18での認識処理では、処理時間の制約が厳しいため、所定時間内で認識結果が得られる認識アルゴリズムによる認識方法が採用されている。このオンラインOCR18による認識の可否は、制御部17へ返信されるようになっている。
【0021】
また、上記オンラインOCR18は、紙葉類の画像から区分情報が認識できなかった場合、紙葉類の画像に対する付帯情報として紙葉類の大きさ、文字の大きさ、文字の向き、区分先を示す情報の表記方向、文字種、認識深度、VCS2による処理が必要な箇所を示す情報等のOCR情報(宛先種別データ)を生成し、上記VCS2へ転送するようにしても良い。この場合、上記VCS2では、上記オンラインOCR(オンライン認識手段)18からの付帯情報を活用してコーディング作業あるいはオフラインOCR(オフライン認識手段)31による認識処理が行われる。
【0022】
また、上記区分システムは、種々の動作モードを有している。これらの区分システムの動作モードは、上記オペレーションパネル3によりオペレータが選択指示するものである。例えば、一時期に大量に発生する同一フォーマットのダイレクトメールなどのバルクと呼ばれる紙葉類(以下、バルク紙葉類と称する)を区分処理する動作モードは、バルクモードと呼ばれる。上記バルクモードでは、当該バルク紙葉類に対する宛先領域が予め設定され、その設定された宛先領域に対して上記オンラインOCR18が宛先情報の認識処理を行うことによりバルク紙葉類を区分処理するようになっている。
【0023】
次に、VCS2について説明する。
上記VCS2は、図1に示すように、VCS制御部19、複数のビデオコーディング端末(以下、VCDと称する)30、及びオフラインOCR(オフライン認識手段)31などから構成されている。
上記VCS制御部19は、上記読取区分機本体1で認識できなかった紙葉類の画像などをVCD30あるいはオフラインOCR31へ供給し、上記VCD30あるいは上記オフラインOCR31による処理結果を上記読取区分機本体1へ返す制御を行うものである。また、上記VCS2は、例えば、上記VCD30により紙葉類の区分情報のコーディング処理を行う画像送信機能(VCDモード)と上記オフラインOCR31により紙葉類の区分情報を認識するオフラインOCR処理機能(オフラインOCRモード)とを有しているものとする。上記VCS制御部19は、上記VCDモードの場合には上記VCD30に紙葉類の画像等を送信し、上記オフラインOCRモードの場合には上記オフラインOCR31へ紙葉類の画像等を送信するようになっている。
【0024】
上記VCS制御部19には、上記区分機本体1のスキャナ部13及びオンラインOCR18などが接続されている。上記VCS制御部19は、例えばパーソナルコンピュータ(PC)と同様な構成を有し、画像制御部20及び記憶部21を有している。上記画像制御部20は、上記オンラインOCR18にて認識できなかった紙葉類の画像を上記記憶部21に蓄積したり、上記記憶部21に蓄積された紙葉類の画像をVCD30やオフラインOCR31へ送信したりする制御を行うようになっている。
【0025】
上記VCD30は、ディスプレイやキーボードなどを有し、例えばPCと同様な構成を有している。上記VCD30では、上記VCS制御部19から分配される紙葉類の画像をディスプレイなどに表示し、この表示された画像に基づいてオペレータがキーボードにより区分先を示す情報を入力するものである。
【0026】
上記オフラインOCR31は、上記VCS制御部19から供給された紙葉類の画像に対して宛先情報の認識処理あるいは宛先領域の検出処理などを行うものである。上記オフラインOCR31では、上記オンラインOCR18とは異なるアルゴリズムにてOCR処理を行うようになっている。上記オフラインOCR31での認識処理では、上記オンラインOCR18での認識処理に比べて処理時間の制約が緩和される。つまり、上記オフラインOCR31での認識処理は、上記オンラインOCR18での認識処理よりも多くの処理時間をかけることが可能であるため、種々のアルゴリズムで上記オンラインOCR18よりも高精度な認識処理を行うことができる。
【0027】
上記オフラインOCR31は、図1に示すように、制御ユニット32及び複数の認識ユニット33(33a、33b、…)(第1の宛先領域検出手段、第2の宛先領域検出手段)からなる構成を有している。上記制御ユニット32は、上記VCS制御部19からの紙葉類の画像などのデータを各認識ユニット33へ送信し、各認識ユニット33による認識結果を制御部17へ送信する制御を行うものである。上記制御ユニット32は、VCS制御部19からの紙葉類の画像などのデータを蓄積する記憶部(蓄積手段)32aを有している。上記記憶部32aには、複数通分の紙葉類の画像などのデータが記憶可能である。また、各認識ユニット(第1、第2の宛先領域検出手段)33は、上記制御ユニット32から供給される紙葉類の画像に対して宛先情報の認識処理あるいは宛先領域の検出処理を実行するものである。各認識ユニット33では、上記制御ユニット32による制御に基づいて種々のアルゴリズムにて紙葉類の画像における宛先領域を検出する処理を行うようになっている。
【0028】
すなわち、上記オフラインOCR31では、複数の認識ユニット33にてそれぞれ異なったアルゴリズムで宛先情報の認識処理や宛先領域の検出処理を行うことが可能である。上記制御ユニット32は、各認識ユニット33に対して処理を行うアルゴリズムを指定し、上記記憶部32aに蓄積した紙葉類の画像を各認識ユニット33へ分配することができる。従って、各認識ユニット33では、複数通分の紙葉類の画像を用いて種々のアルゴリズムにより宛先領域の検出処理を行うことが可能である。
【0029】
図2、図3及び図4は、当該区分システムにて処理対象とする紙葉類の例を示す図である。
図2、図3及び図4に示す紙葉類には、宛先情報、差出人情報、及び広告情報などが記載されている。上記宛先情報は、宛先の郵便番号、住所及び氏名などの情報からなる。上記宛先情報は、紙葉類上の宛先領域A内に記載されている情報である。上記差出人情報は、差出人の郵便番号、住所及び氏名などの情報からなる。上記差出人情報は、紙葉類上の差出人住所領域B内に記載されている情報である。上記広告情報は、上記宛先情報とは無関係の図柄や広告文字などからなる。上記広告情報は、紙葉類上の広告領域Cに記載されている情報である。
【0030】
上記宛先情報、差出人情報、及び広告情報は、紙葉類上の任意の位置に記載される可能性がある。このため、上記宛先領域A、差出人住所領域B、及び広告領域Cは、通常、異なった種類の紙葉類に対してはどのような位置であるかを予め決めておくことができない。
【0031】
一般的な紙葉類に対する認識処理では、宛先領域の候補となる候補領域を検出し、それらの候補領域から最も宛先情報らしい情報が記載されている候補領域を宛先領域として判定するようになっている。例えば、候補領域の大きさ、及び候補領域の位置に基づいて宛先領域らしい領域を判定する。また、紙葉類上の一部に半透明な窓部分が設けられている場合には、窓部分の領域を宛先領域と判定することもある。
【0032】
また、一時的に大量に発生する同一フォーマットのバルク紙葉類では、通常、同種のバルク紙葉類であれば、宛先情報、差出人情報、及び広告情報が同じ位置に記載され、さらに、宛先情報以外の差出人情報及び広告情報が同じ情報である。つまり、同種のバルク紙葉類では、宛先領域、差出人住所領域及び広告領域が一定の位置に存在し、かつ、宛先情報のみが変化するという特徴がある。このようなバルク紙葉類を処理する場合、当該区分システムでは、動作モードをバルクモードとし、上記オンラインOCR18に対して処理するバルク紙葉類における宛先領域の位置を予め設定し、その設定した領域に対して認識処理を行うようになっている。
【0033】
上記のようなバルク紙葉類上の宛先領域は、従来の区分システムでは、オペレータの操作(手作業)によって指定するようになっている。しかしながら、宛先領域を指定する操作が面倒であるため、オペレータによる宛先領域の指定なしで区分処理が開始されてしまうこともある。このような場合、オンラインOCR18による宛先情報の認識率が低下し、区分処理の処理効率が悪くなることがある。このため、本実施の形態では、オフラインOCR31にてバルク紙葉類における宛先領域を判定し、その判定結果を宛先領域として設定するものである。
【0034】
次に、上記のようなバルク紙葉類に対する宛先領域の検出処理に用いられるアルゴリズムの例について説明する。
まず、上記バルク紙葉類に対する宛先領域の検出処理の一例としての第1のアルゴリズムについて説明する。
ここで、図2に示す紙葉類と図3に示す紙葉類とが同一種類のバルク紙葉類であるとする。この場合、図2及び図3に示すバルク紙葉類では、宛先領域、差出人住所領域、及び広告領域の位置が同じであり、かつ、宛先領域内に記載される宛先情報のみが異なる。例えば、図2に示すバルク紙葉類と図3に示すバルク紙葉類との2通のバルク紙葉類から読み取った画像データをそれぞれ2値化し、それらの画像データの差分をとった差分データ(差分画像)を算出する。2通のバルク紙葉類の画像では、宛先情報のみが異なっているため、上記差分画像には、図5に示すように、宛先情報の一部のみが画素として残る。つまり、図5に示す差分画像では、宛先情報の一部の画素のみが現れている。
【0035】
すなわち、第1のアルゴリズムは、複数通分のバルク紙葉類の画像から差分画像を算出し、その差分画像から宛先情報らしい画素の領域を宛先領域として判定するものである。この第1のアルゴリズムを用いた宛先領域の検出処理では、各バルク紙葉類に対する読取り位置全く同一であれば(紙葉類の端点などの読取り画像における紙葉類上の基準位置が一致していれば)、宛先情報の一部のみを正確に検出できる。
【0036】
しかしながら、第1のアルゴリズムによる宛名領域の検出処理では、各バルク紙葉類に対する読取位置が微妙にずれた場合、上記差分画像には、宛先情報以外の差出人情報や広告情報などの一部が現れることになり、宛先領域を正確に検出できないことがある。また、各バルク紙葉類上の広告情報や差出情報などの印刷位置にばらつきがある場合にも、上記差分画像には、宛先情報以外の差出人情報や広告情報などの一部が差分画像に現れることになり、宛先領域を正確に検出できないことがある。
【0037】
次に、上記バルク紙葉類に対する宛先情報の認識処理の一例としての第2のアルゴリズムについて説明する。
ここで、図4に示す紙葉類がバルク紙葉類であるとする。図4に示すバルク紙葉類は、宛先情報と差出人情報とが同じような大きさの領域に記載されている。この場合、図4に示すようなバルク紙葉類では、宛先領域、及び差出人住所領域の位置が同じであり、かつ、宛先領域内に記載される宛先情報のみが異なる。例えば、2通のバルク紙葉類から読み取った画像に対して、それぞれ宛先候補領域を検出し、それらの宛先候補領域について認識処理を行う。すると、バルク紙葉類の画像からは、それぞれ、宛先情報と差出人情報とが認識される。
【0038】
つまり、1通目の紙葉類の画像から検出された2つの情報(宛先情報と差出人情報)と2通目の紙葉類の画像から認識された2つの情報(宛先情報と差出人情報)とを比較すると、差出人情報が同一であり、かつ、宛先情報が異なることから、宛先情報が判定できる。さらに、2通の紙葉類の画像における認識結果から宛先情報が確定すると、その宛先情報を得た領域を宛先領域とすることにより、バルク紙葉類に対する宛先領域を確定できる。
【0039】
すなわち、第2のアルゴリズムでは、複数枚のバルク紙葉類の画像から検出される全ての宛先領域候補に対して認識処理を行って、各バルク紙葉類の画像から得られた認識結果のうち、異なる認識結果が得られた領域を宛先領域と判断するものである。この第2のアルゴリズムによれば、文字などの広告が記載されているバルク紙葉類であっても、広告領域からの認識結果が同じになるため、広告情報を宛先領域として誤検出することがない。
しかしながら、第2のアルゴリズムによる宛名領域の検出処理では、複数のバルク紙葉類の画像から検出される全ての宛先候補領域に対して認識処理を行うため、処理に要する時間が長くなり、処理効率が悪いということもある。
【0040】
上記のような第1のアルゴリズム及び第2のアルゴリズムによる宛先領域の検出処理によれば、同一フォーマットを有する複数のバルク紙葉類の画像を用いて宛先領域を検出することにより、バルク紙葉類上のフォーマットが持つ宛先情報のみが変化するという特徴に基づいてバルク紙葉類上の宛名領域の検出精度をあげることが可能である。
【0041】
また、上記バルク紙葉類に対する宛先領域の検出処理に用いられるその他のアルゴリズムについて説明する。
例えば、バルク紙葉類では、透明な窓部分に宛先情報が記載されているものが多い。このため、窓部分の境界となる部分に対して微分処理を行うことにより窓領域を検出し、宛先領域を判定するアルゴリズムもある。また、このようなアルゴリズムでは、窓部分の境界を検出するための微分値を取って行うため、その微分処理の方法を変更することにより種々の変形が可能である。しかしながら、このような窓部分の境界に基づいて宛名領域を検出する認識アルゴリズムは、バルク紙葉類に窓部分が存在する場合にのみ、適用可能である。また、このアルゴリズムでは、窓部分の境界が読取画像上にはっきりと現れないバルク紙葉類に対しては宛先領域を誤検出してしまう可能性が高くなる。
【0042】
さらに、上記以外のバルク紙葉類における宛先領域を検出する処理のアルゴリズムの例としては、通常の認識処理において宛先領域を検出する処理に適用されるアルゴリズムのパラメータを種々の値に変更することにより種々のアルゴリズムを実現することも可能である。
【0043】
上記したように、種々のアルゴリズムでは、上記のような長所と短所とがあるため、種々のバルク紙葉類に対してどの認識アルゴリズムが宛先領域を検出するのに最適であるかを予め特定することができない。従って、本実施の形態では、複数種類のアルゴリズムを実行してバルク紙葉類に対する宛先領域を確実に検出するようにしたものである。
【0044】
次に、バルク紙葉類に対する宛先領域を検出する第1の動作例について説明する。
図6は、上記オフラインOCR31にてバルク紙葉類における宛先領域の検出して設定する処理を説明するためのフローチャートである。
まず、複数のバルク紙葉類を供給部11にセットしてバルクモードによる動作開始を指示すると、上記供給部11から複数のバルク紙葉類が一通ずつ取出され、搬送部12により搬送される。この搬送部12により搬送される複数のバルク紙葉類の画像は、上記スキャナ部13にて順次読み取られる。このスキャナ部13にて読み取られたバルク紙葉類の画像は、順次、上記VCS制御部19へ転送される。これにより、上記VCS制御部19の記憶部21には、紙葉類の画像が蓄積される。
【0045】
上記スキャナ部13からバルク紙葉類の画像が供給されると、上記VCS制御部19は、当該VCS2の動作モードをオフラインOCRモードとし、上記画像制御部20により上記記憶部21に記憶された紙葉類の画像を順次オフラインOCR31へ転送する。
上記VCS制御部19からバルク紙葉類の画像を受信した上記オフラインOCR31の制御ユニット32は、まず、上記第1のアルゴリズムによる宛先領域の検出処理の実行を判断する(ステップS11)。ここで、第1のアルゴリズムとしては、上述した2通分の紙葉類の画像に対する差分画像に基づいて宛先領域の検出処理を行うものとする。
【0046】
上記第1のアルゴリズムによる宛先領域の検出処理を実行する場合、上記制御ユニット32は、バルク紙葉類に対する宛先領域の検出処理のアルゴリズムとして上記第1のアルゴリズムを指定して2通分のバルク紙葉類の画像を認識ユニット33に送信する。2通分のバルク紙葉類の画像を受信した認識ユニット33は、図示しない記憶部に2通分のバルク紙葉類の画像を記憶し、上記第1のアルゴリズムによる宛先領域の検出処理を行う。
【0047】
すなわち、上記認識ユニット33は、上記第1のアルゴリズムによる宛先領域の検出処理として、2通分のバルク紙葉類の画像の差分データを算出し(ステップS12)、差分データから宛先領域らしい領域を検出する(ステップS13)。この検出結果は、当該認識ユニット33から上記制御ユニット32へ送信される。上記第1のアルゴリズムによる宛先領域の検出処理により宛先領域が検出できた場合(ステップS14、YES)、上記制御ユニット32は、上記認識ユニット33からの宛先領域の検出結果を上記制御部17へ送信する。これにより、上記制御部17は、上記オンラインOCR18に対して処理するバルク紙葉類に対する宛先領域を設定する(ステップS23)。
【0048】
また、上記第1のアルゴリズムによる宛先領域の検出処理にて宛先領域が検出できなかった場合(ステップS14、NO)、上記制御ユニット32は、上記第2のアルゴリズムによる宛先領域の検出処理の実行を判断する(ステップS15)。ここで、第2のアルゴリズムとしては、上述したように、複数の紙葉類に画像における全ての宛先領域候補に対する認識結果に基づいて宛先領域の検出処理を行うものとする。
【0049】
上記第2のアルゴリズムによる宛先領域の検出処理を実行する場合、上記制御ユニット32は、バルク紙葉類に対する宛先領域の検出処理のアルゴリズムとして上記第2のアルゴリズムを指定して2通分のバルク紙葉類の画像を認識ユニット33に送信する。2通分のバルク紙葉類の画像を受信した認識ユニット33は、図示しない記憶部に2通分のバルク紙葉類の画像を記憶し、上記第2のアルゴリズムによる宛先領域の検出処理を行う。
【0050】
すなわち、上記認識ユニット33は、各バルク紙葉類の画像に対して宛先領域候補を全て検出する(ステップS16)。これにより各バルク紙葉類の画像に対する宛先領域候補を検出すると、上記認識ユニット33は、各バルク紙葉類の画像において複数の宛先領域候補が検出されたか否かを判断する(ステップS17)。この判断により各バルク紙葉類の画像から複数の宛先領域候補が検出できた場合、上記認識ユニット33は、各バルク紙葉類における全ての宛先領域候補に対する文字認識処理を行う(ステップS18〜S20)。
【0051】
全てのバルク紙葉類に対する認識処理が完了すると、上記認識ユニット33は、各紙葉類ごとに対応する位置の宛先領域候補における認識結果を比較する。これにより、上記認識ユニット33は、認識結果が同一となった宛先領域候補を削除し、認識結果が異なる宛先領域候補を宛先領域として判定する(ステップS21)。
【0052】
上記第2のアルゴリズムによる宛先領域の検出処理により宛先領域が検出されると、上記制御ユニット32は、上記認識ユニット33からの宛先領域の検出結果を上記制御部17へ送信する。これにより、上記制御部17は、上記オンラインOCR18に対して処理するバルク紙葉類に対する宛先領域を設定する(ステップS23)。
【0053】
また、上記ステップS17において複数の宛先領域候補が存在しないと判断した場合(ステップS17、NO)、上記認識ユニット33は、上記第2のアルゴリズムによる宛先領域の検出処理が不可能であると上記制御ユニット32へ通知する。これにより、上記制御ユニット32は、他のアルゴリズムによる宛先領域の検出処理の実行を判断する(ステップS22)。この場合、上記制御ユニット32は、上記第1、第2のアルゴリズムによる宛先領域の検出処理を同様に、他のアルゴリズムによる宛先領域の検出処理を認識ユニット33にて実行させる。
【0054】
上記のように、上記第1のアルゴリズム、上記第2のアルゴリズム、あるいはその他のアルゴリズムにより宛先領域が検出された場合、上記制御ユニット32は、宛先領域の検出結果としての宛先領域を示す情報を上記制御部17へ送信する。これにより、上記制御部17は、宛先領域を上記オンラインOCR18に対して設定する(ステップS23)。
【0055】
上記のような動作により処理対象とするバルク紙葉類に対する宛先領域が設定されると、上記制御部17は、上記供給部11にセットされているバルク紙葉類を1通づつ供給し、上記スキャナ部13にて読み取ったバルク紙葉類の画像における設定された宛先領域に基づいて上記オンラインOCR18により宛先情報の認識処理を行うことにより、上記読取区分機本体1によるバルク紙葉類に対する区分処理を実行する。
【0056】
上記のように、第1の動作例では、バルク紙葉類の画像から宛先領域を検出するための種々のアルゴリズムを直列的に実行して処理対象とするバルク紙葉類における宛先領域を検出するようにしたものである。これにより、バルク紙葉類における宛先領域を確実かつ高精度に検出することができ、人手を介すことなく処理対象とするバルク紙葉類における宛先領域を設定することができる。
【0057】
また、上記第1の動作例では、種々のアルゴリズムを直列的に実行するようにしたが、直列的に実行されるアルゴリズムの実行順序は、予め設定可能である。従って、直列的に実行する種々のアルゴリズムを最も効率よく宛先領域が検出できるような順序に設定することが可能である。
【0058】
例えば、上述した第1の動作例では、複数の紙葉類の画像から算出される差分画像に基づいて宛先領域を検出する第1のアルゴリズムによる宛先領域の検出処理を先に行うようにしている。上記第1のアルゴリズムでは、上述のように、紙葉類に対する読取位置にずれがなければ、差出人情報や広告情報などは完全に消えてしまうため、確実に宛先領域を検出できる。これに対して、上記第2のアルゴリズムでは、紙葉類に対する読取位置にずれがあっても確実に宛先領域が検出できるが、全ての宛先領域候補に対して文字認識を行うため、上記第1のアルゴリズムよりも処理時間が多くかかる可能性が高い。
【0059】
従って、上記スキャナ部13などの区分機1の基本的な性能として紙葉類に対する読取位置のずれが少ないことが予め分かっていれば、上記第1のアルゴリズムを先に実行することにより、上記のようなオフラインOCR31による処理全体の効率を良くすることが可能である。
すなわち、複数種類のアルゴリズムを直列的に行うように設定する場合、効率的に宛先領域を検出できる可能性が高いアルゴリズムから順に行うようにすることにより、処理全体の効率を良くすることができる。
【0060】
次に、バルク紙葉類に対する宛先領域を検出する第2の動作例について説明する。
上記第1の動作例では、オフラインOCR31において、種々のアルゴリズムによる宛先領域の検出処理を直列的に行うことにより、バルク紙葉類に対する宛先領域を判定している。これに対して、この第2の動作例では、種々のアルゴリズムによる宛先領域の検出処理を並列的に行うことにより、バルク紙葉類に対する宛先領域を判定するものである。
【0061】
例えば、図1に示す構成例では、上記オフラインOCR31が複数の認識ユニット33(33a、33b、…)を有している。このように、上記オフラインOCR31に複数の認識ユニット33(33a、33b、…)を有している場合、それぞれの認識ユニット33(33a、33b、…)で種々のアルゴリズムによる宛先領域の検出処理を並行して行うことが可能である。
【0062】
図7は、複数の認識ユニット33で並行して種々のアルゴリズムによる宛先領域の検出処理を行う場合の動作を説明するためのフローチャートである。
複数のバルク紙葉類を供給部11にセットしてバルクモードによる動作開始を指示すると、複数のバルク紙葉類が一通づつ上記スキャナ部13にて順次読み取られる。このスキャナ部13にて読み取られたバルク紙葉類の画像は、順次、上記VCS制御部19へ転送される。上記VCS制御部19は、上記スキャナ部13からのバルク紙葉類の画像を順次オフラインOCR31へ転送する。
【0063】
上記VCS制御部19からバルク紙葉類の画像を受信した上記オフラインOCR31の制御ユニット32は、各認識ユニット33にて実行する種々のアルゴリズムを判断する。各認識ユニット33にて実行するアルゴリズムを判断すると、上記制御ユニット32は、バルク紙葉類に対する宛先領域の検出処理のアルゴリズムとして上記各アルゴリズムを指定してバルク紙葉類の画像を各認識ユニット33(33a、33b、…)に送信する(ステップS31)。
すると、各認識ユニット33(33a、33b、…)では、上記制御ユニット32からのバルク紙葉類の画像を受信して図示しない記憶部に記憶するとともに、上記制御ユニット32により指定されたアルゴリズムによる宛先領域の検出処理を行う(ステップS32、S33、S34)。
【0064】
これにより、複数の認識ユニット33(33a、33b、…)では、同時に、種々のアルゴリズムによる宛先領域の検出処理が並行して行うことが可能となる。例えば、第1の認識ユニット33aでは第1のアルゴリズムにより宛先領域の検出処理を行い(ステップS32)、第2の認識ユニット33bでは第2のアルゴリズムによる宛先領域の検出処理を行い(ステップS33)、第3の認識ユニット33cではその他のアルゴリズムによる宛先領域の検出処理を行う(ステップS34)。
【0065】
各認識ユニット33(33a、33b、…)は、宛先領域を検出処理が完了すると、それぞれ宛先領域の検出結果を制御ユニット32へ送信するようになっている。上記制御ユニット32では、各認識ユニット33(33a、33b、…)による処理結果から宛先領域を判定する(ステップS35)。
【0066】
この宛先領域の判定では、最も速く得られた処理結果としての宛先領域を採用するようにしても良いし、各認識ユニット33(33a、33b、…)での処理結果を受けた後に宛先領域を決定するようにしても良い。
また、最も速く得られた処理結果を宛先領域として採用する場合、制御ユニット32は、他の認識ユニットが処理中である可能性があるため、処理中の他の認識ユニット33に対して処理の中断を指示する。このような宛先領域の判定によれば、短い処理時間で宛先領域を検出できる。
【0067】
また、各認識ユニット33(33a、33b、…)での処理結果を受けた後に宛先領域を決定する場合、各認識ユニット33(33a、33b、…)から処理結果として得られた宛先領域が一致していれば問題ないが、各認識ユニット33による処理結果として得られた宛先領域が異なっていた場合には、制御ユニット32は、処理結果として得られた宛先領域のちで最も確からしい宛先領域を判定結果とする。このような宛先領域の判定によれば、高精度で確実に宛先領域を検出できる。
【0068】
上記ステップS35により宛先領域を決定すると、上記制御ユニット32は、宛先領域の検出結果としての宛先領域を示す情報を上記制御部17へ送信する。これにより、上記制御部17は、宛先領域を上記オンラインOCR18に対して設定する(ステップS36)。これにより処理対象とするバルク紙葉類に対する宛先領域が上記オンラインOCR18に対して設定すると、上記制御部17は、上記供給部11にセットされているバルク紙葉類を1通づつ供給し、上記スキャナ部13にて読み取ったバルク紙葉類の画像における設定された宛先領域に基づいて上記オンラインOCR18により宛先情報の認識処理を行うことにより、上記読取区分機本体1によるバルク紙葉類に対する区分処理を実行する。
【0069】
上記のように、上記第2の動作例では、オフラインOCR内に認識処理を行う認識ユニットが複数存在する場合、各認識ユニットにて複数種類のアルゴリズムによる宛先領域の検出処理を並行して実行し、各認識ユニットでの宛先領域の検出結果から宛先領域を決定するようにしたものである。これにより、オフラインOCR全体としては、効率良く、確実かつ高精度に宛先領域を出することができ、人手を介すことなく処理対象とするバルク紙葉類における宛先領域を設定することができる。
【0070】
また、各認識ユニットでの宛先領域の検出結果と処理に要する時間との組み合わせから宛先領域を検出するのに最適なアルゴリズムを選択し、選択されたアルゴリズムにて検出された宛先領域をバルク紙葉類に対する宛先領域として設定することが可能である。
【0071】
上記のように、本実施の形態では、バルク紙葉類の画像に対して、複数のアルゴリズムを直列的あるいは並列的に試行して宛先領域を検出するようにしたため、バルク紙葉類に対する宛先領域を精度良く検出することが可能であり、人手を介すことなく処理対象とするバルク紙葉類における宛先領域を確実に設定することができる。
【0072】
さらに、バルク紙葉類に対する宛先領域の検出処理を行うアルゴリズムとして、同一フォーマットを有する複数のバルク紙葉類の画像を用いて宛先領域を検出することにより、バルク紙葉類上のフォーマットが持つ特質により宛名領域の検出精度をあげることが可能である。
【0073】
【発明の効果】
以上詳述したように、この発明によれば、処理対象の紙葉類に対するあて名領域を設定するためのオペレータによる操作を簡単にし、利便性が高く、効率的にあて名領域を設定できる紙葉類処理装置及び紙葉類処理方法を提供することができる。
【図面の簡単な説明】
【図1】この発明の実施の形態に係る区分システムの概略構成を示す図。
【図2】バルク紙葉類の例を示す図。
【図3】バルク紙葉類の例を示す図。
【図4】バルク紙葉類の例を示す図。
【図5】図3と図4との差分画像の例を示す図。
【図6】第1の動作例を説明するためのフローチャート。
【図7】第2の動作例を説明するためのフローチャート。
【符号の説明】
1…区分機本体、2…VCS、11…供給部、12…搬送路、13…スキャナ部、16…区分部、3…オペレーションパネル、17…制御部、18…オンラインOCR、19…VCS制御部、20…画像制御部、21…記憶部、31…オフラインOCR、32…制御ユニット、32a…記憶部、33…認識ユニット、
Claims (8)
- 紙葉類を1通づつ供給する供給手段と、
この供給手段により供給された紙葉類の画像を読取る読取手段と、
前記供給手段により複数枚の紙葉類を1通づつ供給し、前記読取手段により読み取った複数枚の紙葉類の画像を蓄積する蓄積手段と、
この蓄積手段により蓄積した紙葉類の画像における宛先領域を第1のアルゴリズムにより検出する第1の宛先領域検出手段と、
前記蓄積手段により蓄積した紙葉類の画像における宛先領域を前記第1のアルゴリズムとは異なる第2のアルゴリズムにより検出する第2の宛先領域検出手段と、
前記第1の宛先領域検出手段あるいは第2の宛先領域検出手段により検出された宛先領域を設定する設定手段と、
前記供給手段により紙葉類を1通づつ供給し、前記読取手段により読み取った紙葉類の画像に対して前記設定手段により設定された宛先領域から宛先情報を認識する認識手段と、
この認識手段により認識された宛先情報に基づいて紙葉類を区分する区分手段と、
を有することを特徴とする紙葉類処理装置。 - 紙葉類を1通づつ供給する供給手段と、この供給手段により供給された紙葉類の画像を読取る読取手段と、この読取手段により読み取った紙葉類の画像から宛先情報を所定時間内に認識するオンライン認識手段と、このオンライン認識手段により認識された宛先情報に基づいて紙葉類を区分する区分手段と、前記オンライン認識手段により宛先情報が認識できなかった紙葉類の画像の宛先情報を前記オンライン認識手段とは異なる認識方法にて認識するオフライン認識手段と、を有する紙葉類処理装置であって、
前記供給手段により複数枚の紙葉類を1通づつ供給し、前記読取手段により読み取った複数枚の紙葉類の画像を蓄積する蓄積手段と、
この蓄積手段により蓄積した紙葉類の画像に対する宛先領域を前記オフライン認識手段に第1のアルゴリズムを適用して検出する第1の宛先領域検出手段と、
前記蓄積手段により蓄積した紙葉類の画像に対する宛先領域を前記オフライン認識手段に前記第1のアルゴリズムとは異なる第2のアルゴリズムを適用して検出する第2の宛先領域検出手段と、
前記第1の宛先領域検出手段あるいは第2の宛先領域検出手段により検出された宛先領域を前記オンライン認識手段による宛先情報の認識処理を行う領域として設定する設定手段と、
を有することを特徴とする紙葉類処理装置。 - 前記第2の宛先領域検出手段は、前記第1の宛先領域検出手段により前記蓄積手段に蓄積した紙葉類の画像における宛先領域が検出できなった場合に、前記第1のアルゴリズムとは異なる第2のアルゴリズムにより前記宛先領域を検出する、ことを特徴とする前記請求項1又は前記請求項2に記載の紙葉類処理装置。
- 前記第1の宛先領域検出手段及び前記第2の宛先領域検出手段は、前記蓄積手段に蓄積した紙葉類の画像における宛先領域の検出処理を並行して行う、ことを特徴とする前記請求項1又は前記請求項2に記載の紙葉類処理装置。
- 前記第1のアルゴリズム又は前記第2のアルゴリズムは、前記蓄積手段に蓄積した複数枚の紙葉類の画像から得られる差分画像に基づいて前記宛先領域を検出する、ことを特徴とする前記請求項1又は前記請求項2に記載の紙葉類処理装置。
- 前記第1のアルゴリズム又は前記第2のアルゴリズムは、前記蓄積手段に蓄積した複数枚の紙葉類の画像における全ての宛先領域候補を検出し、複数枚の紙葉類の画像から検出された全て宛先領域候補に対して文字認識処理を行って、それらの宛先領域候補に対する文字認識結果に基づいて前記宛先領域を検出する、ことを特徴とする前記請求項1又は前記請求項2に記載の紙葉類処理装置。
- 紙葉類を1通づつ供給する供給手段と、この供給工程により供給された紙葉類の画像を読取る読取手段とを有する紙葉類処理装置に用いられる紙葉類処理方法であって、
前記供給手段により複数枚の紙葉類を1通づつ供給し、前記読取手段により読み取った複数枚の紙葉類の画像を蓄積手段に蓄積する蓄積工程と、
前記蓄積手段に蓄積した紙葉類の画像における宛先領域を第1のアルゴリズムにより検出する第1の宛先領域検出工程と、
前記蓄積手段に蓄積した紙葉類の画像における宛先領域を前記第1のアルゴリズムとは異なる第2のアルゴリズムにより検出する第2の宛先領域検出工程と、
前記第1の宛先領域検出工程あるいは前記第2の宛先領域検出工程により検出された宛先領域を設定する設定工程と、
前記供給手段により紙葉類を1通づつ供給し、前記読取手段により読み取った紙葉類の画像に対して前記設定工程により設定された宛先領域から宛先情報を認識する認識工程と、
この認識工程により認識された宛先情報に基づいて紙葉類を区分する区分工程と、
を有することを特徴とする紙葉類処理方法。 - 紙葉類を1通づつ供給する供給手段と、この供給手段により供給された紙葉類の画像を読取る読取手段と、この読取手段により読み取った紙葉類の画像から宛先情報を所定時間内に認識するオンライン認識手段と、このオンライン認識手段により認識された宛先情報に基づいて紙葉類を区分する区分手段と、前記オンライン認識手段により宛先情報が認識できなかった紙葉類の画像の宛先情報を前記オンライン認識手段とは異なる認識方法にて認識するオフライン認識手段と、を有する紙葉類処理装置に用いられる紙葉類処理方法であって、
前記供給手段により複数枚の紙葉類を1通づつ供給し、前記読取手段により読み取った複数枚の紙葉類の画像を蓄積手段に蓄積する蓄積工程と、
前記蓄積手段に蓄積した紙葉類の画像に対する宛先領域を前記オフライン認識手段に第1のアルゴリズムを適用して検出する第1の宛先領域検出手段と、
前記蓄積手段に蓄積した紙葉類の画像に対する宛先領域を前記オフライン認識手段に前記第1のアルゴリズムとは異なる第2のアルゴリズムを適用して検出する第2の宛先領域検出手段と、
前記第1の宛先領域検出手段あるいは第2の宛先領域検出手段により検出された宛先領域を前記オンライン認識手段による宛先情報の認識処理を行う領域として設定する設定工程と、
を有することを特徴とする紙葉類処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002358338A JP2004188299A (ja) | 2002-12-10 | 2002-12-10 | 紙葉類処理装置及び紙葉類処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002358338A JP2004188299A (ja) | 2002-12-10 | 2002-12-10 | 紙葉類処理装置及び紙葉類処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004188299A true JP2004188299A (ja) | 2004-07-08 |
Family
ID=32758084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002358338A Pending JP2004188299A (ja) | 2002-12-10 | 2002-12-10 | 紙葉類処理装置及び紙葉類処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004188299A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011035067A (ja) * | 2009-07-30 | 2011-02-17 | Juki Corp | 電子部品実装装置に利用可能な部品搭載機構の制御方法 |
JP2013212444A (ja) * | 2012-03-30 | 2013-10-17 | Toshiba Corp | 配送システム、方法およびプログラム |
US9805062B2 (en) | 2014-08-28 | 2017-10-31 | Kabushiki Kaisha Toshiba | Address recognition apparatus, sorting apparatus, integrated address recognition apparatus and address recognition method |
-
2002
- 2002-12-10 JP JP2002358338A patent/JP2004188299A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011035067A (ja) * | 2009-07-30 | 2011-02-17 | Juki Corp | 電子部品実装装置に利用可能な部品搭載機構の制御方法 |
JP2013212444A (ja) * | 2012-03-30 | 2013-10-17 | Toshiba Corp | 配送システム、方法およびプログラム |
US9805062B2 (en) | 2014-08-28 | 2017-10-31 | Kabushiki Kaisha Toshiba | Address recognition apparatus, sorting apparatus, integrated address recognition apparatus and address recognition method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6768810B2 (en) | System and method for detecting address fields on mail items | |
US20020029202A1 (en) | System and methods for unified routing of mailpieces and processing sender notifications | |
KR20010031815A (ko) | 우편물의 루팅 정보를 인식하기 위한 방법 및 시스템 | |
JPH11226513A (ja) | 郵便物宛先読取装置及び郵便物区分装置 | |
KR100323351B1 (ko) | 주소인식방법 및 메일처리장치 | |
JP2009157817A (ja) | バーコード処理装置、区分装置およびバーコード処理方法 | |
US20050025340A1 (en) | Method of sorting mail | |
US6807302B2 (en) | Recognition apparatus and recognition method | |
JP2004188299A (ja) | 紙葉類処理装置及び紙葉類処理方法 | |
WO2010110190A1 (ja) | 物品区分機、物品区分方法、及びプログラム記録媒体 | |
JP4653412B2 (ja) | バーコード認識処理装置 | |
JP2010069438A (ja) | 押印機、区分機および紙葉類処理方法 | |
JP4454759B2 (ja) | 紙葉類の重なり判定方法と紙葉類仕分け装置 | |
JP3709474B2 (ja) | 郵便物区分方法および装置 | |
JPH07171505A (ja) | 郵便物宛名コード読取装置 | |
JP7143488B2 (ja) | 配達物処理装置、配達物処理方法、及び配達物処理プログラム | |
JP3557061B2 (ja) | 郵便物区分装置及びその制御方法 | |
JPH09239327A (ja) | 郵便物処理装置 | |
JP2005007315A (ja) | 区分機と区分方法 | |
JP2003141443A (ja) | 認識装置、区分機、認識方法、及び区分方法 | |
JP2005138007A (ja) | 紙葉類の認識システム | |
JP3546619B2 (ja) | イメージング装置 | |
JP2004337816A (ja) | 区分機、区分システム、及び紙葉類の区分方法 | |
JP2006102648A (ja) | 郵便物読取区分機 | |
JP2004121918A (ja) | コーディングシステム、紙葉類処理システム、コーディング方法及び紙葉類処理方法 |