JP2012084132A - 文字認識装置、文字認識方法および区分装置 - Google Patents

文字認識装置、文字認識方法および区分装置 Download PDF

Info

Publication number
JP2012084132A
JP2012084132A JP2011191506A JP2011191506A JP2012084132A JP 2012084132 A JP2012084132 A JP 2012084132A JP 2011191506 A JP2011191506 A JP 2011191506A JP 2011191506 A JP2011191506 A JP 2011191506A JP 2012084132 A JP2012084132 A JP 2012084132A
Authority
JP
Japan
Prior art keywords
character string
character
concealed
recognition
height
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011191506A
Other languages
English (en)
Inventor
Masaya Maeda
匡哉 前田
Tomoyuki Hamamura
倫行 浜村
Bumpei Irie
文平 入江
Hide Boku
英 朴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011191506A priority Critical patent/JP2012084132A/ja
Priority to US13/229,881 priority patent/US20120072013A1/en
Priority to EP11181155A priority patent/EP2431920A2/en
Priority to KR1020110092890A priority patent/KR20120029351A/ko
Priority to CN2011102744008A priority patent/CN102402682A/zh
Publication of JP2012084132A publication Critical patent/JP2012084132A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】隠れている文字列の高さが他の文字列の高さと異なる場合にも効果的に文字認識が行なえ、かつ、隠れによる文字の欠けが大きな場合にも効果的に文字認識が行なえ、さらに、隠れ度合いが文字ごとに異なる場合にも文字認識を可能とする文字認識装置を提供する。
【解決手段】複数の文字が列状に記載された文字列を認識する文字認識装置において、前記文字列の一部が隠蔽されている状況下で、隠蔽されている可能性のある文字部分を検出して隠蔽文字列領域候補とする隠蔽文字列候補検出手段と、この隠蔽文字列候補検出手段により検出された隠蔽文字列領域候補に対して実際に文字が隠蔽されているか否かを確認する確認手段と、この確認手段の確認結果に基づき対象文字列の認識処理を行なう認識手段とを具備している。
【選択図】図2

Description

本発明の実施形態は、たとえば、窓付き郵便物であって宛先情報を示す文字列の一部が上記窓に隠されている郵便物上の上記文字列を認識する文字認識装置および文字認識方法に関する。
また、本発明の実施形態は、たとえば、上記郵便物上の文字列を上記文字認識装置を用いて認識することにより上記郵便物を区分処理する区分装置に関する。
たとえば、窓の付いた封書等の窓付き郵便物において、宛先情報を示す文字列が窓の端に位置し、文字の一部が隠れて見えないことがある。このような場合の宛先情報の読取りは難しい課題である。このような課題を解決するものとして、たとえば、以下に示す技術が公知である。
(1)隠れている行の文字の高さを隠れていない行を用いて推定し、テンプレートとのマッチングの際に補正を行なう。
また、郵便物の窓に限らず、一般に一部が欠けた文字の読取方法が各種提案されており、たとえば、以下に示す技術が公知である。
(2)下線を除去する際に欠けた文字の高さを下線のない行から推定し、テンプレートとのマッチングの際に補正を行なう。
(3)帳票の罫線を除去する際に欠けた文字の高さおよび上下位置を推定し、テンプレートとのマッチングの際に補正を行なう。
(4)ドット状の欠損部の復元方法。
(5)帳票の認識において罫線に重なった部分の復元方法。
特開平4−148391号公報 特許第2797848号公報 特許第3055484号公報
しかしながら、上記した従来の方法は必ずしも効果的に課題を解決できているとはいえない。すなわち、
上記(1)の方法は、隠れている行の高さが隠れていない行の高さと異なる場合に推定失敗となる。
上記(2)の方法は、下線のある行の文字の高さと下線のない行の文字の高さが異なる場合に推定失敗となる。
上記(3)の方法は、決まったサイズの文字のみを対象としており、文字サイズの不明な対象には適用できない。
上記(4)の方法は、欠けが微小な場合のみに適用できるものであり、窓による隠れのように欠けが大きい場合には適用できない。
上記(5)の方法は、欠けが細い領域である場合のみに適用できるものであり、窓による隠れのように欠けが大きい場合には適用できない。
そこで、実施形態は、隠れている文字列の高さが他の文字列の高さと異なる場合にも効果的に文字認識が行なえ、かつ、隠れによる文字の欠けが大きな場合にも効果的に文字認識が行なえ、さらに、隠れ度合いが文字ごとに異なる場合にも文字認識を可能とする文字認識装置、文字認識方法および区分装置を提供することを目的とする。
実施形態に係る文字認識装置は、複数の文字が列状に記載された文字列を認識する文字認識装置において、前記文字列の一部が隠蔽されている状況下で、隠蔽されている可能性のある文字部分を検出して隠蔽文字列領域候補とする隠蔽文字列候補検出手段と、この隠蔽文字列候補検出手段により検出された隠蔽文字列領域候補に対して実際に文字が隠蔽されているか否かを確認する確認手段と、この確認手段の確認結果に基づき対象文字列の認識処理を行なう認識手段とを具備している。
本実施形態に係る窓付き封書等の窓付き郵便物(日本語表記)の一例を示す平面図。 本実施形態に係る文字認識装置および文字認識方法が適用される区分装置の構成を模式的に示すブロック図。 本実施形態に係る文字認識処理の流れについて説明するフローチャート。 本実施形態に係る文字認識処理の流れについて説明するフローチャート。 窓付き郵便物の窓に文字列の一部が隠れたものとそれに対する輪郭追跡の様子を説明する図。 排他部分文字テーブルの一例を示す図。 日本語の使用文字での排他部分文字の例とそうならない例を説明する図。 ハイフン検出による文字列(日本語表記)の欠損部分の高さ推定の一例を説明する図。 本実施形態に係る窓付き封書等の窓付き郵便物(英語表記)の一例を示す平面図。 英語の使用文字での排他部分文字の例とそうならない例を説明する図。 ハイフン検出による文字列(英語表記)の欠損部分の高さ推定の一例を説明する図。
以下、実施形態について図面を参照して説明する。
図1は、本実施形態に係る処理対象物体である窓付き封書等の窓付き郵便物の一例を示している。この窓付き郵便物11は、表面にセロファン等の窓12を有していて、この窓12内に区分情報としての宛先情報13が複数の文字からなる文字列により表示(記載)されている。図1、図9の例は、宛先情報13を示す文字列の一部が窓12の上端で隠蔽されている状況を示している。
図2は、本実施形態に係る文字認識装置および文字認識方法が適用される区分装置の構成を模式的に示すものである。
図2に示すように、本実施形態に係る区分装置は、たとえば、図1、図9に示した窓付き郵便物11をその宛先情報13に基づき区分処理するもので、郵便物供給部21、搬送手段としての搬送路22、区分手段としての区分部23、読取手段としての読取部24、認識手段としての認識部25、辞書部26、隠蔽文字列候補検出・確認手段としての隠蔽文字列候補検出・確認部27、隠蔽文字列高さ推定手段としての隠蔽文字列高さ推定部28、文字列検証手段としての文字列検証部29およびデータベース30により構成されている。
郵便物供給部21は、処理する郵便物(たとえば、図1、図9に示した窓付き郵便物11)を1通づつ供給する。搬送路22は、郵便物供給部21により供給される郵便物11を1通づつ搬送する。区分部23は、搬送路22で搬送されてくる郵便物11を認識部25の認識結果に基づき宛先別に区分処理する。
読取部24は、搬送路22の途中において、搬送路22で搬送される郵便物11の窓12が存在する面の画像を光学的に読取る。認識部25は、読取部24で読取られた画像から宛先情報13を示す文字列を認識する。
辞書部26は、複数の文字認識辞書26〜26により構成されている。文字認識辞書26〜26は、たとえば、1つの完全文字辞書と文字の欠損割合(たとえば、10%、20%、30%、40%)ごとの欠損文字辞書から構成される。ここに、完全文字辞書とは隠蔽による欠損なしの文字パターンである通常の文字辞書のことを言い、欠損文字辞書とは隠蔽により左右上下が何割か削れたもの(欠損したもの)を言うものとする。
隠蔽文字列候補検出・確認部27は、文字列の一部が隠蔽されている状況下で、隠蔽されている可能性のある文字部分を検出して隠蔽文字列領域候補とし、その隠蔽文字列領域候補が実際の隠蔽文字列領域であるか否かを確認する。隠蔽文字列高さ推定部28は、隠蔽文字列候補検出・確認部27により検出された隠蔽文字列領域に対して実際に文字が隠蔽されているか否かを確認し、文字が隠蔽されていると判断された場合、当該対象文字列に対して高さを推定する。
認識部25は、文字認識を行なう際、隠蔽文字列候補検出・確認部27により宛先情報13が隠蔽されている可能性のある候補があるかどうかを検出し、隠蔽文字列高さ推定部28により隠蔽されている文字列部分の高さを推定し、文字列の欠け割合(欠損割合)に見合った文字認識辞書を使用して個別の文字認識スコアを求める。
文字列検証部29は、認識部25から得られる文字認識スコア(文字認識結果)を用いて、データベース30内の住所データとのマッチング処理を行ない、その結果を最終的な認識結果として区分部23へ出力する。
本実施形態の特徴は、文字列の隠蔽候補を検出して確認し、隠蔽文字列の高さを推定することで文字の欠け割合を知ることにあり、そのため、以降は上記の2点を中心に詳細な説明を行なう。
以下、図3および図4に示すフローチャートを参照して本実施形態に係る文字認識処理の流れについて説明する。
読取部24で読取られた郵便物11上の画像が入力されると(ステップS1)、隠蔽文字列候補検出・確認部27は、入力された画像に対して窓13(窓枠)の候補(隠蔽文字列領域候補)を検出する(ステップS2,S3)。ここの窓枠候補検出の手法は、どの手法を使用しても構わないが、たとえば、微分画像に対してハフ変換を適用して窓枠の4つの線分を見つける手法や、郵便物11の地肌と窓枠の部分に濃度差がある場合には濃度2値ラベルから適当な大きさのラベルが検出された部分を窓枠候補とする手法などが利用可能である。
窓枠候補が検出された場合、一般に隠蔽文字列(以下、欠損文字列ともいう)の近辺は図5に示すような状態となっている。図5において、31は窓枠の上端を示し、32は窓枠の上端31で文字の一部が欠損(隠蔽)している欠損文字列を示し、34は輪郭追跡の状態を示している。
窓枠の左右上下の端でそれぞれ輪郭追跡を行なっていき(ステップS4)、それぞれの方向成分を投票していくと、欠損文字列が存在していない端は同じ方向成分だけが連続する。たとえば、投票方向成分を、右方向を「0」、上方向を「1」、左方向を「2」、下方向を「3」とすると、窓枠のエッジ内部から右手伝いに探索していった場合、窓枠下端では上成分と下成分が多少混じるものの、ほとんど右成分の「0」のみが投票される結果となる。同様に、窓枠の右端では上成分がほとんど全て投票され、上端では左成分がほとんど全て投票されるといった結果となる。
ここで、図5のように欠損文字列32を含んでいる場合には、本来主要成分となるべき方向と逆の方向も多々混じってくる。それにより、輪郭追跡の方向成分に異常があると判断する(ステップS5)。異常があった場合は、その部分を欠損文字列が連続していると判定し、実際の対象領域(隠蔽文字列領域)とする(ステップS6)。
ステップS2,S3において窓枠候補が検出されない場合、あるいは、ステップS5において窓枠候補の方向成分に異常が見られない場合、郵便物11に存在する文字列に対して、完全文字辞書での通常文字認識を実施する(ステップS7)。本実施形態では、完全文字辞書というのは、前述したように、欠損なしのパターンである通常の文字辞書のことを言い、欠損辞書というのは左右上下が何割か削れたものを指す。この欠損割合は、たとえば、左右上下それぞれで10%おきに削れた辞書を持っておくなどすればよく、テンプレートマッチングで個別文字認識を行なうならば正規化した画像でも構わないし、それぞれのカテゴリの欠損パターンで学習した特徴ベクトル群の辞書でも構わない。
ステップS7における完全文字辞書での文字認識の結果、文字認識スコアの悪い文字が続いている部分があるようなら(ステップS8)、欠損文字列が連続している可能性があると判断してステップS6へ進み、欠損文字列が連続していると判定して、実際の対象領域(隠蔽文字列領域)とする。
ステップS8において、特に文字認識スコアが悪いものが連続している状況でなければ、通常の宛先情報の認識処理を行なって終了となる。
本例では、窓枠が検出できたものと仮定して話を進める。窓枠の検出ができている場合には、窓枠部分のエッジが後段の処理のノイズになる可能性が高いので、位置だけ記憶して外枠のエッジ部分は消去などすると都合がよくなる。
ステップS6において欠損文字列領域が検出された場合、隠蔽文字列高さ推定部28は、以下に説明する欠損文字列の高さ推定処理を行なう。なお、本実施形態では、欠損文字辞書として数字を限定使用したケースで説明していくが、他の文字辞書でも構わない。
まず、数字の欠損文字辞書で、それぞれの欠損割合ごとに文字認識を繰り返し実施していく(ステップS9)。もちろん、左右上下全ての候補に対して認識させて行ってもよいが、先に説明したように輪郭追跡の方向成分で欠損文字列領域を検出した場合(ステップS5の流れに対応)、窓枠の左右上下端のどこで異常が見られるのかがわかるため、その方向のみの欠損文字辞書で文字認識させれば充分である。
文字認識スコアの悪い文字列が連続しているという判断から欠損文字列領域を検出した場合(ステップS8の流れに対応)であっても、対象領域の付近の文字列で正しい文字認識が連続で行なわれる部分があるならば、その方向には欠損状態が存在し得ないと推察できるため、正しい文字認識が続いている領域とは逆側に欠損状態が発生していると推察できる。これにより、輪郭追跡の方向成分で実施したのと同様に欠損文字辞書を優先使用する方向が確定できる。欠損文字領域の文字に対して繰り返し実施した各欠損割合での文字認識スコアは一旦保持しておき、後段の処理で使用する。
次に、図6に示すような排他部分文字テーブル34を使用して、その登録内容との比較を行なう。排他部分文字テーブル34は、動作前にあらかじめ作成しておくものであり、対象言語の非数字文字としてあり得ない数字欠損パターンを登録しておくものである。たとえば、日本語で使用する文字を例に取ると、図7(a)に示すような欠損数字のパターンは、他の日本語の部分文字としては存在し得ないものである。すなわち、図7(a)は、たとえば、日本語の通常使用文字であれば、当該図形は数字「8」の下側20%欠損しか有り得ないので、排他部分文字となる。また、英語で使用する文字を例に取ると、図10(a)に示すような欠損数字のパターンは、他の英語の部分文字としては存在し得ないものである。すなわち、図10(a)は、たとえば、英語の通常使用文字であれば、当該図形は数字「8」の下側20%欠損しか有り得ないので、排他部分文字となる。
この場合は、図6に示すように、排他部分文字テーブル34に下側欠損20%の「8」といったものを登録しておくことで、実際に下側欠損20%の「8」が認識された場合には、数字辞書の認識だけでも間違いなく20%隠れた「8」だと判断することが可能となる。
なお、図7(b)は、たとえば、日本語の通常使用文字であれば、当該図形は漢字「東」の下側30%欠損のほかに、漢字「車」や「恵」などの下側欠損の可能性もあるため、排他部分文字とならない。また、図10(b)は、たとえば、英語の通常使用文字であれば、当該図形は英語「E」の下側70%欠損のほかに、英語「F」の下側70%欠損の可能性もあるため、排他部分文字とならない。
こうして、排他部分文字テーブル34にある割合の欠損文字で高スコア認識された場合(ステップS10)、認識辞書の欠損割合から文字列の欠損部分の高さH1(図5参照)が推定できる(ステップS11)。もちろん、認識処理に100%というものは存在しないので、高スコアで認識されたものが3つ以上必要など、精度を上げるために高さ推定処理に移行する制限を設けても構わない。
ステップS10において文字列欠損部分の高さ推定ができなかった場合、先の数字認識のスコアを羅列していったときに、同じ割合で連続して高スコアを取得している場所があるかどうかをチェックしていく(ステップS12)。数字は郵便番号や番地などで連続することが多いため、同じ割合の欠損文字辞書で連続して高スコアが出るような場合は実際に欠損している場所だと判断することが可能となる。
ステップS12の判定において高スコアが連続する場合、認識辞書の欠損割合からそのまま文字列の欠損部分の高さH1(図5参照)が推定できる(ステップS13)。
ステップS12の判定において高スコアが連続しない場合、対象文字列にハイフンらしき文字が存在しているかどうかを文字認識で確認する(ステップS14)。ハイフンらしき文字が検出できた場合には、ハイフンは一般に文字の中央高さに記載されるので、図8、図11に示すように、ハイフン以外のその他の文字の高さから文字列の欠損部分の高さH2を推定することが可能となる(ステップS15)。
すなわち、図8、図11の例は、文字列の上側が欠損しているので、ハイフンから文字列の下端までの高さH3を推定でき、この高さH3の倍の位置を文字列の高さH4と推定することができる。そして、この推定した文字列の高さH4と欠損している文字の高さH5から欠損部分の高さH2を推定(H2=H4−H5)することができるものである。
これは認識対象の言語やフォントによって推定高さが微妙に変わるため、随時必要に応じた高さ推定をしてよい。ここでのキーポイントは、ハイフンの認識で欠損部分の高さ検出が可能となることにある。
また、たとえば、宛先情報の郵便番号や番地など数字とハイフンは近接して記載されることが多いため、先のステップS11やS13で欠損部分の高さ推定を行なうに至らなかった場合でも、ハイフンの認識結果との位置関係が近接しているという条件を加えることで、さらに誤りなく高さ推定することが可能となる。こうして、ハイフン文字を見つけた場合も高さ推定が実行できる。
なお、ステップS10〜S15までの3種類の高さ推定処理に関しては、それぞれ独立で行なっても構わないし、全てを実施して優先順位付けしてもよいし、各推定結果の平均値をとるなど、統合した欠損部分の高さ推定値を改めて取ってもよい。
ステップS14の判定においてハイフンらしき文字が検出できない場合、文字列の欠損部分の高さを推定することができないので、通常の宛先情報の認識処理を行なって終了となる(ステップS16)。
ステップS11あるいはS13あるいはS15において、文字列の欠損部分の高さが推定されると、その高さ推定結果を受けた認識部25は、受取った高さ推定結果から、何割欠損の欠損文字辞書を用いるかを確定し(ステップS17)、確定した欠損文字辞書を辞書部26から選択して対象文字列に対する文字認識処理を行なう(ステップS18)。
すなわち、高さ推定結果から、対象文字列が本来どの高さで文字認識すれば最適かを判断し、判明したら、その欠損具合の文字カテゴリだけに絞って文字認識を行なう。この場合、あらかじめ全ての文字カテゴリの欠損文字辞書を持たせていても構わないし、テンプレートマッチングなどの場合はテンプレートとして使用する範囲を欠損部分の高さがわかってから指定して文字認識してもよい。
次に、文字列検証部29は、ステップS18における指定された欠損文字辞書での文字認識結果を用いて、データベース30内の住所データとのマッチング処理を行ない(ステップS19)、その結果を最終的な認識結果として区分部23へ出力する(ステップS20)。
以上説明したように上記実施形態によれば、高さ推定処理により文字列の隠れている部分の高さが精度よく見つけることができるので、隠れている文字列の高さが他の文字列の高さと異なる場合にも効果的に文字認識が行なえ、かつ、隠れによる文字の欠けが大きな場合にも効果的に文字認識が行なえ、さらに、隠れ度合いが文字ごとに異なる場合にも文字認識が可能となり、文字列の認識精度が著しく向上する。したがって、郵便物区分装置などの省力化機器に用いた場合に省力効果が著しく向上する。
なお、前記実施形態では、窓付き郵便物をその宛先情報に基づき区分処理する区分装置に適用した場合について説明したが、これに限定されるものでなく、たとえば、銀行券等の有価証券や小荷物等の配達物など、文字列により区分先を示す区分情報が表示されている物体を区分情報に基づいて区分処理する区分装置であれば適用可能である。
11…窓付き郵便物(物体)、12…窓、13…宛先情報(区分情報)、21…郵便物供給部、22…搬送路(搬送手段)、23…区分部(区分手段)、24…読取部(読取手段)、25…認識部(認識手段)、26…辞書部、27…隠蔽文字列候補検出・確認部(隠蔽文字列候補検出・確認手段)、28…隠蔽文字列高さ推定部(隠蔽文字列高さ推定手段)、29…文字列検証部(文字列検証手段)、30…データベース、34…排他部分文字テーブル。

Claims (11)

  1. 複数の文字が列状に記載された文字列を認識する文字認識装置において、
    前記文字列の一部が隠蔽されている状況下で、隠蔽されている可能性のある文字部分を検出して隠蔽文字列領域候補とする隠蔽文字列候補検出手段と、
    この隠蔽文字列候補検出手段により検出された隠蔽文字列領域候補に対して実際に文字が隠蔽されているか否かを確認する確認手段と、
    この確認手段の確認結果に基づき対象文字列の認識処理を行なう認識手段と、
    を具備したことを特徴とする文字認識装置。
  2. 前記隠蔽文字列候補検出手段により検出された隠蔽文字列領域候補の輪郭追跡を行ない、輪郭追跡の方向成分のばらつきを確認することにより、前記検出された隠蔽文字列領域候補が実際の隠蔽文字列領域であるか否かを確認する隠蔽文字列候補確認手段をさらに具備したことを特徴とする請求項1記載の文字認識装置。
  3. 前記確認手段により文字が隠蔽されていると判断された場合、当該対象文字列に対して高さを推定する隠蔽文字列高さ推定手段をさらに具備し、
    前記認識手段は、前記隠蔽文字列高さ推定手段により推定された文字列の高さに基づき文字列の認識処理を行なうことを特徴とする請求項1記載の文字認識装置。
  4. 前記隠蔽文字列高さ推定手段は、対象文字列に対して隠蔽用部分文字認識辞書を用いて文字認識を行ない、高スコアの認識結果が連続して得られた場合に、文字列の隠蔽部分の高さを推定することを特徴とする請求項3記載の文字認識装置。
  5. 前記隠蔽用部分文字認識辞書を用いた文字認識結果に対して、対象言語のその他の文字では存在し得ない部分文字をあらかじめマーキングしておくことにより、文字列の隠蔽高さ推定のキーとすることを特徴とする請求項4記載の文字認識装置。
  6. 前記隠蔽文字列高さ推定手段は、文字列中のハイフンを検出することで文字列の隠蔽部分の高さを推定することを特徴とする請求項3記載の文字認識装置。
  7. 複数の文字が列状に記載された文字列を認識する文字認識方法において、
    前記文字列の一部が隠蔽されている状況下で、隠蔽されている可能性のある文字部分を検出して隠蔽文字列領域候補とする第1のステップと、
    この第1のステップにより検出された隠蔽文字列領域候補に対して実際に文字が隠蔽されているか否かを確認する第2のステップと、
    この第2のステップの確認結果に基づき対象文字列の認識処理を行なう第3のステップと、
    を具備したことを特徴とする文字認識方法。
  8. 文字列により区分先を示す区分情報が表示されている物体を前記区分情報に基づいて区分処理する区分装置において、
    前記物体を搬送する搬送手段と、
    この搬送手段により搬送される前記物体の画像を読取る読取手段と、
    この読取手段により読取られた画像から前記区分情報を示す文字列を認識する文字認識手段と、
    この文字認識手段により認識された区分情報としての文字列に基づき前記物体を区分する区分手段とを具備し、
    前記文字認識手段は、
    前記文字列の一部が隠蔽されている状況下で、隠蔽されている可能性のある文字部分を検出して隠蔽文字列領域候補とする隠蔽文字列候補検出手段と、
    この隠蔽文字列候補検出手段により検出された隠蔽文字列領域候補に対して実際に文字が隠蔽されているか否かを確認する確認手段と、
    この確認手段の確認結果に基づき対象文字列の認識処理を行なう認識手段と、
    を具備したことを特徴とする区分装置。
  9. 前記物体は、窓付き郵便物であって、区分情報を示す文字列の一部が前記窓に隠されている郵便物であることを特徴とする請求項8記載の区分装置。
  10. 前記隠蔽文字列候補検出手段により検出された隠蔽文字列領域候補の輪郭追跡を行ない、輪郭追跡の方向成分のばらつきを確認することにより、前記検出された隠蔽文字列領域候補が実際の隠蔽文字列領域であるか否かを確認する隠蔽文字列候補確認手段をさらに具備したことを特徴とする請求項8記載の区分装置。
  11. 前記確認手段により文字が隠蔽されていると判断された場合、当該対象文字列に対して高さを推定する隠蔽文字列高さ推定手段をさらに具備し、
    前記認識手段は、前記隠蔽文字列高さ推定手段により推定された文字列の高さに基づき文字列の認識処理を行なうことを特徴とする請求項8記載の区分装置。
JP2011191506A 2010-09-16 2011-09-02 文字認識装置、文字認識方法および区分装置 Pending JP2012084132A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2011191506A JP2012084132A (ja) 2010-09-16 2011-09-02 文字認識装置、文字認識方法および区分装置
US13/229,881 US20120072013A1 (en) 2010-09-16 2011-09-12 Character recognition apparatus, sorting apparatus, sorting control apparatus, and character recognition method
EP11181155A EP2431920A2 (en) 2010-09-16 2011-09-13 Character recognition apparatus, sorting apparatus, sorting control apparatus, and character recognition method
KR1020110092890A KR20120029351A (ko) 2010-09-16 2011-09-15 문자 인식 장치, 구분 장치, 구분 제어 장치 및 문자 인식 방법
CN2011102744008A CN102402682A (zh) 2010-09-16 2011-09-16 文字识别装置、区分装置、区分控制装置,以及文字识别方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010208493 2010-09-16
JP2010208493 2010-09-16
JP2011191506A JP2012084132A (ja) 2010-09-16 2011-09-02 文字認識装置、文字認識方法および区分装置

Publications (1)

Publication Number Publication Date
JP2012084132A true JP2012084132A (ja) 2012-04-26

Family

ID=46242879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011191506A Pending JP2012084132A (ja) 2010-09-16 2011-09-02 文字認識装置、文字認識方法および区分装置

Country Status (1)

Country Link
JP (1) JP2012084132A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140107163A (ko) * 2014-08-13 2014-09-04 최승규 파쇄된 문서를 복구 하는 장치 및 방법
JP2016177754A (ja) * 2015-03-23 2016-10-06 日本電気株式会社 文字抽出装置、文字抽出方法及び文字抽出プログラム
JP2021092999A (ja) * 2019-12-11 2021-06-17 京セラドキュメントソリューションズ株式会社 画像処理装置及び画像処理装置の制御方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04148391A (ja) * 1990-10-11 1992-05-21 Nec Corp 光学的文字読取装置
JPH06150069A (ja) * 1992-11-09 1994-05-31 Oki Electric Ind Co Ltd 光学的文字認識装置及び該装置の辞書を備えた計数機器読取装置
JPH09185726A (ja) * 1995-12-28 1997-07-15 Nec Corp 罫線除去方式
JP2007075761A (ja) * 2005-09-15 2007-03-29 Toshiba Corp 区分装置および区分処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04148391A (ja) * 1990-10-11 1992-05-21 Nec Corp 光学的文字読取装置
JPH06150069A (ja) * 1992-11-09 1994-05-31 Oki Electric Ind Co Ltd 光学的文字認識装置及び該装置の辞書を備えた計数機器読取装置
JPH09185726A (ja) * 1995-12-28 1997-07-15 Nec Corp 罫線除去方式
JP2007075761A (ja) * 2005-09-15 2007-03-29 Toshiba Corp 区分装置および区分処理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140107163A (ko) * 2014-08-13 2014-09-04 최승규 파쇄된 문서를 복구 하는 장치 및 방법
KR101635675B1 (ko) 2014-08-13 2016-07-01 최승규 파쇄된 문서를 복구 하는 장치 및 방법
JP2016177754A (ja) * 2015-03-23 2016-10-06 日本電気株式会社 文字抽出装置、文字抽出方法及び文字抽出プログラム
JP2021092999A (ja) * 2019-12-11 2021-06-17 京セラドキュメントソリューションズ株式会社 画像処理装置及び画像処理装置の制御方法

Similar Documents

Publication Publication Date Title
US6360001B1 (en) Automatic location of address information on parcels sent by mass mailers
JP2734386B2 (ja) 文字列読み取り装置
JP6286866B2 (ja) 画像処理装置および画像処理方法
KR20120029351A (ko) 문자 인식 장치, 구분 장치, 구분 제어 장치 및 문자 인식 방법
JPH11226513A (ja) 郵便物宛先読取装置及び郵便物区分装置
EP0564827A2 (en) A post-processing error correction scheme using a dictionary for on-line handwriting recognition
JP5621777B2 (ja) 単語認識装置、方法及びプログラムが格納された非一時的なコンピュータ可読媒体並びに発送物区分装置
US20160259988A1 (en) Delivery system and computer readable storage medium
JP4834351B2 (ja) 文字認識装置及び文字認識方法
JP4855698B2 (ja) 宛先認識装置
US8170290B2 (en) Method for checking an imprint and imprint checking device
JP2012084132A (ja) 文字認識装置、文字認識方法および区分装置
EP2138959A1 (en) Word recognizing method and word recognizing program
CN112949523A (zh) 从身份证影像图片中提取关键信息的方法与系统
JPH06124366A (ja) 住所読取装置
CN109299628A (zh) 一种条码的译码方法及装置
JP5178851B2 (ja) 宛先認識装置
KR101013883B1 (ko) 배송분류정보 생성방법 및 장치, 그에 따른 운송장
KR102627591B1 (ko) 문서로부터 정보를 추출하기 위한 장치의 동작 방법 및 그 장치
Lee et al. Rapid analytical verification of handwritten alphanumeric address fields
JPH11226516A (ja) カスタマバーコード印字郵便物上の宛名読み取り装置
KR20230013836A (ko) 컴퓨터를 이용한 문서 분류 및 문자 추출 방법
AU2001235944B2 (en) Automatic location of address information on parcels sent by mass mailers
JPH07160831A (ja) 手書き文字認識結果のリジェクト方法
JP2004178280A (ja) 英文住所認識方法および装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131205

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131212

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131219

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20131226

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20140109

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140307

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141104

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150512