JP3204259B2 - 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置 - Google Patents

文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置

Info

Publication number
JP3204259B2
JP3204259B2 JP28517799A JP28517799A JP3204259B2 JP 3204259 B2 JP3204259 B2 JP 3204259B2 JP 28517799 A JP28517799 A JP 28517799A JP 28517799 A JP28517799 A JP 28517799A JP 3204259 B2 JP3204259 B2 JP 3204259B2
Authority
JP
Japan
Prior art keywords
pixel group
character string
connected pixel
character
elongated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP28517799A
Other languages
English (en)
Other versions
JP2001109844A (ja
Inventor
弘晏 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP28517799A priority Critical patent/JP3204259B2/ja
Priority to US09/680,018 priority patent/US6798895B1/en
Publication of JP2001109844A publication Critical patent/JP2001109844A/ja
Application granted granted Critical
Publication of JP3204259B2 publication Critical patent/JP3204259B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば郵便物の宛
名自動読み取り機などに用いられる画像処理装置等に関
し、特に日本語手書き宛名文字等の不整合な文字列を抽
出するのに適当な画像処理装置等に関する。
【0002】
【従来の技術】例えば、郵便物の処理分野では、大量に
存在する郵便物を連日、短時間にて処理する必要があ
る。従前では、人間による目視と手作業による分類がな
されており、郵便局員の負担が非常に大きかった。その
ために、自動化読み取り装置による機械化が進められ、
例えば、我が国における郵便番号欄に記載された郵便番
号の読み取り等、送達区域毎の区分には大きな進展が見
られている。しかしながら、郵便番号欄が設けられてい
ない諸外国の郵便物では、郵便番号の位置を認識するこ
とが難しい。また、ますます増加が予想される今後の郵
便物処理において、郵便番号以外に郵便物上の宛名情報
を即座に読み取り、送達区域に区分する技術の発展は、
将来においても強く望まれている技術事項である。
【0003】このように、郵便番号欄が無い郵便物から
郵便番号を抽出することや、宛名情報の読み取りについ
て、その要望は強いものの、現状の技術では郵便物から
これらの情報を読み取ることは非常に難しい。これは、
郵便物には、宛名領域以外に差出人の領域や広告情報、
絵、写真等の様々な模様が含まれており、かつ、手書き
と印刷文字の混在や、縦書きや横書き等、バリエーショ
ンの数があまりにも多いことがその主たる理由である。
その為に、これらの混在する情報の中から郵便番号や宛
名情報を正しく抽出するためには、全ての領域をサーチ
する等、非常に複雑な処理が必要となる。特に日本語に
よる手書きの宛名は、縦書き、横書きの混在による問題
の他、宛名を形成する手書き文字が不規則に並んでいる
場合が多く、良好な宛名読み取りを実行することが特に
難しい。
【0004】ここで、宛名情報を抽出する既存の方法と
して、まず、宛名領域を抽出した後に実際の宛名を読み
取る技術が存在する。例えば、印字宛名はラベルとして
郵便物に貼り付けられていると仮定し、その反射属性や
ラベルの有するエッジの影を検出して宛名領域を抽出す
る方法や、横方向と縦方向に関して投影を取り、濃度の
高い場所を文字行として宛名領域を推定する方法があ
る。また、特開平7-265807号公報では、近接し
ている画素連結成分を統合化して文字行を推定し、また
更にそれを統合化して宛名領域の候補とする技術が開示
されている。
【0005】
【発明が解決しようとする課題】しかしながら、印字宛
名がラベルとして貼り付けられていると仮定して領域を
抽出する方法では、ラベルが貼られておらず印字宛名が
直接、郵便物に記載されている場合には全く対応するこ
とができず、抽出できる郵便物が大きく限定される。特
にラベルが殆ど用いられない手書き日本語宛名に対して
この技術を適用することは困難である。また、濃度の高
い場所を文字行として推定する方法では、背景部に多く
の画像情報が存在し複雑な模様のある郵便物に対して宛
名領域以外との区別をつけることが難しく、正確な宛名
領域を検出することができない。更に、特開平7-26
5807号公報に開示された技術では、文字が比較的き
れいに並んでおり、且つ文字列が比較的密に並んでいる
ことを想定しており、印刷文字の宛名にはある程度適用
できても、不規則な手書きの宛名に適用した場合、充分
な結果は期待できない。また、この技術では、全画素か
ら固まりを拾い、それを全部サーチする作業を固まり毎
に全て繰り返す、といった全画素内における複雑な統合
化処理を施す必要性がある。その為に、ロジックが非常
に難しく、処理速度が非常に遅くなると共に、構成があ
まりにも複雑となり、システム上からみて現実的なもの
とは言い得ない。
【0006】本発明はこのような課題を解決するために
なされたものであって、全画素内での複雑な統合化処理
を避け、精度高く高速に手書き宛名等の文字列を抽出す
ることを主たる目的とする。また、他の目的は、文字列
の並びが不規則な宛名であっても実用に耐え得る文字列
抽出を提供することにある。更に他の目的は、縦書き、
横書きが混在した郵便物等の画像に対しても、柔軟性を
持たせ、且つ容易な処理により文字列を抽出することに
ある。また更に他の目的は、印刷文字列等の整合がとれ
た文字列と、日本語手書き宛名等のように不規則な文字
列に対して、アルゴリズムを変えて処理することで、柔
軟性が高く、かつ高精度な文字列抽出を提供することに
ある。
【0007】
【課題を解決するための手段】かかる目的のもと、本発
明の文字列抽出方法は、入力された画像から所定の大き
さを有する連結画素群を抽出するステップと、この連結
画素群に対して縦方向または横方向に伸ばし、伸ばした
方向と直交する方向については縮める伸縮ステップと、
この伸縮ステップにより伸縮された連結画素群を伸ばさ
れた方向に結合させて細長連結画素群を抽出するステッ
プと、抽出されたこの細長連結画素群に対して算出され
た評価点に基づいて文字列候補を抽出するステップとを
備えたことを特徴としている。
【0008】この連結画素群を抽出するステップとして
は、上下、左右、斜めの8連結画素群や、上下、左右の
4連結画素群を用いて抽出し、所定の閾値に入るものを
抽出する方法が挙げられる。また、この連結画素群を抽
出するステップは、連結画素群の縦方向および/または
横方向を、想定される文字サイズが有する所定の縦方向
および/または横方向と比較することにより連結画素群
を抽出することを特徴とすることもできる。これによれ
ば、例えば、手書き文字と予想される文字サイズを考慮
して閾値を定めて比較することで、模様等が混在した郵
便物からノイズを取り除いた状態で連結画素群を検出す
ることが可能となる。より具体的には、例えば、連結画
素群の高さまたは幅が第1の定数値(例えば4本/mmに
圧縮した解像度で110画素)以下であれば抽出する構
成が挙げられる。
【0009】また、この伸縮ステップは、連結画素群の
大きさに基づいて伸ばす量および/または縮める量を変
更することを特徴とすれば、バリエーションの多い手書
き文字のサイズに対応できる点で好ましい。より具体的
には、連結画素群の伸ばす方向の長さがLであれば、そ
の両側にLずつ伸ばすことが挙げられる。更に、この伸
縮ステップでは、縦方向を伸ばした場合には横方向を縮
め、横方向を伸ばした場合には縦方向を縮めており、隣
り合う文字同士の接触を防いで文字列を抽出することが
可能となる点で優れている。
【0010】また、画像を所定の大きさに区分したメッ
シュ画像を想定し、抽出された閾値内連結画素群に対応
するメッシュ画像をONとするステップと、ONとされ
たメッシュ画像の連結状態から特定領域を抽出するステ
ップとを更に具備することを特徴とすることができる。
更に、画像が印刷文字を宛名文字とする場合にはこのメ
ッシュ画像をONとするステップに移行し、この画像が
手書き文字を宛名文字とする場合には細長連結画素群を
抽出するステップに移行することを特徴とすれば、印刷
文字についてはより簡単な領域抽出方法にて宛名領域を
抽出することができ、処理の高速化が図れる点で優れて
いる。尚、このメッシュ画像により特定領域を抽出する
方法は、1画素1ピクセルの世界から所定の矩形エリア
であるメッシュ画像の世界に移行し、このメッシュ画像
を1ポイントとして簡易化する方法であることから、よ
り簡単なアルゴリズムで特定領域を抽出することが可能
となる。
【0011】また、本発明の文字列抽出方法は、入力さ
れた手書き文字を含む画像から所定の大きさを有する画
素群を抽出し、この画素群の一方向を伸ばし他方向を縮
めることで伸ばした方向への文字列の紐を想定し、複数
からなる想定されたこの文字列の紐の状態を検出し、検
出されたこの文字列の紐の状態から宛名パターンを推定
することを特徴としている。ここで、検出されるこの文
字列の紐の状態は、紐の長さおよび紐の凹凸状態を含
み、この文字認識の認識処理を実行する順位は、紐の長
さの長いものまたは/および凹凸状態の少ないものに対
して順位を上げることを特徴とすれば、宛名等の文字列
候補として、より適当な文字列を抽出できる点で好まし
い。また、想定される文字列の紐は、画素群の一方であ
る縦または横に対してこの画素群の大きさに所定の割合
を付加して伸ばし、その他方である横または縦に対して
この画素群の大きさに所定の割合を減じて縮め、伸ばさ
れおよび縮められた複数の画素群の連結状態により文字
列の紐が想定されることを特徴とすることができる。
【0012】また、本発明の文字列抽出装置は、2値化
された画像中の黒の連結画素から形成される連結画素群
を検出する連結画素群検出部と、この連結画素群検出部
により検出された連結画素群のうち、大きすぎず小さす
ぎない文字サイズ連結画素群を抽出する文字サイズ連結
画素群抽出部と、この文字サイズ連結画素群抽出部によ
り抽出された文字サイズ連結画素群に対し、仮定文字列
方向には伸ばしこの仮定文字列方向と直交する方向には
縮めることで文字サイズ連結画素群を伸縮させる連結画
素群伸縮部と、この連結画素群伸縮部により伸縮された
複数の連結画素群を、仮定文字列方向に結合させて細長
連結画素群を抽出する細長連結画素群抽出部と、この細
長連結画素群抽出部により抽出された細長連結画素群に
基づいて画像認識すべき文字列を選定する文字列選定部
とを備えたことを特徴としている。更に、この文字サイ
ズ連結画素群抽出部は、郵便物上に記載された手書き文
字のサイズを考慮した閾値を基に文字サイズ連結画素群
を抽出することを特徴とすれば、手書き文字からなる文
字列を抽出する点から好ましい。ここで、この仮定文字
列方向は、縦書き宛名の文字列を考慮する場合には縦方
向であり、横書き宛名の文字列を考慮する場合には横方
向が該当する。
【0013】また、本発明の画像処理装置は、画像を入
力する画像入力手段と、この画像入力手段により入力さ
れた画像から所定の大きさを有する画素群を抽出する画
素群抽出手段と、この画素群抽出手段により抽出された
画素群に対して縦方向と横方向を定義し、この縦方向に
ついては画素群が伸ばされ横方向には縮められた縦方向
伸長画素群を生成する縦方向伸長画素群生成手段と、一
方、画素群抽出手段により抽出された画素群に対して縦
方向と横方向を定義し、この横方向については画素群が
伸ばされ縦方向には縮められた横方向伸長画素群を生成
する横方向伸長画素群生成手段と、縦方向伸長画素群生
成手段により生成された複数の縦方向伸長画素群および
横方向伸長画素群生成手段により生成された複数の横方
向伸長画素群を、それぞれ伸ばされた方向に結合して細
長連結画素群を抽出する細長連結画素群抽出手段と、こ
の細長連結画素群抽出手段により抽出された細長連結画
素群に基づいて文字列候補を抽出する文字列候補抽出手
段と、この文字列候補抽出手段により抽出された文字列
候補に対して画像の認識を行う画像認識手段とを備えた
ことを特徴としている。
【0014】この文字列候補抽出手段は、細長連結画素
群抽出手段により抽出された複数の細長連結画素群に対
し、その長さの長いものに対して優先度を上げて出力す
ることを特徴とすることができる。更に、この文字列候
補抽出手段は、縦方向伸長画素群と横方向伸長画素群と
の交差する画素群に対して評価点を下げて優先度を決定
することを特徴とすれば、偽りの文字列抽出を防ぎ、よ
り実用レベルとして優れた画像処理装置を提供できる点
で好ましい。
【0015】
【発明の実施の形態】以下、添付図面に示す実施の形態
に基づいて、この発明を詳細に説明する。図1は、本実
施の形態における画像処理装置の全体構成を示した説明
図である。同図に示すように、本実施の形態における画
像処理装置は、大きく、文字列抽出装置1と、画像入力
装置2と、画像認識装置3とにより構成される。この画
像入力装置2は、例えば主走査方向にラインセンサを備
え、副走査方向にスキャンして画像を読み取るスキャナ
ーや、フォトによる画像全面の読み取り等の光学的文字
読取装置から構成され、郵便物の全体イメージを取得で
きるように構成されている。また、この画像入力装置2
には、図示しない光電変換回路が備えられ、光学的に読
み取った画像を電気信号に変換するように構成されてい
る。
【0016】次に、本実施の形態における文字列抽出装
置1について説明する。画像入力装置2により出力され
る電気信号は、2値化部11により白画素と黒画素の2
値信号に変換される。また、この2値化部11では、小
さいノイズを除去するノイズ除去も実行される。尚、場
合によっては、画像入力装置2に2値化手段を備え、2
値化された状態で文字列抽出装置1に入力される場合も
あり得る。この場合には、文字列抽出装置1には2値化
部11を有さない態様となるであろう。次に2値化され
た画像データは縮小部12にて縮小される。例えばこの
縮小部12では、8本/mmの解像度を有する画像を4
本/mmの解像度に変換するように構成されており、処
理スピードを上げるために縮小作業が実行される。縮小
方法としては、簡易な方法として、例えば、連続ライン
のANDをとって出力する方法等があるが、領域抽出精
度に影響が出ることから、処理スピードに問題がない場
合には縮小部12を設ける必要はない。また、2値化部
11と縮小部12との順序を逆にすることも可能であ
る。
【0017】この縮小部12から縮小された画像データ
は、連結画素群(CC)検出部13に入力される。本実施
の形態における連結画素群(CC)検出部13では、2値
化された全体イメージから、8連結画素群、即ち黒画素
の8連結からなる連結画素群(Connected Component:C
C)を全て抽出している。この8連結画素群とは、中心
画素に対して左右、上下、斜めの8画素を捉え、これら
の黒画素の連結を取り出すことで連結画素群(CC)を検
出するものである。尚、連結画素群(CC)の検出方法と
しては、左右、上下である4連結画素群を取り出す方法
もあるが、斜め方向の画素が切れてしまうことから、斜
め方向の繋がりも考慮して、経験上、8連結画素群を採
用することが好ましい。
【0018】閾値格納部15には文字サイズを決定する
際に用いる連結画素群(CC)の閾値が格納されている。
文字サイズ連結画素群(CharCC)抽出部14では、連結
画素群(CC)検出部13により検出された連結画素群
(CC)をこの閾値格納部15に格納された閾値と比較
し、閾値内連結画素群である文字サイズ連結画素群(Cha
rCC)を抽出している。この閾値格納部15には、ま
ず、連結画素群(CC)の高さまたは幅が所定量以上の値
を取らないものとして最大定数値が格納されており、例
えば110といった閾値が格納されている。この値は、
印刷等がなされた郵便物における大きな模様や長い罫線
を取り除くために設けられるもので、4本/mmの解像
度で110画素、即ち約27mmを超える連結画素群
(CC)は文字サイズ連結画素群(CharCC)から除かれる
ように定められている。また、連結画素群(CC)の長方
形領域(矩形領域)が所定大きさ以下の値を取らないよう
な条件として、長方形領域の短いものが3以上、長いも
のが8以上という値も格納されている。この値は、細い
線はラベルにおけるエッジ等、ノイズの可能性があるこ
とや、破線等を取り除く意味から、3画素×8画素以下
の長方形領域を取り除くように定められている。
【0019】一方、文字サイズ連結画素群(CharCC)抽
出部14により抽出された文字サイズ連結画素群(Char
CC)は、サイズ判定部16に入力される。このサイズ
判定部16では、例えば、大き目の文字サイズ連結画素
群(CharCC)のピッチを測定し、そのピッチが大きいも
のは手書き文字の可能性が高く、小さいものは印刷文字
の可能性が高い、との判定がなされるように構成されて
いる。これは、一般に手書き文字だと文字間のピッチが
ばらつくことに鑑み、ばらつきが見られた場合には印刷
文字の可能性が低いと判定するものである。このサイズ
判定部16の結果を受けて、手書き文字の可能性が高い
と判定される場合には手書き文字列抽出部20にて文字
列の抽出を実行し、印刷文字の可能性が高いと判定され
る場合には印刷文字列抽出部40にて文字列の抽出が実
行される。尚、サイズ判定部16の判定は、上記の方法
に限られず、例えば、サイズ毎の文字サイズ連結画素群
(CharCC)の頻度分布を測定して判定する等、任意の方
法により、またこれらの組み合わせにて判定できるよう
に構成することも可能である。
【0020】次に、本実施の形態における手書き文字列
抽出部20の構成について説明する。サイズ判定部16
により手書き文字の可能性が高いと判定された場合に、
文字列方向が縦方向と横方向とを仮定し、それぞれの処
理を独立に実行する。まず、文字列方向が横方向である
と仮定する処理の場合、横方向伸長部21では、抽出さ
れた文字サイズ連結画素群(CharCC)に対し、その仮定
文字列方向である横方向に伸ばし、その仮定文字列方向
と直交する方向である縦方向に縮める処理を行う。この
伸縮された文字サイズ連結画素群(CharCC)は、Hor
第1バッファ23に格納される。また、細長連結画素群
(LongCC)抽出部25では、この伸縮された文字サイズ
連結画素群(CharCC)を結合させて横方向の細長連結画
素群(LongCC)を抽出する。横方向評価部27は、抽出
された細長連結画素群(LongCC)の連結状態を評価し、
その評価結果を文字列選定部30に出力する。
【0021】一方、文字列方向が縦方向であると仮定す
る処理の場合、縦方向伸長部22では、抽出された文字
サイズ連結画素群(CharCC)に対し、その仮定文字列方
向である縦方向に伸ばし、その仮定文字列方向と直交す
る方向である横方向に縮める処理を行う。この伸縮され
た文字サイズ連結画素群(CharCC)は、Ver第1バッ
ファ24に格納される。また、細長連結画素群(LongC
C)抽出部26では、この伸縮された文字サイズ連結画
素群(CharCC)を結合させて縦方向の細長連結画素群(L
ongCC)を抽出する。縦方向評価部28は、抽出された
細長連結画素群(LongCC)の連結状態を評価し、その評
価結果を文字列選定部30に出力する。
【0022】文字列選定部30では、Hor第1バッフ
ァ23とVer第1バッファ24に格納されている細長
連結画素群(LongCC)を混ぜた状態にて、横方向評価部
27および縦方向評価部28から出力された評価点の高
いものから順にソートする。また、文字列閾値格納部2
9に格納されている閾値情報に基づき、ソートされた順
番に閾値以上の評価点であれば文字列と決定している。
ここで、本実施の形態では、後述するように、ある横方
向の細長連結画素群(LongCC)が文字列として選定され
た場合、この横方向の細長連結画素群(LongCC)は、直
交する縦方向の文字列をその後に選定する際の減点材料
とするように構成されている。その為、細長連結画素群
(LongCC)が横方向であれば、直交する減点用のVer
第2バッファ32に減点用矩形領域情報(LongCCの外
接長方形)を格納している。同様に、細長連結画素群(Lo
ngCC)が縦方向であれば、直交する減点用のHor第
2バッファ31に減点用矩形領域情報を格納している。
文字列選定部30では、順次、評価点の減点を実施しな
がら文字列候補に順序を付けてソートし直し、この評価
点の高いものから画像認識装置3に対して文字列情報を
送り込んでいる。画像認識装置3では、2値化部11か
らの全体画像の2値化信号と、文字列選定部30からの
文字列情報に基づいて、通常の場合、複数の宛名候補領
域が抽出されるが、評価点の高い、優先順の高い領域か
ら順に宛名読み取りが実行され、満足な結果が得られた
段階で読み取り作業を終了させている。
【0023】次に、本実施の形態における印刷文字列抽
出部40の構成について説明する。この印刷文字列抽出
部40では、文字サイズ連結画素群(CharCC)の大きさ
が比較的小さい、例えば閾値として4本/mmの解像度
で30画素、即ち約8mm以下の文字について処理され
る。まず、メッシュ画像形成部41では、画像を小エリ
アに分割して1ポイントとして簡易化した矩形領域を想
定する所謂メッシュ画像を形成している。このメッシュ
の分割方法は、例えば、想定される宛名の中から大き目
の文字サイズに均等する範囲でメッシュの大きさを決定
することが有効であり、例えば、最大の文字サイズ連結
画素群(CharCC)が30画素であれば、予め定めた大き
さである24画素×24画素の小エリアからなる矩形領
域でメッシュに分割するように構成されている。
【0024】次に、対応メッシュ画像検出部42では、
抽出された閾値内連結画素群である文字サイズ連結画素
群(CharCC)が、メッシュ画像形成部41により想定さ
れた矩形領域であるメッシュ画像のどれに属するか(ど
れに対応するか)を検出し、対応矩形領域を選定してメ
ッシュ画像をONとしている。この検出の方法として
は、例えば、抽出された文字サイズ連結画素群(CharC
C)の中心座標が属するメッシュ画像をONとする方法
が挙げられる。また、メッシュ画像形成部41にて小さ
目のメッシュが想定されている場合には、文字サイズ連
結画素群(CharCC)の長方形が少しでも重なっているメ
ッシュ画像をONとする方法もある。この対応メッシュ
画像検出部42からの出力を受け、メッシュ画像連結検
出部43では、ONとなったメッシュの連結状態を検出
する。例えば、一行分離れていても同一領域とするため
に縦と横に関してONとなったメッシュに挟まれている
1単位のメッシュをONとする。また、メッシュ画像の
中で、メッシュが縦、横に繋がっている4連結や、それ
に斜めの繋がりを考慮した8連結の連結メッシュ(Conne
cted Mesh:CM)を検出している。
【0025】このメッシュ画像連結検出部43からの結
果を受け、属性情報格納部44からの属性情報を加味し
て特定領域抽出部45により宛名領域候補が抽出され
る。この属性情報格納部44には、宛名領域候補とし
て、そのサイズが小さすぎず大きすぎないものを選定す
るための閾値情報が格納されている。また、例えば、2
行以上の文字列があるか、十分な数の連結画素群(CC)
があるか、文字列の形がそれらしいか等の属性情報が格
納されている。また、郵便物の宛名情報は、通常、その
郵便物の中央に寄っていることが多いことから、全体イ
メージの端に寄っていないか、領域が中央に近いか等の
属性情報も格納されている。特定領域抽出部45では、
この属性情報格納部44からの属性情報に基づいて、例
えばメッシュ画像連結検出部43による連結メッシュ
(CM)に対して評価点を付けることで宛名領域候補であ
る特定領域を抽出している。この結果、宛名領域を数個
に限定することができ、実際に宛名を認識する画像認識
装置3にこの結果を出力することで、宛名の読み取り精
度を格段に向上させることができると共に、宛名読み取
りの高速化を図ることができる。印刷文字列抽出部40
の後処理装置である画像認識装置3では、2値化部11
からの全体画像の2値化信号と、特定領域抽出部45か
らの領域情報に基づいて、例えば評価点の高い、優先順
の高い領域から順に宛名読み取りが実行され、満足な結
果が得られた段階で読み取り作業を終了させている。
【0026】このように、本実施の形態における印刷文
字列抽出部40では、1画素1ピクセルである画素単位
の世界から、所定の大きさを有するエリアであるメッシ
ュの世界へ移し、このメッシュを1ポイントとして簡易
化する方法を採用しているために、既存の方式に比べて
簡単なアルゴリズムで高速に宛名領域を抽出できる。更
に、宛名の文字サイズやメッシュの連結性、属性情報等
を加味して抽出することで、精度の高い領域抽出を実現
している。また、評価点を付与して優先順位の高い領域
から宛名読み取りを実行することで、無駄な宛名読み取
り作業を極力、少なくし、更に効率的かつ迅速な宛名読
み取りが可能となる。
【0027】次に、本実施の形態における郵便物の宛名
読み取り作業の流れを、図1〜図14を用いて説明す
る。ここで、図2は、本実施の形態における手書き文字
列を主とする宛名読み取りの大まかなフローを示してい
る。また、図3〜図8は第1の実用例として、元画像
(図3)、文字サイズ連結画素群(CharCC)の抽出状態
(図4)、横方向細長連結画素群(横方向LongCC)の抽出
状態(図5)、縦方向細長連結画素群(縦方向LongCC)の
抽出状態(図6)、文字列を選定して順位付けをした状態
(図7)、元画像と重ね合わせて抽出文字列を表現したも
の(図8)を示している。
【0028】まず、画像入力装置2により郵便物の画像
が読み取られる(ステップ101)。図3に示すような郵
便物50には、宛名情報51の他、郵便番号52や配信
情報53、差出人情報54や絵柄55等、多種多様な画
像情報が含まれている。これらの画像情報は2値化部1
1により適切な方法にて2値化され(ステップ102)、
その2値化画像に対して連結画素群(CC)検出部13に
より連結画素群(CC)が検出されてメモリ(図示せず)に
登録される(ステップ103)。この連結画素群(CC)
は、文字サイズ連結画素群(CharCC)抽出部14にて閾
値格納部15に格納されている閾値と比較され、大きす
ぎず小さすぎない文字サイズ連結画素群(CharCC)が抽
出される(ステップ104)。図4は、文字サイズ連結画
素群(CharCC)56を黒い長方形にし、理解し易いよう
に元画像に重ね合わせた状態を示している。図4に示す
ように、ほぼ全ての文字が多種サイズの文字サイズ連結
画素群(CharCC)56として抽出されている。但し、
「・」(点)や「二」の文字は、前述の閾値の条件を満た
していないことから抽出されていない。また、絵柄55
を構成する多くの部分も同様に抽出されていないことが
理解できる。
【0029】次に、文字列方向が縦方向と横方向を仮定
し、以下の処理が独立して実行される(ステップ10
5)。まず、連結画素群伸縮部としての横方向伸長部2
1および縦方向伸長部22では、各文字サイズ連結画素
群(CharCC)を囲む長方形を形成し、その縦と横の長い
方をLとし、その長方形を仮定文字列方向(縦または横)
の両側にLずつ伸ばし、仮定文字列方向と直交する方向
には、例えば(2/3)・Lだけ縮小され(ステップ10
6)、横方向と縦方向に、それぞれ細長連結画素群(Long
CC)が形成される。
【0030】図5は、各文字サイズ連結画素群(CharC
C)を囲む長方形を横方向に伸ばし、縦方向に縮めた状
態を、理解し易いように元画像に重ね合わせた図であ
る。但し、元画像の文字イメージは以下の文字列選定の
処理には用いられない。図5に示すように、文字サイズ
連結画素群(CharCC)の外接長方形を横方向に伸長する
ことにより、横方向に連なった横方向の細長連結画素群
(LongCC)57が形成される。また、縦方向に縮小する
ことで隣り合う文字列同士の接触を防いでいる。また、
図6は、各文字サイズ連結画素群(CharCC)を囲む長方
形を縦方向に伸ばし、横方向に縮めた状態を、理解し易
いように元画像に重ね合わせた図である。同図に示すよ
うに、文字サイズ連結画素群(CharCC)の外接長方形の
長い方をLとし、その長方形を縦方向の両側にLずつ伸
ばし、横方向には長方形を縮小(例えば(2/3)・L)する
ことにより、縦方向に連なった縦方向の細長連結画素群
(LongCC)58が形成される。ここで、本実施の形態で
は、外接長方形の伸縮の値を固定値とはしておらず、文
字サイズ連結画素群(CharCC)のサイズ(L)から決定し
ている。これは、文字(特に手書き)サイズのバリエーシ
ョンが大きく、固定値とするのが妥当でないと共に、文
字間隔は文字サイズにほぼ比例すると考えられるためで
ある。
【0031】次に、その仮定文字列方向への伸長によ
り、細長連結画素群(LongCC)抽出部25および26で
は、文字サイズ連結画素群(CharCC)を結合した細長連
結画素群(LongCC)を抽出し、横方向評価部27と縦方
向評価部28にて評価点が付けられる(ステップ10
7)。例えば、仮定文字列方向に長いほど評価点が高
く、例えば、連結画素群(CC)が、細長連結画素群(Lon
gCC)の中に凹凸が少なく並んでいるほど評価点が高く
なる。但し、この段階では、図3に示される横方向の文
字群である「田」「営」「庁」「(株)」は、本来の文字
列とは異なり直交方向に並ぶ擬似文字列であるにもかか
わらず、図5の細長連結画素群(LongCC)61のように
比較的長くなることから、高い評価点が付与される。
【0032】次に、文字列選定部30では、2つのバッ
ファ(Hor第1バッファ23、Ver第1バッファ2
4)内の細長連結画素群(LongCC)を混ぜて、評価点の
高い順にソートする(ステップ108)。そして、最も評
価点の高い細長連結画素群(LongCC)から順にチェック
し、文字列閾値格納部29に格納されている閾値以上の
評価点を有していれば、文字列と決定する。決定された
文字列と交差している直交細長連結画素群(直交LongC
C)は、その交差面積などに応じて評価点を減点される
(ステップ109)。前述のように、文字列と決定された
細長連結画素群(LongCC)に対し、直交バッファ(Ho
r第2バッファ31、Ver第2バッファ32)に減点
用の黒長方形(LongCCの外接長方形)が書き込まれてい
る。この構成により、例えば交差部分の長さだけ短くさ
れる等、決定された文字列と交差している直交方向の細
長連結画素群(LongCC)は、その黒長方形との交差面積
などに応じて評価点が減点される。以降、文字列選定部
30は、次の順位の細長連結画素群(LongCC)を直交バ
ッファ(Hor第2バッファ31、Ver第2バッファ
32)内の黒長方形による減点を考慮しながら再評価
し、合格点(例えば長さが閾値以上で減点面積が20%
以下)の細長連結画素群(LongCC)を文字列として抽出
する。この抽出結果は、順次、減点用の直交バッファ
(Hor第2バッファ31、Ver第2バッファ32)に
書き込まれる。不合格の場合には、減点用の黒長方形は
書き込まれない。これにより、文字列の密な領域であっ
ても本来の文字方向に統一することが可能となる。
【0033】ここで、減点用の黒長方形は、細長連結画
素群(LongCC)そのものでも良い。また、文字列をチェ
ックする順序は、最初のソート順で固定せず、1つ文字
列が決定される毎にダイナミックに残りの細長連結画素
群(LongCC)をソートし直すことが効果的である。但
し、かかる場合には、処理スピードが遅くなることが懸
念されるため、処理スピードとその効果との兼ね合いで
採用することが好ましい。図7は、文字列を選定して順
位付けをした状態を具体的に示している。図中の数字
(1〜10)は、上位1位から10位までの文字列候補に
順位付けをしたものである。また、英字(a〜f)は、縦
の候補と横の候補の交差部分を、処理順に示したもので
ある。縦長の1位、3位、4位、9位、横長の2位、6
位、7位の文字列候補は、減点なしに文字列として選定
される。図3の郵便番号52に対応する4位の横長文字
列は、「a」の交差部分だけ減点されるが、その比率が
小さいので選択される。8位の縦長文字列は「b」の交
差部分だけ減点されて選択される。10位(図5の細長
連結画素群(LongCC)61)である図3の文字列「田」
「営」「庁」「(株)」は、「c」「d」「e」[f]の
交差部分が減点されることで選択されない。その結果、
本来の文字列ではない、直交方向に並ぶ擬似文字列の選
定を防ぐことが可能となる。
【0034】尚、細長連結画素群(LongCC)の評価点の
閾値によっては、細長連結画素群(LongCC)の交差部分
が縦と横の両方向の文字列に属することがあるが、処理
画像がメモリ(図示せず)に前もって登録してある郵便全
体の宛名パターンのどれに属するかを推定するなどし
て、各文字サイズ連結画素群(CharCC)が複数の文字列
に属さないようにする(ステップ110)。また別法とし
て、文字列選定部30は、縦と横の重複に関し、それぞ
れの文字列の整合性等を再吟味して、各文字サイズ連結
画素群(CharCC)が唯一の文字列に属するようにするこ
ともできる。図8は、元画像と重ね合わせて抽出文字列
を表現したものである。同図において、例えば、郵便番
号文字列62は、宛名文字列59や文字列63と交差し
ているが、この画像は、文字列パターンから、郵便番号
枠付きと、縦書き手書き宛名との組み合わせであると推
定できる。例えば、細長連結画素群(LongCC)の配置
が、図7に示すような上方に存在する5位の横長の文字
列と、その横長文字列の下方に交差し、または少し離れ
た位置に配置された複数の縦長の文字列群1位、8位、
3位、9位、4位が存在する場合を考察する。この場
合、横長の文字列が郵便番号文字列であり、縦長の文字
列群は、右側に存在するほど住所である確率が高く、左
側に存在するほど宛名である可能性が高いと判断し、認
識処理を行う。また、細長連結画素群(LongCC)が横方
向に数段を構成して配置されている場合には、1番上が
郵便番号、そして、住所と宛名が順に出現する可能性が
高いと判断し、その後の認識処理を行う。このようにし
て、この実用例では、郵便番号文字列62が優先され、
宛名文字列59および文字列63から「0」「3」
「5」等の文字サイズ連結画素群(CharCC)が除かれ
る。文字列群中からの郵便番号文字列の推定は、文字列
中の文字サイズ連結画素群(CharCC)の個数、その文字
列の位置、宛名パターンに関する知識などを用いて行う
ことができる。郵便番号文字列と認識された文字列に対
しては、他の文字列の認識処理に先立って、手書きの数
字の辞書とのマッチングにより認識処理が行われ、ま
た、宛名文字列に対しては、手書き名前辞書を用いた認
識処理が行われる。住所文字列に対しては、郵便番号か
ら検索された住所との比較、手書き住所辞書を用いた認
識処理等を複合した認識処理が実行される。ここで、図
8における「IBM」の文字群60は、横書きではある
が、縦書きの文字列63が先に選定されたために、それ
によって減点されて文字列としては選択されていない。
これは、文字列の抽出という単独処理ではなく、文字列
63における認識のフィードバック等によって処理され
るべきものである。
【0035】このように、本実施の形態における手書き
文字列からなる宛名文字列の抽出方法によれば、論理的
に文字サイズ連結画素群(CharCC)を結合する他の手法
に比べ、柔軟性があり処理も容易である。また、優先順
位の高い細長連結画素群(LongCC)から文字列を決定
し、且つそれに直交する細長連結画素群(LongCC)の評
価点を減点するように構成しており、直交方向への偽り
の細長連結画素群(LongCC)を文字列として抽出するの
を防いでいる。その結果、文字列の並びが不規則な宛名
でも実用に充分に耐え得るものである。
【0036】次に、本実施の形態における、主として印
刷文字の宛名読み取り作業の流れを、図1、および図9
〜図14を用いて説明する。ここで、図9は印刷文字の
宛名読み取りの大まかな流れを説明するためのフローチ
ャートである。また、図10〜図14は第2の実用例と
して、元画像(図10)、文字サイズ連結画素群(CharC
C)の抽出状態(図11)、メッシュ画像をONした状態
(図12)、統合化してメッシュ画像をONした状態(図
13)、抽出された宛名領域候補(図14)を示した図で
ある。
【0037】まず、画像入力装置2により郵便物の画像
が読み取られる(ステップ121)。図10に示すような
郵便物70には、宛名情報71の他、料金別納印刷7
2、配信情報73、商標等の表示74、連絡情報75、
背景印刷情報76等、多種多様な画像情報が含まれてい
る。これらの画像情報は2値化部11により適切な方法
にて2値化され(ステップ122)、連結画素群(CC)検
出部13により連結画素群(CC)が検出されてメモリ
(図示せず)に登録される(ステップ123)。この連結画
素群(CC)の中から、大きすぎず小さすぎない文字サイ
ズ連結画素群(CharCC)が文字サイズ連結画素群(Char
CC)抽出部14にて抽出される(ステップ124)。
尚、前述の手書き文字列抽出時と異なり、この印刷文字
の宛名領域の読み取りでは、閾値の最大値が小さい(例
えば30画素)ことが挙げられる。図11では、文字サ
イズ連結画素群(CharCC)を黒い長方形にし、理解し易
いように元画像に重ね合わせたものである。この実用例
では、多くの文字情報が抽出されているが、商標等の表
示74の文字や模様、背景印刷情報76の「M」の文字
82や「2000」の文字83は、30画素を超える大
きな文字として除外されている。また、絵柄84も省か
れている。尚、宛名情報71の「川」の文字80や
「二」の文字81は抽出されていない。
【0038】次に、文字サイズ連結画素群(CharCC)の
中心画素を、メッシュ画像形成部41にて想定された矩
形領域である、簡易化したメッシュ画像のどれに属する
かを対応メッシュ画像検出部42にて計算し、そのメッ
シュを黒メッシュとしている(ステップ125)。図12
に示されるように、ここでは、画像を24画素×24画
素の小エリアでメッシュ88に分割している。ここで
は、メッシュ88の境界線は表示されていない。また、
図10にて説明した宛名情報71の「―」文字部が白に
なっている。このような場合を補間するために、次のス
テップ処理が実行される。即ち、メッシュ画像連結検出
部43では、1行分や1文字分の隙間があっても統合化
するために、上下か左右が黒メッシュである白メッシュ
を黒に変換する(ステップ126)。その結果が図13に
示されている。図12と比較して明らかなように、1行
分や1文字分の隙間があっても統合化がなされて黒に変
換されていることが理解できる。尚、この実用例では行
間を埋める必要性は低いが、通常は、ギャップを埋める
ことにより行間が埋められ、離れた2行を統合化できる
点でこの処理は有効である。これにより、宛名領域の可
能性のある部分が1つの連結メッシュ(CM)としてのブ
ロックとして把握することが可能となる。
【0039】次に、特定領域抽出部45では、1メッシ
ュを1画素のごとく見做し、8連結を囲む長方形を宛名
領域の候補とする(ステップ127)。図14の破線で囲
まれた部分がこのステップにより抽出された部分であ
り、領域90〜94が宛名領域の候補に該当する。ここ
で、図14に示されている郵便物70では、図10で説
明した料金別納印刷72、配信情報73、商標等の表示
74、および背景印刷情報76の一部の連結メッシュ
(CM)が選定されていないことが解る。これらは、例え
ば文字列が1行であったり、充分な連結画素群(CC)が
存在しない等の理由により、宛名領域の候補から除外さ
れたものである。次に、領域内で文字抽出等が行われ、
属性情報格納部44が有する種々の属性で各領域が評価
され、宛名候補として順位付けがなされる(ステップ1
28)。この種々の属性は、前述したように、画像の端
に寄っていないか、文字列の形がそれらしいか等の内容
であり、これによって、図14では、上から順に、領域
90が第1候補、91が第2、92が第3、93が第
4、94が第5として順位付けがなされる。次に、優先
順位の高い領域順に、画像認識装置3にて宛名の認識が
行われ、満足な結果が得られた場合には、そこで宛名認
識を終了させる(ステップ129)。これらの処理の流れ
によって、本実施の形態における一連の郵便宛名の読み
取りが終了する。
【0040】本実施の形態による印字文字列抽出のアル
ゴリズムによれば、宛名領域以外に差出人の領域や様々
な模様を含んだ郵便物に対し、簡単なアルゴリズムで宛
名領域を含む矩形領域を抽出することが可能となる。即
ち、各領域候補が、全体イメージに比べて面積が非常に
狭く、模様やノイズから開放されていること、また、領
域内の文字列が垂直方向か水平方向かが予測できること
から、かかる領域候補に対して宛名認識を実行すること
で検出精度の向上と処理の簡潔化、およびそれに伴う処
理速度の向上を図ることができる。その為に、このアル
ゴリズムによれば、領域内の特にプリンタで印刷された
印字の宛名領域はかなり高い確率にて抽出することが可
能となる。また、手書きであっても、欧米の郵便のよう
に横書きで纏めて書かれた宛名に対して精度良く抽出す
ることが可能となる。
【0041】このように、本実施の形態によれば、印刷
文字のように纏まって宛名が記載されている場合や、手
書きであっても欧米の郵便のように横書きで纏めて書か
れた宛名に対しては、前述の印刷文字列抽出のアルゴリ
ズムによって簡単に処理し、日本語手書き宛名のよう
に、横書き、縦書きが入り混じって不規則な宛名に対し
ては、前述の手書き文字列抽出のアルゴリズムを適用し
て文字列を抽出することができる。その結果、宛名書き
の種類を選ぶことなく、精度高く高速に、宛名領域を含
む文字列を抽出することが可能となる。
【0042】
【発明の効果】以上説明したように、本発明によれば、
全画素内での複雑な統合化処理を避け、精度高く高速に
手書き宛名等の文字列を抽出することができる。
【図面の簡単な説明】
【図1】 本実施の形態における画像処理装置の全体構
成を示した説明図である。
【図2】 本実施の形態における手書き文字列を主とす
る宛名読み取りの大まかな流れを説明するためのフロー
チャートである。
【図3】 第1の実用例における元画像を示す図であ
る。
【図4】 第1の実用例における文字サイズ連結画素群
(CharCC)の抽出状態を示した図である。
【図5】 第1の実用例における横方向細長連結画素群
(横方向LongCC)の抽出状態を示した図である。
【図6】 第1の実用例における縦方向細長連結画素群
(縦方向LongCC)の抽出状態を示した図である。
【図7】 第1の実用例における文字列を選定して順位
付けをした状態を示した図である。
【図8】 第1の実用例における元画像と重ね合わせて
抽出文字列を表現した図である。
【図9】 印刷文字の宛名読み取りの大まかな流れを説
明するためのフローチャートである。
【図10】 第2の実用例における元画像を示す図であ
る。
【図11】 第2の実用例における文字サイズ連結画素
群(CharCC)の抽出状態を示した図である。
【図12】 第2の実用例におけるメッシュ画像をON
した状態を示した図である。
【図13】 第2の実用例における統合化してメッシュ
画像をONした状態を示した図である。
【図14】 第2の実用例における抽出された宛名領域
候補を示した図である。
【符号の説明】 1…文字列抽出装置、2…画像入力装置、3…画像認識
装置、11…2値化部、12…縮小部、13…連結画素
群(CC)検出部、14…文字サイズ連結画素群(CharC
C)抽出部、15…閾値格納部、16…サイズ判定部、
21…横方向伸長部、22…縦方向伸長部、23…Ho
r第1バッファ、24…Ver第1バッファ、25,2
6…細長連結画素群(LongCC)抽出部、27…横方向評
価部、28…縦方向評価部、29…文字列閾値格納部、
30…文字列選定部、31…Hor第2バッファ、32
…Ver第2バッファ、40…印刷文字列抽出部、41
…メッシュ画像形成部、42…対応メッシュ画像検出
部、43…メッシュ画像連結検出部、44…属性情報格
納部、45…特定領域抽出部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平7−265807(JP,A) 特開 平11−219407(JP,A) 特開 昭62−165284(JP,A) 特開 平10−99788(JP,A) 特開 平10−31716(JP,A) 特開 平8−305794(JP,A) 特開 平8−224550(JP,A) 特開 平8−180132(JP,A) 「電子情報通信学会技術研究報告」P RU95−6 Vol.95 No.43 p.41−48(1995)中島昇、土屋徹雄、 上村健”手書き郵便からの宛名行検出に おける試行検証プロセスの導入" (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 340 B07C 3/14 G06T 7/40 100 JICSTファイル(JOIS)

Claims (13)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された画像から所定の大きさを有す
    る連結画素群を抽出するステップと、 前記連結画素群に対して縦方向または横方向に伸ばし、
    伸ばした方向と直交する方向については縮める伸縮ステ
    ップと、 前記伸縮ステップにより伸縮された前記連結画素群を伸
    ばされた方向に結合させて細長連結画素群を抽出するス
    テップと、 前記細長連結画素群に対して算出された評価点に基づい
    て文字列候補を抽出するステップとを備えたことを特徴
    とする文字列抽出方法。
  2. 【請求項2】 前記連結画素群を抽出するステップは、
    連結画素群の縦方向および/または横方向を、想定され
    る文字サイズが有する所定の縦方向および/または横方
    向と比較することにより連結画素群を抽出することを特
    徴とする請求項1記載の文字列抽出方法。
  3. 【請求項3】 前記伸縮ステップは、前記連結画素群の
    大きさに基づいて伸ばす量および/または縮める量を変
    更することを特徴とする請求項1記載の文字列抽出方
    法。
  4. 【請求項4】 入力された手書き文字を含む画像から所
    定の大きさを有する画素群を抽出し、 前記画素群の一方向を伸ばし直交する他方向を縮めるこ
    とで伸ばした方向への細長連結画素群を想定し、 前記細長連結画素群の長さの状態および当該細長連結画
    素群の凹凸状態を検出し、 検出された前記細長連結画素群の状態から付与される評
    価点に基づき宛名パターンを推定することを特徴とする
    手書き文字列抽出方法。
  5. 【請求項5】 前記細長連結画素群の長さの長いものま
    たは/および当該細長連結画素群の凹凸状態の少ないも
    のに対して順位を上げて宛名パターンを推定することを
    特徴とする請求項4記載の手書き文字列抽出方法。
  6. 【請求項6】 想定される前記細長連結画素群は、前記
    画素群の一方である縦または横に対して当該画素群の大
    きさに所定の割合を付加して伸ばし、その他方である横
    または縦に対して当該画素群の大きさに所定の割合を減
    じて縮め、伸ばされおよび縮められた複数の画素群の連
    結状態により当該細長連結画素群が想定されることを特
    徴とする請求項4記載の手書き文字列抽出方法。
  7. 【請求項7】 2値化された画像中の黒の連結画素から
    形成される連結画素群を検出する連結画素群検出部と、 前記連結画素群検出部により検出された前記連結画素群
    のうち、大きすぎず小さすぎない文字サイズ連結画素群
    を抽出する文字サイズ連結画素群抽出部と、 前記文字サイズ連結画素群抽出部により抽出された前記
    文字サイズ連結画素群に対し、仮定文字列方向には伸ば
    し当該仮定文字列方向と直交する方向には縮めることで
    当該文字サイズ連結画素群を伸縮させる連結画素群伸縮
    部と、 前記連結画素群伸縮部により伸縮された複数の前記連結
    画素群を、前記仮定文字列方向に結合させて細長連結画
    素群を抽出する細長連結画素群抽出部と、 前記細長連結画素群抽出部により抽出された前記細長連
    結画素群に対して算出された評価点に基づいて、画像認
    識すべき文字列を選定する文字列選定部とを備えたこと
    を特徴とする文字列抽出装置。
  8. 【請求項8】 前記文字サイズ連結画素群抽出部は、郵
    便物上に記載された手書き文字のサイズを考慮した閾値
    を基に前記文字サイズ連結画素群を抽出することを特徴
    とする請求項7記載の文字列抽出装置。
  9. 【請求項9】 前記画像を所定の大きさに区分したメッ
    シュ画像を想定し、前記文字サイズ連結画素群抽出部に
    より抽出された前記文字サイズ連結画素群に対応するメ
    ッシュ画像をONとする対応メッシュ画像検出部と、 ONとされた前記メッシュ画像の連結状態から特定領域
    を抽出する特定領域抽出部とを更に備えることを特徴と
    する請求項7記載の文字列抽出装置。
  10. 【請求項10】 画像を入力する画像入力手段と、 前記画像入力手段により入力された画像から所定の大き
    さを有する画素群を抽出する画素群抽出手段と、 前記画素群抽出手段により抽出された画素群に対して縦
    方向と横方向を定義し、当該縦方向については当該画素
    群が伸ばされ当該横方向には縮められた縦方向伸長画素
    群を生成する縦方向伸長画素群生成手段と、 前記画素群抽出手段により抽出された画素群に対して縦
    方向と横方向を定義し、当該横方向については当該画素
    群が伸ばされ当該縦方向には縮められた横方向伸長画素
    群を生成する横方向伸長画素群生成手段と、 前記縦方向伸長画素群生成手段により生成された複数の
    前記縦方向伸長画素群および前記横方向伸長画素群生成
    手段により生成された複数の前記横方向伸長画素群を、
    それぞれ伸ばされた方向に結合した細長連結画素群を抽
    出する細長連結画素群抽出手段と、 前記細長連結画素群抽出手段により抽出された前記細長
    連結画素群に対して算出された評価点に基づいて文字列
    候補を抽出する文字列候補抽出手段と、 前記文字列候補抽出手段により抽出された文字列候補に
    対して画像の認識を行う画像認識手段とを備えたことを
    特徴とする画像処理装置。
  11. 【請求項11】 前記文字列候補抽出手段は、前記細長
    連結画素群抽出手段により抽出された複数の前記細長連
    結画素群に対し、その長さの長いものに対して評価点を
    上げることを特徴とする請求項10記載の画像処理装
    置。
  12. 【請求項12】 前記文字列候補抽出手段は、前記縦方
    向伸長画素群と前記横方向伸長画素群との交差する画素
    群に対して評価点を下げることを特徴とする請求項10
    記載の画像処理装置。
  13. 【請求項13】 前記文字列候補抽出手段は、前記縦方
    向伸長画素群と前記横方向伸長画素群との交差面積に応
    じて評価点を下げることを特徴とする請求項12記載の
    画像処理装置。
JP28517799A 1999-10-06 1999-10-06 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置 Expired - Fee Related JP3204259B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP28517799A JP3204259B2 (ja) 1999-10-06 1999-10-06 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置
US09/680,018 US6798895B1 (en) 1999-10-06 2000-10-05 Character string extraction and image processing methods and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28517799A JP3204259B2 (ja) 1999-10-06 1999-10-06 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置

Publications (2)

Publication Number Publication Date
JP2001109844A JP2001109844A (ja) 2001-04-20
JP3204259B2 true JP3204259B2 (ja) 2001-09-04

Family

ID=17688107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28517799A Expired - Fee Related JP3204259B2 (ja) 1999-10-06 1999-10-06 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置

Country Status (2)

Country Link
US (1) US6798895B1 (ja)
JP (1) JP3204259B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3221569B2 (ja) 1996-01-23 2001-10-22 グローバルメディアオンライン株式会社 情報表示システム
US6807558B1 (en) 1995-06-12 2004-10-19 Pointcast, Inc. Utilization of information “push” technology
US8050969B2 (en) 1995-07-25 2011-11-01 News America Marketing Properties Llc Interactive marketing network and process using electronic certificates
US8065702B2 (en) 1996-01-19 2011-11-22 Beneficial Innovations, Inc. Network advertising and game playing
USRE44323E1 (en) 1996-01-19 2013-06-25 Beneficial Innovations, Inc. Method and system for playing games on a network
US9530150B2 (en) 1996-01-19 2016-12-27 Adcension, Llc Compensation model for network services

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4095243B2 (ja) * 2000-11-28 2008-06-04 キヤノン株式会社 Url取得および処理システムおよびその方法およびその処理を実行するプログラムを記憶した記憶媒体。
TWI284288B (en) * 2004-06-04 2007-07-21 Benq Corp Text region recognition method, storage medium and system
JP2006085665A (ja) * 2004-08-18 2006-03-30 Ricoh Co Ltd 画像処理装置、画像処理プログラム、記憶媒体、画像処理方法および画像形成装置
US20060045346A1 (en) * 2004-08-26 2006-03-02 Hui Zhou Method and apparatus for locating and extracting captions in a digital image
US8331680B2 (en) * 2008-06-23 2012-12-11 International Business Machines Corporation Method of gray-level optical segmentation and isolation using incremental connected components
JP5600524B2 (ja) * 2010-08-27 2014-10-01 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、および記憶媒体
US8818023B2 (en) * 2011-03-25 2014-08-26 Siemens Industry, Inc. Bulk region of interest learning
US9208550B2 (en) * 2012-08-15 2015-12-08 Fuji Xerox Co., Ltd. Smart document capture based on estimated scanned-image quality
US9940511B2 (en) * 2014-05-30 2018-04-10 Kofax, Inc. Machine print, hand print, and signature discrimination
JP2016181057A (ja) * 2015-03-23 2016-10-13 株式会社東芝 画像処理装置、画像処理方法及び画像処理プログラム
JP6451440B2 (ja) * 2015-03-25 2019-01-16 日本電気株式会社 ラベル領域検知装置、ラベル領域検知方法、ラベル領域検知プログラム、及びラベル領域検知システム
JP6394579B2 (ja) * 2015-12-08 2018-09-26 京セラドキュメントソリューションズ株式会社 画像読取装置及び画像形成装置
US10168192B2 (en) * 2015-12-22 2019-01-01 Intel Corporation Determining values of angular gauges
US10354137B2 (en) 2016-09-30 2019-07-16 Intel Corporation Robust monitoring gauges
JP2019193022A (ja) * 2018-04-20 2019-10-31 富士ゼロックス株式会社 情報処理装置及びプログラム
WO2020089985A1 (ja) * 2018-10-29 2020-05-07 株式会社Pfu 画像処理装置、制御方法及び制御プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06101049B2 (ja) * 1988-03-25 1994-12-12 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 文字列検出方法
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5410611A (en) * 1993-12-17 1995-04-25 Xerox Corporation Method for identifying word bounding boxes in text
DE69516751T2 (de) * 1994-04-15 2000-10-05 Canon Kk Bildvorverarbeitung für Zeichenerkennungsanlage
US6246794B1 (en) * 1995-12-13 2001-06-12 Hitachi, Ltd. Method of reading characters and method of reading postal addresses
US6157738A (en) * 1996-06-17 2000-12-05 Canon Kabushiki Kaisha System for extracting attached text
US5892843A (en) * 1997-01-21 1999-04-06 Matsushita Electric Industrial Co., Ltd. Title, caption and photo extraction from scanned document images

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
「電子情報通信学会技術研究報告」PRU95−6 Vol.95 No.43 p.41−48(1995)中島昇、土屋徹雄、上村健"手書き郵便からの宛名行検出における試行検証プロセスの導入"

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6807558B1 (en) 1995-06-12 2004-10-19 Pointcast, Inc. Utilization of information “push” technology
US8050969B2 (en) 1995-07-25 2011-11-01 News America Marketing Properties Llc Interactive marketing network and process using electronic certificates
US8065702B2 (en) 1996-01-19 2011-11-22 Beneficial Innovations, Inc. Network advertising and game playing
USRE44323E1 (en) 1996-01-19 2013-06-25 Beneficial Innovations, Inc. Method and system for playing games on a network
US9530150B2 (en) 1996-01-19 2016-12-27 Adcension, Llc Compensation model for network services
JP3221569B2 (ja) 1996-01-23 2001-10-22 グローバルメディアオンライン株式会社 情報表示システム

Also Published As

Publication number Publication date
US6798895B1 (en) 2004-09-28
JP2001109844A (ja) 2001-04-20

Similar Documents

Publication Publication Date Title
JP3204259B2 (ja) 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置
JP3305772B2 (ja) 形態学的技術を用いて手書き指示イメージを検出する方法
EP0358815B1 (en) System and method for automatic segmentation
JP3338537B2 (ja) 画像傾き検出装置
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP4098845B2 (ja) テキストのバイナリー画像から抽出されたシンボルを比較する方法
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
US5467410A (en) Identification of a blank page in an image processing system
US7149352B2 (en) Image processing device, program product and system
JP4392907B2 (ja) 文字切出し方法
US5228095A (en) Apparatus for recognizing printed characters
JP4538214B2 (ja) グラフによる画像分割
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP4390523B2 (ja) 最小領域による合成画像の分割
JP2004282701A5 (ja)
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
US5408540A (en) Character slant recognition in a word image
JPS60116078A (ja) 文字認識装置
Balasubramanian et al. Information extraction from tabular drawings
JPH09134404A (ja) 棒グラフ認識装置
JP3100825B2 (ja) 線認識方法
JP2613211B2 (ja) 画像入力装置
EP0701226B1 (en) Method for segmenting handwritten lines of text in a scanned image
JP2962525B2 (ja) テキストブロック認識方法
JP4763113B2 (ja) 高速ラベリング方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080629

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080629

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090629

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120629

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120629

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130629

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees