JP3837193B2 - 文字行抽出方法および装置 - Google Patents

文字行抽出方法および装置 Download PDF

Info

Publication number
JP3837193B2
JP3837193B2 JP28260396A JP28260396A JP3837193B2 JP 3837193 B2 JP3837193 B2 JP 3837193B2 JP 28260396 A JP28260396 A JP 28260396A JP 28260396 A JP28260396 A JP 28260396A JP 3837193 B2 JP3837193 B2 JP 3837193B2
Authority
JP
Japan
Prior art keywords
character
character line
rectangle
main direction
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP28260396A
Other languages
English (en)
Other versions
JPH1031716A (ja
Inventor
建志 平本
浩 松内
秀樹 藤森
亜依 吉森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP28260396A priority Critical patent/JP3837193B2/ja
Publication of JPH1031716A publication Critical patent/JPH1031716A/ja
Application granted granted Critical
Publication of JP3837193B2 publication Critical patent/JP3837193B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、光学的文字読み取り装置(OCR)等に用いる、文書から文字行を抽出する方法および装置に関する。
【0002】
【従来の技術】
従来、OCR等において文書から文字行を抽出する方法として、画像データから連結する画素成分を連結要素として抽出し、連結要素間の距離や重なりに応じて文書の文字行方向に、抽出した連結要素を接続することによって文字行を抽出する方法(特開平5−342407)があった。しかし、この方法では、連結要素と文字が必ずしも1対1に対応していないため、1文字がいくつかの連結要素に分かれていることがあり、このような文字が連続する文字行内や文字行付近においては、同じ文字行内に属する連結要素同士が正しく接続されなかったり、接続すべきでない隣り合った文字行の連結要素同士が接続されてしまう場合がある。また、この方法では、文書の文字行方向が1方向に決まっていることが前提であり、縦書き横書き混在の文書において、両方向の文字行を抽出することは困難である。
【0003】
このような問題を解決する方法として、処理対象の文書の圧縮画像から連結する画素成分を連結要素として抽出し、連結要素の外接矩形の縦横比から圧縮による文字間の融合度合を推定し、融合度合に応じて接続パラメータを決定して連結要素を接続する方法(特開平7−73271)が提案されている。
この方法によると、圧縮率が適切であれば1文字が複数の連結要素に分かれる頻度が減り、上記に述べたような連結要素と文字が1対1に対応していないためにおこる誤結合をある程度防ぐことができる。また、文書内に本文領域と呼ばれるような文字行が連続的に存在する領域があれば、本文領域の文字間や文字の大きさに応じて適切な接続パラメータが設定され、精度よく文字行を抽出することができ、本文文字行と異方向の文字行(縦書き文書におけるフッタやヘッダ等)の抽出も可能となる。
【0004】
また、処理対象となる文書内に写真等の非文字領域が存在する場合、例えば、写真領域内に存在する連結要素の大きさが文字サイズ程度で、文字行と近接している場合など、文字認識処理を行なわずに写真領域内の連結要素と文字行との誤結合を防ぐことは困難である。これに対処するために先に文字領域と非文字領域を分離しておくと、その後の文字行抽出の精度が向上する場合がある。このような文字領域と非文字領域を分離する従来の技術として、画像データから射影分布を取得し、分布の谷部を検出し、検出された谷部で対象領域を分割する方法(特開平3−290774)が提案されている。
【0005】
さらに、連結要素を接続する方法においては、文字行方向が不明な場合、文字行方向を先に判別しておく必要がある。かかる文字行方向の判別方法としては、画像データから文字要素を抽出し、相互に近接する文字要素毎に群分けし、文字要素群の外接矩形の長辺方向を文字行方向として判別する方法(特開平6−243286)が提案されている。
【0006】
【発明が解決しようとする課題】
しかし、上記処理対象の文書の圧縮画像から連結する画素成分を連結要素として抽出して文字行を抽出する方法においては、例えば名刺のように文字の大きさやピッチの異なる別の文字行が近接していたり、文字の大きさが等しい別の文字行同士が1列に並んでいたり、文字の大きさが等しい2列の文字行の中間的な位置に文字行が存在していたりするような文書においては、適切な圧縮率や接続パラメータを設定することは困難である。そして、圧縮率が不適切な場合、行間の狭い文書では複数行が癒着してしまうこともある。
【0007】
また、一般的に1文字行を構成する文字は文字間が近く、均等で文字の大きさもほぼそろっているのが普通であり、従来の文字行の抽出方法はこのことを前提としていた。ところが、名刺の氏名にふられるルビ等は、文字行内の個々の文字が極端に離れているため、従来の方法では1文字行と判断することは困難である。
【0008】
さらに、対象処理対象の文書に散点状に描かれた絵や装飾等が存在する場合には、従来の文字行の抽出方法では、絵等を構成する点を文字と認識して文字行を構成しないにもかかかわらず、文字行として抽出してしまうおそれもある。
一方、上述した従来の文字領域と非文字領域を分離する方法では、2値化された写真画像には画素の多い部分と少ない部分が混在しているので、1写真領域内で複数の谷部が検出され、複数の領域に分割されてしまい、その後の統合処理が適当に行なわれない場合、やはり誤結合を招く可能性がある。例えば、図43(a)のような画像データに対して、射影分布を取得すると図43(b)のようになるが、写真領域に一部画素の少ない領域があるため、分布を操作して検出された谷部Zで対象領域を分割すると図43(c)のように、写真領域が領域a1、領域a2に分かれてしまい、領域a2は文字行として誤って認識される恐れが高い。
【0009】
また、上記従来の文字行方向の判別方法においては、文字要素群の外接矩形の長辺方向を文字行方向とするものであるので、行間が狭く、長さの短い文字行がかたまっている場合など、外接矩形の長辺が文字行方向と直交する方向となることもあり、文字行方向の判定を誤ってしまう可能性がある。
即ち、従来の文字行を抽出する方法では、文字の大きさやピッチの異なる文字行、行間の幅が狭い文字行、縦書き文字行や横書き文字行が混在する文書、写真等の非文字領域が存在する文書や文字行方向が不明な文書等、複雑なレイアウトの文書から正確に文字行を抽出することが容易にはできなかった。
【0010】
そこで、本発明はこのような課題を解決し、雑多な構成要素をもつ複雑なレイアウトの文書から正確にかつ効率よく、文書データから文字行を抽出する方法および装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
上記課題を解決するために、本願発明の文字行抽出方法は文字行候補生成ステップと、文字矩形生成ステップと、文字行候補分割ステップと、文字矩形接続ステップとにより構成される。
文字行候補生成ステップは、処理対象の画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出する画素連結矩形生成ステップと、前記画像データもしくは抽出された各画素連結矩形の構成から、主な文字行の方向を主方向、主方向に直交する方向を副方向として判定する文字行方向判定ステップと、各画素連結矩形を相互の位置関係に応じて主方向又は副方向に接続することにより文字行候補を生成する画素連結矩形接続ステップとよりなる。
【0012】
そして、文字矩形生成ステップは、文字行候補内で、各画素連結矩形の相互の位置関係から文字を構成する画素連結矩形群を抽出し、これに外接する矩形を文字矩形として生成する。また、文字行候補分割ステップは、文字行候補内での文字矩形群の構成に応じて、文字行候補を分割する。さらに、文字矩形接続ステップは分割された文字行候補内で文字矩形を接続して文字行とする。
【0013】
また、上記課題を解決するために本願発明に係る文字領域抽出方法は、処理対象の画像データから射影分布を生成する射影分布生成ステップと、射影分布を所定の幅ごとにグループ化する射影グループ生成ステップと、生成された各グループ内の射影分布の代表値を算出する射影グループ代表値算出ステップとを有し、さらに、隣接する前記射影分布のグループの代表値間の差の最も大きなグループ間の境界をグループ境界として求めるグループ境界抽出ステップと、このグループ境界を挟む2つのグループ内の射影分布の差から文字領域と写真図形領域との境界を決定し、当該境界の接している射影分布の小さい側を文字領域として抽出する文字領域抽出ステップとを有するものである。
【0014】
そして、前記文字行抽出方法においては、この文字領域抽出方法により抽出された文字領域を処理対象とすることが望ましい。
さらに、前記文字行抽出方法において、文字行候補生成ステップ中の画素連結矩形接続ステップには、主方向に重なり、かつ、近接する画素連結矩形群を主方向に接続して主方向の部分文字行として生成する主方向部分文字行生成ステップと、主方向部分文字行生成ステップで、接続されなかった画素連結矩形群で、所定の距離の範囲内にあるものを接続して、主方向以外の部分文字行として生成する非主方向部分文字行生成ステップとを設け、さらに部分文字行のうち、縦横比から文字を構成する部分文字行を抽出する文字部分文字行抽出ステップと、副方向に重なり、かつ、近接する文字を構成する部分文字行群を副方向に接続して、新たな副方向の部分文字行を生成する部分文字行接続第1ステップと、副方向に重なり、かつ、近接する主方向の部分文字行群を接続して新たな主方向の部分文字行を生成する部分文字行接続第2ステップと、主方向に重なる、主方向の部分文字行群を主方向に接続して新たな主方向の部分文字行を生成する部分文字行接続第3ステップとを設け、これらの各ステップより生成された部分文字行を文字行候補とすることが望ましい。
【0015】
そして、上記課題を解決するために本願発明に係る文字行主方向抽出方法は、処理対象の画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、この抽出した画素連結矩形を用いる方法であり、処理対象の画像データの形状から仮の主方向を決定する仮主方向決定ステップと、主方向に重なり、かつ、近接する画素連結矩形群を主方向に接続して主方向の部分文字行として生成する主方向部分文字行生成ステップ、さらに、生成された各主方向の部分文字行の構成から、仮主方向決定ステップで決定した仮の主方向が正しいかどうかを判断する主方向判断ステップと、主方向判断ステップで仮の主方向が正しいと判断されればその仮の主方向を主方向として抽出し、仮の主方向が正しくないと判断されればその仮の主方向に直交する方向を主方向として抽出する主方向抽出ステップとにより構成される。
【0016】
前記文字行抽出方法においては、文字行候補生成ステップ中の主方向部分文字行生成ステップは、上記の文字行主方向抽出方法を用いることが望ましく、この場合、前記主方向部分文字行生成ステップでは、文字行主方向判断方法中の主方向判断ステップで仮の主方向が正しくないと判断された場合のみ、主方向の部分文字行を生成するようにすれば足りる。
【0017】
また、前記部分文字行接続第2ステップには、さらに、副方向に重なり、かつ、準近接する主方向の部分文字行同士を抽出する準近接部分文字行抽出ステップと、この準近接部分文字行抽出ステップで抽出された部分文字行同士間における各部分文字行に含まれる画素連結矩形の距離が所定の値以下であれば、当該部分文字行同士を接続し新たな主方向の部分文字行を生成する準近接部分文字行接続ステップとを設けると効果的である。なお、ここで準近接するとは部分文字行同士の間隔が近接しているとは判断できないが、かなり近いと認められる所定の距離範囲に入っている状態をいい、当該距離は予め定められる。
【0018】
また、前記文字行抽出方法においては、前記主方向接続ステップの前には、さらに、処理対象の画像データの所定領域を予め定めておき、当該所定領域内において、副方向に重なり、かつ、近接する画素連結矩形群を副方向に接続して副方向の部分文字行として生成する特定領域部分文字行生成ステップを設けてもよい。
【0019】
それから、前記文字矩形生成ステップには、文字行候補を被分割領域とし、この被分割領域に対して、主方向の被分割領域、副方向の被分割領域、その他の被分割領域に分類する被分割領域分類ステップを設け、被分割領域分類ステップで、副方向の被分割領域であると分類された場合は、この被分割領域となっている文字行候補を文字行として抽出する副方向文字行抽出ステップと、被分割領域分類ステップで、その他の被分割領域と分類された場合は、この被分割領域の外接矩形を文字矩形として作成する単体文字矩形作成ステップと、被分割領域分類ステップで、主方向の被分割領域であると分類された場合は、この主方向の被分割領域に対して、主方向、副方向に射影をとり、射影間の空白部分が所定の長さを越える区間がある場合は、当該区間で被分割領域を分割してあらたな被分割領域とする被分割領域分割ステップと、被分割領域分割ステップで、射影間の空白部分が所定の長さを越える区間がない場合に、当該被分割領域内で、各画素連結矩形の相互の位置関係から文字を構成する画素連結矩形群を抽出し、これに外接する矩形を文字矩形として生成する主方向文字矩形生成ステップとを設けると効果的である。
【0020】
さらに、前記文字行候補分割ステップには、文字行候補内での文字矩形の大きさの平均値と分散値のいずれか又は両方により、文字行候補内での文字矩形の構成を判断する文字矩形構成判断ステップと、文字矩形構成判断ステップにより、文字行候補内で文字矩形間で所定の差異を有すると判断された場合に、所定の差異がある文字矩形間で、文字行候補を分割する文字矩形間分割ステップとを設けることが望ましい。
【0021】
かかる文字行候補分割ステップの文字矩形構成判断ステップには、文字行候補内での文字矩形の一辺の長さの平均値が文字行候補の短辺の長さよりも小さく、かつ、文字矩形の一辺の長さの分散値が所定値よりも大きければ、文字行候補中に大小の文字矩形が存在するという判断を含ませ、文字矩形間分割ステップには、文字矩形判断ステップにより文字行候補中に大小の文字矩形が存在すると判断された場合に、大きい文字矩形と小さい文字矩形を挟む区間を検索する大小文字矩形間検索ステップと、大小文字矩形間検索ステップで検索された区間で、文字行候補を分割する区間分割ステップとを設けると好適である。
【0022】
さらに、文字行候補分割ステップの文字矩形構成判断ステップには、文字行候補内での文字矩形の一辺の長さの平均値が文字行候補の短辺の長さとほぼ同じであれば、文字行候補中の文字矩形間に空白が存在するという判断を含ませ、文字矩形間分割ステップには、文字矩形判断ステップにより文字行候補中の文字矩形間に空白があると判断された場合に、空白がある区間を検索する文字矩形間空白検索ステップと、文字矩形間空白検索ステップで検索された区間で、文字行候補を分割する区間分割ステップとを設けてもよい。
【0023】
同様に、文字行候補分割ステップの文字矩形構成判断ステップには、文字行候補の短辺の長さが文字行候補内での文字矩形の一辺の長さの平均値の2倍以上であれば、文字行候補中に文字列が2列以上混在するという判断を含ませ、前記文字行候補分割ステップには、文字矩形判断ステップにより文字行候補中に文字列が2列以上混在すると判断された場合に、文字行間で段差を生じている区間を検索する文字行段差部検索ステップと、文字行段差部検索ステップで検索された区間で、文字行候補を分割する区間分割ステップとを設けることができる。
【0024】
また、かかる構成にさらに、前記文字行段差部検索ステップで検索された区間に隣接する文字矩形が所定の特殊な文字矩形か否かを判断する特殊文字判定ステップと、特殊文字判定ステップで所定の特殊な文字矩形であると判断された場合は、当該特殊な文字矩形を分割する、特殊文字分割ステップとを設けることもできる。
【0025】
さらに、上記課題を解決するために本願発明に係る文字行抽出方法は、画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、抽出された各画素連結矩形の位置関係から文字を構成する部分を抽出して、これに外接する矩形を文字矩形として生成し、生成された各文字矩形を連結することによって文字行を抽出する文字行抽出方法において、所定の構成を有する文字矩形をルビ矩形として抽出するルビ矩形抽出ステップと、ルビ矩形の近傍に存在する文字行を検索する親文字行検索ステップと、このルビ矩形を含む、検索された文字行に対してルビが存在し得る範囲を決定するルビ存在可能範囲決定ステップと、ルビが存在し得る範囲に存在するルビ矩形および文字行を連結することによって、ルビを構成する文字行を抽出するルビ文字行抽出ステップとを設けたものである。
【0026】
また、本願発明に係る文字行抽出方法は、画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、抽出された各画素連結矩形の位置関係から文字を構成する部分を抽出して、これに外接する矩形を文字矩形として生成し、生成された各文字矩形を連結することによって文字行を抽出する文字行抽出方法において、抽出された文字行内の画素連結矩形または文字矩形の数が定められた第1の閾値よりも大きければ、その文字行がノイズであると判断するノイズ文字行判断ステップと、ノイズと判断された文字行を削除するノイズ文字行削除ステップとを設けたものである。
【0027】
さらに、この文字行抽出方法においては、抽出された文字行内の画素連結矩形または文字矩形の数が前記第1の閾値よりも小さく、第1の閾値よりも小さい定められた第2の閾値よりも大きければ、その文字行をノイズ文字行候補とするノイズ文字行候補判断ステップと、ノイズ文字行候補内の画素連結矩形または文字矩形の大きさの平均値を算出し、この平均値が予め定められる所定の値以下であれば、そのノイズ文字行候補をノイズと判断するノイズ文字行候補検証ステップとを設けることが望ましい。なお、この所定の値は計算値も含み、例えば、ノイズ文字行候補の短辺の長さに対して所定の割合を定めておき、この割合を予め計算することによって与えるようにしてもよい。
【0028】
一方、上記課題を解決するために本願発明に係る文字行抽出装置は文字行候補生成手段と、文字矩形生成手段と、文字行候補分割手段と、文字矩形接続手段とにより構成される。
文字行候補生成手段は、処理対象の画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出する画素連結矩形生成手段と、前記画像データもしくは抽出された各画素連結矩形の構成から、主な文字行の方向を主方向、主方向に直交する方向を副方向として判定する文字行方向判定手段と、各画素連結矩形を相互の位置関係に応じて主方向又は副方向に接続することにより文字行候補を生成する画素連結矩形接続手段とよりなる。
【0029】
そして、文字矩形生成手段は、文字行候補内で、各画素連結矩形の相互の位置関係から文字を構成する画素連結矩形群を抽出し、これに外接する矩形を文字矩形として生成する。また、文字行候補分割手段は、文字行候補内での文字矩形群の構成に応じて、文字行候補を分割する。さらに、文字矩形接続手段は分割された文字行候補内で文字矩形を接続して文字行とする。
【0030】
また、上記課題を解決するために本願発明に係る文字領域抽出装置は、処理対象の画像データから射影分布を生成する射影分布生成手段と、射影分布を所定の幅ごとにグループ化する射影グループ生成手段と、各グループ内の射影分布の代表値を算出する射影グループ代表値算出手段とを有し、さらに、隣接する前記射影分布のグループの代表値間の差の最も大きなグループ間の境界をグループ境界として求めるグループ境界抽出手段と、このグループ境界を挟む2つのグループ内の射影分布の差から文字領域と写真図形領域との境界を決定し、当該境界の接している射影分布の小さい側を文字領域として抽出する文字域抽出手段とを有するものである。
【0031】
さらに、前記文字行抽出装置において、文字行候補生成手段中の画素連結矩形接続手段には、主方向に重なり、かつ、近接する画素連結矩形群を主方向に接続して主方向の部分文字行として生成する主方向部分文字行生成手段と、主方向部分文字行生成手段で、接続されなかった画素連結矩形群で、所定の距離の範囲内にあるものを接続して、主方向以外の部分文字行として生成する非主方向部分文字行生成手段とを設け、さらに部分文字行のうち、縦横比から文字を構成する部分文字行を抽出する文字部分文字行抽出手段と、副方向に重なり、かつ、近接する文字を構成する部分文字行群を副方向に接続して、新たな副方向の部分文字行を生成する文字副方向接続手段と、副方向に重なり、かつ、近接する主方向の部分文字行群を接続して新たな主方向の部分文字行を生成する部分文字行副方向接続手段と、主方向に重なる、主方向の部分文字行群を主方向に接続して新たな主方向の部分文字行を生成する部分文字行主方向接続手段とを設け、これらの各手段より生成された部分文字行を文字行候補とすることが望ましい。
【0032】
そして、上記課題を解決するために本願発明に係る文字行主方向抽出装置は、処理対象の画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、この抽出した画素連結矩形を用いて処理対象の画像の主方向を抽出する装置であり、処理対象の画像データの形状から仮の主方向を決定する仮主方向決定手段と、主方向に重なり、かつ、近接する画素連結矩形群を主方向に接続して主方向の部分文字行として生成する主方向部分文字行生成手段、さらに、生成された各主方向の部分文字行の構成から、仮主方向決定手段で決定した仮の主方向が正しいかどうかを判断する主方向判断手段と、主方向判断手段で仮の主方向が正しいと判断されればその仮の主方向を主方向として抽出し、仮の主方向が正しくないと判断されればその仮の主方向に直交する方向を主方向として抽出する主方向抽出手段とにより構成される。
【0033】
前記文字行抽出装置においては、文字行候補生成手段中の主方向部分文字行生成手段は、上記の文字行主方向抽出装置を用いることが望ましく、この場合、前記主方向部分文字行生成手段では、文字行主方向判断装置中の主方向判断手段で仮の主方向が正しくないと判断された場合のみ、主方向の部分文字行を生成するようにすれば足りる。
【0034】
また、前記部分文字行副方向接続手段には、さらに、副方向に重なり、かつ、準近接する主方向の部分文字行同士を抽出する準近接部分文字行抽出手段と、この準近接部分文字行抽出手段で抽出された部分文字行同士間における各部分文字行に含まれる画素連結矩形の距離が所定の値以下であれば、当該部分文字行同士を接続し新たな主方向の部分文字行を生成する準近接部分文字行接続手段とを設けると効果的である。
【0035】
また、前記文字行抽出装置においては、前記主方向接続手段の前には、さらに、処理対象の画像データの所定領域を予め定めておき、当該所定領域内において、副方向に重なり、かつ、近接する画素連結矩形群を副方向に接続して副方向の部分文字行として生成する特定領域部分文字行生成手段を設けてもよい。
それから、前記文字矩形生成手段には、文字行候補を被分割領域とし、この被分割領域に対して、主方向の被分割領域、副方向の被分割領域、その他の被分割領域に分類する被分割領域分類手段を設け、被分割領域分類手段で、副方向の被分割領域であると分類された場合は、この被分割領域となっている文字行候補を文字行として抽出する副方向文字行抽出手段と、被分割領域分類手段で、その他の被分割領域と分類された場合は、この被分割領域の外接矩形を文字矩形として作成する単体文字矩形作成手段と、被分割領域分類手段で、主方向の被分割領域であると分類された場合は、この主方向の被分割領域に対して、主方向、副方向に射影をとり、射影間の空白部分が所定の長さを越える区間がある場合は、当該区間で被分割領域を分割してあらたな被分割領域とする被分割領域分割手段と、被分割領域分割手段で、射影間の空白部分が所定の長さを越える区間がない場合に、当該被分割領域内で、各画素連結矩形の相互の位置関係から文字を構成する画素連結矩形群を抽出し、これに外接する矩形を文字矩形として生成する主方向文字矩形生成手段とを設けると効果的である。
【0036】
さらに、前記文字行候補分割手段には、文字行候補内での文字矩形の大きさの平均値と分散値のいずれか又は両方により、文字行候補内での文字矩形の構成を判断する文字矩形構成判断手段と、文字矩形構成判断手段により、文字行候補内で文字矩形間で所定の差異を有すると判断された場合に、所定の差異がある文字矩形間で、文字行候補を分割する文字矩形間分割手段とを設けることが望ましい。
【0037】
かかる文字行候補分割手段の文字矩形構成判断手段は、文字行候補内での文字矩形の一辺の長さの平均値が文字行候補の短辺の長さよりも小さく、かつ、文字矩形の一辺の長さの分散値が所定値よりも大きければ、文字行候補中に大小の文字矩形が存在するという判断を行わせ、文字矩形間分割手段には、文字矩形判断手段により文字行候補中に大小の文字矩形が存在すると判断された場合に、大きい文字矩形と小さい文字矩形を挟む区間を検索する大小文字矩形間検索手段と、大小文字矩形間検索手段で検索された区間で、文字行候補を分割する区間分割手段とを設けると好適である。
【0038】
さらに、文字行候補分割手段の文字矩形構成判断手段は、文字行候補内での文字矩形の一辺の長さの平均値が文字行候補の短辺の長さとほぼ同じであれば、文字行候補中の文字矩形間に空白が存在するという判断を行わせ、文字矩形間分割手段には、文字矩形判断手段により文字行候補中の文字矩形間に空白があると判断された場合に、空白がある区間を検索する文字矩形間空白検索手段と、文字矩形間空白検索手段で検索された区間で、文字行候補を分割する区間分割手段とを設けてもよい。
【0039】
同様に、文字行候補分割手段の文字矩形構成判断手段には、文字行候補の短辺の長さが文字行候補内での文字矩形の一辺の長さの平均値の2倍以上であれば、文字行候補中に文字列が2列以上混在するという判断を行わせ、前記文字行候補分割手段には、文字矩形判断手段により文字行候補中に文字列が2列以上混在すると判断された場合に、文字行間で段差を生じている区間を検索する文字行段差部検索手段と、文字行段差部検索手段で検索された区間で、文字行候補を分割する区間分割手段とを設けることができる。
【0040】
また、かかる構成にさらに、前記文字行段差部検索手段で検索された区間に隣接する文字矩形が所定の特殊な文字矩形か否かを判断する特殊文字判定手段と、特殊文字判定手段で所定の特殊な文字矩形であると判断された場合は、当該特殊な文字矩形を分割する、特殊文字分割手段とを設けることもできる。
さらに、上記課題を解決するために本願発明に係る文字行抽出装置は、画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、抽出された各画素連結矩形の位置関係から文字を構成する部分を抽出して、これに外接する矩形を文字矩形として生成し、生成された各文字矩形を連結することによって文字行を抽出する文字行抽出装置において、所定の構成を有する文字矩形をルビ矩形として抽出するルビ矩形抽出手段と、ルビ矩形の近傍に存在する文字行を検索する親文字行検索手段と、このルビ矩形を含む、検索された文字行に対してルビが存在し得る範囲を決定するルビ存在可能範囲決定手段と、ルビが存在し得る範囲に存在するルビ矩形および文字行を連結することによって、ルビを構成する文字行を抽出するルビ文字行抽出手段とを設けたものである。
【0041】
また、本願発明に係る文字行抽出装置は、画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、抽出された各画素連結矩形の位置関係から文字を構成する部分を抽出して、これに外接する矩形を文字矩形として生成し、生成された各文字矩形を連結することによって文字行を抽出する文字行抽出装置において、抽出された文字行内の画素連結矩形または文字矩形の数が定められた第1の閾値よりも大きければ、その文字行がノイズであると判断するノイズ文字行判断手段と、ノイズと判断された文字行を削除するノイズ文字行削除手段とを設けたものである。
【0042】
さらに、この文字行抽出装置においては、抽出された文字行内の画素連結矩形または文字矩形の数が前記第1の閾値よりも小さく、第1の閾値よりも小さい定められた第2の閾値よりも大きければ、その文字行をノイズ文字行候補とするノイズ文字行候補判断手段と、ノイズ文字行候補内の画素連結矩形または文字矩形の大きさの平均値を算出し、この平均値が予め定められる所定の値以下であれば、そのノイズ文字行候補をノイズと判断するノイズ文字行候補検証手段とを設けることが望ましい。なお、この所定の値も計算値も含むものであり、例えば、ノイズ文字行候補の短辺の長さに対して所定の割合を定めておき、この割合を予め計算することによって与えるようにしてもよい。
【0043】
【発明の実施の形態】
以下、本発明の実施の形態について、図を用いて説明する。
図1は本発明に係る文字行抽出方法および文字行抽出装置を用いた文字認識装置の構成を示すブロック図である。かかる文字認識装置は、スキャナー等よりなる光学的手段により紙面に印字された文字画像等を画像データとして読み取る画像入力部1、画像データから文字領域を抽出する文字領域抽出部2、後に詳述する文字行を抽出する文字行抽出部3、文字行抽出部3で抽出されないルビ文字行を抽出するルビ文字行抽出部8、抽出された文字行がノイズである場合に除去するノイズ文字行削除部9、抽出された文字行を構成する文字を一文字づつ認識する文字認識部10により構成される。この装置の文字領域抽出部2、文字行抽出部3、ルビ文字行抽出部8、ノイズ文字行削除部9、文字認識部10の動作は汎用のコンピューターとこれに格納されるプログラムによっても達成することができ、このプログラムはフロッピーディスク等の記録媒体に記録することができる。
【0044】
以下に、各構成部分の詳細をさらに説明する。まず、本願発明に係る文字領域抽出装置である文字領域抽出部2の構成を図2に示す。文字領域抽出部2中、射影分布生成部21は処理対象の画像データから射影分布を生成する。射影分布とは処理対象の画像データの一方向における黒画素の総和をこの方向に直交する方向に沿って一定間隔ごとに分布をとったものであり、例えば、図3(a)に示すように画像データに対して、縦方向の射影分布を生成すると図3(b)のようになる。
【0045】
射影グループ生成部22は射影分布を所定の幅ごとにグループ化する。この所定の幅は処理対象の文書内に表される写真や図形の大きさ等を統計し、実験により最も良い結果をもたらす値を導き出して使用する。次に、射影グループ代表値算出部23は生成された各グループ内の射影分布の代表値を算出する。ここでは代表値としてグループ内の各射影の平均値を求める。図3(c)に、図3(b)の射影分布をグループ化して各グループを代表値によって表した図を示す。 グループ境界抽出部24は隣接する前記射影分布のグループの代表値間の差の最も大きなグループ間の境界をグループ境界として求める。また、さらにグループ境界抽出部24は、境界で分割してできるそれぞれの領域に属する全グループの射影の平均値の差や平均値の大きな方の値が所定の閾値を越えるか否か、さらには領域の幅が所定の値を越える否か等によって、当該境界が文書領域と写真図形領域のおおよその境界となり得るか否かを判断する。
【0046】
文字域抽出部25は、このグループ境界が文書領域と写真図形領域のおおよその境界となり得ると判断された場合に、このグループ境界を挟む2つのグループ内の射影分布の差から文字領域と写真図形領域との境界を決定し、当該境界の接している射影分布の小さい側を文字領域として抽出する。ここでは、射影分布の差から谷部分を検出し、当該谷部分を文字領域と写真図形領域との境界とする。ただし、射影分布が0の領域と0で出ない領域が隣接している所があれば、その隣接している境界を文字領域と写真図形領域との境界とする。また、グループ境界が文書領域と写真図形領域のおおよその境界となり得えないと判断された場合には対象領域全体を文字領域として抽出する。なお、ここでは対象画像の長辺方向に対して、文字行域と写真図形領域を分離するようにしているが、これは、短辺方向に対して同様の処理を行ってもよく、長辺方向と短辺方向の両方について同様の処理を行ってもよい。
【0047】
次に、本願発明に係る文字抽出装置である文字行抽出部3の構成を説明する。文字行抽出部3は、図1に示すように、画像データから以降の処理の基本単位となる基本矩形を構成する画素の連結する成分を適宜接続して文字行候補を生成する文字行候補生成部4、画素の連結する成分の構成から文字を構成する領域を囲む文字矩形を生成する文字矩形生成部5、文字行候補生成部4により生成された文字行候補を、文字矩形の平均値、分散値等に基づいて分割する文字行候補分割部6、文字行候補分割部6により分割された領域内で文字矩形を適宜接続する文字矩形接続部7よりなる。
【0048】
文字行候補生成部4の構成を図4に示す。文字行候補生成部4中、画素連結矩形生成部41は画像入力部1から入力された画像デ−タの内、文字領域抽出部2により抽出された領域に対して、連続している画素連結成分に外接する矩形(画素連結矩形)を生成する。この画素連結矩形の生成はラベリングなどの公知の手法を用いて行われる。画素連結矩形の例を図5に示す。図5中の各矩形a、a、・・・が画素連結矩形である。図からもわかるように画素連結矩形は必ずしも一文字に対応するものではなく、一文字の部分である場合もある。
【0049】
文字行方向判定部42は、主な文字行の方向を主方向として判定抽出する部分であり、文字行方向判定部42は、図に示すように仮主方向決定部42a、主方向判断部42b、主方向抽出部42cにより構成される。
仮主方向決定部42aは、画像データの外形から仮の主方向を設定する。例えば、処理対象が英文であれば画像データの外形の短辺方向を仮の主方向とし、処理対象が名刺ならば画像データの外形の長辺方向を仮の主方向とする。もっとも、主方向の決定は画素連結矩形の配列の構成から行の多い方向を主方向と定めてもよい。なお、ここでは「主方向」とは画像データに含まれる大多数の文字行の方向をいい、主方向に直交する方向を「副方向」と呼んでいる。例えば、図7の画像データについては、横方向が主方向であり、これに、直交する方向が副方向である。
【0050】
主方向判断部42bは、後に述べる主方向部分文字行生成部43で画素連結矩形を主方向に接続して生成された各主方向の部分文字行の構成から仮主方向決定部42aで決定した主方向が正しかったかどうかを判断する。ここで、画素連結矩形群の接続とは、例えば、図6に示すように、図5のように作成された各画素連結矩形群a、a・・をその位置関係から、グル−プ化してこれに外接する領域bを作成することであり、この領域bが主方向への部分文字行となる。
【0051】
仮主方向決定部42aで決定した仮の主方向が正しかったかどうかの判断は、所定の長さを越え、かつ、画素連結矩形が所定の割合以上に詰まっている部分文字行が所定数あれば仮主方向決定部42aで決定した仮の主方向が正しかったと判断し、この条件を満たさなければ決定した仮の主方向が誤っていたと判断する。例えば、主方向部分文字行生成部43で、図8(a)に示すような主方向の部分文字行が生成されたならば、十分に長く文字の詰まった文字行が多数存在しているので、仮の主方向は正しかった判断されるが、主方向部分文字行生成部43で、図8(b)に示すような主方向の部分文字行が生成されたならば、上記条件を満たさず、仮の主方向は誤っていたと判断される。なお、上記の他に、所定長さ以下の部分文字行が所定数あることや、所定長さを越え、画素連結矩形が所定の割合以下の部分文字行が所定数あることをもって、仮主方向決定部42aで決定した仮の主方向は誤っていたと判断する等の条件も考えられる。
【0052】
最後に、主方向抽出部42cは、主方向判断部42bで仮の主方向が正しいと判断されればその仮の主方向を主方向として抽出し、仮の主方向が正しくないと判断されればその仮の主方向に直交する方向を主方向として抽出する。なお、以上の構成を有する文字行方向判定部42と次に説明する主方向部分文字行生成部43が本願発明に係る文字行主方向抽出装置を構成する。
【0053】
主方向部分文字行生成部43は主方向に重なり、かつ、近接する画素連結矩形群を主方向に接続して主方向の部分文字行として生成する。主方向への画素連結矩形の接続は、画素連結矩形間の距離や重なり度合い等の位置関係、大きさの違いなどの接続条件により接続するかどうか判定し、注目矩形に被接続矩形を接続していくという公知の手法を用いる。主方向部分文字行生成部43での処理の結果は上述したように文字行方向判定部42へと戻され、仮の主方向が正しいが否かの判断がされ、真の主方向が抽出される。ここで、仮の主方向が誤っていれば主方向部分文字行生成部43は、抽出された真の主方向に基づき主方向の部分文字行を生成しなおす。一方、仮の主方向が正しければ主方向部分文字行生成部43は何もせず以前に生成した結果をそのまま出力する。
【0054】
非主方向部分文字行生成部44は、接続されなかった画素連結矩形群のうち、互いに一定範囲に存するもの同士を接続して部分文字行を作成する。
部分文字行分類部45は、生成された部分文字行を、大きさや縦横の比率から主方向の部分文字行、副方向の部分文字行、文字の部分文字行、その他の部分文字行などの属性に分類し、各部分文字行に対して、分類された固有の属性を設定する。例えば、縦横比等から副方向に長い部分文字行は副方向の部分文字行に分類され、縦横比がほぼ等しく、大きさが所定の閾値以下であれば文字の部分文字行であると分類され、抽出される。また、主方向の部分文字行は主方向部分文字行生成部43によって接続された領域が、そのまま主方向の部分文字行となる。
【0055】
文字副方向接続部46は、属性が文字である部分文字行のうち、互いに副方向に重なりが大きく、近接するもの同士を接続する。なお、ここで近接するとは所定の距離以下の範囲に互いに存することをいい、重なる場合も含む。部分文字行副方向接続部47は副方向に重なりが大きく、近接する部分文字行同士を接続する。部分文字行主方向接続部48は主方向に重なりが大きい、副方向以外の部分文字行同士を主方向に接続する。文字行候補生成部4で部分文字行および部分文字行を接続してできた領域を「文字行候補」とする。
【0056】
続いて、文字矩形生成部5の構成を図9に示す。文字矩形生成部5中、被分割領域分類部51は文字行候補生成部4によって生成された文字行候補を被分割領域とし、この被分割領域を主方向、副方向、文字、その他の属性に分類する。副方向文字行抽出部52は、属性が副方向の被分割領域を副方向の文字行として抽出する。被分割領域分割部は、属性が主方向の被分割領域を、主方向及び副方向に射影を取得し、射影と射影の間の空白部分が所定の閾値を越えるところで文字行候補を分割する。なお、射影とは図10のs、s・・・で示すようなある方向からの投影光が画素連結矩形によって遮られる部分をいい、空白部分は図10のB、B、・・・で示すような射影と射影の隙間をいう。また、射影間の空白部分が所定の閾値を越えるところを本願では「セパレータ」とよぶ。文字矩形抽出部54は、セパレータとなる空白部分がなくなった主方向の被分割領域および、文字、その他の属性をもつ被分割領域について、被分割領域内の各画素連結矩形を相互の位置関係に応じて、これに外接する矩形を「文字矩形」として生成する。ここで「文字矩形」とは、図11(a)のように重なりのある画素連結矩形群を文字を構成するものと判断して、図11(b)に示すように、この画素連結矩形群に外接するように形成された矩形をいう。
【0057】
文字行候補分割部6の構成を図12に示す。文字行候補分割部6中、文字矩形平均値算出部61は文字矩形生成部5によって、文字矩形生成の完了した文字行候補内の各文字矩形の主方向の一辺の大きさを文字サイズとして、これら文字サイズの平均値を文字サイズ平均値として算出する。文字矩形分散値算出部63は文字サイズの分散値を算出する。平均値比較部62は文字行候補短辺の長さと文字サイズ平均値の大小を比較する。文字構成判定部64は文字行候補の短辺の長さが文字サイズ平均値より小さければ、文字行候補内には1文字行のみが存在すると判定する。文字行候補の短辺の長さが文字サイズの平均値より小さい場合があり得るのは、文字行内の画素連結矩形群が主方向に近接しており、二つ以上の文字が一文字として文字矩形に含まれる場合であり、かかる場合は文字間が近接しており、文字間には空間が無いものと考える。さらに、文字構成判定部64は、文字行候補の短辺の長さが文字サイズ平均値より小さくなく、文字サイズの分散値が大きければ、文字行候補内には文字サイズが異なる複数の文字行が存在すると判定し、文字サイズの分散値が大きくなく、文字行候補短辺の長さと文字サイズ平均値がほぼ等しければ文字行候補内に同じ文字サイズの文字行が1列のみ存在し、かつセパレータが存在すると判定し、文字サイズの分散値が大きくなく、文字行候補短辺の長さが文字サイズ平均値より大きければ、文字行候補内に同じ文字サイズの文字行が2列存在すると判定する。ここでは、文字行候補短辺の長さと文字サイズ平均の比が2倍程度であれば2列と判定するが、文字行候補短辺の長さと文字サイズ平均の比が、3倍程度であれば3列である等の判定ができるのは言うまでもない。
【0058】
大小文字矩形間検索部65は文字構成判定部64が文字行候補内には文字サイズが異なる複数の文字行が存在すると判定した場合に、大きい文字矩形と小さい文字矩形を挟む区間(図25(a)参照)を検索する。大きい文字矩形と小さい文字矩形を挟む区間を検索する方法は、まず、文字行候補の端に位置する文字矩形を取得し、基準文字とする。次に基準文字に隣接する文字矩形を取得し、これを比較文字とする。基準文字と比較文字の文字サイズを比較して、極端な差異がなければ現在の比較文字を基準文字とし、次の隣接する文字矩形を比較文字として、文字サイズを比較する。そして、文字サイズに極端な差異があれば、この基準文字と比較文字の間が大きい文字矩形と小さな文字矩形を挟む区間であると認定する。
【0059】
文字矩形間空白検索部66は文字構成判定部64が文字行候補内に同じ文字サイズの文字行が1列のみ存在し、かつセパレータが存在すると判定した場合に、セパレータとなる区間(図27参照)を検索する。セパレータとなる区間の検索の方法は、文字行候補内で文字行方向に垂直な方向に文字矩形の射影をとり、その射影値より得られた空白部分について、セパレータとなる極端に大きい空白部分が存在するかどうか判定することにより行う。空白部分がセパレータになりうる程度に極端に大きいかどうかは、例えば最も大きい空白部分と2番目に大きい空白部分との比が閾値以上であるかどうかなどにより判定する。
【0060】
文字行段差部検索部67は、文字構成判定部64が文字行候補内に同じ文字サイズの文字行が2列以上存在すると判定した場合に、2列に並んだ文字行の中間的な位置に、段差をもって存在する文字行(図29(a)参照)と2列の文字行の区間を検索する。なお、本願では、この中間的な位置に存在する文字行を「1/2改行文字行」と呼ぶ。この区間の検索の方法は、まず、1/2改行文字行の存在範囲を計算する。1/2改行文字行の存在範囲は例えば、短辺方向の中心が文字行候補と等しく、短辺方向の幅が平均文字サイズの値と等しい矩形内とする。次に、文字行候補の端に位置する文字矩形を取得し比較文字とする。比較文字が1/2改行文字行の存在範囲内に含まれていれば、現在の比較文字に隣接する文字矩形を次の比較文字とする。このような操作を順次行い、比較文字が1/2改行文字行の存在範囲外となったところで、当該比較文字の文字矩形と直前に比較文字であった文字矩形との間の区間を、1/2改行文字行と2列の文字行の間の区間であると認定する。なお、最初の比較文字が1/2改行文字行の存在範囲外である場合は、1/2改行文字行は存在しないとみなし分割は行なわない。
【0061】
区間分割部68は、大小文字矩形間検索部65、文字矩形間空白検索部66、文字行段差部検索部67によって検索された区間で、文字行候補を分割する。
特殊文字判定部69は、文字行段差部検索部67で検索された区間に隣接する文字矩形が所定の特殊文字であるか否かを判定する。特殊文字とは、例えば、1/2改行文字行と2列の文字行の間に挿入される{等の特殊な文字をいう(図29(b)参照)。特殊文字の判定は、1/2改行文字行を抽出した残りの領域内において、1/2改行文字行に最も近い最初の1文字が{等の特殊文字であるかどうかにより行う。特殊文字であるかどうかは、文字矩形の形状が他の文字矩形に比べて極端に大きいかどうかなどにより判定する。そして、特殊文字分割部70は特殊文字判定部69で特殊文字が存在すると判定された場合に、当該特殊文字を分割する。
【0062】
最後に、文字矩形接続部7について説明する。文字矩形接続部7は文字行候補分割部6による分割処理が終了した後、所定の接続条件を満たす文字行候補を分割した領域内の文字矩形群を主方向に接続する。文字矩形群の接続は、矩形間の距離や重なり度合い、大きさの違いなどの接続条件により接続するかどうか判定し、注目矩形に被接続矩形を接続していくという公知の手法を用いる。なお、文字行段差部検索部67で生成された1/2改行文字行部分など、分割領域内に1文字行しか存在しないことがわかっている場合は、分割領域をそのまま文字行として抽出する。
【0063】
以上の構成により文字行抽出部3は文字行を抽出することができるが、図1のブロック図では、さらに文字行を抽出した後に、ルビ文字行抽出部8、ノイズ文字行削除部9を設けて、ルビを構成する文字行の抽出と、ノイズ文字行の削除を行なっている。
まず、ルビ文字行抽出部8の構成を図13に示す。ルビ文字行抽出部8中、ルビ矩形抽出部81は文字行抽出部3によって抽出された文字行の領域を示す各矩形に注目し、ルビかどうかを判定する。注目した矩形がルビかどうかは、矩形の大きさと予め定められた閾値よりも小さいか否か等により判定する。親文字行検索部82は、ルビ矩形抽出部81によって、注目した矩形がルビと判定されたならば、当該ルビ矩形の近くにある可能性のある「親文字行」を検索する。なお、「親文字行」とは、ルビがふられている文字行をいう。親文字行が存在するかどうかは、注目した矩形の最近接文字行と注目した矩形の距離が近く、最近接文字行が十分大きければ、当該最近接文字行を親文字行とする等の方法で行う。ルビ存在可能範囲決定部83は、親文字行検索部82によって検索された親文字行を基準として、ルビの存在可能範囲を決定する。ルビの存在範囲は、例えば、親文字行の注目した矩形がある側に接し、長辺の長さが親文字行と等しく、短辺の長さが予め定められた閾値以内である領域内とする。ルビ文字行作成部84は、ルビの存在可能範囲に含まれるすべての文字行の領域を表す矩形を注目矩形に接続することにより、ルビ文字行を抽出する。
【0064】
次に、ノイズ文字行削除部9の構成を図14に示す。ノイズ文字行削除部9中、ノイズ文字行判定部91は抽出された各文字行がノイズであるかどうかを判断する。判断はその文字行に含まれる文字矩形の数が定められた第1の閾値よりも大きければ、その文字行がノイズであると判断する。ノイズ文字行候補判断部92は各文字行内の文字矩形の数が前記第1の閾値よりも小さく、第1の閾値よりも小さい定められた第2の閾値よりも大きければ、その文字行をノイズ文字行候補と判断する。これら第1、第2の閾値は処理対象に応じて経験的に見出される値であり予め定められる。ここでは、第1の閾値として200、第2の閾値として5と定めてある。ノイズ文字行候補検証部93は、ノイズ文字行候補内の文字矩形の大きさの平均値を算出し、この平均値が予め定められる所定の値以下であれば、そのノイズ文字行候補をノイズと判断する。この所定の値は実験等によって得られ予め定められる。ここでは、この値を400dpiの解像度で6ピクセル(原画像で0.4mm)としている。なお、上記の判断は文字矩形の数や大きさでなく、画素連結矩形の数や大きさによって行ってもよい。また、文字矩形や画素連結矩形の大きさは所定の位置方向の辺の長さを用いる。以上の動作の後、ノイズ文字行削除部94はノイズと判定された文字行を削除する。
【0065】
以上の構成を有する文字行抽出装置による文字行抽出方法の動作について、名刺画像から文字行を抽出する場合を例にとって以下に説明する。まず、文字領域抽出部2の操作について説明する。図15に文字領域抽出部2の動作を表すフローチャートを示す。ここでは、図3に示す名刺から文字領域を抽出するものとする。
【0066】
文字領域抽出部2の射影分布生成部21は、画像入力部1から入力された名刺の画像データから、射影分布を生成し、平滑化する(ステップ101)。これにより図3(a)のような名刺画像の場合から、図3(b)のような射影分布が得られる。
射影グループ生成部22は、生成された射影分布を名刺画像に対応して予め定められれた所定の幅をもってグループ化し、射影グループ代表値算出部23は生成された各グループ毎に射影分布の平均値を求める(ステップ102)。これにより、図3(b)のような射影分布から、図3(c)のような射影グループの分布が得られる。
【0067】
グループ境界抽出部24は、隣接する射影グループ間の平均値の差が最大となるグループ間の境界を射影グループの境界として抽出する(ステップ103)。この動作により図3(c)に示す射影グループの分布の場合は、グループ境界lが抽出される。さらに、グループ境界抽出部24は、このグループ境界によって分けられた各々の領域の射影グループの平均値および各々の領域の幅を算出し(ステップ104)、その平均値、領域の幅に基づき、当該グループ境界が文章領域と写真領域のおおよその境界となり得るか否かを判断する(ステップ105)。図3(c)におけるグループ境界lの場合には、このグループ境界lによって分けられた各々の領域の射影グループ間の平均値の差が大きく、各々の領域の幅も妥当であるのでグループ境界lは文章領域と写真領域のおおよその境界となり得ると判断される。
【0068】
ステップ105でグループ境界が文書領域と写真図形領域のおおよその境界となり得ると判断された場合には、文字域抽出部25はこのグループ境界を挟む2つのグループ内の射影分布の差から文字領域と写真図形領域との境界を決定し、当該境界の接している射影分布の小さい側を文字領域として抽出する(ステップ106)。例えば、図3(c)で射影グループの境界lが求まれば、これに隣接する射影グループA、A内に含まれる図3(b)中の射影分布領域から文字領域と写真図形領域との境界Lが求まる。そして、この境界Lに接している射影分布の小さい側、即ち、境界Lの右側の領域が文字領域と判断される。
【0069】
また、ステップ105でグループ境界が文書領域と写真図形領域のおおよその境界となり得ると判断されなかった場合には、文字域抽出部25は対象領域全体を文章領域と判断する。以上の動作により対象画像から文字領域が抽出される。なお、グループ境界抽出部24は、隣接する射影グループの値の差が最大となる部分を、射影グループの境界位置として抽出する(ステップ103)だけにとどめ、ステップ104、105を省略することも可能である。
【0070】
次に、文字行抽出部3の大まかな動作について、図16を用いて説明する。図16は文字行抽出部3の処理を示すフローチャートである。まず、文字行候補生成部4は、画像入力部1から取り込んだ画像データから文字行候補を生成する(ステップ201)。次に文字矩形生成部5は文字行候補を一つ取得し(ステップ202)、文字行候補内で、文字矩形を生成する(ステップ203)。そして、文字行候補分割部6は文字行候補内の文字矩形の構成に応じてこの文字行候補を分割する(ステップ204)。さらに、文字矩形接続部7は、文字行候補の分割により生成された分割領域を1つ取得し(ステップ205)、分割領域内で文字矩形の接続を行なう(ステップ206)。文字矩形接続部7は全ての分割領域について、同様の操作を繰り返す(ステップ207)。文字矩形生成部5、文字行候補分割部6、文字矩形接続部7は、以上の動作(ステップ202〜ステップ207)を文字行候補生成部4で生成された全ての文字行候補の処理がされるまで繰り返す(ステップ208)。
【0071】
以下に、各構成部分の動作についてさらに詳細に説明する。まず、文字行候補生成部4の動作について図17を用いて説明する。図17は文字行候補生成部4の動作を示すフローチャートである。文字行候補生成部4の画素連結矩形生成部41は、画像入力部1から入力された名刺の画像デ−タから、画素連結矩形を生成する(ステップ301)。次に、文字行方向判定部42の仮主方向決定部42aは、名刺画像の形状から仮の主方向を決定する(ステップ302)。名刺の場合、ほとんどの場合が名刺画像の長辺と文字行は平行であるため、長辺方向を仮の主方向と設定する。次に、主方向部分文字行生成部43は、各画素連結矩形群の位置関係等の情報から、生成された画素連結矩形群を主方向に接続して主方向の部分文字行を生成する(ステップ303)。それから、主方向判断部42bが仮主方向決定部42aで決定した主方向が正しかったかどうかを判断する(ステップ304)。ここで、仮の主方向が誤っていたと判断されたときは主方向抽出部42cは、仮の主方向と直交する方向を主方向として抽出し(ステップ305)、主方向部分文字行生成部43は新たに主方向の部分文字行を生成する(ステップ306)。一方、主方向判断部42bで仮の主方向が誤っていたと判断されたときは、主方向抽出部42cは、仮の主方向主方向として抽出し(ステップ307)、主方向部分文字行生成部43は何もしない。このような処理によって、例えば図8(b)に示すような名刺であっても適切に主方向を抽出することができる。
【0072】
つぎに、非主方向部分文字行生成部44は主方向以外の部分文字行を作成する(ステップ308)。まず最初に主方向に画素連結矩形群を接続して主方向の部分文字行を生成し、それから主方向以外の部分文字行を作成するのは、文字行の多くは主方向の文字行であり、主方向の文字行が並列に並んでいる場合に、副方向に重なりのある文字同士が副方向の部分文字行と判断されることを避けるためである。
【0073】
図18に、ステップ301から308までを実行した結果の一例を示す。図に示すように、主方向への接続パラメータの一つである矩形間の距離の閾値を厳しく設定すると図18(a)のように接続不十分な箇所が発生し、逆に緩く設定すると図18(b)のように重なり度合いの大きい副方向文字行の一部と接続してしまう。また、図18(c)のように画素連結矩形が上下に別れた文字が連続する文字行の場合、1文字行が上下に分離してしまうこともある。このようにステップ303や308による接続において、常に最適の接続パラメータを設定することは容易ではない。このように接続パラメータが適切でなかった場合に対応できるように文字行候補生成部4はさらに、以下の処理を行う。この処理手順を図19を参照しながら説明する。
【0074】
まず、部分文字行分類部45は、各画素連結矩形群の位置関係、矩形の形状などの情報から、主方向の部分文字行、副方向の部分文字行、文字の部分文字行、その他の部分文字行などの属性に分類し、各部分文字行に対して、分類された固有の属性を設定する(ステップ309)。図19(a)においては、「M」「i」「L」「H」を囲む部分文字行の属性が文字であると設定され、その他の部分文字行は属性が主方向の部分文字行であると設定される。なお、「M」「i」「L」「H」は互いに距離が離れているため、それぞれを囲む領域が部分文字行とされたが、距離の閾値を大きく設定していたなら、この四つの文字を囲む領域が副方向の部分文字行と判断されることもあり得る。文字副方向接続部46により属性が文字である部分文字行のうち、互いに副方向に重なりが大きく、近接するもの同士を接続する(ステップ310)。この操作は主方向の接続(ステップ303等)では抽出できない副方向の部分文字行を抽出するために行う。例えば、図19(a)において、属性が文字の部分文字行は「M」「i」「L」「H」を囲む部分文字行であり、副方向に重なりが大きく、近接するので、図19(b)のハッチング部分に示すように副方向に接続される。さらに、部分文字行副方向接続部47は、副方向に重なりが大きく、近接する部分文字行同士を接続する(ステップ311)。これは、図18(c)のような誤接続に対処するために行なう。例えば、図19(b)では、右下の二つの矩形で囲まれる部分文字行が、互いに副方向に重なり、近接しているので、図19(c)のハッチング部分に示すように副方向に接続される。最後に、部分文字行主方向接続部48は、主方向に重なりが大きい、副方向以外の部分文字行同士を主方向に接続する(ステップ312)。これは図18(a)または図18(c)のような誤接続に対処するために行なう。例えば、図19(c)では、下の二つの矩形で囲まれる部分文字行が主方向に重なりが大きいので、図19(c)のハッチング部分に示すように接続される。
【0075】
ところで、以上の処理によっても、文字行候補生成部4の、主方向部分文字行生成部43、文字副方向接続部46、部分文字行副方向接続部47、部分文字行主方向接続部48における接続パラメータと、読み取る画像データの構成によっては、うまく文字行の抽出ができないことがある。例えば、主方向部分文字行生成部43によって図20(a)のように接続された後に、部分文字行副方向接続部47によって図20(b)のように副方向文字行の全体を含んだ1つの文字行候補として統合されてしまうことがある。このような場合であっても以下の文字矩形生成部5の処理によって、副方向の文字行も1つの文字行として抽出できる。
【0076】
文字矩形生成部5の動作について図21を用いて説明する。図21は文字矩形生成部5の動作を示すフローチャートである。この図において最初に入力されるのは、上記の文字行候補生成部4によって生成された文字行候補の任意の1つである。ここでは、図22(a)に示す文字行候補が入力されたとする。まず、被分割領域分類部51は文字行候補を最初の被分割領域とする(ステップ401)。そして、被分割領域に主方向、副方向、文字、その他のいずれかに分類して属性を設定する(ステップ403)。図22(a)に示す被分割領域は主方向の属性に設定される。被分割領域の属性が副方向文字行または文字であれば何もせず(ステップ404)、それ以外であれば、被分割領域分割部53が被分割領域内で画素連結矩形の射影を取得する(ステップ405)。セパレータとなる空白部分があれば(ステップ406)、セパレータとなる空白部分の前後で被分割領域を分割する(ステップ407)。図22(a)において、主方向、副方向の両方向に射影をとると、まず縦に長い空白部分が見つかり、この空白部分をセパレータとして左右に分割した結果が図22(b)である。
【0077】
次に、分割してできた領域それぞれを新たな被分割領域とし(ステップ408)、未処理の被分割領域が存在する間(ステップ409)、ステップ402から繰り返す。図22(b)では新たな被分割領域が左右にできるので、この新たな被分割領域に対して処理が繰り返される。左側の領域は縦に細長いため、属性が副方向であるとされ、これ以上分割されない。右側の領域は横に長く、適当な大きさがあるため、副方向文字行でも文字でもない。そして、右側の領域に射影をとると、今度は横に細長い空白部分がみつかり、これらの上下で分割すると図22(c)のようになる。ステップ406でセパレータとなる空白部分がなければ、文字矩形抽出部54は被分割領域内の重なりのある画素連結矩形を統合することにより、文字矩形を生成する(ステップ410)。図22(c)では、上の2つの領域には、広い空白部分が存在しないので、文字矩形抽出部54により文字矩形が生成される。一方、一番下の領域(「吉森亜依」の文字行)では、文字間に広い空白部分が存在するので、それぞれの左右で分割され図22(d)のようになる。分割により生じた領域は、縦横比が小さいことや長辺の長さが閾値以内であることから、属性が文字となるのでこれ以上分割されず、これらから文字矩形抽出部54により文字矩形が生成される。なお、以上の動作はあくまで文字矩形を生成するためのものであり、文字行候補は分割されず、以上の動作によっても、もとの文字行候補生成部4で生成された図22(a)の矩形の領域が文字行候補であることには変わりがない。
【0078】
今度は、文字行候補分割部6について図23を用いて説明する。図23は文字行候補分割部6の動作を示すフローチャートである。まず、文字行候補分割部6は、文字矩形生成部5で文字矩形生成の完了した文字行候補を1つ取得する(ステップ501)。次に、文字矩形平均算出部61により、文字行候補内の文字矩形の長辺の長さの平均値を算出する(ステップ502)。次に、平均値比較部62により文字行候補の短辺の長さと文字サイズ平均値を比較する。文字構成判定部64は文字行候補の短辺の長さが文字サイズ平均値より小さければ(ステップ503)、文字行候補内には1文字行のみが存在すると判定し、分割は行なわない。それ以外であれば、文字矩形分散値算出部63により、文字サイズの分散値を算出する(ステップ504)。文字構成判定部64は、文字サイズ分散値が大きければ(ステップ505)、文字行候補内には文字サイズが異なる複数の文字行が存在すると判定し、文字行候補の分割1の処理を行なう(ステップ506)。文字サイズの分散値が小さく、文字行候補短辺の長さと文字サイズ平均値がほぼ等しければ(ステップ507)、文字行候補内に同じ文字サイズの文字行が1列のみ存在し、かつセパレータが存在すると判定し、文字行候補の分割2の処理を行なう(ステップ508)。文字サイズの分散値が小さく、文字行候補短辺の長さが文字サイズの平均値より大きければ(ステップ509)、文字行候補内に同じ文字サイズの文字行が2列以上存在すると判定し、分割3の処理を行なう(ステップ510)。文字行候補の分割1、2、3については以下に述べる。
【0079】
まず、文字行候補の分割1の処理を図24を用いて説明する。図24は文字行候補の分割1の処理のフローチャートである。文字行候補の分割1は、文字行候補を文字矩形の大きさが不連続な箇所で分割する処理である。まず、文字行候補内に文字サイズが異なる複数の文字行が存在すると判定されると、大小文字矩形間検索部65は当該文字行候補の端に位置する文字矩形を取得し、基準文字とする(ステップ601)。次に基準文字に隣接する文字矩形を取得し、これを比較文字とする(ステップ602)。基準文字と比較文字の文字サイズに極端な差異があれば(ステップ603)、区間分割部68により基準文字と比較文字の間で文字行候補を分割する(ステップ604)。極端な差異がなければ現在の比較文字を基準文字とし(ステップ605)、次の文字矩形が存在する間(ステップ606)、ステップ602より繰り返す。
【0080】
かかる処理を、図25を用いてさらに具体的に説明する。xy座標系で考えた場合、横に長い文字行候補においては矩形左辺のx座標の小さい順に処理を行なう。図25(a)において、最初、文字矩形1を基準文字とし、文字矩形2を比較文字とする。文字矩形1と文字矩形2の大きさはほぼ等しいので、次に、文字矩形2を基準文字とし、文字矩形3を比較文字とする。このような処理を文字矩形の大きさに極端な差異が生じるまで進めていく。文字矩形4を基準文字とし、文字矩形5を比較文字としたところで、初めて文字矩形の大きさに極端な差異が生じるので、この文字矩形4と文字矩形5の区間が分割する区間とされる。このようにして文字行候補を分割しておくと、文字行方向に一列に並んだ、異なる文字行同士が誤接続されるのを防ぐことができる。また、図25(b)に示すように、分割領域内に列方向に複数の文字行が存在する場合は、その後、分割領域内において文字矩形同士を主方向に接続することにより、図25(c)のように正確に文字行が抽出される。
【0081】
次に、文字行候補の分割2の処理について、図26を用いて説明する。図26は文字行候補の分割2の処理を示すフローチャートである。文字行候補の分割2の処理は、文字行候補をセパレータとなる空白部分の前後で分割する処理である。まず、文字行候補内に同じ文字サイズの文字行が1列のみ存在し、かつセパレータが存在すると判定されると、文字矩形間空白検索部66は、当該文字行候補内で文字行方向に垂直な方向に文字矩形の射影をとる(ステップ701)。次に、その射影値より得られた空白部分について、セパレータとなる極端に大きい空白部分が存在するかどうか判定する(ステップ702)。セパレーターとなる空白部分が存在すると判定された場合には区間分割部68は、セパレータとなる空白部分の前後で文字行候補を分割する(ステッ703)。このような文字行候補の分割2の処理によって、例えば図27に示すような文字行方向に一列に並んだ、異なる文字行が含まれる文字行候補はセパレータから左右に分割され、これらの異なる文字行が互いに誤接続されるのを防ぐことができる。
【0082】
最後に、文字行候補の分割3の処理について図28を用いて説明する。図28は文字行候補の分割3の処理を示すフローチャートである。文字行候補の分割3は、2列に並んだ文字行の中間的な位置に存在する1/2改行文字行部分と2列に並んだ文字行の部分に分割する処理である。まず、文字行候補内に同じ文字サイズの文字行が2列以上存在すると判定されると、文字行段差部検索部67は1/2改行文字行の存在範囲を計算する(ステップ801)。次に、文字行候補の端に位置する文字矩形を取得し、比較文字とする(ステップ802)。比較文字が1/2改行文字行の存在範囲内に含まれていれば(ステップ803)、次の文字矩形が存在する間(ステップ804)、現在の比較文字に隣接する文字矩形を次の比較文字とし(ステップ805)、ステップ803より繰り返す。1/2改行文字行の存在範囲外の文字が最初の比較文字であれば(ステップ806)、1/2改行文字行は存在しないとみなす。全文字矩形が1/2改行文字行範囲に含まれる場合も同様である。1/2改行文字行の存在範囲外となった文字が最初の比較文字でなければ、区間分割部68は、比較文字の前後で文字行候補を分割する(ステップ807)。これらの処理によって、図29(a)上段に示すような文字行候補は、下段に示すように分割される。これにより、1/2改行文字行と残りの2列の文字行が誤接続されるのが防がれ、1/2改行文字行部分はそのまま文字行とし、残りの2列の文字行部分についてはその後、分割領域内において文字矩形同士を主方向に接続することにより、2列の文字行をそれぞれ抽出することができる。
【0083】
さらに、文字行候補の分割3は図29(b)に示すような1/2改行文字行に続く2行が{等の特殊文字でくくられている場合に、この特殊文字を分割する処理も行う。即ち、ステップ807による分割後、1/2改行文字行を抽出した残りの領域内において、1/2改行文字行に最も近い最初の1文字が{等の特殊文字であるかどうか判定する(ステップ808)。特殊文字であれば、その文字と残りの部分の間で文字行候補を分割する(ステップ809)。かかる処理によって、図29(b)上段の右側の文字行候補は、図の下段に示すように、特殊文字と2列の文字行部分が分離され、これにより、{の文字矩形の影響でこれらの2列の文字行を別々の行として抽出できないということを防ぐことができる。
【0084】
そして、文字矩形接続部7は、文字行候補分割部6による文字行候補の分割処理が終了した後、所定の接続条件を満たす文字行候補の分割した領域内の文字矩形群を主方向に接続して文字行を抽出する。
次に、ルビ文字行抽出部8の動作について説明する。ルビ文字行抽出部8は、ルビを構成する文字行を抽出する。つまり、以上に述べた文字行抽出部3の処理によって文字行を抽出した後であっても、ルビを構成する文字群は大きさに比較して互いの距離が非常に離れているため、文字矩形接続部7によってはルビを構成する文字矩形は接続できない場合があるために、特にルビ文字行抽出部8を設けてルビを構成する文字行を抽出する。
【0085】
図30はルビ文字行抽出部8の動作を示すフローチャートである。図30の入力状態は、文字行抽出部3によって文字行抽出がすべて完了された状態である。ここでは、例えば図31(a)のような画像が入力されているとする。まず、ルビ矩形抽出部81は生成した文字行のそれぞれを注目矩形とし、注目矩形がルビかどうか判定する(ステップ901)。図31(a)では、例えば矩形の大きさ等から「よ」を囲む文字行がルビ矩形と判定される。注目矩形がルビと判定されたならば、親文字行検索部82はルビ矩形の近傍において親文字行を検索する(ステップ902)。図31(a)では、ルビ矩形からの距離や大きさ等から「吉森 亜 依」を囲む文字行が親文字行として認定される。親文字行が見つかった場合には、ルビ存在可能範囲決定部83はルビの存在可能範囲を決定する(ステップ903)。図31(a)のように「よ」がルビ矩形であり、「吉 森 亜依」を囲む文字行が親文字行とされた場合は、図31(b)のトーン部分がルビ文字行存在可能範囲と決定される。最後に、ルビ文字行作成部84がルビの存在可能範囲に含まれるすべての矩形を注目矩形に接続することにより、ルビ文字行を抽出する(ステップ904)。この結果、図31(a)のように離れていたルビを構成する文字行は、図31(c)のように統合されて、一つの文字行となる。
【0086】
最後にノイズ文字行削除部9の動作について説明する。ノイズ文字行削除部9は、以上に述べた文字行抽出部3、ルビ文字行抽出部8の処理によって生成された各文字行について、その文字行を構成する文字矩形の数や大きさから、その文字行がノイズであるかを判断し、ノイズにより構成される文字行を削除する。
図32はノイズ文字行削除部9の動作を示すフローチャートである。図32の入力状態は、文字行抽出部3およびルビ文字行抽出部8によって文字行抽出がすべて完了された状態である。ノイズ文字行判定部91は、抽出された各文字行から一つの文字行を取得し(ステップ1001)、その文字行に含まれる文字矩形の数が予め定められた第1の閾値aよりも大きいか否かを判断する(ステップ1002)。ステップ1002で文字矩形の数が第1の閾値よりも大きい場合は、その文字行はノイズであると判断され、ノイズ文字行削除部94が、これを削除する(ステップ1006)。
【0087】
また、文字矩形の数が第1の閾値aよりも大きくないときは、ノイズ文字行候補判断部92が、文字矩形の数が第2の閾値bよりも大きいか否かについて判断する(ステップ1003)。ここで文字矩形の数が第2の閾値bよりも小さければ、この文字行はノイズでないと判断する。一方、文字矩形の数が第2の閾値bよりも大きい場合はノイズの可能性があるのでノイズ文字行候補であると判断する。例えば、ここで図33(a)(b)のような文字行をノイズ文字行候補と判断したものとする。
【0088】
ノイズ文字行候補に対し、ノイズ文字行候補検証部93は、当該ノイズ文字行候補内の文字矩形の大きさの平均値を算出し(ステップ1004)、この平均値が文字行の短辺の長さに対して所定の割合以下であるか否かを判断する(ステップ1005)。ここで、所定の割合以下であると判断された場合は、当該文字行はノイズであると判断され、ノイズ文字行削除部94がこれを削除する(ステップ1006)。図38(b)に示すノイズ文字行候補は、文字矩形の大きさの平均値が文字行の短辺の大きさより十分小さいので、ノイズと判断されて削除される。一方、所定の割合以下でないと判断された場合は、当該文字行はノイズではないと判断される。図38(a)に示すノイズ文字行候補は、文字矩形の大きさの平均値が文字行の短辺の長さに比較的近い値となり、ノイズではないと判断される。以上の動作(ステップ1001〜ステップ1006)を全ての文字行に対して行い(ステップ1007)、ノイズを構成する文字行を削除は完了する。
【0089】
なお、上記実施の形態において文字行候補生成部4では、主方向の文字行が並列に並んでいる場合に、副方向に重なりのある文字同士が副方向の部分文字行と判断されることを避けるため、最初に主方向の部分文字行を作成して、それからその他の部分文字行を作成した。しかし、処理対象の特定の領域に副方向の文字行が高い確率で現れることが経験的にわかっているときは、この特定の領域についてのみ先に副方向の文字行を作成しておくことが望ましい。例えば、上記実施の形態に基づく処理によって文字行候補生成部4が図34(a)に示すような文字行候補を生成した場合、文字矩形生成部5において射影の取得を行っても副方向文字行「a」と他の主方向文字行の間が詰まっており、セパレータとなりうる空白部分が発生しない。したがって、副方向文字行「a」が独立して副方向の属性を与えられることはなく、図34(b)のように、単独で文字矩形として生成される。さらに、文字行候補分割部6、文字矩形接続部7の処理によって、結果として図34(c)のような文字行が抽出されてしまう。一方、対象画像が名刺であって主方向が長辺方向である場合は、図35に示すような両短辺に沿う一定領域Xに副方向の文字行が現れる確率が高いことが知られている。このような場合には、このような領域における文字行を先に生成しておけば上述のような事態を防ぐことができる。
【0090】
かかる目的を達成するためには、文字行候補生成部4において図36に示すように、処理対象の画像データの予め定められた所定領域内において、副方向に重なり、かつ、近接する画素連結矩形群を副方向に接続して副方向の部分文字行として生成する特定領域部分文字行生成部49を設ければよい。
特定領域部分文字行生成部49を設けたときの部分文字行分類に至るまでの動作を表すフローチャートを図37に示す。これ以下の動作は図17に示すフローチャートと同じである。これに基づき図38(i) に示す名刺画像を例にとって動作を説明すると、画素連結矩形生成部41は名刺の画像データから画素連結矩形を生成し(ステップ1101)、文字行方向判定部42の仮主方向決定部42aは仮の主方向を決定する(ステップ1102)。ここでは上述したように名刺画像の長辺方向が仮の主方向とされる。次に、特定領域部分文字行生成部49が予め定められた特定の領域において、副方向の部分文字行を生成する(ステップ1103)。ここでは図35のハッチングされた領域Xが予め定められた領域であるとする。すると、図38(i) の名刺画像から図38(ii)のように、「☆anasonic」の部分が副文字行として抽出される。
【0091】
それから、上述した文字行候補生成部4の動作と同様にして、主方向部分文字行生成部43が主方向の部分文字行が生成し(ステップ1104)、主方向判断部42bが、領域X以外の領域において仮の主方向が正しいか否かを判断し(ステップ1105)、ここで正しいと判断された場合は主方向抽出部42cがその方向を主方向として抽出する。一方、ステップ1105で正しくないと判断されたときは、主方向抽出部42cが仮の主方向と直交する方向を主方向として抽出し(ステップ1107)、特定領域部分文字行生成部49が、以前の特定領域における文字行の生成を取り消し、新たに特定領域の部分文字行を生成する(ステップ1108)。ただし、仮の主方向が変わることで通常は特定領域も変わるが、場合によっては仮の主方向が変わることによって特定の領域がなくなる場合もある。そのような場合には、特定領域部分文字行生成部49での文字行の生成は行われない。今の場合は、名刺画像であるが主方向が短辺に平行な方向となった場合は、かかる特定領域は存在しなくなるので、ステップ1108では以前の特定領域を取り消すに留まる。ステップ1108、1109の後、非主方向部分文字行生成部44がその他の部分文字行を生成する(ステップ1010)。この結果、文字行候補生成部4において図38(i)の名刺画像からは図38(iii)のよう文字行候補が生成される。これにより、以後の処理によっても副方向の文字行の一部が主方向の文字行に取り込まれることがなくなる。なお、特定領域において副方向を接続する際の接続条件は、特定領域に存在する主方向の部分文字行の一部を誤接続しないように、厳しく設定しておくことが望ましい。
【0092】
さらに、上記実施の形態において、文字行候補生成部4の部分文字行副方向接続部47は図18(c)に示すような1文字行が上下に分離してしまった属性が文字行である部分文字行を接合するために、副方向に重なりが大きく、近接する部分文字行同士を接続している。この際、近接するか否かは部分文字行を構成する矩形間の距離が所定の閾値よりも小さいか否かによって判断するが、画像が傾いて画像入力部1から取り込まれた場合は、この部分文字行を構成する矩形間の距離が実際よりも小さくなってしまう。例えば、図39(a)の名刺画像の下方の電話番号とファクシミリ番号の文字行間の距離は、傾きなしに画像入力部1から取り込まれた場合はdであるが、図39(b)に示すように角度θだけ傾いて取り込まれた場合は、両文字間の距離はd’になり、小さくなってしまう。この結果、部分文字行副方向接続部47によって接続されるべきでない両文字行が接続されてしまう。そして、傾きが大きく両矩形間が一定距離以内となれば、文字矩形生成部5においてもこの間隔をセパレータと認識できず、個々の文字が文字矩形として生成されずに正しい文字行抽出が行われなくなることもあり得る。このことは部分文字行が長い場合に傾きによる移動量が大きくなるため顕著に現れる。
【0093】
そこで、このように名刺画像が傾きをもって入力された場合に対処する手段として、部分文字行副方向接続部47を図40に示すような構成とすることができる。即ち、部分文字行副方向接続部47に、副方向に重なり、かつ、準近接する主方向の部分文字行同士を抽出する準近接部分文字行抽出部47bと、この準近接部分文字行抽出部47bで抽出された部分文字行同士間における各部分文字行に含まれる画素連結矩形の距離が所定の値以下であれば、当該部分文字行同士を接続し新たな主方向の部分文字行を生成する準近接部分文字行接続部47cを付加する。なお、近接部分文字行副方向接続部47aは、上述した実施の形態における部分文字行副方向接続部47と同様のものであり、副方向に重なり、かつ、近接する主方向の部分文字行群を接続して新たな主方向の部分文字行を生成する。
【0094】
このような構成を有する部分文字行副方向接続部47の動作を図41を用いて説明する。図41は部分文字行副方向接続部47の動作を示すフローチャートである。まず、近接部分文字行副方向接続部47aが部分文字行のペアを取得し(ステップ1201)、副方向に十分重なるか否か、ここでは長辺の短い方の1/2以上重なるか否かを判断する(ステップ1202)。ここで、十分に重ならないと判断した場合は、その部分文字行のペアについての処理は終了する。
【0095】
十分に重なると判断された場合は、次に各部分文字行を構成する矩形間の距離が所定の近接していると言える距離の範囲、ここでは短辺の短い方の30%以上重なっている距離の範囲にあるか否かを判断する(ステップ1203)。ここで、近接していると判断した場合は当該部分文字行同士を接続する(ステップ1207)。
【0096】
近接していないと判断した場合は、準近接部分文字行抽出部47bによって、各部分文字行を構成する矩形間の距離が所定の準近接していると言える距離の範囲、ここでは400dpiの精度で1ピクセル(原画像における約0.07mm)以内の範囲にあるか否かを判断する(ステップ1204)。このステップによって準近接していないと判断した場合は、この部分文字行のペアは接続されずに処理が終わる。ステップ1204で準近接していると判断した場合は、準近接部分文字行接続部47cが、まず、部分文字行同士間における各部分文字行に含まれる画素連結矩形の副方向における距離を取得し平均値を算出する(ステップ1205)。そして、この平均値が、所定の近接しているといえるほどの値以内、ここでは400dpiの精度で1ピクセル(原画像における約0.3mm)以内であるか否かを判断する(ステップ1206)。ここで、近接していると判断した場合は、当該部分文字行のペアを接続し(ステップ1207)。そうでなければ接続は行わない。以上の動作を全ての部分文字行のペアについて行う(ステップ1208)。
【0097】
このように、上記構成を有する部分文字行副方向接続部47では接続すべきか否かの判断が困難な部分文字行のペアについては、画素連結矩形間の距離を基準に判断するので、部分文字行が長くても傾きの影響を受けずに正確な判断が可能となる。例えば、図42(a)および図42(b)の部分文字行のペアではステップ1204で準近接してるいるといる判断が下され、ステップ1205において画素連結矩形の距離a、bがそれぞれ求められ、これらの平均値が算出され、さらに、ステップ1206において画素連結矩形が近接しているか否かが判断される。図42(b)の場合は距離bの平均値が小さいので近接していると判断されて接続される。一方、図42(a)の場合は距離aの平均値が大きいので近接していないと判断される。そして、たとえ画像が傾いて入力されて部分文字行間が狭くなっていても、画素連結矩形間の距離にはあまり影響がないので同様の結果が得られる。なお、ここでは、準近接するときに最終的に接続する否かの判断を画素連結矩形間の距離の平均値によって行ったが、これは、画素連結矩形間の距離の小さいものから所定の順番目までのものが、所定の閾値以下であるか否かで判断してもよい。
【0098】
ところで、以上の実施形態では、名刺から文字を抽出する場合を例に挙げており、画素連結成分の接続のパラメータや文字行候補の分割の際の閾値等の、任意に設定できる変数の値等は慣用されている名刺の文字の大きさやレイアウト等から経験的、または実験的に定めることができる。そして、この各種の変数の値は文字行を抽出する対象が変わることによって、例えば葉書から文字行を抽出する場合等は、名刺の場合と異なる値が採用できることは言うまでもない。
【0099】
【発明の効果】
以上のように、まず、本願発明に係る文字行抽出方法および装置では、画像データから画素の連結する成分の外接矩形が画素連結矩形として生成され、文字行の主方向と副方向が判定され、生成された画素連結矩形群が、主方向、副方向に接続されて文字行候補を生成する。そして、文字行候補内で各画素連結矩形の相互の位置関係から文字を構成する画素連結矩形群が抽出され、これに外接する矩形が文字矩形として生成され、文字行候補内での文字矩形の構成に応じて、文字行候補が分割され、分割された文字行候補内で文字矩形を接続して文字行が抽出される。
【0100】
このように、主方向、副方向の文字行候補を作成し、文字行候補の構成に応じて、文字行候補が分割されて文字矩形が接続されるので、従来の方法では抽出が困難であった、文字の大きさやピッチの異なる文字行、行間の幅が狭い文字行、縦書き文字行や横書き文字行が混在するような複雑なレイアウトの文書から、正確にかつ効率よく文字行を抽出することができ、文字認識率の向上を図ることができる。
【0101】
また、本願発明に係る文字領域抽出方法では、画像データから画素の射影分布を生成し、射影分布を一定の幅でグループ化し、各グループ内の射影分布の代表値を算出し、隣接するグループの代表値間の差の最も大きなグループ間の境界をグループ境界として求め、このグループ境界を挟む2つのグループ内の射影分布の差から文字領域と写真図形領域との境界を決定し、この境界の接している射影分布の小さい側を文字領域として抽出する。このようにして文字領域の抽出を行なうので、写真等が混在する文書においても、1写真領域が複数の領域に分割されて抽出されて、その一部が文字領域と誤って抽出されることがない。
【0102】
そして、上記文字行抽出方法において、この文字領域抽出方法および装置によって抽出された文字領域を処理対象とするようにすれば、写真領域を含む文書から文字行を抽出する際に、まず、文字領域が抽出されることになるので、写真領域の一部が文字行として抽出されることなく、容易にかつ正確に文字行を抽出することができる。
【0103】
また、上記文字行抽出方法および装置における画素連結矩形の接続では、主方向に重なり、かつ、近接する画素連結矩形群を主方向に接続して主方向の部分文字行として生成し、接続されなかった画素連結矩形群で、所定の距離の範囲内にあるものを接続して、主方向以外の部分文字行として生成し、部分文字行のうち、縦横比から文字を構成する部分文字行を抽出する。そして、副方向に重なり、かつ、近接する文字を構成する部分文字行群を副方向に接続して、新たな副方向の部分文字行を生成する。さらに、副方向に重なり、かつ、近接する主方向の部分文字行群を接続して新たな主方向の部分文字行を生成し、主方向に重なる、主方向の部分文字行群を主方向に接続して新たな主方向の部分文字行を生成する。
【0104】
以上のような動作により生成された部分文字行を文字行候補とすれば、副方向の部分文字行が正確に抽出でき、文字行が副方向に分離されるのを防ぐことができ、縦書き、横書き文字行が混在する文書において、両方向の文字行を容易に抽出することができる。
また、本願発明に係る文字行主方向抽出方法および装置では、処理対象の画像データの形状から仮の主方向を決定して主方向部分文字行を生成し、生成した主方向部分文字行の長さ、数、その基本矩形の配置等の構成から、仮の主方向が正しいかどうかを判断し、仮の主方向が正しいと判断されればその仮の主方向を主方向として抽出し、仮の主方向が正しくないと判断されればその仮の主方向に直交する方向を主方向として抽出する。
【0105】
このような動作により、例えば名刺画像において行間が狭く、長さの短い文字行がかたまっているような場合等、主方向が通常の経験で判断される方向と異なる場合でも正確に文字行方向を判定することができるだけでなく、仮の主方向が正しかった場合、生成した部分文字行をそのまま後の処理に用いることができるので効率がよい。
【0106】
即ち、この文字行主方向抽出方法および装置を、上記文字行抽出方法および装置の文字行候補の生成における主方向の判定に用いると、より正確な文字行の抽出が可能となり、効率も上がることとなる。
さらに、上記画素連結矩形の生成における部分文字行の生成で、副方向に重なり、かつ準近接する主方向の部分文字行同士を抽出し、抽出された部分文字行同士間に含まれる画素連結矩形の距離が所定の値以下であれば、当該部分文字行同士を接続して新たな主方向の部分文字行を生成するような構成を加えると、対象画像が傾いて入力された場合でも、画素連結矩形間の距離で接続するか否かを判断するので行間が狭く長い文字行同士も誤結合されることを防ぐことができる。
【0107】
さらに、上記部分文字行の生成において、処理対象の画像データの所定領域を予め定めておき、当該所定領域内において、副方向に重なり、かつ、近接する画素連結矩形群を副方向に接続して副方向の部分文字行として生成するようにしておけば、より精度よく、副方向文字行を抽出することが出来る。
また、本願発明に係る文字行抽出方法および装置における文字矩形の生成では、文字行候補を被分割領域とし、この被分割領域を、主方向の被分割領域、副方向の被分割領域、その他の被分割領域に分類する。そして、副方向の被分割領域に分類された場合は、この被分割領域となっている文字行候補を文字行として抽出し、その他の被分割領域と分類された場合は、この被分割領域の外接矩形を文字矩形として作成し、主方向の被分割領域であると分類された場合は、この主方向の被分割領域に対して、主方向、副方向に射影をとり、射影間の空白部分が所定の長さを越える区間がある場合は、当該区間で被分割領域を分割してあらたな被分割領域とする。それから、主方向の非分割領域で射影間の空白部分が所定の長さを越える区間がない場合に、当該被分割領域内で、各画素連結矩形の相互の位置関係から文字を構成する画素連結矩形群を抽出し、これに外接する矩形を文字矩形として生成する。このような構成を設ければ以下のような効果を奏する。
【0108】
つまり、副方向の文字行を抽出して文字行を確定するので、文字行候補の生成において、副方向の文字行が主方向の文字行と混在することとなっても、副方向の文字行の抽出ができ、縦書き、横書き文字行が混在する文書からも、より容易に両方向の文字行を抽出することができる。また、主方向の文字矩形を精度よく抽出することができることにより、文字行候補の構成も精度よく判定することができる。
【0109】
さらに、文字行候補の分割において、文字行候補内での文字矩形の大きさの平均値と分散値のいずれか又は両方により、文字行候補内での文字矩形の構成を判断し、文字行候補内で文字矩形間で所定の差異を有すると判断された場合に、所定の差異がある文字矩形間で、文字行候補を分割するようにすれば、一つの文字行候補内で、文字矩形の構成の異なるところで文字行候補が分離されるので、一つの文字行候補内に異なる文字行が含まれていても、これを分離することができる。
【0110】
さらに、上記のような文字行候補の分割で、文字行候補内での文字矩形の構成を判断する場合に、文字行候補内での文字矩形の一辺の長さの平均値が文字行候補の短辺の長さよりも小さく、かつ、文字矩形の一辺の長さの分散値が所定値よりも大きければ、文字行候補中に大小の文字矩形が存在するという判断を含み、文字行候補中に大小の文字矩形が存在すると判断された場合に、大きい文字矩形と小さい文字矩形を挟む区間を検索し、検索された区間で、文字行候補を分割することとすれば、特に、文字矩形の大きさが異なる文字行同士が近接している文書において、文字矩形の大きさが異なる文字行同士が誤結合されることなく、別々の文字行として抽出することができる。
【0111】
また、上記のような文字行候補の分割で、文字行候補内での文字矩形の構成を判断する場合に、文字行候補内での文字矩形の一辺の長さの平均値が文字行候補の短辺の長さとほぼ同じであれば、文字行候補中の文字矩形間に空白が存在するという判断を含み、文字行候補中の文字矩形間に空白があると判断された場合に、空白がある区間を検索し、検索された区間で、文字行候補を分割するようにすれば、特に、文字の大きさが等しい、異なる文字行同士が1列に並んでいる文書において、異なる文字行同士が誤結合されることなく、別々の文字行として抽出することができる。
【0112】
そして、上記のような文字行候補の分割で、文字行候補内での文字矩形の構成を判断する場合に、文字行候補の短辺の長さが文字行候補内での文字矩形の一辺の長さの平均値の2倍以上であれば、文字行候補中に文字列が2列以上混在するという判断を含み、文字行候補中に文字列が2列以上混在すると判断された場合に、文字行間で段差を生じている区間を検索し、検索された区間で、文字行候補を分割するようにすれば、特に、文字の大きさが等しい2列の文字行が存在し、さらに前記2列の中間的な位置に文字行が存在する文書において、中間的な位置に存在する文字行の影響により前記2列の文字行が誤結合されることなく、別々の文字行として抽出することができる。
【0113】
また、ここでさらに検索された区間に隣接する文字矩形が所定の特殊な文字矩形か否かを判断し、所定の特殊な文字矩形であると判断された場合に、当該特殊な文字矩形を分割するようにすれば、特に、2列以上の文字行の前に{等の特殊文字が存在する文書において、特殊文字の影響により前記2列以上の文字行が誤結合されることなく、別々の文字行として抽出することができる。
【0114】
さらに、本願発明においては、画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、抽出された各画素連結矩形の位置関係から文字を構成する部分を抽出して、これに外接する矩形を文字矩形として生成し、生成された各文字矩形を連結することによって文字行を抽出する場合に、所定の構成を有する文字矩形をルビ矩形として抽出し、ルビ矩形の近傍に存在する親文字行を検索し、このルビ矩形を含む、検索された親文字行に対してルビが存在し得る範囲を決定し、ルビが存在し得る範囲に存在するルビ矩形および文字行を連結することによって、ルビを構成する文字行を抽出することとしたので、文字間距離が極端に離れている文字行、例えば名刺の氏名にふられているルビを、他行の抽出精度に悪影響を及ぼすことなく、文字行として抽出することができる。
【0115】
そして、本願発明においては抽出された各文字行について、抽出された文字行内の画素連結矩形または文字矩形の数が定められた第1の閾値よりも大きければ、その文字行がノイズであると判断し、ノイズであると判断された文字行を削除するようにしたので、ノイズが誤って文字行として認識された場合もこれを削除することができ、文字認識率の向上を図ることができる。
【0116】
このノイズにより構成される文字行の削除に際してさらに、抽出された文字行内の画素連結矩形または文字矩形の数が前記第1の閾値よりも小さく、第1の閾値よりも小さい定められた第2の閾値よりも大きければ、その文字行をノイズ文字行候補とし、ノイズ文字行候補内の画素連結矩形または文字矩形の大きさの平均値を算出し、この平均値が当該ノイズ文字行候補の短辺の長さに対して所定の割合以下であれば、そのノイズ文字行候補をノイズと判断するようにすれば、画素連結矩形や文字矩形の数だけではノイズか否かの判断が困難な場合に、さらに詳細な判断を行うことが可能となり、より精度良くノイズによって構成される文字行を削除することができる。
【図面の簡単な説明】
【図1】本発明の文字行抽出方法を用いた文字認識装置の一例を示すブロック図である。
【図2】文字領域抽出部の構成を示すブロック図である。
【図3】画素の射影分布および射影グループの一例を示す図である。
【図4】文字行候補生成部の構成を示すブロック図である。
【図5】画素連結矩形の一例を示す図である。
【図6】画素連結矩形群を接続して部分文字行を生成したところを示す図である。
【図7】主方向、副方向の一例を示す図である。
【図8】(a)は仮の主方向が正しい状態を示す図であり、(b)は仮の主方向が正しくない状態を示す図である。
【図9】文字矩形生成部の構成を示すブロック図である。
【図10】画素連結矩形の射影の一例を示す図である。
【図11】画素連結矩形群から文字矩形を生成したところを示す図である。
【図12】文字行候補分割部の構成を示すブロック図である。
【図13】ルビ文字行抽出部の構成を示すブロック図である。
【図14】ノイズ文字行削除部の構成を示すブロック図である。
【図15】文字領域抽出部の処理を示すフローチャートである。
【図16】文字行抽出部の処理を示すフローチャートである。
【図17】文字行候補生成部の処理を示すフローチャートである。
【図18】部分文字行の生成結果の例を示す図である。
【図19】文字行候補の生成過程の例を示す図である。
【図20】文字行候補の生成過程の他の例を示す図である。
【図21】文字矩形生成部の処理を示すフローチャートである。
【図22】文字矩形の生成過程の例を示す図である。
【図23】文字行候補分割部の処理を示すフローチャートである。
【図24】図23における文字行候補の分割1の処理を示すフローチャートである。
【図25】文字サイズが異なる複数の文字行が存在する文字行候補の例を示す図である。
【図26】図23における文字行候補の分割2の処理を示すフローチャートである。
【図27】同じ文字サイズの文字行が1列のみ存在し、かつセパレータとなる空白部分が存在する文字行候補の例を示す図である。
【図28】図23における文字行候補の分割3の処理を示すフローチャートである。
【図29】(a)は同じ文字サイズの文字行が2列存在し、1/2改行文字行が存在する文字行候補の例を示す図であり、(b)はさらに特殊文字が存在する文字行候補の例を示す図である。
【図30】ルビ文字行抽出部の処理の例を示すフローチャートである。
【図31】ルビ文字行抽出過程の例を示す図である。
【図32】ノイズ文字行削除部の処理を示すフローチャートである。
【図33】文字行とノイズ文字行との違いを示す図である。
【図34】副方向文字行が含まれる文字行候補において、セパレータとなりうる空白部分が存在しない例を示す図である。
【図35】長辺が主方向の名刺において、副方向の文字行が存在する確率の高い特定領域を示す図である。
【図36】特定領域部分文字行生成部を設けた文字行候補生成部の構成を示すブロック図である。
【図37】特定領域部分文字行生成部を設けた文字行候補生成部の処理を示すフローチャートである。
【図38】特定領域部分文字行生成部を設けた文字行候補生成部による部分文字行の生成過程の例を示す図である。
【図39】(a)は対象画像が適切に入力された状態を示す図であり、(b)は対象画像が傾いて入力された状態を示す図である。
【図40】部分文字行副方向接続部の他の構成を示す図である。
【図41】部分文字行副方向接続部の処理を示すフローチャートである。
【図42】部分文字行副方向接続部における画素連結矩形間距離の例を示す図である。
【図43】従来の文字領域抽出方法による抽出過程を示す図である。
【符号の説明】
1 画像入力部
2 文字領域抽出部
3 文字行抽出部
4 文字行候補生成部
5 文字矩形生成部
6 文字行候補分割部
7 文字矩形接続部
8 ルビ文字行抽出部
9 ノイズ文字行削除部
10 文字認識部
21 射影分布生成部
22 射影グループ生成部
23 射影グループ代表値算出部
24 グループ境界抽出部
25 文字域抽出部
41 画素連結矩形生成部
42 文字行方向判定部
42a 仮主方向決定部
42b 主方向判断部
42c 主方向抽出部
43 主方向部分文字行生成部
44 非主方向部分文字行生成部
45 部分文字行分類部
46 文字副方向接続部
47 部分文字行副方向接続部
47a 近接部分文字行副方向接続部
47b 準近接部分文字行抽出部
47c 準近接部分文字行接続部
48 部分文字行主方向接続部
49 特定領域部分文字行生成部
51 被分割領域分類部
52 副方向文字行抽出部
53 被分割領域分割部
54 文字矩形抽出部
61 文字矩形平均算出部
62 平均値比較部
63 文字矩形分散算出部
64 文字構成判定部
65 大小文字矩形間検索部
66 文字矩形間空白検索部
67 文字行段差部検索部
68 区間分割部
69 特殊文字判定部
70 特殊文字分割部
81 ルビ矩形抽出部
82 親文字行検索部
83 ルビ存在可能範囲決定部
84 ルビ文字行作成部
91 ノイズ文字行判断部
92 ノイズ文字行候補判断部
93 ノイズ文字行候補検証部
94 ノイズ文字行削除部

Claims (33)

  1. 文字行候補生成手段と、文字矩形生成手段と、文字行候補分割手段と、文字矩形接続手段とを備える文字行抽出装置において用いられ、文字行候補生成ステップと、文字矩形生成ステップと、文字行候補分割ステップと、文字矩形接続ステップとにより構成される文字行抽出方法であって、
    文字行候補生成手段において用いられる文字行候補生成ステップが、
    処理対象の画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出する画素連結矩形生成ステップと、
    前記画像データもしくは抽出された各画素連結矩形の構成から、主な文字行の方向を主方向、主方向に直交する方向を副方向として判定する文字行方向判定ステップと、
    各画素連結矩形を相互の位置関係に応じて主方向又は副方向に接続することにより文字行候補を生成する画素連結矩形接続ステップとからなり、
    文字矩形生成手段において用いられる文字矩形生成ステップが、
    文字行候補内で、各画素連結矩形の相互の位置関係から文字を構成する画素連結矩形群を抽出し、これに外接する矩形を文字矩形として生成するステップであり、
    文字行候補分割手段において用いられる文字行候補分割ステップが、
    文字行候補内での文字矩形群の構成に応じて、文字行候補を分割するステップであり、
    文字矩形接続手段において用いられる文字矩形接続ステップが、分割された文字行候補内で文字矩形を接続して文字行とするステップである、
    文字行抽出方法。
  2. 前記文字行抽出方法は、さらに、
    処理対象の画像データから射影分布を生成する射影分布生成ステップと、
    射影分布を所定の幅ごとにグループ化する射影グループ生成ステップと、
    生成された各グループ内の射影分布の代表値を算出する射影グループ代表値算出ステップと、
    隣接する前記射影分布のグループの代表値間の差の最も大きなグループ間の境界をグループ境界として求めるグループ境界抽出ステップと、
    このグループ境界を挟む2つのグループ内の射影分布の差から文字領域と写真図形領域との境界を決定し、当該境界の接している射影分布の小さい側を文字領域として抽出する文字領域抽出ステップと
    よりなる文字領域抽出方法を含むことを特徴とする請求項1に記載の文字行抽出方法。
  3. 請求項1記載の文字行抽出方法における処理対象を請求項2記載の文字領域抽出方法により抽出された文字領域とした文字行抽出方法。
  4. 前記画素連結矩形接続ステップが、
    主方向に重なり、かつ、近接する画素連結矩形群を主方向に接続して主方向の部分文字行として生成する主方向部分文字行生成ステップと、
    主方向部分文字行生成ステップで、接続されなかった画素連結矩形群で、所定の距離の範囲内にあるものを接続して、主方向以外の部分文字行として生成する非主方向部分文字行生成ステップと、
    部分文字行のうち、縦横比から文字を構成する部分文字行を抽出する文字部分文字行抽出ステップと、
    副方向に重なり、かつ、近接する文字を構成する部分文字行群を副方向に接続して、新たな副方向の部分文字行を生成する部分文字行接続第1ステップと、
    副方向に重なり、かつ、近接する主方向の部分文字行群を接続して新たな主方向の部分文字行を生成する部分文字行接続第2ステップと、
    主方向に重なる、主方向の部分文字行群を主方向に接続して新たな主方向の部分文字行を生成する部分文字行接続第3ステップと、
    より生成された部分文字行を文字行候補とする請求項1記載の文字行抽出方法。
  5. 前記文字行抽出方法は、さらに、
    処理対象の画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、この抽出した画素連結矩形を用いて処理対象の画像の主方向を抽出する方法であって、
    処理対象の画像データの形状から仮の主方向を決定する仮主方向決定ステップと、
    主方向に重なり、かつ、近接する画素連結矩形群を主方向に接続して主方向の部分文字行として生成する主方向部分文字行生成ステップと、
    生成された各主方向の部分文字行の構成から、仮主方向決定ステップで決定した仮の主方向が正しいかどうかを判断する主方向判断ステップと
    主方向判断ステップで仮の主方向が正しいと判断されればその仮の主方向を主方向として抽出し、仮の主方向が正しくないと判断されればその仮の主方向に直交する方向を主方向として抽出する主方向抽出ステップと
    を有する文字行主方向抽出方法を含むことを特徴とする請求項1に記載の文字行抽出方法。
  6. 前記文字行候補生成ステップが、請求項5記載の文字行主方向抽出方法を用いて主方向を判定し、
    前記主方向部分文字行生成ステップが、前記文字行主方向抽出方法の前記主方向判断ステップによって仮の主方向が正しくないと判断された場合のみ、主方向の部分文字行を生成する
    請求項4記載の文字行抽出方法。
  7. 前記部分文字行接続第2ステップにさらに、
    副方向に重なり、かつ、準近接する主方向の部分文字行同士を抽出する準近接部分文字行抽出ステップと、
    この準近接部分文字行抽出ステップで抽出された部分文字行同士間における各部分文字行に含まれる画素連結矩形の距離が所定の値以下であれば、当該部分文字行同士を接続し新たな主方向の部分文字行を生成する準近接部分文字行接続ステップと、
    を設けた請求項4又は6記載の文字行抽出方法。
  8. 請求項4、6又は7記載の文字行抽出方法において、主方向接続ステップの前にさらに、
    処理対象の画像データの所定領域を予め定めておき、当該所定領域内において、副方向に重なり、かつ、近接する画素連結矩形群を副方向に接続して副方向の部分文字行として生成する特定領域部分文字行生成ステップを設けた文字行抽出方法。
  9. 前記文字矩形生成ステップが、
    文字行候補を被分割領域とし、この被分割領域を、主方向の被分割領域、副方向の被分割領域、その他の被分割領域に分類する被分割領域分類ステップと、
    被分割領域分類ステップで、副方向の被分割領域であると分類された場合は、この被分割領域となっている文字行候補を文字行として抽出する副方向文字行抽出ステップと、
    被分割領域分類ステップで、その他の被分割領域と分類された場合は、この被分割領域の外接矩形を文字矩形として作成する単体文字矩形作成ステップと、
    被分割領域分類ステップで、主方向の被分割領域であると分類された場合は、この主方向の被分割領域に対して、主方向、副方向に射影をとり、射影間の空白部分が所定の長さを越える区間がある場合は、当該区間で被分割領域を分割してあらたな被分割領域とする被分割領域分割ステップと、
    被分割領域分割ステップで、射影間の空白部分が所定の長さを越える区間がない場合に、当該被分割領域内で、各画素連結矩形の相互の位置関係から文字を構成する画素連結矩形群を抽出し、これに外接する矩形を文字矩形として生成する主方向文字矩形生成ステップと、
    を有する請求項1、3、4、6〜8のいずれか1項に記載の文字行抽出方法。
  10. 前記文字行候補分割ステップが、
    文字行候補内での文字矩形の大きさの平均値と分散値のいずれか又は両方により、文字行候補内での文字矩形の構成を判断する文字矩形構成判断ステップと、
    文字矩形構成判断ステップにより、文字行候補内で文字矩形間に所定の差異を有すると判断された場合に、所定の差異がある文字矩形間で、文字行候補を分割する文字矩形間分割ステップと、
    を有する請求項1、3、4、6〜9のいずれか1項に記載の文字行抽出方法。
  11. 前記文字矩形構成判断ステップが、
    文字行候補内での文字矩形の一辺の長さの平均値が文字行候補の短辺の長さよりも小さく、かつ、文字矩形の一辺の長さの分散値が所定値よりも大きければ、文字行候補中に大小の文字矩形が存在するという判断を含み、
    前記文字矩形間分割ステップが、
    文字矩形判断ステップにより文字行候補中に大小の文字矩形が存在すると判断された場合に、大きい文字矩形と小さい文字矩形を挟む区間を検索する大小文字矩形間検索ステップと、
    大小文字矩形間検索ステップで検索された区間で、文字行候補を分割する区間分割ステップと、
    を有する請求項1、3、4、6〜10のいずれか1項に記載の文字行抽出方法。
  12. 前記文字矩形構成判断ステップが、
    文字行候補内での文字矩形の一辺の長さの平均値が文字行候補の短辺の長さとほぼ同じであれば、文字行候補中の文字矩形間に空白が存在するという判断を含み、
    前記文字矩形間分割ステップが、
    文字矩形判断ステップにより文字行候補中の文字矩形間に空白があると判断された場合に、空白がある区間を検索する文字矩形間空白検索ステップと、
    文字矩形間空白検索ステップで検索された区間で、文字行候補を分割する区間分割ステップとを有する、
    請求項1、3、4、6〜11のいずれか1項に記載の文字行抽出方法。
  13. 前記文字矩形構成判断ステップが、
    文字行候補の短辺の長さが文字行候補内での文字矩形の一辺の長さの平均値の2倍以上であれば、文字行候補中に文字列が2列以上混在するという判断を含み、
    前記文字矩形間分割ステップが、
    文字矩形判断ステップにより文字行候補中に文字列が2列以上混在すると判断された場合に、文字行間で段差を生じている区間を検索する文字行段差部検索ステップと、
    文字行段差部検索ステップで検索された区間で、文字行候補を分割する区間分割ステップとを有する、
    請求項1、3、4、6〜12のいずれか1項に記載の文字行抽出方法。
  14. 請求項13記載の文字行抽出方法において、
    前記文字行段差部検索ステップで検索された区間に隣接する文字矩形が所定の特殊な文字矩形か否かを判断する特殊文字判定ステップと、
    特殊文字判定ステップで所定の特殊な文字矩形であると判断された場合は、当該特殊な文字矩形を分割する、特殊文字分割ステップと、
    をさらに有する請求項13記載の文字行抽出方法。
  15. 前記文字行抽出方法は、さらに、画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、抽出された各画素連結矩形の位置関係から文字を構成する部分を抽出して、これに外接する矩形を文字矩形として生成し、生成された各文字矩形を連結することによって文字行を抽出する方法であって、
    所定の構成を有する文字矩形をルビ矩形として抽出する、ルビ矩形抽出ステップと、
    ルビ矩形の近傍に存在する文字行を検索する親文字行検索ステップと、
    このルビ矩形を含む、検索された文字行に対してルビが存在し得る範囲を決定するルビ存在可能範囲決定ステップと、
    ルビが存在し得る範囲に存在するルビ矩形および文字行を連結することによって、ルビを構成する文字行を抽出するルビ文字行抽出ステップと、
    を有する方法を含むことを特徴とする請求項1に記載の文字行抽出方法。
  16. 前記文字行抽出方法は、さらに、画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、抽出された各画素連結矩形の位置関係から文字を構成する部分を抽出して、これに外接する矩形を文字矩形として生成し、生成された各文字矩形を連結することによって文字行を抽出する方法であって、
    抽出された文字行内の画素連結矩形または文字矩形の数が定められた第1の閾値よりも大きければ、その文字行がノイズであると判断するノイズ文字行判断ステップと、
    ノイズと判断された文字行を削除するノイズ文字行削除ステップと
    を有する方法を含むことを特徴とする請求項1に記載の文字行抽出方法。
  17. 請求項16記載の文字行抽出方法において、さらに、
    抽出された文字行内の画素連結矩形または文字矩形の数が前記第1の閾値よりも小さく、第1の閾値よりも小さい定められた第2の閾値よりも大きければ、その文字行をノイズ文字行候補とするノイズ文字行候補判断ステップと、
    ノイズ文字行候補内の画素連結矩形または文字矩形の大きさの平均値を算出し、この平均値が予め定められる所定の値以下であれば、そのノイズ文字行候補をノイズと判断するノイズ文字行候補検証ステップと
    を設けた文字行抽出方法。
  18. 文字行候補生成手段と、文字矩形生成手段と、文字行候補分割手段と、文字矩形接続手段とにより構成される文字行抽出装置であって、
    文字行候補生成手段が、
    処理対象の画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出する画素連結矩形生成手段と、
    前記画像データもしくは抽出された各画素連結矩形の構成から、主な文字行の方向を主方向、主方向に直交する方向を副方向として判定する文字行方向判定手段と、
    各画素連結矩形を相互の位置関係に応じて主方向又は副方向に接続することにより文字行候補を生成する画素連結矩形接続手段とからなり、
    文字矩形生成手段が、
    文字行候補内で、各画素連結矩形の相互の位置関係から文字を構成する画素連結矩形群を抽出し、これに外接する矩形を文字矩形として生成する手段であり、
    文字行候補分割手段が、
    文字行候補内での文字矩形群の構成に応じて、文字行候補を分割する手段であり、
    文字矩形接続手段が、
    分割された文字行候補内で文字矩形を接続して文字行とする手段である、
    文字行抽出装置。
  19. 前記文字行抽出装置は、さらに、
    処理対象の画像データから射影分布を生成する射影分布生成手段と、
    射影分布を所定の幅ごとにグループ化する射影グループ生成手段と、
    生成された各グループ内の射影分布の代表値を算出する射影グループ代表値算出手段と、
    隣接する前記射影分布のグループの代表値間の差の最も大きなグループ間の境界をグループ境界として求めるグループ境界抽出手段と、
    このグループ境界を挟む2つのグループ内の射影分布の差から文字領域と写真図形領域との境界を決定し、当該境界の接している射影分布の小さい側を文字領域として抽出する文字域抽出手段と
    よりなる文字領域抽出手段を含むことを特徴とする請求項1に記載の文字行抽出装置。
  20. 前記画素連結矩形接続手段が、
    主方向に重なり、かつ、近接する画素連結矩形群を主方向に接続して主方向の部分文字行として生成する主方向部分文字行生成手段と、
    主方向部分文字行生成手段で、接続されなかった画素連結矩形群で、所定の距離の範囲内にあるものを接続して、主方向以外の部分文字行として生成する非主方向部分文字行生成手段と、
    部分文字行のうち、縦横比から文字を構成する部分文字行を抽出する文字部分文字行抽出手段と、
    副方向に重なり、かつ、近接する文字を構成する部分文字行群を副方向に接続して、新たな副方向の部分文字行を生成する文字副方向接続手段と、
    副方向に重なり、かつ、近接する主方向の部分文字行群を接続して新たな主方向の部分文字行を生成する部分文字行副方向接続手段と、
    主方向に重なる、主方向の部分文字行群を主方向に接続して新たな主方向の部分文字行を生成する部分文字行主方向接続手段と、
    より生成された部分文字行を文字行候補とする請求項18記載の文字行抽出装置。
  21. 前記文字行抽出装置は、さらに、
    処理対象の画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、この抽出した画素連結矩形を用いて処理対象の画像の主方向を抽出する文字行主方向抽出手段であって、
    処理対象の画像データの形状から仮の主方向を決定する仮主方向決定手段と、
    主方向に重なり、かつ、近接する画素連結矩形群を主方向に接続して主方向の部分文字行として生成する主方向部分文字行生成手段と、
    生成された各主方向の部分文字行の構成から、仮主方向決定手段で決定した仮の主方向が正しいかどうかを判断する主方向判断手段と
    主方向判断手段で仮の主方向が正しいと判断されればその仮の主方向を主方向として抽出し、仮の主方向が正しくないと判断されればその仮の主方向に直交する方向を主方向として抽出する主方向抽出手段と
    を有する文字行主方向抽出手段を含むことを特徴とする請求項1に記載の文字行抽出装置。
  22. 前記文字行候補生成手段が、請求項21記載の文字行主方向判断装置であり、
    前記主方向部分文字行生成手段が、前記文字行主方向判断装置の前記主方向判断手段によって仮の主方向が正しくないと判断された場合のみ、主方向の部分文字行を生成する
    請求項20記載の文字行抽出装置。
  23. 前記部分文字行主方向接続手段にさらに、
    副方向に重なり、かつ、準近接する主方向の部分文字行同士を抽出する準近接部分文字行抽出手段と、
    この準近接部分文字行抽出手段で抽出された部分文字行同士間における各部分文字行に含まれる画素連結矩形の距離が所定の値以下であれば、当該部分文字行同士を接続し新たな主方向の部分文字行を生成する準近接部分文字行接続手段と、
    を設けた請求項20又は22記載の文字行抽出装置。
  24. 請求項20、22又は23記載の文字行抽出装置にさらに、
    処理対象の画像データの予め定められた所定領域内において、副方向に重なり、かつ、近接する画素連結矩形群を副方向に接続して副方向の部分文字行として生成する特定領域部分文字行生成手段を設けた文字行抽出装置。
  25. 前記文字矩形生成手段が、
    文字行候補を被分割領域とし、この被分割領域を、主方向の被分割領域、副方向の被分割領域、その他の被分割領域に分類する被分割領域分類手段と、
    被分割領域分類手段で、副方向の被分割領域であると分類された場合は、この被分割領域となっている文字行候補を文字行として抽出する副方向文字行抽出手段と、
    被分割領域分類手段で、その他の被分割領域と分類された場合は、この被分割領域の外接矩形を文字矩形として作成する単体文字矩形作成手段と、
    被分割領域分類手段で、主方向の被分割領域であると分類された場合は、この主方向の被分割領域に対して、主方向、副方向に射影をとり、射影間の空白部分が所定の長さを越える区間がある場合は、当該区間で被分割領域を分割してあらたな被分割領域とする被分割領域分割手段と、
    被分割領域分割手段で、射影間の空白部分が所定の長さを越える区間がない場合に、当該被分割領域内で、各画素連結矩形の相互の位置関係から文字を構成する画素連結矩形群を抽出し、これに外接する矩形を文字矩形として生成する主方向文字矩形生成手段と、
    を有する請求項18、20、22〜24のいずれか1項に記載の文字行抽出装置。
  26. 文字行候補分割手段が、
    文字行候補内での文字矩形の大きさの平均値と分散値のいずれか又は両方により、文字行候補内での文字矩形の構成を判断する文字矩形構成判断手段と、
    文字矩形構成判断手段により、文字行候補内で文字矩形間に所定の差異を有すると判断された場合に、所定の差異がある文字矩形間で、文字行候補を分割する文字矩形間分割手段と、
    を有する請求項18、20、22〜25のいずれか1項に記載の文字行抽出装置。
  27. 前記文字矩形構成判断手段が、
    文字行候補内での文字矩形の一辺の長さの平均値が文字行候補の短辺の長さよりも小さく、かつ、文字矩形の一辺の長さの分散値が所定値よりも大きければ、文字行候補中に大小の文字矩形が存在するという判断を行い、
    前記文字矩形間分割手段が、
    文字矩形判断手段により文字行候補中に大小の文字矩形が存在すると判断された場合に、大きい文字矩形と小さい文字矩形を挟む区間を検索する大小文字矩形間検索手段と、
    大小文字矩形間検索手段で検索された区間で、文字行候補を分割する区間分割手段と、
    を有する請求項18、20、22〜26のいずれか1項に記載の文字行抽出装置。
  28. 前記文字矩形構成判断手段が、
    文字行候補内での文字矩形の一辺の長さの平均値が文字行候補の短辺の長さとほぼ同じであれば、文字行候補中の文字矩形間に空白が存在するという判断を行い、
    前記文字矩形間分割手段が、
    文字矩形判断手段により文字行候補中の文字矩形間に空白があると判断された場合に、空白がある区間を検索する文字矩形間空白検索手段と、
    文字矩形間空白検索手段で検索された区間で、文字行候補を分割する区間分割手段とを有する、
    請求項18、20、22〜27のいずれか1項に記載の文字行抽出装置。
  29. 前記文字矩形構成判断手段が、
    文字行候補の短辺の長さが文字行候補内での文字矩形の一辺の長さの平均値の2倍以上であれば、文字行候補中に文字列が2列以上混在するという判断を行い、
    前記文字矩形間分割手段が、
    文字矩形判断手段により文字行候補中に文字列が2列以上混在すると判断された場合に、文字行間で段差を生じている区間を検索する文字行段差部検索手段と、
    文字行段差部検索手段で検索された区間で、文字行候補を分割する区間分割手段とを有する、
    請求項18、20、22〜28のいずれか1項に記載の文字行抽出装置。
  30. 請求項29記載の文字行抽出装置において、さらに、
    前記文字行段差部検索手段で検索された区間に隣接する文字矩形が所定の特殊な文字矩形か否かを判断する特殊文字判定手段と、
    特殊文字判定手段で所定の特殊な文字矩形であると判断された場合は、当該特殊な文字矩形を分割する、特殊文字分割手段と、
    を設けた文字行抽出装置。
  31. 前記文字行抽出装置は、さらに、画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、抽出された各画素連結矩形の位置関係から文字を構成する部分を抽出して、これに外接する矩形を文字矩形として生成し、生成された各文字矩形を連結することによって文字行を抽出する手段であって、
    所定の構成を有する文字矩形をルビ矩形として抽出する、ルビ矩形抽出手段と、
    ルビ矩形の近傍に存在する文字行を検索する親文字行検索手段と、
    このルビ矩形を含む、検索された文字行に対してルビが存在し得る範囲を決定するルビ存在可能範囲決定手段と、
    ルビが存在し得る範囲に存在するルビ矩形および文字行を連結することによって、ルビを構成する文字行を抽出するルビ文字行抽出手段と、
    を有する手段を含むことを特徴とする請求項1に記載の文字行抽出装置。
  32. 前記文字行抽出装置は、さらに、画像データから画素の連結する成分の外接矩形を画素連結矩形として抽出し、抽出された各画素連結矩形の位置関係から文字を構成する部分を抽出して、これに外接する矩形を文字矩形として生成し、生成された各文字矩形を連結することによって文字行を抽出する手段であって、
    抽出された文字行内の画素連結矩形または文字矩形の数が定められた第1の閾値よりも大きければ、その文字行がノイズであると判断するノイズ文字行判断手段と、
    ノイズと判断された文字行を削除するノイズ文字行削除手段と
    を有する手段を含むことを特徴とする請求項1に記載の文字行抽出装置。
  33. 請求項32記載の文字行抽出装置において、さらに、
    抽出された文字行内の画素連結矩形または文字矩形の数が前記第1の閾値よりも小さく、第1の閾値よりも小さい定められた第2の閾値よりも大きければ、その文字行をノイズ文字行候補とするノイズ文字行候補判断手段と、
    ノイズ文字行候補内の画素連結矩形または文字矩形の大きさの平均値を算出し、この平均値が予め定められる所定の値以下であれば、そのノイズ文字行候補をノイズと判断するノイズ文字行候補検証手段と
    を設けた文字行抽出装置。
JP28260396A 1996-05-13 1996-10-24 文字行抽出方法および装置 Expired - Fee Related JP3837193B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28260396A JP3837193B2 (ja) 1996-05-13 1996-10-24 文字行抽出方法および装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11806296 1996-05-13
JP8-118062 1996-05-13
JP28260396A JP3837193B2 (ja) 1996-05-13 1996-10-24 文字行抽出方法および装置

Publications (2)

Publication Number Publication Date
JPH1031716A JPH1031716A (ja) 1998-02-03
JP3837193B2 true JP3837193B2 (ja) 2006-10-25

Family

ID=26456067

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28260396A Expired - Fee Related JP3837193B2 (ja) 1996-05-13 1996-10-24 文字行抽出方法および装置

Country Status (1)

Country Link
JP (1) JP3837193B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11361529B2 (en) * 2019-01-24 2022-06-14 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3335844B2 (ja) * 1996-08-16 2002-10-21 富士通株式会社 文字列方向推定方法および装置
JP4170441B2 (ja) 1997-11-28 2008-10-22 富士通株式会社 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体
JP3753357B2 (ja) * 1999-01-19 2006-03-08 株式会社リコー 文字抽出方法および記録媒体
JP5003445B2 (ja) * 2007-12-05 2012-08-15 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、文字領域特定方法、および文字領域特定プログラム
JP5577948B2 (ja) 2010-08-24 2014-08-27 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
WO2014050481A1 (ja) * 2012-09-26 2014-04-03 富士フイルム株式会社 文書画像処理装置ならびにその動作制御方法およびその動作制御プログラム
JP6676955B2 (ja) * 2015-12-18 2020-04-08 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP6504104B2 (ja) * 2016-04-20 2019-04-24 京セラドキュメントソリューションズ株式会社 画像処理装置
JP7019963B2 (ja) * 2016-05-10 2022-02-16 凸版印刷株式会社 文字列領域・文字矩形抽出装置、文字列領域・文字矩形抽出方法、およびプログラム
US10318803B1 (en) * 2017-11-30 2019-06-11 Konica Minolta Laboratory U.S.A., Inc. Text line segmentation method
KR102138748B1 (ko) * 2019-02-08 2020-07-28 네이버 주식회사 라인 단위의 문자열을 검출 및 정렬하기 위한 방법 및 시스템

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11361529B2 (en) * 2019-01-24 2022-06-14 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Also Published As

Publication number Publication date
JPH1031716A (ja) 1998-02-03

Similar Documents

Publication Publication Date Title
Kise et al. Segmentation of page images using the area Voronoi diagram
JP3302147B2 (ja) 文書画像処理方法
US5335290A (en) Segmentation of text, picture and lines of a document image
JP3359095B2 (ja) 画像処理方法及び装置
US6043823A (en) Document processing system which can selectively extract and process regions of a document
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
Antonacopoulos Page segmentation using the description of the background
JP4856925B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP3393098B2 (ja) ユーザ囲み領域の抽出装置及び抽出方法
US20010041006A1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP3837193B2 (ja) 文字行抽出方法および装置
JP3411472B2 (ja) パターン抽出装置
JP4391704B2 (ja) 多値画像から二値画像を生成する画像処理装置および方法
JP5538812B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN110321887B (zh) 文档图像处理方法、文档图像处理装置及存储介质
JP4049560B2 (ja) 網点除去方法及びシステム
JP4450888B2 (ja) 帳票認識方法
JPH08320914A (ja) 表認識方法および装置
JP2006253842A (ja) 画像処理装置、画像形成装置、プログラム、記憶媒体および画像処理方法
Nguyen et al. Enhanced character segmentation for format-free Japanese text recognition
JP3607753B2 (ja) 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置
JP3187895B2 (ja) 文字領域抽出方法
Kise et al. Document image segmentation as selection of Voronoi edges
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060731

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090804

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100804

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110804

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110804

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120804

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130804

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees