JPH1031716A - 文字行抽出方法および装置 - Google Patents

文字行抽出方法および装置

Info

Publication number
JPH1031716A
JPH1031716A JP8282603A JP28260396A JPH1031716A JP H1031716 A JPH1031716 A JP H1031716A JP 8282603 A JP8282603 A JP 8282603A JP 28260396 A JP28260396 A JP 28260396A JP H1031716 A JPH1031716 A JP H1031716A
Authority
JP
Japan
Prior art keywords
character
character line
rectangle
main direction
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8282603A
Other languages
English (en)
Other versions
JP3837193B2 (ja
Inventor
Kenji Hiramoto
建志 平本
Hiroshi Matsuuchi
浩 松内
Hideki Fujimori
秀樹 藤森
Ai Yoshimori
亜依 吉森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP28260396A priority Critical patent/JP3837193B2/ja
Publication of JPH1031716A publication Critical patent/JPH1031716A/ja
Application granted granted Critical
Publication of JP3837193B2 publication Critical patent/JP3837193B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文字行方向が不明で、文字の大きさやピッ
チ、文字行方向の異なる文字行や写真等の領域が混在す
る文書からの文字行抽出を可能にする。 【解決手段】 文字行候補生成部4で、画像データより
生成した画素連結矩形を接続し、文字行候補を生成す
る。文字矩形生成部5で、生成された文字行候補を非分
割領域として、主方向、副方向に適宜分割して、副方向
の文字行を抽出するとともに、文字行候補内で基本矩形
の統合を行なうことにより文字矩形を生成する。文字行
候補分割部6で、文字矩形サイズの平均値、分散値から
文字行候補の構成を判定し、構成に応じて文字行候補を
分割する。文字矩形接続部7で、分割された文字行候補
の領域内において文字矩形を接続することにより文字行
を抽出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、光学的文字読み取
り装置(OCR)等に用いる、文書から文字行を抽出す
る方法および装置に関する。
【0002】
【従来の技術】従来、OCR等において文書から文字行
を抽出する方法として、画像データから連結する画素成
分を連結要素として抽出し、連結要素間の距離や重なり
に応じて文書の文字行方向に、抽出した連結要素を接続
することによって文字行を抽出する方法(特開平5−3
42407)があった。しかし、この方法では、連結要
素と文字が必ずしも1対1に対応していないため、1文
字がいくつかの連結要素に分かれていることがあり、こ
のような文字が連続する文字行内や文字行付近において
は、同じ文字行内に属する連結要素同士が正しく接続さ
れなかったり、接続すべきでない隣り合った文字行の連
結要素同士が接続されてしまう場合がある。また、この
方法では、文書の文字行方向が1方向に決まっているこ
とが前提であり、縦書き横書き混在の文書において、両
方向の文字行を抽出することは困難である。
【0003】このような問題を解決する方法として、処
理対象の文書の圧縮画像から連結する画素成分を連結要
素として抽出し、連結要素の外接矩形の縦横比から圧縮
による文字間の融合度合を推定し、融合度合に応じて接
続パラメータを決定して連結要素を接続する方法(特開
平7−73271)が提案されている。この方法による
と、圧縮率が適切であれば1文字が複数の連結要素に分
かれる頻度が減り、上記に述べたような連結要素と文字
が1対1に対応していないためにおこる誤結合をある程
度防ぐことができる。また、文書内に本文領域と呼ばれ
るような文字行が連続的に存在する領域があれば、本文
領域の文字間や文字の大きさに応じて適切な接続パラメ
ータが設定され、精度よく文字行を抽出することがで
き、本文文字行と異方向の文字行(縦書き文書における
フッタやヘッダ等)の抽出も可能となる。
【0004】また、処理対象となる文書内に写真等の非
文字領域が存在する場合、例えば、写真領域内に存在す
る連結要素の大きさが文字サイズ程度で、文字行と近接
している場合など、文字認識処理を行なわずに写真領域
内の連結要素と文字行との誤結合を防ぐことは困難であ
る。これに対処するために先に文字領域と非文字領域を
分離しておくと、その後の文字行抽出の精度が向上する
場合がある。このような文字領域と非文字領域を分離す
る従来の技術として、画像データから射影分布を取得
し、分布の谷部を検出し、検出された谷部で対象領域を
分割する方法(特開平3−290774)が提案されて
いる。
【0005】さらに、連結要素を接続する方法において
は、文字行方向が不明な場合、文字行方向を先に判別し
ておく必要がある。かかる文字行方向の判別方法として
は、画像データから文字要素を抽出し、相互に近接する
文字要素毎に群分けし、文字要素群の外接矩形の長辺方
向を文字行方向として判別する方法(特開平6−243
286)が提案されている。
【0006】
【発明が解決しようとする課題】しかし、上記処理対象
の文書の圧縮画像から連結する画素成分を連結要素とし
て抽出して文字行を抽出する方法においては、例えば名
刺のように文字の大きさやピッチの異なる別の文字行が
近接していたり、文字の大きさが等しい別の文字行同士
が1列に並んでいたり、文字の大きさが等しい2列の文
字行の中間的な位置に文字行が存在していたりするよう
な文書においては、適切な圧縮率や接続パラメータを設
定することは困難である。そして、圧縮率が不適切な場
合、行間の狭い文書では複数行が癒着してしまうことも
ある。
【0007】また、一般的に1文字行を構成する文字は
文字間が近く、均等で文字の大きさもほぼそろっている
のが普通であり、従来の文字行の抽出方法はこのことを
前提としていた。ところが、名刺の氏名にふられるルビ
等は、文字行内の個々の文字が極端に離れているため、
従来の方法では1文字行と判断することは困難である。
【0008】さらに、対象処理対象の文書に散点状に描
かれた絵や装飾等が存在する場合には、従来の文字行の
抽出方法では、絵等を構成する点を文字と認識して文字
行を構成しないにもかかかわらず、文字行として抽出し
てしまうおそれもある。一方、上述した従来の文字領域
と非文字領域を分離する方法では、2値化された写真画
像には画素の多い部分と少ない部分が混在しているの
で、1写真領域内で複数の谷部が検出され、複数の領域
に分割されてしまい、その後の統合処理が適当に行なわ
れない場合、やはり誤結合を招く可能性がある。例え
ば、図43(a)のような画像データに対して、射影分
布を取得すると図43(b)のようになるが、写真領域
に一部画素の少ない領域があるため、分布を操作して検
出された谷部Zで対象領域を分割すると図43(c)の
ように、写真領域が領域a1、領域a2に分かれてしま
い、領域a2は文字行として誤って認識される恐れが高
い。
【0009】また、上記従来の文字行方向の判別方法に
おいては、文字要素群の外接矩形の長辺方向を文字行方
向とするものであるので、行間が狭く、長さの短い文字
行がかたまっている場合など、外接矩形の長辺が文字行
方向と直交する方向となることもあり、文字行方向の判
定を誤ってしまう可能性がある。即ち、従来の文字行を
抽出する方法では、文字の大きさやピッチの異なる文字
行、行間の幅が狭い文字行、縦書き文字行や横書き文字
行が混在する文書、写真等の非文字領域が存在する文書
や文字行方向が不明な文書等、複雑なレイアウトの文書
から正確に文字行を抽出することが容易にはできなかっ
た。
【0010】そこで、本発明はこのような課題を解決
し、雑多な構成要素をもつ複雑なレイアウトの文書から
正確にかつ効率よく、文書データから文字行を抽出する
方法および装置を提供することを目的とする。
【0011】
【課題を解決するための手段】上記課題を解決するため
に、本願発明の文字行抽出方法は文字行候補生成ステッ
プと、文字矩形生成ステップと、文字行候補分割ステッ
プと、文字矩形接続ステップとにより構成される。文字
行候補生成ステップは、処理対象の画像データから画素
の連結する成分の外接矩形を画素連結矩形として抽出す
る画素連結矩形生成ステップと、前記画像データもしく
は抽出された各画素連結矩形の構成から、主な文字行の
方向を主方向、主方向に直交する方向を副方向として判
定する文字行方向判定ステップと、各画素連結矩形を相
互の位置関係に応じて主方向又は副方向に接続すること
により文字行候補を生成する画素連結矩形接続ステップ
とよりなる。
【0012】そして、文字矩形生成ステップは、文字行
候補内で、各画素連結矩形の相互の位置関係から文字を
構成する画素連結矩形群を抽出し、これに外接する矩形
を文字矩形として生成する。また、文字行候補分割ステ
ップは、文字行候補内での文字矩形群の構成に応じて、
文字行候補を分割する。さらに、文字矩形接続ステップ
は分割された文字行候補内で文字矩形を接続して文字行
とする。
【0013】また、上記課題を解決するために本願発明
に係る文字領域抽出方法は、処理対象の画像データから
射影分布を生成する射影分布生成ステップと、射影分布
を所定の幅ごとにグループ化する射影グループ生成ステ
ップと、生成された各グループ内の射影分布の代表値を
算出する射影グループ代表値算出ステップとを有し、さ
らに、隣接する前記射影分布のグループの代表値間の差
の最も大きなグループ間の境界をグループ境界として求
めるグループ境界抽出ステップと、このグループ境界を
挟む2つのグループ内の射影分布の差から文字領域と写
真図形領域との境界を決定し、当該境界の接している射
影分布の小さい側を文字領域として抽出する文字領域抽
出ステップとを有するものである。
【0014】そして、前記文字行抽出方法においては、
この文字領域抽出方法により抽出された文字領域を処理
対象とすることが望ましい。さらに、前記文字行抽出方
法において、文字行候補生成ステップ中の画素連結矩形
接続ステップには、主方向に重なり、かつ、近接する画
素連結矩形群を主方向に接続して主方向の部分文字行と
して生成する主方向部分文字行生成ステップと、主方向
部分文字行生成ステップで、接続されなかった画素連結
矩形群で、所定の距離の範囲内にあるものを接続して、
主方向以外の部分文字行として生成する非主方向部分文
字行生成ステップとを設け、さらに部分文字行のうち、
縦横比から文字を構成する部分文字行を抽出する文字部
分文字行抽出ステップと、副方向に重なり、かつ、近接
する文字を構成する部分文字行群を副方向に接続して、
新たな副方向の部分文字行を生成する部分文字行接続第
1ステップと、副方向に重なり、かつ、近接する主方向
の部分文字行群を接続して新たな主方向の部分文字行を
生成する部分文字行接続第2ステップと、主方向に重な
る、主方向の部分文字行群を主方向に接続して新たな主
方向の部分文字行を生成する部分文字行接続第3ステッ
プとを設け、これらの各ステップより生成された部分文
字行を文字行候補とすることが望ましい。
【0015】そして、上記課題を解決するために本願発
明に係る文字行主方向抽出方法は、処理対象の画像デー
タから画素の連結する成分の外接矩形を画素連結矩形と
して抽出し、この抽出した画素連結矩形を用いる方法で
あり、処理対象の画像データの形状から仮の主方向を決
定する仮主方向決定ステップと、主方向に重なり、か
つ、近接する画素連結矩形群を主方向に接続して主方向
の部分文字行として生成する主方向部分文字行生成ステ
ップ、さらに、生成された各主方向の部分文字行の構成
から、仮主方向決定ステップで決定した仮の主方向が正
しいかどうかを判断する主方向判断ステップと、主方向
判断ステップで仮の主方向が正しいと判断されればその
仮の主方向を主方向として抽出し、仮の主方向が正しく
ないと判断されればその仮の主方向に直交する方向を主
方向として抽出する主方向抽出ステップとにより構成さ
れる。
【0016】前記文字行抽出方法においては、文字行候
補生成ステップ中の主方向部分文字行生成ステップは、
上記の文字行主方向抽出方法を用いることが望ましく、
この場合、前記主方向部分文字行生成ステップでは、文
字行主方向判断方法中の主方向判断ステップで仮の主方
向が正しくないと判断された場合のみ、主方向の部分文
字行を生成するようにすれば足りる。
【0017】また、前記部分文字行接続第2ステップに
は、さらに、副方向に重なり、かつ、準近接する主方向
の部分文字行同士を抽出する準近接部分文字行抽出ステ
ップと、この準近接部分文字行抽出ステップで抽出され
た部分文字行同士間における各部分文字行に含まれる画
素連結矩形の距離が所定の値以下であれば、当該部分文
字行同士を接続し新たな主方向の部分文字行を生成する
準近接部分文字行接続ステップとを設けると効果的であ
る。なお、ここで準近接するとは部分文字行同士の間隔
が近接しているとは判断できないが、かなり近いと認め
られる所定の距離範囲に入っている状態をいい、当該距
離は予め定められる。
【0018】また、前記文字行抽出方法においては、前
記主方向接続ステップの前には、さらに、処理対象の画
像データの所定領域を予め定めておき、当該所定領域内
において、副方向に重なり、かつ、近接する画素連結矩
形群を副方向に接続して副方向の部分文字行として生成
する特定領域部分文字行生成ステップを設けてもよい。
【0019】それから、前記文字矩形生成ステップに
は、文字行候補を被分割領域とし、この被分割領域に対
して、主方向の被分割領域、副方向の被分割領域、その
他の被分割領域に分類する被分割領域分類ステップを設
け、被分割領域分類ステップで、副方向の被分割領域で
あると分類された場合は、この被分割領域となっている
文字行候補を文字行として抽出する副方向文字行抽出ス
テップと、被分割領域分類ステップで、その他の被分割
領域と分類された場合は、この被分割領域の外接矩形を
文字矩形として作成する単体文字矩形作成ステップと、
被分割領域分類ステップで、主方向の被分割領域である
と分類された場合は、この主方向の被分割領域に対し
て、主方向、副方向に射影をとり、射影間の空白部分が
所定の長さを越える区間がある場合は、当該区間で被分
割領域を分割してあらたな被分割領域とする被分割領域
分割ステップと、被分割領域分割ステップで、射影間の
空白部分が所定の長さを越える区間がない場合に、当該
被分割領域内で、各画素連結矩形の相互の位置関係から
文字を構成する画素連結矩形群を抽出し、これに外接す
る矩形を文字矩形として生成する主方向文字矩形生成ス
テップとを設けると効果的である。
【0020】さらに、前記文字行候補分割ステップに
は、文字行候補内での文字矩形の大きさの平均値と分散
値のいずれか又は両方により、文字行候補内での文字矩
形の構成を判断する文字矩形構成判断ステップと、文字
矩形構成判断ステップにより、文字行候補内で文字矩形
間で所定の差異を有すると判断された場合に、所定の差
異がある文字矩形間で、文字行候補を分割する文字矩形
間分割ステップとを設けることが望ましい。
【0021】かかる文字行候補分割ステップの文字矩形
構成判断ステップには、文字行候補内での文字矩形の一
辺の長さの平均値が文字行候補の短辺の長さよりも小さ
く、かつ、文字矩形の一辺の長さの分散値が所定値より
も大きければ、文字行候補中に大小の文字矩形が存在す
るという判断を含ませ、文字矩形間分割ステップには、
文字矩形判断ステップにより文字行候補中に大小の文字
矩形が存在すると判断された場合に、大きい文字矩形と
小さい文字矩形を挟む区間を検索する大小文字矩形間検
索ステップと、大小文字矩形間検索ステップで検索され
た区間で、文字行候補を分割する区間分割ステップとを
設けると好適である。
【0022】さらに、文字行候補分割ステップの文字矩
形構成判断ステップには、文字行候補内での文字矩形の
一辺の長さの平均値が文字行候補の短辺の長さとほぼ同
じであれば、文字行候補中の文字矩形間に空白が存在す
るという判断を含ませ、文字矩形間分割ステップには、
文字矩形判断ステップにより文字行候補中の文字矩形間
に空白があると判断された場合に、空白がある区間を検
索する文字矩形間空白検索ステップと、文字矩形間空白
検索ステップで検索された区間で、文字行候補を分割す
る区間分割ステップとを設けてもよい。
【0023】同様に、文字行候補分割ステップの文字矩
形構成判断ステップには、文字行候補の短辺の長さが文
字行候補内での文字矩形の一辺の長さの平均値の2倍以
上であれば、文字行候補中に文字列が2列以上混在する
という判断を含ませ、前記文字行候補分割ステップに
は、文字矩形判断ステップにより文字行候補中に文字列
が2列以上混在すると判断された場合に、文字行間で段
差を生じている区間を検索する文字行段差部検索ステッ
プと、文字行段差部検索ステップで検索された区間で、
文字行候補を分割する区間分割ステップとを設けること
ができる。
【0024】また、かかる構成にさらに、前記文字行段
差部検索ステップで検索された区間に隣接する文字矩形
が所定の特殊な文字矩形か否かを判断する特殊文字判定
ステップと、特殊文字判定ステップで所定の特殊な文字
矩形であると判断された場合は、当該特殊な文字矩形を
分割する、特殊文字分割ステップとを設けることもでき
る。
【0025】さらに、上記課題を解決するために本願発
明に係る文字行抽出方法は、画像データから画素の連結
する成分の外接矩形を画素連結矩形として抽出し、抽出
された各画素連結矩形の位置関係から文字を構成する部
分を抽出して、これに外接する矩形を文字矩形として生
成し、生成された各文字矩形を連結することによって文
字行を抽出する文字行抽出方法において、所定の構成を
有する文字矩形をルビ矩形として抽出するルビ矩形抽出
ステップと、ルビ矩形の近傍に存在する文字行を検索す
る親文字行検索ステップと、このルビ矩形を含む、検索
された文字行に対してルビが存在し得る範囲を決定する
ルビ存在可能範囲決定ステップと、ルビが存在し得る範
囲に存在するルビ矩形および文字行を連結することによ
って、ルビを構成する文字行を抽出するルビ文字行抽出
ステップとを設けたものである。
【0026】また、本願発明に係る文字行抽出方法は、
画像データから画素の連結する成分の外接矩形を画素連
結矩形として抽出し、抽出された各画素連結矩形の位置
関係から文字を構成する部分を抽出して、これに外接す
る矩形を文字矩形として生成し、生成された各文字矩形
を連結することによって文字行を抽出する文字行抽出方
法において、抽出された文字行内の画素連結矩形または
文字矩形の数が定められた第1の閾値よりも大きけれ
ば、その文字行がノイズであると判断するノイズ文字行
判断ステップと、ノイズと判断された文字行を削除する
ノイズ文字行削除ステップとを設けたものである。
【0027】さらに、この文字行抽出方法においては、
抽出された文字行内の画素連結矩形または文字矩形の数
が前記第1の閾値よりも小さく、第1の閾値よりも小さ
い定められた第2の閾値よりも大きければ、その文字行
をノイズ文字行候補とするノイズ文字行候補判断ステッ
プと、ノイズ文字行候補内の画素連結矩形または文字矩
形の大きさの平均値を算出し、この平均値が予め定めら
れる所定の値以下であれば、そのノイズ文字行候補をノ
イズと判断するノイズ文字行候補検証ステップとを設け
ることが望ましい。なお、この所定の値は計算値も含
み、例えば、ノイズ文字行候補の短辺の長さに対して所
定の割合を定めておき、この割合を予め計算することに
よって与えるようにしてもよい。
【0028】一方、上記課題を解決するために本願発明
に係る文字行抽出装置は文字行候補生成手段と、文字矩
形生成手段と、文字行候補分割手段と、文字矩形接続手
段とにより構成される。文字行候補生成手段は、処理対
象の画像データから画素の連結する成分の外接矩形を画
素連結矩形として抽出する画素連結矩形生成手段と、前
記画像データもしくは抽出された各画素連結矩形の構成
から、主な文字行の方向を主方向、主方向に直交する方
向を副方向として判定する文字行方向判定手段と、各画
素連結矩形を相互の位置関係に応じて主方向又は副方向
に接続することにより文字行候補を生成する画素連結矩
形接続手段とよりなる。
【0029】そして、文字矩形生成手段は、文字行候補
内で、各画素連結矩形の相互の位置関係から文字を構成
する画素連結矩形群を抽出し、これに外接する矩形を文
字矩形として生成する。また、文字行候補分割手段は、
文字行候補内での文字矩形群の構成に応じて、文字行候
補を分割する。さらに、文字矩形接続手段は分割された
文字行候補内で文字矩形を接続して文字行とする。
【0030】また、上記課題を解決するために本願発明
に係る文字領域抽出装置は、処理対象の画像データから
射影分布を生成する射影分布生成手段と、射影分布を所
定の幅ごとにグループ化する射影グループ生成手段と、
各グループ内の射影分布の代表値を算出する射影グルー
プ代表値算出手段とを有し、さらに、隣接する前記射影
分布のグループの代表値間の差の最も大きなグループ間
の境界をグループ境界として求めるグループ境界抽出手
段と、このグループ境界を挟む2つのグループ内の射影
分布の差から文字領域と写真図形領域との境界を決定
し、当該境界の接している射影分布の小さい側を文字領
域として抽出する文字域抽出手段とを有するものであ
る。
【0031】さらに、前記文字行抽出装置において、文
字行候補生成手段中の画素連結矩形接続手段には、主方
向に重なり、かつ、近接する画素連結矩形群を主方向に
接続して主方向の部分文字行として生成する主方向部分
文字行生成手段と、主方向部分文字行生成手段で、接続
されなかった画素連結矩形群で、所定の距離の範囲内に
あるものを接続して、主方向以外の部分文字行として生
成する非主方向部分文字行生成手段とを設け、さらに部
分文字行のうち、縦横比から文字を構成する部分文字行
を抽出する文字部分文字行抽出手段と、副方向に重な
り、かつ、近接する文字を構成する部分文字行群を副方
向に接続して、新たな副方向の部分文字行を生成する文
字副方向接続手段と、副方向に重なり、かつ、近接する
主方向の部分文字行群を接続して新たな主方向の部分文
字行を生成する部分文字行副方向接続手段と、主方向に
重なる、主方向の部分文字行群を主方向に接続して新た
な主方向の部分文字行を生成する部分文字行主方向接続
手段とを設け、これらの各手段より生成された部分文字
行を文字行候補とすることが望ましい。
【0032】そして、上記課題を解決するために本願発
明に係る文字行主方向抽出装置は、処理対象の画像デー
タから画素の連結する成分の外接矩形を画素連結矩形と
して抽出し、この抽出した画素連結矩形を用いて処理対
象の画像の主方向を抽出する装置であり、処理対象の画
像データの形状から仮の主方向を決定する仮主方向決定
手段と、主方向に重なり、かつ、近接する画素連結矩形
群を主方向に接続して主方向の部分文字行として生成す
る主方向部分文字行生成手段、さらに、生成された各主
方向の部分文字行の構成から、仮主方向決定手段で決定
した仮の主方向が正しいかどうかを判断する主方向判断
手段と、主方向判断手段で仮の主方向が正しいと判断さ
れればその仮の主方向を主方向として抽出し、仮の主方
向が正しくないと判断されればその仮の主方向に直交す
る方向を主方向として抽出する主方向抽出手段とにより
構成される。
【0033】前記文字行抽出装置においては、文字行候
補生成手段中の主方向部分文字行生成手段は、上記の文
字行主方向抽出装置を用いることが望ましく、この場
合、前記主方向部分文字行生成手段では、文字行主方向
判断装置中の主方向判断手段で仮の主方向が正しくない
と判断された場合のみ、主方向の部分文字行を生成する
ようにすれば足りる。
【0034】また、前記部分文字行副方向接続手段に
は、さらに、副方向に重なり、かつ、準近接する主方向
の部分文字行同士を抽出する準近接部分文字行抽出手段
と、この準近接部分文字行抽出手段で抽出された部分文
字行同士間における各部分文字行に含まれる画素連結矩
形の距離が所定の値以下であれば、当該部分文字行同士
を接続し新たな主方向の部分文字行を生成する準近接部
分文字行接続手段とを設けると効果的である。
【0035】また、前記文字行抽出装置においては、前
記主方向接続手段の前には、さらに、処理対象の画像デ
ータの所定領域を予め定めておき、当該所定領域内にお
いて、副方向に重なり、かつ、近接する画素連結矩形群
を副方向に接続して副方向の部分文字行として生成する
特定領域部分文字行生成手段を設けてもよい。それか
ら、前記文字矩形生成手段には、文字行候補を被分割領
域とし、この被分割領域に対して、主方向の被分割領
域、副方向の被分割領域、その他の被分割領域に分類す
る被分割領域分類手段を設け、被分割領域分類手段で、
副方向の被分割領域であると分類された場合は、この被
分割領域となっている文字行候補を文字行として抽出す
る副方向文字行抽出手段と、被分割領域分類手段で、そ
の他の被分割領域と分類された場合は、この被分割領域
の外接矩形を文字矩形として作成する単体文字矩形作成
手段と、被分割領域分類手段で、主方向の被分割領域で
あると分類された場合は、この主方向の被分割領域に対
して、主方向、副方向に射影をとり、射影間の空白部分
が所定の長さを越える区間がある場合は、当該区間で被
分割領域を分割してあらたな被分割領域とする被分割領
域分割手段と、被分割領域分割手段で、射影間の空白部
分が所定の長さを越える区間がない場合に、当該被分割
領域内で、各画素連結矩形の相互の位置関係から文字を
構成する画素連結矩形群を抽出し、これに外接する矩形
を文字矩形として生成する主方向文字矩形生成手段とを
設けると効果的である。
【0036】さらに、前記文字行候補分割手段には、文
字行候補内での文字矩形の大きさの平均値と分散値のい
ずれか又は両方により、文字行候補内での文字矩形の構
成を判断する文字矩形構成判断手段と、文字矩形構成判
断手段により、文字行候補内で文字矩形間で所定の差異
を有すると判断された場合に、所定の差異がある文字矩
形間で、文字行候補を分割する文字矩形間分割手段とを
設けることが望ましい。
【0037】かかる文字行候補分割手段の文字矩形構成
判断手段は、文字行候補内での文字矩形の一辺の長さの
平均値が文字行候補の短辺の長さよりも小さく、かつ、
文字矩形の一辺の長さの分散値が所定値よりも大きけれ
ば、文字行候補中に大小の文字矩形が存在するという判
断を行わせ、文字矩形間分割手段には、文字矩形判断手
段により文字行候補中に大小の文字矩形が存在すると判
断された場合に、大きい文字矩形と小さい文字矩形を挟
む区間を検索する大小文字矩形間検索手段と、大小文字
矩形間検索手段で検索された区間で、文字行候補を分割
する区間分割手段とを設けると好適である。
【0038】さらに、文字行候補分割手段の文字矩形構
成判断手段は、文字行候補内での文字矩形の一辺の長さ
の平均値が文字行候補の短辺の長さとほぼ同じであれ
ば、文字行候補中の文字矩形間に空白が存在するという
判断を行わせ、文字矩形間分割手段には、文字矩形判断
手段により文字行候補中の文字矩形間に空白があると判
断された場合に、空白がある区間を検索する文字矩形間
空白検索手段と、文字矩形間空白検索手段で検索された
区間で、文字行候補を分割する区間分割手段とを設けて
もよい。
【0039】同様に、文字行候補分割手段の文字矩形構
成判断手段には、文字行候補の短辺の長さが文字行候補
内での文字矩形の一辺の長さの平均値の2倍以上であれ
ば、文字行候補中に文字列が2列以上混在するという判
断を行わせ、前記文字行候補分割手段には、文字矩形判
断手段により文字行候補中に文字列が2列以上混在する
と判断された場合に、文字行間で段差を生じている区間
を検索する文字行段差部検索手段と、文字行段差部検索
手段で検索された区間で、文字行候補を分割する区間分
割手段とを設けることができる。
【0040】また、かかる構成にさらに、前記文字行段
差部検索手段で検索された区間に隣接する文字矩形が所
定の特殊な文字矩形か否かを判断する特殊文字判定手段
と、特殊文字判定手段で所定の特殊な文字矩形であると
判断された場合は、当該特殊な文字矩形を分割する、特
殊文字分割手段とを設けることもできる。さらに、上記
課題を解決するために本願発明に係る文字行抽出装置
は、画像データから画素の連結する成分の外接矩形を画
素連結矩形として抽出し、抽出された各画素連結矩形の
位置関係から文字を構成する部分を抽出して、これに外
接する矩形を文字矩形として生成し、生成された各文字
矩形を連結することによって文字行を抽出する文字行抽
出装置において、所定の構成を有する文字矩形をルビ矩
形として抽出するルビ矩形抽出手段と、ルビ矩形の近傍
に存在する文字行を検索する親文字行検索手段と、この
ルビ矩形を含む、検索された文字行に対してルビが存在
し得る範囲を決定するルビ存在可能範囲決定手段と、ル
ビが存在し得る範囲に存在するルビ矩形および文字行を
連結することによって、ルビを構成する文字行を抽出す
るルビ文字行抽出手段とを設けたものである。
【0041】また、本願発明に係る文字行抽出装置は、
画像データから画素の連結する成分の外接矩形を画素連
結矩形として抽出し、抽出された各画素連結矩形の位置
関係から文字を構成する部分を抽出して、これに外接す
る矩形を文字矩形として生成し、生成された各文字矩形
を連結することによって文字行を抽出する文字行抽出装
置において、抽出された文字行内の画素連結矩形または
文字矩形の数が定められた第1の閾値よりも大きけれ
ば、その文字行がノイズであると判断するノイズ文字行
判断手段と、ノイズと判断された文字行を削除するノイ
ズ文字行削除手段とを設けたものである。
【0042】さらに、この文字行抽出装置においては、
抽出された文字行内の画素連結矩形または文字矩形の数
が前記第1の閾値よりも小さく、第1の閾値よりも小さ
い定められた第2の閾値よりも大きければ、その文字行
をノイズ文字行候補とするノイズ文字行候補判断手段
と、ノイズ文字行候補内の画素連結矩形または文字矩形
の大きさの平均値を算出し、この平均値が予め定められ
る所定の値以下であれば、そのノイズ文字行候補をノイ
ズと判断するノイズ文字行候補検証手段とを設けること
が望ましい。なお、この所定の値も計算値も含むもので
あり、例えば、ノイズ文字行候補の短辺の長さに対して
所定の割合を定めておき、この割合を予め計算すること
によって与えるようにしてもよい。
【0043】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図を用いて説明する。図1は本発明に係る文字行抽
出方法および文字行抽出装置を用いた文字認識装置の構
成を示すブロック図である。かかる文字認識装置は、ス
キャナー等よりなる光学的手段により紙面に印字された
文字画像等を画像データとして読み取る画像入力部1、
画像データから文字領域を抽出する文字領域抽出部2、
後に詳述する文字行を抽出する文字行抽出部3、文字行
抽出部3で抽出されないルビ文字行を抽出するルビ文字
行抽出部8、抽出された文字行がノイズである場合に除
去するノイズ文字行削除部9、抽出された文字行を構成
する文字を一文字づつ認識する文字認識部10により構
成される。この装置の文字領域抽出部2、文字行抽出部
3、ルビ文字行抽出部8、ノイズ文字行削除部9、文字
認識部10の動作は汎用のコンピューターとこれに格納
されるプログラムによっても達成することができ、この
プログラムはフロッピーディスク等の記録媒体に記録す
ることができる。
【0044】以下に、各構成部分の詳細をさらに説明す
る。まず、本願発明に係る文字領域抽出装置である文字
領域抽出部2の構成を図2に示す。文字領域抽出部2
中、射影分布生成部21は処理対象の画像データから射
影分布を生成する。射影分布とは処理対象の画像データ
の一方向における黒画素の総和をこの方向に直交する方
向に沿って一定間隔ごとに分布をとったものであり、例
えば、図3(a)に示すように画像データに対して、縦
方向の射影分布を生成すると図3(b)のようになる。
【0045】射影グループ生成部22は射影分布を所定
の幅ごとにグループ化する。この所定の幅は処理対象の
文書内に表される写真や図形の大きさ等を統計し、実験
により最も良い結果をもたらす値を導き出して使用す
る。次に、射影グループ代表値算出部23は生成された
各グループ内の射影分布の代表値を算出する。ここでは
代表値としてグループ内の各射影の平均値を求める。図
3(c)に、図3(b)の射影分布をグループ化して各
グループを代表値によって表した図を示す。 グループ
境界抽出部24は隣接する前記射影分布のグループの代
表値間の差の最も大きなグループ間の境界をグループ境
界として求める。また、さらにグループ境界抽出部24
は、境界で分割してできるそれぞれの領域に属する全グ
ループの射影の平均値の差や平均値の大きな方の値が所
定の閾値を越えるか否か、さらには領域の幅が所定の値
を越える否か等によって、当該境界が文書領域と写真図
形領域のおおよその境界となり得るか否かを判断する。
【0046】文字域抽出部25は、このグループ境界が
文書領域と写真図形領域のおおよその境界となり得ると
判断された場合に、このグループ境界を挟む2つのグル
ープ内の射影分布の差から文字領域と写真図形領域との
境界を決定し、当該境界の接している射影分布の小さい
側を文字領域として抽出する。ここでは、射影分布の差
から谷部分を検出し、当該谷部分を文字領域と写真図形
領域との境界とする。ただし、射影分布が0の領域と0
で出ない領域が隣接している所があれば、その隣接して
いる境界を文字領域と写真図形領域との境界とする。ま
た、グループ境界が文書領域と写真図形領域のおおよそ
の境界となり得えないと判断された場合には対象領域全
体を文字領域として抽出する。なお、ここでは対象画像
の長辺方向に対して、文字行域と写真図形領域を分離す
るようにしているが、これは、短辺方向に対して同様の
処理を行ってもよく、長辺方向と短辺方向の両方につい
て同様の処理を行ってもよい。
【0047】次に、本願発明に係る文字抽出装置である
文字行抽出部3の構成を説明する。文字行抽出部3は、
図1に示すように、画像データから以降の処理の基本単
位となる基本矩形を構成する画素の連結する成分を適宜
接続して文字行候補を生成する文字行候補生成部4、画
素の連結する成分の構成から文字を構成する領域を囲む
文字矩形を生成する文字矩形生成部5、文字行候補生成
部4により生成された文字行候補を、文字矩形の平均
値、分散値等に基づいて分割する文字行候補分割部6、
文字行候補分割部6により分割された領域内で文字矩形
を適宜接続する文字矩形接続部7よりなる。
【0048】文字行候補生成部4の構成を図4に示す。
文字行候補生成部4中、画素連結矩形生成部41は画像
入力部1から入力された画像デ−タの内、文字領域抽出
部2により抽出された領域に対して、連続している画素
連結成分に外接する矩形(画素連結矩形)を生成する。
この画素連結矩形の生成はラベリングなどの公知の手法
を用いて行われる。画素連結矩形の例を図5に示す。図
5中の各矩形a、a、・・・が画素連結矩形である。図
からもわかるように画素連結矩形は必ずしも一文字に対
応するものではなく、一文字の部分である場合もある。
【0049】文字行方向判定部42は、主な文字行の方
向を主方向として判定抽出する部分であり、文字行方向
判定部42は、図に示すように仮主方向決定部42a、
主方向判断部42b、主方向抽出部42cにより構成さ
れる。仮主方向決定部42aは、画像データの外形から
仮の主方向を設定する。例えば、処理対象が英文であれ
ば画像データの外形の短辺方向を仮の主方向とし、処理
対象が名刺ならば画像データの外形の長辺方向を仮の主
方向とする。もっとも、主方向の決定は画素連結矩形の
配列の構成から行の多い方向を主方向と定めてもよい。
なお、ここでは「主方向」とは画像データに含まれる大
多数の文字行の方向をいい、主方向に直交する方向を
「副方向」と呼んでいる。例えば、図7の画像データに
ついては、横方向が主方向であり、これに、直交する方
向が副方向である。
【0050】主方向判断部42bは、後に述べる主方向
部分文字行生成部43で画素連結矩形を主方向に接続し
て生成された各主方向の部分文字行の構成から仮主方向
決定部42aで決定した主方向が正しかったかどうかを
判断する。ここで、画素連結矩形群の接続とは、例え
ば、図6に示すように、図5のように作成された各画素
連結矩形群a、a・・をその位置関係から、グル−プ化
してこれに外接する領域bを作成することであり、この
領域bが主方向への部分文字行となる。
【0051】仮主方向決定部42aで決定した仮の主方
向が正しかったかどうかの判断は、所定の長さを越え、
かつ、画素連結矩形が所定の割合以上に詰まっている部
分文字行が所定数あれば仮主方向決定部42aで決定し
た仮の主方向が正しかったと判断し、この条件を満たさ
なければ決定した仮の主方向が誤っていたと判断する。
例えば、主方向部分文字行生成部43で、図8(a)に
示すような主方向の部分文字行が生成されたならば、十
分に長く文字の詰まった文字行が多数存在しているの
で、仮の主方向は正しかった判断されるが、主方向部分
文字行生成部43で、図8(b)に示すような主方向の
部分文字行が生成されたならば、上記条件を満たさず、
仮の主方向は誤っていたと判断される。なお、上記の他
に、所定長さ以下の部分文字行が所定数あることや、所
定長さを越え、画素連結矩形が所定の割合以下の部分文
字行が所定数あることをもって、仮主方向決定部42a
で決定した仮の主方向は誤っていたと判断する等の条件
も考えられる。
【0052】最後に、主方向抽出部42cは、主方向判
断部42bで仮の主方向が正しいと判断されればその仮
の主方向を主方向として抽出し、仮の主方向が正しくな
いと判断されればその仮の主方向に直交する方向を主方
向として抽出する。なお、以上の構成を有する文字行方
向判定部42と次に説明する主方向部分文字行生成部4
3が本願発明に係る文字行主方向抽出装置を構成する。
【0053】主方向部分文字行生成部43は主方向に重
なり、かつ、近接する画素連結矩形群を主方向に接続し
て主方向の部分文字行として生成する。主方向への画素
連結矩形の接続は、画素連結矩形間の距離や重なり度合
い等の位置関係、大きさの違いなどの接続条件により接
続するかどうか判定し、注目矩形に被接続矩形を接続し
ていくという公知の手法を用いる。主方向部分文字行生
成部43での処理の結果は上述したように文字行方向判
定部42へと戻され、仮の主方向が正しいが否かの判断
がされ、真の主方向が抽出される。ここで、仮の主方向
が誤っていれば主方向部分文字行生成部43は、抽出さ
れた真の主方向に基づき主方向の部分文字行を生成しな
おす。一方、仮の主方向が正しければ主方向部分文字行
生成部43は何もせず以前に生成した結果をそのまま出
力する。
【0054】非主方向部分文字行生成部44は、接続さ
れなかった画素連結矩形群のうち、互いに一定範囲に存
するもの同士を接続して部分文字行を作成する。部分文
字行分類部45は、生成された部分文字行を、大きさや
縦横の比率から主方向の部分文字行、副方向の部分文字
行、文字の部分文字行、その他の部分文字行などの属性
に分類し、各部分文字行に対して、分類された固有の属
性を設定する。例えば、縦横比等から副方向に長い部分
文字行は副方向の部分文字行に分類され、縦横比がほぼ
等しく、大きさが所定の閾値以下であれば文字の部分文
字行であると分類され、抽出される。また、主方向の部
分文字行は主方向部分文字行生成部43によって接続さ
れた領域が、そのまま主方向の部分文字行となる。
【0055】文字副方向接続部46は、属性が文字であ
る部分文字行のうち、互いに副方向に重なりが大きく、
近接するもの同士を接続する。なお、ここで近接すると
は所定の距離以下の範囲に互いに存することをいい、重
なる場合も含む。部分文字行副方向接続部47は副方向
に重なりが大きく、近接する部分文字行同士を接続す
る。部分文字行主方向接続部48は主方向に重なりが大
きい、副方向以外の部分文字行同士を主方向に接続す
る。文字行候補生成部4で部分文字行および部分文字行
を接続してできた領域を「文字行候補」とする。
【0056】続いて、文字矩形生成部5の構成を図9に
示す。文字矩形生成部5中、被分割領域分類部51は文
字行候補生成部4によって生成された文字行候補を被分
割領域とし、この被分割領域を主方向、副方向、文字、
その他の属性に分類する。副方向文字行抽出部52は、
属性が副方向の被分割領域を副方向の文字行として抽出
する。被分割領域分割部は、属性が主方向の被分割領域
を、主方向及び副方向に射影を取得し、射影と射影の間
の空白部分が所定の閾値を越えるところで文字行候補を
分割する。なお、射影とは図10のs、s・・・で示す
ようなある方向からの投影光が画素連結矩形によって遮
られる部分をいい、空白部分は図10のB、B、・・・
で示すような射影と射影の隙間をいう。また、射影間の
空白部分が所定の閾値を越えるところを本願では「セパ
レータ」とよぶ。文字矩形抽出部54は、セパレータと
なる空白部分がなくなった主方向の被分割領域および、
文字、その他の属性をもつ被分割領域について、被分割
領域内の各画素連結矩形を相互の位置関係に応じて、こ
れに外接する矩形を「文字矩形」として生成する。ここ
で「文字矩形」とは、図11(a)のように重なりのあ
る画素連結矩形群を文字を構成するものと判断して、図
11(b)に示すように、この画素連結矩形群に外接す
るように形成された矩形をいう。
【0057】文字行候補分割部6の構成を図12に示
す。文字行候補分割部6中、文字矩形平均値算出部61
は文字矩形生成部5によって、文字矩形生成の完了した
文字行候補内の各文字矩形の主方向の一辺の大きさを文
字サイズとして、これら文字サイズの平均値を文字サイ
ズ平均値として算出する。文字矩形分散値算出部63は
文字サイズの分散値を算出する。平均値比較部62は文
字行候補短辺の長さと文字サイズ平均値の大小を比較す
る。文字構成判定部64は文字行候補の短辺の長さが文
字サイズ平均値より小さければ、文字行候補内には1文
字行のみが存在すると判定する。文字行候補の短辺の長
さが文字サイズの平均値より小さい場合があり得るの
は、文字行内の画素連結矩形群が主方向に近接してお
り、二つ以上の文字が一文字として文字矩形に含まれる
場合であり、かかる場合は文字間が近接しており、文字
間には空間が無いものと考える。さらに、文字構成判定
部64は、文字行候補の短辺の長さが文字サイズ平均値
より小さくなく、文字サイズの分散値が大きければ、文
字行候補内には文字サイズが異なる複数の文字行が存在
すると判定し、文字サイズの分散値が大きくなく、文字
行候補短辺の長さと文字サイズ平均値がほぼ等しければ
文字行候補内に同じ文字サイズの文字行が1列のみ存在
し、かつセパレータが存在すると判定し、文字サイズの
分散値が大きくなく、文字行候補短辺の長さが文字サイ
ズ平均値より大きければ、文字行候補内に同じ文字サイ
ズの文字行が2列存在すると判定する。ここでは、文字
行候補短辺の長さと文字サイズ平均の比が2倍程度であ
れば2列と判定するが、文字行候補短辺の長さと文字サ
イズ平均の比が、3倍程度であれば3列である等の判定
ができるのは言うまでもない。
【0058】大小文字矩形間検索部65は文字構成判定
部64が文字行候補内には文字サイズが異なる複数の文
字行が存在すると判定した場合に、大きい文字矩形と小
さい文字矩形を挟む区間(図25(a)参照)を検索す
る。大きい文字矩形と小さい文字矩形を挟む区間を検索
する方法は、まず、文字行候補の端に位置する文字矩形
を取得し、基準文字とする。次に基準文字に隣接する文
字矩形を取得し、これを比較文字とする。基準文字と比
較文字の文字サイズを比較して、極端な差異がなければ
現在の比較文字を基準文字とし、次の隣接する文字矩形
を比較文字として、文字サイズを比較する。そして、文
字サイズに極端な差異があれば、この基準文字と比較文
字の間が大きい文字矩形と小さな文字矩形を挟む区間で
あると認定する。
【0059】文字矩形間空白検索部66は文字構成判定
部64が文字行候補内に同じ文字サイズの文字行が1列
のみ存在し、かつセパレータが存在すると判定した場合
に、セパレータとなる区間(図27参照)を検索する。
セパレータとなる区間の検索の方法は、文字行候補内で
文字行方向に垂直な方向に文字矩形の射影をとり、その
射影値より得られた空白部分について、セパレータとな
る極端に大きい空白部分が存在するかどうか判定するこ
とにより行う。空白部分がセパレータになりうる程度に
極端に大きいかどうかは、例えば最も大きい空白部分と
2番目に大きい空白部分との比が閾値以上であるかどう
かなどにより判定する。
【0060】文字行段差部検索部67は、文字構成判定
部64が文字行候補内に同じ文字サイズの文字行が2列
以上存在すると判定した場合に、2列に並んだ文字行の
中間的な位置に、段差をもって存在する文字行(図29
(a)参照)と2列の文字行の区間を検索する。なお、
本願では、この中間的な位置に存在する文字行を「1/
2改行文字行」と呼ぶ。この区間の検索の方法は、ま
ず、1/2改行文字行の存在範囲を計算する。1/2改
行文字行の存在範囲は例えば、短辺方向の中心が文字行
候補と等しく、短辺方向の幅が平均文字サイズの値と等
しい矩形内とする。次に、文字行候補の端に位置する文
字矩形を取得し比較文字とする。比較文字が1/2改行
文字行の存在範囲内に含まれていれば、現在の比較文字
に隣接する文字矩形を次の比較文字とする。このような
操作を順次行い、比較文字が1/2改行文字行の存在範
囲外となったところで、当該比較文字の文字矩形と直前
に比較文字であった文字矩形との間の区間を、1/2改
行文字行と2列の文字行の間の区間であると認定する。
なお、最初の比較文字が1/2改行文字行の存在範囲外
である場合は、1/2改行文字行は存在しないとみなし
分割は行なわない。
【0061】区間分割部68は、大小文字矩形間検索部
65、文字矩形間空白検索部66、文字行段差部検索部
67によって検索された区間で、文字行候補を分割す
る。特殊文字判定部69は、文字行段差部検索部67で
検索された区間に隣接する文字矩形が所定の特殊文字で
あるか否かを判定する。特殊文字とは、例えば、1/2
改行文字行と2列の文字行の間に挿入される{等の特殊
な文字をいう(図29(b)参照)。特殊文字の判定
は、1/2改行文字行を抽出した残りの領域内におい
て、1/2改行文字行に最も近い最初の1文字が{等の
特殊文字であるかどうかにより行う。特殊文字であるか
どうかは、文字矩形の形状が他の文字矩形に比べて極端
に大きいかどうかなどにより判定する。そして、特殊文
字分割部70は特殊文字判定部69で特殊文字が存在す
ると判定された場合に、当該特殊文字を分割する。
【0062】最後に、文字矩形接続部7について説明す
る。文字矩形接続部7は文字行候補分割部6による分割
処理が終了した後、所定の接続条件を満たす文字行候補
を分割した領域内の文字矩形群を主方向に接続する。文
字矩形群の接続は、矩形間の距離や重なり度合い、大き
さの違いなどの接続条件により接続するかどうか判定
し、注目矩形に被接続矩形を接続していくという公知の
手法を用いる。なお、文字行段差部検索部67で生成さ
れた1/2改行文字行部分など、分割領域内に1文字行
しか存在しないことがわかっている場合は、分割領域を
そのまま文字行として抽出する。
【0063】以上の構成により文字行抽出部3は文字行
を抽出することができるが、図1のブロック図では、さ
らに文字行を抽出した後に、ルビ文字行抽出部8、ノイ
ズ文字行削除部9を設けて、ルビを構成する文字行の抽
出と、ノイズ文字行の削除を行なっている。まず、ルビ
文字行抽出部8の構成を図13に示す。ルビ文字行抽出
部8中、ルビ矩形抽出部81は文字行抽出部3によって
抽出された文字行の領域を示す各矩形に注目し、ルビか
どうかを判定する。注目した矩形がルビかどうかは、矩
形の大きさと予め定められた閾値よりも小さいか否か等
により判定する。親文字行検索部82は、ルビ矩形抽出
部81によって、注目した矩形がルビと判定されたなら
ば、当該ルビ矩形の近くにある可能性のある「親文字
行」を検索する。なお、「親文字行」とは、ルビがふら
れている文字行をいう。親文字行が存在するかどうか
は、注目した矩形の最近接文字行と注目した矩形の距離
が近く、最近接文字行が十分大きければ、当該最近接文
字行を親文字行とする等の方法で行う。ルビ存在可能範
囲決定部83は、親文字行検索部82によって検索され
た親文字行を基準として、ルビの存在可能範囲を決定す
る。ルビの存在範囲は、例えば、親文字行の注目した矩
形がある側に接し、長辺の長さが親文字行と等しく、短
辺の長さが予め定められた閾値以内である領域内とす
る。ルビ文字行作成部84は、ルビの存在可能範囲に含
まれるすべての文字行の領域を表す矩形を注目矩形に接
続することにより、ルビ文字行を抽出する。
【0064】次に、ノイズ文字行削除部9の構成を図1
4に示す。ノイズ文字行削除部9中、ノイズ文字行判定
部91は抽出された各文字行がノイズであるかどうかを
判断する。判断はその文字行に含まれる文字矩形の数が
定められた第1の閾値よりも大きければ、その文字行が
ノイズであると判断する。ノイズ文字行候補判断部92
は各文字行内の文字矩形の数が前記第1の閾値よりも小
さく、第1の閾値よりも小さい定められた第2の閾値よ
りも大きければ、その文字行をノイズ文字行候補と判断
する。これら第1、第2の閾値は処理対象に応じて経験
的に見出される値であり予め定められる。ここでは、第
1の閾値として200、第2の閾値として5と定めてあ
る。ノイズ文字行候補検証部93は、ノイズ文字行候補
内の文字矩形の大きさの平均値を算出し、この平均値が
予め定められる所定の値以下であれば、そのノイズ文字
行候補をノイズと判断する。この所定の値は実験等によ
って得られ予め定められる。ここでは、この値を400
dpiの解像度で6ピクセル(原画像で0.4mm)と
している。なお、上記の判断は文字矩形の数や大きさで
なく、画素連結矩形の数や大きさによって行ってもよ
い。また、文字矩形や画素連結矩形の大きさは所定の位
置方向の辺の長さを用いる。以上の動作の後、ノイズ文
字行削除部94はノイズと判定された文字行を削除す
る。
【0065】以上の構成を有する文字行抽出装置による
文字行抽出方法の動作について、名刺画像から文字行を
抽出する場合を例にとって以下に説明する。まず、文字
領域抽出部2の操作について説明する。図15に文字領
域抽出部2の動作を表すフローチャートを示す。ここで
は、図3に示す名刺から文字領域を抽出するものとす
る。
【0066】文字領域抽出部2の射影分布生成部21
は、画像入力部1から入力された名刺の画像データか
ら、射影分布を生成し、平滑化する(ステップ10
1)。これにより図3(a)のような名刺画像の場合か
ら、図3(b)のような射影分布が得られる。射影グル
ープ生成部22は、生成された射影分布を名刺画像に対
応して予め定められれた所定の幅をもってグループ化
し、射影グループ代表値算出部23は生成された各グル
ープ毎に射影分布の平均値を求める(ステップ10
2)。これにより、図3(b)のような射影分布から、
図3(c)のような射影グループの分布が得られる。
【0067】グループ境界抽出部24は、隣接する射影
グループ間の平均値の差が最大となるグループ間の境界
を射影グループの境界として抽出する(ステップ10
3)。この動作により図3(c)に示す射影グループの
分布の場合は、グループ境界lが抽出される。さらに、
グループ境界抽出部24は、このグループ境界によって
分けられた各々の領域の射影グループの平均値および各
々の領域の幅を算出し(ステップ104)、その平均
値、領域の幅に基づき、当該グループ境界が文章領域と
写真領域のおおよその境界となり得るか否かを判断する
(ステップ105)。図3(c)におけるグループ境界
lの場合には、このグループ境界lによって分けられた
各々の領域の射影グループ間の平均値の差が大きく、各
々の領域の幅も妥当であるのでグループ境界lは文章領
域と写真領域のおおよその境界となり得ると判断され
る。
【0068】ステップ105でグループ境界が文書領域
と写真図形領域のおおよその境界となり得ると判断され
た場合には、文字域抽出部25はこのグループ境界を挟
む2つのグループ内の射影分布の差から文字領域と写真
図形領域との境界を決定し、当該境界の接している射影
分布の小さい側を文字領域として抽出する(ステップ1
06)。例えば、図3(c)で射影グループの境界lが
求まれば、これに隣接する射影グループA、A内に含ま
れる図3(b)中の射影分布領域から文字領域と写真図
形領域との境界Lが求まる。そして、この境界Lに接し
ている射影分布の小さい側、即ち、境界Lの右側の領域
が文字領域と判断される。
【0069】また、ステップ105でグループ境界が文
書領域と写真図形領域のおおよその境界となり得ると判
断されなかった場合には、文字域抽出部25は対象領域
全体を文章領域と判断する。以上の動作により対象画像
から文字領域が抽出される。なお、グループ境界抽出部
24は、隣接する射影グループの値の差が最大となる部
分を、射影グループの境界位置として抽出する(ステッ
プ103)だけにとどめ、ステップ104、105を省
略することも可能である。
【0070】次に、文字行抽出部3の大まかな動作につ
いて、図16を用いて説明する。図16は文字行抽出部
3の処理を示すフローチャートである。まず、文字行候
補生成部4は、画像入力部1から取り込んだ画像データ
から文字行候補を生成する(ステップ201)。次に文
字矩形生成部5は文字行候補を一つ取得し(ステップ2
02)、文字行候補内で、文字矩形を生成する(ステッ
プ203)。そして、文字行候補分割部6は文字行候補
内の文字矩形の構成に応じてこの文字行候補を分割する
(ステップ204)。さらに、文字矩形接続部7は、文
字行候補の分割により生成された分割領域を1つ取得し
(ステップ205)、分割領域内で文字矩形の接続を行
なう(ステップ206)。文字矩形接続部7は全ての分
割領域について、同様の操作を繰り返す(ステップ20
7)。文字矩形生成部5、文字行候補分割部6、文字矩
形接続部7は、以上の動作(ステップ202〜ステップ
207)を文字行候補生成部4で生成された全ての文字
行候補の処理がされるまで繰り返す(ステップ20
8)。
【0071】以下に、各構成部分の動作についてさらに
詳細に説明する。まず、文字行候補生成部4の動作につ
いて図17を用いて説明する。図17は文字行候補生成
部4の動作を示すフローチャートである。文字行候補生
成部4の画素連結矩形生成部41は、画像入力部1から
入力された名刺の画像デ−タから、画素連結矩形を生成
する(ステップ301)。次に、文字行方向判定部42
の仮主方向決定部42aは、名刺画像の形状から仮の主
方向を決定する(ステップ302)。名刺の場合、ほと
んどの場合が名刺画像の長辺と文字行は平行であるた
め、長辺方向を仮の主方向と設定する。次に、主方向部
分文字行生成部43は、各画素連結矩形群の位置関係等
の情報から、生成された画素連結矩形群を主方向に接続
して主方向の部分文字行を生成する(ステップ30
3)。それから、主方向判断部42bが仮主方向決定部
42aで決定した主方向が正しかったかどうかを判断す
る(ステップ304)。ここで、仮の主方向が誤ってい
たと判断されたときは主方向抽出部42cは、仮の主方
向と直交する方向を主方向として抽出し(ステップ30
5)、主方向部分文字行生成部43は新たに主方向の部
分文字行を生成する(ステップ306)。一方、主方向
判断部42bで仮の主方向が誤っていたと判断されたと
きは、主方向抽出部42cは、仮の主方向主方向として
抽出し(ステップ307)、主方向部分文字行生成部4
3は何もしない。このような処理によって、例えば図8
(b)に示すような名刺であっても適切に主方向を抽出
することができる。
【0072】つぎに、非主方向部分文字行生成部44は
主方向以外の部分文字行を作成する(ステップ30
8)。まず最初に主方向に画素連結矩形群を接続して主
方向の部分文字行を生成し、それから主方向以外の部分
文字行を作成するのは、文字行の多くは主方向の文字行
であり、主方向の文字行が並列に並んでいる場合に、副
方向に重なりのある文字同士が副方向の部分文字行と判
断されることを避けるためである。
【0073】図18に、ステップ301から308まで
を実行した結果の一例を示す。図に示すように、主方向
への接続パラメータの一つである矩形間の距離の閾値を
厳しく設定すると図18(a)のように接続不十分な箇
所が発生し、逆に緩く設定すると図18(b)のように
重なり度合いの大きい副方向文字行の一部と接続してし
まう。また、図18(c)のように画素連結矩形が上下
に別れた文字が連続する文字行の場合、1文字行が上下
に分離してしまうこともある。このようにステップ30
3や308による接続において、常に最適の接続パラメ
ータを設定することは容易ではない。このように接続パ
ラメータが適切でなかった場合に対応できるように文字
行候補生成部4はさらに、以下の処理を行う。この処理
手順を図19を参照しながら説明する。
【0074】まず、部分文字行分類部45は、各画素連
結矩形群の位置関係、矩形の形状などの情報から、主方
向の部分文字行、副方向の部分文字行、文字の部分文字
行、その他の部分文字行などの属性に分類し、各部分文
字行に対して、分類された固有の属性を設定する(ステ
ップ309)。図19(a)においては、「M」「i」
「L」「H」を囲む部分文字行の属性が文字であると設
定され、その他の部分文字行は属性が主方向の部分文字
行であると設定される。なお、「M」「i」「L」
「H」は互いに距離が離れているため、それぞれを囲む
領域が部分文字行とされたが、距離の閾値を大きく設定
していたなら、この四つの文字を囲む領域が副方向の部
分文字行と判断されることもあり得る。文字副方向接続
部46により属性が文字である部分文字行のうち、互い
に副方向に重なりが大きく、近接するもの同士を接続す
る(ステップ310)。この操作は主方向の接続(ステ
ップ303等)では抽出できない副方向の部分文字行を
抽出するために行う。例えば、図19(a)において、
属性が文字の部分文字行は「M」「i」「L」「H」を
囲む部分文字行であり、副方向に重なりが大きく、近接
するので、図19(b)のハッチング部分に示すように
副方向に接続される。さらに、部分文字行副方向接続部
47は、副方向に重なりが大きく、近接する部分文字行
同士を接続する(ステップ311)。これは、図18
(c)のような誤接続に対処するために行なう。例え
ば、図19(b)では、右下の二つの矩形で囲まれる部
分文字行が、互いに副方向に重なり、近接しているの
で、図19(c)のハッチング部分に示すように副方向
に接続される。最後に、部分文字行主方向接続部48
は、主方向に重なりが大きい、副方向以外の部分文字行
同士を主方向に接続する(ステップ312)。これは図
18(a)または図18(c)のような誤接続に対処す
るために行なう。例えば、図19(c)では、下の二つ
の矩形で囲まれる部分文字行が主方向に重なりが大きい
ので、図19(c)のハッチング部分に示すように接続
される。
【0075】ところで、以上の処理によっても、文字行
候補生成部4の、主方向部分文字行生成部43、文字副
方向接続部46、部分文字行副方向接続部47、部分文
字行主方向接続部48における接続パラメータと、読み
取る画像データの構成によっては、うまく文字行の抽出
ができないことがある。例えば、主方向部分文字行生成
部43によって図20(a)のように接続された後に、
部分文字行副方向接続部47によって図20(b)のよ
うに副方向文字行の全体を含んだ1つの文字行候補とし
て統合されてしまうことがある。このような場合であっ
ても以下の文字矩形生成部5の処理によって、副方向の
文字行も1つの文字行として抽出できる。
【0076】文字矩形生成部5の動作について図21を
用いて説明する。図21は文字矩形生成部5の動作を示
すフローチャートである。この図において最初に入力さ
れるのは、上記の文字行候補生成部4によって生成され
た文字行候補の任意の1つである。ここでは、図22
(a)に示す文字行候補が入力されたとする。まず、被
分割領域分類部51は文字行候補を最初の被分割領域と
する(ステップ401)。そして、被分割領域に主方
向、副方向、文字、その他のいずれかに分類して属性を
設定する(ステップ403)。図22(a)に示す被分
割領域は主方向の属性に設定される。被分割領域の属性
が副方向文字行または文字であれば何もせず(ステップ
404)、それ以外であれば、被分割領域分割部53が
被分割領域内で画素連結矩形の射影を取得する(ステッ
プ405)。セパレータとなる空白部分があれば(ステ
ップ406)、セパレータとなる空白部分の前後で被分
割領域を分割する(ステップ407)。図22(a)に
おいて、主方向、副方向の両方向に射影をとると、まず
縦に長い空白部分が見つかり、この空白部分をセパレー
タとして左右に分割した結果が図22(b)である。
【0077】次に、分割してできた領域それぞれを新た
な被分割領域とし(ステップ408)、未処理の被分割
領域が存在する間(ステップ409)、ステップ402
から繰り返す。図22(b)では新たな被分割領域が左
右にできるので、この新たな被分割領域に対して処理が
繰り返される。左側の領域は縦に細長いため、属性が副
方向であるとされ、これ以上分割されない。右側の領域
は横に長く、適当な大きさがあるため、副方向文字行で
も文字でもない。そして、右側の領域に射影をとると、
今度は横に細長い空白部分がみつかり、これらの上下で
分割すると図22(c)のようになる。ステップ406
でセパレータとなる空白部分がなければ、文字矩形抽出
部54は被分割領域内の重なりのある画素連結矩形を統
合することにより、文字矩形を生成する(ステップ41
0)。図22(c)では、上の2つの領域には、広い空
白部分が存在しないので、文字矩形抽出部54により文
字矩形が生成される。一方、一番下の領域(「吉森亜
依」の文字行)では、文字間に広い空白部分が存在する
ので、それぞれの左右で分割され図22(d)のように
なる。分割により生じた領域は、縦横比が小さいことや
長辺の長さが閾値以内であることから、属性が文字とな
るのでこれ以上分割されず、これらから文字矩形抽出部
54により文字矩形が生成される。なお、以上の動作は
あくまで文字矩形を生成するためのものであり、文字行
候補は分割されず、以上の動作によっても、もとの文字
行候補生成部4で生成された図22(a)の矩形の領域
が文字行候補であることには変わりがない。
【0078】今度は、文字行候補分割部6について図2
3を用いて説明する。図23は文字行候補分割部6の動
作を示すフローチャートである。まず、文字行候補分割
部6は、文字矩形生成部5で文字矩形生成の完了した文
字行候補を1つ取得する(ステップ501)。次に、文
字矩形平均算出部61により、文字行候補内の文字矩形
の長辺の長さの平均値を算出する(ステップ502)。
次に、平均値比較部62により文字行候補の短辺の長さ
と文字サイズ平均値を比較する。文字構成判定部64は
文字行候補の短辺の長さが文字サイズ平均値より小さけ
れば(ステップ503)、文字行候補内には1文字行の
みが存在すると判定し、分割は行なわない。それ以外で
あれば、文字矩形分散値算出部63により、文字サイズ
の分散値を算出する(ステップ504)。文字構成判定
部64は、文字サイズ分散値が大きければ(ステップ5
05)、文字行候補内には文字サイズが異なる複数の文
字行が存在すると判定し、文字行候補の分割1の処理を
行なう(ステップ506)。文字サイズの分散値が小さ
く、文字行候補短辺の長さと文字サイズ平均値がほぼ等
しければ(ステップ507)、文字行候補内に同じ文字
サイズの文字行が1列のみ存在し、かつセパレータが存
在すると判定し、文字行候補の分割2の処理を行なう
(ステップ508)。文字サイズの分散値が小さく、文
字行候補短辺の長さが文字サイズの平均値より大きけれ
ば(ステップ509)、文字行候補内に同じ文字サイズ
の文字行が2列以上存在すると判定し、分割3の処理を
行なう(ステップ510)。文字行候補の分割1、2、
3については以下に述べる。
【0079】まず、文字行候補の分割1の処理を図24
を用いて説明する。図24は文字行候補の分割1の処理
のフローチャートである。文字行候補の分割1は、文字
行候補を文字矩形の大きさが不連続な箇所で分割する処
理である。まず、文字行候補内に文字サイズが異なる複
数の文字行が存在すると判定されると、大小文字矩形間
検索部65は当該文字行候補の端に位置する文字矩形を
取得し、基準文字とする(ステップ601)。次に基準
文字に隣接する文字矩形を取得し、これを比較文字とす
る(ステップ602)。基準文字と比較文字の文字サイ
ズに極端な差異があれば(ステップ603)、区間分割
部68により基準文字と比較文字の間で文字行候補を分
割する(ステップ604)。極端な差異がなければ現在
の比較文字を基準文字とし(ステップ605)、次の文
字矩形が存在する間(ステップ606)、ステップ60
2より繰り返す。
【0080】かかる処理を、図25を用いてさらに具体
的に説明する。xy座標系で考えた場合、横に長い文字
行候補においては矩形左辺のx座標の小さい順に処理を
行なう。図25(a)において、最初、文字矩形1を基
準文字とし、文字矩形2を比較文字とする。文字矩形1
と文字矩形2の大きさはほぼ等しいので、次に、文字矩
形2を基準文字とし、文字矩形3を比較文字とする。こ
のような処理を文字矩形の大きさに極端な差異が生じる
まで進めていく。文字矩形4を基準文字とし、文字矩形
5を比較文字としたところで、初めて文字矩形の大きさ
に極端な差異が生じるので、この文字矩形4と文字矩形
5の区間が分割する区間とされる。このようにして文字
行候補を分割しておくと、文字行方向に一列に並んだ、
異なる文字行同士が誤接続されるのを防ぐことができ
る。また、図25(b)に示すように、分割領域内に列
方向に複数の文字行が存在する場合は、その後、分割領
域内において文字矩形同士を主方向に接続することによ
り、図25(c)のように正確に文字行が抽出される。
【0081】次に、文字行候補の分割2の処理につい
て、図26を用いて説明する。図26は文字行候補の分
割2の処理を示すフローチャートである。文字行候補の
分割2の処理は、文字行候補をセパレータとなる空白部
分の前後で分割する処理である。まず、文字行候補内に
同じ文字サイズの文字行が1列のみ存在し、かつセパレ
ータが存在すると判定されると、文字矩形間空白検索部
66は、当該文字行候補内で文字行方向に垂直な方向に
文字矩形の射影をとる(ステップ701)。次に、その
射影値より得られた空白部分について、セパレータとな
る極端に大きい空白部分が存在するかどうか判定する
(ステップ702)。セパレーターとなる空白部分が存
在すると判定された場合には区間分割部68は、セパレ
ータとなる空白部分の前後で文字行候補を分割する(ス
テッ703)。このような文字行候補の分割2の処理に
よって、例えば図27に示すような文字行方向に一列に
並んだ、異なる文字行が含まれる文字行候補はセパレー
タから左右に分割され、これらの異なる文字行が互いに
誤接続されるのを防ぐことができる。
【0082】最後に、文字行候補の分割3の処理につい
て図28を用いて説明する。図28は文字行候補の分割
3の処理を示すフローチャートである。文字行候補の分
割3は、2列に並んだ文字行の中間的な位置に存在する
1/2改行文字行部分と2列に並んだ文字行の部分に分
割する処理である。まず、文字行候補内に同じ文字サイ
ズの文字行が2列以上存在すると判定されると、文字行
段差部検索部67は1/2改行文字行の存在範囲を計算
する(ステップ801)。次に、文字行候補の端に位置
する文字矩形を取得し、比較文字とする(ステップ80
2)。比較文字が1/2改行文字行の存在範囲内に含ま
れていれば(ステップ803)、次の文字矩形が存在す
る間(ステップ804)、現在の比較文字に隣接する文
字矩形を次の比較文字とし(ステップ805)、ステッ
プ803より繰り返す。1/2改行文字行の存在範囲外
の文字が最初の比較文字であれば(ステップ806)、
1/2改行文字行は存在しないとみなす。全文字矩形が
1/2改行文字行範囲に含まれる場合も同様である。1
/2改行文字行の存在範囲外となった文字が最初の比較
文字でなければ、区間分割部68は、比較文字の前後で
文字行候補を分割する(ステップ807)。これらの処
理によって、図29(a)上段に示すような文字行候補
は、下段に示すように分割される。これにより、1/2
改行文字行と残りの2列の文字行が誤接続されるのが防
がれ、1/2改行文字行部分はそのまま文字行とし、残
りの2列の文字行部分についてはその後、分割領域内に
おいて文字矩形同士を主方向に接続することにより、2
列の文字行をそれぞれ抽出することができる。
【0083】さらに、文字行候補の分割3は図29
(b)に示すような1/2改行文字行に続く2行が{等
の特殊文字でくくられている場合に、この特殊文字を分
割する処理も行う。即ち、ステップ807による分割
後、1/2改行文字行を抽出した残りの領域内におい
て、1/2改行文字行に最も近い最初の1文字が{等の
特殊文字であるかどうか判定する(ステップ808)。
特殊文字であれば、その文字と残りの部分の間で文字行
候補を分割する(ステップ809)。かかる処理によっ
て、図29(b)上段の右側の文字行候補は、図の下段
に示すように、特殊文字と2列の文字行部分が分離さ
れ、これにより、{の文字矩形の影響でこれらの2列の
文字行を別々の行として抽出できないということを防ぐ
ことができる。
【0084】そして、文字矩形接続部7は、文字行候補
分割部6による文字行候補の分割処理が終了した後、所
定の接続条件を満たす文字行候補の分割した領域内の文
字矩形群を主方向に接続して文字行を抽出する。次に、
ルビ文字行抽出部8の動作について説明する。ルビ文字
行抽出部8は、ルビを構成する文字行を抽出する。つま
り、以上に述べた文字行抽出部3の処理によって文字行
を抽出した後であっても、ルビを構成する文字群は大き
さに比較して互いの距離が非常に離れているため、文字
矩形接続部7によってはルビを構成する文字矩形は接続
できない場合があるために、特にルビ文字行抽出部8を
設けてルビを構成する文字行を抽出する。
【0085】図30はルビ文字行抽出部8の動作を示す
フローチャートである。図30の入力状態は、文字行抽
出部3によって文字行抽出がすべて完了された状態であ
る。ここでは、例えば図31(a)のような画像が入力
されているとする。まず、ルビ矩形抽出部81は生成し
た文字行のそれぞれを注目矩形とし、注目矩形がルビか
どうか判定する(ステップ901)。図31(a)で
は、例えば矩形の大きさ等から「よ」を囲む文字行がル
ビ矩形と判定される。注目矩形がルビと判定されたなら
ば、親文字行検索部82はルビ矩形の近傍において親文
字行を検索する(ステップ902)。図31(a)で
は、ルビ矩形からの距離や大きさ等から「吉森 亜
依」を囲む文字行が親文字行として認定される。親文字
行が見つかった場合には、ルビ存在可能範囲決定部83
はルビの存在可能範囲を決定する(ステップ903)。
図31(a)のように「よ」がルビ矩形であり、「吉
森 亜依」を囲む文字行が親文字行とされた場合は、図
31(b)のトーン部分がルビ文字行存在可能範囲と決
定される。最後に、ルビ文字行作成部84がルビの存在
可能範囲に含まれるすべての矩形を注目矩形に接続する
ことにより、ルビ文字行を抽出する(ステップ90
4)。この結果、図31(a)のように離れていたルビ
を構成する文字行は、図31(c)のように統合され
て、一つの文字行となる。
【0086】最後にノイズ文字行削除部9の動作につい
て説明する。ノイズ文字行削除部9は、以上に述べた文
字行抽出部3、ルビ文字行抽出部8の処理によって生成
された各文字行について、その文字行を構成する文字矩
形の数や大きさから、その文字行がノイズであるかを判
断し、ノイズにより構成される文字行を削除する。図3
2はノイズ文字行削除部9の動作を示すフローチャート
である。図32の入力状態は、文字行抽出部3およびル
ビ文字行抽出部8によって文字行抽出がすべて完了され
た状態である。ノイズ文字行判定部91は、抽出された
各文字行から一つの文字行を取得し(ステップ100
1)、その文字行に含まれる文字矩形の数が予め定めら
れた第1の閾値aよりも大きいか否かを判断する(ステ
ップ1002)。ステップ1002で文字矩形の数が第
1の閾値よりも大きい場合は、その文字行はノイズであ
ると判断され、ノイズ文字行削除部94が、これを削除
する(ステップ1006)。
【0087】また、文字矩形の数が第1の閾値aよりも
大きくないときは、ノイズ文字行候補判断部92が、文
字矩形の数が第2の閾値bよりも大きいか否かについて
判断する(ステップ1003)。ここで文字矩形の数が
第2の閾値bよりも小さければ、この文字行はノイズで
ないと判断する。一方、文字矩形の数が第2の閾値bよ
りも大きい場合はノイズの可能性があるのでノイズ文字
行候補であると判断する。例えば、ここで図33(a)
(b)のような文字行をノイズ文字行候補と判断したも
のとする。
【0088】ノイズ文字行候補に対し、ノイズ文字行候
補検証部93は、当該ノイズ文字行候補内の文字矩形の
大きさの平均値を算出し(ステップ1004)、この平
均値が文字行の短辺の長さに対して所定の割合以下であ
るか否かを判断する(ステップ1005)。ここで、所
定の割合以下であると判断された場合は、当該文字行は
ノイズであると判断され、ノイズ文字行削除部94がこ
れを削除する(ステップ1006)。図38(b)に示
すノイズ文字行候補は、文字矩形の大きさの平均値が文
字行の短辺の大きさより十分小さいので、ノイズと判断
されて削除される。一方、所定の割合以下でないと判断
された場合は、当該文字行はノイズではないと判断され
る。図38(a)に示すノイズ文字行候補は、文字矩形
の大きさの平均値が文字行の短辺の長さに比較的近い値
となり、ノイズではないと判断される。以上の動作(ス
テップ1001〜ステップ1006)を全ての文字行に
対して行い(ステップ1007)、ノイズを構成する文
字行を削除は完了する。
【0089】なお、上記実施の形態において文字行候補
生成部4では、主方向の文字行が並列に並んでいる場合
に、副方向に重なりのある文字同士が副方向の部分文字
行と判断されることを避けるため、最初に主方向の部分
文字行を作成して、それからその他の部分文字行を作成
した。しかし、処理対象の特定の領域に副方向の文字行
が高い確率で現れることが経験的にわかっているとき
は、この特定の領域についてのみ先に副方向の文字行を
作成しておくことが望ましい。例えば、上記実施の形態
に基づく処理によって文字行候補生成部4が図34
(a)に示すような文字行候補を生成した場合、文字矩
形生成部5において射影の取得を行っても副方向文字行
「a」と他の主方向文字行の間が詰まっており、セパレ
ータとなりうる空白部分が発生しない。したがって、副
方向文字行「a」が独立して副方向の属性を与えられる
ことはなく、図34(b)のように、単独で文字矩形と
して生成される。さらに、文字行候補分割部6、文字矩
形接続部7の処理によって、結果として図34(c)の
ような文字行が抽出されてしまう。一方、対象画像が名
刺であって主方向が長辺方向である場合は、図35に示
すような両短辺に沿う一定領域Xに副方向の文字行が現
れる確率が高いことが知られている。このような場合に
は、このような領域における文字行を先に生成しておけ
ば上述のような事態を防ぐことができる。
【0090】かかる目的を達成するためには、文字行候
補生成部4において図36に示すように、処理対象の画
像データの予め定められた所定領域内において、副方向
に重なり、かつ、近接する画素連結矩形群を副方向に接
続して副方向の部分文字行として生成する特定領域部分
文字行生成部49を設ければよい。特定領域部分文字行
生成部49を設けたときの部分文字行分類に至るまでの
動作を表すフローチャートを図37に示す。これ以下の
動作は図17に示すフローチャートと同じである。これ
に基づき図38(i) に示す名刺画像を例にとって動作
を説明すると、画素連結矩形生成部41は名刺の画像デ
ータから画素連結矩形を生成し(ステップ1101)、
文字行方向判定部42の仮主方向決定部42aは仮の主
方向を決定する(ステップ1102)。ここでは上述し
たように名刺画像の長辺方向が仮の主方向とされる。次
に、特定領域部分文字行生成部49が予め定められた特
定の領域において、副方向の部分文字行を生成する(ス
テップ1103)。ここでは図35のハッチングされた
領域Xが予め定められた領域であるとする。すると、図
38(i) の名刺画像から図38(ii)のように、「☆
anasonic」の部分が副文字行として抽出され
る。
【0091】それから、上述した文字行候補生成部4の
動作と同様にして、主方向部分文字行生成部43が主方
向の部分文字行が生成し(ステップ1104)、主方向
判断部42bが、領域X以外の領域において仮の主方向
が正しいか否かを判断し(ステップ1105)、ここで
正しいと判断された場合は主方向抽出部42cがその方
向を主方向として抽出する。一方、ステップ1105で
正しくないと判断されたときは、主方向抽出部42cが
仮の主方向と直交する方向を主方向として抽出し(ステ
ップ1107)、特定領域部分文字行生成部49が、以
前の特定領域における文字行の生成を取り消し、新たに
特定領域の部分文字行を生成する(ステップ110
8)。ただし、仮の主方向が変わることで通常は特定領
域も変わるが、場合によっては仮の主方向が変わること
によって特定の領域がなくなる場合もある。そのような
場合には、特定領域部分文字行生成部49での文字行の
生成は行われない。今の場合は、名刺画像であるが主方
向が短辺に平行な方向となった場合は、かかる特定領域
は存在しなくなるので、ステップ1108では以前の特
定領域を取り消すに留まる。ステップ1108、110
9の後、非主方向部分文字行生成部44がその他の部分
文字行を生成する(ステップ1010)。この結果、文
字行候補生成部4において図38(i)の名刺画像から
は図38(iii)のよう文字行候補が生成される。これ
により、以後の処理によっても副方向の文字行の一部が
主方向の文字行に取り込まれることがなくなる。なお、
特定領域において副方向を接続する際の接続条件は、特
定領域に存在する主方向の部分文字行の一部を誤接続し
ないように、厳しく設定しておくことが望ましい。
【0092】さらに、上記実施の形態において、文字行
候補生成部4の部分文字行副方向接続部47は図18
(c)に示すような1文字行が上下に分離してしまった
属性が文字行である部分文字行を接合するために、副方
向に重なりが大きく、近接する部分文字行同士を接続し
ている。この際、近接するか否かは部分文字行を構成す
る矩形間の距離が所定の閾値よりも小さいか否かによっ
て判断するが、画像が傾いて画像入力部1から取り込ま
れた場合は、この部分文字行を構成する矩形間の距離が
実際よりも小さくなってしまう。例えば、図39(a)
の名刺画像の下方の電話番号とファクシミリ番号の文字
行間の距離は、傾きなしに画像入力部1から取り込まれ
た場合はdであるが、図39(b)に示すように角度θ
だけ傾いて取り込まれた場合は、両文字間の距離はd’
になり、小さくなってしまう。この結果、部分文字行副
方向接続部47によって接続されるべきでない両文字行
が接続されてしまう。そして、傾きが大きく両矩形間が
一定距離以内となれば、文字矩形生成部5においてもこ
の間隔をセパレータと認識できず、個々の文字が文字矩
形として生成されずに正しい文字行抽出が行われなくな
ることもあり得る。このことは部分文字行が長い場合に
傾きによる移動量が大きくなるため顕著に現れる。
【0093】そこで、このように名刺画像が傾きをもっ
て入力された場合に対処する手段として、部分文字行副
方向接続部47を図40に示すような構成とすることが
できる。即ち、部分文字行副方向接続部47に、副方向
に重なり、かつ、準近接する主方向の部分文字行同士を
抽出する準近接部分文字行抽出部47bと、この準近接
部分文字行抽出部47bで抽出された部分文字行同士間
における各部分文字行に含まれる画素連結矩形の距離が
所定の値以下であれば、当該部分文字行同士を接続し新
たな主方向の部分文字行を生成する準近接部分文字行接
続部47cを付加する。なお、近接部分文字行副方向接
続部47aは、上述した実施の形態における部分文字行
副方向接続部47と同様のものであり、副方向に重な
り、かつ、近接する主方向の部分文字行群を接続して新
たな主方向の部分文字行を生成する。
【0094】このような構成を有する部分文字行副方向
接続部47の動作を図41を用いて説明する。図41は
部分文字行副方向接続部47の動作を示すフローチャー
トである。まず、近接部分文字行副方向接続部47aが
部分文字行のペアを取得し(ステップ1201)、副方
向に十分重なるか否か、ここでは長辺の短い方の1/2
以上重なるか否かを判断する(ステップ1202)。こ
こで、十分に重ならないと判断した場合は、その部分文
字行のペアについての処理は終了する。
【0095】十分に重なると判断された場合は、次に各
部分文字行を構成する矩形間の距離が所定の近接してい
ると言える距離の範囲、ここでは短辺の短い方の30%
以上重なっている距離の範囲にあるか否かを判断する
(ステップ1203)。ここで、近接していると判断し
た場合は当該部分文字行同士を接続する(ステップ12
07)。
【0096】近接していないと判断した場合は、準近接
部分文字行抽出部47bによって、各部分文字行を構成
する矩形間の距離が所定の準近接していると言える距離
の範囲、ここでは400dpiの精度で1ピクセル(原
画像における約0.07mm)以内の範囲にあるか否か
を判断する(ステップ1204)。このステップによっ
て準近接していないと判断した場合は、この部分文字行
のペアは接続されずに処理が終わる。ステップ1204
で準近接していると判断した場合は、準近接部分文字行
接続部47cが、まず、部分文字行同士間における各部
分文字行に含まれる画素連結矩形の副方向における距離
を取得し平均値を算出する(ステップ1205)。そし
て、この平均値が、所定の近接しているといえるほどの
値以内、ここでは400dpiの精度で1ピクセル(原
画像における約0.3mm)以内であるか否かを判断す
る(ステップ1206)。ここで、近接していると判断
した場合は、当該部分文字行のペアを接続し(ステップ
1207)。そうでなければ接続は行わない。以上の動
作を全ての部分文字行のペアについて行う(ステップ1
208)。
【0097】このように、上記構成を有する部分文字行
副方向接続部47では接続すべきか否かの判断が困難な
部分文字行のペアについては、画素連結矩形間の距離を
基準に判断するので、部分文字行が長くても傾きの影響
を受けずに正確な判断が可能となる。例えば、図42
(a)および図42(b)の部分文字行のペアではステ
ップ1204で準近接してるいるといる判断が下され、
ステップ1205において画素連結矩形の距離a、bが
それぞれ求められ、これらの平均値が算出され、さら
に、ステップ1206において画素連結矩形が近接して
いるか否かが判断される。図42(b)の場合は距離b
の平均値が小さいので近接していると判断されて接続さ
れる。一方、図42(a)の場合は距離aの平均値が大
きいので近接していないと判断される。そして、たとえ
画像が傾いて入力されて部分文字行間が狭くなっていて
も、画素連結矩形間の距離にはあまり影響がないので同
様の結果が得られる。なお、ここでは、準近接するとき
に最終的に接続する否かの判断を画素連結矩形間の距離
の平均値によって行ったが、これは、画素連結矩形間の
距離の小さいものから所定の順番目までのものが、所定
の閾値以下であるか否かで判断してもよい。
【0098】ところで、以上の実施形態では、名刺から
文字を抽出する場合を例に挙げており、画素連結成分の
接続のパラメータや文字行候補の分割の際の閾値等の、
任意に設定できる変数の値等は慣用されている名刺の文
字の大きさやレイアウト等から経験的、または実験的に
定めることができる。そして、この各種の変数の値は文
字行を抽出する対象が変わることによって、例えば葉書
から文字行を抽出する場合等は、名刺の場合と異なる値
が採用できることは言うまでもない。
【0099】
【発明の効果】以上のように、まず、本願発明に係る文
字行抽出方法および装置では、画像データから画素の連
結する成分の外接矩形が画素連結矩形として生成され、
文字行の主方向と副方向が判定され、生成された画素連
結矩形群が、主方向、副方向に接続されて文字行候補を
生成する。そして、文字行候補内で各画素連結矩形の相
互の位置関係から文字を構成する画素連結矩形群が抽出
され、これに外接する矩形が文字矩形として生成され、
文字行候補内での文字矩形の構成に応じて、文字行候補
が分割され、分割された文字行候補内で文字矩形を接続
して文字行が抽出される。
【0100】このように、主方向、副方向の文字行候補
を作成し、文字行候補の構成に応じて、文字行候補が分
割されて文字矩形が接続されるので、従来の方法では抽
出が困難であった、文字の大きさやピッチの異なる文字
行、行間の幅が狭い文字行、縦書き文字行や横書き文字
行が混在するような複雑なレイアウトの文書から、正確
にかつ効率よく文字行を抽出することができ、文字認識
率の向上を図ることができる。
【0101】また、本願発明に係る文字領域抽出方法で
は、画像データから画素の射影分布を生成し、射影分布
を一定の幅でグループ化し、各グループ内の射影分布の
代表値を算出し、隣接するグループの代表値間の差の最
も大きなグループ間の境界をグループ境界として求め、
このグループ境界を挟む2つのグループ内の射影分布の
差から文字領域と写真図形領域との境界を決定し、この
境界の接している射影分布の小さい側を文字領域として
抽出する。このようにして文字領域の抽出を行なうの
で、写真等が混在する文書においても、1写真領域が複
数の領域に分割されて抽出されて、その一部が文字領域
と誤って抽出されることがない。
【0102】そして、上記文字行抽出方法において、こ
の文字領域抽出方法および装置によって抽出された文字
領域を処理対象とするようにすれば、写真領域を含む文
書から文字行を抽出する際に、まず、文字領域が抽出さ
れることになるので、写真領域の一部が文字行として抽
出されることなく、容易にかつ正確に文字行を抽出する
ことができる。
【0103】また、上記文字行抽出方法および装置にお
ける画素連結矩形の接続では、主方向に重なり、かつ、
近接する画素連結矩形群を主方向に接続して主方向の部
分文字行として生成し、接続されなかった画素連結矩形
群で、所定の距離の範囲内にあるものを接続して、主方
向以外の部分文字行として生成し、部分文字行のうち、
縦横比から文字を構成する部分文字行を抽出する。そし
て、副方向に重なり、かつ、近接する文字を構成する部
分文字行群を副方向に接続して、新たな副方向の部分文
字行を生成する。さらに、副方向に重なり、かつ、近接
する主方向の部分文字行群を接続して新たな主方向の部
分文字行を生成し、主方向に重なる、主方向の部分文字
行群を主方向に接続して新たな主方向の部分文字行を生
成する。
【0104】以上のような動作により生成された部分文
字行を文字行候補とすれば、副方向の部分文字行が正確
に抽出でき、文字行が副方向に分離されるのを防ぐこと
ができ、縦書き、横書き文字行が混在する文書におい
て、両方向の文字行を容易に抽出することができる。ま
た、本願発明に係る文字行主方向抽出方法および装置で
は、処理対象の画像データの形状から仮の主方向を決定
して主方向部分文字行を生成し、生成した主方向部分文
字行の長さ、数、その基本矩形の配置等の構成から、仮
の主方向が正しいかどうかを判断し、仮の主方向が正し
いと判断されればその仮の主方向を主方向として抽出
し、仮の主方向が正しくないと判断されればその仮の主
方向に直交する方向を主方向として抽出する。
【0105】このような動作により、例えば名刺画像に
おいて行間が狭く、長さの短い文字行がかたまっている
ような場合等、主方向が通常の経験で判断される方向と
異なる場合でも正確に文字行方向を判定することができ
るだけでなく、仮の主方向が正しかった場合、生成した
部分文字行をそのまま後の処理に用いることができるの
で効率がよい。
【0106】即ち、この文字行主方向抽出方法および装
置を、上記文字行抽出方法および装置の文字行候補の生
成における主方向の判定に用いると、より正確な文字行
の抽出が可能となり、効率も上がることとなる。さら
に、上記画素連結矩形の生成における部分文字行の生成
で、副方向に重なり、かつ準近接する主方向の部分文字
行同士を抽出し、抽出された部分文字行同士間に含まれ
る画素連結矩形の距離が所定の値以下であれば、当該部
分文字行同士を接続して新たな主方向の部分文字行を生
成するような構成を加えると、対象画像が傾いて入力さ
れた場合でも、画素連結矩形間の距離で接続するか否か
を判断するので行間が狭く長い文字行同士も誤結合され
ることを防ぐことができる。
【0107】さらに、上記部分文字行の生成において、
処理対象の画像データの所定領域を予め定めておき、当
該所定領域内において、副方向に重なり、かつ、近接す
る画素連結矩形群を副方向に接続して副方向の部分文字
行として生成するようにしておけば、より精度よく、副
方向文字行を抽出することが出来る。また、本願発明に
係る文字行抽出方法および装置における文字矩形の生成
では、文字行候補を被分割領域とし、この被分割領域
を、主方向の被分割領域、副方向の被分割領域、その他
の被分割領域に分類する。そして、副方向の被分割領域
に分類された場合は、この被分割領域となっている文字
行候補を文字行として抽出し、その他の被分割領域と分
類された場合は、この被分割領域の外接矩形を文字矩形
として作成し、主方向の被分割領域であると分類された
場合は、この主方向の被分割領域に対して、主方向、副
方向に射影をとり、射影間の空白部分が所定の長さを越
える区間がある場合は、当該区間で被分割領域を分割し
てあらたな被分割領域とする。それから、主方向の非分
割領域で射影間の空白部分が所定の長さを越える区間が
ない場合に、当該被分割領域内で、各画素連結矩形の相
互の位置関係から文字を構成する画素連結矩形群を抽出
し、これに外接する矩形を文字矩形として生成する。こ
のような構成を設ければ以下のような効果を奏する。
【0108】つまり、副方向の文字行を抽出して文字行
を確定するので、文字行候補の生成において、副方向の
文字行が主方向の文字行と混在することとなっても、副
方向の文字行の抽出ができ、縦書き、横書き文字行が混
在する文書からも、より容易に両方向の文字行を抽出す
ることができる。また、主方向の文字矩形を精度よく抽
出することができることにより、文字行候補の構成も精
度よく判定することができる。
【0109】さらに、文字行候補の分割において、文字
行候補内での文字矩形の大きさの平均値と分散値のいず
れか又は両方により、文字行候補内での文字矩形の構成
を判断し、文字行候補内で文字矩形間で所定の差異を有
すると判断された場合に、所定の差異がある文字矩形間
で、文字行候補を分割するようにすれば、一つの文字行
候補内で、文字矩形の構成の異なるところで文字行候補
が分離されるので、一つの文字行候補内に異なる文字行
が含まれていても、これを分離することができる。
【0110】さらに、上記のような文字行候補の分割
で、文字行候補内での文字矩形の構成を判断する場合
に、文字行候補内での文字矩形の一辺の長さの平均値が
文字行候補の短辺の長さよりも小さく、かつ、文字矩形
の一辺の長さの分散値が所定値よりも大きければ、文字
行候補中に大小の文字矩形が存在するという判断を含
み、文字行候補中に大小の文字矩形が存在すると判断さ
れた場合に、大きい文字矩形と小さい文字矩形を挟む区
間を検索し、検索された区間で、文字行候補を分割する
こととすれば、特に、文字矩形の大きさが異なる文字行
同士が近接している文書において、文字矩形の大きさが
異なる文字行同士が誤結合されることなく、別々の文字
行として抽出することができる。
【0111】また、上記のような文字行候補の分割で、
文字行候補内での文字矩形の構成を判断する場合に、文
字行候補内での文字矩形の一辺の長さの平均値が文字行
候補の短辺の長さとほぼ同じであれば、文字行候補中の
文字矩形間に空白が存在するという判断を含み、文字行
候補中の文字矩形間に空白があると判断された場合に、
空白がある区間を検索し、検索された区間で、文字行候
補を分割するようにすれば、特に、文字の大きさが等し
い、異なる文字行同士が1列に並んでいる文書におい
て、異なる文字行同士が誤結合されることなく、別々の
文字行として抽出することができる。
【0112】そして、上記のような文字行候補の分割
で、文字行候補内での文字矩形の構成を判断する場合
に、文字行候補の短辺の長さが文字行候補内での文字矩
形の一辺の長さの平均値の2倍以上であれば、文字行候
補中に文字列が2列以上混在するという判断を含み、文
字行候補中に文字列が2列以上混在すると判断された場
合に、文字行間で段差を生じている区間を検索し、検索
された区間で、文字行候補を分割するようにすれば、特
に、文字の大きさが等しい2列の文字行が存在し、さら
に前記2列の中間的な位置に文字行が存在する文書にお
いて、中間的な位置に存在する文字行の影響により前記
2列の文字行が誤結合されることなく、別々の文字行と
して抽出することができる。
【0113】また、ここでさらに検索された区間に隣接
する文字矩形が所定の特殊な文字矩形か否かを判断し、
所定の特殊な文字矩形であると判断された場合に、当該
特殊な文字矩形を分割するようにすれば、特に、2列以
上の文字行の前に{等の特殊文字が存在する文書におい
て、特殊文字の影響により前記2列以上の文字行が誤結
合されることなく、別々の文字行として抽出することが
できる。
【0114】さらに、本願発明においては、画像データ
から画素の連結する成分の外接矩形を画素連結矩形とし
て抽出し、抽出された各画素連結矩形の位置関係から文
字を構成する部分を抽出して、これに外接する矩形を文
字矩形として生成し、生成された各文字矩形を連結する
ことによって文字行を抽出する場合に、所定の構成を有
する文字矩形をルビ矩形として抽出し、ルビ矩形の近傍
に存在する親文字行を検索し、このルビ矩形を含む、検
索された親文字行に対してルビが存在し得る範囲を決定
し、ルビが存在し得る範囲に存在するルビ矩形および文
字行を連結することによって、ルビを構成する文字行を
抽出することとしたので、文字間距離が極端に離れてい
る文字行、例えば名刺の氏名にふられているルビを、他
行の抽出精度に悪影響を及ぼすことなく、文字行として
抽出することができる。
【0115】そして、本願発明においては抽出された各
文字行について、抽出された文字行内の画素連結矩形ま
たは文字矩形の数が定められた第1の閾値よりも大きけ
れば、その文字行がノイズであると判断し、ノイズであ
ると判断された文字行を削除するようにしたので、ノイ
ズが誤って文字行として認識された場合もこれを削除す
ることができ、文字認識率の向上を図ることができる。
【0116】このノイズにより構成される文字行の削除
に際してさらに、抽出された文字行内の画素連結矩形ま
たは文字矩形の数が前記第1の閾値よりも小さく、第1
の閾値よりも小さい定められた第2の閾値よりも大きけ
れば、その文字行をノイズ文字行候補とし、ノイズ文字
行候補内の画素連結矩形または文字矩形の大きさの平均
値を算出し、この平均値が当該ノイズ文字行候補の短辺
の長さに対して所定の割合以下であれば、そのノイズ文
字行候補をノイズと判断するようにすれば、画素連結矩
形や文字矩形の数だけではノイズか否かの判断が困難な
場合に、さらに詳細な判断を行うことが可能となり、よ
り精度良くノイズによって構成される文字行を削除する
ことができる。
【図面の簡単な説明】
【図1】本発明の文字行抽出方法を用いた文字認識装置
の一例を示すブロック図である。
【図2】文字領域抽出部の構成を示すブロック図であ
る。
【図3】画素の射影分布および射影グループの一例を示
す図である。
【図4】文字行候補生成部の構成を示すブロック図であ
る。
【図5】画素連結矩形の一例を示す図である。
【図6】画素連結矩形群を接続して部分文字行を生成し
たところを示す図である。
【図7】主方向、副方向の一例を示す図である。
【図8】(a)は仮の主方向が正しい状態を示す図であ
り、(b)は仮の主方向が正しくない状態を示す図であ
る。
【図9】文字矩形生成部の構成を示すブロック図であ
る。
【図10】画素連結矩形の射影の一例を示す図である。
【図11】画素連結矩形群から文字矩形を生成したとこ
ろを示す図である。
【図12】文字行候補分割部の構成を示すブロック図で
ある。
【図13】ルビ文字行抽出部の構成を示すブロック図で
ある。
【図14】ノイズ文字行削除部の構成を示すブロック図
である。
【図15】文字領域抽出部の処理を示すフローチャート
である。
【図16】文字行抽出部の処理を示すフローチャートで
ある。
【図17】文字行候補生成部の処理を示すフローチャー
トである。
【図18】部分文字行の生成結果の例を示す図である。
【図19】文字行候補の生成過程の例を示す図である。
【図20】文字行候補の生成過程の他の例を示す図であ
る。
【図21】文字矩形生成部の処理を示すフローチャート
である。
【図22】文字矩形の生成過程の例を示す図である。
【図23】文字行候補分割部の処理を示すフローチャー
トである。
【図24】図23における文字行候補の分割1の処理を
示すフローチャートである。
【図25】文字サイズが異なる複数の文字行が存在する
文字行候補の例を示す図である。
【図26】図23における文字行候補の分割2の処理を
示すフローチャートである。
【図27】同じ文字サイズの文字行が1列のみ存在し、
かつセパレータとなる空白部分が存在する文字行候補の
例を示す図である。
【図28】図23における文字行候補の分割3の処理を
示すフローチャートである。
【図29】(a)は同じ文字サイズの文字行が2列存在
し、1/2改行文字行が存在する文字行候補の例を示す
図であり、(b)はさらに特殊文字が存在する文字行候
補の例を示す図である。
【図30】ルビ文字行抽出部の処理の例を示すフローチ
ャートである。
【図31】ルビ文字行抽出過程の例を示す図である。
【図32】ノイズ文字行削除部の処理を示すフローチャ
ートである。
【図33】文字行とノイズ文字行との違いを示す図であ
る。
【図34】副方向文字行が含まれる文字行候補におい
て、セパレータとなりうる空白部分が存在しない例を示
す図である。
【図35】長辺が主方向の名刺において、副方向の文字
行が存在する確率の高い特定領域を示す図である。
【図36】特定領域部分文字行生成部を設けた文字行候
補生成部の構成を示すブロック図である。
【図37】特定領域部分文字行生成部を設けた文字行候
補生成部の処理を示すフローチャートである。
【図38】特定領域部分文字行生成部を設けた文字行候
補生成部による部分文字行の生成過程の例を示す図であ
る。
【図39】(a)は対象画像が適切に入力された状態を
示す図であり、(b)は対象画像が傾いて入力された状
態を示す図である。
【図40】部分文字行副方向接続部の他の構成を示す図
である。
【図41】部分文字行副方向接続部の処理を示すフロー
チャートである。
【図42】部分文字行副方向接続部における画素連結矩
形間距離の例を示す図である。
【図43】従来の文字領域抽出方法による抽出過程を示
す図である。
【符号の説明】
1 画像入力部 2 文字領域抽出部 3 文字行抽出部 4 文字行候補生成部 5 文字矩形生成部 6 文字行候補分割部 7 文字矩形接続部 8 ルビ文字行抽出部 9 ノイズ文字行削除部 10 文字認識部 21 射影分布生成部 22 射影グループ生成部 23 射影グループ代表値算出部 24 グループ境界抽出部 25 文字域抽出部 41 画素連結矩形生成部 42 文字行方向判定部 42a 仮主方向決定部 42b 主方向判断部 42c 主方向抽出部 43 主方向部分文字行生成部 44 非主方向部分文字行生成部 45 部分文字行分類部 46 文字副方向接続部 47 部分文字行副方向接続部 47a 近接部分文字行副方向接続部 47b 準近接部分文字行抽出部 47c 準近接部分文字行接続部 48 部分文字行主方向接続部 49 特定領域部分文字行生成部 51 被分割領域分類部 52 副方向文字行抽出部 53 被分割領域分割部 54 文字矩形抽出部 61 文字矩形平均算出部 62 平均値比較部 63 文字矩形分散算出部 64 文字構成判定部 65 大小文字矩形間検索部 66 文字矩形間空白検索部 67 文字行段差部検索部 68 区間分割部 69 特殊文字判定部 70 特殊文字分割部 81 ルビ矩形抽出部 82 親文字行検索部 83 ルビ存在可能範囲決定部 84 ルビ文字行作成部 91 ノイズ文字行判断部 92 ノイズ文字行候補判断部 93 ノイズ文字行候補検証部 94 ノイズ文字行削除部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 吉森 亜依 広島市東区光町1丁目12番20号 株式会社 松下電器情報システム広島研究所内

Claims (33)

    【特許請求の範囲】
  1. 【請求項1】 文字行候補生成ステップと、文字矩形生
    成ステップと、文字行候補分割ステップと、文字矩形接
    続ステップとにより構成される文字行抽出方法であっ
    て、 文字行候補生成ステップが、 処理対象の画像データから画素の連結する成分の外接矩
    形を画素連結矩形として抽出する画素連結矩形生成ステ
    ップと、 前記画像データもしくは抽出された各画素連結矩形の構
    成から、主な文字行の方向を主方向、主方向に直交する
    方向を副方向として判定する文字行方向判定ステップ
    と、 各画素連結矩形を相互の位置関係に応じて主方向又は副
    方向に接続することにより文字行候補を生成する画素連
    結矩形接続ステップとからなり、 文字矩形生成ステップが、 文字行候補内で、各画素連結矩形の相互の位置関係から
    文字を構成する画素連結矩形群を抽出し、これに外接す
    る矩形を文字矩形として生成するステップであり、 文字行候補分割ステップが、 文字行候補内での文字矩形群の構成に応じて、文字行候
    補を分割するステップであり、 文字矩形接続ステップが、 分割された文字行候補内で文字矩形を接続して文字行と
    するステップである、 文字行抽出方法。
  2. 【請求項2】 処理対象の画像データから射影分布を生
    成する射影分布生成ステップと、 射影分布を所定の幅ごとにグループ化する射影グループ
    生成ステップと、 生成された各グループ内の射影分布の代表値を算出する
    射影グループ代表値算出ステップと、 隣接する前記射影分布のグループの代表値間の差の最も
    大きなグループ間の境界をグループ境界として求めるグ
    ループ境界抽出ステップと、 このグループ境界を挟む2つのグループ内の射影分布の
    差から文字領域と写真図形領域との境界を決定し、当該
    境界の接している射影分布の小さい側を文字領域として
    抽出する文字領域抽出ステップとよりなる文字領域抽出
    方法。
  3. 【請求項3】 請求項1記載の文字行抽出方法における
    処理対象を請求項2記載の文字領域抽出方法により抽出
    された文字領域とした文字行抽出方法。
  4. 【請求項4】 前記画素連結矩形接続ステップが、 主方向に重なり、かつ、近接する画素連結矩形群を主方
    向に接続して主方向の部分文字行として生成する主方向
    部分文字行生成ステップと、 主方向部分文字行生成ステップで、接続されなかった画
    素連結矩形群で、所定の距離の範囲内にあるものを接続
    して、主方向以外の部分文字行として生成する非主方向
    部分文字行生成ステップと、 部分文字行のうち、縦横比から文字を構成する部分文字
    行を抽出する文字部分文字行抽出ステップと、 副方向に重なり、かつ、近接する文字を構成する部分文
    字行群を副方向に接続して、新たな副方向の部分文字行
    を生成する部分文字行接続第1ステップと、 副方向に重なり、かつ、近接する主方向の部分文字行群
    を接続して新たな主方向の部分文字行を生成する部分文
    字行接続第2ステップと、 主方向に重なる、主方向の部分文字行群を主方向に接続
    して新たな主方向の部分文字行を生成する部分文字行接
    続第3ステップと、 より生成された部分文字行を文字行候補とする請求項1
    記載の文字行抽出方法。
  5. 【請求項5】 処理対象の画像データから画素の連結す
    る成分の外接矩形を画素連結矩形として抽出し、この抽
    出した画素連結矩形を用いて処理対象の画像の主方向を
    抽出する方法であって、 処理対象の画像データの形状から仮の主方向を決定する
    仮主方向決定ステップと、 主方向に重なり、かつ、近接する画素連結矩形群を主方
    向に接続して主方向の部分文字行として生成する主方向
    部分文字行生成ステップと、 生成された各主方向の部分文字行の構成から、仮主方向
    決定ステップで決定した仮の主方向が正しいかどうかを
    判断する主方向判断ステップと主方向判断ステップで仮
    の主方向が正しいと判断されればその仮の主方向を主方
    向として抽出し、仮の主方向が正しくないと判断されれ
    ばその仮の主方向に直交する方向を主方向として抽出す
    る主方向抽出ステップとを有する文字行主方向抽出方
    法。
  6. 【請求項6】 前記文字行候補生成ステップが、請求項
    5記載の文字行主方向抽出方法を用いて主方向を判定
    し、 前記主方向部分文字行生成ステップが、前記文字行主方
    向抽出方法の前記主方向判断ステップによって仮の主方
    向が正しくないと判断された場合のみ、主方向の部分文
    字行を生成する請求項4記載の文字行抽出方法。
  7. 【請求項7】 前記部分文字行接続第2ステップにさら
    に、 副方向に重なり、かつ、準近接する主方向の部分文字行
    同士を抽出する準近接部分文字行抽出ステップと、 この準近接部分文字行抽出ステップで抽出された部分文
    字行同士間における各部分文字行に含まれる画素連結矩
    形の距離が所定の値以下であれば、当該部分文字行同士
    を接続し新たな主方向の部分文字行を生成する準近接部
    分文字行接続ステップと、 を設けた請求項4又は6記載の文字行抽出方法。
  8. 【請求項8】 請求項4、6又は7記載の文字行抽出方
    法において、主方向接続ステップの前にさらに、 処理対象の画像データの所定領域を予め定めておき、当
    該所定領域内において、副方向に重なり、かつ、近接す
    る画素連結矩形群を副方向に接続して副方向の部分文字
    行として生成する特定領域部分文字行生成ステップを設
    けた文字行抽出方法。
  9. 【請求項9】 前記文字矩形生成ステップが、 文字行候補を被分割領域とし、この被分割領域を、主方
    向の被分割領域、副方向の被分割領域、その他の被分割
    領域に分類する被分割領域分類ステップと、 被分割領域分類ステップで、副方向の被分割領域である
    と分類された場合は、この被分割領域となっている文字
    行候補を文字行として抽出する副方向文字行抽出ステッ
    プと、 被分割領域分類ステップで、その他の被分割領域と分類
    された場合は、この被分割領域の外接矩形を文字矩形と
    して作成する単体文字矩形作成ステップと、 被分割領域分類ステップで、主方向の被分割領域である
    と分類された場合は、この主方向の被分割領域に対し
    て、主方向、副方向に射影をとり、射影間の空白部分が
    所定の長さを越える区間がある場合は、当該区間で被分
    割領域を分割してあらたな被分割領域とする被分割領域
    分割ステップと、 被分割領域分割ステップで、射影間の空白部分が所定の
    長さを越える区間がない場合に、当該被分割領域内で、
    各画素連結矩形の相互の位置関係から文字を構成する画
    素連結矩形群を抽出し、これに外接する矩形を文字矩形
    として生成する主方向文字矩形生成ステップと、 を有する請求項1、3、4、6〜8のいずれか1項に記
    載の文字行抽出方法。
  10. 【請求項10】 前記文字行候補分割ステップが、 文字行候補内での文字矩形の大きさの平均値と分散値の
    いずれか又は両方により、文字行候補内での文字矩形の
    構成を判断する文字矩形構成判断ステップと、 文字矩形構成判断ステップにより、文字行候補内で文字
    矩形間に所定の差異を有すると判断された場合に、所定
    の差異がある文字矩形間で、文字行候補を分割する文字
    矩形間分割ステップと、 を有する請求項1、3、4、6〜9のいずれか1項に記
    載の文字行抽出方法。
  11. 【請求項11】 前記文字矩形構成判断ステップが、 文字行候補内での文字矩形の一辺の長さの平均値が文字
    行候補の短辺の長さよりも小さく、かつ、文字矩形の一
    辺の長さの分散値が所定値よりも大きければ、文字行候
    補中に大小の文字矩形が存在するという判断を含み、 前記文字矩形間分割ステップが、 文字矩形判断ステップにより文字行候補中に大小の文字
    矩形が存在すると判断された場合に、大きい文字矩形と
    小さい文字矩形を挟む区間を検索する大小文字矩形間検
    索ステップと、 大小文字矩形間検索ステップで検索された区間で、文字
    行候補を分割する区間分割ステップと、 を有する請求項1、3、4、6〜10のいずれか1項に
    記載の文字行抽出方法。
  12. 【請求項12】 前記文字矩形構成判断ステップが、 文字行候補内での文字矩形の一辺の長さの平均値が文字
    行候補の短辺の長さとほぼ同じであれば、文字行候補中
    の文字矩形間に空白が存在するという判断を含み、 前記文字矩形間分割ステップが、 文字矩形判断ステップにより文字行候補中の文字矩形間
    に空白があると判断された場合に、空白がある区間を検
    索する文字矩形間空白検索ステップと、 文字矩形間空白検索ステップで検索された区間で、文字
    行候補を分割する区間分割ステップとを有する、 請求項1、3、4、6〜11のいずれか1項に記載の文
    字行抽出方法。
  13. 【請求項13】 前記文字矩形構成判断ステップが、 文字行候補の短辺の長さが文字行候補内での文字矩形の
    一辺の長さの平均値の2倍以上であれば、文字行候補中
    に文字列が2列以上混在するという判断を含み、 前記文字矩形間分割ステップが、 文字矩形判断ステップにより文字行候補中に文字列が2
    列以上混在すると判断された場合に、文字行間で段差を
    生じている区間を検索する文字行段差部検索ステップ
    と、 文字行段差部検索ステップで検索された区間で、文字行
    候補を分割する区間分割ステップとを有する、 請求項1、3、4、6〜12のいずれか1項に記載の文
    字行抽出方法。
  14. 【請求項14】 請求項13記載の文字行抽出方法にお
    いて、 前記文字行段差部検索ステップで検索された区間に隣接
    する文字矩形が所定の特殊な文字矩形か否かを判断する
    特殊文字判定ステップと、 特殊文字判定ステップで所定の特殊な文字矩形であると
    判断された場合は、当該特殊な文字矩形を分割する、特
    殊文字分割ステップと、 をさらに有する請求項13記載の文字行抽出方法。
  15. 【請求項15】 画像データから画素の連結する成分の
    外接矩形を画素連結矩形として抽出し、抽出された各画
    素連結矩形の位置関係から文字を構成する部分を抽出し
    て、これに外接する矩形を文字矩形として生成し、生成
    された各文字矩形を連結することによって文字行を抽出
    する文字行抽出方法において、 所定の構成を有する文字矩形をルビ矩形として抽出す
    る、ルビ矩形抽出ステップと、 ルビ矩形の近傍に存在する文字行を検索する親文字行検
    索ステップと、 このルビ矩形を含む、検索された文字行に対してルビが
    存在し得る範囲を決定するルビ存在可能範囲決定ステッ
    プと、 ルビが存在し得る範囲に存在するルビ矩形および文字行
    を連結することによって、ルビを構成する文字行を抽出
    するルビ文字行抽出ステップと、 を有することを特徴とする文字行抽出方法。
  16. 【請求項16】 画像データから画素の連結する成分の
    外接矩形を画素連結矩形として抽出し、抽出された各画
    素連結矩形の位置関係から文字を構成する部分を抽出し
    て、これに外接する矩形を文字矩形として生成し、生成
    された各文字矩形を連結することによって文字行を抽出
    する文字行抽出方法において、 抽出された文字行内の画素連結矩形または文字矩形の数
    が定められた第1の閾値よりも大きければ、その文字行
    がノイズであると判断するノイズ文字行判断ステップ
    と、 ノイズと判断された文字行を削除するノイズ文字行削除
    ステップとを有することを特徴とする文字行抽出方法。
  17. 【請求項17】 請求項16記載の文字行抽出方法にお
    いて、さらに、 抽出された文字行内の画素連結矩形または文字矩形の数
    が前記第1の閾値よりも小さく、第1の閾値よりも小さ
    い定められた第2の閾値よりも大きければ、その文字行
    をノイズ文字行候補とするノイズ文字行候補判断ステッ
    プと、 ノイズ文字行候補内の画素連結矩形または文字矩形の大
    きさの平均値を算出し、この平均値が予め定められる所
    定の値以下であれば、そのノイズ文字行候補をノイズと
    判断するノイズ文字行候補検証ステップとを設けた文字
    行抽出方法。
  18. 【請求項18】 文字行候補生成手段と、文字矩形生成
    手段と、文字行候補分割手段と、文字矩形接続手段とに
    より構成される文字行抽出手段であって、 文字行候補生成手段が、 処理対象の画像データから画素の連結する成分の外接矩
    形を画素連結矩形として抽出する画素連結矩形生成手段
    と、 前記画像データもしくは抽出された各画素連結矩形の構
    成から、主な文字行の方向を主方向、主方向に直交する
    方向を副方向として判定する文字行方向判定手段と、 各画素連結矩形を相互の位置関係に応じて主方向又は副
    方向に接続することにより文字行候補を生成する画素連
    結矩形接続手段とからなり、 文字矩形生成手段が、 文字行候補内で、各画素連結矩形の相互の位置関係から
    文字を構成する画素連結矩形群を抽出し、これに外接す
    る矩形を文字矩形として生成する手段であり、 文字行候補分割手段が、 文字行候補内での文字矩形群の構成に応じて、文字行候
    補を分割する手段であり、 文字矩形接続手段が、 分割された文字行候補内で文字矩形を接続して文字行と
    する手段である、 文字行抽出装置。
  19. 【請求項19】 処理対象の画像データから射影分布を
    生成する射影分布生成手段と、 射影分布を所定の幅ごとにグループ化する射影グループ
    生成手段と、 生成された各グループ内の射影分布の代表値を算出する
    射影グループ代表値算出手段と、 隣接する前記射影分布のグループの代表値間の差の最も
    大きなグループ間の境界をグループ境界として求めるグ
    ループ境界抽出手段と、 このグループ境界を挟む2つのグループ内の射影分布の
    差から文字領域と写真図形領域との境界を決定し、当該
    境界の接している射影分布の小さい側を文字領域として
    抽出する文字域抽出手段とよりなる文字領域抽出装置。
  20. 【請求項20】 前記画素連結矩形接続手段が、 主方向に重なり、かつ、近接する画素連結矩形群を主方
    向に接続して主方向の部分文字行として生成する主方向
    部分文字行生成手段と、 主方向部分文字行生成手段で、接続されなかった画素連
    結矩形群で、所定の距離の範囲内にあるものを接続し
    て、主方向以外の部分文字行として生成する非主方向部
    分文字行生成手段と、 部分文字行のうち、縦横比から文字を構成する部分文字
    行を抽出する文字部分文字行抽出手段と、 副方向に重なり、かつ、近接する文字を構成する部分文
    字行群を副方向に接続して、新たな副方向の部分文字行
    を生成する文字副方向接続手段と、 副方向に重なり、かつ、近接する主方向の部分文字行群
    を接続して新たな主方向の部分文字行を生成する部分文
    字行副方向接続手段と、 主方向に重なる、主方向の部分文字行群を主方向に接続
    して新たな主方向の部分文字行を生成する部分文字行主
    方向接続手段と、 より生成された部分文字行を文字行候補とする請求項1
    8記載の文字行抽出装置。
  21. 【請求項21】 処理対象の画像データから画素の連結
    する成分の外接矩形を画素連結矩形として抽出し、この
    抽出した画素連結矩形を用いて処理対象の画像の主方向
    を抽出する文字行主方向抽出装置であって、 処理対象の画像データの形状から仮の主方向を決定する
    仮主方向決定手段と、 主方向に重なり、かつ、近接する画素連結矩形群を主方
    向に接続して主方向の部分文字行として生成する主方向
    部分文字行生成手段と、 生成された各主方向の部分文字行の構成から、仮主方向
    決定手段で決定した仮の主方向が正しいかどうかを判断
    する主方向判断手段と主方向判断手段で仮の主方向が正
    しいと判断されればその仮の主方向を主方向として抽出
    し、仮の主方向が正しくないと判断されればその仮の主
    方向に直交する方向を主方向として抽出する主方向抽出
    手段とを有する文字行主方向抽出装置。
  22. 【請求項22】 前記文字行候補生成手段が、請求項2
    1記載の文字行主方向判断装置であり、 前記主方向部分文字行生成手段が、前記文字行主方向判
    断装置の前記主方向判断手段によって仮の主方向が正し
    くないと判断された場合のみ、主方向の部分文字行を生
    成する請求項20記載の文字行抽出装置。
  23. 【請求項23】 前記部分文字行主方向接続手段にさら
    に、 副方向に重なり、かつ、準近接する主方向の部分文字行
    同士を抽出する準近接部分文字行抽出手段と、 この準近接部分文字行抽出手段で抽出された部分文字行
    同士間における各部分文字行に含まれる画素連結矩形の
    距離が所定の値以下であれば、当該部分文字行同士を接
    続し新たな主方向の部分文字行を生成する準近接部分文
    字行接続手段と、 を設けた請求項20又は22記載の文字行抽出装置。
  24. 【請求項24】 請求項20、22又は23記載の文字
    行抽出装置にさらに、 処理対象の画像データの予め定
    められた所定領域内において、副方向に重なり、かつ、
    近接する画素連結矩形群を副方向に接続して副方向の部
    分文字行として生成する特定領域部分文字行生成手段を
    設けた文字行抽出装置。
  25. 【請求項25】 前記文字矩形生成手段が、 文字行候補を被分割領域とし、この被分割領域を、主方
    向の被分割領域、副方向の被分割領域、その他の被分割
    領域に分類する被分割領域分類手段と、 被分割領域分類手段で、副方向の被分割領域であると分
    類された場合は、この被分割領域となっている文字行候
    補を文字行として抽出する副方向文字行抽出手段と、 被分割領域分類手段で、その他の被分割領域と分類され
    た場合は、この被分割領域の外接矩形を文字矩形として
    作成する単体文字矩形作成手段と、 被分割領域分類手段で、主方向の被分割領域であると分
    類された場合は、この主方向の被分割領域に対して、主
    方向、副方向に射影をとり、射影間の空白部分が所定の
    長さを越える区間がある場合は、当該区間で被分割領域
    を分割してあらたな被分割領域とする被分割領域分割手
    段と、 被分割領域分割手段で、射影間の空白部分が所定の長さ
    を越える区間がない場合に、当該被分割領域内で、各画
    素連結矩形の相互の位置関係から文字を構成する画素連
    結矩形群を抽出し、これに外接する矩形を文字矩形とし
    て生成する主方向文字矩形生成手段と、 を有する請求項17、20、22〜24のいずれか1項
    に記載の文字行抽出装置。
  26. 【請求項26】 文字行候補分割手段が、 文字行候補内での文字矩形の大きさの平均値と分散値の
    いずれか又は両方により、文字行候補内での文字矩形の
    構成を判断する文字矩形構成判断手段と、 文字矩形構成判断手段により、文字行候補内で文字矩形
    間に所定の差異を有すると判断された場合に、所定の差
    異がある文字矩形間で、文字行候補を分割する文字矩形
    間分割手段と、 を有する請求項17、20、22〜25のいずれか1項
    に記載の文字行抽出装置。
  27. 【請求項27】 前記文字矩形構成判断手段が、 文字行候補内での文字矩形の一辺の長さの平均値が文字
    行候補の短辺の長さよりも小さく、かつ、文字矩形の一
    辺の長さの分散値が所定値よりも大きければ、文字行候
    補中に大小の文字矩形が存在するという判断を行い、 前記文字矩形間分割手段が、 文字矩形判断手段により文字行候補中に大小の文字矩形
    が存在すると判断された場合に、大きい文字矩形と小さ
    い文字矩形を挟む区間を検索する大小文字矩形間検索手
    段と、 大小文字矩形間検索手段で検索された区間で、文字行候
    補を分割する区間分割手段と、 を有する請求項17、20、22〜26のいずれか1項
    に記載の文字行抽出装置。
  28. 【請求項28】 前記文字矩形構成判断手段が、 文字行候補内での文字矩形の一辺の長さの平均値が文字
    行候補の短辺の長さとほぼ同じであれば、文字行候補中
    の文字矩形間に空白が存在するという判断を行い、 前記文字矩形間分割手段が、 文字矩形判断手段により文字行候補中の文字矩形間に空
    白があると判断された場合に、空白がある区間を検索す
    る文字矩形間空白検索手段と、 文字矩形間空白検索手段で検索された区間で、文字行候
    補を分割する区間分割手段とを有する、 請求項17、20、22〜27のいずれか1項に記載の
    文字行抽出装置。
  29. 【請求項29】 前記文字矩形構成判断手段が、 文字行候補の短辺の長さが文字行候補内での文字矩形の
    一辺の長さの平均値の2倍以上であれば、文字行候補中
    に文字列が2列以上混在するという判断を行い、 前記文字矩形間分割手段が、 文字矩形判断手段により文字行候補中に文字列が2列以
    上混在すると判断された場合に、文字行間で段差を生じ
    ている区間を検索する文字行段差部検索手段と、 文字行段差部検索手段で検索された区間で、文字行候補
    を分割する区間分割手段とを有する、 請求項17、20、22〜28のいずれか1項に記載の
    文字行抽出装置。
  30. 【請求項30】 請求項29記載の文字行抽出装置にお
    いて、さらに、 前記文字行段差部検索手段で検索された区間に隣接する
    文字矩形が所定の特殊な文字矩形か否かを判断する特殊
    文字判定手段と、 特殊文字判定手段で所定の特殊な文字矩形であると判断
    された場合は、当該特殊な文字矩形を分割する、特殊文
    字分割手段と、 を設けた文字行抽出装置。
  31. 【請求項31】 画像データから画素の連結する成分の
    外接矩形を画素連結矩形として抽出し、抽出された各画
    素連結矩形の位置関係から文字を構成する部分を抽出し
    て、これに外接する矩形を文字矩形として生成し、生成
    された各文字矩形を連結することによって文字行を抽出
    する文字行抽出装置において、 所定の構成を有する文字矩形をルビ矩形として抽出す
    る、ルビ矩形抽出手段と、 ルビ矩形の近傍に存在する文字行を検索する親文字行検
    索手段と、 このルビ矩形を含む、検索された文字行に対してルビが
    存在し得る範囲を決定するルビ存在可能範囲決定手段
    と、 ルビが存在し得る範囲に存在するルビ矩形および文字行
    を連結することによって、ルビを構成する文字行を抽出
    するルビ文字行抽出手段と、 を有することを特徴とする文字行抽出装置。
  32. 【請求項32】 画像データから画素の連結する成分の
    外接矩形を画素連結矩形として抽出し、抽出された各画
    素連結矩形の位置関係から文字を構成する部分を抽出し
    て、これに外接する矩形を文字矩形として生成し、生成
    された各文字矩形を連結することによって文字行を抽出
    する文字行抽出装置において、 抽出された文字行内の画素連結矩形または文字矩形の数
    が定められた第1の閾値よりも大きければ、その文字行
    がノイズであると判断するノイズ文字行判断手段と、 ノイズと判断された文字行を削除するノイズ文字行削除
    手段とを有することを特徴とする文字行抽出装置。
  33. 【請求項33】 請求項32記載の文字行抽出装置にお
    いて、さらに、 抽出された文字行内の画素連結矩形または文字矩形の数
    が前記第1の閾値よりも小さく、第1の閾値よりも小さ
    い定められた第2の閾値よりも大きければ、その文字行
    をノイズ文字行候補とするノイズ文字行候補判断手段
    と、 ノイズ文字行候補内の画素連結矩形または文字矩形の大
    きさの平均値を算出し、この平均値が予め定められる所
    定の値以下であれば、そのノイズ文字行候補をノイズと
    判断するノイズ文字行候補検証手段とを設けた文字行抽
    出装置。
JP28260396A 1996-05-13 1996-10-24 文字行抽出方法および装置 Expired - Fee Related JP3837193B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28260396A JP3837193B2 (ja) 1996-05-13 1996-10-24 文字行抽出方法および装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11806296 1996-05-13
JP8-118062 1996-05-13
JP28260396A JP3837193B2 (ja) 1996-05-13 1996-10-24 文字行抽出方法および装置

Publications (2)

Publication Number Publication Date
JPH1031716A true JPH1031716A (ja) 1998-02-03
JP3837193B2 JP3837193B2 (ja) 2006-10-25

Family

ID=26456067

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28260396A Expired - Fee Related JP3837193B2 (ja) 1996-05-13 1996-10-24 文字行抽出方法および装置

Country Status (1)

Country Link
JP (1) JP3837193B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1063776A (ja) * 1996-08-16 1998-03-06 Fujitsu Ltd 文字列方向推定方法および装置
US6332046B1 (en) 1997-11-28 2001-12-18 Fujitsu Limited Document image recognition apparatus and computer-readable storage medium storing document image recognition program
US6701008B1 (en) * 1999-01-19 2004-03-02 Ricoh Company, Ltd. Method, computer readable medium and apparatus for extracting characters from color image data
JP2009141597A (ja) * 2007-12-05 2009-06-25 Konica Minolta Business Technologies Inc 画像処理装置、文字領域特定方法、および文字領域特定プログラム
US8457404B2 (en) 2010-08-24 2013-06-04 Fuji Xerox Co., Ltd. Image processing apparatus, computer readable medium for image processing and computer data signal for image processing
WO2014050481A1 (ja) * 2012-09-26 2014-04-03 富士フイルム株式会社 文書画像処理装置ならびにその動作制御方法およびその動作制御プログラム
JP2017111720A (ja) * 2015-12-18 2017-06-22 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2017194832A (ja) * 2016-04-20 2017-10-26 京セラドキュメントソリューションズ株式会社 画像処理装置
JP2017204270A (ja) * 2016-05-10 2017-11-16 凸版印刷株式会社 文字列領域・文字矩形抽出装置、文字列領域・文字矩形抽出方法、およびプログラム
JP2019102061A (ja) * 2017-11-30 2019-06-24 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド テキスト線の区分化方法
KR102138748B1 (ko) * 2019-02-08 2020-07-28 네이버 주식회사 라인 단위의 문자열을 검출 및 정렬하기 위한 방법 및 시스템

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7338159B2 (ja) * 2019-01-24 2023-09-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1063776A (ja) * 1996-08-16 1998-03-06 Fujitsu Ltd 文字列方向推定方法および装置
US6332046B1 (en) 1997-11-28 2001-12-18 Fujitsu Limited Document image recognition apparatus and computer-readable storage medium storing document image recognition program
US6577763B2 (en) 1997-11-28 2003-06-10 Fujitsu Limited Document image recognition apparatus and computer-readable storage medium storing document image recognition program
US6701008B1 (en) * 1999-01-19 2004-03-02 Ricoh Company, Ltd. Method, computer readable medium and apparatus for extracting characters from color image data
JP2009141597A (ja) * 2007-12-05 2009-06-25 Konica Minolta Business Technologies Inc 画像処理装置、文字領域特定方法、および文字領域特定プログラム
US8457404B2 (en) 2010-08-24 2013-06-04 Fuji Xerox Co., Ltd. Image processing apparatus, computer readable medium for image processing and computer data signal for image processing
WO2014050481A1 (ja) * 2012-09-26 2014-04-03 富士フイルム株式会社 文書画像処理装置ならびにその動作制御方法およびその動作制御プログラム
JP2017111720A (ja) * 2015-12-18 2017-06-22 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2017194832A (ja) * 2016-04-20 2017-10-26 京セラドキュメントソリューションズ株式会社 画像処理装置
JP2017204270A (ja) * 2016-05-10 2017-11-16 凸版印刷株式会社 文字列領域・文字矩形抽出装置、文字列領域・文字矩形抽出方法、およびプログラム
JP2019102061A (ja) * 2017-11-30 2019-06-24 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド テキスト線の区分化方法
KR102138748B1 (ko) * 2019-02-08 2020-07-28 네이버 주식회사 라인 단위의 문자열을 검출 및 정렬하기 위한 방법 및 시스템

Also Published As

Publication number Publication date
JP3837193B2 (ja) 2006-10-25

Similar Documents

Publication Publication Date Title
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
US5907631A (en) Document image processing method and system having function of determining body text region reading order
EP0632402B1 (en) Method for image segmentation and classification of image elements for document processing
JP3359095B2 (ja) 画像処理方法及び装置
Antonacopoulos Page segmentation using the description of the background
US6006240A (en) Cell identification in table analysis
US20010041006A1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JPH0620092A (ja) 文書画像の領域識別方法
JP3837193B2 (ja) 文字行抽出方法および装置
JP3411472B2 (ja) パターン抽出装置
JP4391704B2 (ja) 多値画像から二値画像を生成する画像処理装置および方法
KR101937398B1 (ko) 고문서의 이미지 데이터에서의 문자 추출 시스템 및 이를 이용한 문자 추출 방법
JP4450888B2 (ja) 帳票認識方法
JP4856235B2 (ja) 帳票認識方法及び帳票認識装置
JP2926066B2 (ja) 表認識装置
JPH0950527A (ja) 枠抽出装置及び矩形抽出装置
JP3285686B2 (ja) 領域分割方法
JPH08320914A (ja) 表認識方法および装置
JP3607753B2 (ja) 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置
JP4867894B2 (ja) 画像認識装置、画像認識方法及びプログラム
Nguyen et al. Enhanced character segmentation for format-free Japanese text recognition
JP3187895B2 (ja) 文字領域抽出方法
JP2001109887A (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2796561B2 (ja) 表形式文書認識方式

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060731

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090804

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100804

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110804

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110804

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120804

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130804

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees