JP2004178397A - 文書画像の向きの判定方法及び同補正方法 - Google Patents
文書画像の向きの判定方法及び同補正方法 Download PDFInfo
- Publication number
- JP2004178397A JP2004178397A JP2002345699A JP2002345699A JP2004178397A JP 2004178397 A JP2004178397 A JP 2004178397A JP 2002345699 A JP2002345699 A JP 2002345699A JP 2002345699 A JP2002345699 A JP 2002345699A JP 2004178397 A JP2004178397 A JP 2004178397A
- Authority
- JP
- Japan
- Prior art keywords
- character
- document image
- orientation
- character line
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
【課題】判定精度が高く、しかも文字認識処理が不要な文書画像の向きの判定方法及び同補正方法を提供する。
【解決手段】文書画像データから文字行または文字列を識別する工程と、識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、決定した文字行または文字列を用いて文書画像の向きを判定する工程と、を備えている。補正方法は、さらに、判定結果に応じて文書画像の向きを補正する工程を備えている。
【選択図】 図5
【解決手段】文書画像データから文字行または文字列を識別する工程と、識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、決定した文字行または文字列を用いて文書画像の向きを判定する工程と、を備えている。補正方法は、さらに、判定結果に応じて文書画像の向きを補正する工程を備えている。
【選択図】 図5
Description
【0001】
【発明の属する技術分野】
この発明は、例えばスキャナ装置等によって読み取られた文書画像の向きを判定する文書画像の向きの判定方法、及び判定結果に応じて正しい向きに補正する補正方法に関する。
【0002】
【従来の技術】
文書原稿をスキャナ等により読取入力する場合、原稿の向きが上下で逆になっていると、読み取られた画像も上下逆になる。また、自動原稿送り装置等で縦向き原稿と横向き原稿とが混在していると、読み取った画像も90度回転したものが含まれることになる。この場合、読み取った画像の向きをユーザがコンピュータ等の画面上で確認し、必要に応じて画像を正しい向きに回転することが行われているが、操作が面倒であった。
【0003】
そこで、読み取った文書画像の向きを自動的に判定する方法として、抽出した文字行の両端の揃いを比較(具体的には文字行の基準位置からのずれ量の総和を比較)して読みの方向(画像の向き)を判定し、これに基づいて画像処理を行う方法が提案されている(例えば特許文献1参照)。
【0004】
また、抽出した文字行を0度、90度、180度、270度回転して文字認識した結果を比較し、画像の向きを判定して補正する方法も提案されている(例えば特許文献2参照)。
【0005】
【特許文献1】
特開平10−93772号公報の特許請求の範囲
【0006】
【特許文献2】
特開平11−219409号公報の特許請求の範囲、段落番号0069
【0007】
【発明が解決しようとする課題】
しかしながら、上記特許文献1に記載された方法では、文書原稿の中に右揃え行が混在していると、基準位置からのずれ量が右揃え行の方が大きくなるため、正立している画像を180度回転していると誤判定するという問題があった。
【0008】
また、上記特許文献2に記載された方法では、文字認識が必要であることから、処理が複雑になるとか処理速度が遅くなる恐れがあるといった問題があった。
【0009】
この発明は、このような技術的背景に鑑みてなされたものであって、判定精度が高く、しかも文字認識処理が不要な文書画像の向きの判定方法及び同補正方法の提供を課題とする。
【0010】
【課題を解決するための手段】
上記課題は、文書画像データから文字行または文字列を識別する工程と、識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、決定した文字行または文字列を用いて文書画像の向きを判定する工程と、を備えたことを特徴とする文書画像の向きの判定方法によって解決される。
【0011】
この判定方法では、文書画像データから文字行または文字列を識別し、識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判定対象となる文字行または文字列を決定し、決定した文字行または文字列を用いて文書画像の向きを判定する。
【0012】
従って、例えば、横読み文書原稿の中に長さの短い右揃え行や、高さの高いあるいは低い文字行や、文字行の間隔の極端に小さいもの等が含まれている場合や、縦読み文書原稿の中に長さの短い下揃え列や、幅の大きいあるいは小さい文字列や、文字列の間隔の極端に小さいもの等が含まれている場合には、これらの文字行や文字列が判定対象から除外され、文書画像の向きについて精度の高い判定が行われる。しかも、判定に際して文字認識処理は不要である。
【0013】
また、前記課題は、文書画像データから文字行または文字列を識別する工程と、識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、決定した文字行または文字列を用いて文書画像の向きを判定する工程と、判定結果に応じて文書画像の向きを補正する工程と、を備えたことを特徴とする文書画像の向きの補正方法によっても解決される。
【0014】
この補正方法では、前記の判定方法で文書画像の向きについての精度の高い判定が行われ、その判定結果に応じて文書画像の向きが補正されるから、文書画像の正しい向きへの補正を高い精度で行うことができる。
【0015】
【発明の実施の形態】
以下、この発明の一実施形態を説明する。
【0016】
図1は、この発明の一実施形態に係る文書画像の向き判定・補正装置の構成を示すブロック図である。なお、この実施形態では、横読み文書原稿の画像の向きを判定し、補正する場合を示している。
【0017】
図1に示すように、前記文書画像の向き判定・補正装置は、画像データ入力部1、CPU2、主メモリ3、画像メモリ4、データ蓄積部5、画像処理部6、操作部7、表示部8、プリンタ部9が、バスライン10にそれぞれ接続されている。
【0018】
前記画像データ入力部1は、文書画像を入力するためのものである。この実施形態では、画像データ入力部1は画像読取装置を備え、文書原稿を読み取って画像データに変換するものとなされている。なお、文書画像データがネットワークを介して送信されてくるときには、前記入力部は送信されてきた文書画像データを受信して入力する受信部として機能するように構成しても良い。
【0019】
前記CPU2は、装置全体を統括的に制御するものであり、例えば画像データ入力部1で読み取った文書画像データをデータ蓄積部5に保存したのち画像メモリ4に展開したり、画像メモリ4に展開した画像データを画像処理部6に前処理させたり、ユーザによる操作部7からの出力指令に基づいて、画像データをプリンタ部9でプリントさせる等の制御を行う。さらにこの実施形態では、CPU2は後述するように、文書画像データから文字行を識別して画像の向きの判定対象となる文字行を決定したり、文書画像の向きを判定したり、判定結果に基づいて文書画像の向きを補正する機能をも有する。
【0020】
前記主メモリ3は、CPU2が実行するためのプログラムを記憶したり、CPU2の動作時の作業領域となるものである。
【0021】
前記画像メモリ4は、画像処理部6による画像処理やCPU2による文書画像の向きの判定及び補正処理に際して、画像データ入力部1で入力された文書画像データ等を記憶するものである。
【0022】
前記データ蓄積部5は各種のデータを蓄積するものであり、例えばハードディスク装置等からなる。
【0023】
前記画像処理部6は、前記CPU2の指令に基づいて、画像データ入力部1で入力された文書画像データに対して、二値化やノイズ除去等の前処理を実施するものである。
【0024】
前記操作部7は、ユーザによる各種の指示を入力操作するものであり、例えばキーボード、マウス、操作パネル等により構成されている。
【0025】
前記表示部8は、例えばユーザが指示する操作内容、文書画像の向きの判定結果、向き補正後の文書画像を等を表示するものであり、CRTディスプレイ、液晶パネル等により構成されている。
【0026】
前記プリンタ部9は、必要に応じて、向きを補正された文書画像データ等をプリントするものである。なお、補正された文書画像データをネットワークを介して他のコンピュータ等に転送するように構成しても良い。
【0027】
次に、図1に示した文書画像の向き判定・補正装置を用いた文書画像の向きの判定方法及び補正方法について説明する。
【0028】
図2は、右揃えの行が混在する文書原稿の例を示している。白矩形が右揃えの文字行12を示し、網掛け矩形が左揃えの文字行11を示している。また、左右の波線は文字行の端部の位置を示している。この例では、日付や会社名等右揃えの文字行が2行続いており、従来の判定方法では方向が逆であると判定されてしまう。この場合、一定の長さ以上の文字行を向き判定対象とすることで、長さの短い右揃えの文字行2行が判定対象からはずれる。その結果、正しい判定が可能となる。
【0029】
図3は、フッタ部分に右揃えの小文字タイトルやページ番号等が存在している文書原稿の例を示している。下端部の白矩形が右揃えの文字行14を示し、網掛け矩形が左揃えの文字行13を示している。また、左右の波線は文字行の端部の位置を示している。この例においても、従来の判定方法では方向が逆であると判定されてしまうが、同じ段落内にある文字行を向き判定対象とすることで、段落外にある右揃えの文字行が判定対象からはずれ、正しい判定が可能となる。
【0030】
図4は、図1に示した文書画像の向き判定・補正装置のCPU2が実行する判定及び補正処理のメインルーチンを示すフローチャートである。なお、以下の説明及び図面において、ステップを「S」と略記する。
【0031】
図4において、S10で、CPU2は画像データ入力部1を介して文書原稿の読み取りを実行する。読み取った画像データは、データ蓄積部5の指定されたファイルに蓄積されたのち、データ蓄積部5のファイルから画像メモリ4に展開される。
【0032】
次に、S20で、読み取った文書画像の向きを判定する。この処理については後述する。
【0033】
次に、S30で、前記判定の結果に基づいて文書画像の向きを補正した後、S40で、補正後の画像を画像メモリ4からデータ蓄積部5のファイルに出力する。
【0034】
図5は、前記図4におけるS20の画像の向きの判定処理のサブルーチンを示すフローチャートである。
【0035】
まずS201で、CPU2は、画像処理部6に画像データの前処理を行わせる。画像処理部6は、前処理として、例えば文書画像がカラーやグレースケール画像の場合には二値化処理を行う。また、ノイズで文字行の切り出しを失敗しないために、ノイズ除去や余白部分の削除処理を行う。
【0036】
次に、S202で、90度回転フラグを初期化する。文書原稿が横向きで読み取られた場合、文字行を切り出しできないので、この場合は、画像を時計回りに90度回転して再度切り出しを行うことになる。初期化では「90度回転フラグ=No」にセットされ、画像を時計回りに90度回転した場合は「90度回転フラグ=Yes」にセットされる。この90度回転フラグは、補正時の文書画像の回転角度を決定するときに参照される。
【0037】
次に、S203で複数の文字行を切り出す。即ち、文字行を識別する。切り出しは各ラインのヒストグラムの谷間と山の幅を調べることにより行われる。領域分割と統合により、文字行を切り出しても良い。
【0038】
次いでS204で、文字行が切り出せたか否かを判断する。切り出せない場合は(S204にてNO)、S205で、90度回転フラグ=Yesか否かを判断する。90度回転フラグ=Yesでなければ(S205にてNO)、文書原稿が横向きで読み取られた可能性があるので、S206で、画像を時計回りに90度回転させ、かつ90度回転フラグをYesにセットしたのち、再度S203の文字行の切り出し及びS204の判断を実行する。
【0039】
S204において、文字行が切り出せた場合には(S204にてYES)、S207で、各文字行の両端位置、長さ、高さ、1つ上の文字行との間隔を求める。そして、S208で判定対象となる文字行を決定する。
【0040】
この実施形態において、判定対象となる文字行の条件は、下記表1に示した▲1▼〜▲4▼の各条件をすべて満たしていることである。
【0041】
【表1】
【0042】
上記表1において、「▲1▼文字行の長さ」については、(文字行の高さ)と(限界文字数)の積よりも大きいことを条件とする。文字行の高さは、通常、1文字の文字サイズに対応し、また限界文字数は適宜設定する。この条件により、長さの短い文字行、例えば図2に示したような日付や会社名等右揃えの文字行が、判定対象から排除される。
【0043】
上記表1において、「▲2▼文字行の高さ」については、最小文字サイズより大きく、最大文字サイズより小さいことを条件とする。この条件により、文字行の長さについては▲1▼の条件を満足していても、小文字のタイトルや、大文字のタイトル等の文字行が、判定対象から排除される。
【0044】
上記表1において、▲3▼及び▲4▼は、図3に示したような右揃えの文字行14を判定対象から排除し、同じ段落内の文字行を判定対象とするための条件である。
【0045】
即ち、「▲3▼一つ上の文字行との高さの差」については、その絶対値が(文字行の高さ)と(文字行の高さの誤差)の積よりも小さいことを条件とする。文字サイズを異にして作成された2つの段落が存在する場合、この条件により2つの段落が区別され、異なる段落に属する文字行が判定対象に含まれるのが防止される。
【0046】
「▲4▼一つ上の文字行の行間隔の差」については、(文字行の高さ)と(限界行間隔)の積よりも小さいことを条件とする。限界行間隔は適宜設定する。この条件により、例えば段落と段落の間をあけて作成された2つの段落が存在する場合、この条件により2つの段落が区別され、異なる段落に属する文字行が判定対象に含まれるのが防止される。
【0047】
このように、表1の▲1▼〜▲4▼の各条件が満たされているか否かを判定し、すべて満たしている文字行を文書画像の向きの判定対象行として決定する。
【0048】
次に、S209で、判定対象行が存在するか否かを判断する。S208の決定条件を満たす判定対象行が存在しなければ(S209にてNO)、前述したS205に進む。判定対象行が存在していれば(S209にてYES)、S210に進んで、前記判定対象行に基づいて、原稿の向きを判定する。
【0049】
S210の原稿の向き判定は、この実施形態では、図6に示すように、比較対照となる一方の文字行の左端位置を(xs1)、右端位置を(xe1)とし、他方の文字行の左端位置を(xs2)、右端位置を(xe2)とすると、
xs2−xs1>しきい値A
かつ|xe1−xe2|<しきい値B
の時、文字行の右端位置が文頭位置と判定し、入力された文書画像が180度回転している(向きが逆)と判定する。上式において、しきい値A、Bは文字行の高さの倍数で表す。このように、しきい値A、Bを文字行の高さの倍数とすることにより、解像度や文字サイズに依存することなく判定が可能となる。
【0050】
こうして、原稿の向きを判定した後、S211に進んで、画像を回転補正するための回転角度を決定する。なお、S205において、90度回転フラグ=Yesの時もS211に進む。
【0051】
回転角度は次のように決定する。
(1)90度回転フラグ=Yesでかつ文書画像の向きが逆の場合は、画像を時計回りに90度回転させたときに向きが逆と判断されたことから、読み取った文書画像は正規画像の上側が右側に位置しており、従って文書画像を時計回りに270度回転させる。
(2)90度回転フラグ=Yesでかつ文書画像の向きが正立の場合は、画像を時計回りに90度回転させたときに向きが正立と判断されたことから、読み取った文書画像は正規画像の上側が左側に位置しており、従って文書画像を時計回りに90度回転させる。
(3)90度回転フラグ=Yesでかつ行を切り出せないときは、判定不能とする。この場合は、補正されないことになる。
(4)90度回転フラグ=Noでかつ文書画像の向きが逆の場合は、読み取った文書画像の向きが逆になっており、従って文書画像を時計回りに180度回転させる。
(5)90度回転フラグ=Noでかつ文書画像の向きが正立の場合は、正しい向きで原稿を読み取っており、従って文書画像は回転させない。
【0052】
S211の回転角度の決定処理後、図4のメインルーチンへリターンする。
【0053】
前記S211で回転角度の決定後、図4のS30で、読み取った文書画像が正立状態でない場合には、CPU2は、決定された回転角度分だけ文書画像を回転して正立状態に補正し、S40で、画像メモリ4からデータ蓄積部5のファイルに出力する。
【0054】
以上、この発明の一実施形態を説明したが、この発明は上記実施形態に限定されるものではない。例えば、表1に示した▲1▼〜▲4▼の各条件をすべて満たしているものを判定対象行としたが、▲1▼〜▲4▼のいずれか1つあるいは2つ以上を満たしているものを判定対象行としても良い。
【0055】
また、文書画像の向きを判定しそれに基づいて補正する装置及び方法を示したが、文書画像の向きの判定のみを行い、補正は別の装置で行うものであっても良い。
【0056】
また、横読み文書原稿の画像の向きを判定し補正する場合を示したが、縦読み文書原稿の画像の向きを判定し、補正するものであっても良い。この場合、「行」を「列」と、「高さ」を「幅」と、「1つ上の行」を「1つ右の列」と、「左端」「右端」を「上端」「下端」とそれぞれ読み替えて、上記実施形態を適用すればよい。
【0057】
なお、以上説明した具体的実施形態には、以下の構成を有する発明が含まれている。
(1)文書画像データから文字行または文字列を識別する手段と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する手段と、
決定した文字行または文字列を用いて文書画像の向きを判定する手段と、
を備えたことを特徴とする文書画像の向きの判定装置。
【0058】
この判定装置では、文書画像データから文字行または文字列が識別されると、この識別された文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列が決定され、この決定された文字行または文字列を用いて文書画像の向きが判定される。
【0059】
従って、例えば、横読み文書原稿の中に長さの短い右揃え行や、高さの高いあるいは低い文字行や、文字行の間隔の極端に小さいもの等が含まれている場合や、縦読み文書原稿の中に長さの短い下揃え列や、幅の大きいあるいは小さい文字列や、文字列の間隔の極端に小さいもの等が含まれている場合には、これらの文字行や文字列が判断対象から除外され、文書画像の向きについて、文字認識処理を必要とすることなく精度の高い判定を行うことができる装置となる。
(2)文書画像データから文字行または文字列を識別する手段と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する手段と、
決定した文字行または文字列を用いて文書画像の向きを判定する手段と、
判定手段による判定結果に応じて文書画像の向きを補正する手段と、
を備えたことを特徴とする文書画像の向きの補正装置。
【0060】
この補正装置では、前記の判定装置で文書画像の向きについての精度の高い判定が行われ、その判定結果に基づいて文書画像の向きが補正されるから、文書画像の正しい向きへの補正を高い精度で行うことができる。
(3)文書画像データから文字行または文字列を識別する工程と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、
決定した文字行または文字列を用いて文書画像の向きを判定する工程と、
をコンピュータに実行させるためのプログラムが記録された、コンピュータ読み取り可能な記録媒体。
【0061】
この記録媒体では、コンピュータによって、文書画像データから文字行または文字列が識別され、この識別された文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列が決定され、この決定された文字行または文字列を用いて文書画像の向きが判定されるから、コンピュータに文書画像の向きについて精度の高い判定を行わせることができる。
(4)文書画像データから文字行または文字列を識別する工程と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、
決定した文字行または文字列を用いて文書画像の向きを判定する工程と、
判定結果に応じて文書画像の向きを補正する工程と、
をコンピュータに実行させるためのプログラムが記録された、コンピュータ読み取り可能な記録媒体。
【0062】
この記録媒体では、コンピュータに、文書画像の向きの判定のみならず、判定結果に応じた文書画像の向きの補正をも行わせるから、精度の高い判定及び補正を行わせることができる。
(5)文書画像データから文字行または文字列を識別する工程と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、
決定した文字行または文字列を用いて文書画像の向きを判定する工程と、
をコンピュータに実行させるためのプログラム。
【0063】
このプログラムによれば、文書画像の向きについて精度の高い判定をコンピュータに実行させることができる。
(6)文書画像データから文字行または文字列を識別する工程と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、
決定した文字行または文字列を用いて文書画像の向きを判定する工程と、
判定結果に応じて文書画像の向きを補正する工程と、
をコンピュータに実行させるためのプログラム。
【0064】
このプログラムによれば、文書画像の向きの判定のみならず、判定結果に応じた文書画像の向きの補正をもコンピュータに実行させることができる。
【0065】
【発明の効果】
この発明に係る文書画像の向きの判定方法は、文書画像データから文字行または文字列を識別し、識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定し、決定した文字行または文字列を用いて文書画像の向きを判定するから、判定を阻害する文字行や文字列が判定対象から除外され、文書画像の向きについて精度の高い判定を行うことができる。しかも、判定に際して文字認識処理のような複雑な処理を必要とすることなく、精度の高い判定を行うことができる。
【0066】
また、この発明に係る文書画像の向きの補正方法は、前記の判定方法で文書画像の向きについて判定結果に応じて、文書画像の向きが補正されるから、文書画像の正しい向きへの補正を高い精度で行うことができる。
【図面の簡単な説明】
【図1】この発明が実施される文書画像の向き判定・補正装置の構成を示すブロック図である。
【図2】右揃えの文字行が存在する文書原稿の一例を示す図である。
【図3】右揃えの文字行が存在する文書原稿の他の例を示す図である。
【図4】図1の文書画像の向き判定・補正装置のCPUが実行する判定補正処理の内容を示すフローチャートである。
【図5】図4のフローチャートにおけるS20の画像の向き判定処理のサブルーチンを示すフローチャートである。
【図6】原稿の向きの判定条件の説明図である。
【符号の説明】
1 画像データ入力部
2 CPU
3 主メモリ
4 画像メモリ
5 データ蓄積部
【発明の属する技術分野】
この発明は、例えばスキャナ装置等によって読み取られた文書画像の向きを判定する文書画像の向きの判定方法、及び判定結果に応じて正しい向きに補正する補正方法に関する。
【0002】
【従来の技術】
文書原稿をスキャナ等により読取入力する場合、原稿の向きが上下で逆になっていると、読み取られた画像も上下逆になる。また、自動原稿送り装置等で縦向き原稿と横向き原稿とが混在していると、読み取った画像も90度回転したものが含まれることになる。この場合、読み取った画像の向きをユーザがコンピュータ等の画面上で確認し、必要に応じて画像を正しい向きに回転することが行われているが、操作が面倒であった。
【0003】
そこで、読み取った文書画像の向きを自動的に判定する方法として、抽出した文字行の両端の揃いを比較(具体的には文字行の基準位置からのずれ量の総和を比較)して読みの方向(画像の向き)を判定し、これに基づいて画像処理を行う方法が提案されている(例えば特許文献1参照)。
【0004】
また、抽出した文字行を0度、90度、180度、270度回転して文字認識した結果を比較し、画像の向きを判定して補正する方法も提案されている(例えば特許文献2参照)。
【0005】
【特許文献1】
特開平10−93772号公報の特許請求の範囲
【0006】
【特許文献2】
特開平11−219409号公報の特許請求の範囲、段落番号0069
【0007】
【発明が解決しようとする課題】
しかしながら、上記特許文献1に記載された方法では、文書原稿の中に右揃え行が混在していると、基準位置からのずれ量が右揃え行の方が大きくなるため、正立している画像を180度回転していると誤判定するという問題があった。
【0008】
また、上記特許文献2に記載された方法では、文字認識が必要であることから、処理が複雑になるとか処理速度が遅くなる恐れがあるといった問題があった。
【0009】
この発明は、このような技術的背景に鑑みてなされたものであって、判定精度が高く、しかも文字認識処理が不要な文書画像の向きの判定方法及び同補正方法の提供を課題とする。
【0010】
【課題を解決するための手段】
上記課題は、文書画像データから文字行または文字列を識別する工程と、識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、決定した文字行または文字列を用いて文書画像の向きを判定する工程と、を備えたことを特徴とする文書画像の向きの判定方法によって解決される。
【0011】
この判定方法では、文書画像データから文字行または文字列を識別し、識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判定対象となる文字行または文字列を決定し、決定した文字行または文字列を用いて文書画像の向きを判定する。
【0012】
従って、例えば、横読み文書原稿の中に長さの短い右揃え行や、高さの高いあるいは低い文字行や、文字行の間隔の極端に小さいもの等が含まれている場合や、縦読み文書原稿の中に長さの短い下揃え列や、幅の大きいあるいは小さい文字列や、文字列の間隔の極端に小さいもの等が含まれている場合には、これらの文字行や文字列が判定対象から除外され、文書画像の向きについて精度の高い判定が行われる。しかも、判定に際して文字認識処理は不要である。
【0013】
また、前記課題は、文書画像データから文字行または文字列を識別する工程と、識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、決定した文字行または文字列を用いて文書画像の向きを判定する工程と、判定結果に応じて文書画像の向きを補正する工程と、を備えたことを特徴とする文書画像の向きの補正方法によっても解決される。
【0014】
この補正方法では、前記の判定方法で文書画像の向きについての精度の高い判定が行われ、その判定結果に応じて文書画像の向きが補正されるから、文書画像の正しい向きへの補正を高い精度で行うことができる。
【0015】
【発明の実施の形態】
以下、この発明の一実施形態を説明する。
【0016】
図1は、この発明の一実施形態に係る文書画像の向き判定・補正装置の構成を示すブロック図である。なお、この実施形態では、横読み文書原稿の画像の向きを判定し、補正する場合を示している。
【0017】
図1に示すように、前記文書画像の向き判定・補正装置は、画像データ入力部1、CPU2、主メモリ3、画像メモリ4、データ蓄積部5、画像処理部6、操作部7、表示部8、プリンタ部9が、バスライン10にそれぞれ接続されている。
【0018】
前記画像データ入力部1は、文書画像を入力するためのものである。この実施形態では、画像データ入力部1は画像読取装置を備え、文書原稿を読み取って画像データに変換するものとなされている。なお、文書画像データがネットワークを介して送信されてくるときには、前記入力部は送信されてきた文書画像データを受信して入力する受信部として機能するように構成しても良い。
【0019】
前記CPU2は、装置全体を統括的に制御するものであり、例えば画像データ入力部1で読み取った文書画像データをデータ蓄積部5に保存したのち画像メモリ4に展開したり、画像メモリ4に展開した画像データを画像処理部6に前処理させたり、ユーザによる操作部7からの出力指令に基づいて、画像データをプリンタ部9でプリントさせる等の制御を行う。さらにこの実施形態では、CPU2は後述するように、文書画像データから文字行を識別して画像の向きの判定対象となる文字行を決定したり、文書画像の向きを判定したり、判定結果に基づいて文書画像の向きを補正する機能をも有する。
【0020】
前記主メモリ3は、CPU2が実行するためのプログラムを記憶したり、CPU2の動作時の作業領域となるものである。
【0021】
前記画像メモリ4は、画像処理部6による画像処理やCPU2による文書画像の向きの判定及び補正処理に際して、画像データ入力部1で入力された文書画像データ等を記憶するものである。
【0022】
前記データ蓄積部5は各種のデータを蓄積するものであり、例えばハードディスク装置等からなる。
【0023】
前記画像処理部6は、前記CPU2の指令に基づいて、画像データ入力部1で入力された文書画像データに対して、二値化やノイズ除去等の前処理を実施するものである。
【0024】
前記操作部7は、ユーザによる各種の指示を入力操作するものであり、例えばキーボード、マウス、操作パネル等により構成されている。
【0025】
前記表示部8は、例えばユーザが指示する操作内容、文書画像の向きの判定結果、向き補正後の文書画像を等を表示するものであり、CRTディスプレイ、液晶パネル等により構成されている。
【0026】
前記プリンタ部9は、必要に応じて、向きを補正された文書画像データ等をプリントするものである。なお、補正された文書画像データをネットワークを介して他のコンピュータ等に転送するように構成しても良い。
【0027】
次に、図1に示した文書画像の向き判定・補正装置を用いた文書画像の向きの判定方法及び補正方法について説明する。
【0028】
図2は、右揃えの行が混在する文書原稿の例を示している。白矩形が右揃えの文字行12を示し、網掛け矩形が左揃えの文字行11を示している。また、左右の波線は文字行の端部の位置を示している。この例では、日付や会社名等右揃えの文字行が2行続いており、従来の判定方法では方向が逆であると判定されてしまう。この場合、一定の長さ以上の文字行を向き判定対象とすることで、長さの短い右揃えの文字行2行が判定対象からはずれる。その結果、正しい判定が可能となる。
【0029】
図3は、フッタ部分に右揃えの小文字タイトルやページ番号等が存在している文書原稿の例を示している。下端部の白矩形が右揃えの文字行14を示し、網掛け矩形が左揃えの文字行13を示している。また、左右の波線は文字行の端部の位置を示している。この例においても、従来の判定方法では方向が逆であると判定されてしまうが、同じ段落内にある文字行を向き判定対象とすることで、段落外にある右揃えの文字行が判定対象からはずれ、正しい判定が可能となる。
【0030】
図4は、図1に示した文書画像の向き判定・補正装置のCPU2が実行する判定及び補正処理のメインルーチンを示すフローチャートである。なお、以下の説明及び図面において、ステップを「S」と略記する。
【0031】
図4において、S10で、CPU2は画像データ入力部1を介して文書原稿の読み取りを実行する。読み取った画像データは、データ蓄積部5の指定されたファイルに蓄積されたのち、データ蓄積部5のファイルから画像メモリ4に展開される。
【0032】
次に、S20で、読み取った文書画像の向きを判定する。この処理については後述する。
【0033】
次に、S30で、前記判定の結果に基づいて文書画像の向きを補正した後、S40で、補正後の画像を画像メモリ4からデータ蓄積部5のファイルに出力する。
【0034】
図5は、前記図4におけるS20の画像の向きの判定処理のサブルーチンを示すフローチャートである。
【0035】
まずS201で、CPU2は、画像処理部6に画像データの前処理を行わせる。画像処理部6は、前処理として、例えば文書画像がカラーやグレースケール画像の場合には二値化処理を行う。また、ノイズで文字行の切り出しを失敗しないために、ノイズ除去や余白部分の削除処理を行う。
【0036】
次に、S202で、90度回転フラグを初期化する。文書原稿が横向きで読み取られた場合、文字行を切り出しできないので、この場合は、画像を時計回りに90度回転して再度切り出しを行うことになる。初期化では「90度回転フラグ=No」にセットされ、画像を時計回りに90度回転した場合は「90度回転フラグ=Yes」にセットされる。この90度回転フラグは、補正時の文書画像の回転角度を決定するときに参照される。
【0037】
次に、S203で複数の文字行を切り出す。即ち、文字行を識別する。切り出しは各ラインのヒストグラムの谷間と山の幅を調べることにより行われる。領域分割と統合により、文字行を切り出しても良い。
【0038】
次いでS204で、文字行が切り出せたか否かを判断する。切り出せない場合は(S204にてNO)、S205で、90度回転フラグ=Yesか否かを判断する。90度回転フラグ=Yesでなければ(S205にてNO)、文書原稿が横向きで読み取られた可能性があるので、S206で、画像を時計回りに90度回転させ、かつ90度回転フラグをYesにセットしたのち、再度S203の文字行の切り出し及びS204の判断を実行する。
【0039】
S204において、文字行が切り出せた場合には(S204にてYES)、S207で、各文字行の両端位置、長さ、高さ、1つ上の文字行との間隔を求める。そして、S208で判定対象となる文字行を決定する。
【0040】
この実施形態において、判定対象となる文字行の条件は、下記表1に示した▲1▼〜▲4▼の各条件をすべて満たしていることである。
【0041】
【表1】
【0042】
上記表1において、「▲1▼文字行の長さ」については、(文字行の高さ)と(限界文字数)の積よりも大きいことを条件とする。文字行の高さは、通常、1文字の文字サイズに対応し、また限界文字数は適宜設定する。この条件により、長さの短い文字行、例えば図2に示したような日付や会社名等右揃えの文字行が、判定対象から排除される。
【0043】
上記表1において、「▲2▼文字行の高さ」については、最小文字サイズより大きく、最大文字サイズより小さいことを条件とする。この条件により、文字行の長さについては▲1▼の条件を満足していても、小文字のタイトルや、大文字のタイトル等の文字行が、判定対象から排除される。
【0044】
上記表1において、▲3▼及び▲4▼は、図3に示したような右揃えの文字行14を判定対象から排除し、同じ段落内の文字行を判定対象とするための条件である。
【0045】
即ち、「▲3▼一つ上の文字行との高さの差」については、その絶対値が(文字行の高さ)と(文字行の高さの誤差)の積よりも小さいことを条件とする。文字サイズを異にして作成された2つの段落が存在する場合、この条件により2つの段落が区別され、異なる段落に属する文字行が判定対象に含まれるのが防止される。
【0046】
「▲4▼一つ上の文字行の行間隔の差」については、(文字行の高さ)と(限界行間隔)の積よりも小さいことを条件とする。限界行間隔は適宜設定する。この条件により、例えば段落と段落の間をあけて作成された2つの段落が存在する場合、この条件により2つの段落が区別され、異なる段落に属する文字行が判定対象に含まれるのが防止される。
【0047】
このように、表1の▲1▼〜▲4▼の各条件が満たされているか否かを判定し、すべて満たしている文字行を文書画像の向きの判定対象行として決定する。
【0048】
次に、S209で、判定対象行が存在するか否かを判断する。S208の決定条件を満たす判定対象行が存在しなければ(S209にてNO)、前述したS205に進む。判定対象行が存在していれば(S209にてYES)、S210に進んで、前記判定対象行に基づいて、原稿の向きを判定する。
【0049】
S210の原稿の向き判定は、この実施形態では、図6に示すように、比較対照となる一方の文字行の左端位置を(xs1)、右端位置を(xe1)とし、他方の文字行の左端位置を(xs2)、右端位置を(xe2)とすると、
xs2−xs1>しきい値A
かつ|xe1−xe2|<しきい値B
の時、文字行の右端位置が文頭位置と判定し、入力された文書画像が180度回転している(向きが逆)と判定する。上式において、しきい値A、Bは文字行の高さの倍数で表す。このように、しきい値A、Bを文字行の高さの倍数とすることにより、解像度や文字サイズに依存することなく判定が可能となる。
【0050】
こうして、原稿の向きを判定した後、S211に進んで、画像を回転補正するための回転角度を決定する。なお、S205において、90度回転フラグ=Yesの時もS211に進む。
【0051】
回転角度は次のように決定する。
(1)90度回転フラグ=Yesでかつ文書画像の向きが逆の場合は、画像を時計回りに90度回転させたときに向きが逆と判断されたことから、読み取った文書画像は正規画像の上側が右側に位置しており、従って文書画像を時計回りに270度回転させる。
(2)90度回転フラグ=Yesでかつ文書画像の向きが正立の場合は、画像を時計回りに90度回転させたときに向きが正立と判断されたことから、読み取った文書画像は正規画像の上側が左側に位置しており、従って文書画像を時計回りに90度回転させる。
(3)90度回転フラグ=Yesでかつ行を切り出せないときは、判定不能とする。この場合は、補正されないことになる。
(4)90度回転フラグ=Noでかつ文書画像の向きが逆の場合は、読み取った文書画像の向きが逆になっており、従って文書画像を時計回りに180度回転させる。
(5)90度回転フラグ=Noでかつ文書画像の向きが正立の場合は、正しい向きで原稿を読み取っており、従って文書画像は回転させない。
【0052】
S211の回転角度の決定処理後、図4のメインルーチンへリターンする。
【0053】
前記S211で回転角度の決定後、図4のS30で、読み取った文書画像が正立状態でない場合には、CPU2は、決定された回転角度分だけ文書画像を回転して正立状態に補正し、S40で、画像メモリ4からデータ蓄積部5のファイルに出力する。
【0054】
以上、この発明の一実施形態を説明したが、この発明は上記実施形態に限定されるものではない。例えば、表1に示した▲1▼〜▲4▼の各条件をすべて満たしているものを判定対象行としたが、▲1▼〜▲4▼のいずれか1つあるいは2つ以上を満たしているものを判定対象行としても良い。
【0055】
また、文書画像の向きを判定しそれに基づいて補正する装置及び方法を示したが、文書画像の向きの判定のみを行い、補正は別の装置で行うものであっても良い。
【0056】
また、横読み文書原稿の画像の向きを判定し補正する場合を示したが、縦読み文書原稿の画像の向きを判定し、補正するものであっても良い。この場合、「行」を「列」と、「高さ」を「幅」と、「1つ上の行」を「1つ右の列」と、「左端」「右端」を「上端」「下端」とそれぞれ読み替えて、上記実施形態を適用すればよい。
【0057】
なお、以上説明した具体的実施形態には、以下の構成を有する発明が含まれている。
(1)文書画像データから文字行または文字列を識別する手段と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する手段と、
決定した文字行または文字列を用いて文書画像の向きを判定する手段と、
を備えたことを特徴とする文書画像の向きの判定装置。
【0058】
この判定装置では、文書画像データから文字行または文字列が識別されると、この識別された文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列が決定され、この決定された文字行または文字列を用いて文書画像の向きが判定される。
【0059】
従って、例えば、横読み文書原稿の中に長さの短い右揃え行や、高さの高いあるいは低い文字行や、文字行の間隔の極端に小さいもの等が含まれている場合や、縦読み文書原稿の中に長さの短い下揃え列や、幅の大きいあるいは小さい文字列や、文字列の間隔の極端に小さいもの等が含まれている場合には、これらの文字行や文字列が判断対象から除外され、文書画像の向きについて、文字認識処理を必要とすることなく精度の高い判定を行うことができる装置となる。
(2)文書画像データから文字行または文字列を識別する手段と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する手段と、
決定した文字行または文字列を用いて文書画像の向きを判定する手段と、
判定手段による判定結果に応じて文書画像の向きを補正する手段と、
を備えたことを特徴とする文書画像の向きの補正装置。
【0060】
この補正装置では、前記の判定装置で文書画像の向きについての精度の高い判定が行われ、その判定結果に基づいて文書画像の向きが補正されるから、文書画像の正しい向きへの補正を高い精度で行うことができる。
(3)文書画像データから文字行または文字列を識別する工程と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、
決定した文字行または文字列を用いて文書画像の向きを判定する工程と、
をコンピュータに実行させるためのプログラムが記録された、コンピュータ読み取り可能な記録媒体。
【0061】
この記録媒体では、コンピュータによって、文書画像データから文字行または文字列が識別され、この識別された文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列が決定され、この決定された文字行または文字列を用いて文書画像の向きが判定されるから、コンピュータに文書画像の向きについて精度の高い判定を行わせることができる。
(4)文書画像データから文字行または文字列を識別する工程と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、
決定した文字行または文字列を用いて文書画像の向きを判定する工程と、
判定結果に応じて文書画像の向きを補正する工程と、
をコンピュータに実行させるためのプログラムが記録された、コンピュータ読み取り可能な記録媒体。
【0062】
この記録媒体では、コンピュータに、文書画像の向きの判定のみならず、判定結果に応じた文書画像の向きの補正をも行わせるから、精度の高い判定及び補正を行わせることができる。
(5)文書画像データから文字行または文字列を識別する工程と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、
決定した文字行または文字列を用いて文書画像の向きを判定する工程と、
をコンピュータに実行させるためのプログラム。
【0063】
このプログラムによれば、文書画像の向きについて精度の高い判定をコンピュータに実行させることができる。
(6)文書画像データから文字行または文字列を識別する工程と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、
決定した文字行または文字列を用いて文書画像の向きを判定する工程と、
判定結果に応じて文書画像の向きを補正する工程と、
をコンピュータに実行させるためのプログラム。
【0064】
このプログラムによれば、文書画像の向きの判定のみならず、判定結果に応じた文書画像の向きの補正をもコンピュータに実行させることができる。
【0065】
【発明の効果】
この発明に係る文書画像の向きの判定方法は、文書画像データから文字行または文字列を識別し、識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定し、決定した文字行または文字列を用いて文書画像の向きを判定するから、判定を阻害する文字行や文字列が判定対象から除外され、文書画像の向きについて精度の高い判定を行うことができる。しかも、判定に際して文字認識処理のような複雑な処理を必要とすることなく、精度の高い判定を行うことができる。
【0066】
また、この発明に係る文書画像の向きの補正方法は、前記の判定方法で文書画像の向きについて判定結果に応じて、文書画像の向きが補正されるから、文書画像の正しい向きへの補正を高い精度で行うことができる。
【図面の簡単な説明】
【図1】この発明が実施される文書画像の向き判定・補正装置の構成を示すブロック図である。
【図2】右揃えの文字行が存在する文書原稿の一例を示す図である。
【図3】右揃えの文字行が存在する文書原稿の他の例を示す図である。
【図4】図1の文書画像の向き判定・補正装置のCPUが実行する判定補正処理の内容を示すフローチャートである。
【図5】図4のフローチャートにおけるS20の画像の向き判定処理のサブルーチンを示すフローチャートである。
【図6】原稿の向きの判定条件の説明図である。
【符号の説明】
1 画像データ入力部
2 CPU
3 主メモリ
4 画像メモリ
5 データ蓄積部
Claims (2)
- 文書画像データから文字行または文字列を識別する工程と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、
決定した文字行または文字列を用いて文書画像の向きを判定する工程と、
を備えたことを特徴とする文書画像の向きの判定方法。 - 文書画像データから文字行または文字列を識別する工程と、
識別した文字行または文字列の長さ、文字行の高さまたは文字列の幅、文字行または文字列の間隔、のうちの少なくとも一つに基づくパラメータによって、判断対象となる文字行または文字列を決定する工程と、
決定した文字行または文字列を用いて文書画像の向きを判定する工程と、
判定結果に応じて文書画像の向きを補正する工程と、
を備えたことを特徴とする文書画像の向きの補正方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002345699A JP2004178397A (ja) | 2002-11-28 | 2002-11-28 | 文書画像の向きの判定方法及び同補正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002345699A JP2004178397A (ja) | 2002-11-28 | 2002-11-28 | 文書画像の向きの判定方法及び同補正方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004178397A true JP2004178397A (ja) | 2004-06-24 |
Family
ID=32706815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002345699A Pending JP2004178397A (ja) | 2002-11-28 | 2002-11-28 | 文書画像の向きの判定方法及び同補正方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004178397A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008234223A (ja) * | 2007-03-19 | 2008-10-02 | Ricoh Co Ltd | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
US8203763B2 (en) | 2008-02-15 | 2012-06-19 | Kabushiki Kaisha Toshiba | Image scanning apparatus and method for aligning a stack of scanned images using the stack orientation indicated by a user and an automatically determined image orientation |
JP2017046248A (ja) * | 2015-08-27 | 2017-03-02 | 株式会社沖データ | 画像形成装置 |
JP2018120591A (ja) * | 2017-01-24 | 2018-08-02 | 富士通株式会社 | 文書の向きの認識方法、認識装置及びニューラルネットワーク |
-
2002
- 2002-11-28 JP JP2002345699A patent/JP2004178397A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008234223A (ja) * | 2007-03-19 | 2008-10-02 | Ricoh Co Ltd | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
US8203763B2 (en) | 2008-02-15 | 2012-06-19 | Kabushiki Kaisha Toshiba | Image scanning apparatus and method for aligning a stack of scanned images using the stack orientation indicated by a user and an automatically determined image orientation |
JP2017046248A (ja) * | 2015-08-27 | 2017-03-02 | 株式会社沖データ | 画像形成装置 |
JP2018120591A (ja) * | 2017-01-24 | 2018-08-02 | 富士通株式会社 | 文書の向きの認識方法、認識装置及びニューラルネットワーク |
JP7020134B2 (ja) | 2017-01-24 | 2022-02-16 | 富士通株式会社 | 文書の向きの認識方法、認識装置及びニューラルネットワーク |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6640010B2 (en) | Word-to-word selection on images | |
US8326085B2 (en) | Image processing apparatus and image processing method | |
JPH1139428A (ja) | 文書映像の方向修正方法 | |
US8538154B2 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
JP2009152673A (ja) | 画像処理装置及び画像処理プログラム | |
JP4869841B2 (ja) | 画像処理装置、画像方向判別方法、および画像方向判別プログラム | |
JP5412903B2 (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
JP5412916B2 (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
JP2004178397A (ja) | 文書画像の向きの判定方法及び同補正方法 | |
JP2009272962A (ja) | 画像処理装置 | |
JP2004127203A (ja) | 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム、並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4420440B2 (ja) | 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体 | |
JP4281236B2 (ja) | 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 | |
JP4866184B2 (ja) | 画像処理装置、画像方向判別方法、および画像方向判別プログラム | |
JP4070486B2 (ja) | 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム | |
JP3187895B2 (ja) | 文字領域抽出方法 | |
EP0767941B1 (en) | Automatic determination of landscape scan in binary images | |
JP3547897B2 (ja) | イメージ処理装置 | |
JP2008181383A (ja) | 文字認識装置、文字認識装置の制御方法、および文字認識装置の制御プログラム | |
JP2007328652A (ja) | 画像処理装置および画像処理プログラム | |
JPH09288714A (ja) | 表認識方法および装置 | |
JPH11250179A (ja) | 文字認識装置および文字認識方法 | |
JP2007280344A (ja) | 画像処理装置、画像方向判別方法、および画像方向判別プログラム | |
JP3024234B2 (ja) | 文書画像の罫線抽出装置 | |
JP2022162474A (ja) | 画像処理システム、画像処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040309 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20050614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20050803 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20050803 |