JP2007280345A - 画像処理装置、画像方向判別方法、および画像方向判別プログラム - Google Patents

画像処理装置、画像方向判別方法、および画像方向判別プログラム Download PDF

Info

Publication number
JP2007280345A
JP2007280345A JP2006238016A JP2006238016A JP2007280345A JP 2007280345 A JP2007280345 A JP 2007280345A JP 2006238016 A JP2006238016 A JP 2006238016A JP 2006238016 A JP2006238016 A JP 2006238016A JP 2007280345 A JP2007280345 A JP 2007280345A
Authority
JP
Japan
Prior art keywords
document
image information
character line
coordinate
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006238016A
Other languages
English (en)
Other versions
JP4869841B2 (ja
Inventor
Toshifumi Yamaai
敏文 山合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2006238016A priority Critical patent/JP4869841B2/ja
Priority to US11/713,011 priority patent/US7873239B2/en
Publication of JP2007280345A publication Critical patent/JP2007280345A/ja
Application granted granted Critical
Publication of JP4869841B2 publication Critical patent/JP4869841B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees

Abstract

【課題】画像情報の方向の判定の処理速度を高速化するとともに、画像情報の方向を正確に判定できる画像処理装置、画像方向判別方法、および画像方向判別プログラムを提供する。
【解決手段】第1方向判定部102は、文書を示す文書画像情報における上下左右方向それぞれが文書の上方向である確信度を判定し、第2方向判定部103は、最も高い確信度が判定された第1方向と、2番目に高い確信度が判定された第2方向とが逆方向である場合、文書画像情報から抽出された文字行の配置位置に基づいて、文書の上方向が第1方向または第2方向のいずれであるかを判定する。
【選択図】 図1

Description

本発明は、画像処理装置、画像方向判別方法、および画像方向判別プログラムに関するものである。
従来、画像の方向を判定する方法としては、文書画像から文字を切り出し、その特徴量を抽出し、4方向の文字を持つ辞書と文字との類似度を求め、最も類似度の高い方向を画像の方向として判定する技術が一般に知られている。このような技術では、方向を判定するために切出された文字の4方向すべての類似度を加算して方向を判定するため、例えば“6”と“9”のようにある方向の類似度と逆方向の類似度が高い場合は、類似度が累積されることによって、文書画像の方向を誤認してしまうという問題があった。
このような問題を解決するものとして、画像情報から文字領域を切り出し、各文字について4方向に対して文字認識を行い、各方向の文字認識の類似度を求め、予め定められた閾値を超えた類似度のみを加算していき、最も高い値の類似度の方向を文書画像の方向として判定する方法が開示されている(特許文献1参照)。
特開2000−113103号公報
しかしながら、上記特許文献1に記載された技術を用いて、切出した文字の4方向に対して文字認識を行なうと、CPU(Central Processing Unit)にかかる負荷が高くなる。このため、パーソナルコンピュータに対して低スペックなCPUしか搭載されていない画像機器(スキャナやコピー、デジタルカメラ等)では、OCR(光学文字認識:Optical Charactor Recognition)処理を実行すると、処理速度が遅く、実用に耐えないという問題があった。
また、処理速度の高速化を図るために、画像情報の文字行のレイアウト情報を用いて、画像情報の方向を判定する方法も考案されている。しかしながら、この方法では上下左右の4つの方向を判定する際に画像情報の方向が上下方向か左右方向かは正確に判定できるが、上下方向と判定された画像情報の方向が上方向か下方向か、または左右方向と判定された画像情報の方向が右方向か左方向かの判定は、レイアウト情報の差異が小さいため、誤って判定してしまう場合があるという問題があった。
本発明は、上記に鑑みてなされたものであって、画像情報の方向の判定の処理速度を高速化するとともに、画像情報の方向を正確に判定できる画像処理装置、画像方向判別方法、および画像方向判別プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、請求項1にかかる発明は、文書を示す文書画像情報における上下左右方向それぞれが前記文書の上方向である確信度を判定する確信度判定手段と、前記確信度判定手段によって最も高い確信度が判定された第1方向と、2番目に高い確信度が判定された第2方向とが逆方向である場合、前記文書画像情報から抽出された文字行の配置位置に基づいて、前記文書の上方向が前記第1方向または前記第2方向のいずれであるかを判定する方向判定手段と、を備えることを特徴とする。
また、請求項2にかかる発明は、請求項1に記載の画像処理装置において、前記方向判定手段は、さらに前記確信度判定手段によって判定された上下左右方向すべての前記確信度が所定の閾値以下である場合に、前記文書画像情報から抽出された文字行の配置位置に基づいて、前記文書の上方向が前記第1方向または前記第2方向のいずれであるかを判定すること、を特徴とする。
また、請求項3にかかる発明は、請求項1または請求項2に記載の画像処理装置において、前記文字行の先頭の座標値および終端の座標値を抽出する座標抽出手段、をさらに備え、前記方向判定手段は、さらに前記座標抽出手段によって抽出された前記文字行の先頭の座標値および終端の座標値に基づいて、前記文書の上方向が前記第1方向または前記第2方向のいずれであるかを判定すること、を特徴とする。
また、請求項4にかかる発明は、請求項3に記載の画像処理装置において、前記座標抽出手段は、前記文書画像情報に含まれる複数の文字行それぞれの先頭の座標値および終端の座標値を抽出し、複数の先頭の座標値の度数分布および複数の終端の座標値の度数分布を求め、前記方向判定手段は、さらに前記座標抽出手段によって抽出された前記先頭の座標値の度数分布および前記終端の座標値の度数分布に基づいて、前記文書の方向が前記第1方向または前記第2方向のいずれであるかを判定すること、を特徴とする。
また、請求項5にかかる発明は、請求項1または請求項2に記載の画像処理装置において、前記文書画像情報中の複数の文字行を含む矩形領域の境界位置から文字行の先頭までの距離および終端までの距離を計測する座標抽出手段、をさらに備え、前記方向判定手段は、さらに前記座標抽出手段によって求められた前記先頭までの距離および前記終端までの距離に基づいて、前記文書の方向が前記第1方向または前記第2方向のいずれであるかを判定すること、を特徴とする。
また、請求項6にかかる発明は、請求項5に記載の画像処理装置において、前記座標抽出手段は、前記矩形領域の境界位置から前記矩形領域に含まれる複数の文字行それぞれの文字行の先頭までの距離の度数分布および文字行の終端までの距離の度数分布を求め、前記方向判定手段は、さらに前記座標抽出手段によって求められた前記先頭までの距離の度数分布および前記終端までの距離の度数分布に基づいて、前記文書の方向が前記第1方向または前記第2方向のいずれであるかを判定すること、を特徴とする。
また、請求項7にかかる発明は、文書を示す文書画像情報における上下左右方向それぞれが前記文書の上方向である確信度を判定する確信度判定ステップと、前記確信度判定ステップによって最も高い確信度が判定された第1方向と、2番目に高い確信度が判定された第2方向とが逆方向である場合、前記文書画像情報から抽出された文字行の配置位置に基づいて、前記文書の上方向が前記第1方向または前記第2方向のいずれであるかを判定する方向判定ステップと、を有することを特徴とする。
また、請求項8にかかる発明は、請求項7に記載された画像方向判別方法をコンピュータに実行させることを特徴とする。
請求項1にかかる発明によれば、確信度判定手段によって、文書を示す文書画像情報における上下左右方向それぞれが文書の上方向である確信度を判定し、方向判定手段によって、最も高い確信度が判定された第1方向と、2番目に高い確信度が判定された第2方向とが逆方向である場合、文書画像情報から抽出された文字行の配置位置に基づいて、文書の上方向が第1方向または第2方向のいずれであるかを判定することにより、文書画像情報に対して上下左右方向それぞれの確信度を求め、さらに文書画像情報の方向を2方向に限定して判定するため、文書画像情報の方向の判定の処理速度を高速化するとともに、文書画像情報の方向を正確に判定することができるという効果を奏する。
また、請求項2にかかる発明によれば、方向判定手段は、さらに確信度判定手段によって判定された上下左右方向すべての確信度が所定の閾値以下である場合に、文書画像情報から抽出された文字行の配置位置に基づいて、文書の上方向が第1方向または第2方向のいずれであるかを判定することにより、誤判定する可能性が高い場合に2方向に限定して文書画像情報の方向を判定するため、方向判定の精度を高めることができるという効果を奏する。
また、請求項3にかかる発明によれば、座標抽出手段によって、文字行の先頭の座標値および終端の座標値を抽出し、方向判定手段は、さらに座標抽出手段によって抽出された文字行の先頭の座標値および終端の座標値に基づいて、文書の上方向が第1方向または第2方向のいずれであるかを判定することにより、文字行の先頭および終端の座標値を用いて文書画像情報の方向を判定するため、文書画像情報の方向を正確に判定することができるという効果を奏する。
また、請求項4にかかる発明によれば、座標抽出手段は、文書画像情報に含まれる複数の文字行それぞれの先頭の座標値および終端の座標値を抽出し、複数の先頭の座標値の度数分布および複数の終端の座標値の度数分布を求め、方向判定手段は、さらに座標抽出手段によって抽出された先頭の座標値の度数分布および終端の座標値の度数分布に基づいて、文書の方向が第1方向または第2方向のいずれであるかを判定することにより、文字行の先頭および終端の座標値のばらつきを用いて文書画像情報の方向を判定するため、文書画像情報の方向を正確に判定することができるという効果を奏する。
また、請求項5にかかる発明によれば、座標抽出手段によって、文書画像情報中の複数の文字行を含む矩形領域の境界位置から文字行の先頭までの距離および終端までの距離を計測し、方向判定手段は、さらに座標抽出手段によって求められた先頭までの距離および終端までの距離に基づいて、文書の方向が第1方向または第2方向のいずれであるかを判定することにより、判定領域から文字行の先頭および終端までの距離を用いて文書画像情報の方向を判定するため、文書画像情報の方向を正確に判定することができるという効果を奏する。
また、請求項6にかかる発明によれば、座標抽出手段は、矩形領域の境界位置から矩形領域に含まれる複数の文字行それぞれの文字行の先頭までの距離の度数分布および文字行の終端までの距離の度数分布を求め、方向判定手段は、さらに座標抽出手段によって求められた先頭までの距離の度数分布および終端までの距離の度数分布に基づいて、文書の方向が第1方向または第2方向のいずれであるかを判定することにより、判定領域から文字行の先頭および終端までの距離のばらつきを用いて文書画像情報の方向を判定するため、文書画像情報の方向を正確に判定することができるという効果を奏する。
また、請求項7にかかる発明によれば、確信度判定ステップによって、文書を示す文書画像情報における上下左右方向それぞれが文書の上方向である確信度を判定し、方向判定ステップによって、最も高い確信度が判定された第1方向と、2番目に高い確信度が判定された第2方向とが逆方向である場合、文書画像情報から抽出された文字行の配置位置に基づいて、文書の上方向が第1方向または第2方向のいずれであるかを判定することにより、文書画像情報に対して上下左右方向それぞれの確信度を求め、さらに文書画像情報の方向を2方向に限定して判定するため、文書画像情報の方向の判定の処理速度を高速化するとともに、文書画像情報の方向を正確に判定することができるという効果を奏する。
また、請求項8にかかる発明によれば、請求項7に記載された画像方向判別方法をコンピュータに実行させることにより、文書画像情報に対して上下左右方向それぞれの確信度を求め、さらに文書画像情報の方向を2方向に限定して判定するため、文書画像情報の方向の判定の処理速度を高速化するとともに、文書画像情報の方向を正確に判定することができるという効果を奏する。
以下に添付図面を参照して、本発明にかかる画像処理装置、画像方向判別方法、および画像方向判別プログラムの最良な実施の形態を詳細に説明する。なお、本発明はこれらの実施の形態に限定されるものではない。
本実施の形態について、添付図面を参照して説明する。まず、本発明が適用される画像処理装置の構成例について説明する。図1は、本実施の形態にかかる画像処理装置の構成を示すブロック図である。なお、本実施の形態では、画像処理装置、例えばパーソナルコンピュータを一例として説明するが、原稿から画像情報を読取るスキャナを含む構成でもよいし、画像情報を格納するデータベースを含む構成でもよい。また、画像形成部を含むプリンタや複合機であってもよい。
本実施の形態にかかる画像処理装置100は、画像情報取得部101と、第1方向判定部102と、第2方向判定部103と、方向補正部104と、画像情報出力部105と、を備えている。例えば、スキャナによって文書を読込む場合、任意の方向を上方向として一の文書の画像情報を作成する。従って、文書の上方向と、作成された画像情報の上方向とが異なる場合がある。しかし、画像情報を画面に表示する際には、文字が正立する方向に表示する必要があり、画像情報を印刷する際には、文字を一定の方向に印刷する必要がある。画像処理装置100は、このような方向のずれを補正する。
画像情報取得部101は、スキャナによって読込まれた画像情報やネットワークを介して送信された画像情報を取得するものである。ここで、読込まれた画像情報は、文字を含む画像情報である(以下、文書画像情報という)。
第1方向判定部102は、画像情報取得部101によって取得された文書画像情報の上下左右方向それぞれが一の文書画像情報に対応する文書の上方向である確からしさの尺度を示す確信度を判定するものである。ここで、文書画像情報の方向とは、文字の方向を示すものである。例えば、文書画面情報に含まれる文字の傾きが0度、すなわち文字が正立している場合を上方向、90度、すなわち文字が左に倒れている場合を左方向、180度、すなわち文字が倒立している場合を下方向、270度、すなわち文字が右に倒れているである場合を右方向という。また、第1方向判定部102は、文書画像情報に含まれる文字行を縦方向の文字行または横方向の文字行として抽出する。第1方向判定部102は、本発明における確信度判定手段を構成するものである。
第2方向判定部103は、第1方向判定部102によって判定された確信度が最も高い方向(確信度が1位の方向)と確信度が2番目に高い方向(確信度が2位の方向)に限定して、文書画像情報の方向を判定するものである。第2方向判定部103は、さらに文字行抽出部1031と、座標抽出部1032と、方向判定部1033と、を備えている。文字行抽出部1031は、第1方向判定部102によって抽出された文字行が縦方向か横方向かに従い、文書画像情報から文字行を抽出する。座標抽出部1032は、抽出された文字行の先頭と終端の座標値を求めてヒストグラムを生成する。方向判定部1033は、文字行の先頭の座標値と終端の座標値の分散の度合いによって文書画像情報の方向を判定する。第2方向判定部103は、本発明における方向判定手段を構成するものである。
方向補正部104は、第2方向判定部103によって判定された文書画像情報の方向に従って文書画像情報を回転させ補正するものである。画像情報出力部105は、方向補正部104によって補正された文書画像情報を印刷または画面に出力するものである。
次に、上述したように構成されている画像処理装置による方向判定・補正処理について説明する。図2は、画像情報取得部、第1方向判定部、第2方向判定部、方向補正部、画像情報出力部が行う方向判定・補正処理手順を示すフローチャートである。
画像情報取得部101は、画像情報を取得する(ステップS201)。第1方向判定部102は、方向判定処理1により上下左右方向それぞれの確信度を判定する(ステップS202)。詳細は後述する。第2方向判定部103は、上下左右方向の4方向の確信度のいずれか1つが所定の閾値以上か否かを判断する(ステップS203)。4方向の確信度のいずれか1つが所定の閾値以上であると判断した場合は(ステップS203:Yes)、第2方向判定部103は確信度が最も高い方向を文書画像情報の方向と判定する(ステップS204)。
4方向の確信度のいずれか1つ、すなわち4方向すべての確信度が所定の閾値以上でないと判断した場合は(ステップS203:No)、第2方向判定部103は1位の方向と2位の方向が上方向と下方向、または右方向と左方向の関係か否かを判断する(ステップS205)。
1位の方向と2位の方向が上方向と下方向、または右方向と左方向の関係であると判断した場合には(ステップS205:Yes)、第2方向判定部103は方向判定処理2により1位の方向と2位の方向のうちの1方向を文書画像情報の方向と判定する(ステップS206)。詳細は後述する。方向補正部104は、判定された方向に従って画像情報を回転して補正する(ステップS207)。なお、画像情報の回転補正は、画像情報の座標を回転して補正するのみではなく、画像情報がPDF(PortableDocumentFormat)であれば、画像情報の回転角度に関する情報をヘッダ部分に記載してもよい。また、画像情報がEXIF(ExchangeableImageFileFormat)であれば、画像情報の回転角度に関する情報を付加情報として記載してもよい。画像情報を表示や印刷する際に、ビューワや印刷プログラムがPDFやEXIFに対応している場合は、画像情報の座標を変更することなく、画像情報を回転させて表示または印刷することができる。
1位の方向と2位の方向が上方向と下方向、または右方向と左方向の関係でないと判断した場合には(ステップS205:No)、第2方向判定部103は文書画像情報の方向が不明であると判定する(ステップS208)。画像情報出力部105は、画像情報を画面やプリンタに出力する(ステップS209)。
このように、第1の方向判定処理において上下左右方向の確認度が所定の閾値を超えず、文書画像情報の方向を判定できない場合または文書画像情報の方向を誤認してしまうような場合に、第2の方向判定処理が第1の方向判定処理で文書画像情報の方向として可能性が高い2方向に限定して、第1の方向判定処理と異なる方法で再度文書画像情報の方向の判定を行うことによって、正確な文書画像情報の方向を判定することができる。また、第2の方向判定処理で判定する方向を限定することによって、正しい方向を判定する可能性が高くなるとともに、処理時間も短くなる。また、文書画像情報は判定された方向に従って回転されて補正されるため、画面に表示する際にユーザが見やすい方向、すなわち文字が正立するように表示することができる。また、印刷においても、一定の方向で印刷することができる。
次に、方向判定処理1について説明する。図3は、第1方向判定部が行う方向判定処理手順を示すフローチャートである。ここでは、処理内容を簡単に説明する。さらに詳細な説明は、既に出願されている特願2005−077879号を参照する。
第1方向判定部102は、画像情報から横方向の文字行を抽出する(ステップS301)。次に、第1方向判定部102は、画像情報から縦方向の文字行を抽出する(ステップS302)。第1方向判定部102は、各文字行内部の矩形特徴を抽出する(ステップS303)。第1方向判定部102は、抽出された矩形特徴と辞書に記載された特徴とをマッチングする(ステップS304)。第1方向判定部102は、マッチングを上下左右方向それぞれに対して4回行ったか否かを判断する(ステップS305)。
マッチングを4回行っていないと判断した場合は(ステップS305:No)、第1方向判定部102は矩形の座標を変換、すなわち90度回転する(ステップS306)。マッチングを4回行なったと判断した場合は(ステップS305:Yes)、第1方向判定部102は、各方向のうち、特徴の合致率が高い方向を当該文字行の方向とする(ステップS307)。第1方向判定部102は、方向ごとに文字行の数を計測する(ステップS308)。第1方向判定部102は、方向ごとの文字行の数から各方向の確信度を算出する(ステップS309)。
なお、方向判定処理1は、ここで記載された処理には限らず、他の処理によって各方向の確信度を求めてもよい。例えば、上述した処理より高速な方向判定処理を第1の方向判定処理として行うことによって、処理速度を全体としてさらに短縮することができる。
次に、方向判定処理2について説明する。図4は、第2方向判定部が行う方向判定処理手順を示すフローチャートである。
文字行抽出部1031は、文字行の判定領域を抽出する(ステップS401)。具体的には、第1方向判定部102において確信度が1位2位の文書画像情報の方向が上方向と下方向であった場合は、暫定的に上方向とみなして領域を抽出する。また、第1方向判定部102において確信度が1位2位の文書画像情報の方向が左方向と右方向であった場合は、暫定的に左方向とみなして領域を抽出する。図5は、文書画像情報の方向を判定する画像情報の一例を示す説明図である。例えば、図5において、点線で示す矩形領域51は、文字行を切出す矩形領域として抽出される。
文字行抽出部1031は、切出した矩形領域51から文字行を抽出する(ステップS402)。図6は、図5に示す文書画像情報から文字行を抽出した一例を示す説明図である。これは、第1方向判定部102において確信度が1位2位の文書画像情報の方向が上方向と下方向であり、方向判定処理1の結果に基づいて文字行を横方向に抽出した場合の例である。なお、文字行を抽出する際に、文字行の傾きを求め、求められた傾きを考慮して後述する先頭および終端の座標を求めてもよい。文字行の傾きは、文字行内の矩形の終点座標の分布の回帰直線によって求められる。回帰直線の求め方に関しては周知であるため、ここでは説明しないが、例えば、「工科系のための統計概論」(培風館)I・ガットマン、S・S・ウィルクス共著などに詳しい。
座標抽出部1032は、抽出された文字行の先頭の座標と終端の座標を抽出する(ステップS403)。図6に示す例では、各文字行の先頭位置(左側)のx座標と、終端位置(右側)のx座標を抽出する。方向判定部1033は、複数の文字行の先頭の座標値と終端の座標値からヒストグラムを生成する(ステップS404)。図6に示す例では、文字行の先頭のx座標のヒストグラムと終端のx座標のヒストグラムが生成される。方向判定部1033は、生成されたヒストグラムから分散を測定する(ステップS405)。具体的には、文字行の先頭の座標値の分散値と終端の座標値の分散値を計測する。
ここで、文字行の始点を示すヒストグラムの特徴は、(1)同じ座標値に集中する場合と、(2)インデント(字下げ位置)の座標値と本文の先頭の座標値の2箇所の集中する場合がある。また、文字行の終点を示すヒストグラムの特徴は、(1)座標値の分散が大きい場合と、(2)同じ座標値に集中する場合がある。なお、先頭の座標値も終端の座標値も同じ座標値に集中する場合には、ある程度文字行の数が多いと考えられるため、第1方向判定部102において確信度の高い方向が判定でき、所定の閾値を超えるため、ここでの判定の困難性は問題とならない。
次に、上述したヒストグラムの特徴を用い、方向判定部1033は計測した分散値を用いて条件式から方向を判定する(ステップS406)。具体的には、文字行の先端のx座標の平均値−先頭のx座標の分散値×2に外れた文字行の数と、文字行の終端のx座標の平均値−終端のx座標の分散値×2に外れた文字行の数を計数し、計数された数が多いほうが文字行の終点と判断される。図6に示す例では、文字行の終端(右側)のほうが、x座標が分散しているため、多くの行数が計数される。よって、文字行の右側が終点であると判定する。この場合、文字は正立していると考えられ、画像情報の方向は上方向と判断される。
また、ステップS401において、判定領域として各段落(パラグラフ)を切出し、判定領域の最初の文字行の先頭の座標値と、最終の文字行の終端の座標値のヒストグラムを求めて文書画像情報の方向を判定してもよい。これにより、段落ごとに方向が異なる場合でも、正しい方向を判定することができる。
他の実施例として、文字行の先頭の座標値と終端の座標値の分散によって文字行の始点と終点を判定し、画像情報の方向を判定することに代えて、抽出された文字行を含む矩形領域を求め、矩形領域の境界位置から文字行の先端および終端までの距離を求め、その距離の分散によって画像情報の方向を判定する場合の処理を説明する。
第2方向判定部1033の座標抽出部1032は、上述した処理に代えて、抽出された文字行を含む矩形領域を求め、矩形領域の境界位置から文字行の先頭までの距離と終端までの距離を求める。また、座標抽出部1032は、矩形領域に含まれる複数の文字行の先頭までの距離と終端までの距離を求めてヒストグラムを生成する。方向判定部1033は、上述した処理に代えて、矩形領域から文字行の先頭まで距離と終端までの距離の分散の度合いによって文書画像情報の方向を判定する。
また、他の方向判定処理2について説明する。図7は、第2方向判定部が行う方向判定処理手順を示すフローチャートである。ここでは、第1方法判定部102によって判定された文字行の情報を利用して文書画像情報の方向を判定する。
文字行抽出部1031は、第1方向判定部102において確信度が1位と2位の方向と判定された文字行を選択する(ステップS701)。文字行抽出部1031は、選択された文字行を統合して簡易領域を作成する(ステップS702)。図8は、文字行を抽出し、簡易領域を生成した一例を示す説明図である。図8に示す例では、確信度が1位と2位、例えば文書画像情報の方向が上方向と下方向であり、方向判定処理1によって抽出された文字行81等を統合して簡易領域82を作成している。なお、確信度が1位と2位である複数文字行において、最小のx座標、y座標と最大のx座標、y座標を求め、最小のx座標、y座標と最大のx座標、y座標によって構成される矩形を判定領域としてもよい。
座標抽出部1032は、簡易領域から文字行ごとに先頭までの距離(以下、先頭距離という)および終端までの距離(以下、終端距離という)を計測する(ステップS703)。図8では、例えば文字行81において、簡易領域82から文字行81の先頭までの距離が先頭距離83である。また、簡易領域82から文字行81の終端までの距離が終端距離84である。方向判定部1033は、先頭距離の分散、および終端距離の分散を測定する(ステップS704)。なお、この場合もヒストグラムを生成して分散を測定してもよい。
方向判定部1033は、条件式により文書画像情報の方向を判定する(ステップS705)。上述した文字行の先頭の座標および終端の座標と同様の特徴があるため、その特徴を用いた条件式で文書画像情報の方向を判定する。具体的には、先端距離の平均値−先頭距離の分散値×2に外れた文字行の数と、終端距離の平均値−終端距離の分散値×2に外れた文字行の数を計数し、計数された数が多いほうが文字行の終点と判断される。図8に示す例では、文字行の終端(右側)のほうが、文字行の終端距離が分散しているため、多くの行数が計数される。よって、文字行の右側が終点と判定する。この場合、文字は正立していると考えられ、文書画像情報の方向は上方向と判定される。
なお、上述した実施例では、第2方向判定部103では、第1方向判定部102において抽出された縦方向または横方向の文字行に基づいて、文字行の先頭の座標値や終端の座標値を求めたが、第2方向判定部103の文字行抽出部1031において独立に縦方向および横方向の文字行を抽出してもよい。この場合、座標抽出部1032では、縦方向の文字行の先端の座標値および終端の座標値、横方向の文字行の先端の座標値および終端の座標値を求め、4つの座標値について分散を求めることによって、文書画像情報の方向を判定する。
また、矩形領域から文字行の先端までの距離や終端までの距離を求める場合も同様に、縦方向の文字行の先端までの距離および終端までの距離、横方向の文字行の先端までの距離および終端までの距離を求め、4つの距離について分散を求めることによって、文書画像情報の方向を判定する。
図9は、本実施の形態にかかる画像処理装置のハードウェア構成を示す説明図である。図9に示すハードウェア構成は、本実施の形態にかかる処理をマイクロプロセッサ等のデジタル処理によって実行するものである。図9に示すように、画像処理装置100は、PCなどのコンピュータであり、画像処理装置100の各部を制御するCPU902、CPU902を起動するためのプログラムが記憶されるROM(Read Only Memory)907、スキャナ901により読み取られた画像情報やオペレーティングシステム、アプリケーションプログラム等を記憶するハードディスク903、文字方向識別処理を行うためにハードディスク903に記憶された画像情報等を一時的に読み出して展開するワークエリアとして機能するRAM(Random Access Memory)906、画像情報や入力状況等を表示する表示装置904、画像情報等を印刷する印刷装置908、CD−ROMなどの各種光情報記録メディアに記憶されたプログラム等を読み取る光ディスクドライブ905等から構成されており、これらの各部間で送受信されるデータを図示しないバスコントローラが調整して動作する。
スキャナ901は、文書原稿を光学的に読取り電気信号である画像情報に変換する。CPU902は、本発明にかかる画像方向判定プログラムを格納してあるROM907またはハードディスク903から当該プログラムを読出してワークエリアRAM906において文書画像情報に対する画像処理を実行する。なお、CD−ROMやFDの記憶媒体からCD−ROM/FDドライブ905によって当該プログラムを読出して実行してもよい。処理された画像情報は、CPU902の指示によりハードディスク903に格納され、必要により表示装置904に表示され、印刷装置908によって出力される。
ここで、画像処理装置100は、アプリケーションプログラムとして、画像方向判定プログラムをハードディスク903に記憶している。この意味で、ハードディスク903は、画像方向判定プログラムを記憶する記憶媒体として機能する。
また、一般的には、画像処理装置100のハードディスク903にインストールされるアプリケーションプログラムは、CD−ROMなどの各種光情報記録メディアやFD等の磁気メディア等の記憶媒体に記録され、記憶媒体に記録されたアプリケーションプログラムがハードディスク903にインストールされる。このため、CD−ROMなどの各種光情報記録メディアやFD等の磁気メディア等の可搬性を有する記憶媒体も、画像方向判定プログラムを記憶する記憶媒体となり得る。さらには、画像方向判定プログラムは、例えば図示しない通信装置を介して外部から取り込まれ、ハードディスク903にインストールされてもよい。
本実施の形態にかかる画像処理装置の構成を示すブロック図である。 画像情報取得部、第1方向判定部、第2方向判定部、方向補正部、画像情報出力部が行う方向判定・補正処理手順を示すフローチャートである。 第1方向判定部が行う方向判定処理手順を示すフローチャートである。 第2方向判定部が行う方向判定処理手順を示すフローチャートである。 文書画像情報の方向を判定する画像情報の一例を示す説明図である。 図5に示す文書画像情報から文字行を抽出した一例を示す説明図である。 第2方向判定部が行う方向判定処理手順を示すフローチャートである。 文字行を抽出し、簡易領域を生成した一例を示す説明図である。 本実施の形態にかかる画像処理装置のハードウェア構成を示す説明図である。
符号の説明
100 画像処理装置
101 画像取得部
102 第1方向判定部
103 第2方向判定部
104 方向補正部
105 画像情報出力部
1031 文字行抽出部
1032 座標抽出部
1033 方向判定部

Claims (8)

  1. 文書を示す文書画像情報における上下左右方向それぞれが前記文書の上方向である確信度を判定する確信度判定手段と、
    前記確信度判定手段によって最も高い確信度が判定された第1方向と、2番目に高い確信度が判定された第2方向とが逆方向である場合、前記文書画像情報から抽出された文字行の配置位置に基づいて、前記文書の上方向が前記第1方向または前記第2方向のいずれであるかを判定する方向判定手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記方向判定手段は、さらに前記確信度判定手段によって判定された上下左右方向すべての前記確信度が所定の閾値以下である場合に、前記文書画像情報から抽出された文字行の配置位置に基づいて、前記文書の上方向が前記第1方向または前記第2方向のいずれであるかを判定すること、を特徴とする請求項1に記載の画像処理装置。
  3. 前記文字行の先頭の座標値および終端の座標値を抽出する座標抽出手段、をさらに備え、
    前記方向判定手段は、さらに前記座標抽出手段によって抽出された前記文字行の先頭の座標値および終端の座標値に基づいて、前記文書の上方向が前記第1方向または前記第2方向のいずれであるかを判定すること、を特徴とする請求項1または請求項2に記載の画像処理装置。
  4. 前記座標抽出手段は、前記文書画像情報に含まれる複数の文字行それぞれの先頭の座標値および終端の座標値を抽出し、複数の先頭の座標値の度数分布および複数の終端の座標値の度数分布を求め、
    前記方向判定手段は、さらに前記座標抽出手段によって抽出された前記先頭の座標値の度数分布および前記終端の座標値の度数分布に基づいて、前記文書の方向が前記第1方向または前記第2方向のいずれであるかを判定すること、を特徴とする請求項3に記載の画像処理装置。
  5. 前記文書画像情報中の複数の文字行を含む矩形領域の境界位置から文字行の先頭までの距離および終端までの距離を計測する座標抽出手段、をさらに備え、
    前記方向判定手段は、さらに前記座標抽出手段によって求められた前記先頭までの距離および前記終端までの距離に基づいて、前記文書の方向が前記第1方向または前記第2方向のいずれであるかを判定すること、を特徴とする請求項1または請求項2に記載の画像処理装置。
  6. 前記座標抽出手段は、前記矩形領域の境界位置から前記矩形領域に含まれる複数の文字行それぞれの文字行の先頭までの距離の度数分布および文字行の終端までの距離の度数分布を求め、
    前記方向判定手段は、さらに前記座標抽出手段によって求められた前記先頭までの距離の度数分布および前記終端までの距離の度数分布に基づいて、前記文書の方向が前記第1方向または前記第2方向のいずれであるかを判定すること、を特徴とする請求項5に記載の画像処理装置。
  7. 文書を示す文書画像情報における上下左右方向それぞれが前記文書の上方向である確信度を判定する確信度判定ステップと、
    前記確信度判定ステップによって最も高い確信度が判定された第1方向と、2番目に高い確信度が判定された第2方向とが逆方向である場合、前記文書画像情報から抽出された文字行の配置位置に基づいて、前記文書の上方向が前記第1方向または前記第2方向のいずれであるかを判定する方向判定ステップと、
    を有することを特徴とする画像方向判別方法。
  8. 請求項7に記載された画像方向判別方法をコンピュータに実行させることを特徴とする画像方向判別プログラム。
JP2006238016A 2006-03-14 2006-09-01 画像処理装置、画像方向判別方法、および画像方向判別プログラム Expired - Fee Related JP4869841B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006238016A JP4869841B2 (ja) 2006-03-14 2006-09-01 画像処理装置、画像方向判別方法、および画像方向判別プログラム
US11/713,011 US7873239B2 (en) 2006-03-14 2007-03-02 Image processing apparatus, image direction determining method, and computer program product

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006068988 2006-03-14
JP2006068988 2006-03-14
JP2006238016A JP4869841B2 (ja) 2006-03-14 2006-09-01 画像処理装置、画像方向判別方法、および画像方向判別プログラム

Publications (2)

Publication Number Publication Date
JP2007280345A true JP2007280345A (ja) 2007-10-25
JP4869841B2 JP4869841B2 (ja) 2012-02-08

Family

ID=38517906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006238016A Expired - Fee Related JP4869841B2 (ja) 2006-03-14 2006-09-01 画像処理装置、画像方向判別方法、および画像方向判別プログラム

Country Status (2)

Country Link
US (1) US7873239B2 (ja)
JP (1) JP4869841B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013250975A (ja) * 2012-05-31 2013-12-12 Fujitsu Ltd 文書処理装置、文書処理方法およびスキャナー
JP2016038821A (ja) * 2014-08-08 2016-03-22 京セラドキュメントソリューションズ株式会社 画像処理装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010540811A (ja) 2007-10-04 2010-12-24 サンジェヴィティ エネルギーシステムを提供するための方法及びシステム
US8417061B2 (en) * 2008-02-01 2013-04-09 Sungevity Inc. Methods and systems for provisioning energy systems
US9934334B2 (en) 2013-08-29 2018-04-03 Solar Spectrum Holdings Llc Designing and installation quoting for solar energy systems
US11373388B2 (en) * 2017-07-24 2022-06-28 United States Postal Service Persistent feature based image rotation and candidate region of interest
US11151373B2 (en) 2018-07-20 2021-10-19 Ricoh Company, Ltd. Information processing apparatus and information processing method
US11113559B2 (en) 2018-07-20 2021-09-07 Ricoh Company, Ltd. Information processing apparatus for improving text data recognition, information processing method, and non-transitory recording medium

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08202815A (ja) * 1995-01-24 1996-08-09 Omron Corp 書類の上下方向検知方法及び装置
JP2000113103A (ja) * 1998-09-30 2000-04-21 Ricoh Co Ltd 文書画像の方向判定方法、装置および記録媒体

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5761328A (en) * 1995-05-22 1998-06-02 Solberg Creations, Inc. Computer automated system and method for converting source-documents bearing alphanumeric text relating to survey measurements
JP3902840B2 (ja) * 1996-10-18 2007-04-11 キヤノン株式会社 画像処理装置および画像処理方法
JP3606500B2 (ja) * 1997-01-31 2005-01-05 株式会社リコー 矩形分類方法
JP4159720B2 (ja) * 2000-03-15 2008-10-01 株式会社リコー 表認識方法と表認識装置と文字認識装置及び表認識プログラムを記録した記憶媒体
JP3995185B2 (ja) * 2000-07-28 2007-10-24 株式会社リコー 枠認識装置及び記録媒体
US7151859B2 (en) * 2002-01-16 2006-12-19 Ricoh Company, Ltd Method and system for correcting direction or orientation of document image
US7082219B2 (en) * 2002-02-04 2006-07-25 The United States Of America As Represented By The Secretary Of The Air Force Method and apparatus for separating text from images
US7215828B2 (en) * 2002-02-13 2007-05-08 Eastman Kodak Company Method and system for determining image orientation
JP4553241B2 (ja) 2004-07-20 2010-09-29 株式会社リコー 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
US7684648B2 (en) * 2005-01-14 2010-03-23 Ricoh Company, Limited Reducing the size of a document image
JP4607633B2 (ja) 2005-03-17 2011-01-05 株式会社リコー 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08202815A (ja) * 1995-01-24 1996-08-09 Omron Corp 書類の上下方向検知方法及び装置
JP2000113103A (ja) * 1998-09-30 2000-04-21 Ricoh Co Ltd 文書画像の方向判定方法、装置および記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013250975A (ja) * 2012-05-31 2013-12-12 Fujitsu Ltd 文書処理装置、文書処理方法およびスキャナー
JP2016038821A (ja) * 2014-08-08 2016-03-22 京セラドキュメントソリューションズ株式会社 画像処理装置

Also Published As

Publication number Publication date
JP4869841B2 (ja) 2012-02-08
US7873239B2 (en) 2011-01-18
US20070217710A1 (en) 2007-09-20

Similar Documents

Publication Publication Date Title
JP4869841B2 (ja) 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JP5508359B2 (ja) 文字認識装置、文字認識方法及びプログラム
JP2006295606A (ja) 画像処理装置及びその方法、プログラム並びに記憶媒体
JP2004046315A (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
US9614984B2 (en) Electronic document generation system and recording medium
US8538154B2 (en) Image processing method and image processing apparatus for extracting heading region from image of document
JP5412903B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP5412916B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP2009272962A (ja) 画像処理装置
JP2006252562A (ja) 画像認識方法
US10623603B1 (en) Image processing apparatus, non-transitory computer readable recording medium that records an image processing program, and image processing method
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
US20200288040A1 (en) Image inclination angle detection apparatus that detects inclination angle of image with respect to document, image forming apparatus, and computer-readable non-transitory recording medium storing image inclination angle detection program
JP4866184B2 (ja) 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JP4998176B2 (ja) 翻訳装置及びプログラム
JP4070486B2 (ja) 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
CN100578530C (zh) 图像处理设备和图像方向判定方法
JP2015207903A (ja) 画像処理装置、画像形成装置およびプログラム
JP2007280344A (ja) 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JP4819661B2 (ja) 方向判定装置、画像処理装置、画像方向判別方法、および画像方向判別プログラム
US11087448B2 (en) Apparatus, method, and non-transitory recording medium for a document fold determination based on the change point block detection
JP3880091B2 (ja) 情報処理装置及び方法
EP2945099B1 (en) Character presence determination system and character presence determination method
JP6528927B2 (ja) 文書処理装置及びプログラム
JP2018082303A (ja) 画像処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111005

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111108

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111116

R150 Certificate of patent or registration of utility model

Ref document number: 4869841

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees