JP4598426B2 - 境界抽出方法、プログラムおよびこれを用いた装置 - Google Patents

境界抽出方法、プログラムおよびこれを用いた装置 Download PDF

Info

Publication number
JP4598426B2
JP4598426B2 JP2004101461A JP2004101461A JP4598426B2 JP 4598426 B2 JP4598426 B2 JP 4598426B2 JP 2004101461 A JP2004101461 A JP 2004101461A JP 2004101461 A JP2004101461 A JP 2004101461A JP 4598426 B2 JP4598426 B2 JP 4598426B2
Authority
JP
Japan
Prior art keywords
search
edge
image
line
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004101461A
Other languages
English (en)
Other versions
JP2005285010A (ja
Inventor
真一 江口
直子 鈴木
裕 勝又
浩一 金元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Priority to JP2004101461A priority Critical patent/JP4598426B2/ja
Priority to DE602004017697T priority patent/DE602004017697D1/de
Priority to EP04021046A priority patent/EP1587295B1/en
Priority to KR1020040074687A priority patent/KR100640035B1/ko
Priority to US10/958,231 priority patent/US7729536B2/en
Priority to CNB2004100841944A priority patent/CN100426313C/zh
Publication of JP2005285010A publication Critical patent/JP2005285010A/ja
Application granted granted Critical
Publication of JP4598426B2 publication Critical patent/JP4598426B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Image Input (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

本発明は、概して画像処理装置に関し、さらに詳細には画像処理装置において取り込んだ背景を含む画像から用紙部分を抽出する技術に関する。
例えば紙などで出来た原稿を読み取ることのできる装置として、スキャナ、コピー機、ファクシミリなどの画像処理装置がよく知られている。このような画像処理装置における原稿画像の読み取りは、一般に、画像読取装置の読み取り面に向けて原稿の表面(読取対象面)がセットされ、その原稿の背面から、原稿を覆う原稿カバーが被せられた状態で、読み取りが行なわれる。そして、画像の読み取りに際しては、セットされた原稿表面に向けて読み取り面側から光を照射し、反射してきた光を読み取り面側に構成された光読み取り部(CCD)で読み取る。原稿の大きさが読み取り面よりも小さい場合には、読み取り面側から見た原稿の周りに原稿カバー(以降、背景と称する)も現れてしまい、画像読み取り時には原稿の表面に加えてこの背景も読み取られることとなるため、当然、取得される画像データは、原稿周りに背景か写りこんだものとなる。
そこで、発明者らは、画像を取り込む時点では特別な工夫を必要とせず、取り込んだ後の画像処理のみで背景と原稿との材質の違いを利用して原稿のエッジを検出する技術を開示した(特許文献1)。
しかし、背景と原稿との材質が類似している場合や、フラットヘッド型スキャナで読み取った画像のように背景側の画像が安定していない場合などは、エッジ検出精度が低下するという問題があった。
特開2002−370596号広報(図2)
本発明は、背景側画像が不安定であったり、背景と原稿との材質が類似していたりしても原稿のエッジを高い精度で検出できる技術を提供することを目的とする。
本発明は、上記の課題を解決するため、原稿をスキャナで取り込んで得た画像において材質の違いを利用して原稿の境界を構成する1つのエッジを検出する方法を与える。本方法は、画像を尽くす全ての探索行に対し、画像の端からエッジと直角な方向に探索してエッジ片を検出するステップと、エッジ片が検出できない行が存在する場合、全ての探索行に対し、画像の中央付近から画像の端へと探索することにより、エッジ片を検出するステップと、全ての探索行に対するエッジ片から直線エッジを決定するエッジ決定ステップとを含むことを特徴とする。
エッジ決定ステップは、好ましくは、全ての探索行に対するエッジ片から複数のエッジ候補を求める候補決定ステップと、複数のエッジ候補から最適な候補を選ぶ選択ステップとからなる。
選択ステップは、罫線との比較に基づいて最適な候補を選ぶステップで構成してもよい。
本発明は、別の面では、プログラムを格納する記憶媒体とプログラムの制御下で動作するCPU(中央情報処理装置)を備えた装置において、記憶媒体に格納されCPUに実行されて、原稿をスキャナで取り込んで得た画像から原稿の境界を構成する1つのエッジを検出する境界検出プログラムを与える。本プログラムは、画像を尽くす全ての探索行に対し、画像の端からエッジと直角な方向に探索してエッジ片を検出するステップと、エッジ片が検出できない行が存在する場合、全ての探索行に対し、画像の中央付近から画像の端へと探索することにより、エッジ片を検出するステップと、全ての探索行に対するエッジ片から直線エッジを決定するエッジ決定ステップとを含むことを特徴とする。
また、本発明によれば、上述の方法を用いて、原稿をスキャナで取り込んで得た画像から原稿の境界を抽出する機能を有する装置を得ることができる。
本発明によれば、エッジ片が検出できない行が存在する場合、全ての探索行に対し、画像の中央付近から画像の端へと探索するので、検出の精度が増す。
本発明によれば、全ての探索行に対するエッジ片から複数のエッジ候補を求め、複数のエッジ候補から最適な候補を選ぶので、さらに精度が向上する。
以下、本発明の実施形態と添付図面とにより本発明を詳細に説明する。なお、複数の図面に同じ要素を示す場合には同一の参照符号を付ける。
〔第1の実施形態〕
図2は、本発明の一実施形態により、取り込んだ画像から原稿部分を抽出して使用する画像処理装置の構成を示す図である。図2において、画像処理装置1は、本体12と本体の上面においた原稿を覆うための原稿カバー10からなる。本体12は、本体12の上面に置かれた原稿を読み込むスキャナの機械部分であるスキャナ機構部14,画像印刷装置の機械部分である画像印刷機構部16、およびスキャナ機構部14と16との連携により所望の機能を果たす電子装置部20から構成される。電子装置部20は、周知のように図示しないCPU(中央情報処理装置),ROM(read only memory)、RAM(random access memory)などからなる制御部22,種々のプログラムおよびデータを格納する二次記憶装置26,およびスキャナ機構部14と画像印刷機構部16とのインタフェースを与える入出力インタフェース24から構成される。二次記憶装置26は、オペレーティイングシステム(OS)32,スキャナ機能部と連携して画像を取り込むスキャナドライバ34,スキャナで取り込んだ画像からエッジを検出する境界抽出プログラム36、および画像処理装置1の機能を実現するための種々のプログラム38を格納している。図2の画像処理装置1は、スキャナから取り込んだ画像に含まれる原稿部分を抽出して処理する装置であれば、何でもよく、例えば、複写機、ファクリミシ、OCR装置、自動伝票処理装置などである。
原稿を画像処理装置1本体の所定の位置に置いて読み込んだ後、境界抽出プログラム36を呼び出して実行し、読み込んだ画像から原稿領域を抽出する、即ち、原稿の左右上下のエッジを検出する。左右上下のエッジは、それぞれ同じ要領で検出できるので、まず1つのエッジ、例えば、左側のエッジの検出について説明する。
図1は、本発明の一実施形態による境界抽出プログラム36の制御下で制御部22が取り込み画像から原稿の1エッジを検出する動作を示すフローチャートである。図1の多くの部分は、既に述べた本出願人による特許出願第2000−370596号広報(特許文献1)に開示してあるが、図1において本発明の原理に係る動作ステップは太線で示した。したがって、公開済みの内容は詳細な説明を省略する。
図3は、境界抽出プログラム36で用紙(または原稿)の境界を抽出しようとする画像の一部を示す図である。図3において、垂直方向の波線が原稿の左エッジであり、左エッジの右側の部分が原稿であり、左エッジの左側の縦長の領域が原稿カバーである。原稿には、横の罫線と縦の罫線が含まれている。以下、このような画像において、原稿のエッジを検出する動作を説明する。
境界抽出プログラム36が呼び出されると、まずステップ100において、原稿の印字領域を検出して、この印字領域をステップ104以下の処理において処理対象から除外する。具体的には、例えば、図4に示すような印字領域除外処理により、RGB階調値で200以下の画素領域を特定・記憶して、ステップ104以下の探索対象から外す。図5に、元の画像から印字領域を除外する様子を示す。印字領域除外処理は、図4のフローチャートに従って行ってもよいが、これに限らず、他の適切な方法で行ってもよい。図4の詳細な説明は、後述する。
本発明によれば、ステップ102において、ステップ100で検出した印字領域を周知の方法により探索して縦および横の罫線を抽出する。後に、ここで検出した罫線を利用して仮エッジの決定を行う(後述のステップ110)。
次に、ステップ104において、探索領域に設定した各ブロックに対して、2DFFT(2次元高速フーリエ変換)によりスペクトルを求め、求めたスペクトルの高周波成分、低周波成分および直流成分のそれぞれの平均値を求め、スペクトルの半値幅を周波数分布とし、求めた高周波成分平均値、低周波成分平均値、直流成分平均値および周波数分布を特徴量とすることにより、特徴強調を行う。この特徴強調は、例えば、図6の特徴強調処理によって行ってもよいが、これに限らず、他の適切な方法で行ってもよい。図6の詳細な説明は、後述する。図7は、図6の特徴強調処理によりサンプル画像に対して行った2DFFT(2次元高速フーリエ変換)の結果を示すデータ表である。
次に、ステップS106において、ステップ104で求めた特徴量を用いてエッジを求め、これを仮エッジとする。この仮エッジ決定ステップS106は、エッジ候補決定ステップ106、複数エッジ候補抽出ステップ108および仮エッジ選択ステップ110からなる。
具体的には、ステップ106において、ステップ104で求めた特徴量を用いて、エッジ候補決定処理を行う。まず、ステップ210において、探索方向を端から印字領域の始まりまでとし、開始ブロックを設定する。ステップ220において、図9に示すように、すべての行に対し、ブロックごとの特徴量を用いて探索方向に探索しエッジ片を求める。なお、探索処理により検出される探索ブロックの長さに相当するエッジ相当部分をエッジ片と称する。そして、判断ステップ250において、エッジ片が見つからなかった探索行が存在するか否かを判断する。エッジ片が検出できなかった行がある場合、ステップ260において、探索方向を印字領域から端(この例では、左エッジの検出を例に取っているので、左端)に設定し、開始ブロックを設定した後、ステップ220に戻り、すべての探索行に対して印字領域の左端から左側に向かって探査を行ってエッジ片を検出する。なお、この場合、中央から左側に向かって探索してもよいが、印字領域を除外して探索する方が効率的である。なお、ステップ106に付いては、一実施例を後述する。
本発明によれば、ステップ108において、ステップ106で求めたエッジ候補のエッジ片から複数のエッジ候補を抽出する。この詳細な処理例を図10に示す。図10において、まず、ステップ460において、ステップ106で求めたエッジ片の列全体に対して直線近似を行い1つ目のエッジ候補とする。ステップ462において、各ブロック間のx軸差分Δxを求める。ここで、「各ブロック間のx軸差分Δx」とは、隣接するエッジ片の探索方向の位置の差のことである。現在の例では、探索方向が水平なので、隣接するエッジ片の水平軸(即ち、x軸)方向の位置(即ち、x座標)の差のことである。ステップ464において、x軸差分Δxの絶対値の平均を求める。ステップ466において、x軸差分Δxの絶対値が平均を超えるブロックを除外したブロック群(仮に、「中央沿いブロック群」と称する)、即ち、ステップ106で求めたエッジ片の列の比較的中央沿いのエッジ片の集合を求める。ここで、ステップ468において、閾値を0とする。
次に、ステップ470において、x軸差分Δxがプラスの閾値内にあるブロック群(即ち、右寄りのエッジ片の集合)を中央沿いブロック群に加えたブロック群(仮に、「中央右よりブロック群」と称する)を求める。ステップ472において、x軸差分Δxがマイナスの閾値内にあるブロック群(即ち、左寄りのエッジ片の集合)を中央沿いブロック群に加えたブロック群(仮に、「中央右よりブロック群」と称する)を求める。
そして、判断ステップ474において、閾値がx軸差分Δxが最大のブロックに到達したか否かを判断する。達していなければ、現在の閾値に所定の閾値増分αを加えて、ステップ470に戻り、ステップ470〜476を繰り返す。判断ステップ474において、x軸差分Δxが最大のブロックに到達した場合、ステップ478において、以上求めた各ブロック群の直線近似を行い、エッジ候補とする。このようにして複数のエッジ候補を求めることができる。閾値増分αを適当な大きさに設定することにより、求めるエッジ候補の数を調節することができる。
このようにして、複数のエッジ候補を抽出した後、ステップ110において、ステップ108で求めたエッジ候補の中から、ステップ102で求めた罫線と最も平行なものを仮エッジとする。即ち、現在検出中のエッジの方向と同じ方向の罫線(この例では、左エッジの検出であるから縦方向の罫線)と最も平行なエッジ候補を仮エッジとする。現在検出中のエッジが上下の水平なエッジである場合、横方向の罫線と最も平行なエッジ候補を仮エッジとする。図11は、ステップ110において、複数のエッジ候補から罫線に最も平行なものを選択する方法を例示する図である。図11(a)において、まず、罫線の一端を通る横軸が各エッジ候補と交わる点のx座標と前記の一端のx座標との差をΔTとし、罫線の他端を通る横軸が上述のエッジ候補と交わる点のx座標と前記の他端のx座標との差をΔBとする。次に、図11(b)のフローチャートを参照して動作を説明する。ステップ482において、罫線上端と各エッジ候補との水平方向の差ΔT、および罫線下端と各エッジ候補との水平方向の差ΔBを求める。ステップ484において、ΔTとΔBとの差が最小のエッジ候補を選択し、仮エッジとする。図11(a)の例では、エッジ候補2の方がΔTとΔBとの差が小さいので選択される。
なお、ステップ110で選択したエッジを最終的なエッジとして、エッジ検出処理を終了してもよいが、この実施形態では、エッジ検出精度を上げるため、ここで求めたエッジを仮エッジとして、次のステップにおいて、この仮エッジの近傍でさらに高精度の(処理ブロックをより小さくした)エッジ検出を行い、正確なエッジ位置を絞り込む。
即ち、ステップ112において、ステップ110で求めた仮エッジを基に、最終的なエッジを決定する。ステップ112の詳細は、図12に示す。ステップ120において、図13に示すようにステップ110で求めた仮エッジの左右それぞれ16画素の幅にわたり縦32画素x横1画素のブロックで特徴を抽出し、その特徴に基づくピーク位置をエッジ片とする。ステップ122において、求めたエッジ片に直線近似を行い、直線を得る。さらに、ステップ124のロバスト補正において、ステップ122で求めた直線を基準にステップ120で求めたエッジ片の集合からエッジと判断するには相応しくないエッジ(ステップ122で求めた直線から離れすぎているエッジ)を除外したエッジの集合に直線近似を行って、最終的なエッジを求める。ステップ120の詳細は後述する。
このように、図1の実施形態では、ステップ106で縦32画素x横4画素の大きめのブロックで探索することによりエッジ候補を決定し、さらにステップ112において、仮決定されたエッジの近傍を縦32画素x横1画素の小さめのブロックで探索することにより精度を上げてエッジを求めている。しかし、本発明は、このように必ずしもブロックサイズを変えて2段階にエッジを検出する方法のみに適応できる訳ではなく、後半の小さいブロックごとの探索によるエッジ検出は省略することができる。例えば、ステップ112を省略して、ステップ110の後に図1のエッジ検出処理を終了してもよい。
以上を要するに、本発明の原理は、(1)取り込んだ画像の端から各探索行を探索して、材質の違いを利用してエッジ片が発見できない行がある場合、中央付近(好ましくは、印字領域の端)から逆に端に向かって探索してエッジ片を検出すること、および(2)求めたエッジ片の列から複数の直線エッジ候補を決定し、それらのエッジ候補を予め抽出しておいた罫線と最も平行な候補をエッジとして選択することである。以上の実施形態では、ステップ104、S106において大きめのブロックにより(比較的低い精度で)仮エッジを求め、ステップ112において、仮エッジの近傍で小さめのブロックで(精度を高めて)最終的なエッジを求めた。しかし、本発明は、このように2段階にエッジを求める方法に限らず、取り込んだ画像の端から各探索行を探索してエッジを求めるエッジ検出方法であれば、如何なるエッジ検出方法にも適用することができる。したがって、ステップ100,104,220,112は、それぞれの目的に叶う限り如何なる方法で実現するものでもよい。上述のようにステップ112は省略可能である。
ここで、ステップ100,104,106,および112の実施例を詳細に説明するが、これらのステップは、その目的に叶えさえすれば、以下の実施例に限らず、如何なる形態で実現してもよい。
<印字領域除外>
図4の動作フローにおいては、先ず、図3の枠付き原稿画像Aの、画像平面上において最初の読み取り対象とする開始ラインの位置を図3に示す画像Aの上端の位置に設定する(S300)。そして、設定したラインの図3の左端に位置する画素を読み取り対象として設定する(S302)。ここで、上記設定した画素のRGB階調値を読み取って、本例において予め取り決めた、印字領域として除外する基準となるRGB階調値200を超えないものがあるかどうかを判定する(S304)。この判定の基準となるRGB階調値は、原稿に応じて適宜設定してよい。ステップS304において、読み取った画素のRGB階調値が200を超えている場合は、その画素は印字領域ではないと判定し、同一ライン上の右隣に位置する画素を次の読み取り対象として設定する(S306)。また、ステップS304において、読み取った画素のRGB階調値か200以下であった場合は、この領域に印字領域があるものと仮設定し、続くステップS308のノイズ判定処理に移行する。ステップS308においては、ステップS304において印字領域があるものと仮設定された画素に対し、画像平面上における位置が連続し、印字領域として仮設定されている画素が存在するかどうかの判定を行なう。このステップS308において連続する画素か存在しないと判定されると、ステップS306の処理に移行して、現在処理対象となっている画素の、同一ライン上の右隣に位置する画素を読み取り対象として設定し、上記同様なステップで処理を実行する。
これは、2画素続けて印字領域として仮設定されていないものは、印字領域とは関係のない、ゴミ等によるノイズである可能性が高いためで、この判定の基準とする連続画素数の設定は、適宜設定できる。ステップS308において連続する画素が存在すると判定されると、当該画素を図3の画像Aの左端から最初に検出された印字領域200として設定する(S310)。続いて、ステップS312において、本ラインで処理されていない画素が残っているかどうかを判定する。このステップS312において本ラインで処理する画素か残っていると判定されると、ステップS306の処理に移行して、残りの画素についても同様に、上述したステップで処理を実行する。ステップS312において本ラインで処理する画素かないと判定されると、本ラインが図3の画像Aの下端まで移動した最終ラインであるかどうかを判定する(S314)。このステップS314において本ラインが最終ラインではないと判定されると、画像平面上における、本ラインの直下の位置にラインを設定し(S316)、この設定されたラインの左端から、ステップS302以後に示す処理を繰り返し実行する。そして、図3の画像Aにおいて全ての走査か終了する、上記最終ラインまでの走査が終了すると、ステップS314において本ラインが最終ラインであると判定されて本処理を終了する。
<特徴強調>
この特徴強調ステップ104、およびエッジ片検出ステップ220においては、画像Aの探索領域(印字領域除外部)を大きめの画素ブロック、例えば、縦32画素×横4画素のブロックに分割して、これらのブロック単位に処理を行うものとする。
図6の動作フローにおいては、先ず、画像Aの上部左端のブロックを開始ブロックとして設定する(S500)。そして、現在のブロックが図5の印字領域を含んでいるかどうかを、図1の印字領域除外ステップ100によって特定された画素の図4の印字領域を示す情報に基づいて判定する(S502)。このステップS502において現在のブロックに図4の印字領域か含まれていると判定されると、画像Aにおいて現在のブロックの次のブロックを処理対象の領域として設定し直す(S504)。ステップS502において現在のブロックに図4の印字領域か含まれないと判定されると、現在のブロックに対し、ブロック単位で、既知の2次元高速フーリエ変換処理(以下、2DFFTと略記する)を実行し、現在のブロックのスペクトルを求める(S506)。ここで、現在のブロックにおいて求めたスペクトルの、高周波成分(本例においては、1/2π≦ω<3/4πとする、なおωは周波数を示す変数である)の平均値を求める(S508)。
続いて、現在のブロックにおいて求めたスペクトルの、低周波成分(本例においては、0<ω<1/2πとする)の平均値を求める(S510)。さらに続けて、現在のブロックにおいて求めたスペクトルの、直流成分(本例においては、ω=0とする)の平均値を求める(S512)。図7は、このように探索した縦32画素×横212画素の矩形領域内において、ブロック毎に求めた上記各種成分の平均値の実測データの例である。なお、この実測テータにおいてはRGB別に算出結果を示すものとし、RGB別の各値の変動を分かり易いものとした。同区のX座標は、図3の画像AのX軸方向に対応し、図3の矩形領域の左端をX座標の原点として右方向に画素数をカウントした時の画素数の値が示されている。そして、図7には、図3の矩形領域の左端からの画素数の位置である、X座標に指定された位置に対応させて、RGB別の直流成分(直流成分R、直流成分G、及び直流成分B)として階調値、RGB別の低周波成分(低周波成分R、低周波成分G、及び低周波成分B)としてスペクトル値、及びRGB別の高周波成分(高周波成分R、高周波成分G、及び高周波成分B)としてスペクトル値が示されている。上述したステップでは3種類の成分の平均値を求めたが、更にここでは、現在のブロックのスペクトルから半値幅を求め、求めた半値幅を現在のブロックの周波数分布として設定する(S514)。なお、半値幅とは、横軸を周期、縦軸をスペクトルの強さとした時に得られる周波数分布図において、ピーク値の半分の強さを示す、ピーク周期近傍の2つの周期間の間隔である。そして、ステップ508からステップS512で求めた各種成分毎の平均値、及びステップS514で設定した周波数分布を現在のブロックの特徴量として設定する(S516)。ここで、図6に示される枠付き原稿画像Aの全てのブロックに対して上述した処理を実行したかどうかを判定する(S518)。このステップS518において現在のブロックの次の走査対象となるブロックがあると判定されると、ステップS504に移行して図6の画像Aにおける次の走査対象となるブロックを処理対象の領域として設定し直し、上述したステップで処理を実行する。そして、ステップS518において、画像Aの全てのブロックに対して上述した処理が実行され、現在のブロックの次の走査対象となるブロックがないと判定されると、本処理を終了する。なお、本動作フローにおいては、4つの特徴量を求めたが、これのみに限定されず、さらに他の特徴量を加えても良い。このように、図1の特徴強調ステップ104においては、印字領域除外ステップ100によって処理を施された枠付き原稿画像Aから、所定の大きさのブロックを単位とする各種特徴量を抽出することができる。
<エッジ候補決定>
図8は、図1のエッジ候補決定ステップ106においてエッジ候補のエッジ片を求める処理の一実施例を示すフローチャートである。本動作フローは、図1の特徴強調ステップ104で抽出した各種の特徴量に基づいて実行される。
本動作フローにおいては、先ず、図3の画像Aの領域を分割した縦32画素x横4画素のブロックを単位に、画像の処理対象範囲を判定し、該当する処理範囲を設定する(Sll00)。なお、本例における処理範囲の判定は、図4(b)に印字領域を黒塗りして示した画像Aの、左端から印字領域までを処理対象範囲であるとして判定する。このようにして処理範囲が確定すると、画像Aの上端のラインを、ブロックを読み取る開始ラインとして設定する(S1102)。ここで、後に詳しく説明する、上記各種の特徴量の重み決定処理を実行する(S1104)。そして、ステップ210において、探索方向を端から印字領域までとし、画像Aの左上のブロックを開始ブロックとして設定する。続いて、現在のブロックに対して隣接して連なるブロック(本例においては、該当するブロックに対して左に隣接して連なる、最大で2つのまでブロックとする)に対し、ステップ104で求めた特徴量毎の平均を求める(S1108)。そして、このようにして求めた特徴量毎の平均を、引き続き図8の処理(ステップS1110)に使用する。図8のステップS1110においては、処理の対象となっているブロックの各種特徴量とステップS1108で求めた特徴量毎の平均との、特徴量毎の変化量を求める。
このようにして求めた各種特徴量の変化量を、ステップS1104の重み決定処理で求めた各種特徴量の重み、または、予め統計的に求めておいた重み(望ましくは、高周波成分を1、低周波成分を2、直流成分を1、周波数分布を1とする)で足し合わせ、その値を現在のブロックにおける特徴変化量として設定する(S1112)。ここで、ステップS1112でブロック毎に設定された特徴変化量のピークを求めるための処理を行なう(S1114)。ここに示すピークを求めるための処理(ピーク検出処理)は、後に詳しく説明するものとする。そして、上記ピーク検出処理に基つく現在のブロックの特徴変化量の、ピーク判定を行なう(S1116)。このステップS1116においてピーク無しと判定されると、続いて、次に走査するブロック(図12においてはブロック1206)に対して、そのブロックが印字領域であるかどうかを判定する(S1118)。そして、このステップS1118において、次に走査するブロックは印字領域ではないと判定されると、続いて、そのブロックは、中央のブロックから1ブロックだけ走査方向側のブロックであるかどうかを判定する(S1120)。このステップS1120においてそのブロックは中央のブロックから1ブロックだけ走査方向側のブロックであると判定されると、処理対象となっているブロックが最終ラインに位置するものであるかどうかを判定する(S1122)。また、ステップS1116の処理にもどって、ステップS1116から示した各ステップか上記とは反対の判定を受けた場合は、以下のように処理を実行する。ステップS1116においてピーク有りと判定されると、処理対象となっているこのブロックをエッジに相当するブロックであると判定し、このブロックを、本例では原稿画像の左端のエッジとして仮決定する(S1124)。そして、上述したステップS1122の処理に移行する。ステップS1118において、処理対象のブロックか印字領域であると判定されると、ステップS1122の処理に移行する。
ステップS1120において、そのブロックは中央のブロックから1ブロックだけ走査方向側のブロックでないと判定されると、ステップS1126の処理に移行して次に走査するブロックを処理対象のブロックとして設定し、ステップS1108から、上述したステップ順で処理を繰り返し実行する。ステップS1122において、処理対象となっているブロックが最終ラインに位置するものでないと判定されると、ステップS1126の処理に移行して、上述したステップ順で処理を実行する。また、ステップS1122において、処理対象となっているブロックが最終ラインに位置するものであると判定されると、続くステップ250の処理に移行する。ステップ250では、エッジ片が発見できなかった行があるかどうかを判断する。発見できなかった行がある場合、ステップ260において、探索方向を印字領域から画像Aの端までとして、開始ブロックを設定して、ステップS1108に戻る。判断ステップ250において、エッジ片が発見できない行が無い場合、このエッジ候補決定処理を終了する。
<ステップ120(高精度エッジ検出)>
本動作ステップにおいては、先ず、図9の画像Aの上端のラインにエッジの位置として仮設定された画素列(縦32画素×横1画素)の、走査方向に対して前後に位置する各々16画素の範囲を処理の対象として設定する(S1700)。そして、本処理におけるブロックの単位を、縦32画素、横1画素の範囲とした画素列とし、この画素列単位で上記範囲の1次元高速フーリエ変換を行ない、各画素列のスペクトルを求める(S1702)。図13は、位置ラインに対する上記処理対象の範囲を示している。図13は、図9の近似直線の画素列を含む、一ラインの処理対象範囲を示している。同図の矩形領域1800が、破線で示すライン1802の処理対象範囲となり、特に図示されていないが、他のラインも同様に処理対象範囲が設定される。矩形領域1800を拡大した部分には、エッジの位置として仮決定された仮エッジと上記処理対象の範囲の位置関係を示している。この図から、図中の中央に線で示された仮エッジの、矢印で示す走査方向に対して前後16画素に配列された各画素列(縦32画素×横1画素)を、上記処理対象の範囲としていることが分かる。さて、ステップS1702でスペクトルを求めると、続いて、スペクトルの各成分(高周波成分、低周波成分、及び直流成分)及び周波数分布の平均値を上記画素列単位で求める(S1704)。そして、図8のステップS1104で求めた、または予め統計的に求められた重みで、画素列ごとに成分及び周波数分布を足し合わせ、得られた値をその画素列の特徴値とする(S1706)。ここで、この特徴値に対して画素列ごとに既知のウエーブレット変換を行なう(S1708)。
次に、ウエーブレット変換によって得られた値を用いて、ライン単位で、公知のピーク検出処理を行いエッジ片を検出する(S1710)。そして、処理の対象としているラインが仮エッジとして指定された最終のラインであるかどうかを判定する(S1712)。最終ラインでなければ、次に走査するラインを設定し(S1714)、ステップS1702から上述したステップを繰り返す。ステップS1712において最終ラインと判定されると、ステップ120の処理を終了する。
<4辺からなる境界の検出>
以上のようにして、原稿の1辺のエッジを高精度で求めることができる。以上の説明を基に、原稿のすべての辺を求めることにより、取込画像から原稿を抽出する場合を説明する。図14は、図1に示す本発明のエッジ検出原理により原稿を抽出する動作を示すフローチャートである。ここで、原稿の左右上下のエッジをそれぞれSL、Sr,SuおよびSdとする。これら4つのエッジのうち、現在の処理対象のエッジをSx(x=L、r、uまたはd)と表す。図14の主な処理ステップは、既に説明してあるので、処理の流れを中心に説明する。
図14において、ステップ100および102の処理の結果は、以降の探索処理に方向とは関係なく利用できるので、最初に1回実行すればよい。ステップ103において、現在の検出対象エッジSxのxに左エッジを表すLを設定する。
次に、ステップ104において、ブロックごとに特徴量を求め特徴強調を行う。この処理では、縦長のブロックを用いるので、左右のエッジと上下のエッジにはそれぞれ別途ステップ104を実行する必要がある。後続のステップ106〜112は、各エッジに対して実行する必要がある。
しかがって、ステップ112の終了後、ステップ130において、x=rかどうか判断する。xがrでなければ、ステップ132において、xを右エッジを表すrに設定して、ステップ106に戻り、右エッジを検出する。
判断ステップ130において、x=rならば、右エッジの検出が終わったことになるので、判断ステップ134において、xが上エッジを表すuであるかどうかを判断する。xがuでないならば、まだ上エッジの検出は終わっていないので、ステップ136において、xをuに設定し、ステップ136に戻り、上下方向の探索用にブロックごとの特徴量を求めてらか、上エッジの検出を行う。
判断ステップ134において、x=uならば、上エッジの検出は終わったことになるので、判断ステップ138において、xが下エッジを表すdであるかどうかを判断する。xがdでないならば、下エッジの検出は終わっていないので、ステップ140において、xをdに設定して、ステップ106に戻り、下エッジの検出を行う。判断ステップ138において、x=dならば、下エッジの検出も終わっていることになるので、原稿抽出処理を終了する。
図15は、図14において、原稿の4つのエッジを検出する際の2通りの探索方法を示す図である。一つは、探索する方向は固定し、原稿を順次回転させて4つのエッジを検出する方法である(図中の左側)。2つ目は、画像の方向は固定しておき、探索方向を順次回転する方法である。何れの場合も、本発明によれば、ステップ106(図1および12)およびステップ220に示したように、すべての探索行に対して外側から印字領域方向に探索してエッジ片が発見できない行が存在する場合、印字領域から端に向かって探索を行う。このようにすることによりエッジ検出の精度を高めることができる。
<種々の変形>
図16は、本発明の一実施形態による境界抽出プログラムをコンピュータにロードして実行する実施例を示す略ブロック図である。図16のシステムは、原稿を取り入れるスキャナ40と、本発明のエッジ抽出プログラム36を格納して実行しうるコンピュータ42を備える。スキャナ40で取り入れた画像に含まれる原稿の部分をコンピュータ42に格納された境界抽出プログラム36で抽出し、利用する。
図17は、本発明の一実施形態による境界抽出プログラムをコンピュータにロードして実行する第2の実施例を示す略ブロック図である。図17のシステムは、コンピュータ42と通信できるように接続されたファイリングコンピュータ44をさらに備えた点を除けば、図17のシステムと同じである。図17のコンピュータ42は、スキャナ40から取り込んだ画像からプログラム36で原稿抽出を行った後、自らは使用せず、別の装置、例えばファイリングコンピュータ44に送ってもよい。なお、コンピュータ42は、この場合、送る前に、画像から背景部分を切り取り、原稿の大きさを調節したり、エッジ検出の過程で得た情報を基に原稿画像を回転させて斜行補正を行ってもよい。
図18は、本発明の一実施形態による境界抽出プログラムを用いた画像取り扱いシステムの動作例を示すフローチャートである。先ず、スキャナ40から読み込んだ画像データを取り込む(S2400)。そして、境界抽出プログラム36により原稿のエッジ検出処理をその画像データに施し(S2402)、原稿のエッジ情報を取得する(S2404)。4方をエッジで囲まれた画像領域(原稿画像)のみを抽出する(S2408)。そして、このように抽出した原稿画像を記録する(S2410)。
図19は、本発明の一実施形態による境界抽出プログラムを用いた第2の画像取り扱いシステムの動作例を示すフローチャートである。先ず、スキャナ40から読み込んだ画像データを、コンピュータ42に取り込む(S2500)。そして、上記の境界抽出プログラム36によりエッジの検出処理を行い(S2502)、原稿のエッジ情報を取得する(S2504)。ここで、画像データの編集として、取得されたエッジの、画像平面上の軸(X軸またはY軸)に対する例えば最小の傾きを検出し(S2506)、その傾きがなくなるように画像データを回転して斜行補正する(S2508)。そして、このように補正された画像原稿を画像データ蓄積部2300に記録する(S2510)。
なお、上図18と図19の動作フローを組み合わせることも可能であり、例えば、図19のステップS2506及びステップS2508の処理を図17のステップS2404及びステップS2408の処理の問に行なわせるようにすることができる。このように斜行補正を施すことにより、後処理をしやすくすることが可能になる。また、背景画像データを切り落とすことによって、余分なデータを取り除く事か可能になり、データ量も小さくて済むので、データの保管も少ない容量で済み、データの利用において処理スピードを早くすることができる。
図20は、本発明の一実施形態による境界抽出プログラムを用いて取り込み画像から原稿を抽出し、文字認識を行うシステムの動作例を示すフローチャートである。先ず、スキャナ40から読み込んだ画像データを取り込む(S2700)。そして、境界抽出プログラム36によりエッジ検出処理をその画像データに施し(S2702)、原稿のエッジ情報を取得する(S2704)。さらに、画像データに対して、4方をエッジで囲まれた画像領域以外の画像領域を判定し(S2706)、4方をエッジで囲まれた画像領域(原稿画像)以外の画像領域の階調濃度を黒色になるように変更する(S2708)。そして最後に、原稿画像の始点(例えば画像平面上における原稿画像の上端左端の位置)を特定して、例えば、予め記憶部などに記憶された、上記始点からの印字位置を対象に、画像を切り抜いてその画像を分析し、その画像に含まれる文字をパターン認識処理に基づいて抽出するなどといった文字認識処理を施す(S2710)。
なお、本処理において、図19の動作フローと組み合わせることも可能であり、例えは、図19のステップS2506及びステップS2508の処理を図20のステップS2704及びステップS2706の処理の問に行なわせるようにすることができる。このように、背景画像を黒色に着色することで、従来の黒色背景のスキャナから取り込んだ、黒色背景画像を原稿画像の縁の周辺に有した、従来画像と同じ仕様の画像データを作成できるので、従来の黒色背景を有した画像データを編集する装置(例えばOCR処理装置など)に対して、本発明の画像処理装置を介して得られた画像データを利用させることも可能である。
以上は、本発明の説明のために実施例を掲げたに過ぎない。したがって、本発明の技術思想または原理に沿って上述の実施例に種々の変更、修正または追加を行うことは、当業者には容易である。
例えば、以上説明してきた各処理(当然、エッジ検出処理を含む)はプログラムの形態で配布することもできる。その場合、フロンピーディスク(登録商標)、CD−ROM,DVDなどの記録媒体に上記プログラムを記録させて配布したり、或いは、公衆網等で用いられる伝送媒体を介して、そのプログラムの一部、若しくは全部を配信するようにしたりすることができる。
(付記1)原稿をスキャナで取り込んで得た画像において材質の違いを利用して原稿の境界を構成する1つのエッジを検出する方法であり、
前記画像を尽くす全ての探索行に対し、前記画像の端から前記エッジと直角な方向に探索してエッジ片を検出するステップと、
前記エッジ片が検出できない行が存在する場合、前記全ての探索行に対し、前記画像の中央付近から前記画像の前記端へと探索することにより、エッジ片を検出するステップと、
全ての探索行に対する前記エッジ片から直線エッジを決定するエッジ決定ステップとを含む
ことを特徴とする境界検出方法。
(付記2)前記エッジ決定ステップが、
全ての探索行に対する前記エッジ片から複数のエッジ候補を求める候補決定ステップと、
前記複数のエッジ候補から最適な候補を選ぶ選択ステップとからなる
ことを特徴とする付記1記載の境界検出方法。
(付記3)前記画像において前記原稿から罫線を抽出するステップをさらに含み、
前記選択ステップが、前記罫線との比較に基づいて前記の最適な候補を選ぶステップからなる
ことを特徴とする付記2記載の境界検出方法。
(付記4)前記候補決定ステップが、全ての探索行に対する前記エッジ片の全部に直線近似を行いエッジ候補とするステップを含む
ことを特徴とする付記2または3記載の境界検出方法。
(付記5)前記候補決定ステップが、全ての探索行に対する前記エッジ片のうち中央沿いのエッジ片に直線近似を行いエッジ候補とするステップを含む
ことを特徴とする付記2乃至4の何れか1つに記載の境界検出方法。
(付記6)前記候補決定ステップが、全ての探索行に対する前記エッジ片のうち中央沿いと右よりのエッジ片に直線近似を行いエッジ候補とするステップを含む
ことを特徴とする付記2乃至5の何れか1つに記載の境界検出方法。
(付記7)前記候補決定ステップが、全ての探索行に対する前記エッジ片のうち中央沿いと左よりのエッジ片に直線近似を行いエッジ候補とするステップを含む
ことを特徴とする付記2乃至6の何れか1つに記載の境界検出方法。
(付記8)前記候補決定ステップが、
隣接エッジ間の探査方向の差分絶対値の平均を求めるステップと、
前記差分絶対値が前記平均からプラスの閾値内にあるエッジ片を前記中央沿いのエッジ片に加えた集合に直線近似を行いエッジ候補とするプラス側ステップを含む
ことを特徴とする付記5記載の境界検出方法。
(付記9)前記候補決定ステップが、
隣接エッジ間の探査方向の差分絶対値の平均を求めるステップと、
前記差分絶対値が前記平均からマイナスの閾値内にあるエッジ片を前記中央沿いのエッジ片に加えた集合に直線近似を行いエッジ候補とするマイナス側ステップを含む
ことを特徴とする付記5記載の境界検出方法。
(付記10)前記候補決定ステップが、
前記差分絶対値が前記平均からマイナスの閾値内にあるエッジ片を前記中央沿いのエッジ片に加えた集合に直線近似を行いエッジ候補とするマイナス側ステップを含む
ことを特徴とする付記8記載の境界検出方法。
(付記11)前記閾値を所定の変化分だけ変化させるステップをさらに含む
ことを特徴とする付記8乃至10の何れかに記載の境界検出方法。
(付記12)前記の変化させるステップが、
前記閾値の初期値を0とするステップと、
前記平均からプラスの閾値内または前記平均からマイナスの閾値内に前記差分絶対値が最大のエッジ片が含まれるようになった場合、前記閾値を変化させるのを止めるステップを含む
ことを特徴とする付記11記載の境界検出方法。
(付記13)原稿をスキャナで取り込んで得た画像から原稿の境界を構成する1つのエッジを検出する境界検出プログラムであり、
前記画像を尽くす全ての探索行に対し、前記画像の端から前記エッジと直角な方向に探索してエッジ片を検出するステップと、
前記エッジ片が検出できない行が存在する場合、前記全ての探索行に対し、前記画像の中央付近から前記画像の前記端へと探索することにより、エッジ片を検出するステップと、
全ての探索行に対する前記エッジ片から直線エッジを決定するエッジ決定ステップとをコンピュータに実行させる
ことを特徴とする境界検出プログラム。
(付記14)原稿をスキャナで取り込んで得た画像から原稿の境界を構成する1つのエッジを検出する境界検出プログラムを記録したコンピュータ読み取り可能な記憶媒体であり、前記プログラムが実行されることにより、
前記画像を尽くす全ての探索行に対し、前記画像の端から前記エッジと直角な方向に探索してエッジ片を検出する機能と、
前記エッジ片が検出できない行が存在する場合、前記全ての探索行に対し、前記画像の中央付近から前記画像の前記端へと探索することにより、エッジ片を検出する機能と、
全ての探索行に対する前記エッジ片から直線エッジを決定する機能とが前記コンピュータに備わる
ことを特徴とする境界検出プログラムを記録したコンピュータ読み取り可能な記憶媒体。
(付記15)付記1乃至12の何れかに記載の方法を用いて、原稿をスキャナで取り込んで得た画像から原稿の境界を抽出する機能を有する装置。
(付記16)付記1乃至12の何れかに記載の方法を用いて、原稿をスキャナで取り込んで得た画像から原稿の境界を抽出する複写機。
本発明により取込画像から原稿の1エッジを検出する動作を示すフローチャートである。 本発明の一実施形態による画像処理装置の構成を示す図である。 本発明により境界抽出を行う画像の例を示す図である。 図1のステップ100の処理例を詳細に示すフローチャートである。 図1の印字領域除外処理により印字領域が除外される様子を示す図である。 図1のステップ104における特徴強調処理の例を詳細に示すフローチャートである。 図6の特徴強調処理によりサンプル画像に対して行った2DFFTの結果を示すデータ表である。 図1のステップ106においてエッジ候補のエッジ片を求める処理の例を詳細に示すフローチャートである。 図8の仮エッジ決定処理(ステップ106)の結果得られたエッジ片の例を示す図である。 図1の複数のエッジ候補抽出処理(ステップ108)の例を詳細に示すフローチャートである。 ステップ110において複数の仮エッジ候補から罫線に最も平行なものを選択する方法を例示する図であり、(a)はフローチャート、(b)は比較の様子を表す図である。 図1のエッジ決定処理(ステップ112)の例を詳細に示すフローチャートである。 図15のステップ120が処理対象地する画素領域を示す図である。 図1に示す本発明のエッジ検出原理により原稿を抽出する動作を示すフローチャートである。 図18において、原稿の4つのエッジを検出する際の2通りの探索方法を示す図である。 本発明の境界抽出プログラムをコンピュータにロードして実行する実施例を示す略ブロック図である。 本発明の境界抽出プログラムをコンピュータにロードして実行する第2の実施例を示す略ブロック図である。 本発明による境界抽出プログラムを用いた画像取り扱いシステムの動作例を示すフローチャートである。 本発明による境界抽出プログラムを用いた第2の画像取り扱いシステムの動作例を示すフローチャートである。 本発明の境界抽出プログラムにより取込画像から原稿を抽出し、文字認識を行うシステムの動作例を示すフローチャートである。
符号の説明
1 本発明による画像処理装置
10 原稿カバー
12 画像処理装置本体
14 スキャナ機構部
16 画像印刷機構部
20 電子装置部
22 制御部
24 入力インタフェース
26 二次記憶装置
32 オペレーティングシステム
34 スキャナドライバ
36 本発明の境界抽出プログラム
38 種々のプログラム
40 スキャナ
42 コンピュータ
44 ファイリング・コンピュータ

Claims (4)

  1. 原稿をスキャナで取り込んで得た画像から背景と用紙の画像が類似している原稿の境界を構成する1つのエッジを検出する方法であり、
    前記画像を尽くす全ての探索行に対し、各探索行の一端から当該探索行の行方向に各探索行を探索して、各探索行を構成している各探索ブロックについての特徴量と当該特徴量の当該探索方向の変化量とを算出し、探索行毎に当該変化量がピークとなった探索ブロックを、エッジ片として検出する第一検出ステップと、
    前記第一検出ステップにより前記エッジ片が検出できない行が存在する場合、前記全ての探索行に対し、前記画像の中央付近から前記画像の前記端へと前記行方向とは逆方向に各探索行を探索して、各探索行を構成している各探索ブロックについての特徴量と当該特徴量の当該探索方向の変化量とを算出し、探索行毎に当該特徴量の変化がピークとなった探索ブロックを、エッジ片として検出する第二検出ステップと、
    全ての探索行に対する前記エッジ片の集合に対して直線近似を行い、得られた近似直線を、前記境界を構成する1つのエッジとして決定するエッジ決定ステップとを含むことを特徴とする境界検出方法。
  2. 前記画像において前記原稿から罫線を抽出するステップをさらに含み、
    前記エッジ決定ステップが、
    全ての探索行に対する前記エッジ片の集合に対して直線近似を行ってエッジ候補とすると共に、当該集合において隣接するエッジ片の前記行方向の位置の差と当該差の絶対値の当該集合における平均とを求め、当該差の絶対値が当該平均を超えるエッジ片を当該集合から除外したエッジ片群に対して直線近似を行ってエッジ候補とすることで、少なくとも2つのエッジ候補を求める候補決定ステップと、
    前記少なくとも2つのエッジ候補から、前記罫線上における第一の位置からの前記行方向の距離と、当該罫線上における当該第一の位置とは異なる第二の位置からの前記行方向の距離との差が最小であるエッジ候補を、最適な候補として選ぶ選択ステップとからなる
    ことを特徴とする請求項1記載の境界検出方法。
  3. 原稿をスキャナで取り込んで得た画像から背景と用紙の画像が類似している原稿の境界を構成する1つのエッジを検出する境界検出プログラムであり、
    前記画像を尽くす全ての探索行に対し、各探索行の一端から当該探索行の行方向に各探索行を探索して、各探索行を構成している各探索ブロックについての特徴量と当該特徴量の当該探索方向の変化量とを算出し、探索行毎に当該変化量がピークとなった探索ブロックを、エッジ片として検出する第一検出ステップと、
    前記第一検出ステップにより前記エッジ片が検出できない行が存在する場合、前記全ての探索行に対し、前記画像の中央付近から前記画像の前記端へと前記行方向とは逆方向に各探索行を探索して、各探索行を構成している各探索ブロックについての特徴量と当該特徴量の当該探索方向の変化量とを算出し、探索行毎に当該特徴量の変化がピークとなった探索ブロックを、エッジ片としてを検出する第二検出ステップと、
    全ての探索行に対する前記エッジ片の集合に対して直線近似を行い、得られた近似直線を、前記境界を構成する1つのエッジとして決定するエッジ決定ステップとをコンピュータに実行させる
    ことを特徴とする境界検出プログラム。
  4. 稿をスキャナで取り込んで得た画像から背景と用紙の画像が類似している原稿の境界を抽出する機能を有する装置であり、
    前記画像を尽くす全ての探索行に対し、各探索行の一端から当該探索行の行方向に各探索行を探索して、各探索行を構成している各探索ブロックについての特徴量と当該特徴量の当該探索方向の変化量とを算出し、探索行毎に当該変化量がピークとなった探索ブロックを、エッジ片として検出する第一検出手段と、
    前記第一検出手段により前記エッジ片が検出できない行が存在する場合に、前記全ての探索行に対し、前記画像の中央付近から前記画像の前記端へと前記行方向とは逆方向に各探索行を探索して、各探索行を構成している各探索ブロックについての特徴量と当該特徴量の当該探索方向の変化量とを算出し、探索行毎に当該特徴量の変化がピークとなった探索ブロックを、エッジ片として検出する第二検出手段と、
    全ての探索行に対する前記エッジ片の集合に対して直線近似を行い、得られた近似直線を、前記境界を構成する1つのエッジとしてを決定するエッジ決定手段と、
    を有する境界検出装置
JP2004101461A 2004-03-30 2004-03-30 境界抽出方法、プログラムおよびこれを用いた装置 Expired - Fee Related JP4598426B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2004101461A JP4598426B2 (ja) 2004-03-30 2004-03-30 境界抽出方法、プログラムおよびこれを用いた装置
DE602004017697T DE602004017697D1 (de) 2004-03-30 2004-09-03 Verfahren und Programm zur Ermittlung von Rändern und durch dieses Verfahren verwendetende Vorrichtung
EP04021046A EP1587295B1 (en) 2004-03-30 2004-09-03 Boundary extracting method, program and device using the same
KR1020040074687A KR100640035B1 (ko) 2004-03-30 2004-09-17 경계 추출 방법, 프로그램 및 이것을 이용한 장치
US10/958,231 US7729536B2 (en) 2004-03-30 2004-10-06 Boundary extracting method, program, and device using the same
CNB2004100841944A CN100426313C (zh) 2004-03-30 2004-10-15 边界检测方法,边界检测装置和复印机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004101461A JP4598426B2 (ja) 2004-03-30 2004-03-30 境界抽出方法、プログラムおよびこれを用いた装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2010025369A Division JP2010134958A (ja) 2010-02-08 2010-02-08 境界検出方法、プログラムおよびこれを用いた装置

Publications (2)

Publication Number Publication Date
JP2005285010A JP2005285010A (ja) 2005-10-13
JP4598426B2 true JP4598426B2 (ja) 2010-12-15

Family

ID=34926423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004101461A Expired - Fee Related JP4598426B2 (ja) 2004-03-30 2004-03-30 境界抽出方法、プログラムおよびこれを用いた装置

Country Status (6)

Country Link
US (1) US7729536B2 (ja)
EP (1) EP1587295B1 (ja)
JP (1) JP4598426B2 (ja)
KR (1) KR100640035B1 (ja)
CN (1) CN100426313C (ja)
DE (1) DE602004017697D1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4844247B2 (ja) 2006-06-12 2011-12-28 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
CN101681432B (zh) * 2007-05-01 2013-11-06 计算机连接管理中心公司 图片文档分割方法和系统
JP4502001B2 (ja) 2007-12-20 2010-07-14 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法
US8174737B2 (en) 2007-12-28 2012-05-08 Brother Kogyo Kabushiki Kaisha Image reading apparatus
JP4924416B2 (ja) * 2007-12-28 2012-04-25 ブラザー工業株式会社 画像読取装置
US8284463B2 (en) 2007-12-28 2012-10-09 Brother Kogyo Kabushiki Kaisha Image reading apparatus
JP4941317B2 (ja) * 2008-01-16 2012-05-30 ブラザー工業株式会社 画像読取装置
JP4941316B2 (ja) * 2008-01-16 2012-05-30 ブラザー工業株式会社 画像読取装置
JP2009303164A (ja) * 2008-06-17 2009-12-24 Canon Inc 画像読取装置及び画像読取装置の制御方法
US9177218B2 (en) * 2008-09-08 2015-11-03 Kofax, Inc. System and method, and computer program product for detecting an edge in scan data
JP4821869B2 (ja) * 2009-03-18 2011-11-24 富士ゼロックス株式会社 文字認識装置、画像読取装置、およびプログラム
JP5229050B2 (ja) * 2009-03-30 2013-07-03 富士通株式会社 画像からの文書領域抽出装置、方法、及びプログラム
JP5385372B2 (ja) * 2009-03-31 2014-01-08 富士通フロンテック株式会社 文字認識装置及び文字認識方法
JP5424694B2 (ja) * 2009-04-10 2014-02-26 株式会社日立情報通信エンジニアリング 画像認識装置、及びプログラム
JP5462522B2 (ja) 2009-05-07 2014-04-02 キヤノン株式会社 画像処理装置、画像処理方法、当該画像処理方法をコンピュータに実現させるためのプログラム
JP5290915B2 (ja) * 2009-09-03 2013-09-18 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
KR101733539B1 (ko) * 2009-11-24 2017-05-10 삼성전자주식회사 문자인식장치 및 그 제어방법
US8873112B2 (en) * 2011-10-21 2014-10-28 Canon Kabushiki Kaisha Image processing apparatus and determination method
JP5822664B2 (ja) 2011-11-11 2015-11-24 株式会社Pfu 画像処理装置、直線検出方法及びコンピュータプログラム
JP5871571B2 (ja) 2011-11-11 2016-03-01 株式会社Pfu 画像処理装置、矩形検出方法及びコンピュータプログラム
JP5854774B2 (ja) 2011-11-11 2016-02-09 株式会社Pfu 画像処理装置、直線検出方法及びコンピュータプログラム
JP2013123812A (ja) * 2011-12-13 2013-06-24 Canon Inc 検査装置、検査方法、コンピュータプログラム
JP6021557B2 (ja) * 2012-09-28 2016-11-09 株式会社Pfu 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム
JP5822865B2 (ja) * 2013-04-25 2015-11-25 京セラドキュメントソリューションズ株式会社 画像処理装置、罫線判定方法、及び罫線判定プログラム
CN105447426B (zh) * 2014-07-14 2018-02-02 株式会社理光 判定装置、文档图像管理系统以及判定方法
CN104792263B (zh) 2015-04-20 2018-01-05 合肥京东方光电科技有限公司 确定显示母板的待检测区域的方法和装置
US11059918B2 (en) 2016-05-27 2021-07-13 Exxonmobil Chemical Patents Inc. Metallocene catalyst compositions and polymerization process therewith
JP6600090B2 (ja) 2016-05-31 2019-10-30 株式会社Pfu 画像処理装置、画像処理方法、および、プログラム
CN106951855B (zh) * 2017-03-16 2020-04-10 深圳市六六六国际旅行社有限公司 一种图片中文档定位和裁切方法
US11760814B2 (en) 2020-03-03 2023-09-19 Exxonmobil Chemical Patents Inc. 1,5 diazabicyclooctane ligand systems and methods therewith
US11829701B1 (en) * 2022-06-30 2023-11-28 Accenture Global Solutions Limited Heuristics-based processing of electronic document contents

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0637987A (ja) * 1992-07-20 1994-02-10 Canon Inc 原稿検知装置
JPH0799581A (ja) * 1992-09-25 1995-04-11 Olympus Optical Co Ltd 画像処理装置
JPH10313406A (ja) * 1997-05-12 1998-11-24 Riso Kagaku Corp 画像処理装置
JPH11252351A (ja) * 1998-03-02 1999-09-17 Konica Corp 画像読取装置
JP2004005177A (ja) * 2002-05-31 2004-01-08 Fujitsu Ltd 文字認識システムおよび文字認識プログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2644724B2 (ja) 1985-07-12 1997-08-25 株式会社日立製作所 文書画像傾き補正方法
JP3278471B2 (ja) * 1991-11-29 2002-04-30 株式会社リコー 領域分割方法
US5452374A (en) 1992-04-06 1995-09-19 Ricoh Corporation Skew detection and correction of a document image representation
JP3304404B2 (ja) 1992-07-31 2002-07-22 株式会社日立製作所 傾き検出方法および画像処理装置
US5556764A (en) * 1993-02-17 1996-09-17 Biometric Imaging, Inc. Method and apparatus for cell counting and cell classification
US5818976A (en) * 1993-10-25 1998-10-06 Visioneer, Inc. Method and apparatus for document skew and size/shape detection
JPH10210266A (ja) * 1997-01-22 1998-08-07 Minolta Co Ltd 画像読み取り装置
JP3606500B2 (ja) * 1997-01-31 2005-01-05 株式会社リコー 矩形分類方法
US6005683A (en) * 1997-12-05 1999-12-21 Hewlett-Packard Company Document edge detection by linear image sensor
US6310984B2 (en) * 1998-04-09 2001-10-30 Hewlett-Packard Company Image processing system with image cropping and skew correction
EP1100257B1 (en) * 1998-06-23 2011-12-07 Sharp Kabushiki Kaisha Image processor, image processing method, and medium on which image processing program is recorded
JP3878401B2 (ja) 2000-09-14 2007-02-07 シャープ株式会社 画像処理装置、画像処理方法およびそれを記録した記録媒体
CN1184796C (zh) * 2001-07-26 2005-01-12 佳能株式会社 图象处理方法和设备以及图象处理系统
US7003161B2 (en) * 2001-11-16 2006-02-21 Mitutoyo Corporation Systems and methods for boundary detection in images
US7277579B2 (en) * 2002-05-31 2007-10-02 Arcsoft, Inc. Smart scan
JP4067957B2 (ja) * 2002-12-20 2008-03-26 富士通株式会社 境界検出方法、プログラム、及び画像処理装置
US20050013494A1 (en) * 2003-07-18 2005-01-20 Microsoft Corporation In-loop deblocking filter

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0637987A (ja) * 1992-07-20 1994-02-10 Canon Inc 原稿検知装置
JPH0799581A (ja) * 1992-09-25 1995-04-11 Olympus Optical Co Ltd 画像処理装置
JPH10313406A (ja) * 1997-05-12 1998-11-24 Riso Kagaku Corp 画像処理装置
JPH11252351A (ja) * 1998-03-02 1999-09-17 Konica Corp 画像読取装置
JP2004005177A (ja) * 2002-05-31 2004-01-08 Fujitsu Ltd 文字認識システムおよび文字認識プログラム

Also Published As

Publication number Publication date
JP2005285010A (ja) 2005-10-13
EP1587295A3 (en) 2006-05-17
KR100640035B1 (ko) 2006-11-01
DE602004017697D1 (de) 2008-12-24
US7729536B2 (en) 2010-06-01
KR20050096810A (ko) 2005-10-06
EP1587295A2 (en) 2005-10-19
US20050226510A1 (en) 2005-10-13
EP1587295B1 (en) 2008-11-12
CN100426313C (zh) 2008-10-15
CN1677430A (zh) 2005-10-05

Similar Documents

Publication Publication Date Title
JP4598426B2 (ja) 境界抽出方法、プログラムおよびこれを用いた装置
KR101011865B1 (ko) 경계 검출 방법, 기록 매체, 및 화상 처리 장치
US8155443B2 (en) Image extracting apparatus, image extracting method and computer readable medium
US8849042B2 (en) Image processing apparatus, rectangle detection method, and computer-readable, non-transitory medium
US8467606B2 (en) Method for segmenting a composite image
US8897574B2 (en) Image processing apparatus, line detection method, and computer-readable, non-transitory medium
US9386186B2 (en) Image processing apparatus and image processing method performing detection of inclination of original in read image in accordance with direction of fiber
JP6171167B2 (ja) 文字認識装置、文字認識方法、及び文字認識プログラム
JP6021665B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP2002288589A (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2010134958A (ja) 境界検出方法、プログラムおよびこれを用いた装置
JP4132766B2 (ja) 画像処理装置および方法
JP4629718B2 (ja) 境界検出方法、プログラム、及び画像処理装置
JP4579646B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム及び記憶媒体
JP2005284509A (ja) 画像処理装置
JP6362075B2 (ja) 画像読取装置、画像処理装置、及びその画像処理方法
JPH07120392B2 (ja) 文字パターン切り出し装置
JP2003223612A (ja) 画像処理方法および装置
JP2012181743A (ja) 画像処理装置及び画像処理方法
JP2010068198A (ja) 画像形成装置
JPH08110931A (ja) 文字マーク認識装置
JP2001127998A (ja) 画像処理装置および画像処理方法
WO2016151706A1 (ja) 画像処理装置、領域決定方法及びコンピュータプログラム
JPH04291479A (ja) 罫線認識方法及び表処理方法
JP2003244437A (ja) 画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100921

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100924

R150 Certificate of patent or registration of utility model

Ref document number: 4598426

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees