JP2007081882A - 原稿読取装置および原稿読取方法 - Google Patents

原稿読取装置および原稿読取方法 Download PDF

Info

Publication number
JP2007081882A
JP2007081882A JP2005267655A JP2005267655A JP2007081882A JP 2007081882 A JP2007081882 A JP 2007081882A JP 2005267655 A JP2005267655 A JP 2005267655A JP 2005267655 A JP2005267655 A JP 2005267655A JP 2007081882 A JP2007081882 A JP 2007081882A
Authority
JP
Japan
Prior art keywords
line
edge
color
edge portion
continuous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005267655A
Other languages
English (en)
Other versions
JP4167680B2 (ja
Inventor
Kazuhiko Iwaki
和彦 岩城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC AccessTechnica Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC AccessTechnica Ltd filed Critical NEC AccessTechnica Ltd
Priority to JP2005267655A priority Critical patent/JP4167680B2/ja
Publication of JP2007081882A publication Critical patent/JP2007081882A/ja
Application granted granted Critical
Publication of JP4167680B2 publication Critical patent/JP4167680B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)

Abstract

【課題】複雑な演算処理を行うことなく、罫線等の原稿の特定の部分を抽出して除去等の処理を行うことのできる原稿読取装置および原稿読取方法を得ること。
【解決手段】色分解部215は入力補正済画像データ302を輝度成分と色成分に分解し、エッジ検出部216は輝度成分を微分して画像の前景部分の境界線にあたるエッジ位置を検出する。ライン判定部217は、ある走査ラインで検出されたエッジ位置を起点として1つ前の走査ラインで検出されたエッジ位置の近傍でエッジ位置を検索する処理を、連続して検索される走査ライン数が所定の値に達するまで繰り返す。その結果検出されたエッジラインの直線性を判定し、直線の場合には罫線カラー格納部218がそのエッジを形成する前景部分を罫線として罫線カラーを特定する。ドロップアウト処理部219は、入力補正済画像データ302に対してこの罫線カラーに一致する画素を背景色に変換する。
【選択図】図5

Description

本発明は、カラー複写機やスキャナといった原稿の読み取りを行う原稿読取装置および原稿読取方法に係わり、特に罫線部分を除去することのできる原稿読取装置および原稿読取方法に関する。
入出金伝票や振替伝票といった事務処理で使用される各種の伝票の多くは、種類ごとにおおよそのフォーマットが定まっている。このため、罫線があらかじめ印刷(プレプリント)された各種の伝票用紙が市販されている。事務作業者は、このような罫線が印刷された伝票用紙を使用することにより、見やすい伝票を効率良く作成することができる。
作成された伝票は、ファクシミリ装置で所定の相手先に送信されたり複写機で複写される場合も多い。一方で、ファクシミリ通信での送信データ量や受信側をできるだけ低減させたいという市場の要求が存在する。また、このようなプレプリントされた書類上のデータを読み取って処理を行うコンピュータ等のデータ処理装置では、スキャナ等の原稿読取装置から本来必要なデータのみを入力したいという要請もある。
そこで、罫線部分を予め薄い色で印字したり、特定の複写機やスキャナで読みとりにくいとされる色で罫線を印刷した伝票用紙が多く市販されている。このような伝票用紙を使用すれば、読み取りの際の画像濃度を低く設定する等の手法によって罫線を除去した状態で伝票の画像を読み取ることができる。
ところが、原稿の読み取りの際の画像濃度を低く設定するようにすると、鉛筆やボールペンで伝票に書き込んだ情報までも薄くなり、読み取りにくくなってしまうという問題が発生する。また、このような設定で読み取った原稿を基にして光学式文字読取装置(Optical Character Reader : OCR)で文字認識を行うと、文字の認識率が低下してしまうという問題もある。
そこで、原稿上で罫線として使用している色を読み取りの対象外としてのドロップアウトカラーに設定することのできる原稿読取装置が製品化されている。このような装置では、カラーCCD(Charge Coupled Devices)等の一次元イメージセンサが読み取った原稿の画像情報を処理する過程で、オペレータが指定したドロップアウトカラーを背景色あるいは地色として処理する機能を備えている。たとえば、オペレータが原稿読取装置上でドロップアウトカラーとして青色を指定したとすると、原稿上の青色の部分が画像データの処理の過程で白色等の原稿の背景色に変換される。したがって、青色で罫線が印刷されている原稿については、結果的に罫線が除去されて読み取られることになる。
ところが、伝票用紙の罫線の色や帳票における罫線の色は、特定の1色あるいは数色に予め定められているものではない。文書のカラー化と共に、原稿の制作者の意図で各種の色が罫線に使用されているのが実状である。したがって、ドロップアウトカラーを設定することのできる原稿読取装置でも、現実に使用されている罫線の色を見て、これがすでに設定されているドロップアウトカラーと異なる場合には新たに設定しなおす必要がある。したがって、本来は原稿をひとまとめにして原稿読取装置に一括して読み取りを行わせる場合であっても、原稿の中に除去すべき罫線が存在するかをチェックしたり、更に罫線の色がすでに設定している色と異なる場合には、これを原稿読取装置に設定するという手間が必要になった。特に、罫線の色が特殊な色であるような場合には、ドロップアウトカラーをこれに一致させる調整が必要とされた。過去にドロップアウトカラーとして使用した色を登録しておくようにした原稿読取装置も存在する。しかしながらドロップアウトカラーの数が多くなると一致する色をその中から選択する操作が面倒になるだけでなく、登録されていない色が罫線の色として使用されている場合にはこれに対応させることができない。
そこで、原稿読取装置側で読み取った画像データの中から罫線を抽出して、その色をドロップアウトカラーとすることが提案されている(たとえば特許文献1参照)。この第1の提案では、まず読み取ったカラー画像データを背景色か背景色以外の色かで画素単位で2値化した画像データに変換する。そして、背景色以外の色の領域を罫線の色あるいは文字の色を有する前景部分とする。この前景部分では、文字や記号等の伝票内部に記入された情報を構成する線分に比べて、伝票用紙の罫線の多くは長く、しかもほぼ正確な直線となっている。第1の提案ではこれに着目し、前景部分の中からこのような直線部分を検出してこれを罫線であると推定し、その部分の画素の色をドロップアウトカラーに設定するようにしている。
この直線部分の検出については、ハフ(Hough)変換を利用することが従来より提案されている(たとえば特許文献2参照)。この第2の提案では、各画素の値について画像全体にわたって所定の方向に空間微分を行い、その微分値の絶対値がしきい値よりも大きい部分に該当する画素を、背景部分と前景部分との境界線上に位置する画素としての境界線画素であると判別する。そして、各境界線画素の画像平面の座標に対してハフ変換を行い、ハフ平面上の曲線に変換する。ハフ平面では、画像平面上で同一の直線上に位置する各点に対応する曲線は、この直線に対応する点で交わるようになっている。したがって、ハフ平面で多くの曲線が交わる点を判別し、その点を通る各曲線を画像平面上の座標に逆変換することによって、直線部分の境界線画素を特定することができる。
特開2005−71134号公報(第0023〜第0028段落) 特開平11−53555号公報(第0015段落)
しかしながら、ハフ変換やその逆変換では複雑な三角関数の演算が必要不可欠であり、更にハフ平面上での交点の検出といった演算処理が必要となる。したがって、直線部分を検出するための構成が複雑であり、装置の大型化やコスト高を招く可能性がある。通常、罫線のドロップアウトはファクシミリ装置や複写機の付加的な機能であることから、できるだけ簡単な構成によって実現できることが望ましい。
そこで本発明の目的は、複雑な演算処理を行うことなく、罫線等の原稿の特定の部分を抽出して除去等の処理を行うことのできる原稿読取装置および原稿読取方法を提供することにある。
本発明では、(イ)原稿をライン単位で走査して読み取る原稿読取手段と、(ロ)この原稿読取手段によって読み取られた原稿の各走査ラインにおける画像のエッジ部分をそれぞれ検出するエッジ部分検出手段と、(ハ)このエッジ部分検出手段の検出したエッジ部分が走査ラインと直交した副走査方向に所定長以上連続するか否かによってエッジ部分の連続してなる連続線の有無を判別する連続線有無判別手段と、(ニ)この連続線有無判別手段が連続線が存在すると判別したとき、その連続線が直線であるか否かを判別する直線判別手段と、(ホ)この直線判別手段が直線と判別したとき、原稿読取手段が読み取る画像のうちその連続線を構成する部分と同一の色の部分を予め設定した色に変換する色変換手段とを原稿読取装置に具備させる。
すなわち本発明では、原稿の各走査ラインにおける画像のエッジ部分をそれぞれ検出し、各エッジ部分が走査ラインと直交した副走査方向に所定長以上連続するか否かによってエッジ部分の連続してなる連続線の有無を判別する。そして、連続線が存在すると判別した場合にはその連続線が直線であるか否かを判別し、直線の場合には、読み取る画像のうちその連続線を構成する部分と同一の色の部分を予め設定した色に変換するようにしている。伝票用紙等の罫線は縦方向と横方向の両方に作成されていることが多く、走査ラインと直交した副走査方向に伸びた罫線が存在することになる。また、正確な直線と比べたときの誤差は、プレプリントされた罫線よりも手書きによる線分のほうがはるかに大きい。したがって、連続線の判別の基準となる長さを適切な長さに設定することによって罫線のエッジ部分を検出することができる。そして、罫線に該当する部分をたとえば原稿の用紙の地色に変換することによって、画像から罫線部分をドロップアウトさせることができる。しかも、所定長以上の連続線の検出を行ってからその連続線が直線か否かを判別するようにしているため、検出された各エッジ部分の位置をハフ変換してその中から直線に配置されたものを探し出すのに比べて、より簡単に罫線のエッジ部分を特定することができる。したがって、より簡単に画像から罫線をドロップアウトさせることが可能となる。
本発明では、(イ)原稿をライン単位で走査して読み取る原稿読取手段と、(ロ)この原稿読取手段によって読み取られた原稿の各走査ラインにおける画像のエッジ部分をそれぞれ検出するエッジ部分検出手段と、(ハ)このエッジ部分検出手段の検出した各エッジ部分が走査ラインと直交した副走査方向に所定長以上連続するか否かによってエッジ部分の連続してなる連続線の有無を判別する連続線有無判別手段と、(ニ)この連続線有無判別手段が連続線が存在すると判別したとき、その連続線が直線であるか否かを判別する直線判別手段と、(ホ)この直線判別手段が直線ではないと判別したとき、原稿読取手段が読み取る画像のうちその連続線を構成する部分と同一の色の部分を予め設定した色に変換する色変換手段とを原稿読取装置に具備させる。
すなわち本発明では、原稿の各走査ラインにおける画像のエッジ部分をそれぞれ検出し、各エッジ部分が走査ラインと直交した副走査方向に所定長以上連続するか否かによってエッジ部分の連続してなる連続線の有無を判別する。そして、連続線が存在すると判別した場合にはその連続線が直線であるか否かを判別し、直線ではない場合には、読み取る画像のうちその連続線を構成する部分と同一の色の部分を予め設定した色に変換するようにしている。手書きによる線分のほうが、プレプリントされた罫線よりも正確な直線と比べたときの誤差ははるかに大きい。したがって、連続線の判別の基準となる長さを適切な長さに設定することによって、記入された文字といった罫線以外の画像のエッジ部分を検出することができる。そして、罫線以外の画像に該当する部分をたとえば赤といった出力の際に視覚的により強調されるような色に変換することによって、罫線部分を相対的に弱める形で画像からドロップアウトさせることができる。
本発明では、(イ)原稿をライン単位で走査して読み取る原稿読取ステップと、(ロ)この原稿読取ステップで得られる画像データで元の原稿の画像のエッジ部分を1つ検索する第1のエッジ部分検索ステップと、(ハ)エッジ部分が1つ検索されるたびに、画像データの次の走査ラインのこの検索されたエッジ部分に連続する範囲でエッジ部分を1つ検索する連続エッジ部分検索ステップと、(ニ)この連続エッジ部分検索ステップでエッジ部分が連続して検索される走査ラインの本数が所定の値に達する前にいずれかの走査ラインで該当するエッジ部分が存在しないと判別されると、画像データで新たなエッジ部分を1つ検索する第2のエッジ部分検索ステップと、(ホ)連続エッジ部分検索ステップでエッジ部分が連続して検索される走査ラインの本数が所定の値に達すると、その連続して検索された各エッジ部分が直線に配置されているか否かを判別する直線配置判別ステップと、(へ)この直線配置判別ステップで直線に配置されていないと判別されると、画像データで新たなエッジ部分を1つ検索する第3のエッジ部分検索ステップと、(ト)直線配置判別ステップで直線に配置されていると判別されると、画像データのうち該当するエッジ部分を構成する部分と同一の色の部分を予め設定した色に変換する色変換ステップとを原稿読取方法に具備させる。
すなわち本発明では、原稿をライン単位で走査して読み取りを行い、得られる画像データで元の原稿の画像のエッジ部分を1つ検索する。また、エッジ部分が1つ検索されるたびに、画像データの次の走査ラインのこの検索されたエッジ部分に連続する範囲でエッジ部分を1つ検索するようにしている。ただし、エッジ部分が連続して検索される走査ラインの本数が所定の値に達する前にいずれかの走査ラインで該当するエッジ部分が存在しないと判別されると、画像データで新たなエッジ部分を1つ検索するようにしている。エッジ部分が連続して検索される走査ラインの本数が所定の値に達すると、その連続して検索された各エッジ部分が直線に配置されているか否かを判別するが、直線に配置されていない場合には同様に新たなエッジ部分を1つ検索する。一方、直線に配置されている場合には、画像データのうち該当するエッジ部分を構成する部分と同一の色の部分を予め設定した色に変換するようにしている。
伝票用紙等の罫線は縦方向と横方向の両方に作成されていることが多く、走査ラインと直交した副走査方向に伸びた罫線が存在することになる。また、正確な直線と比べたときの誤差は、プレプリントされた罫線よりも手書きによる線分のほうがはるかに大きい。したがって、エッジ部分の連続性の判別の基準となる走査ラインの本数を適切な値に設定することによって罫線のエッジ部分を検出することができる。そして、罫線に該当する部分をたとえば原稿の用紙の地色に変換することによって、画像から罫線部分をドロップアウトさせることができる。また、走査ラインを順にチェックしていく形で連続するエッジ部分の検出を行っていくので、画像データを2次元に展開する必要がない。しかもチェックする必要がある範囲までスキップするので、処理を迅速に行うことができる。したがって、より簡単かつ迅速に画像から罫線をドロップアウトさせることが可能となる。
以上説明したように本発明によれば、原稿の各走査ラインにおける画像のエッジ部分が副走査方向に所定長以上連続する連続線を構成するか否かをまず判別し、連続線を構成する場合にはそれが直線であるか否かを判別するようにしている。そして、直線であるか否かに応じて、画像データのうちこれらのエッジ部分を形成する部分と同一の色の部分を予め設定した色に変換する。これにより、ハフ変換といった複雑な演算処理を特に行うことなく、原稿のこれらの特定の部分について除去や強調といった処理をより簡単に行うことができる。
以下実施例につき本発明を詳細に説明する。
図1は、本発明の一実施例による原稿読取装置としてのスキャナ装置の構成の概要を表わしたものである。このスキャナ装置200は、図示しない原稿から画像データを読み取る画像入力部201と、読み取った画像データに対して各種の画像処理を行うと共に装置全体の制御を行う主制御部202を備えている。更に、主制御部202が処理を行った画像データを図示しないパーソナルコンピュータやプリンタといった外部装置へと出力する画像出力部203と、装置に対する各種操作を行うための操作部204を備えている。画像入力部201は、原稿に光を照射するための図示しない光源と原稿の反射光を図示しない光学系によって結像させたCCDからなるカラー読取用の1次元イメージセンサ206を備えている。
主制御部202は、画像入力部201の画像の読み取り特性に応じた画像処理を読み取られた画像データに対して行う入力画像処理部209と、画像データが外部装置に出力される際の画質を補正するための出力画像処理部210を備えている。更に、画像データからその輝度成分と色成分を抽出する色分解部215と、抽出された画像データの輝度成分を基に画像の背景部分とこれとは異なる色の罫線や文字(記号を含む。以下同様。)といった前景部分の境界線としてのエッジを検出するエッジ検出部216と、検出された複数のエッジの配置についての判定を行うライン判定部217を備えている。そして、直線に配置された各エッジを構成する前景部分を元の原稿の罫線部分と推定し、その罫線の色を色分解部215で抽出された画像データの色成分を基に特定して罫線カラーとして格納する罫線カラー格納部218を備えている。更に、この格納された罫線カラーをオペレータの指示によって画像データからドロップアウトさせるドロップアウト処理部219を備えている。
入力画像処理部209は、図示しないが光源の光量分布や1次元イメージセンサ206を構成する個々の読取素子の感度のバラツキが画像の入力レベルに与える影響を除去するためのシェーディング補正回路や、画像の読み取りの際の色の非直線特性を補正するためのガンマ補正回路といった画像処理のための各種回路を備えている。また、出力画像処理部210も、図示しないがコントラストの強さを調整するためのMTF(Modulation Transfer Function)補正回路や、出力先の装置で画像が印字あるいは表示される際の色の非直線特性に適合させるためのガンマ補正回路といった画像処理のための各種回路を備えている。操作部204は、図示しないが画像の読み取りを開始するための読取ボタンや、罫線のドロップアウトを行う罫線除去モードとドロップアウトを行わない通常モードとを切り替えるためのキースイッチを備えている。また、スキャナ装置200は、図示しないがCPU(中央処理装置)と各種の制御プログラムを格納するROM(Read Only Memory)および作業用メモリであるRAM(Random Access Memory)ならびに通信制御部や回路装置等のハードウェアによって構成されている。すなわち、制御プログラムをCPUが実行することで所望の機能部が実現するようになっている。
スキャナ装置200は、電源が投入されると操作部204の図示しない読取ボタンが押下されるのを待機する状態となる。この状態で読取ボタンが押下されると、画像入力部201を使用して原稿の読み取りが開始される。
図2は、図1に示すスキャナ装置200に備えられた原稿の読み取りを行う原稿台を上方から見た状態を表わしたものである。原稿台231には、中央に長方形をした板状の透明なプラテンガラス232が配置されており、その角の1つは原稿を載置する際の基準点233となっている。オペレータは、原稿の角の1つを基準点233に合わせる形でプラテンガラス232にセットする。プラテンガラス232の下側には、棒状の光源207が往復動自在に配置されている。原稿台231内部には図示しないがこの光源207による原稿の反射光を図1に示した1次元イメージセンサ206上に結像する光学系が配置されている。したがって、光源207が副走査方向236に走査されると、原稿の反射光が1次元イメージセンサ206上に結像し、順次、主走査方向235に画像データの読み取りが行われることになる。1次元イメージセンサ206は、たとえばRGB(Red-Green-Blue)3本のイメージセンサで構成されており、それぞれ画素単位で原稿上の対応する色および濃度を読み取ってRGBの画像データに変換する。本実施例で原稿の読み取り分解能は主走査方向235および副走査方向236共に600dpi(Dot Per Inch)となっている。
1次元イメージセンサ206は1次元の画像データを画素単位で順に出力するが、この出力は、基準点233側を基点とする1次元イメージセンサ206の長さ方向としての主走査方向235に沿って行われる。そして、1走査ライン分の出力が完了すると、副走査方向236に1ライン分移動し、次の走査ラインの画像データを同様に出力する。また、1次元イメージセンサ206から出力される1次元の画像データのそれぞれは間に走査ラインの区切りを示す信号を挿入した形で出力順に連結される。
図3は、プラテンガラスに載置された原稿の画像と出力される画像データの関係を表わしたものであり、図2に示した原稿台内部の図示しない光学系の側からプラテンガラスの方を見た様子を表わしたものである。図2に示したプラテンガラス232のサイズに等しいサイズの原稿241が載置されているものとして説明する。1次元イメージセンサ206が基準点233を起点として画像の読み取りを行っていくことによって、図3に示すように、原稿241の基準点233側から順に同じ長さで平行する複数の走査ラインを同一方向に走査していく形で構成された画像データが生成される。そして、この画像データは、画像入力部201(図1)で画素単位でディジタル値化され、RGBの画像データに変換される。
図1に戻って説明を続ける。本実施例のスキャナ装置200は、原稿の読み取りについて、原稿の罫線部分を除去して読み取る罫線除去モードと、このような除去を行わない通常モードのいずれかをオペレータが操作部204によって選択できるようになっている。通常モードが設定されている場合には、1次元イメージセンサ206の出力した画像データに対して入力画像処理部209で画像処理を行った後、そのまま出力画像処理部210で画像処理を行い、画像出力部203から外部装置へと画像データが出力されるようになっている。すなわち、原稿の画像は全体の濃度やコントラストが微調整されるものの、ほぼそのままの状態で外部装置で印字あるいは表示されることになる。
一方、罫線除去モードが選択された場合には、たとえば伝票のように罫線と手書きの文字とによって構成される原稿について、罫線を除去した状態でその画像を外部装置で印字あるいは表示させる処理が行われる。市販の伝票用紙の罫線は、ボールペンや鉛筆によって記入された文字と区別し易いような色で印字されていることが多く、画素単位で画像データからこれらの色を原稿の背景色に置き換えれば、罫線のみをドロップアウトさせることが可能である。しかしながら、伝票用紙の罫線の色はメーカごとあるいは種類ごとにばらつきがある。そこで、本実施例では画像データの中から罫線に相当する部分を特定し、その色をドロップアウトカラーに設定する。
図4は、罫線と手書きの情報とにより構成される原稿の一例を部分的に表わしたものである。この原稿2411は、表の罫線のみが淡い緑色でプレプリントされた市販の伝票用紙を使用したものであり、黒いボールペンで「1月分出金伝票」等の文字が記入された状態となっている。たとえば、表の左端に縦に引かれた罫線245の左側のエッジの主走査方向235の位置は、図3で説明した各走査ラインでほぼ同じとなる。原稿2411の読み取りは、図3に示したように各走査ラインでプラテンガラス232の読取領域の右端から同一副走査位置の左端へ進む形で行われる。したがって、ある走査ラインで検出されたエッジを起点として、次の走査ラインでその検出されたエッジの近傍にエッジが存在するか否かを調べることによって、原稿2411の縦方向に伸びた連続するエッジを検出でき、これを基に縦方向の罫線を検出することが可能となる。
しかしながら、たとえば「1月分出金伝票」の「1」の文字の縦に伸びる線分の左側のエッジの位置も、各走査ラインでほぼ同じとなる。そこで、記入される文字に含まれる線分よりも罫線のほうが比較的長いということに着目し、起点となるエッジから連続してエッジが検出される走査ライン数にしきい値を設定することによって、文字による連続するエッジと区別して罫線の検出を行うことが可能である。しかしながら、原稿には文字だけではなく地図等の図形が記入されている場合もあり、このような図形では比較的長い線分が記入されることも多い。
ところが、手書きの場合には正確な直線を作成することは難しい。一方で、伝票用紙の罫線は比較的長いだけでなく、ほぼ正確な直線となっているのが通常である。そこで、本実施例では、画像の前景部分のエッジをその輝度の変化によって検出し、そのうち5センチ程度以上の連続するエッジを検索し、更にそれが直線か否かを判定して直線の場合にはそのエッジを罫線部分のエッジであると判別するようにする。そして、その罫線部分から罫線の色を抽出し、これをドロップアウトカラーに設定する。これにより、高い精度で簡単に罫線のみを画像から除去させることができる。
図5は、罫線除去モードで画像読み取りが行われた場合の各装置部間の信号の流れを表わしたものである。図1と共に説明を行う。画像入力部201は、原稿から読み取った画像をRGBの画像データ301に変換し、主制御部202の入力画像処理部209へ送る。入力画像処理部209は、この画像データ301に対して前記したシェーディング補正やガンマ補正を行い、入力補正済画像データ302を生成する。
この入力補正済画像データ302はRGBの3色に分解されたままとなっている。すなわち、原稿上の各部分の色は、赤(R)、緑(G)、青(B)の3原色のそれぞれの輝度を表わすデータの組み合わせで表わされている。色分解部215は、入力補正済画像データ302を入力し、輝度成分(Y)と2つの色差成分からなる色成分(Cb、Cr)により構成されるYCbCr色空間への変換を行う。そして、その輝度成分を示す輝度データ303と色成分を示す色データ304を1画素分ずつ順次出力する。なお、これら輝度成分と色成分の分解にはLab色空間変換といった他の変換手法を使用してもよい。RGB色空間からこのようなYCbCr色空間あるいはLab色空間変換への変換を行う理由については、後に説明する。エッジ検出部216では、色分解部215から入力される輝度データ303を基に原稿の前景部分のエッジの位置の検出を行う。
図6は、エッジ検出部の構成を表わしたものである。エッジ検出部216は、微分フィルタ321を使用して入力した輝度データ303を空間微分して微分値データ322を出力するフィルタ演算部323と、微分値データ322をしきい値324と比較することによりそれぞれのエッジ位置を検出してエッジ位置データ325を出力するエッジ判定部326を備えている。微分をとることで、画像の濃度変化の顕著な部分が検出されることになる。しきい値は、罫線等の線分のエッジを検出するために経験的な値として設定される。
図7は、微分フィルタの演算係数を表わしたものである。微分フィルタ321は、同図に示すように9×1のマトリクス構造の演算係数を有する一次元フィルタとなっており、各演算係数は1次元イメージセンサ206の主走査方向235に読み取られる同一ラインの9画素に順次対応するものとする。この微分フィルタ321で右側の4画素はそれぞれ値「−1」、逆方向に対応する左側の4画素はそれぞれ値「1」となっている。すなわち、主走査方向235に対応する右側の4画素の輝度がこれと逆方向に対応する左側の4画素の輝度よりも低く、なおかつその差が大きければ大きいほど、微分値データ322の該当する画素についての値は大きくなる。また、通常の伝票用紙では用紙の背景色の輝度よりも罫線や文字の色の輝度のほうが低い。したがって、微分フィルタ321で各ラインを走査した結果としての微分値データ322で値が大きい画素を調べることで罫線や文字のエッジの位置を検出することができる。
図8は、ある走査ラインに背景部分と前景部分との境界が存在した場合の各信号の波形を表わしたものである。横軸は各画素の主走査方向235の位置を示しており、左側から右側へと各信号の出力が行われるものとする。ただし、走査ラインのうち背景部分と前景部分との境界部分近傍のみを拡大して図示している。同図(a)は、輝度データ303の波形を表わしており、縦軸は各画素の輝度を表わしている。第1の区間331の輝度に比べて、第2の区間332の輝度は低くなっている。すなわち、第1の区間331は原稿の背景部分であり、第2の区間332は前景部分である。また、同図(b)は、この輝度データ303に対応してフィルタ演算部323が出力する微分値データ322を表わしており、主走査方向235に各画素を順に調べていったときに輝度が急激に低くなる部分、すなわち背景部分から前景部分に遷移するエッジ部分で高い値となる。
エッジ判定部326は、入力される微分値データ322がしきい値324を超えるか否かを画素単位で逐次監視している。そして、同図(c)に示すように、デフォルトでは値「0」をとり、しきい値234を超えた場合には次の1画素分で値「1」をとるエッジ位置データ325を出力する。すなわち、エッジ位置データ325は、元の画像のどの部分にエッジが存在するかを示す信号となる。エッジ判定部326から出力されるエッジ位置データ325は、図5に示すライン判定部217へと送られる。
伝票用紙には、縦方向に伸びる罫線と横方向に伸びる罫線の両方が印字されている場合が多い。したがって、伝票用紙を図3に示したプラテンガラス232の基準点233に揃えた状態で原稿台231上に載置した場合、通常は副走査方向236に伸びた罫線が存在することになる。また、このような罫線のエッジ部分の各走査ラインでの主走査方向235の位置は、隣り合う走査ラインでほぼ同じとなる。
図9は、ライン判定部の構成を表わしたものである。ライン判定部217は、検出された複数のエッジ位置について関連性の有無の判定を行うエッジ位置関連性判定部351と、1つ前の走査ラインで検出されたエッジ位置を記憶するための前ラインエッジ位置記憶部352を備えている。そして、隣り合う走査ラインのエッジ位置の間に関連性があることが連続して検出された数をカウントするためのラインカウンタ353と、このラインカウンタ353のカウント値が異なる3つの所定の値に達したときのそれぞれのエッジ位置を記憶するための第1〜第3のエッジ位置記憶部354〜356を備えている。更に、エッジ位置データ325に同期して主走査方向235の画素数をカウントする主走査カウンタ357と、第1〜第3のエッジ位置記憶部354〜356に記憶された各エッジ位置が直線に配置されているか、すなわち直線性を有するか否かを判定するための直線性判定部358を備えている。
図10は、ライン判定部の各装置部間の信号の流れを表わしたものである。主走査カウンタ357は、各ラインについて主走査方向235に何番目の画素についての処理が行われているかを示す主走査位置信号361を出力する。何番目の画素についての処理が行われているかは、たとえば図5に示した入力補正済画像データ302を入力し、前記した走査ラインの区切りを示す信号を基に判別するようにすればよい。エッジ位置関連性判定部351は、この主走査位置信号361とエッジ位置データ325を基に、新たに検出されたエッジ位置が1つ前のラインで検出されたエッジ位置と関連性が有ると判別したときに有効となる関連性有フラグ362を出力する。また、逆に関連性が無いと判別したときに有効となる関連性無フラグ363も出力するようになっている。前ラインエッジ位置記憶部352は、関連性有フラグ362と主走査位置信号361を基に、検出された最新のエッジ位置を主走査方向235の画素位置で記憶するとともに、次のラインについての処理のために記憶したエッジ位置を前ラインエッジ位置364としてエッジ位置関連性判定部351へと送るようになっている。なお、新たに検出されたエッジ位置が1つ前のラインで検出されたエッジ位置と関連性が有るとするか無いとするかの判別基準については、後に説明する。
ラインカウンタ353は、エッジ位置関連性判定部351から入力される関連性有フラグ362が有効となるたびにカウント値を1つ増加させ、関連性無フラグ363が有効となるたびにカウント値をクリアする。また、保持するカウント値を、関連性有りと連続して検出されたライン数を示す連続ライン数365としてエッジ位置関連性判定部351へと送るようになっている。更に、カウント値が第1の所定の値に達したときに有効となる第1のライン数到達信号366を第1のエッジ位置記憶部354へ送る。同様に、第1の所定の値よりも大きい第2の所定の値にカウント値が達したときに有効となる第2のライン数到達信号367を第2のエッジ位置記憶部355へ送り、第2の所定の値よりも大きい第3の所定の値にカウント値が達したときに有効となる第3のライン数到達信号368を第3のエッジ位置記憶部356へと送るようになっている。ただし、これらのうち第2のライン数到達信号367は、図5の罫線カラー格納部218へも送られるようになっている。
第1〜第3のエッジ位置記憶部354〜356は、それぞれ第1〜第3のライン数到達信号366〜368が有効になると、そのときに主走査位置信号361が示している主走査方向235の画素位置を記憶する。そして、それぞれ第1〜第3のエッジ位置369〜371として直線性判定部358へと送るようになっている。直線性判定部358は、第1〜第3のエッジ位置369〜371が直線性を有するか否かを判定し、直線性を有すると判定したときに有効となる直線性有フラグ372を図5の罫線カラー格納部218へと送る。また、直線性を有していないと判別したときに有効となる直線性無フラグ373をラインカウンタ353へ送るようになっている。ラインカウンタ353は、この直線性無フラグ373が有効となった場合にも保持するカウント値をクリアする。
図11は、エッジ位置関連性判定部のエッジ位置関連性判定処理の流れを表わしたものである。エッジ位置関連性判定部351は、エッジ位置データ325の入力が開始されると(ステップS401:Y)、その1画素分を入力し(ステップS402)、連続エッジライン数365が値「0」よりも大きいか否かを判別する(ステップS403)。連続エッジライン数365が「0」の場合には(N)、まだ関連性を判定する起点となるエッジ位置が検出されていないので、その画素にエッジが存在するか、すなわちエッジ位置データ325が値「1」となっているか否かを判別する(ステップS404)。エッジが存在しない場合には(N)、関連性無フラグ363を有効にしてラインカウンタ353のカウント値をクリアする(ステップS405)。そして、エッジ位置データ325の残りがまだ存在する場合には(ステップS406:N)、ステップS402へと戻り次の1画素分を入力して処理を繰り返す。
ステップS402〜S405を繰り返すうちに、エッジが存在する画素のデータが入力されると(ステップS404:Y)、関連性有フラグ362を有効にして前ラインエッジ位置記憶部352にその主走査方向235の画素位置を記憶させるとともにラインカウンタ353のカウント値をアップさせる(ステップS407)。そして、その走査ラインの残り部分をスキップし(ステップS408)、ステップS406へ進み、エッジ位置データすなわち残りの走査ラインが存在する場合には、ステップS402へ戻る。1つ前の走査ラインでエッジが存在した場合には、連続ライン数365は値「1」以上となっているため(ステップS403:Y)、次に前ラインエッジ位置364の近辺であるか否かを判別し(ステップS409)。前ラインエッジ位置364の近辺ではない場合には(N)、再びステップS402へと戻る。一方、前ラインエッジ位置364の近辺である場合には(ステップS409:Y)、エッジの有無を判別する(ステップS404)。
すなわち、本実施例では1つ前の走査ラインで検出されたエッジ位置の近辺についてのみエッジの有無の判定を行うようにしている。これは、連続する線の各エッジ位置は、その連続性から、隣り合う走査ラインで非常に近くに配置されるという特徴がある。したがって、前ラインエッジ位置364のたとえばプラスマイナス1画素以内の画素についてのエッジ位置データ325が入力されているときにのみ、エッジの有無の判定が行われる。なお、前ラインエッジ位置364で検出されたエッジ位置と同じ位置の画素についてのみエッジの有無の判定を行うようにしてもよいが、原稿の伝票用紙の罫線がもともと斜めになっていたりプラテンガラス232に斜めに載置された場合には、検出されなくなる。
図12は、各種のエッジラインについてのエッジ画素の配置を例示したものである。個々の桝目はそれぞれ画素を表わしており、斜線が引かれた桝目はエッジ画素を表わしている。エッジラインが副走査方向236に平行な直線となっている場合、第1のエッジ画素群411に示すように、1つ前の走査ラインのエッジ画素と同じ位置に次の走査ラインのエッジ画素も配置される。ところが、原稿の伝票用紙の罫線がもともと斜めになっていたりプラテンガラス232に斜めに載置されるなどしてエッジラインが副走査方向236に対して45度斜めになっている場合、第2のエッジ画素群412に示すように、1つ前の走査ラインのエッジ画素から1画素分ずれた位置に次の走査ラインのエッジ画素が配置される。エッジラインが副走査方向236に対して45度よりも小さい角度で斜めになっている場合には、第3のエッジ画素群413に示すように、1つ前の走査ラインのエッジ画素と同じ画素あるいは1画素分ずれた位置に次の走査ラインのエッジ画素が配置される。したがって、前ラインエッジ位置364のプラスマイナス1画素以内とすれば、エッジラインが副走査方向236に対して45度よりも小さい角度で斜めになっていても、連続する線として検出されることになる。なお、直線ではないエッジラインも、第4のエッジ画素群414に示すようにこの条件に当てはまる場合がある。
なお、プラテンガラス232に対して原稿241が斜めにずれて配置される角度は、一般にわずかである。したがって、第2のエッジ画素群412のような画素の配列を検出したとしても、これを罫線の一部と判別する必要はない。オペレータが罫線として認識を許容する角度をスキャナ装置200側に設定しておき、更にエッジ位置関連性判定部351で設定された角度を考慮してエッジ位置の関連性の判別を行うようにすれば、罫線以外の直線を誤って罫線と認識する誤認識を軽減することができる。あるいは、逆に原稿の罫線のエッジ部分の濃度のばらつきや歪みにも柔軟に対応できるように、より多くの範囲の画素をエッジの有無の判定の対象としてもよい。
図11に戻って説明を続ける。前ラインエッジ位置364の近辺の画素でエッジが存在すると判別されると(ステップS409:Y、かつステップS404:Y)、ステップS407へと進み、前ラインエッジ位置記憶部352の記憶内容をその主走査方向235の画素位置で更新し、ラインカウンタ353のカウント値を更にアップさせる。そして、更に次の走査ラインへと処理を移す。一方、1つ前の走査ラインで検出されたエッジ位置の近辺にエッジが存在しない場合には(ステップS409:Y、かつステップS404:N)、1つ前の走査ラインで検出されたエッジが連続する線を構成するものではないとして、ラインカウンタ353のカウント値をクリアする(ステップS405)。そして、ステップS406へ進み、まだエッジ位置データ325の残りが存在する場合には次の画素以降についてエッジの有無を判別するようにする。
エッジ位置データ325の残りが存在する間、ステップS402〜S409の処理が繰り返される。この間に、検出されたエッジ位置の連続性に応じて、ラインカウンタ353のカウント値は増加したり、クリアされたりする。そして、エッジ位置データ325の入力が終了すると(ステップS406:Y)、再び新たなエッジ位置データ325が入力されるのを待機する(リターン)。なお、原稿の端部には通常は罫線が存在しない場合が多いことから、ステップS402の前に走査ラインを所定の本数だけスキップさせるようにしてもよい。
図10に戻って説明を続ける。ラインカウンタ353では、カウント値を予め設定された第1〜第3の所定の値のそれぞれと逐次比較する。そして、第1の所定の値に一致すると第1のライン数到達信号366を、第2の所定の値に一致すると第2のライン数到達信号367を、そして第3の所定の値に一致すると第3のライン数到達信号368をそれぞれ有効にするようになっている。また、第1〜第3のエッジ位置記憶部354〜356は第1〜第3のライン数到達信号366〜368のうち対応する信号が有効になると、その有効になったときに主走査位置信号361が示している主走査方向235の画素位置をエッジ位置としてそれぞれ記憶する。また、第1〜第3のエッジ位置記憶部354〜356は、ラインカウンタ353のカウント値がクリアされたときにはそれぞれ記憶内容を消去するようになっている。
本実施例では既に説明したように、5センチにわたる直線は罫線以外に元の原稿に存在しないという前提で、罫線の検出を行うようにしている。また、画像入力部201の副走査方向236の読み取り分解能は600dpiとなっており、原稿の副走査方向236の5センチに相当する走査ライン数は1,181本となる。したがって、第3の所定の値をたとえば「1,200」に設定し、第1の所定の値と第2の所定の値をそれぞれ「50」、「700」に設定するようにすればよい。
なお、第1〜第3のエッジ位置記憶部354〜356へ入力する第1〜第3のライン数到達信号366〜368は、エッジ位置関連性判定部351で出力するようにしてもよい。この場合には、エッジ位置関連性判定部351から第1〜第3のライン数到達信号366〜368を出力するようにした上で、図11のエッジ位置関連判定処理のステップS407の直後に、以下に説明する連結性判定処理を実行するようにすればよい。
図13は、この連結性判定処理の流れを表わしたものである。エッジ位置関連性判定部351は、まずステップS407(図11)でラインカウンタ353のカウント値がアップすると、連続ライン数365が第1の所定の値に一致するか否かを判別する(ステップS421)。一致しない場合には(N)、次に第2の所定の値に一致するか否かを判別し(ステップS422)、これにも一致しない場合には(N)、第3の所定の値に一致するか否かを判別する(ステップS423)。第3の所定の値にも一致しない場合には(N)、そのまま処理を終了する(エンド)。一方、第1の所定の値に一致する場合には(ステップS421:Y)、第1のライン数到達信号366を所定の時間だけ有効にし(ステップS424)、処理を終了する(エンド)。第2の所定の値に一致する場合には(ステップS422:Y)、第2のライン数到達信号367を所定の時間だけ有効にし(ステップS425)、処理を終了する(エンド)。第3の所定の値に一致する場合には(ステップS423:Y)、第3のライン数到達信号368を所定の時間だけ有効にし(ステップS426)。処理を終了する(エンド)。
このようにして第1〜第3のエッジ位置記憶部354〜356に記憶された3つのエッジ位置は、それぞれ連続した線を構成するエッジの一部であるが、この線が直線ではない可能性もある。そこで、この線が罫線のエッジであるか否かを判別するために、直線性判定部358ではこれら3つのエッジ位置についての直線性の有無の判定を行うようになっている。
図14は、直線性判定部で実行される直線性の有無の判定の手法について説明するためのものである。主走査方向235の位置を横軸とし、連続ライン数を縦軸とした座標系を想定する。この座標系で、第1のエッジ位置369と第1の所定の値との交点、第2のエッジ位置370と第2の所定の値との交点、第3のエッジ位置371と第3の所定の値との交点を、それぞれ第1〜第3の座標4411〜4413としてプロットする。そして、これら第1〜第3の座標4411〜4413を基に1次近似直線442を作成し、更に3つの座標441の1次近似直線442からの距離の合計値を算出する。第1〜第3の座標4411〜4413の直線性が高いほど、この合計値は小さい値となる。そこで、この合計値を予め定められたしきい値と比較し、より小さい場合には第1〜第3の座標4411〜4413は直線性を有すると判定する。すなわち、第1〜第3のエッジ位置369〜371は同一の罫線のエッジを示していると判定する。このしきい値は、ラインカウンタ353に設定する第1〜第3の所定の値と併せて、試験や測定によって適正な値を求める必要がある。
直線性判定部358は、このような演算によって第1〜第3のエッジ位置369〜371が罫線のエッジを示していると判定すると、直線性有フラグ372を有効にする。一方、3つのプロットの1次近似直線からの距離の合計値がしきい値以上となっている場合には、直線性無フラグ373を有効にする。直線性無フラグ373が有効となると、ラインカウンタ353のカウント値はクリアされるため、再びエッジ位置の検出が行われる。
なお、直線性判定部358による判定処理に時間が掛かる場合、直線性無フラグ373が有効となったときには検出可能な罫線が存在しないところまでエッジ位置データ325の入力が進んでしまっている可能性がある。そこで、たとえば第3のライン数到達信号368が有効となった場合には、次に直線性無フラグ373が有効となるまでライン判定部217にエッジ位置データ325を入力しないようにして、最後に検出されたエッジ位置の次の画素からエッジ位置の有無の判別を開始するようにしてもよい。この場合には、同じ走査ラインに他の連続した線が存在するとき、そのエッジ位置が関連性を判定する新たな起点となる。すなわち、既に直線性が否定されたエッジラインに対して、延々と直線性の判定処理を繰り返してしまうのを防ぐことができる。
図5に戻って説明を続ける。ライン判定部217から出力される直線性有フラグ372は、罫線カラー格納部218に入力されており、このフラグは上記したように第1〜第3のエッジ位置369〜371が罫線のエッジであると判別されたときに有効となる。一方で、罫線カラー格納部218には図10のラインカウンタ353のカウント値が第2の所定の値に達した時点で有効となる第2のライン数到達信号367と、色分解部215から出力される色データ304が入力されている。罫線カラー格納部218は、第2のライン数到達信号367が有効となると、そのときの色データ304が示す色成分、すなわち該当する走査ラインで検出されたエッジ画素の色成分を取得するようになっている。そして、直線性有フラグ372が有効となると、該当するエッジ画素が罫線部分のエッジであるとして、取得した色成分を各レベルの輝度と組み合わせる形で色空間上の領域をドロップアウトカラーに設定する。図10の直線性判定部358による演算処理には比較的時間が掛かるため、第2のライン数到達信号367が有効となった時点で色成分を取得しておくようにしている。
ここで、RGB色空間からYCbCr色空間に変換してドロップアウトカラーの設定を行った理由について説明する。伝票用紙等に印字されている罫線は、色成分は同じでも領域によって濃度にばらつきがあることが多い。これらの色を特定することは、赤と緑と青の3原色のそれぞれの輝度の組み合わせで色を定義するRGB色空間では困難である。一方、輝度成分と色成分により構成されるYCbCr色空間やLab色空間では、輝度とは無関係に色成分で罫線部分の色を特定することができ、各レベルの輝度と組み合わせるだけで罫線の色をより簡単に定義することができる。また、3原色のそれぞれの輝度の組み合わせによってエッジ部分を検出することは困難である。いずれか1色に絞って空間微分を行うことも考えられるが、罫線の色成分にこの色が含まれていない場合も考えられる。したがって、より簡単かつ適切にドロップアウトカラーを設定するためには、この実施例のように輝度成分と色成分とに分離して処理を行うことができるYCbCr色空間へと画像データを変換させることが望ましい。
このようにして設定されたドロップアウトカラーはYCbCrのデータとなっており、このままではRGBのデータである入力補正済画像データ302との比較が困難である。そこで、罫線カラー格納部218では、YCbCr色空間で設定したドロップアウトカラーをRGB色空間に変換し、これを罫線カラーとして図示しない記憶領域に記憶する。そして、罫線カラー381としてドロップアウト処理部219へ送るようにしている。
ドロップアウト処理部219は、入力画像処理部209が出力する入力補正済画像データ302を入力するが、罫線カラー格納部218から罫線カラー381が送られてくるまで図示しないバッファメモリに格納させておく。罫線カラー381が入力されると、格納しておいた入力補正済画像データ302の先頭から各画素の色成分をこの罫線カラー381と比較する。そして、一致しない色成分の画素についてはそのままとするが、一致する色成分の画素については、背景色として予め設定された色に置き換える。これにより、罫線部分は背景色と同一となり、画像からドロップアウトされる。なお、背景色は、たとえばいずれかの走査ラインでエッジ検出部216でエッジが検出された画素よりも手前の画素の色成分を特定するなどして、入力補正済画像データ302から抽出するようにしてもよい。
このようにして生成されたドロップアウト処理済画像データ382は、出力画像処理部210に入力され、通常モードと同様にMTF補正等の画像処理が行われ、出力補正済画像データ383として出力される。この結果、画像出力部203が画像データを出力する相手先の装置では、罫線が除去された状態の画像が出力されることになる。
以上説明したように本実施例では、ある走査ラインで最初に検出されたエッジ位置を起点とし、その起点となるエッジ位置から順に、次の走査ラインで検出されたエッジ位置の近傍にエッジ位置が存在するか否か、すなわち関連性を有するか否かを判定する。以下同様である。そして、関連性を有するエッジ位置がどれだけ続くかを判定することによって、これらのエッジが連続する線を構成するものであるか否かを判定する。更に、連続した線を構成するものである場合には、そのうちの3点をピックアップし、これらの配置関係が直線性を有するか否かを判別する。直線性を有する場合には罫線のエッジであるとし、そのエッジ付近の前景部分の色を抽出してこれを罫線カラーとする。各エッジが連続した線を構成するものではない場合や、直線性を有するものではない場合には、起点となるエッジ位置を変更して再度各エッジ位置の関連性についての判定を開始する。
一般的に、伝票用紙の罫線は文字の記入領域を四方から囲う枠線となっていることが多い。したがって、各走査ラインでは文字のエッジよりも先に罫線のエッジが検出される場合が多く、ほとんどの伝票用紙では迅速に罫線カラーが特定されることになる。また、起点として検出されたエッジ位置がインク染み等の汚れによるものであっても、連続する線ではないことがすぐに判別され、迅速に他のエッジ位置に起点を移して判定を再開する。また、起点として検出されたエッジ位置が文字によるものであっても、直線性を有しないことがすぐに判別され、迅速に他のエッジ位置に起点を移して判定を再開する。したがって、従来行われていたハフ変換といった複雑な演算を特に行うことなく、より簡単な構成で罫線のエッジを特定し、罫線カラーを抽出して罫線のドロップアウトを実現することができる。なお、原稿がノートのように1方向にのみ罫線が印字されているものの場合には、罫線が副走査方向に伸びる形で原稿をプラテンガラスに載置すれば問題なく罫線のドロップアウトを実現できる。また、副走査方向すなわち縦方向の直線のみを検出対象とすることによって、画像データを展開することなくエッジ位置の検出を行うことができる。すなわち、画像を展開するためのバッファメモリを特に必要とせずに罫線部分のエッジを特定することができ、構成が簡易となり低コスト化を図ることが可能となる。
なお、実施例ではエッジによって構成される連続した線の直線性を判定する際に3点をピックアップするとしたが、判定の精度を高めるために更に多くの箇所をピックアップするようにしてもよい。また、直線性を判定するために他の手法を使用するようにしてもよい。更に、罫線カラー格納部には取得した罫線カラーを蓄積し、同一種類の伝票用紙について画像読み取りを行う際には蓄積した中から指定してドロップアウトカラーとして設定するようにしてもよい。この場合には、操作部にタッチパネル等の情報入出力装置を設け、罫線カラーの判別を行う際にメーカ名や伝票の種類に関する情報を入力して罫線カラーに対応付けて記憶させるようにするとともに、画像読み取りの際にこの情報を表示させて選択できるようにすればよい。
<発明の変形例>
連続した線を構成すると判定された各エッジ位置のうち、直線性を有しないものは、文字部分といった罫線以外の前景部分である可能性が高い。また、文字のみを強調色に変換するというように、文字部分に対して色変換を行うことが求められるケースがある。そこで、発明の変形例として、文字部分の色としての文字カラーを抽出し、画像のうち文字カラーの部分を他の色に変換する場合について説明する。
図15は、本発明の変形例によるスキャナ装置の構成の概要を表わしたものであり、実施例の図1に対応するものである。そこで、図1と同一部分には同一符号を付し、これらについての説明を適宜省略する。このスキャナ装置500の主制御部502には、直線性を有さない各エッジを構成する前景部分を元の原稿の文字部分と推定しその色を色分解部215で抽出された色データを元に特定し、文字カラーとして格納する文字カラー格納部518が備えられている。更に、画像中のこの格納された文字カラーに該当する部分を他の強調色に置き換えて文字部分を強調させる強調処理部519が備えられている。また、実施例とは異なり、操作部504の図示しないキースイッチでは、罫線除去モードと通常モードだけでなく、罫線のドロップアウトを行った上で更に原稿の文字部分を強調させるための文字強調モードについても選択できるようになっている。
図16は、文字強調モードで画像読み取りが行われた場合の各装置部間の信号の流れを表わしたものであり、実施例の図5と対応するものである。そこで、図5と同一部分には同一符号を付し、これについての説明を適宜省略する。実施例の図10で説明した第2のライン数到達信号367および直線性無フラグ373は、この変形例では文字カラー格納部518にも入力されるようになっている。実施例で説明したように、直線性無フラグ373は検出された各エッジ位置が直線ではない連続する線を構成するものであった場合に有効となる。すなわち、第2のライン数到達信号367が有効となったときの画素は、文字部分のエッジ画素であるといえる。そこで、罫線の場合と同様に、文字カラー格納部518は第2のライン数到達信号367が有効となったときの画素の色成分を色データ304から取得し、直線性無フラグ373が有効になるとこれを各レベルの輝度とを組み合わせ、図示しない記憶領域に記憶する。そして、これをRGB色空間に変換したものを文字カラー581として強調処理部519へと送る。
ただし、罫線の端部や平行ではない複数の罫線が交わる部分でエッジが検出されている可能性もあり、直線ではないからといって文字部分のエッジであるとは断定できない。そこで、罫線カラー格納部218と文字カラー格納部518のそれぞれで取得した色成分が異なる場合にのみ文字カラー格納部518が取得した色成分を有効として記憶するようにし、一致する場合にはライン判定部217に処理をやり直させるようにしてもよい。なお、罫線カラー格納部218および文字カラー格納部518では、各レベルの輝度と組み合わせる処理まであるいは変換処理までを直線性有フラグ372や直線性無フラグ373が有効になる前に行っておき、処理の高速化を図るようにしてもよい。
強調処理部519は、ドロップアウト処理部219が出力するドロップアウト処理済画像データ382を入力し、各画素についてこの文字カラー581に一致する色成分を有しているか否かの判別を行う。そして、一致する色成分を有する画素については、赤といった予め設定された強調色に置き換え、強調処理後画像データ582として出力画像処理部210へと送られる。これにより、出力画像で文字部分が強調されることになる。
以上説明したように本変形例では、連続する曲線のエッジが検出されたときに、これを罫線以外の部分としての文字部分のエッジであるとし、文字カラーを抽出する。そして、画像データに対してこの文字カラーに一致する色を予め定められた強調色に置き換えるようにした。これにより、文字カラーが原稿ごとに異なるような場合でも、特にオペレータによる文字カラーの設定を行うことなく、文字カラーを抽出することができ、予め定めた強調色に簡単に置き換えることができる。また、ほとんどの機能部を罫線のドロップアウトを実現するための各機能部と兼用させることができ、安価にこのような強調処理を実現することが可能となる。なお、強調処理部519では、文字カラーに該当する画素の周辺の画素も文字カラーに変換して文字部分を太くするというような処理、色変換以外の強調処理を行うようにしてもよい。
また、以上説明した実施例および変形例では、スキャナ装置を例として説明したが、複写機やファクシミリ装置等、罫線を除去することが望ましいような画像データを取り扱う可能性のある各種の原稿読取装置に適用できることはもちろんである。また、罫線のドロップアウトだけでなく、赤いボールペンで定規を使用して文字の上に引かれた取り消し線を除去したり、罫線の色と背景部分の色以外を全て背景色にしてしまうことによって罫線部分のみを残すといった各種の画像処理に応用することが可能である。更に、各装置部の機能のうち可能なものについては、ハードウェアで実現するようにしてもよい。
発明の一実施例による原稿読取装置としてのスキャナ装置の構成の概要を表わしたブロック図である。 本発明の実施例によるスキャナ装置に備えられた原稿の読み取りを行う原稿台を上方から見た状態を表わした平面図である。 本発明の実施例によるプラテンガラスに載置された原稿の画像と出力される画像データの関係を表わした説明図である。 罫線と手書きの情報とにより構成される原稿の一例を部分的に表わした説明図である。 本発明の実施例による罫線除去モードで画像読み取りが行われた場合の各装置部間の信号の流れを表わした説明図である。 本発明の実施例によるエッジ検出部の構成を表わした構成図である。 本発明の実施例による微分フィルタの演算係数を表わした説明図である。 本発明の実施例によるある走査ラインに背景部分と前景部分との境界が存在した場合の各信号の波形を表わした波形図である。 本発明の実施例によるライン判定部の構成を表わした構成図である。 本発明の実施例によるライン判定部の各装置部間の信号の流れを表わした説明図である。 本発明の実施例によるエッジ位置関連性判定部のエッジ位置関連性判定処理の流れを表わした流れ図である。 本発明の実施例による各種のエッジラインについてのエッジ画素の配置を例示した説明図である。 本発明の実施例によるエッジ位置関連性判定部の連結性判定処理の流れを表わした流れ図である。 本発明の実施例による直線性判定部で実行される直線性の有無の判定の手法について説明するための説明図である。 本発明の変形例によるスキャナ装置の構成の概要を表わしたブロック図である。 本発明の変形例による文字強調モードで画像読み取りが行われた場合の各装置部間の信号の流れを表わした説明図である。
符号の説明
200、500 スキャナ装置
201 画像入力部
202 主制御部
203 画像出力部
204、504 操作部
209 入力画像処理部
210 出力画像処理部
211 1次元イメージセンサ
215 色分解部
216 エッジ検出部
217 ライン判定部
218 罫線カラー格納部
219 ドロップアウト処理部
231 原稿台
232 プラテンガラス
321 微分フィルタ
323 フィルタ演算部
326 エッジ判定部
351 エッジ位置関連性判定部
352 前ラインエッジ位置記憶部
353 ラインカウンタ
354 第1のエッジ位置記憶部
355 第2のエッジ位置記憶部
356 第3のエッジ位置記憶部
357 主走査カウンタ
358 直線性判定部
518 文字カラー格納部
519 強調処理部

Claims (10)

  1. 原稿をライン単位で走査して読み取る原稿読取手段と、
    この原稿読取手段によって読み取られた原稿の各走査ラインにおける画像のエッジ部分をそれぞれ検出するエッジ部分検出手段と、
    このエッジ部分検出手段の検出した各エッジ部分が前記走査ラインと直交した副走査方向に所定長以上連続するか否かによってエッジ部分の連続してなる連続線の有無を判別する連続線有無判別手段と、
    この連続線有無判別手段が前記連続線が存在すると判別したとき、その連続線が直線であるか否かを判別する直線判別手段と、
    この直線判別手段が直線と判別したとき、前記原稿読取手段が読み取る画像のうちその連続線を構成する部分と同一の色の部分を予め設定した色に変換する色変換手段
    とを具備することを特徴とする原稿読取装置。
  2. 原稿をライン単位で走査して読み取る原稿読取手段と、
    この原稿読取手段によって読み取られた原稿の各走査ラインにおける画像のエッジ部分をそれぞれ検出するエッジ部分検出手段と、
    このエッジ部分検出手段の検出した各エッジ部分が前記走査ラインと直交した副走査方向に所定長以上連続するか否かによってエッジ部分の連続してなる連続線の有無を判別する連続線有無判別手段と、
    この連続線有無判別手段が前記連続線が存在すると判別したとき、その連続線が直線であるか否かを判別する直線判別手段と、
    この直線判別手段が直線ではないと判別したとき、前記原稿読取手段が読み取る画像のうちその連続線を構成する部分と同一の色の部分を予め設定した色に変換する色変換手段
    とを具備することを特徴とする原稿読取装置。
  3. 前記エッジ部分検出手段が検出した画像のエッジ部分としての1画素の主走査方向の位置を各走査ラインごとに判別する主走査方向位置判別手段と、
    この主走査方向位置判別手段によって判別された各画素の主走査方向の位置が隣接する走査ライン間でそれぞれ最大で1画素分以内のずれとなっているか否かを判別するライン間判別手段とを更に具備し、
    前記連続線有無判別手段は、このライン間判別手段によって隣接する走査ライン間でそれぞれ最大で1画素分以内のずれとなっていると判別された画素群のうち前記副走査方向に所定長以上連続するものを、前記エッジ部分の連続してなる連続線と判別する手段であることを特徴とする請求項1または請求項2記載の原稿読取装置。
  4. 前記エッジ部分検出手段が検出したエッジ部分のいずれかを前記連続線の判別の対象として設定する連続線判別対象設定手段と、
    エッジ部分が前記連続線の判別の対象として設定されるたびに、次の走査ラインのうちそのエッジ部分に連続する範囲にエッジ部分が存在するか否かを前記エッジ部分検出手段による検出結果を使用して判別するエッジ検出有無判別手段と、
    このエッジ検出有無判別手段がエッジ部分が存在すると判別したとき、そのエッジ部分を前記連続線の判別の対象に追加設定する連続線判別対象追加設定手段とを更に具備し、
    前記連続線有無判別手段は、前記エッジ検出有無判別手段によって連続してエッジ部分が存在すると判別された走査ラインの本数が前記所定長に相当する値に達したときに、前記連続線が存在すると判別する手段であることを特徴とする請求項1記載の原稿読取装置。
  5. 前記エッジ検出有無判別手段によって連続してエッジ部分が存在すると判別された走査ラインの本数が前記所定長に相当する値に達する前にいずれかの走査ラインで前記エッジ検出有無判別手段によって該当するエッジ部分が存在しないと判別されると、前記エッジ部分検出手段が検出したエッジ部分のうち、前記連続線判別対象設定手段および前記連続線判別対象追加設定手段で前記連続線の判別の対象として設定されていないもののいずれかを新たに前記連続線の判別の対象として設定する非連続時再設定手段を更に具備することを特徴とする請求項4記載の原稿読取装置。
  6. 前記直線判別手段が直線ではないと判別すると、前記エッジ部分検出手段が検出したエッジ部分のうち前記連続線判別対象設定手段および前記連続線判別対象追加設定手段で前記連続線の判別の対象として設定されていないもののいずれかを新たに前記連続線の判別の対象として設定する非直線時再設定手段を更に具備することを特徴とする請求項4記載の原稿読取装置。
  7. 前記エッジ検出有無判別手段が連続してエッジ部分が存在すると判別した走査ラインの本数をカウントする連続ライン数カウント手段と、
    この連続ライン数カウント手段のカウント値が前記所定数を超えない予め設定された3つ以上の異なる値のそれぞれに達するたびに、該当するエッジ部分の位置を取得するエッジ部分位置取得手段と、
    このエッジ部分位置取得手段が取得した3つのエッジ部分の位置が直線上に配置されているときには前記連続線が直線であると判別する直線配置判別手段とを更に具備することを特徴とする請求項4記載の原稿読取装置。
  8. 前記原稿読取手段によって読み取られた原稿の各走査ラインにおける画像の輝度成分をそれぞれの走査ライン上の空間で微分する輝度成分微分手段と、
    この輝度成分微分手段が算出する微分値を所定のしきい値と比較するしきい値比較手段とを更に具備し、
    前記エッジ部分検出手段は、このしきい値比較手段による比較結果を基にエッジ部分を検出する手段であることを特徴とする請求項1記載の原稿読取装置。
  9. 前記原稿読取手段が読み取った画像から元の原稿の背景部分の色を抽出する背景部分色抽出手段を更に具備し、
    前記色変換手段は、この背景部分色抽出手段が抽出した色に変換する手段であることを特徴とする請求項1記載の原稿読取装置。
  10. 原稿をライン単位で走査して読み取る原稿読取ステップと、
    この原稿読取ステップで得られる画像データで元の原稿の画像のエッジ部分を1つ検索する第1のエッジ部分検索ステップと、
    エッジ部分が1つ検索されるたびに、前記画像データの次の走査ラインのこの検索されたエッジ部分に連続する範囲でエッジ部分を1つ検索する連続エッジ部分検索ステップと、
    この連続エッジ部分検索ステップでエッジ部分が連続して検索される走査ラインの本数が所定の値に達する前にいずれかの走査ラインで該当するエッジ部分が存在しないと判別されると、前記画像データで新たなエッジ部分を1つ検索する第2のエッジ部分検索ステップと、
    前記連続エッジ部分検索ステップでエッジ部分が連続して検索される走査ラインの本数が前記所定の値に達すると、その連続して検索された各エッジ部分が直線に配置されているか否かを判別する直線配置判別ステップと、
    この直線配置判別ステップで直線に配置されていないと判別されると、前記画像データで新たなエッジ部分を1つ検索する第3のエッジ部分検索ステップと、
    前記直線配置判別ステップで直線に配置されていると判別されると、前記画像データのうち該当するエッジ部分を構成する部分と同一の色の部分を予め設定した色に変換する色変換ステップ
    とを具備することを特徴とする原稿読取方法。
JP2005267655A 2005-09-14 2005-09-14 原稿読取装置および原稿読取方法 Expired - Fee Related JP4167680B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005267655A JP4167680B2 (ja) 2005-09-14 2005-09-14 原稿読取装置および原稿読取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005267655A JP4167680B2 (ja) 2005-09-14 2005-09-14 原稿読取装置および原稿読取方法

Publications (2)

Publication Number Publication Date
JP2007081882A true JP2007081882A (ja) 2007-03-29
JP4167680B2 JP4167680B2 (ja) 2008-10-15

Family

ID=37941702

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005267655A Expired - Fee Related JP4167680B2 (ja) 2005-09-14 2005-09-14 原稿読取装置および原稿読取方法

Country Status (1)

Country Link
JP (1) JP4167680B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013136593A1 (ja) * 2012-03-14 2013-09-19 オムロン株式会社 領域抽出結果の表示方法及び画像処理装置
AU2011250827B2 (en) * 2011-04-06 2014-01-30 Fujifilm Business Innovation Corp. Image processing apparatus, image processing method, and program
JP2014215797A (ja) * 2013-04-25 2014-11-17 京セラドキュメントソリューションズ株式会社 画像処理装置、罫線判定方法、及び罫線判定プログラム
US9432551B2 (en) 2014-03-28 2016-08-30 Brother Kogyo Kabushiki Kaisha Image processing apparatus configured to execute correction on scan image data

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2011250827B2 (en) * 2011-04-06 2014-01-30 Fujifilm Business Innovation Corp. Image processing apparatus, image processing method, and program
WO2013136593A1 (ja) * 2012-03-14 2013-09-19 オムロン株式会社 領域抽出結果の表示方法及び画像処理装置
JP2013191054A (ja) * 2012-03-14 2013-09-26 Omron Corp 領域抽出結果の表示方法及び画像処理装置
KR20140133547A (ko) * 2012-03-14 2014-11-19 오므론 가부시키가이샤 영역 추출 결과의 표시 방법 및 화상 처리 장치
KR101658719B1 (ko) 2012-03-14 2016-09-21 오므론 가부시키가이샤 영역 추출 결과의 표시 방법 및 화상 처리 장치
JP2014215797A (ja) * 2013-04-25 2014-11-17 京セラドキュメントソリューションズ株式会社 画像処理装置、罫線判定方法、及び罫線判定プログラム
US9355326B2 (en) 2013-04-25 2016-05-31 Kyocera Document Solutions Inc. Image processing apparatus, ruled line determination method, and storage medium having ruled line determination program stored therein
US9432551B2 (en) 2014-03-28 2016-08-30 Brother Kogyo Kabushiki Kaisha Image processing apparatus configured to execute correction on scan image data

Also Published As

Publication number Publication date
JP4167680B2 (ja) 2008-10-15

Similar Documents

Publication Publication Date Title
JP4574503B2 (ja) 画像処理装置、画像処理方法およびプログラム
US8320019B2 (en) Image processing apparatus, image processing method, and computer program thereof
US8587835B2 (en) Image processing apparatus, method, and program product using difference in count of pixels in margin and image areas based on gradation value to determine if document is white paper
US10075614B2 (en) Image processing apparatus and non-transitory computer readable medium
JP4167680B2 (ja) 原稿読取装置および原稿読取方法
JP4777024B2 (ja) 画像処理装置および画像処理装置の制御方法
US8477988B2 (en) Image processing apparatus, image forming apparatus and computer readable medium
US8830487B2 (en) System and method for separating image and text in a document
US10887491B2 (en) Image processing apparatus for processing of highlighted regions
JP5887242B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP6540597B2 (ja) 情報処理装置、情報処理方法及びプログラム
US8260057B2 (en) Image processing apparatus that obtains a ruled line from a multi-value image
JP2006229685A (ja) 帳票歪み判定装置
US11328425B2 (en) Image processing apparatus and non-transitory computer readable medium
JP2010154244A (ja) 画像処理装置、画像処理方法及びプログラム
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP2007028181A (ja) 画像処理装置
US11521403B2 (en) Image processing device for a read image of an original
US20170272612A1 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP4810995B2 (ja) 画像処理装置、方法及びプログラム
JP4974367B2 (ja) 領域分割方法及び装置、並びにプログラム
JP5474222B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP2001109842A (ja) 光学文字読取装置
US10623598B2 (en) Image processing apparatus and non-transitory computer readable medium for extracting and connecting inherent regions of multiple pages of document data
JPH09274643A (ja) 画像処理装置及び画像出力装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080722

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080801

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110808

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110808

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120808

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees