JP2007193446A - 画像処理装置および罫線抽出プログラム - Google Patents

画像処理装置および罫線抽出プログラム Download PDF

Info

Publication number
JP2007193446A
JP2007193446A JP2006009115A JP2006009115A JP2007193446A JP 2007193446 A JP2007193446 A JP 2007193446A JP 2006009115 A JP2006009115 A JP 2006009115A JP 2006009115 A JP2006009115 A JP 2006009115A JP 2007193446 A JP2007193446 A JP 2007193446A
Authority
JP
Japan
Prior art keywords
ruled line
pixel group
image data
ruled
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006009115A
Other languages
English (en)
Other versions
JP4329764B2 (ja
Inventor
Kazuya Yago
和也 矢後
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2006009115A priority Critical patent/JP4329764B2/ja
Priority to US11/447,050 priority patent/US7660014B2/en
Publication of JP2007193446A publication Critical patent/JP2007193446A/ja
Application granted granted Critical
Publication of JP4329764B2 publication Critical patent/JP4329764B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

【課題】処理速度を確保しつつ原稿画像から高精度で罫線を抽出することのできる画像処理装置を提案する。
【解決手段】画像データをx方向に、ある行について走査し、黒画素が第1のしきい値以上の長さ連続して存在することが検出された場合、罫線であると判定し、消去する(ステップS501〜S509)。さらに、上記罫線に、y方向に第2のしきい値以上の長さ連続して黒画素が連結されていることが検出された場合、罫線であると判定して、消去する(ステップS511〜S517)。
【選択図】図8

Description

この発明は画像処理装置および罫線抽出プログラムに関し、特に、原稿中の罫線部分を判定する画像処理装置および罫線抽出プログラムに関する。
近年、情報の電子化が進み、文書を紙ではなく電子化して保存、または送信する需要が高まっている。そこで、MFP(Multi Function Peripherals)等の画像データを取得する画像処理装置において、スキャンして得られた画像データを紙に印刷することなく、メールに添付するなどして直接送信する機能が普及してきている。
ところで、MFP等の画像処理装置において取り扱う画像は白黒画像からカラー画像に移行しつつあるため、上記画像データはカラー画像データとなりつつある。MFPにおいて、いわゆるA4サイズと言われる297mm×210mmのサイズのフルカラー原稿を解像度300dpiでスキャンして得られるカラー画像データのサイズは、約25MBに達する。そのため、カラー画像データは、メールに添付して送信するにはサイズが大きすぎるという問題が発生してきている。
この問題を解決するために、スキャンして得られた画像データ(スキャンデータと略する)を圧縮してサイズダウンしてから送信することが一般的になされている。しかしながら、画像全体に対して同一の解像度でスキャンデータを圧縮すると、画像に含まれる文字の判読性が損なわれる。画像中の文字の判読性を確保できる程度の高い解像度で圧縮すると、スキャンデータのサイズダウンが十分にできないという問題がある。
この問題を解決するために、画像中の領域ごとに異なる解像度でスキャンデータを圧縮する、いわゆるコンパクトPDF(Portable Document Format)化と言われる方法などのファイル作成方法が提案されている。コンパクトPDFは、
(1)スキャンデータの領域を判別する処理を実行し、文字部分と文字以外の部分とを分離し、
(2)文字部分に対して、高解像度のまま二値化処理し、同じ色属性をもつ文字の領域を同じレイヤ上に統合して、MMR(Modified Modified-Read)圧縮等の可逆圧縮し、
(3)文字以外の部分に対して、解像度を下げてJPEG(Joint Photographic Experts Group)圧縮等の非可逆圧縮する、
(4)各圧縮されたデータでPDFファイルを生成する、
手順で作成される。
この方法でスキャンデータを圧縮することで、文字の判読性の確保と低サイズ化とを両立させることができる。
この方法は上述の手順で実行されるため、スキャンデータから文字部分を正確に抽出することが重要となる。そのためには、文字と罫線とが混在する文字領域から罫線を正確に抽出することが重要になる。
詳しくは、たとえば図18に示される、文字「ABC」と文字「123」とが罫線と罫線との間に存在し、文字「abc」が罫線に重なって存在する原稿画像に対して文字判定を行なう場合について、罫線抽出を行なう場合と行なわない場合とについて判定結果の違いを説明する。
罫線抽出を行なわずに図18の原稿画像に対して文字判定を行なった場合、図19に示されるように、罫線に重なって存在する文字「abc」については、文字と罫線とが一体の画像であると認識されて文字でないものと判定されてしまう。その結果、この原稿画像を圧縮した場合には、当該文字「abc」について解像度を下げた圧縮がなされるので、判読性が損なわれてしまうことになる。
一方、罫線抽出を行なって図18の原稿画像に対して文字判定を行なった場合、図20に示されるように原稿画像から抽出された罫線を除去することで、図21に示されるように、原稿画像に含まれるすべての文字が文字であると判定される。その結果、この原稿画像を圧縮した場合には、含まれる文字について高解像度のまま圧縮がなされるので、判読性が損なわれない。
このような罫線の抽出に関しては、たとえば以下の特許文献1には表画像から枠を認識する表処理方法が提案されている。また、特許文献2には、黒ランの長さが主・副走査方向の所定のしきい値以上のラインを罫線として抽出し、所定領域中に抽出された罫線が規定数以上あるときには文字と判定する罫線処理方法が提案されている。また、特許文献3には、入力画像からランを抽出し、抽出されたランから連結矩形を抽出し、連結矩形から所定のしきい値以上の長さをもつものを罫線として抽出すると共に、残された画像からさらに連結矩形を抽出して短罫線を抽出する方法が提案されている。
特開平10−187878号公報 特開2000−222577号公報 特開2000−306102号公報
上記特許文献1に記載の方法を採用して原稿画像の罫線を抽出する場合、枠線は抽出されるものの、枠線以外の罫線が抽出されないという問題がある。また、上記特許文献2,3に記載の方法では、まず所定のしきい値以上の長さをもつラインを罫線として抽出したり、連結矩形の抽出を行なってから罫線として抽出したりする処理を行なっているので、罫線抽出処理に時間がかかるという問題がある。
さらに、これらの方法では、主・副走査方向の枠線や罫線は抽出されるものの、斜め罫線が抽出されないという問題もある。
本発明はこのような問題に鑑みてなされたものであって、処理速度を確保しつつ原稿画像から高精度で罫線を抽出することのできる画像処理装置および罫線抽出プログラムを提供することを目的とする。
上記目的を達成するために、本発明のある局面に従うと、画像処理装置は、画像データを得る画像データ取得手段と、画像データから罫線を抽出する罫線抽出手段とを備え、罫線抽出手段は、画像データを第1の方向に走査して、第1のしきい値以上の長さ連続する第1の画素群が検出されると、第1の画素群を第1の罫線と判定する第1判定手段と、第1の罫線から第2の方向に走査して、第1の罫線に連結された、第2のしきい値以上の長さ連続する第2の画素群が検出されると、第2の画素群を第2の罫線と判定する第2判定手段とを含み、第2のしきい値は第1のしきい値よりも小さい。
詳しくは、第1の方向と第2の方向とは直角をなす方向であることが好ましい。
または、第1の方向と第2の方向とは0度以上90度未満の角度なす方向であり、第2判定手段は、第2の画素群が第1の罫線の端点に連結されているときに第2の画素群を第2の罫線と判定することが好ましい。
または、第1の方向と第2の方向とは0度以上90度未満の角度なす方向であり、第2判定手段は、第2の画素群が第1の罫線の端点と第3の罫線の端点とに連結されているときに、第2の画素群を第2の罫線と判定することが好ましい。
または、第1の方向と第2の方向とは0度以上90度未満の角度なす方向であり、第2判定手段は、第2の画素群が第1の罫線の1端点から、第1の罫線に対して線対称に連結される第3の画素群および第4の画素群からなるときに、第2の画素群を第2の罫線と判定することが好ましい。
または、罫線抽出手段は、第1の罫線から第3の方向に走査して、第1の罫線の1端点から第1の罫線に対して線対称に連結された、第3のしきい値以上の長さ連続する第3の画素群および第4の画素群が検出されると、第3の画素群および第4の画素群を第3の罫線および第4の罫線と判定する第3判定手段をさらに含み、第3のしきい値は第2のしきい値よりも小さいことが好ましい。
さらに、画像処理装置は、罫線抽出手段によって罫線と判定された画素群を消去する手段を備えることが好ましい。
さらに、画像処理装置は、画像データのうち、罫線抽出手段によって罫線と判定された画素群を除く領域について文字判定処理を行なう手段をさらに備えることが好ましい。
本発明の他の局面に従うと、画像処理装置は、画像データを得る画像データ取得手段と、画像データから罫線を抽出する罫線抽出手段とを備え、罫線抽出手段は、画像データを第1の方向に走査して、第1のしきい値以上の長さ連続する第1の画素群が検出されると、第1の画素群を第1の罫線と判定する第1判定手段と、第1の方向と0度以上90度未満の角度なす第2の方向に走査して、前記第1の罫線に連結された、第2のしきい値以上の長さ連続する第2の画素群が検出されると、第2の画素群を第2の罫線と判定する第2判定手段とを含む。
詳しくは、第2のしきい値は第1のしきい値よりも小さいことが好ましい。
また、第2判定手段は、第2の画素群が第1の罫線の端点に連結されているときに第2の画素群を第2の罫線と判定することが好ましい。
または、第2判定手段は、第2の画素群が第1の罫線の端点と第3の罫線の端点とに連結されているときに、第2の画素群を第2の罫線と判定することが好ましい。
または、第2判定手段は、第2の画素群が第1の罫線の1端点から、第1の罫線に対して線対称に連結される第3の画素群および第4の画素群からなるときに、第2の画素群を第2の罫線と判定することが好ましい。
なお、上述の第1判定手段は、特定色の画素で構成される第1の画素群が検出されると、その第1の画素群を第1の罫線と判定することがより好ましい。
本発明のさらに他の局面に従うと、罫線抽出プログラムは、画像処理装置における罫線抽出処理をコンピュータに実行させるプログラムであって、画像データを得る画像データ取得ステップと、画像データを第1の方向に走査して、第1のしきい値以上の長さ連続する第1の画素群が検出されると、第1の画素群を第1の罫線と判定して抽出する第1抽出ステップと、第1の罫線から第2の方向に走査して、第1の罫線に連結された、第2のしきい値以上の長さ連続する第2の画素群が検出されると、第2の画素群を第2の罫線と判定して抽出する第2抽出ステップとを実行させ、第2のしきい値は第1のしきい値よりも小さい。
詳しくは、第1の方向と第2の方向とは直角をなす方向であることが好ましい。
または、第1の方向と第2の方向とは0度以上90度未満の角度なす方向であり、第2抽出ステップにおいては、第2の画素群が第1の罫線の端点に連結されているときに第2の画素群を第2の罫線と判定して抽出することが好ましい。
または、第1の方向と第2の方向とは0度以上90度未満の角度なす方向であり、第2抽出ステップにおいては、第2の画素群が第1の罫線の端点と第3の罫線の端点とに連結されているときに、第2の画素群を第2の罫線と判定して抽出することが好ましい。
または、第1の方向と第2の方向とは0度以上90度未満の角度なす方向であり、第2抽出ステップにおいては、第2の画素群が第1の罫線の1端点から、第1の罫線に対して線対称に連結される第3の画素群および第4の画素群からなるときに、第2の画素群を第2の罫線と判定して抽出することが好ましい。
さらに、罫線抽出プログラムは、第1の罫線から第3の方向に走査して、第1の罫線の1端点から第1の罫線に対して線対称に連結された、第3のしきい値以上の長さ連続する第3の画素群および第4の画素群が検出されると、第3の画素群および第4の画素群を第3の罫線および第4の罫線と判定して抽出する第3抽出ステップを前記コンピュータに実行させ、第3のしきい値は第2のしきい値よりも小さいことが好ましい。
本発明にかかる画像処理装置が上記構成であることによって、処理速度を確保しつつ、原稿画像から罫線を正確に抽出することができる。
以下に、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。
本実施の形態においては、本発明にかかる画像処理装置がMFP(Multi Function Peripherals)であるものとするが、本発明にかかる画像処理装置はMFPに限定されず、画像データを取得する手段と、その画像データを処理する手段とを備える装置であれば他の装置であってもよく、たとえば一般的なパーソナルコンピュータやファクシミリ装置などであってもよい。
図1は、本実施の形態にかかるMFP10のハードウェア構成の具体例を示す図である。
図1を参照して、本実施の形態にかかるMFP10は、スキャン処理部1と、入力画像処理部2と、記憶部3と、CPU(Central Processing Unit)4と、ネットワークI/F(インタフェース)部5と、出力画像処理部6と、エンジン部7と、モデム・NCU(Network Control Unit)8と、操作部9とを含んで構成される。
操作部9は操作キーと表示部とを含んで構成され、ユーザI/Fとして機能して、ユーザからの宛先の入力、スキャン条件の選択、前述したコンパクトPDFなどの画像ファイルフォーマットの選択、処理の開始/中断等の操作を受付ける。操作部9は、操作に基づいた操作信号を、CPU4に対して出力する。
記憶部3は、DRAM(Dynamic Random Access Memory)等の電子メモリと、ハードディスク等の磁気メモリとを含んで構成され、プログラムや画像データを保持する。CPU4は、記憶部3に記憶されるプログラムを実行し、操作部9から入力された操作信号に基づいて、必要な制御信号を各部に対して出力してMFP10全体を制御する。なお、記憶部3は、CPU4においてプログラムが実行される際の作業領域としても用いられる。
スキャン処理部1は、上記制御信号に従ってセットされた原稿をスキャンして読取り、入力画像処理部2に対して画像データを出力する。入力画像処理部2は、上記制御信号に従って、入力された画像データに対して色変換、色補正、解像度変換、領域判別等の処理を実行する。処理後のデータは記憶部3に保持される。
出力画像処理部6は、上記制御信号に従って記憶部3に保持される画像データを読出し、その画像に対してスクリーン制御、スムージング処理、PWM(Pulse Wide Modulation)制御等を施し、処理後の画像データをエンジン部7に対して出力する。
エンジン部7は、上記制御信号に従って、出力画像処理部6から入力された画像データに基づいてトナー画像を生成し、トナー画像をセットされた印刷用紙に転写することで画像を印刷する。ここでMFP10がカラー画像を出力するカラーMFPである場合にはエンジン部7はイエロー、マゼンタ、シアン、ブラックの4色のトナーを用いてトナー画像を生成する。
また、CPU4は、記憶部3に記憶されるプログラムを実行し、記憶部3に保持される画像データに対して画像処理を施し、記憶部3、ネットワークI/F部5、またはモデム・NCU8に対して出力する。
ネットワークI/F部5は、電子メール等を、ネットワークを介して他の装置に送信するためのI/Fであり、プロトコルの作成などを行なう。ネットワークI/F部5は、上記制御信号に従って、CPU4から入力された画像データ、または記憶部3から読出した画像データを、ネットワークを介して他の装置に送信する。
モデム・NCU8は、ファクシミリ送受信のための変復調、ファクシミリの通信プロトコルの生成などを行なって電話回線を介した通信を制御する。モデム・NCU8は、上記制御信号に従って、CPU4から入力された画像データ、または記憶部3から読出した画像データを、電話回線を介して他の装置に送信する。
図2は、本実施の形態にかかるMFP10において画像データの圧縮を行なってPDF(Portable Document Format)ファイルを作成するための機能構成の具体例を示すブロック図である。図2に示される各部は、主にCPU4が記憶部3に記憶されるプログラムを実行することによってCPU4に形成される機能であるが、いくつかの機能はたとえば入力画像処理部2などの他のハードウェア構成に形成されてもよい。
図2を参照して、本実施の形態にかかるMFP10においてPDFファイルを作成するための機能は、画像データ取得部101と、前処理部103と、文字抽出部104と、領域判定部105と、文字統合部106と、可逆圧縮部107と、図/写真領域統合部108と、解像度変換部109と、非可逆圧縮部111と、PDF化部113とを含んで構成される。
画像データ取得部101は、上記スキャン処理部1において生成された画像データを取得し、TIFF(Tagged Image File Format)、JPEG(Joint Photographic Experts Group)、BMP(Bit Map)などのデータフォーマットで前処理部103に入力する。
前処置部103は、画像データ取得部101から入力された画像データに対して、領域判別のための前処理として、画像形式の変換、解像度変換、下地除去などの処理を施し、領域判定部105に入力する。
領域判定部105は、前処理部103から入力された画像データに対して二値化処理やラベリングなどを行ない、図や写真などの特徴が抽出された領域を図/写真領域、その特徴のない領域を文字領域と判定する。そしてその判定結果を文字抽出部104に入力する。
文字抽出部104は、領域判定部105から入力された判定結果を基に、図/写真領域および文字領域から文字(文字および罫線)部分を抽出する。その際、以降に説明する罫線抽出処理が施される。ここでは、文字部分と文字以外の写真や図形やグラフなどの背景部分とを分離し、各部分の色を算出する。抽出された文字部分および図/写真領域は、各々、文字統合部106および図/写真領域統合部108に入力される。
文字統合部106および図/写真領域統合部108は、各々、文字抽出部104から入力された文字部分および図/写真領域を同じレイヤ上に統合する。統合された図/写真領域を構成する画像データは解像度変換部109を経て非可逆圧縮部111に、文字部分を構成する画像データは解像度変換部109を経ることなく可逆圧縮部107に直接、各々入力される。
可逆圧縮部107は、領域判定部105から入力された文字部分を構成する画像データに対して、MMR(Modified Modified-Read)圧縮方式のような可逆性の圧縮を行なう。また、非可逆圧縮部111は、解像度変換部109で低解像度化された図/写真領域を構成する画像データに対して、JPEG圧縮方式のような非可逆圧縮を行なう。可逆圧縮部107および非可逆圧縮部111において圧縮された文字部分を構成する画像データおよび図/写真領域を構成する画像データはPDF化部113に入力され、これらに基づいてPDFファイルが作成される。
図3は、本実施の形態にかかるMFP10において画像データの圧縮を行なってPDFファイルを作成する処理の流れを示すフローチャートである。図3のフローチャートに示される処理は、主にCPU4が記憶部3に記憶されるプログラムを実行して図2に示される各部を制御することで実現される処理である。すなわち、図3を参照して、本実施の形態にかかるMFP10においては、まず画像データ取得部101において画像データが取得され(ステップS1)、取得された画像データに対して、前処理部103で前処理が施される(ステップS3)。
図4は、ステップS3で実行される前処理を示すフローチャートである。図4を参照して、前処理は、下地除去処理(ステップS101)、明度変換処理(ステップS103)、およびスムージング処理(ステップS105)を含む。
詳しくは、図4を参照して、ステップS101において、入力された画像データのコントラストを伸張する処理が施されて薄い下地色がとばされ、入力画像の色の傾向が整えられる。
次に、ステップS103において下地が除去された画像データの明度が算出され、明度画像が生成される。ここでは、入力された画像データがフルカラーの24bitの画像である場合、モノクロの8bitの明度画像が生成される。
次に、ステップS105で、生成された明度画像に対してスムージング処理が施される。スムージング処理が施されることで明度画像からノイズが除去され、以降の判別の精度が向上する。
次に、領域判定部105においてテキスト領域および図/写真領域を判定する判別処理が実行される(ステップS5)。
図5は、ステップS5で実行される図/写真領域の判別処理を示すフローチャートである。図5を参照して、判別処理は、二値化処理(ステップS201)、ラベリング処理(ステップS203)、および図/写真特徴抽出処理(ステップS205)を含む。
詳しくは、図5を参照して、ステップS201で、前処理された画像データに対して二値化処理が施され、二値化画像が生成される。
次に、ステップS203で二値化画像に対してラベリング処理が施され、規定のしきい値と比較されることによって画像データから検出用の小領域であるブロックが検出される。
次に、ステップS205で、検出されたブロックが、そのブロック内の画像データの特性に応じてより詳細に分類され、そのブロックが図/写真領域中の写真の小領域であるか、図形の小領域であるか、グラフの小領域であるか、文字部分を含む小領域であるか、テキスト領域中の小領域である、いずれの特定も有しない領域であるか、などが判別される。
次に、文字抽出部104において文字抽出処理が実行される(ステップS7)。
図6は、ステップS7で実行される文字抽出処理を示すフローチャートである。図6を参照して、文字抽出処理は、文字エッジ抽出処理(ステップS301)、傾き検出処理(ステップS303)、罫線処理(ステップS305)、文字連結/判定処理(ステップS307)、網点除去/二値化処理(ステップS309)、および色算出処理(ステップS311)を含む。
詳しくは、図6を参照して、ステップS301において、スムージング処理された明度画像からエッジが抽出され、エッジ画像が生成される。このようにエッジ画像が生成されることで、明度の高い領域の文字や反転文字が検出されやすくなる。
次に、ステップS303において、エッジ画像の傾きが検出され、エッジ画像の傾きが補正される。このように画像の傾きが補正されることで、罫線抽出の精度を高めることができる。
次に、ステップS305において、生成されたエッジ画像から罫線が抽出され、文字判定を行なうために罫線が除去される。
次に、ステップS307においては、文字を構成する特定色の画素(ここでは黒画素とする)が膨張され近傍の画素が連結される。そして、文字が連結されて得られた矩形領域ごとに、短辺の長さ、短辺と長辺との長さの比率、および矩形領域内に存在する黒画素の割合などの条件に基づいて、その矩形領域が文字部分であるか否かを判定する文字判定が行なわれる。ここでの文字判定処理は一般的な文字判定処理であって、本発明において限定されない。なお、ステップS307での文字判定処理は、処理対象の領域が上記ステップS5においてテキスト領域と判別された領域と図/写真領域と判別された領域とによって異なる方法でなされてもよい。
次に、ステップS309において、上記ステップS307の文字判定処理によって文字部分と判定された矩形領域から網点を除去する処理が実行される。ここで網点除去処理が実行されることで、文字の背景に含まれる網点が除去され、網点が文字として二値化されることが防がれる。さらに、網点が除去された文字部分である矩形領域に対して二値化処理が実行され、各矩形領域内で文字と背景とが分離される。このように文字部分が二値化されることで、画像データのサイズを小さくすることができる。
次に、ステップS311において、文字部分および背景に対応する元画像の色データ(RGBデータ)が参照されて、文字および背景の色が決定される。
次に、文字統合部106および図/写真領域統合部108において、ステップS7で抽出された文字およびステップS5で判定された図/写真領域が各々同じレイヤ上に統合される(ステップS9)。
図7は、ステップS9で実行される領域統合処理を示すフローチャートである。図7を参照して、領域統合処理は、文字統合処理(ステップS401)と図/写真領域統合処理(ステップS403)とを含む。
詳しくは、図7を参照して、ステップS401において、上記ステップS7での文字抽出処理の結果文字部分と判定された、隣合う2つの矩形領域の間隔が所定の間隔以下であり、それらの矩形領域に割当てられた色の差が所定値以下である場合、これらの矩形領域が統合される。同様に、図/写真領域に含まれるブロックについても所定条件が満たされると統合される。このようにすることで文字部分である矩形領域の数および図/写真領域に含まれる処理対象のレイヤの数を減らすことができ、作成されるPDFデータのサイズを小さくすることができる。また、作成処理の速度を早めることができる。
そして、PDF化部113において、以上の処理で得られた画像データを用いてPDF化処理が実行されることで(ステップS11)、その画像データが圧縮されてPDFファイルが作成される。すなわち、ステップS11では、ステップS9で統合された文字部分を構成する画像データについては、解像度を低下させずに可逆圧縮部107でMMR圧縮方式のような可逆圧縮処理が施される。また、統合された図/写真領域を構成する画像データについては、解像度変換部109で解像度を低下させるように解像度変換された後に非可逆圧縮部111でJPEG圧縮方式のような非可逆圧縮処理が施される。
なお、上記ステップS11でのPDF化処理については、上述したような、いわゆるコンパクトPDFファイルを作成する一般的な処理が採用され、本発明において限定される処理ではない。
本発明の特徴とする、上記ステップS305における罫線抽出処理について、以下に具体例として第1〜第4の罫線抽出処理を挙げて説明する。
[第1の罫線抽出処理]
図8は、上記ステップS305における罫線抽出処理として、第1の罫線抽出処理の流れを示すフローチャートである。また、図9(A)〜図9(E)は、処理対象の画像が先に図18に示された原稿画像である場合の、第1の罫線抽出処理の流れを具体的に説明する図である。図9(A)〜図9(E)において抽出された黒画素の連続は太線で示されている。
図8を参照して、始めに、処理対象を第1の走査方向として主走査方向(たとえばx方向)に、ある行について走査する(ステップS501)。その結果、その行に、罫線を構成する特定色の画素(ここでは黒画素とする)が連続して存在することが検出された場合(ステップS503でYES)、その連続する黒画素群を連結し、黒画素のx方向ラインとする(ステップS505)。その黒画素のx方向ラインの長さが第1のしきい値以上の長さである場合(ステップS507でYES)、その黒画素のx方向ラインを罫線であると判定し、消去する(ステップS509)。
なお、上記第1のしきい値は通常の罫線判定に用いられている値であり、一般に用いられる大きさの文字の横幅よりも長めであることが好ましく、2〜3cm程度の値が好ましい。
上記ステップS501〜S509の処理が実行されることで、原稿画像の主走査方向の罫線が抽出される。処理対象の画像が図18に示された原稿画像である場合のここまでの処理結果は図9(A)で表わされ、ライン501が罫線と判定される。
次に、ステップS509で罫線と判定された黒画素のx方向ラインを走査して、第2の走査方向として副走査方向(たとえばy方向)に黒画素が連結されているか否かを探索する。該当する黒画素が検出された場合(ステップS511でYES)、その位置で副走査方向に走査してその黒画素に連続する黒画素を連結し、黒画素のy方向ラインとする(ステップS513)。その黒画素のy方向ラインの長さが第2のしきい値以上の長さである場合(ステップS515でYES)、その黒画素のy方向ラインを罫線であると判定して、消去し(ステップS517)、処理をステップS511に戻す。
ここでの第2のしきい値は上記第1のしきい値よりも小さい値であり、具体的には5mm程度の値が好ましい。
上記ステップS511〜S517の処理が実行されることで、原稿画像の主走査方向の罫線に接続されている副走査方向の罫線が抽出される。処理対象の画像が図18に示された原稿画像である場合のここまでの処理結果は図9(B)で表わされて、罫線と判定されたライン501に接続されたy方向ラインであるライン503を追跡し、罫線と判定される。
x方向のその行に黒画素が存在しない場合または以上の処理が終了してこれ以上黒画素が存在しない場合(ステップS503でNO)、黒画素のx方向ラインの長さが第1のしきい値に達しない場合(ステップS507でNO)、黒画素のx方向ラインにy方向に黒画素が連結されていない場合または以上の処理が終了して黒画素のx方向ラインにy方向に連結されている黒画素がすべて検出された場合(ステップS511でNO)、または黒画素のy方向ラインの長さが第2のしきい値に達しない場合には(ステップS515でNO)、その行に関する処理を終了し、次の行を走査するために処理をステップS501に戻す。すなわち、処理対象の画像が図18に示された原稿画像である場合、図9(C)に示されるように、x方向の走査を繰返して、次のx方向ラインであるライン505を追跡し、罫線と判定する。
以上の処理を、処理対象の画像に含まれるすべての行について繰返す。なお、このとき、すでに走査された画素については走査を行なわないようにする。図18に示された原稿画像について以上の処理が行なわれることで、図9(D)に示されるライン501〜511が罫線と判定される。なお、ライン513はx方向のいずれの罫線にも接続されていないため、ここまでの処理では罫線ではないと判定される。
処理対象の画像に含まれるすべての行について処理が終了し、以降の処理が始めてである場合(ステップS519でYES、かつステップS521でNO)、主走査方向と副走査方向とを入替えて再度上述の処理を行なうために、処理対象の画像を90度回転させる(ステップS523)。ここでは、図18に示される原稿画像は、図9(E)に示されるように回転され、同様の処理が施される。なお、このときライン513が上記第1のしきい値以上の長さである場合には、ステップS523で90度回転した後のステップS509において罫線と判定される。
なお、上記罫線抽出処理において、第1の走査方向としてx方向、第2の走査方向としてy方向が具体的に挙げられているが、その他の任意の方向であってもよい。また、その方向には、上記傾き検出の結果が反映されていてもよい。
以上の第1の罫線抽出処理が行なわれることで、原稿画像中の、主走査方向および副走査方向に第1のしきい値の長さ以上に連続した黒画素群は罫線と判定される。また、罫線と判定された連続する黒画素群に垂直に接続された、上記第1のしきい値の長さよりも短い第2のしきい値の長さ以上に連続した黒画素群もまた罫線と判定される。このように、第1の罫線抽出処理は、他の罫線に連結していることに注目して、罫線判定に用いるしきい値を第1のしきい値からそれよりも小さい第2のしきい値に変更して罫線に垂直に接続された罫線を抽出するものである。そのため、第1の罫線抽出処理を採用すると、短い罫線であっても正確に抽出することができる。
また、第1の罫線抽出処理は、このように短い長さで連続する黒画素群であって、他の罫線に垂直に接続されている黒画素群、つまり罫線である可能性が高い黒画素郡を罫線と判定するものである。そのため、第1の罫線抽出処理を採用すると、文字を罫線と誤判定することが少なくなる。
さらに、第1の罫線抽出処理は、上述のように条件に応じて用いるしきい値を変更しながら、罫線である可能性の高い黒画素群を抽出するものである。そのため、第1の罫線抽出処理を採用すると、従来の罫線抽出処理にみられる、文字を含んだ罫線候補の中からさらなるしきい値を用いて罫線を抽出する処理が不要となり、処理量を少なくすることができ、処理速度を早めることができる。
[第2の罫線抽出処理]
図10は、上記ステップS305における罫線抽出処理として、第2の罫線抽出処理の流れを示すフローチャートである。また、図11(A)〜(C)は第2の罫線抽出処理の流れを具体的に説明する図である。第2の罫線抽出処理は、「主走査方向および/または副走査方向の罫線の端点に連結された斜め方向のラインは斜め罫線であることが多い」という特徴を利用して斜め罫線を抽出する処理である。
第2の罫線抽出処理では、第1の罫線抽出処理に加えて、ステップS601〜S605の処理が実行される。詳しくは、図10を参照して、上記ステップS501〜S517の処理が実行されて主走査方向の罫線および副走査方向の罫線が判定されると、さらに、ステップS509で主走査方向の罫線と判定された黒画素のx方向ラインを走査して、その端点から斜め方向に黒画素が連結されているか否かを探索する。ここで探索される黒画素は、上記黒画素のx方向ラインに対して角度をもって連結された黒画素であればよいが、より好ましくは、0度以上90度未満の角度をもって連結された黒画素である。該当する黒画素が検出された場合(ステップS601でYES)、その位置から検出された角度に走査してその黒画素に連続する黒画素を連結し、黒画素の斜め方向ラインとする(ステップS603)。その黒画素の斜め方向ラインの長さが第2のしきい値以上の長さである場合(ステップS605でYES)、その黒画素の斜め方向ラインを罫線であると判定して、消去し(ステップS607)、処理をステップS511に戻す。
処理対象の原稿画像が図11(A)に示される画像である場合、図11(A)に示されるように上記ステップS501〜S509でライン601が主走査方向の罫線と判定され、上記ステップS601では、図11(B)に示されるように、罫線と判定されたライン601の端点から斜め方向に連結された斜めライン603が追跡され、罫線と判定される。
黒画素のx方向ラインの端点に斜め方向に黒画素が連結されていない場合またはもう一方の端点に斜め方向に黒画素が連結されていない場合(ステップS601でNO)、または黒画素の斜め方向ラインの長さが第2のしきい値に達しない場合にも(ステップS605でNO)、その行に関する処理を終了し、次の行を走査するために処理をステップS501に戻す。また、処理対象の画像に含まれるすべての行について処理が終了すると(ステップS519でYES)、第1の罫線抽出処理と同様に処理対象の画像を90度回転させ、同様の処理を繰返す(ステップS523)。
以上の第2の罫線抽出処理が行なわれることで、さらに、原稿画像中の、主走査方向および/または副走査方向の罫線の端点に斜め方向に連結された、上記第2のしきい値の長さ以上に連続した黒画素群が、斜め罫線と判定される。そのため、第2の罫線抽出処理を採用すると、誤判定を少なくして斜め罫線を抽出することができる。
[第3の罫線抽出処理]
図12は、上記ステップS305における罫線抽出処理として、第3の罫線抽出処理の流れを示すフローチャートである。また、図13は第3の罫線抽出処理の流れを具体的に説明する図である。第3の罫線抽出処理は、「表枠の対角を結ぶラインは斜め罫線であることが多い」という特徴を利用して斜め罫線を抽出する処理である。
第3の罫線抽出処理では、第2の罫線抽出処理に加えて、ステップS701の処理が実行される。詳しくは、図12を参照して、上記ステップS501〜S605の処理が実行されて主走査方向の罫線および副走査方向の罫線が判定され、抽出された、黒画素のx方向ラインに連結された黒画素の斜め方向ラインが第2のしきい値以上の長さであることが検出されると、その黒画素の斜め方向ラインを追跡していずれか他の罫線の端点に連結されている場合(ステップS701でYES)、その黒画素の斜め方向ラインを罫線であると判定して、消去し(ステップS607)、処理をステップS511に戻す。
なお、上記ステップS607では、「いずれか他の罫線の端点」に換えて、「罫線と罫線との交点」に連結されていることが検出されたときに、その黒画素の斜め方向ラインを罫線であると判定してもよい。
処理対象の原稿画像が先に図11(A)に示された画像である場合、第2の罫線抽出処理では斜め罫線とされたライン603は第3の罫線抽出処理では罫線として抽出されず、罫線と判定されるライン613の端点とライン615の端点とに斜め方向に連結された2つの斜めライン617,619が各々追跡されて、罫線と判定される。また、ライン607,609,611は両端または一端が罫線と判定されたラインの端点に連結されていないために、第3の罫線抽出処理では罫線と判定されない。
以上の第3の罫線抽出処理が行なわれることで、さらに、原稿画像中の、主走査方向および/または副走査方向の罫線の端点と他の罫線の端点とに斜め方向に連結された、上記第2のしきい値の長さ以上に連続した黒画素群、すなわち表のような枠の対角を結ぶ線が、斜め罫線と判定される。そのため、第3の罫線抽出処理を採用すると、より正確に斜め罫線を抽出することができる。
[第4の罫線抽出処理]
図14は、上記ステップS305における罫線抽出処理として、第4の罫線抽出処理の流れを示すフローチャートである。また、図15(A),(B)は第4の罫線抽出処理の流れを具体的に説明する図である。第4の罫線抽出処理は、「矢印の先端にある2本の斜め方向のラインは中心線に対して対称の方向に伸びている」という特徴を利用して矢印選択になる斜め罫線を抽出する処理である。
第4の罫線抽出処理では、第2の罫線抽出処理に加えて、ステップS801,S803の処理が実行される。詳しくは、図14を参照して、上記ステップS501〜S603の処理が実行されて主走査方向の罫線および副走査方向の罫線が判定され、黒画素のx方向ラインに黒画素の斜め方向ラインが連結していることが検出され、その斜め方向ラインが、その位置に連結された他の斜め方向ラインとそのx方向ラインに対して線対称に連結されていることが検出されると(ステップS801でYES)、それらのラインを追跡し、その長さがいずれも第3のしきい値以上の同じ長さである場合(ステップS803でYES)、それらの黒画素の斜め方向ラインを罫線であると判定して、消去し(ステップS607)、処理をステップS511に戻す。
ここでの第3のしきい値は上記第2のしきい値と同程度の値であってもよいし、より好ましくは上記第2のしきい値よりも小さい値である。具体的には3mm程度の値が好ましい。
処理対象の原稿画像が先に図11(A)に示された画像である場合、図15(A)に示されるように、罫線と判定されたライン621に斜め方向ライン607が連結し、ライン607がその位置に連結された他の斜め方向ライン609とライン621に対して線対称に連結されていることが検出されるとライン607を追跡する。さらに、ライン609も追跡し、図15(B)に示されるように、それらが罫線と判定される。
以上の第4の罫線抽出処理が行なわれることで、さらに、原稿画像中の、主走査方向および/または副走査方向の罫線の端点から、その罫線に対して線対称に同じ角度の方向に連結された、上記第3のしきい値の長さ以上に連続した2つの黒画素群が、斜め罫線と判定される。そのため、第4の罫線抽出処理を採用すると、矢印先端にある斜め罫線を、長さが短い場合であっても正確に抽出することができる。
なお、本実施の形態にかかる罫線抽出処理は上記第1〜第4の罫線抽出処理に限定されず、その他の方法が採用された処理であってもよいし、これらのうちの2つまたは2以上の方法が採用された処理であってもよい。
また、上記第2〜第4の罫線抽出処理においては、第1の罫線処理に含まれるステップS501〜S517の処理が実行されて主走査方向の罫線および副走査方向の罫線が判定された後に斜め罫線が判定されるものとされているが、ステップS501〜S509が実行されて主走査方向の罫線が判定された後に上記ステップS511〜S517がスキップされ、副走査方向の罫線を判定せずに、斜め罫線が判定されてもよい。
さらに、上記MFP10で画像データの圧縮を行なってPDFファイルを作成する際に行なわれる罫線抽出処理で採用されている罫線抽出方法を、プログラムとして提供することもできる。このようなプログラムは、コンピュータに付属するフレキシブルディスク、CD−ROM(Compact Disk-Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)およびメモリカードなどのコンピュータ読取り可能な記録媒体にて記録させて、プログラム製品として提供することもできる。あるいは、コンピュータに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。
なお、本発明にかかる罫線抽出プログラムは、コンピュータのオペレーションシステム(OS)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して情報管理処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して情報管理処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかる罫線抽出プログラムに含まれ得る。
提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記録された記録媒体とを含む。
図16は、上記プログラムを用いてPDFファイルを作成するシステムの構成の具体例として、第1の構成を示す図である。図16を参照して、第1の構成は、有線または無線のネットワークを介して接続されたMFPなどの画像データ取得装置と、上記プログラムである文書管理アプリケーションがインストールされたパーソナルコンピュータ(以下、PCと称する)とを含む構成である。第1の構成であるシステムにおいては、PCは文書管理アプリケーションにしたがって、MFPからメールに添付されるなどして送信された画像データから、上述の罫線抽出処理を含むPDF作成処理を実行してPDFファイルを作成する。上記プログラムが第1の構成のシステムで用いることで、PCを操作するユーザは、MFPから送信された画像データの中から目的に合わせてPDF化する画像データを選択することができる。
また、図17は、上記プログラムを用いてPDFファイルを作成するシステムの構成の具体例として、第2の構成を示す図である。図17を参照して、第2の構成は、有線または無線のネットワークで、上記プログラムである文書管理アプリケーションがインストールされた、メールサーバ等のサーバを介して接続されたMFPなどの画像データ取得装置と、PCとを含む構成である。第2の構成であるシステムにおいては、サーバは文書管理アプリケーションにしたがって、MFPから取得した画像データから、上述の罫線抽出処理を含むPDF作成処理を実行してPDFファイルを作成する。そして、PCに対してPDF化された画像データを送信する。上記プログラムが第2の構成のシステムで用いることで、サーバに接続されたPCを操作するユーザは、サーバより、PDF化されてサイズダウンされた画像データを取得することができる。
なお、上記第1の構成および第2の構成は、本発明にかかる罫線抽出プログラムおよび/または罫線抽出プログラムを含むプログラムが用いられる具体的な形態であり、その他の構成において用いられてもよい。
なお、本実施の形態ではPDFファイルを作成する前の画像処理としての罫線抽出処理に適用した場合を示しているが、本発明はこれに限定されることなく、たとえばOCR(Optical Character Reader)のような文字認識処理の前処理として文字を誤認識しないように罫線を抽出・消去する処理にも適用できる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
MFP10のハードウェア構成の具体例を示す図である。 MFP10において画像データの圧縮を行なってPDFファイルを作成するための機能構成の具体例を示すブロック図である。 MFP10において画像データの圧縮を行なってPDFファイルを作成する処理の流れを示すフローチャートである。 ステップS3で実行される前処理を示すフローチャートである。 ステップS5で実行される図/写真領域の判別処理を示すフローチャートである。 ステップS7で実行される文字抽出処理を示すフローチャートである。 ステップS9で実行される領域統合処理を示すフローチャートである。 ステップS305で実行される、第1の罫線抽出処理の流れを示すフローチャートである。 第1の罫線抽出処理の流れを具体的に説明する図である。 ステップS305で実行される、第2の罫線抽出処理の流れを示すフローチャートである。 第2の罫線抽出処理の流れを具体的に説明する図である。 ステップS305で実行される、第3の罫線抽出処理の流れを示すフローチャートである。 第3の罫線抽出処理の流れを具体的に説明する図である。 ステップS305で実行される、第4の罫線抽出処理の流れを示すフローチャートである。 第4の罫線抽出処理の流れを具体的に説明する図である。 罫線抽出プログラムを用いてPDFファイルを作成するシステムの第1の構成を示す図である。 罫線抽出プログラムを用いてPDFファイルを作成するシステムの第2の構成を示す図である。 原稿画像の具体例を示す図である。 罫線抽出を行なわずに文字判定を行なった結果の具体例を示す図である。 罫線抽出を行なって文字判定を行なう処理を説明する図である。 罫線抽出を行なって文字判定を行なった結果の具体例を示す図である。
符号の説明
1 スキャン処理部、2 入力画像処理部、3 記憶部、4 CPU、5 ネットワークI/F部、6 出力画像処理部、7 エンジン部、8 モデム・NCU、9 操作部、10 MFP、101 画像データ取得部、103 前処理部、104 文字抽出部、105 領域判別部、106 文字統合部、107 可逆圧縮部、108 図/写真領域統合部、109 解像度変換部、111 非可逆圧縮部、113 PDF化部、501,505,507,509,511,513,601,603,607,609,611,613,615,517,619,621 ライン。

Claims (20)

  1. 画像データを得る画像データ取得手段と、
    前記画像データから罫線を抽出する罫線抽出手段とを備え、
    前記罫線抽出手段は、
    前記画像データを第1の方向に走査して、第1のしきい値以上の長さ連続する第1の画素群が検出されると、前記第1の画素群を第1の罫線と判定する第1判定手段と、
    前記第1の罫線から第2の方向に走査して、前記第1の罫線に連結された、第2のしきい値以上の長さ連続する第2の画素群が検出されると、前記第2の画素群を第2の罫線と判定する第2判定手段とを含み、
    前記第2のしきい値は前記第1のしきい値よりも小さい、画像処理装置。
  2. 前記第1の方向と前記第2の方向とは直角をなす方向である、請求項1に記載の画像処理装置。
  3. 前記第1の方向と前記第2の方向とは0度以上90度未満の角度なす方向であり、
    前記第2判定手段は、前記第2の画素群が前記第1の罫線の端点に連結されているときに前記第2の画素群を第2の罫線と判定する、請求項1に記載の画像処理装置。
  4. 前記第1の方向と前記第2の方向とは0度以上90度未満の角度なす方向であり、
    前記第2判定手段は、前記第2の画素群が前記第1の罫線の端点と第3の罫線の端点とに連結されているときに、前記第2の画素群を第2の罫線と判定する、請求項1に記載の画像処理装置。
  5. 前記第1の方向と前記第2の方向とは0度以上90度未満の角度なす方向であり、
    前記第2判定手段は、前記第2の画素群が前記第1の罫線の1端点から、前記第1の罫線に対して線対称に連結される第3の画素群および第4の画素群からなるときに、前記第2の画素群を第2の罫線と判定する、請求項1に記載の画像処理装置。
  6. 前記罫線抽出手段は、
    前記第1の罫線から第3の方向に走査して、前記第1の罫線の1端点から前記第1の罫線に対して線対称に連結された、第3のしきい値以上の長さ連続する第3の画素群および第4の画素群が検出されると、前記第3の画素群および前記第4の画素群を第3の罫線および第4の罫線と判定する第3判定手段をさらに含み、
    前記第3のしきい値は前記第2のしきい値よりも小さい、請求項1に記載の画像処理装置。
  7. 前記罫線抽出手段によって罫線と判定された画素群を消去する手段をさらに備える、請求項1に記載の画像処理装置。
  8. 前記画像データのうち、前記罫線抽出手段によって罫線と判定された画素群を除く領域について文字判定処理を行なう手段をさらに備える、請求項1に記載の画像処理装置。
  9. 画像データを得る画像データ取得手段と、
    前記画像データから罫線を抽出する罫線抽出手段とを備え、
    前記罫線抽出手段は、
    前記画像データを第1の方向に走査して、第1のしきい値以上の長さ連続する第1の画素群が検出されると、前記第1の画素群を第1の罫線と判定する第1判定手段と、
    前記第1の方向と0度以上90度未満の角度なす第2の方向に走査して、前記第1の罫線に連結された、第2のしきい値以上の長さ連続する第2の画素群が検出されると、前記第2の画素群を第2の罫線と判定する第2判定手段とを含む、画像処理装置。
  10. 前記第2のしきい値は前記第1のしきい値よりも小さい、請求項9に記載の画像処理装置。
  11. 前記第2判定手段は、前記第2の画素群が前記第1の罫線の端点に連結されているときに前記第2の画素群を第2の罫線と判定する、請求項9に記載の画像処理装置。
  12. 前記第2判定手段は、前記第2の画素群が前記第1の罫線の端点と第3の罫線の端点とに連結されているときに、前記第2の画素群を第2の罫線と判定する、請求項9に記載の画像処理装置。
  13. 前記第2判定手段は、前記第2の画素群が前記第1の罫線の1端点から、前記第1の罫線に対して線対称に連結される第3の画素群および第4の画素群からなるときに、前記第2の画素群を第2の罫線と判定する、請求項9に記載の画像処理装置。
  14. 前記第1判定手段は、特定色の画素で構成される前記第1の画素群が検出されると、前記第1の画素群を第1の罫線と判定する、請求項1または9に記載の画像処理装置。
  15. 画像処理装置における罫線抽出処理をコンピュータに実行させるプログラムであって、
    画像データを得る画像データ取得ステップと、
    前記画像データを第1の方向に走査して、第1のしきい値以上の長さ連続する第1の画素群が検出されると、前記第1の画素群を第1の罫線と判定して抽出する第1抽出ステップと、
    前記第1の罫線から第2の方向に走査して、前記第1の罫線に連結された、第2のしきい値以上の長さ連続する第2の画素群が検出されると、前記第2の画素群を第2の罫線と判定して抽出する第2抽出ステップとを実行させ、
    前記第2のしきい値は前記第1のしきい値よりも小さい、罫線抽出プログラム。
  16. 前記第1の方向と前記第2の方向とは直角をなす方向である、請求項15に記載の罫線抽出プログラム。
  17. 前記第1の方向と前記第2の方向とは0度以上90度未満の角度なす方向であり、
    前記第2抽出ステップにおいては、前記第2の画素群が前記第1の罫線の端点に連結されているときに前記第2の画素群を第2の罫線と判定して抽出する、請求項15に記載の罫線抽出プログラム。
  18. 前記第1の方向と前記第2の方向とは0度以上90度未満の角度なす方向であり、
    前記第2抽出ステップにおいては、前記第2の画素群が前記第1の罫線の端点と第3の罫線の端点とに連結されているときに、前記第2の画素群を第2の罫線と判定して抽出する、請求項15に記載の罫線抽出プログラム。
  19. 前記第1の方向と前記第2の方向とは0度以上90度未満の角度なす方向であり、
    前記第2抽出ステップにおいては、前記第2の画素群が前記第1の罫線の1端点から、前記第1の罫線に対して線対称に連結される第3の画素群および第4の画素群からなるときに、前記第2の画素群を第2の罫線と判定して抽出する、請求項15に記載の罫線抽出プログラム。
  20. 前記第1の罫線から第3の方向に走査して、前記第1の罫線の1端点から前記第1の罫線に対して線対称に連結された、第3のしきい値以上の長さ連続する第3の画素群および第4の画素群が検出されると、前記第3の画素群および前記第4の画素群を第3の罫線および第4の罫線と判定して抽出する第3抽出ステップをさらに実行させ、
    前記第3のしきい値は前記第2のしきい値よりも小さい、請求項15に記載の罫線抽出プログラム。
JP2006009115A 2006-01-17 2006-01-17 画像処理装置および罫線抽出プログラム Expired - Fee Related JP4329764B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006009115A JP4329764B2 (ja) 2006-01-17 2006-01-17 画像処理装置および罫線抽出プログラム
US11/447,050 US7660014B2 (en) 2006-01-17 2006-06-06 Image processing apparatus capable of extracting rule from document image with high precision

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006009115A JP4329764B2 (ja) 2006-01-17 2006-01-17 画像処理装置および罫線抽出プログラム

Publications (2)

Publication Number Publication Date
JP2007193446A true JP2007193446A (ja) 2007-08-02
JP4329764B2 JP4329764B2 (ja) 2009-09-09

Family

ID=38262896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006009115A Expired - Fee Related JP4329764B2 (ja) 2006-01-17 2006-01-17 画像処理装置および罫線抽出プログラム

Country Status (2)

Country Link
US (1) US7660014B2 (ja)
JP (1) JP4329764B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010074368A (ja) * 2008-09-17 2010-04-02 Ricoh Co Ltd 画像処理装置、画像処理方法、およびプログラム
JP2011018338A (ja) * 2009-07-10 2011-01-27 Palo Alto Research Center Inc スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム
US8116568B2 (en) 2008-03-03 2012-02-14 Sharp Kabushiki Kaisha Image processing apparatus, image reading apparatus, image data output processing apparatus, and image processing method
US9355326B2 (en) 2013-04-25 2016-05-31 Kyocera Document Solutions Inc. Image processing apparatus, ruled line determination method, and storage medium having ruled line determination program stored therein
JP2016139209A (ja) * 2015-01-26 2016-08-04 コニカミノルタ株式会社 情報処理装置、画像形成システム及びプログラム

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4424309B2 (ja) * 2006-01-23 2010-03-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、文字判定プログラム、および文字判定方法
JP4135752B2 (ja) * 2006-06-12 2008-08-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
KR101282030B1 (ko) * 2007-01-26 2013-07-04 삼성전자주식회사 데이터의 보안 전송을 위한 화상형성장치 및 그 전송방법
US8351707B2 (en) * 2007-07-31 2013-01-08 Sharp Kabushiki Kaisha Image processing apparatus, image forming apparatus, image processing system, and image processing method
US8457432B2 (en) * 2008-06-25 2013-06-04 Microsoft Corporation High information density of reduced-size images of web pages
US8602758B2 (en) 2008-09-17 2013-12-10 Exponential Technologies, Inc. Indexed positive displacement rotary motion device
US8562318B1 (en) 2009-08-20 2013-10-22 Exponential Technologies, Inc. Multiphase pump with high compression ratio
JP6314544B2 (ja) * 2014-03-04 2018-04-25 株式会社リコー 画像処理方法、画像処理装置、画像形成装置、プログラム
AU2018385847A1 (en) 2017-12-13 2020-07-30 Exponential Technologies, Inc. Rotary fluid flow device
US11168683B2 (en) 2019-03-14 2021-11-09 Exponential Technologies, Inc. Pressure balancing system for a fluid pump
JP2022003752A (ja) * 2020-06-23 2022-01-11 株式会社リコー シェーディング補正装置、読取装置、画像形成装置、及び方法

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3113555A1 (de) 1981-04-03 1982-10-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen
DE3838729C2 (de) 1987-11-16 1994-05-05 Canon Kk Dokumentverarbeitungsgerät
JPH01266689A (ja) 1988-04-19 1989-10-24 Canon Inc 画像認識装置
JPH0341562A (ja) 1989-07-10 1991-02-22 Mitsubishi Electric Corp 図形認識方法
JP2851089B2 (ja) 1989-11-30 1999-01-27 株式会社リコー 表処理方法
JPH04158482A (ja) 1990-10-23 1992-06-01 Ricoh Co Ltd 矢印方向検出装置
JPH05282493A (ja) 1992-03-31 1993-10-29 Matsushita Electric Ind Co Ltd 英文字認識装置
JPH0676103A (ja) 1992-08-25 1994-03-18 Fuji Facom Corp 文書画像の文章領域抽出装置
JPH06187489A (ja) 1992-12-17 1994-07-08 Matsushita Electric Ind Co Ltd 文字認識装置
JP2550867B2 (ja) 1993-06-04 1996-11-06 日本電気株式会社 図形混在文書画像の構造解析方法
JPH07168911A (ja) 1993-12-16 1995-07-04 Matsushita Electric Ind Co Ltd 文書認識装置
JP3749282B2 (ja) 1995-05-16 2006-02-22 株式会社東芝 画像処理装置
JPH09223240A (ja) 1996-02-14 1997-08-26 Oki Electric Ind Co Ltd 文書電子化装置
JP2878194B2 (ja) 1996-07-29 1999-04-05 日本電気ソフトウェア株式会社 画像データの部分消去および部分検出方法
US6226402B1 (en) 1996-12-20 2001-05-01 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JPH10187878A (ja) 1996-12-26 1998-07-21 Ricoh Co Ltd 表処理方法
US6721071B1 (en) 1997-07-09 2004-04-13 Minolta Co., Ltd. Facsimile allowing correct registration of telephone number
JP4235286B2 (ja) 1998-09-11 2009-03-11 キヤノン株式会社 表認識方法及び装置
JP4089849B2 (ja) 1999-02-01 2008-05-28 株式会社リコー 罫線処理装置および記録媒体
JP2001034763A (ja) 1999-03-01 2001-02-09 Matsushita Electric Ind Co Ltd 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法
JP2000306102A (ja) 1999-04-23 2000-11-02 Ricoh Co Ltd 罫線識別方法および記録媒体
JP2001060247A (ja) 1999-06-14 2001-03-06 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
JP2001016447A (ja) 1999-06-30 2001-01-19 Minolta Co Ltd 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体
JP3153812B1 (ja) 1999-10-05 2001-04-09 松下電送システム株式会社 インターネットファクシミリ装置およびインターネットファクシミリ送信方法
JP2001147988A (ja) 1999-11-22 2001-05-29 Nippon Digital Kenkyusho:Kk 文字認識方法及び文字認識装置
JP4159720B2 (ja) 2000-03-15 2008-10-01 株式会社リコー 表認識方法と表認識装置と文字認識装置及び表認識プログラムを記録した記憶媒体
JP4150842B2 (ja) 2000-05-09 2008-09-17 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4586241B2 (ja) 2000-06-14 2010-11-24 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
JP4655335B2 (ja) 2000-06-20 2011-03-23 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2002165105A (ja) 2000-11-27 2002-06-07 Canon Inc 画像処理装置及びその方法並びに記憶媒体
JP3899872B2 (ja) 2001-08-24 2007-03-28 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
US7340092B2 (en) 2001-12-21 2008-03-04 Minolta Co., Ltd. Image processing device, image processing method, program for executing image processing, and computer readable recording medium on which the program is stored
JP3931651B2 (ja) 2001-12-21 2007-06-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
JP2003317107A (ja) 2002-04-26 2003-11-07 Fujitsu Ltd 罫線抽出方法及び装置
JP2004304469A (ja) 2003-03-31 2004-10-28 Minolta Co Ltd 原稿画像の領域分割・圧縮プログラム及び領域分割・圧縮方法
US7602995B2 (en) * 2004-02-10 2009-10-13 Ricoh Company, Ltd. Correcting image distortion caused by scanning
JP4569162B2 (ja) 2004-04-30 2010-10-27 コニカミノルタビジネステクノロジーズ株式会社 画像処理方法、画像処理プログラムおよび画像処理装置
JP2004246929A (ja) 2004-06-01 2004-09-02 Ricoh Co Ltd 文書画像の領域分割方法および装置
JP4424309B2 (ja) 2006-01-23 2010-03-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、文字判定プログラム、および文字判定方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8116568B2 (en) 2008-03-03 2012-02-14 Sharp Kabushiki Kaisha Image processing apparatus, image reading apparatus, image data output processing apparatus, and image processing method
JP2010074368A (ja) * 2008-09-17 2010-04-02 Ricoh Co Ltd 画像処理装置、画像処理方法、およびプログラム
JP2011018338A (ja) * 2009-07-10 2011-01-27 Palo Alto Research Center Inc スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム
US9355326B2 (en) 2013-04-25 2016-05-31 Kyocera Document Solutions Inc. Image processing apparatus, ruled line determination method, and storage medium having ruled line determination program stored therein
JP2016139209A (ja) * 2015-01-26 2016-08-04 コニカミノルタ株式会社 情報処理装置、画像形成システム及びプログラム

Also Published As

Publication number Publication date
US20070165280A1 (en) 2007-07-19
JP4329764B2 (ja) 2009-09-09
US7660014B2 (en) 2010-02-09

Similar Documents

Publication Publication Date Title
JP4329764B2 (ja) 画像処理装置および罫線抽出プログラム
JP4424309B2 (ja) 画像処理装置、文字判定プログラム、および文字判定方法
US7545992B2 (en) Image processing system and image processing method
JP4135752B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4333708B2 (ja) 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム
JP4861967B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、画像形成装置、記憶媒体
US7133559B2 (en) Image processing device, image processing method, image processing program, and computer readable recording medium on which image processing program is recorded
JP5049920B2 (ja) 画像処理装置及び画像処理方法
JP2008099149A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP4089736B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4861362B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US8577132B2 (en) Electronic document generation system, electronic document generation method, and program
JP5003445B2 (ja) 画像処理装置、文字領域特定方法、および文字領域特定プログラム
JP4442701B2 (ja) 領域判別方法、画像圧縮方法、画像圧縮装置、およびコンピュータプログラム
JP4792835B2 (ja) 画像処理装置
JP4396710B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP5517028B2 (ja) 画像処理装置
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP6025803B2 (ja) 画像処理装置
JP2020087320A (ja) 画像処理装置、画像処理方法、及びプログラム
JP4412339B2 (ja) 画像形成装置および画像データの補正方法
JP2010068198A (ja) 画像形成装置
US20090316998A1 (en) Outlining method for properly representing curved line and straight line, and image compression method using the same
JP2010113431A (ja) 画像処理装置、画像処理方法及び画像処理プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090526

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090608

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120626

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130626

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees