JP4424309B2 - 画像処理装置、文字判定プログラム、および文字判定方法 - Google Patents

画像処理装置、文字判定プログラム、および文字判定方法 Download PDF

Info

Publication number
JP4424309B2
JP4424309B2 JP2006013830A JP2006013830A JP4424309B2 JP 4424309 B2 JP4424309 B2 JP 4424309B2 JP 2006013830 A JP2006013830 A JP 2006013830A JP 2006013830 A JP2006013830 A JP 2006013830A JP 4424309 B2 JP4424309 B2 JP 4424309B2
Authority
JP
Japan
Prior art keywords
character
area
determination
pixel
minimum rectangular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006013830A
Other languages
English (en)
Other versions
JP2007193750A (ja
Inventor
俊浩 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2006013830A priority Critical patent/JP4424309B2/ja
Priority to US11/447,103 priority patent/US8208744B2/en
Publication of JP2007193750A publication Critical patent/JP2007193750A/ja
Application granted granted Critical
Publication of JP4424309B2 publication Critical patent/JP4424309B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Description

この発明は画像処理装置、文字判定プログラム、および文字判定方法に関し、特に、原稿中の文字部分を判定する画像処理装置、文字判定プログラム、および文字判定方法に関する。
近年、情報の電子化が進み、文書を紙ではなく電子化して保存、または送信する需要が高まっている。そこで、MFP(Multi Function Peripherals)等の画像データを取得する画像処理装置において、スキャンして得られた画像データを紙に印刷することなく、メールに添付するなどして直接送信する機能が普及してきている。
ところで、MFP等の画像処理装置において取り扱う画像は白黒画像からカラー画像に移行しつつあるため、上記画像データはカラー画像データとなりつつある。MFPにおいて、いわゆるA4サイズと言われる297mm×210mmのサイズのフルカラー原稿を解像度300dpiでスキャンして得られるカラー画像データのサイズは、約25MBに達する。そのため、カラー画像データは、メールに添付して送信するにはサイズが大きすぎるという問題が発生してきている。
この問題を解決するために、スキャンして得られた画像データ(スキャンデータと略する)を圧縮してサイズダウンしてから送信することが一般的になされている。しかしながら、画像全体に対して同一の解像度でスキャンデータを圧縮すると、画像に含まれる文字の判読性が損なわれる。画像中の文字の判読性を確保できる程度の高い解像度で圧縮すると、スキャンデータのサイズダウンが十分にできないという問題がある。
この問題を解決するために、本願出願人が先に出願して公開されている以下の特許文献3において、画像中の領域ごとに異なる解像度や異なる圧縮方法でスキャンデータを圧縮する、いわゆるコンパクトPDF(Portable Document Format)化と言われる方法などの圧縮方法が提案されている。この方法によると、コンパクトPDFは、
(1)スキャンデータの領域を判別する処理を実行し、文字部分と文字以外の部分とを分離し、
(2)文字部分に対して、高解像度のまま二値化処理し、同じ色の文字を統合して文字の色を決定して、MMR(Modified Modified-Read)圧縮等の可逆圧縮し、
(3)文字以外の部分に対して、解像度を下げてJPEG(Joint Photographic Experts Group)圧縮等の非可逆圧縮する、
手順で作成される。
図17は、コンパクトPDFファイルのデータ構成の具体例を示す図である。
図17を参照して、コンパクトPDFファイルのデータ構成は階層化構造であって、最上層である第1層として、コンパクトPDFファイルには、大きくは、PDF使用のバージョンが記されたファイルヘッダと、文書内容が記されたボディと、ボディ内のオブジェクトの位置が記された相互参照表と、PDFファイルのオブジェクト数やカタログ辞書のオブジェクト番号が記されたトレーラとが含まれる。
第1層の下の第2層として、上記ボディには、日付等の文書情報と、文書を構成する各ページ(子ページ)のデータブロックと、子ページに対応した子ページ辞書と、ページ数や子ページ辞書の番号が記された親ページ辞書と、親ページ辞書の番号が記されたカタログ辞書とが含まれる。
さらに、第2層の下の第3層として、子ページのデータブロックには、JPEG圧縮されたデータが格納された、1つの背景レイヤと、二値化後にMMR圧縮された、複数の文字レイヤと、各レイヤの位置や文字の色などが記されたレイヤ情報とが含まれる。
特許文献3に提案されている方法でスキャンデータを圧縮することで、文字の判読性の確保と低サイズ化とを両立させることができる。
この方法は上述の手順で実行されるため、スキャンデータから文字部分を正確に抽出することが重要となる。たとえば以下の特許文献1,2に記載されている文字認識装置,画像処理装置においては、スキャンデータから文字部分を抽出するために、次のような領域判別処理がなされている。すなわち、黒画素を膨張させ連結させる処理を行ない、近傍にある黒画素群を単語や行単位の矩形としてまとめた後に(ラベリング)、その領域がテキスト領域か否かを判定する処理がなされている。
上述のように領域判別処理において黒画素群を連結させて単語単位の矩形としてまとめることは、テキスト領域が大部分を占める原稿に対しては、判定の精度を向上させたり、処理時間を短縮させたりでき、効果的である。
このような処理がなされることで、たとえば図18に示されるように文字と、写真、図形、およびグラフ(これらを総称して図と称するものとする)とが混在する原稿がスキャンされたとき、文字や罫線が付加された文字の領域はテキスト領域として抽出されてMMR圧縮され、図の領域は背景領域として抽出されてJPEG圧縮され、これらがPDFファイルフォーマットに格納されることでコンパクトPDFファイルが作成される。
特開平6−187489号公報 特開平8−317197号公報 特開2004−304469号公報
しかしながら、上述の領域判別処理においては、領域の特徴に関わらず一定の条件で黒画素を膨張させて連結させる処理が行なわれるため、原稿内に写真や図形やグラフなどの図が含まれている場合、その近傍の文字を構成する黒画素が図を構成する黒画素と連結されてしまい、その文字の領域を判定できない場合があるという問題があった。
また、図に文字が含まれる場合、その文字を構成する黒画素が周囲のノイズ画素と連結されてしまい、その文字の領域を判定できない場合があるという問題があった。
本発明はこのような問題に鑑みてなされたものであって、画像中に写真や図形やグラフなどの図が含まれている場合であっても、高精度かつ高速に画像に含まれる文字部分を判定することのできる画像処理装置、文字判定プログラム、および文字判定方法を提供することを目的とする。
上記目的を達成するために、本発明のある局面に従うと、画像処理装置は、画像データを得る画像データ取得手段と、画像データに含まれる領域について、テキスト領域か図領域かを判別する判別手段と、判別手段によってテキスト領域と判別された領域に対して第1の文字判定方法で文字判定を行なう第1の文字判定手段と、判別手段によって図領域と判別された領域に対して、第1の文字判定方法とは異なる第2の文字判定方法で文字判定を行なう第2の文字判定手段とを備える。
より詳しくは、第2の文字判定手段は、図領域についてラベリングを行なって、連続する画素を囲む最小矩形領域を得る最小矩形領域取得手段と、その最小矩形領域が文字部分であるか否かを判定する判定手段とを含むことが好ましい。
また、第1の文字判定手段は、テキスト領域に含まれる第1の画素と第2の画素とを連結する連結手段と、テキスト領域についてラベリングを行なって、連結された第1の画素および第2の画素を囲む最小矩形領域を得る最小矩形領域取得手段と、その最小矩形領域が文字部分であるか否かを判定する判定手段とを含むことが好ましい。
さらに、第1の文字判定手段は、テキスト領域から行間を検出する行間検出手段を含み、連結手段は、テキスト領域から行間を除いた領域内で、第1の画素と第2の画素とを連結することがより好ましい。
またさらに、連結手段は、第1の画素と第2の画素との距離が所定距離以下である場合に第1の画素と第2の画素とを連結することがより好ましい。
なお、上述の画素は特定色(たとえば黒)の画素であることがより好ましい。
また、判定手段は、最小矩形領域内の特定色の画素の比率を用いて最小矩形領域が文字部分であるか否かを判定することが好ましい。
また、画像処理装置は、第1の文字判定手段および/または第2の文字判定手段における文字判定で文字部分であると判定された第1領域を可逆圧縮する第1の圧縮手段と、第1の文字判定手段および/または第2の文字判定手段における文字判定で文字部分でないと判定された第2領域を非可逆圧縮する第2の圧縮手段とを含むことが好ましい。
さらに、第2の圧縮手段は第2領域の解像度を低下させる手段を含むことが好ましい。
本発明の他の局面に従うと、文字判定プログラムは、コンピュータに文字判定処理を実行させるプログラムであって、画像データを得る画像データ取得ステップと、画像データに含まれる領域について、テキスト領域か図領域かを判別する判別ステップと、判別ステップにおいてテキスト領域と判別された領域に対して第1の文字判定方法で文字判定を行なう第1の文字判定ステップと、判別ステップにおいて図領域と判別された領域に対して第1の文字判定方法とは異なる第2の文字判定方法で文字判定文字判定を行なう第2の文字判定ステップとを実行させる。
より詳しくは、第2の文字判定ステップは、図領域についてラベリングを行なって、連続する画素を囲む最小矩形領域を得る最小矩形領域取得ステップと、その最小矩形領域が文字部分であるか否かを判定する判定ステップとを含むことが好ましい。
また、第1の文字判定ステップは、テキスト領域に含まれる第1の画素と第2の画素とを連結する連結ステップと、テキスト領域についてラベリングを行なって、連結された第1の画素および第2の画素を囲む最小矩形領域を得る最小矩形領域取得ステップと、その最小矩形領域が文字部分であるか否かを判定する判定ステップとを含むことが好ましい。
また、文字判定プログラムは、第1の文字判定ステップおよび/または第2の文字判定ステップにおける文字判定で文字部分であると判定された第1領域を可逆圧縮する第1の圧縮ステップと、文字部分でないと判定された第2領域を非可逆圧縮する第2の圧縮ステップとをさらに実行させることが好ましい。
本発明のさらに他の局面に従うと、文字判定方法は画像処理装置において画像データに含まれる文字を判定する方法であって、画像データを得る画像データ取得ステップと、画像データに含まれる領域について、テキスト領域か図領域かを判別する判別ステップと、判別ステップにおいてテキスト領域と判別された領域に対して第1の文字判定方法で文字判定を行なう第1の文字判定ステップと、判別ステップにおいて図領域と判別された領域に対して第2の文字判定方法で文字判定文字判定を行なう第2の文字判定ステップとを含む。
より詳しくは、第2の文字判定ステップは、図領域についてラベリングを行なって、連続する画素を囲む最小矩形領域を得る最小矩形領域取得ステップと、その最小矩形領域が文字部分であるか否かを判定する判定ステップとを含むことが好ましい。
また、第1の文字判定ステップは、テキスト領域に含まれる第1の画素と第2の画素とを連結する連結ステップと、テキスト領域についてラベリングを行なって、連結された第1の画素および第2の画素を囲む最小矩形領域を得る最小矩形領域取得ステップと、その最小矩形領域が文字部分であるか否かを判定する判定ステップとを含むことが好ましい。
また、文字判定方法は、第1の文字判定ステップおよび/または第2の文字判定ステップにおける文字判定で文字部分であると判定された第1領域を可逆圧縮する第1の圧縮ステップと、文字部分でないと判定された第2領域を非可逆圧縮する第2の圧縮ステップとをさらに含むことが好ましい。
本発明にかかる画像処理装置が、テキスト領域については連結された画素を囲む矩形単位で文字判定を行ない、図領域については画素が連結されることなくラベリングで得られた連続する画素を囲む矩形領域ごとに文字判定を行なうことで、処理速度を確保しつつ、図領域に含まれる文字部分を高精度で検出することができる。
以下に、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。
本実施の形態においては、本発明にかかる画像処理装置がMFP(Multi Function Peripherals)であるものとするが、本発明にかかる画像処理装置はMFPに限定されず、画像データを取得する手段と、その画像データを処理する手段とを備える装置であれば他の装置であってもよく、たとえば一般的なパーソナルコンピュータやファクシミリ装置などであってもよい。
図1は、本実施の形態にかかるMFP10のハードウェア構成の具体例を示す図である。
図1を参照して、本実施の形態にかかるMFP10は、スキャン処理部1と、入力画像処理部2と、記憶部3と、CPU(Central Processing Unit)4と、ネットワークI/F(インタフェース)5と、出力画像処理部6と、エンジン部7と、モデム・NCU(Network Control Unit)8と、操作部9とを含んで構成される。
操作部9は操作キーと表示部とを含んで構成され、ユーザI/Fとして機能して、ユーザからの宛先の入力、スキャン条件の選択、画像ファイルフォーマットの選択、処理の開始/中断等の操作を受付ける。操作部9は、操作に基づいた操作信号を、CPU4に対して出力する。
記憶部3は、DRAM(Dynamic Random Access Memory)等の電子メモリと、ハードディスク等の磁気メモリとを含んで構成され、プログラムや画像データを保持する。CPU4は、記憶部3に記憶されるプログラムを実行し、操作部9から入力された操作信号に基づいて、必要な制御信号を各部に対して出力してMFP10全体を制御する。なお、記憶部3は、CPU4においてプログラムが実行される際の作業領域としても用いられる。
スキャン処理部1は、上記制御信号に従ってセットされた原稿をスキャンして読取り、入力画像処理部2に対して画像データを出力する。入力画像処理部2は、上記制御信号に従って、入力された画像データに対して色変換、色補正、解像度変換、領域判別等の処理を実行する。処理後のデータは記憶部3に保持される。
出力画像処理部6は、上記制御信号に従って記憶部3に保持される画像データを読出し、その画像に対してスクリーン制御、スムージング処理、PWM(Pulse Wide Modulation)制御等を施し、処理後の画像データをエンジン部7に対して出力する。
エンジン部7は、上記制御信号に従って、出力画像処理部6から入力された画像データに基づいてトナー画像を生成し、トナー画像をセットされた印刷用紙に転写することで画像を印刷する。ここでMFP10がカラー画像を出力するカラーMFPである場合にはエンジン部7はイエロー、マゼンタ、シアン、ブラックの4色のトナーを用いてトナー画像を生成する。
また、CPU4は、記憶部3に記憶されるプログラムを実行し、記憶部3に保持される画像データに対して画像処理を施し、記憶部3、ネットワークI/F部5、またはモデム・NCU8に対して出力する。
ネットワークI/F部5は、電子メール等を、ネットワークを介して他の装置に送信するためのI/Fであり、プロトコルの作成などを行なう。ネットワークI/F部5は、上記制御信号に従って、CPU4から入力された画像データ、または記憶部3から読出した画像データを、ネットワークを介して他の装置に送信する。
モデム・NCU8は、ファクシミリ送受信のための変復調、ファクシミリの通信プロトコルの生成などを行なって電話回線を介した通信を制御する。モデム・NCU8は、上記制御信号に従って、CPU4から入力された画像データ、または記憶部3から読出した画像データを、電話回線を介して他の装置に送信する。
図2は、本実施の形態にかかるMFP10において画像データの圧縮を行なってPDF(Portable Document Format)ファイルを作成するための機能構成の具体例を示すブロック図である。図2に示される各部は、主にCPU4が記憶部3に記憶されるプログラムを実行することによってCPU4に形成される機能であるが、いくつかの機能はたとえば入力画像処理部2などの他のハードウェア構成に形成されてもよい。
図2を参照して、本実施の形態にかかるMFP10においてPDFファイルを作成するための機能は、画像データ取得部101と、前処理部103と、領域判別部105と、可逆圧縮部107と、低解像度化部109と、非可逆圧縮部111と、PDF化部113とを含んで構成される。
画像データ取得部101は、上記スキャン処理部1において生成された画像データを取得し、TIFF(Tagged Image File Format)、JPEG(Joint Photographic Experts Group)、BMP(Bit MaP)などのデータフォーマットで前処理部103に入力する。
前処置部103は、画像データ取得部101から入力された画像データに対して、領域判別のための前処理として、画像形式の変換、解像度変換、下地除去などの処理を施し、領域判別部105に入力する。
領域判別部105は、前処理部103から入力された画像データに対して領域判別処理を施す。領域判別処理には、文字判定処理、図や写真や下地を判定する処理、網点除去処理、二値化処理、および文字色決定処理等が含まれる。領域判別部105はこのような領域判別処理を実行して、画像中の文字(文字および罫線)部分を抽出し、文字部分と文字以外の写真や図形やグラフなどの背景部分とを分離する。ここでいう文字部分には、以降に説明されるように、写真や図形やグラフなど図の中に存在する文字も含まれる。
分離された背景部分を構成する画像データは低解像度化部109を経て非可逆圧縮部111に、文字部分を構成する画像データは低解像度化部109を経ることなく可逆圧縮部107に直接、各々入力される。
可逆圧縮部107は、領域判別部105から入力された文字部分を構成する画像データに対して、MMR(Modified Modified-Read)圧縮方式のような可逆性の圧縮を行なう。また、非可逆圧縮部111は、低解像度化部109で低解像度化された背景部分を構成する画像データに対して、JPEG圧縮方式のような非可逆圧縮を行なう。可逆圧縮部107および非可逆圧縮部111において圧縮された文字部分を構成する画像データおよび背景部分を構成する画像データはPDF化部113に入力され、これらに基づいてPDFファイルが作成される。
なお、図2に示されるMFP10の機能構成はPDFファイルを作成する際に画像データのうち背景部分を構成する画像データについて解像度を低下させて非可逆圧縮する場合の構成であるが、背景部分を構成する画像データについて解像度を低下させずに非可逆圧縮してもよい。その場合、MFP10の機能には低解像度化部109が含まれていなくてもよい。
図3は、本実施の形態にかかるMFP10において画像データの圧縮を行なってPDFファイルを作成する処理の流れを示すフローチャートである。図3のフローチャートに示される処理は、主にCPU4が記憶部3に記憶されるプログラムを実行して図2に示される各部を制御することで実現される処理である。すなわち、図3を参照して、本実施の形態にかかるMFP10においては、まず画像データ取得部101において画像データが取得され(ステップS1)、取得された画像データに対して、前処理部103での前処理を経てから領域判別部105において領域判別処理が施される(ステップS3)。画像データにはその判別結果に応じて領域ごとに適した圧縮処理が行なわれて、PDF化部113においてPDF化処理が実行されることで(ステップS5)、その画像データが圧縮されてPDFファイルが作成される。すなわち、ステップS5では、ステップS3において文字部分と判定された領域を構成する画像データについては、解像度を低下させずに可逆圧縮部107でMMR圧縮方式のような可逆圧縮処理が施される。また、ステップS3において背景部分と判定された領域を構成する画像データについては、上記ステップS5において、低解像度化部109で解像度を低下させるように解像度変換された後に非可逆圧縮部111でJPEG圧縮方式のような非可逆圧縮処理が施される。なお、ステップS5において、背景部分と判定された領域を構成する画像データについて解像度を低下させずに非可逆圧縮処理が施されてもよい。
上記ステップS5でのPDF化処理については、上述のしたような、いわゆるコンパクトPDFファイルを作成する一般的な処理が採用され、本発明において限定される処理ではない。以下においては、本発明の特徴とする、上記ステップS3の領域判定処理について詳細に説明する。
図4は、上記ステップS3における領域判別処理の流れを示すフローチャートであり、具体的に図5に示される原稿に対して領域判別処理が実行されるものとして説明する。
図4を参照して、始めに、ステップS101〜S107において、原稿内の写真や図形やグラフなどの図が主に含まれている領域(以下、この領域を図領域と称する)を判別するための処理が実行される。詳しくは、ステップS101において、入力された画像データ全体の明度が算出され、明度画像が生成される。ここでは、入力された画像データがフルカラーの24bitの画像である場合、モノクロの8bitの明度画像が生成される。
次に、ステップS103で、生成された明度画像に対してスムージング処理が施される。スムージング処理が施されることで明度画像からノイズが除去され、以降の判別の精度が向上する。
次に、ステップS105で、スムージング処理された明度画像に対して二値化処理およびラベリング処理が施される。二値化処理およびラベリング処理が施された明度画像のうち一定の大きさ以上のもの(一般的な文字の大きさを越える大きさのもの)が図領域の候補である図ブロックとして抽出される。さらにステップS107で、抽出されたブロックが、その図ブロック内の画像の特性に応じてより詳細に分類され、その図ブロックが図領域中の写真の小領域であるか、図形の小領域であるか、グラフの小領域であるか、文字部分を含む小領域であるか、などが判別される。
次に、ステップS109〜S125において、原稿内の文字や文字列などから構成されている領域(以下、この領域をテキスト領域と称する)を判別するための処理が実行される。詳しくは、ステップS109,S111において明度算出処理およびスムージング処理が施される。これらの処理は上記ステップS101,S103での背景領域を判別するための明度算出処理およびスムージング処理と同様であり、上記ステップS101,S103での処理結果がそのまま用いられてもよいが、好ましくは、背景領域を判別するための明度算出処理およびスムージング処理(ステップS101,S103)と、テキスト領域を判別するための明度算出処理およびスムージング処理(ステップS109,S111)とは、それぞれの判別において最適な判別結果が得られるようにパラメータが異なる。
次に、ステップS113において、スムージング処理された画像データからエッジが抽出され、エッジ画像が生成される。図5に具体例が示される原稿に対して処理がなされた場合、図6に示されるようなエッジ画像が生成される。このようにエッジ画像が生成されることで、明度の高い領域の文字や反転文字が検出されやすくなる。さらに、ステップS115において、生成されたエッジ画像から罫線が抽出され、分離される。エッジ画像から罫線を分離する技術は本発明において限定されるものではなく、すでに提案されているいずれの技術が用いられてもよい。
以上の処理によって、図5に具体例が示される原稿は、図7に示されるように、図領域とテキスト領域とに分離される。
次に、ステップS117〜S125において文字判定処理が施される。詳しくは、ステップS117において、判定対象とする領域が図領域かテキスト領域かによって、以降の処理が分岐され、テキスト領域については(ステップS117でYES)、ステップS119で、文字でない領域である行間が検出されて分離される。ここでの行間を検出する処理は、比較的緩やかな条件を用いて幅の広い行間など、文字が含まれないラインをテキスト領域から除く処理である。
図8はステップS119での行間検出処理を示すフローチャートである。図8を参照して、ステップS119では、まず、対象領域について、主走査方向(x方向)に連続する、文字を構成していない画素としての特定色の画素(ここでは白画素)の数がカウントされ、規定数以上連続する白画素が検出されると、その連続する白画素が特定の色(STOPPIXEL)に塗りつぶされる(ステップS201)。なお、ここでは文字を構成していない画素が具体的に白画素である特定色の画素であるものとされているが、対象となる画素の色は限定されていなくてもよく、たとえば文字を構成する画素色以外の色の画素等であってもよい。
次に、STOPPIXELの画素の副走査方向(y方向)の連続数がカウントされ、規定数に達していない場合にはそれらの画素群の色が白に戻される(ステップS203)。上記規定数は、対象画像の解像度と、検出しようとする文字のサイズとに応じて決定されるものであるが、具体的には、主走査方向に150dot、副走査方向に2dot以上などが挙げられる。ここまでの処理によって、対象画像が図5に示される原稿である場合、図9に示されるように主走査方向の行間が検出される。
同様に、副走査方向について、規定数以上連続する白画素が検出され(ステップS205)、さらにその白画素の連続に対して主走査方向の連続数がチェックされる(ステップS207)。上記規定数もまた同様に決定されるものであるが、具体的には、主走査方向に2dot、副走査方向に150dot以上などが挙げられる。ここまでの処理によって、対象画像が図5に示される原稿である場合、図10に示されるように副走査方向の行間が検出される。
次に、ステップS121で、文字を構成する特定色の画素(ここでは黒画素とする)が膨張され近傍の画素が連結される。なお、ここでは文字を構成する画素が具体的に黒画素である特定色の画素であるものとされているが、対象となる画素の色は限定されていなくてもよく、たとえば背景を構成する画素色以外の色の画素等であってもよい。
図11はステップS121での文字膨張処理を示すフローチャートである。図11を参照して、まず、近傍の画素として、具体的には対象領域の主走査方向について所定の距離以下で隣合う黒画素が検出される(ステップS301)。より詳しくは、画像を主走査方向(x方向)に走査して、あるx座標について、そのx座標位置の左右最大文字幅(たとえば190pixel)/2の範囲について黒画素が探索され、黒画素が検出されたそのy座標における配列値が1とされて、y座標が0から画像高さから1減じた座標値までについて、順次y方向に、黒画素の探索が繰返され。ただし、途中でSTOPPIXEL(行間)が検出された場合には、それ以上のy方向の探索が行なわれない。さらに、上記あるx座標について生成された配列が走査され、配列値0の連続が規定数以下である場合にはその連続の配列値を1に書換えられる。なお、上の具体例ではステップS121で近傍の画素を検出する方法として画素の間隔が所定の距離以下であるか否かで検出する方法が示されているが、その他の方法で近傍の画素が検出されてもよい。
次に、副走査方向(y方向)に黒画素が膨張される(ステップS303)。より詳しくは、画像が主走査方向(x方向)に走査されてあるx座標についてy方向に走査され、黒画素が探索される。そして検出された黒画素の上下最大文字幅(たとえば190pixel)/2の範囲についてそのx座標について生成された配列の配列値が1であるならば、その範囲にある白画素を黒に塗りつぶされる。
次に、対象領域が90度回転され(ステップS305)、同様に、主走査方向について所定の距離以下で隣合う黒画素が検出されて(ステップS307)、副走査方向にそれらの黒画素が膨張される(ステップS309)。図5に示される原稿がこのように処理される場合、図12に示されるように、行間を除いて、近傍にある黒画素が連結される。
次に、ステップS123で、テキスト領域における文字判定処理が実行される。
図13はステップS123でのテキスト領域における文字判定処理を示すフローチャートである。図13を参照して、始めに、上述の処理によって連結された黒画素群を囲む最小矩形領域を得るためにラベリングが行なわれ、ラベリングによって得られた、連結された文字を囲む最小矩形の座標値が得られる(ステップS401)。なお、ここでのラベリング方法は一般的な方法が用いられ、本発明において限定されない。図5に示される原稿がこのように処理される場合、図14に示されるように連結された黒画素の矩形が得られ、その矩形が以下の処理に用いられる。
次に、上記ラベリングで得られた矩形領域ごとに、短辺の長さ、短辺と長辺との長さの比率、および矩形領域内に存在する黒画素の割合などの条件に基づいて、その矩形領域が文字部分であるか否かを判定する文字判定が行なわれる(ステップS403)。
図領域については(ステップS117でNO)、上記ステップS119,S121の処理が行なわれることなく、ステップS125で図領域内の文字を判定する文字判定処理が実行される。
図15はステップS125での図領域における文字判定処理を示すフローチャートである。図15を参照して、始めに、テキスト領域における文字判定処理と同様に、連続する黒画素群を囲む最小矩形領域を得るために、一般的な方法でラベリングが行なわれる(ステップS501)。
次に、上記ラベリングで得られた矩形領域について、その矩形領域が文字部分であるか否かの判定を行なう(ステップS503)。具体的には、矩形領域の横幅、高さ、矩形領域内の黒画素の比率、および当該矩形領域をさらに分割(たとえば縦横各5分割)したときの各領域における黒画素の比率などに着目して特徴ベクトルを算出し、この特徴ベクトルを用いてその矩形領域が文字部分であるか否かの判定を行なう。たとえば、判定対象の領域が図16に示される矩形領域である場合、図16に示されるように、横幅(A)、高さ(B)、矩形領域全体における黒画素の比率(C)、および縦横各5分割して25分割したときの各分割された小領域における黒画素の比率(D)を用いて、当該矩形領域が文字部分であるか否かが判定される。
なお、特徴ベクトルを算出する際の着目点は上述の5項目のみに限定されず、その他の項目が含まれていてもよいし、また上記4項目のうちの少なくとも1つであってもよい。上記判定の一例としては、予め各文字について上述の項目に着目した特徴ベクトルを記述する辞書データを記録(または作成)しておき、その辞書データと算出された特徴ベクトルとを比較してその矩形領域が文字部分であるか否かを判定する方法が挙げられる。また、上記文字判定を行なう際、上記ステップS107での図領域の図ブロックが文字部分を含む小領域であるかそれ以外(写真等)の小領域であるかの判別結果が用いられ、文字部分を含む小領域と判別された図ブロックについて上記文字判定が行なわれてもよい。
次に、ステップS127〜S131において、原稿内の文字を二値化する処理が実行される。詳しくは、ステップS127において、上記ステップS123またはステップS125の文字判定処理によって文字部分と判定された矩形領域から網点を除去する処理が実行される。ここで網点除去処理が実行されることで、文字の背景に含まれる網点が除去され、網点が文字として二値化されることが防がれる。
次に、ステップS129において、網点が除去された文字部分である矩形領域に対して二値化処理が実行され、各矩形領域内で文字と背景とが分離される。このように文字部分が二値化されることで、画像データのサイズを小さくすることができる。
次に、ステップS131において、文字部分に対応する元画像の色データ(RGBデータ)が参照されて、文字の色が決定される。ステップS131での文字の色の決定は、上記ステップS123またはステップS125で文字部分と判定された矩形領域ごとに行なわれ、1つの文字部分に対して1色が割当てられる。なお、文字部分と判定された隣合う2つの矩形領域の間隔が所定の間隔以下であり、それらの矩形領域に割当てられた色の差が所定値以下である場合、これらの矩形領域を統合してもよい。このようにすることが文字部分である矩形領域の数を減らすことができ、作成されるPDFデータのサイズを小さくすることができる。また、作成処理の速度を早めることができる。
以上で、コンパクトPDFデータ作成のための上記ステップS3での領域判定処理が終了する。
上述のように、本実施の形態にかかる領域判定処理では、原稿に含まれるテキスト領域と図領域とについて文字判定処理を分岐し、テキスト領域については従来からなされている黒画素が連結された矩形単位で文字判定がなされるのに対して、図領域については黒画素が連結されることなくラベリングで得られた矩形領域ごとに文字判定がなされる。
このように図領域内では黒画素を連結しないことによって、図領域にある文字近傍に多く存在すると考えられる線や点が文字を構成する画素と連結されて、文字判定の精度を低下させることが防止される。その結果、図領域中の文字部分が高精度で判定される。また、図領域とテキスト領域とを分けてテキスト領域について従来からなされている文字判定を行なうことで、処理速度も確保される。
なお、本実施の形態ではPDFファイルを作成する前の画像処理としての文字判定処理に適用した場合を示しているが、本発明はこれに限定されることなく、たとえばOCR(Optical Character Reader)のような文字認識処理の前処理として文字を誤認識しないように文字判定する処理にも適用できる。
さらに、本実施の形態にかかるMFP10で実行される文字判定処理をコンピュータに実行させるための文字判定プログラムを提供することもできる。このようなプログラムは、コンピュータに付属するフレキシブルディスク、CD−ROM(Compact Disk-Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)およびメモリカードなどのコンピュータ読取り可能な記録媒体にて記録させて、プログラム製品として提供することもできる。あるいは、コンピュータに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。
なお、本発明にかかる文字判定プログラムは、コンピュータのオペレーションシステム(OS)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して情報管理処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して情報管理処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかる文字判定プログラムに含まれ得る。
提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記録された記録媒体とを含む。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
MFP10のハードウェア構成の具体例を示す図である。 MFP10において画像データの圧縮を行なってPDFファイルを作成するための機能構成の具体例を示すブロック図である。 MFP10において画像データの圧縮を行なってPDFファイルを作成する処理の流れを示すフローチャートである。 ステップS3での領域判別処理の流れを示すフローチャートである。 原稿の具体例を示す図である。 エッジ画像の具体例を示す図である。 図領域とテキスト領域とに分離された画像データの具体例を示す図である。 ステップS119での行間検出処理を示すフローチャートである。 テキスト領域中の主走査方向の行間が検出された画像データの具体例を示す図である。 テキスト領域中の副走査方向の行間が検出された画像データの具体例を示す図である。 ステップS121での文字膨張処理を示すフローチャートである。 テキスト領域中の黒画素が連結された画像データの具体例を示す図である。 ステップS123でのテキスト領域における文字判定処理を示すフローチャートである。 ラベリングによって文字を囲む最小矩形が連結された画像データの具体例を示す図である。 ステップS125での図領域における文字判定処理を示すフローチャートである。 図領域中の文字判定を行なうブロックの具体例を示す図である。 コンパクトPDFファイルのデータ構成の具体例を示す図である。 コンパクトPDFファイルの作成方法を説明する図である。
符号の説明
1 スキャン処理部、2 入力画像処理部、3 記憶部、4 CPU、5 ネットワークI/F、6 出力画像処理部、7 エンジン部、8 モデム・NCU、9 操作部、10 MFP、101 画像データ取得部、103 前処理部、105 領域判別部、107 可逆圧縮部、109 低解像度化部、111 非可逆圧縮部、113 PDF化部。

Claims (11)

  1. 画像データを得る画像データ取得手段と、
    前記画像データに含まれる領域について、テキスト領域か図領域かを判別する判別手段とを備え、
    前記判別手段によってテキスト領域であると判別された場合には、
    前記テキスト領域から行間を検出する行間検出手段と、
    前記テキスト領域から前記行間を除いた領域内で、前記テキスト領域に含まれる前記第1の画素と前記第2の画素とを連結する連結手段と、
    前記テキスト領域についてラベリングを行なって、連結された前記第1の画素および前記第2の画素を囲む最小矩形領域を得る第1の最小矩形領域取得手段と、
    前記最小矩形領域が文字部分であるか否かを判定する第1の判定手段とを用いて第1の文字判定を行ない、
    前記判別手段によって図領域であると判別された場合には、
    行間を検出する処理および画像を連結する処理を行なうことなく、前記図領域についてラベリングを行なって、連続する画素を囲む最小矩形領域を得る第2の最小矩形領域取得手段と、
    前記最小矩形領域が文字部分であるか否かを判定する第2の判定手段とを用いて第2の文字判定を行なう、画像処理装置。
  2. 前記連結手段は、前記第1の画素と前記第2の画素との距離が所定距離以下である場合に、前記第1の画素と前記第2の画素とを連結する、請求項1に記載の画像処理装置。
  3. 前記第1および第2の画素は特定色の画素である、請求項1または2に記載の画像処理装置。
  4. 前記第1および第2の判定手段は、前記最小矩形領域内の前記特定色の画素の比率を用いて前記最小矩形領域が文字部分であるか否かを判定する、請求項1〜3のいずれかに記載の画像処理装置。
  5. 前記第2の判定手段が用いる前記特定色の画素の比率は、前記最小矩形領域全体における比率と、前記最小矩形領域をさらに分割した小領域における比率とを含む、請求項4に記載の画像処理装置。
  6. 前記第1の文字判定および/または前記第2の文字判定で文字部分であると判定された第1領域を可逆圧縮する第1の圧縮手段と、
    前記第1の文字判定および/または前記第2の文字判定で文字部分でないと判定された第2領域を非可逆圧縮する第2の圧縮手段とを含む、請求項1〜5のいずれかに記載の画像処理装置。
  7. 前記第2の圧縮手段は、前記第2領域の解像度を低下させる手段を含む、請求項6に記載の画像処理装置。
  8. コンピュータに文字判定処理を実行させるプログラムであって、
    画像データを得る画像データ取得ステップと、
    前記画像データに含まれる領域について、テキスト領域か図領域かを判別する判別ステップとを実行させる文字判定プログラムであって、
    前記判別ステップにおいてテキスト領域と判別された場合には、
    前記テキスト領域から行間を検出する行間検出ステップと、
    前記テキスト領域から前記行間を除いた領域内で、前記テキスト領域に含まれる前記第1の画素と前記第2の画素とを連結する連結ステップと、
    前記テキスト領域についてラベリングを行なって、連結された前記第1の画素および前記第2の画素を囲む最小矩形領域を得る第1の最小矩形領域取得ステップと、
    前記最小矩形領域が文字部分であるか否かを判定する第1の判定ステップとからなる第1の文字判定処理を前記コンピュータに実行させ、
    前記判別ステップにおいて図領域と判別された場合には、
    行間を検出する処理および画像を連結する処理を行なうことなく、前記図領域についてラベリングを行なって、連続する画素を囲む最小矩形領域を得る第2の最小矩形領域取得ステップと、
    前記最小矩形領域が文字部分であるか否かを判定する第2の判定ステップとからなる第2の文字判定処理を前記コンピュータに実行させる、文字判定プログラム。
  9. 前記第1の文字判定処理および/または前記第2の文字判定処理で文字部分であると判定された第1領域を可逆圧縮する第1の圧縮ステップと、
    前記第1の文字判定処理および/または前記第2の文字判定処理で文字部分でないと判定された第2領域を非可逆圧縮する第2の圧縮ステップとをさらに実行させる、請求項8に記載の文字判定プログラム。
  10. 画像処理装置において画像データに含まれる文字を判定する方法であって、
    前記画像データを得る画像データ取得ステップと、
    前記画像データに含まれる領域について、テキスト領域か図領域かを判別する判別ステップとを含む文字判定方法であって、
    前記判別ステップにおいてテキスト領域と判別された場合には、
    前記テキスト領域から行間を検出する行間検出ステップと、
    前記テキスト領域から前記行間を除いた領域内で、前記テキスト領域に含まれる前記第1の画素と前記第2の画素とを連結する連結ステップと、
    前記テキスト領域についてラベリングを行なって、連結された前記第1の画素および前記第2の画素を囲む最小矩形領域を得る第1の最小矩形領域取得ステップと、
    前記最小矩形領域が文字部分であるか否かを判定する第1の判定ステップとからなる第1の文字判定処理を実行し、
    前記判別ステップにおいて図領域と判別された場合には、
    行間を検出する処理および画像を連結する処理を行なうことなく、前記図領域についてラベリングを行なって、連続する画素を囲む最小矩形領域を得る第2の最小矩形領域取得ステップと、
    前記最小矩形領域が文字部分であるか否かを判定する第2の判定ステップとからなる第
    2の文字判定処理を実行する、文字判定方法。
  11. 前記第1の文字判定処理および/または前記第2の文字判定処理で文字部分であると判定された第1領域を可逆圧縮する第1の圧縮ステップと、
    前記第1の文字判定処理および/または前記第2の文字判定処理で文字部分でないと判定された第2領域を非可逆圧縮する第2の圧縮ステップとをさらに含む、請求項10に記載の文字判定方法。
JP2006013830A 2006-01-23 2006-01-23 画像処理装置、文字判定プログラム、および文字判定方法 Active JP4424309B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006013830A JP4424309B2 (ja) 2006-01-23 2006-01-23 画像処理装置、文字判定プログラム、および文字判定方法
US11/447,103 US8208744B2 (en) 2006-01-23 2006-06-06 Image processing apparatus capable of accurately and quickly determining character part included in image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006013830A JP4424309B2 (ja) 2006-01-23 2006-01-23 画像処理装置、文字判定プログラム、および文字判定方法

Publications (2)

Publication Number Publication Date
JP2007193750A JP2007193750A (ja) 2007-08-02
JP4424309B2 true JP4424309B2 (ja) 2010-03-03

Family

ID=38285634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006013830A Active JP4424309B2 (ja) 2006-01-23 2006-01-23 画像処理装置、文字判定プログラム、および文字判定方法

Country Status (2)

Country Link
US (1) US8208744B2 (ja)
JP (1) JP4424309B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4717562B2 (ja) * 2005-09-02 2011-07-06 キヤノン株式会社 画像処理装置及び方法
JP4329764B2 (ja) * 2006-01-17 2009-09-09 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および罫線抽出プログラム
JP5003394B2 (ja) * 2007-10-05 2012-08-15 セイコーエプソン株式会社 ファイル生成プログラム、画像処理装置、および画像処理方法
JP5003445B2 (ja) * 2007-12-05 2012-08-15 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、文字領域特定方法、および文字領域特定プログラム
US8457432B2 (en) * 2008-06-25 2013-06-04 Microsoft Corporation High information density of reduced-size images of web pages
AU2008260018C1 (en) * 2008-12-18 2011-01-20 Canon Kabushiki Kaisha Refining text extraction in colour compound documents
JP4905482B2 (ja) * 2009-02-25 2012-03-28 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法およびプログラム
JP5245953B2 (ja) * 2009-03-18 2013-07-24 コニカミノルタビジネステクノロジーズ株式会社 プレゼンテーション画像の生成方法および装置並びに画像形成装置
US8648858B1 (en) * 2009-03-25 2014-02-11 Skyfire Labs, Inc. Hybrid text and image based encoding
JP5845724B2 (ja) * 2011-08-26 2016-01-20 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US9779513B2 (en) 2013-03-13 2017-10-03 Rakuten, Inc. Image processing device, image processing method, and image processing program
JP6370080B2 (ja) * 2014-04-02 2018-08-08 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム。
US9183636B1 (en) * 2014-04-16 2015-11-10 I.R.I.S. Line segmentation method

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3113555A1 (de) * 1981-04-03 1982-10-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen
DE3838729C2 (de) 1987-11-16 1994-05-05 Canon Kk Dokumentverarbeitungsgerät
JPH01266689A (ja) 1988-04-19 1989-10-24 Canon Inc 画像認識装置
JPH0341562A (ja) 1989-07-10 1991-02-22 Mitsubishi Electric Corp 図形認識方法
JP2851089B2 (ja) 1989-11-30 1999-01-27 株式会社リコー 表処理方法
JPH04158482A (ja) 1990-10-23 1992-06-01 Ricoh Co Ltd 矢印方向検出装置
JPH05282493A (ja) 1992-03-31 1993-10-29 Matsushita Electric Ind Co Ltd 英文字認識装置
JPH0676103A (ja) 1992-08-25 1994-03-18 Fuji Facom Corp 文書画像の文章領域抽出装置
JPH06187489A (ja) 1992-12-17 1994-07-08 Matsushita Electric Ind Co Ltd 文字認識装置
JP2550867B2 (ja) 1993-06-04 1996-11-06 日本電気株式会社 図形混在文書画像の構造解析方法
JPH07168911A (ja) 1993-12-16 1995-07-04 Matsushita Electric Ind Co Ltd 文書認識装置
JP3749282B2 (ja) 1995-05-16 2006-02-22 株式会社東芝 画像処理装置
JPH09223240A (ja) 1996-02-14 1997-08-26 Oki Electric Ind Co Ltd 文書電子化装置
JP2878194B2 (ja) 1996-07-29 1999-04-05 日本電気ソフトウェア株式会社 画像データの部分消去および部分検出方法
US6226402B1 (en) 1996-12-20 2001-05-01 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JPH10187878A (ja) 1996-12-26 1998-07-21 Ricoh Co Ltd 表処理方法
US6721071B1 (en) 1997-07-09 2004-04-13 Minolta Co., Ltd. Facsimile allowing correct registration of telephone number
JP4235286B2 (ja) 1998-09-11 2009-03-11 キヤノン株式会社 表認識方法及び装置
JP4089849B2 (ja) 1999-02-01 2008-05-28 株式会社リコー 罫線処理装置および記録媒体
JP2001034763A (ja) 1999-03-01 2001-02-09 Matsushita Electric Ind Co Ltd 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法
JP2000306102A (ja) 1999-04-23 2000-11-02 Ricoh Co Ltd 罫線識別方法および記録媒体
JP2001060247A (ja) 1999-06-14 2001-03-06 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
JP2001016447A (ja) * 1999-06-30 2001-01-19 Minolta Co Ltd 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体
JP3153812B1 (ja) 1999-10-05 2001-04-09 松下電送システム株式会社 インターネットファクシミリ装置およびインターネットファクシミリ送信方法
JP2001147988A (ja) 1999-11-22 2001-05-29 Nippon Digital Kenkyusho:Kk 文字認識方法及び文字認識装置
JP4159720B2 (ja) 2000-03-15 2008-10-01 株式会社リコー 表認識方法と表認識装置と文字認識装置及び表認識プログラムを記録した記憶媒体
JP4150842B2 (ja) 2000-05-09 2008-09-17 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4586241B2 (ja) * 2000-06-14 2010-11-24 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
JP4655335B2 (ja) 2000-06-20 2011-03-23 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2002165105A (ja) 2000-11-27 2002-06-07 Canon Inc 画像処理装置及びその方法並びに記憶媒体
JP3899872B2 (ja) 2001-08-24 2007-03-28 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP3931651B2 (ja) 2001-12-21 2007-06-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
US7340092B2 (en) 2001-12-21 2008-03-04 Minolta Co., Ltd. Image processing device, image processing method, program for executing image processing, and computer readable recording medium on which the program is stored
JP2003317107A (ja) 2002-04-26 2003-11-07 Fujitsu Ltd 罫線抽出方法及び装置
JP2004304469A (ja) 2003-03-31 2004-10-28 Minolta Co Ltd 原稿画像の領域分割・圧縮プログラム及び領域分割・圧縮方法
US7602995B2 (en) 2004-02-10 2009-10-13 Ricoh Company, Ltd. Correcting image distortion caused by scanning
JP4569162B2 (ja) 2004-04-30 2010-10-27 コニカミノルタビジネステクノロジーズ株式会社 画像処理方法、画像処理プログラムおよび画像処理装置
JP2004246929A (ja) 2004-06-01 2004-09-02 Ricoh Co Ltd 文書画像の領域分割方法および装置
JP4329764B2 (ja) 2006-01-17 2009-09-09 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および罫線抽出プログラム

Also Published As

Publication number Publication date
US8208744B2 (en) 2012-06-26
US20070172137A1 (en) 2007-07-26
JP2007193750A (ja) 2007-08-02

Similar Documents

Publication Publication Date Title
JP4424309B2 (ja) 画像処理装置、文字判定プログラム、および文字判定方法
JP4329764B2 (ja) 画像処理装置および罫線抽出プログラム
US7545992B2 (en) Image processing system and image processing method
JP4135752B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4333708B2 (ja) 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム
US8384964B2 (en) Image processing apparatus and image processing method
JP5049920B2 (ja) 画像処理装置及び画像処理方法
JP4861967B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、画像形成装置、記憶媒体
US7133559B2 (en) Image processing device, image processing method, image processing program, and computer readable recording medium on which image processing program is recorded
CN102984429A (zh) 图像处理设备和图像处理方法
JP4861362B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4405663B2 (ja) 画像処理方法及び装置
JP5049922B2 (ja) 画像処理装置及び画像処理方法
JP2007318520A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP6249240B2 (ja) 画像処理装置
JP4140519B2 (ja) 画像処理装置、プログラムおよび記録媒体
JP5003445B2 (ja) 画像処理装置、文字領域特定方法、および文字領域特定プログラム
JP4396710B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP5517028B2 (ja) 画像処理装置
JP7301529B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP6025803B2 (ja) 画像処理装置
JP2009105541A (ja) 画像処理装置、方法、および、プログラム
JPH11136505A (ja) 画像処理装置およびその方法
US8553294B2 (en) Outlining method for properly representing curved line and straight line, and image compression method using the same

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090519

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091009

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091130

R150 Certificate of patent or registration of utility model

Ref document number: 4424309

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131218

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350