JP2010057017A - 画像処理装置および画像処理方法 - Google Patents

画像処理装置および画像処理方法 Download PDF

Info

Publication number
JP2010057017A
JP2010057017A JP2008221273A JP2008221273A JP2010057017A JP 2010057017 A JP2010057017 A JP 2010057017A JP 2008221273 A JP2008221273 A JP 2008221273A JP 2008221273 A JP2008221273 A JP 2008221273A JP 2010057017 A JP2010057017 A JP 2010057017A
Authority
JP
Japan
Prior art keywords
outline
coordinate value
image
image processing
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008221273A
Other languages
English (en)
Inventor
Toshihiro Mori
俊浩 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2008221273A priority Critical patent/JP2010057017A/ja
Priority to US12/545,910 priority patent/US8284460B2/en
Publication of JP2010057017A publication Critical patent/JP2010057017A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • H04N1/4092Edge or detail enhancement

Abstract

【課題】アウトラインデータの適切な画像品質の維持と、ファイルサイズの不必要な増大の抑制といった相反する課題を両立することが可能なアウトライン処理機能を備えた画像処理装置および画像処理方法を提供する。
【解決手段】本実施の形態に従うアウトライン処理では、座標値の間の変化量に応じて、アウトラインデータとして出力される値が規定桁数における最大値にほぼ一致するように、規格化係数を決定する。これにより、対象とする文字サイズに影響されることなく、常にアウトラインデータの画像品質(文字の判読性)を規定桁数における最高値まで高めることができる。言い換えれば、ファイルサイズの制限から定まる桁数の制約下において実現可能な最大の画像品質を提供することができる。
【選択図】図7

Description

この発明は、画像処理装置および画像処理方法に関し、特に画像のアウトライン処理に関する。
近年、情報の電子化に伴って、文書を紙媒体ではなく電子データとして保存や送受信する、いわゆるペーパレス化が進んでいる。一方で、画像形成装置からプリント出力される紙媒体についても、モノクロからフルカラーへ移行しつつある。そのため、フルカラーでプリントされた文書をスキャナなどで読み取って画像データを生成し、この画像データをハードディスクなどに格納したり、電子メールに添付して送信したりする必要も生じている。
しかしながら、たとえばA4サイズのフルカラー原稿を300dpiのスキャナで読み取ると、その生の画像データ(スキャンデータ)は約25MBにもなり、電子メールに添付するには、ファイルサイズが大きくなり過ぎる。
そのため、スキャンデータを適切なファイルサイズまで圧縮する必要が生じる。このような圧縮技術としてはさまざまなものが提案されているが、たとえば、JPEG(Joint Photographic Experts Group)などの方式を用いることができる。JPEGでは、スキャンデータをブロック単位で量子化するため量子化誤差が生じる。この量子化誤差は、圧縮率を高めるほど増大するので、スキャンデータに高圧縮をかけると、原稿内の文字が判読不可能となり得る。
そこで、スキャンデータとして読み込まれた文字の形状を、複数の頂点を通る関数として取扱うアウトライン化という処理が実用化されている。
たとえば、特開2006−253892号公報(特許文献1)は、小さな文字は高解像度二値画像よりアウトライン化し、大きな文字は低解像度二値画像よりアウトライン化することで、処理時間を短縮しつつ、高品位なアウトライン化画像を生成する画像処理方法及び画像処理装置を開示している。
また、特開2005−174227号公報(特許文献2)は、原稿画像の画像サイズに基づいて、原稿画像のベクトルデータ変換を実行することで、読取原稿画像に対応する電子ファイルとして、高画質でかつ、データ量を削減した電子ファイルを生成することができる画像処理装置及びその制御方法、プログラムを開示している。
上述のようなアウトライン処理の具体的な手順としては、スキャンデータに含まれるオブジェクト(文字などを含む)を構成する頂点の座標値を複数検出し、このいずれかの座標値を基準として、アンカーポイントの座標値や、関数(ベジェ曲線)を記述するためのベジェコントロールポイントの座標値を演算処理によって算出する。さらに、これらの座標値が特定の変換係数を用いて変換され、アウトラインデータとして出力される。このときの演算結果は、四捨五入などによって、規定桁数に収まるように出力される。
一般的に、アウトライン処理された画像の品質は、各座標値の精度(桁数)に依存しており、より多くの桁数を用いて表現された数値を用いることで、より高精度な画像を再現することができる。一方、ファイルサイズを抑制する観点からは、各座標値を表現する桁数は少ないことが好ましい。
特開2006−253892号公報 特開2005−174227号公報
ところで、画像に含まれる文字サイズが小さくなるほど、抽出される座標値の間の変化量は小さな値となる。したがって、小さな文字サイズの文字を含む原稿に対しては、そのような座標値間の変化を表現できるような精度が必要となる。一方、このような小さな文字サイズの文字に適した精度で、大きな文字サイズの文字を含む原稿に対してアウトライン処理を行なうと、ファイルサイズが不必要に大きくなるという課題が生じる。
逆に、精度を低くすると、小さな文字サイズの文字を含む原稿に対する十分な画像品質(文字の判読性)を維持することができないという課題が生じる。
そこで、この発明は、かかる問題を解決するためになされたものであり、その目的は、アウトラインデータの適切な画像品質の維持と、ファイルサイズの不必要な増大の抑制といった相反する課題を両立することが可能なアウトライン処理機能を備えた画像処理装置および画像処理方法を提供することである。
この発明のある局面に従う画像処理装置は、入力画像に含まれるオブジェクトのアウトラインを示す座標値を複数検出する手段と、基準として定められた座標値から検出した座標値の相対座標値を算出する手段と、規定桁数で表現可能な数値範囲に相対座標値を規格化するための規格化係数を算出する手段と、相対座標値の各々に規格化係数を乗じることでアウトラインデータを生成する手段とを含む。
好ましくは、規格化係数を算出する手段は、相対座標値に含まれる座標値成分の最大値を抽出する手段と、規定桁数で表現可能な最大値を座標値成分の最大値で除算する手段とを含む。
好ましくは、画像処理装置は、入力画像を文字領域と文字領域以外の領域とに分離する手段をさらに含み、座標値を複数検出する手段は、文字領域を検出対象とする。
さらに好ましくは、画像処理装置は、アウトラインデータを圧縮する手段と、文字領域以外の領域の画像を圧縮する手段と、圧縮されたアウトラインデータと圧縮された文字領域以外の領域の画像とを結合して、電子化文書を生成する手段とをさらに含む。
好ましくは、画像処理装置は、紙媒体の原稿をスキャンすることで入力画像を生成するスキャナをさらに含む。
この発明の別の局面に従う画像処理方法は、入力画像に含まれるオブジェクトのアウトラインを示す座標値を複数検出するステップと、基準として定められた座標値から検出した座標値の相対座標値を算出するステップと、規定桁数で表現可能な数値範囲に相対座標値を規格化するための規格化係数を算出するステップと、相対座標値の各々に規格化係数を乗じることでアウトラインデータを生成するステップとを含む。
好ましくは、前記規格化係数を算出するステップは、前記相対座標値に含まれる座標値成分の最大値を抽出するステップと、前記規定桁数で表現可能な最大値を前記座標値成分の最大値で除算するステップとを含む。
好ましくは、画像処理方法は、前記入力画像を文字領域と前記文字領域以外の領域とに分離するステップをさらに含み、前記座標値を複数検出するステップは、前記文字領域を検出対象とする。
さらに好ましくは、画像処理方法は、前記アウトラインデータを圧縮するステップと、前記文字領域以外の領域の画像を圧縮するステップと、圧縮された前記アウトラインデータと圧縮された前記文字領域以外の領域の画像とを結合して、電子化文書を生成するステップとをさらに含む。
好ましくは、画像処理方法は、スキャナを用いて、紙媒体の原稿をスキャンすることで前記入力画像を生成するステップをさらに含む。
この発明によれば、アウトラインデータの適切な画像品質の維持と、ファイルサイズの不必要な増大の抑制といった相反する課題を両立することが可能なアウトライン処理を実現できる。
この発明の実施の形態について、図面を参照しながら詳細に説明する。なお、図中の同一または相当部分については、同一符号を付してその説明は繰返さない。
本発明に係る画像処理装置の代表例として、プリント機能やコピー機能といった画像形成機能(モノクロおよび/またはカラー)に加えて、スキャン機能を搭載した複合機(Multi Function Peripheral:以下「MFP」とも称す。)について、以下説明する。
<概略>
本実施の形態に従うMFP100は、文字や図表が記述された紙媒体の原稿をスキャナで読み取り、この読み取りによって生成されたスキャンデータ(入力画像)に対して、アウトライン処理を実行する。より具体的には、MFP100は、スキャンデータから電子化文書(代表的に、PDF(Portable Document Format)形式の文書データ)を生成する。特に、MFP100は、スキャンデータから文字領域と文字領域以外の背景領域とを分離抽出し、それぞれ異なる形式で画像圧縮を行なうことで、いわゆる「アウトラインPDF」を生成する。このアウトラインPDFは、上述した文字領域に対してアウトライン処理が実行された結果得られるアウトラインデータを含む。このアウトラインPDFの生成処理の詳細については、後述する。
<機能構成>
図1は、この発明の実施の形態に従うMFP100の機能構成を示すブロック図である。
図1を参照して、MFP100は、スキャナ10と、入力画像処理部12と、CPU(Central Processing Unit)14と、記憶部16と、ネットワークI/F(Interface)18と、モデム20と、操作パネル22と、出力画像処理部24と、プリントエンジン26とを含み、これらの各部は、バス28を介して互いに接続されている。
スキャナ10は、原稿から画像情報を読み取ってスキャンデータ(入力画像)を生成する。このスキャンデータは、入力画像処理部12へ送られる。より具体的には、スキャナ10は、プラテンガラスに載置された原稿に向けて光源から光を照射するとともに、原稿から反射した光を主走査方向に配列された撮像素子などによって受光することで、原稿の画像情報を読み取る。あるいは、連続的な原稿読み取りができるように、原稿給紙台、送出ローラ、レジストローラ、搬送ドラム、および排紙台などを含むようにスキャナ10を構成してもよい。
入力画像処理部12は、スキャナ10から受けたスキャンデータに対して、色変換処理、色補正処理、解像度変換処理、領域判別処理といった入力画像処理を実行する。入力画像処理部12は、入力画像処理後のデータを記憶部16へ出力する。
CPU14は、MFP100の全体処理を司る演算装置であり、代表的に、予め格納されたプログラムを実行することで後述する各種処理を実行する。より具体的には、CPU14は、操作パネル22に対してなされた操作キーの検出、操作パネル22における表示制御、スキャンデータの画像形式(JPEG,PDF,TIFF(Tagged Image File Format)など)の変換処理、ネットワークや電話回線を介した通信の制御などを実行する。
記憶部16は、CPU14で実行されるプログラムや入力画像処理部12から出力されるスキャンデータなどを格納する。代表的に、記憶部16は、DRAM(Dynamic Random Access Memory)などの揮発性メモリと、ハードディスク(HDD:Hard Disk Drive)やフラッシュメモリなどの不揮発性メモリとを含む。また、記憶部16は、後述するアウトライン処理によって生成されるアウトラインPDFファイルを格納する。
ネットワークI/F18は、LAN(Local Area Network)などのネットワークを介して、図示しないサーバ装置などとの間でデータ通信を行なう。具体的には、ネットワークI/F18は、MFP100内で生成されたアウトラインPDFデータを添付したメールを作成し、サーバ装置へ送信する。
モデム20は、電話回線と接続され、他のMFPなどとの間でFAXデータの送受信を行なう。代表的に、モデム20は、NCU(Network Control Unit)を含んで構成される。
操作パネル22は、操作メニューやジョブ実行状態などの操作情報をユーザに提示するとともに、ユーザによる押下に応じてユーザ指示を受付けるユーザインターフェイスである。より具体的には、操作パネル22は、入力部としてのキー入力部と、表示部と一体的に構成された入力部としてのタッチパネルとを含む。キー入力部は、テンキーや各機能が割当てられたキーを含んで構成され、ユーザによって押下されたキーに対応する指示をCPU14へ出力する。タッチパネルは、液晶パネルと、当該液晶パネルの上に設けられたタッチ操作検出部とからなり、ユーザに対して各種の情報を視覚的に表示するとともに、ユーザによるタッチ操作を検出すると、当該タッチ操作に対応する指示をCPU14へ出力する。
出力画像処理部24は、スキャンデータをプリント出力する場合に、当該スキャンデータに対して、スクリーン制御、スムージング処理、PWM(Pulse Width Modulation)制御といった出力画像処理を実行する。出力画像処理部24は、出力画像処理後の画像データをプリントエンジン26へ出力する。
プリントエンジン26は、出力画像処理部24から受信した画像データに基づいて、用紙上に当該画像をプリント(画像形成)する。代表的に、プリントエンジン26は、電子写真方式の画像形成ユニットからなる。より具体的には、プリントエンジン26は、感光体、露光器、現像器などからなるイメージングユニットや、転写ベルト、定着装置、給紙部、排紙部などを含んで構成される。なお、プリントエンジン26がフルカラープリントを行なう場合には、たとえば、イエロー(Y),マゼンタ(M),シアン(C),ブラック(K)の4色のイメージングユニットが設けられる。
<全体処理>
図2は、本実施の形態に従うMFP100における画像処理に係る機能構成を示すブロック図である。本実施の形態に従う画像処理では、原稿がスキャナ10によって読み取られ、この読み取られた画像情報に基づいて、アウトラインPDFデータが生成される。
図2を参照して、入力画像処理部12は、前処理部52および領域判別/分離部54をその機能として含む。また、CPU14は、低解像度化部56と、アウトライン処理部58と、可逆圧縮部60と、非可逆圧縮部62と、結合部64とをその機能として含む。
スキャナ10は、紙媒体の原稿を読み取ってスキャンデータ(入力画像)を生成し、そのスキャンデータを入力画像処理部12へ出力する。なお、スキャンデータとしては、ビットマップ形式などのラスターデータであってもよいし、TIFF形式やJPG形式といった他の画像フォーマットでもよい。
入力画像処理部12では、前処理部52が、スキャナ10から受信したスキャンデータに対して、画像形式の変換、解像度変換、下地除去といった前処理を実行する。さらに、領域判別/分離部54が前処理部52によって処理された後の画像データを解析し、文字領域と文字領域以外の背景領域とを判別する。そして、領域判別/分離部54は、前処理部52から受けた画像データのうち、文字領域に対応する文字領域データをアウトライン処理部58へ出力し、背景領域に対応する背景領域データを低解像度化部56へ出力する。なお、文字領域と背景領域との判別は、公知の方法を用いることができる。そのような公知の方法の一例として、スキャンデータを2値化した上で、その濃度変化に基づいて判別を行なう方法や、輝度のヒストグラムに基づいて判別を行なう方法がある。
アウトライン処理部58は、領域判別/分離部54から受信した文字領域データに対して、本実施の形態に従うアウトライン処理を実行し、アウトラインデータを生成する。より具体的には、アウトライン処理部58は、頂点検出部581と、直線近似部582と、ベジェ近似部583と、精度決定部584とを含む。これらの各部における処理については後述する。
可逆圧縮部60は、アウトライン処理部58から受信したアウトラインデータに対して圧縮処理を行なう。代表的に、可逆圧縮部60は、アウトラインデータ(すなわち、テキストデータ)に適した圧縮方法として、可逆性の圧縮方式であるFLATE圧縮を用いる。
低解像度化部56は、領域判別/分離部54から受信した背景領域データに対して、低解像度化処理を実行する。たとえば、背景領域データが300dpiであれば、この解像度を150dpiに変更する解像度変換を行なう。これは、背景領域についての画像品質は、上述の文字領域に比較して低くてもよいので、ファイルサイズが小さくなることを優先するためである。低解像度化部56において低解像度化された背景領域データは、非可逆圧縮部62へ出力される。
非可逆圧縮部62は、低解像度化部56から受信した低解像度化された背景領域データに対して圧縮処理を行なう。代表的に、非可逆圧縮部62は、背景領域データ(すなわち、画像データ)に適した圧縮方法として、非可逆性の圧縮方式であるJPEG圧縮を用いる。
結合部64は、可逆圧縮部60によって圧縮されたアウトラインデータと、非可逆圧縮部62によって圧縮された背景領域データとを階層的に結合して、電子化文書であるアウトラインPDFファイルを生成する。このアウトラインPDFは、適切な画像品質でアウトライン化された文字の情報と、ファイルサイズを小さくされた背景領域の情報とから構成される。これにより、必要な文字情報についての適切な画像品質を維持するとともに、ファイルサイズの不要な増大を抑制できる。
<アウトライン処理>
次に、本実施の形態に従うアウトライン処理について説明する。
図2を参照して、頂点検出部581は、領域判別/分離部54から受信した文字領域データを必要に応じて2値化のラスターデータに変換し、この2値化されたラスターデータから各オブジェクト(代表的に、文字)の頂点を複数検出し、それぞれの頂点の座標値を出力する。この検出される頂点は、スキャンデータ(入力画像)に含まれるオブジェクトのアウトラインを示す座標値に相当する。なお、このオブジェクトに対するそれぞれの頂点の検出方法としては、いわゆるエッジ検出処理を用いることができる。
直線近似部582は、頂点検出部581により検出された複数の頂点に基づいて、隣接する2つまたはそれ以上の頂点を通過する近似直線を順次生成する。さらに、ベジェ近似部583は、直線近似部582で生成された近似直線を補正しつつ、ベジェ近似を行なって、近似曲線を生成する。より具体的には、ベジェ近似部583は、近似曲線を特定するためのベジェコントロールポイントの座標値を算出する。なお、ベジェ近似については、公知であるので詳細な説明は行なわない。すなわち、直線近似部582およびベジェ近似部583は、頂点検出部581により検出された頂点間の関係を規定する関数を決定する。
精度決定部584は、頂点検出部581で検出された各頂点の座標値、およびベジェコントロールポイントの座標値などを規定桁数に規格化するための規格化係数(精度)を決定する。この規格化係数は、抽出された座標値を規定桁数で表現可能な数値範囲に規格化(適合化)するための係数である。そして、精度決定部584は、それぞれの座標値をこの決定した規格化係数に基づいてそれぞれの座標値を規格化し、規格化後の座標値に基づいてアウトラインデータを生成する。
なお、規定桁数は、アウトラインデータ(あるいは、アウトラインPDFデータ)のファイルサイズの制限によって定められるものであり、予めデフォルト値として設定されてもよいし、ユーザが任意に設定できるようにしてもよい。後者の場合には、ユーザが原稿をスキャナ10にセットした後、読み取り開始の指示を与える前に、ファイルサイズ「大」「中」「小」などの項目から選択できるようにしてもよい。
次に、図3〜図6を用いて、アウトライン処理部58における処理の具体例を例示する。
図3は、アウトライン処理の対象となるオブジェクトOBJの一例を示す図である。図4は、図3(b)に示す座標値に対した差分処理が実行された後の結果を示す図である。図5は、図4に示す座標値を規格化した後の結果を示す図である。
図3(a)を参照して、たとえば、主走査方向と副走査方向との2次元座標において矩形状となるオブジェクトOBJを含む文字領域データが頂点検出部581(図2)に入力されると、頂点検出部581は、頂点A〜Fの座標値を検出する。この検出値の一例を図3(b)に示す。すなわち、頂点検出部581が、座標A(30.00,10.00)、座標B(32.51,10.00)、座標C(32.51,12.53)、座標D(33.82,12.53)、座標E(33.82,13.94)、座標F(30.00,13.94)を検出したものとする。なお、頂点検出部581の検出精度の最小単位は、「0.01cm」であるとする。
このように検出されたオブジェクトOBJの各頂点の座標値に対して、直線近似部582(図2)およびベジェ近似部583(図2)は、頂点間の関係を規定する関数を決定する。
そして、精度決定部584(図2)は、基準として定められた座標値に基づいて、検出されたオブジェクトOBJの頂点の座標値を表現する。好ましくは、検出されたオブジェクトOBJの頂点のいずれかが基準として定めされる。すなわち、精度決定部584は、基準の頂点(図3の場合には、頂点A)からの他の座標値の差分をそれぞれ算出する。すると、図4に示すように、頂点Aの座標値を(0,0)とした場合における他の頂点の相対座標値が算出される。
なお、基準としては、オブジェクトOBJの各頂点に相対する位置の座標値であればよく、オブジェクトOBJの辺上の任意の点、オブジェクトOBJの内部領域の任意の点、あるいはオブジェクトOBJに近接する任意の点などを用いることができる。
さらに、精度決定部584は、図4に示す相対座標値に含まれる座標値成分のいずれもが規定桁数で表現可能な数値範囲内(たとえば、2桁の場合には、「99」以下)に収まるように、規格化係数(精度)を決定する。より具体的には、精度決定部584は、図4に示す座標値成分のうち最大のものが当該規定桁数における最大値を超えない範囲でほぼ一致するように、規格化係数を算出する。
たとえば、図4に示す例では、各座標成分の最大値は、座標EおよびFの副走査方向成分である「3.94」である。そして、精度決定部584は、2桁で表現可能な最大値である「99」を座標成分の最大値「3.94」で除算する。この除算結果は「25.2」となるが、規格化係数についても2桁に制限するために、小数点以下を切り捨てて、規格化係数として「25」を得る。さらに、精度決定部584は、この規格化係数「25」を図4に示す座標成分にそれぞれ乗じた上で、小数点以下を四捨五入することで、図4に示す座標値を2桁(0〜99)の範囲に規格化する。このように規格化された座標値を図5に示す。
図5に示すように、座標A〜Fの座標成分の値が0〜99の範囲に規格化されていることがわかる。このように、本実施の形態に従うアウトライン処理では、図4に示されるような差分の座標値の組を適切な規格化係数を動的に決定し、これを用いて規定桁数に規格化する。これにより、アウトラインデータの画像品質(文字の判読性)を規定桁数において再現可能な最大レベルまで高めることができる。
なお、上述の説明では、主走査方向および副走査方向の座標成分について共通の規格化係数を用いる構成について例示したが、主走査方向における規格化係数と、副走査方向における規格化係数とを独立に設けてもよい。この場合には、図4に示す例では、主走査方向における規格化係数は「26」となり、副走査方向における規格化係数は「25」となる。
図6は、図5に示す規格化後の座標値に基づいて生成されたアウトラインデータの記述例を示す図である。なお、簡略化のため、図6に示す記述例ではヘッダ情報などを記述していない。
図6を参照して、アウトラインデータは、規格化係数を示すスケールを記述する行202を含む。この行202には、規格化係数を示すスケール、すなわち規格化係数の逆数(1/25=0.04cm)が規定される。このアウトラインデータから画像データを生成する場合には、後述する規格化後の各座標値に対して、このスケールが乗じられることで、元の文字領域データの座標値が算出される。
また、アウトラインデータは、基準の頂点(この例では、頂点A)を示す座標が記述された行204を含む。すなわち、行204には「30 10 cm」との記述があり、これは、頂点Aの規格化された座標値が(30,10)であることを示している。
さらに、アウトラインデータは、頂点A〜Eの座標値をそれぞれ記述した行211〜217を含む。たとえば、行211には「0 0 l」との記述があり、これは、座標値(0,0)から次の行212に記述された座標値(63,0)まで直線近似することを意味する。
これらの行211〜217に対して画像データを生成する際の処理としては、たとえば、行211については、当該行に記述された座標値(0,0)に基準の頂点の座標値(30,10)がオフセットとして追加され、座標値(30,10)が絶対座標として算出される。また、行212については、当該行に記述された座標値(63,0)に基準の頂点の座標値(30,10)がオフセットとして追加され、座標値(93,10)が絶対座標値として算出される。以下、行213〜217に対して同様の処理が実行される。さらに、行213〜217のそれぞれから算出された絶対座標値の各成分に、行202に記述のスケール(0.04)がそれぞれ乗じられることで、元の原稿におけるオブジェクトOBJの情報として復元される。
なお、上述の説明では、直線近似で表現可能なオブジェクトOBJについて説明したが、曲線を含むオブジェクトOBJに対しても、ベジェ近似などを用いて同様の手順でアウトラインデータが生成される。
<関連するアウトライン処理との対比>
図7は、この発明の実施の形態に従うアウトライン処理を関連するアウトライン処理と対比して説明するための図である。図7(a)は、本発明に関連するアウトライン処理の概要を示し、図7(b)は、本実施の形態に従うアウトライン処理の概要を示す。
図7(a)に示すように、本発明に関連するアウトライン処理では、上述した本実施の形態に従うアウトライン処理で用いられる規格化係数に相当する係数αが固定されている。すなわち、座標値の間の変化量(図4に示す座標値成分の最大値に相当)に依存することなく、係数αが一律に乗じられた値がアウトラインデータとして出力される。
そのため、たとえ、図7(a)に示すように文字1では、規定桁数によって表現できる範囲(ダイナミックレンジ)を十分に活用することができたとしても、その座標値の間の変化量が文字1に比較して小さな文字2については、ダイナミックレンジを十分に活用することができない。すなわち、座標値をアウトラインデータに変換する際の係数を固定することで、アウトラインデータの画像品質およびファイルサイズは、対象となる文字のサイズなどに影響を受けて劣化し得る。
また、図示していないが、その座標値の間の変化量が文字1に比較して大きな文字については、より多くの桁数を要することになり、ファイルサイズが増大する。
これに対して、図7(b)に示すように、本実施の形態に従うアウトライン処理では、座標値の間の変化量(図4に示す座標値成分の最大値)に応じて、アウトラインデータとして出力される値が規定桁数における最大値にほぼ一致するように、規格化係数を決定する。これにより、対象とする文字サイズに影響されることなく、常にアウトラインデータの画像品質(文字の判読性)を規定桁数における最高値まで高めることができる。言い換えれば、ファイルサイズの制限から定まる桁数の制約下において実現可能な最大の画像品質を提供することができる。
<実験例>
本実施の形態に従うアウトライン処理における効果を検証するために、複数の文字に対して、様々な規格化係数を用いてアウトライン処理を行なった場合の画像品質とファイルサイズとの関係について実験した。
図8は、文字「A」についてアウトライン処理を行なった実験結果である。図9は、文字「B」についてアウトライン処理を行なった実験結果である。図10は、文字「昌」についてアウトライン処理を行なった実験結果である。
具体的な実験内容としては、各文字(「A」、「B」、「昌」)がプリントされた原稿のスキャナ画像に対して、規格化係数を1〜250までの13通りに設定した場合について、アウトライン処理をそれぞれ行なった。さらに、それぞれのアウトラインデータに記述された各頂点の座標と本来の座標値との誤差(最大値および平均値)について評価した。また、各アウトラインデータのテキスト数(ファイルサイズに相当)についても評価した。このテキスト数とは、各アウトラインデータに記述された文字の数を意味する。
なお、本実験は、本実施の形態に従うアウトライン処理の効果を検証するためのものであり、上述した規格化係数を動的に変更する処理は行なっていない。
図8(a)には、文字「A」についてのテキスト数と平均誤差との関係を示し、図8(b)には、文字「A」についてのテキスト数と最大誤差との関係を示し、図8(c)には、実験結果の一覧を示す。なお、図8(c)のハッチング領域は、本実施の形態に従うアウトライン処理において設定される規格化係数を示す。
図8(a)および図8(b)に示すように、全般的には、ファイルサイズ(テキスト数)と画像品質(平均誤差/最大誤差)とはトレードオフの関係にあるが、画像品質が大きく変化する変化点が存在していることがわかる。すなわち、(1)テキスト数が87〜88付近、および(2)テキスト数が100付近において、画像品質が大きく変化している。図8(c)に示すように、これらの変化点は、各頂点(アンカー点およびベジェ制御点を含む)の座標値が2桁から3桁に変化する点、および各頂点の座標値が3桁から4桁に変化する点にそれぞれ対応する。
図8(a)および図8(b)に示すように、アウトラインデータに記述される座標値の桁数が繰り上がる直前の領域が最も効率的に画像品質を高めることができることがわかる。
一方、本実施の形態に従うアウトライン処理によれば、図8に示す文字「A」に対する規格化係数は「9」となり、図8(c)に示すように、座標値が2桁から3桁に変化する直前の最も効率的な値が選択されることがわかる。
同様に、図9(a)には、文字「B」についてのテキスト数と平均誤差との関係を示し、図9(b)には、文字「B」についてのテキスト数と最大誤差との関係を示し、図9(c)には、実験結果の一覧を示す。同様に、図10(a)には、文字「昌」についてのテキスト数と平均誤差との関係を示し、図10(b)には、文字「昌」についてのテキスト数と最大誤差との関係を示し、図10(c)には、実験結果の一覧を示す。
これらの図9および図10についても、上述の図8と同様の傾向を示し、また本実施の形態に従うアウトライン処理によれば、いずれも最も効率的な規格化係数が選択されることがわかる。
図11は、図8に示す実験によって得られた画像の品質を示す実験結果である。なお、図11には、文字「A」について、規格化係数=1,2.5,9,50の4通りの場合について、生成されたアウトラインデータから得られるアウトライン画像を示す。
図11を参照して、規格化係数が大きくなるに従って、アウトラインデータから得られるアウトライン画像は原稿にプリントされた画像に近付いているのがわかる。しかしながら、規格化係数=「9」の場合に得られるアウトライン画像と、規格化係数=「50」の場合に得られるアウトライン画像とは、その画像品質に大きな違いはなく、よりテキストサイズの小さな規格化係数=「9」の場合(本実施の形態に従うアウトライン処理によって設定される値)の方が、ファイルサイズの抑制という意味において優れている。
上述したように、本実施の形態に従うアウトライン処理によれば、アウトラインデータの適切な画像品質の維持と、ファイルサイズの不必要な増大の抑制といった相反する課題を両立することができる。
<処理手順>
上述した本実施の形態に従うアウトライン処理の手順をまとめると、以下のようになる。
図12は、この発明の実施の形態に従う画像処理手順を示すフローチャートである。
図12を参照して、入力画像処理部12(図1)は、スキャナ10(図1)で何らかの原稿が読み取られたか否かを判断する(ステップS100)。スキャナ10で何らの原稿も読み取られていない場合(ステップS100においてNOの場合)には、処理はステップS100に戻る。
スキャナ10で何らかの原稿が読み取られた場合(ステップS100においてYESの場合)には、入力画像処理部12は、当該読み取りによって生成されたスキャンデータに対して、画像形式の変換、解像度変換、下地除去といった前処理を実行する(ステップS102)。さらに、入力画像処理部12は、前処理後の画像データを解析し、文字領域と文字領域以外の背景領域とを判別し(ステップS104)、前処理後の画像データのうち、文字領域に対応する文字領域データと背景領域に対応する背景領域データとを分離する(ステップS106)。
続いて、CPU14(図1)は、文字領域データを2値化のラスターデータに変換し(ステップS108)、この2値化されたラスターデータから各文字の頂点を検出することで、文字領域データに含まれる各頂点の座標値を抽出する(ステップS110)。
さらに、CPU14は、抽出した複数の頂点の座標値に基づいて、隣接する2つまたはそれ以上の頂点を通過する近似直線を順次生成する(ステップS112)。続いて、CPU14は、ステップS112において生成した近似直線を補正しつつ、ベジェ近似を行なって近似曲線を順次生成し(ステップS114)、各近似曲線を特定するためのベジェコントロールポイントの座標値を算出する(ステップS116)。
続いて、CPU14は、ステップS110〜S116の処理によって得られた頂点(アンカー点およびベジェ制御点を含む)のいずれかを基準として、その他の頂点の座標値(相対値)を算出する(ステップS118)。そして、CPU14は、それぞれの頂点の座標値(相対値)に含まれる座標値成分のうち最大値を抽出し(ステップS120)、予め設定されている規定桁数における最大値を抽出した座標値成分の最大値で除算することで、規格化係数を算出する(ステップS122)。さらに、CPU14は、ステップS118で算出したそれぞれの頂点の座標値(相対値)にステップS122で算出した規格化係数を乗じて、アウトラインデータを生成し(ステップS124)、この生成したアウトラインデータに対して圧縮処理を行なう(ステップS126)。
ステップS108〜S126の処理と並行して、CPU14は、背景領域データに対して、低解像度化処理を実行し(ステップS130)、さらに低解像度化した背景領域データに対して圧縮処理を行なう(ステップS132)。
最終的に、CPU14は、ステップS126において圧縮したアウトラインデータと、ステップS132において圧縮した背景領域データとを階層的に結合して、アウトラインPDFファイルを生成する(ステップS140)。
<本実施の形態の効果>
この発明の実施の形態によれば、対象のオブジェクトを示す複数の座標値をファイルサイズの制限から定められる規定桁数で表現可能な数値範囲に規格化するための規格化係数が動的に決定される。この規格化係数は、規定桁数によって表現できる範囲(ダイナミックレンジ)を最も効率的に活用できるように決定されるので、アウトラインデータの画像品質(文字の判読性)を当該規定桁数における最大レベルまで高めることができる。
その結果、アウトラインデータの適切な画像品質の維持と、ファイルサイズの不必要な増大の抑制といった相反する課題を両立することができる。
[その他の実施の形態]
上述の実施の形態では、本発明に係る画像処理装置の代表例として、MFP100について例示したが、本発明に係る画像処理装置をスキャナと接続されたパーソナルコンピュータを用いて実現してもよい。この場合には、パーソナルコンピュータに本発明に係る画像処理プログラムをインストールすることで、当該パーソナルコンピュータを本発明に係る画像処理装置として機能させることができる。
また、本発明に係る画像処理プログラムは、オペレーティングシステムの一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列およびタイミングで呼出して処理を実行させるものであってもよい。その場合には、プログラム自体には上記モジュールが含まれずオペレーティングシステムと協働して処理が実行される。このようなモジュールを含まないプログラムも、本発明に係るプログラムに含まれ得る。
また、本発明に係る画像処理プログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して処理が実行される。このような他のプログラムに組込まれたプログラムも、本発明にかかるプログラムに含まれ得る。
提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記憶された記憶媒体とを含む。
さらに、本発明に係る画像処理プログラムによって実現される機能の一部または全部を専用のハードウェアによって構成してもよい。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
この発明の実施の形態に従うMFPの機能構成を示すブロック図である。 本実施の形態に従うMFPにおける画像処理に係る機能構成を示すブロック図である。 アウトライン処理の対象となるオブジェクトの一例を示す図である。 図3(b)に示す座標値に対した差分処理が実行された後の結果を示す図である。 図4に示す座標値を規格化した後の結果を示す図である。 図5に示す規格化後の座標値に基づいて生成されたアウトラインデータの記述例を示す図である。 この発明の実施の形態に従うアウトライン処理を関連するアウトライン処理と対比して説明するための図である。 文字「A」についてアウトライン処理を行なった実験結果である。 文字「B」についてアウトライン処理を行なった実験結果である。 文字「昌」についてアウトライン処理を行なった実験結果である。 図8に示す実験によって得られた画像の品質を示す実験結果である。 この発明の実施の形態に従う画像処理手順を示すフローチャートである。
符号の説明
10 スキャナ、12 入力画像処理部、14 CPU、16 記憶部、18 ネットワークI/F、20 モデム、22 操作パネル、24 出力画像処理部、26 プリントエンジン、28 バス、52 前処理部、54 領域判別/分離部、56 低解像度化部、58 アウトライン処理部、581 頂点検出部、582 直線近似部、583 ベジェ近似部、584 精度決定部、60 可逆圧縮部、62 非可逆圧縮部、64 結合部。

Claims (10)

  1. 入力画像に含まれるオブジェクトのアウトラインを示す座標値を複数検出する手段と、
    基準として定められた座標値から検出した座標値の相対座標値を算出する手段と、
    規定桁数で表現可能な数値範囲に前記相対座標値を規格化するための規格化係数を算出する手段と、
    前記相対座標値の各々に前記規格化係数を乗じることでアウトラインデータを生成する手段とを備える、画像処理装置。
  2. 前記規格化係数を算出する手段は、
    前記相対座標値に含まれる座標値成分の最大値を抽出する手段と、
    前記規定桁数で表現可能な最大値を前記座標値成分の最大値で除算する手段とを含む、請求項1に記載の画像処理装置。
  3. 前記入力画像を文字領域と前記文字領域以外の領域とに分離する手段をさらに備え、
    前記座標値を複数検出する手段は、前記文字領域を検出対象とする、請求項1または2に記載の画像処理装置。
  4. 前記アウトラインデータを圧縮する手段と、
    前記文字領域以外の領域の画像を圧縮する手段と、
    圧縮された前記アウトラインデータと圧縮された前記文字領域以外の領域の画像とを結合して、電子化文書を生成する手段とをさらに備える、請求項3に記載の画像処理装置。
  5. 紙媒体の原稿をスキャンすることで前記入力画像を生成するスキャナをさらに備える、請求項1〜4のいずれか1項に記載の画像処理装置。
  6. 入力画像に含まれるオブジェクトのアウトラインを示す座標値を複数検出するステップと、
    基準として定められた座標値から検出した座標値の相対座標値を算出するステップと、
    規定桁数で表現可能な数値範囲に前記相対座標値を規格化するための規格化係数を算出するステップと、
    前記相対座標値の各々に前記規格化係数を乗じることでアウトラインデータを生成するステップとを備える、画像処理方法。
  7. 前記規格化係数を算出するステップは、
    前記相対座標値に含まれる座標値成分の最大値を抽出するステップと、
    前記規定桁数で表現可能な最大値を前記座標値成分の最大値で除算するステップとを含む、請求項6に記載の画像処理方法。
  8. 前記入力画像を文字領域と前記文字領域以外の領域とに分離するステップをさらに備え、
    前記座標値を複数検出するステップは、前記文字領域を検出対象とする、請求項6または7に記載の画像処理方法。
  9. 前記アウトラインデータを圧縮するステップと、
    前記文字領域以外の領域の画像を圧縮するステップと、
    圧縮された前記アウトラインデータと圧縮された前記文字領域以外の領域の画像とを結合して、電子化文書を生成するステップとをさらに備える、請求項8に記載の画像処理方法。
  10. スキャナを用いて、紙媒体の原稿をスキャンすることで前記入力画像を生成するステップをさらに備える、請求項6〜9のいずれか1項に記載の画像処理方法。
JP2008221273A 2008-08-29 2008-08-29 画像処理装置および画像処理方法 Pending JP2010057017A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008221273A JP2010057017A (ja) 2008-08-29 2008-08-29 画像処理装置および画像処理方法
US12/545,910 US8284460B2 (en) 2008-08-29 2009-08-24 Image processing apparatus directed to image outline processing, image processing method of the same, and computer-readable storage medium storing instructions for performing image processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008221273A JP2010057017A (ja) 2008-08-29 2008-08-29 画像処理装置および画像処理方法

Publications (1)

Publication Number Publication Date
JP2010057017A true JP2010057017A (ja) 2010-03-11

Family

ID=41725044

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008221273A Pending JP2010057017A (ja) 2008-08-29 2008-08-29 画像処理装置および画像処理方法

Country Status (2)

Country Link
US (1) US8284460B2 (ja)
JP (1) JP2010057017A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5383416B2 (ja) * 2009-10-06 2014-01-08 キヤノン株式会社 画像処理装置及びその制御方法とプログラム
KR101645994B1 (ko) * 2009-12-29 2016-08-05 삼성전자주식회사 문자 인식 영역 검출 장치 및 문자 인식 방법
WO2017009910A1 (ja) * 2015-07-10 2017-01-19 楽天株式会社 電子書籍表示装置、電子書籍表示方法、及びプログラム
CN112825141B (zh) * 2019-11-21 2023-02-17 上海高德威智能交通系统有限公司 识别文本的方法、装置、识别设备和存储介质
CN111104947A (zh) * 2019-11-21 2020-05-05 凌云光技术集团有限责任公司 基于特征一致性的干扰轮廓滤除方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0366280A (ja) * 1989-08-04 1991-03-20 Matsushita Electric Ind Co Ltd ベクトル量子化器
JPH05342340A (ja) * 1992-06-11 1993-12-24 Canon Inc 画像処理方法及びその装置
JP2004326490A (ja) * 2003-04-25 2004-11-18 Canon Inc 画像処理方法
JP2006048180A (ja) * 2004-07-30 2006-02-16 Tkc Corp 画像処理装置、画像処理方法および画像処理プログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0461902B1 (en) * 1990-06-14 1998-12-23 Canon Kabushiki Kaisha Neural network
DE69332283D1 (de) * 1992-06-11 2002-10-17 Canon Kk Verfahren und Einrichtung zur Bildverarbeitung
US5768438A (en) * 1994-10-19 1998-06-16 Matsushita Electric Industrial Co., Ltd. Image encoding/decoding device
JP3425366B2 (ja) * 1998-06-30 2003-07-14 シャープ株式会社 画像補正装置
US6944319B1 (en) * 1999-09-13 2005-09-13 Microsoft Corporation Pose-invariant face recognition system and process
US7127087B2 (en) * 2000-03-27 2006-10-24 Microsoft Corporation Pose-invariant face recognition system and process
US7391917B2 (en) * 2003-02-13 2008-06-24 Canon Kabushiki Kaisha Image processing method
JP4185858B2 (ja) 2003-12-15 2008-11-26 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US7664326B2 (en) * 2004-07-09 2010-02-16 Aloka Co., Ltd Method and apparatus of image processing to detect and enhance edges
JP4476733B2 (ja) * 2004-07-30 2010-06-09 株式会社東芝 パターン評価方法、プログラムおよびパターン評価装置
JP2006253892A (ja) 2005-03-09 2006-09-21 Canon Inc 画像処理方法及び画像処理装置
US7831107B2 (en) * 2005-10-17 2010-11-09 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and program
US7561747B2 (en) * 2005-12-23 2009-07-14 Xerox Corporation Image data processing system and method
JP4871144B2 (ja) * 2006-01-13 2012-02-08 株式会社東芝 画像処理装置、方法、プログラム
JP4826333B2 (ja) * 2006-05-11 2011-11-30 ソニー株式会社 画像処理装置および方法、並びにプログラム
US8081839B2 (en) * 2006-08-31 2011-12-20 Brother Kogyo Kabushiki Kaisha Image processor
US20080240588A1 (en) * 2007-03-29 2008-10-02 Mikhail Tsoupko-Sitnikov Image processing method and image processing apparatus
US8411205B2 (en) * 2007-07-11 2013-04-02 Olympus Corporation Noise reducing image processing apparatus
CN102338999B (zh) * 2008-02-07 2014-07-30 株式会社理光 图像形成装置以及图像浓度控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0366280A (ja) * 1989-08-04 1991-03-20 Matsushita Electric Ind Co Ltd ベクトル量子化器
JPH05342340A (ja) * 1992-06-11 1993-12-24 Canon Inc 画像処理方法及びその装置
JP2004326490A (ja) * 2003-04-25 2004-11-18 Canon Inc 画像処理方法
JP2006048180A (ja) * 2004-07-30 2006-02-16 Tkc Corp 画像処理装置、画像処理方法および画像処理プログラム

Also Published As

Publication number Publication date
US8284460B2 (en) 2012-10-09
US20100053707A1 (en) 2010-03-04

Similar Documents

Publication Publication Date Title
US9734439B2 (en) Image processing apparatus and method thereof
JP4753638B2 (ja) 文書圧縮方法、文書を圧縮するためのシステム、及び画像処理装置
JP4861967B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、画像形成装置、記憶媒体
CN101800827A (zh) 装置及方法
JP4416782B2 (ja) 画像処理装置、決定装置、変更装置、および画像処理方法
JP2010057017A (ja) 画像処理装置および画像処理方法
JP4663682B2 (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP6147020B2 (ja) 画像処理装置、画像処理方法及びプログラム
US8654404B2 (en) Image processing apparatus, image processing method and memory medium
US8059296B2 (en) Image forming apparatus that synthesizes fiber information extracted from pages of a paper medium having a plurality of pages, and an image forming apparatus control method, a program, and a storage medium relating thereto
JP4534505B2 (ja) 印刷装置及びラスタイメージプロセッサ
JP5284431B2 (ja) 二次元コードを復号化する装置、二次元コードを復号化する装置の制御方法、およびプログラム
JP6373448B2 (ja) 画像処理装置、画像処理方法及びプログラム
US20100188670A1 (en) Image processing apparatus, image processing method and program executing the image processing method
JP2008148263A (ja) 画像形成装置及びその制御方法
JP4169674B2 (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JP4697933B2 (ja) 画像処理装置および画像入出力装置およびそれらの方法
JP5464157B2 (ja) 画像処理装置及び画像処理プログラム
JP2010218106A (ja) 画像処理装置、画像処理方法及びプログラム
JP5062633B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2008022082A (ja) 画像形成装置及びその制御方法
US20110158531A1 (en) Image processing apparatus and control method thereof
JP2015226264A (ja) 画像処理装置、それを備えた画像形成装置、画像処理プログラム、及びそのプログラムを記録した記録媒体
JP2010288144A (ja) 画像処理装置及び画像処理装置の制御方法及びプログラム及び記憶媒体
JP5371687B2 (ja) 画像表示装置、画像形成装置、画像表示方法、コンピュータプログラム及び記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101019