JP2010074540A - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP2010074540A
JP2010074540A JP2008239804A JP2008239804A JP2010074540A JP 2010074540 A JP2010074540 A JP 2010074540A JP 2008239804 A JP2008239804 A JP 2008239804A JP 2008239804 A JP2008239804 A JP 2008239804A JP 2010074540 A JP2010074540 A JP 2010074540A
Authority
JP
Japan
Prior art keywords
image
resolution
character
resolution image
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008239804A
Other languages
English (en)
Other versions
JP5137759B2 (ja
JP2010074540A5 (ja
Inventor
Naoki Ito
直樹 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008239804A priority Critical patent/JP5137759B2/ja
Priority to US12/554,766 priority patent/US20100067023A1/en
Publication of JP2010074540A publication Critical patent/JP2010074540A/ja
Publication of JP2010074540A5 publication Critical patent/JP2010074540A5/ja
Application granted granted Critical
Publication of JP5137759B2 publication Critical patent/JP5137759B2/ja
Priority to US14/296,290 priority patent/US10477063B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K15/00Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers
    • G06K15/02Arrangements for producing a permanent visual presentation of the output data, e.g. computer output printers using printers
    • G06K15/18Conditioning data for presenting it to the physical printing elements
    • G06K15/1867Post-processing of the composed and rasterized print image
    • G06K15/1872Image enhancement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3871Composing, repositioning or otherwise geometrically modifying originals the composed originals being of different kinds, e.g. low- and high-resolution originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • H04N1/4092Edge or detail enhancement

Abstract

【課題】少ないメモリ量で高画質なベクトル画像を高速に生成することが可能な画像処理装置を提供する。
【解決手段】本発明は、圧縮された高解像度の画像に対して解像度変換を行うことにより、低解像度の画像を生成し、前記低解像度の画像に対してオブジェクト分割を行うことにより、低解像度の文字オブジェクトの情報を得る。そして、前記圧縮された高解像度の画像を解凍し、前記オブジェクト分割で得た低解像度の文字オブジェクトの情報と前記解凍した高解像度の画像とを用いて、高解像度の文字輪郭を示す画像を生成する。また、前記解凍を行う際、文字オブジェクトの情報に基づいて、前記圧縮された高解像度の画像を部分的に解凍してもよい。
【選択図】図4

Description

本発明は入力画像からベクトル化データを生成する場合に、オブジェクト認識処理により認識した文字オブジェクトに対して文字ベクトル化処理を行う画像処理装置に関する。
例えば特許文献1には、カラー文書画像を高品質化することが可能な画像処理装置として、以下の構成を有する画像処理装置が開示されている。
入力画像を低解像度の画像に変換する。変換した低解像度の画像を用いて減色画像を生成し、減色画像から同じ代表色に割り当てられた隣接画素を統合してFCR(Flat Color Region)候補領域を抽出し、減色画像よりも高解像度の画像を用いて領域候補を再判定する。次に、FCRの境界を検出して最終的なFCRを決定し、決定したFCRの代表色の選定を行い、純色に近い色は純色に置き換える特色処理を行う。最後にFCRを入力画像に上書き描画(合成)することにより画像再生成を行う。
特開2002−142128号公報
従来から文書の電子化が行われているが、文書を高画質で、かつ、再利用可能な状態で電子化するためには、必要なメモリ量が大きくなり、また、文書を電子化するには膨大な計算量を要するため電子化処理に時間がかかる。特に、限られた処理リソースにおいては、小さなメモリ量で文書の電子化を実現しなければならない。そのためには処理するデータ量を出来る限り抑える必要があるが、処理するデータ量を少なくすると良好な画質が得られなくなる。限られた処理リソースで文書を電子化する場合、データを圧縮化することで必要なメモリ量を抑えることが行われているが、データを圧縮するだけでは、必要なメモリ量を小さくできても、良好な画質が得られないという課題がある。
本発明の画像処理装置は、圧縮された高解像度の画像に対して解像度変換を行うことにより、低解像度の画像を生成する解像度変換手段と、前記低解像度の画像に対してオブジェクト分割を行うことにより、低解像度の文字オブジェクトの情報を得るオブジェクト分割手段と、前記圧縮された高解像度の画像を解凍する解凍手段と、前記オブジェクト分割手段で得た低解像度の文字オブジェクトの情報と前記解凍手段で解凍した高解像度の画像とを用いて、高解像度の文字輪郭を示す画像を生成する文字輪郭生成手段と、を備えることを特徴とする。
本発明によれば、少ないメモリ量で高画質なベクトル画像を高速に生成することが可能になる。
以下、本発明の実施形態を、図面を用いて説明する。
(実施形態1)
[画像処理システム]
図1は、本発明の実施形態に係る画像処理システムの構成を示すブロック図である。
画像処理システムは、各種機器を備えたオフィス10とオフィス20とから構成される。オフィス10とオフィス20内には、LAN107、108が構築され、更に、両オフィスはインターネット104を介して接続される。
オフィス10は、複合機(Multifunction Peripheral、以下、「MFP」と称す。)100と、MFP100を制御するマネージメントPC101と、ローカルPC102と、プロキシサーバ103と、データベース105と、文書管理サーバ106とを備える。これらの機器は、LAN107により接続される。
オフィス20は、ローカルPC102と、データベース105と、文書管理サーバ106と、プロキシサーバ103とを備える。これらの機器は、LAN108により接続される。
LAN107、108にはプロキシサーバ103が各々接続され、LAN107、108はそれぞれのプロキシサーバ103を介してインターネット104に接続される。
MFP100は、原稿から読み取った入力画像に対する画像処理の一部を実行し、画像処理した画像データを、LAN109を介してマネージメントPC101に送信する。また、MFP100は、LAN107を介してローカルPC102又は汎用PC(不図示)から受け取ったPDL(Page Description Language)言語を解釈して、印刷出力する。さらに、MFP100は、原稿から読み取った画像データを、LAN107を介してローカルPC102又は汎用PCに送信する。
マネージメントPC101は、画像記憶部、画像処理部、表示部、入力部等(不図示)を含むコンピュータである。マネージメントPC101は、MFP100と協働して、画像処理を実行する。なお、本実施形態では、マネージメントPC101がデータベース105に対して以下に述べる登録処理等を実行するが、MFP100自身が登録処理等を実行する構成にしてもよい。
[MFP]
図2は、MFP100の構成を示すブロック図である。
MFP100は、画像読み取り部110と、記憶部(ボックス)111と、印刷部112と、入力部113と、ネットワークI/F部114、117と、データ処理部115とを備える。
画像読み取り部110は、原稿自動送り機能(Auto Document Feeder)を有するスキャナで構成される。画像読み取り部110は、束状の或いは1枚の原稿の画像に光を照射し、反射された光をレンズで固体撮像素子上に結像させる。固体撮像素子は、所定解像度(例えば600dpi)および所定輝度レベル(例えば8ビット)の画像信号を生成する。この画像信号は、ラスターデータよりなる画像データからなる。
データ処理部115は、通常の複写を実行する際には、画像読み取り部110から受け取った画像データに対して複写用の画像処理を実行して印刷データに変換し、印刷部112に出力する。複数枚を複写する場合には、データ処理部115は、1頁分の印刷データを一旦記憶部111に保存した後、印刷部112に順次出力する。印刷部112は、印刷データに基づき、記録紙上に画像等を印刷する。また、データ処理部115は、ネットワークI/F114を介してローカルPC102又は他の汎用PC(不図示)から受け取ったPDL言語を解釈、処理することによって印刷データを生成し、印刷部112に出力する。
記憶部111は、画像読み取り部110から受け取った画像データやローカルPC102から受け取ったPDLデータをレンダリングしたデータを保存する機能を有する。また、記憶部111は、ネットワークI/F117とLAN109とを介して、マネージメントPC101から直接制御され得る。
入力部113は、タッチパネルやキーボード等の操作用インタフェースを備え、ユーザからの操作用入力を受け付ける。また、MFP100は、マネージメントPC101が有するキーボードやポインティングデバイス等を操作することによっても動作可能である。
表示部116は、MFP100のステータスや画像データ等を表示する。
図3は、実施形態1に係るベクトル化処理の流れを示すフローチャートである。
ステップS301において、MFP100は画像読み取り部を用いて画像を入力する。
ステップS302において、MFP100は、入力した画像に対して、当該画像に応じた画像処理を行う。画像処理とは、例えば、色変換やフィルタ処理等の周知の処理である。
ステップS303において、MFP100は、画像処理された画像データに対して圧縮処理を実行し、圧縮画像データを生成する。圧縮方式としては、例えば、JPEGがある。
ステップS304において、MFP100は、圧縮画像データを記憶部111にスプールする。記憶部111は、例えば、メモリやハードディスクである。
ステップS305において、MFP100は、スプールされた圧縮画像データに対して解凍処理を実行する。例えば、ステップS303において画像がJPEGで圧縮されていた場合には、JPEGで解凍する処理が行われる。すなわち、ステップS305においては、ステップS303で用いられた圧縮方式に対応する解凍方式が用いられる。
ステップS306において、MFP100は、解凍された画像データの解像度を下げる解像度変換処理を実行する。例えば、解像度が600dpiの画像データは、300dpiの画像データに解像度変換される。
ステップS307において、MFP100は、解像度変換後の画像データに対して、オブジェクト分割処理(領域分割処理)を実行する。オブジェクト種としては、文字オブジェクト、写真オブジェクト、グラフィック(図面、線画、表)オブジェクト、背景オブジェクトがある。
ステップS312において、MFP100は、ステップS303で圧縮された画像データを解凍する。
ステップS308において、MFP100は、文字オブジェクトに対して、文字輪郭生成処理を実行する。ここでは、MFP100は、文字オブジェクトに対応する部分の高解像度画像データを参照し文字の輪郭を生成する。すなわち、S307で分割された文字オブジェクトと、ステップS312で解凍された画像データとに基づいて文字の輪郭を生成する。つまり、MFP100は、低解像度の画像データから分割された文字オブジェクトと、解凍後の高解像度の画像データとを用いて文字の輪郭を生成する。この文字輪郭生成処理の詳細は後述する。
ステップS309において、MFP100は、ステップS308で生成された文字輪郭に対して関数近似処理を実行し、パス化されたデータに変換する。
ステップS310において、MFP100は、パス化されたデータを汎用のフォーマットにフォーマット化する。汎用のフォーマットとは、例えば、PDFやXPSやSVGやXMLなどである。なお、MFP100は、フォーマット化されたデータを記憶部111に保存してもよく、また、ネットワークを介してPCなどの外部の機器に送信してもよい。
次に、図4を用いて、上述の処理をより具体的に説明する。
図4は、上述のベクトル化処理を模式的に表した図である。
MFP100は、原稿をスキャンし(411)、スキャンされた画像に対して画像処理を行い(412)、画像処理された画像データに対して画像圧縮を行う(413)。本例では、圧縮方式はJPEGとする。
MFP100は、圧縮画像データを記憶部111にスプールし(414)、スプールした圧縮画像を読み出して解凍を行い(415)、解像度600dpi/階調数24bitの画像データを生成する。
MFP100は、生成された解像度600dpi/階調数24bitの画像データ(402)を低解像度画像に変換する解像度変換を行い(401)、解像度300dpi/階調数24bitの画像データを生成する。なお、これらの解像度や階調数は例示であり、これらの値に限定されない。
MFP100は、解像度300dpi/階調数24bitの画像データ(403)に対してオブジェクト分割を行い(404)、その結果として、オブジェクト分割領域情報と文字情報を求める(405、406)。オブジェクト分割領域情報(405)とは、画像中のどの領域に何のオブジェクト(文字オブジェクト等のオブジェクト種)が存在するかを示す情報である。すなわち、オブジェクト分割領域情報(405)は、矩形領域の位置情報と当該矩形領域に含まれるオブジェクトの属性(オブジェクト種)とを示す情報であり、公知の技術を用いて判定することができる。文字情報(406)とは、文字オブジェクトが存在する領域の中で文字オブジェクトを示す情報である。すなわち、文字情報(406)は、文字属性の領域を2値画像データ(すなわち300dpi/1bitの画像)で示した情報であり、例えば、文字属性の領域を2値化することにより得られる。このとき、例えば処理対象の画像が白地に黒文字の画像である場合、文字情報は、文字を構成する画素が1、文字でない背景の画素が0として表される、文字領域の低解像度2値画像になる。
MFP100は、オブジェクト分割領域情報と、文字情報と、解像度変換前(解凍後)の高解像度画像である解像度600dpi/階調数24bitの画像データと、を用いて後述する文字輪郭生成処理を行う(407)。文字輪郭生成処理407を行うことにより、解像度600dpi/階調数1bitの文字輪郭画像データを得ることができる(408)。
MFP100は、文字輪郭画像データ408に対して関数近似処理を行うことでパス化を行い(409)、パス化されたデータ(すなわちベクトルデータ)をフォーマット化する(410)。
次に、文字輪郭生成処理の詳細を説明する。
図5は、文字輪郭生成処理(407)を模式的に表した図である。
501は、オブジェクト分割領域情報と文字情報とを含む低解像度画像を示す。解像度は、300dpiとする。502は、解像度600dpi/階調数24bitの高解像度画像から生成した解像度600dpi/階調数8bitの輝度画像を示す。輝度画像の生成は、周知の方法で実現できる。例えば、24bitのカラー画像(RGB画像)を所定の変換式を用いて8bitの輝度画像に変換する処理が行われることになる。
504は、解像度300dpiの画像501内の一領域を示す。ここでは、領域情報405に基づいて文字属性の領域の位置を特定し、当該特定された文字の領域の位置に対応する領域の部分を文字情報406から取り出した300dpi/1bitの画像504である。画像504は2値画像であり、503で示すように黒塗の画素は、画像504において文字を形成する画素である。504で示す画像の一つの升目は、低解像度の画像における1画素を表す。
505は、504の領域に対応する解像度600dpi/階調数8bitの高解像画像502内の領域を示す。505で示す画像の一つの升目は、高解像度の画像における1画素を表す。なお、画像505は輝度画像(多値画像)であり、文字を構成する画素と背景の画素との境界には、グレーの画素が存在することが多い。
506は、低解像度画像504と高解像度画像505を用いて生成された解像度600dpi/1bitの文字画像を示す。すなわち、画像506は、高解像度の2値画像である。
文字画像506の生成方法は以下の通りである。
解像度300dpiの低解像度画像504をラスタ順序に走査を行う。低解像度画像504の走査を行う際に、走査される画素毎に、その画素の周囲8近傍(周囲の8画素)に文字オブジェクトを構成する画素が存在するかどうかを確認する。存在しない場合は、当該1つの画素を2×2画素(4画素)に分割することによって解像度600dpiに変換し、それらの画素の画素値を白(0)とする。これに対して、走査される画素の周囲8近傍に文字オブジェクトを構成する画素(黒画素)が存在する場合には、まず、解像度600dpi/階調数8bitデータ(高解像度の多値画像)を用いて、当該画素の部分における閾値算出処理を行う。そして、当該算出した閾値を用いて、解像度600dpi/階調数8bitデータを0/1に2値化する。例えば、周囲8近傍に存在する文字オブジェクトを構成する画素の画素値と、そうでない画素の画素値の平均値を解像度600dpi/階調数8bit画像から求める。次いで、それぞれの平均値を足し算してそれを2で割ることで閾値を求める。画素値がこの閾値を上回るか下回るかを解像度600dpi/階調数8bit画像において比較し、画素値が閾値を上回る画素は黒(1)とし、下回る画素は白(0)とする。これによって、解像度600dpi/階調数1bit文字画像(すなわち高解像度の2値画像)を生成できる。このように、画像504において300dpiの画像で文字が存在すると判定された画素の近傍画素について、解像度600dpi/階調数8bitの画像を用いて適応的に閾値を決めて2値化処理を行う。すなわち、文字画素が存在する可能性が高い部分のみを2値化処理対象にするので、効率よく高解像度の文字輪郭を示す2値画像を生成することができる。例えば、画像504における矩形507で囲んだ部分の白画素と黒画素は、高解像度の輝度画像505の対応する画素はグレーの画素を含んでいるので、それぞれの画素において算出した閾値を用いて2値化すると、画像506のようになる。なお、文字には白抜き文字のように周囲の画素が色を持っていて、文字は白という場合も存在する。この場合は、周囲の色と文字の色から白抜き文字であるか否かの判定を行い、その判定によって、前述した解像度600dpi/階調数1bit文字画像の生成を行う。なお、白抜き文字の判定方法に関しては周知の方法を使うことが可能である。例えば、解像度600dpi/階調数1bitの画像を生成したときに、黒画素の総数と白画素の総数とを比較し、多い方の画素を背景画素と判断する。このときに、黒画素が背景画素と判断された場合は、当該領域の白黒反転を行い、白画素が背景画素となるようにすればよい。
このように、文字領域を特定する際は、解像度を落とした画像を用いて領域分割を行い、その文字領域に関して低解像度の画像で文字が存在する画素を特定し、その特定した画素について高解像度の画像を用いて文字輪郭を生成する。したがって、少ないメモリで且つ高速に文字の画素を特定して、且つ高精度に文字輪郭を抽出することができる。例えば、300dpiの画像のみを用いて文字輪郭を抽出してベクトル化処理を行った場合は、生成されたベクトルデータをレンダリングすると図19(1)のような画像になる。一方、300dpiの画像で文字画素を特定しながら、600dpiの輝度画像を用いて文字輪郭を抽出してベクトル化処理を行った場合は、当該生成されたベクトルデータをレンダリングすると図19(2)のように、精度の高い滑らかな画像が得られる。
〔ビットマップ画像データの作成〕
MFP100の画像読み取り部110を使用した場合には、図13に示すステップS1301において、画像を読み込む。読み込まれた画像は、既にビットマップ画像データである。そのビットマップ画像データをステップS1302において、スキャナに依存する画像処理を行う。スキャナに依存する画像処理とは、例えば、色処理やフィルタ処理である。一方PC102上のアプリケーションソフトを使用して作成したアプリケーションデータは、PC102上にあるプリントドライバによってPDLに変換され、MFP100に送信される。ここで、PDLとは、例えば、LIPS、Postscriptである。PDLを受け取ったMFP100は、内蔵するインタープリタを用いて、PDLに基づいてディスプレイリストを生成する。次いで、MFP100は、ディスプレイリストをレンダリングすることにより、ビットマップ画像データを生成する。
MFP100は、上記2つの方法のいずれかにより生成されたビットマップ画像データを処理対象として、ステップS303(図3)以降の処理(図4の413以降の処理)を行う。
[登録の詳細設定]
図18は、図3に示すステップS309における関数近似処理でベクトル化されたデータのフォーマットの一例を示す図である。本実施形態では、SVG(Scalable Vector Graphic)形式で表記しているが、これに限定されるものではない。
図18では説明のため、オブジェクトの表記を枠で囲っている。枠1801内にはイメージ属性が示され、イメージオブジェクトの領域の示すオブジェクト分割領域情報とビットマップ情報が示されている。枠1802内にはテキストオブジェクトの情報が示されている。枠1803内には、枠1802内で示した内容がベクターオブジェクトとして示されている。枠1804には、表オブジェクトなどのラインアートが示されている。
[オブジェクト分割ステップ]
図14は、オブジェクト分割処理(図3のステップS307、図4の404)により得られたオブジェクト分割領域情報(図4の405)を示す図である。
ステップS307において、MFP100は、画像1402に示すように、入力画像1401を属性ごとに矩形ブロックに分割する。前述のように、矩形ブロックの属性としては、文字、写真、グラフィック(図面、線画、表など)がある。
ステップS307のオブジェクト分割においては、まず、RAM(不図示)に格納された画像データ(403)を白黒に2値化し、黒画素からなる輪郭で囲まれる黒画素塊(連結黒画素)を抽出する。さらに、抽出された黒画素塊の大きさを算出し、その黒画素塊の大きさが所定値以上の場合、黒画素塊の内部にある白画素塊を抽出し、その輪郭を求める。さらに、白画素塊の大きさの算出、白画素塊の内部にある黒画素塊の抽出及びその輪郭を求めるというように、内部の画素塊の大きさが所定値以上である限り、繰り返し、画素塊を抽出し、その輪郭を求める。画素塊の大きさとは、例えば画素塊の面積である。このようにして得られた画素塊に外接する矩形ブロックを求め、矩形ブロックの大きさ、形状に基づき矩形ブロックの属性が判定される。例えば、縦横比が1に近く、大きさが一定の範囲(文字と判断する大きさの範囲)の矩形ブロックは文字オブジェクト領域矩形ブロックの可能性が高い文字相当ブロックと判定する。また、近接する文字相当ブロックが規則正しく整列しているときに、これら文字相当ブロックを纏めた新たな矩形ブロックを生成し、新たな矩形ブロックを文字オブジェクト領域矩形ブロックと判定する。すなわち、近くにある文字相当のブロックをまとめていくので、文字オブジェクト領域矩形ブロックは、文字行や文字段落単位の領域になる。また縦長や横長の扁平な黒画素塊をセパレータなどの線画領域矩形ブロックと判定し、黒画素塊が一定以上の大きさ以上でかつ内部に四角形の白画素塊を整列よく内包する場合は表領域矩形ブロックと判定し、これらをグラフィック領域矩形ブロックとして扱う。また、それ以外の不定形の黒画素塊を写真領域矩形ブロックと判定する。なお、本実施形態では、文字、写真、グラフィックとして属性を分類することとしたが、属性の種類はこれらに限るものではなく、更に細かく属性分類しても構わない。
ステップS307において、このようにして判定された矩形ブロックのそれぞれについて、図15に示すような、属性等のブロック情報および入力ファイル情報を生成する。図15において、ブロック情報には、各ブロックの属性、座標X、座標Y、幅W、高さH、OCR情報が含まれる。属性には1〜3の数値が割り当てられ、1は文字オブジェクト領域矩形ブロックを示し、2は写真領域矩形ブロックを示し、3はグラフィック領域矩形ブロックを示す。座標X、座標Yは、画像内における各矩形ブロックの始点のX、Y座標(左上角の座標)を示す。幅W、高さHは、矩形ブロックのX座標方向の幅、Y座標方向の高さを示す。OCR情報は、入力画像におけるポインタ情報の有無を示す。また、入力ファイル情報には、矩形ブロックの個数を示すブロック総数N(画像1402の場合、N=6)が含まれる。
矩形ブロックごとのブロック情報は、特定領域でのベクトル化に利用される。なお、本実施形態では文字領域をベクトル化処理の対象とするので、特定領域とは文字領域のことである。すなわち、この文字オブジェクト領域を抽出して後段の文字輪郭生成処理407に利用する。またブロック情報によって、特定領域とその他の領域を合成する際の相対的位置関係を特定でき、入力画像のレイアウトを損なわずにベクトル化領域とラスターデータ領域を合成することが可能となる。
図16は、文書構造ツリー生成処理の対象となる文書の模式図である。
図16において、文書の最上部には、矩形ブロックT1、T2が横に並んで存在する。矩形ブロックT1、T2の下には横方向セパレータS1が存在し、横方向セパレータS1の下には矩形ブロックT3、T4、T5、T6、T7が存在する。矩形ブロックT3、T4、T5は、横方向セパレータS1の下側の領域の左半分に上から下に縦方向に配列され、矩形ブロックT6、T7は、横方向セパレータS1の下側の領域の右半部に上下に配列されている。
図17は、以上の処理結果を文書構造ツリーで表現した図である。
図17において、入力画像V0は、最上位階層に、グループH1、H2、セパレータS1を有し、グループH1には、第2階層の矩形ブロックT1、T2が属する。グループH2には、第2階層のグループV1、V2が属し、グループV1には、第3階層の矩形ブロックT3、T4、T5が属し、グループV2には、第3階層の矩形ブロックT6、T7が属する。
(実施形態2)
実施形態2は、文字輪郭生成処理の前段の処理である入力画像の解凍処理が実施形態1とは異なり、装置構成、他の処理は実施形態1と共通する。したがって、実施形態1とは異なる解凍処理について主に説明する。
図6は、実施形態2に係る処理の流れを示すフローチャートである。図6のS601〜S610の処理は、それぞれ図3のS301〜S310の処理と似た処理を行うので、下記では、ステップS612の処理の詳細を説明する。
ステップS612において、MFP100は、ステップS607でのオブジェクト分割処理により得られたオブジェクト分割領域情報を用いて、ページ内にいくつかある文字オブジェクト領域の1つ1つを部分的に解凍する部分解凍処理を実行する。そして、部分解凍した画像を得るごとにステップS608とS609の処理を順次行う。オブジェクト単位に解凍を行うことで小さなメモリ量での解凍処理とベクトル化処理が可能になる。
図7は、実施形態2に係る、オブジェクト分割領域情報を用いた文字ベクトル化処理の流れを示すフローチャートである。図7で行われる処理は、図6のステップS612,S608,S609に相当する処理である。
ステップS702において、MFP100は、オブジェクト分割領域情報を取得し、取得したオブジェクト分割領域情報から1つの文字オブジェクト領域を取得する。
ステップS703において、MFP100は、この1つの文字オブジェクト領域に対応する入力画像を部分的に解凍する。オブジェクト分割領域情報が解像度300dpiの情報であった場合に、それが解像度600dpiになった場合の座標を計算する。また、圧縮の最小単位は、例えば、JPEGの場合には、8画素×8画素であるので、取得した文字オブジェクト領域に対応する圧縮画像の領域を解凍できるようにする。部分解凍の方法に関しては、圧縮方法が何であるかによってその方法は異なる。しかし、周知の圧縮技術及び周知の部分解凍方法を用いることで実現が可能である。このようにして、1つの文字オブジェクト領域に対応する解像度600dpiの高解像度画像を得ることが可能となる。
ステップS704において、MFP100は、文字輪郭生成処理を行う。文字輪郭生成処理は、実施形態1で説明した処理と同じである。
ステップS705において、MFP100は、ステップS704で生成された文字輪郭に対して関数近似処理を実行し、パス化されたベクトルデータを生成する。
ステップS706において、MFP100は、全ての文字オブジェクト領域に対して上記の処理を実行したかどうかを判定し、全ての文字オブジェクト領域に対して上記処理が終了するとベクトル化処理は完了する。
図8は、解像度300dpiのオブジェクト分割領域情報を解像度600dpiの画像における対応する位置の座標に変換し、部分解凍処理(ステップS812)をする場合を説明するための図である。
図8(a)は、600dpiの圧縮画像801を示す図である。図8(b)は、オブジェクト分割領域情報を画像802として示す図である。画像802内の808〜812のTEXTは、各々、文字オブジェクト領域を表す。画像802内の文字オブジェクト領域(TEXT)808を部分的に解凍する場合には、文字オブジェクト領域808の座標に対応する圧縮画像801の座標を求め、その座標を含む圧縮画像の領域を特定し、当該領域の圧縮画像を解凍する。図8(c)の813〜817は、図8(b)の808〜812に示すオブジェクト分割領域情報802を用いて、圧縮画像801内の対応する位置にある803〜807の各領域に対して部分解凍処理を行った結果を示す。例えば、図8(c)の813(ABCD)は、図8(b)の文字オブジェクト領域808に対応する圧縮画像(600dpi)の領域803に対して部分解凍処理を行った結果を示す。
以上説明したように、オブジェクト分割領域情報を用いて、部分的に必要な圧縮画像の領域のみを解凍して処理することで、文字輪郭生成を行う際のメモリ量を抑えながらベクトル化処理を行うことが可能となる。
(実施形態3)
実施形態3は、文字輪郭生成処理の前段の処理である入力画像の解凍処理が前述の実施形態とは異なり、装置構成、他の処理は前述の実施形態と共通する。実施形態2では、文字領域(文字行や段落)ごとに部分解凍したが、実施形態3では、文字領域内の1文字ごとに部分解凍する。したがって、前述の実施形態とは異なる解凍処理について以下に説明する。
実施形態2は、1つの文字オブジェクト領域に対して部分的に解凍処理するものである。実施形態2では、1つの文字オブジェクト領域(段落や文字行)が大きいと処理に必要なメモリ量が不足する場合があるが、実施形態3は、そのような場合にも対処可能である。
図9は、実施形態3に係る、オブジェクト分割領域情報を用いた文字ベクトル化処理の流れを示すフローチャートである。
ステップS902において、MFP100は、オブジェクト分割領域情報と、1つの文字オブジェクト領域から一文字を切りだすための一文字情報とを取得する。1つの文字オブジェクト領域から一文字を切り出すための情報、すなわち、当該1文字の座標は、オブジェクト分割領域情報から得られる。
ステップS903において、MFP100は、この座標に相当する入力画像を部分的に解凍する。例えば、オブジェクト分割領域情報が解像度300dpiの情報であった場合に、それが解像度600dpiになった場合の座標を計算する。また、圧縮の最小単位は、例えば、JPEGの場合には、8画素×8画素であるので、算出した文字オブジェクト領域が含まれる圧縮画像の領域を解凍できるようにする。部分解凍の方法に関しては、圧縮方法が何であるかによってその方法は異なるものである。しかし、周知の圧縮技術及び周知の部分解凍方法を用いることで実現が可能である。このようにして、一文字に該当する解像度600dpiの画像を得ることが可能となる。オブジェクト分割からの文字要素画素と600dpi画像を得ることができる。
ステップS904において、MFP100は、文字輪郭生成処理を行う。文字輪郭生成処理は、実施形態1で説明した処理と同じである。
ステップS905において、MFP100は、ステップS904で生成された文字輪郭に対して関数近似処理を実行し、パス化されたベクトルデータを生成する。
ステップS906において、MFP100は、全ての文字オブジェクトに対して上記の処理を実行したかどうかを判定する。
図10は、一文字ごとに部分的に解凍処理(一文字解凍)を行うことの有用性を説明するための図である。
1001は、8×8画素の圧縮単位でJPEG圧縮された画像を示す。1002は、JPEG圧縮の圧縮単位を示す。画像1001において各文字を囲む枠は文字切り情報1003を示す。文字切り情報1003は、オブジェクト分割処理において一文字と判断された文字を示す。解凍はJPEGの圧縮単位で行われるため、“あ”の文字を解凍したい場合に、1004に示すように右隣の文字の“い”の一部も解凍されてしまう。また、“い”の文字を解凍したい場合に、同様に、1005に示すように左隣の文字の“あ”の一部も解凍されてしまう。したがって、JPEGの部分解凍された画像をそのままベクトル化処理(文字輪郭生成処理・関数近似処理)を行うと、隣の文字の一部も処理を行ってしまうことになる。そこで、本実施形態では、当該部分解凍された画像のうち、文字切り情報1003によって特定される1文字の領域のみに対して、ベクトル化処理を行うこととする。なお、ステップS904〜S905の処理は、1文字の領域を対象として、図5で示したように、高解像度の画像データとオブジェクト分割から得られる文字を構成する要素を使って文字輪郭生成を行うことになる。
(実施形態4)
実施形態4は、文字輪郭生成処理の前段の処理である入力画像の解凍処理が前述の実施形態とは異なり、装置構成、他の処理は前述の実施形態と共通する。したがって、前述の実施形態とは異なる解凍処理について以下に説明する。
実施形態3は、1つの文字に対して部分的に解凍処理するものである。実施形態3では、文字数が多いと処理時間が長くなる場合があるが、実施形態4は、このような場合に対処するものである。
図11は、実施形態4に係る、オブジェクト分割領域情報を用いた文字ベクトル化処理の流れを示すフローチャートである。
ステップS1102において、MFP100は、オブジェクト分割領域情報と、1つの文字オブジェクト領域(文字行や段落の領域)から一文字を切りだすための情報を取得する。さらに、MFP100は、オブジェクト分割領域情報から文字オブジェクト領域の大きさを計算し、領域処理に必要なメモリ量を算出する(メモリ量算出)。
ステップS1103において、MFP100は、予め設定されている利用可能なメモリ量と、ステップS1102で算出した領域処理に必要なメモリ量とを比較する。比較した結果、領域処理に必要なメモリ量が所定の利用可能なメモリ量よりも少ない場合には、領域処理可能と判断し、ステップS1104に進む一方、そうでない場合には、ステップS1107に進む。
領域処理に必要なメモリ量が所定の利用可能なメモリ量よりも少ないと判定した場合、ステップS1104において、MFP100は、1つの文字オブジェクト領域(文字行や段落の領域)の解凍処理を行う。
ステップS1105において、MFP100は、文字輪郭生成処理(第1の文字輪郭生成処理)を行う。
一方、領域処理に必要なメモリ量が所定の利用可能なメモリ量以上であると判定した場合、ステップS1107において、MFP100は、文字オブジェクト領域の中の文字を一文字ごとに解凍処理(一文字解凍)する。一文字解凍に関しては前述した通りである。
ステップS1108において、MFP100は、文字輪郭生成処理(第2の文字輪郭生成処理)を行う。
ステップS1106において、MFP100は、ステップS1105で生成された文字輪郭又はステップS1108で生成された文字輪郭に対して関数近似処理を実行し、パス化されたベクトルデータを生成する。
ステップS1109において、MFP100は、全ての文字オブジェクトに対して上記の処理を実行したかどうかを判定する。
(実施形態5)
実施形態5は、文字輪郭生成処理の前段の処理である入力画像の解凍処理が前述の実施形態とは異なり、装置構成、他の処理は前述の実施形態と共通する。したがって、前述の実施形態と異なる解凍処理について以下に説明する。
実施形態4は、1つの文字に対して部分的に解凍処理するものである。実施形態4では、1つの文字オブジェクト領域の大きさ(すなわち、必要となるメモリ量)に応じて、文字オブジェクト領域のまま解凍処理を行うか、文字オブジェクト領域内の一文字ごとに解凍処理を行うかどうかを切り替える。しかし、実施形態4でも、文字オブジェクト領域が大きいときは1文字ごとの解凍処理を行うので、1領域内の文字数が多い場合には処理時間がかかってしまう場合がある。実施形態5は、このような場合にも対処可能である。
図12は、実施形態5に係る、オブジェクト分割領域情報を用いた文字ベクトル化処理の流れを示すフローチャートである。
ステップS1202において、MFP100は、オブジェクト分割領域情報と、1つの文字オブジェクト領域から一文字を切りだすための情報を取得する。次いで、MFP100は、オブジェクト分割領域情報から文字オブジェクト領域の大きさを計算し、領域処理に必要なメモリ量を算出する(メモリ量算出)。
ステップS1203において、MFP100は、予め設定されている利用可能なメモリ量と、ステップS1202で算出した処理に必要なメモリ量とを比較する。比較した結果、領域処理に必要なメモリ量が所定の利用可能なメモリ量よりも少ない場合には、領域処理可能と判断し、ステップS1204に進む一方、そうでない場合には、ステップS1207に進む。
領域処理に必要なメモリ量が利用可能なメモリ量よりも少ない場合、ステップS1204において、MFP100は、1つの文字オブジェクト領域の解凍処理を行う。
ステップS1205において、MFP100は、文字輪郭生成処理(第1の文字輪郭生成処理)を行う。
ステップS1206において、MFP100は、ステップS1205で生成された文字輪郭に対して関数近似処理を実行し、パス化されたベクトルデータを生成する。
一方、領域処理に必要なメモリ量が利用可能なメモリ量よりも多い場合、ステップS1207において、MFP100は、1つの文字オブジェクト領域を領域処理可能な領域に分割する。領域の分割は、所定の利用可能なメモリ量から領域処理可能な領域の大きさを算出し、その算出した領域の大きさに基づいて行われる。このとき、複数の文字が含まれるように分割していくようにする。
ステップS1208において、MFP100は、ステップS1207で分割された領域を部分的に解凍する。
ステップS1209において、MFP100は、文字輪郭生成処理(第2の文字輪郭生成処理)を行う。
ステップS1210において、MFP100は、ステップS1209で生成された文字輪郭に対して関数近似処理を実行し、パス化されたベクトルデータを生成する。
ステップS1211において、MFP100は、分割された全ての領域に対して上記の処理を実行したかどうかを判定する。
ステップS1212において、MFP100は、文字オブジェクト領域に対して上記の処理を実行したかどうかを判定する。
画質の向上に関しては図19に例を示した。
(他の実施形態)
本発明の実施形態には、記録媒体又はネットワークを介して、前述した本発明の機能を実現するコンピュータプログラムをシステム又は装置に供給し、そのシステム又は装置が備えるコンピュータがそのプログラムを実行することが含まれる。記録媒体はコンピュータ読み取り可能な記録媒体である。よって、実施例には、本発明の機能を実現するコンピュータプログラム自体も含まれる。コンピュータプログラムは、オブジェクトコード、インタープリタにより実行されるプログラム、OSに供給するスクリプトデータ等を含む。記録媒体は、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD等である。プログラムの供給方法としては、例えば、クライアントコンピュータのブラウザを用いてインターネットからハードディスク等の記録媒体にダウンロードする方法がある。この方法では、インターネットからコンピュータプログラムのファイル、又は、圧縮され自動インストール機能を含むファイルをダウンロードする。また、実施形態には、コンピュータプログラムを構成するプログラムコードを複数のファイルに分割し、各ファイルを異なるサーバからダウンロードすることが含まれる。また、実施形態には、コンピュータプログラムのファイルを複数のユーザに対してダウンロードさせるサーバも含まれる。
コンピュータが、コンピュータプログラムを実行することによって、前述した実施形態の機能が実現され得る。また、そのコンピュータプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行うことによっても、前述した実施形態の機能が実現され得る。
記録媒体から読み出されたコンピュータプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後においても前述した実施形態の機能が実現され得る。すなわち、コンピュータプログラムの指示に基づき、機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行うことによっても前述した実施形態の機能が実現され得る。
本発明の実施形態に係る画像処理システムの構成を示すブロック図である。 MFPの構成を示すブロック図である。 実施形態1に係る処理の流れを示すフローチャートである。 実施形態1に係る処理を模式的に表した図である。 実施形態1に係る文字輪郭生成処理を模式的に表した図である。 実施形態2に係る処理の流れを示すフローチャートである。 実施形態2に係る部分解凍処理の流れを示すフローチャートである。 実施形態2に係る部分解凍処理を説明するための図である。 実施形態3に係る一文字解凍処理の流れを示すフローチャートである。 実施形態3に係る一文字解凍処理を説明するための図である。 実施形態4に係る解凍処理の流れを示すフローチャートである。 実施形態5に係る解凍処理の流れを示すフローチャートである。 スキャナからの画像読み込みを示すフローチャートである。 オブジェクト分割領域情報を示す図である。 属性のブロック情報および入力ファイル情報を示す図である。 文書構造ツリー生成処理の対象となる文書の模式図である。 文書構造ツリー生成処理によって生成される文書構造ツリーを示す図である。 関数近似処理でベクトル化されたデータのフォーマットの一例を示す図である。 本実施形態を適用した効果を示す図である。
符号の説明
411 スキャン
412 入力画像処理
413 圧縮
414 スプール
415 解凍
416 解像度変換
404 オブジェクト分割
405 領域情報
406 文字情報
407 文字輪郭生成
409 関数近似
410 フォーマット化

Claims (20)

  1. 圧縮された高解像度の画像に対して解像度変換を行うことにより、低解像度の画像を生成する解像度変換手段と、
    前記低解像度の画像に対してオブジェクト分割を行うことにより、低解像度の文字オブジェクトの情報を得るオブジェクト分割手段と、
    前記圧縮された高解像度の画像を解凍する解凍手段と、
    前記オブジェクト分割手段で得た低解像度の文字オブジェクトの情報と前記解凍手段で解凍した高解像度の画像とを用いて、高解像度の文字輪郭を示す画像を生成する文字輪郭生成手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記オブジェクト分割手段で得られる前記低解像度の文字オブジェクトの情報は、文字画像を含むと判断された文字オブジェクト領域に含まれる文字の画素と背景の画素とを2値で示した低解像度の2値画像であり、
    前記文字輪郭生成手段は、前記低解像度の2値画像を用いて文字の画素が存在しうる画素を特定し、当該特定された各画素と前記解凍した高解像度の画像とを用いて前記高解像度の文字輪郭を示す画像を生成することを特徴とする請求項1に記載の画像処理装置。
  3. 前記文字輪郭生成手段は、前記特定された各画素と前記解凍した高解像度の画像とを用いて、前記特定された各画素の近傍における閾値を決定し、前記解凍した高解像度の画像の前記特定された各画素に対応する部分を当該決定された閾値を用いて2値化することにより、前記高解像度の文字輪郭を示す画像を生成することを特徴とする請求項2に記載の画像処理装置。
  4. 前記文字輪郭生成手段で生成された前記高解像度の文字輪郭を示す画像に基づいて、文字輪郭を関数近似する関数近似手段と、
    前記関数近似した結果をフォーマット化するフォーマット化手段と、
    を更に備えることを特徴とする請求項1乃至3のいずれかに記載の画像処理装置。
  5. 入力された高解像度の画像を圧縮することにより、前記圧縮された高解像度の画像を生成する圧縮手段と、
    前記圧縮された高解像度の画像をスプールするスプール手段と、を更に備え、
    前記解凍手段は、前記スプール手段にスプールされている前記圧縮された高解像度の画像を解凍することを特徴とする請求項1乃至4のいずれかに記載の画像処理装置。
  6. 前記文字輪郭生成手段は、前記高解像度の画像がカラー画像である場合、前記解凍手段で解凍した高解像度の画像を高解像度の輝度画像に変換し、前記オブジェクト分割手段で得た低解像度の文字オブジェクトの情報と前記高解像度の輝度画像とを用いて、高解像度の文字輪郭を示す画像を生成することを特徴とする請求項1乃至5のいずれかに記載の画像処理装置。
  7. 前記解凍手段は、前記文字オブジェクトの情報に基づいて、前記圧縮された高解像度の画像を部分的に解凍することを特徴とする請求項1乃至6のいずれかに記載の画像処理装置。
  8. 前記解凍手段は、前記圧縮された高解像度の画像のうち、複数の文字を含む文字オブジェクト領域に対応する部分を解凍することを特徴とする請求項7に記載の画像処理装置。
  9. 前記解凍手段は、前記圧縮された高解像度の画像のうち、1つの文字に対応する部分を解凍することを特徴とする請求項7に記載の画像処理装置。
  10. 前記解凍手段は、
    前記文字オブジェクトの情報に基づいて、文字オブジェクト領域を処理するのに必要なメモリ量が予め設定したメモリ量よりも少ないか否か判定し、
    少ないと判定した場合は、前記圧縮された高解像度の画像のうち、当該文字オブジェクト領域に対応する部分を解凍し、
    少なくないと判定した場合は、前記圧縮された高解像度の画像のうち、1つの文字に対応する部分を解凍することを特徴とする請求項7に記載の画像処理装置。
  11. 前記解凍手段は、
    前記文字オブジェクトの情報に基づいて、文字オブジェクト領域を処理するのに必要なメモリ量が予め設定したメモリ量よりも少ないか否か判定し、
    少ないと判定した場合は、前記圧縮された高解像度の画像のうち、当該文字オブジェクト領域に対応する部分を解凍し、
    少なくないと判定した場合は、前記文字オブジェクト領域を処理可能な大きさの領域に分割し、前記圧縮された高解像度の画像のうち、当該分割された領域に対応する部分を解凍することを特徴とする請求項7に記載の画像処理装置。
  12. 解像度変換手段が、圧縮された高解像度の画像に対して解像度変換を行うことにより、低解像度の画像を生成する解像度変換ステップと、
    オブジェクト分割手段が、前記低解像度の画像に対してオブジェクト分割を行うことにより、低解像度の文字オブジェクトの情報を得るオブジェクト分割ステップと、
    解凍手段が、前記圧縮された高解像度の画像を解凍する解凍ステップと、
    文字輪郭生成手段が、前記オブジェクト分割ステップで得た低解像度の文字オブジェクトの情報と前記解凍ステップで解凍した高解像度の画像とを用いて、高解像度の文字輪郭を示す画像を生成する文字輪郭生成ステップと、
    を備えることを特徴とする画像処理方法。
  13. コンピュータに、
    圧縮された高解像度の画像に対して解像度変換を行うことにより、低解像度の画像を生成する解像度変換ステップと、
    前記低解像度の画像に対してオブジェクト分割を行うことにより、低解像度の文字オブジェクトの情報を得るオブジェクト分割ステップと、
    前記圧縮された高解像度の画像を解凍する解凍ステップと、
    前記オブジェクト分割ステップで得た低解像度の文字オブジェクトの情報と前記解凍ステップで解凍した高解像度の画像とを用いて、高解像度の文字輪郭を示す画像を生成する文字輪郭生成ステップと、
    を実行させるための、コンピュータプログラム。
  14. 前記オブジェクト分割ステップで得られる前記低解像度の文字オブジェクトの情報は、文字画像を含むと判断された文字オブジェクト領域に含まれる文字の画素と背景の画素とを2値で示した低解像度の2値画像であり、
    前記文字輪郭生成ステップでは、前記低解像度の2値画像を用いて文字の画素が存在しうる画素を特定し、当該特定された各画素と前記解凍した高解像度の画像とを用いて前記高解像度の文字輪郭を示す画像を生成することを特徴とする請求項13に記載のコンピュータプログラム。
  15. 前記文字輪郭生成ステップでは、前記特定された各画素と前記解凍した高解像度の画像とを用いて、前記特定された各画素の近傍における閾値を決定し、前記解凍した高解像度の画像の前記特定された各画素に対応する部分を当該決定された閾値を用いて2値化することにより、前記高解像度の文字輪郭を示す画像を生成することを特徴とする請求項14に記載のコンピュータプログラム。
  16. 前記文字輪郭生成ステップで生成された前記高解像度の文字輪郭を示す画像に基づいて、文字輪郭を関数近似する関数近似ステップと、
    前記関数近似した結果をフォーマット化するフォーマット化ステップと、
    を前記コンピュータに更に実行させることを特徴とする請求項13乃至15のいずれかに記載のコンピュータプログラム。
  17. 入力された高解像度の画像を圧縮することにより、前記圧縮された高解像度の画像を生成する圧縮ステップと、
    前記圧縮された高解像度の画像をスプールするスプールステップと、を前記コンピュータに更に実行させ、
    前記解凍ステップでは、前記スプールステップでスプールされている前記圧縮された高解像度の画像を解凍することを特徴とする請求項13乃至16のいずれかに記載のコンピュータプログラム。
  18. 前記文字輪郭生成ステップでは、前記高解像度の画像がカラー画像である場合、前記解凍ステップで解凍した高解像度の画像を高解像度の輝度画像に変換し、前記オブジェクト分割ステップで得た低解像度の文字オブジェクトの情報と前記高解像度の輝度画像とを用いて、高解像度の文字輪郭を示す画像を生成することを特徴とする請求項13乃至17のいずれかに記載のコンピュータプログラム。
  19. 前記解凍ステップでは、前記文字オブジェクトの情報に基づいて、前記圧縮された高解像度の画像を部分的に解凍することを特徴とする請求項13乃至18のいずれかに記載のコンピュータプログラム。
  20. 請求項13乃至19のいずれか1項に記載のコンピュータプログラムを記録した、コンピュータ読み取り可能な記録媒体。
JP2008239804A 2008-09-18 2008-09-18 画像処理装置 Active JP5137759B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008239804A JP5137759B2 (ja) 2008-09-18 2008-09-18 画像処理装置
US12/554,766 US20100067023A1 (en) 2008-09-18 2009-09-04 Image processing apparatus, image processing method and program
US14/296,290 US10477063B2 (en) 2008-09-18 2014-06-04 Character detection and binarization

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008239804A JP5137759B2 (ja) 2008-09-18 2008-09-18 画像処理装置

Publications (3)

Publication Number Publication Date
JP2010074540A true JP2010074540A (ja) 2010-04-02
JP2010074540A5 JP2010074540A5 (ja) 2011-11-04
JP5137759B2 JP5137759B2 (ja) 2013-02-06

Family

ID=42006946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008239804A Active JP5137759B2 (ja) 2008-09-18 2008-09-18 画像処理装置

Country Status (2)

Country Link
US (2) US20100067023A1 (ja)
JP (1) JP5137759B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014107683A (ja) * 2012-11-27 2014-06-09 Kyocera Document Solutions Inc 画像処理装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5703769B2 (ja) * 2011-01-19 2015-04-22 ソニー株式会社 画像変換装置、画像変換方法、プログラム、および電子機器
JP6152310B2 (ja) * 2013-06-28 2017-06-21 理想科学工業株式会社 画像形成装置
CN103942552B (zh) * 2014-02-11 2017-02-08 北京大学 一种基于骨架指导的文字图像矢量化方法及系统
CN105338360B (zh) * 2014-06-25 2019-02-15 优视科技有限公司 图像解码方法及装置
JP6525641B2 (ja) * 2015-03-02 2019-06-05 キヤノン株式会社 情報処理システム、制御方法、およびコンピュータプログラム
US9965695B1 (en) * 2016-12-30 2018-05-08 Konica Minolta Laboratory U.S.A., Inc. Document image binarization method based on content type separation
JP7030462B2 (ja) * 2017-09-21 2022-03-07 キヤノン株式会社 スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム
JP7185451B2 (ja) * 2018-09-10 2022-12-07 キヤノン株式会社 画像処理装置と画像処理方法、及びプログラム
CN109767741B (zh) * 2019-03-26 2021-07-23 上海天马微电子有限公司 一种显示面板的显示方法及显示装置
CN110334760B (zh) * 2019-07-01 2021-06-08 成都数之联科技有限公司 一种基于resUnet的光学元器件损伤检测方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01130957A (ja) * 1987-11-18 1989-05-23 Hitachi Ltd 文字制御装置
JPH09251291A (ja) * 1996-03-18 1997-09-22 Hitachi Inf Syst Ltd ベクトル・フォント生成方法
JP2000184219A (ja) * 1998-12-15 2000-06-30 Seiko Epson Corp カラー印刷システム及びカラープリンタ
JP2001051670A (ja) * 1999-05-28 2001-02-23 Fluency Kenkyusho:Kk 文字データ作成装置、文字データ作成方法及び記憶媒体
JP2003072161A (ja) * 2001-08-31 2003-03-12 Canon Inc 印刷制御装置および印刷制御方法および記憶媒体およびプログラム
JP2004229095A (ja) * 2003-01-24 2004-08-12 Ricoh Co Ltd 画像処理装置、プログラムおよび記憶媒体
JP2008108178A (ja) * 2006-10-27 2008-05-08 Nobuhiko Ido webページに利用する文字輪郭情報の作成方法、および、利用方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5182657A (en) * 1989-04-27 1993-01-26 Casio Computer Co., Ltd. Image processing apparatus including binary data producing unit
JPH0491966A (ja) * 1990-08-08 1992-03-25 Canon Inc 印刷装置
JP2705744B2 (ja) * 1992-11-13 1998-01-28 富士ゼロックス株式会社 画像符号化装置及び復号装置
US5956468A (en) * 1996-07-12 1999-09-21 Seiko Epson Corporation Document segmentation system
JPH1130957A (ja) 1997-07-11 1999-02-02 Lintec Corp 封印シール
JP2000003445A (ja) * 1998-06-15 2000-01-07 Toshiba Corp 情報抽出方法および情報抽出装置および記録媒体
US6873436B1 (en) 2000-09-05 2005-03-29 Fuji Xerox Co., Ltd. Image processing device and recording medium
US6944357B2 (en) * 2001-05-24 2005-09-13 Microsoft Corporation System and process for automatically determining optimal image compression methods for reducing file size
JP2004086810A (ja) * 2002-08-29 2004-03-18 Fuji Xerox Co Ltd 画像形成システム、バックエンドプロセッサ
JP4646797B2 (ja) * 2005-02-01 2011-03-09 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP4878209B2 (ja) * 2006-05-15 2012-02-15 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP4829835B2 (ja) * 2006-06-12 2011-12-07 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータ読み取り可能な記憶媒体

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01130957A (ja) * 1987-11-18 1989-05-23 Hitachi Ltd 文字制御装置
JPH09251291A (ja) * 1996-03-18 1997-09-22 Hitachi Inf Syst Ltd ベクトル・フォント生成方法
JP2000184219A (ja) * 1998-12-15 2000-06-30 Seiko Epson Corp カラー印刷システム及びカラープリンタ
JP2001051670A (ja) * 1999-05-28 2001-02-23 Fluency Kenkyusho:Kk 文字データ作成装置、文字データ作成方法及び記憶媒体
JP2003072161A (ja) * 2001-08-31 2003-03-12 Canon Inc 印刷制御装置および印刷制御方法および記憶媒体およびプログラム
JP2004229095A (ja) * 2003-01-24 2004-08-12 Ricoh Co Ltd 画像処理装置、プログラムおよび記憶媒体
JP2008108178A (ja) * 2006-10-27 2008-05-08 Nobuhiko Ido webページに利用する文字輪郭情報の作成方法、および、利用方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014107683A (ja) * 2012-11-27 2014-06-09 Kyocera Document Solutions Inc 画像処理装置
US9165205B2 (en) 2012-11-27 2015-10-20 Kyocera Document Solutions Inc. Image processing device generating character image and background image on the basis of connected pixel group

Also Published As

Publication number Publication date
JP5137759B2 (ja) 2013-02-06
US10477063B2 (en) 2019-11-12
US20140285824A1 (en) 2014-09-25
US20100067023A1 (en) 2010-03-18

Similar Documents

Publication Publication Date Title
JP5137759B2 (ja) 画像処理装置
JP5180670B2 (ja) 画像処理装置及び画像処理方法
US7551753B2 (en) Image processing apparatus and method therefor
US7860266B2 (en) Image processing system and image processing method
US8320019B2 (en) Image processing apparatus, image processing method, and computer program thereof
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
EP2264995B1 (en) Image processing apparatus, image processing method, and computer program
US8384936B2 (en) System which performs resolution-dependent vectorization of print data
US8384964B2 (en) Image processing apparatus and image processing method
JP4217575B2 (ja) 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
JP5893379B2 (ja) 画像圧縮装置、画像圧縮方法、コンピュータプログラム
US20100329551A1 (en) Image processing apparatus and image processing method
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2012105015A (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2009296150A (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
US8270722B2 (en) Image processing with preferential vectorization of character and graphic regions
JP2006345314A (ja) 画像処理装置および画像処理方法
JP2007129557A (ja) 画像処理システム
JP7301529B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7185451B2 (ja) 画像処理装置と画像処理方法、及びプログラム
JP6413783B2 (ja) 印刷指示装置、印刷システムおよびプログラム
JP5315637B2 (ja) 画像処理装置、原稿電子化システムおよびプログラム
JP4900149B2 (ja) 画像処理装置及び画像処理プログラム
JP2008152353A (ja) 画像処理装置
JP2015065596A (ja) 画像処理装置、画像処理方法、およびプログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20101106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110916

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120724

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121016

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121113

R151 Written notification of patent or utility model registration

Ref document number: 5137759

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151122

Year of fee payment: 3