JP5612851B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP5612851B2
JP5612851B2 JP2009291789A JP2009291789A JP5612851B2 JP 5612851 B2 JP5612851 B2 JP 5612851B2 JP 2009291789 A JP2009291789 A JP 2009291789A JP 2009291789 A JP2009291789 A JP 2009291789A JP 5612851 B2 JP5612851 B2 JP 5612851B2
Authority
JP
Japan
Prior art keywords
image
information processing
processing apparatus
compression
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009291789A
Other languages
English (en)
Other versions
JP2011134035A5 (ja
JP2011134035A (ja
Inventor
岩内 伸之
伸之 岩内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2009291789A priority Critical patent/JP5612851B2/ja
Publication of JP2011134035A publication Critical patent/JP2011134035A/ja
Publication of JP2011134035A5 publication Critical patent/JP2011134035A5/ja
Application granted granted Critical
Publication of JP5612851B2 publication Critical patent/JP5612851B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ファイルを作成する情報処理装置、情報処理方法、およびプログラムに関する。
従来、文字が複数の色で表現されている場合でも、効率良く、入力画像データに対して忠実に圧縮する画像処理装置が知られている。
一般的に、高圧縮PDF(以下、「PDF」という)は、ファイルサイズを圧縮する技術として知られている。なお、上記PDFは、Portable Document Formatの略である。
また、PDF化を行う際に、PDFの実体とは別に、サムネイルデータ、実体のポインタ(URI等)を格納し、文書を効率よく管理するデータ管理装置が知られている(たとえば、特許文献1参照)。
特開2004−355470号公報
文字が複数の色で表現されている場合でも、効率良く、入力画像データに対して忠実に圧縮する上記画像処理装置は、出力データに対し、多数の圧縮データを含み、入力データによっては、画像展開処理に時間がかかるという問題がある。
また、特許文献1に記載の発明では、PDFファイルとサムネイルとが一体ではないので、PDFファイルとサムネイルデータとの管理が困難であるという問題がある。
本発明は、文字を含む画像に対応するファイルを適切に作成することができる情報処理装置、情報処理方法、およびプログラムを提供することを目的とする。
本発明の情報処理装置は、処理対象の画像に含まれている文字に対応するデータを可逆圧縮形式の圧縮方法で圧縮する第1の圧縮手段と、上記処理対象の画像から上記文字が除かれた画像に対応する画像データをJPEG形式の圧縮方法で圧縮する第2の圧縮手段と、上記処理対象の画像を縮小し、且つ当該縮小により得られた縮小画像の画像データをJPEG形式の圧縮方法で圧縮する縮小手段と、上記第1の圧縮手段により圧縮された上記文字に対応する上記データと、上記第2の圧縮手段により圧縮された上記画像データと、上記縮小手段により圧縮された上記縮小画像の画像データとを含むファイルを作成する作成手段とを有することを特徴とする。
本発明によれば、文字を含む画像に対応するファイルを適切に作成することができる。
本発明の実施例である画像処理装置10の構成を示す図である。 画像処理装置10を示すブロック図である。 画像処理装置10の動作を示すフローチャートである。 生成されたPDFファイルのPDF文書構成の一例を示す図である。
発明を実施するための形態は、次の実施例である。
図1は、本発明の実施例の一例である画像処理装置10の構成を示す図である。
画像処理装置10は、CPU11と、UI12と、ROM13と、RAM14と、スキャナエンジン15と、外部記憶装置16とを有する。
CPU11は、画像処理装置10の全体の動作を制御する。CPU11は、ROM13に格納されているプログラムであって、図3に示すフローチャートに対応するプログラムをRAM14にロードし、そのプログラムを実行する。なお、これらのプログラムによらずに、その一部または全部をハードウェアによって実現するようにしてもよい。
ROM13は、RAM14に展開されているプログラムと、起動時に動作するブートプログラム等を記憶している。RAM14は、OS(Operating System)やプログラムや画像情報等が展開される記憶装置である。スキャナエンジン15は、原稿を読み込み、入力画像データを生成する。外部記憶装置16は、スキャナエンジン15が生成した画像データを保存する記憶装置である。UI12は、ユーザインタフェースであり、ユーザが画像処理装置10を操作し、情報を入力し、外部記憶装置に記憶された画像を表示する際に用いられる。
図2は、画像処理装置10を示すブロック図である。
2値化部101は、RGBのヒストグラムから、入力画像データを2値化する。画像解像度変換部102は、絵柄データの画質劣化が起こらない程度に、入力画像データについて解像度変換する。
文字領域判断部103は、2値化部101が生成した2値データと、画像解像度変換部102が生成した画像データとに基づいて、文字領域を抽出する。文字領域判断部103は、文字領域を抽出し、文字領域の画像の座標、色を抽出し、文字領域座標108、文字色109の情報を得る。また、文字領域判断部103は、文字を抽出する際に、抽出した文字領域について、部分的に2値画像である部分2値画像104を生成する。この部分2値画像104は、入力画像データについて、複数生成されることもある。
絵柄画像105は、画像解像度変換部102が生成した画像データから、部分2値画像104が抽出した文字領域の画像を抜き出した残りの絵柄画像、つまり、文字領域の画像が除かれた絵柄画像である。MMR圧縮部106は、文字領域の画像である部分2値画像104を情報圧縮し、第1圧縮コード110を生成する。JPEG圧縮部107は、絵柄画像105を情報圧縮し、第2圧縮コード111を生成する。なお、第1圧縮コード110を第1の圧縮データともいい、第2圧縮コード111を第2の圧縮データともいう。
さらに、入力画像データに対し、画像解像度変換部102が生成した画像を、縮小部112が縮小し、JPEG圧縮部113が情報圧縮し、サムネイルデータとなる第3圧縮コード114を生成する。なお、第3圧縮コード114を第3の圧縮データともいう。
最終的に、文字領域座標108、文字色109、第1圧縮コード110、第2圧縮コード111、第3圧縮コード114のデータを、PDFとして結合し、1ページの原稿である高圧縮PDFファイル115を生成する。
次に、画像処理装置10の処理の流れについて説明する。
図3は、画像処理装置10の動作を示すフローチャートである。まず、ステップS201で、入力画像データを取得する。この入力画像データは、スキャナエンジン15が取得した数ラインの画像データでもよく、1ページ全体の画像データでもよい。
ステップS202で、2値化部101が、入力画像データを処理し、2値画像を生成する。これと同時に、画像解像度変換部102が、画像解像度を変換して多値画像を生成する。ステップS203では、ステップS202で作成された2値画像、多値画像から文字領域を抽出し、文字が置かれている文字領域座標、文字色を判定し、文字領域座標108、文字色109を記憶装置内に記憶する。また、抽出した文字領域の画像を、MMR圧縮部106が情報圧縮し、第1圧縮コード110を生成する。文字以外の画像である絵柄画像を、JPEG圧縮部107が情報圧縮し、第2圧縮コード111を生成する。
そして、1ページ全体の画像生成が完了した後に、ステップS204で、入力画像データが、特定の入力画像データであるか否かを判断する。特定の入力画像データであれば、ステップS205で、特定の入力画像データを縮小し、縮小画像データを生成し、特定の入力画像データに、上記第3の圧縮データを付加する。この生成された縮小画像データは、ページ全体のサムネイル画像である。
上記特定の入力画像データは、図4に示す1ページ目301である。また、上記特定の入力画像データは、図4に示す2ページ目302でも、3ページ目303でも、4ページ目以降であってもよい。さらには、入力画像データを判断し、この判断結果に応じて、特定の入力画像データを決定するようにしてもよく、ユーザが指定した入力画像データを、特定の入力画像データとしてもよい。
ステップS206では、ステップS205で縮小された画像データを、JPEG圧縮部113が圧縮し、第3圧縮コード114を生成する。ステップS207では、S206で生成された第3圧縮コード114と、領域座標と文字色とからなる文字情報とを、PDFファイルとして保存する。
図4は、画像処理装置10において、生成されたPDFファイルのPDF文書構成の一例を示す図である。PDFファイルは、大別すると、ヘッダ311と、カタログ312と、複数のオブジェクト313、314、316と、サムネイル画像315と、トレーラー317とを含む。
ヘッダ311は、PDF文書を特定するためのキーとなるヘッダ情報を含み、“%PDF−1.4”のような文字列を含んでいる。カタログ312は、文書の目次に相当するものであり、ファイル中、全ての間接オブジェクトのファイル内位置を、格納されている相互参照テーブル(「Xrefテーブル」と呼ぶ)として定義されている。
オブジェクト313、314、316は、文書に含まれている複数の部分2値画像、絵柄画像等の描画オブジェクトや、PDFファイル全体の木構造の根にあたるCatalogオブジェクト、アウトライン目次に出てくるページの木構造を含む。また、各ページへのポインタを作るPagesオブジェクト、描画される個別のページを記述したPageオブジェクト等を含む。たとえば、電子文書の中に画像データが含まれている場合、画像データ及び、データサイズ、幅、高さ、描画位置などの情報を持つ。
トレーラー317は、Xrefテーブルのテーブルの要素数や、相互参照テーブルの開始アドレスを規定する。
本文書構成の一例では、1ページ目301が空白であり、2ページ目302、3ページ目303に文書が書かれている。この場合、1ページ目301のサムネイル画像を作成したとしても、PDFファイルの中身を知ることはできない。そこで、代表するページを2ページ目302とし、2ページ目302のサムネイル画像315を作成し、この作成されたサムネイル画像315をPDFファイル内に埋め込む。ページのサムネイル画像は、PageオブジェクトにThumbエントリを登録することによって、ページに対して、サムネイル画像を定義することができる。
上記実施例によれば、プレビュー表示時に、PDFファイル内の最初に検出されるサムネイル画像を取得すれば足りるので、サムネイルを含んだPDFファイルであれば、ファイル内を全て解析する必要がない。また、本画像を形成する場合には、ページに含まれている文字領域座標108と文字色109と第1圧縮コード110と第2圧縮コード111とを合成する必要がある。しかし、サムネイル画像をプレビュー表示する場合には、サムネイルデータとしての第3圧縮コード114に対して復号処理を行うことでサムネイル画像の画像データを取得できるため、上記のような合成を行う必要がない。したがって、プレビュー表示の際にはサムネイル画像を表示させることで処理時間を短縮することができる。
上記のように、上記実施例では、多値画像を圧縮してPDF化する際に、文字領域の画像、絵柄画像、入力画像の縮小データをそれぞれ圧縮し、それぞれを、第1の圧縮データ、第2の圧縮データ、第3の圧縮データとする。そして、これら第1の圧縮データ、第2の圧縮データ、第3の圧縮データと上記文字領域の位置の情報とを合成し、PDFデータを作成する。したがって、上記実施例では、文字領域の画像、絵柄画像の各ファイルとサムネイル(第3の圧縮データ)とが一体であるので、文字領域の画像、絵柄画像の各ファイルとサムネイルの管理が容易である。
また、入力画像データから、文字領域の画像と、上記入力画像データにおける文字領域の位置とを検出する処理は、上記実施例に限定されるものではなく、種々の方法を採用すればよい。上記検出処理を、上記のように画像処理装置10自体が実行するようにしてもよい。そして、画像処理装置10の外部に設けられている外部装置が、入力画像データから、文字領域の画像と、上記入力画像データにおける文字領域の位置とを検出し、この検出結果を、ネットワーク等を介して、画像処理装置10が受信するようにしてもよい。
これと同様に、入力画像データから文字領域を切り抜く処理を、上記のように画像処理装置10自体が実行するようにしてもよい。また、画像処理装置10の外部に設けられている外部装置が、入力画像データから文字領域を切り抜く処理を実行し、この切り抜かれた文字領域の画像を、ネットワーク等を介して、画像処理装置10が受信するようにしてもよい。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上記実施例の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。また、上記プログラムを、1つのコンピュータが実行してもよく、また、複数のコンピュータが連動して実行してもよい。さらに、上記処理の全てをソフトウェアで実現する必要はなく、一部または全部をハードウェアによって実現するようにしてもよい。
10…画像処理装置、
11…CPU、
13…ROM、
14…RAM。

Claims (12)

  1. 処理対象の画像に含まれている文字に対応するデータを可逆圧縮形式の圧縮方法で圧縮する第1の圧縮手段と;
    上記処理対象の画像から上記文字が除かれた画像に対応する画像データをJPEG形式の圧縮方法で圧縮する第2の圧縮手段と;
    上記処理対象の画像を縮小し、且つ当該縮小により得られた縮小画像の画像データをJPEG形式の圧縮方法で圧縮する縮小手段と;
    上記第1の圧縮手段により圧縮された上記文字に対応する上記データと、上記第2の圧縮手段により圧縮された上記画像データと、上記縮小手段により圧縮された上記縮小画像の画像データとを含むファイルを作成する作成手段と;
    を有することを特徴とする情報処理装置。
  2. 上記作成手段は、上記処理対象の画像における上記文字に対応する一部分を特定するための情報を更に含む上記ファイルを作成することを特徴とする請求項1に記載の情報処理装置。
  3. 上記第1の圧縮手段は、上記文字の内容を示すデータを圧縮し、上記作成手段は、圧縮された当該文字の内容を示すデータと当該文字の色を示すデータを、上記文字に対応するデータとして含むファイルを作成することを特徴とする請求項1または2に記載の情報処理装置。
  4. 上記縮小手段は、処理対象の複数の画像のうち、特定の画像を縮小し且つ上記JPEG形式の圧縮方法で圧縮し、上記作成手段は、当該縮小された特定の画像を含む上記ファイルを作成することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 上記作成手段は、処理対象の複数の画像を複数ページの画像として含むファイルを作成し、上記特定の画像は、当該複数ページのうちの1ページ目の画像であることを特徴とする請求項4に記載の情報処理装置。
  6. 上記作成手段は、処理対象の複数の画像を複数ページの画像として含むファイルを作成し、上記縮小手段は、当該複数ページの画像の内容に基づき当該複数ページから特定されたページに対応する画像を、上記特定の画像として縮小することを特徴とする請求項4に記載の情報処理装置。
  7. 上記作成手段は、処理対象の複数の画像を複数ページの画像として含むファイルを作成し、上記縮小手段は、当該複数ページからユーザにより指定されたページに対応する画像を、上記特定の画像として縮小することを特徴とする請求項4に記載の情報処理装置。
  8. 上記可逆圧縮形式の圧縮方法は2値化された画像を圧縮する圧縮方法であることを特徴とする請求項1乃至のいずれか1項に記載の情報処理装置。
  9. 原稿を読み取る読取手段を有し、
    上記処理対象の画像は、上記読取手段が原稿を読み取ることで得られた読取画像であることを特徴とする請求項1乃至8のいずれか1項に記載の情報処理装置。
  10. 上記作成手段は、PDFファイルを作成することを特徴とする請求項1乃至9のいずれか1項に記載の情報処理装置。
  11. 処理対象の画像に含まれている文字に対応するデータを可逆圧縮形式の圧縮方法で圧縮し、
    上記処理対象の画像から上記文字が除かれた画像に対応する画像データをJPEG形式の圧縮方法で圧縮し、
    上記処理対象の画像を縮小し、且つ当該縮小により得られた縮小画像の画像データをJPEG形式の圧縮方法で圧縮し、
    上記可逆圧縮形式の圧縮方法により圧縮された上記文字に対応する上記データと、上記JPEG形式の圧縮方法により圧縮された上記画像データと、上記JPEG形式の圧縮方法により圧縮された上記縮小画像の画像データとを含むファイルを作成することを特徴とする情報処理方法
  12. 請求項11に記載の情報処理方法を、コンピュータにより実行させることを特徴とするプログラム。
JP2009291789A 2009-12-24 2009-12-24 情報処理装置、情報処理方法、およびプログラム Active JP5612851B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009291789A JP5612851B2 (ja) 2009-12-24 2009-12-24 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009291789A JP5612851B2 (ja) 2009-12-24 2009-12-24 情報処理装置、情報処理方法、およびプログラム

Publications (3)

Publication Number Publication Date
JP2011134035A JP2011134035A (ja) 2011-07-07
JP2011134035A5 JP2011134035A5 (ja) 2013-02-14
JP5612851B2 true JP5612851B2 (ja) 2014-10-22

Family

ID=44346710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009291789A Active JP5612851B2 (ja) 2009-12-24 2009-12-24 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5612851B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109582654B (zh) * 2018-11-30 2021-09-03 万兴科技股份有限公司 Pdf文档压缩方法、装置、计算机设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000268163A (ja) * 1999-03-19 2000-09-29 Pfu Ltd 画像処理装置および記録媒体
JP2004334340A (ja) * 2003-04-30 2004-11-25 Canon Inc 画像処理方法及び装置
JP4708888B2 (ja) * 2005-07-12 2011-06-22 キヤノン株式会社 画像処理装置、画像処理方法及びコンピュータプログラム
JP2009140311A (ja) * 2007-12-07 2009-06-25 Konica Minolta Business Technologies Inc 文書処理装置および文書処理方法

Also Published As

Publication number Publication date
JP2011134035A (ja) 2011-07-07

Similar Documents

Publication Publication Date Title
JP5274305B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4817821B2 (ja) 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2004265384A5 (ja)
US9247099B2 (en) Image file editing apparatus and method, and program
JP2007074030A (ja) 画像処理装置及び方法
US20160092407A1 (en) Document processing using multiple processing threads
JP4708888B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP2006155381A5 (ja)
JP2010056827A (ja) 画像処理装置および画像処理プログラム
JP5893379B2 (ja) 画像圧縮装置、画像圧縮方法、コンピュータプログラム
JP6708476B2 (ja) 文書保存処理システム
JP2003244447A (ja) 画像処理装置及び画像処理方法
JP2010146218A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2010125778A (ja) 印刷装置及びプログラム
JP2006262442A (ja) 画像編集装置と画像編集方法
JP5612851B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2010125779A (ja) 印刷装置及びプログラム
JP2008042345A (ja) 画像処理方法、画像処理装置
JP6397183B2 (ja) 画像処理装置及び方法とプログラム
US9361852B2 (en) Media reproduction device
JP2008206073A (ja) 画像処理装置、制御方法、プログラム、及び記憶媒体
JP2004258861A (ja) 情報処理方法
JP2005316813A (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
JP5979950B2 (ja) 画像処理装置及びその制御方法、並びにプログラム
JP2003338934A (ja) 画像処理装置および方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121225

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131227

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140905

R151 Written notification of patent or utility model registration

Ref document number: 5612851

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D03