JP4860558B2 - Encoding apparatus and encoding method - Google Patents
Encoding apparatus and encoding method Download PDFInfo
- Publication number
- JP4860558B2 JP4860558B2 JP2007166300A JP2007166300A JP4860558B2 JP 4860558 B2 JP4860558 B2 JP 4860558B2 JP 2007166300 A JP2007166300 A JP 2007166300A JP 2007166300 A JP2007166300 A JP 2007166300A JP 4860558 B2 JP4860558 B2 JP 4860558B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- encoding
- mask
- foreground
- background
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は、画像を符号化して構造化文書を生成する符号化装置及び符号化方法に関する。 The present invention relates to an encoding apparatus and an encoding method for generating a structured document by encoding an image.
従来より、文字や絵柄が混在する文書(絵柄混在文書)などの画像を符号化する技術がある。このような絵柄混在文書を高圧縮率で符号化するために、符号化した画像を構造化文書として形成する技術がある(例えば、特許文献1〜2参照)。構造化文書とは、絵柄混在文書を画像成分分析して絵柄部分とエッジ部分とに分離し、例えば、絵柄部分を表す画像を背景とし、エッジ部分を表す画像をマスクとし、エッジの色を表す画像を前景とし、これらを各々独立して符号化して符号データを作成した後、これらの各符号データを1つのファイルフォーマットに組み立てたものである。このような符号化方式によって絵柄混在文書を符号化して構造化文書を生成すれば、高圧縮率で符号化したときに、絵柄混在文書を1つの多値画像として符号化する符号化方式に比べてより高画質を提供できる。 2. Description of the Related Art Conventionally, there is a technique for encoding an image such as a document in which characters and pictures are mixed (picture mixed document). In order to encode such a picture mixed document at a high compression rate, there is a technique for forming an encoded image as a structured document (see, for example, Patent Documents 1 and 2). A structured document is an image component analysis of a mixed pattern document and separated into a pattern portion and an edge portion. For example, an image representing a pattern portion is used as a background, an image representing an edge portion is used as a mask, and an edge color is represented. An image is used as a foreground, and these are independently encoded to generate code data, and then each of these code data is assembled into one file format. If a structured document is generated by encoding a mixed picture document using such an encoding method, compared to an encoding method that encodes a mixed picture document as one multi-valued image when encoded at a high compression rate. Can provide higher image quality.
しかしながら、特許文献1に示されるような従来の技術においては、エッジ部分と絵柄部分とを分離するためにかなりの処理時間が掛かっていた。 However, in the conventional technique as shown in Patent Document 1, it takes a considerable amount of processing time to separate the edge portion and the pattern portion.
本発明は、上記に鑑みてなされたものであって、高画質な構造化文書の生成に掛かる処理時間を低減可能な符号化装置及び符号化方法を提供することを目的とする。 The present invention has been made in view of the above, and an object of the present invention is to provide an encoding apparatus and an encoding method capable of reducing the processing time required to generate a high-quality structured document.
上述した課題を解決し、目的を達成するために、請求項1にかかる発明は、入力画像を符号化して、前景、背景及びマスクから構成される構造化文書を生成する符号化装置であって、前記前景として第1多値画像を割り当て、前記背景として第2多値画像を割り当て、前記マスクとして2値画像を割り当て、前記前景、前記背景及び前記マスクを各々符号化する符号化手段と、前記符号化手段が符号化した前記前景、前記背景及び前記マスクを所定のファイルフォーマットに従って組み立てて構造化文書を生成する組立手段とを備え、前記符号化手段は、前記第1多値画像として任意の画像を多値符号化方式により符号化する第1符号化手段と、前記第2多値画像として前記入力画像を多値符号化方式により符号化する第2符号化手段と、前記2値画像として白色を表す画像を2値画像符号化方式により符号化する第3符号化手段とを有することを特徴とする。 In order to solve the above-described problems and achieve the object, the invention according to claim 1 is an encoding device that encodes an input image and generates a structured document including a foreground, a background, and a mask. Assigning a first multi-valued image as the foreground, assigning a second multi-valued image as the background, assigning a binary image as the mask, and encoding the foreground, the background and the mask, respectively, An assembling unit that generates the structured document by assembling the foreground, the background, and the mask encoded by the encoding unit according to a predetermined file format, and the encoding unit is arbitrarily configured as the first multi-valued image. First encoding means for encoding the image of the input image by a multi-level encoding system, second encoding means for encoding the input image as the second multi-level image by a multi-level encoding system, And having a third coding means for coding the binary image encoding scheme an image representing white as a binary image.
請求項2にかかる発明は、請求項1にかかる発明において、前記第1符号化手段は、前記第1多値画像として白色を表す画像を多値符号化方式により符号化することを特徴とする。 The invention according to claim 2 is the invention according to claim 1, wherein the first encoding means encodes an image representing white as the first multi-value image by a multi-value encoding method. .
請求項3にかかる発明は、入力画像を符号化して、前景、背景及びマスクから構成される構造化文書を生成する符号化装置であって、前記前景として第1多値画像を割り当て、前記背景として第2多値画像を割り当て、前記マスクとして2値画像を割り当て、前記前景、前記背景及び前記マスクを各々符号化する符号化手段と、前記符号化手段が符号化した前記前景、前記背景及び前記マスクを所定のファイルフォーマットにより組み立てて構造化文書を生成する組立手段とを備え、前記符号化手段は、前記第1多値画像として前記入力画像を多値符号化方式により符号化する第1符号化手段と、前記第2多値画像として任意の画像を多値符号化方式により符号化する第2符号化手段と、前記2値画像として黒色を表す画像を2値画像符号化方式により符号化する第3符号化手段とを有することを特徴とする。 The invention according to claim 3 is an encoding device that encodes an input image to generate a structured document including a foreground, a background, and a mask, and assigns a first multi-valued image as the foreground, and the background Assigning a second multi-valued image as the mask, assigning a binary image as the mask, encoding the foreground, the background and the mask, respectively, and the foreground, the background and the encoding encoded by the encoding means Assembly means for generating a structured document by assembling the mask according to a predetermined file format, wherein the encoding means encodes the input image as the first multi-value image by a multi-value encoding method. Encoding means; second encoding means for encoding an arbitrary image as the second multi-value image by a multi-value encoding method; and binary image encoding for an image representing black as the binary image And having a third coding means for coding the equation.
請求項4にかかる発明は、入力画像を符号化して、前景、背景及びマスクから構成される構造化文書を生成する符号化装置であって、前記背景として前記入力画像を多値画像符号化方式により符号化する符号化手段と、前記符号化手段が符号化した前記背景と、任意の画像が多値符号化方式により予め符号化されて第1記憶手段に記憶された符号化済前景と、白色を表す画像が2値符号化方式により予め符号化されて第2記憶手段に記憶された符号化済マスクとを所定のファイルフォーマットにより組み立てて構造化文書を生成する組立手段とを備えることを特徴とする。 The invention according to claim 4 is an encoding device that encodes an input image to generate a structured document composed of a foreground, a background, and a mask, wherein the input image is a multi-valued image encoding method as the background. Encoding means for encoding according to the above, the background encoded by the encoding means, an encoded foreground in which an arbitrary image is encoded in advance by a multi-level encoding method and stored in the first storage means, Assembly means for generating a structured document by assembling an encoded mask stored in the second storage means in advance in accordance with a binary encoding method and an encoded mask stored in the second storage means. Features.
請求項5にかかる発明は、請求項1又は請求項2にかかる発明において、前記第1符号化手段は、前記第1多値画像を構成する画素の値が全て0となるよう、又は当該第1多値画像を伸張したときの伸張画像を構成する画素の値が全て0となるよう、当該第1多値画像を多値符号化方式により符号化することを特徴とする。 According to a fifth aspect of the present invention, in the first or second aspect of the invention, the first encoding means is configured such that all the values of the pixels constituting the first multi-valued image are 0, or the first The first multi-valued image is encoded by a multi-level encoding method so that all the values of the pixels constituting the expanded image when the one multi-valued image is expanded are 0.
請求項6にかかる発明は、請求項1にかかる発明において、前記第3符号化手段は、前記2値画像を構成する画素の値が全て0となるよう、又は当該2値画像を伸張したときの伸張画像を構成する画素の値が全て0となるよう、当該2値画像を2値符号化方式により符号化することを特徴とする。 According to a sixth aspect of the present invention, in the first aspect of the invention, the third encoding means is configured such that all the values of the pixels constituting the binary image are 0 or the binary image is expanded. The binary image is encoded by a binary encoding method so that all the values of the pixels constituting the expanded image are 0.
請求項7にかかる発明は、請求項3にかかる発明において、前記第3符号化手段は、前記2値画像を構成する画素の値が全て1となるよう、又は当該2値画像を伸張したときの伸張画像を構成する画素の値が全て1となるよう、当該2値画像を2値符号化方式により符号化することを特徴とする。 The invention according to claim 7 is the invention according to claim 3, wherein the third encoding means is configured such that all the values of the pixels constituting the binary image are 1 or the binary image is expanded. The binary image is encoded by a binary encoding method so that all the values of the pixels constituting the expanded image are 1.
請求項8にかかる発明は、請求項1乃至請求項7のいずれか一項にかかる発明において、前記画像は、IS15444シリーズで規定されるJPEG2000ファミリーファイル、国際標準IS15444−1 JPEG2000 IMAGE CODING SYSTEM:Core Coding Systemで示すJPEG2000コードストリーム、国際標準IS15444−1 JPEG2000 IMAGE CODING SYSTEM:Core Coding Systemで示すJPEG2000ファイル、国際標準IS15444−2 JPEG2000 IMAGE CODING SYSTEM:EXTENTIONSで示すJPEG2000ファイル、国際標準IS15444−3 MOTION JPEG2000で示すJPEG2000パート3ファイルで示すモーションJPEG2000ファイル及び国際標準IS15444−6 INFORMATIONTECHNOLOGY−JPEG2000 IMAGE Coding System:Part6:Compound Image Fileで示すJPMファイルのうち少なくとも1つのファイル形式で表される画像であることを特徴とする。 The invention according to claim 8 is the invention according to any one of claims 1 to 7, wherein the image is a JPEG2000 family file defined by IS15444 series, an international standard IS154444-1 JPEG2000 IMAGE CODING SYSTEM: Core. JPEG2000 code stream shown in Coding System, International Standard IS154444-1 JPEG2000 IMAGE CODING SYSTEM: JPEG2000 file shown in Core Coding System, International Standard IS15444-2 JPEG2000 IMAGE CODING2000 Standard JPEG4 Indication It is characterized by being an image represented by at least one of the JPEG 2000 file indicated by the Motion JPEG2000 file indicated by the JPEG2000 part 3 file and the international standard IS15444-6 INFORMATIONTECHNOLOGY-JPEG2000 IMAGE Coding System: Part6: Compound Image File. .
請求項9にかかる発明は、請求項1乃至請求項8のいずれか一項にかかる発明において、前記構造化文書は、国際標準IS15444−6 INFORMATIONTECHNOLOGY−JPEG2000 IMAGE Coding System:Part6:Compound Image File Formatで示すJPEG2000パート6ファイル、PDF:Portable Document Formatで示すPDFファイル、PostScriptファイル及びDjvuファイルのうち少なくとも1つのファイル形式により表される画像であることを特徴とする。 The invention according to claim 9 is the invention according to any one of claims 1 to 8, wherein the structured document is an international standard IS15444-6 INFORMATIONTECHNOLOGY-JPEG2000 IMAGE Coding System: Part 6: Compound Image File Format. It is an image represented by at least one file format among a JPEG 2000 part 6 file shown, a PDF file indicated by PDF: Portable Document Format, a PostScript file, and a Djvu file.
請求項10にかかる発明は、入力画像を符号化して、前景、背景及びマスクから構成される構造化文書を生成する符号化方法であって、前記前景として第1多値画像を割り当て、前記背景として第2多値画像を割り当て、前記マスクとして2値画像を割り当て、前記前景、前記背景及び前記マスクを各々符号化する符号化ステップと、前記符号化手段が符号化した前記前景、前記背景及び前記マスクを所定のファイルフォーマットに従って組み立てて構造化文書を生成する組立ステップとを含み、前記符号化ステップは、前記第1多値画像として任意の画像を多値符号化方式により符号化する第1符号化ステップと、前記第2多値画像として前記入力画像を多値符号化方式により符号化する第2符号化ステップと、前記2値画像として白色を表す画像を2値画像符号化方式により符号化する第3符号化ステップとを含むことを特徴とする。
The invention according to
本発明によれば、高画質な構造化文書の生成に掛かる処理時間を低減することができる。 According to the present invention, it is possible to reduce the processing time required to generate a high-quality structured document.
以下に添付図面を参照して、この発明にかかる符号化装置及び符号化方法の最良な実施の形態を詳細に説明する。 Exemplary embodiments of an encoding apparatus and an encoding method according to the present invention will be explained below in detail with reference to the accompanying drawings.
(1)構成
本実施の形態にかかる符号化装置1の構成について説明する。符号化装置1は、CPU(Central Processing Unit)と、ROM(Read Only Memory)と、RAM(Random Access Memory)と、HDD(Hard Disk Drive)やCD(Compact Disk)ドライブ装置等の外部記憶装置と、通信I/Fと、ユーザからの操作が入力される操作装置と、情報を表示する表示装置と、これらを接続するバスを備えており(いずれも図示せず)、通常のコンピュータを利用したハードウェア構成となっている。外部記憶装置には、各種プログラムや各種データが記憶される。また、外部記憶装置には、例えば、スキャナにより読み取られた文書の画像を構造化文書のファイルフォーマット(例えば、JPMとする)で符号化した符号データ(JPMファイル)が記憶される。構造化文書とは、文字からなる文字部分や絵柄からなる絵柄部分などの構成要素が混在する一般的なオフィス文書(絵柄混在文書という)において、これらの構成要素をオブジェクトとして捉え、前景、背景及び前景と背景とを切り替えるためのマスクを有する複数のレイアウトオブジェクトから構成されるものである。ここで、前景と背景とは高精細カラー画像となるため、タイル分割またはプレシンクト分割を行うようにJPEG2000符号化方式により符号化されており、それぞれ4分割されている。一方、マスクは、MH/MR/MMRのような分割構造を持たない2値画像符号化方式により符号化されている。以降、このようなマスクを2値マスクという。ROMには、各種プログラムや各種データが記憶される。CPUは、ROMや外部記憶装置に記憶されている各種プログラムをRAMにロードしてこれを実行することにより、装置全体を制御し、各種機能を実現させる。特に、本実施の形態においては、CPUは、絵柄混在文書を符号化して構造化文書を生成する機能を実現させる。
(1) Configuration A configuration of the encoding device 1 according to the present embodiment will be described. The encoding device 1 includes a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), an external storage device such as an HDD (Hard Disk Drive) and a CD (Compact Disk) drive device. A communication I / F, an operation device to which an operation from a user is input, a display device for displaying information, and a bus for connecting them (none shown), and using a normal computer It has a hardware configuration. Various programs and various data are stored in the external storage device. Also, the external storage device stores, for example, code data (JPM file) obtained by encoding a document image read by a scanner in a structured document file format (for example, JPM). A structured document is a general office document (referred to as a mixed picture document) in which constituent elements such as character parts consisting of characters and picture parts consisting of pictures are mixed. It is composed of a plurality of layout objects having a mask for switching between the foreground and the background. Here, since the foreground and the background are high-definition color images, they are encoded by the JPEG2000 encoding method so as to perform tile division or precinct division, and each is divided into four. On the other hand, the mask is encoded by a binary image encoding method having no division structure such as MH / MR / MMR. Hereinafter, such a mask is referred to as a binary mask. Various programs and various data are stored in the ROM. The CPU loads the various programs stored in the ROM and the external storage device to the RAM and executes them, thereby controlling the entire device and realizing various functions. In particular, in the present embodiment, the CPU realizes a function of generating a structured document by encoding a design mixed document.
ここで、符号化装置1が絵柄混在文書を符号化して構造化文書を生成する機能について簡単に説明する。図1は、符号化装置1が絵柄混在文書を符号化して構造化文書を生成する機能を概念的に示した図である。符号化装置1は、絵柄混在文書G1を用いて、構造化文書の各オブジェクトである前景G2、背景G3及びマスクG4に対して各々画像を割り当てる。背景及び前景は、2値画像又は多値画像であり、マスクは2値画像である。そして、符号化装置1は、前景G2に割り当てた画像を多値符号化方式により符号化し、背景G3に割り当てた画像を多値符号化方式により符号化し、マスクG4に割り当てた画像を2値画像符号化方式により符号化する。そして、符号化装置1は、各々符号化した画像を組み立てることにより、構造化文書G5を生成する。ここで、本実施の形態において特徴的なことは、前景G2、背景G3及びマスクG4を、絵柄混在文書からの分離により得るのではなく、画像の割り当てにより得る。どのように画像を割り当てるかについては後述の動作欄で説明する。 Here, the function in which the encoding apparatus 1 encodes a design mixed document to generate a structured document will be briefly described. FIG. 1 is a diagram conceptually showing a function of the encoding apparatus 1 for generating a structured document by encoding a mixed picture document. The encoding device 1 assigns images to the foreground G2, the background G3, and the mask G4, which are the objects of the structured document, using the design mixed document G1. The background and foreground are binary images or multivalued images, and the mask is a binary image. Then, the encoding device 1 encodes the image assigned to the foreground G2 using the multilevel encoding method, encodes the image assigned to the background G3 using the multilevel encoding method, and converts the image assigned to the mask G4 to the binary image. Encoding is performed by an encoding method. Then, the encoding device 1 generates a structured document G5 by assembling the encoded images. Here, what is characteristic in the present embodiment is that the foreground G2, the background G3, and the mask G4 are obtained not by separation from the mixed picture document but by image assignment. How to assign an image will be described in the operation column described later.
次に、符号化装置1のCPUが各種プログラムを実行することにより符号化装置1において実現される機能について説明する。図2は、符号化装置1の機能的構成を示すブロック図である。符号化装置1の機能的構成は、入力ファイルパーサ手段11と、符号化手段12と、組立手段13とからなる。 Next, functions realized in the encoding device 1 when the CPU of the encoding device 1 executes various programs will be described. FIG. 2 is a block diagram showing a functional configuration of the encoding device 1. The functional configuration of the encoding device 1 includes an input file parser means 11, an encoding means 12, and an assembly means 13.
入力ファイルパーサ手段11は、処理対象として入力された絵柄混在文書(入力ファイル10)を外部記憶装置から読み出し、当該絵柄混在文書に書き込まれた情報を読み取ることにより絵柄混在文書の状態を解釈する。このような情報は、例えば、絵柄混在文書のヘッダに書き込まれている。具体的には、入力ファイルパーサ手段11は、絵柄混在文書の状態として、既に圧縮されているのか又は非圧縮なのかを解釈したり、絵柄混在文書が複数のページからなるか否かを解釈したりする。入力された絵柄混在文書が非圧縮であり且つ複数ページからなる場合、入力ファイルパーサ手段11は、当該絵柄混在文書をページ毎に分割して、これらを符号化手段12に引き渡す。 The input file parser means 11 reads a picture mixed document (input file 10) inputted as a processing target from an external storage device, and interprets the state of the picture mixed document by reading information written in the picture mixed document. Such information is written, for example, in the header of the mixed picture document. Specifically, the input file parser means 11 interprets whether the picture mixed document is already compressed or uncompressed as the state of the mixed picture document, or interprets whether the mixed picture document consists of a plurality of pages. Or When the input mixed picture document is uncompressed and consists of a plurality of pages, the input file parser means 11 divides the mixed picture document into pages and passes them to the encoding means 12.
符号化手段12は、入力ファイルパーサ手段11から引き渡された絵柄混在文書についてページ毎に、構造化文書の各オブジェクト(前景、背景及びマスク)に対して各々画像を割り当て、各オブジェクトを所定の符号化方式により各々符号化する。符号化手段12の具体的な動作については後述の動作欄で詳述する。 The encoding means 12 assigns an image to each object (foreground, background and mask) of the structured document for each page of the mixed picture document delivered from the input file parser means 11, and assigns each object to a predetermined code. Each encoding is performed according to the encoding method. The specific operation of the encoding means 12 will be described in detail in the operation column described later.
組立手段13は、符号化手段12が各々符号化した各符号データ(コードストリーム)を所定のデータフォーマットに従って組み立てる。概略的には、組立手段13は、上述した符号データのうち、背景、マスクの順に画像を重ね合わせ、マスクにおいて黒を表す画素については、前景の対応する画素に置き換える。組立手段13は、このようにして組み立てた構造化文書を出力ファイル14として外部記憶装置に出力する。 The assembling means 13 assembles each code data (code stream) encoded by the encoding means 12 according to a predetermined data format. Schematically, the assembling means 13 superimposes images in the order of background and mask in the above-described code data, and replaces pixels representing black in the mask with corresponding pixels in the foreground. The assembling means 13 outputs the structured document thus assembled as an output file 14 to the external storage device.
(2)動作
次に、符号化装置1の動作について説明する。図3は、符号化装置1が絵柄混在文書を符号化して構造化文書を生成する処理の手順を示すフローチャートである。ユーザが操作装置を介して処理対象の絵柄混在文書の符号化要求を入力すると、符号化装置1は、当該符号化要求の入力を受け付ける(ステップS1)。尚、ここで入力される符号化要求には、例えば、処理対象の絵柄混在文書のファイル名(入力ファイル名)と、処理後の構造化文書のファイル名(出力ファイル名)と、圧縮率(例えば、1/500)とが含まれる。そして、符号化装置1の入力ファイルパーサ手段11は、符号化要求に含まれる入力ファイル名を有する絵柄混在文書を外部記憶装置から読み出す(ステップS2)。入力ファイルパーサ手段11は、読み出した絵柄混在文書が非圧縮か否かを判別し(ステップS3)、当該判別結果が肯定的である場合、入力ファイルパーサ手段11は、読み出した絵柄混在文書をページ毎に分解して、符号化手段12に引き渡す。
(2) Operation Next, the operation of the encoding device 1 will be described. FIG. 3 is a flowchart showing a procedure of processing in which the encoding apparatus 1 generates a structured document by encoding a design mixed document. When the user inputs an encoding request for a mixed picture document to be processed through the operation device, the encoding device 1 accepts the input of the encoding request (step S1). The encoding request input here includes, for example, a file name (input file name) of a mixed picture document to be processed, a file name (output file name) of a structured document after processing, and a compression rate ( For example, 1/500) is included. Then, the input file parser means 11 of the encoding device 1 reads a picture mixed document having the input file name included in the encoding request from the external storage device (step S2). The input file parser means 11 determines whether or not the read mixed picture document is uncompressed (step S3). If the determination result is affirmative, the input file parser means 11 reads the read mixed picture document on the page. Each time it is decomposed, it is delivered to the encoding means 12.
符号化手段12は、入力ファイルパーサ手段11が引き渡された絵柄混在文書について、ページ毎に以下の処理を行う。符号化手段12は、構造化文書の各オブジェクト(背景、前景、マスク)に対して画像を各々割り当てる(ステップS4)。具体的には、符号化手段12は、背景として1ページの画像全体を割り当て、マスクとして全面白色の画像を割り当て、前景として全面白色の画像を割り当てる。即ち、ここでは、符号化装置1は、絵柄混在文書を画像成分分析して絵柄部分とエッジ部分とに分離することはせず、絵柄混在文書の画像を背景に割り当てる。そして、符号化装置1は、従来であれば、例えば、エッジ部分の画像を表すマスクに対してダミーの画像として、全面白色の画像を割り当てる。即ち、マスクに対して、エッジ部分が全くない状態を表す画像を符号化装置1は割り当てる。そして、エッジ部分の色を表す画像が割り当てられる前景については、マスクにエッジ部分が全くない状態であるから、表すべき色がない状態となる。このため、前景に割り当てる画像はどのような画像であっても良いが、ここでは便宜的に全面白色の画像を符号化装置1は割り当てる。また、発色は白色以外の他の色であっても良いし、発色のパターンは全面でなくても良く他のパターンであっても良い。一般的には圧縮率が高くなるようにすべて同じ値のパターンとすることが好ましい。
The
そして、符号化手段12は、以上のように画像を割り当てた前景を多値画像符号化方式により符号化し(ステップS5)、背景を多値画像符号化方式により符号化し(ステップS6)、マスクを2値画像符号化方式により符号化する(ステップS7)。尚、符号化手段12は、マスクを2値画像符号化方式により符号化する際に所定の閾値で量子化する処理も適宜行う。
Then, the encoding means 12 encodes the foreground to which the image is assigned as described above by the multi-value image encoding method (step S5), encodes the background by the multi-value image encoding method (step S6), and sets the mask. Encoding is performed by a binary image encoding method (step S7). Note that the
組立手段13は、符号化手段12が各オブジェクトを各々符号化した符号データを所定のファイルフォーマットに従って組み立て、コードストリームを組み立てるという一連の動作をページ毎に繰り返し、構造化文書を生成する(ステップS8)。組立手段13が、背景、前景及びマスクを所定のファイルフォーマットに従って組み立てて構造化文書を生成する処理の手順は、周知技術のMRC(Mixed Raster Content)符号化方式によるものと同様であるため、ここではその説明を省略する。そして、組立手段13は、生成した構造化文書を、ステップS1で入力を受け付けた符号化要求に含まれる出力ファイル名で外部記憶装置に出力する一方、処理結果を表示装置に出力する(ステップS9)。 The assembling means 13 generates a structured document by repeating a series of operations for assembling code data obtained by encoding the respective objects according to a predetermined file format and assembling a code stream for each page (step S8). ). The procedure of the process in which the assembling means 13 generates the structured document by assembling the background, foreground, and mask according to a predetermined file format is the same as that according to the well-known MRC (Mixed Raster Content) encoding method. Then, the explanation is omitted. Then, the assembling means 13 outputs the generated structured document to the external storage device with the output file name included in the encoding request received in step S1, while outputting the processing result to the display device (step S9). ).
以上のようにして、絵柄混在文書を高い圧縮率で符号化して構造化文書を生成する場合、背景、前景及びマスクに対して画像を割り当てる。このため、絵柄混在文書に対して画像成分分析を行って背景、前景及びマスクに分離する必要がない。従って、多くの処理時間を掛けずに高品質な画像を提供することができる。 As described above, when a structured document is generated by encoding a mixed picture document at a high compression rate, images are assigned to the background, foreground, and mask. For this reason, it is not necessary to perform image component analysis on a mixed picture document and separate it into a background, foreground, and mask. Therefore, a high-quality image can be provided without taking much processing time.
[変形例]
また、上述した各実施の形態に限定されるものではなく、以下に例示するような種々の変形が可能である。
[Modification]
Moreover, it is not limited to each embodiment mentioned above, The various deformation | transformation which is illustrated below is possible.
<変形例1>
上述の実施の形態の符号化装置1で実行される各種プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。また、当該プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由で符号化装置1にダウンロードさせることにより提供するように構成しても良い。
<Modification 1>
The various programs executed by the encoding apparatus 1 of the above-described embodiment are files in an installable or executable format, such as a CD-ROM, a flexible disk (FD), a CD-R, and a DVD (Digital Versatile Disk). For example, the program may be recorded on a computer-readable recording medium. Further, the program may be provided by being stored on a computer connected to a network such as the Internet and downloaded to the encoding device 1 via the network.
<変形例2>
上述の実施の形態においては、符号化手段12は、マスクとして全面白色の画像を割り当て、前景として全面白色の画像を割り当てたが、当該画像を符号化した符号化画像を構成する画素の値又は当該符号化画像を伸張したときの伸張画像を構成する画素の値が、全て「0」となるように、符号化すれば良い。
<Modification 2>
In the above-described embodiment, the
<変形例3>
上述した実施の形態においては、符号化手段12は、絵柄混在文書について、1ページの画像全体を構造化文書の背景に割り当てるように構成したが、これを前景に割り当てるようにしても良い。図4は、本変形例にかかる符号化装置1が絵柄混在文書を符号化して構造化文書を生成する機能を概念的に示した図である。この場合、マスクG4には、全面黒色の画像を割り当てる。背景G3には、任意の画像を割り当て可能であるが、ここでは、一例として、全面白色の画像を割り当てる。このような構成によれば、図3のステップS5で組立手段13が背景の画像にマスクの画像を重ね合わせたとき、マスクの全画素を前景の対応する画素に置き換えることになる。この結果、表れる画像は、前景の画像となり、絵柄混在文書の1ページの画像全体と同じとなる。従って、以上のような構成によっても、絵柄混在文書から構造化文書を生成する場合に、絵柄混在文書を画像成分分析して背景、前景及びマスクに分離する必要がなく、多くの処理時間を掛けずに高品質な画像を提供することができる。
<Modification 3>
In the embodiment described above, the
尚、マスクとして全面黒色の画像を割り当てたが、符号化手段12は、当該画像を符号化した符号化画像を構成する画素の値又は当該符号化画像を伸張したときの伸張画像を構成する画素の値が、全て「1」となるように、符号化すれば良い。 Although a black image is assigned as a mask as a mask, the encoding means 12 uses the values of the pixels constituting the encoded image obtained by encoding the image or the pixels constituting the expanded image when the encoded image is expanded. Encoding may be performed so that the values of all become “1”.
<変形例4>
上述の実施形態において、符号化手段12が構造化文書の各オブジェクト(前景、背景、マスク)を符号化するタイミングは、これらを組み立てる時であっても良いし、これらを組み立てる前であっても良い。これらを組み立てる前に符号化する場合とは、例えば、画像を予め符号化した符号データ(コードストリーム)を予め用意しておく場合である。図5は、符号化装置1が、絵柄混在文書の符号化の際に、前景の画像及びマスクの画像が予め符号化されたコードストリームを用いて構造化文書を生成する機能を概念的に示した図である。同図に示される符号化済前景コードストリームM1は、前景を多値符号化方式により予め符号化したコードストリームであり、例えば外部記憶装置に記憶される。尚、符号化前の前景の画像は、上述の実施の形態と同様に、一例として全面白色の画像又は任意の画像である。また、符号化済マスクコードストリームM2は、マスクを2値画像符号化方式により予め符号化したコードストリームであり、例えば外部記憶装置に記憶される。尚、符号化前のマスクは上述の実施の形態と同様に、全面白色の画像である。組立手段13は、符号化手段12が符号化した背景のコードストリームと、外部記憶装置に予め記憶された符号化済前景コードストリーム及び符号化済マスクコードストリームを用いて組立を行い構造化文書を生成する。
<Modification 4>
In the above-described embodiment, the
このような構成によっても、多くの処理時間を掛けずに高品質な画像を提供することができる。 Even with such a configuration, a high-quality image can be provided without taking much processing time.
また、上述の変形例3においても同様に、マスク及び背景を各々符号化したコードストリームを外部記憶装置などに予め記憶させておき、組立手段13は、これらと上述した前景とを組み立てるようにしても良い。 Similarly, in the above-described third modification, a code stream in which a mask and a background are encoded is stored in advance in an external storage device or the like, and the assembling means 13 assembles these and the above-mentioned foreground. Also good.
<変形例5>
上述の実施の形態においては、符号化装置1が符号化する対象の画像として絵柄混在文書を取り扱ったが、これに限らず、絵柄や写真のみの多値画像や文字のみの2値画像を符号化の対象としても良い。
<Modification 5>
In the above-described embodiment, a mixed picture document is handled as an image to be encoded by the encoding device 1. However, the present invention is not limited to this, and a multi-value image including only a pattern or a photo or a binary image including only a character is encoded. It may be a target of conversion.
また、符号化装置1が符号化する対象の画像は、IS15444シリーズで規定されるJPEG2000ファミリーファイル、国際標準IS15444−1 JPEG2000 IMAGE CODING SYSTEM:Core Coding Systemで示すJPEG2000コードストリーム、国際標準IS15444−1 JPEG2000 IMAGE CODING SYSTEM:Core Coding Systemで示すJPEG2000ファイル、国際標準IS15444−2 JPEG2000 IMAGE CODING SYSTEM:EXTENTIONSで示すJPEG2000ファイル、国際標準IS15444−3 MOTION JPEG2000で示すJPEG2000パート3ファイルで示すモーションJPEG2000ファイル及び国際標準IS15444−6 INFORMATIONTECHNOLOGY−JPEG2000 IMAGE Coding System:Part6:Compound Image Fileで示すJPMファイルのうち少なくとも1つのファイル形式で表される画像であっても良い。 In addition, an image to be encoded by the encoding apparatus 1 is a JPEG2000 family file defined by IS15444 series, an international standard IS15444-1 JPEG2000 IMAGE CODING SYSTEM: a JPEG2000 code stream indicated by a Core Coding System, an international standard IS154444-1 JPEG2000. IMAGE CODING SYSTEM: JPEG2000 file shown in Core Coding System, international standard IS15444-2 JPEG2000 IMAGE CODING SYSTEM: JPEG2000 file shown in EXTENSIONS, JPEG2000 part file shown in international standard IS15444-3 MOTION JPEG2000 JPEG2000 file and international standard IS15444-6 INFORMATIONTECHNOLOGY-JPEG2000 IMAGE Coding System: Part6: may be an image represented by at least one file format among the JPM file indicated by the Compound Image File.
また、符号化装置が生成する構造化文書は、国際標準IS15444−6 INFORMATIONTECHNOLOGY−JPEG2000 IMAGE Coding System:Part6:Compound Image File Formatで示すJPEG2000パート6ファイル、PDF:Portable Document Formatで示すPDFファイル、PostScriptファイル及びDjvuファイルのうち少なくとも1つのファイル形式で表される画像であっても良い。 In addition, the structured document generated by the encoding device is an international standard IS15444-6 INFORMATIONTECHNOLOGY-JPEG2000 IMAGE Coding System: Part6: JPEG2000 Part6 file indicated by Compound Image File Format, PDF: Portable Document file, PDF file format format file. And an image represented in at least one file format among the Djvu files.
本発明は、画像を符号化して構造化文書を生成する符号化技術に用いて好適である。 The present invention is suitable for use in an encoding technique for generating a structured document by encoding an image.
1 符号化装置
11 入力ファイルパーサ手段
12 符号化手段
13 組立手段
DESCRIPTION OF SYMBOLS 1
Claims (10)
前記前景として第1多値画像を割り当て、前記背景として第2多値画像を割り当て、前記マスクとして2値画像を割り当て、前記前景、前記背景及び前記マスクを各々符号化する符号化手段と、
前記符号化手段が符号化した前記前景、前記背景及び前記マスクを所定のファイルフォーマットに従って組み立てて構造化文書を生成する組立手段とを備え、
前記符号化手段は、
前記第1多値画像として任意の画像を多値符号化方式により符号化する第1符号化手段と、
前記第2多値画像として前記入力画像を多値符号化方式により符号化する第2符号化手段と、
前記2値画像として白色を表す画像を2値画像符号化方式により符号化する第3符号化手段とを有する
ことを特徴とする符号化装置。 An encoding device that encodes an input image to generate a structured document composed of a foreground, a background, and a mask,
Encoding means for assigning a first multivalued image as the foreground, assigning a second multivalued image as the background, assigning a binary image as the mask, and encoding the foreground, the background and the mask, respectively;
Assembly means for assembling the foreground, the background, and the mask encoded by the encoding means according to a predetermined file format to generate a structured document;
The encoding means includes
First encoding means for encoding an arbitrary image as the first multi-level image by a multi-level encoding method;
Second encoding means for encoding the input image as the second multi-level image by a multi-level encoding method;
An encoding apparatus comprising: third encoding means for encoding an image representing white as the binary image by a binary image encoding method.
ことを特徴とする請求項1に記載の符号化装置。 The encoding apparatus according to claim 1, wherein the first encoding unit encodes an image representing white as the first multi-level image by a multi-level encoding method.
前記前景として第1多値画像を割り当て、前記背景として第2多値画像を割り当て、前記マスクとして2値画像を割り当て、前記前景、前記背景及び前記マスクを各々符号化する符号化手段と、
前記符号化手段が符号化した前記前景、前記背景及び前記マスクを所定のファイルフォーマットにより組み立てて構造化文書を生成する組立手段とを備え、
前記符号化手段は、
前記第1多値画像として前記入力画像を多値符号化方式により符号化する第1符号化手段と、
前記第2多値画像として任意の画像を多値符号化方式により符号化する第2符号化手段と、
前記2値画像として黒色を表す画像を2値画像符号化方式により符号化する第3符号化手段とを有する
ことを特徴とする符号化装置。 An encoding device that encodes an input image to generate a structured document composed of a foreground, a background, and a mask,
Encoding means for assigning a first multivalued image as the foreground, assigning a second multivalued image as the background, assigning a binary image as the mask, and encoding the foreground, the background and the mask, respectively;
Assembly means for generating a structured document by assembling the foreground, the background, and the mask encoded by the encoding means in a predetermined file format;
The encoding means includes
First encoding means for encoding the input image as the first multi-level image by a multi-level encoding method;
A second encoding means for encoding an arbitrary image as the second multi-level image by a multi-level encoding method;
An encoding apparatus comprising: third encoding means for encoding an image representing black as the binary image by a binary image encoding method.
前記背景として前記入力画像を多値画像符号化方式により符号化する符号化手段と、
前記符号化手段が符号化した前記背景と、任意の画像が多値符号化方式により予め符号化されて第1記憶手段に記憶された符号化済前景と、白色を表す画像が2値符号化方式により予め符号化されて第2記憶手段に記憶された符号化済マスクとを所定のファイルフォーマットにより組み立てて構造化文書を生成する組立手段とを備える
ことを特徴とする符号化装置。 An encoding device that encodes an input image to generate a structured document composed of a foreground, a background, and a mask,
Encoding means for encoding the input image as the background by a multilevel image encoding method;
The background encoded by the encoding means, the encoded foreground in which an arbitrary image is encoded in advance by the multi-level encoding method and stored in the first storage means, and the image representing white are binary encoded An encoding apparatus comprising: an assembling unit that assembles an encoded mask that has been encoded in advance by a method and stored in a second storage unit in a predetermined file format to generate a structured document.
ことを特徴とする請求項1又は請求項2に記載の符号化装置。 The first encoding unit is configured such that all the values of the pixels constituting the first multi-valued image are 0, or all the values of the pixels constituting the expanded image when the first multi-valued image is expanded are 0. The encoding apparatus according to claim 1 or 2 , wherein the first multi-valued image is encoded by a multi-level encoding method so that
ことを特徴とする請求項1に記載の符号化装置。 The third encoding means is configured such that all the values of the pixels constituting the binary image are 0, or all the values of the pixels constituting the expanded image when the binary image is expanded are 0. The encoding apparatus according to claim 1, wherein the binary image is encoded by a binary encoding method.
ことを特徴とする請求項3に記載の符号化装置。 The third encoding means is such that all the values of the pixels constituting the binary image are 1, or all the values of the pixels constituting the expanded image when the binary image is expanded are 1. The encoding apparatus according to claim 3, wherein the binary image is encoded by a binary encoding method.
ことを特徴とする請求項1乃至請求項7のいずれか一項に記載の符号化装置。 The image includes a JPEG2000 family file defined by IS15444 series, an international standard IS154444-1 JPEG2000 IMAGE CODING SYSTEM: a JPEG2000 code stream represented by a Core Coding System, and an international standard IS15444-1 JPEG2000 IMAGE CODING SYSTEM: a Core Coding 2000 file. , International Standard IS15444-2 JPEG2000 IMAGE CODING SYSTEM: JPEG2000 file indicated by EXTENSIONS, International Standard IS15444-3 MOTION JPEG2000 file indicated by JPEG2000 Part 3 file indicated by JPEG2000 and International Standard IS1 444-6 INFORMATIONTECHNOLOGY-JPEG2000 IMAGE Coding System: Part6: Image represented in at least one file format among JPM files indicated by Compound Image File. The encoding device described in 1.
ことを特徴とする請求項1乃至請求項8のいずれか一項に記載の符号化装置。 The structured document is an international standard IS15444-6 INFORMATIONTECHNOLOGY-JPEG2000 IMAGE Coding System: Part6: Compound Image File Format JPEG2000 part 6 file, PDF: Format Document file, PDF file file. The encoding device according to any one of claims 1 to 8, wherein the image is represented by one file format.
前記前景として第1多値画像を割り当て、前記背景として第2多値画像を割り当て、前記マスクとして2値画像を割り当て、前記前景、前記背景及び前記マスクを各々符号化する符号化ステップと、
前記符号化手段が符号化した前記前景、前記背景及び前記マスクを所定のファイルフォーマットに従って組み立てて構造化文書を生成する組立ステップとを含み、
前記符号化ステップは、
前記第1多値画像として任意の画像を多値符号化方式により符号化する第1符号化ステップと、
前記第2多値画像として前記入力画像を多値符号化方式により符号化する第2符号化ステップと、
前記2値画像として白色を表す画像を2値画像符号化方式により符号化する第3符号化ステップとを含む
ことを特徴とする符号化方法。 An encoding method that encodes an input image to generate a structured document composed of a foreground, a background, and a mask,
An encoding step of assigning a first multivalued image as the foreground, assigning a second multivalued image as the background, assigning a binary image as the mask, and encoding the foreground, the background and the mask, respectively;
Assembling the foreground, the background and the mask encoded by the encoding means according to a predetermined file format to generate a structured document;
The encoding step includes
A first encoding step of encoding an arbitrary image as the first multi-level image by a multi-level encoding method;
A second encoding step of encoding the input image as the second multi-level image by a multi-level encoding method;
And a third encoding step of encoding an image representing white as the binary image by a binary image encoding method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007166300A JP4860558B2 (en) | 2007-06-25 | 2007-06-25 | Encoding apparatus and encoding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007166300A JP4860558B2 (en) | 2007-06-25 | 2007-06-25 | Encoding apparatus and encoding method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009005247A JP2009005247A (en) | 2009-01-08 |
JP4860558B2 true JP4860558B2 (en) | 2012-01-25 |
Family
ID=40321115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007166300A Expired - Fee Related JP4860558B2 (en) | 2007-06-25 | 2007-06-25 | Encoding apparatus and encoding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4860558B2 (en) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3376870B2 (en) * | 1997-08-14 | 2003-02-10 | ミノルタ株式会社 | Image processing device |
JP4686854B2 (en) * | 2000-12-08 | 2011-05-25 | 株式会社ニコン | Image encoding device, electronic camera, and recording medium for image encoding program |
-
2007
- 2007-06-25 JP JP2007166300A patent/JP4860558B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009005247A (en) | 2009-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2321063C2 (en) | System and method for serial conversion and encoding of digital data | |
US8509310B2 (en) | Method, medium, and system encoding and/or decoding an image | |
US8553301B2 (en) | Image processing apparatus, method, and program product to perform color-reduction processing for a block | |
JP5132517B2 (en) | Image processing apparatus and image processing method | |
JP4979655B2 (en) | Image coding apparatus and control method thereof | |
US8213727B2 (en) | Image encoding apparatus and image decoding apparatus, and control method thereof | |
JP2007082235A (en) | Image data compressor and compressing method | |
JP2007060619A (en) | Image processing unit, method and program for compressing image, and recording medium | |
US6337929B1 (en) | Image processing apparatus and method and storing medium | |
US20090208125A1 (en) | Image encoding apparatus and method of controlling the same | |
JP2006121645A (en) | Image compression apparatus and image compression program | |
JP5413080B2 (en) | Image processing apparatus and image processing method | |
US8406517B2 (en) | Image processing apparatus and image processing method | |
EP1215919B1 (en) | Method for compressing picture-representing data and data recovery program | |
JPH09205647A (en) | Image coder, image decoder and image processor | |
JP3853115B2 (en) | Image encoding apparatus, image decoding apparatus, image encoding method, and image decoding method | |
JP4860558B2 (en) | Encoding apparatus and encoding method | |
KR101454208B1 (en) | Method and apparatus for encoding/decoding halftone image | |
JPH04356873A (en) | Adaptive encoding system for color document image | |
US7292732B2 (en) | Image compression/decompression apparatus and method | |
KR100412176B1 (en) | Document segmentation compression, reconstruction system and method | |
JP2008109478A (en) | Image encoding device, method, program and storage medium | |
JP4719924B2 (en) | Image processing apparatus and image processing method | |
JP4757172B2 (en) | Image coding apparatus and control method thereof | |
JP2010028796A (en) | Image forming apparatus, image converting device, and image forming method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110714 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110809 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111006 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111025 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111102 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4860558 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141111 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |