JP4383157B2 - An image processing apparatus, program and storage medium - Google Patents

An image processing apparatus, program and storage medium Download PDF

Info

Publication number
JP4383157B2
JP4383157B2 JP2003427017A JP2003427017A JP4383157B2 JP 4383157 B2 JP4383157 B2 JP 4383157B2 JP 2003427017 A JP2003427017 A JP 2003427017A JP 2003427017 A JP2003427017 A JP 2003427017A JP 4383157 B2 JP4383157 B2 JP 4383157B2
Authority
JP
Grant status
Grant
Patent type
Prior art keywords
image
character
color
processing apparatus
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2003427017A
Other languages
Japanese (ja)
Other versions
JP2004362541A (en )
Inventor
利夫 宮澤
史裕 長谷川
Original Assignee
株式会社リコー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Grant date

Links

Images

Description

この発明は、画像処理装置、プログラム及び記憶媒体に関する。 This invention relates to an image processing apparatus, a program, and storage medium.

特許文献1には、画像の文字部分を除去し、周辺の色で埋めた背景画像を作成する技術が開示されている。 Patent Document 1, a character portion of the image is removed, a technique for creating a background image filled around the color is disclosed.

特許文献2には、カラー画像から文字情報を抽出、符号化する第1の手段と、画像データの解像度を下げて符号化する第2の手段を備え、各々のデータを合成する符号化技術が提案されている。 Patent Document 2, extract character information from the color image, a first means for encoding comprises a second means for encoding by lowering the resolution of the image data, coding techniques for synthesizing each data Proposed.

特許文献3には、画像データから抽出したテキストデータを検索情報に登録でき、画像データは低解像度で保管する技術について提案されている。 Patent Document 3, can register a text data extracted from the image data in the search information, the image data have been proposed for storing technology at a low resolution.

特許文献4には、自然画像と文字が混在するカラー文書画像を文字地肌ブロックと、画像データブロックに分け、各領域に適した符号化を行ない、絵柄領域の解像度は低く設定する技術が提案されている。 Patent Document 4, a character background block color document image natural image and character are mixed, divided into an image data block, performs suitable coding on each of the areas, the resolution of the picture area is proposed a technique for setting low ing.

特許第2611012号公報 Patent No. 2611012 Publication 特開平8−186711号公報 JP-8-186711 discloses 特開2001−297104公報 JP 2001-297104 Laid 特許第3108133号公報 Patent No. 3108133 Publication

文字画像を含む画像の画像データについては、文字画像を分離し、分離後の文字画像、背景画像のそれぞれに適した画像処理、圧縮処理方式で処理を行った後、文字画像を上から重ね合わせることが可能な、マルチレイア機能を有するファイル形式により保存することで、文字画像の視認性、背景画像の視認性を向上させることが可能となる。 The image data of an image including character images, to separate character images, character images after separation, the image processing suitable for each of the background image, after processing performed by the compression processing method, superimposing a character image from the top What can, by saving the file format having a multi-Leia functionality, visibility of the character image, it becomes possible to improve the visibility of the background image.

これに対し、特許文献1に開示の技術では、画像の文字部分を除去し、周辺の色で埋めた背景画像を作成する技術が開示されている。 In contrast, in the technique disclosed in Patent Document 1, a character portion of the image is removed, a technique for creating a background image filled around the color is disclosed.

しかしながら、特許文献1に開示の技術では、画像の文字部分を除去して周辺の色で埋める処理を行なうので、データ量を削減し、高速な処理を可能とすることができないという不具合がある。 However, the technology disclosed in Patent Document 1, because the process of filling in the color near to remove a character portion of the image to reduce the amount of data, there is a problem that it is not possible to enable high-speed processing.

本発明の目的は、背景画像に文字画像を重ねて表示するのに際して、データ量を削減し、高速な処理を可能とすることである。 An object of the present invention, when the displayed superimposed text image in the background image, to reduce the amount of data is to enable high-speed processing.

請求項1に記載の発明は、画像データから画像の文字部分を抽出する抽出手段と、この抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に1又は複数のファイルとして保存するファイル作成手段と、を備えている画像処理装置である。 According to one aspect of the present invention, an extraction means for extracting a character part of image from the image data, filling the region extracted character portion of the image after the extraction and character image is this extracted image in a predetermined image a file creating means for storing the remains of the background image without separately as one or more files, an image processing apparatus which comprises a.

請求項2に記載の発明は、請求項1に記載の画像処理装置において、前記抽出手段は、前記画像データがカラー画像である場合に所定のサンプリング間隔で前記抽出を行う。 According to a second aspect of the invention, in the image processing apparatus according to claim 1, wherein the extraction means performs said extraction at a predetermined sampling interval when the image data is a color image.

請求項3に記載の発明は、請求項1又は2に記載の画像処理装置において、前記ファイル作成手段は、前記画像データがカラー画像である場合に前記文字画像を1又は複数枚の二値画像として前記ファイルに保存する。 The invention according to claim 3, in the image processing apparatus according to claim 1 or 2, wherein the file creating means of one or a plurality of the character image when the image data is a color image binary image to save the file as.

請求項4に記載の発明は、請求項3に記載の画像処理装置において、前記抽出手段は、前記画像データを二値化処理してから文字部分を抽出し、該文字部分に対応するカラー画像の色を抽出して、文字色を特定する。 Invention according to claim 4, the image processing apparatus according to claim 3, wherein the extraction means, a color image, wherein the image data and extracting a character part from the binarized, corresponding to the character portion to extract the color of, to identify the character color.

請求項5に記載の発明は、請求項1〜4のいずれかの一に記載の画像処理装置において、前記ファイル作成手段は、前記画像データがカラー画像である場合に前記文字画像を減色したカラー画像として前記文字画像を前記ファイルに保存する。 Color the invention according to claim 5, the image processing apparatus according to one of any claims 1 to 4, wherein the file creating means, said image data is color reduction the character image when a color image storing the character image in the file as an image.

請求項6に記載の発明は、請求項1〜5のいずれかの一に記載の画像処理装置において、前記ファイル作成手段は、前記抽出した文字画像を可逆圧縮で、前記抽出後の背景画像は非可逆圧縮で、それぞれ圧縮符号化した上で前記1又は複数のファイルとして保存する。 Invention according to claim 6, in the image processing apparatus according to one of any claims 1 to 5, wherein the file creating means, in reversible compressing character image the extracted background image after the extraction in lossy compression, is stored as the one or more files on the compression-encoded.

請求項7に記載の発明は、請求項6に記載の画像処理装置において、前記ファイル作成手段は、前記非可逆圧縮の前に前記抽出後の背景画像を平滑化する。 The invention according to claim 7, in the image processing apparatus according to claim 6, wherein the file creating means smoothes the background image after the extraction prior to the irreversible compression.

請求項8に記載の発明は、請求項6又は7に記載の画像処理装置において、前記ファイル作成手段は、前記抽出した文字画像をOCR処理して、このOCRの結果を透明色のテキストのテキストデータとしたもの、前記抽出した文字画像、及び前記抽出後の背景画像をそれぞれレイヤとするレイヤ管理されたファイルとして前記ファイルの保存を行い、前記テキストデータのレイヤは前記文字画像のレイヤより上位のレイヤとする。 Invention of claim 8, the image processing apparatus according to claim 6 or 7, wherein the file creating means, a character image the extracted OCR processing, the text in the text of the transparent color the results of the OCR those data, the extracted character image, and performs saving of the file background image after the extraction as a layer management file and the layer each layer of the text data is higher than the layer of the character image and layer.

請求項9に記載の発明は、画像データから画像の文字部分を抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に保存している1又は複数のファイルを対象として、前記背景画像の前記文字部分を抽出した領域に前記文字画像を不透明色で重ねた画像を作成する画像作成手段を備えている、画像処理装置である。 The invention according to claim 9, the image data image which remain filling a predetermined image and the character image is extracted image text portion region extracted character portion of the image after the extraction of the background image targeting separately saved to have one or a plurality of files, and an image forming means for forming an image overlaid with an opaque color the character image to the extracted area of ​​the character part of the background image, image processing it is a device.

請求項10に記載の発明は、画像データから画像の文字部分を抽出する抽出処理と、この抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に1又は複数のファイルとして保存するファイル作成処理と、をコンピュータに実行させるコンピュータに読み取り可能なプログラムである。 The invention according to claim 10, an extraction process of extracting a character part of image from the image data, filling the region extracted character portion of the image after the extraction and character image is this extracted image in a predetermined image it is readable program and file creation process of storing and leave the background image without separately as one or more files, to a computer for causing a computer to execute.

請求項11に記載の発明は、画像データから画像の文字部分を抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に保存している1又は複数のファイルを対象として、前記背景画像の前記文字部分を抽出した領域に前記文字画像を不透明色で重ねた画像を作成する画像作成処理を、コンピュータに実行させるコンピュータに読み取り可能なプログラムである。 The invention according to claim 11, the image data image which remain filling a predetermined image and the character image is extracted image text portion region extracted character portion of the image after the extraction of the background image targeting one or more files are stored separately, the image creation process of creating an image overlaid with an opaque color the character image on the extracted the character part of the background image area, causing a computer to execute the computer it is a readable program.

請求項12に記載の発明は、請求項10又は11に記載のプログラムを記憶している、記憶媒体である。 The invention of claim 12 stores a program according to claim 10 or 11, a storage medium.

請求項1,10に記載の発明は、背景画像は文字画像を抽出した後の領域について、穴埋めを行わないので、背景画像の文字部分を抽出した領域に文字画像を不透明色で重ねた画像を作成するようにすれば、文字画像、背景画像からなる前述のファイルはデータ量を少なくすることができ、なおかつ、文字の可読性を損なわない画像を高速に作成することが可能となる。 Invention of claim 1 and 10, the background image for the region after extracting the character image is not performed filling, an image superimposed letter image with an opaque color region extracted character part of the background image if to create a character image, the aforementioned file composed of the background image can reduce the data amount, yet, it is possible to create an image which does not impair the readability of the characters at high speed. また、文字画像と背景画像とを別個に1又は複数のファイルで保存するので、背景画像は、たとえ文字画像も含めて画像全体を平滑化処理したとしても、最終的にユーザに提供される画像には平滑化処理の影響を何ら及ぼさないようにすることができる。 Moreover, since storing a character image and a background image separately one or more files, background images, even when smoothed full image even if a character image including the final image to be provided to the user it can be made to not adversely any influence of the smoothing processing.

請求項2に記載の発明は、請求項1に記載の発明において、処理に必要な記憶容量を節減し、高速な処理が可能となる。 The invention of claim 2 is the invention according to claim 1, saving the storage capacity required for processing enables high-speed processing.

請求項3に記載の発明は、請求項1又は2に記載の発明において、文字部の色は、一般に1色又はそれほど数が多くない色数で書かれていることが普通であるので、文字部の色をクラスタリング処理などして特定し、クラスタリング結果に応じた色の1又は複数枚の二値画像で文字画像を作成することができる。 Invention according to claim 3, in the invention of claim 1 or 2, the color of the character portion, since it is common that are generally written in one color or not so much the number the number of colors, character the color of the parts identified by like clustering process, it is possible to create a character image in color of one or a plurality of binary images according to the clustering result.

請求項4に記載の発明は、請求項3に記載の発明において、クラスタリング結果に応じた色の1又は複数枚の二値画像で文字画像を作成することができる。 The invention of claim 4 is the invention according to claim 3, it is possible to create a character image in color of one or a plurality of binary images according to the clustering result.

請求項5に記載の発明は、請求項1〜4のいずれかの一に記載の発明において、文字部分に用いられている色数は、通常それほど多くないことから、1枚の4ビットや8ビットに減色した画像、又は複数枚減色した画像を保持するだけでも充分であり、ユーザにとってもコントラストが高く可視性が高くなる効果がある。 Invention according to claim 5, in the invention described in one of any claims 1 to 4, the number of colors used in the character portion is generally because not many, 4 bits or one 8 image Genshoku bit, or a sufficient just to retain a plurality subtractive image, there is a visibility higher effect high contrast for the user.

請求項6に記載の発明は、請求項1〜5のいずれかの一に記載の発明において、文字の二値画像などは文字画像に適した圧縮形式で、背景画像は背景に適した圧縮形式で圧縮符号化することができ、ファイルサイズも小さくすることができる。 The invention of claim 6 is the invention according to one of any claims 1 to 5, a character of the binary image in a compressed format suitable for a character image, background compression format image suitable for background in can be compressed encoded file size can be reduced. また、文字画像を可逆圧縮方式で圧縮することで、将来OCRなどの処理で文字コード化したいときにも、認識率を低下させることなくOCR処理が可能となる。 Furthermore, by compressing the character image with lossless compression method, even when you want to character encoding in the processing of such future OCR, OCR processing is possible without decreasing the recognition rate.

請求項7に記載の発明は、請求項6に記載の発明において、最終的にユーザに提供される画像には平滑化処理の影響を何ら及ぼさないようにすることができる。 The invention of claim 7 is the invention according to claim 6, in the final image to be provided to the user can be prevented from adversely any influence of the smoothing process.

請求項8に記載の発明は、請求項6又は7に記載の発明において、テキスト検索が可能なマルチレイア機能をもつファイルを作成できる。 The invention of claim 8 is the invention according to claim 6 or 7, create a file with a multi Leia function capable text search.

請求項9,11に記載の発明は、背景画像は文字画像を抽出した後の領域について、穴埋めを行わずに、背景画像の文字部分を抽出した領域に文字画像を不透明色で重ねた画像を作成することができるので、文字画像、背景画像からなる前述のファイルはデータ量を少なくすることができ、なおかつ、文字の可読性を損なわない画像を高速に作成することが可能となる。 Invention according to claim 9, 11, the background image for the region after extracting the character image, without filling, an image superimposed letter image with an opaque color region extracted character part of the background image it is possible to create a character image, the aforementioned file composed of the background image can reduce the data amount, yet, it is possible to create an image which does not impair the readability of the characters at high speed.

本発明の一実施の形態について説明する。 It describes an embodiment of the present invention.

図1は、本実施の形態である画像処理装置1の電気的な接続を示すブロック図である。 Figure 1 is a block diagram showing an electrical connection of the image processing apparatus 1 in this embodiment. 図1に示すように、画像処理装置1は、いずれもPCなどのコンピュータであり、各種演算を行ない、画像処理装置1の各部を集中的に制御するCPU11と、各種のROM、RAMからなるメモリ12とが、バス13で接続されている。 As shown in FIG. 1, the image processing apparatus 1 is both a computer such as PC, it performs various calculations, a CPU11 which centrally controls the respective units of the image processing apparatus 1, consists of a variety of ROM, RAM memory 12 and are connected by a bus 13.

バス13には、所定のインターフェイスを介して、ハードディスクなどの磁気記憶装置14と、キーボード、マウスなどの入力装置15と、表示装置16と、光ディスクなどの記憶媒体17を読み取る記憶媒体読取装置18と、画像を読み取る画像読取装置21とが接続され、また、ネットワーク4と通信を行なう所定の通信インターフェイス19が接続されている。 The bus 13, via a predetermined interface, a magnetic storage device 14 such as a hard disk, a keyboard, an input device 15 such as a mouse, a display device 16, a storage medium reading device 18 for reading a storage medium 17 such as an optical disk an image reading device 21 for reading an image are connected, a predetermined communication interface 19 for communicating with the network 4 is connected. なお、記憶媒体17としては、CD,DVDなどの光ディスク、光磁気ディスク、フレキシブルディスクなどの各種メディアを用いることができる。 As the storage medium 17, it is possible to use CD, an optical disk such as a DVD, a magneto-optical disc, various media such as a flexible disk. また、記憶媒体読取装置18は、具体的には記憶媒体17の種類に応じて光ディスク装置、光磁気ディスク装置、フレキシブルディスク装置などが用いられる。 The storage medium reading unit 18, an optical disk device in accordance with the type of the storage medium 17 Specifically, the magneto-optical disk device, such as a flexible disk device is used.

画像処理装置1は、この発明の記憶媒体を実施する記憶媒体17から、この発明のプログラムを実施する画像処理プログラム20を読み取って、磁気記憶装置14にインストールする。 The image processing apparatus 1 from the storage medium 17 to carry out the storage medium of the present invention, by reading the image processing program 20 for implementing the program of the present invention will be installed in the magnetic storage device 14. これらのプログラムはインターネットなどのネットワーク4等を介してダウンロードしてインストールするようにしてもよい。 These programs may be installed and downloaded via the network 4, and the like, such as the Internet. このインストールにより、画像処理装置1は、それぞれ後述する所定の処理の実行が可能な状態となる。 This installation, the image processing apparatus 1 becomes the ready execution of predetermined processing to be described later, respectively. なお、画像処理プログラム20は、所定のOS上で動作するものであってもよい。 Note that the image processing program 20 may be configured to operate on a given of the OS.

図2は、画像処理装置1が画像処理プログラム20に基づいて実現する機能の機能ブロック図であり、図3は、画像処理装置1が実行する処理のフローチャートである。 2, the image processing apparatus 1 is a functional block diagram of functions realized on the basis of the image processing program 20, FIG. 3 is a flowchart of processing performed by the image processing apparatus 1 executes. 図5は、画像処理装置1が実行する処理の説明図である。 Figure 5 is an explanatory diagram of processing by the image processing apparatus 1 executes.

図2、図3、図5に示すように、まず、原稿の画像を例えば600dpiのカラー画像で画像読取装置21により読み取る(ステップS1)。 2, 3, as shown in FIG. 5, first, read by the image reading apparatus 21 the image of the document for example, 600dpi color image (step S1). そして、この読み取った画像データ(図5(a)のオリジナル画像41)について以下のような2系統の処理を行なう。 Then, the following processes such two systems for the read image data (original image 41 of Figure 5 (a)).

一つ目の処理は、ステップS1で読み取った画像データを対象に、解像度変換・圧縮部31で解像度変換を行なってデータ量を低減し(例えば300dpiのカラー画像に変換する)(ステップS2)、このカラー画像からそれぞれの文字色を減色部33で特定して、文字色ごとの二値化を二値化部34で行なって(ステップS3)、文字抽出部32により少なくとも文字領域(画素又はエリア)を抽出して(抽出手段、抽出処理)(ステップS4)、二値画像である文字画像42を作成し(図5(b))(ステップS5)、これを解像度変換・圧縮部31で、MMRなどの可逆圧縮方式で圧縮符号化して(ステップS6)、さらにデータ量を削減するものである。 Processing first is (converted, for example, in 300dpi color image) in the target image data read in step S1, and reduces the amount of data by performing resolution conversion by the resolution conversion and compression section 31 (step S2), and each text color from the color image identified by subtractive color unit 33, performs a binarization for each character color binarization unit 34 (step S3), and at least a character area by the character extraction unit 32 (pixel or area ) extracts (extraction means, the extraction process) (step S4), and creates a character image 42 is a binary image (FIG. 5 (b)) (in step S5), and which resolution conversion and compression section 31, and compression coding in lossless compression method such as MMR (step S6), and is intended to further reduce the data amount. なお、ここでは、文字に特定しているが、文字以外に罫線などの情報を文字とともに抽出しても構わない。 Here, although specific to character, it is also possible to extract information such as ruled lines with characters other than characters. また、文字や罫線の特徴である、エッジなどに注目し、文字である可能性の高い領域を文字領域として抽出してもよい。 Also, a feature of a character or a ruled line, focusing etc. the edge may be extracted likely a character area as a character area. 必ずしも画像から文字領域を正確に抽出することが目的ではないからである。 Necessarily because there is not a purpose to accurately extract a character region from the image.

二つ目の処理は、ステップS1で読み取った画像データを対象に(文字画像も含む)、解像度変換・圧縮部31でJPEGなどの非可逆圧縮方式で解像度変換を行なって、一つ目の処理よりさらにデータ量を低減する(例えば150dpiのカラー画像に変換する)(ステップS7)。 Processing Second, (including a character image) in the target image data read in step S1, by performing resolution conversion by lossy compression scheme such as JPEG resolution conversion and compression section 31, the first one of the processing reducing even more the amount of data (e.g., converting a color image of 150 dpi) (step S7). この場合の処理対象となるオリジナル画像41は、ステップS3で文字画像42を抽出後に、その文字抽出後の領域に穴埋め(所定の画素値を与えるなど)は行わないままで用いる。 Original image 41 to be processed in this case, the character image 42 after extraction in step S3, the filling in the region after the character extraction (such as giving a predetermined pixel value) is used without performing. これを背景画像43とし(図5(b))(ステップS8)、これを解像度変換・圧縮部31で圧縮符号化して(ステップS9)、さらにデータ量を削減するものである。 This was the background image 43 (FIG. 5 (b)) (step S8), and which was compression encoded by the resolution conversion and compression section 31 (step S9), and is intended to further reduce the data amount.

このようにそれぞれ作成された文字画像42と背景画像43とは、別個に1つ又は複数のファイル(PDFファイル)として保存される(ファイル作成手段、ファイル作成処理)(ステップS10)。 Thus the character image 42 and the background image 43 created respectively, are stored as separately one or more files (PDF) (file creation means, the file creation process) (step S10). 具体的には、例えば、マルチレイヤ機能を備えたPDFやJPEG2000などの単一のファイルとして保存することが考えられる。 Specifically, for example, it is conceivable to store a single file such as PDF or JPEG2000 having a multi-layer function. この場合、レイヤ管理されたファイルの第1層(下位層)には背景画像、第2層(上位層)には文字画像を配置する。 In this case, the first layer of layer management file (lower layer) is the background image, the second layer (upper layer) to place the character image.

このようにして作成したファイルのデータを表示装置16に表示等する場合の処理について、図2の機能ブロック図、図4のフローチャート、及び、図5の説明図を参照して説明する。 The process of displaying such data files created this way on the display device 16, a functional block diagram of FIG. 2, the flow chart of FIG. 4, and will be described with reference to the illustration of FIG.

すなわち、画像処理装置1で、ステップS10で作成したファイルを表示装置16に表示等する場合は(ステップS11のY)、文字画像42の解像度変換を解像度変換・圧縮部31で行って、文字画像42を解像度変換された文字画像44とし、文字画像44と背景画像43との解像度をそろえる(ステップS12)。 That is, in the image processing device 1, when displaying such on the display device 16 a file created in step S10 (Y in step S11), and performs resolution conversion of the character image 42 at a resolution conversion and compression section 31, a character image 42 and character image 44 resolution conversion and align the resolution of the character image 44 and the background image 43 (step S12). そして、背景画像43の画像上の文字位置に対応する文字の文字画像44を不透明色として重ね合わせて上書きする(図5(d)の画像45)(ステップS13)。 Then, overwrite by superimposing the character image 44 of a character corresponding to the character position on the image of the background image 43 as an opaque color (image 45 in FIG. 5 (d)) (step S13). この重ね合わせた画像を表示装置16に表示(あるいは印刷、外部に送信など)すれば、文字画像44と背景画像43とが重なった画像を1枚の画像のごとく見ることができる。 The superimposed display on the display device 16 the image was (or printed, transmitted to an external) if the image overlaps the character image 44 and the background image 43 can be viewed as one image.

前述のように、背景画像43は文字画像42を抽出した後の領域について、穴埋めを行わないので、文字画像42、背景画像43からなる前述のファイルはデータ量を少なくすることができ、なおかつ、文字の可読性を損なわない画像を高速に作成することが可能となる。 As described above, the background image 43 is the region after extracting the character image 42 does not perform the filling, character image 42, the aforementioned file composed of the background image 43 can be reduced the amount of data, yet, an image which does not impair the readability of the character it is possible to create a high speed.

なお、ステップS3においては、オリジナル画像41から所定のサンプリング間隔で画像を抽出することで、処理に必要な記憶容量を節減し、高速な処理が可能となる。 In the step S3, by extracting an image from the original image 41 at a predetermined sampling interval, saving the storage capacity required for the processing, enabling high-speed processing. すなわち、前述の特許文献1に開示の技術などでは、文字部を抽出し、その背景の色を求めるために、少なくとも文字の背景を計算するためのメモリが必要になるが、本実施の形態ではこれが不要となる。 That is, like in Patent Document 1 disclosed technique described above, to extract the character portion, in order to determine the color of the background, but a memory for calculating the background of at least characters needed, in this embodiment This is not necessary. つまり、本実施の形態では、文字画像44は背景画像43に不透明色で重ねて表示されるので、オリジナル画像41の背景の色を特定し、オリジナル画像41から文字部分を消す必要はないので、所定の間隔で文字画像42の抽出処理を行い、背景の色の抽出処理が不要となり、そのための処理時間、それに要するメモリが不要となる。 That is, in this embodiment, since the character image 44 is displayed superimposed with an opaque color background image 43, and identifies the color of the background of the original image 41, it is not necessary to erase the character portion from the original image 41, performs extraction processing of the character image 42 at predetermined intervals, the extraction process of the color of the background is not required, the processing time for the memory is not necessary required for it.

前述のように、文字画像42として、1枚または複数枚の二値画像を作成する。 As described above, as a character image 42 to create one or a plurality of binary images. これは、文字部の色は、一般に黒、赤、青など、1色又はそれほど数が多くない色数で書かれていることが普通であるので、文字部の色をクラスタリング処理などして特定し、クラスタリング結果に応じた色の複数枚の二値画像を作成するものである。 This is the color of the character portion is generally black, red, blue, etc., because it is written in the number of not many single color or so few colors are common, then the color of the character portion such as clustering process specifying and it is intended to create a plurality of binary images of a color corresponding to the clustering result.

このクラスタリングの手法の例を示す。 An example of a method of this clustering. すなわち、ステップS3,S4においては、文字画像を先に二値化処理し、その二値画像から文字部を抽出するようにしている。 That is, in step S3, S4, processes binarized character image earlier, and to extract the character portion from the binary image. ここでは、抽出された文字部に対応するカラーオリジナル画像の画素値(RGB値)を参照し、RGBの3次元空間に度数ヒストグラムを作成する。 Here, the extracted pixel values ​​of the color original image corresponding to the character portion with reference to (RGB value), generates a frequency histogram in 3D space of RGB. 次に、その度数ヒストグラムを幾つかのクラスに分割するためのクラスタリングを行う。 Next, the clustering for dividing the frequency histogram into several classes. このクラスタリングの方法は、特別な方法を用いることはなく、一般的に知られているK−ミーン法などを用いればよい。 The method of this clustering is not possible to use special methods are generally known K- or the like may be used Mean method.

また、文字画像42として、1枚または複数枚の文字画像42を作成するに際しては、二値画像ではなく、カラーの多値画像を用いるようにしてもよい。 Also, as a character image 42, when creating the one or a plurality of character images 42 is not a binary image, it may be used multivalued color image. 文字部分に用いられている色数は、通常それほど多くないことから、一般のカラー原稿のように、16万色などは不要である。 Number of colors used in the character portion, since usually not much, as in the general color originals, such as 160,000 colors is not necessary. すなわち、1枚の4ビットや8ビットに減色した画像、又は複数枚減色した画像を保持するだけで充分であり、ユーザにとってもコントラストが高く可視性が高くなる効果がある。 That is, image Genshoku on one 4-bit or 8-bit, or suffices to hold a plurality subtractive image, there is a visibility higher effect high contrast for the user.

なお、前述の例で、抽出した文字画像42(ステップS5)を対象に文字認識(OCR)処理を行い、その文字認識結果を透明テキストのテキストデータとして、レイヤ管理されたファイルの最上位のレイヤ(第3層)に配置し、第1層(下位層)には背景画像、第2層(上位層)には文字画像を配置するようにしてもよい。 Incidentally, in the above example, extracted character image 42 (step S5) performs character recognition (OCR) processing on the subjects, the character recognition result as text data of the transparent text, the uppermost layer of the layer management file (third layer) in place, the background to the first layer (lower layer) image, the second layer (upper layer) may be arranged a character image. これにより、テキスト検索が可能なマルチレイア機能をもつ電子ファイルを作成できる。 This makes it possible to create an electronic file with the multi-Leia function that can be text search.

また、文字画像42は二値化処理されているので(ステップS3)、背景画像43とのコントラストも高く、視認性が高くなっているが、背景画像43については、スキャン画像を印刷すると、通常はこれらのスキャナ機器の特性からモアレなどを生じる。 Further, since the character image 42 is binarized (step S3), and higher contrast between the background image 43, but visibility is high, the background image 43, printing the scanned image, usually It produces a moire from the characteristics of these scanners devices. これを解決する手段として、スキャンした画像に対して、平滑化処理を行うとモアレの発生を抑えることが出来ることも一般に知られている。 As a means to solve this problem, with respect to the scanned image, it is also generally known that it is possible to suppress the performing the moire smoothing processing.

しかし、スキャンした画像全体に平滑化処理を行うと、文字にもボケが生じ、視認性が悪化する不具合がある。 However, when the smoothing process on the entire scanned images, blurring occurs in character, there is a problem that visibility is deteriorated.

そこで、文字画像42を抽出した後(ステップS4)の背景画像43の全体、または、背景画像43の中で文字画像42として認識されなかった領域に対して選択的に、平滑化処理、γ補正処理などの画像処理を行なえば、文字画像42以外の視認性も高めることが可能となる。 Therefore, the entire background image 43 after extracting the character image 42 (step S4), and or, selectively to a region which has not been recognized as a character image 42 in the background image 43, smoothing processing, gamma correction by performing the image processing such as processing, it is possible to enhance visibility is also non-character image 42.

さらに、背景画像43は、一般には、文字以外の写真などの画像から構成されるため、文字のような高い解像度を必要としないこともあるので、解像度変換処理により、画像サイズを小さくしてもよい。 Further, the background image 43 is generally to be configured from an image, such as the non-character photo, because it may not require a high resolution, such as characters, a resolution conversion process, even by reducing the image size good.

本発明の一実施の形態である画像処理装置の電気的な接続のブロック図である。 It is a block diagram of the electrical connection of the image processing apparatus according to an embodiment of the present invention. 画像処理装置の機能ブロック図である。 It is a functional block diagram of an image processing apparatus. 画像処理装置が実行する処理を説明するフローチャートである。 It is a flowchart illustrating a process of the image processing device executes. 画像処理装置が実行する処理を説明するフローチャートである。 It is a flowchart illustrating a process of the image processing device executes. 画像処理装置が実行する処理を説明する説明図である。 It is an explanatory diagram for explaining a process of the image processing device executes.

符号の説明 DESCRIPTION OF SYMBOLS

1 画像処理装置 17 記憶媒体 20 プログラム First image processing apparatus 17 the storage medium 20 the program

Claims (10)

  1. オリジナルの画像データの解像度を変換する第一の解像度変換手段と、 A first resolution conversion means for converting the resolution of the original image data,
    前記第一の解像度変換手段により解像度が変換された画像データから画像の文字部分を抽出する抽出手段と、 Extracting means for resolution is to extract a character portion of the image from the image data converted by said first resolution conversion means,
    前記オリジナルの画像データの解像度を、前記第一の手段より低い解像度に変換する第二の解像度変換手段と、 The resolution of the image data of the original, a second resolution conversion means for converting lower than the first unit resolution,
    前記抽出手段により抽出された文字部分の画像データを文字画像として、前記第二の解像度変換手段により解像度が変換された画像データを背景画像として、別個に1又は複数のファイルとして保存するファイル作成手段とを備え、 As the image data character image of a character portion extracted by the extraction unit, the second image data whose resolution has been converted as a background image by the resolution conversion unit, the file creation means for storing separately as one or more files It equipped with a door,
    前記ファイル作成手段は、前記文字画像を可逆圧縮で、前記背景画像は非可逆圧縮で、それぞれ圧縮符号化した上で前記1又は複数のファイルとして保存すること、 The file creating unit, wherein a character image in lossless compression, the background image is lossy compression, be saved as the one or more files on the compression-encoded,
    を特徴とする画像処理装置。 The image processing apparatus according to claim.
  2. 前記抽出手段は、前記画像データがカラー画像である場合に所定のサンプリング間隔で前記抽出を行う、請求項1に記載の画像処理装置。 Said extraction means performs said extraction at a predetermined sampling interval when the image data is a color image, the image processing apparatus according to claim 1.
  3. 前記ファイル作成手段は、前記画像データがカラー画像である場合に前記文字画像を1又は複数枚の二値画像として前記ファイルに保存する、請求項1又は2に記載の画像処理装置。 The file creating unit, wherein the image data to store the character images on one or a plurality of the file as a binary image in the case of a color image, the image processing apparatus according to claim 1 or 2.
  4. 前記抽出手段は、前記画像データを二値化処理してから文字部分を抽出し、該文字部分に対応するカラー画像の色を抽出して、文字色を特定する、請求項3に記載の画像処理装置。 The extraction means, the image data and extracting a character part from the binarized, extracts the color of the color image corresponding to the character portion, identifying the character color image according to claim 3 processing apparatus.
  5. 前記ファイル作成手段は、前記画像データがカラー画像である場合に前記文字画像を減色したカラー画像として前記文字画像を前記ファイルに保存する、請求項1〜4のいずれかの一に記載の画像処理装置。 The file creating unit, wherein the image data to store the character image as a color image of the character image and color reduction when a color image on the file, the image processing according to one of any claims 1 to 4 apparatus.
  6. 前記ファイル作成手段は、前記非可逆圧縮の前に前記背景画像を平滑化する、請求項1〜4のいずれかの一に記載の画像処理装置。 The file creating unit, wherein the smoothing the pre-xenon scene image in front of the non-reversible compression, the image processing apparatus according to one of claim 1.
  7. 前記ファイル作成手段は、前記文字画像をOCR処理して、このOCRの結果を透明色のテキストのテキストデータとしたもの、前記文字画像、及び前記背景画像をそれぞれレイヤとするレイヤ管理されたファイルとして前記ファイルの保存を行い、前記テキストデータのレイヤは前記文字画像のレイヤより上位のレイヤとする、請求項1〜4のいずれかの一に記載の画像処理装置。 The file creating unit, before Kibun letter image by OCR processing, those with text data of the text in transparent color The results of this OCR, and pre Kibun shaped images, and pre-xenon scene image, respectively Layer and save the file as layer management file, the layer of the text data and the character image of a layer above the layer, the image processing apparatus according to one of any claims 1 to 4.
  8. オリジナルの画像データの解像度を変換する第一の解像度変換手順と、 A first resolution conversion procedure for converting the resolution of the original image data,
    前記第一の解像度変換手段により解像度が変換された画像データから画像の文字部分を抽出する抽出手順と、 An extraction procedure resolution extracting a character portion of the image from the image data converted by said first resolution conversion means,
    前記オリジナルの画像データの解像度を、前記第一の手段より低い解像度に変換する第二の解像度変換手順と、 The resolution of the image data of the original, a second resolution conversion procedure for converting the lower resolution the first means,
    前記抽出手順により抽出された文字部分の画像データを文字画像として、前記第二の解像度変換手順により解像度が変換された画像データを背景画像として、別個に1又は複数のファイルとして保存するファイル作成手順とを備え、 As the image data character image of a character portion extracted by the extraction procedure, the file creation procedure the resolution by the second resolution conversion procedure for saving the image data converted as a background image, separately as one or more files It equipped with a door,
    前記ファイル作成手順は、前記文字画像を可逆圧縮で、前記背景画像は非可逆圧縮で、それぞれ圧縮符号化した上で前記1又は複数のファイルとして保存すること、 The file creation process is a lossless compression of the character image, the background image is lossy compression, be saved as the one or more files on the compression-encoded,
    を特徴とする画像処理方法。 Image processing method according to claim.
  9. 請求項8に記載の画像処理方法をコンピュータに実行させるためのプログラム。 Program for executing the image processing method according to the computer to claim 8.
  10. 請求項9に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。 Computer readable recording medium recording the program according to claim 9.
JP2003427017A 2003-05-15 2003-12-24 An image processing apparatus, program and storage medium Active JP4383157B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003137327 2003-05-15
JP2003427017A JP4383157B2 (en) 2003-05-15 2003-12-24 An image processing apparatus, program and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003427017A JP4383157B2 (en) 2003-05-15 2003-12-24 An image processing apparatus, program and storage medium

Publications (2)

Publication Number Publication Date
JP2004362541A true JP2004362541A (en) 2004-12-24
JP4383157B2 true JP4383157B2 (en) 2009-12-16

Family

ID=34067268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003427017A Active JP4383157B2 (en) 2003-05-15 2003-12-24 An image processing apparatus, program and storage medium

Country Status (1)

Country Link
JP (1) JP4383157B2 (en)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4618676B2 (en) * 2005-04-28 2011-01-26 株式会社リコー The method of transferring structured document code, the image processing system, a server device, program, and information recording medium
JP4810262B2 (en) * 2006-03-17 2011-11-09 株式会社リコー Image processing system
US8306336B2 (en) 2006-05-17 2012-11-06 Qualcomm Incorporated Line or text-based image processing tools
JP2009294788A (en) * 2008-06-03 2009-12-17 Ricoh Co Ltd Information processor, information processing method, control program, and recording medium
JP5306060B2 (en) * 2009-06-01 2013-10-02 キヤノン株式会社 Image processing apparatus and image processing method
JP5491458B2 (en) * 2010-06-30 2014-05-14 株式会社東芝 Image forming apparatus and control method thereof
JP5776419B2 (en) 2011-07-29 2015-09-09 ブラザー工業株式会社 Image processing apparatus, image processing Puraguramu
JP5853470B2 (en) 2011-07-29 2016-02-09 ブラザー工業株式会社 Image processing apparatus, image processing Puraguramu
JP5796392B2 (en) 2011-07-29 2015-10-21 ブラザー工業株式会社 Image processing apparatus, and a computer plug ram
JP5842441B2 (en) 2011-07-29 2016-01-13 ブラザー工業株式会社 An image processing apparatus and program
JP5874497B2 (en) 2012-03-30 2016-03-02 ブラザー工業株式会社 An image processing apparatus and an image processing program
JP5939154B2 (en) 2012-12-27 2016-06-22 ブラザー工業株式会社 An image processing apparatus and a computer program
JP6191505B2 (en) 2014-02-28 2017-09-06 ブラザー工業株式会社 Image processing apparatus, and image processing program

Also Published As

Publication number Publication date Type
JP2004362541A (en) 2004-12-24 application

Similar Documents

Publication Publication Date Title
US5956425A (en) Image processing apparatus and method
US8345998B2 (en) Compression scheme selection based on image data type and user selections
US20040017579A1 (en) Method and apparatus for enhancement of digital image quality
US6981644B2 (en) Apparatus and method for recognizing code
US20030202697A1 (en) Segmented layered image system
US20040257622A1 (en) Image processing apparatus, image processing system, and computer program
US6668101B2 (en) Image processing apparatus and method, and computer-readable memory
US7623712B2 (en) Image processing method and apparatus
US20050281474A1 (en) Segmentation-based hybrid compression scheme for scanned documents
US20030149936A1 (en) Digital watermark embedding apparatus for document, digital watermark extraction apparatus for document, and their control method
JP2004265384A (en) Image processing system, information processing device, control method, computer program, and computer-readable storage medium
US20090214115A1 (en) Image processing apparatus and computer readable medium
US20050123209A1 (en) Image processing system and image processing method
US5388167A (en) Document image processing system and document image processing method
US20090324065A1 (en) Image processing apparatus and method
US20040257625A1 (en) Apparatus for, method of, and system for image processing
JP2002077633A (en) Apparatus and method of image processing
US20050047659A1 (en) Image processing apparatus, image processing method and computer program
US7145676B2 (en) Compound document image compression using multi-region two layer format
JP2006134337A (en) Method and apparatus for decoding mixed code, and recording medium
US20080317348A1 (en) Image processing apparatus, image reproduction apparatus, system, method and storage medium for image processing and image reproduction
US20030039394A1 (en) Image processing device, image processing method, image processing program, and computer readable recording medium on which image processing program is recorded
JP2008028717A (en) Image processor and method and program
US20050036694A1 (en) Compression of mixed raster content (MRC) image data
JP2000322417A (en) Device and method for filing image and storage medium

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041013

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060809

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090915

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090918

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131002

Year of fee payment: 4