JP2004362541A - Image processing device, program, and storage medium - Google Patents

Image processing device, program, and storage medium Download PDF

Info

Publication number
JP2004362541A
JP2004362541A JP2003427017A JP2003427017A JP2004362541A JP 2004362541 A JP2004362541 A JP 2004362541A JP 2003427017 A JP2003427017 A JP 2003427017A JP 2003427017 A JP2003427017 A JP 2003427017A JP 2004362541 A JP2004362541 A JP 2004362541A
Authority
JP
Japan
Prior art keywords
image
character
extracted
file
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003427017A
Other languages
Japanese (ja)
Other versions
JP4383157B2 (en
Inventor
Toshio Miyazawa
利夫 宮澤
Fumihiro Hasegawa
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003427017A priority Critical patent/JP4383157B2/en
Publication of JP2004362541A publication Critical patent/JP2004362541A/en
Application granted granted Critical
Publication of JP4383157B2 publication Critical patent/JP4383157B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To reduce a data volume, and to enable high speed processing, in displaying a text image overlapped on a background image. <P>SOLUTION: The text image of a text portion extracted from an image, and the background image of the remained image in which the extracted portion is not made up for are processed through a predetermined resolution change process and a predetermined compressed encoding process, and stored in one or more files. When displaying the image, the text image of opaque color is superposed and overwritten in the position of the text portion of the background image (Step S13). <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

この発明は、画像処理装置、プログラム及び記憶媒体に関する。   The present invention relates to an image processing device, a program, and a storage medium.

特許文献1には、画像の文字部分を除去し、周辺の色で埋めた背景画像を作成する技術が開示されている。   Patent Literature 1 discloses a technique for removing a character portion of an image and creating a background image filled with surrounding colors.

特許文献2には、カラー画像から文字情報を抽出、符号化する第1の手段と、画像データの解像度を下げて符号化する第2の手段を備え、各々のデータを合成する符号化技術が提案されている。   Patent Literature 2 discloses a coding technique that includes first means for extracting and coding character information from a color image and second means for coding by lowering the resolution of image data, and combining the respective data. Proposed.

特許文献3には、画像データから抽出したテキストデータを検索情報に登録でき、画像データは低解像度で保管する技術について提案されている。   Patent Document 3 proposes a technique in which text data extracted from image data can be registered in search information, and the image data is stored at a low resolution.

特許文献4には、自然画像と文字が混在するカラー文書画像を文字地肌ブロックと、画像データブロックに分け、各領域に適した符号化を行ない、絵柄領域の解像度は低く設定する技術が提案されている。   Patent Document 4 proposes a technique in which a color document image in which a natural image and a character are mixed is divided into a character background block and an image data block, and encoding suitable for each area is performed, and the resolution of the picture area is set low. ing.

特許第2611012号公報Japanese Patent No. 2611012 特開平8−186711号公報JP-A-8-186711 特開2001−297104公報JP 2001-297104 A 特許第3108133号公報Japanese Patent No. 3108133

文字画像を含む画像の画像データについては、文字画像を分離し、分離後の文字画像、背景画像のそれぞれに適した画像処理、圧縮処理方式で処理を行った後、文字画像を上から重ね合わせることが可能な、マルチレイア機能を有するファイル形式により保存することで、文字画像の視認性、背景画像の視認性を向上させることが可能となる。   For image data of an image including a character image, the character image is separated, and image processing and compression processing suitable for each of the separated character image and background image are performed. Then, the character images are superimposed from above. It is possible to improve the visibility of a character image and the visibility of a background image by saving the file in a file format having a multi-layer function.

これに対し、特許文献1に開示の技術では、画像の文字部分を除去し、周辺の色で埋めた背景画像を作成する技術が開示されている。   On the other hand, in the technique disclosed in Patent Document 1, a technique of removing a character portion of an image and creating a background image filled with peripheral colors is disclosed.

しかしながら、特許文献1に開示の技術では、画像の文字部分を除去して周辺の色で埋める処理を行なうので、データ量を削減し、高速な処理を可能とすることができないという不具合がある。   However, in the technique disclosed in Patent Document 1, since a process of removing a character portion of an image and filling the image with surrounding colors is performed, there is a problem that a data amount cannot be reduced and high-speed processing cannot be performed.

本発明の目的は、背景画像に文字画像を重ねて表示するのに際して、データ量を削減し、高速な処理を可能とすることである。   An object of the present invention is to reduce the amount of data and to perform high-speed processing when displaying a character image over a background image.

請求項1に記載の発明は、画像データから画像の文字部分を抽出する抽出手段と、この抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に1又は複数のファイルとして保存するファイル作成手段と、を備えている画像処理装置である。   According to the first aspect of the present invention, there is provided an extracting means for extracting a character portion of an image from image data, and filling a predetermined image in a region where the character image as the extracted image and the character portion of the extracted image are extracted. And a file creating unit that saves the background image without being saved as one or more files separately.

請求項2に記載の発明は、請求項1に記載の画像処理装置において、前記抽出手段は、前記画像データがカラー画像である場合に所定のサンプリング間隔で前記抽出を行う。   According to a second aspect of the present invention, in the image processing apparatus according to the first aspect, when the image data is a color image, the extraction unit performs the extraction at a predetermined sampling interval.

請求項3に記載の発明は、請求項1又は2に記載の画像処理装置において、前記ファイル作成手段は、前記画像データがカラー画像である場合に前記文字画像を1又は複数枚の二値画像として前記ファイルに保存する。   According to a third aspect of the present invention, in the image processing apparatus according to the first or second aspect, when the image data is a color image, the character image is converted into one or more binary images. In the file.

請求項4に記載の発明は、請求項3に記載の画像処理装置において、前記抽出手段は、前記画像データを二値化処理してから文字部分を抽出し、該文字部分に対応するカラー画像の色を抽出して、文字色を特定する。   According to a fourth aspect of the present invention, in the image processing apparatus according to the third aspect, the extracting means extracts a character portion after binarizing the image data, and extracts a color image corresponding to the character portion. Is extracted to specify the character color.

請求項5に記載の発明は、請求項1〜4のいずれかの一に記載の画像処理装置において、前記ファイル作成手段は、前記画像データがカラー画像である場合に前記文字画像を減色したカラー画像として前記文字画像を前記ファイルに保存する。   According to a fifth aspect of the present invention, in the image processing apparatus according to any one of the first to fourth aspects, when the image data is a color image, the color of the character image is reduced. The character image is stored in the file as an image.

請求項6に記載の発明は、請求項1〜5のいずれかの一に記載の画像処理装置において、前記ファイル作成手段は、前記抽出した文字画像を可逆圧縮で、前記抽出後の背景画像は非可逆圧縮で、それぞれ圧縮符号化した上で前記1又は複数のファイルとして保存する。   According to a sixth aspect of the present invention, in the image processing apparatus according to any one of the first to fifth aspects, the file creating unit performs lossless compression on the extracted character image, and the extracted background image is Each of the files is compressed and encoded by irreversible compression, and is stored as the one or more files.

請求項7に記載の発明は、請求項6に記載の画像処理装置において、前記ファイル作成手段は、前記非可逆圧縮の前に前記抽出後の背景画像を平滑化する。   According to a seventh aspect of the present invention, in the image processing apparatus according to the sixth aspect, the file creating means smoothes the extracted background image before the lossy compression.

請求項8に記載の発明は、請求項6又は7に記載の画像処理装置において、前記ファイル作成手段は、前記抽出した文字画像をOCR処理して、このOCRの結果を透明色のテキストのテキストデータとしたもの、前記抽出した文字画像、及び前記抽出後の背景画像をそれぞれレイヤとするレイヤ管理されたファイルとして前記ファイルの保存を行い、前記テキストデータのレイヤは前記文字画像のレイヤより上位のレイヤとする。   According to an eighth aspect of the present invention, in the image processing apparatus according to the sixth or seventh aspect, the file creating means performs an OCR process on the extracted character image, and outputs the OCR result as a transparent text. The file is stored as a layer-managed file having the data, the extracted character image, and the extracted background image as layers, and the text data layer is higher than the character image layer. Layer.

請求項9に記載の発明は、画像データから画像の文字部分を抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に保存している1又は複数のファイルを対象として、前記背景画像の前記文字部分を抽出した領域に前記文字画像を不透明色で重ねた画像を作成する画像作成手段を備えている、画像処理装置である。   According to a ninth aspect of the present invention, a character image which is an image obtained by extracting a character portion of an image from image data and a background image which is not filled with a predetermined image in a region where the character portion of the extracted image is extracted are included. Image processing means for creating an image in which the character image is superimposed in an opaque color on an area where the character portion of the background image is extracted, for one or a plurality of separately stored files; Device.

請求項10に記載の発明は、画像データから画像の文字部分を抽出する抽出処理と、この抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に1又は複数のファイルとして保存するファイル作成処理と、をコンピュータに実行させるコンピュータに読み取り可能なプログラムである。   According to a tenth aspect of the present invention, there is provided an extraction process for extracting a character portion of an image from image data, and filling a predetermined image in a region where the extracted character image and a character portion of the extracted image are extracted. A computer-readable program that causes a computer to execute a file creation process of separately saving one or more files with a background image that has not been saved.

請求項11に記載の発明は、画像データから画像の文字部分を抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に保存している1又は複数のファイルを対象として、前記背景画像の前記文字部分を抽出した領域に前記文字画像を不透明色で重ねた画像を作成する画像作成処理を、コンピュータに実行させるコンピュータに読み取り可能なプログラムである。   According to an eleventh aspect of the present invention, a character image, which is an image obtained by extracting a character portion of an image from image data, and a background image which is not filled with a predetermined image in a region where the character portion of the extracted image is extracted, are included. A computer that causes a computer to execute an image creation process of creating an image in which the character image is overlapped with an opaque color on an area where the character portion of the background image is extracted, for one or a plurality of separately stored files. It is a readable program.

請求項12に記載の発明は、請求項10又は11に記載のプログラムを記憶している、記憶媒体である。   According to a twelfth aspect of the present invention, there is provided a storage medium storing the program according to the tenth or eleventh aspect.

請求項1,10に記載の発明は、背景画像は文字画像を抽出した後の領域について、穴埋めを行わないので、背景画像の文字部分を抽出した領域に文字画像を不透明色で重ねた画像を作成するようにすれば、文字画像、背景画像からなる前述のファイルはデータ量を少なくすることができ、なおかつ、文字の可読性を損なわない画像を高速に作成することが可能となる。また、文字画像と背景画像とを別個に1又は複数のファイルで保存するので、背景画像は、たとえ文字画像も含めて画像全体を平滑化処理したとしても、最終的にユーザに提供される画像には平滑化処理の影響を何ら及ぼさないようにすることができる。   According to the first and tenth aspects of the present invention, since the background image is not filled in the area after the character image is extracted, the image obtained by overlapping the character image with the opaque color on the area where the character portion of the background image is extracted is used. If the file is created, the above-mentioned file including the character image and the background image can reduce the data amount, and can quickly create an image that does not impair the readability of the character. Further, since the character image and the background image are separately stored in one or a plurality of files, even if the entire image including the character image is smoothed, the background image is provided to the user. Has no influence on the smoothing process.

請求項2に記載の発明は、請求項1に記載の発明において、処理に必要な記憶容量を節減し、高速な処理が可能となる。   According to a second aspect of the present invention, in the first aspect of the present invention, the storage capacity required for processing is reduced, and high-speed processing is enabled.

請求項3に記載の発明は、請求項1又は2に記載の発明において、文字部の色は、一般に1色又はそれほど数が多くない色数で書かれていることが普通であるので、文字部の色をクラスタリング処理などして特定し、クラスタリング結果に応じた色の1又は複数枚の二値画像で文字画像を作成することができる。   According to the invention described in claim 3, in the invention described in claim 1 or 2, the color of the character portion is generally written in one color or not so many colors. The color of a part can be specified by clustering processing or the like, and a character image can be created from one or a plurality of binary images of a color corresponding to the clustering result.

請求項4に記載の発明は、請求項3に記載の発明において、クラスタリング結果に応じた色の1又は複数枚の二値画像で文字画像を作成することができる。   According to a fourth aspect of the present invention, in the third aspect, a character image can be created from one or a plurality of binary images of a color corresponding to a clustering result.

請求項5に記載の発明は、請求項1〜4のいずれかの一に記載の発明において、文字部分に用いられている色数は、通常それほど多くないことから、1枚の4ビットや8ビットに減色した画像、又は複数枚減色した画像を保持するだけでも充分であり、ユーザにとってもコントラストが高く可視性が高くなる効果がある。   According to a fifth aspect of the present invention, in the invention according to any one of the first to fourth aspects, the number of colors used for the character portion is usually not so large. It is sufficient to hold only an image in which the number of colors has been reduced to a bit or an image in which the number of colors has been reduced.

請求項6に記載の発明は、請求項1〜5のいずれかの一に記載の発明において、文字の二値画像などは文字画像に適した圧縮形式で、背景画像は背景に適した圧縮形式で圧縮符号化することができ、ファイルサイズも小さくすることができる。また、文字画像を可逆圧縮方式で圧縮することで、将来OCRなどの処理で文字コード化したいときにも、認識率を低下させることなくOCR処理が可能となる。   According to a sixth aspect of the present invention, in the invention according to any one of the first to fifth aspects, a binary image of a character is a compression format suitable for a character image, and a background image is a compression format suitable for a background. , And the file size can be reduced. Further, by compressing the character image by the lossless compression method, even when it is desired to convert the character image into a character code by a process such as OCR in the future, the OCR process can be performed without lowering the recognition rate.

請求項7に記載の発明は、請求項6に記載の発明において、最終的にユーザに提供される画像には平滑化処理の影響を何ら及ぼさないようにすることができる。   According to a seventh aspect of the present invention, in the sixth aspect of the invention, it is possible to prevent the image finally provided to the user from being affected by the smoothing process.

請求項8に記載の発明は、請求項6又は7に記載の発明において、テキスト検索が可能なマルチレイア機能をもつファイルを作成できる。   According to the invention described in claim 8, in the invention described in claim 6 or 7, a file having a multi-layer function capable of performing a text search can be created.

請求項9,11に記載の発明は、背景画像は文字画像を抽出した後の領域について、穴埋めを行わずに、背景画像の文字部分を抽出した領域に文字画像を不透明色で重ねた画像を作成することができるので、文字画像、背景画像からなる前述のファイルはデータ量を少なくすることができ、なおかつ、文字の可読性を損なわない画像を高速に作成することが可能となる。   According to the ninth and eleventh aspects of the present invention, the background image is obtained by superimposing an image obtained by superimposing the character image in an opaque color on the region where the character portion of the background image is extracted without performing padding in the region after extracting the character image. Since the file can be created, the above-mentioned file including the character image and the background image can reduce the amount of data, and can quickly create an image that does not impair the readability of the character.

本発明の一実施の形態について説明する。   An embodiment of the present invention will be described.

図1は、本実施の形態である画像処理装置1の電気的な接続を示すブロック図である。図1に示すように、画像処理装置1は、いずれもPCなどのコンピュータであり、各種演算を行ない、画像処理装置1の各部を集中的に制御するCPU11と、各種のROM、RAMからなるメモリ12とが、バス13で接続されている。   FIG. 1 is a block diagram showing an electrical connection of the image processing apparatus 1 according to the present embodiment. As shown in FIG. 1, each of the image processing apparatuses 1 is a computer such as a PC, and performs various operations and centrally controls each unit of the image processing apparatus 1, and a memory including various ROMs and RAMs. 12 are connected by a bus 13.

バス13には、所定のインターフェイスを介して、ハードディスクなどの磁気記憶装置14と、キーボード、マウスなどの入力装置15と、表示装置16と、光ディスクなどの記憶媒体17を読み取る記憶媒体読取装置18と、画像を読み取る画像読取装置21とが接続され、また、ネットワーク4と通信を行なう所定の通信インターフェイス19が接続されている。なお、記憶媒体17としては、CD,DVDなどの光ディスク、光磁気ディスク、フレキシブルディスクなどの各種メディアを用いることができる。また、記憶媒体読取装置18は、具体的には記憶媒体17の種類に応じて光ディスク装置、光磁気ディスク装置、フレキシブルディスク装置などが用いられる。   The bus 13 includes, via a predetermined interface, a magnetic storage device 14 such as a hard disk, an input device 15 such as a keyboard and a mouse, a display device 16, and a storage medium reading device 18 that reads a storage medium 17 such as an optical disk. And an image reading device 21 for reading an image, and a predetermined communication interface 19 for communicating with the network 4 is connected. In addition, as the storage medium 17, various media such as an optical disk such as a CD and a DVD, a magneto-optical disk, and a flexible disk can be used. As the storage medium reading device 18, an optical disk device, a magneto-optical disk device, a flexible disk device, or the like is used depending on the type of the storage medium 17.

画像処理装置1は、この発明の記憶媒体を実施する記憶媒体17から、この発明のプログラムを実施する画像処理プログラム20を読み取って、磁気記憶装置14にインストールする。これらのプログラムはインターネットなどのネットワーク4等を介してダウンロードしてインストールするようにしてもよい。このインストールにより、画像処理装置1は、それぞれ後述する所定の処理の実行が可能な状態となる。なお、画像処理プログラム20は、所定のOS上で動作するものであってもよい。   The image processing apparatus 1 reads an image processing program 20 that implements the program of the present invention from the storage medium 17 that implements the storage medium of the present invention, and installs the image processing program 20 in the magnetic storage device 14. These programs may be downloaded and installed via a network 4 such as the Internet. With this installation, the image processing apparatus 1 is in a state where it can execute predetermined processing described later. Note that the image processing program 20 may operate on a predetermined OS.

図2は、画像処理装置1が画像処理プログラム20に基づいて実現する機能の機能ブロック図であり、図3は、画像処理装置1が実行する処理のフローチャートである。図5は、画像処理装置1が実行する処理の説明図である。   FIG. 2 is a functional block diagram of functions realized by the image processing apparatus 1 based on the image processing program 20, and FIG. 3 is a flowchart of processing executed by the image processing apparatus 1. FIG. 5 is an explanatory diagram of a process executed by the image processing apparatus 1.

図2、図3、図5に示すように、まず、原稿の画像を例えば600dpiのカラー画像で画像読取装置21により読み取る(ステップS1)。そして、この読み取った画像データ(図5(a)のオリジナル画像41)について以下のような2系統の処理を行なう。   As shown in FIG. 2, FIG. 3, and FIG. 5, first, the image of the document is read by the image reading device 21 as a 600 dpi color image (step S1). Then, the following two processes are performed on the read image data (the original image 41 in FIG. 5A).

一つ目の処理は、ステップS1で読み取った画像データを対象に、解像度変換・圧縮部31で解像度変換を行なってデータ量を低減し(例えば300dpiのカラー画像に変換する)(ステップS2)、このカラー画像からそれぞれの文字色を減色部33で特定して、文字色ごとの二値化を二値化部34で行なって(ステップS3)、文字抽出部32により少なくとも文字領域(画素又はエリア)を抽出して(抽出手段、抽出処理)(ステップS4)、二値画像である文字画像42を作成し(図5(b))(ステップS5)、これを解像度変換・圧縮部31で、MMRなどの可逆圧縮方式で圧縮符号化して(ステップS6)、さらにデータ量を削減するものである。なお、ここでは、文字に特定しているが、文字以外に罫線などの情報を文字とともに抽出しても構わない。また、文字や罫線の特徴である、エッジなどに注目し、文字である可能性の高い領域を文字領域として抽出してもよい。必ずしも画像から文字領域を正確に抽出することが目的ではないからである。   In the first process, the image data read in step S1 is subjected to resolution conversion by the resolution conversion / compression unit 31 to reduce the data amount (for example, to convert to a 300 dpi color image) (step S2). From the color image, each character color is specified by the color reduction unit 33, binarization for each character color is performed by the binarization unit 34 (step S3), and at least the character area (pixel or area) is processed by the character extraction unit 32. ) Is extracted (extraction means, extraction processing) (step S4), and a character image 42, which is a binary image, is created (FIG. 5B) (step S5). The compression encoding is performed by a lossless compression method such as MMR (step S6), and the data amount is further reduced. Here, although the information is specified as characters, information such as ruled lines other than the characters may be extracted together with the characters. In addition, an area that is likely to be a character may be extracted as a character area by paying attention to an edge or the like that is a characteristic of a character or a ruled line. This is because the purpose is not necessarily to accurately extract a character region from an image.

二つ目の処理は、ステップS1で読み取った画像データを対象に(文字画像も含む)、解像度変換・圧縮部31でJPEGなどの非可逆圧縮方式で解像度変換を行なって、一つ目の処理よりさらにデータ量を低減する(例えば150dpiのカラー画像に変換する)(ステップS7)。この場合の処理対象となるオリジナル画像41は、ステップS3で文字画像42を抽出後に、その文字抽出後の領域に穴埋め(所定の画素値を与えるなど)は行わないままで用いる。これを背景画像43とし(図5(b))(ステップS8)、これを解像度変換・圧縮部31で圧縮符号化して(ステップS9)、さらにデータ量を削減するものである。   In the second processing, the resolution conversion / compression unit 31 performs resolution conversion on the image data read in step S1 (including character images) by a lossy compression method such as JPEG, and performs the first processing. The data amount is further reduced (for example, conversion into a 150 dpi color image) (step S7). In this case, the original image 41 to be processed is used after the character image 42 is extracted in step S3 without filling in the area after the character extraction (for example, giving a predetermined pixel value). This is used as a background image 43 (FIG. 5 (b)) (step S8), which is compression-coded by the resolution conversion / compression unit 31 (step S9) to further reduce the data amount.

このようにそれぞれ作成された文字画像42と背景画像43とは、別個に1つ又は複数のファイル(PDFファイル)として保存される(ファイル作成手段、ファイル作成処理)(ステップS10)。具体的には、例えば、マルチレイヤ機能を備えたPDFやJPEG2000などの単一のファイルとして保存することが考えられる。この場合、レイヤ管理されたファイルの第1層(下位層)には背景画像、第2層(上位層)には文字画像を配置する。   The character image 42 and the background image 43 thus created are separately stored as one or a plurality of files (PDF files) (file creation means, file creation processing) (step S10). Specifically, for example, saving as a single file such as PDF or JPEG2000 having a multi-layer function is conceivable. In this case, a background image is arranged on the first layer (lower layer) and a character image is arranged on the second layer (upper layer) of the layer-managed file.

このようにして作成したファイルのデータを表示装置16に表示等する場合の処理について、図2の機能ブロック図、図4のフローチャート、及び、図5の説明図を参照して説明する。   The process of displaying the data of the file created in this manner on the display device 16 will be described with reference to the functional block diagram of FIG. 2, the flowchart of FIG. 4, and the explanatory diagram of FIG.

すなわち、画像処理装置1で、ステップS10で作成したファイルを表示装置16に表示等する場合は(ステップS11のY)、文字画像42の解像度変換を解像度変換・圧縮部31で行って、文字画像42を解像度変換された文字画像44とし、文字画像44と背景画像43との解像度をそろえる(ステップS12)。そして、背景画像43の画像上の文字位置に対応する文字の文字画像44を不透明色として重ね合わせて上書きする(図5(d)の画像45)(ステップS13)。この重ね合わせた画像を表示装置16に表示(あるいは印刷、外部に送信など)すれば、文字画像44と背景画像43とが重なった画像を1枚の画像のごとく見ることができる。   That is, when the image processing apparatus 1 displays the file created in step S10 on the display device 16 (Y in step S11), the resolution conversion / compression unit 31 performs resolution conversion of the character image 42 and outputs the character image. 42 is a character image 44 whose resolution has been converted, and the resolutions of the character image 44 and the background image 43 are made uniform (step S12). Then, the character image 44 of the character corresponding to the character position on the background image 43 is overwritten as an opaque color (image 45 in FIG. 5D) (step S13). If the superimposed image is displayed (or printed, transmitted to the outside, or the like) on the display device 16, an image in which the character image 44 and the background image 43 overlap can be viewed as one image.

前述のように、背景画像43は文字画像42を抽出した後の領域について、穴埋めを行わないので、文字画像42、背景画像43からなる前述のファイルはデータ量を少なくすることができ、なおかつ、文字の可読性を損なわない画像を高速に作成することが可能となる。   As described above, since the background image 43 does not fill in the area after the extraction of the character image 42, the above-described file including the character image 42 and the background image 43 can reduce the data amount, and An image that does not impair the readability of characters can be created at high speed.

なお、ステップS3においては、オリジナル画像41から所定のサンプリング間隔で画像を抽出することで、処理に必要な記憶容量を節減し、高速な処理が可能となる。すなわち、前述の特許文献1に開示の技術などでは、文字部を抽出し、その背景の色を求めるために、少なくとも文字の背景を計算するためのメモリが必要になるが、本実施の形態ではこれが不要となる。つまり、本実施の形態では、文字画像44は背景画像43に不透明色で重ねて表示されるので、オリジナル画像41の背景の色を特定し、オリジナル画像41から文字部分を消す必要はないので、所定の間隔で文字画像42の抽出処理を行い、背景の色の抽出処理が不要となり、そのための処理時間、それに要するメモリが不要となる。   In step S3, by extracting an image from the original image 41 at a predetermined sampling interval, the storage capacity required for the processing can be reduced, and high-speed processing can be performed. That is, in the technique disclosed in Patent Document 1 described above, a memory for calculating at least the background of a character is required in order to extract the character portion and obtain the color of the background, but in the present embodiment, This becomes unnecessary. That is, in the present embodiment, since the character image 44 is displayed in an opaque color on the background image 43, it is not necessary to specify the background color of the original image 41 and delete the character portion from the original image 41. The extraction processing of the character image 42 is performed at predetermined intervals, and the extraction processing of the background color is not required, and the processing time and the memory required for the processing time are not required.

前述のように、文字画像42として、1枚または複数枚の二値画像を作成する。これは、文字部の色は、一般に黒、赤、青など、1色又はそれほど数が多くない色数で書かれていることが普通であるので、文字部の色をクラスタリング処理などして特定し、クラスタリング結果に応じた色の複数枚の二値画像を作成するものである。   As described above, one or more binary images are created as the character image 42. This is because the color of the character portion is generally written in one color or a small number of colors, such as black, red, and blue, and the color of the character portion is specified by clustering processing or the like. Then, a plurality of binary images of a color corresponding to the clustering result are created.

このクラスタリングの手法の例を示す。すなわち、ステップS3,S4においては、文字画像を先に二値化処理し、その二値画像から文字部を抽出するようにしている。ここでは、抽出された文字部に対応するカラーオリジナル画像の画素値(RGB値)を参照し、RGBの3次元空間に度数ヒストグラムを作成する。次に、その度数ヒストグラムを幾つかのクラスに分割するためのクラスタリングを行う。このクラスタリングの方法は、特別な方法を用いることはなく、一般的に知られているK−ミーン法などを用いればよい。   An example of this clustering method will be described. That is, in steps S3 and S4, the character image is binarized first, and the character portion is extracted from the binary image. Here, a frequency histogram is created in a three-dimensional RGB space with reference to the pixel values (RGB values) of the color original image corresponding to the extracted character part. Next, clustering for dividing the frequency histogram into several classes is performed. This clustering method does not use a special method, but may use a generally known K-mean method or the like.

また、文字画像42として、1枚または複数枚の文字画像42を作成するに際しては、二値画像ではなく、カラーの多値画像を用いるようにしてもよい。文字部分に用いられている色数は、通常それほど多くないことから、一般のカラー原稿のように、16万色などは不要である。すなわち、1枚の4ビットや8ビットに減色した画像、又は複数枚減色した画像を保持するだけで充分であり、ユーザにとってもコントラストが高く可視性が高くなる効果がある。   When one or more character images 42 are created as the character image 42, a color multi-value image may be used instead of a binary image. Since the number of colors used for the character portion is usually not so large, 160,000 colors or the like are unnecessary as in a general color original. That is, it is sufficient to hold only one image reduced in color to 4 bits or 8 bits, or an image reduced in color to a plurality of images, which has the effect of increasing the contrast and visibility for the user.

なお、前述の例で、抽出した文字画像42(ステップS5)を対象に文字認識(OCR)処理を行い、その文字認識結果を透明テキストのテキストデータとして、レイヤ管理されたファイルの最上位のレイヤ(第3層)に配置し、第1層(下位層)には背景画像、第2層(上位層)には文字画像を配置するようにしてもよい。これにより、テキスト検索が可能なマルチレイア機能をもつ電子ファイルを作成できる。   In the above-described example, character recognition (OCR) processing is performed on the extracted character image 42 (step S5), and the character recognition result is used as transparent text data, and the uppermost layer of the layer-managed file is processed. (Third layer), a background image may be arranged in the first layer (lower layer), and a character image may be arranged in the second layer (upper layer). Thus, an electronic file having a multi-layer function capable of performing a text search can be created.

また、文字画像42は二値化処理されているので(ステップS3)、背景画像43とのコントラストも高く、視認性が高くなっているが、背景画像43については、スキャン画像を印刷すると、通常はこれらのスキャナ機器の特性からモアレなどを生じる。これを解決する手段として、スキャンした画像に対して、平滑化処理を行うとモアレの発生を抑えることが出来ることも一般に知られている。   In addition, since the character image 42 has been subjected to the binarization processing (step S3), the contrast with the background image 43 is high and the visibility is high. Causes moire and the like from the characteristics of these scanner devices. As means for solving this problem, it is generally known that the occurrence of moire can be suppressed by performing a smoothing process on a scanned image.

しかし、スキャンした画像全体に平滑化処理を行うと、文字にもボケが生じ、視認性が悪化する不具合がある。   However, when the smoothing process is performed on the entire scanned image, there is a problem that characters are blurred and visibility is deteriorated.

そこで、文字画像42を抽出した後(ステップS4)の背景画像43の全体、または、背景画像43の中で文字画像42として認識されなかった領域に対して選択的に、平滑化処理、γ補正処理などの画像処理を行なえば、文字画像42以外の視認性も高めることが可能となる。   Therefore, after the character image 42 is extracted (step S4), the entire background image 43 or a region not recognized as the character image 42 in the background image 43 is selectively subjected to smoothing processing and γ correction. If image processing such as processing is performed, it is possible to enhance the visibility other than the character image 42.

さらに、背景画像43は、一般には、文字以外の写真などの画像から構成されるため、文字のような高い解像度を必要としないこともあるので、解像度変換処理により、画像サイズを小さくしてもよい。   Further, since the background image 43 is generally composed of an image such as a photograph other than the character, the background image 43 may not require a high resolution like the character. Good.

本発明の一実施の形態である画像処理装置の電気的な接続のブロック図である。FIG. 2 is a block diagram of an electrical connection of the image processing apparatus according to the embodiment of the present invention. 画像処理装置の機能ブロック図である。FIG. 2 is a functional block diagram of the image processing apparatus. 画像処理装置が実行する処理を説明するフローチャートである。5 is a flowchart illustrating a process executed by the image processing apparatus. 画像処理装置が実行する処理を説明するフローチャートである。5 is a flowchart illustrating a process executed by the image processing apparatus. 画像処理装置が実行する処理を説明する説明図である。FIG. 4 is an explanatory diagram illustrating a process performed by the image processing device.

符号の説明Explanation of reference numerals

1 画像処理装置
17 記憶媒体
20 プログラム
1 image processing device 17 storage medium 20 program

Claims (12)

画像データから画像の文字部分を抽出する抽出手段と、
この抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に1又は複数のファイルとして保存するファイル作成手段と、
を備えている画像処理装置。
Extracting means for extracting a character portion of the image from the image data;
File creation means for separately saving, as one or a plurality of files, a character image that is the extracted image and a background image that is not filled with a predetermined image in a region where the character portion of the extracted image is extracted,
An image processing apparatus comprising:
前記抽出手段は、前記画像データがカラー画像である場合に所定のサンプリング間隔で前記抽出を行う、請求項1に記載の画像処理装置。 The image processing apparatus according to claim 1, wherein the extraction unit performs the extraction at a predetermined sampling interval when the image data is a color image. 前記ファイル作成手段は、前記画像データがカラー画像である場合に前記文字画像を1又は複数枚の二値画像として前記ファイルに保存する、請求項1又は2に記載の画像処理装置。 The image processing apparatus according to claim 1, wherein the file creating unit saves the character image as one or a plurality of binary images in the file when the image data is a color image. 前記抽出手段は、前記画像データを二値化処理してから文字部分を抽出し、該文字部分に対応するカラー画像の色を抽出して、文字色を特定する、請求項3に記載の画像処理装置。 4. The image according to claim 3, wherein the extraction unit extracts a character portion after binarizing the image data, extracts a color of a color image corresponding to the character portion, and specifies a character color. 5. Processing equipment. 前記ファイル作成手段は、前記画像データがカラー画像である場合に前記文字画像を減色したカラー画像として前記文字画像を前記ファイルに保存する、請求項1〜4のいずれかの一に記載の画像処理装置。 The image processing according to claim 1, wherein, when the image data is a color image, the file creating unit saves the character image in the file as a color image obtained by reducing the color of the character image. apparatus. 前記ファイル作成手段は、前記抽出した文字画像を可逆圧縮で、前記抽出後の背景画像は非可逆圧縮で、それぞれ圧縮符号化した上で前記1又は複数のファイルとして保存する、請求項1〜5のいずれかの一に記載の画像処理装置。 6. The file creation unit according to claim 1, wherein the extracted character image is lossless-compressed, and the extracted background image is lossy-compressed, each of which is compression-encoded and stored as the one or more files. The image processing device according to any one of the above. 前記ファイル作成手段は、前記非可逆圧縮の前に前記抽出後の背景画像を平滑化する、請求項6に記載の画像処理装置。 The image processing apparatus according to claim 6, wherein the file creating unit smoothes the extracted background image before the lossy compression. 前記ファイル作成手段は、前記抽出した文字画像をOCR処理して、このOCRの結果を透明色のテキストのテキストデータとしたもの、前記抽出した文字画像、及び前記抽出後の背景画像をそれぞれレイヤとするレイヤ管理されたファイルとして前記ファイルの保存を行い、前記テキストデータのレイヤは前記文字画像のレイヤより上位のレイヤとする、請求項6又は7に記載の画像処理装置。 The file creator performs OCR processing on the extracted character image and converts the result of the OCR into text data of transparent text, the extracted character image, and the extracted background image as layers. The image processing apparatus according to claim 6, wherein the file is stored as a layer-managed file, and the text data layer is a higher layer than the character image layer. 画像データから画像の文字部分を抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に保存している1又は複数のファイルを対象として、前記背景画像の前記文字部分を抽出した領域に前記文字画像を不透明色で重ねた画像を作成する画像作成手段を備えている、画像処理装置。 One or a plurality of images separately storing a character image which is an image obtained by extracting a character portion of an image from image data and a background image which is not filled with a predetermined image in a region where the character portion of the extracted image is extracted. An image processing apparatus comprising: an image creating unit that creates an image in which the character image is superimposed in an opaque color on an area where the character portion of the background image is extracted, for the file. 画像データから画像の文字部分を抽出する抽出処理と、
この抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に1又は複数のファイルとして保存するファイル作成処理と、
をコンピュータに実行させるコンピュータに読み取り可能なプログラム。
An extraction process for extracting a character portion of the image from the image data;
A file creation process of separately saving, as one or a plurality of files, a character image that is the extracted image and a background image that is not filled with a predetermined image in a region where the character portion of the extracted image is extracted,
A computer-readable program that causes a computer to execute.
画像データから画像の文字部分を抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に保存している1又は複数のファイルを対象として、前記背景画像の前記文字部分を抽出した領域に前記文字画像を不透明色で重ねた画像を作成する画像作成処理を、コンピュータに実行させるコンピュータに読み取り可能なプログラム。 One or a plurality of images separately storing a character image which is an image obtained by extracting a character portion of an image from image data and a background image which is not filled with a predetermined image in a region where the character portion of the extracted image is extracted. A computer-readable program for causing a computer to execute an image creation process of creating an image in which the character image is superimposed in an opaque color on an area where the character portion of the background image is extracted, for the file of (1). 請求項10又は11に記載のプログラムを記憶している、記憶媒体。
A storage medium storing the program according to claim 10.
JP2003427017A 2003-05-15 2003-12-24 Image processing apparatus, program, and storage medium Expired - Fee Related JP4383157B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003427017A JP4383157B2 (en) 2003-05-15 2003-12-24 Image processing apparatus, program, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003137327 2003-05-15
JP2003427017A JP4383157B2 (en) 2003-05-15 2003-12-24 Image processing apparatus, program, and storage medium

Publications (2)

Publication Number Publication Date
JP2004362541A true JP2004362541A (en) 2004-12-24
JP4383157B2 JP4383157B2 (en) 2009-12-16

Family

ID=34067268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003427017A Expired - Fee Related JP4383157B2 (en) 2003-05-15 2003-12-24 Image processing apparatus, program, and storage medium

Country Status (1)

Country Link
JP (1) JP4383157B2 (en)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006311200A (en) * 2005-04-28 2006-11-09 Ricoh Co Ltd Method of transferring structured document code, image processing system, server unit, program and information recording medium
JP2007251849A (en) * 2006-03-17 2007-09-27 Ricoh Co Ltd Image processing system
JP2009538057A (en) * 2006-05-17 2009-10-29 クゥアルコム・インコーポレイテッド Line or text-based image processing tool
JP2009294788A (en) * 2008-06-03 2009-12-17 Ricoh Co Ltd Information processor, information processing method, control program, and recording medium
JP2010277535A (en) * 2009-06-01 2010-12-09 Canon Inc Image processing device and image processing method
JP2012016012A (en) * 2010-06-30 2012-01-19 Toshiba Corp Image forming device and method of controlling the same
US8792719B2 (en) 2011-07-29 2014-07-29 Brother Kogyo Kabushiki Kaisha Image processing device determining attributes of regions
US8830529B2 (en) 2011-07-29 2014-09-09 Brother Kogyo Kabushiki Kaisha Image processing device for accurately identifying region in image without increase in memory requirement
US8837836B2 (en) 2011-07-29 2014-09-16 Brother Kogyo Kabushiki Kaisha Image processing device identifying attribute of region included in image
US8929663B2 (en) 2011-07-29 2015-01-06 Brother Kogyo Kabushiki Kaisha Image processing device identifying region in image as one of uniform region and nonuniform region
US9014468B2 (en) 2012-03-30 2015-04-21 Brother Kogyo Kabushiki Kaisha Image processing apparatus, computer-readable storage medium storing computer-readable instructions and associated method
US9300840B2 (en) 2012-12-27 2016-03-29 Brother Kogyo Kabushiki Kaisha Image processing device and computer-readable storage medium storing computer-readable instructions
US9576226B2 (en) 2014-02-28 2017-02-21 Brother Kogyo Kabushiki Kaisha Image processing device for reducing data size of object in image data based on target value
CN106874937A (en) * 2017-01-18 2017-06-20 腾讯科技(上海)有限公司 A kind of character image generation method, device and terminal
JP2019101904A (en) * 2017-12-06 2019-06-24 コニカミノルタ株式会社 Image processing apparatus, image processing method, and program

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006311200A (en) * 2005-04-28 2006-11-09 Ricoh Co Ltd Method of transferring structured document code, image processing system, server unit, program and information recording medium
JP4618676B2 (en) * 2005-04-28 2011-01-26 株式会社リコー Structured document code transfer method, image processing system, server device, program, and information recording medium
JP2007251849A (en) * 2006-03-17 2007-09-27 Ricoh Co Ltd Image processing system
JP2009538057A (en) * 2006-05-17 2009-10-29 クゥアルコム・インコーポレイテッド Line or text-based image processing tool
US8306336B2 (en) 2006-05-17 2012-11-06 Qualcomm Incorporated Line or text-based image processing tools
JP2013117970A (en) * 2006-05-17 2013-06-13 Qualcomm Inc Line or text-based image processing tools
JP2009294788A (en) * 2008-06-03 2009-12-17 Ricoh Co Ltd Information processor, information processing method, control program, and recording medium
JP2010277535A (en) * 2009-06-01 2010-12-09 Canon Inc Image processing device and image processing method
JP2012016012A (en) * 2010-06-30 2012-01-19 Toshiba Corp Image forming device and method of controlling the same
JP2014099936A (en) * 2010-06-30 2014-05-29 Toshiba Corp Image forming apparatus
US8792719B2 (en) 2011-07-29 2014-07-29 Brother Kogyo Kabushiki Kaisha Image processing device determining attributes of regions
US8830529B2 (en) 2011-07-29 2014-09-09 Brother Kogyo Kabushiki Kaisha Image processing device for accurately identifying region in image without increase in memory requirement
US8837836B2 (en) 2011-07-29 2014-09-16 Brother Kogyo Kabushiki Kaisha Image processing device identifying attribute of region included in image
US8929663B2 (en) 2011-07-29 2015-01-06 Brother Kogyo Kabushiki Kaisha Image processing device identifying region in image as one of uniform region and nonuniform region
US9014468B2 (en) 2012-03-30 2015-04-21 Brother Kogyo Kabushiki Kaisha Image processing apparatus, computer-readable storage medium storing computer-readable instructions and associated method
US9300840B2 (en) 2012-12-27 2016-03-29 Brother Kogyo Kabushiki Kaisha Image processing device and computer-readable storage medium storing computer-readable instructions
US9576226B2 (en) 2014-02-28 2017-02-21 Brother Kogyo Kabushiki Kaisha Image processing device for reducing data size of object in image data based on target value
US9788014B2 (en) 2014-02-28 2017-10-10 Brother Kogyo Kabushiki Kaisha Image processing device for reducing data size of object in image data based on target value
CN106874937A (en) * 2017-01-18 2017-06-20 腾讯科技(上海)有限公司 A kind of character image generation method, device and terminal
JP2019101904A (en) * 2017-12-06 2019-06-24 コニカミノルタ株式会社 Image processing apparatus, image processing method, and program

Also Published As

Publication number Publication date
JP4383157B2 (en) 2009-12-16

Similar Documents

Publication Publication Date Title
AU2008212078B2 (en) Image processing apparatus, image processing method, and image processing program
JP5302768B2 (en) Image processing apparatus and image processing method
JP5132530B2 (en) Image coding apparatus, image processing apparatus, and control method thereof
US8244035B2 (en) Image processing apparatus and control method thereof
JP4383157B2 (en) Image processing apparatus, program, and storage medium
JP2010010819A (en) Image processing apparatus, image forming apparatus, image reading apparatus, image processing method, image processing program, and computer-readable recording medium
JPH08235346A (en) Picture processor
JP2007336226A (en) Information processor, control method, and computer program
JP2013145491A (en) Image processing device, image forming device, program and storage medium
JP4364809B2 (en) Image processing apparatus, image processing method, program, and recording medium
JP5893379B2 (en) Image compression apparatus, image compression method, and computer program
JP2008165381A (en) Image processing device and image processing method
JP2611012B2 (en) Character separation encoding method
JP6607490B2 (en) CONVERSION PROCESSING DEVICE, INFORMATION PROCESSING DEVICE EQUIPPED WITH THE SAME, PROGRAM, AND RECORDING MEDIUM
JP2017211936A (en) Document storage processing system
US8577132B2 (en) Electronic document generation system, electronic document generation method, and program
JP2007019673A (en) Image processing apparatus, image compression method, image compression program, and data structure of compressed image
JP2006013590A (en) Image processing apparatus, image processing method, program, and information recording medium
JP4710672B2 (en) Character color discrimination device, character color discrimination method, and computer program
JP2010098743A (en) Image processing device, image reading device, and image processing method
JP2005236800A (en) Image region determining method, image processor, and program
JP2005204206A (en) Image processing apparatus, image processing program, and storage medium
JP2006222940A (en) Image processing apparatus
JP4504096B2 (en) Image processing apparatus, program, and storage medium
JP4757172B2 (en) Image coding apparatus and control method thereof

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041013

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060809

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090915

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090918

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4383157

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131002

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees