JP5245949B2 - Image processing apparatus and image reading apparatus - Google Patents
Image processing apparatus and image reading apparatus Download PDFInfo
- Publication number
- JP5245949B2 JP5245949B2 JP2009064501A JP2009064501A JP5245949B2 JP 5245949 B2 JP5245949 B2 JP 5245949B2 JP 2009064501 A JP2009064501 A JP 2009064501A JP 2009064501 A JP2009064501 A JP 2009064501A JP 5245949 B2 JP5245949 B2 JP 5245949B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- image data
- area
- image area
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Of Band Width Or Redundancy In Fax (AREA)
Description
本発明は、画像処理装置および画像読取装置に関する。 The present invention relates to an image processing apparatus and an image reading apparatus.
例えば画像読み取り装置で読み取った画像について、その画像に含まれる線・面領域・文字・自然画像などの属性ごとに画像領域を区切るという、いわゆる像域分離と呼ばれる技術がある。特許文献1には、イメージ画像かフォント画像もしくはグラフィック画像かを決定する像域分離の技術が開示されている。また、特許文献2には、画像に対して認識した属性に応じて適応的にアウトライン化する技術が開示されている。
For example, for an image read by an image reading apparatus, there is a so-called image area separation technique in which an image area is divided according to attributes such as lines, surface areas, characters, and natural images included in the image. Japanese Patent Application Laid-Open No. H10-228561 discloses an image area separation technique for determining whether an image image, a font image, or a graphic image.
本発明の目的は、画像領域内に互いに隣接して描かれる画素の色、または、画像を構成する画素の配列パターンから、画像に含まれる各画像領域に対応する画像データを、複数の表現形式のうちのいずれによって表現するかを決定する技術を提供することである。 An object of the present invention is to express a plurality of representation formats of image data corresponding to each image area included in an image from the colors of pixels drawn adjacent to each other in the image area or the arrangement pattern of pixels constituting the image. It is to provide a technique for determining which of the two to express.
上述した課題を解決するため、本願の請求項1に記載の画像処理装置は、画像を構成する各画素の色が記述された画像データを取得する取得手段と、前記取得手段により取得された画像データが表す画像を、ラベリング処理によって1つまたは複数の画像領域に区切る区切り手段と、前記区切り手段により区切られた1つ又は複数の画像領域の各々について、当該画像領域に描画対象である要素を描画する処理を数値又は数式により記述した画像データ、当該画像領域に対応する画像データに可逆の圧縮処理を施した画像データ、又は、当該画像領域に対応する画像データに非可逆の圧縮処理を施した画像データのうちのいずれかを生成する生成手段とを具備し、前記生成手段は、前記区切り手段により区切られた画像領域において隣接する画素の色の濃度または明度が、当該隣接する画素間で予め定められた変化量よりも緩やかに変化する第1の場合に、当該画像領域を表す画像データに非可逆の圧縮処理を施した画像データを生成し、第1の場合以外の場合であって、前記画像領域に含まれる画素の色の組み合わせが、予め定められた色の組み合わせと一致する第2の場合に、当該画像領域に前記要素を描画する処理を数値又は数式により記述した画像データを生成し、前記第1の場合および前記第2の場合のいずれでもない場合に、当該画像領域を表す画像データに可逆の圧縮処理を施した画像データを生成することを特徴とする。 In order to solve the above-described problem, an image processing apparatus according to claim 1 of the present application includes an acquisition unit that acquires image data in which a color of each pixel constituting an image is described, and an image acquired by the acquisition unit. Separating means for dividing the image represented by the data into one or a plurality of image areas by labeling processing, and for each of the one or a plurality of image areas divided by the dividing means , an element to be rendered in the image area Image data describing the rendering process with numerical values or mathematical expressions, image data corresponding to the image area subjected to reversible compression processing, or image data corresponding to the image area subjected to irreversible compression processing comprising the and generating means for generating any of the image data, said generating means is adjacent in the image region separated by said separator means An image obtained by performing irreversible compression processing on image data representing the image area in the first case where the density or lightness of the prime color changes more gradually than the predetermined change amount between the adjacent pixels. In a second case where data is generated and the color combination of the pixels included in the image area matches a predetermined color combination in a case other than the first case, the image area Image data describing the process of drawing an element by numerical values or mathematical formulas is generated, and when neither the first case nor the second case is performed, a reversible compression process is performed on the image data representing the image area. It is characterized by generating generated image data .
また、本願の請求項2に記載の画像処理装置は、画像を構成する各画素の色が記述された画像データを取得する取得手段と、前記取得手段により取得された画像データが表す画像を、ラベリング処理によって1つまたは複数の画像領域に区切る区切り手段と、前記区切り手段により区切られた1つ又は複数の画像領域の各々について、当該画像領域に描画対象である要素を描画する処理を数値又は数式により記述した画像データ、当該画像領域に対応する画像データに可逆の圧縮処理を施した画像データ、又は、当該画像領域に対応する画像データに非可逆の圧縮処理を施した画像データのうちのいずれかを生成する生成手段とを具備し、前記生成手段は、前記取得手段により取得された画像データに含まれる画素のうち、文字画像を構成する画素の配列パターンとして予め定められたものと共通する度合が閾値を超える画素を含む画像領域を抽出し、前記区切り手段により区切られた画像領域が、抽出された前記画像領域と重なる場合に、当該区切り手段により区切られた画像領域に前記要素を描画する処理を数値又は数式により記述した画像データを生成することを特徴とする。
An image processing apparatus according to
また、本願の請求項3に記載の画像読取装置は、記録媒体に形成された画像を読み取り、当該画像を表わす画像データを生成する読取手段と、前記読取手段により生成された画像データが表わす画像を、ラベリング処理によって1つまたは複数の画像領域に区切る区切り手段と、前記区切り手段により区切られた1つ又は複数の画像領域の各々について、当該画像領域に描画対象である要素を描画する処理を数値又は数式により記述した画像データ、当該画像領域に対応する画像データに可逆の圧縮処理を施した画像データ、又は、当該画像領域に対応する画像データに非可逆の圧縮処理を施した画像データのうちのいずれかを生成する生成手段とを具備し、前記生成手段は、前記区切り手段により区切られた画像領域において隣接する画素の色の濃度または明度が、当該隣接する画素間で予め定められた変化量よりも緩やかに変化する第1の場合に、当該画像領域を表す画像データに非可逆の圧縮処理を施した画像データを生成し、第1の場合以外の場合であって、前記画像領域に含まれる画素の色の組み合わせが、予め定められた色の組み合わせと一致する第2の場合に、当該画像領域に前記要素を描画する処理を数値又は数式により記述した画像データを生成し、前記第1の場合および前記第2の場合のいずれでもない場合に、当該画像領域を表す画像データに可逆の圧縮処理を施した画像データを生成することを特徴とする。
An image reading apparatus according to
また、本願の請求項4に記載の画像読取装置は、記録媒体に形成された画像を読み取り、当該画像を表わす画像データを生成する読取手段と、前記読取手段により生成された画像データが表わす画像を、ラベリング処理によって1つまたは複数の画像領域に区切る区切り手段と、前記区切り手段により区切られた1つ又は複数の画像領域の各々について、当該画像領域に描画対象である要素を描画する処理を数値又は数式により記述した画像データ、当該画像領域に対応する画像データに可逆の圧縮処理を施した画像データ、又は、当該画像領域に対応する画像データに非可逆の圧縮処理を施した画像データのうちのいずれかを生成する生成手段とを具備し、前記生成手段は、前記取得手段により取得された画像データに含まれる画素のうち、文字画像を構成する画素の配列パターンとして予め定められたものと共通する度合が閾値を超える画素を含む画像領域を抽出し、前記区切り手段により区切られた画像領域が、抽出された前記画像領域と重なる場合に、当該区切り手段により区切られた画像領域に前記要素を描画する処理を数値又は数式により記述した画像データを生成することを特徴とする。 An image reading apparatus according to claim 4 of the present application reads an image formed on a recording medium, generates image data representing the image, and an image represented by the image data generated by the reading unit. Is divided into one or a plurality of image areas by a labeling process, and for each of the one or a plurality of image areas divided by the separation means, a process of drawing an element to be drawn in the image area Image data described by numerical values or mathematical expressions, image data obtained by performing reversible compression processing on image data corresponding to the image region, or image data obtained by performing irreversible compression processing on image data corresponding to the image region comprises a generating means for generating one of out, said generating means, among the pixels included in the image data acquired by the acquisition unit Extracting an image area including pixels whose degree of commonness with a predetermined pixel pattern constituting the character image exceeds a threshold value, and the image area partitioned by the partitioning means is the extracted image area In the case of overlapping, image data in which the process of drawing the element in the image area delimited by the delimiting means is described by numerical values or mathematical expressions is generated.
本願の請求項1に記載の画像処理装置によれば、画像領域内に互いに隣接して描かれる画素の色に応じて、複数の表現形式のうちのいずれかをその画像に応じた表現形式として選択することができる。
本願の請求項2に記載の画像処理装置によれば、画像を構成する画素の配列パターンに基づいて、その画像を描画する処理を数値または数式により記述すべきか否かを判断することができる。
本願の請求項3に記載の画像読取装置によれば、画像領域内に互いに隣接して描かれる画素の色に応じて、複数の表現形式のうちのいずれかをその画像に応じた表現形式として選択することができる。
本願の請求項4に記載の画像読取装置によれば、画像を構成する画素の配列パターンに基づいて、その画像を描画する処理を数値または数式により記述すべきか否かを判断することができる。
According to the image processing device according to claim 1 of the present application, one of a plurality of expression formats is set as an expression format corresponding to the image in accordance with the colors of pixels drawn adjacent to each other in the image region. You can choose.
According to the image processing apparatus according to
According to the image reading device according to
According to the image reading apparatus described in claim 4 of the present application, based on the arrangement pattern of the pixels constituting the image, it can be determined whether or not the process of drawing the image should be described by numerical values or mathematical expressions.
1.定義
以下の実施形態において、「画像領域」とは、画像のうち、画が描かれている領域である。
「ラスター方式」とは、格子状に配列された画素と呼ばれる単位に画像を分割し、各画素によってそれぞれ表される色情報(色調や階調)をその画素ごとに記述する方式である。
「ラスター画像」とは、ラスター方式で表現された画像である。
「解像度」とは、ラスター画像において、単位長さ当たりに配列される画素の数を示す値である。ここで、単位長さとは例えばインチであり、解像度の単位としては1インチ当たりの画素の数を示す「dpi」がある。
「ベクトル情報」とは、描画対象である線・面領域・文字等の各要素を抽象空間上に定義し、各要素を描画する処理を数値又は数式によって記述した情報である。このベクトル情報の記述には、例えばベジエ曲線のパラメータなどが用いられる。
「ベクトル方式」とは、ベクトル情報により定義された要素をその要素ごとに描画する方式である。具体的には、ベクトル方式とは、線の起終点の座標、色、太さ、曲がり方や、線に囲まれた面の色、文字コードと文字属性(サイズやフォント)等を、数値や数式で表す方式である。
「ベクトル画像」とは、ベクトル方式で表現された画像である。
「ラスター化」とは、ベクトル画像をラスター画像に変換することをいう。画像の大きさと解像度が定められていれば、ベクトル画像に含まれる描画情報に応じて、各画素の色情報を定めていくことにより、ラスター化を行うことができる。
「ベクトル化」とは、ラスター画像をベクトル画像に変換することをいう。
「連結成分」とは、画像に対応する二値画像において、同じ値を持つ画素が互いに連結して一つの塊を形成するものをいう。
「描画色」とは、画像のうち、描画対象が描かれる色である。例えば、図5の描画対象Z3における「技術的な課題」という文字列の色Cfや、この文字列を囲む楕円形の内部を埋めている色Cbは、描画対象Z3を描いている「描画色」である。
「非描画色」とは、描画色ではない色であり、画像が形成された記録媒体における、その記録媒体の色に相当する。例えば、図5の描画対象Z3を囲む色Cxは、描画色ではない色、すなわち「非描画色」である。
「写真画像」とは、主に自然物を光学的手法により撮影して得られるラスター画像、および、これに準ずるラスター画像であって、ベクトル化が困難なものをいう。
「圧縮処理」とは、データ量を低減した状態で対象を表現するデータに変換する処理である。
「可逆の圧縮処理」とは、圧縮処理後のデータのみに基づいて、圧縮処理前のデータを復元することができる圧縮処理をいう。
「非可逆の圧縮処理」とは、圧縮処理後のデータのみに基づいて、圧縮処理前のデータを復元することができない圧縮処理をいう。
1. Definitions In the following embodiments, an “image region” is a region where an image is drawn in an image.
The “raster system” is a system in which an image is divided into units called pixels arranged in a grid, and color information (tone and gradation) represented by each pixel is described for each pixel.
A “raster image” is an image expressed in a raster format.
“Resolution” is a value indicating the number of pixels arranged per unit length in a raster image. Here, the unit length is, for example, inches, and the resolution unit is “dpi” indicating the number of pixels per inch.
“Vector information” is information in which each element such as a line, a surface area, and a character to be drawn is defined in an abstract space, and a process of drawing each element is described by a numerical value or a mathematical expression. For example, a Bezier curve parameter is used for the description of the vector information.
The “vector method” is a method for drawing an element defined by vector information for each element. Specifically, the vector method means the coordinates of the start and end points of the line, color, thickness, how to bend, the color of the surface surrounded by the line, character code and character attributes (size and font), etc. This is a method expressed by a mathematical formula.
A “vector image” is an image expressed by a vector method.
“Rasterization” refers to converting a vector image into a raster image. If the size and resolution of the image are determined, rasterization can be performed by determining the color information of each pixel according to the drawing information included in the vector image.
“Vectorization” refers to converting a raster image into a vector image.
The “connected component” refers to a binary image corresponding to an image in which pixels having the same value are connected to each other to form one lump.
The “drawing color” is a color in which a drawing target is drawn in the image. For example, the color Cf of the character string “technical problem” in the drawing target Z3 in FIG. 5 and the color Cb filling the inside of the ellipse surrounding the character string are the “drawing color” drawing the drawing target Z3. Is.
The “non-drawing color” is a color that is not a drawing color and corresponds to the color of the recording medium in the recording medium on which the image is formed. For example, the color Cx surrounding the drawing target Z3 in FIG. 5 is a color that is not a drawing color, that is, a “non-drawing color”.
A “photographic image” refers to a raster image obtained by photographing natural objects mainly by an optical technique, and a raster image equivalent thereto, which is difficult to vectorize.
The “compression process” is a process of converting data that represents a target in a state where the amount of data is reduced.
“Reversible compression processing” refers to compression processing capable of restoring data before compression processing based only on data after compression processing.
The “irreversible compression process” refers to a compression process in which data before the compression process cannot be restored based only on the data after the compression process.
2.第1実施形態
本発明の第1実施形態である画像処理装置10の構成を説明する。
図1は、画像処理装置10の全体構成を説明するためのブロック図である。図1に示すように、画像処理装置10は、情報処理部1、スキャナ2、および画像形成部3を含む。図1の二点鎖線で囲んだ内側は、情報処理部1を示している。CPU11は、ROM12に記憶されているコンピュータプログラム(以下、単にプログラムという)を読み出して実行することにより情報処理部1の各部を制御する。例えば、CPU11は、後述する画像領域区切手段やベクトル化手段として機能する。ROM12は半導体素子等で構成された読み出し専用の不揮発性記憶装置である。このROM12には、種々のプログラムやBIOS(Basic Input/Output System)が記憶されている。RAM13はCPU11がプログラムを実行する際のワークエリアとして利用される。また、RAM13は、ベクトル画像を表すデータ(以下、ベクトル画像データという)やラスター画像を表すデータ(以下、ラスター画像データという)を記憶する領域を有している。なお、画像を表すこれらのデータには、データ圧縮処理が施されていてもよい。VRAM(Video RAM)14は、ラスター画像データを記憶するRAMである。入力部15は、スキャナやコンピュータなどの外部入力装置とのインターフェースであり、CPU11の制御の下、画像データを受け付ける。ここでは、入力部15は、スキャナ2から入力されるラスター画像データを受け付ける。出力部16は、CPU11の制御の下、画像データを、画像形成部や液晶表示媒体などの外部装置へ出力する。ここでは、出力部16は、画像データを画像形成部3へ出力する。情報処理部1の各部はバス19を介して接続されている。
2. First Embodiment A configuration of an
FIG. 1 is a block diagram for explaining the overall configuration of the
図2は、本発明の第1実施形態に係る情報処理部1の機能的構成を示すブロック図である。図2の二点鎖線の枠11で囲まれた各手段は、情報処理部1のCPU11により実現される機能である。取得手段110は、CPU11がスキャナ2からラスター画像データG0を取得する手段である。具体的には、CPU11は、用紙などの記録媒体に描かれた画像をスキャナ2が備える光学読取装置に読み取らせ、この画像に対応するラスター画像データG0を、入力部15およびバス19を介して取得してRAM13やVRAM14に記憶する。そして、取得したラスター画像データG0は、画像領域区切手段111に供給される。
FIG. 2 is a block diagram showing a functional configuration of the information processing unit 1 according to the first embodiment of the present invention. Each unit surrounded by a two-dot
画像領域区切手段111は、供給されたラスター画像データG0が表す画像を、ラベリング処理によって何らかの画が描かれている1つまたは複数の画像領域に区切る手段である。具体的には、CPU11がRAM13やVRAM14に記憶したラスター画像データG0の各画素の色を閾値と比較することで、ラスター画像データG0を二種類の画素からなる二値画像に変換する。なお、二値画像に変換する際に、CPU11は、ラスター画像データG0から、例えば走査線を一本置きに走査して解像度を低下させたり、彩度の情報を除去したりして、検査用の画像データを生成し、生成したこの画像データの各画素の色を閾値と比較してもよい。そして、CPU11は、生成した二値画像をラベリング処理することにより、連結した画素群を描画画素として抽出し、この描画画素に外接する矩形を画像領域として区切る。画像領域区切手段111によって区切られた各画像領域は、第1判定手段112に供給される。
The image area dividing means 111 is a means for dividing the image represented by the supplied raster image data G0 into one or a plurality of image areas in which some image is drawn by a labeling process. Specifically, the
第1判定手段112は、供給された各画像領域について、その画像領域内の画素の色の濃度または明度に基づき、その画像領域が写真画像であるか否かを判定する手段である。具体的には、CPU11は、供給された画像領域内に互いに隣接して描かれる画素の色について、それぞれの濃度または明度の変化量と、予め定めた変化量とを比較する。そして、これら画素の色の変化量が、予め定めた変化量よりも緩やかな場合には、CPU11は、この画像領域を写真画像であると判定し、それ以外の場合には、この画像領域を写真画像ではないと判定して処理を行う。
The
非可逆圧縮手段114は、第1判定手段112において、画像領域を写真画像であると判定した場合に、その画像領域に対応するラスター画像データG0に非可逆の圧縮処理を施した画像データを生成する手段である。非可逆の圧縮処理としては、色の出現頻度に応じた符号化とデータ量子化を組み合わせた圧縮処理などが用いられる。これにより、例えば、JPEG(Joint Photographic Experts Group)などのフォーマットで表現された画像データが生成される。非可逆の圧縮処理によれば、データ量の低減効果が可逆の圧縮処理に比べて高いので、一般にデータ量が多い写真画像に対するデータ量の削減効果が期待される。
When the
第2判定手段113は、第1判定手段112において、画像領域を写真画像ではないと判定した場合に、その画像領域に描かれる画素の色の組み合わせが、予め定められた色の組み合わせと一致するか否かを判定する手段である。ROM12やRAM13には、CPU11が情報処理部1を制御するための基本となるプログラムであるOS(Operating System)が記憶されており、このOSには、例えば16色や256色などのカラーパレットと呼ばれる色の組み合わせが予め定められている。これにより、このカラーパレットは、OSを実行するCPU11によって読み込まれる各種のプログラムで共通に用いられる。第2判定手段113であるCPU11は、第1判定手段112において写真画像ではないと判定された画像領域に描かれる画素の色を標本し、これと上述のカラーパレットにおける色の組み合わせとを比較する。そして、比較した両者が完全に一致する場合に、CPU11は、画像領域に描かれる画素の色と、予め定められた色の組み合わせとが一致すると判定する。なお、CPU11は、比較した両者の一部が一致する場合や、両者の差、または、両者の差の合計が予め定めた値を超えない場合に、画像領域に描かれる画素の色と、予め定められた色の組み合わせとが一致すると判定してもよい。
When the
可逆圧縮手段115は、第2判定手段113において、画像領域に描かれる画素の色と、予め定められた色の組み合わせとが一致しないと判定した場合に、その画像領域に対応するラスター画像データG0に可逆の圧縮処理を施した画像データを生成する手段である。これにより、例えば、PNG(Portable Network Graphics)などのフォーマットで表現された画像データが生成される。可逆の圧縮処理では、非可逆の圧縮処理に比べるとデータ量の低減効果が低いが、画素の色の組み合わせが予め定められたものと一致するような画像であれば、そのデータ量は写真画像に比べると少ないので、このような画像に対しては可逆の圧縮処理で十分となる。
When the
ベクトル化手段116は、第2判定手段113において、画像領域に描かれる画素の色と、予め定められた色の組み合わせとが一致すると判定した場合に、その画像領域に対応するラスター画像データG0をベクトル化して、ベクトル画像の画像データを生成する手段である。これにより、画像領域に描画された描画対象は、数値や数式で表される。
画像領域に描かれる画素の色と、予め定められた色の組み合わせとが一致する場合とは、この画像領域は、上述したカラーパレットに従って描かれている可能性が高いことを示している。そして、上述したように、このカラーパレットは、各種のプログラムで共通に用いられ、特にベクトル方式で描画対象を描画する場合に利用されることが多い。つまり、この性質を利用して、第2判定手段113の判定結果に応じて、その画像領域に対する処理を行う構成として、可逆圧縮手段115およびベクトル化手段116のいずれかが選択される。
When the
The case where the color of the pixel drawn in the image area matches the predetermined color combination indicates that there is a high possibility that the image area is drawn according to the color palette described above. As described above, this color palette is commonly used in various programs, and is often used particularly when drawing a drawing target by a vector method. That is, using this property, either the
以上により、第1判定手段112および第2判定手段113の判定結果に応じて、非可逆圧縮手段114、可逆圧縮手段115、およびベクトル化手段116のいずれかによる処理が行われる。このいずれかの処理が行われて生成された複数の画像データは、一つにまとめられて複合画像データG1として、RAM13などに記憶される。取得手段110により取得されたラスター画像データG0について、その画像領域ごとに、描画色の組み合わせに基づいてベクトル方式で描画されるべきか否かが判断されるため、画像領域ごとにその判断を行わない場合に比較して、その判断処理が速い。このような判断に基づき各描画対象に適したフォーマットが割り当てられ、そのフォーマットによる画像データに変換され、複合画像データG1として、RAM13などに記憶される。そして、記憶された複合画像データG1から、各画像領域に対応する画像データを抽出することができるため、例えば、これらの画像データのそれぞれに対し、拡大/縮小、回転/反転、色の変更などの処理を施すなどの再利用が実現される。
As described above, processing by any one of the
図5(a)〜(c)は、上記の画像処理装置10のスキャナ2によって読み取られる画像の例を示す図である。図5(a)の描画対象Z1は、複写機とその利用者とが描かれた写真画像またはイラストであり、図5(b)の描画対象Z2は、カラーパレットを用いて描かれたグラフである。この描画対象Z1は、これを構成する部分に分解してそれぞれを拡大/縮小、回転/反転、色の変更などの処理を行うということは想定されておらず、描画対象Z1を1つとして再利用することが想定されている。描画対象Z1が写真画像である場合には、情報処理部1は、前述した処理手順に従い、この描画対象Z1の描画色の濃度または明度の変化量に基づいて、この画像が写真画像であると判断し、画像データに非可逆圧縮処理を施す。また、描画対象Z1が予め記憶されたカラーパレットを用いて描かれていない場合には、情報処理部1は、前述した処理手順に従い、この画像が部分に分解して再利用することを想定されていないイラストであると判断し、画像データに可逆圧縮処理を施す。一方、描画対象Z2は、カラーパレットを用いて描かれたグラフであるから、情報処理部1は、前述した処理手順に従い、この描画対象Z2をベクトル化手段116によりベクトル化した画像データで表現する。
5A to 5C are diagrams showing examples of images read by the
3.第2実施形態
次に、本発明の第2実施形態について説明する。本発明の第2実施形態である画像処理装置10の全体構成は、第1実施形態と共通するため説明を省略する。
図3は、本発明の第2実施形態に係る情報処理部1の機能的構成を示すブロック図である。図3において、第1実施形態と共通する機能的構成については、図2と同一の符号を付し、説明を省略する。図3の二点鎖線の枠11で囲まれた各手段は、情報処理部1のCPU11により実現される機能である。第2実施形態の情報処理部1では、第2判定手段113がなく、第2判定手段113に替えて第3判定手段121が設けられる。また、文字領域抽出手段120が設けられる。
3. Second Embodiment Next, a second embodiment of the present invention will be described. The overall configuration of the
FIG. 3 is a block diagram showing a functional configuration of the information processing unit 1 according to the second embodiment of the present invention. In FIG. 3, the functional configuration common to the first embodiment is denoted by the same reference numerals as those in FIG. Each means surrounded by a two-dot
文字領域抽出手段120は、取得手段110により取得されたラスター画像データG0から、予め定めた画素の配列パターンと共通する度合が閾値を超える領域を、文字が描かれている可能性のある文字領域として抽出する抽出手段の一例である。具体的には、CPU11が、取得したラスター画像データG0の各画素を、上記の配列パターンと比較する。ここで、予め定めた画素の配列パターンの例として、「閾値を超えるコントラストを有する2色の画素で構成されていること」や、「上記2色のうち、一方の色の画素が垂直方向に等間隔な直線として出現すること」などが挙げられる。これらの配列パターンを基準として、その基準との一致度を算出することにより、文字領域抽出手段120であるCPU11は、配列パターンと共通する度合を算出して、その度合が閾値を超える領域を抽出する。
The character
なお、ここでいう水平方向や垂直方向とは、スキャナ2によって画像が読み取られたときの走査方向により定まるが、読み取り状態や元の画像のデザインによっては、用紙などに記述された文字列の配列方向とスキャナ2の走査方向が一致しない場合もある。文字領域抽出手段120は、例えば、上述した一方の色の画素により複数本出現する直線の方向がスキャナ2の走査方向と一致しない場合であっても、それらの直線の方向がスキャナ2の操作方向に対して一定の角度をなしている場合には、その領域と配列パターンとが共通する度合を増加させてもよい。
Note that the horizontal direction and vertical direction here are determined by the scanning direction when the image is read by the
第3判定手段121は、画像領域区切手段111によって区切られた画像領域が、文字領域抽出手段120によって抽出された文字領域と重なるか否かを判定する手段である。CPU11は、画像領域区切手段111によって区切られた画像領域と、文字領域抽出手段120によって抽出された文字領域とを比較し、両者が重複しているか否かを判断する。そして、重複していない場合には、CPU11は、その画像領域に対応するラスター画像データG0を可逆圧縮手段115により可逆圧縮し、重複している場合には、その画像領域に対応するラスター画像データG0をベクトル化手段116によりベクトル化する。
The
以上により、第1判定手段112および第3判定手段121の判定結果に応じて、非可逆圧縮手段114、可逆圧縮手段115、およびベクトル化手段116のいずれかによる処理が行われ、生成された複数の画像データは、一つにまとめられて複合画像データG1として、RAM13などに記憶される。取得手段110により取得したラスター画像データG0については、画像領域ごとに文字領域と重複しているか否かが判断され、文字領域と重複していると判断された画像領域をベクトル方式で描くべき画像領域とする。ベクトル方式で描くべき画像領域とするか否かを、文字領域と重複しているか否かの判断によって済ますため、このような構成を用いない場合に比較して迅速にその判断処理を終えることになる。
As described above, according to the determination results of the
例えば、図5に示す描画対象Z3は、記録用紙の色以外のCbで塗りつぶされた楕円形状の中に、色Cfで描かれた「技術的な課題」という文字列を配置したものである。この文字列は、文字領域抽出手段120により文字領域として抽出されるので、抽出された文字領域と、画像領域区切手段111によって区切られた画像領域とは重複する。このため、情報処理部1は、この描画対象Z3を描いた画像領域をベクトル化手段116によりベクトル化する。
For example, the drawing target Z3 shown in FIG. 5 is a character string “technical problem” drawn in the color Cf in an elliptical shape filled with Cb other than the color of the recording paper. Since this character string is extracted as a character region by the character
4.第3実施形態
次に、本発明の第3実施形態について説明する。本発明の第3実施形態である画像処理装置10の全体構成は、第1実施形態と共通するため説明を省略する。
図4は、本発明の第3実施形態に係る情報処理部1の機能的構成を示すブロック図である。図4において、第1実施形態および第2実施形態と共通する機能的構成については、図2または図3と同一の符号を付し、説明を省略する。図4の二点鎖線の枠11で囲まれた各手段は、情報処理部1のCPU11により実現される機能である。第3実施形態の情報処理部1は、第1実施形態の第2判定手段113、および、第2実施形態の文字領域抽出手段120、並びに、第3判定手段121を有しており、さらに、第4判定手段130が設けられている。
4). Third Embodiment Next, a third embodiment of the present invention will be described. The overall configuration of the
FIG. 4 is a block diagram showing a functional configuration of the information processing unit 1 according to the third embodiment of the present invention. In FIG. 4, the functional configuration common to the first embodiment and the second embodiment is denoted by the same reference numerals as those in FIG. 2 or FIG. Each means surrounded by a two-dot
第4判定手段130は、第2判定手段113の判定結果と、第3判定手段121の判定結果を基に、その画像領域に対して、可逆圧縮手段115およびベクトル化手段116のいずれの処理を行うかを判定する手段である。例えば、第4判定手段130は、第2判定手段113により、画像領域に描かれる画素の色と、予め定められた色の組み合わせとが一致すると判定され、かつ、第3判定手段121により、画像領域と文字領域とが重複していると判定された場合に限り、その画像領域に対応するラスター画像データG0をベクトル化して、ベクトル画像の画像データを生成するようにしてもよい。また、第4判定手段130は、第2判定手段113により、画像領域に描かれる画素の色と、予め定められた色の組み合わせとが一致すると判定されるか、または、第3判定手段121により、画像領域と文字領域とが重複していると判定された場合に、上述のベクトル画像の画像データを生成するようにしてもよい。
Based on the determination result of the
取得手段110により取得したラスター画像データG0については、画像領域ごとに、描かれる画素の色の組み合わせ、および、文字領域の包含関係の両方に基づいて、ベクトル方式で描くべきか否かが判断される。よって、その判断の精度は、上記の構成を用いない場合に比較して高い。 With respect to the raster image data G0 acquired by the acquisition means 110, it is determined for each image area whether or not it should be drawn by the vector method based on both the color combination of drawn pixels and the inclusion relation of the character area. The Therefore, the accuracy of the determination is higher than when the above configuration is not used.
5.変形例
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例を組み合わせてもよい。
(1)上述した第3実施形態および第4実施形態において、第3判定手段121は、画像領域区切手段111によって区切られた画像領域が、文字領域抽出手段120によって抽出された文字領域と重なるか否かを判定していたが、この判定の前に、文字領域抽出手段120によって抽出された文字領域をさらにパターンマッチング処理して文字が特定された領域(以下、文字特定領域という)を抽出し、第3判定手段121は、上記の画像領域が、この文字特定領域と重なるか否かを判定するようにしてもよい。すなわち、文字領域抽出手段120のあとに、フォントデータに基づくパターンマッチングを行って文字特定領域を抽出する照合手段122を設けてもよい(図3および図4参照)。具体的には、CPU11が、文字領域抽出手段120により抽出された文字領域の各画素を、予め定めた画素の配列パターンであるビットマップフォントのフォントデータや、ラスター化されたアウトラインフォントのフォントデータなどと比較し、画素のパターンが一致するか否かにより、抽出された文字領域に記述された文字のフォント名とフォントサイズおよび文字コードを特定する。そして、記述された文字が特定された文字特定領域のみを、第3判定手段121に供給するようにすればよい。
なお、このパターンの「一致」には、幅を持たせてもよく、閾値を超えた割合の画素が一致している場合を「パターンの一致」と見做してもよい。
5. Modification The above is the description of the embodiment, but the contents of this embodiment can be modified as follows. Further, the following modifications may be combined.
(1) In the third embodiment and the fourth embodiment described above, the
It should be noted that the “match” of this pattern may have a width, and a case where pixels having a ratio exceeding the threshold value match may be regarded as “pattern match”.
(2)上述した実施形態において、情報処理部1は、画像処理装置10に内蔵されたものであったが、情報処理部1は、パーソナルコンピュータで実現してもよい。
また、図2の二点鎖線で囲んだ各手段は、情報処理部1のCPU11により実現される機能であったが、これら各手段は、CPU11以外によって実現されてもよい。例えば、これら各手段は専用の画像処理プロセッサによって実現されてもよい。
(2) In the above-described embodiment, the information processing unit 1 is built in the
2 is a function realized by the
(3)上述した第2実施形態および第4実施形態において、第2判定手段113は、第1判定手段112において、画像領域を写真画像ではないと判定した場合に、その画像領域に描かれる画素の色の組み合わせが、予め定められた色の組み合わせと一致するか否かを判定していたが、この第2判定手段113の前に、この画像領域の描画色を減色する減色手段117を設けてもよい(図2および図4参照)。すなわち、CPU11は、この第2判定手段113の処理を行う前に、この画像領域の描画色を、減色する処理を行ってもよい。減色する処理のアルゴリズムとしては、例えば、以下のステップS401〜ステップS407に示すアルゴリズムなどが挙げられる。
(3) In the second embodiment and the fourth embodiment described above, when the
ステップS401:計算したヒストグラムに基づき、頻度の低い色を、その色に近い色でその色の頻度よりも頻度が多い色に併合する。
ステップS402:構成色が描画色の目標色数以下であれば処理を終了する。
ステップS403:全体を一つの色グループとして、最大色差のペアを探す。
ステップS404:注目しているグループを色差優先で、2つに分ける。
ステップS405:グループ数が目標色数以下であれば処理を終了する。
ステップS406:全てのグループの中から、最大色差ペアを持つグループを探す。
ステップS407:ステップS404へ戻る。
Step S401: Based on the calculated histogram, a color with a low frequency is merged with a color close to that color and a frequency that is higher than the frequency of the color.
Step S402: If the component color is less than or equal to the target number of drawing colors, the process is terminated.
Step S403: A pair of maximum color differences is searched with the whole as one color group.
Step S404: The group of interest is divided into two with priority on color difference.
Step S405: If the number of groups is less than or equal to the target number of colors, the process ends.
Step S406: A group having the maximum color difference pair is searched from all the groups.
Step S407: Return to step S404.
1…情報処理部、10…画像処理装置、11…CPU、12…ROM、13…RAM、130…第4判定手段、14…VRAM、15…入力部、16…出力部、19…バス、2…スキャナ、3…画像形成部、110…取得手段、111…画像領域区切手段、112…第1判定手段、113…第2判定手段、114…非可逆圧縮手段、115…可逆圧縮手段、116…ベクトル化手段、117…減色手段、120…文字領域抽出手段、121…第3判定手段、122…照合手段、G0…ラスター画像データ、G1…複合画像データ。
DESCRIPTION OF SYMBOLS 1 ... Information processing part, 10 ... Image processing apparatus, 11 ... CPU, 12 ... ROM, 13 ... RAM, 130 ... 4th determination means, 14 ... VRAM, 15 ... Input part, 16 ... Output part, 19 ... Bus, 2 DESCRIPTION OF
Claims (4)
前記取得手段により取得された画像データが表す画像を、ラベリング処理によって1つまたは複数の画像領域に区切る区切り手段と、
前記区切り手段により区切られた1つ又は複数の画像領域の各々について、当該画像領域に描画対象である要素を描画する処理を数値又は数式により記述した画像データ、当該画像領域に対応する画像データに可逆の圧縮処理を施した画像データ、又は、当該画像領域に対応する画像データに非可逆の圧縮処理を施した画像データのうちのいずれかを生成する生成手段と
を具備し、
前記生成手段は、
前記区切り手段により区切られた画像領域において隣接する画素の色の濃度または明度が、当該隣接する画素間で予め定められた変化量よりも緩やかに変化する第1の場合に、当該画像領域を表す画像データに非可逆の圧縮処理を施した画像データを生成し、
第1の場合以外の場合であって、前記画像領域に含まれる画素の色の組み合わせが、予め定められた色の組み合わせと一致する第2の場合に、当該画像領域に前記要素を描画する処理を数値又は数式により記述した画像データを生成し、
前記第1の場合および前記第2の場合のいずれでもない場合に、当該画像領域を表す画像データに可逆の圧縮処理を施した画像データを生成する
ことを特徴とする画像処理装置。 Obtaining means for obtaining image data in which the color of each pixel constituting the image is described;
Separating means for dividing the image represented by the image data acquired by the acquiring means into one or a plurality of image areas by labeling processing;
For each of one or more image areas delimited by the delimiter, image data describing processing for drawing an element to be rendered in the image area by numerical values or mathematical expressions, and image data corresponding to the image area Generating means for generating either reversible compression processing image data or image data corresponding to the image area subjected to irreversible compression processing ;
The generating means includes
In the first case, the color density or brightness of the adjacent pixels in the image area delimited by the delimiter means changes more slowly than the predetermined amount of change between the adjacent pixels. Generate image data that has been subjected to irreversible compression processing.
Processing for drawing the element in the image area in a second case where the combination of the colors of the pixels included in the image area matches a predetermined color combination, except in the case of the first case Generate image data that describes numerically or mathematically,
An image processing apparatus that generates image data obtained by performing reversible compression processing on image data representing the image area when neither of the first case and the second case .
前記取得手段により取得された画像データが表す画像を、ラベリング処理によって1つまたは複数の画像領域に区切る区切り手段と、
前記区切り手段により区切られた1つ又は複数の画像領域の各々について、当該画像領域に描画対象である要素を描画する処理を数値又は数式により記述した画像データ、当該画像領域に対応する画像データに可逆の圧縮処理を施した画像データ、又は、当該画像領域に対応する画像データに非可逆の圧縮処理を施した画像データのうちのいずれかを生成する生成手段と
を具備し、
前記生成手段は、
前記取得手段により取得された画像データに含まれる画素のうち、文字画像を構成する画素の配列パターンとして予め定められたものと共通する度合が閾値を超える画素を含む画像領域を抽出し、
前記区切り手段により区切られた画像領域が、抽出された前記画像領域と重なる場合に、当該区切り手段により区切られた画像領域に前記要素を描画する処理を数値又は数式により記述した画像データを生成する
ことを特徴とする画像処理装置。 Obtaining means for obtaining image data in which the color of each pixel constituting the image is described;
Separating means for dividing the image represented by the image data acquired by the acquiring means into one or a plurality of image areas by labeling processing;
For each of one or more image areas delimited by the delimiter, image data describing processing for drawing an element to be rendered in the image area by numerical values or mathematical expressions, and image data corresponding to the image area Generating means for generating either reversible compression processing image data or image data corresponding to the image area subjected to irreversible compression processing ;
The generating means includes
Among the pixels included in the image data acquired by the acquisition means, an image region including pixels whose degree of commonness with a predetermined pixel array pattern constituting the character image exceeds a threshold value is extracted.
When the image area delimited by the delimiter overlaps with the extracted image area, image data that describes the process of drawing the element in the image area delimited by the delimiter by numerical value or mathematical expression is generated An image processing apparatus.
前記読取手段により生成された画像データが表わす画像を、ラベリング処理によって1つまたは複数の画像領域に区切る区切り手段と、
前記区切り手段により区切られた1つ又は複数の画像領域の各々について、当該画像領域に描画対象である要素を描画する処理を数値又は数式により記述した画像データ、当該画像領域に対応する画像データに可逆の圧縮処理を施した画像データ、又は、当該画像領域に対応する画像データに非可逆の圧縮処理を施した画像データのうちのいずれかを生成する生成手段と
を具備し、
前記生成手段は、
前記区切り手段により区切られた画像領域において隣接する画素の色の濃度または明度が、当該隣接する画素間で予め定められた変化量よりも緩やかに変化する第1の場合に、当該画像領域を表す画像データに非可逆の圧縮処理を施した画像データを生成し、
第1の場合以外の場合であって、前記画像領域に含まれる画素の色の組み合わせが、予め定められた色の組み合わせと一致する第2の場合に、当該画像領域に前記要素を描画する処理を数値又は数式により記述した画像データを生成し、
前記第1の場合および前記第2の場合のいずれでもない場合に、当該画像領域を表す画像データに可逆の圧縮処理を施した画像データを生成する
ことを特徴とする画像読取装置。 Reading means for reading an image formed on a recording medium and generating image data representing the image;
Separating means for dividing an image represented by the image data generated by the reading means into one or a plurality of image areas by labeling processing;
For each of one or more image areas delimited by the delimiter, image data describing processing for drawing an element to be rendered in the image area by numerical values or mathematical expressions, and image data corresponding to the image area Generating means for generating either reversible compression processing image data or image data corresponding to the image area subjected to irreversible compression processing ;
The generating means includes
In the first case, the color density or brightness of the adjacent pixels in the image area delimited by the delimiter means changes more slowly than the predetermined amount of change between the adjacent pixels. Generate image data that has been subjected to irreversible compression processing.
Processing for drawing the element in the image area in a second case where the combination of the colors of the pixels included in the image area matches a predetermined color combination, except in the case of the first case Generate image data that describes numerically or mathematically,
An image reading apparatus that generates image data in which reversible compression processing is performed on image data representing the image area when neither the first case nor the second case is performed .
前記読取手段により生成された画像データが表わす画像を、ラベリング処理によって1つまたは複数の画像領域に区切る区切り手段と、
前記区切り手段により区切られた1つ又は複数の画像領域の各々について、当該画像領域に描画対象である要素を描画する処理を数値又は数式により記述した画像データ、当該画像領域に対応する画像データに可逆の圧縮処理を施した画像データ、又は、当該画像領域に対応する画像データに非可逆の圧縮処理を施した画像データのうちのいずれかを生成する生成手段と
を具備し、
前記生成手段は、
前記取得手段により取得された画像データに含まれる画素のうち、文字画像を構成する画素の配列パターンとして予め定められたものと共通する度合が閾値を超える画素を含む画像領域を抽出し、
前記区切り手段により区切られた画像領域が、抽出された前記画像領域と重なる場合に、当該区切り手段により区切られた画像領域に前記要素を描画する処理を数値又は数式により記述した画像データを生成する
ことを特徴とする画像読取装置。 Reading means for reading an image formed on a recording medium and generating image data representing the image;
Separating means for dividing an image represented by the image data generated by the reading means into one or a plurality of image areas by labeling processing;
For each of one or more image areas delimited by the delimiter, image data describing processing for drawing an element to be rendered in the image area by numerical values or mathematical expressions, and image data corresponding to the image area Generating means for generating either reversible compression processing image data or image data corresponding to the image area subjected to irreversible compression processing ;
The generating means includes
Among the pixels included in the image data acquired by the acquisition means, an image region including pixels whose degree of commonness with a predetermined pixel array pattern constituting the character image exceeds a threshold value is extracted.
When the image area delimited by the delimiter overlaps with the extracted image area, image data that describes the process of drawing the element in the image area delimited by the delimiter by numerical value or mathematical expression is generated An image reading apparatus.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009064501A JP5245949B2 (en) | 2009-03-17 | 2009-03-17 | Image processing apparatus and image reading apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009064501A JP5245949B2 (en) | 2009-03-17 | 2009-03-17 | Image processing apparatus and image reading apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010219903A JP2010219903A (en) | 2010-09-30 |
JP5245949B2 true JP5245949B2 (en) | 2013-07-24 |
Family
ID=42978249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009064501A Expired - Fee Related JP5245949B2 (en) | 2009-03-17 | 2009-03-17 | Image processing apparatus and image reading apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5245949B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022028336A (en) * | 2020-08-03 | 2022-02-16 | キヤノン株式会社 | Information processing apparatus, information processing method, and program |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2693457B2 (en) * | 1987-10-26 | 1997-12-24 | キヤノン株式会社 | Image processing device |
JP2546879B2 (en) * | 1988-04-20 | 1996-10-23 | 株式会社日立製作所 | Encoder |
JPH02205984A (en) * | 1989-02-06 | 1990-08-15 | Canon Inc | Picture processor |
JP2007005949A (en) * | 2005-06-22 | 2007-01-11 | Fuji Xerox Co Ltd | Image forming apparatus, method and program |
JP2008042345A (en) * | 2006-08-02 | 2008-02-21 | Canon Inc | Image processing method and image processor |
JP4861362B2 (en) * | 2008-04-10 | 2012-01-25 | コニカミノルタビジネステクノロジーズ株式会社 | Image processing apparatus, image processing method, and image processing program |
-
2009
- 2009-03-17 JP JP2009064501A patent/JP5245949B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010219903A (en) | 2010-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4821869B2 (en) | Character recognition device, image reading device, and program | |
JP5132530B2 (en) | Image coding apparatus, image processing apparatus, and control method thereof | |
US8050499B2 (en) | Image-processing apparatus, image-processing method, and computer program used therewith | |
CN105528614B (en) | A kind of recognition methods of the cartoon image space of a whole page and automatic recognition system | |
US20050193327A1 (en) | Method for determining logical components of a document | |
JP4748234B2 (en) | Image processing apparatus and image forming apparatus | |
US8774511B2 (en) | Image processing apparatus and image processing method | |
JP2006253892A (en) | Method and device for treating image | |
JP2000306103A (en) | Method and device for information processing | |
US8532385B2 (en) | Image processing apparatus and image processing method | |
JP5049922B2 (en) | Image processing apparatus and image processing method | |
JP2010035173A (en) | Image processing apparatus and method | |
JP5335581B2 (en) | Image processing apparatus, image processing method, and program | |
JP6370080B2 (en) | Image processing apparatus, image processing method, and program. | |
JP5245949B2 (en) | Image processing apparatus and image reading apparatus | |
US20120288188A1 (en) | Image processing apparatus, image processing method, and computer-readable medium | |
JP2008042345A (en) | Image processing method and image processor | |
JP2007109177A (en) | Image processing apparatus, its control method, and program | |
JP4182891B2 (en) | Image processing device | |
JP2006237858A (en) | Image processing apparatus, image processing method, program for allowing computer to execute the method, and recording medium | |
JP2006054817A (en) | Document processor | |
JP5648340B2 (en) | Image processing apparatus and program | |
JP5424785B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP2002244643A (en) | Image processor | |
JP2005184404A (en) | Image processing apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5245949 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160419 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |