JP4935732B2 - Image processing apparatus and image processing program - Google Patents
Image processing apparatus and image processing program Download PDFInfo
- Publication number
- JP4935732B2 JP4935732B2 JP2008071138A JP2008071138A JP4935732B2 JP 4935732 B2 JP4935732 B2 JP 4935732B2 JP 2008071138 A JP2008071138 A JP 2008071138A JP 2008071138 A JP2008071138 A JP 2008071138A JP 4935732 B2 JP4935732 B2 JP 4935732B2
- Authority
- JP
- Japan
- Prior art keywords
- pixel block
- character
- representative
- image data
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 84
- 238000003860 storage Methods 0.000 claims description 58
- 238000004364 calculation method Methods 0.000 claims description 50
- 238000000605 extraction Methods 0.000 claims description 33
- 230000005484 gravity Effects 0.000 claims description 27
- 239000000284 extract Substances 0.000 claims description 16
- 238000005520 cutting process Methods 0.000 claims description 10
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 238000013500 data storage Methods 0.000 description 83
- 238000013075 data extraction Methods 0.000 description 55
- 238000000034 method Methods 0.000 description 51
- 230000009467 reduction Effects 0.000 description 36
- 239000000203 mixture Substances 0.000 description 31
- 230000008569 process Effects 0.000 description 31
- 238000005070 sampling Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 9
- 239000013598 vector Substances 0.000 description 8
- 238000010276 construction Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000011946 reduction process Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
Description
本発明は、画像処理装置及び画像処理プログラムに関する。 The present invention relates to an image processing apparatus and an image processing program.
画像(特に文字が含まれている画像)を拡大する場合、多値データ形式ではボケと曲線のでこぼこが、2値データ形式では幅/間隔の不均一と曲線のでこぼこが発生する場合がある。また、最近傍補間法ではジャギーが、線形補間法ではボケが顕著であり、標本化関数の畳み込み補間法でも曲線のでこぼこが発生する場合がある。これらの手法は、いずれも、画像の解像度(例えば、スキャン・イン(例えば、スキャナを用いた画像読取り)時の解像度)に基づく情報だけを使用している。 When enlarging an image (particularly an image including characters), blur and curved irregularities may occur in the multi-value data format, and uneven width / interval and curved irregularities may occur in the binary data format. Further, jaggy is prominent in the nearest neighbor interpolation method, and blurring is remarkable in the linear interpolation method, and unevenness of a curve may occur even in the convolution interpolation method of the sampling function. Each of these methods uses only information based on the resolution of the image (for example, the resolution at the time of scan-in (for example, image reading using a scanner)).
これに関連する技術として、例えば、特許文献1には、文字画像と疑似中間調処理された写真画像が混在した画像の再現性の向上を図ることを目的とし、写真領域処理部では画素の解像度を記録系の書き込み密度に一致するように入力画像の1画素を縦、横方向共に2分割して合計4画素に置換し、文字領域処理部では入力画像の注目画素とその周辺5×5画素を参照して予め設定されたパターンとマッチングし、斜線の文字ストロークが最適になるように、かつ画素の解像度を記録系の書き込み密度に一致するように変換し、領域判定部は5×5画素の領域において4連結している画素の個数を計数し、この計数値が所定値以上の場合に中央の注目画素を文字領域の画素と判別して文字領域処理部の出力を選択し、所定値未満の場合に注目画素を写真領域の画素と判別して写真領域処理部の出力を選択することが開示されている。
As a technology related to this, for example,
また、例えば、特許文献2には、解像度の低い階調データから拡大した二値画像を作る際に、中間調の画像の他、文字画像などのエッジ部をも、良好に再現した二値画像を得ることができる画像処理方法を提供することを目的とし、原画像の処理画素に隣接する画素の輝度の値から、差分演算において、それぞれ縦方向、横方向の輝度の差を演算し、演算された輝度の差から、輝度勾配を検出し、この輝度勾配がある閾値より小さい場合には、中間調の画像と判断し、二値化中間調処理により、処理画素の輝度に応じたn×m個の二値化画素を生成し、また、輝度勾配がある閾値よりも大きい場合には、輝度勾配の方向を検出し、この方向にしたがって、処理画素の輝度に応じた個数の1又は0の画素を配列し、n×m個の二値化画素を生成する。生成された二値化画素により、二値画像が形成されることが開示されている。
In addition, for example, in
また、例えば、特許文献3には、簡易な付加的回路要素により処理能力の低下を防止しつつ、低解像度の画像情報を高解像度に変換し、文字等の輪郭の傾斜部のぎざぎざを平滑処理して印刷の高品質化を図ることを目的とし、ページメモリで編集した画像情報をビデオ信号生成回路で1画素につき縦、横2倍の画素密度に増倍し、これをラインメモリにより複数ラインにわたり先送り方式で一時的に記憶し、画像置換回路は、先送りされた順に複数ラインの画素データを所定数だけマトリクス化していくことで、そのマトリクスの中心セルにきた画素データを順次印刷し、この印刷に際して該中心セルの画素データが画像輪郭の傾斜部のぎざぎざ要因になる段差部の黒画素あるいは白画素に相当するものかを判別し、ぎざぎざ要因との判定結果に基づき画素置換(白黒反転)を行うことが開示されている。
ところで、対象画像内の存在する類似の画素塊を用いて、解像度を高めた画素塊を生成する処理を用いた場合、類似する画素塊が少ない場合は、解像度を高めた画素塊を生成することができない。
本発明は、対象画像内に類似の画素塊が少ないような場合であっても、その解像度を高められるようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
By the way, if a process for generating a pixel block with an increased resolution using a similar pixel block existing in the target image is used, if there are few similar pixel blocks, a pixel block with an increased resolution is generated. I can't.
An object of the present invention is to provide an image processing apparatus and an image processing program capable of increasing the resolution even when there are few similar pixel clusters in a target image.
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像から画素塊を切り出す画素塊切出手段と、前記画素塊切出手段によって切り出された画素塊のうち類似するものを抽出する類似画素塊抽出手段と、前記類似画素塊抽出手段によって抽出された類似する複数の画素塊の重心を算出する重心算出手段と、前記類似画素塊抽出手段によって抽出された類似する複数の画素塊と前記重心算出手段によって算出された重心に基づいて、該画素塊の代表画素塊を生成する代表画素塊生成手段と、前記代表画素塊生成手段によって生成された代表画素塊を記憶する代表画素塊記憶手段を具備し、前記類似画素塊抽出手段は、前記代表画素塊記憶手段によって記憶された代表画素塊を前記画素塊切出手段によって切り出された画素塊に含めて、類似する画素塊を抽出することを特徴とする画像処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention according to
請求項2の発明は、前記類似画素塊抽出手段は、前記画素塊切出手段によって切り出された画素塊のうち類似するものの数を計数し、前記類似画素塊抽出手段によって計数された数に基づいて、前記類似画素塊抽出手段に前記代表画素塊記憶手段によって記憶された代表画素塊を使用させることを指示する使用指示手段をさらに具備することを特徴とする請求項1に記載の画像処理装置である。
According to a second aspect of the present invention, the similar pixel block extraction unit counts the number of similar pixel blocks extracted by the pixel block extraction unit, and is based on the number counted by the similar pixel block extraction unit. The image processing apparatus according to
請求項3の発明は、前記代表画素塊生成手段によって生成される代表画素塊の解像度を指示する解像度指示手段をさらに具備し、前記代表画素塊生成手段は、前記解像度指示手段によって指示された解像度に応じて、前記代表画素塊を生成することを特徴とする請求項1又は2に記載の画像処理装置である。
The invention according to
請求項4の発明は、前記代表画素塊生成手段によって生成された代表画素塊を回転させる回転手段をさらに具備し、前記代表画素塊記憶手段は、前記回転手段によって回転された代表画素塊を記憶することを特徴とする請求項1から3のいずれか1項に記載の画像処理装置である。
The invention according to
請求項5の発明は、前記類似画素塊抽出手段は、前記画素塊切出手段によって切り出された画素塊のうち類似するものの数を計数し、前記類似画素塊抽出手段によって計数された数に基づいて、前記代表画素塊記憶手段に前記代表画素塊を記憶させることを指示する記憶指示手段をさらに具備することを特徴とする請求項1から4のいずれか1項に記載の画像処理装置である。
According to a fifth aspect of the present invention, the similar pixel block extraction unit counts the number of similar pixel blocks extracted by the pixel block extraction unit, and is based on the number counted by the similar pixel block extraction unit. The image processing apparatus according to
請求項6の発明は、操作者による登録、出力又は消去の指示を受け付け、前記指示が登録である場合は、前記重心算出手段、前記代表画素塊生成手段及び前記代表画素塊記憶手段による処理を行わせ、前記指示が出力である場合は、前記重心算出手段及び前記代表画素塊生成手段による処理を行わせ、前記指示が消去である場合は、前記代表画素塊記憶手段に記憶された代表画素塊を消去するように制御する制御手段をさらに具備することを特徴とする請求項1から5のいずれか1項に記載の画像処理装置である。
The invention of claim 6 accepts an instruction of registration, output or erasure by an operator, and when the instruction is registration, processing by the centroid calculation means, the representative pixel block generation means and the representative pixel block storage means is performed. If the instruction is an output, the center-of-gravity calculating unit and the representative pixel block generation unit perform processing. If the instruction is erasure, the representative pixel stored in the representative pixel block storage unit The image processing apparatus according to
請求項7の発明は、前記代表画素塊記憶手段は、前記代表画素塊生成手段によって生成された代表画素塊を記憶する場合に、前記代表画素塊生成手段が代表画素塊を生成するときに用いた代表画素塊を消去することを特徴とする請求項1から6のいずれか1項に記載の画像処理装置である。
The invention according to claim 7 is used when the representative pixel block generation unit generates the representative pixel block when the representative pixel block storage unit stores the representative pixel block generated by the representative pixel block generation unit. 7. The image processing apparatus according to
請求項8の発明は、前記代表画素塊記憶手段は、記憶する代表画素塊が、前記類似画素塊抽出手段によって抽出された回数を記憶することを特徴とする請求項1から7のいずれか1項に記載の画像処理装置である。 The invention according to claim 8 is characterized in that the representative pixel block storage means stores the number of times the stored representative pixel block is extracted by the similar pixel block extraction means. The image processing device according to item.
請求項9の発明は、コンピュータを、画像から画素塊を切り出す画素塊切出手段と、前記画素塊切出手段によって切り出された画素塊のうち類似するものを抽出する類似画素塊抽出手段と、前記類似画素塊抽出手段によって抽出された類似する複数の画素塊の重心を算出する重心算出手段と、前記類似画素塊抽出手段によって抽出された類似する複数の画素塊と前記重心算出手段によって算出された重心に基づいて、該画素塊の代表画素塊を生成する代表画素塊生成手段と、前記代表画素塊生成手段によって生成された代表画素塊を記憶する代表画素塊記憶手段として機能させ、前記類似画素塊抽出手段は、前記代表画素塊記憶手段によって記憶された代表画素塊を前記画素塊切出手段によって切り出された画素塊に含めて、類似する画素塊を抽出することを特徴とする画像処理プログラムである。 The invention of claim 9 is a computer that extracts a pixel block extracting unit that extracts a pixel block from an image, a similar pixel block extracting unit that extracts a similar pixel block extracted by the pixel block cutting unit, and Calculated by the centroid calculating means for calculating the centroid of a plurality of similar pixel blocks extracted by the similar pixel block extracting means, the similar plurality of pixel blocks extracted by the similar pixel block extracting means and the centroid calculating means. The representative pixel block generating unit that generates a representative pixel block of the pixel block based on the center of gravity, and the representative pixel block storage unit that stores the representative pixel block generated by the representative pixel block generation unit, The pixel block extracting unit includes the representative pixel block stored by the representative pixel block storage unit in the pixel block cut out by the pixel block cutting unit, and a similar pixel block Extracting an image processing program, characterized by.
請求項1の画像処理装置によれば、対象画像内に類似の画素塊が少ないような場合であっても、その解像度を高めることができる。 According to the image processing apparatus of the first aspect, even if there are few similar pixel clusters in the target image, the resolution can be increased.
請求項2の画像処理装置によれば、対象画像内に類似する画素塊が少なくはない場合は、その対象画像内の画素塊だけを用いて高解像度の画素塊を生成することができる。 According to the image processing apparatus of the second aspect, when there are not a few pixel clusters similar in the target image, it is possible to generate a high-resolution pixel cluster using only the pixel blocks in the target image.
請求項3の画像処理装置によれば、複数の解像度の代表画素塊を生成して対象画像の解像度に合わせることができる。 According to the image processing apparatus of the third aspect, representative pixel blocks having a plurality of resolutions can be generated and matched with the resolution of the target image.
請求項4の画像処理装置によれば、回転した代表画素塊を生成して回転した対象画像にも対応できる。 According to the image processing apparatus of the fourth aspect, it is possible to deal with a rotated target image by generating a representative pixel block that has been rotated.
請求項5の画像処理装置によれば、記憶すべき代表画素塊を数を軽減させ、記憶容量の低減を図ることができる。 According to the image processing apparatus of the fifth aspect, the number of representative pixel blocks to be stored can be reduced, and the storage capacity can be reduced.
請求項6の画像処理装置によれば、操作者の指示に応じて、種々の処理を行わせることができる。 According to the image processing apparatus of the sixth aspect, various processes can be performed in accordance with an instruction from the operator.
請求項7の画像処理装置によれば、無駄な代表画素塊を記憶する必要がなくなり、記憶容量の低減を図ることができる。 According to the image processing apparatus of the seventh aspect, it is not necessary to store useless representative pixel blocks, and the storage capacity can be reduced.
請求項8の画像処理装置によれば、類似する画素塊の頻度に応じた処理を行うことができる。 According to the image processing apparatus of the eighth aspect, it is possible to perform processing according to the frequency of similar pixel blocks.
請求項9の画像処理プログラムによれば、対象画像内に類似の画素塊が少ないような場合であっても、その解像度を高めることができる。 According to the image processing program of the ninth aspect, even if there are few similar pixel clusters in the target image, the resolution can be increased.
まず、本実施の形態(第1から第8の実施の形態)の概要を説明する。
なお、本実施の形態が対象とする画素塊とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域は近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての1行から1文字ずつ切り出すように縦又は横方向に射影し、空白地点で切り出した画像領域、又は一定間隔で切り出した画像領域等がある。
なお、1つの画素塊として、1文字の画像となる場合が多い。ただし、実際に人間が文字として認識できる画素領域である必要はない。文字の一部分、文字に余分な画素領域を付加したもの、文字を形成しない画素領域等もあり、何らかの画素の塊であればよい。例えば、円や線のような図形であってもよい。以下、「文字」又は「文字画像」という場合は、特に断りがない限り「画素塊」の意で用いる。
First, an outline of the present embodiment (first to eighth embodiments) will be described.
Note that the pixel block targeted by this embodiment includes at least a pixel region that is continuous in four or eight connections, and also includes a set of these pixel regions. The set of these pixel areas means that there are a plurality of continuous pixel areas such as 4-connected, and the plurality of pixel areas are in the vicinity. Here, what is in the vicinity is, for example, an image area in which the pixel areas are close to each other in distance, an image area that is projected vertically or horizontally so as to cut out one character at a time from a line as a sentence, and cut out at a blank spot Or an image region cut out at regular intervals.
In many cases, an image of one character is formed as one pixel block. However, it is not necessary that the pixel area is actually recognizable as a character by humans. There are a part of a character, a character with an extra pixel area added to the character, a pixel area that does not form a character, and the like, and any block of pixels may be used. For example, it may be a figure such as a circle or a line. Hereinafter, the term “character” or “character image” means “pixel block” unless otherwise specified.
本実施の形態は、複数の文字がある画像を対象としている。これらの文字を用いて、高解像度の文字画像(代表文字画像データ)を生成するものである。高解像度の文字画像を生成する技術として、Super resolution技術がある。
通常の文書画像では、同じ文字画像が複数回出現する場合が多い。さらに、これら複数の類似文字画像(同一文字画像を含む)をスキャン・インした場合に文字画像(の重心)に対してスキャン・イン(標本化)の位相は各々ずれていることが多い。これら標本化の位相が各々ずれた複数の文字画像を用いることにより、スキャン・イン解像度よりも高い解像度の文字画像を構成することができる(なお、「高解像度の文字画像を構成すること」を「代表画像を生成する」ともいう)。このとき、必ずしも画像サイズを拡大する必要はなく、もとと同じ画像サイズであっても、そのデータが表す実効的な解像度だけを上げることもできる。又は、ランダム・ノイズを除去することができる。
This embodiment is intended for an image having a plurality of characters. Using these characters, a high-resolution character image (representative character image data) is generated. As a technique for generating a high-resolution character image, there is a Super resolution technique.
In normal document images, the same character image often appears multiple times. Furthermore, when a plurality of similar character images (including the same character image) are scanned in, the scan-in (sampling) phase is often shifted from the character image (center of gravity). By using a plurality of character images whose sampling phases are shifted from each other, it is possible to construct a character image having a resolution higher than the scan-in resolution (in addition, “structuring a high-resolution character image”). Also referred to as “creating a representative image”). At this time, it is not always necessary to increase the image size, and even if the image size is the same as the original size, only the effective resolution represented by the data can be increased. Alternatively, random noise can be removed.
ところが、1つの文書画像に1回しか使用されていない文字画像に対しては効果がなく、使用回数が少ない文字画像に対しては効果が薄くなる。
そのため、予め多種多様な文字画像データを準備しておき、それらを含めて、同じ形状となる文字画像を探すことが有効である。例えば、文書作成ソフトウェアやプリンタのように、文字コード・データとそれに対応する文字画像データをフォント・データとして準備している場合には、それを利用できるが、そうでない場合は新たに準備する必要がある。また、例えば、常用漢字2000種×フォント4種(明朝、ゴシックなど)=8000種の文字形状を含めて同じ形状の文字を探す処理負荷が多大となる。
However, it is not effective for a character image that is used only once for one document image, and is less effective for a character image that is used less frequently.
Therefore, it is effective to prepare various character image data in advance and search for a character image having the same shape including them. For example, if character code data and corresponding character image data are prepared as font data, such as document creation software and printers, they can be used, but if not, they must be newly prepared There is. Further, for example, the processing load for searching for characters having the same shape including the character shapes of 2000 types of common Kanji characters × 4 types of fonts (Mincho, Gothic, etc.) = 8000 types becomes large.
一方で、1つの文書画像を処理するのではなく、複数の文書画像をまとめて処理することを行ってもよい。複数の文書画像を処理することで、同じ文字画像が複数回使われている確率が増加する。
ところが、文書画像の枚数が増えるにつれて、同じ形状となる文字画像の探索処理負荷が増えてしまう。
本実施の形態は、対象画像データから生成した代表文字画像データを文字群画像データ(いわゆる辞書)として登録し、その文字群画像データを用いて、他の対象画像データから代表文字画像データを生成するものである。他の対象画像データに、1回又は少ない回数しか出現しない文字画像であっても、文字群画像データを用いることによって、代表文字画像データを生成するものである。
On the other hand, instead of processing one document image, a plurality of document images may be processed together. By processing a plurality of document images, the probability that the same character image is used multiple times increases.
However, as the number of document images increases, the search processing load for character images having the same shape increases.
In this embodiment, representative character image data generated from target image data is registered as character group image data (so-called dictionary), and representative character image data is generated from other target image data using the character group image data. To do. Even if a character image appears only once or a small number of times in other target image data, representative character image data is generated by using character group image data.
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<第1の実施の形態>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。また、所定という用語は、予め定められたの意の他に、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じての意を含めて用いる。
Hereinafter, examples of various preferred embodiments for realizing the present invention will be described with reference to the drawings.
<First Embodiment>
FIG. 1 is a conceptual module configuration diagram of a configuration example according to the first embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment also serves as an explanation of a computer program, a system, and a method. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. It is the control to be stored in the device. In addition, the modules correspond almost one-to-one with the functions. However, in mounting, one module may be composed of one program, or a plurality of modules may be composed of one program. A plurality of programs may be used. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. In the following, “connection” includes not only physical connection but also logical connection (data exchange, instruction, reference relationship between data, etc.).
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is also included. “Apparatus” and “system” are used as synonymous terms. Further, the term “predetermined” is used in addition to a predetermined meaning, depending on the situation / state at that time or including the meaning according to the situation / state until then.
第1の実施の形態は、図1に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112を有している。
As shown in FIG. 1, the first embodiment includes a
文字切出モジュール102は、類似文字画像データ抽出モジュール104、文字群画像データ縮小モジュール112と接続されており、文書画像を受け取り、その文書画像から文字を切り出す。切り出した文字(文字画像データ)を類似文字画像データ抽出モジュール104へ渡す。また、文字切出モジュール102は、文字群画像データ縮小モジュール112より縮小された代表文字を受け取り、文書画像から切り出した文字とともに、類似文字画像データ抽出モジュール104へ渡す。
文字切出モジュール102が行う文字切り出し処理として、例えば、特開平5−28301号公報、特開平5−120481号公報、特開平5−143776号公報、特開平5−174185号公報、特開平6−44406号公報、特開平6−187489号公報、特開平6−348911号公報、特開平7−13994号公報、特開平7−160810号公報、特開平8−161432号公報、特開平8−297718号公報、特開平10−69524号公報、特開平10−134145号公報、特開平10−261047号公報、特開2000−57261号公報、特開2001−43314号公報、特開2004−78531号公報等に記載の様々な手法を用いることができる。
The
Examples of character cut-out processing performed by the character cut-out
類似文字画像データ抽出モジュール104は、文字切出モジュール102、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108と接続されている。文字切出モジュール102によって切り出された文字のうち類似するものを抽出する。そして、文字群画像データ記憶モジュール110によって記憶された代表文字を文字切出モジュール102によって切り出された文字に含めて、類似する文字を抽出する。なお、文字群画像データ記憶モジュール110によって記憶された代表文字は、文字群画像データ記憶モジュール110から直接受け取ってもよいし、文字群画像データ縮小モジュール112を介して受け取ってもよいし、さらに、文字切出モジュール102を介して受け取ってもよい。そして、抽出した互いに類似する文字(類似文字画像データ)を文字画像データ重心算出モジュール106、文字画像データ構成モジュール108へ渡す。
The similar character image
類似文字画像データ抽出モジュール104が行う類似しているかどうかを判定する方法は様々にある。以下、文字の類似度を判定する方法の例を述べる。
文字の類似度を検証する方式として以下を例に挙げる。
(A1)切り出された文字画像である2枚の2値画像を入力する。
(A2)2枚の2値画像の黒画素の重心をあわせる。
(A3)重心をあわせた2枚の二値画像のXOR(eXclusive OR:排他的論理和)演算を行う。
(A4)さらに、微小(上下左右斜めに数画素)移動させて、XOR演算の結果、1となった画素(相違する画素)の個数を数える。非移動を含む様々な移動後のXOR演算の結果、1となった画素(相違する画素)の個数の最小値が所定の閾値以下であれば、類似する文字画像であると判断する。閾値として、文字画像の画素数に比例する数値であってもよい。
(A5)切り出された文字画像に対して、他の文字画像との類似度を前述の手法で計算し、次々に類似している文字画像をまとめる(グルーピングする)。
There are various methods for determining whether or not the similar character image
The following is an example of a method for verifying the similarity of characters.
(A1) Two binary images that are clipped character images are input.
(A2) The centers of gravity of the black pixels of the two binary images are matched.
(A3) An XOR (exclusive OR) operation is performed on two binary images with the center of gravity.
(A4) Further, it is moved slightly (several pixels vertically and horizontally), and the number of pixels (different pixels) that become 1 as a result of the XOR operation is counted. As a result of various XOR operations after movement including non-movement, if the minimum value of the number of pixels that are 1 (different pixels) is equal to or less than a predetermined threshold, it is determined that the character images are similar. The threshold value may be a numerical value proportional to the number of pixels of the character image.
(A5) The cut-out character images are calculated for the similarity with other character images by the above-described method, and character images that are similar to each other are grouped together (grouped).
なお、文字画像が類似するか否かの判定として、前述した他に、例えば、切り出された文字画像を1つのベクトルデータとして扱い、クラスタリングを行い、その文字画像と類似する文字画像を抽出してもよい。この場合、その文字画像を表すベクトルデータと判定対象の文字画像を表すベクトルデータとの距離(例えば、ユークリッド距離等)が所定値以下(すなわち、2つのベクトルデータの距離が近いとき)の場合は、その文字画像と判定対象の文字画像とが類似していると判定する。
さらに、2つの文字画像パターンの論理演算の結果画像に基づいて膨張画像を生成し、その膨張画像と重なり合う割合に基づいて、類似しているか否かを判定するようにしてもよい。つまり、その2つが一致する場合の膨張させる度合い(膨張半径)によって、相違度を判定するようにしてもよい。
この他に、特開平07−200745号公報、I. H. Witten, A. Moffat, and T. C. Bell 著 「Managing Gigabytes」Morgan Kaufmmann Publishers pp.320-332.等に記載されている方法を用いてもよい。
In addition to the above, as a determination of whether or not the character images are similar, for example, the cut character image is treated as one vector data, clustered, and a character image similar to the character image is extracted. Also good. In this case, when the distance (for example, the Euclidean distance) between the vector data representing the character image and the vector data representing the character image to be determined is equal to or less than a predetermined value (that is, when the distance between the two vector data is short) Then, it is determined that the character image is similar to the character image to be determined.
Furthermore, an expanded image may be generated based on the result image of the logical operation of the two character image patterns, and it may be determined whether or not they are similar based on the ratio of overlapping with the expanded image. That is, the degree of difference may be determined based on the degree of expansion (expansion radius) when the two match.
In addition, a method described in Japanese Patent Application Laid-Open No. 07-200755, “Managing Gigabytes” by IH Witten, A. Moffat, and TC Bell, Morgan Kaufmmann Publishers, pp. 320-332.
なお、類似度とは、2つの画像が合同である場合に最大となり、相違する度合いに応じて減少する量のことである。
類似度のかわりに、2つの画像が合同である場合に最小となり、相違する度合いに応じて増加する量を用いてもよい。この場合は、「距離」又は「相違度」と呼ばれる。距離とは、画像をベクトルで表した場合(画素値そのものをベクトルとする、又は画像の特徴量をベクトルとする等)に、ベクトルで表現した画像を空間内に配置し、その空間内での各画像同士の隔たり(距離)のことである。例えば、ユークリッド距離、マンハッタン距離、ハウスドルフ距離、マハラノビス距離、ベクトル間の角度θ、cosθ、cosθの2乗等がある。
つまり、類似する文字を探索するのに、類似度の他に、「距離」又は「相違度」を用いてもよい。したがって、「類似する」には、類似度が高いこと、距離が近いこと等を含めた概念である。
Note that the similarity is the amount that is maximized when two images are congruent and decreases according to the degree of difference.
Instead of similarity, an amount that is minimized when two images are congruent and increases according to the degree of difference may be used. In this case, it is called “distance” or “degree of difference”. The distance is an image represented by a vector (such as a pixel value itself as a vector or an image feature amount as a vector). This is the distance (distance) between the images. For example, there are Euclidean distance, Manhattan distance, Hausdorff distance, Mahalanobis distance, angles between vectors θ, cos θ, and the square of cos θ.
That is, in order to search for similar characters, “distance” or “difference” may be used in addition to the similarity. Therefore, “similar” is a concept including high similarity, close distance, and the like.
なお、前述の類似文字の探索処理では、1個の文字に対し、他の全ての文字との類似度を計測しているが、高速化を図るために、文字矩形の大きさがある程度同じものに対してのみ、計算量の多い類似度の計算を行うようにしてもよい。 In the above-described similar character search process, the degree of similarity of one character with all other characters is measured. However, in order to increase the speed, the size of the character rectangle is somewhat the same. Only for the above, similarity calculation with a large amount of calculation may be performed.
文字画像データ重心算出モジュール106は、類似文字画像データ抽出モジュール104、文字画像データ構成モジュール108と接続されており、類似文字画像データ抽出モジュール104によって抽出された類似する複数の文字の重心を算出する。その文字の重心(文字画像データの重心値)を文字画像データ構成モジュール108へ渡す。なお、重心は1画素(文書画像における1画素)以下の精度で求めることになる。重心の算出処理については、図4、5、6を用いて後述する。
The character image data
文字画像データ構成モジュール108は、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字群画像データ記憶モジュール110と接続されており、類似文字画像データ抽出モジュール104によって抽出された類似する複数の文字と文字画像データ重心算出モジュール106によって算出された重心に基づいて、その文字の代表文字を生成する。代表文字とは、文字切出モジュール102によって切り出された文字よりも高解像度の文字であって、また、複数の文字から生成されたものである。なお、代表文字の生成は、重心の相対位置から類似文字の文書画像内での位相を推定し、その推定した位相と類似文字から、文書画像の解像度以上の解像度の代表文字を生成するものである。代表文字の生成については、図4、5、6を用いて後述する。文字画像データ構成モジュール108は、生成した代表文字を、外部に出力し、文字群画像データ記憶モジュール110へ渡す。
The character image
文字群画像データ記憶モジュール110は、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112と接続されている。文字画像データ構成モジュール108によって生成された代表文字を記憶する。そして、文字群画像データ縮小モジュール112からアクセスされ、その代表文字(文字群画像データ)を文字切出モジュール102へ渡す。また、文字切出モジュール102又は類似文字画像データ抽出モジュール104からアクセスされ、その代表文字を文字切出モジュール102又は類似文字画像データ抽出モジュール104へ渡すようにしてもよい。例えば、図2に示すように、文字群画像データ記憶モジュール110は代表文字からなる画像データ200を記憶する。
文字群画像データ縮小モジュール112は、文字群画像データ記憶モジュール110、文字切出モジュール102と接続されており、文字切出モジュール102又は類似文字画像データ抽出モジュール104からの要求に応じて、文字群画像データ記憶モジュール110から代表文字を取り出し、その代表文字の解像度を文字切出モジュール102が受け付ける文書画像の解像度に合わせるために、縮小処理(解像度を下げる処理)を行う。縮小した代表文字(縮小画像データ)を要求を行った文字切出モジュール102又は類似文字画像データ抽出モジュール104へ渡す。なお、代表文字と文書画像の解像度が同じ場合は、文字群画像データ縮小モジュール112は処理を行う必要がない。したがって、ここでの縮小処理には1倍に縮小(何もしない)処理も含む。
The character group image
The character group image
図3は、第1の実施の形態による処理例を示すフローチャートである。
ステップS302では、文字切出モジュール102が、文書画像を受け取り、その文書画像内から文字を切り出す。
ステップS304では、文字群画像データ縮小モジュール112が、文字群画像データ記憶モジュール110から代表文字を抽出する。
ステップS306では、文字群画像データ縮小モジュール112が、ステップS304で抽出した代表文字に対して縮小処理を行う。
ステップS308では、類似文字画像データ抽出モジュール104が、ステップS302で切り出された文字とステップS306で縮小された代表文字の中で、切り出された文字と類似する文字を抽出する。
FIG. 3 is a flowchart illustrating a processing example according to the first exemplary embodiment.
In step S302, the
In step S304, the character group image
In step S306, the character group image
In step S308, the similar character image
ステップS310では、文字画像データ重心算出モジュール106が、ステップS308で抽出された複数の類似文字の重心を算出する。
ステップS312では、文字画像データ構成モジュール108が、ステップS308で抽出された文字とステップS310で算出された重心に基づいて、代表文字を生成する。
ステップS314では、文字群画像データ記憶モジュール110が、ステップS312で生成された文字を記憶する。
ステップS316では、文字画像データ構成モジュール108が、代表文字を外部に出力する。
なお、ステップS314,ステップS316の処理はいずれが先でもよく、また同時であってもよい。
In step S310, the character image data center-of-
In step S312, the character image
In step S314, the character group image
In step S316, the character image
Note that any of the processes in steps S314 and S316 may be performed first or simultaneously.
図4を用いて、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108による処理例を説明する。文字画像データ構成モジュール108は拡大処理を行うものである。
文字切出モジュール102は、複数の「2」という文字が記載された対象文書画像410内の文字画像411、文字画像412、文字画像413を対象画像とする。そして、それぞれの文字画像を、文字画像411の解像度で切り出す。また、それぞれの文字画像の文字サイズ/文字位置データを抽出して、文字画像データ構成モジュール108へ渡すようにしてもよい。
類似文字画像データ抽出モジュール104は、類似している文字画像を探索し、複数の「2」という文字画像のグループを生成する。
そして、文字画像データ重心算出モジュール106は、文字画像411、文字画像412、文字画像413の重点(重心線411A等の交差点)を求め、文字画像データ構成モジュール108は、その重点を一致させるように位相を移動して高解像度文字画像420を生成する。
また、文字画像データ構成モジュール108は、例えば「2」という文字画像の文字コード・データを割り当てるようにしてもよい。文字コードの割り当て処理は、文字認識処理によって行うようにしてもよい。
また、文字画像データ構成モジュール108は、高解像度文字画像420から例えばアウトライン情報であるフォント・データ430を生成するようにしてもよい。その文字画像の文字サイズ/文字位置データを対応付けて出力するようにしてもよい。
An example of processing by the
The
The similar character image
Then, the character image data center-of-
Further, the character image
Further, the character image
図5を用いて、文字画像データ重心算出モジュール106による重心の算出処理例、文字画像データ構成モジュール108による代表文字の生成、つまり高解像度文字画像を構成する拡大処理例を説明する。
図5(A)は、対象文書画像410の解像度(第1の解像度)における標本化格子(第1の標本化格子501、第1の標本化格子502、第1の標本化格子503、第1の標本化格子504)及び文字画像の重心位置(重心501A、重心502A、重心503A、重心504A)を表している。文字画像データ重心算出モジュール106は、各文字画像の重心を算出する。
次に、文字画像データ構成モジュール108は、まず、図5(B)に示すように、文字画像の重心に基づいて、4つの標本化格子の位相を移動させる。
An example of gravity center calculation processing by the character image data gravity
FIG. 5A illustrates a sampling grid (
Next, the character image
図5(C)、図5(D)は、第1の解像度よりも高い第2の解像度の標本化格子を設定する手法の例を説明する図である。図5(C)に記載された丸数字(1、2、3、4)は、第1の解像度における文字画像の値を例示している。ここで、文字画像は、丸数字が第1の解像度における標本化格子の格子点上に表されるようにプロットされている。
図5(C)において、第1の標本化格子505は第1の解像度の標本化格子である。図5(D)において、第2の標本化格子506は第2の解像度(高解像度画像)の標本化格子である。
文字画像データ構成モジュール108は、第1の解像度における4つの標本化格子の位相が移動されると、図5(D)に示すように、第2の解像度における標本化格子を設定し、文字画像の重心が一致するように、第2の解像度における標本化格子の位相を移動させる。
FIGS. 5C and 5D are diagrams illustrating an example of a technique for setting a sampling grid having a second resolution higher than the first resolution. The circled numbers (1, 2, 3, 4) shown in FIG. 5C exemplify the value of the character image at the first resolution. Here, the character image is plotted so that the circled numbers are represented on the grid points of the sampling grid at the first resolution.
In FIG. 5C, a
When the phases of the four sampling grids at the first resolution are moved, the character image
図5(E)は、第2の解像度における文字画像の値を算出する手法の例を説明する図である。第2の標本化格子506A、第2の標本化格子506B、第2の標本化格子506C、第2の標本化格子506D内の中心にある丸数字は、第2の解像度における文字画像の値を例示しているものである。ここで、第2の解像度における文字画像は、中心にある丸数字が、第2の解像度における標本化格子の格子点上に表されるように示されている。
そして、文字画像データ構成モジュール108は、第1の解像度における各文字画像の位相に基づいて、その各文字画像の画素値から、第2の解像度における文字画像の画素値を補間する。本例では、文字画像データ構成モジュール108は、最近傍補間法を適用して、第2の解像度における文字画像の画素値を補間する。すなわち、文字画像データ構成モジュール108は、第1の解像度における文字画像の4つの値(図5(E)では、丸数字の1、2、3、4)のうち、第2の解像度における標本化格子点に最も近い値を選択して、第2の解像度における文字画像の値とする。具体的には、第2の標本化格子506Aでは、中心に最も近い値は「1」であり、「1」を採用している(丸数字は1である)。なお、補間方法は、この方法に限定されるものではなく、その他の方法(例えば、線形補間法など)を適用してもよい。
なお、文字画像データ構成モジュール108による処理は、前述の処理に限られず、線形補間、キュービックコンボリューション等でもよい。
FIG. 5E is a diagram for explaining an example of a method for calculating the value of a character image at the second resolution. The circled numbers in the center of the
Then, the character image
The processing by the character image
図6は、文字群画像データ記憶モジュール110を含めた文字画像データ重心算出モジュール106、文字画像データ構成モジュール108による処理例を示す説明図である。
文字切出モジュール102は、対象文書画像データ610から文字画像411を切り出す。また、類似文字画像データ抽出モジュール104は、文字群画像データ記憶モジュール110に記憶されている先に準備した文字群画像データ620から文字画像411に類似する文字画像621を抽出する。なお、図6の例の場合、対象文書画像データ610内には、文字画像411に類似する文字がないので、類似文字画像データ抽出モジュール104は、文字画像411に類似する文字として文字画像621だけを抽出している。
文字画像データ重心算出モジュール106は、文字画像411、文字画像621のそれぞれの重心(図6では、文字画像411、621内の十字線の中心)を算出する。
文字画像データ構成モジュール108は、代表文字である高解像度文字画像420を生成する。そして、文字群画像データ記憶モジュール110は、先に準備した文字群画像データ620内にこの生成された高解像度文字画像420を記憶する。
FIG. 6 is an explanatory diagram showing an example of processing by the character image data gravity
The
The character image data center-of-
The character image
<第2の実施の形態>
第2の実施の形態は、図7に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112、文字群画像データ使用指示モジュール701を有している。第1の実施の形態に、文字群画像データ使用指示モジュール701を付加したものである。なお、第1の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
<Second Embodiment>
As shown in FIG. 7, the second embodiment includes a
類似文字画像データ抽出モジュール104は、文字切出モジュール102、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ使用指示モジュール701と接続されており、文字切出モジュール102によって切り出された文字のうち類似するものの数を計数する。そして、その類似文字の数を文字群画像データ使用指示モジュール701へ渡す。また、類似文字画像データ抽出モジュール104は、文字群画像データ使用指示モジュール701からの指示に基づいて、文字群画像データ記憶モジュール110によって記憶された代表文字を使用して類似文字を抽出する。
文字群画像データ記憶モジュール110は、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112、文字群画像データ使用指示モジュール701と接続されており、文字群画像データ使用指示モジュール701からの指示に基づいて、代表文字を文字群画像データ縮小モジュール112(文字切出モジュール102又は類似文字画像データ抽出モジュール104でもよい。以下、文字群画像データ縮小モジュール112等ともいう)へ渡すようにしてもよい。
The similar character image
The character group image
文字群画像データ使用指示モジュール701は、類似文字画像データ抽出モジュール104、文字群画像データ記憶モジュール110と接続されている。類似文字画像データ抽出モジュール104によって計数された数に基づいて、類似文字画像データ抽出モジュール104に文字群画像データ記憶モジュール110によって記憶された代表文字を使用させることを指示する。これは、文字群画像データ記憶モジュール110に対して指示を行い、文字群画像データ記憶モジュール110から能動的に文字群画像データ縮小モジュール112等へ代表文字を渡すようにして実現してもよい。また、文字切出モジュール102等に対して指示を行い、文字群画像データ記憶モジュール110から代表文字を使用させるようにして実現してもよい。
なお、「類似文字画像データ抽出モジュール104によって計数された数に基づいて」として、例えば、文書画像内に類似文字がない(その文字が1つの場合)又は所定の閾値(代表文字を生成するに必要な類似文字の数)よりも少ない場合等がある。したがって、文書画像内に類似文字が多い場合は、その文書画像内の類似文字だけで代表文字を生成させることとなる。
The character group image data use
In addition, as “based on the number counted by the similar character image
図8は、第2の実施の形態による処理例を示すフローチャートである。
ステップS802では、文字切出モジュール102が、文書画像を受け取り、その文書画像内から文字を切り出す。
ステップS804では、類似文字画像データ抽出モジュール104が、ステップS802で切り出された文字から類似する文字を抽出する。
ステップS806では、ステップS804で抽出された類似文字の数は所定の閾値よりも少ないか否かを判断する。かかる判断において、少ないと判断した場合はステップS808へ進み、それ以外の場合はステップS814へ進む。
ステップS808では、文字群画像データ使用指示モジュール701の使用指示に基づいて、文字群画像データ縮小モジュール112が、文字群画像データ記憶モジュール110から代表文字を抽出する。
FIG. 8 is a flowchart illustrating a processing example according to the second exemplary embodiment.
In step S802, the
In step S804, the similar character image
In step S806, it is determined whether the number of similar characters extracted in step S804 is less than a predetermined threshold. In this determination, if it is determined that the number is small, the process proceeds to step S808, and otherwise, the process proceeds to step S814.
In step S <b> 808, the character group image
ステップS810では、文字群画像データ縮小モジュール112が、ステップS808で抽出した代表文字に対して縮小処理を行う。
ステップS812では、類似文字画像データ抽出モジュール104が、ステップS802で切り出された文字とステップS810で縮小された代表文字の中で、切り出された文字と類似する文字を抽出する。
ステップS814では、文字画像データ重心算出モジュール106が、ステップS804又はステップS812で抽出された複数の類似文字の重心を算出する。
ステップS816では、文字画像データ構成モジュール108が、ステップS804又はステップS812で抽出された文字とステップS814で算出された重心に基づいて、代表文字を生成する。
ステップS818では、文字群画像データ記憶モジュール110が、ステップS816で生成された文字を記憶する。
ステップS820では、文字画像データ構成モジュール108が、代表文字を外部に出力する。
In step S810, the character group image
In step S812, the similar character image
In step S814, the character image data center-of-
In step S816, the character image
In step S818, the character group image
In step S820, the character image
<第3の実施の形態>
第3の実施の形態は、図9に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112、代表文字解像度指示モジュール901を有している。第1の実施の形態に、代表文字解像度指示モジュール901を付加したものである。なお、第1、第2の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1、第2の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
<Third Embodiment>
As shown in FIG. 9, the third embodiment includes a
代表文字解像度指示モジュール901は、文字画像データ構成モジュール108と接続されている。文字画像データ構成モジュール108によって生成される代表文字の解像度を指示する。その指示する解像度は、文字切出モジュール102が切り出す文字の解像度であってもよい。また、その解像度は、複数であってもよい。複数である場合は、文字画像データ構成モジュール108が外部に出力する代表文字と文字群画像データ記憶モジュール110に記憶させる代表文字の解像度を異ならせてもよい。さらに、異ならせる場合は、外部に出力する代表文字は文字群画像データ記憶モジュール110に記憶させる代表文字よりも高解像度であるようにしてもよい。また、文字群画像データ記憶モジュール110に記憶させる代表文字の解像度を複数としてもよい。例えば、外部に出力する代表文字の解像度と文字切出モジュール102が切り出す文字の解像度である。
The representative character
文字画像データ構成モジュール108は、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字群画像データ記憶モジュール110、代表文字解像度指示モジュール901と接続されている。代表文字解像度指示モジュール901によって指示された解像度に応じて、代表文字を生成する。指示された解像度が複数の場合は、生成する代表文字も複数である。
文字群画像データ記憶モジュール110は、文字画像データ構成モジュール108によって生成された代表文字が複数の場合は、その複数の解像度の代表文字を記憶する。例えば、図10に示すように、画像データ1000は代表文字からなる文字群画像データ1010、文字群画像データ1020を記憶する。
文字群画像データ縮小モジュール112は、文字群画像データ記憶モジュール110に記憶されている代表文字のうち、文字切出モジュール102が切り出す文字と解像度が近いもの(同じものを含む)を選択して縮小してもよい。また、文字群画像データ記憶モジュール110が記憶する代表文字の解像度が文字切出モジュール102が切り出す文字の解像度と同じ場合は、文字群画像データ縮小モジュール112はなくてもよく、文字群画像データ記憶モジュール110は文字切出モジュール102又は類似文字画像データ抽出モジュール104と接続されていてもよい。
The character image
When there are a plurality of representative characters generated by the character image
The character group image
図11は、第3の実施の形態による処理例を示すフローチャートである。
ステップS1102からステップS1110までは、第1の実施の形態の図3に示したフローチャートのステップS302からステップS310までと同等である。
ステップS1112では、文字画像データ構成モジュール108は、代表文字解像度指示モジュール901によって指定された解像度の代表文字を生成する。なお、代表文字解像度指示モジュール901による解像度の指示は、ステップS1112の前であればいつでもよい。例えば、第3の実施の形態による処理が始まる前に1回だけ指定するようにしてもよい。
ステップS1114では、文字群画像データ記憶モジュール110がステップS1112で生成された複数の代表文字を記憶する。
ステップS1116は、第1の実施の形態の図3に示したフローチャートのステップS316と同等である。
FIG. 11 is a flowchart illustrating a processing example according to the third exemplary embodiment.
Steps S1102 to S1110 are the same as steps S302 to S310 in the flowchart shown in FIG. 3 of the first embodiment.
In step S <b> 1112, the character image
In step S1114, the character group image
Step S1116 is equivalent to step S316 in the flowchart shown in FIG. 3 of the first embodiment.
<第4の実施の形態>
第4の実施の形態は、図12に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112、代表文字画像データ回転モジュール1201を有している。第1の実施の形態に、代表文字画像データ回転モジュール1201を付加したものである。なお、第1から第3の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1から第3の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
<Fourth embodiment>
As shown in FIG. 12, the fourth embodiment includes a
文字画像データ構成モジュール108は、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、代表文字画像データ回転モジュール1201と接続されており、生成した代表文字を代表文字画像データ回転モジュール1201へ渡す。
代表文字画像データ回転モジュール1201は、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110と接続されており、文字画像データ構成モジュール108によって生成された代表文字を回転させる。その回転した代表文字を文字群画像データ記憶モジュール110に記憶させる。複数の回転角度で回転してもよい。また、回転角度は90度単位の角度であってもよい。つまり、0度(回転させない)、90度、180度、270度の4つの角度で代表文字を回転させてもよい。
文字群画像データ記憶モジュール110は、代表文字画像データ回転モジュール1201、文字群画像データ縮小モジュール112と接続されている。代表文字画像データ回転モジュール1201によって回転された代表文字を記憶する。複数の回転角度で回転した代表文字を記憶してもよい。例えば、図13に示すように、画像データ1300は、文字群画像データ1301、180度回転した文字群画像データ1302、右へ270度回転した文字群画像データ1303、右へ90度回転した文字群画像データ1304を有している。
文字群画像データ縮小モジュール112は、文字群画像データ記憶モジュール110に記憶されている全ての代表文字を縮小するようにしてもよいし、対象文書画像の回転角度が判明している場合は、文字群画像データ記憶モジュール110に記憶されている該当の回転角度の代表文字を縮小するようにしてもよい。
The character image
The representative character image
The character group image
The character group image
図14は、第4の実施の形態による処理例を示すフローチャートである。
ステップS1402からステップS1412までは、第1の実施の形態の図3に示したフローチャートのステップS302からステップS312までと同等である。
ステップS1414では、代表文字画像データ回転モジュール1201が、ステップS1412で生成された代表文字を回転する。
ステップS1416では、文字群画像データ記憶モジュール110が、ステップS1414で回転された複数の代表文字を記憶する。
ステップS1418は、第1の実施の形態の図3に示したフローチャートのステップS316と同等である。
FIG. 14 is a flowchart illustrating a processing example according to the fourth exemplary embodiment.
Steps S1402 to S1412 are the same as steps S302 to S312 in the flowchart shown in FIG. 3 of the first embodiment.
In step S1414, the representative character image
In step S1416, the character group image
Step S1418 is equivalent to step S316 of the flowchart shown in FIG. 3 of the first embodiment.
<第5の実施の形態>
第5の実施の形態は、図15に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112、代表文字画像データ記憶指示モジュール1501を有している。第1の実施の形態に、代表文字画像データ記憶指示モジュール1501を付加したものである。なお、第1から第4の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1から第4の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
<Fifth embodiment>
As shown in FIG. 15, the fifth embodiment includes a
類似文字画像データ抽出モジュール104は、文字切出モジュール102、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、代表文字画像データ記憶指示モジュール1501と接続されており、文字切出モジュール102によって切り出された文字のうち類似するものの数を計数する。そして、その類似文字の数を代表文字画像データ記憶指示モジュール1501へ渡す。
代表文字画像データ記憶指示モジュール1501は、類似文字画像データ抽出モジュール104、文字群画像データ記憶モジュール110と接続されており、類似文字画像データ抽出モジュール104によって計数された数に基づいて、文字群画像データ記憶モジュール110に代表文字を記憶させることを指示する。なお、「類似文字画像データ抽出モジュール104によって計数された数に基づいて」として、例えば、文書画像内に類似文字がない(その文字が1つの場合)又は所定の閾値(代表文字を生成するに必要な類似文字の数)よりも少ない場合等がある。したがって、文書画像内に類似文字が多い場合、文字群画像データ記憶モジュール110はその文字の代表文字を記憶する必要がない。
文字群画像データ記憶モジュール110は、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112、代表文字画像データ記憶指示モジュール1501と接続されており、代表文字画像データ記憶指示モジュール1501の指示に基づいて、代表文字を記憶する。
The similar character image
The representative character image data
The character group image
図16は、第5の実施の形態による処理例を示すフローチャートである。
ステップS1602からステップS1612までは、第1の実施の形態の図3に示したフローチャートのステップS302からステップS312までと同等である。
ステップS1614では、代表文字画像データ記憶指示モジュール1501が、類似文字画像データ抽出モジュール104によって計数された類似文字数は所定の閾値よりも少ないか否かを判断する。かかる判断において、少ないと判断した場合はステップS1616へ進み、それ以外の場合はステップS1618へ進む。
ステップS1616では、文字群画像データ記憶モジュール110が、ステップS1612で生成された代表文字を記憶する。
ステップS1618で、第1の実施の形態の図3に示したフローチャートのステップS316と同等である。
FIG. 16 is a flowchart illustrating a processing example according to the fifth exemplary embodiment.
Steps S1602 to S1612 are equivalent to steps S302 to S312 of the flowchart shown in FIG. 3 of the first embodiment.
In step S1614, the representative character image data
In step S1616, the character group image
Step S1618 is equivalent to step S316 of the flowchart shown in FIG. 3 of the first embodiment.
第6の実施の形態は、図17に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112、データ出力・記憶・消去制御モジュール1701を有している。第1の実施の形態に、データ出力・記憶・消去制御モジュール1701を付加したものである。なお、第1から第5の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1から第5の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
As shown in FIG. 17, the sixth embodiment includes a
第6の実施の形態は、第1の実施の形態による処理を行わせる学習モードと、代表文字を出力することなく単に代表文字の文字群画像データ記憶モジュール110への記憶のみを行わせる学習専念モードと、代表文字の記憶を行うことなく単に代表文字の出力のみを行わせる非学習モードと、文字群画像データ記憶モジュール110に記憶してある代表文字を消去させる学習初期化モードのうち、1つ又は複数を設け、それらの切り替え指示を操作者が行うものである。
学習モードは、文字群画像データ記憶モジュール110への代表文字の記憶と出力を行うものであり、利用初期の段階で行う(学習用の辞書を生成しながら、代表文字を出力するという利用)ものである。学習専念モードは、代表文字の記憶のみを行う(学習用の辞書のみを生成する利用)ものである。非学習モードは、学習モード又は学習専念モードによって代表文字の記憶を行った後に利用され、高速化を図るために代表文字の記憶を行わずに代表文字の出力のみを行うものである。学習初期化モードは、代表文字の記憶の消去を行う(学習用の辞書の消去)ものであり、辞書のメンテナンスに利用される。
The sixth embodiment is a learning mode in which the processing according to the first embodiment is performed, and learning dedicated to only storing the representative characters in the character group image
The learning mode is for storing and outputting representative characters to the character group image
文字画像データ重心算出モジュール106は、類似文字画像データ抽出モジュール104、文字画像データ構成モジュール108、データ出力・記憶・消去制御モジュール1701と接続されており、データ出力・記憶・消去制御モジュール1701の指示に基づいて、重心算出処理を行う。
文字画像データ構成モジュール108は、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字群画像データ記憶モジュール110、データ出力・記憶・消去制御モジュール1701と接続されており、データ出力・記憶・消去制御モジュール1701の指示に基づいて、代表文字生成処理を行う。
文字群画像データ記憶モジュール110は、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112、データ出力・記憶・消去制御モジュール1701と接続されており、データ出力・記憶・消去制御モジュール1701の指示に基づいて、代表文字の消去処理を行う。
The character image data center-of-
The character image
The character group image
データ出力・記憶・消去制御モジュール1701は、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110と接続されている。操作者による登録、出力又は消去の指示を受け付ける。
その指示が登録である場合は、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108及び文字群画像データ記憶モジュール110による処理を行わせるように制御する。ただし、文字画像データ構成モジュール108に対しては外部へ代表文字を出力させないように制御する。
その指示が出力である場合は、文字画像データ重心算出モジュール106及び文字画像データ構成モジュール108による処理を行わせるように制御する。ただし、文字画像データ構成モジュール108は文字群画像データ記憶モジュール110に対しては代表文字を記憶させないように制御する。
その指示が消去である場合は、文字群画像データ記憶モジュール110に記憶された代表文字を消去するように制御する。
また、受け付ける操作者からの指示は1つ又は複数であってもよい。
その指示が登録及び出力の場合は、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108及び文字群画像データ記憶モジュール110による処理を行わせるように制御する。つまり、第1の実施の形態による処理と同等になる。
なお、指示が登録及び出力の場合は前述の学習モードに該当し、指示が登録の場合は学習専念モードに該当し、指示が出力の場合は非学習モードに該当し、指示が消去の場合は学習初期化モードに該当する。
The data output / storage /
If the instruction is registration, control is performed so that processing by the character image data center-of-
When the instruction is an output, control is performed so that the character image data center-of-
When the instruction is erasure, control is performed so as to erase the representative character stored in the character group image
Moreover, the instruction | indication from the operator who receives may be one or more.
When the instruction is registration and output, control is performed so that processing by the character image data
When the instruction is registration and output, it corresponds to the learning mode described above, when the instruction is registration, it corresponds to the learning dedicated mode, when the instruction is output, it corresponds to the non-learning mode, and when the instruction is erased This corresponds to the learning initialization mode.
図18は、第6の実施の形態による処理例を示すフローチャートである。
ステップS1802からステップS1808までは、第1の実施の形態の図3に示したフローチャートのステップS302からステップS308までと同等である。
ステップS1810では、データ出力・記憶・消去制御モジュール1701が、操作者の指示を受け付け、その指示が登録である場合はステップS1812へ、出力の場合はステップS1818へ、消去の場合はステップS1824へ進む。
ステップS1812からステップS1816までは、第1の実施の形態の図3に示したフローチャートのステップS310からステップS314と同等である。
ステップS1818からステップS1822までは、第1の実施の形態の図3に示したフローチャートのステップS310、ステップS312、ステップS316と同等である。
ステップS1824では、文字群画像データ記憶モジュール110が記憶している代表文字を消去する。
なお、登録及び出力の場合は、ステップS1812からステップS1816の処理及びステップS1822の処理を行う。
FIG. 18 is a flowchart illustrating a processing example according to the sixth exemplary embodiment.
Steps S1802 to S1808 are the same as steps S302 to S308 in the flowchart shown in FIG. 3 according to the first embodiment.
In step S1810, the data output / storage / erase
Steps S1812 to S1816 are the same as steps S310 to S314 in the flowchart shown in FIG. 3 of the first embodiment.
Steps S1818 to S1822 are the same as steps S310, S312 and S316 in the flowchart shown in FIG. 3 according to the first embodiment.
In step S1824, the representative character stored in the character group image
In the case of registration and output, the processing from step S1812 to step S1816 and the processing of step S1822 are performed.
<第7の実施の形態>
第7の実施の形態は、図19に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112を有している。第1の実施の形態に加えて、類似文字画像データ抽出モジュール104と文字群画像データ記憶モジュール110を接続したものである。なお、第1から第6の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1から第6の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
<Seventh embodiment>
As shown in FIG. 19, the seventh embodiment includes a
類似文字画像データ抽出モジュール104は、文字切出モジュール102、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110と接続されており、抽出した類似文字を文字群画像データ記憶モジュール110にも渡す。文字群画像データ記憶モジュール110に渡す類似文字は、文字群画像データ記憶モジュール110に記憶されていた文字であるようにしてもよい。
文字群画像データ記憶モジュール110は、類似文字画像データ抽出モジュール104、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112と接続されており、文字画像データ構成モジュール108によって生成された代表文字を記憶する場合に、文字画像データ構成モジュール108が代表文字を生成するときに用いた代表文字を消去する。つまり、文字画像データ構成モジュール108によって新しく生成された代表文字を記憶するときに、その代表文字に対応する文字群画像データ記憶モジュール110に記憶されている代表文字を消去する。文字群画像データ記憶モジュール110には、類似文字と判断される文字は1つだけとなる。
The similar character image
The character group image
図20は、第7の実施の形態による処理例を示すフローチャートである。
ステップS2002からステップS2014までは、第1の実施の形態の図3に示したフローチャートのステップS302からステップS314までと同等である。
ステップS2016では、文字群画像データ記憶モジュール110が、既に文字群画像データ記憶モジュール110に記憶されている代表文字のうち、類似文字画像データ抽出モジュール104から受け取った類似文字と同じものを消去する。
ステップS2018は、第1の実施の形態の図3に示したフローチャートのステップS316と同等である。
FIG. 20 is a flowchart illustrating a processing example according to the seventh exemplary embodiment.
Steps S2002 to S2014 are the same as steps S302 to S314 in the flowchart shown in FIG. 3 according to the first embodiment.
In step S2016, the character group image
Step S2018 is equivalent to step S316 of the flowchart shown in FIG. 3 of the first embodiment.
<第8の実施の形態>
第8の実施の形態は、図21に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112、頻度記憶・データ消去制御モジュール2101、文字群画像データと頻度記憶モジュール2102を有している。第1の実施の形態に、頻度記憶・データ消去制御モジュール2101、文字群画像データと頻度記憶モジュール2102を付加したものである。なお、第1から第7の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1から第7の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
<Eighth Embodiment>
As shown in FIG. 21, the eighth embodiment includes a
類似文字画像データ抽出モジュール104は、文字切出モジュール102、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データと頻度記憶モジュール2102と接続されており、抽出した類似文字を文字群画像データと頻度記憶モジュール2102にも渡す。文字群画像データと頻度記憶モジュール2102に渡す類似文字は、文字群画像データと頻度記憶モジュール2102に記憶されていた文字であるようにしてもよい。
文字群画像データと頻度記憶モジュール2102は、類似文字画像データ抽出モジュール104、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112、頻度記憶・データ消去制御モジュール2101と接続されており、文字画像データ構成モジュール108によって生成された代表文字とその代表文字が類似文字画像データ抽出モジュール104によって抽出された回数を記憶する。つまり、代表文字とその代表文字が類似文字として抽出された回数(新たな代表文字を生成するために用いられた回数)を対応させて記憶する。そして、文字群画像データ縮小モジュール112等からアクセスされ、その代表文字(文字群画像データ)を文字切出モジュール102等へ渡す。
頻度記憶・データ消去制御モジュール2101は、文字群画像データと頻度記憶モジュール2102と接続されており、文字群画像データと頻度記憶モジュール2102に記憶されている代表文字を消去する。そのときに、代表文字の回数に応じて、代表文字を消去する。例えば、所定の閾値よりも少ない回数の代表文字を消去する。つまり、使用される頻度の少ない代表文字を消去する。
The similar character image
The character group image data and
The frequency storage / data
図22は、第8の実施の形態による処理例を示すフローチャートである。
ステップS2202からステップS2212までは、第1の実施の形態の図3に示したフローチャートのステップS302からステップS312までと同等である。
ステップS2214では、文字群画像データと頻度記憶モジュール2102が、代表文字とその代表文字の使用頻度を記憶する。
ステップS2216は、第1の実施の形態の図3に示したフローチャートのステップS316と同等である。
FIG. 22 is a flowchart illustrating an example of processing according to the eighth embodiment.
Steps S2202 to S2212 are equivalent to steps S302 to S312 in the flowchart shown in FIG. 3 of the first embodiment.
In step S2214, the character group image data and
Step S2216 is equivalent to step S316 in the flowchart shown in FIG. 3 of the first embodiment.
図23は、第8の実施の形態による代表文字の消去処理例を示すフローチャートである。
ステップS2302では、頻度記憶・データ消去制御モジュール2101が、文字群画像データと頻度記憶モジュール2102に記憶されている使用頻度は所定の閾値よりも少ないか否かを判断する。かかる判断において、少ないと判断した場合はステップS2304へ進み、それ以外の場合は終了する(ステップS2306)。
ステップS2304では、頻度記憶・データ消去制御モジュール2101が、文字群画像データと頻度記憶モジュール2102に記憶されている対象となっている代表文字を消去する。
FIG. 23 is a flowchart illustrating an example of a representative character erasing process according to the eighth embodiment.
In step S2302, the frequency storage / data
In step S <b> 2304, the frequency storage / data
図24を参照して、前述の実施の形態のハードウェア構成例について説明する。図24に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部2417と、プリンタなどのデータ出力部2418を備えたハードウェア構成例を示している。
With reference to FIG. 24, a hardware configuration example of the above-described embodiment will be described. The configuration illustrated in FIG. 24 is configured by, for example, a personal computer (PC), and illustrates a hardware configuration example including a
CPU(Central Processing Unit)2401は、前述の実施の形態において説明した各種のモジュール、すなわち、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112、文字群画像データ使用指示モジュール701等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
The CPU (Central Processing Unit) 2401 includes various modules described in the above-described embodiments, that is, the
ROM(Read Only Memory)2402は、CPU2401が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)2403は、CPU2401の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス2404により相互に接続されている。
A ROM (Read Only Memory) 2402 stores programs used by the
ホストバス2404は、ブリッジ2405を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス2406に接続されている。
The
キーボード2408、マウス等のポインティングデバイス2409は、操作者により操作される入力デバイスである。ディスプレイ2410は、液晶表示装置又はCRT(Cathode Ray Tube)などからなり、各種情報をテキストやイメージ情報として表示する。
A
HDD(Hard Disk Drive)2411は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU2401によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、入力画像データや文字群画像データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
An HDD (Hard Disk Drive) 2411 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the
ドライブ2412は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体2413に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース2407、外部バス2406、ブリッジ2405、及びホストバス2404を介して接続されているRAM2403に供給する。リムーバブル記録媒体2413も、ハードディスクと同様のデータ記録領域として利用可能である。
The
接続ポート2414は、外部接続機器2415を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート2414は、インタフェース2407、及び外部バス2406、ブリッジ2405、ホストバス2404等を介してCPU2401等に接続されている。通信部2416は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部2417は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部2418は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
The
なお、図24に示すハードウェア構成は、1つの構成例を示すものであり、前述の実施の形態は、図24に示す構成に限らず、前述の実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図24に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。 The hardware configuration shown in FIG. 24 shows one configuration example, and the above-described embodiment is not limited to the configuration shown in FIG. 24, and the modules described in the above-described embodiment can be executed. Any configuration may be used. For example, some modules may be configured with dedicated hardware (for example, Application Specific Integrated Circuit (ASIC), etc.), and some modules are in an external system and connected via a communication line In addition, a plurality of systems shown in FIG. 24 may be connected to each other via communication lines so as to cooperate with each other. Further, it may be incorporated in a copying machine, a fax machine, a scanner, a printer, a multifunction machine (an image processing apparatus having any two or more functions of a scanner, a printer, a copying machine, a fax machine, etc.).
前述の第1から第8の実施の形態を組み合わせたものであってもよい。例えば、第2の実施の形態に、第3の実施の形態の代表文字解像度指示モジュール901を組み合わせてもよい。
The first to eighth embodiments described above may be combined. For example, the representative character
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standards such as “DVD + R, DVD + RW, etc.”, compact discs (CDs), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), etc. MO), flexible disk (FD), magnetic tape, hard disk, read only memory (ROM), electrically erasable and rewritable read only memory (EEPROM), flash memory, random access memory (RAM), etc. It is.
The program or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.
102…文字切出モジュール
104…類似文字画像データ抽出モジュール
106…文字画像データ重心算出モジュール
108…文字画像データ構成モジュール
110…文字群画像データ記憶モジュール
112…文字群画像データ縮小モジュール
701…文字群画像データ使用指示モジュール
901…代表文字解像度指示モジュール
1201…代表文字画像データ回転モジュール
1501…代表文字画像データ記憶指示モジュール
1701…データ出力・記憶・消去制御モジュール
2101…頻度記憶・データ消去制御モジュール
2102…文字群画像データと頻度記憶モジュール
DESCRIPTION OF
Claims (9)
前記画素塊切出手段によって切り出された画素塊のうち類似するものを抽出する類似画素塊抽出手段と、
前記類似画素塊抽出手段によって抽出された類似する複数の画素塊の重心を算出する重心算出手段と、
前記類似画素塊抽出手段によって抽出された類似する複数の画素塊と前記重心算出手段によって算出された重心に基づいて、該画素塊の代表画素塊を生成する代表画素塊生成手段と、
前記代表画素塊生成手段によって生成された代表画素塊を記憶する代表画素塊記憶手段
を具備し、
前記類似画素塊抽出手段は、前記代表画素塊記憶手段によって記憶された代表画素塊を前記画素塊切出手段によって切り出された画素塊に含めて、類似する画素塊を抽出する
ことを特徴とする画像処理装置。 Pixel block cutting means for cutting out a pixel block from an image;
Similar pixel block extraction means for extracting similar ones of the pixel blocks cut out by the pixel block cutting means;
Centroid calculating means for calculating centroids of a plurality of similar pixel chunks extracted by the similar pixel chunk extracting means;
Representative pixel block generation means for generating a representative pixel block of the pixel block based on a plurality of similar pixel blocks extracted by the similar pixel block extraction unit and the centroid calculated by the centroid calculation unit;
Comprising representative pixel block storage means for storing the representative pixel block generated by the representative pixel block generation means;
The similar pixel block extraction unit includes the representative pixel block stored by the representative pixel block storage unit in the pixel block extracted by the pixel block extraction unit, and extracts similar pixel blocks. Image processing device.
前記類似画素塊抽出手段によって計数された数に基づいて、前記類似画素塊抽出手段に前記代表画素塊記憶手段によって記憶された代表画素塊を使用させることを指示する使用指示手段
をさらに具備することを特徴とする請求項1に記載の画像処理装置。 The similar pixel block extraction unit counts the number of similar pixel blocks extracted by the pixel block extraction unit,
Use instruction means for instructing the similar pixel block extraction unit to use the representative pixel block stored in the representative pixel block storage unit based on the number counted by the similar pixel block extraction unit; The image processing apparatus according to claim 1.
をさらに具備し、
前記代表画素塊生成手段は、前記解像度指示手段によって指示された解像度に応じて、前記代表画素塊を生成する
ことを特徴とする請求項1又は2に記載の画像処理装置。 Resolution instruction means for instructing the resolution of the representative pixel block generated by the representative pixel block generation unit;
The image processing apparatus according to claim 1, wherein the representative pixel block generation unit generates the representative pixel block according to the resolution instructed by the resolution instruction unit.
をさらに具備し、
前記代表画素塊記憶手段は、前記回転手段によって回転された代表画素塊を記憶する
ことを特徴とする請求項1から3のいずれか1項に記載の画像処理装置。 A rotation unit for rotating the representative pixel block generated by the representative pixel block generation unit;
The image processing apparatus according to claim 1, wherein the representative pixel block storage unit stores the representative pixel block rotated by the rotation unit.
前記類似画素塊抽出手段によって計数された数に基づいて、前記代表画素塊記憶手段に前記代表画素塊を記憶させることを指示する記憶指示手段
をさらに具備することを特徴とする請求項1から4のいずれか1項に記載の画像処理装置。 The similar pixel block extraction unit counts the number of similar pixel blocks extracted by the pixel block extraction unit,
5. A storage instructing unit for instructing the representative pixel block storage unit to store the representative pixel block based on the number counted by the similar pixel block extracting unit. The image processing apparatus according to any one of the above.
前記指示が登録である場合は、前記重心算出手段、前記代表画素塊生成手段及び前記代表画素塊記憶手段による処理を行わせ、
前記指示が出力である場合は、前記重心算出手段及び前記代表画素塊生成手段による処理を行わせ、
前記指示が消去である場合は、前記代表画素塊記憶手段に記憶された代表画素塊を消去するように制御する制御手段
をさらに具備することを特徴とする請求項1から5のいずれか1項に記載の画像処理装置。 Accepts instructions for registration, output or deletion by the operator,
If the instruction is registration, the center of gravity calculation unit, the representative pixel block generation unit, and the representative pixel block storage unit perform processing,
If the instruction is an output, let the center of gravity calculation means and the representative pixel block generation means perform processing,
6. The apparatus according to claim 1, further comprising: a control unit that controls to erase the representative pixel block stored in the representative pixel block storage unit when the instruction is erasure. An image processing apparatus according to 1.
ことを特徴とする請求項1から6のいずれか1項に記載の画像処理装置。 When the representative pixel block storage unit stores the representative pixel block generated by the representative pixel block generation unit, the representative pixel block storage unit erases the representative pixel block used when the representative pixel block generation unit generates the representative pixel block. The image processing apparatus according to claim 1, wherein the image processing apparatus is an image processing apparatus.
ことを特徴とする請求項1から7のいずれか1項に記載の画像処理装置。 The image processing apparatus according to any one of claims 1 to 7, wherein the representative pixel block storage unit stores the number of times the stored representative pixel block is extracted by the similar pixel block extraction unit. .
画像から画素塊を切り出す画素塊切出手段と、
前記画素塊切出手段によって切り出された画素塊のうち類似するものを抽出する類似画素塊抽出手段と、
前記類似画素塊抽出手段によって抽出された類似する複数の画素塊の重心を算出する重心算出手段と、
前記類似画素塊抽出手段によって抽出された類似する複数の画素塊と前記重心算出手段によって算出された重心に基づいて、該画素塊の代表画素塊を生成する代表画素塊生成手段と、
前記代表画素塊生成手段によって生成された代表画素塊を記憶する代表画素塊記憶手段
として機能させ、
前記類似画素塊抽出手段は、前記代表画素塊記憶手段によって記憶された代表画素塊を前記画素塊切出手段によって切り出された画素塊に含めて、類似する画素塊を抽出する
ことを特徴とする画像処理プログラム。 Computer
Pixel block cutting means for cutting out a pixel block from an image;
Similar pixel block extraction means for extracting similar ones of the pixel blocks cut out by the pixel block cutting means;
Centroid calculating means for calculating centroids of a plurality of similar pixel chunks extracted by the similar pixel chunk extracting means;
Representative pixel block generation means for generating a representative pixel block of the pixel block based on a plurality of similar pixel blocks extracted by the similar pixel block extraction unit and the centroid calculated by the centroid calculation unit;
Function as a representative pixel block storage unit that stores the representative pixel block generated by the representative pixel block generation unit;
The similar pixel block extraction unit includes the representative pixel block stored by the representative pixel block storage unit in the pixel block extracted by the pixel block extraction unit, and extracts similar pixel blocks. Image processing program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008071138A JP4935732B2 (en) | 2008-03-19 | 2008-03-19 | Image processing apparatus and image processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008071138A JP4935732B2 (en) | 2008-03-19 | 2008-03-19 | Image processing apparatus and image processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009231871A JP2009231871A (en) | 2009-10-08 |
JP4935732B2 true JP4935732B2 (en) | 2012-05-23 |
Family
ID=41246850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008071138A Expired - Fee Related JP4935732B2 (en) | 2008-03-19 | 2008-03-19 | Image processing apparatus and image processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4935732B2 (en) |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0528302A (en) * | 1991-07-19 | 1993-02-05 | Nec Corp | Character reader |
JPH06309437A (en) * | 1993-02-26 | 1994-11-04 | Fujitsu Ltd | Pattern inspecting device |
JPH07121663A (en) * | 1993-10-22 | 1995-05-12 | Canon Inc | Character recognizing method/device |
JPH0877351A (en) * | 1994-09-02 | 1996-03-22 | Hitachi Ltd | Method and device for processing image |
JP2005341382A (en) * | 2004-05-28 | 2005-12-08 | Sony Corp | Image processing apparatus, imaging apparatus, computer program and image processing method |
JP2006011967A (en) * | 2004-06-28 | 2006-01-12 | Fuji Xerox Co Ltd | Character recognition device and character recognition program |
JP2006033232A (en) * | 2004-07-14 | 2006-02-02 | Seiko Epson Corp | Image processing apparatus |
JP2006202170A (en) * | 2005-01-24 | 2006-08-03 | Seiko Epson Corp | Generation of high-resolution image using a plurality of low resolution images |
JP2006221220A (en) * | 2005-02-08 | 2006-08-24 | Seiko Epson Corp | Generation of high resolution image using two or more low resolution image |
JP2006229280A (en) * | 2005-02-15 | 2006-08-31 | Ricoh Co Ltd | Image processing apparatus and method, and program and recording medium |
JP2007087218A (en) * | 2005-09-22 | 2007-04-05 | Toshiba Corp | Image processor |
JP2007334437A (en) * | 2006-06-12 | 2007-12-27 | Canon Inc | Image processor and image processing method, program and storage medium |
JP4862509B2 (en) * | 2006-06-14 | 2012-01-25 | 富士ゼロックス株式会社 | Image processing system and image processing program |
-
2008
- 2008-03-19 JP JP2008071138A patent/JP4935732B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009231871A (en) | 2009-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4553055B2 (en) | Image processing apparatus and image processing program | |
JP4766030B2 (en) | Image processing apparatus and image processing program | |
JP5017031B2 (en) | Image processing apparatus, image processing method, image processing program, and storage medium | |
JP4935732B2 (en) | Image processing apparatus and image processing program | |
JP2007086956A (en) | Image processor, image processing method and computer program | |
JP4930288B2 (en) | Image processing apparatus and image processing program | |
JP4862509B2 (en) | Image processing system and image processing program | |
JP4146047B2 (en) | Image tilt detection method and document image processing apparatus | |
JP5489894B2 (en) | Image processing apparatus and image processing program | |
JP2012175220A (en) | Image processing apparatus and image processing program | |
JP2007295210A (en) | Image processing apparatus, image processing method, image processing program, and recording medium recording the program | |
JP4872780B2 (en) | Image processing system and image processing program | |
JPH08237404A (en) | Selection of optical character recognition mode | |
JP3814547B2 (en) | Image processing apparatus and method | |
JP5067182B2 (en) | Image processing apparatus and image processing program | |
JP5526596B2 (en) | Image processing apparatus and image processing program | |
JP2009187168A (en) | Information processor and information processing program | |
JP6676955B2 (en) | Image processing apparatus and image processing program | |
JP2004030430A (en) | Image processing method and image processing apparatus | |
JP4973536B2 (en) | Image processing apparatus and image processing program | |
JP5991076B2 (en) | Image processing apparatus and image processing program | |
JP6281309B2 (en) | Image processing apparatus and image processing program | |
JP5223985B2 (en) | Encoding system and encoding program | |
JP4900271B2 (en) | Information processing apparatus and information processing program | |
JPH1032714A (en) | Image processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150302 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4935732 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |