JP4935732B2 - Image processing apparatus and image processing program - Google Patents

Image processing apparatus and image processing program Download PDF

Info

Publication number
JP4935732B2
JP4935732B2 JP2008071138A JP2008071138A JP4935732B2 JP 4935732 B2 JP4935732 B2 JP 4935732B2 JP 2008071138 A JP2008071138 A JP 2008071138A JP 2008071138 A JP2008071138 A JP 2008071138A JP 4935732 B2 JP4935732 B2 JP 4935732B2
Authority
JP
Japan
Prior art keywords
pixel block
character
representative
image data
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008071138A
Other languages
Japanese (ja)
Other versions
JP2009231871A (en
Inventor
裕 越
一憲 宋
俊一 木村
雅則 関野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2008071138A priority Critical patent/JP4935732B2/en
Publication of JP2009231871A publication Critical patent/JP2009231871A/en
Application granted granted Critical
Publication of JP4935732B2 publication Critical patent/JP4935732B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、画像処理装置及び画像処理プログラムに関する。   The present invention relates to an image processing apparatus and an image processing program.

画像(特に文字が含まれている画像)を拡大する場合、多値データ形式ではボケと曲線のでこぼこが、2値データ形式では幅/間隔の不均一と曲線のでこぼこが発生する場合がある。また、最近傍補間法ではジャギーが、線形補間法ではボケが顕著であり、標本化関数の畳み込み補間法でも曲線のでこぼこが発生する場合がある。これらの手法は、いずれも、画像の解像度(例えば、スキャン・イン(例えば、スキャナを用いた画像読取り)時の解像度)に基づく情報だけを使用している。   When enlarging an image (particularly an image including characters), blur and curved irregularities may occur in the multi-value data format, and uneven width / interval and curved irregularities may occur in the binary data format. Further, jaggy is prominent in the nearest neighbor interpolation method, and blurring is remarkable in the linear interpolation method, and unevenness of a curve may occur even in the convolution interpolation method of the sampling function. Each of these methods uses only information based on the resolution of the image (for example, the resolution at the time of scan-in (for example, image reading using a scanner)).

これに関連する技術として、例えば、特許文献1には、文字画像と疑似中間調処理された写真画像が混在した画像の再現性の向上を図ることを目的とし、写真領域処理部では画素の解像度を記録系の書き込み密度に一致するように入力画像の1画素を縦、横方向共に2分割して合計4画素に置換し、文字領域処理部では入力画像の注目画素とその周辺5×5画素を参照して予め設定されたパターンとマッチングし、斜線の文字ストロークが最適になるように、かつ画素の解像度を記録系の書き込み密度に一致するように変換し、領域判定部は5×5画素の領域において4連結している画素の個数を計数し、この計数値が所定値以上の場合に中央の注目画素を文字領域の画素と判別して文字領域処理部の出力を選択し、所定値未満の場合に注目画素を写真領域の画素と判別して写真領域処理部の出力を選択することが開示されている。   As a technology related to this, for example, Patent Document 1 aims to improve the reproducibility of an image in which a character image and a photographic image subjected to pseudo halftone processing are mixed. 1 pixel of the input image is divided into two in both the vertical and horizontal directions so as to match the writing density of the recording system and is replaced with a total of 4 pixels, and the character region processing unit and the pixel of interest of the input image and its surrounding 5 × 5 pixels Are matched with a pattern set in advance, and the pixel stroke is converted so as to match the writing density of the recording system so that the hatched character stroke is optimal, and the area determination unit is 5 × 5 pixels The number of four connected pixels in the area is counted, and when the counted value is equal to or larger than a predetermined value, the pixel of interest in the center is determined as a character area pixel, and the output of the character area processing unit is selected. Featured image if less than It is disclosed that an element is determined as a pixel of a photographic region and an output of a photographic region processing unit is selected.

また、例えば、特許文献2には、解像度の低い階調データから拡大した二値画像を作る際に、中間調の画像の他、文字画像などのエッジ部をも、良好に再現した二値画像を得ることができる画像処理方法を提供することを目的とし、原画像の処理画素に隣接する画素の輝度の値から、差分演算において、それぞれ縦方向、横方向の輝度の差を演算し、演算された輝度の差から、輝度勾配を検出し、この輝度勾配がある閾値より小さい場合には、中間調の画像と判断し、二値化中間調処理により、処理画素の輝度に応じたn×m個の二値化画素を生成し、また、輝度勾配がある閾値よりも大きい場合には、輝度勾配の方向を検出し、この方向にしたがって、処理画素の輝度に応じた個数の1又は0の画素を配列し、n×m個の二値化画素を生成する。生成された二値化画素により、二値画像が形成されることが開示されている。   In addition, for example, in Patent Document 2, when creating a binary image enlarged from low-resolution gradation data, a binary image in which edge portions such as character images are well reproduced in addition to a halftone image. In the difference calculation, the difference in luminance in the vertical and horizontal directions is calculated from the luminance value of the pixel adjacent to the processing pixel of the original image, and the calculation is performed. A luminance gradient is detected from the difference in luminance, and if this luminance gradient is smaller than a certain threshold value, it is determined as a halftone image, and n × according to the luminance of the processing pixel is obtained by binarization halftone processing. When m binarized pixels are generated and the luminance gradient is larger than a certain threshold value, the direction of the luminance gradient is detected, and according to this direction, the number 1 or 0 corresponding to the luminance of the processing pixel is detected. Are arranged, and n × m binarized pixels are generated. The It is disclosed that a binary image is formed by the generated binarized pixels.

また、例えば、特許文献3には、簡易な付加的回路要素により処理能力の低下を防止しつつ、低解像度の画像情報を高解像度に変換し、文字等の輪郭の傾斜部のぎざぎざを平滑処理して印刷の高品質化を図ることを目的とし、ページメモリで編集した画像情報をビデオ信号生成回路で1画素につき縦、横2倍の画素密度に増倍し、これをラインメモリにより複数ラインにわたり先送り方式で一時的に記憶し、画像置換回路は、先送りされた順に複数ラインの画素データを所定数だけマトリクス化していくことで、そのマトリクスの中心セルにきた画素データを順次印刷し、この印刷に際して該中心セルの画素データが画像輪郭の傾斜部のぎざぎざ要因になる段差部の黒画素あるいは白画素に相当するものかを判別し、ぎざぎざ要因との判定結果に基づき画素置換(白黒反転)を行うことが開示されている。
特開平06−225122号公報 特開平06−311351号公報 特開平08−310057号公報
In addition, for example, in Patent Document 3, low-resolution image information is converted to high resolution while smoothing out jagged edges of outlines of characters and the like while preventing a reduction in processing capability by a simple additional circuit element. In order to improve the quality of printing, the image information edited in the page memory is multiplied by the video signal generation circuit to double the pixel density in the vertical and horizontal directions for each pixel, and this is multiplied by the line memory. The image replacement circuit sequentially prints the pixel data coming to the center cell of the matrix by forming a predetermined number of pixel data in a matrix in the order of advance, by temporarily storing the data in advance. It is determined whether the pixel data of the central cell corresponds to the black pixel or the white pixel of the stepped portion that causes the jaggedness of the inclined portion of the image outline during printing, and the result of the determination of the jagged factor is determined. It is disclosed that performs pixel substitution (black and white inverted) on the basis of.
Japanese Patent Laid-Open No. 06-225122 Japanese Patent Application Laid-Open No. 06-313151 Japanese Patent Laid-Open No. 08-310057

ところで、対象画像内の存在する類似の画素塊を用いて、解像度を高めた画素塊を生成する処理を用いた場合、類似する画素塊が少ない場合は、解像度を高めた画素塊を生成することができない。
本発明は、対象画像内に類似の画素塊が少ないような場合であっても、その解像度を高められるようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
By the way, if a process for generating a pixel block with an increased resolution using a similar pixel block existing in the target image is used, if there are few similar pixel blocks, a pixel block with an increased resolution is generated. I can't.
An object of the present invention is to provide an image processing apparatus and an image processing program capable of increasing the resolution even when there are few similar pixel clusters in a target image.

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像から画素塊を切り出す画素塊切出手段と、前記画素塊切出手段によって切り出された画素塊のうち類似するものを抽出する類似画素塊抽出手段と、前記類似画素塊抽出手段によって抽出された類似する複数の画素塊の重心を算出する重心算出手段と、前記類似画素塊抽出手段によって抽出された類似する複数の画素塊と前記重心算出手段によって算出された重心に基づいて、該画素塊の代表画素塊を生成する代表画素塊生成手段と、前記代表画素塊生成手段によって生成された代表画素塊を記憶する代表画素塊記憶手段を具備し、前記類似画素塊抽出手段は、前記代表画素塊記憶手段によって記憶された代表画素塊を前記画素塊切出手段によって切り出された画素塊に含めて、類似する画素塊を抽出することを特徴とする画像処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention according to claim 1 is a pixel block extraction unit that extracts a pixel block from an image, a similar pixel block extraction unit that extracts a similar pixel block extracted by the pixel block extraction unit, and the similar pixel A centroid calculating unit that calculates the centroid of a plurality of similar pixel blocks extracted by the block extracting unit, a plurality of similar pixel blocks extracted by the similar pixel block extracting unit, and a centroid calculated by the centroid calculating unit. A representative pixel block generation unit that generates a representative pixel block of the pixel block, and a representative pixel block storage unit that stores the representative pixel block generated by the representative pixel block generation unit; The means includes the representative pixel block stored by the representative pixel block storage unit in the pixel block cut out by the pixel block cutting unit, and extracts similar pixel blocks. That is an image processing apparatus.

請求項2の発明は、前記類似画素塊抽出手段は、前記画素塊切出手段によって切り出された画素塊のうち類似するものの数を計数し、前記類似画素塊抽出手段によって計数された数に基づいて、前記類似画素塊抽出手段に前記代表画素塊記憶手段によって記憶された代表画素塊を使用させることを指示する使用指示手段をさらに具備することを特徴とする請求項1に記載の画像処理装置である。   According to a second aspect of the present invention, the similar pixel block extraction unit counts the number of similar pixel blocks extracted by the pixel block extraction unit, and is based on the number counted by the similar pixel block extraction unit. The image processing apparatus according to claim 1, further comprising a use instruction unit that instructs the similar pixel block extraction unit to use the representative pixel block stored by the representative pixel block storage unit. It is.

請求項3の発明は、前記代表画素塊生成手段によって生成される代表画素塊の解像度を指示する解像度指示手段をさらに具備し、前記代表画素塊生成手段は、前記解像度指示手段によって指示された解像度に応じて、前記代表画素塊を生成することを特徴とする請求項1又は2に記載の画像処理装置である。   The invention according to claim 3 further includes resolution instruction means for instructing the resolution of the representative pixel block generated by the representative pixel block generation means, and the representative pixel block generation means is the resolution specified by the resolution instruction means. The image processing apparatus according to claim 1, wherein the representative pixel block is generated according to the method.

請求項4の発明は、前記代表画素塊生成手段によって生成された代表画素塊を回転させる回転手段をさらに具備し、前記代表画素塊記憶手段は、前記回転手段によって回転された代表画素塊を記憶することを特徴とする請求項1から3のいずれか1項に記載の画像処理装置である。   The invention according to claim 4 further comprises a rotating means for rotating the representative pixel block generated by the representative pixel block generating unit, and the representative pixel block storage unit stores the representative pixel block rotated by the rotating unit. The image processing apparatus according to claim 1, wherein the image processing apparatus is an image processing apparatus.

請求項5の発明は、前記類似画素塊抽出手段は、前記画素塊切出手段によって切り出された画素塊のうち類似するものの数を計数し、前記類似画素塊抽出手段によって計数された数に基づいて、前記代表画素塊記憶手段に前記代表画素塊を記憶させることを指示する記憶指示手段をさらに具備することを特徴とする請求項1から4のいずれか1項に記載の画像処理装置である。   According to a fifth aspect of the present invention, the similar pixel block extraction unit counts the number of similar pixel blocks extracted by the pixel block extraction unit, and is based on the number counted by the similar pixel block extraction unit. The image processing apparatus according to claim 1, further comprising a storage instruction unit that instructs the representative pixel block storage unit to store the representative pixel block. .

請求項6の発明は、操作者による登録、出力又は消去の指示を受け付け、前記指示が登録である場合は、前記重心算出手段、前記代表画素塊生成手段及び前記代表画素塊記憶手段による処理を行わせ、前記指示が出力である場合は、前記重心算出手段及び前記代表画素塊生成手段による処理を行わせ、前記指示が消去である場合は、前記代表画素塊記憶手段に記憶された代表画素塊を消去するように制御する制御手段をさらに具備することを特徴とする請求項1から5のいずれか1項に記載の画像処理装置である。   The invention of claim 6 accepts an instruction of registration, output or erasure by an operator, and when the instruction is registration, processing by the centroid calculation means, the representative pixel block generation means and the representative pixel block storage means is performed. If the instruction is an output, the center-of-gravity calculating unit and the representative pixel block generation unit perform processing. If the instruction is erasure, the representative pixel stored in the representative pixel block storage unit The image processing apparatus according to claim 1, further comprising a control unit that controls to delete the lump.

請求項7の発明は、前記代表画素塊記憶手段は、前記代表画素塊生成手段によって生成された代表画素塊を記憶する場合に、前記代表画素塊生成手段が代表画素塊を生成するときに用いた代表画素塊を消去することを特徴とする請求項1から6のいずれか1項に記載の画像処理装置である。   The invention according to claim 7 is used when the representative pixel block generation unit generates the representative pixel block when the representative pixel block storage unit stores the representative pixel block generated by the representative pixel block generation unit. 7. The image processing apparatus according to claim 1, wherein the representative pixel block is erased.

請求項8の発明は、前記代表画素塊記憶手段は、記憶する代表画素塊が、前記類似画素塊抽出手段によって抽出された回数を記憶することを特徴とする請求項1から7のいずれか1項に記載の画像処理装置である。   The invention according to claim 8 is characterized in that the representative pixel block storage means stores the number of times the stored representative pixel block is extracted by the similar pixel block extraction means. The image processing device according to item.

請求項9の発明は、コンピュータを、画像から画素塊を切り出す画素塊切出手段と、前記画素塊切出手段によって切り出された画素塊のうち類似するものを抽出する類似画素塊抽出手段と、前記類似画素塊抽出手段によって抽出された類似する複数の画素塊の重心を算出する重心算出手段と、前記類似画素塊抽出手段によって抽出された類似する複数の画素塊と前記重心算出手段によって算出された重心に基づいて、該画素塊の代表画素塊を生成する代表画素塊生成手段と、前記代表画素塊生成手段によって生成された代表画素塊を記憶する代表画素塊記憶手段として機能させ、前記類似画素塊抽出手段は、前記代表画素塊記憶手段によって記憶された代表画素塊を前記画素塊切出手段によって切り出された画素塊に含めて、類似する画素塊を抽出することを特徴とする画像処理プログラムである。   The invention of claim 9 is a computer that extracts a pixel block extracting unit that extracts a pixel block from an image, a similar pixel block extracting unit that extracts a similar pixel block extracted by the pixel block cutting unit, and Calculated by the centroid calculating means for calculating the centroid of a plurality of similar pixel blocks extracted by the similar pixel block extracting means, the similar plurality of pixel blocks extracted by the similar pixel block extracting means and the centroid calculating means. The representative pixel block generating unit that generates a representative pixel block of the pixel block based on the center of gravity, and the representative pixel block storage unit that stores the representative pixel block generated by the representative pixel block generation unit, The pixel block extracting unit includes the representative pixel block stored by the representative pixel block storage unit in the pixel block cut out by the pixel block cutting unit, and a similar pixel block Extracting an image processing program, characterized by.

請求項1の画像処理装置によれば、対象画像内に類似の画素塊が少ないような場合であっても、その解像度を高めることができる。   According to the image processing apparatus of the first aspect, even if there are few similar pixel clusters in the target image, the resolution can be increased.

請求項2の画像処理装置によれば、対象画像内に類似する画素塊が少なくはない場合は、その対象画像内の画素塊だけを用いて高解像度の画素塊を生成することができる。   According to the image processing apparatus of the second aspect, when there are not a few pixel clusters similar in the target image, it is possible to generate a high-resolution pixel cluster using only the pixel blocks in the target image.

請求項3の画像処理装置によれば、複数の解像度の代表画素塊を生成して対象画像の解像度に合わせることができる。   According to the image processing apparatus of the third aspect, representative pixel blocks having a plurality of resolutions can be generated and matched with the resolution of the target image.

請求項4の画像処理装置によれば、回転した代表画素塊を生成して回転した対象画像にも対応できる。   According to the image processing apparatus of the fourth aspect, it is possible to deal with a rotated target image by generating a representative pixel block that has been rotated.

請求項5の画像処理装置によれば、記憶すべき代表画素塊を数を軽減させ、記憶容量の低減を図ることができる。   According to the image processing apparatus of the fifth aspect, the number of representative pixel blocks to be stored can be reduced, and the storage capacity can be reduced.

請求項6の画像処理装置によれば、操作者の指示に応じて、種々の処理を行わせることができる。   According to the image processing apparatus of the sixth aspect, various processes can be performed in accordance with an instruction from the operator.

請求項7の画像処理装置によれば、無駄な代表画素塊を記憶する必要がなくなり、記憶容量の低減を図ることができる。   According to the image processing apparatus of the seventh aspect, it is not necessary to store useless representative pixel blocks, and the storage capacity can be reduced.

請求項8の画像処理装置によれば、類似する画素塊の頻度に応じた処理を行うことができる。   According to the image processing apparatus of the eighth aspect, it is possible to perform processing according to the frequency of similar pixel blocks.

請求項9の画像処理プログラムによれば、対象画像内に類似の画素塊が少ないような場合であっても、その解像度を高めることができる。   According to the image processing program of the ninth aspect, even if there are few similar pixel clusters in the target image, the resolution can be increased.

まず、本実施の形態(第1から第8の実施の形態)の概要を説明する。
なお、本実施の形態が対象とする画素塊とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域は近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての1行から1文字ずつ切り出すように縦又は横方向に射影し、空白地点で切り出した画像領域、又は一定間隔で切り出した画像領域等がある。
なお、1つの画素塊として、1文字の画像となる場合が多い。ただし、実際に人間が文字として認識できる画素領域である必要はない。文字の一部分、文字に余分な画素領域を付加したもの、文字を形成しない画素領域等もあり、何らかの画素の塊であればよい。例えば、円や線のような図形であってもよい。以下、「文字」又は「文字画像」という場合は、特に断りがない限り「画素塊」の意で用いる。
First, an outline of the present embodiment (first to eighth embodiments) will be described.
Note that the pixel block targeted by this embodiment includes at least a pixel region that is continuous in four or eight connections, and also includes a set of these pixel regions. The set of these pixel areas means that there are a plurality of continuous pixel areas such as 4-connected, and the plurality of pixel areas are in the vicinity. Here, what is in the vicinity is, for example, an image area in which the pixel areas are close to each other in distance, an image area that is projected vertically or horizontally so as to cut out one character at a time from a line as a sentence, and cut out at a blank spot Or an image region cut out at regular intervals.
In many cases, an image of one character is formed as one pixel block. However, it is not necessary that the pixel area is actually recognizable as a character by humans. There are a part of a character, a character with an extra pixel area added to the character, a pixel area that does not form a character, and the like, and any block of pixels may be used. For example, it may be a figure such as a circle or a line. Hereinafter, the term “character” or “character image” means “pixel block” unless otherwise specified.

本実施の形態は、複数の文字がある画像を対象としている。これらの文字を用いて、高解像度の文字画像(代表文字画像データ)を生成するものである。高解像度の文字画像を生成する技術として、Super resolution技術がある。
通常の文書画像では、同じ文字画像が複数回出現する場合が多い。さらに、これら複数の類似文字画像(同一文字画像を含む)をスキャン・インした場合に文字画像(の重心)に対してスキャン・イン(標本化)の位相は各々ずれていることが多い。これら標本化の位相が各々ずれた複数の文字画像を用いることにより、スキャン・イン解像度よりも高い解像度の文字画像を構成することができる(なお、「高解像度の文字画像を構成すること」を「代表画像を生成する」ともいう)。このとき、必ずしも画像サイズを拡大する必要はなく、もとと同じ画像サイズであっても、そのデータが表す実効的な解像度だけを上げることもできる。又は、ランダム・ノイズを除去することができる。
This embodiment is intended for an image having a plurality of characters. Using these characters, a high-resolution character image (representative character image data) is generated. As a technique for generating a high-resolution character image, there is a Super resolution technique.
In normal document images, the same character image often appears multiple times. Furthermore, when a plurality of similar character images (including the same character image) are scanned in, the scan-in (sampling) phase is often shifted from the character image (center of gravity). By using a plurality of character images whose sampling phases are shifted from each other, it is possible to construct a character image having a resolution higher than the scan-in resolution (in addition, “structuring a high-resolution character image”). Also referred to as “creating a representative image”). At this time, it is not always necessary to increase the image size, and even if the image size is the same as the original size, only the effective resolution represented by the data can be increased. Alternatively, random noise can be removed.

ところが、1つの文書画像に1回しか使用されていない文字画像に対しては効果がなく、使用回数が少ない文字画像に対しては効果が薄くなる。
そのため、予め多種多様な文字画像データを準備しておき、それらを含めて、同じ形状となる文字画像を探すことが有効である。例えば、文書作成ソフトウェアやプリンタのように、文字コード・データとそれに対応する文字画像データをフォント・データとして準備している場合には、それを利用できるが、そうでない場合は新たに準備する必要がある。また、例えば、常用漢字2000種×フォント4種(明朝、ゴシックなど)=8000種の文字形状を含めて同じ形状の文字を探す処理負荷が多大となる。
However, it is not effective for a character image that is used only once for one document image, and is less effective for a character image that is used less frequently.
Therefore, it is effective to prepare various character image data in advance and search for a character image having the same shape including them. For example, if character code data and corresponding character image data are prepared as font data, such as document creation software and printers, they can be used, but if not, they must be newly prepared There is. Further, for example, the processing load for searching for characters having the same shape including the character shapes of 2000 types of common Kanji characters × 4 types of fonts (Mincho, Gothic, etc.) = 8000 types becomes large.

一方で、1つの文書画像を処理するのではなく、複数の文書画像をまとめて処理することを行ってもよい。複数の文書画像を処理することで、同じ文字画像が複数回使われている確率が増加する。
ところが、文書画像の枚数が増えるにつれて、同じ形状となる文字画像の探索処理負荷が増えてしまう。
本実施の形態は、対象画像データから生成した代表文字画像データを文字群画像データ(いわゆる辞書)として登録し、その文字群画像データを用いて、他の対象画像データから代表文字画像データを生成するものである。他の対象画像データに、1回又は少ない回数しか出現しない文字画像であっても、文字群画像データを用いることによって、代表文字画像データを生成するものである。
On the other hand, instead of processing one document image, a plurality of document images may be processed together. By processing a plurality of document images, the probability that the same character image is used multiple times increases.
However, as the number of document images increases, the search processing load for character images having the same shape increases.
In this embodiment, representative character image data generated from target image data is registered as character group image data (so-called dictionary), and representative character image data is generated from other target image data using the character group image data. To do. Even if a character image appears only once or a small number of times in other target image data, representative character image data is generated by using character group image data.

以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
<第1の実施の形態>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。また、所定という用語は、予め定められたの意の他に、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じての意を含めて用いる。
Hereinafter, examples of various preferred embodiments for realizing the present invention will be described with reference to the drawings.
<First Embodiment>
FIG. 1 is a conceptual module configuration diagram of a configuration example according to the first embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment also serves as an explanation of a computer program, a system, and a method. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. It is the control to be stored in the device. In addition, the modules correspond almost one-to-one with the functions. However, in mounting, one module may be composed of one program, or a plurality of modules may be composed of one program. A plurality of programs may be used. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. In the following, “connection” includes not only physical connection but also logical connection (data exchange, instruction, reference relationship between data, etc.).
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is also included. “Apparatus” and “system” are used as synonymous terms. Further, the term “predetermined” is used in addition to a predetermined meaning, depending on the situation / state at that time or including the meaning according to the situation / state until then.

第1の実施の形態は、図1に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112を有している。   As shown in FIG. 1, the first embodiment includes a character cutout module 102, a similar character image data extraction module 104, a character image data barycenter calculation module 106, a character image data configuration module 108, and a character group image data storage module. 110 and a character group image data reduction module 112.

文字切出モジュール102は、類似文字画像データ抽出モジュール104、文字群画像データ縮小モジュール112と接続されており、文書画像を受け取り、その文書画像から文字を切り出す。切り出した文字(文字画像データ)を類似文字画像データ抽出モジュール104へ渡す。また、文字切出モジュール102は、文字群画像データ縮小モジュール112より縮小された代表文字を受け取り、文書画像から切り出した文字とともに、類似文字画像データ抽出モジュール104へ渡す。
文字切出モジュール102が行う文字切り出し処理として、例えば、特開平5−28301号公報、特開平5−120481号公報、特開平5−143776号公報、特開平5−174185号公報、特開平6−44406号公報、特開平6−187489号公報、特開平6−348911号公報、特開平7−13994号公報、特開平7−160810号公報、特開平8−161432号公報、特開平8−297718号公報、特開平10−69524号公報、特開平10−134145号公報、特開平10−261047号公報、特開2000−57261号公報、特開2001−43314号公報、特開2004−78531号公報等に記載の様々な手法を用いることができる。
The character extraction module 102 is connected to the similar character image data extraction module 104 and the character group image data reduction module 112, receives a document image, and extracts characters from the document image. The cut character (character image data) is transferred to the similar character image data extraction module 104. Further, the character cutout module 102 receives the representative character reduced from the character group image data reduction module 112 and passes it to the similar character image data extraction module 104 together with the character cut out from the document image.
Examples of character cut-out processing performed by the character cut-out module 102 include, for example, Japanese Patent Laid-Open No. 5-28301, Japanese Patent Laid-Open No. 5-120481, Japanese Patent Laid-Open No. 5-143776, Japanese Patent Laid-Open No. 5-174185, and Japanese Patent Laid-Open No. No. 44406, JP-A-6-187489, JP-A-6-348911, JP-A-7-13994, JP-A-7-160810, JP-A-8-161432, JP-A-8-297718. JP, 10-69524, JP 10-134145, JP 10-261047, JP 2000-57261, JP 2001-43314, JP 2004-78531, etc. Can be used.

類似文字画像データ抽出モジュール104は、文字切出モジュール102、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108と接続されている。文字切出モジュール102によって切り出された文字のうち類似するものを抽出する。そして、文字群画像データ記憶モジュール110によって記憶された代表文字を文字切出モジュール102によって切り出された文字に含めて、類似する文字を抽出する。なお、文字群画像データ記憶モジュール110によって記憶された代表文字は、文字群画像データ記憶モジュール110から直接受け取ってもよいし、文字群画像データ縮小モジュール112を介して受け取ってもよいし、さらに、文字切出モジュール102を介して受け取ってもよい。そして、抽出した互いに類似する文字(類似文字画像データ)を文字画像データ重心算出モジュール106、文字画像データ構成モジュール108へ渡す。   The similar character image data extraction module 104 is connected to the character cutout module 102, the character image data centroid calculation module 106, and the character image data configuration module 108. A similar character is extracted from the characters extracted by the character extraction module 102. Then, the representative characters stored by the character group image data storage module 110 are included in the characters extracted by the character extraction module 102, and similar characters are extracted. The representative characters stored by the character group image data storage module 110 may be received directly from the character group image data storage module 110, may be received via the character group image data reduction module 112, and You may receive via the character extraction module 102. FIG. The extracted similar characters (similar character image data) are passed to the character image data centroid calculation module 106 and the character image data composition module 108.

類似文字画像データ抽出モジュール104が行う類似しているかどうかを判定する方法は様々にある。以下、文字の類似度を判定する方法の例を述べる。
文字の類似度を検証する方式として以下を例に挙げる。
(A1)切り出された文字画像である2枚の2値画像を入力する。
(A2)2枚の2値画像の黒画素の重心をあわせる。
(A3)重心をあわせた2枚の二値画像のXOR(eXclusive OR:排他的論理和)演算を行う。
(A4)さらに、微小(上下左右斜めに数画素)移動させて、XOR演算の結果、1となった画素(相違する画素)の個数を数える。非移動を含む様々な移動後のXOR演算の結果、1となった画素(相違する画素)の個数の最小値が所定の閾値以下であれば、類似する文字画像であると判断する。閾値として、文字画像の画素数に比例する数値であってもよい。
(A5)切り出された文字画像に対して、他の文字画像との類似度を前述の手法で計算し、次々に類似している文字画像をまとめる(グルーピングする)。
There are various methods for determining whether or not the similar character image data extraction module 104 is similar. Hereinafter, an example of a method for determining the similarity of characters will be described.
The following is an example of a method for verifying the similarity of characters.
(A1) Two binary images that are clipped character images are input.
(A2) The centers of gravity of the black pixels of the two binary images are matched.
(A3) An XOR (exclusive OR) operation is performed on two binary images with the center of gravity.
(A4) Further, it is moved slightly (several pixels vertically and horizontally), and the number of pixels (different pixels) that become 1 as a result of the XOR operation is counted. As a result of various XOR operations after movement including non-movement, if the minimum value of the number of pixels that are 1 (different pixels) is equal to or less than a predetermined threshold, it is determined that the character images are similar. The threshold value may be a numerical value proportional to the number of pixels of the character image.
(A5) The cut-out character images are calculated for the similarity with other character images by the above-described method, and character images that are similar to each other are grouped together (grouped).

なお、文字画像が類似するか否かの判定として、前述した他に、例えば、切り出された文字画像を1つのベクトルデータとして扱い、クラスタリングを行い、その文字画像と類似する文字画像を抽出してもよい。この場合、その文字画像を表すベクトルデータと判定対象の文字画像を表すベクトルデータとの距離(例えば、ユークリッド距離等)が所定値以下(すなわち、2つのベクトルデータの距離が近いとき)の場合は、その文字画像と判定対象の文字画像とが類似していると判定する。
さらに、2つの文字画像パターンの論理演算の結果画像に基づいて膨張画像を生成し、その膨張画像と重なり合う割合に基づいて、類似しているか否かを判定するようにしてもよい。つまり、その2つが一致する場合の膨張させる度合い(膨張半径)によって、相違度を判定するようにしてもよい。
この他に、特開平07−200745号公報、I. H. Witten, A. Moffat, and T. C. Bell 著 「Managing Gigabytes」Morgan Kaufmmann Publishers pp.320-332.等に記載されている方法を用いてもよい。
In addition to the above, as a determination of whether or not the character images are similar, for example, the cut character image is treated as one vector data, clustered, and a character image similar to the character image is extracted. Also good. In this case, when the distance (for example, the Euclidean distance) between the vector data representing the character image and the vector data representing the character image to be determined is equal to or less than a predetermined value (that is, when the distance between the two vector data is short) Then, it is determined that the character image is similar to the character image to be determined.
Furthermore, an expanded image may be generated based on the result image of the logical operation of the two character image patterns, and it may be determined whether or not they are similar based on the ratio of overlapping with the expanded image. That is, the degree of difference may be determined based on the degree of expansion (expansion radius) when the two match.
In addition, a method described in Japanese Patent Application Laid-Open No. 07-200755, “Managing Gigabytes” by IH Witten, A. Moffat, and TC Bell, Morgan Kaufmmann Publishers, pp. 320-332.

なお、類似度とは、2つの画像が合同である場合に最大となり、相違する度合いに応じて減少する量のことである。
類似度のかわりに、2つの画像が合同である場合に最小となり、相違する度合いに応じて増加する量を用いてもよい。この場合は、「距離」又は「相違度」と呼ばれる。距離とは、画像をベクトルで表した場合(画素値そのものをベクトルとする、又は画像の特徴量をベクトルとする等)に、ベクトルで表現した画像を空間内に配置し、その空間内での各画像同士の隔たり(距離)のことである。例えば、ユークリッド距離、マンハッタン距離、ハウスドルフ距離、マハラノビス距離、ベクトル間の角度θ、cosθ、cosθの2乗等がある。
つまり、類似する文字を探索するのに、類似度の他に、「距離」又は「相違度」を用いてもよい。したがって、「類似する」には、類似度が高いこと、距離が近いこと等を含めた概念である。
Note that the similarity is the amount that is maximized when two images are congruent and decreases according to the degree of difference.
Instead of similarity, an amount that is minimized when two images are congruent and increases according to the degree of difference may be used. In this case, it is called “distance” or “degree of difference”. The distance is an image represented by a vector (such as a pixel value itself as a vector or an image feature amount as a vector). This is the distance (distance) between the images. For example, there are Euclidean distance, Manhattan distance, Hausdorff distance, Mahalanobis distance, angles between vectors θ, cos θ, and the square of cos θ.
That is, in order to search for similar characters, “distance” or “difference” may be used in addition to the similarity. Therefore, “similar” is a concept including high similarity, close distance, and the like.

なお、前述の類似文字の探索処理では、1個の文字に対し、他の全ての文字との類似度を計測しているが、高速化を図るために、文字矩形の大きさがある程度同じものに対してのみ、計算量の多い類似度の計算を行うようにしてもよい。   In the above-described similar character search process, the degree of similarity of one character with all other characters is measured. However, in order to increase the speed, the size of the character rectangle is somewhat the same. Only for the above, similarity calculation with a large amount of calculation may be performed.

文字画像データ重心算出モジュール106は、類似文字画像データ抽出モジュール104、文字画像データ構成モジュール108と接続されており、類似文字画像データ抽出モジュール104によって抽出された類似する複数の文字の重心を算出する。その文字の重心(文字画像データの重心値)を文字画像データ構成モジュール108へ渡す。なお、重心は1画素(文書画像における1画素)以下の精度で求めることになる。重心の算出処理については、図4、5、6を用いて後述する。   The character image data centroid calculation module 106 is connected to the similar character image data extraction module 104 and the character image data configuration module 108, and calculates centroids of a plurality of similar characters extracted by the similar character image data extraction module 104. . The character centroid (the centroid value of the character image data) is passed to the character image data composition module 108. Note that the center of gravity is obtained with an accuracy of one pixel or less (one pixel in the document image). The calculation process of the center of gravity will be described later with reference to FIGS.

文字画像データ構成モジュール108は、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字群画像データ記憶モジュール110と接続されており、類似文字画像データ抽出モジュール104によって抽出された類似する複数の文字と文字画像データ重心算出モジュール106によって算出された重心に基づいて、その文字の代表文字を生成する。代表文字とは、文字切出モジュール102によって切り出された文字よりも高解像度の文字であって、また、複数の文字から生成されたものである。なお、代表文字の生成は、重心の相対位置から類似文字の文書画像内での位相を推定し、その推定した位相と類似文字から、文書画像の解像度以上の解像度の代表文字を生成するものである。代表文字の生成については、図4、5、6を用いて後述する。文字画像データ構成モジュール108は、生成した代表文字を、外部に出力し、文字群画像データ記憶モジュール110へ渡す。   The character image data composition module 108 is connected to the similar character image data extraction module 104, the character image data centroid calculation module 106, and the character group image data storage module 110, and is similar to those extracted by the similar character image data extraction module 104. Based on the plurality of characters and the center of gravity calculated by the character image data center of gravity calculation module 106, a representative character of the character is generated. The representative character is a character with a resolution higher than that of the character cut out by the character cut-out module 102 and is generated from a plurality of characters. The representative character is generated by estimating the phase of the similar character in the document image from the relative position of the center of gravity, and generating a representative character having a resolution equal to or higher than the resolution of the document image from the estimated phase and the similar character. is there. The generation of the representative character will be described later with reference to FIGS. The character image data composition module 108 outputs the generated representative character to the outside and passes it to the character group image data storage module 110.

文字群画像データ記憶モジュール110は、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112と接続されている。文字画像データ構成モジュール108によって生成された代表文字を記憶する。そして、文字群画像データ縮小モジュール112からアクセスされ、その代表文字(文字群画像データ)を文字切出モジュール102へ渡す。また、文字切出モジュール102又は類似文字画像データ抽出モジュール104からアクセスされ、その代表文字を文字切出モジュール102又は類似文字画像データ抽出モジュール104へ渡すようにしてもよい。例えば、図2に示すように、文字群画像データ記憶モジュール110は代表文字からなる画像データ200を記憶する。
文字群画像データ縮小モジュール112は、文字群画像データ記憶モジュール110、文字切出モジュール102と接続されており、文字切出モジュール102又は類似文字画像データ抽出モジュール104からの要求に応じて、文字群画像データ記憶モジュール110から代表文字を取り出し、その代表文字の解像度を文字切出モジュール102が受け付ける文書画像の解像度に合わせるために、縮小処理(解像度を下げる処理)を行う。縮小した代表文字(縮小画像データ)を要求を行った文字切出モジュール102又は類似文字画像データ抽出モジュール104へ渡す。なお、代表文字と文書画像の解像度が同じ場合は、文字群画像データ縮小モジュール112は処理を行う必要がない。したがって、ここでの縮小処理には1倍に縮小(何もしない)処理も含む。
The character group image data storage module 110 is connected to the character image data configuration module 108 and the character group image data reduction module 112. The representative character generated by the character image data composition module 108 is stored. Then, it is accessed from the character group image data reduction module 112, and the representative character (character group image data) is passed to the character cutout module 102. Alternatively, the character may be accessed from the character cutout module 102 or the similar character image data extraction module 104, and the representative character may be passed to the character cutout module 102 or the similar character image data extraction module 104. For example, as shown in FIG. 2, the character group image data storage module 110 stores image data 200 composed of representative characters.
The character group image data reduction module 112 is connected to the character group image data storage module 110 and the character cutout module 102, and in response to a request from the character cutout module 102 or the similar character image data extraction module 104, A representative character is extracted from the image data storage module 110, and a reduction process (a process for reducing the resolution) is performed in order to match the resolution of the representative character with the resolution of the document image received by the character cutout module 102. The reduced representative character (reduced image data) is transferred to the character cutout module 102 or the similar character image data extraction module 104 which has made the request. When the representative character and the document image have the same resolution, the character group image data reduction module 112 does not need to perform processing. Therefore, the reduction process here includes a process of reducing (doing nothing) one time.

図3は、第1の実施の形態による処理例を示すフローチャートである。
ステップS302では、文字切出モジュール102が、文書画像を受け取り、その文書画像内から文字を切り出す。
ステップS304では、文字群画像データ縮小モジュール112が、文字群画像データ記憶モジュール110から代表文字を抽出する。
ステップS306では、文字群画像データ縮小モジュール112が、ステップS304で抽出した代表文字に対して縮小処理を行う。
ステップS308では、類似文字画像データ抽出モジュール104が、ステップS302で切り出された文字とステップS306で縮小された代表文字の中で、切り出された文字と類似する文字を抽出する。
FIG. 3 is a flowchart illustrating a processing example according to the first exemplary embodiment.
In step S302, the character cutout module 102 receives a document image and cuts out a character from the document image.
In step S304, the character group image data reduction module 112 extracts representative characters from the character group image data storage module 110.
In step S306, the character group image data reduction module 112 performs a reduction process on the representative character extracted in step S304.
In step S308, the similar character image data extraction module 104 extracts a character similar to the cut out character from the character cut out in step S302 and the representative character reduced in step S306.

ステップS310では、文字画像データ重心算出モジュール106が、ステップS308で抽出された複数の類似文字の重心を算出する。
ステップS312では、文字画像データ構成モジュール108が、ステップS308で抽出された文字とステップS310で算出された重心に基づいて、代表文字を生成する。
ステップS314では、文字群画像データ記憶モジュール110が、ステップS312で生成された文字を記憶する。
ステップS316では、文字画像データ構成モジュール108が、代表文字を外部に出力する。
なお、ステップS314,ステップS316の処理はいずれが先でもよく、また同時であってもよい。
In step S310, the character image data center-of-gravity calculation module 106 calculates the centers of gravity of the plurality of similar characters extracted in step S308.
In step S312, the character image data composition module 108 generates a representative character based on the character extracted in step S308 and the center of gravity calculated in step S310.
In step S314, the character group image data storage module 110 stores the character generated in step S312.
In step S316, the character image data composition module 108 outputs the representative character to the outside.
Note that any of the processes in steps S314 and S316 may be performed first or simultaneously.

図4を用いて、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108による処理例を説明する。文字画像データ構成モジュール108は拡大処理を行うものである。
文字切出モジュール102は、複数の「2」という文字が記載された対象文書画像410内の文字画像411、文字画像412、文字画像413を対象画像とする。そして、それぞれの文字画像を、文字画像411の解像度で切り出す。また、それぞれの文字画像の文字サイズ/文字位置データを抽出して、文字画像データ構成モジュール108へ渡すようにしてもよい。
類似文字画像データ抽出モジュール104は、類似している文字画像を探索し、複数の「2」という文字画像のグループを生成する。
そして、文字画像データ重心算出モジュール106は、文字画像411、文字画像412、文字画像413の重点(重心線411A等の交差点)を求め、文字画像データ構成モジュール108は、その重点を一致させるように位相を移動して高解像度文字画像420を生成する。
また、文字画像データ構成モジュール108は、例えば「2」という文字画像の文字コード・データを割り当てるようにしてもよい。文字コードの割り当て処理は、文字認識処理によって行うようにしてもよい。
また、文字画像データ構成モジュール108は、高解像度文字画像420から例えばアウトライン情報であるフォント・データ430を生成するようにしてもよい。その文字画像の文字サイズ/文字位置データを対応付けて出力するようにしてもよい。
An example of processing by the character cutout module 102, the similar character image data extraction module 104, the character image data centroid calculation module 106, and the character image data configuration module 108 will be described with reference to FIG. The character image data construction module 108 performs enlargement processing.
The character cutting module 102 sets the character image 411, the character image 412, and the character image 413 in the target document image 410 in which a plurality of characters “2” are described as the target images. Then, each character image is cut out with the resolution of the character image 411. Further, the character size / character position data of each character image may be extracted and passed to the character image data configuration module 108.
The similar character image data extraction module 104 searches for similar character images and generates a plurality of character image groups “2”.
Then, the character image data center-of-gravity calculation module 106 obtains the emphasis (intersection of the center of gravity line 411A) of the character image 411, the character image 412, and the character image 413, and the character image data composition module 108 matches the emphasis. The high resolution character image 420 is generated by shifting the phase.
Further, the character image data composition module 108 may assign character code data of a character image “2”, for example. The character code assignment processing may be performed by character recognition processing.
Further, the character image data composition module 108 may generate font data 430 that is outline information, for example, from the high resolution character image 420. The character size / character position data of the character image may be output in association with each other.

図5を用いて、文字画像データ重心算出モジュール106による重心の算出処理例、文字画像データ構成モジュール108による代表文字の生成、つまり高解像度文字画像を構成する拡大処理例を説明する。
図5(A)は、対象文書画像410の解像度(第1の解像度)における標本化格子(第1の標本化格子501、第1の標本化格子502、第1の標本化格子503、第1の標本化格子504)及び文字画像の重心位置(重心501A、重心502A、重心503A、重心504A)を表している。文字画像データ重心算出モジュール106は、各文字画像の重心を算出する。
次に、文字画像データ構成モジュール108は、まず、図5(B)に示すように、文字画像の重心に基づいて、4つの標本化格子の位相を移動させる。
An example of gravity center calculation processing by the character image data gravity center calculation module 106, generation of representative characters by the character image data configuration module 108, that is, an example of enlargement processing for constructing a high-resolution character image will be described with reference to FIG.
FIG. 5A illustrates a sampling grid (first sampling grid 501, first sampling grid 502, first sampling grid 503, first resolution at the resolution (first resolution) of the target document image 410. Sampling center 504) and barycentric positions (centroid 501A, centroid 502A, centroid 503A, centroid 504A) of the character image. The character image data centroid calculation module 106 calculates the centroid of each character image.
Next, the character image data construction module 108 first moves the phases of the four sampling grids based on the center of gravity of the character image, as shown in FIG.

図5(C)、図5(D)は、第1の解像度よりも高い第2の解像度の標本化格子を設定する手法の例を説明する図である。図5(C)に記載された丸数字(1、2、3、4)は、第1の解像度における文字画像の値を例示している。ここで、文字画像は、丸数字が第1の解像度における標本化格子の格子点上に表されるようにプロットされている。
図5(C)において、第1の標本化格子505は第1の解像度の標本化格子である。図5(D)において、第2の標本化格子506は第2の解像度(高解像度画像)の標本化格子である。
文字画像データ構成モジュール108は、第1の解像度における4つの標本化格子の位相が移動されると、図5(D)に示すように、第2の解像度における標本化格子を設定し、文字画像の重心が一致するように、第2の解像度における標本化格子の位相を移動させる。
FIGS. 5C and 5D are diagrams illustrating an example of a technique for setting a sampling grid having a second resolution higher than the first resolution. The circled numbers (1, 2, 3, 4) shown in FIG. 5C exemplify the value of the character image at the first resolution. Here, the character image is plotted so that the circled numbers are represented on the grid points of the sampling grid at the first resolution.
In FIG. 5C, a first sampling grid 505 is a first resolution sampling grid. In FIG. 5D, the second sampling grid 506 is a sampling grid of the second resolution (high resolution image).
When the phases of the four sampling grids at the first resolution are moved, the character image data construction module 108 sets the sampling grid at the second resolution as shown in FIG. The phase of the sampling grating at the second resolution is moved so that the centroids of the two coincide.

図5(E)は、第2の解像度における文字画像の値を算出する手法の例を説明する図である。第2の標本化格子506A、第2の標本化格子506B、第2の標本化格子506C、第2の標本化格子506D内の中心にある丸数字は、第2の解像度における文字画像の値を例示しているものである。ここで、第2の解像度における文字画像は、中心にある丸数字が、第2の解像度における標本化格子の格子点上に表されるように示されている。
そして、文字画像データ構成モジュール108は、第1の解像度における各文字画像の位相に基づいて、その各文字画像の画素値から、第2の解像度における文字画像の画素値を補間する。本例では、文字画像データ構成モジュール108は、最近傍補間法を適用して、第2の解像度における文字画像の画素値を補間する。すなわち、文字画像データ構成モジュール108は、第1の解像度における文字画像の4つの値(図5(E)では、丸数字の1、2、3、4)のうち、第2の解像度における標本化格子点に最も近い値を選択して、第2の解像度における文字画像の値とする。具体的には、第2の標本化格子506Aでは、中心に最も近い値は「1」であり、「1」を採用している(丸数字は1である)。なお、補間方法は、この方法に限定されるものではなく、その他の方法(例えば、線形補間法など)を適用してもよい。
なお、文字画像データ構成モジュール108による処理は、前述の処理に限られず、線形補間、キュービックコンボリューション等でもよい。
FIG. 5E is a diagram for explaining an example of a method for calculating the value of a character image at the second resolution. The circled numbers in the center of the second sampling grid 506A, the second sampling grid 506B, the second sampling grid 506C, and the second sampling grid 506D indicate the value of the character image at the second resolution. This is just an example. Here, the character image in the second resolution is shown such that the circled numbers at the center are represented on the grid points of the sampling grid in the second resolution.
Then, the character image data construction module 108 interpolates the pixel value of the character image at the second resolution from the pixel value of each character image based on the phase of each character image at the first resolution. In this example, the character image data construction module 108 applies the nearest neighbor interpolation method to interpolate the pixel values of the character image at the second resolution. That is, the character image data composition module 108 samples the character image at the second resolution among the four values of the character image at the first resolution (circle numbers 1, 2, 3, 4 in FIG. 5E). The value closest to the grid point is selected as the character image value at the second resolution. Specifically, in the second sampling grid 506A, the value closest to the center is “1”, and “1” is adopted (the circled number is 1). The interpolation method is not limited to this method, and other methods (for example, linear interpolation method) may be applied.
The processing by the character image data configuration module 108 is not limited to the processing described above, and linear interpolation, cubic convolution, or the like may be used.

図6は、文字群画像データ記憶モジュール110を含めた文字画像データ重心算出モジュール106、文字画像データ構成モジュール108による処理例を示す説明図である。
文字切出モジュール102は、対象文書画像データ610から文字画像411を切り出す。また、類似文字画像データ抽出モジュール104は、文字群画像データ記憶モジュール110に記憶されている先に準備した文字群画像データ620から文字画像411に類似する文字画像621を抽出する。なお、図6の例の場合、対象文書画像データ610内には、文字画像411に類似する文字がないので、類似文字画像データ抽出モジュール104は、文字画像411に類似する文字として文字画像621だけを抽出している。
文字画像データ重心算出モジュール106は、文字画像411、文字画像621のそれぞれの重心(図6では、文字画像411、621内の十字線の中心)を算出する。
文字画像データ構成モジュール108は、代表文字である高解像度文字画像420を生成する。そして、文字群画像データ記憶モジュール110は、先に準備した文字群画像データ620内にこの生成された高解像度文字画像420を記憶する。
FIG. 6 is an explanatory diagram showing an example of processing by the character image data gravity center calculation module 106 and the character image data composition module 108 including the character group image data storage module 110.
The character cutout module 102 cuts out the character image 411 from the target document image data 610. The similar character image data extraction module 104 extracts a character image 621 similar to the character image 411 from the previously prepared character group image data 620 stored in the character group image data storage module 110. In the case of the example in FIG. 6, since there is no character similar to the character image 411 in the target document image data 610, the similar character image data extraction module 104 performs only the character image 621 as a character similar to the character image 411. Is extracted.
The character image data center-of-gravity calculation module 106 calculates the center of gravity of each of the character image 411 and the character image 621 (the center of the cross line in the character images 411 and 621 in FIG. 6).
The character image data composition module 108 generates a high resolution character image 420 that is a representative character. Then, the character group image data storage module 110 stores the generated high resolution character image 420 in the character group image data 620 prepared previously.

<第2の実施の形態>
第2の実施の形態は、図7に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112、文字群画像データ使用指示モジュール701を有している。第1の実施の形態に、文字群画像データ使用指示モジュール701を付加したものである。なお、第1の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
<Second Embodiment>
As shown in FIG. 7, the second embodiment includes a character cutout module 102, a similar character image data extraction module 104, a character image data barycenter calculation module 106, a character image data configuration module 108, and a character group image data storage module. 110, a character group image data reduction module 112, and a character group image data use instruction module 701. A character group image data use instruction module 701 is added to the first embodiment. Note that the same type of modules as those in the first embodiment are denoted by the same reference numerals, and redundant description is omitted. Further, even modules with the same reference numerals are described below, which are added to or replaced with the functions and functions of the corresponding modules in the first embodiment.

類似文字画像データ抽出モジュール104は、文字切出モジュール102、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ使用指示モジュール701と接続されており、文字切出モジュール102によって切り出された文字のうち類似するものの数を計数する。そして、その類似文字の数を文字群画像データ使用指示モジュール701へ渡す。また、類似文字画像データ抽出モジュール104は、文字群画像データ使用指示モジュール701からの指示に基づいて、文字群画像データ記憶モジュール110によって記憶された代表文字を使用して類似文字を抽出する。
文字群画像データ記憶モジュール110は、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112、文字群画像データ使用指示モジュール701と接続されており、文字群画像データ使用指示モジュール701からの指示に基づいて、代表文字を文字群画像データ縮小モジュール112(文字切出モジュール102又は類似文字画像データ抽出モジュール104でもよい。以下、文字群画像データ縮小モジュール112等ともいう)へ渡すようにしてもよい。
The similar character image data extraction module 104 is connected to the character cutout module 102, the character image data centroid calculation module 106, the character image data configuration module 108, and the character group image data use instruction module 701. Count the number of similar characters among the extracted characters. Then, the number of similar characters is passed to the character group image data use instruction module 701. Further, the similar character image data extraction module 104 extracts similar characters using the representative characters stored by the character group image data storage module 110 based on an instruction from the character group image data use instruction module 701.
The character group image data storage module 110 is connected to the character image data configuration module 108, the character group image data reduction module 112, and the character group image data use instruction module 701, and receives instructions from the character group image data use instruction module 701. Based on this, the representative character may be passed to the character group image data reduction module 112 (the character cutout module 102 or the similar character image data extraction module 104 may be referred to as the character group image data reduction module 112). .

文字群画像データ使用指示モジュール701は、類似文字画像データ抽出モジュール104、文字群画像データ記憶モジュール110と接続されている。類似文字画像データ抽出モジュール104によって計数された数に基づいて、類似文字画像データ抽出モジュール104に文字群画像データ記憶モジュール110によって記憶された代表文字を使用させることを指示する。これは、文字群画像データ記憶モジュール110に対して指示を行い、文字群画像データ記憶モジュール110から能動的に文字群画像データ縮小モジュール112等へ代表文字を渡すようにして実現してもよい。また、文字切出モジュール102等に対して指示を行い、文字群画像データ記憶モジュール110から代表文字を使用させるようにして実現してもよい。
なお、「類似文字画像データ抽出モジュール104によって計数された数に基づいて」として、例えば、文書画像内に類似文字がない(その文字が1つの場合)又は所定の閾値(代表文字を生成するに必要な類似文字の数)よりも少ない場合等がある。したがって、文書画像内に類似文字が多い場合は、その文書画像内の類似文字だけで代表文字を生成させることとなる。
The character group image data use instruction module 701 is connected to the similar character image data extraction module 104 and the character group image data storage module 110. Based on the number counted by the similar character image data extraction module 104, the similar character image data extraction module 104 is instructed to use the representative character stored by the character group image data storage module 110. This may be realized by instructing the character group image data storage module 110 to actively pass representative characters from the character group image data storage module 110 to the character group image data reduction module 112 or the like. Alternatively, an instruction may be given to the character cutout module 102 or the like, and the representative character may be used from the character group image data storage module 110.
In addition, as “based on the number counted by the similar character image data extraction module 104”, for example, there is no similar character in the document image (in the case where there is one character) or a predetermined threshold (to generate a representative character). In some cases, the number is less than the number of necessary similar characters. Therefore, when there are many similar characters in the document image, representative characters are generated only with the similar characters in the document image.

図8は、第2の実施の形態による処理例を示すフローチャートである。
ステップS802では、文字切出モジュール102が、文書画像を受け取り、その文書画像内から文字を切り出す。
ステップS804では、類似文字画像データ抽出モジュール104が、ステップS802で切り出された文字から類似する文字を抽出する。
ステップS806では、ステップS804で抽出された類似文字の数は所定の閾値よりも少ないか否かを判断する。かかる判断において、少ないと判断した場合はステップS808へ進み、それ以外の場合はステップS814へ進む。
ステップS808では、文字群画像データ使用指示モジュール701の使用指示に基づいて、文字群画像データ縮小モジュール112が、文字群画像データ記憶モジュール110から代表文字を抽出する。
FIG. 8 is a flowchart illustrating a processing example according to the second exemplary embodiment.
In step S802, the character cutout module 102 receives a document image and cuts out a character from the document image.
In step S804, the similar character image data extraction module 104 extracts similar characters from the characters cut out in step S802.
In step S806, it is determined whether the number of similar characters extracted in step S804 is less than a predetermined threshold. In this determination, if it is determined that the number is small, the process proceeds to step S808, and otherwise, the process proceeds to step S814.
In step S <b> 808, the character group image data reduction module 112 extracts representative characters from the character group image data storage module 110 based on the use instruction of the character group image data use instruction module 701.

ステップS810では、文字群画像データ縮小モジュール112が、ステップS808で抽出した代表文字に対して縮小処理を行う。
ステップS812では、類似文字画像データ抽出モジュール104が、ステップS802で切り出された文字とステップS810で縮小された代表文字の中で、切り出された文字と類似する文字を抽出する。
ステップS814では、文字画像データ重心算出モジュール106が、ステップS804又はステップS812で抽出された複数の類似文字の重心を算出する。
ステップS816では、文字画像データ構成モジュール108が、ステップS804又はステップS812で抽出された文字とステップS814で算出された重心に基づいて、代表文字を生成する。
ステップS818では、文字群画像データ記憶モジュール110が、ステップS816で生成された文字を記憶する。
ステップS820では、文字画像データ構成モジュール108が、代表文字を外部に出力する。
In step S810, the character group image data reduction module 112 performs a reduction process on the representative character extracted in step S808.
In step S812, the similar character image data extraction module 104 extracts a character similar to the cut out character from the character cut out in step S802 and the representative character reduced in step S810.
In step S814, the character image data center-of-gravity calculation module 106 calculates the centers of gravity of a plurality of similar characters extracted in step S804 or step S812.
In step S816, the character image data construction module 108 generates a representative character based on the character extracted in step S804 or step S812 and the center of gravity calculated in step S814.
In step S818, the character group image data storage module 110 stores the character generated in step S816.
In step S820, the character image data composition module 108 outputs the representative character to the outside.

<第3の実施の形態>
第3の実施の形態は、図9に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112、代表文字解像度指示モジュール901を有している。第1の実施の形態に、代表文字解像度指示モジュール901を付加したものである。なお、第1、第2の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1、第2の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
<Third Embodiment>
As shown in FIG. 9, the third embodiment includes a character cutout module 102, a similar character image data extraction module 104, a character image data barycenter calculation module 106, a character image data configuration module 108, and a character group image data storage module. 110, a character group image data reduction module 112, and a representative character resolution instruction module 901. A representative character resolution instruction module 901 is added to the first embodiment. The same type of modules as those in the first and second embodiments are denoted by the same reference numerals, and redundant description is omitted. Further, even modules having the same reference numerals are added or replaced with the functions and functions of the corresponding modules in the first and second embodiments.

代表文字解像度指示モジュール901は、文字画像データ構成モジュール108と接続されている。文字画像データ構成モジュール108によって生成される代表文字の解像度を指示する。その指示する解像度は、文字切出モジュール102が切り出す文字の解像度であってもよい。また、その解像度は、複数であってもよい。複数である場合は、文字画像データ構成モジュール108が外部に出力する代表文字と文字群画像データ記憶モジュール110に記憶させる代表文字の解像度を異ならせてもよい。さらに、異ならせる場合は、外部に出力する代表文字は文字群画像データ記憶モジュール110に記憶させる代表文字よりも高解像度であるようにしてもよい。また、文字群画像データ記憶モジュール110に記憶させる代表文字の解像度を複数としてもよい。例えば、外部に出力する代表文字の解像度と文字切出モジュール102が切り出す文字の解像度である。   The representative character resolution instruction module 901 is connected to the character image data configuration module 108. The resolution of the representative character generated by the character image data composition module 108 is indicated. The designated resolution may be the resolution of the character cut out by the character cut-out module 102. The resolution may be plural. When there are a plurality of characters, the resolution of the representative characters output to the outside by the character image data composition module 108 and the representative characters stored in the character group image data storage module 110 may be different. Furthermore, when different, the representative character output to the outside may have a higher resolution than the representative character stored in the character group image data storage module 110. Also, the resolution of representative characters stored in the character group image data storage module 110 may be plural. For example, the resolution of the representative character output to the outside and the resolution of the character cut out by the character cutout module 102.

文字画像データ構成モジュール108は、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字群画像データ記憶モジュール110、代表文字解像度指示モジュール901と接続されている。代表文字解像度指示モジュール901によって指示された解像度に応じて、代表文字を生成する。指示された解像度が複数の場合は、生成する代表文字も複数である。
文字群画像データ記憶モジュール110は、文字画像データ構成モジュール108によって生成された代表文字が複数の場合は、その複数の解像度の代表文字を記憶する。例えば、図10に示すように、画像データ1000は代表文字からなる文字群画像データ1010、文字群画像データ1020を記憶する。
文字群画像データ縮小モジュール112は、文字群画像データ記憶モジュール110に記憶されている代表文字のうち、文字切出モジュール102が切り出す文字と解像度が近いもの(同じものを含む)を選択して縮小してもよい。また、文字群画像データ記憶モジュール110が記憶する代表文字の解像度が文字切出モジュール102が切り出す文字の解像度と同じ場合は、文字群画像データ縮小モジュール112はなくてもよく、文字群画像データ記憶モジュール110は文字切出モジュール102又は類似文字画像データ抽出モジュール104と接続されていてもよい。
The character image data configuration module 108 is connected to the similar character image data extraction module 104, the character image data centroid calculation module 106, the character group image data storage module 110, and the representative character resolution instruction module 901. A representative character is generated according to the resolution instructed by the representative character resolution instruction module 901. When there are a plurality of designated resolutions, there are a plurality of representative characters to be generated.
When there are a plurality of representative characters generated by the character image data composition module 108, the character group image data storage module 110 stores the representative characters having a plurality of resolutions. For example, as shown in FIG. 10, the image data 1000 stores character group image data 1010 and character group image data 1020 composed of representative characters.
The character group image data reduction module 112 selects and reduces a representative character stored in the character group image data storage module 110 that has a resolution (including the same) that is close to the character extracted by the character extraction module 102. May be. Further, when the resolution of the representative character stored in the character group image data storage module 110 is the same as the resolution of the character extracted by the character cutout module 102, the character group image data reduction module 112 may be omitted, and the character group image data storage The module 110 may be connected to the character cutout module 102 or the similar character image data extraction module 104.

図11は、第3の実施の形態による処理例を示すフローチャートである。
ステップS1102からステップS1110までは、第1の実施の形態の図3に示したフローチャートのステップS302からステップS310までと同等である。
ステップS1112では、文字画像データ構成モジュール108は、代表文字解像度指示モジュール901によって指定された解像度の代表文字を生成する。なお、代表文字解像度指示モジュール901による解像度の指示は、ステップS1112の前であればいつでもよい。例えば、第3の実施の形態による処理が始まる前に1回だけ指定するようにしてもよい。
ステップS1114では、文字群画像データ記憶モジュール110がステップS1112で生成された複数の代表文字を記憶する。
ステップS1116は、第1の実施の形態の図3に示したフローチャートのステップS316と同等である。
FIG. 11 is a flowchart illustrating a processing example according to the third exemplary embodiment.
Steps S1102 to S1110 are the same as steps S302 to S310 in the flowchart shown in FIG. 3 of the first embodiment.
In step S <b> 1112, the character image data configuration module 108 generates a representative character having the resolution specified by the representative character resolution instruction module 901. The resolution instruction by the representative character resolution instruction module 901 may be any time before step S1112. For example, it may be specified only once before the process according to the third embodiment starts.
In step S1114, the character group image data storage module 110 stores a plurality of representative characters generated in step S1112.
Step S1116 is equivalent to step S316 in the flowchart shown in FIG. 3 of the first embodiment.

<第4の実施の形態>
第4の実施の形態は、図12に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112、代表文字画像データ回転モジュール1201を有している。第1の実施の形態に、代表文字画像データ回転モジュール1201を付加したものである。なお、第1から第3の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1から第3の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
<Fourth embodiment>
As shown in FIG. 12, the fourth embodiment includes a character extraction module 102, a similar character image data extraction module 104, a character image data barycenter calculation module 106, a character image data configuration module 108, and a character group image data storage module. 110, a character group image data reduction module 112, and a representative character image data rotation module 1201. A representative character image data rotation module 1201 is added to the first embodiment. The same type of modules as those in the first to third embodiments are denoted by the same reference numerals, and redundant description is omitted. Further, even modules having the same reference numerals are described below, which are added to or replaced with the functions and functions of the corresponding modules in the first to third embodiments.

文字画像データ構成モジュール108は、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、代表文字画像データ回転モジュール1201と接続されており、生成した代表文字を代表文字画像データ回転モジュール1201へ渡す。
代表文字画像データ回転モジュール1201は、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110と接続されており、文字画像データ構成モジュール108によって生成された代表文字を回転させる。その回転した代表文字を文字群画像データ記憶モジュール110に記憶させる。複数の回転角度で回転してもよい。また、回転角度は90度単位の角度であってもよい。つまり、0度(回転させない)、90度、180度、270度の4つの角度で代表文字を回転させてもよい。
文字群画像データ記憶モジュール110は、代表文字画像データ回転モジュール1201、文字群画像データ縮小モジュール112と接続されている。代表文字画像データ回転モジュール1201によって回転された代表文字を記憶する。複数の回転角度で回転した代表文字を記憶してもよい。例えば、図13に示すように、画像データ1300は、文字群画像データ1301、180度回転した文字群画像データ1302、右へ270度回転した文字群画像データ1303、右へ90度回転した文字群画像データ1304を有している。
文字群画像データ縮小モジュール112は、文字群画像データ記憶モジュール110に記憶されている全ての代表文字を縮小するようにしてもよいし、対象文書画像の回転角度が判明している場合は、文字群画像データ記憶モジュール110に記憶されている該当の回転角度の代表文字を縮小するようにしてもよい。
The character image data composition module 108 is connected to the similar character image data extraction module 104, the character image data centroid calculation module 106, and the representative character image data rotation module 1201. The generated representative characters are sent to the representative character image data rotation module 1201. hand over.
The representative character image data rotation module 1201 is connected to the character image data composition module 108 and the character group image data storage module 110 and rotates the representative character generated by the character image data composition module 108. The rotated representative character is stored in the character group image data storage module 110. You may rotate by several rotation angles. The rotation angle may be an angle in units of 90 degrees. That is, the representative character may be rotated at four angles of 0 degrees (not rotated), 90 degrees, 180 degrees, and 270 degrees.
The character group image data storage module 110 is connected to the representative character image data rotation module 1201 and the character group image data reduction module 112. The representative character rotated by the representative character image data rotation module 1201 is stored. Representative characters rotated at a plurality of rotation angles may be stored. For example, as shown in FIG. 13, image data 1300 includes character group image data 1301, character group image data 1302 rotated 180 degrees, character group image data 1303 rotated 270 degrees to the right, and character groups rotated 90 degrees to the right. It has image data 1304.
The character group image data reduction module 112 may reduce all the representative characters stored in the character group image data storage module 110. If the rotation angle of the target document image is known, the character group image data reduction module 112 The representative characters of the corresponding rotation angle stored in the group image data storage module 110 may be reduced.

図14は、第4の実施の形態による処理例を示すフローチャートである。
ステップS1402からステップS1412までは、第1の実施の形態の図3に示したフローチャートのステップS302からステップS312までと同等である。
ステップS1414では、代表文字画像データ回転モジュール1201が、ステップS1412で生成された代表文字を回転する。
ステップS1416では、文字群画像データ記憶モジュール110が、ステップS1414で回転された複数の代表文字を記憶する。
ステップS1418は、第1の実施の形態の図3に示したフローチャートのステップS316と同等である。
FIG. 14 is a flowchart illustrating a processing example according to the fourth exemplary embodiment.
Steps S1402 to S1412 are the same as steps S302 to S312 in the flowchart shown in FIG. 3 of the first embodiment.
In step S1414, the representative character image data rotation module 1201 rotates the representative character generated in step S1412.
In step S1416, the character group image data storage module 110 stores a plurality of representative characters rotated in step S1414.
Step S1418 is equivalent to step S316 of the flowchart shown in FIG. 3 of the first embodiment.

<第5の実施の形態>
第5の実施の形態は、図15に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112、代表文字画像データ記憶指示モジュール1501を有している。第1の実施の形態に、代表文字画像データ記憶指示モジュール1501を付加したものである。なお、第1から第4の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1から第4の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
<Fifth embodiment>
As shown in FIG. 15, the fifth embodiment includes a character cutout module 102, a similar character image data extraction module 104, a character image data barycenter calculation module 106, a character image data configuration module 108, and a character group image data storage module. 110, a character group image data reduction module 112, and a representative character image data storage instruction module 1501. A representative character image data storage instruction module 1501 is added to the first embodiment. The same type of modules as those in the first to fourth embodiments are denoted by the same reference numerals, and redundant description is omitted. Further, even modules with the same reference numerals are described below, which are added to or replaced with the functions and functions of the corresponding modules in the first to fourth embodiments.

類似文字画像データ抽出モジュール104は、文字切出モジュール102、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、代表文字画像データ記憶指示モジュール1501と接続されており、文字切出モジュール102によって切り出された文字のうち類似するものの数を計数する。そして、その類似文字の数を代表文字画像データ記憶指示モジュール1501へ渡す。
代表文字画像データ記憶指示モジュール1501は、類似文字画像データ抽出モジュール104、文字群画像データ記憶モジュール110と接続されており、類似文字画像データ抽出モジュール104によって計数された数に基づいて、文字群画像データ記憶モジュール110に代表文字を記憶させることを指示する。なお、「類似文字画像データ抽出モジュール104によって計数された数に基づいて」として、例えば、文書画像内に類似文字がない(その文字が1つの場合)又は所定の閾値(代表文字を生成するに必要な類似文字の数)よりも少ない場合等がある。したがって、文書画像内に類似文字が多い場合、文字群画像データ記憶モジュール110はその文字の代表文字を記憶する必要がない。
文字群画像データ記憶モジュール110は、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112、代表文字画像データ記憶指示モジュール1501と接続されており、代表文字画像データ記憶指示モジュール1501の指示に基づいて、代表文字を記憶する。
The similar character image data extraction module 104 is connected to the character cutout module 102, the character image data centroid calculation module 106, the character image data configuration module 108, and the representative character image data storage instruction module 1501. Count the number of similar characters among the extracted characters. Then, the number of similar characters is passed to the representative character image data storage instruction module 1501.
The representative character image data storage instruction module 1501 is connected to the similar character image data extraction module 104 and the character group image data storage module 110, and based on the number counted by the similar character image data extraction module 104, the character group image Instructing the data storage module 110 to store representative characters. In addition, as “based on the number counted by the similar character image data extraction module 104”, for example, there is no similar character in the document image (in the case where there is one character) or a predetermined threshold (to generate a representative character). In some cases, the number is less than the number of necessary similar characters. Therefore, when there are many similar characters in the document image, the character group image data storage module 110 does not need to store the representative characters of the characters.
The character group image data storage module 110 is connected to the character image data configuration module 108, the character group image data reduction module 112, and the representative character image data storage instruction module 1501, and is based on instructions from the representative character image data storage instruction module 1501. And memorize the representative characters.

図16は、第5の実施の形態による処理例を示すフローチャートである。
ステップS1602からステップS1612までは、第1の実施の形態の図3に示したフローチャートのステップS302からステップS312までと同等である。
ステップS1614では、代表文字画像データ記憶指示モジュール1501が、類似文字画像データ抽出モジュール104によって計数された類似文字数は所定の閾値よりも少ないか否かを判断する。かかる判断において、少ないと判断した場合はステップS1616へ進み、それ以外の場合はステップS1618へ進む。
ステップS1616では、文字群画像データ記憶モジュール110が、ステップS1612で生成された代表文字を記憶する。
ステップS1618で、第1の実施の形態の図3に示したフローチャートのステップS316と同等である。
FIG. 16 is a flowchart illustrating a processing example according to the fifth exemplary embodiment.
Steps S1602 to S1612 are equivalent to steps S302 to S312 of the flowchart shown in FIG. 3 of the first embodiment.
In step S1614, the representative character image data storage instruction module 1501 determines whether the number of similar characters counted by the similar character image data extraction module 104 is less than a predetermined threshold. In this determination, if it is determined that the number is small, the process proceeds to step S1616, otherwise the process proceeds to step S1618.
In step S1616, the character group image data storage module 110 stores the representative character generated in step S1612.
Step S1618 is equivalent to step S316 of the flowchart shown in FIG. 3 of the first embodiment.

第6の実施の形態は、図17に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112、データ出力・記憶・消去制御モジュール1701を有している。第1の実施の形態に、データ出力・記憶・消去制御モジュール1701を付加したものである。なお、第1から第5の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1から第5の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。   As shown in FIG. 17, the sixth embodiment includes a character cutout module 102, a similar character image data extraction module 104, a character image data barycenter calculation module 106, a character image data configuration module 108, and a character group image data storage module. 110, a character group image data reduction module 112, and a data output / storage / erasure control module 1701. A data output / storage / erasure control module 1701 is added to the first embodiment. The same type of modules as those in the first to fifth embodiments are denoted by the same reference numerals, and redundant description is omitted. Further, even modules having the same reference numerals are added or replaced with the functions and functions of the corresponding modules in the first to fifth embodiments.

第6の実施の形態は、第1の実施の形態による処理を行わせる学習モードと、代表文字を出力することなく単に代表文字の文字群画像データ記憶モジュール110への記憶のみを行わせる学習専念モードと、代表文字の記憶を行うことなく単に代表文字の出力のみを行わせる非学習モードと、文字群画像データ記憶モジュール110に記憶してある代表文字を消去させる学習初期化モードのうち、1つ又は複数を設け、それらの切り替え指示を操作者が行うものである。
学習モードは、文字群画像データ記憶モジュール110への代表文字の記憶と出力を行うものであり、利用初期の段階で行う(学習用の辞書を生成しながら、代表文字を出力するという利用)ものである。学習専念モードは、代表文字の記憶のみを行う(学習用の辞書のみを生成する利用)ものである。非学習モードは、学習モード又は学習専念モードによって代表文字の記憶を行った後に利用され、高速化を図るために代表文字の記憶を行わずに代表文字の出力のみを行うものである。学習初期化モードは、代表文字の記憶の消去を行う(学習用の辞書の消去)ものであり、辞書のメンテナンスに利用される。
The sixth embodiment is a learning mode in which the processing according to the first embodiment is performed, and learning dedicated to only storing the representative characters in the character group image data storage module 110 without outputting the representative characters. 1 of a mode, a non-learning mode in which only representative characters are output without storing the representative characters, and a learning initialization mode in which the representative characters stored in the character group image data storage module 110 are deleted. Two or more are provided, and the operator gives an instruction for switching them.
The learning mode is for storing and outputting representative characters to the character group image data storage module 110, and is performed at an early stage of use (use of outputting representative characters while generating a learning dictionary). It is. The dedicated learning mode is for storing only representative characters (use for generating only a learning dictionary). The non-learning mode is used after the representative character is stored in the learning mode or the learning dedicated mode, and only the representative character is output without storing the representative character in order to increase the speed. The learning initialization mode is for erasing the memory of representative characters (erasing the learning dictionary), and is used for dictionary maintenance.

文字画像データ重心算出モジュール106は、類似文字画像データ抽出モジュール104、文字画像データ構成モジュール108、データ出力・記憶・消去制御モジュール1701と接続されており、データ出力・記憶・消去制御モジュール1701の指示に基づいて、重心算出処理を行う。
文字画像データ構成モジュール108は、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字群画像データ記憶モジュール110、データ出力・記憶・消去制御モジュール1701と接続されており、データ出力・記憶・消去制御モジュール1701の指示に基づいて、代表文字生成処理を行う。
文字群画像データ記憶モジュール110は、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112、データ出力・記憶・消去制御モジュール1701と接続されており、データ出力・記憶・消去制御モジュール1701の指示に基づいて、代表文字の消去処理を行う。
The character image data center-of-gravity calculation module 106 is connected to the similar character image data extraction module 104, the character image data composition module 108, and the data output / storage / erasure control module 1701. Based on the above, the center of gravity calculation processing is performed.
The character image data composition module 108 is connected to the similar character image data extraction module 104, the character image data centroid calculation module 106, the character group image data storage module 110, and the data output / storage / erasure control module 1701. Based on an instruction from the storage / erasure control module 1701, representative character generation processing is performed.
The character group image data storage module 110 is connected to the character image data configuration module 108, the character group image data reduction module 112, and the data output / storage / erasure control module 1701. The representative character erasure process is performed based on the above.

データ出力・記憶・消去制御モジュール1701は、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110と接続されている。操作者による登録、出力又は消去の指示を受け付ける。
その指示が登録である場合は、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108及び文字群画像データ記憶モジュール110による処理を行わせるように制御する。ただし、文字画像データ構成モジュール108に対しては外部へ代表文字を出力させないように制御する。
その指示が出力である場合は、文字画像データ重心算出モジュール106及び文字画像データ構成モジュール108による処理を行わせるように制御する。ただし、文字画像データ構成モジュール108は文字群画像データ記憶モジュール110に対しては代表文字を記憶させないように制御する。
その指示が消去である場合は、文字群画像データ記憶モジュール110に記憶された代表文字を消去するように制御する。
また、受け付ける操作者からの指示は1つ又は複数であってもよい。
その指示が登録及び出力の場合は、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108及び文字群画像データ記憶モジュール110による処理を行わせるように制御する。つまり、第1の実施の形態による処理と同等になる。
なお、指示が登録及び出力の場合は前述の学習モードに該当し、指示が登録の場合は学習専念モードに該当し、指示が出力の場合は非学習モードに該当し、指示が消去の場合は学習初期化モードに該当する。
The data output / storage / erasure control module 1701 is connected to the character image data gravity center calculation module 106, the character image data configuration module 108, and the character group image data storage module 110. An instruction for registration, output or deletion by the operator is accepted.
If the instruction is registration, control is performed so that processing by the character image data center-of-gravity calculation module 106, the character image data composition module 108, and the character group image data storage module 110 is performed. However, the character image data composition module 108 is controlled not to output representative characters to the outside.
When the instruction is an output, control is performed so that the character image data center-of-gravity calculation module 106 and the character image data composition module 108 perform processing. However, the character image data composition module 108 controls the character group image data storage module 110 not to store the representative character.
When the instruction is erasure, control is performed so as to erase the representative character stored in the character group image data storage module 110.
Moreover, the instruction | indication from the operator who receives may be one or more.
When the instruction is registration and output, control is performed so that processing by the character image data centroid calculation module 106, the character image data composition module 108, and the character group image data storage module 110 is performed. That is, it is equivalent to the processing according to the first embodiment.
When the instruction is registration and output, it corresponds to the learning mode described above, when the instruction is registration, it corresponds to the learning dedicated mode, when the instruction is output, it corresponds to the non-learning mode, and when the instruction is erased This corresponds to the learning initialization mode.

図18は、第6の実施の形態による処理例を示すフローチャートである。
ステップS1802からステップS1808までは、第1の実施の形態の図3に示したフローチャートのステップS302からステップS308までと同等である。
ステップS1810では、データ出力・記憶・消去制御モジュール1701が、操作者の指示を受け付け、その指示が登録である場合はステップS1812へ、出力の場合はステップS1818へ、消去の場合はステップS1824へ進む。
ステップS1812からステップS1816までは、第1の実施の形態の図3に示したフローチャートのステップS310からステップS314と同等である。
ステップS1818からステップS1822までは、第1の実施の形態の図3に示したフローチャートのステップS310、ステップS312、ステップS316と同等である。
ステップS1824では、文字群画像データ記憶モジュール110が記憶している代表文字を消去する。
なお、登録及び出力の場合は、ステップS1812からステップS1816の処理及びステップS1822の処理を行う。
FIG. 18 is a flowchart illustrating a processing example according to the sixth exemplary embodiment.
Steps S1802 to S1808 are the same as steps S302 to S308 in the flowchart shown in FIG. 3 according to the first embodiment.
In step S1810, the data output / storage / erase control module 1701 accepts an instruction from the operator. If the instruction is registration, the process proceeds to step S1812. If output, the process proceeds to step S1818. If erased, the process proceeds to step S1824. .
Steps S1812 to S1816 are the same as steps S310 to S314 in the flowchart shown in FIG. 3 of the first embodiment.
Steps S1818 to S1822 are the same as steps S310, S312 and S316 in the flowchart shown in FIG. 3 according to the first embodiment.
In step S1824, the representative character stored in the character group image data storage module 110 is deleted.
In the case of registration and output, the processing from step S1812 to step S1816 and the processing of step S1822 are performed.

<第7の実施の形態>
第7の実施の形態は、図19に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110、文字群画像データ縮小モジュール112を有している。第1の実施の形態に加えて、類似文字画像データ抽出モジュール104と文字群画像データ記憶モジュール110を接続したものである。なお、第1から第6の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1から第6の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
<Seventh embodiment>
As shown in FIG. 19, the seventh embodiment includes a character cutout module 102, a similar character image data extraction module 104, a character image data barycenter calculation module 106, a character image data configuration module 108, and a character group image data storage module. 110 and a character group image data reduction module 112. In addition to the first embodiment, a similar character image data extraction module 104 and a character group image data storage module 110 are connected. The same type of modules as those in the first to sixth embodiments are denoted by the same reference numerals, and redundant description is omitted. Further, even modules with the same reference numerals are described below, which are added to or replaced with the functions and functions of the corresponding modules in the first to sixth embodiments.

類似文字画像データ抽出モジュール104は、文字切出モジュール102、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ記憶モジュール110と接続されており、抽出した類似文字を文字群画像データ記憶モジュール110にも渡す。文字群画像データ記憶モジュール110に渡す類似文字は、文字群画像データ記憶モジュール110に記憶されていた文字であるようにしてもよい。
文字群画像データ記憶モジュール110は、類似文字画像データ抽出モジュール104、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112と接続されており、文字画像データ構成モジュール108によって生成された代表文字を記憶する場合に、文字画像データ構成モジュール108が代表文字を生成するときに用いた代表文字を消去する。つまり、文字画像データ構成モジュール108によって新しく生成された代表文字を記憶するときに、その代表文字に対応する文字群画像データ記憶モジュール110に記憶されている代表文字を消去する。文字群画像データ記憶モジュール110には、類似文字と判断される文字は1つだけとなる。
The similar character image data extraction module 104 is connected to the character cutout module 102, the character image data centroid calculation module 106, the character image data configuration module 108, and the character group image data storage module 110. It is also passed to the image data storage module 110. The similar character to be passed to the character group image data storage module 110 may be a character stored in the character group image data storage module 110.
The character group image data storage module 110 is connected to the similar character image data extraction module 104, the character image data composition module 108, and the character group image data reduction module 112. The character group image data storage module 110 stores the representative characters generated by the character image data composition module 108. In the case of storing, the representative character used when the character image data construction module 108 generates the representative character is deleted. That is, when a representative character newly generated by the character image data composition module 108 is stored, the representative character stored in the character group image data storage module 110 corresponding to the representative character is deleted. In the character group image data storage module 110, only one character is determined as a similar character.

図20は、第7の実施の形態による処理例を示すフローチャートである。
ステップS2002からステップS2014までは、第1の実施の形態の図3に示したフローチャートのステップS302からステップS314までと同等である。
ステップS2016では、文字群画像データ記憶モジュール110が、既に文字群画像データ記憶モジュール110に記憶されている代表文字のうち、類似文字画像データ抽出モジュール104から受け取った類似文字と同じものを消去する。
ステップS2018は、第1の実施の形態の図3に示したフローチャートのステップS316と同等である。
FIG. 20 is a flowchart illustrating a processing example according to the seventh exemplary embodiment.
Steps S2002 to S2014 are the same as steps S302 to S314 in the flowchart shown in FIG. 3 according to the first embodiment.
In step S2016, the character group image data storage module 110 erases the same characters as the similar characters received from the similar character image data extraction module 104 among the representative characters already stored in the character group image data storage module 110.
Step S2018 is equivalent to step S316 of the flowchart shown in FIG. 3 of the first embodiment.

<第8の実施の形態>
第8の実施の形態は、図21に示すように、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112、頻度記憶・データ消去制御モジュール2101、文字群画像データと頻度記憶モジュール2102を有している。第1の実施の形態に、頻度記憶・データ消去制御モジュール2101、文字群画像データと頻度記憶モジュール2102を付加したものである。なお、第1から第7の実施の形態と同種のモジュールには同一符号を付し重複した説明を省略する。また、同一符号のモジュールであっても、以下に説明するものは、第1から第7の実施の形態の該当するモジュールの働き、機能に付加又は置換するものである。
<Eighth Embodiment>
As shown in FIG. 21, the eighth embodiment includes a character cutout module 102, a similar character image data extraction module 104, a character image data barycenter calculation module 106, a character image data configuration module 108, and a character group image data reduction module. 112, a frequency storage / data erasure control module 2101, a character group image data and frequency storage module 2102. A frequency storage / data deletion control module 2101, character group image data, and a frequency storage module 2102 are added to the first embodiment. The same type of modules as those in the first to seventh embodiments are denoted by the same reference numerals, and redundant description is omitted. Further, even modules with the same reference numerals are described below, which are added to or replaced with the functions and functions of the corresponding modules in the first to seventh embodiments.

類似文字画像データ抽出モジュール104は、文字切出モジュール102、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データと頻度記憶モジュール2102と接続されており、抽出した類似文字を文字群画像データと頻度記憶モジュール2102にも渡す。文字群画像データと頻度記憶モジュール2102に渡す類似文字は、文字群画像データと頻度記憶モジュール2102に記憶されていた文字であるようにしてもよい。
文字群画像データと頻度記憶モジュール2102は、類似文字画像データ抽出モジュール104、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112、頻度記憶・データ消去制御モジュール2101と接続されており、文字画像データ構成モジュール108によって生成された代表文字とその代表文字が類似文字画像データ抽出モジュール104によって抽出された回数を記憶する。つまり、代表文字とその代表文字が類似文字として抽出された回数(新たな代表文字を生成するために用いられた回数)を対応させて記憶する。そして、文字群画像データ縮小モジュール112等からアクセスされ、その代表文字(文字群画像データ)を文字切出モジュール102等へ渡す。
頻度記憶・データ消去制御モジュール2101は、文字群画像データと頻度記憶モジュール2102と接続されており、文字群画像データと頻度記憶モジュール2102に記憶されている代表文字を消去する。そのときに、代表文字の回数に応じて、代表文字を消去する。例えば、所定の閾値よりも少ない回数の代表文字を消去する。つまり、使用される頻度の少ない代表文字を消去する。
The similar character image data extraction module 104 is connected to the character cutout module 102, the character image data centroid calculation module 106, the character image data configuration module 108, and the character group image data and frequency storage module 2102. It is also passed to the character group image data and frequency storage module 2102. The similar characters passed to the character group image data and the frequency storage module 2102 may be the characters stored in the character group image data and the frequency storage module 2102.
The character group image data and frequency storage module 2102 is connected to the similar character image data extraction module 104, the character image data configuration module 108, the character group image data reduction module 112, and the frequency storage / data erasure control module 2101. The representative character generated by the data composition module 108 and the number of times the representative character is extracted by the similar character image data extraction module 104 are stored. That is, the representative character and the number of times that the representative character is extracted as a similar character (the number of times used to generate a new representative character) are stored in association with each other. Then, it is accessed from the character group image data reduction module 112 or the like, and the representative character (character group image data) is passed to the character cutout module 102 or the like.
The frequency storage / data erasure control module 2101 is connected to the character group image data and the frequency storage module 2102, and deletes the representative characters stored in the character group image data and the frequency storage module 2102. At that time, the representative character is erased according to the number of representative characters. For example, the representative character is deleted a number of times less than a predetermined threshold. That is, representative characters that are used less frequently are deleted.

図22は、第8の実施の形態による処理例を示すフローチャートである。
ステップS2202からステップS2212までは、第1の実施の形態の図3に示したフローチャートのステップS302からステップS312までと同等である。
ステップS2214では、文字群画像データと頻度記憶モジュール2102が、代表文字とその代表文字の使用頻度を記憶する。
ステップS2216は、第1の実施の形態の図3に示したフローチャートのステップS316と同等である。
FIG. 22 is a flowchart illustrating an example of processing according to the eighth embodiment.
Steps S2202 to S2212 are equivalent to steps S302 to S312 in the flowchart shown in FIG. 3 of the first embodiment.
In step S2214, the character group image data and frequency storage module 2102 stores the representative character and the usage frequency of the representative character.
Step S2216 is equivalent to step S316 in the flowchart shown in FIG. 3 of the first embodiment.

図23は、第8の実施の形態による代表文字の消去処理例を示すフローチャートである。
ステップS2302では、頻度記憶・データ消去制御モジュール2101が、文字群画像データと頻度記憶モジュール2102に記憶されている使用頻度は所定の閾値よりも少ないか否かを判断する。かかる判断において、少ないと判断した場合はステップS2304へ進み、それ以外の場合は終了する(ステップS2306)。
ステップS2304では、頻度記憶・データ消去制御モジュール2101が、文字群画像データと頻度記憶モジュール2102に記憶されている対象となっている代表文字を消去する。
FIG. 23 is a flowchart illustrating an example of a representative character erasing process according to the eighth embodiment.
In step S2302, the frequency storage / data deletion control module 2101 determines whether or not the use frequency stored in the character group image data and the frequency storage module 2102 is less than a predetermined threshold. In this determination, if it is determined that the number is small, the process proceeds to step S2304; otherwise, the process ends (step S2306).
In step S <b> 2304, the frequency storage / data deletion control module 2101 deletes the representative character that is the target stored in the character group image data and the frequency storage module 2102.

図24を参照して、前述の実施の形態のハードウェア構成例について説明する。図24に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部2417と、プリンタなどのデータ出力部2418を備えたハードウェア構成例を示している。   With reference to FIG. 24, a hardware configuration example of the above-described embodiment will be described. The configuration illustrated in FIG. 24 is configured by, for example, a personal computer (PC), and illustrates a hardware configuration example including a data reading unit 2417 such as a scanner and a data output unit 2418 such as a printer.

CPU(Central Processing Unit)2401は、前述の実施の形態において説明した各種のモジュール、すなわち、文字切出モジュール102、類似文字画像データ抽出モジュール104、文字画像データ重心算出モジュール106、文字画像データ構成モジュール108、文字群画像データ縮小モジュール112、文字群画像データ使用指示モジュール701等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。   The CPU (Central Processing Unit) 2401 includes various modules described in the above-described embodiments, that is, the character extraction module 102, the similar character image data extraction module 104, the character image data centroid calculation module 106, and the character image data configuration module. Reference numeral 108 denotes a control unit that executes processing according to a computer program describing an execution sequence of each module such as the character group image data reduction module 112 and the character group image data use instruction module 701.

ROM(Read Only Memory)2402は、CPU2401が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)2403は、CPU2401の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス2404により相互に接続されている。   A ROM (Read Only Memory) 2402 stores programs used by the CPU 2401, operation parameters, and the like. A RAM (Random Access Memory) 2403 stores programs used in the execution of the CPU 2401, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 2404 including a CPU bus.

ホストバス2404は、ブリッジ2405を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス2406に接続されている。   The host bus 2404 is connected to an external bus 2406 such as a peripheral component interconnect / interface (PCI) bus via a bridge 2405.

キーボード2408、マウス等のポインティングデバイス2409は、操作者により操作される入力デバイスである。ディスプレイ2410は、液晶表示装置又はCRT(Cathode Ray Tube)などからなり、各種情報をテキストやイメージ情報として表示する。   A keyboard 2408 and a pointing device 2409 such as a mouse are input devices operated by an operator. The display 2410 includes a liquid crystal display device or a CRT (Cathode Ray Tube), and displays various types of information as text and image information.

HDD(Hard Disk Drive)2411は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU2401によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、入力画像データや文字群画像データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。   An HDD (Hard Disk Drive) 2411 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 2401 and information. The hard disk stores input image data, character group image data, and the like. Further, various computer programs such as various other data processing programs are stored.

ドライブ2412は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体2413に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース2407、外部バス2406、ブリッジ2405、及びホストバス2404を介して接続されているRAM2403に供給する。リムーバブル記録媒体2413も、ハードディスクと同様のデータ記録領域として利用可能である。   The drive 2412 reads data or a program recorded on a removable recording medium 2413 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and the data or program is read out to the interface 2407 and the external bus 2406. , The bridge 2405, and the RAM 2403 connected via the host bus 2404. The removable recording medium 2413 can also be used as a data recording area similar to the hard disk.

接続ポート2414は、外部接続機器2415を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート2414は、インタフェース2407、及び外部バス2406、ブリッジ2405、ホストバス2404等を介してCPU2401等に接続されている。通信部2416は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部2417は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部2418は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。   The connection port 2414 is a port for connecting the external connection device 2415 and has a connection unit such as USB, IEEE1394. The connection port 2414 is connected to the CPU 2401 and the like via the interface 2407, the external bus 2406, the bridge 2405, the host bus 2404, and the like. A communication unit 2416 is connected to the network and executes data communication processing with the outside. The data reading unit 2417 is, for example, a scanner, and executes document reading processing. The data output unit 2418 is, for example, a printer, and executes document data output processing.

なお、図24に示すハードウェア構成は、1つの構成例を示すものであり、前述の実施の形態は、図24に示す構成に限らず、前述の実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図24に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。   The hardware configuration shown in FIG. 24 shows one configuration example, and the above-described embodiment is not limited to the configuration shown in FIG. 24, and the modules described in the above-described embodiment can be executed. Any configuration may be used. For example, some modules may be configured with dedicated hardware (for example, Application Specific Integrated Circuit (ASIC), etc.), and some modules are in an external system and connected via a communication line In addition, a plurality of systems shown in FIG. 24 may be connected to each other via communication lines so as to cooperate with each other. Further, it may be incorporated in a copying machine, a fax machine, a scanner, a printer, a multifunction machine (an image processing apparatus having any two or more functions of a scanner, a printer, a copying machine, a fax machine, etc.).

前述の第1から第8の実施の形態を組み合わせたものであってもよい。例えば、第2の実施の形態に、第3の実施の形態の代表文字解像度指示モジュール901を組み合わせてもよい。   The first to eighth embodiments described above may be combined. For example, the representative character resolution instruction module 901 of the third embodiment may be combined with the second embodiment.

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standards such as “DVD + R, DVD + RW, etc.”, compact discs (CDs), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), etc. MO), flexible disk (FD), magnetic tape, hard disk, read only memory (ROM), electrically erasable and rewritable read only memory (EEPROM), flash memory, random access memory (RAM), etc. It is.
The program or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.

第1の実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of 1st Embodiment. 代表文字画像データの例を示す説明図である。It is explanatory drawing which shows the example of representative character image data. 第1の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 1st Embodiment. 文字切出モジュール、類似文字画像データ抽出モジュール、文字画像データ重心算出モジュール、文字画像データ構成モジュールによる処理例を示す説明図である。It is explanatory drawing which shows the process example by a character cut-out module, a similar character image data extraction module, a character image data gravity center calculation module, and a character image data structure module. 文字画像データ重心算出モジュール、文字画像データ構成モジュールによるより詳細な処理例を示す説明図である。It is explanatory drawing which shows the example of a more detailed process by a character image data gravity center calculation module and a character image data structure module. 文字群画像データ記憶モジュールを含めた文字画像データ重心算出モジュール、文字画像データ構成モジュールによる処理例を示す説明図である。It is explanatory drawing which shows the process example by the character image data gravity center calculation module including a character group image data storage module, and a character image data structure module. 第2の実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of 2nd Embodiment. 第2の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 2nd Embodiment. 第3の実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of 3rd Embodiment. 代表文字画像データの例を示す説明図である。It is explanatory drawing which shows the example of representative character image data. 第3の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 3rd Embodiment. 第4の実施の形態の構成例についての概念的なモジュール構成図である。It is a notional module block diagram about the structural example of 4th Embodiment. 代表文字画像データの例を示す説明図である。It is explanatory drawing which shows the example of representative character image data. 第4の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 4th Embodiment. 第5の実施の形態の構成例についての概念的なモジュール構成図である。It is a notional module block diagram about the structural example of 5th Embodiment. 第5の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 5th Embodiment. 第6の実施の形態の構成例についての概念的なモジュール構成図である。It is a notional module block diagram about the structural example of 6th Embodiment. 第6の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 6th Embodiment. 第7の実施の形態の構成例についての概念的なモジュール構成図である。It is a notional module block diagram about the structural example of 7th Embodiment. 第7の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 7th Embodiment. 第8の実施の形態の構成例についての概念的なモジュール構成図である。It is a notional module block diagram about the structural example of 8th Embodiment. 第8の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 8th Embodiment. 第8の実施の形態による代表文字の消去処理例を示すフローチャートである。It is a flowchart which shows the example of the deletion process of the representative character by 8th Embodiment. 第1〜第8の実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。It is a block diagram which shows the hardware structural example of the computer which implement | achieves 1st-8th embodiment.

符号の説明Explanation of symbols

102…文字切出モジュール
104…類似文字画像データ抽出モジュール
106…文字画像データ重心算出モジュール
108…文字画像データ構成モジュール
110…文字群画像データ記憶モジュール
112…文字群画像データ縮小モジュール
701…文字群画像データ使用指示モジュール
901…代表文字解像度指示モジュール
1201…代表文字画像データ回転モジュール
1501…代表文字画像データ記憶指示モジュール
1701…データ出力・記憶・消去制御モジュール
2101…頻度記憶・データ消去制御モジュール
2102…文字群画像データと頻度記憶モジュール
DESCRIPTION OF SYMBOLS 102 ... Character cutout module 104 ... Similar character image data extraction module 106 ... Character image data gravity center calculation module 108 ... Character image data structure module 110 ... Character group image data storage module 112 ... Character group image data reduction module 701 ... Character group image Data use instruction module 901 ... representative character resolution instruction module 1201 ... representative character image data rotation module 1501 ... representative character image data storage instruction module 1701 ... data output / storage / erase control module 2101 ... frequency storage / data erasure control module 2102 ... character Group image data and frequency storage module

Claims (9)

画像から画素塊を切り出す画素塊切出手段と、
前記画素塊切出手段によって切り出された画素塊のうち類似するものを抽出する類似画素塊抽出手段と、
前記類似画素塊抽出手段によって抽出された類似する複数の画素塊の重心を算出する重心算出手段と、
前記類似画素塊抽出手段によって抽出された類似する複数の画素塊と前記重心算出手段によって算出された重心に基づいて、該画素塊の代表画素塊を生成する代表画素塊生成手段と、
前記代表画素塊生成手段によって生成された代表画素塊を記憶する代表画素塊記憶手段
を具備し、
前記類似画素塊抽出手段は、前記代表画素塊記憶手段によって記憶された代表画素塊を前記画素塊切出手段によって切り出された画素塊に含めて、類似する画素塊を抽出する
ことを特徴とする画像処理装置。
Pixel block cutting means for cutting out a pixel block from an image;
Similar pixel block extraction means for extracting similar ones of the pixel blocks cut out by the pixel block cutting means;
Centroid calculating means for calculating centroids of a plurality of similar pixel chunks extracted by the similar pixel chunk extracting means;
Representative pixel block generation means for generating a representative pixel block of the pixel block based on a plurality of similar pixel blocks extracted by the similar pixel block extraction unit and the centroid calculated by the centroid calculation unit;
Comprising representative pixel block storage means for storing the representative pixel block generated by the representative pixel block generation means;
The similar pixel block extraction unit includes the representative pixel block stored by the representative pixel block storage unit in the pixel block extracted by the pixel block extraction unit, and extracts similar pixel blocks. Image processing device.
前記類似画素塊抽出手段は、前記画素塊切出手段によって切り出された画素塊のうち類似するものの数を計数し、
前記類似画素塊抽出手段によって計数された数に基づいて、前記類似画素塊抽出手段に前記代表画素塊記憶手段によって記憶された代表画素塊を使用させることを指示する使用指示手段
をさらに具備することを特徴とする請求項1に記載の画像処理装置。
The similar pixel block extraction unit counts the number of similar pixel blocks extracted by the pixel block extraction unit,
Use instruction means for instructing the similar pixel block extraction unit to use the representative pixel block stored in the representative pixel block storage unit based on the number counted by the similar pixel block extraction unit; The image processing apparatus according to claim 1.
前記代表画素塊生成手段によって生成される代表画素塊の解像度を指示する解像度指示手段
をさらに具備し、
前記代表画素塊生成手段は、前記解像度指示手段によって指示された解像度に応じて、前記代表画素塊を生成する
ことを特徴とする請求項1又は2に記載の画像処理装置。
Resolution instruction means for instructing the resolution of the representative pixel block generated by the representative pixel block generation unit;
The image processing apparatus according to claim 1, wherein the representative pixel block generation unit generates the representative pixel block according to the resolution instructed by the resolution instruction unit.
前記代表画素塊生成手段によって生成された代表画素塊を回転させる回転手段
をさらに具備し、
前記代表画素塊記憶手段は、前記回転手段によって回転された代表画素塊を記憶する
ことを特徴とする請求項1から3のいずれか1項に記載の画像処理装置。
A rotation unit for rotating the representative pixel block generated by the representative pixel block generation unit;
The image processing apparatus according to claim 1, wherein the representative pixel block storage unit stores the representative pixel block rotated by the rotation unit.
前記類似画素塊抽出手段は、前記画素塊切出手段によって切り出された画素塊のうち類似するものの数を計数し、
前記類似画素塊抽出手段によって計数された数に基づいて、前記代表画素塊記憶手段に前記代表画素塊を記憶させることを指示する記憶指示手段
をさらに具備することを特徴とする請求項1から4のいずれか1項に記載の画像処理装置。
The similar pixel block extraction unit counts the number of similar pixel blocks extracted by the pixel block extraction unit,
5. A storage instructing unit for instructing the representative pixel block storage unit to store the representative pixel block based on the number counted by the similar pixel block extracting unit. The image processing apparatus according to any one of the above.
操作者による登録、出力又は消去の指示を受け付け、
前記指示が登録である場合は、前記重心算出手段、前記代表画素塊生成手段及び前記代表画素塊記憶手段による処理を行わせ、
前記指示が出力である場合は、前記重心算出手段及び前記代表画素塊生成手段による処理を行わせ、
前記指示が消去である場合は、前記代表画素塊記憶手段に記憶された代表画素塊を消去するように制御する制御手段
をさらに具備することを特徴とする請求項1から5のいずれか1項に記載の画像処理装置。
Accepts instructions for registration, output or deletion by the operator,
If the instruction is registration, the center of gravity calculation unit, the representative pixel block generation unit, and the representative pixel block storage unit perform processing,
If the instruction is an output, let the center of gravity calculation means and the representative pixel block generation means perform processing,
6. The apparatus according to claim 1, further comprising: a control unit that controls to erase the representative pixel block stored in the representative pixel block storage unit when the instruction is erasure. An image processing apparatus according to 1.
前記代表画素塊記憶手段は、前記代表画素塊生成手段によって生成された代表画素塊を記憶する場合に、前記代表画素塊生成手段が代表画素塊を生成するときに用いた代表画素塊を消去する
ことを特徴とする請求項1から6のいずれか1項に記載の画像処理装置。
When the representative pixel block storage unit stores the representative pixel block generated by the representative pixel block generation unit, the representative pixel block storage unit erases the representative pixel block used when the representative pixel block generation unit generates the representative pixel block. The image processing apparatus according to claim 1, wherein the image processing apparatus is an image processing apparatus.
前記代表画素塊記憶手段は、記憶する代表画素塊が、前記類似画素塊抽出手段によって抽出された回数を記憶する
ことを特徴とする請求項1から7のいずれか1項に記載の画像処理装置。
The image processing apparatus according to any one of claims 1 to 7, wherein the representative pixel block storage unit stores the number of times the stored representative pixel block is extracted by the similar pixel block extraction unit. .
コンピュータを、
画像から画素塊を切り出す画素塊切出手段と、
前記画素塊切出手段によって切り出された画素塊のうち類似するものを抽出する類似画素塊抽出手段と、
前記類似画素塊抽出手段によって抽出された類似する複数の画素塊の重心を算出する重心算出手段と、
前記類似画素塊抽出手段によって抽出された類似する複数の画素塊と前記重心算出手段によって算出された重心に基づいて、該画素塊の代表画素塊を生成する代表画素塊生成手段と、
前記代表画素塊生成手段によって生成された代表画素塊を記憶する代表画素塊記憶手段
として機能させ、
前記類似画素塊抽出手段は、前記代表画素塊記憶手段によって記憶された代表画素塊を前記画素塊切出手段によって切り出された画素塊に含めて、類似する画素塊を抽出する
ことを特徴とする画像処理プログラム。
Computer
Pixel block cutting means for cutting out a pixel block from an image;
Similar pixel block extraction means for extracting similar ones of the pixel blocks cut out by the pixel block cutting means;
Centroid calculating means for calculating centroids of a plurality of similar pixel chunks extracted by the similar pixel chunk extracting means;
Representative pixel block generation means for generating a representative pixel block of the pixel block based on a plurality of similar pixel blocks extracted by the similar pixel block extraction unit and the centroid calculated by the centroid calculation unit;
Function as a representative pixel block storage unit that stores the representative pixel block generated by the representative pixel block generation unit;
The similar pixel block extraction unit includes the representative pixel block stored by the representative pixel block storage unit in the pixel block extracted by the pixel block extraction unit, and extracts similar pixel blocks. Image processing program.
JP2008071138A 2008-03-19 2008-03-19 Image processing apparatus and image processing program Expired - Fee Related JP4935732B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008071138A JP4935732B2 (en) 2008-03-19 2008-03-19 Image processing apparatus and image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008071138A JP4935732B2 (en) 2008-03-19 2008-03-19 Image processing apparatus and image processing program

Publications (2)

Publication Number Publication Date
JP2009231871A JP2009231871A (en) 2009-10-08
JP4935732B2 true JP4935732B2 (en) 2012-05-23

Family

ID=41246850

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008071138A Expired - Fee Related JP4935732B2 (en) 2008-03-19 2008-03-19 Image processing apparatus and image processing program

Country Status (1)

Country Link
JP (1) JP4935732B2 (en)

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528302A (en) * 1991-07-19 1993-02-05 Nec Corp Character reader
JPH06309437A (en) * 1993-02-26 1994-11-04 Fujitsu Ltd Pattern inspecting device
JPH07121663A (en) * 1993-10-22 1995-05-12 Canon Inc Character recognizing method/device
JPH0877351A (en) * 1994-09-02 1996-03-22 Hitachi Ltd Method and device for processing image
JP2005341382A (en) * 2004-05-28 2005-12-08 Sony Corp Image processing apparatus, imaging apparatus, computer program and image processing method
JP2006011967A (en) * 2004-06-28 2006-01-12 Fuji Xerox Co Ltd Character recognition device and character recognition program
JP2006033232A (en) * 2004-07-14 2006-02-02 Seiko Epson Corp Image processing apparatus
JP2006202170A (en) * 2005-01-24 2006-08-03 Seiko Epson Corp Generation of high-resolution image using a plurality of low resolution images
JP2006221220A (en) * 2005-02-08 2006-08-24 Seiko Epson Corp Generation of high resolution image using two or more low resolution image
JP2006229280A (en) * 2005-02-15 2006-08-31 Ricoh Co Ltd Image processing apparatus and method, and program and recording medium
JP2007087218A (en) * 2005-09-22 2007-04-05 Toshiba Corp Image processor
JP2007334437A (en) * 2006-06-12 2007-12-27 Canon Inc Image processor and image processing method, program and storage medium
JP4862509B2 (en) * 2006-06-14 2012-01-25 富士ゼロックス株式会社 Image processing system and image processing program

Also Published As

Publication number Publication date
JP2009231871A (en) 2009-10-08

Similar Documents

Publication Publication Date Title
JP4553055B2 (en) Image processing apparatus and image processing program
JP4766030B2 (en) Image processing apparatus and image processing program
JP5017031B2 (en) Image processing apparatus, image processing method, image processing program, and storage medium
JP4935732B2 (en) Image processing apparatus and image processing program
JP2007086956A (en) Image processor, image processing method and computer program
JP4930288B2 (en) Image processing apparatus and image processing program
JP4862509B2 (en) Image processing system and image processing program
JP4146047B2 (en) Image tilt detection method and document image processing apparatus
JP5489894B2 (en) Image processing apparatus and image processing program
JP2012175220A (en) Image processing apparatus and image processing program
JP2007295210A (en) Image processing apparatus, image processing method, image processing program, and recording medium recording the program
JP4872780B2 (en) Image processing system and image processing program
JPH08237404A (en) Selection of optical character recognition mode
JP3814547B2 (en) Image processing apparatus and method
JP5067182B2 (en) Image processing apparatus and image processing program
JP5526596B2 (en) Image processing apparatus and image processing program
JP2009187168A (en) Information processor and information processing program
JP6676955B2 (en) Image processing apparatus and image processing program
JP2004030430A (en) Image processing method and image processing apparatus
JP4973536B2 (en) Image processing apparatus and image processing program
JP5991076B2 (en) Image processing apparatus and image processing program
JP6281309B2 (en) Image processing apparatus and image processing program
JP5223985B2 (en) Encoding system and encoding program
JP4900271B2 (en) Information processing apparatus and information processing program
JPH1032714A (en) Image processor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110223

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120206

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150302

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4935732

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees