JP4973536B2 - Image processing apparatus and image processing program - Google Patents
Image processing apparatus and image processing program Download PDFInfo
- Publication number
- JP4973536B2 JP4973536B2 JP2008037026A JP2008037026A JP4973536B2 JP 4973536 B2 JP4973536 B2 JP 4973536B2 JP 2008037026 A JP2008037026 A JP 2008037026A JP 2008037026 A JP2008037026 A JP 2008037026A JP 4973536 B2 JP4973536 B2 JP 4973536B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- character image
- recognition result
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
本発明は、画像処理装置及び画像処理プログラムに関する。 The present invention relates to an image processing apparatus and an image processing program.
画像内の文字を認識する文字認識装置がある。
この文字認識装置による処理は、画像を受け付け、その中から行を切り出し、行内の文字を切り出し、その切り出した文字毎に文字認識処理を行い、最終的には文字コードを出力する。
There is a character recognition device that recognizes characters in an image.
The processing by the character recognition device accepts an image, cuts out a line from the image, cuts out a character in the line, performs character recognition processing for each cut out character, and finally outputs a character code.
これに関連する技術として、例えば、特許文献1には、プロポーショナル印字の英文書、日英混在文書等の文字切り出し精度を向上させることを課題とし、文字切り出し前処理部において、形状が同一の画像をグループ化し、グループ間パラメータを算出し、このパラメータを用いて注目グループ内の画像と参照グループ内の画像の統合可能性を判断し、その判断結果に基づいて単独文字画像を抽出し、文字切り出し部は、単独文字画像と判断された画像は文字として切り出し、それ以外の画像に対して必要な統合/分離を行って文字を切り出すことが開示されている。 As a technology related to this, for example, Patent Document 1 has an object to improve the character cutout accuracy of proportionally printed English documents, Japanese-English mixed documents, and the like. Are grouped, and a parameter between groups is calculated. Using this parameter, the possibility of integration of the image in the target group and the image in the reference group is determined. Based on the determination result, a single character image is extracted, and character extraction is performed. This section discloses that an image determined to be a single character image is cut out as a character, and a character is cut out by performing necessary integration / separation with respect to other images.
また、例えば、特許文献2には、算出された確信度と同じ形の矩形を抽出する手法を用い、画像を一時的に保存・利用するキャシングにより、文字認識時におけるマッチング効率を向上させ、高精度の文字認識を実現することを課題とし、入力文字画像を行単位に分離し、行順に文字認識する文字認識方法において、行数分繰り返し実行する際に、前行までの確信度の高い文字画像を保存しておき、その認識結果の信頼度の高い文字画像に対する同じ文字画像を探し出すことが開示されている。
本発明は、画像内の複数の文字画像が類似しており、その内の一方の文字画像が認識されており、他方の文字画像が認識されていない場合であって、その認識されていない文字画像に対しても文字認識結果を付与するようにした画像処理装置及び画像処理プログラムを提供することを目的としている。 The present invention relates to a case where a plurality of character images in an image are similar, one of the character images is recognized, and the other character image is not recognized. It is an object of the present invention to provide an image processing apparatus and an image processing program that can give a character recognition result to an image.
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像内の文字認識済みの第1の文字画像を該画像から除去する文字画像除去手段と、前記文字画像除去手段によって第1の文字画像が除去された画像から第2の文字画像を抽出する文字画像抽出手段と、前記文字認識済みの第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段を具備することを特徴とする画像処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
According to the first aspect of the present invention, there is provided a character image removing unit that removes a first character image that has been recognized in the image from the image, and a second image that has been removed from the first character image by the character image removing unit. A character image extracting means for extracting the character image, and comparing the first character image already recognized by the character with the second character image extracted by the character image extracting means . When the second character image is similar , the image processing apparatus includes a recognition result adding unit that adds a character recognition result of the first character image to the second character image. .
請求項2の発明は、前記画像内の文字画像を認識し、該文字画像及び文字認識結果を対応させて出力する認識結果出力手段をさらに具備し、前記文字画像除去手段が用いる第1の文字画像は、前記認識結果出力手段によって出力される文字画像とし、前記認識結果付与手段が用いる第1の文字画像の文字認識結果は、前記第1の文字画像に対応して前記認識結果出力手段によって出力される文字認識結果とすることを特徴とする請求項1に記載の画像処理装置である。 The invention according to claim 2 further comprises recognition result output means for recognizing a character image in the image and outputting the character image and the character recognition result in correspondence with each other, and the first character used by the character image removal means. The image is a character image output by the recognition result output unit, and the character recognition result of the first character image used by the recognition result adding unit is corresponding to the first character image by the recognition result output unit. The image processing apparatus according to claim 1, wherein the image processing apparatus outputs the character recognition result.
請求項3の発明は、画像内の黒画素成分を抽出する黒画素成分抽出手段と、前記画像内の文字認識済みの文字画像を囲む文字矩形内に含まれる前記黒画素成分を用いて第1の文字画像を生成し、該文字画像に該文字認識結果を付与する文字画像生成認識結果付与手段と、前記文字画像生成認識結果付与手段によって用いられなかった黒画素成分を用いて第2の文字画像を抽出する文字画像抽出手段と、前記文字画像生成認識結果付与手段によって抽出された第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段を具備することを特徴とする画像処理装置である。 According to a third aspect of the present invention, a black pixel component extracting unit that extracts a black pixel component in an image and the black pixel component included in a character rectangle surrounding a character image that has already been recognized in the image are used. A character image generation recognition result adding unit that generates the character image and assigns the character recognition result to the character image, and a second character using a black pixel component that has not been used by the character image generation recognition result addition unit. The first character image extracted by the character image extraction means for extracting an image, the character image generation recognition result assigning means, and the second character image extracted by the character image extraction means are compared, and the first character image is extracted . When the character image of the second character image is similar to the second character image, there is provided a recognition result adding means for adding the character recognition result of the first character image to the second character image. An image processing apparatus.
請求項4の発明は、前記画像内の文字画像を認識し、該文字画像を囲む文字矩形及び文字認識結果を対応させて出力する認識結果出力手段をさらに具備し、前記文字画像生成認識結果付与手段が用いる文字矩形は、前記認識結果出力手段によって出力される文字矩形とし、前記認識結果付与手段が用いる第1の文字画像の文字認識結果は、前記第1の文字画像の文字矩形に対応して前記認識結果出力手段によって出力される文字認識結果とすることを特徴とする請求項3に記載の画像処理装置である。
The invention according to
請求項5の発明は、コンピュータを、画像内の文字認識済みの第1の文字画像を該画像から除去する文字画像除去手段と、前記文字画像除去手段によって第1の文字画像が除去された画像から第2の文字画像を抽出する文字画像抽出手段と、前記文字認識済みの第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段として機能させることを特徴とする画像処理プログラムである。 According to a fifth aspect of the present invention, there is provided a computer, a character image removing unit that removes a character-recognized first character image from the image, and an image from which the first character image has been removed by the character image removing unit. A character image extracting means for extracting a second character image from the image, and comparing the first character image recognized by the character with the second character image extracted by the character image extracting means . When the image and the second character image are similar to each other , the image processing is made to function as a recognition result adding unit that adds a character recognition result of the first character image to the second character image. It is a program.
請求項6の発明は、コンピュータを、画像内の黒画素成分を抽出する黒画素成分抽出手段と、前記画像内の文字認識済みの文字画像を囲む文字矩形内に含まれる前記黒画素成分を用いて第1の文字画像を生成し、該文字画像に該文字認識結果を付与する文字画像生成認識結果付与手段と、前記文字画像生成認識結果付与手段によって用いられなかった黒画素成分を用いて第2の文字画像を抽出する文字画像抽出手段と、前記文字画像生成認識結果付与手段によって抽出された第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段として機能させることを特徴とする画像処理プログラムである。 According to a sixth aspect of the present invention, a computer uses a black pixel component extracting means for extracting a black pixel component in an image, and the black pixel component included in a character rectangle surrounding a character image that has already been recognized in the image. The first character image is generated, and the character image generation recognition result adding unit for adding the character recognition result to the character image and the black pixel component not used by the character image generation recognition result adding unit are used. Comparing the first character image extracted by the character image extraction means for extracting the second character image, the second character image extracted by the character image extraction means, and the second character image extracted by the character image extraction means; When the first character image is similar to the second character image, the second character image is caused to function as a recognition result adding unit that adds a character recognition result of the first character image. Features Is an image processing program.
請求項1の画像処理装置によれば、画像内の複数の文字画像が類似しており、その内の一方の文字画像が認識されており、他方の文字画像が認識されていない場合であって、その認識されていない文字画像に対しても文字認識結果を付与することができる。 According to the image processing apparatus of claim 1, a plurality of character images in the image are similar, one of the character images is recognized, and the other character image is not recognized. The character recognition result can be given to the unrecognized character image.
請求項2の画像処理装置によれば、文字画像及びその文字認識結果を対応させて出力するような文字認識処理に対して対応できるようになる。 According to the image processing apparatus of the second aspect, it is possible to cope with a character recognition process in which a character image and its character recognition result are output in association with each other.
請求項3の画像処理装置によれば、画像内の複数の文字画像が類似しており、その内の一方の文字画像が認識されており、他方の文字画像が認識されていない場合であって、その認識されていない文字画像に対しても文字認識結果を付与することができる。 According to the image processing device of claim 3, a plurality of character images in the image are similar, one of the character images is recognized, and the other character image is not recognized. The character recognition result can be given to the unrecognized character image.
請求項4の画像処理装置によれば、文字画像を囲む文字矩形及びその文字認識結果を対応させて出力するような文字認識処理に対して対応できるようになる。 According to the image processing apparatus of the fourth aspect, it is possible to cope with the character recognition processing in which the character rectangle surrounding the character image and the character recognition result are output in association with each other.
請求項5の画像処理プログラムによれば、画像内の複数の文字画像が類似しており、その内の一方の文字画像が認識されており、他方の文字画像が認識されていない場合であって、その認識されていない文字画像に対しても文字認識結果を付与することができる。 According to the image processing program of claim 5, a plurality of character images in the image are similar, one of the character images is recognized, and the other character image is not recognized. The character recognition result can be given to the unrecognized character image.
請求項6の画像処理プログラムによれば、画像内の複数の文字画像が類似しており、その内の一方の文字画像が認識されており、他方の文字画像が認識されていない場合であって、その認識されていない文字画像に対しても文字認識結果を付与することができる。 According to the image processing program of claim 6, a plurality of character images in the images are similar, one of the character images is recognized, and the other character image is not recognized. The character recognition result can be given to the unrecognized character image.
まず、本実施の形態の概要を説明する。
画像、特に文書を対象とした画像に対して、文字認識を行う。また、文書画像には類似(同一を含む)の文字が複数出現する場合がある。しかし、その類似する文字の内、一部は文字認識できるもの、そして文字認識ができないものがある。
要因としては、文字画像に「かすれ」や「つぶれ」等が発生している場合、又は変則的なレイアウトの文書であって、行切り出しが困難な場合等がある。
特に、後者の場合について説明する。文字認識処理は3つの処理、「行切り出し」、「文字切り出し」、「文字認識」という順番で、それぞれの処理はその前処理の結果のみを扱うようにしている。このようにすると、行に含まれない文字画像に対して、文字コードが付与されるということはない。例えば、図形に近接・内包されている文字画像、行頭・行末の文字画像(特に、句読点、かっこ、中黒等の記号)は図形として判断されてしまい、行に含まれないことがある。
First, an outline of the present embodiment will be described.
Character recognition is performed on an image, particularly an image targeted for a document. In addition, a plurality of similar (including the same) characters may appear in the document image. However, some of the similar characters can be recognized and some cannot be recognized.
As a factor, there are a case where “blurred” or “collapsed” or the like has occurred in a character image, or a document with an irregular layout, which makes it difficult to cut out lines.
In particular, the latter case will be described. The character recognition process is performed in the order of three processes, “line cutout”, “character cutout”, and “character recognition”, and each process handles only the result of the preprocessing. In this way, a character code is not assigned to a character image not included in a line. For example, a character image close to or included in a graphic, or a character image at the beginning or end of a line (particularly, symbols such as punctuation marks, parentheses, and middle black) may be determined as a graphic and may not be included in the line.
本実施の形態は、主に、このような文字認識処理(行切り出し、文字切り出し、文字認識の順番で行う文字認識処理)を利用するものである。そして、文字認識されなかった画像と文字認識された文字画像とが類似しているか否かを判断して、類似しているものには文字認識された文字画像の文字コードを付与するようにしたものである。 The present embodiment mainly uses such character recognition processing (character recognition processing performed in the order of line cutout, character cutout, and character recognition). Then, it is determined whether or not the character-recognized image is similar to the character-recognized character image, and the character code of the character-recognized character image is assigned to the similar image. Is.
以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。
Hereinafter, examples of various preferred embodiments for realizing the present invention will be described with reference to the drawings.
FIG. 1 is a conceptual module configuration diagram of a configuration example according to the first embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment also serves as an explanation of a computer program, a system, and a method. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. It is the control to be stored in the device. In addition, the modules correspond almost one-to-one with the functions. However, in mounting, one module may be composed of one program, or a plurality of modules may be composed of one program. A plurality of programs may be used. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. Hereinafter, “connection” is used not only for physical connection but also for logical connection (data exchange, instruction, reference relationship between data, etc.).
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is also included. “Apparatus” and “system” are used as synonymous terms.
本実施の形態は、図1に示すように、画像受付モジュール110、行切出モジュール120、文字切出モジュール130、文字認識モジュール140、認識済文字画像除去モジュール150、文字画像抽出モジュール160、パターンマッチング処理モジュール170、文字認識結果出力モジュール180を有している。
In the present embodiment, as shown in FIG. 1, the
画像受付モジュール110は、行切出モジュール120、認識済文字画像除去モジュール150と接続されており、画像を受け付け、行切出モジュール120と認識済文字画像除去モジュール150へその画像を渡す。画像を受け付けるとは、スキャナで画像を読み込むこと、ファックスで画像を受信すること、画像データベース等から画像を読み出すこと等が含まれる。画像には、文字画像が含まれている。その画像は、1枚であってもよいし、複数枚の画像であってもよい。また、画像の内容として、ビジネス用に用いられる文書、広告宣伝用のパンフレット等であってもよい。また、画像は、2値画像以外の多値、カラー画像であってもよいが、2値画像以外の画像である場合は、2値画像処理を行うことが望ましい。
The
行切出モジュール120は、画像受付モジュール110、文字切出モジュール130と接続されており、画像受付モジュール110から画像を受け取り、その中の文字から構成されている行を切り出し、その切り出した行を文字切出モジュール130へ渡す。行には、横書きにおける行、縦書きにおける行(列)を含む。行の切り出しの手法としては、例えば、画像の横方向(又は縦方向)の射影(黒画素の頻度分布)をとり、その谷の部分で行を切り出す方法等がある。
The line cut-out
文字切出モジュール130は、行切出モジュール120、文字認識モジュール140と接続されており、行切出モジュール120から行を受け取り、その行内に含まれている文字画像を1つずつ切り出し、その切り出した文字画像を文字認識モジュール140へ渡す。文字画像の切り出し手法としては、例えば、行内で縦方向(又は列内で横方向)の射影をとり、その谷の部分で文字を切り出す方法等がある。また、特開平09−274645等に開示された手法を用いてもよいし、複数の切り出し手法を組み合わせて行ってもよい。
The
文字認識モジュール140は、文字切出モジュール130、認識済文字画像除去モジュール150、パターンマッチング処理モジュール170と接続されており、文字切出モジュール130から文字画像を受け取り、その文字画像の文字認識を行う。つまり、文字画像から文字コードに変換する。そして、その文字画像を認識済文字画像除去モジュール150へ渡し、その文字画像に文字認識結果である文字コードを付与してパターンマッチング処理モジュール170へ渡す。
The
認識済文字画像除去モジュール150は、画像受付モジュール110、文字認識モジュール140、文字画像抽出モジュール160と接続されており、画像受付モジュール110から画像を、文字認識モジュール140からは文字認識済みの文字画像を受け取り、文字認識済みの文字画像を画像から除去する。つまり、行切出モジュール120によって行として切り出され、文字切出モジュール130によって文字として切り出され、さらに文字認識モジュール140によって文字認識された文字画像を元の画像から除去する。除去する方法は、例えば、文字画像と画像内のその位置の画像とをXOR(eXclusive OR:排他的論理和)演算を行うようにすればよい。認識済文字画像除去モジュール150による処理の結果、画像には、文字認識されなかった画像のみが残ることになる。この画像を残滓画像ともいう。残滓画像を文字画像抽出モジュール160へ渡す。
The recognized character
文字画像抽出モジュール160は、認識済文字画像除去モジュール150、パターンマッチング処理モジュール170と接続されており、認識済文字画像除去モジュール150から残滓画像を受け取り、その残滓画像から文字画像を抽出し、その抽出した文字画像をパターンマッチング処理モジュール170へ渡す。文字画像抽出モジュール160による文字画像抽出処理は、文字切出モジュール130と同様の処理を行ってもよいし、特許文献1に開示されている技術でもよいし、さらに、図3、4を用いて後述する処理であってもよい。
The character
パターンマッチング処理モジュール170は、文字認識モジュール140、文字画像抽出モジュール160、文字認識結果出力モジュール180と接続されており、文字認識モジュール140から文字認識された文字画像(文字コードが付与された文字画像、以下、認識文字画像ともいう)、その認識文字画像に対応する文字コードを、文字画像抽出モジュール160から残滓画像から抽出した文字画像(文字コードが付与されていない文字画像、以下、非認識文字画像ともいう)を受け取り、非認識文字画像と認識文字画像間のパターンマッチング処理を行い、その結果、類似していると判断された場合は、非認識文字画像に認識文字画像の文字コードを付与し、文字画像(認識文字画像、文字コードが付与された非認識文字画像の両方を含む)、その文字画像に対応する文字コードを文字認識結果出力モジュール180へ渡す。より詳細には、図5を用いて後述する。
The pattern
文字認識結果出力モジュール180は、パターンマッチング処理モジュール170と接続されており、パターンマッチング処理モジュール170から文字画像、その文字画像に対応する文字コードを受け取り、外部(記憶装置、文書処理アプリケーション等のその他の処理、通信回線を介して接続されている情報処理システム等)へ出力する。つまり、文字認識モジュール140による文字認識結果よりも、より多く(同じ場合もあり得る)の文字認識結果を文字認識モジュール140と同様のフォーマットで出力する。
The character recognition
図2は、第1の実施の形態による処理例を示すフローチャートである。
ステップS202では、画像受付モジュール110が、対象とする画像を受け付ける。
ステップS204では、行切出モジュール120が、ステップS202で受け付けられた画像を解析して行を切り出す。
ステップS206では、文字切出モジュール130が、ステップS204で切り出された行内の文字画像を切り出す。
ステップS208では、文字認識モジュール140が、ステップS206で切り出された文字画像に対して文字認識を行う。
FIG. 2 is a flowchart illustrating a processing example according to the first exemplary embodiment.
In step S202, the
In step S204, the
In step S206, the
In step S208, the
ステップS210では、認識済文字画像除去モジュール150が、ステップS202で受け付けられた画像からステップS208で文字認識された文字画像を除去することによって残滓画像を生成する。
ステップS212では、文字画像抽出モジュール160が、ステップS210で生成された残滓画像から文字画像を抽出する。
ステップS214では、パターンマッチング処理モジュール170が、ステップS212で抽出された文字画像(非認識文字画像)とステップS208で認識された文字画像(認識文字画像)とのパターンマッチング処理を行い、認識文字画像に類似する非認識文字画像に認識文字画像の文字コードを付与する。
ステップS216では、文字認識結果出力モジュール180が、文字画像(認識文字画像、認識文字画像と類似している非認識文字画像)、それらの文字コードを出力する。
In step S210, the recognized character
In step S212, the character
In step S214, the pattern
In step S216, the character recognition
図3、4は、文字画像抽出モジュール160が外接矩形を用いて文字画像を生成する処理例を示す説明図である。
文字画像抽出モジュール160は、残滓画像から8近傍連結又は4近傍連結の黒画素成分を抽出する。例えば、図3(a)で示した例は、2つの黒画素成分からなっている。
次に、その抽出した黒画素成分の外接矩形(黒画素成分の最上位、最下位、最右、最左の黒画素に接しており、全体を取り囲む矩形)を生成する。例えば、図3(b)は、図3(a)の例で示した画像に対して、2つの外接矩形(310、320)を生成した例を示したものである。また、この外接矩形の大きさが所定の閾値以上であれば、文字画像ではないと判断する。
3 and 4 are explanatory diagrams illustrating an example of processing in which the character
The character
Next, a circumscribed rectangle of the extracted black pixel component (a rectangle that is in contact with and surrounds the black pixel components at the highest, lowest, rightmost, and leftmost black pixels) is generated. For example, FIG. 3B shows an example in which two circumscribed rectangles (310, 320) are generated for the image shown in the example of FIG. If the size of the circumscribed rectangle is equal to or greater than a predetermined threshold, it is determined that the character image is not a character image.
文字画像抽出モジュール160は、外接矩形が重なっているものを取り出して、1つの外接矩形として統合する。例えば、図3(c)は、図3(b)で示した重なる2つの外接矩形から1つの外接矩形としたものである。
そして、この統合した外接矩形内の画像を文字画像とする。
The character
Then, an image in the integrated circumscribed rectangle is set as a character image.
また、文字画像抽出モジュール160は、さらに、外接矩形に対して膨張処理(外側に拡大する処理)を施すようにしてもよい。
例えば、図4(a)で示した例は、2つの黒画素成分からなっている。その外接矩形(410、420)は、図4(b)の例に示すように重なりがない。
文字画像抽出モジュール160は、外接矩形410、420のそれぞれに対して膨張処理を施して、図4(c)の例に示すように膨張矩形430、440を生成する。膨張処理を施した外接矩形に対して、重なっているものを取り出す。
そして、その重なりがある外接矩形を1つの外接矩形として統合する。例えば、図4(d)は、図4(c)で示した重なる2つの外接矩形から1つの外接矩形としたものである。
そして、この統合した外接矩形内の画像を文字画像とする。
Further, the character
For example, the example shown in FIG. 4A includes two black pixel components. The circumscribed rectangles (410, 420) do not overlap as shown in the example of FIG.
The character
Then, the circumscribed rectangles having the overlap are integrated as one circumscribed rectangle. For example, FIG. 4D shows one circumscribed rectangle from the two circumscribed rectangles shown in FIG. 4C.
Then, an image in the integrated circumscribed rectangle is set as a character image.
図5は、パターンマッチング処理モジュール170の処理例を示す説明図である。
パターンマッチング処理モジュール170は、文字認識モジュール140から認識文字画像510とその文字コード“4”を受け取り、文字画像抽出モジュール160から非認識文字画像520を受け取る。認識文字画像510と非認識文字画像520のパターンマッチング処理を行う。
FIG. 5 is an explanatory diagram showing a processing example of the pattern
The pattern
例えば、次のような処理を行う。
(1)2つの文字画像(認識文字画像510、非認識文字画像520)の黒画素の重心をあわせる。
(2)重心をあわせた2つの文字画像のXOR演算を行う。
(3)XOR演算の結果、1となった画素(相違する画素)の個数を数える。この個数が閾値以下であれば、類似する文字画像であると判断する。
(4)又は、非認識文字画像に対して、全ての認識文字画像と相違する画素数を計数し、最小のものを類似する文字画像であると判断するようにしてもよい。
また、特開平07−200745等に開示された技術を用いてもよい。
For example, the following processing is performed.
(1) The centers of black pixels of two character images (recognized
(2) An XOR operation is performed on two character images having the same center of gravity.
(3) The number of pixels (different pixels) that become 1 as a result of the XOR operation is counted. If this number is less than or equal to the threshold, it is determined that the character images are similar.
(4) Alternatively, for unrecognized character images, the number of pixels that differ from all recognized character images may be counted, and the smallest may be determined to be a similar character image.
Further, a technique disclosed in Japanese Patent Application Laid-Open No. 07-200755 may be used.
そして、認識文字画像510に対しては、文字認識モジュール140から受け取ったその文字画像に対応する文字コード“4”を付与して出力する。非認識文字画像520に対しても、類似している認識文字画像510に対応する文字コード“4”を付与して出力する。
Then, the character code “4” corresponding to the character image received from the
図6は、横書き文字の認識に成功した場合に、その認識結果を縦書き文字に利用する場合の処理例を示す説明図である。
図6(a)に示す例は、縦書きの行内に「19」という横書きの文字がある場合であり、文字切り出しが失敗する場合が多いものである。図6(b)に示す例は、同一の画像内にある文字画像であり、こちらは文字認識に成功したとする。したがって、それそれの文字画像「1」、「9」、「8」、「4」、「年」に文字コード“1”、“9”、“8”、“4”、“年”が付与されている。
図6(a)に示す例では、認識済文字画像除去モジュール150によって「時」、「に」の認識文字画像が除去され、文字画像抽出モジュール160によって「1」、「9」の非認識文字画像が抽出される。そして、パターンマッチング処理モジュール170によって非認識文字画像「1」には文字コード“1”が付与され、非認識文字画像「9」には文字コード“9”が付与されることになる。
FIG. 6 is an explanatory diagram showing an example of processing when the recognition result is used for vertically written characters when the recognition of horizontally written characters is successful.
The example shown in FIG. 6A is a case where there is a horizontally written character “19” in a vertically written line, and character segmentation often fails. The example shown in FIG. 6B is a character image in the same image, and it is assumed that the character recognition is successful. Therefore, the character codes “1”, “9”, “8”, “4”, “year” are assigned to the character images “1”, “9”, “8”, “4”, “year”. Has been.
In the example shown in FIG. 6A, the recognized character image “hour” and “ni” are removed by the recognized character
図7は、行切出モジュール120による処理が失敗した例とパターンマッチング処理モジュール170によって文字コードが与えられた例を示す説明図である。
図7(a)に示す例は、画像受付モジュール110が受け付けた画像内の一部である。このように図形である黒画素成分710の近傍に文字画像(黒画素成分711〜715)がある場合、行切出モジュール120は黒画素成分712〜715を行として抽出する場合が多い。つまり、図7(b)に示す例は、行切出モジュール120によって行として切り出されなかった画像(黒画素成分710と黒画素成分711)であり、認識済文字画像除去モジュール150による残滓画像である。図7(c)に示す例は、行として切り出された画像であり、認識文字画像である。
一方、同一画像内に図7(d)に示すような文字画像(黒画素成分721〜726)がある場合、これらは文字認識に成功したとする。つまり、文字認識モジュール140によって、黒画素成分724「・」に文字コード“・”が付与されている。文字画像抽出モジュール160は、図7(e)に示すように、外接矩形が所定の大きさ以上である黒画素成分710を文字でないとし、黒画素成分711を非認識文字画像として抽出する。パターンマッチング処理モジュール170は、黒画素成分711と文字画像である黒画素成分724とが類似していると判断し、黒画素成分711にも文字コード“・”を付与する。
FIG. 7 is an explanatory diagram showing an example in which processing by the
The example shown in FIG. 7A is a part of an image received by the
On the other hand, if there are character images (
図8は、第2の実施の形態の構成例についての概念的なモジュール構成図を示している。
第1の実施の形態では、文字認識処理として、文字画像及びその文字コードを出力していたが、第2実施の形態では、文字認識処理として、文字矩形の位置情報(例えば、文字画像を囲む矩形の左上の座標、縦横の長さ)を出力する場合に対応するものである。
なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
FIG. 8 is a conceptual module configuration diagram of a configuration example according to the second embodiment.
In the first embodiment, the character image and its character code are output as the character recognition process. In the second embodiment, the character rectangle position information (for example, surrounding the character image is enclosed) as the character recognition process. This corresponds to the case of outputting the upper left coordinates of the rectangle and the vertical and horizontal lengths).
In addition, the same code | symbol is attached | subjected to the site | part of the same kind as 1st Embodiment, and the overlapping description is abbreviate | omitted.
第2の実施の形態は、図8に示すように、画像受付モジュール110、行切出モジュール120、文字切出モジュール130、文字認識モジュール840、連結成分抽出モジュール850、統合モジュール860、文字画像抽出モジュール870、パターンマッチング処理モジュール880、文字認識結果出力モジュール890を有している。
In the second embodiment, as shown in FIG. 8, an
文字認識モジュール840は、文字切出モジュール130、、統合モジュール860と接続されており、文字切出モジュール130から文字画像を受け取り、その文字画像の文字認識を行う。つまり、文字画像から文字コードに変換する。そして、その文字画像を囲む文字矩形の位置情報、その文字矩形内の文字画像の文字認識結果である文字コードを付与して、統合モジュール860へ渡す。
The
連結成分抽出モジュール850は、画像受付モジュール110、統合モジュール860と接続されており、画像受付モジュール110から画像を受け取り、その中の黒画素成分を抽出し、抽出した黒画素成分を統合モジュール860へ渡す。
The connected
統合モジュール860は、文字認識モジュール840、連結成分抽出モジュール850、文字画像抽出モジュール870、パターンマッチング処理モジュール880と接続されており、文字認識モジュール840から文字矩形の位置情報、その文字矩形内の文字画像の文字認識結果である文字コードを受け取り、連結成分抽出モジュール850からは画像内の黒画素成分を受け取り、文字矩形内に包含される黒画素成分を統合して文字画像(以下、認識文字画像ともいう)を構成する。そして、認識文字画像に対応する文字コードを付与し、認識文字画像とその認識文字画像に対応する文字コードをパターンマッチング処理モジュール880へ渡す。一方、文字矩形内に包含されない黒画素成分を文字画像抽出モジュール870へ渡す。なお、文字矩形内に包含されない黒画素成分からなる画像は、第1の実施の形態における残滓画像に対応しており、文字画像を除去した画像である。より詳細には、図10を用いて後述する。
The
文字画像抽出モジュール870は、統合モジュール860、パターンマッチング処理モジュール880と接続されており、統合モジュール860からその統合モジュール860によっては用いられなかった黒画素成分、つまり文字矩形内に包含されない黒画素成分を受け取り、その黒画素成分から文字画像を抽出して、その文字画像(以下、非認識文字画像ともいう)をパターンマッチング処理モジュール880へ渡す。非認識文字画像の抽出手法は、黒画素成分を用いること以外は文字画像抽出モジュール160と同様である。また、黒画素成分を画像に変換して残滓画像を生成した上で、文字画像抽出モジュール160と同様の処理を行ってもよい。
The character
パターンマッチング処理モジュール880は、統合モジュール860、文字画像抽出モジュール870、文字認識結果出力モジュール890と接続されており、統合モジュール860から認識文字画像とその認識文字画像に対応する文字コードを受け取り、文字画像抽出モジュール870から非認識文字画像を受け取り、非認識文字画像と認識文字画像間のパターンマッチング処理を行い、その結果、類似していると判断された場合は、非認識文字画像に認識文字画像の文字コードを付与する。そして、文字画像(認識文字画像、文字コードが付与された非認識文字画像の両方を含む)の文字矩形を生成する。その生成した文字矩形の位置情報、文字矩形に対応する文字コードを文字認識結果出力モジュール890へ渡す。なお、認識文字画像の文字矩形の位置情報については、文字認識モジュール840から出力される文字矩形の位置情報を用いてもよい。
The pattern
文字認識結果出力モジュール890は、パターンマッチング処理モジュール880と接続されており、パターンマッチング処理モジュール880から文字矩形の位置情報、その文字矩形に対応する文字コードを受け取り、外部(記憶装置、文書処理アプリケーション等のその他の処理、通信回線を介して接続されている情報処理システム等)へ出力する。つまり、文字認識モジュール840による文字認識結果よりも、より多く(同じ場合もあり得る)の文字認識結果を文字認識モジュール840と同様のフォーマットで出力する。
The character recognition
図9は、第2の実施の形態による処理例を示すフローチャートである。
ステップS902では、画像受付モジュール110が、対象とする画像を受け付ける。
ステップS904では、行切出モジュール120が、ステップS902で受け付けられた画像を解析して行を切り出す。
ステップS906では、文字切出モジュール130が、ステップS904で切り出された行内の文字画像を切り出す。
ステップS908では、文字認識モジュール840が、ステップS906で切り出された文字画像に対して文字認識を行う。
FIG. 9 is a flowchart illustrating a processing example according to the second exemplary embodiment.
In step S902, the
In step S904, the
In step S906, the
In step S908, the
ステップS910では、連結成分抽出モジュール850が、ステップS902で受け付けられた画像内の黒画素成分を抽出する。
ステップS912では、統合モジュール860が、ステップS908で文字認識された文字画像の文字矩形、ステップS910で抽出された黒画素成分を用いて、その文字矩形に包含される黒画素成分を統合して認識文字画像を抽出し、そして包含されない黒画素成分を抽出する。
ステップS914では、文字画像抽出モジュール870が、ステップS912で抽出された包含されない黒画素成分を用いて非認識文字画像を抽出する。
ステップS916では、パターンマッチング処理モジュール880が、ステップS914で抽出された非認識文字画像とステップS912で抽出された認識文字画像とのパターンマッチング処理を行い、認識文字画像に類似する非認識文字画像に認識文字画像の文字コードを付与する。そして、文字コードが付与された文字画像の文字矩形の位置情報を生成する。
ステップS918では、文字認識結果出力モジュール890が、ステップS916で生成された文字矩形(認識文字画像の文字矩形、認識文字画像と類似している非認識文字画像の文字矩形)の位置情報、その文字矩形に対応する文字コードを出力する。
In step S910, the connected
In step S912, the
In step S914, the character
In step S916, the pattern
In step S918, the character recognition
図10は、統合モジュール860による処理例を示す説明図である。
統合モジュール860は、文字認識モジュール840から文字矩形の位置情報を受け取り、その中に包含される黒画素成分を統合して文字画像を生成する。
ここでの包含判定は、例えば、黒画素成分の外接矩形が文字矩形に内包される場合を包含とする。図10を用いて説明する。文字認識モジュール840から渡される文字矩形1010の位置情報は、図10(a)の例に示すように、左上位置1011、幅1012、高さ1013である。そして、図10(b)の例に示すように、黒画素成分の外接矩形1021、外接矩形1022は、文字矩形1010内に内包されている。
又は、文字矩形内で黒画素成分の占める面積割合が所定の閾値以上である場合に、その文字矩形に包含されているとするようにしてもよい。
FIG. 10 is an explanatory diagram showing a processing example by the
The
The inclusion determination here includes, for example, a case where a circumscribed rectangle of the black pixel component is included in a character rectangle. This will be described with reference to FIG. The position information of the
Alternatively, when the area ratio of the black pixel component in the character rectangle is equal to or greater than a predetermined threshold, the character rectangle may be included in the character rectangle.
図11を参照して、本実施の形態のハードウェア構成例について説明する。図11に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1117と、プリンタなどのデータ出力部1118を備えたハードウェア構成例を示している。
A hardware configuration example of the present embodiment will be described with reference to FIG. The configuration shown in FIG. 11 is configured by a personal computer (PC), for example, and shows a hardware configuration example including a
CPU(Central Processing Unit)1101は、前述の実施の形態において説明した各種のモジュール、すなわち、行切出モジュール120、文字切出モジュール130、文字認識モジュール140、認識済文字画像除去モジュール150、文字画像抽出モジュール160、パターンマッチング処理モジュール170、連結成分抽出モジュール850、統合モジュール860等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
A CPU (Central Processing Unit) 1101 includes various modules described in the above-described embodiments, that is, a
ROM(Read Only Memory)1102は、CPU1101が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1103は、CPU1101の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1104により相互に接続されている。
A ROM (Read Only Memory) 1102 stores programs used by the
ホストバス1104は、ブリッジ1105を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1106に接続されている。
The
キーボード1108、マウス等のポインティングデバイス1109は、操作者により操作される入力デバイスである。ディスプレイ1110は、液晶表示装置又はCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージ情報として表示する。
A
HDD(Hard Disk Drive)1111は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1101によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、受け付けられた画像や文字認識結果などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
An HDD (Hard Disk Drive) 1111 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the
ドライブ1112は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1113に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1107、外部バス1106、ブリッジ1105、及びホストバス1104を介して接続されているRAM1103に供給する。リムーバブル記録媒体1113も、ハードディスクと同様のデータ記録領域として利用可能である。
The
接続ポート1114は、外部接続機器1115を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1114は、インタフェース1107、及び外部バス1106、ブリッジ1105、ホストバス1104等を介してCPU1101等に接続されている。通信部1116は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1117は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1118は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
The
なお、図11に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図11に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図11に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。 Note that the hardware configuration illustrated in FIG. 11 illustrates one configuration example, and the present embodiment is not limited to the configuration illustrated in FIG. 11, and is a configuration capable of executing the modules described in the present embodiment. I just need it. For example, some modules may be configured with dedicated hardware (for example, Application Specific Integrated Circuit (ASIC), etc.), and some modules are in an external system and connected via a communication line In addition, a plurality of systems shown in FIG. 11 may be connected to each other via a communication line so as to cooperate with each other. Further, it may be incorporated in a copying machine, a fax machine, a scanner, a printer, a multifunction machine (an image processing apparatus having any two or more functions of a scanner, a printer, a copying machine, a fax machine, etc.).
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standards such as “DVD + R, DVD + RW, etc.”, compact discs (CDs), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), etc. MO), flexible disk (FD), magnetic tape, hard disk, read only memory (ROM), electrically erasable and rewritable read only memory (EEPROM), flash memory, random access memory (RAM), etc. It is.
The program or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.
110…画像受付モジュール
120…行切出モジュール
130…文字切出モジュール
140…文字認識モジュール
150…認識済文字画像除去モジュール
160…文字画像抽出モジュール
170…パターンマッチング処理モジュール
180…文字認識結果出力モジュール
840…文字認識モジュール
850…連結成分抽出モジュール
860…統合モジュール
870…文字画像抽出モジュール
880…パターンマッチング処理モジュール
890…文字認識結果出力モジュール
DESCRIPTION OF
Claims (6)
前記文字画像除去手段によって第1の文字画像が除去された画像から第2の文字画像を抽出する文字画像抽出手段と、
前記文字認識済みの第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段
を具備することを特徴とする画像処理装置。 A character image removing means for removing a first character image that has been recognized in the image from the image;
A character image extracting means for extracting a second character image from the image from which the first character image has been removed by the character image removing means;
When the first character image recognized by the character is compared with the second character image extracted by the character image extraction means, and the first character image and the second character image are similar an image processing apparatus characterized by comprising a recognition result providing means for providing a character recognition result of the first character image in the second character image.
をさらに具備し、
前記文字画像除去手段が用いる第1の文字画像は、前記認識結果出力手段によって出力される文字画像とし、
前記認識結果付与手段が用いる第1の文字画像の文字認識結果は、前記第1の文字画像に対応して前記認識結果出力手段によって出力される文字認識結果とする
ことを特徴とする請求項1に記載の画像処理装置。 A recognition result output means for recognizing the character image in the image and outputting the character image and the character recognition result in correspondence with each other;
The first character image used by the character image removing unit is a character image output by the recognition result output unit,
The character recognition result of the first character image used by the recognition result adding unit is a character recognition result output by the recognition result output unit corresponding to the first character image. An image processing apparatus according to 1.
前記画像内の文字認識済みの文字画像を囲む文字矩形内に含まれる前記黒画素成分を用いて第1の文字画像を生成し、該文字画像に該文字認識結果を付与する文字画像生成認識結果付与手段と、
前記文字画像生成認識結果付与手段によって用いられなかった黒画素成分を用いて第2の文字画像を抽出する文字画像抽出手段と、
前記文字画像生成認識結果付与手段によって抽出された第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段
を具備することを特徴とする画像処理装置。 Black pixel component extraction means for extracting a black pixel component in the image;
A character image generation recognition result for generating a first character image using the black pixel component included in a character rectangle surrounding a character image that has already been recognized in the image, and adding the character recognition result to the character image Granting means;
A character image extraction means for extracting a second character image using a black pixel component that has not been used by the character image generation recognition result giving means;
The first character image extracted by the character image generation recognition result assigning means and the second character image extracted by the character image extracting means are compared, and the first character image and the second character image are compared . An image processing apparatus comprising: a recognition result giving unit that gives a character recognition result of the first character image to the second character image when the two are similar to each other .
をさらに具備し、
前記文字画像生成認識結果付与手段が用いる文字矩形は、前記認識結果出力手段によって出力される文字矩形とし、
前記認識結果付与手段が用いる第1の文字画像の文字認識結果は、前記第1の文字画像の文字矩形に対応して前記認識結果出力手段によって出力される文字認識結果とする
ことを特徴とする請求項3に記載の画像処理装置。 A recognition result output means for recognizing the character image in the image and outputting the character rectangle surrounding the character image and the character recognition result in correspondence with each other;
The character rectangle used by the character image generation recognition result assigning unit is a character rectangle output by the recognition result output unit,
The character recognition result of the first character image used by the recognition result giving means is a character recognition result output by the recognition result output means corresponding to the character rectangle of the first character image. The image processing apparatus according to claim 3.
画像内の文字認識済みの第1の文字画像を該画像から除去する文字画像除去手段と、
前記文字画像除去手段によって第1の文字画像が除去された画像から第2の文字画像を抽出する文字画像抽出手段と、
前記文字認識済みの第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段
として機能させることを特徴とする画像処理プログラム。 Computer
A character image removing means for removing a first character image that has been recognized in the image from the image;
A character image extracting means for extracting a second character image from the image from which the first character image has been removed by the character image removing means;
When the first character image recognized by the character is compared with the second character image extracted by the character image extraction means, and the first character image and the second character image are similar an image processing program for causing to function as a recognition result providing means for providing a character recognition result of the first character image in the second character image.
画像内の黒画素成分を抽出する黒画素成分抽出手段と、
前記画像内の文字認識済みの文字画像を囲む文字矩形内に含まれる前記黒画素成分を用いて第1の文字画像を生成し、該文字画像に該文字認識結果を付与する文字画像生成認識結果付与手段と、
前記文字画像生成認識結果付与手段によって用いられなかった黒画素成分を用いて第2の文字画像を抽出する文字画像抽出手段と、
前記文字画像生成認識結果付与手段によって抽出された第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段
として機能させることを特徴とする画像処理プログラム。 Computer
Black pixel component extraction means for extracting a black pixel component in the image;
A character image generation recognition result for generating a first character image using the black pixel component included in a character rectangle surrounding a character image that has already been recognized in the image, and adding the character recognition result to the character image Granting means;
A character image extraction means for extracting a second character image using a black pixel component that has not been used by the character image generation recognition result giving means;
The first character image extracted by the character image generation recognition result assigning means and the second character image extracted by the character image extracting means are compared, and the first character image and the second character image are compared . When the two are similar , an image processing program causing the second character image to function as a recognition result adding unit that adds a character recognition result of the first character image.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008037026A JP4973536B2 (en) | 2008-02-19 | 2008-02-19 | Image processing apparatus and image processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008037026A JP4973536B2 (en) | 2008-02-19 | 2008-02-19 | Image processing apparatus and image processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009199116A JP2009199116A (en) | 2009-09-03 |
JP4973536B2 true JP4973536B2 (en) | 2012-07-11 |
Family
ID=41142580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008037026A Expired - Fee Related JP4973536B2 (en) | 2008-02-19 | 2008-02-19 | Image processing apparatus and image processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4973536B2 (en) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0772906B2 (en) * | 1991-07-10 | 1995-08-02 | 富士ゼロックス株式会社 | Document recognition device |
JPH05282493A (en) * | 1992-03-31 | 1993-10-29 | Matsushita Electric Ind Co Ltd | Roman letter recognizing device |
JPH06309503A (en) * | 1993-04-23 | 1994-11-04 | Matsushita Electric Ind Co Ltd | English character recognizing device |
JP4209511B2 (en) * | 1998-09-11 | 2009-01-14 | 株式会社リコー | Character recognition method, character recognition device, and computer-readable recording medium recording a program for causing a computer to execute the character recognition method |
JP4655335B2 (en) * | 2000-06-20 | 2011-03-23 | コニカミノルタビジネステクノロジーズ株式会社 | Image recognition apparatus, image recognition method, and computer-readable recording medium on which image recognition program is recorded |
-
2008
- 2008-02-19 JP JP2008037026A patent/JP4973536B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009199116A (en) | 2009-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8411955B2 (en) | Image processing apparatus, image processing method and computer-readable medium | |
JP6119952B2 (en) | Image processing apparatus and image processing program | |
KR101235226B1 (en) | Image processor and image processing method and recording medium | |
JP2010055354A (en) | Image processing apparatus and image processing program | |
KR101248449B1 (en) | Information processor, information processing method, and computer readable medium | |
JP2009251872A (en) | Information processing device and information processing program | |
JP6221220B2 (en) | Image processing apparatus and image processing program | |
JP5365440B2 (en) | Image processing apparatus and image processing program | |
JP4973536B2 (en) | Image processing apparatus and image processing program | |
JP5720182B2 (en) | Image processing apparatus and image processing program | |
JP4872780B2 (en) | Image processing system and image processing program | |
JP4930288B2 (en) | Image processing apparatus and image processing program | |
JP6003375B2 (en) | Image processing apparatus and image processing program | |
JP5928714B2 (en) | Information processing apparatus and information processing program | |
JP5062076B2 (en) | Information processing apparatus and information processing program | |
JP6281309B2 (en) | Image processing apparatus and image processing program | |
JP2009187168A (en) | Information processor and information processing program | |
JP4900271B2 (en) | Information processing apparatus and information processing program | |
JP6409423B2 (en) | Image processing apparatus and image processing program | |
JP5526596B2 (en) | Image processing apparatus and image processing program | |
JP5531661B2 (en) | Image processing apparatus and image processing program | |
JP2010039810A (en) | Image processor and image processing program | |
JP2009130870A (en) | Image processor and image processing program | |
JP2010049336A (en) | Image processor and image processing program | |
JP2009069953A (en) | Image processing device and image processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090825 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120326 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |