JP5660294B2 - Character image identification device, character image identification method and program - Google Patents

Character image identification device, character image identification method and program Download PDF

Info

Publication number
JP5660294B2
JP5660294B2 JP2010182102A JP2010182102A JP5660294B2 JP 5660294 B2 JP5660294 B2 JP 5660294B2 JP 2010182102 A JP2010182102 A JP 2010182102A JP 2010182102 A JP2010182102 A JP 2010182102A JP 5660294 B2 JP5660294 B2 JP 5660294B2
Authority
JP
Japan
Prior art keywords
character
image
character image
identification
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010182102A
Other languages
Japanese (ja)
Other versions
JP2012043077A (en
Inventor
久保田 聡
聡 久保田
木村 俊一
俊一 木村
越 裕
裕 越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2010182102A priority Critical patent/JP5660294B2/en
Publication of JP2012043077A publication Critical patent/JP2012043077A/en
Application granted granted Critical
Publication of JP5660294B2 publication Critical patent/JP5660294B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

本発明は、文字画像識別装置、文字画像識別方法およびプログラムに関する。   The present invention relates to a character image identification device, a character image identification method, and a program.

非特許文献1には、Haar-Like特徴と呼ばれる濃淡パターンを用いて、形状、サイズ、対象画像上でパターンを適用する位置が異なるとともに、各パターンの出力値を入力として所定の識別値を出力する複数の識別器(一般に弱識別器と呼ばれる)を構成し、これらの複数の弱識別器から顔の輝度の濃淡を表すのに適した弱識別器を選択して、それら複数の弱識別器をカスケード接続した識別器(一般に強識別器と呼ばれる)で顔識別を行う方法が開示されている。   Non-Patent Document 1 uses a shading pattern called a Haar-Like feature, and the shape, size, and position where the pattern is applied on the target image are different, and the output value of each pattern is input and a predetermined identification value is output. A plurality of weak classifiers (generally called weak classifiers) are selected, and a weak classifier suitable for representing the intensity of facial brightness is selected from the plurality of weak classifiers, and the plurality of weak classifiers are selected. Discloses a method of performing face recognition using a classifier (in general, referred to as a strong classifier) connected in cascade.

また顔識別以外のオブジェクト識別技術に関しては、特許文献1および特許文献2に開示されている方法がある。   Regarding object identification techniques other than face identification, there are methods disclosed in Patent Document 1 and Patent Document 2.

特許文献1には、パターンの認識判定において、判定対象から抽出したn次元特徴量に対してそれぞれ上限/下限閾値により規定される区間を設け、認識対象から抽出した特徴量が全ての次元の区間内に入るか否かに基づいて、認識対象のパターンが特定のカテゴリーに含まれるか否かを判定するパターン学習方法が開示されている。   In Patent Document 1, in pattern recognition determination, sections defined by upper / lower thresholds are provided for n-dimensional feature quantities extracted from a determination target, respectively, and feature quantities extracted from the recognition target are sections of all dimensions. A pattern learning method for determining whether or not a pattern to be recognized is included in a specific category based on whether or not it falls within the pattern is disclosed.

特許文献2には、パターン認識システムにおいて、入力パターンに対して一意な閾値を設定するのではなく、入力パターン毎に標準パターンとの類似度分布に基づいたしきい値を設定して、標準パターン群から入力パターンと整合するパターンを絞り込むようにしたパタン認識システムが開示されている。   In Patent Document 2, in the pattern recognition system, instead of setting a unique threshold value for an input pattern, a threshold value based on a similarity distribution with the standard pattern is set for each input pattern. A pattern recognition system is disclosed in which a pattern matching an input pattern is narrowed down from a group.

特開平06−124349号公報Japanese Patent Laid-Open No. 06-124349 特開平11−120291号公報Japanese Patent Laid-Open No. 11-120291

Paul Viola, Michael Jones, 「Rapid Object Detection using a Boosted Cascade of Simple Features.」IEEE CVPR, 2001.Paul Viola, Michael Jones, `` Rapid Object Detection using a Boosted Cascade of Simple Features. '' IEEE CVPR, 2001.

本発明の目的は、切り出された文字候補画像が文字画像か非文字画像であるかを短時間で識別することが可能な文字画像識別装置、文字画像識別方法およびプログラムを提供することである。   An object of the present invention is to provide a character image identification device, a character image identification method, and a program capable of identifying in a short time whether a cut character candidate image is a character image or a non-character image.

[文字画像識別装置]
請求項1に係る本発明は、処理対象の画像データから文字画像である可能性があると判定されて切出された文字候補画像から、それぞれ異なる複数の画像特性に基づく特徴量を順次抽出する複数段の抽出手段と、
前記複数段の抽出手段とそれぞれ対応して設けられ、対応する抽出手段により抽出された特徴量に基づいて当該文字候補画像が文字画像である可能性または非文字画像である可能性を示す識別値を算出する算出手段と、前記算出手段により算出された識別値をそれぞれ画像特性毎に予め設定されたしきい値と比較する比較手段とを備え、前記比較手段における比較結果に基づいて当該文字候補画像が文字画像であるか非文字画像であるかまたは、文字画像であるか非文字画像であるか不明な不明画像であるかを識別する複数段の識別手段と、
前記複数段の識別手段のうちの少なくとも1つの識別手段により、当該文字候補画像が文字画像または非文字画像であると識別された場合、当該文字候補画像を文字画像または非文字画像であると判定する判定手段とを有し、
前記複数段の抽出手段は、それぞれ、前段の識別手段において当該文字候補画像が不明画像であると識別された場合に、設定された画像特性に基づく特徴量を抽出する文字画像識別装置である。
[Character image identification device]
According to the first aspect of the present invention, feature amounts based on a plurality of different image characteristics are sequentially extracted from a character candidate image that is determined to be a character image from image data to be processed and cut out. A multi-stage extraction means;
An identification value provided corresponding to each of the plurality of stages of extraction means, and indicating the possibility that the character candidate image is a character image or a non-character image based on the feature amount extracted by the corresponding extraction means And a comparison unit that compares the identification value calculated by the calculation unit with a threshold value set in advance for each image characteristic, and based on the comparison result in the comparison unit, the character candidate A plurality of stages of identifying means for identifying whether the image is a character image or a non-character image, or a character image, a non-character image, or an unknown unknown image;
When the character candidate image is identified as a character image or a non-character image by at least one of the plurality of stages of identification means, the character candidate image is determined to be a character image or a non-character image. Determination means for
Each of the plurality of stages of extraction means is a character image identification apparatus that extracts a feature amount based on the set image characteristics when the previous-stage identification means identifies the character candidate image as an unknown image .

請求項に係る本発明は、前記複数段の識別手段が、それぞれ、前段の識別手段における識別値と、現段の算出手段により算出された識別値を加算する加算手段をさらに備えた請求項記載の文字画像識別装置である。 According to a second aspect of the present invention, the plurality of stages of identification means further comprise addition means for adding the identification value in the preceding stage identification means and the identification value calculated by the current stage calculation means, respectively. The character image identification device according to claim 1 .

請求項に係る本発明は、前記算出手段が、当該特徴量に対する複数の文字画像および非文字画像の頻度分布に基づいて予め算出された識別関数を用いて、特徴量から識別値を算出する備えた請求項1または2記載の文字画像識別装置である。 According to a third aspect of the present invention, the calculation means calculates an identification value from the feature amount using an identification function calculated in advance based on the frequency distribution of a plurality of character images and non-character images for the feature amount. It is the character image identification device of Claim 1 or 2 provided.

請求項に係る本発明は、前記複数段の識別手段が、文字候補画像が文字画像か非文字画像であるかを識別する識別能力が高い識別手段ほど前段に配置されている請求項1からのいずれか1項記載の文字画像識別装置である。 According to a fourth aspect of the present invention, from the first aspect, the plurality of stages of identification means are arranged in a preceding stage as the identification means having a higher identification ability for identifying whether the character candidate image is a character image or a non-character image. 3 a character image identification apparatus according to any one of.

[文字画像識別方法]
請求項に係る本発明は、処理対象の画像データから文字画像である可能性があると判定されて切出された文字候補画像から、それぞれ異なる複数の画像特性に基づく特徴量を抽出するステップと、
抽出された特徴量に基づいて当該文字候補画像が文字画像である可能性または非文字画像である可能性を示す識別値を算出するステップと、
算出された識別値をそれぞれ画像特性毎に予め設定されたしきい値と比較するステップと、
しきい値との比較結果に基づいて当該文字候補画像が文字画像であるか非文字画像であるかまたは、文字画像であるか非文字画像であるか不明な不明画像であるかを識別するステップと、
当該文字候補画像が文字画像または非文字画像であると識別された場合、当該文字候補画像を文字画像または非文字画像であると判定し、当該文字候補画像が不明画像であると識別された場合には、特徴量を抽出するステップ、識別値を算出するステップおよびしきい値と比較するステップ、文字候補画像を識別するステップを再度繰り返すステップとを有する文字画像識別方法である。
[Character image identification method]
The present invention according to claim 5 is a step of extracting feature amounts based on a plurality of different image characteristics from character candidate images that have been determined to be character images from image data to be processed and cut out. When,
Calculating an identification value indicating the possibility that the character candidate image is a character image or a non-character image based on the extracted feature amount; and
Comparing the calculated identification value with a preset threshold value for each image characteristic;
Identifying whether the character candidate image is a character image, a non-character image, or a character image, a non-character image, or an unknown image based on a comparison result with a threshold value When,
When the character candidate image is identified as a character image or a non-character image, it is determined that the character candidate image is a character image or a non-character image, and the character candidate image is identified as an unknown image Includes a step of extracting a feature amount, a step of calculating an identification value, a step of comparing with a threshold value, and a step of repeating the step of identifying a character candidate image again.

[プログラム]
請求項に係る本発明は、処理対象の画像データから文字画像である可能性があると判定されて切出された文字候補画像から、それぞれ異なる複数の画像特性に基づく特徴量を抽出するステップと、
抽出された特徴量に基づいて当該文字候補画像が文字画像である可能性または非文字画像である可能性を示す識別値を算出するステップと、
算出された識別値をそれぞれ画像特性毎に予め設定されたしきい値と比較するステップと、
しきい値との比較結果に基づいて当該文字候補画像が文字画像であるか非文字画像であるかまたは、文字画像であるか非文字画像であるか不明な不明画像であるかを識別するステップと、
当該文字候補画像が文字画像または非文字画像であると識別された場合、当該文字候補画像を文字画像または非文字画像であると判定し、当該文字候補画像が不明画像であると識別された場合には、特徴量を抽出するステップ、識別値を算出するステップおよびしきい値と比較するステップ、文字候補画像を識別するステップを再度繰り返すステップとをコンピュータに実行させるためのプログラムである。
[program]
The present invention according to claim 6 is a step of extracting feature amounts based on a plurality of different image characteristics from character candidate images that are determined to be character images from image data to be processed and cut out. When,
Calculating an identification value indicating the possibility that the character candidate image is a character image or a non-character image based on the extracted feature amount; and
Comparing the calculated identification value with a preset threshold value for each image characteristic;
Identifying whether the character candidate image is a character image, a non-character image, or a character image, a non-character image, or an unknown image based on a comparison result with a threshold value When,
When the character candidate image is identified as a character image or a non-character image, it is determined that the character candidate image is a character image or a non-character image, and the character candidate image is identified as an unknown image Is a program for causing a computer to execute a step of extracting a feature amount, a step of calculating an identification value, a step of comparing with a threshold value, and a step of repeating a step of identifying a character candidate image again.

請求項1に係る本発明によれば、切り出された文字候補画像が文字画像か非文字画像であるかを、本構成を有しない場合と比較して、短時間で識別することが可能な文字画像識別装置を提供することができる。   According to the first aspect of the present invention, characters that can be identified in a short time compared with the case where the extracted character candidate image is a character image or a non-character image is not provided. An image identification device can be provided.

請求項に係る本発明によれば、請求項に係る本発明により得られる効果に加えて、前段までの識別結果を加味した識別処理を行うことが可能な文字画像識別装置を提供することができる。 According to the second aspect of the present invention, in addition to the effect obtained by the first aspect of the present invention, there is provided a character image identification device capable of performing identification processing taking into account the identification results up to the previous stage. Can do.

請求項に係る本発明によれば、請求項1または2に係る本発明により得られる効果に加えて、識別関数による計算により容易に識別値を算出することが可能な文字画像識別装置を提供することができる。 According to the third aspect of the present invention, in addition to the effect obtained by the first or second aspect of the present invention, there is provided a character image identification device capable of easily calculating an identification value by calculation using an identification function. can do.

請求項に係る本発明によれば、複数段の識別手段のうち早い段階で文字候補画像が文字画像か非文字画像かを判定することが可能な文字画像識別装置を提供することができる。 According to the fourth aspect of the present invention, it is possible to provide a character image identification device capable of determining whether a character candidate image is a character image or a non-character image at an early stage among a plurality of identification means.

請求項に係る本発明によれば、切り出された文字候補画像が文字画像か非文字画像であるかを、本構成を有しない場合と比較して、短時間で識別することが可能な文字画像識別方法を提供することができる。 According to the fifth aspect of the present invention, it is possible to identify whether the extracted character candidate image is a character image or a non-character image in a short time compared to the case where this configuration is not provided. An image identification method can be provided.

請求項に係る本発明によれば、切り出された文字候補画像が文字画像か非文字画像であるかを、本構成を有しない場合と比較して、短時間で識別することが可能なプログラムを提供することができる。

According to the sixth aspect of the present invention, a program capable of identifying in a short time whether the extracted character candidate image is a character image or a non-character image as compared with the case where the present configuration is not provided. Can be provided.

本発明の第1の実施形態における文字画像識別装置10のハードウェア構成を示すブロック図である。It is a block diagram which shows the hardware constitutions of the character image identification device 10 in the 1st Embodiment of this invention. 本発明の第1の実施形態における文字画像識別装置10の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the character image identification device 10 in the 1st Embodiment of this invention. 画像サイズ規格化部22における画像サイズ規格化の一例を説明した図である。It is a figure explaining an example of image size normalization in the image size normalization part. 特徴量抽出器311〜31Nの具体的な一例を説明する図である。It is a diagram illustrating a specific example of the feature extractor 31 1 to 31 N. 黒画素密度に対する文字画像ならびに非文字画像の頻度分布の具体例を表した図である。It is a figure showing the specific example of the frequency distribution of the character image with respect to black pixel density, and a non-character image. 黒画素周囲長に対する文字画像ならびに非文字画像の頻度分布の具体例を表した図である。It is a figure showing the specific example of the frequency distribution of the character image with respect to a black pixel perimeter, and a non-character image. 平均ラン長特徴量に対する文字画像ならびに非文字画像の頻度分布の具体例を表した図である。It is a figure showing the specific example of the frequency distribution of the character image with respect to an average run length feature-value, and a non-character image. 最大ラン長に対する文字画像ならびに非文字画像の頻度分布の具体例を表した図である。It is a figure showing the specific example of the frequency distribution of the character image with respect to the maximum run length, and a non-character image. 複雑度に対する文字画像ならびに非文字画像の頻度分布の具体例を表した図である。It is a figure showing the specific example of the frequency distribution of the character image with respect to complexity, and a non-character image. 連結成分数に対する文字画像ならびに非文字画像の頻度分布の具体例を表した図である。It is a figure showing the specific example of the frequency distribution of the character image with respect to the number of connected components, and a non-character image. 水平白黒変化点数に対する文字画像ならびに非文字画像の頻度分布の具体例を表した図である。It is a figure showing the specific example of the frequency distribution of the character image with respect to a horizontal black-and-white change score, and a non-character image. 垂直白黒変化点数に対する文字画像ならびに非文字画像の頻度分布の具体例を表した図である。It is a figure showing the specific example of the frequency distribution of the character image with respect to a vertical black-and-white change score, and a non-character image. 文字識別器321〜32Nの構成を説明するための図である。It is a diagram for explaining the structure of a character discriminator 32 1 to 32 N. 文字識別器321〜32Nにおける識別値算出部411〜41Nの動作を説明するための図である。It is a diagram for explaining the operation of the character discriminator 321 to 323 identified value of N calculating unit 41 1 to 41 N. 識別関数の設定方法を説明するための図である。It is a figure for demonstrating the setting method of an identification function. 比較器421〜42Nの動作を説明するための図である。It is a diagram for explaining the operation of the comparator 42 1 through 42 N. 最終段において1つのしきい値thNのみを用いる場合の比較器42Nの動作を説明するための図である。It is a figure for demonstrating operation | movement of the comparator 42 N when only one threshold value thN is used in the last stage. しきい値の設定方法を説明するための図である。It is a figure for demonstrating the setting method of a threshold value. 別の頻度分布においてしきい値の設定方法を説明するための図である。It is a figure for demonstrating the setting method of a threshold value in another frequency distribution. さらに別の頻度分布においてしきい値の設定方法を説明するための図である。It is a figure for demonstrating the setting method of a threshold value in another frequency distribution. 本発明の第1の実施形態の文字画像識別装置10における識別動作を説明するためのフローチャートである。It is a flowchart for demonstrating the identification operation | movement in the character image identification device 10 of the 1st Embodiment of this invention. 本発明の第2の実施形態における文字画像識別装置10aの機能構成を示すブロック図である。It is a block diagram which shows the function structure of the character image identification device 10a in the 2nd Embodiment of this invention. 本発明の第2の実施形態の文字画像識別装置10aにおける文字識別器1321〜132Nの構成を説明するための図である。It is a diagram for explaining the structure of a character classifier 132 1 to 132 N in the second embodiment of the character image identification apparatus 10a of the present invention.

次に、本発明の実施の形態について図面を参照して詳細に説明する。
[第1の実施形態]
図1は本発明の第1の実施形態の文字画像識別装置10のハードウェア構成を示す図である。
Next, embodiments of the present invention will be described in detail with reference to the drawings.
[First embodiment]
FIG. 1 is a diagram showing a hardware configuration of a character image identification device 10 according to the first embodiment of the present invention.

本実施形態の文字画像識別装置10は、図1に示されるように、CPU11、メモリ12、ハードディスクドライブ(HDD)等の記憶装置13、ネットワークを介して外部の装置等との間でデータの送信及び受信を行う通信インタフェース(IF)14、タッチパネル又は液晶ディスプレイ並びにキーボードを含むユーザインタフェース(UI)装置15を有する。これらの構成要素は、制御バス16を介して互いに接続されている。   As shown in FIG. 1, the character image identification device 10 of the present embodiment transmits data to and from a CPU 11, a memory 12, a storage device 13 such as a hard disk drive (HDD), and an external device via a network. And a communication interface (IF) 14 that performs reception, and a user interface (UI) device 15 including a touch panel or a liquid crystal display and a keyboard. These components are connected to each other via a control bus 16.

CPU11は、メモリ12または記憶装置13に格納された文字画像識別プログラムに基づいて所定の処理を実行して、文字画像識別装置10の動作を制御する。なお、本実施形態では、CPU11は、メモリ12または記憶装置13内に格納された文字画像識別装置プログラムを読み出して実行するものとして説明したが、当該プログラムをCD−ROM等の記憶媒体に格納してCPU11に提供することも可能である。   The CPU 11 controls the operation of the character image identification device 10 by executing a predetermined process based on the character image identification program stored in the memory 12 or the storage device 13. In the present embodiment, the CPU 11 has been described as reading and executing the character image identification device program stored in the memory 12 or the storage device 13, but the program is stored in a storage medium such as a CD-ROM. It is also possible to provide it to the CPU 11.

図2は、上記の文字画像識別プログラムが実行されることにより実現される文字画像識別装置10の機能構成を示すブロック図である。   FIG. 2 is a block diagram showing a functional configuration of the character image identification device 10 realized by executing the character image identification program.

本実施形態の文字画像識別装置10は、図2に示されるように、文字候補画像切出部21と、画像サイズ規格化部22と、N個の特徴量抽出器311〜31Nと、文字識別器321〜32Nと、判定器24とを備えている。 As shown in FIG. 2, the character image identification device 10 of the present embodiment includes a character candidate image cutout unit 21, an image size normalization unit 22, N feature quantity extractors 31 1 to 31 N , Character discriminators 32 1 to 32 N and a determiner 24 are provided.

以下、「特徴量抽出器311〜31N」など、複数存在しうる構成部分のいずれかを特定せずに示す場合には、単に「特徴量抽出器31」のように略記する場合がある。 Hereinafter, in the case where any one of a plurality of components that can exist such as “feature amount extractors 31 1 to 31 N ” is indicated without being specified, it may be simply abbreviated as “feature amount extractor 31”. .

本実施形態の文字画像識別装置10は、2値化された画像データ、文字認識を目的とした文字切出し処理を前提として、文字画像らしき画像であるとして切出された画像(以下、文字候補画像と呼ぶ。)が文字画像か非文字画像かを識別する。   The character image identification device 10 of the present embodiment is based on binarized image data and an image cut out as an image that appears to be a character image on the premise of character extraction processing for character recognition (hereinafter referred to as a character candidate image). Is called a character image or a non-character image.

文字候補画像切出部21は、処理対象の画像データから文字画像である可能性があると判定された領域の画像を文字候補画像として切出す。   The character candidate image cutout unit 21 cuts out an image of an area determined to be a character image from the image data to be processed as a character candidate image.

文字切出し技術に関しては、様々な方法が提案されており、本実施形態ではそのうちどれか1つの方法を用いればよい。例えば以下のような文献に開示されている技術が存在する。
特開平5−114047号公報
特開平4−100189号公報
特開平4−92992号公報
特開平4−68481号公報
特開平9−54814号公報
特開平9−185681号公報における段落[0021]に記載の文字の境界候補抽出方式
特開平5−128308号公報における段落[0005]に記載の文字切り出し位置決定方式
なお、当然ながら文字候補画像を切り出し可能な技術であれば、上記の文献に開示された方法以外の方法を用いてもよい。
Various methods have been proposed for the character cutting technique, and any one of them may be used in the present embodiment. For example, there are techniques disclosed in the following documents.
JP-A-5-114047 JP-A-4-100189 JP-A-4-92992 JP-A-4-68481 JP-A-9-54814 JP-A-9-185681 Paragraph [0021] Character boundary candidate extraction method Character cutting position determination method described in paragraph [0005] of Japanese Patent Laid-Open No. Hei 5-128308 It should be noted that, as a matter of course, any technique that can cut out a character candidate image can be used. Other methods may be used.

画像サイズ規格化部22は、文字候補画像切出部21により切出された文字候補画像の大きさを、特徴量抽出器311〜31Nならびに文字識別期321〜32Nの処理に必要な所定のサイズに規格化する。 The image size normalization unit 22 uses the size of the character candidate image cut out by the character candidate image cutout unit 21 for processing in the feature quantity extractors 31 1 to 31 N and the character identification periods 32 1 to 32 N. Standardize to a certain size.

図3は画像サイズ規格化部22における画像サイズ規格化の一例を説明した図である。文書画像を2値化して文字切出し技術で切出される文字候補画像は、文書画像中に含まれる多様な文字サイズ、不正な文字切出し位置、さらには文書画像中に含まれる写真や線画領域の不正切出しなどの影響でさまざまな大きさとなる。例えば図3(A)は異なる文字サイズ、図3(B)は不正な切出し位置、図3(C)は写真や線画領域の不正切出しの例である。画像サイズ規格化部22はこのようなさまざまな大きさで入力される文字候補画像を、図3(A)、図3(B)、図3(C)で示すように一様な大きさに規格化する。規格化するサイズは例えば64×64画素サイズなどである。もちろん正方形サイズに規格化するだけに限らず、同サイズに規格化するのであれば長方形になるように規格化してもよい。   FIG. 3 is a diagram for explaining an example of image size normalization in the image size normalization unit 22. Character candidate images that are extracted by binarizing the document image and extracted by the character extraction technology are various character sizes included in the document image, illegal character extraction positions, and illegal images and line drawing areas included in the document image. It becomes various sizes under the influence of cutting out. For example, FIG. 3A shows a different character size, FIG. 3B shows an example of an illegal cutout position, and FIG. 3C shows an example of an illegal cutout of a photograph or a line drawing area. The image size normalization unit 22 converts the character candidate images input in such various sizes into uniform sizes as shown in FIGS. 3 (A), 3 (B), and 3 (C). Standardize. The standardized size is, for example, a 64 × 64 pixel size. Of course, not only normalization to the square size, but also normalization to a rectangle may be used if normalization to the same size is performed.

特徴量抽出器311〜31Nは、複数段に構成され、画像サイズ規格化部22により規格化された文字候補画像から、それぞれ異なる複数の画像特性に基づく特徴量を順次抽出する。 The feature amount extractors 31 1 to 31 N are configured in a plurality of stages, and sequentially extract feature amounts based on a plurality of different image characteristics from the character candidate images normalized by the image size normalization unit 22.

なお、文字識別器321〜32Nも複数段に構成されており、特徴量抽出器311〜31Nと文字識別器321〜32Nは、それぞれ1対1で対応して設けられている。そのため、1つの特徴量抽出器31と1つの文字識別器32の組により1つの段が構成されているものとして説明する。例えば、特徴量抽出器311や文字識別器321は、特徴量抽出器312および文字識別器322の前段に構成されており、特徴量抽出器313や文字識別器323は、特徴量抽出器312および文字識別器322の後段に構成されている。 The character identifiers 32 1 to 32 N are also configured in a plurality of stages, and the feature quantity extractors 31 1 to 31 N and the character identifiers 32 1 to 32 N are provided in a one-to-one correspondence. Yes. Therefore, description will be made assuming that one stage is constituted by a set of one feature quantity extractor 31 and one character classifier 32. For example, the feature quantity extractor 31 1 and the character classifier 32 1 are arranged in front of the feature quantity extractor 31 2 and the character classifier 32 2 , and the feature quantity extractor 31 3 and the character classifier 32 3 are The feature amount extractor 31 2 and the character identifier 32 2 are arranged at the subsequent stage.

図4は特徴量抽出器311〜31Nの具体的な一例を説明する図である。図4に示すように、例えば文字識別器321が識別判断に黒画素密度を用いる場合、その特徴量を抽出する特徴量抽出器311は黒画素密度抽出器311として機能し、文字候補画像から特徴量として下記の式(1)で示す黒画素密度Dbを算出して文字識別器321に出力する。 FIG. 4 is a diagram illustrating a specific example of the feature quantity extractors 31 1 to 31 N. As shown in FIG. 4, for example, when the character discriminator 32 1 uses the black pixel density for discrimination judgment, the feature amount extractor 31 1 that extracts the feature amount functions as the black pixel density extractor 31 1 , and character candidates A black pixel density Db represented by the following equation (1) is calculated from the image as a feature quantity and output to the character classifier 32 1 .

Db=文字候補画像中の黒画素数/文字候補画像面積 ・・・・・ (1)   Db = number of black pixels in the character candidate image / character candidate image area (1)

また、文字識別器322が識別判断に黒画素周囲長を用いる場合、同様にその特徴量を抽出する特徴量抽出器312は黒画素周囲長抽出器312として機能し、文字候補画像から特徴量として黒画素周囲長Laを算出して文字識別器322に出力する。 Also, if the character discriminator 32 2 uses a black pixel perimeter identification decision, the feature quantity extractor 31 2 for extracting the characteristic amount similarly functions as a black pixel perimeter extractor 31 2, from the character candidate image The black pixel perimeter La is calculated as the feature amount and output to the character discriminator 32 2 .

同様に、文字識別器323〜326が、それぞれ識別判断に0度方向黒画素平均ラン長、45度方向黒画素平均ラン長、90度方向黒画素平均ラン長、135度方向黒画素平均ラン長を用いる場合、特徴量抽出器313〜316は、それぞれ、0度方向黒画素平均ラン長抽出器313、45度方向黒画素平均ラン長抽出器314、90度方向黒画素平均ラン長抽出器315、135度方向黒画素平均ラン長抽出器316として機能する。 Similarly, the character classifiers 32 3 to 32 6 use the 0-degree direction black pixel average run length, the 45-degree direction black pixel average run length, the 90-degree direction black pixel average run length, and the 135-degree direction black pixel average, respectively, for identification determination. When the run length is used, the feature quantity extractors 31 3 to 31 6 respectively include a 0 degree direction black pixel average run length extractor 31 3 , a 45 degree direction black pixel average run length extractor 31 4 , and a 90 degree direction black pixel. The average run length extractor 31 5 functions as a 135-degree direction black pixel average run length extractor 31 6 .

そして、この場合には、0度方向黒画素平均ラン長抽出器313は特徴量として0度方向黒画素平均ラン長L0を文字識別器323に出力し、45度方向黒画素平均ラン長抽出器314は特徴量として45度方向黒画素平均ラン長L45を文字識別器324に出力する。また、90度方向黒画素平均ラン長抽出器315は特徴量として90度方向黒画素平均ラン長L90を文字識別器325に出力し、135度方向黒画素平均ラン長抽出器316は特徴量として135度方向黒画素平均ラン長L135を文字識別器326に出力する。 In this case, the 0 degree direction black pixel average run length extractor 31 3 outputs the 0 degree direction black pixel average run length L 0 to the character identifier 32 3 as the feature quantity, and the 45 degree direction black pixel average run length L 3 is output. The length extractor 31 4 outputs the 45-degree direction black pixel average run length L 45 as a feature quantity to the character identifier 32 4 . Further, 90-degree direction black pixel average run length extractor 31 5 outputs the 90-degree direction black pixel average run length L 90 as the feature amount on the character discriminator 32 5, 135-degree direction black pixel average run length extractor 31 6 outputs the 135-degree direction black pixel average run length L 135 as features in the character discriminator 32 6.

以上説明したように、特徴量抽出器31は文字識別器32が識別判断に用いる画像特性に基づく特徴量の数だけ構成されている。   As described above, the feature quantity extractors 31 are configured by the number of feature quantities based on the image characteristics used by the character classifier 32 for discrimination determination.

したがって、特徴量抽出器31は図4に示したような特徴量を抽出するものだけに限定されるものではなく、入力される2値化された文字候補画像からさまざまな特徴量を抽出するよう構成することが可能である。例えば以下に示すような特徴量抽出器を適用することが可能である。   Therefore, the feature quantity extractor 31 is not limited to the one that extracts the feature quantity as shown in FIG. 4, but various feature quantities are extracted from the input binarized character candidate images. It is possible to configure. For example, a feature quantity extractor as shown below can be applied.

(1)最大ラン長抽出器(0度、45度、90度、135度の各方向)
(2)複雑度抽出器
(3)連結成分数抽出器53
(4)0度方向(水平方向)黒白変化点数抽出器
(5)90度方向(垂直方向)黒白変化点数抽出器
(1) Maximum run length extractor (0 degree, 45 degree, 90 degree, 135 degree directions)
(2) Complexity extractor (3) Connected component number extractor 53
(4) 0 degree direction (horizontal direction) black and white change point extractor (5) 90 degree direction (vertical direction) black and white change point extractor

ここで、(1)最大ラン長抽出器は、各方向独立の特徴量抽出器であり、各方向の最大ラン長を算出する。   Here, (1) the maximum run length extractor is a feature quantity extractor independent of each direction, and calculates the maximum run length in each direction.

(2)複雑度抽出器は、複雑度を算出する。複雑度Cは、例えば以下の式(2)で算出される。
C=(周囲長)2 /黒画素数 ・・・・・ (2)
(2) The complexity extractor calculates the complexity. The complexity C is calculated by the following equation (2), for example.
C = (perimeter) 2 / number of black pixels (2)

(3)連結成分抽出器は、文字候補画像中の独立した連結成分数を算出する。例えば、文字「あ」なら1、文字「い」なら2である。   (3) The connected component extractor calculates the number of independent connected components in the character candidate image. For example, 1 for the character “A” and 2 for the character “I”.

(4)0度方向黒白変化点抽出器は、例えば文字候補画像中における0度方向(水平方向あるいは主走査方向)の黒画素から白画素へ変わる回数の総和を算出する。   (4) The 0-degree direction black-and-white change point extractor calculates, for example, the total number of times of changing from black pixels to white pixels in the 0-degree direction (horizontal direction or main scanning direction) in the character candidate image.

(5)90度方向黒白変化点抽出器は、例えば文字候補画像中における90度方向(垂直方向あるいは副走査方向)の黒画素から白画素へ変わる回数の総和を算出する。   (5) The 90-degree direction black-and-white change point extractor calculates, for example, the total number of times of changing from black pixels to white pixels in the 90-degree direction (vertical direction or sub-scanning direction) in the character candidate image.

以上説明したように、特徴量抽出器31は2値化された文字候補画像から複数の画像特性の異なる特徴量を抽出するが、抽出される各特徴量の値の範囲(値域)は異なるので、例えば抽出される実数値の特徴量xに対して、(0≦x≦127)の範囲や(0≦x≦1)の範囲で値の正規化を行い、値域を揃えて各特徴量抽出器31により出力される特徴量を同様に扱えるようにする。   As described above, the feature quantity extractor 31 extracts a plurality of feature quantities having different image characteristics from the binarized character candidate images, but the range (value range) of the extracted feature quantities is different. For example, the extracted feature value x of the real value is normalized in the range of (0 ≦ x ≦ 127) or in the range of (0 ≦ x ≦ 1), and each feature amount is extracted by aligning the range. The feature amount output by the device 31 can be handled in the same manner.

ここまで特徴量抽出器31で抽出される特徴量の具体例を説明してきたが、ここで特徴量抽出器31においてどのような特徴量を文字識別のための特徴量として利用するかについて説明する。   The specific example of the feature amount extracted by the feature amount extractor 31 has been described so far. Here, what feature amount is used as the feature amount for character identification in the feature amount extractor 31 will be described. .

図5、図6、図7は、上記で説明した黒画素密度、黒画素周囲長、平均ラン長に対する文字画像ならびに非文字画像の頻度分布の具体例を表した図である。ここで図5、図6、図7において、横軸は各特徴量を(0≦x≦127)の範囲で正規化した値を表し、縦軸は文字画像ならびに非文字画像の個数に相当する値であり、文字画像総数をN、非文字画像総数をMとした場合に、文字画像から抽出した特徴量なら1/2N、非文字画像から抽出した特徴量なら1/2Mを個数の計数単位として表している。   5, 6, and 7 are diagrams illustrating specific examples of the frequency distribution of the character image and the non-character image with respect to the black pixel density, the black pixel perimeter, and the average run length described above. Here, in FIGS. 5, 6, and 7, the horizontal axis represents a value obtained by normalizing each feature amount in a range of (0 ≦ x ≦ 127), and the vertical axis corresponds to the number of character images and non-character images. If the total number of character images is N and the total number of non-character images is M, 1 / 2N if the feature amount is extracted from the character image, and 1 / 2M if the feature amount is extracted from the non-character image. It represents as.

図5、図6、図7を参照すると分かるように、黒画素密度、黒画素周囲長、平均ラン長のいずれの特徴量においても、文字画像と非文字画像とでは異なる頻度分布を表していることが分かる。つまり文字画像分布と非文字画像分布は異なる分布の山を有しており、これら特徴量に対して所定の閾値を用いることで文字、非文字を識別可能であることが分かる。   As can be seen from FIGS. 5, 6, and 7, the character image and the non-character image represent different frequency distributions in any of the feature amounts of black pixel density, black pixel perimeter, and average run length. I understand that. That is, it can be seen that the character image distribution and the non-character image distribution have different distribution peaks, and it is possible to identify characters and non-characters by using a predetermined threshold for these feature values.

さらに同様に、これまでに説明した別の特徴量である最大ラン長、複雑度、連結成分数、水平白黒変化点数、垂直白黒変化点数についても、図8〜図12に文字ならびに非文字画像の頻度分布の具体例を示すように、文字画像と非文字画像とでは異なる頻度分布を表しているが分かる。   Similarly, the maximum run length, complexity, number of connected components, horizontal black-and-white change points, and vertical black-and-white change points, which are other feature quantities described so far, are also shown in FIGS. As shown in a specific example of the frequency distribution, it can be seen that the character image and the non-character image represent different frequency distributions.

つまり、文字候補画像が文字画像か非文字画像であるかを判定する際には、文字画像ならびに非文字画像の頻度分布が異なる分布を表すような特徴量を選択するようにして、それらの特徴量を抽出する複数の特徴量抽出器31を構成するようにするとよい。   In other words, when determining whether a character candidate image is a character image or a non-character image, the feature amount is selected so that the frequency distribution of the character image and the non-character image represents different distributions. A plurality of feature quantity extractors 31 for extracting quantities may be configured.

また、各文字識別器321〜32Nは、上述したように、それぞれ異なる画像特性に基づく特徴量に基づいて、文字候補画像が文字画像であるか非文字画像であるかの文字画像識別を行う。 Further, as described above, each of the character identifiers 32 1 to 32 N performs character image identification as to whether the character candidate image is a character image or a non-character image based on feature amounts based on different image characteristics. Do.

そして、判定器24は、N個の文字識別器321〜32Nのうちの少なくとも1つの文字識別器により、文字候補画像が文字画像または非文字画像であると識別された場合、その文字候補画像を文字画像または非文字画像であると最終的に判定する。 When the character candidate image is identified as a character image or a non-character image by at least one character identifier among the N character identifiers 32 1 to 32 N , the determiner 24 selects the character candidate. The image is finally determined to be a character image or a non-character image.

次に、この文字識別器321〜32Nの構成を図13を参照して説明する。
図13に示されるように、文字識別器321は、識別値算出部411と、比較器421とから構成されている。また、文字識別器322は、識別値算出部412と、比較器422と、加算器432とから構成されている。同様に、文字識別器323〜32Nは、それぞれ、識別値算出部413〜41Nと、比較器423〜42Nと、加算器433と〜43Nとから構成されている。
Next, the configuration of the character discriminators 32 1 to 32 N will be described with reference to FIG.
As shown in FIG. 13, the character classifier 32 1 includes an identification value calculation unit 41 1 and a comparator 42 1 . The character identifier 32 2 includes an identification value calculator 41 2 , a comparator 42 2, and an adder 43 2 . Similarly, the character discriminators 32 3 to 32 N are configured by discrimination value calculation units 41 3 to 41 N , comparators 42 3 to 42 N , and adders 43 3 to 43 N , respectively.

識別値算出部411〜41Nは、対応する特徴量抽出器311〜31Nから抽出された特徴量に基づいて、識別値y1〜yNをそれぞれ算出して出力する。この識別値y1〜yNは、当該文字候補画像が文字画像である可能性または非文字画像である可能性を示す値であり、詳細については後述する。 The identification value calculation units 41 1 to 41 N calculate and output the identification values y1 to yN based on the feature amounts extracted from the corresponding feature amount extractors 31 1 to 31 N , respectively. The identification values y1 to yN are values indicating the possibility that the character candidate image is a character image or a non-character image, and details thereof will be described later.

加算器433と〜43Nは、それぞれ、前段の文字識別器321〜32N-1の比較器421〜42N-1に入力される識別値Y1〜Y(N−1)と、同じ文字識別器322〜32N内に設けられている現段の識別値算出部412〜41Nにより算出された識別値y2〜yNとをそれぞれ加算して、識別値Y2〜YNとして比較器422〜42Nに出力する。 Adder 43 3 and ~ 43 N, respectively, and a previous character discriminator 32 1 ~32 N-1 comparators 42 1 ~42 N-1 identification value is input to Y1~Y (N-1), The identification values y2 to yN calculated by the identification value calculation units 41 2 to 41 N of the current stage provided in the same character identifiers 32 2 to 32 N are added and compared as identification values Y2 to YN. Outputs to devices 42 2 to 42 N.

なお、先頭の文字識別器321においては、前段の文字識別器は存在しないため、識別値算出部411において算出された識別値y1がそのまま識別値Y1として比較器421に出力される。 In the first character discriminator 32 1 , the preceding character discriminator does not exist, and therefore, the discrimination value y 1 calculated by the discrimination value calculation unit 41 1 is directly output to the comparator 42 1 as the discrimination value Y 1 .

つまり、ある比較器42に入力される識別値は、それよりも前段における全ての識別値を累積した値となり、例えば、比較器422に入力される識別値Y2は、y1とy2を加算した値であり、比較器423に入力される識別値Y3は、y1、y2、y3を加算した値となっている。 That is, the identification value inputted to the comparator 42 with, it all the identification values becomes a value obtained by accumulating in front than, for example, the identification value Y2 which is input to the comparator 42 2 was added to y1 and y2 a value, identification value Y3 input to the comparator 42 3 is a value obtained by adding the y1, y2, y3.

そして、比較器421〜42Nは、それぞれ、入力された識別値Y1〜YNを、それぞれ画像特性毎に予め設定されたしきい値と比較する。その結果、文字識別器321〜32Nは、この比較器421〜42Nにおける比較結果により、文字候補画像を3通りに識別する。つまり、文字識別器321〜32Nは、文字候補画像が、文字画像か、非文字画像か、不明画像かを識別する。ここで文字画像もしくは非文字画像と識別された場合には、識別結果を出力して現文字候補画像に対する識別動作はここで終了する。なお、比較器421〜42N-1において、文字候補画像が文字画像か非文字画像であるか不明であると判定された場合、その結果は次段の特徴量抽出器322〜32Nに通知される。 Then, the comparators 42 1 to 42 N respectively compare the input identification values Y1 to YN with threshold values set in advance for each image characteristic. As a result, the character identifiers 32 1 to 32 N identify the character candidate images in three ways based on the comparison results in the comparators 42 1 to 42 N. That is, the character identifiers 32 1 to 32 N identify whether the character candidate image is a character image, a non-character image, or an unknown image. If the character image or non-character image is identified, the identification result is output and the identification operation for the current character candidate image ends here. When the comparators 42 1 to 42 N-1 determine that the character candidate image is a character image or a non-character image, it is determined that the result is a feature quantity extractor 32 2 to 32 N in the next stage. Will be notified.

そして、特徴量抽出器322〜32Nは、前段の文字識別処理において文字候補画像が文字画像であるか否かが不明である場合に初めて、文字候補画像から設定された特徴量を抽出する。 The feature quantity extractors 32 2 to 32 N extract the feature quantity set from the character candidate image only when it is unclear whether the character candidate image is a character image in the preceding character identification process. .

つまり、文字識別器321〜32Nは、順次文字候補画像の識別処理を行って文字候補画像が文字画像か否か、または不明であるかの識別を行い、現段での識別処理において不明である場合に次段での識別処理が行われる。 That is, the character discriminators 32 1 to 32 N sequentially identify the character candidate images to identify whether the character candidate images are character images or are unknown, and are unknown in the current identification process. If it is, the identification process in the next stage is performed.

ただし、最終段の文字識別器32Nでは、文字画像か非文字画像であるか不明と識別された画像に対して、文字画像識別装置10の用途、要求精度などを考慮して文字画像と識別するように動作させてもよいし、非文字画像と識別するように動作させてもよい。 However, the character identifier 32 N at the last stage identifies the character image or non-character image from the character image in consideration of the use of the character image identification device 10, the required accuracy, etc. You may operate | move so that it may perform, and you may operate | move so that it may identify with a non-character image.

このように各文字識別器321〜32Nでは、前段の文字識別器32において不明であると判定された場合にのみ、後段の文字識別器32において識別動作が行われる。そして、文字識別器321〜32Nでは、ある段階で文字画像か否かが確定すると、その時点で識別処理を終了する。つまり、本実施形態の文字画像識別装置10では、入力された文字候補画像に対して、識別が容易な文字候補画像に関しては文字/非文字の判断をできるだけ前段の文字識別器32で確定し、識別が難しい文字候補画像に関しては多くの文字識別器32の判断に基づいて識別を行うように動作する。 As described above, in each of the character classifiers 32 1 to 32 N , the classification operation is performed in the subsequent-stage character classifier 32 only when it is determined that the previous-stage character classifier 32 is unknown. When the character classifiers 32 1 to 32 N determine whether or not the image is a character image at a certain stage, the identification process is terminated at that point. In other words, in the character image identification device 10 of the present embodiment, for the input character candidate image, for the character candidate image that is easy to identify, the character / non-character determination is determined by the character identifier 32 at the previous stage as much as possible. For character candidate images that are difficult to identify, the operation is performed so as to perform identification based on the judgment of many character classifiers 32.

次に、文字識別器321〜32Nにおける識別値算出部411〜41Nの動作を図14を参照して説明する。
図14は識別値算出部411〜41Nの動作を模式的に表したものである。図14に示すように、識別値算出部411〜41Nは特徴量抽出器31i(i=1〜N)からの出力xiを入力し、識別値算出部411〜41N毎に設定された識別関数f(x)にしたがって識別値yiを出力する。ここで識別関数f(x)は以下の式(3)で表される1入力1出力関数である。
Next, the operation of the identification value calculation units 41 1 to 41 N in the character identifiers 32 1 to 32 N will be described with reference to FIG.
FIG. 14 schematically shows the operation of the identification value calculation units 41 1 to 41 N. As illustrated in FIG. 14, the identification value calculation units 41 1 to 41 N receive the output xi from the feature quantity extractor 31 i (i = 1 to N), and are set for each of the identification value calculation units 41 1 to 41 N. The discriminant value yi is output according to the discriminated discriminant function f (x). Here, the discriminant function f (x) is a one-input one-output function expressed by the following equation (3).

y=f(x) ・・・・(3)     y = f (x) (3)

つまり特徴量抽出器31iからの出力である特徴量xiに対して、式(3)にしたがって一意に識別値yiが出力される。 That is, the identification value yi is uniquely output according to the equation (3) for the feature quantity xi that is the output from the feature quantity extractor 31 i .

ここである特定の特徴量抽出器31から抽出される特徴量に対する文字画像ならびに非文字画像の分布が図15(A)で表されるような場合を考える。例えば、先に説明した図5〜図9および図11に具体例を示した黒画素密度、黒画素周囲長、平均ラン長、最大ラン長、複雑度、および水平白黒変化点数の場合である。   Consider a case where the distribution of the character image and the non-character image corresponding to the feature amount extracted from the specific feature amount extractor 31 is represented in FIG. For example, this is the case of the black pixel density, the black pixel perimeter, the average run length, the maximum run length, the complexity, and the horizontal black-and-white change points shown in the specific examples in FIGS. 5 to 9 and 11 described above.

図15(A)に示すような分布はあらかじめ多数の文字画像および非文字画像に対して特定の特徴量を抽出して、抽出した特徴量に対する文字および非文字画像のヒストグラムを生成することで得られる。図15(A)で示す例では特徴量xは(0≦x≦127)で値の正規化が行われている。このような分布が得られる前提において各識別値算出部41iに設定されている識別関数y=f(x)は以下の式(4)で表される関数で設定する。 A distribution as shown in FIG. 15A is obtained by extracting specific feature amounts from a large number of character images and non-character images in advance and generating histograms of characters and non-character images for the extracted feature amounts. It is done. In the example shown in FIG. 15A, the feature amount x is (0 ≦ x ≦ 127) and the value is normalized. On the premise that such a distribution is obtained, the discrimination function y = f (x) set in each discrimination value calculation unit 41 i is set by a function represented by the following equation (4).

y=(文字画像分布(x)−非文字画像分布(x))÷(文字画像分布(x)+非文字画像分布(x))・・・(4)   y = (character image distribution (x) −non-character image distribution (x)) ÷ (character image distribution (x) + non-character image distribution (x)) (4)

なお、この式(4)において文字画像分布(x)とは特徴量xに対応する文字画像の個数であり、非文字画像分布(x)とは特徴量xに対応する非文字画像の個数である。   In this equation (4), the character image distribution (x) is the number of character images corresponding to the feature quantity x, and the non-character image distribution (x) is the number of non-character images corresponding to the feature quantity x. is there.

このようにして設定された識別関数f(x)を図示したものを図15(B)に示す。図15(B)で示すように式(4)で設定される識別関数y=f(x)は特徴量x(0≦x≦127)の範囲で、値域(−1≦y≦1)を取る関数であり、図7において文字画像分布の下限値x0、非文字画像分布の上限値x1とすると、識別値yの値は下記の式のようになる。
y= 1 (x>x1)
=−1 (x<x0)
FIG. 15B shows the discrimination function f (x) set in this way. As shown in FIG. 15B, the discriminant function y = f (x) set by the equation (4) is in the range of the feature quantity x (0 ≦ x ≦ 127), and the value range (−1 ≦ y ≦ 1). Assuming that the lower limit value x0 of the character image distribution and the upper limit value x1 of the non-character image distribution in FIG. 7, the value of the identification value y is as shown in the following equation.
y = 1 (x> x1)
= -1 (x <x0)

このように図15(B)に示すような識別関数y=f(x)を設定することで特徴量抽出器31iからの出力される特徴量に対して一意の識別値yiが得られる。 Thus, by setting the discrimination function y = f (x) as shown in FIG. 15B, a unique discrimination value yi is obtained for the feature quantity output from the feature quantity extractor 31 i .

次に、識別値算出部41iから出力された識別値yiに基づく識別処理の詳細について説明する。 Next, details of the identification process based on the identification value yi output from the identification value calculation unit 41 i will be described.

比較器421〜42Nでは、識別値算出部411〜41Nから出力され加算器432〜43Nにより足し合わされた識別値y1〜yNに対して複数のしきい値、具体的には2つのしきい値th(L)、th(H)を用いて文字候補画像が文字画像か、非文字画像か、あるいは文字画像が非文字画像であるかを識別できない不明画像なのかの3通りの判断を行う。なお2つのしきい値th(L)、th(H)は、文字候補画像の識別処理とは別にあらかじめ設定しておくことが望ましい。 In the comparators 42 1 to 42 N , a plurality of threshold values, specifically to the identification values y1 to yN output from the identification value calculation units 41 1 to 41 N and added by the adders 43 2 to 43 N , specifically, There are three ways of determining whether a character candidate image is a character image, a non-character image, or a character image is a non-character image using two threshold values th (L) and th (H). Make a decision. The two threshold values th (L) and th (H) are preferably set in advance separately from the character candidate image identification process.

具体的には、図16に示すように、比較器421〜42Nには、それぞれ値の異なる2つのしきい値th(L)、th(H)が設定されており、th(L)<th(H)となっている。そして、例えば比較器421に設定されている2つのしきい値のうち値の大きな方をth1(H)として表記し、値の小さい方をth1(L)として表記する。 Specifically, as shown in FIG. 16, two threshold values th (L) and th (H) having different values are set in the comparators 42 1 to 42 N , respectively, and th (L) <Th (H). For example, the larger one of the two threshold values set in the comparator 42 1 is expressed as th1 (H), and the smaller value is expressed as th1 (L).

そして、比較器421〜42Nは、入力された識別値Yiと、2つのしきい値thi(L)、thi(H)とを比較することにより、文字候補画像が文字画像であるか非文字画像であるか、あるいは不明であるかを識別する。 Then, the comparators 42 1 to 42 N compare the input identification value Yi with the two threshold values thi (L) and thi (H) to determine whether the character candidate image is a character image. Identify whether it is a character image or unknown.

具体的には、比較器421〜42Nは、入力された識別値Yiと上述した2つのしきい値thi(L)、thi(H)を用いて以下のように文字候補画像を3タイプに識別する。(i=1〜N)
文字画像 (thi(H)≦Yi)
非文字画像 (Yi≦thi(L))
不明画像 (thi(L)<Yi<thi(H))
Specifically, the comparators 42 1 to 42 N use the input identification value Yi and the two threshold values thi (L) and thi (H) described above to generate three types of character candidate images as follows. To identify. (I = 1 to N)
Character image (thi (H) ≦ Yi)
Non-character image (Yi ≦ thi (L))
Unknown image (thi (L) <Yi <thi (H))

なお、最終段の文字識別器32Nでの識別結果は「非文字」、「文字」の2通りになるように、図17に示すように、比較器42Nにおいて用いられるしきい値を、しきい値thNの1つだけ設定するように構成して「非文字」および「文字」のいずれかに必ず識別されるようにしてもよい。 As shown in FIG. 17, the threshold value used in the comparator 42 N is set so that there are two classification results of “non-character” and “character” in the final-stage character classifier 32 N. Only one threshold value thN may be set so as to be identified as either “non-character” or “character”.

次に、上述したしきい値th(L)、th(H)の設定方法について説明する。   Next, a method for setting the threshold values th (L) and th (H) will be described.

2つのしきい値th(L)、th(H)それぞれは各識別値算出部41毎に設定された識別関数y=f(x)に基づいて決定される。図18にしきい値の設定の具体的な一例を示す。図18(B)に示す具体例では、特徴量x2および特徴量x3における識別関数y=f(x)の出力値を、それぞれしきい値th(L)およびth(H)として設定している。ここで特徴量x2および特徴量x3の決定方法の具体例としては、例えば、文字画像分布における下位5%の個数を含む境界特徴量を特徴量x2とし、非文字画像分布における上位5%の個数を含む境界特徴量を特徴量x3とするような方法が挙げられる。ただし、このような方法に限定されるものではなく文字画像識別装置10の用途、または要求精度などにより境界特徴量x2およびx3の決定方法は変更されてもよい。   Each of the two threshold values th (L) and th (H) is determined based on an identification function y = f (x) set for each identification value calculation unit 41. FIG. 18 shows a specific example of threshold setting. In the specific example shown in FIG. 18B, the output values of the discrimination function y = f (x) in the feature quantity x2 and the feature quantity x3 are set as threshold values th (L) and th (H), respectively. . Here, as a specific example of the determination method of the feature amount x2 and the feature amount x3, for example, the boundary feature amount including the lower 5% number in the character image distribution is set as the feature amount x2, and the upper 5% number in the non-character image distribution. A method in which the boundary feature amount including the feature amount x3 is used. However, the method is not limited to such a method, and the determination method of the boundary feature amounts x2 and x3 may be changed depending on the use of the character image identification device 10 or the required accuracy.

また簡単な決定方法としては、下記のように特徴量x2を文字画像分布の下限値、特徴量x3を非文字画像分布の上限値としてもよい。
x2=x0
x3=x1
As a simple determination method, the feature amount x2 may be the lower limit value of the character image distribution and the feature amount x3 may be the upper limit value of the non-character image distribution as described below.
x2 = x0
x3 = x1

図18に示したしきい値設定の具体的な一例は、ある特定の特徴量に対する文字画像および非文字画像の分布が図18(A)で表されるような場合を前提としての例であったが、特徴量に対する文字画像および非文字画像の分布は図18(A)で表されるような場合だけではない。   A specific example of the threshold setting shown in FIG. 18 is an example on the assumption that the distribution of character images and non-character images for a specific feature amount is represented in FIG. However, the distribution of the character image and the non-character image with respect to the feature amount is not limited to the case shown in FIG.

そのため、文字画像および非文字画像の分布が図18(A)とは異なる場合にしきい値を設定する具体的な方法を図19を参照して説明する。
図19(A)は、例えば図10に示した連結成分数を特徴量とした場合の、文字ならびに非文字画像の頻度分布の場合である。図19(A)では、文字画像分布が値の大きい特徴量の範囲に局在分布しており、さらに文字画像分布が非文字画像分布にほぼ包含されている。ここでx0は文字画像分布の下限値である。
Therefore, a specific method for setting the threshold when the distribution of the character image and the non-character image is different from that in FIG. 18A will be described with reference to FIG.
FIG. 19A shows the frequency distribution of characters and non-character images when the number of connected components shown in FIG. In FIG. 19A, the character image distribution is localized in the feature value range having a large value, and the character image distribution is substantially included in the non-character image distribution. Here, x0 is a lower limit value of the character image distribution.

図19(B)は、図19(A)に示した文字および非文字画像分布に対して、上記の式(4)で表される関数により設定される識別関数と、設定されるしきい値th(L)およびth(H)を図示したものである。図19(B)に図示されたしきい値th(L)およびth(H)の設定方法は、しきい値th(L)においては、例えば文字画像分布における上位および下位5%の個数を含む境界特徴量x1およびx2を決定し、その境界特徴量x1、x2に対する関数値をしきい値th(L)およびしきい値th(H)とする。また簡単な決定方法としては、下記のように特徴量x2を文字画像分布の下限値、特徴量x3を特徴量最大値としてもよい。
x1=x0
x2=127
FIG. 19B shows an identification function set by the function represented by the above formula (4) and a threshold value set for the character and non-character image distribution shown in FIG. Th (L) and th (H) are illustrated. In the threshold value th (L) and th (H) setting method illustrated in FIG. 19B, the threshold value th (L) includes, for example, the number of upper and lower 5% in the character image distribution. The boundary feature amounts x1 and x2 are determined, and the function values for the boundary feature amounts x1 and x2 are set as a threshold value th (L) and a threshold value th (H). As a simple determination method, the feature amount x2 may be the lower limit value of the character image distribution, and the feature amount x3 may be the maximum feature amount value as described below.
x1 = x0
x2 = 127

さらに図20(A)に別の特徴量に対する具体例について説明する。図20(A)は、例えば図12に具体例を示した垂直白黒変化点数を特徴量とした場合の、文字ならびに非文字画像の頻度分布の場合である。図20(A)では、文字画像分布と非文字画像分布は異なる分布であるが、非文字画像分布が値の小さい特徴量の範囲に局在分布している。ここでx0およびx1はそれぞれ非文字画像分布の上限値、文字画像分布の上限値である。   Further, a specific example for another feature amount will be described with reference to FIG. FIG. 20A shows a case of frequency distribution of characters and non-character images when, for example, the vertical black-and-white change score shown in the specific example in FIG. 12 is used as the feature amount. In FIG. 20A, the character image distribution and the non-character image distribution are different distributions, but the non-character image distribution is localized in the range of the feature amount having a small value. Here, x0 and x1 are the upper limit value of the non-character image distribution and the upper limit value of the character image distribution, respectively.

図20(B)は、図20(A)に示した文字および非文字画像分布に対して、上記の式(4)で表される関数により設定される識別関数と、設定されるしきい値th(L)およびth(H)を図示したものである。図20(B)に図示されたしきい値th(L)およびth(H)の設定方法は、しきい値th(L)においては、例えば文字画像分布における下位5%の個数を含む境界特徴量x2を、しきい値th(H)においては、非文字画像分布における上位5%の個数を含む境界特徴量x3を決定し、その境界特徴量x2、x3に対する関数値をしきい値th(L)およびしきい値th(H)とする。また簡単な決定方法としては、下記のように特徴量x2を特徴量最小値、特徴量x3を非文字分布上限値としてもよい。
x2=0
x3=x0
FIG. 20B shows an identification function set by the function represented by the above formula (4) and a threshold value set for the character and non-character image distribution shown in FIG. Th (L) and th (H) are illustrated. In the threshold value th (L) and th (H) setting method illustrated in FIG. 20B, the threshold feature th (L) includes, for example, a boundary feature including the number of lower 5% in the character image distribution. When the amount x2 is the threshold th (H), the boundary feature amount x3 including the top 5% number in the non-character image distribution is determined, and the function value for the boundary feature amounts x2 and x3 is set to the threshold th ( L) and threshold value th (H). As a simple determination method, the feature quantity x2 may be the minimum feature quantity value and the feature quantity x3 may be the non-character distribution upper limit value as described below.
x2 = 0
x3 = x0

このように図18(A)で示した文字、非文字画像分布とは別の分布の場合である図19(A)および図20(A)の具体例においても図18(B)と同様の設定方法でしきい値th(L)およびth(H)の設定が可能である。つまりある特定の特徴量に対する文字、非文字分布がどのような分布であっても上記と同様な方法でしきい値th(L)およびth(H)を設定できる。   Thus, the specific example of FIGS. 19A and 20A, which is a distribution different from the character and non-character image distribution shown in FIG. 18A, is the same as FIG. 18B. The thresholds th (L) and th (H) can be set by a setting method. That is, the threshold values th (L) and th (H) can be set in the same manner as described above, regardless of the distribution of characters and non-characters for a specific feature amount.

次に、本実施形態の文字画像識別装置10における識別動作を図21に示すフローチャートを参照して詳細に説明する。   Next, the identification operation in the character image identification apparatus 10 of this embodiment will be described in detail with reference to the flowchart shown in FIG.

先ず、特徴量抽出器311では、文字候補画像から特徴量x(1)を抽出する(ステップS101)。すると、文字識別器321では、識別値算出部411により、抽出された特徴量x(1)に基づく識別値y1が算出される(ステップS102)。 First, the feature quantity extractor 31 1, extracts a feature x (1) from the character candidate image (step S101). Then, in the character classifier 32 1 , the identification value calculation unit 41 1 calculates an identification value y1 based on the extracted feature quantity x (1) (step S102).

すると、文字識別器321では、比較器421により、算出された識別値y1と、予め設定されているしきい値th1(L)、th1(H)との比較が行われる(ステップS103、S104)。 Then, in the character discriminator 32 1 , the comparator 42 1 compares the calculated discriminant value y1 with preset threshold values th1 (L) and th1 (H) (step S103, S104).

この比較器421における比較により、識別値y1がth1(L)以下の場合には(ステップS103においてyes)、判定結果は非文字であるとされ識別処理は終了する(ステップS203)。また、識別値y1がth1(H)以上の場合には(ステップS104においてyes)、判定結果は文字であるとされ識別処理は終了する(ステップS204)。 By comparison in the comparator 42 1, the identification value y1 is th1 when (L) below (yes in step S103), the determination result is to be a non-character identification process ends (step S203). If the identification value y1 is greater than or equal to th1 (H) (yes in step S104), the determination result is assumed to be a character and the identification process ends (step S204).

識別値y1がth1(L)よりも大きくth1(H)よりも小さいと判定された場合には、判定結果は不明であるとして、比較器421から次段の特徴量抽出器322に対してその旨が通知される(ステップS103、S104においてもともにno)。 When it is determined that the identification value y1 is greater than th1 (L) and smaller than th1 (H), the determination result is unknown, and the comparator 421 applies to the next-stage feature quantity extractor 32 2 . This is notified (both in steps S103 and S104, no).

その結果、特徴量抽出器312では、文字候補画像から特徴量x(2)が抽出され(ステップS105)、文字識別器322では、識別値算出部412により、抽出された特徴量x(2)に基づく識別値y2が算出される。そして、加算器432により識別値y1(Y1)と識別値y2が加算されて識別値Y2が算出される(ステップS106)。 As a result, the feature amount extractor 31 2 extracts the feature amount x (2) from the character candidate image (step S105), and the character identifier 32 2 extracts the feature amount x extracted by the identification value calculation unit 41 2. An identification value y2 based on (2) is calculated. The adder 43 2 adds the identification value y1 (Y1) and the identification value y2 to calculate the identification value Y2 (step S106).

そして、文字識別器322では、比較器422により、算出された識別値Y2と、予め設定されているしきい値th2(L)、th2(H)との比較が行われる(ステップS107、S108)。 In the character discriminator 32 2 , the comparator 42 2 compares the calculated discriminant value Y2 with preset threshold values th2 (L) and th2 (H) (step S107, S108).

この比較器422における比較により、識別値Y2がth2(L)以下の場合には(ステップS107においてyes)、判定結果は非文字であるとされ識別処理は終了する(ステップS203)。また、識別値Y2がth2(H)以上の場合には(ステップS108においてyes)、判定結果は文字であるとされ識別処理は終了する(ステップS204)。 By comparison in the comparator 42 2, the identification value Y2 is the case of th2 (L) or less (yes in step S107), the determination result is to be a non-character identification process ends (step S203). If the identification value Y2 is greater than or equal to th2 (H) (yes in step S108), the determination result is assumed to be a character and the identification process ends (step S204).

識別値Y2がth2(L)よりも大きくth2(H)よりも小さいと判定された場合には、判定結果は不明であるとして、比較器422から次段の特徴量抽出器323に対してその旨が通知される(ステップS107、S108においてもともにno)。このようにしてステップS109以下においても同様の処理が繰り返される。 If the identification value Y2 is determined to th2 (L) less than the greater than th2 (H) is determined as the result is unknown, to the comparator 42 2 from the next stage feature quantity extractor 32 3 To that effect (both in steps S107 and S108, no). In this way, the same processing is repeated in step S109 and subsequent steps.

なおこの繰り返し処理において、文字識別器322〜32Nには加算器432〜43Nが設けられていることにより、現段での識別値と前段まで算出された識別値の和(例えば比較器423ではY3=y1+y2+y3)としきい値との比較が行われることになる。 In this iterative process, the character identifiers 32 2 to 32 N are provided with adders 43 2 to 43 N so that the sum of the identification value at the current stage and the identification value calculated up to the previous stage (for example, comparison) vessel 42 comparison 3 in Y3 = y1 + y2 + y3) and the threshold value are to be made.

最後に、文字識別器32Nにおいて、算出された識別値YNとしきい値thNとが比較されて(ステップS202)、最終的に判定結果が「非文字」であるか(ステップS203)、「文字」であるか(ステップS204)が確定する。 Finally, the character discriminator 32 N compares the calculated identification value YN with the threshold thN (step S202), and finally determines whether the determination result is “non-character” (step S203). "(Step S204).

次に、文字識別器321〜32Nの構成順序について説明する。上記において説明してきたように、本実施形態における文字画像識別装置10では、できる限り前段の文字識別器32で「文字」、「非文字」と識別するように動作させるために、文字識別器321〜32Nの構成順序は文字/非文字識別能力が高い順とする。つまり、識別能力が高い文字識別器32ほど前段に配置されるような構成とする。ここで言う文字/非文字識別能力が高い文字識別器32とは、設定された識別関数としきい値による誤識別率が最も低い文字識別器32であり、誤識別率は例えば各文字識別器32毎に文字/非文字を含んだ同じ文字候補画像群を識別させてその誤識別した画像数を計数し、この誤識別した画像数を総文字候補画像数で除することで得られる。 Next, the configuration order of the character identifiers 32 1 to 32 N will be described. As described above, in the character image identification device 10 in the present embodiment, the character identifier 32 is operated so that the character identifier 32 in the preceding stage can be identified as “character” and “non-character” as much as possible. The construction order of 1 to 32 N is the order in which the character / non-character discrimination capability is high. That is, the character discriminator 32 having a higher discriminating ability is arranged in the preceding stage. The character discriminator 32 having a high character / non-character discriminating ability here is the character discriminator 32 having the lowest misidentification rate based on the set discriminating function and threshold value. It is obtained by identifying the same character candidate image group including characters / non-characters every time, counting the number of misidentified images, and dividing the number of misidentified images by the total number of character candidate images.

また文字識別器32で用いるしきい値に関しても、より前段の文字識別器32においては文字/非文字を高い精度で識別するために、たとえば図18(B)でのしきい値設定の説明において文字画像分布の下限値、非文字画像の上限値を用いる場合(x2=x0、x3=x1)のように、より精度が高い識別が期待されるしきい値を設定するようにする。   Further, regarding the threshold value used in the character classifier 32, in order to identify the character / non-character with high accuracy in the preceding character classifier 32, for example, in the description of threshold setting in FIG. As in the case where the lower limit value of the character image distribution and the upper limit value of the non-character image are used (x2 = x0, x3 = x1), a threshold value that is expected to be identified with higher accuracy is set.

[第2の実施形態]
次に、本発明の第2の実施形態の文字画像識別装置について説明する。
[Second Embodiment]
Next, a character image identification apparatus according to a second embodiment of the present invention will be described.

上記の第1の実施形態では、文字識別器322〜32Nにおける識別処理において、前段までの各文字識別器321〜32N-1からの識別値と現段の文字識別器32からの識別値との和を識別処理に用いていたが、本発明はこのような構成に限定されるものではない。 In the first embodiment, in the identification processing in the character classifiers 32 2 to 32 N , the identification values from the character classifiers 32 1 to 32 N−1 up to the previous stage and the character classifiers 32 from the current stage are used. Although the sum with the identification value is used for the identification processing, the present invention is not limited to such a configuration.

本実施形態の文字画像識別装置10aの構成を図22、図23を参照して説明する。
本実施形態の文字画像識別装置10aは、図2に示した第1の実施形態の文字画像識別装置10に対して、文字識別器321〜32Nを文字識別器1321〜132Nに置き換えた構成となっている。
The configuration of the character image identification device 10a of this embodiment will be described with reference to FIGS.
Character image identification apparatus 10a of the present embodiment is different from the character image identification apparatus 10 of the first embodiment shown in FIG. 2, replacing the character discriminator 32 1 to 32 N in the character discriminator 132 1 to 132 N It becomes the composition.

本実施形態における文字識別器1321〜132Nでは、図23を参照すると分かるように、前段の識別値を順次加算していくための加算器が設けられていない。よって、本実施形態における文字識別器1321〜132Nでは、識別値算出部411〜41Nにより算出された識別値y1〜yNと、予め設定されているしきい値th(L)、th(H)との比較が行われる。 In the character identifiers 132 1 to 132 N in the present embodiment, as can be seen with reference to FIG. 23, an adder for sequentially adding the identification values in the previous stage is not provided. Therefore, in the character classifiers 132 1 to 132 N according to the present embodiment, the identification values y1 to yN calculated by the identification value calculation units 41 1 to 41 N and the preset threshold values th (L) and th. Comparison with (H) is made.

本実施形態のように文字識別器1321〜132Nを構成した場合でも、文字識別処理の動作は第1の実施形態の動作と同様であり、図21に示したフローチャートにおいて、ステップS106、S201等におけるY2、YN等をy2、ynと置き換えるだけでよい。 Even when the character identifiers 132 1 to 132 N are configured as in the present embodiment, the operation of the character identification process is the same as the operation of the first embodiment, and steps S106 and S201 in the flowchart shown in FIG. It is only necessary to replace Y2, YN, etc. with y2, yn.

[変形例]
上記実施形態では、文字候補画像が文字画像であるか非文字画像であるかを識別する場合を用いて説明したが、本発明はこれに限定されるものではなく、顔識別処理のように識別対象画像がある特定のパターンと合致するか否かを識別するような場合でも同様に適用することができるものである。
[Modification]
In the above embodiment, the case where a character candidate image is identified as a character image or a non-character image has been described. However, the present invention is not limited to this, and identification is performed as in face identification processing. The present invention can be applied in the same manner even when identifying whether or not the target image matches a specific pattern.

10 文字画像識別装置
11 CPU
12 メモリ
13 記憶装置
14 通信インタフェース(IF)
15 ユーザインタフェース(UI)装置
16 制御バス
21 文字候補画像切出部
22 画像サイズ規格化部
24 判定器
311〜31N 特徴量抽出器
321〜32N 文字識別器
411〜41N 識別値算出部
421〜42N 比較器
432〜43N 加算器
1321〜132N 文字識別器
10 character image identification device 11 CPU
12 Memory 13 Storage Device 14 Communication Interface (IF)
15 User Interface (UI) device 16 controls the bus 21 character candidate image extraction unit 22 image size normalization section 24 judging unit 31 1 to 31 N feature quantity extractor 32 1 to 32 N character discriminators 41 1 to 41 N identification value Calculation unit 42 1 to 42 N comparator 43 2 to 43 N adder 132 1 to 132 N character identifier

Claims (6)

処理対象の画像データから文字画像である可能性があると判定されて切出された文字候補画像から、それぞれ異なる複数の画像特性に基づく特徴量を順次抽出する複数段の抽出手段と、
前記複数段の抽出手段とそれぞれ対応して設けられ、対応する抽出手段により抽出された特徴量に基づいて当該文字候補画像が文字画像である可能性または非文字画像である可能性を示す識別値を算出する算出手段と、前記算出手段により算出された識別値をそれぞれ画像特性毎に予め設定されたしきい値と比較する比較手段とを備え、前記比較手段における比較結果に基づいて当該文字候補画像が文字画像であるか非文字画像であるかまたは、文字画像であるか非文字画像であるか不明な不明画像であるかを識別する複数段の識別手段と、
前記複数段の識別手段のうちの少なくとも1つの識別手段により、当該文字候補画像が文字画像または非文字画像であると識別された場合、当該文字候補画像を文字画像または非文字画像であると判定する判定手段とを有し、
前記複数段の抽出手段は、それぞれ、前段の識別手段において当該文字候補画像が不明画像であると識別された場合に、設定された画像特性に基づく特徴量を抽出する文字画像識別装置。
A plurality of stages of extraction means for sequentially extracting feature amounts based on a plurality of different image characteristics from character candidate images that have been determined to be possibly character images from the image data to be processed;
An identification value provided corresponding to each of the plurality of stages of extraction means, and indicating the possibility that the character candidate image is a character image or a non-character image based on the feature amount extracted by the corresponding extraction means And a comparison unit that compares the identification value calculated by the calculation unit with a threshold value set in advance for each image characteristic, and based on the comparison result in the comparison unit, the character candidate A plurality of stages of identifying means for identifying whether the image is a character image or a non-character image, or a character image, a non-character image, or an unknown unknown image;
When the character candidate image is identified as a character image or a non-character image by at least one of the plurality of stages of identification means, the character candidate image is determined to be a character image or a non-character image. Determination means for
Each of the plurality of stages of extraction means is a character image identification device that extracts a feature amount based on the set image characteristics when the previous-stage identification means identifies the character candidate image as an unknown image .
前記複数段の識別手段は、それぞれ、前段の識別手段における識別値と、現段の算出手段により算出された識別値を加算する加算手段をさらに備えた請求項記載の文字画像識別装置。 It said plurality of stages of identification means, respectively, and the identification value in the preceding-stage identification means, character image identification apparatus according to claim 1, further comprising adding means for adding the calculated identification value by the calculation means in the current stage. 前記算出手段は、当該特徴量に対する複数の文字画像および非文字画像の頻度分布に基づいて予め算出された識別関数を用いて、特徴量から識別値を算出する備えた請求項1または2記載の文字画像識別装置。 The calculating means, the plurality with respect to the feature amount using the discriminant function which is previously calculated based on the frequency distribution of the character image and the non-character image, according to claim 1 or 2, wherein comprising calculating the identification value from the feature Character image identification device. 前記複数段の識別手段は、文字候補画像が文字画像か非文字画像であるかを識別する識別能力が高い識別手段ほど前段に配置されている請求項1からのいずれか1項記載の文字画像識別装置。 The character according to any one of claims 1 to 3 , wherein the plurality of stages of identifying means are arranged in a preceding stage as an identifying means having a higher identification ability for identifying whether a character candidate image is a character image or a non-character image. Image identification device. 処理対象の画像データから文字画像である可能性があると判定されて切出された文字候補画像から、それぞれ異なる複数の画像特性に基づく特徴量を抽出するステップと、
抽出された特徴量に基づいて当該文字候補画像が文字画像である可能性または非文字画像である可能性を示す識別値を算出するステップと、
算出された識別値をそれぞれ画像特性毎に予め設定されたしきい値と比較するステップと、
しきい値との比較結果に基づいて当該文字候補画像が文字画像であるか非文字画像であるかまたは、文字画像であるか非文字画像であるか不明な不明画像であるかを識別するステップと、
当該文字候補画像が文字画像または非文字画像であると識別された場合、当該文字候補画像を文字画像または非文字画像であると判定し、当該文字候補画像が不明画像であると識別された場合には、特徴量を抽出するステップ、識別値を算出するステップおよびしきい値と比較するステップ、文字候補画像を識別するステップを再度繰り返すステップと、
を有する文字画像識別方法。
Extracting a feature amount based on a plurality of different image characteristics from a character candidate image that is determined to be a character image from image data to be processed and cut out;
Calculating an identification value indicating the possibility that the character candidate image is a character image or a non-character image based on the extracted feature amount; and
Comparing the calculated identification value with a preset threshold value for each image characteristic;
Identifying whether the character candidate image is a character image, a non-character image, or a character image, a non-character image, or an unknown image based on a comparison result with a threshold value When,
When the character candidate image is identified as a character image or a non-character image, it is determined that the character candidate image is a character image or a non-character image, and the character candidate image is identified as an unknown image The step of extracting the feature amount, the step of calculating the identification value, the step of comparing with the threshold value, the step of identifying the character candidate image again,
A character image identification method comprising:
処理対象の画像データから文字画像である可能性があると判定されて切出された文字候補画像から、それぞれ異なる複数の画像特性に基づく特徴量を抽出するステップと、
抽出された特徴量に基づいて当該文字候補画像が文字画像である可能性または非文字画像である可能性を示す識別値を算出するステップと、
算出された識別値をそれぞれ画像特性毎に予め設定されたしきい値と比較するステップと、
しきい値との比較結果に基づいて当該文字候補画像が文字画像であるか非文字画像であるかまたは、文字画像であるか非文字画像であるか不明な不明画像であるかを識別するステップと、
当該文字候補画像が文字画像または非文字画像であると識別された場合、当該文字候補画像を文字画像または非文字画像であると判定し、当該文字候補画像が不明画像であると識別された場合には、特徴量を抽出するステップ、識別値を算出するステップおよびしきい値と比較するステップ、文字候補画像を識別するステップを再度繰り返すステップとをコンピュータに実行させるためのプログラム。
Extracting a feature amount based on a plurality of different image characteristics from a character candidate image that is determined to be a character image from image data to be processed and cut out;
Calculating an identification value indicating the possibility that the character candidate image is a character image or a non-character image based on the extracted feature amount; and
Comparing the calculated identification value with a preset threshold value for each image characteristic;
Identifying whether the character candidate image is a character image, a non-character image, or a character image, a non-character image, or an unknown image based on a comparison result with a threshold value When,
When the character candidate image is identified as a character image or a non-character image, it is determined that the character candidate image is a character image or a non-character image, and the character candidate image is identified as an unknown image A program for causing a computer to execute a step of extracting a feature amount, a step of calculating an identification value, a step of comparing with a threshold value, and a step of repeating a step of identifying a character candidate image again.
JP2010182102A 2010-08-17 2010-08-17 Character image identification device, character image identification method and program Expired - Fee Related JP5660294B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010182102A JP5660294B2 (en) 2010-08-17 2010-08-17 Character image identification device, character image identification method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010182102A JP5660294B2 (en) 2010-08-17 2010-08-17 Character image identification device, character image identification method and program

Publications (2)

Publication Number Publication Date
JP2012043077A JP2012043077A (en) 2012-03-01
JP5660294B2 true JP5660294B2 (en) 2015-01-28

Family

ID=45899335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010182102A Expired - Fee Related JP5660294B2 (en) 2010-08-17 2010-08-17 Character image identification device, character image identification method and program

Country Status (1)

Country Link
JP (1) JP5660294B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545261A (en) * 2016-06-23 2018-01-05 佳能株式会社 The method and device of text detection

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5966460A (en) * 1997-03-03 1999-10-12 Xerox Corporation On-line learning for neural net-based character recognition systems
JP2004062385A (en) * 2002-07-26 2004-02-26 Ricoh Co Ltd Method for recognizing character, program to be used for execution of the method and character recognition device
JP2006318341A (en) * 2005-05-16 2006-11-24 Sony Corp Detection object image determination device, method, and program
JP5171362B2 (en) * 2008-04-07 2013-03-27 株式会社東芝 Strong classifier learning apparatus and method, and strong classifier learning program

Also Published As

Publication number Publication date
JP2012043077A (en) 2012-03-01

Similar Documents

Publication Publication Date Title
Chen et al. Automatic license-plate location and recognition based on feature salience
US20110085728A1 (en) Detecting near duplicate images
US8594432B2 (en) Image processing apparatus and image processing method
JP2012146299A (en) Generation device and method of discriminator detecting specific object in image
KR20150137752A (en) Character recognition method and apparatus thereof
CN117197904B (en) Training method of human face living body detection model, human face living body detection method and human face living body detection device
JP2005148987A (en) Object identifying method and device, program and recording medium
EP1930852B1 (en) Image search method and device
Li et al. Leveraging surrounding context for scene text detection
Rassem et al. Performance evaluation of completed local ternary patterns (CLTP) for medical, scene and event image categorisation
CN111428064B (en) Small-area fingerprint image fast indexing method, device, equipment and storage medium
US20120314939A1 (en) Recognizing apparatus and method, program, and recording medium
JP5660294B2 (en) Character image identification device, character image identification method and program
JP2009129253A (en) Pattern recognition apparatus, pattern recognition program and pattern recognition method
JP2016071800A (en) Information processing device, information processing method, and program
JP5857634B2 (en) Word space detection device, word space detection method, and computer program for word space detection
JP2013081174A (en) Image processing apparatus and image processing method
Yu et al. Chinese text detection and recognition in natural scene using hog and SVM
JP2009251962A (en) Learning equipment for strong discriminator and method for the same, and learning program for strong discriminator
KR20140112869A (en) Apparatus and method for recognizing character
Loderer et al. Optimization of LBP parameters
Polsani et al. DeepGray: A Novel Approach to Malware Classification Using Grayscale Images with Deep Learning
Roopa et al. An impact of frequency domain filtering technique on text localization method useful for text reading from scene images
Choubey et al. Bilateral Partitioning based character recognition for Vehicle License plate
Riyanto HOG and zone base features for handwritten Javanese character classification

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130724

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140418

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141118

R150 Certificate of patent or registration of utility model

Ref document number: 5660294

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees