JP5489894B2 - Image processing apparatus and image processing program - Google Patents

Image processing apparatus and image processing program Download PDF

Info

Publication number
JP5489894B2
JP5489894B2 JP2010157514A JP2010157514A JP5489894B2 JP 5489894 B2 JP5489894 B2 JP 5489894B2 JP 2010157514 A JP2010157514 A JP 2010157514A JP 2010157514 A JP2010157514 A JP 2010157514A JP 5489894 B2 JP5489894 B2 JP 5489894B2
Authority
JP
Japan
Prior art keywords
module
feature
value
character string
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010157514A
Other languages
Japanese (ja)
Other versions
JP2012022359A (en
Inventor
明 廣瀬
裕也 今野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Tokyo NUC
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
University of Tokyo NUC
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, University of Tokyo NUC, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2010157514A priority Critical patent/JP5489894B2/en
Publication of JP2012022359A publication Critical patent/JP2012022359A/en
Application granted granted Critical
Publication of JP5489894B2 publication Critical patent/JP5489894B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)

Description

本発明は、画像処理装置及び画像処理プログラムに関する。   The present invention relates to an image processing apparatus and an image processing program.

特許文献1には、1文字の文字データの中から、活字又は手書き文字に応じて異なる簡単な特徴を抽出し、対象文字が活字であるか手書き文字であるかを高精度に判定することを課題とし、特徴抽出部は、文字データ抽出部で抽出された1文字の文字データの中から、文字が活字であるか手書き文字であるかを判定するための特徴(文字ストロークの方向性、太さ、直線性など)を抽出し、文字種類判定部は、その特徴に基づいて活字であるか手書き文字であるかを判定し、その判定結果に応じて、活字文字認識部、手書き文字認識部のいずれかを実行させることが開示されている。   In Patent Document 1, simple features that differ depending on the type or handwritten character are extracted from character data of one character, and it is determined with high accuracy whether the target character is a typed character or a handwritten character. As a task, the feature extraction unit determines whether the character is a printed character or a handwritten character from the character data of one character extracted by the character data extraction unit (direction of character stroke, thick character). The character type determination unit determines whether the character type is a printed character or a handwritten character based on the feature, and according to the determination result, the character type recognition unit, the handwritten character recognition unit It is disclosed that either of the above is executed.

特許文献2には、手書き文字と活字文字を高精度に短時間で識別できるようにし、文字認識処理に要する時間を短縮化することを課題とし、文書又は帳票等から読み取られた画像データから文字パターンが抽出され、手書き/活字判別部で手書き文字、活字の判別が行われ、手書き/活字判別部では、文字パターンから、少なくとも文字パターンの複雑さを表す特徴と、直線性を表す特徴を含むN個の特徴ベクトルを求め、この特徴ベクトルを用いて、上記文字パターンが手書き文字であるか活字文字であるかを判別し、文字認識部では、文字データが手書き文字か活字かに応じて、対応した文字認識処理を行い、上記文字パターンの特徴として、線幅のバラツキ、文字位置のバラツキ等を用いることもできることが開示されている。   In Patent Document 2, it is an object to make it possible to identify handwritten characters and printed characters with high accuracy in a short time, and to shorten the time required for character recognition processing. Characters from image data read from a document or a form are disclosed. A pattern is extracted, and a handwritten / print type discriminating unit discriminates a handwritten character and a type. The handwriting / type discriminating unit includes at least a feature representing the complexity of the character pattern and a feature representing linearity from the character pattern. N feature vectors are obtained, and using the feature vectors, it is determined whether the character pattern is a handwritten character or a printed character. In the character recognition unit, depending on whether the character data is a handwritten character or a printed character, It is disclosed that corresponding character recognition processing can be performed, and line width variation, character position variation, and the like can be used as characteristics of the character pattern.

特許文献3には、被読み取り文字が手書き文字であるかあるいは活字であるかを迅速に判断して、手書き文字と活字が混在して記載されている帳票の読み取り速度を向上させることができる光学的文字読取装置を提供することを目的とし、フィールド切出部はシートバッファ内のスキャナで読み取られた文字データからフィールド単位で文字データを切り出して、これをフィールドバッファに格納し、文字種判定部はフィールドバッファ内の文字データの文字種を判定して、この判定結果を認識部に知らせ、認識部は前記判定結果にしたがって手書き辞書又は活字辞書のいずれか一方を使用してフィールドバッファ内の文字データの文字認識を行うことが開示されている。   In Patent Document 3, an optical that can quickly determine whether a character to be read is a handwritten character or a printed character, and can improve the reading speed of a form described in a mixture of handwritten characters and printed characters. The field cutout unit cuts out character data in field units from the character data read by the scanner in the sheet buffer and stores it in the field buffer. The character type determination unit The character type of the character data in the field buffer is determined, and the determination result is notified to the recognition unit. The recognition unit uses either the handwritten dictionary or the type dictionary according to the determination result to determine the character data in the field buffer. Performing character recognition is disclosed.

特許文献4には、文字データの高さ以外の特徴を用い、また複数の特徴を併用することによって文字の判別精度を向上させることを課題とし、文字矩形抽出部は文書画像の所定領域から文字矩形(黒画素連結矩形)を抽出し、文字矩形特徴算出部は抽出した各矩形の面積を算出し、標準偏差算出部は矩形面積値の集合の標準偏差を求め、比較判定部では標準偏差が所定の閾値を越えていたとき、上記所定領域内の文字は手書き文字であると判定し、閾値より小さいとき活字文字であると判定し、それぞれの辞書を用いて認識処理することが開示されている。   In Patent Document 4, it is an object to improve the character discrimination accuracy by using features other than the height of character data and using a plurality of features together. The rectangle (black pixel concatenation rectangle) is extracted, the character rectangle feature calculation unit calculates the area of each extracted rectangle, the standard deviation calculation unit calculates the standard deviation of the set of rectangular area values, and the comparison determination unit calculates the standard deviation. It is disclosed that when a predetermined threshold value is exceeded, it is determined that the character in the predetermined area is a handwritten character, and when it is smaller than the threshold value, it is determined that it is a printed character, and recognition processing is performed using each dictionary. Yes.

特許文献5には、効率よく高精度に文字種を判定でき、判定処理が高速度に実行できることを課題とし、印刷文字列である簡易な複数の条件を確率の高い順に組み合わせて各条件に適合するか否かを判定し、印刷文字例か手書文字列か判定するようにしたものが開示されている。   In Patent Document 5, it is an object to be able to determine the character type efficiently and with high accuracy, and to execute the determination process at a high speed, and a plurality of simple conditions, which are printed character strings, are combined in descending order of probability to meet each condition. Whether it is a printed character example or a handwritten character string is disclosed.

特開平10−162102号公報Japanese Patent Laid-Open No. 10-162102 特開2000−181993号公報JP 2000-181993 A 特開平05−189604号公報JP 05-189604 A 特開平10−214308号公報JP-A-10-214308 特開2000−339404号公報JP 2000-339404 A

本発明は、文字列画像より文字の線分の角度や長さ、出現頻度の情報を抽出することで、その文字列画像内の文字は活字又は手書きのいずれであるかを判定する画像処理装置及び画像処理プログラムを提供することを目的としている。   The present invention relates to an image processing apparatus that determines whether a character in a character string image is a type or a handwriting by extracting information on the angle, length, and appearance frequency of the line segment from the character string image. And an image processing program.

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、文字列を含む文字列画像に対して、細線情報に変換する細線変換手段と、前記細線変換手段によって細線となった文字列画像内に矩形領域を設定する領域設定手段と、前記領域設定手段によって設定された矩形領域に対して、ハフ変換を行うハフ変換手段と、前記ハフ変換手段によるハフ変換の処理結果の線分の角度情報と、その高さ情報を特徴として抽出する特徴抽出手段と、前記特徴抽出手段によって抽出された特徴に基づいて、前記文字列画像内の文字列は活字又は手書きのいずれであるかを判定する判定手段を具備することを特徴とする画像処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
According to the first aspect of the present invention, fine line conversion means for converting a character string image including a character string into thin line information, and area setting means for setting a rectangular area in the character string image that has become a thin line by the thin line conversion means. And Hough transforming means for performing a Hough transform on the rectangular region set by the region setting means, angle information of a line segment as a result of the Hough transform processing by the Hough transform means, and height information thereof A feature extracting unit for extracting, and a determining unit for determining whether a character string in the character string image is a printed character or a handwritten character based on the feature extracted by the feature extracting unit. An image processing apparatus.

請求項2の発明は、前記特徴抽出手段は、前記ハフ変換手段によるハフ変換の前記各矩形の処理結果に対して重みづけを行い、線分情報ではないと判断されるものを除外した該重みづけを行った処理結果を加算する加算手段と、前記加算手段による処理結果を角度における分布と予め定められた値を比較することによって、該処理結果内から第1の値を抽出する第1の値抽出手段と、前記第1の値抽出手段によって抽出された第1の値と予め定められた値との差を特徴量として抽出する第1の特徴量抽出手段を具備することを特徴とする請求項1に記載の画像処理装置である。   According to a second aspect of the present invention, the feature extraction unit weights the processing result of each rectangle of the Hough transform by the Hough transform unit, and removes the weight that is determined not to be line segment information A first means for extracting a first value from the processing result by comparing the processing result by the adding means with a distribution in angle with a predetermined value; And a first feature quantity extraction means for extracting, as a feature quantity, a difference between the value extraction means and the first value extracted by the first value extraction means and a predetermined value. An image processing apparatus according to claim 1.

請求項3の発明は、前記特徴抽出手段は、前記ハフ変換手段によるハフ変換の前記各矩形の処理結果に対して重みづけを行い、線分情報ではないと判断されるものを除外した該重みづけを行った処理結果を加算する加算手段と、前記加算手段による処理結果を角度における分布と予め定められた値を比較することによって、該処理結果内から第1の値を抽出する第1の値抽出手段と、前記第1の値抽出手段によって抽出された第1の値に対して予め定められた範囲内における前記加算手段による処理結果の分散を特徴量として抽出する第2の特徴量抽出手段を具備することを特徴とする請求項1に記載の画像処理装置である。   According to a third aspect of the present invention, the feature extraction unit weights the processing result of each rectangle of the Hough transform by the Hough transform unit, and removes the weight determined to be not line segment information A first means for extracting a first value from the processing result by comparing the processing result by the adding means with a distribution in angle with a predetermined value; A second feature amount extraction unit that extracts, as a feature amount, a variance of a processing result by the addition unit within a predetermined range with respect to the first value extracted by the first value extraction unit; The image processing apparatus according to claim 1, further comprising: means.

請求項4の発明は、前記特徴抽出手段は、前記第1の値抽出手段によって抽出された第1の値に対して予め定められた範囲内における前記加算手段による処理結果の分散を特徴量として抽出する第2の特徴量抽出手段をさらに具備することを特徴とする請求項2に記載の画像処理装置である。   According to a fourth aspect of the present invention, the feature extraction unit uses, as a feature amount, a variance of a processing result by the addition unit within a predetermined range with respect to the first value extracted by the first value extraction unit. The image processing apparatus according to claim 2, further comprising second feature amount extraction means for extracting.

請求項5の発明は、前記特徴抽出手段は、前記ハフ変換手段によるハフ変換の前記各矩形の処理結果を予め定められた値と比較することによって、該処理結果内から第2の値を抽出する第2の値抽出手段と、前記第2の値抽出手段によって抽出された第2の値の高さと角度を特徴量として抽出する第3の特徴量抽出手段を具備することを特徴とする請求項1から4のいずれか一項に記載の画像処理装置である。   According to a fifth aspect of the present invention, the feature extraction unit extracts a second value from the processing result by comparing the processing result of each rectangle of the Hough transform by the Hough transform unit with a predetermined value. And second feature extraction means for extracting, as feature quantities, the height and angle of the second value extracted by the second value extraction means. Item 5. The image processing device according to any one of Items 1 to 4.

請求項6の発明は、前記特徴抽出手段は、予め定められた値に対して予め定められた範囲内における前記ハフ変換手段によるハフ変換の前記各矩形の処理結果の分散を算出する分散算出手段と、前記分散算出手段によって算出された前記各矩形の分散の合計と高さを特徴量として抽出する第4の特徴量抽出手段を具備することを特徴とする請求項1から4のいずれか一項に記載の画像処理装置である。   According to a sixth aspect of the present invention, the feature extraction unit calculates a variance of the processing result of each rectangle of the Hough transform performed by the Hough transform unit within a predetermined range with respect to a predetermined value. And a fourth feature amount extracting means for extracting the total and height of the variances of the respective rectangles calculated by the variance calculating means as feature amounts. The image processing apparatus according to the item.

請求項7の発明は、コンピュータを、文字列を含む文字列画像に対して、細線情報に変換する細線変換手段と、前記細線変換手段によって細線となった文字列画像内に矩形領域を設定する領域設定手段と、前記領域設定手段によって設定された矩形領域に対して、ハフ変換を行うハフ変換手段と、前記ハフ変換手段によるハフ変換の処理結果の線分の角度情報と、その高さ情報を特徴として抽出する特徴抽出手段と、前記特徴抽出手段によって抽出された特徴に基づいて、前記文字列画像内の文字列は活字又は手書きのいずれであるかを判定する判定手段として機能させることを特徴とする画像処理プログラムである。   According to the seventh aspect of the present invention, the computer sets a rectangular area in the character string image that has become a thin line by the thin line conversion means, and fine line conversion means for converting the character string image including the character string into thin line information. Area setting means, Hough transform means for performing Hough transform on the rectangular area set by the area setting means, angle information of the line segment of the result of Hough transform processing by the Hough transform means, and height information thereof And a feature extraction unit that extracts a character string as a feature, and a determination unit that determines whether a character string in the character string image is a type or a handwriting based on the feature extracted by the feature extraction unit. This is a featured image processing program.

請求項1の画像処理装置によれば、文字列画像より文字の線分の角度や長さ、出現頻度の情報を抽出することで、その文字列画像内の文字は活字又は手書きのいずれであるかを判定することができる。   According to the image processing device of claim 1, by extracting information on the angle and length of the line segment of the character and the appearance frequency from the character string image, the character in the character string image is either printed or handwritten. Can be determined.

請求項2の画像処理装置によれば、第1の値と予め定められた値との差を特徴量として活字又は手書きのいずれであるかを判定することができる。   According to the image processing apparatus of the second aspect, it is possible to determine whether the type is a type or a handwriting by using a difference between the first value and a predetermined value as a feature amount.

請求項3の画像処理装置によれば、第1の値に対して予め定められた範囲内における分散を特徴量として活字又は手書きのいずれであるかを判定することができる。   According to the image processing apparatus of the third aspect, it is possible to determine whether the character is handwritten or handwritten using a variance within a predetermined range with respect to the first value as a feature amount.

請求項4の画像処理装置によれば、第1の値と予め定められた値との差、第1の値に対して予め定められた範囲内における分散を特徴量として活字又は手書きのいずれであるかを判定することができる。   According to the image processing apparatus of claim 4, the difference between the first value and a predetermined value, or the variance within a predetermined range with respect to the first value is used as a feature value in either type or handwriting. It can be determined whether there is.

請求項5の画像処理装置によれば、第2の値の高さと角度を特徴量として活字又は手書きのいずれであるかを判定することができる。   According to the image processing device of the fifth aspect, it is possible to determine whether the character is a type or a handwriting by using the height and angle of the second value as the feature amount.

請求項6の画像処理装置によれば、ハフ変換の処理結果の分散の合計と高さを特徴量として活字又は手書きのいずれであるかを判定することができる。   According to the image processing apparatus of the sixth aspect, it is possible to determine whether the character is handwritten or handwritten by using the total and height of the variance of the processing result of the Hough transform as a feature amount.

請求項7の画像処理プログラムによれば、文字列画像より文字の線分の角度や長さ、出現頻度の情報を抽出することで、その文字列画像内の文字は活字又は手書きのいずれであるかを判定することができる。   According to the image processing program of claim 7, by extracting information on the angle, length, and appearance frequency of the character line segment from the character string image, the character in the character string image is either printed or handwritten. Can be determined.

本実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of this Embodiment. 本実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by this Embodiment. 文字列抽出モジュールによって抽出された文字列画像の例を示す説明図である。It is explanatory drawing which shows the example of the character string image extracted by the character string extraction module. 細線化処理モジュールによって細線化処理された結果の例を示す説明図である。It is explanatory drawing which shows the example of the result thinned by the thinning process module. 文字高さの例を示す説明図である。It is explanatory drawing which shows the example of character height. 文字列画像を矩形分割処理モジュールによって分割する矩形の例を示す説明図である。It is explanatory drawing which shows the example of the rectangle which divides | segments a character string image by the rectangle division | segmentation process module. ハフ変換処理モジュールによるハフ変換の処理結果の例を示す説明図である。It is explanatory drawing which shows the example of the process result of the Hough conversion by a Hough conversion process module. 閾値処理モジュールによる閾値処理の結果の例を示す説明図である。It is explanatory drawing which shows the example of the result of the threshold value process by a threshold value processing module. 特徴抽出モジュール内の構成例についての概念的なモジュール構成図(1)である。It is a conceptual module block diagram (1) about the structural example in a feature extraction module. 特徴抽出モジュールによる処理例を示すフローチャートである。It is a flowchart which shows the process example by a feature extraction module. 教師データテーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a teacher data table. 加算処理モジュールによる加算処理の結果の例を示す説明図である。It is explanatory drawing which shows the example of the result of the addition process by an addition process module. ピーク・教師データ比較モジュールの処理の例を示す説明図である。It is explanatory drawing which shows the example of a process of a peak and teacher data comparison module. 特徴抽出モジュール内の構成例についての概念的なモジュール構成図(2)である。It is a conceptual module block diagram (2) about the structural example in a feature extraction module. 特徴抽出モジュールによる処理例を示すフローチャートである。It is a flowchart which shows the process example by a feature extraction module. ピーク抽出モジュールによる処理例を示す説明図である。It is explanatory drawing which shows the process example by a peak extraction module. ピーク特徴抽出モジュールによる処理例を示す説明図である。It is explanatory drawing which shows the process example by a peak feature extraction module. 特徴抽出モジュール内の構成例についての概念的なモジュール構成図(3)である。It is a conceptual module block diagram (3) about the structural example in a feature extraction module. 特徴抽出モジュールによる処理例を示すフローチャートである。It is a flowchart which shows the process example by a feature extraction module. 分散合計・高さ抽出モジュールによる処理例を示す説明図である。It is explanatory drawing which shows the example of a process by a dispersion | distribution total and height extraction module. 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。It is a block diagram which shows the hardware structural example of the computer which implement | achieves this Embodiment.

以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
Hereinafter, an example of a preferred embodiment for realizing the present invention will be described with reference to the drawings.
FIG. 1 shows a conceptual module configuration diagram of a configuration example of the present embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment is a computer program for causing these modules to function (a program for causing a computer to execute each procedure, a program for causing a computer to function as each means, and a function for each computer. This also serves as an explanation of the program and system and method for realizing the above. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. It is the control to be stored in the device. Modules may correspond to functions one-to-one, but in mounting, one module may be configured by one program, or a plurality of modules may be configured by one program, and conversely, one module May be composed of a plurality of programs. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. Hereinafter, “connection” is used not only for physical connection but also for logical connection (data exchange, instruction, reference relationship between data, etc.). “Predetermined” means that the process is determined before the target process, and not only before the process according to this embodiment starts but also after the process according to this embodiment starts. In addition, if it is before the target processing, it is used in accordance with the situation / state at that time or with the intention to be decided according to the situation / state up to that point.
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is included. “Apparatus” and “system” are used as synonymous terms. Of course, the “system” does not include a social “mechanism” (social system) that is an artificial arrangement.
In addition, when performing a plurality of processes in each module or in each module, the target information is read from the storage device for each process, and the processing result is written to the storage device after performing the processing. is there. Therefore, description of reading from the storage device before processing and writing to the storage device after processing may be omitted. Here, the storage device may include a hard disk, a RAM (Random Access Memory), an external storage medium, a storage device via a communication line, a register in a CPU (Central Processing Unit), and the like.

本実施の形態である画像処理装置は、画像内の文字列は活字又は手書きのいずれであるかを判定するものであって、図1の例に示すように、画像受付モジュール110、文字列抽出モジュール120、細線化処理モジュール130、矩形サイズ決定モジュール140、矩形分割処理モジュール150、ハフ変換処理モジュール160、閾値処理モジュール170、特徴抽出モジュール180、距離測定モジュール185、判定モジュール190、出力モジュール195を有している。   The image processing apparatus according to the present embodiment determines whether a character string in an image is printed or handwritten. As shown in the example of FIG. 1, the image receiving module 110, character string extraction Module 120, thinning processing module 130, rectangle size determination module 140, rectangle division processing module 150, Hough transform processing module 160, threshold processing module 170, feature extraction module 180, distance measurement module 185, determination module 190, and output module 195 Have.

画像受付モジュール110は、文字列抽出モジュール120と接続されており、画像を受け付けて、その画像を文字列抽出モジュール120へ渡す。画像を受け付けるとは、例えば、スキャナ、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、CCD(Charge−Coupled Device)等で映像を撮影すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、文字列が含まれていれば、ビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。   The image reception module 110 is connected to the character string extraction module 120, receives an image, and passes the image to the character string extraction module 120. Accepting an image means, for example, reading an image with a scanner, a camera, etc., receiving an image from an external device via a communication line by fax, taking a video with a CCD (Charge-Coupled Device), etc. This includes reading out an image stored in a hard disk (including those connected to the computer in addition to those built in the computer). The image may be a binary image or a multi-value image (including a color image). One image may be received or a plurality of images may be received. In addition, as long as the content of the image includes a character string, it may be a document used for business, a pamphlet for advertisement, or the like.

文字列抽出モジュール120は、画像受付モジュール110、細線化処理モジュール130と接続されており、画像受付モジュール110から画像を受け取り、文字列を含む文字列画像を抽出して、その文字列画像を細線化処理モジュール130へ渡す。文字列画像の抽出は、構造解析等の既存技術を用いる。例えば、画像から予め定められた幅以上の空白を検出し、その空白によって領域に区分し、その区分された領域の種別(文字領域、図形領域、写真領域等)を画素塊の大きさの分布等によって判断して、文字領域の座標(例えば、左上のX座標、Y座標、その領域の幅と高さ)を抽出する。そして、その文字領域内から文字列画像の座標(例えば、左上のX座標、Y座標、その文字列画像の幅と高さ)を抽出する。例えば、その文字領域内で、横方向及び縦方向に画素を計数し、規則的に並んでいる列を文字列と判断するようにしてもよい。
なお、画素塊とは、4連結又は8連結で連続する画素領域を少なくとも含み、これらの画素領域の集合をも含む。これらの画素領域の集合とは、4連結等で連続した画素領域が複数あり、その複数の画素領域は近傍にあるものをいう。ここで、近傍にあるものとは、例えば、互いの画素領域が距離的に近いもの、文章としての1行から1文字ずつ切り出すように縦又は横方向に射影し、空白地点で切り出した画像領域、又は一定間隔で切り出した画像領域等がある。
また、ここでの文字列とは、文字が横方向に並んだ文字列であってもよいし、文字が縦方向に並んだ文字列であってもよい。
The character string extraction module 120 is connected to the image reception module 110 and the thinning processing module 130, receives an image from the image reception module 110, extracts a character string image including a character string, and converts the character string image into a thin line. To the processing module 130. Extraction of the character string image uses existing techniques such as structural analysis. For example, a blank having a predetermined width or more is detected from an image, divided into regions by the blank, and the type of the divided region (character region, graphic region, photo region, etc.) is distributed in the size of the pixel block The coordinates of the character area (for example, the upper left X coordinate, Y coordinate, and the width and height of the area) are extracted. Then, the coordinates of the character string image (for example, the upper left X coordinate, Y coordinate, and the width and height of the character string image) are extracted from the character area. For example, the pixels may be counted in the horizontal direction and the vertical direction in the character area, and the regularly arranged column may be determined as the character string.
Note that the pixel block includes at least a pixel area that is continuous in four or eight connections, and includes a set of these pixel areas. The set of these pixel areas means that there are a plurality of continuous pixel areas such as 4-connected, and the plurality of pixel areas are in the vicinity. Here, what is in the vicinity is, for example, an image area in which the pixel areas are close to each other in distance, an image area that is projected vertically or horizontally so as to cut out one character at a time from a line as a sentence, and cut out at a blank spot Or an image region cut out at regular intervals.
Further, the character string here may be a character string in which characters are arranged in the horizontal direction, or may be a character string in which characters are arranged in the vertical direction.

細線化処理モジュール130は、文字列抽出モジュール120、矩形サイズ決定モジュール140と接続されており、文字列抽出モジュール120から文字列画像を受け取り、その文字列画像に対して、細線情報に変換し、その細線化された文字列画像を矩形サイズ決定モジュール140へ渡す。細線情報に変換する細線化処理は、既存技術を用いる。例えば、除去する画素を定めたフィルタを用いて細線化するようにしてもよい。また、輪郭線を抽出するようにしてもよい。ここでの細線化処理とは、画像を文字の太さに影響されない線分だけの情報に変換することをいう。   The thinning processing module 130 is connected to the character string extraction module 120 and the rectangular size determination module 140, receives a character string image from the character string extraction module 120, converts the character string image into thin line information, The thinned character string image is passed to the rectangular size determination module 140. The thinning process for converting into thin line information uses existing technology. For example, thinning may be performed using a filter that defines pixels to be removed. Moreover, you may make it extract a contour line. The thinning process here refers to converting an image into information of only a line segment that is not affected by the thickness of characters.

矩形サイズ決定モジュール140は、細線化処理モジュール130、矩形分割処理モジュール150と接続されており、細線化処理モジュール130によって細線化処理された文字列画像を区切る矩形の大きさを決定し、その矩形の大きさとともに細線化処理された文字列画像を矩形分割処理モジュール150へ渡す。矩形は、長方形であってもよいし、正方形であってもよい。決定する矩形の大きさとは、長方形の場合は高さと幅であり、正方形の場合は一辺の長さである。
矩形の大きさは、例えば、文字列画像内の文字の大きさとしてもよい。この場合、文字列画像内の画素塊の大きさから矩形の大きさを決定するようにしてもよい。例えば、前述のように画素塊を抽出した場合、1つの画素塊として、1文字の画像となる場合が多くなる。また、横方向に長い文字列画像である場合、文字列画像内の文字の高さを一辺とする正方形としてもよい。縦方向に長い文字列画像である場合は、文字列画像内の文字の幅を一辺とする正方形としてもよい。また、画素塊の大きさ、文字の高さ等に予め定められた値(0以上の値)を加算した値を矩形の大きさとしてもよい。
The rectangle size determination module 140 is connected to the thinning processing module 130 and the rectangle division processing module 150, determines the size of a rectangle that divides the character string image thinned by the thinning processing module 130, and the rectangle. The character string image that has been subjected to the thinning process along with the size of the image is passed to the rectangular division processing module 150. The rectangle may be a rectangle or a square. The size of the rectangle to be determined is the height and width in the case of a rectangle, and the length of one side in the case of a square.
The size of the rectangle may be, for example, the size of characters in the character string image. In this case, the size of the rectangle may be determined from the size of the pixel block in the character string image. For example, when a pixel block is extracted as described above, an image of one character increases as one pixel block. In the case of a character string image that is long in the horizontal direction, it may be a square with the height of the character in the character string image as one side. In the case of a character string image that is long in the vertical direction, it may be a square with the width of the character in the character string image as one side. Further, a value obtained by adding a predetermined value (a value of 0 or more) to the size of the pixel block, the height of the character, or the like may be used as the rectangular size.

矩形分割処理モジュール150は、矩形サイズ決定モジュール140、ハフ変換処理モジュール160と接続されており、細線化処理モジュール130によって細線化処理された文字列画像内を、矩形サイズ決定モジュール140によって決定された矩形に分割し、その分割された矩形の画像をハフ変換処理モジュール160へ渡す。ここでの矩形の分割は、端から順に矩形の大きさ毎に分割してもよいし、画素ができるだけ存在しない位置で分割してもよいし(つまり、その矩形内に文字(1つの文字であってもよいし、複数の文字であってもよい)が収まるように分割する)、矩形が重なる(オーバーラップする)ように分割してもよいし(つまり、重なった部分では同じ画像が含まれていることになり、矩形の境界で線分が途切れた場合に対応するものである)、矩形間に距離があってもよい(つまり、隣の矩形とは離れている状態に矩形を設定する)。
したがって、矩形サイズ決定モジュール140と矩形分割処理モジュール150によって、細線化処理モジュール130によって細線となった文字列画像内に矩形領域を設定することを行っている。
The rectangular division processing module 150 is connected to the rectangular size determination module 140 and the Hough conversion processing module 160, and the character string image thinned by the thinning processing module 130 is determined by the rectangular size determination module 140. The image is divided into rectangles, and the divided rectangle image is passed to the Hough transform processing module 160. Here, the division of the rectangle may be performed in order from the end for each size of the rectangle, or may be performed at a position where pixels do not exist as much as possible (that is, a character (with one character within the rectangle). May be divided so that they can be included), or may be divided so that the rectangles overlap (overlapping) (that is, the overlapped portion contains the same image) (This corresponds to the case where the line segment breaks at the boundary of the rectangle), and there may be a distance between rectangles (that is, the rectangle is set apart from the adjacent rectangle) To do).
Therefore, the rectangular size determination module 140 and the rectangular division processing module 150 set a rectangular area in the character string image that has been thinned by the thinning processing module 130.

ハフ変換処理モジュール160は、矩形分割処理モジュール150、閾値処理モジュール170と接続されており、矩形分割処理モジュール150によって分割された矩形の画像に対して、ハフ(Hough)変換を行い、その処理結果を閾値処理モジュール170へ渡す。ハフ変換は、直線の検出を行うものであり、中心(原点)から対象とする直線までの距離(その直線に引いた法線の長さ)と角度の組を算出し、それを計数する。なお、ハフ変換の処理結果とは、中心(原点)から対象とする直線までの距離と角度の組と、その組の計数結果(以下、高さともいう)である。例えば、図7に示すように、中心から直線までの距離の軸、角度の軸、高さの軸によって構成されるハフ空間上で、表現することができる。   The Hough conversion processing module 160 is connected to the rectangular division processing module 150 and the threshold processing module 170, performs Hough conversion on the rectangular image divided by the rectangular division processing module 150, and the processing result To the threshold processing module 170. The Hough transform is to detect a straight line, and calculates a pair of a distance (length of a normal line drawn on the straight line) and an angle from the center (origin) to the target straight line and counts it. The Hough transform processing result is a set of distance and angle from the center (origin) to the target straight line, and a counting result (hereinafter also referred to as height) of the set. For example, as shown in FIG. 7, it can be expressed on a Hough space constituted by an axis of distance from the center to a straight line, an axis of angle, and an axis of height.

閾値処理モジュール170は、ハフ変換処理モジュール160、特徴抽出モジュール180と接続されており、ハフ変換処理モジュール160によるハフ変換の処理結果の高さに対して、予め定められた閾値と比較することによって、その処理結果を選択し、選択した処理結果を特徴抽出モジュール180へ渡す。ここでの選択処理は、線分情報ではないと判断されるものを除外する処理である。例えば、高さがその閾値より大きい特徴量(前述の選択した処理結果に該当し、これを矩形特徴量ともいう)を、文字を構成する線分の方向情報として抽出する。また、この閾値は、矩形サイズ決定モジュール140によって決定された矩形の大きさに基づいて設定するようにしてもよい。例えば、矩形の大きさと対応付けて閾値を記憶しているテーブルを予め用意しておき、このテーブルを用いて、矩形の大きさから閾値を設定する。また、矩形の大きさが大きくなれば、閾値も大きくなるような関数に基づいて、矩形の大きさから閾値を設定するようにしてもよい。なお、処理結果を選択するとは、そのまま処理結果を選択することの他に、処理結果の高さから閾値を引き、その結果0以下となったものを削除してもよい。結果として、高さが閾値分減少した処理結果が選択されたことになる。なお、閾値処理モジュール170はなくてもよい。つまり、ハフ変換処理モジュール160によるハフ変換の処理結果を特徴抽出モジュール180に渡すようにしてもよい。
また、閾値処理モジュール170は、ハフ変換処理モジュール160によるハフ変換の各矩形の処理結果に対して重みづけを行うようにしてもよい。そして、前述した選択処理によって、重みづけを行った処理結果を選択するようにしてもよい。なお、後述する加算処理モジュール910による処理を行う場合は、この処理を行う。
The threshold processing module 170 is connected to the Hough conversion processing module 160 and the feature extraction module 180, and compares the height of the Hough conversion processing result by the Hough conversion processing module 160 with a predetermined threshold. The processing result is selected, and the selected processing result is passed to the feature extraction module 180. The selection process here is a process for excluding those determined not to be line segment information. For example, a feature amount whose height is greater than the threshold (corresponding to the above-described selected processing result, which is also referred to as a rectangular feature amount) is extracted as direction information of a line segment constituting the character. Further, this threshold value may be set based on the size of the rectangle determined by the rectangle size determination module 140. For example, a table storing threshold values in association with the size of a rectangle is prepared in advance, and the threshold value is set from the size of the rectangle using this table. Further, the threshold may be set from the size of the rectangle based on a function that increases the threshold as the size of the rectangle increases. In addition to selecting the processing result as it is, selecting the processing result may be performed by subtracting the threshold value from the height of the processing result and deleting the result that is 0 or less. As a result, the processing result whose height is reduced by the threshold value is selected. Note that the threshold processing module 170 may not be provided. That is, the Hough conversion processing result by the Hough conversion processing module 160 may be passed to the feature extraction module 180.
Further, the threshold processing module 170 may weight each rectangular processing result of the Hough conversion performed by the Hough conversion processing module 160. And you may make it select the process result which weighted by the selection process mentioned above. In addition, this process is performed when the process by the addition process module 910 mentioned later is performed.

特徴抽出モジュール180は、閾値処理モジュール170、距離測定モジュール185と接続されており、閾値処理モジュール170によって選択された処理結果の角度に基づいて特徴を抽出し、抽出した特徴を距離測定モジュール185へ渡す。特徴抽出モジュール180内のモジュール構成例、処理例等は、図9〜図20を用いて後述する。なお、閾値処理モジュール170がない場合は、ハフ変換処理モジュール160によるハフ変換の処理結果を対象とする。そして、その処理結果の線分の角度情報と、その高さ情報を特徴として抽出する。なお、ハフ変換の処理結果として高さ情報は、線分の長さと線分らしさを表している。   The feature extraction module 180 is connected to the threshold processing module 170 and the distance measurement module 185, extracts a feature based on the angle of the processing result selected by the threshold processing module 170, and sends the extracted feature to the distance measurement module 185. hand over. A module configuration example, a processing example, and the like in the feature extraction module 180 will be described later with reference to FIGS. When there is no threshold processing module 170, the processing result of the Hough conversion by the Hough conversion processing module 160 is targeted. Then, the angle information and the height information of the line segment of the processing result are extracted as features. Note that the height information as the processing result of the Hough transform represents the length of the line segment and the likelihood of the line segment.

距離測定モジュール185は、特徴抽出モジュール180、判定モジュール190と接続されており、特徴空間における活字の特徴と特徴抽出モジュール180によって抽出された特徴との距離を測定する。ここでの活字の特徴とは、いわゆる教師データであり、予め活字について特徴抽出して作成されたものである。
判定モジュール190は、距離測定モジュール185、出力モジュール195と接続されており、距離測定モジュール185によって測定された距離に基づいて、文字列画像内の文字列は活字又は手書きのいずれであるかを判定し、判定結果を出力モジュール195へ渡す。例えば、距離測定モジュール185によって測定された距離が予め定められた範囲内にあれば、活字であると判定し、それ以外の場合は手書き文字であると判定する。
The distance measurement module 185 is connected to the feature extraction module 180 and the determination module 190, and measures the distance between the type feature in the feature space and the feature extracted by the feature extraction module 180. The feature of the type here is so-called teacher data, which is created by extracting the feature of the type in advance.
The determination module 190 is connected to the distance measurement module 185 and the output module 195. Based on the distance measured by the distance measurement module 185, it is determined whether the character string in the character string image is printed or handwritten. The determination result is passed to the output module 195. For example, if the distance measured by the distance measurement module 185 is within a predetermined range, it is determined to be a printed character, and otherwise it is determined to be a handwritten character.

出力モジュール195は、判定モジュール190と接続されており、判定モジュール190による判定結果を出力する。出力先は、記憶装置であってもよいし、通信回線を介して他の情報処理装置であってもよい。例えば、出力先の情報処理装置として、次のような処理を行う。
(1)活字と手書き文字が混在している文書に対して文字認識を行う際、本実施の形態による処理を行って、活字部分は活字用文字認識装置、手書き文字部分は手書き用文字認識装置を使用する。
(2)本実施の形態による処理を行って、手書きで追記した部分を判別し、その部分を消去して、原画像を再生する。
(3)文書の画像の中から手書きで追記した文書を検索する。
The output module 195 is connected to the determination module 190 and outputs a determination result by the determination module 190. The output destination may be a storage device or another information processing apparatus via a communication line. For example, the following processing is performed as an output destination information processing apparatus.
(1) When character recognition is performed on a document in which printed characters and handwritten characters are mixed, the processing according to the present embodiment is performed, and the printed character portion is a printed character recognition device, and the handwritten character portion is a handwritten character recognition device. Is used.
(2) The process according to the present embodiment is performed to determine the part added by handwriting, erase the part, and reproduce the original image.
(3) A document added by handwriting is retrieved from the document image.

図2は、本実施の形態による処理例を示すフローチャートである。
ステップS202では、画像受付モジュール110が、画像を受け付ける。
ステップS204では、文字列抽出モジュール120が、構造解析を行い、文字列の画像を抽出する。例えば、図3に示した文字列画像300を抽出する。ここでは、横書きの文字列の画像を抽出した例である。
ステップS206では、細線化処理モジュール130が、文字列画像に対して細線化処理を行う。例えば、図3に示した文字列画像300に対して、細線化処理を施した結果が図4に示した細線化画像400である。太さのある線分を1ドットの線分に変換している。
FIG. 2 is a flowchart showing an example of processing according to this embodiment.
In step S202, the image reception module 110 receives an image.
In step S204, the character string extraction module 120 performs structural analysis and extracts a character string image. For example, the character string image 300 shown in FIG. 3 is extracted. In this example, an image of a horizontally written character string is extracted.
In step S206, the thinning processing module 130 performs thinning processing on the character string image. For example, the thinned image 400 shown in FIG. 4 is the result of thinning the character string image 300 shown in FIG. A thick line segment is converted into a 1-dot line segment.

ステップS208では、矩形サイズ決定モジュール140が、矩形サイズを決定する。例えば、図5に示した細線化画像400内の文字画像の文字高さ510を矩形(正方形)の一辺の大きさとして矩形サイズを決定している。
ステップS210では、矩形分割処理モジュール150が、文字列画像を矩形サイズを用いて矩形の画像に分割する。図6は、文字列画像を矩形分割処理モジュール150によって分割する矩形の例を示す説明図である。この例では、細線化画像400を矩形611〜618の8つの矩形の画像に分割している。なお、ここでは、矩形が重ならないように順に分割している。また、矩形内には、1文字とは限らず、複数文字(代表的には2文字)があってもよい。
In step S208, the rectangle size determination module 140 determines the rectangle size. For example, the rectangle size is determined with the character height 510 of the character image in the thinned image 400 shown in FIG. 5 as the size of one side of the rectangle (square).
In step S210, the rectangular division processing module 150 divides the character string image into rectangular images using the rectangular size. FIG. 6 is an explanatory diagram illustrating an example of a rectangle in which a character string image is divided by the rectangle division processing module 150. In this example, the thinned image 400 is divided into eight rectangular images of rectangles 611 to 618. Here, the rectangles are divided in order so as not to overlap. Further, the rectangle is not limited to one character, and may include a plurality of characters (typically two characters).

ステップS212では、ハフ変換処理モジュール160が、各々の矩形の画像に対してハフ変換処理を施す。図7は、ハフ変換処理モジュール160によるハフ変換の処理結果の例を示す説明図である。これは、図6に例示した矩形611に対するハフ変換の処理結果をグラフ表現したものである。
ステップS214では、閾値処理モジュール170が、ハフ変換の処理結果に対して閾値処理を施す。図8は、閾値処理モジュール170による閾値処理の結果の例を示す説明図である。これは、図7に例示したハフ変換の処理結果に対して閾値処理を施したものである。つまり、予め定められた閾値より大きい高さの処理結果を取り出したものである。なお、前述したようにステップS214はなくてもよい。
In step S212, the Hough conversion processing module 160 performs a Hough conversion process on each rectangular image. FIG. 7 is an explanatory diagram illustrating an example of the result of the Hough conversion processing performed by the Hough conversion processing module 160. This is a graph representation of the processing result of the Hough transform for the rectangle 611 illustrated in FIG.
In step S214, the threshold processing module 170 performs threshold processing on the processing result of the Hough transform. FIG. 8 is an explanatory diagram illustrating an example of a result of threshold processing by the threshold processing module 170. This is obtained by performing threshold processing on the processing result of the Hough transform exemplified in FIG. That is, a processing result having a height higher than a predetermined threshold is extracted. As described above, step S214 is not necessary.

ステップS216では、特徴抽出モジュール180が、特徴抽出処理を行う。
ステップS218では、距離測定モジュール185が、ステップS216で抽出された特徴と活字の教師データとの距離を測定する。
ステップS220では、判定モジュール190が、対象としている文字列の画像は手書き文字か活字であるかを判定する。
ステップS222では、出力モジュール195が、判定結果を出力する。
In step S216, the feature extraction module 180 performs feature extraction processing.
In step S218, the distance measurement module 185 measures the distance between the feature extracted in step S216 and the teacher data of the type.
In step S220, the determination module 190 determines whether the image of the target character string is a handwritten character or a printed character.
In step S222, the output module 195 outputs a determination result.

図9は、特徴抽出モジュール180内の構成例についての概念的なモジュール構成図(1)である。
特徴抽出モジュール180は、加算処理モジュール910、ヒストグラム作成処理モジュール920、ピーク抽出モジュール930、ピーク処理モジュール940、特徴量格納モジュール950を有している。
FIG. 9 is a conceptual module configuration diagram (1) for a configuration example in the feature extraction module 180.
The feature extraction module 180 includes an addition processing module 910, a histogram creation processing module 920, a peak extraction module 930, a peak processing module 940, and a feature amount storage module 950.

加算処理モジュール910は、ヒストグラム作成処理モジュール920と接続されており、閾値処理モジュール170によって選択された各矩形の処理結果を加算する。ここで、処理結果を加算するとは、処理結果のうち中心から直線までの距離と角度が一致するものの高さを加算することをいう。
ヒストグラム作成処理モジュール920は、加算処理モジュール910、ピーク抽出モジュール930と接続されており、加算処理モジュール910による処理結果の角度における分布(以下、ヒストグラムともいう)を作成する。例えば、図13に示すようなグラフになる。これは、ハフ空間における角度の軸に対して、加算処理モジュール910による処理によって残ったハフ変換の処理結果の個数を計数している。計数した結果は、その角度における頻度となる。
ピーク抽出モジュール930は、ヒストグラム作成処理モジュール920、ピーク処理モジュール940と接続されており、ヒストグラム作成処理モジュール920によって作成されたヒストグラム内の頻度と予め定められた値を比較することによって、その処理結果内から第1の値を抽出する。第1の値を、以下、ピーク値という。例えば、予め定められた値よりも大きい値の頻度を示している角度をピーク値として抽出する。
The addition processing module 910 is connected to the histogram creation processing module 920 and adds the processing results of each rectangle selected by the threshold processing module 170. Here, adding the processing results means adding the heights of the processing results having the same distance and angle from the center to the straight line.
The histogram creation processing module 920 is connected to the addition processing module 910 and the peak extraction module 930, and creates a distribution (hereinafter also referred to as a histogram) in the angle of the processing result by the addition processing module 910. For example, the graph is as shown in FIG. This counts the number of processing results of the Hough transform remaining by the processing by the addition processing module 910 with respect to the angle axis in the Hough space. The counted result is the frequency at that angle.
The peak extraction module 930 is connected to the histogram creation processing module 920 and the peak processing module 940, and compares the frequency in the histogram created by the histogram creation processing module 920 with a predetermined value to obtain the processing result. A first value is extracted from the inside. Hereinafter, the first value is referred to as a peak value. For example, an angle indicating the frequency of a value larger than a predetermined value is extracted as a peak value.

ピーク処理モジュール940は、ピーク抽出モジュール930、特徴量格納モジュール950と接続されており、ピーク・教師データ比較モジュール942、ピーク周囲分散算出モジュール944を有している。
ピーク・教師データ比較モジュール942は、ピーク抽出モジュール930によって抽出されたピーク値と予め定められた値との差を特徴量として抽出する。予め定められた値としては、例えば、図11に例示する教師データテーブル1100のように、教師データである活字の文字画像に対しての処理結果(画像受付モジュール110から閾値処理モジュール170、加算処理モジュール910からピーク・教師データ比較モジュール942までの処理を行った結果)であってもよいし、教師データに対しての処理結果を用いずに90度、180度、45度等の値であってもよい。これらは、活字の文字画像内で頻繁に出現する文字を構成する線の角度である。したがって、この差が小さい場合は活字の可能性が高いことを示しており、この差が大きい場合は手書き文字の可能性が高いことを示している。判定モジュール190が、この特徴量(差)を用いる場合は、この差と予め定められた値との比較によって、文字列画像内の文字列は活字又は手書きのいずれであるかを判定する。
The peak processing module 940 is connected to the peak extraction module 930 and the feature amount storage module 950, and includes a peak / teacher data comparison module 942 and a peak surrounding variance calculation module 944.
The peak / teacher data comparison module 942 extracts the difference between the peak value extracted by the peak extraction module 930 and a predetermined value as a feature amount. As the predetermined value, for example, as in the teacher data table 1100 illustrated in FIG. 11, the processing result (the image processing module 110 to the threshold processing module 170, the addition processing) Results of processing from the module 910 to the peak / teacher data comparison module 942), or values such as 90 degrees, 180 degrees, and 45 degrees without using the processing results for the teacher data. May be. These are angles of lines constituting characters that frequently appear in the character image of the type. Therefore, when this difference is small, it indicates that the possibility of printed characters is high, and when this difference is large, it indicates that the possibility of handwritten characters is high. When the determination module 190 uses this feature amount (difference), it is determined whether the character string in the character string image is printed or handwritten by comparing this difference with a predetermined value.

ピーク周囲分散算出モジュール944は、ピーク抽出モジュール930によって抽出されたピーク値に対して予め定められた範囲内(以下、ピーク値の周囲ともいう)における加算処理モジュール910による処理結果の分散を特徴量として抽出する。予め定められた範囲としては、例えば、ピーク値を中心としてそのピーク値から予め定められた距離以内であることをいう。この特徴量は線分の方向一致度を示していることになる。この範囲内における分散が小さい場合は活字の可能性が高いことを示しており、この差が大きい場合は手書き文字の可能性が高いことを示している。活字の場合は、予め定められた文字であるためブレが少ないが、手書き文字であるとブレが発生するためである。判定モジュール190が、この特徴量(分散)を用いる場合は、この分散と予め定められた値との比較によって、文字列画像内の文字列は活字又は手書きのいずれであるかを判定する。
なお、ピーク・教師データ比較モジュール942、ピーク周囲分散算出モジュール944は、いずれか一方だけであってもよいし、両方あってもよい。
特徴量格納モジュール950は、ピーク処理モジュール940と接続されており、ピーク・教師データ比較モジュール942、ピーク周囲分散算出モジュール944のいずれか一方、又は両方によって抽出された特徴量を記憶装置に記憶する。距離測定モジュール185、判定モジュール190は、この記憶装置に記憶された特徴量を用いる。
The peak circumference variance calculation module 944 calculates the variance of the processing result by the addition processing module 910 within a predetermined range (hereinafter also referred to as the circumference of the peak value) with respect to the peak value extracted by the peak extraction module 930. Extract as The predetermined range is, for example, within a predetermined distance from the peak value with the peak value as the center. This feature amount indicates the degree of line direction coincidence. When the variance within this range is small, it indicates that the possibility of printing is high, and when this difference is large, it indicates that the possibility of handwritten characters is high. This is because in the case of printed characters, there is little blur because it is a predetermined character, but blurring occurs if it is a handwritten character. When the determination module 190 uses this feature amount (dispersion), the character string in the character string image is determined to be a printed character or a handwritten character by comparing the distribution with a predetermined value.
Note that either one or both of the peak / teacher data comparison module 942 and the peak circumference dispersion calculation module 944 may be provided.
The feature amount storage module 950 is connected to the peak processing module 940 and stores the feature amount extracted by one or both of the peak / teacher data comparison module 942 and the peak surrounding variance calculation module 944 in the storage device. . The distance measurement module 185 and the determination module 190 use the feature values stored in this storage device.

図10は、特徴抽出モジュール180による処理例を示すフローチャートである。
ステップS1002では、加算処理モジュール910が、各矩形において閾値処理されたハフ変換の処理結果を加算する。図12は、加算処理モジュール910による加算処理の結果の例を示す説明図である。図6に例示した矩形611〜618の画像に対してハフ変換処理モジュール160、閾値処理モジュール170による処理結果の高さを加算したものである。
ステップS1004では、ヒストグラム作成処理モジュール920が、角度についてのヒストグラムを作成する。図13は、ピーク・教師データ比較モジュール942の処理の例を示す説明図である。図12に例示した加算結果の角度における頻度分布を生成したものである。
FIG. 10 is a flowchart illustrating an example of processing performed by the feature extraction module 180.
In step S1002, the addition processing module 910 adds the Hough transform processing results subjected to threshold processing in each rectangle. FIG. 12 is an explanatory diagram showing an example of the result of the addition processing by the addition processing module 910. The heights of the processing results obtained by the Hough conversion processing module 160 and the threshold processing module 170 are added to the images of the rectangles 611 to 618 illustrated in FIG.
In step S1004, the histogram creation processing module 920 creates a histogram for the angle. FIG. 13 is an explanatory diagram showing an example of processing of the peak / teacher data comparison module 942. The frequency distribution in the angle of the addition result illustrated in FIG. 12 is generated.

ステップS1006では、ピーク抽出モジュール930が、ヒストグラム内のピーク値を抽出する。図13に示した例では、0度、90度、180度の近辺をピーク値として抽出する。
ステップS1008では、ピーク・教師データ比較モジュール942が、ピーク値と教師データを比較することによって、その差を算出する。
In step S1006, the peak extraction module 930 extracts the peak value in the histogram. In the example shown in FIG. 13, the vicinity of 0 degrees, 90 degrees, and 180 degrees is extracted as a peak value.
In step S1008, the peak / teacher data comparison module 942 calculates the difference by comparing the peak value with the teacher data.

ステップS1010では、ピーク周囲分散算出モジュール944が、ピーク値の周囲の分散を算出する。
ステップS1012では、特徴量格納モジュール950が、特徴量を格納する。
なお、ステップS1008、ステップS1010の処理は、いずれか一方であってもよい。また、いずれを先に行ってもよいし、並列して処理を行ってもよい。
In step S1010, the peak circumference variance calculation module 944 calculates the variance around the peak value.
In step S1012, the feature amount storage module 950 stores the feature amount.
Note that either one of the processes in steps S1008 and S1010 may be performed. In addition, either may be performed first, or processing may be performed in parallel.

図14は、特徴抽出モジュール180内の構成例についての概念的なモジュール構成図(2)である。
特徴抽出モジュール180は、ピーク抽出モジュール1410、ピーク特徴抽出モジュール1420、特徴量格納モジュール1430を有している。
FIG. 14 is a conceptual module configuration diagram (2) of the configuration example in the feature extraction module 180.
The feature extraction module 180 includes a peak extraction module 1410, a peak feature extraction module 1420, and a feature amount storage module 1430.

ピーク抽出モジュール1410は、ピーク特徴抽出モジュール1420と接続されており、閾値処理モジュール170によって選択された各矩形のハフ変換の処理結果(矩形特徴量)を予め定められた値と比較することによって、その処理結果内から第2の値を抽出する。第2の値を、以下、ピーク値という。例えば、予め定められた値よりも大きい値の高さを示しているものをピーク値として抽出する。
ピーク特徴抽出モジュール1420は、ピーク抽出モジュール1410、特徴量格納モジュール1430と接続されており、ピーク抽出モジュール1410によって抽出されたピーク値の高さと角度を特徴量として抽出する。判定モジュール190が、この特徴量(ピーク値の高さと角度の組)を用いる場合は、このピーク値の高さと角度の組の分散と予め定められた値との比較によって、文字列画像内の文字列は活字又は手書きのいずれであるかを判定する。活字であるならば分散が小さくなり、手書き文字であるならばブレの発生によって分散が大きくなることを用いている。
特徴量格納モジュール1430は、ピーク特徴抽出モジュール1420と接続されており、ピーク特徴抽出モジュール1420によって抽出された特徴量を記憶装置に記憶する。距離測定モジュール185、判定モジュール190は、この記憶装置に記憶された特徴量を用いる。
The peak extraction module 1410 is connected to the peak feature extraction module 1420, and by comparing the processing result (rectangular feature amount) of each rectangle selected by the threshold processing module 170 with a predetermined value, A second value is extracted from the processing result. Hereinafter, the second value is referred to as a peak value. For example, a peak value that is higher than a predetermined value is extracted as a peak value.
The peak feature extraction module 1420 is connected to the peak extraction module 1410 and the feature amount storage module 1430, and extracts the height and angle of the peak value extracted by the peak extraction module 1410 as the feature amount. When the determination module 190 uses this feature amount (a pair of peak value height and angle), a comparison between the distribution of the peak value height and angle pair and a predetermined value is performed to determine whether or not the character string image includes It is determined whether the character string is printed or handwritten. It is used that the dispersion is small if it is a type, and the dispersion is large due to blurring if it is a handwritten character.
The feature quantity storage module 1430 is connected to the peak feature extraction module 1420, and stores the feature quantity extracted by the peak feature extraction module 1420 in a storage device. The distance measurement module 185 and the determination module 190 use the feature values stored in this storage device.

図15は、特徴抽出モジュール180による処理例を示すフローチャートである。
ステップS1502では、ピーク抽出モジュール1410が、各矩形において閾値処理されたハフ変換の処理結果からピーク値を抽出する。図16は、ピーク抽出モジュール1410による処理例を示す説明図である。図8に例示した閾値処理された結果では、ピーク1612、ピーク1614、ピーク1616の3つを抽出している。
ステップS1504では、ピーク特徴抽出モジュール1420が、ピーク値の高さと角度をその矩形の特徴として抽出する。図17は、ピーク特徴抽出モジュール1420による処理例を示す説明図である。特徴量として抽出したピーク値の高さと角度を、高さと角度の2次元空間にマッピングしたものである。
ステップS1506では、特徴量格納モジュール1430が、特徴量を格納する。
FIG. 15 is a flowchart illustrating an example of processing performed by the feature extraction module 180.
In step S1502, the peak extraction module 1410 extracts a peak value from the Hough transform processing result subjected to threshold processing in each rectangle. FIG. 16 is an explanatory diagram showing an example of processing by the peak extraction module 1410. In the result of the threshold processing illustrated in FIG. 8, three peaks 1612, 1614, and 1616 are extracted.
In step S1504, the peak feature extraction module 1420 extracts the height and angle of the peak value as the rectangular feature. FIG. 17 is an explanatory diagram illustrating an example of processing performed by the peak feature extraction module 1420. The height and angle of the peak value extracted as the feature amount are mapped in a two-dimensional space of height and angle.
In step S1506, the feature amount storage module 1430 stores the feature amount.

図18は、特徴抽出モジュール180内の構成例についての概念的なモジュール構成図(3)である。
特徴抽出モジュール180は、分散算出モジュール1810、分散合計・高さ抽出モジュール1820、特徴量格納モジュール1830を有している。
FIG. 18 is a conceptual module configuration diagram (3) of the configuration example in the feature extraction module 180.
The feature extraction module 180 includes a variance calculation module 1810, a variance total / height extraction module 1820, and a feature quantity storage module 1830.

分散算出モジュール1810は、分散合計・高さ抽出モジュール1820と接続されており、予め定められた値に対して予め定められた範囲内(以下、代表角度の周囲ともいう)における閾値処理モジュール170によって選択された各矩形のハフ変換の処理結果(矩形特徴量)の分散を算出する。角度について、活字の教師データの代表角度(水平(0度、180度)、垂直(90度)、斜体角度(45度、135度等)等)周囲のデータの角度方向の分散を算出する。   The variance calculation module 1810 is connected to the variance total / height extraction module 1820 and is executed by the threshold processing module 170 within a predetermined range with respect to a predetermined value (hereinafter also referred to as the periphery of the representative angle). The variance of the Hough transform processing result (rectangular feature value) of each selected rectangle is calculated. Regarding the angle, the variance in the angular direction of the data around the representative angle (horizontal (0 degree, 180 degree), vertical (90 degree), italic angle (45 degree, 135 degree, etc.)) of the teacher data of the type is calculated.

分散合計・高さ抽出モジュール1820は、分散算出モジュール1810、特徴量格納モジュール1830と接続されており、分散算出モジュール1810によって算出された各矩形の分散の合計と高さを特徴量として抽出する。前述のように、活字の教師データの代表角度は複数あるので、その代表角度の周囲における各分散を合計する。また、高さは、分散の対象となった矩形特徴量の高さの平均、最頻値等を用いるようにしてもよい。
判定モジュール190が、この特徴量(分散の合計と高さの組)を用いる場合は、この分散の合計と高さの組を2次元空間にマッピングし、予め定めた閾値との位置関係によって、文字列画像内の文字列は活字又は手書きのいずれであるかを判定する。図20は、分散合計・高さ抽出モジュール1820による処理例を示す説明図である。横軸に教師データの代表角度の周囲における矩形特徴量の分散の合計をとり、縦軸に高さをとった2次元空間に、各矩形の特徴量をマッピングしたものである。閾値2010の上側(活字領域2020)は、文字を構成している直線にブレがないので、ピーク値が高くなりやすく、その角度にもブレがないので、教師データに対しての分散も小さくなる。閾値2010の下側(手書き文字領域2030)は、活字に比べると文字を構成している直線にブレが発生しており、ピークの値が低くなりやすく、また、活字のように直角、水平等にはなりにくいため、教師データに対しての分散が大きくなる。
The variance total / height extraction module 1820 is connected to the variance calculation module 1810 and the feature amount storage module 1830, and extracts the total variance and height of each rectangle calculated by the variance calculation module 1810 as a feature amount. As described above, since there are a plurality of representative angles of the teacher data of the type, the variances around the representative angle are summed up. Further, as the height, an average height, a mode value, or the like of the rectangular feature amount that is a target of dispersion may be used.
When the determination module 190 uses this feature amount (a combination of the total variance and the height), the combination of the total variance and the height is mapped in a two-dimensional space, and the positional relationship with a predetermined threshold value is used. It is determined whether the character string in the character string image is printed or handwritten. FIG. 20 is an explanatory diagram showing an example of processing by the variance total / height extraction module 1820. The feature values of each rectangle are mapped in a two-dimensional space in which the horizontal axis represents the total variance of the rectangular feature values around the representative angle of the teacher data and the vertical axis represents the height. On the upper side of the threshold 2010 (type region 2020), since there is no blur in the straight lines constituting the character, the peak value tends to be high, and there is no blur in the angle, so the variance for the teacher data is also small. . On the lower side of the threshold 2010 (handwritten character region 2030), the straight lines constituting the characters are blurred compared to the printed characters, the peak value tends to be low, and the characters are perpendicular, horizontal, etc. Since it is hard to become, the dispersion | distribution with respect to teacher data becomes large.

特徴量格納モジュール1830は、分散合計・高さ抽出モジュール1820と接続されており、分散合計・高さ抽出モジュール1820によって抽出された特徴量を記憶装置に記憶する。距離測定モジュール185、判定モジュール190は、この記憶装置に記憶された特徴量を用いる。   The feature quantity storage module 1830 is connected to the variance total / height extraction module 1820 and stores the feature quantity extracted by the variance total / height extraction module 1820 in a storage device. The distance measurement module 185 and the determination module 190 use the feature values stored in this storage device.

図19は、特徴抽出モジュール180による処理例を示すフローチャートである。
ステップS1902では、分散算出モジュール1810が、教師データの周囲の分散を算出する。
ステップS1904では、分散合計・高さ抽出モジュール1820が、分散の合計と高さをその矩形の特徴として抽出する。
ステップS1906では、特徴量格納モジュール1830が、特徴量を格納する。
FIG. 19 is a flowchart illustrating an example of processing performed by the feature extraction module 180.
In step S1902, the variance calculation module 1810 calculates the variance around the teacher data.
In step S1904, the variance total / height extraction module 1820 extracts the variance total and height as features of the rectangle.
In step S1906, the feature amount storage module 1830 stores the feature amount.

図21を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図21に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部2117と、プリンタなどのデータ出力部2118を備えたハードウェア構成例を示している。   A hardware configuration example of the image processing apparatus according to the present embodiment will be described with reference to FIG. The configuration shown in FIG. 21 is configured by a personal computer (PC), for example, and shows a hardware configuration example including a data reading unit 2117 such as a scanner and a data output unit 2118 such as a printer.

CPU2101は、前述の実施の形態において説明した各種のモジュール、すなわち、文字列抽出モジュール120、細線化処理モジュール130、矩形サイズ決定モジュール140、矩形分割処理モジュール150、ハフ変換処理モジュール160、閾値処理モジュール170、特徴抽出モジュール180、距離測定モジュール185、判定モジュール190等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。   The CPU 2101 includes various modules described in the above-described embodiments, that is, the character string extraction module 120, the thinning processing module 130, the rectangular size determination module 140, the rectangular division processing module 150, the Hough conversion processing module 160, and the threshold processing module. 170 is a control unit that executes processing according to a computer program describing an execution sequence of each module such as 170, feature extraction module 180, distance measurement module 185, and determination module 190.

ROM(Read Only Memory)2102は、CPU2101が使用するプログラムや演算パラメータ等を格納する。RAM2103は、CPU2101の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス2104により相互に接続されている。   A ROM (Read Only Memory) 2102 stores programs used by the CPU 2101, calculation parameters, and the like. The RAM 2103 stores programs used in the execution of the CPU 2101, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 2104 including a CPU bus.

ホストバス2104は、ブリッジ2105を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス2106に接続されている。   The host bus 2104 is connected to an external bus 2106 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 2105.

キーボード2108、マウス等のポインティングデバイス2109は、操作者により操作される入力デバイスである。ディスプレイ2110は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。   A keyboard 2108 and a pointing device 2109 such as a mouse are input devices operated by an operator. The display 2110 includes a liquid crystal display device or a CRT (Cathode Ray Tube), and displays various types of information as text or image information.

HDD(Hard Disk Drive)2111は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU2101によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、受け付けた画像、文字列画像、特徴抽出モジュール180の結果データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。   An HDD (Hard Disk Drive) 2111 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 2101 and information. The hard disk stores received images, character string images, result data of the feature extraction module 180, and the like. Further, various computer programs such as various other data processing programs are stored.

ドライブ2112は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体2113に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース2107、外部バス2106、ブリッジ2105、及びホストバス2104を介して接続されているRAM2103に供給する。リムーバブル記録媒体2113も、ハードディスクと同様のデータ記録領域として利用可能である。   The drive 2112 reads data or a program recorded on a removable recording medium 2113 such as a mounted magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and reads the data or program as an interface 2107 or an external bus 2106. , The bridge 2105, and the RAM 2103 connected via the host bus 2104. The removable recording medium 2113 can also be used as a data recording area similar to the hard disk.

接続ポート2114は、外部接続機器2115を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート2114は、インタフェース2107、及び外部バス2106、ブリッジ2105、ホストバス2104等を介してCPU2101等に接続されている。通信部2116は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部2117は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部2118は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。   The connection port 2114 is a port for connecting the external connection device 2115 and has a connection unit such as USB, IEEE1394. The connection port 2114 is connected to the CPU 2101 and the like via the interface 2107, the external bus 2106, the bridge 2105, the host bus 2104, and the like. A communication unit 2116 is connected to the network and executes data communication processing with the outside. The data reading unit 2117 is a scanner, for example, and executes document reading processing. The data output unit 2118 is a printer, for example, and executes document data output processing.

なお、図21に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図21に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図21に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。   Note that the hardware configuration of the image processing apparatus shown in FIG. 21 shows one configuration example, and the present embodiment is not limited to the configuration shown in FIG. 21, and the modules described in this embodiment are executed. Any configuration is possible. For example, some modules may be configured with dedicated hardware (for example, Application Specific Integrated Circuit (ASIC), etc.), and some modules are in an external system and connected via a communication line In addition, a plurality of the systems shown in FIG. 21 may be connected to each other via communication lines so as to cooperate with each other. Further, it may be incorporated in a copying machine, a fax machine, a scanner, a printer, a multifunction machine (an image processing apparatus having any two or more functions of a scanner, a printer, a copying machine, a fax machine, etc.).

なお、前述の実施の形態内の各種の特徴抽出モジュール180を組み合わせてもよく、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。例えば、特徴量として、ピーク・教師データ比較モジュール942、ピーク周囲分散算出モジュール944、ピーク特徴抽出モジュール1420、分散合計・高さ抽出モジュール1820のうちの2つ以上のモジュールによって抽出された特徴量を組み合わせてもよい。さらに、既存技術を用いた特徴量(文字同士の間隔の分散、上下のブレ、面積の分散等)と組み合わせてもよい。
そして、この特徴量の組み合わせによる特徴空間における距離を距離測定モジュール185は測定し、判定モジュール190は、分布の違いにより文字列画像内の文字列は活字又は手書きのいずれであるかを判定する。
Various feature extraction modules 180 in the above-described embodiments may be combined, and the technology described in the background art may be adopted as the processing content of each module. For example, as feature quantities, feature quantities extracted by two or more of the peak / teacher data comparison module 942, the peak circumference variance calculation module 944, the peak feature extraction module 1420, and the variance total / height extraction module 1820 are used. You may combine. Further, it may be combined with a feature amount using existing technology (dispersion of spacing between characters, vertical blur, area dispersion, etc.).
Then, the distance measurement module 185 measures the distance in the feature space based on the combination of the feature amounts, and the determination module 190 determines whether the character string in the character string image is a type or handwriting based on the difference in distribution.

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standard “DVD + R, DVD + RW, etc.”, compact disc (CD), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), Blu-ray disc ( Blu-ray Disc (registered trademark), magneto-optical disk (MO), flexible disk (FD), magnetic tape, hard disk, read-only memory (ROM), electrically erasable and rewritable read-only memory (EEPROM), flash Includes memory, random access memory (RAM), etc. .
The program or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.

110…画像受付モジュール
120…文字列抽出モジュール
130…細線化処理モジュール
140…矩形サイズ決定モジュール
150…矩形分割処理モジュール
160…ハフ変換処理モジュール
170…閾値処理モジュール
180…特徴抽出モジュール
185…距離測定モジュール
190…判定モジュール
195…出力モジュール
910…加算処理モジュール
920…ヒストグラム作成処理モジュール
930…ピーク抽出モジュール
940…ピーク処理モジュール
942…ピーク・教師データ比較モジュール
944…ピーク周囲分散算出モジュール
950…特徴量格納モジュール
1100…教師データテーブル
1410…ピーク抽出モジュール
1420…ピーク特徴抽出モジュール
1430…特徴量格納モジュール
1810…分散算出モジュール
1820…分散合計・高さ抽出モジュール
1830…特徴量格納モジュール
DESCRIPTION OF SYMBOLS 110 ... Image reception module 120 ... Character string extraction module 130 ... Thin line processing module 140 ... Rectangle size determination module 150 ... Rectangle division processing module 160 ... Hough conversion processing module 170 ... Threshold processing module 180 ... Feature extraction module 185 ... Distance measurement module 190 ... Determination module 195 ... Output module 910 ... Addition processing module 920 ... Histogram creation processing module 930 ... Peak extraction module 940 ... Peak processing module 942 ... Peak / teacher data comparison module 944 ... Peak peripheral variance calculation module 950 ... Feature quantity storage module 1100 ... Teacher data table 1410 ... Peak extraction module 1420 ... Peak feature extraction module 1430 ... Feature quantity storage module 1810 ... Variance calculation module 1820 ... Variance total / height extraction module 1830 ... Feature quantity storage module

Claims (7)

文字列を含む文字列画像に対して、細線情報に変換する細線変換手段と、
前記細線変換手段によって細線となった文字列画像内に矩形領域を設定する領域設定手段と、
前記領域設定手段によって設定された矩形領域に対して、ハフ変換を行うハフ変換手段と、
前記ハフ変換手段によるハフ変換の処理結果の線分の角度情報と、その高さ情報を特徴として抽出する特徴抽出手段と、
前記特徴抽出手段によって抽出された特徴に基づいて、前記文字列画像内の文字列は活字又は手書きのいずれであるかを判定する判定手段
を具備することを特徴とする画像処理装置。
Fine line conversion means for converting into a thin line information for a character string image including a character string,
Area setting means for setting a rectangular area in the character string image that has been turned into a thin line by the thin line conversion means;
Hough transforming means for performing Hough transform on the rectangular area set by the area setting means;
Feature extraction means for extracting the angle information of the line segment of the Hough transformation processing result by the Hough transformation means and the height information thereof as features,
An image processing apparatus comprising: a determination unit that determines whether a character string in the character string image is a type or a handwriting based on the feature extracted by the feature extraction unit.
前記特徴抽出手段は、
前記ハフ変換手段によるハフ変換の前記各矩形の処理結果に対して重みづけを行い、線分情報ではないと判断されるものを除外した該重みづけを行った処理結果を加算する加算手段と、
前記加算手段による処理結果を角度における分布と予め定められた値を比較することによって、該処理結果内から第1の値を抽出する第1の値抽出手段と、
前記第1の値抽出手段によって抽出された第1の値と予め定められた値との差を特徴量として抽出する第1の特徴量抽出手段
を具備することを特徴とする請求項1に記載の画像処理装置。
The feature extraction means includes
A weighting unit for weighting the processing result of each rectangle of the Hough transform by the Hough transforming unit, and an adding unit for adding the weighted processing result excluding those determined not to be line segment information;
A first value extracting means for extracting a first value from the processing result by comparing the processing result by the adding means with a distribution in angle and a predetermined value;
2. The first feature quantity extraction means for extracting, as a feature quantity, a difference between the first value extracted by the first value extraction means and a predetermined value. Image processing apparatus.
前記特徴抽出手段は、
前記ハフ変換手段によるハフ変換の前記各矩形の処理結果に対して重みづけを行い、線分情報ではないと判断されるものを除外した該重みづけを行った処理結果を加算する加算手段と、
前記加算手段による処理結果を角度における分布と予め定められた値を比較することによって、該処理結果内から第1の値を抽出する第1の値抽出手段と、
前記第1の値抽出手段によって抽出された第1の値に対して予め定められた範囲内における前記加算手段による処理結果の分散を特徴量として抽出する第2の特徴量抽出手段
を具備することを特徴とする請求項1に記載の画像処理装置。
The feature extraction means includes
A weighting unit for weighting the processing result of each rectangle of the Hough transform by the Hough transforming unit, and an adding unit for adding the weighted processing result excluding those determined not to be line segment information;
A first value extracting means for extracting a first value from the processing result by comparing the processing result by the adding means with a distribution in angle and a predetermined value;
A second feature amount extracting unit for extracting, as a feature amount, a variance of a processing result by the adding unit within a predetermined range with respect to the first value extracted by the first value extracting unit; The image processing apparatus according to claim 1.
前記特徴抽出手段は、
前記第1の値抽出手段によって抽出された第1の値に対して予め定められた範囲内における前記加算手段による処理結果の分散を特徴量として抽出する第2の特徴量抽出手段
をさらに具備することを特徴とする請求項2に記載の画像処理装置。
The feature extraction means includes
Second feature quantity extraction means for extracting, as a feature quantity, a variance of a processing result by the addition means within a predetermined range with respect to the first value extracted by the first value extraction means. The image processing apparatus according to claim 2.
前記特徴抽出手段は、
前記ハフ変換手段によるハフ変換の前記各矩形の処理結果を予め定められた値と比較することによって、該処理結果内から第2の値を抽出する第2の値抽出手段と、
前記第2の値抽出手段によって抽出された第2の値の高さと角度を特徴量として抽出する第3の特徴量抽出手段
を具備することを特徴とする請求項1から4のいずれか一項に記載の画像処理装置。
The feature extraction means includes
A second value extracting means for extracting a second value from the processing result by comparing the processing result of each rectangle of the Hough transform by the Hough transforming means with a predetermined value;
5. The apparatus according to claim 1, further comprising a third feature amount extraction unit that extracts, as a feature amount, a height and an angle of the second value extracted by the second value extraction unit. An image processing apparatus according to 1.
前記特徴抽出手段は、
予め定められた値に対して予め定められた範囲内における前記ハフ変換手段によるハフ変換の前記各矩形の処理結果の分散を算出する分散算出手段と、
前記分散算出手段によって算出された前記各矩形の分散の合計と高さを特徴量として抽出する第4の特徴量抽出手段
を具備することを特徴とする請求項1から4のいずれか一項に記載の画像処理装置。
The feature extraction means includes
Dispersion calculating means for calculating the dispersion of the processing results of the respective rectangles of the Hough transform by the Hough transform means within a predetermined range with respect to a predetermined value;
5. The method according to claim 1, further comprising: a fourth feature amount extraction unit that extracts a total and height of the variances of the rectangles calculated by the variance calculation unit as feature amounts. The image processing apparatus described.
コンピュータを、
文字列を含む文字列画像に対して、細線情報に変換する細線変換手段と、
前記細線変換手段によって細線となった文字列画像内に矩形領域を設定する領域設定手段と、
前記領域設定手段によって設定された矩形領域に対して、ハフ変換を行うハフ変換手段と、
前記ハフ変換手段によるハフ変換の処理結果の線分の角度情報と、その高さ情報を特徴として抽出する特徴抽出手段と、
前記特徴抽出手段によって抽出された特徴に基づいて、前記文字列画像内の文字列は活字又は手書きのいずれであるかを判定する判定手段
として機能させることを特徴とする画像処理プログラム。
Computer
Fine line conversion means for converting into a thin line information for a character string image including a character string,
Area setting means for setting a rectangular area in the character string image that has been turned into a thin line by the thin line conversion means;
Hough transforming means for performing Hough transform on the rectangular area set by the area setting means;
Feature extraction means for extracting the angle information of the line segment of the Hough transformation processing result by the Hough transformation means and the height information thereof as features,
An image processing program for causing a character string in the character string image to function as a determination unit that determines whether a character string is a type or a handwriting based on the feature extracted by the feature extraction unit.
JP2010157514A 2010-07-12 2010-07-12 Image processing apparatus and image processing program Expired - Fee Related JP5489894B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010157514A JP5489894B2 (en) 2010-07-12 2010-07-12 Image processing apparatus and image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010157514A JP5489894B2 (en) 2010-07-12 2010-07-12 Image processing apparatus and image processing program

Publications (2)

Publication Number Publication Date
JP2012022359A JP2012022359A (en) 2012-02-02
JP5489894B2 true JP5489894B2 (en) 2014-05-14

Family

ID=45776631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010157514A Expired - Fee Related JP5489894B2 (en) 2010-07-12 2010-07-12 Image processing apparatus and image processing program

Country Status (1)

Country Link
JP (1) JP5489894B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955669B (en) * 2014-04-10 2017-02-15 西安理工大学 Invoice date positioning method based on segmentation Hough transformation straight line detection
CN115277979B (en) * 2022-09-29 2022-12-16 南通第二世界网络科技有限公司 Asymmetric block independent encryption method based on image

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02250193A (en) * 1989-03-23 1990-10-05 Nec Corp Graphic/character separating system
JPH10162139A (en) * 1996-11-28 1998-06-19 Nikon Corp Image processor, and medium where image processing program is recorded
JPH10162102A (en) * 1996-12-03 1998-06-19 Ricoh Co Ltd Character recognition device
JP2003263643A (en) * 2002-03-07 2003-09-19 Univ Osaka Device and method for judging photographing direction
JP4140519B2 (en) * 2003-12-22 2008-08-27 富士ゼロックス株式会社 Image processing apparatus, program, and recording medium
JP2006092345A (en) * 2004-09-24 2006-04-06 Fuji Xerox Co Ltd Equipment, method, and program for character recognition

Also Published As

Publication number Publication date
JP2012022359A (en) 2012-02-02

Similar Documents

Publication Publication Date Title
US8768052B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
US10643097B2 (en) Image processing apparatuses and non-transitory computer readable medium
KR101248449B1 (en) Information processor, information processing method, and computer readable medium
JP5489894B2 (en) Image processing apparatus and image processing program
JP5601027B2 (en) Image processing apparatus and image processing program
US8805076B2 (en) Image processing apparatus, image processing method and computer readable medium
JP5365440B2 (en) Image processing apparatus and image processing program
JP5742283B2 (en) Image processing apparatus and image processing program
JP5640645B2 (en) Image processing apparatus and image processing program
JP5262778B2 (en) Image processing apparatus and image processing program
JP2011170481A (en) Image processing apparatus and image processing program
JP6003375B2 (en) Image processing apparatus and image processing program
US9258446B2 (en) Image processing apparatus
JP5821648B2 (en) Information processing apparatus and information processing program
JP6409423B2 (en) Image processing apparatus and image processing program
JP4995507B2 (en) Image processing system, character recognition system, and image processing program
JP5039449B2 (en) Image processing apparatus and image processing program
JP2013161158A (en) Image processing device and image processing program
JP2016053797A (en) Image processor and image processing program
JP6281309B2 (en) Image processing apparatus and image processing program
JP5991076B2 (en) Image processing apparatus and image processing program
JP5853495B2 (en) Image processing apparatus and image processing program
JP2009123155A (en) Image processor and image processing program
JP2010039810A (en) Image processor and image processing program
JP2010049336A (en) Image processor and image processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20130419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140225

R150 Certificate of patent or registration of utility model

Ref document number: 5489894

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees