JP6327963B2 - Character recognition device and character recognition method - Google Patents

Character recognition device and character recognition method Download PDF

Info

Publication number
JP6327963B2
JP6327963B2 JP2014119039A JP2014119039A JP6327963B2 JP 6327963 B2 JP6327963 B2 JP 6327963B2 JP 2014119039 A JP2014119039 A JP 2014119039A JP 2014119039 A JP2014119039 A JP 2014119039A JP 6327963 B2 JP6327963 B2 JP 6327963B2
Authority
JP
Japan
Prior art keywords
character
kanji
divided
character recognition
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014119039A
Other languages
Japanese (ja)
Other versions
JP2015232778A (en
Inventor
庸昂 堤
庸昂 堤
和樹 中島
和樹 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Information and Telecommunication Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information and Telecommunication Engineering Ltd filed Critical Hitachi Information and Telecommunication Engineering Ltd
Priority to JP2014119039A priority Critical patent/JP6327963B2/en
Priority to CN201510313899.7A priority patent/CN105320971B/en
Publication of JP2015232778A publication Critical patent/JP2015232778A/en
Application granted granted Critical
Publication of JP6327963B2 publication Critical patent/JP6327963B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、帳票等に記入された手書き文字を高精度に認識することができる文字認識装置及び文字認識方法に係り、特に、中国の簡体文字や台湾の繁体文字で記入された漢字文字を高精度且つ高速に認識することができる文字認識装置及び文字認識方法に関する。   The present invention relates to a character recognition apparatus and a character recognition method capable of recognizing handwritten characters entered on a form or the like with high accuracy, and in particular, Chinese characters written in simplified Chinese characters or traditional Chinese characters are enhanced. The present invention relates to a character recognition device and a character recognition method that can be recognized accurately and at high speed.

帳票等に記載された手書き漢字を光学的に読み取って文字認識を行う文字認識装置は、1文字毎に切り出した文字図形の特徴を抽出し、漢字構造が、漢字の左側に位置する偏(へん)と、漢字構造の右側に位置する旁(つくり)と、漢字構造の上側に位置する冠(かんむり)と、漢字構造の下側に位置する脚(あし)と、漢字構造全体を包むように位置する構(かまえ)と、漢字の上側から下側に垂れ下がるように位置する垂(たれ)と、漢字構造の左側から下側に沿うように位置する繞(にょう)との複数領域に配置された漢字要素の組み合わせにより構成させるため、各領域を分割するための分割領域を判別すると共に文字画像の特徴量をユークリッド距離値を用いて抽出し、文字認識を行うように構成されている。   A character recognition device that optically reads handwritten Chinese characters written on a form or the like and extracts character features extracted from each character, and the Chinese character structure is located on the left side of the Chinese character. ), 旁 located on the right side of the Chinese character structure, crown on the upper side of the Chinese character structure, leg located on the lower side of the Chinese character structure, and the entire Chinese character structure Arranged in multiple areas of the structure that is located, the hanging that is hung from the upper side to the lower side of the kanji, and the ridge that is located along the lower side from the left side of the kanji structure In order to form the combination of the kanji elements, the divided regions for dividing each region are discriminated, and the feature amount of the character image is extracted using the Euclidean distance value to perform character recognition.

この従来技術による文字認識処理は、文字認識装置のコンピュータが、図18に示す如く、文字画像の特徴を抽出するステップS1801と、該ステップS1801により抽出した特徴量に基づいて文字画像が漢字か非漢字かを判定するステップS1802と、該ステップS1802により判定した文字画像のユークリッド距離値を計算するステップS1804と、漢字の文字画像の部首等の分割領域を判別するステップS1803と、ステップS1803により領域判定した文字画像のn分割した領域毎のコサイン類似度を算出するステップS1805と、該ステップS1805により算出した類似度及び同形文字テーブルとを比較して同形文字及び類似文字候補を選択するステップS1806と、前記ステップS1804により算出したユークリッド距離及びステップS1806により選択した同形文字及び類似文字候補に基づいて認識候補の文字を判定するステップS1807と、該ステップS1807により判定した文字候補の判定結果を出力するステップS1808とを実行することによって、文字認識を行うように構成されている。また、前記同形文字テーブルは、共通の部首や旁(つくり)等で漢字を分類すると共に人間の目視により似ている字形で漢字を分類したものである。   As shown in FIG. 18, the character recognition processing according to this prior art is performed in step S1801 in which the computer of the character recognition device extracts the features of the character image, and whether the character image is a Chinese character or not based on the feature amount extracted in step S1801. Step S1802 for determining whether the character is kanji, step S1804 for calculating the Euclidean distance value of the character image determined in step S1802, step S1803 for determining a divided region such as a radical of the character image of kanji, and region by step S1803 Step S1805 for calculating the cosine similarity for each n-divided region of the determined character image, and step S1806 for selecting the isomorphic character and the similar character candidate by comparing the similarity and the isomorphic character table calculated in step S1805. , Calculated in step S1804 By executing step S1807 for determining the recognition candidate character based on the Clic distance and the isomorphic character and similar character candidate selected in step S1806, and outputting the determination result of the character candidate determined in step S1807. It is configured to perform character recognition. The isomorphic character table is a table in which kanji characters are classified by common radicals, wrinkles, etc., and kanji characters are classified by character shapes that are similar to human eyes.

前記ステップS1807により候補判定は、(1)ステップS1802による漢字・非漢字結果から候補を選択する条件と、(2)ステップS1804によるユークリッド距離値が小さい候補を選択する条件と、(3)ステップS1805によるコサイン類似度が高い候補を選択する条件と、(4)一部の分割領域でコサイン類似度が高い候補を選択する条件と、(5)コサイン類似度が大きい字種が属する同形文字分類テーブルを選択する条件とを用いて認識文字候補の判定を行っており、前記ユーリッド距離値及びコサイン類似度は、図22に示す数式により算出している。   In step S1807, candidate determination is performed by (1) a condition for selecting a candidate from the kanji / non-kanji result obtained in step S1802, (2) a condition for selecting a candidate having a small Euclidean distance value in step S1804, and (3) step S1805. (4) a condition for selecting a candidate with a high cosine similarity in a partial region, and (5) an isomorphic character classification table to which a character type with a high cosine similarity belongs. The recognition character candidate is determined using the selection condition, and the Urid distance value and the cosine similarity are calculated by the mathematical formula shown in FIG.

すなわち、従来の文字認識処理は、文字画像のユーリッド距離値とコサイン類似度と領域分割と同形文字テーブル比較との各種技術を組み合わせによって、認識文字候補を決定するように構成されている。   In other words, the conventional character recognition process is configured to determine a recognized character candidate by combining various techniques such as a Urid distance value, cosine similarity, region division, and isomorphic character table comparison of a character image.

なお、従来技術による文字認識技術が記載された文献としては、下記の特許文献1が挙げられ、この特許文献1には、入力部により入力した文字画像から特徴量抽出部が文字画像の特徴量を抽出し、マッチング部が擬似ベイズ識別関数を用いて辞書との相違度を計算する際に文字画像によって擬似ベイズ識別関数の計算する主成分数(擬似ベイズ識別関数式のk)を調整しながら辞書との相違度を計算することによって、文字認識精度の向上への寄与が不安定な主成分補正項の計算を低減することによって、文字認識に不要な小さい特徴分は削除し、特徴不足成分を補完する技術が記載され、前述の部首を分割して文字認識を行う技術が記載された文献としては、下記の特許文献2が挙げられ、この特許文献2には、領域統合部が入力された手書き文字の各ストロークの座標系列をもとに当該ストロークが文字枠内の分割領域をまたがっているか否かを判定し、またがっている場合には該当する分割領域を統合し、部首切り出し部が統合された分割領域に基づいて上記手書き文字を部首単位に切り出し、この切り出された各部首に対して部首認識部が部首認識辞書を参照して認識処理を行い、文字構成部が部首認識処理の結果と文字構成辞書をもとに手書き文字の認識結果を取得することによって、部首切り出しが容易に行って認識精度を向上する技術が記載され、文字認識にユークリッド距離を用いる技術が記載された文献としては下記の特許文献3が挙げられ、この特許文献3には、文字画像部分を所定寸法の矩形画像に正規化する正規化手段と、該正規化手段にて正規化された矩形画像を分割して得た分割画像それぞれのHOG(Histograms of Oriented Gradient)特徴量を算出する特徴量算出手段と、HOG特徴量空間における各分割画像のHOG特徴量を結合した画像部分のHOG特徴量と各所定文字画像のHOG特徴量とのユークリッド距離を算出する距離算出手段と、該距離算出手段にて算出された距離を比較する比較手段と、比較手段の比較結果に基づいて前記文字画像部分に含まれ得る文字を認識する文字認識手段とを設ける技術が記載されている。   In addition, as a document in which a character recognition technique according to the prior art is described, the following Patent Document 1 can be cited. In Patent Document 1, a feature amount extraction unit from a character image input by an input unit includes a feature amount of a character image. When the matching unit calculates the degree of difference from the dictionary using the pseudo Bayes discriminant function, the number of principal components (k of the pseudo Bayes discriminant function equation) calculated by the pseudo Bayes discriminant function is adjusted by the character image. By calculating the degree of difference from the dictionary, by reducing the calculation of the principal component correction term that contributes to the improvement of character recognition accuracy, small features unnecessary for character recognition are deleted, and feature deficient components The following Patent Document 2 is cited as a document in which a technique for supplementing the above is described, and a technique for performing character recognition by dividing the radicals described above. Was Based on the coordinate series of each stroke of the written character, it is determined whether or not the stroke extends over the divided area in the character frame. Based on the integrated divided area, the handwritten character is cut out in radical units, and the radical recognition unit performs a recognition process for each cut out radical by referring to the radical recognition dictionary. A technique is described in which a recognition result of handwritten characters is easily acquired based on the result of the neck recognition process and the character composition dictionary, thereby improving the recognition accuracy by easily performing radical extraction, and a technique using the Euclidean distance for character recognition The following Patent Document 3 is cited as a document in which is described, and in this Patent Document 3, normalization means for normalizing a character image portion to a rectangular image of a predetermined size, and normalization by the normalization means. HOG features of an image portion obtained by combining feature amount calculation means for calculating HOG (Histograms of Oriented Gradient) feature amounts of each of the divided images obtained by dividing the rectangular image, and HOG feature amounts of the respective divided images in the HOG feature amount space. A distance calculating means for calculating the Euclidean distance between the amount and the HOG feature value of each predetermined character image, a comparing means for comparing the distance calculated by the distance calculating means, and the character image based on a comparison result of the comparing means A technique for providing character recognition means for recognizing characters that can be included in a portion is described.

特開2000−215272号公報JP 2000-215272 A 特開平11−184971号公報JP-A-11-184971 特開2014−29608号公報JP 2014-29608 A

前記の従来技術による文字認識技術は、認識対象となる文字画像から多くの特徴量を抽出し正解となるクラス(例えば、「あ」「亜」等)を推定するため、漢字では数千クラスとなって高精度認識を行う際には処理時間が冗長となり、特に近年においては、日本語の漢字のみならず中国における簡体文字や台湾における繁体文字の文字認識のニーズがあり、認識対象の漢字種が増加するため、更に処理時間が冗長になるという課題を招くものであった。   In the conventional character recognition technology, a large number of features are extracted from a character image to be recognized and a correct class (for example, “A”, “A”, etc.) is estimated. Therefore, processing time becomes redundant when performing high-accuracy recognition, and in recent years, there is a need for character recognition not only for Japanese kanji but also for simplified characters in China and traditional characters in Taiwan. As a result, the processing time becomes redundant.

また、文字認識装置は、比較的低精度であっても大量帳票の高速に文字認識を行う顧客ニーズと、処理時間が長くなっても大量帳票を高精度に文字認識を行う顧客ニーズとがあるが、従来技術による文字認識装置は、顧客ニーズによって処理速度と認識精度とを調整することが困難であるという課題があった。   In addition, character recognition devices have customer needs for high-speed character recognition of large-scale forms even with relatively low accuracy, and customer needs for high-precision character recognition of large-scale forms even when processing time is long. However, the conventional character recognition device has a problem that it is difficult to adjust the processing speed and the recognition accuracy according to customer needs.

さらに、前記した特許文献1記載の技術は、文字認識に不要な小さい特徴分は削除し、特徴不足成分を補完することによって、高速且つ高精度を実現しようとするものであるが、高精度化には前記した閾値の設定によって限界が有り、一定数の誤識別を許容してしまうという課題があり、他の特許文献に記載の技術は、高速処理が困難であるいう課題があった。   Furthermore, the technique described in Patent Document 1 is intended to achieve high speed and high accuracy by deleting small features unnecessary for character recognition and complementing the feature deficient components. However, there is a problem that a certain number of misidentifications are allowed, and the techniques described in other patent documents have a problem that high-speed processing is difficult.

本発明の第1の目的は、前述の従来技術による課題しようとするものであり、高速高精度な漢字文字の認識を行うことができる文字認識装置及び文字認識方法を提供することであり、第2の目的は、顧客ニーズに応じて速度と認識精度を調整することができる文字認識装置及び文字認識方法を提供することである。   A first object of the present invention is to provide a character recognition device and a character recognition method capable of recognizing kanji characters at high speed and high accuracy. The second object is to provide a character recognition device and a character recognition method capable of adjusting the speed and recognition accuracy according to customer needs.

前記の目的を達成するために請求項1記載の発明は、複数領域の漢字要素から成る漢字を含む文字を文字画像として光学的にスキャンして読み取る入力部と、該入力部を用いてスキャンした文字画像を取得する画像取得部と、複数の標準文字画像を格納した文字識別用辞書及び共通の部首や旁等で漢字を分類すると共に目視により似ている類似及び同形の漢字を分類するための同形文字テーブルを格納する外部記憶部と、該文字識別用辞書及び同形文字テーブルを参照して文字画像の文字認識を制御する演算部とを備え、該演算部が、入力した文字画像を文字識別用辞書を参照して文字認識処理を実行する文字認識装置であって、
前記演算部が、
前記画像取得部がスキャンした1文字単位の文字画像を漢字要素毎に分割する分割領域を判定する分割領域判別工程と、
該分割領域判別工程により判定した文字画像の同一領域位置における漢字要素のコサイン類似度を算出するコサイン類似度計算工程と、
前記分割領域判別工程により判定した文字画像の同一領域位置における漢字要素のユークリッド距離値を算出するユークリッド距離値算出工程と、
前記分割領域判別工程により判定した分割領域に基づく漢字構成が同一であり、且つ前記コサイン類似度計算工程により算出したコサイン類似度による同一領域位置の漢字要素間の類似度が所定値より高い文字画像と前記ユークリッド距離値算出工程により算出した漢字要素間のユークリッド距離値が所定値より小さい文字画像とを類似度の高い同形文字としてグループ分けした同形文字テーブルに格納する同形文字テーブル作成工程と、
前記コサイン類似度計算工程により算出したコサイン類似度が所定のコサイン類似度より大きい文字画像と、前記ユークリッド距離値算出工程により算出したユークリッド距離値が所定値より小さい文字画像と、前記同形文字テーブル作成工程により同一領域位置の類似度が高い文字画像をグループ分けした同形文字の文字画像との論理和の文字画像を候補文字として文字認識を行う標準文字認識工程とを実行することを第の特徴とする。
The invention of claim 1, wherein in order to achieve the object of, by using the input unit for reading in optical scan characters including Chinese characters consisting of Chinese elements a plurality of areas as a character image, the input unit scan A character identification dictionary storing a plurality of standard character images, and classifying kanji with similar radicals and similar shapes by classifying them together with a common radical, 旁, etc. An external storage unit for storing an isomorphic character table, and an arithmetic unit for controlling character recognition of a character image with reference to the character identification dictionary and the isomorphic character table, wherein the arithmetic unit stores the input character image A character recognition device that performs character recognition processing with reference to a character identification dictionary,
The computing unit is
A divided region determination step of determining a divided region for dividing the character image in units of one character scanned by the image acquisition unit for each Chinese character element;
A cosine similarity calculation step of calculating the cosine similarity of the kanji elements in the same region position of the character image determined by the divided region determination step;
A Euclidean distance value calculating step of calculating a Euclidean distance value of a Chinese character element at the same region position of the character image determined by the divided region determining step;
Character images having the same kanji composition based on the divided areas determined in the divided area determining step and having a similarity between kanji elements in the same region position based on the cosine similarity calculated in the cosine similarity calculating step higher than a predetermined value And an isomorphic character table creating step for storing character images whose Euclidean distance values between Kanji elements calculated by the Euclidean distance value calculating step are smaller than a predetermined value and grouped as isomorphic characters with high similarity,
A character image whose cosine similarity calculated by the cosine similarity calculation step is larger than a predetermined cosine similarity, a character image whose Euclidean distance value calculated by the Euclidean distance value calculation step is smaller than a predetermined value, and creation of the isomorphic character table And a standard character recognition step of performing character recognition using a character image of a logical sum with a character image of isomorphic characters obtained by grouping character images having high similarity in the same region position by a process as a first character. And

請求項2記載の発明は、第1の特徴の文字認識装置において、前記演算部が、標準文字認識工程による論理和より得た文字画像から、前記分割領域判別工程により分割した複数の分割領域の構成が異なる異種候補文字と該異種候補文字が属するグループに含まれる文字画像を除外した候補文字に基づいて文字認識を行う高精細文字認識工程とを実行することを第2の特徴とする。   According to a second aspect of the present invention, in the character recognition device according to the first feature, the calculation unit includes a plurality of divided regions divided by the divided region determination step from a character image obtained by a logical sum in the standard character recognition step. A second feature is that a heterogeneous candidate character having a different configuration and a high-definition character recognition step of performing character recognition based on a candidate character excluding a character image included in a group to which the heterogeneous candidate character belongs are performed.

請求項3記載の発明は、第1又は第2の特徴の文字認識装置において、前記演算部が、前記ユークリッド距離値算出工程により算出したユークリッド距離値が所定値より小さい文字画像を候補文字として文字認識を行う高速文字認識工程を実行することを第3の特徴とする。 According to a third aspect of the present invention, in the character recognition device according to the first or second feature, a character image having a Euclidean distance value calculated by the Euclidean distance value calculating step smaller than a predetermined value as a candidate character is used as a candidate character. The third feature is to execute a high-speed character recognition process for recognition.

請求項4に記載の発明は、第1から第3何れかの特徴の文字認識装置において、前記演算部が、前記同形文字テーブル作成工程において、前記分割領域判別工程により判定した分割領域に基づく漢字構成が同一な文字画像を大グループとして分ける大グループ分け工程と、該大グループ分け工程によりグループ分けした大グルーブ内における特定の領域位置の漢字要素のコサイン類似度が所定値より高く且つ字画像とユークリッド距離値が所定値より小さい文字画像を小グループとして分ける小グループ分け工程とを含み、該大グループ分け及び小グループ分けした漢字画像を同形文字テーブルに格納することを第4の特徴とし、請求項5に記載の発明は、第3又は第4の特徴の文字認識装置において、前記演算部が、前記標準文字認識工程と高精度文字認識工程と高速文字認識工程とを切り替える、または調整する機能を備えることを第5の特徴とする。   According to a fourth aspect of the present invention, in the character recognition device having any one of the first to third features, the kanji based on the divided region determined by the divided region determining step in the isomorphic character table creating step by the arithmetic unit. A large grouping step for dividing character images having the same structure into large groups, and a cosine similarity of a kanji element at a specific region position in a large groove grouped by the large grouping step is higher than a predetermined value and a character image And a small grouping step of dividing character images whose Euclidean distance values are smaller than a predetermined value into small groups, and storing the large grouped and small grouped kanji images in an isomorphic character table, as a fourth feature, The invention according to Item 5 is the character recognition device according to the third or fourth feature, wherein the calculation unit is configured to perform the standard character recognition step. Switching between accurate character recognition process and the high-speed character recognition process, or the fifth aspect, further comprising a function for adjusting.

また、請求項6記載の発明は、複数領域の漢字要素から成る漢字を含む文字を文字画像として光学的にスキャンして読み取る入力部と、該入力部を用いてスキャンした文字画像を取得する画像取得部と、複数の標準文字画像を格納した文字識別用辞書及び共通の部首や旁等で漢字を分類すると共に目視により似ている類似及び同形の漢字を分類するための同形文字テーブルを格納する外部記憶部と、該文字識別用辞書及び同形文字テーブルを参照して文字画像の文字認識を制御する演算部とを備えて文字を認識する文字認識装置の文字認識方法であって、
該演算部に、
前記画像取得部がスキャンした1文字単位の文字画像を漢字要素毎に分割する分割領域を判定する分割領域判別工程と、
該分割領域判別工程により判定した文字画像の同一領域位置における漢字要素のコサイン類似度を算出するコサイン類似度計算工程と、
前記分割領域判別工程により判定した文字画像の同一領域位置における漢字要素のユークリッド距離値を算出するユークリッド距離値算出工程と、
前記分割領域判別工程により判定した分割領域に基づく漢字構成が同一であり、且つ前記コサイン類似度計算工程により算出したコサイン類似度による同一領域位置の漢字要素間の類似度が所定値より高い文字画像と前記ユークリッド距離値算出工程により算出した漢字要素間のユークリッド距離値が所定値より小さい文字画像とを類似度の高い同形文字としてグループ分けした同形文字テーブルに格納する同形文字テーブル作成工程と、
前記コサイン類似度計算工程により算出したコサイン類似度が所定のコサイン類似度より大きい文字画像と、前記ユークリッド距離値算出工程により算出したユークリッド距離値が所定値より小さい文字画像と、前記同形文字テーブル作成工程により同一領域位置の類似度が高い文字画像をグループ分けした同形文字の文字画像との論理和の文字画像を候補文字として文字認識を行う標準文字認識工程とを実行させることを第6の特徴とする。
The invention of claim 6 wherein acquires the input unit for reading in optical scan characters including Chinese characters consisting of Chinese elements a plurality of areas as a character image, a character image scanned by using the input unit An image acquisition unit, a character identification dictionary storing a plurality of standard character images, and a homomorphic character table for classifying kanji characters that are similar by visual inspection while classifying kanji characters by a common radical or 旁A character recognition method of a character recognition device comprising: an external storage unit for storing; and an arithmetic unit that controls character recognition of a character image with reference to the character identification dictionary and the isomorphic character table,
In the calculation unit,
A divided region determination step of determining a divided region for dividing the character image in units of one character scanned by the image acquisition unit for each Chinese character element;
A cosine similarity calculation step of calculating the cosine similarity of the kanji elements in the same region position of the character image determined by the divided region determination step;
A Euclidean distance value calculating step of calculating a Euclidean distance value of a Chinese character element at the same region position of the character image determined by the divided region determining step;
Character images having the same kanji composition based on the divided areas determined in the divided area determining step and having a similarity between kanji elements in the same region position based on the cosine similarity calculated in the cosine similarity calculating step higher than a predetermined value And an isomorphic character table creating step for storing character images whose Euclidean distance values between Kanji elements calculated by the Euclidean distance value calculating step are smaller than a predetermined value and grouped as isomorphic characters with high similarity,
A character image whose cosine similarity calculated by the cosine similarity calculation step is larger than a predetermined cosine similarity, a character image whose Euclidean distance value calculated by the Euclidean distance value calculation step is smaller than a predetermined value, and creation of the isomorphic character table And a standard character recognition step of performing character recognition using, as a candidate character, a character image that is a logical sum of character images of isomorphic characters obtained by grouping character images having high similarity in the same region position by the process. And

請求項7に記載の発明は、第6の特徴の文字認識方法において、前記演算部に、標準文字認識工程による論理和より得た文字画像から、前記分割領域判別工程により分割した複数の分割領域の構成が異なる異種候補文字と該異種候補文字が属するグループに含まれる文字画像を除外した候補文字に基づいて文字認識を行う高精細文字認識工程とを実行させることを第7の特徴とする。   The invention according to claim 7 is the character recognition method of the sixth feature, wherein a plurality of divided regions divided by the divided region determining step from the character image obtained by the logical sum in the standard character recognition step in the arithmetic unit. And a high-definition character recognition step of performing character recognition based on candidate characters excluding character images included in a group to which the different candidate characters belong, and a different character candidate having different configurations.

請求項8記載の発明は、前記演算部に、前記ユークリッド距離値算出工程により算出したユークリッド距離値が所定値より小さい文字画像を候補文字として文字認識を行う高速文字認識工程を実行させることを第8の特徴とする。
The invention according to claim 8 is to cause the arithmetic unit to execute a high-speed character recognition step of performing character recognition using a character image whose Euclidean distance value calculated by the Euclidean distance value calculation step is smaller than a predetermined value as a candidate character. Eight features.

請求項9に記載の発明は、第6から第8何れかの特徴の文字認識方法において、前記演算部に、前記同形文字テーブル作成工程において、前記分割領域判別工程により判定した分割領域に基づく漢字構成が同一な文字画像を大グループとして分ける大グループ分け工程と、該大グループ分け工程によりグループ分けした大グルーブ内における特定の領域位置の漢字要素のコサイン類似度が所定値より高く且つ字画像とユークリッド距離値が所定値より小さい文字画像を小グループとして分ける小グループ分け工程とを含ませ、該大グループ分け及び小グループ分けした漢字画像を同形文字テーブルに格納させることを第9の特徴とし、第8又は第9何れかの特徴の文字認識方法において、前記演算部に、前記標準文字認識工程と高精度文字認識工程と高速文字認識工程とを切り替える、または調整する機能を備えさせることを第10の特徴とする。   The invention according to claim 9 is the character recognition method according to any of the sixth to eighth features, wherein the kanji based on the divided area determined by the divided area determining step in the isomorphic character table creating step is provided in the arithmetic unit. A large grouping step for dividing character images having the same structure into large groups, and a cosine similarity of a kanji element at a specific region position in a large groove grouped by the large grouping step is higher than a predetermined value and a character image Including a small grouping step of dividing character images whose Euclidean distance values are smaller than a predetermined value into small groups, and storing the large grouping and small grouped kanji images in an isomorphic character table, In the character recognition method according to any of the eighth and ninth features, the standard character recognition step and the high-precision character recognition are included in the calculation unit. Switching between step and high speed character recognition process, or a tenth aspect of the letting a function of adjusting.

本発明による文字認識装置及び文字認識方法は、演算部が、複数領域の漢字要素から成る漢字を領域毎に分割した漢字構成が同一であり、コサイン類似度による同一領域位置の漢字要素間の類似度が所定値より高い文字画像とユークリッド距離値算出工程により算出した漢字要素間のユークリッド距離値が所定値より小さい文字画像とを類似度の高い同形文字としてグループ分けした同形文字テーブルを文字識別用辞書165に格納し、該同形文字テーブルに格納した候補文字を参照して文字認識を行うことによって、高精度且つ高速に簡体文字及び繁体文字を含む漢字を認識することができる。   In the character recognition device and the character recognition method according to the present invention, the arithmetic unit has the same kanji composition in which kanji composed of kanji elements in a plurality of areas are divided for each area, and the similarity between kanji elements in the same area position based on cosine similarity For character identification, an isomorphic character table in which character images whose degrees are higher than a predetermined value and character images whose Euclidean distance values between Kanji elements calculated in the Euclidean distance value calculation step are smaller than a predetermined value are grouped as isomorphic characters with high similarity. By performing character recognition with reference to candidate characters stored in the dictionary 165 and stored in the isomorphic character table, it is possible to recognize kanji characters including simplified characters and traditional characters with high accuracy and high speed.

本発明の実施形態による文字認識装置の基本構成を示す図。The figure which shows the basic composition of the character recognition apparatus by embodiment of this invention. 本実施形態による文字認識処理の概要を示す図。The figure which shows the outline | summary of the character recognition process by this embodiment. 本実施形態による高速モードでの認識出力候補決定処理を示す図。The figure which shows the recognition output candidate determination process in the high speed mode by this embodiment. 本実施形態による標準モードでの認識出力候補決定処理を示す図。The figure which shows the recognition output candidate determination process in the standard mode by this embodiment. 本実施形態による標準モードでの同形文字テーブル及び文字選択処理を示す図。The figure which shows the isomorphic character table and character selection process in the standard mode by this embodiment. 本実施形態による高精度モードでの認識出力候補決定処理を示す図。The figure which shows the recognition output candidate determination process in the high precision mode by this embodiment. 本実施形態による高精度モードでの文字選択処理を示す図。The figure which shows the character selection process in the high precision mode by this embodiment. 本実施形態による同形文字・類字文字選択処理動作を示す図。The figure which shows the isomorphic character / classical character selection processing operation by this embodiment. 本実施形態による分割領域判定処理動作を示す図。The figure which shows the division area determination processing operation | movement by this embodiment. 本実施形態による分割領域判定処理動作を示す図。The figure which shows the division area determination processing operation | movement by this embodiment. 本実施形態による同形文字テーブルの作成処理動作を示す図。The figure which shows the creation processing operation | movement of the isomorphic character table by this embodiment. 本実施形態による分割領域判定処理動作を示すフロー図。The flowchart which shows the division area determination processing operation by this embodiment. 本実施形態による分割領域判定処理における分割位置候補算出工程を説明する図。The figure explaining the division position candidate calculation process in the division area determination process by this embodiment. 本実施形態による大グループ分類テーブル作成処理動作を示す図。The figure which shows the large group classification table creation processing operation by this embodiment. 本実施形態による類似領域判定処理動作を示すフロー図。The flowchart which shows the similar area | region determination processing operation | movement by this embodiment. 本実施形態による領域別類似算出時のテーブルを示す図。The figure which shows the table at the time of the similarity calculation according to area | region by this embodiment. 本実施形態による小グループ分類テーブル作成処理動作を示す図。The figure which shows the small group classification table creation processing operation by this embodiment. 本実施形態による同形文字テーブルを説明する図。The figure explaining the isomorphic character table by this embodiment. 本実施形態による類似度を算出する数式を説明する図。The figure explaining the numerical formula which calculates the similarity degree by this embodiment. 従来技術による出力候補決定処理動作を示す図。The figure which shows the output candidate determination processing operation by a prior art. ユークリッド距離による計算範囲を説明する図。The figure explaining the calculation range by Euclidean distance. ユークリッド距離及びコサイン類似度による判定手法を説明する図。The figure explaining the determination method by Euclidean distance and cosine similarity. 文字認識に要する処理時間と認識精度の関係を示す図。The figure which shows the relationship between the processing time which character recognition requires, and recognition accuracy. ユークリッド距離値とマハラビノス距離値による類似度とコサイン類似度の数式を示す図。The figure which shows the numerical formula of the similarity and cosine similarity by a Euclidean distance value and a Mahalanobis distance value. 従来技術による文字認識処理の概要を示す図。The figure which shows the outline | summary of the character recognition process by a prior art. 本実施形態による認識モードを切り替える、または調整する操作画面を示す図。The figure which shows the operation screen which switches the recognition mode by this embodiment, or adjusts.

以下、本発明による文字認識方法を用いた文字認識装置の一実施形態を詳細に説明する。
[構成]
本実施形態による文字認識装置は、図1に示す如く、帳票等に記入された文字を光学的に読み取るスキャナ等の入力部110と、該入力部110を用いてスキャンした文字画像を取得する画像取得部130と、複数の標準文字画像を格納した文字識別用辞書及び共通の部首や旁等で漢字を分類すると共に目視により似ている類似及び同形の漢字を分類するための同形文字テーブルを含む文字識別用辞書165格納する外部記憶部160と、該外部記憶部160に格納した文字識別用辞書165及び同形文字テーブルを参照して文字画像の文字認識を制御する演算部150と、該演算部150が識別した文字や読み取り不能文字その他を表示する表示部120と、文字認識結果のデータを外部に送信するための通信部140とを備え、前記演算部150が、該外部記憶部160に格納した文字画像を文字識別用辞書165を参照して文字認識処理を実行するように構成されている。
Hereinafter, an embodiment of a character recognition apparatus using a character recognition method according to the present invention will be described in detail.
[Constitution]
As shown in FIG. 1, the character recognition apparatus according to the present embodiment has an input unit 110 such as a scanner that optically reads characters entered in a form and the like, and an image that acquires a character image scanned using the input unit 110. An acquisition unit 130, a character identification dictionary that stores a plurality of standard character images, and an isomorphic character table for classifying kanji characters that are similar by visual inspection while classifying kanji characters by a common radical, 旁, etc. An external storage unit 160 that stores a character identification dictionary 165 that includes the calculation unit 150 that controls character recognition of a character image with reference to the character identification dictionary 165 and the isomorphic character table stored in the external storage unit 160, and the calculation A display unit 120 for displaying characters identified by the unit 150, unreadable characters, and the like, and a communication unit 140 for transmitting data of character recognition results to the outside. 150 is configured to perform a character recognition process character images stored in the external storage unit 160 with reference to the character recognition dictionary 165.

本実施形態による演算部150は、表示部120を用いた操作者からの指示によって、認識速度と認識精度のバランスを考慮した標準(デフォルト)モードと、標準モードに比べて認識精度は低下するものの認識処理が高速な高速モードと、標準モードに比べて認識速度は低下するものの認識精度が高い高精度モードとの3種のモード設定が可能であり、また、細かく認識速度と認識精度の調整が可能なように構成されている。
この3種のモード設定と認識速度及び認識精度の調整を行う表示部120に表示する認識モード設定ウィンドウ画面は、図24(a)に示す如く、高精度・標準・高速の3種モードの切り替えを指定するラジオボタン990と、0から100の範囲の数値入力により精度を任意に指定するための任意指定ボタン991と、マウス等を用いた左右移動により精度を0から100の範囲で調整するためのスライダバー992とが表示され、業務にあわせて例えば、ラジオボタン990の高速ボタンをクリックしたとき、図24(b)に示す如く表示され、任意指定ボタン991をクリックして数値35を入力したとき、図24(c)の如く表示される。
In the calculation unit 150 according to the present embodiment, the recognition accuracy is lower than the standard (default) mode in consideration of the balance between the recognition speed and the recognition accuracy and the standard mode according to an instruction from the operator using the display unit 120. Three modes can be set: a high-speed mode with high recognition processing and a high-accuracy mode with high recognition accuracy, although the recognition speed is lower than the standard mode, and fine adjustment of the recognition speed and recognition accuracy is possible. It is configured as possible.
As shown in FIG. 24A, the recognition mode setting window screen displayed on the display unit 120 for adjusting the three types of modes and adjusting the recognition speed and the recognition accuracy is switched between the three types of modes of high accuracy, standard, and high speed. Radio button 990 for designating, an arbitrary designation button 991 for arbitrarily designating accuracy by inputting a numerical value in the range of 0 to 100, and adjustment of accuracy in the range of 0 to 100 by moving left and right using a mouse or the like The slider bar 992 is displayed, and for example, when the radio button 990 high-speed button is clicked according to the business, it is displayed as shown in FIG. At this time, it is displayed as shown in FIG.

また、本実施形態の文字認識技術が読み取り対象とする文字は、英数字・記号の他に日本語漢字・中国語漢字(簡体文字)・台湾語漢字(繁体文字)を含み、これらの漢字が、左側に位置する偏(へん)と、右側に位置する旁(つくり)と、上側に位置する冠(かんむり)と、下側に位置する脚(あし)と、全体を包むように位置する構(かまえ)と、上側から下側に垂れ下がるように位置する垂(たれ)と、左側から下側に沿うように位置する繞(にょう)等の配置が予め定められた複数の領域とから構成され、本出願においては、「偏」や「旁」等の領域を分割領域といい、分割領域内の部分的な漢字画像を漢字要素といい、「偏」や「旁」等の配置位置を領域位置といい、分割領域の領域位置が同一な漢字の構成(例えば、「峰」「蜂」の如く縦方向に2分割される漢字構成、「瀬」「辯」の如く縦方向に3分割される漢字構成、「昌」の如く上下に2分割される漢字構成等)を漢字構成という。   In addition to alphanumeric characters and symbols, the characters to be read by the character recognition technology of the present embodiment include Japanese kanji, Chinese kanji (simplified characters), and Taiwanese kanji (traditional characters). The left side, the right side, the right side, the upper side, the lower side leg, and the lower side leg. (Kamae), and a plurality of regions in which the arrangement of drooping (position) that hangs down from the upper side to the lower side, and a ridge that is positioned along the lower side from the left side is predetermined. In this application, an area such as “bias” or “旁” is referred to as a divided area, a partial kanji image in the divided area is referred to as a kanji element, and an arrangement position such as “bias” or “旁” is defined. It is called the area position, and the composition of the Chinese characters with the same area position of the divided areas (for example, “Mine” “Bee” 2 divided by Kanji configured longitudinally as kanji configured to be divided into three parts in the vertical direction as "Se", "dialect", "Akira" vertically divided into two parts by Kanji construction, etc.) that the Chinese character configuration as.

[全体動作]
本実施形態による文字認識装置100の演算部150による文字認識処理の概略は、図2に示す如く、演算部の制御によって、帳票等に記入された文字を光学的にスキャンして入力するステップS201と、該ステップS201により入力した文字画像の特徴量を抽出するステップS202と、操作者の操作によって選択された認識モード(高速・標準・高精度モード)を入力するステップS203と、前記ステップS201にて入力した文字画像に基づいて読み取り対象文字画像をグループ分けする同形文字テーブルを作成して文字識別用辞書165に格納するステップS205と、前記ステップS201により入力した文字画像の特徴量及びステップS203により選択された認識モードとを入力とし、文字識別用辞書165を参照して認識文字の出力候補を決定するステップS204と、該ステップS204により決定した認識文字の出力候補に対してユークリッド距離及びマハラビノス距離の数式に基づいた類似度dc(x)を算出して文字識別を行うステップS206と、該ステップS206により算出した類似度dc(x)の小さい順に候補文字を出力するステップS207とを実行することによって、文字識別を行うように動作する。
前述のステップS204による認識文字の出力候補を決定する処理は、高速モードと標準モードと高精度モードとによって処理手法が異なり、次に各処理内容を説明する。
[Overall operation]
As shown in FIG. 2, the outline of the character recognition processing by the calculation unit 150 of the character recognition apparatus 100 according to the present embodiment is to optically scan and input characters entered in a form or the like under the control of the calculation unit. Step S202 for extracting the feature amount of the character image input in Step S201, Step S203 for inputting the recognition mode (high speed / standard / high accuracy mode) selected by the operation of the operator, and Step S201 Step S205 for creating an isomorphic character table for grouping the character images to be read based on the character image inputted in step S205 and storing it in the character identification dictionary 165, and the feature amount of the character image inputted in step S201 and step S203. With the selected recognition mode as input, refer to the character identification dictionary 165 Character recognition is performed by calculating a similarity dc (x) based on a formula of Euclidean distance and Mahalanobis distance for the recognition character output candidate determined in step S204, and determining a recognition character output candidate. By executing step S206 and step S207 of outputting candidate characters in ascending order of similarity dc (x) calculated in step S206, the operation is performed to perform character identification.
The processing for determining the recognition character output candidates in step S204 described above differs in processing method depending on the high-speed mode, the standard mode, and the high-accuracy mode, and each processing content will be described next.

[標準モードの出力候補決定処理]
この標準モードの出力候補決定処理のステップS204は、図4Aに示す如く、候補数を絞り込むために文字画像が漢字か非漢字(数字・英字・記号・仮名文字他)かを判定するステップS402と、該ステップS402に続いてユークリッド距離値の大きい字種を候補から除いて絞り込むためユークリッド距離値を算出するステップS403と、該ステップS402に続いてコサイン類似度が小さい(−1に近い)字種(候補文字)を候補から除外するために文字画像を予め定めたNXN分割した領域毎にコサイン類似度を算出するステップS404と、該ステップS404に続いてコサイン類似度が所定値に比して比較的大きい字種が属しているグループを同形文字テーブルから選択するステップS405と、前記ステップS403によるユークリッド距離値の大きい認識候補を除外した候補文字及びステップS405により規定値(NXN)による分割領域毎に判定したコサイン類似度が小さい字種(候補文字)を除いた候補文字に基づいて、(1)漢字・非漢字判定部の結果から候補を選択する条件と、(2)ユークリッド距離値が小さい候補を選択する条件と、(3)コサイン類似度が大きい候補を選択する条件と、(4)コサイン類似度が大きい字種が属するグループを同形文字分類テーブルから選択する条件との論理和によって、認識文字候補を決定するステップS406とを実行することによって、ユークリッド距離値とコサイン距離値をファクターとした文字画像を出力候補として出力するように動作する。
[Standard mode output candidate decision processing]
In step S204 of the standard mode output candidate determination process, as shown in FIG. 4A, in order to narrow down the number of candidates, it is determined whether the character image is a kanji character or a non-kanji character (number, alphabetic character, symbol, kana character, etc.). Following step S402, a step S403 for calculating a Euclidean distance value to narrow down a character type having a large Euclidean distance value from candidates, and a character type having a low cosine similarity (close to -1) following the step S402. Step S404 for calculating the cosine similarity for each predetermined NXN divided region of the character image in order to exclude (candidate character) from the candidate, and comparing the cosine similarity with a predetermined value after step S404 In step S405, a group to which a large character type belongs is selected from the isomorphic character table, and in step S403, Based on the candidate character excluding the candidate character excluding the recognition candidate having a large Euclidean distance value and the character type (candidate character) having a small cosine similarity determined for each divided region based on the specified value (NXN) in step S405, (1 (2) a condition for selecting a candidate from the result of the kanji / non-kanji determination unit, (2) a condition for selecting a candidate with a small Euclidean distance value, (3) a condition for selecting a candidate with a high cosine similarity, and (4) Step S406 for determining a recognized character candidate by performing a logical OR with a condition for selecting a group to which a character type having a high cosine similarity belongs from the isomorphic character classification table is performed, and the Euclidean distance value and the cosine distance value are set as factors. It operates so as to output the character image as an output candidate.

また、前記ステップS405による同形文字・類字文字候補選択処理は、コサイン類似度の大きい字種が属しているグループを図4Bに示す同形文字分類テーブルから選択し、この選択したグルーブに属している字種は認識候補に追加するように動作し、詳細は後述する。なお、図4他の同形文字テーブルの丸中数字は電子出願ソフトウェアにおいては外字となるため、本明細書においては丸括弧数字にて表記する。   Further, in the isomorphic character / typical character candidate selection process in step S405, a group to which a character type having a high cosine similarity belongs is selected from the isomorphic character classification table shown in FIG. 4B, and belongs to the selected groove. The character type operates to be added to the recognition candidate, and details will be described later. In FIG. 4, other circles in the isomorphic character table are external characters in the electronic application software, and are therefore expressed in parentheses in this specification.

[高速モードの出力候補決定処理]
前記高速モードの出力候補決定処理のステップS204は、図3に示す如く、候補数を絞り込むために文字画像が漢字か非漢字(数字・英字・記号・仮名文字他)かを判定するステップS321と、該ステップS321に続いてユークリッド距離値の大きい字種を候補から除いて絞り込むためユークリッド距離値を算出するステップS322と、該ステップS322によりユークリッド距離値の大きい字種を候補から除いた認識候補文字を、(1)漢字・非漢字を判定するステップS321の判定結果に応じて候補文字を漢字又は非漢字に選択する条件と(2)ユークリッド距離値が所定の閾値より小さい値の候補文字を選択する条件の論理和によって、認識文字候補を決定するステップS323とを実行することによって、コサイン類似度による判定を除いているため、標準モードによる判定に比べて精度は低下するものの高速な候補文字を出力候補として出力するように動作する。
[High-speed mode output candidate decision processing]
Step S204 of the high-speed mode output candidate determination process, as shown in FIG. 3, is a step S321 for determining whether the character image is a Kanji character or a non-Kanji character (number, alphabetic character, symbol, kana character, etc.) in order to narrow down the number of candidates. Subsequent to step S321, step S322 for calculating a Euclidean distance value to narrow down the character types having a large Euclidean distance value from candidates, and recognition candidate characters obtained by excluding character types having a large Euclidean distance value from the candidates in step S322 (1) Judgment of Kanji / Non-Kanji Character according to the determination result of Step S321 and selection of candidate characters as Kanji or non-Kanji (2) Selection of candidate characters whose Euclidean distance value is smaller than a predetermined threshold The cosine similarity is obtained by executing step S323 of determining a recognized character candidate based on the logical sum of the conditions to be Since the exception of the determination by, it operates to output the high-speed candidate characters those accuracy is lower than that determined by the standard mode as an output candidate.

[高精度モードの出力候補決定処理]
前記高精度モードの出力候補決定処理のステップS204は、図5Aに示す如く、候補数を絞り込むために文字画像が漢字か非漢字(数字・英字・記号・仮名文字他)かを判定するステップS502と、該ステップS502に続いてユークリッド距離値の大きい字種を候補から除いて絞り込むためユークリッド距離値を算出するステップS504と、該ステップS502に続いて文字画像の分割領域を判定するステップS503と、該ステップS503に続いてコサイン類似度が小さい(−1に近い)字種(候補文字)を候補から除外するために文字画像を前記ステップS503により分割した領域毎にコサイン類似度を算出するステップS505と、該ステップS506に続いてコサイン類似度が比較的大きい字種が属しているグループを同形文字分類テーブルから選択するステップS506と、前記ステップS507によるユークリッド距離値の大きい認識候補を除外した候補文字及びステップS506により領域毎のコサイン類似度が小さい字種(候補文字)を除いた候補文字に基づいて、(1)漢字・非漢字判定部の結果から候補を選択する条件と、図5Bに示す(2)ユークリッド距離値が小さい候補を選択する条件と、(3)コサイン類似度が大きい候補を選択する条件と、(4)コサイン類似度が大きい字種が属するグループを同形文字分類テーブルから選択する条件の論理和から(5)分割領域判定処理によりで求めた基本的構成に合わない字種(異種候補文字)とその字種が属するグループの字種を候補から外す否定論理和とを実行することによって、ユークリッド距離値と文字画像を漢字の部首等の分割領域毎のコサイン距離値をファクターとして、文字画像を出力候補として出力するように動作することによって、ユークリッド距離値に加えて漢字構成に基づいて分割した分割領域毎のコサイン類似度による判定を行うため、標準モードによる判定に比べて認識速度は低下するものの高精度な候補文字を出力候補として出力するように動作する。
[High-precision mode output candidate decision processing]
In step S204 of the high-accuracy mode output candidate determination process, as shown in FIG. 5A, in order to narrow down the number of candidates, it is determined whether the character image is a kanji character or a non-kanji character (number, alphabetic character, symbol, kana character, etc.). Step S504 for calculating the Euclidean distance value for narrowing down the character types having a large Euclidean distance value from the candidates following Step S502, Step S503 for determining the divided region of the character image following Step S502, Subsequent to step S503, in order to exclude a character type (candidate character) having a small cosine similarity (close to -1) from candidates, a cosine similarity is calculated for each region obtained by dividing the character image in step S503. And a group to which a character type having a relatively high cosine similarity belongs after step S506. Step S506 selected from the glyph classification table, candidate characters excluding recognition candidates having a large Euclidean distance value in Step S507, and candidate characters excluding character types (candidate characters) having a low cosine similarity for each region in Step S506 (1) Conditions for selecting candidates from the results of the kanji / non-kanji determination unit, (2) Conditions for selecting candidates with small Euclidean distance values shown in FIG. 5B, and (3) High cosine similarity From the logical sum of the conditions for selecting a candidate and (4) the condition for selecting a group to which a character type with a high cosine similarity belongs from the isomorphic character classification table, (5) does not match the basic structure obtained by the divided area determination processing Euclidean by performing a negative OR to remove the character type (heterogeneous candidate character) and the character type of the group to which the character type belongs from the candidate The distance value and the character image are divided based on the kanji composition in addition to the Euclidean distance value by operating to output the character image as an output candidate with the cosine distance value of each divided area such as the radical of the kanji as a factor. Since the determination based on the cosine similarity for each divided area is performed, the recognition speed is lower than that in the determination in the standard mode, but the operation is performed so that highly accurate candidate characters are output as output candidates.

[同形文字・類字文字候補選択処理]
前記ステップS405による同形文字・類字文字候補選択処理の詳細は、図6に示す如く、正解文字が「凋」であり、手書き文字が図示の如く偏(へん)「にすい」と旁(つくり)「周」が接触している場合、分割領域判別処理により入力パタン(文字画像)の部首の型と位置を求めることにより偏(へん)と旁(つくり)の縦2分割の分割要素で構成されている漢字構成と判定するステップS601と、該ステップS601により分割した分割領域毎にコサイン類似度・ユークリッド値類似度を求め、類似度の小さい順に図示の左から順に一位候補、二位候補、三位候補と仮定するステップS601と、該ステップS601により仮定した一位候補文字が属する同形文字テーブル(3)と同じ領域位置の旁(つくり)が同一の文字「凋」が属する同形文字テーブル(2)の字種を候補に追加すると共に同形文字テーブル(1)及び(5)の字種を候補に追加するステップS603と、三位文字は類似度が高いものの偏(へん)と旁(つくり)で構成されていないため(漢字構成が異なるため)候補から除外するステップS604とを実行することによって、コサイン類似度・ユークリッド値類似度の大きい字種が属しているグループを同形文字分類テーブルから選択し、この選択したグルーブに属している字種は認識候補に追加するように動作する。
[Homomorphic / classical character candidate selection processing]
The details of the isomorphic / typical character candidate selection processing in step S405 are as follows. As shown in FIG. 6, the correct character is “凋”, and the handwritten character is “Nice” and “旁” ) When the “circumference” is in contact, the divisional element discrimination process determines the type and position of the radical of the input pattern (character image), thereby dividing the vertical and horizontal divisions into two elements. Step S601 for determining the composition of the kanji composed, and cosine similarity and Euclidean value similarity are obtained for each divided region divided by step S601, and the first candidate and second place in order from the left in the figure in ascending order of similarity. In step S601, which is assumed to be a candidate, third place candidate, and the character “凋” having the same region position as the isomorphic character table (3) to which the first candidate character assumed in step S601 belongs is the same. Step S603 for adding the character type of the isomorphic character table (2) to the candidate and adding the character types of the isomorphic character table (1) and (5) to the candidate, and the third character has a high degree of similarity, ) And 旁 (construction) (because the composition of Chinese characters is different), the group to which a character type having a high cosine similarity / Euclidean value similarity belongs is executed by executing step S604 that is excluded from candidates. The character type belonging to the selected groove is selected from the isomorphic character classification table, and operates so as to be added to the recognition candidate.

[分割領域判別処理1]
前述した高精度モードの出力候補決定処理におけるステップS503の文字画像の分割領域判定処理の詳細は、図7に示す如く、前記同様に正解文字が「凋」であり、手書き文字が図示の如く偏(へん)「にすい」と旁(つくり)「周」が接触している縦2分割の漢字構成の場合、入力パタン(文字画像)の文字成分の心線を抽出したA心線パタンと、文字垂直方向成分を抽出したB垂直方向の文字線分パタンと、文字水平方向成分を抽出したC水平直方向の文字線分パタンと、文字画像の外接線を抽出したD線分接近似パタンとを生成するステップS701と、生成したパタンABCから水平方向と垂直方向のヒストグラムを求めるステップS702と、該ステップS702により求めた6つの垂直及び水平ヒストグラム及びパタンDの分割位置を求めるステップS703とを実行することによって、漢字文字の領域分割位置を判定する。
[Division area determination processing 1]
As shown in FIG. 7, the details of the character image segmentation area determination process in step S503 in the output candidate determination process in the high-accuracy mode described above are as follows. (Hen) In the case of a vertically divided Chinese character structure in which “Nisui” and “Tsubaki” (Tsukuri) are in contact with each other, an A core pattern that extracts the core of the character component of the input pattern (character image); A character line segment pattern in the B vertical direction extracted from the character vertical direction component, a character line segment pattern in the C horizontal straight direction extracted from the character horizontal direction component, and a D line segment approximate pattern extracted from the circumscribed line of the character image, Generating step S701, obtaining a horizontal and vertical histogram from the generated pattern ABC, and dividing the six vertical and horizontal histograms and pattern D obtained in step S702. By executing the step S703 for determining the position to determine an area division position of the Kanji characters.

前記ステップS703の分割位置を求める処理は、図示例の文字図形の場合、垂直ヒストグラムA−1及びB−1中のピーク(山)が2つあるため、2つのピーク間の谷位置を分割位置候補a及びbとし、E線分外接近似パタンによる分割位置候補c及びdとし、水平ヒストグラムA−2、B−2、C−2、ヒストグラムC−1は山と谷の差が小さいこと、山が1つであることにより分割位置候補から除外し、これらを総合して分割位置を決定することによって行われる。   In the process of obtaining the division position in step S703, in the case of the illustrated character graphic, since there are two peaks (mountains) in the vertical histograms A-1 and B-1, the valley position between the two peaks is divided. Candidates a and b, division position candidates c and d based on the E-line circumscribed approximation pattern, horizontal histograms A-2, B-2, C-2, and histogram C-1 have small differences between peaks and valleys, This is performed by excluding the candidate from the division position candidates due to being one and determining the division position by combining them.

[分割領域判別処理2]
ステップS503による分割領域判定処理は、前記処理に限られるものではなく、入力パタン(文字画像)の文字成分の心線を抽出したA心線パタンと、文字垂直方向成分を抽出したB垂直方向の文字線分パタンと、文字画像の外接線を抽出したD線分接近似パタンとを生成し、これら生成したパタンAの水平方向のヒストグラムA−1及びパタンBの水平方向のヒストグラムB−1から分割位置候補a及びbを抽出し、外接近似パタンDから分割位置候補a及びbを抽出して求めた分割領域の基本的構成が似ているパタンを同形文字テーブルから選択して追加しても良い。
[Division area determination processing 2]
The divided region determination process in step S503 is not limited to the above process, and the A core line pattern obtained by extracting the core line of the character component of the input pattern (character image) and the B vertical direction obtained by extracting the character vertical direction component. A character line segment pattern and a D-line segment approximated pattern obtained by extracting a circumscribing line of the character image are generated. From the generated horizontal histogram A-1 of pattern A and horizontal histogram B-1 of pattern B. Even if the division position candidates a and b are extracted and the division position candidates a and b are extracted from the circumscribed approximate pattern D, a pattern having a similar basic configuration of the divided area is selected from the isomorphic character table and added. good.

この手法は、例えば図8に示す如く、分割位置a〜dにより分割領域が左右に分かれる構成であると判定し、漢字要素が縦2列に分割された漢字構成である同形文字テーブル(2)及び(3)を抽出し、該同形文字テーブル(2)及び(3)の字種を候補として追加し、漢字構成が上下・囲い等の如く大きく異なる同形文字テーブル(4)以降から除外することによって行われる。   In this technique, for example, as shown in FIG. 8, it is determined that the divided area is divided into right and left by the dividing positions a to d, and an isomorphic character table (2) having a kanji structure in which kanji elements are divided into two vertical columns. And (3) are extracted, the character types of the isomorphic character tables (2) and (3) are added as candidates, and excluded from the isomorphic character table (4) and later after which the kanji composition is greatly different, such as top and bottom, enclosure, etc. Is done by.

[分割位置候補判定の具体的説明]
前述の図7を用いて説明した水平ヒストグラムA−1から分割位置候補を判定する具体的手法は、図11(a)に示す水平ヒストグラムの場合、当該水平ヒストグラムの上閾値αより高い山(画素数が多い位置)を山a・山b・山c・山dとして設定する第1工程と、該第1工程により設定した複数の山のうち、隣り合う山の間で下閾値βよりも最も低い位置を谷aとして設定する第2工程と、他の山間で下閾値βよりも低い位置を谷bとして設定する第3工程と、該第2工程及び第3工程により設定した谷位置から1つを選択する第4工程と、該第4工程により選択した谷が分解位置として妥当か否かを、図11(c)に示す谷の最小座標をY、該座標Yを中心としてX−1離れた位置の座標をYx−1、該座標Yを中心としてx+1離れた位置の座標をYx+1としたとき、「Y<Yx−1且つY<Yx+1」の数式条件を満たしているか否かによって判定する第5工程と、該第5工程により谷aを分割候補と判定したとき、該谷aを分割候補として設定する第6工程とを繰り返すことによって、分割位置候補を判定する。なお、前記第1工程における山であるかの判定し、図11(b)に示した「Yx−1<Y且つYx+1<Y」の数式条件により判定する。
[Specific description of division position candidate determination]
In the case of the horizontal histogram shown in FIG. 11A, a specific method for determining the division position candidate from the horizontal histogram A-1 described with reference to FIG. 7 described above is a mountain (pixel) higher than the upper threshold value α of the horizontal histogram. The first step of setting a position having a large number of peaks as a mountain a, a mountain b, a mountain c, and a mountain d, and among the plurality of mountains set by the first step, the lowermost threshold β is between adjacent mountains. From the second step of setting the low position as the valley a, the third step of setting the position lower than the lower threshold β as the valley b between other peaks, and the valley position set by the second step and the third step, 1 The fourth step of selecting one and whether or not the valley selected in the fourth step is valid as the decomposition position, Y x is the minimum coordinate of the valley shown in FIG. 11C, and X is the center of the coordinate Y x. x -1 position coordinates apart around the Y x-1, the coordinate Y x When a distant position coordinates and the Y x + 1, a fifth step according to whether or not satisfies the equation conditions "Y x <Y x-1 and Y x <Y x + 1", the fifth step When the valley a is determined as the division candidate, the division position candidate is determined by repeating the sixth step of setting the valley a as the division candidate. Incidentally, it is judged by the determination of whether a mountain in the first step, and Equation conditions shown in FIG. 11 (b) "Y x-1 <Y x and Y x + 1 <Y x".

[同形文字テーブル作成処理]
前記同形文字テーブルを作成するステップS205の概略処理は、図9に示す如く、漢字構成が似ているパタン毎に文字画像を大きなグループ(分割無し、縦方向に分割する分割領域、横方向に分割する分割領域、複数+字形に分割する分割領域他の分割形状)分けを行うステップS901と、該ステップS901により大分類したグループ内においてユークリッド距離値の小さい字種同士やコサイン類似度の大きい字種同士で小グループ分けするステップS902と、前記ステップS901で領域構造により大グループ分けした情報とステップS902でユークリッド距離値及びコサイン類似度により小グループ分けした情報を同形文字テーブルに格納するステップS903とを実行することによって、同形文字テーブルを作成するように動作する。このステップS902により小グループ分けは、例えば左右に縦分割される漢字構成の場合、例えば、左側の偏(へん)の漢字要素の類似度が高い漢字画像と、右側の旁(つくり)の漢字要素の類似度が高い漢字画像と小グループ分けするように動作する。
[Uniform character table creation process]
As shown in FIG. 9, the outline process of step S205 for creating the isomorphic character table is as follows. Character images are divided into large groups (no division, division area divided in the vertical direction, division in the horizontal direction) for each pattern having a similar kanji structure. A divided region, a divided region divided into a plurality of + character shapes, and other divided shapes), and a character type having a small Euclidean distance value or a character type having a high cosine similarity in the group roughly classified in step S901. Step S902 for dividing the group into small groups, and step S903 for storing the information divided into large groups according to the region structure in step S901 and the information divided into small groups based on the Euclidean distance value and cosine similarity in step S902 in the isomorphic character table. To create an isomorphic table by running To work. For example, in the case of a kanji composition vertically divided into left and right by this step S902, for example, a kanji image having a high degree of similarity between the left side kanji element and the right side kanji element. It operates to divide into small groups from kanji images with high similarity.

即ち、本実施形態による同形文字テーブル作成処理は、漢字構成規則による分割形状に基づいて漢字画像を大グループ分けし、更に同一大グループ内の同一分割領域位置の漢字要素の類似度が高い漢字画像を小グループ分けすることによって、同形文字テーブルを作成する。   That is, the isomorphic character table creation processing according to the present embodiment divides a kanji image into large groups based on the division shape according to the kanji composition rule, and further, the kanji image having a high similarity between the kanji elements in the same divided region position in the same large group The isomorphic character table is created by dividing into small groups.

この同形文字テーブル作成処理の大グループへの登録処理は、図10に示す如く、同形文字テーブル作成データベースから認識対象とする漢字画像を読み込むステップS1001と、該ステップS1001により読み込んだ漢字画像から心線パタンを作成するステップS1002と、該ステップS1002により作成した心線パタンから水平方向のヒストリズムを作成するステップS1003と、該ステップS1003により作成した水平方向ヒストリズムから隣り合うピーク位置(山)間の谷位置を求めるステップS1004と、該ステップS1004により求めた谷位置から1つの谷位置を選択するステップS1005と、該ステップS1005により選択した谷位置が分割位置候補か否かを(山と谷の距離の大小等により)判定するステップS1006と、該ステップS1006により分割位置候補でないと判定したとき前記ステップS1005により選択した分割位置候補を除外するステップS1007と、前記ステップS1006により分割位置候補であると判定したとき、分割位置候補として記憶するステップS108と、前記ステップS1004により求めた全ての谷位置の判定が終了したか否かを判定し、終了していないと判定したときに前記ステップS1006に戻るステップS1009と、該ステップS1009において全ての谷位置の判定が終了したと判定したとき、前記ステップS1008により記憶した分割位置候補に基づいて分割候補位置を決定するステップS1010と、該ステップS1010により決定した分割領域が同形文字テーブルの大グループに既に登録されているか判定するステップS1011と、該ステップS1011において登録されていないと判定したとき、同形文字テーブルに新たな大分類及び該大分類にステップS1001により読み込んだ字種を登録するステップS1012と、前記ステップS1011において登録されていると判定したとき、既に同形文字テーブルに登録されている該当の大分類にステップS1001により読み込んだ字種を追加するステップS1013と、全ての文字画像を大グループへのテーブル登録が終了したか否かを判定し、全ての文字画像を大グループへのテーブル登録が終了していないと判定したとき前記ステップS1001に戻るステップS1014と、該ステップS1014において全ての文字画像を大グループへのテーブル登録が終了したと判定したとき処理を終了するように動作する。   As shown in FIG. 10, this homomorphic character table creation process registration process to a large group includes step S1001 for reading a kanji image to be recognized from the homomorphic character table creation database, and a cord from the kanji image read in step S1001. Step S1002 for creating a pattern, Step S1003 for creating a horizontal history from the core pattern created in Step S1002, and a valley position between adjacent peak positions (mountains) from the horizontal history created in Step S1003 Step S1004 for obtaining the position, Step S1005 for selecting one valley position from the valley positions obtained in Step S1004, and whether or not the valley position selected in Step S1005 is a division position candidate (the magnitude of the distance between the peaks and valleys) Etc.) Step S1006, step S1007 that excludes the division position candidate selected in step S1005 when it is determined that it is not a division position candidate in step S1006, and division position candidate that is determined in step S1006 that it is a division position candidate As step S1009, and whether or not all valley positions determined in step S1004 have been determined. If it is determined that the determination has not been completed, step S1009 returns to step S1006, and step S1009. When it is determined that all valley positions have been determined in step S1010, the division candidate positions are determined based on the division position candidates stored in step S1008, and the division area determined in step S1010 is the same character table. Large guru Step S1011 for determining whether or not it has already been registered in step S1011, and step S1011 for registering the new major classification in the isomorphic character table and the character type read in step S1001 in the major classification When it is determined in S1012, that it is registered in Step S1011 above, Step S1013 in which the character type read in Step S1001 is added to the corresponding major classification already registered in the isomorphic character table, and all character images are large. It is determined whether or not the table registration to the group has been completed, and when it is determined that the registration of all the character images to the large group has not been completed, step S1014 returns to step S1001, and in step S1014 all of the character images are registered. Text table for large groups When it is determined that the recording has been completed, the processing is ended.

[大グループ作成処理]
前記図9のステップS901による領域構造により大分類した大グループ分けする処理は、図12(a)左側に示した漢字画像(画像パタン)「凋」の場合、前述の分割領域判別処理により図12(b)右側に示した縦分割の分割領域を取得し、この取得した縦分割の分割領域が予め同形文字テーブルに登録されているが字種は登録されていない場合(図12[b]左側)、縦分割の分割領域である#2のグループに漢字画像(画像パタン)「凋」を登録(図12[b]右側)し、この取得した縦分割の分割領域が予め同形文字テーブルに登録されていない場合(図12[c]左側)、縦分割の分割領域の大グループ#2を追加すると共に当該追加した大グループ#2に漢字画像(画像パタン)「凋」を新規登録(図12[c]右側)するように動作する。
[Large group creation processing]
The large grouping process roughly classified according to the area structure in step S901 of FIG. 9 is performed by the above-described divided area determination process in the case of the Chinese character image (image pattern) “凋” shown on the left side of FIG. (B) When the vertical division area shown on the right side is acquired, and the acquired vertical division area is registered in advance in the isomorphic character table but the character type is not registered (FIG. 12 [b] left side) ), The Chinese character image (image pattern) “凋” is registered in the # 2 group which is the vertical division area (right side of FIG. 12B), and the obtained vertical division area is registered in the isomorphic character table in advance. If not (FIG. 12 [c] left side), a large group # 2 of vertically divided areas is added and a Chinese character image (image pattern) “凋” is newly registered in the added large group # 2 (FIG. 12). [C] Right) To work.

[類似領域判定処理]
前記図9のステップS902による大グループ内においてユークリッド距離値の小さい字種同士やコサイン類似度の大きい字種同士を小グループに纏める処理は、演算部が、図13に示す如く、大グループ分類テーブル(図14左側)に登録されている大グループから1つのグルーブを選択するステップS1301と、該ステップS1301により選択した大グループから1つの文字画像を読み込むステップS1302と、該ステップS1302により読み込んだ文字画像から1つの漢字要素を選択するステップS1303と、該ステップS1303により選択した漢字要素と他の漢字画像における同一の領域位置の漢字要素間の類似度をユークリッド距離値及びコサイン類似度を用いて算出して類似度算出結果テーブル(図14右側)に格納するステップS1304とを実行する。
[Similar area judgment processing]
The processing of grouping character types having a small Euclidean distance value or character types having a large cosine similarity into a small group in the large group in step S902 of FIG. 9 is performed by the calculation unit as shown in FIG. Step S1301 for selecting one groove from the large groups registered in (left side of FIG. 14), Step S1302 for reading one character image from the large group selected in Step S1301, and the character image read in Step S1302 Step S1303 for selecting one Kanji element from the above, and calculating the similarity between the Kanji element selected in Step S1303 and the Kanji element at the same region position in another Kanji image using the Euclidean distance value and the cosine similarity. In the similarity calculation result table (right side of FIG. 14) To run and step S1304 to be.

これらステップS1301〜ステップS1304による類似度の算出は、図14に示す如く、例えば、#2の縦分割形式の大グループを選択し、この大グループに属する任意の漢字画像の左領域(偏[へん])の漢字要素に対して同一大グループ内の他漢字の同一領域位置(左の偏[へん]位置)の漢字要素との類似度を算出し、類似度の程度により小グループ分けすることによって、図14右側に示す如く、#2の大グループ内の1つの字種に対して算出対象領域の分割位置(例えば、中央縦分割・左側縦分割・右側縦分割他)に応じて類似度毎に小グルーブ分けすることができる。なお、類似度は、0〜1の範囲内で設定し、値が大きいほど類似していることを表す。   For example, as shown in FIG. 14, the similarity is calculated in steps S1301 to S1304 by selecting a large group of the # 2 vertical division format, and selecting the left region (deviation [hen] of any kanji image belonging to this large group. ])), The degree of similarity between the kanji elements in the same area position (left biased position) of other kanji in the same large group is calculated, and small groups are divided according to the degree of similarity. As shown on the right side of FIG. 14, for each character type in the large group of # 2, the degree of similarity is determined according to the division position of the calculation target area (for example, center vertical division, left vertical division, right vertical division, etc.). Can be divided into small grooves. The similarity is set within a range of 0 to 1, and the larger the value is, the more similar it is.

ついで、類似度の大きい字種同士を小グループに纏める処理は、図13に戻り、前記ステップS1301において選択した大グループ内の全ての文字画像における漢字要素(分割領域)間の類似度算出が終了したか否かを判定し、終了していないと判定したときに前記ステップS1304に戻るステップS1305と、該ステップS1305において同一大グループ内の全文字画像に対する漢字要素(分割領域)の類似度算出が終了したと判定したとき、前記ステップS1303で選択した以外の漢字要素(分割領域)の類似度算出が終了したか否かを判定し、終了していないと判定したときに前記ステップS1303に戻るステップS1306と、該ステップS1306において全ての漢字要素(分割領域)の類似度算出が終了したと判定したとき、前記ステップS1301により選択した大グループ内の全文字画像の類似度算出が終了したか否かを判定し、終了していないと判定したとき、前記ステップS1302に戻るステップS1307と、該ステップS1307において同一大グループ内全ての漢字要素(分割領域)の類似度算出が終了したと判定したとき、全ての大グループにおける類似度算出が終了したか否かを判定し、終了していないと判定したときに前記ステップS1301に戻るステップS1308と、該ステップS1308において全大グループの類似度算出が終了したと判定したとき、前記ステップS1304により算出した類似度算出結果に基づいて小グループ候補に分類するステップS1309と、該ステップS1309により分類した小グループから1グループを選択し他の小グループとの類似度を算出するステップS1310と、該ステップS1310により算出した類似度が所定の閾値以上か否かを判定するステップS1311と、該ステップS1311より算出した類似度が所定の閾値以上で無いと判定したときに小グループ候補を連結しないステップS1314と、前記ステップS1311において類似度が所定の閾値以上であると判定したときに閾値が類似度以上の小グループを1つの小グループに結合して小グループ候補分類テーブル(図15)に格納するステップS1312と、前記ステップS1309により分類した全ての小グループの類似度の算出が終了したか否かを判定し、終了していないと判定したときに前記ステップS1310に戻り、終了したと判定したときに処理を終了するステップS1313とを実行することによって、特定領域位置の漢字要素の類似度が所定値以上の小グループを結合した同形文字テーブル(図15)を作成すること(例えば、縦2分割の左側の偏が類似する小グループや、縦2分割の右側の旁が類似する小グループを作成すること)ができる。   Next, the process of grouping character types having a high degree of similarity back into a small group returns to FIG. 13 and the calculation of the degree of similarity between Chinese character elements (divided regions) in all character images in the large group selected in step S1301 is completed. In step S1305, the process returns to step S1304 when it is determined that the process has not been completed. In step S1305, the similarity calculation of kanji elements (divided areas) for all character images in the same large group is performed. When it is determined that the processing has been completed, it is determined whether or not the similarity calculation of the kanji elements (divided regions) other than those selected in step S1303 has been completed. When it is determined that the processing has not been completed, the process returns to step S1303. In step S1306, in step S1306, it is determined that the similarity calculation for all the kanji elements (divided areas) has been completed. Step S1307 returns to Step S1302 when it is determined whether the similarity calculation of all the character images in the large group selected in Step S1301 has been completed. When it is determined in S1307 that the similarity calculation for all the Kanji elements (divided areas) in the same large group has been completed, it is determined whether the similarity calculation for all large groups has been completed, and it is determined that the calculation has not been completed. If it is determined in step S1308 that the process returns to step S1301 and the similarity calculation for all large groups has been completed in step S1308, classification is made into small group candidates based on the similarity calculation result calculated in step S1304. Step S1309 and the small group classified in Step S1309 Step S1310 for selecting one group and calculating the degree of similarity with another small group, Step S1311 for determining whether the degree of similarity calculated in Step S1310 is equal to or greater than a predetermined threshold, and the similarity calculated from Step S1311 When it is determined that the degree is not equal to or greater than the predetermined threshold, the small group candidate is not connected, and when the similarity is determined to be equal to or greater than the predetermined threshold in Step S1311, the small group whose threshold is equal to or greater than the predetermined threshold is selected. Step S1312, which is combined with one small group and stored in the small group candidate classification table (FIG. 15), determines whether the calculation of the similarity of all the small groups classified in step S1309 has been completed. When it is determined that the process has not been performed, the process returns to step S1310. By executing step S1313 that ends the processing, an isomorphic character table (FIG. 15) in which small groups having the similarity of the Kanji element at the specific region position equal to or higher than a predetermined value is created (for example, vertically divided into two parts). A small group with similar left side bias and a small group with similar vertical wrinkles on the right side of the vertical split).

[同形文字テーブル]
ステップS205により作成する同形文字テーブルは、図16(a)に示す如く、分割領域で有る漢字文字の大まかな分割形式(分割無し、縦分割・・十字分割他)を表す大グループと、大グループ内の詳細分割位置(例えば、中央縦分割・左側縦分割・右側縦分割他)により区分した小グループと、該小グループの分割位置許容範囲と、該小グループに含まれる字種との各項目情報とから構成され、前記分割位置許容範囲は、図16(b)に示す如く、文字画像の横方向をX軸と縦方向をY軸であり、文字画像がnx,nyの大きさとしたとき、X軸方向及び又はY軸方法の許容される範囲をドット単位で表したものであり、分割領域の判定ができない場合、図16(c)に示す如く、文字画像をNXNにて均等分割し、同一領域の類似度をユークリッド距離値が小さい、又はコサイン類似度が大きい領域と小グループを比較することによって、候補字種を選択することができ、分割領域形式(構造)が似ていることにより認識候補に追加することができる。
[Homomorphic character table]
As shown in FIG. 16A, the isomorphic character table created in step S205 includes a large group representing a rough division format (no division, vertical division, cross-cutting, etc.) of kanji characters that are divided areas, and a large group. Items of a small group divided by detailed division positions (for example, center vertical division, left vertical division, right vertical division, etc.), division position allowable range of the small group, and character types included in the small group As shown in FIG. 16 (b), the division position allowable range includes an X axis in the horizontal direction and a Y axis in the vertical direction, and the character image has a size of nx, ny, as shown in FIG. If the allowable range of the X-axis direction and / or the Y-axis method is expressed in dot units and the division area cannot be determined, the character image is equally divided by NXN as shown in FIG. , Similarity in the same area Candidate character types can be selected by comparing a small group with a region with a small Euclidean distance value or a large cosine similarity, and added to a recognition candidate because the divided region format (structure) is similar Can do.

[まとめ]
このように本実施形態による文字認識方法を適用した文字認識装置は、従来技術の如くユークリッド距離値のみを用いた文字認識技術により全クラスのユークリッド距離値と計算対象の文字画像をプロットした場合、図19に示す如く、○印で示す正解の可能性が高いクラスと、斜線○印で示す可能性が中程度のクラスと、●印で示す正解の可能性が低いクラスとに大別され、閾値T以上の○印で示す正解の可能性が高いクラスが計算対象外となって取りこぼす可能性があると共に、逆に閾値T以下の斜線○で示す正解可能性が中程度のクラスも計算対象として誤読の可能性があるという不具合があったのに対し、本発明においては特定の領域位置の漢字要素の類似度を判定した同形文字テーブルを用いることによって、閾値T以上の○印で示すクラスも計算対象内とすることができると共に、閾値T以下の斜線○印で示す誤認識の可能性のあるクラスを計算対象から除外することができ、漏れが少なく効率的な文字認識を行うことができる。
[Summary]
In this way, the character recognition device to which the character recognition method according to the present embodiment is applied, when plotting the Euclidean distance values of all classes and the character images to be calculated by the character recognition technology using only the Euclidean distance values as in the prior art, As shown in FIG. 19, the class is roughly divided into a class having a high possibility of a correct answer indicated by a circle, a class having a medium possibility of being indicated by a hatched circle, and a class having a low possibility of a correct answer indicated by a circle. Classes with a high probability of correct answer indicated by a circle above the threshold T may not be calculated and may be missed, and conversely, a class with a moderate probability of correct answer indicated by the diagonal line below the threshold T is also calculated. While there was a problem that there was a possibility of misreading as a target, in the present invention, by using an isomorphic character table in which the similarity of kanji elements at a specific region position is determined, Class can be included in the calculation target, and the class with the possibility of erroneous recognition indicated by the slash ◯ mark below the threshold T can be excluded from the calculation target. be able to.

また、本実施形態による文字認識方法を適用した文字認識装置は、図20に示す如く、クラスAのパタン(文字画像)を○印でプロットし且つクラスBのパタン(文字画像)をX印で表し、入力パタン(文字画像)を△印で表し、△印で表す入力パタン(文字画像)とクラスA及びクラスBの平均パタン(大○印、大X印)とのユークリッド距離値が同一の場合、従来技術においてはクラスA及びクラスBの両パタンと比較しなければならないために処理時間が冗長となる課題を招くものであったのに対し、本実施形態にようにコサイン類似度も併用し、クラスAの対するコサイン類似度角度αがクラスBのコサイン類似度角度βと比べて大きいためにクラスAを比較対象から除外することによって、高速に文字認識を行うことができる。   In addition, as shown in FIG. 20, the character recognition apparatus to which the character recognition method according to the present embodiment is applied plots class A patterns (character images) with circles and class B patterns (character images) with X marks. The input pattern (character image) is represented by Δ, and the Euclidean distance value between the input pattern (character image) represented by Δ and the average pattern of class A and class B (large ○ mark, large X mark) is the same. In this case, in the conventional technique, since it has to be compared with both the class A and class B patterns, the processing time becomes redundant. On the other hand, the cosine similarity is also used as in this embodiment. Since the cosine similarity angle α for class A is larger than the cosine similarity angle β for class B, character recognition can be performed at high speed by excluding class A from the comparison target.

この文字認識処理時間は、認識対象時に比較する出力候補数に対する処理時間を棒グラフ・認識精度を折れ(破線)線グラフで表した図21に示す如く、認識度を高精度とした場合は処理時間に長時間を要し、認識速度を高速化した場合は認識速度が低下する特性があり、このことから、本実施形態の如く出力候補数を絞り込むことによって、大容量なメモリサイズを要することなく、高速な文字認識を行うことができる。   This character recognition processing time is a processing time when the recognition degree is set to high accuracy as shown in FIG. 21 in which the processing time for the number of output candidates to be compared at the time of recognition is represented by a bar graph / recognition accuracy by a broken (dashed) line graph. If the recognition speed is increased when the recognition time is increased, the recognition speed decreases. Therefore, by narrowing down the number of output candidates as in this embodiment, a large memory size is not required. , High-speed character recognition can be performed.

100 文字認識装置、110 入力部、120 表示部、130 画像取得部、
140 通信部、150 演算部、160 外部記憶部、165 文字識別用辞書
100 character recognition device, 110 input unit, 120 display unit, 130 image acquisition unit,
140 communication unit, 150 calculation unit, 160 external storage unit, 165 dictionary for character identification

Claims (10)

複数領域の漢字要素から成る漢字を含む文字を文字画像として光学的にスキャンして読み取る入力部と、該入力部を用いてスキャンした文字画像を取得する画像取得部と、複数の標準文字画像を格納した文字識別用辞書及び共通の部首や旁等で漢字を分類すると共に目視により似ている類似及び同形の漢字を分類するための同形文字テーブルを格納する外部記憶部と、該文字識別用辞書及び同形文字テーブルを参照して文字画像の文字認識を制御する演算部とを備え、該演算部が、入力した文字画像を文字識別用辞書を参照して文字認識処理を実行する文字認識装置であって、
前記演算部が、
前記画像取得部がスキャンした1文字単位の文字画像を漢字要素毎に分割する分割領域を判定する分割領域判別工程と、
該分割領域判別工程により判定した文字画像の同一領域位置における漢字要素のコサイン類似度を算出するコサイン類似度計算工程と、
前記分割領域判別工程により判定した文字画像の同一領域位置における漢字要素のユークリッド距離値を算出するユークリッド距離値算出工程と、
前記分割領域判別工程により判定した分割領域に基づく漢字構成が同一であり、且つ前記コサイン類似度計算工程により算出したコサイン類似度による同一領域位置の漢字要素間の類似度が所定値より高い文字画像と前記ユークリッド距離値算出工程により算出した漢字要素間のユークリッド距離値が所定値より小さい文字画像とを類似度の高い同形文字としてグループ分けした同形文字テーブルに格納する同形文字テーブル作成工程と、
前記コサイン類似度計算工程により算出したコサイン類似度が所定のコサイン類似度より大きい文字画像と、前記ユークリッド距離値算出工程により算出したユークリッド距離値が所定値より小さい文字画像と、前記同形文字テーブル作成工程により同一領域位置の類似度が高い文字画像をグループ分けした同形文字の文字画像との論理和の文字画像を候補文字として文字認識を行う標準文字認識工程とを実行することを特徴とする文字認識装置。
And input unit for reading in optical scan characters including Chinese characters consisting of Chinese elements a plurality of areas as a character image, an image acquisition unit for acquiring a character image scanned by using the input unit, a plurality of standard character image A character identification dictionary storing characters, an external storage unit for classifying kanji characters by a common radical, 旁, etc., and storing an isomorphic character table for classifying similar and isomorphic kanji characters visually, and the character identification A character recognition unit that performs character recognition processing with reference to the character identification dictionary with respect to the input character image. A device,
The computing unit is
A divided region determination step of determining a divided region for dividing the character image in units of one character scanned by the image acquisition unit for each Chinese character element;
A cosine similarity calculation step of calculating the cosine similarity of the kanji elements in the same region position of the character image determined by the divided region determination step;
A Euclidean distance value calculating step of calculating a Euclidean distance value of a Chinese character element at the same region position of the character image determined by the divided region determining step;
Character images having the same kanji composition based on the divided areas determined in the divided area determining step and having a similarity between kanji elements in the same region position based on the cosine similarity calculated in the cosine similarity calculating step higher than a predetermined value And an isomorphic character table creating step for storing character images whose Euclidean distance values between Kanji elements calculated by the Euclidean distance value calculating step are smaller than a predetermined value and grouped as isomorphic characters with high similarity,
A character image whose cosine similarity calculated by the cosine similarity calculation step is larger than a predetermined cosine similarity, a character image whose Euclidean distance value calculated by the Euclidean distance value calculation step is smaller than a predetermined value, and creation of the isomorphic character table A standard character recognition step of performing character recognition using a character image of a logical sum with a character image of isomorphic characters obtained by grouping character images with high similarity in the same region position by the process as a candidate character Recognition device.
前記演算部が、標準文字認識工程による論理和より得た文字画像から、前記分割領域判別工程により分割した複数の分割領域の構成が異なる異種候補文字と該異種候補文字が属するグループに含まれる文字画像を除外した候補文字に基づいて文字認識を行う高精細文字認識工程とを実行することを特徴とする請求項1記載の文字認識装置。   Characters included in a group to which the different candidate characters belong and different candidate characters having different configurations of a plurality of divided regions divided by the divided region determination step from the character image obtained by the logical sum in the standard character recognition step. The character recognition apparatus according to claim 1, further comprising: a high-definition character recognition step of performing character recognition based on candidate characters excluding images. 前記演算部が、前記ユークリッド距離値算出工程により算出したユークリッド距離値が所定値より小さい文字画像を候補文字として文字認識を行う高速文字認識工程を実行することを特徴とする請求項1又は2記載の文字認識装置。 3. The high-speed character recognition step of performing character recognition using a character image whose Euclidean distance value calculated by the Euclidean distance value calculating step is smaller than a predetermined value as a candidate character. Character recognition device. 前記演算部が、前記同形文字テーブル作成工程において、前記分割領域判別工程により判定した分割領域に基づく漢字構成が同一な文字画像を大グループとして分ける大グループ分け工程と、該大グループ分け工程によりグループ分けした大グルーブ内における特定の領域位置の漢字要素のコサイン類似度が所定値より高く且つ字画像とユークリッド距離値が所定値より小さい文字画像を小グループとして分ける小グループ分け工程とを含み、
該大グループ分け及び小グループ分けした漢字画像を同形文字テーブルに格納することを特徴とする請求項1から3何れかに記載の文字認識装置。
In the isomorphic character table creating step, the computing unit divides character images having the same kanji composition based on the divided regions determined in the divided region determining step into large groups, and groups by the large grouping step. A small grouping step of dividing the character image and the character image and the Euclidean distance value smaller than the predetermined value into small groups, wherein the cosine similarity of the kanji element at a specific region position in the divided large groove is higher than a predetermined value,
4. The character recognition apparatus according to claim 1, wherein the kanji images divided into large groups and small groups are stored in an isomorphic character table.
前記演算部が、前記標準文字認識工程と高精度文字認識工程と高速文字認識工程とを切り替える、または調整する機能を備えることを特徴とする請求項3又は4記載の文字認識装置。   5. The character recognition device according to claim 3, wherein the arithmetic unit has a function of switching or adjusting the standard character recognition step, the high-precision character recognition step, and the high-speed character recognition step. 複数領域の漢字要素から成る漢字を含む文字を文字画像として光学的にスキャンして読み取る入力部と、該入力部を用いてスキャンした文字画像を取得する画像取得部と、複数の標準文字画像を格納した文字識別用辞書及び共通の部首や旁等で漢字を分類すると共に目視により似ている類似及び同形の漢字を分類するための同形文字テーブルを格納する外部記憶部と、該文字識別用辞書及び同形文字テーブルを参照して文字画像の文字認識を制御する演算部とを備えて文字を認識する文字認識装置の文字認識方法であって、
該演算部に、
前記画像取得部がスキャンした1文字単位の文字画像を漢字要素毎に分割する分割領域を判定する分割領域判別工程と、
該分割領域判別工程により判定した文字画像の同一領域位置における漢字要素のコサイン類似度を算出するコサイン類似度計算工程と、
前記分割領域判別工程により判定した文字画像の同一領域位置における漢字要素のユークリッド距離値を算出するユークリッド距離値算出工程と、
前記分割領域判別工程により判定した分割領域に基づく漢字構成が同一であり、且つ前記コサイン類似度計算工程により算出したコサイン類似度による同一領域位置の漢字要素間の類似度が所定値より高い文字画像と前記ユークリッド距離値算出工程により算出した漢字要素間のユークリッド距離値が所定値より小さい文字画像とを類似度の高い同形文字としてグループ分けした同形文字テーブルに格納する同形文字テーブル作成工程と、
前記コサイン類似度計算工程により算出したコサイン類似度が所定のコサイン類似度より大きい文字画像と、前記ユークリッド距離値算出工程により算出したユークリッド距離値が所定値より小さい文字画像と、前記同形文字テーブル作成工程により同一領域位置の類似度が高い文字画像をグループ分けした同形文字の文字画像との論理和の文字画像を候補文字として文字認識を行う標準文字認識工程とを実行させることを特徴とする文字認識方法。
And input unit for reading in optical scan characters including Chinese characters consisting of Chinese elements a plurality of areas as a character image, an image acquisition unit for acquiring a character image scanned by using the input unit, a plurality of standard character image A character identification dictionary storing characters, an external storage unit for classifying kanji characters by a common radical, 旁, etc., and storing an isomorphic character table for classifying similar and isomorphic kanji characters visually, and the character identification A character recognition method for recognizing a character, comprising an arithmetic unit that controls character recognition of a character image with reference to a dictionary and an isomorphic character table,
In the calculation unit,
A divided region determination step of determining a divided region for dividing the character image in units of one character scanned by the image acquisition unit for each Chinese character element;
A cosine similarity calculation step of calculating the cosine similarity of the kanji elements in the same region position of the character image determined by the divided region determination step;
A Euclidean distance value calculating step of calculating a Euclidean distance value of a Chinese character element at the same region position of the character image determined by the divided region determining step;
Character images having the same kanji composition based on the divided areas determined in the divided area determining step and having a similarity between kanji elements in the same region position based on the cosine similarity calculated in the cosine similarity calculating step higher than a predetermined value And an isomorphic character table creating step for storing character images whose Euclidean distance values between Kanji elements calculated by the Euclidean distance value calculating step are smaller than a predetermined value and grouped as isomorphic characters with high similarity,
A character image whose cosine similarity calculated by the cosine similarity calculation step is larger than a predetermined cosine similarity, a character image whose Euclidean distance value calculated by the Euclidean distance value calculation step is smaller than a predetermined value, and creation of the isomorphic character table And a standard character recognition step of performing character recognition using a character image of a logical sum with a character image of isomorphic characters obtained by grouping character images having high similarity in the same region position by a process as a candidate character. Recognition method.
前記演算部に、標準文字認識工程による論理和より得た文字画像から、前記分割領域判別工程により分割した複数の分割領域の構成が異なる異種候補文字と該異種候補文字が属するグループに含まれる文字画像を除外した候補文字に基づいて文字認識を行う高精細文字認識工程とを実行させることを特徴とする請求項6記載の文字認識方法。   Characters included in a group to which the heterogeneous candidate characters belong to different candidate characters having different configurations of a plurality of divided areas divided by the divided area determination step from a character image obtained by logical sum in the standard character recognition step The character recognition method according to claim 6, further comprising: performing a high-definition character recognition step of performing character recognition based on candidate characters excluding images. 前記演算部に、前記ユークリッド距離値算出工程により算出したユークリッド距離値が所定値より小さい文字画像を候補文字として文字認識を行う高速文字認識工程を実行させることを特徴とする請求項6又は7記載の文字認識方法。   8. The high-speed character recognition step of performing character recognition using a character image whose Euclidean distance value calculated by the Euclidean distance value calculating step is smaller than a predetermined value as a candidate character is executed by the computing unit. Character recognition method. 前記演算部に、前記同形文字テーブル作成工程において、前記分割領域判別工程により判定した分割領域に基づく漢字構成が同一な文字画像を大グループとして分ける大グループ分け工程と、該大グループ分け工程によりグループ分けした大グルーブ内における特定の領域位置の漢字要素のコサイン類似度が所定値より高く且つ字画像とユークリッド距離値が所定値より小さい文字画像を小グループとして分ける小グループ分け工程とを含ませ、該大グループ分け及び小グループ分けした漢字画像を同形文字テーブルに格納させることを特徴とする請求項6から8何れかに記載の文字認識方法。   In the isomorphic character table creating step, the arithmetic unit has a large grouping step in which character images having the same kanji composition based on the divided regions determined in the divided region determining step are divided into large groups, and the large grouping step A small grouping step of dividing a character image and a character image having a Euclidean distance value smaller than a predetermined value as a small group, wherein the cosine similarity of the Kanji element at a specific region position in the divided large groove is higher than a predetermined value, 9. The character recognition method according to claim 6, wherein the kanji images divided into large groups and small groups are stored in an isomorphic character table. 前記演算部に、前記標準文字認識工程と高精度文字認識工程と高速文字認識工程とを切り替える、または調整する機能を備えさせることを特徴とする請求項8又は9記載の文字認識方法。   The character recognition method according to claim 8 or 9, wherein the arithmetic unit is provided with a function of switching or adjusting the standard character recognition step, the high-precision character recognition step, and the high-speed character recognition step.
JP2014119039A 2014-06-09 2014-06-09 Character recognition device and character recognition method Active JP6327963B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014119039A JP6327963B2 (en) 2014-06-09 2014-06-09 Character recognition device and character recognition method
CN201510313899.7A CN105320971B (en) 2014-06-09 2015-06-09 Character recognition device and character identifying method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014119039A JP6327963B2 (en) 2014-06-09 2014-06-09 Character recognition device and character recognition method

Publications (2)

Publication Number Publication Date
JP2015232778A JP2015232778A (en) 2015-12-24
JP6327963B2 true JP6327963B2 (en) 2018-05-23

Family

ID=54934187

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014119039A Active JP6327963B2 (en) 2014-06-09 2014-06-09 Character recognition device and character recognition method

Country Status (2)

Country Link
JP (1) JP6327963B2 (en)
CN (1) CN105320971B (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101777601B1 (en) * 2016-01-11 2017-09-13 경북대학교 산학협력단 Distinction method and system for characters written in caoshu characters or cursive characters
KR102107444B1 (en) * 2018-07-30 2020-06-02 주식회사 한글과컴퓨터 Apparatus for recognizing character by comparing original image and generated image and operating method thereof
CN110503682B (en) * 2019-08-08 2021-05-07 深圳市优讯通信息技术有限公司 Rectangular control identification method and device, terminal and storage medium
CN110674813B (en) * 2019-09-24 2022-04-05 北京字节跳动网络技术有限公司 Chinese character recognition method and device, computer readable medium and electronic equipment
KR102374280B1 (en) * 2020-02-27 2022-03-16 주식회사 와들 Blocking System of Text Extracted from Image and Its Method
CN116740688B (en) * 2023-08-11 2023-11-07 武汉市中西医结合医院(武汉市第一医院) Medicine identification method and system

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11238099A (en) * 1997-12-19 1999-08-31 Matsushita Electric Ind Co Ltd Character recognition device, method therefor and computer readable recording medium stored with character recognition program
JPH11184971A (en) * 1997-12-22 1999-07-09 Toshiba Corp Device and method for character input with handwritten character recognition function
JP2001256437A (en) * 2000-03-09 2001-09-21 Matsushita Electric Ind Co Ltd On-line handwritten kanji recognizing device corresponding to free stroke order and continuously writing stroke
CN100587660C (en) * 2007-03-30 2010-02-03 北京三星通信技术研究有限公司 Method and device for forecasting and discriminating hand-written characters
JP5039659B2 (en) * 2008-08-01 2012-10-03 日立オムロンターミナルソリューションズ株式会社 Character recognition method and character recognition device
CN102393850B (en) * 2011-07-22 2016-10-26 镇江诺尼基智能技术有限公司 A kind of Chinese character pattern cognition similarity determines method
CN102323929A (en) * 2011-08-23 2012-01-18 上海粱江通信技术有限公司 Method for realizing fuzzy matching of Chinese short message with keyword
JP2014029608A (en) * 2012-07-31 2014-02-13 Sumitomo Electric Ind Ltd Character recognition device, character recognition method, and computer program
CN102982330B (en) * 2012-11-21 2016-12-21 新浪网技术(中国)有限公司 Character identifying method and identification device in character image

Also Published As

Publication number Publication date
JP2015232778A (en) 2015-12-24
CN105320971B (en) 2018-11-16
CN105320971A (en) 2016-02-10

Similar Documents

Publication Publication Date Title
JP6327963B2 (en) Character recognition device and character recognition method
Roy et al. HMM-based Indic handwritten word recognition using zone segmentation
US7302099B2 (en) Stroke segmentation for template-based cursive handwriting recognition
Gatos et al. ICDAR2009 handwriting segmentation contest
EP1971957B1 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
Khurshid et al. Word spotting in historical printed documents using shape and sequence comparisons
CN105930159A (en) Image-based interface code generation method and system
EP1376390A2 (en) Writing guide for a free-form document editor
KR100412317B1 (en) Character recognizing/correcting system
NO20161728A1 (en) Written text transformer
KR101719088B1 (en) Method for partitioning area, and inspection device
JP5694234B2 (en) Electronic device, handwritten document display method, and display program
Zhou et al. Easy generation of personal Chinese handwritten fonts
Clausner et al. Icfhr 2018 competition on recognition of historical arabic scientific manuscripts–rasm2018
JP2021043478A (en) Information processing device, control method thereof and program
US8989485B2 (en) Detecting a junction in a text line of CJK characters
JP2013246732A (en) Handwritten character retrieval apparatus, method and program
Li et al. Extracting figures and captions from scientific publications
JP2008108114A (en) Document processor and document processing method
Garz et al. A user-centered segmentation method for complex historical manuscripts based on document graphs
Razak et al. A real-time line segmentation algorithm for an offline overlapped handwritten Jawi character recognition chip
KR102102394B1 (en) Method and apparatus for preprocessing image for recognition of character
JP2012108893A (en) Hand-written entry method
US20160034569A1 (en) Search device
JP6007720B2 (en) Information processing apparatus and information processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180417

R150 Certificate of patent or registration of utility model

Ref document number: 6327963

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250