JP2000306045A - Word recognizing device - Google Patents

Word recognizing device

Info

Publication number
JP2000306045A
JP2000306045A JP11113733A JP11373399A JP2000306045A JP 2000306045 A JP2000306045 A JP 2000306045A JP 11113733 A JP11113733 A JP 11113733A JP 11373399 A JP11373399 A JP 11373399A JP 2000306045 A JP2000306045 A JP 2000306045A
Authority
JP
Japan
Prior art keywords
word
character
feature
unit
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11113733A
Other languages
Japanese (ja)
Other versions
JP4237864B2 (en
Inventor
Yoshinobu Hotta
悦伸 堀田
Hiroaki Takebe
浩明 武部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP11373399A priority Critical patent/JP4237864B2/en
Publication of JP2000306045A publication Critical patent/JP2000306045A/en
Application granted granted Critical
Publication of JP4237864B2 publication Critical patent/JP4237864B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a word recognizing device for recognizing a handwritten character string improved in recognition even in the tilt or different character size of a word. SOLUTION: This word recognizing device is provided with an individual character recognizing part 21 for recognizing respective characters constituting the word of an input image, a word recognizing part 22 for collectively recognizing the word of the input image, a certainty calculating part 10 for calculating the certainty of the word from the recognized result of the individual character recognizing part 21 and calculating the certainty of the word from the recognized result of the word recognizing part 22 and a certainty comparing part 11 for comparing the certainty calculated results of the individual character recognizing part 21 and the word recognizing part 22 calculated by the certainty calculating part 10 and on the basis of the compared result of the certainty, the certainty comparing part 11 selects greater one of the certainty of the individual character recognizing part 21 and the word recognizing part 22.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、手書き文字列を認
識する単語認識装置に関する。
The present invention relates to a word recognition device for recognizing a handwritten character string.

【0002】[0002]

【従来の技術】近年、手書き文字入力機器として文字認
識装置OCR(Optical Charactor
Reader)の需要が増加している。文字認識装置の
中には個別文字認識装置のほか、文字認識を向上させる
ため、文字列に注目した単語認識装置が登場している。
2. Description of the Related Art In recent years, a character recognition device OCR (Optical Character) has been used as a handwritten character input device.
Reader) demand is increasing. Among the character recognition devices, in addition to the individual character recognition device, a word recognition device that focuses on a character string to improve character recognition has appeared.

【0003】図7(a)に従来例の個別文字認識装置31
の構成図を示す。個別文字認識装置31は、画像入力部
2、正規化部3、特徴抽出部4、特徴照合部5、認識結
果出力部6、個別文字辞書7より構成される。
FIG. 7A shows a conventional individual character recognition device 31.
FIG. The individual character recognition device 31 includes an image input unit 2, a normalization unit 3, a feature extraction unit 4, a feature comparison unit 5, a recognition result output unit 6, and an individual character dictionary 7.

【0004】画像入力部2は、スキャナなどにより手書
き文字の入力画像を取得する。正規化部3は、文字の大
きさ、位置を一定に揃える。特徴抽出部4は、正規化さ
れた入力画像から特徴量を抽出する。特徴照合部5は、
個別文字辞書7の文字の特徴量と、特徴抽出部4が抽出
した特徴量とを照合する。認識結果出力部6は、特徴照
合部5で照合した結果をディスプレイなどに出力する。
個別文字辞書7は文字とその特徴量とから構成される。
[0004] The image input unit 2 acquires an input image of handwritten characters using a scanner or the like. The normalizing unit 3 makes the size and position of the characters uniform. The feature extraction unit 4 extracts a feature amount from the normalized input image. The feature matching unit 5
The feature amount of the character in the individual character dictionary 7 is compared with the feature amount extracted by the feature extraction unit 4. The recognition result output unit 6 outputs the result of comparison by the feature comparison unit 5 to a display or the like.
The individual character dictionary 7 is composed of characters and their feature amounts.

【0005】図7(b)の住所例を参照して、動作を説
明する。
The operation will be described with reference to an address example shown in FIG.

【0006】画像入力部2から入力された文字列「東京
都」は、正規化部3で規定の大きさに揃えられた後、特
徴抽出部4で、文字の特徴量を抽出される。抽出結果の
「東」の特徴量、「京」の特徴量、「都」の特徴量を特
徴照合部5へ渡す。
The character string “Tokyo” input from the image input unit 2 is adjusted to a prescribed size by the normalization unit 3, and the feature amount of the character is extracted by the feature extraction unit 4. The feature amount of “East”, the feature amount of “K”, and the feature amount of “Tokyo” of the extraction result are passed to the feature matching unit 5.

【0007】特徴照合部5では、個別文字辞書7のすべ
ての文字と特徴抽出部4からの「 東」「京」「 都」の特
徴量とを各々比較し、その結果、特徴量の差分が最小値
となった文字を認識結果として認識結果出力部6より出
力する。
The feature matching unit 5 compares all the characters in the individual character dictionary 7 with the feature amounts of “East”, “Kyo”, and “To” from the feature extraction unit 4, and as a result, the difference between the feature amounts is calculated. The character having the minimum value is output from the recognition result output unit 6 as a recognition result.

【0008】図8(a)に従来例の単語認識装置1の構
成図を示す。
FIG. 8 (a) shows a configuration diagram of a conventional word recognition apparatus 1.

【0009】単語認識装置1は、画像入力部2、正規化
部3、特徴抽出部4、特徴照合部5特徴合成部8、認識
結果出力部6、単語リスト部9および個別文字辞書7を
備える。
The word recognition apparatus 1 includes an image input unit 2, a normalization unit 3, a feature extraction unit 4, a feature comparison unit 5, a feature synthesis unit 8, a recognition result output unit 6, a word list unit 9, and an individual character dictionary 7. .

【0010】画像入力部2は、スキャナなどにより手書
き文字の入力画像を取得する。正規化部3は、文字の大
きさ、位置を一定に揃える。特徴抽出部4は、入力画像
から特徴量を抽出する。特徴合成部8は、単語を選択
し、選択された単語を構成する個々の文字の特徴量を個
別文字辞書7から抽出し合成する。特徴照合部5は、特
徴合成部8が合成した単語の特徴量と特徴抽出部4が抽
出した入力画像の特徴量とを照合する。単語リスト部9
は、複数の単語リストからなる。認識結果出力部6は、
特徴照合部5で照合した結果の中で最も類似した特徴量
を持つ単語をディスプレイなどに出力する。個別文字辞
書7は、文字とその特徴量とから構成される。
The image input unit 2 acquires an input image of a handwritten character using a scanner or the like. The normalizing unit 3 makes the size and position of the characters uniform. The feature extraction unit 4 extracts a feature amount from the input image. The feature synthesizing unit 8 selects a word, extracts feature amounts of individual characters constituting the selected word from the individual character dictionary 7, and synthesizes them. The feature matching unit 5 compares the feature amount of the word combined by the feature combining unit 8 with the feature amount of the input image extracted by the feature extracting unit 4. Word list part 9
Consists of multiple word lists. The recognition result output unit 6
A word having the most similar feature amount among the results matched by the feature matching unit 5 is output to a display or the like. The individual character dictionary 7 includes characters and their feature amounts.

【0011】図8(b)は、住所例を示す。FIG. 8B shows an example of an address.

【0012】都道府県などのキーとなる文字は、規定の
座標に印刷されているものとする。
It is assumed that characters serving as keys such as prefectures are printed at predetermined coordinates.

【0013】画像入力部2は入力された画像について、
まず都道府県のキーとなる文字が印刷されている位置を
検出し、その前の文字列「東京」を切り出す。切り出さ
れた文字列を正規化部3で正規化する。正規化された単
語は、特徴抽出部4で特徴量を抽出し、特徴照合部5に
渡す。特徴合成部8は、単語リスト部9の中にある都道
府県の単語リストを選択する。単語リストには、「北
海」、「東京」、「沖縄」等が単語として登録されてお
り、個別文字辞書7には、すべての文字の特徴量が登録
されている。
The image input unit 2 receives the input image
First, a position where a character serving as a key of a prefecture is printed is detected, and a character string “Tokyo” preceding the position is cut out. The extracted character string is normalized by the normalization unit 3. The feature amount of the normalized word is extracted by the feature extracting unit 4 and passed to the feature matching unit 5. The feature synthesizing unit 8 selects a word list of prefectures in the word list unit 9. In the word list, “Hokukai”, “Tokyo”, “Okinawa”, and the like are registered as words, and the individual character dictionary 7 registers feature amounts of all characters.

【0014】まず、特徴合成部8は、都道府県の単語リ
ストに従って、まず「北海」の単語を選択し、個別文字
辞書7から、「北」と「海」の特徴量が取り出され、
「北海」の特徴量を合成する。その合成結果と入力画像
の特徴量とが特徴照合部5で照合され、両者間の特徴量
の差を求める。そして同様の処理を単語リストのすべて
の単語について行う。照合処理が終了するとそれらの単
語の中で特徴量の差分の小さいものを認識結果出力部6
から認識結果として出力する。
First, the feature synthesizing section 8 first selects the word "North Sea" according to the word list of prefectures, and extracts the feature amounts of "North" and "Sea" from the individual character dictionary 7,
The feature quantity of "North Sea" is synthesized. The result of the synthesis is compared with the feature amount of the input image by the feature matching unit 5, and a difference in feature amount between the two is obtained. Then, the same processing is performed for all the words in the word list. When the matching process is completed, a word having a small difference in the feature amount among the words is output to the recognition result output unit 6.
And output as a recognition result.

【0015】[0015]

【発明が解決しようとする課題】文字を個別に認識して
いる装置では、文字が接触している文字列を精度よく切
り出すことは、困難であった。そのため、接触文字を分
離せずに単語として一括して捉える単語認識方式が登場
している。しかし、単語を個々の文字に分離することな
く一括して認識する方式では、単語の画像から単語特徴
量を抽出しているため、文字同士が同じ高さに並んでい
れば、高い認識で行えるが文字列が傾いている場合や単
語を構成する文字のサイズがばらばらで異なる場合は、
認識精度が低かった。
With an apparatus that individually recognizes characters, it has been difficult to accurately extract a character string in contact with the character. For this reason, a word recognition method has been developed which collectively captures contact characters as words without separating them. However, in the method of recognizing words collectively without separating them into individual characters, since the word feature amount is extracted from the image of the word, high recognition can be performed if the characters are arranged at the same height. If the is skewed or if the letters that make up the word vary in size,
Recognition accuracy was low.

【0016】また、単語認識装置の特徴合成部で単語の
特徴量を合成するときには、個別文字辞書を基本にして
合成しているため、「太秦馬塚」、「太秦垣内」のよう
に同じ部分文字列が含まれている「太秦」の部分につい
て毎回、合成処理を行うため合成処理に無駄があった。
Also, when synthesizing the feature amounts of words in the feature synthesizing section of the word recognition device, the synthesizing is performed based on the individual character dictionary. Since the synthesis process is performed for the "Uzumasa" portion including the column every time, the synthesis process is useless.

【0017】また、単語認識装置の特徴合成部で単語の
特徴量を合成するとき、単一サイズの個別文字辞書から
の抽出のため、入力画像の特徴量との間で特徴次元数に
差を生じ、誤読の要因となっていた。さらに傾いた単語
も誤読の要因になっていた。
Further, when the feature amount of the word is synthesized by the feature synthesizing unit of the word recognition device, the difference between the feature amount of the input image and the feature dimension of the input image is reduced due to the extraction from the single-size individual character dictionary. This caused misreading. Skewed words also caused misreading.

【0018】また、単語認識装置の特徴照合部では、同
一文字が含まれている単語間で、同一文字の特徴量が原
因で、誤読が生じやすかった。本発明の目的は、(1)
傾いた単語および異なる文字サイズの単語の認識精度を
高めた単語認識装置の提供と、(2)合成速度が速く認
識精度を高めた特徴合成方式を有する単語認識装置の提
供と、(3)同一文字が含まれている単語間の誤読を防
止した特徴照合方式を有する単語認識装置の提供にあ
る。
In the feature collating unit of the word recognition device, misreading is likely to occur between words containing the same character due to the feature amount of the same character. An object of the present invention is to provide (1)
(3) The same as the provision of a word recognition device having an improved recognition accuracy for a tilted word and a word having a different character size, and (2) the provision of a word recognition device having a feature synthesizing method in which the synthesis speed is high and the recognition accuracy is improved. It is an object of the present invention to provide a word recognition device having a feature matching method that prevents misreading between words including characters.

【0019】[0019]

【課題を解決するための手段】入力画像の単語を構成す
る個々の文字を認識する個別文字認識部と、入力画像の
単語を一括して認識する単語認識部と、個別文字認識部
の認識結果からの単語の確信度の算出と単語認識部の認
識結果からの単語の確信度の算出とを行う確信度算出部
と、確信度算出部で算出された個別文字認識部と単語認
識部の確信度算出結果を比較する確信度比較部とを備
え、確信度比較部は、確信度の比較結果に基づき、個別
文字認識部と単語認識部の確信度の大きい方を選択する
構成の単語認識装置。
An individual character recognizing unit for recognizing individual characters constituting words of an input image, a word recognizing unit for collectively recognizing words of the input image, and a recognition result of the individual character recognizing unit Calculation unit for calculating the certainty factor of the word from the words and calculating the certainty factor of the word from the recognition result of the word recognition unit, and the confidence of the individual character recognition unit and the word recognition unit calculated by the certainty calculation unit A word recognition device having a certainty comparison unit that compares the calculation results, the certainty comparison unit selecting one of the individual character recognition unit and the word recognition unit with a higher certainty based on the comparison result of the certainty. .

【0020】この構成により、個別文字認識部と単語認
識部を併用することで、それぞれ単独で用いた場合以上
の認識精度を出すことが可能である。すなわち単語認識
部は接触文字の認識精度が高く、個別認識部は、傾き文
字および文字サイズの変化の認識精度が高いというよう
に、お互いを補完し合う。
With this configuration, by using the individual character recognition unit and the word recognition unit together, it is possible to achieve higher recognition accuracy than when each is used alone. That is, the word recognizing units complement each other such that the recognition accuracy of the contact character is high, and the individual recognizing units are high in the recognition accuracy of the inclination character and the change in the character size.

【0021】また、入力画像の個々の文字を認識する個
別文字認識部と、入力画像の単語を一括して認識する単
語認識部と、入力画像の単語を構成する個々の文字の間
隔を検出する文字間隔検出手段と、文字間隔検出手段に
より検出された間隔を所定の閾値と比較する文字間隔比
較手段とを備え、文字間隔比較手段は、検出された文字
間隔が所定の閾値より小さければ単語認識部を選択し、
検出された文字間隔が所定の閾値より大きければ個別文
字認識部を選択する構成の単語認識装置。
Further, an individual character recognizing unit for recognizing individual characters of the input image, a word recognizing unit for recognizing words of the input image collectively, and detecting an interval between individual characters constituting words of the input image. A character spacing detecting means for comparing the spacing detected by the character spacing detecting means with a predetermined threshold, wherein the character spacing comparing means recognizes the word if the detected character spacing is smaller than the predetermined threshold. Select the department,
A word recognition device configured to select an individual character recognition unit if the detected character spacing is greater than a predetermined threshold.

【0022】この構成により、個別文字認識部と単語認
識部を使いわけることで、それぞれ単独で用いた場合以
上の認識精度を出すことが可能であり、また高速で処理
が可能となる。すなわち文字間隔が狭い場合は、単語認
識部を使用することで、接触文字の認識精度を高くし文
字間隔が広い場合は、個別認識部を使用して、傾き文字
および異なる文字サイズの認識精度を高くするというよ
うに、お互いを補完し合う。
With this configuration, by using the individual character recognizing unit and the word recognizing unit separately, it is possible to achieve higher recognition accuracy than when each is used alone, and it is possible to perform processing at high speed. In other words, if the character spacing is narrow, use a word recognition unit to increase the recognition accuracy of contact characters.If the character spacing is wide, use an individual recognition unit to improve the recognition accuracy of tilted characters and different character sizes. Complement each other, such as making them higher.

【0023】また、入力画像から単語の特徴量を抽出し
た結果と辞書の個々の文字の特徴量から単語の特徴量を
合成した結果とを照合することで単語の認識を行う単語
認識装置であって、複数の各種サイズの文字、部分文字
列の特徴量と複数の各種文字サイズの画像を保持する辞
書と、前記辞書に基づいて文字、部分文字列の特徴量か
ら単語の特徴量を合成する手段および前記辞書に基づい
て文字の画像から単語の画像を合成し特徴量の抽出を行
う手段を有する特徴合成部とを備えた構成である。
Further, the word recognition apparatus performs word recognition by comparing the result of extracting the feature of a word from an input image with the result of synthesizing the feature of a word from the feature of each character in the dictionary. And a dictionary that holds a plurality of characters and partial character string feature amounts and a plurality of various character size images, and synthesizes a word feature amount from the character and partial character string feature amounts based on the dictionary. And a feature synthesizing unit having means for synthesizing a word image from a character image based on the dictionary and extracting a feature amount.

【0024】この構成により、単語を構成する文字だけ
でなく、出現頻度の高い部分文字列の特徴量を予め辞書
として持つことで、単語の特徴量の合成の高速化が図れ
るとともに、異なる文字サイズ、部分文字列を持つこと
で認識精度が高まる。さらに画像合成をすることによ
り、傾斜した単語の特徴量も抽出できるので、傾斜した
単語の認識精度も高まる。
According to this configuration, not only the characters constituting the word but also the feature amount of the partial character string having a high frequency of appearance are previously stored in the dictionary, so that the speed of synthesizing the feature amount of the word can be increased, and different character sizes can be obtained. , Having a partial character string enhances recognition accuracy. Further, by performing the image synthesis, the feature amount of the inclined word can be extracted, so that the recognition accuracy of the inclined word is improved.

【0025】また、所定の単語サイズの特徴量を合成す
る文字、部分文字列の特徴量を文字数に応じたサイズで
辞書より選択する選択手段を有する特徴合成部を備えた
構成の単語認識装置。
Also, a word recognition apparatus having a feature synthesizing unit having a selecting means for selecting a character for synthesizing a characteristic amount of a predetermined word size and a characteristic amount of a partial character string from a dictionary in a size corresponding to the number of characters.

【0026】この構成により、文字数に応じた複数の異
なる文字サイズを持ち、同一正規化サイズで、単語の特
徴量を合成することで、入力画像の特徴次元数と合成し
た特徴次元数とが同一となり、認識精度が向上する。
With this configuration, by combining a plurality of different character sizes in accordance with the number of characters and combining the feature amounts of words with the same normalized size, the number of feature dimensions of the input image and the number of combined feature dimensions are the same. And the recognition accuracy is improved.

【0027】また、辞書から抽出した単語を構成する文
字、部分文字列の特徴量から所定のサイズの文字、部分
文字列の特徴量に変換する変換手段を有する特徴合成部
を備えた構成の単語認識装置。
Also, a word having a feature synthesizing unit having a conversion means for converting a character constituting a word extracted from the dictionary and a feature of a partial character string into a character of a predetermined size and a feature of a partial character string. Recognition device.

【0028】この構成により、個別文字認識用の標準の
文字サイズ、部分文字列サイズの特徴量を基に、異なる
サイズの単語の特徴量を合成できるので、小さい辞書容
量で認識精度を向上できる。
According to this configuration, since the feature amounts of words of different sizes can be synthesized based on the feature amounts of the standard character size and partial character string size for individual character recognition, recognition accuracy can be improved with a small dictionary capacity.

【0029】また、辞書から抽出した単語を構成する文
字、部分文字列の線量による複雑度に応じて文字、部分
文字列の特徴量に重み付けをする複雑度重み付け手段
と、複雑度重み付け手段により算出された重み付けに基
づいて、辞書から抽出した単語を構成する文字、部分文
字列を所定のサイズの文字、部分文字列に変換する変換
手段とを有する特徴合成部を備えた構成の単語認識装
置。
Further, a complexity weighting means for weighting the characteristic amount of a character or a partial character string according to the complexity of a character or a partial character string constituting a word extracted from the dictionary according to a dose, and a complexity weighting means. A word recognition device having a feature synthesizing unit having a character synthesizing unit for converting a character constituting a word extracted from the dictionary and a partial character string into a character of a predetermined size and a partial character string based on the weighted data.

【0030】この構成により、複雑な形状の文字の特徴
次元数を高くし、簡単な形状の文字の特徴次元数を低く
することで、文字の形状に応じた認識となり、小さい辞
書容量で高精度の認識が可能となる。
According to this configuration, by increasing the feature dimension of a character having a complicated shape and decreasing the feature dimension of a character having a simple shape, recognition according to the shape of the character can be achieved. Can be recognized.

【0031】また、入力画像の単語の傾きを検出する傾
斜度検出手段と、単語を構成する画像を辞書より抽出し
て傾斜度検出手段により検出した傾きに沿って単語画像
を配置し画像の合成と特徴量の抽出を行う手段を有する
特徴合成部とを備えた構成の単語認識装置。
An inclination detecting means for detecting the inclination of a word in the input image, and an image composing the word are extracted from a dictionary, and the word images are arranged along the inclination detected by the inclination detecting means to synthesize the images. And a feature synthesizing unit having means for extracting a feature amount.

【0032】この構成により、入力された単語の傾きに
対応した単語の特徴量を生成することができ、傾いた文
字列中の単語の認識精度が高くなる。
With this configuration, it is possible to generate a feature amount of a word corresponding to the inclination of the input word, and the recognition accuracy of the word in the inclined character string is improved.

【0033】また、入力画像の単語を構成する文字、部
分文字列の特徴量に重み付けをする入力画像重み付け手
段と、特徴合成部で生成した文字、部分文字列の特徴量
に重み付けをする特徴合成重み付け手段および入力画像
重み付け手段により抽出された特徴量を特徴合成重み付
け手段により抽出された特徴量と照合する照合手段を有
する特徴照合部をさらに備えた構成の単語認識装置。
Also, an input image weighting means for weighting the features of characters and partial character strings constituting words of the input image, and a feature synthesis for weighting the features of characters and partial character strings generated by the feature synthesis unit. A word recognition device having a configuration further comprising a feature matching unit having matching means for matching the feature amount extracted by the weighting means and the input image weighting means with the feature amount extracted by the feature synthesis weighting means.

【0034】この構成により、単語を構成する特定の文
字、または特定の部分文字列が同一の単語に対して、同
一部の特徴量の重み付けを低くし、他の文字または部分
文字列の特徴量を上げることにより、類似単語の特徴量
の差が明確になり、認識精度が高まる。
According to this configuration, for a word having a specific character or a specific partial character string constituting a word, the weight of the characteristic amount of the same part is reduced, and the characteristic amount of another character or a partial character string is reduced. , The difference between the feature amounts of similar words becomes clear, and the recognition accuracy is increased.

【0035】[0035]

【発明の実施の形態】実施例1の単語認識装置1の構成
図を図1(a)に示す。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1A shows a configuration diagram of a word recognition apparatus 1 according to a first embodiment.

【0036】画像入力部2、個別文字認識部21、単語認
識部22、確信度算出部10、確信度比較部11、認識結果出
力部6、個別文字辞書7より構成される。
The image input unit 2, individual character recognition unit 21, word recognition unit 22, certainty calculation unit 10, certainty comparison unit 11, recognition result output unit 6, and individual character dictionary 7.

【0037】個別文字認識部21は、正規化部3、特徴抽
出部4、特徴照合部5より構成される。
The individual character recognition unit 21 includes a normalization unit 3, a feature extraction unit 4, and a feature collation unit 5.

【0038】また単語認識部22は、正規化部3、特徴抽
出部4、特徴照合部5、特徴合成部8、単語リスト部9
より構成される。
The word recognition unit 22 includes a normalization unit 3, a feature extraction unit 4, a feature comparison unit 5, a feature synthesis unit 8, and a word list unit 9.
It is composed of

【0039】個別文字認識部21、単語認識部22は従来例
と同一である。確信度算出部10は、個別文字認識部21か
らの単語を構成する文字毎の確信度の算出および平均の
算出と、単語認識部22からの単語の確信度を算出する。
確信度比較部11は、個別文字認識部21の確信度と単語認
識部22の確信度の大小を比較する。確信度とは、入力画
像の特徴量との類似度が高いことを意味する。
The individual character recognition section 21 and the word recognition section 22 are the same as in the conventional example. The certainty calculating unit 10 calculates the certainty of each character constituting the word from the individual character recognizing unit 21, calculates the average, and calculates the certainty of the word from the word recognizing unit 22.
The certainty comparison unit 11 compares the certainty of the individual character recognition unit 21 with the certainty of the word recognition unit 22. The certainty means that the similarity with the feature amount of the input image is high.

【0040】個別文字認識処理と単語一括認識処理の併
用の装置であり、画像入力部2で入力された手書き文字
は、各認識部で、文字および単語の認識が行われる。そ
してその認識結果の確信度を求める。
This is an apparatus that uses both individual character recognition processing and collective word recognition processing. Handwritten characters input by the image input unit 2 are recognized by each recognition unit for characters and words. Then, the degree of certainty of the recognition result is obtained.

【0041】確信度の算出方法は、以下のようにする。The method of calculating the certainty factor is as follows.

【0042】まず入力画像の特徴量を示す特徴ベクトル
を抽出する。次に個別文字認識部21は、辞書内の文字の
特徴量を示す特徴ベクトルを求め、入力画像の特徴ベク
トルとの差の距離値を求める。単語を構成するすべての
文字について行う。
First, a feature vector indicating a feature amount of an input image is extracted. Next, the individual character recognition unit 21 obtains a feature vector indicating a feature amount of a character in the dictionary, and obtains a distance value of a difference from the feature vector of the input image. Do this for all the letters that make up the word.

【0043】また、単語認識装置1は、特徴合成部8で
合成された単語の特徴量を示す特徴ベクトルを求め、入
力画像の特徴ベクトルとの差の距離値を求める。
Further, the word recognition device 1 obtains a feature vector indicating the feature amount of the word synthesized by the feature synthesizing unit 8, and obtains a distance value of a difference from the feature vector of the input image.

【0044】次に予め、大量のサンプルを用いて、距離
値の分布を調べ、分布の範囲が0〜1に収めるように正
規化してあるので確信度算出部10は、算出した各認識部
の距離値から分布上の距離値に変換する。その分布をf
(X )で表すとすると距離値がdであったときの確信度
R(d)は、以下の式で表される。距離値dは、0≦d
≦1であり、d=1のときを最大の類似度と見る。
Next, using a large number of samples, the distribution of the distance values is examined in advance, and the distribution is normalized so that the range of the distribution is within the range of 0 to 1. Convert distance values to distance values on the distribution. The distribution is f
If expressed as (X), the certainty factor R (d) when the distance value is d is expressed by the following equation. The distance value d is 0 ≦ d
≦ 1, and the case where d = 1 is regarded as the maximum similarity.

【0045】[0045]

【数式1】 [Formula 1]

【0046】そして例えば2文字構成の単語の場合、個
別文字認識部21からは文字毎の確信度の平均であるR
(d1)+R(d2)/2を求める。次に単語認識部22
からは単語の確信度からはR(d3)を求める。確信度
比較部はその大小を比較する。その結果確信度の大きい
ものを認識結果として認識結果出力部6から出力する。
For example, in the case of a two-character word, the individual character recognition unit 21 outputs R, which is the average of the certainty factors for each character.
(D1) + R (d2) / 2 is obtained. Next, the word recognition unit 22
Then, R (d3) is obtained from the certainty factor of the word. The certainty comparison unit compares the magnitudes. As a result, a recognition result having a high degree of certainty is output from the recognition result output unit 6 as a recognition result.

【0047】実施例2の単語認識装置1の構成図を図2
に示す。
FIG. 2 is a block diagram of the word recognition device 1 of the second embodiment.
Shown in

【0048】画像入力部2、文字間隔検出部12、閾値比
較部13、個別文字認識部21、単語認識部22、認識結果出
力部6、個別文字辞書7より構成される。
It comprises an image input unit 2, a character interval detection unit 12, a threshold value comparison unit 13, an individual character recognition unit 21, a word recognition unit 22, a recognition result output unit 6, and an individual character dictionary 7.

【0049】個別文字認識部21は、正規化部3、特徴抽
出部4、特徴照合部5より構成される。
The individual character recognition unit 21 includes a normalization unit 3, a feature extraction unit 4, and a feature collation unit 5.

【0050】また単語認識部22は、正規化部3、特徴抽
出部4、特徴照合部5、特徴合成部8、単語リスト部9
より構成される。個別文字認識部21、単語認識部22は従
来例と同一である。文字間隔検出部12は、入力された画
像の文字間の間隔を検出する。閾値比較部13は、文字間
隔検出部12で検出された間隔を閾値と比較する。
The word recognition unit 22 includes a normalization unit 3, a feature extraction unit 4, a feature comparison unit 5, a feature synthesis unit 8, and a word list unit 9.
It is composed of The individual character recognition unit 21 and the word recognition unit 22 are the same as in the conventional example. The character interval detection unit 12 detects an interval between characters of an input image. The threshold comparing unit 13 compares the interval detected by the character interval detecting unit 12 with a threshold.

【0051】実施例2の処理は、2つの認識処理を通す
ため処理時間がかかるため速い処理速度が要求される場
合に使用する。まず入力された単語の文字間隔を検出
し、文字間隔が閾値より大きいか小さいかにより、2つ
の認識処理を使い分ける。
The processing according to the second embodiment is used when a high processing speed is required because a long processing time is required to pass two recognition processings. First, the character spacing of the input word is detected, and two recognition processes are selectively used depending on whether the character spacing is larger or smaller than a threshold.

【0052】図2を参照して動作を説明する。The operation will be described with reference to FIG.

【0053】画像入力部2から入力された画像が和歌山
とすると、文字間隔検出部12で文字間隔を検出する。例
えば、連結する黒画素から文字の外接矩形を求め、その
外接矩形間を文字間隔として検出する。その検出結果
が、閾値より小さければ、文字間が近接している可能性
が高いため単語認識部22にて処理を行う。検出結果が、
閾値より大きければ、近接していないと判断し、個別文
字単位での個別文字認識部21にて処理を行う。
Assuming that the image input from the image input unit 2 is Wakayama, the character spacing detecting unit 12 detects the character spacing. For example, a circumscribed rectangle of a character is obtained from the connected black pixels, and a space between the circumscribed rectangles is detected as a character interval. If the detection result is smaller than the threshold value, there is a high possibility that the characters are close to each other, so that the word recognition unit 22 performs the processing. If the detection result is
If it is larger than the threshold value, it is determined that they are not close to each other, and the individual character recognizing unit 21 performs the processing for each individual character.

【0054】実施例3の単語認識装置1の構成図を図3
に示す。
FIG. 3 is a block diagram of the word recognition device 1 according to the third embodiment.
Shown in

【0055】単語認識装置1は、画像入力部2、正規化
部3、特徴抽出部4、認識処理部17からなる。認識処理
部17は、特徴照合部5、特徴合成部8、認識結果出力部
6、単語リスト部9、個別文字辞書7、単語辞書16を備
える。
The word recognition device 1 comprises an image input unit 2, a normalization unit 3, a feature extraction unit 4, and a recognition processing unit 17. The recognition processing unit 17 includes a feature collating unit 5, a feature synthesizing unit 8, a recognition result output unit 6, a word list unit 9, an individual character dictionary 7, and a word dictionary 16.

【0056】画像入力部2は、スキャナなどから手書き
文字の入力画像を取得とともに単語の傾斜度を検出す
る。正規化部3は、文字の大きさ、位置を一定に揃え
る。特徴抽出部4は、入力画像から特徴量を抽出する。
特徴合成部8は、単語を選択し、選択された単語を構成
する個々の文字の特徴量を個別文字辞書7から抽出し、
単語を構成する部分文字列の特徴量を単語辞書16から抽
出し合成する。また文字、部分文字列サイズ変換、複雑
度変換、傾き処理等を行う。特徴照合部5は、特徴合成
部8が合成した単語の特徴量と特徴抽出部4が抽出した
入力画像の特徴量と照合する。単語リスト部9は、複数
の単語リストからなる。認識結果出力部6は、特徴照合
部5で照合した結果の中で最も類似した特徴量を持つ単
語をディスプレイなどに出力する。個別文字辞書7は、
文字とその特徴量とその画像から構成される。単語辞書
16は、複合語の共通の部分文字列とその特徴量からな
る。
The image input unit 2 obtains an input image of a handwritten character from a scanner or the like and detects the inclination of a word. The normalizing unit 3 makes the size and position of the characters uniform. The feature extraction unit 4 extracts a feature amount from the input image.
The feature synthesizing unit 8 selects a word, extracts a feature amount of each character constituting the selected word from the individual character dictionary 7,
The feature amounts of the partial character strings constituting the word are extracted from the word dictionary 16 and synthesized. In addition, character and partial character string size conversion, complexity conversion, inclination processing, and the like are performed. The feature matching unit 5 compares the feature amount of the word combined by the feature combining unit 8 with the feature amount of the input image extracted by the feature extracting unit 4. The word list section 9 includes a plurality of word lists. The recognition result output unit 6 outputs, to a display or the like, a word having the most similar feature amount among the results matched by the feature matching unit 5. The individual character dictionary 7
It is composed of characters, their features, and their images. Word dictionary
16 is composed of a common partial character string of a compound word and its characteristic amount.

【0057】図3〜図6を参照して、単語認識装置1の
動作について説明する。
The operation of the word recognition device 1 will be described with reference to FIGS.

【0058】まず入力画像として「東京」が入力された
場合について、図4(b)の住所例により説明する。
First, the case where "Tokyo" is input as an input image will be described with reference to an example of an address shown in FIG.

【0059】都道府県などのキーとなる文字は、規定の
座標に印刷されているものとする。画像入力部2は入力
された画像について、まず都道府県のキーとなる文字が
印刷されている位置を検出し、その前の文字列を切り出
す。次に連結した黒画素を抽出して、それに外接する矩
形を得る。得られたすべての外接矩形の中心に対しての
直線を設定する。そしてその傾きを単語の傾きとし、所
定の閾値と比較する。
It is assumed that key characters such as prefectures are printed at specified coordinates. The image input unit 2 first detects a position where a character serving as a key of a prefecture is printed from the input image, and cuts out a character string in front of the position. Next, the connected black pixel is extracted to obtain a rectangle circumscribing it. Set a straight line to the center of all the obtained circumscribed rectangles. Then, the inclination is set as the inclination of the word, and is compared with a predetermined threshold.

【0060】傾斜度<閾値の場合と傾斜度≧閾値の場合
に分けて説明を行う。 (1)傾斜度<閾値の場合 入力された「東京」の文字列に対して、正規化部3で、
例えば64×64画素への正規化が完了すると、特徴抽
出部4で「東京」の入力画像の特徴量が抽出される。都
道府県の単語リストには、北海、東京、沖縄等都道府県
の単語が登録されており、個別文字辞書7には、すべて
の文字の特徴量が登録されている。
The description will be made separately for the case where the inclination is smaller than the threshold and for the case where the inclination is greater than or equal to the threshold. (1) In the case of inclination <threshold The normalization unit 3 converts the input character string “Tokyo” into
For example, when the normalization to 64 × 64 pixels is completed, the feature amount of the input image “Tokyo” is extracted by the feature extraction unit 4. In the word list of prefectures, words of prefectures such as Hokkai, Tokyo, and Okinawa are registered, and in the individual character dictionary 7, feature amounts of all characters are registered.

【0061】次に認識処理部17の処理の流れを図4
(a)に示す。
Next, the processing flow of the recognition processing section 17 is shown in FIG.
(A).

【0062】個別文字についての説明であるが、部分文
字列も同様である。
Although the description is for individual characters, the same applies to partial character strings.

【0063】まず、特徴合成部8は単語リストに従っ
て、まず「北海」の単語を検索する。(S11ステップ)
次に個別文字辞書7より「北」の特徴量および「海」の
特徴量を抽出して特徴量の合成を行うがその方式として
3種類の方式が有る。特徴合成後の特徴ベクトルの次元
数と入力画像の正規化の次元数とが等しくなるように特
徴合成の処理がされる。
First, the feature synthesizing unit 8 first searches for the word "Hokukai" according to the word list. (Step S11)
Next, the "north" feature amount and the "sea" feature amount are extracted from the individual character dictionary 7 and the feature amounts are synthesized, and there are three types of methods. Feature synthesis processing is performed such that the dimension number of the feature vector after the feature synthesis is equal to the dimension number of the normalization of the input image.

【0064】特徴量としてメッシュ特徴量を用いた場合
を示す。メッシュ特徴量とは、画像をm×nにメッシュ
で分割したときに各小矩形内の黒画素数を小矩形サイズ
で割ったものがその小矩形内の特徴量となる。例えば正
規化サイズが64×64画素だとすると8×8メッシュ
に分割した小矩形のサイズは8×8となる。ある小矩形
内に32個の黒画素があるとするとそのメッシュ特徴量
は32/64=0.5となる。入力画像は、64×64
画素で8×8メッシュで正規化され特徴量を抽出してい
るので、特徴合成結果も、64×64画素で8×8メッ
シュになるように合成される。
A case where a mesh feature is used as a feature will be described. The mesh feature amount is a feature amount in the small rectangle obtained by dividing the number of black pixels in each small rectangle by the small rectangle size when the image is divided into mxn meshes. For example, if the normalized size is 64 × 64 pixels, the size of the small rectangle divided into 8 × 8 mesh is 8 × 8. Assuming that there are 32 black pixels in a certain small rectangle, the mesh feature amount is 32/64 = 0.5. The input image is 64 × 64
Since the feature amount is extracted by normalizing the pixels with 8 × 8 mesh, the feature synthesis result is also synthesized so that the 64 × 64 pixel becomes 8 × 8 mesh.

【0065】第1の方式は縮小文字サイズを有する個別
文字辞書7による特徴合成である。(図4のS121 ステ
ップ)。説明図を図5(a)に示す。
The first method is feature synthesis using an individual character dictionary 7 having a reduced character size. (Step S121 in FIG. 4). An explanatory diagram is shown in FIG.

【0066】OCR専用機など高速で辞書用のメモリ容
量が大きく取れるものに、使用される。
This is used for an OCR-dedicated machine or the like that can provide a large memory capacity for a dictionary at high speed.

【0067】1つの文字、部分文字列について、複数の
文字サイズから抽出した特徴量をそれぞれ個別文字辞書
7として持つ。1/2サイズの縮小文字を有する個別文
字辞書7を用いた例を示す。1/2サイズの縮小文字
は、8×4メッシュとなる。
As for one character and a partial character string, feature amounts extracted from a plurality of character sizes are provided as individual character dictionaries 7 respectively. An example using an individual character dictionary 7 having reduced characters of 1/2 size is shown. A half size reduced character has an 8 × 4 mesh.

【0068】都道府県の単語リストに基づいて「北海」
の1/2サイズの「北」、1/2サイズの「海」の特徴
量を個別文字辞書7から抽出し、合成して8×8メッシ
ュサイズの「北海」の単語の特徴量とする。(S13ステ
ップ) この単語特徴量と、入力画像の特徴量と照合してその差
を記憶する。(図4のS14ステップ) 第2の方式は、文字サイズ変換方式の特徴合成である。
(図4のS122 ステップ)携帯情報端末など辞書用のメ
モリ容量を大きくとれないものに使用される。
"Hokumi" based on the word list of prefectures
Are extracted from the individual character dictionary 7 and are combined to obtain the feature quantity of the word “Hokukai” having an 8 × 8 mesh size. (Step S13) The word feature amount is compared with the feature amount of the input image, and the difference is stored. (Step S14 in FIG. 4) The second method is feature synthesis of the character size conversion method.
(Step S122 in FIG. 4) This is used for a portable information terminal or the like which cannot have a large memory capacity for a dictionary.

【0069】本方式は、標準の文字サイズの特徴量に変
換係数を施して種々の文字サイズの特徴量を生成し、単
語特徴量を合成する方式である。特徴量合成の説明図を
図5(b)に示す。
This method is a method of generating feature quantities of various character sizes by applying conversion coefficients to feature quantities of a standard character size, and synthesizing word feature quantities. FIG. 5B shows an explanatory diagram of the feature amount synthesis.

【0070】標準の文字サイズの特徴量に変換係数を施
して縮小した文字サイズの特徴量を合成する。
A feature amount of a reduced character size is synthesized by applying a conversion coefficient to a feature amount of a standard character size.

【0071】例えば64×64画素の標準の文字サイズ
の特徴量は、縦8×横8メッシュなので、「 北」の標準
の文字サイズに縦8×横4の変換係数をかけることによ
り1/2サイズの「 北」の文字の特徴量が得られる。
又、「 海」の標準の文字サイズに縦8×横4の変換係数
をかけることで、1/2サイズの「 海」の文字の特徴量
が得られる。両者を合成したものを「北海」の単語特徴
量とする。(図4のS13ステップ)この単語特徴量と入
力画像の特徴量と照合してその差を記憶する。(図4の
S14ステップ) 第3の方式は複雑度変換方式の特徴合成である。(図4
のS123 ステップ) 携帯情報端末など辞書用のメモリ容量を大きくとれない
もので、認識精度を高くしたい装置に使用される。
For example, since the feature quantity of the standard character size of 64 × 64 pixels is 8 × 8 mesh, the standard character size of “north” is multiplied by 8 × 4 conversion coefficient to 1 /. The feature value of the character of the size "north" is obtained.
In addition, by multiplying the standard character size of “sea” by a conversion coefficient of 8 × 4, a feature amount of a character of “sea” of サ イ ズ size can be obtained. The combination of the two is used as the word feature of “Hokukai”. (Step S13 in FIG. 4) This word feature is compared with the feature of the input image and the difference is stored. (Step S14 in FIG. 4) The third method is feature synthesis of the complexity conversion method. (FIG. 4
Step S123) The memory capacity for the dictionary, such as a portable information terminal, cannot be large, and is used for a device that requires high recognition accuracy.

【0072】精度の高い処理を行うには、まず単語の構
成する文字の複雑度を調べる。複雑度としては、例えば
縦方向の線密度を用いた線密度算出の説明図を図5
(c)に示す。各文字の線密度の総和の比に応じて、特
徴量に重みづけをして単語特徴量を合成する方法であ
る。
In order to perform processing with high accuracy, first, the complexity of characters constituting a word is checked. As the complexity, for example, an explanatory diagram of the linear density calculation using the vertical line density is shown in FIG.
It is shown in (c). This is a method of combining the word feature amounts by weighting the feature amounts according to the ratio of the sum of the linear densities of the characters.

【0073】例えば「北海」という単語に対して「北」
の線密度が30、「海」の線密度が50だとすると、このと
きの文字サイズを64×64画素とすると8×8のメッ
シュに分割されているので、「北」の特徴量は横のメッ
シュ数を8×30/(30+50)=3とし、「海」の特徴量は、
横のメッシュ数を8×50/(30+50)=5とする。そして、
「 北」の標準の文字サイズに縦8×横3の変換係数をか
けることにより「 北」の文字の特徴量が得られる。又「
海」の標準の文字サイズに縦8×横5の変換係数をかけ
ることで、「 海」の文字の特徴量が得られる。両者を合
成したものを「北海」の単語特徴量とする。(図4のS
13ステップ) この単語特徴量と入力画像の特徴量と照合してその差を
記憶する。(図4のS14ステップ) これらの処理をすべての単語について実施し、最終的に
入力画像の特徴量と特徴合成部8からの特徴量との差が
最小値の特徴量のものを認識結果として出力する。(図
4のS15ステップ) また、図示はしていないが、単語の中には、太秦馬塚、
太秦垣内のように、同一部分文字列を含む複合語が多数
存在する。そこで特徴量合成時に毎回「太」と「秦」か
ら「太秦」を合成するのではなく、予め「太秦」ついて
は、例えば単語辞書16より1/2文字サイズの特徴量
を抽出する。そして、個別文字辞書7から1/4サイズ
の「馬」+1/4サイズの「塚」の文字の特徴量を抽出
し、「太秦」+「馬」+「塚」の特徴量から単語特徴量
を合成する方式である。 (2)傾斜度≧閾値の場合。
For example, for the word "north sea", "north"
If the line density of the sea is 30 and the line density of the “sea” is 50, the character size at this time is 64 × 64 pixels, so that it is divided into 8 × 8 meshes. The number is 8 × 30 / (30 + 50) = 3, and the feature of “sea” is
The number of horizontal meshes is set to 8 × 50 / (30 + 50) = 5. And
By multiplying the standard character size of “north” by a conversion coefficient of 8 × 3, the feature amount of the character of “north” can be obtained. or"
By multiplying the standard character size of “U” by a conversion coefficient of 8 × 5, the feature amount of the character of “U” can be obtained. The combination of the two is used as the word feature of “Hokukai”. (S in FIG. 4
13 Step) This word feature is compared with the feature of the input image, and the difference is stored. (Step S14 in FIG. 4) These processes are performed for all the words, and finally the feature amount having the minimum difference between the feature amount of the input image and the feature amount from the feature synthesizing unit 8 is regarded as the recognition result. Output. (Step S15 in FIG. 4) Although not shown, the words include Uzumasazuka,
There are many compound words that contain the same substring, as in Uzumasaki. Therefore, instead of synthesizing “Uzumasa” from “Fat” and “Hata” every time when synthesizing feature quantities, for “Uzumasa”, for example, a feature quantity of 文字 character size is extracted from the word dictionary 16 in advance. Then, the characteristic amount of the character of “horse” of 1/4 size and “mound” of 1/4 size is extracted from the individual character dictionary 7, and the word characteristic amount is calculated from the characteristic amount of “Uzumasa” + “horse” + “mound”. Is a method of synthesizing. (2) In the case where the inclination degree ≧ the threshold value.

【0074】図6に傾斜度≧閾値の場合の認識処理部1
7の説明図を示す。
FIG. 6 shows a recognition processing unit 1 in the case where the inclination degree ≧ the threshold value.
7 is an explanatory diagram.

【0075】図6(a)は、処理の流れ、図6(b)に
住所例を示す。
FIG. 6A shows a processing flow, and FIG. 6B shows an example of an address.

【0076】住所例で「東京」という入力画像の文字列
を抽出後、正規化部3で、傾斜のある単語として正規化
を行ったあと特徴抽出部4で特徴抽出を行う。次に、都
道府県の単語リストから単語「北海」を取得し、単語を
構成する文字をキーにして、個別文字辞書7から「北」
と「海」の画像を取得する。(S51ステップ)取得され
た画像を傾斜度θに沿って配置する。(S52ステップ) 次に、その画像を入力画像の正規化サイズと同一のサイ
ズに正規化する。(S53ステップ)正規化された単語画
像をもとに特徴抽出を行う。(S54ステップ)この抽出
された特徴量と入力画像から抽出された特徴量とを比較
し差分を記憶する。(S55ステップ) 以上の処理を単語リストの全単語について実施する。全
単語の中で、差分の最小値のものを認識出力部から出力
する。(S56ステップ) また図示はしていないが、特徴照合部5において、例え
ば入力された単語が住所であり、「太秦○○」のどれか
であると予めわかっているような場合は、「太秦」部分
は、照合のための有効な特徴とならない。そこで、この
部分の特徴量の重みを低くするかマスクしておき、それ
以外の成分の重みを高くするか、そのままにして照合を
行うことで、類似単語の特徴量の差を明確化する。これ
により認識精度が高まる。
After extracting the character string of the input image "Tokyo" in the address example, the normalization unit 3 normalizes the input image as a sloping word, and then the feature extraction unit 4 performs feature extraction. Next, the word "north sea" is acquired from the word list of prefectures, and the characters constituting the word are used as keys, and the "north"
And get the image of "sea". (Step S51) The acquired images are arranged along the inclination θ. (Step S52) Next, the image is normalized to the same size as the normalized size of the input image. (Step S53) Feature extraction is performed based on the normalized word image. (Step S54) The extracted feature amount is compared with the feature amount extracted from the input image, and the difference is stored. (Step S55) The above processing is performed for all words in the word list. Of all the words, the one with the minimum difference is output from the recognition output unit. (Step S56) Although not shown, in the feature matching unit 5, for example, if the input word is an address and it is known in advance that it is any of "Uzumasa OO", "Uzumasa" Part "is not a valid feature for matching. Therefore, the difference between the feature amounts of similar words is clarified by making the weight of the feature amount of this part low or masking it, and making the weight of the other components high or performing collation while keeping it as it is. Thereby, recognition accuracy is improved.

【0077】例えば入力画像が「太秦馬塚」だとする
と、この文字列を切りだし、共通文字の部分「太秦」を
マスクして残りの文字「馬塚」の部分のみで特徴抽出を
行う。そして、次に単語リストから「太秦○○」を抽出
する。例えば抽出した単語が「太秦垣内」であれば、
「太秦」をマスクする。そして残りの「垣内」の部分の
特徴量の合成をする。そして入力画像の特徴量と特徴合
成した特徴量との照合を行う。この照合を単語リストの
中の太秦を含む複合語のすべてについて行い、特徴量の
差が最も小さいものを入力単語として特定する。
For example, if the input image is “Uzumasa Mazuka”, this character string is cut out, and the common character portion “Uzumasa” is masked, and the feature is extracted only from the remaining characters “Matsuka”. Then, "Uzumasa" is extracted from the word list. For example, if the extracted word is "Uzumasagakiuchi",
Mask "Uzumasa". Then, the feature amounts of the remaining “Kakiuchi” portion are combined. Then, the feature amount of the input image is compared with the feature amount obtained by the feature synthesis. This collation is performed for all the compound words including Uzumasa in the word list, and the one having the smallest difference in the feature amount is specified as the input word.

【0078】[0078]

【発明の効果】本発明によれば、単語が傾斜していても
単語認識が可能であり、また単語を構成する文字が異な
る文字サイズにおいても認識が可能である。
According to the present invention, word recognition is possible even if the word is inclined, and recognition is possible even if the characters constituting the word are of different character sizes.

【0079】また、文字数に応じた文字サイズの選択に
よる特徴量の合成により、単語認識精度を向上できる。
さらに傾いた単語に対しても画像合成による特徴量抽出
により単語の認識精度を高める。さらに複合語の場合の
共通の部分文字列または文字の特徴を予め保持すること
により、特徴合成のときの処理を高速化することができ
る。
Further, by synthesizing feature amounts by selecting a character size according to the number of characters, word recognition accuracy can be improved.
Furthermore, even for a tilted word, the word recognition accuracy is improved by extracting a feature amount by image synthesis. Further, by preliminarily holding the common partial character string or character feature in the case of a compound word, the processing at the time of feature synthesis can be speeded up.

【0080】また同一の文字または同一の部分文字列か
らなる単語間での特徴量に重み付けをすることで、誤読
を減少することができる。
Further, by weighing the feature amount between words consisting of the same character or the same partial character string, misreading can be reduced.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 実施例1の単語認識装置の構成図FIG. 1 is a configuration diagram of a word recognition device according to a first embodiment.

【図2】 実施例2の単語認識装置の構成図FIG. 2 is a configuration diagram of a word recognition device according to a second embodiment.

【図3】 実施例3の単語認識装置の構成図FIG. 3 is a configuration diagram of a word recognition device according to a third embodiment.

【図4】 実施例3の傾斜度<閾値の時の認識処理部
の説明図
FIG. 4 is an explanatory diagram of a recognition processing unit according to a third embodiment when the inclination degree is smaller than a threshold value.

【図5】 実施例3の特徴量合成の説明図FIG. 5 is an explanatory diagram of feature amount synthesis according to a third embodiment.

【図6】 実施例3の傾斜度≧閾値の時の認識処理部
の説明図
FIG. 6 is an explanatory diagram of a recognition processing unit according to a third embodiment when the inclination degree ≧ the threshold value;

【図7】 従来例の個別文字認識装置の構成図FIG. 7 is a configuration diagram of a conventional individual character recognition device.

【図8】 従来例の単語認識装置の構成図FIG. 8 is a configuration diagram of a conventional word recognition apparatus.

【符号の説明】[Explanation of symbols]

1 単語認識装置 2 画像入力部 3 正規化部 4 特徴抽出部 5 特徴照合部 6 認識結果出力部 7 個別文字辞書 8 特徴合成部 9 単語リスト部 10 確信度算出部 11 確信度比較部 21 個別文字認識部 22 単語認識部 DESCRIPTION OF SYMBOLS 1 Word recognition device 2 Image input part 3 Normalization part 4 Feature extraction part 5 Feature collation part 6 Recognition result output part 7 Individual character dictionary 8 Feature synthesis part 9 Word list part 10 Confidence calculation part 11 Confidence comparison part 21 Individual character Recognition unit 22 Word recognition unit

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 入力画像の単語を構成する個々の文字を
認識する個別文字認識部と、 入力画像の単語を一括して認識する単語認識部と、 個別文字認識部の認識結果からの単語の確信度の算出と
単語認識部の認識結果からの単語の確信度の算出とを行
う確信度算出部と、 確信度算出部で算出された個別文字認識部と単語認識部
の確信度算出結果を比較する確信度比較部とを備え、 確信度比較部は、確信度の比較結果に基づき、個別文字
認識部と単語認識部の確信度の大きい方を選択すること
を特徴とする単語認識装置。
An individual character recognition unit for recognizing individual characters constituting words of an input image, a word recognition unit for collectively recognizing words of an input image, A confidence calculation unit that calculates the confidence and calculates the confidence of the word from the recognition result of the word recognition unit; and calculates the individual character recognition unit and the confidence calculation result of the word recognition unit calculated by the confidence calculation unit. A word recognition device, comprising: a certainty comparison unit for comparing, wherein the certainty comparison unit selects the larger one of the individual character recognition unit and the word recognition unit based on the result of the comparison of the certainty factors.
【請求項2】入力画像の個々の文字を認識する個別文字
認識部と、 入力画像の単語を一括して認識する単語認識部と、 入力画像の単語を構成する個々の文字の間隔を検出する
文字間隔検出手段と、 文字間隔検出手段により検出された間隔を所定の閾値と
比較する文字間隔比較手段とを備え、 文字間隔比較手段は、検出された文字間隔が所定の閾値
より小さければ単語認識部を選択し、検出された文字間
隔が所定の閾値より大きければ個別文字認識部を選択す
ることを特徴とする単語認識装置。
2. An individual character recognizing unit for recognizing individual characters of an input image, a word recognizing unit for recognizing words of the input image collectively, and detecting an interval between individual characters constituting words of the input image. A character spacing detecting means; and a character spacing comparing means for comparing the spacing detected by the character spacing detecting means with a predetermined threshold, wherein the character spacing comparing means recognizes the word if the detected character spacing is smaller than the predetermined threshold. A word recognition apparatus, wherein a unit is selected, and an individual character recognition unit is selected if the detected character interval is larger than a predetermined threshold.
【請求項3】入力画像から単語の特徴量を抽出した結果
と辞書の個々の文字の特徴量から単語の特徴量を合成し
た結果とを照合することで単語の認識を行う単語認識装
置であって、 複数の各種サイズの文字、部分文字列の特徴量と複数の
各種文字サイズの画像を保持する辞書と、 前記辞書に基づいて文字、部分文字列の特徴量から単語
の特徴量を合成する手段および前記辞書に基づいて文字
の画像から単語の画像を合成し特徴量の抽出を行う手段
を有する特徴合成部とを備えたことを特徴とする単語認
識装置。
3. A word recognition apparatus for recognizing a word by comparing a result of extracting a feature of a word from an input image with a result of synthesizing a feature of a word from a feature of an individual character in a dictionary. A dictionary that holds the feature values of a plurality of characters and partial character strings of various sizes and images of the plurality of character sizes, and synthesizes the feature values of words from the feature values of the characters and partial character strings based on the dictionary. A word synthesizing unit having means for synthesizing a word image from a character image based on the dictionary and extracting a feature amount.
【請求項4】所定の単語サイズの特徴量を合成する文
字、部分文字列の特徴量を文字数に応じたサイズで請求
項3記載の辞書より選択する選択手段を有する特徴合成
部を備えたことを特徴とする請求項3記載の単語認識装
置。
4. A feature synthesizing unit having a selecting means for selecting from a dictionary according to claim 3, a character for synthesizing a feature of a predetermined word size and a feature of a partial character string in a size corresponding to the number of characters. The word recognition device according to claim 3, wherein:
【請求項5】請求項3記載の辞書から抽出した単語を構
成する文字、部分文字列の特徴量から所定のサイズの文
字、部分文字列の特徴量に変換する変換手段を有する特
徴合成部を備えたことを特徴とする請求項3記載の単語
認識装置。
5. A feature synthesizing unit having a conversion unit for converting a character constituting a word extracted from the dictionary according to claim 3 and a characteristic amount of a partial character string into a character of a predetermined size and a characteristic amount of a partial character string. The word recognition device according to claim 3, further comprising:
【請求項6】請求項3記載の辞書から抽出した単語を構
成する文字、部分文字列の線量による複雑度に応じて文
字、部分文字列の特徴量に重み付けをする複雑度重み付
け手段と、 複雑度重み付け手段により算出された重み付けに基づい
て、請求項3記載の辞書から抽出した単語を構成する文
字、部分文字列を所定のサイズの文字、部分文字列に変
換する変換手段とを有する特徴合成部を備えたことを特
徴とする請求項3記載の単語認識装置。
6. A complexity weighting means for weighting a characteristic amount of a character or a partial character string according to the complexity of a character or a partial character string constituting a word extracted from the dictionary according to claim 3. And a conversion unit configured to convert characters and partial character strings constituting words extracted from the dictionary according to claim 3 into characters and partial character strings of a predetermined size based on the weights calculated by the degree weighting unit. The word recognition device according to claim 3, further comprising a unit.
【請求項7】入力画像の単語の傾きを検出する傾斜度検
出手段と、 単語を構成する画像を請求項3記載の辞書より抽出して
傾斜度検出手段により検出した傾きに沿って単語画像を
配置し画像の合成と特徴量の抽出を行う手段を有する特
徴合成部とを備えたことを特徴とする請求項3記載の単
語認識装置。
7. An inclination detecting means for detecting an inclination of a word in an input image, and an image forming a word is extracted from the dictionary according to claim 3, and a word image is extracted along the inclination detected by the inclination detecting means. 4. The word recognition device according to claim 3, further comprising a feature synthesizing unit having means for arranging and synthesizing images and extracting feature amounts.
【請求項8】入力画像の単語を構成する文字、部分文字
列の特徴量に重み付けをする入力画像重み付け手段と、 請求項3記載の特徴合成部で生成した文字、部分文字列
の特徴量に重み付けをする特徴合成重み付け手段および
入力画像重み付け手段により抽出された特徴量を特徴合
成重み付け手段により抽出された特徴量と照合する照合
手段を有する特徴照合部をさらに備えたことを特徴とす
る請求項3記載の単語認識装置。
8. An input image weighting means for weighting a feature amount of a character or a partial character string constituting a word of an input image, and a feature amount of a character or a partial character string generated by the feature synthesizing unit according to claim 3. The image processing apparatus according to claim 1, further comprising a feature matching unit having matching means for matching the feature amount extracted by the feature combining weighting means and the feature amount extracted by the feature combining weighting means. 3. The word recognition device according to 3.
JP11373399A 1999-04-21 1999-04-21 Word recognition device Expired - Fee Related JP4237864B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11373399A JP4237864B2 (en) 1999-04-21 1999-04-21 Word recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11373399A JP4237864B2 (en) 1999-04-21 1999-04-21 Word recognition device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006119744A Division JP4201013B2 (en) 2006-04-24 2006-04-24 Word recognition device

Publications (2)

Publication Number Publication Date
JP2000306045A true JP2000306045A (en) 2000-11-02
JP4237864B2 JP4237864B2 (en) 2009-03-11

Family

ID=14619769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11373399A Expired - Fee Related JP4237864B2 (en) 1999-04-21 1999-04-21 Word recognition device

Country Status (1)

Country Link
JP (1) JP4237864B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005352653A (en) * 2004-06-09 2005-12-22 Omron Corp Character recognition device
US7024042B2 (en) 2000-10-04 2006-04-04 Fujitsu Limited Word recognition device, word recognition method, and storage medium
JP2007042097A (en) * 2005-07-29 2007-02-15 Fujitsu Ltd Key character extraction program, key character extraction device, key character extraction method, collective place name recognition program, collective place name recognition device and collective place name recognition method
CN100456317C (en) * 2005-12-16 2009-01-28 富士通株式会社 Program, method and device for determining line direction
KR101090658B1 (en) 2008-09-12 2011-12-07 가시오게산키 가부시키가이샤 Electronic equipment equipped with dictionary function
US8515175B2 (en) 2008-03-04 2013-08-20 Fujitsu Limited Storage medium, apparatus and method for recognizing characters in a document image using document recognition
WO2017104805A1 (en) * 2015-12-18 2017-06-22 国立大学法人東京農工大学 Program, information storage medium, and character string recognition device

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7024042B2 (en) 2000-10-04 2006-04-04 Fujitsu Limited Word recognition device, word recognition method, and storage medium
JP2005352653A (en) * 2004-06-09 2005-12-22 Omron Corp Character recognition device
JP2007042097A (en) * 2005-07-29 2007-02-15 Fujitsu Ltd Key character extraction program, key character extraction device, key character extraction method, collective place name recognition program, collective place name recognition device and collective place name recognition method
CN100456317C (en) * 2005-12-16 2009-01-28 富士通株式会社 Program, method and device for determining line direction
US8515175B2 (en) 2008-03-04 2013-08-20 Fujitsu Limited Storage medium, apparatus and method for recognizing characters in a document image using document recognition
KR101090658B1 (en) 2008-09-12 2011-12-07 가시오게산키 가부시키가이샤 Electronic equipment equipped with dictionary function
WO2017104805A1 (en) * 2015-12-18 2017-06-22 国立大学法人東京農工大学 Program, information storage medium, and character string recognition device
JPWO2017104805A1 (en) * 2015-12-18 2018-10-04 国立大学法人東京農工大学 Program, information storage medium, and character string recognition device

Also Published As

Publication number Publication date
JP4237864B2 (en) 2009-03-11

Similar Documents

Publication Publication Date Title
US8160402B2 (en) Document image processing apparatus
US8208765B2 (en) Search and retrieval of documents indexed by optical character recognition
US6151423A (en) Character recognition with document orientation determination
JP4504702B2 (en) Document processing apparatus, document processing method, and document processing program
JP4364914B2 (en) Image document processing apparatus, image document processing method, program, and recording medium
US20090028435A1 (en) Character image extracting apparatus and character image extracting method
JP4796169B2 (en) How to determine the orientation of a digital image
Puigcerver et al. ICDAR2015 competition on keyword spotting for handwritten documents
JP2009282986A (en) Method of detecting numeral within digital image
KR20110028034A (en) Method and apparatus for searching a label
US11170265B2 (en) Image processing method and an image processing system
JP2010217996A (en) Character recognition device, character recognition program, and character recognition method
JP2000306045A (en) Word recognizing device
CN108090728B (en) Express information input method and system based on intelligent terminal
US6694059B1 (en) Robustness enhancement and evaluation of image information extraction
Rahul et al. Multilingual text detection and identification from Indian signage boards
CN111213157A (en) Express information input method and system based on intelligent terminal
US6859556B2 (en) Word recognizing apparatus for dynamically generating feature amount of word and method thereof
Lu et al. Word searching in document images using word portion matching
JP4201013B2 (en) Word recognition device
JPH07319880A (en) Keyword extraction/retrieval device
Slavin et al. Matching Digital Copies of Documents Based on OCR
JP2576350B2 (en) String extraction device
JP2001092921A (en) Character line area extracting method and learning method to be used for detecting character line area
JP2728117B2 (en) Character recognition device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060424

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060818

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060904

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060922

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081219

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121226

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121226

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131226

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees