JPH07239913A - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JPH07239913A
JPH07239913A JP6029792A JP2979294A JPH07239913A JP H07239913 A JPH07239913 A JP H07239913A JP 6029792 A JP6029792 A JP 6029792A JP 2979294 A JP2979294 A JP 2979294A JP H07239913 A JPH07239913 A JP H07239913A
Authority
JP
Japan
Prior art keywords
recognition
character
candidate
character pattern
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6029792A
Other languages
Japanese (ja)
Inventor
Kazuji Kiyono
和司 清野
Kenichi Michiniwa
賢一 道庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6029792A priority Critical patent/JPH07239913A/en
Publication of JPH07239913A publication Critical patent/JPH07239913A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To provide a character recognition device with excellent real time performance in which a mis-reading rate is reduced through learning. CONSTITUTION:The character recognition device 1 has a recognition section (1st recognition means) 4, a discrimination section 6, a re-recognition section (2nd recognition means) 7, and a correction means 8. When the recognition section 5 decides a character pattern candidate with a highest similarity (evaluation value) in the reading stage, the judging section 6 judges the candidate. When the judging section 6 judges the candidate as a candidate liable to incur mis-reading, the re-recognition section 7 applies recognition processing to an input character pattern corresponding to the candidate. A correction means 8 corrects a judging criterion and a processing criterion so that the judging section 6 and the re-recognition section 7 make surer judgement and recognition based on the judging result by the judging section 6 and the recognition result by the re-recognition section 7 in the learning stage.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字認識装置に関し、
より詳しくはニューラルネットを用いた文字認識装置に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device,
More specifically, it relates to a character recognition device using a neural network.

【0002】[0002]

【従来の技術】近年、ニューラルネットを用いて文字認
識を行うことが試みられている。
2. Description of the Related Art Recently, it has been attempted to perform character recognition using a neural network.

【0003】このニューラルネットを用いた文字認識装
置は、ある入力文字パターンの認識結果に誤りが生じた
場合に、その入力文字パターンに対する次回からの文字
認識において正解の文字パターン候補が得られるような
方向性を持ってニューラルネットワークにおけるアーク
荷重値を修正することで、入力文字パターンの特徴の変
化に応じた良好な文字認識を安定して行うことが可能と
されている。
In the character recognition apparatus using this neural network, when an error occurs in the recognition result of a certain input character pattern, a correct character pattern candidate can be obtained in the next character recognition for the input character pattern. By correcting the arc weight value in the neural network with directionality, it is possible to stably perform good character recognition according to changes in the characteristics of the input character pattern.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、ニュー
ラルネットを用いた従来の文字認識装置は、全ての文字
に対してニューラルネットによる文字認識を行っていた
ため、リアルタイム性に欠けるという問題があった。
However, the conventional character recognition device using a neural network has a problem that it lacks real-time property because it performs character recognition on all characters by the neural network.

【0005】そこで、本発明は、上記事情に鑑みてなさ
れたものであり、学習により誤読率の低減を図ることが
でき、しかもリアルタイム性に優れる文字認識装置を提
供することを目的とするものである。
Therefore, the present invention has been made in view of the above circumstances, and an object of the present invention is to provide a character recognition device which can reduce the misreading rate by learning and which is excellent in real time. is there.

【0006】[0006]

【課題を解決するための手段】上記目的を達成するため
に請求項1記載の文字認識装置は、入力文字パターンと
認識辞書とを照合して評価値を求め、入力文字パターン
の認識結果として最も評価値の高い文字パターン候補を
決定する第1の認識手段と、この第1の認識手段により
決定された文字パターン候補が誤読を招き易い候補か否
かを変更可能な判定基準に従って判定する判定手段と、
この判定手段により誤読を招き易い候補と判定された場
合に、その候補に対応する入力文字パターンについて変
更可能な処理基準に従って特徴抽出を行い、その文字を
認識する第2の認識手段と、前記判定手段の判定結果及
び第2の認識手段の認識結果に基づいて前記判定手段及
び第2の認識手段がそれぞれより確実な判定及び認識を
行えるように前記判定基準及び処理基準を修正し得る修
正手段とを有することを特徴とするものである。
In order to achieve the above object, a character recognition apparatus according to claim 1 collates an input character pattern with a recognition dictionary to obtain an evaluation value, and the character recognition result is the most effective as a recognition result of the input character pattern. A first recognizing unit that determines a character pattern candidate having a high evaluation value, and a determining unit that determines whether or not the character pattern candidate determined by the first recognizing unit is a candidate that is likely to cause misreading according to a changeable determination standard. When,
When the determination unit determines that the candidate is likely to cause misreading, the second character recognition unit that recognizes the character by performing feature extraction according to a process standard that can be changed for the input character pattern corresponding to the candidate, and the determination unit. Correction means capable of correcting the judgment standard and the processing standard so that the judgment means and the second recognition means can make more reliable judgment and recognition based on the judgment result of the means and the recognition result of the second recognition means, respectively. It is characterized by having.

【0007】また、請求項2記載の文字認識装置は、入
力文字パターンと認識辞書とを照合して評価値を求め、
入力文字パターンの認識結果として比較的評価値の高い
複数の文字パターン候補を決定する第1の認識手段と、
この第1の認識手段により決定された最も評価値の高い
文字パターン候補が誤読を招き易い候補か否かを第1の
認識手段が求めた各評価値に基づき変更可能な判定基準
に従って判定する第1の判定手段と、この第1の判定手
段により誤読を招き易い候補と判定された場合に、その
候補に対応する入力文字パターンについて変更可能な処
理基準に従って特徴抽出を行い、その文字を認識する第
2の認識手段と、この第2の認識手段により認識された
文字が前記第1の認識手段により決定された複数の文字
パターン候補のうち上位所定数の文字パターン候補に有
るか無いかの判定を行い、無い場合はその文字をリジェ
クトする第2の判定手段と、前記判定手段の判定結果及
び第2の認識手段の認識結果に基づいて前記判定手段及
び第2の認識手段がそれぞれより確実な判定及び認識を
行えるように前記判定基準及び処理基準を修正し得る修
正手段とを有することを特徴とするものである。
Further, the character recognition device according to the second aspect collates an input character pattern with a recognition dictionary to obtain an evaluation value,
First recognition means for deciding a plurality of character pattern candidates having a relatively high evaluation value as a recognition result of the input character pattern;
It is determined whether or not the character pattern candidate having the highest evaluation value determined by the first recognizing means is a candidate that is likely to cause misreading according to a changeable determination criterion based on each evaluation value obtained by the first recognizing means. If the first determination unit and the first determination unit determine that the candidate is likely to cause misreading, feature extraction is performed on the input character pattern corresponding to the candidate according to a changeable processing standard, and the character is recognized. Second recognition means and determination as to whether or not the character recognized by the second recognition means is present in a predetermined upper number of character pattern candidates among the plurality of character pattern candidates determined by the first recognition means. And a second judging means for rejecting the character when there is no character, and the judging means and the second recognizing means based on the judgment result of the judging means and the recognition result of the second recognizing means. It is characterized in that it has a correction means capable of correcting the criteria and treatment standards to allow a more reliable determination and recognition, respectively.

【0008】また、請求項3記載の文字認識装置は、少
なくとも前記判定手段及び第2の認識手段をニューラル
ネットで構成したことを特徴とするものである。
The character recognition device according to a third aspect of the invention is characterized in that at least the judging means and the second recognizing means are constituted by a neural network.

【0009】[0009]

【作用】請求項1記載の文字認識装置を読取段階と学習
段階とに分けて説明する。
The character recognition device according to the first aspect will be described separately for the reading stage and the learning stage.

【0010】読取段階においては、第1の認識手段が最
も評価値の高い文字パターン候補を決定すると、判定手
段はその候補に対し判定を行う。そして、誤読を招き易
い候補と判定された場合には、第2の認識手段はその候
補に対応する入力文字パターンについて認識処理を行
う。学習段階においては、判定手段の判定結果が誤って
いた場合は、修正手段により判定手段がより確実な判定
を行えるように判定基準を修正する。また、第2の認識
手段の認識結果が誤っていた場合は、修正手段により第
2の認識手段がより確実な認識を行えるように処理基準
を修正する。判定手段の学習が進むに従い、誤読を招き
易い候補か否かの判定がより確実となり、第2の認識手
段の学習が進むに従い、第2の認識手段による認識がよ
り確実となり、誤読率が低減する。
In the reading step, when the first recognition means determines the character pattern candidate having the highest evaluation value, the determination means makes a determination for that candidate. Then, when it is determined that the candidate is likely to cause misreading, the second recognizing means performs the recognition process on the input character pattern corresponding to the candidate. In the learning stage, if the determination result of the determination means is incorrect, the correction means corrects the determination criteria so that the determination means can make a more reliable determination. If the recognition result of the second recognizing means is incorrect, the correcting means corrects the processing standard so that the second recognizing means can perform more reliable recognition. As the learning of the determining means progresses, it becomes more reliable to determine whether or not the candidate is likely to cause misreading, and as the learning of the second recognizing means progresses, the recognition by the second recognizing means becomes more reliable and the misreading rate decreases. To do.

【0011】また、請求項2記載の文字認識装置によれ
ば、第2の認識手段による再認識結果の正誤を第2の判
定手段により判定しているので、誤読率がより低減す
る。
Further, according to the character recognition device of the second aspect, since the correctness of the re-recognition result by the second recognition means is judged by the second judgment means, the misreading rate is further reduced.

【0012】また、請求項3記載の文字認識装置によれ
ば、修正手段により判定手段及び第2の認識手段を構成
しているニューラルネットにおけるアーク荷重値を修正
することで、判定基準及び処理基準を迅速に修正でき
る。
According to the character recognition device of the third aspect, the correction standard is used to modify the arc load value in the neural network that constitutes the determination means and the second recognition means, thereby making the determination standard and the processing standard. Can be fixed quickly.

【0013】[0013]

【実施例】以下、本発明の実施例を図面を参照して詳述
する。
Embodiments of the present invention will now be described in detail with reference to the drawings.

【0014】図1は本発明の文字認識装置の一実施例を
示す概略ブロック図である。
FIG. 1 is a schematic block diagram showing an embodiment of the character recognition apparatus of the present invention.

【0015】この実施例装置1は、文書のイメージを検
出するスキャナ部2と、このスキャナ部2により検出さ
れた文書のイメージから1文字毎に文字パターンを切り
出す文字切出し部3と、この文字切出し部3からの入力
文字パターンと認識辞書部4に格納された文字パターン
候補とを照合して複数の文字パターン候補を決定する第
1の認識手段としての認識部5と、この認識部5により
決定された文字パターン候補が誤読を招き易い候補か否
かを変更可能な判定基準に従って判定する判定部6と、
この判定部6により誤読を招き易い候補と判定された場
合に、その候補に対応する入力文字パターンについて変
更可能な処理基準に従って特徴抽出を行い、その文字を
認識する第2の認識手段としての再認識部7と、判定部
6の判定結果及び再認識部7の認識結果に基づいて判定
部6及び再認識部7がそれぞれより確実な判定及び認識
を行えるように前記判定基準及び処理基準を修正し得る
修正手段8とを有して概略構成されている。
The apparatus 1 of this embodiment includes a scanner unit 2 for detecting an image of a document, a character cutout unit 3 for cutting out a character pattern for each character from the image of the document detected by the scanner unit 2, and this character cutout. A recognition unit 5 as a first recognition unit that determines a plurality of character pattern candidates by collating the input character pattern from the unit 3 with the character pattern candidates stored in the recognition dictionary unit 4, and the recognition unit 5 determines the character pattern candidates. A determination unit 6 that determines whether the generated character pattern candidate is a candidate that is likely to cause misreading according to a changeable determination criterion;
When the determination unit 6 determines that the candidate is likely to cause misreading, feature extraction is performed according to a changeable processing standard for an input character pattern corresponding to the candidate, and the character extraction is performed again as a second recognition unit that recognizes the character. Based on the recognition result of the recognition unit 7, the judgment unit 6 and the recognition result of the re-recognition unit 7, the judgment standard and the processing standard are modified so that the judgment unit 6 and the re-recognition unit 7 can perform more reliable judgment and recognition, respectively. And a correction means 8 which can be used.

【0016】次に、上記各部の詳細を説明する。Next, the details of each of the above parts will be described.

【0017】前記スキャナ部2は、文書上に光を照射す
る光源と、文書からの反射光を受けて電気信号に変換す
る光電変換素子とを具備し、文書全体を光学的に走査し
て文書のイメージを検出するものである。
The scanner unit 2 comprises a light source for irradiating a document with light, and a photoelectric conversion element for receiving reflected light from the document and converting it into an electric signal. The image of is detected.

【0018】前記認識辞書部4には、文字切出し部3か
らの入力文字パターンとの照合の対象となる多数の文字
パターン候補が格納されている。
The recognition dictionary section 4 stores a large number of character pattern candidates to be matched with the input character pattern from the character cutting section 3.

【0019】前記認識部5は、入力文字パターンと認識
辞書部4に格納された文字パターン候補とを照合し、例
えばパターンマッチング法により評価値として類似度を
求め、入力文字パターンの認識結果として比較的類似度
の高い複数の文字パターン候補を文字コードで決定し、
類似度と共に判定部6に出力するものである。なお、評
価値は、類似度に限らず、他の評価値でもよい。また、
評価方法は、パターンマッチング法に限定されず、他の
方法でもよい。
The recognition unit 5 collates the input character pattern with the character pattern candidates stored in the recognition dictionary unit 4, obtains the degree of similarity as an evaluation value by, for example, a pattern matching method, and compares it as the recognition result of the input character pattern. Of multiple character pattern candidates with a high degree of physical similarity is determined by the character code,
It is output to the determination unit 6 together with the similarity. The evaluation value is not limited to the similarity and may be another evaluation value. Also,
The evaluation method is not limited to the pattern matching method and may be another method.

【0020】前記修正手段8は、例えばCRTディスプ
レイの如き表示部9と、キーボード,マウス等を備えた
入力部10と、判定部6の判定基準及び再認識部7の処
理基準を修正すると共にこの装置1の各部を制御する制
御部11とを具備している。
The correction means 8 corrects the display section 9 such as a CRT display, the input section 10 equipped with a keyboard, a mouse, etc., the judgment standard of the judgment section 6 and the processing standard of the re-recognition section 7, and The control unit 11 controls each unit of the apparatus 1.

【0021】前記判定部6は、例えば図2に示すような
ニューラルネットにより構成されている。すなわち、こ
の判定部6は、複数の入力ノード60aからなる入力層
60と、各入力ノード60aとアーク63を介してネッ
トワークで結合された複数の中間ノード61aからなる
中間層61と、各中間ノード61aとアーク64を介し
てネットワークで結合された一対の出力ノード62aか
らなる出力層62とから構成されている。
The determination unit 6 is composed of, for example, a neural network as shown in FIG. That is, the determination unit 6 includes an input layer 60 including a plurality of input nodes 60a, an intermediate layer 61 including a plurality of intermediate nodes 61a connected to each input node 60a via an arc 63 through a network, and each intermediate node. 61a and an output layer 62 including a pair of output nodes 62a connected to each other via a network via an arc 64.

【0022】各入力ノード60aには、認識部5による
パターンマッチング法で算出された各文字パターン候補
に対する類似度(第1位乃至第n位)がそれぞれ入力さ
れるようになっている。出力ノード62aからは、判定
結果が制御部11に出力されるようになっている。
The similarity (first rank to nth rank) for each character pattern candidate calculated by the pattern matching method by the recognition unit 5 is input to each input node 60a. The determination result is output from the output node 62a to the control unit 11.

【0023】また、各アーク63,64には、各ノード
60a,61a,62a間の結合の強さを示す荷重値
(実数)が設定されている。この荷重値の設定により、
判定部6が判定を行うための判定基準が設定されたこと
になる。
A load value (real number) indicating the strength of the connection between the nodes 60a, 61a, 62a is set for each arc 63, 64. By setting this load value,
This means that the judgment standard for the judgment unit 6 to make the judgment is set.

【0024】認識部5にて算出された各類似度が、各入
力ノード60aに入力されると、設定された判定基準に
より、認識部5によって認識された最も類似度の高い文
字パターン候補すなわち第1位の文字パターン候補が誤
読を招き易い候補か否かが判定され、その判定結果が出
力ノード62aから制御部11に出力されるようになっ
ている。例えば、誤読を招き易い候補と判定した場合
は、「1」が出力され、その他の場合は「0」が出力さ
れる。
When each similarity calculated by the recognition unit 5 is input to each input node 60a, the character pattern candidate having the highest similarity recognized by the recognition unit 5, that is, the first character pattern candidate, which is recognized by the recognition unit 5, is set according to the set criterion. It is determined whether or not the first-ranked character pattern candidate is a candidate that is likely to cause misreading, and the determination result is output from the output node 62a to the control unit 11. For example, when it is determined that the candidate is likely to cause misreading, “1” is output, and in other cases, “0” is output.

【0025】また、各荷重値は、表示部8に表示された
認識結果のうち誤読文字にカーソルを合わせて正解の文
字を入力する等の入力部10の操作に基づいて、制御部
11により例えば、誤差逆伝播(バックプロパゲーショ
ン)法に従って修正されるようになっている。これらの
荷重値を修正することにより、判定基準が学習され修正
されることになる。すなわち、ノードが1つの場合を例
にして説明すると、そのノードの出力yは、入力データ
をxi,荷重値をωiとすると、 y=f(Σωi・xi) …(1) で表される。一方、事例データとして{y′(s),x
i′(s)|s=1,…,S}が存在しており、荷重値
ωのノードにx′(s)を入力した出力値をy(ω,
x′(s))とすると、誤差関数R(ω)は、 で表される。ここで、式(1) にxi=xi′(判定部6
が誤判定したときの類似度)の入力を与えたときに、教
師データ(「1」)y′に近い出力y(=f(Σωi・
xi′))が得られるように、ωiを少しずつ変更し
て、誤差関数R(ω)を最も小さくするωiを求める。
これを各ノードについて行い、判定部6の処理基準を修
正する。
Each load value is controlled by the control unit 11 based on the operation of the input unit 10 such as by inputting the correct character by moving the cursor to the misread character in the recognition result displayed on the display unit 8, for example. , Error backpropagation (backpropagation) method. By correcting these load values, the judgment criteria will be learned and corrected. That is, when the case of one node is described as an example, the output y of that node is represented by y = f (Σωi · xi) (1) where xi is the input data and ωi is the load value. On the other hand, as case data, {y '(s), x
i ′ (s) | s = 1, ..., S} exists, and the output value obtained by inputting x ′ (s) into the node of the load value ω is y (ω,
x ′ (s)), the error function R (ω) is It is represented by. Here, in equation (1), xi = xi ′ (determination unit 6
When the input is the similarity when the erroneous determination is made, the output y (= f (Σωi ·
xi ′)) is obtained, ωi is gradually changed to obtain ωi that minimizes the error function R (ω).
This is performed for each node, and the processing standard of the determination unit 6 is corrected.

【0026】また、判定基準としては、例えば、文字パ
ターン候補の第1位の類似度が所定値より低いか、又は
文字パターン候補の第1位と第2位との類似度の点数差
が所定値以下の場合は、誤読を招き易い候補と判定し、
それ以外を正読と判定する。例えば、文字パターン候補
の第1位,第2位,第3位及び第4位の類似度が、それ
ぞれ100点,90点,80点,70点の場合は、第1
位と第2位との類似度の点数差が小さいので、第1位の
文字パターン候補を誤読を招き易い候補と判定する。ま
た、文字パターン候補の第1位が100点、第2位以降
の全てが0点の場合は、第1位と第2位との点数差が大
きいので、正読と判定する。
As the criterion, for example, the similarity of the first rank of the character pattern candidate is lower than a predetermined value, or the score difference between the first rank and the second rank of the character pattern candidate is predetermined. If the value is less than or equal to the value, it is determined that the candidate is likely to cause misreading,
Other than that is determined to be correct reading. For example, if the first, second, third, and fourth similarities of the character pattern candidates are 100 points, 90 points, 80 points, and 70 points, respectively,
Since the score difference in the degree of similarity between the second rank and the second rank is small, the first character pattern candidate is determined to be a candidate that easily causes misreading. Further, when the first rank of the character pattern candidates is 100 points and all of the second and subsequent ranks are 0 points, the score difference between the first rank and the second rank is large, and thus it is determined to be correct reading.

【0027】前記再認識部7は、例えば図3に示すよう
なニューラルネットにより構成されている。すなわち、
この再認識部7は、複数の入力ノード70aからなる入
力層70と、各入力ノード70aとアーク73を介して
ネットワークで結合された複数の中間ノード71aから
なる中間層71と、各中間ノード71aとアーク74を
介してネットワークで結合された複数の出力ノード72
aからなる出力層72とから構成されている。
The re-recognition unit 7 is composed of, for example, a neural network as shown in FIG. That is,
The re-recognition unit 7 includes an input layer 70 including a plurality of input nodes 70a, an intermediate layer 71 including a plurality of intermediate nodes 71a connected to each input node 70a via an arc 73, and each intermediate node 71a. And a plurality of output nodes 72 connected in a network via
and an output layer 72 made of a.

【0028】各入力ノード70aには、文字切出し部3
にて切り出された文字パターンのうち判定部6にて誤読
を招き易い候補と判定されたイメージの文字パターンを
0,1のパターンで入力されるようになっている。出力
ノード72aからは、認識結果が制御部11に出力され
るようになっている。
At each input node 70a, a character cutout unit 3 is provided.
Of the character patterns cut out in step 2, the character patterns of the image that are determined as candidates that are likely to cause misreading by the determination unit 6 are input as patterns 0 and 1. The recognition result is output from the output node 72a to the control unit 11.

【0029】また、各アーク73,74には、各ノード
70a,71a,72a間の結合の強さを示す荷重値
(実数)が設定されている。この荷重値の設定により、
再認識部7が認識するための処理基準が設定されたこと
になる。
A load value (real number) indicating the strength of the connection between the nodes 70a, 71a, 72a is set for each arc 73, 74. By setting this load value,
This means that the processing standard for the re-recognition unit 7 to recognize is set.

【0030】誤読を招き易い候補と判定された文字パタ
ーンが、入力ノード70aに入力されると、設定された
処理基準により、特徴抽出が行われ、文字が文字コード
として認識され、その認識結果が出力ノード72aから
制御部11に出力されるようになっている。
When a character pattern determined to be a candidate for misreading is input to the input node 70a, feature extraction is performed according to the set processing standard, the character is recognized as a character code, and the recognition result is The output node 72a is adapted to output to the control unit 11.

【0031】また、各荷重値は、表示部8に表示された
認識結果のうち誤読文字にカーソルを合わせて正解の文
字を入力する等の入力部10の操作に基づいて、制御部
11により例えば、誤差逆伝播(バックプロパゲーショ
ン)法に従って修正されるようになっている。これらの
荷重値を修正することにより、処理基準が学習され修正
されることになる。すなわち、判定部6と同様に、前記
式(1) にxi=xi′(再認識部7が誤読した文字パタ
ーン)の入力を与えたときに、教師データ(正しい文字
コード)y′に近い出力y(=f(Σωi・xi′))
が得られるように、ωiを少しずつ変更して、誤差関数
R(ω)を最も小さくするωiを求め、これを各ノード
について行い、再認識部7の処理基準を修正する。
Each load value is controlled by the control unit 11 based on the operation of the input unit 10 such as by inputting a correct character by moving the cursor to a misread character in the recognition result displayed on the display unit 8, for example. , Error backpropagation (backpropagation) method. By modifying these load values, the processing criteria will be learned and modified. That is, similar to the determination unit 6, when the input of xi = xi '(character pattern misread by the re-recognition unit 7) is given to the equation (1), the output close to the teacher data (correct character code) y' y (= f (Σωi · xi ′))
So that ωi is gradually changed to obtain ωi that minimizes the error function R (ω), this is performed for each node, and the processing standard of the re-recognition unit 7 is corrected.

【0032】なお、前記判定部6及び再認識部7を構成
するニューラルネットの学習法は、ここではバックプロ
パゲーション法とするが、これに限定されない。また、
層数は上記3層に限定されず、4層以上でもよい。ま
た、判定部6及び再認識部7は、学習可能なものなら、
ニューラルネットに限定されず、他の構成としてもよ
い。
The learning method of the neural network forming the judgment unit 6 and the re-recognition unit 7 is the back propagation method here, but is not limited to this. Also,
The number of layers is not limited to the above three layers, and may be four or more layers. Further, if the judgment unit 6 and the re-recognition unit 7 can learn,
The configuration is not limited to the neural network, and other configurations may be used.

【0033】次に、本実施例の動作を図6のフローチャ
ートに従い読取段階と学習段階とに分けて説明する。
Next, the operation of this embodiment will be described by dividing it into a reading stage and a learning stage according to the flowchart of FIG.

【0034】まず、読取段階において、スキャナ部2
が、制御部11の制御の下に、文書全体を光学的に走査
して文書のイメージを検出すると、文字切出し部3は、
文書のイメージを1文字毎に切り出して、認識部5に出
力する。ここで、その切り出された文字パターンのうち
の一つが図4に示すように「閉」とする。
First, in the reading stage, the scanner unit 2
However, under the control of the control unit 11, when the image of the document is detected by optically scanning the entire document, the character cutting unit 3
The image of the document is cut out character by character and output to the recognition unit 5. Here, one of the cut-out character patterns is "closed" as shown in FIG.

【0035】認識部5は、その文字パターンについて認
識辞書部4に格納された文字パターン候補を用いて認識
処理を行い、類似度の高い順に所定数の文字パターン候
補及び類似度を判定部6に出力する(S1)。その出力
例を図5に示す。同図に示すように、文字パターン候補
及び類似度は、それぞれ第1位に「関」(240点)、
第2位に「閉」(222点)、第3位に「開」(203
点)、第6位に「門」(158点)が出力されたとす
る。
The recognition unit 5 performs a recognition process on the character pattern using the character pattern candidates stored in the recognition dictionary unit 4, and a determination unit 6 determines a predetermined number of character pattern candidates and similarities in descending order of similarity. Output (S1). An example of the output is shown in FIG. As shown in the figure, the character pattern candidates and the similarity are the first place with “Seki” (240 points),
"Closed" (222 points) in second place, "Open" (203) in third place
It is assumed that “gate” (158 points) is output to the sixth place.

【0036】判定部6は、第1位の文字パターン候補
(図5の例では「関」)が誤読を招き易い候補か否かの
判定を行い、その判定結果を制御部11に出力する(S
2)。例えば、誤読を招き易い候補と判定した場合は、
それを示す「1」を出力し、正読となる候補と判定した
場合は、それを示す「0」を出力する。
The determination unit 6 determines whether or not the first-ranked character pattern candidate (“Seki” in the example of FIG. 5) is a candidate that tends to cause misreading, and outputs the determination result to the control unit 11 ( S
2). For example, if it is determined that the candidate is likely to cause misreading,
"1" indicating that is output, and when it is determined that the candidate is the correct reading, "0" indicating that is output.

【0037】制御部11は、判定部6の判定結果を解析
し(S3)、判定結果が「1」(誤読を招き易い候補)
と判定された場合には、それに対応する文字パターン
(図4の例では「閉」)を再認識部7に入力する。再認
識部7は、制御部11の制御の下に、その文字パターン
(「閉」)について処理基準に従って特徴抽出を行い、
その文字を認識する(S4)。
The control unit 11 analyzes the judgment result of the judgment unit 6 (S3), and the judgment result is "1" (a candidate that is likely to cause misreading).
If it is determined that the character pattern (“closed” in the example of FIG. 4) corresponding thereto is input to the re-recognition unit 7. Under the control of the control unit 11, the re-recognition unit 7 performs feature extraction on the character pattern (“closed”) according to the processing standard,
The character is recognized (S4).

【0038】その認識結果は、制御部11の制御の下
に、表示部8に表示される(S5)。この場合は、
「関」が表示され、誤読となっているとする。
The recognition result is displayed on the display section 8 under the control of the control section 11 (S5). in this case,
Seki is displayed and it is misread.

【0039】次に、学習段階においては、操作者は、表
示部8に表示された認識結果と読取対象の文書とを見比
べて、誤読文字「関」を発見すると、入力部10を操作
して、カーソルを誤読文字「関」に合わせ正解の文字
「閉」を入力する(S6)。
Next, in the learning stage, the operator compares the recognition result displayed on the display unit 8 with the document to be read, and when he / she finds the misread character "Seki", operates the input unit 10. , The cursor is aligned with the misread character "Seki" and the correct character "closed" is input (S6).

【0040】続いて、前記ステップS3における判定部
6の判定結果を解析し(S7)、その判定結果が「0」
となっていた場合は、認識部5で誤読され、判定部6で
誤判定された結果とみなせるので、制御部11は、図5
に示すような各文字パターン候補に対する類似度を判定
部6に入力し、出力が「1」(誤読を招き易い候補)と
なるように判定部6における判定基準を修正して学習を
行う(S8)。これにより、より確実な判定が行えるよ
うになる。
Subsequently, the judgment result of the judgment unit 6 in the step S3 is analyzed (S7), and the judgment result is "0".
If it is, it can be considered that the result is erroneously read by the recognition unit 5 and erroneously determined by the determination unit 6.
The similarity with respect to each character pattern candidate as shown in is input to the determination unit 6, and the learning is performed by correcting the determination criterion in the determination unit 6 so that the output is “1” (a candidate that is likely to cause misreading) (S8). ). This enables more reliable determination.

【0041】前記ステップS7にて、判定結果が「1」
となっていた場合は、認識部5で誤読され、判定部6で
正しく判定され、更に再認識部7で誤読された結果とみ
なせるので、制御部11は、文字パターン「閉」を再認
識部7に入力し、出力が「閉」となるように再認識部7
における処理基準を修正して学習を行う(S9)。これ
により、より確実な認識が行えるようになる。
In step S7, the determination result is "1".
If it is, it can be considered that the result is erroneously read by the recognition unit 5, correctly determined by the determination unit 6, and further erroneously read by the re-recognition unit 7. Therefore, the control unit 11 re-recognizes the character pattern “closed”. 7 and re-recognition unit 7 so that the output is "closed".
Learning is performed by correcting the processing standard in (S9). This enables more reliable recognition.

【0042】このような本実施例によれば、判定部6の
学習が進むに従い、誤読を招き易い候補が否かの判定が
より確実となり、再認識部7の学習が進むに従い、再認
識部7による認識がより確実となり、誤読率の低減を図
ることができる。また、修正手段8により判定部6及び
再認識部7を構成しているニューラルネットにおけるア
ーク荷重値を修正することで、判定基準及び処理基準を
迅速に修正でき、リアルタイム性に優れたものとなる。
According to the present embodiment as described above, as the learning of the judging unit 6 progresses, it becomes more reliable to judge whether or not there is a candidate that is likely to cause misreading, and as the learning of the re-recognizing unit 7 progresses, the re-recognizing unit 7 increases. The recognition by 7 becomes more reliable, and the misreading rate can be reduced. Further, by correcting the arc load value in the neural network forming the judgment unit 6 and the re-recognition unit 7 by the correction means 8, the judgment standard and the processing standard can be rapidly modified, and the real-time property is excellent. .

【0043】本実施例の他の実施例としては、再認識部
7により認識された文字が認識部5により決定された複
数の文字パターン候補のうち上位所定数の文字パターン
候補に有るか無いかの判定を行い、無い場合はその文字
をリジェクトする第2の判定手段を設けてもよい。これ
により、誤読率の低減をより図ることができる。
As another embodiment of the present embodiment, whether or not the character recognized by the re-recognition unit 7 exists in a predetermined number of character pattern candidates among the plurality of character pattern candidates determined by the recognition unit 5 or not. It is also possible to provide a second determination means for performing the above determination and rejecting the character when there is no such determination. Thereby, the misreading rate can be further reduced.

【0044】なお、本発明は上記実施例に限定されず、
その要旨を変更しない範囲内で種々に変形実施できる。
The present invention is not limited to the above embodiment,
Various modifications can be made without changing the gist of the invention.

【0045】[0045]

【発明の効果】以上詳述した請求項1記載の発明によれ
ば、判定手段の学習が進むに従い、誤読を招き易い候補
か否かの判定がより確実となり、第2の認識手段の学習
が進むに従い、第2の認識手段による認識がより確実と
なるので、誤読率の低減を図ることができる。
According to the invention described in claim 1 described in detail above, as the learning of the judging means progresses, it becomes more reliable to judge whether or not the candidate is likely to cause misreading, and the learning of the second recognizing means becomes possible. As the process proceeds, the recognition by the second recognition means becomes more reliable, so that the misreading rate can be reduced.

【0046】また、請求項2記載の発明によれば、第2
の認識手段による再認識結果の正誤を第2の判定手段に
より判定しているので、誤読率の低減をより図ることが
できる。
According to the second aspect of the invention,
Since the correctness of the re-recognition result by the recognizing means is determined by the second determining means, the misreading rate can be further reduced.

【0047】また、請求項3記載の発明によれば、判定
手段及び第2の認識手段を構成しているニューラルネッ
トにおけるアーク荷重値を修正することで、判定基準及
び処理基準を迅速に修正できるので、リアルタイム性に
優れたものとなる。
According to the third aspect of the present invention, the judgment standard and the processing standard can be promptly modified by modifying the arc load value in the neural network forming the judging means and the second recognizing means. Therefore, the real-time property is excellent.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の光学的文字読取装置の一実施例を示す
概略ブロック図。
FIG. 1 is a schematic block diagram showing an embodiment of an optical character reading device of the present invention.

【図2】本実施例の判定部の構成図。FIG. 2 is a configuration diagram of a determination unit according to the present exemplary embodiment.

【図3】本実施例の再認識部の構成図。FIG. 3 is a configuration diagram of a re-recognition unit according to the present embodiment.

【図4】本実施例の入力文字パターンの一例を示す図。FIG. 4 is a diagram showing an example of an input character pattern of this embodiment.

【図5】本実施例の認識部の出力例を示す図。FIG. 5 is a diagram showing an output example of a recognition unit of the present embodiment.

【図6】本実施例の動作を示すフローチャート。FIG. 6 is a flowchart showing the operation of this embodiment.

【符号の説明】[Explanation of symbols]

1 文字認識装置 5 認識部(第1の認識手段) 6 判定部 7 再認識部(第2の認識手段) 8 修正手段 1 Character Recognition Device 5 Recognition Unit (First Recognition Unit) 6 Judgment Unit 7 Re-recognition Unit (Second Recognition Unit) 8 Correction Unit

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 入力文字パターンと認識辞書とを照合し
て評価値を求め、入力文字パターンの認識結果として最
も評価値の高い文字パターン候補を決定する第1の認識
手段と、 この第1の認識手段により決定された文字パターン候補
が誤読を招き易い候補か否かを変更可能な判定基準に従
って判定する判定手段と、 この判定手段により誤読を招き易い候補と判定された場
合に、その候補に対応する入力文字パターンについて変
更可能な処理基準に従って特徴抽出を行い、その文字を
認識する第2の認識手段と、 前記判定手段の判定結果及び第2の認識手段の認識結果
に基づいて前記判定手段及び第2の認識手段がそれぞれ
より確実な判定及び認識を行えるように前記判定基準及
び処理基準を修正し得る修正手段と、 を有することを特徴とする文字認識装置。
1. A first recognizing means for determining an evaluation value by collating an input character pattern with a recognition dictionary, and determining a character pattern candidate having the highest evaluation value as a recognition result of the input character pattern; Judgment means for judging whether or not the character pattern candidate decided by the recognition means is a candidate for causing misreading according to a changeable judgment criterion, and if this judgment means is determined as a candidate for causing misreading, A second recognition unit that performs feature extraction for a corresponding input character pattern according to a changeable processing standard and recognizes the character, and the determination unit based on the determination result of the determination unit and the recognition result of the second recognition unit. And a second recognizing means, and a modifying means capable of modifying the judgment standard and the processing standard so as to make more reliable judgment and recognition, respectively. Character recognition device.
【請求項2】 入力文字パターンと認識辞書とを照合し
て評価値を求め、入力文字パターンの認識結果として比
較的評価値の高い複数の文字パターン候補を決定する第
1の認識手段と、 この第1の認識手段により決定された最も評価値の高い
文字パターン候補が誤読を招き易い候補か否かを第1の
認識手段が求めた各評価値に基づき変更可能な判定基準
に従って判定する第1の判定手段と、 この第1の判定手段により誤読を招き易い候補と判定さ
れた場合に、その候補に対応する入力文字パターンにつ
いて変更可能な処理基準に従って特徴抽出を行い、その
文字を認識する第2の認識手段と、 この第2の認識手段により認識された文字が前記第1の
認識手段により決定された複数の文字パターン候補のう
ち上位所定数の文字パターン候補に有るか無いかの判定
を行い、無い場合はその文字をリジェクトする第2の判
定手段と、 前記判定手段の判定結果及び第2の認識手段の認識結果
に基づいて前記判定手段及び第2の認識手段がそれぞれ
より確実な判定及び認識を行えるように前記判定基準及
び処理基準を修正し得る修正手段と、 を有することを特徴とする文字認識装置。
2. A first recognition means for determining an evaluation value by collating an input character pattern with a recognition dictionary and determining a plurality of character pattern candidates having a relatively high evaluation value as a recognition result of the input character pattern, First, it is determined whether or not the character pattern candidate having the highest evaluation value determined by the first recognition means is a candidate that is likely to cause misreading, based on each evaluation value obtained by the first recognition means, according to a changeable determination criterion. And the first deciding means, when it is determined that the candidate is liable to be misread, the feature extraction is performed according to a changeable processing standard for the input character pattern corresponding to the candidate, and the character is recognized. And the character recognized by the second recognizing means is included in a predetermined upper number of character pattern candidates among the plurality of character pattern candidates determined by the first recognizing means. Whether the character is present or not, and if it is not present, second determining means for rejecting the character, and the determining means and the second recognition based on the determination result of the determining means and the recognition result of the second recognizing means. A character recognizing device comprising: a correction unit capable of correcting the determination standard and the processing standard so that each unit can perform more reliable determination and recognition.
【請求項3】 少なくとも前記判定手段及び第2の認識
手段をニューラルネットで構成したことを特徴とする請
求項1又は2記載の文字認識装置。
3. The character recognition device according to claim 1, wherein at least the judging means and the second recognizing means are constructed by a neural network.
JP6029792A 1994-02-28 1994-02-28 Character recognition device Pending JPH07239913A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6029792A JPH07239913A (en) 1994-02-28 1994-02-28 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6029792A JPH07239913A (en) 1994-02-28 1994-02-28 Character recognition device

Publications (1)

Publication Number Publication Date
JPH07239913A true JPH07239913A (en) 1995-09-12

Family

ID=12285855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6029792A Pending JPH07239913A (en) 1994-02-28 1994-02-28 Character recognition device

Country Status (1)

Country Link
JP (1) JPH07239913A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7162086B2 (en) 2002-07-09 2007-01-09 Canon Kabushiki Kaisha Character recognition apparatus and method
US7778447B2 (en) 2004-01-29 2010-08-17 Fujitsu Limited Method and device for mobile object information management, and computer product

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7162086B2 (en) 2002-07-09 2007-01-09 Canon Kabushiki Kaisha Character recognition apparatus and method
US7778447B2 (en) 2004-01-29 2010-08-17 Fujitsu Limited Method and device for mobile object information management, and computer product

Similar Documents

Publication Publication Date Title
US5257314A (en) Voice recognition system having word frequency and intermediate result display features
US7826635B2 (en) System and method for improving accuracy of signal interpretation
JPH07239913A (en) Character recognition device
JP2000348141A (en) Method and device for predicting input information, and program storage medium
JPH0696263A (en) Pattern recognizing device
JP2000089786A (en) Method for correcting speech recognition result and apparatus therefor
JPH09134410A (en) Method for determining degree of certainty of recognition result and character recognition system
JP2002207960A (en) Method and program for recognized character correction
JPH03218567A (en) Electronic dictionary
JP2875678B2 (en) Post-processing method of character recognition result
JP3109476B2 (en) Character recognition device with candidate number control function and method
JPH0654503B2 (en) Pattern recognition device
JPH11154231A (en) Method and device for learning pattern recognition dictionary, method and device for preparing pattern recognition dictionary and method and device for recognizing pattern
JPH0562020A (en) Character recognition device
JPH07225836A (en) Method for generating pattern recognition dictionary
JP2890241B2 (en) Optical character recognition device
JPH1196306A (en) Pattern recognition dictionary learning method
JPH0484383A (en) Character recognizing device
JPH0318987A (en) Dictionary registering method
JPH07141471A (en) Character recognizing method
JPH09237322A (en) Candidate correcting system for recognizing device
JPH076201A (en) Character recognition parameter control method
JPH05225402A (en) Character recognition device
JPH11120294A (en) Character recognition device and medium
JPH08212300A (en) Method and device for recognizing character