JP3930466B2 - Character recognition device, character recognition program - Google Patents

Character recognition device, character recognition program Download PDF

Info

Publication number
JP3930466B2
JP3930466B2 JP2003306790A JP2003306790A JP3930466B2 JP 3930466 B2 JP3930466 B2 JP 3930466B2 JP 2003306790 A JP2003306790 A JP 2003306790A JP 2003306790 A JP2003306790 A JP 2003306790A JP 3930466 B2 JP3930466 B2 JP 3930466B2
Authority
JP
Japan
Prior art keywords
character
image
character string
correction
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003306790A
Other languages
Japanese (ja)
Other versions
JP2005078287A (en
Inventor
智久 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003306790A priority Critical patent/JP3930466B2/en
Publication of JP2005078287A publication Critical patent/JP2005078287A/en
Application granted granted Critical
Publication of JP3930466B2 publication Critical patent/JP3930466B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は、文字認識結果に対する修正の結果を修正以降の文字認識処理に反映させる文字認識装置、文字認識プログラムに関する。   The present invention relates to a character recognition apparatus and a character recognition program for reflecting a result of correction on a character recognition result in character recognition processing after correction.

従来、文字認識装置においては、文字認識によって出力された文字認識結果に対してオペレータによって修正し、その修正結果を以降の文字認識処理に反映せることができる。   Conventionally, in a character recognition device, a character recognition result output by character recognition can be corrected by an operator, and the correction result can be reflected in subsequent character recognition processing.

修正の情報を反映させる方法としては様々な方法が提案されているが、一度、認識結果が修正された(文字)パターンと画像的に酷似している(文字)パターンが再度入力された場合であっても、オペレータによる修正が認識結果に反映されにくい場合があった。このような場合、オペレータが再度修正を行わなければならず、大変煩雑な作業が必要となっていた。   Various methods have been proposed to reflect the correction information, but once the recognition result has been re-entered (character) pattern that is very similar in image to the corrected (character) pattern. Even in such a case, the correction by the operator may not be reflected in the recognition result. In such a case, the operator had to make corrections again, which required very complicated work.

例えば、特許文献1に記載された方法では、オペレータが選択した正解文字列が認識結果となるように、文字カテゴリ毎の評価値を補正する補正情報を求めて登録し、以降の文字認識でのカテゴリの評価値を補正することにより、オペレータによる修正の情報を認識結果に反映させている。   For example, in the method described in Patent Document 1, correction information for correcting an evaluation value for each character category is obtained and registered so that a correct character string selected by the operator becomes a recognition result, and subsequent character recognition is performed. By correcting the category evaluation value, correction information by the operator is reflected in the recognition result.

しかし、この方法では評価値の補正の単位がカテゴリ単位なので、認識処理において誤ったカテゴリと混同されやすいパターンは、当該カテゴリの補正値による悪影響を受け、当該パターン固有の修正が以降の認識結果に反映されにくい。   However, in this method, since the unit of correction of the evaluation value is a category unit, a pattern that is easily confused with an incorrect category in the recognition process is adversely affected by the correction value of the category, and the correction specific to the pattern is not included in the subsequent recognition results. It is hard to be reflected.

また、特許文献2の方法では、オペレータによって修正された誤読カテゴリと正読カテゴリの対について、正読カテゴリが第一候補となるように距離値の補正量を求めて、その補正量と前記誤読カテゴリと前記正読カテゴリとからなるエントリを修正用テーブルに登録している。そして、以降の文字認識で第一候補が前記誤読カテゴリと一致する場合は、前期誤読カテゴリと同一エントリに記憶されている正読カテゴリの距離値を、当該エントリに記録されている補正量で補正することにより、以前の修正でオペレータが入力した正読カテゴリが認識結果として出力されやすくなるようにしている。   Further, in the method of Patent Document 2, the correction amount of the distance value is obtained so that the correct reading category becomes the first candidate for the pair of the misreading category and the correct reading category corrected by the operator, and the correction amount and the misreading are calculated. An entry composed of a category and the correct reading category is registered in the correction table. If the first candidate matches the misread category in subsequent character recognition, the correct reading category distance value stored in the same entry as the previous misread category is corrected by the correction amount recorded in the entry. Thus, the correct reading category input by the operator in the previous correction is easily output as the recognition result.

しかし、この方法においても、正読カテゴリの距離値の補正量が、誤読カテゴリ単位で登録されるため、認識処理で分離が難しいカテゴリは補正を行ってもやはり分離が難しく、パターン固有の修正をオペレータが行っても認識結果に反映しにくい。そのため、ある程度似ているが酷似しているというほどでもないパターンにまで修正が影響を及ぼしてしまう。   However, even in this method, since the correction amount of the distance value of the correct reading category is registered in units of misreading categories, the category that is difficult to separate in the recognition process is still difficult to separate even if correction is performed, and pattern-specific correction is performed. Even if it is performed by the operator, it is difficult to reflect it in the recognition result. As a result, the modification affects even patterns that are somewhat similar but not so similar.

また、特許文献3の方法では、複数の認識エンジンを備えており、各認識エンジンが認識結果と共に認識結果の信頼係数を出力するようになっている。認識装置全体の認識結果としては、認識エンジン毎の認識結果の信頼係数と、当該認識エンジン自体について求められた信頼係数の積が最大の認識エンジンの認識結果が選択されるようになっており、オペレータによって修正された認識結果を用いて認識エンジン毎の誤読回数を計数し、前記誤読回数を元に当該認識エンジンの信頼係数が求められる。この方法ではオペレータによる修正の情報がエンジン毎の信頼係数を介して認識結果に反映されるようになっている。   Further, the method of Patent Document 3 includes a plurality of recognition engines, and each recognition engine outputs a recognition result reliability coefficient together with the recognition result. As the recognition result of the entire recognition device, the recognition result of the recognition engine having the maximum product of the reliability coefficient of the recognition result for each recognition engine and the reliability coefficient obtained for the recognition engine itself is selected. The number of misreads for each recognition engine is counted using the recognition result corrected by the operator, and the reliability coefficient of the recognition engine is obtained based on the number of misreads. In this method, correction information by the operator is reflected in the recognition result via a reliability coefficient for each engine.

しかし、この方法においては、信頼係数の調整の単位が認識対象領域全体なので、修正されたパターンと画像的に酷似したパターンに修正の情報が選択的に反映されるわけではない。   However, in this method, since the unit of adjustment of the reliability coefficient is the entire recognition target region, the correction information is not selectively reflected in a pattern that is very similar in image to the corrected pattern.

また、個々の文字の認識に認識辞書を用いている文字認識方法の中には、修正された認識結果と入力されたパターンの組み合わせをオンラインで学習し、認識辞書を逐次修正する方法が知られている。例えば、特許文献4の方法では、スキャナによって取り込まれたデータは1文字ごとに切り出され、特徴量が抽出された少ない量のデータ(取得文字パターン)に加工される。そして、この取得文字パターンに対する文字認識の結果が誤読の場合、キーボードから入力された文字コードに変更する事ができる。そして変更対象の取得文字パターンと変更後の文字コードとを互いに対応づけて認識辞書に記憶させる。   Also, among character recognition methods that use a recognition dictionary to recognize individual characters, a method is known in which a combination of a corrected recognition result and an input pattern is learned online, and the recognition dictionary is sequentially corrected. ing. For example, in the method of Patent Document 4, data captured by a scanner is cut out for each character and processed into a small amount of data (acquired character pattern) from which a feature amount is extracted. When the character recognition result for the acquired character pattern is misread, it can be changed to the character code input from the keyboard. The acquired character pattern to be changed and the changed character code are associated with each other and stored in the recognition dictionary.

この方法においてオペレータによる修正は、認識辞書とそれを用いた文字認識手段を介して反映される。しかし、通常文字認識手段では汎化能力が要求されるため、辞書の学習では、各学習パターン(文字の特徴量を表す取得文字パターン)がその学習パターンと酷似したパターンのみならず、場合によっては学習パターンとあまり似ていないパターンの認識結果に対しても影響を及ぼすように行われる。従って、場合によっては既に正読していたパターンが誤読に転じる修正がされる場合もある。
特開平2002−334302号公報 特開平9−237322号公報 特開平06−78561号公報 特開平11−143993号公報
In this method, the correction by the operator is reflected through a recognition dictionary and character recognition means using the recognition dictionary. However, since the general character recognition means requires generalization ability, in learning the dictionary, each learning pattern (acquired character pattern representing the feature amount of the character) is not only a pattern very similar to the learning pattern, but in some cases This is performed so as to affect the recognition result of a pattern that is not very similar to the learning pattern. Therefore, in some cases, correction may be made so that a pattern that has been correctly read turns into a misread.
Japanese Patent Laid-Open No. 2002-334302 JP-A-9-237322 Japanese Patent Application Laid-Open No. 06-78561 JP-A-11-143993

このように従来の文字認識装置では、過去に修正されたパターンと画像的に酷似したパターンが入力されても修正が行われない場合や、逆に修正されたパターンとあまり似ていないパターンにも悪影響を及ぼす場合があった。   As described above, in the conventional character recognition device, even when a pattern that is very similar to the pattern corrected in the past is inputted, the correction is not performed, or conversely, the pattern that is not very similar to the corrected pattern is also used. There were cases where it had an adverse effect.

本発明は前記のような事情を考慮してなされたもので、画像的に酷似したパターンにおいては、オペレータによる修正を確実に反映し、逆に酷似していないパターンには影響を与えないようにすることで、オペレータによる認識結果の修正を修正以降の認識処理に的確に反映させて、オペレータに対する負担を増大させることなく正しい認識結果を得ることが可能な文字認識装置、文字認識プログラムを提供することを目的とする。   The present invention has been made in consideration of the above-described circumstances. In a pattern that is very similar in image, correction by an operator is surely reflected, and conversely, a pattern that is not very similar is not affected. Thus, a character recognition device and a character recognition program capable of accurately reflecting the correction of the recognition result by the operator in the recognition processing after the correction and obtaining a correct recognition result without increasing the burden on the operator are provided. For the purpose.

本発明は、第1の文字画像を認識して認識結果とする第1の文字を出力する文字認識手段と、第2の文字画像と前記第2の文字画像に対応する第2の文字を特定するデータの対からなるエントリが記録される修正辞書と、前記第1の文字画像と前記第2の文字画像とを重ね合わせ、それぞれの画素の画素値の比較により前記第1の文字画像と前記第2の文字画像とが酷似しているか否かを判別する判別手段と、前記判別手段によって前記第1の文字画像と前記第2の文字画像とが酷似していると判別された場合に、前記文字認識手段により出力された認識結果とする第1の文字を、前記第2の文字画像と対となる前記文字を特定するデータが示す前記第2の文字に修正する第1の文字修正手段と、前記第1の文字修正手段により修正された前記第2の文字を手動修正の対象として提示する提示手段と、前記提示手段により提示された前記第2の文字を修正するための第3の文字を手動修正操作により入力する入力手段と、前記提示手段により提示された前記第2の文字を、前記入力手段により入力された前記第3の文字に修正する第2の文字修正手段と、
前記第2の文字修正手段によって修正された第3の文字を特定するデータが前記修正辞書に記録されていない場合に、前記第1の文字画像と前記第3の文字を特定するデータの対からなるエントリを前記修正辞書に追加する修正辞書管理手段とを具備したことを特徴とする。
The present invention identifies a character recognition means for recognizing a first character image and outputting a first character as a recognition result, and specifying a second character image and a second character corresponding to the second character image A correction dictionary in which an entry including a pair of data to be recorded is superimposed on the first character image and the second character image, and the first character image and the second character image are compared by comparing pixel values of respective pixels. When it is determined that the first character image and the second character image are very similar by the determination unit that determines whether or not the second character image is very similar, the first character correction means for correcting the first character to the recognition result output by said character recognition means, said second character image and the second letter indicating the data for specifying the characters to be paired And before being corrected by the first character correcting means. And presenting means for presenting the second character as the target of manual correction, input means for inputting the third letter for modifying said second character presented by the presenting means by manual correction operation, the presentation a second character correction means for correcting the presented the second character, the third characters input by said input means by means,
When the data for specifying the third character corrected by the second character correcting means is not recorded in the correction dictionary, the first character image and the data for specifying the third character are And a modified dictionary managing means for adding the entry to the modified dictionary .

本発明によれば、認識対象とする文字の画像と修正辞書に記録された文字の画像が酷似しているか判別され、酷似していると判別された場合に文字認識の結果に対して、修正辞書に記録されたデータが示す文字により修正がされるので、画像的に酷似したパターンにおいては、オペレータによる修正を確実に反映し、逆に酷似していないパターンには影響を与えないようにすることができ、オペレータによる認識結果の修正を修正以降の認識処理に的確に反映させて、オペレータに対する負担を増大させることなく正しい認識結果を得ることが可能となる。 According to the present invention, it is determined whether the character image to be recognized and the character image recorded in the correction dictionary are very similar, and if it is determined that they are very similar, the character recognition result is corrected. Since the correction is performed by the characters indicated by the data recorded in the dictionary, the pattern that is very similar to the image surely reflects the correction by the operator, and conversely, the pattern that is not very similar is not affected. It is possible to accurately reflect the correction of the recognition result by the operator in the recognition processing after the correction, and to obtain a correct recognition result without increasing the burden on the operator.

以下、図面を参照して本発明の実施の形態について説明する。図1は、本実施形態における文字認識装置を実現するシステムの構成を示すブロック図である。   Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of a system that implements a character recognition device according to this embodiment.

本実施形態における文字認識装置は、コンピュータに本実施形態を実現するプログラムを組み込むことによって構成でき、以下ではそのような構成を仮定して説明する。ただし、本実施形態は各手段を専用ハードウェアや、その集合体、または分散処理用のコンピュータネットワークとしても構成することもでき、以下に説明する手段を具備する構成ならば、ここで挙げた構成に関わらずどのようなもので実装しても良い。 The character recognition apparatus according to the present embodiment can be configured by incorporating a program for realizing the present embodiment into a computer, and will be described below assuming such a configuration. However, in the present embodiment, each unit can be configured as dedicated hardware, an aggregate thereof, or a computer network for distributed processing. If the configuration includes the units described below, the configuration described here Regardless of what you implement it.

図1に示すように、本実施形態における文字認識装置は、CPU10、メモリ12、ディスプレイ14、キーボード15、ポインティングデバイス16、スキャナ17、記憶装置18、及びプリンタ19を備えている。   As shown in FIG. 1, the character recognition device in this embodiment includes a CPU 10, a memory 12, a display 14, a keyboard 15, a pointing device 16, a scanner 17, a storage device 18, and a printer 19.

CPU10は、文字認識装置全体の制御を司るもので、メモリ12に記録される各種プログラムに従い、データの入出力制御、スキャナ17から入力された帳票等に記録された文字に対する文字認識処理の制御などの各種の処理を制御する。   The CPU 10 controls the entire character recognition apparatus. According to various programs recorded in the memory 12, the CPU 10 performs data input / output control, control of character recognition processing for characters recorded in a form or the like input from the scanner 17, and the like. Control various processes.

メモリ12は、プログラムやデータなどを記録するもので、各種プログラムに従って処理が実行される場合に、このプログラムの実行に伴って処理対象とするデータが一時的に記憶される。メモリ12に記憶されるプログラムとしては、例えば帳票等に記入された文字を認識するための文字認識プログラム12aが記憶される。また、文字認識プログラム12aの実行に伴って記憶されるデータとしては、スキャナ17によって入力された帳票等の画像のデータ(原画像データ12b)、原画像データ12bに対する文字認識処理によって得られた認識結果について、認識対象となった文字画像をもとにして修正を行うための修正辞書データ12c、文字認識処理の結果(文字コード)である文字認識結果データ12dなどが記憶される。   The memory 12 records programs, data, and the like, and when processing is executed according to various programs, data to be processed is temporarily stored as the programs are executed. As a program stored in the memory 12, for example, a character recognition program 12a for recognizing characters entered in a form or the like is stored. The data stored with the execution of the character recognition program 12a includes image data (original image data 12b) input by the scanner 17 and recognition obtained by character recognition processing on the original image data 12b. Regarding the result, correction dictionary data 12c for correcting the result based on the character image to be recognized, character recognition result data 12d that is a result (character code) of the character recognition process, and the like are stored.

ディスプレイ14は、LCD(Liquid Crystal Display)などにより構成され、文字認識結果や装置の状態を示す情報を表示する。   The display 14 is composed of an LCD (Liquid Crystal Display) or the like, and displays information indicating the character recognition result and the state of the apparatus.

キーボード15は、装置に対して各種の指示を入力するために用いられる。   The keyboard 15 is used for inputting various instructions to the apparatus.

ポインティングデバイス16は、マウスやタブレットなどにより構成され、装置に対して各種の指示を入力するために用いられる。   The pointing device 16 is configured by a mouse, a tablet, or the like, and is used for inputting various instructions to the apparatus.

スキャナ17は、文字認識処理の対象とする帳票等の画像を読み取り、原画像データを生成する。   The scanner 17 reads an image such as a form to be subjected to character recognition processing and generates original image data.

記憶装置18は、各種の記録媒体に対してプログラムやデータなどの読み書きを実行する。記憶装置18は、記録媒体として、ハードディスク等の磁気ディスクや、光ディスク、半導体メモリなどを用いることができる。記録媒体は、固定型、可搬型の何れであっても良い。   The storage device 18 reads / writes programs and data from / to various recording media. The storage device 18 can use a magnetic disk such as a hard disk, an optical disk, a semiconductor memory, or the like as a recording medium. The recording medium may be either a fixed type or a portable type.

プリンタ19は、帳票等の画像に対する文字認識結果を紙媒体に印刷するもので、例えば帳票に設けられた記入枠内に記入されていた文字に対する文字認識処理の結果(文字コード)を画像(文字)として印刷する。   The printer 19 prints a character recognition result for an image such as a form on a paper medium. For example, a result of character recognition processing (character code) for a character entered in an entry frame provided in the form is displayed as an image (character ).

(第1実施形態)
以下、図面を参照して本発明の第1実施形態について説明する。
図2は、図1に示すシステムによって実現される第1実施形態における文字認識装置の機能構成を示すブロック図である。
(First embodiment)
Hereinafter, a first embodiment of the present invention will be described with reference to the drawings.
FIG. 2 is a block diagram showing a functional configuration of the character recognition apparatus in the first embodiment realized by the system shown in FIG.

第1実施形態における文字認識装置は、入力画像(原画像データ12b)に対してノイズ除去、二値化、フォームやプレプリント文字の除去、認識対象領域の切り出し等の前処理を行う前処理手段21と、前処理結果により得られた画像から文字群を抽出する文字抽出手段22と、抽出された文字群中の文字を認識し文字コードに変換する文字認識手段23、文字認識手段23による認識結果を修正辞書25に基づいて自動的に修正する自動修正手段24、自動修正手段24による修正結果のオペレータによる再修正を可能とするための手動修正手段26と、手動修正手段26における修正に基づいて修正辞書25の登録情報(エントリ)を管理、すなわちエントリの追加、削除、変更をする修正辞書管理手段27とから構成されている。   The character recognition apparatus according to the first embodiment performs preprocessing such as noise removal, binarization, form and preprint character removal, and recognition target area cutout on an input image (original image data 12b). 21, character extraction means 22 for extracting a character group from the image obtained from the preprocessing result, character recognition means 23 for recognizing a character in the extracted character group and converting it into a character code, and recognition by the character recognition means 23 Based on the automatic correction means 24 for automatically correcting the result based on the correction dictionary 25, the manual correction means 26 for enabling the operator to recorrect the correction result by the automatic correction means 24, and the correction in the manual correction means 26 In this way, the registration information (entries) of the correction dictionary 25 is managed, that is, the correction dictionary management means 27 for adding, deleting and changing entries.

次に、第1実施形態における文字認識装置の動作について、図4及び図5に示すフローチャートを参照しながら説明する。   Next, the operation of the character recognition device in the first embodiment will be described with reference to the flowcharts shown in FIGS.

まず、スキャナ17により文字が記入された処理対象とする帳票等について読み取りが実行され、原画像データ12b(原画像20)がメモリ12に記憶される(ステップA1)。   First, reading is performed on a form or the like to be processed in which characters are entered by the scanner 17, and the original image data 12b (original image 20) is stored in the memory 12 (step A1).

前処理手段21は、入力された原画像20に対して処理対象となっている欄の周辺からの画像の切り出しや、二値化、ノイズ除去等の画像処理(前処理)を行う(ステップA2)。また、認識対象が帳票上の文字である場合、罫線やプレプリント文字等のフォーム除去等や、認識対象とする領域の画像切り出し等の画像処理も行う。   The pre-processing means 21 performs image processing (pre-processing) such as image segmentation, binarization, noise removal, and the like on the input original image 20 from the periphery of the column to be processed (step A2). ). When the recognition target is a character on the form, image processing such as form removal such as ruled lines and pre-printed characters, and image cutout of a region to be recognized is also performed.

文字抽出手段22は、前処理手段21の処理結果として得られた画像から、認識対象となる文字群を抽出し、この文字群から文字ごとの画像と位置情報の抽出を行う(ステップA3)。 The character extraction unit 22 extracts a character group to be recognized from the image obtained as a processing result of the preprocessing unit 21, and extracts an image and position information for each character from the character group (step A3).

文字の抽出は、例えば以下の方法で行う。先ず、処理対象とする画像に対して横方向への射影を計算し、その値と最大値の比があらかじめ定めた閾値以下になる場所を行の区切りとする。そして、区切られた行内で縦方向への射影を求め、その値と最大値の比があらかじめ定めた閾値以下になる場所を文字の区切りとし、こうして求めた文字矩形の内部の画像を1文字分の文字画像(第1の文字画像)とする。   Character extraction is performed, for example, by the following method. First, the projection in the horizontal direction is calculated for the image to be processed, and a place where the ratio between the value and the maximum value is equal to or less than a predetermined threshold is defined as a line delimiter. Then, the projection in the vertical direction is obtained within the separated line, and the place where the ratio of the value and the maximum value is equal to or less than a predetermined threshold is defined as the character separation, and the image inside the character rectangle thus obtained is represented by one character. Character image (first character image).

また、文字抽出はラベリングによる連結領域抽出として行うこともでき、ここで挙げた方法に限らず、文字の画像と位置が取得できる方法ならどのような方法を用いても良い。   Character extraction can also be performed as connected region extraction by labeling, and is not limited to the method described here, and any method may be used as long as it can acquire the image and position of the character.

文字認識手段23は、文字抽出手段22で抽出された文字画像を複合類似度法や部分空間法などの手法により、予め定められたクラスの何れかに分類し、そのクラスに対応する文字コード(第1の文字)を出力することにより文字認識を行う(ステップA4)。文字認識手段23は、基本的には入力された文字画像に対応する文字コードを出力するが、文字画像からでは判別が困難な文字についてはリジェクトコードを出力することもできる。また、複合類似度法や部分空間法などの方法では、分類尺度となる類似度値をクラスの分類に用いているが、この類似度値を併せて出力しても良い。   The character recognition unit 23 classifies the character image extracted by the character extraction unit 22 into one of predetermined classes by a method such as a composite similarity method or a subspace method, and a character code ( Character recognition is performed by outputting the first character (step A4). The character recognition means 23 basically outputs a character code corresponding to the input character image, but can also output a reject code for a character that is difficult to distinguish from the character image. Further, in methods such as the composite similarity method and the subspace method, the similarity value as a classification scale is used for class classification, but this similarity value may be output together.

修正辞書25(修正辞書25a)は、図3に示すように、修正すべきパターンの代表的な画像(文字画像)と、この文字画像と処理対象とする文字画像とが酷似していると判別された場合に修正結果として使用する文字を特定するデータ(例えば文字コード)の組からなるエントリが登録されている。修正辞書25には、少なくとも一つのエントリが登録される。以下では、修正辞書25中のエントリの画像を参照画像(第2の文字画像)と呼ぶ。   As shown in FIG. 3, the correction dictionary 25 (correction dictionary 25a) determines that the representative image (character image) of the pattern to be corrected is very similar to the character image to be processed. In this case, an entry made up of a set of data (for example, a character code) for specifying a character to be used as a correction result is registered. At least one entry is registered in the correction dictionary 25. Hereinafter, the image of the entry in the correction dictionary 25 is referred to as a reference image (second character image).

自動修正手段24では、文字認識手段23での入力となった画像と、修正辞書25エントリ中の参照画像とが酷似しているか否かを判別し(ステップA5)、酷似していると判別された場合に(ステップA6、Yes)、当該エントリの修正結果(文字コード(第2の文字))で文字認識手段23からの出力を置き換えることにより、文字認識手段23からの出力を自動的に修正する(ステップA7)。   The automatic correction means 24 determines whether or not the image input by the character recognition means 23 and the reference image in the correction dictionary 25 entry are very similar (step A5), and is determined to be very similar. If this happens (step A6, Yes), the output from the character recognition unit 23 is automatically corrected by replacing the output from the character recognition unit 23 with the correction result (character code (second character)) of the entry. (Step A7).

自動修正は、参照画像と入力された文字画像が酷似している場合に必ず行うようにしても良いし、文字認識手段23が文字認識の際に算出した類似度を出力している場合には、その値が予め定めた閾値より低い場合にのみ行うようにしても良い。また、予め類似文字が存在する文字のリストを作っておき、そのリスト中に文字が含まれる場合のみに修正を行うようにしても良い。   Automatic correction may be performed when the reference image and the input character image are very similar, or when the character recognition unit 23 outputs the similarity calculated at the time of character recognition. It may be performed only when the value is lower than a predetermined threshold value. Alternatively, a list of characters having similar characters may be created in advance, and correction may be performed only when the list includes characters.

文字画像が酷似しているか否かの判定は、入力された文字画像と参照画像の不一致を表す値を求め、その値が予め定めた閾値を超えている場合には「酷似していない」と判定し、超えていない場合には「酷似している」と判定することによって行う。文字画像の不一致の程度を表す値は、図6に示すように、入力された文字画像と参照画像の外接矩形の中心が一致するように、参照画像を平行移動して重ね合わせた後に、両者の外接矩形を含む最小の矩形を求め、その矩形の面積Aと、参照画像の画素値R、文字画像の画素値Iから求めた自乗誤差eを以下の式(1)によって算出し、不一致を表す値として用いる。ただし、式(1)での和の計算は矩形内の全画素について行う。

Figure 0003930466
The determination of whether or not the character image is very similar is to determine a value representing the mismatch between the input character image and the reference image, and when the value exceeds a predetermined threshold, “not very similar” If it does not exceed, it is determined by determining that it is “similar”. As shown in FIG. 6, the value representing the degree of mismatch between the character images is obtained by translating and superimposing the reference image so that the centers of the circumscribed rectangles of the input character image and the reference image coincide with each other. The minimum rectangle including the circumscribed rectangle is calculated, the square error e calculated from the area A of the rectangle, the pixel value R of the reference image, and the pixel value I of the character image is calculated by the following equation (1), and the mismatch is determined. Used as a value to represent. However, the calculation of the sum in Expression (1) is performed for all pixels in the rectangle.
Figure 0003930466

ここでは、入力された文字画像と参照画像の位置合せの法方法として、外接矩形の中心点を用いる方法を示したが、他にも、文字画像と参照画像の黒画素の重心を合わせる方法、図7に示すように外接矩形の下辺の中心を合わせる方法、図8に示すように外接矩形の上辺の中心を合わせる方法、図9に示すように外接矩形の角の1つ(図9では左上)を合わせる方法、外接矩形が共有部分を持つ範囲内で自乗誤差eが最小になる位置に参照画像を合わせる方法等も考えられる。なお、自乗誤差eの値が小さくなると期待できる方法ならばいかなる方法で位置合せを行っても良い。   Here, as a method of aligning the input character image and the reference image, a method using the center point of the circumscribed rectangle is shown, but in addition, a method of aligning the center of gravity of the black pixels of the character image and the reference image, A method of aligning the center of the lower side of the circumscribed rectangle as shown in FIG. 7, a method of aligning the center of the upper side of the circumscribed rectangle as shown in FIG. 8, and one of the corners of the circumscribed rectangle as shown in FIG. ) And a method of matching the reference image at a position where the square error e is minimized within a range where the circumscribed rectangle has a shared portion. Note that the alignment may be performed by any method as long as the value of the square error e can be expected to be small.

また、ここでは、位置合せした文字画像と参照画像の不一致の度合いを表す値として、自乗誤差eを用いたが、ガウシアン等によるぼかし処理を行った後に、上述の方法で自乗誤差eを求める方法等も考えられる。すなわち、入力された画像と参照画像の不一致の度合いを表す画像(画素値)をもとに算出される値ならばいかなるものを用いても良い。   Here, the square error e is used as a value representing the degree of mismatch between the aligned character image and the reference image. However, after the blurring process using Gaussian or the like, the square error e is obtained by the above-described method. Etc. are also conceivable. That is, any value may be used as long as it is a value calculated based on an image (pixel value) representing the degree of mismatch between the input image and the reference image.

手動修正手段26は、自動修正手段24で修正された認識結果と、対応する文字画像をオペレータに提示する(ステップA8)。オペレータは、提示された文字認識結果を見て、キーボード15などから文字(第3の文字)を入力して認識結果を修正することができる。   The manual correction means 26 presents the recognition result corrected by the automatic correction means 24 and the corresponding character image to the operator (step A8). The operator can correct the recognition result by inputting the character (third character) from the keyboard 15 or the like by looking at the presented character recognition result.

図10は、認識結果と文字画像の提示方法(表示画面)の一例を示す図である。図10に示す提示方法では、文字抽出手段22で抽出した文字画像と、自動修正手段24によって修正された認識結果を並べて表示している。また、この例では、オペレータが修正する文字を選択するための矢印型のカーソルが表示されており、このカーソルの先端が、特定の文字画像またはそれに対する認識結果の領域上に位置している場合に、その文字が選択されるようになっている。   FIG. 10 is a diagram illustrating an example of a recognition result and a character image presentation method (display screen). In the presentation method shown in FIG. 10, the character image extracted by the character extraction unit 22 and the recognition result corrected by the automatic correction unit 24 are displayed side by side. Also, in this example, an arrow-shaped cursor for selecting a character to be corrected by the operator is displayed, and the tip of the cursor is positioned on a specific character image or the recognition result area In addition, the character is selected.

図10の例では、文字画像の1文字目「〒」の領域内にカーソルの先端が位置しており、この文字が選択されている。   In the example of FIG. 10, the tip of the cursor is positioned in the area of the first character “” in the character image, and this character is selected.

認識結果の特定の文字が選択されている状態でオペレータによりキーボード15からキー入力されると(ステップA9、Yes)、キーで入力された文字が認識結果の文字に対応する修正結果として入力される。手動修正手段26は、入力された修正結果によって該当する文字を修正し(ステップA10)、修正された後の文字を認識結果28として出力する。   When the operator inputs a key from the keyboard 15 in a state where a specific character of the recognition result is selected (step A9, Yes), the character input by the key is input as a correction result corresponding to the character of the recognition result. . The manual correction means 26 corrects the corresponding character based on the input correction result (step A10), and outputs the corrected character as the recognition result 28.

修正結果とする文字の入力は、図11に示すように、認識結果と並べた入力フィールド内で行う。あるいは、図12に示すように、表示された認識結果を修正中の状態にして、直接編集するようにしても良い。   As shown in FIG. 11, the input of the character as the correction result is performed in an input field aligned with the recognition result. Alternatively, as shown in FIG. 12, the displayed recognition result may be corrected and directly edited.

次に、修正辞書管理手段27は、図5に示すフローチャートに従って修正辞書管理処理を実行し、自動修正手段24による認識結果に対する修正に基づいて、修正辞書25のエントリの追加、変更、削除を行う(ステップA11)。   Next, the correction dictionary management means 27 executes correction dictionary management processing according to the flowchart shown in FIG. 5, and adds, changes, and deletes entries in the correction dictionary 25 based on corrections to the recognition result by the automatic correction means 24. (Step A11).

修正辞書管理手段27は、手動修正手段26によって手動修正された文字が修正辞書25の修正文字として登録されていない場合(ステップB1、ステップB2,Yes)、すなわち手動修正手段26で修正された文字の画像と酷似する画像と、手動修正手段26での修正結果の対からなるエントリが修正辞書25中に登録されていない場合には、当該文字画像と修正結果(文字)の対からなるエントリを修正辞書25に追加する(ステップB3)。   The correction dictionary management means 27, when the character manually corrected by the manual correction means 26 is not registered as the correction character of the correction dictionary 25 (step B1, step B2, Yes), that is, the character corrected by the manual correction means 26 If an entry consisting of a pair of an image that is very similar to the image of the image and a correction result by the manual correction means 26 is not registered in the correction dictionary 25, an entry consisting of a pair of the character image and the correction result (character) is added. It adds to the correction dictionary 25 (step B3).

追加するエントリに納める参照画像は、文字抽出手段22によって文字認識の対象として抽出した文字画像そのものであってもよいし、文字抽出手段22で抽出した画像に対してスムージングや解像度変換等の画像処理を施した画像であっても良い。   The reference image stored in the entry to be added may be the character image itself extracted as a character recognition target by the character extraction unit 22, or image processing such as smoothing or resolution conversion on the image extracted by the character extraction unit 22. It may be an image subjected to.

一方、手動修正手段26によって手動修正された文字が修正辞書25の修正文字として登録されている場合(ステップB1、ステップB2,No)、修正辞書管理手段27は、手動修正手段26で修正された文字の画像と類似しているが、自動修正手段24において酷似していると判定されるに至らなかった参照画像と手動修正手段26での認識結果の対からなるエントリが修正辞書25中に既に登録されている場合、または自動修正手段24で当該エントリが用いられた場合、文字認識の対象となった文字画像をもとに修正辞書25中のエントリ(参照画像)の変更を行う。   On the other hand, when the character manually corrected by the manual correction means 26 is registered as the correction character of the correction dictionary 25 (step B1, step B2, No), the correction dictionary management means 27 is corrected by the manual correction means 26. An entry consisting of a pair of a reference image that is similar to a character image but not determined to be very similar in the automatic correction means 24 and a recognition result in the manual correction means 26 is already in the correction dictionary 25. When registered, or when the entry is used by the automatic correction means 24, the entry (reference image) in the correction dictionary 25 is changed based on the character image that has been subjected to character recognition.

なお、手動修正手段26で修正された文字と参照画像が類似しているか否かの判定の方法は、これらの画像が酷似しているか否かの判定の方法と基本的には同じであるが、自乗誤差eの閾値として酷似しているか否かの判定で用いられるものよりも大きい値が用いられる点のみが、酷似しているか否かの判定の方法とは異なる。   The method for determining whether or not the character corrected by the manual correction means 26 and the reference image are similar is basically the same as the method for determining whether or not these images are very similar. The only difference from the method of determining whether or not they are very similar is that a value larger than that used in determining whether or not they are very similar is used as the threshold of the square error e.

参照画像の変更は、入力された文字画像と参照画像が酷似しているか否かの判定で行われる位置合せと同じ方法で、以下の式(2)に示すように、重ね合わせた文字画像と参照画像の画素ごとに参照画像の旧画素値Rと文字画像の画素値Iの平均値R’を算出し、その平均値R’を新しい参照画像の画素値とすることによって行う。   The reference image is changed by the same method as the alignment performed by determining whether or not the input character image and the reference image are very similar to each other, as shown in the following equation (2), For each pixel of the reference image, the average value R ′ of the old pixel value R of the reference image and the pixel value I of the character image is calculated, and the average value R ′ is used as the pixel value of the new reference image.

R’=(R+I)/2 …(2)
また、図13に示すように、修正辞書25(修正辞書25b)に各エントリに対する参照画像変更回数のカウンタNを備え、このカウンタNで係数される変更回数の値を用いて、参照画像の新しい画素値R’を以下の式(3)で与えられる重み付き平均として求めるようにすることもできる。
R ′ = (R + I) / 2 (2)
Further, as shown in FIG. 13, the correction dictionary 25 (correction dictionary 25b) includes a reference image change count counter N for each entry, and a new reference image is obtained by using the value of the change count calculated by the counter N. It is also possible to obtain the pixel value R ′ as a weighted average given by the following equation (3).

R’=(NR+I)/(N+1) …(3)
なお、修正辞書25aの変更回数は、修正辞書管理手段27がエントリに対して変更を施す処理を実行した場合に、カウントアップしていくものとする。
R ′ = (NR + I) / (N + 1) (3)
Note that the number of changes of the correction dictionary 25a is counted up when the correction dictionary management unit 27 executes a process of changing the entry.

また、修正辞書25のデータサイズが際限なく増大すると記憶領域の制限上好ましくない。このため、修正辞書管理手段27は、修正辞書25のエントリを削除し、修正辞書25のデータサイズの際限ない増大を防止することもできる(ステップB6)。   Further, if the data size of the correction dictionary 25 increases without limit, it is not preferable because of the limitation of the storage area. For this reason, the correction dictionary management means 27 can also delete the entry of the correction dictionary 25 and prevent an unlimited increase in the data size of the correction dictionary 25 (step B6).

このような目的でのエントリの削除は、修正辞書25へのエントリの追加または修正辞書25中のエントリ変更のたびに、追加または変更したエントリを修正辞書25の先頭に移動することによってエントリの順序を管理し、修正辞書25中のエントリの数が予め定めた定数を超えた場合に、最後のエントリを削除することによって行う事ができる。あるいは、修正辞書25に登録されている複数のエントリのうち、自動修正手段24による修正において最も長い時間参照されていないエントリから順に削除するようにしても良い。また、図13に示すように、エントリごとに変更回数が管理されている場合には、変更回数が最も少ないエントリを削除するようにもできる。   The entry deletion for such a purpose is performed by moving the added or changed entry to the head of the correction dictionary 25 every time an entry is added to the correction dictionary 25 or an entry in the correction dictionary 25 is changed. If the number of entries in the correction dictionary 25 exceeds a predetermined constant, this can be done by deleting the last entry. Alternatively, among a plurality of entries registered in the correction dictionary 25, entries that have not been referred to for the longest time in correction by the automatic correction means 24 may be deleted in order. Also, as shown in FIG. 13, when the number of changes is managed for each entry, the entry with the smallest number of changes can be deleted.

また、手動修正手段26において、図14のように自動修正手段24で修正された文字の認識結果の表示色や字体、文字画像の表示色や背景色等、表示形態を通常とは変えて表示し、オペレータが修正に用いられた修正辞書25のエントリを編集するようにすることもできる。   Further, the manual correction means 26 displays the display form such as the display color and font of the recognition result of the character corrected by the automatic correction means 24 as shown in FIG. The operator can edit the entry of the correction dictionary 25 used for correction.

オペレータによるエントリの修正または削除は、図14に示すように、修正画面中で自動修正された文字を選択し、キーボード15によるキー操作か、マウス等のポインティングデバイス16による選択によって、図15のようにメニューを開き、それに表示されたコマンドを選択することによって行う。図15に示す修正画面において提示されるメニューには、「1.エントリ削除」「2.修正結果変更」「3.参照画像変更」の項目が設けられている。   As shown in FIG. 14, the operator corrects or deletes an entry by selecting a character that has been automatically corrected on the correction screen, as shown in FIG. 15, by key operation using the keyboard 15 or selection using a pointing device 16 such as a mouse. Do this by opening the menu and selecting the command displayed on it. The menu presented on the correction screen shown in FIG. 15 includes items “1. Delete entry”, “2. Change correction result”, and “3. Change reference image”.

ここで、オペレータにより「1.エントリ削除」が指示された場合には、修正辞書管理手段27は、選択された文字に対応するエントリを削除する。また、修正辞書25から実際にエントリを削除するのではなく、削除済みのマークをエントリにつけ、自動修正手段24における修正処理でマークされた無視することによって、当該エントリを無効化することもできる。また、マークされたエントリを修正辞書管理手段27での削除対象から除外することによって、ユーザが拒否した修正エントリを永久的に無効化することもできる。   Here, when “1. Delete entry” is instructed by the operator, the correction dictionary management unit 27 deletes the entry corresponding to the selected character. Further, instead of actually deleting the entry from the correction dictionary 25, it is also possible to invalidate the entry by putting a deleted mark on the entry and ignoring the mark marked by the correction processing in the automatic correction means 24. Further, by removing the marked entry from the deletion target in the correction dictionary management means 27, the correction entry rejected by the user can be permanently invalidated.

また、「2.修正結果変更」が指示された場合には、修正辞書管理手段27は、キーボード15からキー入力される新しい修正結果を示す文字コードに応じて、修正辞書25の該当エントリの修正結果を変更する。また、直接キー入力するだけでなく、類似文字のリストを提示して、それらの内から選択させるようにすることもできる。   When “2. Modification Result Change” is instructed, the modification dictionary management unit 27 modifies the corresponding entry in the modification dictionary 25 according to the character code indicating the new modification result key-inputted from the keyboard 15. Change the result. In addition to direct key input, a list of similar characters can be presented and selected from them.

また、「3.参照画像変更」が指示された場合には、修正辞書管理手段27は、参照画像の編集用の画面などを提示することができる。   When “3. Reference image change” is instructed, the correction dictionary management unit 27 can present a reference image editing screen or the like.

ところで、第1実施形態の文字認識装置には、図16の機能ブロック図に示すように、認識辞書30と認識辞書管理手段32を追加した構成とすることもできる。   By the way, the character recognition apparatus of the first embodiment may be configured such that a recognition dictionary 30 and a recognition dictionary management means 32 are added as shown in the functional block diagram of FIG.

図16に示す構成では、文字認識手段23が認識辞書30を用いて文字認識処理を実行し、自動修正手段24及び手動修正手段26における修正結果を基にして、認識辞書管理手段32により認識辞書30を修正する。   In the configuration shown in FIG. 16, the character recognition unit 23 executes character recognition processing using the recognition dictionary 30, and the recognition dictionary management unit 32 recognizes the recognition dictionary based on the correction results in the automatic correction unit 24 and the manual correction unit 26. 30 is corrected.

認識辞書管理手段32における、認識辞書30の修正は、初期状態での認識辞書30の学習に用いた学習パターンと、修正が行われたパターンを全て用い再学習を定期的に行うことによってもよいし、再学習を行った場合と同様の学習結果が得られる追加学習を、認識結果の修正の度に行ってもよい。   The correction of the recognition dictionary 30 in the recognition dictionary management unit 32 may be performed by regularly performing re-learning using all of the learning pattern used for learning of the recognition dictionary 30 in the initial state and the corrected pattern. Then, additional learning for obtaining a learning result similar to that performed when relearning is performed may be performed each time the recognition result is corrected.

認識辞書管理手段32を追加した構成を、従来の単にオンラインで認識辞書30を学習する図14のような方式と比較すると、図16の点線内の自動修正手段24、修正辞書25及び修正辞書管理手段27が新設されている点が異なり、これらの手段により修正されたパターンと酷似したパターンのみの自動修正が可能となっている。   Comparing the configuration in which the recognition dictionary management means 32 is added to the conventional method of FIG. 14 in which the recognition dictionary 30 is simply learned online, the automatic correction means 24, the correction dictionary 25, and the correction dictionary management within the dotted line in FIG. The means 27 is newly provided, and only a pattern very similar to the pattern corrected by these means can be automatically corrected.

このようにして、第1実施形態の文字認識装置では、文字認識手段23による認識結果に対しては、処理対象とする文字画像が修正辞書25に登録されている参照画像と酷似している場合には、該当するエントリの修正結果の文字によって自動修正することができる。従って、画像的に酷似している文字パターン(文字画像)についての認識結果に対しては、修正辞書25のエントリによって確実に修正を施すことができる。修正辞書25のエントリについては、手動修正手段26によるオペレータからの指示に応じた最終的な認識結果についての修正に基づいて、追加、変更がされるので、オペレータによる認識結果に対する修正を、修正辞書25を通じて確実に反映させることができる。また、自動修正手段24において、過去に修正された文字と画像的に酷似した文字を自動修正することにより、画像的に酷似した文字をオペレータが繰り返し修正しなくても済むようになり作業負担を軽減できる。   Thus, in the character recognition device of the first embodiment, when the character image to be processed is very similar to the reference image registered in the correction dictionary 25 with respect to the recognition result by the character recognition means 23. Can be automatically corrected by the character of the correction result of the corresponding entry. Accordingly, the recognition result for the character pattern (character image) that is very similar in image can be surely corrected by the entry in the correction dictionary 25. The entries in the correction dictionary 25 are added and changed based on the correction of the final recognition result according to the instruction from the operator by the manual correction means 26. Therefore, the correction to the recognition result by the operator is corrected. 25 can be reliably reflected. Further, the automatic correction means 24 automatically corrects a character that is very similar to a character that has been corrected in the past, thereby eliminating the need for the operator to repeatedly correct a character that is very similar to an image. Can be reduced.

(第2実施形態)
以下、図面を参照して本発明の第2実施形態について説明する。
第2実施形態の文字認識装置は、文字認識結果に対する修正を第1実施形態のような文字単体ではなく文字群(文字列)とし、修正辞書25のエントリを文字群と対応する文字列の組として構成する。
(Second Embodiment)
The second embodiment of the present invention will be described below with reference to the drawings.
The character recognition device according to the second embodiment uses a character group (character string) as a modification to the character recognition result instead of a single character as in the first embodiment, and sets the entry in the correction dictionary 25 to a character string corresponding to the character group. Configure as.

第2実施形態の文字認識装置は、第1実施形態と同じく図2の機能ブロック図に示すようにして構成される。ただし、前処理手段21、文字抽出手段22、文字認識手段23、手動修正手段26は、第1実施形態と同じように機能し、自動修正手段24、修正辞書25、修正辞書管理手段27が第1実施形態と異なる。   The character recognition device of the second embodiment is configured as shown in the functional block diagram of FIG. 2 as in the first embodiment. However, the preprocessing unit 21, the character extraction unit 22, the character recognition unit 23, and the manual correction unit 26 function in the same manner as in the first embodiment, and the automatic correction unit 24, the correction dictionary 25, and the correction dictionary management unit 27 are the first ones. Different from one embodiment.

第2実施形態における修正辞書25(修正辞書25c)には、図17に示すように、修正されるべきパターンの代表的な画像(文字列画像)と、それに対応する修正結果の文字列の組からなるエントリが登録されている。修正結果として文字列を示すデータが記録されているところが、修正結果として文字単体を記憶している第1実施形態と異なっている。   In the correction dictionary 25 (correction dictionary 25c) in the second embodiment, as shown in FIG. 17, a set of a representative image (character string image) of a pattern to be corrected and a character string of a correction result corresponding thereto. An entry consisting of is registered. The data indicating the character string is recorded as the correction result, which is different from the first embodiment in which a single character is stored as the correction result.

次に、第2実施形態における文字認識装置の動作について、図18及び図19に示すフローチャートを参照しながら説明する。   Next, the operation of the character recognition device in the second embodiment will be described with reference to the flowcharts shown in FIGS.

なお、図18に示す第2実施形態の処理の流れは、図4に示す第1実施形態と同じであり、ステップA1〜A11がそれぞれC1〜C11に対応している。同じ処理をする部分については説明を省略し、第1実施形態と異なる処理について以下に説明する。   The processing flow of the second embodiment shown in FIG. 18 is the same as that of the first embodiment shown in FIG. 4, and steps A1 to A11 correspond to C1 to C11, respectively. Description of the same processing is omitted, and processing different from that of the first embodiment is described below.

自動修正手段24は、修正辞書25のエントリ中の参照画像が、エントリ中の修正文字列長と同文字数の文字認識手段23による文字認識処理の対象となった文字群の画像と酷似しているかを判別し(ステップC6)、酷似していると判別された場合に(ステップC6、Yes)、当該エントリの修正結果(文字列コード)で文字認識手段23からの出力を置き換えることにより、文字認識手段23からの出力を自動的に修正する(ステップC7)。   Whether the reference image in the entry of the correction dictionary 25 is very similar to the image of the character group subjected to character recognition processing by the character recognition unit 23 having the same number of characters as the corrected character string length in the entry. (Step C6), and if it is determined that they are very similar (step C6, Yes), character recognition is performed by replacing the output from the character recognition means 23 with the correction result (character string code) of the entry. The output from the means 23 is automatically corrected (step C7).

自動修正手段24による自動修正は、参照画像と認識対象とした文字群の画像とが酷似している場合に必ず行うようにしても良いし、文字認識手段23で類似度を出力している場合には、その値の平均値が予め定めた閾値より低い場合等、文字群中の類似度の組が予め定められた条件を満たしている場合にのみ行うようにしても良い。また、予め類似文字が存在する文字のリストを作っておき、そのリスト中に含まれている文字が文字群中に存在する場合のみに修正を行うようにしても良い。   The automatic correction by the automatic correction unit 24 may be performed when the reference image and the character group image to be recognized are very similar, or the character recognition unit 23 outputs the similarity. May be performed only when the set of similarity in the character group satisfies a predetermined condition, such as when the average value of the values is lower than a predetermined threshold. Alternatively, a list of characters having similar characters may be created in advance, and correction may be performed only when the characters included in the list exist in the character group.

なお、文字群の画像と参照画像が酷似しているか否かの判定方法としては、第1実施形態の自動修正手段24において用いられている方法と同じ方法を用いる。   As a method for determining whether or not the character group image and the reference image are very similar, the same method as that used in the automatic correction means 24 of the first embodiment is used.

次に、修正辞書管理手段27は、図19に示すフローチャートに従って修正辞書管理処理を実行し、自動修正手段24による認識結果に対する修正に基づいて、修正辞書25のエントリの追加、変更、削除を行う(ステップC11)。   Next, the correction dictionary management unit 27 executes a correction dictionary management process according to the flowchart shown in FIG. 19, and adds, changes, and deletes entries in the correction dictionary 25 based on the correction to the recognition result by the automatic correction unit 24. (Step C11).

まず、修正辞書管理手段27は、手動修正手段26で修正された文字について、当該文字と前後の文字群を併せた文字群で、その文字数が予め定められた文字数M以内であるものを列挙する(ステップD1)。例えば、M=2で、図20の文字列で文字「t」(図中、白抜き文字で表す)が修正された場合は、図21の3通りの文字群A,B,Cが列挙される。   First, the correction dictionary management unit 27 lists the characters corrected by the manual correction unit 26, the character group including the character group and the preceding and following character groups, the number of characters being within a predetermined number M of characters. (Step D1). For example, when M = 2 and the character “t” (represented by a white character in the figure) is corrected in the character string of FIG. 20, the three character groups A, B, and C of FIG. 21 are listed. The

そして、修正辞書管理手段27は、列挙された文字群の各々について、当該文字群の画像と酷似した画像と、当該修正結果の組からなるエントリがあるか否かを判定する(ステップD2)。   Then, the correction dictionary management unit 27 determines, for each of the enumerated character groups, whether or not there is an entry including a set of an image that is very similar to the image of the character group and the correction result (step D2).

修正辞書25中から上記条件を満たすエントリが見つからなかった場合は(ステップD3、Yes)、修正辞書管理手段27は、手動修正手段26で修正された文字を含む文字群の画像と、手動修正手段26により修正された文字を含む文字列(修正結果)の対からなるエントリを修正辞書25に追加する。   When no entry satisfying the above condition is found in the correction dictionary 25 (step D3, Yes), the correction dictionary management unit 27 includes a character group image including characters corrected by the manual correction unit 26, and a manual correction unit. An entry made up of a pair of character strings (correction results) including the characters corrected by 26 is added to the correction dictionary 25.

また、修正時書中のエントリの変更は、修正辞書25中から上記条件を満たすエントリが見つかった場合、または自動修正手段24で当該エントリが用いられた場合に行う。参照画像の変更と修正辞書25エントリの削除は、第1実施形態における方法と同じ方法で行われる(ステップD3、ステップD5)。   Further, the entry in the correction timeline is changed when an entry satisfying the above condition is found in the correction dictionary 25 or when the entry is used by the automatic correction means 24. The change of the reference image and the deletion of the modified dictionary 25 entry are performed by the same method as in the first embodiment (step D3, step D5).

また、文字認識手段23において、認識辞書30を用いている場合は、自動修正手段24及び手動修正手段26における修正結果を基にして認識辞書30を修正する認識辞書管理手段32を追加した図16に示す構成にしてもよい点は、第1実施形態と同様である。   Further, in the case where the recognition dictionary 30 is used in the character recognition means 23, a recognition dictionary management means 32 for correcting the recognition dictionary 30 based on the correction results in the automatic correction means 24 and the manual correction means 26 is added. The points that may be configured as described above are the same as in the first embodiment.

このようにして、第2実施形態では、自動修正手段24における修正の単位を文字単体でなく文字群(文字列)とし、修正辞書25のエントリを文字群と対応する文字列の組として管理することができる。自動修正の単位として複数文字からなる文字列を許容することによって、文字単位では画像的に酷似した文字についても、近接した文字のパターンの違いによって自動修正の結果を変えることができる。   Thus, in the second embodiment, the correction unit in the automatic correction means 24 is not a single character but a character group (character string), and the entry in the correction dictionary 25 is managed as a set of character strings corresponding to the character group. be able to. By allowing a character string made up of a plurality of characters as a unit for automatic correction, the result of automatic correction can be changed depending on the pattern of adjacent characters even for characters that are very similar in terms of characters.

(第3実施形態)
以下、図面を参照して本発明の第3実施形態を説明する。
図22は第3実施形態における文字認識装置の構成を表すブロック図である。
第3実施形態の文字認識装置は、文字認識手段23と自動修正手段24の間に単語修正手段40を設けている。単語修正手段40は、単語辞書42中の単語と類似した文字列を認識結果中から検索し、単語と類似した文字列の、単語との不一致部分を単語の当該部分で置き換えることによって認識結果を修正する。単語修正手段40を設けることで、修正辞書管理手段27は、修正辞書25に対するエントリの追加及び変更を、手動修正手段26において修正された文字についてのみではなく、単語修正手段40で修正された文字についても行う。
(Third embodiment)
The third embodiment of the present invention will be described below with reference to the drawings.
FIG. 22 is a block diagram showing the configuration of the character recognition device in the third embodiment.
In the character recognition device of the third embodiment, a word correction unit 40 is provided between the character recognition unit 23 and the automatic correction unit 24. The word correcting means 40 searches the recognition result for a character string similar to the word in the word dictionary 42, and replaces the mismatched portion with the word in the character string similar to the word with the corresponding portion of the word. Correct it. By providing the word correction means 40, the correction dictionary management means 27 adds and changes entries to the correction dictionary 25 not only for characters corrected by the manual correction means 26 but also for characters corrected by the word correction means 40. Also do about.

なお、図22において、前処理手段21、文字抽出手段22、文字認識手段23、手動修正手段26は第2実施形態と同じように機能し、認識対象の文書に含まれると期待される単語が登録された単語辞書42と、単語辞書42を用いて文字認識手段23の認識結果を修正する単語修正手段40が追加されている点で第2実施形態と異なっている。第3実施形態では、自動修正手段24における修正が文字認識手段23の処理結果ではなく単語修正手段40の処理結果に対して行い、また修正辞書管理手段27において単語修正手段40における修正の情報も用いる。   In FIG. 22, the preprocessing means 21, the character extraction means 22, the character recognition means 23, and the manual correction means 26 function in the same way as in the second embodiment, and words expected to be included in the recognition target document are shown. The second embodiment is different from the second embodiment in that a registered word dictionary 42 and word correction means 40 for correcting the recognition result of the character recognition means 23 using the word dictionary 42 are added. In the third embodiment, the correction by the automatic correction unit 24 is performed not on the processing result of the character recognition unit 23 but on the processing result of the word correction unit 40, and the correction dictionary management unit 27 also includes information on the correction in the word correction unit 40. Use.

単語辞書42には認識対象の文書に含まれると期待される単語が格納されており、例えば、日本語の文章が認識対象である場合は国語辞書が、英語の文章が認識対象である場合は英語の単語辞書42が格納される。   The word dictionary 42 stores words that are expected to be included in the document to be recognized. For example, when a Japanese sentence is a recognition target, a Japanese language dictionary is used, and when an English sentence is a recognition target, An English word dictionary 42 is stored.

次に、第3実施形態における文字認識装置の動作について、図23に示すフローチャートを参照しながら説明する。   Next, the operation of the character recognition device in the third embodiment will be described with reference to the flowchart shown in FIG.

なお、図23に示す第3実施形態の処理の流れは、図18に示す第2実施形態とほぼ同じであり、ステップC1〜C4,C5〜C11がそれぞれE1〜E4,E6〜E12に対応している。同じ処理をする部分については説明を省略し、第2実施形態と異なる処理について以下に説明する。 The process flow of the third embodiment shown in FIG. 23 is substantially the same as that of the second embodiment shown in FIG. 18, and steps C1 to C4 and C5 to C11 correspond to E1 to E4 and E6 to E12, respectively. ing. Description of the same processing is omitted, and processing different from that of the second embodiment is described below.

単語修正手段40は、動的計画法等により文字認識手段23の処理結果の文字列中から、単語辞書42中の単語文字列と類似した文字列が、単語文字列と文字数が等しく、不一致文字数が単語長毎に予め定められた定数以下である文字列検索し、当該文字列とそれに対応する単語及びその位置を特定する。上記条件を満たす文字列が見つかり、当該文字列と単語に不一致文字がある場合は、不一致部分の文字を単語の当該部分の文字で置き換えることにより、認識結果の修正を行う(ステップE5)。 The word correction means 40 uses a dynamic programming method or the like to make a character string similar to the word character string in the word dictionary 42 out of the character string as a result of processing by the character recognition means 23, the number of characters not equal to the word character string. Is searched for a character string that is equal to or less than a predetermined constant for each word length, and the character string, the corresponding word, and its position are specified . When a character string satisfying the above conditions is found and there is a mismatched character in the character string and the word, the recognition result is corrected by replacing the character in the mismatched portion with the character in the corresponding portion of the word (step E5).

修正辞書管理手段27による修正辞書25に対するエントリの追加及び変更の方法は、基本的には第2実施形態と同じようにして実行される(図19)。   The method of adding and changing entries to the correction dictionary 25 by the correction dictionary management means 27 is basically executed in the same manner as in the second embodiment (FIG. 19).

ただし、第3実施形態の修正辞書管理手段27は、エントリの追加及び変更を、手動修正手段26で修正された文字についてのみではなく、単語修正手段40において修正された文字についても行う。   However, the correction dictionary management means 27 of the third embodiment performs addition and change of entries not only for characters corrected by the manual correction means 26 but also for characters corrected by the word correction means 40.

すなわち、図19に示すフローチャートのステップD1,D4において、手動修正された文字だけでなく、単語修正された文字列(文字群)を対象として、同様に処理を実行する。   That is, in steps D1 and D4 of the flowchart shown in FIG. 19, not only the manually corrected characters but also the word corrected character strings (character groups) are processed in the same manner.

また、文字認識手段23において、認識辞書30を用いている場合は、自動修正手段24及び手動修正手段26における修正結果を基にして認識辞書30を修正する認識辞書管理手段32を追加してもよい点は、第1実施形態と同じである。   If the recognition dictionary 30 is used in the character recognition means 23, a recognition dictionary management means 32 for correcting the recognition dictionary 30 based on the correction results in the automatic correction means 24 and the manual correction means 26 may be added. The good point is the same as in the first embodiment.

このようにして、第3実施形態では、単語修正手段40による修正で追加されたエントリにより、単語辞書42中の単語のみならず、単語辞書中の単語の部分文字列についても修正が行われるため、ただ単に単語修正手段40で修正を行った場合よりもオペレータによる修正回数を減らして作業負担を軽減することができる。 In this way, in the third embodiment, not only the words in the word dictionary 42 but also the partial character strings of the words in the word dictionary are corrected by the entry added by the correction by the word correcting means 40. The number of corrections by the operator can be reduced and the work load can be reduced as compared with the case where correction is simply performed by the word correction means 40.

なお、本発明は、前述した実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、前述した実施形態で実行される機能は可能な限り適宜組み合わせて実施しても良い。前述した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜の組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件から幾つかの構成要件が削除されても、効果が得られるので有れば、この構成要件が削除された構成が発明として抽出され得る。   In addition, this invention is not limited to embodiment mentioned above, In the implementation stage, it can change variously in the range which does not deviate from the summary. Further, the functions executed in the above-described embodiments may be combined as appropriate as possible. The above-described embodiments include various stages of the invention, and various inventions can be extracted by appropriately combining a plurality of disclosed constituent elements. For example, even if several constituent requirements are deleted from all the constituent requirements shown in the embodiment, an effect can be obtained, so that a configuration from which the constituent requirements are deleted can be extracted as an invention.

また、前述した各実施形態において記載した処理は、コンピュータに実行させることのできる文字認識プログラムとして、例えば磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記録媒体に書き込んで各種装置に提供することができる。また、通信媒体により伝送して各種装置に提供することも可能である。文字認識装置を実現するコンピュータは、記録媒体に記録された文字認識プログラムを読み込み、または通信媒体を介して文字認識プログラムを受信し、このプログラムによって動作が制御されることにより、上述した処理を実行する。   The processing described in each of the embodiments described above is a character recognition program that can be executed by a computer, such as a magnetic disk (flexible disk, hard disk, etc.), an optical disk (CD-ROM, DVD, etc.), and a semiconductor memory. It can be written on a recording medium and provided to various apparatuses. It is also possible to transmit to a variety of devices by transmitting via a communication medium. The computer that implements the character recognition device reads the character recognition program recorded on the recording medium or receives the character recognition program via the communication medium, and the operation is controlled by the program to execute the above-described processing. To do.

本発明の実施の形態における文字認識装置を実現するシステムの構成を示すブロック図。The block diagram which shows the structure of the system which implement | achieves the character recognition apparatus in embodiment of this invention. 図1に示すシステムによって実現される第1実施形態における文字認識装置の機能構成を示すブロック図。The block diagram which shows the function structure of the character recognition apparatus in 1st Embodiment implement | achieved by the system shown in FIG. 第1実施形態における修正辞書25に登録されるエントリの一例を示す図。The figure which shows an example of the entry registered into the correction dictionary 25 in 1st Embodiment. 第1実施形態における文字認識装置の動作(文字認識処理)について説明するためのフローチャート。The flowchart for demonstrating operation | movement (character recognition process) of the character recognition apparatus in 1st Embodiment. 第1実施形態における文字認識装置の動作(修正辞書管理処理)について説明するためのフローチャート。The flowchart for demonstrating operation | movement (correction dictionary management process) of the character recognition apparatus in 1st Embodiment. 第1実施形態における文字画像と参照画像の不一致を表す値を求めるための画像の重ね合わせを説明するための図。The figure for demonstrating the superimposition of the image for calculating | requiring the value showing the mismatch of the character image and reference image in 1st Embodiment. 第1実施形態における文字画像と参照画像の不一致を表す値を求めるための画像の重ね合わせを説明するための図。The figure for demonstrating the superimposition of the image for calculating | requiring the value showing the mismatch of the character image and reference image in 1st Embodiment. 第1実施形態における文字画像と参照画像の不一致を表す値を求めるための画像の重ね合わせを説明するための図。The figure for demonstrating the superimposition of the image for calculating | requiring the value showing the mismatch of the character image and reference image in 1st Embodiment. 第1実施形態における文字画像と参照画像の不一致を表す値を求めるための画像の重ね合わせを説明するための図。The figure for demonstrating the superimposition of the image for calculating | requiring the value showing the mismatch of the character image and reference image in 1st Embodiment. 第1実施形態における認識結果と文字画像の提示方法(表示画面)の一例を示す図。The figure which shows an example of the presentation method (display screen) of the recognition result and character image in 1st Embodiment. 第1実施形態における認識結果と文字画像の提示方法(表示画面)の一例を示す図。The figure which shows an example of the presentation method (display screen) of the recognition result and character image in 1st Embodiment. 第1実施形態における認識結果と文字画像の提示方法(表示画面)の一例を示す図。The figure which shows an example of the presentation method (display screen) of the recognition result and character image in 1st Embodiment. 第1実施形態における参照画像変更回数のカウンタを備えた修正辞書25のエントリの一例を示す図。The figure which shows an example of the entry of the correction dictionary 25 provided with the counter of the reference image change frequency in 1st Embodiment. 第1実施形態における修正辞書25のエントリを編集するための修正画面の一例を示す図。The figure which shows an example of the correction screen for editing the entry of the correction dictionary 25 in 1st Embodiment. 第1実施形態における修正辞書25のエントリを編集するための修正画面の一例を示す図。The figure which shows an example of the correction screen for editing the entry of the correction dictionary 25 in 1st Embodiment. 第1実施形態における認識辞書30と認識辞書管理手段32を追加した機能構成を示すブロック図。The block diagram which shows the function structure which added the recognition dictionary 30 and the recognition dictionary management means 32 in 1st Embodiment. 第2実施形態における修正辞書25のエントリの一例を示す図。The figure which shows an example of the entry of the correction dictionary 25 in 2nd Embodiment. 第2実施形態における文字認識装置の動作(文字認識処理)について説明するためのフローチャート。The flowchart for demonstrating operation | movement (character recognition process) of the character recognition apparatus in 2nd Embodiment. 第2実施形態における文字認識装置の動作(修正辞書管理処理)について説明するためのフローチャート。The flowchart for demonstrating operation | movement (correction dictionary management process) of the character recognition apparatus in 2nd Embodiment. 第2実施形態における修正された文字列の一例を示す図。The figure which shows an example of the corrected character string in 2nd Embodiment. 図20に示す修正文字に対して列挙される文字群の一例を示す図。The figure which shows an example of the character group enumerated with respect to the correction character shown in FIG. 第3実施形態における文字認識装置の機能構成を示すブロック図。The block diagram which shows the function structure of the character recognition apparatus in 3rd Embodiment. 第3実施形態における文字認識装置の動作(文字認識処理)について説明するためのフローチャート。The flowchart for demonstrating operation | movement (character recognition process) of the character recognition apparatus in 3rd Embodiment.

符号の説明Explanation of symbols

10…CPU、12…メモリ、12a…文字認識プログラム、12b…原画像データ、12c…修正辞書データ、12d…文字認識結果データ、14…ディスプレイ、15…キーボード、16…ポインティングデバイス、17…スキャナ、18…記憶装置、19…プリンタ、20…原画像、21…前処理手段、22…文字抽出手段、23…文字認識手段、24…自動修正手段、25…修正辞書、26…手動修正手段、27…修正辞書管理手段、28…認識結果、30…認識辞書、32…認識辞書管理手段、40…単語修正手段、42…単語辞書。   DESCRIPTION OF SYMBOLS 10 ... CPU, 12 ... Memory, 12a ... Character recognition program, 12b ... Original image data, 12c ... Correction dictionary data, 12d ... Character recognition result data, 14 ... Display, 15 ... Keyboard, 16 ... Pointing device, 17 ... Scanner, DESCRIPTION OF SYMBOLS 18 ... Memory | storage device, 19 ... Printer, 20 ... Original image, 21 ... Pre-processing means, 22 ... Character extraction means, 23 ... Character recognition means, 24 ... Automatic correction means, 25 ... Correction dictionary, 26 ... Manual correction means, 27 ... correction dictionary management means, 28 ... recognition result, 30 ... recognition dictionary, 32 ... recognition dictionary management means, 40 ... word correction means, 42 ... word dictionary.

Claims (10)

第1の文字画像を認識して認識結果とする第1の文字を出力する文字認識手段と、
第2の文字画像と前記第2の文字画像に対応する第2の文字を特定するデータの対からなるエントリが記録される修正辞書と、
前記第1の文字画像と前記第2の文字画像とを重ね合わせ、それぞれの画素の画素値の比較により前記第1の文字画像と前記第2の文字画像とが酷似しているか否かを判別する判別手段と、
前記判別手段によって前記第1の文字画像と前記第2の文字画像とが酷似していると判別された場合に、前記文字認識手段により出力された認識結果とする第1の文字を、前記第2の文字画像と対となる前記文字を特定するデータが示す前記第2の文字に修正する第1の文字修正手段と、
前記第1の文字修正手段により修正された前記第2の文字を手動修正の対象として提示する提示手段と、
前記提示手段により提示された前記第2の文字を修正するための第3の文字を手動修正操作により入力する入力手段と、
前記提示手段により提示された前記第2の文字を、前記入力手段により入力された前記第3の文字に修正する第2の文字修正手段と、
前記第2の文字修正手段によって修正された第3の文字を特定するデータが前記修正辞書に記録されていない場合に、前記第1の文字画像と前記第3の文字を特定するデータの対からなるエントリを前記修正辞書に追加する修正辞書管理手段と
を具備したことを特徴とする文字認識装置。
Character recognition means for recognizing a first character image and outputting a first character as a recognition result;
A modified dictionary in which an entry including a pair of data specifying a second character image and a second character corresponding to the second character image is recorded;
The first character image and the second character image are overlapped, and it is determined whether or not the first character image and the second character image are very similar by comparing pixel values of respective pixels. Discriminating means to perform,
When it is determined by the determining means that the first character image and the second character image are very similar, the first character as the recognition result output by the character recognizing means is the first character. a first character modification means for modifying the second letter indicating the data specifying the second character image and paired the character,
Presenting means for presenting the second character corrected by the first character correcting means as an object of manual correction;
Input means for inputting a third character for correcting the second character presented by the presenting means by a manual correction operation;
A second character modifying means for modifying the second character presented by the presenting means, the third characters input by said input means,
When the data for specifying the third character corrected by the second character correcting means is not recorded in the correction dictionary, the first character image and the data for specifying the third character are And a correction dictionary managing means for adding the entry to the correction dictionary .
前記判別手段は、
前記第1の文字画像と前記第2の文字画像の画素値をもとに不一致の程度を表す値を算出し、この値が予め定めた閾値を超えていない場合に、前記第1の文字画像と前記第2の文字画像とが酷似していると判別することを特徴とする請求項1記載の文字認識装置。
The discrimination means includes
A value representing a degree of mismatch is calculated based on pixel values of the first character image and the second character image, and the first character image is determined when the value does not exceed a predetermined threshold value. The character recognition apparatus according to claim 1, wherein it is determined that the second character image is very similar to the second character image.
前記修正辞書管理手段は、
前記第2の文字修正手段によって修正された第3の文字を特定するデータが前記修正辞書に記録されている場合に、前記第3の文字を特定するデータの対となる前記第2の画像を前記第1の画像をもとに変更することを特徴とする請求項1記載の文字認識装置。
The correction dictionary management means includes
When data specifying the third character corrected by the second character correcting means is recorded in the correction dictionary, the second image that is a pair of data specifying the third character is The character recognition device according to claim 1, wherein the character recognition device is changed based on the first image.
前記修正辞書管理手段は、
前記第1の画像と前記第2の画像とを重ね合わせて、画素ごとに画素値の平均値を算出し、この平均値を前記第2の画像の変更後の画素値とすることを特徴とする請求項4記載の文字認識装置。
The correction dictionary management means includes
The first image and the second image are overlapped to calculate an average value of pixel values for each pixel, and the average value is used as a pixel value after the change of the second image. The character recognition device according to claim 4.
前記修正辞書にはエントリに対する前記修正辞書管理手段による変更回数を記録し、
前記修正辞書管理手段は、
前記第1の画像と前記第2の画像とを重ね合わせて、画素ごとに前記変更回数により重み付けした画素値の平均値を算出し、この平均値を前記第2の画像の変更後の画素値とすることを特徴とする請求項4記載の文字認識装置。
In the correction dictionary, the number of changes by the correction dictionary management means for the entry is recorded,
The correction dictionary management means includes
The first image and the second image are overlapped to calculate an average value of pixel values weighted by the number of changes for each pixel, and the average value is used as a pixel value after the change of the second image The character recognition device according to claim 4, wherein:
第1の文字画像を認識して認識結果とする文字を出力する文字認識手段と、
文字列画像と文字列を特定するデータの対からなるエントリが記録される修正辞書と、
複数の前記第1の文字画像と前記文字列画像とを重ね合わせ、それぞれの画素の画素値の比較により前記第1の文字画像と前記文字列画像とが酷似しているか否かを判別する判別手段と、
前記判別手段によって複数の前記第1の文字画像と前記文字列画像とが酷似していると判別された場合に、前記文字認識手段により認識結果として出力された複数の文字からなる第1の文字列を、前記文字列画像と対となる前記文字列を特定するデータが示す第2の文字列に修正する第1の文字列修正手段と、
前記第1の文字列修正手段により修正された前記第2の文字列を修正するための第3の文字を手動修正操作により入力する入力手段と、
前記第1の文字列修正手段により修正された前記第2の文字列を前記入力手段により入力された前記第3の文字を含む第3の文字列に修正する第2の文字列修正手段と、
前記第3の文字列中の前記第3の文字を含む文字群の画像と酷似した画像と、前記文字群に対応する文字列を特定するデータの対からなるエントリが前記修正辞書に登録されていない場合に、前記第3の文字を含む文字群の文字列画像と前記文字群に対応する文字列を特定するデータの対からなるエントリを前記修正辞書に追加する修正辞書管理手段と
を具備したことを特徴とする文字認識装置。
Character recognition means for recognizing the first character image and outputting a character as a recognition result;
A modified dictionary in which an entry consisting of a pair of data specifying a character string image and a character string is recorded;
Determining whether or not the first character image and the character string image are very similar by superimposing a plurality of the first character images and the character string image and comparing pixel values of the respective pixels Means,
A first character composed of a plurality of characters output as a recognition result by the character recognition unit when the determination unit determines that the plurality of first character images and the character string image are very similar. First character string correcting means for correcting a column to a second character string indicated by data specifying the character string paired with the character string image;
Input means for inputting a third character for correcting the second character string corrected by the first character string correcting means by a manual correction operation;
A second character string correcting means for correcting the third string containing the first of said said second string has been modified by the character string correcting means is input by said input means third letter,
An entry consisting of a pair of an image very similar to the image of the character group including the third character in the third character string and data specifying the character string corresponding to the character group is registered in the correction dictionary. A correction dictionary management means for adding, to the correction dictionary, an entry consisting of a character string image of the character group including the third character and a data pair specifying the character string corresponding to the character group when there is not A character recognition device.
第1の文字画像を認識して認識結果とする文字を出力する文字認識手段と、
文字列画像と文字列を特定するデータの対からなるエントリが記録される修正辞書と、
複数の文字からなる単語が登録された単語辞書と、
前記文字認識手段により出力された複数の文字からなる文字列について前記単語辞書に登録された単語をもとに修正する単語修正手段と、
前記単語修正手段によって修正の対象となった前記文字列に対応する複数の前記第1の文字画像と、前記文字列画像とを重ね合わせ、それぞれの画素の画素値の比較により複数の前記第1の文字画像と前記文字列画像とが酷似しているか否かを判別する判別手段と、
前記判別手段によって複数の前記第1の文字画像と前記文字列画像とが酷似していると判別された場合に、前記単語修正手段により修正された第1の文字列を前記文字列画像と対となる前記文字列を特定するデータが示す第2の文字列に修正する第1の文字列修正手段と、
前記第1の文字列修正手段により修正された前記第2の文字列を修正するための第3の文字を手動修正操作により入力する入力手段と、
前記第1の文字列修正手段により修正された前記第2の文字列を前記入力手段により入力された前記第3の文字を含む第3の文字列に修正する第2の文字列修正手段と、
前記第3の文字列中の前記第3の文字を含む文字群の画像と酷似した画像と、前記文字群に対応する文字列を特定するデータの対からなるエントリが前記修正辞書に登録されていない場合に、前記第3の文字を含む文字群の文字列画像と前記文字群に対応する文字列を特定するデータの対からなるエントリを前記修正辞書に追加する修正辞書管理手段と
を具備したことを特徴とする文字認識装置。
Character recognition means for recognizing the first character image and outputting a character as a recognition result;
A modified dictionary in which an entry consisting of a pair of data specifying a character string image and a character string is recorded;
A word dictionary in which words consisting of multiple characters are registered,
Word correction means for correcting a character string composed of a plurality of characters output by the character recognition means based on words registered in the word dictionary;
A plurality of the first character images corresponding to the character string to be corrected by the word correcting means are superimposed on the character string image, and a plurality of the first character images are compared by comparing pixel values of respective pixels. Determining means for determining whether or not the character image and the character string image are very similar;
When it is determined that the plurality of first character images and the character string image are very similar by the determining means, the first character string corrected by the word correcting means is compared with the character string image. First character string correcting means for correcting the second character string indicated by the data for specifying the character string ,
Input means for inputting a third character for correcting the second character string corrected by the first character string correcting means by a manual correction operation;
A second character string correcting means for correcting the third string containing the first of said said second string has been modified by the character string correcting means is input by said input means third letter,
An entry consisting of a pair of an image very similar to the image of the character group including the third character in the third character string and data specifying the character string corresponding to the character group is registered in the correction dictionary. A correction dictionary management means for adding, to the correction dictionary, an entry consisting of a character string image of the character group including the third character and a data pair specifying the character string corresponding to the character group when there is not A character recognition device.
コンピュータを、
第1の文字画像を認識して認識結果とする第1の文字を出力する文字認識手段と、
第2の文字画像と前記第2の文字画像に対応する第2の文字を特定するデータの対からなるエントリが記録される修正辞書と、
前記第1の文字画像と前記第2の文字画像とを重ね合わせ、それぞれの画素の画素値の比較により前記第1の文字画像と前記第2の文字画像とが酷似しているか否かを判別する判別手段と、
前記判別手段によって前記第1の文字画像と前記第2の文字画像とが酷似していると判別された場合に、前記文字認識手段により出力された認識結果とする第1の文字を、前記第2の文字画像と対となる前記文字を特定するデータが示す前記第2の文字に修正する第1の文字修正手段と、
前記第1の文字修正手段により修正された前記第2の文字を手動修正の対象として提示する提示手段と、
前記提示手段により提示された前記第2の文字を修正するための第3の文字を手動修正操作により入力する入力手段と、
前記提示手段により提示された前記第2の文字を、前記入力手段により入力された前記第3の文字に修正する第2の文字修正手段と、
前記第2の文字修正手段によって修正された第3の文字を特定するデータが前記修正辞書に記録されていない場合に、前記第1の文字画像と前記第3の文字を特定するデータの対からなるエントリを前記修正辞書に追加する修正辞書管理手段として機能させるための文字認識プログラム。
Computer
Character recognition means for recognizing a first character image and outputting a first character as a recognition result;
A modified dictionary in which an entry including a pair of data specifying a second character image and a second character corresponding to the second character image is recorded;
The first character image and the second character image are overlapped, and it is determined whether or not the first character image and the second character image are very similar by comparing pixel values of respective pixels. Discriminating means to perform,
When it is determined by the determining means that the first character image and the second character image are very similar, the first character as the recognition result output by the character recognizing means is the first character. a first character modification means for modifying the second letter indicating the data specifying the second character image and paired the character,
Presenting means for presenting the second character corrected by the first character correcting means as an object of manual correction;
Input means for inputting a third character for correcting the second character presented by the presenting means by a manual correction operation;
Second character correcting means for correcting the second character presented by the presenting means to the third character inputted by the input means ;
When the data for specifying the third character corrected by the second character correcting means is not recorded in the correction dictionary, the first character image and the data for specifying the third character are The character recognition program for functioning as a correction dictionary management means to add the entry to the correction dictionary .
コンピュータを、
第1の文字画像を認識して認識結果とする文字を出力する文字認識手段と、
文字列画像と文字列を特定するデータの対からなるエントリが記録される修正辞書と、
複数の前記第1の文字画像と前記文字列画像とを重ね合わせ、それぞれの画素の画素値の比較により複数の前記第1の文字画像と前記文字列画像とが酷似しているか否かを判別する判別手段と、
前記判別手段によって複数の前記第1の文字画像と前記文字列画像とが酷似していると判別された場合に、前記文字認識手段により認識結果として出力された複数の文字からなる第1の文字列を、前記文字列画像と対となる前記文字列を特定するデータが示す第2の文字列に修正する第1の文字列修正手段と、
前記第1の文字列修正手段により修正された前記第2の文字列を修正するための第3の文字を手動修正操作により入力する入力手段と、
前記第1の文字列修正手段により修正された前記第2の文字列を前記入力手段により入力された前記第3の文字を含む第3の文字列に修正する第2の文字列修正手段と、
前記第3の文字列中の前記第3の文字を含む文字群の画像と酷似した画像と、前記文字群に対応する文字列を特定するデータの対からなるエントリが前記修正辞書に登録されていない場合に、前記第3の文字を含む文字群の文字列画像と前記文字群に対応する文字列を特定するデータの対からなるエントリを前記修正辞書に追加する修正辞書管理手段として機能させるための文字認識プログラム。
Computer
Character recognition means for recognizing the first character image and outputting a character as a recognition result;
A modified dictionary in which an entry consisting of a pair of data specifying a character string image and a character string is recorded;
A plurality of the first character images and the character string image are overlapped, and a determination is made as to whether or not the plurality of first character images and the character string image are very similar by comparing pixel values of respective pixels. Discriminating means to perform,
A first character composed of a plurality of characters output as a recognition result by the character recognition unit when the determination unit determines that the plurality of first character images and the character string image are very similar. First character string correcting means for correcting a column to a second character string indicated by data specifying the character string paired with the character string image;
Input means for inputting a third character for correcting the second character string corrected by the first character string correcting means by a manual correction operation;
A second character string correcting means for correcting the third string containing the first of said said second string has been modified by the character string correcting means is input by said input means third letter,
An entry consisting of a pair of an image very similar to the image of the character group including the third character in the third character string and data specifying the character string corresponding to the character group is registered in the correction dictionary. In order to function as a correction dictionary management means for adding an entry consisting of a character string image of a character group including the third character and a data pair specifying a character string corresponding to the character group to the correction dictionary when there is not Character recognition program.
コンピュータを、
第1の文字画像を認識して認識結果とする文字を出力する文字認識手段と、
文字列画像と文字列を特定するデータの対からなるエントリが記録される修正辞書と、
複数の文字からなる単語が登録された単語辞書と、
前記文字認識手段により出力された複数の文字からなる文字列について前記単語辞書に登録された単語をもとに修正する単語修正手段と、
前記単語修正手段によって修正の対象となった前記文字列に対応する複数の前記第1の文字画像と、前記文字列画像とを重ね合わせ、それぞれの画素の画素値の比較により複数の前記第1の文字画像と前記文字列画像とが酷似しているか否かを判別する判別手段と、
前記判別手段によって複数の前記第1の文字画像と前記文字列画像とが酷似していると判別された場合に、前記単語修正手段により修正された第1の文字列を前記文字列画像と対となる前記文字列を特定するデータが示す第2の文字列に修正する第1の文字列修正手段と、
前記第1の文字列修正手段により修正された前記第2の文字列を修正するための第3の文字を手動修正操作により入力する入力手段と、
前記第1の文字列修正手段により修正された前記第2の文字列を前記入力手段により入力された第3の文字を含む第3の文字列に修正する第2の文字列修正手段と、
前記第3の文字列中の前記第3の文字を含む文字群の画像と酷似した画像と、前記文字群に対応する文字列を特定するデータの対からなるエントリが前記修正辞書に登録されていない場合に、前記第3の文字を含む文字群の文字列画像と前記文字群に対応する文字列を特定するデータの対からなるエントリを前記修正辞書に追加する修正辞書管理手段として機能させるための文字認識プログラム。
Computer
Character recognition means for recognizing the first character image and outputting a character as a recognition result;
A modified dictionary in which an entry consisting of a pair of data specifying a character string image and a character string is recorded;
A word dictionary in which words consisting of multiple characters are registered,
Word correction means for correcting a character string composed of a plurality of characters output by the character recognition means based on words registered in the word dictionary;
A plurality of the first character images corresponding to the character string to be corrected by the word correcting means are superimposed on the character string image, and a plurality of the first character images are compared by comparing pixel values of respective pixels. Determining means for determining whether or not the character image and the character string image are very similar;
When it is determined that the plurality of first character images and the character string image are very similar by the determining means, the first character string corrected by the word correcting means is compared with the character string image. First character string correcting means for correcting the second character string indicated by the data for specifying the character string ,
Input means for inputting a third character for correcting the second character string corrected by the first character string correcting means by a manual correction operation;
A second string modifying means for modifying the second character string that has been modified to a third string including the third characters input by said input means by the first character string correcting means,
An entry consisting of a pair of an image very similar to the image of the character group including the third character in the third character string and data specifying the character string corresponding to the character group is registered in the correction dictionary. In order to function as a correction dictionary management means for adding an entry consisting of a character string image of a character group including the third character and a data pair specifying a character string corresponding to the character group to the correction dictionary when there is not Character recognition program.
JP2003306790A 2003-08-29 2003-08-29 Character recognition device, character recognition program Expired - Lifetime JP3930466B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003306790A JP3930466B2 (en) 2003-08-29 2003-08-29 Character recognition device, character recognition program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003306790A JP3930466B2 (en) 2003-08-29 2003-08-29 Character recognition device, character recognition program

Publications (2)

Publication Number Publication Date
JP2005078287A JP2005078287A (en) 2005-03-24
JP3930466B2 true JP3930466B2 (en) 2007-06-13

Family

ID=34409777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003306790A Expired - Lifetime JP3930466B2 (en) 2003-08-29 2003-08-29 Character recognition device, character recognition program

Country Status (1)

Country Link
JP (1) JP3930466B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5952776B2 (en) * 2013-05-24 2016-07-13 富士通フロンテック株式会社 Character recognition device, character recognition method, and character recognition program
WO2015178066A1 (en) * 2014-05-22 2015-11-26 ソニー株式会社 Information processing device and information processing method
JP2017151793A (en) * 2016-02-25 2017-08-31 沖電気工業株式会社 Image segmentation device, image segmentation method, and image segmentation processing program
JP6857983B2 (en) * 2016-08-25 2021-04-14 Jcc株式会社 Metadata generation system

Also Published As

Publication number Publication date
JP2005078287A (en) 2005-03-24

Similar Documents

Publication Publication Date Title
US8015203B2 (en) Document recognizing apparatus and method
KR100412317B1 (en) Character recognizing/correcting system
JP4347677B2 (en) Form OCR program, method and apparatus
US8908971B2 (en) Devices, systems and methods for transcription suggestions and completions
US20210149931A1 (en) Scalable form matching
JP2000293626A (en) Method and device for recognizing character and storage medium
CN115311666A (en) Image-text recognition method and device, computer equipment and storage medium
US10217020B1 (en) Method and system for identifying multiple strings in an image based upon positions of model strings relative to one another
JP3930466B2 (en) Character recognition device, character recognition program
JP2003242441A (en) Document processing method, apparatus and program
JP5357711B2 (en) Document processing device
US20220207900A1 (en) Information processing apparatus, information processing method, and storage medium
US20220398399A1 (en) Optical character recognition systems and methods for personal data extraction
Kumar et al. Line based robust script identification for indianlanguages
US11335108B2 (en) System and method to recognise characters from an image
JP2001022883A (en) Character recognizing system and recording medium for realizing function for the same
JP4517822B2 (en) Image processing apparatus and program
JP7512630B2 (en) System for recognizing cursive characters, method for recognizing cursive characters, method for creating data set, and program
JP2001236467A (en) Method and device for pattern recognition, and recording medium with pattern recognition program recorded thereon
JPH1185899A (en) Character reader, its method and record medium
US20240062567A1 (en) Learning Image Generation Apparatus, Learning Image Generation Method, And Non-Transitory Computer-Readable Recording Medium
JP4633271B2 (en) Dictionary learning method and dictionary learning program
JP4081074B2 (en) Form processing apparatus, form processing method, and form processing program
JP2002207960A (en) Method and program for recognized character correction
JP2003099709A (en) Misread character correction method and optical character recognition device

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070306

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070308

R151 Written notification of patent or utility model registration

Ref document number: 3930466

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100316

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110316

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120316

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130316

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140316

Year of fee payment: 7

EXPY Cancellation because of completion of term