JPH05114052A - Method and device for recognizing character - Google Patents

Method and device for recognizing character

Info

Publication number
JPH05114052A
JPH05114052A JP3275116A JP27511691A JPH05114052A JP H05114052 A JPH05114052 A JP H05114052A JP 3275116 A JP3275116 A JP 3275116A JP 27511691 A JP27511691 A JP 27511691A JP H05114052 A JPH05114052 A JP H05114052A
Authority
JP
Japan
Prior art keywords
character
recognition
numeral
characters
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3275116A
Other languages
Japanese (ja)
Inventor
Hiroaki Ikeda
裕章 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP3275116A priority Critical patent/JPH05114052A/en
Publication of JPH05114052A publication Critical patent/JPH05114052A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To automatically correct the misrecognition of numerals. CONSTITUTION:Each character written in an image original read out from an image input part 101 is segmented and recognized and plural candidate characters are outputted. While referring to a numeral table 110, a numeral collating part 109 retrieves whether a numeral is included in the candicate characters or not. When a numeral is included in the candidate characters before or after the retrieved numeral, a numeral correcting part 111 corrects the numeral to the 1st candidate character for character recognition. The above processing is repeated up to the finally inputted character.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は文字認識方法及びその装
置に関し、特に、誤認識の自動修正機能を備えた文字認
識方法及びその装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition method and an apparatus thereof, and more particularly to a character recognition method and an apparatus thereof having an automatic recognition error correction function.

【0002】[0002]

【従来の技術】従来、文字認識装置は入力文字画像の特
徴を抽出し、予め用意された個々の標準パターン文字の
特徴との類似度を計算し、類似度が最大となる文字を認
識結果として出力している。さらに、このような文字認
識の精度を向上させるため、認識結果を単語毎に区切
り、予め用意された単語辞書と照合し、単語の一部の文
字を他の文字に置換することで、単語辞書内の単語と一
致する場合に認識結果の置換を行ない誤認識を自動修正
する方法が知られている。
2. Description of the Related Art Conventionally, a character recognition device extracts the characteristics of an input character image, calculates the degree of similarity with the characteristics of individual standard pattern characters prepared in advance, and determines the character with the highest degree of similarity as the recognition result. It is outputting. In addition, in order to improve the accuracy of such character recognition, the recognition result is divided into words, collated with a prepared word dictionary, and some characters of the word are replaced with other characters to create a word dictionary. There is a known method for automatically correcting erroneous recognition by replacing the recognition result when it matches a word in.

【0003】[0003]

【発明が解決しようとする課題】しかしながら上記従来
例では、自動修正は単語辞書との照合によって行なわれ
るため、2字以上で構成される単語単位でしか修正する
ことができない。従って、『私の生年月日は1940年
8月21日です』というような文章を認識させた時に、
例えば『私の生年月日は194O(アルファベットのオ
ー)年8月2l(アルファベットのエル)日です』とい
うように数字が類似文字に誤認識されても自動修正はさ
れず、誤ったままであるという欠点があった。
However, in the above-mentioned conventional example, since the automatic correction is performed by collating with the word dictionary, it can be corrected only in units of words composed of two or more characters. Therefore, when you recognize a sentence such as "My date of birth is August 21, 1940",
For example, "My date of birth is August 2l (O of the alphabet) August 2l (L of the alphabet)", even if a number is mistakenly recognized as a similar character, it is not automatically corrected and remains incorrect. There was a flaw.

【0004】本発明は上記従来例に鑑みてなされたもの
で、数字の誤認識を自動的に修正することが可能な文字
認識方法及びその装置を提供することを目的としてい
る。
The present invention has been made in view of the above-mentioned conventional example, and an object thereof is to provide a character recognition method and an apparatus therefor capable of automatically correcting erroneous recognition of numbers.

【0005】[0005]

【課題を解決するための手段】上記目的を達成するため
に本発明の文字認識方法は、以下のような工程からな
る。即ち、文字を描いた画像原稿を入力して前記画像原
稿に描かれた文字を認識する文字認識方法であって、前
記画像原稿する入力工程と、前記画像原稿に描かれた文
字を一文字つづ切り出して文字認識を行い、複数の認識
候補文字を出力する認識工程と、前記認識工程によって
認識された文字の中から数詞を検索する検索工程と、前
記検索工程によって数詞が検索された場合、該数詞の前
後に存在する複数の認識候補文字に数字が含まれている
かどうかを調べ、数字が含まれている場合には該数字を
前記複数の認識候補文字の最有力候補とするよう修正す
る修正工程とを有することを特徴とする文字認識方法を
備える。
In order to achieve the above object, the character recognition method of the present invention comprises the following steps. That is, a character recognition method for recognizing a character drawn on the image original by inputting an image original on which characters are drawn, the input step of the image original, and the characters drawn on the image original are cut out one by one. Recognition step of performing character recognition by outputting a plurality of recognition candidate characters, a retrieval step of retrieving a number from the characters recognized by the recognition step, and a number when the number is retrieved by the retrieval step. A correction step of checking whether or not a plurality of recognition candidate characters existing before and after include a number, and if the number is included, correcting the number to be the most probable candidate of the plurality of recognition candidate characters. And a character recognition method comprising:

【0006】また他の発明によれば、文字を描いた画像
原稿を入力して前記画像原稿に描かれた文字を認識する
文字認識装置であって、前記画像原稿する入力手段と、
前記画像原稿に描かれた文字を一文字つづ切り出して文
字認識を行い、複数の認識候補文字を出力する認識手段
と、複数の数詞を格納する記憶手段と、前記記憶手段に
格納された前記複数の数詞を参照して、前記認識手段に
よって認識された文字の中から数詞を検索する検索手段
と、前記数詞の前後に存在する複数の認識候補文字に数
字が含まれているかどうかを調べ、数字が含まれている
場合には該数字を前記複数の認識候補文字の最有力候補
とするよう修正する修正手段とを有することを特徴とす
る文字認識装置を備える。
According to another aspect of the invention, there is provided a character recognition device for recognizing a character drawn on the image original by inputting the image original on which the character is drawn, the input means for inputting the image original,
The characters drawn on the image original are cut out one by one to perform character recognition, a recognition means for outputting a plurality of recognition candidate characters, a storage means for storing a plurality of numbers, and a plurality of the plurality of storage means stored in the storage means. With reference to a numeral, a search means for searching a numeral from the characters recognized by the recognition means and a check to see whether or not a plurality of recognition candidate characters existing before and after the numeral include a numeral, When it is included, the character recognition device is provided with a correction means for correcting the numeral so as to be the most probable candidate of the plurality of recognition candidate characters.

【0007】[0007]

【作用】以上の構成により本発明は、文字認識された文
字の中から数詞を検索し、その数詞の前後の文字の複数
の認識候補文字の中に数字が含まれているかどうかを調
べ、数字が含まれている場合には、その数字を認識候補
文字の最有力候補とするよう修正するよう動作する。
With the above structure, the present invention searches for a numeral from the characters recognized as characters, checks whether or not a numeral is included in a plurality of recognition candidate characters of the characters before and after the numeral, and recognizes the numeral. If the number is included, the number is corrected so as to be the most promising candidate of the recognition candidate character.

【0008】[0008]

【実施例】以下添付図面を参照して本発明の好適な実施
例を詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT A preferred embodiment of the present invention will be described in detail below with reference to the accompanying drawings.

【0009】図1は本発明の代表的な実施例である文字
認識装置の構成を示すブロック図である。図1におい
て、1はCPU、2はプログラム等を格納するROM、
3はRAMであり、101はイメージスキャナ等の画像
入力部、102は入力画像から1文字ごとに文字画像を
切り出す文字切り出し部、103は切り出した文字画像
より特徴を抽出する特徴抽出部、104は抽出した入力
文字画像の特徴と、個々の文字の特徴等が格納された認
識辞書105との間で類似度計算を行ない、類似度の大
きいものから順にn個をRAM3に設けられた認識結果
領域106に格納する類似度計算部である。
FIG. 1 is a block diagram showing the configuration of a character recognition apparatus which is a typical embodiment of the present invention. In FIG. 1, 1 is a CPU, 2 is a ROM for storing programs,
3 is a RAM, 101 is an image input unit such as an image scanner, 102 is a character cutout unit that cuts out a character image for each character from the input image, 103 is a feature extraction unit that extracts features from the cutout character image, and 104 is a A similarity calculation is performed between the extracted features of the input character image and the recognition dictionary 105 in which the features of individual characters are stored, and the recognition result area in which n pieces are arranged in the RAM 3 in descending order of similarity. This is a similarity calculation unit to be stored in 106.

【0010】ここで、nは入力文字ごとに可変でもよ
く、nの値が1や0(認識不能)の場合も許される。こ
のn個の認識結果の類似度の高い順に第1候補文字、
…、第n候補文字と呼ことにする。また、認識結果全体
を候補文字と呼ぶ。
Here, n may be variable for each input character, and the case where the value of n is 1 or 0 (unrecognizable) is allowed. The first candidate character, in descending order of similarity of the n recognition results,
..., Let's call it the nth candidate character. The entire recognition result is called a candidate character.

【0011】107は単語辞書108を使用し認識結果
領域106に格納されている認識結果を単語単位で照合
し修正を行なう単語照合部、109は「個」「円」等数
の後に付けられる数詞を集めた数詞テーブル110との
照合を取る数詞照合部、111は数詞照合部109で照
合された数詞について、その前後にある数字の誤認識を
判断し修正する数字修正部、112は修正された認識結
果を表示するディスプレイである。また、113は数詞
テーブル110に数詞を追加・削除を可能とする数詞テ
ーブル変更部である。
Reference numeral 107 denotes a word collating unit which collates and corrects the recognition result stored in the recognition result area 106 in units of words by using the word dictionary 108, and 109 is a numeral attached after "pieces""yen" etc. Numerals collating unit for collating with the numerical table 110, 111 is a numeral correcting unit that judges and corrects the erroneous recognition of the numbers before and after the numerals matched by the numeral matching unit 109, and 112 is corrected. It is a display which displays a recognition result. Reference numeral 113 is a number table changing unit that allows addition and deletion of numbers in the number table 110.

【0012】さて公知の技術に従って、入力され一文字
づつ切り出され、その各文字について特徴が取り出され
認識辞書105を参照しながら類似度計算を行って候補
文字を得る。さらに、公知の技術に従って、単語辞書1
08を参照しながら、単語単位での修正(これを単語照
合という)を行なう。ここで修正された文字は第1候補
文字とみなされ、それまで格納されていた候補文字は順
位をずらして格納しなおす。
According to a known technique, the characters are input and cut out one by one, the characteristics of each character are extracted, the similarity is calculated with reference to the recognition dictionary 105, and candidate characters are obtained. Further, according to a known technique, the word dictionary 1
With reference to 08, correction is made in word units (this is called word matching). The character corrected here is regarded as the first candidate character, and the candidate character that has been stored until then is stored again with the rank shifted.

【0013】以上の処理が実行されたことを前提とし
て、この時点での第1候補文字について、本実施例での
最も特徴的な数詞照合の処理が実行される。以下、この
処理について、図2に示すフローチャートと図3に示す
数詞テーブルの例を用いて説明する。なおこの処理には
本実施例の文字認識装置の数詞照合部109が主要な役
割を果たす。
Assuming that the above processing has been executed, the most characteristic number matching process in this embodiment is executed for the first candidate character at this point. This processing will be described below with reference to the flowchart shown in FIG. 2 and the example of the number table shown in FIG. The numeric collation unit 109 of the character recognition apparatus of this embodiment plays a major role in this processing.

【0014】図3は数詞テーブル110に収容される情
報の例を示す図である。図3において、数詞テーブル1
10には単語等、数字の直後に付けられる数詞が含まれ
ている。
FIG. 3 is a diagram showing an example of information stored in the numeral table 110. In FIG. 3, the number table 1
Numeral 10 includes a numeral such as a word, which is added immediately after the numeral.

【0015】まずステップS10では、照合文字を第2
番目の入力文字に初期値としてセットする。数詞に先行
して必ず最低1文字分の数字が存在しなければならない
ことが、ステップS10の第2番目の入力文字をセット
する理由である。ステップS15では、照合文字を先頭
とする数詞が数詞テーブル110に存在するかどうかを
調べる。ここで、その数詞が数詞テーブル110に存在
するなら処理はステップS20に進み、数詞テーブル1
10に存在しないなら処理はステップS50に進み、照
合文字の位置を次の文字に進める。
First, in step S10, the collation character is changed to the second character.
Set as the initial value for the th input character. The reason why at least one numeric character must always exist before the numeral is the reason for setting the second input character in step S10. In step S15, it is checked whether or not there is a numeral in the numeral table 110, which has the collation character as a head. Here, if the number is in the number table 110, the process proceeds to step S20, and the number table 1
If not present, the process proceeds to step S50 to advance the position of the collation character to the next character.

【0016】ステップS20では処理の制御が数字修正
部111に移り、照合文字の1つ前の文字を注目文字と
する。続いてステップS25では、その注目文字の候補
文字に数字が存在するかどうかを調べる。ここで、その
注目文字の候補文字の内に数字が含まれている場合、処
理はステップS30に進み、その文字を第1候補とす
る。また、候補文字の内に複数の数字が含まれている場
合、順位の高い方を第1候補とする。さらに処理はステ
ップS35で注目文字を1つ前にずらし、さらにステッ
プS40でその注目文字の位置が入力文字の先頭位置よ
り前にずれていないことを確認して、ステップS25〜
S35と同様の処理を行なう。これに対して、その注目
文字の候補文字の内に数字が含まれていない場合、或
は、その注目文字位置が入力文字の先頭位置まで戻って
しまった場合には処理はステップS45に進む。この時
点で、処理の制御は数字修正部111から再び数詞照合
部109に戻る。
In step S20, the control of the processing moves to the numeral correction unit 111, and the character immediately before the collation character is set as the target character. Succeedingly, in a step S25, it is checked whether or not a numeral is present in the candidate character of the noted character. Here, if a number is included in the candidate characters of the target character, the process proceeds to step S30, and the character is set as the first candidate. Further, when a plurality of numbers are included in the candidate characters, the one having the higher rank is set as the first candidate. Further, in step S35, the noticed character is moved forward by one, and further, in step S40, it is confirmed that the position of the noticed character is not shifted before the start position of the input character, and then steps S25-
The same process as S35 is performed. On the other hand, if a number is not included in the candidate characters of the target character, or if the target character position has returned to the start position of the input character, the process proceeds to step S45. At this point, control of the process returns from the number correcting unit 111 to the number matching unit 109 again.

【0017】ステップS45では、照合文字の位置を照
合された数詞の中で、最長の文字数+1文字分だけずら
す。
In step S45, the position of the collation character is shifted by the longest character number + 1 character among the collated numerals.

【0018】最後にステップS55では、入力文字の最
後の照合が終了したかどうかを調べる。ここで、照合が
最後の入力文字で至っていないと判断された場合には処
理はステップS15に戻って照合処理を継続し、入力文
字の最後の照合が終了したと判断された場合には処理を
終了する。
Finally, in step S55, it is checked whether or not the last collation of the input character is completed. Here, if it is determined that the collation has not reached by the last input character, the process returns to step S15 to continue the collation process, and if it is determined that the last collation of the input character is completed, the process is terminated. finish.

【0019】以上のような数詞照合の処理を実行するこ
とによって、例えば、『私の生年月日は194O(オ
ー)年8月2l(エル)日です』という文字列が第1候
補として得られたとき、照合文字位置が『年』にあると
きに数字修正が行われる。ここでは、注目文字が『O
(オー)』にセットされ、候補文字内に『0(ゼロ)』
が存在すれば、第1候補文字を『0(ゼロ)』に変更す
る。次いで、注目文字を『4』にずらす。この場合、第
1候補文字にすでに数字があるので、注目文字は更に前
に移動し、『は』に来た時点で候補文字内に数字が存在
しなくなったとすれば、その時点で修正処理は終了し、
再び照合処理を実行する。以下、同様にして『月』、
『日』で照合処理を行い、特に、注目文字が『l(エ
ル)』となった時点で文字候補内に『1(いち)』が存
在すればこれを第1候補文字に変更する。照合がすべて
終了したら、ディスプレイ112にその結果を表示す
る。
By executing the above-described number matching process, for example, a character string "My date of birth is August 2l (L) August 194O" is obtained as the first candidate. When the collation character position is "Year", the numerical correction is performed. Here, the character of interest is "O
(O) ”and“ 0 (zero) ”in the candidate characters
If it exists, the first candidate character is changed to “0 (zero)”. Next, the attention character is shifted to "4". In this case, since the first candidate character already has a number, the character of interest moves further forward, and if the number does not exist in the candidate character when "ha" comes, the correction process is performed at that time. Finished,
The matching process is executed again. In the same way, "Month",
The collation process is performed with "day", and particularly when "1" exists in the character candidate when the target character becomes "l", this is changed to the first candidate character. When all the matching is completed, the result is displayed on the display 112.

【0020】従って本実施例に従えば、候補文字の中に
ある数詞を検索し、その数詞の前に位置する候補文字に
数字が含まれていれば、その数字を第1候補文字に修正
することで数字の誤認識を自動的に修正することが可能
となる。
Therefore, according to the present embodiment, the numeral in the candidate character is searched, and if the candidate character located before the numeral includes a numeral, the numeral is corrected to the first candidate character. This makes it possible to automatically correct misrecognition of numbers.

【0021】[0021]

【他の実施例】ここでは、前述の実施例と共通の文字認
識装置を用いて、数詞テーブル110の構造のみが異な
る場合の数詞照合の処理について、図4に示すフローチ
ャートを参照して説明する。数詞照合の処理に至る前提
となる文字入力や候補文字を得ることなどは前述の実施
例と同様、公知の技術に従うものとし説明を省略する。
また、本実施例の数詞照合の処理において、前述の実施
例と共通の部分については共通のステップ参照番号を付
して説明を省略する。
[Other Embodiments] Here, a process of collating a number when only the structure of the number table 110 is different by using a character recognition apparatus common to the above-described embodiments will be described with reference to a flowchart shown in FIG. .. Similar to the above-described embodiment, the input of characters and the acquisition of candidate characters that are the prerequisites for the process of matching the number of words follow the known technique, and the description thereof will be omitted.
In addition, in the number matching process of the present embodiment, the same parts as those in the above-described embodiments are designated by common step reference numerals and description thereof will be omitted.

【0022】本実施例において用いる数詞テーブル11
0は、「¥」「平成」等、数字の前に付けられる数詞を
集めた数詞テーブルとする。これが本実施例の前提であ
る。まずステップS100では、照合文字を入力先頭文
字に初期値としてセットする。ステップS15の処理
で、照合文字を先頭とする数詞が数詞テーブル110よ
り探索された場合、処理はステップS120に進み、処
理制御が数字修正部111に移る。
Numeral table 11 used in this embodiment
0 is a numeric table that collects numerics such as “¥” and “Heisei” that are prepended to numbers. This is the premise of this embodiment. First, in step S100, the collation character is set to the input leading character as an initial value. In the process of step S15, when a number starting with the collation character is searched from the number table 110, the process proceeds to step S120, and the process control proceeds to the number correcting unit 111.

【0023】ステップS120では、数詞照合部109
で照合が取れた数詞の中で最長の数詞の次の文字を注目
文字とする。以下、ステップS25〜S35と同様の処
理を行なう。ここで、注目文字の文字候補内に数字が存
在しない場合、或は、ステップS140でその注目文字
位置が入力文字の最後の位置まで進んだ場合には処理は
ステップS145に進む。この時点で、処理の制御は数
字修正部111から再び数詞照合部109に戻る。
In step S120, the numeric collator 109
The character next to the longest number among the numbers that have been matched with is the character of interest. Thereafter, the same processing as steps S25 to S35 is performed. Here, if there is no number in the character candidates of the target character, or if the target character position has reached the last position of the input character in step S140, the process proceeds to step S145. At this point, control of the process returns from the number correcting unit 111 to the number matching unit 109 again.

【0024】ステップS145では、数詞修正部111
による処理の終了時点での注目文字を次の照合文字とす
る。
In step S145, the numeral correction unit 111
The character of interest at the end of the processing by is the next matching character.

【0025】従って本実施例に従えば、年号等、数字の
前に付加される数詞の情報を格納した数詞テーブル11
0を用いて数字の誤認識を自動的に修正することが可能
となる。
Therefore, according to the present embodiment, the numeral table 11 storing the information of the numeral added before the numeral such as the year number.
By using 0, it becomes possible to automatically correct the misrecognition of the numeral.

【0026】以上2つの実施例では各々、数字の前に数
詞が存在する場合、数字の後に数詞が存在する場合のつ
いての数字の誤認識における修正について説明したが、
本発明はこれらに限定されるものではない。例えば、前
述の2つの実施例を組み合わせたもの場合にも適用する
ことが可能である。
In each of the above-mentioned two embodiments, the correction in the erroneous recognition of a number when the number is present before the number and the number is after the number has been described.
The present invention is not limited to these. For example, the present invention can be applied to a combination of the above two embodiments.

【0027】さらに、数詞テーブル110に含まれてい
ない数詞のうち、装置使用者が認識させる文章中に存在
する数詞が予めわかっている場合には、数詞テーブル変
更部113により数詞テーブル110に情報を追加する
ことができる。これによって認識させる文章に固有の数
詞が存在した場合にも、自動修正が可能になる。
Further, if the number of the number which is not included in the number table 110 is known in advance in the sentence to be recognized by the device user, the number table changing unit 113 stores information in the number table 110. Can be added. This allows automatic correction even if there is a unique number in the sentence to be recognized.

【0028】尚、本発明は、複数の機器から構成される
システムに適用しても良いし、1つの機器から成る装置
に適用しても良い。また、本発明はシステム或は装置に
プログラムを供給することによって達成される場合にも
適用できることは言うまでもない。
The present invention may be applied to a system composed of a plurality of devices or an apparatus composed of one device. Further, it goes without saying that the present invention can be applied to the case where it is achieved by supplying a program to a system or an apparatus.

【0029】[0029]

【発明の効果】以上説明したように本発明によれば、認
識された文字中にある数詞を手がかりとして、その数詞
の前後に存在する数字の誤認識を自動的に修正すること
ができるので、認識精度が向上するのみならず、手動に
よる誤認識の確認・修正作業が軽減され、文書入力作業
の時間を短縮できる効果がある。
As described above, according to the present invention, the erroneous recognition of the numbers existing before and after the number can be automatically corrected by using the number in the recognized character as a clue. Not only the recognition accuracy is improved, but also the manual confirmation / correction work of erroneous recognition is reduced, and the time for document input work can be shortened.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の代表的な実施例である文字認識装置の
構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a character recognition device that is a typical embodiment of the present invention.

【図2】数詞照合処理を示すフローチャートである。FIG. 2 is a flowchart showing a number matching process.

【図3】数詞テーブル111の一例を示す図である。FIG. 3 is a diagram showing an example of a numeric table 111.

【図4】他の実施例に従う数詞照合処理を示すフローチ
ャートである。
FIG. 4 is a flowchart showing a number matching process according to another embodiment.

【符号の説明】[Explanation of symbols]

1 CPU 2 ROM 3 RAM 101 画像入力部 102 文字切り出し部 103 特徴抽出部 104 類似度計算部 105 認識辞書 106 認識結果格納領域 107 単語照合部 108 単語辞書 109 数詞照合部 110 数詞テーブル 111 数字修正部 112 ディスプレイ 113 数詞テーブル変更部 1 CPU 2 ROM 3 RAM 101 Image Input Section 102 Character Extraction Section 103 Feature Extraction Section 104 Similarity Calculation Section 105 Recognition Dictionary 106 Recognition Result Storage Area 107 Word Matching Section 108 Word Dictionary 109 Numeral Matching Section 110 Numeral Table 111 Number Modifying Section 112 Display 113 Number table change section

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 文字を描いた画像原稿を入力して前記画
像原稿に描かれた文字を認識する文字認識方法であっ
て、 前記画像原稿する入力工程と、 前記画像原稿に描かれた文字を一文字つづ切り出して文
字認識を行い、複数の認識候補文字を出力する認識工程
と、 前記認識工程によって認識された文字の中から数詞を検
索する検索工程と、 前記検索工程によって数詞が検索された場合、該数詞の
前後に存在する複数の認識候補文字に数字が含まれてい
るかどうかを調べ、数字が含まれている場合には該数字
を前記複数の認識候補文字の最有力候補とするよう修正
する修正工程とを有することを特徴とする文字認識方
法。
1. A character recognition method for recognizing a character drawn on an image original by inputting an image original on which a character is drawn, the input step of the image original, and the character drawn on the image original. A recognition step of slicing out one character at a time to perform character recognition and outputting a plurality of recognition candidate characters, a search step of searching for a number from the characters recognized by the recognition step, and a case where the number is searched by the search step , Checking whether or not a plurality of recognition candidate characters existing before and after the number includes a number, and if the number is included, corrects the number to be the most probable candidate of the plurality of recognition candidate characters A character recognition method, comprising:
【請求項2】 文字を描いた画像原稿を入力して前記画
像原稿に描かれた文字を認識する文字認識装置であっ
て、 前記画像原稿する入力手段と、 前記画像原稿に描かれた文字を一文字つづ切り出して文
字認識を行い、複数の認識候補文字を出力する認識手段
と、 複数の数詞を格納する記憶手段と、 前記記憶手段に格納された前記複数の数詞を参照して、
前記認識手段によって認識された文字の中から数詞を検
索する検索手段と、 前記数詞の前後に存在する複数の認識候補文字に数字が
含まれているかどうかを調べ、数字が含まれている場合
には該数字を前記複数の認識候補文字の最有力候補とす
るよう修正する修正手段とを有することを特徴とする文
字認識装置。
2. A character recognition apparatus for recognizing a character drawn on an image original by inputting an image original on which a character is drawn, the input means for inputting the image original, and the character drawn on the image original. Character recognition is performed by cutting out one character at a time, and a recognition unit that outputs a plurality of recognition candidate characters, a storage unit that stores a plurality of numbers, and a plurality of numbers stored in the storage unit are referred to,
Retrieval means for retrieving a number from among the characters recognized by the recognition means, and a check is performed to see if a plurality of recognition candidate characters existing before and after the number includes a numeral, and if a numeral is included. A character recognizing device for correcting the numeral so as to be a most probable candidate of the plurality of recognition candidate characters.
【請求項3】 前記記憶手段に格納される前記複数の数
詞の内容を変更できる変更手段をさらに有することを特
徴とする請求項第2項に記載の文字認識装置。
3. The character recognition device according to claim 2, further comprising changing means capable of changing the contents of the plurality of numbers stored in the storage means.
JP3275116A 1991-10-23 1991-10-23 Method and device for recognizing character Pending JPH05114052A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3275116A JPH05114052A (en) 1991-10-23 1991-10-23 Method and device for recognizing character

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3275116A JPH05114052A (en) 1991-10-23 1991-10-23 Method and device for recognizing character

Publications (1)

Publication Number Publication Date
JPH05114052A true JPH05114052A (en) 1993-05-07

Family

ID=17550946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3275116A Pending JPH05114052A (en) 1991-10-23 1991-10-23 Method and device for recognizing character

Country Status (1)

Country Link
JP (1) JPH05114052A (en)

Similar Documents

Publication Publication Date Title
US7305382B2 (en) Information searching apparatus and method, information searching program, and storage medium storing the information searching program
US20030163319A1 (en) Automatic selection of a disambiguation data field for a speech interface
JPH087033A (en) Method and device for processing information
JPH05114052A (en) Method and device for recognizing character
JP2595934B2 (en) Kana-Kanji conversion processor
US5262948A (en) Word processor
JPS59229683A (en) Recognition processor
US6327560B1 (en) Chinese character conversion apparatus with no need to input tone symbols
KR950001061B1 (en) Correcting apparatus for recognizing document
JP2005044103A (en) Document creation device and method and program
JPH08147289A (en) System and method for kana/kanji conversion
JP2003331214A (en) Character recognition error correction method, device and program
JPH05120472A (en) Character recognizing device
JP2874815B2 (en) Japanese character reader
JPS5827268A (en) Japanese word processing device
JP3113712B2 (en) Character recognition method and apparatus
JPH11120294A (en) Character recognition device and medium
JPH0799520B2 (en) Document editing device
JPH11143983A (en) Character recognition device and method and computer readable recording medium storing character recognition program
JPH09102012A (en) Character recognition method/device
JPS60128579A (en) Information recognition system
GB2151055A (en) Word processing
JPH05298495A (en) Character recognizing device, erroneous recognition character correcting method and occidental document processor
JPH0460754A (en) Kana/kanji (chinese character) conversion system
JPH06203077A (en) Electronic dictionary

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000922