JP3111521B2 - Recognition character correction method - Google Patents

Recognition character correction method

Info

Publication number
JP3111521B2
JP3111521B2 JP03213465A JP21346591A JP3111521B2 JP 3111521 B2 JP3111521 B2 JP 3111521B2 JP 03213465 A JP03213465 A JP 03213465A JP 21346591 A JP21346591 A JP 21346591A JP 3111521 B2 JP3111521 B2 JP 3111521B2
Authority
JP
Japan
Prior art keywords
character
pattern
area
recognized
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03213465A
Other languages
Japanese (ja)
Other versions
JPH0554191A (en
Inventor
保 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP03213465A priority Critical patent/JP3111521B2/en
Publication of JPH0554191A publication Critical patent/JPH0554191A/en
Application granted granted Critical
Publication of JP3111521B2 publication Critical patent/JP3111521B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、文字認識装置により文
字パターンを読み取って、その文字パターンから文字の
認識を行う文字認識の際に、認識文字の文字サイズに関
する誤りを修正する認識文字修正方法に関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for correcting a character in which a character pattern is read by a character recognizing device and an error relating to the character size of the recognized character is corrected at the time of character recognition for character recognition based on the character pattern. It is about.

【0002】[0002]

【従来の技術】近年、文字認識装置は、各種機器の入力
端末装置の一つとして導入が盛んで、実用化が進んでい
る。この文字認識装置における従来の認識文字の大きさ
修正方式では文字パターンの縦の長さ、または横の長さ
を基準とし、これが所定の値より小さい場合には小文
字、大きい場合には大文字に分類していた。
2. Description of the Related Art In recent years, character recognition devices have been actively introduced as one of input terminals of various devices, and are being put to practical use. In the conventional character correction method of the character recognition device, the character pattern is classified based on the vertical or horizontal length of the character pattern. Was.

【0003】[0003]

【発明が解決しようとする課題】しかしながら上記の従
来の方法では、対象とする書体あるいは字体を限定する
場合にはある程度有効であるが、対象を広げた場合には
修正が困難であるという問題点を有していた。具体例を
用いてこれを説明する。
However, the above-mentioned conventional method is effective to some extent in limiting the target typeface or character style, but is difficult to correct when the target type is expanded. Had. This will be described using a specific example.

【0004】図6に書体や字体が異なるが、ポイント数
はいずれも等しい6種類のかな文字(ャ,ヤ,ュ,ユ,
ョ,ヨ)と4種類の漢字(煙,燕,猿,縁)を示す。列
方向は同一フォントである。同図で、たとえばc1は小
文字の「ュ」であり、c2は大文字の「ユ」である。こ
の場合、縦の長さは小文字であるc1が大文字であるc
2より大きく、従来のサイズだけによる方法ではもし認
識の際に小文字か大文字かの文字コードの誤りがあって
も修正が困難であることがわかる。
FIG. 6 shows six types of kana characters (ya, ya, u, yu, u) with different typefaces and the same number of points.
And four types of kanji (smoke, swallow, monkey, rim). The column direction is the same font. In the figure, for example, c1 is a lowercase “u” and c2 is a uppercase “yu”. In this case, the vertical length is c1 which is a lowercase letter and c is an uppercase letter.
It can be seen that it is difficult to correct even if there is an error in the character code of lowercase or uppercase during recognition by the conventional method using only the size.

【0005】本発明は上記課題に留意し、文字認識の際
に文字サイズに関する文字コードの誤りがあっても、確
実にその誤り修正が行われる認識文字修正方法を提供し
ようとするものである。
SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and an object of the present invention is to provide a method for correcting a recognized character in which even if there is an error in a character code relating to a character size in character recognition, the error is surely corrected.

【0006】[0006]

【課題を解決するための手段】上記目的を達成するため
に本発明は、認識すべき文書パターンより文字を認識す
る際に、認識した文字列の文字の最も長い辺の長さを最
大値として算出し、認識した文字の中で大文字と小文字
の両方を有するものについては、その縦または横の長い
方の辺の長さと前記最大値とから面積比を計算すること
により、大文字か小文字かを判定し、文字サイズに関す
る修正を行うものである。
This onset bright in order to achieve the above object, according to the solution to ## in recognizing a character from the document patterns to be recognized, the maximum value the longest side length of the character in the recognized character string calculated as, for having both upper and lower case in a recognized character by calculating the area ratio of the length to the said maximum value of the vertical or horizontal the longer side, of case To determine the font size.
This is to make corrections .

【0007】[0007]

【作用】上記の手順による本発明の認識文字修正方法
は、文字列の中の文字の縦横サイズのそれぞれの最大値
である第1,第2の最大値を求め、この値と大文字と小
文字の両方を有するかな文字の長い方の辺との比較か
ら、文字の書体または字体の特徴を生かした正確な大文
字,小文字判別が可能なものである。
According to the recognition character correcting method of the present invention according to the above-described procedure, the first and second maximum values, which are the maximum values of the vertical and horizontal sizes of the characters in the character string, are obtained. From the comparison with the longer side of the kana character having both, it is possible to accurately distinguish between uppercase and lowercase characters by making use of the characteristics of the character typeface or character type.

【0008】以下に図面を用いて本発明の原理について
説明する。図6に書体,字体が異なるが、ポイント数は
どれも等しい6種類の大文字と小文字の両方を有するか
な文字(ャ,ヤ,ュ,ユ,ョ,ヨ)と4種類の漢字
(煙,燕,猿,縁)を示す。列方向は同一の書体または
字体、すなわち同一フォントである。これから以下のこ
とがいえる。
The principle of the present invention will be described below with reference to the drawings. In FIG. 6, the typeface and font are different, but the number of points is the same. Six types of kana characters (ya, ya, u, yu, yo, yo) having both uppercase and lowercase and four types of kanji (smoke, swallow) , Monkey, rim). The column direction is the same typeface or font, that is, the same font. From this, the following can be said.

【0009】(1)同一フォントでは、必ずかな大文字
はかな小文字より小さい。 (2)同一フォントでは、かな文字の大文字と小文字に
おける縦と横の長さの比(以下、縦横比)がほぼ等し
い。
(1) In the same font, kana uppercase letters are always smaller than kana lowercase letters. (2) In the same font, the ratio between the vertical and horizontal lengths of uppercase and lowercase characters of kana characters (hereinafter, aspect ratio) is almost equal.

【0010】(3)同一フォントでは、かな大文字と漢
字の長辺はほぼ等しい。 本発明では、書体や字体が異なった文字に対して、
(1),(2),(3),の性質を用いることにより効
果的な分類を行う。すなわち、入力文字が大文字と小文
字の両方の可能性がある文字であることが既知の場合
(たとえば、「っ」と「つ」など)に、この文字と漢字
と推定される文字について、縦と横の長さのうち長い方
の長さ(以下、長辺)の比を求め、この比と入力文字の
縦横比から推定した大文字の面積を基準とした入力文字
の面積によって大文字と小文字を判定する。すなわち、
同じ書体または字体が同じ場合に、大文字同士ではほぼ
縦横比が等しく、また、長辺同士の長さの比が特定され
る事実から漢字を含め入力文字が属す文字列中に存在す
る全ての文字パターンの長辺のうち最大値を求めそれを
基準とする。
(3) In the same font, Kana capital letters and long sides of Chinese characters are almost equal. In the present invention, for characters with different fonts and fonts,
Effective classification is performed by using the properties of (1), (2) and (3). That is, if it is known that the input character is a character that may be both uppercase and lowercase (for example, “tsu” and “tsu”), this character and the character assumed Calculates the ratio of the longer one of the horizontal lengths (hereinafter referred to as the long side), and determines uppercase and lowercase characters based on the input character area based on this ratio and the uppercase area estimated from the aspect ratio of the input character. I do. That is,
When the same typeface or font is the same, all characters in the character string to which the input character belongs, including kanji, are based on the fact that the aspect ratio is almost the same between uppercase letters and the length ratio between the long sides is specified. The maximum value among the long sides of the pattern is obtained and is used as a reference.

【0011】いま、最大値を有する漢字の長辺、および
入力されたかな文字の縦,横の長さをそれぞれM,a,
bとするとき、a<bの場合、かな大文字の面積は入力
かな文字の面積a・bに(M/b)・(M/b)を乗じ
た値と推定される。よって、入力かな文字のかな大文字
に対する面積の比は(b/M)・(b/M)になる。同
様にして、a≧bの場合は(a/M)・(a/M)とな
る。a=bの場合はどちらの式でも同じ結果が得られ
る。
Now, the long side of the kanji having the maximum value and the vertical and horizontal lengths of the input kana character are respectively represented by M, a, and
In the case of b, if a <b, the area of a kana uppercase letter is estimated to be a value obtained by multiplying the area ab of the input kana character by (M / b) · (M / b). Therefore, the ratio of the area of the input kana character to the kana capital letter is (b / M) · (b / M). Similarly, when a ≧ b, (a / M) · (a / M). When a = b, the same result is obtained with either equation.

【0012】このように、長辺同士の長さの比を面積比
として特定し、その値から大文字か小文字かを判定す
る。
As described above, the ratio of the lengths of the long sides is specified as the area ratio, and it is determined from the value that the case is uppercase or lowercase.

【0013】[0013]

【実施例】図1は本発明の認識文字修正方法を用いた一
実施例における文字認識装置の機能ブロック図を示すも
のである。図1において1は文書を光電変換して2値化
データとして文書パターンメモリに記憶させる文字入力
部、2は上記2値化データから文字切り出しを行う文字
切り出し部、3は文字切り出し部2からの文字パターン
に対応する文字コードを出力する文字認識部、4は文字
認識部3からの認識文字が大文字と小文字を共に有する
文字である場合に、文字切り出し部2から与えられる同
一文字列中の文字パターンの縦と横の長さのうち最大値
を求め、この値と入力パターンの縦と横の長さから文字
パターンが大文字,小文字をどちらであるかを判定する
文字サイズ判定部、5は文字サイズ判定部4の結果によ
り文字認識部3からの認識文字の文字サイズが間違って
いる場合にこれを修正する修正部、6は修正部5の結果
を出力する表示部、7は文字切り出し部2から得られた
文字列中の全文字の縦と横の長さから最大の長辺を求め
る最大長辺計算部である。
FIG. 1 is a functional block diagram of a character recognition apparatus according to an embodiment using a method for correcting a recognized character according to the present invention. In FIG. 1, reference numeral 1 denotes a character input unit for photoelectrically converting a document and storing it as binary data in a document pattern memory; 2, a character extraction unit for extracting characters from the binary data; A character recognizing unit that outputs a character code corresponding to a character pattern, 4 is a character in the same character string given from the character cutout unit 2 when the character recognized by the character recognizing unit 3 is a character having both uppercase and lowercase characters. A character size determination unit that determines the maximum value of the vertical and horizontal lengths of the pattern and determines whether the character pattern is uppercase or lowercase based on this value and the vertical and horizontal lengths of the input pattern. When the character size of the recognized character from the character recognizing unit 3 is incorrect according to the result of the size determining unit 4, the correcting unit corrects the character size. 6 is a display unit that outputs the result of the correcting unit 5. Ri out of all characters in the resulting string of 2 vertical and horizontal which is the maximum long side calculation unit for obtaining the maximum of the long side from the length.

【0014】図2は本実施例の文字認識装置の構成を示
すブロック図である。ここで21は認識すべき文書を読
み取るスキャナであり読み取った文書をビットデータに
して出力する。22は読み出し,書き込み可能なメモリ
(以下RAMと略す)であり、スキャナ21からのビッ
トデータを記憶する文書パターン領域23と、この文書
パターン領域23内の文書パターンから切り出された文
字列中に含まれる文字パターンのサイズを記憶する文字
サイズ領域27と、文字サイズ領域27中の縦と横の長
さのうち最大値を記憶する最大長辺領域25と、文字パ
ターンを記憶する文字パターン領域24と、この文字パ
ターンを認識して得られる文字コードを記憶する文字コ
ード領域26と、処理で使用するレジスタ領域28を有
している。29は読み出し専用メモリ(以下ROMと略
す)であり大文字と小文字の文字コードと文字コードに
固有なしきい値を記憶した文字サイズ辞書領域30と、
図3に示すフローチャートに従った制御プログラムを記
憶したプログラム記憶領域31とを有する。32はプロ
グラム記憶領域31に記憶された制御プログラムに従っ
て処理を行う処理回路である。33はデータを入力する
キーボードであり、34は文字パターン領域24内の文
字パターンと文字コード領域26内の文字コード、また
はこれに対応する文字フォントを表示する表示部であ
る。
FIG. 2 is a block diagram showing the configuration of the character recognition device of the present embodiment. Here, a scanner 21 reads a document to be recognized, and outputs the read document as bit data. Reference numeral 22 denotes a readable / writable memory (hereinafter abbreviated as RAM), which includes a document pattern area 23 for storing bit data from the scanner 21 and a character string cut out from a document pattern in the document pattern area 23. A character size area 27 for storing the size of the character pattern to be stored, a maximum long side area 25 for storing the maximum value of the vertical and horizontal lengths in the character size area 27, and a character pattern area 24 for storing the character pattern. A character code area 26 for storing a character code obtained by recognizing the character pattern, and a register area 28 used for processing. 29 is a read-only memory (hereinafter abbreviated as ROM), a character size dictionary area 30 storing upper and lower case character codes and a threshold value unique to the character codes;
And a program storage area 31 storing a control program according to the flowchart shown in FIG. Reference numeral 32 denotes a processing circuit that performs processing according to the control program stored in the program storage area 31. Reference numeral 33 denotes a keyboard for inputting data. Reference numeral 34 denotes a display unit for displaying a character pattern in the character pattern area 24 and a character code in the character code area 26, or a character font corresponding thereto.

【0015】以上のように構成された本実施例の文字認
識装置を用いて本発明の認識文字修正方法について図3
のフローチャートに従って説明する。まず、ステップS
1で、文字入力部1において認識すべき文書パターンか
ら読み込まれた文書パターンから、文字切り出し部2の
処理により文字を切り出し、同一文字列中に存在するす
べての文字パターンの縦と横の長さを文字サイズ領域2
7に書き込む。次のステップS2では最大長辺計算部7
で文字サイズ領域27中の縦および横の長さのうち最大
値Mを捜し出し、結果を最大長辺領域25に保存する。
次にステップS3で文字認識部3による文字認識処理を
行い、認識文字,文字コードを文字コード領域26に保
存する。ステップS4では、文字コード領域26中の認
識文字が文字サイズ辞書領域30に登録されているかど
うかの判断を行う。登録されている場合、この文字は小
文字を有するのでステップS4で文字サイズ判定処理を
行うが、そうでない場合は処理を終了する。ステップS
5では、まず入力文字パターンの縦aと横bの長さの大
小関係を調べ、a≧bであるときステップS6、a<b
の場合ステップS7に進む。ステップS6では(a/
M)の2乗を、ステップS7では(b/M)の2乗を計
算する。ここで、Mは最大長辺領域の値である。ステッ
プS8ではステップS6またはS7の結果が文字サイズ
辞書領域30に登録された所定の値よりも小さいときは
小文字、大きいときは大文字と判定する。最後にステッ
プS9で修正部6によりこの判定結果が文字認識部3に
おける認識文字の文字コードと異なり認識文字の文字サ
イズが間違っていた場合に文字コード領域26の内容を
修正する。
FIG. 3 shows a method for correcting a recognized character according to the present invention using the character recognition device of the present embodiment configured as described above.
This will be described according to the flowchart of FIG. First, step S
1, a character is cut out from a document pattern read from a document pattern to be recognized by the character input unit 1 by the processing of a character cutout unit 2, and the vertical and horizontal lengths of all character patterns existing in the same character string are extracted. To character size area 2
Write to 7. In the next step S2, the maximum long side calculation unit 7
The maximum value M is searched for in the vertical and horizontal lengths in the character size area 27, and the result is stored in the maximum long side area 25.
Next, in step S3, a character recognition process is performed by the character recognition unit 3, and the recognized character and the character code are stored in the character code area 26. In step S4, it is determined whether or not the recognized character in the character code area 26 is registered in the character size dictionary area 30. If the character is registered, the character has a lowercase letter, so that a character size determination process is performed in step S4. If not, the process ends. Step S
In step 5, first, the magnitude relation between the lengths a and b of the input character pattern is checked. If a ≧ b, step S6, a <b
In the case of, the process proceeds to step S7. In step S6, (a /
M) is calculated, and in step S7, the square of (b / M) is calculated. Here, M is the value of the maximum long side area. In step S8, if the result of step S6 or S7 is smaller than a predetermined value registered in the character size dictionary area 30, it is determined that the character is a small letter, and if it is larger, it is determined to be a capital letter. Finally, in step S9, the correction unit 6 corrects the contents of the character code area 26 when the result of the determination is different from the character code of the recognized character in the character recognition unit 3 and the character size of the recognized character is wrong.

【0016】つぎに具体的に認識対象例題文字列パター
ン「ナショナルエレクトリック」を読み取った場合を例
に、以下その動作を説明する。まず、文字入力部1で、
認識文字列パターン(以下、入力文字とする)を2値画
像として入力して文書パターン領域23に記憶する。次
に文字切り出し部2で入力文字を切り出した後、文字切
り出し部2が1文字ずつに切り離すが、このとき同一文
字列中に存在するすべての文字パターンの縦と横の長さ
を文字サイズ領域27に書き込む。この時点での文字サ
イズ領域27を図4(a)に示す。最大長辺計算部7に
よると、「ル」の横の長さが最も大きいので最大長辺M
=61が得られる。図4(a)に示すように文字認識部
3が入力文字「ナショナルエレクトリック」を「ナシヨ
ナルェレクトリツク」と認識したとする(これを認識文
字とよぶ)。文字サイズ判定部4ではまず認識文字が大
文字と小文字の両方を持つ文字か否かの判断を行う。こ
こでは「ヨ」,「ェ」,「ツ」の3つが該当する。
「ヨ」は縦が横より長いので(a/M)の2乗を、
「ェ」と「ツ」は横の長さが長いので(b/M)の2乗
を求めると図4(a)に示す値のようになる。一方、R
OM29の文字サイズ辞書領域30には図5のように大
文字,小文字、所定の値が大文字,小文字を有するかな
文字について記憶され、その所定値が、文字サイズの面
積比に等しく、大文字か小文字かを特定する境界値であ
る。そこで入力文字の値が該当する文字の値より大きけ
れば大文字、小さければ小文字に判定する。修正部6で
「ヨ」「エ」「ツ」ともには認識文字の文字サイズが間
違っているので修正し、図4(b)のように認識文字が
正しく修正される。
Next, the operation will be described below by taking as an example a case where the recognition target example character string pattern "National Electric" is read. First, in the character input unit 1,
A recognition character string pattern (hereinafter, referred to as an input character) is input as a binary image and stored in the document pattern area 23. Next, after the input character is cut out by the character cutout unit 2, the character cutout unit 2 cuts out one character at a time. Write 27. FIG. 4A shows the character size area 27 at this point. According to the maximum long side calculation unit 7, since the horizontal length of “R” is the largest, the maximum long side M
= 61 is obtained. As shown in FIG. 4A, it is assumed that the character recognizing unit 3 recognizes the input character "National Electric" as "National Electric" (this is called a recognized character). The character size determination unit 4 first determines whether the recognized character is a character having both uppercase and lowercase characters. Here, three of "yo", "e", and "tu" correspond.
"Y" is longer than horizontal, so the square of (a / M)
Since "e" and "tsu" have a large horizontal length, the square of (b / M) is obtained as shown in FIG. On the other hand, R
The character size dictionary area 30 of the OM 29 stores uppercase and lowercase letters and predetermined values for kana characters having uppercase and lowercase letters, as shown in FIG. Is a boundary value that specifies Therefore, if the value of the input character is larger than the value of the corresponding character, it is determined to be uppercase, and if it is smaller, it is determined to be lowercase. The correcting unit 6 corrects the character size of the recognized characters for "Y", "E", and "T" because they are wrong, and corrects the recognized characters as shown in FIG. 4B.

【0017】以上のように本実施例によれば、最大長辺
計算部と文字サイズ判定部と修正部を設けることによ
り、文字認識部から出力された認識文字のうち文字サイ
ズの誤りを修正する場合に、精度よく修正できる。
As described above, according to this embodiment, by providing the maximum long side calculation unit, the character size determination unit, and the correction unit, the character size error among the recognition characters output from the character recognition unit is corrected. In this case, it can be corrected with high accuracy.

【0018】なお、漢字とかな文字について本実施例で
は説明したが、アルファベットなども書体が確定できる
ものについては、同様な効果を有することは言うまでも
ない。
Although the kanji and kana characters have been described in the present embodiment, it is needless to say that the same effect can be obtained for alphabets and the like whose fonts can be determined.

【0019】[0019]

【発明の効果】以上の説明より明らかなように、認識し
た文字の最大辺の長さを基準に、面積比を計算して文字
サイズを比較することにより認識文字の文字サイズに
関する誤りを精度良く修正を行うことができるものであ
る。
As is clear from the above description, the area ratio is calculated based on the maximum length of the recognized character and the character sizes are compared to correct errors in the character size of the recognized character. It can be corrected frequently.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の認識文字修正方法の一実施例を機能別
に示した構成図
FIG. 1 is a block diagram showing an embodiment of a method for correcting a recognized character according to the present invention for each function.

【図2】同実施例をハード構成として示した文字認識装
置のブロック図
FIG. 2 is a block diagram of a character recognition device showing the embodiment as a hardware configuration;

【図3】同実施例の手順を示すフローチャートFIG. 3 is a flowchart showing a procedure of the embodiment.

【図4】(a),(b)は同実施例の具体的文字列によ
る手順を示す説明図
FIGS. 4A and 4B are explanatory diagrams showing specific character string procedures in the embodiment.

【図5】同実施例の文字サイズ辞書領域に記憶されてい
る記憶内容配置図
FIG. 5 is a layout diagram of storage contents stored in a character size dictionary area according to the embodiment;

【図6】従来の認識文字修正方法を説明するための文字
のパターン図
FIG. 6 is a character pattern diagram for explaining a conventional recognition character correction method.

【符号の説明】[Explanation of symbols]

1 文字入力部 2 文字切り出し部 3 文字認識部 4 文字サイズ判定部 5 修正部 6 表示部 7 最大長辺計算部 1 character input section 2 character cutout section 3 character recognition section 4 character size determination section 5 correction section 6 display section 7 maximum long side calculation section

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/46 G06K 9/62 ──────────────────────────────────────────────────続 き Continued on the front page (58) Field surveyed (Int.Cl. 7 , DB name) G06K 9/46 G06K 9/62

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】認識すべき文書パターンを読み取り、前記
文書パターンから文字を切り出し、 切り出した文字列のなかで文字パターンの縦サイズまた
は横サイズの最大値を計算し、 各文字パターンから文字コードを読みし、前記文字コ
ードが大文字と小文字の両方を有する可能性を判定し、 前記可能性を有する場合には文字パターンの縦の長さと
横の長さを比較し、縦の長さが長い場合には縦の長さと
前記最大値から面積比を計算した値によって大文字と小
文字を判定し、横の長さが長い場合には横の長さと前記
最大値から面積比を計算した値によって大文字と小文字
を判定し、前記判定結果が、 前記読み出した文字コードと異なる場
合には前記文字コードを修正する、ことを特徴とする
識文字修正方法。
1. A reads a document pattern to be recognized, the document pattern cut out characters from, calculate the maximum value of the vertical size or horizontal size of the character pattern among string cut, character codes from the character pattern were read out, the character code determines the possibility of having both upper and lower case, to compare the longitudinal length and lateral length of the character pattern in the case of having the potential, the vertical length determined case by the value of the area ratio was calculated from the vertical length and the maximum value is longer, if the horizontal length is long by the lateral length and the value of the area ratio was calculated from the maximum value A method of correcting a recognized character , wherein upper and lower case characters are determined, and the character code is corrected if the result of the determination is different from the read character code.
【請求項2】文字パターンの縦サイズまたは横サイズの
最大値が、前記文字パターンの長辺の最大値である、こ
とを特徴とする請求項1記載の認識文字修正方法。
The maximum value of the vertical size or horizontal size of 2. A character pattern is the maximum value of the long side of the character pattern, this
2. The method according to claim 1, further comprising the steps of :
JP03213465A 1991-08-26 1991-08-26 Recognition character correction method Expired - Fee Related JP3111521B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03213465A JP3111521B2 (en) 1991-08-26 1991-08-26 Recognition character correction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03213465A JP3111521B2 (en) 1991-08-26 1991-08-26 Recognition character correction method

Publications (2)

Publication Number Publication Date
JPH0554191A JPH0554191A (en) 1993-03-05
JP3111521B2 true JP3111521B2 (en) 2000-11-27

Family

ID=16639659

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03213465A Expired - Fee Related JP3111521B2 (en) 1991-08-26 1991-08-26 Recognition character correction method

Country Status (1)

Country Link
JP (1) JP3111521B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7035463B1 (en) 1999-03-01 2006-04-25 Matsushita Electric Industrial Co., Ltd. Document image processor, method for extracting document title, and method for imparting document tag information

Also Published As

Publication number Publication date
JPH0554191A (en) 1993-03-05

Similar Documents

Publication Publication Date Title
US4941189A (en) Optical character reader with skew recognition
JPH07104909B2 (en) Character recognition method
JP2000315247A (en) Character recognizing device
JP3111521B2 (en) Recognition character correction method
US4876730A (en) Optical character reader with skew recognition
JP3111522B2 (en) Recognition character correction method
JPH0410087A (en) Base line extracting method
JP2569103B2 (en) Character detection method
JPH06348911A (en) English character recognition device
JP3274014B2 (en) Character recognition device and character recognition method
JP2788506B2 (en) Character recognition device
JP2697790B2 (en) Character type determination method
JP3537570B2 (en) Space detection method for Japanese-English mixed documents, pitch format determination method, and space detection method for fixed-pitch alphanumeric character strings
JP3128357B2 (en) Character recognition processor
JPH09274645A (en) Method and device for recognizing character
JP7247472B2 (en) Information processing device and program
JP2930996B2 (en) Image recognition method and image recognition device
JP2974145B2 (en) Correcting character recognition results
JP3270551B2 (en) Character recognition device and character recognition method
JP3195405B2 (en) Character recognition device
JPH01171080A (en) Recognizing device for error automatically correcting character
JP2922949B2 (en) Post-processing method for character recognition
JPH05290211A (en) Discrimination method of character kind and the like
JP2972443B2 (en) Character recognition device
JP3345469B2 (en) Word spacing calculation method, word spacing calculation device, character reading method, character reading device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080922

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080922

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090922

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090922

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100922

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees