JPH06195521A - Character recognizing method - Google Patents

Character recognizing method

Info

Publication number
JPH06195521A
JPH06195521A JP4345945A JP34594592A JPH06195521A JP H06195521 A JPH06195521 A JP H06195521A JP 4345945 A JP4345945 A JP 4345945A JP 34594592 A JP34594592 A JP 34594592A JP H06195521 A JPH06195521 A JP H06195521A
Authority
JP
Japan
Prior art keywords
character
candidate
line
recognition
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4345945A
Other languages
Japanese (ja)
Inventor
Yukiya Sugiyama
幸也 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4345945A priority Critical patent/JPH06195521A/en
Publication of JPH06195521A publication Critical patent/JPH06195521A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To accurately recognize a Japanese document by judging that the Japanese document is not the result of recognition when the number of candidate words obtained by making a search only as to a 1st candidate character in one line is less than a threshold value. CONSTITUTION:A language processing is performed for the character recognition result of a character recognition part 13 which recognizes and converts characters of character image data, obtained by a character segmentation part 12 segmenting image data read by an image reader into character image data, character by character, into character codes. At this time, a post processing necessity/nonnecessity decision part 15 judges that the recognition result is not the result of the recognition of the Japanese document if the number of characters in one line exceeds the threshold value, there are successive characters of single character kind more than the threshold value among 1st candidate characters in one line, and candidate words less than the threshold value are obtained as a result of a search for only 1st candidate words in one line, so that the language processing is not performed.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、新聞,雑誌,小説など
の、活字,ドット文字及び手書き文字パターンをJIS
コード等のコード情報に変換する文字認識方法に関する
ものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention is designed to print characters, dot characters and handwritten character patterns of newspapers, magazines, novels, etc. according to JIS.
The present invention relates to a character recognition method for converting into code information such as a code.

【0002】[0002]

【従来の技術】認識対象文書の原文を(表1)に示す。2. Description of the Related Art The original text of a document to be recognized is shown in (Table 1).

【0003】[0003]

【表1】 [Table 1]

【0004】(表1)に示す原文の認識結果を(表2)
に示す。
The recognition result of the original sentence shown in (Table 1) is shown in (Table 2).
Shown in.

【0005】[0005]

【表2】 [Table 2]

【0006】上記認識結果に言語処理を用いた後処理を
行うと、後処理では候補文字群内の文字を組み合わせて
日本語単語として成立する文字の組合せを検出し、その
単語を正解文字として採用する。従って、後処理により
0行1列の‘位’と1行2列の‘相’が“位相”という
単語を形成するので、正解文字‘移’は不正解文字
‘相’と変換されてしまい、認識率が低下するという問
題点があった。
When post-processing using language processing is performed on the recognition result, the post-processing detects the combination of characters that form a Japanese word by combining the characters in the candidate character group and adopts that word as the correct character. To do. Therefore, in the post-processing, the 0th row and 1st column'position 'and the 1st row and 2nd column'phase' form the word'phase ', so the correct character'transition' is converted to the incorrect character'phase '. However, there is a problem that the recognition rate decreases.

【0007】(表3)に悪影響を受けた認識結果を示
す。
(Table 3) shows the recognition results that are adversely affected.

【0008】[0008]

【表3】 [Table 3]

【0009】[0009]

【発明が解決しようとする課題】従来の文字認識方法で
は、全ての認識結果に対して言語処理を用いた後処理を
行っているために、単一文字種の文字を羅列した文書で
は上記問題点が発生する。後処理の要否を使用者が指定
する構造になっていたとしても指定ミスによる上記問題
点の発生を完全に防止することはできない。
In the conventional character recognition method, since the post-processing using the language processing is performed on all recognition results, the above problem occurs in a document in which characters of a single character type are listed. Occurs. Even if the user specifies the necessity of post-processing, it is not possible to completely prevent the above-mentioned problems from occurring due to a specification error.

【0010】本発明はこの点に鑑み、日本語文章を正確
に認識することのできる文字認識方法を提供することを
目的とする。
In view of this point, the present invention has an object to provide a character recognition method capable of accurately recognizing a Japanese sentence.

【0011】[0011]

【課題を解決するための手段】画像読み取り装置から読
み取った画像データを一文字毎の文字画像データに切り
出しする文字切り出し部により切り出された文字画像デ
ータを文字認識して文字コードに変換する文字認識部に
より認識された文字認識結果に対して言語処理を行うに
あたり、認識結果に於て、1行中の文字数がしきい値以
上存在し、且つ、1行中の第一候補文字の内、単一文字
種の個数がしきい値以上連続して存在し、且つ、1行中
の第一候補文字だけを対象として候補単語を探索した結
果、しきい値以下の個数の候補単語しか得られなかった
場合、当該認識結果は、日本語文章を認識した結果では
無いと判断し、言語処理を行わない事により認識率,認
識速度の低下を防止する。
A character recognizing unit for recognizing character image data cut out by a character slicing unit for slicing image data read from an image reading device into character image data for each character and converting the character image data into a character code. When performing language processing on the character recognition result recognized by, the number of characters in one line exceeds the threshold in the recognition result, and the single candidate character among the first candidate characters in one line is detected. When the number of character types continues for more than the threshold value and the candidate words are searched for only the first candidate character in one line, only the number of candidate words less than the threshold value is obtained. It is determined that the recognition result is not the result of recognizing a Japanese sentence, and the language processing is not performed to prevent the recognition rate and the recognition speed from decreasing.

【0012】[0012]

【作用】本発明は前記の構成により、日本語文章を正し
く認識することができる。
The present invention can correctly recognize a Japanese sentence by the above configuration.

【0013】[0013]

【実施例】以下本発明の一実施例における文字認識方法
について、図面を参照しながら説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A character recognition method according to an embodiment of the present invention will be described below with reference to the drawings.

【0014】図1は本発明の一実施例における文字認識
方法を用いた文字認識装置のブロック図である。
FIG. 1 is a block diagram of a character recognition apparatus using a character recognition method according to an embodiment of the present invention.

【0015】11は認識対象文書を光電変換する画像読
み取り部、12は認識対象文書の画像データより、文字
単位の画像データを切り出す文字切り出し部,13は文
字領域の画像データを文字認識して文字コードに変換す
る文字認識部,14は候補文字群より改行コードを検出
し、1行単位の認識結果を得る行分割部,15は行に対
して言語処理を用いた後処理の要否を判定する後処理要
否判定部,16は言語処理を用いた後処理を行う後処理
部,17は最終的な認識結果を出力する出力部,18は
単語辞書である。
Reference numeral 11 is an image reading unit for photoelectrically converting a recognition target document, 12 is a character cutout unit for cutting out image data in character units from image data of the recognition target document, and 13 is character recognition by recognizing image data in a character area. A character recognizing unit for converting into a code, 14 detects a line feed code from a candidate character group, and a line dividing unit for obtaining a recognition result for each line, 15 determines whether post-processing using language processing is necessary for a line A post-processing necessity determining unit for performing, a post-processing unit for performing post-processing using language processing, an output unit for outputting a final recognition result, and a word dictionary.

【0016】以上のように構成された本実施例における
文字認識方法について、図2〜図6のフローチャートに
そって以下その動作について説明する。
The operation of the character recognition method according to this embodiment having the above-described structure will be described below with reference to the flow charts of FIGS.

【0017】まずステップs21において画像読み取り
部11は、認識対象文書を光電変換し、画像データを得
る。
First, in step s21, the image reading section 11 photoelectrically converts the document to be recognized to obtain image data.

【0018】次に、ステップs22において文字切り出
し部12は、画像データから文字単位の画像データを切
り出す。
Next, in step s22, the character cutout unit 12 cuts out image data in character units from the image data.

【0019】次に、ステップs23において文字認識部
13は、文字画像データを基にして文字認識を行う。認
識結果を(表4)に示す。
Next, in step s23, the character recognition unit 13 performs character recognition based on the character image data. The recognition results are shown in (Table 4).

【0020】[0020]

【表4】 [Table 4]

【0021】次に、行分割を行う。ステップs31にお
いて、iは文字位置を表わし、初期値として−1が設定
される。そしてステップs32においてi+1=0をh
eadに代入する。headは行の先頭位置を表わす。
ステップs33においてi+1=0をiに代入し、文字
位置を一つ進める。
Next, line division is performed. In step s31, i represents a character position, and -1 is set as an initial value. Then, in step s32, i + 1 = 0 is changed to h
Substitute in ead. The head represents the start position of the line.
In step s33, i + 1 = 0 is substituted for i and the character position is advanced by one.

【0022】ステップs34においてiが認識文字数を
超えていないかを調べる。超えていないならばステップ
s35に移行して、(i=0)位置第一候補文字は改行
コードか調べる。超えているならばステップs37に移
行して認識結果を出力する。改行コードではないならば
ステップs33に移行する。
In step s34, it is checked whether i exceeds the number of recognized characters. If it does not exceed, the process proceeds to step s35 to check whether the first candidate character at the (i = 0) position is a line feed code. If it exceeds, the process proceeds to step s37 and the recognition result is output. If it is not a line feed code, the process proceeds to step s33.

【0023】同様にiを一つずつ進めて行き、iを6ま
で進めると第一候補文字が改行コードであるので、ステ
ップs36においてtailにiを代入する。tail
は行の末尾文字位置を表わす。
Similarly, when i is advanced one by one and i is advanced to 6, the first candidate character is a line feed code, so i is substituted for tail in step s36. tail
Represents the last character position in the line.

【0024】以上の作用により、1行分の認識結果範囲
が得られる。ステップs40では行の文字数を求める。
そしてステップs41においてlengthに(tai
l−head)を代入する。
With the above operation, the recognition result range for one line can be obtained. In step s40, the number of characters in the line is calculated.
Then, in step s41, the length is set to (tai
l-head) is substituted.

【0025】そして、lengthはthr1以下か調
べる。thr1は、1行あたりの文字数を表わすしきい
値であり、後処理要否判断要素のひとつである。ここで
は4を設定してあるものとする。
Then, it is checked whether the length is less than thr1. thr1 is a threshold value that represents the number of characters per line, and is one of the post-processing necessity determination elements. Here, it is assumed that 4 is set.

【0026】ステップs42においてjに初期値として
headを代入する。jは0。jは文字位置を表わす。
そしてステップs43においてj位置の第一候補文字種
をkindに設定する。文字種は漢字である。ステップ
s44においてcntに初期値1を設定する。cntは
連続する同一文字種文字数を計数するのに用いる。ステ
ップs45においてjに1を加算する。
In step s42, head is substituted for j as an initial value. j is 0. j represents a character position.
Then, in step s43, the first candidate character type at the j position is set to kind. The character type is Kanji. In step s44, the initial value 1 is set in cnt. cnt is used to count the number of consecutive characters of the same character type. In step s45, 1 is added to j.

【0027】ステップs46においてjがtailを超
えないかどうかをチェックする。超えていないならば、
ステップs47に移行し(j=1)位置の第一候補文字
種とkindを照合する。両者とも漢字なので一致する
とステップs48に移行しcntに1を加算。cnt=
2となったところでステップs49においてcntはt
hr2を超えないかどうかをチェックする。thr2は
同一文字種の連続出現許容数であり、この値を超えると
後処理を行わない。ここでは5を設定する。
In step s46, it is checked whether j does not exceed tail. If not exceeded,
In step s47, the first candidate character type at the position (j = 1) is compared with the kind. Since both are Kanji, if they match, the process moves to step s48 and 1 is added to cnt. cnt =
When it reaches 2, cnt is t in step s49.
Check if hr2 is not exceeded. thr2 is the allowable number of consecutive appearances of the same character type, and if this value is exceeded, post-processing will not be performed. Here, 5 is set.

【0028】(cnt=2)は(thr2=5)を超え
ないのでステップs45へ移行する。
Since (cnt = 2) does not exceed (thr2 = 5), the process proceeds to step s45.

【0029】同様にjを一つずつ進めて行き、jを5ま
で進めるとcntがthr2を超える。
Similarly, when j is advanced one by one and j is advanced to 5, cnt exceeds thr2.

【0030】keyにheadを代入する(s60)。
key=0となる。keyは候補単語照合開始点を表わ
す。ステップs61においてkey位置の文字で始まる
単語を単語辞書18より読み出す。
Head is substituted for key (s60).
The key becomes 0. The key represents a candidate word matching start point. In step s61, the word starting with the character at the key position is read from the word dictionary 18.

【0031】key=0位置は‘亜’なので‘亜’で始
まる単語を辞書から読み出すと(表5)が得られる。
Since the key = 0 position is "A", reading a word starting with "A" from the dictionary yields (Table 5).

【0032】[0032]

【表5】 [Table 5]

【0033】(表5)の単語と候補文字を照合する(s
62)。一致する単語は得られなかったので計数は行わ
ない。
The words in (Table 5) are compared with the candidate characters (s
62). No matching word was obtained, so no counting is performed.

【0034】keyはtailと一致するかチェック
(s64)。一致しない。同様にkeyを一つずつ進め
て行き、tailまで候補単語抽出を行ったが候補単語
は全く得られなかった。
It is checked whether the key matches tail (s64). It does not match. Similarly, the key was advanced one by one, and candidate words were extracted up to tail, but no candidate word was obtained.

【0035】一致した個数とthr3を比較する(s6
6)。thr3は候補単語数を表わすしきい値であり、
ここでは3が設定されている。候補単語数は0である。
従って、当行に対して後処理は行わない。
The number of coincidences and thr3 are compared (s6
6). thr3 is a threshold representing the number of candidate words,
Here, 3 is set. The number of candidate words is 0.
Therefore, no post-processing is performed on the Bank.

【0036】次の行分割を行う。ステップs32におい
て、i+1をheadに代入する。head=7とな
る。
The next line division is performed. In step s32, i + 1 is substituted for head. head = 7.

【0037】ステップs33において、i+1をiに代
入し、文字位置を一つ進める。iは8となる。
In step s33, i + 1 is substituted for i and the character position is advanced by one. i becomes 8.

【0038】ステップs34において、iが認識文字数
を超えていないかを調べる。超えていないのでステップ
s35に移行して、i位置の第一候補文字が改行コード
か調べる。改行コードでないのでs33に移行する。
In step s34, it is checked whether i exceeds the number of recognized characters. Since it has not exceeded, the process proceeds to step s35 to check whether the first candidate character at the i position is a line feed code. Since it is not a line feed code, the process moves to s33.

【0039】同様にiを一つずつ進めていき、iを13
まで進めると第一候補文字が改行コードであるので、ス
テップs36においてtailにiを代入する。
Similarly, i is advanced one by one, and i is increased to 13
Since the first candidate character is a line feed code when i is advanced to, i is substituted for tail in step s36.

【0040】以上の作用により、1行分の認識結果範囲
が得られる。ステップs40では行の文字数を求める。
そしてステップs41においてlengthに(tai
l−head)を代入する。
With the above operation, the recognition result range for one line can be obtained. In step s40, the number of characters in the line is calculated.
Then, in step s41, the length is set to (tai
l-head) is substituted.

【0041】そしてlengthはthr1以下か調べ
る。lengthはthr1以上なのでステップs42
へ移行する。
Then, it is checked whether the length is less than thr1. Since length is more than thr1, step s42
Move to.

【0042】ステップs42においてjに初期値として
headを代入する。jは7。そして、ステップs43
においてj位置の第一候補文字種をkindに設定す
る。文字種は漢字である。
In step s42, head is substituted for j as an initial value. j is 7. And step s43
In, the first candidate character type at position j is set to kind. The character type is Kanji.

【0043】ステップs44においてcntに初期値1
を設定する。ステップs45においてjに1を加算す
る。jは8。
At step s44, the initial value 1 is set to cnt.
To set. In step s45, 1 is added to j. j is 8.

【0044】ステップs46においてjがtailを超
えないかどうかをチェックする。超えていないのでステ
ップs47に移行する。
In step s46, it is checked whether j does not exceed tail. Since it has not exceeded, the process proceeds to step s47.

【0045】ステップs47においてj位置の第一候補
文字種とkindを照合する。両者とも漢字なのでステ
ップs48に移行し、cntに1を加算する。
In step s47, the first candidate character type at the j position is compared with the kind. Since both are Kanji, the process moves to step s48 and 1 is added to cnt.

【0046】ステップs49においてcntはthr2
を超えていないのでステップs45へ移行する。
In step s49, cnt is thr2.
Since it does not exceed, the process proceeds to step s45.

【0047】ステップs45においてjに1を加算す
る。jは9。ステップs46においてjがtailを超
えないかどうかをチェックする。超えていないのでステ
ップs47に移行する。
At step s45, 1 is added to j. j is 9. In step s46, it is checked whether j does not exceed tail. Since it has not exceeded, the process proceeds to step s47.

【0048】ステップs47においてj位置の第一候補
文字種とkindを照合する。両者は一致しないのでス
テップs50へ移行する。
In step s47, the first candidate character type at the j position is compared with the kind. Since both do not match, the process proceeds to step s50.

【0049】ステップs50においてj位置の第一候補
文字種をkindに代入する。ステップs51において
cntに初期値1を代入する。
In step s50, the first candidate character type at the j position is substituted for kind. In step s51, the initial value 1 is substituted for cnt.

【0050】ステップs45においてjに1を加算す
る。jは10。ステップs46においてjがtailを
超えないかどうかをチェックする。超えていないのでス
テップs47に移行する。
At step s45, 1 is added to j. j is 10. In step s46, it is checked whether j does not exceed tail. Since it has not exceeded, the process proceeds to step s47.

【0051】ステップs47においてj位置の第一候補
文字種とkindを照合する。両者は一致しないのでス
テップs50へ移行する。
In step s47, the first candidate character type at the j position is compared with kind. Since both do not match, the process proceeds to step s50.

【0052】ステップs50においてj位置の第一候補
文字種をkindに代入する。ステップs51において
cntに初期値1を代入する。
In step s50, the first candidate character type at the j position is substituted for kind. In step s51, the initial value 1 is substituted for cnt.

【0053】ステップs45においてjに1を加算す
る。jは11。ステップs46においてjがtailを
超えないかどうかをチェックする。超えていないのでス
テップs47に移行する。
At step s45, 1 is added to j. j is 11. In step s46, it is checked whether j does not exceed tail. Since it has not exceeded, the process proceeds to step s47.

【0054】ステップs47においてj位置の第一候補
文字種とkindを照合する。両者は一致しないのでス
テップs50へ移行する。
In step s47, the first candidate character type at the j position is compared with the kind. Since both do not match, the process proceeds to step s50.

【0055】ステップs50においてj位置の第一候補
文字種をkindに代入する。ステップs51において
cntに初期値1を代入する。
In step s50, the first candidate character type at the j position is substituted for kind. In step s51, the initial value 1 is substituted for cnt.

【0056】ステップs45においてjに1を加算す
る。jは12。ステップs46においてjがtailを
超えないかどうかをチェックする。超えていないのでス
テップs47に移行する。
At step s45, 1 is added to j. j is 12. In step s46, it is checked whether j does not exceed tail. Since it has not exceeded, the process proceeds to step s47.

【0057】ステップs47においてj位置の第一候補
文字種とkindを照合する。両者は一致しないのでス
テップs50へ移行する。
In step s47, the first candidate character type at the j position is compared with kind. Since both do not match, the process proceeds to step s50.

【0058】ステップs50においてj位置の第一候補
文字種をkindに代入する。ステップs51において
cntに初期値1を代入する。
In step s50, the first candidate character type at the j position is substituted for kind. In step s51, the initial value 1 is substituted for cnt.

【0059】ステップs45においてjに1を加算す
る。jは13。ステップs46においてjがtailを
超えないかどうかをチェックする。超えていないのでス
テップs47に移行する。
At step s45, 1 is added to j. j is 13. In step s46, it is checked whether j does not exceed tail. Since it has not exceeded, the process proceeds to step s47.

【0060】ステップs47においてj位置の第一候補
文字種とkindを照合する。両者は一致しないのでス
テップs50へ移行する。
In step s47, the first candidate character type at the j position is compared with the kind. Since both do not match, the process proceeds to step s50.

【0061】ステップs50においてj位置の第一候補
文字種をkindに代入する。ステップs51において
cntに初期値1を代入する。
In step s50, the first candidate character type at the j position is substituted for kind. In step s51, the initial value 1 is substituted for cnt.

【0062】ステップs45においてjに1を加算す
る。jは14。ステップs46においてjがtailを
超えないかどうかをチェックする。超えているのでステ
ップs70に移行する。即ち、7から13文字位置の範
囲ではstr1を超える同一文字種列が存在しなかっ
た。従って、当行は日本語文章と判断され、後処理部1
6による処理が行われる。
At step s45, 1 is added to j. j is 14. In step s46, it is checked whether j does not exceed tail. Since it has exceeded, the process proceeds to step s70. That is, in the range of 7 to 13 character positions, the same character type string exceeding str1 does not exist. Therefore, the bank is judged to be a Japanese sentence, and the post-processing unit 1
The process of 6 is performed.

【0063】従って、当行は日本語文章と判断され、後
処理部16による処理が行われる。
Therefore, the bank is judged to be a Japanese sentence, and the post-processing unit 16 performs the processing.

【0064】[0064]

【発明の効果】本発明はこの構成により、日本語文章を
正しく認識することができる。
According to the present invention, with this configuration, Japanese sentences can be correctly recognized.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例における文字認識方法を用い
た文字認識装置のブロック図
FIG. 1 is a block diagram of a character recognition device using a character recognition method according to an embodiment of the present invention.

【図2】本発明の一実施例における文字認識方法を用い
た文字認識装置の制御手順を示すフローチャート
FIG. 2 is a flowchart showing a control procedure of a character recognition device using a character recognition method according to an embodiment of the present invention.

【図3】本発明の一実施例における文字認識方法を用い
た文字認識装置の制御手順を示すフローチャート
FIG. 3 is a flowchart showing a control procedure of a character recognition device using a character recognition method according to an embodiment of the present invention.

【図4】本発明の一実施例における文字認識方法を用い
た文字認識装置の制御手順を示すフローチャート
FIG. 4 is a flowchart showing a control procedure of a character recognition device using a character recognition method according to an embodiment of the present invention.

【図5】本発明の一実施例における文字認識方法を用い
た文字認識装置の制御手順を示すフローチャート
FIG. 5 is a flowchart showing a control procedure of a character recognition device using a character recognition method according to an embodiment of the present invention.

【図6】本発明の一実施例における文字認識方法を用い
た文字認識装置の制御手順を示すフローチャート
FIG. 6 is a flowchart showing a control procedure of the character recognition device using the character recognition method in the embodiment of the present invention.

【符号の説明】[Explanation of symbols]

11 画像読み取り部 12 文字切り出し部 13 文字認識部 14 行分割部 15 後処理要否判定部 16 後処理部 17 出力部 18 単語辞書 11 image reading unit 12 character cutout unit 13 character recognition unit 14 line division unit 15 post-processing necessity determination unit 16 post-processing unit 17 output unit 18 word dictionary

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】画像読み取り装置から読み取った画像デー
タを一文字毎の文字画像データに切り出しする文字切り
出し部により切り出された文字画像データを文字認識し
て文字コードに変換する文字認識部により認識された文
字認識結果に対して言語処理を用いた後処理を行うにあ
たり、 認識結果に於て、1行中の文字数がしきい値以上存在
し、且つ、1行中の第一候補文字の内、単一文字種の個
数がしきい値以上連続して存在し、 且つ、1行中の第一候補文字だけを対象として候補単語
を探索した結果、しきい値以下の個数の候補単語しか得
られなかった場合、 当該認識結果は、日本語文章を認識した結果ではないと
判断し、言語処理を行わないことを特徴とする文字認識
方法。
1. A character recognition unit for recognizing character image data cut out by a character slicing unit for slicing image data read from an image reading device into character image data for each character and converting it into a character code. When performing post-processing using language processing on the character recognition result, the number of characters in one line is greater than or equal to the threshold in the recognition result, and only one of the first candidate characters in one line is detected. The number of one character type continuously existed more than the threshold value, and as a result of searching the candidate words only for the first candidate character in one line, only the number of candidate words less than the threshold value was obtained. In this case, the recognition result is determined not to be the result of recognizing a Japanese sentence, and no language processing is performed, which is a character recognition method.
JP4345945A 1992-12-25 1992-12-25 Character recognizing method Pending JPH06195521A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4345945A JPH06195521A (en) 1992-12-25 1992-12-25 Character recognizing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4345945A JPH06195521A (en) 1992-12-25 1992-12-25 Character recognizing method

Publications (1)

Publication Number Publication Date
JPH06195521A true JPH06195521A (en) 1994-07-15

Family

ID=18380071

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4345945A Pending JPH06195521A (en) 1992-12-25 1992-12-25 Character recognizing method

Country Status (1)

Country Link
JP (1) JPH06195521A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010015502A (en) * 2008-07-07 2010-01-21 Sharp Corp Information processing apparatus, control method and control program therefor, and recording medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010015502A (en) * 2008-07-07 2010-01-21 Sharp Corp Information processing apparatus, control method and control program therefor, and recording medium

Similar Documents

Publication Publication Date Title
Chaudhuri et al. A complete printed Bangla OCR system
JP3427692B2 (en) Character recognition method and character recognition device
KR100412317B1 (en) Character recognizing/correcting system
JP2991779B2 (en) Character recognition method and device
JPH07271915A (en) Text recognition by predicted synthetic shape
JPH0682403B2 (en) Optical character reader
JPH06195521A (en) Character recognizing method
JP3975825B2 (en) Character recognition error correction method, apparatus and program
JPH0528324A (en) English character recognition device
JPH11184976A (en) Dictionary learning system and character recognition device
JP3154752B2 (en) Word recognition device
JPH07200734A (en) Optical character reader
JP2939945B2 (en) Roman character address recognition device
JPH07271921A (en) Character recognizing device and method thereof
JP2851102B2 (en) Character extraction method
JP2931485B2 (en) Character extraction device and method
JPH01277989A (en) Character string pattern reader
JP3123169B2 (en) Character recognition method
JP4148966B2 (en) Pattern matching apparatus, program for realizing the same, and recording medium
JPS60110089A (en) Character recognizer
JP2004272396A (en) Character recognition device, character recognition method, character recognition program and recording medium
JPH03179498A (en) Voice japanese conversion system
JPH08297720A (en) General document reader
JP3116452B2 (en) English character recognition device
JP2972443B2 (en) Character recognition device