JPS6318483A - Character recognizing method for optical information input device - Google Patents

Character recognizing method for optical information input device

Info

Publication number
JPS6318483A
JPS6318483A JP61161683A JP16168386A JPS6318483A JP S6318483 A JPS6318483 A JP S6318483A JP 61161683 A JP61161683 A JP 61161683A JP 16168386 A JP16168386 A JP 16168386A JP S6318483 A JPS6318483 A JP S6318483A
Authority
JP
Japan
Prior art keywords
character
character pattern
pattern
cutting position
cutting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61161683A
Other languages
Japanese (ja)
Inventor
Koichi Ejiri
公一 江尻
Akira Sakurai
彰 桜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61161683A priority Critical patent/JPS6318483A/en
Publication of JPS6318483A publication Critical patent/JPS6318483A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE:To surely recognize a character string connecting characters by segmenting a proposed character pattern position from input image information, to execute pattern matching, and at the time of a reject, determining a proposed extracting position from the recognized result or the like obtained just before the rejection. CONSTITUTION:A character is segmented from a character string optically read out by a scanner 11 in an optical input device 2 at a proposed position by a character extracting unit 12 and a feature pattern 12 is extracted by a feature extracting unit 13 and matched with a dictionary pattern stored in a feature dictionary memory 15. At the time of reject, the recognized result obtained immediately before the proposed position is referred and plural proposed extracting positions are forward moved by one position to execute matching. When plural proposed position do not exist, the recognized result obtained immediately before is referred, and at the time of existence of a recognized result, an extracting point of the just preceding character pattern is forward moved by one point. At the time of no existence of a recognized result, the segmented recognition is decided as a reject. Thus, characters connected to each other in a character string can be surely recognized by the segmenting matching.

Description

【発明の詳細な説明】 [技術分野] 本発明は、原稿上の情報を光学的に読取り入力する光学
的入力装置における文字認識方法に係り、特に1文字が
互いに接続した文字列の認識を確実に行う技術に関する
ものである。
[Detailed Description of the Invention] [Technical Field] The present invention relates to a character recognition method in an optical input device that optically reads and inputs information on a document, and in particular, to a method for reliably recognizing character strings in which single characters are connected to each other. It is related to the techniques used to perform this task.

[従来技術] コンピュータを用いた画像情報処理装置の入力装置、例
えば原稿上の情報を光学的に読取り入力する光学的入力
袋!i!(以下、OCRという)においては、一般に、
テンプレート(辞書メモリ)マツチング法をベースとし
た認識法を用いて入力文字(入力画像情報)の認識を行
っている。
[Prior Art] An input device for an image information processing apparatus using a computer, such as an optical input bag that optically reads and inputs information on a document! i! (hereinafter referred to as OCR), generally,
Input characters (input image information) are recognized using a recognition method based on template (dictionary memory) matching method.

このテンプレートマツチング法をベースとした認識法で
は、各文字に対応するテンプレートは。
In the recognition method based on this template matching method, the template corresponding to each character is

第4図に示すように、幅Wの文字パターンそのもの又は
これに対応するものを標準パターン(辞書)として持っ
ている。
As shown in FIG. 4, a character pattern with a width W or a pattern corresponding thereto is provided as a standard pattern (dictionary).

そして、入力画像情報から文字を垂直射影による文字切
出し法により分離して認識している。
Then, characters are separated and recognized from the input image information using a character extraction method using vertical projection.

しかしながら、従来の垂直射影による文字切出し法では
、第5図に示すように1文字の分離が困難なパターン列
が与えられた時、第6図に示すように1文字切出し位置
候補点C工〜C1□が多すぎて、第5図に示すV工、 
V2. V3・・・・のように誤切断してしまうため、
誤認識やりジェツト(rejact)の原因となってい
た。
However, in the conventional character extraction method using vertical projection, when a pattern sequence in which it is difficult to separate one character is given as shown in FIG. There are too many C1□, so the V-work shown in Figure 5,
V2. V3... Because it will be disconnected incorrectly,
This was a cause of erroneous recognition and jets.

[目的] 本発明の目的は、原稿上の情報を光学的に読取り入力す
る光学的入力装置における文字認識方法において1文字
が互いに接続した活字印刷文字列の認識を確実に行うこ
とができる技術を提供することにある。
[Objective] The object of the present invention is to provide a technology that can reliably recognize a printed character string in which single characters are connected to each other in a character recognition method using an optical input device that optically reads and inputs information on a manuscript. It is about providing.

本発明の前記ならびにその他の目的と新規な特徴は1本
明細書の以下の記述及び添付図面によって説明する。
The above and other objects and novel features of the present invention will be explained by the following description of the specification and the accompanying drawings.

[構成] 本発明は、原稿上の情報を光学的に読取り入力する光学
的入力装置における文字認識方法において、入力された
画像情報から注目画像ブロックを抽出する段階と、この
抽出された注目画像ブロックから文字パターンの切出し
位置の候補点を決定する段階と、この候補点での切断に
おける文字パターンと辞書の文字パターンとのマツチン
グを見る段階と、このマツチングの結果がリジェクトで
ある場合、前記候補点の切断位置の直前の認識結果を参
照し、前記候補点の切断位置の直前に複数の切出し位置
候補点があれば、現文字パターンの切出し点を1つ前へ
移動し、これを現文字パターンの切°出し位置候補点と
して切断し、その切断位置における文字パターンと辞書
の文字パターンとのマツチングを見て文字認識する段階
と、前記切出し位置候補点の切断位置の直前に切出し位
置候補点がない場合には、現注目画像ブロックの直前の
認識結果を参照してその認識結果があれば、現文字パタ
ーンの直前の文字パターンの切出し切断点を1つ前に移
動し、その文字パターンの認識結果がない場合には文字
パターン切出し認識がリジェクトであるとする段階とを
具備したことを特徴とするものである。
[Structure] The present invention provides a character recognition method for an optical input device that optically reads and inputs information on a document, including a step of extracting an image block of interest from input image information, and a step of extracting the extracted image block of interest. a step of determining a candidate point for a character pattern cutting position from Referring to the recognition result immediately before the cutting position of the candidate point, if there are multiple cutting position candidate points immediately before the cutting position of the candidate point, move the cutting point of the current character pattern forward by one, and move this to the current character pattern. a cutting position candidate point is cut as a cutting position candidate point, and character recognition is performed by checking the matching of the character pattern at the cutting position with a character pattern in a dictionary; If not, refer to the recognition result immediately before the current image block of interest, and if there is a recognition result, move the cutting point of the character pattern immediately before the current character pattern one step forward, and perform recognition of that character pattern. The present invention is characterized by comprising the step of determining that character pattern cutout recognition is rejected when there is no result.

[実施例] 以下1本発明の一実施例を図面を用いて具体的に説明す
る。
[Example] An example of the present invention will be specifically described below with reference to the drawings.

なお、実施例を説明するための全回において。In addition, in all the times for explaining the example.

同一機能を有するものは同一符号を付け、その繰り返し
の説明は省略する。
Components having the same function are given the same reference numerals, and repeated explanations thereof will be omitted.

第1図は、本発明の一実施例の○CR入力装置用文字認
識方法に係るOCR入力装置の概略構成を示すブロック
図、 第2図は、第1図に示すOCR入力装置を用いた多機能
画像情報処理装置の概略構成を示すブロック図・ 第3図は1本発明の一実施例のOCR入力装置用文字認
識方法のフローチャートである。
FIG. 1 is a block diagram showing a schematic configuration of an OCR input device according to a character recognition method for a CR input device according to an embodiment of the present invention, and FIG. A block diagram showing a schematic configuration of a functional image information processing device. FIG. 3 is a flowchart of a character recognition method for an OCR input device according to an embodiment of the present invention.

本実施例のOCR入力装置用文字i1識方法を適用した
画像情報処理装置は、第2図に示すように、キーボード
1は1文字を入力する他に各種のモード(仮名漢字変換
、漢字仮名変換、OCR文字認識等)・を指定するもの
に用いる。OCR入力装置2は、原稿を光学的に読取り
入力する。処理装置3は、キーボードlやOCR入力装
置2からの入力情報について、指定されたモードに従っ
た処理を実行し、出力装置4に出力する。出力装置i!
4は、ディスプレイ装置、プリンタ等を総称して示した
ものである。処理装置8の処理に必要なプログラムメモ
リ(ROM)5に格納されるが、キーボード入力による
仮名漢字変換、OCR文字!!!識の後処理、OCR入
力された文字等の仮名漢字変換や漢字仮名変換について
できるだけ共通のアルゴリズムが利用される。データメ
モリ(RAM)6は。
As shown in FIG. 2, the image information processing apparatus to which the character i1 recognition method for an OCR input device of this embodiment is applied has a keyboard 1 for inputting a single character as well as various modes (kana-kanji conversion, kanji-kana conversion, etc.). , OCR character recognition, etc.). The OCR input device 2 optically reads and inputs a document. The processing device 3 executes processing according to a designated mode on the input information from the keyboard 1 and the OCR input device 2, and outputs the processed information to the output device 4. Output device i!
4 is a general term for display devices, printers, etc. It is stored in the program memory (ROM) 5 necessary for the processing of the processing unit 8, but it is possible to convert kana to kanji by keyboard input, OCR characters! ! ! A common algorithm is used as much as possible for the post-processing of information, the conversion of characters input by OCR into kana/kanji, and kanji/kana. Data memory (RAM) 6 is.

処理装置!!3での処理途中のデータやパラメータを格
納するのに用いられる。単語辞書メモリ7には読み表記
対応データを付加した単語辞書が格納されている。
Processing device! ! It is used to store data and parameters that are being processed in 3. The word dictionary memory 7 stores a word dictionary to which reading orthography correspondence data is added.

前記第2図に示すOCR入力装置2は、第1図に示すよ
うに、光源と電荷結合素子(COD)等からなる光学的
スキャナー11により、原稿上の文字等の画像情報を読
み取って入力する。この入力された仮名文字列又は仮名
漢字混合文字列、英字列等の画像情報を1文字切出しユ
ニット12により、第5図に示すように、1文字(幅W
□〜W S )毎に切出され、特徴抽出ユニット13で
その切出された文字の特徴を抽出する。この抽出された
データは、特徴マツチングユニット14で特徴辞書メモ
リ(ROM又はRAM)15に格納されている特徴辞書
データとのマツチングがとられる。マツチングがとれれ
ば、入力文字が認識され処理装置3に送られる。マツチ
ングがリジェクトとなった場合には、特徴マツチングユ
ニット14からリジェクト信号が発生して前記文字切出
しユニット12に送られる。
As shown in FIG. 1, the OCR input device 2 shown in FIG. 2 reads and inputs image information such as characters on a document using an optical scanner 11 comprising a light source and a charge-coupled device (COD). . The image information such as the inputted kana character string, kana-kanji mixed character string, alphabetic character string, etc. is processed by the character cutting unit 12 into one character (width W) as shown in FIG.
□ to W S ), and the feature extraction unit 13 extracts the features of the cut out characters. This extracted data is matched with feature dictionary data stored in a feature dictionary memory (ROM or RAM) 15 in a feature matching unit 14. If matching is achieved, the input characters are recognized and sent to the processing device 3. If the matching is rejected, a reject signal is generated from the feature matching unit 14 and sent to the character cutting unit 12.

次に、本実施例のOCR入力装置用文字認識方法の処理
プロセスを、第3図に示すフローチャートに従って説明
する。
Next, the processing process of the character recognition method for an OCR input device of this embodiment will be explained according to the flowchart shown in FIG.

まず、段階101で第5図に示すように注目画像ブロッ
クを抽出する。この抽出された注目画像ブロックは、少
なくとも数文字分を含む画像ブロックであり、その長さ
は、固定長であっても、可変長(単語)であってもよい
First, in step 101, an image block of interest is extracted as shown in FIG. This extracted image block of interest is an image block including at least several characters, and its length may be fixed length or variable length (word).

次に、段階102でチェック用パックトレイス(Bac
k Traca)符号を設定するカウンタを0に設定す
る。これは1文字切出しのためにパックトレイス(あと
もどり)を行っていないことを意味する。
Next, in step 102, the check pack trace (Bac
k Traca) Set the counter that sets the code to 0. This means that pack tracing (backtracking) is not performed to extract one character.

次に、段階103で画像ブロックの切出し位置候補点を
決定する。すなわち1例えば、第5図に示す文字列パタ
ーンに対応する第6図の場合、切出し位置候補点である
切断点C7が決定される。
Next, in step 103, cropping position candidate points for the image block are determined. That is, for example, in the case of FIG. 6 corresponding to the character string pattern shown in FIG. 5, the cutting point C7, which is a candidate cutting position point, is determined.

次に、段階104で前記画像ブロックの切出し位置候補
点がないかを判断し、前記第6図の例のように゛画像ブ
ロックの切出し位置候補点(切断点c 、)があれば(
No)、段階105に移り、候補点がなければ(YES
)、段W1112に移る。前記段階105では、文字パ
ターン切出しの認識を行う。
Next, in step 104, it is determined whether or not there is a candidate cropping position point for the image block, and if there is a candidate cropping position point (cutting point c,) for the image block as in the example of FIG.
No), proceed to step 105, and if there are no candidate points (YES).
), move to stage W1112. In step 105, character pattern cutout is recognized.

すなわち、第6図の切断点01〜C1を1つの文字と見
なして認識を試みる。
That is, recognition is attempted by regarding the cutting points 01 to C1 in FIG. 6 as one character.

次に、前記段階105で認識を試みたが、その!!!識
ができた(マツチングがとれた)か否かを段階106で
判断し、認識ができれば(YES)、段階107に移り
、認識ができなければ(NO)、段階108に移る1段
階108で現文字パターンの切出し位置候補点を1つ前
へ移動して段階103に戻す、前記第6図の例では、切
断点C7から1つ前の切断点C1に変更して前記同様の
段階104及び106を試みる。さらに、文字の認識が
できなければ1段階108を繰り返し、第6図に示す切
断点C,,C4と変更し、ここでやっと文字の認識が可
能となる。
Next, recognition was attempted in step 105, but that! ! ! It is judged in step 106 whether or not the recognition has been achieved (matching has been achieved). If the recognition is possible (YES), the process moves to step 107. If the recognition is not possible (NO), the process moves to step 108. In the example shown in FIG. 6, in which the character pattern cutting position candidate point is moved forward one position and returned to step 103, the cutting point C7 is changed to the previous cutting point C1, and steps 104 and 106 similar to the above are performed. try. Furthermore, if the character cannot be recognized, the first step 108 is repeated and the cutting points are changed to C, C4 shown in FIG. 6, at which point the character can finally be recognized.

ここまでは、まだ前記画像ブロック内の全部の文字につ
いての認識は、終了していないから、前記と同じ規準で
切断点04〜C1を切出し位置候補点とする。
Up to this point, recognition of all the characters in the image block has not yet been completed, so cutting points 04 to C1 are set as candidate cutting points using the same criteria as above.

すなわち、段階107に移る0段階107でバックトレ
イス=Oの認識結果(文字コード列)を出力する。この
認識結果の出力データから注目画像ブロック内の文字認
識が終了したか否かを段階109で判断し、終了してい
れば(YES)、段階110に移り、ブロック抽出範囲
の移動を行う。
That is, in step 107, the recognition result (character code string) of backtrace=O is output. Based on the output data of this recognition result, it is determined in step 109 whether or not character recognition in the image block of interest has been completed. If it has been completed (YES), the process moves to step 110 and the block extraction range is moved.

次に1段階111で抽出する画像ブロックがないかを判
断し、抽出する画像ブロックがなければ(YES)、O
CR入力装置用文字認識方法の処理プロセスが終る。抽
出する画像ブロックがあれば(No)、段階101に戻
す。
Next, in step 111, it is determined whether there is any image block to be extracted, and if there is no image block to be extracted (YES), O
The processing process of the character recognition method for CR input device is completed. If there is an image block to be extracted (No), the process returns to step 101.

次に、前記段階104で前記画像ブロックの切出し位置
候補点がないかを判断し、画像ブロックの切出し位置候
補点がなければ(YES)、段階112に移る。すなわ
ち、第6図に示す例では1次の対象文字パターンは、切
断点C1゜〜C工、であるが、これは、対応する文字が
ないから!!誠に失敗する。そこで、切断点C1゜〜C
01の間に切断すべき候補点はないから段階112でバ
ック・トレイス・カウンタが「1」であるかを調べ、「
1」であれば(YES)、段階116に移り、リジェク
ト処理をして前記段階105に戻す、前記バック・トレ
イス・カウンタが「0」であれば(NO)1段階113
に移り、現画像ブロックの直前の認識結果は存在するか
を判断し、認識結果があれば(YES)、段階114に
移る。認識結果がなければ(No)、段階116に移り
、リジェクト処理をして前記段階105に戻す。
Next, in the step 104, it is determined whether there is a candidate cropping position point for the image block, and if there is no candidate cropping position point for the image block (YES), the process moves to step 112. That is, in the example shown in FIG. 6, the primary target character pattern is the cutting points C1° to C, but this is because there is no corresponding character! ! Really fail. Therefore, the cutting point C1°~C
Since there is no candidate point to cut between 01 and 01, it is checked in step 112 whether the back trace counter is ``1'', and ``
If the back trace counter is "1" (YES), proceed to step 116, perform a reject process, and return to step 105; if the back trace counter is "0" (NO), step 113
Then, it is determined whether there is a recognition result immediately before the current image block, and if there is a recognition result (YES), the process moves to step 114. If there is no recognition result (No), the process moves to step 116, a reject process is performed, and the process returns to step 105.

前記段階114では直前の画像ブロックのパターンの切
断点を1つ前に移動し、段階115で切断候補がないか
の判断を行い、切断候補があれば(No)、前記段階1
05に戻す、切断候補がなければ(YES)、段階11
6に移り、リジェクト処理をして前記段階105に戻す
In step 114, the cutting point of the pattern of the immediately previous image block is moved forward by one, and in step 115, it is determined whether there is a cutting candidate. If there is a cutting candidate (No), step 1 is performed.
Return to 05, if there are no cutting candidates (YES), step 11
6, a reject process is performed and the process returns to step 105.

すなわち、前記第6図に示す例では、前記段階114で
は直前の画像ブロックのパターンの切断点C8゜を1つ
前の切断点Csに移動し、バック・トレイス・カウンタ
を「1」にする、切断点07〜C9のパターンが認識さ
れ1文字「u」が認識される。ここでバック・トレイス
・カウンタが「0」となる。
That is, in the example shown in FIG. 6, in step 114, the cutting point C8° of the pattern of the immediately previous image block is moved to the previous cutting point Cs, and the back trace counter is set to "1". The pattern of cutting points 07 to C9 is recognized and one character "u" is recognized. At this point, the back trace counter becomes "0".

次に、切断点Cg〜C1□のパターンが切り出さ 。Next, a pattern with cutting points Cg to C1□ is cut out.

れ、前記と同様の処理がなされると1文字rnJが認識
される。最後に切断点011〜C1□が認識され、注目
ブロックの処理はすべて終了する。
When the same processing as above is performed, one character rnJ is recognized. Finally, the cutting points 011 to C1□ are recognized, and all processing of the block of interest is completed.

以上、本発明を実施例にもとすき具体的に説明したが1
1本発明は、前記実施例に限定されるものではなく、そ
の要旨を逸脱しない範囲において種々変更可能であるこ
とは言うまでもない。
The present invention has been specifically explained above using examples.
1. It goes without saying that the present invention is not limited to the embodiments described above, and can be modified in various ways without departing from the spirit thereof.

〔発明の効果〕〔Effect of the invention〕

以上、説明したように1本発明によれば、以下に述べる
効果を得ることができる。
As described above, according to the present invention, the following effects can be obtained.

原稿上の情報を光学的に読取り入力する光学的入力装置
における文字認識方法において、入力された画像情報か
ら注目画像ブロックを抽出する段階と、この抽出された
注目画像ブロックから文字パターンの切出し位置の候補
点を決定する段階と、この候補点での切断における文字
パターンと辞書の文学パターンとのマツチングを見る段
階と、このマツチングの結果がリジェクトである場合、
前記候補点の切断位置の直前の認識結果を参照し。
In a character recognition method using an optical input device that optically reads and inputs information on a document, there are two steps: extracting an image block of interest from input image information, and determining the cutout position of a character pattern from this extracted image block of interest. A step of determining a candidate point, a step of checking the matching between the character pattern cut at this candidate point and the literary pattern in the dictionary, and if the result of this matching is a reject,
Refer to the recognition result immediately before the cutting position of the candidate point.

前記候補点の切断位置の直前に複数の切出し位置候補点
があれば、現文字パターンの切出し点を1つ前へ移動し
、これを現文字パターンの切出し位置候補点として切断
し、その切断位置における文字パターンと辞書の文字パ
ターンとのマツチングを見て文字認識する段階と、前記
切出し位置候補点の切断位置の直前に切出し位置候補点
がない場合には、現注目画像ブロックの直前の認識結果
を参照してその認識結果があれば、現文字パターンの直
前の文字パターンの切出し切断点を1つ前に移動し、そ
の文字パターンの認識結果がない場合には文字パターン
切出し1mがリジェクトであるとする段階とを備えたの
で、抽出された文字が互いに接続した活字印刷等の文字
列からなる注目画像ブロックの全ての文字について確実
に認識することができる。
If there are multiple cutting position candidate points immediately before the cutting position of the candidate point, move the cutting point of the current character pattern forward by one, cut this as the cutting position candidate point of the current character pattern, and set the cutting position. character recognition by looking at the matching between the character pattern and the character pattern in the dictionary; and if there is no cutting position candidate point immediately before the cutting position of the cutting position candidate point, the recognition result immediately before the current image block of interest; If there is a recognition result, move the cutout point of the character pattern immediately before the current character pattern one step forward, and if there is no recognition result for that character pattern, character pattern cutout 1m is rejected. Therefore, it is possible to reliably recognize all the characters in the image block of interest, which is composed of character strings such as printed characters in which the extracted characters are connected to each other.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は1本発明の一実施例のOCR入方装置用文字認
識方法に係るOCR入方装置の概略構成を示すブロック
図、 第2図は、第1図に示すOCR入方装置を用いた多機能
画像情報処理装置の概略構成を示すブロック図、 第3図は、本発明の一実施例のOCR入カ装置用文字認
識方法のフローチャート 第4図乃至第6図は1本発明のOCR入力装置用文字認
識方法における文字切出し処理を説明するための図であ
る。 図中、3・・・処理装置、11・・・スキャナー、12
・・・文字切出しユニット、13・・・特徴抽出ユニッ
ト。 14・・・特徴マツチングユニット、15・・・特徴辞
書メモリである。
FIG. 1 is a block diagram showing a schematic configuration of an OCR input device according to a character recognition method for an OCR input device according to an embodiment of the present invention. FIG. FIG. 3 is a flowchart of a character recognition method for an OCR input device according to an embodiment of the present invention. FIG. 3 is a diagram for explaining character extraction processing in a character recognition method for an input device. In the figure, 3...processing device, 11...scanner, 12
...Character extraction unit, 13...Feature extraction unit. 14... Feature matching unit, 15... Feature dictionary memory.

Claims (1)

【特許請求の範囲】[Claims] (1)原稿上の情報を光学的に読取り入力する光学的入
力装置における文字認識方法において、入力された画像
情報から注目画像ブロックを抽出する段階と、この抽出
された注目画像ブロックから文字パターンの切出し位置
の候補点を決定する段階と、この候補点での切断におけ
る文字パターンと辞書の文字パターンとのマッチングを
見る段階と、このマッチングの結果がリジェクトである
場合、前記候補点の切断位置の直前の認識結果を参照し
、前記候補点の切断位置の直前に複数の切出し位置候補
点があれば、現文字パターンの切出し位置候補点を1つ
前へ移動し、これを現文字パターンの切出し位置候補点
として切断し、その切断位置における文字パターンと辞
書の文字パターンとのマッチングを見て文字認識する段
階と、前記切出し位置候補点の切断位置の直前に切出し
位置候補点がない場合には、現注目画像ブロックの直前
の認識結果を参照してその認識結果があれば、現文字パ
ターンの直前の文字パターンの切出し切断点を1つ前の
候補点に移動し、その文字パターンの認識結果がない場
合には文字パターン切出し認識がリジェクトであるとす
る段階とを具備したことを特徴とする光学的情報入力装
置用文字認識方法。
(1) In a character recognition method using an optical input device that optically reads and inputs information on a document, there are two steps: extracting an image block of interest from input image information, and extracting a character pattern from the extracted image block of interest. a step of determining a candidate point for the cutting position, a step of checking the matching of the character pattern for cutting at this candidate point with a character pattern in the dictionary, and, if the result of this matching is a reject, a step of determining the cutting position of the candidate point. Referring to the previous recognition result, if there are multiple cutting position candidate points immediately before the cutting position of the candidate point, move the cutting position candidate point of the current character pattern forward by one, and use this as the cutting position candidate point of the current character pattern. A step of cutting as a position candidate point and recognizing a character by checking the matching between the character pattern at the cutting position and a character pattern in a dictionary, and when there is no cutting position candidate point immediately before the cutting position of the cutting position candidate point. , refers to the recognition result immediately before the current image block of interest, and if there is a recognition result, moves the cutting point of the character pattern immediately before the current character pattern to the previous candidate point, and calculates the recognition result of that character pattern. 1. A character recognition method for an optical information input device, comprising the step of rejecting character pattern cutout recognition if there is no character pattern.
JP61161683A 1986-07-09 1986-07-09 Character recognizing method for optical information input device Pending JPS6318483A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61161683A JPS6318483A (en) 1986-07-09 1986-07-09 Character recognizing method for optical information input device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61161683A JPS6318483A (en) 1986-07-09 1986-07-09 Character recognizing method for optical information input device

Publications (1)

Publication Number Publication Date
JPS6318483A true JPS6318483A (en) 1988-01-26

Family

ID=15739861

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61161683A Pending JPS6318483A (en) 1986-07-09 1986-07-09 Character recognizing method for optical information input device

Country Status (1)

Country Link
JP (1) JPS6318483A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01279383A (en) * 1988-04-30 1989-11-09 Sharp Corp Method for modifying character code

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01279383A (en) * 1988-04-30 1989-11-09 Sharp Corp Method for modifying character code

Similar Documents

Publication Publication Date Title
JP2726568B2 (en) Character recognition method and device
US6834121B2 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
US5265171A (en) Optical character reading apparatus for performing spelling check
JPS62221088A (en) Optical type character reader
JPS6318483A (en) Character recognizing method for optical information input device
JPH07200734A (en) Optical character reader
JPS61150081A (en) Character recognizing device
JPS62281082A (en) Character recognizing device
JP2995825B2 (en) Japanese character recognition device
JPS6120180A (en) Optical character recognizing device
JP2851865B2 (en) Character recognition device
JPH03150690A (en) Character recognizing device
JPH01259476A (en) Character reader
JPS61220081A (en) Segmentation and recognition system for pattern
JPH0318987A (en) Dictionary registering method
JPH08129608A (en) Character recognition device
JPH0353392A (en) Character recognizing device
JPH06180767A (en) Character recognizing device
JPH07122890B2 (en) Document reader device with separated character processing function
JPS62295193A (en) Type recognizing method
JPH05189614A (en) Optical character reader
JPH0660227A (en) Preparation of character recognition dictionary and character recognizing method using thereof
JPH02292691A (en) Character recognizing device
JPH03273361A (en) Electronic dictionary
JPS6327991A (en) Formation of histogram for input information recognizing device