JP3217442B2 - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JP3217442B2
JP3217442B2 JP10960292A JP10960292A JP3217442B2 JP 3217442 B2 JP3217442 B2 JP 3217442B2 JP 10960292 A JP10960292 A JP 10960292A JP 10960292 A JP10960292 A JP 10960292A JP 3217442 B2 JP3217442 B2 JP 3217442B2
Authority
JP
Japan
Prior art keywords
character
symbol
dictionary
characters
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP10960292A
Other languages
Japanese (ja)
Other versions
JPH05303669A (en
Inventor
健司 三縞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10960292A priority Critical patent/JP3217442B2/en
Publication of JPH05303669A publication Critical patent/JPH05303669A/en
Application granted granted Critical
Publication of JP3217442B2 publication Critical patent/JP3217442B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】この発明は、辞書サブセットを動
的に制御する光学的文字読み取り装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reader for dynamically controlling a dictionary subset.

【0002】[0002]

【従来の技術】近年、OCR(光学的文字認識装置)
は、文字認識技術の進歩に伴い、小型、高性能化が図ら
れ、比較的安価に供給されるようになった。このOCR
は一般に広く普及され、最近では比較的高性能なパーソ
ナルコンピュータの周辺装置としても接続されるように
なり、あらゆるアプリケーションに頻繁に使用されるよ
うになった。
2. Description of the Related Art In recent years, OCR (optical character recognition device) has been developed.
With the advancement of character recognition technology, small size and high performance have been achieved, and they have been supplied at relatively low cost. This OCR
Has become widespread in general, and has recently been connected as a peripheral device of a relatively high-performance personal computer, and has been frequently used for all applications.

【0003】OCRは、スキャナによって帳票を走査し
て、その帳票イメージをイメージデータに変換し、イメ
ージデータから文字パターンを切り出し、この文字パタ
ーンと内蔵する認識辞書との比較照合により文字認識を
行なう。
The OCR scans a form with a scanner, converts the form image into image data, cuts out a character pattern from the image data, and performs character recognition by comparing and comparing this character pattern with a built-in recognition dictionary.

【0004】ところで、上述したOCRは、従来、図4
に示す読み取り帳票の金額欄のように、さまざまな書式
で記入あるいは印字された帳票(a)〜(f)を認識す
る場合、全て同じ辞書サブセットを用いることにより行
われる。即ち、図4の例では、“0〜9”、“*”、
“¥”を用いて認識している。
Incidentally, the above-mentioned OCR is conventionally used in FIG.
When recognizing the forms (a) to (f) written or printed in various formats as shown in the amount column of the read form shown in FIG. That is, in the example of FIG. 4, "0-9", "*",
Recognition is made using “¥”.

【0005】[0005]

【発明が解決しようとする課題】上述した従来例に従え
ば、「数字」を認識する場合であっても“*”や“¥”
の辞書と照合する必要があるため、高速化の妨げとな
り、また、図4に示す(b)を“¥123¥*”等と不
自然に誤認識する可能性があったりして認識率が良くな
い。
According to the above-described conventional example, even when a "numeric character" is recognized, "*" or "@"
Since it is necessary to perform matching with the dictionary of FIG. 4, it may hinder speeding up, and the recognition rate may be unnaturally erroneously recognized as “{123} *” or the like shown in FIG. Not good.

【0006】この発明は上記事情に鑑みてなされたもの
であり、文字をあらかじめ定めた順序で認識し、途中の
文字を認識する際は、それまでに認識した文字の認識結
果によって、辞書サブセットを動的に可変とすることに
より、認識時間を短縮し、かつ認識率を向上させた光学
的文字読み取り装置を提供することを目的とする。
The present invention has been made in view of the above circumstances, and recognizes characters in a predetermined order. When recognizing characters in the middle, a dictionary subset is recognized based on the recognition result of the characters recognized so far. It is an object of the present invention to provide an optical character reading device in which a recognition time is shortened and a recognition rate is improved by dynamically changing the character.

【0007】[0007]

【課題を解決するための手段】の発明の光学的文字読
み取り装置は、金額の単位を示す第1の記号と金額の単
位以外を示す第2の記号と数字との中から少なくとも数
字が第1の端から第2の端に向かう方向に配置されてお
り、前記第1及び第2の記号が配置される場合は前記数
字よりも前記第1の端側だけに配置されてなる複数の文
字が記録された帳票の文字の読み取りをする光学的文字
読み取り装置であって、前記帳票上を走査して前記帳票
のイメージを読み取りイメージデータを得るイメージス
キャナと、このイメージスキャナで読み取ったイメージ
データを格納するイメージメモリと、このイメージメモ
リに格納されたイメージデータから文字パターンを切り
出す文字切り出し手段と、前記文字パターンと照合する
ための前記第1の記号と前記第2の記号と前記数字とに
対応する辞書を格納した辞書メモリと、前記帳票に記録
された前記複数の文字のうちの前記第1の端の文字から
前記第2の端の方向に隣接する文字を順次前記切り出し
手段から切り出された文字パターンと前記辞書メモリに
格納された辞書とを照合することにより文字認識する文
字認識手段と、前記文字認識手段が文字認識する際に照
合する前記辞書メモリに格納された辞書を指定するため
のもので、初期設定として前記第1の記号と前記第2の
記号と前記数字とに対応する辞書と照合することを指定
し、以後順次前記文字認識手段の文字認識結果に基づい
て次の文字を認識する際に、文字認識結果が前記第1の
記号である場合には前記第2の記号と前記数字とに対応
する辞書と照合することを指定する辞書サブセット制御
手段とを具備することを特徴とする。また、この発明の
光学的文字読み取り装置は、金額の単位を示す第1の記
号と金額の単位以外を示す第2の記号と数字との中から
少なくとも数字が第1の端から第2の端に向かう方向に
配置されており、前記第1及び第2の記号が配置される
場合は前記数字よりも前記第1の端側だけに配置されて
なる複数の文字が記録された帳票の文字の読み取りをす
る光学的文字読み取り装置であって、前記帳票上を走査
して前記帳票のイメージを読み取りイメージデータを得
るイメージスキャナと、このイメージスキャナで読み取
ったイメージデータを格納するイメージメモリと、この
イメージメモリに格納されたイメージデータから文字パ
ターンを切り出す文字切り出し手段と、前記文字パター
ンと照合するための前記第1の記号と前記第2の記号と
前記数字とに対応する辞書を格納した辞書メモリと、前
記帳票に記録された前記複数の文字のうちの前記第1の
端の文字から前記第2の端の方向に隣接する文字を順次
前記切り出し手段から切り出された文字パターンと前記
辞書メモリに格納された辞書とを照合することにより文
字認識する文字認識手段と、前記文字認識手段が文字認
識する際に照合する前記辞書メモリに格納された辞書を
指定するためのもので、初期設定として前記第1の記号
と前記第2の記号と前記数字とに対応する辞書と照合す
ることを指定し、以後順次前記文字認識手段の文字認識
結果に基づいて次の文字を認識する際に、文字認識結果
が前記数字である場合には前記数字に対応する辞書と照
合することを指定し、文字認識結果が前記第1の記号で
かつその1つ前の文字認識結果が前記第2の記号の場合
には前記数字に対応する辞書と照合することを指定し、
文字認識結果が前記第1の記号でかつその1つ前の文字
認識結果が前記第2の記号でない場合には前記第2の記
号と前記数字とに対応する辞書と照合することを指定す
る辞書サブセット制御手段とを具備することを特徴とす
る。
Optical character reader of this invention, in order to solve the above-mentioned object, at least numbers first from the second symbol and the number indicating the non-first symbol from the monetary units that a unit amount A plurality of characters are arranged in a direction from one end to a second end, and when the first and second symbols are arranged, the characters are arranged only on the first end side of the numeral. An optical character reading device for reading the characters of a form on which is recorded, an image scanner that scans the form and reads the image of the form to obtain image data, and an image scanner that reads the image data read by the image scanner. An image memory for storing, a character extracting unit for extracting a character pattern from the image data stored in the image memory, and the first memory for collating with the character pattern. A dictionary memory storing a dictionary corresponding to a symbol, the second symbol, and the numeral; and a direction from the first end character to the second end of the plurality of characters recorded in the form. Character recognition means for recognizing a character by comparing a character pattern cut out from the cutout means with a character pattern sequentially cut out from the cutout means and a character recognition means when the character recognition means recognizes a character. This is for designating a dictionary stored in the dictionary memory. As an initial setting, it is designated to match with the dictionary corresponding to the first symbol, the second symbol, and the numeral, and thereafter, the character is sequentially designated. When recognizing the next character based on the character recognition result of the recognizing means, when the character recognition result is the first symbol, it is checked against the dictionary corresponding to the second symbol and the numeral. specify Characterized by comprising a write subsets control means. Further, the optical character reading apparatus of the present invention is characterized in that at least a numeral is selected from a first end and a second end from a first symbol indicating a unit of money and a second symbol and a numeral indicating a unit other than the unit of money. When the first and second symbols are arranged, a plurality of characters arranged only on the first end side of the numeral are recorded on a form in which characters are recorded. An optical character reader for reading, comprising: an image scanner that scans the form to read an image of the form to obtain image data; an image memory that stores image data read by the image scanner; Character extracting means for extracting a character pattern from image data stored in a memory; and a first symbol and a second symbol for collating with the character pattern A dictionary memory in which a dictionary corresponding to a serial number is stored, and characters that are adjacent to each other in the direction from the first end to the second end of the plurality of characters recorded in the form are sequentially cut out. Character recognition means for recognizing a character by collating a character pattern cut out from the means with a dictionary stored in the dictionary memory; and a dictionary stored in the dictionary memory for collating when the character recognition means recognizes a character. Is specified as an initial setting to match with the dictionary corresponding to the first symbol, the second symbol, and the numeral, and thereafter, based on the character recognition result of the character recognition unit. When recognizing the next character, if the character recognition result is the numeral, specify that the character is to be compared with the dictionary corresponding to the numeral, and the character recognition result is the first symbol and the character immediately before the first symbol. of If character recognition result of the second symbol Specifies a match dictionary corresponding to the numbers,
If the character recognition result is the first symbol and the immediately preceding character recognition result is not the second symbol, a dictionary that specifies to collate with the dictionary corresponding to the second symbol and the number And a subset control unit.

【0008】[0008]

【作用】本発明の光学的文字読み取り装置は、金額の単
位を示す第1の記号と金額の単位以外を示す第2の記号
と数字との中から少なくとも数字が第1の端から第2の
端に向かう方向に配置されており、この第1及び第2の
記号が配置される場合は数字よりも第1の端側だけに配
置されてなる複数の文字が記録された帳票上を走査して
その帳票イメージのイメージデータを得て、そのイメー
ジデータから文字パターンを切り出し、帳票に記録され
た複数の文字のうちの第1の端の文字から第2の端の方
向に隣接する文字を順次切り出された文字パターンと辞
書メモリに格納された辞書とを照合することにより文字
認識する。このとき、辞書サブセット制御手段は
(1)初期設定として第1の記号と第2の記号と数字と
に対応する辞書と照合することを指定し、以後順次各文
字認識結果に基づいて次の文字を認識する際に、文字認
識結果が第1の記号である場合には第2の記号と数字と
に対応する辞書と照合すること、(2)初期設定として
第1の記号と第2の記号と数字とに対応する辞書と照合
することを指定し、以後順次各文字認識結果に基づいて
次の文字を認識する際に、文字認識結果が数字である場
合には数字に対応する辞書と照合することを指定し、文
字認識結果が第1の記号でかつその1つ前の文字認識結
果が第2の記号の場合には数字に対応する辞書と照合す
ることを指定し、文字認識結果が第1の記号でかつその
1つ前の文字認識結果が第2の記号でない場合には第2
の記号と数字とに対応する辞書と照合すること、を指定
する。このように、既に認識を行った文字の認識結果に
基づいて、次に認識しようとする文字と照合する辞書を
動的に制御することにより、認識時間の短縮化ならびに
認識率の向上が図れることになる。
According to the optical character reading apparatus of the present invention, at least a numeral is selected from a first symbol indicating a unit of money, a second symbol indicating a unit other than the unit of money, and a numeral. In the case where the first and second symbols are arranged, the document is scanned on a form on which a plurality of characters arranged only on the first end side than the numbers are recorded. The image data of the form image is obtained from the image data, a character pattern is cut out from the image data, and a plurality of characters recorded on the form are sequentially read from a character at a first end to a character adjacent to a second end. Characters are recognized by comparing the cut-out character pattern with the dictionary stored in the dictionary memory. At this time, the dictionary subset control means :
(1) Initially, it is specified to match with the dictionary corresponding to the first symbol, the second symbol, and the numeral. Thereafter, when recognizing the next character based on each character recognition result, character recognition is performed. If the result is the first symbol, check with the dictionary corresponding to the second symbol and the number; (2) Initially set the dictionary corresponding to the first symbol, the second symbol and the number When the character recognition result is a number when the next character is sequentially recognized based on each character recognition result, it is specified to perform the matching with the dictionary corresponding to the number. If the result is the first symbol and the preceding character recognition result is the second symbol, it specifies to match with the dictionary corresponding to the number, and the character recognition result is the first symbol and the first If the previous character recognition result is not the second symbol, the second
Specifies to match with the dictionary corresponding to the symbol and the number. In this way, by dynamically controlling the dictionary for collating with the character to be recognized next based on the recognition result of the character that has already been recognized, the recognition time can be reduced and the recognition rate can be improved. become.

【0009】[0009]

【実施例】以下、図面を使用して本発明の実施例につい
て説明する。図1は本発明の実施例を示すブロック図で
ある。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of the present invention.

【0010】図において、符号1はスキャナであり、帳
票を走査し、イメージデータに変換するコンポーネント
である。符号2はイメージメモリであり、スキャナを介
して得られるイメージデータが格納される。符号3は文
字切出部であり、イメージメモリ2に格納されたイメー
ジデータから文字パターンを切り出すコンポーネントで
ある。符号4は文字認識部であり、切り出された文字パ
ターンと後述する認識辞書とを照合して文字を認識する
コンポーネントである。符号5は辞書メモリであり、認
識辞書を格納する。符号6は認識順序制御部であり、文
字の認識順序を制御する。
In FIG. 1, reference numeral 1 denotes a scanner, which is a component that scans a form and converts it into image data. Reference numeral 2 denotes an image memory, which stores image data obtained via a scanner. Reference numeral 3 denotes a character extracting unit, which is a component for extracting a character pattern from the image data stored in the image memory 2. Reference numeral 4 denotes a character recognizing unit, which is a component for recognizing characters by collating a cut-out character pattern with a recognition dictionary described later. Reference numeral 5 denotes a dictionary memory for storing a recognition dictionary. Reference numeral 6 denotes a recognition order control unit, which controls the recognition order of characters.

【0011】符号7は本発明のポイントとなる辞書サブ
セット制御部であり、既に認識を行った文字の認識結果
により、次に認識しようとする文字に照合する辞書サブ
セットを制御する。図2は本発明実施例の動作を示すフ
ローチャートである。
Reference numeral 7 denotes a dictionary subset control unit which is a point of the present invention, and controls a dictionary subset to be collated with a character to be recognized next, based on a recognition result of a character which has already been recognized. FIG. 2 is a flowchart showing the operation of the embodiment of the present invention.

【0012】以下、図1に示す本発明実施例の動作につ
いて図2を参照しながら詳細に説明する。ここでは図4
に示した金額欄を認識する場合を例示する。この場合に
扱う書式は次の(A)〜(F)で示す6通りとする。 (A)数字のみ (B)数字の前に“¥”が一文字 (C)数字の前が“*”文字 (D)数字の前に“*”が複数文字 (E)数字の前に“¥”が一文字、その前に“*”が一
文字または複数文字 (F)数字の前に“*”が一文字または複数文字、その
前に“¥”が一文字 つまり、金額欄を左側から順に見ていくと、(A)は数
字の後は数字、()は¥の後に¥は現れない、(
は“*”の後は数字でなければならない。
Hereinafter, the operation of the embodiment of the present invention shown in FIG. 1 will be described in detail with reference to FIG. Here, FIG.
An example of recognizing the amount column shown in FIG. The formats handled in this case are six types shown in the following (A) to (F). (A) Numeric characters only (B) A single character “¥” before a numeral (C) A character “*” before a numeral (D) A plurality of characters “*” before a numeral (E) A character “¥” before a numeral "" Is one character, and "*" is one or more characters before it. (F) "*" is one or more characters before the number, and "¥" is one character before it. (A) is a number after a number, ( B ) is a number that does not appear after ¥, ( C )
Must be a number after “*”.

【0013】そこで、認識順序制御部6は、左側から順
に認識するように、文字認識部4を制御する。辞書サブ
セット制御部7は、まず初期の辞書サブセットを“0〜
9”、“*”、“¥”とし、その後、上記(A)、
(B)、(C)を満たすように、図2に示すフローチャ
ートに従って辞書サブセットを変化させる。即ち、認識
結果が数字であるか否かをチェックし、数字であれば、
辞書サブセットを“0〜9”とし、繰り返し次の文字を
認識するステップに移る。否であれば続いて認識結果が
¥であるか否かをチェックする。ここで“¥”であれば
辞書サブセットから¥を取り除き、前の文字の認識結果
は*であることをチェックする。ここで*であることが
認識されたら辞書サブセッを0〜9とし、否であれば繰
り返し次の文字を認識するステップに移る。これによ
り、不必要な辞書との照合を無くし、また、不自然な誤
読を無くすことができる。
Therefore, the recognition order control unit 6 controls the character recognition unit 4 so that recognition is performed in order from the left. The dictionary subset control unit 7 first sets the initial dictionary subset to “0”
9 ”,“ * ”,“ ¥ ”, and then (A),
The dictionary subset is changed according to the flowchart shown in FIG. 2 so as to satisfy (B) and (C). That is, it is checked whether or not the recognition result is a number.
The dictionary subset is set to “0 to 9”, and the process proceeds to the step of repeatedly recognizing the next character. If not, then it is checked whether the recognition result is ¥. If “¥” here, ¥ is removed from the dictionary subset, and it is checked that the recognition result of the previous character is *. Here, if it is recognized as *, the dictionary subset is set to 0 to 9; if not, the process proceeds to the step of repeatedly recognizing the next character. Thus, unnecessary collation with the dictionary can be eliminated, and unnatural misreading can be eliminated.

【0014】図3に具体例を示す。図3のような住所欄
を認識する場合、都道府県欄の認識結果により、次の市
郡区欄を認識する際の辞書セブセットを限定することが
できる。例えば、都道府県欄の認識結果が“東京都”で
ある場合、市郡区欄は、東京都内の市郡区名に含まれる
文字の辞書サブセットで認識すればよい。
FIG. 3 shows a specific example. In the case of recognizing the address column as shown in FIG. 3, it is possible to limit the dictionary subset when recognizing the next city / district column based on the recognition result of the prefecture column. For example, when the recognition result of the prefecture column is “Tokyo”, the city / county column may be recognized with a dictionary subset of characters included in the city / county name in Tokyo.

【0015】[0015]

【発明の効果】以上説明のように本発明によれば、既に
認識を行った文字の認識結果により、次に認識しようと
する文字に照合する辞書サブセットを動的に制御するこ
とにより、認識時間の短縮化ならびに認識率の向上に寄
与する。
As described above, according to the present invention, the recognition time is dynamically controlled by dynamically controlling the dictionary subset to be collated with the character to be recognized next, based on the recognition result of the character already recognized. This contributes to shortening and improving the recognition rate.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例を示すブロック図。FIG. 1 is a block diagram showing an embodiment of the present invention.

【図2】本発明実施例の動作を示すフローチャート。FIG. 2 is a flowchart showing the operation of the embodiment of the present invention.

【図3】本発明実施例の動作を説明するための文字認識
帳票の一例を示す図。
FIG. 3 is a view showing an example of a character recognition form for explaining the operation of the embodiment of the present invention.

【図4】従来における文字認識帳票の一例を示す図。FIG. 4 is a diagram showing an example of a conventional character recognition form.

【符号の説明】[Explanation of symbols]

1…スキャナ、2…イメージメモリ、3…文字切り出し
部、4…文字認識部、5…辞書メモリ、6…認識順序制
御部、7…辞書サブセット制御部。
DESCRIPTION OF SYMBOLS 1 ... scanner, 2 ... image memory, 3 ... character extraction part, 4 ... character recognition part, 5 ... dictionary memory, 6 ... recognition order control part, 7 ... dictionary subset control part.

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 金額の単位を示す第1の記号と金額の単
位以外を示す第2の記号と数字との中から少なくとも数
字が第1の端から第2の端に向かう方向に配置されてお
り、前記第1及び第2の記号が配置される場合は前記数
字よりも前記第1の端側だけに配置されてなる複数の文
字が記録された帳票の文字の読み取りをする光学的文字
読み取り装置であって、 前記帳票上を走査して前記帳票のイメージを読み取りイ
メージデータを得るイメージスキャナと、 このイメージスキャナで読み取ったイメージデータを格
納するイメージメモリと、 このイメージメモリに格納されたイメージデータから文
字パターンを切り出す文字切り出し手段と、 前記文字パターンと照合するための前記第1の記号と前
記第2の記号と前記数字とに対応する辞書を格納した辞
書メモリと、 前記帳票に記録された前記複数の文字のうちの前記第1
の端の文字から前記第2の端の方向に隣接する文字を順
次前記切り出し手段から切り出された文字パターンと前
記辞書メモリに格納された辞書とを照合することにより
文字認識する文字認識手段と、 前記文字認識手段が文字認識する際に照合する前記辞書
メモリに格納された辞書を指定するためのもので、初期
設定として前記第1の記号と前記第2の記号と前記数字
とに対応する辞書と照合することを指定し、以後順次前
記文字認識手段の文字認識結果に基づいて次の文字を認
識する際に、文字認識結果が前記第1の記号である場合
には前記第2の記号と前記数字とに対応する辞書と照合
することを指定する辞書サブセット制御手段と を具備す
ることを特徴とする光学的文字読み取り装置。
1. A first symbol indicating a unit of money and a unit of money
At least a number from the second symbol and the number that indicate other than the place
The characters are arranged in a direction from the first end to the second end.
If the first and second symbols are arranged, the number
A plurality of sentences arranged only on the first end side of the character
Optical characters to read the characters of the form where the characters were recorded
A reading device that scans the form and reads an image of the form.
An image scanner that obtains image data and an image scanner that reads the image data
An image memory for pay, text from the image data stored in this image memory
Character extracting means for extracting a character pattern; and a first symbol for comparing the character pattern with the first symbol.
A dictionary storing a dictionary corresponding to the second symbol and the numeral
And a first memory of the plurality of characters recorded in the form.
In order from the character at the end to the character adjacent to the direction of the second end.
Next character pattern cut out from the cutting means and the previous
By comparing with the dictionary stored in the dictionary memory
Character recognition means for character recognition, and the dictionary to be collated when the character recognition means recognizes characters
This is used to specify a dictionary stored in memory.
The first symbol, the second symbol, and the numeral as setting
To match the dictionary corresponding to
The next character is recognized based on the character recognition result of the character
When recognizing, the character recognition result is the first symbol
Matches with the dictionary corresponding to the second symbol and the number
To and a dictionary subset control means for specifying that
An optical character reading device, comprising:
【請求項2】 金額の単位を示す第1の記号と金額の単
位以外を示す第2の記号と数字との中から少なくとも数
字が第1の端から第2の端に向かう方向に配置されてお
り、前記第1及び第2の記号が配置される場合は前記数
字よりも前記第1の端側だけに配置されてなる複数の文
字が記録された帳票の文字の読み取り をする光学的文字
読み取り装置であって、 前記帳票上を走査して前記帳票のイメージを読み取りイ
メージデータを得るイメージスキャナと、 このイメージスキャナで読み取ったイメージデータを格
納するイメージメモリと、 このイメージメモリに格納されたイメージデータから文
字パターンを切り出す文字切り出し手段と、 前記文字パターンと照合するための前記第1の記号と前
記第2の記号と前記数字とに対応する辞書を格納した辞
書メモリと、 前記帳票に記録された前記複数の文字のうちの前記第1
の端の文字から前記第2の端の方向に隣接する文字を順
次前記切り出し手段から切り出された文字パターンと前
記辞書メモリに格納された辞書とを照合することにより
文字認識する文字認識手段と、 前記文字認識手段が文字認識する際に照合する前記辞書
メモリに格納された辞書を指定するためのもので、初期
設定として前記第1の記号と前記第2の記号と前記数字
とに対応する辞書と照合することを指定し、以後順次前
記文字認識手段の文字認識結果に基づいて次の文字を認
識する際に、文字認識結果が前記数字である場合には前
記数字に対応する辞書と照合することを指定し、文字認
識結果が前記第1の記号でかつその1つ前の文字認識結
果が前記第2の記号の場合には前記数字に対応する辞書
と照合することを指定し、文字認識結果が前記第1の記
号でかつその1つ前の文字認識結果が前記第2の記号で
ない場合には前記第2の記号と前記数字とに対応する辞
書と照合することを指定する辞書サブセット制御手段と
を具備することを特徴とする光学的文字読み取り装置。
2. A first symbol indicating a unit of money and a unit of money.
At least a number from the second symbol and the number that indicate other than the place
The characters are arranged in a direction from the first end to the second end.
If the first and second symbols are arranged, the number
A plurality of sentences arranged only on the first end side of the character
Optical characters to read the characters of the form where the characters were recorded
A reading device that scans the form and reads an image of the form.
An image scanner that obtains image data and an image scanner that reads the image data
An image memory for pay, text from the image data stored in this image memory
Character extracting means for extracting a character pattern; and a first symbol for comparing the character pattern with the first symbol.
A dictionary storing a dictionary corresponding to the second symbol and the numeral
And a first memory of the plurality of characters recorded in the form.
In order from the character at the end to the character adjacent to the direction of the second end.
Next character pattern cut out from the cutting means and the previous
By comparing with the dictionary stored in the dictionary memory
Character recognition means for character recognition, and the dictionary to be collated when the character recognition means recognizes characters
This is used to specify a dictionary stored in memory.
The first symbol, the second symbol, and the numeral as setting
To match the dictionary corresponding to
The next character is recognized based on the character recognition result of the character
When the character recognition result is the number,
Specifies to match the dictionary corresponding to the digit,
The recognition result is the first symbol and the character recognition result immediately before the first symbol.
If the result is the second symbol, a dictionary corresponding to the number
Is specified, and the character recognition result is
And the character recognition result immediately before the character is the second symbol.
If not, the letter corresponding to the second symbol and the number
An optical character reading device, comprising: dictionary subset control means for designating collation with a book .
JP10960292A 1992-04-28 1992-04-28 Optical character reader Expired - Lifetime JP3217442B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10960292A JP3217442B2 (en) 1992-04-28 1992-04-28 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10960292A JP3217442B2 (en) 1992-04-28 1992-04-28 Optical character reader

Publications (2)

Publication Number Publication Date
JPH05303669A JPH05303669A (en) 1993-11-16
JP3217442B2 true JP3217442B2 (en) 2001-10-09

Family

ID=14514446

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10960292A Expired - Lifetime JP3217442B2 (en) 1992-04-28 1992-04-28 Optical character reader

Country Status (1)

Country Link
JP (1) JP3217442B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11603155B2 (en) 2016-08-30 2023-03-14 Ergon International Gmbh Bicycle saddle, saddle pad, and method for producing a bicycle saddle or saddle pad

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11603155B2 (en) 2016-08-30 2023-03-14 Ergon International Gmbh Bicycle saddle, saddle pad, and method for producing a bicycle saddle or saddle pad

Also Published As

Publication number Publication date
JPH05303669A (en) 1993-11-16

Similar Documents

Publication Publication Date Title
US5339412A (en) Electronic filing system using a mark on each page of the document for building a database with respect to plurality of multi-page documents
JP3217442B2 (en) Optical character reader
JP3159087B2 (en) Document collation device and method
JPH0991371A (en) Character display device
JPS5842904B2 (en) Handwritten kana/kanji character recognition device
JP2623292B2 (en) How to create dictionary data
JPS63782A (en) Pattern recognizing device
JP2784004B2 (en) Character recognition device
JP2931485B2 (en) Character extraction device and method
JP3071048B2 (en) Character recognition apparatus and method
JP2924356B2 (en) Optical character reader
JPS6074094A (en) Character recognizing device
JP2570571B2 (en) Optical character reader
JPS60150190A (en) Character recognizing method
JPS63282586A (en) Character recognition device
JPH0756924A (en) Bilingual device
JPS6327992A (en) Generating method for dictionary for individual
JPH0636069A (en) Character recognizing device
JPH0355874B2 (en)
JPH0338787A (en) Character recognition processor
JPH06348889A (en) Character recognizing device
JPS6326789A (en) Character recognizing device
JPS60136885A (en) Business form format discriminating system
JPH0589279A (en) Character recognizing device
JPH04274580A (en) Optical character reader

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070803

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080803

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090803

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100803

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100803

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110803

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120803

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120803

Year of fee payment: 11