JPS62169289A - Optical character reader - Google Patents
Optical character readerInfo
- Publication number
- JPS62169289A JPS62169289A JP61012810A JP1281086A JPS62169289A JP S62169289 A JPS62169289 A JP S62169289A JP 61012810 A JP61012810 A JP 61012810A JP 1281086 A JP1281086 A JP 1281086A JP S62169289 A JPS62169289 A JP S62169289A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- pattern
- partial
- feature
- partial pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012015 optical character recognition Methods 0.000 title description 2
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 23
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 23
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 5
- 230000003287 optical effect Effects 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 7
- 238000000034 method Methods 0.000 abstract description 3
- 230000015654 memory Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、光学文字読取装置に関し、特に小形で高精度
な読取精度を得るのに好適な光学文字読取装置に関する
ものである。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to an optical character reading device, and particularly to an optical character reading device that is small and suitable for obtaining high reading accuracy.
従来、帳票上の文字等を光学的に認識する装置として、
光学文字読取装置が使用されている。この光学文字読取
装置では、辞書メモリ上に用意される辞書情報は、読取
り対象となる字種ごとに作成され(専用の辞書メモリを
用いて)管理されてきだので、読取り可能な文字が増加
するにしたかって、その辞書メモリの管理が複雑化し、
各専用の辞書メモリ間の辞書情報に共通のものが多数存
在し、辞書メモリの有効利用という面から不経済となる
という問題があった。この問題を解決するた、′ノ
め、辞書メモリを一元化し、帳票を読取る際のフィール
ド・リード・モード(帳票上に記述されている文字が数
字のみか、英数字か・・・などを指示するモード)に対
応して、上記一元化された辞書メモリから照合可能な辞
書情報のみを高速度で抽出できるようにした装置が知ら
れている(特公昭58−53791号公報参照)。この
装置では、辞書情報はカテゴリ単位で共通化を行なって
いた。Conventionally, as a device for optically recognizing characters on a form,
Optical character readers are used. In this optical character reading device, the dictionary information prepared on the dictionary memory is created and managed for each type of character to be read (using a dedicated dictionary memory), so the number of characters that can be read increases. However, managing the dictionary memory becomes complicated,
There is a problem in that there is a lot of common dictionary information between the dedicated dictionary memories, and this becomes uneconomical in terms of effective use of the dictionary memories. In order to solve this problem, we unified the dictionary memory and specified the field read mode (whether the characters written on the form are only numbers, alphanumeric characters, etc.) when reading the form. A device is known that is capable of extracting only collated dictionary information from the unified dictionary memory at high speed (see Japanese Patent Publication No. 58-53791). In this device, dictionary information was shared in category units.
上記従来の装置では、上述した辞書構成をとると、さら
に変形パターンを追加させて辞書の共通化を行うために
は、上記装置にさらに変形パターン辞書を追加しなけれ
ばならず、メモリ容量が増加するどいゝう問題があった
。In the conventional device described above, if the dictionary configuration is as described above, in order to add more deformed patterns and standardize the dictionary, it is necessary to add an additional deformed pattern dictionary to the device, which increases the memory capacity. There was a serious problem.
本発明の目的は、このような従来の問題を解決し、従来
装置と同程度の読取り精度を保ちながら、部分パターン
の特徴を共通化するため、大幅に辞書容量を減少可能な
光学文字読取装置を提供することにある。The purpose of the present invention is to solve such conventional problems and to provide an optical character reading device that can significantly reduce dictionary capacity by standardizing the characteristics of partial patterns while maintaining the same level of reading accuracy as conventional devices. Our goal is to provide the following.
上記問題点を解決するため、本発明では、入力文字パタ
ーンから特徴抽出を行う手段および該特徴抽出手段によ
り抽出した特徴量と標準パターンとをマツチングする手
段を有する光学文字読取装置において、上記標準パター
ンを部分パターンごとに分割された部分パターン辞書構
成とし、上記マツチング処理手段により上記部分パター
ンを合成するための情報を格納した特徴合成指示辞書を
用いて、上記抽出した特徴量に対する標準パターンを上
記部分パターン辞書により合成してマツチング処理する
ことに特徴がある。In order to solve the above problems, the present invention provides an optical character reading device having means for extracting features from an input character pattern and means for matching the feature amount extracted by the feature extracting means with a standard pattern. has a partial pattern dictionary structure divided into each partial pattern, and uses a feature synthesis instruction dictionary storing information for synthesizing the partial patterns by the matching processing means to convert the standard pattern corresponding to the extracted feature amount into the partial pattern. The feature is that it is synthesized and matched using a pattern dictionary.
特徴抽出部より抽出されたパターンをおおまかに、クラ
ス分けした番号であるクラス番号をマツチング部を通し
て辞書合成部内の合成処理部に送り、合成処理部は特徴
合成指示辞書を用いて、文字の特徴パターンを格納した
部分パターン辞書から部分パターンを読出して、辞書合
成して、マツチング処理を行う。The pattern extracted by the feature extraction section is roughly divided into classes, and the class number is sent to the synthesis processing section in the dictionary synthesis section through the matching section, and the synthesis processing section uses the feature synthesis instruction dictionary to extract character feature patterns. The partial patterns are read out from the partial pattern dictionary storing the partial patterns, dictionary synthesis is performed, and matching processing is performed.
以下、本発明の一実施例を、図面により詳細に説明する
。Hereinafter, one embodiment of the present invention will be described in detail with reference to the drawings.
まず、本発明の詳細な説明をする。First, the present invention will be explained in detail.
本発明は、変形パターンを読取らせる際に必要となる標
牟パターン辞書の追加量を減らし、さらに広範囲な読取
りを実現させるために考えられたものである。変形パタ
ーンを読取らせる1つの方法は、既存標準パターン辞書
の読取許容範囲を拡大すれば、可能であるが、しかし、
誤読する可能性が大きくなってしまう。そこで、既存標
串パターン辞書を変更することなく、変形部分の部分パ
ターン辞書のみ追加すれば良いことになる。そこで、既
存標準パターン辞書を部分パターン辞書に分解すること
とし1分解した部分パターン辞書を合成させるための情
報を保持する特徴合成指示辞書を作成する。これにより
、既存標準パターン辞書を分解した部分パターン辞書は
かなり共通化ができ、大幅な辞書削減ができる。The present invention was conceived in order to reduce the amount of additional mark pattern dictionaries required when reading modified patterns, and to realize a wider range of reading. One way to read deformed patterns is to expand the reading tolerance of the existing standard pattern dictionary; however,
This increases the possibility of misreading. Therefore, it is only necessary to add only the partial pattern dictionary of the modified part without changing the existing standard pattern dictionary. Therefore, the existing standard pattern dictionary is decomposed into partial pattern dictionaries, and a feature synthesis instruction dictionary is created that holds information for synthesizing the decomposed partial pattern dictionaries. As a result, partial pattern dictionaries obtained by decomposing existing standard pattern dictionaries can be made fairly common, and the number of dictionaries can be reduced significantly.
第1図は、本発明の一実施例を示す光学文字読取装置の
概略構成図である。FIG. 1 is a schematic diagram of an optical character reading device showing an embodiment of the present invention.
第1図において、11は帳票の読取り領域に光を照射す
る走査部、12はその帳票からの反射光を受光し、電気
信号に変換する光電変換部、13は光電変換部12で変
換された電気信号の2値化結果を装置内部のパターンメ
モリに格納する処理を行う前処理部、14は前処理部1
3により切出された1文字分のパターンに対して、内輪
、外輪の数、線分間の位置関係などの特徴を抽出し、大
まかなパターンの分類を行う(これをクラス分けといい
、分類結果をクラス番号Nで表す)特徴抽出部、15は
特徴抽出部14で得られた特徴値と標準パターンとのマ
ツチング処理を行うマツチング部、16はマツチング処
理結果を基に最終的に文字の判定を行う判定部、17は
本発明の主要部をなす辞書合成部である。In FIG. 1, 11 is a scanning unit that irradiates light onto the reading area of the form, 12 is a photoelectric conversion unit that receives reflected light from the form and converts it into an electrical signal, and 13 is a signal that is converted by the photoelectric conversion unit 12. A preprocessing section 14 stores the binarization result of the electrical signal in the pattern memory inside the device; 14 is the preprocessing section 1;
Characteristics such as the number of inner and outer rings and the positional relationship between line segments are extracted from the pattern for one character extracted in step 3, and the pattern is roughly classified (this is called classification, and the classification results 15 is a matching unit that performs matching processing between the feature values obtained by the feature extraction unit 14 and the standard pattern, and 16 is a matching unit that ultimately determines the character based on the matching processing result. The determination unit 17 is a dictionary synthesis unit which is the main part of the present invention.
第2図は、本発明の特徴的な辞書合成部17の詳細構成
図である。FIG. 2 is a detailed configuration diagram of the dictionary synthesis section 17, which is a characteristic feature of the present invention.
第2図において、21はクラス番号Nの入力により部分
パターン辞書23から特徴をロードし、辞書合成して1
文字分の標準パターンを出力する合成処理部、22は合
成処理部21にクラス番号Nに対応した特徴値の格納ア
ドレスを知らせる特徴合成指示辞書、23は既存の標牟
パターン辞書を分解した部分パターン辞書である。この
部分パターンの一例を第3図に示す。本実施例では、部
分パターンとは、第3図に示すように分解された線分で
ある。In FIG. 2, 21 loads features from the partial pattern dictionary 23 by inputting the class number N, synthesizes the dictionaries, and
22 is a feature synthesis instruction dictionary that notifies the synthesis processing unit 21 of the storage address of the feature value corresponding to the class number N; 23 is a partial pattern obtained by decomposing the existing standard pattern dictionary; It's a dictionary. An example of this partial pattern is shown in FIG. In this embodiment, the partial pattern is a segmented line segment as shown in FIG.
以下、第1図、第2図により本光学文字読取装置の動作
を説明する。The operation of the present optical character reading device will be explained below with reference to FIGS. 1 and 2.
まず、走査部1により本装置の所定の位置に置かれた帳
票の読取り領域に光が照射され、その帳票からの反射光
を光電変換部12で受光し、電気信号に変換する。ここ
で、帳票からの反射光は、帳票上の文字とか図形とかの
パターンの濃淡情報を反映したものであり、電気信号は
そのパターンの形態に応じた信号である。次に変換され
た電気信号は、前処理部13に入力され、前処理部13
では、電気信号の2値化およびその結果を内部のパター
ンメモリに格納する処理を行い、雑音除去を行う。さら
に、この前処理部13にあってはパターンメモリから1
文字のパターンを切出し、特徴抽出部14に送る。以下
、この1文字分のパターンを単に文字パターンと称する
。その特徴抽出部14では、入力れた文字パターンに対
して、内輪、外輪の数、線分間の位置関係などの特徴を
抽出し、大まかなパターンの分類を行う。これをクラス
分けといい、分類結果をクラス番号Nで表す。First, the scanning section 1 irradiates light onto the reading area of a form placed at a predetermined position of the device, and the photoelectric conversion section 12 receives the reflected light from the form and converts it into an electrical signal. Here, the reflected light from the form reflects the shading information of patterns such as characters and figures on the form, and the electrical signal is a signal that corresponds to the form of the pattern. Next, the converted electrical signal is input to the preprocessing section 13.
Then, the electrical signal is binarized, the result is stored in the internal pattern memory, and noise is removed. Furthermore, in this preprocessing section 13, one
The character pattern is cut out and sent to the feature extraction section 14. Hereinafter, this pattern for one character will be simply referred to as a character pattern. The feature extraction unit 14 extracts features such as the number of inner and outer rings and the positional relationship between line segments from the input character pattern, and roughly classifies the pattern. This is called classification, and the classification result is represented by a class number N.
次に、このクラス分は結果のクラス番号Nに基つき、マ
ツチングに必要な詳細特徴を抽出し、マツチング部15
に送られる。マツチング部15ではクラス番号Nを辞書
合成部17の合成処理部21へ人力する。合成処理部2
1は、特徴合成指示辞書22を用いてそのクラス番号N
により合成すべき部分パターンに対する特徴の格納アド
レスを知り、部分パターン辞書23から特徴をロードし
。Next, for this class, detailed features necessary for matching are extracted based on the resulting class number N, and the matching unit 15
sent to. The matching section 15 manually inputs the class number N to the synthesis processing section 21 of the dictionary synthesis section 17 . Synthesis processing section 2
1 uses the feature synthesis instruction dictionary 22 to determine its class number N.
The storage address of the feature for the partial pattern to be synthesized is known by , and the feature is loaded from the partial pattern dictionary 23 .
辞書合成し、1文字分の標阜パターンを得る。次に合成
処理部21では、得られた標塗パターンをマツチング部
15に送り、特徴抽出部14で得た特徴値とマツチング
を行い、類似度を得る。この処理を同一クラス番号Nの
辞書すべてについて行う。次に判定部16は類似度をも
とに最終判定を行い、読取り結果を出力する。Synthesize the dictionaries and obtain a signpost pattern for one character. Next, the synthesis processing section 21 sends the obtained marking pattern to the matching section 15 and performs matching with the feature value obtained by the feature extraction section 14 to obtain a degree of similarity. This process is performed for all dictionaries with the same class number N. Next, the determination unit 16 makes a final determination based on the degree of similarity and outputs the reading result.
第4図は、本実施例による部分パターンに対する特徴辞
書を示す図である。(a)は変形文字「2」の部分パタ
ーンの一例、(b)は他の変形文字「2」の部分パター
ンの一例、(c)は(a)に対する特徴辞書の一例、(
d)は(b)に対する特徴辞書の一例を示している。FIG. 4 is a diagram showing a feature dictionary for partial patterns according to this embodiment. (a) is an example of a partial pattern of the modified character "2", (b) is an example of a partial pattern of another modified character "2", (c) is an example of the feature dictionary for (a), (
d) shows an example of a feature dictionary for (b).
第4図(a)に示すパターンの場合は部分パターンS、
〜S、、第4図(b)に示すパターンの場合は部分パタ
ーンも、〜L4に分解され、これらに対する部分パター
ン特徴をμ6、〜μgm(辞書41)、μt1〜μm<
(辞書42)とすると、部分パターンS1とtlおよび
S2とL2が同一部分パターンとなり、共通化ができ、
第4図(a)のパターンに対してμs1μs2μg、μ
S4μ6.μ66が合成特徴(辞書41)となり、第4
図(b)のパターンに対してμ6.μ68μDμいが合
成特徴(辞書43)となる。したがって、部分パターン
辞書μ1.とμ、2が不要となり、大幅にメモリが削減
できることがわかる。In the case of the pattern shown in FIG. 4(a), the partial pattern S,
~S,, In the case of the pattern shown in FIG. 4(b), the partial pattern is also decomposed into ~L4, and the partial pattern features for these are μ6, ~μgm (dictionary 41), μt1~μm<
(Dictionary 42), partial patterns S1 and tl and S2 and L2 become the same partial pattern, and can be shared.
For the pattern in Fig. 4(a), μs1μs2μg, μ
S4μ6. μ66 becomes the composite feature (dictionary 41), and the fourth
μ6 for the pattern in figure (b). μ68μDμ becomes a composite feature (dictionary 43). Therefore, partial pattern dictionary μ1. It can be seen that ,μ,2 is no longer necessary, and the memory can be significantly reduced.
二のように、本実施例においては、変形パターンに対す
る辞書の追加は類似部分については、既存の特徴辞書を
用いて変形部分のみ新たに追加すればよいため、新たに
辞書を学習させる工数を減少させることができ、しかも
既存辞書を母体としているため、合成したa市パターン
辞書の初期信頼度は高いものが容易に得られる。As shown in 2, in this embodiment, when adding a dictionary to a deformed pattern, for similar parts, only the deformed parts need to be newly added using the existing feature dictionary, reducing the man-hours required to learn a new dictionary. Moreover, since it is based on an existing dictionary, it is easy to obtain a high initial reliability of the synthesized A city pattern dictionary.
以上説明したように、本発明によれば、従来装置と同程
度の読取り精度を保ちながら、部分パターンの特徴を共
通化するため、大幅に辞書容量を減少でき、小形の光学
文字読取装置を実現できる。As explained above, according to the present invention, while maintaining the same reading accuracy as conventional devices, the characteristics of partial patterns are shared, so the dictionary capacity can be significantly reduced, and a compact optical character reading device can be realized. can.
第1図は本発明の一実施例を示す光学文字読取装置の概
略構成図、第2図は本実施例の特徴的な辞書合成部の詳
細構成図、第3図は本実施例によるパターンの分解の一
例を示す図、第4図は本実施例による部分パターンに対
する特徴辞書を示す図である。
11 走査部、12:光電変換部、13 前処理部、1
4:特徴抽出部、15 マツチング部、16・判定部、
17:本発明の主要部をなす辞書合成部、211合成処
理部、22・特徴合成指示辞書、23:部分パターン辞
書、41・特徴辞書、42:特徴辞書、43:共通化し
た合成特徴辞書。
第 1 図
第 2 図
第 3 図
第 牛 図FIG. 1 is a schematic configuration diagram of an optical character reading device showing an embodiment of the present invention, FIG. 2 is a detailed configuration diagram of a characteristic dictionary synthesis section of this embodiment, and FIG. 3 is a diagram of a pattern according to this embodiment. FIG. 4, which is a diagram showing an example of decomposition, is a diagram showing a feature dictionary for partial patterns according to this embodiment. 11 scanning section, 12: photoelectric conversion section, 13 pre-processing section, 1
4: Feature extraction unit, 15 Matching unit, 16 Judgment unit,
17: Dictionary synthesis unit which is the main part of the present invention, 211 synthesis processing unit, 22. Feature synthesis instruction dictionary, 23: Partial pattern dictionary, 41. Feature dictionary, 42: Feature dictionary, 43: Commonized synthesis feature dictionary. Figure 1 Figure 2 Figure 3 Cow Figure
Claims (1)
該特徴抽出手段により抽出した特徴量と標準パターンと
をマッチングする手段を有する光学文字読取装置におい
て、上記標準パターンを部分パターンごとに分割された
部分パターン辞書構成とし、上記部分パターンを合成す
るための情報を格納した特徴合成指示辞書を用いて、上
記マッチング処理手段により上記抽出した特徴量に対す
る標準パターンを上記部分パターン辞書により合成して
マッチング処理することを特徴とする光学文字読取装置
。(1) In an optical character reading device that has means for extracting features from an input character pattern and means for matching the feature amount extracted by the feature extraction means with a standard pattern, a portion of the standard pattern divided into partial patterns is provided. Using a feature synthesis instruction dictionary which has a pattern dictionary configuration and stores information for synthesizing the partial patterns, the matching processing means synthesizes a standard pattern for the extracted feature amount with the partial pattern dictionary and performs matching processing. An optical character reading device characterized by:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61012810A JPS62169289A (en) | 1986-01-22 | 1986-01-22 | Optical character reader |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61012810A JPS62169289A (en) | 1986-01-22 | 1986-01-22 | Optical character reader |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62169289A true JPS62169289A (en) | 1987-07-25 |
Family
ID=11815742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61012810A Pending JPS62169289A (en) | 1986-01-22 | 1986-01-22 | Optical character reader |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62169289A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03288973A (en) * | 1990-04-05 | 1991-12-19 | Hitachi Ltd | Part character inspecting device |
-
1986
- 1986-01-22 JP JP61012810A patent/JPS62169289A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03288973A (en) * | 1990-04-05 | 1991-12-19 | Hitachi Ltd | Part character inspecting device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5237628A (en) | System and method for automatic optical data entry | |
JPH01279368A (en) | Transfer system for character data | |
Marne et al. | Identification of optimal optical character recognition (OCR) engine for proposed system | |
JPS62169289A (en) | Optical character reader | |
JP2000029983A (en) | Document reader device | |
CN110889401A (en) | Text layout identification method based on opencv library | |
JPS58192180A (en) | Character reader | |
JPS5816375A (en) | Optical reader | |
JP2784004B2 (en) | Character recognition device | |
JPH0319589B2 (en) | ||
JPH03212779A (en) | Device for recognizing character | |
JPS61290581A (en) | Extracting and storing device for retrieval information | |
JPS63263588A (en) | Character reader | |
JPS6154569A (en) | Document poicture processing system | |
JPS59106084A (en) | Character reader | |
JPS62177686A (en) | Optical character reader | |
JPH0272497A (en) | Optical character reader | |
JPS61272887A (en) | Character recognition system | |
JPS58125183A (en) | Method for displaying unrecognizable character in optical character reader | |
JPS6136878A (en) | Pattern extraction method for optical character reader | |
JPH01201789A (en) | Character reader | |
JPS60254388A (en) | Optical character reader | |
JPS6115288A (en) | Optical character reader | |
JPS6154578A (en) | Character reader | |
JPS5914078A (en) | Reader of business form |