JPH0731711B2 - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH0731711B2
JPH0731711B2 JP58013985A JP1398583A JPH0731711B2 JP H0731711 B2 JPH0731711 B2 JP H0731711B2 JP 58013985 A JP58013985 A JP 58013985A JP 1398583 A JP1398583 A JP 1398583A JP H0731711 B2 JPH0731711 B2 JP H0731711B2
Authority
JP
Japan
Prior art keywords
character
pattern
feature
unit
average
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58013985A
Other languages
Japanese (ja)
Other versions
JPS59149569A (en
Inventor
吉久 田辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58013985A priority Critical patent/JPH0731711B2/en
Publication of JPS59149569A publication Critical patent/JPS59149569A/en
Publication of JPH0731711B2 publication Critical patent/JPH0731711B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の技術分野〕 この発明は、自由手書文字の読取処理を行なう光学的文
字読取装置に関する。
Description: TECHNICAL FIELD OF THE INVENTION The present invention relates to an optical character reading device for performing reading processing of free handwritten characters.

〔発明の技術的背景とその問題点〕[Technical background of the invention and its problems]

近年、光学的文字読取装置(以下OCRと称する)には、
手書文字の読取りを行なうことができる方式のものがあ
る。このような方式のOCRでは、個人の癖による文字の
変形に対して、辞書メモリに予め標準パターンを多数用
意して対応することが行なわれる。
In recent years, optical character readers (hereinafter referred to as OCR) have
There is a system that can read handwritten characters. In the OCR of such a system, a large number of standard patterns are prepared in advance in the dictionary memory to deal with the deformation of characters due to individual habits.

しかしながら、上記のような方式のOCRでは、不特定多
数の人が記入する自由手書文字の読取りを行なう場合、
用意すべき標準パターンが膨大となるため、膨大な容量
の辞書メモリを必要とする。この標準パターンの記憶量
を減少すると、OCRの読取精度が低下するという障害が
生ずることになる。従来では、上記読取精度の低下に対
して、文章処理等の後処理を行なうことにより、読取精
度を高めるようにしたものがある。しかしながら、この
場合、手書文字が純粋な数字のみのときには、適用でき
ない不都合がある。
However, in the OCR of the above-mentioned method, when reading freehand written characters written by unspecified number of people,
Since the number of standard patterns to prepare is huge, a huge amount of dictionary memory is required. If the storage amount of the standard pattern is reduced, the OCR reading accuracy will be degraded. Conventionally, there has been a method in which post-processing such as text processing is performed to improve the reading accuracy with respect to the deterioration of the reading accuracy. However, in this case, there is an inconvenience that cannot be applied when the handwritten characters are pure numbers only.

〔発明の目的〕[Object of the Invention]

この発明は上記の事情に鑑みてなされたもので、自由手
書文字の読取処理において、特別に大きな容量の辞書メ
モリを用いることなく、高い精度で読取処理を行なうこ
とができる光学的文字読取装置を提供することを目的と
する。
The present invention has been made in view of the above circumstances, and an optical character reading device capable of performing a reading process with high accuracy in a reading process of freehand-written characters without using a dictionary memory having a particularly large capacity. The purpose is to provide.

〔発明の概要〕[Outline of Invention]

この発明は、用紙上を走査して光電変換された1文字毎
に文字パターンの特徴を抽出する特徴抽出部、この特徴
抽出部から出力された文字パターンの特徴を少なくとも
1シート分格納する特徴メモリ、この特徴メモリから読
出した文字パターンの特徴どうしの類似性を求め、一定
値以上の類似性がある文字パターンの特徴を特定の文字
に対応する文字パターンの特徴のグループとして分類す
る分類部、分類されたグループ毎に平均パターン特徴を
抽出する平均パターン抽出部、および抽出された平均パ
ターン特徴と辞書メモリに予め記憶された標準パターン
とを照合し、特定の文字を識別する識別部を備えた光学
的文字読取装置である。これにより、特別に大容量の辞
書メモリを用いることなく、自由手書文字の読取処理を
高い精度で行なうことができるものである。
The present invention relates to a feature extraction unit that extracts a feature of a character pattern for each character that is photoelectrically converted by scanning a sheet, and a feature memory that stores at least one sheet of the feature of a character pattern output from the feature extraction unit. , A classifying unit that obtains the similarity between the characteristics of the character patterns read from the characteristic memory, and classifies the characteristics of the character patterns having a certain value of similarity as a group of the characteristics of the character pattern corresponding to a specific character. An average pattern extractor for extracting an average pattern feature for each selected group, and an optical disc having an identifying unit for identifying a specific character by comparing the extracted average pattern feature with a standard pattern stored in advance in a dictionary memory. It is a static character reader. As a result, the free handwritten character reading process can be performed with high accuracy without using a particularly large-capacity dictionary memory.

〔発明の実施例〕Example of Invention

以下図面を参照してこの発明の一実施例について説明す
る。図中、1は光電変換部で、用紙上を走査して得られ
る自由手書文字の走査パターンAを2値化信号に変換
し、しかも適切な前処理を行なう。特徴抽出部2は、光
電変換部1から送られる1文字毎の文字パターンの特徴
を抽出する。特徴メモリ3は、特徴抽出部2で抽出され
た特徴を文字毎に記憶し、例えば1シート分の記憶容量
を有する。分類部4は、特徴メモリ3から読出した文字
パターン特徴を文字毎の複数のグループに分類する。5
は判定処理部で、分類部4での分類処理の終了を判定
し、終了と判定した場合には分類部4からグループ毎の
文字パターン特徴群を平均パターン抽出部6に送るよう
にする。また、判定処理部5は、分類処理が不可能、即
ち類似性の計算結果に基づいて一定値以上の類似性が得
られず文字パターン特徴を特定のグループに分類できな
いと判定した場合、判定部7に制御信号Bを出力する。
判定部7は、判定処理部5の制御信号Bに基づいて、光
電変換部1からの処理を再度行なうようにする制御信号
C1または特徴抽出部2からの処理を再度行なうようにす
る制御信号C2を出力する。平均パターン抽出部6は、文
字毎のグループの平均的なパターン特徴を抽出する。8
は識別部で、辞書メモリ9に予め格納されている標準パ
ターンに基づいて、平均パターン抽出部6からのパター
ン特徴から文字を識別して出力する。
An embodiment of the present invention will be described below with reference to the drawings. In the figure, reference numeral 1 denotes a photoelectric conversion unit which converts a scanning pattern A of free handwritten characters obtained by scanning a sheet into a binarized signal, and also performs an appropriate preprocessing. The feature extraction unit 2 extracts the features of the character pattern for each character sent from the photoelectric conversion unit 1. The feature memory 3 stores the features extracted by the feature extraction unit 2 for each character, and has a storage capacity of, for example, one sheet. The classification unit 4 classifies the character pattern features read from the feature memory 3 into a plurality of groups for each character. 5
Is a judgment processing unit, which judges the end of the classification process in the classification unit 4, and when it is judged that the classification process is completed, the character pattern feature group for each group is sent from the classification unit 4 to the average pattern extraction unit 6. If the determination processing unit 5 determines that the classification process is impossible, that is, the similarity of a certain value or more is not obtained based on the similarity calculation result, and the character pattern features cannot be classified into a specific group, the determination unit 5 The control signal B is output to 7.
Based on the control signal B of the determination processing unit 5, the determination unit 7 is a control signal that causes the process from the photoelectric conversion unit 1 to be performed again.
A control signal C2 that causes the processing from C1 or the feature extraction unit 2 to be performed again is output. The average pattern extraction unit 6 extracts average pattern features of each character group. 8
Is an identification unit that identifies and outputs a character from the pattern feature from the average pattern extraction unit 6 based on a standard pattern stored in advance in the dictionary memory 9.

このような構成において、その動作を説明する。いま仮
に、1シート分の自由手書文字が1行毎に光電変換部1
で2値化信号に変換され、特徴抽出部2に送られる。特
徴抽出部2は、1文字毎に切出された文字パターンの特
徴を抽出する。特徴メモリ3は、1シート分または複数
シート分(但し、同一個人が文字を記入したことが判明
している範囲)の文字パターン特徴を文字毎に記憶す
る。さらに、分類部4は、特徴メモリ3から文字パター
ン特徴を読出して、類似する文字毎のグループに分類す
る。この場合、分類部4は文字パターン特徴間のマッチ
ングまたは特徴コードの相違度等により、類似性を判断
し分類することになる。判定処理部5は、分類部4での
類似性計算において一定の値以上の類似性が得られた場
合には、分類処理を終了したと判定する。また、一定の
値以上の類似性が得られずに、分類処理が不可であると
判定した場合、その内容に応じた制御信号Bを出力す
る。例えば、光電変換部1において文字像の信号化によ
る再現が不十分である場合、判定処理部5は再度光電変
換部1からの処理を指示する制御信号Bを判定部7に出
力する。判定部7は、制御信号Bに基づいて光電変換部
1からの処理または特徴抽出部2からの処理を再度行な
うように制御信号C1,C2を出力することになる。
The operation of such a configuration will be described. Now, suppose that one sheet of freehand handwriting is line-by-line for photoelectric conversion unit 1.
Is converted into a binary signal and sent to the feature extraction unit 2. The feature extraction unit 2 extracts the features of the character pattern cut out for each character. The feature memory 3 stores the character pattern features for one sheet or a plurality of sheets (however, it is known that the same individual has written a character) for each character. Further, the classification unit 4 reads the character pattern features from the feature memory 3 and classifies the character pattern features into groups of similar characters. In this case, the classification unit 4 judges and classifies the similarity based on the matching between the character pattern features or the degree of difference between the feature codes. The determination processing unit 5 determines that the classification process is completed when the similarity calculation performed by the classification unit 4 yields a similarity equal to or greater than a certain value. Further, when it is determined that the classification processing is impossible because the similarity of a certain value or more is not obtained, the control signal B corresponding to the content is output. For example, when the photoelectric conversion unit 1 does not sufficiently reproduce the character image by signalization, the determination processing unit 5 outputs the control signal B instructing the process from the photoelectric conversion unit 1 to the determination unit 7 again. The determination unit 7 outputs the control signals C1 and C2 so that the process from the photoelectric conversion unit 1 or the process from the feature extraction unit 2 is performed again based on the control signal B.

ところで、判定処理部5が上記のように分類部4での分
類処理が終了したと判定した場合、分類部4からグルー
プ毎の文字パターン特徴群が平均パターン抽出部6に与
えられる。この平均パターン抽出部6で、文字パターン
特徴群の平均的なパターン特徴が計算されて求められ
る。この場合、平均パターン抽出部6では、例えば文字
パターン特徴群を距離空間に表現したとき、分布の中心
座標を計算する等の方法で平均的パターン特徴が求めら
れる。識別部8では、平均パターン抽出部6で求められ
た平均的パターン特徴がどの文字に相当するかを、辞書
メモリ9に予め格納された標準パターンに基づいて識別
する。
By the way, when the determination processing unit 5 determines that the classification processing by the classification unit 4 is completed as described above, the classification unit 4 supplies the character pattern feature group for each group to the average pattern extraction unit 6. The average pattern extraction unit 6 calculates and obtains an average pattern feature of the character pattern feature group. In this case, the average pattern extraction unit 6 obtains the average pattern feature by a method such as calculating the center coordinates of the distribution when the character pattern feature group is expressed in the metric space. The identification unit 8 identifies which character the average pattern feature obtained by the average pattern extraction unit 6 corresponds to, based on a standard pattern stored in advance in the dictionary memory 9.

このようにして、用紙に記録された自由手書文字の読取
処理を行なうことができる。この場合、この発明では、
分類部4において、少なくとも1シート分の文字パター
ン特徴を類似計算により、文字毎のグループに分類す
る。したがって、分類されたグループは別々のカテゴリ
に分けられたことになり、そのグループ毎の平均パター
ン特徴から識別部8で文字を識別する場合、同一の答が
得られることはない。そのため、確実に自由手書文字の
読取を行なうことができる。
In this way, the free handwritten characters recorded on the paper can be read. In this case, in the present invention,
The classification unit 4 classifies character pattern features for at least one sheet into groups for each character by similarity calculation. Therefore, the classified groups are divided into different categories, and the same answer cannot be obtained when the identifying unit 8 identifies the character from the average pattern feature of each group. Therefore, free handwritten characters can be reliably read.

〔発明の効果〕〔The invention's effect〕

以上詳述したようにこの発明によれば、自由手書文字の
読取処理において、少なくとも1シート分の文字パター
ン特徴を文字毎のグループに分類し、そのグループ毎に
平均的パターン特徴を求めることにより、確実に文字の
識別を行なうことができる。したがって、結果的に特別
に大きな容量の辞書メモリに格納される多大な標準パタ
ーンを用いることなく、高い精度で自由手書文字の読取
処理を行なうことができるものである。
As described above in detail, according to the present invention, in the free handwritten character reading process, the character pattern features for at least one sheet are classified into groups for each character, and the average pattern features are obtained for each group. Therefore, the characters can be surely identified. Therefore, as a result, the free handwritten character reading process can be performed with high accuracy without using a large standard pattern stored in the dictionary memory having a particularly large capacity.

【図面の簡単な説明】 図はこの発明の一実施例に係る光学的文字読取装置の構
成を示すブロック図である。 2…特徴抽出部、3…特徴メモリ、4…分類部、6…平
均パターン抽出部、7…辞書メモリ、8…識別部。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing the configuration of an optical character reading device according to an embodiment of the present invention. 2 ... feature extraction unit, 3 ... feature memory, 4 ... classification unit, 6 ... average pattern extraction unit, 7 ... dictionary memory, 8 ... identification unit.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】用紙上を走査して光電変換された1文字毎
に文字パターンの特徴を抽出する特徴抽出部と、 この特徴抽出部から出力された前記文字パターンの特徴
を少なくとも1シート分格納する特徴メモリと、 この特徴メモリから読出した前記文字パターンの特徴ど
うしの類似性を求め、一定値以上の類似性がある前記文
字パターンの特徴を特定の文字に対応する文字パターン
の特徴のグループとして分類する分類部と、 この分類部で分類された前記グループ毎に平均パターン
特徴を抽出する平均パターン抽出部と、 この平均パターン抽出部で抽出された前記平均パターン
特徴と、辞書メモリに予め記憶された標準パターンとを
照合し、前記特定の文字を識別する識別部とを具備した
ことを特徴とする光学的文字読取装置。
1. A feature extraction unit for extracting a feature of a character pattern for each character that is photoelectrically converted by scanning a sheet, and stores the feature of the character pattern output from the feature extraction unit for at least one sheet. And a similarity between the features of the character pattern read from the feature memory, and the features of the character pattern having a similarity of a certain value or more as a group of features of the character pattern corresponding to a specific character. A classifying unit for classifying, an average pattern extracting unit for extracting an average pattern feature for each of the groups classified by the classifying unit, the average pattern feature extracted by the average pattern extracting unit, and a pre-stored dictionary memory. An optical character reading device comprising: an identification unit that matches the standard pattern and identifies the specific character.
JP58013985A 1983-01-31 1983-01-31 Optical character reader Expired - Lifetime JPH0731711B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58013985A JPH0731711B2 (en) 1983-01-31 1983-01-31 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58013985A JPH0731711B2 (en) 1983-01-31 1983-01-31 Optical character reader

Publications (2)

Publication Number Publication Date
JPS59149569A JPS59149569A (en) 1984-08-27
JPH0731711B2 true JPH0731711B2 (en) 1995-04-10

Family

ID=11848515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58013985A Expired - Lifetime JPH0731711B2 (en) 1983-01-31 1983-01-31 Optical character reader

Country Status (1)

Country Link
JP (1) JPH0731711B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5582382A (en) * 1978-12-18 1980-06-21 Matsushita Electric Ind Co Ltd Recognition system for hand-written symbol and kana (japanese syllabary) character
JPS55112687A (en) * 1979-02-22 1980-08-30 Nec Corp Character recognition system
JPS5779587A (en) * 1980-11-05 1982-05-18 Toshiba Corp Optical character reader

Also Published As

Publication number Publication date
JPS59149569A (en) 1984-08-27

Similar Documents

Publication Publication Date Title
JP2553608B2 (en) Optical character reader
US5844991A (en) Script identification from images using cluster-based templates
JPH0731711B2 (en) Optical character reader
JPS6316795B2 (en)
JP2894111B2 (en) Comprehensive judgment method of recognition result in optical type character recognition device
JPH0426153B2 (en)
JPH0991385A (en) Character recognition dictionary adding method and terminal ocr device using same
JPS6146573A (en) Character recognizing device
JP2580976B2 (en) Character extraction device
JPS59158482A (en) Character recognizing device
JPH0576674B2 (en)
JPS61290581A (en) Extracting and storing device for retrieval information
JP2973898B2 (en) Character recognition method and device
JPS62177686A (en) Optical character reader
JPH0319589B2 (en)
JP2682456B2 (en) Optical character reader
JPS5914078A (en) Reader of business form
JP3127413B2 (en) Character recognition device
JPS59128682A (en) Character reader
JPS58222384A (en) Discriminating system of font
JPS63257081A (en) Document input system
JPH0578068B2 (en)
JPS6136878A (en) Pattern extraction method for optical character reader
JPS61289479A (en) Character recognizing device for reading out connected characters
JPS61107485A (en) Optical character reader