JPS61168081A - System for implementing character dictionary - Google Patents

System for implementing character dictionary

Info

Publication number
JPS61168081A
JPS61168081A JP60009566A JP956685A JPS61168081A JP S61168081 A JPS61168081 A JP S61168081A JP 60009566 A JP60009566 A JP 60009566A JP 956685 A JP956685 A JP 956685A JP S61168081 A JPS61168081 A JP S61168081A
Authority
JP
Japan
Prior art keywords
stroke
code
pattern
master
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60009566A
Other languages
Japanese (ja)
Other versions
JPH0580707B2 (en
Inventor
Tatsuo Kasahara
笠原 龍夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60009566A priority Critical patent/JPS61168081A/en
Publication of JPS61168081A publication Critical patent/JPS61168081A/en
Publication of JPH0580707B2 publication Critical patent/JPH0580707B2/ja
Granted legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Abstract

PURPOSE:To prevent registration of a wrong stroke code in a character dictionary, by matching plural stroke patterns belonging to the same group as an inputted stroke code does to a master stroke. CONSTITUTION:A master character to be registered in a character dictionary is subjected to core line extraction 32 and stroke extraction 34 after input 30 and obtained data are displayed by means of a display. An operator inputs 38 a stroke code which is considered to be relevant while watching the display and a group of stroke codes belonging to the same group as the inputted stroke code does are retrieved 40. Then a stroke pattern is combined 41 and the combined stroke pattern is matched 42 to the master character pattern. When it is found as a result of the matching 42 that the maximum coincident rate exceeds a specified value, the stroke code is registered 46. If not, input of stroke code is again requested 48 and 38.

Description

【発明の詳細な説明】[Detailed description of the invention]

〔技術分野〕 本発明は1文字認識用の文字辞書を作成する方式に関す
る。
[Technical Field] The present invention relates to a method for creating a character dictionary for single character recognition.

【発明の背景】[Background of the invention]

発明者は2文字認識用の文字辞書を作成する方式の1つ
として、文字辞書に登録すべき文字(マスター文字」の
ストロークを抽出してディスプレイ装置の画面に表示さ
せ、オペレータがそのストロークを観察し、そのストロ
ークに相当するストロークコードを入力し、そのストロ
ークコードをマスター文字のストロークの位置およびサ
イズの情報とへもに文字辞書に登録する方式を研究して
きた。この方式は、相当に効率よく文字辞書を作成でき
ることが確認されたが、その一方で、オペレータの判断
の誤りにより不適切なストロークコードが登録される場
合があり、その誤りを修正するための作業に相当の時間
を要するという問題があることが判明した。 〔目 的〕 本発明は、上記のような問題点を解消した効率的な文字
辞書作成方式を提供することにある。 〔構 成〕 本発明による文字辞書作成方式は、マスター文字パター
ンからストロークと、その位置およびサイズを抽出する
手段と、抽出されたストロークを表示する手段と、mt
準化されたストロークを合成するためのストローク情報
を記憶する手段と、オペレータがストロークコードを入
力する手段と。 オペレータから入力されたストロークコードに対応する
ストロークおよびそれと同一分類に属するストロークの
パターンをストローク情報およびマスター文字から抽出
されたストロークのサイズおよび位置の情報に基づき合
成する手段と1合成されたストロークパターンとマスタ
ー文字から抽出されたストロークのパターンとのマツチ
ングを行い、最も一致度の高い合成ストロークのストロ
ークコードを文字辞書に登録する゛手段とからなること
を特徴とするものである。 以下1図面を参照し1本発明の一実施例について説明す
る。 〔実施例〕 第1図は本発明の一実施例を示すブロック図である。こ
の図において、10はマスター文字のパターンを記憶し
ている記憶装置、12はマスター文字パターンからスト
ロークと、その位置およびサイズを抽出するストローク
抽出装置、14はストロークテーブルを格納している記
憶装置、16はストロークを合成するためのストローク
情報を記憶している記憶装置、18はストローク情報お
よびストローク抽出部12で抽出されたストローク(マ
スターストローク)の位置およびサイズに基づき、スト
ロークパターンを合成するストローク合成装置、20は
オペレータがストロークコードを入力するための入力装
置、22は文字辞書を記憶するための記憶装置、24は
ディスプレイ装置、26は前記各部の制御およびマツチ
ングなどの処理を行う演算制御装置である。各部はシス
テムバス28を介して相互に接続されている。 この実施例においては、ストロークとして第3図に示す
42種類を考えている。この図の各ストローク(心線と
して示されている)の上の数字(16進表@)は、その
ストロークコードである。 また、この実施例においては、42種類のストロークを
1曲がり方向および太線化情報(後述)に基づき13の
分類に分けている。そのように分類°したストロークテ
ーブルを第4図に示す。このストロークテーブルは、記
憶装置14に格納されている。 記憶装置16に格納されているストローク情報を、第6
図に概念図に示す、各ストローク情報は。 ストロークコード、ストロークの長さを示すプロポーシ
ョン、ストロークに肉付けするための太線化情報、スト
ロークをビットパターンに展開するためのチェーンコー
ドからなる。 このチェーンコードは、ストロークをビット展開する際
に、心線上のあるドツトから次のドツトへ移行するため
の方向を、第7図に示す方向ベクトルのコード0〜7と
、ストップコード0の系列として表現したものである。 太線化情報は、第8図に概念図に示すように。 特徴コード、節点座標、太さデータ(L、R)からなる
6特徴コードは、ストロークの肉付けする部分を規定す
るコードである。第9図に例示するように(この図は、
r大」の左下にはらう部分などのストロークを示してい
る)、節点座標はストロークの太さを変化する点のX方
向座標を示す。 太さデータは、ストロークの心線にY方向に左右に肉付
けする幅を示している。 第2図は、本実施例における文字辞書作成処理のフロー
チャートである。この図を参照し・て、各処理段階を順
に説明する。 演算制御装置!26によって1文字辞書に登録すべき文
字のマスター文字パターンが、記憶装置lIOより読み
出されてストローク抽出装置12に入力される(ステッ
プ30)。 ストローク抽出装置12では、マスター文字パターンの
心線を抽出しくステップ32)、ついでストロークを抽
出する(ステップ34)。抽出されたマスターストロー
クのパターンと、その位置およびサイズのデータは、演
算制御装置26内のメモリに格納され、また演算制御装
置!26の制御により、ディスプレイ装置24に転送さ
れ表示される(ステップ36)。 オペレータは、ディスプレイ装置24に表示されたマス
ターストロークのパターンを観察し、そのマスタースト
ロークに該当すると思われるストロークコードを入力装
置20から入力する(ステップ38)。 演算制御装置26は、オペレータから入力されたストロ
ークコードを用いてストロークテーブル(14)を検索
し、そのストロークコードと同じ分類に属するすべての
ストロークコード(候補ストロークコード)を見付ける
(ステップ40)。 例えば、ストロークコード0120が入力された場合、
候補ストロークコードとして0120.0390が得ら
れる。 次に演算制御装置26は、各候補ストロークコードと、
マスターストローク(表示中)の位置とサイズのデータ
とをストローク合成装置に与え。 同装置を起動する。ストローク合成装置18は、各候補
ストロークコードに対応するストローク情報を記憶装置
16から読み出し、そのストローク情報にしたがってス
トロークを合成するが、その際、マスターストロークの
位置およびサイズに応じて1合成ストロークを変倍する
(ステップ41)。 得られた合成ストロークは、演算制御装置26に送られ
、その内部のメモリに一時的に記憶される。 演算制御装置i!26は、各候補ストロークコードの合
成ストローク・パターンと、マスターストローク・パタ
ーン(心線化前)とのマツチングを行い、マツチング率 M= (A+C)/ (B+C) を計算する(ステップ42)。こNで、A−Cは第5図
に示す同一符号の領域の画素数である。この図において
、実線50はマスターストローク・パターンであり、破
線52は合成ストローク・パターンである。つまり、ス
トローク間の不一致画素数と一致画素数との比をマツチ
ング率として計算する。 次に演算制御装W126は1合成ストロークの中でマス
ターストロークとの一致率が最高(マツチング率が最小
)の合成ストロークを選出し、その一致率が規定値以上
であるか判定する(ステップ44)。一致率が規定値以
上ならば、演算制御装置26は、その合成ストロークの
ストロークコードを、マスターストロークの位置および
サイズの情報とNもに、文字辞書(22)のマスター文
字のエントリに登録しくステップ46)、次のストロー
クの処理へ進む。 最高の一致率が規定値未満の場合、演算制御装!!26
は、候補ストロークコードをキャンセルし。 現在表示中のマスターストロークに癖する別のストロー
クコードの入力を促すメツセードをディスプレイ装置2
4に表示させ(ステップ48)、オペレータからの入力
を待つ。 以上の処理により、マスター文字の各ストロークに対す
るストロークコードと、ストロークの位置およびサイズ
の情報を文字辞書に登録することにより、そのマスター
文字用の文字辞書を作成する。同様の処理を必要なマス
ター文字のすべてについて行い1文字認識用の文字辞書
を作成する。 なお、前記のストローク抽出、ストローク合成やその変
倍の処理については、既に知られているので、その詳細
は説明しない。 〔効 果〕 以上説明したように、本発明によれば、オペレータから
入力されたストロークコードに対応する合成ストローク
だけでなく、そのストロークコードと同一分類に属する
他のストロークコードの合成ストロークについても、マ
スターストロークとのマツチングを行い、一致率が最高
の合成ストロークを選び、そのストロークコードを文字
辞書に登録するから、オペレータの判断ミスによる不適
当なストロ−クコ−、ドが文字辞書に登録されることが
なくなり1文字辞書作成を大幅に効率化できる。
As one method for creating a character dictionary for two-character recognition, the inventor extracted the strokes of characters to be registered in the character dictionary (master characters) and displayed them on the screen of a display device, and an operator observed the strokes. We have been researching a method in which the stroke code corresponding to that stroke is input, and the stroke code is registered in a character dictionary along with information on the stroke position and size of the master character.This method is quite efficient. It has been confirmed that it is possible to create a character dictionary, but on the other hand, there are cases where inappropriate stroke codes are registered due to errors in operator judgment, and the problem is that it takes a considerable amount of time to correct the errors. [Objective] The present invention is to provide an efficient character dictionary creation method that solves the above-mentioned problems. [Configuration] The character dictionary creation method according to the present invention is , means for extracting strokes, their positions and sizes from a master character pattern, means for displaying the extracted strokes, and mt
Means for storing stroke information for synthesizing normalized strokes; and means for an operator to input a stroke code. means for synthesizing a stroke corresponding to a stroke code input by an operator and a pattern of strokes belonging to the same classification based on stroke information and stroke size and position information extracted from a master character; 1. a synthesized stroke pattern; The present invention is characterized by comprising means for performing matching with a stroke pattern extracted from a master character and registering a stroke code of a synthetic stroke with the highest degree of matching in a character dictionary. An embodiment of the present invention will be described below with reference to the drawings. [Embodiment] FIG. 1 is a block diagram showing an embodiment of the present invention. In this figure, 10 is a storage device that stores a master character pattern, 12 is a stroke extraction device that extracts strokes, their positions and sizes from the master character pattern, and 14 is a storage device that stores a stroke table. 16 is a storage device that stores stroke information for compositing strokes; 18 is a stroke synthesis unit that synthesizes a stroke pattern based on the stroke information and the position and size of the stroke (master stroke) extracted by the stroke extraction unit 12; 20 is an input device for an operator to input a stroke code, 22 is a storage device for storing a character dictionary, 24 is a display device, and 26 is an arithmetic and control device that performs processing such as controlling and matching the various parts. be. Each section is interconnected via a system bus 28. In this embodiment, 42 types of strokes shown in FIG. 3 are considered. The number (hexadecimal @) above each stroke (shown as a core wire) in this diagram is its stroke code. Further, in this embodiment, 42 types of strokes are divided into 13 categories based on one bending direction and thick line information (described later). A stroke table classified in this way is shown in FIG. This stroke table is stored in the storage device 14. The stroke information stored in the storage device 16 is stored in the sixth
Each stroke information is shown in the conceptual diagram in the figure. It consists of a stroke code, a proportion indicating the length of the stroke, thickening information for fleshing out the stroke, and a chain code for developing the stroke into a bit pattern. When developing a stroke into bits, this chain code indicates the direction of transition from one dot to the next on the core line as a series of direction vector codes 0 to 7 and stop code 0 shown in Figure 7. It is expressed. The bold line information is as shown in the conceptual diagram in FIG. The six feature codes consisting of a feature code, node coordinates, and thickness data (L, R) are codes that define the part of the stroke to be fleshed out. As illustrated in Figure 9 (this figure is
(The lower left of "r large" indicates a stroke such as the part to be drawn), and the node coordinates indicate the X-direction coordinates of the point at which the thickness of the stroke changes. The thickness data indicates the width to be added to the center line of the stroke from left to right in the Y direction. FIG. 2 is a flowchart of the character dictionary creation process in this embodiment. Each processing step will be explained in turn with reference to this figure. Arithmetic control device! 26, the master character pattern of the character to be registered in the one-character dictionary is read out from the storage device IIO and input into the stroke extraction device 12 (step 30). The stroke extraction device 12 extracts the core lines of the master character pattern (step 32), and then extracts the strokes (step 34). The extracted master stroke pattern and its position and size data are stored in the memory within the arithmetic and control unit 26, and the arithmetic and control unit! 26, the data is transferred to the display device 24 and displayed (step 36). The operator observes the master stroke pattern displayed on the display device 24 and inputs a stroke code that seems to correspond to the master stroke from the input device 20 (step 38). The arithmetic and control unit 26 searches the stroke table (14) using the stroke code input by the operator, and finds all stroke codes (candidate stroke codes) that belong to the same classification as the stroke code (step 40). For example, if stroke code 0120 is input,
0120.0390 is obtained as a candidate stroke code. Next, the arithmetic and control unit 26 selects each candidate stroke code,
Provide data on the position and size of the master stroke (currently displayed) to the stroke synthesizer. Start the device. The stroke synthesis device 18 reads stroke information corresponding to each candidate stroke code from the storage device 16 and synthesizes strokes according to the stroke information. At this time, one synthesized stroke is changed depending on the position and size of the master stroke. Multiply (step 41). The obtained composite stroke is sent to the arithmetic and control unit 26 and temporarily stored in its internal memory. Arithmetic control device i! 26 performs matching between the composite stroke pattern of each candidate stroke code and the master stroke pattern (before core formation), and calculates the matching rate M=(A+C)/(B+C) (step 42). Here, A-C is the number of pixels in the area with the same symbol shown in FIG. In this figure, solid line 50 is the master stroke pattern and dashed line 52 is the composite stroke pattern. That is, the ratio between the number of mismatched pixels and the number of matching pixels between strokes is calculated as the matching rate. Next, the arithmetic and control unit W126 selects the composite stroke with the highest matching rate (minimum matching rate) with the master stroke from among the single composite strokes, and determines whether the matching rate is greater than or equal to a specified value (step 44). . If the matching rate is equal to or greater than the specified value, the arithmetic and control unit 26 takes a step to register the stroke code of the composite stroke, along with the master stroke position and size information, in the master character entry of the character dictionary (22). 46), proceed to processing the next stroke. If the highest match rate is less than the specified value, the arithmetic control unit! ! 26
cancels the candidate stroke code. The display device 2 displays a message that prompts you to input another stroke code that is specific to the currently displayed master stroke.
4 (step 48), and waits for input from the operator. Through the above processing, the stroke code for each stroke of the master character and information on the position and size of the stroke are registered in the character dictionary, thereby creating a character dictionary for the master character. Similar processing is performed for all necessary master characters to create a character dictionary for single character recognition. Note that the stroke extraction, stroke synthesis, and magnification processing described above are already known, so the details thereof will not be explained. [Effect] As explained above, according to the present invention, not only the composite stroke corresponding to the stroke code input by the operator but also the composite stroke of other stroke codes belonging to the same classification as that stroke code, Matching with the master stroke is performed, the composite stroke with the highest matching rate is selected, and that stroke code is registered in the character dictionary, so inappropriate stroke codes and codes due to operator error in judgment are registered in the character dictionary. This eliminates this problem and greatly improves the efficiency of creating a single-character dictionary.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示すブロック図。 第2図は同実施例の処理の流れを示すブローチャ−ト、
第3図はストロークとそのコードを対称されて示す図、
第4図はストロークテーブルの説明図5第5図はマスタ
ーストロークと合成ストロークとのマツチングの説明図
、第6図はストローク情報の概念図、第7図はチェーン
コードに用いられる方向ベクトルのコードを示す図、第
8図は太線化情報の概念図、第9図は太線化情報の説明
図である。 lO・・・マスター文字パターン用記憶装置。 12・・・ストローク抽出装置、  14・・・ストロ
ークテーブル用記憶装置、  16・・・ストローク情
報用記憶装置、  18・・・ストローク合成装置。 20・・・入力装置、  22・・・文字辞書用記憶装
置、24・・・ディスプレイ装置、 26・・・演算制
御装置。 第1図 第2図 第  3  図
FIG. 1 is a block diagram showing one embodiment of the present invention. FIG. 2 is a brochart showing the process flow of the same embodiment;
Figure 3 shows the stroke and its chord symmetrically;
Fig. 4 is an explanatory diagram of the stroke table. Fig. 5 is an explanatory diagram of matching between master stroke and composite stroke. Fig. 6 is a conceptual diagram of stroke information. Fig. 7 is an illustration of the direction vector code used in the chain code. 8 is a conceptual diagram of thick line information, and FIG. 9 is an explanatory diagram of thick line information. lO: Storage device for master character pattern. 12... Stroke extraction device, 14... Stroke table storage device, 16... Stroke information storage device, 18... Stroke synthesis device. 20... Input device, 22... Character dictionary storage device, 24... Display device, 26... Arithmetic control device. Figure 1 Figure 2 Figure 3

Claims (1)

【特許請求の範囲】[Claims] (1)マスター文字パターンからストロークと、その位
置およびサイズを抽出する手段と、抽出されたストロー
クのパターンを表示する手段と、標準化されたストロー
クのパターンを合成するためのストローク情報を記憶す
る手段と、オペレータがストロークコードを入力する手
段と、オペレータから入力されたストロークコードに対
応するストロークおよびそれが同一分類に属するストロ
ークのパターンを、ストローク情報およびマスター文字
から抽出されたストロークのサイズおよび位置の情報に
基づき合成する手段と、合成されたストロークパターン
とマスター文字から抽出されたストロークのパターンと
のマッチングを行い、最も一致度の高い合成ストローク
のストロークコードを文字辞書に登録する手段とからな
ることを特徴とする文字辞書作成方式。
(1) A means for extracting strokes, their positions and sizes from a master character pattern, a means for displaying the extracted stroke pattern, and a means for storing stroke information for synthesizing a standardized stroke pattern. , a means for the operator to input a stroke code, a stroke corresponding to the stroke code input by the operator and a pattern of strokes belonging to the same classification, stroke information and information on the size and position of the stroke extracted from the master character. and a means for matching the synthesized stroke pattern with the stroke pattern extracted from the master character and registering the stroke code of the synthesized stroke with the highest degree of matching in a character dictionary. Characteristic dictionary creation method.
JP60009566A 1985-01-22 1985-01-22 System for implementing character dictionary Granted JPS61168081A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60009566A JPS61168081A (en) 1985-01-22 1985-01-22 System for implementing character dictionary

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60009566A JPS61168081A (en) 1985-01-22 1985-01-22 System for implementing character dictionary

Publications (2)

Publication Number Publication Date
JPS61168081A true JPS61168081A (en) 1986-07-29
JPH0580707B2 JPH0580707B2 (en) 1993-11-10

Family

ID=11723842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60009566A Granted JPS61168081A (en) 1985-01-22 1985-01-22 System for implementing character dictionary

Country Status (1)

Country Link
JP (1) JPS61168081A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0198092A (en) * 1987-10-09 1989-04-17 Iizeru:Kk Method for registering character data
JPH0620099A (en) * 1990-09-21 1994-01-28 Internatl Business Mach Corp <Ibm> Method and apparatus for establishment of model in on-line handwritten character recognition system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0198092A (en) * 1987-10-09 1989-04-17 Iizeru:Kk Method for registering character data
JPH0620099A (en) * 1990-09-21 1994-01-28 Internatl Business Mach Corp <Ibm> Method and apparatus for establishment of model in on-line handwritten character recognition system

Also Published As

Publication number Publication date
JPH0580707B2 (en) 1993-11-10

Similar Documents

Publication Publication Date Title
CN110414451A (en) It is a kind of based on end-to-end licence plate recognition method, device, equipment and storage medium
CN111680480A (en) Template-based job approval method and device, computer equipment and storage medium
CN114022748B (en) Target identification method, device, equipment and storage medium
EP0657838B1 (en) Image processing apparatus and method
CN106557553A (en) The method and device of Data Matching
JPS61168081A (en) System for implementing character dictionary
GB2236037A (en) Method and apparatus for filling contours in digital typefaces
CN115330998A (en) Target detection model training method and device, and target detection method and device
CN111460821A (en) Entity identification and linking method and device
CN114782950B (en) 2D image text detection method based on Chinese character stroke characteristics
CN117456549A (en) Intra-station thematic graphic primitive identification method based on intelligent image algorithm
JP2740506B2 (en) Image recognition method
CN110110658A (en) A kind of includes the image segmentation processing method and device of lane line
CN117314928A (en) Natural landscape simulation system based on image segmentation and virtual reality
JPH07117967B2 (en) Drawing processing system
CN113326843A (en) License plate recognition method and device, electronic equipment and readable storage medium
JPH09127929A (en) Multifont device and multifont composing method
JP2000099631A (en) Pattern recognizing device and pattern recognizing method
JPH1040401A (en) Format analytic method in family register data preparation
CN109933748A (en) Method of model identification, device, terminal device and the readable storage medium storing program for executing of ellipsoid equation
JPS61262987A (en) Graphic pattern extracting system containing learning function
JPH04181376A (en) Figure candidate extracting method of automatic drawing input device
JPH0247787B2 (en)
JPS6172376A (en) Recognizing order deciding system
JPH10111933A (en) Segment editing processing method