JPH0514953B2 - - Google Patents
Info
- Publication number
- JPH0514953B2 JPH0514953B2 JP59156258A JP15625884A JPH0514953B2 JP H0514953 B2 JPH0514953 B2 JP H0514953B2 JP 59156258 A JP59156258 A JP 59156258A JP 15625884 A JP15625884 A JP 15625884A JP H0514953 B2 JPH0514953 B2 JP H0514953B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- code
- memory
- characters
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000006870 function Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 8
- 238000012795 verification Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 238000000034 method Methods 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- SBAJRGRUGUQKAF-UHFFFAOYSA-N 3-(2-cyanoethylamino)propanenitrile Chemical compound N#CCCNCCC#N SBAJRGRUGUQKAF-UHFFFAOYSA-N 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000010724 Wisteria floribunda Nutrition 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、媒体上から読み取つた複数個の文字
の組合せを単語として照合する照合装置に係り、
特に高速照合が可能な照合装置に関するものであ
る。[Detailed Description of the Invention] [Industrial Application Field] The present invention relates to a collation device that collates a combination of a plurality of characters read from a medium as a word.
In particular, the present invention relates to a verification device capable of high-speed verification.
近来、OCRの進歩は目覚ましく、英数字、か
な文字を対象とする活字印刷、及び手書き文字の
読み取りが可能なOCRが、帳票処理業務等に広
く実用に供されているが、更に漢字を含む日本語
文字の認識技術の開発も盛んで種々の方法が試み
られている。 In recent years, advances in OCR have been remarkable, and OCR, which is capable of printing alphanumeric characters and kana characters, and reading handwritten characters, is widely used in form processing operations, etc. Development of word recognition technology is also active, and various methods are being tried.
このようなOCRにおいては、認識する漢字が
複数個で単語を構成している時には個々の漢字を
認識した後、漢字の組合わせを単語辞書と照合す
ることにより認識精度を高めている。従つてこの
ような照合を行う場合には照合を高速に行う方法
が望まれている。 In this type of OCR, when a word is made up of multiple kanji, recognition accuracy is improved by recognizing each kanji and then comparing the combination of kanji with a word dictionary. Therefore, when performing such verification, a method of performing verification at high speed is desired.
第3図は漢字を含む手書き文字を対象とする日
本語文字のOCRのブロツク図を示す。
Figure 3 shows a block diagram of OCR for Japanese characters, which targets handwritten characters including kanji.
図において、帳票1は、フイールド毎に顧客の
住所、氏名、または品名等が記された伝票であ
る。 In the figure, form 1 is a form in which the customer's address, name, product name, etc. are written in each field.
読取部2は、帳票1上に照射された光の反射光
をレンズ系21を経てイメージセンサ22によつ
て走査して1フレームの文字を読み取り、イメー
ジデータとして2値化回路3へ送る機能を有す
る。 The reading unit 2 has a function of scanning the reflected light of the light irradiated onto the form 1 through a lens system 21 with an image sensor 22, reading one frame of characters, and transmitting the characters as image data to the binarization circuit 3. have
主制御部4は、各部を制御して文字読取り、認
識処理プログラムを遂行する機能を有する。 The main control section 4 has a function of controlling each section and executing a character reading and recognition processing program.
画像メモリ5は、2値化されたイメージデー
タ、即ち、読み取られた文字の画像データを記憶
するものである。 The image memory 5 stores binarized image data, that is, image data of read characters.
1文字切出回路6は、フオーマツト情報メモリ
9から送られるフオーマツト情報に基いて、画像
メモリ5に記憶された1フレームの文字より1文
字を切り出して認識回路10へ送る機能を有す
る。 The character cutting circuit 6 has a function of cutting out one character from one frame of characters stored in the image memory 5 and sending it to the recognition circuit 10 based on the format information sent from the format information memory 9.
特徴抽出回路7は、認識回路10から送られる
文字の特徴、即ち、文字の画数、曲線係数等を抽
出して認識回路10へ送る機能を有する。 The feature extraction circuit 7 has a function of extracting character features sent from the recognition circuit 10, such as the number of strokes of the character, curve coefficients, etc., and sending them to the recognition circuit 10.
辞書メモリ8は、認識の基準となる文字の特
徴、即ち、漢字、平仮名、片仮名、英文字、数
字、記号等の文字の特徴が記憶されており、認識
回路10の要求により、順次認識回路10へ送出
する機能を有する。 The dictionary memory 8 stores characteristics of characters serving as recognition standards, that is, characteristics of characters such as kanji, hiragana, katakana, English letters, numbers, symbols, etc. The dictionary memory 8 stores characteristics of characters such as kanji, hiragana, katakana, English letters, numbers, symbols, etc. It has a function to send to.
フオーマツト情報メモリ9は、帳票1上の文字
記入位置、及び単語長を示す情報が格納されてお
り、読み取られた文字の記入位置、或いは単語長
等を画像メモリ5、1文字切出回路6、及び認識
回路10へ送る機能を有する。 The format information memory 9 stores information indicating the character entry position and word length on the form 1, and stores the read character entry position or word length etc. in the image memory 5, the single character cutting circuit 6, and has a function of sending it to the recognition circuit 10.
認識回路10は、1文字切出回路6より送られ
た文字に対する特徴を特徴抽出回路7より受け取
り、辞書メモリ8から順次送られる文字の特徴と
を照合して一致度を求め、一致度の高いものから
順に文字コードを候補列とし、順次画像メモリ5
の文字の認識を行い、フオーマツト情報メモリ9
からの単語長によつて候補文字の文字コードを組
合せて単語コードを構成して単語候補列メモリ1
1へ送出する機能を有する。 The recognition circuit 10 receives from the feature extraction circuit 7 the features of the characters sent from the single character extraction circuit 6, compares them with the features of the characters sequentially sent from the dictionary memory 8, determines the degree of matching, and determines the degree of matching. Character codes are set as candidate strings in order, and sequentially stored in the image memory 5.
Recognizes the characters in the format information memory 9.
A word code is constructed by combining the character codes of candidate characters according to the word length from the word candidate string memory 1.
It has a function to send to 1.
単語候補列メモリ11は、認識回路10から送
られる単語候補列のコードを記憶する記憶手段で
ある。 The word candidate string memory 11 is a storage means for storing the code of the word candidate string sent from the recognition circuit 10.
比較回路12は、単語候補列メモリ11から送
られる単語候補列の文字コードの組合せと、単語
辞書メモリ13から送られる単語とを比較照合し
て一致度の高い単語を候補として出力する機能を
有する。 The comparison circuit 12 has a function of comparing and collating the character code combinations of the word candidate string sent from the word candidate string memory 11 and the words sent from the word dictionary memory 13, and outputting words with a high degree of matching as candidates. .
単語辞書メモリ13は、単語のコードを辞書と
して記憶する記憶手段である。 The word dictionary memory 13 is a storage means for storing word codes as a dictionary.
このような構成及び機能を有するので、文字認
識の方法を説明すると、まず帳票1上の文字が読
み取られて2値化された画像データは画像メモリ
5に格納される。 Since it has such a configuration and function, the character recognition method will be explained. First, the characters on the form 1 are read and the binarized image data is stored in the image memory 5.
次に画像データは1文字切出回路6に送られ、
フオーマツト情報メモリ9から送られた文字位置
情報に基いて、1文字の切出しを行つて認識回路
10へ送る。 Next, the image data is sent to the single character cutting circuit 6,
Based on the character position information sent from the format information memory 9, one character is cut out and sent to the recognition circuit 10.
認識回路10は入力した文字データを特徴抽出
回路7へ送り、その文字データの特徴を抽出させ
て受け取る。そこで辞書メモリ8より文字の特徴
を順次読み出して文字データの特徴と照合して、
一致度の高い文字を認識の答として候補文字と
し、フオーマツト情報メモリ9からの情報による
単語長によつて候補単語コードを編成して出力す
る。 The recognition circuit 10 sends the input character data to the feature extraction circuit 7, which extracts and receives the features of the character data. Therefore, the characteristics of the characters are sequentially read out from the dictionary memory 8 and compared with the characteristics of the character data.
Characters with a high degree of matching are recognized as candidate characters, and candidate word codes are organized and output based on word lengths based on information from the format information memory 9.
出力された候補単語コードの候補列は、単語候
補列メモリ11に記憶され、更に比較回路12へ
送られる。一方、単語辞書メモリ13から単語コ
ードが比較回路12へ送られて、候補単語コード
と比較され、照合の結果、一致した時はその単語
が存在したことになり、その候補単語コードcが
出力される。 The output candidate word code candidate string is stored in the word candidate string memory 11 and further sent to the comparison circuit 12. On the other hand, the word code from the word dictionary memory 13 is sent to the comparison circuit 12, where it is compared with the candidate word code. If the word code matches as a result of the comparison, it means that the word exists, and the candidate word code c is output. Ru.
このようにして画像メモリ5に格納されている
画像データは順次文字認識の後、単語照合されて
出力される。 The image data stored in the image memory 5 in this manner is sequentially character-recognized, word-matched, and output.
上記従来方法では単語の照合方法として、入力
単語コードを単語辞書メモリ13に記憶されてい
る単語コードと順次比較して行くので比較処理量
が多く照合速度が遅いという問題点がある。
In the conventional method described above, since the input word code is sequentially compared with the word code stored in the word dictionary memory 13 as a word matching method, there is a problem that the amount of comparison processing is large and the matching speed is slow.
本発明は、単語辞書メモリに、単語のコードを
アドレスとして該単語の存在の有無を異なる符号
で記憶し、入力単語を照合する時は、入力単語の
コードをアドレスとして単語辞書メモリより単語
の存在の有無を示す符号を読み出して判定する照
合装置であり、かくすることにより上記問題点を
解決することができる。
The present invention stores the presence or absence of a word in a word dictionary memory using the code of the word as an address, and stores the presence or absence of the word using a different code. This is a verification device that reads out and determines the code indicating the presence or absence of an object, thereby solving the above-mentioned problems.
本発明によれば、入力単語コードを単語辞書メ
モリに記憶されている単語コードと順次照合する
従来方法に代えて、単語辞書メモリ中に単語のコ
ードをアドレスとして単語の存在の有無を異なる
記号、例えば“1”,“0”で記憶しておき、照合
時に入力される単語コードをアドレスとして、そ
の記憶位置の“1”、或いは、“0”を読み取つて
その単語の存在の有無を判定することにより、検
索のみで照合できるので高速処理が可能となる。
According to the present invention, instead of the conventional method of sequentially collating an input word code with word codes stored in a word dictionary memory, the presence or absence of a word is determined by using a word code as an address in the word dictionary memory using different symbols. For example, it is stored as "1" and "0", and using the word code input during verification as an address, the "1" or "0" at that storage location is read to determine whether the word exists. This enables high-speed processing because matching can be performed only by searching.
以下、本発明の一実施例を第1図及び第2図を
参照して説明する。第1図は本発明による実施例
を示すブロツク図、第2図は第1図の説明図であ
る。全図を通じて同一符号は同一対象物を示す。
An embodiment of the present invention will be described below with reference to FIGS. 1 and 2. FIG. 1 is a block diagram showing an embodiment of the present invention, and FIG. 2 is an explanatory diagram of FIG. 1. The same reference numerals indicate the same objects throughout the figures.
第1図において、主制御部4aは、読み取られ
た文字の画像データの特徴に基いて認識処理を遂
行し、またその結果により編成された単語を後述
する符号化単語辞書メモリを制御して照合処理を
行う機能を有する。 In FIG. 1, the main control unit 4a performs recognition processing based on the characteristics of the image data of the read characters, and also controls the encoded word dictionary memory (described later) to collate the words organized based on the results. It has the function of performing processing.
符号化単語辞書メモリ14は、単語のコードを
アドレスとして単語の存在の有無を異なる符号で
記憶する記憶手段である。即ち、単語コードをア
ドレスとして、その記憶位置に、符号として例え
ばその記憶位置に単語が存在するものは、“1”、
存在しないものは“0”が記憶されている。 The encoded word dictionary memory 14 is a storage means that uses the code of a word as an address and stores the presence or absence of a word using a different code. That is, if a word code is used as an address and a word exists at that storage location as a code, for example, "1",
If the item does not exist, "0" is stored.
そして従来例で説明した比較回路12は省略さ
れている。 The comparison circuit 12 described in the conventional example is omitted.
このような構成及び機能を有するので、認識回
路10での認識処理後の単語照合方法を説明する
と、
まず認識回路10より出力された候補単語コ
ードの候補列は、単語候補列メモリ11に記憶
される。 Having such a configuration and function, the word matching method after recognition processing in the recognition circuit 10 will be explained. First, the candidate string of candidate word codes output from the recognition circuit 10 is stored in the word candidate string memory 11. Ru.
単語候補列メモリ11に記憶された候補単語
コードは符号化単語辞書メモリ14に送られ、
候補単語コードをアドレスとして検索し、その
記憶位置の符号を読み取られて、“1”、或いは
“0”が出力して単語候補列メモリ11に送ら
れる。例えば第2図に示すように、入力単語が
“富士”の場合に、そのコード(C9C9,
BBCE)に対するアドレスa,bによつて符号
化単語辞書メモリ14を検索して符号を読み取
る。 The candidate word codes stored in the word candidate string memory 11 are sent to the encoded word dictionary memory 14,
The candidate word code is searched as an address, the code at the storage location is read, and "1" or "0" is output and sent to the word candidate string memory 11. For example, as shown in Figure 2, if the input word is "Fuji", the code (C9C9,
The encoded word dictionary memory 14 is searched using addresses a and b for BBCE) and the code is read.
かくて符号が“1”であれば、その単語は存
在すると判定され、また“0”であれば存在し
ないと判定される。そこで“1”の時に候補単
語コードcが出力される。。 Thus, if the code is "1", it is determined that the word exists, and if the code is "0", it is determined that the word does not exist. Therefore, when the value is "1", candidate word code c is output. .
このようにして単語候補列メモリ11に入力さ
れた単語候補列の単語コードをアドレスとして符
号化単語辞書メモリ14の検索により高速照合す
ることができる。 In this manner, high-speed verification can be performed by searching the encoded word dictionary memory 14 using the word code of the word candidate string inputted to the word candidate string memory 11 as an address.
上記は認識回路10より出力した単語候補列を
直ちに単語候補列メモリ11に入力して処理する
場合を説明したが、認識回路10からの出力を例
えばフロツピーデイスク等の記憶手段に順次記憶
して置き、後から一括して処理する方法としても
同様の効果が得られる。 In the above description, the word candidate string output from the recognition circuit 10 is immediately input to the word candidate string memory 11 for processing. However, the output from the recognition circuit 10 may be sequentially stored in a storage means such as a floppy disk. A similar effect can be obtained by placing it in place and processing it all at once.
以上説明したように本発明によれば、単語候補
の照合を高速に処理することができるという効果
がある。
As explained above, according to the present invention, there is an effect that matching of word candidates can be processed at high speed.
第1図は本発明による実施例を示すブロツク
図、第2図は第1図の説明図、第3図は従来方法
を示すブロツク図である。
図において、4,4aは主制御部、5は画像メ
モリ、6は1文字切出回路、7は特徴抽出回路、
8は辞書メモリ、9はフオーマツト情報メモリ、
10は認識回路、11は単語候補列メモリ、12
は単語辞書メモリ、13は比較回路、14は符号
化単語辞書メモリを示す。
FIG. 1 is a block diagram showing an embodiment according to the present invention, FIG. 2 is an explanatory diagram of FIG. 1, and FIG. 3 is a block diagram showing a conventional method. In the figure, 4 and 4a are main control units, 5 is an image memory, 6 is a single character extraction circuit, 7 is a feature extraction circuit,
8 is a dictionary memory, 9 is a format information memory,
10 is a recognition circuit, 11 is a word candidate string memory, 12
13 is a comparison circuit, and 14 is a coded word dictionary memory.
Claims (1)
るか否かを判別する照合装置であつて、単語のコ
ードをアドレスとして該単語の存在の有無を異な
る符号で記憶する単語辞書メモリを備え、前記入
力単語を照合する時は、該入力単語のコードをア
ドレスとして前記単語辞書メモリより前記単語の
存在の有無を示す符号を読み出して判定すること
を特徴とする照合装置。1. A collation device for determining whether or not an input word exists in a word dictionary memory, comprising a word dictionary memory that uses a word code as an address and stores the presence or absence of the word with a different code, A collation device characterized in that when collating an input word, the code of the input word is used as an address and a code indicating the presence or absence of the word is read out from the word dictionary memory to make a determination.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15625884A JPS6133584A (en) | 1984-07-26 | 1984-07-26 | Collation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15625884A JPS6133584A (en) | 1984-07-26 | 1984-07-26 | Collation device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6133584A JPS6133584A (en) | 1986-02-17 |
JPH0514953B2 true JPH0514953B2 (en) | 1993-02-26 |
Family
ID=15623862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15625884A Granted JPS6133584A (en) | 1984-07-26 | 1984-07-26 | Collation device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6133584A (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS49102258A (en) * | 1973-01-31 | 1974-09-27 |
-
1984
- 1984-07-26 JP JP15625884A patent/JPS6133584A/en active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS49102258A (en) * | 1973-01-31 | 1974-09-27 |
Also Published As
Publication number | Publication date |
---|---|
JPS6133584A (en) | 1986-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7162086B2 (en) | Character recognition apparatus and method | |
JPS6262387B2 (en) | ||
JPH0772906B2 (en) | Document recognition device | |
JPH0682403B2 (en) | Optical character reader | |
JPH0514953B2 (en) | ||
JPS6262388B2 (en) | ||
JPS6146573A (en) | Character recognizing device | |
JP2538543B2 (en) | Character information recognition device | |
JPH051512B2 (en) | ||
JP2746345B2 (en) | Post-processing method for character recognition | |
JPS60138689A (en) | Character recognizing method | |
JPH0256086A (en) | Method for postprocessing for character recognition | |
JP3151866B2 (en) | English character recognition method | |
JPS63282586A (en) | Character recognition device | |
JPS6143383A (en) | Character recognizer | |
JP2784004B2 (en) | Character recognition device | |
JP2917310B2 (en) | Word dictionary search method for word matching | |
JP2972443B2 (en) | Character recognition device | |
JPS63263588A (en) | Character reader | |
JPH0475556B2 (en) | ||
JPH076212A (en) | Intelligence processing unit for optical character reader | |
JP2923295B2 (en) | Pattern identification processing method | |
JPS63268082A (en) | Pattern recognizing device | |
JPH041882A (en) | Character recognition and device for the same | |
JP2001056840A (en) | Method and device for character recognition, document image processing system, and recording medium |