JPH03196284A - Character recognizing device - Google Patents

Character recognizing device

Info

Publication number
JPH03196284A
JPH03196284A JP1336855A JP33685589A JPH03196284A JP H03196284 A JPH03196284 A JP H03196284A JP 1336855 A JP1336855 A JP 1336855A JP 33685589 A JP33685589 A JP 33685589A JP H03196284 A JPH03196284 A JP H03196284A
Authority
JP
Japan
Prior art keywords
word
image information
storage means
character
information storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1336855A
Other languages
Japanese (ja)
Inventor
Shigeo Yoneda
米田 茂生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1336855A priority Critical patent/JPH03196284A/en
Publication of JPH03196284A publication Critical patent/JPH03196284A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To simplify a character recognizing device by reading printed characters as image information by a scanner with one word as the unit to store them in an image information storage means and recognizing and encoding image information. CONSTITUTION:Printed characters are read as image information by a scanner 101 with one word as the unit and are stored in an image information storage means 102. Pattern matching between patterns of characters stored in the image information storage means 102 and patterns of the standard font of characters stored in a recognition information storage means 103 is performed to select a character code corresponding to each of characters stored in the image information storage means 102, and the selected character code is stored in a word code storage means 105 with each word as the unit and is read and outputted. Since printed characters are read and stored with one word as the unit and are encoded in this manner, the whole of the character recognizing device is simplified.

Description

【発明の詳細な説明】 (イ)産業上の利用分野 この発明は、印字された英数字等のキャラクタをスキャ
ナーで読み取って認識するキャラクタ認識装置に関する
DETAILED DESCRIPTION OF THE INVENTION (A) Field of Industrial Application This invention relates to a character recognition device that reads and recognizes printed characters, such as alphanumeric characters, using a scanner.

(ロ)従来の技術 従来、この種のキャラクタ認識装置において、英文等の
文章の読み取り、及び認識を行うには、第5図に示すよ
うに、固定式スキャナー51に読み取り紙面52を載せ
、複数行にわたる文章をイメージ情報としてパーソナル
コンピュータ53のRAMに一坦人力し、その後、認識
処理装置54にて、一連の文章の認識処理を行うよう?
どしている。
(B) Prior Art Conventionally, in this type of character recognition device, in order to read and recognize sentences such as English sentences, as shown in FIG. Is it possible to manually input a sentence spanning a line into the RAM of the personal computer 53 as image information, and then perform recognition processing on a series of sentences in the recognition processing device 54?
What's wrong?

また、上記固定式スキャナー51の代わりに、読み取り
幅の広いライン型のスキャナーを副走査方向に移動させ
、複数行をイメージ情報として入力するようにしたもの
も見られる。
Furthermore, in place of the fixed scanner 51, a line-type scanner with a wide reading width is moved in the sub-scanning direction, and a plurality of lines are input as image information.

(ハ)発明が解決しようとする課題 このように、従来のキャラクタ認識装置においては、英
文等の文章全体をスキャナーでイメージ情報として入力
し、その後認識するようにしているため、一連の文章を
途切れる事なく入力しなければならず、大容量のメモリ
ーと大型のスキャナーが必要であった。
(C) Problems to be Solved by the Invention As described above, in conventional character recognition devices, the entire sentence, such as English, is input as image information using a scanner and then recognized, so a series of sentences may be interrupted. This required a large amount of memory and a large scanner.

この発明は、このような事情を考慮してなされたもので
、認識したキャラクタを一単語ずつコード化して記憶し
ておき、一連の文章のコード化が完了した時点で外部へ
データを転送するようにして、システムの簡易化を図っ
たキャラクタ認識装置を提供するものである。
This invention was made in consideration of these circumstances, and it is possible to encode and store recognized characters word by word, and to transfer the data to an external device when the encoding of a series of sentences is completed. The present invention provides a character recognition device with a simplified system.

(ニ)課題を解決するための手段 第1図はこの発明の構成を示すブロック図である。(d) Means to solve the problem FIG. 1 is a block diagram showing the configuration of the present invention.

図に示すように、この発明は、印字されたキャラクタを
1単語ずつイメージ情報として読み取るスキャナー10
1と、スキャナー101で読み取られたイメージ情報を
記憶するイメージ情報記憶手段102と、キャラクタの
標準フォントのパターンとそれに対応するキャラクタコ
ードとを記憶した認識情報記憶手段103と、イメージ
情報記憶手段!02に記憶されたキャラクタのパターン
と認識情報記憶手段103に記憶されたキャラクタの標
準フォントのパターンとをマツチングさせることにより
イメージ情報記憶手段+02に記憶されに各キャラクタ
に対応するキャラクタコードを選択する選択手段104
と、選択手段104により選択されたキャラクタコード
を単語毎に記憶する単語コード記憶手段105と、単語
コード記憶手段+05からキャラクタコードを読出して
出力する出力手段+06を備えてなるキャラクタ認識装
置である。
As shown in the figure, the present invention includes a scanner 10 that reads printed characters word by word as image information.
1, an image information storage means 102 for storing image information read by the scanner 101, a recognition information storage means 103 for storing standard font patterns of characters and character codes corresponding thereto, and an image information storage means! Selection of selecting a character code corresponding to each character stored in the image information storage means +02 by matching the character pattern stored in the image information storage means +02 with the standard font pattern of the character stored in the recognition information storage means 103. Means 104
This is a character recognition device comprising a word code storage means 105 for storing the character code selected by the selection means 104 for each word, and an output means +06 for reading out and outputting the character code from the word code storage means +05.

なお、この発明において、選択手段+04及び出力手段
106としては、一般に、CPU、ROM、RAM、I
10ボートからなるマイクロコンピュータを用いるのが
便利であり、イメージ情報記憶手段102及び単語コー
ド記憶手段!05としては、通常、その中のRAMが、
また、認識情報記憶手段103としては、その中のRO
Mが、それぞれ用いられる。
In this invention, the selection means +04 and the output means 106 generally include a CPU, ROM, RAM, I
It is convenient to use a microcomputer consisting of 10 boards, image information storage means 102 and word code storage means! As for 05, the RAM in it is usually
In addition, as the recognition information storage means 103, the RO
M are used respectively.

(ホ)作用 第1図に示すように、この発明によれば、印字されたキ
ャラクタは、スキャナー101によって、!単語ずつイ
メージ情報として読み取られてイメージ情報記憶手段!
02に記憶される。
(E) Function As shown in FIG. 1, according to the present invention, printed characters are scanned by the scanner 101! Image information storage means that reads each word as image information!
02.

そして、イメージ情報記憶手段102に記憶されたキャ
ラクタのパターンと、認識情報記憶手段103に記憶さ
れたキャラクタの標準フォントのパターンとがマツチン
グされて、イメージ情報記憶手段102に記憶された各
キャラクタに対応するキャラクタコードが選択され、選
択されたキャラクタコードが単語毎に単語コード記憶手
段105に記憶され、読出されて出力される。
Then, the character pattern stored in the image information storage means 102 and the standard font pattern of the character stored in the recognition information storage means 103 are matched to correspond to each character stored in the image information storage means 102. The selected character code is stored for each word in the word code storage means 105, read out, and output.

従って、印字されたキャラクタを単語単位で読み取って
記憶し、コード化するようにしたので、スキャナーの小
型化が可能になると共に、イメージ情報記憶手段の記憶
容量が少なくてすみ、これにより、特に認識処理のソフ
トウェアをはじめとするキャラクタ認識装置全体の簡易
化を図ることができる。
Therefore, since the printed characters are read word by word, stored, and encoded, the scanner can be made smaller, and the storage capacity of the image information storage means is also reduced. The entire character recognition device including processing software can be simplified.

(へ)実施例 以下、図面に示す実施例に基づいてこの発明を詳述する
。なお、この発明はこれによって限定される乙のではな
い。
(f) Examples Hereinafter, the present invention will be described in detail based on examples shown in the drawings. Note that this invention is not limited to this.

第2図はこの発明の一実施例の構成を示すブロック図で
ある。
FIG. 2 is a block diagram showing the configuration of an embodiment of the present invention.

図において、1は単語入力スキャナーであり、紙面に印
字された文章中におけろ文字を1単語ずつイメージ情報
として読み取るノhンデイタイブの小型スキャナーであ
る。
In the figure, reference numeral 1 denotes a word input scanner, which is a compact, day-to-day type scanner that reads characters in sentences printed on paper one by one as image information.

単語人力スキャナー1は読み取ったイメージ情報の単語
を認識装置2に転送する。
The human word scanner 1 transfers the words of the read image information to the recognition device 2.

認識装置2は、CPU2aと、単語入力スキャナーlか
ら入力されたイメージ情報の単語を記憶するイメージ情
報格納用RA M 2 bと、キャラクタの標準フォン
トのパターンとそれに対応するキャラクタコード、及び
それに基づいてイメージ情報の単語を認識してコード化
するプログラムが格納された単語認識用プログラムRO
M2cと、コード化されたキャラクタコードを単語毎に
格納するコード格納用RAM2dとから構成される装置
CPU2aは、イメージ情報格納用RA M 2 bに
格納されたキャラクタのパターンと、単語認識用プログ
ラムROM2cに記憶されたキャラクタの標準フォント
のパターンとをマツチングさせることにより、イメージ
情報格納用RAM2bに格納された各キャラクタに対応
するキャラクタコードを選択し、それによって各キャラ
クタをコード化し、コード格納用RAM2dに格納する
The recognition device 2 includes a CPU 2a, an image information storage RAM 2b that stores words of image information input from a word input scanner 1, a standard font pattern of a character, a character code corresponding to the pattern, and a character code based on the standard font pattern of the character. Word recognition program RO that stores a program that recognizes and encodes words in image information
The device CPU 2a, which is composed of an M2c and a code storage RAM 2d that stores coded character codes for each word, stores character patterns stored in the image information storage RAM 2b and a word recognition program ROM 2c. A character code corresponding to each character stored in the image information storage RAM 2b is selected by matching the standard font pattern of the character stored in the image information storage RAM 2b. Store.

そして、例えば「ピリオド“、°」を認識した時点で、
それを一つの文章の終わりと見なして、コード格納用R
AM2dからキャラクタコードを読出して出力し、一連
のコード化された文章を電子手帳3へ転送する。なお、
この電子手帳3への文章の転送は、認識装置2に転送用
のキーを設けておき、そのキーの押下によって転送する
ようにしてもよい。
For example, when recognizing "period", °,
Treating it as the end of one sentence, use R for storing code.
The character code is read and output from the AM2d, and a series of coded sentences are transferred to the electronic notebook 3. In addition,
The text may be transferred to the electronic notebook 3 by providing a transfer key in the recognition device 2 and pressing the key.

第3図は第X図で示したキャラクタ認識装置の処理内容
を概念的に示す説明図である。
FIG. 3 is an explanatory diagram conceptually showing the processing contents of the character recognition device shown in FIG.

図に示すように、スキャナー1は、例えばrThis 
is a pen、 Jというような英語の文章を読み
取るような場合には、スペースとスペースとの間に挟ま
れたキャラクタを1単語のブロックとして、あるいは、
スキャナー1が最初に読み取ったキャラクタから次のス
ペースまでのキャラクタを1単語のブロックとして、単
語単位で文章を読み取るようになっている。
As shown in the figure, the scanner 1 includes, for example, rThis
When reading English sentences such as "is a pen" or "J", the characters between the spaces can be interpreted as one word block, or
The characters from the first character read by the scanner 1 to the next space are treated as one word block, and the text is read word by word.

この単語人力スキャナーlで第1回目のイメージ情報の
読み取り操作を行うことにより、認識装置2はrThi
sJという単語を認識してコード化し、コード格納用R
AM2dへ格納する。
By performing the first image information reading operation with this word scanner l, the recognition device 2
Recognize and code the word sJ and use R for code storage.
Store in AM2d.

次に、単語入力スキャナー■の第2回目の走査で、認識
装置2は、risJという単語を認識してコード化し、
コード、格納用RAM2dへ格納する。
Next, in the second scan of the word input scanner ■, the recognition device 2 recognizes and encodes the word risJ,
The code is stored in the storage RAM 2d.

同様に、raJ、r pen、 Jという単語について
も認識してコード化し、コード格納用RAM2 dへ格
納する。なお、このとき、単語入力スキャナー1にブザ
ーを設けておき、1単語の認識毎にこのブザーを鳴らす
ようにする、また、単語の認識に失敗したような場合に
はブザーを連続して鳴らすようにする、等を考慮すれば
便利である。
Similarly, the words raJ, r pen, and J are also recognized and encoded, and stored in the code storage RAM 2d. At this time, a buzzer is provided on the word input scanner 1, and the buzzer is set to sound each time a word is recognized, and if a word recognition fails, the buzzer is set to sound continuously. It is convenient if you consider things such as

そして、このように一連の文章が全てキャラクタコード
に変換された時点で、電子手帳3へrThis is 
a pen、jという一連の文章がキャラクタコードに
よりデータ転送される。
Then, at the point when all the series of sentences have been converted into character codes in this way, rThis is
A series of sentences such as a pen, j are data transferred using character codes.

次に、このような構成における処理動作の内容を、第4
図に示すフローチャートに従い説明する。
Next, the contents of the processing operation in such a configuration will be explained in the fourth section.
This will be explained according to the flowchart shown in the figure.

まず、単語入力スキャナー1によって、例えば、前述の
例でいえば、rThis is a pen、Jのよう
に紙面情報が入力されると(ステップ41)、認識した
い単語のブロックを、rThisJのように抽出しくス
テップ42)、その単語ブロックを、rT、h、i、s
jとしてlキャラクタ(文字)毎に区分しくステップ4
3)、パターンマツチングによって各文字を認識する(
ステップ44)。
First, when the word input scanner 1 inputs page information such as rThis is a pen, J in the above-mentioned example (step 41), a block of words to be recognized is extracted as rThis J. Step 42), convert the word block to rT, h, i, s
Step 4 for each l character as j
3) Recognize each character by pattern matching (
Step 44).

そして、「T」→“54”、「h」→“68”のように
各文字をコード化しくステップ45)、それによって単
語ブロック全体を、rThisJ−“56.6g、69
.73”のようにコード化して(ステップ46)、コー
ド格納用RAM2dにそのコードを格納する(ステップ
47)。
Then code each character as "T" → "54", "h" → "68" (step 45), thereby converting the entire word block into rThisJ-"56.6g, 69
.. 73'' (step 46), and stores the code in the code storage RAM 2d (step 47).

そして、このステップ41〜47を各単語毎に操り返す
Then, steps 41 to 47 are repeated for each word.

このようにして、印字されたキャラクタを単語単位でイ
メージ情報として読み取り、その読み取ったキャラクタ
を一単語ずつコード化して記憶しておくようにすること
により、スキャナーの小型化と、イメージ情報を格納す
るRAMの低容量化を図ることができ、る。
In this way, the printed characters are read word by word as image information, and the read characters are coded and stored word by word, thereby making the scanner more compact and storing the image information. It is possible to reduce the capacity of RAM.

(ト)発明の効果 この発明によれば、印字されたキャラクタをスキャナー
によって一単語ずつイメージ情報として読み取って、イ
メージ情報記憶手段に記憶し、そのイメージ情報を認識
してコード化するようにしたので、スキャナーの小型化
を図ることが可能になると共に、イメージ情報記憶手段
の記憶容量が少なくてすみ、これによりキャラクタ認識
装置全体の簡易化を図ることができる。
(G) Effects of the Invention According to this invention, printed characters are read word by word as image information by a scanner, stored in the image information storage means, and the image information is recognized and encoded. , it becomes possible to reduce the size of the scanner, and the storage capacity of the image information storage means can be reduced, thereby making it possible to simplify the entire character recognition device.

【図面の簡単な説明】[Brief explanation of drawings]

第1図はこの発明の構成を示すブロック図、第2図はこ
の発明の一実施例の構成を示すブロック図、第3図は第
1図で示したキャラクタ認識装置の処理内容を概念的に
示す説明図、第4図は実施例の動作を示すフローチャー
ト、第5図は従来のキャラクタ認識装置の構成を示すブ
ロック図である。 ■・・・・・・単語人力スキャナー 2・・・・・・認識装置、2a・・・・・・CPU、2
b・・・・・・イメージ情報格納用RAM。 2c・・・・・・単語認識用プログラムROM。 2d・・・・・・コード格納用RAM、3・・・・・・
電子手帳。 第 図 06 ノ 第 4 図 第 図
FIG. 1 is a block diagram showing the configuration of this invention, FIG. 2 is a block diagram showing the configuration of an embodiment of this invention, and FIG. 3 conceptually shows the processing contents of the character recognition device shown in FIG. 1. FIG. 4 is a flowchart showing the operation of the embodiment, and FIG. 5 is a block diagram showing the configuration of a conventional character recognition device. ■...Word scanner 2...Recognition device, 2a...CPU, 2
b...RAM for storing image information. 2c...Program ROM for word recognition. 2d...RAM for code storage, 3...
Electronic notebook. Figure 06-4 Figure 4

Claims (1)

【特許請求の範囲】[Claims] 1、印字されたキャラクタを1単語ずつイメージ情報と
して読み取るスキャナーと、スキャナーで読み取られた
イメージ情報を記憶するイメージ情報記憶手段と、キャ
ラクタの標準フォントのパターンとそれに対応するキャ
ラクタコードとを記憶した認識情報記憶手段と、イメー
ジ情報記憶手段に記憶されたキャラクタのパターンと認
識情報記憶手段に記憶されたキャラクタの標準フォント
のパターンとをマッチングさせることによりイメージ情
報記憶手段に記憶された各キャラクタに対応するキャラ
クタコードを選択する選択手段と、選択手段により選択
されたキャラクタコードを単語毎に記憶する単語コード
記憶手段と、単語コード記憶手段からキャラクタコード
を読出して出力する出力手段を備えてなるキャラクタ認
識装置。
1. A scanner that reads printed characters word by word as image information, an image information storage means that stores the image information read by the scanner, and a recognition device that stores standard font patterns of characters and their corresponding character codes. The information storage means corresponds to each character stored in the image information storage means by matching the character pattern stored in the image information storage means with the standard font pattern of the character stored in the recognition information storage means. A character recognition device comprising a selection means for selecting a character code, a word code storage means for storing the character code selected by the selection means for each word, and an output means for reading and outputting the character code from the word code storage means. .
JP1336855A 1989-12-25 1989-12-25 Character recognizing device Pending JPH03196284A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1336855A JPH03196284A (en) 1989-12-25 1989-12-25 Character recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1336855A JPH03196284A (en) 1989-12-25 1989-12-25 Character recognizing device

Publications (1)

Publication Number Publication Date
JPH03196284A true JPH03196284A (en) 1991-08-27

Family

ID=18303282

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1336855A Pending JPH03196284A (en) 1989-12-25 1989-12-25 Character recognizing device

Country Status (1)

Country Link
JP (1) JPH03196284A (en)

Similar Documents

Publication Publication Date Title
JP3139521B2 (en) Automatic language determination device
JPH0236030B2 (en)
JPH03196284A (en) Character recognizing device
JPH0388062A (en) Device for preparing document
US5224041A (en) Electronic dictionary for outputting words in the opposite order in which they are searched
JP3025382B2 (en) Document processing device
JPS62251884A (en) Recorder
JPH0575143B2 (en)
JPS6154559A (en) Japanese word processor
JPH0365588B2 (en)
JPH08147329A (en) Reading image processor
JPH01137383A (en) Character recognizing device
JP2784004B2 (en) Character recognition device
KR940009451B1 (en) Korean character code exchange method
JPS6017574A (en) Document information input system
JPS62289886A (en) Conversion system for character generator
JPH05127655A (en) Character pattern generation device
JPS5882763A (en) Print controller
JPH0689275A (en) Document preparing device
JPH06149427A (en) Data processing system
JPS63282787A (en) Document editing apparatus
JPS5878276A (en) Optical character reader
JPS59158477A (en) Optical character reader
JPS6349232B2 (en)
JPH0113579B2 (en)