JPH0528302A - Character reader - Google Patents

Character reader

Info

Publication number
JPH0528302A
JPH0528302A JP3178625A JP17862591A JPH0528302A JP H0528302 A JPH0528302 A JP H0528302A JP 3178625 A JP3178625 A JP 3178625A JP 17862591 A JP17862591 A JP 17862591A JP H0528302 A JPH0528302 A JP H0528302A
Authority
JP
Japan
Prior art keywords
character
dictionary
characters
reading
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3178625A
Other languages
Japanese (ja)
Inventor
Toshifumi Yamauchi
俊史 山内
Mitsuo Tanaka
満雄 田中
Kunikazu Shigeta
邦和 重田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3178625A priority Critical patent/JPH0528302A/en
Publication of JPH0528302A publication Critical patent/JPH0528302A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To read slip characters with a various kinds of printers having different fonts. CONSTITUTION:A scanning part 10 reads the characters of a slip printed in a prescribed font and stores the image data in an image memory 11. The data stored in the image memory 11 are cut out for each character by a character cut-out part 12, supplied to a decision part 13 and checked with a character dictionary of a dictionary memory part 14. The decision part 13 outputs the data which could be identified with a prescribed evaluation measure as read data. The identification is decided based on whether or not the reading of the characters printed on a learning field column provided on the slip ensures a prescribed identification precision and when the characters were not readable, a new character dictionary is prepared by utilizing the characters which were not readable and their image pattern in a dictionary preparation part 15 and added to the dictionary memory part 14.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は文字読取装置に関し、特
に読取対象外のフォントによる文字を読み取ることを可
能とした文字読取装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character reading device, and more particularly to a character reading device capable of reading a character in a font which is not a reading target.

【0002】[0002]

【従来の技術】活字文字を読み取る方法の一例として、
入力文字とあらかじめ登録した文字辞書とのマッチング
処理を行ない、一致度の最も良いものを抽出して識別す
る方法がある。
2. Description of the Related Art As an example of a method for reading print characters,
There is a method of performing matching processing between an input character and a character dictionary registered in advance and extracting and identifying the one having the best degree of matching.

【0003】しかしながら、読取対象外のフォントの文
字を読み取る場合には、そのフォントに対応した辞書を
あらかじめ作成し、装置に登録しておく必要があった。
However, when reading characters in a font that is not the object of reading, it is necessary to create a dictionary corresponding to the font in advance and register it in the device.

【0004】[0004]

【発明が解決しようとする課題】近年、パーソナルコン
ピュータの普及により、それらに接続されてハードコピ
ーを出力するプリンタも多種開発されている。
With the widespread use of personal computers in recent years, various types of printers connected to them and outputting a hard copy have been developed.

【0005】また、プリンタの多種開発に伴なって、プ
リンタの印字方式も、ドット等のインパクトプリンタ
や、レーザープリンタのようなノンインパクトプリンタ
が多種開発され、それらのプリンタに使用される文字の
フォントも多種多様に出回ってきている。
With the development of various printers, various types of printers have been developed, such as impact printers for dots and non-impact printers such as laser printers, and fonts for characters used in these printers. Is also in wide variety.

【0006】従来の文字読取装置では、読み取るべきフ
ォントはあらかじめ決まっており、従って他のフォント
を読み取る場合には、そのための辞書を作成し登録する
必要があり、多種のプリンタの文字を読み取ることが困
難であるという欠点があった。
In the conventional character reading device, the font to be read is determined in advance. Therefore, when reading another font, it is necessary to create and register a dictionary for that, and it is possible to read characters of various printers. It had the drawback of being difficult.

【0007】本発明の目的は上述した欠点を除去し、多
種のプリンタによる印字文字を読み取ることができる文
字読取装置を提供することにある。
An object of the present invention is to eliminate the above-mentioned drawbacks and to provide a character reading device capable of reading printed characters by various printers.

【0008】[0008]

【課題を解決するための手段】本発明の文字読取装置
は、読み取るべきデータを印字するデータフィールドの
印字文字と同一フォントかつあらかじめ設定した文字順
で所定の文字を印字する学習フィールドを帳票に備える
手段と、前記学習フィールドを備えた帳票を照合により
読み取るための第一の文字辞書を備えて前記帳票を読み
取るとともに、前記学習フィールドに対する読取り不可
能なすべての文字の文字パタンと、文字位置にもとづい
て得られる文字コードデータとを入力として前記読取り
不可能な文字を読取り可能とする第二の文字辞書を作成
して前記第一の文字辞書と合体させつつ前記帳票を読み
取る手段とを備えて構成される。
The character reading apparatus of the present invention includes a learning field for printing a predetermined character in the same font as a printing character of a data field for printing data to be read and in a preset character order. Means and a first character dictionary for reading the form with the learning field by collation, and reading the form, based on the character patterns of all unreadable characters for the learning field and the character position. And a means for reading the form while incorporating a second character dictionary into which the unreadable characters can be read by inputting the character code data obtained by To be done.

【0009】[0009]

【実施例】次に、本発明について図面を参照して説明す
る。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described below with reference to the drawings.

【0010】図1は、本発明の一実施例の構成を示すブ
ロック図である。
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention.

【0011】図1において、走査部10は、読取りの対
象とする帳票などを走査して、そのイメージパターンを
出力する。
In FIG. 1, a scanning unit 10 scans a form or the like to be read and outputs its image pattern.

【0012】イメージメモリ11は、走査部10の出力
するイメージパターンを順次ストアするメモリである。
The image memory 11 is a memory for sequentially storing the image patterns output from the scanning section 10.

【0013】文字切出し部12は、イメージメモリ11
からイメージパターンを帳票のフォーマット情報に基づ
いて1文字づつ切り出す。
The character cutout unit 12 includes an image memory 11
The image pattern is cut out character by character based on the format information of the form.

【0014】判定部13は、切り出された1文字単位の
文字を識別する。
The determination unit 13 identifies the cut-out character by character.

【0015】辞書メモリ部14は、切り出された文字と
のマッチング(照合)を行なう文字辞書(標準パター
ン)を記憶しておくものであるが、これらの辞書はあら
かじめ作成されて記憶している部分としての第一の文字
辞書と、辞書作成部15で新しく作成された第二の文字
辞書を記憶する部分とから構成されている。
The dictionary memory unit 14 stores a character dictionary (standard pattern) for matching with the cut out characters (standard pattern). These dictionaries are created and stored in advance. And a portion for storing the second character dictionary newly created by the dictionary creating unit 15.

【0016】辞書作成部15は、文字切出し部12によ
り出力された文字イメージから第二の文字辞書を作成す
る。
The dictionary creating unit 15 creates a second character dictionary from the character images output by the character cutting unit 12.

【0017】次に、本実施例の動作について説明する。Next, the operation of this embodiment will be described.

【0018】図2は、図1の実施例に利用する帳票の一
例を示す図である。
FIG. 2 is a diagram showing an example of a form used in the embodiment of FIG.

【0019】図2において、帳票識別コード(以下、I
Cコードと呼ぶ)20は、帳票のフォーマット、すなわ
ち、読み取る行数とそれらの位置,文字種等を指定する
ためのものである。
In FIG. 2, a form identification code (hereinafter, I
A C code) 20 is used to specify the format of a form, that is, the number of lines to be read, their positions, character types, and the like.

【0020】学習フィールド21は、帳票に使用されて
いる文字,例えば数字の0から9の文字を順番に印字す
るためのフィールドである。
The learning field 21 is a field for printing the characters used in the form, for example, the numbers 0 to 9 in order.

【0021】例えば、帳票に使用されているフォントが
新JIS−Bフォントの数字であれば、学習フィールド
21には、新JIS−Bの数字0から9までが順番に印
字される。
For example, if the font used in the form is the numbers of the new JIS-B font, the learning field 21 is printed with the numbers 0 to 9 of the new JIS-B in order.

【0022】図1において、走査部10は、図2に示す
IDコード20を読み取ることによって、学習フィール
ド21と複数のデータフィールド22の位置,文字種等
の帳票フォーマットを知る。
In FIG. 1, the scanning unit 10 knows the form format such as the positions of the learning field 21 and the plurality of data fields 22 and the character type by reading the ID code 20 shown in FIG.

【0023】次に、学習フィールド21の読取りに移
る。
Next, the reading of the learning field 21 is started.

【0024】例えば、図2に示すように、学習フィール
ド21には0から9までの数字が印字されている。
For example, as shown in FIG. 2, numbers 0 to 9 are printed in the learning field 21.

【0025】走査部10によって読み取られた文字は、
イメージメモリ11に記憶されたのち、文字切出し部1
2によって切り出されて判定部13に送出される。
The characters read by the scanning unit 10 are
After being stored in the image memory 11, the character cutout unit 1
It is cut out by 2 and sent to the determination unit 13.

【0026】判定部13は、切り出された文字と辞書メ
モリ14に格納した標準文字パターンとの照合を行な
う。
The determination unit 13 collates the cut out characters with the standard character pattern stored in the dictionary memory 14.

【0027】学習フィールド21に印字した文字は、文
字読取りに利用するとともに、読取り対象外の文字が入
力したときに、この読取り対象外の文字読取に必要な新
たな文字辞書作成用に利用する。このことは、学習フィ
ールドに印字しておく文字が、あらかじめ設定した文字
順で配列しているので、ある文字が読取り不可能な場
合、たとえば前述した例で“2”の存在する位置情報か
ら“2”を特定する文字コードがわかり、これと読み取
れなかった文字パターンとを教師信号として新たな文字
辞書を作成することによって可能となる。
The characters printed in the learning field 21 are used for character reading, and when a character not to be read is input, it is used to create a new character dictionary necessary for reading the character not to be read. This means that the characters to be printed in the learning field are arranged in a preset character order, so if a certain character is unreadable, for example, from the position information where "2" exists in the above example, " This is possible by knowing the character code specifying 2 "and creating a new character dictionary using this and the character pattern that could not be read as a teacher signal.

【0028】帳票の読取りを開始する時、まず帳票の学
習フィールド21に印字されている文字を識別する。
When reading the form, the characters printed in the learning field 21 of the form are first identified.

【0029】この時、確度の高い正解が得られれば、そ
の文字の辞書はすでに登録されていると判断し、以降の
データフィールド22の読取りを実行する。
At this time, if a highly accurate correct answer is obtained, it is determined that the dictionary of the character is already registered, and the subsequent reading of the data field 22 is executed.

【0030】一方、読取り不能や誤読が発生したり、識
別されたとしても確度の低い結果であれば、その文字は
登録されていないと判断する。登録されていないと判断
した時は、学習フィールド21の印字されている文字パ
ターンから自動的に辞書を作成し、登録した後、以降の
データフィールド22の読取りを実行するように動作す
る。
On the other hand, if unreadable or erroneous reading occurs, or if the result is low in accuracy even if it is identified, it is determined that the character is not registered. If it is determined that the dictionary is not registered, the dictionary is automatically created from the printed character pattern of the learning field 21, and after the registration, the subsequent reading of the data field 22 is executed.

【0031】学習フィールド21に印字された文字は、
決められた文字の順序で印字されているので正解が容易
にわかり、識別結果が所定の判定しきい値を超えて確度
の高いものであれば、ただちに以後のデータフィールド
22の読取りに移る。
The characters printed in the learning field 21 are
Since the characters are printed in the determined character order, the correct answer can be easily understood, and if the identification result exceeds the predetermined judgment threshold value and is highly accurate, the subsequent reading of the data field 22 is immediately started.

【0032】しかし、これらの文字の内識別できなかっ
たり、誤読したり、あるいは正読しても確度が低い文字
がある場合には、辞書メモリ部14にその文字辞書が登
録されていないと判断する。
However, if one of these characters cannot be identified, is misread, or has a low accuracy even if correctly read, it is determined that the character dictionary is not registered in the dictionary memory unit 14. To do.

【0033】この時、確度が高い正解以外の文字に対し
ては、それらの文字イメージを辞書作成部15に送り、
それらの文字辞書を作成し、辞書メモリ部14に登録、
以後のデータフィールド部22の識別に移るように動作
する。
At this time, for characters other than the correct answer with high accuracy, those character images are sent to the dictionary creating section 15,
Create those character dictionaries and register them in the dictionary memory unit 14,
It operates so as to proceed to the identification of the data field portion 22 thereafter.

【0034】尚、辞書作成のアルゴリズムは多種多様の
ものが発表されているが、本発明とは直接関係がないの
で説明は省略する。
A variety of algorithms for creating a dictionary have been published, but since they are not directly related to the present invention, their explanations are omitted.

【0035】辞書メモリ部14には、通常使用頻度の高
いフォントの辞書を常時登録させておく部分と、辞書作
成部15によって新たに作成される辞書を登録する部分
に分けてある。
The dictionary memory section 14 is divided into a section for constantly registering a dictionary of a font that is frequently used and a section for registering a dictionary newly created by the dictionary creating section 15.

【0036】辞書メモリ部14の新しく作成される辞書
のエリアが一杯になった場合は、使用頻度の低い辞書と
置きかえる機能を有する。また、その帳票に使用されて
いる文字が辞書メモリ部14に常時登録させているフォ
ントであることがあらかじめ判明している場合は、学習
フィールドは印字なし(ブランク)にしておくことによ
って、すなわちブランクを検知することによって、辞書
作成の処理を省略するように制御することが可能であ
る。
When the area of the newly created dictionary in the dictionary memory unit 14 becomes full, it has a function of replacing the dictionary with a low frequency of use. If it is known in advance that the characters used in the form are fonts that are constantly registered in the dictionary memory unit 14, the learning field is left blank (blank), that is, blank. It is possible to control so as to omit the dictionary creation processing by detecting the.

【0037】さらに、図3に示すように、プリンタの印
字にクセ,たとえば図3では、数字0の下部が欠けてい
る場合がある場合にも、ダミーフィールドに印字してお
くことによってこれらの文字の辞書も自動的に作成され
るので読取りが可能となる。
Further, as shown in FIG. 3, even if there is a case that the lower part of the numeral 0 in FIG. The dictionary is automatically created and can be read.

【0038】[0038]

【発明の効果】以上説明したように本発明によれば、従
来の文字読取装置ではあらかじめ決められたフォントの
文字しか読取ることができなかったが、読取対象外のフ
ォントの文字でもそれに対応する辞書を自動作成するこ
とができ、任意のフォントの読取りを可能にする効果が
ある。
As described above, according to the present invention, the conventional character reading device can read only the characters of the predetermined font, but the dictionary corresponding to the characters of the font not to be read can be read. Can be created automatically, and it has the effect of enabling the reading of arbitrary fonts.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の構成を示すブロック図であ
る。
FIG. 1 is a block diagram showing a configuration of an exemplary embodiment of the present invention.

【図2】図1の実施例における読取り帳票の一例を示す
図である。
FIG. 2 is a diagram showing an example of a read form in the embodiment of FIG.

【図3】プリンタの印字文字のクセの一例を示す図であ
る。
FIG. 3 is a diagram showing an example of a habit of print characters of a printer.

【符号の説明】[Explanation of symbols]

10 走査部 11 イメージメモリ 12 文字切出し部 13 判定部 14 辞書メモリ部 15 辞書作成部 20 帳票識別コード 21 学習フィールド 22 データフィールド 10 Scanning Section 11 Image Memory 12 Character Extraction Section 13 Judgment Section 14 Dictionary Memory Section 15 Dictionary Creation Section 20 Form Identification Code 21 Learning Field 22 Data Field

Claims (1)

【特許請求の範囲】 【請求項1】 読み取るべきデータを印字するデータフ
ィールドの印字文字と同一フォントかつあらかじめ設定
した文字順で所定の文字を印字する学習フィールドを帳
票に備える手段と、前記学習フィールドを備えた帳票を
照合により読み取るための第一の文字辞書を備えて前記
帳票を読み取るとともに、前記学習フィールドに対する
読取り不可能なすべての文字の文字パタンと、文字位置
にもとづいて得られる文字コードデータとを入力として
前記読取り不可能な文字を読取り可能とする第二の文字
辞書を作成して前記第一の文字辞書と合体させつつ前記
帳票を読み取る手段とを備えて成ることを特徴とする文
字読取装置。
Claims: 1. A means for providing a form with a learning field for printing predetermined characters in the same font as a printing character of a data field for printing data to be read and in a preset character order, and the learning field. While reading the form with a first character dictionary for reading the form by collation, the character patterns of all unreadable characters for the learning field, and the character code data obtained based on the character position. Characters comprising means for reading the form while creating a second character dictionary that makes it possible to read the unreadable characters by inputting and, and incorporating the second character dictionary with the first character dictionary. Reader.
JP3178625A 1991-07-19 1991-07-19 Character reader Pending JPH0528302A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3178625A JPH0528302A (en) 1991-07-19 1991-07-19 Character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3178625A JPH0528302A (en) 1991-07-19 1991-07-19 Character reader

Publications (1)

Publication Number Publication Date
JPH0528302A true JPH0528302A (en) 1993-02-05

Family

ID=16051727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3178625A Pending JPH0528302A (en) 1991-07-19 1991-07-19 Character reader

Country Status (1)

Country Link
JP (1) JPH0528302A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008210388A (en) * 2007-02-26 2008-09-11 Fujitsu Ltd Method, device, and program for identifying code
JP2009231871A (en) * 2008-03-19 2009-10-08 Fuji Xerox Co Ltd Image processor and image processing program
US8419630B2 (en) 2009-11-06 2013-04-16 Olympus Medical Systems Corp. Endoscope system with front and lateral fields of view

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008210388A (en) * 2007-02-26 2008-09-11 Fujitsu Ltd Method, device, and program for identifying code
JP2009231871A (en) * 2008-03-19 2009-10-08 Fuji Xerox Co Ltd Image processor and image processing program
US8419630B2 (en) 2009-11-06 2013-04-16 Olympus Medical Systems Corp. Endoscope system with front and lateral fields of view

Similar Documents

Publication Publication Date Title
US4610025A (en) Cryptographic analysis system
US6460766B1 (en) Graphic symbols and method and system for identification of same
EP0011388B1 (en) System and method for processing documents
JPH04195692A (en) Document reader
JP4280355B2 (en) Character recognition device
KR100351171B1 (en) Method and apparatus for determining form sheet type
JPH0528302A (en) Character reader
JPH1125209A (en) Information input device, its method, recording medium, and two-dimensional bar code printer
JP4807618B2 (en) Image processing apparatus and image processing program
JP5041775B2 (en) Character cutting method and character recognition device
JP2006079571A (en) Printer print verification inspection device
JP2001052110A (en) Document processing method, recording medium recording document processing program and document processor
JP3159087B2 (en) Document collation device and method
JP2570571B2 (en) Optical character reader
EP0692768A2 (en) Full text storage and retrieval in image at OCR and code speed
JPH0991385A (en) Character recognition dictionary adding method and terminal ocr device using same
JP2924356B2 (en) Optical character reader
JPH10162103A (en) Character recognition device
JP2005301477A (en) Address recognition system and method
JPS62295192A (en) Optical character image reader
JPH05266244A (en) Character reader
JP2904517B2 (en) Character recognition device
JP2851102B2 (en) Character extraction method
JPH08221507A (en) Method and device for recognizing document
JPH0578873B2 (en)