JPH10187885A - Character recognizer and storage medium storing character recognition processing - Google Patents

Character recognizer and storage medium storing character recognition processing

Info

Publication number
JPH10187885A
JPH10187885A JP8356730A JP35673096A JPH10187885A JP H10187885 A JPH10187885 A JP H10187885A JP 8356730 A JP8356730 A JP 8356730A JP 35673096 A JP35673096 A JP 35673096A JP H10187885 A JPH10187885 A JP H10187885A
Authority
JP
Japan
Prior art keywords
character
symbol
character recognition
digit
postal code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8356730A
Other languages
Japanese (ja)
Other versions
JP3725953B2 (en
Inventor
Toshio Miyazawa
利夫 宮澤
Toshihiro Suzuki
俊博 鈴木
Hideaki Yamagata
秀明 山形
Shinobu Yamamoto
忍 山本
Yukihisa Uchiyama
幸央 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP35673096A priority Critical patent/JP3725953B2/en
Publication of JPH10187885A publication Critical patent/JPH10187885A/en
Application granted granted Critical
Publication of JP3725953B2 publication Critical patent/JP3725953B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve the recognition accuracy of the characters following the symbols concerning a zip code and a telephone number by recognizing the characters in response to the types of decided symbols in regard to a prescribed character area following the character area including the same symbols as those included in the symbol information showing the postal code and the telephone number. SOLUTION: A symbol type decision part 103 has the symbol information including the symbols showing that the prescribed character strings following the next stage are equal to a zip code and a telephone number and inputs the image data which are segmented to a character area of a single character unit. Then the part 103 compares the characters included in the segmented character area with the symbols included in the symbol information to detect the character information including the same symbols as those included in the symbol information and decides the types of symbols included in the character area. When a character area including the same symbols as those included in the symbol information is detected, a character recognition processing part 105 recognizes the characters in response to the types of symbols decided at the part 103 in regard to a prescribed character area following the detected character area.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字認識装置およ
びその文字認識処理を記憶した記憶媒体に関し、より詳
細には、文書中に記載された郵便番号記号等の記号を検
知し、検知した記号の種類に応じた文字認識処理をその
記号の後段の文字に対して実行することにより、文字認
識精度の向上を図った文字認識装置およびその文字認識
処理を記憶した記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device and a storage medium storing the character recognition processing, and more particularly, to detecting a symbol such as a postal code symbol described in a document and detecting the detected symbol. The present invention relates to a character recognition device that improves the character recognition accuracy by performing a character recognition process according to the type of a symbol on a character subsequent to the symbol, and a storage medium that stores the character recognition process.

【0002】[0002]

【従来の技術】光学的文字認識装置において、文字認識
速度の向上のため、文書中に含まれる郵便番号および電
話番号に関する記号を利用するものとして、特開平5−
81464号公報『光学文字読取装置』がある。
2. Description of the Related Art In an optical character recognition apparatus, Japanese Patent Laid-Open Publication No.
There is Japanese Patent Publication No. 81464 entitled "Optical Character Reader".

【0003】この光学文字読取装置は、名刺に印刷され
た文字を光学的に読み取るための光学文字読取装置にお
いて、通常の名刺には必ず印刷されている郵便番号およ
び電話番号に関する記号もしくは文字を含むものであっ
て、文字の上下左右の4方向の向きを判定するための認
識辞書を有し、文字単位に切り出した文字と認識辞書中
の記号もしくは文字とを照合することにより、名刺の印
刷方向を判定して印刷文字を読み取るというものであ
る。この光学文字読取装置によれば、名刺の印刷文字を
光学的に読み取る場合において、特に印刷方向の判定処
理および文字読取処理の迅速化を図ることができるとさ
れる。
This optical character reading device is an optical character reading device for optically reading characters printed on a business card, and a normal business card always includes symbols or characters relating to a postal code and a telephone number which are always printed. A recognition dictionary for determining the orientation of the character in four directions, up, down, left and right, and collating a character cut out in character units with a symbol or a character in the recognition dictionary to print the business card printing direction. And print characters are read. According to this optical character reading device, when reading printed characters of a business card optically, it is possible to particularly speed up the printing direction determination process and the character reading process.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、上記特
開平5−81464号公報『光学文字読取装置』におい
ては、郵便番号および電話番号に関する記号等を名刺の
印刷方向の判定にのみ用いるものであり、せっかく郵便
番号および電話番号に関する記号等であることを認識す
る処理を行うにも拘わらず、この記号が持つ情報を十分
に活かしきれていないという問題があった。
However, in the above-mentioned Japanese Patent Application Laid-Open No. Hei 5-81464, "optical character reading device", symbols related to postal codes and telephone numbers are used only for determining the printing direction of business cards. In spite of performing a process of recognizing that it is a symbol related to a postal code and a telephone number, there is a problem that the information of the symbol is not fully utilized.

【0005】本発明は上記に鑑みてなされたものであっ
て、郵便番号および電話番号に関する記号が持つ情報を
最大限活用することにより、それらの記号に続く文字列
の文字認識精度の向上を図ることを目的とする。
The present invention has been made in view of the above, and aims to improve the character recognition accuracy of a character string following a symbol by utilizing the information of the symbols related to the postal code and the telephone number to the utmost. The purpose is to:

【0006】[0006]

【課題を解決するための手段】上記目的を達成するた
め、請求項1の文字認識装置は、郵便物,名刺,帳票等
の文書の画像を光学的に読み取ることによって得た画像
データを入力し、前記入力した画像データから1文字単
位の文字領域を切り出して、文字認識処理を実行する文
字認識装置において、後段に続く所定の文字列が郵便番
号および電話番号であることを示すための記号を少なく
とも含む記号情報を有し、前記1文字単位の文字領域に
切り出された画像データを入力して、前記文字領域に含
まれた文字と前記記号情報に含まれた記号とを比較する
ことにより、前記記号情報に含まれた記号と同一の記号
を含む文字領域を検知して、当該文字領域に含まれた記
号の種類を判定する記号種類判定手段と、前記記号種類
判定手段が前記記号情報に含まれた記号と同一の記号を
含む文字領域を検知した場合に、当該文字領域に続く所
定の文字領域について、前記記号種類判定手段で判定さ
れた記号の種類に応じた文字認識処理を実行する文字認
識処理手段と、を備えるものである。
According to a first aspect of the present invention, there is provided a character recognition apparatus for inputting image data obtained by optically reading an image of a document such as a mail, a business card, a form, and the like. In a character recognition apparatus that cuts out a character area in units of one character from the input image data and performs a character recognition process, a symbol for indicating that a predetermined character string following the post-stage is a postal code and a telephone number is used. By having at least the symbol information included and inputting the image data cut out in the character area in units of one character, by comparing the characters included in the character area with the symbols included in the symbol information, A symbol type determining unit that detects a character area including the same symbol as the symbol included in the symbol information and determines the type of the symbol included in the character area; and When a character area including the same symbol as the symbol included in the report is detected, a character recognition process according to the type of the symbol determined by the symbol type determination unit is performed on a predetermined character area following the character area. And a character recognition processing unit to be executed.

【0007】また、請求項2の文字認識装置は、請求項
1記載の文字認識装置において、前記文字認識処理手段
が、予め用意された複数の文字認識用辞書から前記記号
種類判定手段で判定された記号の種類に対応した文字認
識用辞書を選択し、前記選択した文字認識用辞書を用い
て、前記所定の文字領域についての文字認識処理を実行
するものである。
According to a second aspect of the present invention, in the character recognition apparatus according to the first aspect, the character recognition processing unit is determined by the symbol type determination unit from a plurality of character recognition dictionaries prepared in advance. The character recognition dictionary corresponding to the type of the selected symbol is selected, and the character recognition process is executed for the predetermined character region using the selected character recognition dictionary.

【0008】また、請求項3の文字認識装置は、請求項
1または2記載の文字認識装置において、前記文字認識
処理手段が、前記記号種類判定手段で前記記号の種類が
3桁または5桁の郵便番号を示す記号であると判定され
た場合に、前記所定の文字領域について3桁または5桁
の郵便番号用の文字認識処理を実行し、前記記号種類判
定手段で前記記号の種類が7桁の郵便番号を示す記号で
あると判定された場合に、前記所定の文字領域について
7桁の郵便番号用の文字認識処理を実行するものであ
る。
According to a third aspect of the present invention, in the character recognition apparatus according to the first or second aspect, the character recognition processing means includes a symbol type judging means in which the type of the symbol is three digits or five digits. If it is determined that the symbol is a postal code, a character recognition process for a three-digit or five-digit postal code is executed for the predetermined character area, and the symbol type determination unit determines that the symbol type is seven digits. If it is determined that the symbol indicates a postal code, a character recognition process for a 7-digit postal code is executed for the predetermined character area.

【0009】また、請求項4の文字認識装置は、請求項
3記載の文字認識装置において、前記文字認識処理手段
が、前記3桁または5桁の郵便番号用の文字認識処理を
行う際に、前記3桁または5桁の郵便番号を示す記号に
続く文字認識処理後の文字が数字であるか否かを判定し
て前記文字領域の切り出しに誤りがないか否かを判定す
ると共に、前記3桁または5桁の郵便番号を示す記号に
続く文字認識処理後の文字列が前記3桁または5桁の郵
便番号であるか否かを判定して前記記号の種類の判定に
誤りがないか否かを判定し、前記7桁の郵便番号用の文
字認識処理を行う際に、前記7桁の郵便番号を示す記号
に続く文字認識処理後の文字が数字であるか否かを判定
して前記文字領域の切り出しに誤りがないか否かを判定
すると共に、前記7桁の郵便番号を示す記号に続く文字
認識処理後の文字列が前記7桁の郵便番号であるか否か
を判定して前記記号の種類の判定に誤りがないか否かを
判定するものである。
According to a fourth aspect of the present invention, in the character recognition apparatus according to the third aspect, when the character recognition processing means performs the character recognition processing for the 3-digit or 5-digit postal code, It is determined whether or not the character after the character recognition processing following the symbol indicating the 3-digit or 5-digit postal code is a numeral to determine whether or not there is an error in extracting the character area. It is determined whether or not the character string after the character recognition processing following the symbol indicating the digit or the 5-digit postal code is the 3-digit or 5-digit postal code, and whether the type of the symbol is correctly determined. When performing the character recognition process for the seven-digit postal code, it is determined whether the character after the character recognition process following the symbol indicating the seven-digit postal code is a number, In addition to determining whether there is no error in extracting the character area, It is determined whether or not the character string after the character recognition processing following the symbol indicating the digit postal code is the seven-digit postal code and whether there is no error in the type of the symbol. is there.

【0010】また、請求項5の文字認識装置は、請求項
1〜4記載の文字認識装置において、前記記号種類判定
手段が3桁または5桁の郵便番号を示す記号を含む文字
領域を検知した場合に、さらに、前記文字認識処理手段
で文字認識処理された後の住所を示す文字に基づいて、
7桁の郵便番号データを生成し、前記生成した7桁の郵
便番号データに対応したバーコードを生成して出力する
バーコード生成手段を備えるものである。
According to a fifth aspect of the present invention, in the character recognition apparatus of the first to fourth aspects, the symbol type determining means detects a character area including a symbol indicating a 3-digit or 5-digit postal code. In the case, further, based on the character indicating the address after the character recognition processing by the character recognition processing means,
It is provided with bar code generation means for generating seven-digit postal code data, and generating and outputting a bar code corresponding to the generated seven-digit postal code data.

【0011】さらに、請求項6記載の文字認識処理を記
憶した記憶媒体は、前記請求項1ないし5に記載の文字
認識処理をコンピュータ上で実行させるプログラムが記
憶され、前記コンピュータが読み取り可能なものであ
る。
Furthermore, a storage medium storing the character recognition processing according to claim 6 stores a program for executing the character recognition processing according to claim 1 on a computer, and is readable by the computer. It is.

【0012】[0012]

【発明の実施の形態】以下、本発明の文字認識装置およ
びその文字認識処理を記憶した記憶媒体の一実施の形態
について、図面を参照しつつ詳細に説明する。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing an embodiment of a character recognition apparatus according to the present invention and a storage medium storing the character recognition processing.

【0013】図1は、本実施の形態の文字認識装置のブ
ロック構成図である。図1に示す文字認識装置は、郵便
物,名刺,帳票等の文書の画像を光学的に読み取り、読
み取りによって得た画像データを入力する画像データ入
力部101と、画像データ入力部101で入力した画像
データから1文字単位の文字領域を切り出す切出処理を
実行する文字切出部102と、後段に続く所定の文字列
が郵便番号および電話番号であることを示すための記号
を少なくとも含む記号情報を有し、文字切出部102で
1文字単位の文字領域に切り出された画像データを入力
して、文字領域に含まれた文字と記号情報に含まれた記
号とを比較することにより、記号情報に含まれた記号と
同一の記号を含む文字領域を検知して、当該文字領域に
含まれた記号の種類を判定する記号種類判定部103
(請求項1記載の記号種類判定手段に該当する)と、記
号種類判定部103が記号情報に含まれた記号と同一の
記号を含む文字領域を検知した場合に、当該文字領域に
続く所定の文字領域について、記号種類判定部103で
判定された記号の種類に応じた文字認識処理を実行させ
る処理切替部104と、処理切替部104の指示に応じ
て各文字領域単位で文字認識処理を実行する文字認識処
理部105(請求項1記載の文字認識処理手段に該当す
る)と、処理切替部104の指示に応じて、文字認識処
理部105で文字認識された後の住所を示す文字データ
列に基づいて、7桁の郵便番号データを生成し、生成し
た7桁の郵便番号データに対応したバーコードを生成し
て出力するバーコード生成処理部106(請求項5記載
のバーコード生成手段に該当する)と、バーコード生成
処理部106で生成されたバーコードの印刷処理を実行
するバーコード印刷部107(請求項5記載のバーコー
ド生成手段に該当する)と、文字認識処理部105で文
字認識された後の文字データ列およびバーコード生成処
理部106で生成されたバーコードを格納するメモリ1
08と、装置の動作モードの指定,動作状態の表示等を
行うための操作部109と、上記各部を制御する主制御
部110と、を有している。
FIG. 1 is a block diagram of a character recognition apparatus according to the present embodiment. The character recognition device shown in FIG. 1 optically reads an image of a document such as a mail, a business card, a form, and the like, and inputs the image data obtained by the reading through an image data input unit 101 and an image data input unit 101. A character extracting unit 102 that performs an extracting process of extracting a character area in units of one character from image data, and symbol information including at least symbols for indicating that a predetermined character string that follows is a postal code and a telephone number By inputting the image data cut out in the character area in units of one character by the character extracting unit 102 and comparing the characters included in the character area with the symbols included in the symbol information, A symbol type determination unit 103 that detects a character region including the same symbol as the symbol included in the information and determines the type of the symbol included in the character region
(Corresponding to the symbol type determining means in claim 1), and when the symbol type determining unit 103 detects a character area including the same symbol as the symbol included in the symbol information, a predetermined area following the character area is detected. A process switching unit 104 for executing a character recognition process according to the type of the symbol determined by the symbol type determination unit 103 for the character region, and executing the character recognition process for each character region in accordance with an instruction from the process switching unit 104 Character recognition processing unit 105 (corresponding to the character recognition processing unit according to claim 1), and a character data string indicating an address after character recognition by the character recognition processing unit 105 in accordance with an instruction from the processing switching unit 104 The bar code generation processing unit 106 generates the seven-digit postal code data based on the bar code generation unit, and generates and outputs a bar code corresponding to the generated seven-digit postal code data. A bar code printing unit 107 (corresponding to a bar code generation unit according to claim 5) for executing a printing process of the bar code generated by the bar code generation processing unit 106, and a character recognition processing unit. Memory 1 for storing a character data string after character recognition at 105 and a barcode generated by barcode generation processing unit 106
08, an operation unit 109 for specifying an operation mode of the apparatus, displaying an operation state, and the like, and a main control unit 110 for controlling the above-described units.

【0014】図2は、図1に示す文字認識装置における
文字認識処理部105のブロック構成図である。図2に
示す文字認識処理部105は、郵便番号が登録された辞
書,電話番号が登録された辞書等、複数の辞書A,辞書
B,辞書C,・・・を有し、処理切替部104の指示に
応じて、上記辞書の中からいずれかを選択し、各文字領
域単位で文字認識処理を実行する文字認識部201と、
処理切替部104の指示に応じて、文字認識部201の
文字認識結果が正しいか否かを判定する文字認識判定部
202と、を備えている。
FIG. 2 is a block diagram of the character recognition processing unit 105 in the character recognition apparatus shown in FIG. The character recognition processing unit 105 shown in FIG. 2 has a plurality of dictionaries A, B, C,... Such as a dictionary in which postal codes are registered and a dictionary in which telephone numbers are registered. A character recognition unit 201 that selects one of the dictionaries in accordance with the instruction, and executes a character recognition process for each character region;
A character recognition determination unit 202 that determines whether the character recognition result of the character recognition unit 201 is correct according to an instruction from the process switching unit 104.

【0015】なお、図1および図2に示す文字認識装置
は、文字認識専用装置ではなく、スキャナ等を有するコ
ンピュータを中心としたシステムでも実現することが可
能である。
The character recognition device shown in FIGS. 1 and 2 can be realized not only by a character recognition device but also by a system centered on a computer having a scanner or the like.

【0016】次に、名刺を読み取ることを例として、本
実施の形態の文字認識装置の動作を説明する。図3は、
本実施の形態の文字認識装置の動作を説明するために用
いる名刺の一例を示す図である。
Next, the operation of the character recognition device of the present embodiment will be described by taking an example of reading a business card. FIG.
It is a figure showing an example of a business card used for explaining operation of a character recognition device of this embodiment.

【0017】画像データ入力部101は、図3に示す名
刺301の画像を光学的に読み取り、読み取りによって
得た名刺301の画像データを文字切出部102に出力
する。
The image data input unit 101 optically reads the image of the business card 301 shown in FIG. 3, and outputs the image data of the business card 301 obtained by the reading to the character extracting unit 102.

【0018】文字切出部102は、画像データを入力
し、入力した画像データから1文字単位の文字領域を切
り出す文字切出処理を実行し、記号種類判定部103に
出力する。
The character extracting unit 102 receives image data, executes a character extracting process of extracting a character area in units of one character from the input image data, and outputs the character region to the symbol type determining unit 103.

【0019】記号種類判定部103は、文字切出部10
2で1文字単位の文字領域に切り出された画像データを
入力して、文字領域に含まれた文字と記号情報に含まれ
た記号とを比較することにより、記号情報に含まれた記
号と同一の記号を含む文字領域を検知して、当該文字領
域に含まれた記号の種類を判定し、判定結果を処理切替
部104に出力する。
The symbol type judging section 103 includes the character extracting section 10
By inputting the image data cut out in the character area in units of one character in step 2 and comparing the character included in the character area with the symbol included in the symbol information, the same as the symbol included in the symbol information is obtained. The character area including the symbol is detected, the type of the symbol included in the character area is determined, and the determination result is output to the process switching unit 104.

【0020】この記号種類判定部103が備える記号情
報には、後段に続く所定の文字列が郵便番号,電話番号
等であることを示すための記号が含まれている。この記
号は、3桁または5桁の郵便番号であることを示す記号
(図3中の302),7桁の郵便番号であることを示す
記号(図示せず)等のことである。ただし、ここでいう
記号には、電話番号やファックス番号であることを示
す”TEL”(図3中の303),”電話”,”FA
X”(図3中の304)等の文字列も含まれるものとす
る。
The symbol information included in the symbol type determination unit 103 includes a symbol indicating that the predetermined character string following the subsequent stage is a postal code, a telephone number, or the like. This symbol is a symbol indicating a 3-digit or 5-digit postal code (302 in FIG. 3), a symbol indicating a 7-digit postal code (not shown), or the like. However, the symbols referred to here are "TEL" (303 in FIG. 3), "telephone", and "FA" indicating a telephone number or a fax number.
It is assumed that a character string such as X "(304 in FIG. 3) is also included.

【0021】ここで、記号種類判定部103は、図3に
示す郵便番号記号302,電話番号記号303およびフ
ァックス番号記号304を検知し、記号の種類情報と位
置情報等を処理切替部104に出力する。
Here, the symbol type determination unit 103 detects the postal code symbol 302, the telephone number symbol 303, and the fax number symbol 304 shown in FIG. 3, and outputs the type information and the position information of the symbol to the processing switching unit 104. I do.

【0022】処理切替部104は、記号種類判定部10
3から記号の種類情報と位置情報等を入力し、記号の種
類に応じた文字認識処理を、検知した記号の後段の文字
領域に対して実行させる。
The processing switching unit 104 is a symbol type determining unit 10
The character information and the position information of the symbol are input from 3 and the character recognition process corresponding to the type of the symbol is executed for the character area subsequent to the detected symbol.

【0023】本実施の形態の文字認識装置は、記号の種
類に応じた文字認識処理として、複数の動作モードを備
えている。この動作モードは、操作部109からユーザ
が予め設定することができ、処理切替部104は、ユー
ザの指定に基づく処理を文字認識処理部105,バーコ
ード生成処理部106およびバーコード印刷部107に
実行させる。以下では、本実施の形態の文字認識装置
が、3つの動作モードを備えることとして、文字認識処
理を説明する。
The character recognition device according to the present embodiment has a plurality of operation modes as character recognition processing according to the type of symbol. This operation mode can be set in advance by the user from the operation unit 109, and the processing switching unit 104 performs processing based on the user's specification to the character recognition processing unit 105, the barcode generation processing unit 106, and the barcode printing unit 107. Let it run. Hereinafter, the character recognition processing will be described assuming that the character recognition device of the present embodiment has three operation modes.

【0024】(1)第1の動作モード 第1の動作モードは、記号の種類に応じて、文字認識部
201が文字認識の際に使用する辞書を使い分けるとい
うものである。例えば、図3に示すように、郵便番号記
号302は全角文字で記載されるが、その後に続く郵便
番号は半角文字で記載され、その上、郵便番号は数字同
士が接触して記載されていることが多く、郵便番号部分
の文字の切り出しにはミスが発生し易い。そこで、第1
の動作モードでは、このような切り出しミスがあること
を考慮して、検知された記号に続く文字領域についての
文字認識処理を実行するというものである。
(1) First Operation Mode In the first operation mode, the dictionary used by the character recognition unit 201 for character recognition is selectively used according to the type of symbol. For example, as shown in FIG. 3, the postal code symbol 302 is described in full-width characters, the postal code following it is described in half-width characters, and the postal code is described in contact with the numbers. In many cases, mistakes are likely to occur in cutting out characters in the postal code portion. Therefore, the first
In the operation mode of (1), character recognition processing is performed on a character area following the detected symbol in consideration of such a cutout error.

【0025】例えば、記号種類判定部103が名刺30
1中の郵便番号記号302を検知した場合、文字認識部
201は、郵便番号が登録された辞書を参照し、郵便番
号記号に続く文字領域の文字認識処理を実行する。
For example, if the symbol type determination unit 103 determines that the business card 30
When the postal code symbol 302 in the postal code 1 is detected, the character recognizing unit 201 refers to a dictionary in which the postal code is registered, and performs a character recognition process for a character area following the postal code symbol.

【0026】また、記号種類判定部103が名刺301
中の電話番号記号303(ファックス番号記号304)
を検知した場合、文字認識部201は、電話番号が登録
された辞書を参照し、電話番号記号303(ファックス
番号記号304)に続く文字領域の文字認識処理を実行
する。
Further, the symbol type determination unit 103 determines that the business card 301
Telephone number symbol 303 (fax number symbol 304)
Is detected, the character recognition unit 201 refers to the dictionary in which the telephone number is registered, and performs the character recognition processing of the character area following the telephone number symbol 303 (fax number symbol 304).

【0027】なお、電話番号を示す記号には、電話番号
記号303の他に、電話番号が0120から始まるフリ
ーダイヤルを示す記号がある。そこで、上記電話番号が
登録された辞書として、一般の電話番号やフリーダイヤ
ル等の電話番号を示す記号の種類によって、いかなる電
話番号となるか等のルールが記載された知識辞書を用い
ることもできる。
The symbols indicating the telephone numbers include, in addition to the telephone number symbols 303, symbols indicating toll-free numbers whose telephone numbers start with 0120. Therefore, as the dictionary in which the telephone numbers are registered, it is possible to use a knowledge dictionary in which rules such as what telephone numbers are used are described according to types of symbols indicating telephone numbers such as general telephone numbers and toll-free numbers. .

【0028】文字認識部201は、上述したように文字
認識処理を実行し、文字認識処理後の文字データ列を例
えばメモり108に格納する。
The character recognition unit 201 executes the character recognition processing as described above, and stores the character data string after the character recognition processing in, for example, the memory 108.

【0029】なお、郵便番号記号302,電話番号記号
303,ファックス番号記号304等に続く文字領域以
外の文字領域については、通常の文字認識処理が実行さ
れることはいうまでもない。また、例えば、郵便番号が
登録された辞書を参照して文字認識処理を実行する際に
は、通常の文字認識処理を行う際に用いる辞書を併用し
て文字認識処理を実行することにしても良い。
It goes without saying that normal character recognition processing is executed for character areas other than the character areas following the postal code symbol 302, telephone number symbol 303, fax number symbol 304, and the like. Further, for example, when performing the character recognition process with reference to a dictionary in which a postal code is registered, the character recognition process may be performed using a dictionary used when performing a normal character recognition process. good.

【0030】このように、記号の種類に応じて、文字認
識処理のための辞書を使い分けることにより、記号の持
つ情報を最大限活用することができ、文字認識精度の向
上を図ることができる。
As described above, by properly using the dictionary for character recognition processing according to the type of the symbol, the information possessed by the symbol can be utilized to the utmost, and the accuracy of character recognition can be improved.

【0031】(2)第2のモード 第2のモードは、記号の種類に応じて、文字認識処理部
105が、記号に続く文字列の文字認識処理結果が正し
いか否かの判定処理を実行し、文字認識精度の向上を図
ったモードである。なお、以下の説明では、郵便番号記
号を例として説明するが、電話番号記号やファックス番
号記号に対しても同様の考え方で適用することができ
る。また、説明の便宜上、以下の説明においては、5桁
および7桁の郵便番号中に含まれる”−”は考慮しない
ものとする。
(2) Second Mode In the second mode, the character recognition processing unit 105 executes a process of determining whether or not the character recognition processing result of the character string following the symbol is correct according to the type of the symbol. In this mode, the character recognition accuracy is improved. In the following description, a zip code is described as an example, but the same concept can be applied to a telephone code and a fax code. Further, for convenience of description, in the following description, "-" included in 5-digit and 7-digit postal codes is not considered.

【0032】まず、記号種類判定部103が、3桁また
は5桁の郵便番号記号302を検知した場合の処理を説
明する。図4は、本実施の形態の文字認識装置におい
て、3桁または5桁の郵便番号記号用の処理を示すフロ
ーチャートである。なお、図4中に図示することは省略
するが、郵便番号記号の後段に続く文字以外について
は、通常の文字認識処理が実行されることはいうまでも
ない。
First, a description will be given of a process when the symbol type determination unit 103 detects a 3-digit or 5-digit zip code 302. FIG. 4 is a flowchart showing a process for a 3-digit or 5-digit postal code symbol in the character recognition device of the present embodiment. Although not shown in FIG. 4, it goes without saying that normal character recognition processing is performed on characters other than those following the post code symbol.

【0033】文字認識部201は、文字単位に切り出し
処理が行われた画像データを入力し、文字認識処理を実
行する(S401)。
The character recognizing unit 201 inputs the image data that has been subjected to the cut-out processing for each character, and executes the character recognition processing (S401).

【0034】文字認識判定部202は、文字認識部20
1で文字認識処理が行われた結果を入力し、3桁または
5桁の郵便番号記号の後に続く文字が数字であるか否か
を判定する(S402)。
The character recognition judging section 202 includes a character recognition section 20.
The result of the character recognition processing performed in step 1 is input, and it is determined whether the character following the three- or five-digit postal code is a numeral (S402).

【0035】ステップS402における判定の結果、郵
便番号記号の後に続く文字が数字である場合、文字認識
判定部202は、さらに郵便番号記号の後に続く文字列
が3桁または5桁の数字であるか否かを判定する(S4
10)。判定の結果、3桁または5桁の数字である場合
は、3桁または5桁の郵便番号記号用の処理を終了す
る。
If the result of the determination in step S402 is that the character following the postal code is a number, the character recognition determining unit 202 further determines whether the character string following the postal code is a three- or five-digit number. (S4)
10). If the result of determination is that it is a three- or five-digit number, the processing for the three- or five-digit postal code is terminated.

【0036】一方、ステップS410における判定の結
果、3桁または5桁の数字ではない場合、記号の判定に
誤りがあることが考えられるため、ステップS409に
進み、後述する7桁の郵便番号記号用の処理を実行す
る。
On the other hand, if the result of determination in step S410 is not a three- or five-digit number, it is likely that there is an error in the determination of the symbol. Execute the processing of

【0037】また、ステップS402における判定の結
果、郵便番号記号の後の文字が数字ではない場合(漢
字,ひらがな等である場合)、文字認識判定部202
は、郵便番号記号の後段の文字を文字切出部102に送
り、文字切出部102は、その文字が含まれる領域を3
等分する強制切り出し処理を実行する(S403)。
If the result of the determination in step S402 is that the character following the postal code is not a number (in the case of kanji, hiragana, etc.), the character recognition determination unit 202
Sends the character after the postal code to the character extracting unit 102, and the character extracting unit 102
Forcible cutout processing is performed for equal division (S403).

【0038】図3に示すように、郵便番号記号302は
全角文字で記載されるが、その後に続く郵便番号は半角
文字で記載され、その上、郵便番号は数字同士が接触し
て記載されていることが多く、郵便番号部分の文字の切
り出しにはミスが発生し易い。そこで、郵便番号記号の
後の文字が数字であるか否か判定し、その文字が数字以
外(漢字,ひらがな等)である場合には、郵便番号部分
の文字切り出しにミスがあると判定し、郵便番号記号の
後の文字領域の文字切り出しを実行する。
As shown in FIG. 3, the postal code symbol 302 is described in full-width characters, the postal code following it is described in half-width characters, and the postal code is described by contacting numbers. In many cases, mistakes occur in cutting out the characters in the postal code portion. Therefore, it is determined whether or not the character after the postal code is a numeral, and if the character is not a numeral (Kanji, Hiragana, etc.), it is determined that there is a mistake in the character extraction of the postal code portion, Performs character segmentation of the character area after the postal code symbol.

【0039】続いて、文字認識部201は、文字切出部
102で3等分された画像データを入力し、文字認識処
理を実行する(S404)。
Subsequently, the character recognizing unit 201 inputs the image data divided into three by the character extracting unit 102 and executes a character recognizing process (S404).

【0040】文字認識判定部202は、文字認識部20
1で文字認識処理が行われた結果を入力し、3桁または
5桁の郵便番号記号の後に続く文字が数字であるか否か
を判定する(S405)。
The character recognition judging section 202 is composed of the character recognizing section 20
The result of the character recognition processing performed in step 1 is input, and it is determined whether or not the character following the 3-digit or 5-digit postal code is a numeral (S405).

【0041】ステップS405における判定の結果、郵
便番号記号の後に続く文字が数字である場合、文字認識
判定部202は、さらに郵便番号記号の後に続く文字列
が3桁の数字であるか否かを判定する(S411)。判
定の結果、3桁の数字である場合は、3桁または5桁の
郵便番号記号用の処理を終了する。
If the result of the determination in step S405 is that the character following the zip code is a number, the character recognition determination unit 202 further determines whether the character string following the zip code is a three-digit number. A determination is made (S411). If the result of the determination is that it is a three-digit number, the process for the three- or five-digit postal code is terminated.

【0042】一方、ステップS411における判定の結
果、3桁の数字ではない場合、記号の判定に誤りがある
ことが考えられるため、ステップS409に進み、後述
する7桁の郵便番号記号用の処理を実行する。
On the other hand, if the result of determination in step S411 is not a three-digit number, it is considered that there is an error in the determination of the symbol, so the process proceeds to step S409, and processing for a seven-digit postal code symbol described later is performed. Run.

【0043】また、ステップS405における判定の結
果、郵便番号記号の後の文字が数字ではない場合、文字
認識判定部202は、郵便番号記号の後段の文字を文字
切出部102に送り、文字切出部102は、その文字が
含まれる領域を5等分する強制切り出し処理を実行する
(S406)。
If the result of the determination in step S405 is that the character following the postal code is not a number, the character recognition determination unit 202 sends the character following the postal code to the character cutout unit 102, and The output unit 102 executes a forced cutout process for dividing the area including the character into five equal parts (S406).

【0044】続いて、文字認識部201は、文字切出部
102で5等分された画像データを入力し、文字認識処
理を実行する(S407)。
Subsequently, the character recognizing unit 201 inputs the image data divided into five equal parts by the character extracting unit 102, and executes a character recognizing process (S407).

【0045】文字認識判定部202は、文字認識部20
1で文字認識処理が行われた結果を入力し、3桁または
5桁の郵便番号記号の後に続く文字が数字であるか否か
を判定する(S408)。
The character recognition judging section 202 includes a character recognizing section 20.
The result of the character recognition processing performed in step 1 is input, and it is determined whether the character following the three- or five-digit postal code is a numeral (S408).

【0046】ステップS408における判定の結果、郵
便番号記号の後に続く文字が数字である場合、文字認識
判定部202は、さらに郵便番号記号の後に続く文字列
が5桁の数字であるか否かを判定する(S412)。判
定の結果、5桁の数字である場合は、3桁または5桁の
郵便番号記号用の処理を終了する。
If the result of the determination in step S408 is that the character following the postal code is a number, the character recognition determination unit 202 further determines whether the character string following the postal code is a five-digit number. A determination is made (S412). If the result of the determination is that it is a five-digit number, the processing for the three- or five-digit postal code is terminated.

【0047】一方、ステップS412における判定の結
果、5桁の数字ではない場合には、記号の判定に誤りが
あることが考えられるため、ステップS409に進み、
後述する7桁の郵便番号記号用の処理を実行する。
On the other hand, if the result of determination in step S 412 is not a five-digit number, it is considered that there is an error in the determination of the symbol, so the flow proceeds to step S 409,
The process for a seven-digit postal code symbol described later is executed.

【0048】また、ステップS408における判定の結
果、郵便番号記号の後の文字が数字ではない場合、文字
の切り出しミスがあると考えられるため、ステップS4
09に進み、後述する7桁の郵便番号記号用の処理を実
行する。
If the character after the postal code is not a numeral as a result of the determination in step S408, it is considered that there is a mistake in extracting the character, and therefore, step S4 is performed.
In step 09, a process for a 7-digit zip code described later is executed.

【0049】次に、記号種類判定部103が、7桁の郵
便番号記号を検知した場合の処理を説明する。図5は、
本実施の形態の文字認識装置において、7桁の郵便番号
記号用の処理を示すフローチャートである。なお、図7
中に図示することは省略するが、郵便番号記号の後段に
続く文字以外については、通常の文字認識処理が実行さ
れることはいうまでもない。
Next, a description will be given of a process performed when the symbol type determination unit 103 detects a seven-digit postal code symbol. FIG.
5 is a flowchart showing processing for a 7-digit postal code symbol in the character recognition device of the present embodiment. FIG.
Although not shown in the drawings, it goes without saying that normal character recognition processing is executed for characters other than those following the post code symbol.

【0050】文字認識部201は、文字単位に切り出し
処理が行われた画像データを入力し、文字認識処理を実
行する(S501)。
The character recognizing unit 201 inputs the image data that has been subjected to the clipping process for each character, and executes the character recognizing process (S501).

【0051】文字認識判定部202は、文字認識部20
1で文字認識処理が行われた結果を入力し、7桁の郵便
番号記号の後に続く文字が数字であるか否かを判定する
(S502)。
The character recognition judging section 202 includes a character recognizing section 20.
The result of the character recognition processing performed in step 1 is input, and it is determined whether or not the character following the seven-digit postal code is a numeral (S502).

【0052】ステップS502における判定の結果、郵
便番号記号の後に続く文字が数字である場合、文字認識
判定部202は、さらに郵便番号記号の後に続く文字列
が7桁の数字であるか否かを判定する(S507)。判
定の結果、7桁の数字である場合は、7桁の郵便番号記
号用の処理を終了する。
As a result of the determination in step S502, if the character following the postal code is a numeral, the character recognition determining unit 202 further determines whether the character string following the postal code is a seven-digit number. A determination is made (S507). If the result of the determination is that it is a seven-digit number, the processing for the seven-digit postal code is terminated.

【0053】一方、ステップS507における判定の結
果、7桁の数字ではない場合、記号の判定に誤りがある
ことが考えられるため、ステップS506に進み、上述
した3桁または5桁の郵便番号記号用の処理を実行す
る。
On the other hand, if the result of determination in step S507 is that the code is not a seven-digit number, it is likely that there is an error in the determination of the symbol. Execute the processing of

【0054】また、ステップS502における判定の結
果、郵便番号記号の後の文字が数字ではない場合、文字
認識判定部202は、郵便番号記号の後段の文字を文字
切出部102に送り、文字切出部102は、その文字が
含まれる領域を7等分する強制切り出し処理を実行する
(S503)。
If the character following the postal code is not a numeral as a result of the determination in step S502, the character recognition determining unit 202 sends the character following the postal code to the character extracting unit 102, and The output unit 102 executes a forced cutout process for dividing the area including the character into seven equal parts (S503).

【0055】続いて、文字認識部201は、文字切出部
102で7等分された画像データを入力し、文字認識処
理を実行する(S504)。
Subsequently, the character recognizing unit 201 inputs the image data divided into seven equal parts by the character extracting unit 102, and executes a character recognizing process (S504).

【0056】文字認識判定部202は、文字認識部20
1で文字認識処理が行われた結果を入力し、7桁の郵便
番号記号の後に続く文字が数字であるか否かを判定する
(S505)。
The character recognition judging section 202 is composed of the character recognizing section 20.
The result of the character recognition processing performed in step 1 is input, and it is determined whether the character following the seven-digit postal code is a number (S505).

【0057】ステップS505における判定の結果、郵
便番号記号の後に続く文字が数字である場合、文字認識
判定部202は、さらに郵便番号記号の後に続く文字列
が7桁の数字であるか否かを判定する(S507)。判
定の結果、7桁の数字である場合は、7桁の郵便番号記
号用の処理を終了する。
If the result of the determination in step S505 is that the character following the zip code is a number, the character recognition determination unit 202 further determines whether the character string following the zip code is a seven-digit number. A determination is made (S507). If the result of the determination is that it is a seven-digit number, the processing for the seven-digit postal code is terminated.

【0058】一方、ステップS507における判定の結
果、7桁の数字ではない場合、記号の判定に誤りがある
ことが考えられるため、ステップS506に進み、上述
した3桁または5桁の郵便番号記号用の処理を実行す
る。
On the other hand, if the result of the determination in step S507 is not a seven-digit number, it is considered that there is an error in the determination of the symbol, so the process proceeds to step S506, and the above-mentioned three- or five-digit postal code symbol is used. Execute the processing of

【0059】また、ステップS505における判定の結
果、郵便番号記号の後の文字が数字ではない場合、文字
の切り出しミスがあると考えられるため、ステップS5
06に進み、上述した3桁または5桁の郵便番号記号用
の処理を実行する。
If the character after the postal code is not a numeral as a result of the determination in step S505, it is considered that there is a mistake in extracting the character, and therefore, in step S5.
Proceeding to step 06, the above-described process for the 3-digit or 5-digit postal code is executed.

【0060】なお、図4および図5に示す処理において
は、最初に文字切出部102で切り出された文字領域を
利用して文字認識処理を行った後、文字認識判定部20
2で判定処理を行うことにしたが、予め郵便番号記号の
後の文字領域を3等分,5等分または7等分する処理を
行ってから文字認識処理を開始しても良い。
In the processing shown in FIGS. 4 and 5, a character recognition process is first performed using the character region cut out by the character cutout unit 102, and then the character recognition determination unit 20 is executed.
Although the determination process is performed in step 2, the character recognition process may be started after a process of dividing the character area after the postal code symbol into three, five, or seven parts in advance.

【0061】また、図4および図5に示す両処理を行っ
ても文字認識判定部202で正しい判定結果が得られな
い場合には、いずれが正しいかを評価し、文字認識処理
結果に誤りがある可能性をディスプレイ(図示せず)等
に表示することにしても良い。さらに、例えば、3桁ま
たは5桁の郵便番号記号用の文字認識処理を行った結
果、正しい判定結果を得ることができなかった場合に
は、図4に示すように7桁の郵便番号記号用の文字認識
処理(ステップS409)を実行することにしている
が、これに限定するものではなく、ここで処理を終了し
て判定結果を表示することにしても良いし、他の処理を
実行することにしても良い。
If the character recognition determination unit 202 does not obtain a correct determination result even after performing both of the processes shown in FIGS. 4 and 5, which is correct, the character recognition determination unit 202 evaluates which is correct, and finds an error in the character recognition processing result. The possibility may be displayed on a display (not shown) or the like. Further, for example, as a result of performing a character recognition process for a three-digit or five-digit postal code, if a correct determination result cannot be obtained, as shown in FIG. Is performed (step S409), but the present invention is not limited to this. The processing may be terminated and the determination result may be displayed, or another processing may be performed. You may decide.

【0062】また、図4および図5では、強制切り出し
処理を実行する際に、1つの文字領域を3等分,5等分
または7等分することにしたが、この処理に代え、その
文字領域の行方向に対して垂直に投影ヒストグラムを作
成し、その谷で切り出しすることにしても良い。
In FIG. 4 and FIG. 5, when executing the forcible cutout processing, one character area is divided into three, five, or seven equal parts. A projection histogram may be created perpendicularly to the row direction of the region, and cut out at the valley.

【0063】さらに、図4および図5において、郵便番
号記号の後の文字列が郵便番号記号の種類に応じた桁数
の数字であるか否かを判定する際に、文字列が全て数字
であるかを基準として判定することにしたが、これに代
えて文字矩形のサイズを基準として判定することにして
も良い。
Further, in FIG. 4 and FIG. 5, when it is determined whether or not the character string after the postal code is a number having the number of digits corresponding to the type of the postal code, all the character strings are numerical. Although the determination is made based on the presence of a character, the size may be determined based on the size of the character rectangle instead.

【0064】このように、記号を検知すると共に検知し
た記号の種類を判定し、その記号の後に続く文字認識処
理後の文字列が、記号の種類に応じた文字列となってい
るか否かを判定するため、文字認識精度の向上を図るこ
とができる。
As described above, a symbol is detected, the type of the detected symbol is determined, and it is determined whether or not the character string following the symbol after the character recognition processing is a character string corresponding to the type of the symbol. As a result, the accuracy of character recognition can be improved.

【0065】(3)第3のモード 郵便番号が7桁化された場合には、郵便業務の効率化の
ため、郵便番号をバーコードにして郵便物に印刷するこ
とになっている。そこで、第3のモードは、文字認識処
理後、文字認識結果に応じてバーコードデータを生成し
て、バーコード印刷を行うというものである。
(3) Third Mode When the postal code is converted to a seven-digit code, the postal code is printed as a bar code on the mail to improve the efficiency of postal services. Therefore, in the third mode, after character recognition processing, barcode data is generated according to the character recognition result, and barcode printing is performed.

【0066】図6は、本実施の形態の文字認識装置にお
いて、バーコード印刷処理を示すフローチャートであ
る。まず、上述した第1および第2のモードで説明した
ように、記号種類判定部103が郵便番号記号を検知す
ると共に、検知した郵便番号記号が3桁または5桁の郵
便番号記号であるか、7桁の郵便番号記号であるかを判
定する(S601)。
FIG. 6 is a flowchart showing a barcode printing process in the character recognition device of this embodiment. First, as described in the first and second modes described above, the symbol type determination unit 103 detects the postal code, and determines whether the detected postal code is a three- or five-digit postal code. It is determined whether the code is a seven-digit postal code (S601).

【0067】ステップS601における判定の結果、3
桁または5桁の郵便番号記号である場合、文字認識処理
部105は、上述した第1および第2のモードで説明し
た処理に基づいて、3桁または5桁の郵便番号記号用の
文字認識処理を実行する(S602)。
As a result of the determination in step S601, 3
If the postal code symbol is a five-digit or five-digit postal code symbol, the character recognition processing unit 105 performs a character recognition process for a three-digit or five-digit postal code symbol based on the processing described in the first and second modes described above. Is executed (S602).

【0068】そして、文字認識処理部105は、処理切
替部104の指示を受けて、文字認識結果をバーコード
生成処理部106に送る。バーコード生成処理部106
は、住所と7桁の郵便番号データを対応づけた第1のテ
ーブル(図示せず)と、7桁の郵便番号とそのバーコー
ドデータとを対応づけた第2のテーブル(図示せず)と
を有している。バーコード生成処理部106は、文字認
識結果を入力し、第1のテーブル中の住所とマッチング
処理を実行して、7桁の郵便番号データを生成する(S
603)。
Then, in response to the instruction from the processing switching unit 104, the character recognition processing unit 105 sends the character recognition result to the barcode generation processing unit 106. Barcode generation processing unit 106
Includes a first table (not shown) in which an address is associated with seven-digit zip code data, and a second table (not shown) in which a seven-digit zip code is associated with the barcode data. have. The barcode generation processing unit 106 receives the character recognition result, performs a matching process with the address in the first table, and generates seven-digit postal code data (S).
603).

【0069】続いて、バーコード生成処理部106は、
生成した7桁の郵便番号データと第2のテーブル中の7
桁の郵便番号とのマッチング処理を実行して、バーコー
ドデータを生成する(S604)。
Subsequently, the barcode generation processing unit 106
The generated 7-digit postal code data and 7 in the second table
The barcode data is generated by executing a matching process with the postal code of the digit (S604).

【0070】その後、バーコード生成処理部106は、
生成したバーコードデータをバーコード印刷部107に
渡し、バーコード印刷部107は、バーコード印刷を実
行する(S605)。例えば、読取対象が郵便物である
場合には、その郵便物に直接印刷を行うことができる。
また、読取対象が名刺等である場合には、例えば、バー
コードシールを出力することにしても良い。さらに、バ
ーコード生成処理部106で生成したバーコードデータ
をメモリ108に格納して、必要なときに読み出して印
刷することにしても良い。
Thereafter, the barcode generation processing unit 106
The generated barcode data is passed to the barcode printing unit 107, and the barcode printing unit 107 executes barcode printing (S605). For example, when the object to be read is a postal matter, printing can be performed directly on the postal matter.
When the reading target is a business card or the like, for example, a barcode seal may be output. Further, the barcode data generated by the barcode generation processing unit 106 may be stored in the memory 108, read out when necessary, and printed.

【0071】一方、ステップS601における判定の結
果、7桁の郵便番号記号である場合、文字認識処理部1
05は、上述した第1および第2のモードで説明した処
理に基づいて、7桁の郵便番号記号用の文字認識処理を
実行する(S606)。
On the other hand, if the result of determination in step S601 is that the code is a seven-digit postal code, the character recognition processing unit 1
In step S606, a character recognition process for a seven-digit zip code is executed based on the processes described in the first and second modes (S606).

【0072】そして、文字認識処理部105は、処理切
替部104の指示を受けて、文字認識結果をバーコード
生成処理部106に送る。バーコード生成処理部106
は、文字認識結果を入力し、第2のテーブル中の7桁の
郵便番号とのマッチング処理を実行して、バーコードデ
ータを生成する(S604)。
Then, in response to the instruction from the process switching unit 104, the character recognition processing unit 105 sends the character recognition result to the bar code generation processing unit 106. Barcode generation processing unit 106
Inputs the character recognition result, executes a matching process with the seven-digit postal code in the second table, and generates barcode data (S604).

【0073】その後、バーコード生成処理部106は、
生成したバーコードデータをバーコード印刷部107に
渡し、バーコード印刷部107は、バーコード印刷を実
行する(S605)。
Thereafter, the barcode generation processing unit 106
The generated barcode data is passed to the barcode printing unit 107, and the barcode printing unit 107 executes barcode printing (S605).

【0074】このように、3桁または5桁の郵便番号記
号または7桁の郵便番号記号を検出し、郵便番号記号の
種類に応じたバーコード生成処理を実行することによ
り、容易にバーコードを生成して印刷することができ
る。
As described above, by detecting a 3-digit or 5-digit postal code symbol or a 7-digit postal code symbol and executing a barcode generation process according to the type of the postal code symbol, the barcode can be easily converted. Can be generated and printed.

【0075】以上のように、本実施の形態の文字認識装
置によれば、文書中に記載されている記号を検知すると
共に、その記号の種類を判定し、判定した記号の種類に
基づいて、その記号に続く文字の文字認識処理を実行す
ることにしたため、記号の持つ情報を最大限活用するこ
とができ、文字認識精度の向上を図ることができる。
As described above, according to the character recognition device of the present embodiment, a symbol described in a document is detected, the type of the symbol is determined, and based on the determined type of the symbol, Since the character recognition processing of the character following the symbol is executed, the information of the symbol can be used to the maximum and the accuracy of character recognition can be improved.

【0076】なお、以上説明した本実施の形態において
は、記号として郵便番号記号,電話番号,ファックス番
号を例としたが、さらに、図3に示すE−mail記号
305を検知し、この記号の後にはアルファベットまた
は数字が来ること等を文字認識処理に利用することもで
きる。その際にE−mailアドレス中のアットマーク
306を利用することも可能である。
In the present embodiment described above, a postal code symbol, a telephone number, and a facsimile number are taken as examples of symbols, but the E-mail symbol 305 shown in FIG. Later, the arrival of an alphabet or a number can be used for character recognition processing. At that time, it is also possible to use the at mark 306 in the E-mail address.

【0077】また、上述した文字認識処理をプログラム
化し、文字認識処理プログラムをフロッピーディスク,
CD−ROM,DVD等のコンピュータが読み取り可能
な記憶媒体に格納して提供することができる。
Further, the above-mentioned character recognition processing is programmed, and the character recognition processing program is stored in a floppy disk,
It can be provided by being stored in a computer-readable storage medium such as a CD-ROM and a DVD.

【0078】[0078]

【発明の効果】以上説明したように、本発明の文字認識
装置(請求項1)によれば、後段に続く所定の文字列が
郵便番号および電話番号であることを示すための記号を
少なくとも含む記号情報を有し、1文字単位の文字領域
に切り出された画像データを入力して、文字領域に含ま
れた文字と記号情報に含まれた記号とを比較することに
より、記号情報に含まれた記号と同一の記号を含む文字
領域を検知して、当該文字領域に含まれた記号の種類を
判定する記号種類判定手段と、記号種類判定手段が記号
情報に含まれた記号と同一の記号を含む文字領域を検知
した場合に、当該文字領域に続く所定の文字領域につい
て、記号種類判定手段で判定された記号の種類に応じた
文字認識処理を実行する文字認識処理手段と、を備える
ため、記号の持つ情報を最大限活用することができ、文
字認識精度の向上を図ることができる。
As described above, according to the character recognition device of the present invention (claim 1), the predetermined character string following the subsequent stage includes at least a symbol indicating that it is a postal code and a telephone number. By inputting image data that has symbol information and is cut out into a character area in units of one character and comparing the characters included in the character area with the symbols included in the symbol information, Symbol type determining means for detecting a character area including the same symbol as the detected symbol, and determining the type of the symbol included in the character area; and the same symbol as the symbol included in the symbol information. Character recognition processing means for executing a character recognition process according to the type of the symbol determined by the symbol type determination means for a predetermined character area following the character area when a character area including the character area is detected. With a sign Distribution to be able to take full advantage, it is possible to improve the character recognition accuracy.

【0079】また、本発明の文字認識装置(請求項2)
によれば、請求項1記載の文字認識装置において、文字
認識処理手段が、予め用意された複数の文字認識用辞書
から記号種類判定手段で判定された記号の種類に対応し
た文字認識用辞書を選択し、選択した文字認識用辞書を
用いて、所定の文字領域についての文字認識処理を実行
するため、記号の持つ情報を最大限活用することがで
き、文字認識精度の向上を図ることができる。
Further, the character recognition device of the present invention (Claim 2)
According to the character recognition device of the first aspect, the character recognition processing means converts a character recognition dictionary corresponding to the symbol type determined by the symbol type determination means from a plurality of character recognition dictionaries prepared in advance. Since the character recognition process is performed for a predetermined character area using the selected and selected character recognition dictionary, the information possessed by the symbols can be used to the utmost, and the character recognition accuracy can be improved. .

【0080】また、本発明の文字認識装置(請求項3)
によれば、請求項1または2記載の文字認識装置におい
て、文字認識処理手段が、記号種類判定手段で記号の種
類が3桁または5桁の郵便番号を示す記号であると判定
された場合に、所定の文字領域について3桁または5桁
の郵便番号用の文字認識処理を実行し、記号種類判定手
段で記号の種類が7桁の郵便番号を示す記号であると判
定された場合に、所定の文字領域について7桁の郵便番
号用の文字認識処理を実行するため、記号の持つ情報を
最大限活用することができ、文字認識精度の向上を図る
ことができる。
Further, the character recognition device of the present invention (claim 3)
According to the character recognition device of the first or second aspect, when the character recognition processing unit determines that the type of the symbol is a symbol indicating a 3-digit or 5-digit postal code by the symbol type determination unit, The character recognition process for a 3-digit or 5-digit postal code is executed for a predetermined character area, and when the symbol type determination unit determines that the symbol type is a symbol indicating a 7-digit postal code, the predetermined Since the character recognition process for a seven-digit postal code is executed for the character region of, the information of the symbol can be utilized to the utmost, and the accuracy of character recognition can be improved.

【0081】また、本発明の文字認識装置(請求項4)
によれば、請求項3記載の文字認識装置において、文字
認識処理手段が、3桁または5桁の郵便番号用の文字認
識処理を行う際に、3桁または5桁の郵便番号を示す記
号に続く文字認識処理後の文字が数字であるか否かを判
定して文字領域の切り出しに誤りがないか否かを判定す
ると共に、3桁または5桁の郵便番号を示す記号に続く
文字認識処理後の文字列が3桁または5桁の郵便番号で
あるか否かを判定して記号の種類の判定に誤りがないか
否かを判定し、7桁の郵便番号用の文字認識処理を行う
際に、7桁の郵便番号を示す記号に続く文字認識処理後
の文字が数字であるか否かを判定して文字領域の切り出
しに誤りがないか否かを判定すると共に、7桁の郵便番
号を示す記号に続く文字認識処理後の文字列が7桁の郵
便番号であるか否かを判定して記号の種類の判定に誤り
がないか否かを判定するため、記号の持つ情報を最大限
活用することができ、文字認識精度の向上を図ることが
できる。
Further, the character recognition device of the present invention (claim 4)
According to the character recognition device of the third aspect, when the character recognition processing means performs a character recognition process for a three-digit or five-digit postal code, the character recognition processing means converts the symbol to a three- or five-digit postal code. It is determined whether the character after the subsequent character recognition process is a numeral to determine whether there is an error in the extraction of the character area, and a character recognition process following a symbol indicating a 3-digit or 5-digit postal code. It is determined whether or not the subsequent character string is a 3-digit or 5-digit postal code to determine whether there is an error in the determination of the symbol type, and a character recognition process for a 7-digit postal code is performed. At this time, it is determined whether or not the character after the character recognition processing following the symbol indicating the seven-digit postal code is a numeral to determine whether or not there is an error in extracting the character area. Whether the character string after the character recognition processing following the symbol indicating the number is a 7-digit postal code To determine whether there is no error in the determination of the type of symbols to determine the, it is possible to maximize the information possessed by the symbol, it is possible to improve the character recognition accuracy.

【0082】また、本発明の文字認識装置(請求項5)
によれば、請求項1〜4記載の文字認識装置において、
記号種類判定手段が3桁または5桁の郵便番号を示す記
号を含む文字領域を検知した場合に、さらに、文字認識
処理手段で文字認識処理された後の住所を示す文字に基
づいて、7桁の郵便番号データを生成し、生成した7桁
の郵便番号データに対応したバーコードを生成して出力
するバーコード生成手段を備えるため、記号の持つ情報
を最大限活用したバーコード生成処理を実行することが
できる。
The character recognition device of the present invention (claim 5)
According to the character recognition device according to claims 1 to 4,
When the symbol type determination means detects a character area including a symbol indicating a three- or five-digit postal code, the character type determination means further determines a seven-digit character based on the character indicating the address after the character recognition processing by the character recognition processing means. A bar code generation process that generates barcodes corresponding to the generated seven-digit postal code data and generates and outputs a barcode corresponding to the generated seven-digit postal code data. can do.

【0083】さらに、本発明の文字認識処理を記憶した
記憶媒体(請求項6)によれば、請求項1ないし5に記
載の文字認識処理をコンピュータ上で実行させるプログ
ラムが記憶され、コンピュータが読み取り可能なため、
このプログラムをコンピュータに読み込ませて実行させ
ることにより、記号の持つ情報を最大限活用して、文字
認識精度の向上を図った文字認識処理を実行することが
できる。
Further, according to the storage medium storing the character recognition processing of the present invention (claim 6), a program for executing the character recognition processing according to any one of claims 1 to 5 on a computer is stored and read by the computer. Because possible
By causing the computer to read and execute this program, it is possible to execute character recognition processing that improves character recognition accuracy by making the most of the information possessed by the symbols.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施の形態の文字認識装置のブロック構成図
である。
FIG. 1 is a block diagram of a character recognition device according to an embodiment.

【図2】図1に示す文字認識装置における文字認識処理
部のブロック構成図である。
FIG. 2 is a block diagram of a character recognition processing unit in the character recognition device shown in FIG.

【図3】本実施の形態の文字認識装置の動作を説明する
ために用いる名刺の一例を示す図である。
FIG. 3 is a diagram showing an example of a business card used to explain the operation of the character recognition device of the present embodiment.

【図4】本実施の形態の文字認識装置において、3桁ま
たは5桁の郵便番号記号用の処理を示すフローチャート
である。
FIG. 4 is a flowchart showing a process for a 3-digit or 5-digit postal code symbol in the character recognition device of the present embodiment.

【図5】本実施の形態の文字認識装置において、7桁の
郵便番号記号用の処理を示すフローチャートである。
FIG. 5 is a flowchart showing processing for a seven-digit postal code in the character recognition device of the present embodiment.

【図6】本実施の形態の文字認識装置において、バーコ
ード印刷処理を示すフローチャートである。
FIG. 6 is a flowchart illustrating a barcode printing process in the character recognition device of the present embodiment.

【符号の説明】[Explanation of symbols]

101 画像データ入力部 102 文字切出部 103 記号種類判定部 104 処理切替部 105 文字認識処理部 106 バーコード生成処理部 107 バーコード印刷部 108 メモリ 109 操作部 110 主制御部 201 文字認識部 202 文字認識判定部 301 名刺 302 郵便番号記号 303 電話番号記号 304 ファックス番号記号 305 E−mail記号 306 アットマーク Reference Signs List 101 Image data input unit 102 Character extraction unit 103 Symbol type determination unit 104 Processing switching unit 105 Character recognition processing unit 106 Barcode generation processing unit 107 Barcode printing unit 108 Memory 109 Operation unit 110 Main control unit 201 Character recognition unit 202 Character Recognition determination unit 301 Business card 302 Postal code symbol 303 Telephone number symbol 304 Fax number symbol 305 E-mail symbol 306 At mark

───────────────────────────────────────────────────── フロントページの続き (72)発明者 山本 忍 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 内山 幸央 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 ──────────────────────────────────────────────────続 き Continued on the front page (72) Inventor Shinobu Yamamoto 1-3-6 Nakamagome, Ota-ku, Tokyo Inside Ricoh Company (72) Inventor Yukio Uchiyama 1-3-6 Nakamagome, Ota-ku, Tokyo Stock Inside the company Ricoh

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 郵便物,名刺,帳票等の文書の画像を光
学的に読み取ることによって得た画像データを入力し、
前記入力した画像データから1文字単位の文字領域を切
り出して、文字認識処理を実行する文字認識装置におい
て、 後段に続く所定の文字列が郵便番号および電話番号であ
ることを示すための記号を少なくとも含む記号情報を有
し、前記1文字単位の文字領域に切り出された画像デー
タを入力して、前記文字領域に含まれた文字と前記記号
情報に含まれた記号とを比較することにより、前記記号
情報に含まれた記号と同一の記号を含む文字領域を検知
して、当該文字領域に含まれた記号の種類を判定する記
号種類判定手段と、 前記記号種類判定手段が前記記号情報に含まれた記号と
同一の記号を含む文字領域を検知した場合に、当該文字
領域に続く所定の文字領域について、前記記号種類判定
手段で判定された記号の種類に応じた文字認識処理を実
行する文字認識処理手段と、を備えることを特徴とする
文字認識装置。
An image data obtained by optically reading an image of a document such as a postal matter, a business card, a form, etc. is input,
In a character recognition device that cuts out a character area in units of one character from the input image data and executes a character recognition process, at least a symbol indicating that a predetermined character string following the post-stage is a postal code and a telephone number is included. By inputting the image data cut out to the character area in units of one character having the symbol information including, and comparing the characters included in the character area with the symbols included in the symbol information, A symbol type determination unit that detects a character region including the same symbol as the symbol included in the symbol information and determines a type of the symbol included in the character region; and the symbol type determination unit includes the symbol type determination unit in the symbol information. When a character area including the same symbol as the detected symbol is detected, character recognition corresponding to the type of the symbol determined by the symbol type determining means is performed for a predetermined character area following the character area. Character recognition apparatus characterized by comprising: a character recognition processing means for executing the management, the.
【請求項2】 前記文字認識処理手段が、予め用意され
た複数の文字認識用辞書から前記記号種類判定手段で判
定された記号の種類に対応した文字認識用辞書を選択
し、前記選択した文字認識用辞書を用いて、前記所定の
文字領域についての文字認識処理を実行することを特徴
とする請求項1記載の文字認識装置。
2. The character recognition processing means selects a character recognition dictionary corresponding to the type of the symbol determined by the symbol type determining means from a plurality of character recognition dictionaries prepared in advance, and selects the selected character. 2. The character recognition device according to claim 1, wherein a character recognition process is performed on the predetermined character region using a recognition dictionary.
【請求項3】 前記文字認識処理手段が、前記記号種類
判定手段で前記記号の種類が3桁または5桁の郵便番号
を示す記号であると判定された場合に、前記所定の文字
領域について3桁または5桁の郵便番号用の文字認識処
理を実行し、前記記号種類判定手段で前記記号の種類が
7桁の郵便番号を示す記号であると判定された場合に、
前記所定の文字領域について7桁の郵便番号用の文字認
識処理を実行することを特徴とする請求項1または2記
載の文字認識装置。
3. The method according to claim 1, wherein the character recognition processing means determines that the type of the symbol is a symbol indicating a three-digit or five-digit postal code by the symbol type determination means. When performing character recognition processing for a digit or five-digit postal code, and the symbol type determination means determines that the type of the symbol is a symbol indicating a seven-digit postal code,
3. The character recognition device according to claim 1, wherein a character recognition process for a seven-digit postal code is executed for the predetermined character area.
【請求項4】 前記文字認識処理手段が、前記3桁また
は5桁の郵便番号用の文字認識処理を行う際に、前記3
桁または5桁の郵便番号を示す記号に続く文字認識処理
後の文字が数字であるか否かを判定して前記文字領域の
切り出しに誤りがないか否かを判定すると共に、前記3
桁または5桁の郵便番号を示す記号に続く文字認識処理
後の文字列が前記3桁または5桁の郵便番号であるか否
かを判定して前記記号の種類の判定に誤りがないか否か
を判定し、前記7桁の郵便番号用の文字認識処理を行う
際に、前記7桁の郵便番号を示す記号に続く文字認識処
理後の文字が数字であるか否かを判定して前記文字領域
の切り出しに誤りがないか否かを判定すると共に、前記
7桁の郵便番号を示す記号に続く文字認識処理後の文字
列が前記7桁の郵便番号であるか否かを判定して前記記
号の種類の判定に誤りがないか否かを判定することを特
徴とする請求項3記載の文字認識装置。
4. When the character recognition processing means performs the character recognition processing for the three-digit or five-digit postal code,
It is determined whether or not the character after the character recognition processing following the symbol indicating the digit or the five-digit postal code is a numeral to determine whether or not there is an error in cutting out the character area.
It is determined whether or not the character string after the character recognition processing following the symbol indicating the digit or the 5-digit postal code is the 3-digit or 5-digit postal code, and whether the type of the symbol is correctly determined. When performing the character recognition process for the seven-digit postal code, it is determined whether the character after the character recognition process following the symbol indicating the seven-digit postal code is a number, It is determined whether there is no error in the extraction of the character area and whether the character string after the character recognition processing following the symbol indicating the seven-digit postal code is the seven-digit postal code. 4. The character recognition device according to claim 3, wherein it is determined whether or not there is an error in determining the type of the symbol.
【請求項5】 前記記号種類判定手段が3桁または5桁
の郵便番号を示す記号を含む文字領域を検知した場合
に、さらに、前記文字認識処理手段で文字認識処理され
た後の住所を示す文字に基づいて、7桁の郵便番号デー
タを生成し、前記生成した7桁の郵便番号データに対応
したバーコードを生成して出力するバーコード生成手段
を備えることを特徴とする請求項1〜4記載の文字認識
装置。
5. When the symbol type judging means detects a character area including a symbol indicating a 3-digit or 5-digit postal code, the symbol type judging means further indicates an address after the character recognition processing by the character recognition processing means. 7. A bar code generating means for generating seven-digit postal code data based on characters, and generating and outputting a bar code corresponding to the generated seven-digit postal code data. 4. The character recognition device according to 4.
【請求項6】 前記請求項1ないし5に記載の文字認識
処理をコンピュータ上で実行させるプログラムが記憶さ
れ、前記コンピュータが読み取り可能なことを特徴とす
る記憶媒体。
6. A storage medium which stores a program for causing a computer to execute the character recognition processing according to claim 1 and is readable by the computer.
JP35673096A 1996-12-27 1996-12-27 Character recognition device Expired - Fee Related JP3725953B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35673096A JP3725953B2 (en) 1996-12-27 1996-12-27 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35673096A JP3725953B2 (en) 1996-12-27 1996-12-27 Character recognition device

Publications (2)

Publication Number Publication Date
JPH10187885A true JPH10187885A (en) 1998-07-21
JP3725953B2 JP3725953B2 (en) 2005-12-14

Family

ID=18450494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35673096A Expired - Fee Related JP3725953B2 (en) 1996-12-27 1996-12-27 Character recognition device

Country Status (1)

Country Link
JP (1) JP3725953B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017142690A (en) * 2016-02-10 2017-08-17 キヤノン株式会社 Information processing apparatus and method for controlling the same
CN110796145A (en) * 2019-09-19 2020-02-14 平安科技(深圳)有限公司 Multi-certificate segmentation association method based on intelligent decision and related equipment

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102161163B1 (en) * 2019-04-29 2020-09-29 (주)한빛넷 order data linkage system through linkage between POS program and delivery agency program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017142690A (en) * 2016-02-10 2017-08-17 キヤノン株式会社 Information processing apparatus and method for controlling the same
CN110796145A (en) * 2019-09-19 2020-02-14 平安科技(深圳)有限公司 Multi-certificate segmentation association method based on intelligent decision and related equipment
CN110796145B (en) * 2019-09-19 2024-01-19 平安科技(深圳)有限公司 Multi-certificate segmentation association method and related equipment based on intelligent decision

Also Published As

Publication number Publication date
JP3725953B2 (en) 2005-12-14

Similar Documents

Publication Publication Date Title
JP2001521821A (en) Method and apparatus for identifying distribution information of delivery
JPH11226513A (en) Mail address reader and mail address classifier
JP3485020B2 (en) Character recognition method and apparatus, and storage medium
EP1202213B1 (en) Document format identification apparatus and method
JPH10187885A (en) Character recognizer and storage medium storing character recognition processing
JP2740335B2 (en) Table reader with automatic cell attribute determination function
JPS5841542B2 (en) optical character reader
JP2001005804A (en) Data base registering method utilizing character recognizing device
JPS63146187A (en) Character recognizing device
JPH0962758A (en) Business form recognition processing system
JPH10302025A (en) Handwritten character recognizing device and its program recording medium
JPH10134141A (en) Device and method for document collation
JP4224914B2 (en) Character reading system and character reading method
JP2529421B2 (en) Character recognition device
JP2924356B2 (en) Optical character reader
JP2002024743A (en) Image reading system and image reading method
JP2003099709A (en) Misread character correction method and optical character recognition device
JP2972443B2 (en) Character recognition device
JP2570571B2 (en) Optical character reader
JPH11226516A (en) Address reader on customer bar code printed mail
JP3060237B2 (en) Japanese character recognition device
JPH04274580A (en) Optical character reader
JPH1185901A (en) Device and method for document image processing, device and method for postal address automatic recognition, and recording medium
JPH11134439A (en) Method for recognizing word
JPH10319939A (en) Character font forming device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050920

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050926

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080930

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090930

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090930

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100930

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110930

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120930

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130930

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees