JP2002366898A - Device and method for location information recognition and sectioning device - Google Patents

Device and method for location information recognition and sectioning device

Info

Publication number
JP2002366898A
JP2002366898A JP2001172796A JP2001172796A JP2002366898A JP 2002366898 A JP2002366898 A JP 2002366898A JP 2001172796 A JP2001172796 A JP 2001172796A JP 2001172796 A JP2001172796 A JP 2001172796A JP 2002366898 A JP2002366898 A JP 2002366898A
Authority
JP
Japan
Prior art keywords
character
recognition
reading
output
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001172796A
Other languages
Japanese (ja)
Other versions
JP4733859B2 (en
Inventor
Michiko Kojima
美知子 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001172796A priority Critical patent/JP4733859B2/en
Publication of JP2002366898A publication Critical patent/JP2002366898A/en
Application granted granted Critical
Publication of JP4733859B2 publication Critical patent/JP4733859B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To automatically adjust parameters which are used to calculate a final character evaluated value from two kinds of character recognition results of a composite similarity recognizing method and a structure feature matching method without any human intervention. SOLUTION: A character evaluated value on which the frequency (appearance rate) of a character is reflected is determined by using statistic information on zip code data gathered at a sectioning machine installed station. Parameter adjustments for character evaluated value determination which were manually made before are automatically made by using the statistic information.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、紙葉類上の数字
列からなる所在情報を読取り、この読取った数字列の1
文字ずつを認識する所在情報認識装置、所在情報認識方
法およびこの所在情報認識装置の認識結果を用いて区分
処理を実行する区分装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention reads location information consisting of a number string on a paper sheet and reads one of the read number strings.
The present invention relates to a location information recognizing device that recognizes characters, a location information recognizing method, and a sorting device that performs a sorting process using the recognition result of the location information recognizing device.

【0002】[0002]

【従来の技術】紙葉類としての郵便物上の宛名情報を光
学的に読み取って郵便物を区分する郵便物宛名自動読取
区分機においては、2種類の文字認識手法(複合類似度
法、構造特徴マッチング法)が使用されている。
2. Description of the Related Art In a mail address automatic reading and sorting machine for optically reading address information on a mail as a paper sheet and classifying the mail, there are two types of character recognition methods (composite similarity method, structure Feature matching method) is used.

【0003】2種類の認識手法によって得られた認識結
果から、郵便番号(数字列からなる所在情報)の出現率
によって予め設定されたパラメータを用いて評価値を求
め、認識結果の総合評価を行っている。例えば、各桁に
おいて、出現率の高い数字の評価値は高く設定し、出現
率の低い数字はその値を低く設定する、等といったこと
をパラメータで設定している。
[0003] From the recognition results obtained by the two types of recognition methods, an evaluation value is obtained by using a parameter set in advance according to the appearance rate of a postal code (location information consisting of a digit string), and comprehensive evaluation of the recognition results is performed. ing. For example, in each digit, a parameter is set such that an evaluation value of a number having a high appearance rate is set to be high, and a number having a low appearance rate is set to be low.

【0004】このような処理を行うことによって、出現
率の多い数字は認識しやすく、出現率の低い数字は認識
し難くすることができ、各地域での区分機の処理効率を
向上させることができる。
[0004] By performing such processing, numbers having a high appearance rate can be easily recognized, while numbers having a low appearance rate can be hardly recognized, and the processing efficiency of the sorting machine in each region can be improved. it can.

【0005】例えば、川崎付近の郵便局においては、
「21*」などという郵便物の割合が多い。従って、1
桁目の数字「2」や2桁目の数字「1」をその他の数字
と比べて認識しやすく設定しておくことによって、区分
率の向上、誤区分率の低減を行っている。
For example, at a post office near Kawasaki,
The proportion of postal items such as "21 *" is large. Therefore, 1
By setting the second digit "2" and the second digit "1" to be easier to recognize than other numbers, the sorting rate is improved and the erroneous sorting rate is reduced.

【0006】従来、このパラメータは、現地保守員など
が経験的に捉えた、各地域での郵便番号の出現率を基に
調整されていた。上記したとおり、パラメータの調整は
地域ごとに人手で行っていたため、調整する手間が非常
にかかる上、人の経験や勘に頼るところが多いのでかえ
って性能が悪化する(調整不良)場合もあり、問題とな
っていた。
Heretofore, this parameter has been adjusted based on the appearance rate of postal codes in each region, as empirically grasped by local maintenance personnel and the like. As described above, parameter adjustments are performed manually for each region, so it takes a lot of time and effort to make adjustments. In addition, there are many places that rely on human experience and intuition, so performance may worsen (improper adjustment). Had become.

【0007】[0007]

【発明が解決しようとする課題】この発明は、区分装置
で収集される数字列からなる所在情報の統計情報を利用
してパラメータ調整を自動化することによって、大幅な
省力化が図れる所在情報認識装置、所在情報認識方法お
よび区分装置を提供することを目的としている。
SUMMARY OF THE INVENTION The present invention provides a location information recognizing apparatus which can save a large amount of labor by automating parameter adjustment using statistical information of location information consisting of a number string collected by a sorting apparatus. It is an object of the present invention to provide a location information recognition method and a sorting device.

【0008】[0008]

【課題を解決するための手段】この発明の装置は、紙葉
類上の数字列からなる所在情報を読取る読取手段と、こ
の読取手段により読取った数字列の1文字ずつを認識す
る認識手段と、この認識手段により認識した認識結果を
収集する収集手段と、この収集手段により収集した収集
内容に基づいて、上記認識手段による1文字ずつの数字
の認識基準を変更する変更手段とを有して構成される。
An apparatus according to the present invention comprises a reading means for reading location information consisting of a number string on a sheet, a recognition means for recognizing each character of the number string read by the reading means. Collection means for collecting the recognition result recognized by the recognition means, and change means for changing the recognition standard of the character by character by the recognition means based on the collected contents collected by the collection means. Be composed.

【0009】[0009]

【発明の実施の形態】この発明の実施の形態を図面に基
いて詳細に説明する。図1は、この発明に係わる区分機
1を示す外観図であり、図2は区分機1の概略構成を示
す図である。この区分機1は、大型の箱型状の区分機本
体1aを有している。この区分機1は、郵便物P上の宛
名、郵便番号を読取り、その読取内容から宛名、郵便番
号を認識し、この認識した宛名、郵便番号に対応する区
分先に郵便物Pを区分するものである。上記区分機本体
1aには、供給部2と、スキャナ部3と、搬送部4と、
区分部5と、収納部6とが設けられている。この供給部
2からの郵便物Pが搬送路Rによって搬送されることに
より、搬送部4、区分部5を順次介して収納部6に導か
れる。
Embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is an external view showing a sorting machine 1 according to the present invention, and FIG. 2 is a diagram showing a schematic configuration of the sorting machine 1. The sorting machine 1 has a large box-shaped sorting machine main body 1a. The sorting machine 1 reads an address and a postal code on a postal matter P, recognizes an address and a postal code from the read contents, and sorts the postal matter P into a sorting destination corresponding to the recognized address and postal code. It is. A supply unit 2, a scanner unit 3, a transport unit 4,
A partitioning section 5 and a storage section 6 are provided. The postal matter P from the supply unit 2 is transported by the transport path R, and is guided to the storage unit 6 via the transport unit 4 and the sorting unit 5 sequentially.

【0010】上記供給部2は、郵便物Pを載置する載置
台7と、この載置台7から郵便物Pを一通ずつ取り出し
て搬送路Rに送る取出し部8とを有している。上記スキ
ャナ部3は、搬送路Rによって搬送される1通ずつの郵
便物P上の全体の画像を光学的に読取って画像情報を生
成する。上記搬送部4は、スキャナ部3を通過してきた
郵便物Pを区分部5へ搬送する。上記収納部6は、郵便
物Pを区分収納する多数の収納ポケット6aを有してい
る。上記区分部5は、搬送部4から送られてくる郵便物
Pをスキャナ部3からの画像情報に対する後述する認識
結果に基いて収納ポケット6a、…のいずれかに振り分
ける。
The supply section 2 has a mounting table 7 on which the postal matter P is mounted, and a take-out section 8 for taking out the postal matter P one by one from the mounting base 7 and sending it to the transport path R. The scanner unit 3 optically reads the entire image on each mail P transported by the transport path R to generate image information. The transport unit 4 transports the mail P that has passed through the scanner unit 3 to the sorting unit 5. The storage section 6 has a large number of storage pockets 6a for storing the mail items P separately. The sorting section 5 sorts the postal matter P sent from the transport section 4 to one of the storage pockets 6a,... Based on a recognition result of image information from the scanner section 3 described later.

【0011】上記スキャナ部3は、郵便物P上を光学的
に走査して光電変換することによりパターン信号を得る
ものであり、たとえば郵便物P上に光を照射する光源、
およびその反射光を受けて電気信号に変換する自己走査
形のCCDイメージセンサ等によって構成される。上記
スキャナ部3の出力は認識部10に供給される。この認
識部10は、スキャナ部3の出力に応じて文字パターン
の認識を行うことにより郵便番号、住所等からなるあて
名を認識するものである。
The scanner unit 3 obtains a pattern signal by optically scanning the postal matter P and performing photoelectric conversion, and includes, for example, a light source for irradiating light on the postal matter P,
And a self-scanning CCD image sensor that receives the reflected light and converts it into an electric signal. The output of the scanner unit 3 is supplied to a recognition unit 10. The recognition unit 10 recognizes a destination name including a postal code, an address, and the like by recognizing a character pattern in accordance with an output of the scanner unit 3.

【0012】上記区分機1において、上記供給部2、ス
キャナ部3、搬送部4、区分部5、認識部10は、制御
部11に接続されている。この制御部11は、区分機1
の全体の動作を制御する。たとえば、制御部11は図示
しないメモリに記憶されている区分指定テーブルを用い
て、上記認識部10の認識結果に対応する区分指定デー
タを読出し、この読出した区分指定データ(収納ポケッ
ト6a、…のアドレス)に対応する収納ポケット6a、
…に上記郵便物Pを搬送せしめるものである。
In the sorting machine 1, the supply section 2, the scanner section 3, the transport section 4, the sorting section 5, and the recognition section 10 are connected to a control section 11. The control unit 11 controls the sorting machine 1
Control the overall operation of. For example, the control section 11 reads out the section designation data corresponding to the recognition result of the recognition section 10 using a section designation table stored in a memory (not shown), and reads out the read section designation data (of the storage pockets 6a,...). Address) corresponding to the storage pocket 6a,
.. To transport the mail P.

【0013】さらに、上記制御部11はドライバ(図示
しない)により上記搬送路R等の搬送機構部(図示しな
い)を駆動することにより、搬送系全体の制御を行うよ
うになっている。上記認識部10は、図3に示すよう
に、領域検出部12と、文字行検出部13と、文字検出
部14と、郵便番号認識部15と、文字認識部16と、
街区文字認識部17と、宛名認識部18と、文字辞書部
19と、住所辞書部20とで構成されている。
Further, the control section 11 controls the entire transport system by driving a transport mechanism section (not shown) such as the transport path R by a driver (not shown). As shown in FIG. 3, the recognition unit 10 includes an area detection unit 12, a character line detection unit 13, a character detection unit 14, a zip code recognition unit 15, a character recognition unit 16,
It comprises a block character recognition unit 17, an address recognition unit 18, a character dictionary unit 19, and an address dictionary unit 20.

【0014】上記領域検出部12は、スキャナ部3から
供給される画像から、領域の形、位置等で、宛名、郵便
番号が記載されている領域を検出する。上記文字行検出
部13は、領域検出部12により検出された領域内の宛
名、郵便番号が記載されている文字行を検出する。領域
検出部12により検出された領域内の画像データからあ
て名行を検出するものである。
The area detecting section 12 detects an area in which an address and a zip code are described in an image supplied from the scanner section 3 in the form, position, and the like of the area. The character line detection unit 13 detects a character line in which an address and a postal code are described in the area detected by the area detection unit 12. The address line is detected from the image data in the area detected by the area detection unit 12.

【0015】この文字行検出部13は、領域検出部12
により検出された領域内の画像より、スタンプ、郵便番
号枠、広告文などを検出し、それらを除去した後、文字
の配置などから行を検出し、その行の大きさ、配置など
から住所もしくは郵便番号行らしい行に優先度をつけ、
その優先度の高い候補から順々に検出結果として出力す
るものである。
The character line detecting section 13 includes the area detecting section 12
Detects stamps, postal code frames, advertising texts, etc. from the image in the area detected by, removes them, detects the line from the arrangement of characters, etc., and determines the address or Prioritize lines that look like zip codes,
The detection results are output in order from the candidate with the highest priority.

【0016】上記文字検出部14は、文字行検出部13
により検出された文字行の文字を1文字ずつ検出切出し
する、つまり住所(郵便番号)に対応する文字情報を検
出切出しする。上記郵便番号認識部15は、文字検出部
14から供給されるつまり検出切出された文字(郵便番
号)を文字辞書部19に記憶されている文字データ(数
字データ:数字に対応する標準パターン)と照合して郵
便番号を認識する。上記郵便番号認識部15における郵
便番号の認識方法および認識手段は、後で詳細に説明す
る。
The character detecting section 14 includes a character line detecting section 13.
The character of the character line detected by is detected and extracted one by one, that is, character information corresponding to the address (postal code) is detected and extracted. The postal code recognizing unit 15 converts the character (postal code) detected or cut out from the character detecting unit 14 into character data (numerical data: a standard pattern corresponding to a numeral) stored in the character dictionary unit 19. To recognize the postal code. The postal code recognizing method and the recognizing means in the postal code recognizing section 15 will be described later in detail.

【0017】上記文字認識部16は、文字検出部14か
ら供給されるつまり検出切出された文字を文字辞書部1
9に記憶されている文字データと照合して文字を認識す
る。同様に、街区文字認識部17も、文字検出部14か
ら供給されるつまり検出切出された文字を文字辞書部1
9に記憶されている文字データと照合して街区の文字を
認識する。宛名認識部18は、文字検出部14から供給
されるつまり検出切出された文字を住所辞書部20に記
憶されている住所データと照合して宛名を認識する。
The character recognition unit 16 converts the characters supplied from the character detection unit 14, that is, the detected and extracted characters, into the character dictionary unit 1.
The character is recognized by comparing it with the character data stored in 9. Similarly, the block character recognition unit 17 also converts the characters supplied from the character detection unit 14, that is, the detected and extracted characters, into the character dictionary unit 1.
The character of the block is recognized by collating with the character data stored in 9. The address recognizing unit 18 recognizes the address by collating the character supplied from the character detecting unit 14, that is, the detected and extracted character with the address data stored in the address dictionary unit 20.

【0018】上記郵便番号認識部15からの郵便番号の
認識結果、文字認識部16からの文字の認識結果、街区
文字認識部17からの街区文字の認識結果、宛名認識部
18からの宛名の認識結果は、制御部11に供給されて
いる。この制御部11は、供給されている各認識結果に
より宛名を判別し、この判別した宛名に対する区分指定
データつまり区分部5における収納ポケット6a、…を
示すデータを出力するものである。
The postal code recognition result from the postal code recognition unit 15, the character recognition result from the character recognition unit 16, the block character recognition result from the block character recognition unit 17, and the address recognition from the address recognition unit 18. The result is supplied to the control unit 11. The control unit 11 discriminates the address based on the supplied recognition results, and outputs section designation data corresponding to the discriminated address, that is, data indicating the storage pockets 6a,.

【0019】図4は、上記郵便番号認識部15の構成を
詳細に示すものである。すなわち、文字検出部14から
供給される文字検出切り出し候補の文字パターンは、複
合類似度認識部31および構造特徴マッチング認識部3
2にそれぞれ送られる。複合類似度認識部31は、供給
される文字パターンと複合類似度辞書31aの標準パタ
ーンとの比較演算により複合類似度演算を行うことによ
り認識処理を行い、その認識結果は上位候補の複合類似
度のみを残し、複合類似度評価部33に送られる。複合
類似度辞書31aは1つの文字種に対し複数のエントリ
文字が存在するので、エントリ文字毎に異なった類似度
を持つ。複合類似度評価部33では、類似度の分布によ
り、予め統計的に予測されたしきい値によって、類似度
信頼度と呼ばれる評価値を算出し、この算出した評価値
の上位3候補までを認識結果として決定する。
FIG. 4 shows the configuration of the postal code recognition section 15 in detail. That is, the character pattern of the character detection cutout candidate supplied from the character detection unit 14 is composed of the composite similarity recognition unit 31 and the structural feature matching recognition unit 3.
2 respectively. The composite similarity recognizing unit 31 performs a recognition process by performing a composite similarity operation by performing a comparison operation between a supplied character pattern and a standard pattern of the composite similarity dictionary 31a, and the recognition result is a composite similarity of a top candidate. , And are sent to the composite similarity evaluation unit 33. Since there are a plurality of entry characters for one character type in the composite similarity dictionary 31a, each entry character has a different similarity. The composite similarity evaluation section 33 calculates an evaluation value called a similarity reliability based on a threshold value statistically predicted in advance based on the distribution of the similarity, and recognizes up to the top three candidates of the calculated evaluation value. Determine as a result.

【0020】構造特徴マッチング認識部32は、供給さ
れる文字パターンの輪郭構造を演算し、その輪郭構造特
徴をセグメントと呼ばれる文字構成要素に分解する。構
造特徴マッチング認識部32は、セグメントは方向コー
ドや長さの情報からなり、そのセグメントの接続条件か
ら、構造の認識を行う。構造特徴マッチング認識部32
は、構造特徴マッチング辞書32aの遷移を行い、構造
特徴がマッチしたものが構造特徴マッチング評価部34
に送られる。構造特徴マッチング辞書32aは1つの文
字種に対し複数のエントリ文字が存在し、そのそれぞれ
が文字の形状を反映している。どのエントリ文字に対し
て構造特徴がマッチしたかという情報も同時に構造特徴
マッチング評価部34に送られる。構造特徴マッチング
評価部34は、文字の詳細な特徴を再評価し、認識結果
を3候補まで決定する。
The structural feature matching recognition unit 32 calculates the outline structure of the supplied character pattern and decomposes the outline structure characteristic into character components called segments. The structure feature matching recognition unit 32 recognizes the structure from the connection condition of the segment, and the segment includes information on the direction code and the length. Structural feature matching recognition unit 32
Performs a transition of the structural feature matching dictionary 32a, and a structural feature matching evaluator 34
Sent to The structure feature matching dictionary 32a has a plurality of entry characters for one character type, each of which reflects the shape of the character. Information on which entry character the structural feature matched is also sent to the structural feature matching evaluation unit 34 at the same time. The structural feature matching evaluation unit 34 re-evaluates the detailed characteristics of the character and determines up to three candidates for the recognition result.

【0021】複合類似度評価部33および構造特徴マッ
チング評価部34の各認識結果は、それぞれ総合評価部
35に送られ、この総合評価部35で供給される文字パ
ターンに対する答えと総合評価値を決定する。総合評価
部35では、図5に示す、出現率評価テーブル(第1の
記憶手段)41を用いて、各桁ごとの出現率を求め、図
6に示す、結合テーブル(第2の記憶手段)42を用い
て、調整パターン番号を選択し、図7に示す、レベル選
択テーブル(第3の記憶手段)43を用いて、頻度レベ
ルを選択し、図8に示す、レベルテーブル(第4の記憶
手段)44を用いて、評価値の算出をする。(統計情報
を利用したこのような評価値出力の方法を、以下、自動
調整処理と記述する。)総合評価部35の評価結果は、
郵便番号編集部36に送られ、ここで7桁の最終的な郵
便番号候補が出力される。
Recognition results of the composite similarity evaluation section 33 and the structural feature matching evaluation section 34 are sent to the overall evaluation section 35, and the answer to the character pattern supplied by the overall evaluation section 35 and the overall evaluation value are determined. I do. The overall evaluation unit 35 obtains an appearance rate for each digit by using the appearance rate evaluation table (first storage means) 41 shown in FIG. 5, and obtains a connection table (second storage means) shown in FIG. 42, an adjustment pattern number is selected, and a frequency level is selected using a level selection table (third storage unit) 43 shown in FIG. 7, and a level table (fourth storage) shown in FIG. (Means) 44 to calculate an evaluation value. (Hereinafter, such a method of outputting an evaluation value using statistical information is referred to as an automatic adjustment process.) The evaluation result of the comprehensive evaluation unit 35 is as follows.
The postal code is sent to the postal code editing section 36, where the final seven-digit postal code candidate is output.

【0022】出現率評価テーブル41は、図5に示すよ
うに、各桁ごとの各文字の出現率からなり、たとえば、
1桁目の出現率として、1の出現率が89%、2の出現
率が11%、他の数字の出現率が0%となっている。ま
た、1桁目が1の際の2桁目の出現率として、0の出現
率が67%、1の出現率が18%、2の出現率が15
%、他の数字の出現率が0%となっている。また、1桁
目が2の際の2桁目の出現率として、0の出現率が10
0%、他の数字の出現率が0%となっている。
The appearance rate evaluation table 41, as shown in FIG. 5, includes the appearance rate of each character for each digit.
As the first digit appearance rate, the appearance rate of 1 is 89%, the appearance rate of 2 is 11%, and the appearance rates of other numbers are 0%. As the second digit appearance rate when the first digit is 1, the appearance rate of 0 is 67%, the appearance rate of 1 is 18%, and the appearance rate of 2 is 15
% And the appearance rate of other numbers is 0%. When the first digit is 2, the appearance rate of 0 is 10
0%, the appearance rate of other numbers is 0%.

【0023】出現率評価テーブル41は、後述するよう
に、あらかじめ収集された郵便番号データの統計情報に
より作成される。結合テーブル42は、図6に示すよう
に、構造特徴マッチングの文字(認識結果)とエントリ
(マッチング用の比較する文字の形状の違いにより区別
されている)と複合類似度の文字(認識結果)とエント
リ(複合類似度用の比較する文字パターンの違いにより
区別されている)との組合わせと、誤読される可能性の
高い文字(相手文字)、相手の文字の条件(相手文字の
出現率)、自分の条件(認識文字の出現率−相手文字の
出現率=出現率差)に対する調整パターン番号が登録さ
れている。
As will be described later, the appearance rate evaluation table 41 is created based on statistical information of postal code data collected in advance. As shown in FIG. 6, the combination table 42 includes characters (recognition results) for structural feature matching, entries (identified by differences in the shapes of characters to be compared for matching), and characters of complex similarity (recognition results). And the entry (identified by the difference in the character pattern to be compared for the composite similarity), the character that is likely to be misread (the other character), the condition of the other character (the appearance rate of the other character) ), And an adjustment pattern number for its own condition (appearance rate of recognized character−appearance rate of partner character = appearance rate difference) is registered.

【0024】たとえば、構造特徴マッチングの文字が
「0」でエントリが「1」、複合類似度の文字が「0」
でエントリが「1」、相手文字が「6」の場合、相手の
条件として出現率が「5」よりも大きく、自分の条件と
して出現率差が「6」よりも大きい際に、調整パターン
番号「5」が選択されるようになっている。
For example, the character of the structural feature matching is "0", the entry is "1", and the character of the composite similarity is "0".
When the entry is “1” and the other party character is “6”, the adjustment pattern number is set when the appearance rate is larger than “5” as the other party's condition and the appearance rate difference is larger than “6” as one's own condition. "5" is selected.

【0025】また、構造特徴マッチングの文字が「0」
でエントリが「1」、複合類似度の文字が「0」でエン
トリが「1」、相手文字が「8」の場合、相手の条件と
して出現率が「5」よりも大きい際に、調整パターン番
号「2」が選択されるようになっている。
The character of the structural feature matching is "0".
When the entry is “1”, the character of the composite similarity is “0”, the entry is “1”, and the partner character is “8”, the adjustment pattern is set when the appearance rate is larger than “5” as the partner condition. The number "2" is selected.

【0026】また、構造特徴マッチングの文字が「0」
でエントリが「1」、複合類似度の文字が「0」でエン
トリが「1」、相手文字が「8」の場合、相手の条件と
して出現率が「6」よりも小さく、自分の条件として出
現率差が「20」よりも大きい際に、調整パターン番号
「3」が選択されるようになっている。
The character of the structural feature matching is "0".
If the entry is “1”, the character of the composite similarity is “0”, the entry is “1”, and the partner character is “8”, the appearance rate is smaller than “6” as the partner condition, and When the difference between the appearance rates is larger than “20”, the adjustment pattern number “3” is selected.

【0027】また、構造特徴マッチングの文字が「0」
でエントリが「1」、複合類似度の文字が「0」でエン
トリが「1」で、相手文字、相手の条件、自分の条件が
上記以外の際に、調整パターン番号「10」が選択され
るようになっている。また、構造特徴マッチングの文字
が「0」でエントリが「2」、複合類似度の文字が
「0」でエントリが「*:1以外」、相手文字が「6」
の場合、相手の条件として出現率が「6」よりも小さ
く、自分の条件として出現率差が「10」よりも小さい
際に、調整パターン番号「1」が選択されるようになっ
ている。
The character of the structural feature matching is "0".
When the entry is “1”, the character of the composite similarity is “0”, the entry is “1”, and the other party character, the other party's condition, and the own condition are other than the above, the adjustment pattern number “10” is selected. It has become so. Further, the character of the structural feature matching is “0” and the entry is “2”, the character of the composite similarity is “0”, the entry is “other than **”, and the partner character is “6”.
In the case of, the adjustment pattern number "1" is selected when the appearance rate is smaller than "6" as the condition of the other party and the difference in appearance rate is smaller than "10" as the own condition.

【0028】レベル選択テーブル43は、図7に示すよ
うに、構造特徴マッチングの認識結果の出現率によっ
て、強強化、強化、標準、弱化、弱弱化の5段階の頻度
レベルを定めている。このレベル選択テーブル43で
は、構造特徴マッチングの文字(認識結果)のエントリ
(マッチング用の比較する文字の形状の違いにより区別
されている)ごとに、各レベルの間の閾値を設定してい
る。
As shown in FIG. 7, the level selection table 43 defines five frequency levels of strong strengthening, strengthening, standard, weakening, and weakening according to the appearance rate of the recognition result of the structural feature matching. In the level selection table 43, a threshold between the levels is set for each entry of the character (recognition result) of the structural feature matching (identified by the difference in the shape of the character to be compared for matching).

【0029】たとえば、構造特徴マッチングの文字が
「0」でエントリが「0」の場合、強強化と強化を区別
する閾値が「20」で、強化と標準を区別する閾値が
「10」で、標準と弱化を区別する閾値が「5」で、弱
化と弱弱化を区別する閾値が「2」である。
For example, if the character of the structural feature matching is "0" and the entry is "0", the threshold for distinguishing between strong reinforcement and reinforcement is "20", the threshold for distinguishing reinforcement from standard is "10", The threshold for distinguishing between normal and weakening is “5”, and the threshold for distinguishing between weakening and weakening is “2”.

【0030】また、構造特徴マッチングの文字が「0」
でエントリが「1」の場合、強強化と強化を区別する閾
値が「25」で、強化と標準を区別する閾値が「15」
で、標準と弱化を区別する閾値が「10」で、弱化と弱
弱化を区別する閾値が「5」である。レベルテーブル4
4は、図8に示すように、調整パターン番号と頻度レベ
ルと複合類似度の信頼度とに基づいて、評価値が登録さ
れている。
The character of the structural feature matching is "0".
And the entry is “1”, the threshold for distinguishing between strong enhancement and reinforcement is “25”, and the threshold for distinguishing between reinforcement and standard is “15”
The threshold for distinguishing between the standard and the weakening is “10”, and the threshold for distinguishing between the weakening and the weakening is “5”. Level table 4
4, evaluation values are registered based on the adjustment pattern number, the frequency level, and the reliability of the composite similarity, as shown in FIG.

【0031】たとえば、調整パターン番号「1」の、頻
度レベルが強強化で複合類似度の信頼度が「0」、
「1」、「2」、「3」に対して、それぞれ評価値
「2」、「4」、「4」、「5」が対応して記憶され、
調整パターン番号「1」の、頻度レベルが強化で複合類
似度の信頼度が「0」、「1」、「2」、「3」に対し
て、それぞれ評価値「2」、「3」、「4」、「5」が
対応して記憶され、調整パターン番号「1」の、頻度レ
ベルが標準で複合類似度の信頼度が「0」、「1」、
「2」、「3」に対して、それぞれ評価値「1」、
「3」、「4」、「5」が対応して記憶され、調整パタ
ーン番号「1」の、頻度レベルが弱化で複合類似度の信
頼度が「0」、「1」、「2」、「3」に対して、それ
ぞれ評価値「1」、「3」、「4」、「4」が対応して
記憶され、調整パターン番号「1」の、頻度レベルが弱
弱化で複合類似度の信頼度が「0」、「1」、「2」、
「3」に対して、それぞれ評価値「1」、「2」、
「3」、「4」が対応して記憶される。
For example, for the adjustment pattern number “1”, the frequency level is strongly enhanced and the reliability of the composite similarity is “0”;
Evaluation values “2”, “4”, “4”, and “5” are stored corresponding to “1”, “2”, and “3”, respectively.
For the adjustment pattern number “1”, the evaluation level “2”, “3”, “3” for the frequency level is enhanced and the reliability of the composite similarity is “0”, “1”, “2”, “3”, respectively. “4” and “5” are stored correspondingly, and the frequency of the adjustment pattern number “1” is standard and the reliability of the composite similarity is “0”, “1”,
For “2” and “3”, the evaluation value “1”,
“3”, “4”, and “5” are stored correspondingly, and the frequency of the adjustment pattern number “1” is weakened and the reliability of the composite similarity is “0”, “1”, “2”, For “3”, the evaluation values “1”, “3”, “4”, and “4” are respectively stored, and the frequency level of the adjustment pattern number “1” is weakened and the composite similarity If the reliability is "0", "1", "2",
For “3”, the evaluation values “1”, “2”,
“3” and “4” are stored correspondingly.

【0032】また、調整パターン番号「2」の、頻度レ
ベルが強強化で複合類似度の信頼度が「0」、「1」、
「2」、「3」に対して、それぞれ評価値「2」、
「4」、「4」、「5」が対応して記憶され、調整パタ
ーン番号「2」の、頻度レベルが強化で複合類似度の信
頼度が「0」、「1」、「2」、「3」に対して、それ
ぞれ評価値「2」、「3」、「5」、「5」が対応して
記憶され、調整パターン番号「2」の、頻度レベルが標
準で複合類似度の信頼度が「0」、「1」、「2」、
「3」に対して、それぞれ評価値「2」、「3」、
「4」、「5」が対応して記憶され、調整パターン番号
「2」の、頻度レベルが弱化で複合類似度の信頼度が
「0」、「1」、「2」、「3」に対して、それぞれ評
価値「1」、「3」、「4」、「5」が対応して記憶さ
れ、調整パターン番号「2」の、頻度レベルが弱弱化で
複合類似度の信頼度が「0」、「1」、「2」、「3」
に対して、それぞれ評価値「1」、「3」、「4」、
「4」が対応して記憶される。
Further, the frequency level of the adjustment pattern number “2” is strongly enhanced and the reliability of the composite similarity is “0”, “1”,
For “2” and “3”, the evaluation value “2”,
“4”, “4”, and “5” are stored correspondingly, and the frequency level of the adjustment pattern number “2” is enhanced and the reliability of the composite similarity is “0”, “1”, “2”, For “3”, the evaluation values “2”, “3”, “5”, and “5” are stored correspondingly, and the frequency of the adjustment pattern number “2” is standard and the reliability of the composite similarity is standard. Degrees are "0", "1", "2",
For “3”, the evaluation values “2”, “3”,
“4” and “5” are stored correspondingly, and the frequency level of the adjustment pattern number “2” is weakened and the reliability of the composite similarity is “0”, “1”, “2”, and “3”. On the other hand, the evaluation values “1”, “3”, “4”, and “5” are stored correspondingly, and the frequency of the adjustment pattern number “2” is weakened and the reliability of the composite similarity is “ "0", "1", "2", "3"
, The evaluation values “1”, “3”, “4”,
“4” is stored correspondingly.

【0033】また、調整パターン番号「3」の、頻度レ
ベルが強強化で複合類似度の信頼度が「0」、「1」、
「2」、「3」に対して、それぞれ評価値「3」、
「5」、「6」、「6」が対応して記憶され、調整パタ
ーン番号「3」の、頻度レベルが強化で複合類似度の信
頼度が「0」、「1」、「2」、「3」に対して、それ
ぞれ評価値「3」、「4」、「6」、「6」が対応して
記憶され、調整パターン番号「3」の、頻度レベルが標
準で複合類似度の信頼度が「0」、「1」、「2」、
「3」に対して、それぞれ評価値「3」、「4」、
「5」、「6」が対応して記憶され、調整パターン番号
「3」の、頻度レベルが弱化で複合類似度の信頼度が
「0」、「1」、「2」、「3」に対して、それぞれ評
価値「2」、「4」、「5」、「6」が対応して記憶さ
れ、調整パターン番号「3」の、頻度レベルが弱弱化で
複合類似度の信頼度が「0」、「1」、「2」、「3」
に対して、それぞれ評価値「2」、「4」、「5」、
「5」が対応して記憶される。
The frequency level of the adjustment pattern number “3” is strongly enhanced and the reliability of the composite similarity is “0”, “1”,
For “2” and “3”, the evaluation value “3”,
“5”, “6”, and “6” are stored correspondingly, and the frequency level of the adjustment pattern number “3” is enhanced and the reliability of the composite similarity is “0”, “1”, “2”, The evaluation values “3”, “4”, “6”, and “6” are stored in correspondence with “3”, and the frequency of the adjustment pattern number “3” is standard and the reliability of the composite similarity is standard. Degrees are "0", "1", "2",
For “3”, the evaluation values “3”, “4”,
“5” and “6” are stored correspondingly, and the frequency level of the adjustment pattern number “3” is weakened and the reliability of the composite similarity is “0”, “1”, “2”, and “3”. On the other hand, the evaluation values “2”, “4”, “5”, and “6” are stored correspondingly, and the frequency of the adjustment pattern number “3” is weakened and the reliability of the composite similarity is “ "0", "1", "2", "3"
, The evaluation values “2”, “4”, “5”,
“5” is stored correspondingly.

【0034】次に、上記構成において、図9に示すフロ
ーチャートを参照しつつ、自動調整処理を説明する。た
とえば、具体例として、郵便番号「100−0001」
の2桁目「0」の評価値を自動調整処理により求める手
順を示す。入力データとして、以下のデータが与えられ
たとする。簡単のため、以下では、複合類似度の認識結
果、構造特徴マッチングの認識結果が共に、例えば文字
が「0」でエントリ1の場合、“0−1”と記述する。
Next, the automatic adjustment processing in the above configuration will be described with reference to the flowchart shown in FIG. For example, as a specific example, zip code “100-0001”
The procedure for obtaining the evaluation value of the second digit “0” of the above by the automatic adjustment processing is shown. It is assumed that the following data is given as input data. For simplicity, hereinafter, both the recognition result of the composite similarity and the recognition result of the structural feature matching are described as “0-1” when the character is “0” and the entry is 1, for example.

【0035】 (例1) 2桁目情報: 複合類似度の認識結果:0−1(3);括弧内は信頼度 6−2(2) 構造特徴マッチングの認識結果:0−1 8−1 前文字列情報(ここでは1桁目の評価結果): 候補「1」の評価値3 候補「2」の評価値1 総合評価では、複合類似度の認識結果と構造特徴マッチ
ングの認識結果の全組み合わせについてそれぞれ評価値
を算出し、その上位2候補を、それまでの前文字列に対
する答えとする。具体的には、(例1)の場合、前文字
列が「1」「2」の場合についてそれぞれ (複合類似度の認識結果、構造特徴マッチングの認識結
果)=(0−1,0−1)、(0−1,8−1)、(6
−2,0−1)、(6−2,8−1)、(0−1,
×)、(6−1,×)、(×,0−1)、(×,8−
1) の全組み合わせ(×は、候補がない状態)について、以
下で示す第22〜第25のステップの操作を行ってそれ
ぞれの総合評価値を算出し、評価値の高い方から1候補
または2候補(候補数の選択の詳細は、第26のステッ
プを参照)を、その前文字列候補に対する答えとして採
用する。
(Example 1) Second digit information: Recognition result of compound similarity: 0-1 (3); reliability in parentheses 6-2 (2) Recognition result of structural feature matching: 0-1 8-1 Previous character string information (here, evaluation result of the first digit): evaluation value of candidate “1” 3 evaluation value of candidate “2” 1 In the comprehensive evaluation, all of the recognition result of the composite similarity and the recognition result of the structural feature matching An evaluation value is calculated for each combination, and the top two candidates are used as answers to the previous character string. Specifically, in the case of (Example 1), when the previous character string is “1” or “2”, (result of recognition of composite similarity, result of recognition of structural feature matching) = (0-1, 0-1) ), (0-1,8-1), (6
−2, 0-1), (6-2, 8-1), (0-1,
×), (6-1, ×), (×, 0-1), (×, 8-
For all combinations (1), (x indicates no candidate), the following 22nd to 25th steps are performed to calculate respective comprehensive evaluation values, and one candidate or 2 is selected from the higher evaluation value. A candidate (for details of selecting the number of candidates, see the 26th step) is adopted as an answer to the preceding character string candidate.

【0036】尚、第22〜第25のステップでは、前文
字列が「1」で、(複合類似度の認識結果、構造特徴マ
ッチングの認識結果)=(0−1,0−1)の場合を例
に挙げて説明する。
In the twenty-second to twenty-fifth steps, if the preceding character string is "1" and (the recognition result of the composite similarity, the recognition result of the structural feature matching) = (0-1, 0-1) Will be described as an example.

【0037】第22のステップでは、文字の出現率を求
める。図5を用いて説明する。出現率評価テーブル41
には、各桁での文字の出現率が、前文字列候補に依存す
る形で設定されている。図5は、1桁目と2桁目の出現
率評価テーブル41の例である。この場合、2桁目に
「0」が出る確率は、1桁目の文字が「1」のときは6
7%であるが、1桁目の文字が「2」の時は100%と
なることを示す。同様に、1桁目の文字が「1」のと
き、2桁目で「1」が出る確率は18%、「2」が出る
確率は15%、その他は0%であることが求められる。
自動調整処理では、ある桁の出現率を求める場合、前文
字列と現在評価する桁の構造特徴マッチングの認識結果
とを用いて出現率評価表としての出現率評価テーブル4
1を探索する。
In the twenty-second step, the appearance rate of characters is determined. This will be described with reference to FIG. Appearance rate evaluation table 41
, The appearance rate of the character at each digit is set in a manner that depends on the preceding character string candidate. FIG. 5 shows an example of the first and second digit appearance rate evaluation tables 41. In this case, the probability that “0” appears in the second digit is 6 when the character in the first digit is “1”.
7%, but when the first digit is “2”, it indicates 100%. Similarly, when the first digit is “1”, the probability that “1” appears in the second digit is 18%, the probability that “2” appears is 15%, and the others are 0%.
In the automatic adjustment processing, when the appearance rate of a certain digit is obtained, the appearance rate evaluation table 4 as an appearance rate evaluation table using the previous character string and the recognition result of the structural feature matching of the currently evaluated digit is used.
Search for 1.

【0038】(例1)の場合、1桁目候補が「1」で、
2桁目の構造特徴マッチング候補は「0」「8」であ
る。よって、「0」の出現率67%が得られる。次に、
処理する桁をN桁目(1≦N≦7)、構造特徴マッチン
グの認識結果をCN、前文字列C1、C2…CN−1=
Cnとした場合の出現率の求め方について、図10に示
すフローチャートを参照しつつ説明する。
In the case of (Example 1), the first digit candidate is “1”, and
The second digit structural feature matching candidates are “0” and “8”. Therefore, an appearance rate of “0” of 67% is obtained. next,
The digit to be processed is the Nth digit (1 ≦ N ≦ 7), the recognition result of the structural feature matching is CN, and the preceding character strings C1, C2,.
How to determine the appearance rate when Cn is set will be described with reference to the flowchart shown in FIG.

【0039】すなわち、N桁目の出現率を求める場合、
nを1に設定し(ST31)、nがNと一致するかチェ
ックし(ST32)、一致する場合、1桁目の出現率評
価テーブル41から構造特徴マッチングの認識結果CN
の出現率(A1)を得る(ST35)。
That is, when calculating the appearance rate of the Nth digit,
n is set to 1 (ST31), and it is checked whether or not n matches N (ST32). If it matches, the recognition result CN of the structural feature matching is obtained from the first digit appearance rate evaluation table 41.
Is obtained (A1) (ST35).

【0040】上記ステップ32のチェックの結果、一致
しない場合、1桁目の出現率評価値により次桁へのポイ
ンタを求め(ST33)、nに1を加算し(n++)
(ST34)、ステップ32に戻る。このステップ32
のチェックの結果、一致する場合、上記ステップ35に
進み、N桁目の出現率評価テーブル41から構造特徴マ
ッチングの認識結果CNの出現率(A1)を得、一致し
ない場合、上記ステップ33に進む。
As a result of the check at the step 32, if they do not match, a pointer to the next digit is obtained from the appearance rate evaluation value of the first digit (ST33), and 1 is added to n (n ++).
(ST34), returning to step 32. This step 32
As a result of the check, if the values match, the process proceeds to step 35, where the appearance rate (A1) of the recognition result CN of the structural feature matching is obtained from the Nth-digit appearance rate evaluation table 41, and if not, the process proceeds to step 33. .

【0041】第23のステップでは、図11のフローチ
ャートに示すように、調整パターン番号を求める。結合
テーブル42から、構造特徴マッチングの認識結果、複
合類似度の認識結果が一致する行を探し(ST41、4
2、50)、更に、「相手の条件」および「自分の条
件」を満たす(ST43〜47)最初の行(I)のパタ
ーン番号を調整パターン番号(A2)として出力する
(ST48)。
In the twenty-third step, an adjustment pattern number is determined as shown in the flowchart of FIG. From the joining table 42, a row is found in which the recognition result of the structural feature matching and the recognition result of the composite similarity match (ST41, ST4).
(2, 50) Further, the pattern number of the first row (I) satisfying the "other party's condition" and the "own condition" (ST43 to 47) is output as the adjustment pattern number (A2) (ST48).

【0042】最終行まで達した際、最終行のパターン番
号を調整パターン番号(A2)として出力する(ST4
9)。「相手文字」とは、誤読しやすいと想定される相
手の数字のことであり、これはシミュレーションや過去
の調整経験から得られる既知の情報から設定されてい
る。たとえば、構造特徴マッチングの認識結果で0−1
の結果が得られたパターンは「6」に誤読することが多
い、等といった情報が、結合テーブル42に盛り込まれ
ている。
When the pattern reaches the last line, the pattern number of the last line is output as the adjustment pattern number (A2) (ST4).
9). The “partner character” is a number of a partner that is assumed to be easily misread, and is set from known information obtained from a simulation or past adjustment experience. For example, in the recognition result of the structural feature matching, 0-1
Information that the pattern obtained as a result is often misread as "6" is included in the combination table 42.

【0043】例の場合、構造特徴マッチングの認識結果
が0−1、複合類似度の認識結果が0−1であり、この
時点では、図6の1行目から4行目が該当し、1行目か
ら順に条件が一致するかを検索する。 1行目:出現率評価表としての出現率評価テーブル41
より、現在の桁では「6」の出現率が0%であり、これ
は「相手の条件」に一致しない。
In the case of the example, the recognition result of the structural feature matching is 0-1, and the recognition result of the composite similarity is 0-1, and at this time, the first to fourth rows in FIG. Search for the conditions that match in order from the line. First line: Appearance rate evaluation table 41 as an appearance rate evaluation table
Therefore, in the current digit, the appearance rate of “6” is 0%, which does not match the “other party's condition”.

【0044】2行目:同様に、「8」の出現率は0%
で、「相手の条件」が一致しない。 3行目:相手の条件が(0<6)で一致し、自分の条件
が((67−0)>20)で一致し、この行が選ばれ
る。以上の結果、この例の場合、調整パターン番号3が
選ばれる。
Second line: Similarly, the appearance rate of “8” is 0%
And the "other party's conditions" do not match. Third line: This line is selected because the other party's condition matches with (0 <6) and the own condition matches with ((67-0)> 20). As a result, in this example, the adjustment pattern number 3 is selected.

【0045】第24のステップでは、頻度レベルを選択
する。構造特徴マッチングの認識結果の出現率によっ
て、強強化、強化、標準、弱化、弱弱化の5段階の頻度
レベルを定める。レベル選択テーブル43では、構造特
徴マッチングの認識結果のエントリ毎に、各レベルの間
の閾値を設定している。構造特徴マッチング法のエント
リが文字の特性を反映しているので、エントリの信頼性
の高低によって頻度レベルの出方をかえることが可能と
なる。
In the twenty-fourth step, a frequency level is selected. Five frequency levels of strong reinforcement, reinforcement, standard, weakening, and weakening are determined according to the appearance rate of the recognition result of the structural feature matching. In the level selection table 43, a threshold between each level is set for each entry of the recognition result of the structural feature matching. Since the entry of the structural feature matching method reflects the characteristics of the character, it is possible to change the frequency level depending on the reliability of the entry.

【0046】今、図7に示すレベル選択テーブル43が
与えられたとき、(例1)の場合では、第23のステッ
プで構造特徴マッチングの認識結果が0−1、出現率が
67%(>25%)が得られており、この頻度レベルは
強強化となる。
Now, when the level selection table 43 shown in FIG. 7 is given, in the case of (Example 1), in the twenty-third step, the recognition result of the structural feature matching is 0-1, and the appearance rate is 67% (>). 25%), and this frequency level is strongly enhanced.

【0047】次に、頻度レベルの選択について、図12
に示すフローチャートを参照しつつ説明する。すなわ
ち、構造特徴マッチングの認識結果としての文字とエン
トリと一致するものをレベル選択テーブル43の1行目
から順次チェックし(ST51、52、54、55)、
一致した場合に、出現率が強強化と強化の頻度レベルを
区別する閾値よりも大きい場合に(ST56)頻度レベ
ル(A3)を強強化と判別し(ST57)、出現率が強
化と標準の頻度レベルを区別する閾値よりも大きい場合
に(ST58)頻度レベル(A3)を強化と判別し(S
T59)、出現率が標準と弱化を区別する閾値よりも大
きい場合に(ST60)頻度レベル(A3)を標準と判
別し(ST61)、出現率が弱化と弱弱化を区別する閾
値よりも大きい場合に(ST62)頻度レベル(A3)
を弱化と判別し(ST63)、出現率が弱化と弱弱化を
区別する閾値よりも小さい場合に(ST62)頻度レベ
ル(A3)を弱弱化と判別する(ST64)。
Next, the selection of the frequency level will be described with reference to FIG.
This will be described with reference to the flowchart shown in FIG. That is, the character and the entry as the recognition result of the structural feature matching are sequentially checked from the first line of the level selection table 43 (ST51, 52, 54, 55).
In the case of coincidence, when the appearance rate is larger than a threshold value for distinguishing between the frequency level of strong reinforcement and the frequency level of reinforcement (ST56), the frequency level (A3) is determined to be strong reinforcement (ST57), and the frequency of appearance is strengthened and the frequency of standard When the frequency level is larger than the threshold for distinguishing the level (ST58), the frequency level (A3) is determined to be enhanced (S58).
T59), when the appearance rate is larger than the threshold for distinguishing between standard and weakened (ST60), the frequency level (A3) is determined to be standard (ST61), and when the appearance rate is larger than the threshold for distinguishing between weakened and weakened (ST62) Frequency level (A3)
Is determined to be weakened (ST63), and when the appearance rate is smaller than the threshold for distinguishing between weakened and weakened (ST62), the frequency level (A3) is determined to be weakened (ST64).

【0048】また、ステップ52により最後の行までチ
ェックしても不一致の際、例外処理として頻度レベル
(A3)を標準とする(ST53)第25のステップで
は、総合評価値を算出する。
If there is no match even if the last line is checked in step 52, the frequency level (A3) is standardized as an exception process (ST53). In the 25th step, a comprehensive evaluation value is calculated.

【0049】第23、第24のステップで求められた調
整パターン番号と頻度レベル、および、複合類似度の信
頼度を用いて、レベルテーブル44から評価値を選択す
る。図8に示すレベルテーブル44を用いた場合、(例
1)の場合では、複合類似度の認識結果が0−1
(3)、パターン番号3、頻度レベルが強強化であるか
ら、総合評価値は「6」となる。
An evaluation value is selected from the level table 44 using the adjustment pattern number and the frequency level obtained in the 23rd and 24th steps, and the reliability of the composite similarity. When the level table 44 shown in FIG. 8 is used, in the case of (Example 1), the recognition result of the composite similarity is 0-1.
(3) Since the pattern number 3 and the frequency level are strongly enhanced, the overall evaluation value is “6”.

【0050】次に、総合評価値の算出について、図13
に示すフローチャートを参照しつつ説明する。すなわ
ち、第23のステップで求められた調整パターン番号
(A2)と一致するものをレベルテーブル44の1行目
から順次チェックし(ST71、72、73、76)、
一致した場合に、第24のステップで求められた頻度レ
ベル(A3)と複合類似度の信頼度から総合評価値(A
4)を選択し、出力する(ST74)。
Next, the calculation of the total evaluation value will be described with reference to FIG.
This will be described with reference to the flowchart shown in FIG. That is, ones that match the adjustment pattern number (A2) obtained in the twenty-third step are sequentially checked from the first row of the level table 44 (ST71, 72, 73, 76),
If they match, the comprehensive evaluation value (A) is obtained from the frequency level (A3) obtained in the twenty-fourth step and the reliability of the composite similarity.
4) is selected and output (ST74).

【0051】また、ステップ72により最後の行(I)
までチェックしても不一致の際、例外処理として総合評
価値「0」(A4=0)を出力する(ST75)。
In step 72, the last line (I)
If they do not match, the overall evaluation value "0" (A4 = 0) is output as exception processing (ST75).

【0052】第26のステップでは全ての前文字列に対
して総合評価処理を行う。同じ複合類似度の認識結果と
構造特徴マッチングの認識結果が入力されても、前文字
列候補によって総合評価値は変化する可能性がある。
(例1)の場合、前文字列「1」について全ての複合類
似度の認識結果、構造特徴マッチングの認識結果の組み
合わせで評価を行った後、前文字列「2」の場合につい
て、同様に総合評価を行う(ST27からST29、S
T22からST26)。
In the twenty-sixth step, a comprehensive evaluation process is performed on all preceding character strings. Even if the recognition result of the same composite similarity and the recognition result of the structural feature matching are input, the overall evaluation value may change depending on the preceding character string candidate.
In the case of (Example 1), after evaluating the combination of the recognition result of all the composite similarities and the recognition result of the structural feature matching for the previous character string “1”, the same applies to the case of the previous character string “2”. Perform comprehensive evaluation (ST27 to ST29, S
T22 to ST26).

【0053】結果的に、7桁目まで上記総合評価を行う
と(ST27)、複数の郵便番号候補が得られる。各桁
で求められた総合評価値を候補ごとにそれぞれ加算し、
それを郵便番号候補の総合評価点とする(ST13)。
この総合評価点の高いものを上位2候補選択し、最終結
果とする(ST14)。
As a result, when the above-described comprehensive evaluation is performed up to the seventh digit (ST27), a plurality of postal code candidates are obtained. The total evaluation value obtained for each digit is added for each candidate,
This is set as the comprehensive evaluation point of the postal code candidate (ST13).
The top two candidates with the higher total evaluation score are selected as the final result (ST14).

【0054】以上のような総合評価算出操作を単純に行
い、存在する前文字列に対して各桁で総合評価点の高い
ほうから第2位までを選んで処理すると、例えば3桁目
までで、図14に示すような2分木の形となる(括弧内
の数字は総合評価点)。この結果、4桁目の総合評価で
は、8種の前文字列候補が存在する。
When the above-described overall evaluation calculation operation is simply performed, and the preceding character string that is present is selected and processed from the highest overall evaluation point in each digit to the second place, for example, up to the third digit 14 (the number in parentheses is the overall evaluation score). As a result, in the fourth digit comprehensive evaluation, there are eight types of preceding character string candidates.

【0055】以上の操作を7桁まで行った場合、得られ
る候補は128通りであり、各桁ごとでの総合評価を行
う回数の総和は127回、しかも、その127回のそれ
ぞれで複合類似度の認識結果と構造特徴マッチングの認
識結果の全ての組み合わせを評価することになり、計算
量が膨大なものとなる。そこで、以下のようなルールで
計算量を削減することもできる。
When the above operation is performed up to 7 digits, 128 candidates are obtained, and the total number of times of performing the comprehensive evaluation for each digit is 127 times. In this case, all combinations of the recognition result of the structural feature matching and the recognition result of the structural feature matching are evaluated, and the amount of calculation becomes enormous. Therefore, the amount of calculation can be reduced by the following rules.

【0056】1.1桁目は2候補までを選択。 2.2桁目以降では、図14に示した2分木のうち、総
合評価点の高い方のノードに接続するものだけ2候補選
択し、他ノードでは1候補のみ選択する。この操作で第
3桁目まで総合評価を行った場合、図15のようにな
り、4桁目では、前文字列候補4個に対して総合評価を
行う。この方法で7桁目まで処理した場合、最終的な候
補は8候補まで絞られる。この8候補の中で、各桁毎の
評価点の総和が最も高いものを順に2位まで選択し、最
終的な郵便番号候補とする。
The first digit selects up to two candidates. 2. In the second and subsequent digits, two candidates are selected from the binary tree shown in FIG. 14 only for those connected to the node having the higher total evaluation score, and only one candidate is selected for other nodes. When the comprehensive evaluation is performed up to the third digit by this operation, the result is as shown in FIG. 15, and in the fourth digit, the comprehensive evaluation is performed on the four preceding character string candidates. When processing is performed up to the seventh digit by this method, the final candidates are narrowed down to eight candidates. Of the eight candidates, the one with the highest sum of the evaluation points for each digit is sequentially selected up to the second place, and is set as the final postal code candidate.

【0057】なお、上記実施例では、文字認識の手法に
ついて複合類似度法と構造特徴マッチング法の2つの認
識手法に適用した場合について説明したが、本発明はこ
れに限定されるものでなく、たとえば、一方もしくは両
方の認識手法を別の手法に置き換えた場合にも同様に適
用できる。また、認識手法が1種類である場合にも同様
に適用できる。
In the above embodiment, the case where the character recognition method is applied to the two recognition methods of the composite similarity method and the structural feature matching method has been described. However, the present invention is not limited to this. For example, the same can be applied to a case where one or both recognition methods are replaced with another method. In addition, the present invention can be similarly applied to a case where there is only one recognition method.

【0058】さらに、使用するテーブル類もこれに限定
されるものでない。上記実施例では、経験やシミュレー
ションなどによって得られた既知の誤読情報を、テーブ
ルに反映させるための方法について説明したが、より単
純に頻度を反映させるためには、たとえば、認識結果か
ら得られた類似度に出現率をかけたものを総合評価値と
する、などといった方法も考えられる。
Further, the tables used are not limited to these. In the above-described embodiment, a method for reflecting known misread information obtained by experience, simulation, or the like in the table has been described. However, in order to more simply reflect the frequency, for example, a method obtained from a recognition result is used. A method of multiplying the similarity by the appearance rate to obtain an overall evaluation value is also conceivable.

【0059】次に、出現率の求め方について説明する。
出現率評価表としての出現率評価テーブル41は、各桁
での0〜9の出現頻度が、前文序列に依存した形で設定
されたファイルであり、図16に示すような、稼働情報
ファイル11aから作成する。この上記制御部11内に
存在し、実際に区分機1で処理した(認識した)郵便番
号とその通数を集計して保存したものである。
Next, a method of obtaining the appearance rate will be described.
The appearance rate evaluation table 41 as an appearance rate evaluation table is a file in which the appearance frequencies of 0 to 9 in each digit are set in a form depending on the preamble, and the operation information file 11a as shown in FIG. Create from. The postal code present in the control unit 11 and actually processed (recognized) by the sorting machine 1 and the number of the postal code are totaled and stored.

【0060】上記稼働情報ファイル11aは郵便局毎の
複数台の区分機を管理する機器に存在し、実際に各区分
機で処理した(認識した)郵便番号とその通数を集計し
て保存したものであっても良い。従来は作業者が経験的
に捉えていた文字の出現率が、実際の機械から得られた
統計的な情報に置き換えられ、より正確に文字認識処理
に反映することができる。
The operation information file 11a exists in a device that manages a plurality of sorting machines for each post office, and is a file in which the postal codes actually processed (recognized) by each of the sorting machines and the number of passes thereof are totaled and stored. It may be. In the past, the appearance rate of characters, which was conventionally empirically captured by the operator, is replaced with statistical information obtained from an actual machine, and can be more accurately reflected in character recognition processing.

【0061】以下、作成手順を示す。 (1)1桁目の文字毎の数と総数を求める。(総数が少
ない場合は、*で代用する。) (2)文字種毎の数を総数で割り、割合を求める。(1
桁目の場合、「1」が89%、「2」が11%) (3)1桁目が同じ文字のグループに関して、2桁目の
文字毎の数と総数を求め、割合を求める。(1桁目
「1」の場合、図16の1〜5行目を集計し割合「0」
67%、「1」18%、「2」15%を得る) (4)(3)の処理を2〜7桁まで繰り返す。(n桁目
の処理をするときには、n−1桁目までの前文字列が等
しいグループ毎に集計を行う。) この結果、図17に示すような、1〜7桁目までの出現
率を得ることができる。
Hereinafter, the creation procedure will be described. (1) The number and total number of each character in the first digit are obtained. (If the total number is small, substitute with *.) (2) Divide the number for each character type by the total number to find the ratio. (1
In the case of the first digit, “1” is 89% and “2” is 11%. (3) For the group of characters having the same first digit, the number and total number of each character in the second digit are obtained, and the ratio is obtained. (If the first digit is “1”, the first to fifth rows in FIG. 16 are totaled and the ratio is “0”
(67%, "1" 18%, "2" 15% are obtained.) (4) The process of (3) is repeated up to 2 to 7 digits. (When processing the nth digit, the tallying is performed for each group in which the preceding character strings up to the (n-1) th digit are equal.) As a result, as shown in FIG. Obtainable.

【0062】これにより、たとえば1、2桁目に対す
る、図5に示すような、出現率評価テーブル41が総合
評価部35に登録される。尚、出現率評価テーブル41
は、区分機1が安定稼働し稼働情報データが十分に畜積
(通常1ヶ月程度)できた段階で作成する。
Thus, for example, the appearance rate evaluation table 41 for the first and second digits as shown in FIG. The appearance rate evaluation table 41
Is created when the sorting machine 1 operates stably and the operation information data is sufficiently accumulated (usually about one month).

【0063】上記したように、区分機設置局で収集され
た郵便番号データの統計情報を利用して、文字の頻度
(出現率)を反映した文字評価値を決定する。今まで人
手で行っていた文字評価値決定のパラメータ調整を統計
情報によって自動的に行う。
As described above, the character evaluation value reflecting the frequency (appearance rate) of the character is determined by using the statistical information of the postal code data collected by the sorting machine installation station. The parameter adjustment for character evaluation value determination, which has been manually performed until now, is automatically performed based on statistical information.

【0064】すなわち、複合類似度認識および構造特徴
マッチング認識の各結果は、それぞれ総合評価部に送ら
れ、ここで入力文字に対する答えと総合評価値を決定す
る。総合評価部では、郵便局にて収集された郵便番号デ
ータの統計情報により自動的に作成された出現率評価テ
ーブル(出現率評価表)を用いて評価値の算出をする。
すなわち、出現頻度の高い数字は評価値を高く、出現頻
度の低い数字は評価値を低く出力するように、パラメー
タが設定されている。総合評価部の認識結果は、郵便番
号編集部に送られ、ここで7桁の最終的な郵便番号候補
が出力される。
That is, the results of the composite similarity recognition and the structural feature matching recognition are sent to the overall evaluation section, respectively, where the answer to the input character and the overall evaluation value are determined. The comprehensive evaluation unit calculates an evaluation value using an appearance rate evaluation table (appearance rate evaluation table) automatically created based on statistical information of postal code data collected at the post office.
That is, the parameters are set such that a number with a high appearance frequency outputs a high evaluation value, and a number with a low appearance frequency outputs a low evaluation value. The recognition result of the comprehensive evaluation unit is sent to the postal code editing unit, where the final seven-digit postal code candidate is output.

【0065】これにより、複合類似度認識法と構造特徴
マッチング法の2種類の文字認識結果から最終的な文字
評価値を算出するときに使用するパラメータを人手によ
らず自動的に調整することができる。
This makes it possible to automatically adjust the parameters used when calculating the final character evaluation value from the two types of character recognition results, the composite similarity recognition method and the structural feature matching method, without manual intervention. it can.

【0066】また、区分機設置局で収集された郵便番号
データの統計情報を利用してパラメータ調整を自動化す
ることによって、大幅な省力化が図れる。さらに、シミ
ュレーションや過去の調整経験から得られる既知の情報
をテーブルに反映させることによって、文字や辞書の特
性を利用した細かい調整も可能となる。
Further, by automating the parameter adjustment using the statistical information of the postal code data collected by the sorting machine installation station, a large labor saving can be achieved. Further, by reflecting known information obtained from simulations and past adjustment experiences in the table, fine adjustment using characteristics of characters and dictionaries can be performed.

【0067】複数の郵便番号候補を編集する処理におい
て、全ての前文字列に対して総合評価処理(ステップ2
6の処理)を行うことによって、全桁認識処理の計算量
を削減することができる。
In the process of editing a plurality of postal code candidates, a comprehensive evaluation process is performed on all the previous character strings (step 2).
6), it is possible to reduce the calculation amount of the all-digit recognition processing.

【0068】[0068]

【発明の効果】以上詳述したように、この発明によれ
ば、区分装置で収集される数字列からなる所在情報の統
計情報を利用してパラメータ調整を自動化することによ
って、大幅な省力化が図れる所在情報認識装置、所在情
報認識方法および区分装置を提供できる。
As described above in detail, according to the present invention, the parameter adjustment is automated by using the statistical information of the location information consisting of the number strings collected by the sorting device, thereby achieving a great saving of labor. A location information recognition device, a location information recognition method, and a sorting device that can be provided can be provided.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の実施形態を説明するための区分機の
概略構成を示す外観図。
FIG. 1 is an external view showing a schematic configuration of a sorting machine for describing an embodiment of the present invention.

【図2】区分機の概略構成を示す図。FIG. 2 is a diagram showing a schematic configuration of a sorting machine.

【図3】区分機の概略構成を示すブロック図。FIG. 3 is a block diagram showing a schematic configuration of a sorting machine.

【図4】郵便番号認識部の概略構成を示すブロック図。FIG. 4 is a block diagram showing a schematic configuration of a postal code recognition unit.

【図5】出現率評価テーブルの構成例を示す図。FIG. 5 is a diagram showing a configuration example of an appearance rate evaluation table.

【図6】結合テーブルの構成例を示す図。FIG. 6 is a diagram showing a configuration example of a connection table.

【図7】レベル選択テーブルの構成例を示す図。FIG. 7 is a diagram showing a configuration example of a level selection table.

【図8】レベルテーブルの構成例を示す図。FIG. 8 is a diagram showing a configuration example of a level table.

【図9】自動調整処理を説明するためのフローチャー
ト。
FIG. 9 is a flowchart illustrating an automatic adjustment process.

【図10】出現率を求める際の処理を説明するためのフ
ローチャート。
FIG. 10 is a flowchart for explaining processing when obtaining an appearance rate.

【図11】調整パターン番号を求める際の処理を説明す
るためのフローチャート。
FIG. 11 is a flowchart for explaining processing when obtaining an adjustment pattern number.

【図12】頻度レベルを選択する際の処理を説明するた
めのフローチャート。
FIG. 12 is a flowchart for explaining a process when selecting a frequency level.

【図13】総合評価値を算出する際の処理を説明するた
めのフローチャート。
FIG. 13 is a flowchart for explaining processing when calculating an overall evaluation value.

【図14】3桁目までの各桁ごとの総合評価点を説明す
るための図。
FIG. 14 is a view for explaining a comprehensive evaluation score for each digit up to the third digit.

【図15】3桁目までの各桁ごとの総合評価点(候補削
減)を説明するための図。
FIG. 15 is a view for explaining the total evaluation score (candidate reduction) for each digit up to the third digit.

【図16】稼働情報ファイルの保存内容を説明するため
の図。
FIG. 16 is a diagram for explaining the storage contents of an operation information file.

【図17】1〜7桁目までの出現率を説明するための
図。
FIG. 17 is a diagram for explaining the appearance rates of the first to seventh digits.

【符号の説明】[Explanation of symbols]

1…区分機、P…郵便物、15…郵便番号認識部、31
…複合類似度認識部、31a…複合類似度辞書、32…
構造特徴マッチング認識部、32a…構造特徴マッチン
グ辞書、33…複合類似度評価部、34…構造特徴マッ
チング評価部、35…総合評価部、41…出現率評価テ
ーブル、42…結合テーブル、43…レベル選択テーブ
ル、44…レベルテーブル。
DESCRIPTION OF SYMBOLS 1 ... Sorting machine, P ... Postal matter, 15 ... Postal code recognition part, 31
... composite similarity recognition unit, 31a ... composite similarity dictionary, 32 ...
Structure feature matching recognition unit 32a Structure feature matching dictionary 33 Complex similarity evaluation unit 34 Structure feature matching evaluation unit 35 Overall evaluation unit 41 Appearance rate evaluation table 42 Connection table 43 Level Selection table, 44... Level table.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06K 9/03 G06K 9/03 C ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) G06K 9/03 G06K 9/03 C

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 紙葉類上の数字列からなる所在情報を読
取る読取手段と、 この読取手段により読取った数字列の1文字ずつを認識
する認識手段と、 この認識手段により認識した認識結果を収集する収集手
段と、 この収集手段により収集した収集内容に基づいて、上記
認識手段による1文字ずつの数字の認識基準を変更する
変更手段と、 を具備したことを特徴とする所在情報認識装置。
1. A reading means for reading location information consisting of a number string on a sheet, a recognition means for recognizing each character of the number string read by the reading means, and a recognition result recognized by the recognition means. A location information recognizing device comprising: collecting means for collecting; and changing means for changing a recognition criterion of a character by character based on the collected contents collected by the collecting means.
【請求項2】 紙葉類上の数字列からなる所在情報を読
取る読取工程と、 この読取工程により読取った数字列の1文字ずつを認識
する認識工程と、 この認識工程により認識した認識結果を収集する収集工
程と、 この収集工程により収集した収集内容に基づいて、上記
認識工程による1文字ずつの数字の認識基準を変更する
変更工程と、 を有することを特徴とする所在情報認識方法。
2. A reading step of reading location information composed of a number string on a sheet, a recognition step of recognizing each character of the number string read in the reading step, and a recognition result recognized in the recognition step. A location information recognition method, comprising: a collection step of collecting; and a change step of changing a recognition criterion of a character-by-character number in the recognition step based on the collection content collected in the collection step.
【請求項3】 紙葉類上の数字列からなる所在情報を読
取る読取手段と、 この読取手段により読取った数字列の1文字ずつを認識
する認識手段と、 この認識手段により認識した認識結果に基づいて、所定
の区分先へ区分する区分手段と、 上記認識手段により認識した認識結果を収集する収集手
段と、 この収集手段により収集した収集内容に基づいて、上記
認識手段による1文字ずつの数字の認識基準を変更する
変更手段と、 この変更手段により変更された認識基準に基づいて、読
取手段により読取った数字列の1文字ずつを上記認識手
段で認識する第1の処理手段と、 この第1の処理手段により認識した認識結果に基づい
て、上記区分手段により区分する第2の処理手段と、 を具備したことを特徴とする区分装置。
3. A reading means for reading location information consisting of a number string on a paper sheet, a recognition means for recognizing each character of the number string read by the reading means, and a recognition result recognized by the recognition means. Sorting means for sorting into predetermined sorting destinations based on the information; collecting means for collecting recognition results recognized by the recognizing means; and a character by character by the recognizing means based on the collected contents collected by the collecting means. Changing means for changing the recognition criterion, and first processing means for recognizing each character of the numeral string read by the reading means by the recognition means based on the recognition criterion changed by the changing means; And a second processing unit for performing classification by the classification unit based on a recognition result recognized by the first processing unit.
【請求項4】 紙葉類上の数字列からなる所在情報を読
取る読取手段と、 この読取手段により読取った数字列の1文字ずつを複合
類似度法により認識する第1の認識手段と、 上記読取手段により読取った数字列の1文字ずつを構造
特徴マッチング法により認識する第2の認識手段と、 上記第1の認識手段の認識結果と上記第2の認識手段の
認識結果とに基づいて、上記数字列の文字を判断する判
断手段と、 この判断手段による判断結果を収集する収集手段と、 この収集手段により収集した収集内容に基づいて、上記
判断手段による上記数字列の文字の判断基準を変更する
変更手段と、 を具備したことを特徴とする所在情報認識装置。
4. A reading means for reading location information consisting of a number string on a sheet, a first recognizing means for recognizing each character of the number string read by the reading means by a composite similarity method, A second recognition unit for recognizing each character of the digit string read by the reading unit by a structural feature matching method, based on a recognition result of the first recognition unit and a recognition result of the second recognition unit, Determining means for determining the characters of the number string; collecting means for collecting the result of the determination by the determining means; and criterion for determining the characters of the number string by the determining means based on the collected contents collected by the collecting means. A location information recognizing device, comprising: changing means for changing.
【請求項5】 紙葉類上の数字列からなる所在情報を読
取る読取手段と、 この読取手段により読取った数字列の1文字ずつを参照
用の各文字ごとに複数の文字パターンとの複合類似度法
により認識する第1の認識手段と、 上記読取手段により読取った数字列の1文字ずつを参照
用の各文字ごとに複数の構造特徴との構造特徴マッチン
グ法により認識する第2の認識手段と、 上記数字列の各桁ごとの文字の出現率を記憶する第1の
記憶手段と、 上記第1の認識手段の認識結果と上記第2の認識手段の
認識結果とに基づく、誤読される可能性高い文字と、こ
の誤読文字の出現率と、認識文字の出現率とに対する、
調整用のパラメータ番号を記憶する第2の記憶手段と、 上記第2の認識手段の認識結果に基づく、認識文字の出
現率に対する、複数段階の頻度レベルを決定する種々の
基準値を記憶する第3の記憶手段と、 上記調整用のパラメータ番号に対する各頻度レベルごと
の評価値を記憶する第4の記憶手段と、 上記第1乃至第2の認識手段の各認識結果と、上記第1
から第4の記憶手段の記憶内容とに基づいて、上記数字
列の文字を判断する判断手段と、 この判断手段による判断結果を収集する収集手段と、 この収集手段により収集した収集内容に基づいて、上記
第1の記憶手段の記憶内容を変更する変更手段と、 を具備したことを特徴とする所在情報認識装置。
5. A compound similar to a reading means for reading location information consisting of a number string on a sheet, and a plurality of character patterns for each character for reference for each character of the number string read by the reading means. First recognizing means for recognizing by a degree method, and second recognizing means for recognizing one character of a digit string read by the reading means by a structural feature matching method for a plurality of structural features for each character for reference. First storage means for storing an appearance rate of a character for each digit of the numeral string, and erroneous reading based on a recognition result of the first recognition means and a recognition result of the second recognition means. For the likely characters, the rate of occurrence of this misread character, and the rate of occurrence of recognized characters,
A second storage unit for storing a parameter number for adjustment; and a second storage unit for storing various reference values for determining a plurality of frequency levels with respect to the appearance rate of the recognized character based on the recognition result of the second recognition unit. 3 storage means; fourth storage means for storing an evaluation value for each frequency level for the adjustment parameter number; each recognition result of the first and second recognition means;
Determining means for determining the characters of the numeral string based on the stored contents of the fourth storage means; collecting means for collecting the determination result by the determining means; and collecting means based on the collected contents collected by the collecting means. A location information recognizing device, comprising: a change unit configured to change storage contents of the first storage unit.
【請求項6】 紙葉類上の数字列からなる所在情報を読
取る読取手段と、 この読取手段により読取った数字列の1文字ずつを参照
用の各文字ごとに複数の文字パターンとの複合類似度法
により認識候補文字と上記参照用の文字パターンの種別
と信頼度とを出力する第1の出力手段と、 上記読取手段により読取った数字列の1文字ずつを参照
用の各文字ごとに複数の構造特徴との構造特徴マッチン
グ法により認識候補文字と上記参照用の構造特徴の種別
とを出力する第2の出力手段と、 上記数字列の各桁ごとの文字の出現率を記憶する第1の
記憶手段と、 上記第1の出力手段の出力結果と上記第2の出力手段の
出力結果とに基づく、誤読される可能性高い文字と、こ
の誤読文字の出現率と、認識文字の出現率とに対する、
調整用のパラメータ番号を記憶する第2の記憶手段と、 上記第2の出力手段の出力結果に基づく、認識候補文字
の出現率に対する、複数段階の頻度レベルを決定する種
々の基準値を記憶する第3の記憶手段と、 上記調整用のパラメータ番号に対する各頻度レベルごと
かつ信頼度ごとの評価値を記憶する第4の記憶手段と、 上記第1乃至第2の出力手段の各出力結果と、上記第1
から第4の記憶手段の記憶内容とに基づいて、上記数字
列の文字を判断する判断手段と、 この判断手段による判断結果を収集する収集手段と、 この収集手段により収集した収集内容に基づいて、上記
第1の記憶手段の記憶内容を変更する変更手段と、 を具備したことを特徴とする所在情報認識装置。
6. A reading means for reading location information consisting of a number string on a paper sheet, and a compound similarity of a plurality of character patterns for each character for reference for each character of the number string read by the reading means. First output means for outputting the recognition candidate character and the type and reliability of the reference character pattern by a degree method; and a plurality of characters for each reference character read by the reading means. A second output unit that outputs the recognition candidate character and the type of the reference structural feature by a structural feature matching method with the structural feature of the above, and a first storage unit that stores an appearance rate of a character for each digit of the numeric string. , A character which is likely to be misread, based on the output result of the first output means and the output result of the second output means, an appearance rate of the misread character, and an appearance rate of the recognized character And against
A second storage unit for storing a parameter number for adjustment, and various reference values for determining a plurality of frequency levels for the appearance rate of the recognition candidate character based on an output result of the second output unit. Third storage means, fourth storage means for storing an evaluation value for each frequency level and reliability for the adjustment parameter number, output results of the first and second output means, The first
Determining means for determining the characters of the numeral string based on the stored contents of the fourth storage means; collecting means for collecting the determination result by the determining means; and collecting means based on the collected contents collected by the collecting means. A location information recognizing device, comprising: a change unit configured to change storage contents of the first storage unit.
【請求項7】 紙葉類上の数字列からなる所在情報を読
取る読取手段と、 この読取手段により読取った数字列の1文字ずつを参照
用の各文字ごとに複数の文字パターンとの複合類似度法
により認識候補文字と上記参照用の文字パターンの種別
と信頼度とを出力する第1の出力手段と、 上記読取手段により読取った数字列の1文字ずつを参照
用の各文字ごとに複数の構造特徴との構造特徴マッチン
グ法により認識候補文字と上記参照用の構造特徴の種別
とを出力する第2の出力手段と、 上記数字列の各桁ごとの文字の出現率を記憶する第1の
記憶手段と、 上記第1の出力手段の出力結果と上記第2の出力手段の
出力結果とに基づく、誤読される可能性高い文字と、こ
の誤読文字の出現率と、認識文字の出現率とに対する、
調整用のパラメータ番号を記憶する第2の記憶手段と、 上記第2の出力手段の出力結果に基づく、認識候補文字
の出現率に対する、複数段階の頻度レベルを決定する種
々の基準値を記憶する第3の記憶手段と、 上記調整用のパラメータ番号に対する各頻度レベルごと
かつ信頼度ごとの評価値を記憶する第4の記憶手段と、 上記第1、第2の出力手段による各認識候補文字に対す
る出現率を上記第1の記憶手段から読出す第1の読出手
段と、 上記第1の出力手段による認識候補文字と上記参照用の
文字パターンの種別と上記第2の出力手段による認識候
補文字と上記参照用の構造特徴の種別と、上記第1の読
出手段により読出された各認識候補文字に対する出現率
とに基づく、調整用のパラメータ番号を上記第2の記憶
手段から読出す第2の読出手段と、 上記第2の出力手段による認識候補文字に対する上記出
現率と、上記第2の出力手段による認識候補文字と参照
用の構造特徴の種別とに対して上記第3の記憶手段に記
憶されている各基準値とを比較することにより、頻度レ
ベルを判断する第1の判断手段と、 上記第2の読出手段による調整用のパラメータ番号と上
記第1の判断手段により判断された頻度レベルとによ
り、上記第4の記憶手段に記憶されている評価値を読出
す第3の読出手段と、 上記第1、第2の出力手段による各認識候補文字に対す
る上記第3の読出手段により読出される評価値により、
上記数字列の文字を判断する第2の判断手段と、 この第2の判断手段により判断した上記数字列の文字を
収集する収集手段と、 この収集手段により収集した上記数字列の文字の収集内
容に基づいて、上記第1の記憶手段に記憶されている上
記数字列の各桁ごとの文字の出現率を変更する変更手段
と、 を具備したことを特徴とする所在情報認識装置。
7. A compound similar to a reading means for reading location information consisting of a number string on a paper sheet, and a plurality of character patterns for each character for reference for each character of the number string read by the reading means. First output means for outputting the recognition candidate character and the type and reliability of the reference character pattern by a degree method; and a plurality of characters for each reference character read by the reading means. A second output unit that outputs the recognition candidate character and the type of the reference structural feature by a structural feature matching method with the structural feature of the above, and a first storage unit that stores an appearance rate of a character for each digit of the numeric string. , A character which is likely to be misread, based on the output result of the first output means and the output result of the second output means, an appearance rate of the misread character, and an appearance rate of the recognized character And against
A second storage unit for storing a parameter number for adjustment, and various reference values for determining a plurality of frequency levels for the appearance rate of the recognition candidate character based on an output result of the second output unit. A third storage unit, a fourth storage unit that stores an evaluation value for each frequency level and a reliability for the adjustment parameter number, and a storage unit for each of the recognition candidate characters by the first and second output units. First reading means for reading the appearance rate from the first storage means; recognition candidate characters by the first output means; types of the character patterns for reference; and recognition candidate characters by the second output means. A second parameter value for adjustment read out from the second storage means based on the type of the structural feature for reference and the appearance rate for each recognition candidate character read by the first read means; Reading means, the above-mentioned appearance rate of the recognition candidate character by the second output means, and the recognition candidate character by the second output means and the type of the structural feature for reference are stored in the third storage means. A first determining means for determining the frequency level by comparing each of the reference values, a parameter number for adjustment by the second reading means, and a frequency level determined by the first determining means. Thus, the third reading means for reading the evaluation value stored in the fourth storage means, and the third reading means for each of the recognition candidate characters by the first and second output means are read by the third reading means. The evaluation value
Second determining means for determining the characters of the number string; collecting means for collecting the characters of the number string determined by the second determining means; and collecting contents of the characters of the number string collected by the collecting means Changing means for changing an appearance rate of a character for each digit of the number string stored in the first storage means based on the location information recognition apparatus.
【請求項8】 上記第1の記憶手段に記憶される上記数
字列の各桁ごとの文字の出現率が、上記数字列の手前の
桁の数字に関連づけられていることを特徴とする請求項
7に記載の装置。
8. The method according to claim 1, wherein an appearance rate of a character for each digit of the number string stored in the first storage means is associated with a number in a digit before the number string. An apparatus according to claim 7.
【請求項9】 紙葉類上の数字列からなる所在情報を読
取る読取手段と、 この読取手段により読取った数字列の1文字ずつを参照
用の各文字ごとに複数の文字パターンとの複合類似度法
により認識候補文字と上記参照用の文字パターンの種別
と信頼度とを出力する第1の出力手段と、 上記読取手段により読取った数字列の1文字ずつを参照
用の各文字ごとに複数の構造特徴との構造特徴マッチン
グ法により認識候補文字と上記参照用の構造特徴の種別
とを出力する第2の出力手段と、 上記第1の出力手段の出力結果と上記第2の出力手段の
出力結果とに基づいて、上記数字列の文字を判断する第
1の判断手段と、 この第1の判断手段により判断した上記数字列の文字を
収集する収集手段と、 この収集手段により収集した上記数字列の文字の収集内
容に基づいて、上記数字列の各桁ごとの文字の出現率を
記憶する第1の記憶手段と、 上記第1の出力手段の出力結果と上記第2の出力手段の
出力結果とに基づく、誤読される可能性高い文字と、こ
の誤読文字の出現率と、認識文字の出現率とに対する、
調整用のパラメータ番号を記憶する第2の記憶手段と、 上記第2の出力手段の出力結果に基づく、認識候補文字
の出現率に対する、複数段階の頻度レベルを決定する種
々の基準値を記憶する第3の記憶手段と、 上記調整用のパラメータ番号に対する各頻度レベルごと
の評価値を記憶する第4の記憶手段と、 上記第1、第2の出力手段による各認識候補文字に対す
る出現率を上記第1の記憶手段から読出す第1の読出手
段と、 上記第1の出力手段による認識候補文字と上記参照用の
文字パターンの種別と上記第2の出力手段による認識候
補文字と上記参照用の構造特徴の種別と、上記第1の読
出手段により読出された各認識候補文字に対する出現率
とに基づく、調整用のパラメータ番号を上記第2の記憶
手段から読出す第2の読出手段と、 上記第2の出力手段による認識候補文字に対する上記出
現率と、上記第2の出力手段による認識候補文字と参照
用の構造特徴の種別とに対して上記第3の記憶手段に記
憶されている各基準値とを比較することにより、頻度レ
ベルを判断する第2の判断手段と、 上記第2の読出手段による調整用のパラメータ番号と上
記第2の判断手段により判断された頻度レベルとによ
り、上記第4の記憶手段に記憶されている評価値を読出
す第3の読出手段と、 上記第1、第2の出力手段による各認識候補文字に対す
る上記第3の読出手段により読出される評価値により、
上記数字列の文字を判断する第3の判断手段と、 を具備したことを特徴とする所在情報認識装置。
9. A reading unit for reading location information consisting of a number string on a paper sheet, and a compound similarity of a plurality of character patterns for each character for reference for each character of the number string read by the reading means. First output means for outputting the recognition candidate character and the type and reliability of the reference character pattern by a degree method; and a plurality of characters for each reference character read by the reading means. A second output unit that outputs a candidate character for recognition and a type of the structural feature for reference by a structural feature matching method with the structural feature of the above, and an output result of the first output unit and a second output unit of the second output unit. First determining means for determining the characters of the numeric string based on the output result; collecting means for collecting the characters of the numeric string determined by the first determining means; Number of characters First storage means for storing the appearance rate of characters for each digit of the numeric string based on the contents of the collection, and based on the output result of the first output means and the output result of the second output means , The characters that are likely to be misread, the appearance rate of these misread characters, and the appearance rate of recognized characters,
A second storage unit for storing a parameter number for adjustment, and various reference values for determining a plurality of frequency levels for the appearance rate of the recognition candidate character based on an output result of the second output unit. A third storage unit, a fourth storage unit that stores an evaluation value for each frequency level with respect to the adjustment parameter number, and an appearance rate of each of the recognition candidate characters by the first and second output units. First reading means for reading from the first storage means; recognition candidate characters by the first output means; types of the character patterns for reference; recognition candidate characters by the second output means; A second reading means for reading, from the second storage means, an adjustment parameter number based on the type of the structural feature and an appearance rate for each recognition candidate character read by the first reading means; Each of the above-mentioned appearance rates of the candidate characters recognized by the second output unit and the types of the candidate characters recognized by the second output unit and the type of the structural feature for reference are stored in the third storage unit. A second determining means for determining a frequency level by comparing with a reference value; and a parameter number for adjustment by the second reading means and a frequency level determined by the second determining means. A third reading unit for reading the evaluation value stored in the fourth storage unit, and an evaluation value read by the third reading unit for each recognition candidate character by the first and second output units. ,
3. A location information recognition apparatus, comprising: third determination means for determining a character in the number string.
JP2001172796A 2001-06-07 2001-06-07 Location information recognition device and sorting device Expired - Fee Related JP4733859B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001172796A JP4733859B2 (en) 2001-06-07 2001-06-07 Location information recognition device and sorting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001172796A JP4733859B2 (en) 2001-06-07 2001-06-07 Location information recognition device and sorting device

Publications (2)

Publication Number Publication Date
JP2002366898A true JP2002366898A (en) 2002-12-20
JP4733859B2 JP4733859B2 (en) 2011-07-27

Family

ID=19014360

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001172796A Expired - Fee Related JP4733859B2 (en) 2001-06-07 2001-06-07 Location information recognition device and sorting device

Country Status (1)

Country Link
JP (1) JP4733859B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011194287A (en) * 2010-03-17 2011-10-06 Toshiba Corp Centralized information processing apparatus and system
JP2015210749A (en) * 2014-04-30 2015-11-24 グローリー株式会社 Character presence/absence determination system and character presence/absence determination method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05298489A (en) * 1992-04-20 1993-11-12 N T T Data Tsushin Kk System for recognizing character
JPH0644401A (en) * 1992-07-24 1994-02-18 Toshiba Corp Postal matter processor
JPH07271920A (en) * 1994-03-31 1995-10-20 Toshiba Corp Character recognizing device
JPH07271899A (en) * 1994-03-31 1995-10-20 Toshiba Corp Character recognition device
JPH0935006A (en) * 1995-07-18 1997-02-07 Fujitsu Ltd Character recognition device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05298489A (en) * 1992-04-20 1993-11-12 N T T Data Tsushin Kk System for recognizing character
JPH0644401A (en) * 1992-07-24 1994-02-18 Toshiba Corp Postal matter processor
JPH07271920A (en) * 1994-03-31 1995-10-20 Toshiba Corp Character recognizing device
JPH07271899A (en) * 1994-03-31 1995-10-20 Toshiba Corp Character recognition device
JPH0935006A (en) * 1995-07-18 1997-02-07 Fujitsu Ltd Character recognition device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011194287A (en) * 2010-03-17 2011-10-06 Toshiba Corp Centralized information processing apparatus and system
JP2015210749A (en) * 2014-04-30 2015-11-24 グローリー株式会社 Character presence/absence determination system and character presence/absence determination method

Also Published As

Publication number Publication date
JP4733859B2 (en) 2011-07-27

Similar Documents

Publication Publication Date Title
JPS62221088A (en) Optical type character reader
JPH0739820A (en) Street zone recognizing device and address reading and classifying machine
JP2002366898A (en) Device and method for location information recognition and sectioning device
JP3243000B2 (en) Mail processing apparatus and mail processing method
JP3710866B2 (en) Mail sorting apparatus, mail processing system, and mail processing method
JPH07271899A (en) Character recognition device
JPH0957199A (en) Address reading apparatus and mail-sorting apparatus
JP3709474B2 (en) Mail sorting method and apparatus
JP3149859B2 (en) Video coding system and method
JP3160347B2 (en) Mail address reading device
JPH07105321A (en) Word recognition device, address recognition device and word recognition method
JP2001025713A (en) Posta sorting mail system
JP2003141443A (en) Recognizing device, sorter, recognizing method and sorting method
JP2991594B2 (en) Mail address reading device
JP2000293725A (en) Ballot counting and assorting device, device and method for presetting it, and medium recording its presetting program
JPH0739816A (en) Address reading device
JP2988784B2 (en) Mail handling equipment
JPH05324899A (en) Recognizing device for address written on mail
JP2001232303A (en) Address recognizing device and postal item sorting machine using the same
JPH11226515A (en) Mail address reader
JPH1011541A (en) Character recognition device
JPH05242303A (en) Address reader
JP2004136201A (en) Sorter and sorting method used for sorter
JPH07182451A (en) Character recognition device, word recognizer and mail address reading/sorting device
JP2005040786A (en) Classification device and method for address information identification

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110425

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140428

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140428

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees